2013-07-25 2 views
0

Je vous remercie de votre temps.Avoir une énorme base de données basée sur une conception spécifique (pour les tests de performance)

Je sais qu'il ya des discussions sur StackOverflow qui ressemblent, mais aucun d'entre eux sont répondre à ma question.

donné une conception d'une base de données, est-il un outil qui peut le remplir avec des valeurs énormes en fonction de cette conception (pour les tests futurs Perfromance).
Ou devrais-je créer un script côté serveur qui met les valeurs au hasard?

En fait, je hésite entre 3 modèles de bases de données et je devrais tester les performances de chacun quand ils ont la même quantité de données.

Toutes les suggestions et clarifications sont très appréciés.

+1

Il existe un site Web qui crée des vidages pour cela. http://www.generatedata.com/ –

+0

@Dagon, vous devez savoir que fonction de vos commentaires sur ma dernière question, il fait une heure que j'ai créé ce sujet, afin que votre connaissance est la bienvenue –

Répondre

1
  1. Si vous souhaitez effectuer une analyse comparative de différentes choses, vous devez toujours essayer d'avoir un contexte commun aussi large que possible. Dans votre cas, cela signifie: N'utilisez pas de jeux de données aléatoires, mais les mêmes jeux de données pour tester différentes implémentations/bases de données/... Si vous ne voulez pas de données pseudo-aléatoires, vous pouvez tout de même y parvenir. régler une fois, puis utiliser le même ensemble plusieurs fois.

  2. Il existe des outils d'automatisation, mais comme votre schéma devrait être entré de toute façon, il est probablement préférable de créer un script simple. Le script aurait l'avantage d'être plus flexible et d'être utilisable dans les tests automatisés. Par exemple. vous pouvez écrire un script ANT qui appelle votre script pour générer un ensemble de données, puis exécute une liste de requêtes tout en les chronométrant, affiche les résultats et les répète sur différentes configurations. Lorsque vous testez différents schémas db pour les performances, vous devez toujours vous assurer de prendre en compte les différences de code/accès, etc. Par exemple, si un schéma peut être plus rapide de 10% dans les tests synthétiques, il peut être plus lent. de 50% dans votre application, simplement parce que le code dont vous auriez besoin pour accéder aux données serait alors 10 fois plus compliqué. C'est aussi pourquoi la plupart du temps cela n'a pas beaucoup de sens de comparer un schéma par lui-même, isolé de l'application/code/... qui l'utilisera. Assurez-vous de consacrer le même temps à l'optimisation de chaque schéma testé, car après les optimisations (index, etc.), les résultats peuvent tourner complètement.

Questions connexes