J'ai des ensembles de données assez volumineux et j'utilise le module de données hiérarchiques pytables. En décrivant les bases de données, je me demande s'il serait plus rapide de créer des tables avec beaucoup de lignes et une seule colonne de valeur, ou dans un format 'matrice' plus courant.Quel est le sentiment général sur les formes de base de données efficaces?
Par exemple:
from_cty, to_cty, valeur
austin, New York, 9000
dallas, New York, 8000
New York, dallas, 8400
austin, dallas, 5030
dallas, austin, 4022
New york, austin, 8002
etc ...
--ou--
Villes '' '' '' '', austin, dallas, New York
austin '' '' '' », 0000, 5030, 9000
dallas '' '' '' », 4022, 0000, 8000
New york, 8002, 8400, 0000
Avantages du premier type pourraient notamment être en mesure de tirer une seule colonne comme une fois, sélectionnée par provenance ou à destination des villes. Mais il ajoute une colonne qui serait normalement les noms de colonnes.