En termes de performances et d'efficacité, est-il préférable d'utiliser beaucoup de petits fichiers (par lots, je veux dire jusqu'à quelques millions) ou un couple (une dizaine) d'énormes fichiers (plusieurs gigaoctets)? Disons simplement que je construis une base de données (pas tout à fait vrai, mais tout ce qui compte, c'est que l'on puisse y accéder BEAUCOUP).Beaucoup de petits fichiers ou un couple énorme?
Je suis principalement concerné par les performances de lecture. Mon système de fichiers est actuellement ext3 sous Linux (Ubuntu Server Edition si c'est important), même si je suis dans une position où je peux encore changer, donc les comparaisons entre différents systèmes de fichiers seraient fabuleuses. Pour des raisons techniques, je ne peux pas utiliser un SGBD réel pour cela (d'où la question), donc "juste utiliser MySQL" n'est pas une bonne réponse.
Merci d'avance, et laissez-moi savoir si je dois être plus précis.
EDIT: Je vais être stocker beaucoup de morceaux de données relativement faible, ce qui explique pourquoi en utilisant beaucoup de petits fichiers serait plus facile pour moi. Donc si j'utilisais quelques fichiers volumineux, je ne récupérerais que quelques Ko à la fois. J'utiliserais aussi un index, donc ce n'est pas vraiment un problème. En outre, certaines données pointent vers d'autres données (elles pointent vers le fichier dans le cas des lots de petits fichiers et pointent vers l'emplacement des données dans le fichier dans le cas des fichiers volumineux).
Plus les informations sont vagues, plus vous en aurez, 'ça dépend' – McAden
Eh bien, quelles autres informations dois-je ajouter? Je ne peux pas penser à autre chose qui pourrait bénéficier de la question. –
Le profil d'accès de ces données fait une grande différence. Allez-vous lire de gros morceaux de données? Certaines données sont-elles liées et sont-elles susceptibles d'être consultées ensemble? À un certain point, il est préférable d'utiliser une base de données plutôt qu'un grand nombre de petits fichiers, à moins que vous ne fassiez quelque chose d'aussi simple que de les utiliser via http, et que cela soit vraiment TRÈS rapide. – jamuraa