Quelle solution représenter de grands résultats?

Je travaille sur l'analyse du code source du noyau Linux compte tenu de toutes les versions 2.6 ...Quelle solution représenter de grands résultats?

Je collectionne les résultats pour chaque fichier compilé et pour chaque version du noyau ...

Alors loin, j'utilise un format ad-hoc puis j'analyse les données avec un petit script python (un fichier de résultat typique fait environ 300MB) ...

Cependant, un ad-hoc n'est pas vraiment pratique, car il est difficile d'interpréter les données, et pas vraiment flexible, puisque dès que vous changez de format, votre script d'interprétation doit être modifié aussi ...

Je voudrais quelque chose qui peut facilement évoluer et à partir de laquelle je peux facilement extraire quelques informations ...

Quelle est la meilleure solution dans mon cas pour représenter les résultats?

format ad hoc?
XML?
Base de données? (Si oui, quel moteur?)
Google App Engine?

PS: j'utilise Java 1.5.

Source

2009-06-23 LB40

Tout d'abord. Arrêtez-vous un moment. Prenez une profonde inspiration et réécrivez la question. Je ne vois pas de question ici, je sais qu'il y a une question en dessous, mais je ne comprends tout simplement pas. – OscarRyz

Dans tous les cas, qu'il s'agisse de XML, de base de données ou autre, si vous modifiez le format (par exemple en ajoutant une autre colonne dans une table DB), vous devrez ajuster le script d'interprétation. Représenter des données codées avec XML peut être très verbeux et auto-explicatif, Mais vous devez bien sûr savoir ce que les données XML signifient, un analyseur XML vous obtenez seulement jusqu'ici. (et avec XML vient en tête, en grande quantité généralement). Si vous interprétez toujours les données en python; sortie des structures de données Python !. Aucune analyse ne serait nécessaire pour votre script, l'analyse des structures de données python n'est pas si difficile dans un autre langage. – nos

Je pense que le premier commentaire d'Oscar n'est pas trop mauvais. Peut-être devriez-vous repenser votre format et la manière de l'analyser. J'ai aussi écrit plusieurs formats ad hoc pour analyser des données, juste pour réaliser qu'une structure de données différente (dans mon cas un arbre binaire simple) pourrait faire la même tâche en quelques secondes au lieu de minutes. La plupart du temps, une base de données peut être la meilleure solution et pour un vieux programme Java, vous pouvez considérer hsqldb comme la solution la plus pratique.

Source

2009-06-23 21:40:34 Daff

Quelle solution représenter de grands résultats?

Répondre

Questions connexes