Un projet sur lequel j'ai travaillé l'année dernière écrit des fichiers journaux sur un lecteur réseau chaque fois qu'une tâche est effectuée. Nous avons actuellement environ 1300 dossiers chacun avec un certain nombre de fichiers et de dossiers. La partie importante ici est que nous avons environ 3-4 fichiers XML en moyenne dans chaque dossier qui contiennent des numéros de série et d'autres données d'identification pour nos produits. Au début, il était facile de simplement utiliser la recherche de fichiers Windows, mais cela peut prendre plus de 10 minutes. Le besoin d'un observateur/chercheur de journal a surgi et j'ai besoin de comprendre comment le rendre rapide. Nous examinons un certain nombre d'idées. L'un étant un fichier d'index XML stocké localement, mais je pense qu'il deviendra trop gros pour être rapide. Deuxièmement, créer un service de surveillance de dossier qui écrira des informations d'index dans une base de données SQL et un lien vers des fichiers. Troisième idée était d'avoir le programme d'écriture des fichiers journaux écrivent également des informations d'index à la base de données. La deuxième option de base de données semble être la meilleure option en ce moment puisque nous avons déjà un tas d'histoire qui devra être indexé, mais pour moi cela semble un peu compliqué. Donc ma question en bref est: Comment puis-je rechercher rapidement des informations contenues dans des fichiers XML dans un grand nombre de répertoires en constante augmentation?Comment rechercher rapidement des données stockées dans un fichier XML dans un grand nombre de répertoires?
1
A
Répondre
1
Nous avons fini à l'aide d'une base de données SQL pour le faire, pour de nombreuses raisons:
- Il a maintenu beaucoup plus rapidement les temps de requête dans une simulation croissance des données de 10 ans (1,5 mil - 2 entrées de mil avaient encore moins de 2 ans secondes) que XML (environ 20-30 secondes).
- Nous pouvons demander à l'application de publier directement des données dans la base de données, ce qui supprime le besoin d'un robot d'exploration (autre que pour les données héritées initiales).
- Il pouvait y avoir des problèmes potentiels avec le verrouillage de fichier si nous décidions d'héberger le fichier sur le réseau quelque part.
Questions connexes
- 1. Comment puis-je rechercher un grand ensemble de données XML?
- 2. Rapidement alphabétiser un grand fichier via python
- 3. Correction d'encodage dans un grand Xml fichier
- 4. Rechercher un fichier dans le répertoire avec plusieurs répertoires
- 5. Comment rechercher rapidement un dépôt subversion?
- 6. Consignation des données XML dans un fichier journal xml
- 7. Recherche dans un grand ensemble de données
- 8. Comment rechercher rapidement un tableau d'objets dans Objective-C
- 9. comment analyser un grand nombre de PDF
- 10. rechercher un jeu de données à partir du fichier xml
- 11. La meilleure façon de rechercher dans les données stockées au format XML dans SQL Server?
- 12. Comment vérifier rapidement un grand nombre d'URL si elles sont toujours valides (ou 404/manquantes)
- 13. Rechercher un fichier XML sans le charger dans la mémoire?
- 14. rubyj traitant un grand nombre de fichiers
- 15. Comment copier un grand ensemble de données dans SQLServer db
- 16. Comment rechercher un enregistrement manquant dans un fichier?
- 17. Liaison de données dans un fichier XML
- 18. Comment écrire des données binaires dans un fichier pour pouvoir les lire rapidement?
- 19. Requêtes aléatoires sur un grand fichier xml
- 20. Comment lancer un très grand nombre de processus dans bash
- 21. Hadoop rechercher des mots d'un fichier dans un autre fichier
- 22. Rechercher une entrée dupliquée dans un grand script SQL
- 23. Filtre efficacement un grand nombre d'entités de banque de données avec un grand nombre de valeurs de propriété
- 24. Can Python xml ElementTree analyse un très grand fichier xml?
- 25. Comment rechercher plusieurs chaînes dans un fichier
- 26. Rechercher un fichier dans Program Files dir
- 27. Agréger un grand nombre d'observables dans un nouveau observable
- 28. Comment tester rapidement un grand nombre d'expressions régulières et savoir lequel correspond?
- 29. Insérer un grand nombre de données hiérarchiques en utilisant Spring
- 30. Comment rechercher une référence de colonne de table de données dans des procédures stockées