Je voudrais créer un programme qui génère du contenu à partir de très gros fichiers XML, d'une taille supérieure à 500 Mo. J'ai besoin d'obtenir des données à partir des fichiers à différents moments, mais l'utilisateur est prêt à attendre un peu, et tout cela est fait sur la machine locale.Analyse, traitement et utilisation de très gros fichiers XML
je womdering si quelqu'un avait des conseils concernant:
langues de mise en œuvre Que chemin x est suffisant pour effectuer des requêtes de lumière sur un (certes énorme) base de données Tout autre avis
Je probablement besoin d'utiliser moins de 1% des données, et je ne peux pas m'attendre à faire un traitement préalable pour préparer le fichier.
Des conseils?
En réponse au commentaire: Je pourrais casser le fichier, mais seulement en le lisant, et en l'écrivant à nouveau. Donc pas vraiment, essentiellement. Je n'utilise le fichier qu'une seule fois, pour générer ce 'contenu' en utilisant des entrées select (et non déterministes) dans le fichier xml donné. Ensuite, je n'ai plus jamais besoin de ce fichier.
Avez-vous un contrôle sur le fichier XML? Pouvez-vous le décomposer en plus petits morceaux? À quelle fréquence traitez-vous le fichier? Traitez-vous le même fichier plus d'une fois? –
avez-vous regardé vtd-xml? –