Parse milliers de fichiers xml avec awk

2013-03-04 2 views 1 likes

J'ai plusieurs milliers de fichiers et ils contiennent chacun une seule ligne très longue. Je veux les convertir tous en un seul fichier avec une entrée par ligne divisée dans les champs ID et cela fonctionne avec quelques fichiers, mais cela prend trop de temps sur des centaines de fichiers et semble planter sur des milliers de fichiers. Vous cherchez un moyen plus rapide et illimité.Parse milliers de fichiers xml avec awk

(find -type f -name '*.xml' -exec cat {} \;) | awk '{gsub("ID","\nID");printf"%s",$0}'

J'ai aussi essayé ..

(find -type f -name '*.xml' -exec cat {} \;) | sed 's/ID/\nID/g'

Je pense que le problème est d'essayer d'utiliser le remplacement au lieu d'insertion ou il utilise trop de mémoire.

Merci

Source

2013-03-04 Road King

Répondre

Je ne peux pas le tester avec des milliers de fichiers, mais au lieu de cat toutes les données en mémoire avant de les traiter avec awk, essayez d'exécuter awk avec certains de ces fichiers à la fois, comme :

find . -type f -name "*.xml*" -exec awk '{gsub("ID","\nID");printf"%s",$0}' {} +

Source

2013-03-04 21:49:50 Birei

Merci les gars. Ma pipe coule à travers maintenant. J'ai l'impression d'avoir débloqué le secret de l'univers. –

Créer une liste de tous les fichiers dont vous avez besoin pour traiter
Diviser cette liste en petites listes comprenant chacun 50 fichiers
Créer un script qui lit une sous-liste et fournit un intermédiaire fichier, faire la chose ID aussi
créer un autre script qui exécute le script dans 3, 20 processus à la fois, autant que nécessaire, en arrière-plan des processus
fusionner les fichiers de sortie

Source

2013-03-04 21:47:36 perreal

Questions connexes

1. Parse xml chanson fichiers. NET
2. Stockage de données XML dans des milliers de petits fichiers
3. Parse XML avec jQuery
4. XML Parse avec PHP
5. Parse XML avec C
6. Parse xml avec php
7. XML Parse avec jQuery
8. Parse Ienumerable avec XML?
9. Cat plusieurs milliers de fichiers
10. Comparer des fichiers avec awk
11. Parse chaîne XML avec JQuery
12. Parse lien XML avec PHP
13. Parse grand XML avec lxml
14. parse imbriqué xml avec php
15. Parse document XML avec jquery
16. IGNORECASE en comparaison de fichiers avec awk
17. Parse version du paquet en HTML avec sed/awk/grep?
18. Parse XML en CSV
19. Parse fichier xml et créer une liste de fichiers
20. Parse fichier xml de treasury.gov avec pugixml
21. PHP FTP Télécharger des milliers de fichiers
22. AWK - le partage de fichiers
23. comment fusionner deux fichiers avec awk?
24. simplexml parse xml seulement version
25. Parse XML en Actionscript
26. php Parse chaîne xml
27. Jquery xml parse question
28. Parse xml en JSON
29. Parse XML Libxmljs (Node.js)
30. Parse xml d'internet (yr.no)