J'essaie d'extraire des données à partir de fichiers journaux au format XML. Comme ils sont énormes, j'utilise XML::Twig pour extraire les données pertinentes d'un tampon à la place du fichier entierComment puis-je analyser des fragments XML incomplets avec XML :: Twig de Perl?
Comme ce sont des données concaténées de STDIN, le XML est loin d'être bien formé. Si souvent, l'analyseur s'arrête avec une erreur. Comment puis-je obtenir l'analyseur XML pour ignorer les erreurs et extraire uniquement les tags qui m'intéressent? Dois-je revenir à l'analyse syntaxique des expressions régulières (start-tag-end-tag)?
Pouvez-vous donner un exemple de ce que vous concatèez aux journaux de STDIN? et aussi quels tags cherchez-vous? – Ibrahim
ce sont les journaux openfire/jabber/xmpp. Les données pertinentes (journaux de discussion) sont entre Tags –
goorj