J'ai 80 000 fichiers XML censés utiliser le même format. Cependant, ce n'est clairement pas le cas. Pour cette raison, je tente d'identifier tous les nœuds existants et les enfants dans les fichiers.Identifier tous les parents et enfants possibles dans les listes
J'ai importé les fichiers XML en tant que listes, en utilisant le package XML, et dans ce qui suit j'ai décrit mon entrée et ma sortie désirée.
Entrée (listes de listes):
XML1 <- list(name = "Company Number 1",
adress = list(street = "JP Street", number = "12"),
product = "chicken")
XML2 <- list(name = "Company Number 2",
company_adress = list(street = "House Street", number = "93"),
invoice = list(quantity = "2", product = "phone"))
XML3 <- list(company_name = "Company Number 3",
adress = list(street = "Lake Street", number = "1"),
invoice = list(quantity = "2", product = "phone", list(note = "Phones are refurbished")))
sortie (structure arborescente dans les fichiers avec un nombre d'occurrences à leafs):
List of 5
$ name : num 2
$ company_name : num 1
$ adress :List of 2
..$ street: num 2
..$ number: num 2
$ company_adress:List of 2
..$ street: num 1
..$ number: num 1
$ invoice :List of 3
..$ quantity: num 2
..$ product : num 2
..$ :List of 1
.. ..$ note: num 1
$ product : num 1
Y at-il un paquet qui peut faire quelque chose le long de cette ligne , ou dois-je écrire une fonction qui le fait moi-même?