2009-08-30 8 views
-1

Je souhaite analyser le type de texte suivant. Example1 <root>my name is <j> <b> mike</b> </j> </root>Analyseur DOM pour non xml

exemple 2

<root> my name is <mytag1 attribute="val" >mike</mytag1> and yours is <mytag2> john</mytag2> </root> 

i peut analyser à l'aide d'un analyseur DOM? Je ne vais pas avoir le même format de temps evry .Je peut avoir différents formats dans lesquels les balises sont nested.I ne sais pas le format à l'avance.

Répondre

0

Vous pouvez utiliser un analyseur DOM pour les exemples que vous avez donnés - il s'agit d'un code XML valide. Cependant, vous ne seriez pas en mesure de l'utiliser pour non-XML selon votre ligne d'objet.

Lorsque vous dites que vous pouvez avoir "différents formats dans lesquels les tags sont imbriqués", que voulez-vous dire exactement? Si c'est toujours simple imbrication, par ex.

<root> 
    <tag1> 
    <tag2> 
     <tag3> 
     Stuff 
     </tag3> 
    </tag2> 
    </tag1> 
</root> 

Ensuite, ce sera très bien. Cependant, un analyseur XML ne sera pas comme le balisage où un « extérieur » tag est fermée avant un « intérieur » un:

<root> 
    <tag1> 
    <tag2> 
     Stuff 
    </tag1> <!-- Invalid --> 
    </tag2> 
</root> 
1

Ces deux exemples sont des documents XML valides donc il n'y a aucune raison que vous pouvez; t faire. Si votre code XML est très simple, en particulier s'il combine du texte et des balises, vous pouvez d'abord le lancer via un XSL transformation, afin d'en faciliter l'analyse ou de le convertir en un autre format, tel que HTML.