2009-09-18 7 views
0

Je cherche un outil capable de prendre un document html et de générer une représentation du fichier à partir du sélecteur.Conversion d'un document HTML en fichier index basé sur le sélecteur

Par exemple:

<div> 
Some text 
    <ul class="foo"> 
    <li>First</li> 
    <li>Second</li> 
    <ul> 
</div> 

Et la sortie d'un fichier texte dans l'esprit de:

div 
div #text Some text 
div ul.foo li Frist 
div ul.foo li Second 

Le but de le faire serait de faire une fonction sous-jacente d'une sorte qui serait capable de comparer deux pages HTML et de dire dans quelle mesure elles correspondent et sont explicitement capables de dire isolément quelle part du contenu ou de la mise en page est différente.

(Pour les curieux, c'est pour la phase d'assurance qualité d'un projet de migration de données relativement importante)

+0

Si vous cherchez un outil pour ce faire, au lieu d'écrire cet outil vous, alors peut-être cette question n'est pas liés à la programmation. – ChrisW

+0

Merci pour votre commentaire Chris. Je crois cependant que ne pas écrire du code est autant programmer que écrire du code. – memet

+0

C'est que cela me semblait être un problème de codage aussi court/facile que j'aurais voulu le coder, au lieu de chercher un outil existant: 1) Charger le HTML dans un DOM 2) Marcher/itérer les nœuds dans le DOM 3) Imprime chaque nœud (y compris son ancêtre informatin) au format que vous avez spécifié. – ChrisW

Répondre

Questions connexes