2011-07-09 2 views
1

Je souhaite déterminer le numéro de position d'occurrence d'un texte spécifique H2 (ou h3/h4/h5/h6) dans le corps du texte, à l'aide de l'analyseur. Par numéro de position, j'entends le nombre de mots qui se sont produits avant cette phrase h2 (ou h3/h4/h5/h6) ... De plus, si une phrase apparaît à la fois dans les textes h2 et h4 (par exemple) alors Comment puis-je m'assurer que je reçois le bon numéro de position pour ces deux textes?Requête relative à Jericho HTML Parser

Répondre

1

Il n'y a pas de moyen facile de faire une telle exigence non standard.

Vous devez trouver des étiquettes, y trouver du texte, mémoriser leur position, tout analyser avant et compter les «mots». Ce n'est pas sorcier, mais cela peut prendre du temps à coder et à tester.