Je souhaite déterminer le numéro de position d'occurrence d'un texte spécifique H2 (ou h3/h4/h5/h6) dans le corps du texte, à l'aide de l'analyseur. Par numéro de position, j'entends le nombre de mots qui se sont produits avant cette phrase h2 (ou h3/h4/h5/h6) ... De plus, si une phrase apparaît à la fois dans les textes h2 et h4 (par exemple) alors Comment puis-je m'assurer que je reçois le bon numéro de position pour ces deux textes?Requête relative à Jericho HTML Parser
1
A
Répondre
1
Il n'y a pas de moyen facile de faire une telle exigence non standard.
Vous devez trouver des étiquettes, y trouver du texte, mémoriser leur position, tout analyser avant et compter les «mots». Ce n'est pas sorcier, mais cela peut prendre du temps à coder et à tester.
Questions connexes
- 1. Comment analyser XML en utilisant Jericho HTML Parser
- 2. Parse texte spécifié à partir de la page avec jericho html parser
- 3. Pourquoi Jericho parser ne peut-il pas analyser ce code HTML?
- 4. JSON twitter requête, parser pour l'alimentation html
- 5. Analyseur similaire à Jericho HTML pour .Net/C#
- 6. .Net WikiText à HTML Parser
- 7. html - divs position à relative
- 8. relative url html
- 9. PHP HTML DOM Parser
- 10. QT HTML Parser (+ XQuery)
- 11. PHP Html Dom/Parser
- 12. simple HTML Parser
- 13. PHP DomDocument parser html
- 14. BeautifulSoup Parser Confusion - HTML
- 15. L'analyseur syntaxique Jericho HTML fonctionne-t-il sur Google App Engine pour Java?
- 16. Définition de l'étiquette HTML à position: relative
- 17. Requête relative à la notification parse push
- 18. Parser HTML En Python sans correction HTML
- 19. Simple html DOM parser obtenir tag html
- 20. PHP Simple HTML DOM Parser
- 21. simple HTML DOM PHP Parser
- 22. HTML DOM Parser en PHP
- 23. php regex pour parser html
- 24. Html Parser en utilisant java
- 25. Comment analyser deux commentaires avec Jericho?
- 26. Simple HTML DOM Parser - Ignorer certain élément
- 27. Jsoup comme html parser pour C++
- 28. Simple HTML DOM Parser - Obtenir le chemin
- 29. En utilisant HTML Parser dans Android Project
- 30. Lucene.net Syntaxe de requête Parser Problème