Quelqu'un sait-il un analyseur HTML pour VB.NET ou C#? Je sais que .NET a beaucoup de support XML, comme XMLReader et XMLWriter. Y a-t-il un HTMLWriter ou HTMLReader? Finalement, ce que j'aimerais, c'est une bibliothèque qui va analyser un fichier HTML et déclencher des événements en fonction des balises qu'il trouve. Quelqu'un sait-il d'une bibliothèque pour le faire?Analyseur HTML
Répondre
Le HTML Agility Pack est le chemin à parcourir si vous voulez analyser HTML (il fait même du bon travail sur tag soupe). Théoriquement, l'analyseur syntaxique XML inclus dans la BCL devrait être en mesure d'analyser XHTML valide, mais le HTML Agility Pack est une solution générique qui peut gérer les variantes HTML, XHTML et désordonnées des deux.
La génération d'événements lors de la recherche d'étiquettes est quelque chose que vous devrez implémenter vous-même bien sûr, mais cela devrait être plutôt trivial avec la classe HtmlReader
.
J'ai écrit ce HtmlParser il y a longtemps et je viens de le publier en tant que projet open source sur GitHub. Il est plus rapide que les outils d'analyse HTML classiques car il ne construit pas le DOM. Il fait exactement ce que vous avez demandé et soulève des "événements" pour chaque tag.
https://github.com/calbucci/CalbucciLib.HtmlParser
Je viens d'ajouter à NuGet:
Est-ce que cela analyse également les balises HTML5? Tels que
Oui, c'est le cas. Il supporte même les balises inconnues. –
- 1. Analyseur de code HTML
- 2. C++ .net Analyseur HTML
- 3. analyseur de texte d'alimentation
- 4. Analyseur syntaxique léger
- 5. Meilleur analyseur pour C#?
- 6. Analyseur de format vidéo
- 7. analyseur .NET HTTP
- 8. analyseur JavaScript Python
- 9. Python 3.1 RSS Analyseur?
- 10. Profiler/Analyseur pour Erlang?
- 11. Analyseur de code ColdFusion?
- 12. Analyseur AMF0 dans ObjectiveC
- 13. Analyseur MSXML en Java
- 14. Lucene hébreu analyseur
- 15. analyseur CSS + générateur XHTML, les conseils nécessaires
- 16. Vous cherchez un analyseur CSS en Java
- 17. Standard (format netscape) HTML Bookmarks Analyseur -> NSMutable Tableau d'URLs et noms/dossiers
- 18. Analyseur pour la syntaxe Mathematica?
- 19. Analyseur DOM pour non xml
- 20. Analyseur syntaxique SAX en Java
- 21. Comment tester un analyseur CSS?
- 22. Analyseur personnalisé pour JQuery Tablesorter
- 23. Analyseur Javascript pour l'expression simple
- 24. Un analyseur lexical pour SPDH
- 25. analyseur espace nom client Spring.net
- 26. Analyseur de code source JavaScript
- 27. composant ou code pour un analyseur d'onde
- 28. Objective-C DOM analyseur XML pour iPhone
- 29. Problème récursif Haskell, analyseur minuscule. Quelques choses
- 30. Analyseur de ligne de commande pour Qt4
Je ne peux pas croire doesnt BCL ont un analyseur syntaxique HTML approprié dans un espace de noms/assemblage neutre approprié (sans toucher certains de ces ensembles de l'interface utilisateur) . JSON et XML ont eu une tonne de cours. – nawfal