Ok, donc j'utilise HTML Tidy pour convertir des pages HTML en XHTML compatibles avec l'analyse syntaxique. Le problème est la page de test que j'ai sauvé dans firefox avait son html apparemment quelque peu pré-nettoyé par firefox pendant l'enregistrement, appelez ce fichier F. Html fonctionne bien sur le fichier F, mais échoue sur les données brutes écrites dans un fichier via .NET (fichier N). Html Tidy se plaint que les étiquettes de formulaire sont mélangées avec des étiquettes de table. Le code HTML n'est pas le mien, donc je ne peux pas simplement corriger la source. Comment nettoyer le fichier N assez pour qu'il puisse être exécuté par Html bien rangé? Existe-t-il un moyen standard de se connecter à Firefox (complètement programmé sans avoir besoin d'utiliser la souris ou le clavier) ou un autre outil qui va appliquer des corrections supplémentaires au html?Correction de html malformé qui ne corrige pas html
Répondre
J'avais utilisé HTML Tidy pendant un certain temps, mais j'ai ensuite constaté que j'obtenais de meilleurs résultats de TagSoup.
Il peut être utilisé comme analyseur JAXP, en convertissant à la volée du HTML non-formé. Je laisse généralement analyser l'entrée pour les transformations XQuery Saxon.
Mais il peut également être utilisé comme utilitaire autonome, en tant que fichier exécutable.
J'ai fini par utiliser SendKeys en C# et en important les fonctions de user32.dll pour positionner Firefox comme fenêtre active après l'avoir lancé sur le site web que je voulais (fichier: /// myfilepathhere /).
SendKeys semblait avoir besoin d'exécuter un programme fenêtré, j'ai donc ajouté un autre exécutable qui effectue des actions dans sa méthode form_load(). En utilisant alt + f, six fois, entrez, attendez un peu, tapez le nom de fichier du chemin d'accès complet, entrez (deux fois), puis en lâchant firefox, j'ai pu automatiser la capacité de Firefox à nettoyer du HTML.
- 1. Querypath et malformé HTML
- 2. Est-ce que caja corrige le HTML malformé en utilisant la méthode GAS createHtmlOutput()?
- 3. Analyse de HTML malformé avec Mechanize (Ruby)
- 4. Analyse HTML malformé avec Ruby Mechanize
- 5. Parser HTML En Python sans correction HTML
- 6. HtmlAgilityPack donnant des problèmes avec html malformé
- 7. code javascript pour la correction de code malform HTML
- 8. Validation HTML/correction en C#
- 9. HTML Agility Pack correction de lien
- 10. jquery livequery ne corrige pas autosuggest?
- 11. MySQL déclaration ne corrige pas
- 12. malformé
- 13. IE injectent des balises VBScript au milieu de rendu, ce qui malformé HTML
- 14. withTransaction ne corrige pas correctement
- 15. IE7 position problème résolu qui Doctype ne corrige pas
- 16. Correction d'un avertissement lancé par HTML Validator
- 17. jQuery .html() ne pas du tout html
- 18. Je cherche une librairie php qui corrige l'URL d'une page html
- 19. Formateur HTML en ligne de commande qui ne modifie pas le code HTML, juste des retraits?
- 20. Python ne corrige pas json dans ConnectWise.
- 21. Correction des sections d'une table html à l'aide de jQuery
- 22. syntaxe de requête ne corrige
- 23. Html Bouton qui appelle JQuery et ne publie pas
- 24. Jquery tout corrige mais ne s'exécute pas
- 25. Comment créer un lien HTML qui ne soit pas surligné?
- 26. Jquery.load (html) ne fonctionne pas
- 27. Tableaux HTML ne montrant pas
- 28. Ajax appel ne rafraîchira pas html interne avec la fonction php qui rend le html - aide?
- 29. JQuery ne rend pas HTML
- 30. carte html ne fonctionne pas