Je cherche un C/C++ fonctionnel équivalent à HTML :: Defang, et mon Google-fu n'a pas été capable de découvrir quoi que ce soit. Je veux garder toutes les étiquettes bénignes et dépouiller/defang tout le reste. En l'absence d'une bibliothèque réelle, tous les pointeurs pour compléter les listes de balises/attributs/etc à defang seraient appréciés. Je connais http://en.wikipedia.org/wiki/DOM_Events. Merci.Meilleur bibliothèque C/C++ pour defang HTML?
Répondre
En Java, j'utilise JTidy pour nettoyer le HTML. Je ne suis pas sûr que cela convienne à vos besoins, mais si vous utilisez Google pour JTidy, vous pouvez également suivre le lien vers une implémentation C/C++, et voir si cela fonctionne comme vous le souhaitez. En ce qui concerne les éléments à déformer: Regardez les spécifications du W3C pour le code HTML; Tout tag qui n'y figure pas n'appartient pas au HTML. Mais encore une fois, je pourrais mal comprendre votre concept de "defang".
Fondamentalement, ce que je veux, c'est ce que font les systèmes de messagerie Web lorsqu'ils sont présentés avec un courriel HTML. Montrez ce qu'ils peuvent, armez le reste, y compris les attaques. –
C'est plus un art qu'une science. Je pense que tu ferais bien de laisser Tidy enlever tous les scripts. Mais je ne peux pas évaluer Tidy pour vous. Essayez-le! –
libxml2 est gratuit et devrait faire ce que vous voulez.
Voir cette partie de l'API: http://www.xmlsoft.org/html/libxml-HTMLparser.html
La fonction htmlReadFile()
pourrait faire l'affaire.
Pour vous aider à démarrer avec libxml2 quelques exemples peuvent être trouvés ici:
- 1. Bibliothèque C# pour nettoyer html
- 2. Meilleur analyseur HTML léger pour Delphi
- 3. Meilleur SGBD pour stocker le code HTML
- 4. PHP Mail, champ CC
- 5. Bibliothèque C# pour la conformité (x) html
- 6. Bibliothèque recommandée pour graver des données html
- 7. Toute bibliothèque pour convertir richtext en html
- 8. VB6: alternative à la bibliothèque d'objets HTML (pour l'analyse HTML)
- 9. Meilleur (s) bibliothèque (s) Java pour interprète de commandes indulgents
- 10. Meilleur éditeur HTML autour de
- 11. Debian cc flat_namespace
- 12. html analyseur codeigniter bibliothèque?
- 13. Processus fork avec CC .NET
- 14. HTML vers la bibliothèque DOM
- 15. Meilleur gratuit disponible wysiwyg éditeur html
- 16. PHPMailer, serveur CC et Linux
- 17. Bibliothèque de classes HTML C#?
- 18. Commande XEmacs pour passer à l'accolade correspondante en mode cc
- 19. Bibliothèque DOM préférée pour l'analyse des pages html avec node.js?
- 20. une bibliothèque d'analyse html/css pour ruby et PHP?
- 21. Préchargement des images avant CC - par soudeurs
- 22. Que signifie CC? = Dans un Makefile?
- 23. Comment supprimer cc, bcc dans MailComposerViewController?
- 24. Expression régulière: Correspond à (aa | bb) (cc)?
- 25. Assistance avec le script de traitement CC
- 26. Obtention d'une copie CC des messages d'invite utilisateur
- 27. Meilleur analyseur pour C#?
- 28. meilleur algorithme pour l'échange?
- 29. Meilleur wiki pour dotnetnuke
- 30. Meilleur modèle pour AllowUnsafeUpdates
Dans ce contexte, ce qui est HTML :: Defang? –