2009-12-17 9 views
0

Je cherche un C/C++ fonctionnel équivalent à HTML :: Defang, et mon Google-fu n'a pas été capable de découvrir quoi que ce soit. Je veux garder toutes les étiquettes bénignes et dépouiller/defang tout le reste. En l'absence d'une bibliothèque réelle, tous les pointeurs pour compléter les listes de balises/attributs/etc à defang seraient appréciés. Je connais http://en.wikipedia.org/wiki/DOM_Events. Merci.Meilleur bibliothèque C/C++ pour defang HTML?

+1

Dans ce contexte, ce qui est HTML :: Defang? –

Répondre

1

En Java, j'utilise JTidy pour nettoyer le HTML. Je ne suis pas sûr que cela convienne à vos besoins, mais si vous utilisez Google pour JTidy, vous pouvez également suivre le lien vers une implémentation C/C++, et voir si cela fonctionne comme vous le souhaitez. En ce qui concerne les éléments à déformer: Regardez les spécifications du W3C pour le code HTML; Tout tag qui n'y figure pas n'appartient pas au HTML. Mais encore une fois, je pourrais mal comprendre votre concept de "defang".

+0

Fondamentalement, ce que je veux, c'est ce que font les systèmes de messagerie Web lorsqu'ils sont présentés avec un courriel HTML. Montrez ce qu'ils peuvent, armez le reste, y compris les attaques. –

+0

C'est plus un art qu'une science. Je pense que tu ferais bien de laisser Tidy enlever tous les scripts. Mais je ne peux pas évaluer Tidy pour vous. Essayez-le! –