2008-10-23 6 views
4

Je dois analyser une grande quantité de texte qui utilise des balises de police HTML pour la mise en forme,C# HTML police Tag Parsing

Par exemple:

<font face="fontname" ...>Some text</font> 

Plus précisément, je dois déterminer quels personnages seraient rendus en utilisant chaque police utilisée dans le texte. Je dois être capable de gérer des choses comme des balises de police à l'intérieur d'une autre balise de police.

-je utiliser C# pour cela. Y a-t-il une classe de parseur C# pour rendre cela plus facile? Ou devrais-je l'écrire moi-même?

Merci!

Répondre

3

Je ne l'ai pas utilisé, mais je l'ai vu le HTML Agility Pack souvent mentionné pour ce genre de chose.

0

Je ne sais pas si cela est applicable à votre situation que je ne sais pas ce que l'utilisation prévue est, mais qu'en l'utilisation de tempaltes XSLT?

+0

Vous suggérez d'envoyer du code HTML à XSLT? –

0

Vous pouvez charger le code HTML dans Internet Explorer, puis interroger les DOM pour les balises de police, (ou style CSS).

Je ne sais pas si cela est la meilleure performance de l'option sage.