2010-11-02 4 views
0

Je cherche une classe java pour analyser tous les caractères spéciaux HTML. Je suppose que c'est un problème commun, mais je ne peux pas trouver une solution rapide en ce moment.Analyse de caractères HTML speacial

Ce que je WANTO obtenir est:

input: thè --> output: thè 
input: » 
input: &lraquo; 
... 

Connaissez-vous quelque chose d'utile pour moi?

Répondre

0

Avez-vous googlé dessus? Le premier lien sur "java HTML markup entity parser" fait référence à html text extractor

Il semble que ce soit ce dont vous avez besoin.

Vous pouvez aussi examiner les moteurs de rendu javax.swing.JLabel (et d'autres composants de texte swing).