2011-04-21 2 views

Répondre

2

Vous pouvez utiliser HTML Parser comme JSoup

Par exemple HTML est

<div style="height:240px;"><br>test: example<br>test1:example1</div> 

Vous pouvez obtenir le code HTML en utilisant

Document document = Jsoup.parse(html); 
Element div = document.select("div[style=height:240px;]").first(); 
div.html(); 
+1

Merci patron fait – ReNa

+0

vous êtes bienvenus :) –

0

Essayez un HTML Parser.

Si le HTML est échappé, à savoir &lt; au lieu de < vous pourriez avoir à décoder d'abord.

0

Compte tenu de vos besoins, vous pouvez essayer Jericho HTML Parser

Jetez un oeil à TextExtractor classe:

Using the default settings, the source segment: "<div><b>O</b>ne</div><div title="Two"><b>Th</b><script>//a script </script>ree</div>" produces the text "One Two Three".

0

Si tout ce que vous voulez faire est de supprimer les balises HTML à partir d'une chaîne, vous pouvez le faire:

String output = input.replaceAll("(?s)\\<.*?\\>", " "); 
Questions connexes