J'utilise la bibliothèque JSoup pour extraire des textes dans des pages Web. Voici mon codeComment extraire tout le texte d'une page Web
Document doc;
try {
URL url = new URL(text);
doc = Jsoup.parse(url, 70000);
Elements paragraphs = doc.select("p");
for(Element p : paragraphs)
{
textField.append(p.text());
textField.append("\n");
}
}
catch (Exception ex)
{
ex.printStackTrace();
}
Ici, je ne peux obtenir du texte qu'à partir de balises «p». Mais j'ai besoin de tous les textes de la page. Comment puis-je le faire? Cela pourrait être en bouclant à travers les nœuds, mais j'ai juste commencé à utiliser JSoup
et pas très bien avec. S'il vous plaît aider.
avoir modifié ma réponse, laissez-moi savoir si toute confusion. – Jhanvi