J'ai une question à propos de l'analyse des pages HTML, spécifiquement des forums, je veux analyser un forum ou un fil contenant certains post-critères, je n'ai pas encore défini l'algorithme , puisque j'ai seulement analysé les formats de texte de structure auparavant, un cas d'utilisation peut être copier et coller chaque thread dans le programme à la main, ou insérer une URL comme http://www.forums.com/forum/showthread.php?t=46875&page=3 et laisser le programme analyser les pagesAnalyse de pages Web
Compte tenu de tout cela, je voudrais savoir:
- Est-il possible d'analyser un fil de discussion sur une page HTML?
- Quel serait le meilleur/le plus rapide/le plus simple pour ce faire?
- Si je préfère Java, quels outils/bibliothèques ai-je besoin pour cela?
- Une autre chose que je devrais considérer?
N'y at-il pas un flux RSS ou Atom disponible pour le forum que vous allez analyser? Ce serait la solution la plus simple pour analyser ceci, alors. –