J'essaye d'écrire un programme qui prend les noms de compagnies d'un dossier de texte et les recherche sur un site Web de moteur de recherche (recherche d'Edgar de SEC). Chaque recherche contient généralement de 1 à 10 liens de résultats de recherche uniques et je veux donc utiliser curl pour cliquer sur le lien avec le nom de l'entreprise concernée. La page de lien a un bref résumé avec le terme "état d'incorporation:" et ensuite le nom de l'état. Im espérant analyser le nom d'état. J'ai du mal à comprendre comment utiliser l'analyse HTML et curl et leurs classes. J'apprécierais toute aide possible telle qu'un bref aperçu des étapes ou juste n'importe quel conseil du tout. Merci.comment utiliser htmlparsing et curl en JAVA pour cette tâche ...?
1
A
Répondre
1
En supposant que le code HTML est assez basique, utilisez quelque chose comme le Mozilla Java HTML Parser. Le getting started guide vous donnera plus de détails sur la création du DOM. Java a builtin APIs pour télécharger du contenu à partir du Web, et ceux-ci seront probablement suffisant pour vous (plutôt que d'utiliser "curl"). Une fois que vous avez un DOM, vous pouvez utiliser les API DOM standards pour naviguer vers les liens et les éléments que vous voulez.
Questions connexes
- 1. Comment utiliser OAuth avec PHP et cURL?
- 2. CURL/PHP/Apache - Pourquoi cette requête CURL/Simplexml pour Vimeo ne fonctionnera-t-elle pas?
- 3. Pour utiliser cURL FTP, les deux serveurs ont-ils besoin de la bibliothèque PHP cURL installée?
- 4. Faut-il utiliser la syntaxe de message cryptographique (CMS) pour cette tâche?
- 5. Comment utiliser JSpeex en java
- 6. Comment puis-je utiliser cURL/PHP pour vider le twitter actuelle tendance des sujets dans mySQL
- 7. Comment effectuer cette tâche dans une seule requête mysql efficace?
- 8. en utilisant php et curl pour mettre à jour mediawiki
- 9. Comment extraire une partie de cette image en Java?
- 10. Comment utiliser "gets" sur une tâche rake?
- 11. comment utiliser JRSwapFileVirtualizer pour les rapports de jaspe en java
- 12. CURL pour WAMP
- 13. cURL - cookies et sessions
- 14. Comment rendre cette tâche SQL plus rapide à terminer
- 15. Comment utiliser cURL ou Wget dans un programme Perl?
- 16. ClassNotFoundException avec la tâche java de ant et classpath
- 17. Comment puis-je utiliser php pour transformer cette URL?
- 18. RAW POST en utilisant cURL en PHP
- 19. Comment puis-je implémenter cette équation en Java?
- 20. Comment utiliser la bibliothèque org.hibernate en java?
- 21. Pourquoi cette fonction utilisant CURL fonctionnera-t-elle pour certaines URL mais pas pour d'autres?
- 22. Comment coder une tâche râteau pour déclencher une tâche BackgrounDRb?
- 23. Comment faire pour utiliser Curl cookie même que le navigateur de PHP
- 24. comment utiliser un nom d'utilisateur et un mot de passe pour lire un fichier en Java
- 25. comment utiliser java stringtokenizer?
- 26. Sortie de la tâche java dans Ant
- 27. Tâche SFTP pour msbuild?
- 28. Comment installer PHP/CURL?
- 29. Comment réparer cette erreur générique Java génériques?
- 30. Utiliser les sons en java