Sans l'utilisation d'une bibliothèque externe, quel est le moyen le plus simple de récupérer le contenu HTML d'un site Web dans une chaîne?Comment récupérer du code HTML en Java
Répondre
J'utilise actuellement ceci:
String content = null;
URLConnection connection = null;
try {
connection = new URL("http://www.google.com").openConnection();
Scanner scanner = new Scanner(connection.getInputStream());
scanner.useDelimiter("\\Z");
content = scanner.next();
}catch (Exception ex) {
ex.printStackTrace();
}
System.out.println(content);
Mais pas sûr s'il y a une meilleure façon.
Pourquoi "\\ Z" ? N'est-ce pas un EOF sur Windows seulement? Je devine juste ici. – greenoldman
Méfiez-vous du hit haute performance lors de l'utilisation. – qwertzguy
Pourquoi utilisez-vous "\\ Z"? Qu'est ce que ça fait? J'ai essayé sans ça, ça n'a pas marché. –
Je viens de quitter this post in your other thread, bien que ce que vous avez ci-dessus pourrait fonctionner aussi bien. Je ne pense pas que ce soit plus facile que l'autre. Les paquets Apache peuvent être consultés en utilisant simplement import org.apache.commons.HttpClient
en haut de votre code.
Modifier: Vous avez oublié le lien;)
Apparemment, vous devez également installer le fichier JAR :) –
Cela a bien fonctionné pour moi:
URL url = new URL(theURL);
InputStream is = url.openStream();
int ptr = 0;
StringBuffer buffer = new StringBuffer();
while ((ptr = is.read()) != -1) {
buffer.append((char)ptr);
}
Je ne sais pas à savoir si l'autre solution (s) fourni sont plus efficaces ou non.
Vous ne devez pas inclure les éléments suivants? Importer java.io. * Importer java.net. * –
Bien sûr, mais ils sont de base java si simple. En ce qui concerne le code réel, les instructions d'importation sont omises pour plus de clarté. –
après 'while', vous devriez aussi afficher le contenu de la mémoire tampon! ou écrivez une méthode où vous l'avez lu! – rupinderjeet
Bien que n'étant pas vanilla-Java, je vais offrir une solution plus simple. Utilisez Groovy
String siteContent = new URL("http://www.google.com").text
- 1. Comment récupérer du code HTML en C/C++
- 2. Convertir du code HTML en XAML
- 3. Récupérer une image du web dans java
- 4. Fuite de mémoire en utilisant JNI pour récupérer la valeur de la chaîne du code Java
- 5. Optimisation du code Java
- 6. Comment récupérer HTML du contrôle WebBrowser de cadres en .net (C#)
- 7. Comment récupérer à partir du code source perdu?
- 8. Eclipse: arrêt du code (java)
- 9. Impression du fichier HTML sur l'imprimante en Java
- 10. Comment récupérer du texte sélectionné en utilisant Regex en C#?
- 11. Mettre du code HTML dans un iframe (en utilisant javascript)
- 12. Comment récupérer/calculer l'empreinte d'un certificat X509 en Java?
- 13. conversion du code Java C++
- 14. DOT NET code pour convertir du HTML en texte
- 15. Insérer du code HTML dans un div
- 16. Insérer du code HTML dans iframe
- 17. Comment sortir le code HTML du bloc JSP <%! ... %>?
- 18. Injecter du code HTML au contrôle du serveur
- 19. Scala en java code: $ colon
- 20. Comment convertir le code Java en code C#?
- 21. Envoyer du code HTML via Ajax POST
- 22. Lit la table html en java
- 23. Comment mettre en forme du code en html/css/js/php
- 24. Comment ouvrir un fichier externe à partir du code HTML
- 25. Récupérer un SQLite SUM en Java sur Android
- 26. Appeler Snarl à partir du code java
- 27. Récupérer un identifiant d'éléments HTML en utilisant jQuery
- 28. Comment puis-je récupérer une URL à partir d'un site Web en utilisant Java?
- 29. javascript - Récupérer le contrôle html en spécifiant les coordonnées
- 30. Conversion du texte en html
double possible de http://stackoverflow.com/questions/238547/how-do-you-programmatically-download-a-webpage-in-java – jjnguy