2009-07-03 4 views
0

en Java comment l'URL est téléchargée et sauvegardée dans un répertoire local. Plus je veux une vue hors ligne de cette URL téléchargée (en particulier le contenu html).web grabber

+0

pouvez-vous expliquer "Plus je veux une vue hors ligne de cette URL téléchargée (en particulier le contenu html)." un peu en détail s'il vous plaît? –

Répondre

1

Voici du code pour aspirer le HTML dans les chaînes. Attention, cela ne tire pas le contenu (images, etc ...), juste le HTML! Profitez :)

try 
{ 
    URL url = new URL("http://www.stackoverflow.com"); 
    URLConnection connection = url.openConnection(); 

    connection.setDoInput(true); 
    InputStream inStream = connection.getInputStream(); 
    BufferedReader input = new BufferedReader(new InputStreamReader(inStream)); 

    String html = ""; 
    String line = ""; 
    while ((line = input.readLine()) != null) 
    { 
     html += line; 
    } 

    //Now you can do what you please with 
    //the HTML content (save it locally, parse, etc...) 
} 
catch(Exception e) 
{ 
    //Error handling 
} 
+2

Je recommande d'utiliser HTTPClient de Jakarta sur les classes Java IO, la première traitant les redirections, etc automatiquement. –

Questions connexes