2011-12-19 5 views
0

J'ai eu quelques liens, certains sur rapidshare et d'autres sur d'autres hôtes de téléchargement. J'ai essayé d'obtenir le code source avec curl et file_get_contents, puis j'ai recherché "Deleted" mais je n'ai pas pu obtenir le code source sur certains hôtes.Obtenir le code source html dans php

Sur certains hôtes curl fonctionne et sur d'autres file_get_contents fonctionne mais la plupart ne retourneront pas le code source.

Voici mon code pour boucle:

function curl_download($Url){ 
$ch = curl_init(); 
curl_setopt($ch, CURLOPT_URL, $Url); 
$agent = "Mozilla/4.0 (compatible; MSIE 5.01; Windows NT 5.0)"; 
curl_setopt($ch, CURLOPT_USERAGENT, $agent); 
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); 
curl_setopt ($ch,CURLOPT_VERBOSE,false); 
    curl_setopt($ch,CURLOPT_SSL_VERIFYPEER, FALSE); 
    curl_setopt($ch,CURLOPT_SSLVERSION,3); 
    curl_setopt($ch,CURLOPT_SSL_VERIFYHOST, FALSE); 
curl_setopt($ch, CURLOPT_TIMEOUT, 0); 
curl_setopt($ch, CURLOPT_FRESH_CONNECT, 1); 
curl_setopt($ch, CURLOPT_FORBID_REUSE, 1); 
$output = curl_exec($ch); 
curl_close($ch); 
return $output; 

Répondre

0

Essayez d'ajouter suivante dans votre code cURL:

 

//after -- curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); 
curl_setopt($ch, CURLOPT_BINARYTRANSFER, true); 

espérons que cela fonctionne pour vous

+0

ne fonctionne toujours pas. Je reçois le code source mais ce n'est pas comme le code source que j'obtiens si j'ouvre le site et regarde le code source, c'est différent. Je reçois ceci avant le code source: HTTP/1.1 200 OK Cache-Control: privé Longueur du contenu: 7036 Type de contenu: text/html; charset = utf-8 Serveur: Microsoft-IIS/7.5 Version X-AspNet: 2.0.50727 Set-Cookie: – user1104615

+0

Ce sont les en-têtes HTTP. – ceejayoz