J'ai eu quelques liens, certains sur rapidshare et d'autres sur d'autres hôtes de téléchargement. J'ai essayé d'obtenir le code source avec curl et file_get_contents, puis j'ai recherché "Deleted" mais je n'ai pas pu obtenir le code source sur certains hôtes.Obtenir le code source html dans php
Sur certains hôtes curl fonctionne et sur d'autres file_get_contents fonctionne mais la plupart ne retourneront pas le code source.
Voici mon code pour boucle:
function curl_download($Url){
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $Url);
$agent = "Mozilla/4.0 (compatible; MSIE 5.01; Windows NT 5.0)";
curl_setopt($ch, CURLOPT_USERAGENT, $agent);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt ($ch,CURLOPT_VERBOSE,false);
curl_setopt($ch,CURLOPT_SSL_VERIFYPEER, FALSE);
curl_setopt($ch,CURLOPT_SSLVERSION,3);
curl_setopt($ch,CURLOPT_SSL_VERIFYHOST, FALSE);
curl_setopt($ch, CURLOPT_TIMEOUT, 0);
curl_setopt($ch, CURLOPT_FRESH_CONNECT, 1);
curl_setopt($ch, CURLOPT_FORBID_REUSE, 1);
$output = curl_exec($ch);
curl_close($ch);
return $output;
ne fonctionne toujours pas. Je reçois le code source mais ce n'est pas comme le code source que j'obtiens si j'ouvre le site et regarde le code source, c'est différent. Je reçois ceci avant le code source: HTTP/1.1 200 OK Cache-Control: privé Longueur du contenu: 7036 Type de contenu: text/html; charset = utf-8 Serveur: Microsoft-IIS/7.5 Version X-AspNet: 2.0.50727 Set-Cookie: – user1104615
Ce sont les en-têtes HTTP. – ceejayoz