2010-08-09 6 views
1

Je me connecte à Craigslist avec CURL pour gratter le statut de mes annonces publiées. Le problème que je rencontre est le transfert de HTML de la sortie CURL $ à file_get_html. Tandis que les statuts de Craigslist sont réellement imbriqués dans les éléments TR, je voulais juste tester les fonctions les plus basiques pour voir si les choses étaient passées (c'est-à-dire le grattage de lien). Ils ne sont pas.Craigslist, CURL, questions PHP simples DOM

Par exemple, cela ne fonctionne pas:

$cookie_file_path = getcwd()."/cookie.txt"; 

$ch = curl_init(); 
curl_setopt($ch, CURLOPT_URL, 'https://accounts.craigslist.org/login?LoginType=L&step=confirmation&originalURI=%2Flogin&rt=&rp=&inputEmailHandle='.$email.'&inputPassword='.$password.'&submit=Log%20In'); 
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); 
curl_setopt($ch, CURLOPT_REFERER, 'http://www.craigslist.org'); 

$agent = "Mozilla/5.0 (Windows; U; Windows NT 5.0; en-US; rv:1.4) Gecko/20030624 Netscape/7.1 (ax)"; 
curl_setopt($ch, CURLOPT_USERAGENT, $agent); 
curl_setopt($ch, CURLOPT_COOKIEJAR, $cookie_file_path); 
curl_setopt($ch, CURLOPT_COOKIEFILE, $cookie_file_path); 

$output = curl_exec($ch); 
$info = curl_getinfo($ch); 
curl_close($ch); 
echo $output; 

// 

include_once('simple_html_dom.php'); 
$html = file_get_html($output); 
//find all links 
foreach($html->find('a') as $element) 
     echo $element->href . '<br>'; 

Je sais que l'expression fonctionne parce qu'il retourne des liens si je mets « http://google.com », ou quelque chose ou autre.

+0

Êtes-vous sûr cURL est correctement connecté? – NullUserException

+0

Absolument positif. En écho à la sortie affiche ma page de compte. –

Répondre

0

Ne devriez-vous pas utiliser str_get_html au lieu de file_get_html? Depuis $ ouput est une chaîne!

1

Voici comment cela devrait être fait

$curl = curl_init(); 
curl_setopt($curl, CURLOPT_URL, 'http://www.sitename.com'); 
curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1); 
curl_setopt($curl, CURLOPT_CONNECTTIMEOUT, 10); 
$str = curl_exec($curl); 
curl_close($curl); 

$html= str_get_html($str);