J'essaye de faire un sitecraper. Je l'ai fait sur ma machine locale et ça marche très bien là-bas. Quand j'exécute le même sur mon serveur, il montre une erreur interdite 403. J'utilise le PHP Simple HTML DOM Parser. L'erreur que je reçois sur le serveur est la suivante:file_get_contents renvoie 403 interdit
Attention: file_get_contents (http://example.com/viewProperty.html?id=7715888) [function.file-get-contents]: failed ouvrir le flux: la requête HTTP a échoué! HTTP/1.1 403 interdit dans /home/scraping/simple_html_dom.php sur la ligne 40
La ligne de code de déclenchement est:
$url="http://www.example.com/viewProperty.html?id=".$id;
$html=file_get_html($url);
I ont vérifié le php.ini sur la server et allow_url_fopen est activé. Une solution possible peut être l'utilisation d'une boucle, mais je dois savoir où je me trompe.
Le serveur vous appartient? Si tel est le cas, il semble que vous ou votre service d'hébergement avez configuré les paramètres de sécurité pour empêcher leur mise au rebut. –
Ce n'est pas mon serveur, mais c'est un serveur dédié. – absk
J'ai mal lu la question. Je pensais que vous étiez en train de supprimer votre propre site (c'est-à-dire, un site que vous avez explicitement autorisé à gratter). @Pekka a raison. –