Je suis en train d'extraire des informations à partir d'une page Web en utilisant PHP cURL + preg_match ou toute autre fonction mais pour certaines raisons, il ne fonctionne pas du tout. Par exemple de this page, Je veux extraire le titre qui est "maison de 4 lits à louer, Caroline Place, Bayswater, W2", le prix qui est "2.300" et la description qui commence à "Ce fantastique ... "et se termine à" (Lignes Cercle et District). ". J'ai essayé d'utiliser php cURL + dom mais je reçois beaucoup d'erreurs comme ceci "htmlParseEntityRef: expecting ';' Entité en ligne: 243" et aucun résultat affichéExtrait une partie spécifique d'un document html, php cURL, php, preg_match
Aussi j'essayé d'utiliser preg_match ou preg_match_all mais ne fonctionne pas non plus.
Un exemple très basique serait très apprécié!
Je pense que la solution DOM ne fonctionne pas en raison du fait que la page n'est pas valide xhtml ou xml – Michael
Peut-être poster vos regexps que vous avez essayé qui ne fonctionnent pas. Ces modèles semblent assez simples. – serg
** Don utiliser regex pour analyser HTML **, utiliser un [html dom parser à la place] (http://simplehtmldom.sourceforge.net/) il supporte le HTML invalide. –