J'expérimente en extrayant certaines pages d'un flux RSS en utilisant curl et php. Le grattage de la page fonctionnait correctement lorsque j'utilisais des liens réels, pas des liens provenant des flux rss. Cependant, je me rends compte maintenant que les liens dans les flux rss sont généralement juste des redirections vers la page réelle (du moins c'est ce que cela semble être). Parce que maintenant, quand je gratte une page avec le lien rss, je ne trouve pas l'information que je recherche.Obtenir un vrai lien à partir du lien de flux rss
Est-ce que quelqu'un a rencontré ceci et sait d'une solution de contournement. Y at-il de toute façon de voir où redirige le lien RSS et de capturer cette valeur?
merci, ouais j'ai réussi à trouver un script qui boucle les redirections et trouve le dernier. Il semble que la plupart des sites ne bloquent pas par useragent, mais il y en a. – pfunc