de Possible en double:
Make a JavaScript-aware Crawlergrattoir Web qui gère JavaScript
J'essaie de comprendre ce à utiliser comme base pour un grattoir web basé sur PHP qui peut gérer des pages rendre en utilisant JavaScript. De nombreuses tentatives de raclement de sites Web (au moins celles que je gère) échouent maintenant à moins que le JS de ces pages ne soit exécuté. Les pages ne sont pas conçues pour revenir aux implémentations sans script. Cela inclut ceux qui utilisent intensément AJAX. Est-ce que n'importe qui aurait des suggestions par où commencer avec le développement d'un grattoir de Web qui peut manipuler des pages Web modernes et lourdement dépendantes de JavaScript?
Quelque chose qui peut être utilisé par PHP serait le meilleur.
Quelle est votre page de grattage? pour quel contenu? –
Vous ne pouvez pas gratter une page JS avec PHP –
@Dragon Beaucoup de pages différentes avec beaucoup de contenu différent. Certains sites ne fonctionneront pas du tout sans JS. Désolé de paraître vague. Une partie est un travail privé pour les clients. – eComEvo