est-Snoopy que bien connu/maturité d'un paquet? Si ce n'est pas le cas, toutes choses égales par ailleurs, j'irais probablement avec du code DOM HTML générique - surtout si le grattage est quelque peu simple. Mais seulement vous savez quand votre code commence à devenir trop grand, ingérable, etc., à quel point il pourrait être préférable de regarder un autre outil là-bas comme Snoopy. Pour ceux qui ne le connaissent pas, il est évident que je n'en ai pas l'expérience: «Snoopy est une classe PHP qui simule un navigateur Web et automatise la tâche de récupération du contenu de la page Web et poster des formulaires, par exemple. ")
La vraie raison pour laquelle je poste, même si je ne connais pas Snoopy en soi et que je ne peux donc pas répondre définitivement à votre question, est de vous demander si vous avez envisagé d'utiliser Selenium (http://www.seleniumhq.org/) au lieu de Snoopy. Le sélénium est un outil de test assez connu, et il m'est venu à l'esprit que l'un des avantages de l'utiliser pour ce que vous faites (si vous le pouvez) est qu'il a intégré des tests.
La raison pour laquelle cela est bon est que le scraping d'écran est une sorte de tâche intrinsèquement fragile - si le site cible change quelque chose, blam, votre scraping échoue. C'est donc un bon design d'avoir un système automatisé de grattage/test-that-scraping-travaillé.
Quelque chose à penser, de toute façon.
Cela dépend de ce que vous voulez faire. Post plus de détails, s'il vous plaît ... –