2010-09-14 6 views
2

Étant donné un identifiant de produit, les associés doivent naviguer sur le site Web d'un fournisseur, se connecter, effectuer une recherche, afin d'obtenir des détails sur un produit pour un client. Mes employeurs veulent un programme qui peut utiliser l'identifiant du produit, et naviguer sur le site Web des fournisseurs, et effectuer la recherche et tout pour obtenir l'information, ce qui évite à l'associé de répéter manuellement cette tâche chaque fois qu'un client veut plus d'informations à propos d'un produit.Comment faire un bot pour naviguer sur un site?

Je sais que de nombreux sites utilisent des méthodes pour empêcher (CAPTCHA) exactement ce que j'essaie de faire. Donc je ne sais pas si cela rend automatiquement mon projet donné "maléfique". Mais je n'ai certainement pas d'intentions malveillantes, mes employeurs veulent simplement faire gagner du temps aux associés pour obtenir des informations qu'ils obtiendront malgré tout. Cependant, s'il s'agit d'un «mal», veuillez expliquer pourquoi, afin que je puisse expliquer à mes employeurs pourquoi nous ne devrions pas emprunter cette voie. Cela étant dit ...

Comment puis-je faire quelque chose comme ça en PHP?

+1

'Donc, je ne sais pas si cela rend automatiquement mon projet donné" maléfique ". - Je pense que cela dépend entièrement des conditions d'utilisation du site cible. S'ils n'en ont pas, je suppose que du point de vue juridique, certains défauts s'appliquent. Pour la plupart des juridictions, c'est «probablement» «c'est bien» ou une zone grise - mais seul un avocat peut y répondre correctement. Mais pourquoi ne pas demander la permission aux personnes qui gèrent le site? S'ils sont d'accord, ce serait la meilleure solution. –

+0

@Pekka bon conseil merci. –

+1

Je pense que j'ai entendu dire que Dark Vador travaillait sur un projet similaire et, après tout, il est plutôt méchant. – Adam

Répondre

2

Cela dépend du site auquel vous essayez d'accéder. De nombreux sites ont une API qui peut être utilisée pour accéder aux données. Si ce n'est pas le cas, vous devrez peut-être écrire un programme qui charge le code HTML à l'aide d'une requête GET, analyser la réponse et récupérer les informations souhaitées. Sans plus de détails, c'est la meilleure réponse que je puisse donner.