2009-09-20 4 views
0

Je cours un tas de manuscrits qui raclent des données d'un site Web. Pour des raisons que je ne vous ennuierai pas, je ne peux pas les faire tous partir du même hôte - à la place, j'ai besoin de mettre en place six hôtes différents. Je veux configurer ma configuration d'hébergement pour masquer le fait que les six hôtes ont le même propriétaire.Configuration optimale pour le désordre Identité de Scraping

J'ai six comptes d'hébergement partagés différents situés dans des zones géographiques différentes. Y a-t-il autre chose que je dois faire? Devrait acheter un nom de domaine différent pour chaque hôte? Si non, quel domaine dois-je donner à chaque hôte?

+1

J'ai le sentiment que ces raisons ne m'ennuieraient pas du tout. – JoshJordan

+0

Juste une suggestion, mais vous pourriez obtenir plus de réponses si vous pouviez fournir une justification éthique pour expliquer pourquoi vous faites cela. – TrueWill

+0

Avez-vous vérifié si le propriétaire du site Web a une API publique que vous pouvez utiliser à la place? – RichardOD

Répondre

1

Vous pouvez configurer plusieurs instances de TOR, configurer chacune d'elles avec un port de contrôle séparé et exécuter vos éraflures sur un ordinateur, chacune utilisant un TOR séparé. Cela fera passer chaque requête HTTP à travers des chaînes séparées de proxies, et donc quand ils arriveront au site désiré, ils proviendront d'une adresse IP unique.

+0

Intéressant, merci. Je vais vérifier TOR. Juste pour confirmer - le nom de domaine n'est pas pertinent ici, n'est-ce pas? L'adresse IP est tout ce qui compte à des fins de détection? – Jack7890

Questions connexes