2009-12-03 4 views
3

J'ai une liste de 6000 noms de sociétés (avec leur adresse de siège social) et j'ai besoin de trouver l'adresse Web pour chacun d'eux. J'envisage d'utiliser l'API Web de Google (cela demandera évidemment quelques jours, puisque seulement 1 000 requêtes par jour sont autorisées) pour ce faire (recherchez «COMPANY_NAME CITY STATE») et ensuite, prenez le premier résultat. Cependant, je ne suis pas sûr à 100% que cela fonctionnera, et je pense qu'il y a un meilleur moyen. Je peux le faire dans n'importe quelle langue que je connais vraiment, C++, Java, PHP, Python. Cela doit seulement être exécuté une fois.Trouver des sites Web à partir du nom de l'entreprise

Comment utiliser le WHOIS pour cela? Je sais comment je le ferais si je connaissais déjà l'URL, mais pas l'inverse (nom de l'URL). Et que ferais-je si elle était enregistrée en privé?

BTW, ce sont des entreprises américaines.

+1

pas vraiment une stratégie, mais le WHOIS du domaine et la vérification de l'entité et de l'adresse enregistrées est une bonne vérification de la santé mentale. – Jimmy

+1

Toute localité particulière pour les entreprises, par ex. États-Unis, Royaume-Uni - ou mondial? – Joel

Répondre

0

Vous pouvez utiliser le WHOIS au lieu de l'API Google pour cela.

0

Utilisez Amazons Mechanical Turk. Il est parfait pour ce genre de tâches qui peuvent être difficiles à automatiser et nécessitent généralement une personne pour les valider. Cela coûtera un peu, mais cela devrait être gérable, en fonction de la qualité des résultats.

+0

... mturk ne peut être utilisé que si vous fournissez une adresse aux États-Unis lors de l'enregistrement, par exemple. – Phil

Questions connexes