2009-08-08 4 views
14

Y a-t-il un moyen/service/base de données en ligne disponible pour convertir un nom de domaine tel que maxmind.com en nom de société "Max Mind Inc." ? Si ce n'est pas le cas, quelqu'un peut-il suggérer une manière programmatique logique d'aborder le problème?Conversion de nom de domaine en nom de société?

Je pensais sur les lignes suivantes:

  1. Prenez le nom de domaine
  2. Visitez le site - essayez de trouver le nom de l'entreprise
  3. Faites un WHOIS - Si le nom de l'entreprise (pas sûr si?) est disponible utiliser que (ne fonctionne pas toujours)

Des suggestions?

Répondre

12

Question poilue! La requête WHOIS échouera spectaculairement dans un certain nombre de cas: serveurs partagés, Akamai ou autres CDN, domaines non liés à l'entreprise, etc. Je viens d'une agence web et je peux vous dire qu'un grand deux chiffres) pourcentage d'entreprises ne se soucient pas de posséder tous leurs noms de domaine - ils ont laissé l'agence web traiter avec elle, en particulier en ce qui concerne les petits sites de promotion.

Mon meilleur conseil serait ceci. Obtenez la page d'accueil ou la carte du site si disponible. Recherchez un symbole de copyright. Cela pourrait se faire sous un nombre limité de formes: "& copy;", "(c)", "©". En outre, le formulaire de déclaration est habituellement soit "société (c) année" ou "(c) société année". De cela, vous pouvez obtenir l'entreprise.

Cela ne fonctionnera pas dans tous les cas, mais c'est probablement votre meilleure option.

+0

Merci pour la suggestion de symbole de copyright! Je pense que cela devrait fonctionner pour la plupart des cas sans échec. Toute entreprise qui ferait de vraies affaires ajouterait certainement ceci sur son site Web. ! –

+0

Ce serait génial si vous pouviez nous mettre à jour pour savoir si cela a fonctionné! =) – Sklivvz

+0

sûr! J'ai l'intention de pirater un peu de code ce soir et de l'exécuter sur des données de test composées de quelques centaines de sites Web pour voir le résultat. –

0

2) Je pense que le point 2 est impossible. le titre d'une page ne contient pas toujours le nom de l'entreprise. et d'autres éléments pourraient être ailleurs sur la page (s'il y a vraiment une étiquette avec le nom de l'entreprise et pas seulement une image). le web est dynamique pour une telle recherche. 3) Y a-t-il vraiment une page d'entreprise sans entrée whois correspondante? il y a beaucoup de domaines là-bas de particuliers (sans nom de société). un blog sur un domaine propre est un tel exemple. vous trouvez le nom de la personne inscrite sur whois, mais vous ne savez pas, si cette personne est l'auteur de la page. Pourquoi avez-vous besoin d'un tel service et n'utilisez pas seulement le nom de domaine?

5

Je combinerais la suggestion de Sklivvz avec au moins l'inspection d'étiquette de titre et si possible les enregistrements de Whois.

Si vous lisez l'avis de copyright de stackoverflow.com, vous finirez par "stackoverflow.com" ou "stackoverflow.com LLC", ce qui n'est pas pertinent.

Dans l'exemple de maxmind.com si vous lisez la notice légale "Copyright © 2009 MaxMind, Inc." vous vous retrouvez avec "MaxMind" ou "MaxMind, Inc.", si vous combinez avec la balise de titre "Géolocalisation et prévention de la fraude en ligne de MaxMind" le seul mot qui apparaît aux deux endroits est MaxMind.

Également domaintools.com casse le nom de domaine en mots (tout le monde peut changer si), vous pouvez analyser cette page et saisir le nom de « vrai », quelques exemples:

http://whois.domaintools.com/maxmind.com = Max Mind 
http://whois.domaintools.com/dabbledb.com = Dabble Db 
http://whois.domaintools.com/domaintools.com = Domain Tools 
http://whois.domaintools.com/stackoverflow.com = Stack Overflow 
http://whois.domaintools.com/joelonsoftware.com = Joel On Software 

aboutus.org pourrait aussi être une référence très bien quand avaliable :

http://aboutus.org/maxmind.com = MaxMind LLC 
http://aboutus.org/dabbledb.com = ... 
http://aboutus.org/domaintools.com = DomainTools.com 
http://aboutus.org/stackoverflow.com = Stack Overflow AG 
http://aboutus.org/joelonsoftware.com = Fog Creek Software Inc. 
3

Check out API Clearbit qui peut obtenir le nom de l'entreprise du nom de domaine: https://clearbit.com/#features

également LinkedIn vient à l'esprit.

+0

Utiliser un service d'enrichissement comme celui-ci est vraiment la meilleure option et devrait être le commentaire accepté. –

Questions connexes