Je combinerais la suggestion de Sklivvz avec au moins l'inspection d'étiquette de titre et si possible les enregistrements de Whois.
Si vous lisez l'avis de copyright de stackoverflow.com, vous finirez par "stackoverflow.com" ou "stackoverflow.com LLC", ce qui n'est pas pertinent.
Dans l'exemple de maxmind.com si vous lisez la notice légale "Copyright © 2009 MaxMind, Inc." vous vous retrouvez avec "MaxMind" ou "MaxMind, Inc.", si vous combinez avec la balise de titre "Géolocalisation et prévention de la fraude en ligne de MaxMind" le seul mot qui apparaît aux deux endroits est MaxMind.
Également domaintools.com casse le nom de domaine en mots (tout le monde peut changer si), vous pouvez analyser cette page et saisir le nom de « vrai », quelques exemples:
http://whois.domaintools.com/maxmind.com = Max Mind
http://whois.domaintools.com/dabbledb.com = Dabble Db
http://whois.domaintools.com/domaintools.com = Domain Tools
http://whois.domaintools.com/stackoverflow.com = Stack Overflow
http://whois.domaintools.com/joelonsoftware.com = Joel On Software
aboutus.org pourrait aussi être une référence très bien quand avaliable :
http://aboutus.org/maxmind.com = MaxMind LLC
http://aboutus.org/dabbledb.com = ...
http://aboutus.org/domaintools.com = DomainTools.com
http://aboutus.org/stackoverflow.com = Stack Overflow AG
http://aboutus.org/joelonsoftware.com = Fog Creek Software Inc.
Merci pour la suggestion de symbole de copyright! Je pense que cela devrait fonctionner pour la plupart des cas sans échec. Toute entreprise qui ferait de vraies affaires ajouterait certainement ceci sur son site Web. ! –
Ce serait génial si vous pouviez nous mettre à jour pour savoir si cela a fonctionné! =) – Sklivvz
sûr! J'ai l'intention de pirater un peu de code ce soir et de l'exécuter sur des données de test composées de quelques centaines de sites Web pour voir le résultat. –