Est-ce que tous ces types de sites écorchent illégalement Google ou un autre moteur de recherche? Pour autant que je sache, il n'existe pas de moyen «légal» d'obtenir ces données pour un site commercial. api (http://developer.yahoo.com/search/siteexplorer/V1/inlinkData.html) est seulement pour une utilisation non commerciale, Yahoo! Le patron n'autorise pas les requêtes automatisées, etc.
Des idées?Comment les sites comme Hubspot suivent-ils les liens entrants?
Répondre
Par exemple, si vous voulez trouver tous les liens vers la page d'accueil de Google, recherchez
link:http://www.google.com
Donc, si vous voulez trouver tous les liens entrants, vous pouvez simplement parcourir l'arbre de votre site Web, et pour chaque élément trouvé, créez une URL. Puis interroger Google pour:
link:URL
Et vous obtiendrez une collection de tous les liens que Google a d'autres sites Web dans votre site Web. Pour ce qui est de la légalité d'une telle récolte, je suis sûr qu'il n'est pas tout à fait légal d'en tirer profit, mais cela n'a jamais été arrêté auparavant?
(donc je ne viendrais pas se demander s'ils l'ont fait ou non. Il suffit de supposer qu'ils le font.)
Je ne sais pas ce que HubSpot faire, mais, si vous voulez savoir quels sites un lien vers votre site, et vous n'avez pas le matériel pour explorer le Web, une chose que vous pouvez faire est de surveiller le HTTP_REFERER des visiteurs de votre site. C'est, par exemple, comment Google Analytics (pour autant que je sache) peut vous dire d'où viennent vos visiteurs. Ce n'est pas fiable à 100% car tous les navigateurs ne le définissent pas, en particulier en "Mode de confidentialité", mais vous n'avez besoin que d'un visiteur par lien pour savoir qu'il existe! Ceci est souvent accompli en intégrant un script dans chacune de vos pages Web (souvent dans un en-tête ou un pied de page commun). Par exemple, si vous examinez la source de la page que vous êtes en train de lire, vous trouverez (au bas de la page) un script qui renvoie à Google les informations relatives à votre visite. Maintenant, cela ne vous dira pas s'il y a des liens que personne n'a jamais utilisé pour accéder à votre site, mais soyons réalistes, ils sont beaucoup moins intéressants que ceux que les gens utilisent.
Exactement raison, je pense - en regardant les captures d'écran exemple de Hubspot, vous pouvez voir que chaque lien entrant suivi unique a eu à un visiteur de celui-ci. Pour exposer, les données de provenance peuvent être obtenues à partir de journaux ou via l'intégration de quelque chose dans votre site. –
- 1. Comment faire apparaître les liens entrants comme une liste déroulante dans le wiki Sharepoint?
- 2. Geeky urls à Search Engine Friendly urls dans IIS sans sacrifier les liens entrants
- 3. Remplacer les liens locaux, conserver les liens externes
- 4. Comment obtenir tous les liens Twitter?
- 5. Comment Firefox rend les liens
- 6. convertir les liens JavaScript aux liens standards
- 7. Tester les sites SharePoint
- 8. Comment gérer les modèles pour les sites Web MVC?
- 9. Comment puis-je parcourir les liens de manière récursive sans devoir revoir les liens?
- 10. Lier les liens profonds et les liens d'ancrage nommés
- 11. comment utiliser to_sentence pour les liens?
- 12. Comment stocker les liens entre les pages d'un CMS
- 13. Comment énumérer tous les sites Web et les données dans une collection de sites SharePoint
- 14. Les liens hypertexte disparaissent
- 15. css avec les liens
- 16. Django, comment les liens publics sur Facebook?
- 17. Comment analyser les liens en sortie bash
- 18. comment afficher les liens hypertexte dans jqGrid
- 19. Comment styliser les liens via le textile?
- 20. Comment les services hébergés comme UserVoice intègrent-ils leur contenu sur d'autres sites Web?
- 21. Comment extraire les liens du HTML en utilisant regex?
- 22. Google Analytics et Hubspot Retarder l'exécution Javascript
- 23. Les liens symboliques dans Windows
- 24. objectif c apprendre les sites Web
- 25. PHP: Télécharger les e-mails entrants depuis POP3 ou IMAP, les analyser et les marquer comme lus/supprimés sur le serveur
- 26. ColdFusion redirige les liens vers Joomla
- 27. Trier la liste "Mes sites SharePoint" dans "Mes liens"
- 28. Comment gérez-vous les réponses non sollicitées (comme les appels/textes entrants) lorsque vous manipulez des SMS avec un modem GSM?
- 29. asp.net 3.5 réécriture d'url/routage pour les sites Web multilingues
- 30. Comment synchroniser les mises à jour sur différents sites? .Net
Ils pourraient simplement explorer le web ... des sites comme http://www.80legs.com/ le rendent plus facile. –