Qu'est-ce que les robots des moteurs de recherche utilisent comme point de départ? Est-ce la recherche DNS ou commence-t-on par une liste fixe de sites connus? Des suppositions ou des suggestions?Où les moteurs de recherche commencent-ils à explorer?
Répondre
Votre question peut être interprétée de deux façons:
demandez-vous où les moteurs de recherche commencent leur exploration de manière générale, ou où ils commencent à explorer un site en particulier?
Je ne sais pas comment fonctionnent les gros joueurs; mais si vous deviez créer votre propre moteur de recherche, vous le doteriez probablement de sites portails populaires. DMOZ.org semble être un point de départ populaire. Puisque les gros joueurs ont tellement plus de données que nous, ils commencent probablement leurs explorations à partir d'une variété d'endroits.
Si vous vous demandez où une SE commence à explorer votre site en particulier, il a probablement beaucoup à voir avec lequel de vos pages sont les plus populaires. J'imagine que si vous avez une page super populaire avec laquelle beaucoup d'autres sites pointent, alors ce serait la page à partir de laquelle les SE vont entrer, car il y a tellement plus de points d'entrée d'autres sites.
Notez que je ne suis pas en SEO ou quoi que ce soit; Je viens d'étudier le trafic bot et SE pendant un certain temps pour un projet sur lequel je travaillais.
Vous pouvez soumettre votre site aux moteurs de recherche en utilisant leur site submission forms - cela vous entrer dans leur système. Lorsque vous êtes réellement ramper après cela est impossible à dire - de l'expérience, il est généralement d'environ une semaine pour une exploration initiale (page d'accueil, quelques autres pages 1-lien profond à partir de là). sitemap - vous permet de lister toutes vos pages et de les peser les unes par rapport aux autres, ce qui aide les moteurs de recherche à comprendre l'importance que vous leur attribuez. chaque partie du site par rapport aux autres.
Si votre site est lié à partir d'autres sites explorés, alors votre site sera également analysé, en commençant par la page liée, et éventuellement se propager au reste de votre site. Cela peut prendre beaucoup de temps, et dépend de la fréquence d'exploration des sites de liaison, donc la soumission d'url est le moyen le plus rapide de faire savoir à google à votre sujet!
Un outil que je ne peux pas recommander est très assez la Google Webmaster Tool. Il vous permet de voir à quelle fréquence vous avez été exploré, toutes les erreurs que le googlebot a trébuché (liens brisés, etc.) et contient une foule d'autres outils utiles.
En principe, ils partent de rien. Ce n'est que lorsque quelqu'un leur dit explicitement d'inclure leur site Web qu'ils peuvent commencer à explorer ce site et utiliser les liens de ce site pour en rechercher d'autres.
Cependant, dans la pratique du créateur (s) d'un moteur de recherche mis sur certains sites arbitraires qu'ils peuvent penser. Par exemple, leurs propres blogs ou les sites qu'ils ont dans leurs favoris.
En théorie, on pourrait aussi simplement choisir certains au hasard et voir adresses s'il y a un site là-bas. Je doute que quelqu'un fasse cela cependant; la méthode ci-dessus fonctionnera très bien et ne nécessite pas de codage supplémentaire juste pour démarrer le moteur de recherche.
- 1. Rendre la page de recherche joomla conviviale pour les moteurs de recherche
- 2. ne les moteurs de recherche lire <!-- --> et est-il detremental aux résultats de recherche
- 3. Quel est le niveau actuel de support XHTML dans les navigateurs et les moteurs de recherche?
- 4. Obtenir des moteurs de recherche à lier à des sous-pages au lieu de l'index
- 5. Les moteurs de recherche peuvent-ils indexer les pages Web générées par JavaScript?
- 6. Les moteurs de recherche peuvent-ils indexer les pages générées par le code côté serveur?
- 7. Installer le fournisseur de recherche [Internet Explorer]
- 8. Est-il possible d'empêcher les robots des moteurs de recherche d'explorer à l'infini les liens de radiomessagerie dans les résultats de recherche?
- 9. Comment arrêter l'indexation d'une page de maintenance par les moteurs de recherche?
- 10. Les moteurs de recherche tiennent-ils compte des rôles ARIA (http://www.w3.org/TR/wai-aria/)?
- 11. Est-ce que les moteurs de recherche pénaliseront le texte caché par javascript?
- 12. Vous connaissez les moteurs de template JavaScript?
- 13. Comment informer les moteurs de recherche que mon site est arrêté depuis un certain temps?
- 14. Sous requête de recherche Où X (à partir de ...?
- 15. Drupal: où afficher les résultats de recherche personnalisés
- 16. Comment rendre le contenu Flex RIA accessible aux moteurs de recherche comme Google?
- 17. Comment puis-je obtenir des informations de requête de moteurs de recherche
- 18. Utilisation excessive de DIVs imbriquées. Mauvaise pratique ou mauvaise pour l'indexation des moteurs de recherche?
- 19. Bons moteurs de galerie d'images
- 20. Représenter des caractères non-ASCII dans les URLs donne un meilleur classement dans les moteurs de recherche?
- 21. Où DLLImport recherche-t-il les DLL non managées?
- 22. Comment dire aux moteurs de recherche que 2 noms de domaine sont le même site?
- 23. Moteurs de recherche pour téléphones mobiles (iPhone, Windows CE, Symbian, Android)?
- 24. La conception de l'URL affecte-t-elle le classement des pages dans les résultats des moteurs de recherche?
- 25. Comment fonctionnent les moteurs de rendu 2d basés sur Scanline?
- 26. Ordre de calcul et itérations pour les moteurs physiques
- 27. Comment choisissez-vous les moteurs de stockage pour Oracle?
- 28. Source pour moteurs de rails mis à jour
- 29. Les moteurs de jeu 3D pour Ruby ou Python?
- 30. Comment puis-je créer une URL délimitée par des liens entre les moteurs de recherche dans une chaîne?
Cette question semble être hors sujet car il ne s'agit pas de programmation. Voir [Quels sujets puis-je poser à ce sujet?] (Http://stackoverflow.com/help/on-topic) dans le centre d'aide. Peut-être [Web Apps Stack Exchange] (http://webapps.stackexchange.com/) serait un meilleur endroit à demander. – jww