Je voudrais savoir combien de pages publiques il y a dans un site, disons, par exemple, smashingmagzine.com. Est-il possible de compter le nombre de pages?Compter le nombre de pages dans un site
Répondre
Vous devez essentiellement explorer le site. Votre processus serait quelque chose comme:
- Démarrer au domaine racine/page d'accueil
- Rechercher tous les liens qui pointent dans le même domaine
- Pour chacun de ces liens, répétez les étapes
Votre boucle se termine lorsqu'il n'y a plus de liens vers l'analyse qui pointent dans le même domaine. N'oubliez pas de rester sur le site, sinon vous commencerez à explorer des sites externes.
Vous pouvez également essayer d'analyser le sitemap s'il en fournit un.
Un outil qui pourrait s'avérer utile si vous utilisez Java est JSpider ou Sphider en PHP.
Vous devrez analyser de manière récursive le balisage de chaque page, en commençant par votre page de niveau supérieur, en recherchant tout type de liens vers d'autres pages et en les parcourant de manière récursive. Vous aurez également besoin de garder une trace de ce qui a été scanné pour ne pas être pris dans une boucle infinie.
Vous pouvez interroger l'index de Google à l'aide de l'opérateur site
. par exemple:
site:domain-to-query.com
Cela retournera une liste des pages du site qui sont actuellement indexées par Google. D'autres moteurs de recherche offrent des fonctionnalités similaires mais je ne connais pas la syntaxe.
Bien sûr, toutes les pages ne peuvent pas être indexées et l'index peut contenir des pages qui n'existent plus.
J'aime l'idée de laisser Google faire tout le dur travail ... –
- 1. nombre de pages dans un fichier pdf
- 2. compter le nombre d'entrées dans un mois
- 3. erreur itext OutOfMemory tout en essayant de compter le nombre de pages dans un fichier pdf
- 4. PHP - Obtenir le nombre de pages dans un document Word
- 5. imagick binaire pour compter le nombre de pages dans un fichier pdf
- 6. Comment compter le nombre de pages dans un fichier Microsoft Word en utilisant Ruby?
- 7. pour compter le nombre
- 8. MySQL - Compter un nombre?
- 9. compter le nombre de messages
- 10. compter le nombre de clics dans un intervalle de temps
- 11. Comment compter le nombre de pages vues par jour du mois dans MySQL?
- 12. Compter le nombre d'éléments ayant un score
- 13. Comment compter le nombre de bits zéro dans un entier?
- 14. compter le nombre d'élément de même classe dans un div?
- 15. compter le nombre de fichiers dans un dossier
- 16. Comment compter le nombre de clés dupliquées dans un tableau?
- 17. Compter le nombre de doublons dans un tableau?
- 18. Comment compter le nombre de fonctions dans un projet C++?
- 19. Comment compter le nombre de lignes dans un jqGrid?
- 20. Compter le nombre de cycles dans un noyau CUDA
- 21. compter le nombre de lignes dans un fichier texte
- 22. compter le nombre de résidus dans un fichier fasta
- 23. Comment compter le nombre de fichiers dans un répertoire Linux?
- 24. Compter le nombre de sélecteurs dans un fichier css
- 25. compter le nombre de résidus dans un fichier
- 26. Quelle est la bonne façon de compter le nombre total de visiteurs sur un site web?
- 27. Nombre de pages dans un document doc en java
- 28. comment compter le nombre d'associations
- 29. Compter le nombre d'objets dans une image
- 30. Problèmes avec un grand nombre de pages statiques dans le site Web
Comment vérifier si je suis toujours sur le même domaine? RegEx? –
Vous pouvez voir les hôtes de l'URL liée. Un analyseur d'URL peut facilement vous obtenir cette information en PHP. –