2009-03-16 6 views
2

Est-ce que certaines araignées/robots suppriment des espaces des noms de fichiers et donc des espaces dans les noms de fichiers devraient-ils être évités sur les sites Web?Site Web Araignées/Robots supprimant des espaces dans les noms de fichiers

+0

Tout d'abord, cela ressemble à une légende urbaine. Plus important encore, si l'application spidering de quelqu'un ne peut pas gérer certains noms, pourquoi vous en souciez-vous? –

+0

Je reçois régulièrement une erreur de mon site Web qui semble provenir d'une araignée, donc c'est un problème de la vie réelle. Je tiens à ce que mon site soit aussi accessible que possible et ne veuille pas perdre de temps à chercher des erreurs! – AJM

Répondre

3

Une fois, j'appris que j'éviter de mélanger majuscules et minuscules, ainsi que les caractères spéciaux (utilisez uniquement ASCII) et des espaces. Puisque dans l'URL ils peuvent avoir besoin d'être échappé - difficile à taper manuellement (pour tester) et probablement être supervisé.

Vous pourriez avoir aussi bien des problèmes avec certains robots bizarres ne fonctionnent pas correctement, mais je ne suis pas au courant d'un.

3

Je pense que vous devriez éviter les espaces dans les noms de fichiers du site en général, et utiliser d'autres méthodes comme

ThisIsAnExample 
This_is_an_example 

Vous ne savez jamais quel logiciel, script ou serveur doit gérer vos noms de fichiers et si cela conduira à des erreurs. De plus, les personnes qui utilisent votre site Web pourraient ne pas aimer gérer les URL qui contiennent quelque chose comme

This%20is%20an%20example 
+0

Les espaces ne sont également pas reconnus par certains scripts de détection de lien dans les scripts de blog/commentaire, ce qui réduit la possibilité que l'URL apparaisse en tant que lien dans le contenu généré par l'utilisateur. – Jacco

2

Je ne connais pas le comportement exact des robots, mais j'imagine que la plupart, sinon tous, devraient être capables de gérer des espaces dans les noms de fichiers de sites Web. Cela dit, les meilleures pratiques recommandent de ne pas utiliser d'espaces dans les noms de fichiers sur le Web. C'est moins un problème aujourd'hui, puis il y a quelques années, quand les navigateurs faisaient encore la différence entre l'espace et% 20, mais il ne peut pas faire de mal de suivre cette convention.

+0

oubliez-le, la plupart des robots sont de la merde. Ils devraient être capables de gérer des choses de base comme les URL .. mais beaucoup échouent. – Jacco

3

Je suis avec schnaader à ce sujet - certainement éviter les espaces, si possible. Cela vous aidera à éviter les problèmes d'encodage d'URL tels que this one.

Cela dit, vous devrez parfois les utiliser de toute façon. Il suffit de réaliser que vous pourriez avoir à faire un peu de travail supplémentaire pour aider les visiteurs avec des navigateurs originaux.

1

Et n'oubliez pas que pour les robots utilisant "_" ou "-" questions.

I.e. Google traite les tirets comme des séparateurs de mots, de sorte que l'url "articles archivés" sera vu comme 2 mots, tandis que "archives_archives" sera vu comme 1.

+0

Hmm? Vous dites que "archived_articles" est la même chose que "archivedarticles"? Pourquoi utiliser le trait de soulignement alors? – core

+0

Ce n'est plus pertinent; Les soulignements sont maintenant séparateurs de mots, proclame Google: http://news.cnet.com/8301-10784_3-9748779-7.html – Jacco

Questions connexes