J'ai une URL qui contient des caractères spéciaux. Par exemple:Dois-je encoder des caractères spéciaux dans mes sitemaps?
http://www.example.com/bléèàû.html
Si vous tapez cette URL dans un navigateur, mon serveur web témoignerait de la bonne page (il peut gérer un caractère spécial).
J'ai regardé le sitemaps specs et il n'est pas clair si le fichier sitemaps peut contenir des caractères spéciaux. D'après ce que je comprends du protocole, si l'URL fonctionne correctement et que le serveur sert la bonne page et que le fichier XML est codé en UTF-8, alors c'est bon.
Par exemple, cette entrée est une entrée de sitemaps valide:
<url>
<loc>http://www.example.com/bléèàû.html</loc>
<changefreq>weekly</changefreq>
</url>
Tout le monde peut le confirmer? [Mise à jour] La raison pour laquelle je suis réticent à encoder les caractères spéciaux est que je ne veux pas introduire d'URL en double pour le même contenu. Par exemple
http://www.example.com/bl%C3%A9%C3%A8%C3%A0%C3%BB.html
et
http://www.example.com/bléèàû.html
servirait la même page. Je suppose que Google attraperait les deux URL avec son indexation normale et les sitemaps. Malheureusement, Google a tendance à dégrader le classement des sites dont les URL en double pointent vers la même page.