2012-02-07 3 views
5

Je suis en train de concevoir une API qui prend une URL comme une entrée, et lit le contenu à cette URL. Lorsque l'URL est un protocole "file:", qu'est-ce qui ferait un meilleur défaut pour l'encodage des caractères?Quel devrait être le codage par défaut pour une API qui lit à partir d'une URL en utilisant le fichier: protocole?

  • UTF-8
natif du système de codage
  • L'API permet de le définir explicitement. En outre, il existe quelques heuristiques que nous pouvons utiliser pour déterminer le codage de caractères, comme la nomenclature si elle est disponible, mais lorsque toutes ces erreurs échouent, quel devrait être le comportement par défaut? Pour autant que je sache, les normes sont muettes sur ce problème. Toutes choses étant égales par ailleurs, je veux que la bonne chose se produise le plus souvent pour quelqu'un qui ne sait même pas qu'il existe un encodage de caractères.

  • Répondre

    2

    Utilisez toujours UTF-8 si possible et documentez-le dans votre documentation API. UTF-8 est un standard solide pour l'encodage et très futuriste - j'éviterais de générer du travail potentiel en supportant d'autres encodages - UTF-8 sera également facile à utiliser si vous migrez l'API pour qu'elle soit utilisée de telle sorte que il peut être consulté via un service Web.

    Questions connexes