Avant que quelqu'un ne me recommande de faire une recherche google sur ce sujet, j'ai. J'ai juste besoin d'un peu plus de clarté sur ce que les pages de codes et les encodages. Si j'utilise l'encodage UTF8 et que j'utilise une page de code en italien puis une page de code en français, est-ce que cela signifie que les caractères seront différents même si les octets n'ont pas changé?Codepages et encodages
Répondre
Joel a un bon résumé de ce:
http://www.joelonsoftware.com/articles/Unicode.html
Et non. Si je comprends bien votre question, cela ne veut pas dire cela. Lorsque vous convertissez UTF-8 à une page de codes spécifique, il est possible que seuls certains des caractères vont être convertis. Ce qui arrive à ceux qui ne sont pas convertis dépend de la façon dont vous appelez la conversion. Un résultat possible est que les caractères qui n'ont pas pu être mappés à la page de codes seraient convertis en caractères de point d'interrogation.
Un codage est simplement un mappage entre des valeurs numériques et des "caractères". US-ASCII mappe le nombre 65 à la lettre A, 32 à un espace et 49 au chiffre "1". (Comment ces choses sont rendues est une autre affaire.) En fait, UTF-8 fait la même chose! Mais il existe d'autres valeurs que UTF-8 traite différemment de l'ASCII. C'est un codage à longueur variable, c'est-à-dire qu'un caractère peut être codé avec 1, 2, 3 ou 4 octets; les caractères communs consomment généralement moins d'octets.
Les fichiers texte, y compris les pages Web, sont stockés et transmis sous la forme de séquences d'octets. Ces octets sont censés représenter quelque chose de textuel. Les applications logicielles (comme les éditeurs de texte et les navigateurs Web) sont chargées de déchiffrer les informations contenues dans ces fichiers à l'écran. Habituellement, ils utilisent des fonctions de bibliothèque ou de système d'exploitation.
Si le logiciel suppose un codage différent du logiciel qui a créé le fichier, les mauvais caractères peuvent s'afficher!
Notez qu'il est possible de convertir entre différents codages; Cependant, si vous convertissez en un encodage qui ne contient pas un certain caractère, le logiciel doit faire un choix quant à ce qu'il doit utiliser à la place. Cette conversion se produit souvent de manière transparente (lorsque vous enregistrez un fichier avec un certain encodage, tout ce que vous avez tapé doit être changé en ce codage).
UTF-8 inclut tous les caractères de votre page de codes en français et en italien, mais les pages de codes spécifiques aux langues n'incluent pas tous les autres caractères.
Ainsi, vous pouvez prendre des entrées de chaque langue et les convertir en UTF-8 pour le stockage, mais vous ne pouvez pas être certain que vous obtiendrez les bons caractères si vous prenez l'italien et le montrez comme français.
Utilisez UTF-8 tout le chemin si vous le pouvez.
- 1. C# HttpRequest et différents encodages
- 2. Liste des encodages de caractères
- 3. R encodages de caractères sur Windows, Mac et Linux
- 4. Traiter une chaîne contenant plusieurs encodages de caractères
- 5. Comment puis-je identifier différents encodages sans utiliser de nomenclature?
- 6. Comment transporter des données entre différents encodages de base de données?
- 7. Accès à une fonction sur la base de données Lien avec encodages dans Oracle
- 8. Boîte de dialogue Ouvrir un fichier avec des encodages combobox sous Vista
- 9. Les encodages d'entités XHTML sont-ils valides dans les documents XML tant qu'ils sont contenus dans des balises CDATA?
- 10. Obtenir une "séquence d'octets invalide en US-ASCII" quand j'essaye de télécharger un fichier dans Ramaze et Ruby 1.9
- 11. WebService: Différence entre mon pc et mon serveur
- 12. Problème d'encodage étrange
- 13. Postsharp et log4net et log4postsharp
- 14. Spring et JSF et JPA
- 15. Problème de codage - Win Xp vs Win 2003
- 16. Pourquoi NSString et NSLog semblent-ils gérer% C et% lc (et% S et% ls) différemment?
- 17. Emballage et minimisation HTML et CSS
- 18. Django i18n et python locales (et dates)
- 19. Makefile et .Mak File + CodeBlocks et VStudio
- 20. OOP design et Listes et collections (C#)
- 21. Index ASP.NET MVC et index et listes
- 22. Fichiers DLL et LIB - quoi et pourquoi?
- 23. Cordes et ints, implicites et explicites
- 24. HTTPS et HTTParty - Timeout et EOF
- 25. SharePoint, List.Items et List.GetItems (requête) et Linq
- 26. Avantages et inconvénients de DFC et DFS?
- 27. DateTimePicker et UserPaint ... Texte et bouton manquant
- 28. Infinity, ActiveRecord et MySQL: stockage et comparaison
- 29. Différences entre Java et C# et .NET
- 30. Comment obtenir des données à partir d'une URL et l'enregistrer dans un fichier binaire en C# .NET sans le désordre d'encodage?
Pourquoi cela a-t-il été réduit? La question n'a pas été formulée très clairement, mais cette réponse me semble correcte. –