2012-12-22 4 views
-2

Possible en double:
Convert Latin 1 encoded UTF8 to UnicodeConvertir latin1 à UTF8 en C#

Je veux convertir latin1 (ISO-8859-1) à UTF8 en C#. Quelle est la meilleure façon de procéder?

Ma chaîne est "C ô ng ty TNHH TM v à DL Việt Hương".

+0

Merci, mais ce n'est pas résolu !! – hainv

+2

Ce n'est pas une chaîne ISO-8859-1 valide. Il n'y a pas de caractères vietnamiens en Latin-1. Voici [la page de code Latin-1] (http://en.wikipedia.org/wiki/ISO/IEC_8859-1#Codepage_layout); Si vous ne voyez pas votre personnage, il n'est pas disponible pour la conversion. –

+0

Question de fermeture en tant que doublon d'une question qui est un non-sens complet (que diable est "Latin 1 codé UTF8"?!) Me semble faux. Bien que cette question est imparfaite, comme indiqué par @MichaelPetrotta notes ci-dessus, je vote pour le rouvrir; il ne peut pas être une copie d'une question sur la conversion de "UTF8 encodé en latin 1" en unicode parce que c'est * complètement dénué de sens *. –

Répondre

1

convertir latin1 (ISO-8859-1) à UTF8 en C#:

Encoding.UTF8.GetString(Encoding.GetEncoding("iso-8859-1").getBytes(s)) 

OU

En utilisation C-Sharp System.Text:

byte[] utf8Bytes = Encoding.UTF8.GetBytes("ASCII to UTF8"); 
byte[] isoBytes = Encoding.Convert(Encoding.ASCII, Encoding.UTF8, utf8Bytes); 
string uf8converted = Encoding.UTF8.GetString(isoBytes); 

Source:

Convert Latin 1 encoded UTF8 to Unicode

C# Convert string from UTF-8 to ISO-8859-1 (Latin1) H

+0

Ma chaîne est "C ô ng ty TNHH TM v à DL Việt Hương" lors de l'utilisation de http://www.unicodetools.com/unicode/utf8-to-latin-converter.php le résultat est correct mais en utilisant Encoding.UTF8.GetString (Encoding.GetEncoding ("iso-8859-1") .getBytes (s)) est incorrect. – hainv

+0

Le convertisseur de site Web pour latin1 en utf8 doit utiliser un algorithme qui peut gérer les caractères non latin1 lors de la conversion de latin1 en UTF8. Donc, il semble que C# soit moins tolérant quand on nourrit des caractères non-latins, alors que le site Web est capable de faire une supposition éclairée sur les caractères invalides. La question devient, quel algorithme utilise le site et dans quelle langue est-il écrit? –

+0

Oui, ce site ne fait pas du bon travail avec la chaîne de l'OP non plus. Pas que je m'y attendais - sans connaître la page de codes source, cela revient à deviner. Je ne l'appellerais certainement pas "correct". –

Questions connexes