2009-11-18 8 views
1

La chose que je veux demander est assez simple. J'ai un document HTML qui est hébergé dans un contrôle webbrowser. Maintenant, lorsque je sélectionne un mot coréen en utilisant la propriété de plage MSHTML, je peux obtenir range.htmlText et range.Text. Ils montrent tous les deux le mot coréen. Tout ce que je veux faire est de le convertir au format Unicode.Convertir le texte coréen en Unicode

Est-ce possible?

FYI Je fais tout cela en utilisant C# WinForms.

Répondre

1

Pourriez-vous fournir un peu plus d'informations? Quel est le format du "mot coréen" lorsque vous le lisez? (Je suppose la même que l'en-tête de document HTML.) Pourriez-vous poster un exemple de page HTML à partir de laquelle vous essayez de lire? Si le problème est que la chaîne que vous obtenez est simplement dans une page de code différente, vous pouvez utiliser les classes de codage dans .Net pour le convertir. Par exemple, votre texte est peut-être en iso-2022-kr. Voici un exemple pour convertir votre chaîne, appelée "stringInKoreanIsoEncoding" dans le code ci-dessous:

Encoding koreanEncoding = Encoding.GetEncoding(50225); // 50225 is the code page for iso-2022-kr 
byte[] convertedToUtf8 = Encoding.Convert(koreanEncoding, Encoding.UTF8, koreanEncoding.GetBytes(stringInKoreanIsoEncoding)); 
string utf8String = Encoding.UTF8.GetString(convertedToUtf8); 
Questions connexes