Récemment, j'ai découvert Unicode et téléchargé son code. Et tester sur Visual Studio pour différents supports linguistiques.Comment Visual Studio stocke-t-il des mots chinois à plusieurs octets
J'utilise un mot chinois pour un exemple, c'est 我. Chinois Charcter 我, le numéro Unicode est U-6211.
Je vérifie comment studio visuel a stocké ce mot, et découvre que la chaîne est CED2, par exemple.
#include <stdio.h>
int main(void)
{
unsigned char *p="我";
while(*p)
{
fprintf(stdout, "%2X ", (unsigned int)*p);
p++;
}
return 0;
}
le je suis arrivé à l'écran est CE D2, je sais comment UTF-8, UTF-16, UCS-2 codé. Mais je ne peux pas trouver de match pour ça. Je suppose que c'est quelque chose qui s'appelle DBCS.
Ma question est, comment traduire unicode à ce DBCS semblait?
Merci pour votre aide.
La question se pose de savoir comment la source est stockée? Ou comment le compilateur regroupe cette chaîne dans le binaire? – Alejandro
oui, c'est. Si je ne sais pas comment il est stocké, il est vraiment difficile de stocker des caractères. –