2010-04-21 3 views

Répondre

10

En UTF-16, il serait deux octets, et en UTF-32, il serait 4 octets. Après tout, sinon vous ne pourriez pas faire la différence entre un caractère dont la valeur codée vient juste de commencer avec un octet zéro et un seul octet nul représentant U + 0000.

Fondamentalement UTF-16 œuvres dans des blocs de 2 octets, et UTF-32 œuvres dans des blocs de 4 octets. (Certes pour caractères en dehors de la BMP vous avez besoin de deux "blocs" de UTF-16, mais le principe est toujours le même.) Si vous deviez implémenter un décodeur UTF-16, vous auriez lu deux octets à la fois.

Questions connexes