Chacun de ces caractères UTF-8 est-il unique?

-1

Je veux être en mesure d'insérer ces caractères dans mon presse-papiers par programmation. Chacun d'entre eux est-il un seul personnage UTF-8? Sinon, dans quel encodage sont-ils? Je regardais bien UTF-8 table de caractères http://www.utf8-chartable.de/unicode-utf8-table.pl sous les lettres latines, mais ne pouvait pas les trouver.Chacun de ces caractères UTF-8 est-il unique?

å å å å å û û û û û ö ö ö Ë Ë Ë

Source

2017-10-11 vda8888

Oui, ils ont tous des points de code Unicode individuels, commençant à U + 1EA4. – deceze

Le tableau de caractère lié à votre question ne couvre que les points de code dans les blocs Basic Latin (U + 0000..U + 007F) et Latin-1 Supplement (U + 0080..U + 00FF) d'Unicode. Chacun des caractères que vous avez affichés sont des points de code dans le bloc Latin Extended Additional d'Unicode (U + 1E00..U + 1EFF). Lorsque codé en UTF-8, ces caractères prennent 3 octets chacun, comme suit:

Ấ = U + 1EA4 = E1 BA A4

Ầ = U + 1EA6 = E1 BA A6

Ẩ = u + 1EA8 = E1 BA A8

Ẫ = U + 1EAA = E1 BA AA

Ậ = U + 1EAC = E1 BA AC

Ứ = U + 1EE8 = E1 BB A8

Ừ = U + 1EEA = E1 BB AA

Ử = U + 1EEC = E1 BB AC

Ữ = U + 1EEE = E1 BB AE

Ự = U + 1EF0 = E1 BB B0

Ỡ = U + 1EE0 = E1 BB A0

Ợ = U + 1EE2 = E1 BB A2

Ở = U + 1EDE = E1 BB 9E

Ề = U + 1EC0 = E1 BB 80

Ể = U + 1EC2 = E1 BB 82

Ễ = U + 1EC4 = E1 BB 84

En fonction de votre plate-forme, vous pouvez ou ne pas être en mesure de stocker UTF-8 sur le presse-papiers. Par exemple, sous Windows, vous pouvez stocker du texte uniquement en tant qu'ANSI ou UTF-16 (sauf si vous créez un format de Presse-papiers personnalisé pour contenir UTF-8).

Source

2017-10-11 20:43:11

Chacun de ces caractères UTF-8 est-il unique?

Répondre

Questions connexes