Texte chinois codant les caractères manquants lors de l'affichage dans le navigateur Web

J'ai un fichier HTML qui contient du texte chinois. Lorsque j'ouvre le fichier dans un navigateur Web, certains caractères semblent manquer.Texte chinois codant les caractères manquants lors de l'affichage dans le navigateur Web

Voici un exemple copié de la fenêtre du navigateur:

本函旨在邀請您參定於

Je sais pertinemment que tous les autres personnages vus ici sont corrects en dehors de ceux qui manquent (confirmé par un locuteur natif chinois).

Dans l'en-tête HTML, j'ai une balise qui signifie que le fichier contient UTF-8 caractères codés:

<META http-equiv="Content-Type" content="text/html; charset=utf-8">

J'ai déjà essayé d'autres jeux de caractères dans cette balise META, mais jusqu'à présent, il semble tout méthode d'encodage que j'essaie en dehors de l'UTF-8 finit par regarder pire.

J'ai également considéré la possibilité qu'il s'agit d'un problème de police, j'ai donc installé 3 polices chinoises traditionnelles différentes sur mon système et forcé Chrome à les utiliser. Aucun d'eux ne faisait la moindre différence - les personnages manquants étaient toujours présents.

Si j'ouvre le fichier HTML avec Notepad ++, voici ce que je peux voir:

http://i.imgur.com/GoS07WX.png

Si je sélectionner et copier-coller ce texte dans le bloc-notes ordinaire MS, je reçois ceci:

Par conséquent, vous pouvez voir ici que le "xE5 x8A" visible dans Notepad ++ semble avoir été remplacé par 劦.

Y a-t-il une raison pour que le navigateur affiche au lieu de 劦 dans ce scénario?

Source

2016-12-14 user2539827

Regardez à nouveau le fichier HTML.

Je vois les 2 premiers octets d'un caractère codé en UTF-8, suivi par ... imaginons qu'il y avait à l'origine un \ xa0, et cela a été muté à   lorsque le fichier a été créé par l'application de substitutions globales à les données codées en UTF-8.

Cependant, \ xE5 \ X8a \ xa0 UTF-8 à U + décode 52A qui n'est pas le même que le caractère étranger qui est U + 52A ... pas assez près à une réponse.

Source

2016-12-18 09:52:49

Il semble qu'il y ait eu un problème impliquant des paramètres d'encodage dans le programme qui génère le fichier HTML. Je n'ai plus ce problème maintenant que le fichier HTML source a été corrigé, merci. – user2539827

Texte chinois codant les caractères manquants lors de l'affichage dans le navigateur Web

Répondre

Questions connexes