2010-10-18 5 views
0

lorsque je lis le fichier XML complet dans JEditorPane tout fonctionne correctement sauf le gestionnaire de nomenclatures. J'obtiens un charateur de nomenclature (un point) au début du fichier. Si je supprime le point et enregistrer le fichier, il est enregistré en tant que ANSI.In notepad ++ il montre (codage ANSI comme UTF-8) pour le même fichier. Si je ne supprime pas le parseur XML point ne parvient pas à analyser le document. Pouvez-vous m'aider avec ça? Merci.Problème de lecture Fichier utilisant l'encodage UTF-8 en java

+0

Quel parseur? avez-vous définir le type de contenu sur le JEditorPane? –

Répondre

1

Si votre fichier XML contient uniquement des caractères ASCII, il sera ASCII/ANSI valide ainsi que UTF8 valide, donc ne vous inquiétez pas si le bloc-notes reconnaît le fichier comme ANSI.

Bien que vous puissiez utiliser une nomenclature pour UTF8, il est déconseillé car il va casser beaucoup de programmes Unix et vous ne devriez pas le faire.

1

Continuer à utiliser UTF-8 sans nomenclature. Essayez Editplus allez au menu Document-> Encodage de fichier -> Changez l'encodage de fichier puis choisissez UTF-8.

+0

Je crée mon éditeur personnalisé –

0

En utilisant l'option -D de la commande java, définissez la propriété système file.encoding, comme l'a suggéré dans ce answer.

java -Dfile.encoding=utf-8 
0

Problème:

utf-8 ne pas utiliser la nomenclature, donc la plupart des programmes ne s'y attendent pas et ne parviennent pas à analyser/manipuler. Pour autant que je sache, seuls certains programmes Microsoft l'insèrent pour détecter l'encodage utf-8 plus rapidement.

Solution:

  • Retirez la nomenclature, personne a besoin.
  • N'utilisez pas d'éditeurs buggés avec un codage non standard. (=> mon opinion)
Questions connexes