J'ai un document texte qui est une liste de titulaires de licence. Je suis en boucle à travers ce document pour créer une table html de ces données. J'ai rencontré des noms avec des caractères non standard.Convertir des caractères en équivalent html en utilisant .net
C'est l'un d'entre eux
Aimeé
J'ai essayé de courir toutes les entrées par la fonction suivante, mais quand il tombe sur le caractère ci-dessus ne remplace pas.
Function ReplaceBadCharacters(ByVal input As String) As String
Return input.Replace(Chr(233), "é")
End Function
Comment puis-je remplacer chaque caractère par l'équivalent html?
EDIT
Lorsque je déboguer la fonction au-dessus montre l'entrée comme Aimé [] et non Aimeé.
Dans Chrome, il ressemble à ceci Aime
Ensuite, l'encodage est erroné. – SLaks
Lorsque j'ouvre le document dans notepad ++, il affiche le codage comme ANSI. Quand je le change en UTF-8 dans notepad ++, il montre que le caractère comme 'xE9' – guanome
qui sonne comme é pourrait être un glyphe différent. De quel type de documents texte disposez-vous? .docx, .doc, .pdf, etc. peuvent insérer des glyphes non standard pour les caractères non standard. S'il s'agit d'un fichier .txt ou d'un document ASCII, vérifiez l'encodage. Vous pouvez lire le fichier en tant que UTF8 et le document est UTF ## ou vice-versa. Assurez-vous également de spécifier le type d'encodage lorsque vous lisez le fichier. –