J'utilise libcurl pour récupérer des pages HTML.Comment convertir ISO-8859-1 en UTF-8 en utilisant libiconv en C++
Les pages HTML contiennent des références de caractères comme: סלקום
Quand je lis cela en utilisant libxml2 je reçois: «₪'¨'~'»
est-il l'ISO-8859-1 codage?
Si oui, comment puis-je le convertir en UTF-8 pour obtenir le mot correct.
Merci
EDIT: Je me suis la solution, MSalters avait raison, libxml2 n'utilise UTF-8.
Je a ajouté à eclipse.ini
-Dfile.encoding = utf-8
et enfin je suis arrivé caractères hébraïques sur ma console Eclipse. Merci
Il ne peut pas être ISO-8859-1 car il ne comporte que des caractères compris entre 0 et 255. 1493-1505 ne se trouvent pas dans cette plage (évidemment). –
Avez-vous des suggestions quel serait-il? et comment puis-je le convertir en UTF-8? – embedded
Les références de caractères numériques doivent provenir du jeu de caractères du document susceptible d'être unicode.Cela n'a rien à voir avec le système de codage de caractères utilisé. –