2015-12-08 3 views
1

Je suis en train d'extraire du texte à partir d'une page Web codée Windows-1255 à l'aide de Node.js. Je suis en train de décoder le texte en utilisant l'encodeur/décodeur Windows 1255 suivantes: https://www.npmjs.com/package/windows-1255Conversion de Windows-1255 en UTF-8 dans le nœud JS

Après l'installation à l'aide NPM et en exigeant dans le fichier concerné, j'ai essayé d'utiliser comme ceci:

var title = windows1255.decode('#title').text()); 

Cela ne semble pas avoir d'effet. Une quelconque idée du pourquoi?

Merci!

Maor

Répondre

0

ne sais pas si vous attend toujours une réponse sur cette question, mais ce qui suit travaillé pour moi ...

Lors de l'extraction des données (un fichier), j'ai mis le get des options de codage à binaire:

var options = { 
     method: 'GET', 
     url: 'myURL', 
     encoding: 'binary' 
    }; 

    request(options, function (error, response, body) { 

     //deal with hebrew encoding 
     csvString = encoding.convert(body, 'UTF8', "CP1255").toString(); 

Ensuite, pour je passe le codage de CP1255 (= windows1255) à UTF8.

Espérons que ça aide :)