2010-11-08 6 views
1

J'ai besoin de lire certaines données de test d'un document html. Le problème est qu'il y a des caractères non anglais représentés en tant que codes HTML (par exemple Ø - Ø). Comment puis-je les changer en un seul personnage? Plus tard, je devrai comparer ces caractères à ce que l'utilisateur entre dans un formulaire Web. J'essaie de faire cela dans Ruby 1.9.2.Stocker les codes HTML (comme Ø) sous forme de lettres

Merci d'avance

Répondre

1

Cette question a été posée le ou plusieurs fois. Mais je ne peux pas le trouver. Donc, comme je me souviens:

require 'CGI' 
some_string = 'Ø&>' 
p CGI.unescapeHTML(some_string).gsub(/&#(\d+);/){[$1.to_i].pack 'U'} 

=> "\u00D8&>" 

\u00D8 est votre symbole. &> sont juste par exemple d'utilisation CGI::unescapeHTML.

Questions connexes