Existe-t-il un meilleur outil d'échappement et de suppression de l'échappement HTML que CGI pour Ruby?

CGI.escapeHTML est assez mauvais, mais CGI.unescapeHTML est complètement borked. Par exemple:Existe-t-il un meilleur outil d'échappement et de suppression de l'échappement HTML que CGI pour Ruby?

require 'cgi' 

CGI.unescapeHTML('&#8230;') 
# => "…"     # correct - an ellipsis 

CGI.unescapeHTML('&hellip;') 
# => "&hellip;"    # should be "…" 

CGI.unescapeHTML('&#162;') 
# => "\242"     # correct - a cent 

CGI.unescapeHTML('&cent;') 
# => "&cent;"    # should be "\242" 

CGI.escapeHTML("…") 
# => "…"     # should be "&#8230;"

Il semble que unescapeHTML connaît tous les codes numériques, plus &, <, > et ". Et escapeHTML ne sait que sur ces quatre derniers - il ne fait aucun des codes numériques. Je comprends que l'échappement n'a généralement pas besoin d'être aussi robuste puisque HTML autorisera les versions littérales de la plupart des caractères à l'exception des quatre que connaît CGI.escapeHTML. Mais décourager devrait vraiment être meilleur.

Y at-il un meilleur outil là-bas, au moins pour l'échappement?

Source

2008-12-18 James A. Rosen

Il ne gère pas — non plus. – Chloe

Le joyau HtmlEntities devrait faire l'affaire:

require 'rubygems' 
require 'htmlentities' 

coder = HTMLEntities.new 

coder.decode('&#8230;') # => "…" 
coder.decode('&hellip;') # => "…" 
coder.decode('&#162;') # => "¢" 
coder.decode('&cent;') # => "¢" 
coder.encode("…", :named) # => "&hellip;" 
coder.encode("…", :decimal) # => "&#8230;"

Source

2008-12-20 18:17:41 titanous

require 'rubygems' 
require 'hpricot' 

Hpricot('&#8230;', :xhtml_strict => true).to_plain_text

Bien que vous deviez jouer avec le codage de caractères.

Source

2008-12-18 23:21:06

Utilisez la gemme htmlentities plutôt que hpricot. –

Existe-t-il un meilleur outil d'échappement et de suppression de l'échappement HTML que CGI pour Ruby?

Répondre

Questions connexes