Esiste uno strumento migliore per l'escape e lo escape di HTML rispetto a CGI per Ruby?

CGI.escapeHTML è piuttosto male, ma CGI.unescapeHTML è completamente borked. Per esempio:Esiste uno strumento migliore per l'escape e lo escape di HTML rispetto a CGI per Ruby?

require 'cgi' 

CGI.unescapeHTML('&#8230;') 
# => "…"     # correct - an ellipsis 

CGI.unescapeHTML('&hellip;') 
# => "&hellip;"    # should be "…" 

CGI.unescapeHTML('&#162;') 
# => "\242"     # correct - a cent 

CGI.unescapeHTML('&cent;') 
# => "&cent;"    # should be "\242" 

CGI.escapeHTML("…") 
# => "…"     # should be "&#8230;"

Sembra che unescapeHTML sa di tutti i codici numerici più &, <, > e ". E escapeHTML conosce solo gli ultimi quattro - non fa nessuno dei codici numerici. Capisco che l'escaping in genere non debba essere così robusto dal momento che HTML consentirà la versione letterale della maggior parte dei caratteri tranne i quattro che sono noti a CGI.escapeHTML. Ma senza scampo dovrebbe essere davvero meglio.

C'è uno strumento migliore là fuori, almeno per scortecciamento?

fonte

2008-12-18 James A. Rosen

Non gestisce — neanche. – Chloe

Il htmlentities gemma dovrebbe fare il trucco:

require 'rubygems' 
require 'htmlentities' 

coder = HTMLEntities.new 

coder.decode('&#8230;') # => "…" 
coder.decode('&hellip;') # => "…" 
coder.decode('&#162;') # => "¢" 
coder.decode('&cent;') # => "¢" 
coder.encode("…", :named) # => "&hellip;" 
coder.encode("…", :decimal) # => "&#8230;"

fonte

2008-12-20 18:17:41 titanous

require 'rubygems' 
require 'hpricot' 

Hpricot('&#8230;', :xhtml_strict => true).to_plain_text

Anche se potresti dover smanettare con la codifica dei caratteri.

fonte

2008-12-18 23:21:06

Utilizza la gemma htmlentities anziché hpricot. –

Esiste uno strumento migliore per l'escape e lo escape di HTML rispetto a CGI per Ruby?

risposta

Problemi correlati