Ecco una domanda veloce Perl:Come posso decodificare le entità HTML?
Come posso convertire HTML caratteri speciali come ü
o '
normale testo ASCII?
ho iniziato con qualcosa di simile:
s/\&#(\d+);/chr($1)/eg;
e potrebbe scrivere per tutti i caratteri HTML, ma qualche funzione in questo modo probabilmente già esiste?
Nota che non è necessario un convertitore di testo HTML-> completo. Ho già analizzato l'HTML con lo HTML::Parser
. Ho solo bisogno di convertire il testo con i caratteri speciali che sto ottenendo.
Per coloro a cui piacciono gli interni una CLI: 'perl -MHTML :: Entità -le 'stampa decode_entities (" & iquest; ' ")' –