2011-12-05 17 views
5

Se il mio sito utilizza UTF-8, c'è qualche vantaggio/svantaggio nell'escludere ancora i caratteri HTML? per esempio. Utilizzando "& "invece di" & "? Qual è la migliore pratica?Escaping di caratteri HTML con UTF-8?

+0

' e 'è un personaggio di basso-ordine ASCII. Non ha nulla a fare con Unicode. – SLaks

risposta

6

Hai ancora bisogno di fuggire caratteri che hanno un significato speciale in HTML, come <, >, &, per evitare ambiguità del parser/sintassi non valida .Questo non ha nulla a che fare con la codifica. È non necessario escape come ogni carattere non ASCII, ad esempio "ö" a &ouml;, poiché è possibile rappresentarli in modo nativo in th e Codifica UTF-8.

+0

Per la prima domanda, vedi [questa altra domanda] (http://stackoverflow.com/questions/10371493/what-are-the-reserved-characters-in-xhtml) Per il concetto generale, vedi [The Great Escapism (o: Cosa devi sapere per lavorare con il testo all'interno del testo)] (http://kunststube.net/escap ISM /). – deceze

0

& è valido HTML (si tratta di un riferimento di entità non terminato).
Questo non ha nulla a che fare con Unicode.

+0

Oppure riferimento di carattere :-) –

0

si deve convertire in entità <> & sempre, e "solo quando in un attributo HTML

ad esempio

<a title="tell me &quot;more&quot;"> 
Problemi correlati