2009-02-06 14 views

risposta

27

Se la codifica è impostata correttamente (e il documento è salvato come UTF-8) dovresti essere in grado di lavorare con solo i caratteri. Dal W3C:

L'utilizzo di una codifica come UTF-8 significa che è possibile evitare la maggior parte degli escape e lavorare solo con i caratteri.

http://www.w3.org/International/questions/qa-escapes

Tuttavia, è ancora necessario utilizzare entità per i caratteri speciali come a maggiore/minore.

4

Nella mia esperienza fintanto che i dati sono realmente UTF-8 e stai dicendo correttamente al browser che è UTF-8, allora non è necessario utilizzare le entità. Tranne cose come & gt ;, & lt ;, & quot; ovviamente.

7

Le entità sono utili nei file di codice sorgente del programma (nei programmi che generano l'HTML). Molti standard di codifica dicono che i file dovrebbero essere in chiaro ASCII. Tranne, naturalmente, i file che contengono effettivamente il contenuto testuale, ad esempio i file .po con le traduzioni.

Quando si dispone di un file lungo con pochi caratteri non ASCII all'interno, è estremamente semplice salvare il file con una codifica errata senza notare che i propri personaggi sono stati fregati.

Un altro buon motivo per utilizzare caratteri non ASCII è rappresentato da caratteri simili. Riuscite ad individuare la differenza tra le prossime due righe di codice:

print "<title>" + pagename + " – " + sitename + "</title>"; 
print "<title>" + pagename + " - " + sitename + "</title>"; 

Ma usando le entità la differenza è evidente:

print "<title>" + pagename + " &ndash; " + sitename + "</title>"; 
print "<title>" + pagename + " - " + sitename + "</title>"; 

Ma al di fuori del file di codice sorgente del programma, UTF-8 è chiaramente il ben fatto.

Problemi correlati