Sembra che alcuni caratteri della lingua europea non possano essere memorizzati in UTF-8?
Non vero. UTF-8 può memorizzare qualsiasi set di caratteri senza limitazioni tranne forse per Klingon. UTF-8 è il tuo sportello unico per l'internazionalizzazione. Se hai problemi con i caratteri, è più probabile che si verifichino problemi di codifica o manca il supporto per quell'intervallo di caratteri nel font che stai usando per visualizzare i dati (Estremamente improbabile per un carattere di lingua europea, ma comune ad es. siti indiani su un computer europeo.Vedere anche this question)
Se non è possibile eseguire il rendering di un set di caratteri non occidentali, è possibile che il font incorporato dell'utente non includa tale intervallo di UTF-8.
Aggiornamento: Klingon è infatti non fa parte del official UTF-8:
Alcuni script inventati moderni che non sono ancora stati inclusi in Unicode (ad esempio, Tengwar) o che non possono essere per l'inclusione in Unicode causa per mancanza di uso del mondo reale (ad esempio, Klingon) sono elencati nel Con Unicode Registry Registry, insieme a assegnazioni di codici di Area di utilizzo privata non ufficiali ma ampiamente utilizzati.
Tuttavia, v'è un volunteer project che ha ufficialmente, assegnato punti di codice F8D0-F8FF nell'area privata a Klingon. Gallery of Klingon characters
fonte
2010-03-13 15:37:59
UTF-8 è uno schema di codifica per Unicode. Tutti i caratteri Unicode possono essere scritti in UTF-8. "È in grado di rappresentare qualsiasi carattere nello standard Unicode" http://en.wikipedia.org/wiki/UTF-8. Cosa stai chiedendo? Se UTF-8 codifica tutti i caratteri Unicode? –
sono curioso ... quali sarebbero i caratteri di lingua europea? – hop