Sto cercando un modo per trascrivere caratteri di lettere Unicode da qualsiasi lingua in lettere latine accentate. L'intento è di consentire agli stranieri di ottenere informazioni sulla pronuncia dei nomi e delle parole scritte in qualsiasi scrittura non latina.Romanizzazione del testo Unicode
Esempi:
greca: Romanize("Αλφαβητικός")
restituisce "Alphabētikós"
(o "Alfavitikós")
giapponese: Romanize("しんばし")
rendimenti "shimbashi"
(o "sinbasi")
Russa: Romanize("яйца Фаберже")
rendimenti "yaytsa Faberzhe"
(o "jajca Faberže ")
Dovrebbe idealmente supportare i caratteri nei seguenti script: CJK, Indic, Cirillico, Semitico e Greco. Dovrebbe essere guidato dai dati ed estendibile, utilizzando i dati del Consorzio Unicode, degli Stati Uniti, dell'UE o dell'ONU. Il codice dovrebbe essere open source scritto in .NET o Java.
Esiste una tale biblioteca?
Sto cercando qualcosa come la traslitterazione di nomi di località di Google Maps, che utilizza le trasformazioni ICU. Vorrei che Google aprisse questo codice. (http://research.google.com/pubs/pub36450.html e http://static.googleusercontent.com/external_content/untrusted_dlcp/research.google.com/en//archive/papers/36450.pdf) –
I penserei che questa operazione sia anche specifica della localizzazione.Welsh e Pinyin usano gli stessi personaggi ma probabilmente romanizzano in modo diverso :-) – wberry
@wberry: il gallese usa nativamente lo script latino e Pinyin è già romanizzato in cinese. –