Sono interessato a scrivere uno script PHP (accolgo favorevolmente i suggerimenti agnostici di lingua) che trasporteranno una frase o una parola scritta in inglese (phoenetically) nella sceneggiatura di un'altra lingua. Dal momento che sto guardando l'inglese scritto in modo fenomenico (cioè a orecchio): dovrei fare i conti con le varianti di ortografia della stessa parola.Traslitterazione intelligente in PHP
Si presume che non esiste uno standard per la romanizzazione (per esempio, in cinese, si ha la Wade semplificato, ecc)
Qualcuno ha qualche consiglio su dove potrei cominciare? EDI: lo sto facendo solo a scopo didattico, e inizialmente ho avuto l'impressione che per capire la connessione tra le varianti di ortografia (che potrebbero essere trovate in un corpus di messaggi di messaggistica istantanea, i post di Facebook scritti in la forma romanizzata della lingua), avresti bisogno di una sorta di strumento di apprendimento automatico. Tuttavia, mi piacerebbe sapere se ero sulla strada giusta, e mi piacerebbe un po 'di aiuto nel capire quale dovrebbe essere il prossimo passo per farlo funzionare (per esempio: quale strumento di apprendimento automatico dovrei esaminare?) .
Senza entrare troppo carnosa - varianti ortografiche di una parola straniera (di solito scritto in una propria scrittura), come ad esempio " eheree "contro" ehery ", o" ei "vs" ey ". Capisco che non è molto: speravo in una soluzione che richiedesse un po 'di analisi statistica su un dato corpus (ad esempio messaggi IM o aggiornamenti di Facebook scritti nella forma romanizzata della lingua). – arkate