2012-01-12 12 views

risposta

3

Prova java.text.Collator per il cinese Locale.

+2

Grazie. Sembra 'Locale.SIMPLIFIED_CHINESE' ordinato da Pinyin cinese ma' Locale.TRADITIONAL_CHINESE' ordinato per tratto. – bydsky

+0

Non ho idea di cosa sia Pinyin o ictus, ma sono contento che sia stato d'aiuto. –

2

Se si desidera eseguire il rollover del codice, una fonte per i dati è i campi Radical-Stroke Counts del database Unihan, del Consorzio Unicode. Il collegamento è alla sezione della relazione tecnica 38, che descrive questi campi.

Si noti che il numero di tratti di un carattere ideografico si basa sulla struttura (o morfologia) del carattere visualizzato, cioè il suo glifo. La morfologia del glifo è una funzione dello stile di progettazione del font, specialmente se il font segue le convenzioni del cinese tradizionale, del cinese semplificato o giapponese. Ma i codici dei caratteri in Java si basano di solito sullo standard Unicode, che unifica caratteri di tutte queste convenzioni sotto un singolo codice di carattere.

Quindi, avrete bisogno di informazioni esterne per dire quale convenzione sta usando il vostro testo. Questo a sua volta ti dice quale campo del database Unihan usare. Se sai che le tue stringhe di testo cinese sono tutte semplificate, o tutte le lingue tradizionali cinesi, allora hai abbastanza informazioni.

Controllare anche il Chinese Character Web API, che serve i dati dal database Unihan.

Problemi correlati