Voglio ottenere il conteggio delle parole da una stringa. E 'così semplice. Il problema è che la stringa può essere in un linguaggio imprevedibile.Ottieni il conteggio delle parole da una stringa in Unicode (in qualsiasi lingua)
Così, ho bisogno di una funzione di firma int getWordCount(String)
con la seguente output di esempio -
getWordCount("供应商代发发货") => 7
getWordCount("This is a sentence") => 4
Qualsiasi aiuto su come procedere sarebbe apprezzato :)
Nel testo cinese (?) C'è un separatore tra le parole? –
No there's no separator. Ho copiato le stringhe esatte. – jaibatrik
In tal caso, tenterei di trovare la lingua in base alla quale vengono utilizzate le rune Unicode nella stringa.Quindi utilizzare tali informazioni per determinare come deve essere analizzata la stringa. –