Sto cercando di rimuovere i caratteri diacritici da un pangram in polacco. Sto usando il codice dal blog di Michael Kaplan http://www.siao2.com/2007/05/14/2629747.aspx, tuttavia, senza successo.Rimozione di segni diacritici in polacco
Considerare il seguente pangram: "Pchnąć w tę łódź jeża lub ośm skrzyń fig.". Tutto funziona bene, ma per la lettera "ł", ho ancora "ł". Immagino che il problema è che "ł" è rappresentato come singolo carattere unicode e non c'è alcun NonSpacingMark successivo.
Avete qualche idea su come posso risolverlo (senza fare affidamento sulla mappatura personalizzata in qualche dizionario - sto cercando una sorta di conversione Unicode)?
Expect del 'L' tutti questi personaggi hanno solo [diacritici] (http: //en.wikipedia.org/wiki/Diacritic) (Vedo almeno ogonek, acute e dot) e potrebbe essere facilmente normalizzato usando 'Normalize'. Suggerirei di combinare i due metodi. – BalusC
Normalizza è una libreria .NET? Scusa ... questo è snippet dal mio codice Java :) E scrivendo "Net" stavo pensando a InterNet, non a ".NET". –