sto usando questa espressione regolare:String spaccato, parole tra cui i caratteri accentati
x.split("[^a-zA-Z0-9']+");
Ciò restituisce un array di stringhe con lettere e/o numeri.
Se io uso questo:
String name = "CEN01_Automated_TestCase.java";
String[] names = name.Split.split("[^a-zA-Z0-9']+");
ho ottenuto:
CEN01
Automated
TestCase
Java
Ma se io uso questo:
String name = "CEN01_Automação_Caso_Teste.java";
String[] names = name.Split.split("[^a-zA-Z0-9']+");
ho ottenuto:
CEN01
Automa
o
Caso
Teste
Java
Come posso modificare questa espressione regolare per includere caratteri accentati? (á, ã, õ, ecc ...)
Se Java supporta le proprietà unicode '[^ \ p {L}]' sarebbe abbastanza robusto. Non so se lo fa però ... – Wrikken
@Wrikken: Funziona. Java 7 supporta anche '\ w' e' \ b' in modo sensato Unicode. –
Bello, ero solo pigro per cercarlo, ma debitamente notato;) – Wrikken