Ho una stringa contenente testo, caratteri di controllo, cifre, dieresi (tedesco) e altri caratteri utf8.Rimuovi caratteri utf8 non stampabili eccetto controlchars da String
Voglio rimuovere tutti i caratteri utf8 che non sono "parte della lingua". Caratteri speciali come (elenco non completo) ":/\ ßä,; \ n \ t" dovrebbero essere tutti conservati.
Purtroppo lo stackoverflow rimuove tutti quei caratteri, quindi devo aggiungere un'immagine (link).
Qualche idea? L'aiuto è molto apprezzato!
PS: Se qualcuno sa un servizio incollando che non uccide quei caratteri speciali sarei felice di caricare le corde .. Non ero in grado di trovare uno ..
[Edit]: Penso che la regex "\ P {Cc}" sono tutti i caratteri che voglio PRESERVARE. Questa regex potrebbe essere invertita in modo che vengano restituiti tutti i caratteri che non corrispondono a questa espressione regolare?
Non sicuro, ma è possibile che la versione invertita di \ P {qualcosa} possa essere \ p {qualcosa}. Altrimenti puoi provare con [^ \ P {qualcosa}]. – Pshemo
@Pshemo yeah indead in minuscolo sembra funzionare come è stato pubblicato qui sotto .. grazie! – friesoft
Possibile duplicato di [Il modo più veloce per eliminare tutti i caratteri non stampabili da una stringa Java] (http://stackoverflow.com/questions/7161534/fastest-way-to-strip-all-non-printable-characters-from- a-java-string) – Stewart