Sto cercando di catturare una sezione di testo ebraico (l'origine è commenti su un sito di notizie) con la seguente espressione regolare:Come catturare l'ebraico con regex in Java?
[\u0590-\u05FF \\p{Graph} \\s]+
funziona per la maggior parte dei commenti, ma alcuni commenti sono mancati.
Ho provato a eseguire il debug di questo e sembra che ci sia una lettera ebraica che non corrisponde al modello.
Quando estraggo questa lettera e stampare il suo valore intero sembra essere corretto, ma ancora l'espressione regolare non prenderlo ...
idee?
Usi 'Pattern.UNICODE_CASE' nel metodo' Pattern.compile'? –
No, dovrei? – lribinik
Provalo: 'Modello p = Pattern.compile (" YOUR_REGEX ", Pattern.UNICODE_CASE);' –