Utilizzando maiale apache e il testoRegexp corrispondente nel maiale
hahahah. my brother just didnt do anything wrong. He cheated on a test? no way!
che sto cercando di abbinare "il mio fratello appena fatto fare qualcosa di sbagliato."
Idealmente, vorrei abbinare qualsiasi cosa che inizia con "mio fratello solo" e finire con la punteggiatura (fine della frase) o EOL.
Guardando la documentazione di maiale, e poi seguendo il link al java.util.regex.Pattern, immagino dovrei essere in grado di utilizzare
extrctd = FOREACH fltr GENERATE FLATTEN(EXTRACT(txt,'(my brother just .*\\p{Punct})')) as (txt:chararray);
ma che sembra corrispondere fino alla fine della linea . Qualche suggerimento per l'esecuzione di questa partita? Sono pronto a tirare fuori i miei capelli, e per estrarre i miei capelli, intendo passare a python in streaming
Ti dispiacerebbe spiegare la parte avidi? Ho pensato che avrei trovato solo la parola giusta, qualsiasi testo successivo, fino alla prima istanza di punteggiatura. –
Senza non-greedy, non corrisponde alla prima istanza di punteggiatura, ma corrisponde a quella _last_. – Wrikken
@Neil Kodner: ho aggiornato la risposta. –