Puramente accademico, ma mi sta frustrando.Rimuovere le parole duplicate in una riga con sed
voglio correggere questo testo:
there there are are multiple lexical errors in this line line
utilizzando sed. I've got this lontano:
sed 's/\([a-z][a-z]*[ ,\n][ ,\n]*\)\1/\1/g' < file.text
Corregge tutto tranne le parole raddoppiate finali!
there are multiple lexical errors in this line line
Un guru di sed può spiegare perché quanto sopra non tratta le parole alla fine?
N.B. RE - '[, \ n]' sed usa '\ n' come delimitatore di riga. Quindi, a meno che non si inseriscano '\ n' nello spazio del motivo, non si incontreranno mai dopo aver letto una linea nello spazio del motivo. – potong