Sto cercando di abbinare e rimuovere tutte le parole in una lista da una stringa utilizzando una regex compilata, ma sto cercando di evitare le occorrenze all'interno delle parole.Rimuovi tutte le occorrenze di parole in una stringa da un elenco python
attuale:
REMOVE_LIST = ["a", "an", "as", "at", ...]
remove = '|'.join(REMOVE_LIST)
regex = re.compile(r'('+remove+')', flags=re.IGNORECASE)
out = regex.sub("", text)
In: "The quick brown fox saltato su una formica"
Out: "quick brown fox saltato t"
attesi: "la volpe marrone veloce è saltata"
Ho provato a cambiare la stringa di compilare il seguente, ma senza alcun risultato:
regex = re.compile(r'\b('+remove+')\b', flags=re.IGNORECASE)
qualsiasi suggerimento o mi sto perdendo qualcosa vistosamente ovvio?
Presumibilmente 'ant' fa parte della vostra rimuovere la lista? –