Python - Individuazione della posizione di una corrispondenza regolare in una stringa?

Attualmente sto usando le espressioni regolari per cercare tra i feed RSS per scoprire se alcune parole e frasi sono menzionate e vorrei quindi estrarre il testo su entrambi i lati della partita. Per esempio:Python - Individuazione della posizione di una corrispondenza regolare in una stringa?

String = "This is an example sentence, it is for demonstration only" 
re.search("is", String)

mi piacerebbe conoscere la posizione (s) di dove il 'è' sono riscontrate in modo da poter estrarre e di uscita o meno così:

1 match found: "This is an example sentence"

lo so che sarebbe facile da fare con le divisioni, ma avrei bisogno di sapere quale fosse l'indice del primo carattere della corrispondenza nella stringa, che non so come trovare

fonte

2010-04-20 nb.

in realtà si trova "è" due volte nel tuo esempio. – extraneon

È possibile utilizzare .find("is"), restituirebbe la posizione di "è" nella stringa

o utilizzare .start() dal re

>>> re.search("is", String).start() 
2

In realtà la sua partita "è" da "Th è"

Se è necessario far corrispondere per parola, si dovrebbe usare \b prima e dopo "is", \b è il limite della parola.

>>> re.search(r"\bis\b", String).start() 
5 
>>>

per ulteriori informazioni su Python espressioni regolari, docs qui

fonte

2010-04-20 10:50:54 YOU

Non ho idea di quanto mi sia perso nella documentazione, fa esattamente quello che mi serviva, grazie! –

Se vuoi prendere solo la parola "is", penso che 're.search (" is ", String) .start()' dovrebbe anche darsi la parola .. ovviamente ci sono anche altri esempi. – kuskmen

Stai attento al fatto che re.search restituisce None se non c'è corrispondenza. – rstackhouse

re.Match objects have a number of methods per aiutare con questo:

>>> m = re.search("is", String) 
>>> m.span() 
(2, 4) 
>>> m.start() 
2 
>>> m.end() 
4

fonte

2010-04-20 10:52:59 SilentGhost

Non credo che questa domanda è stato completamente alcuna risposta perché tutti le risposte forniscono solo esempi di corrispondenza singola. La domanda dell'OP dimostra le sfumature di avere 2 corrispondenze e una sottostringa che non dovrebbe essere riportata perché non è una parola/token.

per abbinare più ricorrenze, si potrebbe fare qualcosa di simile:

iter = re.finditer(r"\bis\b", String) 
indices = [m.start(0) for m in iter]

Questo sarebbe restituire un elenco dei due indici per la stringa originale.

fonte

2013-05-03 13:44:14 demongolem

Python - Individuazione della posizione di una corrispondenza regolare in una stringa?

risposta

Problemi correlati