2010-06-28 19 views
90

ho ottenuto questa lista:Trovare e sostituire i valori di stringa nella lista Python

words = ['how', 'much', 'is[br]', 'the', 'fish[br]', 'no', 'really'] 

Quello che vorrei è quello di sostituire [br] con un po 'fantastico valore simile a <br /> e ottenere così una nuova lista:

words = ['how', 'much', 'is<br />', 'the', 'fish<br />', 'no', 'really'] 

risposta

143

words = [w.replace('[br]', '<br />') for w in words]

chiamato List Comprehensions

+3

Eseguendo un confronto tra questo metodo di comprensione degli elenchi e il metodo della mappa (pubblicato da @Anthony Kong), questo metodo di lista era approssimativamente 2x più veloce. Inoltre ha permesso di inserire più sostituzioni nella stessa chiamata, ad es. 'resname = [name.replace ('DA', 'ADE'). sostituisci ('DC', 'CYT'). sostituisci ('DG', 'GUA'). sostituisci ('DT', 'THY') per nome in ncp.resname()] ' –

24

È possibile utilizzare, ad esempio:

words = [word.replace('[br]','<br />') for word in words] 
+0

Uguale alla risposta accettata, sopra. – macetw

26

Accanto di lista, si può provare mappa

>>> map(lambda x: str.replace(x, "[br]", "<br/>"), words) 
['how', 'much', 'is<br/>', 'the', 'fish<br/>', 'no', 'really'] 
9

Nel caso in cui vi state chiedendo circa le prestazioni dei diversi approcci, ecco alcuni timing:

In [1]: words = [str(i) for i in range(10000)] 

In [2]: %timeit replaced = [w.replace('1', '<1>') for w in words] 
100 loops, best of 3: 2.98 ms per loop 

In [3]: %timeit replaced = map(lambda x: str.replace(x, '1', '<1>'), words) 
100 loops, best of 3: 5.09 ms per loop 

In [4]: %timeit replaced = map(lambda x: x.replace('1', '<1>'), words) 
100 loops, best of 3: 4.39 ms per loop 

In [5]: import re 

In [6]: r = re.compile('1') 

In [7]: %timeit replaced = [r.sub('<1>', w) for w in words] 
100 loops, best of 3: 6.15 ms per loop 

come potete vedere per tali modelli semplici la comprensione della lista accettata è la più veloce, ma guardate a egli segue:

In [8]: %timeit replaced = [w.replace('1', '<1>').replace('324', '<324>').replace('567', '<567>') for w in words] 
100 loops, best of 3: 8.25 ms per loop 

In [9]: r = re.compile('(1|324|567)') 

In [10]: %timeit replaced = [r.sub('<\1>', w) for w in words] 
100 loops, best of 3: 7.87 ms per loop 

Questo dimostra che per le sostituzioni più complicati un pre-compilato reg-exp (come in 9-10) può essere (molto) più veloce. Dipende davvero dal tuo problema e dalla parte più breve del reg-exp.

Problemi correlati