Cercavo un filtro simile delle liste ma volevo un formato leggermente diverso da quello presentato qui.
La chiamata sopra get_hats()
è buona ma limitata nel suo riutilizzo. Stavo cercando qualcosa di più come get_hats(get_clothes(all_things))
, dove è possibile specificare una fonte (all_things)
e quindi come pochi o tanti livelli di filtri get_hats()
, get_clothes()
come si desidera.
Ho trovato un modo per farlo con generatori:
def get_clothes(in_list):
for item in in_list:
if item.garment:
yield item
def get_hats(in_list):
for item in in_list:
if item.headgear:
yield item
Questo può quindi essere chiamato da:
get_hats(get_clothes(all_things))
Ho provato le soluzioni originali, la soluzione di Vartec e questa soluzione ulteriore per vedere la efficienza, ed è stato in qualche modo sorpreso dai risultati. Codice come segue:
installazione:
class Thing:
def __init__(self):
self.garment = False
self.headgear = False
all_things = [Thing() for i in range(1000000)]
for i, thing in enumerate(all_things):
if i % 2 == 0:
thing.garment = True
if i % 4 == 0:
thing.headgear = True
soluzioni originali:
def get_clothes():
return filter(lambda t: t.garment, all_things)
def get_hats():
return filter(lambda t: t.headgear, get_clothes())
def get_clothes2():
return filter(lambda t: t.garment, all_things)
def get_hats2():
return filter(lambda t: t.headgear and t.garment, all_things)
La mia soluzione: soluzione
def get_clothes3(in_list):
for item in in_list:
if item.garment:
yield item
def get_hats3(in_list):
for item in in_list:
if item.headgear:
yield item
di Vartec:
def get_clothes4():
for t in all_things:
if t.garment:
yield t
def get_hats4():
for t in get_clothes4():
if t.headgear:
yield t
Codice
Timing:
import timeit
print 'get_hats()'
print timeit.timeit('get_hats()', 'from __main__ import get_hats', number=1000)
print 'get_hats2()'
print timeit.timeit('get_hats2()', 'from __main__ import get_hats2', number=1000)
print '[x for x in get_hats3(get_clothes3(all_things))]'
print timeit.timeit('[x for x in get_hats3(get_clothes3(all_things))]',
'from __main__ import get_hats3, get_clothes3, all_things',
number=1000)
print '[x for x in get_hats4()]'
print timeit.timeit('[x for x in get_hats4()]',
'from __main__ import get_hats4', number=1000)
Risultati:
get_hats()
379.334653854
get_hats2()
232.768362999
[x for x in get_hats3(get_clothes3(all_things))]
214.376812935
[x for x in get_hats4()]
218.250688076
Il generatore sembrano espressioni per essere leggermente più veloce, la differenza di tempo tra le soluzioni mia e di Vartec sono probabilmente solo rumore. Ma preferisco la flessibilità di poter applicare qualsiasi filtro richiesto in qualsiasi ordine.
Se sei preoccupato per le prestazioni, hai ** verificato ** le prestazioni? –
Lo farei se pensassi che non fosse ovvio. – cammil
"ovvio" è una parola pericolosa quando si tratta di prestazioni. –