2009-09-29 19 views
10

Ho una collezione molto ampia di tuple (p, q) che vorrei convertire in un dizionario di liste in cui il primo elemento in ogni tupla è una chiave che indicizza una lista che contiene q .Combina dizionari di elenchi in Python

Esempio:

Original List: (1, 2), (1, 3), (2, 3) 
Resultant Dictionary: {1:[2, 3], 2:[3]} 

Inoltre, vorrei coniugare in modo efficace questi dizionari.

Esempio:

Original Dictionaries: {1:[2, 3], 2:[3]}, {1:[4], 3:[1]} 
Resultant Dictionary: {1:[2, 3, 4], 2:[3], 3:[1]} 

Queste operazioni risiedono all'interno di un ciclo interno, quindi preferirebbero che siano il più velocemente possibile.

Grazie in anticipo

risposta

14

Se l'elenco di tuple è ordinato, itertools.groupby, come suggerito da @gnibbler, non è una cattiva alternativa al defaultdict, ma ha bisogno di essere utilizzato in modo diverso rispetto ha suggerito:

import itertools 
import operator 

def lot_to_dict(lot): 
    key = operator.itemgetter(0) 
    # if lot's not sorted, you also need...: 
    # lot = sorted(lot, key=key) 
    # NOT in-place lot.sort to avoid changing it! 
    grob = itertools.groupby(lot, key) 
    return dict((k, [v[1] for v in itr]) for k, itr in grob) 

per "fondere" dicts di liste in un nuovo d.o.l ...:

def merge_dols(dol1, dol2): 
    keys = set(dol1).union(dol2) 
    no = [] 
    return dict((k, dol1.get(k, no) + dol2.get(k, no)) for k in keys) 

Sto dando [] un soprannome no per evitare inutilmente costruire un sacco di liste vuote, dato che le prestazioni sono importanti. Se i mazzi di chiavi dei DOLS si sovrappongono solo in misura modesta, più veloce sarebbe:

def merge_dols(dol1, dol2): 
    result = dict(dol1, **dol2) 
    result.update((k, dol1[k] + dol2[k]) 
       for k in set(dol1).intersection(dol2)) 
    return result 

poiché questo utilizza lista-catenation solo per sovrapposizione di chiavi - quindi, se queste sono poche, sarà più veloce.

+0

2016 e '' 'merge_dols''' v.1 suona fantastico ed elegante, grazie! v.2, tuttavia, utilizza un [metodo non accettabile] (http://stackoverflow.com/questions/38987/how-to-merge-two-python-dictionaries-in-a-single-expression/39858#39858) : '' 'dict (dol1, ** dol2)' '' – raratiru

3

defaltdict in soccorso (come al solito)

from collections import defaultdict 
my_dict = defaultdict(list) 

for key,value in original_list: 
    my_dict[key].append(value) 

Combinando le due dicts può essere fatto in questo modo (si noti che i duplicati saranno conservati):

for key,value in orig_dict: 
    new_dict[key].extend(value) 
+0

Penso che è necessario. Appendere() elementi dalle tuple. – Noah

+0

il tuo secondo ciclo non è operativo – SilentGhost

3

collections.defaultdict funziona come questo:

from collections import defaultdict 
dic = defaultdict(list) 
for i, j in tuples: 
    dic[i].append(j) 

simile per i dicts:

a, b = {1:[2, 3], 2:[3]}, {1:[4], 3:[1]} 
de = defaultdict(list, a) 
for i, j in b.items(): 
    de[i].extend(j) 
0

Qui è lo stile iteratore di farlo

 
>>> mylist=[(1, 2), (1, 3), (2, 3)] 
>>> from itertools import groupby 
>>> from operator import itemgetter 
>>> mylist=[(1, 2), (1, 3), (2, 3)] 
>>> groupby(mylist,itemgetter(0)) 

>>> list(_) 
[(1, <itertools._grouper object at 0xb7d402ec>), (2, <itertools._grouper object at 0xb7c716ec>)] 
+0

non è quello che ha chiesto l'OP, vero? – SilentGhost

0

volevo questi fatti in una linea solo per divertimento:

>>> from itertools import groupby 
>>> t=(1, 2), (1, 3), (2, 3) 
>>> [(i,[x for _,x in list(f)]) for i,f in groupby(sorted(t),lambda t: t[0])] 
[(1, [2, 3]), (2, [3])] 
>>> b={1:[2, 3], 2:[3]}, {1:[4], 3:[1]} 
>>> dict([(key,sum([i[1::][0] for i in elements],[])) for key,elements in groupby(sorted(b[0].items()+b[1].items()),lambda t: t[0])]) 
{1: [2, 3, 4], 2: [3], 3: [1]} 
-1

Questo è come lo faccio in Python 2.7:

combined = {} 
combined.update(d1) 
combined.update(d2) 

E 'bene definire una funzione di utilità per fare questo:

def merge(d1, d2): 
    ''' Merge two dictionaries. ''' 
    merged = {} 
    merged.update(d1) 
    merged.update(d2) 
    return merged