2016-02-12 30 views
6

Quello che segue è il mio set di dati da un file di testo.Creare un elenco di dizionario dinamico python

2.1,3.5,1.4,0.2,Iris 
4.9,3.0,1.4,0.2,Ilia 
3.7,3.2,1.3,0.2,Iridium 

C'è una lista di nome:

list_of_keys 

che detiene i seguenti valori nella lista

['S_Length','S_Width','P_Length','P_Width','Predicate'] 

Quindi, il problema è che io voglio creare una lista di dizionario per tenere tutti i miei dati (dal file di testo) usando il list_of_keys as keys per il dizionario come segue:

dict = 
     {'S_Length': 2.1, 'S_Width':3.5 , 'P_Length': 1.4, 'P_Width': 0.2, 'Predicate': Iris}, 
     {'S_Length': 4.9, 'S_Width':3.0 , 'P_Length': 1.4, 'P_Width': 0.2, 'Predicate': Ilia}, 
     ... so on! 

quello che ho fino ad ora:

# store all data from the text files as list 
all_examples = file.readlines() 

for outer_index in range(len(all_examples)): 
    for inner_index in range(0, len(list_of_keys)+1): 

risposta

4

è possibile utilizzare una funzione di generatore di come seguire:

def func(): 
    list_of_keys = ['S_Length','S_Width','P_Length','P_Width','Predicate'] 
    with open('example.txt') as f: 
     for line in f: 
      yield dict(zip(list_of_keys,line.strip().split(','))) 

print(list(func())) 
[{'P_Width': '0.2', 'S_Length': '2.1', 'Predicate': 'Iris', 'S_Width': '3.5', 'P_Length': '1.4'}, {'P_Width': '0.2', 'S_Length': '4.9', 'Predicate': 'Ilia', 'S_Width': '3.0', 'P_Length': '1.4'}, {'P_Width': '0.2', 'S_Length': '3.7', 'Predicate': 'Iridium', 'S_Width': '3.2', 'P_Length': '1.3'}] 

è possibile leggere il file riga per riga e dividere le linee, quindi creare le coppie di chiavi e valori utilizzando la funzione zip e quindi convertirli in un dizionario.

Si noti che poiché un oggetto file è un iteratore, è possibile scorrere l'oggetto file e utilizzare l'istruzione with per aprire il file che chiuderà il file alla fine del blocco.

come un altro modo alternativo e più divinatorio è anche possibile utilizzare il modulo csv per leggere il file di testo:

import csv 
def func(): 
    list_of_keys = ['S_Length','S_Width','P_Length','P_Width','Predicate'] 
    with open('example.txt') as f: 
     spamreader = csv.reader(f, delimiter=',') 
     return [dict(zip(list_of_keys,row)) for row in spamreader] 

print func() 

Iscritto da csv.reader accetta un argomento delimitatore e restituisce tutta delle vostre linee separate in un unico iteratore si don' t necessario scorrere il file e dividerlo manualmente.

E se si desidera conservare l'ordine è possibile utilizzare collections.OrderedDict in entrambi i casi:

from collections import OrderedDict 
import csv 
def func(): 
    list_of_keys = ['S_Length','S_Width','P_Length','P_Width','Predicate'] 
    with open('example.txt') as f: 
     spamreader = csv.reader(f, delimiter=',') 
     return [OrderedDict(zip(list_of_keys,row)) for row in spamreader] 

print func() 
[OrderedDict([('S_Length', '2.1'), ('S_Width', '3.5'), ('P_Length', '1.4'), ('P_Width', '0.2'), ('Predicate', 'Iris')]), OrderedDict([('S_Length', '4.9'), ('S_Width', '3.0'), ('P_Length', '1.4'), ('P_Width', '0.2'), ('Predicate', 'Ilia')]), OrderedDict([('S_Length', '3.7'), ('S_Width', '3.2'), ('P_Length', '1.3'), ('P_Width', '0.2'), ('Predicate', 'Iridium')])] 
+1

Per un OP che itera su un file utilizzando 'range (len())' questo richiede _un bit in più_ spiegazione. – bereal

+0

@bereal In effetti, ho appena aggiunto. – Kasramvd

0

Se pensi di avere a dividere la stringa utilizzando ,, quindi utilizzando namedtuple per mappare ogni riga, rispettivamente.

2

Hai solo bisogno di usare split e fare alcune iterazioni.

Prova:

list_of_keys = ['S_Length','S_Width','P_Length','P_Width','Predicate'] 

list_of_dict = [] 

with open('mydata.txt', "r") as f: 
    for line in f.readlines(): 
     parts = line.strip().split(",") 
     mydict = {} 
     i = 0 
     for k in list_of_keys: 
      mydict[k] = parts[i] 
      i += 1 
     list_of_dict.append(mydict) 

print list_of_dict 

Oppure:

list_of_keys = ['S_Length','S_Width','P_Length','P_Width','Predicate'] 

list_of_dict = [] 

with open('mydata.txt', "r") as f: 
    for line in f.readlines(): 
     parts = line.strip().split(",") 
     mydict = dict(zip(list_of_keys,parts)) 
     list_of_dict.append(mydict) 

print list_of_dict 
2

Per il codice più pulito, è possibile utilizzare la funzione di to_dict da panda:

import pandas as pd 

df = pd.read_csv('example.txt') 
list_of_keys = ['S_Length','S_Width','P_Length','P_Width','Predicate'] 
df.columns = list_of_keys 

dict = df.to_dict(orient='records') 

print dict[0] 
{'P_Width': '0.2', 'S_Length': '4.9', 'Predicate': 'Ilia', 'S_Width': '3.0', 'P_Length': '1.4'} 
Problemi correlati