Ho un file CSV con più voci. Esempio csv:Python: rimozione di voci CSV duplicate
user, phone, email
joe, 123, [email protected]
mary, 456, [email protected]
ed, 123, [email protected]
Sto cercando di rimuovere i duplicati da una colonna specifica nel CSV comunque con il codice qui sotto Ricevo un "indice di lista fuori portata". Ho pensato confrontando row[1]
con newrows[1]
troverei tutti i duplicati e riscrivo solo le voci univoche in file2.csv
. Questo però non funziona e non riesco a capire perché.
f1 = csv.reader(open('file1.csv', 'rb'))
newrows = []
for row in f1:
if row[1] not in newrows[1]:
newrows.append(row)
writer = csv.writer(open("file2.csv", "wb"))
writer.writerows(newrows)
mio risultato finale è quello di avere una lista che mantiene la sequenza del file (set
non funzionerà ... giusto?), Che dovrebbe assomigliare a questo:
user, phone, email
joe, 123, [email protected]
mary, 456, [email protected]
penso che una base di dati sarebbe veramente utile qui. Python funziona con OOB con SQLite, lo sai? – NullUserException
quando qualcosa non funziona, hai sempre bisogno di descrivere cosa è successo. È un errore? è niente? è la cosa sbagliata? –
Ho fatto ... il mio codice attualmente produce un indice di lista fuori range. Questo non ha senso in quanto cerca la seconda "colonna" con la riga [1]. – serk