Ho un file csv con 3 colonne, in cui ogni riga di Colonna 3 contiene un elenco di valori. Come si può vedere dalla seguente struttura tavoloCome leggere una colonna di csv come lista dei dtype usando i panda?
Col1,Col2,Col3
1,a1,"['Proj1', 'Proj2']"
2,a2,"['Proj3', 'Proj2']"
3,a3,"['Proj4', 'Proj1']"
4,a4,"['Proj3', 'Proj4']"
5,a5,"['Proj5', 'Proj2']"
Ogni volta che provo a leggere questo csv, Col3 è sempre letto come oggetto str e non come lista. Ho cercato di alterare il DTYPE di quella colonna per elencare ma ho ottenuto "Attributo di errore", come di seguito
df = pd.read_csv("inputfile.csv")
df.Col3.dtype = list
AttributeError Traceback (most recent call last)
<ipython-input-19-6f9ec76b1b30> in <module>()
----> 1 df.Col3.dtype = list
C:\Python27\lib\site-packages\pandas\core\generic.pyc in __setattr__(self, name, value)
1953 object.__setattr__(self, name, value)
1954 except (AttributeError, TypeError):
-> 1955 object.__setattr__(self, name, value)
1956
1957 #----------------------------------------------------------------------
AttributeError: non è possibile impostare l'attributo
Sarebbe davvero bello se mi si può guidare come andare a proposito.
Puoi mostrarci un esempio del tuo csv (non come immagine), copia incolla prima alcune righe del tuo csv. –
Avviso standard: i valori non scalari non sono realmente supportati dai panda. Puoi usarli, dato che a volte sono a portata di mano nei passaggi intermedi, ma lavorare con loro è scomodo e non cambierà nel prossimo futuro. – DSM
Cosa vuoi fare con i valori? –