Ho provato a passare il parametro dtype
con read_csv
come dtype={n: pandas.Categorical}
ma questo non funziona correttamente (il risultato è un oggetto). The manual is unclear.È possibile leggere le colonne categoriali con i read_csv dei panda?
22
A
risposta
15
Nella versione 0.19.0
è possibile utilizzare il parametro dtype='category'
in read_csv
:
data = 'col1,col2,col3\na,b,1\na,b,2\nc,d,3'
df = pd.read_csv(StringIO(data), dtype='category')
print (df)
col1 col2 col3
0 a b 1
1 a b 2
2 c d 3
print (df.dtypes)
col1 category
col2 category
col3 category
dtype: object
+2
Penso di sì, usare 'df = pd.read_csv (StringIO (data), dtype = {'col1': ' category '}, index_col =' col1 ') ' – jezrael
3
Categorico non valido dtype.
Questo StackOverflow post contiene dettagli su come memorizzare dati categoriali in un file di testo.
Problemi correlati
- 1. Python panda: unione perde colonne categoriali
- 2. Panda read_csv senza sapere se l'intestazione è presente
- 3. panda pitone read_csv delimitatore nei dati delle colonne
- 4. È possibile utilizzare read_csv per leggere solo righe specifiche?
- 5. Panda read_csv e UTF-16
- 6. Errore di codifica in Panda read_csv
- 7. Speed-miglioramento su grandi panda read_csv con indice datetime
- 8. panda pitone read_csv in grado di leggere caratteri a doppio citato due volte
- 9. Ottenere mappatura delle variabili categoriali in panda
- 10. Panda Python read_csv salta le righe ma mantiene l'intestazione
- 11. Panda read_csv si aspetta un numero errato di colonne, con file csv irregolare
- 12. I panda Python uniscono solo determinate colonne
- 13. Vectorized "e" per le colonne panda
- 14. panda a_sql tutte le colonne come nvarchar
- 15. Lettura dei dati da csv in panda quando data e ora sono in colonne separate
- 16. I panda uniscono due dataframes con colonne diverse
- 17. Leggere dati binari in panda
- 18. Restituisce più colonne da applicare i panda
- 19. selezionando tra più colonne con i panda Python?
- 20. Come leggere una colonna di csv come lista dei dtype usando i panda?
- 21. R biglm con variabili categoriali
- 22. Seleziona le righe dei frame dei panda in base ai valori di due colonne
- 23. i panda convertono alcune colonne in righe
- 24. Come forzare i pandas read_csv a usare float32 per tutte le colonne float?
- 25. Python Panda non leggere la prima riga del file CSV
- 26. Python: limita la larghezza delle colonne stampate dei panda DataFrame
- 27. Converti stringa percentuale in float in panda read_csv
- 28. Come ordinare il frame dei dati dei panda usando i valori di più colonne?
- 29. Ottenere conteggio dei valori nelle colonne-panda dataframe
- 30. Pandas - NaNs Inserimento dei dati categoriali
È una colonna categoriale o siete tutti? – wegry
Uno o più, ma non tutti. – Emre
È una stringa nello snippet di codice (probabilmente dovrebbe). Suggerirò di usare il metodo astype sulle singole colonne altrimenti. – wegry