2013-11-01 21 views
31

Voglio fare tutte le intestazioni delle colonne nel mio panda frame di dati minuscolopitone: fare panda dataframe colonna intestazioni tutto minuscolo

per esempio, se ho:

data = 

    country country isocode year  XRAT   tcgdp 
0 Canada    CAN 2001 1.54876 924909.44207 
1 Canada    CAN 2002 1.56932 957299.91586 
2 Canada    CAN 2003 1.40105 1016902.00180 
.... 

vorrei cambiare XRAT a XRAT facendo qualcosa di simile:

data.headers.lowercase() 

In modo che ottengo:

country country isocode year  xrat   tcgdp 
0 Canada    CAN 2001 1.54876 924909.44207 
1 Canada    CAN 2002 1.56932 957299.91586 
2 Canada    CAN 2003 1.40105 1016902.00180 
3 Canada    CAN 2004 1.30102 1096000.35500 
.... 

Non saprò i nomi di ogni intestazione di colonna prima del tempo.

Grazie!

risposta

60

Si può fare in questo modo:

data.columns = map(str.lower, data.columns) 

o

data.columns = [x.lower() for x in data.columns] 

esempio:

>>> data = pd.DataFrame({'A':range(3), 'B':range(3,0,-1), 'C':list('abc')}) 
>>> data 
    A B C 
0 0 3 a 
1 1 2 b 
2 2 1 c 
>>> data.columns = map(str.lower, data.columns) 
>>> data 
    a b c 
0 0 3 a 
1 1 2 b 
2 2 1 c 
+3

Si noti che questo può portare a nomi di colonne duplicati quando inferiore (colonna1) == inferiore (colonna2) (ad esempio, 'a' e 'A'). Questo può avere conseguenze indesiderate quando si fa riferimento a colonne in un secondo momento. (ad esempio, i dati ['a'] restituiranno un DataFrame, non una serie, con tutte le colonne denominate 'a'). Vedi questo esempio per un esempio: https://gist.github.com/grisaitis/170e82a008480acb4fa3 – grisaitis

+0

'[x.lower() per x in data.columns]' è equivalente a: '[x.lower() per x nei dati] ' – joctee

9

Se si vuole fare la ridenominazione utilizzando una chiamata di metodo incatenato, è possibile utilizzare

data.rename(
    columns=unicode.lower 
) 

(Python 2)

o

data.rename(
    columns=str.lower 
) 

(Python 3)

27

si potrebbe fare facilmente con str.lower per columns:

df.columns = df.columns.str.lower() 

Esempio:

In [63]: df 
Out[63]: 
    country country isocode year  XRAT   tcgdp 
0 Canada    CAN 2001 1.54876 9.249094e+05 
1 Canada    CAN 2002 1.56932 9.572999e+05 
2 Canada    CAN 2003 1.40105 1.016902e+06 

In [64]: df.columns = df.columns.str.lower() 

In [65]: df 
Out[65]: 
    country country isocode year  xrat   tcgdp 
0 Canada    CAN 2001 1.54876 9.249094e+05 
1 Canada    CAN 2002 1.56932 9.572999e+05 
2 Canada    CAN 2003 1.40105 1.016902e+06 
Problemi correlati