2012-10-16 15 views
6

Ho panda Dataframe con indice datetime come 'YYYY-MM-DD HH: MM: SS'.Pandas DataFrame slicing di giorno/ora/minuto

Index    Parameter 
2007-05-02 14:14:08  134.8 
2007-05-02 14:14:32  134.8 
2007-05-02 14:14:41  134.8 
2007-05-02 14:14:53  134.8 
2007-05-02 14:15:01  134.8 
2007-05-02 14:15:09  134.8 
...... 
2007-05-30 23:08:02  105.9 
2007-05-30 23:18:02  105.9 
2007-05-30 23:28:02  105.9 
2007-05-30 23:38:03  105.8 

E 'possibile ottenere tagliare un dataframe per anno df['2007'] o per mese df['2007-05']?

Ma quando ho cercato di tagliare dataframe di giorno, per esempio df['2007-05-02'], ho ottenuto l'errore:

KeyError: < Timestamp: 2007-02-05 00:00:00. 

Io uso la versione 8.0.1 panda. È possibile suddividere DataFrame con una frequenza minore rispetto all'anno o al mese? Ad esempio, per giorno o ora?

+1

Interessante, l'indicizzazione per anno o anno-mese ha un comportamento diverso da quello per anno-mese-giorno. Per l'anno-mese-giorno, vengono considerati solo timestamp con H: M: S = 0: 0: 0. A proposito, suppongo tu stia lavorando su una serie e non su un DataFrame. –

risposta

11

utilizzare df.ix[x:y] dove x e sono oggetti datetime.

Esempio:

In [117]: frame.index.summary() 
Out[117]: 'DatetimeIndex: 6312960 entries, 2000-04-05 00:01:00 to 2012-04-06 00:00:00\nFreq: T' 


In [118]: x=datetime(2001, 4, 5, 0, 1) 

In [119]: y=datetime(2001, 4, 5, 0, 5) 

In [120]: print frame.ix[x:y] 
        radiation  tamb 
2001-04-05 00:01:00 67.958873 8.077386 
2001-04-05 00:02:00 50.801294 0.731453 
2001-04-05 00:03:00 16.042035 6.944998 
2001-04-05 00:04:00 5.678343 9.728967 
2001-04-05 00:05:00 72.551601 7.652942 

si può anche fare questo:

In [121]: print frame.ix[x] 
radiation 67.958873 
tamb   8.077386 
Name: 2001-04-05 00:01:00 
+0

sì, ma può essere fatto senza "colpire" un punto indice esatto? Per esempio. se la serie inizia con 2007-05-02 14:14:08, l'indicizzazione con 'x = pd.Timestamp ('2007-05-02 14:00:00')' genera ancora un 'KeyError'. – metakermit

+2

Ah, OK, è riuscito a farlo con 's.between_time (x, y)'. – metakermit