2015-08-21 10 views
6

hanno una serie di tempo (ts) indicizzati da DatatimeIndex, vuole gruppo è di 10 minutiCome raggruppare le serie temporali di 10 minuti usando i panda?

index x y z 

ts1  .... 
ts2  .... 
... 

so come gruppo di 1 minuto

def group_by_minute(timestamp): 
    year = timestamp.year 
    month = timestamp.month 
    day = timestamp.day 
    hour = timestamp.hour 
    minute = timestamp.minute 
    return datetime.datetime(year, month, day, hour, minute) 

poi

ts.groupby(group_by_minute, axis=0) 

la mia funzione personalizzata (circa)

def my_function(group): 
    first_latitude = group['latitude'].sort_index().head(1).values[0] 
    last_longitude = group['longitude'].sort_index().tail(1).values[0] 
    return first_latitude - last_longitude 

in modo che il ts dataframe dovrebbe assolutamente contiene 'latitudine' e le colonne 'di longitudine'

Quando si utilizza TimeGrouper

ts.groupby(pd.TimeGrouper(freq='100min')).apply(my_function) 

mi sono i seguenti errori,

TypeError: cannot concatenate a non-NDFrame object 
+0

Hai provato 'resample'? Per esempio. 'df.resample ('1min', 'mean')' Quale aggregazione stai facendo – JoeCondron

+0

@JoeCondron Sto applicando le funzioni personalizzate con la funzione APPLY. Mi sembra che resample o TimeGrouper riempiano automaticamente il gap, anche se c'è un intervallo temporale di un anno. C'è un modo per evitare questo? Grazie mille –

+0

Puoi passare la tua funzione personalizzata come: 'df.resample ('10min', how = my_func)'. Non colmerà le lacune a meno che tu non lo dica. Forse dovresti postare la funzione che vuoi passare e l'output desiderato. In alternativa, puoi regolare l'ultima riga della tua funzione a 'minute = 10 * (minute/10)'. – JoeCondron

risposta

10

c'è un pandas.TimeGrouper per questo genere di cose, quello che hai descritto sarebbe qualcosa del tipo:

agg_10m = df.groupby(pd.TimeGrouper(freq='10Min')).aggregate(numpy.sum) #or other function 
+1

per la risposta. Sembra che pd.TimeGrouper esista, ma non è documentato qui http://pandas.pydata.org/pandas-docs/stable/api.html –

+0

oops, hai ragione. Non notare mai che non è documentato. –

+0

ottieni un "TypeError: impossibile concatenare un oggetto non-NDFrame" applicando TimeGrouper –

2

So che questo è vecchio ma pd.Grouper() sarà anche raggiungere questo obiettivo:

agg_10m = df.groupby(pd.Grouper(freq='10Min')).aggregate(numpy.sum) 
Problemi correlati