8
Vorrei creare più colonne durante il resampling di un DataFrame panda come il metodo ohlc incorporato.Creazione di più colonne nella funzione di aggregazione dei panda
def mhl(data):
return pandas.Series([np.mean(data),np.max(data),np.min(data)],index = ['mean','high','low'])
ts.resample('30Min',how=mhl)
muore con
Exception: Must produce aggregated value
Qualche suggerimento? Grazie!
È circa 10 volte più veloce da usare '" m ean "" che usare 'np.mean'. Lo stesso vale per "min" e "max" –
Esiste un modo per specificare un valore predefinito per la maggior parte delle colonne (ad esempio, 'sum' invece di' mean') e quindi sovrascrivere il metodo per una singola colonna? –
Neat trick: puoi anche passare un dizionario (per le colonne) del dizionario delle funzioni, in questo modo: 'mhl = {'data_column_1': {'resultA': np.mean, 'resultB': max}, 'data_column_2' : {'resultC': min, 'resultD': sum}} ' –