Reindex sottolivello di panda dataframe multiindex

Ho un dataframe serie temporali e vorrei reindicarlo tramite Trials and Measurements.Reindex sottolivello di panda dataframe multiindex

semplificato, ho questo:

cui voglio diventare questo:

Come posso fare questo meglio?

fonte

2013-11-20 TheChymera

Proprio ieri, l'illustre Andy Hayden ha aggiunto questa funzione alla versione 0.13 di panda, che verrà rilasciata da un giorno all'altro. Vedere here per l'esempio di utilizzo che ha aggiunto ai documenti.

Se è possibile installare la versione di sviluppo dei panda dal sorgente, è possibile utilizzarla ora.

df['Measurements'] = df.reset_index().groupby('Trial').cumcount()

Il seguente codice è equivalente, se meno conciso, e funzionerà su qualsiasi versione recente di panda.

grouped = df.reset_index().groupby('Trial') 
df['Measurements'] = grouped.apply(lambda x: Series(np.arange(len(x)), x.index))

Infine, df.set_index(['Trial', 'Measurements'], inplace=True) per ottenere il risultato desiderato.

fonte

2013-11-20 19:43:40

haha! "illustrious" +1;) (Nota: cumcount funziona anche con i duplicati nell'indice, ma "equivalenti" non ... Ero un po 'sfacciato nei documenti e dicevo "* essenzialmente * equivalente": p) –

e se Il mio indice non è chiamato ('misure') - ma piuttosto non ha alcun nome? – TheChymera

I livelli dell'indice possono essere specificati usando la parola chiave '' level'', come '' groupby (level = 1) ''. –

Reindex sottolivello di panda dataframe multiindex

risposta

Problemi correlati