ho tempo-indicizzato dati:panda - Estendi l'indice di un DataFrame impostando tutte le colonne per le nuove righe su NaN?
df2 = pd.DataFrame({ 'day': pd.Series([date(2012, 1, 1), date(2012, 1, 3)]), 'b' : pd.Series([0.22, 0.3]) })
df2 = df2.set_index('day')
df2
b
day
2012-01-01 0.22
2012-01-03 0.30
Qual è il modo migliore per estendere questo frame di dati in modo che abbia una riga per ogni giorno nel gennaio 2012 (ad esempio), in cui tutte le colonne sono impostate per NaN
(qui solo b
) dove non abbiamo dati?
Così il risultato desiderato sarebbe:
b
day
2012-01-01 0.22
2012-01-02 NaN
2012-01-03 0.30
2012-01-04 NaN
...
2012-01-31 NaN
Molte grazie!
Grazie - questo è grande per riempire i buchi, ma come posso estendere a '2012-01-31' (dire). – paul
Hmmh. Ma se ho più buchi/lacune nelle serie temporali originali, allora questo non funziona più. – paul
@paul sì la mia risposta è limitata a questo riguardo, non riesco a pensare ad un metodo più generico. Sarebbe meglio creare il DataFrame con tutti i valori previsti, se possibile, avrò una soluzione e vedrò se riesco a trovare qualcosa di meglio – EdChum