Cerco di recuperare per ogni riga contenente i valori NaN tutti gli indici delle colonne corrispondenti.Recupera indici di valori NaN in un dataframe panda
d=[[11.4,1.3,2.0, NaN],[11.4,1.3,NaN, NaN],[11.4,1.3,2.8, 0.7],[NaN,NaN,2.8, 0.7]]
df = pd.DataFrame(data=d, columns=['A','B','C','D'])
print df
A B C D
0 11.4 1.3 2.0 NaN
1 11.4 1.3 NaN NaN
2 11.4 1.3 2.8 0.7
3 NaN NaN 2.8 0.7
ho già fatto seguente:
- aggiungere una colonna con il conteggio di NaN per ogni riga
- ottenere gli indici di ciascuna riga contenente NaN valori
Quello che voglio (idealmente il nome della colonna) è ottenere una lista come questa:
[ ['D'],['C','D'],['A','B'] ]
spero di poter trovare un modo senza fare per ogni riga del test per ogni colonna
if df.ix[i][column] == NaN:
Sto cercando un modo panda per essere in grado di affrontare la mia enorme insieme di dati.
Grazie in anticipo.
Ho già trovato gli indici di ogni riga contenente NaN v alori. Quello che voglio sono gli indici delle colonne per ogni riga. Scusa se la descrizione non è chiara. – dooms