Supponiamo di avere un df:Python-panda Sostituire NA con la mediana o media di un gruppo in dataframe
A B
apple 1.0
apple 2.0
apple NA
orange NA
orange 7.0
melon 14.0
melon NA
melon 15.0
melon 16.0
per sostituire la NA, possiamo usare df [ "B"] fillna (df [. "B"]. Median()), ma riempirà NA con la mediana di tutti i dati in "B"
Esiste un modo per utilizzare la mediana di una determinata A per sostituire l'ND (come di seguito):
A B
apple 1.0
apple 2.0
apple **1.5**
orange **7.0**
orange 7.0
melon 14.0
melon **15.0**
melon 15.0
melon 16.0
Grazie!
perché è R tagged? –
'con (dd, ifelse (is.na (B), ave (B, A, FUN = funzione (x) mediana (x, na.rm = TRUE)), B))' – rawr
Questo shld non ha una R tag – hrbrmstr