Ho un dataframe che assomiglia seguente:sottoinsieme dataframe sulla base di conteggi periferici
df <- data.frame(Site=rep(paste0('site', 1:5), 50),
Month=sample(1:12, 50, replace=T),
Count=(sample(1:1000, 50, replace=T)))
Voglio rimuovere tutti i siti in cui il conteggio è sempre < 5% del conteggio mensile massimo in tutti i siti.
I conteggi mensili max in tutti i siti sono:
library(plyr)
ddply(df, .(Month), summarise, Max.Count=max(Count))
Se un conteggio di 1 è assegnato a site5, allora i suoi conti sono sempre < 5% di conteggi mensili max in tutti i siti. Quindi vorrei rimuovere site5.
df$Count[df$Site=='site5'] <- 1
Tuttavia, dopo l'assegnazione di nuovi valori site2, alcuni dei suoi conti sono < 5% di conteggi mensili max, mentre altri sono> 5%. Pertanto, non vorrei rimuovere site2.
df$Count[df$Site=='site2'] <- ceiling(seq(1, 1000, length.out=20))
Come posso sottoinsieme dataframe di rimuovere tutti i siti in cui i conteggi sono sempre < 5% del numero di max mensile? Fammi sapere se la domanda non è chiara e correggerò.
Quindi rimuovere tutte le righe per i siti in cui conta <5% count max gennaio, <5% count massimo in febbraio, <5% del conteggio massimo a marzo .... ogni mese dell'anno. Non rimuovere alcuna riga per i siti in cui, ad esempio, viene conteggiato il conteggio <5% massimo ogni mese tranne giugno. – luciano
@RossAhmed, questo dovrebbe farlo. – Arun