Diciamo che ho quattro campioni: id = 1, 2, 3, e 4, con una o più misure su ciascuno di questi campioni:Rimuovere i duplicati mantenendo voce con grande valore assoluto
> a <- data.frame(id=c(1,1,2,2,3,4), value=c(1,2,3,-4,-5,6))
> a
id value
1 1 1
2 1 2
3 2 3
4 2 -4
5 3 -5
6 4 6
voglio rimuovere i duplicati, mantenendo solo una voce per ID, quella con il valore assoluto più alto della colonna "valore". Io, questo è quello che voglio:
> a[c(2,4,5,6), ]
id value
2 1 2
4 2 -4
5 3 -5
6 4 6
Come posso fare questo in R?
Lei parla di "* mantenendo solo una voce per ID - quella che ha il più grande valore assoluto del 'valore' colonna. * "Qual è il comportamento desiderato se più di una voce per ID corrisponde a tale condizione? Restituire entrambi i valori o uno dei due? Ad esempio, qual è l'output desiderato se 'a [3, 2] <- 4'? – A5C1D2H2I1M1N2O1R2T1
Ah .. questa è una buona domanda. La colonna del valore è un numero reale reale non un intero e molto probabilmente non sarà mai esattamente uguale. Il comportamento ideale desiderato dovrebbe probabilmente essere quello di scartare entrambe le osservazioni, ma probabilmente non succederà come ho detto. –
Grazie a tutti per l'aiuto. –