2013-05-27 15 views
7

Ho il seguente dataframe (DF1):righe Collapse R- e sommare i valori nella colonna

ID someText PSM OtherValues 
ABC c 2 qwe 
CCC v 3 wer 
DDD b 56 ert 
EEE m 78 yu 
FFF sw 1 io 
GGG e 90 gv 
CCC r 34 scf 
CCC t 21 fvb 
KOO y 45 hffd 
EEE u 2 asd 
LLL i 4 dlm 
ZZZ i 8 zzas 

desidero comprimere la prima colonna e aggiungere il corrispondente PSM valori e Vorrei ottenere il seguente risultato:

ID Sum PSM 
ABC 2 
CCC 58 
DDD 56 
EEE 80 
FFF 1 
GGG 90 
KOO 45 
LLL 4 
ZZZ 8 

Sembra fattibile con funzione di aggregazione ma non conosco la sintassi. Qualsiasi aiuto è molto apprezzato! Grazie.

risposta

16

In Base:

aggregate(PSM ~ ID, data=x, FUN=sum) 
## ID PSM 
## 1 ABC 2 
## 2 CCC 58 
## 3 DDD 56 
## 4 EEE 80 
## 5 FFF 1 
## 6 GGG 90 
## 7 KOO 45 
## 8 LLL 4 
## 9 ZZZ 8 
2

Questo è super facile utilizzando il pacchetto plyr:

library(plyr) 
ddply(df1, .(ID), summarize, Sum=sum(PSM)) 
1

Esempio con dplyr, la prossima iterazione del plyr:

df2 <- df1 %>% group_by(ID) %>% 
    summarize(Sum_PSM = sum(PSM)) 

Quando si mette i personaggi %>%, sei "piping". Ciò significa che stai inserendo ciò che si trova sul lato sinistro dell'operatore del tubo e eseguendo la funzione sulla destra.

Problemi correlati