2012-10-29 29 views
11

Ho un frame di dati come questo:unica/quelli in data.frame

x=c("01","01","01","22","22","03","03","03","35","35") 
y=c("f","f","f","m","m","m","m","m","f","f") 
df=data.frame(spn=x, sex=y) 

sembra:

spn sex 
1 01 f 
2 01 f 
3 01 f 
4 22 m 
5 22 m 
6 03 m 
7 03 m 
8 03 m 
9 35 f 
10 35 f 

Quello che mi piacerebbe fare è ordinare la df $ spn e lascia che appaia solo una volta. l'appropriato df $ sex, come:

spn sex 
1 01 f 
2 03 m 
3 22 m 
4 35 f 

Come potrei farlo? molte molte grazie!

risposta

9
df <- df[order(df$spn), ] 
> df[!duplicated(df), ] 
    spn sex 
1 01 f 
6 03 m 
4 22 m 
9 35 f 
9
df2 = df[!duplicated(df), ] # Remove duplicated rows. 
df3 = df2[order(df2$spn), ] # Sort by the spn column. 

df3 
# spn sex 
#1 01 f 
#6 03 m 
#4 22 m 
#9 35 f 
+2

dal punto di vista dell'efficienza, è davvero veloce se i duplicati vengono rimossi prima. – flodel

2

Uso unica per poi:

df <- unique(df) 
df[order(df$spn), ] 
Problemi correlati