2011-11-19 9 views
11

So che questo è stato chiesto numerose volte qui sotto la rubrica "da lungo a largo", ma mi sono imbattuto in una situazione in cui ho due variabili di valore che sono misure ripetute.Da lungo a largo con due misure ripetute

  id sex time  score1 score2 
1 subject 1 m Time1 -0.20926263 0.2499310 
2 subject 2 m Time1 0.17147511 3.2708905 
3 subject 3 m Time1 -0.82619584 0.5993917 
4 subject 4 f Time1 -0.95568823 4.4729726 
5 subject 5 f Time1 -2.29939525 8.0101254 
6 subject 1 m Time2 -0.37914702 3.6387589 
7 subject 2 m Time2 0.26759909 4.9027533 
8 subject 3 m Time2 0.07727621 2.1848642 
9 subject 4 f Time2 -0.08613439 5.8747074 
10 subject 5 f Time2 -0.02743044 4.3963938 
11 subject 1 m Time3 0.07176053 3.7959496 
12 subject 2 m Time3 0.46463917 5.2494579 
13 subject 3 m Time3 -0.68764512 2.2639503 
14 subject 4 f Time3 -0.56670061 2.3361909 
15 subject 5 f Time3 1.70731774 5.8345116 

Modo rapido per riprodurre il frame di dati (DF).

DF<-data.frame(id=rep(paste("subject", 1:5, sep=" "), 3),    
       sex=rep(c("m","m","m","f","f"), 3),      
       time=c(rep("Time1",5), rep("Time2",5), rep("Time3",5)), 
       score1=rnorm(15), score2=abs(rnorm(15)*4))    

posso risolvere il problema di lungo per largo per due variabili di misura ripetuti misurati utilizzando la funzione reshape dalla base, ma speravo in una risposta plyr o reshape2/1, come questi pacchetti sono generalmente molto più intuitivo per me. Se hai altre soluzioni vai avanti e fornisci loro l'apprendimento sarebbe fantastico.

Soluzione dalla base:

wide <- reshape(DF, v.names=c("score1", "score2"), idvar="id",   
       timevar="time", direction="wide")      
wide 
+1

? Non vedo quale sia stato il voto ravvicinato ("off topic") per ...? –

+1

Ben inchiodato con rimodellamento e con un tale piccolo codice. Sono molto aperto ad altri metodi (non sono sicuro se/come farlo con data.table ecc.) –

risposta

12

penso che questo lo farà:

library(reshape) 
m <- melt(DF) 

più semplice, ma il tempo e il punteggio sono nell'ordine opposto dal vostro esempio (nel caso in cui conta)

cast(m,id+sex~...) 

O più esplicitamente:

012.
cast(m,id+sex~variable+time) 

È possibile tagliare questo fino a una battuta:

recast(DF,id+sex~...) 

Se volete potete usare il pacchetto più recente reshape2 invece di reshape, sostituendo cast con dcast (la versione di recast incluso nel reshape2 doesn Non dare il risultato desiderato.)

+0

Perfezione. Grazie per l'opportunità di apprendimento. –

2

La risposta di Ben è ottima considerando la data in cui è stata posta questa domanda. Tuttavia, è necessario notare che la funzione dcast inclusa nelle versioni più recenti di "data.table" può gestire problemi come questo senza dover prima i dati di melt. In quanto tale, sarebbe un approccio più efficiente da usare.

library(data.table) 
dcast(as.data.table(DF), id + sex ~ time, value.var = c("score1", "score2")) 
##   id sex score1_Time1 score1_Time2 score1_Time3 score2_Time1 score2_Time2 score2_Time3 
## 1: subject 1 m 0.78213630 -0.1557955 -0.10278773 1.5771598  1.013447 1.4583278 
## 2: subject 2 m 0.07456498 -1.4707524 0.38767161 0.2372536  2.787854 3.0741317 
## 3: subject 3 m -1.98935170 -0.4781501 -0.05380504 4.4001015  2.226653 0.4493848 
## 4: subject 4 f 0.61982575 0.4179416 -1.37705956 3.0527030  2.755023 3.5244309 
## 5: subject 5 f -0.05612874 1.3586796 -0.41499456 0.6580944  2.829981 1.5924235 
Problemi correlati