Come faccio a calcolare la correlazione tra le corrispondenti colonne di due matrici e non ottenere altre correlazioni come uscita

ho questi datiCome faccio a calcolare la correlazione tra le corrispondenti colonne di due matrici e non ottenere altre correlazioni come uscita

> a 
    a b c 
1 1 -1 4 
2 2 -2 6 
3 3 -3 9 
4 4 -4 12 
5 5 -5 6 

> b 
    d e f 
1 6 -5 7 
2 7 -4 4 
3 8 -3 3 
4 9 -2 3 
5 10 -1 9 

> cor(a,b) 
      d   e    f 
a 1.0000000 1.0000000  0.1767767 
b -1.0000000 -1.000000 -0.1767767 
c 0.5050763 0.5050763 -0.6964286

il risultato che voglio è solo:

cor(a,d) = 1 
cor(b,e) = -1 
cor(c,e) = 0.6964286

fonte

2011-07-15 rder

avrei probabilmente personalmente basta usare diag:

> diag(cor(a,b)) 
[1] 1.0000000 -1.0000000 -0.6964286

Ma si potrebbe anche usare mapply:

> mapply(cor,a,b) 
     a   b   c 
1.0000000 -1.0000000 -0.6964286

fonte

2011-07-15 23:33:47

La prima risposta sopra calcola tutte le correlazioni a coppie, che va bene a meno che le matrici sono grandi, e la seconda non funziona. Per quanto posso dire, efficiente calcolo deve essere fatto direttamente, come ad esempio questo codice preso in prestito dal prestito dal pacchetto arrayMagic Bioconductor, funziona in modo efficiente per grandi matrici:

> colCors = function(x, y) { 
+ sqr = function(x) x*x 
+ if(!is.matrix(x)||!is.matrix(y)||any(dim(x)!=dim(y))) 
+  stop("Please supply two matrices of equal size.") 
+ x = sweep(x, 2, colMeans(x)) 
+ y = sweep(y, 2, colMeans(y)) 
+ cor = colSums(x*y)/sqrt(colSums(sqr(x))*colSums(sqr(y))) 
+ return(cor) 
+ } 

> set.seed(1) 
> a=matrix(rnorm(15),nrow=5) 
> b=matrix(rnorm(15),nrow=5) 
> diag(cor(a,b)) 
[1] 0.2491625 -0.5313192 0.5594564 
> mapply(cor,a,b) 
[1] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 
> colCors(a,b) 
[1] 0.2491625 -0.5313192 0.5594564

fonte

2011-11-15 20:33:21 user1048410

È possibile aggiungere valori p e anche valori p regolati per confronti multipli? – user1883491

mapply opere con i frame di dati, ma non matrici. Questo perché nei frame di dati ogni colonna è un elemento, mentre nelle matrici ogni voce è un elemento.

Nella risposta sopra mapply(cor,as.data.frame(a),as.data.frame(b)) funziona bene.

set.seed(1) 
a=matrix(rnorm(15),nrow=5) 
b=matrix(rnorm(15),nrow=5) 
diag(cor(a,b)) 
[1] 0.2491625 -0.5313192 0.5594564 
mapply(cor,as.data.frame(a),as.data.frame(b)) 
    V1   V2   V3 
0.2491625 -0.5313192 0.5594564

Questo è molto più efficiente per le matrici di grandi dimensioni.

fonte

2018-03-08 21:35:27

Come faccio a calcolare la correlazione tra le corrispondenti colonne di due matrici e non ottenere altre correlazioni come uscita

risposta

Problemi correlati