Una variabile binomiale con n prove e probabilità p di successo in ciascuna prova può essere vista come la somma di n prove di Bernoulli ciascuna avendo anche probabilità p di successo.
Analogamente, è possibile costruire coppie di variabili binomiali correlate per sommando coppie di variabili di Bernoulli aventi la correlazione desiderata r.
require(bindata)
# Parameters of joint distribution
size <- 20
p1 <- 0.5
p2 <- 0.3
rho<- 0.2
# Create one pair of correlated binomial values
trials <- rmvbin(size, c(p1,p2), bincorr=(1-rho)*diag(2)+rho)
colSums(trials)
# A function to create n correlated pairs
rmvBinomial <- function(n, size, p1, p2, rho) {
X <- replicate(n, {
colSums(rmvbin(size, c(p1,p2), bincorr=(1-rho)*diag(2)+rho))
})
t(X)
}
# Try it out, creating 1000 pairs
X <- rmvBinomial(1000, size=size, p1=p1, p2=p2, rho=rho)
# cor(X[,1], X[,2])
# [1] 0.1935928 # (In ~8 trials, sample correlations ranged between 0.15 & 0.25)
È importante notare che ci sono molti distribuzioni congiunte diversi che condividono il coefficiente di correlazione desiderato. Il metodo di simulazione in rmvBinomial()
produce uno di questi, ma indipendentemente dal fatto che sia appropriato dipenderà dal processo che genera i dati.
Come osservato in this R-help answer ad una domanda simile (che va poi a spiegare l'idea più in dettaglio):
mentre un bivariati normali (dato mezzo e varianze) è univocamente definita dal coefficiente di correlazione , questo non è il caso di un bivariata binomio
fonte
2012-05-10 17:42:21
È possibile utilizzare il pacchetto 'bindata', come ben demo'd qui: https://stat.ethz.ch/pipermail/r-help/2007-July/135575.html. (Quel collegamento era nella prima pagina restituita da una ricerca di Google per "simula la variabile binomiale correlata R" ...) –
Grazie Josh, ma ho bisogno di dati binomiali non binari! – Arnaud
@Arnaud - concesso Non ho avuto alcun tipo di caffeina o stimolante stamattina, ma non è una distribuzione binomiale una distribuzione discreta in cui gli unici valori accettabili sono "sì/no", "pass/fail", "VERO/FALSO ", in altre parole binario? Questo è ciò che [Wikipedia sembra pensare.] (Http://en.wikipedia.org/wiki/Binomial_distribution) – Chase