Originariamente, io principalmente voglio eseguire un modello probit/logit con errore standard in cluster in R che è abbastanza intuitivo in Stata. Mi sono imbattuto con la risposta qui Logistic regression with robust clustered standard errors in R. Pertanto, ho provato a confrontare il risultato di Stata e di R con il robusto errore standard e l'errore standard del cluster. Ma ho notato che le uscite per entrambi gli errori standard tra software non sono esattamente le stesse. Tuttavia, se utilizzo il metodo suggerito qui https://diffuseprior.wordpress.com/2012/06/15/standard-robust-and-clustered-standard-errors-computed-in-r/. Posso ottenere l'output esatto sia da R che da Stata per la regressione lineare. Pertanto, temo che il codice che ho scritto in R non sia corretto e quale comando utilizzare se voglio eseguire un modello probit invece di un modello logit. O se esistono alternative eleganti per risolvere questo problema? Grazie.errore standard robusto e in cluster in R per regressione probit e logit
codice R
codice## 1. linear regression
library(rms)
# model<-lm(Sepal.Length~Sepal.Width+Petal.Length+Petal.Width,iris)
summary(model)
fit=ols(Sepal.Length~Sepal.Width+Petal.Length+Petal.Width, x=T, y=T, data=iris)
fit
robcov(fit) #robust standard error
robcov(fit, cluster=iris$Species) #clustered standard error
## 2. logistic regression
##demo data generation
set.seed(1234)
subj<-rep(1:20,each=4)
con1<-rep(c(1,0),40)
con2<-rep(c(1,1,0,0),20)
effect<-rbinom(80,1,0.34)
data<-data.frame(subj,con1,con2,effect)
library(foreign);write.dta(data,'demo_data.dta')
library(rms)
fit=lrm(effect ~ con1 + con2, x=T, y=T, data=data)
fit
robcov(fit) ##robust standard error
robcov(fit, cluster=data$subj) ## clustered standard error
Stata
## 1. linear regression
webuse iris
reg seplen sepwid petlen petwid
reg seplen sepwid petlen petwid,r
reg seplen sepwid petlen petwid,cluster(iris)
## 2. logistic regression
use demo_data,clear
logit effect con1 con2
logit effect con1 con2,r
logit effect con1 con2,cluster(subj)
Puoi specificare cosa significa "non esattamente lo stesso"? Ci sono un sacco di impostazioni predefinite che sono probabilmente diverse. A priori non è chiaro quali valori predefiniti siano migliori. Ma se vuoi ottenere esattamente gli stessi valori, devi capire quali valori di default 'Stata' e' robcov' usano e regolarli di conseguenza. – coffeinjunky
Grazie per il tuo commento, ho modificato la mia domanda per fornire ulteriori informazioni – johnsonzhj
È possibile che tu stia utilizzando logit senza prima eseguire la logistica? "' logistico' visualizza le stime come rapporti di quota, per visualizzare i coefficienti, digitare logit dopo aver eseguito la logistica "([fonte] (http://www.stata.com/manuals13/rlogistic.pdf#rlogistic)) – noumenal