2016-02-21 10 views
5

Voglio valutare un modello di rischio esponenziale con un predittore in R. Per qualche motivo, ottengo coefficienti con segni opposti quando lo stimolo usando un glm poisson con il log di offset t e quando uso solo la funzione di sopravvivenza del pacchetto di sopravvivenza. Sono sicuro che la spiegazione è perfettamente ovvia ma non riesco a capirlo.Direzioni opposte dei coefficienti del modello di rischio esponenziale (con survreg e glit poisson)

Esempio

t <- c(89,74,23,74,53,3,177,44,28,43,25,24,31,111,57,20,19,137,45,48,9,17,4,59,7,26,180,56,36,51,6,71,23,6,13,28,16,180,16,25,6,25,4,5,32,94,106,1,69,63,31) 
d <- c(0,1,1,0,1,1,0,1,1,0,1,1,1,1,0,0,1,0,1,1,1,0,1,0,1,1,0,0,1,1,1,1,1,1,1,1,1,0,1,1,1,1,1,1,1,0,1,1,1,1,1) 
p <- c(1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,0,0,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,0,0,0,1,1,1) 
df <- data.frame(d,t,p) 

# exponential hazards model using poisson with offest log(t) 
summary(glm(d ~ offset(log(t)) + p, data = df, family = "poisson")) 

Produce:

Coefficients: 
      Estimate Std. Error z value Pr(>|z|)  
(Intercept) -5.3868  0.7070 -7.619 2.56e-14 *** 
p    1.3932  0.7264 1.918 0.0551 . 

Rispetto

# exponential hazards model using survreg exponential 
require(survival) 
summary(survreg(Surv(t,d) ~ p, data = df, dist = "exponential")) 

Produce:

  Value Std. Error  z  p 
(Intercept) 5.39  0.707 7.62 2.58e-14 
p   -1.39  0.726 -1.92 5.51e-02 

Perché i coefficienti sono in direzioni opposte e come interpreterei i risultati come stanno? Grazie!

+0

Ok, quindi sto iniziando a leggere l'idea leggendo [questo] (http://www.math.ku.dk/~richard/courses/regression2014/survival.html). Mentre il modello di Poisson stima i pericoli, il modello di sopravvivenza è un modello di tempo di fallimento accelerato. Dato che sto usando un modello esponenziale e non un Weibull, i coefficienti sono esattamente gli stessi solo in direzioni opposte. Comunque sto ancora cancellando l'interpretazione. – fmerhout

+2

Questo è facile. Le variabili di risposta nei due modelli sono diverse. Per Poisson, stai modellando il conteggio/stato degli eventi (solo da 0-1), quindi il coef è come 'rischio' o 'rischio', mentre nel 'modello di sopravvivenza' il tempo del modello, quindi il coef è come 'sopravvivenza' (log time ratio), che è correlato negativamente al "rischio". Più alto è il rischio/pericolo, più breve è il tempo di sopravvivenza. – Eric

risposta

0

Nel secondo modello un valore aumentato di p è associato a una riduzione della sopravvivenza prevista. Nel primo modello l'aumento dello p che aveva un valore t lungo implicherebbe una maggiore probabilità di sopravvivenza e un rischio inferiore. Le variazioni del rischio e i valori medi del tempo di sopravvivenza di necessità vanno in direzioni opposte. Il fatto che i valori assoluti siano gli stessi deriva dal log dell'identità matematica (1/x) = -log (x). Il rischio è (esattamente) inversamente proporzionale alla durata media in modelli esponenziali.

+0

Grazie, questo è esattamente quello che stavo cercando. Certo, un po 'di credito dovrebbe anche andare a @Eric che è stato il primo a fornire questa risposta - non solo come risposta. – fmerhout

+0

Puoi anche dare un'occhiata a: 'summary (survreg (Surv (t, d) ~ p, data = df, dist =" weibull ", scale = 1))' e nota il commento nella sezione Esempi di '? Survreg' –

Problemi correlati