2012-08-30 13 views

risposta

48

Sì, c'è. Se esiste un link function relativo al predittore lineare al valore atteso della risposta (ad esempio registro per regressione di Poisson o logit per regressione logistica), predict restituisce i valori corretti prima dello viene applicato l'inverso della funzione di collegamento (per restituire il valore dati alla stessa scala della variabile di risposta), e fitted lo mostra dopo lo applicato.

Ad esempio:

x = rnorm(10) 
y = rpois(10, exp(x)) 
m = glm(y ~ x, family="poisson") 

print(fitted(m)) 
#   1   2   3   4   5   6   7   8 
# 0.3668989 0.6083009 0.4677463 0.8685777 0.8047078 0.6116263 0.5688551 0.4909217 
#   9  10 
# 0.5583372 0.6540281 
print(predict(m)) 
#   1   2   3   4   5   6   7 
# -1.0026690 -0.4970857 -0.7598292 -0.1408982 -0.2172761 -0.4916338 -0.5641295 
#   8   9   10 
# -0.7114706 -0.5827923 -0.4246050 
print(all.equal(log(fitted(m)), predict(m))) 
# [1] TRUE 

Ciò significa che per i modelli creati mediante regressione lineare (lm), non c'è differenza tra fitted e predict.

In termini pratici, ciò significa che se si desidera confrontare l'adattamento con i dati originali, è necessario utilizzare fitted.

+13

buona risposta fino a come va, ma puoi usare 'prevedere (m, type =" response ")' per ottenere previsioni sulla scala originale (risposta), e come @GregSnow indica sotto, 'predicict' ha opzioni aggiuntive (a seconda del caso). La versione di sviluppo di 'lme4', su r-forge, * fa * ha un metodo' predicict() '. –

16

La funzione fitted restituisce i valori di y-hat associati ai dati utilizzati per adattarsi al modello. La funzione predict restituisce previsioni per un nuovo set di variabili predittive. Se non si specifica un nuovo set di variabili predittive, per impostazione predefinita utilizzerà i dati originali dando gli stessi risultati di fitted per alcuni modelli, ma se si desidera prevedere un nuovo set di valori, è necessario predict. La funzione predict spesso ha anche opzioni per il tipo di previsione da restituire, il predittore lineare, la predizione trasformata in scala di risposta, la categoria più probabile, il contributo di ciascun termine nel modello, ecc.

Problemi correlati