Non capisco cosa significhi il valore p in questa uscita. Non intendo p-value in quanto tale, ma in questo caso.Confronto tra due modelli lineari con anova() in R
> Model 1: sl ~ le + ky
> Model 2: sl ~ le
Res.Df RSS Df Sum of Sq F Pr(>F)
1 97 0.51113
2 98 0.51211 -1 -0.00097796 0.1856 0.6676
Ho qualcosa di simile, e ora mi chiedo quale modello è la soluzione migliore. Dato che ci sono solo UN e non DUE valori di p, mi sto confondendo. ottengo diverse pvalues utilizzando sintesi (model1) o di sintesi (model2)
Ora, se
> fm2<-lm(Y~X+T)
(T essere il mio indicatore variabile) e
> fm4<-lm(Y~X)
se faccio
> anova(fm2,fm4)
questo test l'ipotesi nulla H0: alpha1==alpha2
(Ha: alpha1!=alpha2)
c (alfa essere mio intercetta) Così è testato se sia meglio avere un'intercetta (=>alpha1==alpha2
), o due intercetta (alpha1!=alpha2
)
In questo caso avremmo ora respingere ovviamente l'ipotesi nulla, poiché il valore p è 0.6676.
Ciò significherebbe piuttosto attenersi al modello fm4
, poiché è più appropriato per i nostri dati.
Ho tratto le conclusioni giusto? Ho fatto del mio meglio, ma non sono sicuro di cosa significhi il valore p. Dato che c'è solo, questo è quello che pensavo potesse significare. Qualcuno può chiarire le cose?