Mi piacerebbe conoscere un modo di eseguire ANCOVA (analisi della covarianza) usando Python con scipy. È fondamentalmente un confronto statistico delle linee di regressione. So che Python può fare ANOVA e può anche fare il montaggio della linea di regressione con Scipy.stats. Non sono sicuro di come metterli insieme per ottenere un ANCOVA efficace, se è possibile.ANCOVA in Python con statistiche Scipy/Numpy
risposta
ANCOVA può essere eseguito con la regressione e utilizzando variabili fittizie nella matrice di progettazione per gli effetti che dipendono dalla variabile categoriale.
Un semplice esempio è http://groups.google.com/group/pystatsmodels/browse_thread/thread/aaa31b08f3df1a69?hl=en utilizzando la classe OLS da scikits.statsmodels
parte rilevante di costruzione della matrice disegno xg comprende numeri di gruppo/etichette, x1 è continua variabile esplicativa
>>> dummy = (xg[:,None] == np.unique(xg)).astype(float)
>>> X = np.c_[x1, dummy[:,1:], np.ones(nsample)]
Stima del modello
>>> res2 = sm.OLS(y, X).fit()
>>> print res2.params
[ 1.00901524 3.08466166 -2.84716135 9.94655423]
>>> print res2.bse
[ 0.07499873 0.71217506 1.16037215 0.38826843]
>>> prstd, iv_l, iv_u = wls_prediction_std(res2)
"ipotesi di prova che tutti i gruppi hanno lo stesso intercettare"
>>> R = [[0, 1, 0, 0],
... [0, 0, 1, 0]]
>>> print res2.f_test(R)
<F test: F=array([[ 91.69986847]]), p=[[ 8.90826383e-17]],
df_denom=46, df_num=2>
respinto con forza, perché le differenze di intercettazione sono molto grandi
Update (due anni e mezzo più tardi):
scikits.statsmodels
ha stato rinominato in statsmodels
e alla domanda:
Con l'ultima versione di statsmodels, è più comodo utilizzare le formule per specificare gli effetti categoriali e gli effetti di interazione. statsmodels
utilizza patsy per gestire le formule e crea le matrici di progetto.
Ulteriori informazioni sono disponibili ai collegamenti alla documentazione statsmodels in https://stackoverflow.com/a/19495920/333700
- 1. Statistiche python modelli - termine quadratico in regressione
- 2. libreria bootstrap di statistiche in Python?
- 3. statistiche matematiche con Linq
- 4. Statistiche riassuntive con ddply
- 5. dati statistiche con funzione integrale
- 6. Visualize ANCOVA formule inclusa (per esempio libreria HH)
- 7. Come utilizzare i componenti connessi di openCV con le statistiche in python?
- 8. Calcolo delle statistiche sugli array
- 9. Python statistiche: Come faccio a scrivere ad un (leggibile) file
- 10. Come calcolare le statistiche "t-test" con numpy
- 11. Statistiche della lingua Java
- 12. Faking di statistiche Oracle?
- 13. Alternative alle statistiche :: risagoma
- 14. Analisi del sistema di tracciamento e delle statistiche in tempo reale in Python
- 15. statistiche codice coupon
- 16. Statistiche sulle versioni HTML
- 17. Ottenere statistiche grafite accurate_counts
- 18. Statistiche file NodeJS
- 19. Strumento per statistiche programma
- 20. Interpretazione delle statistiche Z3
- 21. Esercitazione statistiche CruiseControl.net
- 22. Memcache statistiche comprensione
- 23. auto create statistiche
- 24. Statistiche thread per CPU in Linux
- 25. Controllare gli obiettivi delle statistiche in PostgreSQL
- 26. leggenda per le statistiche riassuntive in ggplot2
- 27. API statistiche sviluppatori Google Play
- 28. Boxplot Matplotlib utilizzando le statistiche precalcolate (sommario)
- 29. Calcolo delle statistiche su 1000 array
- 30. Riproduci Google (Negozio Android) Statistiche