2010-06-16 10 views
9

Sto eseguendo una regressione dei minimi quadrati come segue (univariata). Vorrei esprimere il significato del risultato in termini di R^2. Numpy restituisce un valore di residuo non livellato, quale sarebbe un modo ragionevole per normalizzarlo.Conversione del valore residuo Numpy Lstsq su R^2

field_clean,back_clean = rid_zeros(backscatter,field_data) 
num_vals = len(field_clean) 
x = field_clean[:,row:row+1] 
y = 10*log10(back_clean) 

A = hstack([x, ones((num_vals,1))]) 
soln = lstsq(A, y) 
m, c = soln [0] 
residues = soln [1] 

print residues 

risposta

17

Vedi http://en.wikipedia.org/wiki/Coefficient_of_determination

Il valore R2 =

1 - residual/sum((y - y.mean())**2) 

che equivale a

1 - residual/(n * y.var()) 

Ad esempio:

import numpy as np 

# Make some data... 
n = 10 
x = np.arange(n) 
y = 3 * x + 5 + np.random.random(n) 

# Note that polyfit is an easier way to do this... 
# It would just be "model, resid = np.polyfit(x,y,1,full=True)[:2]" 
A = np.vstack((x, np.ones(n))).T 
model, resid = np.linalg.lstsq(A, y)[:2] 

r2 = 1 - resid/(y.size * y.var()) 
print r2 
+0

possiamo eseguire questa operazione in caso di 'scipy.linalg.lstsq'!? – diffracteD

+0

e in che modo questo esempio 'numpy' che hai dato vale per i dati 3D!? non essere in grado di ottenerlo .. – diffracteD

Problemi correlati