Sto utilizzando un codice SQL abbastanza semplice per calcolare i coefficienti di regressione (intercetta e pendenza) di alcuni punti (x, y), utilizzando i minimi quadrati. Questo mi dà una bella linea di adattamento attraverso i dati. Tuttavia, vorremmo essere in grado di vedere gli intervalli di confidenza del 95% e del 5% per la linea di best-fit (le curve di seguito).Intervalli di confidenza di regressione lineare in SQL
link text http://www.curvefit.com/2a03be60.gif
Cosa significano è che la vera linea ha il 95% di probabilità di essere al di sotto della curva superiore e il 95% di probabilità di essere al di sopra della curva inferiore. Come posso calcolare queste curve? Ho già letto wikipedia ecc. E fatto alcuni googling ma non ho trovato equazioni matematiche comprensibili per essere in grado di calcolare questo.
Modifica: ecco l'essenza di ciò che ho adesso.
--sample data
create table #lr (x real not null, y real not null)
insert into #lr values (0,1)
insert into #lr values (4,9)
insert into #lr values (2,5)
insert into #lr values (3,7)
declare @slope real
declare @intercept real
--calculate slope and intercept
select
@slope = ((count(*) * sum(x*y)) - (sum(x)*sum(y)))/
((count(*) * sum(Power(x,2)))-Power(Sum(x),2)),
@intercept = avg(y) - ((count(*) * sum(x*y)) - (sum(x)*sum(y)))/
((count(*) * sum(Power(x,2)))-Power(Sum(x),2)) * avg(x)
from #lr
Grazie in anticipo.
Questo è un collegamento morto. – DatumPoint
Così è! Tuttavia non ne ho memoria. Scusate. – PowerUser