Regresní přímka Model: Yn×1 = Xn×kk×1 + en×1 Rovnice pro odhad : X Y = X X = b = (X X)-1 X Y Pro přímku (k = 2) máme Yi = 0 + 1xi i = 1, . . . , n Pro přímku můžeme vektor Y, matici plánů X a vektor zapsat následovně: Y = Y1 Y2 ... Yn X = 1 x1 1 x2 ... ... 1 xn = 0 1 Tedy odtud máme: X X = n xi xi x2 i det X X = n x2 i - ( xi)2 = n (xi - x)2 (X X)-1 = x2 i n x2 i -( xi)2 - xi n x2 i -( xi)2 - xi n x2 i -( xi)2 n n x2 i -( xi)2 X Y = Yi xiYi b = x2 i n x2 i -( xi)2 Yi + - xi n x2 i -( xi)2 xiYi - xi n x2 i -( xi)2 Yi + n n x2 i -( xi)2 xiYi 1 Odhady regresních koeficientů pro přímku jsou tedy: b1 = n xiYi - xi Yi n x2 i - ( xi)2 b0 = x2 i Yi - xi xiYi n x2 i - ( xi)2 = 1 n ( Yi - b1 xi) S využitím vztahů s2 x = 1 n - 1 (xi - x)2 = 1 n - 1 x2 i - nx2 = 1 n - 1 x2 i - 1 n xi 2 sxy = 1 n - 1 (xi - x)(Yi - Y ) = 1 n - 1 xiYi - nxY = 1 n - 1 xiYi - 1 n xi Yi Můžeme tyto vzorce přepsat pomocí výběrových charakteristik: b1 = sxy s2 x b0 = Y - sxy s2 x x Dosazením b0 a b1 za 0 a 1 dostaneme: Y = b0 + b1x = Y + sxy s2 x (x - x) = Y + rxy sy sx (x - x) Pro reziduální rozptyl platí maticový zápis Se = (Y - Y) (Y - Y) = Y Y - b X Y rozepsáním dostaneme Se = (Yi - Yi)2 = (Yi - b0 - b1xi)2 = Y 2 i - b0 Yi - b1 xiYi 2 Normalita Pokud platí Y Nn(X, 2 I) pak b Nk(, 2 (X X)-1 ) Nestranným odhadem pro parametr 2 je veličina s2 = Se n-k . Dále platí Ti = bi - i s2vii t(n - k) kde vii je (X X)-1 ii Pro přímku (k = 2) máme v00 = x2 i n x2 i - ( xi)2 = x2 i n(n - 1)s2 x v11 = n n x2 i - ( xi)2 = 1 x2 i - 1 n ( xi)2 Dosazením za vii (i = 0, 1) dostaneme a) pro 0 T0 = b0 - 0 s x2 i x2 i - 1 n ( xi)2 = b1 - 1 s sx n(n - 1) x2 i t(n-2) Odtud dostáváme interval spolehlivosti pro parametr 0 b0 - t1- 2 (n - 2) s sx x2 i n(n - 1) ; b0 + t1- 2 (n - 2) s sx x2 i n(n - 1) b) pro 1 T1 = b1 - 1 s x2 i - 1 n ( xi)2 = b1 - 1 s sx n - 1 t(n - 2) Odtud dostáváme interval spolehlivosti pro parametr 1 b1 - t1- 2 (n - 2) s sx n - 1 ; b1 + t1- 2 (n - 2) s sx n - 1 3 Pro parametrickou funkci = c platí T = c b - s c (X X)-1 c t(n - k) Často máme dánu hodnotu vysvětlující proměnné x a máme odhadnout střední hodnotu vysvětlované proměnné EY = 0 + 1x = (pro přímku tj. k = 2) a testovat hypotézu H0 : EY = 0 proti H1 : EY = 0. Vyjdeme z předchozího vzorce, kde položíme c = 1 x . Platí c (X X) -1 c = 1 n + (x - x)2 x2 i - nx2 = 1 n + (x - x)2 (n - 1)s2 x Tedy k testování H0 použijeme statistiku T0 = b0 + b1x - 0 s 1 n + (x-x)2 (n-1)s2 x t(n - 2) a příslušný interval spolehlivosti b0 + b1x - t1- 2 (n - 2)s 1 n + (x - x)2 (n - 1)s2 x ; b0 + b1x + t1- 2 (n - 2)s 1 n + (x - x)2 (n - 1)s2 x Pro x = x je šířka intervalu nejmenší. Jak se x vzdaluje od x roste šířka intervalu. Tento interval je třeba interpretovat bodově! Pás spolehlivosti pro celou regresní přímku získáme nahrazením kvantilu t1- 2 (n-2) v předchozím vzorci číslem [2F1- 2 (2, n - 2)] 1 2 . 4 Pro inverzi matice A2x2 platí: A = a b c d det A = ad - bc A-1 = d ad-bc -b ad-bc -c ad-bc a ad-bc 5