i Pohlaví (P) Výška (V) Hmotnost (H) Vi - mV Hi - mH (Vi-mV)(Hi-mH) zVi * zHi H.stř.i ei 1 0 172 86 -2.5 11.04545455 -27.61363636 -0.152834952 2 1 169 58 -5.5 -16.95454545 93.25 0.516116715 3 0 183 80 8.5 5.045454545 42.88636364 0.237365889 korelace průměr 4 1 170 69 -4.5 -5.954545455 26.79545455 0.148306509 1 (xi - mX) (yi - mY) mX = (1/N) Suma(1…N) xi 5 0 180 85 5.5 10.04545455 55.25 0.305795694 rXY = -------- SUMA (i = 1 … N) {------------------------} 6 1 173 76 -1.5 1.045454545 -1.568181818 -0.008679516 (N - 1) sX sY rozptyl (variance) 7 0 190 89 15.5 14.04545455 217.7045455 1.204943215 úprava vzorce korelace s2X = [1/(N-1)] Suma(1…N) (xi - mX)2 8 1 174 62 -0.5 -12.95454545 6.477272727 0.035850174 = 1/(N - 1) SUMA(i = 1 … N) [ zXi zYi ] 9 1 160 55 -14.5 -19.95454545 289.3409091 1.60143356 směrodatná odchylka 10 0 182 75 7.5 0.045454545 0.340909091 0.001886851 s = odmocnina(s2) 11 0 198 101 23.5 26.04545455 612.0681818 3.387652752 kovariance 12 1 153 48 -21.5 -26.95454545 579.5227273 3.207521352 cXY = sX rXY sY z toho rXY = cXY/(sX sY) 13 1 174 65 -0.5 -9.954545455 4.977272727 0.027548028 14 1 162 76 -12.5 1.045454545 -13.06818182 -0.072329298 15 0 171 69 -3.5 -5.954545455 20.84090909 0.115349507 Jednoduchá regrese dvou proměnných 16 1 159 48 -15.5 -26.95454545 417.7954545 2.312399114 17 0 192 78 17.5 3.045454545 53.29545455 0.294977747 Cíl: předpovědět hodnoty závislé proměnné (zde Y) pomocí hodnot nezávislé proměnné (zde X) 18 1 170 59 -4.5 -15.95454545 71.79545455 0.397370875 19 1 181 76 6.5 1.045454545 6.795454545 0.037611235 Regresní rovnice: 20 0 179 95 4.5 20.04545455 90.20454545 0.499260843 21 0 165 101 -9.5 26.04545455 -247.4318182 -1.369476645 Y se stříškou: Hodnota proměnné Y předpovězená pomocí hodnoty X a regresních koeficientů a a b 22 0 182 98 7.5 23.04545455 172.8409091 0.956633589 "a: Tzv. regresní konstanta, anglicky intercept, v podstatě hodnota proměnné Y pro X = 0" "b: Tzv. regresní koeficient, který vyjadřuje, o kolik vzroste hodnota závislé proměnné (zde Y), pokud hodnota nezávislé proměnné (zde X) vzroste o 1" m 0.5 174.5 74.95454545 vzorcem 0.651652535 sd - vzorec 11.18566259 16.15247961 funkcí 0.651652535 "V případě, že máme v regresi pouze dvě proměnné, lze koeficienty najít analyticky na základě následujících vzorců:" sd - funkcí 0.511766316 11.18566259 16.15247961 b tzn. korelace obou proměnných krát směrodatná odchylka závislé proměnné lomeno SD nezávislé proměnné a tzn. průměr závislé proměnné mínus hodnota b (vypočtená pomocí předchozího vzorce) krát průměr nzávislé proměnné R2: tzv. mnohonásobná korelace se rovná korelaci hodnot Y a hodnot Y předpovězených pomocí regresní rovnice (Y se stříškou)