i Pohl Vyska Hmotnost Vi - mV Hi - mH (Vi-mV)(Hi-mH) H.stř.i ei 1 0 172 86 -2.5 11.04545455 -27.61363636 81.22439642 4.775603576 2 1 169 58 -5.5 -16.95454545 93.25 64.92978486 -6.929784858 3 0 183 80 8.5 5.045454545 42.88636364 85.9713055 -5.971305497 korelace průměr 4 1 170 69 -4.5 -5.954545455 26.79545455 65.36132205 3.638677953 1 (xi - mX) (yi - mY) mX = (1/N) Suma(1…N) xi 5 0 180 85 5.5 10.04545455 55.25 84.67669393 0.323306068 rXY = -------- SUMA (i = 1 … N) {------------------------} 6 1 173 76 -1.5 1.045454545 -1.568181818 66.65593361 9.344066388 (N - 1) sX sY rozptyl (variance) 7 0 190 89 15.5 14.04545455 217.7045455 88.99206582 0.007934183 úprava vzorce korelace s2X = [1/(N-1)] Suma(1…N) (xi - mX)2 8 1 174 62 -0.5 -12.95454545 6.477272727 67.0874708 -5.087470801 = 1/(N - 1) SUMA(i = 1 … N) [ zXi zYi ] 9 1 160 55 -14.5 -19.95454545 289.3409091 61.04595016 -6.045950162 směrodatná odchylka 10 0 182 75 7.5 0.045454545 0.340909091 85.53976831 -10.53976831 s = odmocnina(s2) 11 0 198 101 23.5 26.04545455 612.0681818 92.44436332 8.555636675 kovariance 12 1 153 48 -21.5 -26.95454545 579.5227273 58.02518984 -10.02518984 cXY = sX rXY sY z toho rXY = cXY/(sX sY) 13 1 174 65 -0.5 -9.954545455 4.977272727 67.0874708 -2.087470801 14 1 162 76 -12.5 1.045454545 -13.06818182 61.90902454 14.09097546 15 0 171 69 -3.5 -5.954545455 20.84090909 80.79285924 -11.79285924 Vícenásobná regrese (v tomto případě tří proměnných) 16 1 159 48 -15.5 -26.95454545 417.7954545 60.61441297 -12.61441297 17 0 192 78 17.5 3.045454545 53.29545455 89.85514019 -11.85514019 Cíl: předpovědět hodnoty závislé proměnné (zde Y) pomocí hodnot nezávislých proměnných (zde X1 a X2) 18 1 170 59 -4.5 -15.95454545 71.79545455 65.36132205 -6.361322047 19 1 181 76 6.5 1.045454545 6.795454545 70.10823112 5.89176888 Regresní rovnice: 20 0 179 95 4.5 20.04545455 90.20454545 84.24515674 10.75484326 21 0 165 101 -9.5 26.04545455 -247.4318182 78.2036361 22.7963639 nebo pro každou individuální hodnotu 22 0 182 98 7.5 23.04545455 172.8409091 85.53976831 12.46023169 "Y se stříškou: Hodnota proměnné Y předpovězená pomocí hodnot X1 a X2 a regresních koeficientů a, b1 a b2" m 0.5 174.5 74.95454545 vzorcem 0.651652535 "a: Tzv. regresní konstanta, anglicky intercept, v podstatě hodnota proměnné Y pro X = 0" sd - vzorec 11.18566259 16.15247961 funkcí 0.651652535 "b1 a b2: Tzv. regresní koeficienty, které vyjadřují, o kolik vzroste hodnota závislé proměnné (zde Y), pokud se hodnota nezávislých proměnných (zde X1 a X2) změní o 1" sd - funkcí 0.511766316 11.18566259 16.15247961 a 7 R2: tzv. mnohonásobná korelace se rovná korelaci hodnot Y a hodnot Y předpovězených pomocí regresní rovnice (Y se stříškou) rPV -0.619731492 b1 0.431537189 rPH -0.763283167 b2 -15 Postup rVH 0.651652535 R 0.795440263 "V případě, že máme v regresi více než dvě proměnné, NELZE koeficienty najít analyticky na základě vzorců (tzn. neexistují žádné vzorce pro výpočet a, b1 a b2)" R2 0.632725212 "Nastupuje řešení pomocí metod tzv. numerické matematiky. Abychom si prakticky vyzkoušeli, jak tyto metody mohou postupovat, vyzkoušíme si to formou hry." Zkusíme odhadnout regresní model H = a + b1 V + b2 P (tzn. odhadneme hmotnost na základě výšky a pohlaví). SS 2061.796889 "1. Předstíráme, že známe hodnoty a, b1 a b2 - vlevo v příslušných políčkách jsem napsal nějaké odhady hodnot, které jsem určil zcela ""od oka""" rHe 0.721439076 "2. Vypočítáme H se stříškou pro hodnoty pohlaví a výšky každého respondenta a tyto ""od oka"" stanovené hodnoty a, b1 a b2" rVe 0.09502071 3. Musíme si stanovit nějaká kritéria kvality toho modelu "1. bude to jednak již známý koeficient R (potažmo R2), tzn. korelace H a H se stříškou" "čím vyšší, tím lepší model (odhad hmotnosti na základě výšky a pohlaví" "2. další bude tzv. suma čtverců reziduí, neboli chyb odhadu, neboli hodnot ei (značí se často jako SS - z angl. Sum of Squares)" "čím nižší, tím lepší model" "4. Měníme, přepisujeme hodnoty a, b1 a b2 tak, abychom dosáhli co nejvyšší hodnoty R (nebo R2) a nejnižší hodnoty SS" ##### Sheet/List 2 ##### i Pohlaví (P) Výška (V) Hmotnost (H) H.stř.i.zV ei.HzV P.stř.i.zV ei.PzV H.stř.i.zP ei.HzP V.stř.i.zP ei.VzP V.stř.i.zH ei.VzH P.stř.i.zH ei.PzH 1 0 172 86 72.60202405 13.39797595 0.570884872 -0.570884872 87 -1 181.2727273 -9.272727273 179.4845068 -7.484506832 0.232882849 -0.232882849 2 1 169 58 69.77899836 -11.77899836 0.655946717 0.344053283 62.90909091 -4.909090909 167.7272727 1.272727273 166.8488846 2.151115425 0.91001933 0.08998067 3 0 183 80 82.95311824 -2.953118242 0.258991437 -0.258991437 87 -7 181.2727273 1.727272727 176.7768735 6.223126509 0.377983524 -0.377983524 4 1 170 69 70.72000692 -1.72000692 0.627592769 0.372407231 62.90909091 6.090909091 167.7272727 2.272727273 171.812879 -1.812879033 0.644001427 0.355998573 5 0 180 85 80.13009255 4.869907447 0.344053283 -0.344053283 87 -2 181.2727273 -1.272727273 179.0332346 0.966765392 0.257066295 -0.257066295 6 1 173 76 73.54303261 2.45696739 0.542530923 0.457469077 62.90909091 13.09090909 167.7272727 5.272727273 174.9717846 -1.971784597 0.474717307 0.525282693 7 0 190 89 89.54017819 -0.540178185 0.060513796 -0.060513796 87 2 181.2727273 8.727272727 180.8383235 9.161676498 0.160332512 -0.160332512 8 1 174 62 74.48404117 -12.48404117 0.514176974 0.485823026 62.90909091 -0.909090909 167.7272727 6.272727273 168.6539735 5.346026531 0.813285547 0.186714453 9 1 160 55 61.30992129 -6.309921287 0.911132255 0.088867745 62.90909091 -7.909090909 167.7272727 -7.727272727 165.4950679 -5.495067904 0.982569667 0.017430333 10 0 182 75 82.01210968 -7.012109679 0.287345385 -0.287345385 87 -12 181.2727273 0.727272727 174.5205124 7.479487626 0.498900752 -0.498900752 11 0 198 101 97.06824669 3.931753309 -0.166317793 0.166317793 87 14 181.2727273 16.72727273 186.2535902 11.74640982 -0.129868837 0.129868837 12 1 153 48 54.72286134 -6.722861344 1.109609895 -0.109609895 62.90909091 -14.90909091 167.7272727 -14.72727273 162.3361623 -9.33616234 1.151853788 -0.151853788 13 1 174 65 74.48404117 -9.484041173 0.514176974 0.485823026 62.90909091 2.090909091 167.7272727 6.272727273 170.0077901 3.992209861 0.74073521 0.25926479 14 1 162 76 63.19193841 12.80806159 0.854424358 0.145575642 62.90909091 13.09090909 167.7272727 -5.727272727 174.9717846 -12.9717846 0.474717307 0.525282693 15 0 171 69 71.66101548 -2.661015483 0.59923882 -0.59923882 87 -18 181.2727273 -10.27272727 171.812879 -0.812879033 0.644001427 -0.644001427 16 1 159 48 60.36891272 -12.36891272 0.939486204 0.060513796 62.90909091 -14.90909091 167.7272727 -8.727272727 162.3361623 -3.33616234 1.151853788 -0.151853788 17 0 192 78 91.42219531 -13.42219531 0.003805899 -0.003805899 87 -9 181.2727273 10.72727273 175.874329 16.12567096 0.426350415 -0.426350415 18 1 170 59 70.72000692 -11.72000692 0.627592769 0.372407231 62.90909091 -3.909090909 167.7272727 2.272727273 167.3001568 2.699843202 0.885835884 0.114164116 19 1 181 76 81.07110112 -5.071101116 0.315699334 0.684300666 62.90909091 13.09090909 167.7272727 13.27272727 174.9717846 6.028215403 0.474717307 0.525282693 20 0 179 95 79.18908399 15.81091601 0.372407231 -0.372407231 87 8 181.2727273 -2.272727273 183.5459568 -4.545956843 0.015231838 -0.015231838 21 0 165 101 66.0149641 34.9850359 0.769362512 -0.769362512 87 14 181.2727273 -16.27272727 186.2535902 -21.25359018 -0.129868837 0.129868837 22 0 182 98 82.01210968 15.98789032 0.287345385 -0.287345385 87 11 181.2727273 0.727272727 184.8997735 -2.899773514 -0.0573185 0.0573185 m 0.5 174.5 74.95454545 H predikovaná z V P predikované z V H predikovaná z P V predikovaná z P V predikovaná z H P predikované z H sd 0.511766316 11.18566259 16.15247961 r 0.651652535 r -0.619731492 r -0.763283167 r -0.619731492 r 0.651652535 r -0.763283167 rPV -0.619731492 a -89.25144884 a 5.447764034 a 87 a 181.2727273 a 140.6750956 a 2.312659183 rPH -0.763283167 b 0.941008563 b -0.028353949 b -24.09090909 b -13.54545455 b 0.451272223 b -0.024183446 rVH 0.651652535 Parciální korelace PH.V Parciální korelace VH.P Parciální korelace PV.H vzorcem -0.603790493 vzorcem 0.352283625 vzorcem -0.249639493 korelace e -0.603790493 korelace e 0.352283625 korelace e -0.249639493