Cvičení 12 – příklady u tabule Příklad 1.: V dílně pracuje 15 dělníků, u nichž byl zjištěn počet směn odpracovaných za měsíc (proměnná X) a počet zhotovených výrobků (proměnná Y). X: 20 21 18 17 20 18 19 21 20 14 16 19 21 15 15 Y: 92 93 83 80 91 85 82 98 90 60 73 86 96 64 81 Předpokládáme, že data pocházejí z dvourozměrného normálního rozložení (orientační ověření viz příklad v přednášce 10) a že přímka je vhodným modelem závislosti veličiny Y na veličině X. Máte k dispozici výsledky regresní analýzy, které poskytl systém STATISTICA. Výsledky regrese se závislou proměnnou : Y (smeny a vyrobky.sta) R= ,92718009 R2= ,85966293 Upravené R2= ,84886777 F(1,13)=79,634 p<,00000 Směrod. chyba odhadu : 4,2834 N=15 b* Sm.chyba z b* b Sm.chyba z b t(13) p-hodn. Abs.člen X 5,010135 8,875949 0,564462 0,582049 0,927180 0,103900 4,302365 0,482123 8,923795 0,000001 Analýza rozptylu (smeny a vyrobky.sta) Efekt Součet čtverců sv Průměr čtverců F p-hodn. Regres. Rezid. Celk. 1461,083 1 1461,083 79,63411 0,000001 238,517 13 18,347 1699,600 a) Sestavte regresní matici. b) Napište rovnici regresní přímky. c) Jaký je regresní odhad počtu zhotovených výrobků pro dělníka, který odpracoval za měsíc 18 směn? d) Najděte odhad rozptylu, vypočtěte index determinace a interpretujte ho. e) Najděte 95% intervaly spolehlivosti pro regresní parametry. f) Na hladině významnosti 0,05 proveďte celkový F-test. g) Na hladině významnosti 0,05 proveďte dílčí t-testy. Příklad 2.: U 26 dělníků byla zjištěna délka praxe (veličina X, v letech) a počet zhotovených výrobků za směnu (veličina Y): 2 4 15 3 28 10 7 20 9 15 29 19 12 31 18 13 5 25 8 27 21 32 12 24 30 26 118 121 134 119 126 130 120 137 123 131 117 135 127 123 131 128 116 134 125 135 135 115 126 132 131 128 Na základě dvourozměrného tečkového diagramu lze soudit, že vhodným modelem závislosti počtu výrobků na počtu let praxe bude regresní parabola. 0 5 10 15 20 25 30 35 X 114 116 118 120 122 124 126 128 130 132 134 136 138 Y Máte k dispozici výsledky regresní analýzy, které poskytl systém STATISTICA. Výsledky regrese se závislou proměnnou : Y (praxe_vyrobky.sta) R= ,81747863 R2= ,66827130 Upravené R2= ,63942533 F(2,23)=23,167 p<,00000 Směrod. chyba odhadu : 3,9940 N=26 b* Sm.chyba z b* b Sm.chyba z b t(23) p-hodn. Abs.člen X Xkv 109,1303 2,758631 39,55958 0,000000 3,64589 0,542332 2,5390 0,377677 6,72261 0,000001 -3,42712 0,542332 -0,0677 0,010717 -6,31924 0,000002 Analýza rozptylu (praxe_vyrobky.sta) Efekt Součet čtverců sv Průměr čtverců F p-hodn. Regres. Rezid. Celk. 739,134 2 369,5669 23,16688 0,000003 366,905 23 15,9524 1106,038 Durbin-Watsonovo d (praxe_vyrobky.sta) a sériové korelace reziduí Durbin- Watson.d Sériové korelace Odhad 1,989379 -0,074106 Předpovězené hodnoty vs. rezidua Závislá proměnná : Y 112 114 116 118 120 122 124 126 128 130 132 134 Předpov. hodnoty -10 -8 -6 -4 -2 0 2 4 6 8 Rezidua Normální p-graf reziduí -10 -8 -6 -4 -2 0 2 4 6 8 Rezidua -2,5 -2,0 -1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 2,0 2,5 Očekáv.normál.hodn. a) Napište regresní rovnici vyjadřující závislost počtu zhotovených výrobků za směnu na délce praxe. b) Odhadněte, kolik výrobků za směnu vyrobí dělník, jehož doba praxe je 10 let. c) Z kolika procent je variabilita počtu zhotovených výrobků za směnu vysvětlena uvedeným regresním modelem paraboly? d) Je na hladině významnosti 0,05 dostačující model konstanty? Rozhodnutí zdůvodněte. e) Najděte odhad rozptylu. f) Na hladině významnosti 0,05 proveďte dílčí t-testy. g) Lze považovat rezidua za nezávislá, homoskedastická a normálně rozložená? Příklad 3.: U 11 náhodně vybraných aut jisté značky bylo zjišťováno jejich stáří (znak X – v letech) a cena (znak Y – v tisících Kč). Výsledky: (5, 85), (4, 103), (6, 70), (5, 82), (5, 89), (5, 98), (6, 66), (6, 95), (2, 169), (7, 70), (7, 48). Pro úsporu času máte uvedeny číselné charakteristiky (zaokrouhlené na dvě desetinná místa): m1 = 5,28, m2 = 88,63, s1 2 = 2,02, s2 2 = 970,85, s12 = -40,89. a) Nakreslete dvourozměrný tečkový diagram a s jeho pomocí posuďte, zda závislost Y na X lze uspokojivě popsat regresní přímkou. b) Vypočtěte koeficient korelace a interpretujte ho. c) Najděte rovnici regresní přímky veličiny Y na veličinu X. Interpretujte koeficienty regresní přímky a index determinace. d) Jaký je regresní odhad ceny auta, které je staré 3 roky? Příklad 4.: Koeficienty regresní přímky veličiny Y na veličinu X jsou b0 = 67,5, b1 = 0,3. Koeficient korelace veličin X a Y je 0,75. Aritmetický průměr hodnot veličiny X je 25, veličiny Y je 75. Najděte koeficienty regresní přímky veličiny X na veličinu Y.