8 Ověřování normality a parametrické úlohy o jednom náhodném výběru z normálního rozdělení a dvourozměrného rozdělení 8.1 Grafické ověřování normality Příklad 8.1. Při nanášení tenkých kovových vrstev stříbra na polymerní materiál se vyžaduje, aby tloušťka vrstvy byla 0.020 /líhl. Pomocí atomové absorpční spektroskopie se zjistily hodnoty, jež jsou uvedeny v tabulce a uloženy v souboru vrstva_stribra.txt. Posuďte Q-Q grafem, zda se výsledky měření řídí normálním rozdělením. tloušťka 0.0212 0.0186 0.0192 0.0207 0.0200 0.0200 0.0190 0.0188 0.0208 0.0194 0.0188 0.0193 0.0204 0.0185 0.0187 0.0195 0.0191 0.0195 0.0199 0.0205 0.0189 0.0188 0.0199 0.0202 0.0208 Q-Q graf -2-10 1 teoreticky kvantil Dle vzhledu Q-Q grafu lze soudit, že data vykazují jen lehké odchylky od normality. 8.2 Testy normality Příklad 8.2. U 48 studentek VŠE v Praze byla zjišťována výška a obor studia (1 - národní hospodářství, 2 — informatika). Hodnoty jsou uloženy v souboru vyska.txt. Pomocí Lilieforsovy modifikace K-S testu, pomocí S-W testu a pomocí A-D testu testujte na hladině významnosti a = 0.05 hypotézu, že data pocházejí z normálního rozdělení. Pomocí Q-Q grafu posuďte vizuálně předpoklad normality. Shrnutí výsledků: ## test.statistika p.value rozhodnuti ## Lillie.test 0.155621 0.005258 zamitame ## S-W.test 0.965996 0.176031 nezamitame ## A-D.test 0.660990 0.079330 nezamitame 1 Q-Q graf -1 O 1 teoreticky kvantil Tečky se řadí podél ideální přímky, normalita je jen lehce porušena. Příklad k samostatnému řešení Příklad 8.3. Testy normality a grafické ověření normality proveďte a) pro výšky studentek oboru národní hospodářství; b) pro výšku studentek oboru informatiky. ad a) ## test.statistika p.value rozhodnuti ## Lillie.test 0.167473 0.042926 zamitame ## S-W.test 0.970969 0.606793 nezamitame ## A-D.test 0.419238 0.305268 nezamitame ad b) ## test.statistika p.value rozhodnuti ## Lillie.test 0.172301 0.123974 nezamitame ## S-W.test 0.922747 0.111924 nezamitame ## A-D.test 0.566019 0.123709 nezamitame 2 8.3 Parametrické úlohy o jednom náhodném výběru z normálního rozdělení Upozornění: Pokud to povaha úlohy vyžaduje, proveďte test normality dat. Příklad 8.4 (Vlastnosti výběrového průměru z normálního rozdělení). Předpokládejme, že velký ročník na vysoké škole má výsledky ze statistiky normálně rozloženy kolem střední hodnoty 72 bodů se směrodatnou odchylkou 9 bodů. Najděte pravděpodobnost, že průměr výsledků náhodného výběru 10 studentů bude větší než 80 bodů. ## [1] 0.002470053 Příklad 8.5 (Intervaly spolehlivosti pro parametry /i, a'1 normálního rozdělení). Z populace stejně starých selat téhož plemene bylo vylosováno šest selat a po dobu půl roku jim byla podávána táž výkrmná dieta. Byly zaznamenávány průměrné denní přírůstky hmotnosti v dg. Z dřívějších pokusů je známo, že v populaci mívají takové přírůstky normální rozdělení, avšak střední hodnota i rozptyl se měnívají. Přírůstky v dg: 62, 54, 55, 60, 53, 58. a) Najděte 95 % empirický levostranný interval spolehlivosti pro neznámou střední hodnotu jj, při neznámé směrodatné odchylce a. b) Najděte 95% empirický interval spolehlivosti pro směrodatnou odchylku a. Výpočet intervalů spolehlivosti: ad a) ## [1] "dd = 54.0568" IS= (54.05683; oo) /i > 54.0568 dg s pravděpodobností 0.95. ad b) ## [1] "dh = 2.2332" ## [1] "hh = 8.7747" IS= (2.2332; 8.7747) 2.23 dg < a < 8.77 dg s pravděpodobností 0.95. 3 Příklad 8.6 (Testování hypotézy o střední hodnotě /i). Systematická chyba měřícího přístroje se eliminuje nastavením přístroje a měřením etalonu, jehož správná hodnota je jj, = 10.00. Nezávislými měřeními za stejných podmínek byly získány hodnoty: 10.24, 10.12, 9.91, 10.19, 9.78, 10.14,9.86, 10.17, 10.05, které považujeme za realizace náhodného výběru rozsahu 9 z rozdělení N(fi,a2). Je možné při riziku 0.05 vysvětlit odchylky od hodnoty 10.00 působením náhodných vlivů? Shapirův test normality: ## [1] 0.2873252 Testování nulové hypotézy: a) Testování pomocí kritického oboru ## [1] "tO = 0.9426" ## [1] "wl = 2.306" ## [1] "w2 = -2.306" Hq nezamítáme na hladině významnosti a = 0.05. b) Testování pomocí intervalu spolehlivosti ## [1] "dh = 9.9261" ## [1] "hh = 10.1761" Hq nezamítáme na hladině významnosti a = 0.05. c) Testování pomocí p-hodnoty ## [1] "p-hodnota = 0.1867" Hq nezamítáme na hladině významnosti a = 0.05. Poznámka: K otestování nulové hypotézy o střední hodnotě jj, můžeme použít funkci t.test(x) s argumentem mu=10 (hodnota c z nulové hypotézy) a argumentem alternative='two.sideď (obousranná alternativa). Vyzkoušejte. Příklad 8.7 (Testování hypotézy o směrodatné odchylce a). U 25 náhodně vybraných dvoulitrových lahví s nealkoholickým nápojem byl zjištěn přesný objem nápoje. Výběrový průměr činil m = 1.991 a výběrová směrodatná odchylka s = 0.11. Předpokládejme, že objem nápoje v láhvi je náhodná veličina s normálním rozdělením. Na hladině významnosti a = 0.05 ověřte tvrzení výrobce, že směrodatná odchylka je 0.081. a) Testování pomocí kritického oboru ## [1] "tO = 37.5" ## [1] "wl = 12.4012" ## [1] "w2 = 39.3641" Nejsme oprávněni na hladině významnosti a = 0.05 zamítnout tvrzení výrobce. 4 b) Testování pomocí intervalu spolehlivosti ## [1] "dli = 0.0781" ## [1] "hh = 0.1391" Nejsme oprávněni na hladině významnosti a = 0.05 zamítnout tvrzení výrobce. c) Testování pomocí p-hodnoty ## [1] "p-hodnota = 0.078" Nejsme oprávněni na hladině významnosti a = 0.05 zamítnout tvrzení výrobce. Příklad 8.8 (Interval spolehlivosti pro rozdíl parametrů fii — \ii dvourozměrného rozdělení). Bylo vylosováno 6 vrhů selat a z nich vždy dva sourozenci. Jeden z nich vždy dostal náhodně dietu č. 1 a druhý dietu č. 2. Přírůstky v dg jsou následující: (62,52), (54,56), (55,49), (60,50), (53,51), (58,50). Za předpokladu, že uvedené dvojice tvoří náhodný výběr z dvourozměrného rozdělení s vektorem středních hodnot (pi,^) a jejich rozdíly se řídí normálním rozdělením, sestrojte 95% interval spolehlivosti pro rozdíl středních hodnot. Shapirův test normality: ## [1] 0.3241142 Výpočet intervalů spolehlivosti: ## [1] "dh = 0.6265" ## [1] "hh = 10.7069" 95 % interval spolehlivosti pro rozdíl středních hodnot /ii — /j.2 má tvar: (0.6265; 10.7069). 0.63 dg < jj, < 10.71 dg s pravděpodobností 0.95. Poznámka: K nalezení hranic 95 % empirického intervalu spolehlivosti pro rozdíl středních hodnot /ii — /j.2 dvourozměrného rozdělení můžeme použít funkci t.test(x.y) s argumentem paired=T (párový test) a argumentem alter-native='two.sideď (oboustranná alternativa). Vyzkoušejte ## [1] 0.6264613 10.7068720 ## attr(,"conf.level") ## [1] 0.95 5 Příklad 8.9 (Testování hypotézy o rozdílu parametrů fii — [12 dvourozměrného rozdělení). Bylo vybráno šest nových vozů téže značky a po určité době bylo zjištěno, o kolik mm se sjely jejich levé a pravé přední pneumatiky. Výsledky: (1.8, 1.5), (1.0,1.1), (2.2,2.0), (0.9,1.1), (1.5,1.4), (1.6,1.4). Za předpokladu, že uvedené dvojice tvoří náhodný výběr z dvourozměrného rozdělení s vektorem středních hodnot (fii, fi2) a jejich rozdíly se řídí normálním rozdělením, testujte na hladině významnosti a = 0.05 hypotézu, že obě pneumatiky se sjíždí stejně rychle. Shapirův test normality: ## [1] 0.4522054 Testování nulové hypotézy: a) Testování pomocí kritického oboru ## [1] "tO = 1.0518" ## [1] "wl = 2.5706" ## [1] "w2 = -2.5706" Hq nezamítáme na hladině významnosti a = 0.05. b) Testování pomocí intervalu spolehlivosti ## [1] "dh = -0.1203" ## [1] "hh = 0.287" Hq nezamítáme na hladině významnosti a = 0.05. c) Testování pomocí p-hodnoty ## [1] "p-hodnota = 0.3411" Ho nezamítáme na hladině významnosti a = 0.05. Poznámka: K otestování nulové hypotézy o rozdílu parametrů fj,i — fi2 dvourozměrného rozdělení můžeme použít funkci t.test(x.y) s argumentem paired=T (párový test) a argumentem alternative='two.sideď (oboustranná alternativa). Vyzkoušejte. 6