8 Neparametrické úlohy o mediánech Příklad 8.1. Jednovýběrový znaménkový test a jednovýběrový Wilcoxonův test Z archivních materiálů máme k dispozici původní kraniometrické údaje o šířce lebky (v mm) žen starověké egyptské populace. Náhodný výběr 15 lebek poskytl tyto výsledky: 133, 134, 132, 141, 135, 135, 136, 137, 135, 137, 137, 136, 139, 118, 130. Současně máme k dispozici průměrnou hodnotu šířky lebky žen novověké egyptské populace xm = 131 mm. Na hladině významnosti a = 0.05 testujte hypotézu, že šířka lebky žen starověké egyptské populace je stejná jako šířka lebky žen novověké egytské populace. Sestrojte krabicový diagram. Test normality dat ## [1] 0.001934312 p-hodnota 0.00193 je menší než hladina významnosti a = 0.05 —> Hq zamítáme. Data nepochází z normálního rozdělení. Protože data nepochází z normálního rozdělení, musíme k otestování hypotézy o shodě šířky lebky žen starověké a novověké egyptské populace použít parametrický / neparametrický jednovýběrový test o............................................... Jednovýběrový znaménkový test 2. Hi : ................................................................................................... ## ## One-sample Sign-Test ## ## data: x ## s = 13, p-value = 0.007385 ## alternative hypothesis: true median is not equal to 131 ## 95 percent confidence interval: ## 133.1782 137.0000 ## sample estimates: ## median of x ## 135 ## Conf.Level L.E.pt U.E.pt ## Lower Achieved CI 0.8815 134.0000 137 ## Interpolated CI 0.9500 133.1782 137 ## Upper Achieved CI 0.9648 133.0000 137 1. Testování kritickým oborem Testovací statistika S+ nabývá hodnoty ............................, počet nenulových rozdílů n = ............, kritický obor má potom tvar .................................... Protože S+............W, Hq : o hodnotě mediánu rovné 131 ............................ na hladině významnosti a =............................. 2. Testování IS Interval spolehlivosti má tvar.................................................................................... Protože............................, Hq o hodnotě mediánu rovné 131 ............................na hladině významnosti a = 3. Testování p-hodnotou Protože p-hodnota............................, Hq o hodnotě mediánu rovné 131............................na hladině významnosti a = 0.05. 1 Jednovýběrový Wilcoxonův test ## ## Wilcoxon signed rank test ## ## data: x ## V = 103.5, p-value = 0.0133 ## alternative hypothesis: true location is not equal to 131 ## 95 percent confidence interval: ## 132.9999 137.0000 ## sample estimates: ## (pseudo)median ## 135 1. H0 : ...................................................................... 2. Til : ...................................................................... 1. Testování kritickým oborem Testovací statistika S+ nabývá hodnoty................ má potom tvar....................................Protože S+ na hladině významnosti a =............................. 2. Testování IS Interval spolehlivosti má tvar............................... Protože............................, Ho o hodnotě mediánu rovné 131 ............................na hladině významnosti a = ., počet nenulových rozdílů n =............, kritický obor W, Hq o hodnotě mediánu rovné 131......................... 3. Testování p-hodnotou Protože p-hodnota............................, Ho o hodnotě mediánu rovné 131............................na hladině významnosti a = 0.05. Krabicový diagram Sirka lebky - zeny .o o CO O co CM o Závěr testování: Na hladině významnosti 0.05 se šířka lebky žen starověké a novověké egyptské populace 2 Příklad 8.2. Párový znaménkový test a párový Wilcoxonův test Při zjišťování kvality jedné složky půdy se používají dvě metody označené A a B. Výsledky jsou uvedeny v následující tabulce: Vzorek 1 2 3 4 5 (i 7 8 9 10 11 12 13 A B 0.280 0.280 0.312 0.312 0.280 0.288 0.300 0.298 0.365 0.361 0.307 0.307 0.320 0.319 0.316 0.315 0.242 0.242 0.321 0.323 0.337 0.339 0.315 0.315 0.312 0.359 Na hladině významnosti a = 0.05 testujte hypotézu, že metody A a B dávají stejné výsledky. K testování použijte jak párový znaménkový test, tak párový Wilcoxonův test. Sestrojte krabicové diagramy pro obě metody. Test normality dat ## [1] 0.0008132422 p-hodnota 0.000813 je menší než hladina významnosti a = 0.05 —> Hq zamítáme. Rozdíly v hodnotách metod a A B nepochází z normálního rozdělení. Protože data nepochází z normálního rozdělení, musíme k otestování hypotézy o shodě výsledků metod A a B použít parametrický / neparametrický párový test o ................................................ Párový znaménkový test 1. //• : ................................................................................................... 2. Tři : ................................................................................................... ## ## One-sample Sign-Test ## ## data: xl - x2 ## s = 4, p-value = 1 ## alternativě hypothesis: true medián is not equal to 0 ## 95 percent confidence interval: ## -0.002 0.001 ## sample estimates: ## medián of x ## 0 ## Conf.Level L.E.pt U.E.pt ## Lower AcMeved Cl 0.9077 -0.002 0.001 ## Interpolated Cl 0.9500 -0.002 0.001 ## Upper Achieved Cl 0.9775 -0.002 0.001 1. Testování kritickým oborem Testovací statistika S+ nabývá hodnoty............................, počet nenulových rozdílů n =.................................. kritický obor má tvar....................................Protože S+............W, Hq o shodě mediánů ojo.5 a ž/o.5.................. na hladině významnosti a =............................. 2. Testování IS Interval spolehlivosti má tvar .................................................................................... Protože ............................, H0 o shodě mediánů Xq%5 a y05 ............................ na hladině významnosti a = 3. Testování p-hodnotou Protože p-hodnota............................, Hq o shodě mediánů «0.5 a t/o.5............................na hladině významnosti a =............................. Párový Wilcoxonův test 1. H0 : ............................ 2. Hx : ............................ 1. Testování kritickým oborem Testovací statistika S+ nabývá hodnoty............................, počet nenulových rozdílů n =..............................., kritický obor má tvar....................................Protože S+............W, H0 o shodě mediánů £0.5 a t/o.5................... na hladině významnosti a =............................. 2. Testování IS Interval spolehlivosti má tvar.................................................................................... Protože ............................, H0 o shodě mediánů x0.5 a ž/0.5 ............................ na hladině významnosti a = Testování p-hodnotou Protože p-hodnota........... ., Hq o shodě mediánů X0.5 a 7/0.5............................na hladině významnosti Krabicový graf Kvalita slozky pudy metoda Závěr testování: Na hladině významnosti 0.05 se výsledky metody A a B významně 4 Příklad 8.3. Dvouvýběrový Wilcoxonův test Z archivních materiálů máme k dispozici původní kraniometrické údaje o šířce lebky (v mm) 15 žen a 7 mužů ze starověké egyptské populace. Údaje jsou uvedeny v následující tabulce vzorek 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 šířka lebky - ženy 133 134 132 141 135 135 136 137 135 137 137 136 139 118 130 šířka lebky - muži 132 132 133 128 149 132 137 Na hladině významnosti a = 0.05 testujte hypotézu, že šířka lebky žen a šířka lebky mužů starověké egyptské populace je stejná. Pro lepší představu sestrojte krabicové diagramy pro obě pohlaví. Test normality dat ## [1] 0.001934312 ## [1] 0.02447804 p-hodnota pro šířku lebky žen (p = 0.00193) je menší než hladina významnosti a = 0.05 —> Hq zamítáme, p-hodnota pro šířku lebky mužů (p = 0.0244) je menší než hladina významnosti a = 0.05 —> Hq zamítáme . Oba datové soubory tedy nepochází z normálního rozdělení. Protože data nepochází z normálního rozdělení, musíme k otestování hypotézy o shodě šířky lebky žen a mužů starověké egyptské populace použít parametrický / neparametrický dvouvýběrový test o................................................ 1. //• : ................................................................................................... 2. Hi : ................................................................................................... ## ## Wilcoxon rank sum test ## ## data: x and y ## W = 66.5, p-value = 0.3201 ## alternativě hypothesis: true location shift is not equal to 0 ## 95 percent confidence interval: ## -3.000024 4.999920 ## sample estimates: ## difference in location ## 2.000046 1. Testování kritickým oborem Testovací statistika u\ nabývá hodnoty........... rozsah náhodného výběru pro muže je =... u\............w, Hq o shodě mediánů ojo.5 a 1/0.5 2. Testování IS Interval spolehlivosti má tvar........................ Protože ............................, Hq o shodě mediánů ojq.s a 1/0.5 ............................ na hladině významnosti a = 3. Testování p-hodnotou Protože p-hodnota............................, Hq o shodě mediánů ojo.5 a 1/0.5............................na hladině významnosti a =.................... ....., rozsah náhodného výběru pro ženy je ri\=................ , kritický obor má tvar....................................Protože ................na hladině významnosti a =.................... 5 Krabicový diagram Sirka lebky .Q CD O OJ zeny pohlaví Závěr testování: Mezi šířkou lebky žen a šířkou lebky mužů starověké egyptské populace významný rozdíl. Tedy šířka lebky žen a šířka lebky mužů starověké egyptské populace jsou 6 Příklad 8.4. Kruskalův-Wallisův test Z produkce tří podniků vyrábějících televizory bylo vylosováno 10, 8 a 12 kusů. Byly získány následující výsledky zjišťování citlivosti těchto televizorů v mikrovoltech: 1.podnik: 120 560 600 490 550 570 340 480 510 160 2.podnik: 400 420 580 470 470 500 520 530 3.podnik: 450 700 630 590 420 590 610 540 740 690 540 670 Ověřte na hladině významnosti a = 0.05 hypotézu o shodě úrovně citlivosti televizorů v jednotlivých podnicích. Sestrojte krabicové diagramy pro všechny tři podniky. 1. //• : ................................................................................................... 2. Hi : ................................................................................................... ## ## Kruskal-Wallis rank sum test ## ## data: citlivost and podnik ## Kruskal-Wallis chi-squared = 8.3047, df = 2, p-value = 0.01573 1. Testování kritickým oborem Testovací statistika Q nabývá hodnoty............................, kritický obor má tvar....................................Protože Q............W, Hq o shodě mediánů «1,0.5, «2,0.51 £3,0.5, £4,0.5 ............................ na hladině významnosti a = 2. Testování p-hodnotou Protože p-hodnota ............................, Ho o shodě mediánů «1,0.5, «2,0.5, £3,0.5, £4,0.5 ............................ na hladině významnosti a =.................... Metoda mnohonásobného porovnávání Jelikož jsme nulovou hypotézu o shodě mediánů ................................., chceme nyní zjistit, které dvojice mediánů se od sebe významně liší. Stanovíme nulové a alternativní hypotézy pro dvojice mediánů • íř0i : ..................................................................oproti Hn : • H02 ■ ..................................................................oproti H12 : • ířo3 : ..................................................................oproti Hí3 : ## podnikl podnik2 ## podnik2 0.8728 NA ## podnik3 0.0672 0.0251 7 Krabicový diagram Citilivost televizoru v ruznych podnicich Závěr testování: Na hladině významnosti a podnik . se liší televizory vyráběné ve . podniku. 8