9 Neparametrické úlohy o mediánech Příklad 9.1. Jednovýběrový znaménkový test a jednovýběrový Wilcoxonův test Z archivních materiálů máme k dispozici původní kraniometrické údaje o šířce mozkovny (v mm) žen starověké egyptské populace. Údaje jsou uvedeny v následující tabulce vzorek 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 šířka mozkovny - ženy 133 134 132 137 135 135 136 137 135 137 137 136 139 126 130 Současně máme k dispozici průměrnou hodnotu šířky mozkovny žen novověké egyptské populace x f = 131 mm. Na hladině významnosti a = 0.05 testujte hypotézu, že šířka mozkovny žen starověké egyptské populace je stejná jako šířka mozkovny žen novověké egytské populace. Řešení příkladu 9.1 Nejprve musíme ověřit předpoklad normality naměřených hodnot. Test normality • Hq : Data...................................... z normálního rozdělení. • Hi : Data...................................... z normálního rozdělení. Hladina významnosti a =................ Protože náhodný výběr naměřených hodnot má rozsah .........., což je méně než 30, použijeme na testování hypotézy o normalitě dat ...............................................................test. [1] 0.04627647 P-hodnota vyšla ............................................ Protože p-hodnota .................. a, Hq ............................................. na hladině významnosti a = 0.05. Interpretace výsledku testu normality: Data pochází / nepochází z normálního rozdělení. Protože data pochází / nepochází z normálního rozdělení, použijeme k otestování hypotézy o shodě největší šířky mozkovny žen starověké a novověké egyptské populace parametrický / neparametrický jednovýběrový test o................................................ • //• : ....................................... • Hi : ...................................... (.................................................. alternativa). • Hladina významnosti a = ................ Jednovýběrový znaménkový test a) Testování pomocí kritického oboru [1] 13 [1] 15 Testovací statistika Sg nabývá hodnoty............................, počet nenulových rozdílů n =....................., kritický obor má potom tvar.......................................................................Protože Sg............W, Hq ............................ na hladině významnosti a =............................. b) Testování pomocí intervalu spolehlivosti Proti oboustranné alternativě postavíme oboustranný IS. [1] 133.1782 [1] 137 1 Interval spolehlivosti má tvar...................................................................Protože ..................................... na hladině významnosti a =............................. c) Testování pomocí p-hodnoty [1] 0.007385 P-hodnota vyšla............................................Protože p-hodnota..................a, Hq na hladině významnosti a =............................ Jednovýběrový Wilcoxonův test a) Testování pomocí kritického oboru [1] 109.5 [i] 10.5 [1] 15 Statistika Si =......................., statistika 5*2 =.........................Výsledná testovací statistika Sw = min(5i, S2) ..............................Počet nenulových rozdílů n =............, kritický obor má potom tvar.................................. Protože Sw............W, Hq ..................................na hladině významnosti a =............................. b) Testování pomocí intervalu spolehlivosti Proti oboustranné alternativě postavíme oboustranný IS. [1] 132.9999 10 [1] 136.4999 11 Interval spolehlivosti má tvar...................................................................Protože ..................................... na hladině významnosti a =............................. c) Testování pomocí p-hodnoty [1] 0.004768905 12 P-hodnota vyšla............................................Protože p-hodnota..................a, Hq na hladině významnosti a =............................ Krabicový diagram E 138 136 1 134 H N O E 132 -co ■s 130 H 128 126 zeny Interpretace výsledků: Mezi největší šířkou mozkovny u žen starověké egyptské populace a u žen novověké egyptské populace existuje / neexistuje statisticky významný rozdíl. 2 Příklad 9.2. Párový znaménkový test a párový Wilcoxonův test Načtěte datový soubor 03-paired-means-clavicle2.txt a odstraňte z načtených dat NA hodnoty. Na hladině významnosti a = 0.05 testujte, zda je u žen délka klíční kosti na levé straně statisticky významně větší než na straně pravé. Řešení příkladu 9.2 U párového testu musíme nejprve ověřit normalitu rozdílů mezi naměřenými hodnotami na levé a pravé straně. Test normality rozdílů na levé a pravé straně • Hq : Rozdíly mezi levou a pravou stranou pochází z normálního rozdělení. • H\ : Rozdíly mezi levou a pravou stranou nepochází z normálního rozdělení. Hladina významnosti a =....................Protože náhodný výběr rozdílů má rozsah......., což je více než 30, použijeme na testování hypotézy o normalitě dat ....................................... test. [1] 0.04809869 13 P-hodnota vyšla ............................................ Protože p-hodnota .................. a, Hq ............................................. na hladině významnosti a = 0.05. Interpretace výsledku testu normality: Rozdíly mezi levou a pravou stranou pochází / nepochází z normálního rozdělení. Protože rozdíly pochází / nepochází z normálního rozdělení, musíme k otestování hypotézy ze zadání použít parametrický / neparametrický párový test o................................................ • //• : ...................................... -> ...................................... -> ....................................... • //. : ...................................... -> ...................................... -> ....................................... (.................................................. alternativa). • Hladina významnosti a = ................ Párový znaménkový test a) Testování pomocí kritického oboru [1] 24 14 15 [1] 43 Testovací statistika nabývá hodnoty............................, počet nenulových rozdílů n =.................................... Protože tabulky pro nalezení kritických hodnot znaménkového testu pro jednostrannou alternativu nemáme k dispozici, nemůžeme testování pomocí kritického oboru provést. b) Testování pomocí intervalu spolehlivosti Proti .................................... alternativě postavíme....................................IS. [1] -0.3503022 16 Interval spolehlivosti má tvar.....................................................................................Protože............................, Hq ............................ na hladině významnosti a =.............................. c) Testování pomocí p-hodnoty 17 [1] 0.2712 P-hodnota vyšla............................................Protože p-hodnota..................a, Hq na hladině významnosti a =............................ 3 Párový Wilcoxonův test a) Testování pomocí kritického oboru [i] 628 18 19 20 [1] 647 [1] 43 Statistika Si =......................., statistika 5*2 =.........................Výsledná testovací statistika Sw = min(5i, S2) = .............................. Počet nenulových rozdílů n = ............. Protože tabulky pro nalezení kritických hodnot znaménkového testu pro jednostrannou alternativu nemáme k dispozici, nemůžeme testování pomocí kritického oboru provést. b) Testování pomocí intervalu spolehlivosti Proti .................................... alternativě postavíme IS. [1] 2.860125e-07 21 Interval spolehlivosti má tvar.....................................................................................Protože Hq ............................ na hladině významnosti a =............................. c) Testování pomocí p-hodnoty [1] 0.03002835 22 P-hodnota vyšla............................................Protože p-hodnota . na hladině významnosti a =............................ a, Hq Krabicový graf 160 150 ■ 130 ■ leva pravá strana 0 -2 --4 --6 - 0.15 o 0.10 0.05 0.00 rozdíl délek klicnich kosti (v mm) Rozbor výsledků: Znaménkový test nezamítá hypotézu Hq. Naopak Wilcoxonův test zamítá hypotézu Hq. Při použití Wilcoxonova testu totiž předpokládáme jednak spojitost dat a jednak symetrii dat okolo mediánu (narozdíl od znaménkového testu, který požaduje pouze spojitost dat). Z pohledu na histogram vidíme, že data okolo mediánu příliš symetrická nejsou. Proto se přikloníme k závěru znaménkového testu. Interpretace výsledků: Délka levé klíční kosti u žen je / není statisticky významně vyšší než délka pravé klíční kosti. 4 Příklad 9.3. Dvouvýběrový Wilcoxonův test Z archivních materiálů máme k dispozici původní kraniometrické údaje o šířce mozkovny (v mm) 7 mužů a 15 žen ze starověké egyptské populace. Údaje jsou uvedeny v následující tabulce vzorek 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 šířka mozkovny - ženy 133 134 132 137 135 135 136 137 135 137 137 136 139 126 130 šířka mozkovny - muži 132 132 133 130 143 132 137 Na hladině významnosti a = 0.05 testujte hypotézu, že šířka mozkovny mužů a šířka mozkovny žen starověké egyptské populace je stejná. Pro lepší představu sestrojte krabicové diagramy pro obě pohlaví. Řešení příkladu 9.3 V rámci tohoto příkladu pracujeme se ........................... náhodnými výběry. První výběr obsahuje údaje o šířce mozkovny starověké egyptské .............................. populace, druhý výběr obsahuje údaje o šířce mozkovny u starověké egyptské ..............................populace. Před testovním nulové hypotézy ze zadání musíme nejprve ověřit normalitu naměřených hodnot, a sice zvlášť v každém výběru. (V případě splnění předpokladu normality bychom dále museli ověřit shodu rozptylů obou náhodných výběrů). Test normality naměřených hodnot pro muže Protože máme dva výběry, musíme provést test normality dat pro každý výběr zvlášť. • Hq : Naměřené hodnoty pro muže pochází z normálního rozdělení. • Hi : Naměřené hodnoty pro muže nepochází z normálního rozdělení. Hladina významnosti a =................Protože náhodný výběr naměřených šířek mozkovny u mužů má rozsah..........., což je méně než 30, použijeme na testování hypotézy o normalitě dat ............................................. test. [1] 0.04180268 23 P-hodnota vyšla ............................................ Protože p-hodnota .................. a, Hq na hladině významnosti a = 0.05. Test normality naměřených hodnot pro ženy • Hq : Naměřené hodnoty pro ženy pochází z normálního rozdělení. • Hi : Naměřené hodnoty pro ženy nepochází z normálního rozdělení. Hladina významnosti a =................ Protože náhodný výběr rozdílu naměřených šířek mozkovny u žen má rozsah............., což je méně než 30, použijeme na testování hypotézy o normalitě dat ............................................. test. 24 [1] 0.04627647 P-hodnota vyšla ............................................ Protože p-hodnota .................. a, Hq na hladině významnosti a = 0.05. Interpretace výsledků testů normality: Naměřené hodnoty největší šířky mozkovny pro muže i pro ženy pochází / nepochází z normálního rozdělení. 5 Protože alespoň jeden z náhodných výběrů pochází / nepochází z normálního rozdělení, test o shodě rozptylů již ani provádět nemusíme. K otestování hypotézy o shodě největší šířky mozkovny žen a mužů použijeme parametrický / neparametrický dvouvýběrový test o ................................................. • //• : .............................. • //. : .............................. • Hladina významnosti a alternativa). Dvouvýběrový Wilcoxonův test a) Testování pomocí kritického oboru [i] 39.5 25 26 [1] 65.5 Statistika U\ =......................., statistika Č72 =.........................Výsledná testovací statistika U\y = min([71, Č72) = ..............................Rozsah prvního výběru ri\ =............, rozsah druhého výběru =............, kritický obor má potom tvar....................................Protože Uw............W, Hq o shodě mediánů ojo.5 a 1/0.5..................................... na hladině významnosti a =............................. b) Testování pomocí intervalu spolehlivosti Proti .................................... alternativě postavíme IS. [1] -3.000022 27 28 [1] 4.999987 Interval spolehlivosti má tvar ............................................................. Protože mediánů a:o.5 a 1/0.5 ..............................................na hladině významnosti a = . c) Testování pomocí p-hodnoty Hq o shodě [1] 0.3543915 29 P-hodnota vyšla............................................Protože p-hodnota . na hladině významnosti a =............................ a, Hq Krabicový diagram 140 135 '« 130 CD pohlaví zeny Interpretace výsledků: Mezi největší šířkou mozkovny u mužů starověké egyptské populace a u žen starověké egyptské populace existuje / neexistuje statisticky významný rozdíl. 6