Kapitola 6.: Neparametrické testy o mediánech Cíl kapitoly Po prostudování této kapitoly budete umět provádět testy hypotéz o mediánu jednoho spojitého rozložení hodnotit shodu dvou nezávislých náhodných výběrů ze spojitých rozložení hodnotit shodu aspoň tří nezávislých náhodných výběrů ze spojitých rozložení a identifikovat dvojice významně odlišných náhodných výběrů v Časová zátěž Na prostudování této kapitoly a splnění úkolů s ní spojených budete potřebovat asi 5 hodin studia. 6.1. Motivace Při používání t-testů či analýzy rozptylu by měl být splněn předpoklad normality dat. Pro výběry větších rozsahů (n > 30) nemá mírné porušení normality závažný dopad na výsledky. Někdy se však setkáváme s výběry malých rozsahů, které pocházejí z výrazně nenormálních rozložení. Pro práci s nimi byly vytvořeny tzv. neparametrické testy, které nevyžadují konkrétní typ rozložení (např. normální), stačí např. předpokládat, že distribuční funkce rozložení, z něhož náhodný výběr pochází, je spojitá. Tyto neparametrické testy se rovněž používají v situacích, kdy zkoumaná data nemají intervalový či poměrový charakter, ale pouze ordinální charakter. Ve srovnání s klasickými parametrickými testy jsou však neparametrické testy slabší, tzn., že nepravdivou hypotézu zamítají s menší pravděpodobností než testy parametrické. V této kapitole se omezíme na ty neparametrické testy, které se týkají mediánů. 6.2. Jednovýběrové testy Jde o neparametrické obdoby jednovýběrového t-testu a párového t-testu. 6.2.1. Znaménkový test Nechť Xj,.. .,Xnje náhodný výběr ze spojitého rozložení. Nechť x0 50 je mediánem tohoto rozložení a c je reálná konstanta. Testujeme hypotézu H0 : x0 50 = c proti oboustranné alternativě Hj : x0 50 ^ c (resp. proti levostranné alternativě Hj : x0 50 < c resp. proti pravostranné alternativě Hj : x0 50 > c). Znaménkový test se nejčastěji používá jako párový test, kdy máme náhodný výběr ze spojitého dvourozměrného rozložení ,..., a testujeme hypotézu o rozdílu mediánů, tj. H0 : x0 50 - y0 50 = c proti Hj : x0 50 - y0 50 ^ c (resp. proti jednostranným alternativám). Přejdeme k rozdílům Zt = Xt - Yt,..., Zn = Xn - Yn a testujeme hypotézu o mediánu těchto rozdílů, tj. H0 : z0 50 = c . a) Utvoříme rozdíly Y; = X; - c, i = 1,..., n . (Jsou-li některé rozdíly nulové, pak za n bereme jen počet nenulových hodnot.) b) Zavedeme statistiku Sz+, která udává počet těch rozdílů, které jsou kladné. Sz+ je součtem náhodných veličin s alternativním rozložením (i-tá veličina nabývá hodnoty 1, když i-tý rozdíl je kladný a hodnoty 0, když je záporný). Platí-li Ho, pak pravděpodobnost kladného i záporného rozdílu je stejná, tedy Sz+ ~ Bi(n,^)- Z vlastností binomického rozložení plyne, že e(sz+)=í,d(sz+)=í. c) Stanovíme kritický obor. Pro oboustrannou alternativu: W = (0,kj u(k2,n^, pro levostrannou alternativu: W = (0,kj), pro pravostrannou alternativu: W = (k2,n^. (Nezáporná celá čísla ki, k2 pro oboustranný test i pro jednostranné testy lze najít ve statistických tabulkách.) d) Ho zamítáme na hladině významnosti a, když Sz+ e W . Pro velká n (prakticky n > 20) lze využít asymptotické normality statistiky Sz+ . Testo- vá statistika Un = sz+ -e(sz+) _ sz \ ^ ^7) S má za platnosti H0 asymptoticky rozložení N(0,1). Kritický obor pro oboustranný test: W = (-^-u^^) u(ui-a/2'°°)-Kritický obor pro levostranný test: W = (- oo, - Uj_a). Kritický obor pro pravostranný test: W = ^Uj_a, oo). Aproximace rozložením N(0,l) se zlepší, když použijeme tzv. korekci na nespojitost. S +--±1 Testová statistika pak má tvar U0 = —-—p—-, přičemž \ přičteme, když Sz+ < f a ode- Ví čteme v opačném případě. 6.2.2. Příklad U 9 náhodně vybraných manželských párů byl zjištěn průměrný roční příjem (v tisících Kč). číslo páru 1 2 3 4 5 6 7 8 9 příjem manžela 216 336 384 432 456 528 552 600 1872 příjem manželky 336 240 192 336 384 288 960 312 576 Na hladině významnosti 0,05 testujte hypotézu, že mediány příjmů manželů a manželek jsou stejné. Řešení: Jedná se o párový test. Vypočteme rozdíly mezi příjmy manželů a manželek, čímž úlohu převedeme na jednovýběrový test. Testujeme H0 : z0 50 = Oproti oboustranné alternativě Hj : z0 50 ^ 0, kde z0 50 je medián rozložení, z něhož pochází rozdílový náhodný výběr Zj = Xj - Yj,..., Z9 = X9 - Y9. Vypočtené rozdíly Xj-y^-^O 96 192 96 72 240 -408 288 1296 Testová statistika Sz = 7.Ve statistických tabulkách najdeme pro n = 9 a a = 0,05 kritické hodnoty kj = 1, k2 = 8. Protože kritický obor W = (0,l) u (8,9) neobsahuje hodnotu 7, nemůžeme Ho zamítnout na hladině významnosti 0,05. Neprokázaly se tedy významné rozdíly v mediánech příjmů manželů a manželek.. Výpočet pomocí systému STATISTICA: Vytvoříme nový datový soubor se dvěma proměnnými a 9 případy. Do proměnné X napíšeme příjmy manželů, do proměnné Y příjmy manželek. Statistiky - Neparametrická statistika - Porovnání dvou závislých vzorků - OK - 1. seznam proměnných X, 2. seznam proměnných Y - OK - Znaménkový test. Dvojice proměnných Počet různých | procent 1 v < V Z 1 Úroveň p X & Y 9 22,22222 1,333333| 0,182422 Vidíme, že nenulových hodnot n = 9. Z nich záporných je 22,2%, tj. 2. Hodnota testové statistiky Sz+ =9-2 = 7. Asymptotická testová statistika U0(zde označená jako Z) se realizuje hodnotou 1,3 . Odpovídající asymptotická p-hodnota je 0,1824, tedy na asymptotické hladině významnosti 0,05 nezamítáme hypotézu, že mediány příjmů manželů a manželek jsou stejné. Upozornění: V tomto případě není splněna podmínka pro využití asymptotické normality statistiky Sz+, tj. n > 20 . Je tedy vhodnější najít v tabulkách kritické hodnoty pro znaménkový test. Pro n = 9 a a = 0,05 jsou kritické hodnoty ki = 1, k2 = 8. Protože kritický obor W = (0,l) u (8,9) neobsahuje hodnotu 7, nezamítáme HQ na hladině významnosti 0,05. Dostáváme týž výsledek jako při použití asymptotického testu. 6.2.3. Jednovýběrový Wilcoxonův test Nechť Xi, Xn je náhodný výběr ze spojitého rozložení s hustotou (p(x), která je symetrická kolem mediánu xq^q, tj. (p(xo,so + x) = (p(xo,so - x). Nechť c je reálná konstanta. Testujeme hypotézu Ho: xo,so = c proti oboustranné alternativě Hi: xo,so i1 c (resp. proti levostranné alternativě Hi: xo,5o < c resp. proti pravostranné alternativě Hi: xo,5o > c)- a) Utvoříme rozdíly Yi = Xi - c, i = 1, n. (Jsou-li některé rozdíly nulové, pak za n bereme jen počet nenulových hodnot.) b) Absolutní hodnoty | Yi | uspořádáme vzestupně podle velikosti a spočteme pořadí Ri. c) Zavedeme statistiku Sw+ = ^ R;+ , což je součet pořadí přes kladné hodnoty Y;. Analo- Yi>0 gicky zavedeme statistiku Sw~ = ^Rj" , což je součet pořadí přes záporné hodnoty Y;. Při- Yi<0 tom platí, že součet Sw+ + Sw" = n(n+l)/2. Za platnosti Ho statistika Sw+ má střední hodnotu E(SW+) = n(n+l)/4 a rozptyl D(SW+) = n(n+l)(2n+l)/24. d) Stanovíme testovou statistiku: Testová statistika = min(Sw+, Sw") pro oboustrannou alternativu, = Sw+ pro levostrannou alternativu, = Sw pro pravostrannou alternativu. e) Ho zamítáme na hladině významnosti a, když testová statistika je menší nebo rovna tabelo-vané kritické hodnotě. u0 = Pro n > 30 lze využít asymptotické normality statistiky Sw+- Platí-li Ho, pak C + cíc +1 <í + n(n+l) i+l) N(0,1). Kritický obor pro oboustrannou alternativu má tvar: W = (-^-u^^) u(uj_a/2,oo). (Analogicky pro jednostranné alternativy.) H0 zamítáme na asymptotické hladině významnosti a, když U0 e W. Wilcoxonův test se hodí jen pro výběr ze symetrického rozložení. Není-li tento předpoklad splněn, lze použít např. znaménkový test. 6.2.4. Příklad U 12 náhodně zemí bylo zjištěno procento populace starší 60 let: 4,9 6,0 6,9 17,6 4,5 12,3 5,7 5,3 9,6 13,5 15,7 7,7. Na hladině významnosti 0,05 testujte hypotézu, že medián procenta populace starší 60 let je 12 proti oboustranné alternativě. Řešení: Vypočteme rozdíly pozorovaných hodnot od čísla 12:-7,1 -6,0 -5,1 5,6 -7,5 0,3 -6,3 -6,7 -2,4 1,5 3,7 -4,3. Absolutní hodnoty těchto rozdílů uspořádáme vzestupně podle velikosti. Kladné rozdíly přitom označíme tučně: usp. | xí — 121 0,3 1,5 2,4 3,7 4,3 5,1 5,6 6 6,3 6,7 7,1 7,5 pořadí 1 234 5 6789 10 11 12 Sw+ = 14, Sw = 64, n = 12, a = 0,05, tabelovaná kritická hodnota = 13, testová statistika = min(Sw+, Sw") = min(14,64) = 14. Protože 14 > 13, Ho nezamítáme na hladině významnosti 0,05. Znamená to, že na hladině významnosti 0,05 se nepodařilo prokázat, že aspoň v polovině zemí by se podíl populace nad 60 let odlišoval od 12 %. Řešení pomocí systému ŠTATISTI CA: Otevřeme nový datový soubor se dvěma proměnnou a dvanácti případy. První proměnnou nazveme PROCENTA, druhou KONSTANTA. Do proměnné PROCENTA napíšeme zjištěná procenta populace starší 60 let:a do proměnné KONSTANTA vyplníme čísly 12 (do Dlouhého jména proměnné KONSTANTA napíšeme =12). Statistika - Neparametrická statistika - Porovnání dvou závislých vzorků (proměnné) - OK. Proměnné - 1. seznam proměnných - PROCENTA, 2. seznam proměnných - KONSTANTA, OK, Wilcoxonův párový test. Dostaneme tabulku Dvojice proměnných Wilcoxonův párový test (populace_nad_60) Označené testy jsou významné na hladině p <,05000 Počet platných T Z Úroveň p procento & konst 12 14,00000 1,961161 0,049861 V této tabulce je symbolem T označena testová statistika min(Sw+, Sw"), symbolem Z realizace asymptotické testové statistiky Uo- Uvedená p-hodnota je vypočítána pro realizaci asymptotické testové statistiky Uo. Protože p < 0,05, hypotézu Ho: xo,so = 12 zamítáme na asymptotické hladině významnosti 0,05. Pokud bychom chtěli provést přesný test a nikoliv pouze asymptotický, vyhledali bychom ve statistických tabulkách kritickou hodnotu jednový-běrového Wilcoxonova testu pro n = 12, a = 0,05 (viz výše). Protože tato hodnota je 13, nulovou hypotézu nezamítáme na hladině významnosti 0,05. 6.2.5. Párový Wilcoxonův test Nechť (Xi, Yi), (Xn Yn) je náhodný výběr ze spojitého dvourozměrného rozložení. Testujeme Ho: xo,so - y,50 = c proti Hi: xo,so - yo.so i1 c (resp. proti jednostranným alternativám). Utvoříme rozdíly Zi = Xi - Yi, i = 1, n a testujeme hypotézu o mediánu zo,so> tj. H0: z0,5o = c proti Hi: z0,5o í c. 6.2.6. Příklad K zjištění cenových rozdílů mezi určitými dvěma druhy zboží bylo náhodně vybráno 15 prodejen a byly zjištěny ceny zboží A a ceny zboží B: (11,10), (14,11), (11,9), (13,9), (11,9), (10,9), (12,10), (10,8), (12,11), (11,9), (13,10), (14,10), (14,12), (19,15), (14,12). Na hladině významnosti 0,05 je třeba testovat hypotézu, že medián cenových rozdílů činí 3 Kč. Řešení: Jedná se o párový test. Vypočteme rozdíly mezi cenou zboží A a cenou zboží B, čímž úlohu převedeme na jednovýběrový test. Výpočty uspořádáme do tabulky: č. prodejny cena zboží A cena zboží B rozdíl Irozdíl-mediánl pořadí 1 11 10 1 2 12 2 14 11 3 0 - 3 11 9 2 1 5,5 4 13 9 4 1 5,5 5 11 9 2 1 5,5 6 10 9 1 2 12 7 12 10 2 1 5,5 8 10 8 2 1 5,5 9 12 11 1 2 12 10 11 9 2 1 5,5 11 13 10 3 0 - 12 14 10 4 1 5,5 13 14 12 2 1 5,5 14 19 15 4 1 5,5 15 14 12 2 1 5,5 Tučnejšou vytištěna pořadí pro kladné hodnoty rozdíl - medián. Sw+ = 16,5, Sw = 74,5, n = 15, a = 0,05, tabelovaná kritická hodnota = 17, testová statistika = min(Sw+, Sw") = min(16,5; 74,5) = 16,5. Protože 16,5 < 17, Ho zamítáme na hladině významnosti 0,05, tedy s rizikem omylu nejvýše 5% jsme prokázali, že medián cenových rozdílů se liší od 3 Kč. Řešení pomocí systému ŠTATISTI CA: Otevřeme nový datový soubor se čtyřmi proměnnými a 15 případy. První proměnnou nazveme CENA A, druhou CENA B, třetí ROZDÍL a čtvrtou KONSTANTA. Do proměnných CEANA A a CENA B zapíšeme ceny zboží A a B, do Dlouhého jména proměnné ROZDÍL napíšeme = vl-v2 a proměnnou KONSTANTA vyplníme samými trojkami. Nyní provedeme párový Wilcoxonův test: Statistika - Neparametrická statistika - Porovnání dvou závislých vzorků (proměnné) - OK. Proměnné - 1. seznam proměnných - ROZDÍL, 2. seznam proměnných - KONSTANTA, OK, Wilcoxonův párový test. Dostaneme tabulku Dvojice proměnných Wilcoxonův párový test (priklad734) Označené testy jsou významné na hladině p <,05000 Počet platných T Z I Úroveň p rozdíl & konst 15 16,50000| 2,026684| 0,042696 Podobně jako v příkladu 6.2.4. je symbolem T označena testová statistika min(Sw+, Sw), symbolem Z realizace asymptotické testové statistiky Urj. Uvedená p-hodnota je vypočítána pro realizaci asymptotické testové statistiky Uo. Protože p < 0,05, hypotézu Ho: zo,so = 3 zamítáme na asymptotické hladině významnosti 0,05. Pokud bychom chtěli provést přesný test a nikoliv pouze asymptotický, vyhledali bychom ve statistických tabulkách kritickou hodnotu jedno výběrového Wilcoxonova testu pro n = 13, a = 0,05 (viz výše). Protože tato hodnota je 17 a testová statistika 16,5, nulovou hypotézu zamítáme na hladině významnosti 0,05. 6.3. Dvouvýběrové pořadové testy Jedná se o neparametrickou obdobu dvou výběrového t-testu. 6.3.1. Dvouvýběrový Wilcoxonův test Nechť Xi, Xn a Yi, Ym jsou dva nezávislé náhodné výběry ze dvou spojitých rozložení, jejichž distribuční funkce se mohou lišit pouze posunutím. Označme xo,so medián prvního rozložení a yo,5o medián druhého rozložení. Testujeme hypotézu, že distribuční funkce těchto rozložení jsou shodné neboli mediány jsou shodné proti alternativě, že jsou rozdílné. Všech n + m hodnot Xi, Xn a Yi, Ym uspořádáme vzestupně podle velikosti. Zjistíme součet pořadí hodnot Xi, Xn a označíme ho Ti. Součet pořadí hodnot Yi, Ym označíme T2. Vypočteme statistiky Uj = mn + n(n+l)/2 - Ti , U2 = mn + m(m+l)/2 - T2. Přitom platí Uj + U2 = mn. Pokud min(U1,U2) < tabelovaná kritická hodnota (pro dané rozsahy výběrů m, n a dané a), pak nulovou hypotézu o totožnosti obou distribučních funkcí zamítáme na hladině významnosti a. V tabulkách se používá označení: n = min{m, n} a m = max {m, n}. Pro velká n, m (prakticky n, m > 30) lze využít asymptotické normality statistiky Ui. ui V případě platnosti Ho má statistika U0 = . = asymptoticky rozložení N(0,1). Kntic- / mn(m+n+l) V 12 ký obor pro oboustrannou alternativu má tvar: W = (-°°,-u1_a/2) ^(ui-a/2'00)- (Analogicky pro jednostranné alternativy.) Ho zamítáme na asymptotické hladině významnosti a, když U0eW. Dvouvýběrový Wilcoxonův test se používá v situacích, kdy distribuční funkce rozložení, z nichž dané dva nezávislé náhodné výběry pocházejí, se mohou lišit pouze posunutím. 6.3.2. Příklad Bylo vybráno 10 polí stejné kvality. Na čtyřech z nich se zkoušel nový způsob hnojení, zbylých šest bylo ošetřeno starým způsobem. Pole byla oseta pšenicí a sledoval se její hektarový výnos. Je třeba zjistit, zda nový způsob hnojení má týž vliv na průměrné hektarové výnosy pšenice jako starý způsob hnojení. x: nový způsob 51 52 49 55 y: starý způsob 45 54 48 44 53 50 Řešení usp. hodnoty 44 45 48 49 50 51 52 53 54 55 pořadí x-ových hodnot 4 6 7 10 pořadí y-ových hodnot 1 2 3 5 8 9 Tj = 4 + 6 + 7 + 10 = 27, T2 =1+2 + 3 + 5 + 8 + 9 = 28 Uj = 4.6 + 4.5/2 - 27 = 7, U2 = 4.6 + 6.7/2 - 28 = 17 Kritická hodnota pro a = 0,05, min(4,6) = 4, max(4,6) = 6 je 2. Protože min(7,17) > 2, nemůžeme na hladině významnosti 0,05 zamítnout hypotézu, že nový způsob hnojení má na hektarové výnosy pšenice stejný vliv jako starý způsob. Řešení pomocí systému ŠTATISTI CA: Otevřeme nový datový soubor se dvěma proměnnými VYNOS a ID a 10 případy. Do proměnné VYNOS zapíšeme hektarové výnosy pšenice a do proměnné ID, která slouží k rozlišení nového a starého způsobu hnojení, napíšeme 4 krát jedničku a 6 krát dvojku. Nyní provedeme dvouvýběrový Wilcoxonův test, který je ve STATISTICE uveden pod názvem Mannův - Whitneyův test: Statistika - Neparametrická statistika - Porovnání dvou nezávislých vzorků (skupiny) - OK. Proměnné - Seznam závislých proměnných - VYNOS, Nezáv. (grupov.) proměnné - ID -OK, Mann-Whitneyův U test. Dostaneme tabulku Proměnná Mann-Whitneyův U test (Hnojeni.sta) Dle proměn, id Označené testy jsou významné na hladině p <,05000 Sčt poř. 1 Sčt poř. 1 U Z 1 p-hodn. 1 Z p-hodn. N platn. skup. 1 | skup. 2 | | upravené skup. 1 N platn. skup. 2 2*1 str. přesné p X 27,00000 28,00000 7,000000 0,959403 0,337356 0,959403 0,337356 4 6 0,352381 Zde je symbolem U označena testová statistika mh^U^Ly. V našem případě U = 7, odpovídající p-hodnotu najdeme v posledním sloupci pod označením 2*1 str. přesné p. Protože 0,352381 > 0,05, nezamítáme na hladině významnosti 0,05 nulovou hypotézu. Výpočet ještě doplníme krabicovým diagramem. Na záložce Zákl. výsledky vybereme Krabicový graf dle skupin, OK, proměnná VYNOS, OK. Dostaneme graf Krabicový graf dle skupin Proměnná: výnos Je zřejmé, že medián hektarových výnosů při starém způsobu hnojení je menší než při novém způsobu a také vidíme, že variabilita hektarových výnosů při starém způsobu hnojení je větší než při novém způsobu. 6.3.3. Dvouvýběrový Kolmogorovův - Smirnovův test X X Y Y Nechť 1'"""' n a i'"""' ™jsou dva nezávislé náhodné výběry ze dvou spojitých rozložení?? jejichž distribuční funkce se mohou lišit nejenom posunutím?? ale také tvarem. Testujeme hypotézu, že distribuční funkce těchto rozložení jsou shodné, tj., že všech n+m veličin pochází z téhož rozložení proti alternativě, že distribuční funkce jsou rozdílné. Nechť je empirická distribuční funkce 1. výběru a F2(y) je empirická distribuční funkce 2. výběru. Jako testová statistika slouží D = max iF^x) -F2(x)| . Ho zamítáme na hladině významnosti a, —a> když D > Dn m (a), kde Dn m (a) je tabelovaná kritická hodnota. Pro větší rozsahy n, m lze kritickou hodnotu aproximovat vzorcem J-ln— . V 2nm a 6.3.4. Příklad Na data z příkladu 6.3.2. aplikujte dvouvýběrový K-S test. Výpočet pomocí systému STATISTICA: Statistiky - Neparametrická statistika - Porovnání dvou nezávislých vzorků - OK - Proměnné - Seznam závislých proměnných X, Nezáv. (grupov.) proměnná ID - OK - Kolmogorov-Smirnovův 2-výběrový test. Proměnná Kolmogorov-Smirnovův test (Hnojeni.sta) Dle proměn, id Označené testy jsou významné na hladině p <,05000 Max záp Max klad p-hodn. Průměr rozdíl rozdíl | skup. 1 Průměr Sm.odch. Sm.odch. N platn. N platn. skup. 2 skup. 1 skup. 2 | skup. 1 | skup. 2 X -0,083333 0,500000 p>.10 51,75000 49,00000 2,500000 4,098780 4 6 Ve výstupní tabulce pro dvouvýběrový K-S test dostaneme maximální záporný a maximální kladný rozdíl mezi hodnotami obou výběrových distribučních funkcí, dolní omezení pro p-hodnotu (p > 0,1), průměry, směrodatné odchylky a rozsahy obou výběrů. Jelikož p-hodnota převyšuje hladinu významnosti 0,05, na této hladině nelze nulovou hypotézu zamítnout. 6.4. Kruskalův - Wallisův test a mediánový test (neparametrické obdoby analýzy rozptylu jednoduchého třídění) 6.4.1. Formulace problému Nechť je dáno r > 3 nezávislých náhodných výběrů o rozsazích ni, ... , n. Předpokládáme, že tyto výběry pocházejí ze spojitých rozložení. Označme n = nl + ... + n . Chceme testovat hypotézu, že všechny tyto výběry pocházejí z téhož rozložení. 6.4.2. Kruskalův - Wallisův test Všech n hodnot seřadíme do rostoucí posloupnosti a určíme pořadí každé hodnoty. Označme Tj součet pořadí těch hodnot, které patří do j-tého výběru, j = 1, r (kontrola: musí 12 r T-2 platit T, + ... + T = n(n+l)/2). Testová statistika má tvar: Q =-Y — - 3(n +1). Pla- n(n + l)^nj tí-li Ho, má statistika Q asymptoticky rozložení % (r-1). HQ tedy zamítneme na asymptotické hladině významnosti a, když Q > xi-a (r-1). 6.4.3. Mediánový test P-2 Testová statistika má tvar QM = 4Y —--n , kde Pj je počet hodnot v j-tém výběru, j=i nJ které jsou větší nebo rovny mediánu vypočtenému ze všech n hodnot. Platí-li H0, má statistika Qm asymptoticky rozložení % (r-1). HQ tedy zamítneme na asymptotické hladině významnosti a, když QM > Xi-a 2(r-l)- 6.4.4. Metody mnohonásobného porovnávání Zamítneme-li Ho, zajímá nás, které dvojice náhodných výběrů se liší na zvolené hladině významnosti. a) Neményiho metoda Používá se v případě, že všechny výběry mají týž rozsah p. Je-li | Ti - Tt | > tabelovaná kritická hodnota (pro dané p, r, a ), pak na hladině významnosti a zamítáme hypotézu, že 1-tý a k-tý výběr pocházejí z téhož rozložení. b) Obecná metoda mnohonásobného porovnávání Jestliže T T -M Ak ni nk 1 > "12 '1 O ■ + - Vni nw n(n + l)hKW (a) , pak na hladině významnosti a zamítáme hypotézu, že 1-tý a k-tý výběr pocházejí z téhož rozložení. Kritickou hodnotu hKw(ot) najdeme ve speciálních statistických tabulkách. Při větších rozsazích výběrů je možno ji nahradit kvan-tilem xi-aVl)- 7.4.5. Příklad U přijímacích zkoušek na vysokou školu sledujeme počet bodů z matematiky. Chceme posoudit, zda výsledky jsou závislé na typu absolvované střední školy. Náhodně vybereme osm písemných zkoušek studentů každého z uvažovaných tří typů škol: číslo písemky gymnázium číslo písemky SES číslo písemky SPS 1 78 9 30 17 93 2 95 10 84 18 74 3 84 11 65 19 58 4 78 12 41 20 85 5 85 13 67 21 60 6 96 14 52 22 72 7 90 15 92 23 67 8 83 16 70 24 59 Na hladině významnosti 0,05 testujte hypotézu, že výsledky studentů z gymnázií, SEŠ a SPŠ se neliší. Zamítnete-li nulovou hypotézu, vyšetřete, které dvojice typů škol se od sebe liší na hladině významnosti 0,05. Řešení Kruskalův Wallisův test usp. hodnoty pořadí 1. výběru pořadí 2. výběru pořadí 3. výběru 30 1 41 2 52 3 58 4 59 5 60 6 65 7 67 8,5 67 8,5 70 10 72 11 74 12 78 13,5 78 13,5 83 15 84 16,5 84 16,5 85 18,5 85 18,5 90 20 92 21 93 22 95 23 96 24 Součet pořadí pro jednotlivé výběry: Ti = 69, T2 = 87, T3 = 144 , Realizace testové statistiky: Q = 12 24-25 ^692 872 1442^ -+-+- v 8 8 8 j ■3-25 = 7,665 Kritický obor. W = (^0,95 (2), °o) = (5,991,°°). Protože Q e W , Ho zamítáme na asymptotické hladině významnosti 0,05. Rozdíly mezi počty bodů u přijímací zkoušky z matematiky u studentů ze sledovaných tří typů středních škol se prokázaly s rizikem omylu nejvýše 0,05. Mediánový test Medián všech 24 hodnot je 76. V 1. výběru leží nad mediánem 8 hodnot, ve 2. výběru 2 hodnoty, ve 3. výběru 2 hodnoty. -(82 +22 +22) Realizace testové statistiky: QM = 4 ■24 = 12, Kritický obor. W = (^2o,95 (2), 00) = (5,991,°°). Nulovou hypotézu zamítáme na asymptotické hladině významnosti 0,05. Řešení pomocí systému ŠTATISTI CA: Otevřeme nový datový soubor se dvěma proměnnými X a ID a s 24 případy. Do proměnné X zapíšeme počty bodů, do proměnné ID, která slouží jako identifikátor typu školy, napíšeme 8 krát jedničku, 8 krát dvojku a 8 krát trojku. Nyní provedeme Kruskalův - Wallisův a mediánový test. Statistika - Neparametrická statistika - Porovnání více nezávislých vzorků (skupiny) - OK. Proměnné - Závisle proměnné - X, Nezáv. (grupov.) proměnná - ID - OK, Shrnutí: Kruskal-Wallis ANOVA a mediánový test, Výpočet. Pro K-W test dostaneme tabulku Závislá: X Kruskal-Wallisova ANOVA založ, na poř.; X (body_u_zkousky.sta) Nezávislá (grupovací) proměnná : ID Kruskal-Wallisův test: H ( 2, N= 24) =7,678354 p =,0215 Kód Počet platných Součet pořadí gymnázium 1 8 144,0000 SEŠ 2 8 69,0000 SPŠ 3 8 87,0000 Testová statistika se realizuje hodnotou 7,678, počet stupňů volnosti je 2, odpovídající p-hodnota = 0,0215, tedy na asymptotické hladině významnosti 0,05 zamítáme hypotézu o shodě mediánů. Pro mediánový test máme tabulku Závislá: X Mediánový test, celk. medián = 76,0000; X (body_u_zkousky.sta) Nezávislá (grupovací) proměnná : ID Chi-Kvadr. = 12,00000 sv = 2 p = ,0025 gymnázium | SEŠ SPŠ | Celkem <= Medián: pozorov. 0,00000 6,00000 6,00000 12,00000 očekáv. 4,00000 4,00000 4,00000 poz.-oč. -4,00000 2,00000 2,00000 > Medián: pozorov. 8,00000| 2,00000 2,00000| 12,00000 očekáv. 4,00000 4,00000 4,00000 poz.-oč. 4,00000 -2,00000 -2,00000 Celkem: oček. 8,00000 8,00000 8,00000 24,00000 Realizace testové statistiky = 12, počet stupňů volnosti = 2, odpovídající p-hodnota = 0,0025, tedy na asymptotické hladině významnosti 0,05 zamítáme hypotézu o shodě mediánů. Nyní provedeme mnohonásobné porovnávání, abychom zjistili, které dvojice typů škol se liší. Zvolíme Vícenás. porovnání průměrného pořadí pro vš. skupiny. Závislá: X Vícenásobné porovnání p hodnot (oboustr.); X (body_u_zkousky.sta Nezávislá (grupovací) proměnná : ID Kruskal-Wallisův test: H ( 2, N= 24) =7,678354 p =,0215 gymnázium R:18,000 SEŠ R:8,6250 SPS R:10,875 gymnázium 0,024030 0,131634 SEŠ 0,024030 1,000000 SPŠ 0,131634 1,000000 Tabulka obsahuje p-hodnoty pro porovnání dvojic skupin. Vidíme, že na hladině významnosti 0,05 se liší gymnázium a SES. Výpočet ještě doplníme krabicovým diagramem. Na záložce Zákl. výsledky vybereme Krabicový graf, proměnná X, OK, Typ krabicového grafu Medián/Kvartily/Rozpětí, OK. Dostaneme graf Krabicový graf dle skupin Proměnná: X 100 90 80 70 50 40 30 ^0 „ IVIKUldlI gymnázium SES SPS rj 250/ 750/ ID I Min-Max Vidíme, že mediány se liší velice výrazně, zvláště pro gymnázia a SEŠ. Variabilita počtu bodů je nejmenší pro gymnázia, nej větší pro SEŠ. Shrnutí V některých situacích se setkáváme s náhodnými výběry malých rozsahů, které pocházejí z výrazně nenormálních rozložení. V takových případech nelze použít klasické testy založené na předpokladu normality, které byly popsány ve 4., 5. a 6. kapitole. Místo nich používáme neparametrické testy, které nepotřebují splnění předpokladu noDmDlit3, stačí např. předpokládat spojitost distribuční funkce rozložení, z něhož daný náhodný výběr pochází. Pro testování hypotéz □ o □ mediánu používáme jednovýběrový či párový Wilcoxonův test, což je neparametrinká obdoba jednovýběrového či párového t.testu. Máme-li testovat hypotézu o shodě mediánů dvou rozložení, která se mohou lišit jen posunutím (tj. testujeme hypotézu o shodě těchto dvou rozložení), aplikujeme dvouvýběrový Wilcoxonův test - neparametrickou obdobu dvou výběrového t-testu. Jako neparametrická obdoba analýzy rozptylu jednoduchého třídění slouží Kruskalův -Wallisův test nebo mediánový test. Při zamítnutí nulové hypotézy identifikujeme dvojice odlišných výběrů pomocí metod mnohonásobného porovnávání, a to buď obecnou metodu mnohonásobného porovnávání nebo Neméniyho metodu. Při provádění neparametrických testů potřebujeme speciální tabulky kritických hodnot. Jsou obsaženy v příloze A tohoto učebního textu. Všechny uvedené testy jsou implementovány v systému STATISTICA. Kontrolní otázky 1. V jakých situacích používáme neparametrické testy? 2. Jaká je nevýhoda neparametrických testů oproti testům parametrickým? 3. Jak vypočítáme pořadí čísla v dané posloupnosti čísel? 4. Popište rozdíl mezi jednovýběrovým a párovým Wilcoxonovým testem. 5. Jaké podmínky musí být splněny pro dvouvýběrový Wilcoxonův test? 6. K čemu slouží Kruskalův-Wallisův test? 7. Jak provedeme mediánový test? 8. Které metody mnohonásobného porovnávání znáte? Testová statistika se realizuje hodnotou 12, tabelovaná kritická hodnota pro a = 0,05, min(5,8) = 5, max(5,8) = 8 je 6. Protože min(28,12) > 6, nemůžeme na hladině významnosti 0,05 zamítnout hypotézu, že obě technologie poskytují stejné procento účinné látky. 3. Výrobce koláčů v prášku má 4 nové recepty a chce zjistit, zda se jejich kvalita liší. Upekl proto 5 koláčů z každého druhu a dal je porotě k ohodnocení. recept počet bodů A 72 88 70 87 71 B 85 89 86 82 88 C 94 94 88 87 89 D 91 93 92 95 94 Na asymptotické hladině významnosti 0,05 testujte hypotézu, že recepty se neliší. Výsledek: Použijeme Kruskalův - Wallisův test. Všech 20 hodnot uspořádáme vzestupně podle velikosti a stanovíme součet pořadí pro recepty A, B, C, D: Ti = 23,5, T2 = 37,5, T3 = 66, T4 = 83. Testová statistika: Q 12 20-21 23,52 37,52 662 83 —-— + —-— +-+ — 2^ - 3 ■ 21 = 12,45, xo.95 (3) = 7,81. Protože Q > 7,81, Ho zamítáme na asymptotické hladině významnosti 0,05. Neményiho metoda prokázala, že na hladině významnosti 0,05 se liší recepty A a D. 4. U osmi osob byl změřen systolický krevní tlak před pokusem a po něm. č. osoby 1 2 3 4 5 6 7 8 tlak před 130 185 162 136 147 181 128 139 tlak po 139 190 175 135 155 175 158 149 Na hladině významnosti 0,05 testujte hypotézu, že pokus neovlivní systolický krevní tlak Výsledek: Párový Wilcoxonův test poskytl p-hodnotu 0,04995, tedy H0 zamítáme na hladině významnosti 0,05. 5. Majitel obchodu chtěl zjistit, zda velikost nákupů (v dolarech) placených kreditními kartami Master/EuroCard a Visa jsou přibližně stejné. Náhodně vybral 7 nákupů placených Mas-ter/EuroCard a 9 placených Visou: Master/EuroCard 42 77 46 73 78 33 37 Visa 39 10 119 68 76 126 53 79 102 Lze na hladině významnosti 0,05 tvrdit, že mediány nákupů placených těmito dvěma typy karet se shodují? Výsledek: Dvouvýběrový Wilcoxonův test poskytl p-hodnotu 0,2523, H0 tedy nezamítáme na hladině významnosti 0,05. 6. Z produkce tří podniků vyrábějících televizory bylo vylosováno 10, 8 a 12 kusů. Byly získány následující výsledky zjišťování citlivosti těchto televizorů v mikrovoltech: podnik citlivost 1. podnik 420 560 600 490 550 570 340 480 510 460 2. podnik 400 420 580 470 470 500 520 530 3. podnik 450 700 630 590 420 590 610 540 740 690 540 670 Ověřte na hladině významnosti 0,05 hypotlzu o shodě úrovně citlivosti televizorů v jednotlivých podnicích. Výsledek: K-W test poskytl testovou statistiku 8,304653, počet stupňů volnosti = 2, odpovídající p-hodnota = 0,0157, tedy Ho zamítáme na asymptotické hladině významnosti 0,05. Liší se výrobky podniků 2 a 3.