Kapitola 7. : Pořadové testy o mediánech 7.1. Motivace Při používání t-testů či analýzy rozptylu by měl být splněn předpoklad normality dat. Pro výběry větších rozsahů (n 30) nemá mírné porušení normality závažný dopad na vý- sledky. Někdy se však setkáváme s výběry malých rozsahů, které pocházejí z výrazně nenor- málních rozložení. Pro práci s nimi byly vytvořeny tzv. neparametrické testy, které nevyžadují předpoklad o konkrétním typu rozložení (např. normálním), stačí např. předpokládat, že dis- tribuční funkce rozložení, z něhož náhodný výběr pochází, je spojitá. Tyto neparametrické testy se rovněž používají v situacích, kdy zkoumaná data nemají intervalový či poměrový charakter, ale pouze ordinální charakter. Ve srovnání s klasickými parametrickými testy jsou však neparametrické testy slabší, tzn., že nepravdivou hypotézu zamítají s menší pravděpodobností než testy parametrické. V této kapitole se omezíme na ty neparametrické testy, které jsou založeny na pořadí a týkají se mediánů. Nazývají se pořadové testy. 7.2. Pořadí čísla v posloupnosti čísel 7.2.1. Pojem pořadí Nechť x1, ..., xn je posloupnost reálných čísel. a) Jsou-li čísla navzájem různá, pak pořadím Ri čísla xi rozumíme počet těch čísel x1, ..., xn, která jsou menší nebo rovna číslu xi. b) Vyskytují-li se mezi danými čísly skupinky stejných čísel, pak každé takové skupince při- řadíme průměrné pořadí. 7.2.2. Příklad a) Jsou dána čísla 9, 4, 5, 7, 3, 1. Stanovte pořadí těchto čísel. b) Jsou dána čísla 6, 7, 7, 9, 6, 10, 8, 6, 6, 9. Řešení ad a) usp. čísla 1 3 4 5 7 9 pořadí 1 2 3 4 5 6 ad b) usp. čísla 6 6 6 6 7 7 8 9 9 10 pořadí 1 2 3 4 5 6 7 8 9 10 prům. pořadí 2,25 2,25 2,25 2,25 5,5 5,5 7 8,5 8,5 10 7.3. Jednovýběrové pořadové testy Jde o neparametrické obdoby jednovýběrového t-testu a párového t-testu. 7.3.1. Jednovýběrový Wilcoxonův test Nechť X1, ..., Xn je náhodný výběr ze spojitého rozložení s hustotou (x), která je syme- trická kolem mediánu x0,50, tj. (x0,50 + x) = (x0,50 - x). Nechť c je reálná konstanta. Testujeme hypotézu H0: x0,50 = c proti oboustranné alternativě H1: x0,50 c (resp. proti levostranné alter- nativě H1: x0,50 < c resp. proti pravostranné alternativě H1: x0,50 > c). Utvoříme rozdíly Yi = Xi ­ c, i = 1, ..., n. (Jsou-li některé rozdíly nulové, pak za n bere- me jen počet nenulových hodnot.) Absolutní hodnoty Yiuspořádáme vzestupně podle velikosti a spočteme pořadí Ri. Zavedeme statistiku > ++ = 0Y iW i RS , což je součet pořadí přes kladné hodnoty Yi. Ana- logicky zavedeme statistiku < -- = 0Y iW i RS , což je součet pořadí přes záporné hodnoty Yi. Přitom platí, že součet SW + + SW - = n(n+1)/2. Za platnosti H0 statistika SW + má střední hod- notu E(SW + ) = n(n+1)/4 a rozptyl D(SW + ) = n(n+1)(2n+1)/24. H0 zamítáme na hladině významnosti , když testová statistika je menší nebo rovna ta- belované kritické hodnotě. Testová statistika = min(SW + , SW - ) pro oboustrannou alternativu, = SW + pro levostrannou alternativu, = SW - pro pravostrannou alternativu. Pro n 30 lze využít asymptotické normality statistiky SW + . Platí-li H0, pak ( ) ( ) 24 )1n2)(1n(n 4 )1n(n W W WW 0 S SD SES U ++ ++ + ++ - = - = N(0,1). Kritický obor pro oboustrannou alternativu má tvar: W = ( )-- -- ,uu, 2/12/1 . (Analogicky pro jednostranné alternativy.) H0 zamí- táme na asymptotické hladině významnosti , když WU0 . Wilcoxonův test se hodí jen pro výběr ze symetrického rozložení. Není-li tento předpo- klad splněn, lze použít např. znaménkový test (viz doporučená literatura, str. 193). 7.3.2. Příklad U 12 náhodně zemí bylo zjištěno procento populace starší 60 let: 4,9 6,0 6,9 17,6 4,5 12,3 5,7 5,3 9,6 13,5 15,7 7,7. Na hladině významnosti 0,05 testujte hypotézu, že medián procenta populace starší 60 let je 12 proti oboustranné alternativě. Řešení Vypočteme rozdíly pozorovaných hodnot od čísla 12: -7,1 -6,0 -5,1 5,6 -7,5 0,3 -6,3 -6,7 -2,4 1,5 3,7 -4,3. Absolutní hodnoty těchto rozdílů uspořádáme vzestupně podle veli- kosti. Kladné rozdíly přitom označíme tučně: usp. xi ­ 12 0,3 1,5 2,4 3,7 -4,3 -5,1 5,6 -6 -6,3 -6,7 -7,1 -7,5 pořadí 1 2 3 4 5 6 7 8 9 10 11 12 SW + = 14, SW - = 64, n = 12, = 0,05, tabelovaná kritická hodnota = 13, testová statistika = min(SW + , SW - ) = min(14,64) = 14. Protože 14 > 13, H0 nezamítáme na hladině významnosti 0,05. 7.3.3. Párový Wilcoxonův test Nechť (X1, Y1), ..., (Xn Yn) je náhodný výběr ze spojitého dvourozměrného rozložení. Testujeme H0: x0,50 - y,50 = c proti H1: x0,50 - y0,50 c (resp. proti jednostranným alternati- vám). Utvoříme rozdíly Zi = Xi ­ Yi, i = 1, ..., n a testujeme hypotézu o mediánu z0,50, tj. H0: z0,50 = c proti H1: z0,50 c. 7.3.4. Příklad K zjištění cenových rozdílů mezi určitými dvěma druhy zboží bylo náhodně vybráno 15 prodejen a byly zjištěny ceny zboží A a ceny zboží B: (11,10), (14,11), (11,9), (13,9), (11,9), (10,9), (12,10), (10,8), (12,11), (11,9), (13,10), (14,10), (14,12), (19,15), (14,12). Na hladině významnosti 0,05 je třeba testovat hypotézu, že medián cenových rozdílů činí 3 Kč. Řešení: Jedná se o párový test. Vypočteme rozdíly mezi cenou zboží A a cenou zboží B, čímž úlohu převedeme na jednovýběrový test. Výpočty uspořádáme do tabulky: č. prodejny cena zboží A cena zboží B rozdíl |rozdíl-medián| pořadí 1 11 10 1 2 12 2 14 11 3 0 - 3 11 9 2 1 5,5 4 13 9 4 1 5,5 5 11 9 2 1 5,5 6 10 9 1 2 12 7 12 10 2 1 5,5 8 10 8 2 1 5,5 9 12 11 1 2 12 10 11 9 2 1 5,5 11 13 10 3 0 - 12 14 10 4 1 5,5 13 14 12 2 1 5,5 14 19 15 4 1 5,5 15 14 12 2 1 5,5 Tučně jsou vytištěna pořadí pro kladné hodnoty rozdíl-medián. SW + = 16,5, SW - = 74,5, n = 13, = 0,05, tabelovaná kritická hodnota = 17, testová statistika = min(SW + , SW - ) = min(16,5; 74,5) = 16,5. Protože 16,5 17, H0 zamítáme na hladině význam- nosti 0,05. 7.4. Dvouvýběrové pořadové testy Jedná se o neparametrickou obdobu dvouvýběrového t-testu. 7.4.1. Dvouvýběrový Wilcoxonův test Nechť X1, ..., Xn a Y1, ..., Ym jsou dva nezávislé náhodné výběry ze dvou spojitých roz- ložení, jejichž distribuční funkce se mohou lišit pouze posunutím. Označme x0,50 medián prv- ního rozložení a y0,50 medián druhého rozložení. Testujeme hypotézu, že distribuční funkce těchto rozložení jsou shodné neboli mediány jsou shodné proti alternativě, že jsou rozdílné. Všech n + m hodnot X1, ..., Xn a Y1, ..., Ym uspořádáme vzestupně podle velikosti. Zjis- tíme součet pořadí hodnot X1, ..., Xn a označíme ho T1. Součet pořadí hodnot Y1, ..., Ym ozna- číme T2. Vypočteme statistiky U1 = mn + n(n+1)/2 ­ T1 , U2 = mn + m(m+1)/2 - T2 . Přitom platí U1 + U2 = mn. Pokud min(U1 ,U2 ) tabelovaná kritická hodnota (pro dané rozsa- hy výběrů m, n a dané ), pak nulovou hypotézu o totožnosti obou distribučních funkcí zamí- táme na hladině významnosti . Pro velká n, m (prakticky n, m > 30) lze využít asymptotické normality statistiky U1. V případě platnosti H0 má statistika 12 )1nm(mn 2 mn 1 0 U U ++ - = asymptoticky rozložení N(0,1). Kritic- ký obor pro oboustrannou alternativu má tvar: W = ( )-- -- ,uu, 2/12/1 . (Analogicky pro jednostranné alternativy.) H0 zamítáme na asymptotické hladině významnosti , když WU0 . Dvouvýběrový Wilcoxonův test se používá v situacích, kdy distribuční funkce rozlože- ní, z nichž dané dva nezávislé náhodné výběry pocházejí, se mohou lišit pouze posunutím. 7.4.2. Příklad Bylo vybráno 10 polí stejné kvality. Na čtyřech z nich se zkoušel nový způsob hnojení, zbylých šest bylo ošetřeno starým způsobem. Pole byla oseta pšenicí a sledoval se její hekta- rový výnos. Je třeba zjistit, zda nový způsob hnojení má týž vliv na průměrné hektarové vý- nosy pšenice jako starý způsob hnojení. hektarové výnosy při novém způsobu: 51 52 49 55 hektarové výnosy při starém způsobu: 45 54 48 44 53 50 Řešení usp. hodnoty 44 45 48 49 50 51 52 53 54 55 pořadí x-ových hodnot 4 6 7 10 pořadí y-ových hodnot 1 2 3 5 8 9 T1 = 4 + 6 + 7 + 10 = 27, T2 = 1 + 2 + 3 + 5 + 8 + 9 = 28 U1 = 4.6 + 4.5/2 - 27 = 7, U2 = 4.6 + 6.7/2 - 28 = 17 Kritická hodnota pro = 0,05, min(4,6) = 4, max(4,6) = 6 je 2. Protože min(7,17) > 2, nemů- žeme na hladině významnosti 0,05 zamítnout hypotézu, že nový způsob hnojení má na hekta- rové výnosy pšenice stejný vliv jako starý způsob. Upozornění: Ve STATISTICE je dvouvýběrový Wilcoxonův test uveden pod názvem Man- nův ­ Whitneyův test. 7.5. Kruskalův ­ Wallisův test a mediánový test (neparametrické obdoby analýzy rozptylu jednoduchého třídění) 7.5.1. Formulace problému Nechť je dáno r 3 nezávislých náhodných výběrů o rozsazích n1, ... , nr . Předpokládá- me, že tyto výběry pocházejí ze spojitých rozložení. Označme n = n1 + ... + nr . Chceme testo- vat hypotézu, že všechny tyto výběry pocházejí z téhož rozložení. 7.5.2. Kruskalův ­ Wallisův test Všech n hodnot seřadíme do rostoucí posloupnosti a určíme pořadí každé hodnoty. Označme Tj součet pořadí těch hodnot, které patří do j-tého výběru, j = 1, ..., r (kontrola: musí platit T1 + ... + Tr = n(n+1)/2). Testová statistika má tvar: = +- + = r 1j j 2 j )1n(3 n T )1n(n 12 Q . Pla- tí-li H0, má statistika Q asymptoticky rozložení 2 (r-1). H0 tedy zamítneme na asymptotické hladině významnosti , když Q 1- 2 (r-1). 7.5.3. Mediánový test Testová statistika má tvar = -= r 1j j 2 j M n n P 4Q , kde Pj je počet hodnot v j-tém výběru, které jsou větší nebo rovny mediánu vypočtenému ze všech n hodnot. Platí-li H0, má statistika QM asymptoticky rozložení 2 (r-1). H0 tedy zamítneme na asymptotické hladině významnosti , když QM 1- 2 (r-1). 7.5.4. Metody mnohonásobného porovnávání Zamítneme-li H0, zajímá nás, které dvojice náhodných výběrů se liší na zvolené hladině významnosti. a) Neményiho metoda Používá se v případě, že všechny výběry mají týž rozsah p. Je-li Tl - Tk tabelovaná kri- tická hodnota (pro dané p, r, ), pak na hladině významnosti zamítáme hypotézu, že l-tý a k-tý výběr pocházejí z téhož rozložení. b) Obecná metoda mnohonásobného porovnávání Jestliže )(h)1n(n n 1 n 1 12 1 TT KW kl kl + +- , pak na hladině významnosti zamítáme hypotézu, že l-tý a k-tý výběr pocházejí z téhož rozložení. Kritickou hodnotu hKW() najdeme ve speciálních statistických tabulkách. Při větších rozsazích výběrů je možno ji nahradit kvan- tilem 1- 2 (r-1). 7.5.5. Příklad V roce 1980 byly získány tři nezávislé výběry obsahující údaje o průměrných ročních příjmech (v tisících dolarů) čtyř sociálních skupin ve třech různých oblastech USA. jižní oblast: 6 10 15 29 pacifická oblast: 11 13 17 131 severovýchodní oblast: 7 14 28 25 Na hladině významnosti 0,05 testujte hypotézu, že příjmy v těchto oblastech se neliší. Zamít- nete-li nulovou hypotézu, vyšetřete, které dvojice výběrů se od sebe liší na hladině význam- nosti 0,05. Řešení Kruskalův ­ Wallisův test Usp.hodnoty 6 7 10 11 13 14 15 17 25 28 29 131 Pořadí 1.výběru 1 3 7 11 Pořadí 2.výběru 4 5 8 12 Pořadí 3.výběru 2 6 9 10 T1 = 22, T2 = 29, T3 = 27 , 5,0133 4 27 4 29 4 22 1312 12 Q 222 =- ++ = , 0,95 2 (2) = 5,991. Protože Q < 5,991, H0 nezamítáme na asymptotické hladině významnosti 0,05. Rozdíly mezi průměrnými ročními příjmy v uvedených třech oblastech se neprokázaly. Mediánový test Medián všech 12 hodnot je 14,5. V 1. výběru leží nad mediánem 2 hodnoty, ve 2. výběru 2 hodnoty, ve 3. výběru 2 hodnoty. Testová statistika ( ) 012222 4 1 4Q 222 M =- ++= , odpo- vídající kvantil 0,95 2 (2) = 5,991. Protože QM < 5,991, H0 nezamítáme na asymptotické hladi- ně významnosti 0,05. Kontrolní otázky 1. V jakých situacích používáme neparametrické testy? 2. Jaká je nevýhoda neparametrických testů oproti testům parametrickým? 3. Jak vypočítáme pořadí čísla v dané posloupnostiu čísel? 4. Popište rozdíl mezi jednovýběrovým a párovým Wilcoxonovým testem. 5. Jaké podmínky musí být splněny pro dvouvýběrový Wilcoxonův test? 6. K čemu slouží Kruskalův-Wallisův test? 7. Jak provedeme mediánový test? 8. Které metody mnohonásobného porovnávání znáte? Příklady 1. U 10 náhodně vybraných vzorků benzínu byly zjištěny následující hodnoty oktanového čísla: 98,2 96,8 96,3 99,8 96,9 98,6 95,6 97,1 97,7 98,0. Na hladině významnosti 0,05 testujte hypotézu, že medián oktanového čísla je 98 proti oboustranné alternativě. Výsledek: Použijeme jednovýběrový Wilcoxonův test. Testová statistika se realizuje hodnotou 12, tabe- lovaná kritická hodnota pro = 0,05 a a = 9 je 5. Protože 12 > 5, H0 nezamítáme na hladině významnosti 0,05. 2. Výrobce určitého výrobku se má rozhodnout mezi dvěma dodavateli polotovarů vyrábějí- cích je různými technologiemi. Rozhodující je procentní obsah určité látky. 1. technologie: 1,52 1,57 1,71 1,34 1,68 2. technologie: 1,75 1,67 1,56 1,66 1,72 1,79 1,64 1,55 Na hladině významnosti 0,05 posuďte pomocí dvouvýběrového Wilcoxonova testu, zda je oprávněný předpoklad, že obě technologie poskytují stejné procento účinné látky. Výsledek: Testová statistika se realizuje hodnotou 12, tabelovaná kritická hodnota pro = 0,05, min(5,8) = 5, max(5,8) = 8 je 6. Protože min(28,12) > 2, nemůžeme na hladině významnosti 0,05 za- mítnout hypotézu, že obě technologie poskytují stejné procento účinné látky. 3. Výrobce koláčů v prášku má 4 nové recepty a chce zjistit, zda se jejich kvalita liší. Upekl proto 5 koláčů z každého druhu a dal je porotě k ohodnocení. recept A: 72 88 70 87 71, recept B: 85 89 86 82 88, recept C: 94 94 88 87 89, recept D: 91 93 92 95 94. Na hladině významnosti 0,05 testujte hypotézu, že recepty se neliší. Výsledek: Použijeme Kruskalův ­ Wallisův test. Všech 20 hodnot uspořádáme vzestupně podle velikosti a stanovíme součet pořadí pro recepty A, B, C, D: T1 = 23,5, T2 = 37,5, T3 = 66, T4 = 83. Tes- tová statistika: 45,12213 5 83 5 66 5 5,37 5 5,23 2120 12 Q 2222 =- +++ = , 0,95 2 (3) = 7,81. Protože Q 7,81, H0 zamítáme na asymptotické hladině významnosti 0,05. Neményiho metoda prokázala, že na hladině významnosti 0,05 se liší recepty A a D. 4. (S) U osmi osob byl změřen systolický krevní tlak před pokusem a po něm. č. osoby 1 2 3 4 5 6 7 8 tlak před 130 185 162 136 147 181 128 139 tlak po 139 190 175 135 155 175 158 149 Na hladině významnosti 0,05 testujte hypotézu, že pokus neovlivní systolický krevní tlak Výsledek: Párový Wilcoxonův test poskytl p-hodnotu 0,04995, tedy H0 zamítáme na hladině význam- nosti 0,05. 5. (S) Majitel obchodu chtěl zjistit, zda velikost nákupů (v dolarech) placených kreditními kartami Master/EuroCard a Visa jsou přibližně stejné. Náhodně vybral 7 nákupů placených Master/EuroCard: 42 77 46 73 78 33 37 a 9 placených Visou: 39 10 119 68 76 126 53 79 102. Lze na hladině významnosti 0,05 tvrdit, že mediány nákupů placených těmito dvěma typy karet se shodují? Výsledek: Dvouvýběrový Wilcoxonův test poskytl p-hodnotu 0,2523, H0 tedy nezamítáme na hladině významnosti 0,05. 6. (S) Z produkce tří podniků vyrábějících televizory bylo vylosováno 10, 8 a 12 kusů. Byly získány následující výsledky zjišťování citlivosti těchto televizorů v mikrovoltech: 1.podnik: 420 560 600 490 550 570 340 480 510 460 2.podnik: 400 420 580 470 470 500 520 530 3.podnik: 450 700 630 590 420 590 610 540 740 690 540 670 Ověřte na hladině významnosti 0,05 hypotézu o shodě úrovně citlivosti televizorů v jednotli- vých podnicích. Výsledek: K-W test poskytl testovou statistiku 3,2043, počet stupňů volnosti = 2, odpovídající p-hodnota = 0,0165, H0 zamítáme na asymptotické hladině významnosti 0,05. Liší se výrobky podniků 2 a 3.