Téma 12: Neparametrické úlohy o mediánech Úkol 1.: Párový znaménkový test a párový Wilcoxonův test Při zjišťování kvality jedné složky půdy se používají dvě metody označené A a B. Výsledky: Vzorek 1 2 3 4 5 6 7 8 9 10 11 12 A 0,275 0,312 0,284 0,3 0,365 0,298 0,312 0,315 0,242 0,321 0,335 0,307 B 0,28 0,312 0,288 0,298 0,361 0,307 0,319 0,315 0,242 0,323 0,341 0,315 Na hladině významnosti 0,05 testujte hypotézu, že metody A a B dávají stejné výsledky. Návod: Testujeme H0: z0,50 = 0 proti oboustranné alternativě H1: z0,50 0, kde z0,50 je medián rozložení, z něhož pochází rozdílový náhodný výběr Z1 = X1 - Y1, ... , Z12 = X12 - Y12. Vypočteme rozdíly mezi výsledky metod A a B: xi - yi: -0,005, 0, -0,004, 0,002, 0,004, -0,009, -0,007, 0, 0, -0,002, -0,006, -0,008 Párový znaménkový test: Nenulových rozdílů je 9, testová statistika SZ + = 2. Ve statistických tabulkách najdeme pro n = 9 a = 0,05 kritické hodnoty k1 = 1, k2 = 8. Protože kritický obor 81,0W = neobsahuje hodnotu 2, nemůžeme H0 zamítnout na hladině významnosti 0,05. Znamená to, že s rizikem omylu nejvýše 0,05 metody A a B dávají stejné výsledky. Párový Wilcoxonův test: Absolutní hodnoty nenulových rozdílů uspořádáme vzestupně podle velikosti: Usp. abs(xi - yi): 0,002, 0,002, 0,004, 0,004, 0,005, 0,006, 0,007, 0,008, 0,009 Pořadí 1 2 3 4 5 6 7 8 9 Průměrné pořadí 1,5 1,5 3,5 3,5 5 6 7 8 9 SW + = 1,5 + 3,5 = 5, SW - = 1,5 + 3,5 + 5 + 6 + 7 + 8 + 9 = 40, n = 9, = 0,05, tabelovaná kritická hodnota pro n = 9 a = 0,05 je 5, testová statistika = min (SW +, SW -) = min(5,40) = 5. Protože 5 5, H0 zamítáme na hladině významnosti 0,05. Postup ve STATISTICE: Vytvoříme nový datový soubor se dvěma proměnnými A a B a 12 případy. Do proměnné A napíšeme výsledky metody A, do proměnné B výsledky metody B. Provedení párového znaménkového testu: Statistiky - Neparametrická statistika - Porovnání dvou závislých vzorků - OK - 1. seznam proměnných A, 2. seznam proměnných B - OK Znaménkový test. Znaménkový test (metody AB.sta) Označené testy jsou významné na hladině p <,05000 Dvojice proměnných Počet různých procent v < V Z Úroveň p A & B 9 77,77778 1,333333 0,182422 Vidíme, že nenulových hodnot n = 9. Z nich záporných je 77,78%, tj. 7. Hodnota testové statistiky SZ + = 9 - 7 = 2. Asymptotická testová statistika U0 (zde označená jako Z) se realizuje hodnotou 1,3333. Odpovídající asymptotická p-hodnota je 0,182422, tedy na asymptotické hladině významnosti 0,05 nezamítáme hypotézu, že obě metody dávají stejné výsledky. Grafické znázornění výsledků: Návrat do Porovnání dvou proměnných - Krabicový graf všech proměnných - Proměnné X, Y - OK - ponecháme implicitní nastavení krabicového diagramu - OK. Z krabicových diagramů je vidět, že obě metody se poněkud liší v úrovni, ale neliší se ve variabilitě. Provedení Wilcoxonova testu: Návrat do Porovnání dvou proměnných - Wilcoxonův párový test. Výstupní tabulka poskytne hodnotu testové statistiky (ozn. T), hodnotu asymptotické testové statistiky U0 a p-hodnotu pro U0. (STATISTICA tedy nezohledňuje omezení n 30 pro použití U0.) Wilcoxonův párový test (metody AB.sta) Označené testy jsou významné na hladině p <,05000 Dvojice proměnných Počet platných T Z Úroveň p A & B 12 5,000000 2,073221 0,038153 V tomto případě je p-hodnota 0,038153, tedy nulová hypotéza se zamítá na asymptotické hladině významnosti 0,05. Ze srovnání p-hodnot pro znaménkový test a pro Wilcoxonův test plyne, že Wilcoxonův test je silnější. Úkol 2.: Jednovýběrový znaménkový test a jednovýběrový Wilcoxonův test Vyráběné ocelové tyče mají kolísavou délku s předpokládanou hodnotou mediánu 10 m. Náhodný výběr 10 tyčí poskytl tyto výsledky: 9,83 10,10 9,72 9,91 10,04 9,95 9,82 9,73 9,81 9,90 Na hladině významnosti 0,05 testujte hypotézu, že předpoklad o mediánu délky tyčí je oprávněný. Návod: Testujeme H0: x0,50 = 10 proti oboustranné alternativě H1: x0,50 10. Vypočteme rozdíly mezi naměřenými délkami a konstantou 10: xi - 10: -0,17, 0,1, -0,28, -0,09, 0,04, -0,05, -0,18, -0,27, -0,19, -0,1 Jednovýběrový znaménkový test: Nenulových rozdílů je 10, testová statistika SZ + = 2. Ve statistických tabulkách najdeme pro n = 10 a = 0,05 kritické hodnoty k1 = 1, k2 = 9. Protože kritický obor 10,91,0W = neobsahuje hodnotu 2, H0 nezamítáme na hladině významnosti 0,05. Párový Wilcoxonův test: Absolutní hodnoty nenulových rozdílů uspořádáme vzestupně podle velikosti: Usp. abs(xi - yi): 0,04, 0,05, 0,09, 0,1, 0,1, 0,17, 0,18, 0,19, 0,27, 0,28 Pořadí 1 2 3 4 5 6 7 8 9 10 Průměrné pořadí 1 2 3 4,5 4,5 6 7 8 9 10 SW + = 1 + 4,5 = 5,5, SW - = 2 + 3 + 4,5 + 6 + 7 + 8 + 9 +10 = 49,5, n = 10, = 0,05, tabelovaná kritická hodnota pro n = 10 a = 0,05 je 8, testová statistika = min (SW +, SW -) = min(5,5;49,5) = 5,5. Protože 5,5 8, H0 zamítáme na hladině významnosti 0,05. Vidíme, že Wilcoxonův test dospěl k odlišnému závěru než znaménkový test. Postup ve STATISTICE: Vytvoříme nový datový soubor se dvěma proměnnými X a konst a 10 případy. Do proměnné X napíšeme měřené délky tyčí, do proměnné konst uložíme číslo 10. Provedení jednovýběrového znaménkového testu: Statistiky - Neparametrická statistika Porovnání dvou závislých vzorků - OK - 1. seznam proměnných X, 2. seznam proměnných konst - OK - Znaménkový test. Znaménkový test (delka_tyci.sta) Označené testy jsou významné na hladině p <,05000 Dvojice proměnných Počet různých procent v < V Z Úroveň p X& konst 10 80,00000 1,581139 0,113846 Vidíme, že nenulových hodnot n = 10. Z nich záporných je 80%, tj. 7. Hodnota testové statistiky SZ + = 10 - 8 = 2. Asymptotická testová statistika U0 (zde označená jako Z) se realizuje hodnotou 1,5811. Odpovídající asymptotická p-hodnota je 0,113846, tedy na asymptotické hladině významnosti 0,05 nezamítáme hypotézu, že medián délky tyčí je 10 Provedení Wilcoxonova testu: Návrat do Porovnání dvou proměnných - Wilcoxonův párový test. Výstupní tabulka poskytne hodnotu testové statistiky (ozn. T), hodnotu asymptotické testové statistiky U0 a p-hodnotu pro U0. (STATISTICA tedy nezohledňuje omezení n 30 pro použití U0.) Wilcoxonův párový test (delka_tyci.sta) Označené testy jsou významné na hladině p <,05000 Dvojice proměnných Počet platných T Z Úroveň p X& konst 10 5,500000 2,242448 0,024933 V tomto případě je p-hodnota 0,0249, tedy nulová hypotéza se zamítá na asymptotické hladině významnosti 0,05. Úkol 3.: Dvouvýběrový Wilcoxonův test Majitel obchodu chtěl zjistit, zda velikost nákupů (v dolarech) placených kreditními kartami Master/EuroCard a Visa jsou přibližně stejné. Náhodně vybral 7 nákupů placených Master/EuroCard: 42 77 46 73 78 33 37 a 9 placených Visou: 39 10 119 68 76 126 53 79 102. Lze na hladině významnosti 0,05 tvrdit, že velikost nákupů placených těmito dvěma typy karet se shodují? Návod: Na hladině významnosti 0,05 testujeme H0: x0,50 - y0,50 = 0 proti oboustranné alternativě H1: x0,50 - y0,50 0. usp. hodnoty 10 33 37 39 42 46 53 68 73 76 77 78 79 102 119 126 pořadí xi 2 3 5 6 9 11 12 pořadí yi 1 4 7 8 10 13 14 15 16 T1 = 2 + 3 + 5 + 6 + 9 + 11 + 12 = 48, T2 = 1 + 4 + 7 + 8 + 10 + 13 + 14 + 15 + 16 = 88 U1 = 7.9 + 7.8/2 - 48 = 43, U2 = 7.9 + 9.10/2 - 88 = 20 Kritická hodnota pro = 0,05, min(7,9) = 7, max(7,9) = 9 je 12. Protože min(43,20) = 20 > 12, nemůžeme na hladině významnosti 0,05 zamítnout hypotézu, že velikosti nákupů placených kreditními kartami Master/EuroCard a Visa se shodují. Postup ve STATISTICE: Utvoříme nový datový soubor se dvěma proměnnými a 17 případy. Do proměnné X napíšeme zjištěné hodnoty nákupů a do proměnné ID napíšeme 7x číslo 1 pro kartu Master/EuroCard a 9x číslo 2 pro kartu Visa. Statistiky - Neparametrická statistika - Porovnání dvou nezávislých vzorků - OK - Proměnné Seznam závislých proměnných X, Nezáv. (grupov.) proměnná ID - OK - M-W U test. Mann-Whitneyův U test (kreditní karty.sta) Dle proměn. ID Označené testy jsou významné na hladině p <,05000 Proměnná Sčt poř. M/E Card Sčt poř. Visa U Z Úroveň p Z upravené Úroveň p N platn. M/E Card N platn. Visa 2*1str. přesné p X 48,00000 88,00000 20,00000 -1,21729 0,223495 -1,21729 0,223495 7 9 0,252273 Ve výstupní tabulce jsou součty pořadí T1, T2, hodnota testové statistiky min(U1, U2) ozn. U, hodnota asymptotické testové statistiky U0 (ozn. Z), p-hodnota pro U0 a přesná p-hodnota (ozn. 2 *1str. přesné p - ta se používá pro rozsahy výběrů pod 30). V našem případě přesná p-hodnota = 0,252273, tedy H0 nezamítáme na hladině významnosti 0,05. Výpočet je vhodné doplnit krabicovým diagramem typu Median/Quart/Range . Medián 25%-75% Min-MaxM/E Card Visa ID 0 20 40 60 80 100 120 140 X Úkol 4.: Kruskalův - Wallisův test a mediánový test Voda po holení jisté značky se prodává ve čtyřech různých lahvičkách stejného obsahu. Údaje o počtu prodaných lahviček za týden v různých obchodech: 1.typ: 50 35 43 30 62 52 43 57 33 70 64 58 53 65 39 2.typ: 31 37 59 67 44 49 54 62 34 42 40 3.typ: 27 19 32 20 18 23 4.typ: 35 39 37 38 28 33. Posuďte na 5% hladině významnosti, zda typ lahvičky ovlivňuje úroveň prodeje. Návod: Všech 38 hodnot uspořádáme vzestupně podle velikosti a stanovíme součet pořadí hodnot patřících do 1. až 4. výběru. T1 = 379, T2 = 257, T3 = 24, T4 = 81 = +- + = r 1j j 2 j )1n(3 n T )1n(n 12 Q 79,18393 6 81 6 24 11 257 15 379 3938 12 2222 =- +++ = , ( ) ) ( ) ) )==-= - ,815,7,3,1rW 95,0 2 1 2 Protože WQ , H0 zamítáme na asymptotické hladině významnosti 0,05. Postup ve STATISTICE: Vytvoříme nový datový soubor o dvou proměnných X a typ a 38 případech. Do proměnné X napište zjištěné údaje o prodeji, do proměnné typ 15 x jedničku, 11 x dvojku, 6 x trojku a 6 x čtyřku. Statistiky - Neparametrická statistika - Porovnání více nezávislých vzorků - OK - Seznam závislých proměnných X, Nezáv. (grupovací) proměnná typ - OK - Shrnutí: Kruskal-Wallisova ANOVA a mediánový test. Ve dvou výstupních tabulkách se objeví výsledky K-W testu a mediánového testu. Kruskal-Wallisova ANOVA založ. na poř.; X (voda po holeni.sta) Nezávislá (grupovací) proměnná :TYP Kruskal-Wallisův test: H ( 3, N= 38) =18,80199 p =,0003 Závislá: X Kód Počet platných Součet pořadí 1 2 3 4 1 15 379,0000 2 11 257,0000 3 6 24,0000 4 6 81,0000 Mediánový test, celk. medián = 39,5000; X (voda po holeni.sta) Nezávislá (grupovací) proměnná :TYP Chi-Kvadr. = 17,53939 sv = 3 p = ,0005Závislá: X 1 2 3 4 Celkem <= Medián: pozorov. očekáv. poz.-oč. > Medián: pozorov. očekáv. poz.-oč. Celkem: oček. 4,00000 3,00000 6,00000 6,00000 19,00000 7,50000 5,50000 3,00000 3,00000 -3,50000 -2,50000 3,00000 3,00000 11,00000 8,00000 0,00000 0,00000 19,00000 7,50000 5,50000 3,00000 3,00000 3,50000 2,50000 -3,00000 -3,00000 15,00000 11,00000 6,00000 6,00000 38,00000 Oba testy zamítají hypotézu o shodě mediánů v daných čtyřech skupinách, ale K-W test je poněkud silnější (p-hodnota = 0,0003, zatímco p-hodnota pro mediánový test je 0,0005). Grafické znázornění výsledků: návrat do Kruskal-Wallisova ANOVA a mediánový test Krabicový graf - Proměnná X - OK - Typ grafu: Medián/kvartily/Rozpětí - OK. Je vidět, že úroveň prodeje pro 1. typ je nevyšší, zatímco pro 3. typ nejnižší. Dále je možno vytvořit histogramy proměnné X ve všech čtyřech skupinách: návrat do KruskalWallisova ANOVA a mediánový test - Kategoriz. histogram - Proměnná X - OK. Nyní provedeme mnohonásobné porovnávání, abychom zjistili, které dvojice typů lahviček se liší na hladině významnosti 0,05: návrat do Kruskal-Wallisova ANOVA a mediánový test, Vícenás. porovnání průměrného pořadí pro vš. sk. Vícenásobné porovnání p hodnot (oboustr.);X (voda po holeni.sta) Nezávislá (grupovací) proměnná :TYP Kruskal-Wallisův test: H ( 3, N= 38) =18,80199 p =,0003 Závislá: X 1 R:25,267 2 R:23,364 3 R:4,0000 4 R:13,500 1 2 3 4 1,000000 0,000447 0,170297 1,000000 0,003579 0,481908 0,000447 0,003579 0,832208 0,170297 0,481908 0,832208 Vidíme, že se liší typy (1, 3) a (2, 3). Úkoly k samostatnému řešení 1. Ve skupině 12 studentů se sledovala srdeční frekvence při změně polohy z lehu do stoje. Získaly se tyto rozdíly počtu tepů srdce za 1 minutu: -2 4 8 25 -5 16 3 1 12 17 20 9. Za předpokladu, že tyto rozdíly mají symetrické rozložení, testujte na hladině významnosti 0,05 hypotézu, že medián rozdílů obou tepových frekvencí je 15 proti oboustranné alternativě. (Výsledek: znaménkový a Wilcoxonův test nulovou hypotézu nezamítají na hladině významnosti 0,05, avšak asymptotická varianta Wilcoxonova testu ano.) 2. Z produkce tří podniků vyrábějících televizory bylo vylosováno 10, 8 a 12 kusů. Byly získány následující výsledky zjišťování citlivosti těchto televizorů v mikrovoltech: 1.podnik: 420 560 600 490 550 570 340 480 510 460 2.podnik: 400 420 580 470 470 500 520 530 3.podnik: 450 700 630 590 420 590 610 540 740 690 540 670 Ověřte na hladině významnosti 0,05 hypotézu o shodě úrovně citlivosti televizorů v jednotlivých podnicích. (Výsledek: na hladině významnosti 0,05 se liší televizory vyráběné ve 2. a 3. podniku.)