Cvičení 11: Neparametrické úlohy o mediánech Úkol 1.: Párový znaménkový test a párový Wilcoxonův test Při zjišťování kvality jedné složky půdy se používají dvě metody označené A a B. Výsledky: Vzorek 1 2 3 4 5 6 7 8 9 10 11 12 A 0,275 0,312 0,284 0,3 0,365 0,298 0,312 0,315 0,242 0,321 0,335 0,307 B 0,28 0,312 0,288 0,298 0,361 0,307 0,319 0,315 0,242 0,323 0,341 0,315 Na hladině významnosti 0,05 testujte hypotézu, že metody A a B dávají stejné výsledky. Návod: Testujeme H0: z0,50 = 0 proti oboustranné alternativě H1: z0,50 ≠ 0, kde z0,50 je medián rozložení, z něhož pochází rozdílový náhodný výběr Z1 = X1 – Y1, … , Z12 = X12 – Y12. Vypočteme rozdíly mezi výsledky metod A a B: xi – yi: -0,005, 0, -0,004, 0,002, 0,004, -0,009, -0,007, 0, 0, -0,002, -0,006, -0,008 Párový znaménkový test: Nenulových rozdílů je 9, testová statistika SZ + = 2. Ve statistických tabulkách najdeme pro n = 9 a α = 0,05 kritické hodnoty k1 = 1, k2 = 8. Protože kritický obor 81,0W ∪= neobsahuje hodnotu 2, nemůžeme H0 zamítnout na hladině významnosti 0,05. Neprokázalo se tedy, že by metody A a B dávaly rozdílné výsledky. Párový Wilcoxonův test: Absolutní hodnoty nenulových rozdílů uspořádáme vzestupně podle velikosti: Usp. abs(xi – yi): 0,002, 0,002, 0,004, 0,004, 0,005, 0,006, 0,007, 0,008, 0,009 Pořadí 1 2 3 4 5 6 7 8 9 Průměrné pořadí 1,5 1,5 3,5 3,5 5 6 7 8 9 SW + = 1,5 + 3,5 = 5, SW = 1,5 + 3,5 + 5 + 6 + 7 + 8 + 9 = 40, n = 9, α = 0,05, tabelovaná kritická hodnota pro n = 9 a α = 0,05 je 5, testová statistika = min(SW + , SW ) = min(5,40) = 5. Protože 5 ≤ 5, H0 zamítáme na hladině významnosti 0,05. Postup ve STATISTICE: Načteme datový soubor metody AB.sta Provedení párového znaménkového testu: Statistiky – Neparametrická statistika – Porovnání dvou závislých vzorků – OK – 1. seznam proměnných A, 2. seznam proměnných B – OK – Znaménkový test. Znaménkový test (metody AB.sta) Označené testy jsou významné na hladině p <,05000 Dvojice proměnných Počet různých procent v < V Z Úroveň p A & B 9 77,77778 1,333333 0,182422 Vidíme, že nenulových hodnot n = 9. Z nich záporných je 77,78 %, tj. 7. Hodnota testové statistiky SZ + = 9 – 7 = 2. Asymptotická testová statistika U0 (zde označená jako Z) se realizuje hodnotou 1,3333. Odpovídající asymptotická p-hodnota je 0,182422, tedy na asymptotické hladině významnosti 0,05 nezamítáme hypotézu, že obě metody dávají stejné výsledky. Nejsou však splněny předpoklady pro použití asymptotické varianty testu (příliš malý rozsah výběru), i když závěr je stejný jako při testování pomocí kritické hodnoty. Grafické znázornění výsledků: Návrat do Porovnání dvou proměnných – Krabicový graf všech proměnných – Proměnné A, B – OK – ponecháme implicitní nastavení krabicového diagramu – OK. Z krabicových diagramů je vidět, že obě metody se poněkud liší v úrovni, ale neliší se ve variabilitě. Provedení Wilcoxonova testu: Návrat do Porovnání dvou proměnných – Wilcoxonův párový test. Výstupní tabulka poskytne hodnotu testové statistiky (ozn. T), hodnotu asymptotické testové statistiky U0 a p-hodnotu pro U0. (STATISTICA tedy nezohledňuje omezení n ≥ 30 pro použití U0.) Wilcoxonův párový test (metody AB.sta) Označené testy jsou významné na hladině p <,05000 Dvojice proměnných Počet platných T Z Úroveň p A & B 12 5,000000 2,073221 0,038153 V tomto případě je p-hodnota 0,038153, tedy nulová hypotéza se zamítá na asymptotické hladině významnosti 0,05. Nejsou však splněny předpoklady pro použití asymptotické varianty testu (příliš malý rozsah výběru), i když závěr je stejný jako při testování pomocí kritické hodnoty. Úkol 2.: Jednovýběrový znaménkový test a jednovýběrový Wilcoxonův test Vyráběné ocelové tyče mají kolísavou délku s předpokládanou hodnotou mediánu 10 m. Náhodný výběr 10 tyčí poskytl tyto výsledky: 9,83 10,10 9,72 9,91 10,04 9,95 9,82 9,73 9,81 9,90 Na hladině významnosti 0,05 testujte hypotézu, že předpoklad o mediánu délky tyčí je oprávněný. Návod: Testujeme H0: x0,50 = 10 proti oboustranné alternativě H1: x0,50 ≠ 10. Vypočteme rozdíly mezi naměřenými délkami a konstantou 10: xi – 10: -0,17, 0,1, -0,28, -0,09, 0,04, -0,05, -0,18, -0,27, -0,19, -0,1 Jednovýběrový znaménkový test: Nenulových rozdílů je 10, testová statistika SZ + = 2. Ve statistických tabulkách najdeme pro n = 10 a α = 0,05 kritické hodnoty k1 = 1, k2 = 9. Protože kritický obor 10,91,0W ∪= neobsahuje hodnotu 2, H0 nezamítáme na hladině významnosti 0,05. Jednovýběrový Wilcoxonův test: Absolutní hodnoty nenulových rozdílů uspořádáme vzestupně podle velikosti: Usp. abs(xi – yi): 0,04, 0,05, 0,09, 0,1, 0,1, 0,17, 0,18, 0,19, 0,27, 0,28 Pořadí 1 2 3 4 5 6 7 8 9 10 Průměrné pořadí 1 2 3 4,5 4,5 6 7 8 9 10 SW + = 1 + 4,5 = 5,5, SW = 2 + 3 + 4,5 + 6 + 7 + 8 + 9 +10 = 49,5, n = 10, α = 0,05, tabelovaná kritická hodnota pro n = 10 a α = 0,05 je 8, testová statistika = min(SW + , SW ) = min(5,5;49,5) = 5,5. Protože 5,5 ≤ 8, H0 zamítáme na hladině významnosti 0,05. Vidíme, že Wilcoxonův test dospěl k odlišnému závěru než znaménkový test. Postup ve STATISTICE: Načteme datový soubor delka_tyci.sta. Provedení jednovýběrového znaménkového testu: Statistiky – Neparametrická statistika – Porovnání dvou závislých vzorků – OK – 1. seznam proměnných X, 2. seznam proměnných konst – OK – Znaménkový test. Znaménkový test (delka_tyci.sta) Označené testy jsou významné na hladině p <,05000 Dvojice proměnných Počet různých procent v < V Z Úroveň p X & konst 10 80,00000 1,581139 0,113846 Vidíme, že nenulových hodnot n = 10. Z nich záporných je 80 %, tj. 8. Hodnota testové statistiky SZ + = 10 – 8 = 2. Asymptotická testová statistika U0 (zde označená jako Z) se realizuje hodnotou 1,5811. Odpovídající asymptotická p-hodnota je 0,113846, tedy na asymptotické hladině významnosti 0,05 nezamítáme hypotézu, že medián délky tyčí je 10. Nejsou však splněny předpoklady pro použití asymptotické varianty testu (příliš malý rozsah výběru), i když závěr je stejný jako při testování pomocí kritické hodnoty. Provedení Wilcoxonova testu: Návrat do Porovnání dvou proměnných – Wilcoxonův párový test. Výstupní tabulka poskytne hodnotu testové statistiky (ozn. T), hodnotu asymptotické testové statistiky U0 a p-hodnotu pro U0. (STATISTICA tedy nezohledňuje omezení n ≥ 30 pro použití U0.) Wilcoxonův párový test (delka_tyci.sta) Označené testy jsou významné na hladině p <,05000 Dvojice proměnných Počet platných T Z Úroveň p X & konst 10 5,500000 2,242448 0,024933 V tomto případě je p-hodnota 0,0249, tedy nulová hypotéza se zamítá na asymptotické hladině významnosti 0,05. Nejsou však splněny předpoklady pro použití asymptotické varianty testu (příliš malý rozsah výběru), i když závěr je stejný jako při testování pomocí kritické hodnoty. Úkol 3.: Dvouvýběrový Wilcoxonův test Majitel obchodu chtěl zjistit, zda velikost nákupů (v dolarech) placených kreditními kartami Master/EuroCard a Visa jsou přibližně stejné. Náhodně vybral 7 nákupů placených Master/EuroCard: 42 77 46 73 78 33 37 a 9 placených Visou: 39 10 119 68 76 126 53 79 102. Na hladině významnosti 0,05 testujte hypotézu, že velikost nákupů placených těmito dvěma typy karet se shodují. Návod: Na hladině významnosti 0,05 testujeme H0: x0,50 - y0,50 = 0 proti oboustranné alternativě H1: x0,50 - y0,50 ≠ 0. usp. hodnoty 10 33 37 39 42 46 53 68 73 76 77 78 79 102 119 126 pořadí xi 2 3 5 6 9 11 12 pořadí yi 1 4 7 8 10 13 14 15 16 T1 = 2 + 3 + 5 + 6 + 9 + 11 + 12 = 48, T2 = 1 + 4 + 7 + 8 + 10 + 13 + 14 + 15 + 16 = 88 U1 = 7.9 + 7.8/2 - 48 = 43, U2 = 7.9 + 9.10/2 - 88 = 20 Kritická hodnota pro α = 0,05, min(7,9) = 7, max(7,9) = 9 je 12. Protože min(43,20) = 20 > 12, nemůžeme na hladině významnosti 0,05 zamítnout hypotézu, že velikosti nákupů placených kreditními kartami Master/EuroCard a Visa se shodují. Postup ve STATISTICE: Načteme datový soubor kreditni karty.sta. Statistiky – Neparametrická statistika – Porovnání dvou nezávislých vzorků – OK – Proměnné – Seznam závislých proměnných X, Nezáv. (grupov.) proměnná ID – OK – M-W U test. Mann-Whitneyův U Test (w/ oprava na spojitost) (kreditní karty.sta) Dle proměn. ID Označené testy jsou významné na hladině p <,05000 Proměnná Sčt poř. M/E Card Sčt poř. Visa U Z p-hodn. Z upravené p-hodn. N platn. M/E Card N platn. Visa 2*1str. přesné p X 48,00000 88,00000 20,00000 -1,16436 0,244278 -1,16436 0,244278 7 9 0,252273 Ve výstupní tabulce jsou součty pořadí T1, T2, hodnota testové statistiky min(U1, U2) ozn. U, hodnota asymptotické testové statistiky U0 (ozn. Z), p-hodnota pro U0 a přesná p-hodnota (ozn. 2*1str. přesné p – ta se používá pro rozsahy výběrů pod 30). V našem případě přesná p-hodnota = 0,252273, tedy H0 nezamítáme na hladině významnosti 0,05. Výpočet je vhodné doplnit krabicovým diagramem typu Medián/kvartily/rozpětí . Medián 25%-75% Min-MaxM/E Card Visa ID 0 20 40 60 80 100 120 140 X Úkol 4.: Kruskalův – Wallisův test a mediánový test Voda po holení jisté značky se prodává ve čtyřech různých lahvičkách stejného obsahu. Údaje o počtu prodaných lahviček za týden v různých obchodech: 1.typ: 50 35 43 30 62 52 43 57 33 70 64 58 53 65 39 2.typ: 31 37 59 67 44 49 54 62 34 42 40 3.typ: 27 19 32 20 18 23 4.typ: 35 39 37 38 28 33. Posuďte na 5% hladině významnosti, zda typ lahvičky ovlivňuje úroveň prodeje. Návod: Všech 38 hodnot uspořádáme vzestupně podle velikosti a stanovíme součet pořadí hodnot patřících do 1. až 4. výběru. T1 = 379, T2 = 257, T3 = 24, T4 = 81 ∑ = +− + = r 1j j 2 j )1n(3 n T )1n(n 12 Q 79,18393 6 81 6 24 11 257 15 379 3938 12 2222 =⋅−      +++ ⋅ = , ( ) ) ( ) ) )∞=∞χ=∞−χ= α− ,815,7,3,1rW 95,0 2 1 2 Protože WQ ∈ , H0 zamítáme na asymptotické hladině významnosti 0,05. Postup ve STATISTICE: Načteme datový soubor voda po holeni.sta. Statistiky – Neparametrická statistika – Porovnání více nezávislých vzorků - OK – Seznam závislých proměnných X, Nezáv. (grupovací) proměnná typ – OK – Shrnutí: KruskalWallisova ANOVA a mediánový test. Ve dvou výstupních tabulkách se objeví výsledky K-W testu a mediánového testu. Kruskal-Wallisova ANOVA založ. na poř.; X (voda po holeni.sta) Nezávislá (grupovací) proměnná :TYP Kruskal-Wallisův test: H ( 3, N= 38) =18,80199 p =,0003 Závislá: X Kód Počet platných Součet pořadí 1 2 3 4 1 15 379,0000 2 11 257,0000 3 6 24,0000 4 6 81,0000 Mediánový test, celk. medián = 39,5000; X(voda po holeni.sta) Nezávislá (grupovací) proměnná :TYP Chi-Kvadr. = 17,53939 sv = 3 p = ,0005Závislá: X 1 2 3 4 Celkem <= Medián: pozorov. očekáv. poz.-oč. > Medián: pozorov. očekáv. poz.-oč. Celkem: oček. 4,00000 3,00000 6,00000 6,00000 19,00000 7,50000 5,50000 3,00000 3,00000 -3,50000 -2,50000 3,00000 3,00000 11,00000 8,00000 0,00000 0,00000 19,00000 7,50000 5,50000 3,00000 3,00000 3,50000 2,50000 -3,00000 -3,00000 15,00000 11,00000 6,00000 6,00000 38,00000 Oba testy zamítají hypotézu o shodě mediánů v daných čtyřech skupinách, ale K-W test má poněkud nižší p-hodnotu (0,0003), zatímco p-hodnota pro mediánový test je 0,0005). Grafické znázornění výsledků: návrat do Kruskal-Wallisova ANOVA a mediánový test – Krabicový graf – Proměnná X – OK – Typ grafu: Medián/kvartily/Rozpětí – OK. Je vidět, že úroveň prodeje pro 1. typ je nevyšší, zatímco pro 3. typ nejnižší. Nyní provedeme mnohonásobné porovnávání, abychom zjistili, které dvojice typů lahviček se liší na hladině významnosti 0,05: návrat do Kruskal-Wallisova ANOVA a mediánový test, Vícenás. porovnání průměrného pořadí pro vš. sk. Vícenásobné porovnání p hodnot (oboustr.);X(voda po holeni.sta) Nezávislá (grupovací) proměnná :TYP Kruskal-Wallisův test: H ( 3, N= 38) =18,80199 p =,0003 Závislá: X 1 R:25,267 2 R:23,364 3 R:4,0000 4 R:13,500 1 2 3 4 1,000000 0,000447 0,170297 1,000000 0,003579 0,481908 0,000447 0,003579 0,832208 0,170297 0,481908 0,832208 Vidíme, že se liší typy (1, 3) a (2, 3). Úkoly k samostatnému řešení 1. Ve skupině 12 studentů se sledovala srdeční frekvence při změně polohy z lehu do stoje. Získaly se tyto rozdíly počtu tepů srdce za 1 minutu: -2 4 8 25 -5 16 3 1 12 17 20 9. Za předpokladu, že tyto rozdíly mají symetrické rozložení, testujte na hladině významnosti 0,05 hypotézu, že medián rozdílů obou tepových frekvencí je 15 proti oboustranné alternativě. Data jsou uložena v souboru srdecni_frekvence.sta. (Výsledek: přesný i asymptotický znaménkový test nulovou hypotézu nezamítají na hladině významnosti 0,05, avšak asymptotický Wilcoxonův test ano, zatímco přesný nikoli.) 2. Z produkce tří podniků vyrábějících televizory bylo vylosováno 10, 8 a 12 kusů. Byly získány následující výsledky zjišťování citlivosti těchto televizorů v mikrovoltech: 1.podnik: 420 560 600 490 550 570 340 480 510 460 2.podnik: 400 420 580 470 470 500 520 530 3.podnik: 450 700 630 590 420 590 610 540 740 690 540 670 Ověřte na hladině významnosti 0,05 hypotézu o shodě úrovně citlivosti televizorů v jednotlivých podnicích. Data jsou uložena v souboru televizory.sta. (Výsledek: na hladině významnosti 0,05 se liší televizory vyráběné ve 2. a 3. podniku.)