8. cvičení: Neparametrické testy o mediánech Příklad 1.: Při zjišťování kvality jedné složky půdy se používají dvě metody označené A a B. Výsledky: Vzorek 1 2 3 4 5 6 7 8 9 10 11 12 A 0,275 0,312 0,284 0,3 0,365 0,298 0,312 0,315 0,242 0,321 0,335 0,307 B 0,28 0,312 0,288 0,298 0,361 0,307 0,319 0,315 0,242 0,323 0,341 0,315 Na hladině významnosti 0,05 testujte hypotézu, že metody A a B dávají stejné výsledky. Výsledky pro párový znaménkový test: Testová statistika + ZS = 2, počet nenulových rozdílů = 9. Ve statistických tabulkách najdeme pro 9n = a 05,0=α kritické hodnoty 1k1 = , 8k2 = . Protože kritický obor 9,81,0W ∪= neobsahuje hodnotu 2, nemůžeme H0 zamítnout na hladině významnosti 0,05. Neprokázaly se tedy významné rozdíly ve výsledcích obou metod. Výsledky pro párový Wilcoxonův test: Testová statistika = min(SW + , SW ) = min(5,45) = 5. Protože kritický obor 5,0W = obsahuje hodnotu 5, zamítáme H0 na hladině významnosti 0,05. Výpočet pomocí systému STATISTICA: Vytvoříme nový datový soubor se dvěma proměnnými a 12 případy. Do proměnné X napíšeme výsledky metody A, do proměnné Y výsledky metody B. Provedení párového znaménkového testu: Statistiky – Neparametrická statistika – Porovnání dvou závislých vzorků – OK – 1. seznam proměnných X, 2. seznam proměnných Y – OK – Znaménkový test. Znaménkový test (kvalita_pudy.sta) Označené testy jsou významné na hladině p <,05000 Dvojice proměnných Počet různých procent v < V Z p-hodn. X & Y 9 77,77778 1,333333 0,182422 Vidíme, že nenulových hodnot n = 9. Z nich záporných je 7,77 %, tj. 7. Hodnota testové statistiky 279SZ =−= + . Asymptotická testová statistika 0U (zde označená jako Z) se realizuje hodnotou 3,1 . Odpovídající asymptotická p-hodnota je 0,1824, tedy na asymptotické hladině významnosti 0,05 nezamítáme hypotézu, že metody A a B dávají stejné výsledky. Provedení párového Wilcoxonova testu: Statistiky – Neparametrická statistika – Porovnání dvou závislých vzorků (proměnné) – OK – 1. seznam proměnných A, 2. seznam proměnných B – OK – Wilcoxonův párový test. Wilcoxonův párový test (kvalita_pudy.sta) Označené testy jsou významné na hladině p <,05000 Dvojice proměnných Počet platných T Z p-hodn. X & Y 9 5,000000 2,073221 0,038153 Výstupní tabulka poskytne hodnotu testové statistiky SW + (zde označena T), hodnotu asymptotické testové statistiky U0 (zde ozn. Z) a p-hodnotu pro U0. V tomto případě je phodnota 0,038153, tedy nulová hypotéza se zamítá na asymptotické hladině významnosti 0,05. Upozornění: V tomto případě není splněna podmínka pro využití asymptotické normality statistiky SW + , tj. n ≥ 30. Je tedy vhodnější najít v tabulkách kritickou hodnotu pro Wilcoxonův párový test. Pro n = 9 a α = 0,05 je kritická hodnota rovna 5. Protože kritický obor 5,0W = obsahuje hodnotu 5, zamítáme H0 na hladině významnosti 0,05. To souhlasí s výsledkem asymptotického testu. Příklad 2.: Vyráběné ocelové tyče mají kolísavou délku s předpokládanou hodnotou mediánu 10 m. Náhodný výběr 30 tyčí poskytl tyto výsledky: 9,83 10,10 9,72 9,91 10,04 9,95 9,82 9,73 9,81 9,90 10,12 10,01 9,73 9,88 9,79 10,08 10,05 9,91 9,86 9,99 9,85 10,03 9,89 10,09 9,92 9,88 9,78 10,07 10,02 9,98 Na asymptotické hladině významnosti 0,05 testujte hypotézu, že předpoklad o mediánu délky tyčí je oprávněný. Výsledky pro asymptotickou variantu znaménkového testu: Asymptotická testová statistika: 8257,1 1510S U 4 30 4 n 2 n Z 0 −= − = − = + . Kritický obor: W = ( ) ( )∞∪−∞−=∞∪−∞− ,96,196,1,,uu, 975,0975,0 . Testová statistika se nerealizuje v kritickém oboru, tedy nulovou hypotézu nezamítáme na asymptotické hladině významnosti 0,05. Výsledky pro asymptotickou variantu Wilcoxonova testu: 9207,2 5,90S U 24 )1302)(130(30 4 )130(30 24 )1n2)(1n(n 4 )1n(n W 0 = − = − = +⋅+ + ++ ++ . Kritický obor: W = ( ) ( )∞∪−∞−=∞∪−∞− ,96,196,1,,uu, 975,0975,0 . Testová statistika se realizuje v kritickém oboru, tedy nulovou hypotézu zamítáme na asymptotické hladině významnosti 0,05. Příklad 3.: Výrobce určitého výrobku se má rozhodnout mezi dvěma dodavateli polotovarů vyrábějících je různými technologiemi. Rozhodující je procentní obsah určité látky. 1. technologie 1,52 1,57 1,71 1,34 1,68 2. technologie 1,75 1,67 1,56 1,66 1,72 1,79 1,64 1,55 Na hladině významnosti 0,05 posuďte pomocí dvouvýběrového Wilcoxonova testu, zda je oprávněný předpoklad, že obě technologie poskytují stejné procento účinné látky. Výsledek: Testová statistika = 12, kritický obor 6,0W = . Protože testová statistika se nerealizuje v kritickém oboru, nemůžeme na hladině významnosti 0,05 zamítnout hypotézu, že obě technologie poskytují stejné procento účinné látky. Výpočet pomocí systému STATISTICA: Utvoříme nový datový soubor se dvěma proměnnými a 13 případy. Do proměnné X napíšeme zjištěné hodnoty a do proměnné ID napíšeme 5x číslo 1 pro první technologii a 8x číslo 2 pro starý druhou technologii. Statistiky – Neparametrická statistika – Porovnání dvou nezávislých vzorků – OK – Proměnné – Seznam závislých proměnných X, Nezáv. (grupov.) proměnná ID – OK – M-W U test. Upozornění: Ve STATISTICE je dvouvýběrový Wilcoxonův test uveden pod názvem Mannův – Whitneyův test. Proměnná Sčt poř. skup. 1 Sčt poř. skup. 2 U Z Úroveň p Z upravené Úroveň p N platn. skup. 1 N platn. skup. 2 2*1str. přesné p obsah 27,00000 64,00000 12,00000 -1,17108 0,241567 -1,17108 0,241567 5 8 0,284382 Ve výstupní tabulce jsou součty pořadí 21 T,T , hodnota testové statistiky { }21 U,Umin (označená U ), hodnota asymptotické testové statistiky 0U (označená Z), asymptotická phodnota pro 0U a přesná p-hodnota (ozn. 2*1str. přesné p – ta se používá pro rozsahy výběrů pod 30). V našem případě přesná p-hodnota = 0,284382, tedy H0 nezamítáme na hladině významnosti 0,05. Neprokázali jsme rozdíl mezi danými dvěma technologiemi. Výpočet je vhodné doplnit krabicovým diagramem. Medián 25%-75% Min-Max 1 2 ID 1,3 1,4 1,5 1,6 1,7 1,8 1,9 X Je zřejmé, že první technologie poskytuje vesměs nižší procento účinné látky než druhá technologie a také vykazuje poněkud větší variabilitu. Příklad 4.: Na data z příkladu 3. aplikujte dvouvýběrový K-S test. Výpočet pomocí systému STATISTICA: Statistiky – Neparametrická statistika – Porovnání dvou nezávislých vzorků – OK – Proměnné – Seznam závislých proměnných X, Nezáv. (grupov.) proměnná ID – OK – Kolmogorov-Smirnovův 2-výběrový test. Proměnná Max záp rozdíl Max klad rozdíl Úroveň p Průměr skup. 1 Průměr skup. 2 Sm.odch. skup. 1 Sm.odch. skup. 2 N platn. skup. 1 N platn. skup. 2 obsah -0,400000 0,025000 p > .10 1,564000 1,667500 0,147411 0,085147 5 8 Ve výstupní tabulce pro dvouvýběrový K-S test dostaneme maximální záporný a maximální kladný rozdíl mezi hodnotami obou výběrových distribučních funkcí, dolní omezení pro phodnotu (p > 0,1), průměry, směrodatné odchylky a rozsahy obou výběrů. Jelikož p-hodnota převyšuje hladinu významnosti 0,05, na této hladině nelze nulovou hypotézu zamítnout. Příklad 5.: Výrobce koláčů v prášku má 4 nové recepty a chce zjistit, zda se jejich kvalita liší. Upekl proto 5 koláčů z každého druhu a dal je porotě k ohodnocení. recept A: 72 88 70 87 71, recept B: 85 89 86 82 88, recept C: 94 94 88 87 89, recept D: 91 93 92 95 94. Na asymptotické hladině významnosti 0,05 testujte hypotézu, že recepty se neliší. V případě zamítnutí nulové hypotézy zjistěte, které dvojice receptů se liší na asymptotické hladině významnosti 0,05. Výsledek pro K-W test: Testová statistika: 45,12213 5 83 5 66 5 5,37 5 5,23 2120 12 Q 2222 =⋅−        +++ ⋅ = , χ0,95 2 (3) = 7,81. Protože Q ≥ 7,81, H0 zamítáme na asymptotické hladině významnosti 0,05. Výsledek pro mediánový test: Testová statistika ( ) 8,16205421 5 1 4Q 2222 M =−      +++= , odpovídající kvantil χ0,95 2 (3) = 7,81. Protože QM ≥ 7,81, H0 zamítáme na asymptotické hladině významnosti 0,05. Výsledek Neményiho metody mnohonásobného porovnávání: Na asymptotické hladině významnosti 0,05 se liší recepty A a D. Výpočet pomocí systému STATISTICA: Vytvoříme nový datový soubor o dvou proměnných a 20 případech. Do proměnné X napíšeme udělené body, do proměnné ID napíšeme 5x1 pro recept A atd. až 5x4 pro recept D. Statistiky – Neparametrická statistika – Porovnání více nezávislých vzorků - OK – Seznam závislých proměnných nikl, Nezáv. (grupovací) proměnná ID – OK – Summary: KruskalWallis ANOVA & Median test. Ve dvou výstupních tabulkách se objeví výsledky K-W testu a mediánového testu. Kruskal-Wallisova ANOVA založ. na poř.; X (kolace_v_prasku.sta) Nezávislá (grupovací) proměnná : ID Kruskal-Wallisův test: H ( 3, N= 20) =12,54288 p =,0057 Závislá: X Kód Počet platných Součet pořadí Prům. Pořadí A B C D 1 5 23,50000 4,70000 2 5 37,50000 7,50000 3 5 66,00000 13,20000 4 5 83,00000 16,60000 Mediánový test, celk. medián = 88,0000; X (kolace_v_prasku.sta) Nezávislá (grupovací) proměnná : ID Chi-Kvadr. = 11,91919 sv = 3 p = ,0077Závislá: X A B C D Celkem <= Medián: pozorov. očekáv. poz.-oč. > Medián: pozorov. očekáv. poz.-oč. Celkem: oček. 5,00000 4,00000 2,000000 0,00000 11,00000 2,75000 2,75000 2,750000 2,75000 2,25000 1,25000 -0,750000 -2,75000 0,00000 1,00000 3,000000 5,00000 9,00000 2,25000 2,25000 2,250000 2,25000 -2,25000 -1,25000 0,750000 2,75000 5,00000 5,00000 5,000000 5,00000 20,00000 Oba testy zamítají hypotézu o shodě mediánů v daných čtyřech skupinách. K-W test poskytuje p-hodnotu 0,0057, p-hodnota pro mediánový test je 0,0077. Nyní provedeme mnohonásobné porovnávání, abychom zjistili, které dvojice receptů se liší. Zvolíme Vícenás. porovnání průměrného pořadí pro vš. skupiny. Vícenásobné porovnání p hodnot (oboustr.); X (kolace_v_prasku.sta) Nezávislá (grupovací) proměnná : ID Kruskal-Wallisův test: H ( 3, N= 20) =12,54288 p =,0057 Závislá: X A R:4,7000 B R:7,5000 C R:13,200 D R:16,600 A B C D 1,000000 0,138620 0,008824 1,000000 0,765968 0,090075 0,138620 0,765968 1,000000 0,008824 0,090075 1,000000 Tabulka obsahuje p-hodnoty pro porovnání dvojic skupin. Vidíme, že na hladině významnosti 0,05 se liší recepty A, D. Data znázorníme graficky pomocí krabicových diagramů. Krabicový graf dle skupin Proměnná: X Medián 25%-75% Min-Max A B C D ID 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 X