Příklady na Wilcoxonovy testy Úkol 1.: Párový Wilcoxonův test Při zjišťování kvality jedné složky půdy se používají dvě metody označené A a B. Výsledky: Vzorek 1 2 3 4 5 6 7 8 9 10 11 12 A 0,275 0,312 0,284 0,3 0,365 0,298 0,312 0,315 0,242 0,321 0,335 0,307 B 0,28 0,312 0,288 0,298 0,361 0,307 0,319 0,315 0,242 0,323 0,341 0,315 Na hladině významnosti 0,05 testujte pomocí párového Wilcoxonova testu hypotézu, že metody A a B dávají stejné výsledky. Návod: Načteme datový soubor kvalita_pudy.sta. Proměnná A obsahuje výsledky metody A, proměnná B výsledky metody B. Statistiky – Neparametrická statistika – Porovnání dvou závislých vzorků (proměnné) – OK – 1. seznam proměnných A, 2. seznam proměnných B – OK – Wilcoxonův párový test. Wilcoxonův párový test (kvalita_pudy) Označené testy jsou významné na hladině p <,05000 Dvojice proměnných Počet platných T Z p-hodn. A & B 9 5,000000 2,073221 0,038153 Komentář: Výstupní tabulka poskytne hodnotu testové statistiky SW + (zde označena T), hodnotu asymptotické testové statistiky U0 (zde ozn. Z) a p-hodnotu pro U0. V tomto případě je p-hodnota 0,038153, tedy nulová hypotéza se zamítá na asymptotické hladině významnosti 0,05. Upozornění: V tomto případě není splněna podmínka pro využití asymptotické normality statistiky SW + , tj. n ≥ 30. Je tedy vhodnější najít v tabulkách kritickou hodnotu pro Wilcoxonův párový test (viz skripta Základní statistické metody, tabulka na straně 157). Pro n = 9 a α = 0,05 je kritická hodnota rovna 5. Protože kritický obor 5,0W = obsahuje hodnotu 5, zamítáme H0 na hladině významnosti 0,05. To souhlasí s výsledkem asymptotického testu. Nyní graficky znázorníme výsledky obou metod: Návrat do Porovnání 2 proměnných Krabicový graf všech proměnných – OK – A, B – OK. Krabicový graf Medián 25%-75% Min-Max A B 0,22 0,24 0,26 0,28 0,30 0,32 0,34 0,36 0,38 Komentář: Z krabicových diagramů je vidět, že obě metody se poněkud liší v úrovni, ale neliší se ve variabilitě. Úkol 2.: Jednovýběrový Wilcoxonův test Vyráběné ocelové tyče mají kolísavou délku s předpokládanou hodnotou mediánu 10 m. Náhodný výběr 10 tyčí poskytl tyto výsledky: 9,83 10,10 9,72 9,91 10,04 9,95 9,82 9,73 9,81 9,90 Na hladině významnosti 0,05 testujte hypotézu, že předpoklad o mediánu délky tyčí je oprávněný. Návod: Načteme datový soubor ocelove_tyce.sta. Proměnná X obsahuje naměřené hodnoty a proměnná Y obsahuje konstantu 10. Provedení Wilcoxonova testu je nyní stejné jako v předešlém případě. Wilcoxonův párový test (ocelove_tyce) Označené testy jsou významné na hladině p <,05000 Dvojice proměnných Počet platných T Z Úroveň p X & Y 10 5,500000 2,242448 0,024933 Komentář: Wilcoxonův test dává asymptotickou p-hodnotu 0,024933, tedy nulová hypotéza se zamítá na asymptotické hladině významnosti 0,05. Podobně jak v úkolu 1 by bylo vhodnější najít kritické hodnoty v tabulkách. Kritická hodnota pro n = 10 α = 0,05 je rovna 8. Protože kritický obor 8,0W = obsahuje hodnotu 5,5, zamítáme H0 na hladině významnosti 0,05. I zde tedy existuje soulad mezi výsledkem přesného a asymptotického testu. Podobně jako v úkolu 1. znázorníme výsledky měření pomocí krabicového diagramu: X 9,70 9,75 9,80 9,85 9,90 9,95 10,00 10,05 10,10 10,15 Úkol 3.: Dvouvýběrový Wilcoxonův test Majitel obchodu chtěl zjistit, zda velikost nákupů (v dolarech) placených kreditními kartami Master/EuroCard a Visa jsou přibližně stejné. Náhodně vybral 7 nákupů placených Master/EuroCard: 42 77 46 73 78 33 37 a 9 placených Visou: 39 10 119 68 76 126 53 79 102. Lze na hladině významnosti 0,05 tvrdit, že nákupů placených těmito dvěma typy karet se shodují? Řešení: Načteme datový soubor kreditni_karty.sta. Proměnná X obsahuje hodnoty nákupů, proměnná ID má hodnotu 1 pro kartu Master/EuroCard a hodnotu 2 pro kartu Visa. Statistiky – Neparametrická statistika – Porovnání dvou nezávislých vzorků (skupiny) – OK Seznam závislých proměnných X, Grupovací proměnná ID - OK - Mann – Whitneyův U test. Výstupní tabulka pro dvouvýběrový Wilcoxonův test: Mann-Whitneyův U test (kreditni_karty.sta) Dle proměn. ID Označené testy jsou významné na hladině p <,05000 Proměnná Sčt poř. M/E Card Sčt poř. Visa U Z Úroveň p Z upravené Úroveň p N platn. M/E Card N platn. Visa 2*1str. přesné p X 48,00000 88,00000 20,00000 -1,21729 0,223495 -1,21729 0,223495 7 9 0,252273 Komentář: Zajímá nás především přesná p-hodnota (ozn. 2*1 sided exact p – ta se používá pro rozsahy výběrů pod 30). V našem případě přesná p-hodnota = 0,252273, tedy H0 nezamítáme na hladině významnosti 0,05.