10. Ověřování předpokladů parametrických testů Normalita dat -Normální rozložení vstupních dat – klíčový předpoklad pro použití parametrických metod -Pokud data nejsou normální, neodpovídají ani modelovému rozložení, které je použito pro výpočet (t‐rozložení) a test tak může lhát -Řešení: -a) transformace dat -b) neparametrické metody - - - Parametrické a neparametrické testy Typ srovnání Parametrický test Neparametrický test 2 skupiny dat nepárově Nepárový t-test Mann-Whitney test 2 skupiny dat párově Párový t-test Wilcoxonův test, znaménkový test Více skupin nepárově ANOVA Kruskal-Wallis ANOVA Korelace Pearsonův koeficient Spearmanův koeficient Testy normality -H0: není rozdíl mezi zpracovávaným rozložením a normálním rozložením -Kombinovat test a grafickou reprezentaci zkoumaných dat -Testy: -Test dobré shody -Kolmogorov-Smirnov test (K-S test, Lilieforsův test) -Shapiro-Wilk’s test - - - Šikmost a špičatost Grafická diagnostika normality - histogram Grafická diagnostika normality - Normální graf Test shody rozptylů -F-test -H0: σ12 = σ22 -H1: σ12 σ22 - » v čitateli je větší z obou s2! » » » - - -F má Fisher-Snedecorovo (F) rozdělení se dvěma parametry: stupni volnosti čitatele a jmenovatele -H0 zamítáme pro - 11. Neparametrické metody Neparametrické metody -Parametrické metody – předpoklady o rozložení dat -Neparametrické metody – nepředpokládají konkrétní rozložení -Pro data nevyhovující předpokladům parametrických metod -Ordinální data, pořadí nebo četnosti -Mohou vyžadovat velmi obecné předpoklady na rozložení dat výběru – např. symetrie -Slabší než odpovídající parametrické testy - - - Pořadí -Reálná čísla uspořádaná podle velikosti x1, x2, … xn -Pro různá čísla je pořadí čísla xi dáno indexem i -Pořadí Ri udává počet čísel x1, x2, … xn, která jsou menší nebo rovna číslu xi - -Čísla x1, x2, … xn nejsou různá, vytvářejí shody => průměrné pořadí - • - - Vzestupně uspořádané hodnoty xi -2 0 5 7 18 Pořadí Ri 1 2 3 4 5 Vzestupně uspořádané hodnoty xi -5 -5 0 0 0 10 21 21 Očíslování hodnot xi 1 2 3 4 5 6 7 8 Pořadí Ri 1,5 1,5 4 4 4 6 7,5 7,5 Kvantilový test • H0: xq = c -100q% kvantil základního souboru xq je roven konstantě c -Z rozsahu výběru n stanovíme počet členů m, kde x 30 a 0,10 < q < 0,90 - - Kvantilový test -Kritická hodnota: z1-α/2 = kvantil standardizovaného normálního rozložení -H0 zamítáme pro - -Kritická hodnota: zα -H0 zamítáme pro - -Kritická hodnota: z1-α -H0 zamítáme pro Mediánový test -q = 0,50 - Mediánový test - příklad •Ve skupině 49 chlapců ve věku 9,5-10 let dispenzarizovaných v roce 1960 po dobu •nejméně čtyř let pro jisté onemocnění bylo nalezeno 27 chlapců menších než •138,5 cm, kde 138,5 cm je zjištěný průměr tělesné výšky v populaci chlapců •stejného věku při celostátním šetření. Ověřte na 5% hladině významnosti, zda •u nemocných dětí je průměrná výška menší než v odpovídající věkové skupině •zdravých dětí. •Řešení: H0: x0,50 = 138,5; H1: x0,50 < 138,5 • • • •Pro jednostrannou alternativu a α=0,05 je kvantil z1-α=1,645 •Na 5% hladině významnosti nelze zamítnout nulovou hypotézu => naše pozorování •neprokázalo, že onemocnění brzdí růst dětí • Znaménkový test -Mediánový test pro rozdíly párových pozorování -Jednoduchý, ale velmi slabý -Pro alespoň ordinální stupnici -Testová statistika: počet znamének vyskytujících se méně často nebo stejná jako pro mediánový test Znaménkový test - příklad • U skupiny 15 dětí byla měřena frekvence mrkání oka v klidové situaci (při volné hře) a při sledování napínavého televizního programu. Máme rozhodnout, zda při sledování napínavého televizního programu je frekvence mrkání oka vyšší než v klidové situaci. Dítě číslo Frekvence mrkání oka Změna V klidu Při sledování TV 1 10 11 + 2 8 10 + 3 9 8 - 4 15 14 - 5 12 13 + 6 13 15 + 7 11 13 + 8 14 12 - 9 10 11 + 10 11 13 + 11 12 14 + 12 13 14 + 13 17 16 - 14 16 19 + 15 12 15 + H0: mezi frekvencí mrkání oka v klidové situaci a frekvencí mrkání oka při sledování napínavého programu není rozdíl (x0,50 = 0) H1: Frekvence mrkání oka je při sledování napínavého televizního programu vyšší než v klidové situaci (x0,50 > 0) α = 0,05; zα = -1,645 Z = -1,81 < -1,645 => zamítáme H0 Wilcoxonův párový test -Obdoba párového t-testu -Při nesplnění předpokladu normality rozdílů -H0: medián rozdílů je nulový (není systematická diference uvnitř párů) -H1: medián rozdílů je různý od nuly (je systematická diference uvnitř párů) -Stanovení rozdílů, přiřazení pořadí bez ohledu na znaménko -Testová statistika = min(T+, T-) – T+ - součet kladných pořadí, T- - součet záporných pořadí - - - Wilcoxonův párový test -Oboustranný test: H0 zamítáme -pro min(T+,T-) < Tα,n Wilcoxonův párový test - příklad Osmi rostlinám tabáku byl odebrán druhý list. Jedna náhodně vybraná polovina listu byla ošetřena přípravkem A, druhá přípravkem B. Potom byly listy potřeny suspenzí agresora a byl sledován počet skvrn na každé polovině. Uspořádáme rozdíly: T- = 2 T+ = 34 min(T-,T+ ) = 2 Počet nenulových rozdílů je n = 8; pro α = 0,05 je kritická hodnota 3 min(T-,T+ ) = 2 < 3 => zamítáme hypotézu stejné účinnosti přípravků A a B Mann-Whitney U test -Někdy název dvouvýběrový Wilcoxonův test -Obdoba dvouvýběrového t-testu -H0: rozdělení obou skupin je shodné -H1: rozdělení obou skupin se liší -Kombinace obou výběrů, vzestupné seřazení hodnot, stanovení pořadí jednotlivých pozorování, stejným hodnotám dáváme průměrné pořadí - Mann-Whitney U test -Si – součet pořadí v souboru i -ni – počet prvků v souboru i -U1 + U2 = n1n2 -min(U1,U2) porovnáváme s kritickou hodnotou -Pro min(U1,U2) < kritická hodnota zamítáme H0 Mann-Whitney U test -Pro n1 > 30 a n2 > 20 lze použít normální aproximaci - - - - -Kritickou hodnotou je kvantil standardizovaného normálního rozdělení -H0 zamítáme pro - Mann-Whitney U test - příklad •Výkon 18 gymnastek byl ohodnocen stanovením jejich pořadí od nejlepší (pořadí 1) po nejslabší (pořadí 18). V této skupině bylo n1 = 11 žákyň trenérky A a n2 = 7 žákyň trenérky B. Na základě výsledků (pořadí) shrnutých v tabulce se má posoudit nulová hypotéza H0: „účinnost výukových metod obou trenérek se neliší“ - A B 1 2 4 3 5 6 7 9 8 12 10 15 11 18 13 14 16 17 Trenérka: n1 = 11 n2 = 7 S1 = 106 S2 = 65 Min(U1,U2) = 37 U0,05(7,11) = 16 37 > 16 => nelze zamítnout H0, že účinnost výukových metod obou trenérek se neliší