10 Neparametrické testy o mediánech • Předpoklady k použití parametrických testů: — normalita dat — homogenita rozptylů • Závažné porušení předpokladů —> Neparametrické testy — předpoklad pouze o spojitém rozdělení dat — slabší než parametrické testy —> nepravdivou hypotézu zamítají s menší pstí — pořadové testy ... stanovíme pořadí dat a s tímto pořadím dále pracujeme — střední hodnotu nahradíme mediánem —> hypotézy o mediánech. 10.1 Jednovýběrové testy • Nechť Xi,..., Xn je náhodný výběr ze spojitého rozdělení s mediánem xo.50 a c je konstanta. • H0 : X0.50 = c • Hi : xo.50 ŕ c (Hu : xo.05 < c, nebo Hi3 : x0.05 > c) Znaménkový test — SIGN.test(x, md=c, alternative='two.sideď), knihovna PASWR — argument alternativě může nabývat variant 'two.sideď (Hu), 'less' (H12), 'greater' (His) — výstupem: statistika S+, IS, p-hodnota — kritický obor W = (0, ki) U (^2, n) — n je počet nenulových hodnot x — c; ki a &2 —> statistické tabulky pro n Wilcoxonův test — wilcox.test(x, mu=c, alternative='two.sideď, correct=F, exact=F) — argument alternativě může nabývat variant 'two.sideď (Hu), 'less' (H12), 'greater' (H13) — výstupem: statistika S+, IS, p-hodnota — kritický obor (—oo;k) — n je počet nenulových hodnot x — c; k —?► statistické tabulky pro n 10.2 Párové testy • (Xi, Yi),... (Xn, Yn) je náhodný výběr z dvourozměrného spojitého rozdělení • vytvoříme rozdíly Zi = Xi — Yi,..., Zn = Xn — Yn • nový náhodný výběr Zi,..., Zn je ze spojitého rozdělení s mediánem zo.50 a c je konstanta. • Hq : zq.05 = 0 • Hi : zo.05 / 0 (H12 : x0.05 < 0, nebo Hi3 : x0.05 > 0) Znaménkový test — SIGN.test(z, md=0, alternative='two.sided'), knihovna PASWR — argument alternativě může nabývat variant 'two.sideď, 'less', 'greater', podle tvaru Hi — výstupem: statistika S+, IS, p-hodnota — kritický obor W = (0, ki) U (^2, n) — n je počet nenulových hodnot z (resp. x — y); ki a &2 —> statistické tabulky pro n 1 Wilcoxonův test — wilcox.test(z, mu=0, alternative='two.sideď, correct=F, exact=F) — argument alternativě může nabývat variant 'two.sideď, 'less', 'greater', podle tvaru H\ — výstupem: statistika S+, IS, p-hodnota — kritický obor (—oo; k) — n je počet nenulových hodnot z (resp. x — y); k —> statistické tabulky pro n 10.3 Dvouvýběrové testy • Nechť Xi,... Xn a Y\,... Ym jsou dva nezávislé náhodné výběry ze dvou spojitých rozdělení. • ^0.50 • • • medián prvního rozdělení; yo.5 • • • medián druhého rozdělení • n je rozsah prvního výběru, m je rozsah druhého výběru • H0 : x0,5 - í/o.5 = 0 • Hn : x0.5 - ž/o.5 ŕ 0 (#12 : ^0.5 - ž/0.5 < 0; #13 : x0.5 - y0.5 > 0) Wilcoxonův test — wilcox.test(x, y, alternativě = 'two.sideď, correct=F, exact=F) — výstupem: statistika S+, IS, p-hodnota — kritický obor (—00; k); k —?► statistické tabulky pro n a m 10.4 Vícevýběrové testy • Nechť máme r > 2 nezávislých náhodných výběrů, každý ze spojitého rozdělení • Hq : Všechny výběry pochází z téhož rozdělení • H\ : Alespoň jeden výběr pochází z jiného rozdělení Kruskal-Wallisův test — kruskal.test(x, g) — g ... vektor skupin, příslušných danému pozorování 10.5 Metody mnohonásobného porovnávání • Zamítneme-li Hq, že všechny výběry jsou z téhož rozdělení, zajímá nás, která dvojice výběrů se od sebe významně liší • Hq : k-tý a l-tý výběr pochází z téhož rozdělení • H± : k-tý a l-tý výběr nepochází z téhož rozdělení Neményiova metoda — posthoc.kruskal.nemenyi.test(x, group, method='Chisquare') knihovna PMCMR 2