7. Statistické testování Princip testování Chyby p-hodnota Statistické testování – základní pojmy Možné chyby při testování hypotéz — I přes dostatečnou velikost vzorku a kvalitní design experimentu se můžeme při rozhodnutí o zamítnutí/nezamítnutí nulové hypotézy dopustit chyby. Význam chyb při testování hypotéz P-hodnota Významnost hypotézy hodnotíme dle získané tzv. p-hodnoty, která vyjadřuje pravděpodobnost, s jakou číselné realizace výběru podporují H[0], je-li pravdivá. P-hodnotu porovnáme s α (hladina významnosti, stanovujeme ji na 0,05, tzn., že připouštíme 5% chybu testu, tedy, že zamítneme H[0], ačkoliv ve skutečnosti platí). P-hodnotu získáme při testování hypotéz ve statistickém softwaru. — Je-li p-hodnota ≤ α, pak H[0] zamítáme na hladině významnosti α a přijímáme H[A]. — Je-li p-hodnota > α, pak H[0] nezamítáme na hladině významnosti α. P-hodnota vyjadřuje pravděpodobnost za platnosti H[0], s níž bychom získali stejnou nebo extrémnější hodnotu testové statistiky. Statistické testy a normalita dat — Normalita dat je jedním z předpokladů tzv. parametrických testů (testů založených na předpokladu nějakého rozložení) – např. t-testy — Pokud data nejsou normální, neodpovídají ani modelovému rozložení, které je použito pro výpočet (t-rozložení) a test tak může lhát — Řešením je tedy: ¡ Transformace dat za účelem dosažení normality jejich rozložení ¡ Neparametrické testy – tyto testy nemají žádné předpoklady o rozložení dat Shrnutí statistických testů Shrnutí statistických testů Parametrické vs. neparametrické testy One-sample vs. two sample testy Nepárový vs. párový design Normalita dat