logo-IBA Základy testování hypotéz Přehled a aplikace statistických testů Pokročilé statistické metody 2. cvičení logo-IBA Hypotéza Příklad H0 HA Změní aplikace hnojiva proces růstu rostlin? nezmění změní Je průměrný plat populace 20 000? µ = 20 000,- µ ≠ 20 000,- Liší se úspěšnost u zkoušky mezi muži a ženami? úspěšnost je stejná úspěšnost se liší Došlo po absolvování diety ke změně tělesné váhy? váha se po dietě nezměnila váha se po dietě změnila http://3.bp.blogspot.com/-gFJYEE2N1ys/V__MFZf4nSI/AAAAAAAADz8/bO3T-g4Inls5nlx26a_iR8x5_LpzdHAnwCK4B /s1600/Alternative%2Bvs%2BNull%2BHypothesis.jpg http://3.bp.blogspot.com/-gFJYEE2N1ys/V__MFZf4nSI/AAAAAAAADz8/bO3T-g4Inls5nlx26a_iR8x5_LpzdHAnwCK4B /s1600/Alternative%2Bvs%2BNull%2BHypothesis.jpg Nulová hypotéza HO Alternativní hypotéza HA •Pozorovaný efekt je nulový. •Cílem je zamítnout platnost H0 a přijmout platnost HA. •Pozorovaný efekt není nulový (existuje rozdíl mezi skupinami). •Vyvrací platnost H0. •Tvrzení, které chceme dokázat. logo-IBA Hypotéza logo-IBA Hypotéza logo-IBA Statistická významnost •Informace z dat je kvantifikována pomocí testové statistiky (variabilita dat, efekt = rozdíl mezi skupinami, velikost souboru). •Otázka: Je hodnota testové statistiky dostatečně extrémní, abychom mohli usoudit, že pozorovaný rozdíl není pouze důsledkem náhody? •P-hodnota vyjadřuje pravděpodobnost, že testová statistika nabyde stejné nebo extrémnější hodnoty za předpokladu, že nulová hypotéza platí = cílem je dosáhnout co nejnižší p-hodnoty, jelikož tak minimalizujeme pravděpodobnost, že jsme chybně zamítli H0, která ve skutečnosti platí. •P-hodnotu porovnáme s α (hladina významnosti). Nejčastěji volíme α =0,05, tzn., že připouštíme 5% chybu testu, tedy, že zamítneme H0, i když ve skutečnosti platí). • • ØJe-li p-hodnota ≤ α, zamítáme H0 na hladině významnosti α a přijímáme platnost HA. ØJe-li p-hodnota > α, pak H0 nezamítáme na hladině významnosti α (nepřipouštíme platnost H0). •Malá p-hodnota nemusí znamenat velký efekt. Hodnota testové statistiky a p-hodnota mohou být ovlivněny velkou velikostí vzorku a malou variabilitou pozorovaných dat. •Statistická významnost indikuje, že pozorovaný rozdíl není náhodný, ale nemusí znamenat, že je významný i ve skutečnosti. Důležitá je i praktická (klinická) významnost. logo-IBA Možné chyby při testování hypotéz Závěr testu Hypotézu nezamítáme Hypotézu zamítáme β 1-β 1-α α —I přes dostatečnou velikost vzorku a kvalitní design experimentu se můžeme při rozhodnutí o zamítnutí/nezamítnutí nulové hypotézy dopustit chyby. Správné rozhodnutí Správné rozhodnutí = síla testu schopnost rozpoznat neplatnost hypotézy Chyba II. druhu Pravděpodobnost nerozpoznání neplatné nulové hypotézy Chyba I. druhu Pravděpodobnost nesprávného zamítnutí nulové hypotézy, hladina významnosti logo-IBA Možné chyby při testování hypotéz logo-IBA Jednostranné testy (one-tailed) Oboustranné testy (two-tailed) •Hypotéza testu je postavena asymetricky, tedy ptáme se na větší než / menší. • • •HA testuje pouze jeden směr asociace. •Jednodušší zamítnout H0. •Např.: H0: váha se po dietě nezměnila/vzrostla H1: váha se po dietě snížila •Hypotéza testu se ptá na otázku rovná se / nerovná se. •HA testuje oba směry asociace. •Obtížněji dosáhneme statistické významnosti. H0: HA: H0: HA: H0: HA: One-tailed vs. two-tailed testy logo-IBA Parametrické vs. neparametrické testy Parametrické testy Neparametrické testy •Mají předpoklady o rozložení vstupujících dat (např. normální rozložení). •Při stejném N a dodržení předpokladů mají vyšší sílu testu než testy neparametrické. •Pokud nejsou dodrženy předpoklady parametrických testů, potom jejich síla testu prudce klesá a výsledek testu může být zcela chybný a nesmyslný. •Vyžadují méně předpokladů o rozložení vstupujících dat, lze je tedy použít i při asymetrickém rozložení, odlehlých hodnotách. •Snížená síla těchto testů je způsobena redukcí informační hodnoty původních dat, kdy neparametrické testy nevyužívají původní hodnoty, ale nejčastěji pouze jejich pořadí. •Souvisí s malou velikostí souboru (nejsme schopni normalitu dat ověřit). logo-IBA Základní rozhodování o výběru statistických testů Typ dat Spojitá x spojitá data Spojitá x kategoriální data Kategoriální x kategoriální data Jeden výběr Dva výběry Tři a více výběrů (nepárově) Jeden výběr Více výběrů Párová data Nepárová data Pearsonův korelační koeficient Jednovýběrový t-test Párový t-test Dvouvýběrový t-test ANOVA Párová data Nepárová data Chí-kvadrát test Spearmanův korelační koeficient Wilcoxonův / znaménkový test Wilcoxonův / znaménkový test Mannův-Whitneyho / mediánový t. Kruskalův-Wallisův test / mediánový t. Jednovýběrový binomický test McNemarův test Fisherův exaktní test Parametrické testy Neparametrické testy