logo-IBA
Základy testování hypotéz
Přehled a aplikace statistických testů
Pokročilé statistické metody
2. cvičení

logo-IBA
Hypotéza
Příklad
H0
HA
Změní aplikace hnojiva proces růstu rostlin?
nezmění
změní
Je průměrný plat populace 20 000?
µ = 20 000,-
µ ≠ 20 000,-
Liší se úspěšnost u zkoušky mezi muži a ženami?
úspěšnost je stejná
úspěšnost se liší
Došlo po absolvování diety ke změně tělesné váhy?
váha se po dietě nezměnila
váha se po dietě změnila
http://3.bp.blogspot.com/-gFJYEE2N1ys/V__MFZf4nSI/AAAAAAAADz8/bO3T-g4Inls5nlx26a_iR8x5_LpzdHAnwCK4B
/s1600/Alternative%2Bvs%2BNull%2BHypothesis.jpg
http://3.bp.blogspot.com/-gFJYEE2N1ys/V__MFZf4nSI/AAAAAAAADz8/bO3T-g4Inls5nlx26a_iR8x5_LpzdHAnwCK4B
/s1600/Alternative%2Bvs%2BNull%2BHypothesis.jpg
Nulová hypotéza HO
Alternativní hypotéza HA
•Pozorovaný efekt je nulový.
•Cílem je zamítnout platnost H0 a přijmout platnost HA.
•Pozorovaný efekt není nulový (existuje rozdíl mezi skupinami).
•Vyvrací platnost H0.
•Tvrzení, které chceme dokázat.

logo-IBA
Hypotéza


logo-IBA
Hypotéza


logo-IBA
Statistická významnost
•Informace z dat je kvantifikována pomocí testové statistiky (variabilita dat, efekt = rozdíl mezi
skupinami, velikost souboru).
•Otázka: Je hodnota testové statistiky dostatečně extrémní, abychom mohli usoudit, že pozorovaný
rozdíl není pouze důsledkem náhody?
•P-hodnota vyjadřuje pravděpodobnost, že testová statistika nabyde stejné nebo extrémnější hodnoty
za předpokladu, že nulová hypotéza platí = cílem je dosáhnout co nejnižší p-hodnoty, jelikož tak
minimalizujeme pravděpodobnost, že jsme chybně zamítli H0, která ve skutečnosti platí.
•P-hodnotu porovnáme s α (hladina významnosti). Nejčastěji volíme α =0,05, tzn., že připouštíme 5%
chybu testu, tedy, že zamítneme H0, i když ve skutečnosti platí).
•
•
ØJe-li p-hodnota ≤ α, zamítáme H0 na hladině významnosti α a přijímáme platnost HA.
ØJe-li p-hodnota > α, pak H0 nezamítáme na hladině významnosti α (nepřipouštíme platnost H0).
•Malá p-hodnota nemusí znamenat velký efekt. Hodnota testové statistiky a p-hodnota mohou být
ovlivněny velkou velikostí vzorku a malou variabilitou pozorovaných dat.
•Statistická významnost indikuje, že pozorovaný rozdíl není náhodný, ale nemusí znamenat, že je
významný i ve skutečnosti. Důležitá je i praktická (klinická) významnost.

logo-IBA
Možné chyby při testování hypotéz
Závěr testu
Hypotézu
nezamítáme
Hypotézu
zamítáme
β
1-β
1-α
α
—I přes dostatečnou velikost vzorku a kvalitní design experimentu se můžeme při rozhodnutí o
zamítnutí/nezamítnutí nulové hypotézy dopustit chyby.
Správné rozhodnutí
Správné rozhodnutí = síla testu
schopnost rozpoznat neplatnost hypotézy
Chyba II. druhu
Pravděpodobnost nerozpoznání neplatné nulové hypotézy
Chyba I. druhu
Pravděpodobnost nesprávného zamítnutí nulové hypotézy, hladina významnosti

logo-IBA
Možné chyby při testování hypotéz


logo-IBA
Jednostranné testy (one-tailed)
Oboustranné testy (two-tailed)
•Hypotéza testu je postavena asymetricky, tedy ptáme se na větší než / menší.
•
•
•HA testuje pouze jeden směr asociace.
•Jednodušší zamítnout H0.
•Např.: H0: váha se po dietě nezměnila/vzrostla
 H1: váha se po dietě snížila
•Hypotéza testu se ptá na otázku rovná se / nerovná se.
•HA testuje oba směry asociace.
•Obtížněji dosáhneme statistické významnosti.
H0:
HA:
H0:
HA:
H0:
HA:
 One-tailed vs. two-tailed testy

logo-IBA
Parametrické vs. neparametrické testy
Parametrické testy
Neparametrické testy
•Mají předpoklady o rozložení vstupujících dat (např. normální rozložení).
•Při stejném N a dodržení předpokladů mají vyšší sílu testu než testy neparametrické.
•Pokud nejsou dodrženy předpoklady parametrických testů, potom jejich síla testu prudce klesá a
výsledek testu může být zcela chybný a nesmyslný.
•Vyžadují méně předpokladů o rozložení vstupujících dat, lze je tedy použít i při asymetrickém
rozložení, odlehlých hodnotách.
•Snížená síla těchto testů je způsobena redukcí informační hodnoty původních dat, kdy
neparametrické testy nevyužívají původní hodnoty, ale nejčastěji pouze jejich pořadí.
•Souvisí s malou velikostí souboru (nejsme schopni normalitu dat ověřit).

logo-IBA
Základní rozhodování o výběru statistických testů
Typ dat
Spojitá x spojitá data
Spojitá x kategoriální data
Kategoriální x kategoriální data
Jeden výběr
Dva výběry
Tři a více výběrů (nepárově)
Jeden výběr
Více výběrů
Párová data
Nepárová data
Pearsonův korelační koeficient
Jednovýběrový
t-test
Párový t-test
Dvouvýběrový
t-test
ANOVA
Párová data
Nepárová data
Chí-kvadrát test
Spearmanův korelační koeficient
Wilcoxonův / znaménkový test
Wilcoxonův / znaménkový test
Mannův-Whitneyho / mediánový t.
Kruskalův-Wallisův test / mediánový t.
Jednovýběrový binomický test
McNemarův test
Fisherův exaktní test
Parametrické testy
Neparametrické testy