Úvod do statistického testování Co se dá testovat/srovnávat … •1. Chceme srovnávat. –- 1 náhodný výběr s předpokládanou hodnotou –- 2 náhodné výběry mezi sebou -Více náhodných výběrů mezi sebou - •2. Chceme hodnotit změnu náhodné veličiny vzhledem k vnějšímu zásahu. • •3. Chceme rozhodovat o nezávislosti dvou náhodných veličin. • •4. Chceme rozhodovat o charakteru rozdělení náhodné veličiny. Hypotéza Proč nulová hypotéza vyjadřuje nepřítomnost sledovaného efektu …. Co se při rozhodování o platnosti hypotéz může stát Analogie se soudním procesem… Pravděpodobnost výsledků rozhodovacího procesu Testovací statistika •funkce, odvozena na základě předpokládaných vlastností výběrů, které chceme porovnávat • • • •funkce pravděpodobnostní Pozorovaná hodnota – Očekávaná hodnota Variabilita dat Testová statistika = * Velikost vzorku Statistické testy – příklady předpokladů Parametrické a neparametrické testy Jednostranné a oboustranné testy Parametrické testy •Jednovýběrový test Jednovýběrový test Jednovýběrový t-test STATISTICA – jednovýběrový t-test Je délka karet obrovských na Marshallových ostrovech srovnatelná s celosvětovou populací? C:\Users\User\Dropbox\_PHD\Výuka\Analýza dat na PC\4 hodina\Hawaii_turtle_2.JPG C:\Users\User\Dropbox\_PHD\Výuka\Analýza dat na PC\4 hodina\Hawaii_turtle_2.JPG Želvy • • 3 možnosti testování • pomocí intervalu spolehlivosti • pomocí kritické hodnoty • pomocí p-hodnoty H0 = není rozdíl mezi délkou želv na Marshallových ostrovech a délkou celé populace karet obrovských H1 = je rozdíl mezi délkou karet obrovských na MO a celé populace Želvy interval spolehlivosti •Pokud hladina významnosti α = 0,05 –95% IS pro výběrový průměr – – – – – – – – – – – – – – – – – – – – – – – Želvy interval spolehlivosti •IS pro jedovýběrový t-test • • • • • • 120 je v IS – nezamítáme nulovou hypotézu o rovnosti délek kvantil studentova rozložení počet stupňů volnosti http://en.wikipedia.org/wiki/Student's_t-distribution Želvy – kritický obor -2,02 2,02 t-hodnota není v kritickém oboru hodnot – NEZAMÍTÁME NULOVOU HYPOTÉZU p-hodnota Želvy – p-hodnota p-hodnota menší než 0,05 – NEZAMÍTÁME NULOVOU HYPOTÉZU Testy o rovnosti průměru - váhy C:\Users\User\Dropbox\_PHD\Výuka\Analýza dat na PC\5 hodina\obrázek_váhy.jpg Systematická chyba měřicího přístroje se eliminuje nastavením přístroje a měřením etalonu, jehož správná hodnota je µ = 10,00. Nezávislými měřeními za stejných podmínek byly získány hodnoty: 10,24 10,12 9,91 10,19 9,78 10,14 9,86 10,17 10,05, které považujeme za realizace náhodného výběru rozsahu 9 z rozložení N(µ,σ2). Je možné při riziku 0,05 vysvětlit odchylky od hodnoty 10,00 působením náhodných vlivů? *mereni_etalonu.sta Testy o rovnosti průměru – automat Při kontrole balicího automatu, který má plnit cukrem balíčky o hmotnosti 1000 g, byly při přesném převážení 5 balíčků zjištěny tyto odchylky (v gramech) od požadované hodnoty: 3, -2, 2, 0, 1. Na hladině významnosti 0,05 testujte hypotézu, že automat nemá systematickou odchylku od požadované hodnoty. C:\Users\User\Dropbox\_PHD\Výuka\Analýza dat na PC\5 hodina\sugar.jpg Dvouvýběrový t-test - párový