Matematika IV - 13. přednáška Bodové a intervalové odhady, testování hypotéz ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ /potéz oooooo Michal Bulant Masarykova univerzita Fakulta informatiky 17. 5. 2010 Náhodný výběr Bodové a intervalové odhady Testovaní hypotéz oooooo ooooooooooooo oooooooooooooo Obsah přednášky Náhodný výběr Bodové a intervalové odhady Testovaní hypotéz Náhodný výběr oooooo Bodové a intervalové odhady ooooooooooooo Testovaní hypotéz oooooooooooooo Doporučené zdroje • Martin Panák, Jan Slovák, Drsná matematika, e-text. • Karel Zvára, Josef Štěpán, Pravděpodobnost a matematická statistika, Matfyzpress, 4. vydání, 2006, 230 stran, ISBN 80-867-3271-1. • Marie Budíková, Štěpán Mikoláš, Pavel Osecký, Popisná statistika, Masarykova univerzita, 3. vydání, 2002, 48 stran, ISBN 80-210-1831-3. • Marie Budíková, Štěpán Mikoláš, Pavel Osecký, Teorie pravděpodobnosti a matematická statistika (sbírka příkladů), Masarykova univerzita, 3. vydání, 2004, 117 stran, ISBN 80-210-3313-4. Náhodný výběr Bodové a intervalové odhady Testovaní hypotéz oooooo ooooooooooooo oooooooooooooo Plán přednášky Náhodný výběr Bodové a intervalové odhady Náhodný výběr •ooooo Bodové a intervalové odhady ooooooooooooo Testovaní hypotéz oooooooooooooo Základní statistiky Nechť Xl,... , X„ je náhodný výběr. (Náhodným výběrem rozsahu n rozumíme n-tici nezávislých a stejně rozdělených náhodných veličin X\,... ,X„ ~ Fx(x)). Náhodný výběr •ooooo Bodové a intervalové odhady ooooooooooooo Testovaní hypotéz oooooooooooooo Základní statistiky Nechť Xl,... , X„ je náhodný výběr. (Náhodným výběrem rozsahu n rozumíme n-tici nezávislých a stejně rozdělených náhodných veličin X\,... ,X„ ~ Fx(x)). Statistiku M = Yľi=i^i nazýváme výběrový průměr, statistiku S2 = l^í Eľ=i(x'' " Mf výběrový rozptyl a statistiku S = VŠ* výběrová směrodatná odchylka. Analogicky se definují i výběrová kovariance, příp. výběrový korelační koeficient pro dvourozměrný náhodný výběr. Náhodný výběr •ooooo Základní statistiky Nechť Xl,... , X„ je náhodný výběr. (Náhodným výběrem rozsahu n rozumíme n-tici nezávislých a stejně rozdělených náhodných veličin X\,... ,X„ ~ Fx(x)). Statistiku M = ^"=1X; nazýváme výběrový průměr, statistiku S2 = T^T Eľ=i(x'' " Mf výběrový rozptyl a statistiku S = VŠ* výběrová směrodatná odchylka. Analogicky se definují i výběrová kovariance, příp. výběrový korelační koeficient pro dvourozměrný náhodný výběr. Věta Necht Xi,.. ., Xn je náhodný výběr rozsahu n z rozdělení se střední hodnotou [i a rozptylem a2 . Pak platí: » E(M) -- = li, • D(M) -. = var(M) = a2/n, • E (S2) = = <72. Testovaní hypotéz oooooooooooooo Náhodný výběr Bodové a intervalové odhady Testovaní hypotéz o«oooo ooooooooooooo oooooooooooooo Náhodný výběr z normálního rozdělení Uvažme nyní speciální případ, kdy je Xl,..., X„ náhodný výběr z normálního rozdělení A/(/x, a2). Věta • M a S2 jsou nezávislé náhodné veličiny. • M ~ N(n, a2/n), a tedy U = (M - n)/{o/^~h) ~ N(0,1). . T = (M-(i,)/(S/y/?i)~t(n-Í). • K = (n- l)S2/o2 ~ X2(n - 1)- • E(X/-Aí)2A72~X2(n)- Náhodný výběr Bodové a intervalové odhady Testovaní hypotéz o«oooo ooooooooooooo oooooooooooooo Náhodný výběr z normálního rozdělení Uvažme nyní speciální případ, kdy je Xl,..., X„ náhodný výběr z normálního rozdělení A/(/x, a2). Věta • M a S2 jsou nezávislé náhodné veličiny. • M ~ A/(/j, a2/n), a tedy U = (M - n)/{o/^~h) - N(0,1). . T = (M-(i,)/(S/y/?i)~t(n-Í). • K = (n- l)S2/o2 - X2(n - 1)- • E(X/-Aí)2A72~X2(n)- Poznámka K odhadu /x, neznáme-li a2, slouží T, v opačném případě U. K odhadu a2, neznáme-li /x, slouží K, v opačném případě následující (bezejmenná?) statistika, která je vlastně statistikou K, v níž místo odhadu M použijeme přímo ji. Náhodný výběr oo«ooo Bodové a intervalové odhady ooooooooooooo Testovaní hypotéz oooooooooooooo Důkaz. Položme Z; = (X; — /j)/a, což jsou zrejme nezávislé náhodné veličiny s normovaným normálním rozdělením. Zřejmě je X = a + aEnZ, kde a = (/x,..., /x) je vektor samých /x, a proto má X podle věty z předchozí přednášky mnohorozměrné normální rozdělení. Je-li dále d vektor ze samých 1/n, pak má náhodná veličina M = dTX (jednorozměrné) normální rozdělení se střední hodnotou dTa = /ia rozptylem dTa2End = a2/n. Náhodný výběr oo«ooo Bodové a intervalové odhady ooooooooooooo Testovaní hypotéz oooooooooooooo Důkaz. Položme Z; = (X; — /j)/a, což jsou zrejme nezávislé náhodné veličiny s normovaným normálním rozdělením. Zrejme je X = a + aEnZ, kde a = (/x,..., /x) je vektor samých /x, a proto má X podle věty z předchozí přednášky mnohorozměrné normální rozdělení. Je-li dále d vektor ze samých 1/n, pak má náhodná veličina M = dTX (jednorozměrné) normální rozdělení se střední hodnotou dTa = /ia rozptylem dTa2End = a2/n. Ostatní tvrzení se dokážou obdobně. □ Náhodný výběr ooo«oo Bodové a intervalové odhady ooooooooooooo Testovaní hypotéz oooooooooooooo Dva nezávislé výběry z normálního rozdělení Věta Necht je X\\,..., Xm\ náhodný výběr rozsahu m z rozdělení A/(/x, g\) a X\2,..., Xn2 je na něm nezávislý náhodný výběr rozsahu n z rozdělení N (/i, 2. Označme M\, M2 jejich výběrové průměry a S2, S| výběrové rozptyly. Dále necht je 52_(m-l)512 + (n-l)522 * m+n-2 vážený průměr výběrových rozptylů. Pak platí: 00. o- Náhodný výběr ooo«oo Bodové a intervalové odhady ooooooooooooo Testovaní hypotéz oooooooooooooo Dva nezávislé výběry z normálního rozdělení Věta Necht je X\\,..., Xm\ náhodný výběr rozsahu m z rozdělení A/(/x, g\) a X\2,..., Xn2 je na něm nezávislý náhodný výběr rozsahu n z rozdělení N (/i, 2. Označme M\, M2 jejich výběrové průměry a , S| výběrové rozptyly. Dále necht je 52_(m-l)512 + (n-l)522 * m+n-2 vážený průměr výběrových rozptylů. Pak platí: • M\ — M2 a S2 jsou stochasticky nezávislé, 00. o- Náhodný výběr ooo«oo Bodové a intervalové odhady ooooooooooooo Testovaní hypotéz oooooooooooooo Dva nezávislé výběry z normálního rozdělení Věta Necht je X\\,..., Xm\ náhodný výběr rozsahu m z rozdělení A/(/x, g\) a X\2,..., Xn2 je na něm nezávislý náhodný výběr rozsahu n z rozdělení N (/i, 2. Označme M\, M2 jejich výběrové průměry a S2, S| výběrové rozptyly. Dále necht je 52_(m-l)512 + (n-l)522 * m+n-2 vážený průměr výběrových rozptylů. Pak platí: • M\ — M2 a S2 jsou stochasticky nezávislé, • Mi - M2 ~ A/(/xi - H2, ^ + 4) , 00. o- Náhodný výběr ooo«oo Bodové a intervalové odhady ooooooooooooo Testovaní hypotéz oooooooooooooo Dva nezávislé výběry z normálního rozdělení Věta Necht je X\\,..., Xm\ náhodný výběr rozsahu m z rozdělení A/(/x, a2) a X\2,..., Xn2 je na něm nezávislý náhodný výběr rozsahu n z rozdělení N (/i, u2), přičemž m, n > 2. Označme M\, M2 jejich výběrové průměry a S2, S| výběrové rozptyly. Dále necht je s2_(m-l)S2 + (n-l)S2 * m+n-2 vážený průměr výběrových rozptylů. Pak platí: • M\ — M2 a S2 jsou stochasticky nezávislé, • Mi - M2 ~ A/(/íi - H2, ^ + 4) , • je-li o\ = o\ = a2, pak K = {m + n- 2)S2/a2 ~ x2(m + n - 2) , 00. o- Náhodný výběr ooo«oo Bodové a intervalové odhady ooooooooooooo Testovaní hypotéz oooooooooooooo Dva nezávislé výběry z normálního rozdělení Věta Necht je X\\,..., Xm\ náhodný výběr rozsahu m z rozdělení A/(/x, a2) a X\2,..., Xn2 je na něm nezávislý náhodný výběr rozsahu n z rozdělení N (/i, u2), přičemž m, n > 2. Označme M\, M2 jejich výběrové průměry a S2, Sf výběrové rozptyly. Dále necht je s2_(m-l)S2 + (n-l)S2 * m+n-2 vážený průměr výběrových rozptylů. Pak platí: • M\ — M2 a S2 jsou stochasticky nezávislé, • Mi - M2 ~ A/(/xi - H2, ^ + 4) , • je-li g\ = g\ = a2, pak K = {m + n- 2)S2/a2 ~ %2(m + n - 2) , • F = 4t4 ~F(m-l,n-l). Náhodný výběr Bodové a intervalové odhady Testovaní hypotéz oooo»o ooooooooooooo oooooooooooooo Užití statistik dvou nezávislých výběrů • Statistika U, vzniklá normováním M\ — M2, se používá pro odhad rozdílu [i\ — [12, známe-li rozptyly al,a2. Náhodný výběr oooo»o Bodové a intervalové odhady ooooooooooooo Užití statistik dvou nezávislých výběrů Testování hypotéz oooooooooooooo • Statistika U, vzniklá normováním M\ — M2, se používá pro odhad rozdílu [i\ — [12, známe-li rozptyly i 4 10 "r" 5 . 0 libovolné. Z Čebyševovy nerovnosti máme P(\Tn - E(Tn)\< 6/2) > 1 - D(T„)/(e/2)2. Náhodný výběr Bodové a intervalové odhady Testovaní hypotéz oooooo oo»oooooooooo oooooooooooooo Je-li posloupnost Tn odhadů parametru 0 asymptoticky nestranná a platí-li limn^oo D{Tn) = 0, pak Tn je konzistentním odhadem 9. Důkaz. Buď e > 0 libovolné. Z Čebyševovy nerovnosti máme P(|T„ - E(T„)| < e/2) > 1 - D(Tn)/(e/2)2. Zároveň pro dostatečně velké n máme \E{Tn) — 0\ < e/2. Proto P{\Tn-9\ P(\Tn - E(Tn)\ < e/2,\E(Tn) - 9\ < e/2) = P(\Tn-E(Tn)\ M + — (M — -^U!_a/2) = v n v n Náhodný výběr oooooo Bodové a intervalové odhady oooooooo»oooo Testovaní hypotéz oooooooooooooo Příklad Nechť Xl,... , X„ je náhodný výběr z rozdělení A/(/x; 0,1). Jaký musí být minimální rozsah výběru, aby velikost 95% intervalu spolehlivosti pro jjl nepřesáhla číslo 0,03? Řešení Podle předchozí tabulky dostáváme (pro a = 0,05) 0, 03 > M + — (M — -^U!_a/2) V vn = ž=Wl-a/2- Proto n> . ^r"/2 =170,7 0,032 a rozsah výběru tedy musí splňovat n > 171. Náhodný výběr oooooo Bodové a intervalové odhady ooooooooo«ooo Testovaní hypotéz oooooooooooooo Intervaly spolehlivosti pro parametry 2 normálních rozdělení jiti — [i2 (známe a2, a2) M1-M2±^ + ^u1_a/2 /xi — fj.2 (neznámé a\ = a2) M1-M2±S*y/± + ±t1_a/2 společný rozptyl a2 ( (m+n-2)Sl (m+n-2)Sl \ \xl_a/2(m+n-2)' x2/2(m+n_2) J podíl rozptylů g\Jg\ ( S'i/S'i Si/Si \ Fi-a/2(m-l,n-l)' Fa/2(m-l,n-l) ) Náhodný výběr oooooo Bodové a intervalové odhady ooooooooo«ooo Testovaní hypotéz oooooooooooooo Intervaly spolehlivosti pro parametry 2 normálních rozdělení jiti — /i2 (známe a2, a2) M1-M2±^ + ^u1_a/2 /xi — fj.2 (neznámé a\ = a2) M1-M2±S*y/± + ±t1_a/2 společný rozptyl a2 ( (m+n-2)Sl (m+n-2)Sl \ \xl_a/2(m+n-2)' x2/2(m+n_2) J podíl rozptylů g\Jg\ ( S'i/S'i Si/Si \ Fi-a/2(m-l,n-l)' Fa/2(m-l,n-l) ) Poznámka Pokud a priori nevíme, jestli jsou rozptyly shodné, můžeme to ověřit tak, že nejprve sestrojíme interval spolehlivosti pro g\jg\. Obsahuje-li 1, lze (s pravděpodobností 1 — a) považovat rozptyly za shodné a tento rozptyl odhadovat pomocí statistiky K, jak je uvedeno v tabulce. Náhodný výběr Bodové a intervalové odhady Testování hypotéz oooooo oooooooooo«oo oooooooooooooo Inteval spolehlivosti pro výběr z dvourozměrného rozdělení Nechť (Xi, Yi),..., (X„, Yn) je výběr z rozdělení Náhodný výběr Bodové a intervalové odhady Testování hypotéz oooooo oooooooooo«oo oooooooooooooo Inteval spolehlivosti pro výběr z dvourozměrného rozdělení Nechť (Xi, Yi),..., (X„, Yn) je výběr z rozdělení Označíme /jl = [i\ — fi2 a zavedeme rozdílový výběr Z; = X; — Y,. Pak statistika T = výběru Z má ř-rozdělení s n — 1 stupni volnosti, proto jsou hranice intervalu spolehlivosti l — a pro [i rovny M±4=ri_a/2(n-l). Náhodný výběr oooooo Bodové a intervalové odhady ooooooooooo«o Testovaní hypotéz oooooooooooooo Příklad U šesti nových automobilů bylo testováno, nakolik se sjíždějí pneumatiky na předních kolech. Byly naměřeny tyto hodnoty (v mm): číslo auta 1 2 3 4 5 6 sjetí pravé pneu 1,8 1,0 2,2 0,9 1,5 1,6 sjetí levé pneu 1,5 1,1 2,0 1,1 1,4 1,4 Předpokládejte, že jde o realizaci náhodného výběru z dvourozměrného normálního rozdělení a rozhodněte, jestli nedochází k výraznějšímu nesymetrickému sjíždění pneumatik (tj. sestrojte 95% interval spolehlivosti pro jjl = [i\ — ^2). □ s - ■ * ■O O. o- Náhodný výběr oooooo Bodové a intervalové odhady 000000000000« Testovaní hypotéz oooooooooooooo Řešení Postupně vypočteme: Z = (O, 3; -0,1; O, 2; -O, 2; 0,1; O, 2), M = 0,0833, S = 0,1941. Náhodný výběr Bodové a intervalové odhady Testování hypotéz oooooo 000000000000« oooooooooooooo Řešení Postupně vypočteme: Z = (0, 3; —0,1; 0, 2; -0,2; 0,1; 0,2), M = 0,0833, S = 0,1941. Pak jsou krajními body hledaného 95% intervalu spolehlivosti M ± ^ti_a/2(n - 1) = 0,0833 ± 0,1941 • 2,5706/\/6, tj. (-0,12;0,29). Náhodný výběr oooooo Bodové a intervalové odhady 000000000000« Testovaní hypotéz oooooooooooooo Řešení Postupně vypočteme: Z = (O, 3; -0,1; O, 2; -O, 2; 0,1; O, 2), M = 0,0833, S = 0,1941. Pak jsou krajními body hledaného 95% intervalu spolehlivosti M ± -^t1_a/2(n - 1) = 0,0833 ± 0,1941 • 2,5706/\/6, tj. (-0,12;0,29). Poznamenejme, že snadno odvodíme i míru rizika, se kterou bychom mohli tvrdit, že je [i\ > /j2, tj. že pravé pneumatiky se sjíždějí více než levé. Je to takové číslo a, aby příslušný interval spolehlivosti neobsahoval číslo O - v našem případě je a = 0,34, což je riziko příliš vysoké. Náhodný výběr Bodové a intervalové odhady Testování hypotéz oooooo ooooooooooooo oooooooooooooo Plán přednášky Náhodný výběr Bodové a intervalové odhady Testování hypotéz Náhodný výběr Bodové a intervalové odhady Testovaní hypotéz oooooo ooooooooooooo »0000000000000 Motivační úvod Testování hypotéz umožňuje na základě náhodného výběru s danou pravděpodobností ověřovat domněnky o rozdělení, z něhož pochází daný náhodný výběr. Náhodný výběr oooooo Bodové a intervalové odhady ooooooooooooo Testovaní hypotéz •ooooooooooooo Motivační úvod Testování hypotéz umožňuje na základě náhodného výběru s danou pravděpodobností ověřovat domněnky o rozdělení, z něhož pochází daný náhodný výběr. Hypotézou budeme rozumět nějaké tvrzení o parametrech tohoto rozdělení. Náhodný výběr oooooo Bodové a intervalové odhady ooooooooooooo Testovaní hypotéz •ooooooooooooo Motivační úvod Testování hypotéz umožňuje na základě náhodného výběru s danou pravděpodobností ověřovat domněnky o rozdělení, z něhož pochází daný náhodný výběr. Hypotézou budeme rozumět nějaké tvrzení o parametrech tohoto rozdělení. Definice Hq .. . nulová hypotéza (např. 9 = c, kde c vyjadřuje naši domněnku o hodnotě parametru 9) H\ ... (oboustranná) alternativní hypotéza (obvykle negace nulové) Testováním Ho oproti alternativní hypotéze rozumíme postup založený na náhodném výběru, s jehož pomocí platnost Ho zamítneme nebo nezamítneme (= připouštíme). 00. o- Náhodný výběr oooooo Bodové a intervalové odhady ooooooooooooo Testovaní hypotéz •ooooooooooooo Motivační úvod Testování hypotéz umožňuje na základě náhodného výběru s danou pravděpodobností ověřovat domněnky o rozdělení, z něhož pochází daný náhodný výběr. Hypotézou budeme rozumět nějaké tvrzení o parametrech tohoto rozdělení. Definice Hq .. . nulová hypotéza (např. 9 = c, kde c vyjadřuje naši domněnku o hodnotě parametru 9) H\ ... (oboustranná) alternativní hypotéza (obvykle negace nulové) Testováním Ho oproti alternativní hypotéze rozumíme postup založený na náhodném výběru, s jehož pomocí platnost Ho zamítneme nebo nezamítneme (= připouštíme). Chyba 1. druhu .. . Ho platia myji zamítneme (závažnější) Chyba 2. druhu .. . Hq neplatí a myji nezamítneme 00. o- Náhodný výběr Bodové a intervalové odhady Testování hypotéz oooooo ooooooooooooo »0000000000000 Motivační úvod Testování hypotéz umožňuje na základě náhodného výběru s danou pravděpodobností ověřovat domněnky o rozdělení, z něhož pochází daný náhodný výběr. Hypotézou budeme rozumět nějaké tvrzení o parametrech tohoto rozdělení. Definice Hq .. . nulová hypotéza (např. 9 = c, kde c vyjadřuje naši domněnku o hodnotě parametru 9) H\ ... (oboustranná) alternativní hypotéza (obvykle negace nulové) Testováním Ho oproti alternativní hypotéze rozumíme postup založený na náhodném výběru, s jehož pomocí platnost Ho zamítneme nebo nezamítneme (= připouštíme). Chyba 1. druhu .. . Ho platia myji zamítneme (závažnější) Chyba 2. druhu .. . Ho neplatí a myji nezamítneme Pravděpodobnost chyby 1. druhu se nazývá hladina významnosti (a, obvykle a = 0,05), pravděpodobnost chyby 2. druhu se značí [3 a číslo 1 — [3 se nazývá síla testu. Náhodný výběr Bodové a intervalové odhady Testování hypotéz oooooo ooooooooooooo o«oooooooooooo Způsoby testovaní nulové hypotézy 9 pomoci intervalu spolehlivosti Náhodný výběr Bodové a intervalové odhady Testování hypotéz oooooo ooooooooooooo o«oooooooooooo Způsoby testovaní nulové hypotézy O pomoci intervalu spolehlivosti 0 pomocí kritického oboru Náhodný výběr Bodové a intervalové odhady Testování hypotéz oooooo ooooooooooooo o«oooooooooooo Způsoby testovaní nulové hypotézy O pomocí intervalu spolehlivosti 0 pomocí kritického oboru O pomocí tzv. p—hodnoty (p-value) Náhodný výběr oooooo Bodové a intervalové odhady ooooooooooooo Testovaní hypotéz o«oooooooooooo Způsoby testovaní nulové hypotézy O pomoci intervalu spolehlivosti 0 pomocí kritického oboru O pomoci tzv. p—hodnoty (p-value) Interval spolehlivosti Na základě realizace náhodného výběru sestrojíme 100(1 — a)% interval spolehlivosti pro neznámý parametr 6 a zjistíme, zda c patří do tohoto intervalu. Pokud ano, hypotézu Hq nezamítáme (v opačném případě zamítáme) na hladině významnosti a. Náhodný výběr oooooo Bodové a intervalové odhady ooooooooooooo Testovaní hypotéz o«oooooooooooo Způsoby testovaní nulové hypotézy O pomoci intervalu spolehlivosti 0 pomocí kritického oboru O pomoci tzv. p—hodnoty (p-value) Interval spolehlivosti Na základě realizace náhodného výběru sestrojíme 100(1 — a)% interval spolehlivosti pro neznámý parametr 6 a zjistíme, zda c patří do tohoto intervalu. Pokud ano, hypotézu Hq nezamítáme (v opačném případě zamítáme) na hladině významnosti a. Kritický obor Stanovení kritického oboru je postup do jisté míry obrácený. Nejprve (i bez náhodného výběru) zvolíme vhodnou statistiku T a množinu hodnot, jichž může T nabývat, rozdělíme na dvě disjunktní podmnožiny: obor nezamítnutí Ho (značíme V) a kritický obor W (obor zamítnutí Ho). Pokud realizace T padne do W, pak Ho zamítneme, jinak nezamítáme. Náhodný výběr oooooo Bodové a intervalové odhady ooooooooooooo Testovaní hypotéz oo»ooooooooooo Stanovení kritického oboru na hladine a Pro statistiku T (testové kritérium) stanovíme obor nezamítnutí V jako interval, jehož hraniční body tvoří kvantil a/2 a 1 — a/2, odtud je W = (-00, F-\a/2)) U (F-\l - a/2), 00). Náhodný výběr oooooo Bodové a intervalové odhady ooooooooooooo Testovaní hypotéz ooo«oooooooooo Způsoby testovaní nulové hypotézy p-hodnota Testovaní pomoci p-hodnoty je jednoduchý test, umožněný rozšířením statistických balíků, p-hodnota udává nejnižší možnou hladinu významnosti, při níž Ho zamítáme. Je-li p-hodnota > a, hypotézu Ho nezamítáme, pro p-hodnotu menší než a, hypotézu zamítneme. Náhodný výběr oooooo Bodové a intervalové odhady ooooooooooooo Testování hypotéz ooo«oooooooooo Způsoby testovaní nulové hypotézy p-hodnota Testovaní pomoci p-hodnoty je jednoduchý test, umožněný rozšírením statistických balíků, p-hodnota udává nejnižší možnou hladinu významnosti, při níž Ho zamítáme. Je-li p-hodnota > a, hypotézu Ho nezamítáme, pro p-hodnotu menší než a, hypotézu zamítneme. □ g - ■ m Náhodný výběr oooooo Bodové a intervalové odhady ooooooooooooo Testování hypotéz ooo«oooooooooo Způsoby testovaní nulové hypotézy p-hodnota Testovaní pomoci p-hodnoty je jednoduchý test, umožněný rozšířením statistických balíků, p-hodnota udává nejnižší možnou hladinu významnosti, při níž Ho zamítáme. Je-li p-hodnota > a, hypotézu Ho nezamítáme, pro p-hodnotu menší než a, hypotézu zamítneme. p-hodnota se stanoví rovněž se znalostí konkrétní realizace řo statistiky T náhodného výběru jako p = 2min{P(T< ř0),P(T> ř0)}. Náhodný výběr oooooo Bodové a intervalové odhady ooooooooooooo Testování hypotéz 0000*000000000 Testování hypotézy proti jednostranné alternativě Je-li Ho hypotéza 9 = c, pak levostranná alternativní hypotéza je tvrzení 9 < c, pravostranná alternativní hypotéza je tvrzení 9 > Náhodný výběr oooooo Bodové a intervalové odhady ooooooooooooo Testovaní hypotéz 0000*000000000 Testování hypotézy proti jednostranné alternativě Je-li Ho hypotéza 9 = c, pak levostranná alternativní hypotéza je tvrzení 9 < c, pravostranná alternativní hypotéza je tvrzení 9 > c. Volba typu alternativní hypotézy vyplýva z konkrétní situace. Příklad • V předmětu Matematika 3 psali studenti písemku rozdělení na 2 skupiny. Hypotéza Ho : obě zadání mají stejnou průměrnou obtížnost je testována oproti oboustranné alternativní hypotéze zadání nejsou stejně obtížná. •O 0. o- Náhodný výběr oooooo Bodové a intervalové odhady ooooooooooooo Testovaní hypotéz 0000*000000000 Testování hypotézy proti jednostranné alternativě Je-li Ho hypotéza 9 = c, pak levostranná alternativní hypotéza je tvrzení 9 < c, pravostranná alternativní hypotéza je tvrzení 9 > c. Volba typu alternativní hypotézy vyplýva z konkrétní situace. Příklad • V předmětu Matematika 3 psali studenti písemku rozdělení na 2 skupiny. Hypotéza Ho : obě zadání mají stejnou průměrnou obtížnost je testována oproti oboustranné alternativní hypotéze zadání nejsou stejně obtížná. • V předmětu Matematika 3 se dříve po studentech nevyžadovalo řešení domácích úloh. Toto bylo nyní nově zavedeno s cílem dosažení lepších výsledků studentů u závěrečné zkoušky. •0 0.0 Náhodný výběr oooooo Bodové a intervalové odhady ooooooooooooo Testovaní hypotéz 0000*000000000 Testování hypotézy proti jednostranné alternativě Je-li Ho hypotéza 9 = c, pak levostranná alternativní hypotéza je tvrzení 9 < c, pravostranná alternativní hypotéza je tvrzení 9 > c. Volba typu alternativní hypotézy vyplýva z konkrétní situace. Příklad • V předmětu Matematika 3 psali studenti písemku rozdělení na 2 skupiny. Hypotéza Ho : obě zadání mají stejnou průměrnou obtížnost je testována oproti oboustranné alternativní hypotéze zadání nejsou stejně obtížná. • V předmětu Matematika 3 se dříve po studentech nevyžadovalo řešení domácích úloh. Toto bylo nyní nově zavedeno s cílem dosažení lepších výsledků studentů u závěrečné zkoušky. •O 0. o- Náhodný výběr oooooo Bodové a intervalové odhady ooooooooooooo Testování hypotéz 0000*000000000 Testování hypotézy proti jednostranné alternativě Je-li Ho hypotéza 9 = c, pak levostranná alternativní hypotéza je tvrzení 9 < c, pravostranná alternativní hypotéza je tvrzení 9 > c. Volba typu alternativní hypotézy vyplýva z konkrétní situace. Příklad • V předmětu Matematika 3 psali studenti písemku rozdělení na 2 skupiny. Hypotéza Ho : obě zadání mají stejnou průměrnou obtížnost je testována oproti oboustranné alternativní hypotéze zadání nejsou stejně obtížná. • V předmětu Matematika 3 se dříve po studentech nevyžadovalo řešení domácích úloh. Toto bylo nyní nově zavedeno s cílem dosažení lepších výsledků studentů u závěrečné zkoušky. V tomto případě zřejmě použijeme nulovou hypotézu Ho : výsledné bodové hodnocení se nezlepšilo oproti pravostranné alternativní hypotéze H\ : bodový výsledek studentů se zlepšil Náhodný výběr oooooo Bodové a intervalové odhady ooooooooooooo Testování hypotéz ooooo«oooooooo Jednoduchý príklad Příklad Náš protivník hodil 60x kostkou a padla mu 16x šestka. Testujme na hladině významnosti a = 0,05 nulovou hypotézu Ho : kostka není upravená oproti jednostranné alternativní hypotéze H\ : kostka je upravená tak, aby padalo více šestek. Náhodný výběr oooooo Bodové a intervalové odhady ooooooooooooo Testovaní hypotéz ooooo«oooooooo Jednoduchý príklad Příklad Náš protivník hodil 60x kostkou a padla mu 16x šestka. Testujme na hladině významnosti a = 0,05 nulovou hypotézu Ho : kostka není upravená oproti jednostranné alternativní hypotéze H\ : kostka je upravená tak, aby padalo více šestek. Řešení Statistika T (počet šestek) ma rozdělení T ~ 6/(60,1/6). Kritický obor je dán 95. percentilem tohoto rozdělení. Snadno vypočteme, že P(T > 14) = 0,065 a P(T > 15) = 0,034, proto p-hodnota rovna 0,034 (nebo jinými slovy: kritickým oborem na hladině 0,05 je interval (16, oo). Hypotézu Ho tedy zamítáme - na hladině 0,05 můžeme tvrdit, že kostka je upravená. Náhodný výběr oooooo Bodové a intervalové odhady ooooooooooooo Testovaní hypotéz oooooo«ooooooo Jednoduchý príklad - pokr. Řešení (pomocí aproximace) Porovnejme předchozí řešení příkladu s řešením, při kterém využijeme aproximaci pomocí de Moive-Laplaceovy věty. Náhodnou veličinu v_ 7~10 lze považovat za veličinu mající normální rozdělení A/(/x, a2) s jednotkovým rozptylem a2 = 1, testovat budeme hypotézu jjl = 0. Náhodný výběr oooooo Bodové a intervalové odhady ooooooooooooo Testování hypotéz oooooo«ooooooo Jednoduchý príklad - pokr. Řešení (pomocí aproximace) Porovnejme předchozí řešení příkladu s řešením, při kterém využijeme aproximaci pomocí de Moive-Laplaceovy věty. Náhodnou veličinu v_ 7~10 lze považovat za veličinu mající normální rozdělení A/(/x, a2) s jednotkovým rozptylem a2 = 1, testovat budeme hypotézu [i = 0. Kritickým oborem A/(0,1) je interval (1,65, oo) (stále uvažujeme pravostranou alternativu). Přitom pro realizaci statistiky X platí x = (16 — 10)/a/50/6 w 2,08 a hypotézu tedy opět zamítáme. Náhodný výběr oooooo Bodové a intervalové odhady ooooooooooooo Testovaní hypotéz oooooo«ooooooo Jednoduchý príklad - pokr. Řešení (pomocí aproximace) Porovnejme předchozí řešení příkladu s řešením, při kterém využijeme aproximaci pomocí de Moive-Laplaceovy věty. Náhodnou veličinu v_ 7~10 lze považovat za veličinu mající normální rozdělení A/(/x, a2) s jednotkovým rozptylem a2 = 1, testovat budeme hypotézu [i = 0. Kritickým oborem A/(0,1) je interval (1,65, oo) (stále uvažujeme pravostranou alternativu). Přitom pro realizaci statistiky X platí x = (16 — 10)/a/50/6 w 2,08 a hypotézu tedy opět zamítáme. Jednostranným intervalem spolehlivosti pro X je ((2,08 — 1,65)/\/6Ô, oo) a protože do něj nepatří hodnota 0 zamítáme nulovou hypotézu (všimněte si, že v obou případech rozhodlo porovnání 1, 65 < 2, 08). Náhodný výběr Bodové a intervalové odhady Testování hypotéz oooooo ooooooooooooo ooooooo»oooooo Jednoduchý príklad - pokr. Řešení (pomocí aproximace a p-hodnoty ) Určeme nejmenší pravděpodobnost p, při níž stále ještě zamítáme nulovou hypotézu /x = 0 oproti pravostranné hypotéze /x > 0 (tj. p-hodnotu). Má-li X rozdělení N(0,1), pak p = P(X> 2,08) = 1 - 0,981 = 0,019. Náhodný výběr Bodové a intervalové odhady Testovaní hypotéz oooooo ooooooooooooo ooooooo»oooooo Jednoduchý príklad - pokr. Řešení (pomocí aproximace a p-hodnoty ) Určeme nejmenší pravděpodobnost p, při níž stále ještě zamítáme nulovou hypotézu /x = 0 oproti pravostranné hypotéze /x > 0 (tj. p-hodnotu). Má-li X rozdělení N(0,1), pak p = P(X> 2,08) = 1 - 0,981 = 0,019. Protože je a = 0,05 > 0,019, opět hypotézu zamítáme. Náhodný výběr oooooo Bodové a intervalové odhady ooooooooooooo Testovaní hypotéz oooooooo«ooooo Základní testy hypotéz o parametrech normálního rozdělení Podobně jako statistiky při konstrukci intervalů spolehlivosti jsou i základní testy standardizované (není divu - jak jsme viděli, jde o úzce propojené pojmy). Náhodný výběr oooooo Bodové a intervalové odhady ooooooooooooo Testování hypotéz oooooooo«ooooo Základní testy hypotéz o parametrech normálního rozdělení Podobně jako statistiky při konstrukci intervalů spolehlivosti jsou i základní testy standardizované (není divu - jak jsme viděli, jde o úzce propojené pojmy). z-test Nechť je X\,..., Xn náhodný výběr z rozdělení A/(/x, a2) se známým a2 a n > 2. Test Ho : [i = c proti alternativní hypotéze /i^cse nazývá z-test. Náhodný výběr oooooo Bodové a intervalové odhady ooooooooooooo Testovaní hypotéz oooooooo«ooooo Základní testy hypotéz o parametrech normálního rozdělení Podobně jako statistiky při konstrukci intervalů spolehlivosti jsou i základní testy standardizované (není divu - jak jsme viděli, jde o úzce propojené pojmy). z-test Nechť je X\,..., Xn náhodný výběr z rozdělení A/(/x, a2) se známým a2 a n > 2. Test Ho : /x = c proti alternativní hypotéze /i ^ c se nazývá z-test. jednovýběrový t-test Nechť je X\,..., Xn náhodný výběr z rozdělení A/(/x, a2) s neznámým a2 a n > 2. Test Ho : /x = c proti alternativní hypotéze /i^cse nazývá jednovýběrový t-test. Náhodný výběr oooooo Bodové a intervalové odhady ooooooooooooo Testovaní hypotéz oooooooo«ooooo Základní testy hypotéz o parametrech normálního rozdělení Podobně jako statistiky při konstrukci intervalů spolehlivosti jsou i základní testy standardizované (není divu - jak jsme viděli, jde o úzce propojené pojmy). z-test Nechť je X\,..., X„ náhodný výběr z rozdělení A/(/x, a2) se známým a2 a n > 2. Test Ho : [i = c proti alternativní hypotéze /i^cse nazývá z-test. jednovýběrový t-test Nechť je Xl,..., Xn náhodný výběr z rozdělení A/(/x, a2) s neznámým a2 a n > 2. Test Ho : [i = c proti alternativní hypotéze /i ^ c se nazývá jednovýběrový t-test. dvouvýběrový t-test Nechť je Xn,..., Xm\ náhodný výběr z rozdělení A/(/xi, 2 a neznámým a2. Test Ho : [i\ — [i2 = c proti H\ : [i\ — fj.2 7^ c se nazývá dvouvýběrový t-test. Náhodný výběr oooooo Bodové a intervalové odhady ooooooooooooo Testování hypotéz ooooooooo»oooo Základní testy hypotéz o parametrech normálním rozdělení párový t-test Nechť je (Xi, Vi)r,..., (X„, Yn) výběr z rozdělení s n > 2 a neznámými parametry. Test Ho : [i\ — /j.2 = c oproti H\ : [i\ — [i2 ^ c se nazývá párový t-test. Náhodný výběr oooooo Bodové a intervalové odhady ooooooooooooo Testovaní hypotéz ooooooooo»oooo Základní testy hypotéz o parametrech normálním rozdělení párový t-test Nechť je (Xi, Y\)T,..., (X„, Yn) výběr z rozdělení (J12 °2 J s n > 2 a neznámými parametry. Test Ho : [i\ — fj.2 = c oproti H\ : [i\ — /x2 7^ c se nazývá párový t-test. F-test Nechť je Xn,..., Xmi náhodný výběr z rozdělení N(Hi, cr2) a X12,..., Xn2 na něm nezávislý náhodný výběr z rozdělení N(/j,2, cr2) s m, n > 2. Test Ho : cr2/cr2 = 1 proti ŕ/i : c2/ 2 a neznámými parametry. Test Ho : [i\ — H2 = c oproti H\ : [i\ — /x2 7^ c se nazývá párový t-test. F-test Nechť je Xn,..., Xmi náhodný výběr z rozdělení N(Hi, cr2) a X12,..., Xn2 na něm nezávislý náhodný výběr z rozdělení N(/j,2, cr2) s m, n > 2. Test M) : cr\/a2 = 1 proti H\ : a2/a2 ^ 1 se nazývá F-test. test rozptylu Nechť je Xl,..., Xn náhodný výběr z A/(/x, a2) s neznámým /í a n > 2. Test Ho : a2 = c proti ŕ/i : cr2 c se nazývá test o rozptylu. Náhodný výběr Bodové a intervalové odhady Testovaní hypotéz oooooo ooooooooooooo oooooooooo«ooo Kritický obor testů normálního rozdělení z-test |(M - c)/( Ul_a/2 □ rgi - ■ * -r)c^(y Náhodný výběr Bodové a intervalové odhady Testovaní hypotéz oooooo ooooooooooooo oooooooooo«ooo Kritický obor testů normálního rozdělení z-test |(M - c)/( Ul_a/2 jednovýběrový t-test \(M — c)/{S/yfň)\ > ti_a/2{n — 1) Náhodný výběr Bodové a intervalové odhady Testování hypotéz oooooo ooooooooooooo oooooooooo«ooo Kritický obor testů normálního rozdělení z-test \(M - c)/{a/y/ň)\ > Ul_a/2 jednovýběrový t-test \(M — c)/(S/yfň)\ > ti_a/2{n — 1) dvouvýběrový t-test Mi - M2-c S*\/ ^ + l > ti-a/2{m + n - 2) Náhodný výběr Bodové a intervalové odhady Testovaní hypotéz oooooo ooooooooooooo oooooooooo«ooo Kritický obor testů normálního rozdělení z-test \(M - c)/{a/y/ň)\ > Ul_a/2 jednovýběrový t-test \(M — c)/{S/yfň)\ > ti_a/2{n — 1) dvouvýběrový t-test Mi - M2-c + 1 > ti-a/2{m + n - 2) párový t-test sestrojením rozdílu Z; = X; — Y; a /x = [i\ — úlohu předvedeme na jednovýběrový ŕ— test Náhodný výběr Bodové a intervalové odhady Testovaní hypotéz oooooo ooooooooooooo oooooooooo«ooo Kritický obor testů normálního rozdělení z-test |(M - c)/{a/y/ň)\ > Ul_a/2 jednovýběrový t-test |(M — c)/(S/yfň)\ > ti_a/2{n dvouvýběrový t-test 1) Mi - M2 - c + 1 > ti-a/2{m + n - 2) párový t-test sestrojením rozdílu Z; = X; — Y-, a /i = [i\ — [i2 úlohu předvedeme na jednovýběrový t— test F-test S2/S2 < Fa/2{m — 1, n — 1) nebo Sl/Sj > Fx_a/2{m - 1, n - 1) Náhodný výběr Bodové a intervalové odhady Testovaní hypotéz oooooo ooooooooooooo oooooooooo«ooo Kritický obor testů normálního rozdělení z-test \(M - c)/{a/y/ň)\ > Ul_a/2 jednovýběrový t-test \(M — c)/(S/yfň)\ > ti_a/2{n — 1) dvouvýběrový t-test Mi - M2-c + 1 > ti-a/2{m + n - 2) párový t-test sestrojením rozdílu Z; = X\ — Y-, a /x = [i\ — [i2 úlohu předvedeme na jednovýběrový t— test F-test S2/S| < Fa/2{m — 1, n — 1) nebo S2/S2 > Fx_a/2{m - 1, n - 1) test rozptylu (n — l)S2/c < Xa/2(n ~ 1) nebo ta/2 (n-l)S2/c>X2 a/2 (n-1) Bodové a intervalové odhady ooooooooooooo Testování hypotéz ooooooooooo»oo Komplexní príklad na dvouvýběrový t-test Příklad Uvažme bodové výsledky studentů z 2. termínu zkoušky předmětu MB103 v roce 2008, přičemž výsledky testů skupiny A a skupiny B považujeme za dva nezávislé výběry z normálního rozdělení. Úkolem je zjistit, jestli výsledky některé ze skupin byly statisticky významně horší. Testujme nulovou hypotézu Ho : [i\ — [ii = 0 oproti alternativní hypotéze H\ : ^ /i2- Náhodný výběr Bodové a intervalové odhady Testování hypotéz oooooo ooooooooooooo ooooooooooo»oo Komplexní příklad na dvouvýběrový t-test Příklad Uvažme bodové výsledky studentů z 2. termínu zkoušky předmětu MB103 v roce 2008, přičemž výsledky testů skupiny A a skupiny B považujeme za dva nezávislé výběry z normálního rozdělení. Úkolem je zjistit, jestli výsledky některé ze skupin byly statisticky významně horší. Testujme nulovou hypotézu Ho : [i\ — [i2 = 0 oproti alternativní hypotéze H\ : ^ /J2- Řešení Nejprve pomocí F-testu otestujeme hypotézu o stejných rozptylech, v případě úspěchu poté použijeme dvouvýběrový t-test. Vypočteme základní statistiky: Náhodný výběr Bodové a intervalové odhady Testování hypotéz oooooo ooooooooooooo ooooooooooo»oo Komplexní příklad na dvouvýběrový t-test Příklad Uvažme bodové výsledky studentů z 2. termínu zkoušky předmětu MB103 v roce 2008, přičemž výsledky testů skupiny A a skupiny B považujeme za dva nezávislé výběry z normálního rozdělení. Úkolem je zjistit, jestli výsledky některé ze skupin byly statisticky významně horší. Testujme nulovou hypotézu Ho : [i\ — [i2 = 0 oproti alternativní hypotéze H\ : ^ /X2- Řešení Nejprve pomocí F-testu otestujeme hypotézu o stejných rozptylech, v případě úspěchu poté použijeme dvouvýběrový t-test. Vypočteme základní statistiky: rozsah výb. průměr výb. rozptyl A 65 10,48 22,49 B 64 7,21 29,75 Náhodný výběr oooooo Bodové a intervalové odhady ooooooooooooo Testovaní hypotéz oooooooooooo«o Řešení (Komplexní příklad na dvouvýbšrový t-test (pokr.)) Dostáváme S^/Sf = 0,76 a protože F(0,025; 64; 63) = 0,61, nezamítáme hypotézu o rovnosti rozptylů. □ s - ■ m -00.0 Náhodný výběr oooooo Bodové a intervalové odhady ooooooooooooo Testovaní hypotéz oooooooooooo«o Řešení (Komplexní příklad na dvouvýbšrový t-test (pokr.)) Dostáváme S^/Sf = 0,76 a protože F(0,025; 64; 63) = 0,61, nezamítáme hypotézu o rovnosti rozptylů. O tomtéž se presvedčíme i vypočtením intervalu spolehlivosti Ír--TV r J * ^ ^ \Fi-a/2{m-l,n-l) Fa/2{m - 1, n - 1) J v němž leží testovaný podíl rozptylů 1. □ s - ■ m -00.0 Náhodný výběr oooooo Bodové a intervalové odhady ooooooooooooo Testování hypotéz oooooooooooo«o Řešení (Komplexní příklad na dvouvýbšrový t-test (pokr.)) Dostáváme S^/Sf = 0,76 a protože F(0,025; 64; 63) = 0,61, nezamítáme hypotézu o rovnosti rozptylů. O tomtéž se presvedčíme i vypočtením intervalu spolehlivosti Ír--TV r J * ^ ^ \Fi-a/2(m-l,n-l) Fa/2{m - 1, n - 1) J v němž leží testovaný podíl rozptylů 1. Budeme tedy dále s výběry pracovat s předpokladem, že mají stejný rozptyl a použijeme dvouvýběrový t-test. Náhodný výběr oooooo Bodové a intervalové odhady ooooooooooooo Testovaní hypotéz ooooooooooooo* Řešení (Komplexní příklad na dvouvýbšrový t-test (pokr.)) Vypočteme vážený průměr výběrových rozptylů (m - 1)S2 + (n- 1)S| dále Mi M2 = 3,27. m + n 5,ll2 19 0,0- Náhodný výběr oooooo Bodové a intervalové odhady ooooooooooooo Testování hypotéz ooooooooooooo* Řešení (Komplexní příklad na dvouvýběrový t-test (pokr.)) Vypočteme vážený průměr výběrových rozptylů c2_(m-l)S2 + (n-l)S2 m + n 5,ll2 dále Mi — M2 = 3,27. V tabulkách najdeme hodnotu ío,975(65 + 64 - 2) = 1, 98, a protože T M1 - M2 ± + ± 65 ^ 64 3,64, docházíme k závěru, že můžeme hypotézu o stejné střední hodnotě obou rozdělení (tj. hypotézu [i\ = /J2) zamítnout (neboť 3,64 > 1,98). 19 0,0- Náhodný výběr oooooo Bodové a intervalové odhady ooooooooooooo Testovaní hypotéz ooooooooooooo* Řešení (Komplexní příklad na dvouvýbšrový t-test (pokr.)) Vypočteme vážený průměr výběrových rozptylů s2 = (m-l)S* + (n-l)S$ ^ 5 n2 * m + n — 2 ' ' dále Mi — M2 = 3,27. V tabulkách najdeme hodnotu ío,975(65 + 64 - 2) = 1, 98, a protože T M1 - M2 S*\/ST; + ± + ~ 65 ^ 64 3,64, docházíme k závěru, že můžeme hypotézu o stejné střední hodnotě obou rozdělení (tj. hypotézu [i\ = fj,2) zamítnout (neboť 3,64 > 1,98).Toto opět ověříme výpočtem intervalu spolehlivosti, který má střed v M\ — M2 a velikost rovnou dvojnásobku 5*\[^~+\h_a/2{m + n - 2) w 1,78, proto je interval spolehlivosti (1,49; 5, 05).