Náhodný výběr oooooooooooo Bodové a intervalové odhady OOOOOOOOOOOO Testovaní hypotéz oooooooooooooo Matematika III - 14. přednáška Bodové a intervalové odhady, testovaní hypotéz Michal Bulant Masarykova univerzita Fakulta informatiky 18. 12. 2013 Náhodný výběr Bodové a intervalové odhady Testovaní hypotéz oooooooooooo oooooooooooo oooooooooooooo Obsah přednášky Náhodný výběr Bodové a intervalové odhady Testovaní hypotéz Náhodný výběr Bodové a intervalové odhady Testovaní hypotéz oooooooooooo oooooooooooo oooooooooooooo Doporučené zdroje • Jan Slovák, Martin Panák, Michal Bulant, Matematika drsně a svižně, MU Brno, 2013, 774 s. (též jako e-text). • Karel Zvára, Josef Štěpán, Pravděpodobnost a matematická statistika, Matfyzpress, 4. vydání, 2006, 230 stran, ISBN 80-867-3271-1. • Marie Budíková, Štěpán Mikoláš, Pavel Osecký, Teorie pravděpodobnosti a matematická statistika (sbírka příkladů), Masarykova univerzita, 3. vydání, 2004, 117 stran, ISBN 80-210-3313-4. • Marie Budíková, Statistika, Masarykova univerzita, 2004, distanční studijní opora ESF, http: //www.math.muni.cz/~budikova/esf/Statistika.zip. • Marie Budíková, Tomáš Lerch, Štěpán Mikoláš, Základní statistické metody, Masarykova univerzita, 2005, 170 stran, ISBN 80-210-3886-1. Náhodný výběr Bodové a intervalové odhady Testovaní hypotéz •ooooooooooo oooooooooooo oooooooooooooo Náhodný výběr Definice Náhodným výběrem rozsahu n rozumíme n-tici nezávislých a stejně rozdělených náhodných veličin Xl,... ,X„ ~ Fx{x) (někdy také hovoříme o n nezávislých kopiích náhodné veličiny X). Náhodným výběrem rozsahu n z p-rozměrného rozdělení rozumíme n-tici nezávislých a stejně rozdělených p-rozměrných náhodných vektoru. V matematické statistice často pracujeme s transformacemi náhodného výběru, takovým náhodným veličinám (příp. vektorům) říkáme statistiky. V následujícím zavedeme několik důležitých statistik a ukážeme jejich souvislost s číselnými charakteristikami náhodných veličin. Náhodný výběr Bodové a intervalové odhady Testovaní hypotéz o»oooooooooo oooooooooooo oooooooooooooo Základní statistiky Definice Nechť Xl,... ,X„ je náhodný výběr. Statistiku 1 " M = ~yx, n t—' nazývame výběrový průměr, statistiku i=l výběrový rozptyl a statistiku S = VŠ^ výběrová směrodatná odchylka. Analogicky se definují i výběrová kovariance, příp. výběrový korelační koeficient pro dvourozměrný náhodný výběr. Náhodný výběr Bodové a intervalové odhady Testovaní hypotéz oo»ooooooooo oooooooooooo oooooooooooooo Vlastnosti statistik Protože jsou uvedené statistiky náhodnými veličinami, lze se přirozeně ptát po jejich číselných charakteristikách. Věta _' Nechť X1,.. ., Xn je náhodný výběr rozsahu n z rozdělení se střední hodnotou fi a rozptylem a2 . Pak platí: « E(M) = = V, « D(M) -. = var(M) = a2/n, • E(S2) - = a2. Náhodný výběr ooo»oooooooo Bodové a intervalové odhady oooooooooooo Testování hypotéz oooooooooooooo Důkaz. Ukážeme jen (nejsložitější) 3. tvrzení. Snadno se odvodí, že platí Proto je n — 1 1 n — 1 n n — 1 ^2 _2 -2~X2(n)- Poznámka K odhadu /x, neznáme-li u2, slouží T, v opačném případě Í7. K odhadu a2, neznáme-li fi, slouží K, v opačném případě následující (bezejmenná?) statistika, která je vlastně statistikou K, v níž místo odhadu M použijeme přímo fi. Náhodný výběr OOOOOOOOOOOO Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz OOOOOOOOOOOOOO V roce 1951 bylo rozsáhlým statistickým průzkumem zjištěno, že střední hodnota výšky desetiletých chlapců je 136,1 cm se směrodatnou odchylkou a = 6,4 cm. V roce 1961 byla zjištěna výška pouze u 15 náhodně vybraných chlapců: 130 140 136 141 139 133 149 151 139 136 138 142 127 139 147 Otázkou je, zda se v porovnání s rokem 1951 změnila střední výška chlapců, pokud předpokládáme, že variabilita výšek se v různých generacích příliš nemění. Náhodný výběr OOOOOOOOOOOO Bodové a intervalové odhady OOOOOOOOOOOO Testovaní hypotéz OOOOOOOOOOOOOO Řešení Vzhledem k tomu, že základní soubor všech desetiletých chlapců je rozsáhlý, lze zmíněná data považovat za náhodný výběra. Zjistíme, že výběrový průměr M = 139,133, n = 15 a s využitím statistiky U dostáváme, že s 95% pravděpodobností leží hodnota fi v intervalu (M - l,96a/vn; M + 1,96a/y/ň) = (135,9; 142,4). Protože i střední hodnota výšek z roku 1951 leží v tomto intervalu, nemáme vážný důvod tvrdit, že se střední výška změnila. Pokud bychom ovšem připustili vyšší možnost omylu a stanovili interval se spolehlivostí pouze 90%, pak bychom na této hladině hypotézu, že se střední výška změnila, „přijali" - interval je nyní (136,41;141,85). Podobně, pokud nás zajímá pouze dolní odhad střední hodnoty výšek chlapců (a vůbec tedy nepřipouštíme možnost, že by se střední výška snížila), pak s 95% pravděpodobností je střední výška větší než 136,41, a tedy nyní opět „přijímáme" hypotézu, že se střední výška zvýšila. Náhodný výběr oooooooo»ooo Bodové a intervalové odhady oooooooooooo Testování hypotéz oooooooooooooo Příklady k procvičení Příklad Předpokládejme, že velká skupina studentů má ze zápočtové písemky ze statistiky bodové hodnoty normálně rozloženy kolem střední hodnoty 72 se směrodatnou odchylkou 9 bodů. Určete pravděpodobnost, že a) náhodně vybraný student bude mít výsledek lepší než 80 bodů, b) průměr výsledků náhodného výběru 10 studentů bude lepší než 80 bodů. Příklad Rychlost letadla byla určována v 5 zkouškách, jejichž aritmetický průměr byl M = 870,3 ms^1. Najděte 95% interval spolehlivosti pro /i, víte-li, že měření rychlosti se řídí normálním rozdělením se směrodatnou odchylkou 2,1 ms^1. Náhodný výběr Bodové a intervalové odhady Testování hypotéz OOOOOOOOO0OO oooooooooooo oooooooooooooo Dva nezávislé výběry z normálního rozdělení Nechť je Xn,..., Xmi náhodný výběr rozsahu m z rozdělení A/(/x, a\) a X12,..., X„2 je na něm nezávislý náhodný výběr rozsahu n z rozdělení N(fi, a\), přičemž m, n > 2. Označme M\, M2 jejich výběrové průměry a S%, S| výběrové rozptyly. Dále necht je 2=(m-l)S* + (n-l)Sj m + n - 2 vážený průměr výběrových rozptylů. Pak platí: • Mi — M2 a S2 jsou stochasticky nezávislé, • Mi - M2 ~ A/(/xi -fl2,d + ň)i • je-li o\ = aj pa/c • F : {m + n-2)Sl/a2^x2{m + n-2) F(m- l,n-l). Náhodný výběr Bodové a intervalové odhady Testování hypotéz oooooooooo»o oooooooooooo oooooooooooooo Užití statistik dvou nezávislých výberu • Statistika U, vzniklá normováním M\ — M2, se používá pro odhad rozdílu \i\ — [12, známe-li rozptyly a2, a2. • Je-1i a\ = a\ = a2, pak statistika T (vzniklá z U nahrazením teoretického společného rozptylu a2 váženým průměrem výběrových rozptylu S2) slouží pro odhad rozdílu \i\ — [12, neznáme-li rozptyl a2. • Statistika K = (m + n — 2)S2/a2 slouží k odhadu společného rozptylu a2. • Statistika F = \. \ slouží k odhadu podílu rozptylu o\ja\. Náhodný výběr ooooooooooo* Bodové a intervalové odhady oooooooooooo Testování hypotéz oooooooooooooo Príklad Mějme dva nezávislé náhodné výběry; první rozsahu 10 z rozdělení A/(2; 1,5) a druhý rozsahu 5 z rozdělení A/(3, 4). Určete pravděpodobnost, že výběrový průměr prvního výběru bude menší než výběrový průměr druhého výběru. P(Mi < M2) = P(Mi - M2 < 0) p - (Mi - M2) - (/ii - /i2) < 0 - (/ii - /i2) 2 2 21 + ^2 m ' n 2 2 li _L 12 m ' n p\u<-HL LŘ. _L 1 10 t 5 . cŕ(l,05) = 0,853. P(Ľ < 1,05) Náhodný výběr Bodové a intervalové odhady Testovaní hypotéz oooooooooooo •ooooooooooo oooooooooooooo Náhodný výběr je n-tice nezávislých náhodných veličin se stejným rozdělením, které záleží na jednom nebo více parametrech. Obvykle přitom hodnotu těchto parametrů neznáme, ale můžeme tuto hodnotu nebo hodnotu nějaké jeho funkce (tzv. parametrické funkce) z náhodného výběru odhadnout. Definice Mějme náhodný výběr Xl,... ,X„, které závisí na (obecně vektorovém) parametru 9. Bodovým odhadem parametru 9 rozumíme statistiku 7~(Xi,... ,X„), která je v nějakém smyslu blízko parametru 9. Rozdíl (příp. vektorový) E(T) — 9 nazveme vychýlení, je-li E(T) = 9, pak odhad T nazveme nestranným. Intervalovým odhadem parametru 9 rozumíme (obecně vícerozměrný) interval (7/_, Tu), kde 7/_(Xi,..., X„) a 7~l/(xi, ... ,X„) jsou statistiky výběru (Xi,... ,X„). Platí-1i P{TL<9< Tu) = l-a, říkáme, že (7/., Tu) je interval spolehlivosti 1 — a pro parametr 9 . Náhodný výběr oooooooooooo Bodové a intervalové odhady o»oooooooooo Testování hypotéz oooooooooooooo Definice Jsou-li 7~i, T2 nestranné odhady parametru 9, říkáme, že odhad 7~i je lepší než odhad 7~2, pokud D(7~i) < D(7~2), příp. var 7"i < var 7~2 (tj. matice var T2 — var 7"i je pozitivně definitivní). O posloupnosti Tn odhadu 9 říkáme, že je asymptoticky nestranná, pokud limn^oo E(Tn) = 9. O posloupnosti Tn odhadu 9 říkáme, že je konzistentní, pokud y\m„^00P{\T„-9\ a2 (známe fi) V^-a/2(")' XÍ/2(n) J Náhodný výběr oooooooooooo Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz oooooooooooooo Príklad Nechť Xi,..., X„ je náhodný výběr z rozdělení A/(/x; 0,1). Jaký musí být minimální rozsah výběru, aby velikost 95% intervalu spolehlivosti pro fi nepřesáhla číslo 0,03? Řešení Podle předchozí tabulky dostáváme (pro a = 0,05) 0,03 > M + 4="i-<*/2 - (M - -^=Ul_a/2) v" vn = Z—ž=ul-a/2- Jn 1 Proto Aa2u2 n > l-a/2 0,032 1707,38 a rozsah výběru tedy musí splňovat n > 1708. Náhodný výběr Bodové a intervalové odhady Testovaní hypotéz oooooooooooo oooooooo»ooo oooooooooooooo Intervaly spolehlivosti pro parametry 2 normálních rozdělení A'i ~~ f-2 (známe u2, a2) fJ-i — (nezn. a\ = a2) M1-M2±S*yJ± + ^i-a/2(m + n - 2) společný rozptyl a2 / {m+n-2)Sl {m+n-2)Sl \ V XÍ_a/2(m+n-2)' xÍ/2(m+n-2) J podíl rozptylů a\ja\ 1 sa Si Si/Si ) V^l-c^O-l,"-!)' Fa/2(m-l,n-l) Pokud a priori nevíme, jestli jsou rozptyly shodné, můžeme to ověřit tak, že nejprve sestrojíme interval spolehlivosti pro o\ja\. Obsahuje-li 1, lze (s pravděpodobností 1 — a) považovat rozptyly za shodné a tento rozptyl odhadovat pomocí statistiky K, jak je uvedeno v tabulce. Náhodný výběr Bodové a intervalové odhady Testování hypotéz oooooooooooo ooooooooo»oo oooooooooooooo Inteval spolehlivosti pro výběr z dvourozměrného rozdělení Nechť (Xi, Yi),..., (X„, Yn) je výběr z rozdělení N2 Vi\ (0"l 0"12 ' \&12 o\ Označíme fi = \i\ — [12 a zavedeme rozdílový výběr Z; = X; — Y,. Pak statistika T = výběru Z má ř-rozdělení s n — 1 stupni volnosti, proto jsou hranice intervalu spolehlivosti l — a pro fi rovny M± S -7=h-a/2{n ~ !)• v n Náhodný výběr oooooooooooo Bodové a intervalové odhady oooooooooo»o Testovaní hypotéz oooooooooooooo U šesti nových automobilu bylo testováno, nakolik se sjíždějí pneumatiky na předních kolech. Byly naměřeny tyto hodnoty (v mm): číslo auta 1 2 3 4 5 6 sjetí pravé pneu 1,8 1,0 2,2 0,9 1,5 1,6 sjetí levé pneu 1,5 1,1 2,0 1,1 1,4 1,4 Předpokládejte, že jde o realizaci náhodného výběru z dvourozměrného normálního rozdělení a rozhodněte, jestli nedochází k výraznějšímu nesymetrickému sjíždění pneumatik (tj. sestrojte 95% interval spolehlivosti pro fi = [i-i). Náhodný výběr oooooooooooo Bodové a intervalové odhady 00000000000» Testování hypotéz oooooooooooooo Řešení Postupně vypočteme: Z = (0,3; -0,1; 0,2; -0,2; 0,1; 0,2), M = 0,0833, S = 0,1941. Pak jsou krajními body hledaného 95% intervalu spolehlivosti M ± -=Ui_a/2(n - 1) = 0,0833 ± 0,1941 • 2,5706/76, tj. (-0,12;0,29). Poznamenejme, že snadno odvodíme i míru rizika, se kterou bychom mohli tvrdit, že je \i\ > fi2, tj. že pravé pneumatiky se sjíždějí více než levé. Je to takové číslo a, aby příslušný interval spolehlivosti neobsahoval číslo O - v našem případě je a = 0,34, což je riziko příliš vysoké. Náhodný výběr oooooooooooo Bodové a intervalové odhady OOOOOOOOOOOO Testovaní hypotéz •OOOOOOOOOOOOO' Testovaní hypotéz umožňuje na základě náhodného výběru s danou pravděpodobností ověřovat domněnky o rozdělení, z něhož pochází daný náhodný výběr. Hypotézou budeme rozumět nějaké tvrzení o parametrech tohoto rozdělení. Definice Hq .. . nulová hypotéza (např. 9 = c, kde c vyjadřuje naši domněnku o hodnotě parametru 9) H\ ... (oboustranná) alternativní hypotéza (obvykle negace nulové) Testováním Ho oproti alternativní hypotéze rozumíme postup založený na náhodném výběru, s jehož pomocí platnost Ho zamítneme nebo nezamítneme (= připouštíme). Chyba 1. druhu ... Ho platí a my ji zamítneme (závažnější) Chyba 2. druhu ... Ho neplatí a my ji nezamítneme Pravděpodobnost chyby 1. druhu se nazývá hladina významnosti (a, obvykle a = 0,05), pravděpodobnost chyby 2. druhu se značí /3 a číslo 1 — /3 se nazývá síla testu. Náhodný výběr oooooooooooo Bodové a intervalové odhady OOOOOOOOOOOO Testovaní hypotéz o»oooooooooooo< Způsoby testovaní nulové hypotézy O pomoci intervalu spolehlivosti Q pomoci kritického oboru O pomoci tzv. p—hodnoty (p-value) Interval spolehlivosti Na základě realizace náhodného výběru sestrojíme 100(1 — a)% interval spolehlivosti pro neznámý parametr 9 a zjistíme, zda c patří do tohoto intervalu. Pokud ano, hypotézu Ho nezamítáme (v opačném případě zamítáme) na hladině významnosti a. Kritický obor Stanovení kritického oboru je postup do jisté míry obrácený. Nejprve (i bez náhodného výběru) zvolíme vhodnou statistiku T a množinu hodnot, jichž může T nabývat, rozdělíme na dvě disjunktní podmnožiny: obor nezamítnutí Ho (značíme V) a kritický obor W (obor zamítnutí Ho). Pokud realizace T padne do W, pak hq zamítneme, jinak nezamítáme. Náhodný výběr oooooooooooo Bodové a intervalové odhady OOOOOOOOOOOO Testovaní hypotéz oo»ooooooooooo< Stanovení kritického oboru na hladině a Pro statistiku T [testové kritérium) stanovíme obor nezamítnutí V jako interval, jehož hraniční body tvoří kvantil a/2 a 1 — a/2, odtud je W = (-00, F_1(a/2)) U (F_1(l - a/2), 00). Náhodný výběr Bodové a intervalové odhady Testování hypotéz OOOOOOOOOOOO OOOOOOOOOOOO OOOOOOOOOOOOOO' Způsoby testovaní nulové hypotézy p-hodnota Testovaní pomoci p-hodnoty je jednoduchý test, umožněný rozšířením statistických balíků, p-hodnota udává nejnižší možnou hladinu významnosti, při níž Ho zamítáme. Je-li p-hodnota > a, hypotézu Ho nezamítáme, pro p-hodnotu menší než a, hypotézu zamítneme. p-hodnota se stanoví rovněž se znalostí konkrétní realizace íq statistiky T náhodného výběru jako p = 2min{P(7"< t0),P(T> to)}. Náhodný výběr oooooooooooo Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz oooo»ooooooooo< Testovaní hypotézy proti jednostranné alternativě Je-li Ho hypotéza 9 = c, pak levostranná alternativní hypotéza je tvrzení 9 < c, pravostranná alternativní hypotéza je tvrzení 9 > c. Volba typu alternativní hypotézy vyplýva z konkrétní situace. Príklad • V predmetu Matematika 3 psali studenti písemku rozdělení na 2 skupiny. Hypotéza Ho : obě zadání mají stejnou průměrnou obtížnost je testována oproti oboustranné alternativní hypotéze zadání nejsou stejně obtížná. • V předmětu Matematika 3 se dříve po studentech nevyžadovalo řešení domácích úloh. Toto bylo nyní nově zavedeno s cílem dosažení lepších výsledků studentů u závěrečné zkoušky. V tomto případě zřejmě použijeme nulovou hypotézu Ho : výsledné bodové hodnocení se nezlepšilo oproti pravostranné alternativní hypotéze Hl : bodový výsledek studentů se zlepšil Príklad Náš protivník hodil 60x kostkou a padla mu 16x šestka. Testujme na hladině významnosti a = 0,05 nulovou hypotézu Ho : kostka není upravená oproti jednostranné alternativní hypotéze Hl : kostka je upravená tak, aby padalo více šestek. Řešení Statistika T (počet šestek) ma rozdělení T ~ 6/(60,1/6). Kritický obor je dán 95. percentilem tohoto rozdělení. Snadno vypočteme, že P(T > 14) = 0,065 a P(T > 15) = 0,034, proto je p-hodnota rovna 0,034 (nebo jinými slovy: kritickým oborem na hladině 0,05 je interval (16, oo). Hypotézu Ho tedy zamítáme - na hladině 0,05 můžeme tvrdit, že kostka je upravená. Náhodný výběr OOOOOOOOOOOO Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz oooooo»ooooooo< ídnodiK pokr. Řešení (pomocí aproximace) Porovnejme předchozí řešení příkladu s řešením, při kterém využijeme aproximaci pomocí de Moive-Laplaceovy věty. Náhodnou veličinu 7-10 X lze považovat za veličinu mající normální rozdělení N(fi,a2) s jednotkovým rozptylem a2 = 1, testovat budeme hypotézu fi = 0. Kritickým oborem A/(0,1) je interval (1,65, oo) (stále uvažujeme pravostranou alternativu). Přitom pro realizaci statistiky X platí x = (16 — 10)/-\/50/6 Ri 2,08 a hypotézu tedy opět zamítáme. Jednostranným intervalem spolehlivosti pro X je ((2,08— l,65)/\/60, oo) a protože do něj nepatří hodnota 0 zamítáme nulovou hypotézu (všimněte si, že v obou případech rozhodlo porovnání 1,65 < 2,08). Řešení (pomocí aproximace a p-hodnoty ) Určeme nejmenší pravděpodobnost p, při níž stále ještě zamítáme nulovou hypotézu fi = 0 oproti pravostranné hypotéze fi > 0 (tj. p-hodnotu). Má-li X rozdělení A/(0,1), pak p = P(X > 2,08) = 1 - 0,981 = 0,019. Protože je a = 0,05 > 0,019, opět hypotézu zamítáme. Náhodný výběr oooooooooooo Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz oooooooo»ooooo< Základní testy hypotéz o parametrech normálního rozdělení Podobně jako statistiky při konstrukci intervalů spolehlivosti jsou i základní testy standardizované (není divu - jak jsme viděli, jde o úzce propojené pojmy). z-test Nechť je Xi,... ,X„ náhodný výběr z rozdělení A/(/x, a2) se známým a2 a n > 2. Test Hq : fi = c proti alternativní hypotéze /i / c se nazývá z-test. jednovýběrový t-test Nechť je Xi,... ,X„ náhodný výběr z rozdělení N(fi,a2) s neznámým a2 a n > 2. Test Ho : /x = c proti alternativní hypotéze /i / c se nazývá jednovýběrový t-test. dvouvýběrový t-test Nechť je Xn,..., Xmi náhodný výběr z rozdělení A/(/íi, a2) a X12,..., X„2 na něm nezávislý náhodný výběr z rozdělení A/(/i2,cr2) s m, n > 2 a neznámým u2. Test Ho : \i\ — [12 = c proti Hi : /ii — /i2 7^ c se nazývá dvouvýběrový t-test. Náhodný výběr oooooooooooo Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz ooooooooo»oooo< Základní testy hypotéz o parametrech normálního rozdělení párový t-test Nechť je (Xi, Vi)7",..., (X„, Yn) výběr z rozdělení s n > 2 a neznámými parametry. Test Ho : /ii — fi2 = c oproti /7i : /ii — /x2 7^ c se nazývá párový t-test. F-test Nechť je Xn,... ,Xmi náhodný výběr z rozdělení A/(/íi,o"i) a Xi2,...,X„2 na něm nezávislý náhodný výběr z rozdělení A/(/i2, cr|) s m, n > 2. Test Ho : = 1 proti Hi : a\ja\ 7^ 1 se nazývá F-test. test rozptylu Nechť je Xi,... ,Xn náhodný výběr z N(fi,a2) s neznámým /ia/i>2. Test Hq \ a2 = c proti Hi : u2 7^ c se nazývá test o rozptylu. Náhodný výběr Bodové a intervalové odhady Testování hypotéz OOOOOOOOOOOO OOOOOOOOOOOO OOOOOOOOOO0OOO' Kritický obor testů normálního rozdělení z-test \(M-c)/(a/^~n)\ > Ul_a/2 jednovýběrový t-test |(M — c)/(S/^fh~)\ > t1_a/2{n — 1) dvouvýběrový t-test Mi - M2 - c * >' m ' n > h-a/2(m + n - 2) párový t-test sestrojením rozdílu Z/ = X; — Y; a fi = [i\ — fi2 úlohu předvedeme na jednovýběrový t— test F-test S2/S| < Fa/2(m — 1, n — 1) nebo S2/S2 > FW2(m-l,n-l) test rozptylu (n — l)S2/c < X^í" ~~ 1) neb° (n-l)S2/c>X2_a/2(n-l) Náhodný výběr oooooooooooo Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz OOOOOOOOOOOSOO' Príklad Aktivní studenti chtěli dopravnímu podniku dokázat, že autobusy trpí většími výkyvy příjezdových dob na danou zastávku než tramvaje a provedli měření odchylek od jízdního řádu: autobus 0 2 4 -3 2 -4 -3 0 0 5 tramvaj 4 6 3 0 -2 2 0 1 1 0 Z tabulky lze snadno vypočítat, že = 9,12 a S| = 5,39. Q Na hladině 0,05 testujte nulovou hypotézu, že autobus i tramvaj jsou stejně spolehlivé oproti alternativní hypotéze, že tramvaj je spolehlivější. 0 Určete maximální pravděpodobnost, s níž můžete tvrdit, že je tramvaj spolehlivější než autobus. Náhodný výběr oooooooooooo Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz oooooooooooo»o< Príklad Ve dvou nádržích se zkoumal obsah chlóru. Z první bylo odebráno 22 vzorků, z druhé 10 vzorků. Byly vypočteny následující hodnoty výběrových průměrů a rozptylů: M\ = 34,23, M2 = 35,73, S2 = 1,76, S| = 1,81. Hodnoty zjištěné z odebraných vzorků považujeme za realizace dvou nezávislých náhodných výběrů z rozdělení A/(/íi,u2), resp. N(fi2,a2). Sestrojte 95% interval spolehlivosti pro rozdíl středních hodnot \i\ — fi2 a vyslovte závěr na dané hladině spolehlivosti o podstatnosti rozdílu naměřených hodnot. Řešení Dosadíme do vztahu M1 - M2 ± S*y ^ + \ ■ t-y_ai2{m + n - 2) hodnoty M\ — M2 = —1,5, S* = 1,3323 a dostaneme interval (—2,5377; —0,4623). Do tohoto intervalu 0 nepatří, proto je rozdíl /íi — fi2 statisticky významně různý od nuly. Náhodný výběr oooooooooooo Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz 0000000000000» Komplexní příklad na dvouvýběrový t-test Příklad Uvažme bodové výsledky studentů z 2. termínu zkoušky předmětu MB103 v roce 2008, přičemž výsledky testů skupiny A a skupiny B považujeme za dva nezávislé výběry z normálního rozdělení. Úkolem je zjistit, jestli výsledky některé ze skupin byly statisticky významně horší. Testujme nulovou hypotézu Ho : \i\ — [12 = 0 oproti alternativní hypotéze H\ : \i\ 7^ fi2- Nejprve pomocí F-testu otestujeme hypotézu o stejných rozptylech, v případě úspěchu poté použijeme dvouvýběrový t-test. Vypočteme základní statistiky: rozsa h výb. průměr výb. rozptyl A 65 10,48 22,49 B 64 7,21 29,75 Náhodný výběr oooooooooooo Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz OOOOOOOOOOOOOO' Řešení (Komplexní příklad na dvouvýběrový t-test (pokr.)) Dostáváme S2/S| = 0,76 a protože F(0,025; 64; 63) = 0,61, nezamítáme hypotézu o rovnosti rozptylů. O tomtéž se přesvědčíme i vypočtením intervalu spolehlivosti Si/S: sl/sl _~'l/~'2_ _~'l/~'2 Fi-a/2{m - 1, n - 1)' Fa/2{m - 1, n 1), (0,46; 1,24), v němž leží testovaný podíl rozptylů 1. Budeme tedy dále s výběry pracovat s předpokladem, že mají stejný rozptyl a použijeme dvouvýběrový t-test. Náhodný výběr OOOOOOOOOOOO Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz OOOOOOOOOOOOOO Řešení (Komplexní příklad na dvouvýběrový t-test (pokr.)) Vypočteme vážený průměr výběrových rozptylů s2 = (m-l)S2 + (n-l)S2 ^ 2 * m + n — 2 dále Mi — M2 = 3,27. V tabulkách najdeme hodnotu ř0,975(65 + 64 - 2) = 1,98, a protože Mi - M2 7 =- « 3,64, S*V 65 + 64 docházíme k závěru, že můžeme hypotézu o stejné střední hodnotě obou rozdělení (tj. hypotézu \i\ = ^2) zamítnout (neboť 3,64 > 1,98).Toto opět ověříme výpočtem intervalu spolehlivosti, který má střed v Mi — M2 a velikost rovnou dvojnásobku S*\Jm + n " ři-a/2(m + " - 2) ~ 1J8, proto je interval spolehlivosti roven (1,49; 5,05).