Kapitola 5.: Úlohy o dvou nezávislých náhodných výběrech z normálních rozložení 5.1. Motivace V tomto případě je naším úkolem porovnat střední hodnoty či rozptyly dvou normálních rozložení na základě znalosti dvou nezávislých náhodných výběrů pořízených z těchto rozložení. Zpravidla konstruujeme intervaly spolehlivosti pro rozdíl středních hodnot nebo podíl rozptylů respektive hodnotíme shodu středních hodnot pomocí dvouvýběrového t-testu a shodu rozptylů pomocí F-testu. 5.2. Rozložení statistik odvozených z výběrových průměru a výběrových rozptylu Nechť 1n11 1 X,,X K je náhodný výběr z rozložení N(1, 1 2 ) a 2n12 2 X,,X K je na něm nezávislý náhodný výběr z rozložení N(2, 2 2 ), přičemž n1 2 a n2 2. Označme M1, M2 výběrové průměry a S1 2 , S2 2 výběrové rozptyly. Pak platí: a) Statistiky M1 ­ M2 a 2 *S = 2nn S)1n(S)1n( 21 2 22 2 11 -+ -+- jsou stochasticky nezávislé. b) M1 ­ M2 ~ N(1 ­ 2, 2 2 2 1 2 1 nn + ), tedy U = ( ) ( ) 2 2 2 1 2 1 2121 nn MM + --- ~ N(0, 1). (Pivotová statistika U slouží k řešení úloh o 1- 2, když 1 2 a 2 2 známe.) c) Jestliže 1 2 = 2 2 =: 2 , pak K = 2 2 *21 S)2nn( -+ ~ 2 (n1 + n2 - 2). (Pivotová statistika K slouží k řešení úloh o neznámém společném rozptylu 2 .) d) Jestliže 1 2 = 2 2 =: 2 , pak T = ( ) ( ) 21 * 2121 n 1 n 1 S MM + --- ~ t(n1 + n2 ­ 2). (Pivotová statistika T slouží k řešení úloh o 1- 2, když 1 2 a 2 2 neznáme, ale víme, že jsou shodné.) e) F = 2 2 2 1 2 2 2 1 / S/S ~ F(n1 ­ 1, n2 ­ 1). (Pivotová statistika F slouží k řešení úloh o 1 2 / 2 2 .) 5.2.1. Příklad Nechť jsou dány dva nezávislé náhodné výběry, první pochází z rozložení N(2, 1,5) a má rozsah 10, druhý pochází z rozložení N(3, 4) a má rozsah 5. Jaká je pravděpodobnost, že výběrový průměr 1. výběru bude menší než výběrový průměr 2. výběru? Řešení: P(M1 < M2) = P(M1 - M2 < 0) = .8475,0)026,1()026,1U(P 5 4 10 5,1 32 UP nn )(0 nn )()MM( P 2 2 2 1 2 1 21 2 2 2 1 2 1 2121 ==<= + +- <= + -- < + --- S pravděpodobností přibližně 84,8% je výběrový průměr 1. výběru menší než výběrový průměr 2. výběru. 5.3. Intervaly spolehlivosti pro parametrické funkce 1 - 2 , 1 2 / 2 2 Budeme zabývat speciálními případy, kdy za parametrickou funkci h() považujeme rozdíl středních hodnot 1- 2 nebo podíl rozptylů 1 2 / 2 2 dvou normálních rozložení. Při konstrukci intervalu spolehlivosti pro rozdíl středních hodnot buď rozptyly známe nebo neznáme a víme, že jsou shodné či nikoliv. Shodu rozptylů ověřujeme pomocí F-testu. Uvedeme jen přehled vzorců pro meze 100(1-)% empirických intervalů spolehlivosti pro parametrické funkce 1 - 2 , 1 2 / 2 2 . 5.3.1. Přehled vzorců a) Interval spolehlivosti pro 1 - 2, když 1 2 , 2 2 známe (využití pivotové statistiky U = ( ) ( ) 2 2 2 1 2 1 2121 nn MM + --- ~ N(0, 1)) Oboustranný: (d, h) = (m1 ­ m2 ­ 2 2 2 1 2 1 nn + u1-/2, m1 ­ m2 + 2 2 2 1 2 1 nn + u1-/2) Levostranný: (d, ) = (m1 ­ m2 ­ 2 2 2 1 2 1 nn + u1-, ) Pravostranný: (-, h) = (-,m1 ­ m2 + 2 2 2 1 2 1 nn + u1-) b) Interval spolehlivosti pro 1 - 2, když 1 2 , 2 2 neznáme, ale víme, že jsou shodné (využití pivotové statistiky T = ( ) ( ) 21 * 2121 n 1 n 1 S MM + --- ~ t(n1 + n2 ­ 2)) Oboustranný: (d, h) = (m1 ­ m2 ­ 21 * n 1 n 1 s + t1-/2(n1+n2-2), m1 ­ m2 + 21 * n 1 n 1 s + t1-/2(n1+n2-2)) Levostranný: (d, ) = (m1 ­ m2 ­ 21 * n 1 n 1 s + t1-(n1+n2-2), ) Pravostranný: (-, h) = (-, m1 ­ m2 + 21 * n 1 n 1 s + t1-(n1+n2-2)) c) Interval spolehlivosti pro společný neznámý rozptyl 2 (využití pivotové statistiky K = 2 2 *21 S)2nn( -+ ~ 2 (n1 + n2 - 2)) Oboustranný: (d, h) = -+ -+ -+ -+ - )2nn( s)2nn( , )2nn( s)2nn( 212/ 2 2 *21 212/1 2 2 *21 Levostranný: (d, ) = -+ -+ - , )2nn( s)2nn( 211 2 2 *21 Pravostranný: (-, h) = -+ -+ - )2nn( s)2nn( , 21 2 2 *21 d) Interval spolehlivosti pro podíl rozptylů 2 2 2 1 (využití pivotové statistiky F = 2 2 2 1 2 2 2 1 / S/S ~ F(n1 ­ 1, n2 ­ 1)) Oboustranný: (d, h) = ---- )1n,1n(F s/s , )1n,1n(F s/s 21/2 2 2 2 1 21/2-1 2 2 2 1 Levostranný: (d, ) = -- , )1n,1n(F s/s 21-1 2 2 2 1 Pravostranný: (-, h) = -- - )1n,1n(F s/s , 21 2 2 2 1 Upozornění: Není-li v 5.3.1. (b) splněn předpoklad o shodě rozptylů, lze sestrojit aspoň přibližný 100(1-)% interval spolehlivosti pro 1-2. V tomto případě má statistika T přibližně rozložení t( ), kde počet stupňů volnosti = ( ) ( ) ( ) 1n n/s 1n n/s n/sn/s 2 2 2 2 2 1 2 1 2 1 2 2 2 21 2 1 - + - + . Není-li celé číslo, použijeme v tabulkách kvantilů Studentova rozložení lineární interpolaci. 5.3.2. Příklad Ve dvou nádržích se zkoumal obsah chlóru (v g/l). Z první nádrže bylo odebráno 25 vzorků, z druhé nádrže 10 vzorků. Byly vypočteny realizace výběrových průměrů a rozptylů: m1 = 34,48, m2 = 35,59, s1 2 = 1,7482, s2 2 = 1,7121. Hodnoty zjištěné z odebraných vzorků považujeme za realizace dvou nezávislých náhodných výběrů z rozložení N(1, 2 ) a N(2, 2 ). Sestrojte 95% empirický interval spolehlivosti pro rozdíl středních hodnot 1 - 2. Řešení: Úloha vede na vzorec 5.3.1. (b). Vypočteme vážený průměr výběrových rozptylů a najdeme odpovídající kvantily Studentova rozložení: 2 *s = 7384,1 33 7121,197482,124 2nn s)1n(s)1n( 21 2 22 2 11 = + = -+ -+- , t0,975(33) = 2,035. Dosadíme do vzorců pro dolní a horní mez intervalu spolehlivosti: d = m1­m2­ 21 * n 1 n 1 s + t1-/2(n1+n2-2) = 34,48­35,59 - 035,2 10 1 25 1 7384,1 + = -2,114 h = m1­m2+ 21 * n 1 n 1 s + t1-/2(n1+n2-2) = 34,48­35,59 + 035,2 10 1 25 1 7384,1 + = -0,106 Zjistili jsme, že -2,114 g/l < 1 - 2 < -0,106 g/l s pravděpodobností aspoň 0,95. 5.3.3. Příklad V příklad 5.3.2. nyní předpokládáme, že dané dva náhodné výběry pocházejí z rozložení N(1, 1 2 ) a N(2, 2 2 ). Sestrojte 95% empirický interval spolehlivosti pro podíl rozptylů. Řešení: Úloha vede na vzorec 5.3.1. (d). d = 28,0 6142,3 7121,1/7482,1 )9,24(F 7121,1/7482,1 )1n,1n(F s/s 975,021/2-1 2 2 2 1 === -- h = 76,2 7027,2/1 7121,1/7482,1 )24,9(F/1 7121,1/7482,1 )9,24(F 7121,1/7482,1 )1n,1n(F s/s 975,0025,021/2 2 2 2 1 ==== -- Dostáváme, že 0,28 < 2 2 2 1 < 2,76 s pravděpodobností aspoň 0,95. 5.4. Testování hypotéz o parametrických funkcích 1 - 2 , 1 2 / 2 2 5.4.1. Přehled testů a) Nechť 1n11 1 X,,X K je náhodný výběr z rozložení N(1, 1 2 ) a 2n12 2 X,,X K je na něm nezávislý náhodný výběr z rozložení N(2, 2 2 ), přičemž n1 2, n2 2 a 1 2 , 2 2 známe. Nechť c je konstanta. Test H0: 1 ­ 2 = c proti H1: 1 ­ 2 c se nazývá dvouvýběrový z-test. b) Nechť 1n11 1 X,,X K je náhodný výběr z rozložení N(1, 2 ) a 2n12 2 X,,X K je na něm nezávislý náhodný výběr rozložení N(2, 2 ), přičemž n1 2 a n2 2 a 2 neznáme. Nechť c je konstanta. Test H0: 1 ­ 2 = c proti H1: 1 ­ 2 c se nazývá dvouvýběrový t-test. c) Nechť 1n11 1 X,,X K je náhodný výběr z rozložení N(1, 1 2 ) a 2n12 2 X,,X K je na něm nezávislý náhodný výběr rozložení N(2, 2 2 ), přičemž n1 2 a n2 2. Test H0: 2 2 2 1 = 1 proti H1: 2 2 2 1 1 se nazývá F-test. 5.4.2. Provedení testů o parametrickcýh funkcích 1 - 2 , 1 2 / 2 2 pomocí kritického oboru a) Provedení dvouvýběrového z-testu Hypotézu H0: 1 ­ 2 = c proti H1: 1 ­ 2 c (resp. H1: 1 ­ 2 < c resp. H1: 1 ­ 2 > c ) zamítáme na hladině významnosti , jestliže 2/1 2 2 2 1 2 1 21 u nn cmm - + -- (resp. -- + -- 1 2 2 2 1 2 1 21 u nn cmm resp. - + -- 1 2 2 2 1 2 1 21 u nn cmm ). b) Provedení dvouvýběrového t-testu Hypotézu H0: 1 ­ 2 = c proti H1: 1 ­ 2 c (resp. H1: 1 ­ 2 < c resp. H1: 1 ­ 2 > c ) zamítáme na hladině významnosti , jestliže )2nn(t n 1 n 1 s cmm 212/1 21 * 21 -+ + -- - (resp. )2nn(t n 1 n 1 s cmm 211 21 * 21 -+- + -- - resp. )2nn(t n 1 n 1 s cmm 211 21 * 21 -+ + -- - ) . c) Provedení F-testu Hypotézu H0: 2 2 2 1 = 1 proti H1: 2 2 2 1 1 (resp. H1: 2 2 2 1 < 1 resp. H1: 2 2 2 1 > 1) zamítáme na hladině významnosti , jestliže 2 2 2 1 s s F/2(n1+n2-2) nebo 2 2 2 1 s s F1-/2(n1+n2-2) (resp. 2 2 2 1 s s F(n1+n2-2) resp. 2 2 2 1 s s F1-(n1+n2-2)). Podobně jako v kapitole 4 musíme ověřit normalitu dat. Pokud výběry menších rozsahů (pod 30) vykazují výraznější odchylky od normality, doporučuje se místo dvouvýběrového t- testu použít neparametrický dvouvýběrový Wilcoxonů test (viz kapitola 7). Před provedením dvouvýběrového t-testu bychom se měli F-testem přesvědčit o shodě rozptylů. Zamítne-li F-test na dané hladině významnosti hypotézu o shodě rozptylů, musíme pro testování hypotézy o shodě středních hodnot použít speciální variantu dvouvýběrového t- testu, tzv. dvouvýběrový t-test se separovanými odhdy rozptylů. Musíme si být vědomi rozdílu mezi dvouvýběrovým t-testem a párovým t-testem. Dvouvýběrový t-test je založen na předpokladu nezávislosti daných dvou výběrů. Pokud v situaci, která vede na párový test, použijeme dvouvýběrový t-test, můžeme dostat nepravdivé výsledky. Naopak, mají-li dva nezávislé výběry stejný rozsah a my použijeme párový t-test místo dvouvýběrového t-testu, nedopustíme se hrubé chyby, pouze méně efektivně využijeme informaci obsaženou v datech. 5.4.3. Příklad Výrobce limonád chtěl zjistit, zda změna technologie výroby se projeví v prodeji limonád. Proto sledoval po 14 náhodně vybraných dnů před zavedením nových limonád tržby v určitém regionu a zjistil, že za den utržil v průměru 39 600 Kč se směrodatnou odchylkou 5 060 Kč. Po zavedení nových limonád prověřil stejným způsobem tržby v 11 náhodně vybraných dnech v témž regionu a zjistil průměrný příjem 41 200 Kč se směrodatnou odchylkou 4 310 Kč. Předpokládejte, že tržby za starý typ limonád se řídí rozložením N(1, 1 2 ) a tržby za nový typ limonád se řídí rozložením N(2, 2 2 ). a) Na hladině významnosti 0,05 testujte hypotézu H0: 2 2 2 1 = 1 proti H1: 2 2 2 1 1. b) Na hladině významnosti 0,05 testujte hypotézu H0: 1 ­ 2 = 0 proti H1: 1 ­ 2 0. Řešení: ad a) Úloha vede na F-test. Vypočteme realizaci testového kritéria: ,3783,1 4310 5060 s s 2 2 2 2 2 1 == dále najdeme příslušné kvantily: ( ) ( ) ( ) ( ) 5832,310,13F1n,1nF,3077,010,13F1n,1nF 975,021/21025,021/2 ==--==-- - . Protože testové kritérium 2 2 2 1 s s = 1,3783 se nerealizuje v kritickém oboru W = )( ;5832,30,3077;0 , nelze na hladině významnosti 0,05 zamítnout hypotézu o shodě rozptylů. ad b) Úloha vede na dvouvýběrový t-test. Protože jsme na hladině významnosti 0,05 nezamítli hypotézu o shodě rozptylů, můžeme rozptyly 1 2 , 2 2 považovat za shodné a za jejich odhad vezmeme vážený průměr výběrových rozptylů 217,22548165 23 431010506013 s 22 2 * = + = . Vypočteme realizaci testového kritéria: 0687,2)23(t)2nn(t,8363,0 11 1 14 1 217,22548165 4120039600 n 1 n 1 s cmm 975,021/2-1 21 * 21 ==-+-= + - = + -- Protože testové kritérium -0,8363 se nerealizuje v kritickém oboru W = )( - ;0687,22,0687-; , na hladině významnosti 0,05 nelze zamítnout hypotézu o shodě středních hodnot. Kontrolní otázky 1. Které pivotové statistiky používáme při řešení úloh o rozdílu středních hodnot a podílu rozptylů dvou normálních rozložení? 2. Jaké meze má 100(1-)% empirický interval spolehlivosti pro podíl směrodatných odchylek dvou normálních rozložení? 3. V čem spočívá rozdíl mezi dvouvýběrovým z-testem a dvouvýběrovým t-testem? 4. V jakých situacích používáme dvouvýběrový t-test a v jakých a párový t-test? 5. K čemu slouží F-test? Příklady 1. Bylo vylosováno 11 stejně starých selat téhož plemene. Šesti z nich byla předepsána výkrmná dieta č. 1 a zbylým pěti výkrmná dieta č. 2. Průměrné denní přírůstky v Dg za dobu půl roku jsou následující: dieta č. 1: 62, 54, 55, 60, 53, 58 dieta č. 2: 52, 56, 49, 50, 51. Zjištěné hodnoty považujeme za realizace dvou nezávislých náhodných výběrů pocházejících z rozložení N(1, 1 2 ) a N(2, 2 2 ). Sestrojte 95% empirický interval spolehlivosti pro podíl rozptylů a 95% empirický interval spolehlivosti pro rozdíl středních hodnot 1 - 2. Výsledek: 0,1872 Dg2 < 2 2 2 1 < 12,9541 Dg2 s pravděpodobností aspoň 0,95. 0,99 Dg < 1 - 2 < 9,81 Dg s pravděpodobností aspoň 0,95. 2. Pro údaje z příkladu 1. testujte na hladině významnosti 0,05 hypotézu, že obě výkrmné diety mají stejný vliv na hmotnostní přírůstky selat. Výsledek: Testujeme hypotézu H0: 1 - 2 = 0 proti H1: 1 - 2 0 1. způsob ­ pomocí intervalu spolehlivosti. 95% empirický interval spolehlivosti pro 1 - 2 je interval (0,99; 9,81). Neobsahuje nulu, proto H0 zamítáme na hladině významnosti 0,05. 2. způsob ­ pomocí kritického oboru. Protože testové kritérium se realizuje hodnotou 2,771, která patří do kritického oboru ( )-- ;2622,22622,2; , H0 zamítáme na hladině významnosti 0,05. 3. Máme k dispozici relaizace dvou nezávislých náhodných výběrů z rozložení N(1, 2 ) a N(2, 2 ) o rozsazích n1 = 10, n2 = 15. Výběrové průměry se realizovaly hodnotami m1 = 120,56, m2 = 124,13, výběrové rozptyly hodnotami s1 2 = 9,14, s2 2 = 8,95. Lze na základě těchto výsledků zamítnout na hladině významnosti 0,1 nulovou hypotézu H0: 1 - 2 = 0 ve prospěch oboustranné alternativy H1: 1 - 2 0? Výsledek: Nulovou hypotézu zamítáme na hladině významnosti 0,1. 4. (S) V restauraci "U bílého koníčka" měřili ve 20 případech čas obsluhy zákazníka. Výsledky v minutách: 6, 8, 11, 4, 7, 6, 10, 6, 9, 8, 5, 12, 13, 10, 9, 8, 7, 11, 10, 5. V restauraci "Zlatý lev" bylo dané pozorování uskutečněno v 15 případech s těmito výsledky: 9, 11, 10, 7, 6, 4, 8, 13, 5, 15, 8, 5, 6, 8, 7. Na hladině významnosti 0,05 testujte hypotézu, že střední hodnoty doby obsluhy jsou v obou restauracích stejné. Uveďte hodnotu testové statistiky, počet stupňů volnosti, p-hodnotu a rozhodnutí o nulové hypotéze. Výsledek: Vzhled diagnostických grafů svědčí o normalitě dat v obou výběrech. Nejprve je zapotřebí pomocí F-testu ověřit shodu rozptylů. Realizace testového kritéria = 1,493, počet stupňů volnosti = 19 a 14, odpovídající p-hodnota = 0,41044, hypotézu o shodě rozptylů tedy nezamítáme na hladině významnosti 0,05. Shodu středních hodnot otestujeme pomocí dvouvýběrového t-testu. Realizace testového kritéria = 0,1237, počet stupňů volnosti = 33, odpovídající p-hodnota = 0,9023, hypotézu o shodě středních hodnot tedy nezamítáme na hladině významnosti 0,05.