Parametrické úlohy o dvou nezávislých náhodných výběrech z normálních rozložení Motivace: V této situaci je naším úkolem porovnat střední hodnoty či rozptyly dvou normálních rozložení na základě znalosti dvou nezávislých náhodných výběrů pořízených z těchto rozložení. Zpravidla konstruujeme intervaly spolehlivosti pro rozdíl středních hodnot respektive hodnotíme shodu středních hodnot pomocí dvouvýběrového t-testu či dvouvýběrového z-testu a shodu rozptylů pomocí F-testu. Rozložení statistik odvozených z výběrových průměrů a výběrových rozptylů Máme dva nezávislé náhodné výběry, první pochází z rozložení N(µ1, σ1 2 ) a má rozsah n1 ≥ 2, druhý pochází z rozložení N(µ2, σ2 2 ) a má rozsah n2 ≥ 2. Označme M1, M2 výběrové průměry, S1 2 , S2 2 výběrové rozptyly a 2 *S = 2nn S)1n(S)1n( 21 2 22 2 11 −+ −+− vážený průměr výběrových rozptylů. Pak platí: a) Statistiky M1 – M2 a 2 *S = 2nn S)1n(S)1n( 21 2 22 2 11 −+ −+− jsou stochasticky nezávislé. b) U = ( ) ( ) 2 2 2 1 2 1 2121 nn MM σ + σ µ−µ−− ~ N(0, 1). (Pivotová statistika U slouží k řešení úloh o µ1- µ2, když σ1 2 a σ2 2 známe.) c) Nechť σ1 2 = σ2 2 =: σ2 , pak K = 2 2 *21 S)2nn( σ −+ ~ χ2 (n1 + n2 - 2). (Pivotová statistika K slouží k řešení úloh o neznámém rozptylu σ2 .) d) Jestliže σ1 2 = σ2 2 =: σ2 , pak T = ( ) ( ) 21 * 2121 n 1 n 1 S MM + µ−µ−− ~ t(n1 + n2 – 2). (Pivotová statistika T slouží k řešení úloh o µ1- µ2, když σ1 2 a σ2 2 neznáme, ale víme, že jsou shodné.) e) F = 2 2 2 1 2 2 2 1 / S/S σσ ~ F(n1 – 1, n2 – 1). (Pivotová statistika F slouží k řešení úloh o σ1 2 / σ2 2 .) Vysvětlení: ad b) M1-M2 je lineární kombinace náhodných veličin s normálním rozložením, má tedy normální rozložení s parametry E(M1-M2) = µ1- µ2, D(M1-M2) = σ1 2 /n1+ σ2 2 /n2. U se získá standardizací M1-M2. ad c) K1 = 2 2 11 S)1n( σ − ~ χ2 (n1-1) a K2 = 2 2 22 S)1n( σ − ~ χ2 (n2-1) jsou stochasticky nezávislé náhodné veličiny, tedy K = K1+K2 ~ χ2 (n1 + n2 - 2). ad d) U = ( ) ( ) 2 2 1 2 2121 nn MM σ + σ µ−µ−− ~ N(0, 1), K = 2 2 *21 S)2nn( σ −+ ~ χ2 (n1 + n2 - 2) jsou stochasticky nezávislé, protože M1 – M2 a 2 *S jsou stochasticky nezávislé. = −+ = 2nn K U T 21 ( ) ( ) 21 * 2121 n 1 n 1 S MM + µ−µ−− ~ t(n1 + n2 – 2). ad e) K1 = 2 1 2 11 S)1n( σ − ~ χ2 (n1-1) a K2 = 2 2 2 22 S)1n( σ − ~ χ2 (n2-1) jsou stochasticky nezávislé náhodné veličiny, tedy 1n K 1n K 2 2 1 1 F − − = = 2 2 2 1 2 2 2 1 / S/S σσ ~ F(n1 – 1, n2 – 1). Příklad: Nechť jsou dány dva nezávislé náhodné výběry, první pochází z rozložení N(0,28; 0,09) a má rozsah 16, druhý pochází z rozložení N(0,25; 0,04) a má rozsah 25. Jaká je pravděpodobnost, že výběrový průměr 1. výběru bude větší než výběrový průměr 2. výběru? Řešení: ( ) ( ) ( ) 63683,0)35,0()35,0(1)35294,0U(P1 25 04,0 16 09,0 25,028,0 UP1 nn )(0 nn )()MM( P10MMP10MMPMMP 2 2 2 1 2 1 21 2 2 2 1 2 1 2121 212121 =Φ=−Φ−=−≤−=             + +− ≤−= =               σ + σ µ−µ− ≤ σ + σ µ−µ−− −=≤−−=>−=> S pravděpodobností přibližně 63,7% je výběrový průměr 1. výběru větší než výběrový průměr 2. výběru. Výpočet pomocí systému STATISTICA: Statistika M1 - M2 se podle bodu (a) řídí rozložením N(µ1 – µ2, 2 2 2 1 2 1 nn σ + σ ), kde µ1 – µ2 = 0,28 – 0,25 = 0,03, 007225,0 25 04,0 16 09,0 nn 2 2 2 1 2 1 =+= σ + σ , tj. statistika M1 - M2 ~ N(0,03;0,007225). Otevřeme nový datový soubor o jedné proměnné a jednom případu. Do Dlouhého jména této proměnné napíšeme = 1-INormal(0;0,03;sqrt(0,007225)). V proměnné Prom1 se objeví hodnota 0,637934. Intervaly spolehlivosti pro parametrické funkce µ1-µ2, σ1 2 /σ2 2 Uvedeme přehled vzorců pro meze 100(1-α)% empirických intervalů spolehlivosti pro parametrické funkce µ1 - µ2 , σ1 2 / σ2 2 . a) Interval spolehlivosti pro µ1-µ2, když σ1 2 , σ2 2 známe (využití pivotové statistiky U) Oboustranný: (d, h) = (m1 – m2 – 2 2 2 1 2 1 nn σ + σ u1-α/2, m1 – m2 + 2 2 2 1 2 1 nn σ + σ u1-α/2) Levostranný: (d, ∞) = (m1 – m2 – 2 2 2 1 2 1 nn σ + σ u1-α, ∞) Pravostranný: (-∞, h) = (-∞,m1 – m2 + 2 2 2 1 2 1 nn σ + σ u1-α) b) Interval spolehlivosti pro µ1-µ2, když σ1 2 , σ2 2 neznáme, ale víme, že jsou shodné (využití pivotové statistiky T) Oboustranný: (d, h) = (m1 – m2 – 21 * n 1 n 1 s + t1-α/2(n1+n2-2), m1 – m2 + 21 * n 1 n 1 s + t1-α/2(n1+n2-2)) Levostranný: (d, ∞) = (m1 – m2 – 21 * n 1 n 1 s + t1-α(n1+n2-2), ∞) Pravostranný: (-∞, h) = (-∞, m1 – m2 + 21 * n 1 n 1 s + t1-α(n1+n2-2)) c) Interval spolehlivosti pro společný neznámý rozptyl σ2 (využití pivotové statistiky K) Oboustranný: (d, h) =         −+χ −+ −+χ −+ αα− )2nn( s)2nn( , )2nn( s)2nn( 212/ 2 2 *21 212/1 2 2 *21 Levostranný: (d, ∞) =         ∞ −+χ −+ α− , )2nn( s)2nn( 211 2 2 *21 Pravostranný: (-∞, h) =         −+χ −+ ∞− α )2nn( s)2nn( , 21 2 2 *21 d) Interval spolehlivosti pro podíl rozptylů 2 2 2 1 σ σ (využití pivotové statistiky F) Oboustranný: (d, h) =         −−−− αα )1n,1n(F s/s , )1n,1n(F s/s 21/2 2 2 2 1 21/2-1 2 2 2 1 Levostranný: (d, ∞) =         ∞ −−α , )1n,1n(F s/s 21-1 2 2 2 1 Pravostranný: (-∞, h) =         −− ∞− α )1n,1n(F s/s , 21 2 2 2 1 Upozornění: Není-li v bodě (b) splněn předpoklad o shodě rozptylů, lze sestrojit aspoň přibližný 100(1-α)% interval spolehlivosti pro µ1-µ2. V tomto případě má statistika T přibližně rozložení t(ν ), kde počet stupňů volnosti ν = ( ) ( ) ( ) 1n n/s 1n n/s n/sn/s 2 2 2 2 2 1 2 1 2 1 2 2 2 21 2 1 − + − + . Není-li ν celé číslo, použijeme v tabulkách kvantilů Studentova rozložení lineární interpolaci. Příklad: Ve dvou nádržích se zkoumal obsah chlóru (v g/l). Z první nádrže bylo odebráno 25 vzorků, z druhé nádrže 10 vzorků. Byly vypočteny realizace výběrových průměrů a rozptylů: m1 = 34,48, m2 = 35,59, s1 2 = 1,7482, s2 2 = 1,7121. Hodnoty zjištěné z odebraných vzorků považujeme za realizace dvou nezávislých náhodných výběrů z rozložení N(µ1, σ2 ) a N(µ2, σ2 ). Sestrojte 95% empirický interval spolehlivosti pro rozdíl středních hodnot µ1 - µ2. Řešení: Úloha vede na vzorec z bodu (b). Vypočteme vážený průměr výběrových rozptylů a najdeme odpovídající kvantily Studentova rozložení: 2 *s = 7384,1 33 7121,197482,124 2nn s)1n(s)1n( 21 2 22 2 11 = ⋅+⋅ = −+ −+− , t0,975(33) = 2,035 Dosadíme do vzorců pro dolní a horní mez intervalu spolehlivosti: d = m1–m2– 21 * n 1 n 1 s + t1-α/2(n1+n2-2) = = 34,48–35,59 - 035,2 10 1 25 1 7384,1 ⋅+⋅ = -2,114 h = m1–m2+ 21 * n 1 n 1 s + t1-α/2(n1+n2-2) = = 34,48–35,59 + 035,2 10 1 25 1 7384,1 ⋅+⋅ = -0,106 -2,114 g/l < µ1 - µ2 < -0,106 g/l s pravděpodobností aspoň 0,95. Výpočet pomocí systému STATISTICA: Otevřeme nový datový soubor o dvou proměnných d a h a jednom případu. Do Dlouhého jména proměnné d napíšeme =34,48-35,59-sqrt((24*1,7482+9*1,7121)/33)*sqrt((1/25)+(1/10))*VStudent(0,975;33) Do Dlouhého jména proměnné h napíšeme =34,48-35,59+ sqrt((24*1,7482+9*1,7121)/33)*sqrt((1/25)+(1/10))*VStudent(0,975;33) 1 d 2 h 1 -2,11368 -0,10632 S pravděpodobností aspoň 0,95 tedy -2,114 g/l < µ1 - µ2 < -0,106 g/l. Příklad: V předešlém příkladě nyní předpokládáme, že dané dva náhodné výběry pocházejí z rozložení N(µ1, σ1 2 ) a N(µ2, σ2 2 ). Sestrojte 95% empirický interval spolehlivosti pro podíl rozptylů. Řešení: Úloha vede na vzorec z bodu (d). d = 28,0 6142,3 7121,1/7482,1 )9,24(F 7121,1/7482,1 )1n,1n(F s/s 975,021/2-1 2 2 2 1 === −−α h = 76,2 7027,2/1 7121,1/7482,1 )24,9(F/1 7121,1/7482,1 )9,24(F 7121,1/7482,1 )1n,1n(F s/s 975,0025,021/2 2 2 2 1 ==== −−α 0,28 < 2 2 2 1 σ σ < 2,76 s pravděpodobností aspoň 0,95. Výpočet pomocí systému STATISTICA: Otevřeme nový datový soubor o dvou proměnných d a h a jednom případu. Do Dlouhého jména proměnné d napíšeme =(1,7482/1,7121)/VF(0,975;24;9) (Funkce VF(x;ný;omega) počítá x-kvantil Fisherova – Snedecorova rozložení F(ný, omega).) Do Dlouhého jména proměnné h napíšeme =(1,7482/1,7121)/VF(0,025;24;9) 1 d 2 h 1 0,282521 2,759698 S pravděpodobností aspoň 0,95 tedy platí: 0,28 < σ1 2 / σ2 2 < 2,76. Jednotlivé typy testů o parametrických funkcích µ1-µ2, σ1 2 /σ2 2 a) Nechť 1n111 X,,X K je náhodný výběr z rozložení N(µ1, σ1 2 ) a 2n221 X,,X K je na něm nezávislý náhodný výběr z rozložení N(µ2, σ2 2 ), přičemž n1 ≥ 2, n2 ≥ 2 a σ1 2 , σ2 2 známe. Nechť c je konstanta. Test H0: µ1 – µ2 = c proti H1: µ1 – µ2 ≠ c se nazývá dvouvýběrový z-test. b) Nechť 1n111 X,,X K je náhodný výběr z rozložení N(µ1, σ2 ) a 2n221 X,,X K je na něm nezávislý náhodný výběr rozložení N(µ2, σ2 ), přičemž n1 ≥ 2 a n2 ≥ 2 a σ2 neznáme. Nechť c je konstanta. Test H0: µ1 – µ2 = c proti H1: µ1 – µ2 ≠ c se nazývá dvouvýběrový t-test. c) Nechť 1n111 X,,X K je náhodný výběr z rozložení N(µ1, σ1 2 ) a 2n221 X,,X K je na něm nezávislý náhodný výběr rozložení N(µ2, σ2 2 ), přičemž n1 ≥ 2 a n2 ≥ 2. Test H0: 2 2 2 1 σ σ = 1 proti H1: 2 2 2 1 σ σ ≠ 1 se nazývá F-test. Provedení testů o parametrických funkcích µ1-µ2, σ1 2 /σ2 2 pomocí kritického oboru a) Provedení dvouvýběrového z-testu Vypočteme realizaci testového kritéria ( ) 2 2 2 1 2 1 21 0 nn cmm t σ + σ −− = . Stanovíme kritický obor W. Pokud t0 ∈ W, H0 zamítáme na hladině významnosti α a přijímáme H1. Oboustranný test: Testujeme H0: µ1 - µ2 = c proti H1: µ1 - µ2 ≠ c. Kritický obor má tvar: )( ∞∪−∞−= α−α− ,uu,W 2/12/1 . Levostranný test: Testujeme H0: µ1 - µ2 = c proti H1: µ1 - µ2 < c. Kritický obor má tvar: ( α−−∞−= 1u,W . Pravostranný test: Testujeme H0: µ1 - µ2 = c proti H1: µ1 - µ2 > c. Kritický obor má tvar: )∞= α− ,uW 1 . b) Provedení dvouvýběrového t-testu Vypočteme realizaci testového kritéria ( ) 21 * 21 0 n 1 n 1 s cmm t + −− = . Stanovíme kritický obor W. Pokud t0 ∈ W, H0 zamítáme na hladině významnosti α a přijímáme H1. Oboustranný test: Testujeme H0: µ1 - µ2 = c proti H1: µ1 - µ2 ≠ c. Kritický obor má tvar: ( ) ( ) )( ∞−+∪−+−∞−= α−α− ,2nnt2nnt,W 212/1212/1 . Levostranný test: Testujeme H0: µ1 - µ2 = c proti H1: µ1 - µ2 < c. Kritický obor má tvar: ( )( 2nnt,W 211 −+−∞−= α− . Pravostranný test: Testujeme H0: µ1 - µ2 = c proti H1: µ1 - µ2 > c. Kritický obor má tvar: ( ) )∞−+= α− ,2nntW 211 . c) Provedení F-testu Vypočteme realizaci testového kritéria 2 2 2 1 0 s s t = . Stanovíme kritický obor W. Pokud t0 ∈ W, H0 zamítáme na hladině významnosti α a přijímáme H1. Oboustranný test: Testujeme H0: 2 2 2 1 σ σ = 1 proti H1: 2 2 2 1 σ σ ≠ 1. Kritický obor má tvar: ( ) ( ) )( ∞−−∪−−= α−α ,1n,1nF1n,1nF,0W 212/1212/ . Levostranný test: Testujeme H0: 2 2 2 1 σ σ = 1 proti H1: 2 2 2 1 σ σ < 1. Kritický obor má tvar: ( )( 1n,1nF,0W 21 −−= α . Pravostranný test: Testujeme H0: 2 2 2 1 σ σ = 1 proti H1: 2 2 2 1 σ σ > 1. Kritický obor má tvar: ( ) )∞−−= α− ,1n,1nFW 211 . Příklad: V restauraci "U bílého koníčka" měřili ve 20 případech čas obsluhy zákazníka. Výsledky v minutách: 6, 8, 11, 4, 7, 6, 10, 6, 9, 8, 5, 12, 13, 10, 9, 8, 7, 11, 10, 5. V restauraci "Zlatý lev" bylo dané pozorování uskutečněno v 15 případech s těmito výsledky: 9, 11, 10, 7, 6, 4, 8, 13, 5, 15, 8, 5, 6, 8 ,7. Za předpokladu, že uvedené hodnoty pocházejí ze dvou normálních rozložení, na hladině významnosti 0,05 testujte hypotézu, že střední hodnoty doby obsluhy jsou v obou restauracích stejné. Řešení: Na hladině významnosti 0,05 testujeme nulovou hypotézu H0: µ1 - µ2 = 0 proti oboustranné alternativě H1: µ1 – µ2 ≠ 0. Je to úloha na dvouvýběrový t-test. Před provedením tohoto testu je však nutné pomocí F-testu ověřit shodu rozptylů. Na hladině významnosti 0,05 tedy testujeme H0: 2 2 2 1 σ σ = 1 proti H1: 2 2 2 1 σ σ ≠ 1. Nejprve vypočteme m1 = 8,25, m2 = 8,13, s1 2 = 6,307, s2 2 = 9,41, 623,7 33 41,914307,619 2nn s)1n(s)1n( s 21 2 22 2 112 * = ⋅+⋅ = −+ −+− = . Podle vzorce z bodu (c) vypočteme realizaci testové statistiky: 6702,0 41,9 307,6 s s t 2 2 2 1 0 === . Stanovíme kritický obor: ( ) ( ) ) ( ) ( ) ) ( ) ( ) ) ) )∞∪=∞∪=∞∪= =∞∪=∞−−∪−−= α−α ,8607,23778,0;0,8607,26469,2/1,0,14,19F19,14F/1,0 ,14,19F14,19F,0,1n,1nF1n,1nF,0W 975,0975,0 975,0025,0212/1212/ Protože se testová statistika nerealizuje v kritickém oboru, nulovou hypotézu nezamítáme na hladině významnosti 0,05. Rozptyly tedy můžeme považovat za shodné. Nyní se vrátíme k dvouvýběrovému t-testu. Podle vzorce z bodu (b) vypočteme realizaci testové statistiky: 124,0 15 1 20 1 623,7 13,825,8 n 1 n 1 s cmm t 21 * 21 0 = + − = + −− = . Stanovíme kritický obor: ( ) ( ) )( ( ) ( ) )( )( ∞∪−∞−= =∞∪−∞−=∞−+∪−+−∞−= α−α− ,035,2035,2, ,33t33t,,2nnt2nnt,W 975,0975,0212/1212/1 Protože testová statistika se nerealizuje v kritickém oboru, nulovou hypotézu nezamítáme na hladině významnosti 0,05. Výpočet pomocí systému STATISTICA: Otevřeme nový datový soubor o dvou proměnných a 35 případech. První proměnnou nazveme OBSLUHA, druhou ID. Do proměnné OBSLUHA napíšeme nejprve doby obsluhy v první restauraci a poté doby obsluhy ve druhé restauraci. Do proměnné ID, která slouží k rozlišení první a druhé restaurace, napíšeme 20 krát jedničku a 15 krát dvojku. Provedeme dvouvýběrový t-test současně s testem o shodě rozptylů: Statistika – Základní statistiky a tabulky – t-test, nezávislé, dle skupin – OK, Proměnné –Závislé proměnné OBSLUHA, Grupovací proměnná ID – OK. Po kliknutí na tlačítko Souhrn dostaneme tabulku t-testy; grupováno: ID (restaurace) Skup. 1: 1 Skup. 2: 2 Proměnná Průměr 1 Průměr 2 t sv p Poč.plat 1 Poč.plat. 2 Sm.odch. 1 Sm.odch. 2 F-poměr rozptyly p rozptyly OBSLUHA 8,250000 8,133333 0,123730 33 0,902279 20 15 2,510504 3,067495 1,492952 0,410440 Vidíme, že testová statistika pro test shody rozptylů se realizuje hodnotou 1,492952 (je to převrácená hodnota k číslu 0,6702, které jsme vypočítali při ručním postupu), odpovídající p-hodnota je 0,41044, tedy na hladině významnosti 0,05 nezamítáme hypotézu o shodě rozptylů. (Upozornění: v případě zamítnutí hypotézy o shodě rozptylů je zapotřebí v tabulce t-testu pro nezávislé vzorky dle skupin zaškrtnout volbu Test se samostatnými odhady rozptylu.) Dále z tabulky plyne, že testová statistika pro test shody středních hodnot se realizuje hodnotou 0,12373, počet stupňů volnosti je 33, odpovídající p-hodnota 0,902279, tedy hypotézu o shodě středních hodnot nezamítáme na hladině významnosti 0,05. Znamená to, že s rizikem omylu nejvýše 5% se neprokázal rozdíl ve středních hodnotách dob obsluhy v restauracích "U bílého koníčka" a „Zlatý lev“. Tabulku ještě doplníme krabicovými diagramy. Na záložce Detaily zaškrtneme krabicový graf a vybereme volbu Průměr/SmOdch/Min-Max. Krabicový graf z obsluha seskupený id restaurace.sta 2v*35c Průměr Průměr±SmOdch Min-Max Odlehlé Extrémy 1 2 id 2 4 6 8 10 12 14 16 obsluha Z grafu je vidět, že průměrná doba obsluhy v první restauraci je nepatrně delší a má menší variabilitu než ve druhé restauraci. Extrémní ani odlehlé hodnoty se zde nevyskytují. Cohenův koeficient věcného účinku – doplnění významu dvouvýběrového t-testu: Nechť 1n111 X,,X K je náhodný výběr z rozložení N(µ1, σ2 ) a 2n221 X,,X K je na něm nezávislý náhodný výběr rozložení N(µ2, σ2 ), přičemž n1 ≥ 2 a n2 ≥ 2 a σ2 neznáme. Nechť c je konstanta. Testujeme H0: µ1 – µ2 = 0 proti H1: µ1 – µ2 ≠ 0. Označme m1, m2 realizace výběrových průměrů hodnot dané veličiny v těchto dvou skupinách, s1 2 , s2 2 realizace výběrových rozptylů a ( ) ( ) 2nn s1ns1n s 21 2 22 2 112 * −+ −+− = realizaci váženého průměru výběrových rozptylů. Cohenův koeficient d vypočteme podle vzorce: * 21 s mm d − = . Tento koeficient slouží k posouzení velikosti rozdílu průměrů, který je standardizován pomocí odmocniny z váženého průměru výběrových rozptylů. Jedná se o tzv. věcnou významnost neboli velikost účinku skupiny na variabilitu hodnot sledované náhodné veličiny. Velikost účinku hodnotíme podle následující tabulky: Hodnota d účinek aspoň 0,8 velký mezi 0,5 až 0,8 střední mezi 0,2 až 0,5 malý pod 0,2 zanedbatelný (Uvedené hodnoty nemají samozřejmě absolutní platnost, posouzení, jaký účinek považujeme za velký či malý, závisí na kontextu.) Je zapotřebí si uvědomit, že při dostatečně velkých rozsazích náhodných výběrů i malý rozdíl ve výběrových průměrech způsobí zamítnutí nulové hypotézy na hladině významnosti α, i když z věcného hlediska tak malý rozdíl nemá význam. Naopak, máme-li výběry malých rozsahů, pak i značně velký rozdíl ve výběrových průměrech nemusí vést k zamítnutí nulové hypotézy na hladině významnosti α. Příklad: Máme k dispozici údaje o celkovém IQ 856 žáků ZŠ. Zajímáme se jednak o skupinu dětí, jejichž oba rodiče mají pouze základní vzdělání (je jich 296) a jednak o skupinu dětí, jejichž oba rodiče mají vysokoškolské vzdělání (těch je 75). Na hladině významnosti 0,05 budeme testovat hypotézu, že střední hodnota celkového IQ je v obou skupinách stejná a také vypočteme Cohenův koeficient věcného účinku. Řešení: Provedeme dvouvýběrový t-test: t-testy; grupováno:ZŠ a VŠ (IQ) Skup. 1: oba ZŠ Skup. 2: oba VŠ Proměnná Průměr oba ZŠ Průměr oba VŠ t sv p Poč.plat oba ZŠ Poč.plat. oba VŠ Sm.odch. oba ZŠ Sm.odch. oba VŠ F-poměr Rozptyly p Rozptyly IQ_CELK 94,13851 110,9067 -10,6295 369 0,000000 296 75 11,82604 13,60164 1,322829 0,110124 Hypotézu o shodě středních hodnot zamítáme na hladině významnosti 0,05, protože odpovídající p-hodnota je velmi blízká 0 (hypotézu o shodě rozptylů nezamítáme na hladině významnosti 0,05, p-hodnota F-testu je 0,110124, což je větší než 0,05). Krabicový diagram: Krabicový graf z IQ_CELK seskupený ID Průměr Průměr±SmOdch Min-Max Odlehlé Extrémy oba ZŠ oba VŠ ID 50 60 70 80 90 100 110 120 130 140 150 IQ_CELK Vidíme, že průměrné celkové IQ dětí v 1. skupině je 94,1, zatímco ve 2. skupině 110,9. Vliv skupiny na variabilitu hodnot celkového IQ posoudíme pomocí Cohenova koeficientu. 1 n1 2 n2 3 m1 4 m2 5 s1 6 s2 7 d 1 296 75 94,13851 110,9067 11,82604 13,60164 1,374117 Cohenův koeficient nabývá hodnoty 1,37, tudíž vliv skupiny na variabilitu hodnot celkového IQ lze považovat za velký. Příklad: Výrobce limonád chtěl zjistit, zda změna technologie výroby se projeví v prodeji limonád. Proto sledoval po 14 náhodně vybraných dnů před zavedením nových limonád tržby v určitém regionu a zjistil, že za den utržil v průměru 39 600 Kč se směrodatnou odchylkou 5 060 Kč. Po zavedení nových limonád prověřil stejným způsobem tržby v 11 náhodně vybraných dnech v témž regionu a zjistil průměrný příjem 41 200 Kč se směrodatnou odchylkou 4 310 Kč. Předpokládejte, že tržby za starý typ limonád se řídí rozložením N(µ1, σ2 ) a tržby za nový typ limonád se řídí rozložením N(µ2, σ2 ). Na hladině významnosti 0,05 testujte hypotézu H0: µ1 – µ2 = 0 proti oboustranné alternativě H1: µ1 – µ2 ≠ 0. Řešení: Za odhad společného neznámého rozptylu vezmeme vážený průměr výběrových rozptylů: 217,22548165 23 431010506013 s 22 2 * = ⋅+⋅ = . Realizace testového kritéria: 8363,0 11 1 14 1 217,22548165 4120039600 n 1 n 1 s cmm t 21 * 21 0 −= + − = + −− = Kritický obor: ( ) ( ) )( ( ) ( ) )( )( ∞∪−∞−=∞∪−∞−= =∞−+∪−+−∞−= α−α− ,0687,20687,2,,23t23t, ,2nnt2nnt,W 975,0975,0 212/1212/1 Protože testové kritérium se nerealizuje v kritickém oboru, na hladině významnosti 0,05 nelze zamítnout hypotézu o shodě středních hodnot. Výpočet pomocí systému STATISTICA: Statistiky – Základní statistiky a tabulky – Testy rozdílů: r, %, průměry – OK – vybereme Rozdíl mezi dvěma průměry (normální rozdělení) – do políčka Pr1 napíšeme 39600, do políčka SmOd1 napíšeme 5600, do políčka N1 napíšeme 14, do políčka Pr2 napíšeme 41200, do políčka SmOd1 napíšeme 4310, do políčka N1 napíšeme 14 - Výpočet. Dostaneme phodnotu 0,4116 tedy nezamítáme nulovou hypotézu na hladině významnosti 0,05. Jelikož p-hodnota je větší než hladina významnosti 0,05, H0 nezamítáme na hladině významnosti 0,05. Znamená to, že změna technologie výroby se neprojevila ve střední hodnotě tržeb. Parametrické úlohy o jednom náhodném výběru z alternativního rozložení Opakování: Alternativní rozložení: Náhodná veličina X udává počet úspěchů v jednom pokusu, přičemž pravděpodobnost úspěchu je ϑ. Píšeme X ~ A(ϑ). π(x) =      =ϑ =ϑ− jinak0 1xpro 0xpro1 neboli π(x) = ( )    =ϑ−ϑ − jinak0 10,xpro1 x1x Binomické rozložení: Náhodná veličina X udává počet úspěchů v posloupnosti n nezávislých opakovaných pokusů, přičemž pravděpodobnost úspěchu je v každém pokusu ϑ. Píšeme X ~ Bi(n,ϑ). π(x) =      =ϑ−ϑ      − jinak0 n,0,xpro)1( x n xnx K E(X) = nϑ , D(X) = nϑ (1-ϑ ) (Alternativní rozložení je speciálním případem binomického rozložení pro n = 1. Jsou-li X1, ..., Xn stochasticky nezávislé náhodné veličiny, Xi ~ A(ϑ ), i = 1, ..., n, pak X = ∑ = n 1i iX ~ Bi(n, ϑ ).) Centrální limitní věta: Jsou-li náhodné veličiny X1, …, Xn stochasticky nezávislé a všechny mají stejné rozložení se střední hodnotou µ a rozptylem σ2 , pak pro velká n (n ≥ 30) lze rozložení součtu ∑= n 1i iX aproximovat normálním rozložením N(nµ, nσ2 ). Zkráceně píšeme ( )2 n 1i i n,nNX σµ≈∑= . Pokud součet ∑= n 1i iX standardizujeme, tj. vytvoříme náhodnou veličinu n nX U n 1i i n σ µ− = ∑= , pak rozložení této náhodné veličiny lze aproximovat standardizovaným normálním rozložením. Zkráceně píšeme Un ≈ N(0,1) Asymptotické rozložení statistiky odvozené z výběrového průměru. Nechť X1, ..., Xn je náhodný výběr z rozložení A(ϑ) a nechť je splněna podmínka ( ) 91n >ϑ−ϑ . Pak statistika ( ) n 1 M U ϑ−ϑ ϑ− = konverguje v distribuci k náhodné veličině se standardizovaným normálním rozložením. (Říkáme, že U má asymptoticky rozložení N(0,1) a píšeme U ≈ N(0,1).) Vysvětlení: Protože X1, ..., Xn je náhodný výběr z rozložení A(ϑ), bude mít statistika Yn = ∑ = n 1i iX (výběrový úhrn) rozložení Bi(n, ϑ). Yn má střední hodnotu E(Yn) = nϑ a rozptyl D(Yn) = ( )ϑ−ϑ 1n . Podle centrální limitní věty se standardizovaná statistika ( )ϑ−ϑ ϑ− = 1n nY U n asymptoticky řídí standardizovaným normálním rozložením N(0,1). Pokud čitatele i jmenovatele podělíme n, dostaneme vyjádření: ( ) ( ) ( ) ( )1,0N n 1 M n 1 X n 1 n 1n n Y U n 1i i 2 n ≈ ϑ−ϑ ϑ− = ϑ−ϑ ϑ− = ϑ−ϑ ϑ− = ∑= Vzorec pro meze 100(1-α)% asymptotického empirického intervalu spolehlivosti pro parametr ϑ: Meze 100(1-α)% asymptotického empirického intervalu spolehlivosti pro parametr ϑ jsou: 2/12/1 u n )m1(m mh,u n )m1(m md α−α− − += − −= . Vysvětlení: Pokud rozptyl ( ) ( ) n 1 MD ϑ−ϑ = nahradíme odhadem ( ) n M1M − , konvergence náhodné veličiny U k veličině s rozložením N(0,1) se neporuší. Tedy         − +<ϑ< − −= =             < − ϑ− <−≤α−Ξ∈ϑ∀ α−α− α−α− 2/12/1 2/12/1 u n )M1(M Mu n )M1(M MP u n )M1(M M uP1: Příklad: Náhodně bylo vybráno 100 osob a zjištěno, že 34 z nich používá zubní kartáček zahraniční výroby. Najděte 95% asymptotický interval spolehlivosti pro pravděpodobnost, že náhodně vybraná osoba používá zubní kartáček zahraniční vý- roby. Řešení: Zavedeme náhodné veličiny X1, ..., X100, přičemž Xi = 1, když i-tá osoba používá zahraniční zubní kartáček a Xi = 0 jinak, i = 1, ..., 100. Tyto náhodné veličiny tvoří náhodný výběr z rozložení A(ϑ). n = 100, m = 34/100, α = 0,05, u1-α/2 = u0,975 = 1,96. Ověření podmínky nϑ (1- ϑ ) > 9: parametr ϑ neznáme, musíme ho nahradit výběrovým průměrem. Pak 100.0,34.0,66 = 22,44 > 9. Dosadíme do vzorce: 2/12/1 u n )m1(m mh,u n )m1(m md α−α− − += − −= , tedy 4328,096,1 100 )34,01(34,0 34,0h,2472,096,1 100 )34,01(34,0 34,0d = − +== − −= . S pravděpodobností přibližně 0,95 tedy 0,2472 < ϑ < 0,4328. Znamená to, že s pravděpodobností přibližně 0,95 tedy můžeme očekávat, že v populaci je 24,7% až 43,3% osob, které používají zubní kartáček zahraniční výroby. Výpočet pomocí systému STATISTICA: Statistiky – Analýza síly testu – Odhad intervalu – Jeden podíl, Z, Chí-kvadrát test – OK – Pozorovaný podíl p: 0,34, Velikost vzorku: 100, Spolehlivost: 0,95 – Vypočítat. Dostaneme tabulku: Hodnota Podíl vzorku p Velikost vz. ve skup. (N) Interval spolehlivosti Meze spolehlivosti: Pí (přesně): Dolní mez Horní mez Pí (přibližně): Dolní mez Horní mez Pí (původ.): Dolní mez Horní mez 0,3400 100,0000 0,9500 0,2482 0,4415 0,2501 0,4423 0,2472 0,4328 Zajímá nás výsledek uvedený v dolní části tabulky, tj. Pí (původ.). Zjišťujeme, že s pravděpodobností aspoň 0,95 se pravděpodobnost používání zubního kartáčku zahraniční výroby bude pohybovat v mezích 0,2472 až 0,4328. Příklad: Kolik osob musíme vybrat, abychom podíl modrookých osob v populaci odhadli se spolehlivostí 90% a šířka intervalu spolehlivosti byla nanejvýš a) 0,06, b) 0,01? Řešení: Šířka 100(1-α)% asymptotického empirického intervalu spolehlivosti pro parametr ϑ : 2/12/12/1 u n )m1(m 2u n )m1(m mu n )m1(m mdh α−α−α− − =        − −− − +=− Požadujeme, aby h – d ≤ ∆, tedy ∆≤ − α− 2/1u n )m1(m 2 . Odtud vyjádříme ( ) 2 2 2/1um1m4 n ∆ − ≥ α− . Předpokládejme, že nemáme žádné předběžné informace o podílu modrookých osob v populaci. Musíme tedy zvolit takové m, aby šířka intervalu spolehlivosti byla maximální. Maximalizujeme výraz ( ) 2 mmm1m −=− . Derivujeme podle m a položíme rovno 0: 2 1 m0m21 =⇒=− .V tomto případě volíme relativní četnost m = 0,5. ad a) ( ) 67,751 06,0 645,15,05,04 06,0 u5,05,04um1m4 n 2 2 2 2 95,0 2 2 2/1 = ⋅⋅⋅ = ⋅⋅⋅ = ∆ − ≥ α− Uvedenou podmínku tedy splníme, když vybereme aspoň 752 osob. ad b) ( ) 25,27060 01,0 645,15,05,04 01,0 u5,05,04um1m4 n 2 2 2 2 95,0 2 2 2/1 = ⋅⋅⋅ = ⋅⋅⋅ = ∆ − ≥ α− Chceme-li dosáhnout podstatně užšího intervalu spolehlivosti, musíme vybrat aspoň 27 061 osob. Modifikace: Předpokládejme, že v populaci je nanejvýš 30% modrookých osob. Pak relativní četnost m = 0,3. ad a) ( ) 41,631 06,0 645,17,03,04 06,0 u7,03,04um1m4 n 2 2 2 2 95,0 2 2 2/1 = ⋅⋅⋅ = ⋅⋅⋅ = ∆ − ≥ α− V tomto případě stačí vybrat 632 osob. Ve srovnání s předešlým případem vidíme, že rozsah výběru skutečně klesl. ad b) ( ) 61,22730 01,0 645,17,03,04 01,0 u7,03,04um1m4 n 2 2 2 2 95,0 2 2 2/1 = ⋅⋅⋅ = ⋅⋅⋅ = ∆ − ≥ α− V tomto případě musíme vybrat aspoň 22 731 osob. Testování hypotézy o parametru ϑ Nechť X1, ..., Xn je náhodný výběr z rozložení A(ϑ) a nechť je splněna podmínka ( ) 91n >ϑ−ϑ . Na asymptotické hladině významnosti α testujeme hypotézu H0: ϑ = c proti alternativě H1: ϑ ≠ c (resp. H1: ϑ < c resp. H1: ϑ > c). Testovým kritériem je statistika n )c1(c cM T0 − − = , která v případě platnosti nulové hypotézy má asymptoticky rozložení N(0,1). Kritický obor má tvar ( )∞∪−∞−= α−α− ,uu,W 2/12/1 (resp. ( α−−∞−= 1u,W resp. )∞= α− ,uW 1 ). (Testování hypotézy o parametru ϑ lze samozřejmě provést i pomocí 100(1-α)% asymptotického intervalu spolehlivosti nebo pomocí p-hodnoty.) Příklad: Podíl zmetků při výrobě určité součástky činí ϑ = 0,01. Bylo náhodně vybráno 1000 výrobků a zjistilo se, že mezi nimi je 16 zmetků. Na asymptotické hladině významnosti 0,05 testujte hypotézu H0: ϑ = 0,01 proti oboustranné alternativě H1: ϑ ≠ 0,01. Řešení: Zavedeme náhodné veličiny X1, ..., X1000, přičemž Xi = 1, když i-tý výrobek byl zmetek a Xi = 0 jinak, i = 1, ..., 1000. Tyto náhodné veličiny tvoří náhodný výběr z rozložení A(ϑ). Testujeme hypotézu H0: ϑ = 0,01 proti alternativě H1: ϑ ≠ 0,01. Známe: n = 1000, 016,0 1000 16 m == , c = 0,01, α = 0,05, u1-α/2 = u0,975 = 1,96 Ověření podmínky ( ) 91n >ϑ−ϑ : 1000.0,01.0,99 = 9,9 > 9. a) Testování pomocí kritického oboru: Realizace testového kritéria: ( ) 907,1 1000 99,001,0 01,0016,0 n c1c cm t0 = ⋅ − = −⋅ − = . Kritický obor: ( )=∞∪−∞−= ,uu,W 975,0975,0 ( )∞∪−∞− ,96,196,1, . Protože 1,907 ∉ W, H0 nezamítáme na asymptotické hladině významnosti 0,05. b) Testování pomocí intervalu spolehlivosti 0082,096,1 1000 984,0016,0 016,0u n )m1(m md 2/1 = ⋅ −= − −= −α 0238,096,1 1000 984,0016,0 016,0u n )m1(m mh 2/1 = ⋅ += − += −α Protože číslo c = 0,01 leží v intervalu 0,0082 až 0,0238, H0 nezamítáme na asymptotické hladině významnosti 0,05. c) Testování pomocí p-hodnoty Protože testujeme nulovou hypotézu proti oboustranné alternativě, vypočteme p-hodnotu podle vzorce: p = 2 min{ Φ(1,907), 1–Φ(1,907) } = 2 min { 0,97104, 1 – 0,97104 } = 0,05792. Protože vypočtená p-hodnota je větší než hladina významnosti 0,05, H0 nezamítáme na asymptotické hladině významnosti 0,05. Výpočet pomocí systému STATISTICA (pouze přibližný): Statistiky – Základní statistiky a tabulky – Testy rozdílů: r, %, průměry – OK – vybereme Rozdíl mezi dvěma poměry – do políčka P 1 napíšeme 0,016, do políčka N1 napíšeme 1000, do políčka P 2 napíšeme 0,01, do políčka N2 napíšeme 32767 (větší hodnotu systém neumožní) - Výpočet. Dostaneme p-hodnotu 0,0626, tedy nezamítáme nulovou hypotézu na hladině významnosti 0,05. Příklad: Nový léčebný postup považujeme za úspěšný, pokud po jeho ukončení bude dosaženo zlepšení zdravotního stavu u alespoň 50% zúčastněných pacientů. Nová terapie byla vyzkoušena u 40 pacientů a ke zlepšení došlo u 24 osob, tj. u 60%. Je možné na asymptotické hladině významnosti 0,05 zamítnout hypotézu, že tato terapie nedosahuje úspěšnosti aspoň 50%? Řešení: Zavedeme náhodné veličiny X1, ..., X40, přičemž Xi = 1, když terapie u i-tého pacienta byl úspěšná a Xi = 0 jinak, i = 1, ..., 40. Tyto náhodné veličiny tvoří náhodný výběr z rozložení A(ϑ ). Testujeme hypotézu H0: ϑ ≤ 0,5 proti pravostranné alternativě H1: ϑ > 0,5. Známe: n = 40, 6,0 40 24 m == , c = 0,5, α = 0,05, u1-α = u0,95 = 1,645 Ověření podmínky ( ) 91n >ϑ−ϑ : 40.0,6.0,4 = 9,6 > 9. Realizace testového kritéria: ( ) 2649,1 40 5,05,0 5,06,0 n c1c cm t0 = ⋅ − = −⋅ − = . Kritický obor: ) ) )∞=∞=∞= α− ,645,1,u,uW 95,01 . Protože 1,2649 ∉ W, H0 nezamítáme na asymptotické hladině významnosti 0,05. Výpočet pomocí systému STATISTICA: Vypočtená p-hodnota jednostranného testu je 0,1031, tedy větší než asymptotická hladina významnosti 0,05. H0 nezamítáme na asymptotické hladině významnosti 0,05.