7. Parametrické úlohy o dvou nezávislých náhodných výběrech z normálních rozložení 7.1. Motivace: V této situaci je naším úkolem porovnat střední hodnoty či rozptyly dvou normálních rozložení na základě znalosti dvou nezávislých náhodných výběrů pořízených z těchto rozložení. Zpravidla konstruujeme intervaly spolehlivosti pro rozdíl středních hodnot respektive hodnotíme shodu středních hodnot pomocí dvouvýběrového t-testu či dvouvýběrového z-testu a shodu rozptylů pomocí F-testu. 7.2. Věta: Rozložení statistik odvozených z výběrových průměrů a výběrových rozptylů 7.3. Věta: Vzorce pro meze 100(1-α)% empirických intervalů spolehlivosti pro parametrické funkce μ[1] - μ[2] a σ[1]^2/ σ[2]^2 a) Interval spolehlivosti pro μ[1] - μ[2], když σ[1]^2, σ[2]^2 známe b) Interval spolehlivosti pro μ[1] - μ[2], když σ[1]^2[, ] σ[2]^2 neznáme, ale víme, že jsou shodné c) Interval spolehlivosti pro společný neznámý rozptyl σ^2 d) Interval spolehlivosti pro podíl rozptylů σ[1]^2/ σ[2]^2 Upozornění: Není-li v 7.3. (b) splněn předpoklad o shodě rozptylů, lze sestrojit aspoň přibližný 100(1-α)% interval spolehlivosti pro μ[1 ]- μ[2]. V tomto případě má statistika T přibližně rozložení t( ), kde počet stupňů volnosti = . Není-li ν celé číslo, použijeme v tabulkách kvantilů Studentova rozložení lineární interpolaci. 7.4. Příklad: Ve dvou nádržích se zkoumal obsah chlóru (v g/l). Z první nádrže bylo odebráno 25 vzorků, z druhé nádrže 10 vzorků. Byly vypočteny realizace výběrových průměrů a rozptylů: m[1] = 34,48, m[2] = 35,59, s[1]^2 = 1,7482, s[2]^2 = 1,7121. Hodnoty zjištěné z odebraných vzorků považujeme za realizace dvou nezávislých náhodných výběrů z rozložení N(μ[1], σ^2) a N(μ[2], σ^2). Sestrojte 95% empirický interval spolehlivosti pro rozdíl středních hodnot μ[1] - μ[2]. Řešení: Úloha vede na vzorec 7.3. (b). Vypočteme vážený průměr výběrových rozptylů a najdeme odpovídající kvantily Studentova rozložení: = , t[0,975](33) = 2,035. Dosadíme do vzorců pro dolní a horní mez intervalu spolehlivosti: d = m[1]–m[2]– t[1-α/2](n[1]+n[2]-2) = 34,48–35,59 - = -2,114 h = m[1]–m[2]+ t[1-α/2](n[1]+n[2]-2) = 34,48–35,59 + = -0,106 Zjistili jsme, že -2,114 g/l < μ[1] - μ[2] < -0,106 g/l s pravděpodobností aspoň 0,95. 7.5. Příklad: V příkladu 7.4. nyní předpokládáme, že dané dva náhodné výběry pocházejí z rozložení N(μ[1], σ[1]^2) a N(μ[2], σ[2]^2). Sestrojte 95% empirický interval spolehlivosti pro podíl rozptylů. Řešení: Úloha vede na vzorec 7.3. (d). d = h = Dostáváme, že 0,28 < < 2,76 s pravděpodobností aspoň 0,95. 7.6. Definice: Jednotlivé typy testů pro parametrické funkce μ[1] - μ[2] a σ[1]^2/ σ[2]^2 a) Dvouvýběrový z-test b) Dvouvýběrový t-test c) F-test 7.7. Příklad: V restauraci "U bílého koníčka" měřili ve 20 případech čas obsluhy zákazníka. Výsledky v minutách: 6, 8, 11, 4, 7, 6, 10, 6, 9, 8, 5, 12, 13, 10, 9, 8, 7, 11, 10, 5. V restauraci "Zlatý lev" bylo dané pozorování uskutečněno v 15 případech s těmito výsledky: 9, 11, 10, 7, 6, 4, 8, 13, 5, 15, 8, 5, 6, 8 ,7. Za předpokladu, že uvedené hodnoty pocházejí ze dvou normálních rozložení, na hladině významnosti 0,05 testujte hypotézu, že střední hodnoty doby obsluhy jsou v obou restauracích stejné. Řešení: Na hladině významnosti 0,05 testujeme nulovou hypotézu H[0]: μ[1] - μ[2] = 0 proti oboustranné alternativě H[1]: μ[1] – μ[2] 0. Je to úloha na dvouvýběrový t-test. Před provedením tohoto testu je však nutné pomocí F-testu ověřit shodu rozptylů. Na hladině významnosti 0,05 tedy testujeme H[0]: = 1 proti H[1]: 1. Nejprve vypočteme m[1] = 8,25, m[2] = 8,13, s[1]^2 = 6,307, s[2]^2 = 9,41, . Podle 7.6. (c) vypočteme realizaci testové statistiky: . Stanovíme kritický obor: Protože se testová statistika nerealizuje v kritickém oboru, nulovou hypotézu nezamítáme na hladině významnosti 0,05. Rozptyly tedy můžeme považovat za shodné. Nyní se vrátíme k dvouvýběrovému t-testu. Podle 7.6. (b) vypočteme realizaci testové statistiky: . Stanovíme kritický obor: Protože testová statistika se nerealizuje v kritickém oboru, nulovou hypotézu nezamítáme na hladině významnosti 0,05.