Příklady z matematické statistiky Příklad 1.: Kontrola zvážila 5 tabulek čokolády. Výsledky vážení (v gramech) byly: 198, 199, 197, 202, 200. Předpokládáme, že tyto výsledky představují realizace náhodného výběru rozsahu 5 z normálního rozložení N(μ, σ^2). a) Vypočtěte výběrový průměr a výběrový rozptyl. (definice 11.2.) b) Sestrojte 95% interval spolehlivosti pro střední hodnotu μ. (věta 12.9. (b)) c) Sestrojte 95% interval spolehlivosti pro rozptyl σ^2. (věta 12.9. (c)) Řešení: ad a) m = 199,2 g, s^2 = 3,7 g^2 ad b) d = m - t[1-α/2](n-1) = 199,2 - t[0,975](4) = 199,2 - 2,7764 = 196,8 h = m + t[1-α/2](n-1) = 199,2 + t[0,975](4) = 199,2 + 2,7764 = 201,6 196,8 g < µ < 201,6 g s pravděpodobností aspoň 0,95. ad c) 1,33 g^2 < σ^2 < 30,58 g^2 s pravděpodobností aspoň 0,95. Příklad 2.: Měřením délky deseti válečků byly získány hodnoty (v mm): 5,38 5,36 5,35 5,40 5,41 5,34 5,29 5,43 5,42 5,32. Pro úsporu času máte uveden aritmetický průměr m = 5,37 mm a směrodatnou odchylku s = 0,044 mm. Těchto deset hodnot považujeme za realizace náhodného výběru rozsahu 10 z normálního rozložení N(μ, σ^2). a) Sestrojte 99% interval spolehlivosti pro neznámou střední hodnotu μ.(Návod: věta 12.9. (b)) b) Sestrojte 99% interval spolehlivosti pro neznámou směrodatnou odchylku σ. (Návod: věta 12.9. (c)) c) Na hladině významnosti 0,01 testujte hypotézu, že střední hodnota délky válečků je 5,3 mm proti oboustranné alternativě. (Návod: poznámka 13.5. (b)) Řešení: ad a) d = m - t[1-α/2](n-1) = 5,37 - t[0,995](9) = 5,37 - 3,25 = 5,3248 h = m + t[1-α/2](n-1) = 5,37 + t[0,995](9) = 5,37 + 3,25 = 5,4152 5,3248 mm < µ < 5,4152 mm s pravděpodobností aspoň 0,99 ad b) 0,0272 mm < σ < 0,1002 mm s pravděpodobností aspoň 0,99. ad c) Testujeme H[0]: μ = 5,3 proti H[1]: μ 5,3 na hladině významnosti 0,01. Protože 99% empirický interval spolehlivosti vypočtený v bodě (a) neobsahuje hodnotu 5,3, zamítáme nulovou hypotézu na hladině významnosti 0,01 a přijímáme alternativní hypotézu. Příklad 3.: Při kontrolních zkouškách životnosti 16 žárovek byl stanoven odhad m = 3000 h střední hodnoty jejich životnosti a odhad s = 20 h směrodatné odchylky jejich životnosti. Za předpokladu, že životnost žárovky se řídí normálním rozložením, vypočtěte a) 99% empirický interval spolehlivosti pro střední hodnotu životnosti b) 99% empirický interval spolehlivosti pro směrodatnou odchylku životnosti c) 90% levostranný empirický interval spolehlivosti pro střední hodnotu životnosti d) 95% pravostranný empirický interval spolehlivosti pro rozptyl životnosti. Návod: věta 12.9., příklad 12.8. – konkrétní aplikace Upozornění: Výsledek zaokrouhlete na jedno desetinné místo a vyjádřete v hodinách a minutách. Řešení: ad a) , h = 3014,7 2985 h a 18 min < μ < 3014 h a 42 min s pravděpodobností aspoň 0,99 ad b) , 13 h a 30 min < σ < 36 h a 6 min s pravděpodobností aspoň 0,99 ad c) 2993 h a 18 min < μ s pravděpodobností aspoň 0,9 ad d) 826 h^2 a 18 min^2 > σ^2 s pravděpodobností aspoň 0,95 Příklad 4.: Nechť X[1], ..., X[10] je náhodný výběr z N(μ, σ^2), kde parametry μ, σ^2 neznáme. Realizace výběrového průměru M je m = 21,2 a realizace výběrového rozptylu S^2 je s^2 = 30,25. Na hladině významnosti α = 0,01 testujte nulovou hypotézu H[0]: μ = 25 proti alternativní hypotéze H[1]: μ < 25. Test proveďte pomocí a) intervalu spolehlivosti, b) kritického oboru. Řešení: ad a) Při testování nulové hypotézy proti levostranné alternativě konstruujeme pravostranný interval spolehlivosti. h = m + t[1-α](n-1) = 21,2 + t[0,99](9) = 21,2 + 1,7392527.2,8214 = 26,11 Protože číslo c = 25 leží v intervalu (-∞; 26,11), hypotézu H[0]: μ = 25 nezamítáme na hladině významnosti 0,01. ad b) Vypočteme realizaci testového kritéria Číslo t[0] porovnáme s opačnou hodnotou kvantilu t[0,99](9) = 2,8214. Protože -2,1848 je větší než -2,8214, hypotézu H[0]: μ = 25 nezamítáme na hladině významnosti 0,01. Příklad 5.: Při provádění určitého pokusu bylo zapotřebí udržovat v laboratoři konstantní teplotu 26,5°C. Teplota byla v jednom pracovním týdnu 46x namátkově kontrolována v různých denních a nočních hodinách. Z výsledků měření byly vypočteny realizace výběrového průměru a výběrové směrodatné odchylky: m = 26,33°C, s = 0,748°C. Za předpokladu, že výsledky měření teploty se řídí rozložením N(μ,σ^2), vypočtěte a) 95% empirický interval spolehlivosti pro střední hodnotu μ. Návod: Věta 12.9. b), příklad 9 a) z POTu b) 95% empirický interval spolehlivosti pro směrodatnou odchylku σ. Návod: Věta 12.9. c), příklad 9 b) z POTu Řešení: ad a) 26,11°C < μ < 26,55°C s pravděpodobností aspoň 0,95. ad b) 0,62°C < σ < 0,94°C s pravděpodobností aspoň 0,95. Příklad 6.: V následující tabulce jsou údaje o výnosnosti dosažené 12 náhodně vybranými firmami při investování do mezinárodního podnikání (veličina X) a do domácího podnikání (veličina Y): č.firmy 1 2 3 4 5 6 7 8 9 10 11 12 X 10 12 14 12 12 17 9 15 9 11 7 15 Y 11 14 15 11 13 16 10 13 11 17 9 19 (Výnosnost je vyjádřena v procentech a představuje podíl na zisku vložených investic za rok) Na hladině významnosti 0,1 testujte hypotézu, že neexistuje rozdíl mezi střední hodnotou výnosnosti investic do mezinárodního a domácího podnikání proti oboustranné alternativě. Testování proveďte a) pomocí intervalu spolehlivosti (poznámka 13.5. (b), věta 12.9.) b) pomocí kritického oboru. (poznámka 13.5. (b), věta 13.9.) (Pro úsporu času máte uvedeny realizace výběrového průměru m = a výběrového rozptylu s^2 = rozdílového náhodného výběru Z[i] = X[i] – Y[i], i = 1, …, 12.) Řešení: Testujeme H[0]: μ = 0 proti H[1]: μ ≠ 0 ad a) 90% interval spolehlivosti pro střední hodnotu μ při neznámém rozptylu σ^2 má meze: Protože číslo c = 0 neleží v intervalu (-2,4677; -0,1989), H[0] zamítáme na hladině významnosti 0,1. ad b) Vypočítáme realizaci testové statistiky Stanovíme kritický obor Protože testová statistika se realizuje v kritickém oboru, H[0] zamítáme na hladině významnosti 0,1.