6. Parametrické úlohy o jednom náhodném výběru z normálního rozložení 6.1. Motivace 6.2. Věta: Rozložení statistik odvozených z výběrového průměru a výběrového rozptylu 6.3. Příklad: Hmotnost balíčku krystalového cukru baleného na automatické lince se řídí normálním rozložením se střední hodnotou 1002 g a směrodatnou odchylkou 8 g. Kontrolor náhodně vybírá 9 balíčků z jedné série a zjišťuje, zda jejich průměrná hmotnost je alespoň 999 g. Pokud ne, podnik musí zaplatit pokutu 20 000 Kč. Jaká je pravděpodobnost, že podnik bude muset zaplatit pokutu? Řešení: X ~ N(1002, 64), M ~ Pravděpodobnost, že podnik bude platit pokutu, je asi 12,9%. 6.4. Věta: Vzorce pro meze 100(1-α)% empirických intervalů spolehlivosti pro μ a σ^2 a) Interval spolehlivosti pro μ, když σ^2 známe b) Interval spolehlivosti pro μ, když σ^2 neznáme c) Interval spolehlivosti pro σ^2, když μ neznáme d) Interval spolehlivosti pro σ^2, když μ známe 6.5. Příklad: 10 krát nezávisle na sobě byla změřena jistá konstanta μ. Výsledky měření byly: 2 1,8 2,1 2,4 1,9 2,1 2 1,8 2,3 2,2. Tyto výsledky považujeme za číselné realizace náhodného výběru X[1], ..., X[10] z rozložení N(μ, σ^2), kde parametry μ, σ^2 neznáme. Najděte 95% empirický interval spolehlivosti pro μ, a to a) oboustranný, b) levostranný, c) pravostranný. Řešení: Vypočteme realizaci výběrového průměru: m = 2,06, výběrového rozptylu: s^2 = 0,0404 a výběrové směrodatné odchylky: s = 0,2011. Riziko α je 0,05. Jde o situaci popsanou v bodě (b), kde využíváme pivotovou statistiku T, která se řídí Studentovým rozložením t(9). V tabulkách najdeme kvantil t[0,975](9) = 2,2622 pro oboustranný interval spolehlivosti a kvantil t[0,95](9) = 1,8331 pro jednostranné intervaly spolehlivosti. ad a) d = m - t[1-α/2](n-1) = 2,06 - 2,2622 = 1,92 h = m + t[1-α/2](n-1) = 2,06 + 2,2622 = 2,20 1,92 < μ < 2,20 s pravděpodobností aspoň 0,95. ad b) d = m - t[1-α](n-1) = 2,06 - 1,8331 = 1,94 1,94 < μ s pravděpodobností aspoň 0,95. ad c) h = m + t[1-α](n-1) = 2,06 + 1,8331 = 2,18 μ < 2,18 s pravděpodobností aspoň 0,95. 6.6. Definice: Jednotlivé typy testů pro parametry normálního rozložení a) Jednovýběrový z-test b) Jednovýběrový t-test c) Test o rozptylu 6.7. Příklad: Podle údajů na obalu čokolády by její čistá hmotnost měla být 125 g. Výrobce dostal několik stížností od kupujících, ve kterých tvrdili, že hmotnost čokolád je nižší než deklarovaných 125 g. Z tohoto důvodu oddělení kontroly náhodně vybralo 50 čokolád a zjistilo, že jejich průměrná hmotnost je 122 g a směrodatná odchylka 8,6 g. Za předpokladu, že hmotnost čokolád se řídí normálním rozložením, můžeme na hladině významnosti 0,01 považovat stížnosti kupujících za oprávněné? Řešení: X[1], ..., X[50] je náhodný výběr z N(μ, σ^2). Testujeme hypotézu H[0]: μ = 125 proti levostranné alternativě H[1]: μ < 125. Protože neznáme rozptyl σ^2, použijeme jednovýběrový t-test. Realizace testového kritéria t[0] = . Kritický obor: W = . Protože se testová statistika realizuje v kritickém oboru, zamítáme nulovou hypotézu na hladině významnosti 0,01. Stížnosti kupujících tedy lze považovat za oprávněné. 6.8. Definice: Definice rozdílového náhodného výběru na základě náhodného výběru z dvourozměrného normálního rozložení. 6.9. Věta: Vzorec pro meze 100(1-α)% empirického intervalu spolehlivosti pro střední hodnotu rozdílového náhodného výběru 6.10. Příklad: Dvěma rozdílnými laboratorními metodami se zjišťoval obsah chemické látky v roztoku (v procentech). Bylo vybráno 5 vzorků a proměřeno oběma metodami. Výsledky měření jsou obsaženy v tabulce: číslo vzorku 1 2 3 4 5 1. metoda 2,3 1,9 2,1 2,4 2,6 2. metoda 2,4 2,0 2,0 2,3 2,5 Za předpokladu, že data mají normální rozložení, sestrojte 90% empirický interval spolehlivosti pro rozdíl středních hodnot výsledků obou metod. Řešení: Přejdeme k rozdílovému náhodnému výběru, jehož realizace jsou: -0,1 -0,1 0,1 0,1 0,1. Vypočteme m = 0,02, s^2 = 0,012, s = 0,109545. Předpokládáme, že tato data pocházejí z normálního rozložení N(μ, σ^2). Vypočteme meze 90% oboustranného intervalu spolehlivosti pro μ při neznámém σ: -0,0844 < μ < 0,1244 s pravděpodobností aspoň 0,9. 6.11. Definice: Definice párového t-testu 6.12. Příklad: V následující tabulce jsou údaje o výnosnosti dosažené 12 náhodně vybranými firmami při investování do mezinárodního podnikání (veličina X) a do domácího podnikání (veličina Y): č.firmy 1 2 3 4 5 6 7 8 9 10 11 12 X 10 12 14 12 12 17 9 15 9 11 7 15 Y 11 14 15 11 13 16 10 13 11 17 9 19 (Výnosnost je vyjádřena v procentech a představuje podíl na zisku vložených investic za rok.) Za předpokladu, že data pocházejí z dvourozměrného normálního rozložení, na hladině významnosti 0,1 testujte hypotézu, že neexistuje rozdíl mezi střední hodnotou výnosnosti investic do mezinárodního a zahraničního podnikání proti oboustranné alternativě. Testování proveďte a) pomocí intervalu spolehlivosti b) pomocí kritického oboru. (Pro úsporu času máte uvedeny realizace výběrového průměru m = a výběrového rozptylu s^2 = rozdílového náhodného výběru Z[i] = X[i] – Y[i], i = 1, …, 12. Řešení: Testujeme H[0]: μ = 0 proti H[1]: μ ≠ 0 ad a) 90% interval spolehlivosti pro střední hodnotu μ při neznámém rozptylu σ^2 má meze: Protože číslo c = 0 neleží v intervalu (-2,4677; -0,1989), H[0] zamítáme na hladině významnosti 0,1. ad b) Vypočítáme realizaci testové statistiky Stanovíme kritický obor Protože testová statistika se realizuje v kritickém oboru, H[0] zamítáme na hladině významnosti 0,1.