7 Základní pojmy matematické statistiky 7.1 Bodové odhady výběrových charakteristik Příklad 7.1. Ve 12-ti náhodně vybraných internetových obchodech byly zjištěny následující ceny deskriptoru artefaktů (v Kč): 102, 99,106,103, 96, 98,100,105,103, 98,104,107. Těchto 12 hodnot považujeme za realizace náhodného výběru X\,..., X\2 z rozdělení, které má střední hodnotu /i a rozptyl a2. a) Určete nestranné bodové odhady neznámé střední hodnoty jj, a neznámého rozptylu a2. b) Najděte výběrovou distribuční funkci Fi2(x) a nakreslete její graf. ## [1] 101.75 ## [1] 12.38636 Pro usnadnění výpočtu hodnot výběrové distribuční funkce F\2{x) uspořádáme ceny podle velikosti: 96, 98, 98, 99, 100, 102, 103, 103, 104, 105, 106, 107. Číselnou osu rozdělíme na 11 intervalů a v každém intervalu stanovíme hodnotu výběrové distribuční funkce: ## [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] ## [1,] 0.0833 0.25 0.3333 0.4167 0.5 0.6667 0.75 0.8333 0.9167 1 Výberová distribuční funkce CO O OJ O I 96 ~~1— 98 —I— 102 —r~ 108 100 104 106 Příklad 7.2. Přírůstky cen akcií v % na burze v New Yorku u 10 náhodně vybraných společností dosáhly těchto hodnot: 10,16, 5,10,12, 8,4, 6, 5,4. a) Odhadněte střední hodnotu, rozptyl a směrodatnou odchylku růstu cen akcií. b) Odhadněte pravděpodobnost růstu cen akcií aspoň o 8.5%. ad a) ## m s2 s ## akcie 101.75 15.78 3.97 ad b) ## [1] 0.4 1 Průměrný růst cen akcií odhadujeme na 8 % se směrodatnou odchylkou 3.97%. Dále, u 40 % akcií vzrostla cena alespoň o 8.5 %. Příklad 7.3. Bylo zkoumáno 9 vzorků půdy s různým obsahem fosforu (veličina X). Hodnoty veličiny Y označují obsah fosforu v obilných klíčcích (po 38dnech), jež vyrostly na těchto vzorcích půdy. číslo vzorku 1 2 3 4 5 6 7 8 9 X 1 4 5 9 11 13 23 23 28 Y 64 71 54 81 76 93 77 95 109 Těchto 9 dvojic hodnot považujeme za realizace náhodného výběru {X\, Y\),..., (Xg, Yg) z dvourozměrného rozdělení s kovariancí a\2 a koeficientem korelace p. Najděte bodové odhady kovariance a\2 a koeficientu korelace p. ## [1] 130 ## [1] 0.8049892 Výběrová kovariance veličin X, Y se realizuje hodnotou 130. Výběrový koeficient korelace veličin X, Y nabyl hodnoty 0.805, tedy mezi veličinami X, Y existuje silná přímá lineární závislost. 7.2 Intervalové odhady výběrových charakteristik Nechť Xi,..., Xn je náhodný výber z rozdělení L(9), 9 je sledovaný parametr a a € (0,1). Interval (D, H) se nazývá 100(1 — a) % oboustranný interval spolehlivosti parametru 9, pokud pro každé 9 € 0 platí Pr(D < 9 < H) = 1 - a. Interval (D, oo) se nazývá 100(1 — a) % levostranný interval spolehlivosti parametru 9, pokud pro každé 9 € 0 platí Pr(L> <9) = l-a. Interval (—oo, H) se nazývá 100(1 — a) % pravostranný interval spolehlivosti parametru 9, pokud pro každé 9 G O platí Pr(0 jj, s pravděpodobnostní 0.95. 7.3 Úvod do testování hypotéz Příklad 7.5. Víme, že výška hochů ve věku 9.5 až 10 let má normální rozdělení s neznámou střední hodnotou jj, a známým rozptylem a2 = 39.112 cm2. Dětský lékař náhodně vybral 15 hochů uvedeného věku, změřil je a vypočítal realizaci výběrového průměru m = 139.13 cm. Podle jeho názoru by výška hochů v tomto věku neměla přesáhnout 142 cm s pravděpodobností 0.95. Lze tvrzení lékaře akceptovat? Testujeme Hq : jj, > 142 proti H\ : jj, < 142 na hladině významnosti a = 0.05. a) Test provedeme pomocí kritického oboru. Pro úlohy o střední hodnotě normálního rozdělení při známém rozptylu používáme pivotovou statistiku ## [1] "tO = -1.777348" ## [1] "Wh = -1.644854" W = (-oo, -1.645) b) Test provedeme pomocí intervalu spolehlivosti. Meze 100(1 —a) % empirického pravostranného intervalu spolehlivosti pro střední hodnotu jj, při známém rozptylu a2 jsou (—oo, h) = (—oo, m — ## [1] "hh = 141.786052" (-oo, 141.79). c) Test provedeme pomocí p-hodnoty. p = Pr(T0 < to) ## [1] "p-hodnota = 0.037755" Závěr testování: Tvrzení lékaře lze tedy akceptovat s rizikem omylu 5%. 3