Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr oooooooooooooooooooooooooo oooooooo oooooooooo ooooooooo Matematika III - 12. přednáška Náhodné veličiny - číselné charakteristiky, normální rozdělení, limitní věty Michal Bulant Masarykova univerzita Fakulta informatiky 11. 12. 2013 Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr oooooooooooooooooooooooooo oooooooo oooooooooo ooooooooo Obsah přednášky Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr oooooooooooooooooooooooooo oooooooo oooooooooo ooooooooo Doporučené zdroje • Jan Slovák, Martin Panák, Michal Bulant, Matematika drsně a svižně, MU Brno, 2013, 774 s. (též jako e-text). • Karel Zvára, Josef Štěpán, Pravděpodobnost a matematická statistika, Matfyzpress, 4. vydání, 2006, 230 stran, ISBN 80-867-3271-1. • Marie Budíková, Štěpán Mikoláš, Pavel Osecký, Teorie pravděpodobnosti a matematická statistika (sbírka příkladů), Masarykova univerzita, 3. vydání, 2004, 117 stran, ISBN 80-210-3313-4. • Marie Budíková, Statistika, Masarykova univerzita, 2004, distanční studijní opora ESF, http: //www.math.muni.cz/~budikova/esf/Statistika.zip. • Marie Budíková, Tomáš Lerch, Štěpán Mikoláš, Základní statistické metody, Masarykova univerzita, 2005, 170 stran, ISBN 80-210-3886-1. Při statistickém zkoumání hodnot náhodných veličin (např. zpracování výsledků nějakého měření) hledáme výpovědi o náhodné veličině pomocí různých z ní odvozených čísel. Jako nejjednodušší příklad může sloužit střední hodnota1 E(X) náhodné veličiny X, která je definována Obecně střední hodnota náhodných veličin nemusí existovat, protože příslušné sumy či integrály nemusí konvergovat. 1Často se místo E(X) píše EX. ^2ixi • 6((*/) Pro diskrétní veličinu f^^x • fx{x) dx pro spojitou veličinu. Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr o»oooooooooooooooooooooooo oooooooo oooooooooo ooooooooo Střední hodnota transformované náhodné veličiny Střední hodnotu můžeme přímo vyjádřit také pro funkce Y = ip(X) náhodné veličiny X. V diskrétním případě můžeme přímo spočíst E(Y) = Y,yjP(Y = yj) j = ^ v(*,-)P(x = */) = X>(*/)6f(x,-). / i Je tedy E(tp(X)) přímo spočítatelná pomocí pravděpodobnostní funkce fx- Podobně vyjadřujeme střední hodnotu funkce ze spojité náhodné veličiny: /oo V>(x)fx(x) dx, -oo pokud tento integrál absolutně konverguje. Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr oo»ooooooooooooooooooooooo oooooooo oooooooooo ooooooooo Príklad Spočtěme střední hodnotu binomického rozdělení. Pro X ~ Bi(n, p) je E{x) = J2k.(n\pk{i-Py- k=0 np (n-1)! ^(n-/c)!(/c-l)! n-1 np y (" 1); p/(i _ p)n-i-j np(p + (1 - p))""1 = np. Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr ooo»oooooooooooooooooooooo oooooooo oooooooooo ooooooooo Základní vlastnosti střední hodnoty Věta Nechť a, b G M a X, Y jsou náhodné veličiny s existující střední hodnotou. Pak 9 E (a) = a, • E(a + bX) = a + bE(X), » E(X + Y) = E{X) + E{Y), » jsou-li X a Y nezávislé, pak E(XY) = E (X) ■ E(Y). Důkazy těchto tvrzení jsou přímočaré, zkuste si je udělat! Analogická tvrzení platí i pro náhodné vektory. Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr oooo^ooooooooooooooooooooo oooooooo oooooooooo ooooooooo Príklad Spočtěme ještě jednou střední hodnotu binomického rozdělení, tentokrát s využitím vlastností střední hodnoty. Řešení Vyjádříme počet zdarů v n pokusech jako počet zdarů v jednotlivých pokusech *=x> k=l přičemž náhodné veličiny mají všechny alternativní rozdělení A(p). Snadno spočítáme E( Y^) = 1 • p + 0 • (1 — p) = p. Dále víme, že střední hodnota součtu je součtem středních hodnot, proto n E(X) = Y,E(Yk) = np. k=l Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr ooooo»oooooooooooooooooooo oooooooo oooooooooo ooooooooo Dalšími užitečnými charakteristikami jsou tzv. kvantily. Pro ryze monotónní distribuční funkci Fx (tj. spojitou náhodnou veličinu X s všude nenulovou hustotou, jako je tomu např. u normálního rozdělení) jde prostě o inverzní funkci F^1 : (0,1) —> M. To znamená, že hodnota y = F-1 (a) je taková, že P[X < y) = a. Obecněji, je-li Fx(x) distribuční funkce náhodné veličiny X, pak definujeme kvantilovou funkci2 Zřejmě jde o zobecnění předchozí definice. Nejčastěji jsou používané kvantily s a = 0.5, tzv. medián, s a = 0.25, tzv. první kvartil, a = 0.75, tzv. třetí kvartil, a podobně pro decily a percentily (kdy je a rovno násobkům desetin a setin). K těmto hodnotám se vrátíme v popisné statistice později. 2Uvědomte si, že jsme se již s kvantily setkali, jen jsme jím tak zatím F-\a) inf{x G M; F (x) >a}, a G (0,1). neříkali. Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr oooooo^ooooooooooooooooooo oooooooo oooooooooo ooooooooo Rozptyl a směrodatná odchylka Tyto číselné charakteristiky rozdělení náhodné veličiny nepopisují nějakou střední či typickou hodnotu (jako střední hodnota či medián), ale míru „kolísání" náhodné veličiny kolem střední hodnoty. Rozptylem (variancí) náhodné veličiny X, která má konečnou střední hodnotu, nazýváme číslo D(X) = varX = E ([X - E(X)]2), odmocnina z rozptylu y/D(x) se pak nazývá směrodatná odchylka. Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr OOOOOOO0OOOOOOOOOOOOOOOOOO oooooooo oooooooooo ooooooooo Základní vlastnosti rozptylu Pro náhodnou veličinu X a reálna čísla a, b platí: O D(X) = E(X2) - E(X)2, O D(a + bX) = b2D(X), 0 ^/D(a + bX) = \b\y/D{X). Důkaz. Důkaz je přímočarý. Poznamenejme, že tvrzení 1 se často používá k výpočtům D{X). □ Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr oooooooo»ooooooooooooooooo oooooooo oooooooooo ooooooooo Kovariance O závislosti dvou náhodných veličin do jisté míry vypovídá tzv. kovariance, definovaná předpisem C(X, Y) = cov(X, Y) = E([X - E(X)][Y - E {Y)]). Veličinám X, Y, pro něž je C(X, Y) = 0, říkáme nekorelované . Věta Pro náhodné veličiny s existujícími rozptyly platí: O C(X,Y) = C(Y,X), e c{x,x) = d{x), O C(X, Y) = E{XY) - E{X)E{Y), O C(a + bX,c + dY) = bd ■ C(X, Y), O D(X +Y) = D(X) + D(Y) + 2C(X, Y), speciálně, jsou-li X, Y nezávislé, je D(X + Y) = D(X) + D(Y), tj. C(X, Y) = 0 a X, Y jsou nekorelované. Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr OOOOOOOOO0OOOOOOOOOOOOOOOO oooooooo oooooooooo ooooooooo Koeficient korelace Koeficient korelace je jen speciální název pro kovarianci dvou normovaných náhodných veličin: R(x,y)=pxv=cf*-fg>/-fwy ' Věta ^ 9 R(X,X) = 1, O R{a + bX,c + dY) = sgn(bd)R(X, Y), O jsou-li X, Y nezávislé, je R(X, Y) = 0, O (Cauchyova nerovnost) \R(X, Y)\ < 1. Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr oooooooooo«ooooooooooooooo oooooooo oooooooooo ooooooooo Príklad Spočtěme rozptyl binomického rozdělení. Řešení Stejně jako dříve lze psát X = Yll-i ^k, kde Y\,...,Yn jsou nezávislé náhodné veličiny vyjadřující úspěch v /c-tém pokusu. Snadno vypočteme E(Y%) = l2 • p + O2 • (1 — p) = p, proto D{Yk) = E(y2) - E{Yk)2 = p - p2 = p(l - p). Protože pro nezávislé Yk platí D(£ Yk) = E D{Yk), je D(X) = np(l - p). Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr OOOOOOOOOOOOOOOOOOOOOOOOOO oooooooo oooooooooo ooooooooo Příklady k procvičení Príklad Náhodná veličina X je dána pravděpodobnostní funkcí pro x = —2 pro x = 3 pro x = 1 0 jinak. Určete E(X), E(2X + 5), E(X2), D(X) a D(2X + 1). Příklad Nekorelované náhodné veličiny X a Y mají rozptyly D(X) = a a D(Y) = 2. Určete konstantu a, jestliže rozptyl náhodné veličiny Z = 3V-Xje D(Z) = 25. Číselné charakteristiky náhodných veličin Limitní věty a odhady oooooooooooo»ooooooooooooo oooooooo Normovaná náhodná veličina a Normální rozdělení a rozdělení odvezená Náhodný výběr oooooooooo ooooooooo imitní Všimněme si, že výraz ,x" np vystupující v Moivre-Laplaceově y/np(l-p) větě je totéž, co X^j^^ a Jde tedy o tzv. normovanou náhodnou veličinu (tj. veličinu lineárně transformovanou tak, aby měla střední hodnotu 0 a rozptyl 1). Moivre-Laplaceova věta pak říká, že pro n —> oo se rozložení této náhodné veličiny blíži normovanému normálnímu rozdělení A/(0,1). Jde o speciální případ limitních vět, ukazujících, že za určitých podmínek platí „zákony velkých čísel", kdy se obdobným způsobem transformované náhodné veličiny chovají jako normální rozdělení. Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr ooooooooooooo»oooooooooooo oooooooo oooooooooo ooooooooo Další momenty Někdy je užitečné studovat řadu dalších charakteristik rozdělení náhodných veličin. Za rozumných předpokladů jsou definovány k-té obecné momenty E(Xk) a4 a k-té centrální momenty pk = E{[X-E{X)]k). Pomocí momentů pak definujeme např. šikmost (asymetrii) náhodné veličiny X jako Aí3 nebo špičatost (exces) jako /i4 D{xf 3. Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr oooooooooooooo»ooooooooooo oooooooo oooooooooo ooooooooo 30 20 10 Kladná šikmost distribuce (více vysokých kladných hodnot než odpovídá normálnímu rozdělení s nulovou šikmostí). Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr ooooooooooooooo»oooooooooo oooooooo oooooooooo ooooooooo Momentová vytvořující funkce Definice Reálnou funkci proměnné ŕ G M Mx(t) = E(e ) nazveme momentovou vytvořující funkcí náhodné veličiny X. Poznámka Je-1i X např. spojitá, platí /oo etxf(x) dx = -oo ľ°° t2X2 = / (l + íx+_ + ...)f(x)dx = = 1 + t/ii + -^p + • • • a jde vlastně o exponenciální vytvořující funkci posloupnosti /c-tých obecných momentů y!k. Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr oooooooooooooooo»ooooooooo oooooooo oooooooooo ooooooooo ' Věta ^ Pro momentovou vytvořující funkci platí: * V'k = ^Mx(ŕ) |t=o- • Platí-li M x {t) = M y {t) pro všechna t G (- b, b), mají náhodné veličiny stejné rozdělení, tj. Fx(x) = FY{x). • Ma+bX(t) = eatMx(bt). • Jsou-li X, Y nezávislé, je Mx+y(ŕ) = Mx{ >)MY{t). Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr ooooooooooooooooo»oooooooo oooooooo oooooooooo ooooooooo Príklad Určete momentovou vytvořující funkci binomického rozdělení. Řešení M(t) = E(etx) = £ ^("V(1 - p)"^ = =z (*W)*(i - pr*= = (pet + (l-p)y = (p(et-l) + iy. Snáze jsme mohli funkci určit s využitím předchozích vět a momentové vytvořující funkce alternativního rozdělení, neboť pro Y ~ A(p) je E(etY) = eřl • p + eř0(l - p) = p(eř - 1) + 1. * Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr oooooooooooooooooo»ooooooo oooooooo oooooooooo ooooooooo Príklad Naposled spočtěme střední hodnotu a rozptyl binomického rozdělení, tentokrát s využitím vytvořující funkce. Řešení M(t) = (p(eř - 1) + 1)", proto je ftM(t) = n(p(eř - -i) + i)"-VP, což pro t = 0 dá E(X) = fi^ = np Podobně spočítáme i D(x) = //2 — Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr ooooooooooooooooooo»oooooo oooooooo oooooooooo ooooooooo Příklady k procvičení Príklad Náhodná veličina X má na intervalu (0, a) konstantní hustotu pravděpodobnosti (a jinde nulovou). S využitím vlastností střední hodnoty a rozptylu určete: O E(2X + 3), O E(3X2 - 2X + 1), O D(2X + 3), 0 D(X2 + 1), Příklad Náhodná veličina X má Poissonovo rozdělení (tj. pravděpodobnostní funkci p(x) = ^e~A). Určete její (momentovou vytvořující funkci,) střední hodnotu a rozptyl. Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr oooooooooooooooooooo»ooooo oooooooo oooooooooo ooooooooo Číselné charakteristiky náhodných vektorů var(X) E(X) = (E(Xi),..., E(X„)) se nazýva vektor středních hodnot, D(Xi) C(Xi,X2) ••• C(Xi,Xn)N vC(X„,Xi) C(X„,X2) ••• D(X„) varianční (rozptylová) matice a 1 tf(Xi,X2) ••• /?(Xl5Xn)N ,/?(X„,Xi) r{xn,x2) ••• 1 corX je korelační matice. Snadno je po rozepsání po jednotlivých složkách vidět, že var(X) = E((X - E(X)) • (X - E(X)H Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr ooooooooooooooooooooosoooo oooooooo oooooooooo ooooooooo Ukážeme na příkladech, že pravděpodobnostní struktura náhodného vektoru (X, y) není určena pouze marginálními rozděleními veličin X a Y. Podstatný je rovněž pravděpodobnostní vztah mezi X a y, který je částečně popsán např. prostřednictvím korelačního koeficientu. Příklad Jsou-li X a y náhodné veličiny, nabývající hodnot 0 a 1, pak P(X = 1, y = 1) - p(x = 1)p{y = 1) = e(xy)-e(x)e(y) = = c(x, y). Odtud je snadno vidět, že pokud jsou X a y nekorelované, jsou i nezávislé (což obecně neplatí). Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr oooooooooooooooooooooo»ooo oooooooo oooooooooo ooooooooo Uveďme ještě příklad, ilustrující, že nekorelovanost nemusí implikovat nezávislost: Příklad Buďte A a X nezávislé náhodné veličiny, splňující X ~ A/(0,1) a P (A = 1) = P{A = -1) = 1/2. Položíme-li Y = AX, pak P(Y < y) = \P{X < y) + l-P{-X < y) = 9a^ 0 platí DX P(\X-EX\>e)<—. Důkaz. Budeme odhadovat rozptyl DX ve spojitém prípade (diskrétni analogicky): DX > /OO ŕ (X - EX)2 f (x) dx> (X - EX)2 f (x) dx > -oo J\x-ex\>e e2 f (x) dx = e2P(\X - EX\ > e). |x-£X|>e □ Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr oooooooooooooooooooooooooo oo»ooooo oooooooooo ooooooooo Pomoci Čebyševovy nerovnosti můžeme odhadovat pravděpodobnost, s jakou se náhodná veličina s neznámým rozdělením odchýlí od své střední hodnoty o více než /c-násobek směrodatné odchylky (zřejmě je totiž P(\X — E(X)\ > ka) < p). ' Příklad * Nechť je E(X) = fi, D{X) = a2. 9 Odhadněte P(\X -y, > 3 3a), jestliže navíc víte, že X ~ N(0,1). Řešení O 1/9, @ 0,0027. Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr oooooooooooooooooooooooooo ooo«oooo oooooooooo ooooooooo Speciálním případem je Bernoulliova věta, která říká, že je-li Yn ~ Bi(n, p), pak posloupnost relativních četností Yn/n konverguje podle pravděpodobnosti k p. Věta (Bernoulliova) Pro náhodnou veličim pro libovolné e > 0 pl i s binon 3tí Yn --p n niekým rozdělením Yn ~ Bi(n,p) a ) nez Důkaz. "* Plyne snadno z Čebyševovy nerovnosti, neboť E(Yn/n) = np/n = p a D(Yn/n) = np(l - p)/n2 = p(l - p)/n. □ Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr oooooooooooooooooooooooooo oooo»ooo oooooooooo ooooooooo Príklad Při zkoušce bylo zjištěno, že mezi 600 kontrolovanými studenty je 5 studentů, kteří neumí ani malou násobilku. Odhadněte pravděpodobnost, že relativní četnost takových studentů se od jejich pravděpodobnosti výskytu liší o více než 0,01? (Můžete předpokládat, že pravděpodobnost výskytu studenta bez znalosti násobilky je menší než 0,02). Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr oooooooooooooooooooooooooo ooooo»oo oooooooooo ooooooooo Centrálni limitní věta Centrální limitní věta dává odpověď na otázku, proč je normální rozdělení nejdůležitějším rozdělením. Ukazuje totiž, že rozdělení součtu dostatečně velkého počtu nezávislých a stejně rozdělených náhodných veličin lze aproximovat normálním rozdělením. Necht je Y\, Y2,... posloupnost nezávislých stejně rozdělených náhodných veličin se střední hodnotou fi a rozptylem a2. Pak pro normované náhodné veličiny platí lim P{Sn < t) = 0,05 • 0,022 4500. Opět vidíme, že odhad prostřednictvím Bernoulliovy nerovnosti je podstatně slabší než odhad s využitím centrálni limitní věty (resp. de Moivre-Laplaceovy věty). Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr OOOOOOOOOOOOOOOOOOOOOOOOOO OOOOOOOO »000000000 ooooooooo Normální rozdělení Príklad Dokažte, že funkce je hustotou (tzv. normované/standardizované normálně rozdělené náhodné veličiny), tj. že platí Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr oooooooooooooooooooooooooo oooooooo o»oooooooo ooooooooo Tento příklad je možné řešit několika způsoby, my (neformálně) naznačíme postup pomocí integrace funkce dvou proměnných přechodem k polárním souřadnicím. Dvěma způsoby tak spočítáme e-(x2+y2) d^ odkud porovnáním dostaneme pro dx 7t. Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr oooooooooooooooooooooooooo oooooooo oo»ooooooo ooooooooo Momenty normálního rozdělení Přímý výpočet střední hodnoty a rozptylu normovaného normálního rozdělení není triviální. S využitím momentové vytvořující funkce je ale poměrně jednoduchý. Nechť Z~ N(0,1). Pak Poslední integrál je roven 1 díky tomu, že na místě integrované funkce je funkce s vlastnostmi hustoty. Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr oooooooooooooooooooooooooo oooooooo ooo»oooooo ooooooooo Střední hodnota a rozptyl normálního rozdělení S využitím předchozího výpočtu M^(ŕ) = exp^-yj snadno spočítame, že A4(ŕ) = ŕexp(!), 2 2 M^(ŕ) = ŕ2exp(^)+exp(^-). Dosazením ŕ = 0 pak dostaneme E(Z) = 0,D(Z) = 1. Pro transformovanou náhodnou veličinu Y = y + aZ ~ a2) pak snadno odvodíme z vlastností střední hodnoty, resp. rozptylu, že E(Y) = y, D(Y) = a2 (což zpětně zdůvodňuje zápis A/(/x, u2)) Momentová vytvořující funkce pro Y má tvar My(ŕ) = exp(/iŕ + cr2y). Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr oooooooooooooooooooooooooo oooooooo oooo»ooooo ooooooooo Príklad Určete rozdělení součtu nezávislých náhodných veličin X~/V(/iX,<72), Y ~ N(vy,v2y)- Řešení Z vlastností momentové vytvořující funkce dostáváme t2 t2 Mx+v{t) = exp(/xxŕ + o-Xy) exp(/xyŕ + o2Y—) = ŕ2 = exp((/iX + /iy)t + (CJX + (Ty) y). Proto X + V ~ A/(/iX + Aty, (tx + «ry). Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr oooooooooooooooooooooooooo oooooooo ooooo»oooo ooooooooo ľ (gamma) rozdělení r rozdělení se často používá u modelů čekání (např. v pojistné matematice je čas dožití často modelován pomocí gamma rozdělení). Příklad Určete konstantu c tak, aby funkce cxa e pro x > 0 a nulová jinde (a, b > 0 jsou parametry) byla hustotou náhodné veličiny. Řešení Hustota musí splňovat ľOO 1 = / cx^e-^dx Jo b" Jo proto c = rgy. ľ°° /t\3-l I -jí cQ eidt= Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr OOOOOOOOOOOOOOOOOOOOOOOOOO OOOOOOOO OOOOOO0OOO ooooooooo Poznámka Funkce ľ je zobecnění faktoriálu (ľ(n) = (n — 1)! pro n G N), definované předpisem ľ(a) = xa~1e~x dx. Často počítáme hodnoty této funkce s využitím vlastností r(l/2) = r(a + l) = a-r(a). Definice Rozdělení náhodné veličiny s hustotou spočítanou v předchozím příkladu nazýváme gamma rozdělení s parametry a, b a značíme V(a,b). Momentová vytvořující funkce je pak M(t) = {^-t)a, střední hodnota E(X) = a/b a rozptyl D(X) = a/b2. Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr oooooooooooooooooooooooooo oooooooo ooooooo»oo ooooooooo Příklad (rozdělení \2 podruhé) Nechť Z má normované normální rozdělení. Určete hustotu transformované náhodné veličiny X = Z2. Již dříve jsme vypočetli přímým výpočtem přes distribuční funkci, že hustota c ( \ 1 -- --fx{x) = 2 e 2tt a řekli jsme si, že jde o (Pearsonovo) \2 rozdělení s jedním stupněm volnosti, které značíme X ~ X2(l)- Nyní vidíme, že jde o speciální případ T-rozdělení, totiž l~(l/2,l/2). Obecně pro součet Y čtverců n nezávislých náhodných veličin s rozdělením A/(0,1) obdobně odvodíme, že má rozdělení T(n/2,1/2) a říkáme, že Y má rozdělení x2{n) (chíkvadrát s n stupni volnosti). Toto rozdělení se ve statistice používá velmi často. Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr OOOOOOOOOOOOOOOOOOOOOOOOOO OOOOOOOO OOOOOOOO0O ooooooooo Další důležitá rozdělení F-rozdělení Jsou-li X, Y nezávislé náhodné veličiny s rozděleními X ~ X2{k), Y ~ x2{m)> Pa^ má transformovaná náhodná veličina U X/k Y/m takzvané Fisher-Snedecorovo F-rozdělení F(k,m) s k a m stupni volnosti. Studentovo t-rozdělení Jsou-li Z ~ A/(0,1) a X ~ x2{n) nezávislé náhodné veličiny, pak má veličina 7 T tzv. Studentovo t-rozdělení t(n) s n stupni volnosti. Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr OOOOOOOOOOOOOOOOOOOOOOOOOO OOOOOOOO OOOOOOOOO* ooooooooo Přehled rozdělení odvozených od normálního Zi,..., Zk ~ A/(0,1) .....nezávislá normovaná normálni i Zf ~ x2(^) ■ ■ ■ ■ chĺ-kvadrát o k stupních volnosti x2/k Fk m = v21 ~ F(k, m) . . F-rozdělení s k a m stupni volnosti Ti, = ~ tik)......t-rozdělení s k stupni volnosti Odtud zejména Z2 ~ x2(l) 3 Tk ~ ^(1, k)- rozdělení střední hodnota rozptyl /V(/i,a2) X2(k) t(k) F(k,m) y-k 0 m/(m - 2) a2 2k k/(k - 2) 2m2(k + m - 2)/k(m - 2)2(m - 4) Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr OOOOOOOOOOOOOOOOOOOOOOOOOO OOOOOOOO OOOOOOOOOO »00000000 Náhodný výběr Definice Náhodným výběrem rozsahu n rozumíme n-tici nezávislých a stejně rozdělených náhodných veličin Xi,... ,X„ ~ Fx{x) (někdy také hovoříme o n nezávislých kopiích náhodné veličiny X). Náhodným výběrem rozsahu n z p-rozměrného rozdělení rozumíme n-tici nezávislých a stejně rozdělených p-rozměrných náhodných vektoru. V matematické statistice často pracujeme s transformacemi náhodného výběru, takovým náhodným veličinám (příp. vektorům) říkáme statistiky. V následujícím zavedeme několik důležitých statistik a ukážeme jejich souvislost s číselnými charakteristikami náhodných veličin. Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr oooooooooooooooooooooooooo oooooooo oooooooooo o»ooooooo Základní statistiky Definice Nechť Xl,... ,X„ je náhodný výběr. Statistiku 1 " M = ~yx, n t—' nazýváme výběrový průměr, statistiku i=l výběrový rozptyl a statistiku S = VŠ2 výběrová směrodatná odchylka. Analogicky se definují i výběrová kovariance, příp. výběrový korelační koeficient pro dvourozměrný náhodný výběr. Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr OOOOOOOOOOOOOOOOOOOOOOOOOO OOOOOOOO OOOOOOOOOO OO0OOOOOO Vlastnosti statistik Protože jsou uvedené statistiky náhodnými veličinami, lze se přirozeně ptát po jejich číselných charakteristikách. Věta _' Nechť x1,.. ., xn je náhodný výběr rozsahu n z rozdělení se střední hodnotou fi a rozptylem a2 . Pak platí: « E(M) = = V-, « D(M) -. = var(M) = a2/n, • E(S2) - = a2. Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr oooooooooooooooooooooooooo oooooooo oooooooooo ooo»ooooo Důkaz. Ukážeme jen (nejsložitější) 3. tvrzení. Snadno se odvodí, že platí £(X, - yf = £(X, ~ Mf + n(M - yf. Proto je n — 1 1 n — 1 n n — 1 ^2 _2 -a = a . □ Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr oooooooooooooooooooooooooo oooooooo oooooooooo oooo»oooo V předchozí větě jsme ukázali, že výběrový průměr M splňuje E(M) = /x, jeho střední hodnota je tedy rovna odhadovanému parametru fi. V takovém případě říkáme, že statistika M je nestranným odhadem parametru fi. Podobně jsme viděli, že S2 je nestranným odhadem parametru a2. Všimněme si rovněž, že „přirozeněji" definovaná statistika - ^2(Xj — M)2 není nestranným odhadem u2, její střední hodnota je totiž ^a2. Příklad Rozmyslete si, je-li S nestranným odhadem směrodatné odchylky a. Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr oooooooooooooooooooooooooo oooooooo oooooooooo ooooo»ooo Náhodný výběr z normálního rozdělení Uvažme nyní speciální případ, kdy je Xi,..., X„ náhodný výběr z normálního rozdělení N(fi,a2). Věta • M a S 2 jsou nezávislé náhodné veličiny. • M ~ N(fi, o2 jri), a tedy U = (M - fi)/{a/^/ň) ~ A/(0,1). • T = (M - /x)/(S/VH) ~ t(n - 1). • K = {n - l)S2/a2 ~ x2(" - 1)- • E(*/-^»2~X2(")- Poznámka K odhadu /x, neznáme-li a2, slouží 7", v opačném případě U. K odhadu a2, neznáme-li fi, slouží K, v opačném případě následující (bezejmenná?) statistika, která je vlastně statistikou K, v níž místo odhadu M použijeme přímo fi. Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr oooooooooooooooooooooooooo oooooooo oooooooooo oooooo»oo V roce 1951 bylo rozsáhlým statistickým průzkumem zjištěno, že střední hodnota výšky desetiletých chlapců je 136,1 cm se směrodatnou odchylkou a = 6,4 cm. V roce 1961 byla zjištěna výška pouze u 15 náhodně vybraných chlapců: 130 140 136 141 139 133 149 151 139 136 138 142 127 139 147 Otázkou je, zda se v porovnání s rokem 1951 změnila střední výška chlapců, pokud předpokládáme, že variabilita výšek se v různých generacích příliš nemění. Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr oooooooooooooooooooooooooo oooooooo oooooooooo ooooooo»o Řešení Vzhledem k tomu, že základní soubor všech desetiletých chlapců je rozsáhlý, lze zmíněná data považovat za náhodný výběra. Zjistíme, že výběrový průměr M = 139,133, n = 15 a s využitím statistiky U dostáváme, že s 95% pravděpodobností leží hodnota fi v intervalu (M - l,96a/vn; M + 1,96a/y/ň) = (135,9; 142,4). Protože i střední hodnota výšek z roku 1951 leží v tomto intervalu, nemáme vážný důvod tvrdit, že se střední výška změnila. Pokud bychom ovšem připustili vyšší možnost omylu a stanovili interval se spolehlivostí pouze 90%, pak bychom na této hladině hypotézu, že se střední výška změnila, „přijali" - interval je nyní (136,41;141,85). Podobně, pokud nás zajímá pouze dolní odhad střední hodnoty výšek chlapců (a vůbec tedy nepřipouštíme možnost, že by se střední výška snížila), pak s 95% pravděpodobností je střední výška větší než 136,41, a tedy nyní opět „přijímáme" hypotézu, že se střední výška zvýšila. Číselné charakteristiky náhodných veličin Limitní věty a odhady Normální rozdělení a rozdělení odvezená Náhodný výběr OOOOOOOOOOOOOOOOOOOOOOOOOO OOOOOOOO OOOOOOOOOO 00000000» Příklady k procvičení Príklad Předpokládejme, že velká skupina studentů má ze zápočtové písemky ze statistiky bodové hodnoty normálně rozloženy kolem střední hodnoty 72 se směrodatnou odchylkou 9 bodů. Určete pravděpodobnost, že a) náhodně vybraný student bude mít výsledek lepší než 80 bodů, b) průměr výsledků náhodného výběru 10 studentů bude lepší než 80 bodů. Příklad Rychlost letadla byla určována v 5 zkouškách, jejichž aritmetický průměr byl m = 870,3 ms^1. Najděte 95% interval spolehlivosti pro fi víte-li, že měření rychlosti se řídí normálním rozdělením se směrodatnou odchylkou 2,1 ms^1.