Spojité náhodné veličiny oooooo Funkce náhodných veličin ooooooooo Číselné charakteristiky náhodných veličin ooooo Matematika IV - 9. přednáška Náhodné veličiny a jejich transformace Michal Bulant Masarykova univerzita Fakulta informatiky 17. 4. 2013 Spojité náhodné veličiny oooooo Funkce náhodných veličin ooooooooo Číselné charakteristiky náhodných veličin ooooo Ql Spojité náhodné veličiny • Typy spojitých náhodných veličin Q Funkce náhodných veličin • Transformace náhodných veličin Q| Číselné charakteristiky náhodných veličin Spojité náhodné veličiny oooooo Funkce náhodných veličin ooooooooo Číselné charakteristiky náhodných veličin ooooo • Martin Panák, Jan Slovák, Drsná matematika, e-text. » Karel Zvára, Josef Štěpán, Pravděpodobnost a matematická statistika, Matfyzpress, 4. vydání, 2006, 230 stran, ISBN 80-867-3271-1. • Marie Budíková, Štěpán Mikoláš, Pavel Osecký, Teorie pravděpodobnosti a matematická statistika (sbírka příkladů), Masarykova univerzita, 3. vydání, 2004, 117 stran, ISBN 80-210-3313-4. » Marie Budíková, Statistika, Masarykova univerzita, 2004, distanční studijní opora ESF, http: //www.math.muni.cz/~budikova/esf/Statistika.zip. • Marie Budíková, Tomáš Lerch, Štěpán Mikoláš, Základní statistické metody, Masarykova univerzita, 2005, 170 stran, ISBN 80-210-3886-1. Spojité náhodné veličiny •ooooo Funkce náhodných veličin ooooooooo Číselné charakteristiky náhodných veličin OOOOO Typy spojitý. Rovnoměrné spojité rozdělení Rs(a, b) je nejjednoduším příkladem spojitého rozdělení. Ilustruje, že při jednoduše formulovaném požadavku na chování rozdělení nám nezbude moc prostoru pro jeho definici. Nyní chceme, aby pravděpodobnost každé hodnoty v předem daném intervalu (a, b) c M byla stejná, tj. hustota fx našeho rozdělení náhodné veličiny X má být konstantní. Pak ovšem jsou pro libovolná reálná čísla —oo < a < b < oo jen jediné možné hodnoty (0 tb, [l t>b. Spojité náhodné veličiny o»oooo Funkce náhodných veličin ooooooooo Číselné charakteristiky náhodných veličin ooooo Exponenciální rozdělení Ex(A) je dalším rozdělením, které je snadno určeno požadovanými vlastnostmi náhodné veličiny. Předpokládejme, že sledujeme náhodný jev, jehož výskyty v nepřekrývajících se časových intervalech jsou nezávislé. Je-li tedy P(r) pravděpodobnost, že jev nenastane během intervalu délky t, pak nutně P[t + s) = P(r)P(s) pro všechna ŕ, s > 0. Předpokládejme navíc diferencovatelnost funkce P a P(0) = 1. Pak jistě In P[t + s) = In P[ť) + In P(s), takže limitním přechodem lim '"^ + *)-'"^) = (|nf%(0). Označme si spočtenou derivaci zprava v nule jako —A G M. Pak tedy pro P[ť) platí In P{ť) = —Aŕ + C a počáteční podmínka dává jediné řešení P(ř) = e-Ař. Všimněme si, že z definice našich objektů vyplývá, že A > 0. Spojité náhodné veličiny oo»ooo Funkce náhodných veličin ooooooooo Číselné charakteristiky náhodných veličin ooooo Nyní uvažme náhodnou veličinu X udávající (náhodný) okamžik, kdy náš jev poprvé nastane (je vidět analogie s geometrickým rozdělením?). Zřejmě tedy je distribuční funkce rozdělení pro X dána íl - e~Ař t > 0 Fx (t) = 1 - P (t) = { Je vidět, že skutečně jde rostoucí funkci s hodnotami mezi nulou a jedničkou a správnými limitami v ±oo. Hustotu tohoto rozdělení dostaneme derivováním distribuční funkce, tj. 'Ae-Ař t > 0 0 t < 0. fx Spojité náhodné veličiny ooo#oo Funkce náhodných veličin ooooooooo Číselné charakteristiky náhodných veličin ooooo Jde o nejdůležitější rozdělení. Uveďme nejprve motivaci pro jeho zavedení. Pokud budeme v binomickém rozdělení Bi(n,p) zvyšovat n při zachování úspěšnosti p, bude mít pravděpodobnostní funkce pořád přibližně stejný tvar. 7 v -10 10 Bi(500,0.5) Bi(5000,0.5) graf funkce e x2/2 Spojité náhodné veličiny 0000*0 Funkce náhodných veličin ooooooooo Číselné charakteristiky náhodných veličin ooooo Normální rozdělení A/(0,1) Vzhledem k uvedené motivaci se nabízí hledat vhodné spojité rozdělení, které by mělo hustotu danou nějakou obdobnou funkcí. Protože je e~x I2 vždy kladná funkce, potřebovali bychom spočíst J^e^2/2 dx což není pomocí elementárních funkcí možné. Je však možné (i když ne úplně snadné) ověřit, že příslušný nevlastní integrál konverguje k hodnotě Odtud vyplývá, že hustota rozdělení náhodné veličiny může být Rozdělení s touto hustotou se nazývá normální rozdělení N(0,1). Spojité náhodné velič :iny Funkce náhodných veličin Číselné charakteristiky náhodných veličin ooooo* ooooooooo OOOOO Normální rozděl ení A/(0,1) Příslušnou distribuční funkci Fx(x) = ľ e-x2/2dx J—oo nelze vyjádřit pomocí elementárních funkcí, přesto se s ní numericky běžně počítá (pomocí tabulek nebo softwarových aplikací). Hustotě fx se také často říká Gaussova křivka. Abychom uměli přesněji zformulovat asymptotickou blízkost normálního a binomického rozdělení pro n —> oo, musíme si vytvořit další nástroje pro práci s náhodnými veličinami. Budeme k tomu používat funkce dvojím různým způsobem. Spojité náhodné veličiny oooooo Funkce náhodných veličin •oooooooo Číselné charakteristiky náhodných veličin ooooo Príklad Nechť má náhodná veličina X rovnoměrné rozdělení na intervalu (0, r). Určete distribuční funkci a hustotu pravděpodobnosti rozdělení objemu koule o poloměru X. Určeme nejprve distribuční funkci F (pro 0 < d < j^r3) F(d) = P 4 i ifŠď -tvX3 < d = P X< \ — 3 ~ V 4?r celkem 0 pro x < 0 F(x) ={ \lthixl* Pro 0 < x < 3 4nr3 "~ f"" 3 1 rorrs v ^> l-n-,-3 7rr" pro x > l^r-3 Derivováním pak obdržíme hustotu pravděpodobnosti. Spojité náhodné veličiny oooooo Funkce náhodných veličin 0*0000000 Číselné charakteristiky náhodných veličin ooooo Príklad (rozdělení x2(l)) Nechť Z má normované normální rozdělení. Určete hustotu transformované náhodné veličiny X = Z2. Řešení Zřejmě je pro x < O distribuční funkce nulová, pro x > O dostáváme: Fx{x) = P[Z2 < x] = P[—y/x < Z < ^/x] = 2tt z2 T dz t 2 e 2 dŕ 2tt 1 _x "2 e 2 a derivací podle x dostaneme hustotu 6c(x) : Rozdělení náhodné veličiny s touto hustotou se nazývá (Pearsonovo) x2 rozdělení s jedním stupněm volnosti a značí se X~X2(1). Spojité náhodné ve i činy Funkce náhodných veličin Číselné charakteristiky náhodných veličin oooooo OO0OOOOOO ooooo Transfor nace náhodných veličin Místo náhodné veličiny X, např. „roční plat zaměstnance", budeme vyčíslovat jinou závislou hodnotu ip(X), např. „roční čistý příjem zaměstnance po zdanění a včetně sociálních dávek". V systému se značnou sociální solidaritou je první veličina hodně variabilní, zatímco druhá může být skoro konstantní. Statisticky se proto budou značně odlišovat. Připomeňme si přechod od binomického k Poissonovu rozdělení: Věta (Poissonova) Je-li Xn ~ Bi(n,p„) taková, že lim„- ^oo npn = X a X ~ Po(A), pak lim P[Xn = k] = P[X = k] pro k = 0,1,.... Spojité náhodné veličiny oooooo Funkce náhodných veličin ooo«ooooo Číselné charakteristiky náhodných veličin ooooo Nejjednodušší funkcí, po konstantách, je afinní závislost ip(x) = a + bx. V prípade afinní závislosti x = ^(y — a) je proto pravděpodobnostní funkce nenulová právě v bodech y; = ax\ + b. Ukážeme si, že v případě rozdělení Xn typu Bi(n, p) převádí transformace x = y y/ np(l — p) + np náhodnou veličinu Xn na rozdělení Yn s distribuční funkcí blízkou distribuční funkci spojitého rozdělení A/(0,1). Dříve uvedená Poissonova věta popisuje asymptotické chování binomického rozdělení pří n —> oo a p —> 0, následující věta pak chování v případě konstantní pravděpodobnosti zdaru p. Věta (de Moivre-Laplaceova) Pro náhodné veličiny Xn s rozdělením Bi(n,p) platí Xn - np lim P n—>oo a < < b *(/))- je distribuční funkce normovaného normálního rozdělení. Spojité náhodné veličiny oooooo Funkce náhodných veličin oooo»oooo Číselné charakteristiky náhodných veličin ooooo Príklad Hodíme kostkou celkem 12 000 krát. Určete pravděpodobnost toho, že počet hozených šestek je mezi 1 800 a 2 100. Řešení Přesná pravděpodobnost je dána výrazem E2100 /12000\/-l\/f/-5\12000-/( ~ ■ u~ ~ v. , - fr=i80o( k )(é)(|) ■ coz je obtizne vyčíslitelné. Využijeme tvrzení Moivre-Laplaceovy věty, přepsaného do tvaru P[A 0. Spojité náhodné veličiny oooooo Funkce náhodných veličin ooooo»ooo Číselné charakteristiky náhodných veličin ooooo Řešení (pokr.) Volbou p = 1/6, A = 1800, B = p^.^í 2100 - 2000^ V12000-My = 4>(V6) - Í>(-2V6 2100, n = 12000 dostávame odhad / 1800 - 2000 ^ VV12000-5Í/ ) « 0,992. Poznámka Statistické tabulky - viz např. https://is.muni.cz/auth/el/ 1433/jaro2013/MB104/um/StatTab.pdf nebo sbírka příkladů [BMO]. ' Příklad ^ Pravděpodobnost narození chlapce je 0,515. Jaká je pravděpodobnost, že mezi tisíci novorozenci bude alespoň tolik děvčat jako chlapců? Spojité náhodné veličiny oooooo Funkce náhodných veličin oooooo»oo Číselné charakteristiky náhodných veličin ooooo Príklad Nezávisle opakujeme pokus s výsledky 1 a 0, které mají neznámé pravděpodobnosti p a 1 — p. Parametr p chceme odhadnout pomocí relativních četnostíXn/n (Xn je počet jedniček při n pokusech). Víme, že je Xn ~ Bi(n,p), proto nám Moivre-Laplaceova věta umožní určit počet pokusů n potřebný k zajištění požadované přesnosti odhadu ô se spolehlivostí 1 — /3. Využijeme Moivre-Laplaceovu větu zapsanou ve tvaru 0 = lim nó yjnp{l-p) < ó nó yjnp{l-p) Spojité náhodné veličiny oooooo Funkce náhodných veličin ooooooo»o Číselné charakteristiky náhodných veličin ooooo Řešení Hledáme nejmenší n, splňující nerovnost P[\Xn/n — p| < ô] > 1 — /3, kterou můžeme podle věty aproximovat nerovností \y/np{l-p)J \ y/np{l - p) = 2* ( , nS )-l>l-fi. \y/np(l-p)J - Ta je ekvivalentní s podmínkou nô/yjnp(l — p) > z(/3/2), kde z(p) je řešení rovnice í>(z(p)) = 1 — p (tzv. kritická hodnota normovaného normálního rozdělení). Pro ô = 0,05 a 1-/3 = 0,9 máme z tabulek z(/3/2) 1,645 a s využitím zřejmého odhadu p(l - p) < 1/4 dostáváme n > (z(/3/2)/2č)2 « 270,6. Spojité náhodné veličiny Funkce náhodných veličin Číselné charakteristiky náhodných veličin OOOOOO 00000000» ooooo Transformace normálně rozdělené veličiny Podobně zkusme opačnou transformaci provést na veličinu Y s normálním rozdělením A/(0,1). Pro pevně zvolená čísla fi,a G a > O spočtěme rozdělení náhodné veličiny Z = fi + aY. Dostáváme distribuční funkci Fz(z) = P(Z < z) = P(fjL + aY < z) (*/)6f(x,-). / i Je tedy E(tp(X)) přímo spočítatelná pomocí pravděpodobnostní funkce fx- Podobně vyjadřujeme střední hodnotu funkce ze spojité náhodné veličiny: /oo V>(x)6f(x) dx, -oo pokud tento integrál absolutně konverguje. Spojité náhodné ve i činy Funkce náhodných veličin Číselné charakteristiky náhodných veličin oooooo ooooooooo oo»oo Príklad Spočtěme střední hodnotu binomického rozdělení. Řešení Pro X ~ Bi(n, p) je E(X) = J> • ("V(1 - p)""* = = np(p + (1 - p))"-1 = np. Spojité náhodné veličiny oooooo Funkce náhodných veličin ooooooooo Číselné charakteristiky náhodných veličin ooo»o Věta Nechť a, b G M a X, Y jsou náhodné veličiny s existující střední hodnotou. Pak • E (a) = a, • E(a + bX) = a + bE(X), » E{X + Y) = E{X) + E{Y), » jsou-li X a Y nezávislé, pak E(XY) = E (X) ■ E (Y). Důkazy těchto tvrzení jsou přímočaré, zkuste si je udělat! Analogická tvrzení platí i pro náhodné vektory. Spojité náhodné veličiny oooooo Funkce náhodných veličin ooooooooo Číselné charakteristiky náhodných veličin oooo» Príklad Spočtěme ještě jednou střední hodnotu binomického rozdělení, tentokrát s využitím vlastností střední hodnoty. Řešení Vyjádříme počet zdarů v n pokusech jako počet zdarů v jednotlivých pokusech *=x> k=l přičemž náhodné veličiny mají všechny alternativní rozdělení A(p). Snadno spočítáme E(Y/<) = 1 • p + 0 • (1 — p) = p. Dále víme, že střední hodnota součtu je součtem středních hodnot, proto n E(X) = J2E(Yk) = np. k=l