Náhodné veličiny Typy diskrétních náhodných veličin Spojité náhodné veličiny Transformace náhodných veličin ooooooooo oooooooo oooooo ooooooooo Matematika III - 11. přednáška Náhodné veličiny - základní typy Michal Bulant Masarykova univerzita Fakulta informatiky 27. 11. 2013 Náhodné veličiny Typy diskrétních náhodných veličin Spojité náhodné veličiny Transformace náhodných veličin ooooooooo oooooooo oooooo ooooooooo Q Náhodné veličiny Q Typy diskrétních náhodných veličin O Spojité náhodné veličiny • Typy spojitých náhodných veličin Q Funkce náhodných veličin • Transformace náhodných veličin Náhodné veličiny Typy diskrétních náhodných veličin Spojité náh( )dné veličiny Transformace náhodných veličin ooooooooo oooooooo oooooo OOOOOOOOO Doporuče ;né zdroje • Jan Slovák, Martin Panák, Michal Bulant, Matematika drsně a svižně, MU Brno, 2013, 774 s. (též jako e-text). • Karel Zvára, Josef Štěpán, Pravděpodobnost a matematická statistika, Matfyzpress, 4. vydání, 2006, 230 stran, ISBN 80-867-3271-1. • Marie Budíková, Štěpán Mikoláš, Pavel Osecký, Teorie pravděpodobnosti a matematická statistika (sbírka příkladů), Masarykova univerzita, 3. vydání, 2004, 117 stran, ISBN 80-210-3313-4. • Marie Budíková, Statistika, Masarykova univerzita, 2004, distanční studijní opora ESF, http: //www.math.muni.cz/~budikova/esf/Statistika.zip. • Marie Budíková, Tomáš Lerch, Štěpán Mikoláš, Základní statistické metody, Masarykova univerzita, 2005, 170 stran, ISBN 80-210-3886-1. Náhodné veličiny Typy diskrétních náhodných veličin Spojité náhodné veličiny Transformace náhodných veličin •oooooooo oooooooo oooooo ooooooooo Definice Náhodná veličina X na pravděpodobnostním prostoru (ft, A, P) je taková funkce X : ft —> M, že vzor X~1(B) patří do A pro každou Borelovskou množinu B g B na M (tj. X : ft —> M je tzv. borelovsky měřitelná). Množinová funkce PX{B) = P{X-\B)) = P{{lo g Q;X{lo) g B}) se nazývá rozdělení pravděpodobnosti náhodné veličiny X. Definice náhodné veličiny zajišťuje, že pro všechny —oo < a < b < oo existuje pravděpodobnost P(a < X < b), kde používáme stručné značení projev A = (u £ SI; a < X(lo) < b)). Distribuční funkcí (distribution, cumulative density function) náhodné veličiny X je funkce F : M —> M definovaná pro všechny x g M vztahem F(x) = P(X < x). Náhodné veličiny Typy diskrétních náhodných veličin Spojité náhodné veličiny Transformace náhodných veličin o»ooooooo oooooooo oooooo ooooooooo Diskrétni náhodné veličiny Předpokládejme, že náhodná veličina X na pravděpodobnostním prostoru (Q, A, P) nabývá jen konečně mnoha hodnot xi,X2,..., x„ £ M. Pak existuje tzv. pravděpodobnostní funkce f (x) taková, že f(x) P (X = xf) pro x 0 jinak. Evidentně £?=1 ŕ (x,-) = 1. Takové náhodné veličině se říká diskrétní. Náhodné veličiny Typy diskrétních náhodných veličin Spojité náhodné veličiny Transformace náhodných veličin oo»oooooo oooooooo oooooo ooooooooo Spojité náhodné veličiny I když hodnoty náhodné veličiny X nejsou diskrétní, můžeme postupovat podobně s užitím diferenciálního a integrálního počtu. Intuitivně lze uvažovat takto: hustotu f(x) pravděpodobnosti pro X si představíme jako P{x < X < x + dx) = f(x)dx. To znamená, že chceme pro —oo < a < b < oo P(a < X < b) = Definice Náhodná veličina X, pro kterou existuje její hustota pravděpodobnosti splňující (*), se nazývá spojitá. Náhodné veličiny Typy diskrétních náhodných veličin Spojité náhodné veličiny Transformace náhodných veličin ooo»ooooo oooooooo oooooo ooooooooo Příklady k procvičení Příklad Rozhodněte, které z následujících funkcí jsou hustotami (mimo vymezený interval je vždy funkce nulová, c je vhodná konstanta -v případě, že jde o hustotu, tuto konstantu určete): O cx pro x G (0,1), O cx pro x G (-1, 2), O cxsinx pro x G (—f, f), O cex pro x G (0, oo), O ce~x pro x G (0, oo), 1+x2 Náhodné veličiny Typy diskrétních náhodných veličin Spojité náhodné veličiny Transformace náhodných veličin oooo^oooo oooooooo oooooo ooooooooo Príklad V lese tvaru trojúhelníka s vrcholy v bodech (—1, 0), (1, 0) a (0, VŠ) se ztratilo dítě. Pravděpodobnost výskytu dítěte v určité části lesa je úměrná velikosti této části, nikoliv umístění této části. Určete O rozdělení vzdálenosti dítěte od zvolené strany lesa, O rozdělení vzdálenosti dítěte od nejbližší strany lesa. Náhodné veličiny Typy diskrétních náhodných veličin Spojité náhodné veličiny Transformace náhodných veličin ooooo»ooo oooooooo oooooo ooooooooo Vlastnosti distribuční funkce Věta Necht X je náhodná veličina, F (x) je její distribuční funkce. O F je neklesající. O F je zprava spojitá, lim^-oo F (x) = 0 a lirrix^oo F (x) = 1. 0 Je-li X diskrétni s hodnotami xi,..., xn, pak je F (x) po částech konstantní, F (x) = J2x- xn. Q Je-li X spojitá, pak je F (x) diferencovatelná a její derivace se rovná hustotě X, tj. platí F'(x) = f (x). Náhodné veličiny Typy diskrétních náhodných veličin Spojité náhodné veličiny Transformace náhodných veličin ooooooo»o oooooooo oooooo ooooooooo Obdobně definujeme distribuční funkce a hustotu a pravděpodobnostní funkci pro spojité a diskrétní náhodné vektory. Hovoříme také o simultánních pravděpodobnostních funkcích a hustotách. Pro dvě proměnné (vektor (X, Y) náhodných veličin): (P(X =x, A Y =yí) x=x/Ay = y/ 1 0 jinak, u diskrétních a pro všechny a, b G M pro spojité: P(-oo < X < a, -oo 1 I O jinak Náhodné veličiny Typy diskrétních náhodných veličin Spojité náhodné veličiny Transformace náhodných veličin ooooooooo o»oooooo oooooo ooooooooo Binomické rozdělení Bi(n,p) odpovídá n-krát nezávisle opakovanému pokusu popsanému alternativním rozdělením, přičemž naše náhodná veličina měří počet zdarů. Je tedy 6c(t) (")př(i-pr o re {0,1, jinak n} Na obrázku jsou pravděpodobnostní funkce pro Bi(50, 0.2), Bi(50, 0.5) a Bi(50,0.9). Rozdělení pravděpodobnosti dobře odpovídá intuici, že nejvíce výsledků bude blízko u hodnoty np: Náhodné veličiny Typy diskrétních náhodných veličin Spojité náhodné veličiny Transformace náhodných veličin ooooooooo oo»ooooo oooooo ooooooooo Binomické rozdělení S binomickým rozdělením se potkáváme velice často v praktických úlohách. Jednou z nich je náhodná veličina, která popisuje počet X předmětů v jedné zvolené přihrádce z n možných, do nichž jsme náhodně rozdělili r předmětů. Umístění kteréhokoliv předmětu do pevně zvolené přihrádky má pravděpodobnost 1/n (každá z nich je stejně pravděpodobná). Zjevně tedy bude pro jakýkoliv počet k = 0,...,r P(X = k) r-k r\ (n - l)r-k k ď ' jde proto o rozložení X typu Bi(r, 1/n). Náhodné veličiny Typy diskrétních náhodných veličin Spojité náhodné veličiny Transformace náhodných veličin ooooooooo ooo»oooo oooooo ooooooooo Binomické —> Poissonovo rozdělení Jestliže nám bude vzrůstat počet přihrádek n společně s počtem předmětů rn tak, že v průměru nám na každou přihrádku bude připadat (přibližně) stejný počet prvků A, můžeme dobře vyjádřit chování našeho rozdělení veličin Xn při limitním přechodu n —> oo. Takovéto chování popisuje např. fyzikální soustavy s velikým počtem molekul plynu nebo branky ve fotbalových zápasech. Standardní úpravy vedou při lim„->oo rn/n = \ k výsledku: lim P(Xn = k) = lim ("f) {n ~ lJ"~k .. rn{rn - 1)... (r„ - k + 1) 1 = lim —— >CXD {n-l)k k\ = — hm lH--°- = —e_A k\ n^oo y rn J k\ protože obecně funkce (1 + x/n)n konvergují stejnoměrně k funkci Typy diskrétních náhodných veličin Náhodné veličiny Typy diskrétních náhodných veličin Spojité náhodné veličiny Transformace náhodných veličin ooooooooo ooooo»oo oooooo ooooooooo Poissonovo rozdělení Po(A) Poissonovo rozdělení popisuje náhodné veličiny s pravděpodobnostní funkcí fx(k) Jak jsme odvodili výše, toto diskrétní rozdělení (rozložené do nekonečně mnoha bodů) dobře aproximuje binomická rozdělení Bi(n, A) pro konstantní A > 0 a veliká n. Snadno ověříme k=0 k\ 3-A+A 1. Náhodné veličiny Typy diskrétních náhodných veličin Spojité náhodné veličiny Transformace náhodných veličin OOOOOOOOO OOOOOO0O oooooo ooooooooo Poissonovo rozdělení Dobře modeluje výskyt jevů: • s očekávanou konstantní hustotou na jednotku objemu - např. bakterie ve vzorku (popis očekávaného výskytu k bakterií při rozdělení vzorku na n stejných částí) • rozdělení událostí, které se vyskytují náhodně v čase a bez závislosti na předchozí historii - v praxi jsou takové procesy často spojeny s poruchovostí strojů a zařízení Příklad • počet branek ve fotbalovém zápase (za 90 minut) • počet telefonních hovorů za minutu na call centru • počet aut přijíždějících na křižovatku Geometrické rozdělení má náhodná veličina X ~ Ge(p), která udává celkový počet nezdarů, které v posloupnosti opakovaných pokusu předcházejí prvnímu zdaru, přičemž pravděpodobnost úspěchu v každém pokusu je rovna p . Hypergeometrické rozdělení. Mějme N předmětů, z nichž právě M má danou vlastnost. Z těchto N předmětů náhodně vybereme n předmětů bez vracení. Náhodná veličina X ~ Hg(/V, M,n) udává počet vybraných prvků s danou vlastností. Zřejmě tato náhodná velišina může nabývat pouze celočíselných hodnot z intervalu [max{0, M — N + n}, min{n, M}]. Pro t z tohoto intervalu pak Náhodné veličiny Typy diskrétních náhodných veličin Spojité náhodné veličiny Transformace náhodných veličin OOOOOOOOO OOOOOOOO »00000 ooooooooo Typy spojitých náhodných veličin Rovnoměrné spojité rozdělení Rs(a, b) je nejjednoduším příkladem spojitého rozdělení. Ilustruje, že při jednoduše formulovaném požadavku na chování rozdělení nám nezbude moc prostoru pro jeho definici. Nyní chceme, aby pravděpodobnost každé hodnoty v předem daném intervalu (a, b) c M byla stejná, tj. hustota fx našeho rozdělení náhodné veličiny X má být konstantní. Pak ovšem jsou pro libovolná reálná čísla —oo < a < b < oo jen jediné možné hodnoty (O tb, [l t>b. Náhodné veličiny Typy diskrétních náhodných veličin Spojité náhodné veličiny Transformace náhodných veličin ooooooooo oooooooo o»oooo ooooooooo Exponenciální rozdělení Ex(A) je dalším rozdělením, které je snadno určeno požadovanými vlastnostmi náhodné veličiny. Předpokládejme, že sledujeme náhodný jev, jehož výskyty v nepřekrývajících se časových intervalech jsou nezávislé. Je-li tedy P(r) pravděpodobnost, že jev nenastane během intervalu délky t, pak nutně P[t + s) = P(r)P(s) pro všechna ŕ, s > 0. Předpokládejme navíc diferencovatelnost funkce P a P(0) = 1. Pak jistě In P[t + s) = In P[ť) + In P(s), takže limitním přechodem lim lnP't + 5'-|nP'r» = (lnP)'+(0). Označme si spočtenou derivaci zprava v nule jako —A G M. Pak tedy pro P[ť) platí In P{ť) = —Aŕ + C a počáteční podmínka dává jediné řešení P(ř) = e-Ař. Všimněme si, že z definice našich objektů vyplývá, že A > 0. Náhodné veličiny Typy diskrétních náhodných veličin Spojité náhodné veličiny Transformace náhodných veličin ooooooooo oooooooo oo»ooo ooooooooo Nyní uvažme náhodnou veličinu X udávající (náhodný) okamžik, kdy náš jev poprvé nastane (je vidět analogie s geometrickým rozdělením?). Zřejmě tedy je distribuční funkce rozdělení pro X dána íl - e~Ař t > 0 Fx (t) = 1 - P (t) = { Je vidět, že skutečně jde rostoucí funkci s hodnotami mezi nulou a jedničkou a správnými limitami v ±oo. Hustotu tohoto rozdělení dostaneme derivováním distribuční funkce, tj. 'Ae-Ař t > 0 0 t < 0. fx Náhodné veličiny Typy diskrétních náhodných veličin Spojité náhodné veličiny Transformace náhodných veličin ooooooooo oooooooo ooo»oo ooooooooo Jde o nejdůležitější rozdělení. Uveďme nejprve motivaci pro jeho zavedení. Pokud budeme v binomickém rozdělení Bi(n,p) zvyšovat n při zachování úspěšnosti p, bude mít pravděpodobnostní funkce pořád přibližně stejný tvar. 7 v -10 10 Bi(500,0.5) Bi(5000,0.5) graf funkce e x2/2 Náhodné veličiny Typy diskrétních náhodných veličin Spojité náhodné veličiny Transformace náhodných veličin ooooooooo oooooooo oooo»o ooooooooo Normální rozdělení A/(0,1) Vzhledem k uvedené motivaci se nabízí hledat vhodné spojité rozdělení, které by mělo hustotu danou nějakou obdobnou funkcí. Protože je e~x I2 vždy kladná funkce, potřebovali bychom spočíst J^e^2/2 dx což není pomocí elementárních funkcí možné. Je však možné (i když ne úplně snadné) ověřit, že příslušný nevlastní integrál konverguje k hodnotě Odtud vyplývá, že hustota rozdělení náhodné veličiny může být Rozdělení s touto hustotou se nazývá normální rozdělení N(0,1). Náhodné veličiny Typy diskrétních náhodných veličin Spojité náhodné veličiny Transformace náhodných veličin OOOOOOOOO OOOOOOOO 00000» ooooooooo Normální rozdělení A/(0,1) Příslušnou distribuční funkci Fx(x) = ľ e~x2/2 c/x J—oo nelze vyjádřit pomocí elementárních funkcí, přesto se s ní numericky běžně počítá (pomocí tabulek nebo softwarových aplikací). Hustotě fx se také často říká Gaussova křivka. Abychom uměli přesněji zformulovat asymptotickou blízkost normálního a binomického rozdělení pro n —> oo, musíme si vytvořit další nástroje pro práci s náhodnými veličinami. Budeme k tomu používat funkce dvojím různým způsobem. Náhodné veličiny Typy diskrétních náhodných veličin Spojité náhodné veličiny Transformace náhodných veličin OOOOOOOOO OOOOOOOO OOOOOO »00000000 Příklady k procvičení Příklad Nechť má X binomické rozdělení s parametry n = 4, p = 2/3. Určete rozdělení transformované náhodné veličiny Y = (X — 2)2 a nakreslete graf její distribuční funkce. Příklad Mějme náhodnou veličinu X hustoty f (x) = 2xe x pro x > O (a jinde nulové). Určete hustotu pravděpodobnosti náhodné veličiny Y = X2. Náhodné veličiny Typy diskrétních náhodných veličin Spojité náhodné veličiny Transformace náhodných veličin ooooooooo oooooooo oooooo o»ooooooo Transformace náhodných veličin Příklad Nechť má náhodná veličina X rovnoměrné rozdělení na intervalu (0, r). Určete distribuční funkci a hustotu pravděpodobnosti rozdělení objemu koule o poloměru X. Určeme nejprve distribuční funkci F (pro 0 < d < 57rr3) F(d) = P 4 i 3fšď -tvX3 < d = P X< \ — 3 ~ V 4?r celkem F(x) pro x < 0 W*3 Pro 0 j7rr Náhodné veličiny Typy diskrétních náhodných veličin Spojité náhodné veličiny Transformace náhodných veličin ooooooooo oooooooo oooooo oo»oooooo Príklad (rozdělení x2(l)) Nechť Z má normované normální rozdělení. Určete hustotu transformované náhodné veličiny X = Z2. Řešení Zřejmě je pro x < 0 distribuční funkce nulová, pro x > 0 dostáváme: Fx{x) = P[Z2 < x] = P[—y/x < Z < ^/x] = 2tt z2 T dz t 2 e 2 dŕ 2tt 1 _x "2 e 2 a derivací podle x dostaneme hustotu 6c(x) : Rozdělení náhodné veličiny s touto hustotou se nazývá (Pearsonovo) x2 rozdělení s jedním stupněm volnosti a značí se X~X2(1). Náhodné veličiny Typy diskrétních náhodných veličin Spojité náhodné veličiny Transformace náhodných veličin ooooooooo oooooooo oooooo ooo«ooooo Místo náhodné veličiny X, např. „roční plat zaměstnance", budeme vyčíslovat jinou závislou hodnotu ip(X), např. „roční čistý příjem zaměstnance po zdanění a včetně sociálních dávek". V systému se značnou sociální solidaritou je první veličina hodně variabilní, zatímco druhá může být skoro konstantní. Statisticky se proto budou značně odlišovat. Připomeňme si přechod od binomického k Poissonovu rozdělení: Věta (Poissonova) Je-li Xn ~ Bi(n,p„) taková, že lim„- ^oo npn = A a X ~ Po(A), pak lim P[Xn = k] = P[X = k] pro k = 0,1,.... Náhodné veličiny Typy diskrétních náhodných veličin Spojité náhodné veličiny Transformace náhodných veličin ooooooooo oooooooo oooooo oooo»oooo Nejjednodušší funkcí, po konstantách, je afinní závislost ip(x) = a + bx. V prípade afinní transformace diskrétní náhodné veličiny x = |(y — b) je proto pravděpodobnostní funkce nenulová právě v bodech y, = ax\ + b. Ukážeme si, že v případě rozdělení Xn typu Bi(n, p) převádí transformace x = y y/ np{l — p) + np náhodnou veličinu Xn na rozdělení Yn s distribuční funkcí blízkou distribuční funkci spojitého rozdělení A/(0,1). Dříve uvedená Poissonova věta popisuje asymptotické chování binomického rozdělení pří n —> oo a p —> 0, následující věta pak chování v případě konstantní pravděpodobnosti zdaru p. Věta (de Moivre-Laplaceova) Pro náhodné veličiny Xn s rozdělením Bi(n,p) platí Xn - n p lim P n—>oo a < < b 0. Náhodné veličiny Typy diskrétních náhodných veličin Spojité náhodné veličiny Transformace náhodných veličin OOOOOOOOO oooooooo oooooo ooooooooo Řešení (pokr.) Volbou p = 1/6, A = 1800, B = p^.^í 2100 - 2000^ V12000-My = 4>(V6) - Í>(-2V6 2100, n = 12000 dostávame odhad / 1800 - 2000 ^ VV12000-5Í/ ) « 0,992. Poznámka Statistické tabulky - viz např. https://is.muni.cz/auth/el/ 1433/podzim2013/MB103/um/StatTab.pdf nebo sbírka příkladů [BMO]. ' Příklad ^ Pravděpodobnost narození chlapce je 0,515. Jaká je pravděpodobnost, že mezi tisíci novorozenci bude alespoň tolik děvčat jako chlapců? Náhodné veličiny Typy diskrétních náhodných veličin Spojité náhodné veličiny Transformace náhodných veličin ooooooooo oooooooo oooooo ooooooo»o Príklad Nezávisle opakujeme pokus s výsledky 1 a 0, které mají neznámé pravděpodobnosti p a 1 — p. Parametr p chceme odhadnout pomocí relativních četnostíXn/n (Xn je počet jedniček při n pokusech). Víme, že je Xn ~ Bi(n,p), proto nám Moivre-Laplaceova věta umožní určit počet pokusů n potřebný k zajištění požadované přesnosti odhadu ô se spolehlivostí 1 — /3. Využijeme Moivre-Laplaceovu větu zapsanou ve tvaru 0 = lim nó yjnp{l-p) < ó nó yjnp{l-p) Náhodné veličiny Typy diskrétních náhodných veličin Spojité náhodné veličiny Transformace náhodných veličin OOOOOOOOO OOOOOOOO OOOOOO 00000000» Řešení Hledáme nejmenší n, splňující nerovnost P[\Xn/n — p| < ô] > 1 — /3, kterou můžeme podle věty aproximovat nerovností \y/np{l-p)J \ y/np{l - p) = 2* ( , nS )-l>l-fi. \y/np(l-p)J - Ta je ekvivalentní s podmínkou nô/yjnp(l — p) > z(/3/2), kde z(p) je řešení rovnice í>(z(p)) = 1 — p (tzv. kritická hodnota normovaného normálního rozdělení). Pro ô = 0,05 a 1-/3 = 0,9 máme z tabulek z(/3/2) 1,645 a s využitím zřejmého odhadu p(l - p) < 1/4 dostáváme n > (z(/3/2)/2č)2 « 270,6. Náhodné veličiny Typy diskrétních náhodných veličin Spojité náhodné veličiny Transformace náhodných veličin ooooooooo oooooooo oooooo ooooooooo Příklady k procvičení Příklad Náhodne vybraná konzerva v armádním skladu je vadná s pravděpodobností 0,1. Kolik konzerv musí zásobovací důstojník ze skladu vzít, aby mezi nimi bylo s pravděpodobností 99% alespoň 60 bezvadných konzerv. (Předpokládejte, že konzervy jsou vydávány náhodně).