Matematika IV - 8. přednáška Náhodné veličiny - základní vlastnosti a typy Michal Bulant Masarykova univerzita Fakulta informatiky 19. 4. 2010 □ S Obsah přednášky Q Náhodné veličiny Typy diskrétních náhodných veličin Typy spojitých náhodných veličin Q Funkce náhodných veličin • Transformace náhodných veličin Doporučené zdroje Martin Panák, Jan Slovák, Drsná matematika, e-text. Karel Zvára, Josef Štěpán, Pravděpodobnost a matematická statistika, Matfyzpress, 4. vydání, 2006, 230 stran, ISBN 80-867-3271-1. Marie Budíková, Štěpán Mikoláš, Pavel Osecký, Teorie pravděpodobnosti a matematická statistika (sbírka příkladů), Masarykova univerzita, 3. vydání, 2004, 117 stran, ISBN 80-210-3313-4. Marie Budíková, Statistika, Masarykova univerzita, 2004, distanční studijní opora ESF, http: //www.math.muni.cz/~budikova/esf/Statistika.zip. Marie Budíková, Tomáš Lerch, Štěpán Mikoláš, Základní statistické metody, Masarykova univerzita, 2005, 170 stran, ISBN 80-210-3886-1. Plán přednášky Q Náhodné veličiny Typy diskrétních náhodných veličin Typy spojitých náhodných veličin Q Funkce náhodných veličin • Transformace náhodných veličin □ s Na prostoru R uvažujme nejmenší jevové pole B obsahující všechny /(-rozměrné intervaly. Množinám v B říkáme borelovske množiny (nebo také měřitelné množiny) na Rfc. Na prostoru R uvažujme nejmenší jevové pole B obsahující všechny /(-rozměrné intervaly. Množinám v B říkáme borelovske množiny (nebo také měřitelné množiny) na Rfc. Speciálně pro k = 1 jde o množiny, které obdržíme z intervalů konečnými průniky a nejvýše spočetnými sjednoceními. Na prostoru Rfc uvažujme nejmenší jevové pole B obsahující všechny /(-rozměrné intervaly. Množinám v B říkáme borelovske množiny (nebo také měřitelné množiny) na Rfc. Speciálně pro k = 1 jde o množiny, které obdržíme z intervalů konečnými průniky a nejvýše spočetnými sjednoceními. Definice Náhodná veličina je taková funkce X každou Borelovskou borelovsky měřitelní Množinová funkce X na pravděpodobnostním prostoru (Q,A, P) Q -► R, že vzor X~1{B) patří do A pro množinu B G B na R (tj. X : Q -► R je tzv. 0- PX(B) = PiX-1 (B)) se nazývá rozdělen ' pravděpodobnost náhodné veličiny X. Na prostoru Rfc uvažujme nejmenší jevové pole B obsahující všechny /(-rozměrné intervaly. Množinám v B říkáme borelovske množiny (nebo také měřitelné množiny) na Rfc. Speciálně pro k = 1 jde o množiny, které obdržíme z intervalů konečnými průniky a nejvýše spočetnými sjednoceními. Definice Náhodná veličina X na pravděpodobnostním prostoru (Q,A, P) je taková funkce X : Q —> R, že vzor X_1(ß) patří do „4 pro každou Borelovskou množinu B G B na R (tj. X : Q —> R je tzv. borelovsky měřitelná). Množinová funkce PX{B) = P{X-\B)) se nazývá rozdělení pravděpodobnosti náhodné veličiny X. Náhodný vektor (Xi,... ,Xk) na (Q, A, P) je /c-tice náhodných veličin. Definice náhodné veličiny zajišťuje, že pro všechny —oo < a < b < oo existuje pravděpodobnost P(a < X < b), kde používáme stručné značení projev A = (w G Q; a < X{uo) < b)). Definice Distribuční funkcí (distribution, cumulative density function) náhodné veličiny X je funkce F : R —> R definovaná pro všechny x G R vztahem F(x) = P(X < x). □ S Definice náhodné veličiny zajišťuje, že pro všechny —oo < a < b < oo existuje pravděpodobnost P(a < X < b), kde používáme stručné značení projev A = (w G Q; a < X(w) < b)). Definice Distribuční funkcí náhodné veličiny X x G R vztahem (distribution je funkce F F(x) = , cumulative : R -^ R def P(X < x). density function) novaná pro všechny Distribuční funkcí náhodného vektoru (Xi, F : R^ —> R definovaná pro všechny (xi,..., .. ,X/() je funkce Xk) G Rfc vztahem F(x ) = P(Xi < xi A • •AXt xn. Q Je-li X spojitá, pak je F (x) diferencovatelná a její derivace se rovná hustotě X, tj. platí F'(x) = f (x). Distribuční funí o o ■š ► ■= -O QvO Obdobně definujeme distribuční funkce a hustotu a pravděpodobnostní funkci pro spojité a diskrétní náhodné vektory. Hovoříme také o simultánních pravděpodobnostních funkcích a hustotách. □ s Obdobně definujeme distribuční funkce a hustotu a pravděpodobnostní funkci pro spojité a diskrétní náhodné vektory. Hovoříme také o simultánních pravděpodobnostních funkcích a hustotách. Pro dvě proměnné (vektor (X, Y) náhodných veličin): f(*,y) P(X = Xj A Y = y,) x =Xj A y = y, 0 jinak, u diskrétních a pro všechny a, b G M pro spojité: P(-oo 1 [O jinak Alternativní rozděleni popisuje pokus se dvěma možnými výsledky, často nazývanýni zdar, resp. nezdar. Náhodná veličina X ~ A{p) nabývá hodnoty 1 {zdar) s pravděpodobností p. Distribuční a pravděpodobnostní funkce jsou tedy tvaru: Fx(t) Binomické rozdělení Bi(n,p) odpovídá n-krát nezávisle opakovanému pokusu popsanému alternativním rozdělením, přičemž naše náhodná veličina měří počet zdarů. Je tedy 6f(t) = /Ot(l-P)1-t t e {0,1,...,n} 10 jinak 0 ř<0 p ŕ = l 1-p 0< t<1 6c(ŕ) = ll-p ŕ=0 1 ŕ> 1 [O jinak Na obrázku jsou pravděpodobnostní funkce pro Bi(50,0.2), Bi(50,0.5) a Bi(50, 0.9). Rozdělení pravděpodobnosti dobře odpovídá intuici, že nejvíce výsledků bude blízko u hodnoty np: 9 - = = -oao- Binomické rozdělení S binomickým rozdělením se potkáváme velice často v praktických úlohách. Jednou z nich je popis náhodné veličiny, která popisuje počet X předmětů v jedné zvolené přihrádek z n možných, do nichž jsme náhodně rozdělili r předmětů. Umístění kteréhokoliv předmětu do pevně zvolené přihrádky má pravděpodobnost 1/n (každá z nich je stejně pravděpodobná). Zjevně tedy bude pro jakýkoliv počet k = 0,..., r P(X = k) r-k r\(n-iy-k k ď : jde proto o rozložení X typu Bi(r, 1/n). Jestliže nám bude vzrůstat počet přihrádek n společně s počtem předmětů rn tak, že v průměru nám na každou přihrádku bude připadat (přibližně) stejný počet prvků A, můžeme dobře vyjádřit chování našeho rozdělení veličin Xn při limitním přechodu n —> oo. Binomické —>■ Poissonovo rozdělení Jestliže nám bude vzrůstat počet přihrádek n společně s počtem předmětů rn tak, že v průměru nám na každou přihrádku bude připadat (přibližně) stejný počet prvků A, můžeme dobře vyjádřit chování našeho rozdělení veličin Xn při limitním přechodu n —> oo. Takovéto chování popisuje např. fyzikální soustavy s velikým počtem molekul plynu. Standardní úpravy vedou při lim^oo rn/n = A k výsledku: lim P(Xn = k) k rn(rn lim n—>oo lim n—>oo — hm k! n—>oo rn\ (n - If"- nrn l)...(rn k + 1) 1 (n-iy k\ 1 + /c! protože obecně funkce (1 + x/n)n konvergují stejnoměrně k funkci ex na každém omezeném intervalu v □ s Poissonovo rozdělení popisuje náhodné veličiny s pravděpodobnostní funkcí 10 jinak. Jak jsme odvodili výše, toto diskrétní rozdělení (rozložené do nekonečně mnoha bodů) dobře aproximuje binomická rozdělení Bi(n, X/n) pro konstantní A > 0 a veliká n. Poissonovo rozdělení Po(A) Poissonovo rozdělení popisuje náhodné veličiny s pravděpodobnostní funkcí fx(t) k\ 0 řGN jinak. Jak jsme odvodili výše, toto diskrétní rozdělení (rozložené do nekonečně mnoha bodů) dobře aproximuje binomická rozdělení Bi(n, X/n) pro konstantní A > 0 a veliká n. Snadno ověříme A* E «*) = E Ír •-*=«-* E k=0 hl k\ -A+A 1. □ s Dobře modeluje výskyt jevů: • s očekávanou konstantní hustotou na jednotku objemu - např. bakterie ve vzorku (popis očekávaného výskytu k bakterií při rozdělení vzorku na n stejných částí) • rozdělení událostí, které se vyskytují náhodně v čase a bez závislosti na předchozí historii - v praxi jsou takové procesy často spojeny s poruchovostí strujů a zařízení Geometrické rozdělení má náhodná veličina X ~ Ge(p), která udává celkový počet nezdarů, které v posloupnosti opakovaných pokusů předcházejí prvnímu zdaru, přičemž pravděpodobnost úspěchu v každém pokusu je rovna p . □ s Geometrické rozdělení má náhodná veličina X ~ Ge(p), která udává celkový počet nezdarů, které v posloupnosti opakovaných pokusů předcházejí prvnímu zdaru, přičemž pravděpodobnost úspěchu v každém pokusu je rovna p . fx(t) (1-pY-P pro t = 0,1, 0 jinak. □ s Geometrické rozdělení má náhodná veličina X ~ Ge(p), která udává celkový počet nezdarů, které v posloupnosti opakovaných pokusů předcházejí prvnímu zdaru, přičemž pravděpodobnost úspěchu v každém pokusu je rovna p . fx(t) (1-pY-P pro t = 0,1, 0 jinak. Hypergeometrické rozdělení. Mějme N předmětů, z nichž právě M má danou vlastnost. Z těchto N předmětů náhodně vybereme n předmětů bez vracení. Náhodná veličina X ~ Hg(/V, M, n) udává počet vybraných prvků s danou vlastností. Zřejmě tato náhodná velišina může nabývat pouze celočíselných hodnot z intervalu [max{0, M — N + n}, min{n, M}]. Pro t z tohoto intervalu pak fx(t) Cľ)(tľ) □ s Plán přednášky Q Náhodné veličiny Typy diskrétních náhodných veličin Typy spojitých náhodných veličin Q Funkce náhodných veličin • Transformace náhodných veličin □ s Rovnoměrné spojité rozdělení Rs(a, b) je nejjednoduším příkladem spojitého rozdělení. Ilustruje, že při jednoduše formulovaném požadavku na chování rozdělení nám nezbude moc prostoru pro jeho definici. Nyní chceme, aby pravděpodobnost každé hodnoty v předem daném intervalu (a, í))cM byla stejná, tj. hustota fx našeho rozdělení náhodné veličiny X má být konstantní. Pak ovšem jsou pro libovolná reálná čísla —oo < a < b < oo jen jediné možné hodnoty fx(t) t< a t G (a, b) t> b, Fx(t) 0 t-a b-a t < a t G (a, b) t> b. □ S Exponenciální rozdělení ex(A) je dalším rozdělením, které je snadno určeno požadovanými vlastnostmi náhodné veličiny. Předpokládejme, že sledujeme náhodný jev, jehož výskyty v nepřekrývajících se časových intervalech jsou nezávislé. Je-li tedy P(t) pravděpodobnost, že jev nenastane během intervalu délky ř, pak nutně P(t + s) = P(t)P(s) pro všechna ŕ, s > 0. □ s Exponenciální rozdělení ex(A) je dalším rozdělením, které je snadno určeno požadovanými vlastnostmi náhodné veličiny. Předpokládejme, že sledujeme náhodný jev, jehož výskyty v nepřekrývajících se časových intervalech jsou nezávislé. Je-li tedy P(t) pravděpodobnost, že jev nenastane během intervalu délky ř, pak nutně P(t + s) = P(t)P(s) pro všechna ŕ, s > 0. Předpokládejme navíc diferencovatelnost funkce P a P(0) = 1. Pak jistě In P{t + s) = In P(ť) + In P{s), takže limitním přechodem lim 5^0 + In P(ŕ + s)-In P(r) (InP)V(O). Označme si spočtenou derivaci zprava v nule jako —A G M. Pak tedy pro P{ť) platí In P{ť) = —Xt + C a počáteční podmínka dává jediné řešení -At P(t) = e Všimněme si, že z definice našich objektů vyplývá, že A > 0. □ ► < S > <-=► < -E ► Nyní uvažme náhodnou veličinu X udávající (náhodný) okamžik, kdy náš jev poprvé nastane. Zřejmě tedy je distribuční funkce rozdělení pro X dána -At Fx(t) P(t) r>0 r<0. Je vidět, že skutečně jde rostoucí funkci s hodnotami mezi nulou a jedničkou a správnými limitami v ±00. Hustotu tohoto rozdělení dostaneme derivováním distribuční funkce, tj. ÍAe"At ř>0 fx 0 r<0. □ S Jde o nejdůležitější rozdělení. Uveďme nejprve motivaci pro jeho zavedení. Jde o nejdůležitější rozdělení. Uveďme nejprve motivaci pro jeho zavedení. Pokud budeme v binomickém rozdělení Bi(n, p) zvyšovat n při zachování úspěšnosti p, bude mít pravděpodobnostní funkce pořád přibližně stejný tvar. Bi(500,0.5) Bi(5000,0.5) graf funkce e x I2 = -oao- Normální rozdělení A/(0,1) Vzhledem k uvedené motivaci se nabízí hledat vhodné spojité rozdělení, které by mělo hustotu danou nějakou obdobnou funkcí. Protože je e_x '2 vždy kladná funkce, potřebovali bychom spočíst J e~x /2 dx což není pomocí elementárních funkcí možné. Je však možné (i když ne úplně snadné) ověřit, že příslušný nevlastní integrál konverguje k hodnotě -2/2 dx 2vr. Odtud vyplývá, že možná hustota rozdělení náhodného rozdělení může být 1 6c(x) -x2/2 2vr Rozdělení s touto hustotou se nazývá normální rozdělení N(0,1). Normální rozdělení A/(0,1) Příslušnou distribuční funkci Fx(x)= ľ e~x2/2dx nelze vyjádřit pomocí elementárních funkcí, přesto se s ní numericky běžně počítá (pomocí tabulek nebo softwarových aplikací). Hustotě fx se také často říká Gaussova křivka. Normální rozdělení A/(0,1) Příslušnou distribuční funkci Fx(x) -2/2 dx nelze vyjádřit pomocí elementárních funkcí, přesto se s ní numericky běžně počítá (pomocí tabulek nebo softwarových aplikací). Hustotě fx se také často říká Gaussova křivka. Abychom uměli přesněji zformulovat asymptotickou blízkost normálního a binomického rozdělení pro n —> oo, musíme si vytvořit další nástroje pro práci s náhodnými veličinami. Budeme k tomu používat funkce dvojím různým způsobem. □ s Příklad Nechť má náhodná veličina X rovnoměrné rozdělení na intervalu (0, r). Určete distribuční funkci a hustotu pravděpodobnosti rozdělení objemu koule o poloměru X. □ s Příklad Nechť má náhodná veličina X rovnoměrné rozdělení na intervalu (0, r). Určete distribuční funkci a hustotu pravděpodobnosti rozdělení objemu koule o poloměru X. Řešení Určeme nejprve distribuční funkci F (pro 0 < d < f 7rr3) F{d) = P ^vrX3 < d 3 = P X < \ — ~ V 47T 3/šZ V 4-7T f celkem í 0 pro x < 0 F(x) = l ^x3 pro 0 < x < fvrr3 [ 1 pro X > |7Tf3 Derivováním pak obdržíme hustotu pravděpodobnosti. Plán přednášky Q Náhodné veličiny Typy diskrétních náhodných veličin Typy spojitých náhodných veličin Q Funkce náhodných veličin • Transformace náhodných veličin □ s Příklad (rozdělení x2(l)) Nechť Z má normované normální rozdělení. Určete hustotu transformované náhodné veličiny X = Z2. □ s Příklad (rozdělení x2(l)) Nechť Z má normované normální rozdělení. Určete hustotu transformované náhodné veličiny X = Z2. Řešení Zřejmě je pro x < 0 distribuční funkce nulová, pro x > 0 dostáváme: Fx(x) = P[Z2 < x] = P[-y/x < Z < y/x\ = 1 -^a e 2 dz ß. V2ŤŤ Jo V27T a derivací podle x dostaneme hustotu 1 1 -i -^ t 2 e 2 dř 6c(x) _ 1 _x x 2 e 2 . Rozdělení náhodné veličiny s touto hustotou se nazývá (Pearsonovo) %2 rozdělení s jedním stupněm volnosti a značí se x - v2m. Místo náhodné veličiny X, např. „roční plat zaměstnance", budeme vyčíslovat jinou závislou hodnotu ip(X), např. „roční čistý příjem zaměstnance po zdanění a včetně sociálních dávek". V systému se značnou sociální solidaritou je první veličina hodně variabilní, zatímco druhá může být skoro konstantní. Statisticky se proto mohou značně odlišovat. Transformace náhodných veličin Místo náhodné veličiny X, např. „roční plat zaměstnance", budeme vyčíslovat jinou závislou hodnotu ip(X), např. „roční čistý příjem zaměstnance po zdanění a včetně sociálních dávek". V systému se značnou sociální solidaritou je první veličina hodně variabilní, zatímco druhá může být skoro konstantní. Statisticky se proto mohou značně odlišovat. Nejjednodušší funkcí, po konstantách, je afinní závislost ip(x) = a + bx s konstatními a, b e M, b ^ 0. Je-li 6c(x) pravděpodobnostní funkce náhodné veličiny s diskrétním rozdělením, snadno se vypočte ip(xi)=y V případě afinní závislosti x = ^(y — a) je proto pravděpodobnostní funkce nenulová právě v bodech y = ax\ + b. V případě rozdělení Xn typu Bi(n,p) převádí transformace y\/np(l -p) + np náhodnou veličinu Xn na rozdělení Yn s distribuční funkcí blízkou distribuční funkci spojitého rozdělení A/(0,1). □ s - V případě afinní závislosti x = ^(y — a) je proto pravděpodobnostní funkce nenulová právě v bodech y = ax\ + b. V případě rozdělení Xn typu Bi(n,p) převádí transformace x = y^/np(l - p) + np náhodnou veličinu X„ na rozdělení Yn s distribuční funkcí blízkou distribuční funkci spojitého rozdělení A/(0,1). Věta (Moivre-Laplaceova) Pro náhodné veličiny Xn s rozdělením Bi(n,p) platí Xn - np lim P n—>oo a < je distribuční funkce normovaného normálního rozdělení. □ g - = Příklad Hodíme kostkou celkem 12 000 krát. Určete pravděpodobnost toho, I že počet hozených šestek je mezi 1800 a 2 100. □ s Náhodne veličiny Typy diskretn ooooooo ooooooo Příklad Hodíme kostkou celkem 12 000 krát. Určete pravděpodobnost toho, I že počet hozených šestek je mezi 1800 a 2 100. Řešení Přesná pravděpodobnost je dána výrazem 2100 A2000^1^5U2000-^ Qof jfi obtížně vycTs|ite|ne. Y^iuu /12000\/1>>/(/5>i12000 2^k=1800 \ k /V6^V6^ □ g - = Náhodne veličiny Typy diskretn ooooooo ooooooo Příklad Hodíme kostkou celkem 12 000 krát. Určete pravděpodobnost toho, I že počet hozených šestek je mezi 1800 a 2 100. Řešení Přesná pravděpodobnost je dána výrazem ZS»o CTK^a)12000^ což je obtížně vyčíslitelné. Využijeme tvrzení Moivre-Laplaceovy věty, přepsaného do tvaru P[A( B~np )-*( A~np ))- pro n —> 0. □ s Náhodne veličiny Typy diskretn ooooooo ooooooo Příklad Hodíme kostkou celkem 12 000 krát. Určete pravděpodobnost toho, I že počet hozených šestek je mezi 1800 a 2 100. Řešení Přesná pravděpodobnost je dána výrazem ZS»o CTK^a)12000^ což je obtížně vyčíslitelné. Využijeme tvrzení Moivre-Laplaceovy věty, přepsaného do tvaru P[A( B~np )-*( A~np ))- pro n —> 0. □ s Řešení (pokr. Volbou p = 1/6, A = 1800, B = 2100, n = 12000 dostáváme odhad P^

1800 - 2000 12000-||_ (V6) - *(-2\/6) ^0,992. □ g - = Podobně zkusme opačnou transformaci provést na veličinu Y s normálním rozdělením A/(0,1). Pro pevně zvolená čísla /x, a G M, a > 0 spočtěme rozdělení náhodné veličiny Z = ß + a Y. Transformace normálně rozložené veličiny Podobně zkusme opačnou transformaci provést na veličinu Y s normálním rozdělením A/(0,1). Pro pevně zvolená čísla /x, a G M, a > 0 spočtěme rozdělení náhodné veličiny Z = ß + a Y. Dostáváme distribuční funkci Fz(z) = P(Z < z) = P{ß + uY < z) O" J-oo V27T (*-m)2 e 2«t2 c/x, 2-7T(T kde poslední úprava vychází ze substituce x = /j, + at. Hustota naší nové náhodné veličiny Zje proto 1 (x-m)2 f- = ------------ e 2CT2 2"7T