Matematika IV - 10. přednáška Transformace a číselné charakteristiky náhodných veličin Michal Bulant Masarykova univerzita Fakulta informatiky 21. 4. 2008 ooooooooooooooooooo Obsah přednášky Transformace náhodných veličin Q Číselné charakteristiky náhodných veličin ooooooooooooooooooo Doporučene zdroje * Martin Panák, Jan Slovák, Drsná matematika, e-text. * Karel Zvára, Josef Štěpán, Pravděpodobnost a matematická statistika, Matfyzpress, 4. vydání, 2006, 230 stran, ISBN 80-867-3271-1. * Marie Budíková, Štěpán Mikoláš, Pavel Osecký, Teorie pravděpodobnosti a matematická statistika (sbírka příkladů), Masarykova univerzita, 3. vydání, 2004, 117 stran, ISBN 80-210-3313-4. * Marie Budíková, Štěpán Mikoláš, Pavel Osecký, Popisná statistika, Masarykova univerzita, 3. vydání, 2002, 48 stran, ISBN 80-210-1831-3. * Marie Budíková, Tomáš Lerch, Štěpán Mikoláš, Základní statistické metody, Masarykova univerzita, 2005, 170 stran, ISBN 80-210-3886-1. Číselne charakteristiky nahodr ooooooooooooooooooo Příklad (rozdelení x 2 ( l ) ) Nechť Z má normované normální rozdělení. Určete hustotu transforomované náhodné veličiny X = Z2 . Řešení Zřejmě je pro x < 0 distribuční funkce nulová, pro x > 0 dostáváme: F*(x) = P[Z2 < x] = P[-y/x < Z < y/x\ = 1 -*-Ae 2 dz '2ir Jo a derivací podle x dostaneme hustotu 1 1 - i - í j t 2 e 2 dŕ 2vr 6c(x) x 2 e 2 . Rozdělení náhodné veličiny s touto hustotou se nazývá (Pearsonovo) %2 rozdělení s jedním stupněm volnosti a značí se x - Y2 m. Číselne charakteristiky nahodr ooooooooooooooooooo Transformace náhodných veličin Místo náhodné veličiny X, např. ,,roční plat zaměstnance", budeme vyčíslovat jinou závislou hodnotu ip(X), např. ,,roční čistý příjem zaměstnance po zdanění a včetně sociálních dávek". V systému se značnou sociální solidaritou je první veličina hodně variabilní, zatímco druhá může být skoro konstantní. Statisticky se proto budou značně odlišovat. Připomeňme si přechod od binomického k Poissonovu rozdělení z minulé přednášky: Věta (Poissonova) Je-li Xn ~ Bi(n,p,,) taková, že lim,,_-+00 npn = X a X - Po(A), pak lim P[Xn = k] -- n-->oo = P[X == k] pro k = 0,1,.... Číselne charakteristiky nahodr ooooooooooooooooooo Binomické rozdělení Bi(n,p) odpovídá n-krát nezávisle opakovanému pokusu popsanému alternativním rozdělením, přičemž naše náhodná veličina měří počet zdarů. Je tedy fx(t) Dťil-p)1 -' t G {0,1,..., n} jinak lim P(Xn = k)= lim ír ") ( n 1)r " k Poissonovo rozdělení popisuje náhodné veličiny s pravděpodobnostní funkcí fx (ŕ) = ^ e " A p r o ř G N .. rn(rn-l)...(rn-k + l) 1 / l V " h m 1 7Ü 77 I ! - - I n->oo ( n -- 1)K k\ -- hm 1 + -- M = T T e Číselne charakteristiky nahodr ooooooooooooooooooo Nejjednodušší funkcí, po konstantách, je afinní závislost ip(x) = a + bx. V případě afinní závislosti x = \{y -- a) je proto pravděpodobnostní funkce nenulová právě v bodech y, = ax; + b.\l případě rozdělení Xn typu Bi(n, p) převádí transformace x = y^np(l -- p) + np náhodnou veličinu Xn na rozdělení Yn s distribuční funkcí blízkou distribuční funkci spojitého rozdělení A/(0,1). Dříve uvedená Poissonova věta popisuje asymptotické chování binomického rozdělení pří n --> oo a p --> 0, následující věta pak chování v případě konstantní pravděpodobnosti zdaru p. Věta (de Moivre-Laplaceova) Pro náhodné veličiny Xn s rozdělením Bi(n,p) platí Xn - np lim P n-->oo a < je distribuční funkce normovaného normálního rozdělení. Příklad Hodíme kostkou celkem 12 000 krát. Určete pravděpodobnost toho, I že počet hozených šestek je mezi 1800 a 2 100. Řešení Přesná pravděpodobnost je dána výrazem Z S o C T K ^ a ) 1 2 0 0 0 ^ což je obtížně vyčíslitelné. Využijeme tvrzení Moivre-Laplaceovy věty, přepsaného do tvaru P[A( B ~np ) - * ( A ~np ) ) pro n -->ˇ 0. Řešení (pokr.) Volbou p = 1/6, A = 1800, B = 2100, n = 12000 dostáváme odhad 2100 - 2000 '12000 - i f 1800 - 2000 '12000 - i f <Í>(V6) - (-2^6) -0,992. Poznámka Statistické tabulky - viz např. h t t p s : / / i s . m u n i . c z / a u t h / e l / 1433/jaro2008/MB104/um/StatTab.pdf nebo sbírka příkladů [BMO]. Osecký. Příklad Pravděpodobnost narození chlapce je 0,515. Jaká je pravděpodobnost, že mezi tisíci novorozenci bude alespoň tolik děvčat jako chlapců? Příklad Nezávisle opakujeme pokus s výsledky 1 a 0, které mají neznámé pravděpodobnosti p a 1 -- p. Parametr p chceme odhadnout pomocí relativních četnostíXn/n (Xn je počet jedniček při n pokusech). Víme, zeje Xn ~ Bi(n,p), proto nám Moivre-Laplaceova věta umožní určit počet pokusů n potřebný k zajištění požadované přesnosti odhadu ö se spolehlivostí 1 -- ß. Využijeme Moivre-Laplaceovu větu zapsanou ve tvaru Xn 0 = lim n-->oo 1 -- ß, kterou můžeme podle věty aproximovat nerovností Ta je ekvivalentní s podmínkou nö/\Jnp{l z{p) je řešení rovnice (z(p)) -p)>z(ß/2), kde 1 -- p (tzv. kritická hodnota normovaného normálního rozdělení). Pro ö = 0, 05 a 1 -- ß = 0, 9 máme z tabulek z(/3/2) w 1, 645 a s využitím zřejmého odhadu p ( l - p) < 1/4 dostáváme n > (z(ß/2)/25)2 w 270,6. ooooooooooooooooooo Transformace normálně rozložené veličiny Podobně zkusme opačnou transformaci provést na veličinu Y s normálním rozdělením A/(0,1). Pro pevně zvolená čísla /x, a G M, a > 0 spočtěme rozdělení náhodné veličiny Z = ß + a Y. Dostáváme distribuční funkci Fz(z) = P(Z < z) = P{ß + uY < z) /x, M^)a 1 e"*2 /2 * 2vr (*-Mr e 2T2 d x , 2-7T(T kde poslední úprava vychází ze substituce x = /j, + at. Hustota naší nové náhodné veličiny Z j e proto 1 (*-M)2 e 2<72 2"7T(x,)P(X = x,). i Je tedy E(ip(X)) přímo spočítatelná pomocí pravděpodobnostní funkce 5cPodobně vyjadřujeme střední hodnotu funkce ze spojité náhodné veličiny: / oo V(x)fx(x)dx, -oo pokud tento integrál absolutně konverguje. Transformace náhodných veličin Číselne charakteristiky náhodných ve ooooooooo oooooooooooooooooo icm Příklad Spočtěme střední hodnotu binomického rozdělení. Pro X ~ Bi(n,p) je E{x) = Yjk-(n \pk {i-PyI,--n \ /k=0 *T^i^^->r> n-l j=0 v JJJ np. Číselne charakteristiky nahodr oooooooooooooooooo Základní vlastnosti střední hodnoty roffii Necht a, b e R 3 X, Y jsou náhodné veličina s existující střední hodnotou. Pak * E(a) = a, * E(a + bX) = a + bE(X), * E(X + Y) = E(X) + E(Y), * jsou-li X a Y nezávislé, pak E(XY) = E{X) E (Y). Důkazy těchto tvrzení jsou přímočaré, zkuste si je udělat! Analogická tvrzení platí i pro náhodné vektory. Příklad Spočtěme ještě jednou střední hodnotu binomického rozdělení, tentokrát s využitím vlastností střední hodnoty. Řešení Vyjádříme počet zdarů v n pokusech jako počet zdarů v jednotlivých pokusech X k=\ přičemž náhodné veličiny Yk mají všechny alternativní rozdělení A{p). Snadno spočítáme E{Yk) = 1 p + 0 ( l -- p) = p. Dále víme, že střední hodnota součtu je součtem středních hodnot, proto E(X) = Y,E(Yk) np. k=\ Dalšími užitečnými charakteristikami jsou tzv. kvantily. Pro ryze monotóní distribuční funkci Fx (tj. spojitou náhodnou veličinu X s všude nenulovou hustotou, jako je tomu např. u normálního rozdělení) jde prostě o inverzní funkci F^1 : (0,1) --> R. To znamená, že hodnota y = F~1 {a) je taková, že P(X < y) = a. Obecněji, je-li fx(x) distribuční funkce náhodné veličiny X, pak definujeme kvantilovou funkci2 F-1 {a) = inf{x G R; F(x) >a}, a e (0,1). Zřejmě jde o zobecnění předchozí definice. Nejčastěji jsou používané kvantily s a = 0.5, tzv. medián, s a = 0.25, tzv. první kvartil, a = 0.75, tzv. třetí kvartil, a podobně pro decily a percentily (kdy je a rovno násobkům desetin a setin). K těmto hodnotám se vrátíme v popisné statistice později. 2 Uvědomte si, že jsme se již s kvantily setkali, jen jsme jím tak zatím neříkali. oooooooooooooooooo Rozptyl a směrodatná odchylka Tyto číselné charakteristiky rozdělení náhodné veličiny nepopisují nějakou střední či typickou hodnotu (jako střední hodnota či medián), ale míru ,,kolísání' náhodné veličiny kolem střední hodnoty. Rozptylem (variancí) náhodné veličiny X, která má konečnou střední hodnotu, nazýváme číslo D(X) = varX = E([X - E(X)]2 ), odmocnina z rozptylu \JD(x) se pak nazývá směrodatná odchylka. Základní vlastnosti rozptylu Pro náhodnou veličinu X a reálna čísla a, b platí: O D{X) = E(X2 ) - E{Xf, O D(a + bX) = b2 D(X), O ^D(a + bX) = \b\^/Ď(XJ. Důkaz. Důkaz je přímočarý - nejprve se dokáže 2. tvrzení, pak se z něj tvrzení první. Poznamenejme, že tvrzení 1 se často používá k výpočtům D{X). D oooooooooooooooooo Kovariance O závislosti dvou náhodných veličin do jisté míry vypovídá tzv. kovariance, definovaná předpisem C(X, Y) = cov(X, Y) = E([X - E(X)][Y - E(Y)]). Veličinám X, Y, pro něž je C(X, Y) = 0, říkáme nekorelované Pro náhodné veličiny s existujícími rozptyly platí: O (X,Y) = C(Y,X), 9 C(X,X) = D(X), O C(X, Y) = E(XY) - E(X)E(Y), O C(a + bX,c + dY) = bdC(X, Y), Q D(X + Y) = D(X) + D(Y) + 2C(X, Y), speciálně, jsou-li X, Y nezávislé, je D(X + Y) = D(X) + D{Y), tj. C(X, Y) = 0 a X, Y jsou nekorelované. Číselne charakteristiky nahodr oooooooooooooooooo Koeficient korelace Koeficient korelace je jen speciální název pro kovarianci dvou normovaných náhodných veličin: R(X, Y) = px>Y = C X-E(X) Y-E(Y) Transformace náhodných veličin ooooooooo Číselne charakteristiky náhodných v oooooooooooooooooo li cm Příklad ^ Spočtěme rozptyl binomického rozdělení. Řešení Stejně jako dříve lze psát X = J2"k=i Yk, kde Y\,... ,Yn jsou nezávislé náhodné veličiny vyjadřující úspěch v k-tém pokusu. I2 * p + O2 * (1 - p) = p, proto : p -- p2 = p(l -- p). Protože pro ED(Yfc),je Snadno vypočteme E(Y%) D{Yk) = E(V2 ) - E{Ykf nezávislé Yk platí D(Y^ Yk) D(X) = np(l-p). Všimněme si, že výraz Xn -- np/\/np(l -- p) vystupující v Moivre-Laplaceově větě je totéž, co Xn -- E(Xn)/\jD(x) a jde tedy o tzv. normovanou náhodnou veličinu (tj. veličinu lineárně transforomovanou tak, aby měla střední hodnotu 0 a rozptyl 1). Moivre-Laplaceova věta pak říká, že pro n --> oo se rozložení této náhodné veličiny blíží normovanému normálnímu rozdělení A/(0,1). OOOOOOOOOOO0OOOOOOO Další momenty Někdy je užitečné studovat řadu dalších charakteristik rozdělení náhodných veličin. Za rozumných předpokladů jsou definovány k-té obecné momenty ß'k E(Xk ) a k-té centrální momenty ßk = E([X-E(X)]k ). Pomocí momentů pak definujeme např. šikmost (asymetrii) náhodné veličiny X jako M3 vwr nebo špičatost (exces) jako _JM_ D(x)2 3. Kladná šikmost distribuce (více vysokých kladných hodnot než odpovídá normálnímu rozdělení s nulovou šikmostí). Momentová vytvořující funkce Definice Reálnou funkci proměnné t G M Mx(t) = E(etX ) nazveme momentovou vytvořující funkcí náhodné veličiny X. Poznámka Je-li X např. spojitá, platí / oo etx f(x)dx = -oo f°° t2 X2 = / (1 + t x + i -- + ...)f(x)dx a ,,iI t Ví = i +1A + -^ +''' a jde vlastně o exponenciální vytvořující funkci posloupnosti /c-tých obecných momentů //fc. BSH Pro momentovou vytvořující funkci platí: * A = ŮM x{t) |t=0. * Platí-li Mx{t) = MY{ť) pro všechna t e (-b, b), mají náhodné veličiny stejné rozdělení, tj. Fx(x) = FY{x). * Ma+bX(t) = eat Mx{bt). * Jsou-li X, Y nezávislé, je Mx+y(r) == Mx(t)MY(t). Transformace náhodných veličin Číselne charakteristiky náhodných ve ooooooooo oooooooooooooooooo icm I Příklad 1 Určete momentovou vytvořující funkci binomického rozdělení. Řešení M(ř) = E(etX ) =í>"(k=0 v n ^pk {i-Py-k = k 0 ) ( p e ř ) k ( l --pf-k = = ( p e ' + ( 1 - P ) ) " =-- (p(ef - 1 ) + 1 ) " . Snáze jsme mohli funkci u momentové vytvořující fun E(etX ) = e t l - p + e t 0 ( l rčit s využitím předchozích vět a kce alternativního rozdělení, neboť - p) = p(ef - 1) + 1. Příklad Naposled spočtěme střední hodnotu a rozptyl binomického rozdělení, tentokrát s využitím vytvořující funkce. Řešení M(t) = (P(é -1) +1)" proto je m- = "(P(ef --1) + iy- "Vp, což pro ř = 0 dá E(X) = //x = np. Podobně spočítáme i D{x) = //2 --(ß'i)2 - oooooooooooooooooo Momenty normálního rozděleni Přímý výpočet střední hodnoty a rozptylu normovaného normálního rozdělení není triviální. S využitím momentové vytvořující funkce je ale poměrně jednoduchý. Nechť Z > Mz(t) A/(0,1). Pak 1-,tz -oo oo 2vr exp exp áz 2tz + t2 exp exp (z - tf áz áz = e x p ( Poslední integrál je roven 1 díky tomu, že na místě integrované funkce je funkce s vlastnostmi hustoty. S využitím předchozího výpočtu Mz(t) = exp í y j snadno spočítáme, že A4(ŕ) = ŕ e x p ( | ) , A^(ŕ) = ŕ 2 e x p ( ^ ) + e x p ( ^ ) . Dosazením ŕ = 0 pak dostaneme E(Z) = 0,D(Z) = 1. Pro transformovanou náhodnou veličinu Y = ß + aZ ~ A/(/x,