Literatura Pravděpodobnostní funkce a hustoty Náhodné vektory Funkce náhodných veličin Matematika III – 9. týden Základní typy a vlastnosti náhodných veličin Jan Slovák Masarykova univerzita Fakulta informatiky 21.-25. 11. 2016 Literatura Pravděpodobnostní funkce a hustoty Náhodné vektory Funkce náhodných veličin Obsah přednášky 1 Literatura 2 Pravděpodobnostní funkce a hustoty 3 Náhodné vektory 4 Funkce náhodných veličin Literatura Pravděpodobnostní funkce a hustoty Náhodné vektory Funkce náhodných veličin Plán přednášky 1 Literatura 2 Pravděpodobnostní funkce a hustoty 3 Náhodné vektory 4 Funkce náhodných veličin Literatura Pravděpodobnostní funkce a hustoty Náhodné vektory Funkce náhodných veličin Kde je dobré číst? Karel Zvára, Josef Štěpán, Pravděpodobnost a matematická pravděpodobnost statistika, Matfyzpress, 2006, 230pp. J. Slovák, M. Panák, M. Bulant, Matematika drsně a svižně, Muni Press, Brno 2013, v+773 s., elektronická edice www.math.muni.cz/Matematika_drsne_svizne Marie Budíková, Štěpán Mikoláš, Pavel Osecký, Teorie pravděpodobnosti a matematická statistika (sbírka příkladů), Masarykova univerzita, 3. vydání, 2004, 117 stran, ISBN 80-210-3313-4. Marie Budíková, Tomáš Lerch, Štěpán Mikoláš, Základní statistické metody, Masarykova univerzita, 2005, 170 stran, ISBN 80-210-3886-1. Riley, K.F., Hobson, M.P., Bence, S.J. Mathematical Methods for Physics and Engineering, second edition, Cambridge University Press, Cambridge 2004, ISBN 0 521 89067 5, xxiii + 1232 pp. Literatura Pravděpodobnostní funkce a hustoty Náhodné vektory Funkce náhodných veličin Plán přednášky 1 Literatura 2 Pravděpodobnostní funkce a hustoty 3 Náhodné vektory 4 Funkce náhodných veličin Literatura Pravděpodobnostní funkce a hustoty Náhodné vektory Funkce náhodných veličin Diskrétní náhodné veličiny Jestliže náhodná veličina X na pravděpodobnostním prostoru (Ω, A, P) nabývá jen konečně nebo spočetně mnoha hodnot x1, x2, · · · ∈ R, pak existuje pravděpodobnostní funkce f (x) taková, že f (x) = P(X = xi ) x = xi 0 jinak. Spojité náhodné veličiny Hustota f (x) pravděpodobnosti pro náhodnou veličinu X je funkce splňující pro −∞ ≤ a ≤ b ≤ ∞ P(a < X < b) = b a f (x)dx. (∗) Náhodná veličina X, pro kterou existuje její hustota pravděpodobnosti splňující (∗), se nazývá spojitá. Literatura Pravděpodobnostní funkce a hustoty Náhodné vektory Funkce náhodných veličin Degenerované a alternativní rozdělení. Degenerované rozdělení D(µ) odpovídá konstantní hodnotě X = µ. Distribuční funkce FX a pravděpodobnostní funkce fX jsou tedy rovny FX (t) = 0 t ≤ µ 1 t > µ fX (t) = 1 t = µ 0 jinak . Literatura Pravděpodobnostní funkce a hustoty Náhodné vektory Funkce náhodných veličin Degenerované a alternativní rozdělení. Degenerované rozdělení D(µ) odpovídá konstantní hodnotě X = µ. Distribuční funkce FX a pravděpodobnostní funkce fX jsou tedy rovny FX (t) = 0 t ≤ µ 1 t > µ fX (t) = 1 t = µ 0 jinak . Alternativní rozdělení A(p) popisuje pokus s pouze dvěma možnými výsledky, kterým budeme říkat zdar a nezdar. Náhodné veličině X pro určitost přiřadíme hodnotu 0 pro nezdar a 1 pro zdar. Pokud má zdar pravděpodobnost p, pak nezdar musí mít pravděpodobnost 1 − p. Jsou tedy distribuční a pravděpodobnostní funkce tvaru: FX (t) =    0 t ≤ 0 1 − p 0 < t ≤ 1 1 t > 1 fX (t) =    p t = 1 1 − p t = 0 0 jinak . Literatura Pravděpodobnostní funkce a hustoty Náhodné vektory Funkce náhodných veličin Binomické rozdělení Bi(n, p) odpovídá n–krát nezávisle opakovanému pokusu popsanému alternativním rozdělením, přičemž naše náhodná veličina měří počet zdarů. Je tedy zjevné, že pravděpodobnostní funkce bude mít nenulové hodnoty právě v celých číslech 0, . . . , n odpovídajícím celkovému počtu úspěchů v pokusech (a nezáleží nám na pořadí). Je tedy fX (t) = n t pt(1 − p)1−t t ∈ {0, 1, . . . , n} 0 jinak . Literatura Pravděpodobnostní funkce a hustoty Náhodné vektory Funkce náhodných veličin Na obrázku jsou pravděpodobnostní funkce pro Bi(50, 0.2), Bi(50, 0.5) a Bi(50, 0.9). Rozdělení pravděpodobnosti dobře odpovídá intuici, že nejvíce výsledků bude blízko u hodnoty np: Literatura Pravděpodobnostní funkce a hustoty Náhodné vektory Funkce náhodných veličin S binomickým rozdělením se potkáváme velice často v praktických úlohách. Jednou z nich je popis náhodné veličiny, která popisuje počet X předmětů v jedné zvolené příhrádek z n možných, do nichž jsme náhodně rozdělili r předmětů. Umístění kteréhokoliv předmětu do pevně zvolené přihrádky má pravděpodobnost 1/n (každá z nich je stejně pravděpodobná). Zjevně tedy bude pro jakýkoliv počet k = 0, . . . , r P(X = k) = r k 1 n k 1 − 1 n r−k = r k (n − 1)r−k nr , jde proto o rozložení X typu Bi(r, 1/n). Literatura Pravděpodobnostní funkce a hustoty Náhodné vektory Funkce náhodných veličin Jestliže nám bude vzrůstat počet přihrádek n společně s počtem předmětů rn tak, že v průměru nám na každou přihrádku bude připadat (přibližně) stejný počet prvků λ, můžeme dobře vyjádřit chování našeho rozdělení veličin Xn při limitním přechodu n → ∞: Literatura Pravděpodobnostní funkce a hustoty Náhodné vektory Funkce náhodných veličin Jestliže nám bude vzrůstat počet přihrádek n společně s počtem předmětů rn tak, že v průměru nám na každou přihrádku bude připadat (přibližně) stejný počet prvků λ, můžeme dobře vyjádřit chování našeho rozdělení veličin Xn při limitním přechodu n → ∞: lim n→∞ P(Xn = k) = lim n→∞ rn k (n − 1)rn−k nrn = lim n→∞ rn(rn − 1) . . . (rn − k + 1) (n − 1)k 1 k! 1 − 1 n rn = λk k! lim n→∞ 1 + −rn n rn rn = λk k! e−λ protože obecně funkce (1 + x/n)n konvergují stejnoměrně k funkci ex na každém omezeném intervalu v R. To dává Poissonovo rozdělení Po(λ). Literatura Pravděpodobnostní funkce a hustoty Náhodné vektory Funkce náhodných veličin Poissonovo rozdělení Poissonovo rozdělení Po(λ) popisuje např. události, které se vyskytují náhodně v čase a přitom pravděpodobnost výskytu v následujícím časovém intervalu o jednotkové délce nezávisí na předchozí historii a je rovna stále stejné hodnotě λ. V praxi jsou takové procesy spojeny např. s poruchovostí strojů a zařízení. Literatura Pravděpodobnostní funkce a hustoty Náhodné vektory Funkce náhodných veličin Poissonovo rozdělení Poissonovo rozdělení Po(λ) popisuje např. události, které se vyskytují náhodně v čase a přitom pravděpodobnost výskytu v následujícím časovém intervalu o jednotkové délce nezávisí na předchozí historii a je rovna stále stejné hodnotě λ. V praxi jsou takové procesy spojeny např. s poruchovostí strojů a zařízení. Theorem (Poissonova věta) Jsou-li Xn ∼ Bi(n, pn) a limn→∞ n · pn = λ je konečná, pak lim n→∞ P(Xn = k) = P(X = k), kde X ∼ Po(λ). Literatura Pravděpodobnostní funkce a hustoty Náhodné vektory Funkce náhodných veličin Příklady spojitých rozdělení Nejjednodušší je tzv. rovnoměrné rozdělení. Jestliže chceme, aby pravděpodobnost každé hodnoty v předem daném intervalu (a, b) ⊂ R byla stejná, pak hustota fX našeho rozdělení náhodné veličiny X má být konstantní. Pak ovšem jsou pro libovolná reálná čísla −∞ < a < b < ∞ jen jediné možné hodnoty fX (t) =    0 t ≤ a 1 b−a t ∈ (a, b) 0 t ≥ b, FX (t) =    0 t ≤ a t−a b−a t ∈ (a, b) 1 t ≥ b. Literatura Pravděpodobnostní funkce a hustoty Náhodné vektory Funkce náhodných veličin Exponenciální rozdělení ex(λ) je dalším rozdělením, které je snadno určeno požadovanými vlastnostmi náhodné veličiny. Předpokládejme, že sledujeme výskyt náhodného jevu tak, že výskyty v nepřekrývajících se intervalech jsou nezávislé. Je-li tedy P(t) pravděpodobnost, že jev nenastane během intervalu délky t, pak nutně P(t + s) = P(t)P(s) pro všechna t, s > 0. Předpokládejme navíc diferencovatelnost funkce P a P(0) = 1. Pak ln P(t + s) = ln P(t) + ln P(s). Literatura Pravděpodobnostní funkce a hustoty Náhodné vektory Funkce náhodných veličin Exponenciální rozdělení ex(λ) je dalším rozdělením, které je snadno určeno požadovanými vlastnostmi náhodné veličiny. Předpokládejme, že sledujeme výskyt náhodného jevu tak, že výskyty v nepřekrývajících se intervalech jsou nezávislé. Je-li tedy P(t) pravděpodobnost, že jev nenastane během intervalu délky t, pak nutně P(t + s) = P(t)P(s) pro všechna t, s > 0. Předpokládejme navíc diferencovatelnost funkce P a P(0) = 1. Pak ln P(t + s) = ln P(t) + ln P(s). Limitním přechodem: lim s→0+ ln P(t + s) − ln P(t) s = (ln P) (t) = −λ. Odtud vyplývá diferenciální rovnice pro zatím neznámou funkci P(t) (ln P(t)) = −λ. Literatura Pravděpodobnostní funkce a hustoty Náhodné vektory Funkce náhodných veličin Odtud dostáváme ln P(t) = −λt + C a počáteční podmínka P(0) = 1 dává C = 0 a tedy jediné řešení P(t) = e−λt . Všimněme si, že z definice našich objektů vyplývá, že λ > 0. Literatura Pravděpodobnostní funkce a hustoty Náhodné vektory Funkce náhodných veličin Odtud dostáváme ln P(t) = −λt + C a počáteční podmínka P(0) = 1 dává C = 0 a tedy jediné řešení P(t) = e−λt . Všimněme si, že z definice našich objektů vyplývá, že λ > 0. Uvažme náhodnou veličinu X udávající okamžik, kdy náš jev poprvé nastane. Zřejmě tedy je distribuční funkce rozdělení pro X dána FX (t) = 1 − P(t) = 1 − e−λt t > 0 0 t ≤ 0. Je vidět, že je to rostoucí funkce s hodnotami mezi nulou a jedničkou a správnými limitami v ±∞. Hustotu tohoto rozdělení dostaneme derivováním distribuční funkce, tj. fX = λe−λt t > 0 0 t ≤ 0. Literatura Pravděpodobnostní funkce a hustoty Náhodné vektory Funkce náhodných veličin Normální rozdělení je ze všech nejdůležitější. Literatura Pravděpodobnostní funkce a hustoty Náhodné vektory Funkce náhodných veličin Normální rozdělení je ze všech nejdůležitější. Jestliže v binomiálním rozdělení zachováme konstatní úspěšnost p, ale budeme přidávat počet pokusů n, bude pravděpodobnostní funkce kupodivu pořád mít podobný tvar (i když jiné rozměry). Na obrázku při rostoucím n se budou vynesené bodové hodnoty slévat do křivky, pro hodnoty Bi(500, 0.5) a Bi(5000, 0.5) je výsledek vidět na obrázku níže. Třetí křivka na obrázku je grafem funkce f (x) = e−x2/2. Literatura Pravděpodobnostní funkce a hustoty Náhodné vektory Funkce náhodných veličin Hledáme-li podobné spojité rozdělení, potřebovali bychom spočíst b a e−x2/2 dx což není pomocí elementárních funkcí možné. Je však možné (i když ne úplně snadné) ověřit, že příslušný nevlastní integrál konverguje k hodnotě ∞ −∞ e−x2/2 dx = √ 2π. Odtud vyplývá, že možná hustota rozdělení náhodného rozdělení může být fX (x) = 1 √ 2π e−x2/2 . Literatura Pravděpodobnostní funkce a hustoty Náhodné vektory Funkce náhodných veličin Hledáme-li podobné spojité rozdělení, potřebovali bychom spočíst b a e−x2/2 dx což není pomocí elementárních funkcí možné. Je však možné (i když ne úplně snadné) ověřit, že příslušný nevlastní integrál konverguje k hodnotě ∞ −∞ e−x2/2 dx = √ 2π. Odtud vyplývá, že možná hustota rozdělení náhodného rozdělení může být fX (x) = 1 √ 2π e−x2/2 . Rozdělení s touto hustotou se nazývá normální rozdělení N(0, 1). Příslušnou distribuční funkci FX (x) = 1 √ 2π x −∞ e−x2/2 dx nelze vyjádřit pomocí elementárních funkcí, přesto se s ní numericky běžně počítá (pomocí tabulek nebo softwarových aplikací). Literatura Pravděpodobnostní funkce a hustoty Náhodné vektory Funkce náhodných veličin Hledáme-li podobné spojité rozdělení, potřebovali bychom spočíst b a e−x2/2 dx což není pomocí elementárních funkcí možné. Je však možné (i když ne úplně snadné) ověřit, že příslušný nevlastní integrál konverguje k hodnotě ∞ −∞ e−x2/2 dx = √ 2π. Odtud vyplývá, že možná hustota rozdělení náhodného rozdělení může být fX (x) = 1 √ 2π e−x2/2 . Rozdělení s touto hustotou se nazývá normální rozdělení N(0, 1). Příslušnou distribuční funkci FX (x) = 1 √ 2π x −∞ e−x2/2 dx nelze vyjádřit pomocí elementárních funkcí, přesto se s ní numericky běžně počítá (pomocí tabulek nebo softwarových aplikací). Hustotě fX se také často říká Gaussova křivka. Literatura Pravděpodobnostní funkce a hustoty Náhodné vektory Funkce náhodných veličin Plán přednášky 1 Literatura 2 Pravděpodobnostní funkce a hustoty 3 Náhodné vektory 4 Funkce náhodných veličin Literatura Pravděpodobnostní funkce a hustoty Náhodné vektory Funkce náhodných veličin Obdobně definujeme distribuční funkce a hustotu a pravděpodobnostní funkci pro spojité a diskrétní náhodné vektory. Hovoříme také o simultánních (sdružených) pravděpodobnostních funkcích a hustotách. Pro dvě proměnné (vektor (X, Y ) náhodných veličin): f (x, y) = P(X = xi ∧ Y = yj ) x = xi ∧ y = yj 0 jinak. u diskrétních a pro všechny a, b ∈ R pro spojité: F(b, a) = P(−∞ < X < b, ∞ < Y < a) = a −∞ b −∞ f (x, y)dxdy. Literatura Pravděpodobnostní funkce a hustoty Náhodné vektory Funkce náhodných veličin Marginální rozložení pro jednu z proměnných obdržíme tak, že přes ostatní posčítáme nebo zintegrujeme. Např. u diskrétních vektorových veličin (X, Y ) tvoří jevy (X = xi , Y = yj ) pro všechny možné hodnoty xi a yj s nenulovými pravděpodobnostmi pro X a Y úplný systém jevů pro vektor (X, Y ) a dostáváme vztah: P(X = xi ) = ∞ j=1 P(X = xi , Y = yj ) mezi marginálním rozdělením pravděpodobnosti náhodné veličiny X a sdruženým rozdělením pravděpodobnosti náhodného vektoru (X, Y ). Literatura Pravděpodobnostní funkce a hustoty Náhodné vektory Funkce náhodných veličin Náhodné veličiny X a Y jsou stochasticky nezávislé, jestliže jejich sdružená distribuční funkce splňuje F(x, y) = G(x) · H(y), kde G a H jsou distribuční funkce veličin X a Y . Literatura Pravděpodobnostní funkce a hustoty Náhodné vektory Funkce náhodných veličin Plán přednášky 1 Literatura 2 Pravděpodobnostní funkce a hustoty 3 Náhodné vektory 4 Funkce náhodných veličin Literatura Pravděpodobnostní funkce a hustoty Náhodné vektory Funkce náhodných veličin Definition Pro danou spojitou funkci ψ : R → R a náhodnou veličinu X máme dánu také náhodnou veličinu Y = ψ(X). Nazýváme ji funkcí náhodné veličiny X. V případě náhodného vektoru (X1, . . . , Xn) a funkce ψ : Rn → R hovoříme o funkci Y = ψ(X1, . . . , Xn) náhodného vektoru. Požadavek spojitosti ψ zaručuje, že je Y opět náhodnou veličinou podle naší definice, protože vzor borelovské množiny ve spojitém zobrazení je opět borelovská množina. Obecněji můžeme právě tento požadavek na ψ vztáhnout pro každý speciální případ veličiny či vektoru a definovat tak pojem funkce z náhodné veličiny či vektoru obecněji. Literatura Pravděpodobnostní funkce a hustoty Náhodné vektory Funkce náhodných veličin Nejjednodušší funkcí po konstantách je afinní závislost ψ(X) = a + bX s konstantami a, b ∈ R, b = 0. Je-li fX (x) pravděpodobnostní funkce náhodné veličiny s diskrétním rozdělením, snadno se vypočte fψ(X)(y) = P(ψ(X) = y) = ψ(xi )=y f (xi ). V případě afinní závislosti Y = a + bX je proto pravděpodobnostní funkce nenulová právě v bodech yi = axi + b. Např. součet n nezávislých náhodných veličin s alternativním rozdělením A(p) je veličina s binomiální rozdělení Bi(n, p). Literatura Pravděpodobnostní funkce a hustoty Náhodné vektory Funkce náhodných veličin Podobně můžeme přepočíst distribuční funkci rozdělení funkce ze spojité náhodné veličiny, či vektoru. Např. má-li Z s normální rozdělení N(0, 1), pak veličiny Y = µ + σZ budou mít normální rozdělení N(µ, σ). Literatura Pravděpodobnostní funkce a hustoty Náhodné vektory Funkce náhodných veličin Podobně můžeme přepočíst distribuční funkci rozdělení funkce ze spojité náhodné veličiny, či vektoru. Např. má-li Z s normální rozdělení N(0, 1), pak veličiny Y = µ + σZ budou mít normální rozdělení N(µ, σ). Se součty nezávislých spojitých veličin X a Y s hustotami fX a fY je to složitější. Přímým výpočtem spočteme distribuční funkci náhodné promnné V = X + Y . FV (u) = x+y