4 Diskrétní a spojité náhodné veličiny - OSNOVA 4.1 Základy pravděpodobnosti • Motivace: — reálná situace (data) —y popíšeme ji nějakým známým rozdělením (binomické, poissonovo, normální) —y z dat odhadneme parametry rozdělení —y stanovíme nové závěry na základě vlastností rozdělení • Experiment —y založen na náhodném pokusu — porodní hmotnost: náhodný pokus = zvážení 1 novorozence; — vzdělání matky: náhodný pokus = dotaz na jednu matku; — číslo na kostce: náhodný pokus = hod kostkou; • Základni prostor Q = množina všech možných výsledků — porodní hmotnost: 0 — oo; 0 — 6 000g; — počet starších sourozenců: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 a více; — kostka ... 1-6; • Jev = výsledek náhodného pokusu — Hodila jsem kostkou —y nastal jev: (a) padla 5; (b) padlo liché číslo; (c) padlo číslo < 2 — Zvážila jsem novorozence —y nastal jev: (a) vážil 2 654g; (b) vážil více než 2 500g, apod. Pravděpodobnost • vyjadřuje, jak velká je naděje, že nějaký jev nastane • Pr(Á) = Pr(nastal jev A) • Pr(A) E (0; 1); resp. (0% - 100%) • příklad: hodím kostkou: — Pr(padne 1) = 1/6... 16.7% — Pr(padne liché číslo) = 1/2 ... 50 % — Pr(padne 3,4,5,6) = 2/3 ... 66.67 % 1 4.2 Náhodné veličiny • Víc než výsledek nás často zajímají jeho číselné interpretace • Náhodná veličina X = pravidlo, které zobrazuje základní prostor možných výsledků do množiny reálních čísel • i-tá realizace náh. veličiny X se značí Xi (a) X ... počet puntíků na vrchní straně kostky: X\ = 4, x2 = 1 ... (b) Y ... dokončené vzdělání; y± = 1 (ZŠ), y2 = 3 (SŠm) ... (c) Y ... počet starších sourozenců yľ = 0, y2 = 2 ... (d) X ... porodní hmotnost v g; x\ = 3470, x2 = 3240 ... (e) Y ... největší šířka mozkovny v mm; yľ = 145, y2 = 139 ... • Dva typy náhodných veličin: — Diskrétní - z podstaty nabývají převážně celých hodnot (a), (b), (c) * počet sourozenců: 0, 3, 2, ...; novorozenec nemůže mít 2.4 sourozence * hod kostkou: padne 1, 2, 3, 4, 5, 6; nemůže padnout 3.5 . pr(X = A) = ... ■ Pr(X < 4) = ... • Pr(X > 4) = Pr(X > 5) = ... • Pr(3 < X < 5) = ... — Spojité - z podstaty mohou nabývat libovolných i neceločíselných hodnot (d), (e) * porodní hmotnost: • základní prostor rozdělíme na intervaly: II: 0-1500; 12: 1500-2500; 13: 2500-3500; 14: 3500-4500; I5:>4500 • Pr(X G (3500; 4500)) = ... • Pr(X < 3500) • Pr(X > 3500) • Pravděpodobnostní funkce p(x) {X je diskrétní): — p(x) = Pr(X = x) — pstní fce pro případ hodu kostkou: 0.22 -0.20 -_ 0.18 - "s: o.i6 - T T T T T T 0.14 -0.12 - 0.10 -|_______ 1 2 3 4 5 6 x — nezáporná: Pr(x) > 0; normovaná: Pr(-^ = xi) = 1 2 hustota f (x) (X je spojitá) — Pst realizace X v libovolném intervalu / se dá vyjádřit jako plocha pod křivkou pomocí integrálního tvaru: Pr(X el)= í f(x)dx, Jxei kde f (x) je hustota pravděpodobnosti spojité náhodné veličiny — nezáporná: f (x) > 0; normovaná (plocha pod křivkou hustoty = 1) — Hustota normálního rozdělení (Gaussova křivka): distribuční funkce F(x) (X je diskrétní / spojitá) - F(x) = Pr(X < x) - příklad: distribuční fce hodu kostkou: Komplementarita: Pr(X > x) platí v diskrétním případě: * Pr(X = x) = p(x) platí ve spojitém případě: * Pr(X = x) = 0 1 - Pr(X < x) = 1 - F(x) 3 Přehled rozdělení • máme náhodný výběr a rádi bychom věděli z jakého pochází rozdělení. — Diskrétní * Binomické Bin(iV,p); * Poissonovo Po(A) — Spojité * Normální N(fi, a2) * Dvourozměrné normální A^A*, S) • Nejdříve odhadneme typ rozdělení, potom parametry rozdělení 4.3 Diskrétní náhodné veličiny 4.3.1 Binomické rozdělení Bin(iV,p) • Bernoulliho (opakované) pokusy X\,..., X^: — Xi = 1 ... událost nastala; Xi = 0... událost nenastala; i = 1,..., N. Pr(X,t = l)=p — Pr(Xi = 0) = 1 - p = q • Binomické rozdělení: — X... počet událostí v posloupnosti N nezávislých Bernoulliho pokusů, přičemž pravděpodobnost nastání události v každém pokusu je vyjádřena parametrem p. -e = (N,P) — pravděpodobnostní funkce: P{X)= {NX)pX{1~P)N~X x = 0>1>--->N-> — vlastnosti: E[X] = Np; Var[X] = Np(l - p) — dbinom(x, N, p), pbinom(x, N, p), rbinom(M, N, p) 4.3.2 Poissonovo rozdělení Po(A) • X ... počet událostí, které nastanou v jednotkovém časovém intervalu, přičemž k událostem dochází náhodně, jednotlivě a vzájemně nezávisle. Střední počet těchto událostí je vyjádřen parametrem A > 0. • X ~ Po(A) • 9 = A • pravděpodobnostní funkce: \ x A \ P\x) = ~re x = 0,1,...; xi • vlastnosti: E[X] = A; Var[X] = A • dpois(x, lambda), ppois(x, lambda) 4 4.4 Spojité náhodné veličiny 4.4.1 Normální rozdělení iV(/i, a2) • Xi,..., Xn ... nezávislé náhodné veličiny • Normální rozdělení - X ~ N(ii,a2) - hustota - vlastnosti E [X] = /i; Var [X] = a2 - dnorm(x, mu, sigma), pnorm(x, mu, sigma) • Standardizované normální rozdělení - X ~ N(0,1) - 0 = (O,lf - hustota f (x) = (x) = x e R. — vlastnosti E[X] = 0; Var[X] = 1 — dnorm(x), pnorm(x) • Vlastnosti normální rozdělení — Věta 1: Nechť Xi,..., Xn jsou nezávislé náhodné veličiny z normálního rozdělení iV(/i, a2). Potom náhodná veličina Xn = ^ Y^t=i Xi ~ N (ji, . 4.4.2 Aproximace binomického rozdělení normálním rozdělením • Normální rozdělení je limitním rozdělením binomického rozdělení Bin(iV, p), tedy X ~ Bin(iV,p) -> X ~ N(ii,a2), kde /i = Np a a2 = Np(l — p). • Podmínky: N —> oo, p —y 0.5 • Haldova podmínka: Nechť X ~ Bin(iV, p) a platí, že Np > 5 a N(l — p) > 5. Potom rozdělení náhodné proměnné X můžeme aproximovat normálním rozdělením X ~ N(Np, Np(l — p)). 5