Číselné charakteristiky náhodných veličin Motivace Doposud jsme poznali funkcionální charakteristiky náhodných veličin (např. distribuční funkce, pravděpodobnostní funkce, hustota pravděpodobnosti), které plně popisují pravděpodobnostní chování náhodné veličiny. Číselné charakteristiky vystihují pouze některé rysy tohoto chování, např. popisují polohu realizací náhodné veličiny na číselné ose či jejich proměnlivost (variabilitu). Jsou jednodušší než funkcionální charakteristiky, ale nesou jen částečnou informaci. Podobně jako v popisné statistice volíme vhodnou číselnou charakteristiku podle toho, jakého typu je daná náhodná veličina - zda je ordinální nebo intervalová či poměrová. Číselné charakteristiky znaků mají své teoretické protějšky v číselných charakteristikách náhodných veličin. Číselné charakteristiky spojité náhodné veličiny aspoň ordinálního typu Charakteristika polohy : α-kvantil Nechť X je spojitá náhodná veličina aspoň ordinálního typu s distribuční funkcí Φ(x) a hustotou pravděpodobnosti φ(x). Nechť α ∈(0, 1). Číslo Kα(X), které splňuje podmínku α = Φ(Kα(X)) = ∫ α ∞− ϕ )X(K dx)x( , se nazývá α-kvantil náhodné veličiny X. K0,50(X) - medián, K0,25(X) - dolní kvartil, K0,75(X) - horní kvartil, K0,10(X), ..., K0,90(X) - 1. až 9. decil, K0,01(X), ..., K0,99(X) - 1. až 99. percentil. Kterýkoliv α-kvantil je charakteristikou polohy číselných realizací náhodné veličiny na číselné ose. Charakteristika variability: kvartilová odchylka q = K0,75(X) - K0,25(X). Ilustrace Označení pro kvantily speciálních rozložení X ~ N(0, 1) ⇒ Kα(X) = uα, X ~ χ2 (n) ⇒ Kα(X) = χ2 α(n), X ~ t(n) ⇒ Kα(X) = tα(n), X ~ F(n1, n2) ⇒ Kα(X) = Fα(n1, n2). Tyto kvantily najdeme ve statistických tabulkách. Používáme vztahy: uα = - u1-α, tα(n) = - t1-α(n), Fα(n1, n2) = )n,n(F 1 121 α− . Význam kvantilu u0,25 = -0,6745 Význam kvantilu χ2 0,95(8) = 15,5073 Význam kvantilu t0,90(5) = 1,4759 Význam kvantilu F0,05(3,7) = ( ) 1125,0 8867,8 1 3,7F 1 95,0 == Příklad: Nechť U ~ N(0, 1). Pomocí systému STATISTICA najděte 2. decil a první a poslední percentil. První možnost: Použijeme Pravděpodobnostní kalkulátor. Do okénka průměr napíšeme 0, do okénka Sm. Odch. napíšeme 1, do okénka p napíšeme pro 2. decil 0,2, pro první percentil 0,01 a pro poslední percentil 0,99. V okénku X se objeví -0,841621 pro 2. decil, -2,326348 pro první percentil a 2,326348 pro poslední percentil. Ilustrace pro poslední percentil: Šedá plocha pod grafem hustoty má velikost 0,99 a hodnota distribuční funkce v bodě 2,326348 je 0,99 (značeno šrafovaně). Druhá možnost: Otevřeme nový datový soubor o třech proměnné a jednom případu. Do dlouhého jména první proměnné napíšeme =VNormal(0,2;0;1). Dostaneme -0,841621. Do dlouhého jména druhé proměnné napíšeme =VNormal(0,01;0;1). Dostaneme -2,326348. Do dlouhého jména třetí proměnné napíšeme =VNormal(0,99;0;1). Dostaneme 2,326348. Příklad: Nechť X ~ N(-1, 4). Pomocí systému STATISTICA najděte horní kvartil. První možnost: Spustíme Pravděpodobnostní kalkulátor, vybereme Rozdělení Normální. Do okénka průměr napíšeme -1, do okénka Sm. Odch. napíšeme 2, do okénka p napíšeme 0,75 a v okénku X se objeví 0,34898. Druhá možnost: Otevřeme nový datový soubor o jedné proměnné a jednom případu. Do dlouhého jména této proměnné napíšeme =VNormal(0,75;-1;2). Dostaneme 0,34898. Příklad: Pomocí systému STATISTICA určete χ2 0,05(5). První možnost: Spustíme Pravděpodobnostní kalkulátor, vybereme Rozdělení Chi 2. Do okénka sv. napíšeme 5 a do okénka p napíšeme 0,05. V okénku Chi 2 se objeví 1,145476. Druhá možnost: Otevřeme nový datový soubor o jedné proměnné a jednom případu. Do dlouhého jména této proměnné napíšeme =VChi2(0,05;5). Dostaneme 1,145476. Příklad: Pomocí systému STATISTICA určete t0,975(18) a t0,01(4). První možnost: Spustíme Pravděpodobnostní kalkulátor, vybereme Rozdělení t (Studentovo). Do okénka sv. napíšeme 18 (resp. 4) a do okénka p napíšeme 0,975 (resp. 0,01). V okénku t se objeví 2,100922 (resp. -3,746947). Druhá možnost: Otevřeme nový datový soubor o jedné proměnné a jednom případu. Do Dlouhého jména této proměnné napíšeme =VStudent(0,975;18) (resp. VStudent(0,01;4)). Dostaneme 2,100922 (resp. -3,746947). Příklad: Pomocí systému STATISTICA určete F0,975(3, 12) a F0,05(18, 20). První možnost: Spustíme Pravděpodobnostní kalkulátor, vybereme Rozdělení F (Fisherovo). Do okénka sv1 napíšeme 3 (resp. 18), do okénka sv2 napíšeme 12 (resp. 20) a do okénka p napíšeme 0,975 (resp. 0,05). V okénku F se objeví 4,474185 (resp. 0,456486). Druhá možnost: Otevřeme nový datový soubor o jedné proměnné a dvou případech Do Dlouhého jména první proměnné napíšeme =VF(0,975;3;12), do Dlouhého jména druhé proměnné napíšeme =VF(0,05;18;20).Dostaneme 4,474185 (resp. 0,456486). Číselné charakteristiky diskrétních a spojitých náhodných veličin aspoň intervalového typu Charakteristika polohy: střední hodnota E(X) – číslo, které charakterizuje polohu realizací náhodné veličiny na číselné ose s přihlédnutím k jejich pravděpodobnostem. Diskrétní případ: náhodná veličina X má pravděpodobnostní funkci π(x). Střední hodnota ( ) ( )∑ ∞ −∞= π= x xxXE , pokud je suma vpravo konečná. Fyzikální význam: střední hodnota je těžiště soustavy hmotných bodů, jejichž celková hmotnost je 1 a bod o souřadnici x má hmotnost π(x). Spojitý případ: náhodná veličina X má hustotu pravděpodobnosti φ(x). Střední hodnota ( ) ( )∫ ∞ ∞− ϕ= dxxxXE , pokud je integrál vpravo konečný. Fyzikální význam: střední hodnota je těžiště hmotné přímky, jejíž celková hmotnost je 1 a hmota je na přímce rozprostřena podle předpisu φ (x). Centrovaná náhodná veličina: Y = X - E(X). (Pro náhodnou veličinu Y platí: E(Y) = 0.) Střední hodnota transformované náhodné veličiny Y = g(X) ( ) ( ) ( ) ( ) ( )∫ ∑ ∞ ∞ ∞ −∞= ϕ π = - x dxxxg xxg YE Střední hodnota transformované náhodné veličiny Y = g(X1, X2) ( ) ( ) ( ) ( ) ( )∫ ∫ ∑ ∑ ∞ ∞− ∞ ∞− ∞ −∞= ∞ −∞= ϕ π = 212121 x x 2121 dxdxx,xx,xg x,xx,xg YE 1 2 Charakteristika variability: rozptyl D(X) - číslo, které charakterizuje proměnlivost realizací náhodné veličiny kolem její střední hodnoty s přihlédnutím k jejich pravděpodobnostem. Definiční vzorec: ( ) ( )[ ]( )2 XEXEXD −= (rozptyl je střední hodnota kvadrátu centrované náhodné veličiny). Výpočetní vzorec: ( ) ( ) ( )[ ]22 XEXEXD −= (rozptyl je střední hodnota kvadrátu mínus kvadrát středních hodnot). ( ) ( ) ( ) ( ) ( ) 2 -- 2 2 xx 2 dxxxdxxx xx-xx XD       ϕ−ϕ       ππ = ∫∫ ∑∑ ∞ ∞ ∞ ∞ ∞ −∞= ∞ −∞= Směrodatná odchylka ( )XD - vyjadřuje průměrnou variabilitu realizací náhodné veličiny X kolem její střední hodnoty. Standardizovaná náhodná veličina: ( ) ( )XD XEX Z − = (Pro náhodnou veličinu Z platí: E(Z) = 0, D(Z) = 1.) Příklad na výpočet střední hodnoty a rozptylu diskrétní náhodné veličiny: Střelec střílí do terče až do prvního zásahu. Má v zásobě 4 náboje. Pravděpodobnost zásahu je při každém výstřelu 0,6. Náhodná veličina X udává počet nespotřebovaných nábojů. Vypočtěte střední hodnotu a rozptyl náhodné veličiny X. Řešení: X nabývá hodnot 0, 1, 2, 3 a její pravděpodobnostní funkce je π(0) = P(X=0) = 0,44 + 0,43 *0,6 = 0,064, π(1) = P(X=1) = 0,42 *0,6 = 0,096, π(2) = P(X=2) = 0,4*0,6 = 0,24, π(3) = P(X=3) = 0,6, π(x) = 0 jinak E(X) = 0*0,064 + 1*0,096 + 2*0,24 + 3*0,6 = 2,376 D(X) = 02 *0,064 + 12 *0,096 + 22 *0,24 + 32 *0,6 – 2,3762 = 0,8106 Postup ve STATISTICE: Otevřeme nový datový soubor o dvou proměnných X a cetnost a čtyřech případech. Do proměnné X napíšeme 0, 1, 2, 3, do proměnné cetnost napíšeme 64, 96, 240, 600. Statistiky – Základní statistiky/tabulky – Popisné statistiky – OK – zavedeme proměnnou vah cetnost – OK Proměnné X – OK – Detailní výsledky - zaškrtneme Průměr, Rozptyl – Výpočet. Popisné statistiky (Tabulka10) Proměnná N platných Průměr Rozptyl X 1000 2,376000 0,811435 Rozptyl však musíme upravit, musíme ho přenásobit číslem 999/1000. Do výstupní tabulky tedy přidáme za proměnnou Rozptyl novou proměnnou a do jejího Dlouhého jména napíšeme =v3*999/1000 Popisné statistiky (Tabulka10) Proměnná N platných Průměr Rozptyl NProm X 1000 2,376000 0,811435 0,810624 Střední hodnoty a rozptyly vybraných diskrétních a spojitých rozložení X ~ Dg(µ) ⇒ E(X) = µ, D(X) = 0 X ~ A(ϑ) ⇒ E(X) = ϑ, D(X) = ϑ (1-ϑ) X ~ Bi(n, ϑ ) ⇒ E(X) = nϑ , D(X) = nϑ (1-ϑ ) X ~ ( )ϑGe ⇒ ( ) ϑ ϑ− = 1 XE , ( ) 2 1 XD ϑ ϑ− = X ~ ( )n,M,NHg ⇒ ( ) n N M XE = , ( ) 1N nN N M 1 N Mn XD − −       −= X ~ ( )λPo ⇒ ( ) λ=XE , ( ) λ=XD X ~ ( )GRd ⇒ ( ) 2 1n XE + = , ( ) 12 1n XD 2 − = X ~ Rs(a, b) ⇒ E(X) = 2 ba + , D(X) = ( ) 12 ab 2 − X ~ ( )λEx ⇒ ( ) λ = 1 XE , ( ) 2 1 XD λ = X ~ N(µ, σ2 ) ⇒ E(X) = µ, D(X) = σ2 X ~ ( )n2 χ ⇒ ( ) nXE = , ( ) n2XD = X ~ ( )nt ⇒ ( ) 0XE = pro 2n ≥ (pro 1n = střední hodnota neexistuje) , ( ) 2n n XD − = pro 3n ≥ (pro 2,1n = rozptyl neexistuje). X ~ ( )21 n,nF ⇒ ( ) 2n n XE 2 2 − = pro 3n2 ≥ (pro 2,1n2 = střední hodnota neexistuje) , ( ) ( ) ( ) ( )4n2nn 2nnn2 XD 2 2 21 21 2 2 −− −+ = pro 5n2 ≥ (pro 4,3,2,1n2 = rozptyl neexistuje). Čebyševova nerovnost: Jestliže náhodná veličina X má střední hodnotu E(X) a rozptyl D(X), pak ( ) ( )( ) 2 t 1 XDtXEXP:0t ≤>−>∀ . (Význam: pokud neznáme rozložení náhodné veličiny, ale známe její střední hodnotu a rozptyl, pak můžeme odhadnout pravděpodobnost, s jakou se od své střední hodnoty odchýlí o více než t-násobek své směrodatné odchylky.) Ilustrace: Příklad: Nechť E(X) = µ, D(X) = σ2 . a) Odhadněte P( )σ>µ− 3X . b) Jestliže X ~ N(µ, σ2 ), vypočtěte P( )σ>µ− 3X . Řešení: ad a) P( )σ>µ− 3X ≤ 1,0 9 1 3 1 2 == . (Tento výsledek je znám jako pravidlo 3σ a říká, že nejvýše 11,1% realizací náhodné veličiny leží vně intervalu (µ - 3σ, µ + 3σ).) ad b) P( )σ>µ− 3X = 1 – P(-3σ ≤ X – µ ≤ 3σ) = 1 – P(-3 ≤ σ µ−X ≤ 3) = 1 – Φ(3) + Φ(-3) = 2[1 - Φ(3)] = = 2(1 – 0,99865) = 0,0027. (Má-li náhodná veličina normální rozložení, pak pouze 0,27% realizací leží vně intervalu (µ - 3σ, µ + 3σ).) Charakteristika společné variability: kovariance C(X1, X2) – číslo, které charakterizuje variabilitu realizací dvou náhodných veličin X1, X2 kolem jejich středních hodnot s přihlédnutím k pravděpodobnostem těchto realizací. Definiční vzorec: ( ) ( )[ ] ( )[ ]( )221121 XEXXEXEX,XC −−= (kovariance je střední hodnota součinu centrovaných náhodných veličin). Výpočetní vzorec: ( ) ( ) ( ) ( )212121 XEXEXXEX,XC −= (kovariance je střední hodnota součinu mínus součin středních hodnot). ( ) ( ) ( ) ( ) ( ) ( ) ( )∫ ∫∫∫ ∑∑∑ ∑ ∞ ∞− ∞ ∞− ∞ ∞− ∞ ∞− ∞ −∞= ∞ −∞= ∞ −∞= ∞ −∞= ϕϕ−ϕ πππ = 22221111212121 x 222 x 111 x x 2121 21 dxxxdxxxdxdxx,xxx xxxx-x,xxx X,XC 211 2 Význam kovariance: Je-li kovariance kladná (záporná), pak to svědčí o existenci jistého stupně přímé (nepřímé) lineární závislosti mezi realizacemi náhodných veličin X1, X2. Je-li kovariance nulová, pak říkáme, že náhodné veličiny X1, X2 jsou nekorelované a znamená to, že mezi jejich realizacemi není žádný lineární vztah. Pozor – z nekorelovanosti nevyplývá stochastická nezávislost, zatímco ze stochastické nezávislosti plyne nekorelovanost. Charakteristika těsnosti lineárního vztahu: koeficient korelace R(X1, X2) - číslo, které charakterizuje těsnost lineární závislosti realizací náhodných veličin X1, X2. Čím bližší je 1, tím těsnější je přímá lineární závislost, čím bližší je -1, tím těsnější je nepřímá lineární závislost. Definiční vzorec: ( ) ( ) ( ) ( ) ( )         − ⋅ − = 2 22 1 11 21 XD XEX XD XEX EX,XR pro kladné směrodatné odchylky, jinak klademe R(X1, X2) = 0 (koeficient korelace je střední hodnota součinu standardizovaných náhodných veličin). Výpočetní vzorec: ( ) ( ) ( ) ( )21 21 21 XDXD X,XC X,XR = (koeficient korelace je podíl kovariance a součinu směrodatných odchylek). Příklad na výpočet koeficientu korelace diskrétního náhodného vektoru: Náhodná veličina X udává počet skleniček tvrdého alkoholu, které během jedné hodiny pobytu v restauraci vypije náhodně vybraný host a náhodná veličina Y udává počet vykouřených cigaret za 1 h u téhož hosta. Hodnoty simultánní pravděpodobnostní funkce ( )y,xπ jsou dány v kontingenční tabulce: Y X 0 1 2 ( )x1π 1 0,02 0,08 0,05 0,15 2 0,02 0,28 0,25 0,55 3 0,01 0,13 0,16 0,30 ( )y2π 0,05 0,49 0,46 1 Vypočtěte koeficient korelace náhodných veličin X, Y. Řešení: E(X) = 1.0,15 + 2.0,55 + 3.0,30 = 2,15 E(Y) = 0.0,05 + 1.0,49 + 2.0,46 = 1,41 D(X) = 12 .0,15 + 22 .0,55 + 32 .0,30 – 2,152 = 0,4275 D(Y) = 02 .0,05 + 12 .0,49 + 22 .0,46 – 1,412 = 0,3419 C(X,Y) = 1.0.0,02 + 1.1.0,08 + … + 3.2.0,16 – 2,15.1,41 = 0,0585, R(X,Y) = 0,0585/√0,4275√0,3419 = 0,153. Vidíme, že lineární závislost mezi počtem vypitých skleniček tvrdého alkoholu a počtem vykouřených cigaret za 1 h pobytu v restauraci je jenom slabá. Postup ve STATISTICE: Vytvoříme nový datový soubor o třech proměnných X, Y, cetnost a 16 případech. Do proměnné X napíšeme 1, 1, 1, 2, 2, 2, 3, 3, 3, do proměnné Y 3x pod sebe 0, 1, 2 a do proměnné cetnost 2, 8, 5, 2, 28, 25, 1, 13, 16. Statistiky - Základní statistiky/tabulky – zavedeme proměnnou vah cetnost – OK - Korelační matice – OK – 1 seznam proměnných – X, Y – OK. Korelace (alkohol_cigarety.sta) Označ. korelace jsou významné na hlad. p < ,05000 N=100 (Celé případy vynechány u ChD) Proměnná X Y X Y 1,00 0,15 0,15 1,00 Vlastnosti střední hodnoty a) E(a) = a b) E(a + bX) = a + bE(X) c) E(X – E(X)) = 0 d) E       ∑ = n 1i iX = ∑ = n 1i i )X(E e) Jsou-li náhodné veličiny X1, ..., Xn stochasticky nezávislé, pak E         ∏ = n 1i iX = ∏ = n 1i i )X(E Vlastnosti kovariance a) C(a1, X2) = C(X1, a2) = C(a1, a2) = 0 b) C(a1 + b1X1, a2 + b2X2) = b1b2C(X1, X2) c) C(X, X) = D(X) d) C(X1, X2) = C(X2, X1) e) C(X1, X2) = E(X1X2) – E(X1)E(X2) f) C         ∑ ∑ = = n 1i m 1j ji Y,X = ∑∑ = = n 1i m 1j ji )Y,X(C Vlastnosti rozptylu a) D(a) = 0 b) D(a + bX) = b2 D(X) c) D(X) = E(X2 ) - [ ]2 )X(E d) D       ∑ = n 1i iX = ∑ ∑∑ − = +== + 1n 1i n 1ij ji n 1i i )X,X(C2)X(D (jsou-li náhodné veličiny X1, ..., Xn nekorelované, pak D       ∑ = n 1i iX = ∑ = n 1i i )X(D ) Vlastnosti koeficientu korelace a) R(a1, X2) = R(X1, a2) = R(a1, a2) = 0 b) R(a1 + b1X1, a2 + b2X2) = sgn(b1b2) R(X1, X2) c) R(X, X) = 1 pro D(X) ≠ 0, R(X, X) = 0 jinak d) R(X1, X2) = R(X2, X1) e) R(X1, X2) = ( )      > jinak0 0)X(D)X(Dpro )X(D)X(D X,XC 21 21 21 f) 1)X,X(R 21 ≤ a rovnost nastane tehdy a jen tehdy, když mezi veličinami X1, X2 existuje s pravděpodobností 1 úplná lineární závislost, tj. existují konstanty a1, a2 tak, že P(X2 = a1 + a2X1) = 1. (Uvedená nerovnost se nazývá Cauchyova – Schwarzova – Buňakovského nerovnost.) Příklad na využití vlastností číselných charakteristik: Náhodné veličiny X, Y jsou náhodné chyby, které vznikají na vstupním zařízení. Mají střední hodnoty E(X) = -2, E(Y) = 4 a rozptyly D(X) = 4, D(Y) = 9. Koeficient korelace těchto chyb je R(X,Y) = -0,5. Chyba na výstupu zařízení souvisí s chybami na vstupu funkční závislostí Z = 3X2 – 2XY + Y2 - 3. Najděte střední hodnotu chyby na výstupu. Řešení: E(Z) = E(3X2 – 2XY + Y2 – 3) = 3E(X2 ) – 2E(XY) + E(Y2 ) – E(3) = = 3{D(X) + [E(X)]2 } – 2[C(X,Y) + E(X)E(Y)] + D(Y) + [E(Y)]2 – 3 = = 3[D(X) + [E(X)]2 ] – 2[R(X,Y) )Y(D)X(D + E(X)E(Y)] + D(Y) + [E(Y)]2 - 3 = 3(4 + 4) -2[-0,5×2×3 + (-2) ×4] + 9 + 16 – 3 = 24 + 22 + 25 – 3 = 68 Centrální limitní věta: Jsou-li náhodné veličiny X1, …, Xn stochasticky nezávislé a všechny mají stejné rozložení se střední hodnotou µ a rozptylem σ2 , pak pro velká n (n ≥ 30) lze rozložení součtu ∑= n 1i iX aproximovat normálním rozložením N(nµ, nσ2 ). Zkráceně píšeme ( )2 n 1i i n,nNX σµ≈∑= . Pokud součet ∑= n 1i iX standardizujeme, tj. vytvoříme náhodnou veličinu n nX U n 1i i n σ µ− = ∑= , pak rozložení této náhodné veličiny lze aproximovat standardizovaným normálním rozložením. Zkráceně píšeme Un ≈ N(0,1) Normální rozložení je tedy rozložením limitním, k němuž se blíží všechna rozložení, proto hraje velmi důležitou roli v počtu pravděpodobnosti a matematické statistice. Ilustrace centrální limitní věty: Uvažme n stochasticky nezávislých náhodných veličin X1, …, Xn, přičemž každá z nich má rovnoměrné spojité rozložení na intervalu (0,1), tj. Xi ~ Rs(0,1), i = 1, …, n. Protože ( ) 2 1 XE i = a ( ) 12 1 XD i = , podle centrální limitní věty náhodná veličina ( )1,0N 12 n 2 n X n nX U n 1i i n 1i i n ≈ − = σ µ− = ∑∑ == . Položíme-li n = 12, pak ( )1,0N6XU 12 1i i12 ≈−= ∑= . Při ilustraci působení centrální limitní věty na počítači postupujeme tak, že pro každou z 12 veličin Xi ~ Rs(0,1), i = 1, …, 12 vygenerujeme dostatečně velký počet realizací , např. 1000 a uložíme je do proměnných v1 až v12. Do proměnné v13 uložíme součet proměnných v1 až v12 zmenšený o 6. Histogram kterékoliv proměnné v1 až v12 se svým tvarem bude blížit obdélníku, zatímco histogram proměnné v13 se svým tvarem bude blížit Gaussově křivce. Důsledkem centrální limitní věty je Moivreova – Laplaceova věta: Nechť X1, …, Xn jsou stochasticky nezávislé náhodné veličiny, všechny se řídí alternativním rozložením A(ϑ ). Pak jejich součet ∑= = n 1i in XY má binomické rozložení Bi(n, ϑ). Střední hodnota veličiny Yn je E(Yn) = nϑ, rozptyl je D(Yn) = nϑ(1-ϑ). Podle centrální limitní věty se standardizovaná náhodná veličina ( )ϑ−ϑ ϑ− 1n nYn asymptoticky řídí standardizovaným normálním rozložením N(0,1). Aproximace se považuje za vyhovující, když jsou splněny podmínky: 9.)-(1na 1n n 1n 1 >ϑϑ + <ϑ< + Na základě Moivreovy – Laplaceovy věty se používá aproximativní vzorec, který složitý výpočet distribuční funkce binomického rozložení nahrazuje jednoduchým hledáním v tabulkách hodnot distribuční funkce standardizovaného normálního rozložení. Máme náhodnou veličinu Yn ~ Bi(n, ϑ). Pak pravděpodobnostní funkce ( ) ( ) yny n 1 y n yYP − ϑ−ϑ      == pro y = 0, 1, …, n, distribuční funkce ( ) ( ) ( )∑∑ = − = ϑ−ϑ      ===≤ y 0t tnt y 0t 1 t n tYPyYP - složitý výpočet Aproximativní vzorec:         ϑ−ϑ ϑ− Φ≈≤ )1(n ny )yY(P n . Příklad na aplikaci Moivreovy – Laplaceovy věty: 100 x nezávisle na sobě hodíme hrací kostkou. Jaká je pravděpodobnost, že šestka padne aspoň 20 x? Řešení: Y100 – počet šestek ve 100 hodech, Y100 ~ Bi(100, 6 1 ). Ověření podmínek dobré aproximace: 9)-(1na 1n n 1n 1 >ϑϑ + <ϑ< + 9.8,13 6 1 -1 6 1 100a 101 100 6 1 101 1 >=      ⋅⋅<< Aproximativní výpočet: ( ) ( ) ( ) ( ) 26435,073565,01626,01 626,0UP1 6 5 6 1 100 6 100 19 6 5 6 1 100 6 100 Y P119YP120YP 100 100 100100 =−=Φ−≈ ≈≤−=             ⋅⋅ − ≤ ⋅⋅ − −=≤−=≥ Přesný výpočet: ( ) ( ) 219751,0 6 5 6 1100 119120 19 0 100 100100 =                  −=≤−=≥ ∑= − t tt t YPYP Příklad na aplikaci Moivreovy – Laplaceovy věty: Osobě prohlašující, že má proutkařské schopnosti, předložíme 100 dvojic zakrytých nádob. V každé dvojici je jedna nádoba prázdná a druhá naplněná vodou. Výsledky proutkaře srovnáme s výsledky hypotetické osoby, která pracuje zcela náhodně. Nechť náhodná veličina Y100 udává počet úspěšně identifikovaných dvojic nádob. Jaká je pravděpodobnost, že Y100 překročí přirozené číslo y, y = 0, 1, …, 100? Řešení: Je zřejmé, že 100Y ~       2 1 ,100Bi . ( ) ( ) ( ) ( )       − Φ−≈      − ≤ − −=         −⋅⋅ ⋅− ≤ −⋅⋅ ⋅− −=≤−=> 5 50y 1 5 50y 5 50Y P1 5,015,0100 5,0100y 5,015,0100 5,0100Y P1yYP1yYP 100100 100100 y = 50: ( ) ( ) 5,05,010150YP 100 =−=Φ−≈> y = 55: ( ) ( ) 15866,084134,011155YP 100 =−=Φ−≈> y = 60: ( ) ( ) 02275,097725,012160YP 100 =−=Φ−≈> y = 65: ( ) ( ) 00135,099865,013165YP 100 =−=Φ−≈> Ilustrace: závislost ( )yYP 100 > na y -20 0 20 40 60 80 100 120 y -0,2 0,0 0,2 0,4 0,6 0,8 1,0 1,2 p