Níže naleznete řešení některých příkladů z 12. cvičení z předmětu MB 103/203, podzim 2018. Číslo v hranaté závorce odkazuje na řešený příklad s ohledem na číslování pdf souboru ke cvičení, který naleznete ve studijních materiálech předmětu (soubor mlllc-2018-12.pdf). Řešení k úlohám by mělo být možné nalézt ve velice podobné formě ve skriptech k tomuto předmětu, odkud jsem je převzal a pouze mírně uzpůsobil s ohledem na notaci a teorii, kterou jsme používali. Kromě jiných výsledků plynoucích z teorie budeme při řešení příkladů potřebovat následující tvrzení. Věta 1 (Cebyševova nerovnost). Nechť X je náhodná veličina s konečným rozptylem DX a nechť e > 0 je libovolná, fixně zvolená konstanta. Pak platí P(\X-EX\>e) < ^ Věta 2 (Markovova nerovnost). Nechť X je nezáporná náhodná veličina1, pro kterou známe střední hodnotu EX a nechť e > 0 je libovolná, fixně zvolená konstanta. Pak platí P{X > e) < E* e Věta 3 (O střední hodnotě, rozptylu a aproximaci binomického rozdělení). Nechť X je náhodná veličina s binomickým rozdělením X ~ Bi(n,p). Pak pro střední hodnotu EX a rozptyl DX platí EX = np DX = np{l — p) . Navíc lze binomické rozdělení aproximovat normálním rozdělením s parametry \i = np a a2 = np{l — p), tj. X ~ N(np,np(l — p)). Řešení. [2. úlohy] X je náhodná veličina s EX = //. Chceme určit P(X > 3/x). Podle Markovovy nerovnosti z věty 2 máme Jestliže navíc víme, že náhodná veličina má exponenciální rozdělení s parametrem fi, tj. X ~ Ex(j^), pak platí P{X > 3/i) = 1 - P{X < 3/i) = 1 - P{X < 3/i) = 1 - F(3/i) , _ x_ kde F(x) = 1 — e ^ je distribuční funkce uvažovaného rozdělení. Proto P(X > 3/i) = 1 - (1 - e~3) = \ . o _ ed xTj. X(u>) > 0 Vcj G Q. 1 Řešeni. [3. úlohy] Cebyšev: Náhodná veličina X, která popisuje počet padlých šestek, má binomické rozdělení X ~ Bi(1200, |). Podle věty 3 to v našem případě znamená, že střední hodnota pro X je a rozptyl je EX = 1200 • - = 200 6 DX = 1200- -(1 --) = 200-- = — 6y 6; 6 3 Pravděpodobnost, že v 1200 pokusech pádně alespoň 150-krát a nejvýše 250-krát hodnota 6 se zapíše jako P(150 < X < 250). Přepíšeme tuto nerovnost pomocí absolutní hodnoty (uvnitř vyjde \X — EX\), využijeme pravděpodobnosti doplňku a použijeme Cebyševovu nerovnost z věty 1. P(150 < X < 250) = P(\X - 200| < 50) = 1 - P(\X - 200| > 51) 500 > 1 3-512 0.94 . Moivre-Laplace: Jelikož přímé vyčíslení hodnoty P(150 < X < 250) pomocí distribuční funkce je (bez užití počítače) komplikované, můžeme využít aproximace pomocí normálního rozdělení. Moivre-Laplaceova věta je důsledkem centrální limitní věty pro náhodné veličiny s binomickým rozdělením. Konkrétně platí, že je-li X náhodná veličina s binomickým rozdělením Bi(n,p), pak náhodná veličina Sn dána vztahem X -np On yjnp{\ -p) bude pro dostatečně velká n konvergovat2 k náhodné veličině se standardizovaným normálním rozdělením3 N(0,1) a distribuční funkcí í>. Pro nás to znamená, že náhodnou veličinu X nahradíme náhodnou veličinou _ X - 200 _ VŠ(X - 200) 102 10a/5 pro jejíž distribuční funkci platí F z ~ 3>. Přepíšeme podle výše uvedeného vztahu pro Z 2aproximace se považuje za dobrou, platí-li np(l — p) > 9, což je v našem případě se značnou rezervou splněno 3tj. normální rozdělení se střední hodnotou 0 a rozptylem 1. nerovnost v pravděpodobnosti P(150 < X < 250) a upravíme P(150 < X < 250) = P(150 - 200 < X - 200 < 250 - 200) = p 73(150- 200) (\/l5) ~ 0.99995 a dohromady získáváme P(150 < X < 250) « 2$(V15) - 1 « 2 • 0.99995 - 1 « 0.9999 = 99. Řešení. [4. úlohy] Jako náhodnou veličinu X máme dle zadání označit rychlost větru a chceme zjistit P(X < 60). Průměrná rychlost je 20 km/hod, tj. EX = 20 a podle Markovovy nerovnosti pak5 20 2 P(X < 60) = 1 - P(X > 60) = 1 - — = - . V druhé části úkolu navíc víme, že směrodatná odchylka a = V DX = 1 km/hod a úloha vede na aplikaci Cebyševovy nerovnoti. Chceme zjistit, pro jaké x platí 0.9 < P(\X — 20| < x). Přitom platí P(\X — 20| < x) = 1 — — 20| > x) a podle Cebyševovy nerovnosti máme P(\X - 20| > x) < 4y, tedy P(|X - 20| < x) < 1 - ^. Dohromady 0.9 < 1 - =^ x > VIĎ « 3.2 . Jelikož jsme zjistili, jak velký výkyv může být kolem průměrné hodnoty větru, víme, že interval rychlostí, kterých vítr s pravděpodobností alespoň 0.9 nabývá, je / « (20 — 3.2,20 + 3.2) = (16.8,23.2). o Řešení. [5. úlohy] V této úloze X je náhodná veličina, která udává počet studentů s prospěchem do 1.2 ze skupiny n náhodně vybraných studentů. X má tedy binomické rozdělení X ~ Bi(n, 0.1), jelikož pouze 10% studentů z celé fakulty má požadovaný prospěch. Úloha se nás ptá, pro jaké nejmenší n bude splněna rovnost 0.95 = P(0.08n < X < 0.012n). Nerovnost uvnitř 4POZOR: Podívejte se, jak tabulka funguje, aby vás při písemce nepřekvapila. Tabulka totiž nevyjadřuje přímo 3>(a;), ale $(a;) — 0.5. 6v nerovnostech využijeme, že X je spojitá, tj. P[X > 60) = P(X > 60) 3 argumentu P můžeme transformovat podobně jako ve 3. úloze a získat aproximaci pomocí standardizovaného normálního rozdělení 0.95 = P(0.08n < X < 0.12n) -0.02n X-0.1n 0.02n P -;=■ < -1=- < O.S^yn ~ 0.3v^ ~ 0.3y/ňJ V 0.3 V ' 2$(0.0666V/ň) - 1 Tedy máme 0.95 « 2$( —y^) - 1 y/n) « 0.975 v30 7 v30 7 V tabulce proto hledáme6 vzor hodnoty 0.975 — 0.5 = 0.475. Zjistíme, že vzor hodnoty 0.475 je číslo 1.96, což znamená P(Z < 1.96) = $(1.96) = 0.975 « $(í^y/ň). Konečně vyvozujeme ^y/ň ~ 1.96 n (1.96 • 15)2 = 864.36. Potřebujeme tedy skupinu 865 studentů, abychom dosáhli požadovaných parametrů. o Řešení. [6. úlohy] Zde volíme náhodnou veličinu X jako počet stromů, které se ujmou. Máme proto X ~ -Bi(500, 0.8), EX = 400, DX = 80 a analogicky jako v předchozích úlohách můžeme aproximovat pomocí standardizovaného rozdělení náhodné veličiny Z = x~400 r^™™^ „;;o+u P{X > 380) P(X> 380) = P(Z>38°-400 '80 = p{z > -VE) « 1 - $(-VE) « 0.987 = 98.7% kde rovnost 1 — $(—a/5) = 3>(\/5) plyne z vlastností standardizovaného normálního rozdělení (funke hustoty je symetrická podle osy y). o Řešeni. [6. úlohy] Nechť X je náhodná veličina určující počet padlých jedniček při 600 hodech ideálni kostkou, tj. X ~ Bi(600, i). Podle věty 3 můžeme X aproximovat pomocí normálního rozdělení AT(100, ^p)- Situaci, ve které padla jednička přesně 45-krát, můžeme uvažovat jako jednoprvkový náhodný výběr. Chceme zjistit, zda-li na hladině spolehlivosti a = 0.01 může uvažovaná kostka být ideální kostkou. V ideální případě padne jednička v 600 hodech 100 krát. Chceme tedy určit oboustranný interval spolehlivosti pro střední hodnotu počtu padlých jedniček naší kostky a zjistit, zda-li v něm ideální střední hodnota 100 leží. Při určování oboustranného intervalu spolehlivosti pro parametr fi vycházíme ze vzorce 1-" = P(-'f-^Z<2)<ř'<-'f + ^Z<2))' 8opět zdůrazňuji, mrkněte se na tabulku pro standardizované normální rozdělení a jak se s ní pracuje 4 kde číslo z (x) odpovídá vzoru hodnoty x v tabulce standardizovaného normálního rozdělení. V našem případě máme a = 0.01, X = 45, ~ = a dostáváme proto, že interval spolehlivosti na hladině a = 0.01 pro střední hodnotu /x je (21, 69). Jelikož hodnota 100 v tomto intervalu neleží, nedá se s pravděpodobností 99% tvrdit, že naše kostka je ideální. o 5