4.2. Poznámka: Lze odvodit, že náhodná veličina X~ ( )λPo má tyto číselné charakteristiky: a) střední hodnota ( ) λ=XE b) rozptyl ( ) λ=XD c) šikmost ( ) λ =α 1 X3 d) špičatost ( ) λ =α 1 X4 4.3. Poznámka: Náhodná veličina X~ ( )λPo udává počet událostí, které nastanou v jednotkovém časovém intervalu resp. jednotkové oblasti, přičemž tyto události nastávají náhodně, jednotlivě a nezávisle na sobě. Parametr λ > 0 udává střední hodnotu (i rozptyl) počtu událostí. Poissonovým rozložením se řídí např. - počet výzev, které dojdou na TÚ za jednotkový časový interval - počet mikroorganizmů v jednotkové oblasti zorného pole mikroskopu - počet požadavků v systému hromadné obsluhy za jednotkový časový interval - atd. Upozornění: Pokud X udává počet událostí, které nastanou v časovém intervalu délky t a střední hodnota počtu událostí v jednotkovém časovém intervalu je λ, pak X~ ( )tPo λ . 4.4. Věta: Nechť X ~ ( )λPo a Y ~ ( )n,nBi ϑ , přičemž 0lim n n =ϑ ∞→ a λ=ϑ ∞→ n n nlim . Pak pravděpodobnostní funkce náhodné veličiny Y konverguje pro n → ∞ k pravděpodobnostní funkci náhodné veličiny X. Důkaz: ( ) ( ) ( ) ( ) ( ) ( ) λ− − ∞→∞→∞→ − ∞→ − ∞→ − ∞→ − ∞→ λ = =      λ −      λ −            − −      − λ =      λ − +−−⋅λ = =      λ −      λ − =ϑ−ϑ − =ϑ−ϑ      e !y n 1lim n 1lim n 1y 1 n 1 11lim !yn 1 n 1yn1nn lim !y n 1 n!yn!y !n lim1 !yn!y !n lim1 y n lim y y n n nn yyn nn y yny n yn n y n n yn n y n n K K Upozornění: Binomické rozložení můžeme dobře aproximovat Poissonovým rozložením, když pravděpodobnost výskytu jevu v jednom pokusu je velmi malá ( 1,0≤ϑ ) a zároveň počet pokusů je dostatečně velký ( 30n ≥ ). 4.5. Příklad: Předpokládejme, že při pěstování rostlin hrachu je pravděpodobnost uhynutí rostliny 0,002. Jaká je pravděpodobnost, že při pěstování 1000 rostlin a) neuhyne žádná rostlina, b) uhynou nejvýše 4 rostliny? Řešení: Označme Y náhodnou veličinu, která udává počet uhynulých rostlin hrachu. Z podmínek úlohy plyne, že Y ~ ( )002,0;1000Bi . Přesný výpočet: a) ( ) 13506452,0)002.0,1000,0(binopdf998,0002,0 0 1000 0YP 010000 ==      == − b) ( ) 94752761,0)002.0,1000,4(binocdf998,0002,0 y 1000 4YP 4 0y y1000y ==      =≤ = − Aproximace Poissonovým rozložením: podmínky 30n ≥ a 1,0≤ϑ jsou splněny. Přitom 2002,01000n =⋅=ϑ⋅=λ . a) ( ) 13533528,0)2,0(poisspdfe !0 2 0YP 2 0 ==≈= − b) ( ) 94734699,0)2,4(poisscdfe !y 2 4YP 4 0y 2 y ==≈≤ = − 4.6. Věta: Nechť X ~ ( )λPo . Pak pro modus xˆ platí: λ≤≤−λ xˆ1 . Je-li λ přirozené číslo, pak existují dvě modální hodnoty. Není-li λ přirozené číslo, je Poissonovo rozložení unimodální. Důkaz: Protože modus je nejpravděpodobnější hodnota, musí současně vyhovovat dvěma nerovnostem: ( ) ( ) ( ) ( )1xˆxˆ1xˆxˆ +π≥π∧−π≥π , tj. ( ) ( ) ( ) ( ) 1 xˆ 1xˆ 1 xˆ 1xˆ ≤ π +π ∧≤ π −π . Dosadíme za pravděpodobnostní funkci a postupně upravujeme: ( ) ( ) 1 e !xˆ e !1xˆ 1 e !xˆ e !1xˆ xˆ 1xˆ xˆ 1xˆ ≤ λ + λ ∧≤ λ − λ λ− λ− + λ− λ− − 1 1xˆ 1 xˆ ≤ + λ ∧≤ λ 1xˆxˆ −λ≥∧λ≤ , tj. λ≤≤−λ xˆ1 . 4.7. Příklad: K holiči chodí průměrně 6 zákazníků za 1 h. Určete nejpravděpodobnější počet zákazníků u holiče během půl hodiny a určete pravděpodobnost tohoto počtu. Řešení: Náhodná veličina X udává počet zákazníků u holiče během 1/2 h, X ~ ( )3Po . Protože λ je přirozené číslo, existují dvě modální hodnoty, a to 2 a 3. Jejich pravděpodobnosti: ( ) 224,0e5,4e !2 3 2XP 33 2 ==== −− ( ) 224,0e5,4e !3 3 3XP 33 3 ==== −− 4.8. Věta: Nechť X ~ Po(λ). Pak pro L,3,2,1x =∀ platí: ( ) ( )1xxx −λπ=π . Pravděpodobnostní funkci Poissonova rozložení lze tedy vyjádřit rekurzívně: ( ) ( )1x x x −π λ =π pro x = 1, 2, 3, …, ( ) λ− =π e0 Důkaz: ( ) ( ) ( ) ( )1xe !1x e !1x e !x xxx 1xxx −λπ= − λ λ= − λ = λ =π λ− − λ−λ− 4.9. Věta: Nechť X ~ Po(λ). Pak pro L,2,1,0x =∀ platí: ( ) ( ) ( )1x ,1x x +Γ λ+Γ =Φ , kde ( )  ∞ −− =Γ 0 t1a dteta , ( )  ∞ λ −− =λΓ dtet,a t1a , pro přirozené a: ( ) ( )!1aa −=Γ , ( ) ( ) ( ) λ−−λ−−λ− −++λ−+λ=λΓ e!1ae1ae,a 2a1a K Důkaz: ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )x01xx ee !1x e !x!x e !x !x e 1xx !x e x !x e 1x ,1x 1xx2x1xx Φ=π++−π+π= =++ − λ + λ =++ λ −+ λ + λ = +Γ λ+Γ λ−λ− − λ− λ−−λ−−λ−λ− K KK 4.10. Věta: Nechť X1, X2 jsou stochasticky nezávislé náhodné veličiny, Xi ~ Po(λi), i = 1, 2. Pak transformovaná náhodná veličina Y = X1 + X2 ~ Po(λ1+ λ2). Důkaz: Podle věty o konvoluci dostáváme: ( ) ( ) ( ) ( ) ( ) ( ) ( ) jinak0,2,1,0,yproe !yx y e !y 1 e !xy e !x yx00xy,0xxyxy 21 1 1121 1 2 1 1 1 1 - y 21 y 0x xy 2 x 1 1 - y 0x 1 xy 2 1 x 1 111 x 1211* == λ+λ =λλ      = = − λλ =≤≤≥−≥=−ππ=π λ+λ = −λ+λ = λ− − λ− ∞ −∞=   K . Vidíme, že Y ~ Po(λ1+ λ2). 4.11. Poznámka: Tvrzení věty 4.10. lze zobecnit i na n stochasticky nezávislých veličin X1, …, Xn, Xi ~ Po(λi), i = 1, …, n. Pak transformovaná náhodná veličina       λ=  == n 1i i n 1i i Po~XY . Znamená to, že Poissonovo rozložení je uzavřené vzhledem k operaci sčítání. 4.12. Věta: Nechť X ~ ( )λPo , přičemž λ je přirozené číslo větší než 9. Pak rozložení náhodné veličiny X lze aproximovat rozložením N(λ, λ). Důkaz: Podle poznámky 4.11. je  λ = = 1i iXX , přičemž stochasticky nezávislé náhodné veličiny X1, …, Xλ se řídí rozložením Po(1), E(Xi) = 1, D(Xi) = 1, i = 1, …, λ. Přitom ( ) ( ) λ = λ = λ==      = 1i i 1i i XEXEXE , ( ) ( ) λ = λ = λ==      = 1i i 1i i XDXDXD . Podle CLV dostáváme, že veličina ( )λλ≈ ,NX . Graf pravděpodobnostní funkce Po(20) 0 5 10 15 20 25 30 35 40 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 Graf hustoty N(20,20) 0 5 10 15 20 25 30 35 40 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 4.13. Věta: Nechť X ~ ( )λPo , přičemž λ je přirozené číslo větší než 9. Pak pro nezáporná celá čísla a, b, a < b platí: ( )       λ λ− Φ−      λ λ− Φ≈≤≤ ab bXaP , kde Φ je distribuční funkce rozložení N(0, 1). Důkaz: ( ) ( ) ( ) ( ) ( )       λ λ− Φ−      λ λ− Φ≈      λ λ− ≤≤ λ λ− =         − ≤≤ − =≤≤ abb U a P XD XEb U XD XEa PbXaP 4.14. Poznámka: Aproximace Poissonova rozložení normálním rozložením se zlepší, když použijeme tzv. opravu na nespojitost: ( )       λ −λ− Φ−      λ +λ− Φ≈≤≤ 2 1 2 1 ab bXaP . 4.15. Příklad: Nechť X ~ ( )12Po . Pomocí aproximace normálním rozložením stanovte ( )20X8P ≤≤ . Řešení: ( ) ( ) ( ) ( ) ( ) 89606,09034,0199286,03,1145,2 3,145,2 12 128 12 1220 20X8P 2 1 2 1 =+−=Φ+−Φ= =−Φ−Φ=      −− Φ−      +− Φ≈≤≤ Pro porovnání provedeme přesný výpočet: ( ) 8989,0)12,7(poisscdf)12,20(poisscdfe !x 12 20X8P 20 8x 12 x =−==≤≤ = − 4.16. Věta: Nechť X1, …, Xn je náhodný výběr z rozložení Po(λ), přičemž nλ > 9. Označme = = n 1i iX n 1 M výběrový průměr. Pak meze 100(1-α)% asymptotického intervalu spolehlivosti pro střední hodnotu λ jsou: 21u n M MD α−−= , 21u n M MH α−+= Důkaz: Podle centrální limitní věty ( ) ( )( )MD,MENM ≈ , kde E(M) = λ, ( ) n MD λ = . Standardizací M dostaneme ( )1,0N n M U ≈ λ λ− = . Konvergence k N(0,1) se neporuší, když λ ve jmenovateli nahradíme M, tedy ( )1,0N n M M U ≈ λ− = . Pak platí:         +<λ<−=             < λ− <−≤α−>λ∀ α−α−α−α− 21212121 u n M Mu n M MPu n M M uP1:0 4.17. Poznámka: Meze 100(1-α)% asymptotického intervalu spolehlivosti pro střední hodnotu λ se zpřesní, když použijeme tzv. opravu na nespojitost: 21u n M n2 1 MD α−−−= , 21u n M n2 1 MH α−++= . 4.18. Příklad: Předpokládáme, že při výrobě určité tkaniny je počet kazů připadajících na 100 m této tkaniny náhodná veličina s rozložením Po(λ). Při kontrole 25 balíků, z nichž každý obsahoval 100 m této tkaniny, bylo zjištěno, že celkový počet kazů je 30. Najděte 95% asymptotický interval spolehlivosti pro střední hodnotu počtu kazů připadajících na jeden balík. Řešení: n = 25, m = 30/25 = 1,2, α = 0,05. 75,096,1 25 2,1 50 1 2,1u n m n2 1 md 21 =−−=−−= α− 65,196,1 25 2,1 50 1 2,1u n m n2 1 mh 21 =++=++= α− S pravděpodobností aspoň 95 % lze očekávat, že střední hodnota počtu kazů připadajících na jeden balík se nachází v mezích od 0,75 do 1,65. 4.19. Věta: Nechť X1, …, Xn je náhodný výběr z rozložení Po(λ). Označme = = n 1i ix n 1 m realizaci výběrového průměru. Pak meze 100(1-α)% empirického intervalu spolehlivosti pro střední hodnotu λ jsou: ( )nm2 n2 1 d 2 2 αχ= , ( )2nm2 n2 1 h 21 2 +χ= α− . Důkaz: Viz HÁTLE JAROSLAV - LIKEŠ JIŘÍ. Základy počtu pravděpodobnosti a matematické statistiky, 2. vyd. Praha: SNTL – Nakladatelství technické literatury, 1974. 463 s. Upozornění: Podle vztahů uvedených ve větě 4.19. počítá MATLAB pomocí funkce poissfit meze 100(1-α)% empirického intervalu spolehlivosti pro střední hodnotu λ. 4.20. Příklad: Pro údaje z příkladu 4.16. najděte 95% empirický interval spolehlivosti pro střední hodnotu počtu kazů připadajících na jeden balík. Řešení: n = 25, m = 30/25 = 1,2, α = 0,05. ( ) ( ) 81,048,40 50 1 60 50 1 nm2 n2 1 d 025,0 2 2 2 ==χ=χ= α ( ) ( ) 71,165,85 50 1 62 50 1 2nm2 n2 1 h 975,0 2 21 2 ==χ=+χ= α− S pravděpodobností aspoň 95 % lze očekávat, že střední hodnota počtu kazů připadajících na jeden balík se nachází v mezích od 0,81 do 1,71. 4.21. Věta: (Souvislost exponenciálního a Poissonovo rozložení) Nechť náhodná veličina X, udává počet událostí za x jednotek času, přičemž za časovou jednotku nastává průměrně λ událostí, se řídí rozložením Po(λx). Pak náhodná veličina Y, která udává dobu mezi dvěma po sobě následujícími událostmi, se řídí rozložením Ex(λ). Důkaz: ( ) ( ) ( )      = λ ==λ λ− jinak0 0,1,2,...kproe !k x kXPxPo~X x k . Pravděpodobnost, že za x jednotek času nenastane žádná událost, je stejná jako pravděpodobnost, že na událost budeme čekat více než x časových jednotek, tedy ( ) ( ) ( )x1e0XPxYP x Φ−====> λ− , kde Φ(x) je distribuční funkce rozložení Ex(λ). 4.22. Příklad: V době oběda přijde do restaurace průměrně 20 hostů za hodinu. Předpokládáme, že počet hostů má Poissonovo rozložení. Vypočtěte pravděpodobnost, že v průběhu 5 minut nepřijde do restaurace nikdo. Úlohu řešte využitím a) Poissonova rozložení, b) exponenciálního rozložení. Řešení: Časová jednotka = 5 min = 1/12 h Ad a) X – počet hostů, kteří přijdou do restaurace za časovou jednotku, X ~ Po(λ), 3 5 12 20 ==λ ( ) 1889,0e0XP 3 5 === − Ad b) Y – doba, která uplyne mezi dvěma příchody hostů, Y ~ Ex(λ), 3 5 12 20 ==λ Nepřijde-li během časové jednotky 5 min nikdo, pak to znamená, že doba mezi dvěma příchody je větší než 1. ( ) 1889,0e1YP 3 5 ==> − 4.23. Vzorce pro meze 100(1-α)% intervalu spolehlivosti pro střední hodnotu rozložení Po(λ) 1. způsob: Využití Pearsonova rozložení chí-kvadrát: ( )nm2 n2 1 d 2 2 αχ= , ( )2nm2 n2 1 h 21 2 +χ= α− 2. způsob: Využití standardizovaného normálního rozložení: 21u n m md α−−= , 21u n m mh α−+= Závislost mezí 95% intervalu spolehlivosti pro střední hodnotu Poissonova rozložení na rozsahu výběru d: chi2 h: chi2 d: N(0,1) h: N(0,1)30 40 50 60 70 80 90 100 110 120 0,0 0,2 0,4 0,6 0,8 1,0 1,2 Závislost šířky 95% intervalu spolehlivosti pro střední hodnotu Poissonova rozložení na rozsahu výběru sirka: chi2 sirka: N(0,1)30 40 50 60 70 80 90 100 110 120 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,55 0,60 0,65 0,70 4.24. Příklad: Počet hostů v restauraci se řídí Poissonovým rozložením, Z ~ Po(λ). Pravděpodobnost, že náhodně vybraný host si objedná nápoj, je p (0 < p < 1) a pravděpodobnost, že neobjedná, je q = 1 – p. Náhodná veličina X udává počet hostů, kteří si objednají nápoj a náhodná veličina Y udává počet hostů, kteří si neobjednají nápoj. a) Najděte marginální rozložení náhodných veličin X a Y. b) Najděte simultánní rozložení náhodného vektoru (X, Y). Řešení: Je zřejmé, že X + Y = Z. Za podmínky, že Z = n, se X řídí rozložením Bi(n, p) a Y se řídí rozložením Bi(n, q). Ad a) Při hledání pravděpodobnostní funkce veličiny X resp. Y použijeme vzorec úplné pravděpodobnosti: ( ) ( ) ( )∈ = Ii ii HAPHPAP Označíme A = {X = k}, Hn ={Z = n}, n = 0, 1, 2, … Pak ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) p k p1 k q k 0j jk kn knk 0n kn knk n kn knk n e !k p ee !k p ee !k p !j q e !k p knj !kn q e !k p kknnqp !kn!k !n !n eqp k n e !n nZkXPnZPkXP λ−−λλ−λλ− ∞ = λ− ∞ = − λ− ∞ = ∞ = −λ− ∞ = −λ− λ = λ = λ = λλ =−== − λλ = =+−== − ⋅ λ =     λ ======    Vidíme tedy, že X ~ Po(λp). Analogicky lze odvodit, že Y ~ Po(λq). Ad b) Při hledání simultánní pravděpodobnostní funkce vektoru (X, Y) opět použijeme vzorec pro úplnou pravděpodobnost, kde položíme A = {X = i ∧ Y = j}, Hn ={Z = n}, n = 0, 1, 2, … Pak ( ) ( ) ( ) ∞ = ==∧====∧= 0n nZjYiXPnZPjYiXP Uvědomíme si, že P(X = i ∧ Y = j/Z = n) = 0, když Z ≠ i + j . Pak ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )jYPiXP e !j q e !i p eeeeqp !j!i !ji e !ji qp i ji e !ji jiZiXPjiZPjiZjYiXPjiZPjYiXP q i p i qpp1pji ji ji ji === = λ ⋅ λ ==== + + λ =      + + λ = =+==+==+==∧=+===∧= λ−λ−λ−λ−−+λ−λ−λ− + λ− + Simultánní pravděpodobnostní funkce je rovna součinu marginálních pravděpodobnostních funkcí, tedy náhodné veličiny X a Y jsou stochasticky nezávislé.