4. Poissonovo rozložení a jeho vlastnosti 4.1. Definice: Diskrétní náhodná veličina X má Poissonovo rozložení s parametrem λ > 0, jestliže pravděpodobnostní funkce π(x) má tvar: ( )      = λ =π λ jinak0 0,1,2,xproe x!x - x K . Zkráceně píšeme X ~ ( )λPo . Průběh pravděpodobnostní funkce Poissonova rozložení pro různé hodnoty parametru λ: 4.2. Poznámka: Lze odvodit, že náhodná veličina X~ ( )λPo má tyto číselné charakteristiky: a) střední hodnota ( ) λ=XE b) rozptyl ( ) λ=XD c) šikmost ( ) λ =α 1 X3 d) špičatost ( ) λ =α 1 X4 4.3. Poznámka: Náhodná veličina X~ ( )λPo udává počet událostí, které nastanou v jednotkovém časovém intervalu resp. jednotkové oblasti, přičemž tyto události nastávají náhodně, jednotlivě a nezávisle na sobě. Parametr λ > 0 udává střední hodnotu (i rozptyl) počtu událostí. Poissonovým rozložením se řídí např. - počet výzev, které dojdou na TÚ za jednotkový časový interval - počet mikroorganizmů v jednotkové oblasti zorného pole mikroskopu - počet požadavků v systému hromadné obsluhy za jednotkový časový interval - atd. Upozornění: Pokud X udává počet událostí, které nastanou v časovém intervalu délky t a střední hodnota počtu událostí v jednotkovém časovém intervalu je λ, pak X~ ( )tPo λ . 4.4. Věta: Nechť X ~ ( )λPo a Y ~ ( )n,nBi ϑ , přičemž 0lim n n =ϑ ∞→ a λ=ϑ ∞→ n n nlim . Pak pravděpodobnostní funkce náhodné veličiny Y konverguje pro n → ∞ k pravděpodobnostní funkci náhodné veličiny X. Důkaz: ( ) ( ) ( ) ( ) ( ) ( ) λ− − ∞→∞→∞→ − ∞→ − ∞→ − ∞→ − ∞→ λ = =      λ −      λ −            − −      − λ =      λ − +−−⋅λ = =      λ −      λ − =ϑ−ϑ − =ϑ−ϑ      e !y n 1lim n 1lim n 1y 1 n 1 11lim !yn 1 n 1yn1nn lim !y n 1 n!yn!y !n lim1 !yn!y !n lim1 y n lim y y n n nn yyn nn y yny n yn n y n n yn n y n n K K Upozornění: Binomické rozložení můžeme dobře aproximovat Poissonovým rozložením, když pravděpodobnost výskytu jevu v jednom pokusu je velmi malá ( 1,0≤ϑ ) a zároveň počet pokusů je dostatečně velký ( 30n ≥ ). 4.5. Příklad: Předpokládejme, že při pěstování rostlin hrachu je pravděpodobnost uhynutí rostliny 0,002. Jaká je pravděpodobnost, že při pěstování 1000 rostlin a) neuhyne žádná rostlina, b) uhynou nejvýše 4 rostliny? Řešení: Označme Y náhodnou veličinu, která udává počet uhynulých rostlin hrachu. Z podmínek úlohy plyne, že Y ~ ( )002,0;1000Bi . Přesný výpočet: a) ( ) 13506452,0)002.0,1000,0(binopdf998,0002,0 0 1000 0YP 010000 ==      == − b) ( ) 94752761,0)002.0,1000,4(binocdf998,0002,0 y 1000 4YP 4 0y y1000y ==      =≤ ∑= − Aproximace Poissonovým rozložením: podmínky 30n ≥ a 1,0≤ϑ jsou splněny. Přitom 2002,01000n =⋅=ϑ⋅=λ . a) ( ) 13533528,0)2,0(poisspdfe !0 2 0YP 2 0 ==≈= − b) ( ) 94734699,0)2,4(poisscdfe !y 2 4YP 4 0y 2 y ==≈≤ ∑= − 4.6. Věta: Nechť X ~ ( )λPo . Pak pro modus xˆ platí: λ≤≤−λ xˆ1 . Je-li λ přirozené číslo, pak existují dvě modální hodnoty. Není-li λ přirozené číslo, je Poissonovo rozložení unimodální. Důkaz: Protože modus je nejpravděpodobnější hodnota, musí současně vyhovovat dvěma nerovnostem: ( ) ( ) ( ) ( )1xˆxˆ1xˆxˆ +π≥π∧−π≥π , tj. ( ) ( ) ( ) ( ) 1 xˆ 1xˆ 1 xˆ 1xˆ ≤ π +π ∧≤ π −π . Dosadíme za pravděpodobnostní funkci a postupně upravujeme: ( ) ( ) 1 e !xˆ e !1xˆ 1 e !xˆ e !1xˆ xˆ 1xˆ xˆ 1xˆ ≤ λ + λ ∧≤ λ − λ λ− λ− + λ− λ− − 1 1xˆ 1 xˆ ≤ + λ ∧≤ λ 1xˆxˆ −λ≥∧λ≤⇒ , tj. λ≤≤−λ xˆ1 . 4.7. Příklad: K holiči chodí průměrně 6 zákazníků za 1 h. Určete nejpravděpodobnější počet zákazníků u holiče během půl hodiny a určete pravděpodobnost tohoto počtu. Řešení: Náhodná veličina X udává počet zákazníků u holiče během 1/2 h, X ~ ( )3Po . Protože λ je přirozené číslo, existují dvě modální hodnoty, a to 2 a 3. Jejich pravděpodobnosti: ( ) 224,0e5,4e !2 3 2XP 33 2 ==== −− ( ) 224,0e5,4e !3 3 3XP 33 3 ==== −− 4.8. Věta: Nechť X1, X2 jsou stochasticky nezávislé náhodné veličiny, Xi ~ Po(λi), i = 1, 2. Pak transformovaná náhodná veličina Y = X1 + X2 ~ Po(λ1+ λ2). Důkaz: Podle věty o konvoluci dostáváme: ( ) ( ) ( ) ( ) ( ) ( ) ( ) jinak0,2,1,0,yproe !yx y e !y 1 e !xy e !x yx00xy,0xxyxy 21 1 1121 1 2 1 1 1 1 - y 21 y 0x xy 2 x 1 1 - y 0x 1 xy 2 1 x 1 111 x 1211* == λ+λ =λλ      = = − λλ =<<⇒>−>=−ππ=π λ+λ = −λ+λ = λ− − λ− ∞ −∞= ∑ ∑∑ K . Vidíme, že Y ~ Po(λ1+ λ2). 4.9. Poznámka: Tvrzení věty 4.8. lze zobecnit i na n stochasticky nezávislých veličin X1, …, Xn, Xi ~ Po(λi), i = 1, …, n. Pak transformovaná náhodná veličina       λ= ∑∑ == n 1i i n 1i i Po~XY . Znamená to, že Poissonovo rozložení je uzavřené vzhledem k operaci sčítání. 4.10. Věta: Nechť X ~ ( )λPo , přičemž λ je přirozené číslo větší než 9. Pak rozložení náhodné veličiny X lze aproximovat rozložením N(λ, λ). Důkaz: Podle poznámky 4.9. je ∑ λ = = 1i iXX , přičemž stochasticky nezávislé náhodné veličiny X1, …, Xλ se řídí rozložením Po(1), E(Xi) = 1, D(Xi) = 1, i = 1, …, λ. Podle CLV dostáváme, že standardizovaná veličina ( ) ( ) ( )1,0N X XD XEX U 1i i 1i i 1i i ≈ λ λ− = − = ∑ ∑∑ λ = λ = λ = , tedy ( )λλ≈λ+λ= ,NUX . Graf pravděpodobnostní funkce Po(20) 0 5 10 15 20 25 30 35 40 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 Graf hustoty N(20,20) 0 5 10 15 20 25 30 35 40 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 4.11. Věta: Nechť X ~ ( )λPo , přičemž λ je přirozené číslo větší než 9. Pak pro nezáporná celá čísla a, b, a < b platí: ( )       λ λ− Φ−      λ λ− Φ≈≤≤ ab bXaP , kde Φ je distribuční funkce rozložení N(0, 1). Důkaz: ( ) ( ) ( ) ( ) ( )       λ λ− Φ−      λ λ− Φ≈      λ λ− ≤≤ λ λ− =         − ≤≤ − =≤≤ abb U a P XD XEb U XD XEa PbXaP 4.12. Poznámka: Aproximace Poissonova rozložení normálním rozložením se zlepší, když použijeme tzv. opravu na nespojitost: ( )       λ −λ− Φ−      λ +λ− Φ≈≤≤ 2 1 2 1 ab bXaP . 4.13. Příklad: Nechť X ~ ( )12Po . Pomocí aproximace normálním rozložením stanovte ( )20X8P ≤≤ . Řešení: ( ) ( ) ( ) ( ) ( ) 89606,09034,0199286,03,1145,2 3,145,2 12 128 12 1220 20X8P 2 1 2 1 =+−=Φ+−Φ= =−Φ−Φ=      −− Φ−      +− Φ≈≤≤ Pro porovnání provedeme přesný výpočet: ( ) 8989,0)12,7(poisscdf)12,20(poisscdfe !x 12 20X8P 20 8x 12 x =−==≤≤ ∑= − 4.14. Věta: Nechť X1, …, Xn je náhodný výběr z rozložení Po(λ), přičemž nλ > 9. Označme ∑= = n 1i iX n 1 M výběrový průměr. Pak meze 100(1-α)% asymptotického intervalu spolehlivosti pro střední hodnotu λ jsou: 21u n M MD α−−= , 21u n M MH α−+= Důkaz: Podle centrální limitní věty ( ) ( )( )MD,MENM ≈ , kde E(M) = λ, ( ) n MD λ = . Standardizací M dostaneme ( )1,0N n M U ≈ λ λ− = . Konvergence k N(0,1) se neporuší, když λ ve jmenovateli nahradíme M, tedy ( )1,0N n M M U ≈ λ− = . Pak platí:         +<λ<−=             < λ− <−≤α−>λ∀ α−α−α−α− 21212121 u n M Mu n M MPu n M M uP1:0 4.15. Poznámka: Meze 100(1-α)% asymptotického intervalu spolehlivosti pro střední hodnotu λ se zpřesní, když použijeme tzv. opravu na nespojitost: 21u n M n2 1 MD α−−−= , 21u n M n2 1 MH α−++= . 4.16. Příklad: Předpokládáme, že při výrobě určité tkaniny je počet kazů připadajících na 100 m této tkaniny náhodná veličina s rozložením Po(λ). Při kontrole 25 balíků, z nichž každý obsahoval 100 m této tkaniny, bylo zjištěno, že celkový počet kazů je 30. Najděte 95% asymptotický interval spolehlivosti pro střední hodnotu počtu kazů připadajících na jeden balík. Řešení: n = 25, m = 30/25 = 1,2, α = 0,05. 75,096,1 25 2,1 50 1 2,1u n m n2 1 md 21 =−−=−−= α− 65,196,1 25 2,1 50 1 2,1u n m n2 1 mh 21 =++=++= α− S pravděpodobností aspoň 95 % lze očekávat, že střední hodnota počtu kazů připadajících na jeden balík se nachází v mezích od 0,75 do 1,65. 4.17. Věta: Nechť X1, …, Xn je náhodný výběr z rozložení Po(λ). Označme ∑= = n 1i ix n 1 m realizaci výběrového průměru. Pak meze 100(1-α)% empirického intervalu spolehlivosti pro střední hodnotu λ jsou: ( )nm2 n2 1 d 2 2 αχ= , ( )2nm2 n2 1 h 21 2 +χ= α− . Důkaz: Viz HÁTLE JAROSLAV - LIKEŠ JIŘÍ. Základy počtu pravděpodobnosti a matematické statistiky, 2. vyd. Praha: SNTL – Nakladatelství technické literatury, 1974. 463 s. Upozornění: Podle vztahů uvedených ve větě 4.17. počítá MATLAB pomocí funkce poissfit meze 100(1-α)% empirického intervalu spolehlivosti pro střední hodnotu λ. 4.18. Příklad: Pro údaje z příkladu 4.16. najděte 95% empirický interval spolehlivosti pro střední hodnotu počtu kazů připadajících na jeden balík. Řešení: n = 25, m = 30/25 = 1,2, α = 0,05. ( ) ( ) 81,048,40 50 1 60 50 1 nm2 n2 1 d 025,0 2 2 2 ==χ=χ= α ( ) ( ) 71,165,85 50 1 62 50 1 2nm2 n2 1 h 975,0 2 21 2 ==χ=+χ= α− S pravděpodobností aspoň 95 % lze očekávat, že střední hodnota počtu kazů připadajících na jeden balík se nachází v mezích od 0,81 do 1,71. 4.19. Poznámka: Exponenciální a Poissonovo rozložení mají úzkou souvislost. Jestliže náhodná veličina X, která udává počet událostí za časovou jednotku, se řídí rozložením Po(λ), pak náhodná veličina Y, která udává dobu mezi dvěma po sobě následujícími událostmi, se řídí rozložením Ex(λ). Vzorce pro meze 100(1-α)% intervalu spolehlivosti pro střední hodnotu rozložení Po(λ) 1. způsob: Využití Pearsonova rozložení chí-kvadrát: ( )nm2 n2 1 d 2 2 αχ= , ( )2nm2 n2 1 h 21 2 +χ= α− 2. způsob: Využití standardizovaného normálního rozložení: 21u n m md α−−= , 21u n m mh α−+= Závislost mezí 95% intervalu spolehlivosti pro střední hodnotu Poissonova rozložení na rozsahu výběru d: chi2 h: chi2 d: N(0,1) h: N(0,1)30 40 50 60 70 80 90 100 110 120 0,0 0,2 0,4 0,6 0,8 1,0 1,2 Závislost šířky 95% intervalu spolehlivosti pro střední hodnotu Poissonova rozložení na rozsahu výběru sirka: chi2 sirka: N(0,1)30 40 50 60 70 80 90 100 110 120 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,55 0,60 0,65 0,70