3. Exponenciální rozložení a jeho vlastnosti 3.1. Definice: Spojitá náhodná veličina X má exponenciální rozložení s parametrem λ > 0, jestliže hustota φ(x) má tvar: ( )    >λ =ϕ λ jinak0 0xproe x x. Zkráceně píšeme X ~ ( )λEx . Průběh hustoty exponenciálního rozložení pro různé hodnoty parametru λ: 3.2. Poznámka: Náhodná veličina X udává dobu čekání na příchod nějaké události, která se může dostavit každým okamžikem se stejnou šancí bez ohledu na dosud pročekanou dobu. (Jde o tzv. čekání bez paměti.) Přitom 1/λ vyjadřuje střední hodnotu doby čekání. Lze odvodit, že: a) distribuční funkce ( )    >− =Φ λ jinak0 0xproe1 x xb) funkce přežití ( ) ( )    > =Φ−=Ψ λ jinak1 0xproe x1x xc) intenzita poruchy (též riziková funkce) ( ) ( ) ( ) λ= λ− −= Ψ Ψ −=λ λ− λ− x x e e x x' x d) kvantilová funkce ( ) ( ) ( )0,1,1ln 11 ∈αα− λ −=αΦ− e) střední hodnota ( ) λ = 1 XE f) rozptyl ( ) 2 1 XD λ = g) medián λ = 2ln x 50,0 Průběhy důležitých funkcí exponenciálního rozložení Distribuční funkce exponenciálního rozložení 1,5 1 0,5 0 1 2 3 4 5 6 x 0,0 0,2 0,4 0,6 0,8 1,0 Funkce přežití exponenciálního rozložení 1,5 1 0,5 0 1 2 3 4 5 6 x 0,0 0,2 0,4 0,6 0,8 1,0 Intenzity poruchy exponenciálního rozložení 1,5 1 0,5 0 1 2 3 4 5 6 x 0,0 0,2 0,4 0,6 0,8 1,0 1,2 1,4 1,6 1,8 2,0 Kvantilová funkce exponenciálního rozložení 1,5 1 0,5 0,0 0,2 0,4 0,6 0,8 1,0 alfa -2 0 2 4 6 8 10 3.3. Poznámka: Exponenciální rozložení Ex(λ) je speciálním případem dvouparametrického exponenciálního rozložením Ex(A, λ), kde parametr A > 0 udává dobu, po kterou událost nemůže nastat. Hustota: ( ) ( )    >λ =ϕ −λ jinak0 Axproe x Ax- . Exponenciální rozložení je speciálním případem Erlangova rozložení Er(k, λ) pro k = 1. Náhodná veličina X s rozložením Er(k, λ) vyjadřuje souhrnnou dobu čekání na k-tý výskyt události, která se může dostavit každým okamžikem se stejnou šancí bez ohledu na dosud pročekanou dobu. Přitom λ 1 je střední hodnota doby čekání od výskytu předešlé události. Hustota: ( ) ( ) ( )      >λ − λ =ϕ λ − jinak0 0xproe !1k x x x- 1k . (Erlangovo rozložení je speciálním případem gama rozložení, kde první parametr je přirozené číslo.) Grafy hustot Er(3, 1), Er(5, 1), Er(7, 1): Grafy intenzit poruchy Er(3, 1), Er(5, 1), Er(7, 1): Intenzita poruchy Erlangova rozložení je rostoucí funkce, proto je toto rozložení vhodné pro modelování procesů stárnutí. 3.4. Příklad (Praktické využití základních vlastností exponenciálního rozložení) Dlouhodobým pozorováním v určité prodejně bylo zjištěno, že 40 % zákazníků je obslouženo do 3 minut. Lze předpokládat, že doba čekání se řídí exponenciálním rozložením. a) Určete parametr λ exponenciálního rozložení. b) Vypočtěte střední hodnotu doby čekání na obsluhu. c) Jaká je doba čekání, kterou polovina osob nepřekročí? d) Jaké procento zákazníků bude na obsluhu čekat déle než 6 minut? Řešení: Ad a) Je známo, že ( ) 34,01 =Φ− . Přitom ( ) ( )α− λ −=αΦ− 1ln 11 , tedy ( ) ( ) ( ) 1703,0 3 4,01ln1ln 1 = − −= αΦ α− −=λ − Ad b) ( ) s52min5min87,5 1703,0 11 XE === λ = Ad c) Hledáme medián, tedy počítáme s4min4min07,4 1703,0 2ln2ln === λ Ad d) ( ) ( ) 36,0ee66XP 61703,06 ===Ψ=> ⋅−⋅λ− . Znamená to, že 36 % zákazníků bude čekat déle než 6 minut. 3.5. Věta: Nechť X ~ ( )λEx . Pak platí: ( ) ( )hXPtX/htXP:0h,0t >=>+>>∀>∀ Vysvětlení: Tato věta vysvětluje, proč se exponenciálnímu rozložení říká rozložení bez paměti. Jestliže náhodná veličina X udává dobu do poruchy nějakého zařízení, pak pravděpodobnost, že zařízení, které pracovalo po dobu aspoň t, bude pracovat bez poruchy aspoň po dobu t + h, je stejná jako pravděpodobnost, že zařízení bude pracovat bez poruchy po dobu aspoň h – jako kdyby „zapomnělo“ již odpracovanou dobu t. Důkaz: ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )hXPt e e e t ht tXP htXP tXP tXhtXP tX/htXP h t ht >=Ψ= === Ψ +Ψ = > +> = > >∧+> =>+> λ− λ− +λ− 3.6. Příklad: Výrobce žárovek udává, že průměrná doba životnosti jeho žárovek je 10 000 h. V rámci své propagační kampaně chce garantovat dobu t, do níž s spálí nejvýše 3 % žárovek. Stanovte tuto dobu za předpokladu, že životnost žárovky se řídí exponenciálním rozložením. Řešení: X ~ ( )λEx , ( ) 10000 1 10000 1 XE =λ⇒= λ = . Hledáme t tak, aby platilo: ( ) ( ) h6,30497,0ln10000te1ttXP03,0 10000 t =⋅−=⇒−=Φ=≤= − 3.7. Věta: Nechť X ~ ( )λEx . Pak transformovaná náhodná veličina Y = λX ~ ( )1Ex . (Rozložení ( )1Ex se nazývá standardizované exponenciální rozložení.) Důkaz: ( ) ( ) ( )    >− =      λ Φ=      λ ≤=≤λ=≤=Φ − jinak0 0yproe1yy XPyXPyYPy y * , tedy Y ~ ( )1Ex . 3.8. Věta: Nechť X ~ Rs(0, 1). Pak transformovaná náhodná veličina Y = -ln X ~ ( )1Ex . Důkaz: ( ) ( ) ( ) ( ) ( ) ( )    >− =Φ−=−≤−=−≥=≤−=≤=Φ − −−− jinak0 0yproe1 e1eXP1eXPyXlnPyYPy y yyy * 3.9. Poznámka: Vět 3.7. a 3.8. se využívá při generování realizací náhodné veličiny Y ~ ( )λEx na počítači: vygenerujeme n náhodných čísel x1, …, xn ~ Rs(0, 1) a transformujeme je vztahem ( ) n,1,i,x1ln 1 y ii K=− λ −= . Čísla y1, …, yn jsou realizace náhodné veličiny Y ~ ( )λEx . 3.10. Věta: Nechť X1, X2 jsou stochasticky nezávislé náhodné veličiny, Xi ~ Ex(λi), i = 1, 2. Pak transformovaná náhodná veličina Y = min{ X1, X2} ~ Ex(λ1 + λ2). Důkaz: ( ) ( ) { }( ) ( ) ( ) ( ) ( ) ( ) ( )    >=− =ΨΨ−= =>>−=≤∨≤=≤=≤=Φ λ+λλ−λ− jinak0 0yproe-1ee1 yy1 yXPyXP1yXyXPyX,XminPyYPy y-yy 21 212121* 2121 , tedy Y ~ Ex(λ1 + λ2). 3.11. Poznámka: Tvrzení věty 3.10. lze zobecnit i na n stochasticky nezávislých veličin X1, …, Xn, Xi ~ Ex(λi), i = 1, …, n. Pak transformovaná náhodná veličina Y = min{ X1, …, Xn} ~ Ex(λ1 + … + λn). 3.12. Věta: Nechť X1, X2 jsou stochasticky nezávislé náhodné veličiny, Xi ~ Ex(λ), i = 1, 2. Pak transformovaná náhodná veličina Y = X1 + X2 ~ Er(2, λ). Důkaz: Podle věty o konvoluci dostáváme: ( ) ( ) ( ) ( ) jinak00,yproyedxe dxeeyx00xy,0xdxxyxy y2 y 0 1 y2 y 0 1 xyx 11111211* 11 =>λ=λ= =λλ=<<⇒>−>=−ϕϕ=ϕ λ−λ− −λ−λ− ∞ ∞− ∫ ∫∫ Přitom rozložení Er(2, λ) má hustotu ( ) ( ) ( )      >λ=λ − λ =ϕ λλ − jinak0 0xproxee !12 x x x-2x- 12 . 3.13. Poznámka: Tvrzení věty 3.12. lze zobecnit i na n stochasticky nezávislých veličin X1, …, Xn, Xi ~ Ex(λ), i = 1, …, n. Pak transformovaná náhodná veličina ( )λ= ∑= ,nEr~XY n 1i i . 3.14. Příklad: Zákazník prochází třemi nezávislými stanicemi obsluhy, přičemž v každé z nich se doba obsluhy řídí exponenciálním rozložením se střední hodnotou 1 minuta. Jaká je pravděpodobnost, že celková doba obsluhy nepřesáhne 2 minuty? Řešení: Označme Xi dobu obsluhy na i-té stanici, Xi ~ Ex(1), i = 1, 2, 3 a Y = X1 + X2 + X3 celkovou dobu obsluhy. Podle poznámky 3.13. se celková doba obsluhy řídí rozložením Er(3,1), tedy hustota ( ) 0yproe 2 y y y 2 >=ϕ − . Počítáme: ( ) 3233,0e51dye 2 y 2YP 2 2 0 y 2 =−===≤ −− ∫ K Pravděpodobnost, že celková doba obsluhy nepřesáhne 2 minuty, je 0,3233. 3.15. Věta: Nechť X1, X2 jsou stochasticky nezávislé náhodné veličiny, Xi ~ Ex(λ), i = 1, 2. Pak ( ) 21 1 12 XXP λ+λ λ => . Důkaz: ( ) ( )( )SX,XPXXP 2112 ∈=> , kde ( ){ }1221 2 21 xx,0x,0x;Rx,xS >>>∈= , tedy ( )( ) ( ) ( ) ( ) ( ) [ ] 21 1 0 x 21 1 0 1 xx 1 0 1 x x 2 x 21 0 1 x 2 x 2 x 1 S 212211 S 212121 2111211 1 2211 1 2211 edxeedxe 1 e dxdxeedxdxxxdxdxx,xSX,XP λ+λ λ = λ+λ λ −=λ=      λ −λλ= =         λλ=ϕϕ=ϕ=∈ ∞λ+λ− ∞ λ−λ− ∞ ∞ λ−λ− ∞ ∞ λ−λ− ∫∫ ∫ ∫∫∫∫∫ 3.16. Věta: Nechť X ~ Ex(λ). Pak transformovaná náhodná veličina Y = 2λX ~ χ2 (2). Důkaz: Hustota rozložení χ2 (n) je ( )        >       Γ=ϕ −− jinak0 0xproex 2 2 n 1 x 2 x 1 2 n 2 n . V našem případě n = 2, tedy ( )      > =ϕ − jinak0 0xproe 2 1 x 2 x . Počítáme distribuční funkci veličiny Y: ( ) ( ) ( ) jinak00,yproe1 2 y 2 y XPyX2PyYPy 2 y * =>−=      λ Φ=      λ ≤=≤λ=≤=Φ − Derivováním obdržíme hustotu: ( ) ( ) jinak00,yproe 2 1 dy yd y 2 y * * =>= Φ =ϕ − , tedy Y ~ χ2 (2). 3.17. Poznámka: Tvrzení věty 3.16. lze zobecnit i na n stochasticky nezávislých veličin X1, …, Xn, Xi ~ Ex(λ), i = 1, …, n. Pak transformovaná náhodná veličina ( )n2~X2Y 2 n 1i i χλ= ∑= . 3.18. Věta: Nechť X1, …, Xn je náhodný výběr z rozložení Ex(λ). Označme ∑= = n 1i iX n 1 M výběrový průměr. Pak meze 100(1-α)% intervalu spolehlivosti pro střední hodnotu λ 1 jsou: ( )n2 nM2 D 21 2 α−χ = , ( )n2 nM2 H 2 2 αχ = . Důkaz: Podle poznámky 3.17. náhodná veličina Y = 2λnM ~ χ2 (2n). Z definice 100(1-α)% intervalu spolehlivosti dostáváme: ( ) ( )( ) ( ) ( ) ( ) ( )      χ < λ < χ = =      χ < λ < χ =χ<λ<χ=α−>λ∀ αα− αα− α−α n2 nM21 n2 nM2 P n2 1 nM2 1 n2 1 Pn2nM2n2P1:0 2 2 21 2 2 2 21 221 2 2 2 3.19. Příklad: V jisté prodejně potravin bylo na základě náhodného výběru 50 zákazníků zjištěno, že průměrná doba obsluhy u pokladny je 30 s. Předpokládejme, že doba obsluhy je náhodná veličina s exponenciálním rozložením. Najděte 95% empirický interval spolehlivosti pro střední hodnotu doby obsluhy. Řešení: n = 50, m = 30, α = 0,05 ( ) ( ) 16,23 501,129 3000 100 30502 n2 nm2 d 975,0 2 21 2 == χ ⋅⋅ = χ = α− ( ) ( ) 42,40 222,74 3000 100 30502 n2 nm2 h 025,0 2 2 2 == χ ⋅⋅ = χ = α Střední hodnota doby obsluhy se s pravděpodobností aspoň 0,95 nachází v intervalu 23 s až 40 s. 3.20. Poznámka: Pro větší rozsahy náhodných výběrů (n ≥ 30) lze pro střední hodnotu λ 1 použít asymptotický 100(1-α)% interval spolehlivosti založený na centrální limitní větě. Nechť X1, …, Xn je náhodný výběr z rozložení Ex(λ), ∑= = n 1i iX n 1 M je výběrový průměr. Pak střední hodnota ( ) λ = 1 ME a rozptyl ( ) 2 n 1 MD λ = . Standardizací výběrového průměru dostaneme veličinu ( ) ( ) ( ) ( )1,0N nMM MD MEM U 1 1 n 1 1 2 ≈ − = − = − = λ λ λ λ . Konvergence k rozložení N(0,1) se neporuší, když λ 1 ve jmenovateli nahradíme M, tedy ( ) ( )1,0N M nM U 1 ≈ − = λ . ( )       +< λ <−=         < − <−≤α−>λ∀ α−α−α− λ α− 212121 1 21 u n M M 1 u n M MPu M nM uP1:0 , tedy 2121 u n M MH,u n M MD α−α− +=−= . 3.21. Příklad: Pro údaje z příkladu 3.19. spočtěte meze 95% intervalu spolehlivosti pro střední hodnotu doby obsluhy podle vzorů uvedených v poznámce 3.20. Řešení: n = 50, m = 30, α = 0,05 68,2196,1 50 30 30u n m md 21 =−=−= α− 32,3896,1 50 30 30u n m mh 21 =+=+= α− Střední hodnota doby obsluhy se s pravděpodobností aspoň 0,95 nachází v intervalu 22 s až 38 s. 3.22. Poznámka: Výhody a nevýhody exponenciálního rozložení v praxi Výhoda: Exponenciálního rozložení má jednoduché vyjádření hustoty a jeho hustota má průběh, který dobře popisuje řadu reálných dějů. Nevýhoda: Exponenciální rozložení závisí pouze na jediném parametru, je tedy málo flexibilní. V některých situacích, např. při modelování výše pojistného plnění, špatně modeluje interval nejnižších hodnot a také interval nejvyšších hodnot, protože hustota příliš rychle klesá k nule.