3. Exponenciální rozložení a jeho vlastnosti 3.1. Definice: Spojitá náhodná veličina X má exponenciální rozložení s parametrem λ > 0, jestliže hustota φ(x) má tvar:         jinak0 0xproe x x. Zkráceně píšeme X ~  Ex . Průběh hustoty exponenciálního rozložení pro různé hodnoty parametru λ: 3.2. Poznámka: Náhodná veličina X udává dobu čekání na příchod nějaké události, která se může dostavit každým okamžikem se stejnou šancí bez ohledu na dosud pročekanou dobu. (Jde o tzv. čekání bez paměti.) Přitom 1/λ vyjadřuje střední hodnotu doby čekání. Lze odvodit, že: a) distribuční funkce         jinak0 0xproe1 x xb) funkce přežití           jinak1 0xproe x1x xc) intenzita poruchy (též riziková funkce)               x x e e x x' x d) kvantilová funkce      0,1,1ln 11    e) střední hodnota     1 XE f) rozptyl   2 1 XD   g) medián   2ln x 50,0 Průběhy důležitých funkcí exponenciálního rozložení Distribuční funkce exponenciálního rozložení 1,5 1 0,5 0 1 2 3 4 5 6 x 0,0 0,2 0,4 0,6 0,8 1,0 Funkce přežití exponenciálního rozložení 1,5 1 0,5 0 1 2 3 4 5 6 x 0,0 0,2 0,4 0,6 0,8 1,0 Intenzity poruchy exponenciálního rozložení 1,5 1 0,5 0 1 2 3 4 5 6 x 0,0 0,2 0,4 0,6 0,8 1,0 1,2 1,4 1,6 1,8 2,0 Kvantilová funkce exponenciálního rozložení 1,5 1 0,5 0,0 0,2 0,4 0,6 0,8 1,0 alfa -2 0 2 4 6 8 10 3.3. Poznámka: Exponenciální rozložení Ex(λ) je speciálním případem dvouparametrického exponenciálního rozložením Ex(A, λ), kde parametr A > 0 udává dobu, po kterou událost nemůže nastat. Hustota:           jinak0 Axproe x Ax- . Exponenciální rozložení je speciálním případem Erlangova rozložení Er(k, λ) pro k = 1. Náhodná veličina X s rozložením Er(k, λ) vyjadřuje souhrnnou dobu čekání na k-tý výskyt události, která se může dostavit každým okamžikem se stejnou šancí bez ohledu na dosud pročekanou dobu. Přitom  1 je střední hodnota doby čekání od výskytu předešlé události. Hustota:                  jinak0 0xproe !1k x x x- 1k . (Erlangovo rozložení je speciálním případem gama rozložení, kde první parametr je přirozené číslo.) Grafy hustot Er(3, 1), Er(5, 1), Er(7, 1): Grafy intenzit poruchy Er(3, 1), Er(5, 1), Er(7, 1): Intenzita poruchy Erlangova rozložení je rostoucí funkce, proto je toto rozložení vhodné pro modelování procesů stárnutí. 3.4. Příklad (Praktické využití základních vlastností exponenciálního rozložení) Dlouhodobým pozorováním v určité prodejně bylo zjištěno, že 40 % zákazníků je obslouženo do 3 minut. Lze předpokládat, že doba čekání se řídí exponenciálním rozložením. a) Určete parametr λ exponenciálního rozložení. b) Vypočtěte střední hodnotu doby čekání na obsluhu. c) Jaká je doba čekání, kterou polovina osob nepřekročí? d) Jaké procento zákazníků bude na obsluhu čekat déle než 6 minut? Řešení: Ad a) Je známo, že   34,01  . Přitom       1ln 11 , tedy       1703,0 3 4,01ln1ln 1        Ad b)   s52min5min87,5 1703,0 11 XE    Ad c) Hledáme medián, tedy počítáme s4min4min07,4 1703,0 2ln2ln   Ad d)     36,0ee66XP 61703,06   . Znamená to, že 36 % zákazníků bude čekat déle než 6 minut. 3.5. Věta: Nechť X ~  Ex . Pak platí:    hXPtX/htXP:0h,0t  Vysvětlení: Tato věta vysvětluje, proč se exponenciálnímu rozložení říká rozložení bez paměti. Jestliže náhodná veličina X udává dobu do poruchy nějakého zařízení, pak pravděpodobnost, že zařízení, které pracovalo po dobu aspoň t, bude pracovat bez poruchy aspoň po dobu t + h, je stejná jako pravděpodobnost, že zařízení bude pracovat bez poruchy po dobu aspoň h – jako kdyby „zapomnělo“ již odpracovanou dobu t. Důkaz:                    hXPhΨ e e e tΨ htΨ tXP htXP tXP tXhtXP th/XtXP λh λt htλ              3.6. Příklad: Výrobce žárovek udává, že průměrná doba životnosti jeho žárovek je 10 000 h. V rámci své propagační kampaně chce garantovat dobu t, do níž se spálí nejvýše 3 % žárovek. Stanovte tuto dobu za předpokladu, že životnost žárovky se řídí exponenciálním rozložením. Řešení: X ~  Ex ,   10000 1 10000 1 XE    . Hledáme t tak, aby platilo:     h6,30497,0ln10000te1ttXP03,0 10000 t   3.7. Věta: Nechť X ~  Ex . Pak transformovaná náhodná veličina Y = λX ~  1Ex . (Rozložení  1Ex se nazývá standardizované exponenciální rozložení.) Důkaz:                           jinak0 0yproe1yy XPyXPyYPy y * , tedy Y ~  1Ex . 3.8. Věta: Nechť X ~ Rs(0, 1). Pak transformovaná náhodná veličina Y = -ln X ~  1Ex . Důkaz:                    jinak0 0yproe1 e1eXP1eXPyXlnPyYPy y yyy * 3.9. Poznámka: Vět 3.7. a 3.8. se využívá při generování realizací náhodné veličiny Y ~  Ex na počítači: vygenerujeme n náhodných čísel x1, …, xn ~ Rs(0, 1) a transformujeme je vztahem   n,1,i,x1ln 1 y ii    . Čísla y1, …, yn jsou realizace náhodné veličiny Y ~  Ex . 3.10. Věta: Nechť X1, X2 jsou stochasticky nezávislé náhodné veličiny, Xi ~ Ex(λi), i = 1, 2. Pak transformovaná náhodná veličina Y = min{ X1, X2} ~ Ex(λ1 + λ2). Důkaz:                           jinak0 0yproe-1ee1 yy1 yXPyXP1yXyXPyX,XminPyYPy y-yy 21 212121* 2121 , tedy Y ~ Ex(λ1 + λ2). 3.11. Poznámka: Tvrzení věty 3.10. lze zobecnit i na n stochasticky nezávislých veličin X1, …, Xn, Xi ~ Ex(λi), i = 1, …, n. Pak transformovaná náhodná veličina Y = min{ X1, …, Xn} ~ Ex(λ1 + … + λn). 3.12. Věta: Nechť X1, X2 jsou stochasticky nezávislé náhodné veličiny, Xi ~ Ex(λ), i = 1, 2. Pak transformovaná náhodná veličina Y = X1 + X2 ~ Er(2, λ). Důkaz: Podle věty o konvoluci dostáváme:         jinak00,yproyedxe dxeeyx00xy,0xdxxyxy y2 y 0 1 y2 y 0 1 xyx 11111211* 11         Přitom rozložení Er(2, λ) má hustotu                  jinak0 0xproxee !12 x x x-2x- 12 . 3.13. Poznámka: Tvrzení věty 3.12. lze zobecnit i na n stochasticky nezávislých veličin X1, …, Xn, Xi ~ Ex(λ), i = 1, …, n. Pak transformovaná náhodná veličina    ,nEr~XY n 1i i . 3.14. Příklad: Zákazník prochází třemi nezávislými stanicemi obsluhy, přičemž v každé z nich se doba obsluhy řídí exponenciálním rozložením se střední hodnotou 1 minuta. Jaká je pravděpodobnost, že celková doba obsluhy nepřesáhne 2 minuty? Řešení: Označme Xi dobu obsluhy na i-té stanici, Xi ~ Ex(1), i = 1, 2, 3 a Y = X1 + X2 + X3 celkovou dobu obsluhy. Podle poznámky 3.13. se celková doba obsluhy řídí rozložením Er(3,1), tedy hustota   0yproe 2 y y y 2   . Počítáme:   3233,0e51dye 2 y 2YP 2 2 0 y 2     Pravděpodobnost, že celková doba obsluhy nepřesáhne 2 minuty, je 0,3233. 3.15. Věta: Nechť X1, X2 jsou stochasticky nezávislé náhodné veličiny, Xi ~ Ex(λi), i = 1, 2. Pak   21 1 12 XXP    . Důkaz:     SX,XPXXP 2112  , kde   1221 2 21 xx,0x,0x;Rx,xS  , tedy              21 1 0 x 21 1 0 1 xx 1 0 1 x x 2 x 21 0 1 x 2 x 2 x 1 S 212211 S 212121 2111211 1 2211 1 2211 edxeedxe 1 e dxdxeedxdxxxdxdxx,xSX,XP                                    3.16. Věta: Nechť X ~ Ex(λ). Pak transformovaná náhodná veličina Y = 2λX ~ χ2 (2). Důkaz: Hustota rozložení χ2 (n) je                   jinak0 0xproex 2 2 n 1 x 2 x 1 2 n 2 n . V našem případě n = 2, tedy           jinak0 0xproe 2 1 x 2 x . Počítáme distribuční funkci veličiny Y:       jinak00,yproe1 2 y 2 y XPyX2PyYPy 2 y *                 Derivováním obdržíme hustotu:     jinak00,yproe 2 1 dy yd y 2 y * *     , tedy Y ~ χ2 (2). 3.17. Poznámka: Tvrzení věty 3.16. lze zobecnit i na n stochasticky nezávislých veličin X1, …, Xn, Xi ~ Ex(λ), i = 1, …, n. Pak transformovaná náhodná veličina  n2~X2Y 2 n 1i i   . 3.18. Věta: Nechť X1, …, Xn je náhodný výběr z rozložení Ex(λ). Označme   n 1i iX n 1 M výběrový průměr. Pak meze 100(1-α)% intervalu spolehlivosti pro střední hodnotu  1 jsou:  n2 nM2 D 21 2   ,  n2 nM2 H 2 2   . Důkaz: Podle poznámky 3.17. náhodná veličina Y = 2λnM ~ χ2 (2n). Z definice 100(1-α)% intervalu spolehlivosti dostáváme:                                        n2 nM21 n2 nM2 P n2 1 nM2 1 n2 1 Pn2nM2n2P1:0 2 2 21 2 2 2 21 221 2 2 2 3.19. Příklad: V jisté prodejně potravin bylo na základě náhodného výběru 50 zákazníků zjištěno, že průměrná doba obsluhy u pokladny je 30 s. Předpokládejme, že doba obsluhy je náhodná veličina s exponenciálním rozložením. Najděte 95% empirický interval spolehlivosti pro střední hodnotu doby obsluhy. Řešení: n = 50, m = 30, α = 0,05     16,23 501,129 3000 100 30502 n2 nm2 d 975,0 2 21 2            42,40 222,74 3000 100 30502 n2 nm2 h 025,0 2 2 2        Střední hodnota doby obsluhy se s pravděpodobností aspoň 0,95 nachází v intervalu 23 s až 40 s. 3.20. Poznámka: Pro větší rozsahy náhodných výběrů (n ≥ 30) lze pro střední hodnotu  1 použít asymptotický 100(1-α)% interval spolehlivosti založený na centrální limitní větě. Nechť X1, …, Xn je náhodný výběr z rozložení Ex(λ),   n 1i iX n 1 M je výběrový průměr. Pak střední hodnota     1 ME a rozptyl   2 n 1 MD   . Standardizací výběrového průměru dostaneme veličinu        1,0N nMM MD MEM U 1 1 n 1 1 2            . Konvergence k rozložení N(0,1) se neporuší, když  1 ve jmenovateli nahradíme M, tedy    1,0N M nM U 1     .                          212121 1 21 u n M M 1 u n M MPu M nM uP1:0 , tedy 2121 u n M MH,u n M MD   . 3.21. Příklad: Pro údaje z příkladu 3.19. spočtěte meze 95% intervalu spolehlivosti pro střední hodnotu doby obsluhy podle vzorců uvedených v poznámce 3.20. Řešení: n = 50, m = 30, α = 0,05 68,2196,1 50 30 30u n m md 21   32,3896,1 50 30 30u n m mh 21   Střední hodnota doby obsluhy se s pravděpodobností aspoň 0,95 nachází v intervalu 22 s až 38 s. 3.22. Poznámka: Výhody a nevýhody exponenciálního rozložení v praxi Výhoda: Exponenciálního rozložení má jednoduché vyjádření hustoty a jeho hustota má průběh, který dobře popisuje řadu reálných dějů. Nevýhoda: Exponenciální rozložení závisí pouze na jediném parametru, je tedy málo flexibilní. V některých situacích, např. při modelování výše pojistného plnění, špatně modeluje interval nejnižších hodnot a také interval nejvyšších hodnot, protože hustota příliš rychle klesá k nule. Vzorce pro meze 100(1-α)% intervalu spolehlivosti pro střední hodnotu rozložení Ex(λ) 1. způsob: Využití Pearsonova rozložení chí-kvadrát:  n2 nm2 d 21 2   ,  n2 nm2 h 2 2   2. způsob: Využití standardizovaného normálního rozložení: 2121 u n m mh,u n m md   Závislost mezí 95% intervalu spolehlivosti pro střední hodnotu exponenciálního rozložení na rozsahu výběru d:chi2 h: chi2 d: N(0,1) h: N(0,1)30 40 50 60 70 80 90 100 110 120 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 Závislost šířky 95% intervalu spolehlivosti pro střední hodnotu exponenciálního rozložení na rozsahu výběru sirka: chi2 sirka: N(0,1)30 40 50 60 70 80 90 100 110 120 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50