Využití MATLABu při práci s exponenciálním rozložením Základní poznatky o exponenciálním rozložení Ex(λ) Náhodná veličina X udává dobu čekání na příchod nějaké události, která se může dostavit každým okamžikem se stejnou šancí bez ohledu na dosud pročekanou dobu. Přitom 1/λ vyjadřuje střední hodnotu doby čekání. Hustota: ( )    ≤ >λ =ϕ λ− 0xpro0 0xproe x x , distribuční funkce: ( )    ≤ >− =Φ λ− 0xpro0 0xproe1 x x , kvantilová funkce: ( ) ( )α− λ −=αΦ− 1ln 11 , kde 0 < α < 1. Střední hodnota: ( ) λ = 1 XE , rozptyl: ( ) 2 1 XD λ = . Interval spolehlivosti pro střední hodnotu: Nechť X1, …, Xn je náhodný výběr z rozložení Ex(λ) a nechť m je realizace výběrového průměru. Pak meze 100(1-α)% přibližného empirického intervalu spolehlivosti pro ( ) λ = 1 XE jsou: ( ) ( )n2 nm2 h, n2 nm2 d 2/ 2 2/1 2 αα− χ = χ = Pozor, funkce v MATLABu pro práci s exponenciálním rozložením vyžadují zadávat převrácenou hodnotu parametru λ! a) Kreslení grafu hustoty a distribuční funkce rozložení Ex(1/2) x=[0:0.01:10]’; f=exppdf(x,2); plot(x,f) df=expcdf(x,2); figure plot(x,df) b) Kreslení grafu kvantilové funkce rozložení Ex(1/2) alfa=[0.01:0.01:0.99]’; kf=expinv(alfa,2); plot(alfa,kv) c) Generování 100 realizací náhodné veličiny s rozložením Ex(1/2) a kreslení histogramu s 10 třídicími intervaly r=exprnd(2,100,1); hist(r) d) Odhad střední hodnoty a meze intervalu spolehlivosti pro střední hodnotu na základě proměnné r Hodnoty uložené v proměnné r považujeme za realizace náhodného výběru rozsahu 100 z rozložení Ex(1/2) [m,meze]=expfit(r) e) Výpočet střední hodnoty a rozptylu rozložení Ex(1/2) [m,v]=expstat(2) Příklady na využití exponenciálního rozložení Příklad 1.: Doba do ukončení opravy v opravně obuvi je náhodná veličina, která se řídí exponenciálním rozložením se střední hodnotou 3 dny. Jaká je pravděpodobnost, že oprava bude ukončena do dvou dnů? Řešení: X ~ Ex(1/3), ( ) 4866,0e1edxe 3 1 2XP 3 22 0 3 x2 0 3 x =−=      −==≤ −−− ∫ V MATLABu: p = expcdf(2,3) Příklad 2.: Životnost žárovky má exponenciální rozložení se střední hodnotou 600 h. Jaká je pravděpodobnost, že žárovka bude svítit dalších aspoň 200 h, jestliže již svítila aspoň 800 h? Řešení: X ~ Ex(1/600), ( ) ( ) ( ) ( ) 7165,0eee1dxe 600 1 1 200XP200XP1200XP800X/200800XP 3 1 600 200200 0 600 x200 0 600 x ===      −−=−= =+≤−=≥=≥+≥ −−−− ∫ V MATLABu: p = 1- expcdf(200,600) Příklad 3.: Náhodné doby života dvou součástek jsou stochasticky nezávislé náhodné veličiny, přičemž Xi ~ Ex(λi), i = 1, 2. Střední hodnota doby života první součástky je 2 roky, druhé součástky 3 roky. Jaká je pravděpodobnost, že druhá součástka přežije první? Řešení: Podle věty 3.14 dostáváme: ( ) 6,0XXP 6 5 2 1 3 1 2 1 2 1 21 1 12 == + = λ+λ λ => Příklad 4.: Doba (v hodinách), která uplyne mezi dvěma naléhavými příjmy v jisté nemocnici, se řídí exponenciálním rozložením se střední hodnotou 2 h. Jaká je pravděpodobnost, že uplyne více než 5 h bez naléhavého příjmu? Řešení: X ~ Ex(1/2), ( ) ( ) 082,0ee1dxe 2 1 15XP15XP 5,2 5 0 2 x5 0 2 x ==      −−=−=≤−=> − −− ∫ V MATLABu: p = 1- expcdf(5,2) Příklad 5.: Zkoumá se funkce dvou nezávisle na sobě pracujících přístrojů. Doba bezporuchové funkce i-tého přístroje je náhodná veličina Xi ~ Ex(λi), i = 1, 2. Jaká je pravděpodobnost, že za dobu t0 > 0 a) ani jeden přístroj neselže, b) selže aspoň jeden přístroj? Řešení: ad a) ( ) ( ) ( ) ( )[ ] ( )[ ] ( )[ ] ( )[ ] ( )2100201 ttt 0201 020102010201 eeet1t1 tXP1tXP1tXPtXPtXtXP λ+λ−λ−λ− ==Φ−Φ−= =≤−≤−=>>=>∧> ad b) ( ) ( )210t 0201 e1tXtXP λ+λ− −=≤∨≤ Příklad 6.: Najděte 5. percentil náhodné veličiny X ~ Ex(0,1) Řešení: ( )( ) ( )( ) ( ) 5129,095,0ln10 XKXK1,0exp1XK05,0 05,005,005,0 =−= =⇒−−=Φ= V MATLABu: K = expinv(0.05,10) Využití exponenciálního rozložení při analýze příjmů Úvod do problému: Je známo, že příjmy obyvatelstva ve společnosti jsou rozděleny nerovnoměrně. Jako první zkoumal toto rozdělení italský inženýr Vilfredo Pareto na konci 19. století. Zjistil, že příjmy lze modelovat mocninnou funkcí. V dalších letech se ukázalo, že tento tzv. Paretův zákon platí jen pro 5 % nejbohatších lidí. Příjmy ostatních 95 % obyvatel lze modelovat pomocí exponenciálního rozložení. (Proč to tak je? To je vysvětleno v článku F. Slaniny, Vesmír č. 9, rok 2001) Nechť náhodná veličina X udává měsíční příjem náhodně vybraného zaměstnance. Předpokládejme, že X ~ Ex(λ). Podle údajů Českého statistického úřadu dosáhla průměrná hrubá mzda v ČR ve 4. čtvrtletí roku 2010 hodnoty 25 752 Kč. Úkol 1.: Zjistěte parametr λ pro náhodnou veličinu X. Řešení: ( ) 00003883,0 25752 1 25752 1 dxexXE 0 x ==λ⇒= λ ==λ= ∫ ∞ λ− K Úkol 2.: Odvoďte obecný vzorec pro výpočet α-kvantitu náhodné veličiny X a pak vyjádřete medián náhodné veličiny X. Co lze říci o vztahu střední hodnoty a mediánu? Řešení: ( )( ) ( ) ( ) ( )α− λ −=⇒−=Φ=α α λ− α α 1ln 1 XKe1XK XK Výpočet mediánu: ( ) 178502ln25752 2ln 2 1 ln 1 XK 50,0 =⋅= λ = λ −= Znamená to, že aspoň polovina osob má průměrnou hrubou mzdu nejvýše 17 850 Kč a aspoň polovina osob má průměrnou hrubou mzdu aspoň 17 850 Kč. Protože exponenciální rozložení je rozložení s kladnou šikmostí (lze spočítat, že šikmost = 2), bude medián vždy menší než střední hodnota. Úkol 3.: Kolik procent zaměstnanců má podprůměrnou hrubou mzdu? Řešení: ∫ λ −λ− =−=λ=      λ < 1 0 1x 6321,0e1dxe 1 XP Znamená to, že téměř 2/3 zaměstnanců nedosáhnou na průměrnou mzdu. Průměr tedy není vhodnou charakteristikou střední úrovně mezd. Práce se systémem MATLAB Úkol 1.: Pomocí funkce exprnd náhodně vygenerujte příjmy n = 1000, 10 000 a 100 000 osob (střední hodnotu volte 25 752) a vytvořte histogram vygenerovaných příjmů. r = exprnd(25752,n,1); hist(r) Úkol 2.: Vypočtěte průměrný příjem a vypočtěte medián příjmů. m = mean(r); x50 = median(r); Zjištěné hodnoty porovnejte s teoretickými hodnotami: střední hodnota = 25 752 Kč, medián = 17 850 Kč. Úkol 3.: Zjistěte, kolik procent osob bude mít podprůměrné příjmy. pocet=0; pocet=sum(r