Využití MATLABu při práci s exponenciálním rozložením Základní poznatky o exponenciálním rozložení Ex() Náhodná veličina X udává dobu čekání na příchod nějaké události, která se může dostavit každým okamžikem se stejnou šancí bez ohledu na dosud pročekanou dobu. Přitom 1/ vyjadřuje střední dobu čekání. Hustota: 0xpro0 0xproe x x , distribuční funkce: 0xpro0 0xproe1 x x , kvantilová funkce: 1ln 11 , kde 0 < < 1. Střední hodnota: 1 XE , rozptyl: 2 1 XD . Interval spolehlivosti pro střední hodnotu: Nechť X1, ..., Xn je náhodný výběr z rozložení Ex() a nechť m je realizace výběrového průměru. Pak meze 100(1-)% přibližného empirického intervalu spolehlivosti pro 1 XE jsou: n2 nm2 h, n2 nm2 d 2/ 2 2/1 2 Pozor, funkce v MATLABu pro práci s exponenciálním rozložením vyžadují zadávat převrácenou hodnotu parametru . a) Kreslení grafu hustoty a distribuční funkce rozložení Ex(1/2) x=[0:0.01:10]'; f=exppdf(x,2); plot(x,f) df=expcdf(x,2); figure plot(x,df) Graf hustoty 0 1 2 3 4 5 6 7 8 9 10 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5 Graf distribuční funkce 0 1 2 3 4 5 6 7 8 9 10 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 b) Kreslení grafu kvantilové funkce rozložení Ex(1/2) alfa=[0.01:0.01:0.99]'; kv=expinv(alfa,2); plot(alfa,kv) Graf kvantilové funkce 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 1 2 3 4 5 6 7 8 9 10 c) Generování 100 realizací náhodné veličiny s rozložením Ex(1/2) a kreslení histogramu s 10 třídicími intervaly r=exprnd(2,100,1); hist(r) Histogram 0 1 2 3 4 5 6 7 8 9 10 0 5 10 15 20 25 30 35 40 45 d) Odhad střední hodnoty a meze intervalu spolehlivosti pro střední hodnotu na základě proměnné r Hodnoty uložené v proměnné r považujeme za realizace náhodného výběru rozsahu 100 z rozložení Ex(1/2) [m,meze]=expfit(r) e) Výpočet střední hodnoty a rozptylu rozložení Ex(1/2) [m,v]=expstat(2) Využití exponenciálního rozložení při analýze příjmů Úvod do problému: Je známo, že příjmy obyvatelstva ve společnosti jsou rozděleny nerovnoměrně. Jako první zkoumal toto rozdělení italský inženýr Vilfredo Pareto na konci 19. století. Zjistil, že příjmy lze modelovat mocninnou funkcí. V dalších letech se ukázalo, že tento tzv. Paretův zákon platí jen pro 5% nejbohatších lidí. Příjmy ostatních 95% obyvatel lze modelovat pomocí exponenciálního rozložení. (Proč to tak je? To je vysvětleno v článku F. Slaniny, Vesmír č. 9, rok 2001) Hustota: 0xpro0 0xproe x x , distribuční funkce: 0xpro0 0xproe1 x x Nechť náhodná veličina X udává měsíční příjem náhodně vybraného zaměstnance. Předpokládejme, že X ~ Ex(). Podle údajů Českého statistického úřadu dosáhla průměrná hrubá mzda v ČR za 1. až 3. čtvrtletí roku 2007 hodnoty 21 119 Kč. Úkol 1.: Zjistěte parametr pro náhodnou veličinu X. Řešení: 00004735,0 21119 1 21119 1 dxexXE 0 x Úkol 2.: Odvoďte obecný vzorec pro výpočet -kvantilu náhodné veličiny X a pak vyjádřete medián náhodné veličiny X. Co lze říci o vztahu střední hodnoty a mediánu? Řešení: 1ln 1 XKe1XK XK Výpočet mediánu: 146392ln21119 2ln 2 1 ln 1 XK 50,0 Znamená to, že aspoň polovina osob má průměrnou hrubou mzdu nejvýše 14 639 Kč a aspoň polovina osob má průměrnou hrubou mzdu aspoň 14 639 Kč. Protože exponenciální rozložení je rozložení s kladnou šikmostí (lze spočítat, že šikmost = 2), bude medián vždy menší než střední hodnota. Úkol 3.: Kolik procent zaměstnanců má podprůměrnou hrubou mzdu? Řešení: 1 0 1x 6321,0e1dxe 1 XP Znamená to, že téměř 2/3 zaměstnanců nedosáhnou na průměrnou mzdu. Průměr tedy není vhodnou charakteristikou střední úrovně mezd. Práce se systémem MATLAB Úkol 1.: Pomocí funkce exprnd náhodně vygenerujte příjmy n = 1000, 10 000 a 100 000 osob a vytvořte histogram vygenerovaných příjmů. r = exprnd(20000,n,1); hist(r) Úkol 2.: Vypočtěte průměrný příjem a vypočtěte medián příjmů. m = mean(r); x50 = median(r); Zjištěné hodnoty porovnejte s teoretickými hodnotami. Úkol 3.: Zjistěte, kolik procent osob bude mít podprůměrné příjmy. pocet=0; pocet=sum(r 0 a) ani jeden přístroj neselže, b) selže aspoň jeden přístroj? Řešení: ad a) 2100201 ttt 0201 020102010201 eeet1t1 tXP1tXP1tXPtXPtXtXP ad b) 210t 0201 e1tXtXP Příklad 6.: Najděte 5. percentil náhodné veličiny X ~ Ex(0,1) Řešení: 5129,095,0ln10XKXK1,0exp1XK05,0 05,005,005,0 V MATLABu: K = expinv(0.05,10)