Téma 4.: Pravděpodobnostní funkce, hustoty a distribuční funkce v systému STATISTICA, výpočet pravděpodobností pomocí distribučních funkcí Systém STATISTICA vytváří grafy hustot a distribučních funkcí mnoha spojitých rozložení, umí stanovit hodnotu distribuční funkce či počítat 1 - hodnota distribuční funkce. Slouží k tomu Pravděpodobnostní kalkulátor v menu Statistiky. Hodnoty pravděpodobnostních funkcí, hustot a distribučních funkcí lze počítat též pomocí funkcí implementovaných v položce „Dlouhé jméno“ proměnné. Zaměříme se na binomické rozložení, Poissonovo rozložení, exponenciální rozložení a normální rozložení. Binomické rozložení Bi(n, ϑ ) Náhodná veličina X udává počet úspěchů v posloupnosti n nezávislých opakovaných pokusů, přičemž pravděpodobnost úspěchu je v každém pokusu ϑ . Píšeme X ~ Bi(n, ϑ ). ( ) ( ) ∑= − − ϑ−ϑ      =Φ      =ϑ−ϑ      =π x 0t tnt xnx )1( t n x, jinak0 n,0,xpro)1( x n x K Kreslení grafů funkcí ( )xπ a ( )xΦ v systému STATISTICA 1. možnost: Ukážeme si, jak získat grafy pravděpodobnostní a distribuční funkce náhodné veličiny X ~ ( )3,0;12Bi . Vytvoříme nový datový soubor o 3 proměnných a 13 případech. První proměnnou nazveme X a uložíme do ní hodnoty 0, 1, ..., 12 (do Dlouhého jména napíšeme =v0-1). Druhou proměnnou nazveme PF a uložíme do ní hodnoty pravděpodobnostní funkce (do Dlouhého jména napíšeme příkaz =Binom(x;0,3;12)). Třetí proměnnou nazveme DF a uložíme do ní hodnoty distribuční funkce (do Dlouhého jména napíšeme příkaz =IBinom(x;0,3;12)). Graf pravděpodobnostní funkce: Grafy – Bodové grafy – Proměnné X, PF – OK – vypneme Lineární proložení – OK. Graf distribuční funkce: Grafy – Bodové grafy – Proměnné X, DF – OK – vypneme Lineární proložení – OK – 2x klikneme na pozadí grafu – Graf:Obecné – zaškrtneme Spojnice – Typ spojnice: Schod – OK. Graf funkce ( )xp rozložení ( )3,0;12Bi Graf funkce ( )xF rozložení ( )3,0;12Bi -2 0 2 4 6 8 10 12 14 X -0,02 0,00 0,02 0,04 0,06 0,08 0,10 0,12 0,14 0,16 0,18 0,20 0,22 0,24 0,26 PF -2 0 2 4 6 8 10 12 14 X -0,2 0,0 0,2 0,4 0,6 0,8 1,0 1,2 DF Analogickým způsobem můžeme získat grafy pravděpodobnostních distribučních funkcí binomického rozložení pro různá n a ϑ a sledovat vliv těchto parametrů na vzhled grafů. 2. možnost: Využijeme Pravděpodobnostní kalkulátor. Statistiky – Pravděpodobnostní kalkulátor – Rozdělení – Binomické. Vyplníme X: 0, N: 12, p: 0,3, zaškrtneme Vytv. graf – Výpočet. y=Binom(x;,3;12) 0 2 4 6 8 10 12 14 0,0 0,2 0,4 0,6 0,8 1,0 p=iBinom(x;,3;12) 0 2 4 6 8 10 12 14 0,0 0,2 0,4 0,6 0,8 1,0 Graf pravděpodobnostní funkce není z formálního hlediska správný, protože pravděpodobnostní funkce je kladná pouze v bodech 0, 1, …, n (=12) všude jinde je nulová. Poissonovo rozložení Po(λ) Náhodná veličina X udává počet událostí, které nastanou v jednotkovém časovém intervalu (resp. v jednotkové oblasti), přičemž k událostem dochází náhodně, jednotlivě a vzájemně nezávisle. Parametr 0>λ je střední počet těchto událostí. Píšeme X ~ ( )λPo . ( ) ( ) ∑= λ− λ− λ =Φ      = λ =π x 0t t x e !t x, jinak0 1,0,xproe !xx K Kreslení grafů funkcí ( )xπ a ( )xΦ v systému STATISTICA 1. možnost: Při tvorbě grafů pravděpodobnostní a distribuční funkce náhodné veličiny s Poissonovým rozložením, např. X ~ ( )5Po , postupujeme podobně jako u binomického rozložení, ale v datovém souboru bude 16 případů a použijeme funkce Poisson(x;5) a IPoisson(x;5). 2. možnost: Využijeme Pravděpodobnostní kalkulátor. Statistiky – Pravděpodobnostní kalkulátor – Rozdělení – Poisson. Vyplníme X: 0, Lambda 5, zaškrtneme Vytv. graf – Výpočet. Příklad 1.: Při provozu balicího automatu vznikají během směny náhodné poruchy, které se řídí rozložením Po(2). Jaká je pravděpodobnost, že během směny dojde k aspoň jedné poruše? Řešení: X – počet poruch během směny, X ~ Po(2), P(X ≥ 1) = 1 – P(X < 1) = 1 – P(X = 0) = = 1 - 2 0 e !0 2 − = 0,8647. Návod na výpočet pomocí systému STATISTICA: Otevřeme nový datový soubor o jedné proměnné a jednom případu. Do Dlouhého jména této proměnné napíšeme =1-IPoisson(0;2). Dostaneme výsledek 0,8647. Exponenciální rozložení Ex(λ) Náhodná veličina X udává dobu čekání na příchod nějaké události, která se může dostavit každým okamžikem se stejnou šancí bez ohledu na dosud pročekanou dobu. (Jde o tzv. čekání bez paměti.) Přitom λ 1 vyjadřuje střední dobu čekání. Náhodná veličina X ~ Ex(λ) má hustotu ( )    >λ =ϕ λ jinak0 0xproe x x- . Použití systému STATISTICA: První možnost: Ve volbě Rozdělení vybereme Exponenciální, do okénka lambda napíšeme hodnotu parametru λ. Hodnotu distribuční funkce v bodě x zjistíme tak, že do okénka označeného X napíšeme dané x a po kliknutí na Výpočet se v okénku p objeví hodnota distribuční funkce. Druhá možnost: Výpočet hodnoty distribuční funkce pomocí funkcí implementovaných v položce „Dlouhé jméno“: Otevřeme nový datový soubor o jedné proměnné a jednom případu. V položce „Dlouhé jméno“ této proměnné použijeme funkci IExpon(x;lambda). Příklad 2.: Doba do ukončení opravy v opravně obuvi je náhodná veličina, která se řídí exponenciálním rozložením se střední dobou opravy 3 dny. Jaká je pravděpodobnost, že oprava bude ukončena do dvou dnů? Řešení: X ~ Ex(1/3), ( ) 4866,0e1edxe 3 1 2XP 3 22 0 3 x2 0 3 x =−=      −==≤ −−− ∫ Návod na výpočet pomocí systému STATISTICA: První možnost: Do okénka lambda napíšeme 0,3333, do okénka exp. napíšeme 2 a po kliknutí na Výpočet se v okénku p objeví 0,4866. Druhá možnost: Otevřeme nový datový soubor o jedné proměnné a jednom případu. Do dlouhého jména této proměnné napíšeme =IExpon(2;1/3). Dostaneme 0,4866. Příklad 2.: Doba (v hodinách), která uplyne mezi dvěma naléhavými příjmy v jisté nemocnici, se řídí exponenciálním rozložením se střední dobou čekání 2 h. Jaká je pravděpodobnost, že uplyne více než 5 h bez naléhavého příjmu? Výsledek: X ~ Ex(1/2), ( ) 082,05XP => Kreslení grafů funkcí ( )xϕ a ( )xΦ rozložení Ex(2) v systému STATISTICA pomocí Pravděpodobnostního kalkulátoru Statistiky – Pravděpodobnostní kalkulátor – Rozdělení – Exponenciální. Vyplníme lambda: 2, zaškrtneme Vytv. graf – Výpočet. Normální rozložení N(µ, σ2 ) Náhodná veličina X ~ N(µ, σ2 ) má hustotu ( ) 2 2 2 )-x( e 2 1 x σ µ − πσ =ϕ . Pro µ = 0, σ2 = 1 se jedná o standardizované normální rozložení, píšeme U ~ N(0, 1). Hustota pravděpodobnosti má v tomto případě tvar φ(u) = 2 u2 e 2 1 − π . Použití systému STATISTICA: První možnost: Ve volbě Rozdělení vybereme Z (Normální), do okénka průměr napíšeme hodnotu µ a do okénka Sm. Odch. napíšeme hodnotu σ. Hodnotu distribuční funkce v bodě x zjistíme tak, že do okénka označeného X napíšeme dané x a po kliknutí na Výpočet se v okénku p objeví hodnota distribuční funkce. Druhá možnost: Výpočet hodnoty distribuční funkce pomocí funkcí implementovaných v položce „Dlouhé jméno“: Otevřeme nový datový soubor o jedné proměnné a jednom případu. V položce „Dlouhé jméno“ této proměnné použijeme funkci INormal(x;mu;sigma). Příklad 3.: Výsledky u přijímacích zkoušek na jistou VŠ jsou normálně rozloženy s parametry µ = 550 bodů, σ = 100 bodů. S jakou pravděpodobností bude mít náhodně vybraný uchazeč aspoň 600 bodů? Řešení: X – výsledek náhodně vybraného uchazeče, X ~ N(550, 1002 ), P(X ≥ 600) = 1 – P(X ≤ 600) + P(X = 600) = 1 – P(X ≤ 600) = 1 – P       σ µ− ≤ σ µ− 600X = 1 - P       − ≤ 100 550600 U = 1 – Φ(0,5) = 1 – 0,69146 = 0,30854. Návod na výpočet pomocí systému STATISTICA: První možnost: Do okénka průměr napíšeme 550, do okénka Sm. Odch. napíšeme 100, do okénka X napíšeme 600, zaškrtneme 1-Kumul. p a v okénku p se objeví 0,308538. Druhá možnost: Otevřeme nový datový soubor o jedné proměnné a jednom případu. Do dlouhého jména této proměnné napíšeme =1-INormal(600;550;100). Dostaneme 0,3085. Příklad 4: Životnost baterie v hodinách je náhodná veličina, která má normální rozložení se střední hodnotou 300 hodin a směrodatnou odchylkou 35 hodin. Jaká je pravděpodobnost, že náhodně vybraná baterie bude mít životnost a) aspoň 320 hodin? b) nejvýše 310 hodin? Výsledek: ad a) ( ) 28434,0320XP => ad b) ( ) 61245,0310XP =≤ Příklad 5.: Na výrobní lince jsou automaticky baleny balíčky rýže o deklarované hmotnosti 1000 g. Působením náhodných vlivů hmotnost balíčků kolísá. Lze ji považovat za náhodnou veličinu, která se řídí normálním rozložením se střední hodnotou 996 g a směrodatnou odchylkou 18 g. Jaká je pravděpodobnost, že náhodně vybraný balíček rýže neprojde výstupní kontrolou, jestliže je povolená tolerance 30± g od deklarované hmotnosti 1000 g? Výsledek: ( ) 104,0)1030X970(P11030,970XP =<<−=∉ Kreslení grafů funkcí ( )xϕ a ( )xΦ rozložení N(0,1) v systému STATISTICA pomocí Pravděpodobnostního kalkulátoru Statistiky – Pravděpodobnostní kalkulátor – Rozdělení – Z (normální). Vyplníme průměr: 0, SmOdch: 1, zaškrtneme Vytv. graf – Výpočet. Kreslení grafu hustoty dvourozměrného standardizovaného normálního rozložení Tato hustota je dána předpisem ( ) ( )22 yx 2 1 e 2 1 y,x +− π =ϕ . Grafy – 3D XYZ – Grafy vlastních funkcí – nastavíme rozsahy os: osa X: -3;3, osa Y: -3;3 – do pole Funkce Z(x,y) napíšeme: (1/2*pi)*exp(-(x^2+y^2)/2) – OK. Dostaneme graf: Graf funkce Funkce = (1/2*pi)*exp(-(x^2+y^2)/2) > 1,4 < 1,3 < 1,1 < 0,9 < 0,7 < 0,5 < 0,3 < 0,1 -3 -2 -1 0 1 2 3 X -3 -2 -1 0 1 2 3 Y 0,2 0,4 0,6 0,8 1,0 1,2 1,4 Z