Cvičení 9: Pravděpodobnostní funkce, hustoty a distribuční funkce v systému STATISTICA, výpočet pravděpodobností pomocí distribučních funkcí Systém STATISTICA vytváří grafy hustot a distribučních funkcí mnoha spojitých rozložení, umí stanovit hodnotu distribuční funkce či počítat 1 - hodnota distribuční funkce. Slouží k tomu Pravděpodobnostní kalkulátor v menu Statistiky. Hodnoty pravděpodobnostních funkcí, hustot a distribučních funkcí lze počítat též pomocí funkcí implementovaných v položce „Dlouhé jméno“ proměnné. Zaměříme se na binomické rozložení, Poissonovo rozložení, exponenciální rozložení a normální rozložení. Binomické rozložení Bi(n, ϑ ) Náhodná veličina X udává počet úspěchů v posloupnosti n nezávislých opakovaných pokusů, přičemž pravděpodobnost úspěchu je v každém pokusu ϑ . Píšeme X ~ Bi(n, ϑ ). ( ) ( ) ∑= − − ϑ−ϑ      =Φ      =ϑ−ϑ      =π x 0t tnt xnx )1( t n x, jinak0 n,0,xpro)1( x n x K Kreslení grafů funkcí ( )xπ a ( )xΦ v systému STATISTICA 1. možnost: Ukážeme si, jak získat grafy pravděpodobnostní a distribuční funkce náhodné veličiny X ~ ( )3,0;12Bi . Vytvoříme nový datový soubor o 3 proměnných a 13 případech. První proměnnou nazveme X a uložíme do ní hodnoty 0, 1, ..., 12 (do Dlouhého jména napíšeme =v0-1). Druhou proměnnou nazveme PF a uložíme do ní hodnoty pravděpodobnostní funkce (do Dlouhého jména napíšeme příkaz =Binom(x;0,3;12)). Třetí proměnnou nazveme DF a uložíme do ní hodnoty distribuční funkce (do Dlouhého jména napíšeme příkaz =IBinom(x;0,3;12)). Graf pravděpodobnostní funkce: Grafy – Bodové grafy – Proměnné X, PF – OK – vypneme Lineární proložení – OK. Graf distribuční funkce: Grafy – Bodové grafy – Proměnné X, DF – OK – vypneme Lineární proložení – OK – 2x klikneme na pozadí grafu – Graf:Obecné – zaškrtneme Spojnice – Typ spojnice: Schod – OK. (Svislé čáry do grafu nepatří.) Graf funkce ( )xπ rozložení ( )3,0;12Bi Graf funkce ( )xΦ rozložení ( )3,0;12Bi -2 0 2 4 6 8 10 12 14 X -0,02 0,00 0,02 0,04 0,06 0,08 0,10 0,12 0,14 0,16 0,18 0,20 0,22 0,24 0,26 PF -2 0 2 4 6 8 10 12 14 X -0,2 0,0 0,2 0,4 0,6 0,8 1,0 1,2 DF Analogickým způsobem můžeme získat grafy pravděpodobnostních distribučních funkcí binomického rozložení pro různá n a ϑ a sledovat vliv těchto parametrů na vzhled grafů. 2. možnost: Využijeme Pravděpodobnostní kalkulátor. Statistiky – Pravděpodobnostní kalkulátor – Rozdělení – Binomické. Vyplníme X: 0, N: 12, p: 0,3, zaškrtneme Vytv. graf – Výpočet. y=Binom(x;,3;12) 0 2 4 6 8 10 12 14 0,0 0,2 0,4 0,6 0,8 1,0 p=iBinom(x;,3;12) 0 2 4 6 8 10 12 14 0,0 0,2 0,4 0,6 0,8 1,0 Graf pravděpodobnostní funkce není z formálního hlediska správný, protože pravděpodobnostní funkce je kladná pouze v bodech 0, 1, …, n (=12) všude jinde je nulová. Do grafu distribuční funkce nepatří svislé čáry. Poissonovo rozložení Po(λ) Náhodná veličina X udává počet událostí, které nastanou v jednotkovém časovém intervalu (resp. v jednotkové oblasti), přičemž k událostem dochází náhodně, jednotlivě a vzájemně nezávisle. Parametr 0>λ je střední počet těchto událostí. Píšeme X ~ ( )λPo . ( ) ( ) ∑= λ− λ− λ =Φ      = λ =π x 0t t x e !t x, jinak0 1,0,xproe !xx K Kreslení grafů funkcí ( )xπ a ( )xΦ v systému STATISTICA 1. možnost: Při tvorbě grafů pravděpodobnostní a distribuční funkce náhodné veličiny s Poissonovým rozložením, např. X ~ ( )5Po , postupujeme podobně jako u binomického rozložení, ale v datovém souboru bude 16 případů a použijeme funkce Poisson(x;5) a IPoisson(x;5). 2. možnost: Využijeme Pravděpodobnostní kalkulátor. Statistiky – Pravděpodobnostní kalkulátor – Rozdělení – Poisson. Vyplníme X: 0, Lambda 5, zaškrtneme Vytv. graf – Výpočet. Příklad 1.: Při provozu balicího automatu vznikají během směny náhodné poruchy, které se řídí rozložením Po(2). Jaká je pravděpodobnost, že během směny dojde k aspoň jedné poruše? Řešení: X – počet poruch během směny, X ~ Po(2), P(X ≥ 1) = 1 – P(X < 1) = 1 – P(X = 0) = = 1 - 2 0 e !0 2 − = 0,8647. Návod na výpočet pomocí systému STATISTICA: 1. možnost: Otevřeme nový datový soubor o jedné proměnné a jednom případu. Do Dlouhého jména této proměnné napíšeme =1-IPoisson(0;2). Dostaneme výsledek 0,8647. 2. možnost: Využijeme Pravděpodobnostní kalkulátor. Statistiky – Pravděpodobnostní kalkulátor – Rozdělení – Poisson. Vyplníme X: 0, Lambda 2, zaškrtneme Kum. Pravděpodobnost – Výpočet. Dostaneme 0,1353. Hledaná pravděpodobnost je doplněk do 1, tedy 0,8647. Exponenciální rozložení Ex(λ) Náhodná veličina X udává dobu čekání na příchod nějaké události, která se může dostavit každým okamžikem se stejnou šancí bez ohledu na dosud pročekanou dobu. (Jde o tzv. čekání bez paměti.) Přitom λ 1 vyjadřuje střední dobu čekání. Náhodná veličina X ~ Ex(λ) má hustotu ( )    >λ =ϕ λ jinak0 0xproe x x- . Kreslení grafů funkcí ( )xϕ a ( )xΦ exponenciálního rozložení v systému STATISTICA 1. možnost: Ukážeme si, jak získat grafy hustoty pravděpodobnosti a distribuční funkce náhodné veličiny X ~ ( )2Ex . Vytvoříme nový datový soubor o 3 proměnných a 30 případech. První proměnnou nazveme X a uložíme do ní hodnoty 0,001,1, 0,2, ..., 3 (do Dlouhého jména napíšeme =v0/10). Před 1. případ vložíme jeden případ a do proměnné X napíšeme 0,001. Druhou proměnnou nazveme HP a uložíme do ní hodnoty hustoty pravděpodobnosti. (do Dlouhého jména napíšeme příkaz =Expon(x;2)). Třetí proměnnou nazveme DF a uložíme do ní hodnoty distribuční funkce (do Dlouhého jména napíšeme příkaz =IExpon(x;2)). Graf hustoty: Grafy – Bodové grafy – Proměnné X, HP – OK – vypneme Lineární proložení – OK. Vymažeme značky, zapneme spojnici a na vodorovné ose upravíme měřítko od 0 do 3. Graf distribuční funkce: Grafy – Bodové grafy – Proměnné X, DF – OK – vypneme Lineární proložení – OK. Vymažeme značky, zapneme spojnici a na vodorovné ose upravíme měřítko od 0 do 3. Graf funkce ( )xϕ rozložení ( )2Ex Graf funkce ( )xΦ rozložení ( )2Ex 0,0 0,2 0,4 0,6 0,8 1,0 1,2 1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 x -0,2 0,0 0,2 0,4 0,6 0,8 1,0 1,2 1,4 1,6 1,8 2,0 2,2 HP 0,0 0,2 0,4 0,6 0,8 1,0 1,2 1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 x -0,2 0,0 0,2 0,4 0,6 0,8 1,0 1,2 DF 2. možnost: Využijeme Pravděpodobnostní kalkulátor. Statistiky – Pravděpodobnostní kalkulátor – Rozdělení – Exponenciální. Vyplníme lambda: 2, zaškrtneme Vytv. graf – Výpočet. Příklad 2.: Doba do ukončení opravy v opravně obuvi je náhodná veličina, která se řídí exponenciálním rozložením se střední dobou opravy 3 dny. Jaká je pravděpodobnost, že oprava bude ukončena do dvou dnů? Řešení: X ~ Ex(1/3), ( ) 4866,0e1edxe 3 1 2XP 3 22 0 3 x2 0 3 x =−=      −==≤ −−− ∫ Návod na výpočet pomocí systému STATISTICA: 1. možnost: Otevřeme nový datový soubor o jedné proměnné a jednom případu. Do dlouhého jména této proměnné napíšeme =IExpon(2;1/3). Dostaneme 0,4866. 2. možnost: Využijeme Pravděpodobnostní kalkulátor. Statistiky – Pravděpodobnostní kalkulátor – Rozdělení – Exponenciální - do okénka lambda napíšeme 0,3333, do okénka exp. napíšeme 2 a po kliknutí na Výpočet se v okénku p objeví 0,4866. Normální rozložení N(µ, σ2 ) Náhodná veličina X ~ N(µ, σ2 ) má hustotu ( ) 2 2 2 )-x( e 2 1 x σ µ − πσ =ϕ . Pro µ = 0, σ2 = 1 se jedná o standardizované normální rozložení, píšeme U ~ N(0, 1). Hustota pravděpodobnosti má v tomto případě tvar φ(u) = 2 u2 e 2 1 − π . Kreslení grafů funkcí ( )xϕ a ( )xΦ normálního rozložení v systému STATISTICA 1. možnost: Ukážeme si, jak získat grafy hustoty pravděpodobnosti a distribuční funkce náhodné veličiny X ~ ( )4,1N − . Vytvoříme nový datový soubor o 3 proměnných a 101 případech. První proměnnou nazveme x a uložíme do ní hodnoty -6, -5,9, -5,8, ..., 4 (do Dlouhého jména napíšeme =(v0-1)/10-6). Druhou proměnnou nazveme HP a uložíme do ní hodnoty hustoty pravděpodobnosti. (do Dlouhého jména napíšeme příkaz =Normal(x;-1;2)). Třetí proměnnou nazveme DF a uložíme do ní hodnoty distribuční funkce (do Dlouhého jména napíšeme příkaz = INormal(x;-1;2)). Graf hustoty: Grafy – Bodové grafy – Proměnné x, HP – OK – vypneme Lineární proložení – OK. Vymažeme značky, zapneme spojnici a na vodorovné ose upravíme měřítko od -6 do 4. Graf distribuční funkce: Grafy – Bodové grafy – Proměnné x, DF – OK – vypneme Lineární proložení – OK. Vymažeme značky, zapneme spojnici a na vodorovné ose upravíme měřítko od -6 do 4. Graf funkce ( )xϕ rozložení ( )4,1N − Graf funkce ( )xΦ rozložení ( )4,1N − -6 -5 -4 -3 -2 -1 0 1 2 3 4 x 0,00 0,02 0,04 0,06 0,08 0,10 0,12 0,14 0,16 0,18 0,20 0,22 HP -6 -5 -4 -3 -2 -1 0 1 2 3 4 x -0,2 0,0 0,2 0,4 0,6 0,8 1,0 1,2 DF2. možnost: Využijeme Pravděpodobnostní kalkulátor. Statistiky – Pravděpodobnostní kalkulátor – Rozdělení – Z (normální). Vyplníme průměr: -1, SmOdch: 2, zaškrtneme Vytv. graf – Výpočet. Příklad 3: Životnost baterie v hodinách je náhodná veličina, která má normální rozložení se střední hodnotou 300 hodin a směrodatnou odchylkou 35 hodin. Jaká je pravděpodobnost, že náhodně vybraná baterie bude mít životnost aspoň 320 hodin? Návod na výpočet pomocí systému STATISTICA: 1. možnost: Otevřeme nový datový soubor o jedné proměnné a jednom případu. Do dlouhého jména této proměnné napíšeme =1-INormal(320;300;35). Dostaneme 0,2839. 2. možnost: Využijeme Pravděpodobnostní kalkulátor. Statistiky – Pravděpodobnostní kalkulátor – Rozdělení – Z(normální) - do okénka průměr napíšeme 300, do okénka SmOdch napíšeme 35, zaškrtneme 1-kumul. p a po kliknutí na Výpočet se v okénku p objeví 0,2839. Příklad k samostatnému řešení.: Na výrobní lince jsou automaticky baleny balíčky rýže o deklarované hmotnosti 1000 g. Působením náhodných vlivů hmotnost balíčků kolísá. Lze ji považovat za náhodnou veličinu, která se řídí normálním rozložením se střední hodnotou 996 g a směrodatnou odchylkou 18 g. Jaká je pravděpodobnost, že náhodně vybraný balíček rýže neprojde výstupní kontrolou, jestliže je povolená tolerance 30± g od deklarované hmotnosti 1000 g? Výsledek: ( ) 104,0)1030X970(P11030,970XP =<<−=∉