Téma 7.: Číselné charakteristiky diskrétních náhodných veličin, M-L věta Výpočet střední hodnoty a rozptylu diskrétní náhodné veličiny Střední hodnota: ( ) ( )∑ ∞ −∞= π= x xxXE , rozptyl: ( ) ( ) ( )xx-xxXD 2 xx 2       ππ= ∑∑ ∞ −∞= ∞ −∞= Střední hodnota a rozptyl lineární kombinace: E(a+bX) = a + bE(X), D(a+bX) = b2 D(X) Příklad 1.: Postupně se zkouší spolehlivost čtyř přístrojů. Další se zkouší jen tehdy, když předchozí je spolehlivý. Každý z přístrojů vydrží zkoušku s pravděpodobností 0,8. Náhodná veličina X udává počet zkoušených přístrojů. Vypočtěte střední hodnotu a rozptyl náhodné veličiny X. Řešení: X nabývá hodnot 1, 2, 3, 4 a její pravděpodobnostní funkce je π(1) = 0,2, π(2) = 0,8*0,2 = 0,16, π(3) = 0,82 *0,2 = 0,128, π(4) = 0,83 *0,2 + 0,84 = 0,512, π(0) = 0 jinak E(X) = 1*0,2 + 2*0,16 + 3*0,128 + 4*0,512 = 2,952 D(X) = 12 *0,2 + 22 *0,16 + 32 *0,128 + 42 *0,512 – 2,9522 = 1,4697 Postup ve STATISTICE: Otevřeme nový datový soubor o dvou proměnných X a cetnost a čtyřech případech. Do proměnné X napíšeme 1, 2, 3, 4, do proměnné cetnost napíšeme 200, 160, 128, 512 (hodnoty váhové proměnné musí být celá čísla). Statistiky – Základní statistiky/tabulky – Popisné statistiky – OK – zavedeme proměnnou vah cetnost – OK - Proměnné X – OK – Detailní výsledky - zaškrtneme Průměr, Rozptyl – Výpočet. Popisné statistiky (Tabulka1) Proměnná N platných Průměr Rozptyl X 1000 2,952000 1,471167 Rozptyl však musíme upravit, musíme ho vynásobit číslem 999/1000. Do výstupní tabulky tedy přidáme za proměnnou Rozptyl novou proměnnou a do jejího Dlouhého jména napíšeme =v3*999/1000 Popisné statistiky (Tabulka1) Proměnná N platných Průměr Rozptyl NProm X 1000 2,952000 1,471167 1,469696 Příklad 2.: Dodavatel se zajímá o celkovou cenu projektu. Odhaduje, že materiál bude stát 25 000 Kč a práce 900 Kč denně. Doba trvání projektu (ve dnech) je popsána náhodnou veličinou X, která může nabývat hodnot 10, 11, 12, 13, 14 s pravděpodobnostmi 0,1, 0,3, 0,3, 0,2 a 0,1. Vypočtěte střední hodnotu a směrodatnou odchylku celkové ceny projektu. Řešení: Nejprve vypočteme střední hodnotu a rozptyl doby trvání projektu: ( ) ( ) 9,111,0142,0133,0123,0111,010xxXE 14 10x =⋅+⋅+⋅+⋅+⋅=π= ∑= ( ) ( ) ( )[ ] 29,19,111,0142,0133,0123,0111,010XExxXD 2222222 14 10x 2 =−⋅+⋅+⋅+⋅+⋅=−π= ∑= Zavedeme náhodnou veličinu Y, která udává celkovou cenu projektu. Je zřejmé, že X90025000Y += . Z vlastností střední hodnoty a rozptylu plyne: ( ) ( ) ( ) 357109,1190025000XE90025000X90025000EYE =⋅+=+=+= Kč ( ) ( ) ( ) 104490029,1810000XD900X90025000DYD 2 =⋅==+= Kč2 ( ) 20,10221044900YD == Kč Postup ve STATISTICE: Otevřeme nový datový soubor o dvou proměnných X a cetnost a pěti případech. Do proměnné X napíšeme 10, 11, 12, 13, 14, do proměnné cetnost napíšeme 1, 3, 3, 2, 1. Statistiky – Základní statistiky/tabulky – Popisné statistiky – OK – zavedeme proměnnou vah cetnost – OK - Proměnné X – OK – Detailní výsledky - zaškrtneme Průměr, Rozptyl – Výpočet. Popisné statistiky (Tabulka16) Proměnná N platných Průměr Rozptyl X 10 11,90000 1,433333 Rozptyl však musíme upravit, musíme ho vynásobit číslem 9/10. Do výstupní tabulky tedy přidáme za proměnnou Rozptyl novou proměnnou a do jejího Dlouhého jména napíšeme =v3*9/10. Popisné statistiky (Tabulka16) Proměnná N platných Průměr Rozptyl NProm X 10 11,90000 1,433333 1,29 Pro výpočet střední hodnoty a směrodatné odchylky celkové ceny projektu přidáme k této tabulce dvě nové proměnné, které nazveme E(Y) a sqrtD(Y). Do Dlouhého jména proměnné E(Y) napíšeme =25000+900*v2 a do Dlouhého jména proměnné sqrtD(Y) napíšeme =900*sqrt(v4). Výsledná tabulka: Popisné statistiky (Tabulka16) Proměnná N platných Průměr Rozptyl NProm E(Y) sqrtD(Y) X 10 11,90000 1,433333 1,29 35710 1022,2035 Příklad k samostatnému řešení: Náhodná veličina X udává počet ok při hodu kostkou. Pomocí systému STATISTICA vypočtěte její střední hodnotu a rozptyl. Výsledek: E(X) = 3,5, D(X) = 2,9167 Výpočet koeficientu korelace diskrétních náhodných veličin Koeficient korelace: ( ) ( ) ( ) ( )21 21 21 XDXD X,XC X,XR = , kde kovariance ( ) ( ) ( ) ( )∑∑∑ ∑ ∞ −∞= ∞ −∞= ∞ −∞= ∞ −∞= πππ= 211 2 x 222 x 111 x x 212121 xxxx-x,xxxX,XC Příklad 3.: Náhodná veličina X udává roční příjem manžela (v tisících dolarů) a náhodná veličina Y roční příjem manželky (v tisících dolarů). Je známa simultánní pravděpodobnostní funkce π(x,y) diskrétního náhodného vektoru (X,Y): Příjem manželkyPříjem manžela 10 20 30 40 10 0,2 0,04 0,01 0 20 0,1 0,36 0,09 0 30 0 0,05 0,1 0 40 0 0 0 0,05 Vypočtěte koeficient korelace příjmů manžela a manželky. Řešení: Stanovíme hodnoty marginálních pravděpodobnostních funkcí π1(x), π2(y): Příjem manželkyPříjem manžela 10 20 30 40 π1(x) 10 0,2 0,04 0,01 0 0,25 20 0,1 0,36 0,09 0 0,55 30 0 0,05 0,1 0 0,15 40 0 0 0 0,05 0,05 π2(y) 0,3 0,45 0,2 0,05 1 Spočteme E(X) = 20, E(Y) = 20, D(X) = 60, D(Y) = 70. Dosazením do vzorce pro výpočet kovariance zjistíme, že C(X,Y) = 49, tedy koeficient korelace R(X,Y) = 49/√60√70 = 0,76. Postup ve STATISTICE: Vytvoříme nový datový soubor o třech proměnných X, Y, cetnost a 16 případech. Do proměnné X napíšeme 10, 10, 10, 10, 20, 20, 20, 20, 30, 30, 30, 30, 40 ,40 40, 40 , do proměnné Y 4x pod sebe 10, 20, 30, 40 a do proměnné cetnost 20, 4, 1, 0, 10, 36, 9, 0, 0, 5, 10, 0, 0, 0, 0, 5. Statistiky - Základní statistiky/tabulky – zavedeme proměnnou vah cetnost – OK - Korelační matice – OK – 1 seznam proměnných – X, Y – OK. Korelace (Tabulka6) Označ. korelace jsou významné na hlad. p < ,05000 N=100 (Celé případy vynechány u ChD) Proměnná Průměry Sm.odch. X Y X Y 20,00000 7,784989 1,000000 0,756086 20,00000 8,408750 0,756086 1,000000 Příklad k samostatnému řešení: Diskrétní náhodný vektor (X1,X2) má simultánní pravděpodobnostní funkci s hodnotami π(0,-1) = c, π(0,0) = π(0,1) = π(1,-1) = π(2,-1) = 0, π(1,0) = π(1,1) = π(2,1) = 2c, π(2,0) = 3c, π(x,y) = 0 jinak. Určete konstantu c a vypočtěte R(X1,X2). Výsledek: c = 0,1, R(X1,X2) = 0,42379. Aplikace Moivreovy - Laplaceovy věty Příklad 4.: Pravděpodobnost úspěchu při jednom pokusu je 0,3. S jakou pravděpodobností lze tvrdit, že počet úspěchů ve 100 pokusech bude v mezích od 20 do 40? Y100 – počet úspěchů v posloupnosti n = 100 opakovaných nezávislých pokusů, pravděpodobnost úspěchu ϑ = 0,3, Y100 ~ Bi(100, 0,3), E(Y100) = ϑn = 30, D(Y100) = ( )ϑ−ϑ 1n = 21. Aproximativní výpočet: Vidíme, že podmínky dobré aproximace jsou splněny, protože ( ) 9.21,30-13,0100a 101 100 3,0 101 1 >=⋅⋅<< ( ) 9773,0 21 11 21 10 21 3040 21 30Y 21 3019 P40Y20P 100 100 =      −Φ−      Φ≈      − ≤ − < − =≤≤ , kde Φ(x) je distribuční funkce rozložení N(0,1). Přesný výpočet: ( ) ( ) ( ) ( ) 978614,0194040Y19P40Y20P 100100 =Φ−Φ=≤<=≤≤ , kde Φ(x) je distribuční funkce rozložení Bi(100, 0,3). Postup ve STATISTICE: Otevřeme nový datový soubor se dvěma proměnnými a jedním případem. Nastavíme se kurzorem na 1. sloupec. Do Dlouhého jména první proměnné napíšeme =INormal(10/sqrt(21);0;1)- INormal(-11/sqrt(21);0;1) OK. (Funkce INormal(x;mu;sigma) poskytuje hodnotu distribuční funkce v bodě x normálního rozložení se střední hodnotou mu a směrodatnou odchylkou sigma.) Nastavíme se kurzorem na 2. sloupec. Do Dlouhého jména druhé proměnné napíšeme =IBinom(40;0,3;100)- IBinom(19;0.3;100). (Funkce IBinom(x;p;n) poskytuje hodnotu distribuční funkce v bodě x binomického rozložení s parametry p a n.) 1 Prom1 2 Prom2 1 0,97726318 0,97861426 Příklad k samostatnému řešení: Pravděpodobnost, že určitý typ výrobku bude mít výrobní vadu, je 0,05. Jaká je pravděpodobnost, že ze série 1000 výrobků bude mít výrobní vadu nejvýše 70 výrobků? (Při aproximativním výpočtu nezapomeňte na ověření podmínek dobré aproximace.) Výsledek: ≈0,99815, =0,9977