Téma 7.: Číselné charakteristiky diskrétních náhodných veličin, M-L věta
Výpočet střední hodnoty a rozptylu diskrétní náhodné veličiny
Střední hodnota: ( ) ( )∑
∞
−∞=
π=
x
xxXE , rozptyl: ( ) ( ) ( )xx-xxXD
2
xx
2






ππ= ∑∑
∞
−∞=
∞
−∞=
Střední hodnota a rozptyl lineární kombinace: E(a+bX) = a + bE(X), D(a+bX) = b2
D(X)
Příklad 1.: Postupně se zkouší spolehlivost čtyř přístrojů. Další se zkouší jen tehdy, když
předchozí je spolehlivý. Každý z přístrojů vydrží zkoušku s pravděpodobností 0,8. Náhodná
veličina X udává počet zkoušených přístrojů. Vypočtěte střední hodnotu a rozptyl náhodné
veličiny X.
Řešení:
X nabývá hodnot 1, 2, 3, 4 a její pravděpodobnostní funkce je π(1) = 0,2, π(2) = 0,8*0,2 =
0,16, π(3) = 0,82*0,2 = 0,128, π(4) = 0,83*0,2 + 0,84 = 0,512, π(0) = 0 jinak
E(X) = 1*0,2 + 2*0,16 + 3*0,128 + 4*0,512 = 2,952
D(X) = 12
*0,2 + 22
*0,16 + 32
*0,128 + 42
*0,512 – 2,9522
= 1,4697
Postup ve STATISTICE:
Otevřeme nový datový soubor o dvou proměnných X a cetnost a čtyřech případech. Do
proměnné X napíšeme 1, 2, 3, 4, do proměnné cetnost napíšeme 200, 160, 128, 512 (hodnoty
váhové proměnné musí být celá čísla).
Statistiky – Základní statistiky/tabulky – Popisné statistiky – OK – zavedeme proměnnou vah
cetnost – OK - Proměnné X – OK – Detailní výsledky - zaškrtneme Průměr, Rozptyl –
Výpočet.
Popisné statistiky (Tabulka1)
Proměnná N platných Průměr Rozptyl
X 1000 2,952000 1,471167
Rozptyl však musíme upravit, musíme ho vynásobit číslem 999/1000. Do výstupní tabulky
tedy přidáme za proměnnou Rozptyl novou proměnnou a do jejího Dlouhého jména napíšeme
=v3*999/1000
Popisné statistiky (Tabulka1)
Proměnná N platných Průměr Rozptyl NProm
X 1000 2,952000 1,471167 1,469696
Příklad 2.: Dodavatel se zajímá o celkovou cenu projektu. Odhaduje, že materiál bude stát
25 000 Kč a práce 900 Kč denně. Doba trvání projektu (ve dnech) je popsána náhodnou
veličinou X, která může nabývat hodnot 10, 11, 12, 13, 14 s pravděpodobnostmi 0,1, 0,3,
0,3, 0,2 a 0,1. Vypočtěte střední hodnotu a směrodatnou odchylku celkové ceny projektu.
Řešení:
Nejprve vypočteme střední hodnotu a rozptyl doby trvání projektu:
( ) ( ) 9,111,0142,0133,0123,0111,010xxXE
14
10x
=⋅+⋅+⋅+⋅+⋅=π= ∑=
( ) ( ) ( )[ ] 29,19,111,0142,0133,0123,0111,010XExxXD 2222222
14
10x
2
=−⋅+⋅+⋅+⋅+⋅=−π= ∑=
Zavedeme náhodnou veličinu Y, která udává celkovou cenu projektu. Je zřejmé, že
X90025000Y += . Z vlastností střední hodnoty a rozptylu plyne:
( ) ( ) ( ) 357109,1190025000XE90025000X90025000EYE =⋅+=+=+= Kč
( ) ( ) ( ) 104490029,1810000XD900X90025000DYD 2
=⋅==+= Kč2
( ) 20,10221044900YD == Kč
Postup ve STATISTICE:
Otevřeme nový datový soubor o dvou proměnných X a cetnost a pěti případech. Do proměnné
X napíšeme 10, 11, 12, 13, 14, do proměnné cetnost napíšeme 1, 3, 3, 2, 1.
Statistiky – Základní statistiky/tabulky – Popisné statistiky – OK – zavedeme proměnnou vah
cetnost – OK - Proměnné X – OK – Detailní výsledky - zaškrtneme Průměr, Rozptyl –
Výpočet.
Popisné statistiky (Tabulka16)
Proměnná N platných Průměr Rozptyl
X 10 11,90000 1,433333
Rozptyl však musíme upravit, musíme ho vynásobit číslem 9/10. Do výstupní tabulky tedy
přidáme za proměnnou Rozptyl novou proměnnou a do jejího Dlouhého jména napíšeme
=v3*9/10.
Popisné statistiky (Tabulka16)
Proměnná N platných Průměr Rozptyl NProm
X 10 11,90000 1,433333 1,29
Pro výpočet střední hodnoty a směrodatné odchylky celkové ceny projektu přidáme k této
tabulce dvě nové proměnné, které nazveme E(Y) a sqrtD(Y). Do Dlouhého jména proměnné
E(Y) napíšeme =25000+900*v2 a do Dlouhého jména proměnné sqrtD(Y) napíšeme
=900*sqrt(v4).
Výsledná tabulka:
Popisné statistiky (Tabulka16)
Proměnná N platných Průměr Rozptyl NProm E(Y) sqrtD(Y)
X 10 11,90000 1,433333 1,29 35710 1022,2035
Příklad k samostatnému řešení: Náhodná veličina X udává počet ok při hodu kostkou.
Pomocí systému STATISTICA vypočtěte její střední hodnotu a rozptyl.
Výsledek: E(X) = 3,5, D(X) = 2,9167
Výpočet koeficientu korelace diskrétních náhodných veličin
Koeficient korelace: ( ) ( )
( ) ( )21
21
21
XDXD
X,XC
X,XR = , kde
kovariance ( ) ( ) ( ) ( )∑∑∑ ∑
∞
−∞=
∞
−∞=
∞
−∞=
∞
−∞=
πππ=
211 2 x
222
x
111
x x
212121 xxxx-x,xxxX,XC
Příklad 3.: Náhodná veličina X udává roční příjem manžela (v tisících dolarů) a náhodná
veličina Y roční příjem manželky (v tisících dolarů). Je známa simultánní pravděpodobnostní
funkce π(x,y) diskrétního náhodného vektoru (X,Y):
Příjem manželkyPříjem manžela
10 20 30 40
10 0,2 0,04 0,01 0
20 0,1 0,36 0,09 0
30 0 0,05 0,1 0
40 0 0 0 0,05
Vypočtěte koeficient korelace příjmů manžela a manželky.
Řešení:
Stanovíme hodnoty marginálních pravděpodobnostních funkcí π1(x), π2(y):
Příjem manželkyPříjem manžela
10 20 30 40
π1(x)
10 0,2 0,04 0,01 0 0,25
20 0,1 0,36 0,09 0 0,55
30 0 0,05 0,1 0 0,15
40 0 0 0 0,05 0,05
π2(y) 0,3 0,45 0,2 0,05 1
Spočteme E(X) = 20, E(Y) = 20, D(X) = 60, D(Y) = 70. Dosazením do vzorce pro výpočet
kovariance zjistíme, že C(X,Y) = 49, tedy koeficient korelace R(X,Y) = 49/√60√70 = 0,76.
Postup ve STATISTICE:
Vytvoříme nový datový soubor o třech proměnných X, Y, cetnost a 16 případech. Do
proměnné X napíšeme 10, 10, 10, 10, 20, 20, 20, 20, 30, 30, 30, 30, 40 ,40 40, 40 , do
proměnné Y 4x pod sebe 10, 20, 30, 40 a do proměnné cetnost 20, 4, 1, 0, 10, 36, 9, 0, 0, 5,
10, 0, 0, 0, 0, 5.
Statistiky - Základní statistiky/tabulky – zavedeme proměnnou vah cetnost – OK - Korelační
matice – OK – 1 seznam proměnných – X, Y – OK.
Korelace (Tabulka6)
Označ. korelace jsou významné na hlad. p < ,05000
N=100 (Celé případy vynechány u ChD)
Proměnná Průměry Sm.odch. X Y
X
Y
20,00000 7,784989 1,000000 0,756086
20,00000 8,408750 0,756086 1,000000
Příklad k samostatnému řešení: Diskrétní náhodný vektor (X1,X2) má simultánní
pravděpodobnostní funkci s hodnotami π(0,-1) = c, π(0,0) = π(0,1) = π(1,-1) = π(2,-1) = 0,
π(1,0) = π(1,1) = π(2,1) = 2c, π(2,0) = 3c, π(x,y) = 0 jinak. Určete konstantu c a vypočtěte
R(X1,X2).
Výsledek: c = 0,1, R(X1,X2) = 0,42379.
Aplikace Moivreovy - Laplaceovy věty
Příklad 4.: Pravděpodobnost úspěchu při jednom pokusu je 0,3. S jakou pravděpodobností
lze tvrdit, že počet úspěchů ve 100 pokusech bude v mezích od 20 do 40?
Y100 – počet úspěchů v posloupnosti n = 100 opakovaných nezávislých pokusů,
pravděpodobnost úspěchu ϑ = 0,3, Y100 ~ Bi(100, 0,3), E(Y100) = ϑn = 30, D(Y100) =
( )ϑ−ϑ 1n = 21.
Aproximativní výpočet:
Vidíme, že podmínky dobré aproximace jsou splněny, protože
( ) 9.21,30-13,0100a
101
100
3,0
101
1
>=⋅⋅<<
( ) 9773,0
21
11
21
10
21
3040
21
30Y
21
3019
P40Y20P 100
100 =





−Φ−





Φ≈




 −
≤
−
<
−
=≤≤ ,
kde Φ(x) je distribuční funkce rozložení N(0,1).
Přesný výpočet:
( ) ( ) ( ) ( ) 978614,0194040Y19P40Y20P 100100 =Φ−Φ=≤<=≤≤ ,
kde Φ(x) je distribuční funkce rozložení Bi(100, 0,3).
Postup ve STATISTICE:
Otevřeme nový datový soubor se dvěma proměnnými a jedním případem. Nastavíme se
kurzorem na 1. sloupec.
Do Dlouhého jména první proměnné napíšeme
=INormal(10/sqrt(21);0;1)- INormal(-11/sqrt(21);0;1) OK.
(Funkce INormal(x;mu;sigma) poskytuje hodnotu distribuční funkce v bodě x normálního
rozložení se střední hodnotou mu a směrodatnou odchylkou sigma.)
Nastavíme se kurzorem na 2. sloupec. Do Dlouhého jména druhé proměnné napíšeme
=IBinom(40;0,3;100)- IBinom(19;0.3;100). (Funkce IBinom(x;p;n) poskytuje hodnotu
distribuční funkce v bodě x binomického rozložení s parametry p a n.)
1
Prom1
2
Prom2
1 0,97726318 0,97861426
Příklad k samostatnému řešení: Pravděpodobnost, že určitý typ výrobku bude mít výrobní
vadu, je 0,05. Jaká je pravděpodobnost, že ze série 1000 výrobků bude mít výrobní vadu
nejvýše 70 výrobků? (Při aproximativním výpočtu nezapomeňte na ověření podmínek dobré
aproximace.)
Výsledek: ≈0,99815, =0,9977