Rozložení transformované diskrétní náhodné veličiny 11.1. Motivace: Máme náhodnou veličinu X s distribuční funkcí O(x) (resp. pravděpodobnostní funkcí 7i(x) v diskrétním případě resp. hustotou (p(x) ve spojitém případě) a borelovskou funkci g: R —> R. Zavedeme transformovanou náhodnou veličinu Y = g(X) a hledáme její distribuční funkci 0*(y) (resp. pravděpodobnostní funkcí 7i*(y) v diskrétním případě resp. hustotu (p*(y) ve spojitém případě). 11.2. Věta: Nechť X je diskrétní náhodná veličina s pravděpodobnostní funkcí 7i(x) a g je borelovská ryze monotónní funkce, tedy v oblasti C c R existuje inverzní funkce g"1 = x. Pak pravděpodobnostní funkce 7i*(y) transformované náhodné veli-činy Y = g(X) má tvar: 7i*(y) = Mx(y))proy e C Oj inak Důkaz: 7i.(y) = p(y = y) = P(g(x) = y) = p(x = g"1^ P(x = x(y)) = n(x(y)) pro yeC, ;r*(y) = 0 jinak. 11.3. Příklad: X ~ te(x), Y = a + bX, 7i*(y) = ? Řešení: a)b^0: 7tí(y)=P(Y = y)=P(a + bX = y)=P b)b = 0:Y = a^ Y~Dg(a) X = y-a = 71 'y-a^ Rozložení transformované spojité náhodné veličiny 11.4. Věta: Nechť X je spojitá náhodná veličina s hustotou q>(x) a g je borelovská ryze monotónní funkce se spojitou a nenulovou derivací v R, tedy v oblasti CcR existuje inverzní funkce g"1 = x se spojitou a nenulovou derivací. Pak hustota (P*(y) transformované náhodné veličiny Y = g(X) má tvar: / \ í
(\ prv^ ^ p/ íyW ^ ÍP(X 0, (p*(y) = 0 jinak
Y má x rozložení s jedním stupněm volnosti, píšeme Y ~ % (1).
cp(x,k) =
1
k/2
T(k/2) 0
. ^2-1.^/2 x>0
fi\
r
= V7T
jinak
\^J
Rozložení transformovaného náhodného vektoru
11.8. Věta (transformace náhodného vektoru X = (Xi, ..., Xn) na skalární náhodnou veličinu Y = g(Xi, ..., Xn)) a) Diskrétní případ: X = (Xi, ..., Xn) ~ 7i(xi, ..., xn), g: Rn —> R je borelovská funkce Y = g(xi, ...,Xn)~7t*(yi, ...,yn)= J] ...£7i(x1,...,xn),kde
(x,,...xn)eS(y)
s(y)=|(xlv..,x1)£R';g(xl,.,x1)=yl____________________
b) Spojitý případ: X = (Xt, ..., Xn) ~ cp (xt, ..., xn), g: Rn —> R je borelovská funkce
Y = g(xi, ...,xn)~
00 00
Y = Xi + X2 ~ (p*(y) = J^feiK^-x^^ J(p1(y-x2>2(x2>lx2
—00 —00
(p*(y) se nazývá konvoluce funkcí (pi(xi), (p2(x2).
Príklad
11.10. Příklad: Xi, X2 jsou stochasticky nezávislé náhodné veličiny, Xi ~ Po(Ä,i), i = 1, 2, Y = Xi + X2, rc*(y) = ? Řešení:
*í&í)=
^•Xl -1.
——e ' proXj =0,1.
Xj! [O jinak
00 y
n.(y)= X7Ii(xi)I2^-x1)=|x1 >0,y-X! >0^0 7i(x) = 7(1 + 2 + 3 + 4 + 5 + 6)= ^ = 3,5. 6 2
x=l
12.10. Příklad b):
Rozložení náhodné veličiny X je dáno hustotou (p(x) Vypočtěte její střední hodnotu.
= 2x+2 na (—1, 0) a nulovou jinde.
Řešení
u
E\X) = \x(p(x)dx= \x\2x + 2)dx =
2— + X2 3
j-i
= 2_1 = _I
3 3
Střední hodnota transformované NV
12.11. Věta:
a) Diskrétní případ: Nechť X je diskrétní náhodná veličina s pravděpodobnostní funkcí n(x) (resp. (Xi.. ...Xn) je diskrétní náhodný vektor s pravde podobnostní funkcí n(x\,... .xn) ). Nechť g : B. i-> iř je borelovská funkce. Y = g(X) je transformovaná náhodná veličina (resp. g : B.71 i—> Jí je bore lovská fiinkce. Y = g(X-\..... Xn) je transformovaná náhodná veličina). Pak
, pokud součet vpravo je konečný nebo absolutné konver-
E(Y)= £ Bix)*{xt
gentní (resp. E(Y) = £
£ g(xi.... .x^ttÍx^. ....xn). pokud součet
vpravo je konečný nebo absolutně konvergentní).
a) Spojitý případ: Nechť X je spojitá náhodná veličina s hustotou {-p(x) (resp. (X]..... Xn) je spojitý náhodný vektor s hustotou tp{x\..... xn) ). Nechť g : B. i—> B. je borelovská funkce, Y = g (X) je transformovaná náhodná veličina (resp. g : fí.n \-> fí. je borelovská funkce. Y = g [X i..... Xn) je transformovaná
náhodná veličina). l*ak
\E(Y) = j g(x)ip(x)dx..
nečný nebo absolútne konvergentní (resp.
oc- oo
E(Y)= j ... J g(xu...,xn)ip(xu...,xn)dx1
— oo —oc
je konečný nebo absolútne konvergentní).
pokud integrál vpravo je kn-
dxn. pokud integrál vpravo
Príklad
12.12. Příklad:
Nechť X ~ Ex(X), Y = éyX, kde y > O je konstanta. Vypočtěte E(Y).
Řešení:
_KXxprox>0 , . % . X
^í;ij .*>-j^*-x+t-
Rozptyl NV
D(X) = E([X-E(X)]2),
12.13. Definice:
Nechť (ß, A , P) je pravděpodobnostní prostor, X náhodná veličina aspoň intervalového typu definovaná na měřitelném prostoru (^, A ), která má střední hodnotu E(X).Rozptylem náhodné veličiny X rozumíme číslo| pokud střední hodnota vpravo existuje. ČísloVD(X) se nazývá směrodatná odchylka.
(Rozptyl je číslo, které charakterizuje proměnlivost realizací náhodné veličiny kolem její střední hodnoty s přihlédnutím k jejich pravděpodobnostem. Je teoretickým protějškem váženého rozptylu. Je vhodnější počítat rozptyl podle vzorce d(x)= e(x2)- [e(x)J , jak bude ukázáno později.)
12.14. Důsledek:
V diskrétním případě je rozptyl dán vzorcem
a ve spojitém případě vzorcem
D(X)= E[x-E(x)] n(x)= £xMx)-[E(x)]
2 z
d(x)= {[x-E(X)] (p(x)dx ={x>(x) dx -[e(x)]
(pokud suma či integrál vpravo absolutně konvergují).
Centrovaná a standardizovaná NV
12.15. Definice:
Transformovaná náhodná veličina X- E(X) se nazývá centrovaná náhodná veličina
"X" — FOO
Transformovaná náhodná veličina—, se nazývá standardizovaná náhodná veliäna.
VD(X)
12.16. Příklad: Náhodná veličina X udává počet ok při hodu kostkou. Vypočtěte její rozptyl.
-prox = l,...,65E(X) = 3,5(vizpř.12.10.), d(x)=1>2--3,52 =... = -= 2,92. [0 jinak x=1 6 12
Řešení: 7i(x)=
Kovariance a korelace NV
12,17, Definice: Kovariancí náhodných veličin Xi, X2, které mají střední hodnoty E(Xi), E(X2), rozumíme číslo C(Xi, X2) = E([Xi - E(Xi)] [X2 - E(X2)])|(pokud střední hodnoty vpravo existují).
Kovariance je číslo, které charakterizuje proměnlivost realizací náhodných veličin Xi, X2 kolem jejich středních hodnot s přihlédnutím k jejich pravděpodobnostem. Je-li kovariance kladná (záporná), pak to svědčí o existenci jistého stupně přímé (nepřímé) lineární závislosti mezi realizacemi náhodných veličin Xi, X2. Je-li kovariance nulová, pak říkáme, že náhodné veličiny Xi, X2 jsou nekorelované a znamená to, že mezi jejich realizacemi není žádný lineární vztah. Pozor -z nekorelovanosti nevyplývá stochastická nezávislost, zatímco ze stochastické nezávislosti plyne nekorelovanost. Kovariance je teoretickým protějškem vážené kovariance. Je vhodnější počítat kovarianci podle vzorce
cCx^x.^eC^x^-eCx^eCx,).
Koeficientem korelace náhodných veličin Xi, X2 rozumíme číslo 'x^ECXO X2-E(X2)^
R(Xi, X2)
r----- !—---- ,proA/D(X1)VD(X2)>0
VD(X1) VD(X2) J , pokud strední hodnoty vpravo existuji.
[0 jinak
Koeficient korelace je číslo, které charakterizuje těsnost lineární závislosti realizací náhodných veličin Xi, X2. Cím bližší je 1, tím těsnější je přímá lineární závislost čím bližší je -1, tím těsnější je nepřímá lineární závislost. Je vhodnější počítat
koeficient korelace podle vzorce
Kovariance NV
12.18. Důsledek:
V diskrétním případě je kovariance dána vzorcem
00 co _____ _____
C(X1;X2)= X Xk-E(xi)}[x2-E(X2)]7i(x1,x2)=X I^x^x^-E^MX,)
CO CO
x1=-°ox,=-°o
x1=-°ox,=-°o
a ve spojitém případě vzorcem
00 00 00 00
C(X„X2)= J j[x1-E(xi)]-[x2-E(xi)](p(x1,x2)dx1dx2 = j Jx1x29(x1,x2)dx1dx2 -E0Í,) e(X2)
Příklad
12.19. Příklad:
Náhodná veličina X udává příjem manžela (v tisících dolarů) a náhodná veličina Y příjem manželky (v tisících dolarů. Je známa simultánní pravděpodobnostní funkce ?r(x,y) diskrétního náhodného vektoru (X,Y): 71(10,10) = 0,2,7i( 10,20) = 0,04, 71(10,30) = 0,01,71(10,40) = 0,71(20,10) = 0,1, ti(20,20) = 0,36, ti(20,30) = 0,09, ti(20,40) = 0, ti(30,10) = 0, te(30,20) = 0,05, 7i(30,30) = 0,1,71(30,40) = 0, ti(40,10) = 0, ti(40,20) = 0, ti(40,30) = 0, ti(40,40) = 0,05,7i(x,y) = 0 jinak. Vypočtěte koeficient korelace příjmů manžela a manželky. Řešení: Náhodná veličina X i náhodná veličina Y nabývají hodnot 10, 20, 30, 40. Sestavíme kontingenční tabulku:
X Y
10 [2Ö] |~3Ö] |~4Ö] hi(x)J
10 $M ^04] ^ö^ |ö^öö| 0,25
20 |ö7Tö| |Ö^36] \ö$9\ |ö^öö| 0,55
30 [Ö7ÖÖ1 |öiös] |ö7Tö| |ö^öö| 0,15
40 [Ö7ÖÖ1 ^öb] [ö7öö| [Ö~Ö5] 0,05
1^2 (y)| 0,30 0,45 0,20 0,05 1,00
Spočteme
E(X) = 10.0,25+20.0,55+30.0,15+40.0,05 = 20, E(Y) = 10.0,30+20.0,45+30.0,20+40.0,05 = 20,
D(X) = 102.0,25+202.0,55+302.0,15+402.0,05 - 202 = 60, D(Y) = 102.0,30+202.0,45+302.0,20+402.0,05 - 202 = 70,
C(X,Y) = 10.10.0,20 + 10.20.0,04 + ... 40.40.0,05 -20.20 = 49,
R(X,Y) = 49/V60V70 = 0,76.
Príklad
Postup ve STATISTICE:
Vytvoříme nový datový soubor o třech proměnných X, Y, četnost a 16 případech. Do proměnné X napíšeme 10, 10, 10, 10, 20, 20, 20, 20, 30, 30, 30, 30, 40 ,40 40, 40 , do proměnné Y 4x pod sebe 10, 20, 30, 40 a do proměnné četnost 20, 4, 1, 0, 10,36,9,0,0,5, 10,0,0,0,0,5.
Statistiky - Základní statistiky/tabulky - zavedeme proměnnou vah četnost - OK - Korelační matice - OK - 1 seznam proměnných - X, Y - OK.
Proměnná Korelace (Tabulka6) Označ, korelace jsou významné na hlad. p < ,05000 N=100 (Celé případy vynechány u ChD) |
Průměry Sm.odch. X Y
X 20,00000 7,784989 1,000000 0,756086
|y 20,00000 8,408750 0,756086 1,000000
Střední hodnota a rozptyl vybraných typů rozložení NV
12.20. Poznámka: Uvedeme střední hodnoty a rozptyly vybraných typů diskrétních a spojitých rozložení:
a) X ~ DgQi) => E(X) = m D(X) = 0
b) X~A(0) =>E(X)= d,D(X)=d (1-9)
c) X~Bi(n, S) =^E(X) = n3,D(X) = n3 (1-d)
d) X~Ge(a)=>E(X)=—, D(X)- l~S
B
S'
M
Mn
ŕ
e) X ~ Hg(N,M,n) => E(X) = ^n, D(X) =
i-M
v N.
N-n
N-l
n-1
n2-l
12
f) X ~ Rd(G) => E(X) = ^—^, D(X) =
g) X ~ Po(A,) => E(X) = X, D(X) = X
h) X ~ Rs(a, b) => E(X) = i±*, D(X) = í^£
i) X~E4)^E(X)=i,D(X)=i
j) X ~ N(li, a2) => E(X) = li, D(X) = a2
k) X ~ x2(n) => E(X) = n, D(X) = 2n
1) X ~ t(n) => E(X) = 0 pro n > 2, pro n = 1 E(X) neexistuje, D(X)
n
n-2
pro n > 3, pro n = 1, 2 D(X) neexistuje
m) X ~ F(ni, n2) => E(X)
= Ul pro n2 > 3, pro n2 = 1, 2 E(X) neexistuje, D(X) = ^ ^ + Ul ^
n2 -2
ni(n2-2)2(n2-4)
pro n2> 5, pro n2 = 1,
2, 3, 4 D(X) neexistuje.
Príklad
12.21. Příklad:
V sadě 15 výrobku je 5 zmetků. Náhodně vybereme 4 výrobky. Určete střední hodnotu a rozptyl náhodné vekičiny X, která udává počet zmetků, jestliže výběr provádíme
a) bez vracení,
b) s vracením.
Řešení:
ad a) X ~ Hg(N, M, n), N = 15, M = 5, n = 4
M
Mn
E(x) = -n = -4 = - = l,3,D(x) =
V ' N 15 3 V ' N
adb)X~Bi(n, 9),n = 4, ô = —= -
' v 7 15 3
E(X) = nô = 4- = 1,3, D(X) = nô(l - d) = -
1-
M
N
N-n 4
N-l
8
(
1- — l 15
\
11 _44_ 14~63
= 0,6984
= - = 0,8 9
Príklad
Najděte medián rozložení určeného hustotou (p(x) = 1 - x/2, 0 < x < 2. Řešení: Distribuční funkce: F(x) = 0 pro x < 0, F(x) = 1 pro x > 2 a
x , 2
F {x)— íl—dt = x
o ^ Medián x0 5 je řešením rovnice F (x) = 0,5 , tedy
x -4x + 2 = 0
2 4
;e F(x) = i 4 + V16-8
proxe(0,2)
x12 —
= 2 + V2 =
3,4142
2 [0,5857
Protože 3,4142 > 2, je hledaným řešením x0 5 = 0,5857.
Príklad
Náhodná veličina má hustotu 0. Tj. střední doba životnosti je 5 let. Tvar distribuční funkce znamená, že k poruše výrobku dojde s velkou pravděpodobností velmi brzy po jeho prodeji. Jakou záruční dobu stanoví výrobce, nemá-li počet reklamovaných výrobků překročit 10%?
Řešení: Náhodná veličina X udává životnost výrobku. Hledáme takové x, aby platilo P(X