HEB«
Matematika IV - 8. přednáška Náhodné veličiny - základní vlastnosti a typy
Michal Bulant
Masarykova univerzita Fakulta informatiky
14. 4. 2008
=
O Náhodné veličiny
0 Typy diskrétních náhodných veličin
Q Typy spojitých náhodných veličin
• Martin Panák, Jan Slovák, Drsná matematika, e-text.
•  Karel Zvára, Josef Štěpán, Pravděpodobnost a matematická statistika, Matfyzpress, 4. vydání, 2006, 230 stran, ISBN 80-867-3271-1.
•  Marie Budíková, Štěpán Mikoláš, Pavel Osecký, Teorie pravděpodobnosti a matematická statistika (sbírka příkladů), Masarykova univerzita, 3. vydání, 2004, 117 stran, ISBN 80-210-3313-4.
•  Marie Budíková, Štěpán Mikoláš, Pavel Osecký, Popisná statistika, Masarykova univerzita, 3. vydání, 2002, 48 stran, ISBN 80-210-1831-3.
•  Marie Budíková, Tomáš Lerch, Štěpán Mikoláš, Základní statistické metody, Masarykova univerzita, 2005, 170 stran, ISBN 80-210-3886-1.
Náhodné veličiny


Na prostoru R   uvažujme nejmenší jevové pole B obsahující všechny /(-rozměrné intervaly. Množinám v B říkáme borelovske množiny (nebo také měřitelné množiny) na Rfc.
Na prostoru R   uvažujme nejmenší jevové pole B obsahující všechny /(-rozměrné intervaly. Množinám v B říkáme borelovske množiny (nebo také měřitelné množiny) na Rfc. Speciálně pro k = 1 jde o množiny, které obdržíme z intervalů konečnými průniky a nejvýše spočetnými sjednoceními.
Na prostoru Rfc uvažujme nejmenší jevové pole B obsahující všechny /(-rozměrné intervaly. Množinám v B říkáme borelovske množiny (nebo také měřitelné množiny) na Rfc. Speciálně pro k = 1 jde o množiny, které obdržíme z intervalů konečnými průniky a nejvýše spočetnými sjednoceními.
Definice			
Náhodná veličina je taková funkce X každou Borelovskou borelovsky měřitelní Množinová funkce	X na pravděpodobnostním prostoru (Q,A, P) Q -► R, že vzor X~1{B) patří do A pro množinu B G B na R (tj. X : Q -► R je tzv. 0-		
	PX(B) = PiX-1	(B))	
se nazývá rozdělen	' pravděpodobnost	náhodné veličiny X.	
Na prostoru Rfc uvažujme nejmenší jevové pole B obsahující všechny /(-rozměrné intervaly. Množinám v B říkáme borelovske množiny (nebo také měřitelné množiny) na Rfc. Speciálně pro k = 1 jde o množiny, které obdržíme z intervalů konečnými průniky a nejvýše spočetnými sjednoceními.
Definice
Náhodná veličina X na pravděpodobnostním prostoru (Q,A, P) je taková funkce X : Q —> R, že vzor X_1(ß) patří do „4 pro každou Borelovskou množinu B G B na R (tj. X : Q —> R je tzv. borelovsky měřitelná). Množinová funkce
PX{B) = P{X-\B))
se nazývá rozdělení pravděpodobnosti náhodné veličiny X. Náhodný vektor (Xi,..., X/c) na (Q, ^4, P) je /c-tice náhodných veličin.
Definice náhodné veličiny zajišťuje, že pro všechny
—oo < a < b < oo existuje pravděpodobnost P(a < X < b), kde
používáme stručné značení projev A = (w G Q; a < X{uo) < b)).
Definice				
Distribuční funkcí	(distribution	, cumulative		density function)
náhodné veličiny X	je funkce F	:R-	^Rdef	novaná pro všechny
x G R vztahem				
	F(x) =	P(X	<x).	
mmm
Definice náhodné veličiny zajišťuje, že pro všechny
—oo < a < b < oo existuje pravděpodobnost P(a < X < b), kde
používáme stručné značení projev A = (w G Q; a < X(w) < b)).
Definice				
Distribuční funkcí náhodné veličiny X x G R vztahem	(distribution je funkce F F(x) =	, cumulative : R -^ R def P(X < x).		density function) novaná pro všechny
Distribuční funkcí náhodného vektoru (Xi, F : R^ —> R definovaná pro všechny (xi,...,				.. ,X/() je funkce Xk) G Rfc vztahem
F(x	) = P(Xi <	xi A •	•AXt	<xk).
Diskr
veličin
Předpokládejme, že náhodná veličina X na pravděpodobnostním prostoru (Q,A, P) nabývá jen konečně mnoha hodnot xi,x2, ...,x„Gl Pak existuje tzv. pravděpodobnostní funkce f(x) taková, že
f(x) =
Evidentně £? f(xf) = :
Xj)    pro x jinak.
X;
Diskr
veličin
Předpokládejme, že náhodná veličina X na pravděpodobnostním prostoru (Q,A, P) nabývá jen konečně mnoha hodnot xi,x2, ...,x„Gl Pak existuje tzv. pravděpodobnostní funkce f(x) taková, že
f(x)
Xj)    pro x jinak.
X;
Evidentně Eí f(xÔ = 1-
Takové náhodné veličině se říká diskrétní
Diskr
veličin
Předpokládejme, že náhodná veličina X na pravděpodobnostním prostoru (Q,A, P) nabývá jen konečně mnoha hodnot xi,x2, ...,x„Gl Pak existuje tzv. pravděpodobnostní funkce f(x) taková, že
f(x)
Xj)    pro x jinak.
X;
Evidentně Eí f(xÔ = 1-
Takové náhodné veličině se říká diskrétní.
Každá náhodná veličina definovaná pro klasickou pravděpodobnost
je diskrétní.
Diskr
veličin
Předpokládejme, že náhodná veličina X na pravděpodobnostním prostoru (Q,A, P) nabývá jen konečně mnoha hodnot xi,x2, ...,x„Gl Pak existuje tzv. pravděpodobnostní funkce f(x) taková, že
f(x)
Xj)    pro x jinak.
X;
Evidentně Eí f(xÔ = 1-
Takové náhodné veličině se říká diskrétní.
Každá náhodná veličina definovaná pro klasickou pravděpodobnost
je diskrétní. Obdobně lze definici pravděpodobnostní funkce rozšířit
na veličiny se spočetně mnoha hodnotami (pracujeme pak
s nekonečnými řadami)
I když hodnoty náhodné veličiny X nejsou diskrétní, můžeme postupovat podobně s užitím ideí diferenciálního a integrálního počtu. Intuitivně lze uvažovat takto: hustotu f(x) pravděpodobnosti pro X si představíme jako
P(x < X < x + dx) = f{x)dx.
Spoji
eličiny
I když hodnoty náhodné veličiny X nejsou diskrétní, můžeme postupovat podobně s užitím ideí diferenciálního a integrálního počtu. Intuitivně lze uvažovat takto: hustotu f(x) pravděpodobnosti pro X si představíme jako
P(x < X < x + dx) = f{x)dx.
To znamená, že chceme pro —oo < a < b < oo
P(a < X < b) =  í   f(x)dx.
(*)
Spoji
eličiny
I když hodnoty náhodné veličiny X nejsou diskrétní, můžeme postupovat podobně s užitím ideí diferenciálního a integrálního počtu. Intuitivně lze uvažovat takto: hustotu f(x) pravděpodobnosti pro X si představíme jako
P(x < X < x + dx) = f{x)dx.
To znamená, že chceme pro —oo < a < b < oo
P(a < X < b) =  í   f(x)dx.
(*)
Definice
Náhodná veličina X, pro kterou existuje její hustota pravděpodobnosti splňující (*), se nazývá spojitá.
Typy diskrétních
ooooooo
ční fúrii
Necht X je náhodná veličina, F(x) je její distribuční funkce. O F je neklesající.
O F je zprava spojitá, limx^_oo = 0 a limx^oo = 1. O Je-li X diskrétní s hodnotami xi,..., xn, pak je F(x) po částech konstantní, F(x) = J2x<x Pfó = x,) a F(x) = 1 kdykoliv x > xn.
Q Je-li X spojitá, pak je F(x) diferencovatelná a její derivace se rovná hustotě X, tj. platí F'{x) = f{x).
Distribu«
o
□           gp            -            =            -E-O^O
Obdobně definujeme distribuční funkce a hustotu a pravděpodobnostní funkci pro spojité a diskrétní náhodné vektory. Hovoříme také o simultánních pravděpodobnostních funkcích a hustotách.
Obdobně definujeme distribuční funkce a hustotu a pravděpodobnostní funkci pro spojité a diskrétní náhodné vektory. Hovoříme také o simultánních pravděpodobnostních funkcích a hustotách.
Pro dvě proměnné (vektor (X, Y) náhodných veličin):
r,       x       ÍP(X=XiAY = yi)    x=XiAy = y; 10                                   jinak.
u diskrétních a pro všechny a, b G M pro spojité:
P(-oo <X < b, -oc < Y < b) =  f      f     f (x, y)dxdy.
J—oo J — oo
Obdobně definujeme distribuční funkce a hustotu a pravděpodobnostní funkci pro spojité a diskrétní náhodné vektory. Hovoříme také o simultánních pravděpodobnostních funkcích a hustotách.
Pro dvě proměnné (vektor (X, Y) náhodných veličin):
r,       x       ÍP(X=XiAY = yi)    x=XiAy = y; 10                                   jinak.
u diskrétních a pro všechny a, b G M pro spojité:
P(-oo <X < b, -oc < Y < b) =  f      f     f (x, y)dxdy.
J—oo J — oo
Marginální rozložení pro jednu z proměnných obdržíme tak, že přes ostatní posčítáme nebo zintegrujeme.
Obdobně definujeme distribuční funkce a hustotu a pravděpodobnostní funkci pro spojité a diskrétní náhodné vektory. Hovoříme také o simultánních pravděpodobnostních funkcích a hustotách.
Pro dvě proměnné (vektor (X, Y) náhodných veličin):
r,       x       ÍP(X=XiAY = yi)    x=XiAy = y; 10                                   jinak.
u diskrétních a pro všechny a, b G M pro spojité:
P(-oo <X < b, -oc < Y < b) =  f      f     f (x, y)dxdy.
J—oo J — oo
Marginální rozložení pro jednu z proměnných obdržíme tak, že přes ostatní posčítáme nebo zintegrujeme. Náhodné veličiny X a Y jsou stochasticky nezávislé, jestliže je jejich simultánní distribuční funkce
F{x,y) = G{x)H{y)
kde F a G jsou distribuční funkce veličin X a Y.
Typy diskret
ooooooo
Typy diskrétních náhodných veličin

□          S           ~           =          ■€.      -o<\(y
Alternativní rozdělení popisuje pokus se dvěma možnými výsledky, často nazývanýni zdar, resp. nezdar. Náhodná veličina X ~ A{p) nabývá hodnoty 1 {zdar) s pravděpodobností p. Distribuční a pravděpodobnostní funkce jsou tedy tvaru:
Fx(t)
0          ř<0		p          ř = l
1-p    0< t<1	6c(ŕ) =	jl-p    í = 0.
1          ŕ> 1		[O          jinak
Alternativní rozdělení popisuje pokus se dvěma možnými výsledky, často nazývanýni zdar, resp. nezdar. Náhodná veličina X ~ A{p) nabývá hodnoty 1 {zdar) s pravděpodobností p. Distribuční a pravděpodobnostní funkce jsou tedy tvaru:
Fx(t)
0          ř<0		p          ř = l
1-p    0< t<1	6c(ŕ) =	jl-p    í=0
1          ŕ> 1		[O          jinak
Binomické rozdělení Bi(n,p) odpovídá n-krát nezávisle opakovanému pokusu popsanému alternativním rozdělením, přičemž naše náhodná veličina měří počet zdarů. Je tedy
fx(t)
^(l-p)1-*    t G {0,1,..., n} jinak
Na obrázku jsou pravděpodobnostní funkce pro Bi(50,0.2), Bi(50,0.5) a Bi(50, 0.9). Rozdělení pravděpodobnosti dobře odpovídá intuici, že nejvíce výsledků bude blízko u hodnoty np:
S binomickým rozdělením se potkáváme velice často v praktických úlohách. Jednou z nich je popis náhodné veličiny, která popisuje počet X předmětů v jedné zvolené přihrádek z n možných, do nichž jsme náhodně rozdělili r předmětů. Umístění kteréhokoliv předmětu do pevně zvolené přihrádky má pravděpodobnost 1/n (každá z nich je stejně pravděpodobná). Zjevně tedy bude pro jakýkoliv počet k = 0,..., r
jde proto o rozložení X typu Bi(r, 1/n).
Jestliže nám bude vzrůstat počet přihrádek n společně s počtem předmětů rn tak, že v průměru nám na každou přihrádku bude připadat (přibližně) stejný počet prvků A, můžeme dobře vyjádřit chování našeho rozdělení veličin Xn při limitním přechodu n —> oo.
isonovo rozdě
Jestliže nám bude vzrůstat počet přihrádek n společně s počtem předmětů rn tak, že v průměru nám na každou přihrádku bude připadat (přibližně) stejný počet prvků A, můžeme dobře vyjádřit chování našeho rozdělení veličin Xn při limitním přechodu n —> oo. Takovéto chování popisuje např. fyzikální soustavy s velikým počtem molekul plynu. Standardní úpravy vedou při lim^oo rn/n = A k výsledku:
lim  P(Xn = k)
k rn(rn
lim
n—>oo
lim
n—>oo
— hm
k!   n—>oo
rn\ (n - If"-
nrn
l)...(r„
k+ 1)1
(n-iy
k\
1 +
k\
protože obecně funkce (1 + x/n)n konvergují stejnoměrně k funkci ex na každém omezeném intervalu v R.
Poissonovo rozdělení popisuje náhodné veličiny s pravděpodobnostní funkcí
10             jinak.
Jak jsme odvodili výše, toto diskrétní rozdělení (rozložené do nekonečně mnoha bodů) dobře aproximuje binomická rozdělení Bi(n, X/n) pro konstantní A > 0 a veliká n.
Poiss'
iní Po(A)
Poissonovo rozdělení popisuje náhodné veličiny s pravděpodobnostní funkcí
6c(r)
k\
0
ÍGN
jinak.
Jak jsme odvodili výše, toto diskrétní rozdělení (rozložené do nekonečně mnoha bodů) dobře aproximuje binomická rozdělení Bi(n, X/n) pro konstantní A > 0 a veliká n. Snadno ověříme
A*
EM*) = £^-A='-A£
k=0
k\
-A+A
1.
Dobře modeluje výskyt jevů:
•  s očekávanou konstantní hustotou na jednotku objemu - např. bakterie ve vzorku (popis očekávaného výskytu k bakterií při rozdělení vzorku na n stejných částí)
•  rozdělení událostí, které se vyskytují náhodně v čase a bez závislosti na předchozí historii - v praxi jsou takové procesy často spojeny s poruchovostí strujů a zařízení
Geometrické rozdělení má náhodná veličina X ~ Ge(p), která udává celkový počet nezdarů, které v posloupnosti opakovaných pokusů předcházejí prvnímu zdaru, přičemž pravděpodobnost úspěchu v každém pokusu je rovna p .
wmm
Geometrické rozdělení má náhodná veličina X ~ Ge(p), která udává celkový počet nezdarů, které v posloupnosti opakovaných pokusů předcházejí prvnímu zdaru, přičemž pravděpodobnost úspěchu v každém pokusu je rovna p .
fx(t)
(1-pY-P    pro t = 0,1,
0
jinak.
wmm
Geometrické rozdělení má náhodná veličina X ~ Ge(p), která udává celkový počet nezdarů, které v posloupnosti opakovaných pokusů předcházejí prvnímu zdaru, přičemž pravděpodobnost úspěchu v každém pokusu je rovna p .
fx(t)
(1-pY-P    pro t = 0,1,
0
jinak.
Hypergeometrické rozdělení. Mějme N předmětů, z nichž právě M má danou vlastnost. Z těchto N předmětů náhodně vybereme n předmětů bez vracení. Náhodná veličina X ~ Hg(/V, M, n) udává počet vybraných prvků s danou vlastností. Zřejmě tato náhodná velišina může nabývat pouze celočíselných hodnot z intervalu [max{0, M — N + n}, min{n, M}]. Pro t z tohoto intervalu pak
fx(t)
CľHtľ)
Typy diskrel
ooooooo
Typy spojitých náhodných veličin
□       s
Rovnoměrné spojité rozdělení Rs(a, b) je nejjednoduším příkladem spojitého rozdělení. Ilustruje, že při jednoduše formulovaném požadavku na chování rozdělení nám nezbude moc prostoru pro jeho definici. Nyní chceme, aby pravděpodobnost každé hodnoty v předem daném intervalu (a, í))cM byla stejná, tj. hustota fx našeho rozdělení náhodné veličiny X má být konstantní. Pak ovšem jsou pro libovolná reálná čísla —oo < a < b < oo jen jediné možné hodnoty
{0        ř< a                                   (O        t < a
T±-a    tE(a,b)         Fx(ř)=     B    te(a,b)
0        t>b,                          (l        t>b.
Exponenciální rozdělení ex(A) je dalším rozdělením, které je snadno určeno požadovanými vlastnostmi náhodné veličiny. Předpokládejme, že sledujeme náhodný jev, jehož výskyty v nepřekrývajících se časových intervalech jsou nezávislé. Je-li tedy P(t) pravděpodobnost, že jev nenastane během intervalu délky ř, pak nutně P(t + s) = P(t)P(s) pro všechna ŕ, s > 0.
Exponenciální rozdělení ex(A) je dalším rozdělením, které je snadno určeno požadovanými vlastnostmi náhodné veličiny. Předpokládejme, že sledujeme náhodný jev, jehož výskyty v nepřekrývajících se časových intervalech jsou nezávislé. Je-li tedy P(r) pravděpodobnost, že jev nenastane během intervalu délky ř, pak nutně P(t + s) = P(t)P(s) pro všechna ŕ, s > 0. Předpokládejme navíc diferencovatelnost funkce P a P(0) = 1. Pak jistě In P{t + s) = In P(ŕ) + In P{s), takže limitním přechodem
lim
In P(ŕ + s)-In P(r)
(InP)V(O).
Označme si spočtenou derivaci zprava v nule jako —A G M. Pak tedy pro P(ř) platí In P(ř) = —Ař + C a počáteční podmínka dává jediné řešení
-At
P(ŕ) = e Všimněme si, že z definice našich objektů vyplývá, že A > 0.
Nyní uvažme náhodnou veličinu X udávající (náhodný) okamžik, kdy náš jev poprvé nastane. Zřejmě tedy je distribuční funkce rozdělení pro X dána
-At
Fx(t)
P(t)
r>0 ř<0.
Je vidět, že skutečně jde rostoucí funkci s hodnotami mezi nulou a
jedničkou a správnými limitami v ±00.
Hustotu tohoto rozdělení dostaneme derivováním distribuční
funkce, tj.
ÍAe"At    ř>0 >x
0
ř<0.
Jde o nejdůležitější rozdělení. Uveďme nejprve motivaci pro jeho zavedení.
Norm
Jde o nejdůležitější rozdělení. Uveďme nejprve motivaci pro jeho
zavedení.
Pokud budeme v binomickém rozdělení Bi(n, p) zvyšovat n při
zachování úspěšnosti p, bude mít pravděpodobnostní funkce pořád
přibližně stejný tvar.
Bi(500,0.5)
Bi(5000,0.5)
graf funkce e x I2
□       o
1      -Oao
Vzhledem k uvedené motivaci se nabízí hledat vhodné spojité rozdělení, které by mělo hustotu danou nějakou obdobnou funkcí. Protože je e_x '2 vždy kladná funkce, potřebovali bychom spočíst J  e_x /2 dx což není pomocí elementárních funkcí možné. Je však možné (i když ne úplně snadné) ověřit, že příslušný nevlastní integrál konverguje k hodnotě
/oo                                    ___
e"x2/2 dx = VŤ^. -oo
Odtud vyplývá, že možná hustota rozdělení náhodného rozdělení může být
6c(x) = ^e-*2/2.
V2-7T
Rozdělení s touto hustotou se nazývá normální rozdělení N(0,1).
Příslušnou distribuční funkci
Fx(x) =   ľ   e"x2/2 dx
J—oo
nelze vyjádřit pomocí elementárních funkcí, přesto se s ní
numericky běžně počítá (pomocí tabulek nebo softwarových
aplikací).
Hustotě fx se také často říká Gaussova křivka.
Příslušnou distribuční funkci
Fx(x) =   ľ   e"x2/2 dx
J—oo
nelze vyjádřit pomocí elementárních funkcí, přesto se s ní
numericky běžně počítá (pomocí tabulek nebo softwarových
aplikací).
Hustotě fx se také často říká Gaussova křivka.
Abychom uměli pořádněji sformulovat asymptotickou blízkost
normáního a binomického rozdělení pro n —> oo, musíme si vytvořit
další nástroje pro práci s náhodnými veličinami. Budeme k tomu
používat funkce dvojím různým způsobem.
Příklad                                                                                                '					
Nechť veličina	náhodná veličina X	má rovnoměrné		rozdělení	na
intervalu (0, r)	Určete distribuční	Funkci	a hustotu		
pravděpodobnosti rozdělení objemu koule			o poloměru X.		
Příklad
Nechť veličina náhodná veličina X má rovnoměrné rozdělení na intervalu (0, r). Určete distribuční funkci a hustotu pravděpodobnosti rozdělení objemu koule o poloměru X.
Řešení				
Určeme nejprve distribuční funkci F (pro 0 < d < f 7rr3)				
F(d) = P	^vrX3 < d 3	= P	X < \  — ~   V  47T	3/3ČŽ" V    4-7T
				f
celkem í 0                  pro   x < 0				
F(x) = l   ^x3    pro    0 < x < fvrr3				
[    1                            pro     X >  |7Tf3				
Derivováním pak obdržíme hustotu pravděpodobnosti.