Literatura Střední hodnota, rozptyl a kvantilová funkce Kovariance Momentová funkce
Matematika III – 10. týden
Číselné charakteristiky – střední hodnota, rozptyl,
kovariance, korelace, momenty
Jan Slovák
Masarykova univerzita
Fakulta informatiky
23.–27. 11. 2015
Literatura Střední hodnota, rozptyl a kvantilová funkce Kovariance Momentová funkce
Obsah přednášky
1 Literatura
2 Střední hodnota, rozptyl a kvantilová funkce
3 Kovariance
4 Momentová funkce
Literatura Střední hodnota, rozptyl a kvantilová funkce Kovariance Momentová funkce
Kde je dobré číst?
Karel Zvára, Josef Štěpán, Pravděpodobnost a matematická
pravděpodobnost statistika, Matfyzpress, 2006, 230pp.
J. Slovák, M. Panák, M. Bulant, Matematika drsně a svižně,
Muni Press, Brno 2013, v+773 s., elektronická edice
www.math.muni.cz/Matematika_drsne_svizne
Marie Budíková, Štěpán Mikoláš, Pavel Osecký, Teorie
pravděpodobnosti a matematická statistika (sbírka příkladů),
Masarykova univerzita, 3. vydání, 2004, 117 stran, ISBN
80-210-3313-4.
Marie Budíková, Tomáš Lerch, Štěpán Mikoláš, Základní
statistické metody, Masarykova univerzita, 2005, 170 stran,
ISBN 80-210-3886-1.
Riley, K.F., Hobson, M.P., Bence, S.J. Mathematical Methods
for Physics and Engineering, second edition, Cambridge
University Press, Cambridge 2004, ISBN 0 521 89067 5, xxiii
+ 1232 pp.
Literatura Střední hodnota, rozptyl a kvantilová funkce Kovariance Momentová funkce
Střední hodnota
Nechť X je náhodná veličina s diskrétním rozdělením. Jestliže řada
∞
k=1 xi P(X = xi ) konverguje absolutně (zejména tedy pro
všechny X s konečně mnoha možnými hodnotami xi ), pak její
součet E X nazýváme střední hodnotou X.
Je-li X náhodná veličina se spojitým rozdělením s hustotou f (x) a
nevlastní integrál
∞
−∞ xf (x)dx konverguje absolutně, pak jeho
hodnota E X se nazývá střední hodnota X.
Je tedy E X = np, je-li X ∼ Bi(n, p), zatímco pro rovnoměrné
rozdělení na intervalu (a, b) dostaneme dle očekávání
E X =
b
a
x
b − a
dx =
1
2
b2 − a2
b − a
=
1
2
(a + b).
Literatura Střední hodnota, rozptyl a kvantilová funkce Kovariance Momentová funkce
Vlastnosti střední hodnoty
Theorem
Uvažme náhodné veličiny X, Y , skaláry a, b ∈ R, náhodný vektor
W = (X1, . . . , Xn) a čtvercovou skalární matici B s n řádky.
Pro konstantní náhodnou veličinu X = a ∈ R je E a = a.
E(a + bX) = a + b E X.
E(X + Y ) = E X + E Y .
E(a + BW ) = a + B(E W ).
Theorem
Jsou-li veličiny X a Y nezávislé, pak E(XY ) = E X E Y .
Literatura Střední hodnota, rozptyl a kvantilová funkce Kovariance Momentová funkce
Rozptyl
Další charakteristika popisuje, jak moc se dá čekat, že se hodnoty
náhodné veličiny „hemží“ kolem nějaké hodnoty.
Deﬁnition
Nechť X je náhodná veličina s konečnou střední hodnotou. Pak
deﬁnujeme rozptyl veličiny X výrazem
var X = E(X − E X)2
,
pokud taková konečná hodnota existuje.
Odmocnina z rozptylu
√
var X se nazývá směrodatná odchylka
náhodné veličiny X.
Jde o zjevnou obdobu deﬁnice kvadrátu vzdálenosti vektorů nebo
funkcí. Zachycujeme tak „očekávanou vzdálenost“ hodnot X od její
střední hodnoty.
Literatura Střední hodnota, rozptyl a kvantilová funkce Kovariance Momentová funkce
Theorem
Jestliže má náhodná veličina X konečný rozptyl, pro libovolné
skaláry a, b ∈ R platí
var X = E X2 − (E X)2
var(a + bX) = b2 var X
var(a + bX) = |b|
√
var X.
Občas přiřazujeme k X normovanou veličinu Z,
Z =
X − E X
√
var X
,
která má zjevně nulovou střední hodnotu a jednotkový rozptyl.
Literatura Střední hodnota, rozptyl a kvantilová funkce Kovariance Momentová funkce
Normální rozdělení Z má hustotu ϕ(z) = 1√
2π
e−z2/2 distribuční
funkci Φ(z) =
z
−∞ ϕ(t)dt =
z
−∞
1√
2π
e−z2/2dt.
Náhodná veličina Y = µ + σZ, µ, σ ∈ R, σ > 0 má distribuční
funkci
FY (y) =
y−µ
σ
−∞
1
√
2π
e−z2/2
dz
{substituce x = µ + σz}
=
y
−∞
1
√
2πσ
exp −
(x − µ)2
2σ2
dx
Takové rozdělení je normální, píšeme Y ∼ N(µ, σ2).
Parametry odpovídají střední hodnotě a rozptylu.
Literatura Střední hodnota, rozptyl a kvantilová funkce Kovariance Momentová funkce
Uvažme Z ∼ N(0, 1) a podívejme se na náhodnou veličinu X = Z2.
FX (x) = P[Z2
< x]
=
√
x
−
√
x
1
√
2π
e−z2/2
dz
=
x
0
1
√
2π
t−1/2
e−t/2
dt
s hustotou
fX (x) =
1
√
2π
t−1/2
e−t/2
.
Říkáme mu rozdělení χ2, píšeme X ∼ χ2(1).
Literatura Střední hodnota, rozptyl a kvantilová funkce Kovariance Momentová funkce
kvantilová funkce
Je-li F(x) distibuční funkce náhodné veličiny X, pak
F−1
(u) = inf{x ∈ R; F(x) ≥ u}, 0 < u < 1
je kvantilová funkce náhodné veličiny X.
Hodnota F−1(α) se nazývá α-kvantil.
Tzv. kritické hodnoty pro veličinu X jsou pak F−1(1 − α).
Literatura Střední hodnota, rozptyl a kvantilová funkce Kovariance Momentová funkce
Čebyševova nerovnost
Theorem
Má-li X rozptyl a > 0 je libovolné, pak platí
P(|X − E X| ≥ ) ≤
var X
2
.
Literatura Střední hodnota, rozptyl a kvantilová funkce Kovariance Momentová funkce
Kovariance veličin
Jsou-li X a Y dvě náhodné veličiny, pro které existují jejich konečné
royptyly, pak deﬁnijeme jejich kovarianci vztahem
cov(X, Y ) = E(X − E X)(Y − E Y ).
Evidentně je cov(X, X) = var X a cov(X, Y ) = cov(Y , X).
Theorem
Nechť existují konečné rozptyly veličin X a Y . Pak
cov(X, Y ) = E(XY ) − (E X)(E Y )
pro jakékoliv skaláry a, b, c, d platí
cov(a + bX, c + dY ) = bd cov(X, Y )
var(X + Y ) = var X + var Y + 2 cov(X, Y ).
Literatura Střední hodnota, rozptyl a kvantilová funkce Kovariance Momentová funkce
Od kovariance snadno odvodíme tzv. korelační koeﬁcient dvou
náhodných veličin X a Y . Deﬁnujeme jej jako kovarianci
příslušných normovaných veličin:
ρX,Y = cov
X − E X
√
var X
,
Y − E Y
√
var Y
=
cov(X, Y )
√
var X varY
.
Theorem
ρa+bX,c+dY = sign(bd)ρX,Y , pro bd = 0
ρX,X = 1
ρX,Y = 0, pokud jsou veličiny X a Y nezávislé.
pokud je ρX,Y deﬁnován, pak je v absolutní hodnotě roven
jedné právě, když existují konstanty a, b, c tak, že
P(aX + bY = c) = 1.
Literatura Střední hodnota, rozptyl a kvantilová funkce Kovariance Momentová funkce
Varianční matice
Uvažme náhodný vektor W = (X1, . . . , Xn) takový, že pro všechny
jeho komponenty existuje rozptyl. Pak varianční matice var W je
dána
var W =




var X1 cov(X1, X2) . . . cov(X1, Xn)
cov(X2, X1) var X2 . . . cov(X2, Xn)
. . .
cov(Xn, X1) cov(Xn, X2) . . . var Xn



 .
Theorem
Pro náhodný vektor X, skaláry a, matice skalárů B platí
var(a + BX) = B var XBT
.
Literatura Střední hodnota, rozptyl a kvantilová funkce Kovariance Momentová funkce
Momenty
Podobně jako rozptyl můžeme uvažovat výrazy vyšších řádů:
µk = E Xk
, µk = E(X − E X)k
.
Nazýváme je k-tý moment a k-tý centrální moment náhodné
veličiny X. Momenty lze všechny dostat jako koeﬁcienty v
mocninné řadě následujícím způsobem.
Pro volný reálný parametr t deﬁnujeme momentovou vytvořující
funkci pro náhodnou veličinu X vztahem
MX (t) = E etX
.
Tato funkce (za docela rozumných předpokladů následující věty)
zcela určuje náhodné veličiny a má řadu užitečných vlastností (tj.
stejná momentová funkce na nějakém netriviálním intervalu =⇒
stejná distribuční funkce).
Literatura Střední hodnota, rozptyl a kvantilová funkce Kovariance Momentová funkce
Theorem
Nechť X je náhodná veličina pro kterou na intervalu (−a, a)
existuje její analytická momentová vytvořující funkce. Pak na tomto
intervalu je MX (t) dána absolutně konvergující řadou
Mt(X) =
∞
k=0
tk
k!
E Xk
.
Theorem
Pro součet náhodných veličin platí:
MX+Y (t) = MX (t)MY (t).
Literatura Střední hodnota, rozptyl a kvantilová funkce Kovariance Momentová funkce
Momentová vytvořující funkce pro X ∼ Bi(0, 1)
Často je jednodušší počítat momenty z jejich vytvořující funkce než
přímo.
Pro alternativní rozdělení náhodné veličiny Y ∼ A(p) spočteme
snadno
MY (t) = E etY
= e0
(1 − p) + et
p = p(et
− 1) + 1.
Protože je binomické rozdělení X ∼ Bi(n, p) dáno jako součet n
alternativních rozdělení Yi ∼ A(p), je zjevně v tomto případě
M(t) = MX (t) = (p(et
− 1) + 1)n
.
Obecně platí µk = dk
dtk MX (t)|t=0. Je tedy např. první moment
binomického rozdělení skutečně np (první derivace M(t) v nule),
což je střední hodnota. Druhý moment je np(1 − p), čímž jsme
ověřili výsledek pro rozptyl.
Literatura Střední hodnota, rozptyl a kvantilová funkce Kovariance Momentová funkce
Momentová vytvořující funkce pro Z ∼ N(0, 1)
MZ (t) =
∞
−∞
etx 1
√
2π
exp(−x2
/2)dx
=
∞
−∞
1
√
2π
exp −
x2 − 2tx + t2 − t2
2
dx
= exp(t2
/2)
∞
−∞
1
√
2π
exp −
(x − t)2
2
dx
= exp(t2
/2).
(V předposledním řádku je integrálem dána pravděpodobnost
jakékoliv hodnoty pro normální rozdělení, proto je to jednička.)
Derivováním: (MZ ) (0) = 0 a (MZ ) (0) = (tet2/2) (0) = 1. Je tedy
skutečně
E Z = 0, var Z = 1.