Normální rozdělení a rozděl er lí odvezen. á Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo OOOOOOOOO 000 ooooooooooo ooooooooooo Matematika IV - 11. přednáška Normální rozdělení, limitní vlastnosti, zákony velkých čísel Michal Bulant Masarykova univerzita Fakulta informatiky 4. 5. 2011 Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo ooo ooooooooooo ooooooooooo Obsah přednášky Q Normální rozdělení a rozdělení odvezená Q Limitní věty a odhady O Popisná statistika Q Náhodný vektor Q Náhodný výběr Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo ooo ooooooooooo ooooooooooo Doporučené zdroje • Martin Panák, Jan Slovák, Drsná matematika, e-text. • Karel Zvára, Josef Štěpán, Pravděpodobnost a matematická statistika, Matfyzpress, 4. vydání, 2006, 230 stran, ISBN 80-867-3271-1. • Marie Budíková, Štěpán Mikoláš, Pavel Osecký, Popisná statistika, Masarykova univerzita, 3. vydání, 2002, 48 stran, ISBN 80-210-1831-3. • Marie Budíková, Štěpán Mikoláš, Pavel Osecký, Teorie pravděpodobnosti a matematická statistika (sbírka příkladů), Masarykova univerzita, 3. vydání, 2004, 117 stran, ISBN 80-210-3313-4. Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo ooo ooooooooooo ooooooooooo Plán přednášky Q Normální rozdělení a rozdělení odvezená Q Limitní věty a odhady Q Popisná statistika Q Náhodný vektor Q Náhodný výběr Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr •oooooooo ooooooooo ooo ooooooooooo ooooooooooo Charakteristiky náhodných veličin - připomenutí • střední hodnota E(X) , Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr •oooooooo ooooooooo ooo ooooooooooo ooooooooooo Charakteristiky náhodných veličin - připomenutí • střední hodnota E(X) , • rozptyl D(X) = E([X - E(X)]2) , směrodatná odchylka Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr •oooooooo ooooooooo ooo ooooooooooo ooooooooooo Charakteristiky náhodných veličin - připomenutí » střední hodnota E(X) , • rozptyl D(X) = E([X - E(X)f) , směrodatná odchylka • kovariance C(X, Y) = E([X - E(X)][Y - E(Y)]), korelační koeficient R(X, Y) = C(X, Y)/{^X~)^D{Y)), Cauchyova nerovnost \R(X, Y)\ < 1, Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr •oooooooo ooooooooo ooo ooooooooooo ooooooooooo Charakteristiky náhodných veličin - připomenutí • střední hodnota E(X) , • rozptyl D{X) = E([X - E(X)]2) , směrodatná odchylka • kovariance C(X, Y) = E([X - E(X)][Y - E(Y)]), korelační koeficient R{X, Y) = C(X, Y)/(^D(X)^D(Y)), Cauchyova nerovnost \R(X, Y)\ < 1, • kvantily, Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr •oooooooo ooooooooo ooo ooooooooooo ooooooooooo Charakteristiky náhodných veličin - připomenutí • střední hodnota E{X) , • rozptyl D(X) = E([X - E(X)]2) , směrodatná odchylka • kovariance C(X, Y) = E([X - E(X)][Y - E(Y)]), korelační koeficient R(X, Y) = C(X, Y)/\^D(X). Cauchyova nerovnost \R(X, Y)\<1, 9 kvantily, • další momenty (obecné, centrální) - momentová vytvořující funkce Mx(t) = E(éx) Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr •oooooooo ooooooooo ooo ooooooooooo ooooooooooo Charakteristiky náhodných veličin - připomenutí • střední hodnota E{X) , • rozptyl D(X) = E([X - E(X)]2) , směrodatná odchylka • kovariance C(X, Y) = E([X - E(X)][Y - E(Y)]), korelační koeficient R(X, Y) = C(X, Y)/\^D(X). Cauchyova nerovnost \R(X, Y)\<1, 9 kvantily, • další momenty (obecné, centrální) - momentová vytvořující funkce Mx(t) = E(éx) Věta Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr •oooooooo ooooooooo ooo ooooooooooo ooooooooooo Charakteristiky náhodných veličin - připomenutí • střední hodnota E{X) , • rozptyl D(X) = E([X - E(X)]2) , směrodatná odchylka • kovariance C(X, Y) = E([X - E(X)][Y - E(Y)]), korelační koeficient R(X, Y) = C(X, Y)/\^D(X). Cauchyova nerovnost \R(X, Y)\<1, 9 kvantily, • další momenty (obecné, centrální) - momentová vytvořující funkce Mx(t) = E(éx) Věta • Pro nezávislé náhodné veličiny platí Mx+y(t) = Mx(t)My(t). Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr •oooooooo ooooooooo ooo ooooooooooo ooooooooooo Charakteristiky náhodných veličin - připomenutí • střední hodnota E{X) , • rozptyl D(X) = E([X - E(X)]2) , směrodatná odchylka • kovariance C(X, Y) = E([X - E(X)][Y - E(Y)]), korelační koeficient R(X, Y) = C(X, Y)/\^D(X). Cauchyova nerovnost \R(X, Y)\<1, 9 kvantily, • další momenty (obecné, centrální) - momentová vytvořující funkce Mx(t) = E(éx) Věta • Pro nezávislé náhodné veličiny platí Mx+y(t) = Mx(t)My(t). • r-tý obecný moment i^'r náhodné veličiny X je koeficient u ^ v rozvoji Mx do exponenciální mocninné řady (tedy např. EX = DX = ú - (mí)2;. 'o o. o- Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr •oooooooo ooooooooo ooo ooooooooooo ooooooooooo Charakteristiky náhodných veličin - připomenutí • střední hodnota E{X) , • rozptyl D(X) = E([X - E(X)]2) , směrodatná odchylka • kovariance C(X, Y) = E([X - E(X)][Y - E(Y)]), korelační koeficient R(X, Y) = C(X, Y)/\^D(X). Cauchyova nerovnost \R(X, Y)\<1, 9 kvantily, • další momenty (obecné, centrální) - momentová vytvořující funkce Mx(t) = E(éx) Věta • Pro nezávislé náhodné veličiny platí Mx+y(t) = Mx(t)My(t). • r-tý obecný moment i^'r náhodné veličiny X je koeficient u ^ v rozvoji Mx do exponenciální mocninné řady (tedy např. EX = DX = ú - (mí)2;. • Je-li Y=a+bX, pak MY{t) = eat Mx{bt). Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr o«ooooooo ooooooooo ooo ooooooooooo ooooooooooo Momenty normálního rozdělení Přímý výpočet střední hodnoty a rozptylu normovaného normálního rozdělení není triviální. S využitím momentové vytvořující funkce je ale poměrně jednoduchý. Nechť Z ~ N(0,1). Pak Poslední integrál je roven 1 díky tomu, že na místě integrované funkce je funkce s vlastnostmi hustoty. Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr OOOOOOOOO ooooooooo ooo ooooooooooo ooooooooooo Střední hodnota a rozptyl normálního rozdělení S využitím předchozího výpočtu Mz(t) = exp( y ) snadno spočítáme, že (I M'z(t) = ŕ exp M2(r) = t2exp{-) +exp Dosazením t = 0 pak dostaneme E(Z) = 0,D(Z) = 1. Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr oo«oooooo ooooooooo ooo ooooooooooo ooooooooooo Střední hodnota a rozptyl normálního rozdělení S využitím předchozího výpočtu Mz(t) = exp^yj snadno spočítáme, že MKr) = řexp(|), 2 2 A^(ŕ) = ŕ2exp(^)+exp(^). Dosazením t = 0 pak dostaneme E(Z) = 0,D(Z) = 1. Pro transformovanou náhodnou veličinu Y = /j, + aZ ~ A/(/x, a2) pak snadno odvodíme z vlastností střední hodnoty, resp. rozptylu, že E(Y) = fj,, D{Y) = a2 (což zpětně zdůvodňuje zápis A/(/x, 0 a nulová jinde (a, b > 0 jsou parametry) byla hustotou náhodné veličiny. Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr oooo»oooo ooooooooo ooo ooooooooooo ooooooooooo ľ (gamma) rozdělení r rozdělení se často používá u modelů čekání (např. v pojistné matematice je čas dožití často modelován pomocí gamma rozdělení). Příklad Určete konstantu c tak, aby funkce cxa 1e pro x > 0 a nulová jinde (a, b > 0 jsou parametry) byla hustotou náhodné veličiny. Řešení Hustota musí splňovat 1 = / cxa-1e-bxdx = Jo f°° /t\a-l 1 r ľ°° ba Jo proto c = pgy- Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooo«ooo ooooooooo ooo ooooooooooo ooooooooooo Poznámka Funkce ľ je zobecnění faktoriálu = (n — 1)! pro n G N), definované předpisem T(a) = J*0°°xa_1e_xdx. Často počítáme hodnoty této funkce s využitím vlastností r(l/2) = v^, V{a + 1) = a-V{a). Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooo«ooo ooooooooo ooo ooooooooooo ooooooooooo Poznámka Funkce ľ je zobecnění faktoriálu = (n — 1)! pro n G N), definované předpisem T(a) = J*0°°xa_1e_xdx. Často počítáme hodnoty této funkce s využitím vlastností r(l/2) = v^, V{a + 1) = a-V{a). Definice Rozdělení náhodné veličiny s hustotou f(x) T(a) spočítanou v předchozím příkladu nazýváme gamma rozdělení s parametry a, b a značíme T(a, b). □ s - ■ m Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooo«ooo ooooooooo ooo ooooooooooo ooooooooooo Poznámka Funkce ľ je zobecnění faktoriálu definované předpisem l~(a) = /0°oxa_16 hodnoty této funkce s využitím vlastností r(l/2) = v^, V{a + 1) = a-V{a). = (n-"xdx. 1)! pro n G N), Často počítáme Definice Rozdělení náhodné veličiny s hustotou ba f(x) T(a) spočítanou v předchozím příkladu nazýváme gamma rozdělení s parametry a, b a značíme T(a, b). Momentová vytvořující funkce je pak M{ť) = (bjb - t)a, střední hodnota E{X) = a/b a rozptyl D(X) = a/b2. Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr oooooo»oo ooooooooo ooo ooooooooooo ooooooooooo Příklad (rozdělení x2 podruhé) Nechť Z má normované normální rozdělení. Určete hustotu transformované náhodné veličiny X = Z2. Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr oooooo»oo ooooooooo ooo ooooooooooo ooooooooooo Příklad (rozdělení x2 podruhé) Nechť Z má normované normální rozdělení. Určete hustotu transformované náhodné veličiny X = Z2. Již dříve jsme vypočetli přímým výpočtem přes distribuční funkci, že hustota 6fW = 1 _1 _x x 2 e 2 2vr a řekli jsme si, že jde o (Pearsonovo) %2 rozdělení s jedním stupněm volnosti, které značíme X ~ X2(l)- Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr oooooo»oo ooooooooo ooo ooooooooooo ooooooooooo Příklad (rozdělení x2 podruhé) Nechť Z má normované normální rozdělení. Určete hustotu transformované náhodné veličiny X = Z2. Již dříve jsme vypočetli přímým výpočtem přes distribuční funkci, že hustota 6fW = 2vr i "2 e a řekli jsme si, že jde o (Pearsonovo) %2 rozdělení s jedním stupněm volnosti, které značíme X ~ X2(l)- Nyní vidíme, že jde o speciální případ T-rozdělení, totiž l~(l/2,1/2). Obecně pro součet Y čtverců n nezávislých náhodných veličin s rozdělením A/(0,1) obdobně odvodíme, že má rozdělení r(n/2,1/2) a říkáme, že Y má rozdělení x2(n) (chí kvadrát s n stupni volnosti). Toto rozdělení se ve statistice používá velmi často. Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooo«o ooooooooo ooo ooooooooooo ooooooooooo Další důležitá rozdělení F-rozdělení Jsou-li X, Y nezávislé náhodné veličiny s rozděleními X ~ X2(^), Y ~ X2(m)< Pak má transformovaná náhodná veličina U X/k Y/m takzvané Fisher-Snedecorovo F-rozdělení F(k, tri) s k a m stupni volnosti. Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooo«o ooooooooo ooo ooooooooooo ooooooooooo Další důležitá rozdělení F-rozdělení Jsou-li X, Y nezávislé náhodné veličiny s rozděleními X ~ X2(^), Y ~ X2(m)< Pak má transformovaná náhodná veličina U X/k Y/m takzvané Fisher-Snedecorovo F-rozdělení F(k, tri) s k a m stupni volnosti. Studentovo t-rozdělení Jsou-li Z ~ A/(0, l)aX~ X2{n) nezávislé náhodné veličiny, pak má veličina 7 T ^/Xfn tzv. Studentovo t-rozdělení ŕ(n) s n stupni volnosti. Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr 00000000» ooooooooo ooo ooooooooooo ooooooooooo Přehled rozdělení odvozených od normálního Zi,..., Zfc ~ A/(0,1) .....nezávislá normovaná normální X% = Yl^=i ~ X2(^) ■ ■ ■ ■ chĺ-kvadrát o k stupních volnosti X2 / k Fk m = v2 / ~ F(k, m) ■ ■ F-rozdělení s k a m stupni volnosti Tk = r^Yi- ~ ......t-rozdělení s k stupni volnosti Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr oooooooo* ooooooooo ooo ooooooooooo ooooooooooo Přehled rozdělení odvozených od normálního Zi,..., Zfc ~ A/(0,1) .....nezávislá normovaná normální X% = Yl^=i ~ X2(^) ■ ■ ■ ■ chĺ-kvadrát o k stupních volnosti X2 / k Fk m = v2 / ~ F(k, m) ■ ■ F-rozdělení s k a m stupni volnosti Tk = r^Yi- ~ ......t-rozdělení s k stupni volnosti Odtud zejména Z2 ~ %2(1) a Tj; ~ F(l, /c). Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr oooooooo* ooooooooo ooo ooooooooooo ooooooooooo Přehled rozdělení odvozených od normálního Zi,..., Zfc ~ A/(0,1) .....nezávislá normovaná normální X% = Yl^=i ~ X2{k) ■ ■ ■ ■ chĺ-kvadrát o k stupních volnosti X2 / k Fk m = v2 / ~ F(k, m) ■ ■ F-rozdělení s k a m stupni volnosti Tk = r^Yi- ~ t(k)......t-rozdělení s k stupni volnosti Odtud zejména Z2 ~ %2(1) a T% ~ F(l, k). rozdělení střední hodnota rozptyl x2(k) m F(k, m) (i k 0 m/(m-2) a2 2k k/(k - 2) 2m2(k + m- 2)/k(m - 2)2(m - 4) Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo ooo ooooooooooo ooooooooooo Plán přednášky Q Limitní věty a odhady Q Popisná statistika Q Náhodný vektor Q Náhodný výběr Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo «00000000 ooo ooooooooooo ooooooooooo Motivace S jedním případem limitní věty jsme se již setkali -de Moivre-Laplaceova věta říká, že binomické rozdělení Bi(n,p) lze za určitých podmínek aproximovat normovaným normálním rozdělením. Obvykle se k aproximaci přistupuje při splnění podmínek np(l — p) > 9 a < p < ^ípx■ Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr OOOOOOOOO «00000000 ooo ooooooooooo ooooooooooo Motivace S jedním případem limitní věty jsme se již setkali - de Moivre-Laplaceova věta říká, že binomické rozdělení Bi(n,p) lze za určitých podmínek aproximovat normovaným normálním rozdělením. Obvykle se k aproximaci přistupuje při splnění podmínek np(l — p) > 9 a < p < ^ípx■ V této kapitole zformulujeme zobecnění této věty a rovněž další tvrzení umožňující odhadovat chování náhodných veličin při velkém počtu nezávislých opakování náhodného pokusu. Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo o»ooooooo ooo ooooooooooo ooooooooooo Čebyševova nerovnost Věta Pro libovolné e > 0 platí , DX P(\X-EX\ >e)<^. Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo o»ooooooo ooo ooooooooooo ooooooooooo Čebyševova nerovnost Věta Pro libovolné e > 0 platí , DX P(\X-EX\ >e)<^. Důkaz. Budeme odhadovat rozptyl DX ve spojitém případě (diskrétní analogicky): (X - EX)2f(x)dx > / (X - EX)2f(x)dx > -oo j\x-ex\>e > í e2f(x) dx = e2P(\X - EX\ > e). j\x-ex\>e □ •O O. O- Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo oo«oooooo ooo ooooooooooo ooooooooooo Pomocí Čebyševovy nerovnosti můžeme odhadovat pravděpodobnost, s jakou se náhodná veličina s neznámým rozdělením odchýlí od své střední hodnoty o více než /(-násobek směrodatné odchylky (zřejmě je totiž P(\X — E(X)\ > ka) < A). Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo oo«oooooo ooo ooooooooooo ooooooooooo Pomocí Čebyševovy nerovnosti můžeme odhadovat pravděpodobnost, s jakou se náhodná veličina s neznámým rozdělením odchýlí od své střední hodnoty o více než /(-násobek směrodatné odchylky (zřejmě je totiž P(\X — E(X)\ > ka) < A). Příklad Nechť je E{X) = fi, D{X) = a2. O Odhadněte P(\X - fx\ > 3a). Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo oo«oooooo ooo ooooooooooo ooooooooooo Pomocí Čebyševovy nerovnosti můžeme odhadovat pravděpodobnost, s jakou se náhodná veličina s neznámým rozdělením odchýlí od své střední hodnoty o více než /(-násobek směrodatné odchylky (zřejmě je totiž P(\X — E(X)\ > ka) < A). ' Příklad * Nechť je E{X) = fi, D{X) = a2. O Odhadněte P(\X - fx > 3(i). Q Vypočtěte P{\X - /i\ > 3a), jestliže navíc víte, že X ~ A/(0,1). Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo ooo ooooooooooo ooooooooooo Pomocí Čebyševovy nerovnosti můžeme odhadovat pravděpodobnost, s jakou se náhodná veličina s neznámým rozdělením odchýlí od své střední hodnoty o více než /(-násobek směrodatné odchylky (zřejmě je totiž P(\X — E(X)\ > ka) < A). ' Příklad * Nechť je E{X) = fi, D{X) = a2. O Odhadněte P(\X - fx > 3(i). Q Vypočtěte P{\X - /i\ > 3a), jestliže navíc víte, že X ~ A/(0,1). Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo oo«oooooo ooo ooooooooooo ooooooooooo Pomocí Čebyševovy nerovnosti můžeme odhadovat pravděpodobnost, s jakou se náhodná veličina s neznámým rozdělením odchýlí od své střední hodnoty o více než /(-násobek směrodatné odchylky (zřejmě je totiž P(\X — E(X)\ > ka) < A). ' Příklad * Nechť je E{X) = fi, D{X) = a2. O Odhadněte P(\X - fx > 3(i). Q Vypočtěte P{\X - /i\ > 3a), jestliže navíc víte, že X ~ A/(0,1). Řešení O 1/9, 0 0,0027. Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooo«ooooo ooo ooooooooooo ooooooooooo Zákon velkých čísel Věta (Čebyševova - slabý zákon velkých čísel) Necht jsou Xi,X2,... po dvou nezávislé náhodné veličiny, které mají všechny stejnou střední hodnotu /j, a rozptyl shora ohraničený stejnou hodnotou a2. Pak pro libovolné e > 0 platí lim P n—>oo 1 " n ^—' 11 ;=i < e Říkáme, že posloupnost aritmetických průměrů konverguje podle pravděpodobnosti ke střední hodnotě jjl. Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooo«ooooo ooo ooooooooooo ooooooooooo Zákon velkých čísel Věta (Čebyševova - slabý zákon velkých čísel) Necht jsou Xi,X2,... po dvou nezávislé náhodné veličiny, které mají všechny stejnou střední hodnotu /j, a rozptyl shora ohraničený stejnou hodnotou a2. Pak pro libovolné e > 0 platí lim P n—>oo 1 " n ^—' 11 ;=i < e Říkáme, že posloupnost aritmetických průměrů konverguje podle pravděpodobnosti ke střední hodnotě [i. Speciálním případem této věty je Bernoulliova věta, která říká, že je-li Yn ~ Bi(n, p), pak posloupnost relativních četností Yn/n konverguje podle pravděpodobnosti k p. Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo oooo«oooo ooo ooooooooooo ooooooooooo Věta (Bernoulliova) Pro náhodnou veličím pro libovolné e > 0 pl '( i s binon 3tí Yn --P n niekým rozdělením Yn ~ Bi(n,p) a / nez Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo oooo«oooo ooo ooooooooooo ooooooooooo Věta (Bernoulliova) Pro náhodnou veličím pro libovolné e > 0 pl i s binon 3tí Yn --P n niekým rozdělením Yn ~ Bi(n,p) a >e)<"(17». / nez Důkaz. Plyne snadno z Čebyševovy nerovnosti, neboť E(Yn/n) = np/n = p a D(Yn/n) = np(l - p)/n2 = p(l - p)/n. □ Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooo«ooo ooo ooooooooooo ooooooooooo Příklad Při zkoušce bylo zjištěno, že mezi 600 kontrolovanými studenty je 5 studentů, kteří neumí ani malou násobilku. Odhadněte pravděpodobnost, že relativní četnost takových studentů se od jejich pravděpodobnosti výskytu liší o více než 0,01? (Můžete předpokládat, že pravděpodobnost výskytu studenta bez znalosti násobilky je menší než 0,02). Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo oooooo»oo ooo ooooooooooo ooooooooooo Centrální limitní věta Centrální limitní věta dá odpověď na otázku, proč je normální rozdělení nejdůležitějším rozdělením. Ukazuje totiž, že rozdělení součtu dostatečně velkého počtu nezávislých a stejně rozdělených náhodných veličin lze aproximovat normálním rozdělením. Necht je Y\, Y2,... posloupnost nezávislých stejně rozdělených náhodných veličin se střední hodnotou /j, a rozptylem a2. Pak pro normované náhodné veličiny platí lim P{Sn < x) = je distribuční funkce rozdělení A/(0,1). 'O0.O- Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooo«o ooo ooooooooooo ooooooooooo Příklad Mezi matematiky v ČR je jich 10% s příjmem přesahujícím celostátní průměr. Kolik matematiků je třeba pozvat na konferenci, aby s pravděpodobností aspoň 0,95 mezi nimi bylo 8 až 12 procent s nadprůměrným příjmem? Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooo«o ooo ooooooooooo ooooooooooo Příklad Mezi matematiky v ČR je jich 10% s příjmem přesahujícím celostátní průměr. Kolik matematiků je třeba pozvat na konferenci, aby s pravděpodobností aspoň 0,95 mezi nimi bylo 8 až 12 procent s nadprůměrným příjmem? V„ ~ Bi(n; 0,1), E(Y„) = 0,1 • n, D(Y„) = 0,1 • 0,9 • n. Pak 0,95 < P(0,08n < Yn < 0,12n) = p '0,08-0,1^ < yn-0,ln < 0,12-0,1 n y/ÔfiÔň -y/ň < Yn-0,ln < Vň 15 ~ ^Ô9ň ~ 15 15 j > 0,975, což je ekvivalentní y/ň/15 > 1,96, tj. n > 865. FOQ.O- Normální rozdělení a rozděle í odve ená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo 00000000» 000 OOOOOOOOOOO OOOOOOOOOOO Řešení (Pomocí Bernoulliovy nerovnosti) Nyní využijme Bernoulliovu nerovnost - ta dává Yn 0,1 n \ , 0,1-0,9 s °-02 ž 1 - tm- což má být alespoň 0,95. Odtud . 0,09 n > 0,05 • 0,022 4500. Normální rozdělení a rozděle í odve ená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo 00000000» 000 ooooooooooo ooooooooooo Řešení (Pomocí Bernoulliovy nerovnosti) Nyní využijme Bernoulliovu nerovnost - ta dává Yn 0,1 < 0,02 > 1 0,1-0,9 n-0,022' což má být alespoň 0,95. Odtud . 0,09 n > 0,05 • 0,022 4500. Vidíme, že odhad prostřednictvím Bernoulliovy nerovnosti je podstatně slabší než odhad s využitím centrální limitní věty (resp. de Moivre-Laplaceovy věty). Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo ooo ooooooooooo ooooooooooo Plán přednášky Q Limitní věty a odhady O Popisná statistika Q Náhodný vektor Q Náhodný výběr Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo »oo ooooooooooo ooooooooooo Statistika zkoumá jevy na rozsáhlých souborech případů a zkoumá statistické znaky jednotlivých statistických jednotek. Obvykle nelze testovat všechny jednotky základního souboru, proto se omezujeme na prozkoumání některého výběrového souboru rozsahu n. Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo »oo ooooooooooo ooooooooooo Statistika zkoumá jevy na rozsáhlých souborech případů a zkoumá statistické znaky jednotlivých statistických jednotek. Obvykle nelze testovat všechny jednotky základního souboru, proto se omezujeme na prozkoumání některého výběrového souboru rozsahu n. Předpokládejme, že jsme na n statistických jednotkách naměřili soubor hodnot X\,..., xn daného znaku. Znaky obvykle dělíme na kvalitativní (nominální, ordinální) a kvantitativní (intervalové, poměrové). Počtu prvků souboru říkáme rozsah. Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo omo ooooooooooo ooooooooooo Základní pojmy popisné statistiky • absolutní (relativní) četnosti, četnostní tabulka wej3o}Sji| • e>||nqei JU1SOU18D '|}sou}8D (juAjiepj) juinpsqe • Á>iiq.siq.eq.s ausíd ooooooooooo JsqÁA ÄupoL|e[\| OOOOOOOOOOO JO}>|3a ÄupoL|e[\| ooooooooo Apeijpo e a43a juq.jluj~| spzoj ju|eujJO[^j Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo omo OOOOOOOOOOO OOOOOOOOOOO Základní pojmy popisné statistiky • absolutní (relativní) četnosti, četnostní tabulka • histogram • (výběrový) průměr, geometrický, harmonický průměr Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo omo ooooooooooo ooooooooooo Základní pojmy popisné statistiky • absolutní (relativní) četnosti, četnostní tabulka • histogram • (výběrový) průměr, geometrický, harmonický průměr » medián, p-tý kvantil, percentil, kvartil Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo omo ooooooooooo ooooooooooo Základní pojmy popisné statistiky • absolutní (relativní) četnosti, četnostní tabulka • histogram • (výběrový) průměr, geometrický, harmonický průměr » medián, p-tý kvantil, percentil, kvartil • modus Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo omo ooooooooooo ooooooooooo Základní pojmy popisné statistiky • absolutní (relativní) četnosti, četnostní tabulka • histogram • (výběrový) průměr, geometrický, harmonický průměr » medián, p-tý kvantil, percentil, kvartil • modus • rozptyl s%, resp. n/(n — l)s2 Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo omo ooooooooooo ooooooooooo Základní pojmy popisné statistiky • absolutní (relativní) četnosti, četnostní tabulka • histogram • (výběrový) průměr, geometrický, harmonický průměr » medián, p-tý kvantil, percentil, kvartil • modus • rozptyl s%, resp. n/(n — l)s2 • rozpětí, kvartilové rozpětí, průměrná odchylka (od mediánu) Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo omo ooooooooooo ooooooooooo Základní pojmy popisné statistiky • absolutní (relativní) četnosti, četnostní tabulka • histogram • (výběrový) průměr, geometrický, harmonický průměr » medián, p-tý kvantil, percentil, kvartil • modus • rozptyl s2, resp. n/(n — l)s2 • rozpětí, kvartilové rozpětí, průměrná odchylka (od mediánu) • koeficient šikmosti, špičatosti Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo oo« ooooooooooo ooooooooooo Diagramy Krabicový diagram, box plot I Value > 60lh Percentile ÍOth Peraanlila 7Sth PeraanlilB - Mecian T - lílft Percenlila ■ lůth Peroanlila . Value ^iIDth Percentile □ s - ■ M Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo ooo ooooooooooo ooooooooooo Plán přednášky 9 Limitní věty a odhady Q Popisná statistika Q Náhodný vektor Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr OOOOOOOOO OOOOOOOOO OOO »0000000000 ooooooooooo Náhodný vektor - připomenutí Je-li (Q, A, P) pravděpodobnostní prostor a X\,...,Xn na něm definované náhodné veličiny s distribučními funkcemi F\,..., Fn, pak náhodným vektorem je n-tice X = (Xi,... ,X„) s distribuční funkcí definovanou vztahem Fv(xi,...,x„) = P(Xi < xi,..., X„ < xn). V tomto kontextu nazýváme F simultánní distribuční funkcí náhodného vektoru X a F; marginální distribuční funkcí náhodné veličiny X/. Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo ooo o«ooooooooo ooooooooooo Podobně jako v případě diskrétní náhodné veličiny označuje p(xi,...,x„) pravděpodobnostní funkci diskrétního náhodného vektoru X, je-li Fx(xi,... ,x„) = ■■■ Yl PÍ*1' • • •' ř")- tl ^ = Yj)i kde yi,... tvoří úplný systém jevů. 'Obvykle zapisujeme ve statistice vektory do sloupců, proto bychom spise měli psát (X, Y)T. Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr OOOOOOOOO OOOOOOOOO OOO 00*00000000 ooooooooooo Uvážíme-li diskrétní náhodný vektor 1 (X, Y), pak je vztah mezi sdruženým rozdělením vektoru (X, Y) a marginálním rozdělením proměnné X určen rovností P(X = xf) = YljZi P{X = x/> Y = yj), kde yi,... tvoří úplný systém jevů. Vztah pro spojitě rozdělený náhodný vektor je analogický. 'Obvykle zapisujeme ve statistice vektory do sloupců, proto bychom spise měli psát (X, Y)T. Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo ooo ooooooooooo ooooooooooo (stochastická) Nezávislost náhodných veličin Dříve uvedenou definici nezávislosti náhodných veličin Xi,... ,Xn pomocí vztahu P(Xi =Xl,...,Xn = xn) = P(Xi = xi) • • • P(Xn = xn) pro libovolné x\,... ,xn, tak můžeme nyní přepsat pomocí vztahu mezi sdruženou distribuční funkcí náhodného vektoru X = (Xi,... ,X„) a marginálních distribučních funkcí náhodných veličin Xi,..., X„: Fx(xi, • • •, xn) = Fxi(xi) • • • Fxn(xn). Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo ooo ooo«ooooooo ooooooooooo (stochastická) Nezávislost náhodných veličin Dříve uvedenou definici nezávislosti náhodných veličin X\,...,Xn pomocí vztahu P(Xi = xi,... ,Xn = xn) = P(Xi = xi) • • • P(Xn = xn) pro libovolné xi,... ,x„, tak můžeme nyní přepsat pomocí vztahu mezi sdruženou distribuční funkcí náhodného vektoru X = (Xi,... ,X„) a marginálních distribučních funkcí náhodných veličin Xi,..., X„: Fx{xi, ■ ■ ■, xn) = FXl(xi) • • • Fx„(xn). Příklad Házíme dvěma běžnými kostkami, jako náhodnou veličinu X označme součet bodů na obou kostkách, jako náhodnou veličinu Y absolutní hodnotu rozdílu. Určete sdružené rozdělení náhodného vektoru (X, Y), obě marginální rozdělení a odvoďte, jsou-li X a Y nezávislé. Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr OOOOOOOOO OOOOOOOOO OOO OOOOOOOOOOO OOOOOOOOOOO Číselné charakteristiky náhodných vektorů E(X) = (E(Xi),..., E(Xn)) se nazývá vektor středních hodnot, Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo ooo ooooooooooo ooooooooooo Číselné charakteristiky náhodných vektorů E(X) = (E(Xi),..., E(X„)) se nazývá vektor středních hodnot, D(Xi) C(X1,X2) ... C(Xi,X„^ var(X) ,C(Xn,Xi) C(X„,X2) ... D(Xn) varianční (rozptylová) matice a Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr OOOOOOOOO ooooooooo ooo ooooooooooo ooooooooooo Číselné charakteristiky náhodných vektorů var(X) E(X) = (E(Xi),..., E(X„)) se nazývá vektor středních hodnot, D(Xi) C(X1,X2) ... C(Xi,X„^ ,C(Xn,Xi) C(X„,X2) ... D{Xn) varianční (rozptylová) matice a 1 R(X1,X2) ■■■ /?(Xi,Xn)^ ,/?(Xn,Xi) /?(X„,X2) ••• 1 je korelační matice. corX Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr OOOOOOOOO ooooooooo ooo ooooooooooo ooooooooooo Číselné charakteristiky náhodných vektorů var(X) E(X) = (E(Xi),..., E(X„)) se nazývá vektor středních hodnot, D(Xi) C(X1,X2) ... C(Xi,X„^ ,C(Xn,Xi) C(X„,X2) ... D{Xn) varianční (rozptylová) matice a 1 R(X1,X2) ■■■ /?(Xi,Xn)^ ,/?(Xn,Xi) /?(X„,X2) ••• 1 corX je korelační matice. Snadno je po rozepsání po jednotlivých složkách vidět, že var(X) = E((X - E(X)) ■ (X - E(X)D Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo ooo ooooo«ooooo ooooooooooo Ukážeme na příkladech, že pravděpodobnostní struktura náhodného vektoru (X, Y) není určena pouze marginálními rozděleními veličin X a Y. Podstatný je rovněž pravděpodobnostní vztah mezi X a Y, který je částečně popsán např. prostřednictvím korelačního koeficientu. Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo ooo ooooo«ooooo ooooooooooo Ukážeme na příkladech, že pravděpodobnostní struktura náhodného vektoru (X, Y) není určena pouze marginálními rozděleními veličin X a Y. Podstatný je rovněž pravděpodobnostní vztah mezi X a Y, který je částečně popsán např. prostřednictvím korelačního koeficientu. ' Příklad ^ Jsou-li X a Y náhodné veličiny, nabývající hodnot 0 a 1, pak P(X = 1, Y = 1) - P(X = 1)P(V = 1) = E{XY) - E(X)E(Y) = = cov(X, Y). □ s Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo ooo ooooo«ooooo ooooooooooo Ukážeme na příkladech, že pravděpodobnostní struktura náhodného vektoru (X, Y) není určena pouze marginálními rozděleními veličin X a Y. Podstatný je rovněž pravděpodobnostní vztah mezi X a Y, který je částečně popsán např. prostřednictvím korelačního koeficientu. Příklad Jsou-li X a Y náhodné veličiny, nabývající hodnot 0 a 1, pak P(X = 1, Y = 1) - P(X = l)P{Y = 1) = E{XY)-E{X)E{Y) = = cov(X, Y). Odtud je snadno vidět, že pokud jsou X a Y nekorelované, jsou i nezávislé (což obecně neplatí). Normální rozdělení a rozděler lí odve; :ená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr OOOOOOOOO ooooooooo 000 oooooo«oooo ooooooooooo Uveďme ještě příklad, ilustrující, že nekorelovanost nemusí implikovat nezávislost: Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo ooo oooooo«oooo ooooooooooo Uveďme ještě příklad, ilustrující, že nekorelovanost nemusí implikovat nezávislost: Příklad Buďte A a X nezávislé náhodné veličiny, splňující X ~ A/(0,1) a P(A = 1) = P(A = -1) = 1/2. Položíme-li Y = AX, pak P{Y = ^(X, Y) polární souřadnice náhodného vektoru (X, Y) a určíme rozdělení vektoru (/?, ). Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo ooo ooooooo»ooo ooooooooooo Nechť (X, Y) je náhodný vektor, který má rovnoměrné rozdělení na jednotkovém kruhu K = {(x, y) : x2 + y2 < 1}. Zřejmě je hustota tohoto rozdělení rovna 1/tt pro (x, y) G K a 0 jinde a je rovněž vidět, že X, Y nejsou nezávislé. Označme R = R(X, Y) a = ^(X, Y) polární souřadnice náhodného vektoru (X, Y) a určíme rozdělení vektoru (/?, ). Pro 0 < fi < 1 a 0 < px < 2ir je Hustota je tedy rovna f{r, ip) = ^ pro 0 < r < 1, 0 < tp <2ir a rovna 0 všude jinde. P(R < ri, se nyní snadno dopočtou: /•27T g(r) = / f(r, se nyní snadno dopočtou: g(r) 2?r f(r, má rovnoměrné rozdělení na (O, 2tt), odkud E() = 7r a D(í>) = 7r2/3, snadno rovněž odvodíme E(R) = 2/3, D(R) = 1/18. Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr OOOOOOOOO OOOOOOOOO OOO OOOOOOOOÄOO OOOOOOOOOOO Příklad (pokr.) Marginální hustoty g{r) a h(ip) veličin R a se nyní snadno dopočtou: g(r) f (ľ, má rovnoměrné rozdělení na (0, 2tt), odkud E() = 7r a D(í>) = 7r2/3, snadno rovněž odvodíme = 2/3, D(/?) = 1/18. Všimněme si ale zejména, že f(r,ip) = g(r)h(ip), což znamená nezávislost veličin R a . Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo ooo ooooooooo»o ooooooooooo Vlastnosti charakteristik náhodného vektoru Věta Pro náhodné vektory X, Y stejné dimenze, konstantní matici B a konstantní vektor a (odpovídajících dimenzí) platí • E(X + Y) = E(X) + E(Y), Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr OOOOOOOOO ooooooooo ooo ooooooooooo ooooooooooo Vlastnosti charakteristik náhodného vektoru Pro náhodné vektory X, Y stejné dimenze, konstantní matici B a konstantní vektor a (odpovídajících dimenzí) platí • E(X + Y) = E(X) + E(Y), • E(a + BX) = a+ B ■ E(X), Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo ooo ooooooooo»o ooooooooooo Vlastnosti charakteristik náhodného vektoru Věta Pro náhodné vektory X, Y stejné dimenze, konstantní matici B a konstantní vektor a (odpovídajících dimenzí) platí • E(X + Y) = E(X) + E(Y), • E(a + BX) = a+ B ■ E(X), • var(a + B • X) = Bvar(X)Br . Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo ooo ooooooooo»o ooooooooooo Vlastnosti charakteristik náhodného vektoru Věta Pro náhodné vektory X, Y stejné dimenze, konstantní matici B a konstantní vektor a (odpovídajících dimenzí) platí • E(X + Y) = E(X) + E(Y), • E(a + BX) = a+ B ■ E(X), • var(a + B • X) = Bvar(X)Br . Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo ooo ooooooooo»o ooooooooooo Vlastnosti charakteristik náhodného vektoru Věta Pro náhodné vektory X, Y stejné dimenze, konstantní matici B a konstantní vektor a (odpovídajících dimenzí) platí • E(X + Y) = E(X) + E(Y), • E(a + BX) = a + B ■ E(X), • var(a + B • X) = Bvar(X)Br . [ Důkaz. Důkaz vyplývá z vlastností náhodných veličin a ze vztahu var(X) = E((X - - E(X))(X - E(X))T). □ ooooooooooo •oooooooooo 000 OOOOOOOOO OOOOOOOOO JsqÁA ÄupoL|e[\| JO}>|3A ÄupoL|e[\| e>||}S|}e}s eusjdoj Apeijpo e juq.jluj~| :sApo J l \^\^pzo^ e ju3|spzoj ju|ew.io[\| Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo ooo ooooooooooo ooooooooooo Plán přednášky Q Limitní věty a odhady Q Popisná statistika Q Náhodný vektor Q Náhodný výběr Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo ooo ooooooooooo «0000000000 Definice Náhodným výběrem rozsahu n rozumíme n-tici nezávislých a stejně rozdělených náhodných veličin X\,... ,Xn ~ Fx(x) (někdy také hovoříme o n nezávislých kopiích náhodné veličiny X). Normální rozdělení a rozděl e í odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo OOOOOOOOO 000 ooooooooooo •oooooooooo Definice Náhodným výběrem rozsahu n rozumíme n-tici nezávislých a stejně rozdělených náhodných veličin X\,... ,Xn ~ /~x(x) (někdy také hovoříme o n nezávislých kopiích náhodné veličiny X). Náhodným výběrem rozsahu n z p-rozměrného rozdělení rozumíme n-tici nezávislých a stejně rozdělených p-rozměrných náhodných vektorů. Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr OOOOOOOOO OOOOOOOOO OOO OOOOOOOOOOO «0000000000 Definice Náhodným výběrem rozsahu n rozumíme n-tici nezávislých a stejně rozdělených náhodných veličin X\,... ,Xn ~ /~x(x) (někdy také hovoříme o n nezávislých kopiích náhodné veličiny X). Náhodným výběrem rozsahu n z p-rozměrného rozdělení rozumíme n-tici nezávislých a stejně rozdělených p-rozměrných náhodných vektorů. V matematické statistice často pracujeme s transformacemi náhodného výběru, takovým náhodným veličinám (příp. vektorům) říkáme statistiky. V následujícím zavedeme několik důležitých statistik a ukážeme jejich souvislost s číselnými charakteristikami náhodných veličin. Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr OOOOOOOOO ooooooooo ooo ooooooooooo ooooooooooo Základní statistiky Definice Nechť Xi,..., Xn je náhodný výběr. Statistiku 1 " n ^ ;=i nazýváme výběrový průměr, statistiku ;=i výběrový rozptyl a statistiku S = VŠ2 výběrová směrodatná odchylka. Analogicky se definují i výběrová kovariance, příp. výběrový korelační koeficient pro dvourozměrný náhodný výběr. Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr OOOOOOOOO ooooooooo ooo ooooooooooo oo«oooooooo Vlastnosti statistik Protože jsou uvedené statistiky náhodnými veličinami, lze se přirozeně ptát po jejich číselných charakteristikách. Věta Necht X\,... ,Xn je náhodný výběr rozsahu n z rozdělení se střední hodnotou [i a rozptylem a2 . Pak platí: 9 E(M) = n, Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo ooo ooooooooooo oo«oooooooo Vlastnosti statistik Protože jsou uvedené statistiky náhodnými veličinami, lze se přirozeně ptát po jejich číselných charakteristikách. Věta Necht Xi,.. ., Xn je náhodný výběr rozsahu n z rozdělení se střední hodnotou [i a rozptylem a2 . Pak platí: 9 E(M) = = li, 9 D(M) -- = var(M) = a2/n, Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo ooo ooooooooooo oo«oooooooo Vlastnosti statistik Protože jsou uvedené statistiky náhodnými veličinami, lze se přirozeně ptát po jejich číselných charakteristikách. Věta Necht Xi,.. ., Xn je náhodný výběr rozsahu n z rozdělení se střední hodnotou [i a rozptylem a2 . Pak platí: • E(M) -- = li, • D(M) -. = var(M) = a2/n, • E(S2) - = a2. Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr OOOOOOOOO OOOOOOOOO OOO OOOOOOOOOOO OOO0OOOOOOO Důkaz. Ukážeme jen (nejsložitější) 3. tvrzení. Snadno se odvodí, že platí £(X; - /x)2 = £(X; - M)2 + n(M - /x)2. Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr OOOOOOOOO ooooooooo ooo ooooooooooo ooo»ooooooo Důkaz. Ukážeme jen (nejsložitější) 3. tvrzení. Snadno se odvodí, že platí £(X; - /x)2 = £(X; - M)2 + n(M - /x)2. Proto je E(S2) = ^E(£(X/ " /O2) ~ j^EiM - líf n — 1 1 n — 1 n n — 1 ^2 Jl -a = a . □ Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr OOOOOOOOO OOOOOOOOO OOO OOOOOOOOOOO 0000*000000 V předchozí větě jsme ukázali, že výběrový průměr M splňuje E(M) = [i, jeho střední hodnota je tedy rovna odhadovanému parametru /x. V takovém případě říkáme, že statistika M je nestranným odhadem parametru jjl. Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr OOOOOOOOO OOOOOOOOO OOO OOOOOOOOOOO 0000*000000 V předchozí větě jsme ukázali, že výběrový průměr M splňuje E(M) = [i, jeho střední hodnota je tedy rovna odhadovanému parametru /x. V takovém případě říkáme, že statistika M je nestranným odhadem parametru /x. Podobně jsme viděli, že S2 je nestranným odhadem parametru a2. Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr OOOOOOOOO OOOOOOOOO OOO OOOOOOOOOOO 0000*000000 V předchozí větě jsme ukázali, že výběrový průměr M splňuje E(M) = /x, jeho střední hodnota je tedy rovna odhadovanému parametru /x. V takovém případě říkáme, že statistika M je nestranným odhadem parametru /x. Podobně jsme viděli, že S2 je nestranným odhadem parametru a2. Všimněme si rovněž, že „přirozeněji" definovaná statistika - ^{X; — M)2 není nestranným odhadem a2, její střední hodnota je totiž n^cr2. Rozmyslete si, je-li S nestranným odhadem směrodatné odchylky a. Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr OOOOOOOOO OOOOOOOOO OOO OOOOOOOOOOO OOOOO0OOOOO Náhodný výběr z normálního rozdělení Uvažme nyní speciální případ, kdy je Xi,..., X„ náhodný výběr z normálního rozdělení A/(/x, a2). Věta • M a S2 jsou nezávislé náhodné veličiny. 4 Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr OOOOOOOOO OOOOOOOOO ooo ooooooooooo ooooo»ooooo Náhodný výběr z normálního rozdělení Uvažme nyní speciální případ, kdy je Xl,..., X„ náhodný výběr z normálního rozdělení A/(/x, a2). Věta • M a S2 jsou nezávislé náhodné veličiny. • M ~ A/(/j, a2/n), a tedy U = (M - n)/{o/^~h) ~ N(0,1). Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo ooo ooooooooooo ooooooooooo Náhodný výběr z normálního rozdělení Uvažme nyní speciální případ, kdy je Xl,..., X„ náhodný výběr z normálního rozdělení A/(/x, a2). Věta • M a S2 jsou nezávislé náhodné veličiny. o M ~ N(n, a2/n), a tedy U = (M - n)/{o/^~h) ~ N(0,1). • K = (n- l)S2/a2 - x2(n - 1). Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo ooo ooooooooooo ooooooooooo Náhodný výběr z normálního rozdělení Uvažme nyní speciální případ, kdy je Xl,..., X„ náhodný výběr z normálního rozdělení A/(/x, a2). Věta • M a S2 jsou nezávislé náhodné veličiny. o M ~ N(n, a2/n), a tedy U = (M - n)/{o/^~h) ~ N(0,1). • K = (n — l)S2/a2 ~ x2(n - 1). • Z(Xi-ri2/2~x2(")- . T = {M-fi,)/{S/y/?i)~t{n-l). Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr OOOOOOOOO OOOOOOOOO OOO OOOOOOOOOOO OOOOO0OOOOO Náhodný výběr z normálního rozdělení Uvažme nyní speciální případ, kdy je Xl,..., X„ náhodný výběr z normálního rozdělení A/(/x, a2). Věta • M a S2 jsou nezávislé náhodné veličiny. o M ~ A/(/j, a2/n), a tedy U = (M - n) / (a / y/ň) ~ N(0,1). • K = (n- l)S2/a2 ~ x2(n - 1). • E(X/-Aí)2A72~X2(n)- . 7 = (M-/i)/(S/v^)-r(n-l). Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr OOOOOOOOO OOOOOOOOO OOO OOOOOOOOOOO OOOOO0OOOOO Náhodný výběr z normálního rozdělení Uvažme nyní speciální případ, kdy je Xl,..., X„ náhodný výběr z normálního rozdělení A/(/x, a2). Věta • M a S2 jsou nezávislé náhodné veličiny. 9 M ~ A/(/j, a2/n), a tedy U = (M - n)/{o/^~h) ~ N(0,1). • K = (n- l)S2/a2 ~ x2(n - 1). • E(X/-Aí)2A72~X2(n)- . T = (M-ii)/(S/^h-)~t(n-l). Poznámka K odhadu jjl, známe-li a2, slouží U, v opačném případě T. Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr OOOOOOOOO OOOOOOOOO OOO OOOOOOOOOOO OOOOO0OOOOO Náhodný výběr z normálního rozdělení Uvažme nyní speciální případ, kdy je Xi,..., X„ náhodný výběr z normálního rozdělení A/(/x, a2). Věta • M a S2 jsou nezávislé náhodné veličiny. o M ~ A/(/j, a2/n), a tedy U = (M - n)/{o/^~h) ~ N(0,1). • K = (n- l)S2/a2 - x2(n - 1). • £(X-/x)>2~x2(")- . 7 = (/W-/i)/(S/^)-ř(n-l). Poznámka K odhadu /x, známe-li a2, slouží U, v opačném případě T. K odhadu 2. Označme M\, M2 jejich výběrové průměry a S2, Sf výběrové rozptyly. Dále necht je s2_(m-l)S2 + (n-l)S2 * m+n-2 vážený průměr výběrových rozptylů. Pak platí: 00. o- Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo ooo ooooooooooo oooooooo«oo Dva nezávislé výběry z normálního rozdělení Věta Necht je X\\,..., Xm\ náhodný výběr rozsahu m z rozdělení A/(/x, a2) a X\2,..., Xn2 je na něm nezávislý náhodný výběr rozsahu n z rozdělení N (/i, a2,), přičemž m, n > 2. Označme M\, M2 jejich výběrové průměry a S2, Sf výběrové rozptyly. Dále necht je s2_(m-l)S2 + (n-l)S2 * m+n-2 vážený průměr výběrových rozptylů. Pak platí: • M\ — M2 a S2 jsou stochasticky nezávislé, 00. o- Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr ooooooooo ooooooooo ooo ooooooooooo oooooooo«oo Dva nezávislé výběry z normálního rozdělení Věta Necht je X\\,..., Xm\ náhodný výběr rozsahu m z rozdělení A/(/x, a2) a X\2,..., Xn2 je na něm nezávislý náhodný výběr rozsahu n z rozdělení N (/i, a2), přičemž m, n > 2. Označme M\, M2 jejich výběrové průměry a S2, Sf výběrové rozptyly. Dále necht je s2_(m-l)S2 + (n-l)S2 * m+n-2 vážený průměr výběrových rozptylů. Pak platí: • M\ — M2 a S2 jsou stochasticky nezávislé, • Mi - M2 ~ A/(/xi - H2, ^ + 4) , 00. o Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr OOOOOOOOO OOOOOOOOO ooo ooooooooooo oooooooo«oo Dva nezávislé výběry z normálního rozdělení Věta Necht je X\\,..., Xm\ náhodný výběr rozsahu m z rozdělení A/(/x, a2) a X\2,..., Xn2 je na něm nezávislý náhodný výběr rozsahu n z rozdělení N (/i, a2), přičemž m, n > 2. Označme M\, M2 jejich výběrové průměry a S2, Sf výběrové rozptyly. Dále necht je s2_(m-l)S2 + (n-l)S2 * m+n-2 vážený průměr výběrových rozptylů. Pak platí: • M\ — M2 a S2 jsou stochasticky nezávislé, • Mi - M2 ~ A/(/íi - H2, ^ + 4) , • je-li g\ = g\ = a2, pak K = {m + n- 2)S2/a2 - X2(m + n - 2) , 00. o- Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr OOOOOOOOO OOOOOOOOO ooo ooooooooooo oooooooo«oo Dva nezávislé výběry z normálního rozdělení Necht je X\\,..., Xm\ náhodný výběr rozsahu m z rozdělení A/(/x, a2) a X\2,..., Xn2 je na něm nezávislý náhodný výběr rozsahu n z rozdělení N (/i, a2), přičemž m, n > 2. Označme M\, M2 jejich výběrové průměry a S2, Sf výběrové rozptyly. Dále necht je (m - 1)S2 + (n 1)S2 m + n-2 vážený průměr výběrových rozptylů. Pak platí: • Mi — M2 a S2 jsou stochasticky nezávislé, r2 • je-li af = 02 pak K • F (m + n- 2)S2/a< o\lo\ F{m — 1, n X2{m + n 2) 190,0. Normální rozdělení a rozdělení odvezená Limitní věty a odhady Popisná statistika Náhodný vektor Náhodný výběr OOOOOOOOO ooooooooo ooo ooooooooooo ooooooooo«o Užití statistik dvou nezávislých výběrů • Statistika U, vzniklá normováním M\ — M2, se používá pro odhad rozdílu [i\ — [12, známe-li rozptyly i 4 10 "r" 5 .