Matematika IV - 11. přednáška Náhodný vektor, náhodný výběr Michal Bulant Masarykova univerzita Fakulta informatiky 5. 5. 2008 • Martin Panák, Jan Slovák, Drsná matematika, e-text. • Karel Zvára, Josef Štěpán, Pravděpodobnost a matematická statistika, Matfyzpress, 4. vydání, 2006, 230 stran, ISBN 80-867-3271-1. • Marie Budíková, Štěpán Mikoláš, Pavel Osecký, Popisná statistika, Masarykova univerzita, 3. vydání, 2002, 48 stran, ISBN 80-210-1831-3. • Marie Budíková, Štěpán Mikoláš, Pavel Osecký, Teorie pravděpodobnosti a matematická statistika (sbírka příkladů), Masarykova univerzita, 3. vydání, 2004, 117 stran, ISBN 80-210-3313-4. Je-li (Q, A, P) pravděpodobnostní prostr a Xi,...,X„ na něm definované náhodné veličiny s distribučními funkcemi F\,..., F„, pak náhodným vektorem je n-tice X = {X\,... ,Xn) s distribuční funkcí definovanou vztahem Fx(xi,...,x„) = P(Xi < xi,..., Xn < x„). V tomto kontextu nazýváme F simultánní distribuční funkcí náhodného vektoru X a F; marginální distribuční funkcí náhodné veličiny X;. Podobně jako v případě diskrétní náhodné veličiny označuje p(xi,...,x„) pravděpodobnostní funkci diskrétního náhodného vektoru X, je-li F(xi,... ,x„) = Y^ ■■■ Yl p(rl' • • •' r")- tl kde yi,... tvoří úplný systém jevů. Vztah pro spojitě rozdělený náhodný vektor je analogický__ 'Obvykle zapisujeme ve statistice vektory do sloupců, proto bychom spise měli psát (X, Y)T. Dříve uvedenou definici nezávislosti náhodných veličin X\,..., Xn pomocí vztahu P(X1 =Xl,...,Xn = xn) = P(Xi = xi) - ■ ■ P(Xn = xn) pro libovolné X\,... ,xn, tak můžeme nyní přepsat pomocí vztahem mezi sdruženou distribuční funkcí náhodného vektoru X = (Xi,... ,X„) a marginálních distribučních funkcí náhodných veličin Xi,... ,X„: Fx(xi,..., x„) = Fxi(xi) • • • Fx„(xn). Příklad Házíme dvěma běžnými kostkami, jako náhodnou veličinu X označme součet bodů na obou kostkách, jako náhodnou veličinu Y absolutní hodnotu rozdílu. Určete sdružené rozdělení náhodného vektoru (X, Y), obě marginální rozdělení a odvoďte, jsou-li X a Y nezávislé. E(X) = (E(Xi),..., E(X„)) se nazývá vektor středních hodnot, D(Xi) C(X1,X2) ••• C(X1}X„)\ C(X„,Xi) C(X„,X2) ••• D(X„) / varianční (rozptylová) matice a i /?(Xi,x2) ••• R(X1}X„)\ R(Xn,Xx) R(Xn,X2) ••• 1 ) je korelační matice. Snadno je po rozepsání po jednotlivých složkách vidět, že var(X) = E((X - E(X)) ■ (X - E(X)D var(X) corX Ukážeme na příkladech, že pravděpodobnostní struktura náhodného vektoru (X, Y) není určena pouze marginálními rozděleními veličin X a Y. Podstatný je rovněž pravděpodobnostní vztah mezi X a Y, který je částečně popsán např. prostřednictvím korelačního koeficientu. Příklad Jsou-li X a Y náhodné veličiny, nabývající hodnot 0 a 1, pak P(X = 1, Y = 1) - P(X = 1)P(V = 1) = E(XY) - E(X)E(Y) = = cov(X, Y). Odtud je snadno vidět, že pokud jsou X a Y nekorelované, jsou i nezávislé (což obecně neplatí). Uveďme ještě příklad, ilustrující, že nekorelovanost nemusí implikovat nezávislost: Příklad Buďte A a X nezávislé náhodné veličiny, splňující X ~ A/(0,1) a P(A = 1) = P(/4 = -1) = 1/2. Položíme-li Y = AX, pak p( v < y) = \p(x = Q>{X, Y) polární souřadnice náhodného vektoru (X, Y) a určíme rozdělení vektoru (/?, ). Pro 0 < fi < 1 a 0 < ip1 < 2vr je P(R < ri,4> < ipx) = -7Tf: 7T 2^1 2vr 2vr 2rdtpdr. Hustota je tedy rovna f(r, ip) rovna 0 všude jinde. £ pro 0 < r < 1, 0 < Lp < 2tt a ' Příklad (pokr.) ' Marginální hustoty g(r) i dopočtou: /j(v?) veličin R a se nyní snadno /•CX g(r) = / J — CX f(r, má rovnoměrné rozdělení D(í>) = 7T2/3, snadno rovněž odvodí D(/?) = 1/18. Všimněme si ale zejména, že f(r,ip) nezávislost veličin R a . (0,2ti-), odk me E(R) = ud E(4>) = 7T a 2/3, což znamená Pro náhodné vektory X, Y stejné dimenze, konstantní matici B a konstantní vektor a (odpovídajících dimenzí) platí • E(X + Y) = E(X) + E(Y), » E(a + BX) = a+ B- E(X), • var(a + B • X) = ßvar(X)ßr . Důkaz. Důkaz vyplýva z vlastností náhodných veličin a ze vztahu var(X) = E((X - E(X))(X - E(X))T). D Necht jsou složky náhodného vektoru Z = {Z\,..., Zn) nezávislé a mají rozdělení Z; ~ A/(0,1), dále necht Q je ortonormální matice řádu n. Pak jsou rovněž složky náhodného vektoru U = QTZ nezávislé a každá má rozdělení N (0,1). Má tedy U (stejně jako Z) nulovou střední hodnotu a jednotkovou varianční matici a oba vektory jsou zobecněním normovaného normálního rozdělení. V následující definice zavedeme zobecnění normálního rozdělení s obecnými parametry: Definice Nechť jsou složky náhodného vektoru Z = (Zi,..., Z„) nezávislé a mají rozdělení Z; ~ A/(0,1) a nechť a G Mm je vektor konstant a ß konstantní matice typu m x n. Označme dále V = V ■ BT. Pak řekneme, že náhodný vektor U = a + B ■ Z má m-rozměrné normální rozdělení Nm(a, V). Pomocí vlastností charakteristik snadno spočítáme, že E(U) = a,var(Ľ) = V = BBT. Pokud je matice V regulární, pak existuje hustota náhodného vektoru a je tvaru f(Ul, ...,um) = (2vr)-m/2| l/r^exp (~(u - a)TV~\u - a)\ . Pro úvahy ve statistice je důležitá následující věta. Necht má vektor U rozdělení Nm(a, V), necht c £M.k a matice D typu k x m jsou konstanty. Pak má c + D ■ U k-rozměrné normální rozdělení Nk(c + Da, DVDT). Důkaz. * Vyjádříme-li matici V = BBT, dostáváme c + DU = c + D(a + BZ) = (c + Da) + (DB) Z = - Nk(c + Da,DBBTDT). Speciálně je tedy marginální rozdělení podvektoru vektoru s mnohorozměrným normálním rozdělením opět mnohorozměrné normální a je-li navíc D jednořádková matice, dostáváme, že libovolná lineární funkce takového vektoru má normální rozdělení. Připomeňme ještě jednou rozdělení odvozená od normálního: rozdělení transformace střední hodnota rozptyl N(ß,a2) x2(k) t(k) F(k,m) ß + aZ *l = EjU zf ß k 0 m/(m - 2) a2 2/c k/{k - 2) 2m2(k+m-2) k(m-2)2(m-4) Xl/m Definice Náhodným výběrem rozsahu n rozumíme n-tici nezávislých a stejně rozdělených náhodných veličin X\,... ,Xn ~ fx(x). Náhodným výběrem rozsahu n s p-rozměrného rozdělení rozumíme n-tici nezávislých a stejně rozdělených p-rozměrných náhodných vektorů. V matematické statistice často pracujeme s transformacemi náhodného výběru, takovým náhodným veličinám (příp. vektorům) říkáme statistiky. V následujícím zavedem několik důležitých statistik a ukážeme jejich souvislost s číselnými charakteristikami náhodných veličin. Definice Nechť Xi,..., Xn je náhodný výběr. Statistiku 1 - n ^ /=i nazýváme výběrový průměr, statistiku výběrový rozptyl a statistiku S = VŠ^ výběrová směrodatná odchylka. Analogicky se definují i výběrová kovariance, příp. výběrový korelační koeficient pro dvourozměrný náhodný výběr. Protože jsou uvedené statistiky náhodnými veličinami, lze se přirozeně ptát po jejich číselných charakteristikách. roffii Necht Xi,.. ., Xn je náhodný výběr rozsc ihu n z rozdělení se střed nil hodnotou ß a rozptylem a2 . Pak platí: 9 E(M) = = li, 9 D(M) -- = var(/W) = a2/n, . E(S2) - = a2. ' Důkaz. ' Ukážeme jen (nejsložitější) 3. tvrzení. Snadno se odvodí, že platí £(*/ - ßf = £(X; - M)2 + n(M - ßf. Proto je E(S2) = ^É(£(*/ - ß)2 - ^E(M - ßf = = ^lEvarW-^Ivar(M) = n Jí ■*■ Jí Jí = .o- a = a . n — 1 n — 1 D V předchozí větě jsme ukázali, že výběrový průměr M splňuje E(M) = ß, jehostřední hodnota tedy rovna odhadovanému parametru ß. V takovém případě říkáme, že statistika M je nestranným odhadem parametru ß. Podobně jsme viděli, že S2 je nestranným odhadem parametru a2 Všimněme si rovněž, že „přirozeněji" definovaná statistika - ^{X-, — M)2 není nestranným odhadem a2, její střední hodnota je totiž n^cr2. Rozmyslete si, je-li S nestranným odhadem směrodatné odchylky a. Uvažme nyní speciální případ, kdy je X\,..., Xn náhodný výběr z normálního rozdělení A/(/x, a2). • M a S2 jsou nezávislé náhodné veličiny. • M ~ N(n, a2/n), a tedy U = (M - ß)/{a/y/n) ~ A/(0,1). • K = {n- l)S2/a2 ~ x2(n - 1). •£(*/-^»2~x2(")- • T = (/W-/x)/(S/0ľ)~ŕ(n-l). Poznámka K odhadu ji, známe-li a2, slouží U, v opačném případě 7. K odhadu a2, neznáme-li ji, slouží K, v opačném případě následující (bezejmenná?) statistika, která je vlastně statistikou K, v níž místo odhadu M použijeme přímo ß. Důkaz. Položme Z; = (X; — /x)/<7, což jsou zřejmě nezávislé náhodné veličiny s normovaným normálním rozdělením. Zřejmě je X = a + crEnZ, kde a je vektor samých /j, a proto má podle předchozího X mnohorozměrné normální rozdělení a je-li dále d vektor ze samých 1/n, pak má náhodná veličina M = dTX (jednorozměrné) normální rozdělení se střední hodnotou dTa = ji a rozptylem dTu2End = u2/n. Ostatní tvrzení se dokážou obdobně. D Příklad V roce 1951 bylo rozsáhlým statistickým průzkumem zjištěno, že střední hodnota výšky desetiletých chlapců je 136,1 cm se směrodatnou odchylkou a = 6,4 cm. V roce 1961 byla zjištěna výška pouze u 15 náhodně vybraných chlapců: 130 140 136 141 139 133 149 151 139 136 138 142 127 139 147 Otázkou je, zda se v porovnání s rokem 1951 změnila střední výška chlapců, pokud předpokládáme, že variabilita výšek se v různých generacích příliš nemění. Řešení Vzhledem k tomu, že základní soubor všech desetiletých chlapců je rozsáhlý, lze zmíněná data považovat za náhodný výběr3. Zjistíme, že M = 139,133, n = 15 a s využitím statitstiky U dostáváme, že s 95% pravděpodobností leží hodnota ß v intervalu (M - 1, 96(7/y/ň; M + l, 96a/y/ň) = (135, 9; 142,4). Protože i střední hodnota výšek z roku 1951 leží v tomto intervalu, nemá vážný důvod tvrdit, že se střední výška změnila. Pokud bychom ovšem připustili vyšší možnost omylu a stanovili interval se spolehlivostí pouze 90%, pak bychom na této hladině hypotézu, že střední výška se změnila, přijali - interval je nyní (136,41;141,85). Podobně, pokud nás zajímá pouze dolní odhad střední hodnoty výšek chlapců (a vůbec tedy nepřipouštíme možnost, že by se střední výška snížila), pak s 95% pravděpodobností je střední výška větší než 136,41, a tedy nyní opět přijímáme hypotézu, že se střední výška zvýšila.