Matematika IV ­ 13. přednáška Bodové a intervalové odhady Michal Bulant Masarykova univerzita Fakulta informatiky 12. 5. 2008 Obsah přednášky Doporučené zdroje Martin Panák, Jan Slovák, Drsná matematika, e-text. Karel Zvára, Josef Štěpán, Pravděpodobnost a matematická statistika, Matfyzpress, 4. vydání, 2006, 230 stran, ISBN 80-867-3271-1. Marie Budíková, Štěpán Mikoláš, Pavel Osecký, Popisná statistika, Masarykova univerzita, 3. vydání, 2002, 48 stran, ISBN 80-210-1831-3. Marie Budíková, Štěpán Mikoláš, Pavel Osecký, Teorie pravděpodobnosti a matematická statistika (sbírka příkladů), Masarykova univerzita, 3. vydání, 2004, 117 stran, ISBN 80-210-3313-4. Základní statistiky Nechť X1, . . . , Xn je náhodný výběr. (Náhodným výběrem rozsahu n rozumíme n-tici nezávislých a stejně rozdělených náhodných veličin X1, . . . , Xn FX (x)). Statistiku M = 1 n n i=1 Xi nazýváme výběrový průměr, statistiku S2 = 1 n-1 n i=1(Xi - M)2 výběrový rozptyl a statistiku S = S2 výběrová směrodatná odchylka. Analogicky se definují i výběrová kovariance, příp. výběrový korelační koeficient pro dvourozměrný náhodný výběr. Věta Nechť X1, . . . , Xn je náhodný výběr rozsahu n z rozdělení se střední hodnotou a rozptylem 2 . Pak platí: E(M) = , D(M) = var(M) = 2/n, E(S2) = 2. Náhodný výběr z normálního rozdělení Uvažme nyní speciální případ, kdy je X1, . . . , Xn náhodný výběr z normálního rozdělení N(, 2). Věta M a S2 jsou nezávislé náhodné veličiny. M N(, 2/n), a tedy U = (M - )/(/ n) N(0, 1). T = (M - )/(S/ n) t(n - 1). K = (n - 1)S2/2 2(n - 1). (Xi - )2/2 2(n). Poznámka K odhadu , neznáme-li 2, slouží T, v opačném případě U. K odhadu 2, neznáme-li , slouží K, v opačném případě následující (bezejmenná?) statistika, která je vlastně statistikou K, v níž místo odhadu M použijeme přímo . Důkaz. Položme Zi = (Xi - )/, což jsou zřejmě nezávislé náhodné veličiny s normovaným normálním rozdělením. Zřejmě je X = a + EnZ, kde a = (, . . . , ) je vektor samých , a proto má X podle věty z předchozí přednášky mnohorozměrné normální rozdělení. Je-li dále d vektor ze samých 1/n, pak má náhodná veličina M = dT X (jednorozměrné) normální rozdělení se střední hodnotou dT a = a rozptylem dT 2End = 2/n. Ostatní tvrzení se dokážou obdobně. Příklad V roce 1951 bylo rozsáhlým statistickým průzkumem zjištěno, že střední hodnota výšky desetiletých chlapců je 136, 1 cm se směrodatnou odchylkou = 6, 4 cm. V roce 1961 byla zjištěna výška pouze u 15 náhodně vybraných chlapců: 130 140 136 141 139 133 149 151 139 136 138 142 127 139 147 Otázkou je, zda se v porovnání s rokem 1951 změnila střední výška chlapců, pokud předpokládáme, že variabilita výšek se v různých generacích příliš nemění. Řešení Vzhledem k tomu, že základní soubor všech desetiletých chlapců je rozsáhlý, lze zmíněná data považovat za náhodný výběra. Zjistíme, že výběrový průměr M = 139, 133, n = 15 a s využitím statistiky U dostáváme, že s 95% pravděpodobností leží hodnota v intervalu (M - 1, 96/ n; M + 1, 96/ n) = (135, 9; 142, 4). Protože i střední hodnota výšek z roku 1951 leží v tomto intervalu, nemáme vážný důvod tvrdit, že se střední výška změnila. Pokud bychom ovšem připustili vyšší možnost omylu a stanovili interval se spolehlivostí pouze 90%, pak bychom na této hladině hypotézu, že střední výška se změnila, přijali ­ interval je nyní (136,41;141,85). Podobně, pokud nás zajímá pouze dolní odhad střední hodnoty výšek chlapců (a vůbec tedy nepřipouštíme možnost, že by se střední výška snížila), pak s 95% pravděpodobností je střední výška větší než 136,41, a tedy nyní opět přijímáme hypotézu, že se střední výška zvýšila. Dva nezávislé výběry z normálního rozdělení Věta Nechť je X11, . . . , Xm1 náhodný výběr rozsahu m z rozdělení N(, 2 1) a X12, . . . , Xn2 je na něm nezávislý náhodný výběr rozsahu n z rozdělení N(, 2 2), přičemž m, n 2. Označme M1, M2 jejich výběrové průměry a S2 1 , S2 2 výběrové rozptyly. Dále nechť je S2 = (m - 1)S2 1 + (n - 1)S2 2 m + n - 2 vážený průměr výběrových rozptylů. Pak platí: M1 - M2 a S2 jsou stochasticky nezávislé, M1 - M2 N(1 - 2, 2 1 m + 2 2 n ) , je-li 2 1 = 2 2 = 2, pak K = (m + n - 2)S2 /2 2(m + n - 2) , F = S2 1 /S2 2 2 1/2 2 F(m - 1, n - 1). Užití statistik dvou nezávislých výběrů Statistika U, vzniklá normováním M1 - M2, se používá pro odhad rozdílu 1 - 2, známe-li rozptyly 2 1, 2 2. Je-li 2 1 = 2 2 = 2, pak statistika T (vzniklá z U nahrazením teoretického společného rozptylu 2 váženým průměrem výběrových rozptylů S2 ) slouží pro odhad rozdílu 1 - 2, neznáme-li rozptyl 2. Statistika K = (m + n - 2)S2 /2 slouží k odhadu společného rozptylu 2. Statistika F = S2 1 /S2 2 2 1/2 2 slouží k odhadu podílu rozptylů 2 1/2 2. Příklad Mějme dva nezávislé náhodné výběry; první rozsahu 10 z rozdělení N(2; 1, 5) a druhý rozsahu 5 z rozdělení N(3, 4). Určete pravděpodobnost, že výběrový průměr prvního výběru bude menší než výběrový průměr druhého výběru. Řešení P(M1 < M2) = P(M1 - M2 < 0) = = P (M1 - M2) - (1 - 2) 2 1 m + 2 2 n < 0 - (1 - 2) 2 1 m + 2 2 n = P U < -2 + 3 1,5 10 + 4 5 = P(U < 1, 05) = = (1, 05) = 0, 853. Náhodný výběr je n-tice nezávislých náhodných veličin se stejným rozdělením, které záleží na jednom nebo více parametrech. Obvykle přitom hodnotu těchto parametrů neznáme, ale můžeme tuto hodnotu nebo hodnotu nějaké jeho funkce (tzv. parametrické funkce) z náhodného výběru odhadnout. Definice Mějme náhodný výběr X1, . . . , Xn, které závisí na (obecně vektorovém) parametru . Bodovým odhadem parametru rozumíme statistiku T((X1, . . . , Xn), která je v nějakém smyslu blízko parametru . Rozdíl (příp. vektorový) E(T) - nazveme vychýlení, je-li E(T) = , pak odhad T nazveme nestranným. Intervalovým odhadem parametru rozumíme (obecně vícerozměrný) interval (TL, TU), kde TL(X1, . . . , Xn) a TU(X1, . . . , Xn) jsou statistiky výběru (X1, . . . , Xn). Platí-li P(TL TU) = 1 - , říkáme, že (TL, TU) je interval spolehlivosti 1 - pro parametr . Definice Jsou-li T1, T2 nestranné odhady parametru , říkáme, že odhad T1 je lepší než odhad T2, pokud D(T1) < D(T2), příp. var T1 < var T2 (tj. matice var T2 - var T1 je pozitivně definitivní). O posloupnosti Tn odhadů říkáme, že je asymptoticky nestranná , pokud limn E(Tn) = . O posloupnosti Tn odhadů říkáme, že je konzistentní, pokud limn P(|Tn - | < ) = 1. Věta Je-li posloupnost Tn odhadů parametru asymptoticky nestranná a platí-li limn D(Tn) = 0, pak Tn je konzistentním odhadem . Důkaz. Buď > 0 libovolné. Z Čebyševovy nerovnosti máme P(|Tn - E(Tn)| < /2) 1 - D(Tn)/( /2)2. Zároveň pro dostatečně velké n máme |E(Tn) - | < /2. Proto P(|Tn - | < ) P(|Tn - E(Tn)| < /2, |E(Tn) - | < /2) = = P(|Tn - E(Tn)| < /2), která konverguje k 1, což znamená, že Tn konverguje podle pravděpodobnosti k . Příklad Uvažujme opakovaná nezávislá měření určité konstanty , popsaná náhodným výběrem X1, . . . , Xn z rozdělení se střední hodnotou E(Xi ) = a rozptylem D(Xi ) = 2. Dokažte, že statistiky M = 1 n Xi a L = 1 2(X1 + Xn) jsou nestrannými odhady a rozhodněte, který z odhadů je lepší. Řešení E(M) = 1 n E(Xi ) = 1 n n = E(L) = X1 + Xn 2 = 1 2 E(X1 + Xn) = 1 2 ( + ) = D(M) = 1 n2 D(Xi ) = 1 n2 n2 = 2 n D(L) = D(1/2(X1 + Xn)) = 1/4D(X1 + Xn) = = 1 4 (D(X1) + D(Xn)) = 2 2 . Poznámka Odpověď na otázku z minulé přednášky je, že výběrová směrodatná odchylka S není nestranným odhadem směrodatné odchylky . Kdyby totiž E(S) = , pak by D(S) = E(S2) - E(S)2 = 2 - 2 = 0, což by znamenalo, že S je konstanta, a to je spor, protože rozptyl S je nenulový. Poznámka Jak jsme viděli dříve, není statistika s2 n = 1 n n i=1(Xi - M)2 náhodného výběru z normálního rozdělení nestranným odhadem rozptylu 2 ­ je totiž E(s2 n ) = E(n-1 n S2) = n-1 n 2. Zřejmě je ale limn E(s2 n ) = 2 a protože D(S2 ) = 22 n - 1 , je i limn D(s2 n ) = limn D((n - 1)S2/n) = 0, a je tedy posloupnost s2 n konzistentním odhadem rozptylu 2. Intervaly spolehlivosti (confidence intervals) Připomeňme, že pro náhodný výběr X1, . . . , Xn závislý na parametru jsme definovali intervalový odhad parametru pomocí statistik TL, TU výběru tak, že P(TL TU) = 1 - . Jde o tzv. oboustranný interval spolehlivosti pro . Podobně definujeme levostranný interval spolehlivosti (TL, ) pomocí P(TL < ) = 1 - , analogicky pravostranný interval spolehlivosti. Číslo se nazývá riziko (obvykle se používá = 0, 05), číslo 1 - spolehlivost. Algoritmus konstrukce intervalu spolehlivosti 1 Zvolíme statistiku V , která je nestranným bodovým odhadem parametru . 2 Najdeme tzv. pivotovou statistiku, která je transformací V se známým rozdělením, nezávisící na neznámé hodnotě (např. M, K, T, F). 3 Najdeme příslušné kvantily rozdělení statistiky W tak, že P(w/2 W w1-/2) = 1 - . 4 Nerovnost w/2 W w1-/2 převedeme ekvivalentními úpravami na nerovnost TL TU. 5 Z daného výběru zjistíme konkrétní číselné realizace statistik TL, TU a dostaneme tak intervalový odhad požadované spolehlivosti 1 - . Intervaly spolehlivosti pro parametry normálního rozdělení (známe 2) (M - n u1-/2,M + n u1-/2) (neznáme 2) (M - S n t1-/2,M + S n t1-/2) 2 (neznáme ) (n-1)S2 2 1-/2 (n-1) , (n-1)S2 2 /2 (n-1) 2 (známe ) P (Xi -)2 2 1-/2 (n) , P (Xi -)2 2 /2 (n) Příklad Nechť X1, . . . , Xn je náhodný výběr z rozdělení N(; 0, 1). Jaký musí být minimální rozsah výběru, aby velikost 95% intervalu spolehlivosti pro nepřesáhla číslo 0,03? Řešení Podle předchozí tabulky dostáváme (pro = 0, 05) 0, 03 M + n u1-/2 - (M - n u1-/2) = = 2 n u1-/2. Proto n 42u2 1-/2 0, 032 = 170, 7 a rozsah výběru tedy musí splňovat n 171. Intervaly spolehlivosti pro parametry 2 normálních rozdělení 1 - 2 (známe 2 1, 2 2) M1 - M2 2 1 m + 2 2 n u1-/2 1 - 2 (neznámé 2 1 = 2 2) M1 - M2 S 1 m + 1 n t1-/2 společný rozptyl 2 (m+n-2)S2 2 1-/2 (m+n-2) , (m+n-2)S2 2 /2 (m+n-2) podíl rozptylů 2 1/2 2 S2 1 /S2 2 F1-/2(m-1,n-1), S2 1 /S2 2 F/2(m-1,n-1) Poznámka Pokud a priori nevíme, jestli jsou rozptyly shodné, můžeme to ověřit tak, že nejprve sestrojíme interval spolehlivosti pro 2 1/2 2. Obsahuje-li 1, lze (s pravděpodobností 1 - ) považovat rozptyly za shodné a tento rozptyl odhadovat pomocí statistiky K jak je uvedeno v tabulce. Inteval spolehlivosti pro výběr z dvourozměrného rozdělení Nechť (X1, Y1), . . . , (Xn, Yn) je výběr z rozdělení N2 1 2 , 2 1 12 12 2 2 . Označíme = 1 - 2 a zavedeme rozdílový výběr Zi = Xi - Yi . Pak statistika T = M- S/ n výběru Z má t-rozdělení s n - 1 stupni volnosti, proto jsou hranice intervalu spolehlivosti 1- pro rovny M S n t1-/2(n - 1). Příklad U šesti nových automobilů bylo testováno, nakolik se sjíždějí pneumatiky na předních kolech. Byly naměřeny tyto hodnoty (v mm): číslo auta 1 2 3 4 5 6 sjetí pravé pneu 1,8 1,0 2,2 0,9 1,5 1,6 sjetí levé pneu 1,5 1,1 2,0 1,1 1,4 1,4 Předpokládejte, že jde o realizaci náhodného výběru z dvourozměrného normálního rozdělení a rozhodněte, jestli nedochází k výraznějšímu nesymetrickému sjíždění pneumatik (tj. sestrojte 95% interval spolehlivosti pro = 1 - 2). Řešení Postupně vypočteme: Z = (0, 3; -0, 1; 0, 2; -0, 2; 0, 1; 0, 2), M = 0, 0833, S = 0, 1941. Pak jsou krajními body hledaného 95% intervalu spolehlivosti M S n t1-/2(n - 1) = 0, 0833 0, 1941 2, 5706/ 6, tj. (-0, 12; 0, 29). Poznamenejme, že snadno odvodíme i míru rizika, se kterou bychom mohli tvrdit, že je 1 > 2, tj. že pravé pneumatiky se sjíždějí více než levé. Je to takové číslo , aby příslušný interval spolehlivosti neobsahoval číslo 0 ­ v našem případě je = 0, 34, což je riziko příliš vysoké.