Náhodný výběr oooooooooooo Bodové a intervalové odhady OOOOOOOOOOOO Testovaní hypotéz oooooooooooooooo Matematika III - 13. přednáška Bodové a intervalové odhady, testovaní hypotéz Michal Bulant Masarykova univerzita Fakulta informatiky 15. 12. 2014 Náhodný výběr Bodové a intervalové odhady Testovaní hypotéz oooooooooooo oooooooooooo oooooooooooooooo Obsah přednášky Q Náhodný výběr Q Bodové a intervalové odhady Q Testovaní hypotéz Náhodný výběr Bodové a intervalové odhady Testovaní hypotéz oooooooooooo oooooooooooo oooooooooooooooo Doporučené zdroje • Jan Slovák, Martin Panák, Michal Bulant, Matematika drsně a svižně, MU Brno, 2013, 774 s. (též jako e-text). • Karel Zvára, Josef Štěpán, Pravděpodobnost a matematická statistika, Matfyzpress, 4. vydání, 2006, 230 stran, ISBN 80-867-3271-1. o Marie Budíková, Štěpán Mikoláš, Pavel Osecký, Teorie pravděpodobnosti a matematická statistika (sbírka příkladů), Masarykova univerzita, 3. vydání, 2004, 117 stran, ISBN 80-210-3313-4. • Marie Budíková, Statistika, Masarykova univerzita, 2004, distanční studijní opora ESF, http: //www.math.muni.cz/~budikova/esf/Statistika.zip. 9 Marie Budíková, Tomáš Lerch, Štěpán Mikoláš, Základní statistické metody, Masarykova univerzita, 2005, 170 stran, ISBN 80-210-3886-1. Náhodný výběr Bodové a intervalové odhady Testovaní hypotéz oooooooooooo oooooooooooo oooooooooooooooo Plán prednášky Q Náhodný výběr Náhodný výběr Bodové a intervalové odhady Testovaní hypotéz •ooooooooooo oooooooooooo oooooooooooooooo Náhodný výběr Definice Náhodným výběrem rozsahu n rozumíme r?-tici nezávislých a stejně rozdělených náhodných veličin Xi,... ,Xn ~ Fx(x) (někdy také hovoříme o n nezávislých kopiích náhodné veličiny X). Náhodný výběr Bodové a intervalové odhady Testovaní hypotéz •ooooooooooo oooooooooooo oooooooooooooooo Náhodný výběr Definice Náhodným výběrem rozsahu n rozumíme r?-tici nezávislých a stejně rozdělených náhodných veličin Xi,... ,Xn ~ Fx(x) (někdy také hovoříme o n nezávislých kopiích náhodné veličiny X). Náhodným výběrem rozsahu n z p-rozměrného rozdělení rozumíme r?-tici nezávislých a stejně rozdělených p-rozměrných náhodných vektorů. Náhodný výběr Bodové a intervalové odhady Testovaní hypotéz •ooooooooooo oooooooooooo oooooooooooooooo Náhodný výběr Definice Náhodným výběrem rozsahu n rozumíme r?-tici nezávislých a stejně rozdělených náhodných veličin Xi,... ,Xn ~ Fx(x) (někdy také hovoříme o n nezávislých kopiích náhodné veličiny X). Náhodným výběrem rozsahu n z p-rozměrného rozdělení rozumíme r?-tici nezávislých a stejně rozdělených p-rozměrných náhodných vektorů. V matematické statistice často pracujeme s transformacemi náhodného výběru, takovým náhodným veličinám (příp. vektorům) říkáme statistiky. V následujícím zavedeme několik důležitých statistik a ukážeme jejich souvislost s číselnými charakteristikami náhodných veličin. Náhodný výběr Bodové a intervalové odhady Testovaní hypotéz O0OOOOOOOOOO oooooooooooo oooooooooooooooo Základní statistiky Definice Nechť X±,... ,X„ je náhodný výběr. Statistiku M = -n 1 " n f J i=l nazýváme výběrový průměr, statistiku s2 = i=l výběrový rozptyl a statistiku S = VŠ* výběrová směrodatná odchylka. Analogicky se definují i výběrová kovariance, příp. výběrový korelační koeficient pro dvourozměrný náhodný výběr. Náhodný výběr Bodové a intervalové odhady Testování hypotéz OO0OOOOOOOOO oooooooooooo oooooooooooooooo Vlastnosti statistik Protože jsou uvedené statistiky náhodnými veličinami, lze se přirozeně ptát po jejich číselných charakteristikách. Necht Xi,..., Xn je náhodný výběr rozsahu n z rozdělení se střední hodnotou ji a rozptylem a2 . Pak platí: • E(M) = n, Náhodný výběr Bodové a intervalové odhady Testování hypotéz OO0OOOOOOOOO oooooooooooo oooooooooooooooo Vlastnosti statistik Protože jsou uvedené statistiky náhodnými veličinami, lze se přirozeně ptát po jejich číselných charakteristikách. Necht Xi,..., Xn je náhodný výběr rozsahu n z rozdělení se střední hodnotou ji a rozptylem a2 . Pak platí: • E(M) = n, • D{M) = var(M) = a2/n, Náhodný výběr Bodové a intervalové odhady Testování hypotéz OO0OOOOOOOOO oooooooooooo oooooooooooooooo Vlastnosti statistik Protože jsou uvedené statistiky náhodnými veličinami, lze se přirozeně ptát po jejich číselných charakteristikách. Nechť X±,..., Xn je náhodný výběr rozsahu n z rozdělení se střední hodnotou \x a rozptylem a . Pak platí: • D(M) = var(M) = a2/n, • E(S2) = a2. Náhodný výběr OOO0OOOOOOOO Bodové a intervalové odhady oooooooooooo Testování hypotéz oooooooooooooooo Důkaz. Ukážeme jen (nejsložitejší) 3. tvrzení. Snadno se odvodí, že platí - ti)2 = £(X/ - M)2 + n(M - Náhodný výběr OOO0OOOOOOOO Bodové a intervalové odhady oooooooooooo Testovaní hypotéz oooooooooooooooo Důkaz. Ukážeme jen (nejsložitější) 3. tvrzení. Snadno se odvodí, že platí - ti)2 = £(X/ - M)2 + n(M - tf. Proto je r? — i i r? — i n r? — i a2- n-1 2 2 a = a . □ Náhodný výběr OOOO0OOOOOOO Bodové a intervalové odhady oooooooooooo Testovaní hypotéz oooooooooooooooo V předchozí větě jsme ukázali, že výběrový průměr M splňuje E(M) = [i, jeho střední hodnota je tedy rovna odhadovanému parametru ji. V takovém případě říkáme, že statistika M je nestranným odhadem parametru ji. Náhodný výběr OOOOOOOOOOOO Bodové a intervalové odhady OOOOOOOOOOOO Testovaní hypotéz oooooooooooooooo V předchozí větě jsme ukázali, že výběrový průměr M splňuje E(M) = [i, jeho střední hodnota je tedy rovna odhadovanému parametru ji. V takovém případě říkáme, že statistika M je nestranným odhadem parametru /i. Podobně jsme viděli, že S2 je nestranným odhadem parametru a2. Náhodný výběr OOOO0OOOOOOO Bodové a intervalové odhady oooooooooooo Testování hypotéz oooooooooooooooo V předchozí větě jsme ukázali, že výběrový průměr M splňuje E(M) = [i, jeho střední hodnota je tedy rovna odhadovanému parametru ji. V takovém případě říkáme, že statistika M je nestranným odhadem parametru /i. Podobně jsme viděli, že S2 je nestranným odhadem parametru a2. Všimněme si rovněž, že „přirozeněji" definovaná statistika - J2(Xi — M)2 není nestranným odhadem a2, její střední hodnota je totiž ^a2. Náhodný výběr OOOO0OOOOOOO Bodové a intervalové odhady oooooooooooo Testování hypotéz oooooooooooooooo V předchozí větě jsme ukázali, že výběrový průměr M splňuje E(M) = [i, jeho střední hodnota je tedy rovna odhadovanému parametru ji. V takovém případě říkáme, že statistika M je nestranným odhadem parametru /i. Podobně jsme viděli, že S2 je nestranným odhadem parametru a2. Všimněme si rovněž, že „přirozeněji" definovaná statistika - J2(Xi — M)2 není nestranným odhadem a2, její střední hodnota je totiž ^a2. -j ti Příklad Rozmyslete si, je-li S nestranným odhadem směrodatné odchylky a. Náhodný výběr Bodové a intervalové odhady Testování hypotéz OOOOOOOOOOOO oooooooooooo oooooooooooooooo Náhodný výběr z normálního rozdělení Uvažme nyní speciální případ, kdy je X±,..., Xn náhodný výběr z normálního rozdělení N(/i,o ). Bez důkazu uvedeme velmi důležité tvrzení o rozdělení následujících statistik: • M a S jsou nezávislé náhodné veličiny. • M ~ N{n,2~x2(")- Náhodný výběr Bodové a intervalové odhady Testování hypotéz ooooo«oooooo oooooooooooo oooooooooooooooo Náhodný výběr z normálního rozdělení Uvažme nyní speciální případ, kdy je X±,..., Xn náhodný výběr z normálního rozdělení N(/i,o ). Bez důkazu uvedeme velmi důležité tvrzení o rozdělení následujících statistik: • M a S jsou nezávislé náhodné veličiny. • M - N{n,2~x2(")- Poznámka K odhadu fi, neznáme-li a2, slouží T, v opačném případě U. K odhadu a2, neznáme-li fi, slouží K, v opačném případě následující (bezejmenná?) statistika, která je vlastně statistikou K, v níž místo odhadu M použijeme přímo ji. 9 q,o Náhodný výběr OOOOOOOOOOOO Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz oooooooooooooooo Příklad V roce 1951 bylo rozsáhlým statistickým průzkumem zjištěno, že střední hodnota výšky desetiletých chlapců je 136,1 cm se směrodatnou odchylkou a = 6,4 cm. Náhodný výběr OOOOOO0OOOOO Bodové a intervalové odhady oooooooooooo Testování hypotéz oooooooooooooooo Príklad V roce 1951 bylo rozsáhlým statistickým průzkumem zjištěno, že střední hodnota výšky desetiletých chlapců je 136,1 cm se směrodatnou odchylkou a = 6,4 cm. V roce 1961 byla zjištěna výška pouze u 15 náhodně vybraných chlapců: 130 140 136 141 139 133 149 151 139 136 138 142 127 139 147 Otázkou je, zda se v porovnání s rokem 1951 změnila střední výška chlapců, pokud předpokládáme, že variabilita výšek se v různých generacích příliš nemění. Náhodný výběr Bodové a intervalové odhady Testování hypotéz OOOOOOOOOOOO oooooooooooo oooooooooooooooo Vzhledem k tomu, že základní soubor všech desetiletých chlapců je rozsáhlý, lze zmíněná data považovat za náhodný výběra. Zjistíme, že výběrový průměr M = 139,133, n = 15 a s využitím statistiky U dostáváme, že s 95% pravděpodobností leží hodnota ji v intervalu (M - 1,96a/Vn; M + 1,96a/y/ň) = (135,9; 142,4). Protože i střední hodnota výšek z roku 1951 leží v tomto intervalu, nemáme vážný důvod tvrdit, že se střední výška změnila. 9 q,o Náhodný výběr Bodové a intervalové odhady Testování hypotéz OOOOOOO0OOOO oooooooooooo oooooooooooooooo Vzhledem k tomu, že základní soubor všech desetiletých chlapců je rozsáhlý, lze zmíněná data považovat za náhodný výběra. Zjistíme, že výběrový průměr M = 139,133, n = 15 a s využitím statistiky U dostáváme, že s 95% pravděpodobností leží hodnota ji v intervalu (M - 1,96a/Vn; M + 1,96a/y/ň) = (135,9; 142,4). Protože i střední hodnota výšek z roku 1951 leží v tomto intervalu, nemáme vážný důvod tvrdit, že se střední výška změnila. Pokud bychom ovšem připustili vyšší možnost omylu a stanovili interval se spolehlivostí pouze 90%, pak bychom na této hladině hypotézu, že se střední výška změnila, „přijali" - interval je nyní (136,41;141,85). Náhodný výběr Bodové a intervalové odhady Testování hypotéz OOOOOOO0OOOO oooooooooooo oooooooooooooooo Vzhledem k tomu, že základní soubor všech desetiletých chlapců je rozsáhlý, lze zmíněná data považovat za náhodný výběra. Zjistíme, že výběrový průměr M = 139,133, n = 15 a s využitím statistiky U dostáváme, že s 95% pravděpodobností leží hodnota ji v intervalu (M - 1,96a/Vn; M + 1,96a/y/ň) = (135,9; 142,4). Protože i střední hodnota výšek z roku 1951 leží v tomto intervalu, nemáme vážný důvod tvrdit, že se střední výška změnila. Pokud bychom ovšem připustili vyšší možnost omylu a stanovili interval se spolehlivostí pouze 90%, pak bychom na této hladině hypotézu, že se střední výška změnila, „přijali" - interval je nyní (136,41:141,85). Podobně, pokud nás zajímá pouze dolní odhad střední hodnoty výšek chlapců (a vůbec tedy nepřipouštíme možnost, že by se střední výška snížila), pak s 95% pravděpodobností je střední výška větší než 136,41, a tedy nyní opět „přijímáme" hypotézu, že se střední výška zvýšila. Náhodný výběr Bodové a intervalové odhady Testování hypotéz OOOOOOOO0OOO oooooooooooo oooooooooooooooo Příklady k procvičení Příklad Předpokládejme, že velká skupina studentů má ze zápočtové písemky ze statistiky bodové hodnoty normálně rozloženy kolem střední hodnoty 72 se směrodatnou odchylkou 9 bodů. Určete pravděpodobnost, že a) náhodně vybraný student bude mít výsledek lepší než 80 bodů, b) průměr výsledků náhodného výběru 10 studentů bude lepší než 80 bodů. Náhodný výběr Bodové a intervalové odhady Testování hypotéz OOOOOOOO0OOO oooooooooooo oooooooooooooooo Příklady k procvičení Příklad Předpokládejme, že velká skupina studentů má ze zápočtové písemky ze statistiky bodové hodnoty normálně rozloženy kolem střední hodnoty 72 se směrodatnou odchylkou 9 bodů. Určete pravděpodobnost, že a) náhodně vybraný student bude mít výsledek lepší než 80 bodů, b) průměr výsledků náhodného výběru 10 studentů bude lepší než 80 bodů. Příklad Rychlost letadla byla určována v 5 zkouškách, jejichž aritmetický průměr byl M = 870,3 ms_1. Najděte 95% interval spolehlivosti pro [i, víte-li, že měření rychlosti se řídí normálním rozdělením se směrodatnou odchylkou 2,1 ms_1. Náhodný výběr ooooooooo«oo Dva nezávislé výběry Bodové a intervalové odhady oooooooooooo z normálního rozdělení Testování hypotéz oooooooooooooooo Necht je Xn,..., Xm\ náhodný výběr rozsahu m z rozdělení A/(/i, a X12,..., Xn2 je na něm nezávislý náhodný výběr rozsahu n z rozdělení A/(/i, a^), přičemž m, n > 2. Označme M±, m2 jejich výběrové průměry a , S| výběrové rozptyly. Dále necht je 2 (m- 1)S* + (n- 1)S22 m + n — 2 vážený průměr výběrových rozptylů. Pak platí Náhodný výběr ooooooooo«oo Dva nezávislé výběry Bodové a intervalové odhady oooooooooooo z normálního rozdělení Testování hypotéz oooooooooooooooo Necht je Xn,..., Xm\ náhodný výběr rozsahu m z rozdělení A/(/i, a X12,..., Xn2 je na něm nezávislý náhodný výběr rozsahu n z rozdělení A/(/i, a^), přičemž m, n > 2. Označme M±, m2 jejich výběrové průměry a , S| výběrové rozptyly. Dále necht je 2 (m - l)Sf + {n- 1)S22 m + n — 2 vážený průměr výběrových rozptylů. Pak platí • Mi — m2 a jsou stochasticky nezávislé, Náhodný výběr OOOOOOOOOOOO Dva nezávislé výběry Bodové a intervalové odhady OOOOOOOOOOOO z normálního rozdělení Testování hypotéz oooooooooooooooo Necht je Xn,..., Xm\ náhodný výběr rozsahu m z rozdělení A/(/i, a X12,..., Xn2 je na něm nezávislý náhodný výběr rozsahu n z rozdělení A/(/i, a^), přičemž m, n > 2. Označme M±, M2 jejich výběrové průměry a , S| výběrové rozptyly Dále necht je 2 (m - l)Sf + {n- 1)S22 m + n — 2 vážený průměr výběrových rozptylů. Pak platí • Mi — m2 a S2 jsou stochasticky nezávislé, • M1-M2~N(fi1-fi2^ + ^), Náhodný výběr ooooooooo«oo Dva nezávislé výběry Bodové a intervalové odhady oooooooooooo z normálního rozdělení Testování hypotéz oooooooooooooooo Necht je Xn,..., Xm\ náhodný výběr rozsahu m z rozdělení A/(/i, a X12,..., Xn2 je na něm nezávislý náhodný výběr rozsahu n z rozdělení A/(/i, a^), přičemž m, n > 2. Označme M±, M2 jejich výběrové průměry a , S| výběrové rozptyly. Dále necht je 2 (m - l)Sf + {n- 1)S22 m + n — 2 vážený průměr výběrových rozptylů. Pak platí • Mi — m2 a S2 jsou stochasticky nezávislé, • M1-M2~N(fi1-fi2^ + ^), • je-li o\ = o\ = 2. Označme M±, m2 jejich výběrové průměry a S2, S| výběrové rozptyly. Dále necht je 2 (m - 1)S2 + {n- 1)S22 m + n — 2 vážený průměr výběrových rozptylů. Pak platí • Mi — m2 a S2 jsou stochasticky nezávislé, • M1-M2~N(fi1-fi2^ + ^), • je-li o\ = o\ = (J' rr r? D(l/2(Xi + X„)) = l/4D(Xx + X„) = l(D(X1) + D(Xn)) = ^. Náhodný výběr oooooooooooo Bodové a intervalové odhady OOO0OOOOOOOO Testování hypotéz oooooooooooooooo Poznámka Odpověď na otázku, zda je výběrová směrodatná odchylka S nestranným odhadem směrodatné odchylky a, je záporná. Kdyby totiž E(S) = a, pak by D(S) = E(S2) - E(S)2 = a2 - a2 = O, což by znamenalo, že S je konstanta, a to je spor, protože rozptyl S je nenulový. Náhodný výběr oooooooooooo Bodové a intervalové odhady OOO0OOOOOOOO Testování hypotéz oooooooooooooooo Poznámka Odpověď na otázku, zda je výběrová směrodatná odchylka S nestranným odhadem směrodatné odchylky a, je záporná. Kdyby totiž E(S) = a, pak by D(S) = E(S2) - E(S)2 = a2 - a2 = O, což by znamenalo, že S je konstanta, a to je spor, protože rozptyl S je nenulový. Poznámka Jak jsme viděli dříve, není statistika s2 = ^ X)ľ=i(^' ~~ ^)2 náhodného výběru z normálního rozdělení nestranným odhadem rozptylu a -je totiž E(s„) = E(ZL^S ) = rL^o'z- Zřejmě je ale lim^oo E(s2) = a2 Náhodný výběr oooooooooooo Bodové a intervalové odhady OOO0OOOOOOOO Testování hypotéz oooooooooooooooo Poznámka Odpověď na otázku, zda je výběrová směrodatná odchylka S nestranným odhadem směrodatné odchylky a, je záporná. Kdyby totiž E(S) = a, pak by D(S) = E(S2) - E(S)2 = a2 - a2 = O, což by znamenalo, že S je konstanta, a to je spor, protože rozptyl S je nenulový. Poznámka Jak jsme viděli dříve, není statistika s2 = ^ X)ľ=i(^' ~~ ^)2 náhodného výběru z normálního rozdělení nestranným odhadem rozptylu a2 - je totiž E(s2) = E(ZZ^S2) = ^^cr2- Zřejmě je ale lim^oo E(s2) = a2 a protože D(S2) = 2ď n-1 je i limn_>.00 D(s^) = lim^oo D((n - l)S2/n) = O, a je tedy posloupnost s2 konzistentním odhadem rozptylu cr . ✓ oq.o Náhodný výběr oooooooooooo Intervaly spolehlivosti Bodové a intervalové odhady OOOOOOOOOOOO (confidence intervals) Testování hypotéz oooooooooooooooo Připomeňme, že pro náhodný výběr Xi,... ,Xn závislý na parametru 9 jsme definovali intervalový odhad parametru 9 pomoci statistik T/_, Tu výběru tak, že P(T/_ < 9 < Tu) = 1 — a. Jde o tzv. oboustranný interval spolehlivosti pro 9 . Náhodný výběr oooooooooooo Intervaly spolehlivosti Bodové a intervalové odhady OOOOOOOOOOOO (confidence intervals) Testování hypotéz oooooooooooooooo Připomeňme, že pro náhodný výběr Xi,... ,Xn závislý na parametru 9 jsme definovali intervalový odhad parametru 9 pomoci statistik T/_, Tu výběru tak, že P(T/_ < 9 < Tu) = 1 — a. Jde o tzv. oboustranný interval spolehlivosti pro 9 . Podobně definujeme levostranný interval spolehlivosti (T/_,oo) pomoci P(7~/_ < 9) — 1 — a, analogicky pravostranný interval spolehlivosti. Náhodný výběr oooooooooooo Intervaly spolehlivosti Bodové a intervalové odhady OOOOOOOOOOOO (confidence intervals) Testování hypotéz oooooooooooooooo Připomeňme, že pro náhodný výběr Xi,... ,Xn závislý na parametru 9 jsme definovali intervalový odhad parametru 9 pomoci statistik T/_, Tu výběru tak, že P(T/_ < 9 < Tu) = 1 — a. Jde o tzv. oboustranný interval spolehlivosti pro 9 . Podobně definujeme levostranný interval spolehlivosti (7/_,oo) pomoci P(7~/_ < 9) — 1 — a, analogicky pravostranný interval spolehlivosti. Číslo a se nazývá riziko (obvykle se používá a — 0,05), číslo 1 — a spolehlivost. Náhodný výběr oooooooooooo Bodové a intervalové odhady ooooo«oooooo Testování hypotéz oooooooooooooooo Algoritmus konstrukce intervalu spolehlivosti O Zvolíme statistiku V, která je nestranným bodovým odhadem parametru 9. Náhodný výběr OOOOOOOOOOOO Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz oooooooooooooooo Algoritmus konstrukce intervalu spolehlivosti O Zvolíme statistiku V, která je nestranným bodovým odhadem parametru 9. O Najdeme tzv. pivotovou statistiku l/l/, která je transformací V se známým rozdělením, nezávisící na neznáme hodnotě 9 (např. (7, K, 7~, F). Náhodný výběr oooooooooooo Bodové a intervalové odhady ooooo«oooooo Testování hypotéz oooooooooooooooo Algoritmus konstrukce intervalu spolehlivosti O Zvolíme statistiku V, která je nestranným bodovým odhadem parametru 9. O Najdeme tzv. pivotovou statistiku W, která je transformací V se známým rozdělením, nezávisící na neznáme hodnotě 9 (např. (7, K, 7~, F). O Najdeme příslušné kvantily rozdělení statistiky W tak, že P{wa/2 M a a + -ž="i-a/2 -(M- -ž=tfi_a/2) = 2 ul-a/2 □ Náhodný výběr OOOOOOOOOOOO Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz oooooooooooooooo Príklad Nechť Xi,..., Xn je náhodný výběr z rozdělení A/(/í; 0,1). Jaký musí být minimální rozsah výběru, aby velikost 95% intervalu spolehlivosti pro ji nepřesáhla číslo 0,03? Řešení Podle předchozí tabulky dostáváme (pro a — 0,05) 0,03 > M a a + -ž="i-a/2 -(M- -ž=tfi_a/2) = 2 ul-a/2 Proto " * -w^- w 1707'38 a rozsah výběru tedy musí splňovat n > 1708. □ Náhodný výběr oooooooooooo Bodové a intervalové odhady OOOOOOOO0OOO Testování hypotéz oooooooooooooooo Intervaly spolehlivosti pro parametry 2 normálních rozdělení Ml — M2 (známe a2, a^) Mi-M2±^ + <řul_a/2 Mi — M2 (nezn. a2 — a^) Mi - M2 ± S*^ + Jti_a/2(m + n - 2) společný rozptyl a2 / (m+n-2)S2 (m+n-2)S2 \ V^-a/2(m+"-2)' X2a/2(™+"-2) y podíl rozptylů o\ja\ ( /ri-a/2("i-l,n-l)' Fa/2(m-l,n-l) J Náhodný výběr Bodové a intervalové odhady Testování hypotéz OOOOOOOOOOOO OOOOOOOO0OOO oooooooooooooooo Intervaly spolehlivosti pro parametry 2 normálních rozdělení Ml — M2 (známe a\, a2) Mi-M2±^ + <řul_a/2 Mi — M2 (nezn. a2 — a2) Mi - M2 ± S*^ + ih^pim + n - 2) společný rozptyl a2 / (m+n-2)S2 (m+n-2)S2 \ V^-a/2(m+"-2)' xí/2{m+n-2) ) podíl rozptylů o\ja\ ( sí/s- s{/S1 \ /ri-a/2("i-l,n-l)' Fa/2(m-l,n-l) J Poznámka Pokud a priori nevíme, jestli jsou rozptyly shodné, můžeme to ověřit tak, že nejprve sestrojíme interval spolehlivosti pro cr2/(J2. Obsahuje-li 1, lze (s pravděpodobností 1 — a) považovat rozptyly za shodné a tento rozptyl odhadovat pomocí statistiky K, jak je uvedeno v tabulce. Náhodný výběr Bodové a intervalové odhady Testování hypotéz OOOOOOOOOOOO OOOOOOOOO0OO oooooooooooooooo nteval spolehlivosti pro výběr z dvourozměrného rozdělení Nechť (Xi, Yi),..., (Xn, yn) je výběr z rozdělení □ s Náhodný výběr Bodové a intervalové odhady Testování hypotéz oooooooooooo oooooooooooo oooooooooooooooo Inteval spolehlivosti pro výběr z dvourozměrného rozdělení Nechť (Xi, Yi),..., (Xn, yn) je výběr z rozdělení N2 Mi a- (712 J ' Va12 a2 Označíme ji — m — 112 a zavedeme rozdílový výběr Z; = X/ — V/. Pak statistika T = |^ výběru Z má ř-rozdělení s n — 1 stupni volnosti, proto jsou hranice intervalu spolehlivosti l — a pro ji rovny /W±^ti_a/2("-l). Náhodný výběr oooooooooooo Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz oooooooooooooooo U šesti nových automobilů bylo testováno, nakolik se sjíždějí pneumatiky na předních kolech. Byly naměřeny tyto hodnoty (v mm): číslo auta 1 2 3 4 5 6 sjetí pravé pneu 1,8 1,0 2,2 0,9 1,5 1,6 sjetí levé pneu 1,5 1,1 2,0 1,1 1,4 1,4 Předpokládejte, že jde o realizaci náhodného výběru z dvourozměrného normálního rozdělení a rozhodněte, jestli nedochází k výraznějšímu nesymetrickému sjíždění pneumatik (tj. sestrojte 95% interval spolehlivosti pro ji — ji\ — 112). Náhodný výběr oooooooooooo Bodové a intervalové odhady 00000000000« Testování hypotéz oooooooooooooooo Postupně vypočteme: Z = (0,3; -0,1; 0,2; -0,2; 0,1; 0,2), M — 0,0833, S = 0,1941. = Náhodný výběr oooooooooooo Bodové a intervalové odhady 00000000000« Testování hypotéz oooooooooooooooo Rešení Postupně vypočteme: Z = (0,3; —0,1; 0,2; -0,2; 0,1; 0,2), M = 0,0833, S = 0,1941. Pak jsou krajními body hledaného 95% intervalu spolehlivosti M±^-t1_a/2(n 1) = 0,0833 ±0,1941 • 2,5706/^, tj. (-0,12; 0,29). Náhodný výběr oooooooooooo Bodové a intervalové odhady 00000000000« Testování hypotéz oooooooooooooooo Rešení Postupně vypočteme: Z = (0,3; -0,1; 0,2; -0,2; 0,1; 0,2), M = 0,0833, S = 0,1941. Pak jsou krajními body hledaného 95% intervalu spolehlivosti M ± JLŕi_a/2(n - 1) = 0,0833 ± 0,1941 • 2,5706/^6, tj. (-0,12; 0,29). Poznamenejme, že snadno odvodíme i míru rizika, se kterou bychom mohli tvrdit, že je m > [12, tj. že pravé pneumatiky se sjíždějí více než levé. Je to takové číslo a, aby příslušný interval spolehlivosti neobsahoval číslo O - v našem případě je a = 0,34, což je riziko příliš vysoké. Náhodný výběr oooooooooooo Plán přednáš Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz oooooooooooooooo O Testovaní hypotéz Náhodný výběr OOOOOOOOOOOO Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz •ooooooooooooooo Motivační úvod Testování hypotéz umožňuje na základě náhodného výběru s danou pravděpodobností ověřovat domněnky o rozdělení, z něhož pochází daný náhodný výběr. Náhodný výběr Bodové a intervalové odhady Testování hypotéz OOOOOOOOOOOO OOOOOOOOOOOO «000000000000000 Motivační úvod Testovaní hypotéz umožňuje na základě náhodného výběru s danou pravděpodobností ověřovat domněnky o rozdělení, z něhož pochází daný náhodný výběr. Hypotézou budeme rozumět nějaké tvrzení o parametrech tohoto rozdělení. Náhodný výběr oooooooooooo Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz •ooooooooooooooo Motivační úvod Testování hypotéz umožňuje na základě náhodného výběru s danou pravděpodobností ověřovat domněnky o rozdělení, z něhož pochází daný náhodný výběr. Hypotézou budeme rozumět nějaké tvrzení o parametrech tohoto rozdělení. Hq .. . nulová hypotéza (např. 9 = c, kde c vyjadřuje naši domněnku o hodnotě parametru 9) Hi ... (oboustranná) alternativní hypotéza (obvykle negace nulové) Testováním Hq oproti alternativní hypotéze rozumíme postup založený na náhodném výběru, s jehož pomocí platnost Ho zamítneme nebo nezamítneme (= připouštíme). Náhodný výběr oooooooooooo Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz •ooooooooooooooo Motivační úvod Testování hypotéz umožňuje na základě náhodného výběru s danou pravděpodobností ověřovat domněnky o rozdělení, z něhož pochází daný náhodný výběr. Hypotézou budeme rozumět nějaké tvrzení o parametrech tohoto rozdělení. Hq .. . nulová hypotéza (např. 9 = c, kde c vyjadřuje naši domněnku o hodnotě parametru 9) Hi ... (oboustranná) alternativní hypotéza (obvykle negace nulové) Testováním Hq oproti alternativní hypotéze rozumíme postup založený na náhodném výběru, s jehož pomocí platnost Ho zamítneme nebo nezamítneme (= připouštíme). Chyba 1. druhu . .. Hq platí a myji zamítneme (závažnější) Chyba 2. druhu . .. Hq neplatí a my ji nezamítneme Náhodný výběr oooooooooooo Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz •ooooooooooooooo Motivační úvod Testování hypotéz umožňuje na základě náhodného výběru s danou pravděpodobností ověřovat domněnky o rozdělení, z něhož pochází daný náhodný výběr. Hypotézou budeme rozumět nějaké tvrzení o parametrech tohoto rozdělení. Hq .. . nulová hypotéza (např. 9 = c, kde c vyjadřuje naši domněnku o hodnotě parametru 9) Hi ... (oboustranná) alternativní hypotéza (obvykle negace nulové) Testováním Hq oproti alternativní hypotéze rozumíme postup založený na náhodném výběru, s jehož pomocí platnost Ho zamítneme nebo nezamítneme (= připouštíme). Chyba 1. druhu . .. Hq platí a myji zamítneme (závažnější) Chyba 2. druhu . .. Hq neplatí a my ji nezamítneme Pravděpodobnost chyby 1. druhu se nazývá hladina významnosti (a, obvykle a = 0,05), pravděpodobnost chyby 2. druhu se značí /3 a číslo 1 — (3 se nazývá síla testu. Náhodný výběr OOOOOOOOOOOO Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz o«oooooooooooooo Způsoby testování nulové hypotézy O pomoci intervalu spolehlivosti Náhodný výběr oooooooooooo Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz o«oooooooooooooo Způsoby testovaní nulové hypotézy O pomoci intervalu spolehlivosti O pomoci kritického oboru Náhodný výběr OOOOOOOOOOOO Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz o«oooooooooooooo Způsoby testovaní nulové hypotézy O pomocí intervalu spolehlivosti O pomocí kritického oboru O pomocí tzv. p—hodnoty (p-value) Náhodný výběr Bodové a intervalové odhady Testování hypotéz oooooooooooo oooooooooooo o«oooooooooooooo Způsoby testovaní nulové hypotézy O pomoci intervalu spolehlivosti O pomoci kritického oboru O pomoci tzv. p—hodnoty (p-value) Interval spolehlivosti Na základě realizace náhodného výběru sestrojíme 100(1 — a)% interval spolehlivosti pro neznámý parametr 9 a zjistíme, zda c patří do tohoto intervalu. Pokud ano, hypotézu Hq nezamítáme (v opačném případě zamítáme) na hladině významnosti a. Náhodný výběr Bodové a intervalové odhady Testování hypotéz oooooooooooo oooooooooooo o«oooooooooooooo Způsoby testovaní nulové hypotézy O pomoci intervalu spolehlivosti O pomoci kritického oboru O pomoci tzv. p—hodnoty (p-value) Interval spolehlivosti Na základě realizace náhodného výběru sestrojíme 100(1 — a)% interval spolehlivosti pro neznámý parametr 9 a zjistíme, zda c patří do tohoto intervalu. Pokud ano, hypotézu Hq nezamítáme (v opačném případě zamítáme) na hladině významnosti a. Kritický obor Stanovení kritického oboru je postup do jisté míry obrácený. Nejprve (i bez náhodného výběru) zvolíme vhodnou statistiku T a množinu hodnot, jichž může T nabývat, rozdělíme na dvě disjunktní podmnožiny: obor nezamítnutí Hq (značíme V) a kritický obor W (obor zamítnutí Hq). Pokud realizace T padne do l/l/, pak Hq zamítneme, jinak nezamítáme. Náhodný výběr oooooooooooo Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz OO0OOOOOOOOOOOOO Stanovení kritického oboru na hladině a Pro statistiku T {testové kritérium) stanovíme obor nezamítnutí V jako interval, jehož hraniční body tvoří kvantil a/2 a 1 — a/2, odtud je W = (-oc, F~1(a/2)) U (F-^l - a/2), oc). Náhodný výběr Bodové a intervalové odhady Testování hypotéz oooooooooooo oooooooooooo ooo«oooooooooooo Způsoby testovaní nulové hypotézy p-hodnota Testovaní pomoci p-hodnoty je jednoduchý test, umožněný rozšírením statistických balíků, p-hodnota udává nejnižší možnou hladinu významnosti, při níž Ho zamítáme. Je-li p-hodnota > a, hypotézu Ho nezamítáme, pro p-hodnotu menší než a, hypotézu zamítneme. Náhodný výběr Bodové a intervalové odhady Testování hypotéz oooooooooooo oooooooooooo ooo«oooooooooooo Způsoby testovaní nulové hypotézy p-hodnota Testovaní pomoci p-hodnoty je jednoduchý test, umožněný rozšírením statistických balíků, p-hodnota udává nejnižší možnou hladinu významnosti, při níž Ho zamítáme. Je-li p-hodnota > a, hypotézu Ho nezamítáme, pro p-hodnotu menší než a, hypotézu zamítneme. Náhodný výběr Bodové a intervalové odhady Testování hypotéz oooooooooooo oooooooooooo ooo«oooooooooooo Způsoby testovaní nulové hypotézy p-hodnota Testovaní pomoci p-hodnoty je jednoduchý test, umožněný rozšírením statistických balíků, p-hodnota udává nejnižší možnou hladinu významnosti, při níž Ho zamítáme. Je-li p-hodnota > a, hypotézu Ho nezamítáme, pro p-hodnotu menší než a, hypotézu zamítneme. p-hodnota se stanoví rovněž se znalostí konkrétní realizace ŕo statistiky T náhodného výběru jako p = 2min{P(T< ťb),P(T> ŕ0)}. Náhodný výběr oooooooooooo Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz oooo«ooooooooooo Testovaní hypotézy proti jednostranné alternativě Je-li Hq hypotéza 9 = c, pak levostranná alternativní hypotéza je tvrzení 9 < c, pravostranná alternativní hypotéza je tvrzení 9 > c. Náhodný výběr OOOOOOOOOOOO Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz oooo«ooooooooooo Testovaní hypotézy proti jednostranné alternativě Je-li Hq hypotéza 9 = c, pak levostranná alternativní hypotéza je tvrzení 9 < c, pravostranná alternativní hypotéza je tvrzení 9 > c. Volba typu alternativní hypotézy vyplýva z konkrétní situace. • V predmetu Matematika 3 psali studenti písemku rozdělení na 2 skupiny. Hypotéza Hq : obě zadání mají stejnou průměrnou obtížnost je testována oproti oboustranné alternativní hypotéze zadání nejsou stejně obtížná. Náhodný výběr OOOOOOOOOOOO Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz oooo«ooooooooooo Testovaní hypotézy proti jednostranné alternativě Je-li Hq hypotéza 9 = c, pak levostranná alternativní hypotéza je tvrzení 9 < c, pravostranná alternativní hypotéza je tvrzení 9 > c. Volba typu alternativní hypotézy vyplýva z konkrétní situace. • V predmetu Matematika 3 psali studenti písemku rozdělení na 2 skupiny. Hypotéza Hq : obě zadání mají stejnou průměrnou obtížnost je testována oproti oboustranné alternativní hypotéze zadání nejsou stejně obtížná. 9 V předmětu Matematika 3 se dříve po studentech nevyžadovalo řešení domácích úloh. Toto bylo nyní nově zavedeno s cílem dosažení lepších výsledků studentů u závěrečné zkoušky. V tomto případě zřejmě použijeme nulovou hypotézu Hq : výsledné bodové hodnocení se nezlepšilo oproti pravostranné alternativní hypotéze H\ : bodový výsledek studentů se zlepšil Náhodný výběr Bodové a intervalové odhady Testování hypotéz OOOOOOOOOOOO OOOOOOOOOOOO OOOOO0OOOOOOOOOO Jednoduchý príklad Příklad Náš protivník hodil 60x kostkou a padla mu 16x šestka. Testujme na hladině významnosti a = 0,05 nulovou hypotézu Hq : kostka není upravená oproti jednostranné alternativní hypotéze H\ : kostka je upravená tak, aby padalo více šestek. Náhodný výběr Bodové a intervalové odhady Testování hypotéz OOOOOOOOOOOO OOOOOOOOOOOO OOOOOÄOOOOOOOOOO Jednoduchý príklad Příklad Náš protivník hodil 60x kostkou a padla mu 16x šestka. Testujme na hladině významnosti a = 0,05 nulovou hypotézu Hq : kostka není upravená oproti jednostranné alternativní hypotéze H\ : kostka je upravená tak, aby padalo více šestek. Statistika T {počet šestek) ma rozdělení T ~ 6/(60,1/6). Kritický obor je dán 95. percentilem tohoto rozdělení. Snadno vypočteme, že P{T > 14) = 0,065 a P{T > 15) = 0,034, proto je p-hodnota rovna 0,034 (nebo jinými slovy: kritickým oborem na hladině 0,05 je interval (16, oc). Hypotézu Hq tedy zamítáme - na hladině 0,05 můžeme tvrdit, že kostka je upravená. Náhodný výběr Bodové a intervalové odhady Testování hypotéz OOOOOOOOOOOO OOOOOOOOOOOO 000000*000000000 Jednoduchý príklad - pokr. Řešení (pomocí aproximace) Porovnejme předchozí řešení příkladu s řešením, při kterém využijeme aproximaci pomocí de Moive-Laplaceovy věty. Náhodnou veličinu v= 7"-10 lze považovat za veličinu mající normální rozdělení A/(/i, a2) s jednotkovým rozptylem a2 = 1, testovat budeme hypotézu ji — Q. Náhodný výběr Bodové a intervalové odhady Testování hypotéz OOOOOOOOOOOO OOOOOOOOOOOO 000000*000000000 Jednoduchý príklad - pokr. Řešení (pomocí aproximace) Porovnejme předchozí řešení příkladu s řešením, při kterém využijeme aproximaci pomocí de Moive-Laplaceovy věty. Náhodnou veličinu v= 7"-10 yšoTě lze považovat za veličinu mající normální rozdělení A/(/i, a2) s jednotkovým rozptylem a2 = 1, testovat budeme hypotézu ji — Q. Kritickým oborem A/(0,1) je interval (1,65, oc) (stále uvažujeme pravostranou alternativu). Přitom pro realizaci statistiky X platí x = (16 — 10)/^/50/6 ~ 2,08 a hypotézu tedy opět zamítáme. Náhodný výběr Bodové a intervalové odhady Testování hypotéz OOOOOOOOOOOO OOOOOOOOOOOO 000000*000000000 Jednoduchý príklad - pokr. Řešení (pomocí aproximace) Porovnejme předchozí řešení příkladu s řešením, při kterém využijeme aproximaci pomocí de Moive-Laplaceovy věty. Náhodnou veličinu v= 7"-10 lze považovat za veličinu mající normální rozdělení A/(/i, a2) s jednotkovým rozptylem a2 = 1, testovat budeme hypotézu ji — Q. Kritickým oborem A/(0,1) je interval (1,65, oc) (stále uvažujeme pravostranou alternativu). Přitom pro realizaci statistiky X platí x = (16 — 10)/^/50/6 ~ 2,08 a hypotézu tedy opět zamítáme. Jednostranným intervalem spolehlivosti pro X je ((2,08 — l,65)/v/6Ô, oo) a protože do něj nepatří hodnota O zamítáme nulovou hypotézu (všimněte si, že v obou případech rozhodlo porovnání 1,65 < 2,08). Náhodný výběr Bodové a intervalové odhady Testování hypotéz OOOOOOOOOOOO OOOOOOOOOOOO OOOOOOO0OOOOOOOO Jednoduchý príklad - pokr. Řešení (pomocí aproximace a p-hod noty ) Určeme nejmenší pravděpodobnost p, při níž stále ještě zamítáme nulovou hypotézu ji — 0 oproti pravostranné hypotéze ji > 0 (tj. p-hodnotu). Má-li X rozdělení A/(0,1), pak p = p(x > 2,08) = 1 - 0,981 = 0,019. Náhodný výběr Bodové a intervalové odhady Testování hypotéz OOOOOOOOOOOO OOOOOOOOOOOO OOOOOOOÄOOOOOOOO Jednoduchý príklad - pokr. Řešení (pomocí aproximace a p-hod noty ) Určeme nejmenší pravděpodobnost p, při níž stále ještě zamítáme nulovou hypotézu ji — 0 oproti pravostranné hypotéze ji > 0 (tj. p-hodnotu). Má-li X rozdělení A/(0,1), pak p = p(x > 2,08) = 1 - 0,981 = 0,019. Protože je a = 0,05 > 0,019, opět hypotézu zamítáme. Náhodný výběr OOOOOOOOOOOO Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz OOOOOOOO0OOOOOOO Základní testy hypotéz o parametrech normálního rozdělení Podobně jako statistiky při konstrukci intervalů spolehlivosti jsou i základní testy standardizované (není divu - jak jsme viděli, jde o úzce propojené pojmy). Náhodný výběr Bodové a intervalové odhady Testování hypotéz OOOOOOOOOOOO OOOOOOOOOOOO OOOOOOOO0OOOOOOO Základní testy hypotéz o parametrech normálního rozdělení Podobně jako statistiky při konstrukci intervalů spolehlivosti jsou i základní testy standardizované (není divu - jak jsme viděli, jde o úzce propojené pojmy). z-test Nechť je Xi,... ,Xn náhodný výběr z rozdělení A/(/i, a2) se známým a2 a n > 2. Test Hq \ 11 — c proti alternativní hypotéze ji ^ c se nazývá z-test. Náhodný výběr OOOOOOOOOOOO Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz OOOOOOOO0OOOOOOO Základní testy hypotéz o parametrech normálního rozdělení Podobně jako statistiky při konstrukci intervalů spolehlivosti jsou i základní testy standardizované (není divu - jak jsme viděli, jde o úzce propojené pojmy). z-test Nechť je Xi,... ,Xn náhodný výběr z rozdělení A/(/i, a2) se známým a2 a n > 2. Test Hq \ 11 — c proti alternativní hypotéze ji ^ c se nazývá z-test. jednovýběrový t-test Nechť je Xi,... ,Xn náhodný výběr z rozdělení A/(/i,a2) s neznámým a2 a n > 2. Test Hq \ ji — c proti alternativní hypotéze /i^ c se nazývá jednovýběrový t-test. Náhodný výběr Bodové a intervalové odhady Testování hypotéz OOOOOOOOOOOO OOOOOOOOOOOO OOOOOOOO0OOOOOOO Základní testy hypotéz o parametrech normálního rozdělení Podobně jako statistiky při konstrukci intervalů spolehlivosti jsou i základní testy standardizované (není divu - jak jsme viděli, jde o úzce propojené pojmy). z-test Nechť je Xi,... ,Xn náhodný výběr z rozdělení A/(/i, a2) se známým a2 a n > 2. Test Ho : M = c proti alternativní hypotéze ji ^ c se nazývá z-test. jednovýběrový t-test Nechť je Xi,... ,Xn náhodný výběr z rozdělení A/(/i,a2) s neznámým a2 a r? > 2. Test Hq \ ji — c proti alternativní hypotéze /i^ c se nazývá jednovýběrový t-test. dvouvýběrový t-test Nechť je Xn,..., Xmi náhodný výběr z rozdělení A/(/ii, a2) a X12,..., Xn2 na něm nezávislý náhodný výběr z rozdělení A/(//2,cr2) s m,/? > 2 a neznámým a2. Test Hq \ ji\ — 112 — c proti Hi : /ii — /i2 7^ c se nazývá dvouvýběrový t-test. Náhodný výběr OOOOOOOOOOOO Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz OOOOOOOOO0OOOOOO Základní testy hypotéz o parametrech normálního rozdělení párový t-test Necht je (Xi, y\) ,..., (Xn, yn) výběr z rozdělení sn>2a neznámými parametry. Test Hq : jjli — ji2 — c oproti H\ : ji\ — fi2 ^ c se nazývá párový t-test. Náhodný výběr oooooooooooo Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz OOOOOOOOO0OOOOOO Základní testy hypotéz o parametrech normálního rozdělení párový t-test Necht je (Xi, y\) ,..., (Xn, yn) výběr z rozdělení s n > 2 a neznámými parametry. Test Hq : fii — fi2 — c oproti H\ : ji\ — {12 7^ c se nazývá párový t-test. F-test Necht je Xn,..., Xmi náhodný výběr z rozdělení A/(/ii, o^) a X12,..., Xn2 na něm nezávislý náhodný výběr z rozdělení A/(/i2, 0*2) s m, r? > 2. Test /-/o : O1/02 — 1 Prot' H\\ a\la\^\ nazývá F-test. Náhodný výběr oooooooooooo Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz OOOOOOOOO0OOOOOO Základní testy hypotéz o parametrech normálního rozdělení párový t-test Necht je (Xi, y\) ,..., (Xn, yn) výběr z rozdělení s n > 2 a neznámými parametry. Test Hq \ fii — fi2 — c oproti Hi \ fii — fi2 7^ c se nazývá párový t-test. F-test Necht je Xn,..., Xmi náhodný výběr z rozdělení A/(/ii, a2) a X12,..., Xn2 na něm nezávislý náhodný výběr z rozdělení A/(/i2, 0*2) s m, r? > 2. Test Ho\ g\Ig\ — \ proti Hi : g\Jg\ 7^ 1 se nazývá F-test. test rozptylu Necht je Xi,..., Xn náhodný výběr z A/(/i, a2) s neznámým /i a r? > 2. Test Hq : a2 = c proti Hi : a2 7^ c se nazývá test o rozptylu. Náhodný výběr Bodové a intervalové odhady Testování hypotéz OOOOOOOOOOOO OOOOOOOOOOOO oooooooooo«ooooo Kritický obor testů normálního rozdělení z-test \(M-c)/(a/^)\ > ul-a/2 Náhodný výběr OOOOOOOOOOOO Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz oooooooooo«ooooo Kritický obor testů normálního rozdělení z-test \{M - c)/{ Ul_a/2 jednovýběrový t-test \(M — c)/(S/a/Ä7)| > ti_a/2(n — 1) Náhodný výběr Bodové a intervalové odhady Testování hypotéz OOOOOOOOOOOO OOOOOOOOOOOO oooooooooo«ooooo Kritický obor testů normálního rozdělení z-test \{M- c)/{a/yfn)\ > Ul_a/2 jednovýběrový t-test \(M — c)/(5/y/ň)| > ti_a/2(n — 1) dvouvýběrový t-test Mi - M2 - c m n > h-a/2(m + n - 2) □ S1 Náhodný výběr Bodové a intervalové odhady Testování hypotéz OOOOOOOOOOOO OOOOOOOOOOOO oooooooooo«ooooo Kritický obor testů normálního rozdělení z-test \{M - c)/{a/yfn)\ > Ul_a/2 jednovýběrový t-test \(M — c)/(S/a/Ä7)| > ti_a/2(n — 1) dvouvýběrový t-test Mi - M2 - c m n > h-a^im + n - 2) párový t-test sestrojením rozdílu Z; = X; — Y/ a fi = ji\ — {12 úlohu předvedeme na jednovýběrový t— test Náhodný výběr Bodové a intervalové odhady Testování hypotéz oooooooooooo oooooooooooo oooooooooo«ooooo Kritický obor testů normálního rozdělení z-test \{M - c)/{a/yfn)\ > Ul_a/2 jednovýběrový t-test \(M — c)/(S/a/Ä7)| > ti_a/2(n — 1) dvouvýběrový t-test Mi - M2 - c * v m 1 n > h-a^im + n - 2) párový t-test sestrojením rozdílu Z; = X; — y\ a ji — úlohu předvedeme na jednovýběrový t— F-test 52/S| < Fa/2{m — 1, n — 1) nebo Sl/Sl^F^^m-l.n-l) Ml - test Náhodný výběr Bodové a intervalové odhady Testování hypotéz OOOOOOOOOOOO OOOOOOOOOOOO oooooooooo«ooooo Kritický obor testů normálního rozdělení z-test \{M - c)/{a/yfn)\ > Ul_a/2 jednovýběrový t-test \(M — c)/(S/a/Ä7)| > ti_a/2(n — 1) dvouvýběrový t-test Mi - M2 - c * v m 1 n > h-a^im + n - 2) párový t-test sestrojením rozdílu Z; = X; — y\ a ji — úlohu předvedeme na jednovýběrový t— F-test S1/S2 < Fa/2{m — 1, n — 1) nebo SÍ/SŽ^F^pim-^n-l) test rozptylu (r? — l)S2/c < Xa/2^n ~ ^) ne^° (n-l)S2/c>xL/2(^-l) Ml - test >0 0,0 Náhodný výběr oooooooooooo Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz OOOOOOOOOOO0OOOO Aktivní studenti chtěli dopravnímu podniku dokázat, že autobusy trpí většími výkyvy příjezdových dob na danou zastávku než tramvaje a provedli měření odchylek od jízdního řádu: autobus 0 2 4 -3 2 -4 -3 0 0 5 tramvaj 4 6 3 0 -2 2 0 1 1 0 Z tabulky lze snadno vypočítat, že S± = 9,12 a S2 = 5,39. O Na hladině 0,05 testujte nulovou hypotézu, že autobus i tramvaj jsou stejně spolehlivé oproti alternativní hypotéze, že tramvaj je spolehlivější. O Určete maximální pravděpodobnost, s níž můžete tvrdit, že je tramvaj spolehlivější než autobus. Náhodný výběr OOOOOOOOOOOO Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz OOOOOOOOOOOO0OOO Príklad Ve dvou nádržích se zkoumal obsah chlóru. Z první bylo odebráno 22 vzorků, z druhé 10 vzorků. Byly vypočteny následující hodnoty výběrových průměrů a rozptylů: M\ — 34,23, M2 — 35,73, S\ — 1,76, S| = 1,81. Hodnoty zjištěné z odebraných vzorků považujeme za realizace dvou nezávislých náhodných výběrů z rozdělení A/(/ii, a2), resp. N(n2,a2). Sestrojte 95% interval spolehlivosti pro rozdíl středních hodnot m — ji2 a vyslovte závěr na dané hladině spolehlivosti o podstatnosti rozdílu naměřených hodnot. Náhodný výběr oooooooooooo Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz OOOOOOOOOOOO0OOO Ve dvou nádržích se zkoumal obsah chlóru. Z první bylo odebráno 22 vzorků, z druhé 10 vzorků. Byly vypočteny následující hodnoty výběrových průměrů a rozptylů: M\ — 34,23, M2 = 35,73, S2 = 1,76, S| = 1,81. Hodnoty zjištěné z odebraných vzorků považujeme za realizace dvou nezávislých náhodných výběrů z rozdělení A/(/ii, a2), resp. A/(/i2,cr2)- Sestrojte 95% interval spolehlivosti pro rozdíl středních hodnot m — 112 a vyslovte závěr na dané hladině spolehlivosti o podstatnosti rozdílu naměřených hodnot. Dosadíme do vztahu Mľ - M2 ± S*y ^ + \ • ri_a/2(™ + n-2) hodnoty M\ — M2 — —1,5, S* = 1,3323 a dostaneme interval (—2,5377;—0,4623). Do tohoto intervalu 0 nepatří, proto je rozdíl Mi — statisticky významně různý od nuly. Náhodný výběr OOOOOOOOOOOO Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz OOOOOOOOOOOOO0OO Komplexní příklad na dvou výběrový t-test Uvažme bodové výsledky studentů z 2. termínu zkoušky predmetu MB103 v roce 2008, přičemž výsledky testů skupiny A a skupiny B považujeme za dva nezávislé výběry z normálního rozdělení. Úkolem je zjistit, jestli výsledky některé ze skupin byly statisticky významně horší. Testujme nulovou hypotézu Hq : ji\ — ji2 — 0 oproti alternativní hypotéze H\ : ji\ ^ ji2. Náhodný výběr OOOOOOOOOOOO Komplexní příklad na Bodové a intervalové odhady OOOOOOOOOOOO d vo u výběrový t-test Testování hypotéz OOOOOOOOOOOOO0OO Príklad Uvažme bodové výsledky studentů z 2. termínu zkoušky predmetu MB103 v roce 2008, přičemž výsledky testů skupiny A a skupiny B považujeme za dva nezávislé výběry z normálního rozdělení. Úkolem je zjistit, jestli výsledky některé ze skupin byly statisticky významně horší. Testujme nulovou hypotézu Hq : ji\ — ji2 — 0 oproti alternativní hypotéze H\ : ji\ ^ fi2. Řešení Nejprve pomocí F-testu otestujeme hypotézu o stejných rozptylech, v případě úspěchu poté použijeme dvou výběrový t-test. Vypočteme základní statistiky: Náhodný výběr OOOOOOOOOOOO Komplexní příklad na Bodové a intervalové odhady OOOOOOOOOOOO dvouvýběrový t-test Testování hypotéz OOOOOOOOOOOOO0OO Príklad Uvažme bodové výsledky studentů z 2. termínu zkoušky predmetu MB103 v roce 2008, přičemž výsledky testů skupiny A a skupiny B považujeme za dva nezávislé výběry z normálního rozdělení. Úkolem je zjistit, jestli výsledky některé ze skupin byly statisticky významně horší. Testujme nulovou hypotézu Hq : ji\ — 112 — 0 oproti alternativní hypotéze H\ : ji\ ^ ji2- Řešení Nejprve pomocí F-testu otestujeme hypotézu o stejných rozptylech, v případě úspěchu poté použijeme dvouvýběrový t-test. Vypočteme základní statistiky: rozsah výb. průměr výb. rozptyl A 65 10,48 22,49 B 64 7,21 29,75 00,0 Náhodný výběr oooooooooooo Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz oooooooooooooo«o Řešení (Komplexní příklad na dvouvýběrový t-test (pokr.)) Dostávame3 S^/Sf = 0,76 a protože F(0,025; 64; 63) = 0,61, nezamítáme hypotézu o rovnosti rozptylu. Náhodný výběr OOOOOOOOOOOO Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz oooooooooooooo«o Řešení (Komplexní příklad na dvouvýběrový t-test (pokr.)) Dostáváme3 S^/Sf = 0,76 a protože F(0,025; 64; 63) = 0,61, nezamítáme hypotézu o rovnosti rozptylů. O tomtéž se přesvědčíme i vypočtením intervalu spolehlivosti si/s? si/s? Fi-a/i{m ~ 1, n - 1)' Fa/2(m - 1, n - 1) (0,46; 1,24) v němž leží testovaný podíl rozptylů 1 Náhodný výběr OOOOOOOOOOOO Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz oooooooooooooo«o Řešení (Komplexní příklad na dvouvýběrový t-test (pokr.)) Dostáváme3 S^/Sf = 0,76 a protože F(0,025; 64; 63) = 0,61, nezamítáme hypotézu o rovnosti rozptylů. O tomtéž se přesvědčíme i vypočtením intervalu spolehlivosti Fi-a/2{™ - 1, n - 1)' Fa/2(m - 1, n - 1) (0,46; 1,24) v němž leží testovaný podíl rozptylů 1. Budeme tedy dále s výběry pracovat s předpokladem, že mají stejný rozptyl a použijeme dvouvýběrový t-test. Detaily výpočtů jsou uvedeny v doprovodném souboru Náhodný výběr oooooooooooo Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz ooooooooooooooo* Řešení (Komplexní příklad na dvouvýběrový t-test (pokr.)) Vypočteme vážený průměr výběrových rozptylů 2 (m - 1)S2 + (n - 1)522 2 m + r? — 2 dále Mľ-M2 = 3,27 Náhodný výběr oooooooooooo Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz ooooooooooooooo* Řešení (Komplexní příklad na dvouvýběrový t-test (pokr.)) Vypočteme vážený průměr výběrových rozptylů 2 (m - 1)S* + (n - 1)522 2 m + n — 2 dále Mi — M2 = 3,27. V tabulkách najdeme hodnotu to,975(65 + 64 - 2) = 1,98, a protože 7 = Mi - M2 S* \l 55 + 54 3,64, docházíme k závěru, že můžeme hypotézu o stejné střední hodnotě obou rozdělení (tj. hypotézu [i\ — ^2) zamítnout (neboť 3,64 > 1,98). 9 q,o Náhodný výběr OOOOOOOOOOOO Bodové a intervalové odhady OOOOOOOOOOOO Testování hypotéz ooooooooooooooo* Řešení (Komplexní příklad na dvouvýběrový t-test (pokr.)) Vypočteme vážený průměr výběrových rozptylů 2 (m - 1)S* + (n - 1)522 2 m + n — 2 dále Mi — M2 = 3,27. V tabulkách najdeme hodnotu ŕo,975(65 + 64 - 2) = 1,98, a protože T = Mi - M2 55 + 54 3,64, docházíme k závěru, že můžeme hypotézu o stejné střední hodnotě obou rozdělení (tj. hypotézu [i\ — ^2) zamítnout (neboť 3,64 > 1,98).Toto opět ověříme výpočtem intervalu spolehlivosti, který má střed v M\ — M2 a velikost rovnou dvojnásobku ^*\jm + n ' ŕi-a/2(m + n - 2) 1,78, proto je interval spolehlivosti roven (1,49; 5,05).