M5VM05 Statistické modelování 3. Testování statistických hypotéz Jan Koláček (kolacek@math.muni.cz) s Ustav matematiky a statistiky, Přírodovědecká fakulta, Masarykova univerzita, Brno M5VM05 Statistické modelování 1/34 Testování statistických hypotéz Mějme náhodný výběr X = (Xi,... ,Xn)f rozsahu n z rozdělení o distribuční funkci F(x;0), kde 6 = (Q\,...,Qm)r £ 0 C Rm. Množina 0 nechť je neprázdná a otevřená. Předpokládejme, že o parametru 6 existují dvě konkurující si hypotézy: h0: e e 0O c e Hi: e e 0i = e - e0 Hq se nazývá nulovou hypotézou. Hi alternativní hypotézou. Tvrzení O platnosti této hypotézy se má rozhodnout na základě náhodného výběru /v v \/ i v zamítneme nebo . . , TT X= (Xi,...,XnJ , a to tak, ze ^ _____rj_____ platnost hypotézy Hq. nezamítneme Jan Koláček (PřF MU) M5VM05 Statistické modelování Testování statistických hypotéz Na testování použijeme statistiku Tn = T(X), kterou nazýváme testovací statistikou. Množinu hodnot, které může testovací statistika nabýt, rozdělíme na dvě disjunktní oblasti. Jednu označíme Wa , a nazveme ji kritickou oblastí (nebo také oblastí zamítnutí hypotézy) a druhá je doplňkovou oblastí (oblast nezamítnutí testované hypotézy). Na základě realizace náhodného výběru x = (x\,... ,xn)r vypočítáme hodnotu testovací statistiky tn = T(x). • Pokud hodnota testovací statistiky tn nabude hodnoty z kritické oblasti, tj tn = T(x) £ Woc , pak nulovou hypotézu zamítáme. Pokud hodnota testovací statistiky nabude hodnoty z oblasti nezamítnutí, tj tn = T(x) ^ Woc , tak nulovou hypotézu nezamítáme, což ovšem neznamená že přijímáme alternativu Jan Koláček (PřF MU) M5VM05 Statistické modelování 3/34 Testování statistických hypotéz Ho PLATÍ NEPLATÍ ZAMÍTÁME tn = T(x) e Wa chyba 1. druhu (#o je hladina testu) 7(^0) : V tomto případě využijeme dolní odhad Dn(X) parametrické funkce j(0) o spolehlivosti 1 — oc. Pokud platí nulová hypotéza, pak l-a = P0 (D„(X) < 7(0O)). takže kritický obor tohoto testu má tvar: Wa = {XGlRM:DřI(X)>7(0o)}. Jan Koláček (PřF MU) M5VM05 Statistické modelování 8/34 Vztah mezi testy a intervalovými odhady C Hypotéza Hq : y(0) = 7(#o) Pr°ti (tzv. jednostranné) alternativě H\ : 7(0) < 7(60) V tomto případě využijeme horní odhad Hn(X) parametrické funkce 7(6) o spolehlivosti 1 — oc. Pokud platí nulová hypotéza, pak l-ct = P0 (y(0o) au1_oc a2 známé ]í = jí0 ]l > ]lQ (X-po)y/ň > CTUX-ol a2 známé ]í = jí0 (X-po)y/ň < -ctux-ol a2 známé ]í = jí0 H ŕ Ho X — fiQ ^Jň > St1_ot(n — 1) a2 neznámé jí = jío ]l> fl0 (X -}iQ)^ň> Stx-ocin - 1) a2 neznámé ]í = jí0 (X -}iu)^ň< -Stx-ocin - 1) a2 neznámé 2 2 o* ŕ o* {n-fZč(xl(n l),xL(n 1)) ]i neznámé 2 2 ]i neznámé 2 2 ct2<(tI (n-fZ 136,1 . Rozptyl cr2 = 6,42 cm2, zjištěný v roce 1951 (kdy se provádělo rozsáhlé šetření), můžeme považovat za známý, nebot variabilita výšek zůstává (na rozdíl od střední výšky) téměř nezměněná. Jan Koláček (PřF MU) M5VM05 Statistické modelování 11/34 Řešení Řešení (I) Testování nulové hypotézy pomocí pivotové statistiky Uy- a kritické hodnoty. Protože kritický obor Wq lze ekvivalentně vyjádřit i takto W0 = {x G Kn : x - ^ji/i_Ä >fo} = {xGRw:íí, = ™ > «1-«} , počítejme = 139/13634 136/1 \/l5 = 1,835. Protože u-x = 1,835 překračuje kritickou hodnotu t/i-^ = t/o,95 = 1/645, nulovou hypotézu na 5% hladině zamítneme ve prospěch alternativní hypotézy, že se střední výška desetiletých hochů zvětšila. Jan Koláček (PřF MU) M5VM05 Statistické modelování 12/ Řešení (II) Testování nulové hypotézy 132 133 134 135 136 137 138 139 140 141 X =139.1333 p r um p-val=0.033206 )MOCÍ p-HODNOTY Dosažená hladina odpovídající testové statistice (tj. tzv. p-hodnota, anglicky P-value, significance value), což je nejmenší hladina testu, při které bychom ještě hypotézu Hq zamítli, je rovna 0,033, takže například při oc = 2,5% by již dosažený výsledek nebyl statisticky významný. Protože p-hodnota je menší než zvolená hladina významnosti oc = 0.05, hypotézu zamítáme. Jan Koláček (PřF MU) M5VM05 Statistické modelování 13/34 Řešení (III) Testování nulové hypotézy pomocí intervalu spolehlivosti (D,+oo) Protože jde o jednostranný test, použijeme dolní odhad střední hodnoty /i d = x-^ru1_0i = 139,133 - 4= 1/645 = 136,415 Vn v15 Protože interval spolehlivosti (136,415,+oo) nepokrývá hodnotu 136,1, proto nulovou hypotézu na hladině významnosti oc = 0,05 zamítáme. Jan Koláček (PřF MU) M5VM05 Statistické modelování 14/ Testy dvou nezávislých výběrů • první náhodný výběr -U-{Xi,.. 9 druhý náhodný výběr x{Y1/. • označme ^12 — .,XWl} ~ N(jilfof), .,yn2} ~ n (1*2,02)* (n1-l)S21 + (n2-l)S22 711+712—2 H0 Hi H0 zamítáme, pokud (X', Y')' G W« Předpoklady h = m cf\,cr\ známé h = m x-y >tl_.(n1+n2-2)s12y/^ ^1 = ^2 nezr,ánrié ^ t {fa (ni-l,n2-l),-Fi_a (ni-l,n2-l)) ]i\,]i2 neznámé Jan Koláček (PřF MU) M5VM05 Statistické modelování 15/34 Příklad Příklad 2 (Dva nezávislé náhodné výběry z normálního rozdělení při neznámých ale stejných rozptylech) Bylo vybráno 13 polí stejné kvality Na 8 z nich se zkoušel nový způsob hnojení, zbývajících 5 bylo ošetřeno běžným způsobem. Výnosy pšenice uvedené v tunách na hektar jsou označeny Xj u nového a Y j u běžného způsobu hnojení Je třeba zjistit, zda způsob hnojení má vliv na výnos pšenice. Xi 5,7 5,5 4,3 5,9 5,2 5,6 5,8 5,1 v. 5fQ 4,5 4,2 5,4 4,4 4.2 4.4 4.6 4. Jan Koláček (PřF MU) M5VM05 Statistické modelování 16/34 Řešení Řešení Budeme nejprve testovat hypotézu Hq : -\ = 1 proti alternativě o2 H\ : -\ 7^ 1 . Za pivotovou statistiku zvolíme statistiku 2 F=iH ~ F(m-1^2-1). ^2 ^ (a) Můžeme například vypočítat statistiku F za platnosti nulové hypotézy a porovnat ji s příslušnými oboustrannými kvantily. / =^ = 1,1243 F«(ni-l,n2-l) = 0,1811 Fi-f («i-l/«2-l) =9,0741 Hq nezamítáme Jan Koláček (PřF MU) M5VM05 Statistické modelování 17/ Řešení (b) Další možností je spočítat p-hodnotu a srovnat se zvolenou hladinou testu oc\ p-value = 0,9656 > 0,05 Protože p-hodnota je výrazně větší než zvolená hladina testu, hypotézu o rovnosti rozptylů proti alternativě nerovnosti nezamítáme. 0 . 7 r 0 . 6 0 . 5 0 . 1 0 . 3 0.2 0 . 1 0 0123456789 10 F=l.1243 p-val=0.96557 Jan Koláček (PřF MU) M5VM05 Statistické modelování 18/34 Řešení (c) A naposledy můžeme ještě zkonstruovat 100(1 — oc)% interval spolehlivosti o2 pro podíl rozptylů -\ ls{_1_S\ 1 ^i-f (ni —l/n2 —1)r S\ F*(n\ — l,n2 — 1) a zjistit, zda pokrývá hodnotu 1. Protože dostáváme interval (0,1239;6,2088), který pokrývá jedničku, hypotézu nezamítáme. Jan Koláček (PřF MU) M5VM05 Statistické modelování 19/ Řešení (I) Testování pomocí statistiky T a kritické hodnoty Vypočítáme-li hodnotu statistiky 0.35 h 0.25 h X-Y- (]i\ -fí2) S 12 n\U2 U\ + ÍÍ2 0.15 0.05 h a porovnáme s kvantilem Studentova rozdělení, h-y = 2.3697 > ři_a/2(ll) = 2.201, takže hypotézu 2 3 T=2.3697 p-val=0.037169 Ho : M - }ii = 0 zamítáme. Jan Koláček (PřF MU) M5VM05 Statistické modelování 20 Řešení (II) Testování pomocí p-hodnoty Vypočítáme-li p-hodnotu a porovnáme se zvolenou hladinou významnosti oc = 0.05 p = 2P(\TX_?\ >t)= 2(1 - P(\Tx_y\ < ř)) = 0.037169 < oc takže hypotézu zamítáme. H0 : ]i\ - ]i2 = 0 Jan Koláček (PřF MU) M5VM05 Statistické modelování 21 / 34 Řešení (III) Testování nulové hypotézy pomocí intervalu spolehlivosti ž-ý±íi_«(v) s12^g^= (0,6875 ±2,201-0,5089/1,7541 = (0,048958; 1,326 Protože interval spolehlivosti nepokrývá nulu, na dané hladině významnosti hypotézu zamítáme ve prospěch alternativy. Jan Koláček (PřF MU) M5VM05 Statistické modelování Příklad Příklad 3 (Párový test) Na sedmi rostlinách byl posuzován vliv fungicidního přípravku podle počtu skvrn na listech před a týden po použití přípravku. Otestujte, zdali má přípravek vliv na počet skvrn na listech. Data udávající počet skvrn na listech před a po použití přípravku: před použitím přípravku X\ 9 17 31 7 8 20 10 po použití přípravku X2 10 11 18 6 7 17 5 Jan Koláček (PřF MU) M5VM05 Statistické modelování 23 / 34 Řešení (I) Testovaní pomočí štatistiky T a kritické hodnoty Položme Z = X| — X2. Vypočítáme-li hodnotu štatistiky 0.35 ■ 0.25 ■ 0.15 0.05 ■ 2 3 T=2.2736 p-val=0.063354 T = ž a porovnáme s kvantilem Studentova rozdělení, tj t s \ n = 2,2736 ? ři_a/2(n - 1) = 2,4469, takže hypotézu H0 : ^1 - ]i2 = 0 nezamítáme. Jan Koláček (PřF MU) M5VM05 Statistické modelování 24 / 34 (II) Testování pomocí ^-hodnoty Vypočítáme-li p-hodnotu a porovnáme se zvolenou hladinou významnosti oc = 0,05 p = 2P(\T\ >í) = 2(1 — P(|T| <ř)) = 0,06335 > oc takže hypotézu H0 : ]i\ - }ii = 0 nezamítáme Řešení (III) Testování nulové hypotézy pomocí intervalu spolehlivosti ž±řl-a/2(rc-l) -s/Vň = 4 ± 2,4469 • 4,6547/2,6458 = [-0,30492; 8,3049] Protože interval spolehlivosti pokrývá hodnotu Z = 0, na dané hladině významnosti hypotézu nezamítáme. Shrneme-li předchozí výsledky slovně, pak nulovou hypotézu o tom, že přípravek nemá vliv na počet skvrn na hladině významnosti oc = 0,05 nemůžeme zamítnout oproti alternativě o jeho vlivu. Jan Koláček (PřF MU) M5VM05 Statistické modelování 26 / 34 Asymptotické testy Nechť -U-{Xi,... ,Xn} ~ jC(fi(d),cr (0)) s konečnými druhými momenty n (s výběrovým průměrem X = ^ ^ Xz- a se = S*(X), což je (slabě) i=l konzistentní odhad rozptylu cr2(d)): H0 Hi Hq zamítáme, pokud X G Wa Předpoklady fi = ji0 P ŕ Ho X-fi0 s* v — i 2 0 < ŕr2(0) < oo fi = ji0 P ŕ Ho X-flQ x{Xi,...,Xn} ~Po(p) P = Po P ŕ PO Po(l-) — \fň > w-i ^ JL^,...^}-^) Jan Koláček (PřF MU) M5VM05 Statistické modelování 27/34 Příklad Příklad 4 Při 40 hodech mincí byl rub zaznamenán 22krát. Je důvod se domnívat, že rub nepadá stejně často jako líc? Řešení Označme Xj, i = 1,.. .,40 náhodnou veličinu nabývající hodnoty 1, pokud padne rub a hodnoty 0, pokud padne líc. Zřejmě Xj ~ A{p). Testujeme hypotézu Hq : p = 0,5 proti alternativní hypotéze H\ : p 7^ 0,5. Vypočteme průměr x = |^ = 0,55 a směrodatnou odchylku s = ^0,5(1 -0,5) = 0,5. Jan Koláček (PřF MU) M5VM05 Statistické modelování 28 / 34 Řešení (I) Testování nulové hypotézy pomocí pivotové statistiky a kritické hodnoty. Protože kritický obor Wq lze ekvivalentně vyjádřit i takto o x G Rn : Uf = x—p VVoCL-Po) počítejme = q/5q/5Q/5 = 0,6325. Protože u-x = 0,6325 nepřekračuje kritickou hodnotu a. = ^0 975 = 1,96, nulovou hypotézu na 5% hladině 1 2 nezamítáme. Jan Koláček (PřF MU) M5VM05 Statistické modelování (II) Testování pomocí p-hodnoty Vypočítáme p-hodnotu a porovnáme se zvolenou hladinou významnosti oc = 0,05 p = 2P(\Ux\ >u-x) = 2(1-P(|lfe|