M5VM05 Statistické modelování 3. Testování statistických hypotéz
Jan Koláček (kolacek@math.muni.cz)
s
Ustav matematiky a statistiky, Přírodovědecká fakulta, Masarykova univerzita, Brno
M5VM05 Statistické modelování
1/34
Testování statistických hypotéz
Mějme náhodný výběr X = (Xi,... ,Xn)f rozsahu n z rozdělení o distribuční funkci F(x;0), kde 6 = (Q\,...,Qm)r £ 0 C Rm. Množina 0 nechť je neprázdná a otevřená.
Předpokládejme, že o parametru 6 existují dvě konkurující si hypotézy:
h0: e e 0O c e Hi: e e 0i = e - e0
Hq se nazývá nulovou hypotézou. Hi alternativní hypotézou.
Tvrzení
O platnosti této hypotézy se má rozhodnout na základě náhodného výběru
/v       v \/          i  v       zamítneme nebo    . .       , TT
X= (Xi,...,XnJ , a to tak, ze  ^ _____rj_____ platnost hypotézy Hq.
nezamítneme
Jan Koláček (PřF MU)
M5VM05 Statistické modelování
Testování statistických hypotéz
Na testování použijeme statistiku Tn = T(X), kterou nazýváme testovací statistikou. Množinu hodnot, které může testovací statistika nabýt, rozdělíme na dvě disjunktní oblasti. Jednu označíme Wa , a nazveme ji kritickou oblastí (nebo také oblastí zamítnutí hypotézy) a druhá je doplňkovou oblastí (oblast nezamítnutí testované hypotézy).
Na základě realizace náhodného výběru x = (x\,... ,xn)r vypočítáme hodnotu testovací statistiky tn = T(x).
• Pokud hodnota testovací statistiky tn nabude hodnoty z kritické oblasti,
tj
tn = T(x) £ Woc , pak nulovou hypotézu zamítáme.
Pokud hodnota testovací statistiky nabude hodnoty z oblasti nezamítnutí, tj
tn = T(x) ^ Woc , tak nulovou hypotézu nezamítáme, což ovšem
neznamená že přijímáme alternativu
Jan Koláček (PřF MU)
M5VM05 Statistické modelování
3/34
Testování statistických hypotéz
Ho	PLATÍ	NEPLATÍ
ZAMÍTÁME tn = T(x) e Wa	chyba 1. druhu (#o je hladina testu) <x0    =    sup0G0Q Pe(T(X) e	O.K.  (tzv. sila testu či silo-funkce) 1-/5(0) = Pe(T(X) G W«Hi) pro 0 £ ©i
NEZAMÍTÁME tn = T(x) í Wa	O.K.	chyba 2. druhu 0(0) = Pe(T(X) £ Wafíi) pro
Jan Koláček (PřF MU)
M5VM05 Statistické modelování
4/
Chyby
Definice 1
Chybu, která spočíva v nesprávném zamítnutí nulové hypotézy, i když je správná, budeme nazývat chybou prvého druhu, pravděpodobnost
*0= sup Pe(T(X) e Wa|H0) OeG0
nazveme hladinou významnosti (též hladinou testu).
Chybu, která spočívá v nesprávném přijetí nulové hypotézy, i když neplatí, budeme nazývat chybou druhého druhu a její pravděpodobnost pro V0 G ©i označíme
j6(0)=Pe(r(X) čWalfíj).
Pravděpodobnost 1 — /5(0) nazýváme silou testu (též silou kritické oblasti Wa) a jakožto funkci 0 £ ©i ji také nazveme silofunkcí testu.
Jan Koláček (PřF MU)
M5VM05 Statistické modelování
5/34
Vztah mezi testy a intervalovými odhady
Mějme náhodný výběr X = (Xi,... ,Xn)f rozsahu n z rozdělení, které závisí na parametru d= (6\,... ,9m)ř G 0 a parametrickou funkci y(0).
a Hypotéza Hq : j(6) = j(6q) proti (tzv. oboustranné) alternativě
Hi : 7(0) ŕ 7(00) :
Mějme intervalový odhad (Dn(X),fín(X)) parametrické funkce j(6) o spolehlivosti 1 — oc. Pokud platí nulová hypotéza, pak
l-oc = Pe (D„(X) < 7(0O) < H„(X)),
takže kritický obor tohoto testu má tvar:
Wa = {X G R" : 7(0O) ^ (D„(X),H„(X))}
Jan Koláček (PřF MU)
M5VM05 Statistické modelování
6/34
Vztah mezi testy a intervalovými odhady
Zjistíme-li v konkrétní situaci, že
7(0o) í (dn(x),hn(x))
tj. realizace x £ Wa potom
• buď nastal jev, který má pravděpodobnost oc (volí se blízká nule),
• nebo neplatí nulová hypotéza.
Protože při obvyklé volbě oc = 0.05 nebo oc = 0.01 je tento jev „prakticky nemožný", proto nulovou hypotézu Hq zamítáme ve prospěch alternativy H\.
V opačném případě, tj. pokud
7(0o) ^ (4(x)A(x))
tj. realizace x £ Wa
nulovou hypotézu Hq nezamítáme.
Jan Koláček (PřF MU)
M5VM05 Statistické modelování
7/34
Vztah mezi testy a intervalovými odhady
B Hypotéza Hq : 7(0) = 7(#o) Pr°ti (tzv. jednostranné) alternativě
Hi : 7(0) > 7(^0) :
V tomto případě využijeme dolní odhad Dn(X) parametrické funkce j(0) o spolehlivosti 1 — oc. Pokud platí nulová hypotéza, pak
l-a = P0 (D„(X) < 7(0O)).
takže kritický obor tohoto testu má tvar:
Wa = {XGlRM:DřI(X)>7(0o)}.
Jan Koláček (PřF MU)
M5VM05 Statistické modelování
8/34
Vztah mezi testy a intervalovými odhady
C Hypotéza Hq : y(0) = 7(#o) Pr°ti (tzv. jednostranné) alternativě
H\ : 7(0) < 7(60) V tomto případě využijeme horní odhad Hn(X) parametrické funkce 7(6) o spolehlivosti 1 — oc. Pokud platí nulová hypotéza, pak
l-ct = P0 (y(0o)<Hn(X)),
takže kritický obor tohoto testu má tvar:
Wa = {XeRn:Hn(X)<7(60)}.
Testy o parametrech normálního rozdělení
Ho	Hi	Hypotézu Hq zamítáme, pokud X £ Wa, tj.	Předpoklady
]í = jí0	H ŕ Ho	X — fiQ ^Jň > au1_oc	a2 známé
]í = jí0	]l > ]lQ	(X-po)y/ň > CTUX-ol	a2 známé
]í = jí0		(X-po)y/ň < -ctux-ol	a2 známé
]í = jí0	H ŕ Ho	X — fiQ ^Jň > St1_ot(n — 1)	a2 neznámé
jí = jío	]l> fl0	(X -}iQ)^ň> Stx-ocin - 1)	a2 neznámé
]í = jí0		(X -}iu)^ň< -Stx-ocin - 1)	a2 neznámé
2 2	o* ŕ o*	{n-fZč(xl(n   l),xL(n 1))	]i neznámé
2 2			]i neznámé
2 2	ct2<(tI	(n-fZ<xl(n 1)	]i neznámé
Jan Koláček (PřF MU)
M5VM05 Statistické modelování
10/34
Příklad
Příklad 1 (Výška desetiletých chlapců)
V roce 1961 byla u 15 náhodně vybraných chlapců z populace všech desetiletých chlapců žijících v Československu zjištěna výška:
6
7
8
9
10
11
12
13
14
15
130     140     136     141     139     133     149     151     139     136     138     142     127     139 147
Je známo, že každá následující generace je v průměru o něco vyšší než generace předcházející Můžeme se tedy ptát, zda průměr x = 139.133 zjištěný v náhodném výběru rozsahu n = 15 znamená, že na 5% hladině máme zamítnout nulovou hypotézu Hq : ]i = 136,1 (zjištění z roku 1951) ve prospěch alternativní hypotézy
H1:jí> 136,1 .
Rozptyl cr2 = 6,42 cm2, zjištěný v roce 1951 (kdy se provádělo rozsáhlé šetření), můžeme považovat za známý, nebot variabilita výšek zůstává (na rozdíl od střední výšky) téměř nezměněná.
Jan Koláček (PřF MU)
M5VM05 Statistické modelování
11/34
Řešení
Řešení (I) Testování nulové hypotézy pomocí pivotové statistiky
Uy- a kritické hodnoty.
Protože kritický obor Wq lze ekvivalentně vyjádřit i takto
W0 = {x G Kn : x - ^ji/i_Ä >fo} = {xGRw:íí, = ™     > «1-«} ,
počítejme     = 139/13634 136/1 \/l5 = 1,835. Protože u-x = 1,835 překračuje kritickou hodnotu t/i-^ = t/o,95 = 1/645, nulovou hypotézu na 5% hladině zamítneme ve prospěch alternativní hypotézy, že se střední výška desetiletých hochů zvětšila.
Jan Koláček (PřF MU)
M5VM05 Statistické modelování
12/
Řešení
(II) Testování nulové hypotézy
132      133      134      135      136      137      138      139      140 141
X =139.1333
p r um
p-val=0.033206
)MOCÍ p-HODNOTY
Dosažená hladina odpovídající testové statistice (tj. tzv. p-hodnota, anglicky P-value, significance value), což je nejmenší hladina testu, při které bychom ještě hypotézu Hq zamítli, je rovna 0,033, takže například při oc = 2,5% by již dosažený výsledek nebyl statisticky významný. Protože p-hodnota je menší než zvolená hladina významnosti oc = 0.05, hypotézu zamítáme.
Jan Koláček (PřF MU)
M5VM05 Statistické modelování
13/34
Řešení
(III) Testování nulové hypotézy pomocí intervalu spolehlivosti (D,+oo)
Protože jde o jednostranný test, použijeme dolní odhad střední hodnoty /i
d = x-^ru1_0i = 139,133 - 4= 1/645 = 136,415
Vn v15
Protože interval spolehlivosti (136,415,+oo) nepokrývá hodnotu 136,1, proto nulovou hypotézu na hladině významnosti oc = 0,05 zamítáme.
Jan Koláček (PřF MU)
M5VM05 Statistické modelování
14/
Testy dvou nezávislých výběrů
• první náhodný výběr -U-{Xi,.. 9 druhý náhodný výběr x{Y1/.
• označme
^12 —
.,XWl} ~ N(jilfof),
.,yn2} ~ n (1*2,02)*
(n1-l)S21 + (n2-l)S22
711+712—2
H0	Hi	H0 zamítáme, pokud (X', Y')' G W«	Předpoklady
h = m			cf\,cr\ známé
h = m		x-y >tl_.(n1+n2-2)s12y/^	^1 = ^2 nezr,ánrié
		^ t {fa (ni-l,n2-l),-Fi_a (ni-l,n2-l))	]i\,]i2 neznámé
Jan Koláček (PřF MU)
M5VM05 Statistické modelování
15/34
Příklad
Příklad 2 (Dva nezávislé náhodné výběry z normálního rozdělení při neznámých ale stejných rozptylech)
Bylo vybráno 13 polí stejné kvality Na 8 z nich se zkoušel nový způsob hnojení, zbývajících 5 bylo ošetřeno běžným způsobem. Výnosy pšenice uvedené v tunách na hektar jsou označeny Xj u nového a Y j u běžného způsobu hnojení Je třeba zjistit, zda způsob hnojení má vliv na výnos pšenice.
Xi    5,7   5,5   4,3   5,9   5,2   5,6   5,8 5,1
v.    5fQ   4,5   4,2   5,4 4,4
4.2 4.4 4.6 4.
Jan Koláček (PřF MU)
M5VM05 Statistické modelování
16/34
Řešení
Řešení Budeme nejprve testovat hypotézu Hq : -\ = 1 proti alternativě
o2
H\ : -\ 7^ 1 . Za pivotovou statistiku zvolíme statistiku
2
F=iH ~ F(m-1^2-1).
^2 ^
(a) Můžeme například vypočítat statistiku F za platnosti nulové hypotézy a porovnat ji s příslušnými oboustrannými kvantily.
/ =^ = 1,1243 F«(ni-l,n2-l) = 0,1811 Fi-f («i-l/«2-l) =9,0741
Hq nezamítáme
Jan Koláček (PřF MU)
M5VM05 Statistické modelování
17/
Řešení
(b) Další možností je spočítat p-hodnotu a srovnat se zvolenou hladinou testu oc\
p-value = 0,9656 > 0,05
Protože p-hodnota je výrazně větší než zvolená hladina testu, hypotézu o rovnosti rozptylů proti alternativě nerovnosti nezamítáme.
0 . 7 r
0 . 6 0 . 5 0 . 1 0 . 3 0.2 0 . 1 0
0123456789 10 F=l.1243
p-val=0.96557
Jan Koláček (PřF MU)
M5VM05 Statistické modelování
18/34
Řešení
(c) A naposledy můžeme ještě zkonstruovat 100(1 — oc)% interval spolehlivosti
o2
pro podíl rozptylů -\
ls{_1_S\ 1
^i-f (ni —l/n2 —1)r S\ F*(n\ — l,n2 — 1)
a zjistit, zda pokrývá hodnotu 1. Protože dostáváme interval (0,1239;6,2088), který pokrývá jedničku, hypotézu nezamítáme.
Jan Koláček (PřF MU)
M5VM05 Statistické modelování
19/
Řešení
(I) Testování pomocí statistiky T a kritické hodnoty
Vypočítáme-li hodnotu statistiky
0.35 h
0.25 h
X-Y- (]i\ -fí2)
S
12
n\U2
U\ + ÍÍ2
0.15
0.05 h
a porovnáme s kvantilem Studentova rozdělení, h-y = 2.3697 > ři_a/2(ll) = 2.201,
takže hypotézu
2 3 T=2.3697 p-val=0.037169
Ho : M - }ii = 0
zamítáme.
Jan Koláček (PřF MU)
M5VM05 Statistické modelování
20
Řešení
(II) Testování pomocí p-hodnoty
Vypočítáme-li p-hodnotu a porovnáme se zvolenou hladinou významnosti oc = 0.05
p = 2P(\TX_?\ >t)= 2(1 - P(\Tx_y\ < ř)) = 0.037169 < oc
takže hypotézu
zamítáme.
H0 : ]i\ - ]i2 = 0
Jan Koláček (PřF MU)
M5VM05 Statistické modelování
21 / 34
Řešení
(III) Testování nulové hypotézy pomocí intervalu spolehlivosti
ž-ý±íi_«(v) s12^g^= (0,6875 ±2,201-0,5089/1,7541
= (0,048958; 1,326
Protože interval spolehlivosti nepokrývá nulu, na dané hladině významnosti hypotézu zamítáme ve prospěch alternativy.
Jan Koláček (PřF MU)
M5VM05 Statistické modelování
Příklad
Příklad 3 (Párový test)
Na sedmi rostlinách byl posuzován vliv fungicidního přípravku podle počtu skvrn na listech před a týden po použití přípravku. Otestujte, zdali má přípravek vliv na počet skvrn na listech. Data udávající počet skvrn na listech před a po použití přípravku:
před použitím přípravku X\	9    17   31    7   8   20 10
po použití přípravku X2	10   11    18   6    7   17 5
Jan Koláček (PřF MU)
M5VM05 Statistické modelování
23 / 34
Řešení
(I) Testovaní pomočí štatistiky T a kritické hodnoty
Položme
Z = X| — X2. Vypočítáme-li hodnotu štatistiky
0.35 ■
0.25 ■
0.15
0.05 ■
2 3 T=2.2736 p-val=0.063354
T =
ž
a porovnáme s kvantilem Studentova rozdělení, tj
t
s \ n
= 2,2736 ? ři_a/2(n - 1) = 2,4469,
takže hypotézu
H0 : ^1 - ]i2 = 0
nezamítáme.
Jan Koláček (PřF MU)
M5VM05 Statistické modelování
24 / 34
(II) Testování pomocí ^-hodnoty
Vypočítáme-li p-hodnotu a porovnáme se zvolenou hladinou významnosti oc = 0,05
p = 2P(\T\ >í) = 2(1 — P(|T| <ř)) = 0,06335 > oc
takže hypotézu
H0 : ]i\ - }ii = 0
nezamítáme
Řešení
(III) Testování nulové hypotézy pomocí intervalu spolehlivosti
ž±řl-a/2(rc-l) -s/Vň
= 4 ± 2,4469 • 4,6547/2,6458 = [-0,30492; 8,3049]
Protože interval spolehlivosti pokrývá hodnotu Z = 0, na dané hladině významnosti hypotézu nezamítáme.
Shrneme-li předchozí výsledky slovně, pak nulovou hypotézu o tom, že
přípravek nemá vliv na počet skvrn
na hladině významnosti oc = 0,05 nemůžeme zamítnout oproti alternativě o jeho vlivu.
Jan Koláček (PřF MU)
M5VM05 Statistické modelování
26 / 34
Asymptotické testy
Nechť -U-{Xi,... ,Xn} ~ jC(fi(d),cr (0)) s konečnými druhými momenty
n
(s výběrovým průměrem X = ^ ^ Xz- a se     = S*(X), což je (slabě)
i=l
konzistentní odhad rozptylu cr2(d)):
H0	Hi	Hq zamítáme, pokud X G Wa			Předpoklady
fi = ji0	P ŕ Ho		X-fi0 s*	v      —      i 2	0 < ŕr2(0) < oo
fi = ji0	P ŕ Ho		X-flQ		x{Xi,...,Xn} ~Po(p)
P = Po	P ŕ PO		Po(l-)	— \fň > w-i ^	JL^,...^}-^)
Jan Koláček (PřF MU)
M5VM05 Statistické modelování
27/34
Příklad
Příklad 4
Při 40 hodech mincí byl rub zaznamenán 22krát. Je důvod se domnívat, že rub nepadá stejně často jako líc?
Řešení Označme Xj, i = 1,.. .,40 náhodnou veličinu nabývající hodnoty 1, pokud padne rub a hodnoty 0, pokud padne líc. Zřejmě Xj ~ A{p). Testujeme hypotézu Hq : p = 0,5 proti alternativní hypotéze H\ : p 7^ 0,5. Vypočteme průměr x = |^ = 0,55 a směrodatnou odchylku
s = ^0,5(1 -0,5) = 0,5.
Jan Koláček (PřF MU)
M5VM05 Statistické modelování
28 / 34
Řešení
(I) Testování nulové hypotézy pomocí pivotové statistiky a
kritické hodnoty.
Protože kritický obor Wq lze ekvivalentně vyjádřit i takto
o
x G Rn : Uf =
x—p
VVoCL-Po)
počítejme     = q/5q/5Q/5       = 0,6325. Protože u-x = 0,6325 nepřekračuje
kritickou hodnotu      a. = ^0 975 = 1,96, nulovou hypotézu na 5% hladině
1 2
nezamítáme.
Jan Koláček (PřF MU)
M5VM05 Statistické modelování
(II) Testování pomocí p-hodnoty
Vypočítáme p-hodnotu a porovnáme se zvolenou hladinou významnosti oc = 0,05
p = 2P(\Ux\ >u-x) = 2(1-P(|lfe| <u-x)) = 0,527
takže hypotézu
H0 :p = 0,5
nezamítáme
Řešení
(III) Testování nulové hypotézy pomocí intervalu spolehlivosti Interval spolehlivosti pro p:
x ± 1/0,975 ^ = 0,55 ± 1,96 •      = (0,395; 0,705).
Protože interval spolehlivosti (0,395;0,705) pokrývá hodnotu 0,5, nulovou hypotézu na hladině významnosti oc = 0,05 nezamítáme.
Jan Koláček (PřF MU)
M5VM05 Statistické modelování
Úlohy k procvičení
Příklad 1
Spotřeba téhož auta byla testována u 11 řidičů s výsledky 8,8; 8,9; 9,0; 8,7; 9,3; 9,0; 8,7; 8,8; 9,4; 8,6; 8,9 (7/100km). Můžeme na hladině významnosti 0,05 zamítnout hypotézu, že je pravdivá výrobcem udávaná spotřeba 8,8 1/100 km? Můžeme na stejné hladině významnosti popřít tvrzení, že rozptyl spotřeby je 0,1?
[ne, ne]
Příklad 2
Na hladině významnosti oc = 0,05 testujte hypotézu Hq : Cq = 300 o směrodatné odchylce normálně rozdělené náhodné veličiny, jestliže je zaznamenáno n = 25, X = 3118, s = 357.
[nezamítáme]
Příklad 3
Denní přírůstky váhy selat (v dkg) byly při krmení směsí A : 62, 54, 55, 60, 53, 58, u směsi B : 52, 56, 50, 49, 51. Je mezi nimi statisticky významný rozdíl?
[ano]
4
Jan Koláček (PřF MU)
M5VM05 Statistické modelování
32 / 34
Úlohy k procvičení
Příklad 4
Pro bavlněnou přízi je předepsána horní mez variability pevnosti vlákna: rozptyl pevnosti (která má normální rozdělení) nemá překročit Oq = 0,36. Při zkoušce 16 vzorků byly zjištěny výsledky 2,22, 3,54, 2,37, 1,66, 4,74, 4,82, 3,21, 5,44, 3,23, 4,79, 4,85, 4,05, 3,48, 3,89, 4,90, 5,37. Je důvod k podezření na vyšší nestejnoměrnost než je stanoveno?
[ano]
Příklad 5
Bylo provedeno měření obsahu S/O2 ve strusce dvěma metodami
analyticky 20,1    19,6   20,0   19,9 20,1
fotokolorometricky   20,9   20,1    20,6   20,5   20,7 20,5
Je mezi rozptyly výsledků jednotlivých metod podstatný rozdíl?
[není]
Jan Koláček (PřF MU)
M5VM05 Statistické modelování
33 / 34
Úlohy k procvičení
Příklad 6
Starosta obdržel při posledních volbách 60% hlasů. Bude stejně úspěšný i při příštích, když ze 100 náhodně vybraných občanů je pro něj 48?
[nebude]
Příklad 7
Na základě testu máme na 5% hladině významnosti rozhodnout, zda produkce vajec plemene kornyšek černých je nižší než plemene leghornek bílých. Náhodně jsme vybrali 50 kornyšek a 40 leghornek, u nichž byla zjištěna roční produkce vajec. Byl vypočten roční průměr produkce na slepici - kornyška 275, leghornka 280. Z dřívějška jsou známy rozptyly cr2or = 48, of = 41.
/Hq zamítáme, kornyšky mají horší produkci vajec než leghornky]
^ i
Jan Koláček (PřF MU)
M5VM05 Statistické modelování
34/34