Parametrické úlohy o dvou nezávislých náhodných výběrech z normálních rozložení
Motivace: Máme-li k dispozici dva nezávislé náhodné výběry z normálních rozložení, je naším úkolem porovnat střední
hodnoty či rozptyly těchto rozložení. Zpravidla konstruujeme intervaly spolehlivosti pro rozdíl středních hodnot respektive
hodnotíme shodu středních hodnot pomocí dvouvýběrového t-testu či dvouvýběrového z-testu a shodu rozptylů pomocí F-
testu.
Osnova:
- rozložení statistik odvozených ze dvou výběrových průměrů a rozptylů
- vzorce pro meze intervalů spolehlivosti pro rozdíl středních hodnot a podíl rozptylů
- jednotlivé typy testů pro parametry dvou normálních rozložení
(dvouvýběrový z-test, dvouvýběrový t-test, F-test)
- Cohenův koeficient věcného účinku
Rozložení statistik odvozených z výběrových průměrů a výběrových rozptylů normálních rozložení
Předpokládáme, že
1n111 X,,X K je náhodný výběr z rozložení N(µ1, σ1
2
),
2n221 X,,X K je náhodný výběr z rozložení N(µ2, σ2
2
),
přičemž n1 ≥ 2 a n2 ≥ 2 a oba výběry jsou stochasticky nezávislé.
Označme
M1, M2 výběrové průměry,
S1
2
, S2
2
výběrové rozptyly a
2
*S =
2nn
S)1n(S)1n(
21
2
22
2
11
−+
−+−
vážený průměr výběrových rozptylů.
Pak platí:
a) Statistiky M1 – M2 a 2
*S jsou stochasticky nezávislé.
b) U =
( ) ( )
2
2
2
1
2
1
2121
nn
MM
σ
+
σ
µ−µ−−
~ N(0, 1).
(Pivotová statistika U slouží k řešení úloh o µ1 – µ2, když σ1
2
a σ2
2
známe.)
c) Jestliže σ1
2
= σ2
2
=: σ2
, pak K = 2
2
*21 S)2nn(
σ
−+
~ χ2
(n1 + n2 – 2).
(Pivotová statistika K slouží k řešení úloh o neznámém společném rozptylu σ2
.)
d) Jestliže σ1
2
= σ2
2
=: σ2
, pak T =
( ) ( )
21
*
2121
n
1
n
1
S
MM
+
µ−µ−−
~ t(n1 + n2 – 2).
(Pivotová statistika T slouží k řešení úloh o µ1 – µ2, když σ1
2
a σ2
2
neznáme, ale víme, že jsou shodné.)
e) F = 2
2
2
1
2
2
2
1
/
S/S
σσ
~ F(n1 – 1, n2 – 1).
(Pivotová statistika F slouží k řešení úloh o σ1
2
/ σ2
2
.)
Vysvětlení:
ad a) Neuvádíme, viz např. J. Anděl: Matematická statistika.
ad b) M1 – M2 je lineární kombinace náhodných veličin s normálním rozložením, má tedy normální rozložení s parametry
E(M1 – M2) = µ1- µ2,
D(M1 – M2) = σ1
2
/n1 + σ2
2
/n2.
U se získá standardizací M1 – M2.
ad c) K1 = 2
2
11 S)1n(
σ
−
~ χ2
(n1 – 1) a K2 = 2
2
22 S)1n(
σ
−
~ χ2
(n2 – 1) jsou stochasticky nezávislé náhodné veličiny, tedy
K = K1 + K2 ~ χ2
(n1 + n2 – 2).
ad d) U =
( ) ( )
2
2
1
2
2121
nn
MM
σ
+
σ
µ−µ−−
~ N(0, 1), K = 2
2
*21 S)2nn(
σ
−+
~ χ2
(n1 + n2 – 2) jsou stochasticky nezávislé, protože
M1 – M2 a 2
*S jsou stochasticky nezávislé. =
−+
=
2nn
K
U
T
21
( ) ( )
21
*
2121
n
1
n
1
S
MM
+
µ−µ−−
~ t(n1 + n2 – 2).
ad e) K1 = 2
1
2
11 S)1n(
σ
−
~ χ2
(n1 – 1) a K2 = 2
2
2
22 S)1n(
σ
−
~ χ2
(n2 – 1) jsou stochasticky nezávislé náhodné veličiny, tedy
1n
K
1n
K
2
2
1
1
F
−
−
= = 2
2
2
1
2
2
2
1
/
S/S
σσ
~ F(n1 – 1, n2 – 1).
Příklad: Nechť jsou dány dva nezávislé náhodné výběry, první pochází z rozložení N(0,28; 0,09) a má rozsah 16, druhý
pochází z rozložení N(0,25; 0,04) a má rozsah 25. Jaká je pravděpodobnost, že výběrový průměr 1. výběru bude větší než
výběrový průměr 2. výběru?
Řešení:
( ) ( ) ( )
63683,0)35,0()35,0(1)35294,0U(P1
25
04,0
16
09,0
25,028,0
UP1
nn
)(0
nn
)()MM(
P10MMP10MMPMMP
2
2
2
1
2
1
21
2
2
2
1
2
1
2121
212121
=Φ=−Φ−=−≤−=












+
+−
≤−=
=














σ
+
σ
µ−µ−
≤
σ
+
σ
µ−µ−−
−=≤−−=>−=>
S pravděpodobností přibližně 63,7% je výběrový průměr 1. výběru větší než výběrový průměr 2. výběru.
Výpočet pomocí systému STATISTICA:
Statistika M1 – M2 se podle bodu (a) řídí rozložením N(µ1 – µ2,
2
2
2
1
2
1
nn
σ
+
σ
),
kde µ1 – µ2 = 0,28 – 0,25 = 0,03, 007225,0
25
04,0
16
09,0
nn 2
2
2
1
2
1
=+=
σ
+
σ
, tj. statistika M1 - M2 ~ N(0,03;0,007225).
Otevřeme nový datový soubor o jedné proměnné a jednom případu. Do Dlouhého jména této proměnné napíšeme
= 1-INormal(0;0,03;sqrt(0,007225)). V proměnné Prom1 se objeví hodnota 0,637934:
1
Prom1
1 0,637934
Intervaly spolehlivosti pro parametrické funkce µ1 - µ2, σ1
2
/σ2
2
Uvedeme přehled vzorců pro meze 100(1-α)% empirických intervalů spolehlivosti pro parametrické funkce µ1 - µ2 , σ1
2
/ σ2
2
.
a) Interval spolehlivosti pro µ1-µ2, když σ1
2
, σ2
2
známe (využití pivotové statistiky U)
Oboustranný: (d, h) = (m1 – m2 –
2
2
2
1
2
1
nn
σ
+
σ
u1-α/2, m1 – m2 +
2
2
2
1
2
1
nn
σ
+
σ
u1-α/2)
Levostranný: (d, ∞) = (m1 – m2 –
2
2
2
1
2
1
nn
σ
+
σ
u1-α, ∞)
Pravostranný: (-∞, h) = (-∞,m1 – m2 +
2
2
2
1
2
1
nn
σ
+
σ
u1-α)
b) Interval spolehlivosti pro µ1-µ2, když σ1
2
, σ2
2
neznáme, ale víme, že jsou shodné (využití pivotové statistiky T)
Oboustranný:
(d, h) = (m1 – m2 –
21
*
n
1
n
1
s + t1-α/2(n1+n2-2), m1 – m2 +
21
*
n
1
n
1
s + t1-α/2(n1+n2-2))
Levostranný: (d, ∞) = (m1 – m2 –
21
*
n
1
n
1
s + t1-α(n1+n2-2), ∞)
Pravostranný: (-∞, h) = (-∞, m1 – m2 +
21
*
n
1
n
1
s + t1-α(n1+n2-2))
c) Interval spolehlivosti pro společný neznámý rozptyl σ2
(využití pivotové statistiky K)
Oboustranný: (d, h) = 







−+χ
−+
−+χ
−+
αα− )2nn(
s)2nn(
,
)2nn(
s)2nn(
212/
2
2
*21
212/1
2
2
*21
Levostranný: (d, ∞) = 







∞
−+χ
−+
α−
,
)2nn(
s)2nn(
211
2
2
*21
Pravostranný: (-∞, h) = 







−+χ
−+
∞−
α )2nn(
s)2nn(
,
21
2
2
*21
d) Interval spolehlivosti pro podíl rozptylů 2
2
2
1
σ
σ
(využití pivotové statistiky F)
Oboustranný: (d, h) = 







−−−− αα )1n,1n(F
s/s
,
)1n,1n(F
s/s
21/2
2
2
2
1
21/2-1
2
2
2
1
Levostranný: (d, ∞) = 







∞
−−α
,
)1n,1n(F
s/s
21-1
2
2
2
1
Pravostranný: (-∞, h) = 







−−
∞−
α )1n,1n(F
s/s
,
21
2
2
2
1
Upozornění: Není-li v bodě (b) splněn předpoklad o shodě rozptylů, lze sestrojit aspoň přibližný 100(1-α)% interval
spolehlivosti pro µ1-µ2.
V tomto případě má statistika T přibližně rozložení t(ν ), kde počet stupňů volnosti ν =
( )
( ) ( )
1n
n/s
1n
n/s
n/sn/s
2
2
2
2
2
1
2
1
2
1
2
2
2
21
2
1
−
+
−
+
. Není-li ν celé
číslo, použijeme v tabulkách kvantilů Studentova rozložení lineární interpolaci.
Příklad: Ve dvou nádržích se zkoumal obsah chlóru (v g/l). Z první nádrže bylo odebráno 25 vzorků, z druhé nádrže 10
vzorků. Byly vypočteny realizace výběrových průměrů a rozptylů: m1 = 34,48, m2 = 35,59, s1
2
= 1,7482, s2
2
= 1,7121.
Hodnoty zjištěné z odebraných vzorků považujeme za realizace dvou nezávislých náhodných výběrů z rozložení N(µ1, σ2
) a
N(µ2, σ2
). Sestrojte 95% empirický interval spolehlivosti pro rozdíl středních hodnot µ1 - µ2.
Řešení:
Úloha vede na vzorec (b) s využitím statistiky T. Vypočteme vážený průměr výběrových rozptylů a najdeme odpovídající
kvantily Studentova rozložení:
2
*s = 7384,1
33
7121,197482,124
2nn
s)1n(s)1n(
21
2
22
2
11
=
⋅+⋅
=
−+
−+−
, t0,975(33) = 2,035
Dosadíme do vzorců pro dolní a horní mez intervalu spolehlivosti:
d = m1–m2–
21
*
n
1
n
1
s + t1-α/2(n1+n2-2) =
= 34,48–35,59 - 035,2
10
1
25
1
7384,1 ⋅+⋅ = -2,114
h = m1–m2+
21
*
n
1
n
1
s + t1-α/2(n1+n2-2) =
= 34,48–35,59 + 035,2
10
1
25
1
7384,1 ⋅+⋅ = -0,106
-2,114 g/l < µ1 - µ2 < -0,106 g/l s pravděpodobností aspoň 0,95.
Výpočet pomocí systému STATISTICA:
Otevřeme nový datový soubor o dvou proměnných d a h a jednom případu.
Do Dlouhého jména proměnné d napíšeme
=34,48-35,59-sqrt((24*1,7482+9*1,7121)/33)*sqrt((1/25)+(1/10))*VStudent(0,975;33)
Do Dlouhého jména proměnné h napíšeme
=34,48-35,59+
sqrt((24*1,7482+9*1,7121)/33)*sqrt((1/25)+(1/10))*VStudent(0,975;33)
1
d
2
h
1 -2,11368 -0,10632
S pravděpodobností aspoň 0,95 tedy -2,114 g/l < µ1 - µ2 < -0,106 g/l.
Příklad: V předešlém příkladě nyní předpokládáme, že dané dva náhodné výběry pocházejí z rozložení
N(µ1, σ1
2
) a N(µ2, σ2
2
). Sestrojte 95% empirický interval spolehlivosti pro podíl rozptylů.
Řešení:
Úloha vede na vzorec (d) s využitím statistiky F.
d = 28,0
6142,3
7121,1/7482,1
)9,24(F
7121,1/7482,1
)1n,1n(F
s/s
975,021/2-1
2
2
2
1
===
−−α
h = 76,2
7027,2/1
7121,1/7482,1
)24,9(F/1
7121,1/7482,1
)9,24(F
7121,1/7482,1
)1n,1n(F
s/s
975,0025,021/2
2
2
2
1
====
−−α
0,28 < 2
2
2
1
σ
σ
< 2,76 s pravděpodobností aspoň 0,95.
Výpočet pomocí systému STATISTICA:
Otevřeme nový datový soubor o dvou proměnných d a h a jednom případu.
Do Dlouhého jména proměnné d napíšeme
=(1,7482/1,7121)/VF(0,975;24;9)
(Funkce VF(x;ný;omega) počítá x-kvantil Fisherova – Snedecorova rozložení F(ný, omega).)
Do Dlouhého jména proměnné h napíšeme
=(1,7482/1,7121)/VF(0,025;24;9)
1
d
2
h
1 0,282521 2,759698
S pravděpodobností aspoň 0,95 tedy platí: 0,28 < σ1
2
/ σ2
2
< 2,76.
Jednotlivé typy testů o parametrických funkcích µ1 - µ2, σ1
2
/σ2
2
a) Nechť 1n111 X,,X K je náhodný výběr z rozložení N(µ1, σ1
2
) a 2n221 X,,X K je na něm nezávislý náhodný výběr z rozložení
N(µ2, σ2
2
), přičemž n1 ≥ 2, n2 ≥ 2 a σ1
2
, σ2
2
známe. Nechť c je konstanta.
Test H0: µ1 – µ2 = c proti H1: µ1 – µ2 ≠ c se nazývá dvouvýběrový z-test.
b) Nechť 1n111 X,,X K je náhodný výběr z rozložení N(µ1, σ2
) a 2n221 X,,X K je na něm nezávislý náhodný výběr z rozložení
N(µ2, σ2
), přičemž n1 ≥ 2 a n2 ≥ 2 a σ2
neznáme. Nechť c je konstanta.
Test H0: µ1 – µ2 = c proti H1: µ1 – µ2 ≠ c se nazývá dvouvýběrový t-test.
c) Nechť 1n111 X,,X K je náhodný výběr z rozložení N(µ1, σ1
2
) a 2n221 X,,X K je na něm nezávislý náhodný výběr rozložení
N(µ2, σ2
2
), přičemž n1 ≥ 2 a n2 ≥ 2. Test H0: 2
2
2
1
σ
σ
= 1 proti H1: 2
2
2
1
σ
σ
≠ 1 se nazývá F-test.
Provedení testů o parametrických funkcích µ1 - µ2, σ1
2
/σ2
2
pomocí kritického oboru
a) Provedení dvouvýběrového z-testu
Vypočteme realizaci t0 testového kritéria
( )
2
2
2
1
2
1
21
0
nn
cMM
T
σ
+
σ
−−
= . Stanovíme kritický obor W. Pokud t0 ∈ W, H0 zamítáme na
hladině významnosti α a přijímáme H1.
Oboustranný test: Testujeme H0: µ1 - µ2 = c proti H1: µ1 - µ2 ≠ c. Kritický obor má tvar: )( ∞∪−∞−= α−α− ,uu,W 2/12/1 .
Levostranný test: Testujeme H0: µ1 - µ2 = c proti H1: µ1 - µ2 < c. Kritický obor má tvar: ( α−−∞−= 1u,W .
Pravostranný test: Testujeme H0: µ1 - µ2 = c proti H1: µ1 - µ2 > c. Kritický obor má tvar: )∞= α− ,uW 1 .
b) Provedení dvouvýběrového t-testu
Vypočteme realizaci t0 testového kritéria
( )
21
*
21
0
n
1
n
1
S
cMM
T
+
−−
= . Stanovíme kritický obor W. Pokud t0 ∈ W, H0 zamítáme na
hladině významnosti α a přijímáme H1.
Oboustranný test: Testujeme H0: µ1 - µ2 = c proti H1: µ1 - µ2 ≠ c. Kritický obor má tvar:
( ) ( ) )( ∞−+∪−+−∞−= α−α− ,2nnt2nnt,W 212/1212/1 .
Levostranný test: Testujeme H0: µ1 - µ2 = c proti H1: µ1 - µ2 < c. Kritický obor má tvar: ( )( 2nnt,W 211 −+−∞−= α− .
Pravostranný test: Testujeme H0: µ1 - µ2 = c proti H1: µ1 - µ2 > c. Kritický obor má tvar: ( ) )∞−+= α− ,2nntW 211 .
c) Provedení F-testu
Vypočteme realizaci testového kritéria 2
2
2
1
0
s
s
t = . Stanovíme kritický obor W. Pokud t0 ∈ W, H0 zamítáme na hladině
významnosti α a přijímáme H1.
Oboustranný test: Testujeme H0: 2
2
2
1
σ
σ
= 1 proti H1: 2
2
2
1
σ
σ
≠ 1. Kritický obor má tvar:
( ) ( ) )( ∞−−∪−−= α−α ,1n,1nF1n,1nF,0W 212/1212/ .
Levostranný test: Testujeme H0: 2
2
2
1
σ
σ
= 1 proti H1: 2
2
2
1
σ
σ
< 1. Kritický obor má tvar: ( )( 1n,1nF,0W 21 −−= α .
Pravostranný test: Testujeme H0: 2
2
2
1
σ
σ
= 1 proti H1: 2
2
2
1
σ
σ
> 1. Kritický obor má tvar: ( ) )∞−−= α− ,1n,1nFW 211 .
Příklad: V restauraci "U bílého koníčka" měřili ve 20 případech čas obsluhy zákazníka. Výsledky v minutách: 6, 8, 11, 4, 7,
6, 10, 6, 9, 8, 5, 12, 13, 10, 9, 8, 7, 11, 10, 5. V restauraci "Zlatý lev" bylo dané pozorování uskutečněno v 15 případech s
těmito výsledky: 9, 11, 10, 7, 6, 4, 8, 13, 5, 15, 8, 5, 6, 8 ,7. Za předpokladu, že uvedené hodnoty pocházejí ze dvou normálních
rozložení, na hladině významnosti 0,05 testujte hypotézu, že střední hodnoty doby obsluhy jsou v obou restauracích
stejné.
Řešení:
Na hladině významnosti 0,05 testujeme nulovou hypotézu H0: µ1 - µ2 = 0 proti oboustranné alternativě H1: µ1 – µ2 ≠ 0. Je to
úloha na dvouvýběrový t-test. Před provedením tohoto testu je však nutné pomocí F-testu ověřit shodu rozptylů. Na hladině
významnosti 0,05 tedy testujeme H0: 2
2
2
1
σ
σ
= 1 proti H1: 2
2
2
1
σ
σ
≠ 1. Nejprve vypočteme m1 = 8,25, m2 = 8,13, s1
2
= 6,307, s2
2
=
9,41, 623,7
33
41,914307,619
2nn
s)1n(s)1n(
s
21
2
22
2
112
* =
⋅+⋅
=
−+
−+−
= . Podle vzorce (c) vypočteme realizaci testové statistiky:
6702,0
41,9
307,6
s
s
t 2
2
2
1
0 === . Stanovíme kritický obor:
( ) ( ) ) ( ) ( ) )
( ) ( ) ) ) )∞∪=∞∪=∞∪=
=∞∪=∞−−∪−−= α−α
,8607,23778,0;0,8607,2649,2/1,0,14,19F19,14F/1,0
,14,19F14,19F,0,1n,1nF1n,1nF,0W
975,0975,0
975,0025,0212/1212/
Protože se testová statistika nerealizuje v kritickém oboru, nulovou hypotézu nezamítáme na hladině významnosti 0,05.
Rozptyly tedy můžeme považovat za shodné.
Nyní se vrátíme k dvouvýběrovému t-testu. Podle vzorce (b) vypočteme realizaci testové statistiky:
124,0
15
1
20
1
623,7
13,825,8
n
1
n
1
s
cmm
t
21
*
21
0 =
+
−
=
+
−−
= . Stanovíme kritický obor:
( ) ( ) )( ( ) ( ) )( )( ∞∪−∞−=∞∪−∞−=∞−+∪−+−∞−= α−α− ,035,2035,2,,33t33t,,2nnt2nnt,W 975,0975,0212/1212/1
Protože testová statistika se nerealizuje v kritickém oboru, nulovou hypotézu nezamítáme na hladině významnosti 0,05.
Výpočet pomocí systému STATISTICA:
Otevřeme nový datový soubor o dvou proměnných a 35 případech. První proměnnou nazveme OBSLUHA, druhou ID. Do
proměnné OBSLUHA napíšeme nejprve doby obsluhy v první restauraci a poté doby obsluhy ve druhé restauraci. Do
proměnné ID, která slouží k rozlišení první a druhé restaurace, napíšeme 20 krát jedničku a 15 krát dvojku.
Pomocí NP-grafu ověříme normalitu dat v obou skupinách. Grafy – 2D Grafy – Normální pravděpodobnostní grafy –
zaškrtneme S-W test - Proměnné OBSLUHA, OK, Kategorizovaný – Kategorie X, zaškrtneme Zapnuto, Změnit proměnnou
– ID, OK. Dostaneme graf
Normální p-graf z obsluha; kategorizovaný id
restaurace.sta 2v*35c
Pozorovaný kvantil
Oček.normál.hodnoty
id: 1
2 4 6 8 10 12 14 16
-2,0
-1,5
-1,0
-0,5
0,0
0,5
1,0
1,5
2,0
id: 2
2 4 6 8 10 12 14 16
id: 1 obsluha: SW-W = 0,9715; p = 0,7871
id: 2 obsluha: SW-W = 0,9345; p = 0,3185
V obou případech se tečky odchylují od přímky jenom málo a p-hodnoty S-W testu převyšují 0,05. Předpoklad o normálním
rozložení dat v obou skupinách je oprávněný.
Nyní provedeme dvouvýběrový t-test současně s testem o shodě rozptylů:
Statistika – Základní statistiky a tabulky – t-test, nezávislé, dle skupin – OK, Proměnné –Závislé proměnné OBSLUHA,
Grupovací proměnná ID – OK.
Po kliknutí na tlačítko Souhrn dostaneme tabulku
t-testy; grupováno: ID (restaurace)
Skup. 1: 1
Skup. 2: 2
Proměnná
Průměr
1
Průměr
2
t sv p Poč.plat
1
Poč.plat.
2
Sm.odch.
1
Sm.odch.
2
F-poměr
rozptyly
p
rozptyly
OBSLUHA 8,250000 8,133333 0,123730 33 0,902279 20 15 2,510504 3,067495 1,492952 0,410440
Vidíme, že testová statistika pro test shody rozptylů se realizuje hodnotou 1,492952 (je to převrácená hodnota k číslu
0,6702, které jsme vypočítali při ručním postupu), odpovídající p-hodnota je 0,41044, tedy na hladině významnosti 0,05
nezamítáme hypotézu o shodě rozptylů. (Upozornění: v případě zamítnutí hypotézy o shodě rozptylů je zapotřebí v tabulce
t-testu pro nezávislé vzorky dle skupin zaškrtnout volbu Test se samostatnými odhady rozptylu.)
Dále z tabulky plyne, že testová statistika pro test shody středních hodnot se realizuje hodnotou 0,12373, počet stupňů
volnosti je 33, odpovídající p-hodnota 0,902279, tedy hypotézu o shodě středních hodnot nezamítáme na hladině
významnosti 0,05. Znamená to, že s rizikem omylu nejvýše 5% se neprokázal rozdíl ve středních hodnotách dob obsluhy
v restauracích "U bílého koníčka" a „Zlatý lev“.
Tabulku ještě doplníme krabicovými diagramy. Na záložce Detaily zaškrtneme krabicový graf a vybereme volbu
Průměr/SmOdch/Min-Max.
Krabicový graf z obsluha seskupený id
restaurace.sta 2v*35c
Průměr
Průměr±SmOdch
Min-Max
Odlehlé
Extrémy
1 2
id
2
4
6
8
10
12
14
16
obsluha
Z grafu je vidět, že průměrná doba obsluhy v první restauraci je nepatrně delší a má menší variabilitu než ve druhé
restauraci. Extrémní ani odlehlé hodnoty se zde nevyskytují.
Upozornění:
V případě, že známe realizace obou výběrových průměrů a směrodatných odchylek, můžeme pro provedení
dvouvýběrového t-testu v systému STATISTICA použít aplikaci Tesy rozdílů. Postup si ukážeme na příkaldě s dobou
obsluhy ve dvou restauracích
Statistiky – Základní statistiky a tabulky – Testy rozdílů: r, %, průměry – OK – vybereme Rozdíl mezi dvěma průměry
(normální rozdělení) – do políčka Pr1 napíšeme 8,25, do políčka SmOd1 napíšeme 2,5105, do políčka N1 napíšeme 20, do
políčka Pr1 napíšeme 8,25, do políčka SmOd1 napíšeme 3,0675, do políčka N1 napíšeme 15 – Výpočet. Dostaneme phodnotu
0,9023, tedy nezamítáme nulovou hypotézu na hladině významnosti 0,05.
Nepovinná část: Cohenův koeficient věcného účinku – doplnění významu dvouvýběrového t-testu:
Nechť 1n111 X,,X K je náhodný výběr z rozložení N(µ1, σ2
) a 2n221 X,,X K je na něm nezávislý náhodný výběr rozložení
N(µ2, σ2
), přičemž n1 ≥ 2 a n2 ≥ 2 a σ2
neznáme. Nechť c je konstanta.
Testujeme H0: µ1 – µ2 = c proti H1: µ1 – µ2 ≠ c. Označme m1, m2 realizace výběrových průměrů hodnot dané veličiny
v těchto dvou skupinách, s1
2
, s2
2
realizace výběrových rozptylů a
( ) ( )
2nn
s1ns1n
s
21
2
22
2
112
*
−+
−+−
= realizaci váženého průměru
výběrových rozptylů.
Cohenův koeficient d vypočteme podle vzorce:
*
21
s
mm
d
−
= .
Tento koeficient slouží k posouzení velikosti rozdílu průměrů, který je standardizován pomocí odmocniny z váženého průměru
výběrových rozptylů. Jedná se o tzv. věcnou významnost neboli velikost účinku skupiny na variabilitu hodnot sledované
náhodné veličiny. Velikost účinku hodnotíme podle následující tabulky:
Hodnota d účinek
aspoň 0,8 velký
mezi 0,5 až 0,8 střední
mezi 0,2 až 0,5 malý
pod 0,2 zanedbatelný
(Uvedené hodnoty nemají samozřejmě absolutní platnost, posouzení, jaký účinek považujeme za velký či malý, závisí na
kontextu.)
Je zapotřebí si uvědomit, že při dostatečně velkých rozsazích náhodných výběrů i malý rozdíl ve výběrových průměrech
způsobí zamítnutí nulové hypotézy na hladině významnosti α, i když z věcného hlediska tak malý rozdíl nemá význam. Naopak,
máme-li výběry malých rozsahů, pak i značně velký rozdíl ve výběrových průměrech nemusí vést k zamítnutí nulové
hypotézy na hladině významnosti α.
Příklad:
Máme k dispozici údaje o celkovém IQ 856 žáků ZŠ. Zajímáme se jednak o skupinu dětí, jejichž oba rodiče mají pouze základní
vzdělání (je jich 296) a jednak o skupinu dětí, jejichž oba rodiče mají vysokoškolské vzdělání (těch je 75). Na hladině
významnosti 0,05 budeme testovat hypotézu, že střední hodnota celkového IQ je v obou skupinách stejná a také vypočteme
Cohenův koeficient věcného účinku.
Řešení:Normalitu dat v obou skupinách posoudíme pomocí N-P plotu:
Normální p-graf z IQ_CELK; kategorizovaný ID
ID: oba ZŠ
50
60
70
80
90
100
110
120
130
140
150
-4
-3
-2
-1
0
1
2
3
4
Očekávanánormálníhodnota
ID: oba VŠ
50
60
70
80
90
100
110
120
130
140
150
Vzhled N- P plotů v obou skupinách podporuje domněnku o normalitě dat.
Provedeme dvouvýběrový t-test:
t-testy; grupováno:ZŠ a VŠ (IQ)
Skup. 1: oba ZŠ
Skup. 2: oba VŠ
Proměnná
Průměr
oba ZŠ
Průměr
oba VŠ
t sv p Poč.plat
oba ZŠ
Poč.plat.
oba VŠ
Sm.odch.
oba ZŠ
Sm.odch.
oba VŠ
F-poměr
Rozptyly
p
Rozptyly
IQ_CELK 94,13851 110,9067 -10,6295 369 0,000000 296 75 11,82604 13,60164 1,322829 0,110124
Hypotézu o shodě středních hodnot zamítáme na hladině významnosti 0,05, protože odpovídající p-hodnota je velmi blízká
0 (hypotézu o shodě rozptylů nezamítáme na hladině významnosti 0,05, p-hodnota F-testu je 0,110124, což je větší než
0,05).
Krabicový diagram:
Krabicový graf z IQ_CELK seskupený ID
Průměr
Průměr±SmOdch
Min-Max
Odlehlé
Extrémy
oba ZŠ oba VŠ
ID
50
60
70
80
90
100
110
120
130
140
150
IQ_CELK
Vidíme, že průměrné celkové IQ dětí v 1. skupině je 94,1, zatímco ve 2. skupině 110,9. Vliv skupiny na variabilitu hodnot
celkového IQ posoudíme pomocí Cohenova koeficientu.
1
n1
2
n2
3
m1
4
m2
5
s1
6
s2
7
d
1 296 75 94,13851 110,9067 11,82604 13,60164 1,374117
Cohenův koeficient nabývá hodnoty 1,37, tudíž vliv skupiny na variabilitu hodnot celkového IQ lze považovat za velký.