Osnova přednášky Přehled t-testů
1. Jednovýběrový t-test
2. Párový t-test
3. Dvouvýběrový t-test
- ověření hypotézy o shodě rozptylů (F-test)
- Cohenův koeficient věcného účinku
4. Provedení t-testů v systému STATISTICA pomocí aplikace Testy rozdílů
Přehled t-testů
1. Jednovýběrový t-test
Označení: Nechť X1, ..., Xn je náhodný výběr, n ≥ 2.
∑=
=
n
1i
iX
n
1
M … výběrový průměr,
( )∑=
−
−
=
n
1i
2
i
2
MX
1n
1
S … výběrový rozptyl,
2
SS = … výběrová směrodatná odchylka
Definice jednovýběrového t-testu: Nechť X1, ..., Xn je náhodný výběr z N(µ, σ2
), kde rozptyl σ2
neznáme. Nechť n ≥ 2 a c je reálná konstanta. Test H0: µ = c proti H1: µ ≠ c (resp. H0: µ = c proti
H1: µ < c resp. H0: µ = c proti H1: µ > c) se nazývá jednovýběrový t-test.
Poznámka: Jednovýběrový t-test je založen na pivotové statistice
( )1-nt~
n
S
M
T
µ−
=
.
Dosadíme-li za µ konstantu c, dostaneme testovou statistku:
n
S
cM
T0
−
=
, která se v případě
platnosti H0 řídí Studentovým rozložením t(n-1).
Provedení jednovýběrového t-testu pomocí kritického oboru
Vypočteme realizaci testové statistiky
n
s
cm
t0
−
= . Stanovíme kritický obor W. Pokud t0 ∈ W,
H0 zamítáme na hladině významnosti α a přijímáme H1.
Oboustranný test: Testujeme H0: µ = c proti H1: µ ≠ c. Kritický obor má tvar:
( ) ( ) )( ∞−∪−−∞−= α−α− ,1nt1nt,W 2/12/1 .
Levostranný test: Testujeme H0: µ = c proti H1: µ < c. Kritický obor má tvar: ( )( 1nt,W 1 −−∞−= α− .
Pravostranný test: Testujeme H0: µ = c proti H1: µ > c. Kritický obor má tvar: ( ) )∞−= α− ,1ntW 1 .
Provedení jednovýběrového t-testu pomocí intervalu spolehlivosti
Pro oboustranný test sestrojíme oboustranný 100(1-α)% interval spolehlivosti pro střední
hodnotu µ při neznámém rozptylu σ2
:
(d, h) = (m -
n
s
t1-α/2(n-1), m +
n
s
t1-α/2(n-1))
Pro levostranný test sestrojíme pravostranný 100(1-α)% interval spolehlivosti pro střední
hodnotu µ při neznámém rozptylu σ2
:
(-∞, h) = (-∞, m +
n
s
t1-α(n-1))
Pro pravostranný test sestrojíme levostranný 100(1-α)% interval spolehlivosti pro střední
hodnotu µ při neznámém rozptylu σ2
:
(d, ∞) = (m -
n
s
t1-α(n-1), ∞)
Pokud číslo c padne do intervalu spolehlivosti, nulovou hypotézu nezamítáme na hladině
významnosti α. V opačném případě nulovou hypotézu zamítáme na hladině významnosti α a
přijímáme alternativní hypotézu.
Provedení jednovýběrového t-testu pomocí p-hodnoty
Vypočteme p-hodnotu (nejlépe pomocí statistického software) a porovnáme ji s hladinou
významnosti α. Jestliže p ≤ α, pak nulovou hypotézu zamítáme na hladině významnosti α a
přijímáme alternativní hypotézu. Je-li p > α, pak nulovou hypotézu nezamítáme na hladině
významnosti α.
Způsob výpočtu p-hodnoty:
Označme Φ distribuční funkci Studentova rozložení t(n-1).
Pro oboustrannou alternativu p = 2 min{Φ( t0), 1- Φ( t0)}.
Pro levostrannou alternativu p = Φ( t0).
Pro pravostrannou alternativu p = 1- Φ( t0).
Příklad na jednovýběrový t-test:
Bylo prováděno sledování obsahu vitamínu C ve vzorcích mrkve, která byla zakoupena na
biofarmě. Celkem bylo provedeno analytické stanovení obsahu vitamínu C ve 20 vzorcích
mrkve a byly zjištěny následující koncentrace (v mg/kg):
41,1; 32,6; 28,9; 19,6; 23,6; 35,0; 36,7; 45,9; 49,6; 33,6; 17,8; 24,6; 29,6; 47,7; 41,6; 39,8; 15,6;
34,1; 44,0 a 55,8
Průměrný obsah vitamínu C v mrkvi, který je uváděn v literatuře, je 35 mg/kg.
Liší se obsah vitamínu C stanoveného ve vzorcích mrkve z biofarmy od průměrné hodnoty
uváděné v literatuře?
Řešení pomocí systému STATISTICA:
Otevřeme datový soubor mrkev.sta s jednou proměnnou X a 20 případy. V proměnné X jsou
zapsány zjištěné hodnoty obsahu vitamínu C.
Na hladině významnosti 0,05 testujeme hypotézu H0: µ = 35 proti alternativě H1: µ ≠ 35.
Jde o úlohu na jednovýběrový t-test.
Nejprve pomocí N-P grafu a Shapirova – Wilkova testu ověříme, zda data pocházejí
z normálního rozložení.
Vytvoření N-P plotu: Grafy – 2D Grafy – Normální pravděpodobnostní grafy – Proměnná X –
OK - odškrtneme Neurčovat průměrnou pozici svázaných pozorování – zaškrtneme Shapiro –
Wilkův test - OK.
Ověření normality pomocí N-P grafu a S-W testu:
Normální p-graf z X
Tabulka1 1v*20c
10 15 20 25 30 35 40 45 50 55 60
Pozorovaný kvantil
-2,0
-1,5
-1,0
-0,5
0,0
0,5
1,0
1,5
2,0
Oček.normál.hodnoty
X: SW-W = 0,9816; p = 0,9535
Body v N-P grafu jsou blízko ideální přímky.
S-W test poskytl p-hodnotu 0,9535, tedy na hladině významnosti 0,05 nezamítáme hypotézu
o normalitě.
Provedení jednovýběrového t-testu:
Statistiky – Základní statistiky/tabulky – t-test, samost. vzorek – OK – Proměnné X – OK. Do Referenční
hodnoty napíšeme 35, na záložce Možnosti zaškrtneme Výpočet mezí spolehl. – Výpočet. Dostaneme
tabulku:
Test průměrů vůči referenční konstantě (hodnotě) (mrkev.sta)
Proměnná
Průměr Sm.odch. N Sm.chyba Int. spolehl.
-95,000%
Int. spolehl.
+95,000%
Referenční
konstanta
t SV p
X: obsah vitaminu C v mrkvi 34,86000 11,08719 20 2,479170 29,67104 40,04896 35,00000 -0,056471 19 0,955557
Vidíme, že průměrný obsah vitamínu C ve sledovaných 20 vzorcích je 34,86 mg/kg se směrodatnou
odchylkou 11,09 mg/kg.
Test pomocí intervalu spolehlivosti: S pravděpodobností 95 % se neznámá střední hodnota obsahu
vitamínu C nachází v intervalu 29,67 mg/kg až 40,05 mg/kg. Protože referenční konstanta 35 mg/kg se
nachází v tomto 95% intervalu spolehlivosti, hypotézu H0: µ = 35 nezamítáme na hladině významnosti 0,05.
Test pomocí kritického oboru: Testová statistika nabývá hodnoty -0,0565. Kritický obor je
( )( ( ) ) ( )( ( ) )
( )∞∪−∞−=
=∞∪−∞−=∞−∪−−∞−= α−α−
,093,2093,2,
,19t19t,,1nt1nt,W 975,0975,02/12/1
Testová statistika se nerealizuje v kritickém oboru, tedy hypotézu H0: µ = 35 nezamítáme na hladině
významnosti 0,05.
Upozornění: Kvantil t0,975(19) najdeme v systému STATISTICA pomocí Pravděpodobnostního kalkulátoru:
Statistiky – Pravděpodobnostní kalkulátor - vybereme Rozdělení t (Studentovo). Do okénka sv. napíšeme 19
a do okénka p napíšeme 0,975. V okénku t se objeví 2,093.
Test pomocí p-hodnoty: Protože p-hodnota je 0,9556, což je větší než hladina významnosti 0,05, hypotézu
H0: µ = 35 nezamítáme na hladině významnosti 0,05.
2. Párový t-test
Označení: Nechť 











n
n
1
1
Y
X
,,
Y
X
K je náhodný výběr z dvourozměrného rozložení, přičemž n ≥ 2.
Označíme µ = µ1 - µ2 a zavedeme rozdílový náhodný výběr Z1 = X1 - Y1, ... , Zn = Xn - Yn,
o němž předpokládáme, že se řídí normálním rozložením. Označíme
∑
=
=
n
1i
iZ
n
1
M … výběrový průměr rozdílového náhodného výběru,
( )∑
=
−=
n
1i
2
i
2
MZ
n
1
S … výběrový rozptyl rozdílového náhodného výběru.
Definice párového t-testu:
Nechť 











n
n
1
1
Y
X
,,
Y
X
K je náhodný výběr z dvourozměrného rozložení, přičemž n ≥ 2. Nechť c je
reálná konstanta. Testujeme H0: µ1 - µ2 = c (tj. µ = c) proti H1: µ1 - µ2 ≠ c (tj. µ ≠ c) nebo
testujeme nulovou hypotézu proti jedné z jednostranných alternativ. Tento test se nazývá párový
t-test.
Provedení párového t-testu: Párový t-test se provádí stejně jako jednovýběrový t-test
aplikovaný na rozdílový náhodný výběr Z1, …, Zn.
Příklad na párový t-test:
U 22 vzorků dřeva byla změřena jejich vlhkost v procentech dvěma metodami. Výsledky máme
v tabulce:
Na hladině významnosti 0,05 testujte hypotézu, že střední hodnoty vlhkosti dřeva získané oběma
metodami se neliší.
Řešení pomocí systému STATISTICA:
Otevřeme datový soubor vlhkost_dreva.sta s dvěma proměnnými X, Y a 22 případy. Datový
soubor doplníme o proměnnou Z, do níž uložíme rozdíl X – Y.
Na hladině významnosti 0,05 testujeme hypotézu H0: µ1 - µ2 = 0 proti alternativě H1: µ1 - µ2 ≠ 0.
Jde o úlohu na párový t-test.
Nejprve pomocí N-P grafu a Shapirova – Wilkova testu ověříme, zda data v proměnné Z
pocházejí z normálního rozložení.
Vytvoření N-P plotu: Grafy – 2D Grafy – Normální pravděpodobnostní grafy – Proměnná Z –
OK - odškrtneme Neurčovat průměrnou pozici svázaných pozorování – zaškrtneme Shapiro –
Wilkův test - OK.
Normální p-graf z Z
Tabulka13 3v*22c
-3,5 -3,0 -2,5 -2,0 -1,5 -1,0 -0,5 0,0 0,5 1,0 1,5
Pozorovaný kvantil
-2,5
-2,0
-1,5
-1,0
-0,5
0,0
0,5
1,0
1,5
2,0
Oček.normál.hodnoty
Z: SW-W = 0,932; p = 0,1350
Vzhled N-P grafu svědčí o mírném porušení normality, které však není významné na hladině
významnosti 0,05, protože p-hodnota S – W testu je 0,135, což je větší než 0,05.
Provedení párového t-testu:
Statistiky – Základní statistiky/tabulky – t-test, závislé vzorky – OK – Proměnné – 1. seznam
proměnných X, 2. seznam proměnných Y – OK - Výpočet. Dostaneme tabulku:
t-test pro závislé vzorky (vlhkost_dreva.sta)
Označ. rozdíly jsou významné na hlad. p < ,05000
Proměnná
Průměr Sm.odch. N Rozdíl Sm.odch.
rozdílu
t sv p Int. spolehl.
-95,000%
Int. spolehl.
+95,000%
X
Y
6,945455 0,954552
7,577273 0,944625 22 -0,631818 1,311265 -2,26002 21 0,034569 -1,21320 -0,050436
Testová statistika párového t-testu se realizuje číslem -2,26, odpovídající p-hodnota je 0,0346,
tedy na hladině významnosti 0,05 zamítáme nulovou hypotézu. S rizikem omylu nejvýše 5 %
jsme prokázali, že střední hodnoty vlhkosti dřeva získané oběma metodami se liší.
Tabulku ještě doplníme krabicovými diagramy: Na záložce Detailní výsledky zvolíme
Krabicový graf a vybereme možnost Prům./SmCh/1,96*SmCh.
Krabicový graf
X vs. Y
Průměr
Průměr±SmCh
Průměr±1,96*SmChX Y
6,4
6,6
6,8
7,0
7,2
7,4
7,6
7,8
8,0
8,2
3. Dvouvýběrový t-test
Označení: Máme dva nezávislé náhodné výběry, první je 1n111 X,,X K , pochází z rozložení
N(µ1, σ2
), jeho rozsah n1 ≥ 2, druhý je 2n221 X,,X K , pochází z rozložení N(µ2, σ2
) a jeho rozsah
n2 ≥ 2.
∑=
=
1n
1i
i11 X
n
1
M , ∑=
=
2n
1i
i22 X
n
1
M … výběrové průměry 1. a 2. výběru,
( )∑=
−
−
=
1n
1i
2
1i1
1
2
1 MX
1n
1
S , ( )∑=
−
−
=
2n
1i
2
2i2
2
2
2 MX
1n
1
S … výběrové rozptyly 1. a 2. výběru,
2nn
S)1n(S)1n(
S
21
2
22
2
112
*
−+
−+−
= … vážený průměr výběrových rozptylů.
Definice dvouvýběrového t-testu: Nechť 1n111 X,,X K je náhodný výběr z rozložení N(µ1, σ2
) a
2n221 X,,X K je na něm nezávislý náhodný výběr rozložení N(µ2, σ2
), přičemž n1 ≥ 2 a n2 ≥ 2 a σ2
neznáme. Nechť c je konstanta.
Test H0: µ1 – µ2 = c proti H1: µ1 – µ2 ≠ c (resp. H0: µ1 – µ2 = c proti H1: µ1 – µ2 < c resp. H0: µ1 –
µ2 = c proti H1: µ1 – µ2 > c) se nazývá dvouvýběrový t-test.
Poznámka: Dvouvýběrový t-test je založen na pivotové statistice ( ) ( ) ( )2-nnt~
n
1
n
1
S
MM
T 21
21
*
2121
+
+
µ−µ−−
= .
Dosadíme-li za µ1 – µ2 konstantu c, dostaneme testovou statistku: ( )
21
*
21
0
n
1
n
1
S
cMM
T
+
−−
= , která se
v případě platnosti H0 řídí Studentovým rozložením t(n1+n2-2).
Provedení dvouvýběrového t-testu pomocí kritického oboru
Vypočteme realizaci testové statistiky
( )
21
*
21
0
n
1
n
1
s
cmm
t
+
−−
=
. Stanovíme kritický obor W.
Pokud t0 ∈ W, H0 zamítáme na hladině významnosti α a přijímáme H1.
Oboustranný test: Testujeme H0: µ1 – µ2 = c proti H1: µ1 – µ2 ≠ c. Kritický obor má tvar:
( ) ( ) )( ∞−+∪−+−∞−= α−α− ,2nnt2nnt,W 212/1212/1 .
Levostranný test: Testujeme H0: µ1 – µ2 = c proti H1: µ1 – µ2 < c. Kritický obor má tvar:
( )( 2nnt,W 211 −+−∞−= α− .
Pravostranný test: Testujeme H0: µ1 – µ2 = c proti H1: µ1 – µ2 > c. Kritický obor má tvar:
( ) )∞−+= α− ,2nntW 211 .
Provedení dvouvýběrového t-testu pomocí intervalu spolehlivosti
Pro oboustranný test sestrojíme oboustranný 100(1-α)% interval spolehlivosti pro rozdíl
středních hodnot µ1 – µ2 při společném neznámém rozptylu σ2
:
(d, h) = (m1 – m2 –
21
*
n
1
n
1
s + t1-α/2(n1+n2-2), m1 – m2 +
21
*
n
1
n
1
s + t1-α/2(n1+n2-2))
Pro levostranný test sestrojíme pravostranný 100(1-α)% interval spolehlivosti pro střední
hodnotu µ při společném neznámém rozptylu σ2
:
(-∞, h) = (-∞, m1 – m2 +
21
*
n
1
n
1
s + t1-α(n1+n2-2))
Pro pravostranný test sestrojíme levostranný 100(1-α)% interval spolehlivosti pro střední
hodnotu µ při společném neznámém rozptylu σ2
:
(d, ∞) = (m1 – m2 –
21
*
n
1
n
1
s + t1-α(n1+n2-2), ∞)
Pokud číslo c padne do tohoto intervalu, nulovou hypotézu nezamítáme na hladině významnosti
α. V opačném případě nulovou hypotézu zamítáme na hladině významnosti α a přijímáme
alternativní hypotézu.
Provedení dvouvýběrového t-testu pomocí p-hodnoty
Vypočteme p-hodnotu (nejlépe pomocí statistického software) a porovnáme ji s hladinou
významnosti α. Jestliže p ≤ α, pak nulovou hypotézu zamítáme na hladině významnosti α a
přijímáme alternativní hypotézu. Je-li p > α, pak nulovou hypotézu nezamítáme na hladině
významnosti α.
Způsob výpočtu p-hodnoty:
Označme Φ distribuční funkci Studentova rozložení t(n1+n2-2).
Pro oboustrannou alternativu p = 2 min{Φ( t0), 1- Φ( t0)}.
Pro levostrannou alternativu p = Φ( t0).
Pro pravostrannou alternativu p = 1- Φ( t0).
Upozornění: Před provedením dvouvýběrového t-testu je zapotřebí testovat hypotézu o shodě
rozptylů daných dvou rozložení (tzv. hypotézu homoskedasticity), tj. hypotézu H0: 2
2
2
1
σ
σ
= 1 proti
alternativě H1: 2
2
2
1
σ
σ
≠ 1. K tomu slouží F-test. Je založen na pivotové statistice
F = 2
2
2
1
2
2
2
1
/
S/S
σσ
~ F(n1 – 1, n2 – 1). Nahradíme-li podíl 2
2
2
1
σ
σ
předpokládanou hodnotou 1, dostaneme
testovou statistiku 2
2
2
1
0
s
s
t = , která se v případě platnosti H0 řídí rozložením F(n1-1, n2-1).
Provedení F-testu pomocí kritického oboru
Vypočteme realizaci testové statistiky 2
2
2
1
0
s
s
t = . Stanovíme kritický obor W.
Pokud t0 ∈ W, H0 zamítáme na hladině významnosti α a přijímáme H1.
Oboustranný test: Testujeme H0: 2
2
2
1
σ
σ
= 1 proti H1: 2
2
2
1
σ
σ
≠ 1. Kritický obor má tvar:
( ) ( ) )( ∞−−∪−−= α−α ,1n,1nF1n,1nF,0W 212/1212/ .
Levostranný test: Testujeme H0: 2
2
2
1
σ
σ
= 1 proti H1: 2
2
2
1
σ
σ
< 1. Kritický obor má tvar:
( )( 1n,1nF,0W 21 −−= α .
Pravostranný test: Testujeme H0: 2
2
2
1
σ
σ
= 1 proti H1: 2
2
2
1
σ
σ
> 1. Kritický obor má tvar:
( ) )∞−−= α− ,1n,1nFW 211 .
Provedení F-testu pomocí intervalu spolehlivosti
Pro oboustranný test sestrojíme oboustranný 100(1-α)% interval spolehlivosti pro podíl rozptylů 2
2
2
1
σ
σ
:
(d, h) = 







−−−− αα )1n,1n(F
s/s
,
)1n,1n(F
s/s
21/2
2
2
2
1
21/2-1
2
2
2
1
Pro levostranný test sestrojíme pravostranný 100(1-α)% interval spolehlivosti pro podíl rozptylů 2
2
2
1
σ
σ
:
(0, h) = 







−−α )1n,1n(F
s/s
,0
21
2
2
2
1
Pro pravostranný test sestrojíme levostranný 100(1-α)% interval spolehlivosti pro podíl rozptylů 2
2
2
1
σ
σ
:
(d, ∞) = 







∞
−−α
,
)1n,1n(F
s/s
21-1
2
2
2
1
.
Pokud číslo c padne do intervalu spolehlivosti, nulovou hypotézu nezamítáme na hladině významnosti α.
V opačném případě nulovou hypotézu zamítáme na hladině významnosti α a přijímáme alternativní
hypotézu.
Provedení F-testu pomocí p-hodnoty
Vypočteme p-hodnotu (nejlépe pomocí statistického software) a porovnáme ji s hladinou
významnosti α. Jestliže p ≤ α, pak nulovou hypotézu zamítáme na hladině významnosti α a
přijímáme alternativní hypotézu. Je-li p > α, pak nulovou hypotézu nezamítáme na hladině
významnosti α.
Způsob výpočtu p-hodnoty:
Označme Φ distribuční funkci Fisherova - Snedecorova rozložení F(n1-1, n2-1).
Pro oboustrannou alternativu p = 2 min{Φ( t0), 1- Φ( t0)}.
Pro levostrannou alternativu p = Φ( t0).
Pro pravostrannou alternativu p = 1- Φ( t0).
Příklad na dvouvýběrový t-test:
V restauraci "U bílého koníčka" měřili ve 20 případech čas obsluhy zákazníka. Výsledky
v minutách: 6, 8, 11, 4, 7, 6, 10, 6, 9, 8, 5, 12, 13, 10, 9, 8, 7, 11, 10, 5. V restauraci "Zlatý lev"
bylo dané pozorování uskutečněno v 15 případech s těmito výsledky: 9, 11, 10, 7, 6, 4, 8, 13, 5,
15, 8, 5, 6, 8 ,7. Na hladině významnosti 0,05 testujte hypotézu, že střední hodnoty doby obsluhy
jsou v obou restauracích stejné.
Řešení pomocí systému STATISTICA:
Otevřeme datový soubor restaurace.sta s dvěma proměnnými X a ID a 35 případy. V proměnné
X jsou zapsány zjištěné doby obsluhy. Proměnná ID slouží k rozlišení restaurací – nabývá
hodnoty 1 pro restauraci "U bílého koníčka" a hodnoty 2 pro restauraci „Zlatý lev“.
Na hladině významnosti 0,05 testujeme nulovou hypotézu H0: µ1 - µ2 = 0 proti oboustranné
alternativě H1: µ1 – µ2 ≠ 0. Je to úloha na dvouvýběrový t-test.
Nejprve ověříme předpoklady dvouvýběrového t-testu.
Nezávislost obou náhodných výběrů: splněno, plyne přímo ze způsobu pořízení dat.
Normalita obou nezávislých náhodných výběrů: ověříme pomocí N-P grafů a
Shapirova – Wilkova testu.
Vytvoření N-P plotu pro oba výběry: Grafy – 2D Grafy – Normální pravděpodobnostní grafy
– Proměnná X – OK - odškrtneme Neurčovat průměrnou pozici svázaných pozorování –
zaškrtneme Shapiro – Wilkův test – na záložce Kategorizovaný zapneme Kategorie X – Změnit
proměnnou - ID – OK – OK.
Ověření normality pomocí N-P grafu a S-W testu:
Normální p-graf z X; kategorizovaný id
restaurace.sta 2v*35c
Pozorovaný kvantil
Oček.normál.hodnoty
id: 1
2 4 6 8 10 12 14 16
-2,0
-1,5
-1,0
-0,5
0,0
0,5
1,0
1,5
2,0
id: 2
2 4 6 8 10 12 14 16
id: 1 X: SW-W = 0,9715; p = 0,7871
id: 2 X: SW-W = 0,9345; p = 0,3185
V obou případech jsou body v N-P grafu blízko ideální přímky.
Pro první výběr S-W test poskytl p-hodnotu 0,7871, pro druhý výběr 0,3185, tedy na hladině
významnosti 0,05 nezamítáme ani v jednom případě hypotézu o normalitě.
Testování hypotézy o shodě rozptylů:
Statistiky – Základní statistiky /tabulky – t-test, nezávislé, dle skupin – OK, Proměnné –Závislé
proměnné X, Grupovací proměnná ID – OK.
Po kliknutí na tlačítko Výpočet dostaneme tabulku:
t-testy; grupováno: ID (restaurace.sta)
Skup. 1: 1
Skup. 2: 2
Proměnná
Průměr
1
Průměr
2
t sv p Poč.plat
1
Poč.plat.
2
Sm.odch.
1
Sm.odch.
2
F-poměr
Rozptyly
p
Rozptyly
X 8,250000 8,133333 0,123730 33 0,902279 20 15 2,510504 3,067495 1,492952 0,410440
Vidíme, že testová statistika pro test shody rozptylů se realizuje hodnotou 1,492952,
odpovídající p-hodnota je 0,41044, tedy na hladině významnosti 0,05 nezamítáme hypotézu o
shodě rozptylů.
(Upozornění: v případě zamítnutí hypotézy o shodě rozptylů je zapotřebí v tabulce t-testu pro
nezávislé vzorky dle skupin zaškrtnout volbu Test se samostatnými odhady rozptylu.)
Testování hypotézy o shodě středních hodnot (provedení dvouvýběrového t-testu):
Z výše uvedené výstupní tabulky plyne, že testová statistika pro test shody středních hodnot se
realizuje hodnotou 0,12373, počet stupňů volnosti je 33, odpovídající p-hodnota 0,902279, tedy
hypotézu o shodě středních hodnot nezamítáme na hladině významnosti 0,05. Neprokázal se
rozdíl ve středních hodnotách dob obsluhy v restauracích "U bílého koníčka" a „Zlatý lev“.
Tabulku ještě doplníme krabicovými diagramy. Na záložce Detaily zaškrtneme krabicový graf a
vybereme volbu Průměr/SmCh/1,96*SmCh.
Krabicový graf : X: doba obsluhy
Průměr
Průměr±SmCh
Průměr±1,96*SmCh
1 2
ID
6,0
6,5
7,0
7,5
8,0
8,5
9,0
9,5
10,0
X
Z grafu je vidět, že průměrná doba obsluhy v první restauraci je nepatrně delší a má menší
variabilitu než ve druhé restauraci.
Cohenův koeficient věcného účinku – doplnění významu dvouvýběrového t-testu:
Cohenův koeficient d vypočteme podle vzorce:
*
21
s
mm
d
−
= .
Tento koeficient slouží k posouzení velikosti rozdílu průměrů, který je standardizován pomocí
odmocniny z váženého průměru výběrových rozptylů. Jedná se o tzv. věcnou významnost neboli
velikost účinku skupiny na variabilitu hodnot sledované náhodné veličiny. Velikost účinku
hodnotíme podle následující tabulky:
Hodnota d účinek
aspoň 0,8 velký
mezi 0,5 až 0,8 střední
mezi 0,2 až 0,5 malý
pod 0,2 zanedbatelný
(Uvedené hodnoty nemají samozřejmě absolutní platnost, posouzení, jaký účinek považujeme za
velký či malý, závisí na kontextu.)
Je zapotřebí si uvědomit, že při dostatečně velkých rozsazích náhodných výběrů i malý rozdíl
ve výběrových průměrech způsobí zamítnutí nulové hypotézy na hladině významnosti α, i když
z věcného hlediska tak malý rozdíl nemá význam. Naopak, máme-li výběry malých rozsahů, pak
i značně velký rozdíl ve výběrových průměrech nemusí vést k zamítnutí nulové hypotézy na
hladině významnosti α.
V předešlém příkladě d = 0,0423, tedy účinek restaurace na průměrnou dobu obsluhy je zcela
zanedbatelný.
4. Provedení t-testů v systému STATISTICA pomocí aplikace Testy rozdílů
Předpokládejme, že jsou splněny podmínky použití t-testů (normalita, v případě dvou výběrů
nezávislost a homoskedasticita). Ze zadaných dat zjistíme rozsahy, průměry a směrodatné
odchylky.
Jednovýběrový t-test:
Použijeme příklad s obsahem vitamínu C ve 20 vzorcích mrkve.
V Základních statistikách a tabulkách vypočteme průměr (m = 34,86) a směrodatnou odchylku
(s = 11,087) obsahu vitamínu C. Pak použijeme Testy rozdílů: r, %, průměry – OK – vybereme
Rozdíl mezi dvěma průměry (normální rozdělení) – zaškrtneme Výběrový průměr vs. Střední
hodnota – do políčka Pr1 napíšeme 34,86, do políčka SmOd1 napíšeme 11,087, do políčka N1
napíšeme 20, do políčka Pr2 napíšeme 35 - Výpočet. Dostaneme p-hodnotu 0,9556, tedy
nezamítáme nulovou hypotézu na hladině významnosti 0,05.
Párový t-test:
Použijeme příklad s měřením vlhkosti 22 vzorků dřeva dvěma metodami.
V Základních statistikách a tabulkách vypočteme průměr (m = -0,6318) a směrodatnou odchylku
(s = 1,3113) rozdílů výsledků obou metod. Pak použijeme Testy rozdílů: r, %, průměry – OK –
vybereme Rozdíl mezi dvěma průměry (normální rozdělení) – zaškrtneme Výběrový průměr vs.
Střední hodnota – do políčka Pr1 napíšeme -0,6318, do políčka SmOd1 napíšeme 1,3113, do
políčka N1 napíšeme 22, do políčka Pr2 napíšeme 0 - Výpočet. Dostaneme p-hodnotu 0,0346,
tedy zamítáme nulovou hypotézu na hladině významnosti 0,05.
Dvouvýběrový t-test:
Použijeme příklad s dobami obsluhy zákazníků ve dvou restauracích.
V Základních statistikách a tabulkách vypočteme průměry (m1 = 8,25, m2 = 8,1313 ) a
směrodatné odchylky dob obsluhy v obou restauracích (s1 = 2,5105, s2 = 3,0675).
Pak použijeme Testy rozdílů: r, %, průměry – OK – vybereme Rozdíl mezi dvěma průměry
(normální rozdělení) – do políčka Pr1 napíšeme 8,25, do políčka SmOd1 napíšeme 2,5105, do
políčka N1 napíšeme 20, do políčka Pr2 napíšeme 8,1313, do políčka SmOd2 napíšeme 3,0675,
do políčka N2 napíšeme 15 – Výpočet. Dostaneme p-hodnotu 0,9006, tedy nezamítáme nulovou
hypotézu na hladině významnosti 0,05.