Testování hypotéz
Testování hypotéz o rozdílu průměrů
ot-test pro nezávislé výběry
ot-test pro závislé výběry
o
oPorovnání výzkumných plánů
oPrezentace výsledků t-testu
o
o
o

Testování hypotéz o rozdílu průměrů
o4 možné typy problémů:
nporovnáváme průměr vzorku
s průměrem populace
à jednovýběrový t-test
nporovnáváme průměry dvou vzorků
à t-test pro nezávislé výběry
nporovnáváme dva průměry jednoho vzorku à t-test pro závislé výběry (tzv. párový t-test)
nporovnáváme více průměrů
à analýza rozptylu
n

T-test pro nezávislé výběry
otento test používáme, pokud chceme porovnat průměry dvou skupin případů
onapř.
nprůměrné skóre v neurocitismu u mužů a žen
nprůměr v indexu životní spokojenosti u extravertů a introvertů atd.

T-test pro nezávislé výběry - příklad
oVýzkumník chce otestovat účinnost nového léku proti bolesti hlavy. Získá 20 dobrovolníků, náhodně
je rozdělí do dvou skupin po 10 osobách: jedna skupina si domů odnese placebo, druhá testovaný lék
(ani účastníci, ani výzkumník nevědí, kdo je ve které skupině). Účastníci studie si mají vzít lék
ve chvíli, kdy je začne bolet hlava a zaznamenat, jak dlouho poté bolest trvala (kolik minut).

T-test pro nezávislé výběry - příklad
skupina s placebem
skupina s test. lékem
95
75
85
60
100
30
120
65
80
100
90
70
85
40
80
55
75
65
120
110

T-test pro nezávislé výběry
oplacebo
nprůměrná délka bolesti 93 minut; směrodatná odchylka 16.02
otestovaný lék
nprůměrná délka bolesti 67 minut; směrodatná odchylka 24.28

1. Určení statistické hypotézy
onulová hypotéza: délka trvání bolesti hlavy po aplikaci léku a po aplikaci placeba se neliší
(=účinnost testovaného léku se neliší od účinnosti placeba)
ojinými slovy: rozdílné průměry (93 a 67 minut) trvání bolesti je možno vysvětlit náhodou – vzorky
mohou pocházet
z populace o stejném průměru

1. Určení statistické hypotézy
oalternativní hypotéza: délka trvání bolesti hlavy po aplikaci léku a po aplikaci placeba je
rozdílná
(= mezi účinností testovaného léku
a účinností placeba je rozdíl)
ojinými slovy: rozdíl v průměrech skupin (93 a 67 minut) v trvání bolesti je velmi nepravděpodobně
pouze náhodný (je velmi nepravděpodobné, že by oba vzorky pocházely z populace o stejném průměru)

2. Určení hladiny chyby a
ohladina významnosti: použijeme
a =5%
opokud je pravděpodobnost získání takto rozdílných průměrů z jedné populace menší než 5%, pak
zamítneme H0 (závěr – lék je účinný)
opokud je pravděpodobnost získání takto rozdílných průměrů z jedné populace větší než 5%, pak H0
nezamítneme

T-test pro nezávislé výběry
optáme se vlastně: jak velká je pravděpodobnost, že bychom získali dva takto rozdílné průměry,
pokud by platila nulová hypotéza, tj. pokud by lék nebyl účinnější než placebo?
opokud je tato pravděpodobnost velmi malá, nepřipíšeme zjištěný rozdíl náhodě, ale nezávislé
proměnné (lék vs. placebo)

3. Výpočet testovací statistiky
oobecně se testová statistika t vypočítá jako
nrozdíl výběrových průměrů dvou nezávislých výběrů – očekávaný rozdíl, pokud platí H0 (=0)
na vydělíme ho odhadem směrodatné chyby rozdílu výběrových průměrů
otj. rozdíl průměrů vydělíme tzv. sdruženým odhadem variability

3. Výpočet testovací statistiky


3. Výpočet testovací statistiky
ot = (93 – 67) /  (16.022/10 + 24.282/10)
t = 26 / 9.198
t = 2.82
odf = n-2 = 20-2 = 18
(počet stupňů volnosti pro vyhledání pravděpodobnosti v tabulce t-rozdělení)


4. Rozhodnutí
okritická hodnota t je 2.101 (tj. 95% všech standardizovaných rozdílů průměrů je do hodnoty
+/-2.101)
ozískaná hodnota t je 2.82 – větší než kritická hodnota
orozdíl průměrů obou skupin je tedy statisticky významný na hladině 5%
o

4. Rozhodnutí
opravděpodobnost, že bychom vzorky o tak rozdílných průměrech získali z jedné populace je menší než
5%
oje velmi málo pravděpodobné, že by byl takový rozdíl v průměrech, pokud by lék byl ve skutečnosti
neúčinný

T-test pro nezávislé výběry
v SPSS


T-test pro nezávislé výběry
opředpoklady t-testu pro nezávislé výběry
nvýběry jsou skutečně nezávislé (tj. oba výběry tvoří jiní lidé, zvířata atd.)
nměřený znak má normální rozdělení (mírné odchylky je možno tolerovat; u větších odchylek a malých
vzorků použít raději neparametrické testy)
nhomogenita rozptylů – rozptyly jsou shodné u obou skupin

T-test pro nezávislé výběry
ohomogenita rozptylů
oobvykle nejsou směrodatné odchylky (či rozptyly) zcela shodné, ale rozdíly by neměly být příliš
velké
o
o
o

T-test pro nezávislé výběry
ohomogenita rozptylů
ozda se rozptyly liší, je možno otestovat některým testem pro rozdíl rozptylů, např. F-testem
npokud nevyjde stat. významný, pak rozptyly pokládáme za shodné
npokud vyjde stat. významný, interpretujeme modifikovaný t-test pro rozdílné rozptyly (equal
variances not assumed)
o
o

F-test pro shodu rozptylů
ve Statistice


T-test pro závislé výběry
ooznačuje se někdy také jako t-test pro párované výběry
ov naprosté většině případů se používá pro porovnání dvou měření u stejných osob (tj. páru měření u
jedné skupiny osob)
oněkdy také pro porovnání průměrů u dvou skupin osob, které tvoří páry (např. manželské či podle
jiného klíče – věku, pohlaví, nemoci atd.)

T-test pro závislé výběry - příklad
oPsychiatr chce vyhodnotit úspěšnost určitého způsobu terapie poruch příjmu potravy. Terapie se
účastnilo 10 dívek. U každé z nich byla zaznamenána váha před a po terapii. Psychiatr si chce
ověřit, zda jejich hmotnost průkazně vzrostla.

T-test pro závislé výběry - příklad
hmotnost před terapií
hmotnost po terapii
36
45
38
41
45
40
45
45
38
45
40
63
49
59
54
63
47
54
49
61

T-test pro závislé výběry
oprůměrná hmotnost před zahájením terapie 44.1 kg
směrodatná odchylka 5.90
oprůměrná hmotnost po ukončení terapie 51.6 kg
směrodatná odchylka 9.35

T-test pro závislé výběry - příklad
 před
po
rozdíl (před – po)
36
45
-9
38
41
-3
45
40
+5
45
45
0
38
45
-7
40
63
-23
49
59
-10
54
63
-9
47
54
+7
49
61
-12

T-test pro závislé výběry
oprůměrný rozdíl hmotnosti před a po terapii byl 7.5 kg
směrodatná odchylka rozdílu 7.49
o

1. Určení statistické hypotézy
onulová hypotéza: terapie není účinná – rozdíl v hmotnosti před a po terapii je nulový
ojinými slovy: je velká pravděpodobnost, že zjištěný rozdíl o této velikosti (7.5 kg) je pouze
náhodný

1. Určení statistické hypotézy
oalternativní hypotéza: terapie je účinná – existuje rozdíl v hmotnosti před a po terapii
ojinými slovy: je jen velmi malá pravděpodobnost, že rozdíl o této velikosti (7.5 kg) je pouze
náhodný

2. Určení hladiny chyby a
ohladina významnosti: použijeme
a =5%
opokud je pravděpodobnost získání takto rozdílných průměrů menší než 5%, pak zamítneme H0 (závěr –
terapie je účinná)
opokud je pravděpodobnost získání takto rozdílných průměrů větší než 5%, pak H0 nemůžeme zamítnout
o

3. Výpočet testovací statistiky
oprůměrný rozdíl před a po
o
o
osměrodatná odchylka průměrného rozdílu

3. Výpočet testovací statistiky
ot = - 7.5 /(7.48/10)
t = - 7.5 / 2.37
t = - 3.16
odf = n-1 = 10-1 = 9
(počet stupňů volnosti pro vyhledání pravděpodobnosti v tabulce t-rozdělení)
o


4. Rozhodnutí
okritická hodnota t je 2.262
ozískaná hodnota t je 3.16 – větší než kritická hodnota
orozdíl obou průměrů je tedy statisticky významný na hladině 5%
omůžeme zamítnout nulovou hypotézu
oterapie je účinná
o

T-test pro závislé výběry
v SPSS


Porovnání výzkumných plánů
ot-test pro nezávislé výběry se používá většinou u výzkumných plánů s výzkumnou a kontrolní
skupinou
ozatímco t-test pro závislé výběry většinou u výzkumných plánů s opakovaným měřením u stejných osob

Porovnání výzkumných plánů
ovýhody opakovaného měření:
nkontrola vlivu intervenujících proměnných (všichni jsou v jedné skupině, nehrají roli případné
náhodné rozdíly mezi skupinami)
npostačí menší vzorek (test pro závislé výběry má větší statistickou sílu – spíše zamítne nulovou
hypotézu, pokud neplatí)

Porovnání výzkumných plánů
onevýhody opakovaných měření:
nnemůže být použito pro všechny výzkumné problémy (porovnání mužů a žen, vzdělaných a
nevzdělaných…)
nmožný vliv učení či únavy při testování výkonovými testy

Prezentace výsledků t-testu
ouvádějí se obvykle průměry, směrodatné odchylky a počty osob, příp. rozdíly mezi průměry (příp.
intervaly spolehlivosti),
u párových t-testů korelace
ohodnota t, počet stupňů volnosti a hladina významnosti
nRozdíl mezi průměrným reakčním časem u sprinterů a vytrvalců byl statisticky významný (t=5.89;
sv=60, p<0.05).

Prezentace výsledků t-testu
opříklad výsledků
t-testu
v tabulce

Prezentace výsledků t-testu
opříklad prezentace výsledků t-testu v textu
o

Kontrolní otázky
ojaké testy se používají pro testování hypotéz o rozdílu průměrů?
opro jaké typy výzkumných plánů použijete jednovýběrový t-test?
oporovnejte užití t-testu pro nezávislé a pro závislé výběry