Seminář 6 – statistické testy
Část I. – Volba správného testu
 Chceme zjistit, zda se Ježkovy a Širůčkovy seminární skupiny liší ve výsledcích v 2. průběžné
písemce ze statistiky.
 Chceme zjistit, zda 1. průběžná písemka ze statistiky byla stejně těžká jako 2. průběžná.
 Chceme zjistit, zda populační rozložení skórů 1. průběžné písemky má průměr 7 (pro který byl
konstruován).
 Chceme zjistit podle známek v ISu, jestli je statistika stejně těžká jako vývojová psychologie 2.
 Chceme zjistit podle známek v ISu, zda je statistika stejně těžká pro muže a ženy.
 Chceme zjistit, zda jsou v populaci všechny základní barvy (b,čr,čv,z,m,ž,o,h) stejně oblíbené.
 Chceme zjistit, zda se kombinovaní a prezenční studenti psychologie liší v preferenci placeného
vysokoškolského studia.
 Chceme na vzorku 30 rodin se dvěma školou povinnými dětmi zjistit, zda mladší i starší
sourozenci jsou stejně populární ve své třídě.
 Chceme zjistit, zda výkonnost ve statistice (1.průběžná) roste s dobou přípravy (v hodinách).
 Chceme zjistit, zda platí, že čím více chodí lidé do kina, tím méně jsou pro školné na VŠ.
 Chceme zjistit, zda se milovníci různých základních barev liší ve výkonnosti ve statistice (1.
průběžná).
 Chceme na vzorku 30 spokojených partnerů uvěřit hypotézu, že ve spokojených vztazích se míra
romantičnosti obou partnerů neliší.
Úkol
a) pro každou situaci najít ten správný test
… b) najít kód receptu Oseckých
Část II. Příklady výstupů k jednotlivým testům.
1. t-test pro nezávislé skupiny
Chceme zjistit, zda se středeční a čtvrteční seminární skupiny liší ve výsledcích v 1. průběžné písemce.
sem N Mean Std. Deviation Std. Error Mean
P2 CD 28 7,07 2,879 ,544
AB 49 6,00 3,367 ,481
Independent Samples Test
Levene's Test for
Equality of Variances t-test for Equality of Means
F Sig. t df
Sig. (2-
tailed)
Mean
Difference
Std. Error
Difference
95% Confidence Interval
of the Difference
Lower Upper
P2 Equal variances
assumed
1,516 ,222 1,413 75 ,162 1,071 ,758 -,439 2,581
Equal variances
not assumed
1,475 63,768 ,145 1,071 ,726 -,379 2,522
2. párový t-test
Chceme zjistit, zda 1. průběžná písemka ze statistiky byla stejně těžká jako 2. průběžná. (loňská data)
Paired Samples Statistics
Mean N Std. Deviation Std. Error Mean
Pair 1 P1 7,04 77 2,998 ,342
P2 6,39 77 3,221 ,367
Paired Samples Correlations
N Correlation Sig.
Pair 1 P1 & P2 77 ,358 ,001
Paired Samples Test
Paired Differences
Mean Std. Deviation
Std. Error
Mean
95% Confidence Interval of
the Difference
t df Sig. (2-tailed)Lower Upper
Pair 1 P1 - P2 ,649 3,527 ,402 -,151 1,450 1,615 76 ,110
3. jednovýběrový t-test
Chceme zjistit, zda populační rozložení skórů 1. průběžné písemky má průměr 7.
One-Sample Statistics
N Mean Std. Deviation Std. Error Mean
P2 77 6,39 3,221 ,367
One-Sample Test
Test Value = 7
t df Sig. (2-tailed) Mean Difference
95% Confidence Interval of the
Difference
Lower Upper
P2 -1,663 76 ,100 -,610 -1,34 ,12
4. neparametrický test pro dva nezávislé výběry – Mann-Whitney U
Chceme zjistit, zda se středeční a čtvrteční seminární skupiny liší ve výsledcích v 1. průběžné písemce.
… a nevěříme tak úplně dobře intervalovosti svého měření
Ranks
sem3 N Mean Rank Sum of Ranks
P2 1,00 49 36,22 1775,00
2,00 28 43,86 1228,00
Total 77
Test Statistics
a
P2
Mann-Whitney U 550,000
Wilcoxon W 1775,000
Z -1,459
Asymp. Sig. (2-tailed) ,144
a. Grouping Variable: sem3
5. neparametrický párový test – Wilcoxon T
Chceme zjistit, zda 1. průběžná písemka ze statistiky byla stejně těžká jako 2. průběžná (loňská data).
… a nevěříme tak úplně dobře intervalovosti svého měření
Ranks
55a 43,58 2397,00
26b 35,54 924,00
7c
88
Negative Ranks
Positive Ranks
Ties
Total
p2 - p1
N Mean Rank Sum of Ranks
p2 < p1a.
p2 > p1b.
p2 = p1c.
Test Statisticsb
-3,482a
,000
Z
Asy mp. Sig. (2-tailed)
p2 - p1
Based on positiv e ranks.a.
Wilcoxon Signed Ranks Testb.
6. Chí-kvadrát test dobré shody
Chceme zjistit, zda jsou v populaci studentů odpůrci a příznivci školného zastoupeni rovnoměrně.
skolne
29 41,5 -12,5
54 41,5 12,5
83
pro
proti
Total
Observed N Expected N Residual
Test Statistics
7,530
1
,006
Chi-Squarea
df
Asy mp. Sig.
skolne
0 cells (,0%) hav e expected frequencies less than
5. The minimum expected cell f requency is 41,5.
a.
7. Chí kvadrát test rozdílu rozložení mezi dvěma populacemi / nezávislosti mezi dvěma kategoriálními
proměnnými.
Chceme zjistit, zda je poměr příznivců/odpůrců stejný mezi prezenčními a kombinovanými studenty.
Část III. Ruční počítání statistických testů
A) t-test pro nezávislé skupiny
Chceme zjistit, zda se studenti, kteří připustili, že by je statistika mohla bavit (A), liší od těch, co je
statistika bavit nebude (B) v míře potřeby struktury (NFS – vyšší číslo je menší potřeba struktury).
sk N Mean Std. Deviation
Std. Error
Mean
NFS B 45 3,26 0,570 ,085
A 38 3,52 0,660 ,107
1. H0: s = č neboli  = s – č = 0 a hladinu významnosti zvolíme  = 0,05
2. Rozdíl průměrů nezávislých skupin má t-rozložení s n1 + n2 – 2 stupni volnosti, středem v  a
směrodatnou chybou 









2121
2
22
2
11 11
2
)1()1(
nnnn
snsn
sd
3. Nyní spočítáme testovou statistiku, což je t, které vyjadřuje jak je zjištěný rozdíl veliký v jednotkách
své směrodatné chyby. Jinými slovy, rozdíl průměrů převedeme na standardizovaný skór t, což je něco
jako z. Ještě jinými slovy, abychom rozdíl průměrů v jednotkách měření mohli snadněji interpretovat,
standardizujeme jej.
d
čs
s
mm
t
0

4. Jaká je pravděpodobnost, že nám při náhodném výběru z t-rozložení s 81 stupni volnosti a průměrem 0
vyjde standardizovaná hodnota t =1,95 nebo větší?
TDIST(1,95;81;2) =
5. Vyšla nám pravděpodobnost vyšší než je zvolená hladina statistické významnosti. To znamená, že
kdyby byla nulová hypotéza platná, tak by tak velký rozdíl, jaký nám vyšel, mohl vyjít se %
pravděpodobností. Nulovou hypotézu tedy na 5% hladině významnosti nezamítáme.
6. Interval spolehlivosti pro rozdíl průměrů
d – 0,975t(81)sd <  < d + 0,975t(81)sd
7. Co nám SPSS nespočítalo - velikost účinku – Cohenovo d
Cohenovo
pooleds
d
d 
B) Párový t-test (t-test pro korelované vzorky)
Chceme zjistit, zda 1. průběžná písemka ze statistiky byla stejně těžká jako 2. průběžná. (loňská data)
Paired Samples Statistics
9,7045 88 2,65295 ,28281
8,3523 88 3,04389 ,32448
p1
p2
Pair
1
Mean N Std. Dev iation
Std. Error
Mean
Paired Samples Correlations
88 ,295 ,005p1 & p2Pair 1
N Correlation Sig.
1. H0: s = č neboli  = s – č = 0 a hladinu významnosti zvolíme  = 0,05
2. Rozdíl průměrů nezávislých skupin má t-rozložení s n – 1 stupni volnosti, středem v  a směrodatnou
chybou )2(
1
21
2
2
2
1 srsss
n
sd 
3. Nyní spočítáme testovou statistiku, což je t, které vyjadřuje jak je zjištěný rozdíl veliký v jednotkách
své směrodatné chyby (jinými slovy, rozdíl průměrů převedeme na standardizovaný skór t, což je něco
jako z).
ds
mm
t 21 

4. Jaká je pravděpodobnost, že nám při náhodném výběru z t-rozložení s 87 stupni volnosti a průměrem 0
vyjde standardizovaná hodnota 3,73 nebo větší?
TDIST(3,73;82;2) = 0,0003
5. Vyšla nám pravděpodobnost nižší než je zvolená hladina statistické významnosti. To znamená, že
kdyby byla nulová hypotéza skutečně platná, tak by tak by pravděpodobnost toho, že nám vyjde tak velký
nebo větší rozdíl, než jaký nám vyšel, byla velmi nízká cca 0,03%. Nulovou hypotézu tedy na 5% hladině
významnosti zamítáme.
6. Interval spolehlivosti
d – 0,975t(87)sd <  < d + 0,975t(87)sd
7. Co nám SPSS nespočítalo - velikost účinku – Cohenovo d
Cohenovo
pooleds
d
d 
B) Chí-kvadrátový test nezávislosti proměnných (homogenity)
Chceme zjistit, zda je poměr příznivců/odpůrců stejný mezi studenty píšícími levou a pravou.
skolne
Totalpro proti
Psaní leváci Observed Count (fo) 4 11 15
27% 73%
praváci Observed Count (fo) 30 34 64
47% 53%
Total Observed Count 34 45 79
1. H0: 
Kdyby bylo procento příznivců stejné mezi praváky a leváky (43% ku 57%), očekávali bychom abcd
přibližně 6,5 8,5 27,5 a 36,5. Konceptuální nulová hypotéza je tedy, že mezi očekávanými četnostmi a
skutečně získanými četnostmi není žádný rozdíl. Konkrétním statistickým vyjádřením těchto rozdílů je
jejich speciální součet zvaný chí-kvadrát, jehož výběrové rozložení známe



e
eo
f
ff 2
2 )(

Očekávaná hodnota (průměr) chí-kvadrát rozložení je rovna jeho stupňům volnosti  = (i-1)(j-1)
H0: 2
= ; H1: 2
> (ano, jednostranný test)a hladinu významnosti zvolíme  = 0,05
2. Spočítáme testovou statistiku
3. Jaká je pravděpodobnost této hodnoty 2
s jedním stupněm volnosti, pokud platí H0?
CHIDIST(2;1)=0,0135
4. H0 na 5% hladině významnosti zamítáme; rozdíly jsou příliš velké na to, aby se přihodily náhodou.
5. Velikost účinku je zde např. r, nebo Cramerovo V
r =
n
2

C) Interval spolehlivosti a test hypotézy o relativních četnostech
p má přibližně normální rozložení s průměrem  a
n
pp
N
n
p
)1.().1( 

1. činitel v čitateli zohledňuje, jak velkou část populace máme ve vzorku. Je-li populace vzhledem
k vzorku obrovská(nekonečná), nemusíme ho používat.