Parametrické úlohy o více nezávislých náhodných výběrech
Osnova:
Porovnání aspoň tří nezávislých náhodných výběrů z normálních rozložení (jednofaktorová analýza rozptylu)
- testování hypotézy o shodě středních hodnot
- testování hypotézy o shodě rozptylů (testy homogenity rozptylů)
- zkoumání vlastností testů homogenity pomocí simulačních studií
- post-hoc metody mnohonásobného porovnávání
Porovnání aspoň tří nezávislých náhodných výběrů z alternativních rozložení
- test homogenity binomických rozložení
- mnohonásobné porovnávání
I. Případ r ≥ 3 nezávislých náhodných výběrů z normálních rozložení (Analýza rozptylu jednoduchého třídění)
Motivace: Zajímáme se o problém, zda lze určitým faktorem (tj. nominální náhodnou veličinou A) vysvětlit variabilitu
pozorovaných hodnot náhodné veličiny X, která je intervalového či poměrového typu. Např. zkoumáme, zda metoda výuky
určitého předmětu (faktor A) ovlivňuje počet bodů dosažených studenty v závěrečném testu (náhodná veličina X).
Předpokládáme, že faktor A má r ≥ 3 úrovní a přitom i-té úrovni odpovídá ni pozorování iin1i X,,X K , které tvoří náhodný
výběr z rozložení N(µi, σ2
), i = 1, ..., r a jednotlivé náhodné výběry jsou stochasticky nezávislé, tedy Xij = µi + εij, kde εij jsou
stochasticky nezávislé náhodné veličiny s rozložením N(0, σ2
), i = 1, …, r, j = 1, …, ni.
Výsledky lze zapsat do tabulky
faktor A výsledky
úroveň 1 1n111 X,,X K
úroveň 2 2n221 X,,X K
… …
úroveň r rrn1r X,,X K
Ilustrace:
Na hladině významnosti α testujeme nulovou hypotézu, která tvrdí, že všechny střední hodnoty jsou stejné, tj.
H0: µ1 = … = µr proti alternativní hypotéze H1, která tvrdí, že aspoň jedna dvojice středních hodnot se liší.
Jedná se tedy o zobecnění dvouvýběrového t-testu a na první pohled se zdá, že stačí utvořit 





2
r
dvojic náhodných výběrů a
na každou dvojici aplikovat dvouvýběrový t-test. Hypotézu o shodě všech středních hodnot bychom pak zamítli, pokud
aspoň v jednom případě z 





2
r
porovnávání se prokáže odlišnost středních hodnot. Odtud je vidět, že k neoprávněnému zamítnutí
nulové hypotézy (tj. k chybě 1. druhu) může dojít s pravděpodobností větší než α. Proto ve 30. letech 20. století vytvořil
R. A. Fisher metodu ANOVA (analýza rozptylu, v popsané situaci konkrétně analýza rozptylu jednoduchého třídění),
která uvedenou podmínku splňuje.
Pokud na hladině významnosti α zamítneme nulovou hypotézu, zajímá nás, které dvojice středních hodnot se od sebe liší.
K řešení tohoto problému slouží metody mnohonásobného porovnávání, např. Scheffého nebo Tukeyova metoda.
Označení:
V analýze rozptylu jednoduchého třídění se používá tzv. tečková notace.
∑=
=
r
1i
inn … celkový rozsah všech r výběrů
∑=
=
in
1j
ij.i XX … součet hodnot v i-tém výběru
.i
i
.i X
n
1
M = … výběrový průměr v i-tém výběru
∑∑= =
=
r
1i
n
1j
ij..
i
XX … součet hodnot všech výběrů
.... X
n
1
M = … celkový průměr všech r výběrů
Zavedeme součty čtverců
( )∑∑= =
−=
r
1i
n
1j
2
..ijT
i
MXS … celkový součet čtverců (charakterizuje variabilitu jednotlivých pozorování kolem celkového průmě-
ru),
počet stupňů volnosti fT = n – 1,
( )∑=
−=
r
1i
2
...iiA MMnS … skupinový součet čtverců (charakterizuje variabilitu mezi jednotlivými náhodnými výběry),
počet stupňů volnosti fA = r – 1.
Sčítanec ( )...i MM − představuje bodový odhad efektu αi.
( )∑∑= =
−=
r
1i
n
1j
2
.iijE
i
MXS … reziduální součet čtverců (charakterizuje variabilitu uvnitř jednotlivých výběrů),
počet stupňů volnosti fE = n - r.
Lze dokázat, že ST = SA + SE.
(Důkaz je proveden např. ve skriptech Budíková, Mikoláš, Osecký: Popisná statistika v poznámce 5.20.)
Testování hypotézy o shodě středních hodnot
Náhodné veličiny Xij se řídí modelem
M0: Xij = µ + αi + εij
pro i = 1, …, r, j = 1, …, ni , přičemž
εij jsou stochasticky nezávislé náhodné veličiny s rozložením N(0, σ2
),
µ je společná část střední hodnoty závisle proměnné veličiny,
αi je efekt faktoru A na úrovni i.
Parametry µ, αi neznáme.
Požadujeme, aby platila tzv. reparametrizační rovnice: 0n
r
1i
ii =α∑=
.
(Pokud je třídění vyvážené, tj. pokud mají všechny výběry stejný rozsah: n1 = n2 = … = nr, pak lze použít zjednodušenou
podmínku 0
r
1i
i =α∑=
.)
Kdyby nezáleželo na faktoru A, platila by hypotéza α1 = … = αr = 0 a dostali bychom model
M1: Xij = µ + εij.
Během analýzy rozptylu tedy zkoumáme, zda výběrové průměry M1, …, Mr se od sebe liší pouze v mezích náhodného kolísání
kolem celkového průměru M nebo zda se projevuje vliv faktoru A.
Rozdíl mezi modely M0 a M1 ověřujeme pomocí testové statistiky
EE
AA
A
f/S
f/S
F = , která se řídí rozložením F(r-1,n-r), je-li model M1 správný. Hypotézu o nevýznamnosti faktoru A tedy zamítneme
na hladině významnosti α, když platí: FA ≥ F1-α(r-1,n-r).
Výsledky výpočtů zapisujeme do tabulky analýzy rozptylu jednoduchého třídění.
Zdroj variability součet čtverců stupně volnosti podíl FA
skupiny SA fA = r - 1 SA/fA
EE
AA
fS
fS
reziduální SE fE = n - r SE/fE celkový
ST fT = n - 1 - Sílu
závislosti náhodné veličiny X na faktoru A můžeme měřit pomocí poměru determinace:
T
A2
S
S
P = . Nabývá hodnot
z intervalu 1,0 .
Testování hypotézy o shodě rozptylů
Před provedením analýzy rozptylu je zapotřebí ověřit předpoklad o shodě rozptylů v daných r výběrech.
a) Levenův test: Položme .iijij MXZ −= . Označíme
( )
( )∑
∑∑
∑∑
∑
=
= =
= =
=
−=
−=
=
=
r
1i
2
ZZiiZA
r
1i
n
1j
2
ZiijZE
r
1i
n
1j
ijZ
n
1j
ij
i
Zi
MMnS
,MZS
,Z
n
1
M
,Z
n
1
M
i
i
i
Platí-li hypotéza o shodě rozptylů, pak statistika
( )
( )rnS
1rS
F
ZE
ZA
ZA
−
−
= ≈ F(r-1, n-r).
Hypotézu o shodě rozptylů tedy zamítáme na asymptotické hladině významnosti α, když FZA ≥ F1-α(r-1, n-r).
(Levenův test je vlastně založen na analýze rozptylu absolutních hodnot centrovaných pozorování. Vzhledem k tomu, že
náhodné veličiny Xij – Mi nejsou stochasticky nezávislé a absolutní hodnoty těchto veličin nemají normální rozložení, je
Levenův test pouze aproximativní.)
b) Brownův – Forsytheův test je modifikací Levenova testu. Modifikace spočívá v tom, že místo výběrového průměru i-tého
výběru se při výpočtu veličiny ijZ používá medián i-tého výběru.
c) Bartlettův test: Platí-li hypotéza o shodě rozptylů a rozsahy všech výběrů jsou větší než 6, pak statistika
( ) ( ) 





−−−= ∑=
r
1i
2
ii
2
* Sln1nSlnrn
C
1
B se asymptoticky řídí rozložením ( )1r2
−χ . Přitom konstanta
( ) 





−
−
−−
+= ∑=
r
1i i rn
1
1n
1
1r3
1
1C a
S*
2
je vážený průměr výběrových rozptylů.
H0 zamítáme na asymptotické hladině významnosti α, když B se realizuje v kritickém oboru ( ) )∞−χ= α− ,1rW 1
2
.
Zkoumání vlastností uvedených tří testů
Pro odhad pravděpodobnosti chyby 1. druhu bylo vždy vygenerováno 100 000 náhodných výběrů, a to postupně z těchto
rozložení:
N(10; 1), t(10), LN(1; 0,4), Ex(0,85).
Všechny výběry měly stejný rozsah od 3 do 11 s krokem 2, počet výběrů byl od 2 do 10 s krokem 2.
Jako odhad pravděpodobnosti chyby 1. druhu sloužila relativní četnost těch případů, kdy se na hladině významnosti 0,05
zamítla nulová hypotéza o shodě rozptylů. Simulace byly provedeny v programu MathCad.
Grafy hustot zkoumaných rozložení
Normální rozložení N(10; 1)
7,8 8,6 9,4 10,2 11,0 11,8
0,00
0,06
0,12
0,18
0,24
0,30
0,36
0,42
Studentovo rozložení t(10)
-2,4 -1,6 -0,8 0,0 0,8 1,6 2,4
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
Log – normální rozložení LN(1; 0,4)
0 2 4 6 8 10
0,0
0,1
0,2
0,3
0,4
0,5
Exponenciální rozložení Ex(0,85)
0,8 1,6 2,4 3,2 4,0 4,8
0,0
0,2
0,4
0,6
0,8
Případ dvou nezávislých náhodných výběrů
Nejprve bylo provedeno srovnání F-testu s Bartlettovým testem a Brownovým – Forsytheovým testem pro dva nezávislé
náhodné výběry. V grafech se modrá barva vztahuje k F-testu, červená k Bartlettovu testu a zelená k Brownovu –
Forsytheovu testu.
Normální rozložení N(10; 1)
F
B
B-F
1 3 5 7 9 11 13
rozsah výběrů
0,00
0,04
0,08
0,12
0,16
0,20
0,24
0,28
odhadalfa
Studentovo rozložení t(10)
F
B
B-F
1 3 5 7 9 11 13
rozsah výběrů
0,00
0,04
0,08
0,12
0,16
0,20
0,24
0,28
odhadalfa
Log - normální rozložení LN(1; 0,4)
F
B
B-F
1 3 5 7 9 11 13
rozsah výběrů
0,00
0,04
0,08
0,12
0,16
0,20
0,24
0,28
odhadalfa
Exponenciální rozložení Ex(0,85)
F
B
B-F
1 3 5 7 9 11 13
rozsah výběrů
0,00
0,04
0,08
0,12
0,16
0,20
0,24
0,28
odhadalfa
Komentář: Podle očekávání je nejnižších odhadů pravděpodobnosti chyby 1. druhu dosahováno pro výběry z normálního
rozložení, kdy všechny testy udrží odhad pod hladinou významnosti 0,05. S postupným „vzdalováním se“ od normality
relativní četnost neoprávněného zamítnutí nulové hypotézy roste, nejvyšší je pro výběry z exponenciálního rozložení, kde se
pro F-test a Bartlettův test blíží k 0,24.
Pro všechna zkoumaná rozložení dávají F-test a Bartlettův test srovnatelné výsledky, u F-testu pozorujeme poněkud nižší
odhad. Jednoznačně nejlepší výsledky jsou dosahovány při použití B-F testu, který i pro výběry z exponenciálního rozložení
poskytuje odhad pravděpodobnosti chyby 1. druhu dostatečně hluboko pod 0,05.
Případ více než dvou nezávislých náhodných výběrů
Dále jsme se zabývali srovnáním Bartlettova testu s Brownovým – Forsytheovým testem pro 4, 6, 8 a 10 nezávislých náhodných
výběrů, jejichž rozsahy byly 3, 5, 7, 9, 11. Kvůli větší přehlednosti jsou grafy závislosti odhadu na rozsahu výběrů
uvedeny zvlášť pro 4 a 6 výběrů a poté pro 8 a 10 výběrů. V grafech se modrá a zelená barva vztahuje k Bartlettovu testu,
červená a hnědá pak k Brownovu – Forsytheovu testu.
a) Normální rozložení N(10; 1)
Počet výběrů 4 a 6 Počet výběrů 8 a 10
4 B
4 B-F
6 B
6 B-F
1 3 5 7 9 11 13
rozsah výběrů
-0,01
0,00
0,01
0,02
0,03
0,04
0,05
0,06
odhadalfa
8 B
8 B-F
10 B
10 B-F
1 3 5 7 9 11 13
rozsah výběrů
-0,01
0,00
0,01
0,02
0,03
0,04
0,05
0,06
odhadalfa
Pro výběry z normálního rozložení dává Bartlettův test odhady velmi blízké hladině významnosti 0,05. Není zde pozorovatelná
závislost na rozsahu výběrů. Brownův – Forsytheův test neoprávněně zamítá nulovou hypotézu s podstatně menší relativní
četností, která nepřesáhne 0,021.
b) Studentovo rozložení t(10)
Počet výběrů 4 a 6 Počet výběrů 8 a 10
4 B
4 B-F
6 B
6 B-F
1 3 5 7 9 11 13
rozsah výběrů
-0,02
0,00
0,02
0,04
0,06
0,08
0,10
0,12
0,14
0,16
0,18
odhadalfa
8 B
8 B-F
10 B
10 B-F
1 3 5 7 9 11 13
rozsah výběrů
-0,02
0,00
0,02
0,04
0,06
0,08
0,10
0,12
0,14
0,16
0,18
odhadalfa
Pro výběry ze Studentova rozložení jsou výsledky Bartlettova testu již ovlivněny porušením předpokladu normality. Získané
odhady narůstají se zvětšujícím se rozsahem výběrů a v nejméně příznivém případě, tj. pro 10 nezávislých náhodný výběrů o
rozsahu 11, odhad pravděpodobnosti chyby 1. druhu převyšuje 0,16. Brownův – Forsytheův test neoprávněně zamítá
nulovou hypotézu s relativní četností, která nepřesáhne 0,023. Rozdíly mezi odhady pro různé počty výběrů jsou u B-F testu
zanedbatelně malé.
c) Logaritmicko – normální rozložení LN(1; 0,4)
Počet výběrů 4 a 6 Počet výběrů 8 a 10
4 B
4 B-F
6 B
6 B-F
1 3 5 7 9 11 13
rozsah výběrů
-0,05
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
odhadalfa
8 B
8 B-F
10 B
10 B-F
1 3 5 7 9 11 13
rozsah výběrů
-0,05
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
odhadalfa
Pro výběry z logaritmicko - normálního rozložení odhad pravděpodobnosti chyby 1. druhu získaný Bartlettovým testem
velmi výrazně narůstá, zvláště pro větší počet rozsáhlejších výběrů. Zde je dokonce o něco vyšší než 0,42, tudíž použití
Bartlettova testu skutečně nelze doporučit. Daleko lepší výsledky poskytuje Brownův – Forsytheův test, kde odhady
zůstávají pod 0,03.
d) Exponenciální rozložení Ex(0,85)
Počet výběrů 4 a 6 Počet výběrů 8 a 10
4 B
4 B-F
6 B
6 B-F
1 3 5 7 9 11 13
rozsah výběrů
-0,1
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
odhadalfa
8 B
8 B-F
10 B
10 B-F
1 3 5 7 9 11 13
rozsah výběrů
-0,1
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
odhadalfa
Vidíme, že použití Bartlettova testu pro výběry z exponenciálního rozložení nelze vůbec doporučit. Odhad
pravděpodobnosti chyby 1. druhu je neúnosně velký, v nejméně příznivém případě – pro 10 nezávislých náhodných výběrů
o rozsahu 11 - se tento odhad blíží 0,75. Naproti tomu odhady získané Brownovým – Forsytheovým testem jsou nanejvýš
0,035, což ještě zdaleka nedosahuje hladiny významnosti 0,05.
Komentář
Výsledky našich simulačních studií vedou k závěru, že pro testy homogenity rozptylů je vhodné používat Brownův – Forsytheův
test, a to jak pro dva, tak pro více nezávislých náhodných výběrů. Ukazuje se, že tento test lze aplikovat i na výběry,
které pocházejí z výrazně nenormálních rozložení. To lze vysvětlit tím, že při jeho konstrukci jsou použity výběrové mediány
jednotlivých výběrů, přičemž medián – na rozdíl od průměru – je robustní vůči odlehlým či extrémním hodnotám.
U Brownova – Forsytheova testu odhad pravděpodobnosti chyby 1. druhu ve všech případech zůstal pod hladinou významnosti
0,05, nejhorší výsledek byl 0,036 pro 4 nezávislé výběry z exponenciálního rozložení. Bartlettův test zcela selhává pro
výběry z nesymetrických rozložení. Např. pro 10 nezávislých výběrů z exponenciálního rozložení, jejichž rozsah byl 11, se
odhad pravděpodobnosti chyby 1. druhu blížil číslu 0,8.
Výhodou Brownova – Forsytheova testu je rovněž skutečnost, že velikosti odhadů vykazují jen velmi nepatrnou závislost
na počtu výběrů.
Brownův – Forsytheův test je implemenován např. v systémech STATISTICA či MINITAB, Bartlettův test najdeme v systému
MINITAB, F-test pak v obou zmíněných systémech.
Post – hoc metody mnohonásobného porovnávání
Zamítneme-li na hladině významnosti α hypotézu o shodě středních hodnot, chceme zjistit, které dvojice středních hodnot se
liší na dané hladině významnosti α, tj. na hladině významnosti α testujeme H0: µl = µk proti H1: µl ≠ µk pro všechna l, k = 1,
.., r, l ≠ k.
a) Mají-li všechny výběry týž rozsah p (říkáme, že třídění je vyvážené), použijeme Tukeyovu metodu.
Testová statistika má tvar
p
S
MM
*
.l.k −
. Rovnost středních hodnot µk a µl zamítneme na hladině významnosti α, když
( )rn,rq
p
S
MM
1
*
.l.k
−≥
−
α− , kde hodnoty q1-α(r, n-r) jsou kvantily studentizovaného rozpětí a najdeme je ve statistických tabulkách.
(Studentizované rozpětí je náhodná veličina
( ) ( )
s
XX
Q
1n −
= .)
Existuje modifikace Tukeyovy metody pro nestejné rozsahy výběrů, nazývá se Tukeyova HSD metoda. V tomto případě má
testová statistika tvar






+
−
lk
*
.l.k
n
1
n
1
2
1
S
MM
. Rovnost středních hodnot µk a µl zamítneme na hladině významnosti α, když
( )rn,rq
n
1
n
1
2
1
S
MM
1
lk
*
.l.k
−≥






+
−
α− .
b) Nemají-li všechny výběry stejný rozsah, použijeme Scheffého metodu: rovnost středních hodnot µk a µl zamítneme na
hladině významnosti α, když
( ) ( )rn,1rF
n
1
n
1
1rSMM 1
lk
*.l.k −−





+−≥− α− .
Výhodou Scheffého testu je, že k jeho provedení nepotřebujeme speciální statistické tabulky s hodnotami kvantilů studentizovaného
rozpětí, ale stačí běžné statistické tabulky s kvantily Fisherova – Snedecorova rozložení.
V případě vyváženého třídění, kdy lze aplikovat Tukeyovu i Scheffého metodu, použijeme tu, která je citlivější. Tukeyova
metoda tedy bude výhodnější, když
q1-α
2
(r, n-r) < 2(r-1)F1-α(r-1, n-r).
Metody mnohonásobného porovnávání mají obecně menší sílu než ANOVA.
Může nastat situace, kdy při zamítnutí H0 nenajdeme metodami mnohonásobného porovnávání významný rozdíl u žádné
dvojice středních hodnot. K tomu dochází zvláště tehdy, když p-hodnota pro ANOVU je jen o málo nižší než zvolená hladina
významnosti. Pak slabší test patřící do skupiny metod mnohonásobného porovnávání nemusí odhalit žádný rozdíl.
Doporučený postup při provádění analýzy rozptylu:
a) Ověření normality daných r náhodných výběrů (grafické metody - NP plot, Q-Q plot, histogram, testy hypotéz o normálním
rozložení - Lilieforsova varianta Kolmogorovova – Smirnovova testu nebo Shapirův – Wilkův test).
Doporučuje se kombinace obou způsobů. Závěry učiníme až na základě posouzení obou výsledků.
Obecně lze říci, že analýza rozptylu není příliš citlivá na porušení předpokladu normality, zvláště při větších rozsazích výběrů
(nad 20), což je důsledek působení centrální limitní věty. Mírné porušení normality tedy není na závadu, při větším porušení
použijeme např. Kruskalův – Wallisův test jako neparametrickou obdobu analýzy rozptylu jednoduchého třídění.
b) Po ověření normality se testuje homogenitu rozptylů, tj. předpoklad, že všechny náhodné výběry pocházejí z normálních
rozložení s týmž rozpylem. Graficky ověřujeme shodu rozptylů pomocí krabicových diagramů, kdy sledujeme, zda je šířka
krabic stejná. Numericky testujeme homogenitu rozptylů pomocí Levenova testu, Brownova – Forsytheova testu (oba jsou
implementovány ve STATISTICE, Brownův – Forsytheův test v MINITABu) či Bartlettova testu (je k dispozici
v MINITABu).
Slabé porušení homogenity rozptylů nevadí, při větším se doporučuje mediánový test.
c) Pokud jsou splněny předpoklady normality a homogenity rozptylů, můžeme přistoupit k testování shody středních hodnot.
Předtím je samozřejmě vhodné vypočítat průměry a směrodatné odchylky či rozptyly v jednotlivých skupinách.
d) Dojde-li na zvolené hladině významnosti k zamítnutí hypotézy o shodě středních hodnot, zajímá nás, které dvojice středních
hodnot se od sebe liší. K řešení tohoto problému slouží post-hoc metody mnohonásobného porovnávání, např. Scheffého
nebo Tukeyova metoda.
Příklad: U čtyř odrůd brambor (označených symboly A, B, C, D) se zjišťovala celková hmotnost brambor vyrostlých vždy
z jednoho trsu. Výsledky (v kg):
odrůda hmotnost
A 0,9 0,8 0,6 0,9
B 1,3 1,0 1,3
C 1,3 1,5 1,6 1,1 1,5
D 1,1 1,2 1,0
Na hladině významnosti 0,05 testujte hypotézu, že střední hodnota hmotnosti trsu brambor nezávisí na odrůdě. Zamítnete-li
nulovou hypotézu, zjistěte, které dvojice odrůd se liší na hladině významnosti 0,05.
Řešení:
Data považujeme za realizace čtyř nezávislých náhodných výběrů ze čtyř normálních rozložení se stejným rozptylem.
Testujeme hypotézu, že všechny čtyři střední hodnoty jsou stejné.
Vypočítáme výběrové průměry v jednotlivých výběrech: M1. = 0,8, M2. = 1,2, M3. = 1,4, M4. = 1,1,
celkový průměr: M.. = 1,14,
výběrové rozptyly: S1
2
= 0,02, S2
2
= 0,03, S3
2
= 0,04, S4
2
= 0,01,
vážený průměr výběrových rozptylů:
( )
720,0
110
3
11
01,0204,0403,0202,03
rn
S1n
S
r
1i
2
ii
2
* ==
⋅+⋅+⋅+⋅
=
−
−
=
∑=
,
reziduální součet čtverců: ( ) 3,0
110
3
11SrnS
2
*E =⋅=−= ,
skupinový součet čtverců: ( ) ( ) ( ) ( ) ( ) 816,014,11,1314,14,1514,12.1314,18,04MMnS
2222
r
1i
2
...iiA =−⋅+−⋅+−⋅+−⋅=−= ∑=
celkový součet čtverců: ST = SA + SE = 0,816 + 0,3 = 1,116,
testová statistika
11/3,0
3/816,0
f/S
f/S
F
EE
AA
A == = 9,97,
Kritický obor W = ( ) ) )∞=∞ ,59,3,11,3F 95,0 . Protože testová statistika se realizuje v kritickém oboru, H0 zamítáme na
hladině významnosti 0,05.
Vypočteme poměr determinace: 7312,0
116,1
816,0
S
S
P
T
A2
===
Výsledky zapíšeme do tabulky ANOVA:
Zdroj variability Součet čtverců Stupně volnosti podíl FA
skupiny SA = 0,816 3 SA/3 = 0,272 ( )
( )rnS
1rS
E
A
−
−
= 9,97
reziduální SE = 0,3 11 SE/11 = 0,02727 celkový
ST = 1,116 14 - Nyní
pomocí Scheffého metody zjistíme, které dvojice odrůd se liší na hladině významnosti 0,05.
Srovnávané odrůdy Rozdíly .l.k MM − Pravá strana vzorce
A, B 0,4 0,41
A, C 0,67 0,36
A, D 0,3 0,41
B, C 0,2 0,40
B, D 0,1 0,44
C, D 0,3 0,40
Na hladině významnosti 0,05 se liší odrůdy A a C.
Řešení pomocí systému STATISTICA
Otevřeme nový datový soubor o dvou proměnných X a odrůda a 15 případech. Do proměnné X zapíšeme zjištěné hmotnosti,
do proměnné odrůda kódy pro dané odrůdy (1 pro A, 2 pro B, 3 pro C a 4 pro D).
1
X
2
odruda
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
0,9 A
0,8 A
0,6 A
0,9 A
1,3 B
1 B
1,3 B
1,3 C
1,5 C
1,6 C
1,1 C
1,5 C
1,1 D
1,2 D
1 D
Ověříme normalitu daných čtyř náhodných výběrů pomocí N-P plotu:
odruda: A
0,4 0,6 0,8 1,0 1,2 1,4 1,6 1,8
-1,4
-1,2
-1,0
-0,8
-0,6
-0,4
-0,2
0,0
0,2
0,4
0,6
0,8
1,0
1,2
1,4
Očekávanánormálníhodnota
odruda: B
0,4 0,6 0,8 1,0 1,2 1,4 1,6 1,8
odruda: C
0,4 0,6 0,8 1,0 1,2 1,4 1,6 1,8
-1,4
-1,2
-1,0
-0,8
-0,6
-0,4
-0,2
0,0
0,2
0,4
0,6
0,8
1,0
1,2
1,4
Očekávanánormálníhodnota
odruda: D
0,4 0,6 0,8 1,0 1,2 1,4 1,6 1,8
Odchylky od normality jsou jen nepatrné.
Vypočteme výběrové průměry a výběrové rozptyly:
Statistiky – Základní statistiky a tabulky – Rozklad & jednofakt. ANOVA – OK – Proměnné – Závislé – X, Grupovací odrůda
– OK – Skupiny tabulek - zaškrtneme Rozptyly - Výpočet.
Rozkladová tabulka popisných statistik (priklad8301)
N=15 (V seznamu záv. prom. nejsou ChD)
odruda X
průměr
X
N
X
Sm.odch.
X
Rozptyl
A 0,800000 4 0,141421 0,020000
B 1,200000 3 0,173205 0,030000
C 1,400000 5 0,200000 0,040000
D 1,100000 3 0,100000 0,010000
Vš.skup. 1,140000 15 0,282337 0,079714
Nyní ověříme předpoklad shody rozptylů.
Na záložce Skupiny tabulek zaškrtneme Levenův test – Výpočet.
Leveneův test homogenity rozpylů (priklad8301)
Označ. efekty jsou význ. na hlad. p < ,05000
Proměnná
SČ
efekt
SV
efekt
PČ
efekt
SČ
chyba
SV
chyba
PČ
chyba
F p
X 0,018667 3 0,006222 0,065333 11 0,005939 1,047619 0,410027
Vidíme, že p-hodnota Levenova testu je 0,41, tedy větší než hladina významnosti 0,05. Hypotézu o shodě rozptylů
nezamítáme na hladině významnosti 0,05.
Přistoupíme k testu hypotézy o shodě středních hodnot.
Na záložce Skupiny tabulek zaškrtneme Analýza rozptylu – Výpočet.
Analýza rozptylu (priklad8301)
Označ. efekty jsou význ. na hlad. p < ,05000
Proměnná
SČ
efekt
SV
efekt
PČ
efekt
SČ
chyba
SV
chyba
PČ
chyba
F p
X 0,816000 3 0,272000 0,300000 11 0,027273 9,973333 0,001805
Jelikož p-hodnota = 0,001805 je menší než hladina významnosti 0,05, hypotézu o shodě středních hodnot zamítáme na
hladině významnosti 0,05.
Výpočet doplníme krabicovými diagramy:
Průměr
Průměr±SmCh
Průměr±1,96*SmCh
A B C D
odruda
0,4
0,6
0,8
1,0
1,2
1,4
1,6
1,8
X
Nyní aplikujeme Scheffého metodu mnohonásobného porovnávání, abychom zjistili, které dvojice odrůd se liší na hladině
významnosti 0,05. Na záložce Post – hoc zvolíme Schefféův test.
Scheffeho test; proměn.:X (priklad8301)
Označ. rozdíly jsou významné na hlad. p < ,05000
odruda
{1}
M=,80000
{2}
M=1,2000
{3}
M=1,4000
{4}
M=1,1000
A {1}
B {2}
C {3}
D {4}
0,059165 0,001950 0,190463
0,059165 0,464537 0,905502
0,001950 0,464537 0,163499
0,190463 0,905502 0,163499
Tabulka obsahuje p-hodnoty pro vzájemné porovnání středních hodnot hmotnosti všech čtyř odrůd. Vidíme, že na hladině
významnosti 0,05 se liší odrůdy A, C.
Význam předpokladů v analýze rozptylu
a) Nezávislost jednotlivých náhodných výběrů – velmi důležitý předpoklad, musí být splněn, jinak dostaneme nesmyslné
výsledky.
b) Normalita – ANOVA není příliš citlivá na porušení normality, zvlášť pokud mají všechny výběry rozsah nad 20
(důsledek centrální limitní věty). Při výraznějším porušení normality se doporučuje Kruskalův – Wallisův test.
c) Shoda rozptylů – mírné porušení nevadí, při větším se doporučuje Kruskalův – Wallisův test. Test shody rozptylů má
smysl provádět až po ověření předpokladu normality.
II. Případ r ≥ 3 nezávislých náhodných výběrů z alternativních rozložení
Test homogenity binomických rozložení
Nechť máme r ≥ 3 nezávislých náhodných výběrů o rozsazích n1, …, nr, přičemž j-tý náhodný výběr pochází z alternativního
rozložení A( jϑ ), j = 1, 2, ..., r.
Testujeme hypotézu H0: r1 ϑ==ϑ K proti alternativní hypotéze H1: aspoň jedna dvojice parametrů je různá.
Označme
∑
=
=
r
1j
jnn celkový rozsah všech r výběrů,
n
Mn
M
r
1j
jj
*
∑=
= vážený průměr výběrových průměrů.
Testové kritérium:
( )
( ) ( )1rMMn
M1M
1
Q 2
r
1j
2
*jj
**
−χ≈−
−
= ∑=
, když H0 platí.
Kritický obor: ( ) )∞−χ= α− ,1rW 1
2
H0 tedy zamítáme na asymptotické hladině významnosti α, když WQ∈ .
Podmínka dobré aproximace: njM* > 5 pro všechna j = 1, ..., r.
Brandtův – Snedecorův výpočetní tvar:
( )∑
= −
−
−
=
r
1j *
*2
jj
** M1
M
nMn
M1M
1
Q .
Test homogenity založený na arkussinusové transformaci
Není-li splněna podmínka njM* > 5 pro všechna j = 1, ..., r, doporučuje se následující postup: označme
jj MarcsinA = , j = 1, ..., r,
∑
=
=
r
1j
jjAn
n
1
B .
Pak statistika ( )∑=
−=
r
1j
2
jj BAn4Q ≈ χ2
(r-1).
H0 tedy zamítáme na asymptotické hladině významnosti α, když Q ≥ χ2
1-α(r-1).
Mnohonásobné porovnávání
Zamítneme-li nulovou hypotézu na asymptotické hladině významnosti α, chceme zjistit, které dvojice parametrů lk , ϑϑ se
liší. Platí-li nerovnost ( )∞⋅





+≥− α− ,rq
n
1
n
1
8
1
AA 1
lk
lk , pak na hladině významnosti α zamítáme hypotézu o shodě parametrů
lk , ϑϑ . (Hodnoty q1-α(r, ∞) najdeme v tabulkách.)
Příklad: Na gymnázium bylo přijato 142 studentů. Ti byli náhodně rozděleni do čtyř tříd A, B, C, D. V každé třídě byla
matematika vyučována jinou metodou. Na konci školního roku psali všichni studenti stejnou písemnou práci a byl
zaznamenán počet těch studentů, kteří vyřešili všechny zadané úkoly.
Třída A B C D
Počet studentů 35 36 37 34
Počet úspěšných studentů 5 8 17 15
Na asymptotické hladině významnosti 0,05 testujte hypotézu, že rozdíly mezi třídami jsou způsobeny pouze náhodnými
vlivy.
Řešení:
Máme čtyři nezávislé náhodné výběry, j-tý pochází z rozložení A( jϑ ), j = 1, 2, 3, 4.
Testujeme hypotézu H0: 4321 ϑ=ϑ=ϑ=ϑ .
n1 = 35, n2 = 36, n3 = 37, n4 = 34, n = 142
m1 = 5/35, m2 = 8/36, m3 = 17/37, m4 = 15/34, m* = (5+8+17+15)/142 = 45/142.
Podmínky dobré aproximace:
09,11
142
45
35 =⋅ , 41,11
142
45
36 =⋅ , 73,11
142
45
37 =⋅ , 77,10
142
45
34 =⋅
Testová statistika
( )
288,12
142
45
1
142
45
142
34
15
34
37
17
37
36
8
36
35
5
35
142
45
1
142
45
1
M1
M
nMn
M1M
1
Q
2222r
1j *
*2
jj
**
=
−
−














⋅+





⋅+





⋅+





⋅






−
=
−
−
−
= ∑=
Kritický obor: ( ) ) )∞=∞χ= ,81,7,3W 95,0
2
.
Protože testové kritérium se realizuje v kritickém oboru, H0 zamítáme na asymptotické hladině významnosti 0,05.
Nyní metodou mnohonásobného porovnávání zjistíme, které dvojice parametrů se od sebe liší na hladině významnosti 0,05.
Pomocí arkussinusové transformace vypočteme hodnoty jj MarcsinA = :
A1 = 0,3876, A2 = 0,4909, A3 = 0,7448, A4 = 0,7264
Platí-li nerovnost ( )∞⋅





+≥− α− ,rq
n
1
n
1
8
1
AA 1
lk
lk , pak na hladině významnosti α zamítáme hypotézu o shodě parametrů
lk , ϑϑ .
Kvantil studentizovaného rozpětí najdeme v tabulkách: q0,95(4,∞) = 3,63
Srovnávané třídy Rozdíly lk AA − Pravá strana vzorce
A, B 0,1033 0,30
A, C 0,3572 0,30
A, D 0,3388 0,31
B, C 0,2539 0,30
B, D 0,2356 0,31
C, D 0,0184 0,30
Na hladině významnosti 0,05 se liší třídy A, C a A, D.
Řešení pomocí systému STATISTICA
Vytvoříme nový datový soubor se dvěma proměnnými a 142 případy.
Proměnná USPECH obsahuje hodnotu 1, pokud student vyřešil všechny zadané úkoly, jinak obsahuje hodnotu 0.
Proměnná TRIDA má hodnotu 1, pokud student pochází z třídy A, hodnotu 2 pro třídu B, hodnotu 3 pro třídu C a hodnotu 4
pro třídu D.
Nejprve zjistíme podíly úspěšných studentů v jednotlivých třídách.
Statistiky – Základní statistiky a tabulky – Rozklad – OK – Proměnné – Závislé – USPECH, Grupovací - TRIDA – OK –
Skupiny tabulek - odškrtneme Směrovat. odchylka - Výpočet.
TRIDA USPECH
Průměry
USPECH
N
A 0,142857 35
B 0,222222 36
C 0,459459 37
D 0,441176 34
Vš.skup. 0,316901 142
Vidíme, že nejslabší výkony podávali studenti ze třídy A, úspěšných bylo pouze 14,3% studentů, ve třídě B 22,2%, ve třídě
C 45,9% a ve třídě D 44,1%. Třídy C a D se z hlediska úspěchu v písemce z matematiky liší jen nepatrně
Dále provedeme testování hypotézy o shodě parametrů čtyř alternativních rozložení. Nejprve ověříme splnění podmínek
dobré aproximace: njm* > 5 pro všechna j = 1, ..., r. Vážený průměr m* se nachází v posledním řádku výstupní tabulky
procedury Rozklad. Jeho hodnotu okopírujeme do políček pro průměry tříd A, B, C, D, poslední řádek odstraníme a
k tabulce přidáme jednu novou proměnnou, do jejíhož Dlouhého jména napíšeme =v2*v3.
TRIDA USPECH
Průměry
USPECH
N
NProm
=v2*v3
A 0,316901 35 11,09155
B 0,316901 36 11,40845
C 0,316901 37 11,72535
D 0,316901 34 10,77465
Vidíme, že podmínky dobré aproximace jsou splněny.
Statistiky – Základní statistiky/tabulky – Kontingenční tabulky - OK - Specif. tabulky – List 1 USPECH, List 2 TRIDA,
OK– Možnosti – Statistiky dvourozměrných tabulek - zaškrtněte Pearson & M-L Chi –square – Detailní výsledky - Detailní
2-rozm. tabulky.
Statist. Chí-kvadr. sv p
Pearsonův chí-kv.
M-V chí-kvadr.
12,28760 df=3 p=,00646
12,80263 df=3 p=,00509
Testová statistika Q se realizuje hodnotou 12,2876, počet stupňů volnosti je 3, odpovídající p-hodnota = 0,00646, tedy na
asymptotické hladině významnosti 0,05 hypotézu H0 zamítáme. S rizikem omylu nejvýše 0,05 jsme tedy prokázali, že
rozdíly v podílech úspěšných studentů v jednotlivých třídách nelze vysvětlit náhodnými vlivy.
Upozornění: Systém STATISTICA neumožňuje provedení metody mnohonásobného porovnávání pro náhodné výběry
z alternativního rozložení. Pro orientaci lze použít Scheffého metodu. V našem případě:
TRIDA
{1}
M=,14286
{2}
M=,22222
{3}
M=,45946
{4}
M=,44118
A {1}
B {2}
C {3}
D {4}
0,907720 0,034818 0,060978
0,907720 0,173652 0,253566
0,034818 0,173652 0,998684
0,060978 0,253566 0,998684
Na asymptotické hladině významnosti 0,05 se liší třídy A a C.