Kapitola 6.: Analýza rozptylu jednoduchého třídění 6.1. Motivace Zajímáme se o problém, zda lze určitým faktorem (tj. nominální náhodnou veličinou A) vysvětlit variabilitu pozorovaných hodnot náhodné veličiny X, která je intervalového či po- měrového typu. Např. zkoumáme, zda metoda výuky určitého předmětu (faktor A) ovlivňuje počet bodů dosažených studenty v závěrečném testu (náhodná veličina X). Předpokládáme, že faktor A má r 3 úrovní a i-té úrovni odpovídá ni výsledků iin1i X,,X K , které tvoří náhodný výběr z rozložení N(i, 2 ), i = 1, ..., r a jednotlivé náhodné výběry jsou stochasticky nezávislé, tedy Xij = i + ij, kde ij jsou stochasticky nezávislé ná- hodné veličiny s rozložením N(0, 2 ), i = 1, ..., r, j = 1, ..., ni. Výsledky lze zapsat do tabulky faktor A výsledky úroveň 1 1n111 X,,X K úroveň 2 2n221 X,,X K ... ... úroveň r rrn1r X,,X K Na hladině významnosti testujeme nulovou hypotézu, která tvrdí, že všechny střední hodnoty jsou stejné proti alternativní hypotéze, která tvrdí, že aspoň jedna dvojice středních hodnot se liší. Jedná se tedy o zobecnění dvouvýběrového t-testu a na první pohled se zdá, že stačí utvořit 2 r dvojic náhodných výběrů a na každou dvojici aplikovat dvouvýběrový t-test. Tento postup však nelze použít, neboť nezaručuje splnění podmínky, že pravděpodobnost chyby 1. druhu je . Proto ve 30. letech 20. století vytvořil R. A. Fisher metodu ANOVA (analýza rozptylu, v popsané situaci konkrétně analýza rozptylu jednoduchého třídění), která uvedenou podmínku splňuje. Pokud na hladině významnosti zamítneme nulovou hypotézu, zajímá nás, které dvoji- ce středních hodnot se od sebe liší. K řešení tohoto problému slouží metody mnohonásobného porovnávání, např. Scheffého nebo Tukeyova metoda. 6.2. Označení V analýze rozptylu jednoduchého třídění se používá následující označení. = = r 1i inn ... celkový rozsah všech r výběrů = = in 1j ij.i XX ... součet hodnot v i-tém výběru .i i .i X n 1 M = ... výběrový průměr v i-tém výběru = = = r 1i n 1j ij.. i XX ... součet hodnot všech výběrů .... X n 1 M = ... celkový průměr všech r výběrů 6.3. Testování hypotézy o shodě středních hodnot Náhodné veličiny Xij se řídí modelem M0: Xijk = + i + ij pro i = 1, ..., r, j = 1, ..., ni , přičemž ij jsou stochasticky nezávislé náhodné veličiny s rozložením N(0, 2 ), je společná část střední hodnoty závisle proměnné veličiny, i je efekt faktoru A na úrovni i. Parametry , i neznáme. Požadujeme, aby platila tzv. reparametrizační rovnice: 0 r 1i i == . Zavedeme součty čtverců ( )= = -= r 1i n 1j 2 ..ijT i MXS ... celkový součet čtverců (charakterizuje variabilitu jednotlivých po- zorování kolem celkového průměru), má počet stupňů volnosti fT = n ­ 1, ( )= -= r 1i 2 ....iiA MMnS ... skupinový součet čtverců (charakterizuje variabilitu mezi jednotli- vými náhodnými výběry), má počet stupňů volnosti fA = r ­ 1, ( )= = -= r 1i n 1j 2 .iijE i MXS ... reziduální součet čtverců (charakterizuje variabilitu uvnitř jednotli- vých výběrů), má počet stupňů volnosti fE = n - r. Lze dokázat, že ST = SA + SE. Sčítanec ( )...i MM - představuje bodový odhad efektu i. Kdyby nezáleželo na faktoru A, platila by hypotéza 1 = ... = r = 0 a dostali bychom model M1: Xij = + ij. Rozdíl mezi modely M0 a M1 ověřujeme pomocí testové statistiky EE AA A f/S f/S F = , která se řídí rozložením F(r-1,n-r), je-li model M1 správný. Hypotézu o nevý- znamnosti faktoru A tedy zamítneme na hladině významnosti , když platí: FA F1-(r-1,n-r). Výsledky výpočtů zapisujeme do tabulky analýzy rozptylu jednoduchého třídění. Zdroj variability součet čtverců stupně volnosti podíl F skupiny SA fA = r-1 SA/fA EE AA fS fS reziduální SE fE = n-r SE/fE - celkový ST fT = n-1 - - 6.4.Testy shody rozptylů Před provedením analýzy rozptylu je zapotřebí ověřit předpoklad o shodě rozptylů v daných r výběrech. 6.4.1. Levenův test Položme .iijij MXZ -= . Označíme ( ) ( ) = = == == -=-=== r 1i n 1j r 1i 2 ZZiiZA 2 ZiijZE r 1i n 1j ijZ n 1j ij i Zi iii MMnS,MZS,Z n 1 M,Z n 1 M . Platí-li hypotéza o shodě rozptylů, pak statistika ( ) ( )rnS 1rS F ZE ZA Z - - = ~ F(r-1, n-r). H0 tedy zamí- táme na hladině významnosti , když FZ F1-(r-1, n-r). 6.4.2. Bartlettův test Platí-li hypotéza o shodě rozptylů, pak statistika ( ) ( ) ---= = r 1i 2 ii 2 * Sln1nSlnrn C 1 B má přibližně rozložení 2 (r-1), kde ( ) - - -- += = r 1i i rn 1 1n 1 1r3 1 1C , ( )= - - = in 1j 2 .iij i 2 i MX 1n 1 S je výběrový rozptyl i-tého vý- běru, ( ) rn S rn S1n S E r 1i 2 ii 2 * - = - - = = je vážený průměr výběrových rozptylů. H0 zamítáme na přibližné hladině významnosti , když B 2 1-(r-1, n-r). Bartlettův test lze použít, pokud rozsahy všech výběrů jsou aspoň 7. 6.5. Metody mnohonásobného porovnávání Zamítneme-li na hladině významnosti hypotézu o shodě středních hodnot, chceme zjistit, které dvojice středních hodnot se liší na dané hladině významnosti . 6.5.1. Tukeyova metoda Mají-li všechny výběry týž rozsah p (říkáme, že třídění je vyvážené), použijeme Tukeyovu metodu: rovnost středních hodnot k a l zamítneme na hladině významnosti , když ( ) p S rn,rqMM * 1.l.k -- - , kde hodnoty q1-(r, n-r) jsou kvantily studentizovaného rozpětí a najdeme je ve statistických tabulkách. 6.5.2. Scheffého metoda Nemají-li všechny výběry stejný rozsah, použijeme Scheffého metodu: rovnost středních hod- not k a l zamítneme na hladině významnosti , když ( ) ( )rn,1rF n 1 n 1 1rSMM 1 lk *.l.k -- +-- - . Pozor, může nastat situace, kdy při zamítnutí H0 nenajdeme významný rozdíl u žádné dvojice středních hodnot. Pak je významně rozdílná některá složitější kombinace středních hodnot, tzv. kontrast. 6.6. Příklad U čtyř odrůd brambor (označených symboly A, B, C, D) se zjišťovala celková hmotnost brambor vyrostlých vždy z jednoho trsu. Výsledky (v kg): odrůda hmotnost A 0,9 0,8 0,6 0,9 B 1,3 1,0 1,3 C 1,3 1,5 1,6 1,1 1,5 D 1,1 1,2 1,0 Na hladině významnosti 0,05 testujte hypotézu, že střední hodnota hmotnosti trsu brambor nezávisí na odrůdě. Zamítnete-li nulovou hypotézu, zjistěte, které dvojice odrůd se liší na hla- dině významnosti 0,05. Řešení Data považujeme za realizace čtyř nezávislých náhodných výběrů ze čtyř normálních rozložení se stejným rozptylem. Testujeme hypotézu, že všechny čtyři střední hodnoty jsou stejné. M1. = 0,8, M2. = 1,2, M3. = 1,4, M4. = 1,1, M.. = 1,14, SE = 0,3, SA = 0,816, ST = 1,116, F = 9,97, F0,95(3,11) = 3,59. Protože testová statistika se realizuje v kritickém oboru, H0 zamítáme na hladině významnosti 0,05. Výsledky zapíšeme do tabulky ANOVA Zdroj variability Součet čtverců Stupně volnosti podíl F skupiny SA = 0,816 fA = 3 SA/3 = 0,272 EE AA fS fS = 9,97 reziduální SE = 0,3 fE = 11 SE/11 = 0,02727 - celkový ST = 1,116 fT = 14 - - Nyní pomocí Scheffého metody zjistíme, které dvojice odrůd se liší na hladině význam- nosti 0,05. Srovnávané odrůdy Rozdíly .l.k MM - Pravá strana vzorce A, B 0,4 0,41 A, C 0,67 0,36 A, D 0,3 0,41 B, C 0,2 0,40 B, D 0,1 0,44 C, D 0,3 0,40 Na hladině významnosti 0,05 se liší odrůdy A a C. 6.7. Význam předpokladů v analýze rozptylu a) Nezávislost jednotlivých náhodných výběrů ­ velmi důležitý předpoklad, musí být splněn, jinak dostaneme nesmyslné výsledky. b) Normalita ­ ANOVA není příliš citlivá na porušení normality, zvlášť pokud mají všechny výběry rozsah nad 20 (důsledek centrální limitní věty). Při výraznějším porušení normality se doporučuje Kruskalův ­ Wallisův test. c) Shoda rozptylů ­ mírné porušení nevadí, při větším se doporučuje Kruskalův ­ Wallisův test. Test shody rozptylů má smysl provádět až po ověření předpokladu normality. Kontrolní otázky 1. Jaký problém řeší analýza rozptylu jednoduchého třídění? 2. Jak je definován celkový, skupinový a reziduální součet čtverců a co tyto součty čtverců charakterizují? 3. Popište způsob testování hypotézy o shodě středních hodnot. 4. Jak se testuje hypotéza o shodě rozptylů? 5. Které metody mnohonásobného porovnání se používají v analýze rozptylu jednoduchého třídění? 6. Pojednejte o významu předpokladů v analýze rozptylu jednoduchého třídění. Příklady 1. Jsou známy měsíční tržby (v tisících Kč) tří prodavačů za dobu půl roku. 1. prodavač: 12 10 9 10 11 9 2. prodavač: 10 12 11 12 14 13 3. prodavač: 19 18 16 16 17 15 Na hladině významnosti 0,05 testujte hypotézu, že střední hodnoty tržeb všech tří prodavačů jsou stejné. Pokud zamítneme nulovou hypotézu, zjistěte, tržby kterých dvou prodavačů se liší na hladině významnosti 0,05. Výsledek: M1. = 10,17, M2. = 12, M3. = 16,83, M.. = 13, SE = 27,7, SA = 142,3, ST = 170, F = 38,58, F0,975(2,015) = 3,6823, H0 tedy zamítáme na hladině významnosti 0,05. Výsledky zapíšeme do tabulky ANOVA Zdroj variability Součet čtverců Stupně volnosti podíl F skupiny SA = 142,3 fA = 2 SA/fA = 71,17 EE AA fS fS = 38,58 reziduální SE = 27,7 fE = 15 SE/fE = 1,84 - celkový ST = 170 fT = 17 - - Nyní pomocí Tukeyovy metody zjistíme, které dvojice prodavačů se liší na hladině význam- nosti 0,05. Srovnávaní prodavači Rozdíly .l.k MM - Pravá strana vzorce 1, 2 1,83 2,03 1, 3 6,67* 2,03 2, 3 4,83* 2,03 Pravá strana: 03,2 6 84,1 83,4 6 84,1 )15,3(q p S )rn,r(q 95,0 * 1 ===-- , kde 84,1 rn S S E2 * = - = Na hladině významnosti 0,05 se liší tržby prodavačů 1, 3 a 2, 3. 2. Je dáno pět nezávislých náhodných výběrů o rozsazích 5, 7, 6, 8, 5, přičemž i-tý výběr pochází z rozložení N(i,2 ), i = 1, ..., 5. Byl vypočten celkový součet čtverců ST = 15 a rezi- duální součet čtverců SE = 3. Na hladině významnosti 0,05 testujte hypotézu o shodě středních hodnot. Výsledek: n = 5 + 7 + 6 + 8 + 5 = 31, r = 5, SA = ST ­ SE = 15 ­ 3 = 12 9752,2)26,4(F,26 263 412 )rn(S )1r(S F 95,0 E A === - - = Protože F F0,95(4,26), H0 zamítáme na hladině významnosti 0,05. 3. Je dána neúplná tabulka ANOVA. Místo otazníků doplňte chybějící čísla. zdroj variability součet čtverců stupně volnosti podíl F skupiny ? 2 ? ? reziduální 16,033 ? ? - celkový 17,301 35 - - Výsledek: zdroj variability součet čtverců stupně volnosti podíl F skupiny 1,268 2 0,634 1,304 reziduální 16,033 33 0,486 - celkový 17,301 35 - - 4. (S) Studenti byli vyučováni předmětu za využití pěti pedagogických metod: tradiční způ- sob, programová výuka, audiotechnika, audiovizuální technika a vizuální technika. Z každé skupiny byl vybrán náhodný vzorek studentů a všichni byli podrobeni témuž písemnému tes- tu. Na hladině významnosti 0,05 testujte hypotézu, že znalosti všech studentů jsou stejné a nezávisí na použité pedagogické metodě. V případě zamítnutí nulové hypotézy zjistěte, které výběry se liší na hladině významnosti 0,05. metoda počet bodů tradiční 76,2 48,3 85,1 63,7 91,6 87,2 programová 85,2 74,3 76,5 80,3 67,4 67,9 72,1 60,4 audio 67,3 60,1 55,4 72,3 40 audiovizuální 75,8 81,6 90,3 78 67,8 57,6 vizuální 50,5 70,2 88,8 67,1 77,7 73,9 Výsledek: Všech pět náhodných výběrů má rozložení blízké normálnímu rozložení. Levenův test shody rozptylů má testové kritérium 0,819, počet stupňů volnosti je 4 a 26, odpovídající p-hodnota je 0,5248, tedy na hladině významnosti 0,05 hypotézu o shodě rozptylů nezamítáme. Analýza rozptylu má testové kritérium 1,6236, počet stupňů volnosti je 4 a 26, odpovídající p-hodnota je 0,1983, tedy na hladině významnosti 0,05 hypotézu o shodě středních hodnot nezamítáme. Znamená to, že na hladině významnosti 0,05 se neprokázaly odlišnosti ve znalostech studentů. 5. (S) Pan Novák může cestovat z místa bydliště do místa pracoviště třemi různými způsoby: tramvají (způsob A), autobusem (způsob B) a metrem s následným přestupem na tramvaj (způsob C). Máme k dispozici jeho naměřené časy cestování do práce v době ranní špičky (včetně čekání na příslušný spoj) v minutách. Způsob A: 32, 39, 42, 37, 34, 38 Způsob B: 30, 34, 28, 26, 32 Způsob C: 40, 37, 31, 39, 38, 33, 34 Pro všechny tři způsoby dopravy vypočtěte průměrné časy cestování. Na hladině významnosti 0,05 testujte hypotézu, že doba cestování do práce nezávisí na způsobu dopravy. V případě zamítnutí nulové hypotézy zjistěte, které způsoby dopravy do práce se od sebe liší na hladině významnosti 0,05. Výsledek: Průměrné časy cestování pro tři způsoby dopravy jsou 37 min, 30 min, 36 min. Všechny tři náhodné výběry mají rozložení blízké normálnímu rozložení. Levenův test shody rozptylů má testové kritérium 0,1054, počet stupňů volnosti je 2 a 15, odpovídající p-hodnota je 0,9007, tedy na hladině významnosti 0,05 hypotézu o shodě rozptylů nezamítáme. Analýza rozptylu má testové kritérium 6,7151, počet stupňů volnosti je 2 a 15, odpovídající p-hodnota je 0,0083, tedy na hladině významnosti 0,05 hypotézu o shodě středních hodnot zamítáme. Scheffého metoda mnohonásobného porovnávání prokázala na hladině významnosti 0,05 roz- díl mezi způsoby A a B a mezi způsoby Ba C.