Kapitola 5.: Analýza rozptylu jednoduchého třídění Cíl kapitoly Po prostudování této kapitoly budete umět hodnotit vliv faktoru o r > 3 úrovních na variabilitu hodnot sledované náhodné veličiny sestrojit tabulku analýzy rozptylu identifikovat dvojice náhodných výberu, které se významně liší střední hodnotou provést test shody rozptylů znázornit rozložení dat v daných r > 3 náhodných výběrech graficky pomocí kategorizovaných krabicových diagramů v Časová zátěž Na prostudování této kapitoly a splnění úkolů s ní spojených budete potřebovat asi 5 hodin studia. 5.1. Motivace Zajímáme se o problém, zda lze určitým faktorem (tj. nominální náhodnou veličinou A) vysvětlit variabilitu pozorovaných hodnot náhodné veličiny X, která je intervalového či poměrového typu. Např. zkoumáme, zda metoda výuky určitého předmětu (faktor A) ovlivňuje počet bodů dosažených studenty v závěrečném testu (náhodná veličina X). Předpokládáme, že faktor A má r > 3 úrovní a i-té úrovni odpovídá ni výsledků Xu,...,Xin , které tvoří náhodný výběr z rozložení N(ui, g ), i = 1, r a jednotlivé náhodné výběry jsou stochasticky nezávislé, tedy Xy = ui + £jj, kde Sy jsou stochasticky nezávislé náhodné veličiny s rozložením N(0, o2), i = 1, ..., r, j = 1, ..., ni. Výsledky lze zapsat do tabulky faktor A výsledky úroveň 1 xn,...,xlni úroveň 2 X21,...,X2ll2 úroveň r xrl,...,xmr Na hladině významnosti a testujeme nulovou hypotézu, která tvrdí, že všechny střední hodnoty jsou stejné proti alternativní hypotéze, která tvrdí, že aspoň jedna dvojice středních hodnot se liší. Jedná se tedy o zobecnění dvouvýběrového t-testu a na první pohled se zdá, že štaci utvořit v2y dvojic náhodných výběrů a na každou dvojici aplikovat dvouvýběrový t-test. Tento postup však nelze použít, neboť nezaručuje splnění podmínky, že pravděpodobnost chyby 1. druhuje nejvýše a. Proto ve 30. letech 20. století vytvořil R. A. Fisher metodu ANOVA (analýza rozptylu, v popsané situaci konkrétně analýza rozptylu jednoduchého třídění), která uvedenou podmínku splňuje. Pokud na hladině významnosti a zamítneme nulovou hypotézu, zajímá nás, které dvojice středních hodnot se od sebe liší. K řešení tohoto problému slouží metody mnohonásobného porovnávání, např. Scheffého nebo Tukeyova metoda. 5.2. Označení V analýze rozptylu jednoduchého třídění se používá následující označení. r n = ^ n; ... celkový rozsah všech r výběrů i=l X; = ^ X;j ... součet hodnot v i-tém výběru j=i M; =—X; ... výběrový průměr v i-tém výběru r n, X = ^ ^ Xy ... součet hodnot všech výběrů i=i j=i M =—X ... celkový průměr všech r výběrů n 5.3. Testování hypotézy o shodě středních hodnot Náhodné veličiny Xy se řídí modelem MO: Xy = [i + oii + Sij pro i = 1, ..., r, j = 1, ..., ni, přičemž Síj jsou stochasticky nezávislé náhodné veličiny s rozložením N(0, o2), [i je společná část střední hodnoty závisle proměnné veličiny, oii je efekt faktoru A na úrovni i. Parametry [i, ai neznáme. Požadujeme, aby platila tzv. reparametrizační rovnice: Zniai =0- i=l Zavedeme součty čtverců r lij ST = ^ ^ (X;j - M ) ... celkový součet čtverců (charakterizuje variabilitu jednotlivých poví j=i zorování kolem celkového průměru), má počet stupňů volnosti f x = n - 1, r SA = ^ n; (M; - M ) ... skupinový součet čtverců (charakterizuje variabilitu mezi jednotliví vými náhodnými výběry), má počet stupňů volnosti f a = r - 1, r n, SE = ^ ^ (X;j - M;) ... reziduálni součet čtverců (charakterizuje variabilitu uvnitř jednotliví j=i vých výběrů), má počet stupňů volnosti fE = n - r. Lze dokázat, že Sx = Sa + Se- Sčítanec (M; -M ) představuje bodový odhad efektu ai. Kdyby nezáleželo na faktoru A, platila by hypotéza ai = ... = ar = 0 a dostali bychom model Ml: Xy = n + Sij. Rozdíl mezi modely MO a Ml ověřujeme pomocí testové statistiky S /f FA = ———, která se řídí rozložením F(r-l,n-r), je-li model Ml správný. Hypotézu o nevý-Se /fe znamnosti faktoru A tedy zamítneme na hladině významnosti a, když platí: FA> Fi_a(r-l,n-r). Výsledky výpočtů zapisujeme do tabulky analýzy rozptylu jednoduchého třídění. Zdroj variability součet čtverců stupně volnosti podíl FA skupiny Sa fA = r-l sA/fA sA/fA sE/fE reziduálni Se fE = n-r Se/Íe - celkový St fT = n-1 - - 5.4. Testy shody rozptylů Před provedením analýzy rozptylu je zapotřebí ověřit předpoklad o shodě rozptylů v daných r výběrech. 5.4.1. Levenův test Položme Z;. = X;. - M; . Označíme y y Mzi = — £Zä,Mz =l^Jzij,SZE = 2S(Zä -MziKSzA =Éni(Mzi -Mz)2 • n i h n i=i j=i i=i j=i i=l Platí-li hypotéza o shodě rozptylů, pak statistika F^ = ^ZA^r—má asymptoticky rozložení SZE/(n-r) F(r-l,n-r). Ho tedy zamítáme na asymptotické hladině významnosti a, když Fza > Fi_a(r-l,n-r). Často užívanou modifikací Levenova testu je Brownův - Forsytheův test. Modifikace spočívá v tom, že místo výběrového průměru i-tého výběru se při výpočtu veličiny Zy používá medián i-tého výběru. Simulační studie ukazují, že Brownův - Forsytheův test lze použít i při porušení předpokladu normality. 5.4.2. Bartlettův test Platí-li hypotéza o shodě rozptylů, pak statistika B=I C (n-rJlnS.'-Šfo-lJlnSj5 i=l má asymptoticky rozložení % (r-1), kde C = l + 3(r-l) z- ,S; =-y] (Xj: - M; ) )e výběrový rozptyl i-tého vý- Hi -1 j=i Zín.-DS,2 s beru, S* = —-= —— je vážený průměr výběrových rozptylů. n-r n-r Ho zamítáme na asymptotické hladině významnosti a, když B > y^i-a{ľ-\,rí-ť). Bartlettův test lze použít, pokud rozsahy všech výběrů jsou aspoň 7. Je velmi citlivý na porušení předpokladu normality. 5.5. Metody mnohonásobného porovnávání Zamítneme-li na hladině významnosti a hypotézu o shodě středních hodnot, chceme zjistit, které dvojice středních hodnot se liší na dané hladině významnosti a. 5.5.1. Tukeyova metoda Mají-li všechny výběry týž rozsah p (říkáme, že třídění je vyvážené), použijeme Tukeyovu metodu: rovnost středních hodnot a \i\ zamítneme na hladině významnosti a, když |Mk - Mj I > qj_a (r, n - r)—-j=, kde hodnoty qi_a(r,n-r) jsou kvantily studentizovaného rozpětí VP a najdeme je ve statistických tabulkách. 5.5.2. Scheffého metoda Nemají-li všechny výběry stejný rozsah, použijeme Scheffého metodu: rovnost středních hodnot a zamítneme na hladině významnosti a, když Mk -ML > S* (r-1) ' 1 P — + — vnk niy F^Jr-Ln-r) Metody mnohonásobného porovnávání mají obecně menší sílu než ANOVA. Může proto nastat situace, kdy při zamítnutí Ho nenajdeme metodami mnohonásobného porovnávání významný rozdíl u žádné dvojice středních hodnot. K tomu dochází zvláště tehdy, když p-hodnota pro ANOVU je jen o málo nižší než zvolená hladina významnosti. Pak slabší test patřící do skupiny metod mnohonásobného porovnávání nemusí odhalit žádný rozdíl. 5.6. Příklad U čtyř odrůd brambor (označených symboly A, B, C, D) se zjišťovala celková hmotnost brambor vyrostlých vždy z jednoho trsu. Výsledky (v kg): odrůda hmotnost A 0,9 0,8 0,6 0,9 B 1,3 1,0 1,3 C 1,3 1,5 1,6 1,1 1,5 D 1,1 1,2 1,0 Na hladině významnosti 0,05 testujte hypotézu, že střední hodnota hmotnosti trsu brambor nezávisí na odrůdě. Zamítnete-li nulovou hypotézu, zjistěte, které dvojice odrůd se liší na hladině významnosti 0,05. Řešení: Data považujeme za realizace čtyř nezávislých náhodných výběrů ze čtyř normálních rozložení se stejným rozptylem. Testujeme hypotézu, že všechny čtyři střední hodnoty jsou stejné. Mi. = 0,8, M2. = 1,2, M3. = 1,4, M4. = 1,1, M.. = 1,14, SE = 0,3, SA= 0,816, ST = 1,116, FA = 9,97, Fo,95(3,l 1) = 3,59. Protože testová statistika se realizuje v kritickém oboru, Ho zamítáme na hladině významnosti 0,05. Výsledky zapíšeme do tabulky ANOVA Zdroj variability Součet čtverců Stupně volnosti podíl FA skupiny SA = 0,816 fA = 3 SA/3 = 0,272 SA/fA =997 sE/fE reziduálni SE = 0,3 fE= 11 Se/11 = 0,02727 - celkový ST= 1,116 fT= 14 - - Nyní pomocí Scheffého metody zjistíme, které dvojice odrůd se liší na hladině významnosti 0,05. Srovnávané odrůdy Rozdíly Mk — ML Pravá strana vzorce A, B 0,4 0,41 A, C 0,67 0,36 A, D 0,3 0,41 B, C 0,2 0,40 B, D 0,1 0,44 C, D 0,3 0,40 Na hladině významnosti 0,05 se liší odrůdy A a C. Řešení pomocí systému ŠTATISTI CA: Otevřeme nový datový soubor o dvou proměnných a 15 případech. První proměnnou nazveme HMOTNOST, druhou ID. Do proměnné HMOTNOST zapíšeme zjištěné hmotnosti, do proměnné ID, která slouží k rozlišení odrůd, zapíšeme 4 krát jedničku, 3 krát dvojku, 5 krát trojku a 3 krát čtyřku. Pomocí NP-grafu a S-W testu ověříme normalitu dat v daných čtyřech skupinách. Grafy - 2D Grafy - Normální pravděpodobnostní grafy - zaškrtneme S-W test, Proměnné HMOTNOST, OK, Kategorizovaný - Kategorie X, zaškrtneme Zapnuto, Změnit proměnnou - ID, OK. Dostaneme graf Vidíme, že ve všech čtyřech případech jsou odchylky teček od přímky jenom malé a data tedy lze považovat za realizace náhodných výběrů z normálních rozložení. Nyní budeme na hladině významnosti 0,05 testovat hypotézu o shodě rozptylů: Statistika -Základní statistiky a tabulky — Rozklad & jednofakt. ANOVA - OK, Proměnné - Závislé proměnné HMOTNOST, Grupovací proměnná ID - OK. Na záložce ANOVA & testy vybereme Leveneovy testy. Ve výstupu dostaneme tabulku Proměnná Leveneův test homogenity rozpylů (priklad66) Označ, efekty jsou význ. na hlad. p < ,05000 SČ efekt SV efekt PČ efekt SČ chyba SV chyba PČ chyba F P HMOTNOST 0,018667 3 0,006222 0,065333 11 0,005939 1,047619 0,410027 Testová statistika Levenova testu se realizuje hodnotou 1,047619, počet stupňů volnosti čitatele je 3, jmenovatele 11, odpovídající p-hodnota je 0,410027, tedy na hladině významnosti 0,05 nezamítáme hypotézu o shodě rozptylů. Dále budeme na hladině významnosti 0,05 testovat hypotézu o shodě středních hodnot. Na záložce ANOVA & testy vybereme Analýza rozptylu. Ve výstupu dostaneme tabulku Proměnná Analýza rozptylu (priklad66) Označ, efekty jsou význ. na hlad. p < ,05000 SČ efekt SV efekt PČ efekt SČ chyba SV chyba PČ chyba F P HMOTNOST 0,816000 3 0,272000 0,300000 11 0,027273 9,973333 0,001805 Testová statistika Fa se realizuje hodnotou 9,97333, počet stupňů volnosti čitatele je 3, jmenovatele 11, odpovídající p-hodnota je 0,001805, tedy na hladině významnosti 0,05 zamítáme hypotézu o shodě středních hodnot. Vytvoříme ještě tabulku s hodnotami výběrových průměrů a výběrových směrodatných odchylek tak, že na záložce Popisné statistiky zvolíme Výpočet: Tabulka statistik. Rozkladová tabulka popisných statistik (priklad66) N=15 (V seznamu záv. prom. nejsou ChD) ID HMOTNOST HMOTNOST HMOTNOST průměr N Sm.odch. 1 0,800000 4 0,141421 2 1,200000 3 0,173205 3 1,400000 5 0,200000 4 1,100000 3 0,100000 Vš.skup. 1,140000 15 0,282337 Rovněž sestrojíme krabicové diagramy tak, že na záložce Popisné statistiky zvolíme Katego-riz. krabicový graf. Vybereme typ Průměr/SmOdch/1.96SmOdch. Kategoriz. krabicový graf: HMOTNOST T T □ □ 1 □ i _i_ 12 3 4 □ Fťůrrěr I I RůrrěrtSmOdch T~ Růměr±1,96*SrrOdch Vidíme, že nejnižší průměrnou hmotnost má odrůda A, nejnižší variabilitu hmotnosti vykazuje odrůda D. Abychom zjistili, které dvojice odrůd se liší na hladině významnosti 0,05, na záložce Post-hoc vybereme Schefféův test. Scheffeho test; proměn.:HMOTNOST (priklad66) Označ, rozdíly jsou významné na hlad. p < ,05000 ID {1} M=,80000 {2} M=1,2000 {3} M=1,4000 {4} M=1,1000 1 {1} 0,059165 0,001950 0,190463 2 {2} 0,059165 0,464537 0,905502 3 {3} 0,001950 0,464537 0,163499 4 {4} 0,190463 0,905502 0,163499 V tabulce jsou uvedeny p-hodnoty pro testování hypotéz o shodě dvojic středních hodnot. Pouze jediná z těchto p-hodnot je menší nebo rovna 0,05, tedy na hladině významnosti 0,05 se liší odrůdy A a C. 5.7. Význam předpokladů v analýze rozptylu a) Nezávislost jednotlivých náhodných výběrů - velmi důležitý předpoklad, musí být splněn, jinak dostaneme nesmyslné výsledky. b) Normalita - ANOVA není příliš citlivá na porušení normality, zvlášť pokud mají všechny výběry rozsah nad 20 (důsledek centrální limitní věty). Při výraznějším porušení normality se doporučuje Kruskalův - Wallisův test. c) Shoda rozptylu - mírné porušení nevadí, při větším se doporučuje Kruskalův - Wallisův test. Test shody rozptylů má smysl provádět až po ověření předpokladu normality. Shrnutí Analýza rozptylu jednoduchého třídění slouží k hodnocení vlivu faktoru o r > 3 úrovních na variabilitu hodnot sledované náhodné veličiny s normálním rozložením. Test hypotézy o shodě středních hodnot odvodil R. A. Fisher. Výpočty spojené s testováním této hypotézy se zapisují do tabulky ANOVA. Dojde-li na dané hladině významnosti a k zamítnutí nulové hypotézy, použijeme některou z metod mnohonásobného porovnávání (např. Scheffého nebo Tukeyovu metodu), abychom identifikovali dvojice náhodných výběrů, které přispěly k zamítnutí nulové hypotézy. ANOVA předpokládá shodu rozptylů. Hypotézu o shodě rozptylů můžeme testovat pomocí Bartlettova testu, Levenova testu nebo Brownova - Forsytheova testu. Vlastnosti rozložení dat v daných r > 3 náhodných výběrech graficky znázorňujeme pomocí kategorizovaných krabicových diagramů typu průměr - směrodatná odchylka - 1,96 směrodatná odchylka. Kontrolní otázky 1. Jaký problém řeší analýza rozptylu jednoduchého třídění? 2. Jak je definován celkový, skupinový a reziduálni součet čtverců a co tyto součty čtverců charakterizují? 3. Popište způsob testování hypotézy o shodě středních hodnot. 4. Jak se testuje hypotéza o shodě rozptylů? 5. Které metody mnohonásobného porovnání se používají v analýze rozptylu jednoduchého třídění? 6. Pojednejte o významu předpokladů v analýze rozptylu jednoduchého třídění. Autokorekční test 1. Z následujících tří možností vyberte tu správnou: Analýza rozptylu jednoduchého třídění slouží k vyhodnocení dat, které vznikly: a) při párovém uspořádání pokusu b) při blokovém uspořádání pokusu c) při mnohovýběrovém uspořádání pokusu. 2. Která z následujících tvrzení jsou pravdivá? Analýza rozptylu jednoduchého třídění vyžaduje, aby a) jednotlivé náhodné výběry byly stochasticky nezávislé b) jednotlivé náhodné výběry pocházely z binomického rozložení c) jednotlivé náhodné výběry měly stejný rozptyl. 3. Která z následujících tvrzení jsou pravdivá? a) Celkový součet čtverců charakterizuje variabilitu jednotlivých pozorování kolem celkového průměru. b) Skupinový součet čtverců charakterizuje variabilitu jednotlivých pozorování kolem skupinových průměrů. c) Reziduálni součet čtverců charakterizuje variabilitu skupinových průměrů kolem celkového průměru. 4. Nulovou hypotézu o shodě středních hodnot zamítáme na hladině významnosti a, když testové kritérium Fa se realizuje v kritickém oboru a) W = (0,Fff(r-l,n-r)) b) W = (0,F^(r-l,n-r)) c) W = (F1_a(r-l,n-r),oo) 5. Pokud zamítneme hypotézu o shodě středních hodnot a všechny výběry mají stejný rozsah, pak pro zjištění, které dvojice středních hodnot se liší na zvolené hladině významnosti, použijeme a) Tukeyovu metodu mnohonásobného porovnávání b) Bartlettův test c) Levenův test Správné odpovědi: lc) 2a), c) 3a) 4c) 5a) Příklady 1. Jsou známy měsíční tržby (v tisících Kč) tří prodavačů za dobu půl roku. 1. prodavač: 12 10 9 10 11 9 2. prodavač: 10 12 11 12 14 13 3. prodavač: 19 18 16 16 17 15 Na hladině významnosti 0,05 testujte hypotézu, že střední hodnoty tržeb všech tří prodavačů jsou stejné. Pokud zamítneme nulovou hypotézu, zjistěte, tržby kterých dvou prodavačů se liší na hladině významnosti 0,05. Výsledek: Mi. = 10,17, M2. = 12, M3. = 16,83, M.. = 13, SE = 27,7, SA = 142,3, ST = 170, FA = 38,58, Fo,95(2, 15) = 3,6823, Ho tedy zamítáme na hladině významnosti 0,05. Výsledky zapíšeme do tabulky ANOVA Zdroj variability Součet čtverců Stupně volnosti podíl FA skupiny SA= 142,3 fA = 2 SA/fA = 71,17 SA(fA =38,58 sE/fE reziduálni SE = 27,7 fE= 15 SE/fE=l,84 - celkový ST = 170 fT= 17 - - Nyní pomocí Tukeyovy metody zjistíme, které dvojice prodavačů se liší na hladině významnosti 0,05. Srovnávaní prodavači Rozdíly Mk — ML Pravá strana vzorce 1,2 1,83 2,03 1,3 6,67* 2,03 2,3 4,83* 2,03 S /l 84 /l 84 S Pravá strana: qi a(v,n -r)-£= = q095 (3,15)^=- = 4,83^=- = 2,03, kde S*2 = —^ = 1,84 y]p V6 V6 n-r Na hladině významnosti 0,05 se liší tržby prodavačů 1, 3 a 2, 3. 2. Je dáno pět nezávislých náhodných výběrů o rozsazích 5, 7, 6, 8, 5, přičemž i-tý výběr pochází z rozložení N(ui,o2), i = 1, 5. Byl vypočten celkový součet čtverců St = 15 a reziduálni součet čtverců Se = 3. Na hladině významnosti 0,05 testujte hypotézu o shodě středních hodnot. Výsledek: n = 5 + 7 + 6 + 8 + 5 = 31,r = 5, Sa = St-Se= 15-3 = 12 F = ^f"! = = 26> Fo.5 (4,26) = 2,9752 SE/(n-r) 3/26 Protože F > Fo,9s(4, 26), Ho zamítáme na hladině významnosti 0,05. 3. Je dána neúplná tabulka ANOVA. Místo otazníků doplňte chybějící čísla. zdroj variability součet čtverců stupně volnosti podíl F skupiny ? 2 ? ? reziduálni 16,033 ? ? - celkový 17,301 35 - - Výsledek: zdroj variability součet čtverců stupně volnosti podíl F skupiny 1,268 2 0,634 1,304 reziduálni 16,033 33 0,486 - celkový 17,301 35 - - 4. Studenti byli vyučováni předmětu za využití pěti pedagogických metod: tradiční způsob, programová výuka, audiotechnika, audiovizuální technika a vizuální technika. Z každé skupiny byl vybrán náhodný vzorek studentů a všichni byli podrobeni témuž písemnému testu. Na hladině významnosti 0,05 testujte hypotézu, že znalosti všech studentů jsou stejné a nezávisí na použité pedagogické metodě. V případě zamítnutí nulové hypotézy zjistěte, které výběry se liší na hladině významnosti 0,05. metoda počet bodů tradiční 76,2 48,3 85,1 63 91,6 87,2 programová 85,2 74,3 76,5 80,3 67,4 67,9 72,1 60,4 audio 67,3 60,1 55,4 72,3 40 audiovizuální 75,8 81,6 90,3 78 67,8 57,6 vizuální 50,5 70,2 88,8 67,1 77,7 73,9 Výsledek: Všech pět náhodných výběrů má rozložení blízké normálnímu rozložení. Levenův test shody rozptylů má testové kritérium 0,863, počet stupňů volnosti je 4 a 26, odpovídající p-hodnota je 0,4991, tedy na hladině významnosti 0,05 hypotézu o shodě rozptylů nezamítáme. Analýza rozptylu má testové kritérium 1,6236, počet stupňů volnosti je 4 a 26, odpovídající p-hodnota je 0,1983, tedy na hladině významnosti 0,05 hypotézu o shodě středních hodnot nezamítáme. Znamená to, že na hladině významnosti 0,05 se neprokázaly odlišnosti ve znalostech studentů 5. Pan Novák může cestovat z místa bydliště do místa pracoviště třemi různými způsoby: tramvají (způsob A), autobusem (způsob B) a metrem s následným přestupem na tramvaj (způsob C). Máme k dispozici jeho naměřené časy cestování do práce v době ranní špičky (včetně čekání na příslušný spoj) v minutách. způsob doba čekání A 32 39 42 37 34 38 B 30 34 28 26 32 C 40 37 31 39 38 33 34 Pro všechny tři způsoby dopravy vypočtěte průměrné časy cestování. Na hladině významnosti 0,05 testujte hypotézu, že doba cestování do práce nezávisí na způsobu dopravy. V případě zamítnutí nulové hypotézy zjistěte, které způsoby dopravy do práce se od sebe liší na hladině významnosti 0,05. Výsledek: Průměrné časy cestování pro tři způsoby dopravy jsou 37 min, 30 min, 36 min. Všechny tři náhodné výběry mají rozložení blízké normálnímu rozložení. Levenův test shody rozptylů má testové kritérium 0,1054, počet stupňů volnosti je 2 a 15, odpovídající p-hodnota je 0,9007, tedy na hladině významnosti 0,05 hypotézu o shodě rozptylů nezamítáme. Analýza rozptylu má testové kritérium 6,7151, počet stupňů volnosti je 2 a 15, odpovídající p-hodnota je 0,0083, tedy na hladině významnosti 0,05 hypotézu o shodě středních hodnot zamítáme. Scheffého metoda mnohonásobného porovnávání prokázala na hladině významnosti 0,05 rozdíl mezi způsoby A a B a mezi způsoby B a C.