9 Analýza rozptylu: porovnání více průměrů Mnoho studií má komparativní charakter. Srovnáváme např. platy žen a mužů nebo hodnoty cílové proměnné v kontrolovaném klinickém pokusu. Data v takovém výzkumu se mohou přehledně zobrazit pomocí krabicového grafu nebo sloupkového grafu, také můžeme pro číselné srovnání použít kvantilové charakteristiky rozložení dat ve skupinách nebo průměry a směrodatné odchylky. Při statistickém usuzování se ptáme, zda jsou rozdíly mezi skupinami statisticky významné. Pro porovnání průměrů dvou populací nebo průměrů cílové proměnné sledované v kontrolovaném dvouskupinovém experimentu použijeme í-test, který jsme popsali v kapitole 6.2. Studie se však neomezují pouze na dvě skupiny. Potřebujeme tedy metody pro porovnání libovolného poctu průměrů. Takové metody existují a používají se pod shrnujícím názvem analýza rozptylu. Je vhodná např. k zodpovězení následujících otázek: ■ Liší se ve svém účinku tři metody výuky statistiky na středních školách? Naučí se žáci pomocí některé z těchto metod více než žáci, kteří jsou vyučování jinými metodami? ■ Dožívají se leváci kratšího věku než praváci? Protože ženy žijí déle než muži, je nutné připravit dvoufaktorový plán výzkumu, aby se zohlednil vliv faktoru pohlaví. Analýzu rozptylu (ANOVA, analysis of variance) rozvinul R. A. Fisher začátkem 20. století. Jedná se o třídu statistických modelů a technik, které lze využít v mnoha výzkumných situacích. Fisherovy statistické práce vznikaly v rámci zemědělského výzkumu v ústavu Rothamsted Experimental Station při vyhodnocování zemědělských pokusů. Před Fisherovým příchodem se zemědělský pokus prováděl tak, že se pole rozdělilo na několik „parcel" a každá parcela byla ošetřena (hnojena) určitým způsobem. Následně se srovnávaly výnosy z jednotlivých parcel. Bylo však zřejmé, že rozdíly ve výnosech mohou být způsobeny jinými faktory než hnojivem, např. rozdílnou kvalitou půdy. Fisher navrhl roz- 337 PŘEHLED STATISTICKÝCH METOD dělit pole na bloky a každý blok na parcely (plots). Každá parcela uvnitř bloku pak dostala náhodně přiřazené ošetření. Toto schéma výzkumu (design) se stalo základem pro analýzu, známou dnes pod názvem analýza rozptylu. Jádro Fisherova postupu tvoří dva principy. První spočívá v klíčové roli, již hraje randomizace (znáhodnění) v experimentování. Tím se zajišťuje eliminace systematického zkreslení efektu posuzovaného ošetření. Randomizace také umožňuje validní odhady náhodné chyby, což má vztah k druhému principu, k možnosti kontrolované odhadovat náhodnou chybu opakování ošetření. Opakováním každého ošetření v blocích a uvnitř bloku můžeme v pozorované variabilitě lépe identifikovat variabilitu mezi parcelami uvnitř bloků po „očištění" od variability mezi bloky. Fisher popsal základy analýzy rozptylu v knížce Statistical methodsfor research z roku 1925. Obecně spočívá základní funkce analýzy rozptylu v posouzení hlavních a interakčních efektů kategoriálních nezávislých proměnných na závisle proměnnou kvantitativního typu. Nezávisle proměnné v ANOVA často nazýváme faktory a jejich hodnoty úrovně nebo kategorie. Nejjednodušším případem je analýza rozptylu jednoduchého třídění, kdy analyzujeme efekt jednoho faktoru na závisle proměnnou. Jde o přímé zobecnění případu zkoumání rozdílu mezi dvěma nezávislými skupinami pomocí Mestu na případy zkoumání rozdílů mezi více skupinami (odpovídajícím jednotlivým úrovním neboli kategoriím faktoru). Pokud zkoumáme vliv více faktorů, rozlišujeme mezi hlavními efekty a efekty, které jsou způsobeny interakcemi mezi faktory při působení na závisle proměnnou. Hlavní efekt je přímý efekt faktoru na závisle proměnnou. Interakční efekt je spojený efekt kombinace dvou nebo více faktorů na závisle proměnnou. Pomocí obecnějších modelů analyzujeme podobné úlohy s kategoriální závisle proměnnou (GLM, generál linear model). Také existují postupy, jež do modelu zařazují mezi nezávisle proměnné intervalové proměnné (analýza kova-riance, ANCOVA, analysis of covariance) nebo modely, které analyzují simultánně ovlivnění více nezávislých proměnných (MANOVÁ, multiple analysis of variance). Základní statistikou v analýze rozptylu je F-testovací statistika rozdílnosti skupinových průměrů, pomocí níž se testuje hypotéza, zda průměry ve skupinách určených kombinacemi faktorů se od sebe liší více než na základě působení náhodného kolísání. Pokud se průměry neliší významně, usuzujeme, že faktory nemají na závisle proměnnou vliv. Jestliže F-test indikuje nějaký systematický vliv, používají se testy simultánního srovnávání pro nalezení kombinací hodnot faktorů, které nejvíce přispívají k systematickým vlivům. Testovací F-statistika musí zohlednit rozdílnosti ve výběrových průměrech a zároveň přirozenou variabilitu závisle proměnné. V podstatě měří určitým 338 t 9 ANALÝZA ROZPTYLU: POROVNÁNÍ VÍCE PRŮMĚRŮ způsobem velikost rozdílnosti výběrových průměrů a její hodnota závisí jednak na výběrových průměrech v jednotiivých skupinách, dále na velikosti těchto skupin a na rozptylu závisle proměnné uvnitř skupin. Obecně má F-statistika v analýze rozptylu formu: vážený rozptyl mezi průměry skupin F =- rozptyl mezi jedincí ve stejné skupině Pokud celková rozdílnost měřená F-statistikou překročí určenou kritickou mez, zamítá se nulová hypotéza, že všechny teoretické průměry mají stejnou hodnotu. Analýzou konstrukce F-testu lze ukázat, že podobně jako u jiných testů dojde k zamítnutí hypotézy, pokud jsou rozdíly průměrů relativně veliké. Jestliže zamítneme hypotézu rovnosti průměrů, ještě nám to nic neřekne o rozdílech mezi jednotlivými průměry. Další analýza se musí provést pomocí metod následného zkoumání těchto rozdílů. Jestliže je plán výzkumu uspořádán vnitroskupinově s opakovaným měřením závisle proměnné u stejných objektů, jako je tomu např. u hodnocení měření před pokusem a po pokusu, výpočty při provádějí F-testů se odlišují od testů v plánech výzkumu prováděných meziskupinove. Procedury analýzy rozptylu předpokládají, že závisle proměnná v jednot-livých skupinách má normální rozdělení se stejným rozptylem. Často se také předpokládá, že pro každou skupinu je rozsah výběru měřených jednotek stejný. Tato symetrie zjednodušuje některé výpočty. 9.1 Analýza rozptylu při jednoduchém třídění Analýza rozptylu při jednoduchém třídění (one-way ANOVA) analyzuje diference průměrů sledované závisle proměnné mezi skupinami, které jsou určeny jednou kategoriální nezávisle proměnnou (faktorem). Zkoumá se, zda skupiny vytvořené tímto klasifikačním faktorem jsou podobné, nebo zda jednotlivé průměry tvoří nějaké identifikovatelné shluky. Jestliže faktor má jenom dvě kategorie (úrovně), úloha je totožná s testováním rovnosti průměru ve dvou nezávislých výběrech pomocí ř-testu nebo testování hypotézy, že korelační koeficient mezi závisle proměnnou a binární proměnnou určující příslušnost měření do jedné z obou skupin má nulovou hodnotu. Popišme přesněji situaci, kterou analyzujeme pomocí této metody. Označme závisle proměnnou X. Provedeme měření na prostých náhodných výběrech objektů z m populací (j = 1, 2,..., m). Rozsahy výběrů n j mohou být různé. Pro 339 PŘEHLED STATISTICKÝCH METOD každý výběr j vypočítáme příslušný průměr xíj a rozptyl sj. Předpokládáme, že měření vyhovují modelu xíj = /i + a j + eu> kde xíj označuje í-té měření (i - 1, 2,..., n;) v j-tém výběru a /i je společná část průměru. Efekt skupiny ary způsobuje, že průměry //y sledované proměnné v populacích si nemusí být rovny. Měření x,j se liší od průměru ve své skupině o náhodnou odchylku O této odchylce předpokládáme, že je normálně rozdělená s nulovou střední hodnotou a s rozptylem o2, jenž je pro všechny měření stejný. Symbolem n označujeme celkový počet měření, který se rovná součtu všech tij. Základní hypotéza, jež nás zajímá, předpokládá, že jsou všechny průměry v jednotlivých populacích stejné, tedy Ho: /íi = /i2 = ■ • • = Vm, alternativa j e Hi: Ne všechny fij jsou stejné, nebo v jiném přepisu H0: cti = &2 = * * ■ = <*m = 0, s alternativou Hi: Ne všechny a j jsou nulové. Nulová hypotéza tedy znamená, že faktor neovlivňuje závisle proměnnou X. Při analýze dat zkoumáme, zda vypočtené průměry xj se od sebe liší jen v mezích náhodného kolísání od společného průměru x, nebo zda je nulová hypotéza porušena. Konstrukce testovací F-statistiky vychází z rozkladu součtu čtverců odchylek měření od společného průměru x. Odchylku měření x,; od x přepíšeme ve formě rozkladu x - (xíj-xj)+(xj-x). V tomto vyjádření hodnota Xj—x představuje odhad parametru a}, tedy efektu kategorie j. Jestliže umocníme a sečteme obě strany rovnice pro všechna měření, pak po úpravách (při kterých se vyruší všechny ostatní členy vzniklé při umocnění) dostaneme 5 t = X Yj (XiJ ~ *f = Yi Ti (XV ~ *if + Tinj =Se+SA. j i j i j Tento výraz říká, že celkový součet čtverců 5 r se rovná součtu čtverců odchylek uvnitř výběrů Se a součtu čtverců rozdílů mezi výběry S a- K součtům čtverců rozdílů patří stupně volnosti n — í, n■ — m am — 1. Když jimi vydělíme příslušné součty, dostaneme tzv. průměrné čtverce MS (mean squares): MST = ST/(n- 1), MSe = Se/(n - ni), MSA = SA/(m-\) Platí, že statistika F = MS a /MS e má za platnosti nulové hypotézy F-rozdělení se stupni volnosti (m - 1, n - m). Tato F-statistika měří globální odchylku dat od nulové hypotézy. Je tomu tak proto, že obě hodnoty MS A a MSe odhadují za 340 9 ANALÝZA ROZPTYLU: POROVNÁNÍ VÍCE PRŮMĚRŮ Schéma tabulky analýzy rozptylu Zdroj variability S st.v. MS F faktor A sA m -1 n MSA ~ MSe reziduálni n ■ - m MSe = Á Celková variabilita St n -1 platnosti nulové hypotézy společný rozptyl a2. Pokud je však porušena nulová hypotéza, hodnota MS a bude významně větší než MS e. Velikost mezního poměru určuje kritická mez pro F-rozdělení s příslušnými stupni volnosti. Výpočty se obvykle shrnují tabulkou analýzy rozptylu (tab. 9.1). PŘÍKLAD 9.1 Modelová data v tabulce 9.2 popisují hodnoty kontrolního testu u studentů. Každý sloupec obsahuje data pro skupinu náhodně vybraných studentů ze skupin s danou metodou výuky. Zkoumáme nulovou hypotézu, že průměry hodnot jsou stejné ve všech skupinách. To znamená, že typ výuky {faktor A) nemá vliv na průměrnou hodnotu testu. Pro statistický test volíme hladinu významnosti 0,05. Naše hypotézy jsou: H1: Ne všechny ti jsou stejné. Příklad dat, u nichž provádíme analýzu rozptylu (jednoduché třídění) Metoda výuky 1 2 3 89 104 86 101 120 98 87 98 100 87 110 96 Součet 364 432 380 341 PŘEHLED STATISTICKÝCH METOD Průměry ve skupinách mají hodnoty 364 ™ *1 = — = 91 4 4 Celkový průměr je průměr ze všech hodnot 364 + 432 + 380 432 . 380 n_ x2 - = 108 a x3 = —— = 95. x = 12 = 98. Vypočítáme tři součty čtverců. a) Celkový součet čtverců je totéž co čitatel při počítání výběrového rozptylu ze všech 12 měření: ^ {89 -98)2 + (104 -98)2 + (86 - 98}2 ^ + (101 -98)2 + (120-98)2 + (98 - 98)2 + {87 -98)2 + (98-98)2 + (100 - 98}2 \+ {87-98)2 + (110-98)2 + (96 - 98}2 / = 1148 b) Součet čtverců uvnitř skupin má stejný počet členů. Ty jsou však určeny rozdíly mezi měřením a příslušným skupinovým průměrem: ( {89 -91)2 + (104- 108)2 + {86-95)2\ + (101-91)2 + {120- 108)2 + (98-95)2 + (87-91)2 + (98- 108}2 + (100 - 95)2 \^+ (87-91)2 + (110- 108)2 + (96-95)2/ = 516 c) Součet čtverců mezi výběry má také stejný počet členů, ale počítá se pouze se skupinovými průměry a celkovým průměrem: 54 = H<*/-*}2 = ^ (91 - 98)2 + (108 - 98)2 + (95 - 98)2 ^ + (91 -98)2 + (108 -98)2 + (95 - 98)2 + (91 - 98)2 + (108 -98)2 + {95 -98)2 ^+ (91 -98)2 + (108-98)2 + (95-98)2y = 632 Protože se v tomto posledním vzorci opakují průměry ve sloupci pro skupinu, lze jej zjednodušit: SA = J.; n j (xj - xf = 4 (91 - 98)2 + 4 (108 - 98)2 + 4 (95 - 98)2 = 632 Všimněte si, že SA + Se = STt takže výpočet jednoho ze třech součtů je zbytečný. Do schématu tabulky rozptylu {tab. 9.1, s. 341) doplníme příslušné vypočtené hodnoty (tab. 9.3) 342 9 ANALÝZA ROZPTYLU: POROVNANÍ VICE PRŮMĚRU Příklad vyplněné tabulky analýzy rozptylu Zdroj variability 5 St.v. MS F Fq05 mezi výběry 632 2 316 5,51 F{2,9) =4,26 reziduálni 516 9 57,333 Celková variabilita 1148 11 a srovnáme vypočítané F s kritickou hodnotou F-rozdělení s příslušnými stupni volnosti s hladinou významnosti 0,05. Pokud je F větší než kritická mez, nulovou hypotézu zamítáme. Protože je v našem případě testovací statistika F větší než kritická mez, můžeme tvrdit, že máme evidenci pro zamítnutí nulové hypotézy o rovnosti průměrů kontrolního testu ve skupinách. 9.1.1 Ověření předpokladů analýzy rozptylu Aby jednoduchá analýza rozptylu byla validní, musí být splněny následující předpoklady: 1. Všechna měření musí být vzájemně nezávislá uvnitř skupin i mezi skupinami. 2. Měření v každé skupině jsou normálně rozdělená s průměrem 3. Ve všech skupinách mají měření stejný rozptyl kolem průměru. Ověřování uvedených předpokladů se provádí numericky pomocí různých testů, korelační analýzou a graficky. Především se provádí tzv. „analýza reziduálních hodnot", což vyžaduje: ■ výpočet reziduálních hodnot x(; - x j a hodnot xy, ■ grafické znázornění reziduálních hodnot a jejich absolutních hodnot proti hodnotám faktorů a hodnotám závisle proměnné a zjištění změn, trendů a konfigurací v těchto hodnotách; ■ prověření normality rozdělení reziduálních hodnot graficky a statistickým testem. O výsledku této kontroly má výzkumník informovat čtenáře ve výzkumné zprávě. Jestliže je splněn předpoklad nezávislosti a homogenity rozptylů, grafy reziduálních hodnot neobsahují žádné systematické konfigurace bodů (podrobněji kap. 7.3.2). 343 PŘEHLED STATISTICKÝCH METOD Předpoklad rovnosti rozptylů se často těžko ověřuje. Minimálně zkoumáme, zda je splněno, že J ť max s; i <3, min S{ kde Si jsou směrodatné odchylky měření v jednotlivých skupinách. Obecně lze říci, že nej větší vliv na validitu F-testu má předpoklad o statistické nezávislosti všech měření. Vůči poruchám ostatních předpokladů je analýza rozptylu poměrně robustní. Jestliže analýza reziduálních hodnot odhalí nehomogenitu, porušení normality nebo systematické chyby způsobené špatně sestaveným modelem, pokoušíme se tyto nedostatky ošetřit transformací závisle proměnné. Tento postup může fungovat, jestliže poměr (největší hodnota pozorování)/(nejmenší hodnota pozorování) je veliký. Nejpoužívanější transformace jsou: ■ logaritmická transformace, pokud se rozptyl zvyšuje úměrně s průměrem; ■ arcussinová transformace pro relativní četnosti; ■ druhá odmocnina pro četnosti. Poslední dvě transformace se používají při analýze dat četnostního typu. 344