Analýza rozptylu o logika analýzy rozptylu o výpočetní postup o mnohonásobná porovnávání o opakovaná měření o faktoriální analýza rozptylu o analýza kovariance o vícerozměrná analýza rozptylu Porovnávání průměrů o t-testy jsou určeny pouze pro porovnávání dvojice průměrů o v mnoha výzkumných plánech je však více skupin než dvě n např. v příkladu s testováním účinnosti nového léku může být kromě skupin s testovaným lékem a placebem ještě skupina se starým lékem Porovnávání průměrů o rozdíly mezi více skupinami by sice bylo možné otestovat po dvojicích pomocí t-testu, ale... n pravděpodobnosti v tabulce t-rozdělení jsou spočítány za předpokladu, že je prováděno pouze jediné srovnání n čím více testů, tím vyšší pravděpodobnost chyby typu I (např. pro 3 srovnání je 5% alfa ve skutečnosti 10%, pro 10 srovnání 30% atd.) Analýza rozptylu o proto je vhodnější místo mnoha t-testů použít jinou statistickou techniku -- analýzu rozptylu o analysis of variance --ANOVA o umožňuje otestovat rozdíly mezi průměry více skupin najednou Logika analýzy rozptylu o analýza rozptylu nevyužívá pro testování rozdílu mezi průměry samotné průměry, ale rozptyly o počítají se dva odhady: n rozptyl uvnitř skupin (within-groups nebo within-subjects variance) n rozptyl mezi skupinami (between-groups nebo between-subjects variance) Logika analýzy rozptylu o rozptyl uvnitř skupin je ukazatel celkové variability uvnitř skupin -- tj. jak se od sebe vzájemně liší osoby v rámci jednotlivých skupin o rozptyl mezi skupinami je měřítkem variability mezi skupinami -- tj. jak se od sebe liší skupiny osob Logika analýzy rozptylu o poměr těchto dvou rozptylů je statistika F rozptyl mezi skupinami F = rozptyl uvnitř skupin Logika analýzy rozptylu o pokud nejsou mezi skupinami rozdíly, pak by měl být rozptyl mezi skupinami a uvnitř skupin velmi podobný (teoreticky shodný - F=1) o pokud jsou mezi skupinami rozdíly, pak budou tyto rozdíly (between)větší než vzájemné rozdíly mezi osobami uvnitř skupin (within) Logika analýzy rozptylu o je-li F>1, pak kromě F musíme ještě spočítat pravděpodobnost, že bychom takto vysoké získali náhodou (tj. statistickou významnost) o tabulka F rozdělení je vždy pro konkrétní hodnotu alfa; má v řádcích počet stupňů volnosti pro rozptyl uvnitř skupin a ve sloupcích pro rozptyl mezi skupinami Analýza rozptylu - příklad o v klasickém experimentu testujícím tzv. efekt přihlížejících (bystander effect) zjišťovali Darley a Latane, zda má přítomnost dalších lidí vliv na naši ochotu pomoci někomu v nouzi o ZO čekala v místnosti s dalšími 0, 2 nebo 4 osobami Analýza rozptylu - příklad o experimentátorka odešla něco připravit do vedlejší místnosti a bylo slyšet, že upadla a vykřikla něco o bolesti v kotníku o závislou proměnnou byla doba, která uplynula do nabídnutí pomoci experimentátorce (v sekundách) Analýza rozptylu - příklad Analýza rozptylu [o ] 1. krok -- výpočet celkového rozptylu (součtu čtverců -- sum of squares) SST (SS[total)] = SSB + SSW o SST = S(X-X)^2 o výpočetní rovnice SST = SX^2 --[(SX)^2/n] Analýza rozptylu - příklad ^o SST = SX^2 --[(SX)^2/n] SST = (27^2+20^2+22^2+...+33^2)--[(906)^2/33] SST = 26016 -- 24873,818 SST = 1142,182 Analýza rozptylu o 2. krok -- výpočet rozptylu mezi skupinami SSB (SS[between]) ^o SSB = Sn[k](X[k]-X)^2 n n[k] je počet osob ve skupině n X[k] je průměr skupiny Analýza rozptylu - příklad ^o SSB = Sn[k](X[k]-X)^2 SSB = 12*(23,75-27,45)^2 + 10*(27,60- 27,45)^2 + 11*(31,36-27,45)^2 SSB = 12*(-3,7)^2+10*(0,15)^2+(11*3,91)^2 SSB = 332,968 Analýza rozptylu [o ] 3. krok -- výpočet rozptylu uvnitř skupin SSW (SS[within]) [ ]^o SSW = S(X-X[k])^2 n X[k] je průměr skupiny o výpočetní rovnice SSW = SST - SSB Analýza rozptylu - příklad o SSW = SST -- SSB SSW = 1142,182 -- 332,986 SSW = 809,196 Analýza rozptylu - příklad [o ] 4. krok -- výpočet stupňů volnosti [ ]o pro SST: dft = n-1 (n je celkový počet osob) n dft = 33-1 = 32 [ ]o pro SSB: dfb = k-1 (k je počet skupin) n dfb = 3-1 = 2 [ ]o pro SSW: dfw = n-k [ ]n dfw = 33-3 = 30 Analýza rozptylu - příklad Analýza rozptylu - příklad o F = rozptyl mezi / rozptyl uvnitř F = MSB / MSW F = 166,493 / 26,973 F = 6,17 o F vypadá větší než 1, ale jak je pravděpodobné, že by tento výsledek byl náhodný? tj., je F statisticky významné? Analýza rozptylu - příklad o F (2, 30) = 6,17 Analýza rozptylu - příklad o F (2, 30) = 6,17 o kritická hodnota F pro 5% hladinu významnosti F = 3,32 o kritická hodnota F pro 1% hladinu významnosti F = 5,39 o F (2, 30) = 6,17 p < 0.01 o rozdíl mezi průměry je statisticky významný na 1% hladině významnosti Výstup ve Statistice rozptyl mezi skupinami rozptyl uvnitř skupin hladina významnosti Mnohonásobná porovnávání o průkaznost F nám řekne, zda existují průkazné rozdíly mezi průměry o ale nedozvíme se tak, mezi kterými skupinami je průkazný rozdíl (která skupina se liší od které) o je třeba provést tzv. mnohonásobná porovnání (multiple comparisons nebo post-hoc comparisons) Mnohonásobná porovnávání Mnohonásobná porovnávání o jde vpodstatě o upravené t-testy n upravené vzhledem k počtu porovnávání o existuje více různých typů mnohonásobných porovnávání, např. Fisherův LSD test, Bonferroniho test, Tukeyho test, Scheffeho test atd. Mnohonásobná porovnávání o tyto testy jsou si hodně podobné vzorcem pro jejich výpočet o liší se však ve způsobu, jak se u nich stanovuje hladina významnosti (Fisherův LSD test je liberálnější, zatímco ostatní uvedené přísnější) Mnohonásobná porovnávání o pokud bychom tyto testy spočítali u předchozího příkladu, zjistili bychom, že průkazný rozdíl je mezi skupinou osob, které byly v místnosti sami, a skupinou se 4 dalšími lidmi Mnohonásobná porovnávání Opakovaná měření o analýza rozptylu může být aplikována také na data z opakovaných měření n podobně jako t-test pro závislé výběry; analýza rozptylu se použije v případě, máme-li více než dvě měření o např. v příkladu u t-testu -- změna hmotnosti u dívek s PPP po terapii -- hmotnost by mohla být měřena i několikrát v průběhu terapie Opakovaná měření o procedura se nazývá Analýza rozptylu pro opakovaná měření (Repeated measures) o logika výpočtu je obdobná jako u analýzy rozptylu pro nezávislá data Faktoriální analýza rozptylu o faktor je v analýze rozptylu nezávislá proměnná o v prvním příkladu (bystander effect) byl pouze jeden faktor (počet osob); podobně u opakovaných měření (terapie -- před a po) Faktoriální analýza rozptylu o máme-li faktorů (nezávislých proměnných) více, použijeme faktoriální ANOVu o může jít o porovnání nezávislých výběrů, o opakovaná měření nebo obojí najednou (tzv. mixed design -- se smíšenými efekty) Faktoriální analýza rozptylu o příklad: neuropsycholog zkoumá oblasti mozku odpovídající za tvorbu a porozumění řeči o vyšetří speciálním testem 24 náhodně vybraných pacientů s poškozenou levou hemisférou mozku -- polovina z nich jsou muži a polovina ženy o kromě mezipohlavních rozdílů ho zajímá rovněž, zda bude rozdíl mezi praváky a leváky (těch je rovněž 12 a 12) Faktoriální analýza rozptylu o tento design se zapisuje 2x2 ANOVA n 2 kategorie pohlaví (muži x ženy) n 2 kategorie laterality (leváci x praváci) Faktoriální analýza rozptylu o faktoriální analýza rozptylu testuje n hlavní efekty n interakce Faktoriální analýza rozptylu o hlavní efekt (main effect) -- vliv jedné nezávislé proměnné zprůměrovaný pro všechny úrovně ostatních nezávislých proměnných o u faktoriální ANOVy jsou testovány hlavní efekty pro všechny faktory o v příkladu testujeme hlavní efekt pro pohlaví a lateralitu Faktoriální analýza rozptylu o průkazný (na hladině 1%) hlavní efekt pro faktor pohlaví o ženy mají celkově vyšší skóry než muži (16,2 a 11,0) Faktoriální analýza rozptylu o průkazný (na hladině 1%) hlavní efekt pro faktor lateralita o leváci mají celkově vyšší skóry než praváci (15,3 a 11,9) Faktoriální analýza rozptylu o interakce se projeví v případě, kdy vliv jedné nezávislé proměnné není stejný na všech úrovních druhé nezávislé proměnné o v příkladu -- je vliv laterality stejný u mužů a žen? n pokud ano, není zde interakce n pokud ne, je zde interakce Faktoriální analýza rozptylu o interakce mezi pohlavím a lateralitou je průkazná (na 5% hladině významnosti) o u žen nehraje lateralita pro výkon v testu roli -- levačky a pravačky se neliší, zatímco u mužů leváci a praváci ano Faktoriální analýza rozptylu o bez interakce -- pouze hlavní efekty Faktoriální analýza rozptylu o interakce Opakovaná měření s další nezávislou proměnnou o faktoriální design je možno uplatnit i u analýzy opakovaných měření o interakce zde znamená, že jsou různě velké rozdíly mezi měřeními u jednotlivých kategorií nezávislé proměnné Opakovaná měření s další nezávislou proměnnou o příklad: psychiatr testující léčbu anorexie by mohl soubor rozdělit na dívky podstupující terapii dobrovolně a nedobrovolně n interakce by mohla vypadat třeba tak, že u motivovaných dívek by došlo k nárůstu hmotnosti, zatímco u nedobrovolných pacientek ke stagnaci Opakovaná měření s další nezávislou proměnnou Analýza kovariance o kromě kategoriálních faktorů je možno do analýzy zařadit také spojitou nezávislou proměnnou -- tzv. kovariát o pak jde o analýzu kovariance (ANCOVA) Analýza kovariance o příklad: šéf firmy obdrží stížnost od zaměstnankyň, že ženy mají nižší platy než muži o podle porovnání průměrů to tak vypadá, ale co kdybychom do analýzy zařadili jako další faktor (kovariát) délku praxe? Vícerozměrná analýza rozptylu o ve všech předchozích příkladech jsme měli pouze jednu závislou proměnnou o je však možno testovat také vliv jednoho či více faktorů na několik závislých proměnných najednou o tato analýza se označuje jako MANOVA (multivariate analysis of variance) Vícerozměrná analýza rozptylu o příklad: psycholog chce porovnat strukturu intelektu u mužů a žen o zadá jim IST (test struktury inteligence) s 9 subtesty o těchto 9 závislých proměnných pak porovná pro pohlaví subjektů jako faktor Kontrolní otázky o jaké typy rozptylu jsou v analýze rozptylu porovnávány? o k čemu v analýze rozptylu slouží mnohonásobná porovnávání? o uveďte příklady výzkumných plánů, při kterých by bylo možno použít: n faktoriální analýzu rozptylu n analýzu opakovaných měření s kovariátem n vícerozměrnou analýzu rozptylu