PSY117 Statistická analýza dat v psychologii Př ednáška 12 2018 Analýza rozptylu Srovnávání více než dvou průměrů If your experiment needs statistics, you ought to have done a better experiment. Ernest Rutherford Omezení t-testu  (i jeho nPar alternativ) t-test umožňuje srovnání pouze dvou průměrů Více skupin ( j ) >> mnoho porovnání: j ( j -1)/2 Více srovnání způsobuje strmý růst pravděpodobnosti chyby I. typu   např. při α=0,05 a 20 testech p=0,64 (1 nebo více chyb)  aplikace binomického rozložení Platí to pro jakékoli statistické testy (zejm. korelace) Je problematické provádět mnoho testů na jedněch datech (cca >5)   Zneužití se označuje jako rybaření v datech – capitalizing on chance Lze kompenzovat korekcí hladiny α (Bonferroniho korekce), avšak za cenu značného snížení síly testu (1-β).  Místo α testujeme na hladině α ’=α /N, kde N je počet prováděných testů. AJ : multiple tests, capitalizing on chance, fishing, Bonferroni correction, statistical power dobnost 1 nebo více falešných pozitiv při dané hladině a a p 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 0,05 0,01 0,001 Řešení = Analýza rozptylu (ANOVA) Testuje na více skupinách jen jednu hypotézu:  Je mezi skupinovými průměry někde rozdíl?  Je mezi Pražáky, Brňáky a Ostraváky rozdíl v průměrné lakotě?  H0: µPražáci = µBrňáci = µOstraváci  Je-li odpověď „ano“ (p <α), pak se můžeme podívat na jednotlivé rozdíly detailněji (post-hoc testy)  Je-li odpověď „ne“ (p >α), pak bychom neměli (rybaření) AJ : ANalysis Of Variance, post-hoc tests (multiple comparisons) Terminologická vložka - ANOVA  ANOVA = ANalysis Of Variance = analýza rozptylu  i přes svůj název jde o srovnávání prů mě rů  ANOVA zjišťuje vztah mezi kategorickou nezávislou a intervalovou závislou.  kategorická nezávislá = faktor (factor, „-way“) >> skupiny  hodnoty kategorické NP = úrovně (level, treatment)  Zjištěný rozdíl = efekt, účinek (effect) Opáčko  Výběrové rozložení průměru má sm=s/√N  s=sm√N nebo s2=s2mN  Když vybereme ze stejné populace 50 vzorků o 100 lidech a rozptyl těch 50 průměrů bude 25, jaká je směrodatná odchylka proměnné? Plati-li H0...  Rozptyl každé skupiny je jedním nezávislým odhadem populačního rozptylu  Zprůměrováním těch odhadů se odhad ještě zpřesní  Rozptyl vypočítaný z rozptylu skupinových průměrů by také měl být odhadem populačního rozptylu  Tyto dva odhady by měly být stejné, až na výběrovou chybu  Je-li rozptyl vypočítaný z rozptylu skupinových průměrů vyšší, asi se průměry skupin liší Princip ANOVY 1.  rozptyl =M =mean square = S SS/df =(∑(x ))/(n -m -1)  M Swithin : variabilita uvnitř skupin (M , er r Se ro) M Swithin= SSwithin/n– j  SSwithin=∑j (x-m ∑i i j )2  M Sbetween : s spočítaný 2 ze skupinových průměrů, variabilita uvnitř skupiny je ignorována (též MSA, B, treatment )  M Sbetween= SSbetween/j -1  SSbetween=∑j j j )2) (n(m -m Platí-li H jaký čekáme vztah 0, Princip ANOVY – F -test  Čím jsou si průměry podobnější, tím je rozptyl mezi skupinami nižší (Platí-li H0, MSbetween se blíží s2)  Čím nižší je rozptyl uvnitř skupin (MSwithin se blíží 0), tím průkaznější se průměry mezi skupinami zdají být.  Důležitý je pomě r tě chto dvou odhadů rozptylu:  Čím vyšší je F-poměr, tím průkaznější jsou rozdíly mezi skupinovými průměry (rozsah je 0 až ∞ )  F -poměr má při platnosti H0 jako výběrová statistika F –rozložení s (df1,df2), které má průměr přibližně 1 (přesně df2/(df2-2)) MS between F= MS within Fisherovo-Snedecorovo Frozložení   Podobně jako t-rozložení, je F-rozložení vlastně rodina mnoha rozložení mírně se lišící svým tvarem (F(1; ν)= t(ν)2) Tato rozložení se liší tentokrát dvěma parametry – stupni volnosti    ν1 = počet skupin – 1 : stupně volnosti čitatele - MSbetween ν2 = počet lidí – počet skupin : stupně volnosti jmenovatele MSwithin na pořadí stupňů volnosti ZÁLEŽÍ http://www.econtools.com/jevons/java/Graphics2D/FDist.html Princip ANOVY – dělení rozptylu.  Dělení variability (rozptylu) podle zdrojů jako u lineární regrese Xij =µ + αj + eij     Yi = a + b X i + ei Xij = skóre jedince (i-tý jedinec v j-té skupině) µ = průměr populace α = vliv příslušnosti ke skupině (vliv úrovně faktoru) eij= chyba (vše, s čím nepočítáme, individuální prom.) Xij – m = (m – mj ) + (Xij – mj ) odchylka od celkového průměru = odchylka od skupinového průměru + odchylka skupinového průměru od celkového průměru  … odchylky umocněné na druhou = cesta k rozptylu SSTotal = SSBetween (A, treatment) + SSWithin(Error) MSTotal; MSA; MSError Velikost účinku (efektu)  Podobně jako u regrese chceme vědět, jaká část rozptylu závislé je vysvětlená nezávislou  Ekvivalentem R 2 je u anovy η2 (eta)  η2=SSBetween/SSTotal  Poněkud přesnější je ω2 = (SSBetween – dfBetween.MSWithin)/(SSTotal + MSWithin)  Pro konkrétní rozdíl průměrů dCoh = m1m2/√MSWithin  Velikost účinku je vždy třeba uvádět Předpoklady použití ANOVY  normální rozložení uvnitř skupin  při nj>30 a n1=n2=…=nj je ANOVA robustní  stejné rozptyly uvnitř skupin: homoskedascita  do smax/smin<3 je ANOVA robustní, zvláště při n1=n2=… =nj  nezávislost všech pozorování  při opakovaných měřeních je třeba použít ANOVU pro opakovaná měření viz Hendl 343 Post-hoc testy (simultánní porovnávání)  Po (a pouze po) prokázání „nějakých“ rozdílů mezi průměry obvykle chceme vědět, mezi kterými skupinami konkrétně rozdíly jsou: post-hoc testy  Srovnáváme každou skupinu s každou způsobem, který nezpůsobí nárůst α.  Je-li důležité udržet α pod kontrolou, pak je správnou volbou Scheffeho test – volba pro rybaření  Pokud to není tak kritické a máte-li pár kvazi-hypotéz na mysli, pak je volbou Student-Neuman-Keuls (S-N-K)  Extrémně „dajný“ a nepříliš vhodný pro více než 3 skupiny je LSD a proto se nedoporučuje. Další varianty a rozšíření ANOVA  ANOVA pro opakovaná měření (jako párový t-test)  ANOVA s 2 a více faktory (faktoriální ANOVA)  MANOVA – s více závislými proměnnými To vše v SPSS skryto pod GLM – general linear model  Pořadovou (neparametrickou) alternativou ANOVY jsou  Kruskal-Wallis H: H0: Md1=Md2=…=Mdj H1: Md1≠Md2 ≠ … ≠ Mdj  Jonckeheere-Terpstra Test: H1: Md1≤Md2 ≤ … ≤ Mdj AJ : repeated measures ANOVA, two(three..)-way ANOVA,(factorial ANOVA)