PSY117/454 Statistická analýza dat v psychologii Přednáška 12 Analýza rozptylu Srovnávání více než dvou průměrů If your experiment needs statistics, you ought to have done a better experiment. Ernest Rutherford Omezení t-testu (i jeho nPar alternativ) ot-test umožňuje srovnání pouze dvou průměrů nVíce skupin ( j ) >> mnoho porovnání: j ( j -1)/2 oVíce srovnání způsobuje strmý růst pravděpodobnosti chyby I. typu nnapř. při a=0,05 a 20 testech p=0,64 (1 nebo více chyb) oaplikace binomického rozložení nPlatí to pro jakékoli statistické testy (zejm. korelace) oJe nevhodné provádět velké množství testů na jedněch datech (cca >5) nZneužití se označuje jako rybaření v datech – capitalizing on chance nLze kompenzovat korekcí hladiny a (Bonferroniho korekce), avšak za cenu značného snížení síly testu (1-b). oMísto a testujeme na hladině a ’=a/N, kde N je počet prováděných testů. AJ: multiple tests, capitalizing on chance, Bonferroni correction, statistical power Řešení = Analýza rozptylu (ANOVA) oTestuje na více skupinách jen jednu hypotézu: oJe někde mezi skupinovými průměry někde rozdíl? nJe mezi Pražáky, Brňáky a Ostraváky rozdíl v průměrné lakotě? nH0: mPražáci = mBrňáci = mOstraváci oJe-li odpověď „ano“ (p a), pak bychom neměli (rybaření) o o AJ: ANalysis Of Variance, post-hoc tests (multiple comparisons) Zde už mluvíme o dichotomickém rozhodování. Terminologická vložka - ANOVA oANOVA = ANalysis Of Variance = analýza rozptylu ni přes svůj název jde o srovnávání průměrů oANOVA zjišťuje vztah mezi kategoriální nezávislou a intervalovou závislou. nkategoriální nezávislá = faktor (factor, „-way“) nhodnoty kategoriální nez. = úrovně (level, treatment) oZjištěný rozdíl = efekt, účinek (effect) Anově táhne na stovku a vymyslel ji zemědělský statistik Fisher. Je velmi spojena s experimentálním výzkumem v soc. vědách a má svou vlastní terminologii. Pro porozumění je třeba ji znát. Princip ANOVY 1. ¨ rozptyl = MS = mean square = SS/df = (∑(x-m))/(n-1) ¨ MSwithin : variabilita uvnitř skupin (MSe, error) ¨MSwithin=SSwithin/n – j ¨SSwithin= ∑j∑i(xi-mj) ¨ MSbetween : s2 spočítaný ze skupinových průměrů, variabilita uvnitř skupiny je ignorována (též MSA, B, treatment ) ¨ MSbetween=SSbetween/j -1 ¨SSbetween= ∑j(nj(mj-m)) Platí-li H0, jaký čekáme vztah mezi Msbetween a Mswithin ? Princip ANOVY – F -test oČím jsou si průměry podobnější, tím je rozptyl mezi skupinami nižší (Platí-li H0, MSbetween se blíží s2) oČím nižší je rozptyl uvnitř skupin (MSwithin se blíží 0), tím průkaznější se průměry mezi skupinami zdají být. oDůležitý je poměr těchto dvou odhadů rozptylu: o oČím vyšší je F-poměr, tím průkaznější jsou rozdíly mezi skupinovými průměry (rozsah je 0 až ∞ ) oF -poměr má při platnosti H0 jako výběrová statistika F –rozložení s (df1,df2), které má průměr přibližně 1 (přesně df2/(df2-2)) o Fisherovo-Snedecorovo F-rozložení oPodobně jako t-rozložení, je F-rozložení vlastně rodina mnoha rozložení mírně se lišící svým tvarem (F(1; n)= t(n)2) oTato rozložení se liší tentokrát dvěma parametry – stupni volnosti nn1 = počet skupin – 1 : stupně volnosti čitatele - MSbetween nn2 = počet lidí – počet skupin : stupně volnosti jmenovatele - MSwithin nna pořadí ZÁLEŽÍ o o o o o o o o o o o o ohttp://www.econtools.com/jevons/java/Graphics2D/FDist.html o Princip ANOVY – dělení rozptylu. oDělení variability (rozptylu) podle zdrojů jako u lineární regrese oXij =m + aj + eij nXij = skóre jedince (i-tý jedinec v j-té skupině) nm = průměr populace na = vliv příslušnosti ke skupině (vliv úrovně faktoru) neij= chyba (vše, s čím nepočítáme, individuální prom.) oXij – m = (m – mj ) + (Xij – mj ) oodchylka od celkového průměru = odchylka od skupinového průměru + odchylka skupinového průměru od celkového průměru n… odchylky umocněné na druhou = cesta k rozptylu oSSTotal = SSBetween (A, treatment) + SSWithin(Error) oMSTotal; MSError; MSA Velikost účinku (efektu) oPodobně jako u regrese chceme vědět, jaká část rozptylu závislé je vysvětlená nezávislou oEkvivalentem R 2 je u anovy h2 (eta) nh2=SSBetween/SSTotal nPoněkud přesnější je w2 = (SSBetween –dfBetween.MSWithin)/(SSTotal + MSWithin) oPro konkrétní rozdíl průměrů dCoh = m1-m2/√MSWithin o oVelikost účinku je vždy třeba uvádět Předpoklady použití ANOVY onormální rozložení uvnitř skupin npři nj>30 a n1=n2=…=nj je ANOVA robustní ostejné rozptyly uvnitř skupin: homoskedascita ndo smax/smin<3 je ANOVA robustní, zvláště při n1=n2=…=nj onezávislost všech pozorování npři opakovaných měřeních je třeba použít ANOVU pro opakovaná měření o oviz Hendl 343 Post-hoc testy (simultánní porovnávání) oPo (a pouze po) prokázání „nějakých“ rozdílů mezi průměry obvykle chceme vědět, mezi kterými skupinami konkrétně rozdíly jsou: post-hoc testy oSrovnáváme každou skupinu s každou způsobem, který nezpůsobí nárůst a. oJe-li důležité udržet a pod kontrolou, pak je správnou volbou Scheffeho test – volba pro rybaření oPokud to není tak kritické a máte-li pár kvazi-hypotéz na mysli, pak je volbou Student-Neuman-Keuls (S-N-K) oExtrémně „dajný“ a nepříliš vhodný pro více než 3 skupiny je LSD a proto se nedoporučuje. Další varianty a rozšíření ANOVA oANOVA pro opakovaná měření (jako párový t-test) oANOVA s 2 a více faktory (faktoriální ANOVA) oMANOVA – s více závislými proměnnými n oTo vše v SPSS skryto pod GLM – general linear model o oPořadovou (neparametrickou) alternativou ANOVY jsou n Kruskal-Wallis H: H0: Md1=Md2=…=Mdj H1: Md1≠Md2 ≠ … ≠ Mdj nJonckeheere-Terpstra Test: H1: Md1≤Md2 ≤ … ≤ Mdj AJ: repeated measures ANOVA, two(three..)-way ANOVA,(factorial ANOVA)