Statistická analýza dat II.

Analýza rozptylu


Analýza rozptylu

Analýza rozptylu, F-test, sumy čtverců. Přepoklady ANOVy. Plánované kontrasty (ortogonální, neortogonální, polynomiální) a post hoc testy.  Faktoriální analýza rozptylu, model a parametry. Fixované a náhodné faktory, hlavní efekty a interakce faktorů, výhody vyváženého designu, kontrasty a post-hoc testy. Velikost účinku v kontextu ANOVy - éta, omega, parciální. Specifika reportování ANOVy.  Analýza kovariance, analýza rozptylu s opakovanými měřeními,  MANOVA.

Stream z dnešní přednášky : https://cesnet.zoom.us/j/97702935302?pwd=RWhjc0RnMmRCcnhCOFdkV29LTVkyUT09


Literatura: [F] kap. 12, 14, 13 a začátky kapitol 15(.1-.3), 16(.1-.5) a 17(.1-.2); [MRH] 55 – 68


Příklady studií:

Imhoff, R., & Banse, R. (2011). Implicit and explicit attitudes toward ex-partners differentially predict breakup adjustment. Personal Relationships, 18(3), 427–438. http://doi.org/10.1111/j.1475-6811.2010.01308.x


Komentáře ke čtení Fielda:

Kapitola 12 GLM1 představuje analýzu rozptylu. Kromě sekcí 12.8 a 12.9 není nic k přeskočení, vše je relevantní. Pokud už jste uvěřili, že ANOVA je jen převlečená regrese, můžete začít sekcí 12.2.1. Na s. 548 je přehled kontrastů nabízených SPSS. Protože SPSS samo je nevysvětluje, je dobré si sem dát záložku.

Kapitola 13 o Ancově. Četl bych ji rychle až po kapitole 14, protože přidání spojité nezávislé proměnné (kovariátu) je snáze srozumitelné, když už vím, že v modelu ANOVA může být více nezávislých proměnných. Není nutné ANCOVu zvládnout jako samostatný model. Stačí vědět, že je to totéž, co regresní model, v němž mám kategorický i spojitý prediktor. Tradičně je termínem ANCOVA pojmenován model, v němž je jeden nebo více faktorů, které mají interakce, a jeden spojitý kovariát, který nemá interakci s těmi faktory. Tomu odpovídá výchozí nastavení modelu v SPSS UNIANOVA. Nic nám ale nebrání kliknout na tlačítko "Model" a ručně přidat interakci mezi kovariátem a faktorem, nebo ubrat interakce mezi faktory. Pak už modelu nebudeme říkat ANCOVA a možná se bude kvůli interakcím obtížně interpretovat, ale můžeme ho tak specifikovat. Benefitem ANCOVy má být právě nezávislost efektu kovariátu a faktoru, což nám vlastně umožňuje interpretovat efekt faktoru bez ohledu na kovariát (ten má jen zajistit větší sílu testu). Pokud jsme faktorem experimentálně (náhodně) manipulovali, měla by být podmínka naplněna. Pokud není, nemůžeme na kovariát v interpretaci zapomenout, ale neznamená to, že bychom model neměli dělat. Podobně se to má s homogenitou regresních směrnic (=absence moderace mezi kovariátem a faktorem). Většina kapitoly 13 by po přečtení kapitoly 14 měla být jen opakováním.

Kapitola 14 o faktoriální ANOVě je druhou základní kapitolou v tomto tématu. Vedle vysvětlení matematické stránky faktoriální ANOVY si všimněte také toho, že se zde obvykle mluví o manipulovaných faktorech. Ne, že by ANOVA nefungovala s faktory, které jsme je změřili (např. pohlaví), ale jejich efekt pak závisí na ostatních proměnných v modelu a my musíme jejich efekt reportovat vždy s alespoň implicitním odkazem na celý model (jako v regresi). Když se v této kapitole vysvětluje interakce, určitě si ji spojte s moderací - je to konceptuálně to samé. Oba termíny se v současné době používají jak v regresi, tak v kontextu ANOVy - interakce je obecnější termín, moderací se míní interakce, kde alespoň jedna z proměnných je spojitá. Výpočty sum čtverců vypadají odpudivě, ale nebojte se jich, princip je jednoduchý; alespoň jednou byste měli zažít pocit, že to chápete (pak to můžete zase klidně zapomenout). Simple efekty můžete pominout, stejně jako podkapitolky 14.8 a 14.9.

Z kapitol 15,16 a 17 si přečtěte jen začátky (podkapitolky uvedené v seznamu výše). Jde je o to vědět, k čemu ty analýzy jsou. 



Video k semináři: 

Zadání seminární práce

Zpracujte následující analýzy podle zadání ze semináře: 
PPT se zadáním: zde
Data: zde


Odevzdejte textový dokument se zprávou o analýze, která bude mít podobu sekce výsledky v souladu s doporučeními APA manuálu a příručky Morganové a kol.. Zpráva bude obsahovat:

  • stručné představení dat, vzorku, na kterém byla data získána, a použitých metod měření (velmi stručná verze sekcí Vzorek a Metody),
  • kroky provedené v rámci přípravy dat (čištění, počítání nových proměnných),
  • informace o chybějících datech a strategii, jak se s nimi naložilo v ANOVě,
  • popisné statistiky všech proměnných použitých v analýze 
  • zdůvodnění specifikace modelu  
  • popis modelu (s tabulkou analýzy rozptylu v případě faktoriální anovy)
  • grafické zobrazení průměrů i intervaly spolehlivosti
  • zhodnocení naplnění předpokladů a případných omezení, které z toho mohou plynout, též zmínění outlierů.
  • stručnou interpretaci a diskuzi smyslu výsledků

Formát. V tradici ANOVy píšeme co nejvíce informací v textu; nezapomeňte na omegy. Pamatujte na 11. přikázání - NEZKOPÍRUJEŠ TABULKU ZE SPSS! 

Odevzdejte také skript/syntax (.sps), jehož spuštěním vzniknou výsledky, které prezentujete ve své zprávě. Nejlépe je to vložit do odevzdávány jako jeden .zip pojmenovaný podle vzoru U5_S3_Bílek_Fialová_Zelená.zip. 

Pro zprávu využijte šablonu uloženou ve studijních materiálech zde.

Na vypracování je týden od semináře. Termín odevzdání je ve středu následující po tomto semináři.