Autoři: Jméno1 (UČO) Jméno1 (UČO) Jméno1 (UČO) Název: Úkol 1 Předmět: Statistická analýza dat II., PSYb2520 Datum odevzdání: 12. 12. 2018 Seminární skupina: 01 Úvod[A1] Stručné představení kontextu, ve kterém budete dělat analýzu, a otázky, na kterou budete hledat odpověď. Zastupuje vlastně celé Introduction ze struktury empirického výzkumného článku. Stačí jedna-dvě věty typu Analýza se zabývá pamětí na zvuky u lidí obecně a nás zajímat, jestli ji ovlivňuje oční vada. Myslíme si, že když má člověk obtížně korigovatelnou oční vadu, měla by se kompenzačně zlepšit funkce sluchu, což se projeví lepší pamětí na zvuky. Metoda Zde uveďte zdroj dat. Používáme data získaná v rámci projektu XX (Netopejr et al., 2020), dostupná online na http://projekt.pazvuky.cz. Vzorek Představení dat začíná stručným shrnutím toho, kolik účastníků tvořilo vzorek a z jaké populace byli vybíráni. Když zmíníte i způsob výběru, nebude to na škodu. V článku tohle obvykle zabere půl i více strany, ale pro účely PSYb2520 stačí opět jedna-dvě věty. Metody Opět stačí jen stručně uvést, jak vznikla data, která analyzujete. Někdo pozoroval, zaznamenával chování, administroval dotazník/test, použil nějaký měřící přístroj, atd. V případě experimentů se hodnoty některých proměnných účastníkům přiřazují (manipulace), obvykle zařazením do skupin, které pak procházejkí odlišnými procedurami. I když to bývá v článcích zmíněno v samostatně sekci, v tomto úkolu to stačí stručně uvést zde. Např. přítomnost oční vady byla zjišťována testem zraku XY. Paměť na zvuky byla zjišťována tak, že účastníkům bylo přehráno 10 zvuků, které si měli zapamatovat. Potom se jim jeden po druhém pouštělo 20 zvuků a oni měli určovat, zda jde či nejde o jeden z těch 10 zapamatovaných. Počet správně rozpoznaných zvuků je skór paměti. Příprava dat[A2] Uveďte, jaké kroky jste podnikli v rámci čištění/filtrování dat. To, že je tato infomace v sekci Metoda a ne v sekci Výsledky, znamená, že je zde kladen důraz na plánování těchto kroků před vlastní analýzou. Např. nepřípustné hodnoty uvedených proměnných budou nahrazeny kódem pro chybějící hodnoty. Odlehlé hodnoty, za které budeme považovat hodnoty o 3 SD nižší než průměr vzorku, budou považovány za chybějící hodnoty, protože pravděpodobně reprezentují chybné porozumění instrukcím či ztrátu koncentrace. Analytická strategie[A3] Stručně, jak na to půjdete. Reálně se v této sekci uvádí pouze to, co by čtenář nemusel čekat, to, co je nad rámec samozřejmosti. Ale co je samozřejmé, se trochu proměňuje. Např. Klíčovou hypotézu testujeme Welchovým t-testem. V případě pochyb ohledně normality doplňujeme analýzu o bootstrapové intervaly spolehlivosti. Výsledky Chybějící data[A4] Kolik hodnot chybí v které proměnné a proč(asi). Co s tím děláte, jestli vůběc něco. Jaká je kvůli tomu efektivní velikost vzorku. Popisné statistiky Popisné statistiky všech proměnných použitých v analýze. Pokud jde jen o pár statistik, dávají se spíše do věty než do tabulky. Samotná tabulka nestačí, obvykle je dobré okomentovat tvar rozložení, který ze statistik není moc patrný (a histogramy obvykle nereportujeme). Testy hypotéz[A5] Zde uvedeme testované hypotézy (normálním jazykem) a uvedeme statistiky, které hypotézy reprezentují (pokud nejsou zřejmé už z popisných statistik, jako třeba při porovnávání průměrů). Zde je místo také pro vyjádření (standardizované) velikosti účinku, třeba i s intervalem spolehlivosti. Uvedeme výsledky testování hypotéz a vyjádříme se k předpokladům použitého testu. Nemusí to být dlouhé. Například u t-testu se většina vejde do jedné věty + věta s hypotézou a věta o předpokladech. Časem toho zde bude více, vč. tabulek. Formát prezentace výše uvedených informací je nejstručněji pro jednoduché testy popsán v Morganové či Fieldovi (radí to, co APA). I když se v časopisech s grafy šetří, zobrazte data pro každou hypotézu vhodným grafem (scatterplot, sloupcový/čárový graf s chybovými úsečkami, kontingenční tabulka). Diskuse Krátce shrňte, co jste se dozvěděli – zvažte jak velikost účinku, tak výsledek statistického testování. Uveďte, zda podle vás něco brání tomu, abychom výsledku věřili – zaměřte se na statistické obavy (outlieři, nepřesnost, nesplněné předpoklady apod.), ty metodologické budeme probírat na PSYb1120. ________________________________ [A1]Šablona je založena na Appelbaum, M., Cooper, H., Kline, R. B., Mayo-Wilson, E., Nezu, A. M., & Rao, S. M. (2018). Journal article reporting standards for quantitative research in psychology: The APA Publications and Communications Board task force report. American Psychologist, 73(1), 3–25. https://doi.org/10.1037/amp0000191 Modrý text je k náhradě. [A2]Describe planned data diagnostics, including • Criteria for post-data collection exclusion of participants, if any • Criteria for deciding when to infer missing data and methods used for imputation of missing data • Defining and processing of statistical outliers • Analyses of data distributions • Data transformations to be used, if any [A3]Describe the analytic strategy for inferential statistics and protection against experiment-wise error for • Primary hypotheses • Secondary hypotheses • Exploratory hypotheses [A4]Missing data • Frequency or percentages of missing data • Empirical evidence and/or theoretical arguments for the causes of data that are missing, for example, missing completely at random (MCAR), missing at random (MAR), or missing not at random (MNAR) • Methods actually employed for addressing missing data, if any [A5]Inferential statistics, including • Results of all inferential tests conducted, including exact p values if null hypothesis statistical testing (NHST) methods were employed, including reporting the minimally sufficient set of statistics (e.g., dfs, mean square [MS] effect, MS error) needed to construct the tests • Effect-size estimates and confidence intervals on those estimates that correspond to each inferential test conducted, when possible • Clear differentiation between primary hypotheses and their tests–estimates, secondary hypotheses and their tests–estimates, and exploratory hypotheses and their test–estimates Report any problems with statistical assumptions and/or data distributions that could affect the validity of findings.