Cíle předmětu
Statistická analýza dat II. navazuje na PSYb1170 a rozšiřuje statistické znalosti a dovednosti studentů tak, aby byli schopni:
1. realizovat vlastní analýzu dat s využitím statistického software (zde IBM SPSS),
2. uvažovat ve svých analýzách i modely s více než dvěma proměnnými
Ad 1. Statistický software výrazně zrychluje výpočty. To bohužel ale neznamená, že analýza je rychleji hotová. Zatímco při ručně počítané analýze je člověk motivován k veškerým možným zjednodušením ve smyslu složitosti použitého modelu (či srovnání) , množství zohledněných, potenciálně intervenujících proměnných, a důslednosti v kontrole naplnění předpokladů použitých postupů, statistický software nám umožňuje se soustředit na dosažení co nejvyšší statistické validity. To znamená snahu o nalezení právě té statistiky či o testování přesně té hypotézy, která je nejlepší, nejméně zkreslenou a nejpřesnější odpovědí na naši výzkumnou otázku. S tím je pak následně spojena otázka, jak takový proces a jeho výsledky popsat - reportovat ve zprávě o analýze - typicky v sekcích Výsledky , Metoda a Diskuze ve struktuře IMRaD. S tím je spojena řada konvencí, které si mají studující za úkol v tomto předmětu osvojit. Díky reportovacím konvencím čtenář analýze snadněji porozumí, může jí více důvěřovat a má menší potřebu se ptát. Znalost výše uvedeného je samozřejmě užitečná i v roli čtenáře empirických výzkumů v psychologii.
Ad 2. I velmi jednoduché výzkumné otázky v psychologii je obvykle těžké zredukovat na pouhé dvě proměnné (např. závislou a nezávislou). Proto patří do základů statistické analýzy dat i regresní modely s více prediktory spolu se znalostí toho, jaké role mohou v modelu různé prediktory hrát a jak pak výsledky interpretovat. To zahrnuje i schopnost pracovat s různými typy prediktorů, nejen se spojitými, ale i kategorickým. A protože i závislé proměnné mohou být více typů, zahrnuje předmět také logistickou regresi jako nejjednoduššího zástupce modelů pro závislé proměnné, které nejsou spojité. I zde platí, že předpokládané využití bude častěji pasivní, tj. při čtení výzkumných článků.
Časový harmonogram
Předmět se skládá ze 6 tematických bloků. S každým se pojí jedna přednáška a seminář. Přednáška představuje analytické postupy a modely včetně postupu v SPSS. Na konci přednášky je zadán seminární úkol pro skupinové zpracování. Semináře budou věnovány zpětné vazbě na seminární úkoly a nápravě nejproblematičtějších prvků.
Druhá a třetí seminární skupina následují týden po přednášce a jejich termín pro odevzdání seminárního úkolu je neděle před seminářem. První seminární skupina bude mít na zpracování úkolu o týden více - proběhne k danému tématu dva týdny po přednášce. Jejich termín je také neděle před seminářem.
Průběžný semestrální test proběhne na začátku 2. přednášky, tj. 7. října. Náhradní termín bude v čase posledního přednáškového termínu, tj. 16.12.
Přednášky
Aby bylo možné do přednáškového času dostat i praktické ukázky analýzy, poskytují přednášky pouze základní teoretické prvky probíraných statistických modelů. Proto se hodně odkazují do Fieldovy učebnice. Jednotlivé kapitoly této interaktivní osnovy poskytují také vodítka pro práci s učebnicí. Analýza předvedená na přednášce bude východiskem pro zpracování seminárního úkolu. S tím mohou pomoci videa z doby covidu a také videa na YouTube kanále Andyho Fielda (https://www.youtube.com/@ProfAndyField)
Semináře
Na seminářích budeme společně diskutovat seminární analýzy. Nepředpokládáme, že odevzdané verze analýz budou perfektní, ale měly by být pokuse o co nejlepší analýzu. Čím méně se budeme zabývat základními prvky, trivialitami, tím více času budeme mít na ty skutečně obtížně, nebo často pomíjené prvky. S ohledem na to jsou seminární práce hodnoceny pouze na stupnici přijato-nepřijato - jako nepřijaté budou hodnoceny pouze práce, které nezvládly základní prvky úlohy a nemělo by smysl je na semináři diskutovat.
Seminární úkoly a úlohy k procvičování plní důležitou roli tréninku a získávání zkušeností. I když rozumím tomu, jak tu kterou analýzu udělat, její realizace je spojena se spoustou kroků a možných zádrhelů. To je potřebné natrénovat a získat zkušenosti s řešením různých praktických problémů. Seminární úkoly budete zpracovávat v čtyřčlenných skupinách. Důvod pro skupinky je dvojí. Jednak bychom nedokázali poskytovat zpětnou vazbu na 120 analýz. Důležitější je ale to, že ve skupině se můžete doplňovat a sdílet své znalosti a dovednosti. Není dobré si ale práci dělit - dělení práce dělí i zkušenosti. Ideální je řešit to společně, jak jen to vaše odlišné rozvrhy dovolí.
Rozpis pracovních skupin na semináře je zde
S ohledem na diskuzní charakter seminář je žádoucí si udělat reflexi toho, čím jste si při řešení nebyli listí, co bylo problematické, a zeptat se na to, pokud se na to samo v diskuzi nedostane. Předpokládáme zároveň, že všichni členové v pracovní skupině budou ve své analýze zorientovaní, aby ji byli schopni diskutovat či stručně prezentovat.
Je dobrý nápad si nosit svůj notebook a pracovat na něm, protože nás bude na semináři opravdu hodně. (Počítejte ale prosím s tím, že závěrečná zkouška bude na počítačích v PC25/26).
Semináře jsou povinnou součástí výuky. Toleruje se jedna neúčast. Případnou neúčast na semináři omlouvejte prosím standardně podle SZŘ.
Software
Budeme pracovat se statistickým software IBM SPSS ve verzi 29. SPSS si může každý student nainstalovat na svůj počítač z https://inet.muni.cz/app/soft/licence. Nezapomeňte po instalaci SPSS autorizovat, návod na autorizaci je pod odkazy na stažení instalačního souboru v sekci Nápověda.
Každá verze SPSS má nějakou otravnou chybu. Ve verzi 29 je to to, že občas přestane SPSS produkovat jakékoli výstupy. Můžete klikat a zadávat příkazy, můžete používat syntax, ale výsledkem v okně Output není vůbec nic, ani (a to je to neobvyklé) žádná chybová hláška. Jde o chybu související s automatickým zálohováním všech souborů, které má SPSS defaultně zapnuté. Pokud se vám stane, že SPSS přestane cokoli produkovat, nezoufejte, situace má řešení. Stačí v syntaxu zadat příkaz OMSEND. a spustit ho. Nezapomeňte na tu tečku! Překvapivě se zdá, že právě ta zpropadená tečka je zdrojem problému. SPSS to zálohování spouští pomocí syntaxu, který vám neukazuje, ale zapisuje ho do žurnálovacího souboru. A když se tato chyba vyskytne, je příkaz OMSEND zaznamenaný v žurnálu bez tečky. Proč tečka chybí v naprosto náhodných případech, nevíme.
Literatura
Základní učebnicí pro tento předmět je Field, 6. vydání (dále jen [F]). Website knihy s užitečnými materiály naleznete zde https://discoverspss.com/. Field, A.: Discovering statistics using SPSS, 6th Ed. Sage, 2024. Páté vydání knihy je také použitelné.
Pro komunikaci výsledků ve zprávách, nebo sekcích "Výsledky" v článcích nebo diplomkách je důležité se držet konvencí a doporučení uvedených v následujících publikacích:
Morgan, S. E., Reichert, T.,
Harrison, T. R.: From numbers to words.
Reporting statistical results for the social sciences. Allyn & Bacon,
2017. [MRH]
American Psychological
Association:. Publication manual of the American Psychological Association : the official guide to APA style , 7th Ed. Washington, DC, 2020. [APA]
Hodnocení
Pro úspěšné zvládnutí předmětu bude potřeba:
- Mít přijaty všechny seminární úkoly. Ty jsou hodnoceny pouze na škále přijato/nepřijato. Dostáváte na ně zpětnou vazbu souhrnně na semináři. Je možná oprava jednoho nepřijatého seminárního úkolu.
- Absolvovat průběžný semestrální test v první třetině semestru - maximum je 20b
- Absolvovat zkoušku. Zkouška bude mít teoretickou a praktickou část, každá za 30b. Teoretická i praktická část testují znalosti z celého semestru. Obě části zkoušky mají stanovené minimum - 15b. Při nedosažení minima je nutné danou část zkoušky opakovat.
Hodnotící stupnice je A >= 65b, B >= 60b, C >= 55b, D >= 50b, E >= 45b, F < 45b.