PSYb1170 Statistická analýza dat

Fakulta sociálních studií
jaro 2020
Rozsah
1/1/0. 6 kr. Ukončení: zk.
Vyučující
doc. Mgr. Stanislav Ježek, Ph.D. (přednášející)
Mgr. Karel Rečka (cvičící)
Mgr. Jan Širůček, Ph.D. (cvičící)
Mgr. Adam Ťápal, M.A. (cvičící)
Garance
doc. Mgr. Stanislav Ježek, Ph.D.
Katedra psychologie – Fakulta sociálních studií
Kontaktní osoba: doc. Mgr. Stanislav Ježek, Ph.D.
Dodavatelské pracoviště: Katedra psychologie – Fakulta sociálních studií
Rozvrh
St 8:00–9:40 P31 Posluchárna A. I. Bláhy
  • Rozvrh seminárních/paralelních skupin:
PSYb1170/01: St 10:00–10:50 exP21, J. Širůček
PSYb1170/02: St 11:00–11:50 exP21, A. Ťápal
PSYb1170/03: St 12:00–12:50 PC25, K. Rečka
PSYb1170/04: St 13:00–13:50 PC25, S. Ježek
Předpoklady
! PSY117 Statistická analýza dat
Omezení zápisu do předmětu
Předmět je určen pouze studentům mateřských oborů.
Mateřské obory/plány
předmět má 18 mateřských oborů, zobrazit
Cíle předmětu
Cílem předmětu je seznámit studenty se základy statistiky používané v psychologické praxi a výzkumu a běžném životě. Studenti získají statistickou gramotnost – porozumění základním statistickým a pravděpodobnostním myšlenkám a dovednost je aktivně i pasivně používat. Studenti získají dovednost připravit data pro statistické zpracování, spočítat základní statistiky, otestovat běžné typy hypotéz. Kurz klade důraz i na komunikaci, tj. slovní popis výsledků i schopnost porozumět takto popsaným výsledkům v empirických studiích. V rámci kurzu budou studenti seznamováni paralelně s českou i anglickou terminologií, aby byli po skončení kurzu schopni dále studovat a používat internetové zdroje.
Výstupy z učení
Student bude po absolvování předmětu schopen:
- kódovat a uspořádat data do datové matice ve formátu použitelném napříč různými statistickými programy
- popsat rozdělení hodnot proměnnné pomocí základních popisných statistik, parametrických i neparametrických
- vytvořit základní typy zobrazení rozdělení hodnot proměnné
- statisticky konceptualizovat vztah mezi proměnnými, popsat jej statistikami i graficky
- usuzovat z výběrových statistik na populační parametry; vytvořit intervaly spolehlivosti pro základní popisné statistiky
- otestovat elementární statistické hypotézy pomocí NHST s vědomím limitů tohoto postupu
- využít lineární regresní model s jedním prediktorem pro predikci
- s pomocí podmíněných pravděpodobností počítat ukazatele diagnostické úspěšnosti testů.
Osnova
  • 1. Proměnné. Data, proměnné, úrovně měření, kvalita měření, organizace dat, kontrola dat, datová matice a kódování.
  • 2. Zobrazování dat, četnosti, rozdělení četností. Tabelace dat, šíře intervalů, minimum, maximum, odlehlá hodnota, absolutní a relativní četnosti, kumulativní absolutní a relativní četnosti, rozložení četností, tvary rozložení, normální (Gaussovo) rozložení, velikosti oblastí pod křivkou normálního rozložení, Poissonovo rozložení, graf absolutních a relativních četností, sloupcový graf, histogram.
  • 3. Míry centrální tendence a variability. Modus, medián, průměr, vážený průměr, vhodnost použití různých měr centrální tendence, (variační) rozpětí, kvartilové rozpětí, směrodatná odchylka, rozptyl, z-skóry a další standardní skóry, percentily, šikmost, špičatost, krabicový graf s anténami.
  • 4. Vztahy mezi proměnnými. Korelace – Pearsonův, Spearmannův, Kendallův koeficient a jejich vlastnosti. Koeficient determinace, kovariance. Kontingenční tabulka, marginální četnosti. Lineární vztah, monotónní vztah, pozitivní a negativní vztah. Těsnost vztahu. Bodový graf. Parciální korelace.
  • 5. Lineární regrese. Statistická predikce, lineární vs. nelineární regrese, odhad, modelování, reziduum, prediktor, zdroje variability, stanovení regresní přímky metodou nejmenších čtverců, regresní rozptyl a reziduální rozptyl, koeficient determinace jako ukazatel úspěšnosti regrese, homoskedascita.
  • 6. Pravděpodobnost. Pojetí pravděpodobnosti, počítání s pravděpodobnostmi, náhodné jevy, podmíněné pravděpodobnosti, Bayesův teorém, normální rozdělení a další běžná rozložení.
  • 7. Statistická indukce, intervalové odhady. Vzorek(výběr), statistiky vs. parametry, výběrová rozložení, centrální limitní teorém, směrodatná chyba (průměru), výběrové rozložení průměru, relativní četnosti, rozptylu, bodové vs. intervalové odhady.
  • 8. Testování hypotéz. Statistická(nulová) hypotéza, výzkumná (alternativní) hypotéza, jednostranná vs. oboustranná hypotéza(test); Bayesovský přístup k testování hypotéz vs. Fisherovský a Pearson-Neymanovský (tradiční) přístup, úroveň(hladina) statistické významnosti, chyba I. a II. typu a jejich pravděpodobnost, (statistická) síla testu, jednovýběrový t-test, dvouvýběrový t-test (pro nezávislé výběry), párový t-test (z-test), testování korelačního koeficientu, velikost efektu, Cohenovo d.
  • 9. Testy pro nominální a ordinální proměnné. Parametrické vs. neparametrické testy, znaménkový test, test relativních četností, test dobré shody, závislost kategoriálních proměnných, Wilcoxonovy testy, Mann-Whitney U.
  • 10. Analýza rozptylu. Problém s prováděním většího počtu testů, rybaření v datech, Bonferroniho korekce, princip analýzy rozptylu, rozptyl mezi skupinami , rozptyl uvnitř skupin, statistika F, analýza rozptylu s jedním faktorem (one-way), předpoklady analýzy rozptylu, post-hoc testy, velikost účinku.
Literatura
    povinná literatura
  • HOWELL, David C. Statistical methods for psychology. 8th ed. Belmont, CA: Wadsworth Cengage Learning, 2013, xix, 770. ISBN 9781111840853. info
    neurčeno
  • HENDL, Jan. Přehled statistických metod : analýza a metaanalýza dat. Páté, rozšířené vydán. Praha: Portál, 2015, 734 stran. ISBN 9788026209812. info
Výukové metody
přednáška, demonstrace řešení problémů, skupinová diskuze, kritické čtení, domácí cvičení, online diskuze
Metody hodnocení
Průběžné hodnocení
V průběhu semestru budou na semináře zařazeny tři krátké průběžné desetiminutové testy. V každém bude možné získat 10b. Termíny průběžných testů jsou uveden v interaktivní osnově kurzu. Množství bodů z průběžných testů, které se bude počítat do celkového hodnocení, se počítá podle následujícího excelovského vzorce: =ZAOKROUHLIT((SUMA(P1;P2;P3)-MIN(P1;P2;P3))*1,5;0). Tento výpočet eliminuje jedno zakolísání směrem dolů (včetně případné absence). Proto se na průběžné testy náhradní termíny neposkytují.
Seminární práce
Za týmovou seminární práci lze získat 10b.

Zkouška
Kurz je zakončen zkouškou. Zkouška má písemnou podobu (papír-tužka-kalkulačka) a je možné za ni získat 50b. K úspěšnému složení zkoušky je nutné získat minimálně 30b. Zkouší se v rozsahu látky, který je vymezen v tomto sylabu a interaktivní osnově k předmětu PSYb1170.

Celkové hodnocení
Celkem lze v průběhu kurzu získat 40b a za závěrečnou zkoušku lze získat 50b. K úspěšnému absolvování je potřeba dosáhnout alespoň 55% úspěšnosti. Celkové hodnocení tedy bude používat následující stupnici:
A: 90 - 80b B: 79 – 73b C: 72 – 68b D: 67 – 63b E: 62 – 58b F: 57 a méně bodů.
Navazující předměty
Informace učitele
Uznávání dříve absolvovaných kurzů statistiky
1. Ekvivalentní kurzy dříve absolvované na katedře psychologie FSS budou uznávány v plné míře. Své žádosti o uznání v takovém případě směřujte na studijní oddělení.
2. Kurzy absolvované jinde než na Katedře psychologie FSS budou uznávány tou formou, že jejich absolventi nebudou povinni plnit požadavky na práci v semestru (seminární práce, průběžné testy) a bude jim za ně započítán plný počet bodů. I nadále jsou však povinni absolvovat závěrečnou zkoušku. Žádosti o uznání v tomto případě zasílejte na mail jezek@fss.muni.cz. V předmětu zprávy použijte „uznani PSYb1170“ (bez diakritiky). V textu stačí uvést kód absolvovaného předmětu na FSS. V případě žádosti o uznání kurzů z jiné fakulty či univerzity, uveďte též odkaz na sylaby absolvovaných kurzů, popř. sylaby přímo přiložte. Žádosti zasílejte do konce 2. týdne semestru. Později zaslaným žádostem nebude vyhověno.
Další komentáře
Předmět je vyučován každoročně.
Cvičení je děleno na tři skupiny.
Nachází se v prerekvizitách jiných předmětů
Předmět je zařazen také v obdobích jaro 2021, jaro 2022, jaro 2023, jaro 2024, jaro 2025.