Statistická analýza dat II.

Týden 8 - Seminář 4 - Logistická regrese


Průběžný test

Průběžný test ověřuje teoretické znalosti z okruhu 1 (čtení z Fielda popsané v Interaktivní osnově pro 1. přednášku a seminář), který je opakováním a rozšířením základů statistické analýzy. Je možné v něm získat 10 bodů.

Seminární skupina 2 absolvuje průběžný test o týden dříve po přednášce.

Zadání seminárního úkolu
Zpracujte následující analýzu:
Data: Opět EU Kids online. Tentokrát budeme pracovat s celým datovým souborem bez ohledu na zemi.
ZP: Vlastnictví účtu na nějaké sociální síti (QC313, nezapomeňte, že data popisují situaci před 10 lety).
Prediktory:
Věk dítěte (QP201). Předpokládáme, že starší děti budou mít spíše účet.
Množství rad ohledně bezpečného užívání internetu, které dítě obdrželo z různých zdrojů. Proměnné QC339a-g udávají přítomnost rad z různých zdrojů - udělejte si z nich součtovou proměnnou vyjadřující počet zdrojů, z nichž dítě dostalo rady. Můžete posoudit konzistenci odpovídání podle QC339h. Budeme předpokládat, že rady mají spíše odrazující podobu a efekt.
Otestujte i H, že čím je dítě starší, tím menší dopad rady mají.


Odevzdejte textový dokument se zprávou o analýze, která bude mít podobu sekce výsledky v souladu s doporučeními APA manuálu a příručky Morganové a kol.. Zpráva bude obsahovat:

  • stručné představení dat, vzorku, na kterém byla data získána, a použitých metod měření (velmi stručná verze sekcí Vzorek a Metody),
  • kroky provedené v rámci přípravy dat (čištění, počítání nových proměnných),
  • informace o chybějících datech a strategii, jak se s nimi naložilo v regresním modelu,
  • popisné statistiky všech proměnných použitých v analýze i s korelační maticí, či jiného sdělení vztahů mezi proměnnými
  • zdůvodnění specifikace modelu  (zde lze zmínit i transformace či jiné způsoby řešení problémů s případnou nelinearitou vztahů)
  • popis modelu s tabulkou parametrů a jeho hodnocení prizmatem klesajícího loglikelihoodu a klasifikační tabulky
  • zhodnocení naplnění předpokladů regresního modelu a případných omezení, které z toho mohou plynout, též zmínění outlierů a vlivných případů.
  • stručnou interpretaci a diskuzi smyslu výsledků

Formát. Minimum je na slajdech 38 a 39 v prezentaci z první přednášky. Pamatujte na 11. přikázání - NEZKOPÍRUJEŠ TABULKU ZE SPSS!

Odevzdejte také skript/syntax (.sps), jehož spuštěním vzniknou výsledky, které prezentujete ve své zprávě. Nejlépe je to vložit do odevzdávány jako jeden .zip pojmenovaný podle vzoru U4_S3_Bílek_Fialová_Zelená.zip. 

Pro zprávu využijte šablonu uloženou ve studijních materiálech zde.

Na vypracování je týden od semináře. Termín odevzdání je ve středu následující po tomto semináři pro skupinu S02 a v úterý pro seminární skupiny S01 a S03 .