• PŘEHLED KURZU SEZNÁMENÍ SE SPSS PSY252 – Statistická analýza dat II 1. setkání DNEŠNÍ PROGRAM Představení kurzu Představení zdrojů Učebnice Data Představení SPSS a základních analýz CÍLE KURZU Získat praktickou schopnost provádět statistické analýzy s více než 2 proměnnými Rozumět prezentovaným výsledkům Korektně komunikovat výsledky analýz PŘEHLED TÉMAT Seznámení se SPSS Opáčko – analýzy z minulého semestru Lineární regrese Logistická regrese Analýza rozptylu Víceúrovňový lineární model POŽADAVKY A ZKOUŠKA Zpracování všech průběžných úkolů (trojice) Na každý seminář, nebodováno Vstupní test – teorie statistické indukce (cca Field kap. 2) Průběžný test Opakování, okruh č. 1 Cvičné testy v ISu, budou rozšířeny Zápočtový test Teoretické znalosti, termíny Zkouška Během hodiny a půl vypracovat zprávu z analýzy na počítači Se všemi zdroji, vč. googlení UČEBNICE •Field, A.: Discovering statistics using SPSS, 4th 5th •http://www.statisticshell.com/ •http://www.uk.sagepub.com/field4e/study/default.htm • •Morgan, S. E., Reichert, T., Harrison, T. R.: From numbers to words. Reporting statistical results for the social sciences. Allyn & Bacon, 2002. American Psychological Association. (2001). Publication manual of the American Psychological Association (6th ed.). Washington, DC: Author. https://scontent-fra3-1.xx.fbcdn.net/hphotos-xpf1/v/t1.0-9/11903886_10204948324809101_2768297236246 882883_n.jpg?oh=528e0c3426d56998075b3bdc7c474651&oe=569DC3FD OPÁČKO S FIELDEM Nelze všechno přečíst hned, projděte na test. Kap 1 – popisná statistika Kap 2 – statistická indukce Kap 3 – seznámení se SPSS Kap 4 – Vyrábíme grafy Kap 5 – Kontrolujeme předpoklady testů Kap 6 – Neparametrické testy Kap 7 – Korelace Kap 9 – t-testy Kap 18 – Chí-kvadrát DATA Long2 – prof. Macek, adolescenti, 2 kohorty EU Kids Online – celoevropský průzkum a vlastní data… PŘÍKLADY ZDROJŮ DAT (g: „free data sets“) https://toolbox.google.com/datasetsearch http://lib.stat.cmu.edu/cgi-bin/dasl.cgi?query=Psychology&submit=Search!&metaname=topics&sort=swis hrank (data v textové podobě v odkazu za Datafile Name:“ http://www.amstat.org/publications/jse/jse_data_archive.htm StatSci.org – metazdroj - http://www.statsci.org/datasets.html http://www.kdnuggets.com/datasets/index.html - metazdroj http://www.cessda.org/ (Některá data na objednávku, jiná přímo ke stažení) https://openfmri.org/data-sets - Volná data z funkční magnetické rezonance SPSS Nainstalovat z inet.muni.cz Import a export dat Datová matice a orientace v datech Data, output, syntax Transformace proměnných Popisné statistiky Grafy SPSS - IMPORT A EXPORT DAT .sav – nativní formát dat SPSS, obsahuje hodně metadat .csv – obvyklý textový formát – hodnoty oddělené středníkem, destinná čárka, kromě názvů proměnných na 1. řádku žádná metadata .xls(x) – MS Excel, metadata obvykle na samostatném listu SPSS – DATOVÁ MATICE Datová matice, jak jsme se ji učili v PSY117 Názvy proměnný mohou být delší Metadata zobrazena na samostatné záložce – Variable view Typ proměnné – numeric/string /date… Label – dlouhý název, popisek Values – popisky jednotlivých hodnot proměnné Missing – které hodnoty jsou kódy pro chybějící nebo neplatné odpovědi Measure – nominal/ordinal/scale Třídění – pravým tl. myši, popř. Data – Sort cases SPSS – OUTPUT, SYNTAX Output – okno, kam se vypisují výstupy analýz, stromová hierarchie Syntax – okno, jehož prostřednictvím se dají zadávat hromadně příkazy pro vykonání analýz SPSS – TRANSFORMACE PROMĚNNÝCH Vypočítání nové proměnné např. součet 5 položek do jednoho součtového skóru Transform – Compute variable… nebo v syntaxu COMPUTE nova=jedna+druha. Změna kódování proměnné, sloučení kódů Transform – Recode into Different Variables… nebo v syntaxu RECODE … INTO… JSOU DÍVKY VÍCE MONITOROVÁNY SVÝMI RODIČI NEŽ KLUCI? Škála monitorování vytvořit + vnitřní konzistence popsat rozložení i graficky Pohlaví Test hypotézy popis rozložení v porovnávaných skupinách t-test nebo nějaký neparametrický test? … předpoklady? velikost účinku Formulace závěru V souladu s naším očekáváním udávají kluci (M=2,72, SD=0,56) přibližně o čtvrt směrodatné odchylky nižší míru monitorování než dívky (M=2,86; SD=0,58), t(759)=3,30; p<0,01; Cohen d=0,24; 95% CI (0,06;0,22). Též podle kohorty a podle pohlaví v rámci kohorty. Kopírování do Wordu LIŠÍ SE POČET DĚTÍ V RODINÁCH RŮZNÝCH NÁRODNOSTÍ? Národnost a Počet dětí četnosti a překódování Test hypotézy kontingenční tabulka t-test nebo nějaký neparametrický test? … předpoklady? velikost účinku Formulace závěru Rozložení kategorizovaného počtu dětí v českých rodinách se liší od počtu dětí v rodinách jiných národností (c2(3, N=768)=9,44; p=0,02; Cramér V=0,11). Adjustovaná rezidua indikují, že rozdíl spočívá především v menší relativní četnosti českých rodin se 3 dětmi a větší rel. četnosti českých rodin s jedináčky. VYPOVÍDAJÍ RESPONDENTI O VŘELOSTI OBOU RODIČŮ STEJNĚ? Škála vřelosti matky a otce vytvořit + vnitřní konzistence popsat rozložení i graficky vztah mezi vřelostmi Test hypotézy t-test nebo nějaký neparametrický test? … předpoklady? velikost účinku Formulace závěru Respondenti v průměru udávají vřelost matky (M=3,23, SD=0,47) přibližně o čtvrt směrodatné odchylky vyšší než vřelost otce (M=3,08; SD=0,58), t(743)=7,61; p<0,01; Cohen d=0,29; 95% CI (0,11;0,19). DOBRÁ PRAXE PŘI PRÁCI S DATY Příprava dat R/O čistá datová matice v XLS nebo CSV Import do SAV a nastavit R/O (lze zaznamenat syntax) Výpočet odvozených proměnných uložit do syntaxu Veškeré přepočty děláme do nových proměnných Práce s daty Otevřu SAV s čistými daty a spustím syntax, který mi vytvoří odvozené proměnné a uložím jako nový soubor Dělám analýzy Když si data nějak poškodím, vrátím se k R/O čistým datům Když najdu v datech chybu, opravím v XLS a znovu provedu import PREZENTACE STATISTICKÝCH ANALÝZ (SEKCE RESULTS) Představení dat (vzorek, metoda, výpočet škál, vnitřní konzistence) Popisné statistiky (popř. zobrazení rozložení, tabulky/grafy dle APA) Formulace hypotézy (často pouze implicitní, žádné formality) Zdůvodnění volby testu, popř. analytického postupu Rekapitulace splnění předpokladů zvoleného testu Standardní prezentace testových statistik (u jednodušších testů v textu, u složitějších modelů v tabulkách) vč. velikosti účinku (ideálně i intervalu spolehlivosti) Interpretace výsledků testu (modelu) vzhledem k hypotéze ÚKOL: NASTARTOVAT •Nainstalovat si SPSS a sehnat si Fielda, Morganovou a APA manuál •Zopakovat si obsah PSY117 – nejprve indukci •Najít si parťáky 1. SEMINÁRNÍ ÚKOL Ve trojicích Realizovat 3 analýzy z Long2 dat Důvěřují respondenti stejně rodičům a přátelům? Důvěřování rodičům jsou liché položky dXX_99 a důvěřování přátelům jsou ty sudé. Je rozdíl mezi důvěřování rodičům a přátelům jiný v mladší a ve starší kohortě? Jaký je vztah mezi stavem manželství rodičů a vzděláním rodičů? Využijeme stav_r99 a vzdel_ma a vzdel_ot Z analýz sepsat zprávu v souladu s konvencemi Odevzdat do neděle - půlnoci DĚKUJI ZA POZORNOST