TRANSFORMACE A VYTVÁŘENÍ UMĚLÝCH PROMĚNNÝCH A MULTIPLE RESPONSE SETŮ. ZUR357 Statistická analýza dat -- 19. října 2017 DESKRIPTIVNÍ STATISTIKA vypovídá o rozložení (distribuci) hodnot v rámci analyzovaného datového souboru Rozložení dat – absolutní, relativní a kumulativní četnosti míry centrální tendence: Modus (Mo) Nejčetnější hodnota Medián (Mdn) Střední hodnota Aritmetický průměr (M; X) míry disperze: Rozpětí (R) Rozptyl (variance; S2 ) Standardní (směrodatná) odchylka (S) Šikmost a špičatost ZOBRAZENÍ DAT – ČIŠTĚNÍ DAT GRAFY ZOBRAZENÍ DAT – ČIŠTĚNÍ DAT GRAFY ZOBRAZENÍ DAT – ČIŠTĚNÍ DAT GRAFY TRANSFORMACE PROMĚNNÝCH Práce s daty před analýzou Zjednodušení, redukce informace Převracení škál Změna rozložení Atp. RECODE Slučuje hodnoty nominálního znaku do obecnějších kategorií (město à kraj, titul à žánr) Kategorizuje spojité proměnné (věk à věkové kategorie) Odstraňuje irelevantní kategorie (nevím, odlehlé hodnoty) Mění pořadí hodnot: I am relieved after I finsh a game, because I do not have to play for a while. RECODE Vytvořte kategorie z proměnné věk rodiče Do 20 let 21 – 30 let 31 – 40 let 41 – 50 let 51 – 60 let 61+ Otočte škálu proměnných EIU scale (vyzkoušíme SYNTAX) Rozdělte EIU skór na tři kategorie (no riks, moderate risk, high risk) Substantivní přístup a teoretický přístup Distribuční přístup AUTOMATIC RECODE Transformace string values do numerických hodnot Kategorizuje kardinální znaky podle percentilů tak, aby každá kategorie obsahovala přibližně stejný počet případů CATEGORIZE VARIABLES COUNT VALUES Sčítání výskytu určité hodnoty Např. Které tituly pravidelně čtete (0=nečte, 1čte) Respekt, Reflex, Euro, Týden…. Kolik strategií používají děti, aby se vypořádali s obtěžováním? RANK CASES Vytvoří novou proměnnou, která určuje pořadí případu podle původní proměnné COMPUTE Libovolné operace zadané strukturovaným příkazem Podmínka IF… Změna rozložení Centrování Sumační indexy Komplexní operace A JDEME DOMŮ..! J