BOD 1 PŘÍPRAVA ANALÝZA DAT ZAČÍNÁ PROJEKTEM VÝZKUMU A NÁVRHEM DOTAZNÍKU PŘEMÝŠLET O ANALÝZE VE CHVÍLI, KDY MÁM SEBRANÁ DATA JE POZDĚ JAK UDĚLAT DOTAZNÍK, ABY SE DATA DOBŘE ANALYZOVALA Již při návrhu dotazníku uvažuji o úrovni měření proměnných 1) Potřebuji pouze rozlišit kategorie? (NOMINÁLNÍ) Např. Používáte ve výuce A / B 2) Potřebuji znát sílu, intenzitu nějakého postoje? (ORDINÁLNÍ) Např. Do jaké míry považujete A za užitečný přístup? velmi užitečný spíše užitečný stejný jako ostatní méně užitečný velmi neužitečný 3) Potřebuji přesně porovnávat o kolik víc je něčeho? (KARDINÁLNÍ) Např. Příjem respondenta v Kč, výška, hmotnost, věk, konstrukce součtového indexu z baterie otázek PRO JISTOTU SI JEŠTĚ JEDNOU ZOPAKUJME: A TECHNICKY VZATO JE NEJPODSTATNĚJŠÍ: NOMINÁLNÍ ORDINÁLNÍ KARDINÁLNÍ KATEGORIZOVANÉ (mají relativně malý počet hodnot) (někdy také: kvalitativní proměnné) SPOJITÉ (více hodnot, mezi nimiž lze určit vzdálenost) (někdy také: kvantitativní proměnné) A B C D 3 6 27 Převzato z: DeVaus, D.A. 2002. Surveys in Social Research. (5th. Ed.) Crows Nest: Allen & Unwin JAK UDĚLAT DOTAZNÍK, ABY SE DATA DOBŘE ANALYZOVALA Používám co nejvíce komplexních Indikátorů – baterií otázek Baterie, která má za úkol měřit subjektivní postoj učitele k inkluzivnímu vzdělávání (nejde o objektivní popis konceptu, ale postoj k fenoménu) Výsledkem je měřicí škála 5 – 20 bodů, na níž můžeme srovnávat úroveň postoje (není ideální, ale jako příklad ujde) •většina konceptů není měřena jedním indikátorem ale sadou indikátorů, což bývají v dotaznících obvykle sady výroků • •příklad z dotazníku Manželství, práce, rodina 2005: • • BOD 2 DATA POKUD NEMÁTE PARTU BRIGÁDNÍKŮ, BUDETE POTŘEBOVAT VĚDĚT TOTO… DATA SBÍRÁM SÁM dotazník strukturované pozorování kvantitativní obsahová analýza • POUŽIJI DATA SEBRANÁ NĚKÝM JINÝM MNOHO DAT JE JIŽ K DISPOZICI: oficiální statistiky: MŠMT, ÚIV, ČSÚ Projekty výběrových šetření: např. PISA, datové archivy CO JSOU DATA A JAK VZNIKAJÍ JAK UDĚLAT DOTAZNÍK, ABY SE DATA DOBŘE PŘEPISOVALA Odpovědi vždy kóduji číselně a již při přípravě dotazníku myslím na přepis - lze udělat dotazník on-line? (přepis odpadá) - vyplatí se připravit dotazník ke skenování? (nad 500 případů) - budu přepisovat sám, nebo někdo jiný? JAK UDĚLAT DOTAZNÍK, ABY SE DATA DOBŘE PŘEPISOVALA Používám co nejméně otázek s více možnostmi odpovědi!! TAK TO VYPADÁ V DOTAZNÍKU TAKHLE V DATOVÉ MATICI: DOPLŇKOVÉ PROMĚNNÉ Kód proměnné „label“ proměnné Kód odpovědi V matici vždy jedno číslo do jedné buňky… …Jak tedy kódovat odpovědi na otázky s více možnostmi odpovědi? Respondent zaškrtl b, d, e Takto ne! Takto ano: každá položka jako dichotomická proměnná 0/1 Máme tedy tzv. matici dat – nejlépe se vyplňuje v excelu a pak se importuje do Statistického softwaru + další tisíce případů + další desítky či stovky proměnných Výsledek obrázku pro statistica Výsledek obrázku pro sas statistical software Výsledek obrázku pro spss K ČEMU TO JE: Výhody oproti Excelu: Snadná tvorba analytických tabulek – menu s procedurami Pokročilé analýzy, snazší zacházení s daty OSTATNÍ: STATA, R Specializovanější nástroje. Za cenu horšího uživatelského komfortu výrazně výkonnější výpočty, pokročilejší modely, široká paleta uživatelských doplňků. FREEWARE ALTERNATIVA: PSPP https://www.gnu.org/software/pspp/ Výsledek obrázku pro stata Výsledek obrázku pro r statistical package Výsledek obrázku pro PSPP Program budovaný jako náhrada za SPSS: Má totožnou logiku ovládání, podobné funkce. Nevýhodou je obtížnější export výsledků. Data Editor: Zobrazení matice a vlastností proměnných, přístup k menu analýz PRACOVNÍ PROSTŘEDÍ SPSS: TŘI ZÁKLADNÍ OKNA V NICHŽ SE POHYBUJEME Statistic Viewer: Výstupy analýz – tabulky, grafy, editace výstupů Syntax editor: Možnost ukládat sady příkazů Užitečné zejména při rutině, nebo transformacích proměnných DATA EDITOR: STATISTICS VIEWER: BOD 3 ANALÝZA JAKÉ KONKRÉTNÍ POSTUPY LZE VOLIT A POČÍTAT S NIMI JIŽ V NÁVRHU PROJEKTU Čištění dat Logické kontroly, kontroly filtrů Příprava pro analýzu Analýza Kontroly missing values, překlepů, vtipů, outliers Popisná jednorozměrná analýza proměnných, které hodlám použít Kontrola předpokládaných struktur: Konzistence indikátorů daných konceptů Transformace proměnných: Úprava kategorií Výpočet součtových indexů Využití metod dvou- či vícerozměrné analýzy Regresní modelování Převzato z: DeVaus, D.A. 2002. Surveys in Social Research. (5th. Ed.) Crows Nest: Allen & Unwin Výsledek obrázku pro histogram JEDNOROZMĚRNÁ ANALÝZA KATEGORIE (nominální, ordinální proměnné) KONTINUUM (kardinální proměnné) FREKVENČNÍ TABULKY SLOUPCOVÉ, KOLÁČOVÉ GRAFY MODUS, MEDIÁN PRŮMĚR, ROZPTYL GRAFY ROZLOŽENÍ (HISTOGRAM, BOX-PLOT) KVANTILY (PERCENTILY) Výsledek obrázku pro categorical variable Výsledek obrázku pro boxplot Výsledek obrázku pro boxplot V České republice je dnes příliš mnoho přistěhovalců. četnost procento Rozhodně souhlasím 253 14,6 Souhlasím 528 30,3 Ani souhlas ani nesouhlas 507 29,1 Nesouhlasím 371 21,3 Rozhodně nesouhlasím 81 4,7 Celkem 1740 100,0 Pramen: EVS 2008 Do jaké míry jsou ospravedlnitelné… (desetibodová škála od 1=nikdy do 10=vždy - kvazikardinální proměnná) •Každý výběr se mírně liší od populace – odlišnost je tím větší, čím více se vzdalujeme od náhodnosti výběru a čím menší je výběrový soubor. • •Ve výsledcích je tedy třeba tuto chybu zohlednit. V případě náhodných výběrů máme k dispozici nástroje tzv. inferenční statistiky, která pomáhá určovat s jakou pravděpodobností a v jakém rozmezí najdeme dané výsledky v populaci. • • Ale naše data jsou výběrová… Terminologie… STATISTIKA: vlastnost dané veličiny vypočtená na vzorku (např. průměrný věk respondentů reprezentativního výzkumu, procento voličů KSČM v reprezentativním výzkumu atd.) PARAMETR: vlastnost dané veličiny v základním souboru (průměrný věk obyvatel ČR, podíl voličů KSČM mezi voliči v ČR atd) Ze STATISTIK usuzuji na PARAMETRY Toto usuzování se nazývá STATISTICKÁ INFERENCE (někdy statistická INDUKCE) = parametry jsou obvykle neznámé, proto potřebujeme výběrová šetření (např. postoje ke genderovým rolím, postoje k ochraně ŽP atp.) ODHAD PARAMETRŮ: Velikost výběrové chyby lze vyjádřit: a.Standardní chybou (neplést se směrodatnou odchylkou) b.Intervalem spolehlivosti. • • •Bodový odhad versus interval spolehlivosti • CVVM Naše společnost 2015 - červen Pokud byste k volbám šel, kterou stranu byste volil? CVVM Naše společnost 2015 - červen Pokud byste k volbám šel, kterou stranu byste volil? A nyní s intervaly spolehlivosti Je stále tak jasné, kdo by vyhrál a kdo by se určitě dostal do parlamentu? Věcné důsledky: do TV diskusí nad 5 %