Analýza dat z výzkumu Příklad1: Dělám kvalitativní rozhovory s 15 ženami Příklad 2: Mám sebráno 100 dotazníků od žen navštěvujících předporodní kursy Příklad 3: Mám k dispozici 10 kazuistik rodiček po 40 Co se děje po sběru dat? • • Příklad 1: kvalitativní rozhovory Kvalitativní analýza 1) Probíhá paralelně se sběrem dat, nelze tedy striktně rozlišit fázi sběru dat a jejich analýzy 2) Nemá tak jasná pravidla a nástroje jako statistická analýza (neoperuje se s čísly, procenty, korelacemi) Barney Glaser, Anslem Strauss (The Discovery of Grounded Theory, 1976). Zakotvená teorie je pokusem vytvořit novou teorii na základě sběru dat o studovaném fenoménu. Jde za fenomenologii, neboť vysvětlení je vysvětlením výzkumníkovým (ne aktérovým) – výzkumník totiž vytváří vysvětlující teorii fenoménu. Z. t. kombinuje naturalistický přístup s pozitivistickou snahou formulovat systém procedur, jak dělat kvalitativní výzkum. Umožňuje výzkumníkovi být vědeckým a kreativním. zakotvená teorie I 3 hlavní zásady tvorby zakotvené teorie: Opakovaně odstup od výzkumu a zeptej se sám sebe: Co se to tam děje? Je to, co si myslím, že se děje, ve shodě s datovou realitou? Udrž si ducha skepticismu. Všechna teoretická vysvětlení, kategorie, které používám a hypotézy, které mám, ať pocházejí z literatury nebo ze zkušenosti, je nutno chápat jako prozatímní. Všechny je nutno neustále konfrontovat s daty. Drž se výzkumných procedur. Pomohou ti vyhnout se nerealistickému pochopení dat (Strauss, Corbin 1990) Výzkumníci v tomto paradigmatu se snaží vstupovat do terénu bez jakýchkoliv prekoncepcí. Znát dopředu, co již jiní vyzkoumali, může vést k šumu v pozorování a teoriích. nejblíže k ideálnímu modelu induktivního usuzování obvyklé techniky: rozhovor, obsahová analýza zakotvená teorie II klíčové pojmy: metoda konstantního srovnávání Simultánní průběh sběru dat a jejich analýzy. Sběr dat je řízen poznatky z již analyzovaného materiálu. teoretická tvorba vzorku (theoretical sampling) reprezentativnost z hlediska výzkumného problému – výběr zkoumaných objektů je dán potřebou pokrýt všechny dimenze výzkumného problému, nikoliv reprezentativitou z hlediska populace. teoretická citlivost výzkumník vstupuje do terénu bez teorií a hypotéz, přesto je četbou a studiem předchozích výzkumů vybaven citlivostí pro vynořující se vzorce zakotvená teorie III Operace s daty se dají rozdělit do několika kroků: 1) Kontrola a čištění dat (vypuštění nesmyslných dotazníků, kontrola překlepů, logické kontroly) 2) 2) Popisná analýza (popis rozložení odpovědí na všechny otázky) 3) 3) explorativní analýza (testy hypotéz) KVANTITATIVNÍ ANALÝZA Prostředkem analýzy jsou statistické programy, které umějí zacházet s daty ve formátu matice KVANTITATIVNÍ ANALÝZA Číslo respondenta Pohlaví Věk Kolik máte dětí Kouříte? Jakou značku nejraději? 1 1 28 1 1 Camel 2 2 35 2 1 Marlboro 3 1 40 1 2 4 1 58 3 2 5 2 30 0 2 6 2 22 0 2 Princip falzifikace v testování hypotéz Formulace nulových hypotéz: Nulová hypotéza – neexistence vztahu/rozdílu, nevhodnost modelu (negace našeho předpokladu – snaha vyvrátit jej) Alternativní hypotéza – vztah/rozdíl existuje, model je vhodný -> falzifikovatelnost (alespoň v principu) – hlavní kritérium použitelnosti hypotéz Do statistické analýzy vstupujeme vždy s nulovou hypotézou (netřeba ji však formulovat přímo v textu, je to samozřejmé) Neexistuje rozdíl v průměrech -> t-test Neexistuje rozdíl v distribucích -> chí-kvadrát Model není vhodný -> F-test, Anova, chí-kvadrát (podle povahy modelu) Dvě roviny testování hypotéz Na úrovni výzkumného vzorku: Vyvrácení H0 na základě rozdílu Věcný význam velikosti rozdílu -> vyhněme se mechanickému zamítání/přijímání hypotéz na základě testů Na úrovni cílové populace: Vyvrácení H0 na základě statistických testů Statistická významnost (lze rozdíl dané velikosti s danou pravděpodobností nalézt v cílové populaci, nebo vznikl náhodným rozptylem – výběrovou chybou?) Statistická významnost nevypovídá vždy o věcné významnosti – Je závislá na velikosti vzorku Jak testovat hypotézy na datech VŠEOBECNĚ PLATNÝ ZÁKON GIGO: garbage in garbage out Problém nejasnosti testování hypotéz často netkví v tom, že neznáme nějakou zázračnou techniku analýzy, ale v celém řetězci výzkumný problém – analýza. Důležité je kladení korektních hypotéz, z nichž lze mnoho vytěžit . Hypotéza musí nabízet co nejširší pohyb mezi úrovněmi abstrakce od teorie až k indikátorům. Musíme být schopni formulovat vějíř hypotéz na různé úrovni abstrakce a uvědomovat si hierarchický vztah mezi nimi. (pokud nelze, bude někde chyba) - Vyšší otevřenost společnosti ovlivňuje princip výběrového párování - Společnosti s vysokou mobilitou mají nižší míru homogamie -Státy, v nichž je rozvolněný mezigenerační přenos vzdělání vykazují také vyšší podíl sňatků napříč vzdělanostními kategoriemi. -Častější a větší rozdíl mezi vzděláním nejvzdělanějšího z rodičů a respondenta je asociován s častějším a větším rozdílem vzdělání mezi partnery uzavírajícími sňatek -Indikátory: vzdělanostní úroveň měřená na škále ISCED 4 Jak testovat hypotézy na datech II Vyvarujme se zvěcnění indikátorů – neměříme koncept samotný, ale jen jeho nepřímo zachytitelné projevy. Již při plánování výzkumu je dobré si uvědomit s jakým typem proměnných budeme pracovat a jaké postupy analýzy bude možné aplikovat. Typy proměnných NOMINÁLNÍ – jen roztřídit (pohlaví, barva očí) ORDINÁLNÍ – i seřadit (míra souhlasu s něčím, vzdělanostní kategorie) KARDINÁLNÍ – i určit o kolik (kolikrát) více (věk, příjem) Operace, které s nimi lze provádět NOMINÁLNÍ – procenta, stanovení výskytu kategorií a nejčastější kategorie ORDINÁLNÍ – také procenta - výskyt kategorií. Dále lze použít medián – kategorie, která dělí vzorek napůl, asociační koeficienty KARDINÁLNÍ – všechny jako předchozí + průměr, korelace, regrese Prezentace výsledků Počet respondentů Absolutní četnost (n) Relativní četnost (%) Kategorie podváha 1 1,0 norma 7 7,0 nadváha 49 49,7 obezita 1. stupně 34 34,3 obezita 2. stupně (závažná) 5 5,0 obezita 3. stupně (těžká) 3 3,0 Celkem 99 100,00 Abs. četnost Procento muž 82 43,4 žena 107 56,6 Celkem platných 189 100 Prezentace výsledků „krabicový graf“ - boxplot Prezentace výsledků Prezentace výsledků Věk v letech Délka pobytu v měsících Počet platných případů 99 99 Minimum 42 1 Maximum 101 60 Průměr 75,70 18,58 Směrodatná odchylka 12,07 15,70 Vývoj ukazatelů během nutriční intervence Prezentace výsledků Prezentace výsledků Prezentace výsledků Prezentace výsledků stav - pracující? Celkem pracuje nepracuje Vnímáte po období dosažení důchodového věku ve srovnání s obdobím před jeho dosažením nějaké zdravotní potíže? rozhodně ano 34,9 22,8 29,7 spíše ano 52,8 49,4 51,4 spíše ne 10,4 25,3 16,8 rozhodně ne 1,9 2,5 2,2 Celkem 100,0 100,0 100,0 Prezentace výsledků Pohlaví Celkem muž žena podváha 0,00 0,93 0,53 norma 2,44 14,02 8,99 nadváha 59,76 43,93 50,79 obezita 1. stupně 35,37 30,84 32,80 obezita 2. stupně (závažná) 1,22 8,41 5,29 obezita 3. stupně (těžká) 1,22 1,87 1,59 100,00 100,00 100,00 Prezentace výsledků Prezentace výsledků