Kontrolní sk. Měření 1 (před) Kontrolní sk. Měření 2 (po) Experimentální sk. Měření 1 (před) Experimentální sk. Měření 2 (po) Výzkumná populace Náhodný výběr INTERVENCE BEZ INTERVENCE (pro srovnání) Manipulujeme s výzkumnou proměnnou (intervence) Rozlišujeme experimentální a kontrolní skupinu (srovnání) Měříme (minimálně) ve dvou bodech v čase - Sledování změn v proměnných - Vyloučení vlivu další proměnné - Časová následnost EXPERIMENTÁLNÍ DESIGN Množství leukocytů průměr 4000 / mm3 Množství leukocytů průměr 3500 / mm3 Množství leukocytů průměr 4000 / mm3 Množství leukocytů průměr 6000 / mm3 Výzkumná Populace (onkologičtí pacienti nemocnice X) Náhodný výběr PODÁN NOVÝ LÉK LÉK NEPODÁN (placebo - pro srovnání) Měření ráno Měření večer Poměrně dobré podmínky: Výzkumník podává lék, pacienti jsou ve stejném prostředí a působí na ně stejné vlivy EXPERIMENTÁLNÍ DESIGN KONKRÉTNĚ Podpora Zeman /Schwarzenberg (před) 50/50 Podpora Zeman /Schwarzenberg (po) 50/50 Podpora Zeman /Schwarzenberg (před) 50/50 Podpora Zeman /Schwarzenberg (po) 65/45 Výzkumná populace (Voliči v ČR) Náhodný Výběr (?) ČETLI INZERÁT NEČETLI INZERÁT (pro srovnání) Měření čtvrtek Měření pátek Slabší kontrola vedlejších vlivů: Kdo inzerát četl a kdo ne? Co dělali respondenti mezi oběma měřeními? A hlavně: tušíme, že inzerát vyjde? / Vydáváme ho my? KVAZI-EXPERIMENTÁLNÍ DESIGN - DVĚ VÝBĚROVÁ ŠETŘENÍ ČT, PÁ Podpora Zeman /Schwarzenberg 50/50 Podpora Zeman /Schwarzenberg 65/45 Výzkumná Populace (aktivní voliči v ČR) Náhodný Výběr při východu z volební místnosti ČETLI INZERÁT NEČETLI INZERÁT PRŮŘEZOVÝ DESIGN – MĚŘENÍ V JEDNOM BODĚ V ČASE (SURVEY / VÝBĚROVÉ ŠETŘENÍ) Takže např. v „EXIT POLL“ dám (aspoň) dvě otázky, Například nějak takto: 1) Koho jste volil(a)? 2) Všiml(a) jste si inzerátu s nadpisem XXX, který vyšel v pátek v XXX ? PRŮŘEZOVÝ DESIGN – MĚŘENÍ V JEDNOM BODĚ V ČASE (SURVEY / VÝBĚROVÉ ŠETŘENÍ) X – četba inzerátu Y – podpora kandidáta ? Z – intervenující (kontrolní) proměnné: Pravidelnost četby daného periodika Politická orientace Sledování ostatního tisku Sledování televize Názory v rodině Atd, atp…až do nekonečna LOGIKA PŘÍPRAVY VÝBĚROVÉHO ŠETŘENÍ: TŘI TYPY INDIKÁTORŮ: X – NEZÁVISLE PROMĚNNÁ Y – ZÁVISLE PROMĚNNÁ Z – KONTROLNÍ PROMĚNNÉ Četba inzerátu Podpora kandidátovi Recepce – Jak podrobně četl(a) … Politická orientace Atd… Interpretace – Co inzerát říká? … Postoj – Souhlasí? Líbí se?... Atd… Volba … Důvěra … Informovanost... Atd… Levo-pravá orientace … Volená strana do PS … Názor na předchozího prezidenta… Atd… převzato z Babbie, E. 2001 The Practice of Social Research str. 108 Formulace problému (čtu, co se ví, jak se ví) Formulace výzkumné otázky Formulace hypotéz Rozhodnutí o populaci a vzorku Pilotní studie (je informace, kterou požadujeme k dispozici?) Rozhodnutí o technice sběru informací (dotazník, pozorování…) Operacionalizace Konstrukce nástroje pro sběr dat Předvýzkum Sběr dat Zpracování dat (jak dostat data do formátu pro analýzu? ) Analýza – interpretace dat Závěry etapy výzkumu • • Rozhodování o výzkumném designu § Povaha výzkumných otázek Ptáme se na prvky kauzálního modelu? Chceme popsat fenomén? Ověřujeme vymyšlené, nebo chceme vygenerovat nové? § Povaha výzkumného problému Máme nějaké předpoklady založené na teorii? Předchozím výzkumu? Má smysl kvantifikace? § Povaha populace a organizační aspekty Lze v dané populaci uskutečnit daný typ výzkumu? Je dostupná opora výběru, existuje ochota ke spolupráci? Je hierarchický přístup v dané populaci vhodný? • • Otázky spojené s výběrem přístupu Otázky které se nekladou tak často jak by měly: Je nutné sbírat vlastní data? Lze data získat neintervenující technikou? Jaký časový rozměr dat potřebuji? Časová dimenze dat průřezové strategie kohortní studie studie trendů panelová studie + longitudinální výzkum experimentální techniky – předpokládají manipulaci s nezávisle proměnnou - experiment - přirozený experiment - - neexperimentální techniky – bez možnosti ovlivnění proměnných - - pozorování - analýza dokumentů - Možná základní třídění výzkumných technik intervenující techniky – interference se zkoumanými objekty, stup do jejich světa - experiment - zúčastněné pozorování - techniky založené na rozhovorech - - neintervenující techniky - nevstupuje do prostoru zkoumaných objektů - - nezúčastněné pozorování - analýza dokumentů/artefaktů - sekundární analýza - Možná základní třídění výzkumných technik TYPY VÝBĚROVÝCH ŠETŘENÍ PODLE FORMY SBĚRU DAT Tváří v tvář - osobní dotazování s využitím papírového dotazníku - dotazník čte tazatel a zaznamenává odpovědi - tazatel dotazník předloží a vyplněný odebere - osobní dotazování s využitím počítače Poštovní dotazování Telefonické dotazování On-line dotazování - využití on-line nástrojů pro sběr dat - rozesílání dotazníků mailem všechny varianty však probíhají na základě standardizovaného dotazníku Žargon agentur: CAPI – computer aided personal interview CATI – computer aided telephone interview CAWI – computer aided web interview PAPI – paper and pencil interview … a stále nové zkratky (tablety, smartphony) dotazník je základním nástrojem sběru dat obvykle je věnován jednomu tématu (výjimkou jsou komerční omnibusy) délka rozhovoru obvykle nepřesahuje 1 hodinu otázky by se daly rozlišit do několika typů: - sociodemografické - věcné -indikátory závisle proměnné -Indikátory nezávisle proměnné -indikátory kontrolních proměnných - filtrační - dále podle formátu na: - uzavřené - otevřené - dotazník Zejména 3 typy: Čas – nejčastější průřezová strategie Komplexnost systému- počet sledovaných souvislostí – liší se kvali/kvanti přístup – vždy však redukujeme Rozsah zkoumaných jednotek – počet případů Další typy redukce: prostor, etnicita, třída… U všech typů redukce lze vznášet otázky na reprezentativitu Srovnej kvalitativní reprezentativita dimenzí problému a kvantitativní reprezentativita populace Nás nyní bude zajímat redukce rozsahu zkoumaných jednotek -> VÝBĚR VZORKU Výběr a typy redukce CÍLOVÁ POPULACE (též základní soubor, základní populace) – soubor jednotek pro něž předpokládáme platnost našich výsledků VÝZKUMNÁ POPULACE – soubor jednotek teoreticky dostupných pro výběr (oba pojmy se v praxi často používají synonymicky) VZOREK (sample, výběrový soubor) – soubor jednotek, které zkoumáme OPORA VÝBĚRU – seznam jednotek, umožňující náhodný výběr VÝBĚR – proces redukce počtu zkoumaných jednotek Jednotky: osoby, místa, texty, obrazy, časy, události, kontexty… ZÁKLADNÍ POJMY Liší se pro kvalitativní a kvantitativní výzkum U kvalitativního výzkumu je výběr veden logikou reprezentativity pro výzkumný problém Jednotky reprezentují jednotlivé dimenze problému Výběr vzorku je veden pravidlem teoretické saturace Prakticky to znamená nenáhodný výběr vedený snahou po rozmanitosti, odlišných úhlech pohledu, konfrontace různých typů expertního vědění (expertem není tazatel, ale komunikační partner) Záměrný výběr Sněhová koule/přes informátora Kvótní TYPY VÝBĚRŮ I v kvantitativním výzkumu má vzorek reprezentovat populaci existuje několik technik výběru: náhodný výběr (pravděpodobnostní) dále se rozlišuje: - prostý náhodný - systematický náhodný - stratifikovaný náhodný kvótní výběr anketa (samovýběr) Složitější typy výběrů – víceúrovňová struktura (reprezentativita v různých úrovních) Např. škola – třída - žák – párované výběry Např. žák - rodič - TYPY VÝBĚRŮ II každá jednotka základní populace musí mít stejnou pravděpodobnost dostat se do výběru pokud je tato podmínka dodržena, data reprezentují cílovou populaci s chybou, která je odhadnutelná a závislá na velikosti vzorku reprezentuje známé i neznámé vlastnosti populace je třeba opory výběru – seznam jednotek cílové populace z níž je vybírán vzorek (např. seznam obyvatel ČR, seznam domácností) prostý náhodný výběr stratifikovaný náhodný výběr prostý náhodný výběr je organizačně velmi náročný, proto se náhodný výběr většinou provádí v několika krocích např. výběr z okresů v rámci ČR výběr sídel v rámci okresů výběr škol v rámci sídel výběr žáků v rámci školy stratifikovaný náhodný výběr je reprezentativní, je však třeba vhodně zvolit kroky, aby nedošlo ke zkreslení pro agentury náhodný výběr = stratifikovaný kvótní výběr stanovuje kvóty – vyjádření základních parametrů populace, které mají být ve výběru dodržěny kvóty jsou stanoveny na základě sčítání lidu, podle pohybu obyvatelstva, či jiných vyčerpávajících šetření obvykle je použito několik málo charakteristik: např. pohlaví, věk, vzdělání, velikost místa bydliště z ortodoxního hlediska neplatí pro kvótní výběr pravděpodobnostní statistika (inferenční statistika) – o tom dále srovnání výběrů Náhodný výběr Kvótní výběr + Kontrolovatelná reprezentativita Kontrola tazatelů + Rychlost Pružnost Láce - Náročnost Nízká návratnost Nutnost opory výběru - Nekontrolovatelné odchylky od reprezentativnosti Obtížná kontrola tazatelů Velký vliv tazatelů Rozhodování o konstrukci vzorku Chci-li dosáhnout reprezentativity s danou mírou chyby, musím splnit dvě podmínky: 1) Pravděpodobnostní výběr (paradoxně pouze u náhodného výběru lze stanovit pravděpodobnost chyby, zatímco u systematických výběrů ne) -(o tom jsme mluvili výše – typy výběrů) (tady je na místě rozhodování do jaké míry jsem schopen docílit pravděpodobnostního výběru, nebo do jaké míry se uchýlit ke kvótnímu) 2) Velikost výběrového souboru (při pravděpodobnostním výběru je dosažení dané míry přesnosti jen otázkou velikosti souboru) -(tím se nyní budeme zabývat) - Jak velký vzorek potřebuji? Kritéria rozhodování: Zvolená přesnost chyba 3 % = 1000 lidí, chyba 6 % = 300 lidí, atd. Nutná třídění do podskupin dvojrozměrná, třírozměrná, x-rozměrná třídění typy použitých proměnných a počty kategorií Non-response Dostupnost a heterogenita cílové populace Velikost cílové populace (hraje roli pouze u malých populací) výběrová chyba zdroj: http://people-press.org/methodology/sampling/ Non-response Při plánování vzorku je třeba počítat s neochotou odpovídat 2 aspekty problému: Navýšení velikosti o předpokládaný odpad -Např. on-line survey má návratnost mezi 20 – 40 %, potřebuji-li vzorek 100 lidí, obešlu 500 -Např. longitudinální výzkum má úmrtnost 30 % ročně. Potřebuji.li 100 lidí za 5 let, musím začínat s vzorkem cca 370 lidí - Sledování struktury odmítnutí Čím vyšší je míra odmítnutí, tím více se výběr blíží anketě Je-li odmítnutí rozloženo náhodně, není to takový problém jako když systematicky odmítají konkrétní skupiny -> zkreslení výsledků -Alespoň sledovat návratnost (mít přehled kolik jednotek jsme oslovili) -Screening před dotazováním – získáváme základní údaje i o těch, kteří nespolupracují (např. tazatel může zaznamenat pohlaví, odhad věku bydliště…) Vedle toho se samozřejmě snažíme zavést motivační prvky!! Důsledky pro analýzu Pro koho je vzorek reprezentativní? Jedná se o vzorek, nebo vyčerpávající výběr? -> Aplikace inferenční statistiky Inference: usuzování ze vzorku na základní populaci Statistická významnost: pravděpodobnost, že statistiky vypočtené na vzorku platí také pro populaci SEKUNDÁRNÍ ANALÝZA ČSDA Český sociálněvědní datový archiv Sociologický ústav AV ČR http://archiv.soc.cas.cz/ ČSÚ Český statistický úřad ARCHIVY MEZINÁRODNÍCH ŠETŘENÍ (ÚČAST ČR) ESS – European Social Survey http://www.europeansocialsurvey.org/data/ ISSP – International Social Survey Programme http://www.issp.org/page.php?pageId=4 EVS – European Values Study http://www.gesis.org/en/services/data-analysis/survey-data/european-values-study/ A mnoho dalších… PŘÍSTUP K DATŮM PŘES ROZHRANÍ NESSTAR