Základy reprezentativity a výběrové postupy v kvantitativním výzkumu Mgr. Jana Obrovská, 20.9. 2016 Kvantitativní a kvalitativní výzkum: podobnosti a rozdíly (opakování) -deduktivní versus induktivní strategie výzkumu -lineární versus cirkulární plán výzkumu -náhodný versus záměrný výběr případů do zkoumaného vzorku -zobecnitelnost zjištění versus platnost zjištění zejména pro daný případ/kontext (mnoho informací o málo jedincích versus málo informací o mnoha jedincích) -snaha eliminovat efekt tazatele versus subjektivita a biografie výzkumníka jako součást výzkumného procesu -Kdy se více hodí následovat kvantitativní výzkumnou strategii a kdy kvalitativní? U kvantitativních výzkumů zpravidla pokud se zabýváme relativně velkými populacemi a zjištění chceme generalizovat, zatímco kvalitativní strategii zpravidla u menších populací, kdy usilujeme o detailní zjištění, která nechceme zobecňovat na celou populaci. Plán kvantitativního výzkumu u1) Formulace teoretického nebo praktického sociálního problému u2) Formulace teoretické hypotézy u3) Formulace souboru pracovních hypotéz u4) Rozhodnutí o populaci a vzorku u5) Pilotní studie u6) Rozhodnutí o technice sběru informací u7) Konstrukce nástrojů pro tento sběr u8) Předvýzkum u9) Sběr dat u10) Analýza dat u11) Interpretace, závěry, teoretická zobecnění (podle Disman, 2011) Kvanti, nebo kvali? uMusíme dobře zvážit, jestli zvolit kvalitativní nebo kvantitativní design výzkumu. Volba se odvíjí od našeho tématu a zejména od výzkumných otázek, které si na začátku výzkumu položíme. u uPokud si zvolíme kvantitativní paradigma, musíme dobře zvážit, jaká je velikost cílové skupiny, kterou chceme zkoumat, případně jestli jsme vůbec schopni její velikost zjistit u uNapř. zajímá nás populace dospělých jedinců s Williamsovým syndromem. Má smysl zde usilovat o realizaci kvantitativního výzkumu, pokud jejich celkový počet bude 250? u uA co když nás bude zajímat populace jedinců s touto diagnózou, kteří jsou starší 50 let, kterých bude v celé populaci ČR jen 50? u u Důležité pojmy – základní populace a výběrový soubor uCílová populace (základní soubor) je soubor jednotek, o kterém předpokládáme, že jsou pro něj naše závěry platné. Je to soubor osob, pro který chceme vyslovit závěry výzkumu. u uVzorek (výběrový soubor) – skupina jednotek, které skutečně pozorujeme. u uZkoumat celou populaci většinou nemůžeme – ta je studována pouze v případě cenzu jednou za deset let, kdy skutečně vyplňují dotazníky všechny osoby starší osmnácti let. Jde o tzv. vyčerpávající výběr. u uRedukovaná analýza reality (tj. z populace na vzorek) vede k tvrzením pravděpodobnostního charakteru u u u u u u Populace x vzorek Základní soubor x výběrový soubor xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx X x x x x x x x x x x Reprezentativita u uMožnost zobecnění výsledků - určuje, zda to, co bylo vyzkoumáno, je možné vztáhnout i na další objekty, které přímo nebyly předmětem zkoumání. u uGeneralizovat informace lze pouze v případě, že výběrový soubor je zmenšeninou souboru základního, tzn. že oba soubory se neliší v rozložení žádné z myslitelných vlastností, jenom svojí velikostí. Proměnné, které nás ve výzkumu zajímají, musí být ve vzorku stejně distribuovány jako proměnné v naší populaci, abychom mohli zjištění na populaci aplikovat. u uReprezentativnost znamená, že struktura vzorku musí imitovat složení populace tak dobře, jak je to jen možné. u uS rostoucí velikostí vzorku se rozdíl mezi strukturou populace a vzorku zmenšuje. u uReprezentativita není určována jen počtem zkoumaných jednotek a návratností, ale i mechanismem jejich výběru ze základního souboru. Zobecnění jsou potom možná jen tehdy, pokud dodržíme principy pravděpodobnostního neboli náhodného výběru. Skrze postupy náhodného výběru se snažíme zajistit, aby vzorek byl co nejvíc podobný s výchozí populací. u - Orientační návod pro vztah mezi velikostí základního a výběrového souboru (Gavora, 2010) Základní soubor Výběrový soubor 100 80 200 135 300 169 400 196 500 217 1000 278 1500 357 10000 370 uZobecnění jsou možná jen na naši cílovou populaci a na žádnou jinou, na což se často zapomíná. u uNapř. z reprezentativního vzorku pacientů a pacientek sexuologických poraden a ordinací se zobecňuje na sexuální chování celé české populace. u uNapř. z reprezentativního vzorku účastníků demonstrace organizované Blokem proti islámu se usuzuje na xenofobní nálady celé české populace. u Výběry zajišťující reprezentativitu uNáhodný výběr neboli pravděpodobnostní výběr jako takový výběr, v němž má každý člen populace stejnou pravděpodobnost, že se dostane do vzorku. u uNáhodný vzorek reprezentuje všechny známé i neznámé vlastnosti populace. u uPokud dodržujeme principy náhodného výběru, tak jsme schopni odhadnout, jak se vzorek liší od populace u uZávislost na tzv. opoře výběru: seznam jednotek základní populace, z něhož vzorek vybíráme u uV praxi tedy usilujeme o co možná největší vzorek, při zvladatelných finančních nákladech, aniž bychom ohrozili principy náhodného výběru u u u Systematický výběr – každá n-tá jednotka ze seznamu (první ale musí být vybrána náhodně!), stratifikovaný – populace je rozdělena do skupin (například studenti jednotlivých ročníků) a vybírá se náhodně z těchto skupin, vícestupňový – nejprve se náhodně vybírají uskupení (okresy), pak teprve jedinci atd. Typy náhodného/pravděpodobnostního výběru uProstý náhodný výběr – „metoda klobouku“ – očíslujeme všechny členy populace, z níž vytváříme vzorek, a použijeme generátor náhodných čísel (existují programy, kam můžeme přesně nastavit, v jakém rozmezí se náhodná čísla mají generovat - např. v rozsahu 1-300, pokud má naše populace 300 členů). Vybereme tolik čísel a podle nich i osob ze seznamu, kolik potřebujeme mít ve vzorku. uSystematický výběr - ze seznamu je vybrán každý n-tý člen. Číslo n získáme tak, že vydělíme velikost populace velikostí vzorku. Aby byl postup skutečně náhodný, tak první člen, od něhož budeme vybírat každý n-tý člen, musí být vybrán náhodně. Seznamy nesmí být řazeny podle nějakého systematického kritéria. uNáhodný stratifikovaný výběr - populace je rozdělena do skupin podle homogenního kritéria a v rámci těchto skupin je uplatněn prostý náhodný výběr nebo systematický výběr uVícestupňový náhodný výběr - jde o výběr prováděný ve dvou krocích. Nejprve jsou náhodně vybrána nějaká přirozeně existující uskupení a potom z těchto uskupení jsou náhodně vybírány jednotlivé členy. V tomto postupu je podstatné dodržet náhodnost i např. ve fázi výběru osoby v domácnosti (to je zpravidla úkol tazatele), ten by si mohl chtít usnadnit práci tím, že bude vybírat osobu, která je zrovna v dosahu. u u Problémy s pravděpodobnostními výběry uVelmi často ale nejsme schopni postupy náhodného výběru použít kvůli: u -Nákladnosti - -Protože nemáme seznamy všech členů populace (tzv. opory výběru) - -Protože máme nízkou návratnost dotazníků (tzv. redukce negativním samovýběrem, s níž se velmi obtížně bojuje). - u………………… Proto volíme nepravděpodobnostní typy výběrů. Výběry nezajišťující reprezentativitu u uKvótní výběr - imituje ve struktuře vzorku známé vlastnosti populace. Kvótní výběr se většinou omezuje jen na několik málo proměnných, zpravidla pohlaví, věk, povolání, dosažené vzdělání apod. uÚčelový výběr/Záměrný – je založen na úsudku výzkumníka o tom, co by mělo být pozorováno a co je možné pozorovat uSamovýběr/Anketa - odpovídá ten, kdo má zájem. Je problematická, protože u ní nejsme schopni určit, pro jakou populaci jsou naše závěry platné (problém zkreslení samovýběrem) uSněhová koule - je založena na postupu, při kterém nás původní informant vede k dalším informátorům. Tato technika je explicitně účelová a používá se zejména v kvalitativním výzkumu, případně v případě, že zkoumáme populace, které existovaly přechodně (např. účastníci nějaké události apod.). u- U nepravděpodobnostních výběrů je velké omezení pro generalizaci našich závěrů. Nesmíme předstírat, že jsou naše závěry platné pro „každého ve vesmíru.“ Problém samovýběru; O jaké typy výběru se jedná? uPostavím se na Náměstí Svobody a oslovím každého třetího náhodného kolemjdoucího do svého vzorku. u uNejprve náhodně vyberu okresy, v jejich rámci obce, v jejich rámci např. volební obvody a až potom z nich náhodně vybírám jedince. u uZajímá mě populace bezdomovců, nechci se ale omezit jen na ty, kteří obývají azylové domy a jiné typy zařízení. Proto svůj vzorek konstruuji tak, že oslovím skupinu bezdomovců, kteří postávají na hlavním nádraží a ti mi doporučí oslovit další bezdomovecké skupiny podle míst jejich nejčastějšího výskytu. u u Pilotní studie ucílem je zjistit, zda je náš výzkum v dané populaci vůbec realizovatelný u uověřuje, zda informace, kterou požadujeme, v naší populaci vůbec existuje a zda je dosažitelná u uje prováděna např. na malé skupině vybrané z populace, kterou hodláme studovat u učasto kvalitativní techniky u udůležitá hlavně tehdy, pokud nemáme opravdu hlubokou znalost o zkoumané populaci u uOpomenutí pilotní studie hrozí výrazně ohroženou validitou našich zjištění (v duchu rčení, když dva říkají to samé, nemusí to pro ně to stejné znamenat). u u u Předvýzkum uúčelem předvýzkumu je odzkoušení nástrojů (např. dotazníku), které jsme pro náš výzkum zkonstruovali u upočet zapojených osob je zde zpravidla vyšší než u pilotní studie u unejčastěji testujeme srozumitelnost otázek, popř. zkoušíme i analytický postup u upředvýzkum bychom neměli v žádném případě v našem výzkumném postupu opominout u