Výběr vzorku v kvantitativním výzkumu Metodologie ISK, 8/11/2013 Terminologie Populace / základní soubor • Soubor jednotek, které chceme zkoumat – předpokládáme, že naše výroky jsou pro tento soubor platné • Soubor jednotek, ze kterých vybíráme vzorek Vzorek (výběrový soubor): • Množina subjektů, které ve výzkumu zastupují náš výběrový soubor • Jednotky, které skutečně zkoumáme, pozorujeme Terminologie Reprezentativnost • Zobecnitelnost vzorku na populaci • Jde to, co bylo vyzkoumáno, vztáhnout i na další prvky populace? Cenzus • Úplný/totální/vyčerpávající výběr • Speciální případy (ČSÚ) nebo pokud je populace tak malá, že není efektivní dělat výběr (desítky až stovky prvků) Typy výběrů Reprezentativní výběry Nereprezentativní výběry Pravděpodobnostní výběry Nepravděpodobnostní výběry Prostý náhodný výběr Kvótní výběr Snowball technika Systematický výběr Teoretický výběr Náhodný stratifikovaný výběr Výběr typických případů Náhodný skupinkový výběr Výběr kritických případů Účelový výběr Jak vybírat? http://www.flickr.com/photos/53921113@N02/ Co brát v úvahu při výběru? • Velikost populace • Složení populace (homogenní/heterogenní) • Složitost zkoumaného problému • Zamýšlenou míru statistické pravděpodobnosti • Jaké informace o populaci máme k dispozici? • Zdroje (ekonomickou stránku) Pravděpodobnostní výběry http://www.flickr.com/photos/m Pravděpodobnostní výběry • Každý prvek (jednotka) základního souboru má stejnou šanci dostat se do výběrového souboru (vzorku) • Princip náhody Prostý náhodný výběr • Vyžaduje sampling frame (oporu výběru) • „losování“ • Vyjadřuje všechny známé i neznámé vlastnosti populace (největší výhoda!) • Jsme schopni odhadnout, jak se liší od populace (výběrová chyba) • Úplná eliminace možnosti ovlivnit podobu vzorku ze strany výzkumníka Náhodný výběr ≠ jak vás zrovna napadne Náhodný výběr ≠ kdo jde zrovna kolem Prostý náhodný výběr Zdroj:BABBIE,Earl.ThePracticeofSocialResearch. Systematický náhodný výběr • Vybíráme každý n-tý případ: – Nejprve je náhodně (losem) stanoven první prvek a poté každý x-tý (x = podíl velikosti základního a výběrového souboru) • Pozor na organizační klíč při řazení seznamů! Seznam musí být v tomto případě řazen náhodně! Zdroj:BABBIE,Earl.ThePracticeofSocialResearch. Zdroj: Disman, M.: Jak se vyrábí sociologická znalost, s. 106 Stratifikovaný výběr 1. Vytvoříme straty (skupiny homogenní vzhledem ke konkrétnímu kritériu – pohlaví věk – záleží na hypotézách) 2. Ze strat vybereme náhodně jednotky 3. Může být proporcionální i neproporcionální Příklad: předpokládáme, že vnímání kognitivní autority u studentů KISK je odlišné dle věku, délky studia, pohlaví. Vytvoříme straty dle daných kritérií a z nich vybíráme náhodně. Skupinkový náhodný výběr Podobný jako stratifikovaný, ale skupinky jsou přirozeného původu a jsou uvnitř heterogenní 1. Identifikujeme skupiny (clustery) 2. Vybereme náhodně clustery 3. Vybereme náhodně prvky z clusterů Příklad vícestupňového výběru: Chceme zkoumat registrované uživatele v knihovnách v ČR. Vybereme nejprve náhodně kraje, poté knihovny, poté z nich náhodně čtenáře. Orientační přehled - výběr vzorku Velikost populace Velikost vzorku (pravděpodobnostní výběry) Do 100 jednotek 80 % Do 1000 jednotek 40 % Do 10 000 jednotek 7,5 % Do 100 000 jednotek 1,5 % Do 1 000 000 jednotek 0,25 % Do 10 000 000 jednotek 0,045 % Kvótní výběr • Imituje známé vlastnosti ve struktuře populace (vytváříme model populace) • Lze použít jen pro dobře zmapované populace (známe podíly zastoupení kvót) • Skládání kvót znesnadňuje výběr • Nelze stanovit výběrovou chybu(!) Zdroje informací o populaci: např. Český statistický úřad (Sčítání lidu), seznam čtenářů knihovny atd. River sampling (real-time) • Charakteristický pro online dotazování • Reaguje na nedostatky panelových výzkumů (vzorek zatížený opětovným dotaováním) • Rekrutace za pomoci bannerů, popupů, reklamy Výběry založené na dobrovolnosti/dostupnosti • Experimenty • Ankety (samovýběr), výběr namátkou („kdo jde zrovna kolem“) Výsledky nejsou zobecnitelné na populaci! „Reprezentativita není určována jen počtem jedinců, ale i mechanizmem jejich výběru“ (Reichel, 2009) Sběr dat z pohledu respondenta http://www.flickr.com/photos/sp Druhy sběru dat • PAPI (Paper and Pencil Interviewing) • CAPI (Computer Assisted Personal Interviewing) • CAWI (Computer Assisted Web Interviewing) CATI (telefonické dotazování respondentů za pomoci počítačového programu) • CAMI (Computer Assisted Mobile Interviewing) Cvičení: výběr vzorku a sběr dat http://www.flickr.com/photos/sp