VÝBĚR VZORKU V KVANTITATIVNÍM VÝZKUMU Metodologie ISK, 30/10/2014 TERMINOLOGIE Populace / základní soubor Soubor jednotek, které chceme zkoumat – předpokládáme, že naše výroky jsou pro tento soubor platné Soubor jednotek, ze kterých vybíráme vzorek Vzorek (výběrový soubor): Množina subjektů, které ve výzkumu zastupují náš výběrový soubor Jednotky, které skutečně zkoumáme, pozorujeme TERMINOLOGIE Reprezentativnost Zobecnitelnost vzorku na populaci Jde to, co bylo vyzkoumáno, vztáhnout i na další prvky populace? VÝBĚR V KVANTI A KVALI VÝZKUMU Kvantitativní zkoumání (statistický výběr) Kvalitativní zkoumání (teoretický výběr) Populace Je definována Není definována (je definován problém) Rozsah výběru Je předem znám Není předem znám Znaky populace Známé nebo odhadnutelné Nejsou známé předem Provedení výběru Pouze jednou (redukce na jeden časový bod) Opakované Ukončení výběru Po dosažení potřebného rozsahu výběru Po dosažení teoretického nasycení Reprezentativita Reprezentuje populaci Reprezentuje výzkumný problém Zpracováno dle: Reichel, 2009 TYPY VÝBĚRŮ Reprezentativní výběry Nereprezentativní výběry Pravděpodobnostní výběry Nepravděpodobnostní výběry Prostý náhodný výběr Kvótní výběr Snowball technika Systematický výběr Teoretický výběr Náhodný stratifikovaný výběr Výběr typických případů Náhodný skupinkový výběr Výběr kritických případů Účelový výběr http://farm6.staticflickr.com/5188/5669173764_a40c5fb559_b.jpg Jak vybírat? http://www.flickr.com/photos/53921113@N02/ CO BRÁT V ÚVAHU PŘI VÝBĚRU? Plán výběru musí být známý předem Velikost populace Složení populace (homogenní/heterogenní) Složitost zkoumaného problému Zamýšlenou míru statistické pravděpodobnosti Jaké informace o populaci máme k dispozici? Zdroje (ekonomickou stránku) http://farm4.staticflickr.com/3235/2620019495_92d7f032f7_o.jpg Pravděpodobnostní výběry http://www.flickr.com/photos/missturner/ PRAVDĚPODOBNOSTNÍ VÝBĚRY Každý prvek (jednotka) základního souboru má stejnou šanci dostat se do výběrového souboru (vzorku) Princip náhody PROSTÝ NÁHODNÝ VÝBĚR Vyžaduje sampling frame (oporu výběru) „losování“ Vyjadřuje všechny známé i neznámé vlastnosti populace (největší výhoda!) Jsme schopni odhadnout, jak se liší od populace (výběrová chyba) Úplná eliminace možnosti ovlivnit podobu vzorku ze strany výzkumníka Náhodný výběr ≠ jak vás zrovna napadne Náhodný výběr ≠ kdo jde zrovna kolem PROSTÝ NÁHODNÝ VÝBĚR http://kisk.phil.muni.cz/w/images/7/74/Pnv.png SYSTEMATICKÝ NÁHODNÝ VÝBĚR Vybíráme každý n-tý případ: Nejprve je náhodně (losem) stanoven první prvek a poté každý x-tý (x = podíl velikosti základního a výběrového souboru) Pozor na organizační klíč při řazení seznamů! Seznam musí být v tomto případě řazen náhodně! http://kisk.phil.muni.cz/w/images/b/b6/Systematicky_yber.png Zdroj: Disman, M.: Jak se vyrábí sociologická znalost, s. 106 STRATIFIKOVANÝ VÝBĚR 1.Vytvoříme straty (skupiny homogenní vzhledem ke konkrétnímu kritériu – pohlaví věk – záleží na hypotézách) 2.Ze strat vybereme náhodně jednotky 3.Může být proporcionální i neproporcionální 4. Příklad: předpokládáme, že vnímání kognitivní autority u studentů KISK je odlišné dle věku, délky studia, pohlaví. Vytvoříme straty dle daných kritérií a z nich vybíráme náhodně. SKUPINKOVÝ NÁHODNÝ VÝBĚR Podobný jako stratifikovaný, ale skupinky jsou přirozeného původu a jsou uvnitř heterogenní 1.Identifikujeme skupiny (clustery) 2.Vybereme náhodně clustery 3.Vybereme náhodně prvky z clusterů Příklad vícestupňového výběru: Chceme zkoumat registrované uživatele v knihovnách v ČR. Vybereme nejprve náhodně kraje, poté knihovny, poté z nich náhodně čtenáře. ORIENTAČNÍ PŘEHLED - VÝBĚR VZORKU Velikost populace Velikost vzorku (pravděpodobnostní výběry) Do 100 jednotek 80 % Do 1000 jednotek 40 % Do 10 000 jednotek 7,5 % Do 100 000 jednotek 1,5 % Do 1 000 000 jednotek 0,25 % Do 10 000 000 jednotek 0,045 % Nepravděpodobnostní výběry http://www.flickr.com/photos/missturner/ KVÓTNÍ VÝBĚR Imituje známé vlastnosti ve struktuře populace (vytváříme model populace) Lze použít jen pro dobře zmapované populace (známe podíly zastoupení kvót) Skládání kvót znesnadňuje výběr Nelze stanovit výběrovou chybu(!) Zdroje informací o populaci: např. Český statistický úřad (Sčítání lidu), seznam čtenářů knihovny atd. RIVER SAMPLING (REAL-TIME) Většinou jako varianta kvótního výběru Charakteristický pro online dotazování Reaguje na nedostatky panelových výzkumů (vzorek zatížený opětovným dotazováním), nemůže být ale většinou považovaný za reprezentativní Rekrutace za pomoci bannerů, pop-upů, reklamy VÝBĚRY ZALOŽENÉ NA DOBROVOLNOSTI/DOSTUPNOSTI Experimenty Ankety (samovýběr), výběr namátkou („kdo jde zrovna kolem“) Výsledky nejsou zobecnitelné na populaci! „Reprezentativita není určována jen počtem jedinců, ale i mechanizmem jejich výběru“ (Reichel, 2009) CENZUS Úplný/totální/vyčerpávající výběr Speciální případy (ČSÚ) nebo pokud je populace tak malá, že není efektivní dělat výběr (desítky až stovky prvků) http://www.colourplanet.cz/image.aspx?itemid=73829&width=&height=&q=80 http://farm1.staticflickr.com/31/64027565_79b890c8c4_b.jpg Sběr dat z pohledu respondenta http://www.flickr.com/photos/splorp/ DRUHY SBĚRU DAT PAPI (Paper and Pencil Interviewing) CAPI (Computer Assisted Personal Interviewing) CAWI (Computer Assisted Web Interviewing) CATI (telefonické dotazování respondentů za pomoci počítačového programu) CAMI (Computer Assisted Mobile Interviewing) Úkol: výběr vzorku a sběr dat http://www.flickr.com/photos/splorp/