VÝBĚR VZORKU
V KVANTITATIVNÍM VÝZKUMU
Metodologie ISK, 30/10/2014

TERMINOLOGIE
 Populace / základní soubor
 Soubor jednotek, které chceme zkoumat – předpokládáme, že naše výroky jsou pro tento soubor platné
 Soubor jednotek, ze kterých vybíráme vzorek
 Vzorek (výběrový soubor):
 Množina subjektů, které ve výzkumu zastupují náš výběrový soubor
 Jednotky, které skutečně zkoumáme, pozorujeme

TERMINOLOGIE
 Reprezentativnost
 Zobecnitelnost vzorku na populaci
 Jde to, co bylo vyzkoumáno, vztáhnout i na další prvky populace?

VÝBĚR V KVANTI A KVALI VÝZKUMU
Kvantitativní zkoumání
(statistický výběr)
Kvalitativní zkoumání (teoretický výběr)
Populace
Je definována
Není definována (je definován problém)
Rozsah výběru
Je předem znám
Není předem znám
Znaky populace
Známé nebo odhadnutelné
Nejsou známé předem
Provedení výběru
Pouze jednou (redukce na jeden časový bod)
Opakované
Ukončení výběru
Po dosažení potřebného rozsahu výběru
Po dosažení teoretického nasycení
Reprezentativita
Reprezentuje populaci
Reprezentuje výzkumný problém
Zpracováno dle: Reichel, 2009

TYPY VÝBĚRŮ
Reprezentativní výběry
Nereprezentativní výběry
Pravděpodobnostní výběry
Nepravděpodobnostní výběry
Prostý náhodný výběr
Kvótní výběr
Snowball technika
Systematický výběr
Teoretický výběr
Náhodný stratifikovaný výběr
Výběr typických případů
Náhodný skupinkový výběr
Výběr kritických případů
Účelový výběr


http://farm6.staticflickr.com/5188/5669173764_a40c5fb559_b.jpg
Jak vybírat?
http://www.flickr.com/photos/53921113@N02/

CO BRÁT V ÚVAHU PŘI VÝBĚRU?
 Plán výběru musí být známý předem

 Velikost populace
 Složení populace (homogenní/heterogenní)
 Složitost zkoumaného problému
 Zamýšlenou míru statistické pravděpodobnosti
 Jaké informace o populaci máme k dispozici?
 Zdroje (ekonomickou stránku)

http://farm4.staticflickr.com/3235/2620019495_92d7f032f7_o.jpg
Pravděpodobnostní výběry
http://www.flickr.com/photos/missturner/

PRAVDĚPODOBNOSTNÍ VÝBĚRY
 Každý prvek (jednotka) základního souboru má stejnou šanci dostat se do výběrového souboru
(vzorku)
 Princip náhody

PROSTÝ NÁHODNÝ VÝBĚR
 Vyžaduje sampling frame (oporu výběru)
 „losování“
 Vyjadřuje všechny známé i neznámé vlastnosti populace (největší výhoda!)
 Jsme schopni odhadnout, jak se  liší od populace (výběrová chyba)
 Úplná eliminace možnosti ovlivnit podobu vzorku ze strany výzkumníka
 Náhodný výběr ≠ jak vás zrovna napadne
 Náhodný výběr ≠ kdo jde zrovna kolem

PROSTÝ NÁHODNÝ VÝBĚR
http://kisk.phil.muni.cz/w/images/7/74/Pnv.png


SYSTEMATICKÝ NÁHODNÝ VÝBĚR
 Vybíráme každý n-tý případ:
Nejprve je náhodně (losem) stanoven první prvek a poté každý x-tý (x = podíl velikosti základního a
výběrového souboru)
 Pozor na organizační klíč při řazení seznamů! Seznam musí být v tomto případě řazen náhodně!

http://kisk.phil.muni.cz/w/images/b/b6/Systematicky_yber.png


Zdroj: Disman, M.: Jak se vyrábí sociologická znalost, s. 106


STRATIFIKOVANÝ VÝBĚR
1.Vytvoříme straty (skupiny homogenní vzhledem ke konkrétnímu kritériu – pohlaví věk – záleží na
hypotézách)
2.Ze strat vybereme náhodně jednotky
3.Může být proporcionální i neproporcionální
4.
 Příklad: předpokládáme, že vnímání kognitivní autority u studentů KISK je odlišné dle věku, délky
studia, pohlaví. Vytvoříme straty dle daných kritérií a z nich vybíráme náhodně.

SKUPINKOVÝ NÁHODNÝ VÝBĚR
 Podobný jako stratifikovaný, ale skupinky jsou přirozeného původu a jsou uvnitř heterogenní
1.Identifikujeme skupiny (clustery)
2.Vybereme náhodně clustery
3.Vybereme náhodně prvky z clusterů

 Příklad vícestupňového výběru: Chceme zkoumat registrované uživatele v knihovnách v ČR. Vybereme
nejprve náhodně kraje, poté knihovny, poté z nich náhodně čtenáře.

ORIENTAČNÍ PŘEHLED - VÝBĚR VZORKU
Velikost populace
Velikost vzorku
(pravděpodobnostní výběry)
Do 100 jednotek
80 %
Do 1000 jednotek
40 %
Do 10 000 jednotek
7,5 %
Do 100 000 jednotek
1,5 %
Do 1 000 000 jednotek
0,25 %
Do 10 000 000 jednotek
0,045 %

Nepravděpodobnostní výběry
http://www.flickr.com/photos/missturner/


KVÓTNÍ VÝBĚR
 Imituje známé vlastnosti ve struktuře populace (vytváříme model populace)
 Lze použít jen pro dobře zmapované populace (známe podíly zastoupení kvót)
 Skládání kvót znesnadňuje výběr
 Nelze stanovit výběrovou chybu(!)


 Zdroje informací o populaci: např. Český statistický úřad (Sčítání lidu), seznam čtenářů knihovny
atd.

RIVER SAMPLING (REAL-TIME)
 Většinou jako varianta kvótního výběru
 Charakteristický pro online dotazování
 Reaguje na nedostatky panelových výzkumů (vzorek zatížený opětovným dotazováním), nemůže být ale
většinou považovaný za reprezentativní
 Rekrutace za pomoci bannerů, pop-upů, reklamy

VÝBĚRY ZALOŽENÉ NA DOBROVOLNOSTI/DOSTUPNOSTI
 Experimenty
 Ankety (samovýběr), výběr namátkou („kdo jde zrovna kolem“)

 Výsledky nejsou zobecnitelné na populaci! „Reprezentativita není určována jen počtem jedinců, ale
i mechanizmem jejich výběru“
(Reichel, 2009)

CENZUS
 Úplný/totální/vyčerpávající výběr
 Speciální případy (ČSÚ) nebo pokud je populace tak malá, že není efektivní dělat výběr (desítky až
stovky prvků)
http://www.colourplanet.cz/image.aspx?itemid=73829&width=&height=&q=80

http://farm1.staticflickr.com/31/64027565_79b890c8c4_b.jpg
Sběr dat z pohledu respondenta
http://www.flickr.com/photos/splorp/

DRUHY SBĚRU DAT
 PAPI (Paper and Pencil Interviewing)
 CAPI (Computer Assisted Personal Interviewing)
 CAWI (Computer Assisted Web Interviewing)
 CATI (telefonické dotazování respondentů za pomoci počítačového programu)
 CAMI (Computer Assisted Mobile Interviewing)

Úkol: výběr vzorku a sběr dat
http://www.flickr.com/photos/splorp/