KONSTRUKCE PRIMÁRNÍCH DAT – DOTAZNÍK, ROZHOVOR


Sampling – výběr dat

Celý set relevantních dat, ze kterých se provádí výběr, můžeme nazývat populace. Samplingem rozumím
výběr podsouboru z určité definované populace, která je příliš široká na to, aby mohlo být zkoumáno
každé individuum.  Metodika výběru by měla být zvolena tak, že údaje o celkové populaci (souboru)
mohou být získány na základě omezeného podsouboru – vzorku s určitou danou mírou přesnosti/chyby.
Platí samozřejmě, že čím větší je vzorek, tím je přesnější (schopnější reprezentovat kompletní
soubor). V případě tzv. vyčerpávajícího výzkumu se vzorek shoduje s populací, v případě tzv.
reprezentativního výzkumu jsou výsledky získané na základě zkoumání vzorku uplatnitelné na celou
populaci (struktura vzorku musí tedy co nejlépe púopisovat strukturu populace).


Je tedy nutné:


1.     definovat populaci – pokud zpracováváme volební průzkum, vyloučíme např. osoby pod 18 let
bez práva volit. Je také nutné definovat populaci v čase a místě;

2.     určit jednotky výběru (sampling units) – např. ulice, domácnost;

3.     definovat rámec výběru – jde o určení seznamu entit, ze kterých bude vzorek konstruován –
např. telefonní seznam, seznam firem, apod. V humánní geografii se nepoužívá prostorové vyjádření
rámce tak často, jako ve FG výzkumu. Pokud využíváme jako rámec mapu volíme mezi bodovým vzorkem
(např. průsečíky koordinát), liniovým vzorkem (řez) či oblastí. Často se vyskytuje problém
nekompletních seznamů;

4.     zvolit metodiku výběru;

5.     stanovit velikost vzorku;

6.     určit způsob sběru dat.


Případ špatného samplingu – průzkum časopisu Literary Digest před prezidentskými volbami v USA
v roce 1936. Kandidáti Landon vs. Roosevelt.  Předpovídán byl výsledek 57 ku 43 pro Landona,
skutečný výsledek 38 ku 62 pro Roosevelta. Příčina - vzorek 2,4 mil. lidí byl brán z telefonních
seznamů a seznamů klubů. Šlo o nereprezentativní výběr spíše bohatších lidí (vlastníci telefonů,
členové klubů).


Nepravděpodobnostní (kvótní) sampling

Lze vyčlenit zcela náhodný nepravděpodobnostní sampling (tzv. convenience sampling) – např.
interviewujeme prvních n zákazníků, kteří vstoupí do obchodu (většinou předpokládáme, že jsme
zvolili typické místo a nashromážděný vzorek nám představuje typickou skladbu zákazníků, jde o
výběr typických individualit). Typickým příkladem mohou být ankety televizních reportérů mezi
náhodně vybranými lidmi na ulici.

Jiným typem je účelový nepravděpodobnostní výběr – vybíráme např. určité typy osob; spadá sem i
výběr dle kvóty (může být i pravděpodobnostní) – oslovíme určitý počet žen, určitý počet mužů,
důchodců či studentů. Většinou se používá v průzkumech politických preferencí, veřejného mínění.

V případě kvótního výběru tak postupujeme u populací, o jejichž struktuře máme dostatek informací.

Specifickými dalšími typy nepravděpodobnostního samplingu je tzv. snowball sampling (respondent
dává kontakt na dalšího respondenta) či experní účelový sampling (výzkumník sám určí vhodné
respondenty).


Pravděpodobní (náhodný) sampling

Mezi pravděpodobnostní metody patří sampling využívající nějaké formy náhodného výběru, která
zaručí, že každá jednotka v populaci má přibližně stejnou šanci na to být vybrána.

Nejzákladnější metodou je využití náhodných čísel (generovaných počítačem či např. pomocí tabulky
náhodných čísel).

Při stratifikovaném pravděpodobnostním samplingu rozdělíme na základě našich předběžných znalostí
výchozí populaci. Populace se rozdělí do podskupin, v rámci kterých se provádí oddělený výběr.

Při systematickém výběru vybíráme každou n-tou jednotku populace, poté co je náhodně vybrána první
jednotka (je nutné dbát, abychom se nedostali do konfliktu s vnitřní periodicitou či pravidelností
souboru).

Geografové běžně využívají tzv. shlukový, resp. areálový sampling, kdy uplatňují pravděpodobnostní
sampling pouze ve vybraných geografických
oblastech.


Výběr bude vždy spojen s určitou chybou. V závislosti na použité metodě můžeme chybu odhadnout už
před zahájením výzkumu. Stejně tak lze stanovit předem velikost vzorku.

Díky rafinovaným metodám výběru vzorku se podařilo v moderních výzkumech významným způsobem zmenšit
nutnou velikost vzorku. Gallupův ústav pro výzkum veřejného mínění ve Velké Británii používá např.
vzorku pouhých 1000 osob k zachycení předvolebních nálad, a chyba u jednotlivých stran při
výzkumech před volbami od roku 1945 od roku nepřesáhla 1,4 %. Například v roce 1980 se zpracovával
vzorek 1000 osob z počtu 43 miliónů oprávněných voličů.

Typy dat

1.     Nominální data (výčtová) – každé individuum je zařazováno do jedné z kategorií (nominální
data zařazují 3 mil. lidí do Birminghamu a 9 mil. do Londýna). Populaci můžeme rozdělit např. na
mužskou a ženskou kategorii (2), na muslimy, židy a křesťany (3). kategorie mohou vyčerpávat danou
populaci, mohou se navzájem překrývat či vylučovat.

2.     Pořadová data (ordinální) – individua či kategorie, do kterých náležejí, jsou řazeny podle
nějakého kritéria (ordinální měření nám řekne, že Londýn je větší než Birmingham). Jde tedy o data,
která mají mezi sebou nějaký vztah vyjádřitelný jako „větší než“, „preferovanější“, apod.). Hodnoty
se dají rozlišovat pořadím, ale ne velikostí. S těmito typy dat pracují např. výzkumy preferencí,
přístupů, zařazovaní sebe sama do sociálních skupin (rozhodně ano, spíše ano, nevím, apod.).

Příklad: předložíme 10 výroků, se kterými může respondent souhlasit, spíše souhlasit, spíše
nesouhlasit a nesouhlasit. Za každý výrok může tedy respondent dostat od 4 do 1 bodu. Dle získaných
lze respondenty seřadit do pořadí. Toto pořadí je ordinálními daty, vyjadřuje opravdu jen pořadí a
nic víc, neznamená např. že mezi respondenty na 2 a 4 místě a respondenty na 5 a 7 je stejný rozdíl
v názorech.

Dovoleny jsou takové statistické operace, které nezasahují do pořadí.

3.     Intervalová data – kvalitativně vyjádřená vzdálenost mezi dvěma měřeními na předurčené škále
(intervalové měření dává informaci, že Londýn má o 6 mil. obyvatel více než Birmingham). Přitom
naměřená vzdálenost je u intervalových dat nezávislá na zvolených jednotkách. Pomocí intervalových
dat měříme např. příjmy, inteligenční kvocient, trestnou činnost, apod. Často charakterizují
relativní pozici v prostoru, čase nebo velikost - zeměpisná šířka, nadmořská výška.

4.     Poměrová data (ratio) – dovolují relativní kvantitativní ohodnocení na určité škále (Londýn
je třikrát větší než Birmingham). Tyto proměnné mají přirozenou nulu (váha, délka, plocha), jsou
také nezávislé na jednotce měření.


Dalším členěním může být např. dělení dat na lokalizační (vztahující se k pouhé lokalizaci jevu) a
atributová (popisující samotné jevy či procesy).


Dotazníkové šetření, rozhovor

Před spuštěním dotazníkového průzkumu je nutné si zodpovědět několik otázek:

jaký je náš výzkumný problém?; je opravdu nutné použít tento typ získávání dat? Např. studujeme-li
proces gentrifikace vnitřního města je nutné si upřesnit zda studujeme, kde se gentrifikace
odehrává, kdo je nositelem či jaké jsou motivy gentrifikace. Pouze pro některé z uvedených otázek
je ospravedlnitelné využití dotazníku. Dotazník by neměl být postaven jako jediný zdroj dat o
výzkumném problému a je vhodné jej doplnit i daty z sekundárních, resp. jiných statistických
zdrojů. Zkoumáme –li gentrifikaci je vhodné pracovat i se sčítáním či s informacemi realitních
kanceláří, což jsou nepoměrně lacinější zdroje.


Úspěšnost dotazníku/rozhovoru je založena na několika faktorech:


a)     na adekvátně vybraném vzorku (viz. předchozí přednáška);

b)     na správné skladbě a sestavení dotazníku, na provedení rozhovoru či vyplnění dotazníku;

c)     na analýzách a interpretaci výsledků.


1.


Jakékoli šetření je získáváním přímých informací od lidí o jejich názorech, pocitech, plánech,
motivacích – tyto kvalitativní údaje musíme vztáhnout k určitým skupinám, proto současně musíme od
lidí získávat i data o jejich osobním, vzdělanostním či finančním pozadí.


Nabízí se nám dvě možnosti – dotazník nebo interview.


Rozhodnutí zda použít dotazník či rozhovor (interview) je determinováno povahou výzkumu a
praktickými možnostmi výzkumníka. Pro příklad: pokud potřebujeme získat informace od respondentů
z celé země je téměř nemožné použít metodu rozhovoru.

Závažné důvody proti rozhovoru jsou: zkreslení vyvolané tazatelem a vysoká nákladnost tohoto
postupu (mnohonásobně vyšší).


Závažné důvody proti dotazníku jsou: nesmírně nízká návratnost (platí především pro poštou
distribuované dotazníky), což může výrazně zkreslit výsledky, které bychom dostali od vzorku
skutečně reprezentujícího zkoumanou populaci (řešení: dotazníky mohou být distribuovány a sbírány
osobně, mizí tím ale finanční efektivita).


Základem všech dotazníků je otázka. Kvalita dotazu pak ovlivňuje hodnotu odpovědi.


Dle předmětu zjišťování:

·         fakta (objektivní údaje);

·         otázky na postoje, názory, mínění, důvody, apod. (subjektivní údaje).


Podle typu proměnné:


·         otázky na kvantitativní údaje (numerické, číselné proměnné) -

            např. počet členů domácnosti, výše nájemného, počet odpracovaných hodin apod.;


·         otázky na kvalitativní údaje (kategoriální, verbální proměnné) -

            např. úroveň dosaženého vzdělání, druh vlastnictví bytu, spokojenost s bydlením apod.


Dle funkce, kterou otázky plní v dotazníku:


·         otázky meritorní - zjišťují údaje o předmětu šetření;


otázky analytické (identifikační, cenzové) - třídicí a identifikační parametry, dle kterých se
provádí analýza (u respondentů: pohlaví, věk, vzdělání, zaměstnání, rodinný stav, místo bydliště
atd. dle záměru zjišťování u zpravodajských jednotek: IČO, počet pracovníků, druh vlastnictví, kraj
apod.);

·         filtrační otázky – používají se v případech, kdy na následující otázku by měla odpovídat
jen část respondentů, která např. vlastní určitou proměnnou nebo znak. Tyto otázky pomohou odlišit
ty respondenty, kteří jsou o určitém problému informováni lépe než ostatní, a tak jejich odpovědi
mohou být pokládány za závažnější. Negativní odpověď na otázku (filtr) vede k pokynu, aby
respondent přeskočil jednu nebo sérii otázek pro něj irelevantních;


·        otázky kontrolní - cílem těchto otázek je prověřit pravdivost odpovědí na základní otázky
dotazníku. S jejich pomocí se oceňuje kvalita získané informace. Zpravidla se kontrolují otázky,
které těsně souvisí se základním cílem a předmětem výzkumu, protože v těchto případech je stupeň
hodnověrnosti (validity) nesmírně důležitý. Obvykle se základní a kontrolní otázky uspořádají
v dotazníku tak, aby dotazovaný nemohl při jejich vyplňování najít přímou souvislost.


pozn. interviewer bias znamená, že tazatel podává určité otázky emocionálně zabarvené, čímž může
ovlivnit odpovědi


Uzavřené otázky

V případě uzavřených otázek jsou respondentovi nabídnuty alternativy odpovědí na danou otázku.
Kategorie použité pro uzavřené otázky musí představovat soubor vyčerpávající všechny možné
alternativy odpovědí, které se vzájemně vylučují.


studna


veřejný vodovod


obojí


podnikatel (fyzická osoba)

                          □


                           akciová společnost

                                                        □


státní podnik

                          □


                           společnost s ručením omezeným

                                                        □


družstvo

                          □


                           jiné ………………………………...

                                                        □


Výhodou uzavřené je relativní snadnost odpovědí pro respondenta, snadnost a jednoznačnost
zpracování odpovědí pro výzkumníka. Na druhou stranu mohou uzavřené otázky příliš schematizovat
problém, resp. podsouvat respondentovi možné odpovědi.


Uzavřené otázky se dále dělí na:

·         otázky dichotomické (two-choice) s možností výběru ze dvou odpovědí;

·         otázky alternativní (polytomické, množné, multiple choice) s možností výběru jedné
z několika  alternativ;

·         otázky výčtové (checklist) s možností označení více odpovědí;

·         otázky pořadové (s uvedením pořadí vybraných alternativ, ranking format)

·         škály pořadové (rating scale).


Otevřené otázky

Jde o formu otázky, kdy respondentovi nejsou předloženy žádné varianty odpovědí a tazatel nebo sám
respondent zapíše jejich úplné nebo zkrácené znění. Tento typ otázek umožňuje spontánní
sebevyjádření respondenta, nicméně je pracnější, jak pro respondenta, tak pro výzkumníka (složitá
analýza a interpretace).


Pořadí otázek

Začátek dotazníku v mnohém ovlivňuje věrohodnost odpovědí. Proto bychom se měli v první fázi tázání
především věnovat vytvoření motivace respondenta k účasti v šetření, vysvětlení jeho cílů a
důležitosti, ujištění respondenta o zachování anonymnosti a ochrany jím sdělených údajů. Je dobré
členit dotazník do tematických oddílů a pečlivě volit načasování citlivých otázek.

Monotónní sérii otázek je nejlépe umístit uprostřed dotazníku, otázky osobního rázu nebo otázky,
kde je nebezpečí, že budou neupřímně zodpovězeny, se dávají spíše na konec; otázky jejichž
zodpovězení se zdá snadno ovlivnitelné, se dávají na začátek, dříve než vlastní téma dotazníku
začne působit.


Při sestavování dotazníku je nezbytné si uvědomit:

·         je otázka nezbytná?


·         bude otázka srozumitelná všem členům vzorku?


·         neptá se otázka na dvě věci najednou? (two-barrels question – dvouhlavňová otázka)


·         není naše otázka sugestivní? (za sugestivní lze považovat takový výrok, jenž navádí
respondenta k jiné odpovědi, než kterou by uvedl na jinak formulovanou otázku stejného obsahu).


U dotazníkové metody platí, že výsledky lze velice snadno kvantifikovat (na rozdíl od jiných metod
používaných zejména v sociologii). Kvantifikace však může být sporná, protože byť shodné odpovědi
v dotaznících nemusí vždy vyjadřovat shodné názory a postoje respondentů (jestliže dva lidé
v dotazníku souhlasí s tvrzením „..Velká Británie by měla omezit svou vojenskou přítomnost
v zahraničí..“ může jeden podporovat návrat k tradičnímu britskému izolacionismu, zatímco druhý být
fanatickým přívržencem odzbrojení).


Související literatura


·         Disman, M., (2000): Jak se vyrábí sociologická znalost. Praha, Karolinum, UK.


·         Nachmias, F.N., Nachmias, D., (1996): Research Methods in the Social Sciences. London,
Arnold, s.223 – 278.


·         ROBINSON, G.M., (1998): Methods & Techniques in Human Geography. Chichester, Wiley.