1 Zařazení a název: Lekce 8: Dotazníková šetření Autor (resp. autoři): Jaroslav Nekuda Datum vygenerování dokumentu: Pá 3. listopad 2017, 12:48:24 CET Upozornění: Obsahem tohoto dokumentu je část učebního textu e-learningového kurzu Akademické psaní, která byla vybrána a automaticky převedena z interaktivní osnovy z IS MU za účelem usnadnění tisku a možnosti studia v elektronických čtečkách typu Kindle, iPad apod. Přestože je naší snahou, aby se tento dokument po obsahové stránce v maximální možné míře shodoval se zdrojovou osnovou, nelze vyloučit, že při převodu mohlo dojít ke ztrátě či „zašumění“ některých publikovaných informací, nevykreslení některých obrázků či speciálních symbolů, rozhození formátování a podobným neduhům v důsledku automatického převodu. V případě nejasností je nutné správnost zobrazovaných informací ověřit přímo v příslušné interaktivní osnově v IS MU. V podobném duchu je žádoucí nahlédnout do osnovy v IS MU v případě citovaných zdrojů – úplný seznam literatury není součástí tohoto dokumentu. Tento dokument byl vytvořen výhradně pro studenty kurzu Akademické psaní a bez souhlasu autora není povoleno jej šířit třetím osobám. 1 Empirický výzkum II: dotazníková šetření „Mučíte-li fakta dostatečně dlouho, nakonec se přiznají“ Ronald Harry Coase Tuto část napsal Jaroslav Nekuda. Dotazníková šetření patři do skupiny empirických metod založených na dotazování vybraných jedinců pomocí sady otázek soustředěných obvykle na nějaký aktuální problém. Má různé podoby, jednou je třeba prováděno školeným tazatelem s „papírovým dotazníkem“ nebo notebookem či tabletem, podruhé třeba respondent vyplňuje elektronický dotazník na webu sám. Metoda dává rychlé výsledky a zdá se být – ke škodě věci – jednoduchá. Proto je dnes velice populární; můžeme konstatovat, že dnešní doba je naprosto promořená dotazováním. Kam se jeden hne, tam na něho čeká nějaké dotazování. Dobrý den, měl byste prosím chviličku, provádíme průzkum trhu / zjišťujeme názory na . . . / nechtěl byste se zúčastnit soutěže o cenu – součástí je i zodpovězení několika málo otázek . . . Útoky nejsou jen fyzické, na ulici, v obchodě, institucích, ale i virtuální – na internetu vyskakují dotazovací okna jako divá (kouzlo nechtěného – právě mně na počítači vyskočila žádost o vyplnění dotazníku „Pomozte zlepšit zkušenosti s Adobe Acrobat“), mobilní – Voláme vám ze společnosti X. Y. a rádi bych se vás zeptali . . . Otevřete noviny nebo časopis a vypadne z nich – anketa o ceny, atd. atd. Ťuky, ťuky, ťuk: Jsme ze statistického úřadu a provádíme sčítání lidu, domů a bytů. Přinesli jsme vám takový malý dotazník a chtěli bychom se s vámi domluvit, kdy bychom si pro 2 vyplněný mohli přijít. Dotazníky, dotazníky, dotazníky. Dotazníky všude tam, kam se jeden podívá. Jak to na naší fakultě občas probíhá a proč to není dobré? Měl jsem tu čest se setkat s nesčetnými variacemi následujícího příběhu; text je třeba brát jako „jen velmi mírně nadsazený“. Student(-ka): Dobrý den, přicházím za vámi / nebo posílá mě za vámi pan doktor/docent Tenaten a jestli byste nebyl tak hodný a neporadil mně, co mám dělat. O co se jedná, v čem je problém, člověče, opáčím. Student(-ka): No, my sme tady jako udělali takový jako malý dotazník a sebrali jsme data a teď jako nějak nevím přesně, co mám dělat dál. Aha. A to jste nějak nepřemýšlel, když jste to dělal, nad tím, co se bude dít od začátku až do konce? Student(-ka): éééééééé já jako ehm, tótó, éééé a jako, jo tótó, jako. Ukažte, co to máte. To je ten dotazník? Student(-ka): ano, ano, to je ten dotazník. Kdybyste se na to třeba podíval nebo tak něco. No a o co tady jde? Jaký jste měl cíl, co jste chtěl zjistit, k čemu je to všechno dobré? Student(-ka): Nó my jsme jako chtěli zjistit . . .následuje nějaké ne úplně pochopitelné vysvětlení . . . a tady tohle je ten výsledek jako, ten dotazník jako. Letmo prohlédnu dotazník a vidím, že to je slátanina bez hlavy a paty, která nerespektuje základní metodická ani formální pravidla tvorby dotazníků a jen stěží by se dalo konstatovat, že představuje nějaký rozumný, konzistentní, logicky provázaný rozklad zkoumaného problému do sestavy pokládaných otázek (měřitelných proměnných). Ptám se – víte co znamená anglická zkratka GIGO? Student(-ka): ééééé, tak to sem teda nikdy neslyšel. To fakt nevím (odzbrojující úsměv). To je zkratka pro Garbage In – Garbage Out. Svinstvo dovnitř – svinstvo ven. Lepší překlad by asi byl:pokud shromažďujete pomocí dotazníku nesmysly, výsledkem pak nemůže být nic jiného, než nesmysly. Škoda, že jste se na celou věc nepřipravil nějak dopředu, neprostudoval si nějakou literaturu k metodám a technikám sociologického výzkum a tak. Co teď už s tím? Student(-ka): No já myslel, jako, ééé, že si napíšu jako tady ty otázky, nějaký jako, jó a éééééé. . . No a tady příběh většinou končí. Pokud jsou už data shromážděná, těžko co už s tím; GIGO je doma, vítej! Pokud se student dostavil ještě před sběrem dat, je možné věc zastavit, předělat, připravit lépe. 3 Jednoho docela překvapuje, proč se studenti pouští do věcí s přesvědčením, že to je „náramně jednoduché“. Sami by si asi svépomocí sotva operovali slepé střevo doma „příborákem“ nebo psali nějaké důležité právní dokumenty, když o tom nic nevědí. Prostě „jdou do toho“, vypadá to tak jednoduše a nevinně. Takže první rada, kterou by bylo možné dát, je: všechno chce svoje. Na vysoké škole trvá kurz metod a technik sociologického výzkumu obvykle dva nebo dokonce čtyři semestry. Uznávám, že to sice není „všechna věda světa“, ale . . . Zde, na malém prostoru, není možné suplovat regulérní kurz, proto se ze zkušenosti soustředím jen na několik málo vybraných otázek, které by snad mohly čtenáře zaujmout. První otázka Ta je nejdůležitější. Zní takto: je skutečně nutné dělat nějaký dotazníkový empirický výzkum? Není třeba možné najít požadované informace jinou cestou? Neprováděl třeba už někdo jiný v minulosti podobné šetření s výsledky, které hledám? A co třeba nějaké statistiky, pozorování, rozhovory s experty na danou oblast, historické dokumenty, archívy, dopisy, data na internetu . . . Velice dobrou podotázkou je: nesnažím se vyzkoumat nesmysly? Tropil si z toho v Hospodářských novinách legraci Petr Honzejk: „Ústav pro informace ve vzdělávání provedl reprezentativní průzkum. Vyplynulo z něj, že si žáci základních a středních škol většinou volí další školu sami, ale dost často dají i na radu rodičů. K čertu, to jsou věci, to by nás nenapadlo.“ (2012, s. 24). Dobře, všechno jsme prošli, nic jiného rozumného se nikde nenabízí, jdeme do toho. Druhá otázka Musí být proveden právě výzkum pomocí dotazování? Nenabízí se třeba jiná, efektivnější a vhodnější metoda sběru dat? Jako je třeba pozorování reálného chování lidí, experiment, hloubkové rozhovory s respondenty, ale bez předem dané pevné struktury, rozhovory s experty na danou oblast, analýza nejrůznějších dokumentů, webů, statistik apod. Dobře, všechno jsme zvážili, nic alternativního se nenabízí, jdeme do toho. Otázka materiální – technické, organizační a finanční předpoklady Pokud stále ještě směřujete k realizaci sběru dat pomocí dotazníku, je třeba vzít v úvahu, že taková věc něco stojí. Existuje řada způsobů, jak dotazování s užitím dotazníku uskutečnit. Nejznámější, tradiční, je rozhovor s tazatelem „tváří v tvář“, dále je to telefonní interview nebo rozesílání dotazníků poštou. S rozmachem internetu a počítačů se možnosti a jejich kombinace zmnožují. Když na univerzitě provádíme výzkum mezi absolventy, kteří jsou už jeden nebo dva roky v praxi, posíláme jim dopis se žádostí o vyplnění dotazníku s přihlašovacími údaji s tím, že dotazník fyzicky existuje už jen na webu. Stále častější je také sběr dat v žargonu 4 označovaný jako CAPI (Computer Assisted Personal Interview), kdy tazatel zadává odpovědi respondenta přímo do notebooku (tabletu), CATI (Computer Assisted Telephone Interview), opět s užitím počítače, ale realizovaný telefonicky nebo CAWI (Computer-Assisted Web Interview) – dotazování pomocí on-line dotazníku na webu. Posledně jmenovaná metoda se v posledních letech těší nejen mezi studenty velké oblibě, řada společností nabízí na webu možnost buď zdarma (v limitovaném rozsahu, např. omezení počtu respondentů na 100 osob) nebo za nevelký poplatek poměrně jednoduše sestavit vlastní dotazník, viz např. web SURVIO. Zvažujte výhody a nevýhody jednotlivých způsobů dotazování, pomoci vám v tom může přehled prezentovaný Kozlem (2006:81). Spočítejte si, kolik budete potřebovat dotazníků (pokud budete sbírat data s pomocí klasického, „papírového“ dotazníku), kolik bude stát jejich tisk. Jak budete vybírat a kontaktovat respondenty? Kolik jich bude? Jak je zastihnete – budete je osobně „obcházet“, telefonovat jim, posílat e-maily nebo dopisy či korespondenční lístky? Budete potřebovat nějakou síť tazatelů nebo spolupracovníků? Pokud bude probíhat terénní sběr dat, bude to v rámci jedné instituce, jednoho města, kraje, celé republiky? Jaké budou náklady na cestování, ubytování apod.? Jaký objem dat se bude sbírat a kdo je bude přepisovat do elektronické podoby? Tisk a množení závěrečné zprávy; všechno stojí nějaké peníze, čas a námahu. V neposlední řadě je na stole otázka statistického zpracování dat. Máte k dispozici potřebné programové vybavení a máte alespoň orientační představu o tom, co budete se sebranými daty podnikat? Máte schopnost data odpovídajícím způsobem statisticky zpracovat, interpretovat a prezentovat v závěrečné zprávě? To vše důkladně promyslete a zkalkulujte. Velikost zkoumaného vzorku a techniky jeho výběru Většina dotazníkových šetření má výběrový charakter. Znamená to, že se obvykle nedotazujeme všech členů základního souboru, ale jen pečlivě vybraného vzorku, který by měl základní soubor reprezentovat. Stanovení velikosti vzorku bývá zapeklitým oříškem. Na jedné straně musíme stanovit rozsah tzv. základního souboru, tedy skupiny osob, na kterou budeme chtít zobecňovat získané poznatky. Příkladem rozsáhlého výzkumu a velkého vzorku je například předvolební průzkum, který má odpovědět na otázku, koho lidé hodlají ve volbách volit. Základní soubor v tomto případě představuje veškerá populace ČR s volebním právem. Z této se na základě určitých postupů vybere vzorek – tzv. výběrový soubor o velikosti cca 1000–2000 respondentů a získané výsledky je možné s určitou mírou nepřesnosti (statistickou chybou) zobecnit na celý základní soubor. Podívejte se, prosím, na následující dokument. Jedná se o výsledky výzkumu společnosti Median pro Českou televizi, který se jmenuje Rok Miloše Zemana ve funkci a jmenování vlády. Zajímavá je zejména informace o složení výběrového souboru, který by měl být reprezentativní pro dospělou populaci ČR, je uvedena na straně třetí. Analogicky pak postupujeme i v jiných případech. Zkoumáme například příčiny fluktuace v určitém průmyslovém závodě. Základní soubor by mohli představovat 5 buď všichni zaměstnanci nebo jen osoby zaměstnané v dělnických / manuálních profesích anebo naopak jen zaměstnanci v kategorii „technicko-hospodářští / administrativní“. Následně bude třeba stanovit, jak velký by měl být výběrový vzorek, abychom mohli získané informace považovat za reprezentativní a získané informace mohli zobecňovat na celý základní soubor. Opačným případem výběrových šetření jsou tzv. vyčerpávající šetření, kdy jsou dotazováni všichni jedinci daného souboru: na jedné straně to například může být celá dospělá populace v ČR při sčítání lidu, domů a bytů – tedy miliony respondentů, na straně druhé to může být třeba jen třicítka studentů v jedné třídě s tím, že odpovědi studentů z jiných tříd na škole nás nezajímají. Globálně vzato na stanovení velikosti výběrového souboru existují různé výpočty, které často nemají daleko k alchymii. Jednoduchá je situace, pokud bychom chtěli zkoumat třeba jen jednu jedinou proměnnou, například výši mzdy v nějakém odvětví nebo podniku. Zde je možné stanovit velikost vzorku – při požadované spolehlivosti – poměrně přesně. Například postačí vybrat ze 2000 osob základního souboru při 5% spolehlivosti a znalosti hodnoty rozptylu mezd cca 180 respondentů. V jedné zemi, kde jsou dva prezidentští kandidáti se zhruba stejnou pravděpodobností vítězství, je třeba dotazovat: s 5 % chybou – 400 respondentů, se 3 % chybou – 1 111 respondentů a s 1 % chybou – 10 000 respondentů. Jinou výzvu však představují případy, kdy sledujeme celou řadu různých proměnných s různými charakteristikami (nominální, ordinální, kardinální) a „dopředu“ třeba ještě úplně přesně nevíme, do jaké hloubky v našich analýzách chceme jít, případně jaké statistické testy při zpracování budeme používat. Zde je přesné stanovení velikosti výběrového souboru velice komplikované, ne-li nemožné. Blaikie soudí, že stanovení velikosti výběrového vzorku je vždy kompromisem mezi ideálním a proveditelným, mezi potřebnou velikostí a technickými požadavky a velikostí vzorku, která může být dosažena s dostupnými zdroji. A pokud se ho studenti ptají na velikost vzorku (mluvíme zde o velkých základních populacích), obvykle odpovídá: „Vzorek o velikosti 1000 by byl ideální, nebo dokonce 2000, pokud byste to zvládl, ale i 500 může být dostatečných a dokonce i 300, pokud máte hodně omezené zdroje.“ (Blaikie, 2000, s. 212) Celkově je možné konstatovat, že velikost vzorku bývá u velkých populací častěji než striktním statistickým formulím podřízena disponibilnímu rozpočtu a dostupným organizačním a technickým prostředkům; velice často je to jen otázka prosté uzance. Dobře si všimněte, pokud jsou například v televizních pořadech dotazování různí autoři výzkumů na základě čeho přesně stanovili rozsah právě použitého vzorku – a zda je reprezentativní, zakaboní se, začnou se potit (někteří), tvářit vědecky a vysvětlovat, že to je příliš složité na to, aby se to dalo nějak jednoduše vysvětlit. Pokud bychom měli uvažovat o „velkých“ základních populacích (20–200 tis. osob, nikoli celostátní populace), pak má osobní zkušenost říká, že vzorky se zhruba 6 200–250 náhodně (!) vybranými osobami už mohou začít dávat nějaké docela rozumné výsledky, ano, lépe je 350–400 a když je to možné, tak bych šel až do 550 respondentů. Disman (2009) popisuje několik zajímavých omylů spojených se stanovením vzorku respondentů, v přiloženém souboru uvádíme pro zajímavost dva z nich. Tvorba dotazníku Zde jen několik obecných rad. Konstrukce by měla být plně podřízena účelu a odrážet získané teoretické poznatky. Dotazník není vlastně nic jiného než převedením zkoumaného problému a jeho okolí do soustavy měřitelných proměnných. Při koncipování celého výzkumu je dobré se nejprve zaměřit na celkový teoretický rámec: existuje k tomu, co chceme zjistit, nějaká teorie? Ví se něco o tom, jak se zkoumaná problematika vyvíjela, v jakém je stavu poznání, jak je zmapována? Dotazník by měl být co nejúspornější, neměl by obsahovat zbytečné otázky. Měl by být všem respondentům bezezbytku srozumitelný tak, aby přesně chápali, na co se tazatel ptá. Na jeho začátku byl měl být krátký úvod, ve kterém je vysvětlen účel dotazování, případně i zdůrazněna anonymita získaných informací. Začínat bychom měli otázkami, které dotazované „vtáhnou do děje“, zaujmou, zvýší ochotu respondentů odpovídat. Až je mezi tazatelem a dotazovaným vytvořena určitá důvěra, je možné se ptát ve druhé části nebo poslední třetině na citlivější témata jako jsou třeba příjmy, struktura výdajů domácnosti, postoje k nadřízeným, plány do budoucna apod. Poslední část bývá věnována standardním identifikačním (segmentačním) proměnným jako jsou pohlaví, věk, nejvyšší dosažené vzdělání, společenské postavení, bydliště apod. Důkladně je třeba také zvážit rozsah dotazníku a tím i čas potřebný k jeho vyplnění. Obvykle se uvádí cca 30–45 minutová hranice, poté už mohou být respondenti unavení, méně se koncentrují a už odpovídají „jen aby něco odpověděli“ a dotěrného tazatele se co nejrychleji zbavili. Neplatí to, samozřejmě, absolutně. Zkuste si pro zajímavost změřit v pilotní fázi, kolik času je k vyplnění dotazníku zapotřebí. Svou roli také hraje motivace respondentů k vyplňování dotazníku. Výzkumné agentury často rozdávají respondentům malé dárky, někdy je to ale třeba i láhev dobrého vína, aby byli ochotní s tazatelem strávit více času a odpovědět na více otázek. Nikdo nevytvoří dobrý dotazník hned napoprvé. Proto doporučuji jeho tvorbu v několika krocích. Vytvoření první makety a její testování na několika osobách, nejlépe odlišného stupně vzdělání a z prostředí, kam s dotazníkem míříte: dělníci, studenti, úředníci, mladí, starší . . . Získáte neocenitelnou zpětnou vazbu a impulzy pro další vylepšování dotazníku. Celý proces je vhodné opakovat alespoň dvakrát. Na toto téma si můžeme přečíst doporučení prezentovaná Romanem Kozlem (2006, s. 161–163) nebo několik zajímavých poznámek a příkladů z pera kolegy Aleše Burjanka z FSS MU zde. 7 Studentů končících studia na naší univerzitě i našich absolventů se pomocí dotazníků pravidelně ptáme na celou řadu otázek spojených se studiem a jejich dalším pracovním uplatněním. Všechny závěrečné zprávy najdete na webu RMU v sekci „Čerství absolventi“. Zde se můžete podívat, jak třeba takový dotazník může vypadat (formálního vzhledu si nevšímejte, v originále je to webový dotazník, zde převedený jen do textové podoby). Zpracování dat Když se vám podařilo vyhnout se všem zmíněným nástrahám a máte na stole třeba paklík dotazníků, určitě už dopředu víte, co budete podnikat dále. Víte tedy, že získaná data přepíšete do Excelu (nebo třeba programů IBM SPSS příp. Statistica, ke kterým má univerzita zakoupenou multilicenci) a můžete začít „zpracovávat“. Již při tvorbě dotazníku je dobré mít na mysli, že každá varianta odpovědi – pokud budete zpracovávat kategoriální data (což bude s největší pravděpodobností náš případ) – by měla mít vlastní číselný kód a všechny otázky je třeba průběžně číslovat, „aby se v tom všem“ pak jeden správně vyznal. Malý příklad. Respondent č. 1 v dotazníku zvolil odpovědi označené červeně: O1) Jak jste v současné době celkově spokojen(a) s tím, co vám vaše fakulta (Masarykova univerzita) během vysokoškolského studia „do života“ poskytla? 1. velmi spokojen(a) 2. spíše spokojen(a) 3. něco mezi 4. spíše nespokojen(a) 5. velmi nespokojen(a) 6. nevím O2) Domníváte se, že absolvování vysokoškolského studia na MU bylo z hlediska úsilí, které jste musel(a) během studia vynaložit: 1. velice náročné 2. poměrně náročné 3. něco mezi 4. nebylo příliš náročné 5. nebylo vůbec náročné 6. nevím, nemohu posoudit O3) Jaké byly vaše celkové studijní výsledky, jakého průměru známek se vám za celou dobu studia podařilo dosáhnout? 1. do 1,5 včetně 2. od 1,51 do 2,00 3. od 2,01 do 2,50 4. 2,51 a horšího 8 O4) Jste: 1. muž 2. žena Data přepsaná do programu SPSS (nebo třeba Excelu) by pak vypadala následovně. V řádcích jsou tedy „případy“ (tj. výpovědi jednotlivých respondentů) a ve sloupcích jsou tzv. „proměnné“. A malá část reálné datová matice z výzkumu absolventů MU může vypadat třeba takto: No a pak se můžeme pustit do díla. Manuály k programu IBM–SPSS mají obvykle stovky stránek, mnohé vhodné procedury a testy se budete učit třeba v předmětech Statistika nebo Ekonometrie, takže byste měli být schopni si pak vybrat ty, které budou vhodné k účelu uskutečněného šetření. Nabízí se mj. třídění prvního stupně, třídění druhého (třetího) stupně, srovnání průměrů, analýza rozptylu, korelační a regresní analýza, clusterová analýza, klasifikační stromy . . . a asi milion dalších. Vždy je třeba mít na mysli, s jakým typem proměných pracujeme a také které 9 testy jsou pro daný typ vhodné. Mnoho štěstí . . . Internetové dotazování v praxi - videoprezentace Ondřeje Coufalíka, ředitele společnosti SURVIO Pro studenty ESF MU se v r. 2017 uskutečnila zajímavá přednáška o tom, jak se dělají dotazníky, jak reálně probíhá výzkum pomocí dotazování na internetu s celou řadou zajímavých a srozumitelných tipů a rad „jak na věc“ včetně trendů v měření zákaznické spokojenosti a informací „ze zákulisí“. Velice doporučujeme všem, kteří se o problematiku zajímají. Video trvá něco málo přes hodinu a najdete ho v offline přednáškách AKAPu ve Studiu online (záznam z 12. května 2017). Co je závěrem možné doporučit naprosto vážně je následující: nepouštějte se do dotazování formou dotazníkového šetření, aniž byste si nejdříve přečetli vhodnou odbornou literaturu. Velice doporučuji například knihu Miroslava Dismana Jak se vyrábí sociologická znalost. Je napsána mimořádně poutavě a srozumitelně i pro laika s velkým množstvím praktických a názorných příkladů. V knihovně ESF ji najdete pod signaturou SOC-318. Pěkně a přehledně napsané jsou i Moderní metody a techniky marketingového výzkumu od Romana Kozla, Lenky Mynářové a Hany Svobodové, knihu u nás najdete pod signaturou MAR-504. Doporučená literatura: • BLAIKIE, Norman W. Designing social research: the logic of anticipation. 2nd ed. Cambridge: Polity Press, 2010. ISBN 9780745643373. • DISMAN, M. Jak se vyrábí sociologická znalost. 4. vyd. Praha:Karolinum, 2011. ISBN 9788024619668 • FIELD, A. Discovering statistics using SPSS: (and sex, drugs and rock ‚n‘ roll). 3rd ed. Los Angeles: Sage, 2009. ISBN 9781847879066. • KOZEL, R. Moderní marketingový výzkum: nové trendy, kvantitativní a kvalitativní metody a techniky, průběh a organizace, aplikace v praxi, přínosy a možnosti. 1. vyd. Praha: Grada, 2006. ISBN 802470966X. • PUNCH, K. Základy kvantitativního šetření. Praha: Portál, 2008. ISBN 9788073673819 • ŘEZANKOVÁ, H. Analýza dat z dotazníkových šetření. 3. aktualiz. vyd. Praha: Professional Publishing, 2011. ISBN 9788074310621. • SURYNEK, A. – KOMÁRKOVÁ, R. – KAŠPAROVÁ, E. Základy sociologického výzkumu. Praha: Management Press, 2001. ISBN 8072610384.