Metodologie pro ISK 2, jaro 2014. Ladislava Z. Suchá 1 Metodologie pro Informační studia a knihovnictví 2 Modul I: Opakování. Základní termíny. Tvorba dotazníku. Online nástroje pro sběr a administraci dat. Minulý semestr jsme se věnovali návrhu dobrého výzkumu. Víme tedy, jak zrealizovat výzkum tak, aby byl validní a reprezentativní. V tomto semestru se budeme zabývat prací s daty – ukážeme si, jak co nejlépe vytěžit a zhodnotit výsledky výzkumu. Co se dozvíte v tomto modulu? • Co je to proměnná, hodnota proměnné, jaké jsou druhy proměnných? • Co jsou to hypotézy a kdy se používají? • Jaká jsou základní pravidla pro tvorbu (online) dotazníků? 2 Základní termíny Při vyhodnocování kvantitativních výzkumů pracujeme s velkým množstvím standardizovaných dat. Proto je velmi důležité vědět, jak tato data organizovat a dále s nimi pracovat. Nejprve si pojďme zopakovat základní termíny z minulého semestru: Proměnná (znak) a její hodnoty Při měření kvantitativních jevů nejprve vytváříme operační definici pojmů, které měříme. Tzv. operacionalizace znamená převedení těchto pojmů na indikátory neboli měřitelné proměnné (znaky). Např. vzdělání respondentů můžeme měřit jako proměnnou „dokončené vzdělání“, která bude nabývat hodnot „základní“, „středoškolské bez maturity“, středoškolské s maturitou“ atd. (Reichel 2009, s. 55). Operacionalizace pojmu vzdělání respondentů je určitě jednoduchým příkladem. Existují ale pojmy, které je složitější operacionalizovat – příkladem může být např. spokojenost uživatele s knihovnou. Při operacionalizaci podobně složitých pojmů je dobré postupovat ve třech krocích: a. Vyhledat množství definic pojmu. Například spokojenost uživatele s knihovnou můžeme definovat pomocí normy ISO jako „vnímání zákazníka týkající se stupně splnění jeho požadavku“ (ČSN ISO 9000). Jinou definici můžeme nalézt v modelu spokojenosti a loajality uživatelů vyvinutý ve spolupráci dánských knihoven pod odbornou garancí Dánského knihovního úřadu (Styrelsen for Bibliotek og Medier). 3 Obr. 1: The user satisfaction and loyalty model (Martensen & Gronholdt, 2003) b. Zvolit si nejrelevantnější definici. Hned na začátku výzkumu se musíte rozhodnout, jaká definice je pro váš výzkum nejrelevantnější. Můžete si také stanovit definici vlastní, musíte ji však vždy zdůvodnit. c. Proveďte dekompozici pojmu / výzkumného problému. Výše uvedená definice Martensena a Gronholdta například říká, že model spokojenosti zahrnuje spokojenost s elektronickými zdroji, spokojenost s tištěnými publikacemi, s ostatními službami, s technickým zázemím, s prostředím v knihovně a s personálem. Každá z těchto položek jde dále ještě rozložit na nižší měřitelné jednotky. Například spokojenost s personálem můžeme ještě rozložit na tyto indikátory: • spokojenost s odborností personálu, • spokojenost s ochotou personálu, • spokojenost s dostupností personálu. Podobným způsobem bychom si mohli rozložit všechny součásti pojmu spokojenost uživatele s knihovnou., Na konci bychom dostali určité množství indikátorů, které by tuto spokojenost měřily. Při konstrukci výzkumného nástroje (v případě kvantitativních výzkumů typicky dotazníku, ale může se jednat např. i o tabulku pro zapisování výsledků standardizovaného pozorování) je třeba dbát na to, aby proměnné byly rozlišitelné (znak nabývá různých hodnot), úplné (jsou vyčerpány všechny hodnoty) a jednoznačné (hodnoty znaku se nepřekrývají, jsou výlučné). Reliabilita a validita indikátorů Indikátory jsou realiabilní neboli spolehlivé, získáváme-li opakovaně stejné výsledky. Znamená to, že všichni respondenti porozuměli otázce stejně, respondenty nemohla ovlivnit různým způsobem osoba tazatele, kódování bylo provedené stejně pro všechny případy. Spolehlivost indikátorů ale sama o sobě nezaručuje, že měření bude validní. Indikátory jsou validní neboli platné, měří-li skutečně pojem, který jsme měřit chtěli. Pokud respondenti rozumí pojmu stejně jako my a chápou stejně měřítka, která používáme. 4 Druhy proměnných Rozlišujeme tři druhy proměnných: • Nominální proměnné nabývají nečíselných hodnot a nelze je uspořádat hierarchicky či podle velikosti (nemůžeme určit, která hodnota proměnné je vyšší než jiná. Speciálním případem nominálních hodnot jsou dichotomické proměnné (muž/žena, ano/ne). Nominální proměnnou může být např. stav, bydliště, oblíbená barva apod. • Ordinální proměnné nabývají hodnot, u kterých můžeme s jistotou tvrdit, že jedna je vyšší než druhá, nemůžeme však s jistotou tvrdit, o kolik je vyšší. Ordinální proměnnou je například vzdělání, volně formulované frekvence činností. • Kardinální proměnné nabývají skutečných měřitelných číselných hodnot – kardinální proměnnou je například věk, počet dětí, výše platu. Speciálním případem kardinálních proměnných jsou intervalové proměnné (např. výše platu měřená intervaly 0-10000, 10001-20000, 20001-30000…). Ovlivňující proměnná se nazývá nezávisle proměnná, ovlivňovaná proměnná se nazývá proměnná závislá. Hypotézy Hypotézy jsou výroky o dosud neprokázaných vztazích mezi dvěma nebo více proměnnými. Jsou formulovány stručně a jasně, ideálně ve formě jedné oznamovací věty. Hypotézy by měly být vždy formulované tak, aby byly ověřitelné, a všechny proměnné musí být definovány operacionálně (jinými slovy tak, že je jasné, jak budou měřeny). Při formulaci hypotéz postupujeme tak, že si nejprve stanovíme tzv. vstupní hypotézu, kterou si zpřesníme na několik pracovních hypotéz tak, že provedeme dekompozici výzkumného problému (rozložíme si tedy zkoumané koncepty na co nejmenší zkoumatelné dílky). Pracovní hypotézy lze postupně zpřesnit a formulovat i jako hypotézy statistické. Příklad vstupní a pracovní hypotézy: • H (vstupní hypotéza): Lidé chodí do knihovny z mnoha důvodů, které se liší podle jejich sociodemografických, vzdělanostních a dalších charakteristik. • H1 (pracovní hypotéza 1): Důvody chození do knihovny se liší podle pohlaví. • H2 (pracovní hypotéza 2): Důvody chození do knihovny se liší dle věku. • H3 (pracovní hypotéza 3): Důvody chození do knihovny se liší dle dosaženého vzdělání. • … 5 V tomto příkladu jsme provedli dekompozici výzkumného problému a máme nyní čtyři proměnné (závislou proměnnou „důvody chození do knihovny“ a tři nezávislé proměnné: pohlaví, věk a dosažené vzdělání). Deskriptivní a induktivní statistika Formulace hypotéz je důležitá zejména ve výzkumech, kdy používáme induktivní statistiku. Ve výzkumech, které počítají jen se statistikou deskriptivní, si vystačíme s výzkumnými otázkami. Deskriptivní statistika Induktivní statistika • Jednoduchý popis a sumarizace souborů • Dává odpověď na otázku po prostých četnostech hodnot jednotlivých proměnných (třídění prvního stupně), případně po četnostech rozlišených dle kategorií (třídění druhého a dalších stupňů) • Na základě prosté deskriptivní analýzy nelze zobecňovat na populaci • Způsob přenášení závěrů analýzy z výzkumného vzorku na celou populaci. • Je založená na matematických statistických modelech a teoriích pravděpodobnosti. • Pomocí induktivní statistiky lze zobecnit na populaci s určitým stupněm spolehlivosti. Tvorba dotazníku Velkou většinu semestru budeme trávit analýzou dat, která získáme standardizovaným dotazníkem. O tvorbě dotazníků existuje celá řada zdrojů, proto si pojďme zopakovat jen to nejdůležitější. Než začneme vytvářet dotazník… Před samotným vytvořením dotazníku bychom si měli být jistí odpovědí na následující otázky: • Máme dobře rozpracovaný výzkumný problém? Provedli jsme dobře dekompozici a máme tedy pojmenované a definované všechny proměnné, které potřebujeme změřit? 6 • Budeme přebírat existující dotazník nebo vytvoříme dotazník nový? Neexistují už ověřené měřící nástroje, které měří to, co chceme? • Jak budeme dotazník distribuovat? Stačí nám papírová forma nebo budeme vytvářet online dotazníkový formulář? Jaké požadavky na dotazník máme? O rozpracování výzkumného problému už byla řeč, pojďme se podívat na vytváření a distribuci dotazníku… Existující nebo nový dotazník? Vytvářet nový dotazník není jednoduchá činnost – je zapotřebí hlídat reliabilitu i validitu výzkumného nástroje, a to vyžaduje celou řadu testů. Existuje celá řada standardizovaných dotazníků i sad otázek, které můžeme využít. Využití standardizovaného dotazníku má navíc velkou výhodu – můžeme naše data porovnat snadno se závěry jiných výzkumníků. Výhody využití existujících a vytváření nových dotazníků Využití existujících nástrojů Vytvoření nového dotazníku • Používáme již otestovaný nástroj (validita, reliabilita). • Máme možnost porovnat naše výsledky s výsledky předchozích výzkumů. • Pokud nejsme zkušení výzkumníci, je převzetí dotazníku sázkou na jistotu. • Nadesignování dotazníku přímo pro náš výzkumný problém. • Možnost přizpůsobení lokálním podmínkám. V praxi lze samozřejmě oba přístupy kombinovat – například využít sady otázek z existujících dotazníků a další otázky k nim přidat. Na tomto principu fungují například dotazníky zjišťující spokojenost se službami knihoven (http://vyzkumy.knihovna.cz/dotazniky). V našem oboru je příkladem standardizovaného dotazníku například dotazník na měření fenoménu úzkosti z knihoven od Sharon Bostick. Dotazník byl přeložen do českého jazyka v rámci bakalářské práce Moniky Machovské. 7 Online nástroje pro sběr a administraci dat Existuje celá řada online nástrojů pro sběr a administraci dat. Liší se cenou (ta se pohybuje od licencí zdarma až po tisícové položky za měsíc), funkcemi, dostupnými variantami otázek, ale i možnostmi distribuce a designu dotazníků. Než se rozhodnete, v jaké aplikaci budete dotazník vytvářet, je tedy potřeba rozmyslet všechny požadavky, které by měl nástroj splňovat (některé nástroje neumí speciální typy otázek, některé neumožňují grafickou customizaci šablon). Příklady služeb pro tvorbu dotazníků: • Google Spreadsheets • Survey Monkey • SurveyGizmo • Polldaddy • Survs • Survio (české) • Easyresearch (český) Služby Vyplňto.cz mohou studenti KISKu využívat v rámci svého studia zdarma: http://www.vyplnto.cz/studentske-registrace. Specifika online výzkumů1 Většina studentských výzkumů probíhá dnes formou online dotazníků. Pro online dotazování se často používá zkratka CAWI (Computer Assisted Web Interviewing). Online dotazníky umožňují získat velké množství dat rychleji, efektivněji a často i pro respondenty zajímavou formou. Je-li k online dotazování využito správného nástroje, poskytuje tato forma dotazování řadu výhod, především: • výrazně snižuje časový interval sběru dat, • eliminuje chyby při sběru dat (filtrování otázek a implementace logických posloupností se odehrává bez toho, aby o tom respondent věděl), • poskytuje možnost okamžité a průběžné kontroly výsledků a jejich základní analýzy, • obsahuje možnost zapojení multimédií (videa, obrazu, zvuku…), • eliminuje finanční náklady na tisk dotazníků a tazatele atd., • umožňuje i vyplnění poměrně dlouhého dotazníku (např. delšího než při telefonickém dotazování), aniž by respondent formulář opustil, • získaná data lze snadno exportovat do různých formátů (.csv, .xls, .sav atd.), 1 Vychází z článku Suchá, L. Měření spokojenosti online: Sběr a administrace online dotazníků. Knihovny oučasnosti 2012 - sborník. Ostrava: Sdružení knihoven ČR, 2010. 8 • distribuce dotazníku může probíhat současně několika kanály (zasláním html odkazu, zveřejněním na stránkách atd.), • snadnou integraci dotazníku do webových stránek knihovny formou iframe nebo pop-up oken - pro umístění stačí jen jednoduché vložení kódu (embed). Metoda CAWI má však i řadu slabých stránek, se kterými je potřeba počítat: • výzkumná skupina, kterou jsme schopni oslovit, nemusí být reprezentativní vzhledem k celkové populaci registrovaných čtenářů knihovny – podle údajů Eurostatu (2009) má pouze 54 % českých domácností přístup k internetu, přičemž obrovský rozdíl v používání internetu existuje mezi různými věkovými skupinami (zatímco ve věkové skupině 12-19 let využíván internet 90 % populace, mezi seniory nad 60 let pouze 14 %), • obtížná je možnost kontroly identity respondenta, • míra návratnosti závisí na formě distribuce dotazníku, • snižuje možnost pokládat komplexní a náročné otázky. Design a implementace online dotazníků tedy vyžaduje velký důraz na kontrolu rizika nízké návratnosti, reprezentativnosti a výběrové chyby (Vicente, Reis, 2010). Na řadu úskalí online dotazování upozorňuje také Ryšavý (Ryšavý 2011), který připomíná, že online dotazování bývá většinou cenzovní šetření s nízkou návratností a s výsledky nelze zacházet jako s reprezentativními daty získanými pomocí náhodného výběru. Nemůžeme v nich pracovat se statistickou významností tak, jako v reprezentativních šetřeních. Ryšavý však tyto druhy výzkumů nezavrhuje – nízká návratnost nemusí automaticky znamenat chybné výsledky: „ Jde spíše o to, jak zhodnotit informace o nerespondentech, které mají výzkumníci k dispozici, a jak tuto zprávu zprostředkovat nejen odbornému publiku.“ (Ryšavý 2011, s. 100). 6 tipů na zvýšení návratnosti online dotazníků Faktorům ovlivňujícím návratnost online dotazníků byla v posledních letech věnována řada výzkumů. Vicente a Reis (2010) stanovili šest oblastí, které míru návratnosti online dotazníků ovlivňují: 1. Obecná struktura dotazníku. Předchozí výzkumy ukázaly, že existují rozdíly mezi návratností online dotazníků, které jsou rozděleny na několik stran a delších dotazníků, kde musí respondent rolovat stránku. Rozdělení dotazníku do několika stran bez nutnosti rolování zvyšuje míru vyplněných a dokončených dotazníků (Lozar Manfreda, Batagejl a Vehovar, 2002). 2. Délka dotazníku. Délka dotazníku má vliv především na míru opuštění online formuláře v průběhu jeho vyplňování, dále také na míru výběru odpovědí typu „nevím, nemohu odpovědět“, která stoupá spolu s délkou dotazníku (Deutskens et al, 2004). 9 3. Sledování pokroku ve vyplňování. Součástí online dotazníků by mělo být i sledování pokroku ve vyplňování (formou grafického znázornění nebo zprávy Zbývá vyplnit XX % otázek / stran dotazníku atd.). Důležitější než samotný pokrok je ale vnímání tohoto pokroku samotným respondentem (nevidí-li hned zpočátku jasný pokrok ve vyplňování, míra opuštění dotazníku se zvyšuje). 4. Vizuální prezentace. Množství výzkumů sledovalo i roli vizuální prezentace. Vyšší míra vyplnění online dotazníků je zaznamenána u designově střídmých dotazníků. Oproti tomu vizualizace určitých prvků (např. log, ukázek zboží) může zvyšovat míru odpovědí na konkrétní otázku (Deutskens, et al. 2004). 5. Interaktivita. Interaktivní dotazník reaguje na respondenta – využívá filtrovacích otázek, změny řazení odpovědí atd. Interaktivita dotazníku ovlivňuje především kvalitu získaných dat. 6. Formát otázek a odpovědí. Složité otázky a otevřené otázky zvyšují dle výzkumů míru opuštění dotazníku před jeho kompletním vyplněním (Lozar Manfreda, Vehovar, 2002). Významný rozdíl oproti tomu nebyl nalezen např. mezi odpověďmi formou tlačítek (radio buttons) a výběrem odpovědí (drop down boxes). Formulace otázek v dotazníku Ještě důležitější než zvýšení návratnosti je však mít metodologicky správně postavený dotazník, s dobře formulovanými otázkami. K formulaci otázek můžeme přistoupit tehdy, máme-li dobře provedenou operacionalizaci a jsou nám tedy jasné všechny proměnné, na které se chceme dotazovat. Existuje celá řada požadavků pro formulaci otázek v dotazníku (např Jarrett & Gaffney 2009). Mezi nejdůležitější patří tyto zásady:  Používejte jednoduchý jazyk, kterému respondenti rozumějí. Potřebujete se zeptat, zda respondentům vyhovuje v knihovně mezinárodní desetinné třídění? Zda využívají hledání podle signatur? Zda by využili QR kódy? Zeptejte se tak, aby tomu rozuměli!  Ptejte se tak jednoznačně, aby všichni rozuměli otázce stejně. Zeptáte-li se například „Jak často čtete?“ (Někteří respondenti mohou odpovídat na to, jak často čtou knihy, jiní mohou do odpovědi zařadit i noviny a časopisy atd.).  Ptejte se na reálné zážitky či chování. Vyvarujte se hypotetických otázek, na které nemohou respondenti odpovědět na základě vlastní zkušenosti (předvídat vlastní budoucí chování je vždy problematické).  Ptejte se vždy pouze na jednu věc. Otázky, které ve skutečnosti obsahují dvě podotázky, se nazývají odborně dvouhlavňové. Jedná se o otázky typu „Jak často 10 čtete knihy a časopisy? (respondent může číst každý den časopisy, ale knihy jen výjimečně, přesto bude mít na tuto otázku stejné skóre jako vášnivý čtenář).  Nepokládejte návodné otázky. Příkladem návodné otázky může být například sugestivně položený dotaz „Všeobecně se ví, že čtení pomáhá dětem zlepšovat vztah ke světu i k sobě samým. Čtete se svými dětmi?“. Speciálním případem návodných otázek může být používání autorit (např. „Souhlasíte s názorem emeritního profesora XY, že…?“  Dejte si pozor na používání záporů. Například otázka „Souhlasíte s tím, že by se erotická beletrie neměla půjčovat náctiletým?“ nemusí být pro všechny jednoduše pochopitelná.  Používejte pojmy, které mají pro každého stejný význam. Například časová určení „často“, „málokdy“ atd. může každý vnímat jinak.  Seskupujte otázky podle smyslu tak, aby jim respondent velmi snadno rozuměl a neztratil se v kontextu.  Používejte jasné časové a místní rámce. Chcete-li se zeptat například na frekvenci čtení, připojte upřesnění časového období (například „Jak často jste v uplynulém roce četl beletrii?“  Dejte si pozor na příčinnou souvislost. Příkladem otázky, která podsouvá příčinnou souvislost je třeba „Zařídil/a jste si kvůli rostoucí ceně knih průkazku do knihovny?“.  Podobně si dejte pozor i na neodůvodněné předpoklady. Špatně položená otázka je i „S ohledem na stav našeho školství, myslíte si, že je dobré poslat své dítě do státní školy?“  Vyčerpejte všechny možnosti. Nabízíte respondentům všechny možnosti odpovědi? Pokud si nejste jistí, připojte odpověď „nevím“ a „jiné, prosím upřesněte“.  Zbavte se zbytečných otázek! Projděte si dotazník ještě jednou a dejte si pozor, zda nemáte zbytečně v dotazníku otázky, které se opakují, či zbytečně zjišťují stejnou věc (pokud neslouží ke kontrole kvality odpovědí). Dramaturgie dotazníku Stejně důležitá jako dobrá formulace otázek je i dramaturgie dotazníku. Na začátek dotazníku je vhodné umístit jednodušší otázky, které uvádějí do tématu. Složitější otázky a obsáhlejší baterie je vhodné umístit doprostřed dotazníku, naopak otázky citlivější a otázky na sociodemografické údaje je vhodné umístit na konec dotazníku. U složitějších dotazníků je vhodné využívat filtrační otázky, které filtrují nerelevantní otázky. Například na názor na práci knihovního personálu na výpůjčním pultu se budeme ptát pouze respondentů, kteří dříve uvedli, že využívají výpůjční knihovní služby. 11 U složitějších dotazníků je také vhodné využívat přechodů, vysvětlení – provést respondenta dotazníkem. Pokud je to možné, dělte otázky tematicky do oddílů a sdělte respondentům, co je v jednotlivých oddílech čeká. Průvodní dopis Při tvorbě dotazníku nezapomínejte na komunikaci s respondentem, především na oslovení. To by mělo obsahovat: • oslovení (personalizované oslovení znamená mnohem vyšší míru návratnosti), • zdůvodnění výzkumu (pokud se vám podaří přesvědčit respondenta, že je výzkum důležitý a potřebný, zafunguje to dokonce lépe než dárky a odměny za vyplnění), • prohlášení o anonymitě, • informaci o tom, kdo výzkum dělá a jak bude naloženo s daty. Instrukce pro vyplňování Především v případě složitých dotazníků dbejte na pečlivé instrukce. Ne všechny online aplikace umožňují vkládat text mezi otázky (umí to například Survs.com). Pokud potřebujete respondenta provést dotazníkem, ověřte si, zda to aplikace, kterou chcete použít, umí. Jarrett a Gaffney (2009) o psaní instrukcí ve webových formulářích a dotaznících říkají: a. Pište instrukce jednoduchým jazykem: využívejte známé termíny, aktivní věty (oslovujte přímo respondenta, nepožívejte trpný rod), nepoužívejte dlouhá souvětí a nekonečné odstavce, místo nich volte raději odrážky – rozbijte graficky text, používejte smysluplné nadpisy sekcí dotazníku. b. Seškrtejte instrukce, které jsou zbytečné: zbavte se textu, který není nutný. c. Vložte instrukce opravdu tam, kde jsou potřebné. A závěrečná rada… Svůj dotazník vždy nejprve otestujte! Testování vám pomůže odhalit chyby, kterých jste si nemuseli při tvorbě otázek všimnout. Pro testování vám stačí několik málo respondentů, ideálně přímo z vaší výzkumné populace. Pokud to z nějakého důvodu možné, otestujte dotazník alespoň na svých spolužácích, rodině, přátelích… 12 Literatura Connaway, L. S., & Powell, R. R. (2004). Basic research methods for librarians. Library and information science text series. Westport, Conn: Libraries Unlimited. Denscombe, M. (2006). Web-based questionnaires and the mode effect: An evaluation based on completion rates and data contents of near-identical questionnaires delivered in different modes.Social Science Computer Review, 24(2) 246-254. Deutskens E., de Ruyter K., Wetzels M., Oosterveld P. (2004). Response rate and response quality of internet-based surveys: an experimental study. Mark. Lett. 15(1), 21–36. Eurostat. (2009) Internet usage in 2009 - Households and Individuals. WWW: http://epp.eurostat.ec.europa.eu/cache/ITY_OFFPUB/KS-QA-09-046/EN/KS-QA-09-046- EN.PDF. Jarrett, C., & Gaffney, G. (2009). Forms that work: Designing Web forms for usability. Amsterdam: Morgan Kaufmann. Lozar Manfreda, K., Batagelj, Z. & Vehovar, V. (2002): Design of Web Survey Questionnaires: Three Basic Experiments. Journal of Computer-Mediated Communication, 7 (3). Martensen, A., Gronholdt, L. (2003). Improving library users’ perceived quality, satisfaction and loyalty: an integrated measurement and management system, Journal of Academic librarianship, 2003, 29(3), pp.140-147. Reichel, J. Kapitoly metodologie sociálních výzkumů. Praha: Grada, 2009. Ryšavý, D. (2011). Úskalí on-line dotazování při měření postojů vysokoškoláků a pracovníků vysokých škol. Data a výzkum - SDA Info, 2011, roč. 5, č. 1, s. 85-103. Vicente, P., Reis E., (2010). Using Questionnaire Design to Fight Nonresponse Bias in Web Surveys. Social Science Computer Review, May 1, 2010; 28(2): 251 - 267.