Papírové dotazníky přepisujeme do elektronické formy - datové matice. Ta představuje soubor kvantifikovaných odpovědí z dotazníku (případně jiných zdrojů dat - testy, pozorování) a její vytváření se řídí předem definovanými pravidly. Tato pravidla je nutné dodržovat, neboť analytické statistické programy počítají s předem danou strukturou dat.
Standardní formát datové matice je určen tak, že v řádcích jsou údaje od jednotlivých respondentů a ve sloupcích jsou pak jednotlivé proměnné (můžeme si je představit jako odpovědi na jednotlivé otázky v dotazníku, záznam o tom, zda jde o muže či ženu, jaký je věk respondenta, apod.)
Důležitou součástí datové matice je proměnná, která jednoznačně identifikuje daného respondenta (standardně se nachází v prvním sloupci a označuje se obvykle ID). ID výzkumník přiřazuje jednotlivým respondentům tak, aby byla zachována jejich anonymita.
Kvantifikace proměnných
Vzhledem k tomu, že se předpokládá kvantitativní analýza získaných odpovědí, kódujeme jednotlivé odpovědi většinou v číselném formátu, a to i tam, kde je odpověď zakotvena verbálně.
Příklad
Likertovu škálu s pěti odpověďmi VŮBEC NESOUHLASÍM - NESOUHLASÍM - ANI SOUHLASÍM, ANI NESOUHLASÍM - SOUHLASÍM - ZCELA SOUHLASÍM kódujeme čísly 1 až 5.
Pohlaví respondenta/ky kódujeme zvolenými čísly, např. 1 (žena/female) a 2 (muž/male).
- Pohlaví je spojováno s biologickými charakteristikami, jako jsou pohlavní orgány a chromozomy. Tyto kategorie jsou založeny na binárním chápání biologického pohlaví.
Gender respondenta/ky kódujeme zvolenými čísly, např. 1 (žena/wonam) a 2 (muž/man).
- Dvě hlavní kategorie genderu muž a žena jsou obvykle spojovány se společenskými a kulturními rolemi, chováním a identitami. Gender je komplexní koncept, který může zahrnovat nejen binární genderové identity žena/muž.
Datová matice vzniká přepisem z vyplněných papírových dotazníků, při větším počtu respondentů jde o poměrně náročnou činnost. Užitečnou praxí je přiřazené ID fixem napsat i na papírový dotazník pro pozdější dohledávání překlepů a nejasností v datové matici. Současně si doporučujeme také udržovat jeden vytištěný dotazník jako vzor, do kterého si dopíšeme ke každé položce kvantifikované kódy jednotlivých variant odpovědí.
V dnešní době se však již stává standardem využívání online dotazníků, kde odpadá krok s přepisem dat do elektronické podoby. Jednoduché dotazníky lze snadno vytvářet například v Google Forms nebo v jiných více univerzálních nástrojích, které pak umožňují exportovat data ve formátu CSV - ten pak umí načíst prakticky jakýkoli analytický software (JASP, IBM SPSS, Microsoft Excel,...).
Kontrola datové matice
Po přepsání dat do datové matice (nebo stažení online datové matice) kontrolujeme celou datovou matici. Kontrolujeme, zda jsou hodnoty proměnných dle nastavených pravidel (kontrolujeme, zda se v matici vyskytují nějaké odlehlé hodnoty), zda nějaká data nechybí, nejsou duplicitní atd.
Příklad
Zjišťovali jsme míru spokojenosti žáků s předmětem na Likertově škále od 1-5. Pokud se objeví v políčku hodnota 13 nebo 7 znamená to, že jsme se uklikli ve sloupci nebo spojili například dva sloupce.