Příprava dat před analýzou o uspořádání dat o kontrola přesnosti dat o vytvoření struktury databáze o vkládání dat do PC o transformace dat Uspořádání dat o výzkumná data mohou pocházet z různých zdrojů: dotazníky, rozhovory, měření při experimentech (pretest, posttest), pozorování o je třeba všechny formuláře, dotazníky, záznamové archy atd. řádně označit, aby je vždy bylo možno i zpětně dohledat Uspořádání dat o původní data se u profesionálních výzkumů po určitou dobu archivují (min. 5-7 let) o je vhodné vytvořit si databázi -- přehled všech použitých zdrojů dat (např. v MS Access nebo Excel, Statistica, SPSS) Kontrola přesnosti dat o někdy vhodné provést již při sběru dat -- pak je možno příp. chybějící nebo jinak problematické odpovědi vyřešit na místě o kontrola: čitelnosti odpovědí, úplnosti odpovědí, důležitých informací (datum, jméno výzkumníka atp.) o je vhodné z dalších kroků vyloučit nevalidní odpovědi (na všechny otázky stejné atd.) Vytvoření struktury databáze o data je možno vkládat přímo do statistických programů nebo do databázových programů (a potom je převést) o rozsáhlé výzkumné projekty mají vytištěnu podrobnou kódovací příručku (codebook) s popisem proměnných Vytvoření struktury databáze pro každou proměnnou: o jméno proměnné (např. pohlaví) o popis proměnné (např. celkový skór dotazníku deprese) o popis hodnot proměnné (např. 1=chlapci, 2=dívky) o způsob kódování chybějících hodnot (např. 9) o formát proměnné (numerický, textový, datum...) Vkládání dat do PC o pro kontrolu přesnosti vkládání existují nejrůznější postupy o např. dvojité vkládání (double entry) -- speciální program, který při druhém vkládání porovnává data s původním údajem a upozorní na chyby; není příliš rozšířeno Vkládání dat do PC o jednodušší je náhodně zkontrolovat určitý počet případů (při velkém procentu chyb kódovat znovu a porovnat) o vždy je nutno alespoň zkontrolovat, zda rozsah zadaných hodnot odpovídá předpokladům (v programu STATISTICA odkaz Data - Verify Data) Transformace dat o obrácení položek --některé položky bývají formulovány v opačném směru než zbytek škály; o jejich hodnoty je třeba překódovat (např. u 5 bodové škály se bude 1 rovnat 5, 2 bude 4 atd. až 5 bude 1) Transformace dat o vzorec pro obrácení škály nová hodnota = nejvyšší hodnota +1 -- stará hodnota o ve STATISTICE se vzorec zadává v definici proměnných -- do rámečku pro dlouhý název proměnné Transformace dat o výpočet celkových skórů -- většinou součtem hodnot několika proměnných (příp. průměr atp.) o zadá se příslušný vzorec, např. pro součet celk = p1 + p2 + p3 o nebo ve STATISTICE rovnou funkce (sum, mean) Transformace dat o sloučení hodnot proměnných -- např. ze 7 bodové škály chceme udělat 3 bodovou; nebo z věku zadaného v letech vytvořit 3 věkové skupiny o ve STATISTICE se zadává v Data -- Recode Values of Variable Příklady o Vytvořte strukturu databáze, obsahující tyto proměnné: o 1) číslo osoby o 2) jméno osoby o 3) věk (v letech) o 4) pohlaví (0 = muž, 1 = žena) o 5 ) rodinný stav (0 = svobodný, 1 = ženatý/vdaná, 2 = rozvedený, 3 =vdovec/vdova) o 6) příjem (Kč/měsíc) o 7) počet dětí o 8) odpověď na položku Většinou jsem se sebou spokojen (1 = vůbec nesouhlasím, 2 = spíše nesouhlasím, 3 = něco mezi, 4 = spíše souhlasím, 5 = zcela souhlasím) o 9) odpověď na položku Občas si připadám jako bezcenný člověk (1 = vůbec nesouhlasím, 2 = spíše nesouhlasím, 3 = něco mezi, 4 = spíše souhlasím, 5 = zcela souhlasím -- popisy hodnot je možno kopírovat z předchozí položky) o 10 ) odpověď na položku Mám sám sebe rád (1 = vůbec nesouhlasím, 2 = spíše nesouhlasím, 3 = něco mezi, 4 = spíše souhlasím, 5 = zcela souhlasím) Příklady o Data uložte do souboru pod názvem esteem o Zadejte fiktivní data 5 -- 10 osob: u jedné z osob budou některé údaje chybět (např. neuvedla příjem a odpověď na položku 8) o Zkontrolujte, zda rozsah hodnot proměnných u zadaných dat odpovídá předpokládanému rozsahu Příklady o Vytvořte novou proměnnou -- celkové sebehodnocení, která bude průměrem z položek 8 -- 10 (! Ještě předtím je třeba obrátit položku 9, která je formulována v opačném směru než ostatní dvě) Příklady o Vytvořte novou proměnnou, která rozdělí soubor na dvě skupiny -- bezdětné osoby a osoby s alespoň jedním dítětem (zkopírujte proměnnou 7 a potom rekódujte její hodnoty) o Vytvořte novou proměnnou, která rozdělí soubor na tři příjmové skupiny -- osoby s příjmem pod 10 tis. Kč, 10 tis. -- 20 tis. Kč a nad 20 tis. Kč (zkopírujte proměnnou 6 a potom rekódujte její hodnoty) Příklady o u všech proměnných (včetně nově vytvořených) určete, na jaké úrovni měření jsou měřeny