Statistická analýza dat oKontakt na vyučující: o Mgr. Helena Klimusová o Psychologický ústav FF MU o A. Nováka 1, Brno o budova C – 5. patro otel. 549494035 oe-mail klimusov@fss.muni.cz okonzultační hodiny v JS 2004: pondělí 14.00-15.00 o Statistická analýza dat ocíl kurzu oorganizace výuky oosnova kurzu odoporučená literatura ohodnocení o o Cíl kurzu oobeznámit se s metodami a základními postupy statistické analýzy onaučit se používat statistický software SPSS ozískat znalosti potřebné pro popis, analýzu a interpretaci výsledků kvantitativního výzkumu otyto znalosti aplikovat při analýze dat bakalářských a diplomových prací onaučit se číst a porozumět metodám a výsledkům statistické analýzy ve výzkumných zprávách publikovaných v odborném tisku Doporučená literatura oHealey, Joseph F. Statistics: A Tool for Social Research. 3. vyd. Belmont, California: Wadsworth, 1993. oDisman, Miroslav. Jak se vyrábí sociologická znalost. Praha: Karolinum, 1993. oSwoboda, Helmut. Moderní statistika. 1. vyd. Praha: Svoboda, 1977. oGregor, Miroslav, Přadková, Svatomíra, Spěšná, Daniela. Statistika pro sociology. 2. vyd. Brno MU 1993. Statistika - úvod ovymezení statistiky oúloha statistiky v psychologickém výzkumu ozákladní pojmy - měření, proměnné (diskrétní a spojité proměnné; podle úrovně měření); popisná a induktivní statistika; populace a vzorek opříprava dat před analýzou Definice statistiky oStatistika je vědní obor zabývající se zkoumáním jevů, které mají hromadný charakter. oStatistika je soubor metod, které nám umožňují rozhodnutí v případě nejistoty. o o Definice statistiky oAnalýza dat náhodného charakteru, která předpokládá použití pokročilejšího aparátu matematiky a určitého matematického modelu (teorie pravděpodobnosti). o Definice statistiky oStatistická analýza jsou záhadné, někdy až prapodivné manipulace s daty získanými pomocí experimentu, jejichž cílem je zastřít ten fakt, že výsledky nemají pro lidstvo žádný zobecnitelný význam. Obvykle jsou při ní používány počítače, což této proceduře propůjčuje další auru nereálnosti. o Role statistiky ve výzkumu opři výzkumu v sociálních vědách jsou střídavě používány deduktivní a induktivní postupy ostatistika se uplatňuje u induktivních postupů o(deduktivní postupy – z teorie jsou odvozeny hypotézy a z nich postup pozorování/měření; induktivní postupy: z pozorování jsou odvozeny obecné závěry, které mohou modifikovat teorii atd.) Proměnné opři výzkumu psychologové získávají, měří a analyzují proměnné Proměnné opři výzkumu psychologvé získávají, měří a analyzují proměnné oproměnná je objekt, který může nabývat různých hodnot (na rozdíl od konstanty) Proměnné ojsou rozlišovány různé typy proměnných o o Proměnné ojsou rozlišovány různé typy proměnných opodle jejich role ve výzkumném plánu -závislé, nezávislé, intervenující okvalitativní (kategoriální) a kvantitativní (ty dále na spojité a diskrétní) opodle úrovně měření – nominální, pořadové, intervalové a poměrové o Závislé a nezávislé proměnné opříklad experimentu: chceme zjistit účinnost prostředku na zlepšení paměti u seniorů ve srovnání s placebem Závislé a nezávislé proměnné onezávislá proměnná – podávaný prostředek (testovaný lék x placebo) ozávislá proměnná – výkon v testu paměti (např. počet vybavených slov) omožné intervenující proměnné – ochota užívat léky, podmínky při testu o Závislé a nezávislé proměnné ojiný příklad: Milgramův experiment s poslušností vůči autoritě Závislé a nezávislé proměnné onezávislá proměnná – viditelnost a slyšitelnost žáka a přítomnost autority ozávislá proměnná – nejvyšší hodnota uděleného šoku omožné intervenující proměnné –pohlaví učitele/žáka atd. o Závislé a nezávislé proměnné onezávislá proměnná – ta, se kterou experimentátor manipuluje (independent variable) ozávislá proměnná – proměnná měřená experimentátorem (dependent variable) ointervenující proměnná – e. se snaží její vliv eliminovat (znáhodňováním, vyrovnáváním) (intervening variable) o Kvalitativní a kvantitativní data okvalitativní (kategoriální) – zjišťujeme hodnotu znaku – kategorii (např. pohlaví, náboženské vyznání, rodinný stav, barva očí, vzdělání); často fungují jako nezávislé proměnné (faktory); (categorial data) okvantitativní (metrická) data – zjištěná měřením pomocí nějakého nástroje (v širším smyslu); skór v testu, tělesná váha…; obvykle závislé proměnné (measurement data) Úroveň měření okategoriální proměnné jsou měřeny buď na nominální nebo pořadové úrovni onominální – čísla jsou hodnotám proměnné přiřazena náhodně; pouze hodnoty označují, ale nelze s nimi jako s čísly zacházet (jediné operace jsou = a ≠) (nominal scales) o Úroveň měření opořadová (ordinální) – hodnoty je možno uspořádat podle velikosti (např. pořadí v závodu, postojové škály), ale není možno stanovit, o kolik se liší (ordinal scales) omožné početní operace jsou stále = a ≠, ale také < a > o Úroveň měření ointervalová – hodnoty je možno uspořádat a vzdálenosti mezi nimi (intervaly) jsou shodné (např. rok narození, teplota) (interval scales) omožné početní operace: = a ≠, < a >, + a - o o Úroveň měření opoměrová – stejné vlastnosti jako intervalová a navíc se mezi hodnotami vyskytuje přirozená 0 (indikující absenci znaku) – tj. má smysl se ptát, kolikrát je hodnota větší než jiná hodnota (ratio scales) onapř. věk, počet správně řešených úloh, počet dětí okromě předchozích početních operací je možné také násobení a dělení o Úroveň měření okvantitativní data je možno zredukovat na kategoriální (např. místo hodnoty krevního tlaku údaj normotenze x hypertenze) oněkdy je obtížné stanovit hraniční hodnoty (cut-off scores) o Účel typologie proměnných omá pomoci při rozhodování o tom, jak nejlépe zobrazit, shrnout či analyzovat data o o Populace a výběr odata mohou být získávána na populaci nebo na vzorku populace Populace a výběr opopulace (základní soubor) - úplný souhrn lidí, objektů nebo věcí, které jsou předmětem našeho zkoumání oje dána přesným stanovením jeho prvků oprvky mohou být určeny buď jejich výčtem nebo vymezením některých společných vlastností (např. územní příslušnost, věk atd. – např. všechny děti s diagnostikovanou poruchou pozornosti a trvalým bydlištěm v JM kraji) Populace a výběr ovýběr (výběrový soubor, vzorek) – výzkumníci se snaží, aby byl reprezentativní vůči příslušné populaci (pomocí postupů náhodného výběru) ostejný soubor objektů může za určitých okolností představovat jednou populaci a jindy výběr Parametry a statistiky opokud provádíme měření na celé populaci, jsou výsledky nazývány parametry populace obývají označovány řeckými písmeny (např. průměr μ) Parametry a statistiky ovýsledky z měření na vzorku se nazývají statistiky ovětšinou jsou užívány k odhadu populačních parametrů pomocí postupů statistické indukce (inference) Popisná a induktivní statistika opopisná (deskriptivní) statistika – třída technik, které slouží k popisu proměnných (např. typická hodnota proměnné, distribuce hodnot atd.) oinduktivní (inferenční) statistika – umožňuje rozhodnutí, zda zjištění ze vzorku platí i na populaci (a s jakou pravděpodobností) – odhady intervalu spolehlivosti, testování hypotéz Popisná a induktivní statistika oinduktivní statistika se dále dělí na parametrické a neparametrické postupy oparametrickými testy ověřujeme platnost hypotézy o parametrech základního souboru (např. průměr) – vyžadují měření na intervalové úrovni Příprava dat před analýzou ouspořádání dat okontrola přesnosti dat ovytvoření struktury databáze ovkládání dat do PC otransformace dat o o o Uspořádání dat ovýzkumná data mohou pocházet z různých zdrojů: dotazníky, rozhovory, měření při experimentech (pretest, posttest), pozorování oje třeba všechny formuláře, dotazníky, záznamové archy atd. řádně označit, aby je vždy bylo možno i zpětně dohledat o Uspořádání dat opůvodní data se u profesionálních výzkumů po určitou dobu archivují (min. 5-7 let) oje vhodné vytvořit si databázi – přehled všech použitých zdrojů dat (např. v MS Access nebo Excel, Statistica, SPSS) Kontrola přesnosti dat oněkdy vhodné provést již při sběru dat – pak je možno příp. chybějící nebo jinak problematické odpovědi vyřešit na místě okontrola: čitelnosti odpovědí, úplnosti odpovědí, důležitých informací (datum, jméno výzkumníka atp.) oje vhodné z dalších kroků vyloučit nevalidní odpovědi (na všechny otázky stejné atd.) Vytvoření struktury databáze odata je možno vkládat přímo do statistických programů nebo do databázových programů (a potom je převést) orozsáhlé výzkumné projekty mají vytištěnu podrobnou kódovací příručku (codebook) s popisem proměnných Vytvoření struktury databáze opro každou proměnnou: ojméno proměnné (např. pohlaví) opopis proměnné (např. celkový skór dotazníku deprese) opopis hodnot proměnné (např. 1=chlapci, 2=dívky) ozpůsob kódování chybějících hodnot (např. 9) oformát proměnné (numerický, textový, datum…) Vkládání dat do PC opro kontrolu přesnosti vkládání existují nejrůznější postupy onapř. dvojité vkládání (double entry) – speciální program, který při druhém vkládání porovnává data s původním údajem a upozorní na chyby; není příliš rozšířeno Vkládání dat do PC ojednodušší je náhodně zkontrolovat určitý počet případů (při velkém procentu chyb kódovat znovu a porovnat) ovždy je nutno alespoň zkontrolovat, zda rozsah zadaných hodnot odpovídá předpokladům Transformace dat oobrácení položek –některé položky bývají formulovány v opačném směru než zbytek škály; ojejich hodnoty je třeba překódovat (např. u 5 bodové škály se bude 1 rovnat 5, 2 bude 4 atd. až 5 bude 1) o Transformace dat ovzorec pro obrácení škály o nová hodnota = nejvyšší hodnota +1 – stará hodnota ov SPSS je možno provést pomocí příkazů COMPUTE nebo RECODE Transformace dat ovýpočet celkových skórů – většinou součtem hodnot několika proměnných (příp. průměr atp.) ov příkazu COMPUTE se zadá příslušný vzorec, např. pro součet celk = p1 + p2 + p3 onebo rovnou funkce (sum, mean) celk = sum (p1 TO p3) o Transformace dat osloučení hodnot proměnných – např. ze 7 bodové škály chceme udělat 3 bodovou; nebo z věku zadaného v letech vytvořit 3 věkové skupiny opříkaz RECODE Kontrolní otázky oklasifikace proměnných podle jejich role ve výzkumném plánu orozdíly mezi nominální, ordinální, intervalovou a poměrovou úrovní měření; možné početní operace ovymezení populace a výběru, parametrů a statistik ovymezení popisné a induktivní statistiky opostup přípravy dat před analýzou o o o o