Statistika - úvod ovymezení statistiky oúloha statistiky v psychologickém výzkumu ozákladní pojmy - měření, proměnné; popisná a induktivní statistika; populace a vzorek opříprava dat před analýzou Definice statistiky oStatistika je naukou o tom, jak získat informace z numerických dat. oStatistika je vědní obor zabývající se zkoumáním jevů, které mají hromadný charakter. oStatistika je soubor metod, které nám umožňují rozhodnutí v případě nejistoty. o o Definice statistiky oAnalýza dat náhodného charakteru, která předpokládá použití pokročilejšího aparátu matematiky a určitého matematického modelu (teorie pravděpodobnosti). o Definice statistiky oStatistická analýza jsou záhadné, někdy až prapodivné manipulace s daty získanými pomocí experimentu, jejichž cílem je zastřít ten fakt, že výsledky nemají pro lidstvo žádný zobecnitelný význam. Obvykle jsou při ní používány počítače, což této proceduře propůjčuje další auru nereálnosti. o Role statistiky ve výzkumu opři výzkumu v sociálních vědách jsou střídavě používány deduktivní a induktivní postupy ostatistika se uplatňuje především u induktivních postupů Proměnné opři výzkumu psychologvé získávají, měří a analyzují proměnné oproměnná je objekt, který může nabývat různých hodnot (na rozdíl od konstanty) Proměnné ojsou rozlišovány různé typy proměnných o o Proměnné opodle jejich role ve výzkumném plánu -závislé, nezávislé, intervenující opodle úrovně měření – nominální, pořadové, intervalové a poměrové o Závislé a nezávislé proměnné opříklad experimentu: chceme zjistit účinnost prostředku na zlepšení paměti u seniorů ve srovnání s placebem Závislé a nezávislé proměnné onezávislá proměnná – podávaný prostředek (testovaný lék x placebo) ozávislá proměnná – výkon v testu paměti (např. počet vybavených slov) omožné intervenující proměnné – ochota užívat léky, podmínky při testu, věk… o Závislé a nezávislé proměnné onezávislá proměnná – ta, se kterou experimentátor manipuluje (independent variable) ozávislá proměnná – proměnná měřená experimentátorem (dependent variable) ointervenující proměnná – e. se snaží její vliv eliminovat (znáhodňováním, vyrovnáváním) (intervening variable) o Účel typologie proměnných omá pomoci při rozhodování o tom, jak nejlépe zobrazit, shrnout či analyzovat data o o Kvalitativní a kvantitativní data okvalitativní (kategoriální) – zjišťujeme hodnotu znaku – kategorii (např. pohlaví, náboženské vyznání, rodinný stav, barva očí, vzdělání); často fungují jako nezávislé proměnné (faktory); (categorial data) okvantitativní (metrická) data – zjištěná měřením pomocí nějakého nástroje (v širším smyslu); skór v testu, tělesná váha…; obvykle závislé proměnné (measurement data) Úroveň měření okategoriální proměnné jsou měřeny buď na nominální nebo pořadové úrovni onominální – čísla jsou hodnotám proměnné přiřazena náhodně; pouze hodnoty označují, ale nelze s nimi jako s čísly zacházet (jediné operace jsou = a ≠) (nominal scales) o Úroveň měření opořadová (ordinální) – hodnoty je možno uspořádat podle velikosti (např. pořadí v závodu, postojové škály), ale není možno stanovit, o kolik se liší (ordinal scales) omožné početní operace jsou stále = a ≠, ale také < a > o Úroveň měření ointervalová – hodnoty je možno uspořádat a vzdálenosti mezi nimi (intervaly) jsou shodné (např. rok narození, teplota) (interval scales) omožné početní operace: = a ≠, < a >, + a - o o Úroveň měření opoměrová – stejné vlastnosti jako intervalová a navíc se mezi hodnotami vyskytuje přirozená 0 (indikující absenci znaku) – tj. má smysl se ptát, kolikrát je hodnota větší než jiná hodnota (ratio scales) onapř. věk, počet správně řešených úloh, počet dětí okromě předchozích početních operací je možné také násobení a dělení o Úroveň měření okvantitativní data je možno zredukovat na kategoriální (např. místo hodnoty krevního tlaku údaj normotenze x hypertenze) o Populace a výběr odata mohou být získávána na populaci (cenzus) nebo na vzorku populace (výběrové šetření) Populace a výběr opopulace (základní soubor) - úplný souhrn lidí, objektů nebo věcí, které jsou předmětem našeho zkoumání oje dána přesným stanovením jeho prvků oprvky mohou být určeny buď jejich výčtem nebo vymezením některých společných vlastností Populace a výběr ovýběr (výběrový soubor, vzorek) – výzkumníci se snaží, aby byl reprezentativní vůči příslušné populaci (pomocí postupů náhodného výběru) ostejný soubor objektů může za určitých okolností představovat jednou populaci a jindy výběr Parametry a statistiky opokud provádíme měření na celé populaci, jsou výsledky nazývány parametry populace obývají označovány řeckými písmeny (např. průměr μ) Parametry a statistiky ovýsledky z měření na vzorku se nazývají (výběrové) statistiky ovětšinou jsou užívány k odhadu populačních parametrů pomocí postupů statistického usuzování (inference) Popisná a induktivní statistika opopisná (deskriptivní, explorační) statistika – třída technik, které slouží k popisu proměnných (např. typická hodnota proměnné, distribuce hodnot atd.) oinferenční/induktivní statistika – umožňuje rozhodnutí, zda zjištění ze vzorku platí i na populaci (a s jakou pravděpodobností) – odhady intervalu spolehlivosti, testování hypotéz Popisná a induktivní statistika oinferenční statistika se dále dělí na parametrické a neparametrické postupy oparametrickými testy ověřujeme platnost hypotézy o parametrech základního souboru (např. průměr) – vyžadují měření na intervalové úrovni Příprava dat před analýzou ouspořádání dat okontrola přesnosti dat ovytvoření struktury databáze ovkládání dat do PC otransformace dat o o o Uspořádání dat ovýzkumná data mohou pocházet z různých zdrojů: dotazníky, rozhovory, měření při experimentech (pretest, posttest), pozorování oje třeba všechny formuláře, dotazníky, záznamové archy atd. řádně označit, aby je vždy bylo možno i zpětně dohledat o Uspořádání dat opůvodní data se u profesionálních výzkumů po určitou dobu archivují (min. 5-7 let) oje vhodné vytvořit si databázi – přehled všech použitých zdrojů dat (např. v MS Access nebo Excel, Statistica, SPSS) Kontrola přesnosti dat oněkdy vhodné provést již při sběru dat – pak je možno příp. chybějící nebo jinak problematické odpovědi vyřešit na místě okontrola: čitelnosti odpovědí, úplnosti odpovědí, důležitých informací (datum, jméno výzkumníka atp.) oje vhodné z dalších kroků vyloučit nevalidní odpovědi (na všechny otázky stejné atd.) Vytvoření struktury databáze odata je možno vkládat přímo do statistických programů nebo do databázových programů (a potom je převést) orozsáhlé výzkumné projekty mají vytištěnu podrobnou kódovací příručku (codebook) s popisem proměnných Vytvoření struktury databáze opro každou proměnnou: ojméno proměnné (např. pohlaví) opopis proměnné (např. celkový skór dotazníku deprese) opopis hodnot proměnné (např. 1=chlapci, 2=dívky) ozpůsob kódování chybějících hodnot (např. 9) oformát proměnné (numerický, textový, datum…) Vkládání dat do PC opro kontrolu přesnosti vkládání existují nejrůznější postupy onapř. dvojité vkládání (double entry) – speciální program, který při druhém vkládání porovnává data s původním údajem a upozorní na chyby; není příliš rozšířeno Vkládání dat do PC ojednodušší je náhodně zkontrolovat určitý počet případů (při velkém procentu chyb kódovat znovu a porovnat) ovždy je nutno alespoň zkontrolovat, zda rozsah zadaných hodnot odpovídá předpokladům Transformace dat ovýpočet celkových skórů – většinou součtem hodnot několika proměnných (příp. průměr atp.) ozadá se příslušný vzorec, např. pro součet celk = p1 + p2 + p3 (v SPSS přes menu Transform - Compute) oPřípadně lze zadat příslušnou funkci (sum, mean) Transformace dat oobrácení položek –některé položky bývají formulovány v opačném směru než zbytek škály; ojejich hodnoty je třeba překódovat (např. u 5 bodové škály se bude 1 rovnat 5, 2 bude 4 atd. až 5 bude 1) o Transformace dat oVětšinou jsem se sebou spokojen oObčas si připadám jako bezcenný člověk oMám sám sebe rád n1 = vůbec nesouhlasím n2 = spíše nesouhlasím n3 = něco mezi n4 = spíše souhlasím n5 = zcela souhlasím o Transformace dat ovzorec pro obrácení škály (počínající hodnotou 1) o nová hodnota = nejvyšší hodnota +1 – stará hodnota ov SPSS se výpočet „obrácené“ proměnné zadává v menu Transform – Compute opřípadně lze využít menu Transform – Recode (into same/different variables) Transformace dat osloučení hodnot proměnných – např. ze 7 bodové škály chceme udělat 3 bodovou; nebo z věku zadaného v letech vytvořit 3 věkové skupiny ov SPSS se zadává v Transform – Recode into same (/different) variables Kontrolní otázky oklasifikace proměnných podle jejich role ve výzkumném plánu orozdíly mezi nominální, ordinální, intervalovou a poměrovou úrovní měření; možné početní operace ovymezení populace a výběru, parametrů a statistik ovymezení popisné a inferenční statistiky opostup přípravy dat před analýzou o o o o Zopakovat z kurzu metodologie ovýzkumný projekt oměření, objektivita, reliabilita, validita ovýzkumné plány ovýběr (postupy) Literatura oHendl – kapitoly 1 a 2 odoplňující (v IS): nGaito, J. (1980). Measurement scales and statistics: Resurgence of an old misconception. Psychological Bulletin, 87, 564-567 nVelleman, P. F. & Wilkinson, L. (1993). Nominal, ordinal, interval, and ratio typologies are misleading. The American Statistician, 47(1), 65-72. nLord, F. (1953). The Statistical treatment of football numbers. The American Psychologist, 8, 750-751. n