1 Základy statistiky Kateřina Vlčková, 2007 Požadavek kvantitativní gramotnosti u každého jedince Se statistickými daty se v životě setkáváme stále, nelze jim ,,uniknout". Schopnost rozumět statistickým datům je důležitá pro každého, o to více pak pro učitele jako odborníka a profesionála. Např. v medicíně existuje směr zvaný medicína založená na faktech (Evidence based medicine), jejímž základním požadavkem je, aby se pacientovi dostalo lékařské péče, jež se opírá o nejnovější výsledky vědeckého výzkumu. Totéž platí pro pedagogiku a psychologii jako základ učitelské práce. Jedinci v procesu edukace se má dostat profesionálního přístupu a péče založeného na nejnovějších poznatcích vědeckého výzkumu. Učitel má být s to aplikovat poznatky výzkumů do své praxe, má přezkušovat názory autorit pomocí systematicky získaných empirických údajů, má umět realizovat vlastní akční výzkum, má kriticky posuzovat informace masmédií, dodavatelských firem, nakladatelství, odborných článků a číselných údajů v nich obsažených, mít adekvátní míru nedůvěry ke zjednodušeným a mnohdy zastaralým návodům, jak přistupovat k žákům, jak diagnostikovat a řešit problémy. Ve vědních oborech došlo k demokratizaci informací a vědecké informace v dnešní době již nejsou vyhrazeny jen pro odborníky. Mluví se o tzv. kvantitativní gramotnosti (quantitative literacy) - o schopnosti používání prostředků matematiky a statistiky k řešení každodenních problémů. Definice statistiky Statistika je nauka, jak získávat informace z numerických dat. V praxi statistiky lze rozlišovat tři její části: 1/ Získávání dat ­ metody sběru dat, přístupy k výběru měřených objektů, k návrhu experimentu, validizaci instrumentů, 2/ analýza dat ­ organizace dat, popis dat použitím grafů, tabulek (nepřesně označováno jako popisná/deskriptivní statistika ­ nepřesně proto, že má také svou explorační funkci a dynamickou povahu), 3/ statistické usuzování (inference) ­ závěry o širším univerzu jevů, jde za sama data, hodnocení spolehlivosti závěrů, pravděpodobnosti, testování hypotéz, používání intervalů spolehlivosti atd. Tento způsob práce s daty se nazývá inferenční statistika. Tato část statistiky se v učebnicích objevuje nejvíce, je to také část statistiky, která je náročnější než dvě předchozí části. ad 1/ Získávání dat: Opakování předchozího učiva Statistika je spojena s výzkumem a metodologií. Před fází získávání dat, je fáze plánování výzkumu, v níž se všechny tři části statistiky ve výzkumu předem plánují. Zopakujte si co je to: Výzkum, teorie, 2 operacionalizace, hypotéza, jaké etapy má empirický výzkum, co vše zahrnuje projekt výzkumu, kritéria kvality měření (objektivita, reliabilita a validita); jaké typy proměnných se rozlišují (závisle proměnná, nezávisle proměnná; kategoriální, metrická - ordinální, intervalové, poměrové; ...); základní způsoby výběru výzkumného vzorku (náhodný, dostupný, ...) a designy/plány výzkumu (deskriptivní, relační, kauzální), zejména experimentální plán. ad 2/ Analýza dat: Deskriptivní statistika Příprava dat Organizace dat a jejich kontrola, scházející údaje, přepis dat do tabulky dat (datové matice), kódování dat (0 ­ 1, ...), kontrola dat, scházející hodnoty. Modelování. Grafický a číselný popis rozložení dat Způsoby zobrazení dat Míry centrální tendence Míry rozptýlenosti Míry špičatosti a šikmosti Popis dat pomocí pěti hodnot (krabicový graf s anténami) Zkoumání přítomnosti odlehlých hodnot Transformace dat, standardizace Explorační analýza dat ad 3/ Statistické usuzování Pravděpodobnost jako základ statistického usuzování Analýza závislostí 3 Korelační analýza (Spearmanův korelační koeficient, regresí analýza) Analýza kategoriálních dat hodnocení četnosti chí test dobré shody závislost kategoriálních proměnných Analýza rozptylu: porovnání více průměrů Mnohonásobná lineární regrese Rozsah výběru, síla a velikost účinku Volba statistické metody Statistické metody jsou založeny na teoretických principech a předpokladech o rozdělení náhodných proměnných. V reálném životě tyto předpoklady neplatí, často jde pouze o přiblížení se. Dva výzkumníci proto řeknou každý možná jiný názor na to, jakou metodu použít. Metody vícerozměrné analýzy Př. analýza historie událostí (survival analysis), shluková analýza (cluster analysis), faktorová analýza (FA). Metaanalýza Statistické programy SPSS Stata SAS Statistica Amos M-Plus Lisrel aj. Literatura HENDL, J. Přehled statistických metod zpracování dat. Analýza a metaanalýza dat. Portál : Praha, 2004. ISBN 80-7178-820-1.