Zpracování a interpretace dat v empirickém kvantitativním výzkumu Kateřina Vlčková, Ph.D. Centrum pedagogického výzkumu PdF MU Zpracování dat jako jedna z fází výzkumu • po všech přípravných fázích – formulace problému, – studia literatury, – formulování hypotéz, – vymezení základních pojmů, – tvorby výzkumného nástroje, – volby výzkumného vzorku, – ověřování konstrukce a vlastností výzkumného nástroje aj. v předvýzkumu, – po sběru dat • nastává odlišná fáze, dosti mechanická, a to fáze zpracování dat Rozdíl zpracování dat v kvalitativním a kvantitativním výzkumu • o tom, jak bude vypadat zpracování dat rozhoduje to, zda jsme dělali kvalitativní či kvantitativní výzkum • u kvalitativního – budeme získaná data třídit, kategorizovat, – kvalitativní analýza (typické, reprezentativní příklady X atypické), – interpretovat, vysvětlovat • u kvatitat. výzkumu – bylo o způsobu zpracování dat bylo už rozhodnuto předem, než se začala sbírat data!!! – způsob zprac. byl také ozkoušen v předvýzkumu Kvalitně a adekvátně statistice sbíraná data Problémy • Jednoznačné přiřazení do kategorií • Dostatečně naplněné kategorie • Dostatečný počet respondentů • Otevřené položky a jejich kategorizace • Moc dlouhé otázky a náročné nebo nesmyslné • Nečitelné odpovědi • Zavádějící odpovědi respondentů • Plán kódování dat Předzpracování dat • nejprve se data předzpracovávají, – připravují pro zpracování, – zvažují se možné kategorizace dat, – zadávají se proměnné a jejich hodnoty do hlavičky databáze, – pak se zadávají data převedená většinou do čísel • vše už rovnou psát do počítače, – do (nejlépe) statistického programu nebo alespoň do Excelu, – z něj se to dá převést do SPSS, Statistica aj. Databáze • databáze je uspořádaný soubor dat • uzavřený soubor dat • u longitudálního výzkumu – otevřený • utřídění dat do databáze lépe umožňuje výsledky statisticky zpracovat • databázi zkontrolovat • bude tam dost chyb • např. vytisknout Typy proměnných Typy proměnných • je důležité znát, o jaký typ proměnné se jedná, • zda je kategoriální či měřitelná, • ve statistických programech se to zadává, • ovlivňuje to naše možnosti jaké stat. metody můžeme použít NOMINÁLNÍ • nejméně kvalitní, počítají se jen četnosti • nejjednodušší forma přiřazení čísla charakteristikám proměnných – => nejméně inf. nám to přinese, • je to jen kategorizace – jednoduchá třídění do vzájemně se vylučujících kategorií • př. typ školy, pohlaví, věk, vzdělání, druh motivace, • číselné označení kategorií muž 2, žena 1 • neznamená určitou měřitelnou hodnotu, • napomáhá pouze klasifikaci dat, • místo 1, 2 jsi lze dát do databáze Ž,M • v dosti omezené míře lze statisticky zpracovávat – lze spočítat absolutní četnosti a relativní četnosti (% zastoupení jednotl. kategorií v celku) – nelze počítat průměry, SD, korelace – lze použít analýzy rozptylu, výpočtů chí-kvadrátu ORDINÁLNÍ • pořadí prvků je známo (př. pořadí v běhu) • nevím ale nic o rozdílech v jednotlivcích • nelze sčítat, odčítat, lze jen porovnávat rozdíl, co je víc a co míň • v pedagogice často nelze určit přesné hodnoty – píle žáků, snaha, míra spolupráce • => jen se relativním způsobem posoudí daná hodnota ve srovnání s jejich výskytem u jiných jedinců • => nejde o měření absolutních hodnot • př. snahu 1 žáka srovnáme se snahou dalších, • dostaneme škálu od min. po max. a seřadíme žáky do pořadí, • známe jejich pořadovou hodnotu, • intervaly mohou být různé, ale to pořadové měření nezjistí • př. známky, výkon sportovců • více možností pro stat. zprac. dat – Me, směrodat. odchylka, kvartil – můžeme zjišťovat těsnost vztahů mezi růz, proměnnými • používá se postupů adaptovaných pro tuto úroveň měření – Spearmanův pořadový korelační koeficient INTERVALOVÉ • lze sčítat i odčítat, víme, zda je to vetší či menší a o kolik, známe rozdíly mezi sousedními body + jsou konstantní • př. teplota na Celsiově stupnici – má 0 (ale jen dohodnutou – teplota 0°C neznamená, že není teplota – 0 bodů v testu neznamená, že nemá žádné vědomosti, jen to, že nestačily na ten test • nesmí se dělit (př. byl 2x lepší), násobit • lze počítat průměry, směrod. odchylky, parametrické testy rozdílů, Pearsonův korelační koeficient, regrese atd., pak i faktorová analýza ad. Ukázka prezentace výsledků intervalových dat POMĚROVÉ • číslo, které jev zastupuje se mu blíží tak dokonale, že vyjadřuje míru vlastnosti, kt. Měří • poměr intevalů mezi 2 sousedními body škály je stejný jako mezi dalšími • lze násobit i dělit • u ped. jevů téměř nikdy • (max. jen měření výšky, váhy) • má to reálnou nulu, byť by v praxi byla nedosažitelná • (el. odpor, teplota) • geometrický průměr, variační koeficient atd. - všechny stat. m. pro intervalové měření Pozor • Známky ve škole jsou v podstatě nominální – max. ordinální – mezi stupni není stejná vzdálenost – (NE intervalové) Statistické programy na zpracování dat Zpracování údajů statistickými postupy • zpracování utříděných dat sám nebo se statistikem – statistická analýza • 1/ primární zpracování dat (třídění 1. stupně) • zpracování skupin dat, zjišťujeme absolutní a relativní četnosti, průměr, Me , směrodatné odchylky u jednotl. Proměnných • 2/ sekundární zpracování dat (třídění 2.stupně) • zjišťují se vazby mezi jednotlivými proměnnými, příp. jejich skupinami • => výpočty korelací, regresí, použití růz. variant neparametrických výpočtů, faktorovou analýzu, trsovou analýzu atd., • testují se rozdíly mezi proměnnými, skupinami apod. (Studentův t-test nebo testem chí-kvadrát), uvede se, zda výsledky jsou nebo nejsou statisticky významné Statistické programy • Excel (je v balíku Microsoft Office), • statistické softwary – SPSS, Statistica, Stata, Statgraphic, Origin aj. – => vypočítají výsledky – a umožňují i grafické znázornění výsledků, – po zacvičení je práce s nimi velmi jednoduchá a rychlá, – umožňuje zkoušet různé možnosti výpočtů a vytěžit z údajů maximum • pozor: – počítač nebude protestovat, když ho budete nutit zpracovat údaje pro daný účel naprosto nevhodnou statistickou metodou, za výběr metod a interpretaci ručí výzkumník, lze požádat o pomoc matematika, statistika, sociology aj. • nepsát si údaje prve na papír, ale rovnou např. do Excelu Excel • Není statistický program • Mnohé jde zpracovat i v Excelu • Problém, jak pracovat s chybějícími daty • ručně Statistica • MU má licenci – Lze koupit za 70 Kč na Komenského nám. V Brně Ukázka tabulky z programu Statistica Testování rozdílů v efektivitě učení dle pohlaví Testování vztahů efektivity učení a používání strategií SPSS • Nejvíce používaný statistický program v sociálních vědách Amos 6 • Program pro strukturální modelování • http://amosdevelopment.com/index.htm • http://www.washington.edu/ • book help amos 6 Prezentace dat v práci Prezentace dat v práci Zpracování dat • uspořádání a shrnutí dat, jejich transformace do grafů a tabulek • přehledná, úsporná forma prezentování údajů, • je třeba zdůraznit důležitá zjištění – ta, kt. podporují očekávané trendy nebo naopak údaje, kt. nebyly očekávány Prezentace dat v práci • údaje lze různě přeskupovat a kombinovat, • lze vyrobit velké množství tabulek a grafů • => vybrat jen rozumné množství, – ve zprávě z výzkumu uvést jen podstatné výsledky vzhledem k cíli výzkumu Prezentace dat v práci • příliš velké množství tabulek ukazuje, že se výzkumník v datech ztratil, – neumí najít správnou hierarchii, a proto uvedl vše, co měl k dispozici • výzkumy z větším množstvím proměnných obyčejně vyžadují větší počet tabulek než jednodušší výzkumy Prezentace dat v práci • úlohu hraje i žánr textu, v němž se výsledky publikují – do článku se vejde méně tabulek a grafů než do výzkumné práce • disertační, diplomové práce – hlavní tabulky jsou v příslušné části o zpracování údajů, – doplňující tabulky jsou v příloze Prezentace dat v práci Pořadí tabulek a grafů A/ nejprve ty, kt. obsahují hlavní a souhrnné informace • čtenář získá globální přehled o výsledcích, pak se hlavní výsledky přeměňují na drobné B/ tematické řazení – dle výzkumného problému a hypotéz, • má-li výzkum 4 hypotézy, výsledky budou seřazeny do 4 okruhů Prezentace dat v práci Styl psaní • odborný, dosti suchý, neosobní, • pro účely zábavného čtení jsou populárně-vědecké publikace, • psát srozumitelně, s ohledem na čtenáře, nikoli komplikovaně, • inspirovat se autory, kt. mají vhodný styl – i složité teoretické věci řeknou jasně a jednoduše • Průcha, Gavora, Jan Slavík, Jiří Mareš • psát v první osobě mn.č. a v minulém čase – př. mezi žáky nebyl žádný rozdíl – X není = neomezená platnost, té ale nelze dosáhnout Prezentace dat v práci Kritéria dobré prezentace • přehlednost grafů a tabulek • srovnávání vhodných skupin v komentáři ke grafům • komentář není převod čísel do slov, je třeba uplatnit nadhled • vyjádřit se ke svým hypotézám (očekávám, předpokládám…) • tematicky řadit údaje, tabulky a grafy • rozlišit jasně samotné údaje a svou interpretaci údajů – jde o vhodné formulace – srovnat své závěry s údaji z předcházejících výzkumů Interpretace dat v práci Úmrtnost zapříčiněná motorovými vozidly Úmrtnost zapříčiněná motorovými vozidly Interpretace dat • zpracované údaje jsou jen holými čísly, sama o sobě moc neznamenají • interpretace = vysvětlení a vyhodnocení – hlavním výstupem výzkumu nejsou údaje, ale jejich interpretace – slovní popis není interpretace – v kapitole „výsledky a intepretace“, „diskuse a závěry“ • po zapracování údajů je na chvíli odložit, – interpretace vyžaduje nadhled, – je to jiný druh činnosti než zpracovávání, – vyžaduje jiné naladění, hluboké zažití výsledků, jinak se člověk mezi čísly ztrácí Interpretace dat • vyžaduje pochopení číselných údajů získaných z matematicko-statistických výpočtů – a zároveň velký přehled a dobrou orientaci ve zkoumané problematice • začátečníci mívají s interpretací velké problémy, – často je to nejtěžší etapa výzkumu • někdy důsledek zanedbání studia problematiky na začátku výzkumu • jsou-li výzkumné hypotézy postaveny špatně, potom se i obtížně interpretují (jdou-li vůbec zpracovat) a naopak. Interpretace • interpretace – srovnávat údaje mezi sebou a ptát se např. – Vyplývají z tohoto srovnání nějaké souvislosti? Jsou v údajích nějaké diskrepance? Jak se dají vysvětlit? – Vyjadřují údaje nějaký trend, směřování, linii, anebo jsou spíše rozházené? – Jsou údaje v souladu s existující teorií o zkoumaném jevu? – Jsou údaje v souladu s údaji z jiných výzkumů? • Nejsou-li, proč? – Bylo to proto, že šlo o jinou populaci, jiné období, nebo proto, že výsledky byly zpracovány jiným způsobem? – Anebo to bylo proto, že z údajů „vystoupily“ neznámé, nekontrolované proměnné? Interpretace • naše zjištění konfrontujeme se stanovenými hypotézami a komentujeme • opíráme se o existující ped. teorii + své zkušenosti (viz hypotézy), – na základě nových zjištění hypotézy přehodnocujeme a dále rozvíjíme • vyjádřit se o podmínkách a rozsahu platnosti hypotéz • vyjádřit se k tomu, zda se dají závěry široce zevšeobecňovat, nebo platí jen pro určitou omezenou populaci Chyby u začínajících • vedle legitimních, vytváří nelegitimní závěry – neopírající se o předcházející zjištění • přílišná zevšeobecnění • (na základě zjištění o parciálních nedostatcích učitele, udělají urychlený závěr o celkově špatné práci učitele, školy) • moralizování – dávají tam svůj světový názor, působí originálně X je to projev nedisciplinovanosti v myšlení Zásady interpretace údajů • Udělejte zřejmé zřejmým. • Udělejte zřejmé pochybným. • Udělejte skryté zřejmým.