Stationery anabnr2 ‹#› 1 Statistika pro sociální pracovníky n Stationery anabnr2 ‹#› 2 Obsah: n1. Úvod do statistické analýzy n2. Frekvenční tabulky a grafy n3. Centrální tendence a variabilita n4. Normální distribuce n5. Úvod do testování hypotéz n6. Populace a vzorek, statistická inference n7. Výběr statistického testu n8. Korelace n9. Regresní analýza n10. Kontingenční tabulky (křížení) n11. T-test a analýza rozptylu Stationery anabnr2 ‹#› 3 Kapitola 1: Úvod do statistické analýzy nProč studovat statistiku? (3) nPoužití statistické analýzy (4) nZákladní metodologické pojmy (5-) nÚrovně měření nÚrovně měření a analýza dat nDalší klasifikace měření nKategorie (druhy) statistické analýzy nShrnutí a otázky pro studium Stationery anabnr2 ‹#› 4 Proč studovat statistiku v sociální práci? nSociální pracovníci (SoPci) provádějí výzkumné studie (jak sbírat, třídit, organizovat data a učinit závěry) n nSoPci přispívají ke znalostní základně profese šířením nálezů svých výzkumů (prokázat důvěryhodnost zjištění) n nSoPci se v praxi opírají o výsledky cizích výzkumů (Porozumění výsledků statistické analýzy zvyšuje pravděpodobnost zvolení správné intervence) n nSoPci potřebují zhodnotit efektivitu své intervence (efektivita a odpovědnost intervence) Stationery anabnr2 ‹#› 5 Použití statistické analýzy nVýběr, design a úprava nástrojů sběru dat nVýběr a velikost výzkumného vzorku nZhodnotit zda nástroje měření produkují validní a reliabilní výsledky nShrnout vlastnosti specifického výzkumného vzorku nebo populace nOdhadnout vlastnosti populace, z které jsme vybrali vzorek nRozhodnout zda vztahy a souvislosti nalezené ve vzorku mohou být zobecněny na populaci n Stationery anabnr2 ‹#› 6 Základní metodologické pojmy nPopulace vs. Vzorek nDeskriptivní vs. Inferenční statistika nData (6) nInformace (7) nProměnné a konstanty (8-9) nKonceptualizace (9) nOperacionalizace (10) nReliabilita (konzistence a opakovatelnost) (11) nValidita (platnost) (12) nVýzkumná hypotéza (13) n Stationery anabnr2 ‹#› 7 Vzorek vs. populace nSbíráme informace (data) o vzorku nebo o populaci nOba termíny nepředstavují jen lidi nebo události, ale i sadu naměřených hodnot o těchto lidech / událostech nnaměřené hodnoty všech klientů obsloužených v průběhu jednoho roku v konkrétním zařízení soc. služeb = populace nVzorek = podskupina hodnot z větší populace hodnot. Údaje o vybrané polovině klientů obsloužených v průběhu jednoho roku Stationery anabnr2 ‹#› 8 Deskriptivní vs. Inferenční statistika nDeskriptivní (=popisná) = používáme pokud je našim cílem pouze popsat a interpretovat sadu hodnot (data) která držíme v ruce (ať už vzorek nebo populaci) nInferenční (=deduktivní, usuzovací) = používáme pokud je naším záměrem použít data která držíme k tomu, abychom se pokusili porozumět většímu množství dat (děláme odhady o vlastnostech populace na základě vzorku). Stationery anabnr2 ‹#› 9 Data (pl.), datum (s.) n= Naměřené hodnoty sesbírané při výzkumu ještě před tím než byly jakkoli analyzovány (př. skóre škály spokojenosti klientů) nNástroje sběru dat = např. rozhovory, obsahové analýzy, přímé a zúčastněné pozorování atd. nAnalýza dat posbíraných někým jiným pro jiné účely: analýza sekundárních dat nKvalitní závěry vyžadují kvalitní data n Stationery anabnr2 ‹#› 10 Informace n= Interpretace analyzovaných data nPř. „Při snižování zneužívání látek je intervenční metoda A u účastníků výzkumu úspěšnější než metoda B“ nnebo „je velmi teplo“ noproti tomu 102° F je datum n Stationery anabnr2 ‹#› 11 Proměnná vs. konstanta nPři výzkumu limitujeme sběr dat pouze na takové data, které jsou nezbytné a užitečné pro naši výzkumnou otázku n= vlastnost která se liší v kvantitě nebo kvalitě u lidí které zkoumáme nPř. úroveň vzdělání, pohlaví, sexuální orientace, etnicita, úroveň sebedůvěry atd. nKonstanta = vlastnost která se neliší v kvantitě nebo kvalitě u lidí které zkoumáme nPř. Smrtelnost (lidé) nebo národnost (Češi) nPř. Vzorek adolescentních dívek závislých na kokainu n Stationery anabnr2 ‹#› 12 Kategorie a hodnoty proměnných nRůzná změření proměnných mohou být vyjádřena buďto slovně nebo čísly nKategorie proměnné (categories) = různé formy které proměnná může nabývat, vyjádřené slovně př. Pohlaví: muž / žena nHodnoty proměnné (values) = různá změření proměnné vyjádřená čísly, která reflektují kvantifikovatelný rozdíl př. Věk: 20, 24, 60 Stationery anabnr2 ‹#› 13 Frekvence kategorií a hodnot n= Četnost (=kolikrát) s jakou se vyskytuje daná hodnota nebo kategorie ve zkoumaném skupině osob (vzorku) nPř. ve skupině máme 12 mužů a 16 žen: frekvence pro kategorii „muž“ proměnné „pohlaví“ je 12, zatímco frekvence pro kategorii „žena“ stejné proměnné je 16 Stationery anabnr2 ‹#› 14 Konceptualizace n1. Vybrat nedůležitější proměnné vzhledem k výzkumné otázce (důkladně prostudovat literaturu!) n2. Definovat co přesně každá proměnná znamená n3. Načrtnout druh vztahu mezi proměnnými n Př. Je intervence A lepší než intervence B ve snižování autistického chování tříletých dětí u nichž byl diagnostikován autismus? (typ a obsah intervence, snižování?, projevy autistického chování, závažnost?, Intervence ovlivňuje chování) Stationery anabnr2 ‹#› 15 Operacionalizace n= specifikovat jak přesně budeme měřit proměnné které jsme konceptualizovali nJedna proměnná – často více indikátorů nPř. Úroveň asertivity: n a) specifické chování klienta pozorovaného doktorem v různých podmínkách n b) subjektivní diagnóza klienta sociálním pracovníkem n c) sebe-analýza klientem n d) klientovy odpovědi na dotazník, který je ve vědecké komunitě považovaný za důvěryhodně měřící asertivitu nPř. Úroveň spokojenosti se zaměstnáním… Stationery anabnr2 ‹#› 16 Reliabilita n= stupeň konzistence a opakovatelnosti měření, stupeň chybovosti měření, podíl skutečného skóre na naměřeném skóre, spolehlivost (unidimenzionalita) škály nPř. Nástroj který měří klinickou depresi a vykazuje konzistentní výsledky napříč lidmi a v různých situacích, oproti tomu jiný nástroj může být ovlivněn tím kdo jej používá, prostředím, časem…. Stationery anabnr2 ‹#› 17 Validita n= měříme skutečně to co věříme že měříme (validita měření/konstruktu) X interní validita (design), validita výsledku (analýza), externí validita (výběr vzorku) nSamotná reliabilita nástroje neznamená že je nástroj správný nNapř. Nástroj kteří měří klinickou depresi může opakovaně udávat konzistentní výsledky ale ty mohou být opakovaně špatné (např. měřit úroveň sebevědomí, energie nebo fyzického zdraví) Stationery anabnr2 ‹#› 18 Vztah mezi reliabilitou a validitou rel&val1 rel&val2 Stationery anabnr2 ‹#› 19 Výzkumná hypotéza n= tvrzení o vztahu mezi proměnnými nFormulace v budoucím čase protože předpovídá co najdeme (co očekáváme) když zanalyzujeme data výzkumu nZpůsob jakým je stanovena umožňuje její ověření statistickou analýzou nPř. H1: Lidé kteří jsou v depresi budou mít jinou kvalitu spánku než lidé bez depresí (testujeme tak že změříme kvalitu spánku operacionalizovaného např. jako počet hodin spánku lidí s diagnosou deprese a porovnáme s kvalitou spánku lidí u kterých nebyla diagnostikována deprese) nPOZOR: H1 neříká nic o podstatě/směru vztahu (zda deprese ovlivňuje spánek či naopak), ani o jeho formě (negativní, pozitivní vztah, přímý/nepřímý, relace/kauzalita), pouze souvislost mezi proměnnými n n n n n Stationery anabnr2 ‹#› 20 Výzkumná hypotéza 2: (ne)závislá proměnná nAlter. H1: Narušený spánek způsobuje depresi nNavrhuje přímý, kauzální vztah, jedna proměnná ovlivňuje druhou nNezávislá (independent, explaining, predictor) proměnná = ovlivňující proměnná, ta s kterou manipulujeme n (Př. Pravý experiment (druh výzkumného designu): narušíme spánek několika lidí abychom zjistili jestli dostanou deprese (nelze z etického hlediska)) nZávislá (dependent, explained, criterion) proměnná = předpokládá se že je ovlivňována nezávislou proměnnou (deprese ovlivňovaná narušeným spánkem) n n Stationery anabnr2 ‹#› 21 Úrovně měření nPo konceptualizaci, operacionalizaci a stanovení výzkumné hypotézy je třeba určit, jak přesně byly proměnné měřeny nSnaha o maximální přesnost, někdy není vhodné z etického nebo praktického hlediska (př. výše příjmu( návratnost)) nUrčení úrovně měření proměnné – nezbytnost k výběru statistické metody analýzy nČtyři úrovně měření: nominální, ordinální, intervalová, poměrová n Stationery anabnr2 ‹#› 22 Nominální (nominal) nProměnná je rozdělena do kategorií (podtříd), které jsou nespojité (vzájemně se odlišují) nMezi podtřídami neexistují kvantifikovatelné rozdíly, pouze kvalitativní – tudíž nelze řadit podle velikosti nPř. Pohlaví, rasa, rodinný status nHodnoty (čísla) přidělená kategoriím reflektují pouze kvalitativní rozdíly (Př. Jaké je vaše pohlaví? 1. muž 2. žena) nPodmínky: kategorie musí být rozdílné, vzájemně neslučitelné (každý respondent pasuje pouze do jediné kategorie) a vyčerpávající (pro každého respondenta je k dispozici odpověď/kategorie) Stationery anabnr2 ‹#› 23 Ordinální (ordinal) nKategorie proměnné představují nejen rozdílnost, ale mají i kvantitativní význam – lze je smysluplně seřadit (rank-order) od největší po nejmenší. nPř. Stupeň vzdělání, účinnost intervence, úroveň klientovy spokojenosti se službou (škály) nPř.Otázka: Jak byste ohodnotil práci svého sociálního pracovníka? 1.velmi dobrý, 2.Dobrý, 3.Slušný, 4.Slabý, 5.velmi slabý nebo Jaký je váš nejvyšší stupeň vzdělání v oboru sociální práce? 1. Vyšší odborný, 2. Bc, 3. Mgr., 4. PhD nPozor: protože intervaly mezi jednotlivými kategoriemi nejsou stejné, nelze říci, že rozdíl mezi 1. a 3. je stejný jako mezi 2. a 4. n Stationery anabnr2 ‹#› 24 Intervalová (interval) nUmisťuje hodnoty proměnné na pravidelně rozdělené kontinuum, kde jednotlivé hodnoty jsou od sebe stejně vzdáleny – má shodnou jednotku měření např. jeden rok, teplotní stupeň nMůžeme říct nejen že jeden respondent má určité proměnné více než druhý (ordinální) ale i o kolik nRozdíl mezi 1 a 4 je významově stejný jako mezi 3 a 6, a sice 3. Rozdíl v inteligenci mezi IQ 105 a 100 je stejný jako mezi IQ 125 a 120. nAle: nemá absolutní nulu - nelze identifikovat bod, ve kterém neexistuje žádné (nulové) množství proměnné, a proto nelze říct, že 2 je dvakrát více než 1, ale pouze o jednotku více n Př. Protože 0 stupňů Farenheita neznamená absenci tepla, nelze říct že při 60 stupních F je dvakrát tepleji než při 30 stupních F. nAritmetické operace: sčítání a odčítání n n Stationery anabnr2 ‹#› 25 Poměrová (ratio) nExistence fixní, absolutní a nelibovolně zvolené nulové hodnoty nHodnoty proměnné představují skutečné množství vlastnosti nMůžeme říct nejen o kolik má jeden respondent více jednotek vlastnosti než druhý, ale také kolikrát více nPř. Věk, počet dětí v rodině, počet případů kolikrát klient absolvoval skupinovou terapii nAbsolutní nula umožňuje všechny aritmetické operace: n +, -, *, / nPř. Země s ø porodností 4 děti/pár má 2x větší porodnost než země s ø porodností 2 děti/pár nIntervalová nebo poměrová? Pokud je logicky možné jít do mínusu, pak intervalová, pokud nelze, pak poměrová. n Stationery anabnr2 ‹#› 26 Úroveň měření a analýza dat nJak přesně je proměnná naměřena ovlivňuje možnosti použití statistických technik nNěkdy ač proměnná vypadá jako intervalová, je pouze ordinální. Př. Schopnost řídit auto operacionalizovaná jako počet dopravních nehod za 10 let: poměrová? n Ne, protože ačkoli má opravdovou nulu a stejně veliké intervaly, tak nelze říci, že rozdíl ve schopnostech mezi osobou která měla 4 nehody a osobou se 3 nehodami je stejný jako rozdíl mezi osobou s 1 nehodou a žádnou nehodou. Co dělat? Lze vytvořit skupiny kde 0-2 nehody, 3-5 atd. a užívat proměnnou jako ordinální. nPřesnější proměnné lze transformovat na méně přesné n (př. Věk na Věk_skupiny (Starší a Mladší)), ne však opačně. n n Stationery anabnr2 ‹#› 27 Jiné klasifikace proměnných nNespojité (discrete) = může nabývat jen konečné množství hodnot př. Počet sourozenců, člověk může mít 2 nebo 3 sourozence, ale ne 2,16 nSpojité (continuous) = může teoreticky nabývat jakékoli hodnoty př. výška studentů soc.práce. Mezi jakýmikoli dvěma naměřenými hodnotami může být teoreticky další hodnota n Stationery anabnr2 ‹#› 28 nDichotomické (dichotomous) =druh nespojité proměnné, která má pouze dvě kategorie př. Pohlaví (muž nebo žena) nebo výsledek voleb (vyhrál nebo prohrál) nBinární (binary) = druh dichotomické proměnné, kdy připisujeme hodnoty 1 přítomnosti a 0 absenci proměnné př. Vlastnictví auta (1= mám auto,0 = nemám) nFalešné (dummy) = druh dichotomické proměnné, kdy nominální nebo ordinální proměnnou transformujeme do takového množství proměnných, kolik má původní proměnná kategorií (k) (V analýze však použijeme o jednu méně (k-1) proměnných). n Př. Pohlaví transformujeme do muže (=1 pokud muž, =0 pokud žena), nebo do ženy (=1 pokud žena, 0 = pokud muž) n Užití dummy: n 1) když chceme použít nominální proměnnou v technikách vyžadující proměnné vyšší úrovně (např. lineární regrese) n 2) když chceme testovat nelinearitu vztahu (efektu) Jiné klasifikace proměnných (2) Stationery anabnr2 ‹#› 29 Druhy statistické analýzy nPodle počtu proměnných n a) univariační/jednorozměrná (univariate) = zkoumá distribuci hodnot jediné proměnné nb) bivariační/dvourozměrná (bivariate) = zkoumá vztah mezi dvěma proměnnými nc) multivariační/vícerozměrná (multivariate) = zkoumá vztah mezi třemi a více proměnnými zároveň n n Stationery anabnr2 ‹#› 30 Druhy statistické analýzy (2) nPodle účelu na) deskriptivní n= pomocí tabulek a grafů shrnuje základní informace ze syrových (původních) dat a pomáhá tak jejich interpretaci a komunikaci navenek nnepřekračujeme hranice vzorku §b) inferenční §= určuje jak bezpečné je zobecňovat (odhadovat, usuzovat) výsledky ze vzorku (statistiky) na charakteristiky populace (parametry) §- jak je pravděpodobné že výsledek ze vzorku platí i v populaci n n n