Statistická síla o princip testování hypotéz (opakování) o chyby I. a II. druhu o statistická síla o požadovaná velikost výběru Statistická síla o pravděpodobnost, že zamítneme nulovou hypotézu, která neplatí o tj. že najdeme (statisticky významný) rozdíl, když tento rozdíl existuje Statistická síla o příklad: srovnáváme účinnost léčby úzkostných poruch o dva typy léčby -- farmakoterapie (A) a psychoterapie (B) Testování hypotéz o náhodně vybereme z populace pacientů s úzkostnou poruchou vzorek pacientů o polovina z nich se podrobí farmakoterapii, druhá polovina psychoterapii o po léčbě změříme u obou skupin standardizovaným nástrojem míru úzkosti Testování hypotéz o jaká bude nulová hypotéza v této studii? Testování hypotéz o nulová hypotéza: průměrná míra úzkosti u pacientů s terapií A je stejná jako průměrná míra úzkosti u pacientů s terapií B o uA = uB Testování hypotéz o pro porovnání průměrů vzorku A a B můžeme použít t-test (pro nezávislé výběry) o t =( xA -- xB) / S o hodnotu t vyhledáme v tabulkách t-rozdělení (pro příslušný počet stupňů volnosti) Testování hypotéz o pokud se t blíží nule (tj. mezi průměry vzorků A a B není velký rozdíl), pak nezamítneme nulovou hypotézu -- vyvodíme, že ani mezi průměry populace A a B není rozdíl o pokud je t od nuly vzdáleno, pak nulovou hypotézu zamítneme a vyvodíme, že populační průměry se liší Testování hypotéz o jaké mohou být výsledky testování hypotéz? Testování hypotézy Testování hypotéz o předpokládejme, že nulová hypotéza platí (tj. účinnost farmakoterapie a psychoterapie je stejná) o 2 možnosti: n průměry vzorku A a B jsou velice podobné -- t je blízké nule a tak správně nezamítneme nulovou hypotézu n nebo se dopustíme chyby I. druhu Chyba I. druhu o je možné (i když málo pravděpodobné), že vzorky z populací o stejném průměru mohou mít velice rozdílné průměry o v tomto případě bychom nulovou hypotézu zamítli nesprávně a vyvodili, že průměry populací A a B jsou odlišné Chyba I. druhu o pravděpodobnost takové chyby se označuje hladina významnosti (a) o její úroveň stanovuje výzkumník (velice často na 5%, příp. 1%) o jde vlastně o pravděpodobnost, že získáme tuto hodnotu t (=rozdíl mezi průměry vzorků), pokud by nulová hypotéza platila Testování hypotéz o předpokládejme, že nulová hypotéza neplatí, terapie A není stejně účinná jako terapie B (tj. je rozdíl v míře úzkosti u pacientů z populace A a B) o opět dvě možnosti n najdeme rozdíly mezi průměry vzorků -- t je dostatečně velké a nulovou hypotézu tak správně zamítneme n dopustíme se chyby II. druhu Testování hypotézy Chyba II. druhu o průměry populace se liší, ale přesto se může stát, že průměry vzorků budou velice podobné o v tom případě nesprávně nezamítneme nulovou hypotézu a vyvodíme, že terapie jsou podobně účinné o pravděpodobnost této chyby se označuje b Testování hypotézy Statistická síla o pravděpodobnost, že správně zamítneme nulovou hypotézu, která neplatí, je rovna 1 - b o jde o tzv. sílu testu (power) -- schopnost zachytit rozdíl, který existuje o na rozdíl od hladiny významnosti nemůže být přesně stanovena ještě před provedením výzkumu, ale hraje velkou roli při rozhodování o dostatečné velikosti vzorku Statistická síla o je ovlivněna 4 faktory: n velikostí vzorku n rozdílem mezi populačními průměry n variabilitě měřeného znaku n zvolené hladině významnosti Velikost vzorku o s větším vzorkem máme větší pravděpodobnost, že existující rozdíl zachytíme Rozdíl mezi populačními průměry o čím je rozdíl mezi populačními průměry větší, tím větší pravděpodobnost, že najdeme i rozdíl mezi průměry vzorků o proto nejmenší rozdíl, po kterém má smysl pátrat, je ten, který je ještě klinicky významný o vychází i z podstaty problému - pokud porovnáváme např. lék s placebem, můžeme očekávat větší rozdíl účinku než při porovnání dvou léků Variabilita měřeného znaku o čím je větší variabilita měřeného znaku, tím menší pravděpodobnost, že zachytíme rozdíl mezi průměry Hladina významnosti o čím přísněji ji stanovíme (např. 0,1%), tím nižší síla testu Požadovaná velikost výběru o nejobvyklejší účel analýzy statistické síly je určení, jak velký musí být náš vzorek, abychom měli dostatečnou pravděpodobnost, že zachytíme předpokládaný rozdíl o je ovšem možné i zpětně posoudit sílu našeho testování poté, co byl výzkum proveden (příp. při metaanalýzách) Požadovaná velikost výběru o nejprve se musíme rozhodnout, jaký nejmenší rozdíl je ještě klinicky významný o takový rozdíl označíme d (nebo delta) o označuje se jako tzv. effect size -- velikost účinku o buď jde o standardizovaný rozdíl průměrů nebo korelaci mezi nezávislou a závislou proměnnou (pak se označuje r) Požadovaná velikost výběru o podle Cohena je n d = 0.20 malý účinek (r=0.10) n d = 0. 50 střední (r=0.243) n d = 0. 80 velký (r=0.371) Požadovaná velikost výběru o dále musíme odhadnout variabilitu znaku v populaci (s) -- z předchozích výzkumů, pilotní studie atd. o pak stanovit hladinu významnosti (obvykle 5%) o a nakonec sílu testu -- tj. jakou chceme mít pravděpodobnost, že pokud rozdíl existuje, že ho prokážeme? (ideálně 80%) Požadovaná velikost výběru o pro různé statistické testy se požadovaná velikost vzorku počítá různě o existují speciální počítačové programy, statistické software mají obvykle v pokročilejších modulech tyto výpočty zabudovány o je možné provést i ruční výpočet (s pomocí tabulky pro hodnoty d) Požadovaná velikost výběru o příklad: pro studii srovnávání účinnosti terapií úzkostných poruch chceme vypočítat velikost výběru o velikost účinku: jednu metodu bychom upřednostnili před druhou, pokud by rozdíl v testu úzkosti byl nejméně 5 bodů o směrodatná odchylka pro test úzkosti je 10 bodů Požadovaná velikost výběru o velikost účinku je pro naši studii d = 5/10 = 0.5 o hladina významnosti a = 0.05 o chceme dosáhnout síly testu 0.90 Požadovaná velikost výběru o vzorec pro test porovnávající dva průměry ze stejně velkých výběrů: o N = 2(d/d)2 Požadovaná velikost výběru o N = 2(d/d)2 o d najdeme v tabulce (hledáme d pro sílu testu 0.80 a a = 0.05) n d = 2.80 o N = 2(2.8/0.5)2 = 2(5,6)2 o N = 62.72 Požadovaná velikost výběru o požadovaná velikost výběru je asi 63 v každé skupině, tj. celkem 126 osob Síla již provedeného testu o obdobně můžeme spočítat sílu již provedeného testování -- kdy víme, jaká byla velikost výběru o kdyby byl v našem příkladu počet osob v jedné skupině 25, jaká by byla síla testu? Síla již provedeného testu o N = 2(d/d)2 o d = d N/2 o d = 0,5 25/2 o d = 0,5 (3,54) = 1,77 o pro d =1.77 a a =0,05 je síla testu asi 0,43 Síla již provedeného testu o při N=50 (v každé skupině 25) bychom měli pouze 43% pravděpodobnost, že najdeme rozdíl, i kdyby skutečně existoval Požadovaná velikost výběru Faktorová analýza o cíl faktorové analýzy o základní pojmy, postup o interpretace faktorů o příklad Faktorová analýza o cílem faktorové analýzy (exploratorní) je n 1) redukce dat -- zmenšení počtu proměnných odstraněním nadbytečných proměnných (tj. těsně korelujících s ostatními proměnnými) n 2) idetifikace struktury dat -- prozkoumat vztahy mezi proměnnými Faktorová analýza o výsledkem faktorové analýzy (exploratorní) je vytvoření několika hypotetických proměnných -- faktorů n někdy bývají nazývány latentní proměnné o faktory jsou lineárními kombinacemi původních proměnných o vysvětlují vztahy mezi původními proměnnými Faktorová analýza o extrakce faktorů -- na základě matice vztahů mezi proměnnými (např. korelační matice) o počet extrahovaných faktorů -- do značné míry závisí na rozhodnutí výzkumníka n cílem je vysvětlit co největší množství společného rozptylu co nejmenším počtem faktorů Faktorová analýza o interpretace faktorů -- faktorová analýza sama o sobě nenabídne označení faktorů (to je opět na výzkumníkovi) o faktor bývá označen na základě proměnných, které k němu mají nejtěsnější vztah (nejvyšší tzv. faktorové náboje -- korelace mezi faktorem a položkou) Faktorová analýza o rotace faktorového řešení -- usnadní interpretaci faktorů o rotace může být ortogonální (tj. předpokládá, že faktory jsou nezávislé) nebo šikmá (předpoklad korelace mezi faktory) o faktorové náboje zde můžeme interpretovat jako parciální korelace položky s faktorem Faktorová analýza - příklad o příklad aplikace FA: o Osecká, L., Řehulková, O., Macek, P. (1998). Zdravotní stesky adolescentů: struktura a rozdíly mezi pohlavím. Sborník konference Sociální procesy a osobnost, MU Brno. Faktorová analýza - příklad o cílem studie bylo mj.vytvořit typologii adolescentů na základě jejich zdravotních obtíží o adolescenti v dotazníku označili, jak často trpí každou z 18 nabídnutých zdravotních obtíží Faktorová analýza - příklad o bolesti hlavy o dýchací potíže o žaludeční potíže o závratě o nechutenství o nervozita, neklid o nespavost o noční můry o nesoustředěnost o nevolnosti o silný tlukot srdce o třesení rukou o náhlé zpocení o průjem, zácpa o bolesti v zádech o krční bolesti o bolesti na prsou o bolesti v pánvi Faktorová analýza - příklad o typologie na základě 18 proměnných by byla příliš složitá -- je třeba tento počet snížit o autoři spočítali faktorovou analýzu a extrahovali 3 faktory (vysvětlovaly celkem 48% společného rozptylu) Faktorová analýza - příklad Faktorová analýza - příklad o první faktor nazvali nevolnosti -- sytily ho především tyto potíže: n nevolnosti n nechutenství n závratě n žaludeční potíže n bolesti hlavy n nervozita, neklid Faktorová analýza - příklad o druhý faktor označili vegetativní obtíže -- sytily ho především položky: n třesení rukou n nespavost n náhlé zpocení n silný tlukot srdce n nesoustředěnost n noční můry Faktorová analýza - příklad o třetí faktor označili bolesti -- sytily ho především tyto potíže: n bolesti v pánvi n průjem, zácpa n bolesti na prsou n krční bolesti n bolesti v zádech Faktorová analýza - příklad o místo původních 18 proměnných indikujících frekvenci zdravostních potíží měli nyní 3 proměnné (lineární kombinace původní proměnných) -- nevolnosti, vegetativní potíže a bolesti o s nimi pak pracovali při typologii (viz dále)