Přednáška 6 Mm f>Ř$\ fMPh *iui^ Pojmy z oblasti statistického testování Typy testů Normalita dat a její význam pro testování iba W W W Parametrické vs. neparametrické testy • Parametrické testy • Mají předpoklady o rozložení vstupujících dat (např. normální rozložení) • Při stejném N a dodržení předpokladů mají vyšší sílu testu než testy neparametrické • Pokud nejsou dodrženy předpoklady parametrických testů, potom jejich síla testu prudce klesá a výsledek testu může být zcela chybný a nesmyslný • Neparametrické testy • Nemají předpoklady o rozložení vstupujících dat, lze je tedy použít i při asymetrickém rozložení, odlehlých hodnotách, či nedetekovatelném rozložení • Snížená síla těchto testů je způsobena redukcí informační hodnoty původních dat, kdy neparametrické testy nevyužívají původní hodnoty, ale nejčastěji pouze jejich pořadí Problémy parametrických a neparametrických testů Parametrické testy • Reálná data neodpovídají modelovému rozdělení Neparametrické testy • Díky převodu dat na pořadí ztrácíme část informace \ / \ 1 \l původních / \ « datech vidím e \ t ,mezeru" mezi/ \ skupinami 40 50 60 70 80 90 100 110 120 Po převodu na pořadí o tuto informaci přicházíme. Jednovýběrové a dvouvýběrové testy • Jednovýběrové testy (one-sample) • Srovnávají jeden vzorek (one sample, jednovýběrové testy) s referenční hodnotou (popřípadě se statistickým parametrem cílové populace) • V testu je tedy srovnáváno rozložení hodnot (vzorek) s jediným číslem (referenční hodnota, hodnota cílové populace) • Otázka položená v testu může být vztažena k průměru, rozptylu, podílu hodnot i dalším statistickým parametrům popisujícím vzorek • Dvouvýběrové testy (two-sample) • Srovnávají navzájem dva vzorky (two sample, dvouvýběrové testy) • V testu jsou srovnávány dvě rozložení hodnot • Otázka položená v testu může být opět vztažena k průměru, rozptylu, podílu hodnot i dalším statistickým parametrům popisujícím vzorek • Kromě testů pro dvě skupiny hodnot existují samozřejmě i testy pro více skupin dat Jednostranné a oboustranné hypotézy • Jednostranné testy (one-tailed) • Hypotéza testu je postavena asymetricky, tedy ptáme se na větší než/ menší než • Test může mít pouze dvojí výstup-jedna z hodnot je větší (menší) než druhá a všechny ostatní případy • Pouze v případě jasné hypotézy - jinak může být napadnuto za účelovost (při vhodném výběru směru testování snazší potvrzení významnosti) • Oboustranné testy (two-tailed) • Hypotéza testu se ptá na otázku rovná se/nerovná se • Test může mít trojí výstup - menší - rovná se - větší než • Situace nerovná se je tedy souhrnem dvou možných výstupů testu (menší+větší) • Významově neutrální ■J /V?V\ ': i IUII Institut biostatistiky a analýz, PřF a LF MU iba *>mf w w /* *\ Kritický obor (0.05) A Nepárový vs. párový design * Nepárový design • Skupiny srovnávaných dat jsou na sobě zcela nezávislé (též nezávislý, independent design), např. lidé z různých zemí, nezávislé skupiny pacientů s odlišnou léčbou atd. • Při výpočtu je nezbytné brát v úvahu charakteristiky obou skupin dat • Párový design • Mezi objekty v srovnávaných skupinách existuje vazba, daná např. člověkem před a po operaci, reakce stejného kmene krys atd. • Vazba může být buď přímo dána nebo pouze předpokládána (vtom případě je nutněji ověřit) • Test je v podstatě prováděn na diferencích skupin, nikoliv na jejich původních datech \ ■*—**- ■ ' y two sample I--• teši Důležité poznámky k testování hypotéz • Nezamítnutí nulové hypotézy neznamená automaticky její přijetí! Může se jednat o situaci, kdy pro zamítnutí nulové hypotézy nemáme dostatečné množství informace. • Dosažená hladina významnosti testu (ať už 5 %, 1 % nebo 10 %) nesmí být slepě brána jako hranice pro existenci / neexistenci testovaného efektu. • Malá p-hodnota nemusí znamenat velký efekt. Hodnota testové statistiky a p-hodnota mohou být ovlivněny velkou velikostí vzorku a malou variabilitou pozorovaných dat. • Na výsledky testování musí být nahlíženo kriticky-jedná se o závěr založeny „pouze" na jednom výběrovém souboru. • Statistická významnost indikuje, že pozorovaný rozdíl není náhodný, ale nemusí znamenat, že je významný i ve skutečnosti. Důležitá je i praktická (klinická) významnost. Statistické testy a normalita • Normalita dat je jedním z předpokladů tzv. parametrických testů (testů založených na předpokladu nějakého rozložení) - napr. t-testy • Obecně lze říci, že každá statistická metoda, v jejímž algoritmu je obsažen výpočet průměru nebo směrodatné odchylky má předpoklad normálního rozložení • Pokud data nejsou normální, neodpovídají ani modelovému rozložení, které je použito pro výpočet (t-rozložení) a test tak může lhát • Řešením je tedy: • Transformace dat za účelem dosažení normality jejich rozložení • Neparametrické testy - tyto testy nemají předpoklady o rozložení dat (nebo jen minimální) Typ srovnání Parametrický test Neparametrický test 2 skupiny dat nepárově: Nepárový t-test Mannův-Whitneyho test 2 skupiny dat párově: Párový t-test Wilcoxonův test, znaménkový test Více skupin nepárově: ANOVA (analýza rozptylu) Kruskalův- Wallisův test Korelace: Pearsonův koeficient Spearmanův koeficient Testy normality • Testy normality pracují s nulovou hypotézou, že není rozdíl mezi zpracovávaným rozložením a normálním rozložením. Vždy je ovšem dobré prohlédnout si i histogram, protože některé odchylky od normality, např. bimodalitu některé testy neodhalí. Chí-kvadrát test dobré shody • V testu dobré shody jsou data rozdělena do kategorií (obdobně jako při tvorbě histogramu), tyto intervaly jsou normalizovány (převedeny na normální rozložení) a podle obecných vzorců normálního rozložení jsou k nim dopočítány očekávané hodnoty v intervalech, pokud by rozložení byío normální. Pozorované normalizované četnosti jsou poté srovnány s očekávanými četnostmi pomocí x2 testu dobré shody. Test dáva dobré výsledky, ale ie náročný na n, tedy množství dat, aby bylo možné vytvořit dostatečný počet třícf hodnot. Kolmogorovův - Smirnovův test • Tento test je často používán, dokáže dobře najít odlehlé hodnoty, ale počítá spíše se symetrií hodnot nez přímo s normalitou. Jde o neparametrický test pro srovnání rozdílu dvou rozložení. Je založen na zjištění rozdílu mezi reálným kumulativním rozložením (vzorek) a teoretickým kumulativním rozložením. Měl by být počítán pouze v případě, že známe průměr a směrodatnou odchylku hypotetického rozložení, pokud tyto hodnoty neznáme, měla by být použita jeho modifikace - Lilieforsův test. Shapirův-Wilkův test • Jde o neparametrický test použitelný i při velmi malých n (10) s dobrou sílou testu, zvláště ve srovnání s alternativními typy testů, je zaměřen na testování symetrie. 250 200 150 100 145 155 165 175 185 195 205 215 iba JMI I Institut biostatistiky a analýz, PřF a LF MU Šikmost a špičatost jako testy normality • Parametry normálního rozdělení, skewness a kurtosis mohou být využity pro testování normality, ale pouze pro velké vzorky (šikmost - 100, špičatost - 500). skewness>0 skewness<0 Vizuální hodnocení normality c -o E o c _aj >oi ■o N o E 0 c 01 Histogram P-P plot -200 400 1000 1600 Hodnota proměnné Institut biostatistiky a analýz, PřF a LF MU 2200 -200 400 1000 1600 Hodnota proměnné 2200 -Ol c c £ o Q. ro O C xs o -Ol c c £ o o c xs o 135 125 115 105 95 85 75 700 600 500 400 300 200 100 Krabicový graf medián 25-75 percentil 5-95 percentil Vizuální hodnocení normality II Normální p-graf "í -0,5 Graf Q.Q 0,01 0,05 0,10 0,26 0,50 0,75 0,90 0,95 0,99 ??? 1,0 -0,5 -0,6 -0,4 -0,2 0,0 0,2 0,4 0,6 0,8 1,0 1,2 1,4 1,6 Pozorovaný kvantil Graf P-P • Pouze výměna os • Znázorněn pozorovaný a teoretický kvantil • Vykresleno kumulativní rozdělení PAMATUJ: Pocházejí-li data z normálního rozložení, pak body budou ležet okolo přímky A 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 Teoretické kumulativní rozděleni i m | Institut biostatistiky a analýz, PřF a LF MU Vizuální hodnocení normality III Rozložení s kladnou šikmostí Normální rozložení Rozložení se zápornou šikmostí Histogram Histogram Histogram __L NP plot Kon kávní NP plot NP plot K :c n v t "\ 1 M 1 1 j k r v k a < S r S Krabicový diagram Krabicový diagram Krabicový diagram Výukové materiály: Výpočetní statistika, RNDr. Marie Budíková, Dr., 2011 iba I Institut biostatistiky a analýz, PřF a LF MU Parametrické jednovýběrové statistické testy Jednovýběrový t-test Jednovýběrový test rozptylu Anotace • Jednovýběrové statistické testy srovnávají některou popisnou statistiku vzorku (průměr, směrodatnou odchylku) s jediným číslem, jehož význam je ze statistické hlediska hodnota cílové populace • Z hlediska statistické teorie jde o ověření, zda daný vzorek pochází z testované cílové populace. Shrnutí statistických testů Typ srovnání Nulová hypotéza Parametrický test Neparametrický test 1 výběr dat vs. referenční hodnota Střední hodnota je rovna zvolené referenční hodnotě. jednovýběrový t-test / z-test Jednovýběrový Wilcoxonův test 2 nezávislé skupiny dat (test shody středních hodnot) Střední hodnoty se mezi skupinami neliší. nepárový t-test Mannův-Whitneyho test 2 nezávislé skupin dat (test shody rozptylů = homoskedasticity) Rozptyl obou skupin je shodný. F-test Levenův test 2 párově závislé výběry dat Rozdíl (diference) párových hodnot je nulový. párový t-test Wilcoxonův test; znaménkový test Shoda rozdělení výběru s teoretickým rozdělením Rozdělení dat odpovídá teoretickému (vybranému) rozdělení. test dobré shody (X2 test) Shapirův-Wilkův test; Kolmogorovův-Smirnovův test; Lilieforsův test 3 a více skupin nepárově (test shody středních hodnot) Střední hodnoty se mezi skupinami neliší. ANOVA Kruskalův-Wallisův test Korelace Neexistuje vztah mezi hodnotami dvou výběrů. Pearsonův korelační koeficient Spearmanův korelační koeficient iba JMI | Institut biostatistiky a analýz, PřF a LF MU Základní rozhodování o výběru statistických testů Spojitá x spojitá data Pearsonův korelační koeficient Spearmanův korelační koeficient Spojitá x kategoriálnídata Jeden výběr Dva výběry Párová data Jednovýběrový t-test Jednovýběrový Wilcoxonův test Nepárová data Párový t-test Wilcoxonův / znaménkový test Dvouvýběrový t-test Mannův-Whitneyho test Tři a více výběrů nepárově) Parametrické testy Neparametrické testy Kategoriálníx kategoriální data Jeden výběr ANOVA Kruskalův-Wallisův test 1 Více výběrů Párová data Jednovýběrový binomický test 1 Nepárová data McNemarův test Chí-kvadrát test Fisherův exaktní test iba JMI I Institut biostatistiky a analýz, PřF a LF MU Parametrické jednovýbérové testy • Předpoklad: normalita dat • Jednovyběrovy z-test (porovnání základního a výběrového souboru, známe střední hodnotu a rozptyl základního souboru) • Studentův jednovyběrovy t-test (testování rozdílů dvou středních hodnot) -(porovnání základního a výběrového souboru, známe střední hodnotu ale neznáme rozptyl základního souboru; nahrazujeme jej výběrovým rozptylem našich dat) • Chi-kvadrát test (testování rozdílu cílová vs. výběrová populace) Jednovýběrový z a t test • V případě jednovýběrových testů jde o srovnání výběru dat (tedy one sample) s cílovou populací. Pro parametrické testy musí mít datový soubor normální rozložení. • Rozdíl mezi jednovýběrovým z-testem a t-testem spočívá ve znalosti rozptylu základního souboru (z-test) nebo jeho nahrazení výběrovým rozptylem našich dat (t-test) z-test: x — \i z =- VAŽ t-test: x — u t =- VAŽ H0 HA Testová statistika Kritická hodnota X < \i X > \i z/t z > zl-a / t > tl-a X>\i X <\i z/t z*l-«/2/ M > ti-a/2 iba Ě 'WS* | Institut biostatistiky a analýz, PřF a LF MU Příklad: z-test projeden výběr 1 • Při populačním epidemiologickém průzkumu se zjistilo, že průměrný objem prostaty u mužů je 32,73 ml (SD = 18,12 ml). • Na hladině významnosti testu a = 0,05 chceme ověřit, jestli se muži nad 70 let liší od celé populace. • Máme náhodný výběr o velikosti n = 100 a výběrový průměr 36,60 ml. • Chceme ověřit platnost: • H0: jLX = 32,73 • HA: jlx ^ 32,73 a/2 1-a a/2 iba JMI I Institut biostatistiky a analýz, PřF a LF MU Příklad: z-test projeden výběr 2 Hodnota testové statistiky: x — a ,— 36,60 — 32,73 ,- z =--VAŽ =-——-VTÔÔ = 2,14 p 18,12 • Můžeme zamítnout nulovou hypotézu na hladině významnosti testu a = 0,05 nebo ne? z = 2,14 > 1,96 (z!_a/2 = z0<975) • Nulovou hypotézu o rovnosti objemu prostaty u mužů nad 70 let populační hodnotě 32,73 ml zamítáme na hladině významnosti a = 0,05, protože výsledná hodnota z statistiky je větší než kritická hodnota (příslušný kvantil) rozdělení N(0,1). •*to&r '^.-^ ^»»«* |U| I Institut biostatistiky a analýz, PřF a LF MU Příklad: t-test projeden výběr • Určitá linka autobusové městské dopravy má v době dopravní špičky průměrnou rychlost 8 km/hod. Uvažovalo se o tom, zda změna trasy by vedla ke změně průměrné rychlosti. Nová trasa byla proto projeta v deseti náhodně vybraných dnech a byly zjištěny tyto průměrné rychlosti: 8,4; 7,9; 9,0; 7,8; 8,0; 7,8; 8,5; 8,2; 8,2; 9,3. Rozhodněte, zda změna trasy vede ke změně průměrné rychlosti. Předpokládáme normální rozdělení a a=0,05. • Postup: 1. Na hladině významnosti 0,05 testujeme hypotézu H0: u. = 8, proti HA: u. * 8 2. Vypočteme aritmetický průměr a rozptyl výběrového souboru. 3. Vypočteme testovou statistiku t: x-\i r- 8,310-8 _ t =--VAŽ = VTÔ = 1,934 5 0,507 4. Vypočtené t porovnáme s kritickou hodnotou: h-a/2 = řo,975 — 2,262 5. Je-li \t\ < t^Zot/ - > statisticky nevýznamný rozdíl testovaných parametrů při zvolené a; nulovou hypotézu nezamítáme, na hladině významnosti a=0,05 se nepodařilo prokázat, ze by změna trasy měla za následek změnu průměrné rychlosti. V?V^ i\mi\ I Institut biostatistiky a analýz, PřF a LF MU Typické výstupy SW (Statistica, v jiných obdobné) Výběrový průměr (průměr pozorovaných dat) Rozsah výběru Hodnota testovacího kritéria Standardní chyba Variable Test of rr eans against referei> fe const* |nt (value) (Q4_doprava.sta) Std.Dv. rychlost Stupeň volnosti J Std.Err. Reference Constant t-value 513_10 0.160174 8,000000 1,935401 Výběrová směrodatná odchylka (pozorovaných dat) POZOR: Platí pro oboustranný test! Referenční konstanta-předpokládaná velikost střední hodnoty iba Ě I Institut biostatistiky a analýz, PřF a LF MU Příklad k řešení: t-test 1 Data - koncentrace antibiotika v cílovém orgánu • Při 1000 měřeních antibiotika byla zjištěna v cílovém orgánu průměrná koncentrace 202,5 jednotek a směrodatná odchylka 44 jednotek. • Požadovaná koncentrace antibiotika je 200 jednotek. Výzkumné otázky 1. Je daný rozdíl 2,5 významný vzhledem k variabilitě znaku na hladině významnosti 5%? 2. Jaká je skutečná hladina významnosti? Příklad k řešení: t-test 1 Data - koncentrace antibiotika v cílovém orgánu • Při 1000 měřeních antibiotika byla zjištěna v cílovém orgánu průměrná koncentrace 202,5 jednotek a směrodatná odchylka 44 jednotek. • Požadovaná koncentrace antibiotika je 200 jednotek. Výzkumné otázky 1. Je daný rozdíl 2,5 významný vzhledem k variabilitě znaku na hladině významnosti 5%? 2. Jaká je skutečná hladina významnosti? X — [i Važ = 202,5 - 200 VTÔÔÔ = 1,797 t = 44 5 Příklad k řešení: t-test 1 X — li ,— 202,5 — 200 ,- .N-l -999 i n^n t =--VAŽ =---VTÔÔÔ = 1,797-1,8 h_a/ = řj;9y75 = 1,960 Area between O and z /Y, 0 z 0.00 .01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 1.7 0.455^ 0.4573 0.45ÍÍ 0.459" 0.4599 0.4608 0.4616 0.4625 0.4633 1.8 D.4641 .4649 0.4656 0.466^ 0.4671 0.4678 0.46S6 0.4693 C.4Í99 0.4706 Výzkumné otázky 1. Je daný rozdíl 2,5 významný vzhledem k variabilitě znaku na hladině významnosti 5%? • Nulovou hypotézu nezamítáme 2. Jaká je skutečná hladina významnosti? • p = 2*(1-0,4641)=0,072 ■J /V?V\ ': i IUII Institut biostatistiky a analýz, PřF a LF MU IBA ^ ltí# W Příklad k řešení: t-test 2 Data - aktivita enzymu v buňkách • Při zjišťování aktivity enzymu v buňkách na vzorku 25 měření byl zjištěn průměr 3,5 jednotek a směrodatná odchylka 1. Výzkumné otázky 1. otázka zní, zda se naměřené hodnoty našeho vzorku liší od výsledků dřívější rozsáhlé studie zaměřené na celou cílovou populaci, kde byla zjištěna průměrná aktivita 2,5 2. otázka - jakou minimální odchylku X od jiné hodnoty bychom zachytili při daných hodnotách? 3. za předpokladu, že z praktického hlediska je významná odchylka již 0,2 jednotky, jaký minimální počet měření musíme provést, abychom ji byli schopni prokázat ? jednotky? Příklad k řešení: t-test 2 Data - aktivita enzymu v buňkách • Při zjišťování aktivity enzymu v buňkách na vzorku 25 měření byl zjištěn průměr 3,5 jednotek a směrodatná odchylka 1. Výzkumné otázky 1. otázka zní, zda se naměřené hodnoty našeho vzorku liší od výsledků dřívější rozsáhlé studie zaměřené na celou cílovou populaci, kde byla zjištěna průměrná aktivita 2,5 jednotky? X - LI i— t =-—yln 3,5 - 2,5 V25 =5 s tl%5 = 2,064 ^> t>t .24 \-al2 HO zamítnuta při a<0,05 Příklad k řešení: t-test 2 Data - aktivita enzymu v buňkách • Při zjišťování aktivity enzymu v buňkách na vzorku 25 měření byl zjištěn průměr 3,5 jednotek a směrodatná odchylka 1. Výzkumné otázky 2. otázka - jakou minimální odchylku X od jiné hodnoty bychom zachytili při daných hodnotách? t = ——sfň = —síň ^ d s s l-a/2 4ň s ^ d = 2,064 5 Příklad k řešení: t-test 2 Data - aktivita enzymu v buňkách • Při zjišťování aktivity enzymu v buňkách na vzorku 25 měření byl zjištěn průměr 3,5 jednotek a směrodatná odchylka 1. Výzkumné otázky 3. za předpokladu, že z praktického hlediska je významná odchylka již 0,2 jednotky, jaký minimální počet měření musíme provést, abychom ji byli schopni prokázat ? t = -ju i- d i--V« = — yln ^ n = l-a/2 d Jednovýběrový test pro rozptyl • V případě one sample testů jde o srovnání výběru dat (tedy one sample) s cílovou populací. Pro parametrické testy musí mít datový soubor normální rozložení. Chi-kvadrát test: (N - l)s2 X2 = H0 HA Testová statistika Kritická hodnota s2 CT2 x2 2 . 2 (N-l) X > Xi-a s2 >CT2 s2 xllaj^ nebox2 < xVf2~^ iba Ě 'WS* | Institut biostatistiky a analýz, PřF a LF MU Neparametrické jednovýběrové statistické testy Jednovýběrový t-test Jednovýběrový test rozptylu » yXV O tba mm Parametrické vs. neparametrické testy Parametrické testy • Mají předpoklady o rozložení vstupujících dat (např. normální rozložení) • Při stejném N a dodržení předpokladů mají vyšší sílu testu než testy neparametrické • Pokud nejsou dodrženy předpoklady parametrických testů, potom jejich síla testu prudce klesá a výsledek testu může být zcela chybný a nesmyslný Neparametrické testy • Vyžadují méně předpokladů o rozložení vstupujících dat, lze je tedy použít i při asymetrickém rozložení, odlehlých hodnotách, či nedetekovatelném rozložení • Snížená síla těchto testů je způsobena redukcí informační hodnoty původních dat, kdy neparametrické testy nevyužívají původní hodnoty, ale nejčastěji pouze jejich pořadí • Souvisíš malou velikostí souboru (nejsme schopni normalitu dat ověřit) Proč nemusí parametrický a neparametrický test vyjít stejně? Jednovýběrový Wilcoxonův test • Předpokladem je symetrické rozdělení dat kolem mediánu. • Testuje, zda je medián jednoho výběru roven hodnotě c (v případě párového designu je x0.5 reprezentováno mediánem rozdílu hodnot) Postup: 1. Spočítáme rozdíly hodnot výběru s testovanou hodnotou mediánu. 2. Absolutní hodnoty rozdílů uspořádáme vzestupně a přiřadíme jim pořadí. 3. Spočítáme statistiky Sw+a Sw~, které odpovídají součtu pořadí kladných (Sw+) a záporných rozdílů (Sw~). Jako finální hodnotu testové statistiky bereme minimum z Sw+ a Sw\ Nulovou hypotézu zamítáme, pokud hodnota testové statistiky menší nebo rovna tabelované kritické hodnotě (při dané hladině významnosti a počtu nenulových rozdílů). nebo 3. Pro N > 30 lze využít asymptotické normality statistiky Sw+ H0: x05=c proti H1: x05* c. E(Sw+) n(n + l) D(Sw+) n(n + l)(2n + l) Z = + -E(SW+) 4 24 • Pokud | Z | > u l-a/2 zamítáme nulovou hypotézu, že medián výběru je roven hodnotě c. Jednovýběrový znaménkový test • Lze použít v situaci, kdy není splněn předpoklad symetrie rozdělení kolem mediánu. • Testuje, zda je medián jednoho výběru roven hodnotě c (v případě párového designu je x0 5 reprezentováno mediánem rozdílu Postup: 1. Spočítáme rozdíly hodnot výběru s testovanou hodnotou mediánu. 2. Spočítáme statistiku Sz+, která odpovídá počtu kladných rozdílů -> test nevyužívá hodnot pořadí původních dat ale pouze informaci, zda se hodnota realizuje nad nebo pod mediánem -> dochází ke snížení síly testu 3. Nulovou hypotézu zamítáme, pokud statistika Sz+ realizuje v kritickém oboru hodnot W=(0,k1)U(k2,n), kde n odpovídá počtu nenulový rozdílů a hodnoty kx a k2 lze dohledat v matematických tabulkách. • nebo 3. Pro N > 20 lze využít asymptotické normality statistiky Sz+ hodnot) H0: x0 5=c proti H^. x0 5* c. E(Sz+) n D(Sz+) n Z = Sz + -E(Sz+) 2 4 Pokud | Z | > u^/2 zamítáme nulovou hypotézu, že medián výběru je roven hodnotě c. Příklad: jednovýběrový test • U 15 náhodně vybraných pacientů byla vyhodnocena doba, kterou museli strávit v čekárně, než byli sestrou pozváni do ordinace. Na 5% hladině významnosti testujte nulovou hypotézu, že medián čekací doby je roven půl hodině. Příklad: jednovýběrový test - Wilcoxonův test • U 15 náhodně vybraných pacientů byla vyhodnocena doba, kterou museli strávit v čekárně, než byli sestrou pozváni do ordinace. Na 5% hladině významnosti testujte nulovou hypotézu, že medián čekací doby je roven půl hodině. Pacient č. čekací doba (min) medián rozdíl | rozdílí pořadí 1 1 30 -29 29 15 2 45 30 15 15 10 3 25 30 -5 5 3.5 4 15 30 -15 15 10 5 34 30 4 4 2 6 19 30 -11 11 8 7 31 30 1 1 1 8 25 30 -5 5 3.5 9 8 30 -22 22 14 10 12 30 -18 18 12 11 20 30 -10 10 6 12 15 30 -15 15 10 13 40 30 10 10 6 14 20 30 -10 10 6 15 10 30 -20 20 13 sw-=ioi min (V,SW-)=19 Kritická hodnota w15(0,05)=25 Hodnota testové statiky je menší než kritická hodnota -> zamítáme Hn iba JMI I Institut biostatistiky a analýz, PřF a LF MU Příklad: jednovýběrový test - Znaménkový test • U 15 náhodně vybraných pacientů byla vyhodnocena doba, kterou museli strávit v čekárně, než byli sestrou pozváni do ordinace. Na 5% hladině významnosti testujte nulovou hypotézu, že medián čekací doby je roven půl hodině. Pacient č. čekací doba (min) medián rozdíl Větší než medián? 1 1 30 -29 Ne 2 45 30 15 Ano 3 25 30 -5 Ne 4 15 30 -15 Ne 5 34 30 4 Ano 6 19 30 -11 Ne 7 31 30 1 Ano 8 25 30 -5 Ne 9 8 30 -22 Ne 10 12 30 -18 Ne 11 20 30 -10 Ne 12 15 30 -15 Ne 13 40 30 10 Ano 14 20 30 -10 Ne 15 10 30 -20 Ne Kritický obor: W=(0,3)U(12,15) Hodnota statistiky se realizuje mimo kritický obor hodnot -> nezamítáme Hn iba JMI I Institut biostatistiky a analýz, PřF a LF MU Příklad: Řešení v softwaru 1) Výstup Wilcoxonova testu Testová statistika: min (SW+,SW") Wilcoxon Matclled Pairs Test (v cekáme.sta) Marked tests fre significant at p <.05000 Pair of Variables Valid N Z p-value doba & median 15 19.00000, 2.328E44 0.019879, I z Statistika a p-hodnota pro asymptotickou variantu testu (používat pouze pro N > 30) Počet nenulových rozdílů 2) Výstup znaménkového testu Podíl hodnot menších než testovaný medián Pair of Variables Sign Test (v cekar Marked tests are f ]e.sta) Ignificant at p <.05000 Ho. of I Perl Non-ties | v 1 ent V Z p-value doba & median 151 73.33333. 1.549193 I-1-■ 1 0.121335 Počet nenulových rozdílů asymptotickou variantu testu (používat pouze pro N > 20) iba řYSVt i*Wft* i IUI I Institut biostatistiky a analýz, PřF a LF MU W Ä' W Schéma při testování pomocí jednovýběrových testů Data ~~r~ Vizuální ověření normality Testové ověření normality Histogram, Q-Q graf, P-P graf, N-P graf, krabicový graf S-W test, K-S test, Lilieforsův test Opakování Normální rozdělení? I - NE Logaritmická transformace Normální rozdělení? I NE ZEL Jednovýběrový Wilcoxonův test na původních datech ANO Jednovýběrový t-test / z-test na transformovaných datech ANO Jednovýběrový t-test / z-test Parametrické testy Neparametrické testy iba řYSVt i*Wft* i IUI I Institut biostatistiky a analýz, PřF a LF MU W Ä' W Parametrické dvouvýběrové statistické testy Dvouvýběrový nepárový t-test Dvouvýběrový párový t-test HUSU "w,.^ ^llAt* Anotace • Jedním z nejčastějších úkolů statistické analýzy dat je srovnání spojitých dat ve dvou skupinách pacientů. • Na výběr je celá škála testů, výběr konkrétního testu se pak odvíjí od toho, zda je o srovnání párové nebo nepárové a zda je vhodné použít test parametrický (má předpoklady o rozložení dat) nebo neparametrický (nemá předpoklady o rozložení dat, nicméně má nižší vypovídací sílu). • Nejznámějšími testy z této skupiny jsou tzv. t-testy používané pro srovnání průměrů dvou skupin hodnot Dvouvýběrové testy: párové a nepárové I Při použití two sample testů srovnáváme spolu dvě rozložení. Jejich základním dělením je podle designu experimentu na testy párové a nepárové. Základním testem pro srovnání dvou nezávislých rozložení spojitých čísel je nepárový two-sample t-test nepárový ^ I two sample tesi X2 ♦ t '.V Základním testem pro srovnání dvou závislých rozložení spojitých čísel je párový two-sample t-test Diference XI X2 xiaX2 Párový ■ i y two sample tes L iba Ě 'WS* I Institut biostatistiky a analýz, PřF a LF MU Dvouvýběrové testy: párové a nepárové x1 x2 Nezávislé uspořádání ^ H0. ^ iii2 XrX2=D Párové uspořádání ^ 2 2 i5\ tS" o H n:D = 0 Design uspořádání zásadně ovlivňuje interpretaci parametrů LÄ y^^HiK AlBKSíř, 2 (n = n2 = /BA řYSVt i*Wft* t IUII Institut biostatistiky a analýz, PřF a LF MU W Ä' W Dvouvýběrové testy: párové a nepárové III • Identifikace párovitosti (Korelace, Kovariance) Předpoklady nepárového dvouvýběrového t-testu Náhodný výběr subjektů jednotlivých skupin z jejich cílových populací Nezávislost obou srovnávaných vzorků Přibližně normální rozložení proměnné ve vzorcích, drobné odchylky od normality ovšem nejsou kritické, test je robustní proti drobným odchylkám od tohoto předpokladu, normalita může být testována testy normality Rozptyl v obou vzorcích by měl být přibližně shodný (homoscedastic). Tento předpoklad je testován několika možnými testy - Levenův test nebo F-test. Vždy je vhodné prohlédnout histogramy proměnné v jednotlivých vzorcích pro okometrické srovnání a ověření předpokladů normality a homogenity rozptylu - nenahradí statistické testy, ale poskytne prvotní představu. x X + + Varianta 1 Varianta 2 YÍYt ífč^ň& ŕlliľl Institut biostatistiky a analýz, PřF a LF MU m* W w Nepárový dvou výběrový t-test - výpočet I nulová hypotéza: průměry obou skupin jsou shodné, alternativní hypotéza je, že nejsou shodné, two tailed test prohlédnout průběh dat, průměr, medián apod. pro zjištění odchylek od normality a nehomogenita rozptylu, provést F-test F-test pro srovnání dvou výběrových rozptylů • Používá se pro srovnání rozptylu dvou skupin hodnot, často za účelem ověření homogenity rozptylu těchto skupin dat. V případě ověření homogenity je testována hypotéza shody rozptylů (two tailed); v případě shodných rozptylů je vše v pořádku a je možné pokračovat ve výpočtu t-testu, v opačném případě není vhodné test počítat. H0 HA Testová statistika 2 ^1 , 2 2 ^1 2 >a2 2 S2 2 ^1 >Ř$\ fMPh 4ui^ Příklad : Nepárový dvouvýběrový t-test ^ 1. skupina, N=30 • Průměrná hmotnost ovcí v čase páření byla srovnávána pro kontrolní skupinu a skupinu krmenou zvýšenou dávkou potravy. Kontrolní skupina obsahuje 30 ovcí, skupina se zvýšeným příjmem potravy pak 24 ovcí. Vlastní experiment byl prováděn tak. že na začátku máme 54 ovcí (ideálně stejného plemene, stejně staré atd.), které náhodně rozdělíme do dvou skupin (náhodné rozdělování objektů do pokusných skupin je objektem celého specializovaného odvětví statistiky nazývaného randomizace). Poté co experiment proběhne, musíme nejprve ověřit teoretický předpoklad pro využití nepárového t-testu. Pro obě skupiny jsou vykresleny grafy (můžeme téz spočítat základní popisnou statistiku), na kterých můžeme posoudit normalitu a homogenitu rozptylu, kromě okometrického pohledu můžeme pro ověření normality použít testy normality, pro ověření homogenity rozptylu pak F-test. Pokud platí všechny předpoklady dvouvýběrového nepárového t-testu, můžeme spočítat testovou statistiku, výsledné řje 2,43 s 52 stupni volnosti, podle tabulek je a tpo75(52)= 2,01, tedy 111 > tQ 975 (52) a nulovou hypotézu můžeme zamítnout, skutečná pravděpodobnost je pak 0,018. Rozcfífmezi skupinami je 1,59 Kg ve prospěch skupiny se zvýšeným příjmem. Rozdíl. průměru x\-xi SE (rozdíl .průměru ) L 0 i P + — V n2) [nx - \)s\ + [n2 - l)s n, +n Pro rozdíl mezi oběma soubory jsou spočítány 95% intervaly spolehlivosti jako 1,59±2.01*(0,655) kg, což odpovídá rozsahu 0,28 až 2,91 kg. To, že interval spolehlivosti nezahrnuje 0 je dalším potvrzením, že mezi skupinami je významný rozdíl - jde o další způsob testování významnosti rozdílů mezi skupinami dat - nulovou hypotézu o tom, že rozdíl průměrů dvou skupin dat je roven nějaké hodnotě zamítáme v případě, kdy 95% interval spolehlivosti rozdílu nezahrnuje tuto hodnotu (v tomto případě 0). í i i A (x1 x2) i t q 915SE(xx x2) — (x1 x2)iř0975 Is 1 1 — + — V n\ n2 J Y5Yí fr^y-Ú i Ilji I Institut biostatistiky a analýz, PřF a LF MU 2. skupina, N=24 Příklad : Nepárový dvouvýběrový t-test • Nejprve ověřte normalitu hmotnosti jednak ve skupině kontroly a ve skupině se zvýšenou potravou 2.5 2,0 1.5 1,0 tu - 05 Normal Probability Plot of Hmotnost: categorized by Skupina srovnáni hmotnosti ovci 5v*54c O/ /o /o I 0,0 0 1 -0,5 OJ S -1 0 Q. x LU -1,5 -2,0 2,5 6 Jo / of - '■"■'/- o 9 '/ O 7 0 62 64 66 68 70 72 74 6 .....................................!i5;.k'.!..!.p-irhí!.:....!<™i.tr.R. ŕ*.................................................................. 0 62 64 66 68 70 72 74 .............................Skiininŕľ 7\i\/^nr\ň nntravpi Skupina: Kontrola Hmotnost: SW-W = D;9859; p = 0,9520 Skupina: Zvýšená potrava Hmotnost: SW-W = 0,9847: o - 0,9645 • V obou případech se tečky odchylují od přímky jenom málo a p-hodnoty S-W testu převyšují 0,05. Předpoklad o normálním rozložení dat v obou skupinách je oprávněný. iba JMI I Institut biostatistiky a analýz, PřF a LF MU Příklad : Nepárový dvouvýběrový t-test 'POZOR: Výstupní tabulku vyhodnocujeme zezadu!!! Výběrový průměr u 1. skupiny Výběrový průměr u 2. skupiny T-tests; Group Group 1: Kont Group 2: Zvýšená potrava Mean Kontrola 65.77333 67.3666 Výběrová směrodatná odchylka u 2. skupiny Rozsah výběru 1. skupiny Rozsah výběru 2. skupiny ng: Skupina (srovnáni hmotnosti ovc la Mean Zvýšená potrava Hodnota testové statistiky (pro test shody středních hodnot) Počet stupňů volnosti ValhTN Zvýšená potrava Std.Dev. Kontrola 24 2.497162 Std. Zvýšina potrava F-rati o Variances 2.252471 1.229066 Variances 0.617383 Testová statistika pro test shody rozptylů (F-test) Tyto sloupce lze interpretovat pouze pokud rozdíl mezi rozptyly byl neprůkazný!!! iba JMI I Institut biostatistiky a analýz, PřF a LF MU Párový dvouvýběrový t-test • Skupiny dat jsou spojeny přes objekt měření, příkladem může být měření parametrů pacienta před léčbou a po léčbě (nemusí jít přímo o stejný objekt, dalším příkladem mohou být např. krysy ze stejné linie). • Oba soubory musí mít shodný počet hodnot, protože všechna měření v jednom souboru musí být spárována s měřením v druhém souboru. Při vlastním výpočtu se potom počítá se změnou hodnot (diferencí) subjektů v obou souborech. • V případě, že se nejedná o měření na temže subjektu je vhodné si před párovým testem ověřit si, zda existuje vazba mezi oběma skupinami - vynesení do grafu, korelace. Existuje několik možných designů experimentu, stručně lze sumarizovat: • pokus je párový a jako párový se projeví • párové provedení pokusu - párově se neprojeví • možná párovost není • špatně provedený pokus - malé n, velká variabilita, špatný výběr jedinců • čekali jsme nezávislé a jsou • čekali jsem nezávislé a nejsou • vazba • náhoda Párový dvouvýběrový t-test • Tento test nemá žádné předpoklady o rozložení vstupních dat, protože je počítán až na základě jejich diferencí. • Tyto diference by měly být normálně rozloženy a otázkou v párovém t-testu je, zda se průměrná hodnota diferencí rovná nějakému číslu, typicky jde o srovnání s nulou jako důkaz neexistence změny mezi oběma spárovanými skupinami. • V podstatě jde o one sample t-test, kde místo rozdílu průměru vzorku a cílové populace je uveden průměr diferencí a srovnávané číslo (0 v případě otázky, zda není rozdíl mezi vzorky). Někdy je obtížné rozhodnout, zda jde nebo nejde o párové uspořádání, párový test by měl být použit pouze v případě, že můžeme potvrdit vazbu (korelace, vynesení do grafu), jedním z důvodů proč toto ověřovat je fakt, že v případě párového t-testu není nutné brát ohled na variabilitu původních dvou souborů, tento předpoklad však platí pouze v případě vazby mezi proměnnými. Výpočet obou typů testů se vlastně liší v použité s, jednou jde o s diferencí, v druhém případě o složený odhad rozptylu obou souborů. Zda je párové uspořádání efektivnější lze určit na základě: Síly vazby Je-li sD výrazně menší než sxl.x2 2 2 2 Závislost je možné rozepsat pomocí vzorce: 5 = 30) lze využít asymptotické normality statistiky U. mm m»2(»i + »2 + l) E(U) =- D(U) =- 2 12 6. Pro testování lze využít Z-statistiky: 7. Pokud |Z| - uzamítáme nulovou hypotézu o shodnosti distribučních funkcí Institut biostatistiky a analýz, PřF a LF MU Mannův-Whitneyův U test • Stejně jako řada jiných neparametrických testů počítá i tento test s pořadím dat v souborech namísto s originálními daty. Jde o neparametrickou obdobu nepárového t-testu a z těchto neparametrických testů má nejvyšší sílu testu (95% párového t-testu). • V případě Mann-Whitney testu jsou nejprve čísla obou souborů sloučena a je vytvořeno jejich pořadí v tomto sloučeném souboru, pak jsou hodnoty vráceny do původních souborů a nadále se pracuje již jen s jejich pořadím. • Pro oba soubory je tedy vytvořen součet pořadí a menší z obou součtů je porovnán s kritickou hodnotou testu, pokud je tato hodnota menší než kritická hodnota testu, zamítáme nulovou hypotézu shody distribučních funkcí obou skupin. JMI | Institut biostatistiky a analýz, PřF a LF MU Příklad: Mannův-Whitneyův U test • 17 štěňat bylo trénováno v chození na záchod metodou pozitivní motivace (pochvala, když jde na záchod venku) nebo negativní motivace (trest, když jde na záchod doma). Jako parametr bylo měřeno, za kolik dní je štěně vycvičeno. • Nulová hypotéza je, že není rozdíl v metodách tréninku, tedy, že oběma metodami je štěně vycvičeno za stejnou dobu. • Po srovnání rozložení + kvůli nízkému počtu hodnot je vhodné použít neparametrický test. • Je vytvořeno pořadí hodnot v kompletním souboru. • Hodnota testové statistiky je určena ze součtu pořadí hodnot v jednotlivých skupinách. * Jak dopadne testování? LÄ y^^HiK AlBKSíř, Y?V\ í^ďů í Ilji f Institut biostatistiky a analýz, PřF a LF MU Příklad: Řešení v softwaru Součet pořadí Součet pořadí T2 Hodnota Z statistiky variable délka Manr Whitney U 1 By variable skupin Marked tests are Rank Sum Group 1 49 50000 103,5 51 st (Spreadsheets) nificant at p <,05000 Rank Sum Group 2 U p-value Z adjusted p-value Valid N Group 1 Valid N Group 2 2ř1sided exact p Q0 IjlfrOOOO -2.11G95 0.034265 -2.11955 0.034045 9 0.027396 r1 Hodnota testové statistiky Asymptotická p-hodnota Přesná p-hodnota (použít, jestliže rozsah výběru je menší než 30) Institut biostatistiky a analýz, PřF a LF MU Párový Wilcoxonův a znaménkový test • Vycházíme z rozdílů párových hodnot a přecházíme na design jednovýběrových testů • Testuje, zda je medián diferencí (D) párových hodnot roven hodnotě c H0: D05=c proti D05* c. Wilcoxonův párový test 1. Spočítáme rozdíly diferencí výběru s testovanou hodnotou mediánu = c. 2. Absolutní hodnoty rozdílů uspořádáme vzestupně a přiřadíme jim pořadí. 3. Spočítáme statistiky Sw+ a Sw~, které odpovídají součtu pořadí kladných (Sw+) a záporných rozdílů (Sw~). Jako finální hodnotu testové statistiky bereme minimum z Sw+a Sw~. Nulovou hypotézu zamítáme, pokud hodnota testové statistiky menší nebo rovna tabelované kritické hodnotě (při dané hladině významnosti a počtu nenulových rozdílů). Znaménkový párový test 1. Spočítáme rozdíly diferencí výběru s testovanou hodnotou mediánu = c. 2. Spočítáme statistiku Sz+, která odpovídá počtu kladných rozdílů -> test nevyužívá hodnot pořadí původních dat ale pouze informaci, zda se hodnota realizuje nad nebo pod mediánem -> dochází ke snížení síly testu 3. Nulovou hypotézu zamítáme, pokud statistika Sz+ realizuje v kritickém oboru hodnot W=(0,k1)U(k2,n), kde n odpovídá počtu nenulový rozdílů a hodnoty kx a k2 lze dohledat v matematických tabulkách. Příklad 2: Párový dvouvýběrový test Byla testována nová dieta pro laboratorní krysy, při pokusu byl zjišťován její vliv na hmotnost v různých liniích krys, bylo proto zvoleno párové uspořádání kdy krysy v obou dietách jsou spojeny pres svoji linii, tj. na začátku byly dvojice krys stejné linie, jedna z nich byla náhodně přiřazena k dietě, druhá z dvojice pak do druhé diety. 1. nulová hypotéza je, že váha krys není ovlivněna použitou dietou, alternativní, že ovlivněni dietou existuje 2. spočítáme diference - tyto diference jsou nenormální a proto je vhodné využít neparametrický test 3. Spočítáme sumu pořadí kladných a záporných diferencí, zde je menší suma záporných diferencí-31 4. výsledkem výpočtu je p>0,05 a tedy nemáme dostatečné důkazy pro zamítnutí nulové hypotézy, nelze říci, že by nová dieta byla efektivnější nez stará 5. pro doplnění výsledků je vhodné zjistit také skutečnou velikost rozdílu hmotností ve skupinách, např. ve formě mediánu Schéma při testování 2 a více skupin Data Parametrické testy Neparametrické testy Normální rozdělení v rámci skupin? I - NE zu Logaritmická transformace ANO Homogenita rozptylů] Normální rozdělení v rámci skupin? I NE Mannův-Whitneyho test, Kruskalův-Wallisův test na původních datech ANO Homogenita rozptylů' NE Mannův-Whitneyho test, Kruskalův-Wallisův test * ANO Dvouvýběrový t-test, AN OVA -E NE ANO Mannův-Whitneyho test, Kruskalův-Wallisův test na původních datech * Dvouvýběrový t-test, ANOVA na transformovaných datech * Při nesplnění předpokladu shody rozptylů mezi skupinami lze použít i parametrický t-test s Welchovou korekcí iba JMI I Institut biostatistiky a analýz, PřF a LF MU Schéma při testování pomocí párových testů Data Normální rozdělení? (normální rozdělení diferencí!) NE ANO Párový Wilcoxonův test / znaménkový test Párový t-test Parametrické testy Neparametrické testy Institut biostatistiky a analýz, PřF a LF MU Binomické rozdělení Popis binomického rozložení Testování hypotéz binomicky rozložených dat iba ifjfr ^ %|f/ Anotace • Kromě spojitých dat se setkáváme také s daty kategoriálními, jejichž nejjednodušším případem jsou data binární. • Binární data jsou popsána binomickým rozdělením, od chování binomického rozdělení je odvozena popisná statistika binárních dat (procento výskytu jevu), její interval spolehlivosti a binomické testy pro srovnání procentuálního výskytů jevů v různých skupinách. Alternativní rozdělení Nastane jedna ze dvou možných varianta n(x) = n pro x = i n(x) = i - n pro x = o n(x) = 0 jinak X = 1 .jev n o x li) 1 'ffV^i ř lili f Institut biostatistiky a analýz, PřF a LF MU Binomické rozdělení X..... celkový počet nastání jevu v n nezávislých pokusech E(x)= n . n D(x)= n . n (1-n) n ~ p d u y jediný parametr distribuce určuje tvar distribuce ^ = 0,5 7T = 02 ] 0 n n iba I Institut biostatistiky a analýz, PřF a LF MU Binomické rozdělení jako model pro zkoumání výskytu sledovaného jevu n.....počet nezávislých opakování (dotazů) X.....počet lidí s jistým symptomem r znamená celkový počet nastání jevu v n nezávislých experimentech p ~ n .. jediný parametr binomického rozložení p .... relativní četnost nastání jevu p..........určuje tvar distribuce r: 0 n tt = 0,5 Binomická proměnná X Y?Yt f^W%' /lllfí Institut biostatistiky a analýz, PřF a LF MU &J WJ k = 0,2 I D n n „ X Binomické rozdělení jako model Jev: narození chlapce 11 = 0,5 n : rodina s 5 dětmi r: 0,1,2,3,4,5 chlapců Vr7 P(r)= pr (l-p) ín-r) n! !(n-r)! pr q(n r) r = 0: (of 5!)(a5)0(a5)5=a°31 r = 1: ^^(°>5M0,5)4 =0,15625 r = 2: P(r) = 0,3125 r = 3: P(r) = 0,3125 r = 4: P(r) = 0,15625 r = 5: P(r) = 0,031 X: Binomická proměnná Střed rozložení: Rozptyl: EM =n'P D(j) = n • p • (1 - p) Příklad: n = 100 respondentů r = 20 má symptom -D- E (x) = n • p = 20 je střed rozložení a nejpravděpodobnější hodnota iba I Institut biostatistiky a analýz, PřF a LF MU Binomické rozdělení jako model 0,2 -0,18 -0,16 -0,14 -0,12 - 0,1 -0,08 -0,06 -0,04 -0,02 -0 - P(x = r) = n n = 10 P = 0,3 n II II II II II n ^ n = 50 P = 0,1 n ! (n — r) ! (n-r) q = l-p n = 30 P = 0,3 n = 100 P = 0,3 ........lil llh..... TTTTTTTTTTTTTTTTTTTrlTTriTTTT^ 5 10 15 20 25 30 0 10 20 30 40 50 60 70 80 90 100 n = 50 P = 0,5 0,2 -, 0,18 -0,16 -0,14 -0,12 - 0,1 -0,08 -0,06 -0,04 -0,02 - n = 50 P = 0,9 t 10 15 20 25 30 35 40 45 50 10 15 20 25 30 35 40 45 50 10 15 20 25 30 35 40 45 50 iba w | Institut biostatistiky a analýz, PřF a LF MU Binomial distribution showing the number of subjects out of ten in blood group B based on the probability of being in in blood group B of 0,08. Aplikace binomického rozdělení Výskyt krevní skupiny B v určité populaci: p = 0,08 .Q .Q o Number in blood group B Probability 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 Binomial distribution of number of people out of two in blood group B Number: blood group B in 2 cases 0,5 0,4 B B 2 0,0064 Iq not B B 1 0,0736 U i— CL 0,1 B not B 1 0,0736 not B not B 0 0,8464 0 0,16 0,14 0,12 -1—1 0,1 15 0,08 -Q O 0,06 i— Cl. 0,04 0,02 0 23456789 10 Number of subjects Binomial distribution showing the number of subjects out of 100 in blood group B based on the probability of being in in blood group B of 0,08. 10 20 30 40 50 60 70 80 90 100 N u m ber of subjects iba I Institut biostatistiky a analýz, PřF a LF MU Aplikace binomického rozdělení • Populace: 60% jedinců má zvýšenou hladinu cholesterolu; výběr: 5 lidí • Kolik lidí má ve výběru vyšší hladinu cholesterolu ? • n. p = 5. 0,6 = 3 lidé ~ E(x) • Jaká je P, že právě 3 lidé budou mít vyšší hladinu cholesterolu ? odpovídá dané populaci ? 5! Pm = —--(0,6)3 • (OAf = 0,346 = 35% (3) 3! (5-3)! v 7 v 7 Jaká je P, že většina jedinců (tedy minimálně 3) má vyšší hladinu cholesterolu ? ~ Tzn. výběr alespoň obecně odpovídá zkoumané populaci ? • P(X > 3) = P(3) + P(4) + P (5) = 0,346 + 0,259 + 0,078 = 68 % Tzn. Výběr přesně P(x) i y X iba Ě I Institut biostatistiky a analýz, PřF a LF MU Odhad parametru n binomického rozdělení • Při vícenásobném odhadu se parametr fl chová jako normálně rozložen U malých nebo velkých hodnot p (11) je však předpoklad normality omezen i IIJII Institut biostatistiky a analýz, PřF a LF MU mf w w Odhad parametru ľl binomického rozložení p=r/ 1 /n 1) Bodový ^ 2 P' sp = . £(l_ P) n-í 2) Intervalový - aproximace Íp(í-p) í n-l iba I Institut biostatistiky a analýz, PřF a LF MU Odhad parametru ľl binomického rozložení: příklad I X: % jedinců s daným znakem n = 100 jedinců r = 60; p = 0,6 sp = 0,049 Interval spolehlivosti : 95 % Z 0,975 = 1,96 0,6 -1,96 • 0,049 < n < 0,6 +1,96 • 0,049 0,504 < n < 0,697 P(0,504 < ;r< 0,697) > 0,95 LíOt ^^^K jS^tt. /BA ŕYSVt t IIJII Institut biostatistiky a analýz, PřF a LF MU W Ä' W Odhad parametru ľl binomického rozložení • Intervalový odhad bez aproximací na normálni rozložení r r + (n-r + \)-F^V2) n spodní limit intervalu vi ~~ ' l{n-r + \)\ v2 = 2r /2 " «-r + (r + l)-FJ/í;vi) v; = 2(r + l) = v2 + 2 U Á v'2 = l(n-r)=vl-2 horní limit intervalu P(LX \-a ■J ŕVfV'í ': f Institut biostatistiky a analýz, PřF a LF MU iba *>mf w w Odhad parametru ľl binomického rozložení: příklad II Náhodný vzorek n = 200 jedinců. Zjištěno pouze r = 4 jedinci bez určitého znaku. p = 14oo = 2£Í 95% interval spolehlivosti = ? ví = 2(n-r + í)= 2(200 -4 +1) = 394 v -2r=2-4 = 8 v1' = 2(r + l)=10 v'2 = 2(n - r) = 2(200 - 4) = 392 F?y] = 3,67 1 /2 - ' 4 +(200-4 + 1)-3,67 0,0055 F (10; 392) 2,08 (4 + 1)-2,08 200-4 +(4 + 1)-2,08 0,051 _____________j iba I Institut biostatistiky a analýz, PřF a LF MU Binomické rozložení v datech: vizualizace n(x) 1 n X Pravděpodobnost výskytu hodnot X n opakování jev ANO jev NE Binární podstata původních hodnot 5* í iba řYSVt i*Wft* t IUII Institut biostatistiky a analýz, PřF a LF MU W Ä' W Interval spolehlivosti pro fl Statistické testování binomických dat Liší se odhad jd od předpokládané hodnoty P ? Liší se dva nebo více odhadů jd ? - závislé odhady - - nezávislé odhady - Je výskyt kategorií dvou jevů nezávislý 1 Hodnocení relativního rizika z výskytu určitého jevu v rámci skupiny lidí Ä ,?(ätx /V?V\ ■-■ ŕlliľí Institut biostatistiky a analýz, PřF a LF MU Jednovýběrový binomický test H, Testová statistika Interval spolehlivosti pn z > Z i-a p>n p z t a/2 Z = p-n-n n-p-n-n -0,5 Korekce na kontinuitu Ho Testová statistika Interval spolehlivostí pn (r -+- p = r/n > Lx // — r~ -\- Cr~ -\- 1) Z7, p>n p Li LÄ y^^HiK AlBKSíř, wy\ Mill! Institut biostatistiky a analýz, PřF a LF MU W WJ Test 7i ? p: Příklad 1 • Stromy s pozměněným tvarem koruny • n = 9 000 jedinců • r = 2 250 změněných jedinců • Jak je pravděpodobná změna u až 1/3 jedinců? z _ n • p - n • 7T _ 225Q - 3QQQ _ ^} p(V - p)n JO,2,5 -0,75 - 9000 a = 5%; Z 1,96; Z ^=1,645 Z > Z i_a/2.........zamítáme H0: p < 0,01 • 95 % Interval spolehlivosti ... p: (0,241; 0,258) LOt, jS^ÍS, YiY! £ IUI | Institut biostatistiky a analýz, PřF a LF MU &>' W W Test 71 ? p: Příklad 2 • Pravděpodobnost narození chlapce je asi 1/2. • Máte zhodnotit výsledky průzkumu populace, která žije v silně poškozeném životním prostředí. • Průzkum se týká 1000 náhodně vybraných rodin a zjištěný podíl narozených chlapců je 0.41. Jaké jsou vaše závěry o této populaci (zda se rodí stejný podíl chlapců jako v běžné populaci?) Jak se váš odhad zpřesní, když použijete vzorek n = 10 000 rodin při zachování odhadu p = 0.41? Test n ? p: Příklad 2 • Použijeme jednovýběrový binomický test s nulovou hypotézou HO: p=K, hladina významnosti a=0,05 • Testová statistika: a příslušný kvantil: • Protože nulovou hypotézu ??? • Interval spolehlivosti: • Pokud použijeme n=10 000, bude int. spolehlivosti ???: jÍSPs r-^í-v mm<É | Institut biostatistiky a analýz, PřF a LF MU iba ' \JO^ Test 71 ? p: Příklad 2 • Použijeme jednovýběrový binomický test s nulovou hypotézou HO: p=rt, hladina významnosti a=0,05 • Testová statistika: z■ -g^ -ľa Příslušný kvantil: V2"" "'96 • Protože \z|>z0,975 nulovou hypotézu zamítáme. Chlapci se ve zkoumavé populaci nerodí s pravděpodobností 0,5. • Interval spolehlivosti: ^ p+z1 _^^pE5=0,4±z0 975 -o,o46=0,41+1,%-0,010=0,41+0,03 • Pokud použijeme n=10 000, bude int. spolehlivosti užší: n: p + Z ■ jp(l~p) = 0,41 +1,96• 0,005 = 0,41 + 0,01 1 A V n — l M_ /VfVt '• i\ií\ I Institut biostatistiky a analýz, PřF a LF MU iba *>mf w w Test 71 ? p: Příklad 3 Příklad testu bez aproximace na normální rozložení 12 jedinců bylo zkoumáno pro výskyt určitého znaku, 10 jedinců znak nemělo *p Jak hodně se tento výsledek liší od výsledku 6 - 6: tedy od situace, kdy polovina • jedinců znak má? a) Využití distribuční funkce r 0 1 2 3 4 5 6 7 8 9 10 11 12 P(r) 0,0002 4 0,0029 3 0,0161 1 0,0537 1 0,1208 5 0,1933 5 0,2255 9 0,1933 6 0,1208 5 0,0537 1 0,0161 1 0,0029 3 0,0002 4 P (r > 10) = 0,01611 + 0,00393 + 0,00024 = 0,01928 H0: p = 0,5 je tedy značně nepravděpodobná b) Pozorované p = 1^/^ = 0,833 překročilo horní limit 95 % intervalu spolehlivosti pro p: p = 0,5 : L2 = (6 + 1)-2,64 LÄ y^^HiK AlBKSíř, 12-6 +(6 + 1)-2,64 = 0,755 iba íYSVt £^ru í Ilji I Institut biostatistiky a analýz, PřF a LF MU W Ä' W Dvouvýběrový binomický test (pi ? p2) z = ✓v P\ PA p(y-p), M1-/7) f z (A-p2)±z(1_ p(l-p) , p(l-p) Ur /BA ŕYSVt i*Wft* i IUI I Institut biostatistiky a analýz, PřF a LF MU W Ä' W Dvouvýběrový binomický test (pi ? p2) • Tento příklad je ukázkou testování rozdílů mezi dvěma binomickými populacemi (tedy srovnání dvou odhadů parametru p). • Celkem 49 pokusných myší bylo použito k testování toxického preparátu během dvouměsíční kultivace. Následující tabulka obsahuje původní data zároveň s testem nulové hypotézy: Podíl přežívajících jedinců je u zasažené populace stejný. Alive Dead Total Proportion alive Proportion dead Treated 15 9 24 p1 = 0,625 qx = 0,375 Not Treated 10 15 25 p2 = 0,400 q2 = 0,600 Total 25 24 49 p = 0,510 q = 0,490 z = 0,625 - 0,400 0,225 J(0,510) (0,490) (0,510) (0,490) A/0,010413 +0,009996 AÍ 24 25 = 1,573 II y Nezamítáme H0: 0,10 < P < 0,20 Z0,05(2) = t0,05(2) = 1,96 S korekcí 15-0,5 10 + 0,5 na kontinuitu: z = —— 25 0,604 - 0,420 = 1,287 0,143 0,143 Nezamítáme H0: 0,10 < P < 0,20 ÍVÍYí /lllíl Institut biostatistiky a analýz, PřF a LF MU %J#' Wj iba Z0,05(2) = t0,05(2) = 1,96 Přednáška 8 Mm f>Ř$\ fMPh 4ui^ Kontingenční tabulky Test dobré shody Fisherův přesný test McNemar test Odds ratio a relativní riziko — "u TET |>-VÍIP Anotace • Analýza kontingenčních tabulek umožňuje analyzovat vazbu mezi dvěma kategoriálními proměnnými. • Základním způsobem testování je tzv. chi-square test, který srovnává pozorované četnosti kombinací kategorií oproti očekávaným četnostem, které vychází z teoretické situace, kdy je vztah mezi proměnnými náhodný. • Test dobré shody je využíván také pro srovnání pozorovaných četností proti očekávaným četnostem daným určitým pravidlem (typickým příkladem je Hardy-Weinbergova rovnováha v genetice) • Specifickým typem výstupů odvozených z kontingenčních tabulek jsou tzv. odds ratia a relativní rizika, využívaná často v medicíně pro identifikaci a popis rizikových skupin pacientů. Co je kontingenční tabulka ? • Frekvenční sumarizace dvou kategoriálních proměnných (binárních, nominálních nebo ordinálních proměnných). • Obecně: R x C kontingenční tabulka (R - počet kategorií jedné proměnné, C- počet kategorií druhé proměnné). • Speciální případ: 2x2 tabulka = čtyřpolní tabulka. • Kontingenční tabulky: absolutních četností, celkových procent, řádkových/sloupcových četností • Př.: Sumarizace vyšetřených osob podle pohlaví a výsledku diagnostického testu. Výsledek vyšetření Pohlaví Nemocný Zdravý Celkem Muž 45 11 56 Žena 25 6 31 Celkem 70 17 87 ■_ ŕVfV'í I Institut biostatistiky a analýz, PřF a LF MU iba *>mf w w Ukázka kontingenční tabulky • Vztah pohlaví a výskytu onemocnění (pozor na hodnocení nesmyslného vztahu) Nemocný Zdravý Celkem Muž Žena a b + k |—^ Marginální absolutní c dl c + d Celkem a + c b + d \N a + b + c + d = N ^^►celkový počet hodnot Simultánní absolutní četnost Nemocný Zdravý Celkem j Muž Žena 45 11 25 6 56 31 A^s^ Celkem 70 17 V—y 87 jsou více nemocní muži nebo ženy? ■_ ŕVfV'í I Institut biostatistiky a analýz, PřF a LF MU iba *>mf w w Test dobré shody - základní teorie Testová statistika: x [pozorovaná - očekávaná"] četnost četnost I -I očekávaná četnost [pozorovaná - očekávaná I 2 [pozorovaná- očekávaná] 2 četnost četnost I I četnost četnost I X = —-— + ^=-- očekávaná četnost očekávaná četnost v v 1. jev 2. jev Z >%(i-a)(s'ľ^ ... zamítáme Hn —^—V—■-- 1 - hladina významnosti stupně volnosti iba Ě I Institut biostatistiky a analýz, PřF a LF MU Test dobré shody: příklad x (d _ Binomické jevy (1/0) [pozorovaná očekávaná |^ [pozorovaná očekávaná]^ četnost ~ četnost J [četnost četnost J očekávaná četnost očekávaná četnost Příklad LíOt ^^^K 4$*****. I. jev 1 ^ 10 000 lidí hází mincí I. jev 2 -> rub: 4 000 případu (R) líc: 6 000 případů (L) Lze výsledek považovat za statisticky významně odlišný (nebo neodlišný) od očekávaného poměru R : L = 1 : 1 (tzn. že je výsledek hodu mincí náhodný)? Z (4000 - 5000)2 (6000 - 5000)' 5000 5000 = 400 Tabulková hodnota: J(095)(v = fc-i = i) = 3,84 (0,95 = 1-«) Rozdíl je vysoce statisticky významný (p < 0,001) iba řYSVt f=*yu ř IUI I Institut biostatistiky a analýz, PřF a LF MU W Ä' W Kontingenční tabulka - hypotézy • NEZÁVISLOST (Pearsonův chí-kvadrát test, Fisherův exaktní test) • Jeden výběr, 2 charakteristiky-obdoba nepárového uspořádání • Např.: existence vztahu mezi barvou očí a známkou z biostatistiky u studentů • SHODA STRUKTURY (Pearsonův chí-kvadrát test, Fisherův exaktní test) • Tzv. test homogenity • Více výběrů, jedna charakteristika - obdoba nepárového uspořádání • Např.: věková struktura pacientů s diabetem v K nemocnicích (tj. K výběrů) • SYMETRIE (McNemarův test) • Jeden výběr, opakovaně jedna charakteristika - obdoba párového uspořádání • Např.: posouzení stavu stromů ve dvou sezónách Základní rozhodování o výběru statistických testů - analýza kontingenčních tabulek Spojitá x spojitá data Spojitá x kategoriální data Jeden výběr Pearsonův korelační koeficient Spearmanův korelační koeficient Tři a více Dva výběry výběrů nepárově) 1 1 Párová data Jednovýběrový t-test Wilcoxonův / znaménkový test Nepárová data Párový t-test Wilcoxonův / znaménkový test Dvouvýběrový t-test Mannův-Whitneyho / mediánový t. Parametrické testy Neparametrické testy A N OVA Kategoriální x kategoriální data Jeden výběr Kruskalův-Wallisův test / mediánový t. 1 Více výběrů Párová data Jednovýběrový binomický test 1 Nepárová data McNemarův test Chí-kvadrát test Fisherův exaktní test 5* í iba řYSVt £^ru ř IUI I Institut biostatistiky a analýz, PřF a LF MU W Ä' W Kontingenční tabulka - obecně Máme dvě nominální veličiny, X (má r variant) a Y (má s variant) Kontingenční tabulka typu r x s hu l[r] n .k Y[s] n 11 n rl n .1 Označení: • njk- simultánní absolutní četnost, • nj.- marginální absolutní četnost Marginální absolutní četnost n ls "rs n n1 IX n Marginální absolutní četnost Simultánní absolutní četnost iba Ě I Institut biostatistiky a analýz, PřF a LF MU Kontingenční tabulky HO :Nezávislost dvou jevů A a B Kontingenční tabulka 2x2 + - Podíl (+) + a b - c d Podíl (+) CL (či -h ( ) (p -+- cl) N=a+b+c+d (a + b) p(b-)= N (c + d) N Očekávané četnosti: f = 1 (A) f = 1 (B) (a + b)(a + c) N (a + b)(b + d) N f = 1 (C) f = (D) (a + c) (d + c) N (b + d)(c + d) N v = l = (r-l)*(c-l) P(A)>P(B) I' =1 i=\ ^2 = SS— (fi - LOt, y^^HiK AlBKSíř, WlA HUlt Institut biostatistiky a analýz, PřF a LF MU Očekávané četnosti v kontingenční tabulce • Očekávané četnosti pro výpočet testu dobré shody v kontingenční tabulce odpovídají tabulce, která nemá žádný vztah mezi řádky a sloupečky (náhodný vztah řádků a sloupců) Za) = r I pozorovaná I četnost očekávaná četnost očekávaná četnost Počítáno pro každou buňku tabulky 9 © A 10 0 A 5 5 B 0 10 B 5 5 Pozorovaná tabulka Očekávaná tabulka Institut biostatistiky a analýz, PřF a LF MU Testování nezávislosti - Pearsonův chí-kvadrát test • Souvisí spolu výskyt dvou nominálních znaků měřených na jediném výběru? • Příklad: Barva očí (modrá, zelená, hnědá) a barva vlasů (hnědá, černá, blond) u vybraných 30 studentů jsou nezávislé. • Nulová hypotéza: Znaky X a Y jsou nezávislé náhodné veličiny. • Alternativní hypotéza: Znaky X a Y jsou závislé náhodné veličiny. • Test: Pearsonův chí-kvadrát 2 H0 platí - * r((r~ l)Cs-l)) *=ZZ (n • Očekávané (teoretické) četnosti ejk: ejk =-LJl • HO zamítáme na hladině významnosti a, pokud K> xl_a({r-\){s-\)) • Předpoklady testu ? Testování nezávislosti - Pearsonův chí-kvadrát test Předpoklady Pearsonova chí-kvadrát testu: • Jednotlivá pozorování shrnutá v kontingenční tabulce jsou nezávislá, tj. každý prvek patří jen dojedná buňky kont. tabulky, nemůže zároveň patřit do dvou. • Podmínky dobré aproximace: Očekávané (teoretické) četnosti jsou aspoň v 80 % případů větší nebo rovné 5 a ve 100 % případů nesmí být pod 2 (pokud není tento předpoklad splněn, je vhodné sloučit kategorie s nízkými četnostmi). • Měření síly závislosti: / K Cramérův koeficient: Význam hodnot: 0-0,1....zanedbatelná závislost 0,1-0,3...slabá závislost 0,3-0,7...střední závislost 0,7-1 silná závislost Kontingenční tabulky: příklad Ano Ne Z Ano 20 82 102 Ne 10 54 64 Z 30 136 166 FA= 102*30/166 = 18,43 FB = 102* 136/166 = 83,57 Fc = 11,57 FD = 52,43 2 = (2Q-18,43)2 + (82 -83,57)2 + (l0-ll,57)2 + (54-52,43)2 = ^ ^ < ^ = ^ Kontingenční tabulka v obrázku Gen: ANO Gen: NE Zemřelí Žijící Zemřelí Žijící iba Ě 1 Institut biostatistiky a analýz, PřF a LF MU Výstup řešení v SW Tab.l: Pozorované četnosti Tab. 2: Očekávané četnosti Summary Frequency Table (07 priklad_z_prednasky_K Marked cells have counts > 10 (Marginal summaries are not marked) Summary Table: Expected Frequencies (07 priklad_z_pre Marked cells have counts > 10 Pearson Chi-square: .421322. df= 1, p=,516278 Gen Stav_pacienta úmrtí Stav_pacienta žijící Row Totals Gen Stav_pacienta .-úmrtí- Stav_pacienta -žijící-. Row Totals ;ritc~en 20 G2 102 přítomen 18,43373 53 5663 102,00001 nepřítomen 10 54 64 necntc-en 11.56627 52.4337 64.0000 i All Grps 30 13E 1EE All Grps 30,0000|4 136,0000 166,0000 Jsou splněny podmínky dobré aproximace? Tab. 3: Paersonův chí-kvadrát Hodnota testové statistiky Počet stupňů volnosti Statistic Pearson Chi-square M-L Chi-square Phi for 2 x2 tables Tetrachoric correlation Contingency coefficient tatistics: Ger^ f.) x Stav_p; Chi-square df _n 42132231 ďFT df=l ,0503794 0949754 ,0503156 p- hodnota IE I Institut biostatistiky a analýz, PřF a LF MU R x C kontingenční tabulka Výběr: N lidí ze sociologického průzkumu (delikventi) Jev A: Původ z rozvrácených rodin Jev B: Stupeň zločinnosti I < II < III < IV P a = 1. II. III. IV. a b c d e f g h číslo2 Stupně volnosti: (R-1) * (C-1) = 1 *3 = 3 číslo 1 • číslo 2 N 2 číslo 1 Tabulky: Očekávané četnos a a + e y2 M /C (1-a) Pb = b + f Pc = c + g P d = d d + h iba | Institut biostatistiky a analýz, PřF a LF MU Rekódování kategoriálních proměnných na binární Původní Dummies Vzhledem k referenci NYHA NYHA 1 NYHA II NYHA III NYHA IV NYHA II ref NYHA III ref NYHA IV ref 1 1 0 0 0 0 0 0 1 1 0 0 0 0 0 0 1 1 0 0 0 0 0 0 II 0 1 0 0 1 II 0 1 0 0 1 III 0 0 0 0 1 III 0 0 0 0 1 IV 0 0 1 1 1 IV 0 0 1 1 1 iba JMI | Institut biostatistiky a analýz, PřF a LF MU Rekódování kategoriálních proměnných na binární • Kategoriální a ordinální data mohou do analýzy vstupovat jako binární proměnné • Kategoriální data (nelze seřadit) -> dummies • Ordinální data (lze seřadit) • Dummies • Definice referenční kategorie (obvykle kategorie s nejnižším rizikem pro hodnocený endpoint • Příklad: The New York Heart Association (NYHA) Functional Classification Původní Dummies Vzhledem k referenci NYHA NYHA 1 NYHAN NYHA III NYHA IV NYHA II ref NYHA III ref NYHA IV ref 1 1 0 0 0 0 0 0 1 1 0 0 0 0 0 0 1 1 0 0 0 0 0 0 II 0 1 0 0 1 II 0 1 0 0 1 III 0 0 0 0 1 III 0 0 0 0 1 IV 0 0 1 1 1 IV 0 0 1 1 1 iba JMI I Institut biostatistiky a analýz, PřF a LF MU Test dobré shody: příklad I Ověřte na datech z pokusu se 100 květinkami určitého druhu, že barva květů se geneticky štěpí v poměru žlutá : červená = 3:1. H0: Pozorovaná frekvence pro jednotlivé barvy květů jsou vzorkem populace mající poměr mezi žlutými a červenými květy 3:1. Součet frekvencí u obou barev květů (f;) se rovná 100 a pozorované frekvence u kategorií barvy budou srovnány s očekávanými frekvencemi (uvedeny v závorkách): Kategorie barvy Červená n ^ poz. 84 16 100 ^ oček. 75 25 X ^ {fpoz. - Ú _ (84 - 75)2 | (16 - 25)2 _ ^ f 75 25 St. volnosti = n = k -1 =1 Zamítáme hypotézu shody srovnávaných četností Při testování H0 jsme použili matematický zápis (0,025 < P < 0,05). Z tabulek %2 rozložení vidíme, že pravděpodobnost překročení hranice 2,706 je 0,1 (10 %), což může být stručně zapsáno jako P(x2> 2,706) = 0,10. Dále lze zjistit pro P (y2 > 3,841) = 0,05. V řešené úloze jsme dospěli k hodnotě testové statistiky y2 = 4,320. Pro tento případ lze tedy psát 0,025 < P {j2 > 4,320) < 0,05; a jednodušeji 0,025 < P < 0,05. Jde v podstatě o přibližné určení hranic chyby 1. druhu. iba JMI I Institut biostatistiky a analýz, PřF a LF MU Test dobré shody: příklad II Tento příklad je rozšířením problému z příkladu 1 na srovnání pozorovaných a očekávaných frekvencí pro více kategorií sledovaného znaku: Celkem bylo zkoumáno 250 semen určitého druhu rostliny a roztříděno do následujících kategorií: žluté/hladké; žluté/vrásčité; zelené/hladké; zelené/vrásčité. Předpokládaný poměr výskytu těchto kategorií v populaci je 9 : 3 : 3 : 1. Následující tabulka obsahuje původní data z pozorování a dále postup při testování H0. žluté/hladké žluté/vrásčité zelené/hladké zelené/vrásčité n ^ poz. 152 39 53 6 250 ^ oček. 140,6250 46,8750 46,8750 15,6250 v = k-1 =3 2 11,37501 7,87501 6,1250 X =-+-+- l+^!=8,972 140,6250 46,8750 46,8750 15,6250 DDI Zamítáme hypotézu shody pozorovaných četností s očekávanými iba JMI I Institut biostatistiky a analýz, PřF a LF MU Test dobré shody: příklad Složitější příklady řešené srovnáváním frekvencí je možné rozdělit na testování dílčích hypotéz: /Předpokládejme, že chceme pro data z předchozí úlohy testovat hypotézu existence štěpného poměru 9 : 3 : 3 pro první tři kategorie semen: žluté/hladké žluté/vrásčité zelené/hladké n 152 39 53 244 ^ oček. 146,400 48,800 48,800 n = k-1 =2 5,600 9,800 146,40 48,80 4,200 2 48,80 2,544 Nezamítáme hypotézu shody pozorovaných četností s očekávanými. Nyní otestujeme hypotézu štěpného poměru kategorií zelené/vrásčité:ostatní typy =1:15 zelené/vrásčité ostatní n 6 244 25 ^ oček 15,625 234,375 n = k-1= 1 9,625 2 9,625 15,625 234,375 = 6,324 Zamítáme hypotézu shody pozorovaných četností s očekávanými. Ä ičžp&x A YsVí fr^y-Ú i IUI I Institut biostatistiky a analýz, PřF a LF MU Testování homogenity (shody struktury) • Motivace: Zajímá nás výskyt nominálního znaku u r nezávislých výběrů z r různých populací. • Příklad: Je zájem o sport stejný u děvčat jako u chlapců? • Nulová hypotéza: pravděpodobnostní rozdělení kategoriální proměnné je stejné v různých populací • Test: Pearsonův chí-kvadrát Dívky Chlapci Zájem Ano a b a+b o sport Ne c d c+d a+c b+d / n Některé marginální četnosti (buďsloupcové nebo řádkové) jsou předem pevně stanoveny ■J /V?V\ ': i IUII Institut biostatistiky a analýz, PřF a LF MU iba *>mf w w Test homogenity binomických rozložení E Jev: Úmrtnost na leukemii Předpoklad: n = 0,6 Absolutní četnost jevu označena r. Sledovalo s autorů z s zemí: - 2> Autor n. r. Pi l 2 s Test homogenity binomických rozložení O Po možném sloučení s výběrů Test shody reálného r fcr) % S-l fen Pí - pY,ri) p \Zri-N-u\ n • n • (i - n) LÄ y^^HiK AlBKSíř, /BA íYSVt i IUI I Institut biostatistiky a analýz, PřF a LF MU W Ä' W Test homogenity binomických četností: příklad Pomocí %2 rozložení lze rovněž posuzovat homogenitu většího množství nezávislých pokusů testujících tutéž hypotézu. Bylo provedeno 6 nezávislých výběrů z populace mladých mužů, kteří v dětství onemocněli těžkým zánětem mozkových blan. H0: V této populaci se vyskytují praváci a leváci v poměru 1:1. Nalezněte v literatuře příslušné vztahy pro testování homogenity všech šesti výběrových populací a na základě výsledků tohoto testu rozhodněte o dalším postupu. Následující tabulka obsahuje původní data a výsledek testování (v závorkách jsou uvedeny očekávané četnosti): Vzorek Praváci Leváci n 3C2 St. volnosti l 3(7) 11(7) 14 4,5714 l 2 4(8) 12 (8) 16 4,000 l 3 15(10) 5(10) 20 5,000 l 4 14 (9) 14(9) 18 5,5556 l 5 13 (8,5) 4 (8,5) 17 4,7647 l 6 17 (11) 5(11) 22 6,5455 l y = 30 2 /L heterogeni ta ' v=s-\=5 P < 0,001 Jednoduchým testováním lze zjistit, že všechny testy pro jednotlivé výběry jsou významné, což znamená, že ani v jednom případě nebyla potvrzena shoda očekávaných a pozorovaných četností. Test homogenity štěpného poměru v zkoumaných populacích rovněž vedl k zamítnutí možnosti sloučit jednotlivé výběry a posuzovat je jako celek (kromě testovaného poměru 1 neexistuje tedy v datech žádný jiný jednotný štěpný poměr mezi oběma vlastnostmi. V případě, že by tento test neprokázal odchylky mezi jednotlivými výběrovými populacemi, bylo by možné jednotlivé odběry sloučit a posuzovat jako homogenní vzorek. %2 test - příklad frakcionace složitější kontingenční ta Cílem rozsáhlejšího průzkumu populace bylo prozkoumat vztah mezi dvěma typy chorob a krevními skupinami u lidí. Konkrétní data jsou uvedena v tabulce: I Krevní skupina Žaludeční vředy Rakovina žaludku Kontrola Celkem 0 983 383 2892 4258 A 679 416 2625 3720 B 134 84 570 788 Celkem 1796 883 6087 8766 Vypočítejte testovou charakteristiku pro tuto kontingenční tabulku a otestujte nulovou hypotézu nezávislosti jevů {j2 = 40,54; 4 st. volnosti) LÄ y^^HiK AlBKSíř, iba íYSVt £^ru í Ilji I Institut biostatistiky a analýz, PřF a LF MU W Ä' W 99 %2 test - příklad frakcionace složitější kontingenční tabulky K podrobnějšímu průzkumu složitějších tabulek výrazně napomáhá přepis původní tabulky do podoby procentického zastoupení kategorií: Krevní skupina Žaludeční vředy Rakovina žaludku Kontrola 0 983 383 2892 A 679 416 2625 B 134 84 570 Celkem 1796 883 6087 Z této tabulky je patrné: 1. 2. Jsou jenom malé rozdíly v distribuci krevních skupin u kontroly a u skupiny nemocných rakovinou žaludku. Pacienti s vředy mají mnohem častěji krevní skupinu 0. Na základě těchto poznatků je možné sestrojit menší kontingenční tabulku, která otestuje hypotézu o shodné distribuci krevních skupin pro nemocné rakovinou a pro zdravé lidi. Sestavte tuto tabulku a otestujte nulovou hypotézu. (%2 = 5,64 (2 st. v.), P je přibližně rovna 0,06) LÄ y^^HiK AlBKSíř, wy\ f&/i\ lUll Institut biostatistiky a analýz, PřF a LF MU &f WJ %2 test - příklad frakcionace složitější kontingenční tabulky III • Z tohoto dílčího testu vyplývá možnost sloučení skupiny nemocných rakovinou a zdravých lidí neboť se vzhledem k distribuci krevních skupin chovají jako homogenní populace. • Dalším logickým krokem v podrobné analýze je testování shody relativních četností výskytu krevních skupin A a B mezi kombinovaným vzorkem (sloučená skupina s rakovinou a kontrola) a mezi vzorkem lidí nemocných žaludečními vředy - tzn. nyní neuvažujeme krevní skupinu 0. Výsledkem tohoto testu je %2 = 0,68 (1 st. vol.); P > 0,7. Vzorky pro krevní skupiny A a B lze tedy sloučit do směsného vzorku A + B. • Nyní otestujeme shodu relativních četností výskytu skupiny 0 oproti A + B, a to mezi kombinovanou populací (kontrola + nemocní rakovinou) a mezi vzorkem nemocných vředařů (c2 = 34,29; 1 st. vol.). • Lze tedy shrnout, že vysoká hodnota původního c2 se 4 st. volnosti byla způsobena zvýšenou četností lidí s krevní skupinou 0 mezi nemocnými žaludečními vředy. %2 test - příklad frakcionace složitější kontingenční tabulky IV Průběh hodnocení lze shrnout do tabulky: Srovnání St. volnosti X2 0, A, B skupina u pacientů s rakovinou (r) x kontrola (k) 2 5,64 A, B skupina u pacientů s vředy x kombinovaný vzorek (r + k) 1 0,68 0, A, B skupina u pacientů s s vředy x kombinovaný vzorek (r + k) 1 34,29 Celkem 4 40,61 Celkový součet testových statistik %2 (40,61) odpovídá přibližně původní hodnotě x2 (40,54). Což platí i o stupních volnosti (4). Tato skutečnost potvrzuje, že jsme detailním rozborem vyčerpali informační obsah původní kontingenční tabulky a kromě popsané závislosti (zvýšený výskyt krevní skupiny 0 u lidí s žaludečními vředy) jsou jednotlivé kategorie zkoumaných jevů zcela nezávislé. ■_ ŕVfV'í I Institut biostatistiky a analýz, PřF a LF MU iba *>mf w w Kontingenční tabulka 2x2: Řešení při nedostatečné velikosti vzorku Yates' corection Fisher's exact test H0: Nezávislost jevů Test analyzuje všechny možné 2x2 tabulky, které dávají stejnou sumu řádků a sloupců jako tabulka zdrojová. Algoritmus každé tabulce přiřazuje pravděpodobnost, že taková situace nastane, je-li H 0 pravdivá. Spectacle wearing among juvenile delinquents and non-delinquents who failed a vision test (Weindling et al., 1986) Juvenile delinquents Non- deliquents Total Yes 1 5 6 Spectacle wearers---- No 8 2 10 Total 9 7 16 iba JMI I Institut biostatistiky a analýz, PřF a LF MU Kontingenční tabulka 2x2: Řešení při nedostatečné velikosti vzorku Všechny možné varianty tabulky s danou sumou řádků a sloupců (I) (II) (III) (IV) 0 9 1 8 2 7 3 6 6 1 5 2 4 3 3 4 (V) (VI) (VII) 4 5 5 4 6 3 2 5 1 6 0 7 Pravděpodobnost náhodného vzniku variant tabulky a b C d P (1) 0 6 9 l 0,00087 (II) 1 5 8 2 0,02360 (III) 2 4 7 3 0,15734 (IV) 3 3 6 4 0,36713 (V) 4 2 5 5 0,33042 (VI) 5 1 4 6 0,11014 (VII) 6 0 3 7 0,01049 Total 0,99999 LÄ y^^HiK AlBKSíř, wy\ fp'%V\ Mill! Institut biostatistiky a analýz, PřF a LF MU W Fisherův exaktní test • Využití ve čtyřpolní tabulce (v současnosti i větší díky vyššímu výkonu počítačů) s nízkými četnostmi, které znemožňují použití Pearsonova chí-kvadrát testu. • Patří mezi neparametrické testy pracující s daty na nominální škále, v nejjednodušší podobě ve dvou třídách: pozitivní/negativní, úspěch/neúspěch apod. • Nulová hypotéza předpokládá rovnoměrné zastoupení sledovaného znaku u dvou nezávislých souborů. • Slovo exaktní (přímý) znamená, že se přímo vypočítává pravděpodobnost odmítnutí, resp. platnosti nulové hypotézy. Fisherův exaktní test • Výpočet „přesné" p-hodnoty, která zde hraje roli testové statistiky: • spočítá se parciální pravděpodobnost čtyřpolní tabulky pl: Sledovaný jev Skupina Experimentální Kontrolní Celkem Ano a b a + b Ne c d c + d Celkem a + c b + d n Pí = (a+b)! * (c+d)! * (a+c)! * (b+d)! N! * a! * b! * c! * d! • Spočítá se pa všech možných tabulek při zachování marginálních četností (řádkové a sloupcové součty) a výsledná p-hodnota je součtem pa menších nebo stejných jako pl, která přísluší pozorované tabulce. iba JMI I Institut biostatistiky a analýz, PřF a LF MU Test hypotézy o symetrii (McNemarův test pro čtyřpolní tabulku) Motivace: Na osobách sledujeme binární proměnnou před pokusem a po něm, cílem je zjistit, zda došlo ke změně v rozdělení této proměnné. Analýza párových dichotomických proměnných Četnost n f tabulka Tabulka teoretických pravděpodobností po + - nj. před + 0 b a+b - c d c+d a+c b+d n po + před + Pu P12 Pl. - P 21 P22 P2. P.l P.2 • Nulová hypotéza: = pn , pokus nemá vliv na výskyt daného znaku Testová statistika: (\b-c\-iy b + c pokud je větší než kritická hodnota x rozdělení o jednom stupni volnosti (vhodné pro počty údajů b+c > 8), pak nulovou hypotézu zamítáme iba JMI I Institut biostatistiky a analýz, PřF a LF MU McNemarův test: příklad I • Zjistěte, zda úspěch našich sportovců na Olympiádě nebo ve Světovém poháru vede ke změně postojů žáků ke sportování. • Nulová hypotéza: Počet žáků, kteří změní svůj postoj pozitivním směrem, je pouze náhodně odlišný od počtu žáků, kteří změní svůj postoj negativním směrem. Postoj po výuce (3-16 -l)2 = 7,58 X = 3 + 16 Stupně volnosti • Závěr: Úspěch našich sportovců má pozitivní vliv na postoj žáků vzhledem k provozování sportu. McNemarův test: příklad II Příklad: Srovnání 2 metod stanovení antigenu v krvi (antigen vždy přítomen) metoda 1 = metoda 2 | Metoda 1 Metoda 2 Frekvence | úspěch úspěch 202 úspěch neúspěch 60 neúspěch úspěch 42 neúspěch neúspěch 10 , (|60 - 42 - l)2 Xl, = ^-—-— = 2,83 102 Tabulky: xlJy=1) = 3>84 ■3 = 102 Hn nezamítnuta iba JMI 'WS* I Institut biostatistiky a analýz, PřF a LF MU Aplikace analýzy 2x2 tabulky pro hodnocení rizika I. Prospektivní studie - odhad relativního rizika Jedinci jsou sledováni prospektivně, zda se vyskytne nějaká vlastnost. VÝBĚR JE DÁN SLOUPCEM OBECNĚ PŘIKLAD Skupina 1 Skupina 2 Retardace plodu Symetrická Asymetrická ANO a b Agpar ANO 2 33 L.I IdIV NE c d skoré >7 NE 14 58 u Riziko: (a + c) (b + d) RR = = o,345 33/91 33/91=0,36 a RR _ (a + c) b {b + d) H0: RR = 1 Riziko u "symetrické skupiny" je asi 35 % rizika u asymetrické skupiny S/: (In rr) = -V a a ci + c _\_ b cl IS: In RR-Z In RR + Z 1-o/2 ■ 1-a/2 SE (In RR) , SE (In RR) YsVí fr^y-Ú i Ilji I Institut biostatistiky a analýz, PřF a LF MU &f mt&> Wj Aplikace analýzy 2x2 tabulky pro hodnocení rizika II. Retrospektivní studie - "ODDS RATIO" Zcela zásadně odlišný přístup od retrospektivní studie VÝBĚR JE DÁN VLASTNOSTÍ - ŘÁDKEM Není tedy možné analyzovat relativní riziko, protože přípravou řádků můžeme měnit velikost kontrol. OBECNĚ PŘIKLAD Skupina 1 Skupina 2 ANO a b ĹlldK NE c d odds a/c b/d Odds ratio : ale b/d a b c d LÄ .^i*«^ AlBKSíř, wy\ Mill! Institut biostatistiky a analýz, PřF a LF MU &f WJ Vady chrupu ANO NE Plavání <6h 32 118 týdně > 6h 17 127 OR = (32 /17 ) / (l 18 /127 ) = 2,026 ln (OR) = 0,706 SE (ln(OR)) =0,326 Relative risk vs. Odds ratio ? Relative risk (relativní riziko) Odds ratio (poměr šancí) • Smysl RR a OR • Výpočet • Srovnatelnost • Interpretace • Výhody a nevýhody • Aplikace v klinickém hodnocení Smysl RR a OR Popis vlivu faktoru (léčba, klinicky parametr) na výskyt události (úmrtí, progrese aj.) Relative risk (relativní riziko) 0 Snadná přirozená interpretace rizik vyjádřených jako procento událostí ALE 0 Matematická omezení pro některé aplikace Odds ratio (poměr šancí) 0 Pouze málo lidí má přirozenou schopnost interpretovat OR ALE 0 OR v řadě aplikací výhodnější matematické vlastnosti iba JMI I Institut biostatistiky a analýz, PřF a LF MU Výpočet 1|l event bez eventu Relative risk Odds ratio (relativní riziko) fY% (poměr šancí) A B t t tttttt * ; ; tttttt dd_ MMMMM _io _0 t * nD_ _ttttt_ _4_.c RR— ^^^^^^^^^^^^^^^^^ — ~~~ — L a UK— — — ó. D tti A * f ttf 3 t t 10 II iiiAA*i 7 ömmmm J { ftttftt iba I Institut biostatistiky a analýz, PřF a LF MU Vztah mezi RR a OR Relative risk (relativní riziko) 10 5 3 2 Odds ratio (poměr šancí) i - n CC if) r> O 0.7 - 0.5 0.3 0.1 1 —r— 5 RR a OR je přímo srovnatelné pouze při nízkém bazálním riziku RR = 0.75 RR = 0.5 RR = 0.3 10 Zhang, J. et al. JAMA 1998;280:1690-1691. 20 30 40 50 Incidence Among the Nonexposed. % 60 70 - Arft * iba ŕYSVt f=*yu í IUI I Institut biostatistiky a analýz, PřF a LF MU W lÄ' W Srovnatelnost RR a OR I: maximum Relative risk (relativní riziko) RR mění své maximum podle bazálního rizika ft lb JO CĹ S(L) C >N O E E -m E 'x ro 10 0% 20% 40% 60% Bazálni riziko s™ ■iC'frí, Odds ratio (poměr šancí) 0 Odds ratio má vždy rozsah od 0 do nekonečna 0 Velikost OR není závislá na velikosti bazálního rizika 0 OR lze použít pro srovnání studií s různým bazálním rizikem !!!! 0 Výhodné pro metaanalýzu iba 0 RR ve studiích s různým bazálním rizikem jsou nesrovnatelná !!!! LÄ y^^HiK AlBKSíř, ij^t\ íčWw í Ilji I Institut biostatistiky a analýz, PřF a LF MU W lÄ' w Srovnatelnost RR a OR I: symetrie Existuje mezi RR a O rozdíl v případě Relative risk výměny definice eventu a non-eventu? RR(I) = RR(II) = (relativní rizi ko) ÍHf 4 öööööflööiö 1 10 iont* 7 10 litttt 6 fiÔĎfiĎÔfifififi 10 ttt 3 OÔĎfiĎÔfifiÔfi 10 = 0.57 = 2 0 © f t f t 11 11 i t 11 t í 11 11 11 vs. I t t1 t f t f i f II 11 11 11 i i OR(I) = OR(II) = Odds ratio (poměr šancí) tf tt Htttt ttttttt Hi tttttt tttt m ttitttt = -2- = 0.29 3 = ^ = 3 5 3 7 /t* í 'fŕ%"íi ř IUI I Institut biostatistiky a analýz, PřF a LF MU RR a OR ve studiích s různou mírou bazálního rizika Výskyt eventu (%) iba Výskyt eventu (%) I Institut biostatistiky a analýz, PřF a LF MU Odds ratio Ve skupině „Case" připadá na jednoho pacienta bez eventu 4x tolik pacientů s eventem než ve skupině „Control" 5 ^ 3 O cN o% o^- ■ŕ"- o-* cN ■Hi-Nj^coLnocTiiHomo H rM ro lTj Bazálni (control) výskyt eventu (%) Relative risk Pacient ve skupině „Case" má x-krát zvýšenou pravděpodobnost výskytu eventu než pacient ve skupině „Control". X-krát závisí na basálním výskytu eventu. RR a OR v prospektivních a retrospektivních studiích Prospektivní studie Retrospektivní studie 0 Sledování výskytu eventu a následná analýza jeho příčin 0 Převážně kohortní studie 0 Zpetne sledovaní pricin eventu 0 Převážně case-control studie 0 Výběrem pacientů ovlivňujeme bazální výskyt eventu 0 Bazálni výskyt eventu je dán vlastnostmi kohorty pacientů 0 Bezproblémové využití RR 0 RR nelze použít -ovliněno bazálním výskytem eventu 0 Využití OR - není ovliněno designem studie Relative risk (relativní riziko) Odds ratio (poměr šancí) iba JMI I Institut biostatistiky a analýz, PřF a LF MU Relative risk vs. Odds ratio: shrnutí Relative risk (relativní riziko) 0 Intuitivně snadno interpretovatelné 0 Pro prospektivní studie 0 Maximum se lisí podle bazálni hodnoty výskytu eventu Odds ratio (poměr šancí) 0 Retrospektivní studie 0 Aplikace v metaanalýze 0 Standardní výstup logistické regrese 0 Rozsah vždy 0 až nekonečno, není ovlivněno bazálním výskytem eventu 0 Obtížnější interpretace iba JMI I Institut biostatistiky a analýz, PřF a LF MU Přednáška 9 Mm f>Ř$\ fMPh 4ui^ Poissonovo rozdělení Popis rozložení a jeho využití OK? ^iw M55^ Anotace • Poissonovo rozdělení se používá pro popis četnosti výskytu jevu na experimentální jednotku, příkladem může být počet mutací bakterií na Petriho misku nebo počet srdečních poruch na jednotku času r^^cřs ^"TíT^ \iá\ 1 Institut biostatistiky a analýz, PřF a LF MU iba '-m ->j w Poissonovo rozdělení Celkový počet jevů v n nezávislých pokusech E(x) = n p i |_ . > D(x)= n p } £W = °W n, , e-"-fir P(r) = -A r! r! jU=Á= průměrný počet jevů z n pokusů ?(X = 6)=e M p(X=4)= M (4)(3)(2) iba JMI I Institut biostatistiky a analýz, PřF a LF MU Poissonovo rozdělení jako model iba 3f I Institut biostatistiky a analýz, PřF a LF MU Poissonovo rozdělení v přírodě existuje Mutace bakterií na inkubačních miskách O Výskyt jevu v prostoru (počet žížal na určitou plochu pole) Orientační stanovení jevu (při produkci plynu bakteriemi) + y u u + The most probable number technique Výskyt jevu v čase (srdeční arytmie v určitých časových intervalech) 1 ill 1 -I-1-1-1- cas Institut biostatistiky a analýz, PřF a LF MU Poissonovo rozdělení jako model pro náhodný výskyt jevů Předpoklad: náhodná distribuce jevu mezi studovanými objekty (příp. v čase, v prostoru). JLl CJ1 = JU Poisson Pokud je X spíše větší (~ 5-10), pak Poisson odpovídá spíše binomickému až normálnímu rozložení. ■J /V?V\ ': i IUII Institut biostatistiky a analýz, PřF a LF MU IBA W W Formální prezentace Poissonova rozložení Př: pokus......10 000 bakterií na misce n = 10 misek Jev: mutace (r=25) X..........průměrný počet mutantů na jednu misku r = 25 jč»vl = 25/10 = 2,5 95 % IS: x — Z l—CC, X n mf w w Poissonova náhodná proměnná Konstantní zářič: n = 2608 časových intervalů (každý 7,5 s) i: počet částic v intervalu (x) s,: pozorovaná četnost intervalů s i částicemi P(x = i) = X -é ~ P i Poissonova proměnná: * Výborný model pro experimenty, v nichž je během časového průběhu zjišťován počet výskytu určitého jevu Počet intervalů teoretické četnosti \si-nPi) i s právě i zaznamenanými částicemi s, nPj 0 57 54,399 0,1244 1 203 210,523 0,2688 2 383 407T3fi1 1,4568 3 525 5?5,496 0,0005 4 532 508.418 1,0938 5 408 393.515 0,5332 6 273 253.817 1,4498 7 139 140.325 0,0125 8 45 67.882 7,7132 9 27 29,189 0,1642 10 10 11 4 17,075 12 2 (-P{š>10}) 0,0677 13 0 n = 2608 2608,00 12,8849 iba JMI | Institut biostatistiky a analýz, PřF a LF MU Poissonovo rozdělení: jednovýběrový test Př: Počet hnízd křepelek na dané ploše n = 8000 "pod lokalit" -| A r = 28 } ^ = 0,0035 Nechť je srovnávací soubor (předchozí průzkum) Po =0,0020 p0 • 8 000 = 16 = ju = A \H0: p 28) = ?) ^<0,05 => Ho [0,00411] ) i r = 28 je příliš velké pro populaci s p0 aby r = 28 bylo p > /?0, pravděpodobnější Analýza rozptylu Parametrická analýza rozptylu Post hoc testy Kruskal-Wallis test Anotace • Analýza rozptyluje základním nástrojem pro analýzu rozdílů mezi průměry v několika skupinách objektů. • Základní myšlenka, na níž je ANOVA založena, je rozdělení celkové variability v datech (neznámé, dané pouze náhodným rozložením) na část systematickou (spjatou s kategoriemi pacientů, vysvětlená variabilita) a část náhodnou. Pokud systematická, tedy nenáhodná a vysvětlitelná část variability převažujeme, považujeme daný kategoriální faktor za významný pro vysvětlení variability dat. • Analýza rozptylu vyhodnocuje pouze celkový vliv faktoru na variabilitu, v případě analýzy jednotlivých kategorií je třeba využít tzv. post-hoc testy Základní rozhodování o výběru statistických testů Parametrické testy Neparametrické testy Spojitá x spojitá data Spojitá x kategoriálnídata Kategoriálníx kategoriální data Pearsonův korelační koeficient Spearmanův korelační koeficient Jeden výběr Jednovýběrový t-test Jednovýběrový Wilcoxonův test Dva výběry Párová data Nepárová data Párový t-test Wilcoxonův / znaménkový test Dvouvýběrov) t-test Mannův-Whitneyho test Tři a více výběrů nepárově) ANOVA Kruskalův-Wallisův test Jeden výběr 1 Více výběrů Párová data Jednovýběrový binomický test 1 Nepárová data McNemarův test Chí-kvadrát test Fisherův exaktní test iba JMI I Institut biostatistiky a analýz, PřF a LF MU Cíl stochastického modelování • Obecným cílem je snaha vysvětlit variabilitu predikované proměnné (endpoint, Y) pomocí prediktorů (vysvětlující proměnná, faktor, X) • Jak predikovaná proměnná, tak prediktor mohou být různého typu • Binární • Kategoriální • Ordinální • Spojitá • Cenzorovaná (-> analýza přežití) • Kombinace datového typu predikované proměnné a prediktorů určuje použitou metodu analýzy Y?Vt ^S^sl /lllfí Institut biostatistiky a analýz, PřF a LF MU &J WJ 8 .5 Vysvětluje kategoriální prediktor? 8 .5 7.5 ■ 7 ■ 6.5 ■ 6 ■ 5.5 ■ 5 ■ 4.5 ■ 0 0 .4 0 .8 1 .2 1 .6 2 2 .4 0 .2 0 .6 1 1 .4 1 .8 2 .2 2 .6 Analýza rozptylu - ANOVA Základní technika sloužící k posouzení rozdílů mezi více úrovněmi pokusného zásahu JE o i— +-> c o ro Q. X X CD cu CD cd <_> <_> U u ro ro ro ro i— i_ i_ i— +-> +-> +-> +-> c C C c cu CD q; q; <_> U <_> u c c c c o o o o Rostoucí koncentrace testované látky / látek Celkově významné změny v reakci biologického systému Vzájemné rozdíly účinku jednotlivých dávek || \ Rozdíly účinku dávek od kontroly LÄ y^^HiK AlBKSíř, /BA ŕYSVt t IIJII Institut biostatistiky a analýz, PřF a LF MU W Ä' W Analýza rozptylu - ANOVA Významné kroky analýzy, vedoucí k efektivnímu srovnání variant _ro O i— +-> c o (N ro Q. X X X cd CD CD CD u <_> <_> <_> ro ro ro ro i— i— i_ i_ +-> +-> +-> +-> c c c c CD CD CD CD <_> U U <_> c c c c o o o o Rostoucí koncentrace testované látky / látek Splnění předpokladů analýzy Transformace dat Relevantnost kontroly (vliv vlastní aplikace látek) Vhodnost modelu ANOVA pro účely testu Vlastní srovnání variant Minimalizace chyb při ověřování hypotéz 5* í /BA řYSVt i IIJII Institut biostatistiky a analýz, PřF a LF MU W Ä' W Analýza rozptylu - ANOVA SPLNĚNÍ PŘEDPOKLADŮ ANOVA JE NEZBYTNOU PODMÍNKOU POUŽITÍ TÉTO TECHNIKY 1 Předpoklad nezávislosti opakování experimentu ANOVA = parametrická analýza dat Homogenita rozptylu \ v rámci pokusných variant Normalita rozložení 3. v rámci pokusných variant ALTERNATIVOU JSOU NEPARAMETRICKÉ METODY iba ŕYSVt i=^T»V i IIH I Institut biostatistiky a analýz, PřF a LF MU W Ä' W ANOVA- předpoklady • Symetrické rozložení hodnot a normalita odchylek od hodnoceného modelu ANOVA. Velkou část dat lze adekvátně normalizovat použitím logaritmické transformace. Předpoklad lognormální transformace může pochopitelně být teoreticky vyloučen u mnoha datových souborů obsahujících diskrétní parametry, kde je indikována vhodnost jiného typu transformace. U asymetricky rozložených a u diskrétních dat je nutné využít neparametrické alternativy analýzy rozptylu. • Homogenita rozptylu je nutným předpokladem pro smysluplnost vzájemných srovnání pokusných variant. U testů toxicity by splnění tohoto předpokladu mělo být ověřováno (Bartlettův test), neboť vážné rozdíly (až řádové) v jednotkách testovaného parametru mohou nastat v důsledku inhibice dávkami látky. Nehomogenita rozptylu je často ve vztahu k nenormalitě (asymetrii) dat a lze ji odstranit vhodnou normalizující transformací. • Statistická nezávislost reziduí vyhodnocovaného modelu ANOVA. Pokud odhad a posouzení korelačních vztahů mezi pokusnými variantami není přímo předmětem výzkumu, lze jejich vliv na vyhodnocení odstranit znahodněním dat v rámci pokusných variant - tedy změnou poradí v náhodné. Rozsah vlivu těchto autokorelačních vztahů musí být ovsem primárně omezen správností experimentálního uspořádání. • Ad it i vita jako předpoklad týkající se složitějších experimentálních uspořádání. Exaktní otestování ad it i vity více pokusných faktorů je procedura poměrně náročná na experimentální design vyvážený co do počtu opakování. Je rovněž obtížné testovat interakci na nestandardních datech, neboť případná transformace může změnit charakter odchylek původních dat od hodnoceného modelu ANOVA. Omezení aplikace ANOVA lze řešit • Chybějící data. Vážným problémem jsou chybějící údaje o celé skupině kombinací testovaných látek, například u faktoriálních pokusů, kdy je znemožněno hodnocení experimentu jako celku. • Různé počty opakování. Jde o typickýjev pro experimentální datové soubory. Při různých počtech opakování v experimentálních variantách jsou testy ANOVA citlivější na nenormalitu dat. Pokud jsou počty opakování zcela odlišnéfaž na řádové rozdíly), je nutno použít neparametrické techniky nebo analýzu rozptylu nevyvážených pokusů. • Odlehlé hodnoty. Ojedinělé odlehlé hodnoty musí být před parametrickou analýzou rozptylu vyloučeny. • Nedostatek nezávislosti mezi rezidui modelu. Jde o závažný nedostatek, zkreslující výsledek F-testu. Velmi často je tato skutečnost důsledkem špatného provedení nebo naplánování experimentu. • Nehomogenita rozptylu. Velmi častý nedostatek experimentálních dat, často související s nenormalitou rozložení nebo s odľehlými hodnotami. • Nenormalita dat. I v tomto případě Iz situaci upravit vyloučením odlehlých hodnot nebo normalizující transformací. • Neaditivita kombinovaného vlivu více pokusných zásahů. Tuto situaci lze testovat jednak speciálními testy aditivity nebo přímo F testem kontrolujícím významnost vlivu interakce pokusných zásahů. Při významné interakci je nutné prozkoumat především její charakter ve vhodném experimentálním uspořádání. Modely analýzy rozptylu Model I. Pevný model Model II. Náhodný model X0 X1 X2 X3 X4 A B C D E y,i =ft + At+et -mrnm o. iba +■ + + I Institut biostatistiky a analýz, PřF a LF MU 4- XO XI X2 X3 X4 A B C D E Princip ANOVA Základním principem ANOVY je porovnání rozptylu připadajícího na: • Rozdělení dat do skupin (tzv. effect, variance between groups) • Variabilitu objektů uvnitř skupin (tzv. error, variance within groups), předpokládá se, že jde o náhodnou variabilitu (=error) o SS between 1. Variabilita mezi skupinami Rozptyl je počítán pro celkový průměr (tzv. grand mean) a průměry v jednotlivých skupinách dat Stupně volnosti jsou odvozeny od počtu skupin (= počet skupin -1) 2. Variabilita uvnitř skupin Rozptyl je počítán pro průměry jednotlivých skupin a objekty uvnitř příslušných, celková variabilita je pak sečtena pro všechny skupiny Stupně volnosti jsou odvozeny od počtu hodnot (= počet hodnot - počet skupin) 5* í iba řYSVt £^ru ř Ilji I Institut biostatistiky a analýz, PřF a LF MU W Ä' W - Ľ i SS within v. - n-k F = between_ groups within _ groups Výsledný poměr (F) porovnáme s tabulkami F rozložení pro v1 a v2 stupňů volnosti SS=sum of squares Design modelu • Design modelu znamená jaké proměnné a v jakých kombinacích budou vysvětlovat hodnocenou proměnnou • Obecně je vhodné ať již expertně nebo jako výsledek předběžné analýzy vytvořit a ověřit hypotézy o vzájemných vztazích proměnných a podle těchto předběžných výsledků vytvářet finální model • Tvorba designu modelu úzce souvisí s pojmy: • Analýza pouze hlavních efektů proměnných • Analýza interakcí mezi proměnnými a složitost interakcí • Design modelu lze vyjádřit graficky nebo v rovnici nebo pomocí maticového zápisu faktor 1 y = hmotnost * 1.5 + věk * 3.6 + hmotnost * věk * 1.8 + 9 CM k_ O .re A B C 1 2 U interakce " Vi " "l II' = 1 X2 + f-2 .1 x" . iba JMI 'WS* I Institut biostatistiky a analýz, PřF a LF MU Jednoduchý ANOVA design • Nejjednodušším případem ANOVA designu je rozdělení na skupiny podle jednoho parametru dělící parametr B C /BA řYSVt f=*yu ř Ilji I Institut biostatistiky a analýz, PřF a LF MU W Ä' W Nested ANOVA • Rozdělení skupin na náhodné podskupiny (např. opakování experimentu) • Cílem je zjistit, zda data v jedné skupině nejsou pouhou náhodou • Nejprve je testována shoda podskupin v hlavních skupinách, • pokud jsou shodné, je vše v pořádku • pokud nejsou, stále lze zjišťovat, zda se variabilita uvnitř hlavních skupin liší od celkové variability jednoduchá ANOVA nested ANOVA B B iba řYSVt f=*yu ř Ilji I Institut biostatistiky a analýz, PřF a LF MU W Ä' W Two way ANOVA • Pro rozdělení do kategorií je zde více parametrů • Na rozdíl od nested ANOVY nejde o náhodná opakování experimentu, ale o řízené zásahy (např.vliv pH a koncentrace 02) • Kromě vlivu hlavních faktorů se uplatňuje i jejich interakce iba JMI | Institut biostatistiky a analýz, PřF a LF MU ANOVA-základní výstup • Základním výstupem analýzy rozptylu je Tabulka ANOVA - frakcionace komponent rozptylu LÄ y^^HiK AlBKSíř, #\ ,'f *%ÄV, * Zdroj rozptylu St. v. SS MS F Pok. zásah a-1 SSB SSB/(a-1) MSB/MSE (mezi skupinami) Uvnitř skupin N-a SSE SSE/(N - a) Celkem N -1 SST v—\ Kvantifikovaný podíl rozdílu mezi pokusnými zásahy na SSB/SST 1—y celkovém rozptylu MSB/MST > \ Statistická významnost rozdílu iba řYSVt i*Wft* t IUII Institut biostatistiky a analýz, PřF a LF MU w W w Hlavní efekty a interakce 18 i- 3£ Faktor 2 3E Faktor 2 8 I-1-1- A B SS Di. MS F P Intercept 33487 1 33487 8165.3 0.000 Faktor 1 1978 1 1978 482.2 0.000 Faktor 2 1 1 1 0.3 0.602 F1*F2 1 1 1 0.3 0.570 Error 804 196 4 18 r-17 ■ 16 ■ 15 ■ 8 I-1-■- A B SS D.f. MS F P Intercept 28511 1 28511 6952.0 0.000 Faktor 1 4 1 4 1.0 0.314 Faktor 2 1 1 1 0.3 0.602 F1*F2 867 1 867 211.3 0.000 Error 804 196 4 ■J ŕVfV't ': v í IUI I Institut biostatistiky a analýz, PřF a LF MU iba *>mf w w 18 I- 17 - 15 -14 ■ 13 -12 ■ 11 - A B SS D.f. MS F P Intercept 33487 1 33487 8165.3 0.000 Faktor 1 4 1 4 1.0 0.314 Faktor 2 1891 1 1891 461.1 0.000 F1*F2 1 1 1 0.3 0.570 Error 804 196 4 20 r 8 I-1-■- A B _SS D.f. MS F p Intercept 38863 1 38863 9476.2 0.000 Faktorl 920 1 920 224.3 0.000 Faktor2 1 1 1 0.3 0.602 F1*F2 867 1 867 211.3 0.000 Error 804 196 4 A B SS D.f. MS F P Intercept 57391 1 57391 13993 0.000 Faktor 1 5293 1 5293 1290.7 0.000 Faktor 2 861 1 861 209.9 0.000 F1*F2 1 1 1 0.3 0.570 Error 804 196 4 24 I- 8 I-1-L- A B _SS D.f. MS F p Intercept 45203 1 45203 13596 0.000 Faktorl 4799 1 4799 1443.4 0.000 Faktor2 316 1 316 95.0 0.000 F1*F2 175 1 175 52.5 0.000 Error 652 196 3 Analýza rozptylu - obecný F test _CO o -I—' c o C\J CO x X X 0 0 0 o O O CO CO CO i_ i_ c C C 0 0 0 O O O c C C o o o HQ platí Látka nepůsobí Q. X 0 O CO i_ -I—' c 0 O C o H o- obecný F test m1 = m2 = m3 = ... = m. H0 neplatí Látka působí Další analýzy iba JMÍ I Institut biostatistiky a analýz, PřF a LF MU Testování dílčích hypotéz • V řadě analýz je třeba pracovat se vzájemným testováním více skupin objektů stylem každý s každým • Obecný postup analýzy je • Testování celkové významnosti - všechny skupiny navzájem (ENG: among groups) • Pokud je zjištěna celková významnost pokračuje testování analýzou již konkrétních kombinací dvojic skupin (ENG: between) • Problémem je vliv mnohonásobného testování na statistickou významnost testů: • Každý jeden test má a=0.05 (chyba I. druhu) • Při mnohonásobném testování stoupá pravděpodobnost, že alespoň u jednoho testu dojde k chybnému zamítnutí nulové hypotézy (tedy k chybě I. druhu) i 3 Řešením jsou různé procedury korigující hodnotu p (např. Bonferroniho korekce, FWR, FDR procedury apod.) Q_ 0 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 Počet testů Analýza rozptylu - testy kontrastů _C0 o -I—' c o iba ANOVA:H0 zamítnuta Testy kontrastů C\J CO Q. x X X X 0 0 0 0 o O O O CC CO CO CO i_ i_ i_ c C C C 0 0 0 0 O O O O c C C C o o o o • Rozdíly v smysluplných kombinacích ? I Institut biostatistiky a analýz, PřF a LF MU ( ] Neplánované Pro srovnání variant s kontrolou r Testování kontrastů "Multiple range testy" Neparametrické Řada různých post-hoc testů One Way ANOVA for PRODUCTS Taík Poles T es. 5 Means Breakdowr = ::s T-es Means > Comparison The main effect is: Product Name .-Methods to use — □ Preview code 2i I I Bonferrani ttest I I TLkey 3 stL^ertizec r = r;= lest (HSC i I I Duncan's multiple-rangetest □ Dunnett's ttest I I Hshers I; thrift:-rt-citfersrcs test LJ Gabriel's multiple-comparison procedure □ Student-Newman-KeulE multiple rangetest I I Waller-Duncan k-ratiottest I I Scheffes multiplecompanson procedure I I Rtan-Eirot-Gsbriel-'.'/els;!" rrdti pie-range test §sas í ANOVA Results 1: srovnáni hmotnosti ovci Profiler | Custom tests | Residuals 1 | Residuals 2 | Matrix | Report Surnmarv | Means Effect: |Skupina ^ Planned comps Post-hoc ! Assumptions Dependent variables: J Hrr Display f* Significant differences C Homogeneous groups: C Confidence intervals C Critical ranges: Error term f* Between error C Within error C Between; within; pooled r MS:|0.00t " J ^ Modify j Options 1 J. Jj M TukeyHSD | fflfl Unequal NHSD | Range tests (multi-stage tests) StatSoft9 One-Way ANOVA: Post Hoc Multiple Com pari son 5 |)uncan's | Crit. ranges | ■ Equal Variances Assumed- r LSD; r~ Bonferroni r Sidak \~ Scheffe T R-E-G-WF r S-N-K r~ lukey r~ Tukey's-b I Duncan I Hochberg's GT2 \~ Waller-Duncan Type I/Type II Error Ratio: I- Dunnett Control Category: ■Test- 100 Last 31 r R-E-G-WQ r Gabriel 2-sided C < Control C > Control - Equal Variances Not Assumed I- Tamhane's T2 | Dunnett'sT3 \~ Games-Howell \~ Dunnett's C Significance level: 1.05 Continue Cancel Help CG cell«: iba I Institut biostatistiky a analýz, PřF a LF MU Příklad: Anova - One way Dávka rostlinného stimulátoru (0, 4, 8,12 mg/l) A = 4;n = 8 I. ANOVA Bartletťs test: P = 0,9847 K-S test: P = 0,482 - 0,6525 pro jednotlivé kategorie Source D.f. SS MS F P Between 3 305.8 101.9 8.56 <0.001 Within 28 322.2 11.9 Total 31 638 II. Multiple Range Test (NKS -test) Level Average Homogeneous groups 0 34.8 X 4 41.4 X 12 41.8 X 8 52.6 X ■_ rYfVí í IUI I Institut biostatistiky a analýz, PřF a LF MU iba *>mf w w