Přednáška VIII. Testování hypotéz o kvantitativních proměnných 3 Úvodní poznámky ^ Testy o parametrech 1 rozdělení ^ Testy o parametrech 2 rozdělení ^ Permutační testy INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ Opakování - hypotézy Co jsou to hypotézy a jak je stanovujeme' Nulová hypotéza Alternativní hypotéza mu jť"m\ Tomáš Pavlík JU— | IUI | Biostatistika Iba 'vij?,/ Opakování - co se při rozhodování může stát Popište možné výsledky testování hypotéz a uveďte, jak označujeme jejich pravděpodobnosti. Rozhodnutí Skutečnost H0 platí H0 neplatí H0 nezamítneme A B H0 zamítneme C D Tomáš Pavlík Biostatistika Opakování - z-test pro jeden výběr u; Při populačním epidemiologickém průzkumu se zjistilo, že průměrný objem prostaty u mužů je 32,73 m\((SD~=~18,l^Tmj}) Na hladině významnosti testu a = 0,05 chceme ověřit, jestli se muži nad 70 let liší od celé populace. Máme náhodný výběr o velikosti n = 100 a výběrový průměr 36,60 ml. Chceme ověřit platnost H0: jU = 32,73 proti Hl: ju^ 32,73 ■* Platí-li H0, pak X ~ N(p = 32,73^^8^)) (předpokládáme, že známe o) * Z CLV víme, že by mělo platit: X^ ~ #(0,1) Pokud tedy výběrový průměr patří do rozdělení 7V(// = 32,73,^ = 1,812) neměla by jeho hodnota být vzhledem k tomuto rozdělení nijak extrémní. Tomáš Pavlík Biostatistika 1. Úvodní poznámky Spojité x diskrétní náhodné veličiny ■* Budeme se zabývat hodnocením spojitých náhodných veličin (mohou nabývat jakýchkoliv hodnot v určitém rozmezí). Příklady: výška, váha, vzdálenost, čas, teplota. Uvedené testy lze ale použít i pro hodnocení diskrétních náhodných veličin -ale musí to být odůvodnitelné (např. velký počet možných hodnot). * Příklady: počet krevních buněk, počet hospitalizací, počet krvácivých epizod za rok. Tomáš Pavlík Biostatistika Parametrické a neparametrické testy Parametrické testy - zabývají se testováním tvrzení o neznámých parametrech rozdělení pravděpodobnosti, kterým se řídí uvažovaná náhodná veličina . Vyžadují různé předpoklady, minimálně specifikaci rozdělení. Neparametrické testy-tyto procedury jsou nezávislé (nebo téměř nezávislé) na konkrétním rozdělení pravděpodobnosti náhodné veličiny. Vyžadují méně předpokladů - např. symetrii rozdělení. Na druhou stranu mají menší sílu („no free lunch"). Testování v případě chybně určeného rozdělení pravděpodobnosti testové statistiky může vést k mylným závěrům z důvodu nerelevantní p-hodnoty, respektive p-hodnoty stanovené chybnou úvahou. Tomáš Pavlík Biostatistika Postup při statistickém testování 1. Formulujeme nulovou hypotézu H0. 2. Formulujeme alternativní hypotézu Hr Alternativní hypotéza u parametrických testů může být oboustranná nebo jednostranná. 3. Zvolíme testovou statistiku jako kritérium pro rozhodnutí o nulové hypotéze (statistiku volíme tak, abychom byli schopni odvodit rozdělení pravděpodobnosti této statistiky při platnosti nulové hypotézy). 4. Hodnotu testové statistiky vypočítáme na základě pozorovaných hodnot: 5. Na základě rozdělení testové statistiky určíme kritický obor (obor hodnot, kdy zamítáme H0). 6. Zjistíme, zda hodnota testové statistiky leží v oboru kritických hodnot: pokud ano, zamítáme nulovou hypotézu, pokud ne, nezamítáme nulovou hypotézu. Alternativně můžeme zjistit p-hodnotu výsledku. Tomáš Pavlík Biostatistika 2. Testy o parametrech 1 rozdělení O co jde? ■* Chceme srovnat sledovanou charakteristiku náhodné veličiny s předem danou hodnotou (konstantou, předpokladem). * Test o průměru při známém rozptylu-z-test •*Test o průměru při neznámém rozptylu - f-test Neparametrický test pro 1 výběr - Wilcoxonův test •^Test o rozdílu párových (závislých) pozorování - párový f-test * Test o rozptylu normálního rozdělení ; Spolu s výsledkem testu by měly být reportovány i intervaly spolehlivosti pro sledovanou charakteristiku (průměr/rozptyl). Tomáš Pavlík Biostatistika Test o průměru při známém rozptylu -z-test Předpokládáme realizaci náhodného výběru o rozsahu n: xv x2,..., xn. ; Předpokládáme normalitu dat:Xj ~ N{ju,g2) - velmi silný předpoklad (silnější než CLV, neřeší totiž n jdoucí do nekonečna). H q '. ju = jlíq Hy \ ju ^ jlíq Hy '. ju > juq Hy \ ju < ju0 " Testujeme, zda data náhodného výběru pochází z rozdělení se stejnou střední hodnotou jako je předpokládaná hodnota )U0 (konstanta). Předpokládáme, že známe parametr o. ■i Víme, že za platnosti H0 platí: X ~ N(/uQ,aYn) + Testová statistika: Z = X^ ~ N'(0,1) Tomáš Pavlík Biostatistika Test o průměru při známém rozptylu -z-test * Nulovou hypotézu zamítáme na hladině významnosti a, když výsledná hodnota Z statistiky je větší (nebo menší) než kritická hodnota (příslušný kvantil) rozdělení N[0,1). „Větší nebo menší" závisí na předem zvolené alternativě. ^Alternativa Hl: ju^ jU0 Zamítáme HQ když | Z | > zx_al2 i- Alternativa Hl:ju>ju0 ■ Zamítáme H0 když Z > zh a * Alternativa Hl\ju< jU0 Zamítáme H0 když Z < z '0,005 L0,025 = -1,96 '0,050 Tomáš Pavlík /BA ^ 1 Test o průměru při neznámém rozptylu - ř-test Předpokládáme realizaci náhodného výběru o rozsahu n: xv x2,..., xn. ; Předpokládáme normalitu dat: Xí ~ N(jU, a) - velmi silný předpoklad (silnější než CLV, neřeší totiž n jdoucí do nekonečna). H q '. ju = jlíq Hy \ ju ^ jlíq Hy '. ju > juq Hy \ ju < ju0 " Testujeme, zda data náhodného výběru pochází z rozdělení se stejnou střední hodnotou jako je předpokládaná hodnota )U0 (konstanta). * Neznáme hodnotu parametru o - musíme ho odhadnout pomocí výběrové směrodatné odchylky (s). - Víme, že za platnosti H0 platí: X ~ N(ju^2/n) Z = ~ N(0,1) * Dále využijeme statistiku K: K = ("'/^s2 ~ j2(«-l) i-; Testová statistika: 7 y - u T = . =^-p- ~t(n-l) K/(n-\) s/4ň Tomáš Pavlík iaX i IM) i Biostatistika * BA ^ Test o průměru při neznámém rozptylu - ŕ-test ^ Nulovou hypotézu zamítáme na hladině významnosti a, když výsledná hodnota 7 statistiky je větší (nebo menší) než kritická hodnota (příslušný kvantil) rozdělení t(n -1). „Větší nebo menší" závisí na předem zvolené alternativě. '; Alternativa Hx\ ju^ ju0 ' ■ Zamítáme HQ když \T >t\ -a/2 ' Alternativa Hl: ju> ju0 ■* Za m ítá m e H0 když T > t^~l) •^Alternativa Hx\ju 2,228 = t{ .10 0,975 = / l-a/2 ^ Zamítáme H, o Tomáš Pavlík IMI Biostatistika Příklad - interpretace výsledku t1 - 2,821 > 2,228 -ŕj° -1"_*/2 Zamítáme Hr i; Na hladině významnosti a = 0,05 můžeme říci, že sledovaná skupina žen měla statisticky významně nižší energetický příjem než je doporučená denní hodnota 7725 kJ. Tomáš Pavlík Biostatistika Neparametrický test pro 1 výběr - Wilcoxonův test Předpokládáme realizaci náhodného výběru o rozsahu n: xv x2,..., xn. Předpokládáme symetrii dat (daleko slabší předpoklad než normalita dat) -> nulová hypotéza se týká mediánu Princip Wilcoxonova testu je takový, že spočítáme diference xv x2,..., xn od x0 a podíváme se, jestli je zhruba Ví diferencí kladných a Ví záporných. -^To je ekvivalentní s tím, že zhruba polovina hodnot x1,x2,... ,xnje menších než x0 a polovina hodnot xv x2,..., xn je větších než x0. ^Spočítáme diference (nulové vyhodíme): y. = jt - jt0 Diference seřadíme podle velikosti absolutních hodnot: | y(l) \ < \ y(2) | <... < | y(n) mu Tomáš Pavlík irK ilMJ ^ Biostatistika Neparametrický test pro 1 výběr - Wilcoxonův test ■*Spočítáme diference (nulové vyhodíme): y i = *i - x, o Diference seřadíme podle velikosti absolutních hodnot: | y{l) \ < \ y{2) I < • • • < I }>( Jako /?, označíme pořadí diference y,. Testovací statistika: min(S+,S~) •*Pro malá n (cca do 30) lze kritickou hodnotu pro statistiku min(5+,5~) odpovídající zvolenému a najít v tabulkách - je-li výsledná hodnota min(5+,5~) menší nebo rovna kritické hodnotě, zamítáme HQ. •*Pro větší/? lze rozdělení testové statistiky min(5+,5~) aproximovat normálním rozdělením s parametry: E(min(S+ ,S~)) = «(« + !)/4 kde Tomáš Pavlík Příklad - Wilcoxonův test pro jeden výběr - Chceme srovnat průměrný energetický příjem skupiny 11 žen ve věku 22 -30 let s doporučenou hodnotou (7725 kJ). Nulovou a alternativní hypotézu vyjádříme jako: H0: Žena Denní energetický příjem v kJ Diference od hodnoty 7725 kJ Pořadí absolutní hodnoty diference 1 5260 -2465 11 2 5470 -2255 10 3 5640 -2085 4 6180 -1545 8 5 6390 -1335 > 6 6515 -1210 6 7 6805 -920 4 8 7515 -210 1,5 9 7515 -210 1,5 10 8230 505 3 8770 1045 Tomáš Pavlík Biostatistika Příklad - Wilcoxonův test pro jeden výběr * Výpočet testové statistiky: S+ = = 8 a S~ = , = 58 min(S+,S~) = 8 Kritická hodnota z tabulek pro n = 11: = wu(0,05) = 10 ■i Výsledná hodnota statistiky min(S+,S~) je menší než 10: ' ^ Zamítáme H0 Tomáš Pavlík Biostatistika Poznámka Parametrické a neparametrické testy nemusí vycházet stejně. Důvody: 1. Nesplněné předpoklady parametrického testu. 2. Malá síla neparametrického testu. ■*Je-li však dobře specifikován pravděpodobnostní model a je-li dostatek dat, bude to vycházet stejně. ^Měli bychom preferovat parametrické testy, ALE pouze po důkladném ověření jejich předpokladů! Tomáš Pavlík Biostatistika Párový t-test Předpokládáme realizaci dvourozměrného náhodného vektoru o rozsahu n: x2 ^2 y (máme dvojice hodnot, které patří k sobě) Předpokládáme dvourozměrné normální rozdělení: Nulovou a alternativní hypotézu vyjádříme jako: U J ^2 y v i Párový problém převedeme na případ jednoho výběru - nebudeme počítat s dvojicemi hodnot, ale s rozdíly: ^ = jt,. -_y. Následně testujeme, zda je průměr hodnot cfl7 cf2/..., c(n různý od předpokládané hodnoty cf0. Tomáš Pavlík Biostatistika Párový ŕ-test Dále postupujeme jako při f-testu projeden výběr. Testová statistika má tvar: T = ^^~t{n-\) sdNn Nulovou hypotézu zamítáme na hladině významnosti a, když výsledná hodnota T statistiky je větší (nebo menší) než kritická hodnota (příslušný kvantil) rozdělení t(n -1). Alternativa Hl: jjlx- ju2^ d0 ^H-t Hx: jud * dQ »7-1) -a 12 Zamítáme H0 když \T\> t[n Alternativa H1: //: - ju2 > d0 Hl: jud > d0 Zamítáme H0 když T > t{"^ Alternativa h1: jáx - ju2 < dQ hl:jud< d0 Zamítáme HQ když T < t^~] Tomáš Pavlík JUL_||^Jj Biostatistika Příklad - párový ř-test ■i Wiebe a Bortolotti (2002) zkoumali žluté zbarvení ocasního peří datlů zlatých. Všimli si, že někteří ptáci mají jedno ocasní pero jinak zbarvené než ta ostatní -> chtěli vědět, jestli je odchylka ve žlutém zbarvení statisticky významná. Měřenou veličinou byl yellowness index („index žlutosti") Pták Index pro typické pero Index pro atypické pero Rozdíl (c/) A -0.255 -0.324 0.069 B -0.213 -0.185 -0.028 c -0.19 -0.299 0.109 D -0.185 -0.144 -0.041 E -0.045 -0.027 -0.018 F -0.025 -0.039 0.014 G -0.015 -0.264 0.249 H 0.003 -0.077 0.080 1 0.015 -0.017 0.032 J 0.020 -0.169 0.189 K 0.023 -0.096 0.119 L 0.040 -0.330 0.370 M 0.040 -0.346 0.386 N 0.050 -0.191 0.241 0 0.055 -0.128 0.183 P 0.058 -0.182 0.240 Tomáš Pavlík Biostatistika Příklad - párový f-test Pracovní hypotéza: „Je odchylka ve žlutém zbarvení statisticky významná?". Nulová hypotéza a alternativa: H0\ju = 0 Hl:Ju>0 Za platnosti H0 předpokládáme: d ~ jV(0,ct%) Vypočtené statistiky: d = 0,137 a s3 =0,135 . .. d-dn 0,137-0 Testová statistika: t =-A = — ^ = 4,06 sl-Jn 0,135/ 16 Absolutní hodnotu f srovnáme s kvantilem f rozdělení s 15 stupni volnosti. 11 = 4,06 > 1,75 = ŕ0595 = txn_l Zamítáme H0 Tomáš Pavlík Biostatistika 3. Testy o parametrech 2 rozdělení Testy pro dva výběry * Chceme srovnat sledovanou charakteristiku náhodné veličiny ve dvou nezávislých skupinách. Test o rozdílu průměru dvou nezávislých výběrů - f-test pro dva výběry (při stejných rozptylech) ^Test o shodnosti rozptylů dvou nezávislých výběrů - F-test Welchova korekce pro f-test při nestejných rozptylech 1 ■ Neparametrický test pro 2 výběry - Mann-Whitneyho test ; Spolu s výsledkem testu by měly být reportovány i intervaly spolehlivosti pro pozorované rozdíly v průměrech/mediánech či podíl rozptylů. Tomáš Pavlík Biostatistika 7-test pro dva výběry při stejných rozptylech " Máme realizaci 1. náhodného výběru o rozsahu n{. xv x2,..., x a na ní nezávislou realizaci 2. náhodného výběru o rozsahu n2: yv y2,..., yn . ... a stejný rozptyl (i když neznámý) Yt ~ N(ju2,cr2) Testujeme, zda náhodné výběry pochází z rozdělení se středními hodnotami, které se liší o předpokládanou hodnotu c (konstanta). H0:fdx-ju2= c Hl\jul-ju2^c Hl:jul-ju2 c * Neznáme hodnotu parametru o2, ale předpokládáme, že je stejný pro oba výběry - parametr musíme odhadnout pomocí váženého průměru odhadů Předpokládáme normalitu dat: rozptylu v jednotlivých výběrech: (nx - \)sl + (n2 - \)s22 nY + n2-2 Tomáš Pavlík IMI Biostatistika 7"-test pro dva výběry při stejných rozptylech ■* Víme, že za platnosti H0 platí: X - Y ~ N(c, a1 + ^)) „Větší nebo menší" závisí na předem zvolené alternativě. ■Alternativa Hl\nx-ju2*c * Za m ítá me H0 když \T\> t^Jf 1 • Alternativa Hl:{i1-fi2>c < • Zamítáme H0 když 7 > &+"2_2) '• Alternativa Hl:{i1-fi2 F^J^ '; Alternativa Hl: o\ > g\ * Zamítáme H0 když F > F&1*2~1) ' ■ Alternativa Hl: o\ < o\ * Zamítáme H0 když F < F£ni~l,rt2~l) Tomáš Pavlík Biostatistika Příklad - F-test '; Máme dvě skupiny dětí s hypotyreózou: první skupina jsou děti s mírnými symptomy, druhá skupina jsou děti s výraznými symptomy. Chceme srovnat hladinu tyroxinu v séru. Můžeme si dovolit použít f-test pro dva výběry? H0: g\ = cj\ Hladina tyroxinu v séru (nmol/l) Mírné symptomy (n1 = 9) Výrazné symptomy (n2 = 7) 34 5 45 8 49 18 55 24 58 60 59 84 60 96 62 86 Průměr 56,4 42,1 SD 14,22 37,48 mu Tomáš Pavlík lIMl ^ Biostatistika * BA \í,„a ^ Příklad - F-test Hladina tyroxinu v séru (nmol/l) Mírné symptomy K = 9) Výrazné symptomy (n2 = 7) Průměr 56,4 42,1 SD 14,22 37,48 ; Testová statistika: F = 4 = í14^24 = 0,144 s\ (37,48)2 i-; Hodnotu F srovnáme s a kvantilem F rozdělení s 8 a 6 stupni volnosti. F = 0,144 < 0,279 = F0(80f = F^'1^ Zamítáme H0 * mm * Tomáš Pavlík ll^Jj Biostatistika Stejné rozptyly? Myslíte si, že jsou stejné rozptyly obou souborů v praxi časté? Pokud ne, zkuste vymyslet příklad... Tomáš Pavlík Biostatistika Welchova korekce pro nestejné rozptyly * Welch (1937) navrhl korekci pro výpočet T statistiky se zohledněním nestejných rozptylů. - ■ Víme, že za platnosti H0 platí: X - 7 ~ N(c, °^ + ^) X — Y — c * Testová statistika: T = , ~ t (v) V »1 n2 Počet stupňů volnosti NENÍ roven ale třeba ho stanovit následovně: Kritické hodnoty pro zamítnutí H0 lze odvodit stejně, jako v případě f-testu pro dva výběry se stejným rozptylem. v = [(s'/ni) + (s22/n2)ý (s21nxf + {s221n2ý nx-\ «2-l Tomáš Pavlík Biostatistika Neparametrický test pro 2 výběry - Mann-Whitneyho test 1 ■ Máme realizaci 1. náhodného výběru o rozsahu n{. xv x2,..., x a na ní nezávislou realizaci 2. náhodného výběru o rozsahu n2: yv y2,..., y^- X, ~ F(x) Y, - F(y) Předpokládáme stejné rozdělení dat v obou souborech (slabší předpoklad než normalita dat) -> nulová hypotéza se týká distribučních funkcí. H0: F(x) = F(y) Hx: F(x) * F(y) * Pointa Mann-Whitneyho testu: pokud x, a y- pochází ze stejného rozdělení, pak by pravděpodobnost P(x] > y-) měla být zhruba 50 %. •^To je ekvivalentní tomu, že při srovnání všech dvojic x, a y- bude v případě cca 50 % dvojic menší x, a naopak. Tomáš Pavlík Biostatistika Neparametrický test pro 2 výběry - Mann-Whitneyho test 1 ■ Pro výpočet nejprve seřadíme všechna pozorování podle velikosti (jako by byly z jednoho vzorku) a přiřadíme jednotlivým hodnotám jejich pořadí. i-; Statistikou T1 označíme součet poradiv 1. skupině. * Testové statistiky: U = nxn2 + n^+V} Tx U'= nxn2 - U Větší z hodnot U a W následně srovnáme s kritickou hodnotou z tabulek (v případě oboustranného testu). Je-li kritická hodnota menší, H0 zamítáme. Pro jednostranný test uvažujeme dle nulové hypotézy pouze buď statistiku L/nebo U'. Pro vzorky s n1 > 10 a n2 > 10 lze rozdělení statistiky U aproximovat normálním rozdělením s charakteristikami: E{U) = nxn2/2 D(U) = nxn2(nx + n2 +1)/12 mu Tomáš Pavlík irK ^ Biostatistika IBA X,, ^ Příklad - Mann-Whitneyho test '; Máme dvě skupiny dětí s hypotyreózou: první skupina jsou děti s mírnými symptomy, druhá skupina jsou děti s výraznými symptomy. ,; Chceme srovnat hladinu tyroxinu v séru (f-test pro dva výběry není vhodný) H0: F(x) = F(y)) Hx: F(x) * F(y) Hladina tyroxinu v séru (nmol/l) Mírné symptomy K = 9) Výrazné symptomy (n2 = 7) 34 5 45 8 49 18 55 24 58 60 59 84 60 96 62 86 Průměr 56,4 42,1 SD 14,22 37,48 Tomáš Pavlík Biostatistika Příklad - Mann-Whitneyho test i-; Seřadíme všechna pozorování podle velikosti a přiřadíme jednotlivým hodnotám jejich pořadí. Součet pořadí v 1. skupině: T1 = 84,5. Skupina n1 = 9 Skupina n2 = 7 Pořadí 5 1 8 2 18 3 24 4 34 5 45 6 49 55 8 58 9 59 10 60 11,5 60 11,5 62 13 84 14 86 15 96 16 U = 9 * 7 + 9(9 + ^ - 84,5 = 63 + 45 - 84,5 = 23,5 2 £7 = 9*7-23,5 = 39,5 *max(l/,ir) = 39,5. •^Srovnáme s kritickou hodnotou z tabulek (pozor na správné tabulky): — TTÍ9>7) -J](n\,ni) ~ U a(\/2) m3x(U,U') = 39,5<51 = U 0,05(2) Nezamítáme H0 Tomáš Pavlík Biostatistika Příklad - Mann-Whitneyho test Zdá se vám ten výsledek správný? Pokud ne, čemu to lze přisoudit? Tomáš Pavlík Biostatistika 4. Permutační testy Princip permutačních testů Permutační testy jsou neparametrickými testy, ale místo pořadí pracují s pozorovanými hodnotami. Principem permutačního testování je srovnání pozorované testové statistiky s testovými statistikami, které by bylo možno teoreticky získat ze stejného datového souboru, když by přiřazení jednotlivých pozorovaných hodnot do sledovaných skupin bylo náhodné. Permutační test je tedy založen na výpočtu všech možných hodnot testové statistiky, které lze získat opakovaným přeskupením původního souboru dat tak, že v rámci každého opakování zůstane zachován jak celkový počet pozorování (celkové n), tak počet pozorování náležících do jednotlivých skupin (např. n1 a n2). Tomáš Pavlík Biostatistika Výpočet permutačních testů ■* Výslednou p-hodnotu pak odhadneme jako podíl počtu testových statistik, které byly v absolutní hodnotě větší než původní pozorovaná testová statistika (tedy představují extrémnější výsledky experimentu), k celkovému počtu provedených permutací. *Tedy odhad p-hodnoty lze vyjádřit následovně: #t :t >t m P M' i = l M M * Permutační testy jsou velmi oblíbené v hodnocení genomických a proteomických dat. Tomáš Pavlík IMI Biostatistika Příklad - permutační test pro dva výběry Srovnání hmotnosti dvou skupin pacientů. n, = 7 xA= 74,5 kg sA = 9,49 kg «2=8 xB = 87,1 kg sB = 6,95 kg H0: juY- ju2= c Hl\ jul- ju2^ c - Pro permutační test použijeme T statistiku pro dva výběry. 1 * Zvolíme hladinu významnosti testu: a = 0,05. * Pro nr - 1 a n2 = 8 je možnost provést celkem 6435 jedinečných permutací. Kategorie pacienta Hmotnost pacienta (kg) A 91,5 A 79,8 A 66,2 A 70,7 A 63,4 A 77,7 A 71,9 B 83,9 B 92,2 B 85,4 B 99,2 B 77,5 B 80,8 B 91,6 B 86,2 Tomáš Pavlík IBA mu v" ""'V m Biostatistika Příklad - permutační test pro dva výběry Kategorie pacienta Hmotnost pacienta (kg) 1 2 Pořadí permutace 3 6435 A 91,5 A B B B A 79,8 B B B B A 66,2 A A A A A 70,7 A B A B A 63,4 B B A A A 77,7 B B B A A 71,9 B A A B B 83,9 A B A A B 92,2 B B A A B 85,4 A A B A B 99,2 A A B A B 77,5 A A A B B 80,8 B A B B B 91,6 B B B B B 86,2 B A B B Testová statistika 2,900 0,429 0,341 3,106 0,798 Tomáš Pavlík Biostatistika Příklad - permutační test pro dva výběry ■*Srovnání hmotnosti dvou skupin pacientů: A a B. Pro výpočet p-hodnoty permutačního testu je potřeba následující: 1. Hodnota původní testové statistiky: t = 2,900 2. Celkový počet provedených permutací: M = 6435 3. Počet permutací, kdy je absolutní hodnota testové statistiky tu / = 1, M, větší nebo rovna původní testové statistice f = 2,900. Zde je m = 59. - Pak p-hodnotu můžeme odhadnout následovně: m 59 0,009 P M 6435 Výsledná p-hodnota je menší než zvolená hladina významnosti testu a = 0,05. Zamítáme H, o Tomáš Pavlík IMI Biostatistika Permutační test pro dva výběry Interpretace výsledné p-hodnoty je zde stejná jako pro klasický f-test. * Velkou výhodou permutačního testování je fakt, že jej lze použít pro jakoukoliv testovou statistiku. ■* Klíčovým předpokladem je zaměnitelnosti pozorovaných hodnot v obou srovnávaných skupinách - oba soubory by neměly mít výrazně odlišnou variabilitu (proto bychom neměli permutační test použít na příklad s hypotyreózou). Při malém n (cca 10 - 20) je poměrně malý také počet dostupných permutací, což může vést k nepřesnému odhadu p-hodnoty. ""^ Při 1000 permutacích je nejmenší dosažitelná p-hodnota 0,001,100 000 permutací umožňuje dosáhnout p-hodnoty až 0,00001. Tomáš Pavlík Biostatistika Poděkování... Rozvoj studijního oboru „Matematická biologie'' PřF MU Brno je finančně podporován prostředky projektu ESF č. CZ.1.07/2.2.00/07.0318 „Víceoborová inovace studia Matematické biologie" a státním rozpočtem České republiky 18f k BH pnSt t^í čími ^^^^fc I soclalnL ^^^^^^^ MINISTERSTVO ŠKOLSTVÍ. OP Vzdělávání 'J-^iJr^ ^0 M fondvCR EVROPSKÁ UNIE mládeže a tělovýchovy pro konkurenceschopnost 4ííA p*" INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ Tomáš Pavlík Biostatistika