Analýza prežívania Neparametrické modely Stanislav Katina1 1 Ustav matematiky a statistiky, Masarykova univerzita Honoráry Research Fellow, The University of Glasgow 23. mája 2018 Stanislav Katina Analýza prežívania Cenúrovanie Úvodné definície Úvodné definície Udalosť: ukončenie pozorovania z dôvodu zlyhania alebo smrti pacienta - do konca sledovaného obdobia Príklady udalostí: • overall survival smrí z akéhokoľvek dôvodu prvé znaky progresie choroby • progression-free survival alebo smrí a disease-free survival - prvé znovuobjavenie sa choroby alebo smrí a event-free survival - prvé znovuobjavenie sa choroby, objavenie sa inej špecifikovanej choroby alebo smrí • disease-specific survival (cause-specific survival) - smrí ako dôsledok špecifikovanej choroby o relapse-free survival (recurrence-free survival) - prvé znaky recidívy (opakovania sa) chodoby • time-to-progression - prvé znaky progresie choroby Stanislav Katina Analýza prežívania Cenúrovanie Cenzurovanie I. typu Cenzúra: ukončenie pozorovania z dôvodu iného ako je zlyhanie alebo smrt pacienta - do konca sledovaného obdobia dôjde k úmrtiu len niektorých pacientov, zatiaf čo u ostatných k úmrtiu do konca sledovaného obdobia bud nedôjde alebo sa títo pacienti z pozorovania stratia Príklady cenúr: • ukončenie štúdie (termination of the study): pacient prežije časový interval experimentu • konkurenčné riziko (competing risk): pacient zomrie z iného dôvodu, ako v dôsledku sledovanej choroby • prerušenie/vysadenie liečby (drop-out): pacient preruší liečbu a odíde z kliniky predčasne, napr. z dôvodu zlých vedľajších účinkov liečby, pacient sa sám rozhodne nepokračovat v liečbe • strata z ďalšieho sledovania (loss to follow-up): pacient sa rozhodne presíahovaí a nemáme o ňom už žiadne informácie 3/120 Stanislav Katina Analýza prežívania Základné princípy: O predpoklad - všetkých n jedincov vstupuje do experimentu súčasne Q príčina cenzurovania - plánované ukončenie experimentu O ide o cenzurovanie časom - zvolíme pevné číslo tc, ktoré nazveme fixovaný cenzurujúci čas Q T™ < 7<2> < ... < 7, kde 7 < to < 7(D+,) O náhodná veličina - počet skutočne pozorovaných zlyhaní De {0,1,..., n} O nech X\, X2,..., Xn, kde „ . . . í T,, T, < U, pre necenzurované X, Xj = mm (T, to) = { t -r — * - -v [ fc, T > tc, pre cenzurované X, Q skutočnému pozorovaniu potom zodpovedá náhodný vektor (Xj, á,)7, kde g _ í 1, T■ < tc, pre necenzurované X, 1 ~ \ 0, T > tc, pre cenzurované X, 4/120 Stanislav Katina Analýza prežívania Cenúrovanie Cenzurovanie II. typu Cenúrovanie Progresívne (zrýchlené) cenzurovanie I. typu Základné princípy: Q predpoklad - všetkých n jedincov vstupuje do experimentu súčasne & príčina cenzurovania - plánované ukončenie experimentu 9 ide o cenzurovanie zlyhaním - zvolíme si pevné číslo d, ktoré nazveme fixovaný počet zlyhaní; ukončenie teda nastáva po vopred zvolenom počte d zlyhaní, kde d = [np] + 1 ,p e (0,1) O * = T(,U2 = 7<2>, ...,*„= 7*", = 7,... Xn = 7 9 náhodná veličina - čas trvania experimentu 7(d) Q nech X), X2,..., Xn, kde „ . Jdi, í 7, 7 < 7(d), pre necenzurované X, X, = mm(7, 7V M = 4 Tfdl ~ _fdr , , ., v ' [ 7(tí), 7> T{a>, pre cenzurované X, O skutočnému pozorovaniu potom zodpovedá náhodný vektor {X,, á,)7, kde j _ í 1, 7} < 7"(o,), pre necenzurované X, ' \ 0, 7 > 7(d), pre cenzurované X, Základné princípy: O predpoklad - všetkých n jedincov vstupuje do experimentu súčasne O príčina cenzurovania - plánované ukončenie experimentu O ide o cenzurovanie časom - zvolíme čísla tci, i = 1,2,..., k, ktoré nazveme fixované cenzurujúce časy, v čase ŕc, vyradíme m, subjektov O ŕd < ŕc2 < ■ ■ ■ < ŕ* Q v čase ŕci vyradíme mi subjektov, v čase ŕC2 vyradíme m2 subjektov, v čase řek vyradíme mk subjektov Q po /(-tom kroku máme vyradených mi + m2 + ... + mk subjektov O náhodná veličina - počet skutočne pozorovaných zlyhaní De {0,1,..., n} Stanislav Katina Analýza prežívania Cenúrovanie Progresívne (zrýchlené) cenzurovanie II. typu 6/120 Stanislav Katina Cenúrovanie Náhodné a ľubovoľné cenzurovanie Analýza prežívania Základné princípy: Q predpoklad - všetkých n jedincov vstupuje do experimentu súčasne 0 príčina cenzurovania - plánované ukončenie experimentu O ide o cenzurovanie zlyhaním - zvolíme čísla c/,, ktoré nazveme fixované počty zlyhaní; vyradenie teda nastáva po vopred zvolenom počte di zlyhaní, kde cŕ, = [np,] + 1 ,p, e (0,1) Q po d\ zlyhaniach vyradíme m\ subjektov, po cŕ2 zlyhaniach vyradíme m2 subjektov,..., po dk zlyhaniach vyradíme mk subjektov Q po /(-tom kroku máme vyradených m\ + m2 + ... + mk subjektov Q náhodná veličina - čas trvania experimentu 7(o,k) Základné princípy: O predpoklad - n jedincov nevstupuje do experimentu súčasne O čas do zlyhania 7, 72,..., 7n sú nezávislé, rovnako rozdelené náhodné premenné, kde náhodná veličina T, (i = 1,..., n) má hustotu f (t) a distribučnú funkciu F (t) Q čas do cenzurovania C\, d, ■ ■ ■, Cn sú nezávislé, rovnako rozdelené náhodné premenné, kde náhodná veličina C, (i = 1,..., n) má hustotu g(t) a distribučnú funkciu G (t) nech X\,X2,...,X„ je náhodný výber časov, kde X, = min (7, Q) T,, T, < d, pre necenzurované X, d, 7 > Ci, pre cenzurované X, Q nech (Xi, á,)7 je náhodný vektor, kde X, = min(7, C,-) a Si 1, 7 < Q, pre necenzurované X 0, 7 > Ci, pre cenzurované X 0 náhodná veličina - čas trvania experimentu a čas do cenzúry (ak C = c, ide o ľubovoľné cenzurovanie) 7/120 Stanislav Katina Analýza prežívania 3/120 Stanislav Katina Analýza prežívania Cenúrovanie Intervalové cenzurovanie I. typu Základné princípy: Majme n subjektov. Nech časy do zlyhania T, i = 1,2,. ., n, sú náhodné premenné, ktorých realizácie nedokážeme pozorovať. Nech (X,, á,) je náhodný vektor, kde X, = C, sú časy cenzúr a á,- = l(T < C), t.j. 1, T< C,, pre necenzurované X, 0, T > C,, pre cenzurované X, Example (nádor píúc, animálny model) Laboratórne myši sú injektované látkou, ktorá spôsobuje nádor. Kedže tento druh nádoru nie je smrteíný, je potrebné myš najprv zabit, aby sme zistili, či bol nádor indukovaný, t.j. po časovom úseku náhodnej dĺžky C je myš zabitá, aby sme zistili, či sa nádor vyvinul alebo nie. Endpoint záujmu je čas T do objavenia sa nádoru. Cenúrovanie Intervalové cenzurovanie II. typu Základné princípy: Majme opát n subjektov. Nech časy do zlyhania T, i = 1,2,..., n sú náhodné premenné, ktorých realizácie nedokážeme pozorovať. Vieme len, že T, nastalo buď vnútri nejakého náhodného časového intervalu, pred jeho íavou hranicou alebo po jeho pravej hranici. Označme d a C2, časy dvoch vyšetrení a indikačné funkcie definujeme nasledovne á,i = l(T< d), Sí2 = /(C/l d), t.j. á _ ŕ 1, T< C/i, pre necenzurované X, ,1 ~~ 1 0, T, > d, pre cenzurované X, á/2 = a nakoniec á/3 = 0. 1, Ci < T < C/2, pre necenzurované X, 0, T > C/2, pre cenzurované X, Example (nádor píúc, pacienti) Pacienti navštevovali kliniku opakovane každých 4 až 6 mesiacov, kde pozorovania sú bud intervaly (d, C,2) ak sa retrakcia prsníka vyskytla medzi poslednými dvoma návštevami alebo (C,2, oo), ak sa do C,2 retrakcia nevyskytla. Stanislav Katina Analýza prežívania Cenúrovanie Intervalové cenzurovanie II. typu Stanislav Katina Analýza prežívania Základné charakteristiky prežívania Názvoslovie, označenia, vzorce Základné princípy: Máme nasledovné tri možnosti: O událost mohla nastat niekedy pred prvým vyšetrením d, kde á,i = 1 a á/2 = á/3 = 0, 9 událost mohla nastat niekedy medzi prvým a druhým vyšetrením, t.j. v intervale (d, C,2), kde á,i = 0, á,2 = 1 a Si3 = 0, Q událost sa do druhého vyšetrenia nevyskytla, t.j. mohla nastat niekedy po C/2 (ale nevieme kedy), kde á,i = 0, á,2 = 0 a Si3 = 0. Nech Xj\ = Ci a X2, = C2,. Potom dostaneme náhodný vektor (Xíu X21, á/1, á/2)7. Všimnime si, že á,3 nie je potrebné použit, pretože nemáme ďalšie vyšetrenie po C/2. Keby sme mali C,3 alebo aj ďalšie (po ňom nasledujúce) vyšetrenia, hovorili by sme zovšeobecnenom intervalovom cenzurovaní. Nech T je nezáporná náhodná premenná (T > 0) reprezentujúca čas úmrtia (zlyhania) indivídua z homogénnej populácie. Rozdelenie pravdepodobnosti T môže byí charakterizované rôznym spôsobom. V analýze prežívania sa najčastejšie používajú: O distribučná funkcia (distribution function) F (t) Q funkcia hustoty (hustota; probability density function) f (t) O funkcia prežívania (survivor function, reliability function) S(t) O riziková funkcia (funkcia rizika, intenzita úmrtnosti, riziko; hazard function, hazard rate, risk, mortality rate) A (ŕ), v poistných aplikáciách fj,(t) Q kumulatívna riziková funkcia (funkcia kumulatívneho rizika, kumulatívne riziko; cumulative hazard function) A(ŕ) 11/120 □ s1 Stanislav Katina Analýza prežívania I -00.0 12/120 □ S Stanislav Katina Analýza prežívania Základné charakteristiky prežívania Názvoslovie, označenia, vzorce Základné charakteristiky prežívania Názvoslovie, označenia, vzorce - spojitý prípad Distribučná funkcia Ďalej sa budeme zaoberaí charakteristikami: O p-ty kvantil tp rozdelenia T, špeciálne medián času prežívania (median survival time, median survival) ŕ0.5 medián funkcie prežívania S(ř0 5) 9 stredná hodnota času prežívania (mean survival) [i Q stredná hodnota zostatkového života v čase t (mean residual life) mri (t) 9 medián zostatkového života v čase t (median remaining lifetime, median residual life) mrlt(t) F{t) = Pr{Tn = fr{u-mu)du-frmdu S(t) S(t) 15/120 Stanislav Katina Analýza prežívania 16/120 Stanislav Katina Analýza prežívania Základné charakteristiky prežívania Názvoslovie, označenia, vzorce - spojitý prípad Funkcia prežívania vyjadrená pomocou mrl(ŕ) mrl(O) S{t) = exp du mri (ŕ) V Jo mri (u) Funkcia rizika vyjadrená pomocou mrl(ŕ) A(0 =(1^(0 + 1)^ Funkcia hustoty vyjadrená pomocou mrl(ŕ) i 9 u* h \ mrl(0) dt (mrl(ř)r du o mrl(ív) Stanislav Katina Analýza prežívania Základné charakteristiky prežívania Názvoslovie, označenia, vzorce - diskrétny prípad Základné charakteristiky prežívania Názvoslovie, označenia, vzorce - diskrétny prípad Funkcia prežívania Funkcia hustoty Kumulatívne riziko i:ti(1-A(ŕ,)) í':fc^(fy+l - tj)S(tj) 9 cenzurovanie II. typu n! n-d mrl(ŕ) = kde t; < t < ŕ,+i o náhodné cenzurovanie S(ŕ) L = Hf{XiySf{xtf-s' = l\x(xiýSf(xi) /=1 /=1 19/120 □ S1 Stanislav Katina Analýza prežívania I -00.0 20/120 □ S Stanislav Katina Analýza prežívania Funkcia vierohodnosti Pravé typy cenzurovania Funkcia vierohodnosti Pravé typy cenzurovania - funkcia vierohodnosti • intervalové cenzurovanie I. typu n L = l\[Sf(xi)]'-5'[F(xi)f • intervalové cenzurovanie II. typu n L = II [F{xh [F(x/2) - F{xh )}5* [Sf(xi2)}5» , /=1 kde 6i3 = 1 - č/1 - 5j2 Náhodné cenzurovanie n I nc n,—-d, L = ^ms'sf{xiý-s'^wi)ý\[ n Sficfi) /=1 /=1 /=1 y=i = Ŕ n[S(íy)]',"%,"í* /=1 y=i / / = nisit^ntitnisitj)}"1 /=1 y=i n,-n,+1-dí = nwtifii-w-" /=i Stanislav Katina Analýza prežívania Prehfad vzorcov Charakteristiky definované sčítacím procesom Stanislav Katina Analýza prežívania Prehfad vzorcov Charakteristiky definované sčítacím procesom Vo formuláciách sčítacím procesom (X,, ój)T nahradíme (A/, (ŕ), Y, (ŕ)), kde A/, (ŕ) je počet pozorovaných udalostí v intervale (0, t) v jednotke /', vít\ — í 1 jednotka / je v riziku v čase ŕ (pozorujem ju) r,(rj"\ 0 inak Táto formulácia obsahuje dáta s pravým typom cenzúr ako špeciálny prípad, teda Y, {t) = I{{T,> t}) a N, (t) = / ({T, < ŕ, S = 1}). Všimnime si, že N (t) je zprava spojitá a Y (t) zíava spojitá. Y (t) je príkladom predikovateíného procesu, ktorého hodnoty v čase t sú známe nekonečne krátko pred t, v čase ŕ~, ak nie skôr. Sčítací proces\e stochastický proces začínajúci v čase 0, ktorého trajektória je zprava spojitá funkcia so skokmi velkosti 1. Pre N (t) potom platí {N(t) : ŕ> 0}, N(0) = 0. 23/120 Stanislav Katina Analýza prežívania Odhad kumulatívneho rizikaje definovaný na základe agregovaného procesu Y (t) = Ej_V/(0 ,_Ň (0 = E/ M (0 , aW(ŕ) = AA/ (ŕ) = A/(ŕ) -N {r), kde A/(ŕ) je suma udalostí do času ŕ vrátane, V (ŕ) je počet jednotiek v riziku v čase t (formálne ide o počet jednotiek v riziku v časovom intervale (t - e, t) pre malé e). Example r Majme náhodný vektor (X,, ô,), definovaný nasledovne (pre nejakú fiktívnu /-tu štatistickú jednotku, t.j. subjekt) Riešenie 1) (X,, ô,)7 = (3,0)7", t.j. v čase X, = 3 je cenzúra, N, (ŕ) = N, (3) = 0, Y,- (3) = Y,- (3) = 1 ^ (A/,- (3), Y (3))T = (0,1 f, 2) (X,, ói)T = (4,1 )7", t.j. v čase X,- = 4 je udalosí (zlyhanie), N; (4) = 1, y (4) = 1, t.j. (A/,- (4), Y, (4)f = (1,1 )7, 3) Ak máme viac udalostí: (A/,- (0.5), Y-, (0.5))7" = (1,1 )T, (A//(2),y(2))r = (2,1)r □ s> - = i 24/120 Stanislav Katina Analýza prežívania P re h fad vzorcov Odhady kumulatívneho rizika Pre hlad vzorcov Odhady kumulatívneho rizika • Nelson-Aalenov (NA) odhad kumulatívneho rizika 'řcW(sK ^ A/V (ŕ,) AAw(ŕ) = Jo Y (s) Y (t,) 9 Flemingom a Harringtonom (FH) modifikovaný NA odhad kumulatívneho rizika ^FHmodNA (t) A/V(s)-1 1 E i:tio Y (s) Y(s)-dN(s) 9 NA odhad rozptylu kumulatívneho rizika rtdŇ(s) ds Var Aam(0 o y2(s) ds 9 Flemingom a Harringtonom modifikovaný NA odhad rozptylu kumulatívneho rizika Var ^FHmodNA (0 A/V(s)-1 E j=o [Y(s)-j ds 9 Greenwoodov odhad rozptylu kumulatívneho rizika AŽV(f/) ,^tY(ti) Y(ti)-AŇ(ti) VarG A(f)l = E- 9 NA odhad rozptylu kumulatívneho rizika A/V (ŕ,) Var i:t S(f) V y:ŕ,+1 Šb(-) alebo ŠFHmodB()- □ gp - = 33/120 Stanislav Katina Analýza prežívania Prehfad vzorcov Odhad strednej hodnoty zostatkového života a jeho rozptyl Odhad rozptyl priemerného zostatkového života Var[mr\{t)} S2(t) \ Jt -i 2 S{x)dx d2{u) du ŕtmax. ^ 2 ŕ \ / S(u)du / Z2(u)du) Jt Jo J pre spojitý prípad, kde u e (t, ŕmax), a pre diskrétny prípad l/ar[mrl(ŕ)] 1 S2(t) E /:f 3) • Kruskal-Wallis test (KW) • Jonckheere test (J) o Cuzick test (C) • Letest(L) Neparametrické testy porovnania kriviek prežívania pre cenzurované dáta 9 testy porovnania dvoch kriviek prežívania (k = 2) • Gehan-Wilcoxon test, zovšeobecnený Wilcoxonov test (GW) • Cox-Mantel test, log-rank test (CM) • Tarone-Ware test (TW) • Peto-Peto test (PP) • testy porovnania viac kriviek prežívania (k > 3) • Gehan-Breslow test, zovšeobecnený Wilcoxonov test, zovšeobecnený Kruskal-Wallis test (GB) a Cox-Mantel test, log-rank test (CM) • Mantel-Haenszel test, log-rank test (MH) • Peto-Peto test (PP) 43/120 Stanislav Katina Analýza prežívania 44/120 Stanislav Katina Analýza prežívania Testy na porovnanie kriviek prežívania Prehľad testov Testy na porovnanie dvoch kriviek prežívania Wilcoxonov test Testované hypotézy o nulovná hypotéza H0 ■. Si {t) = S2 {t) = S {t) 9 alternatíva hypotéza H-\ : * S^ (ŕ) ž S2{t), pre Vr st » Si -< S2, co je ekvivalentne s S-i(t) < S2(t), pre Vr st » S-\ >- S2, čo je ekvivalentné s S-i(ŕ) > S2{t), pre Vr S (ř) je funkcia prežívania st st , . , „, . , _____ -< a >- stochasticky mensi, resp. stochasticky vacsi Predpoklady 9 X-i,..., Xni je náhodný výber (NV) z nejakého spojitého rozdelenia 9 Y-\,..., Yn2 je NV z rovnakého spojitého rozdelenia a je oproti prvému rozdeleniu posunuté o nejakú konštantu s o veličiny X^,..., Xm a Y-\ - s,..., Yn2 - s majú rovnaké rozdelenie • oba výbery sú nezávislé Hypotézy 9 H0 : s = 0 (S, (t) = S2(ř), Vr) • H, : s ý 0 (Si (r) ý S2(ř). pre aspoň jedno ŕ) Stanislav Katina Analýza prežívania Testy na porovnanie dvoch kriviek prežívania Wilcoxonov test Stanislav Katina Analýza prežívania Testy na porovnanie dvoch kriviek prežívania Wilcoxonov test Označenia 9 rij je počet pozorovaní v y'-tom NV, y = 1,2 • A7-| + n2 = n 9 nech R-\, R2,f?n, sú poradia X-\,X2,..., Xm prvého NV v rámci usporiadaného združeného NV • ich realizácie ^, r2,..., rni sú poradia realizácií x-i, x2,..., xn, Wilcoxonova štatistika "i wx = sw = Yá*i Realizáciu Sw ozn. wx = Sw = Yl ri- 47/120 Stanislav Katina Analýza prežívania Stredná hodnota a rozptyl Sw E0[S Var0 [S rh (n + 1) A7-I n2 {n + 1) 12 Wilcoxonova testovacia štatistika Ak A7i , A72 > 1 0 Var0 [S Realizáciu Zw ozn. zw. 48/120 Stanislav Katina Analýza prežívania Testy na porovnanie dvoch kriviek prežívania Wilcoxonov test Testy na porovnanie dvoch kriviek prežívania Mann-Whitney test Stredná hodnota a rozptyl Sw'- Var0[Sw\t] Eo [Sw] A7-I n2 (n + 1) 12 "1 {n + 1) n(n2--\)^ E í ( 1 0 -w ■>w E0[S v Var0 [bW\ - i2(n1+n2)(n1+n2-1) W(0,1) Realizáciu Zw ozn. zw. 49/120 Stanislav Katina Analýza prežívania Testy na porovnanie dvoch kriviek prežívania Mann-Whitney test Predpoklady • X-i,..., Xni je NV z nejakého spojitého rozdelenia o Vi,..., Yp2 je NV z rovnakého spojitého rozdelenia a je oproti prvému rozdeleniu posunuté o nejakú konštantu s • oba výbery sú nezávislé • nech (X-,, Yj) sú možné páry pozorovaní, pre ktoré môže nastai bud X, < Ys alebo Xt > Ys Hypotézy O H0 : 6 = 0 (S, (t) = S2(ř), Vr) • H-| : á > 0 (Si (ŕ) < S2(t), pre aspoň jedno ŕ) Stanislav Katina Analýza prežívania Testy na porovnanie dvoch kriviek prežívania Mann-Whitney test Označenia 9 rij je počet pozorovaní v y'-tom NV, y = 1,2 • A7-| + n2 = n Mann-Whitneyho štatistika Smw = EE '(*/ > Yj) = # (X/, Y}), kde Xj > Yj i=1 y=1 Realizáciu SMlv ozn. sMW = ££Li E"1i /(x,- > /y). Stredná hodnota a rozptyl Smw E0[S, mw\ n^n2 Var0 [SMW] = Var0 [Sw] A7-I n2 (A7j + A72 + 1 ) 12 Mann-Whitneyho testovacia štatistika Ak Z7-] , A72 > 10 =-; _ =— ~ /v (U, i j Var0 [S, mw\ Realizáciu ZMW ozn. zMW. 51/120 Stanislav Katina Analýza prežívania 52/120 Stanislav Katina Analýza prežívania Testy na porovnanie dvoch kriviek prežívania Mann-Whitney vs Wilcoxonov test Wilcoxonov a Mann-Whitneyho test Ux vyjadruje počet dvojíc X,, Yj, kde platí X, < Yj Ux = ^n2 + -'- - Wx, Uy vyjadruje počet dvojíc X,, Yj, kde platí X, > Yj "2(^2 + 1) U y = n-\n2 +--- - WY Example (nádor pfúc; cvič.) Nech ty, i = 1,..., rijj = 1,2 sú časy do zlyhania (úmrtia) od diagnostiky nádoru pfúc v mesiacoch, kde j = 1 predstavuje I. typ terapie ay = 2 zasa II. typ terapie (pozri tabulku). Otestujte H0 : Si (ř) = S2 (ŕ) oproti alternatíve H, : S, (t) / S2 (ŕ) pomocou Sw a Smw nesledovne (1) Sw = WY a Sw = Wx, (2) Smw = Uy a Smw = Ux- Vždy presne naformulujte H-|. Okomentujte výsledky. 52 240 19 53 15 43 340 133 111 231 378 49 skup 1 2 2 1 1 2 2 1 1 2 1 1 Stanislav Katina Analýza prežívania Wilcoxonov vs Mann-Whitneyho test Stanislav Katina Analýza prežívania Asymptotická normalita rozdelenia S/u Example (Wilcoxonov vs Mann-Whitneyho test; DÚ) Nech Ux vyjadruje počet dvojíc X,, Yj, kde platí X, < Vy, podobne UY vyjadruje počet dvojíc X,, Yj, kde platí X, > Yj. Dokážte, že Ux = n^n2 + ni (ni + 1) Wx, UY = n^n2 + n2 (n2 + 1) WY. Pozn.: Ekvivalentne sa dá ukázat, že Wx = uY (podobne pre WY a Ux) a dosadiť do vzorcov pre Ux a Uy- Example (asymptotická normalita Smw) Pre A7i = 7 a n2 = 5 porovnajte v 70.75)- 55/120 Stanislav Katina Analýza prežívania 56/120 Stanislav Katina Analýza prežívania Testy na porovnanie dvoch kriviek prežívania Asymptotická normalita rozdelenia SMw_ Testy na porovnanie dvoch kriviek prežívania Siegel-Tukey a Levene test_ Hustota MW statistiky Distribučná funkcia MW statistiky qq-diaqram MW rozdelenia 0 5 10 15 2C Obr.: Rozdelenie Mann-Whitneyho štatistiky SMw ("i — 7, nz — 5) Example (asymptotická normalita Smw) Porovnajte v « asymptotické rozdelenie Smw s jej exaktným rozdelením pre (1) n-\ = 5 a n2 = 50, (2) n-\ = 50 a n2 = 50, (3) /7-i = 50 a n2 = 100 a (4) A71 = 100 a /i2 = 100. Prec/po/í/ac/y • liečba nespôsobuje zmenu priemernej odpovede, ale výsledná odpoveď má menší rozptyl okolo strednej hodnoty o X-\, ...,Xni je NV z nejakého spojitého rozdelenia o V-i,Yn2 je NV z nejakého spojitého rozdelenia o oba výbery sú nezávislé Hypotézy o H0 : Var{Sy{t)) = Var(S2(í)), Vř o H : Var(Si(0) / l/ar(S2(/)), pre aspoň jedno ŕ 1 -00.0 Stanislav Katina Analýza prežívania Stanislav Katina Analýza prežívania Testy na porovnanie dvoch kriviek prežívania Siegel-Tukey test_ Testy na porovnanie dvoch kriviek prežívania Siegel-Tukey test _ ■0 0.O Podstata Siegel-Tukey testu je nasledovná Algoritmus 1: o poradie R-\ priradíme najmenšiemu pozorovaniu o poradie R2 priradíme najväčšiemu pozorovaniu o poradie f?3 priradíme druhému najmenšiemu pozorovaniu o poradie F?4 priradíme druhému najväčšiemu pozorovaniu 9 atď. Siegel-Tukey štatistika Stredná hodnota a rozptyl Sst (resp. Sf'f): A7-I (A7-I + n2 + 1) E0[s st\ = 1=0 ;a/í 5ST Var^[SsT] = Var0 [Sf'f] Siegel-Tukey testovacia štatistika Ak n-!, n2 > 10 n: n2 + n2 + 1) 12 Ssr = A/i ;=1 kde daná suma prislúcha súčtu poradí pre prvý NV. Realizáciu Sst ozn. sst = t,n- i 1 59/120 Stanislav Katina Analýza prežívania 7 yalt SST - Ep [SST] v ^ST = ^ST = -/ _-- ^Var0[SST} Realizáciu ZST = ZJ'f ozn. zST = z|'f. 60/120 Stanislav Katina Analýza prežívania /V (0,1) Testy na porovnanie dvoch kriviek prežívania Levene test Testy na porovnanie dvoch kriviek prežívania Levene test Podstata Leveneho alternatívy ST testu (Levene testu) je nasledovná: • odchýlky Dx X-X a Dv Y- Y • D(1) < D(2) < ... < D(n), n = n^+n2 • realizácie odchýlok {d, = \x-, - a {dj = \y - y\}"^ • d0) < d(2) < ... < d(n) Levene štatistika "i ca/f E". /'=1 d/'ff,(/')> kde predstavujú poradia odchýlok od priemeru pre prvý NV. Realizáciu Sff ozn. s|'f. Stredná hodnota a rozptyl S|'f / £o [Ssr] = £o Sf'f Levene testovacia štatistika Ak A7-| , A72 > 1 0 A7i ("i + n2 + 1) 12 73/f SST - E0 ÍSSt\ V Var? [SST] A/(0,1) Realizáciu ZL = Z§í ozn. zL = zit. 61/120 Stanislav Katina Analýza prežívania Testy na porovnanie dvoch kriviek prežívania Siegel-Tukey test a Levene test 62/120 Stanislav Katina Analýza prežívania Testy na porovnanie dvoch kriviek prežívania Siegel-Tukey test a Levene test Example (nádor pfúc pokrač., cvič.) Nech ty, i = 1,..., rijj = 1,2 sú časy do zlyhania (úmrtia) od diagnostiky nádoru píúc v mesiacoch, kde j = 1 predstavuje I. typ terapie ay = 2 zasa II. typ terapie (pozri tabufku). Otestujte v m H0 : Var[S] (t)] = Var[S2 (t)] oproti alternatíve H[ : Var[SÁ (ŕ)] / Var[S2 {t)] pomocou SST a Sf'f. Okomentujte výsledky. Siegel-Tukey test sST = E rf] = 26 /=1 7x5(7+5+1) 12 Eq[Sst]= 5(7+5+11. í/aro[Sw]: ZS7 = (26 -32.5)/6.157651 = -3.167 a p-hodnota=0.291 63/120 Stanislav Katina Analýza prežívania Example (Siegel-Tukey test a Levene test) Naprogramujte v Q? test H0 : Var[S: (t)] = Var[S2 (t)] oproti alternatíve H, : Var[SÁ {t)] + Var[S2 {t)] pomocou SST a Sf'f použitím algoritmu 2. Okomentujte výsledky. Algoritmus 2: f* 52 240 19 53 15 43 340 133 111 231 378 49 o skup 1 2 2 1 1 2 2 1 1 2 1 1 9 - - 11 1 - - 10 12 2 7 O ff> - 6 3 - - 5 4 - 8 - - O najmenšiemu pozorovaniu atd. 64/120 Stanislav Katina Analýza prežívania Testy na porovnanie viacerých kriviek prežívania Prehľad testov Testy na porovnanie viacerých kriviek prežívania Kruskall-Wallis test Testované hypotézy • nulovná hypotéza HQ ■. S, (ř) = S, (ř) = S (ŕ) o alternatíva hypotéza H-\ : 9 S, (ŕ) ^ Sj{t) pre aspoň jedno i, j (KW test) • Si % Sj (čo je ekv. s S,(ŕ) < Sj(t), pre Vr; J,C,L testy) • Si >- Sj (čo je ekv. s S,(ŕ) > Sj(t), pre Vr; J,C,L testy) /'- stochasticky mensi, resp. stochasticky vacsi Označenia 9 Xfl,...,Xjnijey-tyNV, / = 1,2,..., nľJ = 1,2,..., k 9 Rjj poradia Xp v združenom výbere 65/120 Stanislav Katina Analýza prežívania Testy na porovnanie viacerých kriviek prežívania Kruskall-Wallisov test Ďalšie označenia 9 n = Ylj=-\ nj' nj Je počet pozorovaní v y'-tom NV • Sj = H"U RÄ' S = Eyti Rj, Šj = Sj/nj, S = S/n = (n + 1)/2 Kruskall-Wallisova testovacia štatistika U, 12 kw Sj A7+1 n{n+^nj\nj 12 J--^ Sf n(n+^^nj JL s2 ■ ^2 Ei n {n + 1 )2 \ d 2 Realizáciou LW je uKW = Y!j^ nj (f - ■ 66/120 Stanislav Katina Analýza prežívania Testy na porovnanie viacerých kriviek prežívania Jonckheere test Rozptyl poradí R: vár\R] ^EEÍ^ n- 1 7=1 i=1 /f "/ 7=1 /'=1 ^ A7(A7+1) A7+1 Oz/iače/i/ä a / < y, teda / = 1,2,..., k - 1J = 1 +/,..., /c, ďalej = 1,2,..., A7/, aj = 1,2, ...,ľlj 9 nech S'JMW je Mann-Whitney štatistika porovnávajúca /-ty a y'-ty výber 12 1 n(n2 - 1) E í ( Xj A Y, > Y j j diskordantná (neusporiadaná) pokiaľ platí X, < Xy A Y, > Vy alebo X, < Xy A V, > Ys o ak platí Y, — Ys alebo V, — Vy, nejde ani o konkordantný ani o diskordantný vzíah • C + D < n (n - 1), C je počet konkordantných dvojíc, D počet diskonkordantných dvojíc C-d 9 r Kendallov korelačný koeficient r = ^ £íLi Eyii sfcn (X, - Xj) sign (V- - Yj), čo je identické s r = ^h) EíL~ľ Eti+i (x< - */)(yi ~ yj) kde 1, ak X,- > Xj sign{Xj - Xy) = <( -1, ak X/ < Xy 0, ak X,- = Xj "("-') 2 s/g/7(V/- Yj) 1, ak y;- > y- -1, ak Yj < Yj 0, ak Y,- = Yj 71/120 Stanislav Katina Analýza prežívania 72/120 Stanislav Katina Analýza prežívania Testy na porovnanie viacerých kriviek prežívania Kendallov korelačný koeficient Alternatíva Kendallovho korelačného koeficientu o nech R-\,..., Rn sú poradia X-\,...,Xn 9 nech Q-i,..., Qn sú poradia Y-\,..., Yn Potom platí r = j^iy H=1 T.U si3n (Ri ~ Ri) si9n (O/ - Qj) to je identické s r = Tih) ĽÍm Ľ?=/+i sign (R, - Rj) sign (Q- - Qj) Platí fG<-1,1>,£b[f]=0)V&Sň = !^ ^ = íM£n(o,i) VVar0[Ť] Stanislav Katina Analýza prežívania Testy na porovnanie viacerých kriviek prežívania Kendallov korelačný koeficient Testy na porovnanie viacerých kriviek prežívania Kendallov korelačný koeficient Vztah Kendallovho a Pearsonovho korelačného koeficientu Ak (X, Y) ~ Afe(/i, T.) a px,y, potom r = f arcsin(px,v), kde arcsin(-) nadobúda hodnoty z (-|, |) Vz/a/7 Kendallovho korelačného koeficientu a Jonckheere štatistiky calt TG(-1,1) kde r nazývame zovšeobecnený Kendallov korelačný koeficient Stanislav Katina Analýza prežívania Testy na porovnanie viacerých kriviek prežívania Kendallov korelačný koeficient Example (WBC; predn.) Majme pacientov s akútnou myeloidnou leukémiou (AML) a v rámci nich skupinu AG-pozitívnych (výskyt určitých špecifických indikátorov choroby v kostnej dreni). Pre chorobu je charakteristické, že s počtom bielych krviniek (white blood cells counts, WBC) vzrastná závažnost choroby. Nech /,,/'= 1,2,..., 17 sú časy do zlyhania v týždňoch prislúchajúce zoradeným WBC (pozri tab.). Vypočítajte r pomocou počtu konkordantných a diskonkordantných párov. Otestujte nezávislosi medzi počtom bielych krviniek a časmi do zlyhania na hladine významnosti a = 0.05. WBC ŕ, df 750 156 0 16 2300 65 5 9 2600 134 1 13 4300 100 3 10 5400 39 5 7 6000 16 7 4 7000 143 0 10 9400 56 3 6 10000 121 0 8 10500 108 0 7 17000 4 4 2 32000 26 1 4 35000 22 1 3 52000 5 1 2 100000 1 1 0 100000 1 1 0 100000 65 0 0 cji = #(T ti, T WBCj) pod / c = E cji = 33 dp = #(! ti, T WBCj) pod / d = £4/ = 101 "("-1) _ 17x16 2 — 2 9=M = -°-5 ^] = SSt| = 0.032 zp = -0.5/VOÖ32 = -2.801 p-hodnota=0.005 75/120 Stanislav Katina Analýza prežívania 76/120 □ s Stanislav Katina Analýza prežívania Testy na porovnanie viacerých kriviek prežívania Cuzick test Označenia • nech Rjj je poradie Xp v združenom NV a nech sy/ je skóre prislúchajúce NV, do ktorého Xy/ patrí Cuzickova štatistika ^EE5/^ 7=1 i=1 Realizácia Sc je sc = Eyti E"ii sy/0/- Stanislav Katina Analýza prežívania Testy na porovnanie viacerých kriviek prežívania Cuzick test Stredná hodnota Eo [SC] = (E E [Z] = l/i (n + 1) E [Z], kde E [Z] = Ylj=-\ zjPj' k Je počet skupín, z,y = z, = j, pj = rij/n Rozptyl Var[Sc] /ŕ(/7+1) Var [Z] 12 kde Var[Z] = J2l,zfPj-(E [Z])2 Cuzickova testovacia štatistika ^Vár^[šc] Realizácia Zc je zc. 78/120 Stanislav Katina Analýza prežívania Testy na porovnanie viacerých kriviek prežívania Spearmanov korelačný koeficient Ak máme v pozorovaniach zhody, potom Cuzickova testovacia štatistika Žc= sc-Eq[Sc] g a/(q,1) VV^]-7<ŕi)Ey^(y n j = # pozorovaní vo všetkých výberoch napravo od y'-teho výberu, Mk = 0 • Lj - Mj g (-n, n) 9 Rj je priemerné poradie pre y'-ty výber Le štatistika SL = "£nj(Lj-Mj)Řj y'=i Realizáciu S/, ozn. sl = Ylj=-\ nj {lj ~ mj) ô- Eo [SL] = 0 Stredná hodnota Rozptyl VaMŠL] = r^-^J2nj{Lj-Mj) y'=i Le testovacia štatistika Zl=Sl-E0[Sl]vn{0 1} Var0 [Si. Realizáciu Zi ozn. Zi. 83/120 Stanislav Katina Analýza prežívania 84/120 Stanislav Katina Analýza prežívania Testy na porovnanie viacerých kriviek prežívania Zovšeobecnenia Testy na porovnanie viacerých kriviek prežívania Príklad Testovacia štatistika odklonu od trendu okw--,-_ ~ Xk-2 Var [SL] Všeobecný tvar štatistiky k sA = '^2 njsjRji y'=i kde rij sú rozsahy jednotlivých NV, Sj skóre prislúchajúce jednotlivým NV a Rj sú priemerné charakeristiky polohy prislúchajúce jednotlivým NV Potom {SA - Eq[Sa\) v 2 Example (nádor pfúc pokrač.) Nech tjj, i = 1,..., rijj = 1,2 sú časy do zlyhania (úmrtia) od diagnostiky nádoru pfúc v mesiacoch, kde j = 1 predstavuje I. typ terapie ay = 2 zasa II. typ terapie (pozri tabuľku). Otestujte H0 : Si (ř) = S2 (ŕ), alternatíva H : Si (ŕ) ± S2 {t). Použite (1) Skw, (2) Sj, (3) Sc a (4) S/.. Vždy presne naformulujte H-|. Prečo nemôžeme testovai odkolon od trendu? Aký je vzfah medzi týmito testovacími štatistikami a testovacími štatistikami Sw a SMw pre dva výbery? tii 52 240 19 53 15 43 340 133 111 231 378 49 skup 1 2 2 1 1 2 2 1 1 2 1 1 Var0 [SA] Realizáciu ZA ozn. zA. 85/120 Stanislav Katina Analýza prežívania Testy na porovnanie viacerých kriviek prežívania Príklad Stanislav Katina Analýza prežívania Testy na porovnanie viacerých kriviek prežívania Príklad Rozdefme AG-pozitívnych pacientov do troch skupín nasledovne • Skupina 1: WBC > 100000, /71 = 3,(1,1, 65) 9 Skupina 2: WBC g (10000,100000), n2 = 6, (108, 121, 4, 26, 22, 5), a Skupina 3: WBC < 10000, n3 = 8, (65, 156, 100, 134, 16, 39, 143, 56) fíi = 4.50, R2 7.833, R3 11.5625 S^=7^TyEyÍl^-3(A7+1) = tť^š [3 x 4.52 + 6 x 7.8Š32 + 8 x 11.56252 4.762662, p-hodnota= 0.0924 3x18 E/.1 nj M,) Rj sk.1 1 1 sk.2 - - 4 5 - 22 26 sk.3 - - - 16 - - 39 poradie 1.5 1.5 3 4 5 6 7 8 sk.1 - 65 - - - - - - sk.2 - - - 108 121 - - - sk.3 56 65 100 - - 134 143 156 poradie 9 10.5 12 13 14 15 16 17 3x(0-14)x4.5+6x(3-8)x7.833+8x(9-0)x11.5625 = 408.5 Var [Si] 17(17+1) Mi 12 Z^y=l "j [Lj — [3 x (0 - 14)2 + 6 x (3 - 8)2 +8 x (9-O)2] = 187.99732 ZL = 408.5/187.9973 = 2.172903, p-hodnota=0.0298 Skw - {ZLf = 4.762662 - 2.1729032 = 0.0412, p-hodnota=0.8392 87/120 Stanislav Katina Analýza prežívania 3/120 Stanislav Katina Analýza prežívania Testy na porovnanie dvoch kriviek prežívania Cenzurované dáta-prehíad Testy na porovnanie dvoch kriviek prežívania Cenzurované dáta-prehíad Tarone a Ware (1977) trieda váh (Cochran, 1954; Mantel a Haenszel, 1959; Armitage, 1966) Q konštantný rozdiel v logitovej škále f(p) = In potom váhy w(t) = 1 9 konštantný rozdiel v aritmetickej škále: f(p) = p, potom váhy w(t) = (1/7(0 x (1 -1 / Vír)))"1 = Y2(t)/(Y(t)-1) « Y(t) O konštantný rozdiel v arcsin škále: f(p) = arcsin y/p, potom sú váhy rovné w(t) = ^ ~ \jY{t), kde p, = 1 /Y(t) a V(ŕ) počet osôb v riziku v združenom výbere v čase t Vo všeobecnosti môžeme váhy zapísai ako w(t) = g(Y(t)/n) Harrington a Fleming (1982) trieda váh w(t) = Sp(t),p> 0 O P = 0, a teda w(ŕ) = Š°(ŕ) = 1 (Cox-Mantel test alebo log-rank test; Cox, 1972; Mantel, 1966) Q P = 1, a teda w(ŕ) = Š1 (ŕ) = Š(ŕ) (Gehan-Wilcoxon test alebo Peto-Peto-Wilcoxon test, Gehan, 1965; Peto a Peto, 1972) 89/120 Stanislav Katina Analýza prežívania Testy na porovnanie dvoch kriviek prežívania Cenzurované dáta-prehíad 90/120 Stanislav Katina Analýza prežívania Testy na porovnanie dvoch a viac kriviek prežívania Kontingenčné tabuľky Formálna formulácia Testovacia štatistika na porovnanie dvoch kriviek prežívania T(w,t) = Y,Wj(d,j-dj^-),L=l 1. 5/120 Stanislav Katina Analýza prežívania Testy na porovnanie dvoch kriviek prežívania Prehľad testov Testy na porovnanie dvoch kriviek prežívania Prehľad testov • marginálne početnosti v tab., nu, n2i a d, sú náhodné premenné závislé iba na minulosti pred časom t, 9 Mantel a Haenzel (1959): rozdelenie pozorovaní (realizácií) v bunkách KT podmienené pozorovanými marginálnymi početnosťami (d,, a,-, nu, n2i) za platnosti • to implikuje rozdelenie iba jednej bunky, du, pretože ostatné početnosti sú íahko odvoditefné od marginálnych o za platnosti nulovej hypotézy, H0, rozdelenie du je hypergeometrické, teda (nV)( "2/ ) Pr(d,i\di,ai,n,i,n2J)=^)d^ o v tejto forme H0 o rovnosti kriviek prežívania implikuje nezávislosť výberu a statusu (nažive alebo zlyhanie) Za platnosti H0 9 očakávaná (stredná) hodnota E0 [du] = nM%, 9 rozptyl VarQ[du] (i - * n, \ m nj-nij\ ihinziSidi J W-1) Informáciu o KT v čase nám dá nasledovný vztah Xi 2 _ [dy- EQ[dy]] v 2 Var0[du] Stanislav Katina Analýza prežívania Testy na porovnanie dvoch kriviek prežívania Prehľad testov Stanislav Katina Analýza prežívania Testy na porovnanie dvoch kriviek prežívania Prehľad testov Pre všetky tabufky (/' = 1,2,/) píšeme / U = ^2(d,i-E0[d,i}). /=1 E0 [t7] = 0, Var0 [U] = £ Var0 [du] = £ nuihiajdj Ak máme fixované d-,, nu, n2i, potom platí (Mantel a Haenzel, 1959) 2 Q Q (dy-E0[dy}) U2 v Eli Var0[du (U-E0[U])2 Var0 [U] U-E0 [U] v Xdf, cŕŕ = 1. 3/120 ~ XyZQ VaroiU] \JVar0[U] □ s1 Stanislav Katina Analýza prežívania /v(0,1). Majme váhy w, asociované s KT v čase ŕ,-, potom U = yž2wi(du-E0[du}). /=1 E0 [t7] = 0, Var0 [U] = £ w2Var0 [du] = £ wj 2 nun2iaidi /=1 Ak máme fixované dj, nu, n2j, potom platí (Mantel a Haenzel, 1959) Q=(U-JM)22xlZQ=u-Eolu]vN{^h Var0 [U] Var0 [U] 100/120 Stanislav Katina Analýza prežívania Testy na porovnanie dvoch kriviek prežívania Prehľad testov Testy na porovnanie dvoch kriviek prežívania Prehíad testov v © Podfa výberu váh w, rozoznávame nasledovné typy testov: 9 ak Wj = Dj, Q = Qqw, ide o Gehan-Wilcoxon test (zovšeobecnený Wilcoxonov test; Gehan, 1965), ktorý môžeme zredukovai na Wilcoxonovu štatistiku pri absencii cenzúr [TW trieda (2)] 9 ak i/v, = 1, Q = Qcm, ide o Cox-Mantel test (log-rank test; Mantel a Haenzel, 1959) [TW trieda (1) a HF trieda (1)] a ak Wj = yfh~j, Q = QTw, ide o Tarone-Ware test (Tarone a Ware, 1977) [TW trieda (3)] 9 ak Wj = Spooled {ti) = nM O = Opp, ide o Peto-Peto test (Peto a Peto, 1972; Prentice, 1978) [HF trieda (2)] surv.test <- survdiff(Surv(cas,status)~x,rho=0) Argumenty: O typ testu • rho=0 (QMH) • rho=l (Qpp) Výstupy objektu surv. test sú nasledovné: O n - počet pozorovaní n v každej skupine 9 obs - počet udalostí v každej skupine (cŕi a cfe ) Q exp - počet očakávaných udalostí v každej skupine E0[di] a Eo[d2] O var - rozptyl alebo kovariančná matica Var0[U] Stanislav Katina Analýza prežívania Stanislav Katina Analýza prežívania Testy na porovnanie dvoch kriviek prežívania Odhad relatívneho rizika 9 Veličina U podelená jej rozptylom Var0 [U] nám dáva podfa práce Peto (1976) U Var0 [U] ako maximálne vierohodný odhad log 9. Táto štatistika má rozptyl rovný Var0 In0f = (Var0[U\) -1 preto obojstranný 100 (1 - a) % interval spoľahlivosti pre log 9 (na základe asymptotickej normality) bude rovný potom 103/120 {lnf5P : \n9P±za/2X/Var0[U}}, [9p : f5Pexp (±Za/2X/Var0[UÝj } □ Stanislav Katina Analýza prežívania Testy na porovnanie dvoch kriviek prežívania Odhad relatívneho rizika 9 Podľa Mantel a Haenzela (1959), odhadneme 9 nasledovným spôsobom £-w=1 n. 1 n/ z^/=1 E/=1 Ri ^± kedy tento odhad môžeme písaí ako vážený priemer odhadu pomeru šancí zlyhania {O R j) pre každú kontingenčnú tabulku, teda kde W; — 7MH ORj = 1 --h Eli WjORj di/("2/-d2/) d2/(ni/-di/)' 1 n2i (1 -Pv)hi, — Pží — ^ sú podmienené pravdepodobnosti zlyhania. "i; 104/120 Stanislav Katina Analýza prežívania Testy na porovnanie dvoch kriviek prežívania Odhad relatívneho rizika 9 Testy na porovnanie dvoch kriviek prežívania Odhad relatívneho rizika 9 -1 Prvá časí + ^ j ukazuje, že väčšie váhy zodpovedajú väčším rozsahom n1(- a/alebo n2i. Sato (1990) odvodil 100(1 - a)% interval spoľahlivosti pre 0 ako riešenie kvadratickej rovnice (fí+ - 0s+y 9W+ — z; a/2' kde W+ cIm (n2i - d2i) (riM - dVl + d2i + 1) + d2i (n1(- - cy (n2i - d2i + + 1) /=1 /=1 Riešením vyššie uvedenej rovnice dostaneme 2R+S+ + z2a/2W+ ± J[AR+S+ + zll0W+) zil0W_ /n? /2VV+J V + 2S\ Du "i Ak nemáme zhody v čase ŕ,, potom cŕ,- = 1 a du - E0 [c/1(] = 1 ak je zlyhanie pozorované v prvej skupine, alebo ak je zlyhanie pozorované v druhej skupine a korešpondujú príspevkom do R+, resp. S+. Ak rozptyl Var0 [c/1(] = úl^, ľahko sa dá vidieí, že Var0 [c/1(] korešponduje s w-, a výpočet IS pre 9 má členy, ktoré sa vyskytujú aj v Qmh- Simulačně Monte-Carlo štúdie ukázali, že pravděpodobnost pokrytia tohoto približného IS je veľmi podobná očakávanej pravdepodobnosti pokrytia. Stanislav Katina Analýza prežívania Stanislav Katina Analýza prežívania Testy na porovnanie dvoch kriviek prežívania Odhad relatívneho rizika 9 Alternatívou ku 9MH\e nasledovný odhad (Anderson a Bernstein, 1985) El duri2i /=1 n, 2^/=i n. kde ide o vážený priemer odhadovaného pomeru zlyhaní v dvoch skupinách s váhami ... Wi — -. n; Ak máme konštatnú proporcionalitu rizika cez všetky časy (9 sa nemení časom), 9MH a aj 9*MH odhadujú túto konštantu. Ak máme nekonštantnú proporcionalitu rizika 0,-, 9MH a aj 9*MH dávajú vážený priemer 0,-. Ak máme konštatnú proporcionalitu rizika cez všetky časy (0 sa nemení časom), 9MH a aj 9*MH odhadujú túto konštantu. Ak máme nekonštantnú proporcionalitu rizika 0,-, 9MH a aj 9*MH dávajú vážený priemer 0,-. Testy na porovnanie dvoch kriviek prežívania Príklad Example (dvojvýberové testy) Majme dáta z klinickej štúdie zhrnuté v nasledovnej tabul'ke (pozri tabuľku), (a) Vytvorte kontingenčné tabuľky v každom čase zlyhania /)■,/'= 1,2,..., 7 použitím celkového počtu subjektov v riziku n, v čase ŕ,, celkového počtu zlyhaní d, v čase tj, celkového počtu subjektov prvej skupiny v riziku n^-, v čase t; a celkového počtu zlyhaní d^ subjektov prvej skupiny v čase ŕ,. (b) Vypočítajte stredné hodnoty E0[d-n], rozdiely empirických a očakávaných početností d^ - £b[c/i;], ako aj rozptyly Var0[d^i\. (c) Otestujte H0 : Ai (ŕ) = A2 {t) oproti : Ai (ŕ) = 6\2 {t) pomocou testovacích štatistík Qqw, Qcm, Qtw a Qpp- (d) Nakreslite Kaplan-Meierove odhady funkcie prežívania pre obe skupiny do jedného obrázka, (e) Vypočítajte (1) 9P, Var\9MH] a 95%/S pre bp, (2) bmh a 95%/S pre bmh a (3) 9*MH. I -00,0 107/120 Stanislav Katina Analýza prežívania 108/120 Stanislav Katina Analýza prežívania Testy na porovnanie dvoch kriviek prežívania Príklad Testy na porovnanie dvoch kriviek prežívania Príklad ti rii d. rhi d m E0[du] du-Eo[du] Var0[du] 3 10 1 5 1 0.50 0.50 0.2500 5 9 1 4 1 0.44 0.56 0.2469 7 8 1 3 1 0.38 0.62 0.2344 12 6 1 1 0 0.17 -0.17 0.1389 18 5 1 1 1 0.20 0.80 0.1600 19 4 1 0 0 0.00 0 0 20 3 1 0 0 0.00 0 0 suma 4 1.69 2.31 1.0302 Q = 2.312/1 0302 = 5.179674 p-hodnota=0.02285261 zQ = ^2.312/1.0302 = 2.275890 p-hodnota=2 x 0.01142630 = 0.02285259 109/120 Stanislav Katina Analýza prežívania Testy na porovnanie viacerých kriviek prežívania Prehľad testov Example (dvojvýberová situácia) (1) Nakreslite (a) kumulatívne riziko AKMj(t), (b) kumulatívne riziko ÁNAj(t), (c) Kaplan-Meierove krivky prežívania S~KMj{t) a (d) Breslowove krivky prežívania S~Bj{t),j =1,2 (vždy po dvojiciach do jedného obrázka). (2) Otestujte H0 : Ai (ŕ) = A2 (t) oproti H : Ai (ŕ) = 6x2 (t) pomocou testovacích štatistík QMH a Qpp. Použite funkcie survdiff () s argumentami rho=0 (Qmh) a rho=l (Qpp). (3) Otestujte H0 : \, (t) = A2 (ř) oproti H, : \, (t) = bx2 (ŕ) pomocou testovacích štatistík Qqw, Qcm, Qtw a Qpp. (4) Vypočítajte (a) 9p, Var[6p] a Waldov 95% IS pre 9p, (b) 6mh a Waldov 95% IS pre bmh a (c) 9*mh. 110 /120 Stanislav Katina Analýza prežívania Testy na porovnanie viacerých kriviek prežívania Prehíad testov Testované hypotézy H0 : x, (t) = x2(t) = ... = xk (t) H-i : 3 aspoň jedno / < y, A; (ŕ) / Ay (t) Pre každé t,, 1 < i < I, môžeme dáta zapísat do KT 2 x k status/výber 1 2 • j ... k spolu v tj zlyhanie v ŕ, dM d2i ■ dj, ... dki di nažive v case t. au- a2j .. • aß ... akj v riziku pred časom t. riM n2i .. ■ říj. ... nki n. a, = ^2 j 3jí = n j — dj, aj j n i = Ey nji di = Ejdji = nji - dp Za platnosti nulovej hypotézy a fixovaných marginálnych početnostiach sa dá ukázai, že počet zlyhaní v k výberoch má hypergeometrické rozdelenie s dimenziou k - 1 so strednou hodnotou £0 [dji\ Potom njijj; v čase ŕ; u = Eu, /=1 kde U, je vektor merajúci rozdiel medzi pozorovaným a očakávaným počtom zlyhaní v čase ŕ; a je definovaný ako / Um \ ( dM-E0[dM] \ 111/120 Stanislav Katina Analýza prežívania 112/120 Uji dji - E0 [dji] V Uk_Mi ) V dk_Mi~E0 [dk-Mi] J Stanislav Katina Analýza prežívania Testy na porovnanie viacerých kriviek prežívania Prehľad testov Testy na porovnanie viacerých kriviek prežívania Prehfad testov Kovariančná matica V (ŕ/) s komponentami v časoch t, je daná nasledovne {V{ti))is = Cov[d!hdsi\ rtf(n,-1) r pre//s ! kde /, s = 1,2,..., k - 1. Potom, ak berieme do úvahy všetky časy zlyhania, dostaneme / Testovacia štatistika QWera// = UrV-1u£xLi Ak k = 2, štatistika Qovera// = Qcm- 113/120 Stanislav Katina Analýza prežívania Testy na porovnanie viacerých kriviek prežívania Prehľad testov V prípade pridania váh wt v čase t, bude platii u„ = X>U/ = £u!"')' kde U-1^ je vektor merajúci vážený rozdiel medzi pozorovaným a očakávaným počtom zlyhaní v čase ŕ; a je definovaný ako í U^ \ í Uy, \ í dri-E0[dy] \ U (w) Wj Un \ Uk-^i j Wj dp - E0 [dp] \ dk-u-E0 [dk-u] J Stanislav Katina Analýza prežívania Testy na porovnanie viacerých kriviek prežívania Prehľad testov Pre kovariančnú maticu bude platif Vw = ^2wjV(tj). Nakoniec bude testovacia štatistika rovná urv 1u £ v2 Voľba váh je nasledovná: • ak Wj = rij, potom Q = Qqb a ide o zovšeobecnený Wilcoxonov test (zovšeobecnený Kruskal-Wallis test, Gehan-Breslow test) [TW trieda (2)] • ak w/ = 1, potom Q = QCM a ide o Cox-Mantel test (log-rank test) [TW trieda (1)] • ak Wj = ^JTľj, potom Q = QTw a ide o Tarone-Ware test) [TW trieda (3)] • ak Wj = Š (tr)p, p = 0, potom Q = QMH a ide o Mantel-Haenszelov test (log-rank test) [HF trieda (1)] • ak Wj = Š (tr)p, p = 1, potom Q = QPP a ide o Peto-Peto-Wilcoxon test [HF trieda (2)] 115 /120 Stanislav Katina Analýza prežívania 116 /120 Stanislav Katina Analýza prežívania Testy na porovnanie viacerých kriviek prežívania Test trendu Test nulovej hypotézy oproti stochasticky usporiadanej alternatíve je testom trendu, kde testujeme zoradený vziah medzi k funkciami prežívania definovanými v zmysle vektora váh 6 = ((9-i, 02,.. •, Oj, ■ ■ ., 0k)T, potom H0 : A-i (r) = X2(t) = ... = Xk (t) a H Ai (0 = M*(0> a2 (0 = o2xk (t), Xj(t) = 0jXk(t), A/c-1 (t) = Ôk^Xk(t), kde bez straty na všeobecnosti môžeme predpokladať, že 0* = 1. 117/120 Stanislav Katina Analýza prežívania Testy na porovnanie viacerých kriviek prežívania Príklad Testy na porovnanie viacerých kriviek prežívania Test trendu Testovacia štatistika pre trend bude daná nasledovným vziahom (Vu*N' Qtrend a po zložkách Qtrend oTv*o (E,tifl/EU4/-frK-]])2 EL, "0{j:U WKÍEjL,°Mdß]Y kde U* je U doplnené o /c-ty element. Ďalej V* počítame tak ako V, ale s tým rozdielom, že ide o maticu k x k. Ak sú váhy lineárne, napr. Oj = j, potom hovoríme o teste lineárneho trendu. Platí Qresidual = Qoverall ~ Qtrend ~ Xk-2- 118/120 Stanislav Katina Analýza prežívania Testy na porovnanie viacerých kriviek prežívania Príklad Example (trojvýberová situácia) Majme experiment, kde sme mali 3 rôzne koncentrácie látky (konci = 2.0, konc2 = 1.5 a kone?, = 0) a hľadali sme jej účinok na pacientov, u ktorých sme sledovali objavenie sa nádoru (pozri tabufku). (1) Nakreslite (a) kumulatívne riziko Akm,j{í), (b) kumulatívne riziko ÁNAj(t), (c) Kaplan-Meierove krivky prežívania S km,j (t) a (d) Breslowove krivky prežívania SB,j{t),j = 1,2,3 (vždy po trojiciach do jedného obrázka). (2) Otestujte (a) H0 : Ai (ŕ) = A2 (t) = A3 (t) oproti H : 3 aspoň jedno / < j, A, (ŕ) / Ay (ŕ) pomocou testovacích štatistík Qqw, Qcm, Qtw a QpP; (b) H0 : \, (t) = X2 (t) = X3 (t) oproti \, (t) = #1A3 (ř), A2 (r) = 02A3 (r), kde 0/ = koncj, y = 1,2 (test trendu) pomocou testovacej štatistiky Qtrend- Pozn.: časy do zlyhania alebo cenzúry; + znamená cenzúra, n0 — # pozorovaní v ŕ0, koncj je koncentrácia látky v skupine j koncj "0 2.0 10 41 + 41 + 47 47+ 47+ 58 58 58 100+ 117 1.5 10 43+ 44+ 45+ 67 68+ 136 136 150 150 150 0 9 73+ 74+ 75+ 76 76 76+ 99 166 246+ 119/120 Stanislav Katina Analýza prežívania 120/120 Stanislav Katina Analýza prežívania