Aké otázky v analýze prežívania riešime? Príklady z praxe Analýza prežívania (Survival analysis) Handout ku prednáškam Stanislav Katina 1 Ústav matematiky a štatistiky Prírodovedecká fakulta Masarykova univerzita jarný semester 2016 Verzia 1. júna 2016 Stanislav Katina Analýza prežívania (Survival analysis) Otázky v analýze prežívania v aplikáciách Príklady - infarkt myokardu Prežívanie pacientov po infarkte myokardu (IM) v rámci sekundárnej prevencie závažných kardiovaskulárnych problémov u pacientov s polymorfizmom glykoproteínu IV (GP VI13254C/T) v membráne krvných doštičiek. [Thrombosis Research 125, 2: 61-4, 2009] 105 pacientov sledovaných v priemere 19 (±10.8) mesiacov Stanislav Katina Analýza prežívania (Survival analysis) 9 Odhadujeme a interpretujeme funkciu prežívania a riziko • Porovnávame funkcie prežívania a riziká • Charakterizujeme čas prežívania • Modelujeme vztah medzi vysvetľujúcimi premennými a časom prežívania Stanislav Katina Analýza prežívania (Survival analysis) Otázky v analýze prežívania v aplikáciách Príklady - infarkt myokardu Zlyhania: smrt, ďalší IM, ďalšia selektívna koronarografia (SKG: percutaneous coronary intervention (PC/, coronary angioplasty), coronary artery bypass graft (CABG)), ďalša cievna mozgová príhoda (CMP; stroke), ďalšia hospitalizácia (re-intervencia); sledované kombinácie: smrť/lM/re-intervencia a smrt/IM/re-intervencia/CMP [MACE; Major Adverse Cardiac Events, hlavné nepriaznivé srdcové udalosti] Adjustujúce (rizikové) premenné: O pohlavie (žena=0, muž=1) Q hypertenzia (nie=0, áno=1) Q hyperlipidémia (nie=0, áno=1) O fajčenie (nefajčiar=0, fajčiar a bývalý fajčiar=1) Q diabetes (nie=0, áno=1) Q srdcové zlyhanie (NYHA; New York Heart Association; Classes: I = 0; II, III, IV = 1) Stanislav Katina Analýza prežívania (Survival analysis) Otázky v analýze prežívania v aplikáciách Príklady - ortopédia, slovenský artroplastický register Otázky v analýze prežívania v aplikáciách Príklady - ortopédia, slovenský artroplastický register Analýza prežívania implantátov bedra a kolena na Slovensku v rokoch 2003-2011. [Acta Chir. Orthop. Traum. Čech. 80: 1-85, 2013] 49 668 operácií (primárnych operácií a revízií) zo všetkých slovenských ortopedických kliník za roky 2003-2011: • 38 485 THA (Total Hip Arthroplasty) • 11 183 TKA (Total Knee Arthroplasty) Stanislav Katina Analýza prežívania (Survival analysis) Stanislav Katina Analýza prežívania (Survival analysis) Otázky v analýze prežívania v aplikáciách Príklady - ortopédia, slovenský artroplastický register Otázky v analýze prežívania v aplikáciách Príklady - chronická myeloidná leukémia Zlyhania: zlyhanie komponentu implantátu Adjustujúce (rizikové, prognostické) premenné: Q typ komponentu (acetabulárny=0, femorálny=1) Q fixácia komponentu (necementovaný=0, cementovaný=0) O pohlavie (žena=0, muž=1) Q cementovacia technika (necementovaný=0, generácia cementu 1 = 1, generácia cementu II = 2, generácia cementu III = 3) Q diagnóza pri primárnej operácii (primárna coxartróza = 1, dysplastická coxartróza = 2, poúrazová coxartróza = 3, aseptická nekróza hlavy = 4, M.Perthes = 5, reumatoidná artritída = 6, zlomenina krčku = 7) 0 dôvod revízie (spolu 18 dôvodov) O revidované časti (spolu 19 časti") a pod. Prežívanie pacientov s chronickou myeloidnou leukémiou (CML). [Neoplasma, 92, 5: 381-7, 2005] 589 pacientov s CML, z ktorých 78 absolvovalo transplantáciu krvotvorných kmeňových buniek kostnej drene (allogeneic transplantation; transplantácia od HLA-identického súrodenca alebo nepríbuzného darcu; HLA znamená human leukocyte antigen) a zároveň majú odobrané vzorky periférnej krvi a kostnej drene pred a po transplantácii na Katedre genetiky Národného onkologického ústavu v Bratislave v rokoch 1990 až 2002 Stanislav Katina Analýza prežívania (Survival analysis) Stanislav Katina Analýza prežívania (Survival analysis) Otázky v analýze prežívania v aplikáciách Príklady - chronická myeloidná leukémia Klasický prístup vs. analýza prežívania Príklady - akútna myelogénna leukémia Zlyhania: úmrtie pacienta Adjustujúce (prognostické, rizikové) premenné: Q vek pacienta v čase transplantácie (skupina 1: <20 rokov, skupina 2: [20,40), skupina 3: >40) Q fáza CML (spolu dve fázy; prvá chronická fáza = 1, ďalšie chronické fázy = 2) Q pohlavie darcu a príjemcu (m-m, m-ž, ž-m, ž-ž) Q čas od diagnózy po transplantáciu (< 1 rok, > 1 rok) Stanislav Katina Analýza prežívania (Survival analysis) Klasický prístup vs. analýza prežívania Príklady - akútna myelogénna leukémia Sk čas po kompletnú remisiu (v týždňoch) n udalostí cenzúr A 9,13,13+, 18,23,28+, 31,34,45+, 48,161 + 11 7 4 B 5,5, 8, 8,12,16+, 23,27, 30, 33,43,45 12 11 1 (číslo = čas do zlyhania, číslo a plus (+) = čas do cenzúry) Stanislav Katina Analýza prežívania (Survival analysis) Example Akútna myelogénna leukémia (acute myelogenous leukemia, AML). Po absolvovaní chemoterapie a zmiernení príznakov, boli pacienti náhodne rozdelení do dvoch skupín. Prvá skupina (skupina A) dostala udržujúcu chemoterapiu a druhá (kontrolná; skupina B) nie. Ciefom bolo zistií, či udržujúca chemoterapia predlžuje čas do remisie (opätovného zhoršenia stavu). Stanislav Katina Analýza prežívania (Survival analysis) Klasický prístup vs. analýza prežívania Tri náhíady na problém analýzy AML dát O problém 1: po odstránení cenzurovaných pozorovaní O problém 2: po ošetrení cenzurovaných pozorovaní, ktoré zoberieme do úvahy akoby boli udalostami (zlyhaniami) O problém 3: berúc do úvahy cenzurované pozorovania Stanislav Katina Analýza prežívania (Survival analysis) Klasický prístup vs. analýza prežívania Tri náhíady na problém analýzy AML dát Klasický prístup vs. analýza prežívania Príklady - cystická fibróza problém 1 problém 2 problém 3 A B A B A B x 25.1 21.7 38.5 21.3 52.6 22.7 x 23.0 23.0 28.0 19.5 31.0 23.0 (čísla sú v týždňoch) Stanislav Katina Analýza prežívania (Survival analysis) Klasický prístup vs. analýza prežívania Príklady - cystická fibróza skupina/počty typická forma CF atypická forma CF spolu živí 259 188 447 zomrelí 112 0 112 spolu 371 188 559 Stanislav Katina Analýza prežívania (Survival analysis) Example Cystická fibróza (CF) je autozomálne genetické ochorenie spôsobené mutáciou génu pre CFTR (cystic fibrosis transmembrane conductance regulátor). Postihuje prevažne pfúca, ale aj pankreas, pečeň a črevo. V celoslovenskej databáze pacientov CF rozlišujeme pacientov s jasnou klinickou formou (typická forma, 259 živých, 112 zomrelých) a pacientov s atypickou formu (188 živých). Spolu teda 559 pacientov, 447 živých a 112 zomrelých. Aký je priemerný vek (prežívania) a medián (prežívania) v rokoch? Stanislav Katina Analýza prežívania (Survival analysis) Klasický prístup vs. analýza prežívania Príklady - cystická fibróza problém 1 problém 3 typická CF typická CF x 9.22 45.05 x 4.90 52.26 (čísla sú v rokoch) rozdiel problému 1 a 2 - rozdiel medzi priemerným vekom prežívania pacientov s typickou formou CF a priemerným vekom úmrtia je 35.83 roka (podobne pre medián je tento rozdiel 47.36 roka) problém 1 - empirický 95% IS Waldovho typu pre strednú hodnotu veku úmrtia je (7.02,11.41) a pre medián veku úmrtia (2.72,7.08) Stanislav Katina Analýza prežívania (Survival analysis) Klasický prístup vs. analýza prežívania Príklady - cystická fibróza Klasický prístup vs. analýza prežívania Príklady - cystická fibróza priemerný vek prežívania pre všetkých pacientov bez rozdielu typu CFje 53.94 ±2.10 rokov, kde empirický 95% IS Waldovho typu pre strednú hodnotu veku prežívania je rovný (49.82,58.06) medián prežívania pre všetkých pacientov bez rozdielu typu CFje 70.82 roka; empirický 95% IS Waldovho typu pre mediánu prežívania zatiaf nie je možné vypočítai priemerný vek prežívania pre pacientov s typickou formou CF je 45.05 ± 2.47 rokov, kde empirický 95% IS Waldovho typu pre strednú hodnotu veku prežívania je (40.21,49.89) medián prežívania je 52.26 roka, dolná hranica empirického 95% IS Waldovho typu pre medián prežívania je 36.43 roka; hornú hranicu IS pre medián zatiaf nie je možné vypočítat Krabicový diagram zomreli pacienti s CF Stanislav Katina Analýza prežívania (Survival analysis) Stanislav Katina Analýza prežívania (Survival analysis) Klasický prístup vs. analýza prežívania Príklady - cystická fibróza Klasický prístup vs. analýza prežívania Príklady - cystická fibróza Tabuľka: Početnosti zomrelých v päíročných vekových intervaloch (n = 112). Označenia: vekové intervaly (zdola je interval otvorený a zhora uzavretý, okrem prvého, ktorý je aj zdola uzavretý): h = (0,5), h = (5,10), /3 = (10,15), U = (15,20), k = (20,25), k = 25,max(vek)). Rozptylový graf a vyhladzovací splajn: typická Torma CF vekové intervaly /i h h U /s k početnosti 56 11 16 13 11 5 percentá 50% 9.82% 14.29% 11.61% 9.82% 4.46% D70 1930 1990 2000 2C13 Stanislav Katina Analýza prežívania (Survival analysis) Stanislav Katina Analýza prežívania (Survival analysis) Klasický prístup vs. analýza prežívania Príklady - cystická fibróza Událost Úvodné definície Ďalšie možné otázky Zlyhanie: smrť Adjustujúce (prognostické) premenné: antropologické ukazovatele, funkčné charakteristiky pfúc a pod. Stanislav Katina Analýza prežívania (Survival analysis) Udalosť: ukončenie pozorovania z dôvodu zlyhania alebo smrti pacienta - do konca sledovaného obdobia Príklady udalostí: • overall survival - smrť z akéhokofvek dôvodu • progression-free survival - prvé znaky progresie choroby alebo smrť • disease-free survival - prvé znovuobjavenie sa choroby alebo smrť • event-free survival - prvé znovuobjavenie sa choroby, objavenie sa inej špecifikovanej choroby alebo smrť o disease-specific survival (cause-specific survival) - smrť ako dôsledok špecifikovanej choroby • relapse-free survival (recurrence-free survival) - prvé znaky recidívy (opakovania sa) chodoby • time-to-progression - prvé znaky progresie choroby Stanislav Katina Analýza prežívania (Survival analysis) Cenúrovanie Úvodné definície Cenúrovanie Cenzurovanie I. typu Cenzúra: ukončenie pozorovania z dôvodu iného ako je zlyhanie alebo smrt pacienta - do konca sledovaného obdobia dôjde k úmrtiu len niektorých pacientov, zatiaf čo u ostatných k úmrtiu do konca sledovaného obdobia bud nedôjde alebo sa títo pacienti z pozorovania stratia Príklady cenúr: • ukončenie štúdie (termination of the study): pacient prežije časový interval experimentu • konkurenčné riziko (competing risk): pacient zomrie z iného dôvodu, ako v dôsledku sledovanej choroby • prerušenie/vysadenie liečby (drop-out): pacient preruší liečbu a odíde z kliniky predčasne, napr. z dôvodu zlých vedfajších účinkov liečby, pacient sa sám rozhodne nepokračovať v liečbe • strata z ďalšieho sledovania (loss to follow-up): pacient sa rozhodne presťahovať a nemáme o ňom už žiadne informácie Základné princípy: Q predpoklad - všetkých n jedincov vstupuje do experimentu súčasne Q príčina cenzurovania - plánované ukončenie experimentu Q ide o cenzurovanie časom - zvolíme pevné číslo ŕc, ktoré nazveme fixovaný cenzurujúci čas Q t<1> < t<2> < ... < TV\ kde r<"> < ŕc < t^1' Q náhodná veličina - počet skutočne pozorovaných zlyhaní de{0,1,...,n} Q nechXi,X2,...,Xn, kde X = mm (T,, tc Tj, T < tc, pre necenzurované X, tc, T > tc, pre cenzurované X O skutočnému pozorovaniu potom zodpovedá náhodný vektor (X,, 5,)T, kde 1, Ti < U, pre necenzurované X S,= 0, T > tc, pre cenzurované X Stanislav Katina Analýza prežívania (Survival analysis) Stanislav Katina Analýza prežívania (Survival analysis) Cenúrovanie Cenzurovanie II. typu Cenúrovanie Progresívne (zrýchlené) cenzurovanie I. typu Základné princípy: Q predpoklad - všetkých n jedincov vstupuje do experimentu súčasne Q príčina cenzurovania - plánované ukončenie experimentu O ide o cenzurovanie zlyhaním - zvolíme si pevné číslo d, ktoré nazveme fixovaný počet zlyhaní; ukončenie teda nastáva po vopred zvolenom počte d zlyhaní, kde d = [np] + 1,p e (0,1) O Xi = r<1>,x2 = r<2>,...,*, = T«\xd+, = r"",...x„ = r Q náhodná veličina - čas trvania experimentu T(d) Q nechX,X2,...,Xn, kde X = mm(Th V ■(d) \ T, T, < T(d), pre necenzurované X, T(d), 7} > T(d), pre cenzurované X, O skutočnému pozorovaniu potom zodpovedá náhodný vektor (X, 5,)T, kde 1, T,■ < T T(d), pre cenzurované X 5/ Stanislav Katina Analýza prežívania (Survival analysis) Základné princípy: Q predpoklad - všetkých n jedincov vstupuje do experimentu súčasne Q príčina cenzurovania - plánované ukončenie experimentu Q ide o cenzurovanie časom - zvolíme čísla tci,/' = 1,2,..., k, ktoré nazveme fixované cenzurujúce časy, v čase ŕ„ vyradíme m, subjektov O kí < tC2 < ■ ■ ■ < tok Q v čase ŕc1 vyradíme m-! subjektov, v čase ŕc2 vyradíme m2 subjektov,... v čase ŕc« vyradíme mk subjektov Q po /<-tom kroku máme vyradených m-! + m2 + ... + mk subjektov Q náhodná veličina - počet skutočne pozorovaných zlyhaní De{0,1,...,n} Stanislav Katina Analýza prežívania (Survival analysis) Cenúrovanie Progresívne (zrýchlené) cenzurovanie II. typu Základné princípy: O predpoklad - všetkých n jedincov vstupuje do experimentu súčasne Q príčina cenzurovania - plánované ukončenie experimentu 0 ide o cenzurovanie zlyhaním - zvolíme čísla d,, ktoré nazveme fixované počty zlyhaní; vyradenie teda nastáva po vopred zvolenom počte di zlyhaní, kde d, = [np,-] + 1,p, e (0,1) Q po di zlyhaniach vyradíme m-! subjektov, po d2 zlyhaniach vyradíme m2 subjektov,..., po d« zlyhaniach vyradíme mk subjektov 0 po /<-tom kroku máme vyradených m-! + m2 + ... + mk subjektov Q náhodná veličina - čas trvania experimentu T(dk) Stanislav Katina Analýza prežívania (Survival analysis) Cenúrovanie Náhodné a íubovoíné cenzurovanie Základné princípy: 0 predpoklad - n jedincov nevstupuje do experimentu súčasne 0 čas do zlyhania TUT2,... ,Tn sú nezávislé, rovnako rozdelené náhodné premenné, kde náhodná veličina 7/ (/' = 1,... ,n) má hustotu f (t) a distribučnú funkciu F (ŕ) O čas do cenzurovania C1; C2,..., C„ sú nezávislé, rovnako rozdelené náhodné premenné, kde náhodná veličina C, (/' = 1,..., n) má hustotu g (t) a distribučnú funkciu G (ŕ) O nechX,X2,...,Xn, kde X = min(T,,C,) Ti, Ti < C,, pre necenzurované X, C,, T > Cj, pre cenzurované X Q skutočnému pozorovaniu potom zodpovedá náhodný vektor (X, 5,)T, kde X = min(7/, C,) a 1, T,■ < C,, pre necenzurované X 0, T > Cj, pre cenzurované X S, Q náhodná veličina - čas trvania experimentu a čas do cenzúry (ak C, = c, ide o fubovofné cenzurovanie) Stanislav Katina Analýza prežívania (Survival analysis) Cenúrovanie Intervalové cenzurovanie I. typu Cenúrovanie Intervalové cenzurovanie II. typu Základné princípy: Majme n subjektov. Nech časy do zlyhania T,i = 1,2,... , n, sú náhodné premenné, ktorých realizácie nedokážeme pozorovať. Skutočnému pozorovaniu potom zodpovedá náhodný vektor (X,, 5,)T, kde X, = C, sú časy cenzúr a 5,- = l(T < C,), t.j. 5, = 1, 7/ < C, pre necenzurované X, 0, T, > C,, pre cenzurované X Example (nádor píúc, animálny model) Laboratórne myši sú injektované látkou, ktorá spôsobuje nádor. Kedže tento druh nádoru nie je smrteíný, je potrebné myš najprv zabií, aby sme zistili, či bol nádor indukovaný, t.j. po časovom úseku náhodnej dĺžky C je myš zabitá, aby sme zistili, či sa nádor vyvinul alebo nie. Endpoint záujmu je čas T do objavenia sa nádoru. Stanislav Katina Analýza prežívania (Survival analysis) Základné princípy: Majme opát n subjektov. Nech časy do zlyhania T,i = 1,2,... ,nú náhodné premenné, ktorých realizácie nedokážeme pozorovať. Vieme len, že T, nastalo buď vnútri nejakého náhodného časového intervalu, pred jeho ľavou hranicou alebo po jeho pravej hranici. Označme Cŕ1 a C2, časy dvoch vyšetrení a indikačné funkcie definujeme nasledovne 5(1 = /(T, < d), 5,2 = /(C,i < T< C,2) a = l(T > C,2), t.j. 5,1 5,2 = a nakoniec 5,3 = 0. 1, 7/ < C,i, pre necenzurované X 0, T, > Cŕ1, pre cenzurované X ' 1,Cŕ1 < T■ < C/2, pre necenzurované X 0, T > C,2, pre cenzurované X, Example (nádor píúc, pacienti) Pacienti navštevovali kliniku opakovane každých 4 až 6 mesiacov, kde pozorovania sú buď intervaly (Cn, C,2) ak sa retrakcia prsníka vyskytla medzi poslednými dvoma návštevami alebo (C,2, oo), ak sa do C,2 retrakcia nevyskytla. Stanislav Katina Analýza prežívania (Survival analysis Cenúrovanie Intervalové cenzurovanie II. typu Základné princípy: Máme nasledovné tri možnosti: Q udalosí mohla nastat niekedy pred prvým vyšetrením Cn, kde 5(1 = 1 a 5,2 = 5,3 = 0, Q udalosí mohla nastat niekedy medzi prvým a druhým vyšetrením, t.j. v intervale (d, C,2), kde 5(1 = 0, 5,2 = 1 a 5,3 = 0, Q udalosí sa do druhého vyšetrenia nevyskytla, t.j. mohla nastat niekedy po C,2 (ale nevieme kedy), kde 5(1 = 0, 5,2 = 0 a 5,3 = 0. NechXn = d aX2, = C2j. Skutočnému pozorovaniu potom zopovedá náhodný vektor (Xi, X21,5,1,5,2) . Všimnime si, že 5,3 nieje potrebné použit, pretože nemáme ďalšie vyšetrenie po C/2. Keby sme mali C,3 alebo aj ďalšie (po ňom nasledujúce) vyšetrenia, hovorili by sme zovšeobecnenom intervalovom cenzurovaní. Stanislav Katina Analýza prežívania (Survival analysis) Základné charakteristiky prežívania Názvoslovie, označenia, vzorce Nech 7 je nezáporná náhodná premenná (T > 0) reprezentujúca čas úmrtia (zlyhania) indivídua z homogénnej populácie. Rozdelenie pravdepodobnosti T môže byt charakterizované rôznym spôsobom. V analýze prežívania sa najčastejšie používajú: Q distribučná funkcia (distribution function) F (t) Q funkcia hustoty (hustota; probability density function) f (t) O funkcia prežívania (survivor function, reliability function) S(t) riziková funkcia (funkcia rizika, intenzita úmrtnosti, riziko; hazard function, hazard rate, risk, mortality rate) X(t), v poistných aplikáciách ^i(t) Q kumulatívna riziková funkcia (funkcia kumulatívneho rizika, kumulatívne riziko; cumulative hazard function) A(t) Stanislav Katina Analýza prežívania (Survival analysis) Základné charakteristiky prežívania Názvoslovie, označenia, vzorce Základné charakteristiky prežívania Názvoslovie, označenia, vzorce - spojitý prípad Ďalej sa budeme zaoberaí charakteristikami: O p-ty kvantil tp rozdelenia T, špeciálne medián času prežívania (median survival time, median survival) to.5 Q medián funkcie prežívania S(ŕo.s) Q stredná hodnota času prežívania (mean survival) ^1 Q stredná hodnota zostatkového života v čase t (mean residual life) mrl(t) Q medián zostatkového života v čase t (median remaining lifetime, median residual life) mrlt(t) Stanislav Katina Analýza prežívania (Survival analysis) Základné charakteristiky prežívania Názvoslovie, označenia, vzorce - spojitý prípad Riziková funkcia A(ŕ) = f (t) _ ftS(t) d = -■57 In S (ŕ) S (t) S (t) dt Kumulatívna riziková funkcia a (0 = ľ x (x) dx = -\nS (t) - (- In S (0)) = - In S (t) Jo Funkcia prežívania vyjadrená pomocou rizika a kumulatívneho rizika S{t) = e-^mds = e-A{t) Stanislav Katina Analýza prežívania (Survival analysis) Distribučná funkcia F(t) = Pr(T t) = J f(x)dx Stanislav Katina Analýza prežívania (Survival analysis) Základné charakteristiky prežívania Názvoslovie, označenia, vzorce - spojitý prípad Stredná hodnota času prežívania 11= \ S(t)dt a často aj ^ = / S (t) dt Jo Jo Stredná hodnota zostatkového života v čase t /~(u - t)f(u)du _ /~ S(u)du mr\(t) = E[T - t\T > t] = S(t) S(t) Stanislav Katina Analýza prežívania (Survival analysis) Základné charakteristiky prežívania Názvoslovie, označenia, vzorce - spojitý prípad Základné charakteristiky prežívania Názvoslovie, označenia, vzorce - diskrétny prípad Funkcia prežívania vyjadrená pomocou mrl(ŕ) mrl(O) / ŕ du s<ŕ> = ^exp(-./0SÍM Funkcia rizika vyjadrená pomocou mrl(ŕ) A(ŕ) = —mrl(ŕ) + 1 —-T7T dt J mrl(ŕ) Funkcia hustoty vyjadrená pomocou mrl(ŕ) f(t)-- d .... \ mrl(O) mrl(ŕ) + 1 ) -—exP dt {mň{t)Y t du o mrl(u) Stanislav Katina Analýza prežívania (Survival analysis) Základné charakteristiky prežívania Názvoslovie, označenia, vzorce - diskrétny prípad Stredná hodnota času prežívania / /-i M = J> - t,_,)S(t,_,) = £/,+i(S(ŕŕ) - S(ŕ/+1)), /=1 /=o kde to = 0 a / < n je počet rôznych zlyhaní; ak ŕmax < cmax, kde Cmax je maximálnym časom do cenzúry, potom strednú hodnotu počítame na intervale (0, cmax) Stredná hodnota zostatkového života v čase t (ŕ/+i-0s(ŕ/) + E;>/+i(í;+i-í;)S(ŕ;) mrl(ŕ) = kde tj (*,-) i:ti■ xSf(/c)1- ■<5/ i'=1 • cenzurovanie II. typu n\ n-d a náhodné cenzurovanie L = Hf(Xi)s'Sf(Xi)'-s' = H\(x,)s'Sf(x,) i=i i=i Stanislav Katina Analýza prežívania (Survival analysis) Funkcia vierohodnosti Pravé typy cenzurovania Funkcia vierohodnosti Pravé typy cenzurovania • intervalové cenzurovanie I. typu ^=n [skxiO]1-* Fírf 1=1 • intervalové cenzurovanie II. typu 1=1 kde 5/3 = 1 - - <5/2 Stanislav Katina Analýza prežívania (Survival analysis) Prehíad vzorcov Charakteristiky definované sčítacím procesom Vo formuláciách sčítacím procesom (Xj,5j)T nahradíme (N, (t), Y i (t)), kde N, (t) je počet pozorovaných udalostí v intervale (Q, t) v jednotke /', Yi(t) {o jednotka / je v riziku v čase t (pozorujem ju) 0 inak Táto formulácia obsahuje dáta s pravým typom cenzúr ako špeciálny prípad, teda Y, (t) = I {{T, > t}) a N, (t) = I {{T, 0}, N(0) = 0. Stanislav Katina Analýza prežívania (Survival analysis) Náhodné cenzurovanie /=1 /=1 /=1 7=1 /=1 7=1 /=i / 7=1 /=i Stanislav Katina Analýza prežívania (Survival analysis) Prehíad vzorcov Charakteristiky definované sčítacím procesom Odhad kumulatívneho rizika je definovaný na základe agregovaného procesu Y (t) = E^Y, (ŕ) ,Ň(t) = £, N, (t), d N (t) = A/V (t) = N (t) - N {t~), kde N (t) je suma udalostí do času t vrátane, Y (t) je počet jednotiek v riziku v čase t (formálne ide o počet jednotiek v riziku v časovom intervale (t - e, t) pre malé e). Example Majme náhodný vektor (X,, ô,), definovaný nasledovne (pre nejakú fiktívnu Mu štatistickú jednotku, t.j. subjekt) Riešenie 1) {Xj, 5j)T = (3,0)7", t.j. v čase X, = 3 je cenzúra, N, (t) = N, (3) = 0, Y, (3) = Y, (3) = 1 ^ (Nj (3), Y, (3))r = (0,1 )r, 2) (X,, Sj)T = (4,1)r, t.j. v čase X, = 4 je udalosť (zlyhanie), Ni (4) = 1, Y (4) = 1, t.j. (Ni (4), Y (4))r = (1,1 )r, 3) Ak máme viac udalostí: (/V, (0.5), Y, (0.5))r = (1,1)r, (/V,(2),Y,(2))r = (2,1)r. Stanislav Katina Analýza prežívania (Survival analysis) Přehrad vzorcov Odhady kumulatívneho rizika Přehrad vzorcov Odhady kumulatívneho rizika • Nelson-Aalenov (NA) odhad kumulatívneho rizika Jo Y (s) Y (t;) 9 Flemingom a Harringtonom (FH) modifikovaný NA odhad kumulatívneho rizika ^FHmodNA (t) E i:t, AM'í) i:t, i:t,KMmod n i:t, i\2 Prehíad vzorcov Odhad strednej hodnoty a jeho rozptyl Odhad strednej hodnoty času do zlyhania E [T] (priemerný čas do zlyhania) v spojitom prípade je definovaný ako fi= / S(t)dt, Jo v diskrétnom prípade ŕmax 1 /=o kde t0 = 0 a / < n je počet rôznych zlyhaní a ti = ŕmax. Odhad rozptylu priemerného času do zlyhania je definovaný ako -i 2 Vari S (u) du d2(t)dt Stanislav Katina Analýza prežívania (Survival analysis) Stanislav Katina Analýza prežívania (Survival analysis) Přehrad vzorcov Odhad strednej hodnoty a jeho rozptyl Prehíad vzorcov Odhad strednej hodnoty zostatkového života a jeho rozptyl a v diskrétnom prípade Varl E l:íf<ímax-1 - tj)Š{tj) 7:ř/<řj<řmax-1 Za S (t) dosadíme SKm (0> ^b (0 alebo SFHmodB (0- Podobne ako pri rozptyle funkcie prežívania dostaneme päť nasledovných rozptylov VarG [£km] = VarG [MKMmod], Varm [p,B], VarM [£km], Var^A [MFHmodB] 3 VarG [/tFHmodB] • Stanislav Katina Analýza prežívania (Survival analysis) Prehíad vzorcov Odhad strednej hodnoty zostatkového života a jeho rozptyl Odhad rozptyl priemerného zostatkového života Var[mrl(ŕ)] 1 S2(t) \Jt + S(u)du S{x)dx d2(u)du 2{u) du pre spojitý prípad, kde u g {t,tmax ), a pre diskrétny prípad Var[mrl(ŕ)] s2(0 E íiŕ^ŕKŕmax-l + 53 {tj+,-tj)š{tj) J-.tiKtjKtmux-l 2 x S2(fi) 53 ( 3 • typ pozorovaní: nepárové alebo párové • typ alternatívy: všeobecná alebo zoradená • crossing efekt (prekrižovanie sa kriviek prežívania): neexistuje alebo existuje • časový efekt liečby: neexistuje alebo existuje Neparametrické testy porovnania kriviek prežívania pre necenzurované dáta 9 testy porovnania dvoch kriviek prežívania (k = 2) » Wilcoxonovtest (W) a Mann-Whitney test (MW) » Siegel-Tukey test (ST) o testy porovnania viac kriviek prežívania (k > 3) a Kruskal-Wallis test (KW) a Jonckheere test (J) » Cuzick test (C) o Letest(L) Stanislav Katina Analýza prežívania (Survival analysis) Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie kriviek prežívania Prehfad testov Testy na porovnanie kriviek prežívania Prehfad testov Neparametrické testy porovnania kriviek prežívania pre cenzurované dáta 9 testy porovnania dvoch kriviek prežívania (k = 2) • Gehan-Wilcoxon test, zovšeobecnený Wilcoxonovtest (GW) • Cox-Mantel test, log-rank test (CM) o Ta ro n e-Ware test (TW) o Peto-Peto test (PP) 9 testy porovnania viac kriviek prežívania (k > 3) • Gehan-Breslow test, zovšeobecnený Wilcoxonov test, zovšeobecnený Kruskal-Wallis test (GB) • Cox-Mantel test, log-rank test (CM) • Mantel-Haenszel test, log-rank test (MH) o Peto-Peto test (PP) Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie dvoch kriviek prežívania Wilcoxonov test Predpoklady 9 X-i,... ,Xni je náhodný výber (NV) z nejakého spojitého rozdelenia 9 Y<\,..., Yn2 je NV z rovnakého spojitého rozdelenia a je oproti prvému rozdeleniu posunuté o nejakú konštantu ô 9 veličinyX-i,. rozdelenie ,Xni a Yi 6, Yn2 - Ö majú rovnaké 9 oba výbery sú nezávislé Hypotézy 9 H0:5 = 0(S- S2, čo je ekvivalentné s S-\(t) > S2{t), pre Vr S (t) je funkcia prežívania st st -< a y stochasticky menší, resp. stochasticky vacsí Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie dvoch kriviek prežívania Wilcoxonov test Označenia 9 nj je počet pozorovaní vy'-tom NV, j = 1,2 9 n-i + n2 = n 9 nech R<\,R2,...,Rn^ sú poradia ,X2,... ,Xni prvého NVv rámci usporiadaného združeného NV 9 ich realizácie r^,r2,... ,rni sú poradia realizácií x-|, x2,..., xni Wilcoxonova štatistika "i E* /=1 "i Realizáciu Sw ozn. wx = sw = ^ r,. /=1 Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie dvoch kriviek prežívania Wilcoxonov test Testy na porovnanie dvoch kriviek prežívania Wilcoxonov test Stredná hodnota a rozptyl Sw E0[S Var0 [S ni {n + 1) n-\ a?2 {n + 1) 12 Wilcoxonova testovacia štatistika Ak n-,, n2 > 10 zw = Sw~Eo[sdzN{o^) Var0 [S w\ Realizáciu Zw ozn. z Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie dvoch kriviek prežívania Mann-Whitney test Predpoklady • X-i,... ,Xni je NV z nejakého spojitého rozdelenia a Yi,..., Yn2 je NV z rovnakého spojitého rozdelenia a je oproti prvému rozdeleniu posunuté o nejakú konštantu ô 9 oba výbery sú nezávislé • nech (X,-, Y7j sú možné páry pozorovaní, pre ktoré môže nastat bud X, < Y7 alebo X, > Y7 Hypotézy 9 H0:5 = 0(S 0 (S-i(ŕ) < S2(/)> pre aspoň jedno ŕ) Stredná hodnota a rozptyl Sw: Var0[Sw\t] E0 [Sw] n-[n2(n + 1) 12 ni (n + 1) 1~ , 21 ^Efrfc2-1 n (n2 - 1) ^ J v7 v. 7 7=1 Wilcoxonova testovacia štatistika Akn-|,n2 > 10 -n/ = 3 w E0[S v Var0 [Sw] - 12(řll+řl2)(ni+řl2_i) W(0,1) Realizáciu Z^ ozn. z Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie dvoch kriviek prežívania Mann-Whitney test Označenia 9 nj je počet pozorovaní vy'-tom NV, j = 1,2 • n-i + n2 = n Mann-Whitneyho štatistika "i n2 smw = Y, E > YV) = * (X'' Yv) > kde x' > yj /=1 7=1 Realizáciu SMW ozn. sMW = J2"U Ľ7=i /(*/ > /;)■ Stanislav Katina Analýza prežívania (Survival analysis) Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie dvoch kriviek prežívania Mann-Whitney test Testy na porovnanie dvoch kriviek prežívania Mann-Whitney vs Wilcoxonov test Stredná hodnota a rozptyl SMW E0[S, A7-|A72 Var0 [SMW] = Var0 [Sw] n^n2{n^ + n2 + 1) 12 Mann-Whitneyho testovacia štatistika Ak n-,, n2 > 10 SMW - E0 [Smw] v /n ,,, ZMw =-; _ =— ~ /v (U, 1) Var0 [S Realizáciu ZMw °zn. zMw- Stanislav Katina Analýza prežívania (Survival analysis) Wilcoxonov a Mann-Whitneyho test Example (nádor pfúc; cvič.) Nech ty, i = 1,... ,ľij,j = 1,2 sú časy do zlyhania (úmrtia) od diagnostiky nádoru pfúc v mesiacoch, kde j = 1 predstavuje I. typ terapie aj = 2 zasa II. typ terapie (pozri tabufku). Otestujte H0 : S-, (t) = S2 (t) oproti alternatíve : S-, (ŕ) + S2 (t) pomocou Sw a SMW nesledovne (1) Sw = WY a Sw = Wx, (2) Smw = UY a SMW = Ux. Vždy presne naformulujte H-i. Okomentujte výsledky. tii 52 240 19 53 15 43 340 133 111 231 378 49 skup 1 2 2 1 1 2 2 1 1 2 1 1 Stanislav Katina Analýza prežívania (Survival analysis) Ux vyjadruje počet dvojíc Xh Y7, kde platí X < Y7 ni(ni+1) ,A, Ux = ^n2 + -'- - Wx, Uy vyjadruje počet dvojíc X,, Y7, kde platí X, > Y7 Uy = n^n2 + v-- - Wy Stanislav Katina Analýza prežívania (Survival analysis) Wilcoxonov a Mann-Whitneyho test casy.zlyh <- c(52,240,19,53,15,43,340,133,111,231,378,49) skupina <- c(l,2,2,1,1,2,2,1,1,2,1,1) nl <- length(easy.zlyh[skupina == 1]) n2 <- length(easy.zlyh[skupina == 2]) n <- nl+n2 N <- c(nl,n2) Wilcoxonov test '(<) 15 19 43 49 52 53 111 133 231 240 340 378 skup 1 2 2 1 1 2 2 1 1 2 1 1 1 - - 4 5 6 7 8 - - 12 rř - 2 3 - - - - 9 10 11 - sw = wy = £r,(2)=35 Eo [Sw] = §ÍŽ+s±!l = 32.5 a var0 [sw] = 7x5<^5+1> zw = (35 - 32.5)/6.158 = 0.406 a p-hodnota=0.685 R <- rank(easy.zlyh) = 37.92 Sw <- sum(R*(skupina ==2)) # 35 (S E.Sw <- n2*(n+l)/2 # 32.5 (£0[SW]) Var.Sw <- nl*n2* (n+1)/12 # 37.91667 (Var0[Sw]) Zw <- (Sw-E . Sw)/sqrt (Var . Sw) # 0.405999 (Zw) 2*(l-pnorm(abs(Zw))) # 0.6847434 Stanislav Katina Analýza prežívania (Survival analysis) H Wilcoxonov a Mann-Whitneyho test m Wilcoxonov vs Mann-Whitneyho test Sw = wx = Y, r?] = 43; £0 [Sw] = 7S1^1 = 45.5; l/ar0[Sw]='7x5<^5+1> = 37.92; zw = (43 - 45.5)/6.158 = -0.406; p-hodnota=0.685; R <- rank(easy.zlyh) Sw <- sum(R*(skupina ==1)) # 43 (S^) E.Sw <- n2*(n+l)/2 # 45.5 (£0[SW]) Var.Sw <- nl*n2* (n+1)/12 # 37.91667 (Var0[Sw]) Zw <- (Sw-E . Sw)/sqrt (Var . Sw) # -0.405999 (Zw) p.val <- 2*(1-pnorm(abs(Zw))) # 0.6847434 Mann-Whitneyho test Smw <- nl*n2-sum (R* (skupina == 2) )+n2* (n2 + l)/2 # 15 (S/vji/y) E.Smw <- nl*n2/2 # 17.5 (e0[SM(V]) Var.Smw <- nl*n2* (n+1)/12 # 37.91667 (Var0[SMN]) Zmw <- (Smw-E.Smw)/sqrt(Var.Smw) # -0.405999 (Zw) 2*(l-pnorm(abs(Zmw.2))) # 0.6847434 Smw <- nl*n2- sum (R* (skupina == 1) )+nl* (nl + 1)/2 (S/vji/y) Zmw <- (Smw-E . Smw)/sqrt (Var . Smw) # 0.405999 (ZMW) p.val <- 2*(1-pnorm(abs(Zmw))) # 0.6847434 Example (Wilcoxonov vs Mann-Whitneyho test; DÚ) Nech Ux vyjadruje počet dvojíc X,, Y7, kde platí X, < Yj, podobne Uy vyjadruje počet dvojíc X,, Yj, kde platí X, > Yj. Dokážte, že Ux = n^n2-\—-- - l/l/x, UY = n^n2 + .-- - l/l/y. Pozn.: Ekvivalentne sa dá ukázať, že Wx = UY + "l(n2+1) (podobne pre WY a Ux) a dosadiť do vzorcov pre Ux a Uy. Stanislav Katina Analýza prežívania (Survival analysis) Stanislav Katina Analýza prežívania (Survival analysis) Asymptotická normalita rozdelenia SK Example (asymptotická normalita SMW) Pre n-i = 7 a n2 = 5 porovnajte v dt asymptotické rozdelenie SMW s jej exaktným rozdelením. Na výpočet asymptotickej hustoty použite funkciu dnorm () a na výpočet asymptotickej distribučnej funkcie použite funkcie dnorm () a cumsum (). Na výpočet exaktnej hustoty použite funkciu dwilcox () a na výpočet exaktnej distribučnej funkcie použite funkciu pwilcox (). Teoretické a exaktné rozdelenie superponujte v podobe (1) hustoty, (2) distribučnej funkcie a (3) gg-diagramu s gg-priamkou (na x-ovej osi bude sekvencia x od teoreticky možného m\n(SMW) po teoreticky možné max(SMW) a na y-ovej osi teoretické kvantily y vypočítané pomocou funkcie qnorm (); gg-priamka bude prechádzat bodmi (x0.25,ýo.25) a (řo.75,/0.75)- Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie dvoch kriviek prežívania Asymptotická normalita rozdelenia Sk Hustota MW statistiky Distribučná funkcia MW statistiky q q-diagram MW rozdelenia Obr.: Rozdelenie Mann-Whitneyho štatistiky SMW (ni = 7,n2 = 5) Example (asymptotická normalita SMW) Porovnajte v m asymptotické rozdelenie SMW s jej exaktným rozdelením pre (1) n-i = 5 a n2 = 50, (2) n-i = 50 a n2 = 50, (3) n-, = 50 a n2 = 100 a (4) n-, = 100 a n2 = 100. Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie dvoch kriviek prežívania Siegel-Tukey a Levene test Testy na porovnanie dvoch kriviek prežívania Siegel-Tukey test Predpoklady 9 liečba nespôsobuje zmenu priemernej odpovede, ale výsledná odpoveď má menší rozptyl okolo strednej hodnoty 9 X-i, ...,Xni je NV z nejakého spojitého rozdelenia • Y1?Yn2 je NV z nejakého spojitého rozdelenia • oba výbery sú nezávislé Hypotézy 9 H0 : Var{S-\{t)) = Var{S2{t)), Vř o H-, : Var(S-\(t)) / Var(S2{t)), pre aspoň jedno t Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie dvoch kriviek prežívania Siegel-Tukey test Stredná hodnota a rozptyl SST (resp. S|'f): n-, (n-, + n2 + 1) E0[S stí q a/ŕ Var0 [SST] = Var0 [S alt] stí n^n2{n^ + n2 + 1) 12 Siegel-Tukey testovacia štatistika Ak n-,, n2 > 10 7 - 7a/ŕ SST - £0 [Sst] v A/(0,1) Var0 [S, STJ Realizáciu ZST = Z|'| ozn. zST = z|'f. Stanislav Katina Analýza prežívania (Survival analysis) Podstata Siegel-Tukey testu je nasledovná Algoritmus 1: 9 poradie R<\ priradíme najmenšiemu pozorovaniu o poradie R2 priradíme najväčšiemu pozorovaniu • poradie R3 priradíme druhému najmenšiemu pozorovaniu • poradie R4 priradíme druhému najväčšiemu pozorovaniu • atd. Siegel-Tukey štatistika "i SST = /=1 kde daná suma prislúcha súčtu poradí pre prvý NV. Realizáciu "i SST ozn. sST = El-- /=1 Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie dvoch kriviek prežívania Levene test Podstata Leveneho alternatívy ST testu (Levene testu) je nasledovná: 9 odchýlky Dx X-X 9 D(1) < D(2) < ... < D{n),n a Dy = "1 Y -Y vn2 9 realizácie odchýlok {cf(- = |x(- - x|}"=l1 a {ó-s = \y - y\}"^ 10 n-, (n-, + n2 + 1) A?iA72(ni +n2 + 1) 12 oa/ŕ ľz ľoa/ŕl 7a/ŕ _ ÖST - fc0 L^srJ » Var f [S, A/(0,1) STJ Realizáciu ZL = Z|'| ozn. zL = zalt Stanislav Katina st' Analýza prežívania (Survival analysis) Testy na porovnanie dvoch kriviek prežívania Siegel-Tukey test a Levene test Example (nádor pfúc pokrač., cvič.) Nech tjj,i = 1,..., rijj = 1,2 sú časy do zlyhania (úmrtia) od diagnostiky nádoru pfúc v mesiacoch, kde j = 1 predstavuje I. typ terapie aj = 2 zasa II. typ terapie (pozri tabufku). Otestujte v c H0 : Var[S-\ (t)] = Var[S2 (t)] oproti alternatíve H-, : Var[S<\ (t)] / Var[S2 (t)] pomocou SSr a Sff. Okomentujte výsledky. h 52 240 19 53 15 43 340 133 111 231 378 49 skup 1 2 2 1 1 2 2 1 1 2 1 1 9 - - 11 1 - - 10 12 2 7 R<2> - 6 3 - - 5 4 - 8 - - Siegel-Tukey test Ssr = E r((2) = 26 ;'=1 5(7+5+1) . Zsr = (26 - 32.5)/6.157651 = e0[sst]=°-^p^; var0[sw] 7x5(7+5+1) 12 -3.167 a p-hodnota=0.291 Analýza prežívania (Survival analysis) Stanislav Katina Testy na porovnanie dvoch kriviek prežívania Siegel-Tukey test a Levene test casy.zlyh.l <- casy.zlyh Rst <- rep(0,n) for (i in l:n) { if(i%%2 = = l) Rst <- Rst+(min(easy.zlyh.1 [easy.zlyh.1>0] )= = easy.zlyh.1)*i else Rst <- Rst+(max(easy.zlyh.1[easy.zlyh.1>0])==casy.zlyh.1)*i casy.zlyh.l <- easy.zlyh.1*(Rst==0) } Rst #963 11 154 10 12 827 Sst <- sum(Rst*(skupina==2)) # 26 (SST) E.Sst <- n2*(n+l)/2 # 32.5 (£0[Ssr]) Var.Sst <- nl*n2* (n+1)/12 # 37.91667 (Var0[SST]) Zst <- (Sst-E.Sst)/sqrt(Var.Sst) # -1.055597 (Zsr) p.val <- 2*(1-pnorm(abs(Zst))) # 0.2911522 Sst <- sum(Rst*(skupina==l)) # 52 (SST) E.Sst <- nl*(n+l)/2 # 32.5 (£0[SST]) Zst <- (Sst-E.Sst)/sqrt(Var.Sst) # 1.055597 (Zsr) p.val <- 2*(1-pnorm(abs(Zst))) # 0.2911522 Testy na porovnanie dvoch kriviek prežívania Siegel-Tukey test a Levene test Levene test priemer.1 <- mean(časy.zlyh[skupina == 1]) priemer.2 <- mean(časy.zlyh[skupina == 2]) časy.zlyh.2 <- casy.zlyh for(i in 1:n){ if(skupina [i]= = 0) časy.zlyh.2 [i] <- abs(časy.zlyh [i] -priemer.1) else časy.zlyh.2[i] <- abs(časy.zlyh[i] - priemer.2) } Rl <- rank(casy.zlyh.2) #5710489 11213 12 6 SI <- sum(Rl* (skupina= = 2) ) # 40 (s|*) E.SI <- n2*(n+l)/2 # 32.5 (£0[S|*]) Zsl <- (SI-E.SI)/sqrt(Var.Sw) # 1.217997 (z|*) p.val <- 2*(l-pnorm(abs(Zsl))) # 0.2232251 SI <- sum(Rl* (skupina= = l) ) # 38 (s|*) E.SI <- nl*(n+l)/2 # 45.5 (£0[S|'f]) Zsl <- (SI-E. SI)/sqrt (Var. Sw) # -1.217997 (z|*) p.val <- 2*(l-pnorm(abs(Zsl))) # 0.2232251 Stanislav Katina Analýza prežívania (Survival analysis) Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie dvoch kriviek prežívania Siegel-Tukey test a Levene test Testy na porovnanie viacerých kriviek prežívania Prehfad testov Example (Siegel-Tukey test a Levene test) Naprogramujte v test H0 : Var[S-\ (t)] = Var[S2 (t)] oproti alternatíve H-, : Var[S-\ (t)] / Var[S2 (t)] pomocou SST a Sff použitím algoritmu 2. Okomentujte výsledky. Algoritmus 2: • poradie R<\ priradíme najmenšiemu pozorovaniu • poradia R2 a R3 priradíme dvom najväčším pozorovaniam • poradia f?4 a R5 priradíme druhému a tretiemu najmenšiemu pozorovaniu • atcf. Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie viacerých kriviek prežívania Kruskall-Wallis test Ďalšie označenia 9 n = 53JÍ=1 A7y, A77 je počet pozorovaní vy'-tom NV 9 Sj = YHU rJí> s = ĽjLi Rj, Šj = Sj/nj, S = S/n = (n + 1)/2 Kruskall-Wallisova testovacia štatistika U, kw 12 n(n + 1) 12 n(n + 1) 1 t, (f n + 1 S? 3(n + 1) n(n + 1f \ v 2 \/ar[ft] ^ nv 4 Realizáciou LW je t/Kiv = E/U "j (f - írI) Stanislav Katina Analýza prežívania (Survival analysis) Testované hypotézy 9 nulovná hypotéza H0 : S, (t) = S7 (t) = S (t) 9 alternatíva hypotéza H-i : » Si (t) ^ Sj (t) pre aspoň jedno i, j (KWtest) » Si % Sj (čo je ekv. s S,(ŕ) < Sj(t), pre W; J,C,L testy) a S, ? S, (čo je ekv. s S i (t) > Sj(t), pre Vr; J,C,L testy) ' Xja.^ , kde Xja. < Xja. Jonckheere štatistika k sj = e smw = e e smw /' Xj AYj > Y} 9 diskordantná (neusporiadaná) pokiaf platí X Yj alebo X, Y} a ak platí Y = Y) alebo Y = Vý, nejde ani o konkordantný ani o diskordantný vzťah a C + D < n (n - 1), C je počet konkordantných dvojíc, D počet diskonkordantných dvojíc O T C-D 17(17-1) 2 Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie viacerých kriviek prežívania Kendallov korelačný koeficient Testy na porovnanie viacerých kriviek prežívania Kendallov korelačný koeficient Kendallov korelačný koeficient T - __!_y^" čo je identické s ~ 2 t = —— kde ňŕrj Eľ=i s/gn (X, - X7) sign (Y, - Y7), u,cké s ňp^rj Eľ=ľ Ľ"=/+i sfo" (X, - X7) s/gn (Y, - Y7), í 1' ak X, >X7 sign(Xj -Xj)=< ak X, ak Y, > Yj sign(Yj -Yj)=< ak Y, < Y7 I o, ak Y, = Y7 Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie viacerých kriviek prežívania Kendallov korelačný koeficient Vztah Kendallovho a Pearsonovho korelačného koeficientu Ak (X, Y) - N2{fj,, Y.) a PXy, potom t = f arcsin(pXíy), kde arcsin(-) nadobúda hodnoty z (-|, |) \/z/a/7 Kendallovho korelačného koeficientu a Jonckheere štatistiky T = ti alt ,tg(-i,i; kde r nazývame zovšeobecnený Kendallov korelačný koeficient Stanislav Katina Analýza prežívania (Survival analysis) Alternatíva Kendallovho korelačného koeficientu • nech /?i ,...,/?„ sú poradia X^,... ,Xn 9 nech Q-i,..., Q„ sú poradia Y-i,..., Yn Potom platí r = ^ Eľ=i ĽjLi sign (R, - Rj) sign (Q,- - Q7 to je identické s Platí r = T^iy Ľľ=ľ EJL/+1 s/gn (/?,■ - /?,■) s/g/7 (Q,- - Q7) ťg(-1,1),£0[r]=0,V^] = |g±5J ť-E0[7\ v A/(0,1) Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie viacerých kriviek prežívania Kendallov korelačný koeficient Example (WBC; predn.) Majme pacientov s akútnou myeloidnou leukémiou (AML) a v rámci nich skupinu AG-pozitívnych (výskyt určitých špecifických indikátorov choroby v kostnej dreni). Pre chorobu je charakteristické, že s počtom bielych krviniek (white blood cells counts, WBC) vzrastná závažnost choroby. Nech ti, i = 1,2,..., 17 sú časy do zlyhania v týždňoch prislúchajúce zoradeným WBC (pozri tab.). Vypočítajte r pomocou počtu konkordantných a diskonkordantných párov. Otestujte nezávislost medzi počtom bielych krviniek a časmi do zlyhania na hladine významnosti a = 0.05. Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie viacerých kriviek prežívania Kendallov korelačný koeficient Testy na porovnanie viacerých kriviek prežívania Cuzick test WBC ti 9/ dji 750 156 0 16 2300 65 5 9 2600 134 1 13 4300 100 3 10 5400 39 5 7 6000 16 7 4 7000 143 0 10 9400 56 3 6 10000 121 0 8 10500 108 0 7 17000 4 4 2 32000 26 1 4 35000 22 1 3 52000 5 1 2 100000 1 1 0 100000 1 1 0 100000 65 0 0 c,-,- = #(!/,-,T l/l/ßC,-) pod/ c = £9/ = 33 dji = #(H,T WBC,) pod/ d = = 101 n(n-1) _ 17x16 2 ~ 2 c-d _ _o.5 17(17-1) 2 ^ = áwŤ^j = 0.032 z9 = -0.5/^/0^032 = -2.801 p-hodnota=0.005 Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie viacerých kriviek prežívania Cuzick test Stredná hodnota E0[Sc]=(j2i)jE[Z] = ^n(n + ^E[Z], kde E [Z] = YJj=-\ zjpj, k je počet skupín, zfJ = zs =j, ps = nsjn Rozptyl Var [Sc] = -x ,2, n2 (n + 1) 12 n2 Var [Z] kde Var [Z] = £jLi z/P; - (£[*])' Cuzickova testovacia štatistika Sc — £o [Sc] r> -c = A/(0,1) Var0 [Sc Realizácia Zc je zc. Stanislav Katina Analýza prežívania (Survival analysis) Označenia a nech Ry, je poradie -X), v združenom NV • nech Sjj je skóre prislúchajúce NV, do ktorého Xy, patrí • n = £j=1 n, Cuzickova štatistika 7=1 /=1 Realizácia Sc je sc = £/=1 £"i1 s,,/},-. Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie viacerých kriviek prežívania Cuzick test Ak máme v pozorovaniach zhody, potom Cuzickova testovacia štatistika -c = E0[SC v Var0[Sc]-^Zjtj(t?-l A/(0,1) Var0[Sc\t] = Varo[SKW\t] Realizácia Zc je zc. Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie viacerých kriviek prežívania Spearmanov korelačný koeficient Testy na porovnanie viacerých kriviek prežívania Spearmanov korelačný koeficient Označenia 9 nech (X-i, Y-i)7,..., (Xn, Yn)T je výber z dvojrozmerného rozdelenia • nech /?i,...,/?„ sú poradiaX^,...,Xn 9 nech Q-i,..., Qn sú poradia Y^,...,Yn Spearmanova štatistika S/y = ^2 RjQj /=1 Realizáciu SN ozn. sN = £"=1 r,q,. Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie viacerých kriviek prežívania Spearmanov korelačný koeficient Vztah Spearmanovho Rs a Cuzickovej štatistiky Sc: Cuzickova štatistika Sc je rovná Spearmanovej štatistike SN, kde jedna premenná predstavuje zoradenú (ordinálnu) premennú a druhá spojitú premennú. Example (pokrač. WBC) Vypočítajte Spearmanov korelačný koeficient rs. Otestujte nezávislost medzi počtom bielych krviniek a časmi do zlyhania pomocou Zs na hladine významnosti a = 0.05. Stanislav Katina Analýza prežívania (Survival analysis) Stredná hodnota E0 [S/y] = n n + 1 Rozptyl Var0 [S/v] = 1 /n(n2-1) n- 1 V 12 Spearmanova testovacia štatistika S/v - En [S/v] v A/(0,1),čoje ekv. VŽ7-T/?S ~ A/(0,1) var0 [S/v] 1 kde Rs = - V(n-1)^o[Sw] var0 [Ks] = Realizácie f?s a Zs ozn. rs a zs. Stanislav Katina (S/v-E0[S/v]),E0[/?s] = 0, Analýza prežívania (Survival analysis) Testy na porovnanie viacerých kriviek prežívania Le test Označenia 9 nj je rozsah y'-teho NV • Lj = J2í 100000, n-, = 3, (1, 1, 65) 9 Skupina 2: WBC e (10000,100000), n2 = 6, (108, 121,4, 26, 22, 5), • Skupina 3: WBC < 10000, n3 = 8, (65, 156, 100, 134, 16, 39, 143, 56) sk.1 1 1 sk.2 - - 4 5 - 22 26 sk.3 - - - 16 - - 39 poradie 1.5 1.5 3 4 5 6 7 8 sk.1 - 65 - - - - - - sk.2 - - - 108 121 - - - sk.3 56 65 100 - - 134 143 156 poradie 9 10.5 12 13 14 15 16 17 Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie viacerých kriviek prežívania Príklad Testy na porovnanie dvoch kriviek prežívania Cenzurované dáta-prehíad = 4.50, R2 = 7.833, R3 = 11.5625 skw = Ef=1 ~H- - 3 (n 12 n(n+1) 3 x 4.52 17x1 4.762662, p-hodnota 6 x 7.833 + 0.0924 1) = 8 x 11.56252 3 x 18 17(17+1) Sl = £/=1 nj (Lj - Mj) Rj = _ 3x(0-14)x4.5+6x(3-8)x7.833+8x(9-0)x11.5625 = 408.5 ^zU"j(lj-mj)2 = —12— [3 x (0- 14)2+6 x (3-8)2 +8 x (9-O)2] = 187.99732 ZL = 408.5/187.9973 = 2.172903, p-hodnota=0.0298 Skw - {ZL)2 = 4.762662 - 2.1729032 = 0.0412, p-hodnota=0.8392 Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie dvoch kriviek prežívania Cenzurované dáta-prehlad Harrington a Fleming (1982) trieda váh w(t) = Sp(t),p > 0 O p = 0, a teda w(t) = S°(t) = 1 (Cox-Mantel test alebo log-rank test; Cox, 1972; Mantel, 1966) O p = 1, a teda w(t) = Š1 (ŕ) = Š(ŕ) (Gehan-Wilcoxon test alebo Peto-Peto-Wilcoxon test, Gehan, 1965; Peto a Peto, 1972) Stanislav Katina Analýza prežívania (Survival analysis) Tarone a Ware (1977) trieda váh (Cochran, 1954; Mantel a Haenszel, 1959; Armitage, 1966) O konštantný rozdiel v logitovej škále f (p) = In potom váhy w(t) = 1 9 konštantný rozdiel v aritmetickej škále: f (p) = p, potom váhy w(t) = (1/Y(ř) x (1 -1 / Y(0))-1 = Y2(t)/(Y(t) -1) « Y (t) o konštantný rozdiel v arcsin škále: f (p) = arcsin y/p, potom sú váhy rovné w(t) = -M=^ « y/Y(t), kde pt = 1 /Y(t) a Y (t) počet osôb v riziku v združenom výbere v čase t Vo všeobecnosti môžeme váhy zapísat ako w(t) = g(Y(t)/n) Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie dvoch kriviek prežívania Cenzurované dáta-prehíad Formálna formulácia Testovacia štatistika na porovnanie dvoch kriviek prežívania T(w,t) = J2wj (dy - dj^i) ,L = I< n potom • stredná hodnota E0[T(w,t)] = 0 • rozptyl Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie dvoch a viac kriviek prežívania Kontingenčné tabuíky Testy na porovnanie dvoch a viac kriviek prežívania Kontingenčné tabuíky KT 2 x 2 (označenia typické v epidemiológii - vfavo, označenia typické v analýze prežívania - vpravo) /2 Ľ yi /2 Ľ a b nv *1 d, d2 d c d n2. a^ a2 a Ľ nA n.2 n Ľ "i r>2 n početnosti rij.,n.jj = 1,2 sa nazývajú marginálne početnosti a sú v tomto prípade fixované X2 test nezávislosti (alebo homogenity) pre KT 2 x 2 2 x2 = di - E0[D] \ v 2 Xdf,df= 1, Var0[D] kde cf-i je početnost v prvej bunke KT. Stanislav Katina Analýza prežívania (Survival analysis) x\y yi /2 Ľ x\y yi /2 Ľ Pii p12 PL *1 "n "i. p21 p22 p2. ^2 A72. Ľ p-1 P-2 1 Ľ "i n.2 • predpoklad binomického/multinomického rozdelenia - fixované riadkové marginálne početnosti • predpoklad Poissonovho rozdelenia - žiadne marginálne početnosti fixované • predpoklad hypergeometrického rozdelenia - fixované všetky marginálne početnosti Testované efekty • rozdiel pravdepodobností p-n -pi2 • pomer rizík RR = £^ = tt1 r "21/"2- p21 9 pomer šancí OR = = 1 p21/p22 "21/122 Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie dvoch a viac kriviek prežívania Kontingenčné tabuíky Kombinovanie L(L = /) jednoduchých KT (Gart, 1970; Cox, 1972) v L časoch zlyhania do mnohorozmernej (/.-rozmernej) KT o pre dvojvýberový prípad je KT (2 x 2) x L 9 pre k -rozmerný prípad je KT (2 x k) x L Použitý x2 test porovnania nezávislých kriviek prežívania bude potom formálne identický s Birch-Armitage štatistikou asociácie týchto KT (Mantel, 1966; Birch, 1965; Armitage, 1966) X2 test pre kombináciu L KT 2 x k (Mantel a Haenszel, 1959) Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie dvoch kriviek prežívania Prehfad testov Pre každé ŕ,-, 1 < / < /, môžeme dáta zapísat do KT 2 x 2 výber/status 1 2 spolu v tj zlyhanie v t, d m d2i d nažive v ŕ, spolu v tj nv n2i n. • nr, = # subjektov v prvom NV, ktorí boli v riziku tesne pred časom tj, n2j = # subjektov v druhom NV, ktorí boli v riziku tesne pred časom tj, n, = nr, + n2j o dy, = # zlyhaní z prvého NV, d2j = # zlyhaní z druhého NV, dj = dv + d2i 9 a, = n, - d, = a1( + a2( = # subjektov, ktorí ostali nažive v čase tj 9 # zlyhaní do času tj vrátane d = Y^jtj 1 Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie dvoch kriviek prežívania Prehfad testov • marginálne početnosti vtab., n2j a d, sú náhodné premenné závislé iba na minulosti pred časom t, 9 Mantel a Haenzel (1959): rozdelenie pozorovaní (realizácií) v bunkách KT podmienené pozorovanými marginálnymi početnosťami (cí(, a(,n1(,n2/) za platnosti • to implikuje rozdelenie iba jednej bunky, dv. pretože ostatné početnosti sú fahko odvoditefné od marginálnych • za platnosti nulovej hypotézy, H0, rozdelenie dy, je hypergeometrické, teda Pr(dv\di,aj,nv,n2j) l"M\( "2i 1 Q) • v tejto forme H0 o rovnosti kriviek prežívania implikuje nezávislosť výberu a statusu (nažive alebo zlyhanie) Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie dvoch kriviek prežívania Prehfad testov Testy na porovnanie dvoch kriviek prežívania Prehfad testov Za platnosti H0 9 očakávaná (stredná) hodnota E0 [cf1(] = • rozptyl Var0 [dy] n; V n; rij - nv\ nrin2jajdj n,-1 J nf(n,-1) Informáciu o KT v čase t^ nám dá nasledovný vztah 2 _ [dm - E0 [dy]]2 v 2 Xi = Var0 [dv] x«^=\ Pre všetky tabufky (/' = 1,2,/) píšeme / U = Y/(dv-E0[dv]). E0 [U] = 0, Var0 [U] = £ Var0 [dv] = £ nvn2jajdj ^nf (n,-1) i=i /=1 ' v ' 1 Ak máme fixované d-,, n2j, potom platí (Mantel a Haenzel, 1959) 2 Q = £,'=1 {dv - E0 [dv]) Z!i=,Var0[dv] u2 v 2 m * (U-E0[U])2 2 y = — -----xi)Zq = Var0 [U] Var0 [U] U-E0 [U] v Väŕb\U] A/(0,1) Stanislav Katina Analýza prežívania (Survival analysis) Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie dvoch kriviek prežívania Prehfad testov Testy na porovnanie dvoch kriviek prežívania Prehfad testov Majme váhy w( asociované s KT v čase t,, potom u = J2wj{dij - E0[cŕ1(]): /=1 E0 [U] = 0, Var0 [U] = ^wf Var° Pi/l = Y,wi 2 TiMn^ajd, 1=1 U '"?("/-1) Ak máme fixované djt n2/, potom platí (Mantel a Haenzel, 1959) Var0 [U] Var0 [U] Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie dvoch kriviek prežívania Prehfad testov v M surv.test <- survdiff(Surv(cas, status) ~x,rho=0) Argumenty: O typ testu • rho=0(QMh) • rho=l (Qpp) Výstupy objektu surv.test sú nasledovné: O n - počet pozorovaní n v každej skupine O obs - počet udalostí v každej skupine (d-\ a d2) 9 exp - počet očakávaných udalostí v každej skupine Eo^] a E0[d2] O var - rozptyl alebo kovariančná matica Var0[L/] Stanislav Katina Analýza prežívania (Survival analysis) Podfa výberu váh w, rozoznávame nasledovné typy testov: • ak Wj = rij, Q = Qgw, ide o Gehan-Wilcoxon test (zovšeobecnený Wilcoxonov test; Gehan, 1965), ktorý môžeme zredukovať na Wilcoxonovu štatistiku pri absencii cenzúr [TW trieda (2)] j ak Wj: = 1, Q = Qcm, ide o Cox-Mantel test (log-rank test; Mantel a Haenzel, 1959) [TW trieda (1) a HF trieda (1)] • ak Wj = ^/Wj, Q = Qtw, ide o Tarone-Ware test (Tarone a Ware, 1977) [TW trieda (3)] • ak Wj = Špooied (ti) = Uj.tjKt, "'ňj+ť1 ■ Q = Qpp. ide o Peto-Peto test (Peto a Peto, 1972; Prentice, 1978) [HF trieda (2)] Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie dvoch kriviek prežívania Odhad relatívneho rizika 9 Veličina U podelená jej rozptylom Var0 [U] nám dáva podía práce Peto (1976) ako maximálne vierohodný odhad log 9. Táto štatistika má rozptyl rovný Var0 [logépl =(Var0[U]y\ preto obojstranný 100 (1 - a) % interval spofahlivosti pre log 9 (na základe asymptotickej normality) bude rovný potom {log 9 p ■ log 9P ± za/2 y/Vär0[U\j [9P:9pexp (±za/2^VarQ[U]) } . Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie dvoch kriviek prežívania Odhad relatívneho rizika 8 Testy na porovnanie dvoch kriviek prežívania Odhad relatívneho rizika 8 Podfa Mantel a Haenzela (1959), odhadneme 9 nasledovným spôsobom 7/WH z^ŕ=1 n, W d2i(nv,-dVl) /^/=1 n. E/=1 R' EU s, S4 kedy tento odhad môžeme písať ako vážený priemer odhadu pomeru šancí zlyhania (OR,) pre každú kontingenčnú tabufku, teda kde omh OR, -- J_ _ n1( n2i Ei=i WjORj e!=,«í ' di,(n2, -d2)) d2,(ni, -d1() 1 Pi/ ,P2i M2i "2i w, = ( — + — ) (I-P1/JP2/, sú podmienené pravdepodobnosti zlyhania. Stanislav Katina Analýza prežívania (Survival analysis) Prvá časť ( + ^ + ukazuje, že väčšie váhy zodpovedajú väčším rozsahom n1( a/alebo n2(. Sato (1990) odvodil 100 (1 - a) % interval spofahlivosti pre 9 ako riešenie kvadratickej rovnice OHA 'a/2' kde / / MA. cŕi, (n2, - d2)) (n1( - di, + d2, + 1) + cfo ("1/ - o"i,) (n2, - d2, + di,- + 1) (=1 (=1 Riešením vyššie uvedenej rovnice dostaneme /"f 2R+S++zl/2W+ ± xj[AR+S+ +zl/2W+) zl/2W+ ~2Ši Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie dvoch kriviek prežívania Odhad relatívneho rizika 8 Testy na porovnanie dvoch kriviek prežívania Odhad relatívneho rizika 8 Ak nemáme zhody v čase t,, potom d, = 1 a d1( - £0 [d1(] = 1 - ^, ak je zlyhanie pozorované v prvej skupine, alebo ak je zlyhanie pozorované v druhej skupine a korešpondujú príspevkom do R+, resp. S+. Ak rozptyl Var0 [d1(] = !hj^L, fahko sa dá vidieť, že Var0 [d1(] korešponduje s w, a výpočet IS pre 9 má členy, ktoré sa vyskytujú aj v QMH. Simulačně Monte-Carlo štúdie ukázali, že pravdepodobnosť pokrytia tohoto približného IS je vefmi podobná očakávanej pravdepodobnosti pokrytia. Alternatívou ku 9MH je nasledovný odhad (Anderson a Bernstein, 1985) Ľí=1 jmh n. sr1 d2inu Stanislav Katina Analýza prežívania (Survival analysis) kde ide o vážený priemer odhadovaného pomeru zlyhaní v dvoch skupinách s váhami ni Ak máme konštatnú proporcionalitu rizika cez všetky časy (9 sa nemení časom), 9MH a aj 9*MH odhadujú túto konštantu. Ak máme nekonštantnú proporcionalitu rizika 9i: 9MH a aj 9*MH dávajú vážený priemer 9,. Ak máme konštatnú proporcionalitu rizika cez všetky časy (9 sa nemení časom), 9MH a aj 9*MH odhadujú túto konštantu. Ak máme nekonštantnú proporcionalitu rizika 9h 9MH a aj 9*MH dávajú vážený priemer 9,. Analýza prežívania (Survival anaíysis) Stanislav Katina Testy na porovnanie dvoch kriviek prežívania Príklad Testy na porovnanie dvoch kriviek prežívania Príklad Example (dvojvýberové testy) Majme dáta z klinickej štúdie zhrnuté v nasledovnej tabufke (pozri tabufku). (a) Vytvorte kontingenčné tabufky v každom čase zlyhania /,,/'= 1,2,..., 7 použitím celkového počtu subjektov v riziku n, v čase i,, celkového počtu zlyhaní d, v čase tj, celkového počtu subjektov prvej skupiny v riziku riy v čase f, a celkového počtu zlyhaní dy subjektov prvej skupiny v čase i,. (b) Vypočítajte stredné hodnoty E0[dy], rozdiely empirických a očakávaných početností dy, - E0[dy], ako aj rozptyly Var0[dy]. (c) Otestujte H0 : A-, (t) = A2 (/) oproti H<\ : A-, (t) = 6\2 (t) pomocou testovacích štatistík Qgw, Qcm, Qtw a Qpp- (d) Nakreslite Kaplan-Meierove odhady funkcie prežívania pre obe skupiny do jedného obrázka, (e) Vypočítajte (1) 6P, Var[6MH] a 95%/S pre 6P, (2) 6MH a 95%/S pre 6MH a (3) 0*MH. Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie dvoch kriviek prežívania Príklad skup. 1 skup. 2 5 10 15 20 25 Obr.: Kaplan Meierove odhady funkcie prežívania Stanislav Katina Analýza prežívania (Survival analysis) ti rij dj n v d y E0[dy] dy - E0[dy] Var0[dy] 3 10 1 5 1 0.50 0.50 0.2500 5 9 1 4 1 0.44 0.56 0.2469 7 8 1 3 1 0.38 0.62 0.2344 12 6 1 1 0 0.17 -0.17 0.1389 18 5 1 1 1 0.20 0.80 0.1600 19 4 1 0 0 0.00 0 0 20 3 1 0 0 0.00 0 0 suma 4 1.69 2.31 1.0302 Q = 2.312/1.0302 = 5.179674 p-hodnota=0.02285261 zQ = V2.312/1.0302 = 2.275890 p-hodnota=2 x 0.01142630 = 0.02285259 Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie dvoch kriviek prežívania Príklad Example (dvojvýberová situácia) (1) Nakreslite (a) kumulatívne riziko Akmj(0. C3) kumulatívne riziko ANAj(t), (c) Kaplan-Meierove krivky prežívania SKMj(t) a (d) Breslowove krivky prežívania SBj(t)J =1,2 (vždy po dvojiciach do jedného obrázka). (2) Otestujte H0 : (t) = A2 (/) oproti : A-, (t) = 6\2 (t) pomocou testovacích štatistík QMH a QPP. Použite funkcie survdif f () s argumentami rho=o (Qmh) a rho=i (QPP). (3) Otestujte H0 : A-, (t) = A2 (/) oproti : A-, (t) = 6\2 (t) pomocou testovacích štatistík Qgw, Qcm, Qtw a Qpp- (4) Vypočítajte (a) 6P, Var[6P] a Waldov 95% IS pre 6P, (b) 6MH a Waldov 95% IS pre 6MH a (c) 6*MH. Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie dvoch kriviek prežívania Príklad Testy na porovnanie dvoch kriviek prežívania Príklad Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie viacerých kriviek prežívania Prehíad testov Testované hypotézy H0 : \, (t) = \2(t) = ... = Xk (t) H-i : 3 aspoň jedno /' < j, A; (ŕ) / A7- (ŕ) Pre každé ŕ,-, 1 < / < /, môžeme dáta zapísaí do KT 2 x k status/výber 1 2 ■ j k spolu V tj zlyhanie v t, d m d2i . ■ djj . ■ dki d nažive v case ŕ, a y, a2i . ■ ajj . aki a/ v riziku pred časom t, nv n2i . ■ rijj . ■ nkj n. a j = djj = n j — dj, ajj ni = Ey nH di = Ejdji = "a - dji Stanislav Katina Analýza prežívania (Survival analysis) KM kumulativně riziko pre AML data NA kumulatívne riziko pre AML data 0 10 20 30 40 50 cas do relapsu (v týždňoch) 0 10 20 30 40 50 cas do relapsu (v týždňoch) Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie viacerých kriviek prežívania Prehíad testov Za platnosti nulovej hypotézy a fixovaných marginálnych početnostiach sa dá ukázat, že počet zlyhaní v k výberoch má hypergeometrické rozdelenie s dimenziou k - 1 so strednou hodnotou E0 [djj] = v čase t, Potom kde U, je vektor merajúci rozdiel medzi pozorovaným a očakávaným počtom zlyhaní v čase t, a je definovaný ako / Uy, \ ( dy-E0[dy] \ U/ Un djj - E0 [dj- \ Uk_y J \ dk_y - E0 [dk_y] J Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie viacerých kriviek prežívania Prehfad testov Testy na porovnanie viacerých kriviek prežívania Prehfad testov Kovariančná matica V (ŕ,) s komponentami v časoch t, je daná nasledovne (V(ŕ;))/s = Cov [dlhdsi] n»fr'-n'ffa' Pre/ = s - n»"*di*i prel /s kde /, s = 1,2,..., k - 1. Potom, ak berieme do úvahy všetky časy zlyhania, dostaneme v = £v(/,-) Testovacia štatistika QWera// = UTV-1uSx2_i Ak k = 2, štatistika Qwera// = Qcm Analýza prežívania (Survival analysis) Stanislav Katina V prípade pridania váh w, v čase t, bude platit (w) 1=1 1=1 kde u|w^ je vektor merajúci vážený rozdiel medzi pozorovaným a očakávaným počtom zlyhaní v čase t, a je definovaný ako U (w) ( Uv] \ 7' v u[w) I = W, í Uv \ = w. ( dv - E0 [dv] \ dji - E0 [dji \ dk_y - E0 [ck_i,,-] J Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie viacerých kriviek prežívania Prehfad testov Testy na porovnanie viacerých kriviek prežívania Prehfad testov Pre kovariančnú maticu bude platit Vw = ^w/V(ŕ/) /=1 Nakoniec bude testovacia štatistika rovná l|T\/-1|i £> 2 Vofba váh je nasledovná: • ak Wj = rij, potom Q = QGB a ide o zovšeobecnený Wilcoxonov test (zovšeobecnený Kruskal-Wallis test, Gehan-Breslow test) [TW trieda (2)] • ak w,: = 1, potom Q = QCM a ide o Cox-Mantel test (log-rank test) [TW trieda (1)] • ak Wj = -/rTj, potom Q = Qjw a ide o Tarone-Ware test) [TW trieda (3)] o ak Wj = Š (tj~)p, p = 0, potom Q = QMH a ide o Mantel-Haenszelov test (log-rank test) [HF trieda (1)] o ak Wj = Š (tj~)p, p = 1, potom Q = QPP a ide o Peto-Peto-Wilcoxon test [HF trieda (2)] Stanislav Katina Analýza prežívania (Survival analysis) Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie viacerých kriviek prežívania Test trendu Testy na porovnanie viacerých kriviek prežívania Test trendu Test nulovej hypotézy oproti stochasticky usporiadanej alternatíve je testom trendu, kde testujeme zoradený vzíah medzi k funkciami prežívania definovanými v zmysle vektora váh0 = (e^,e2,...,ej,...,ek)T, potom a Hi Hi l0 : At (t) = \2{t) = ... = \k (t) At {t) = e^\k (t), A2 (/) = 02Xk (t), Xj(t) = 9jXk (t), Xk-, (t) = ek_,xk (t), kde bez straty na všeobecnosti môžeme předpokládat, že 0k = 1 Stanislav Katina Analýza prežívania (Survival analysis) Testovacia štatistika pre trend bude daná nasledovným vztahom Qtrend a po zložkách Qtrend 6>TV*0 (eMeU4/-e°M]) EU t^ťžt (EJLi flfeoKl-^Ey^ eMdj,]]' kde U* je U doplnené o k-ty element. Ďalej V* počítame tak ako V, ale s tým rozdielom, že ide o maticu k x k. Ak sú váhy lineárne, napr. Oj = j, potom hovoríme o teste lineárneho trendu. Platí Qresidual = Qoverall ~ Qtrend ~ Xk-2 Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie viacerých kriviek prežívania Príklad Example (trojvýberová situácia) Majme experiment, kde sme mali 3 rôzne koncentrácie látky (/conc-i = 2.0, konc2 = 1.5 a koncz = 0) a hfadali sme jej účinok na pacientov, u ktorých sme sledovali objavenie sa nádoru (pozri tabufku). (1) Nakreslite (a) kumulatívne riziko Akm,/(0> C3) kumulatívne riziko ANAj(t), (c) Kaplan-Meierove krivky prežívania SKMj(t) a (d) Breslowove krivky prežívania SBj{t),j = 1,2,3 (vždy po trojiciach do jedného obrázka). (2) Otestujte (a) H0 : A-i (t) = X2 (t) = A3 (t) oproti H-i : 3 aspoň jedno /' < j, Xj (t) / A7 (t) pomocou testovacích štatistík QGW, Q cm, Qjw a QPP; (b) H0: Ai (ŕ) = A2 (ŕ) = A3 (ŕ) oproti Ai (ŕ) = 0^X3 (t), A2 (ŕ) = e2A3 (ŕ), kde Oj = koncjj = 1,2 (test trendu) pomocou testovacej štatistiky Qtrend- Pozn.: časy do zlyhania alebo cenzúry; + znamená cenzúra, n0 = # pozorovaní v t0, konCj je koncentrácia látky v skupine j konCj "o 2.0 10 41 + 41 + 47 47+ 47+ 58 58 58 100+ 117 1.5 10 43+ 44+ 45+ 67 68+ 136 136 150 150 150 0 9 73+ 74+ 75+ 76 76 76+ 99 166 246+ Stanislav Katina Analýza prežívania (Survival analysis) Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie viacerých kriviek prežívania Príklad NA kumulativně riziko Krivky prežívania a IS 50 100 150 is do relapsu (v týždňoch) ""L 11 - _ ......... skup 3 40 60 80 100 120 149/149 Stanislav Katina Analýza prežívania (Survival analysis)