www.iba.muni.cz PLÁNOVÁNÍ, ORGANIZACE A HODNOCENÍ KLINICKÝCH STUDIÍ Základní pojmy analýzy přežití Analýza přežití •Hlavní charakteristikou odlišující data o přežití (survival data) od ostatních typů dat, např. od klasického vnímání mortality jako podílu zemřelých pacientů v klinických aplikacích, je jejich časová složka. • •Data o přežití totiž odráží nejen informaci o počtu, respektive podílu sledovaných událostí, ale zároveň nás také informují, kdy k dané události došlo. • •Analýza přežití zahrnuje matematicko-statistické metody pro hodnocení času do výskytu sledované události. • •Klíčovým prvkem analýzy přežití je definice sledované události (event of interest). Ta musí být stanovena jednoznačně a měla by být také snadno pozorovatelná či zjistitelná. Cenzorování •Definovaná událost se nemusí v průběhu sledování vyskytnout u všech subjektů (pozorování není kompletní). Čas přežití subjektů, u nichž v průběhu sledování nenastala definovaná událost, označujeme jako cenzorovaný (censored). • •Subjekty bez sledované události nelze v žádném případě z hodnocení vyloučit, neboť nepřítomnost události lze velmi často považovat za pozitivní ukazatel. • •Příčiny cenzorování: ukončení sledování (např. uzavření databáze), ztráta kontaktu s pacientem, výskyt události, která výskyt námi definované události jednoznačně vylučuje: kompetitivní událost (competing event). • •cenzorování zprava (right censoring), •cenzorování zleva (left censoring), •intervalové cenzorování (interval censoring). Cenzorování v klinickém hodnocení Vliv cenzorování na hodnocení přežití •Procento cenzorovaných subjektů ve studii bývá měřítkem kvality sledování daného souboru, protože výrazně ovlivňuje kvalitu odhadů přežití. Bez cenzorování 50 % cenzorovaných hodnot Význam délky sledování •Cenzorování vnímáme jako ztrátu informace. • •Vysoké procento cenzorovaných časů přežití může vypovídat o nedostatečné délce sledování, kdy jsme nebyli schopni pozorovat dostatečné množství událostí, které hodnotíme. • •Cenzorování tak má vliv na požadovanou velikost souboru hodnocených subjektů. • •Cenzorované časy přežití nejsou rovnocenné s kompletními časy přežití a v přítomnosti cenzorování je nutné navýšit velikost souboru tak, abychom zajistili dostatečný počet kompletních časů přežití. • •Předpoklad nezávislosti cenzorování a výskytu sledované události, tedy tzv. neinformativního cenzorování (non-informative censoring). Funkce přežití •Čas přežití (survival time) neboli dobu do výskytu sledované události reprezentujeme nezápornou náhodnou veličinou T, která představuje buď skutečný čas přežití daného subjektu, nebo cenzorovaný čas přežití. • • •Funkce přežití (survival function), označme ji S(t), vyjadřuje pravděpodobnost, že se náhodná veličina T realizuje na reálné ose až za danou hodnotou t, což znamená, že čas přežití daného subjektu bude větší, než je zvolený čas t. • • •Funkci přežití lze tedy zapsat jako: Medián přežití •Medián přežití (median survival time) je definován jako čas, ve kterém má funkce přežití hodnotu 0,5, tedy jako čas pro který platí S(t0,5) = 0,5. V klinických studiích zaměřených na hodnocení přežití pacientů se výpočet mediánu přežití stal standardem, který je reportován jako hlavní výsledek. • • • • • • • • • • • •Obdobně jako medián přežití jsme schopni definovat i další kvantily rozdělení pravděpodobnosti náhodné veličiny T. Čas, který bude 100·p-procentním kvantilem náhodné veličiny T, označme ho tp, je definován jako čas, pro který platí, že S(tp) = 1 – p. http://www.graphpad.com/faq/images/1764a.gif Kaplanův-Meierův odhad funkce přežití •Je nejznámějším a nejpoužívanějším neparametrickým odhadem funkce přežití, který se také stal standardem pro hodnocení přežití v klinických studiích. • •Myšlenka výpočtu: aby byl subjekt v čase t bez sledované události (aby se např. pacient s nádorovým onemocněním dožil času t), nesmí se u něj událost vyskytnout v žádném čase t* takovém, pro nějž platí, že t* < t. Čas ^ p1 p2 p3 p4 p5 p6 p7 p8 p9 p10 p11 p12 ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ t1 t2 t3 t4 t5 t6 t7 t8 t9 t10 t11 t12 Kaplanův-Meierův odhad funkce přežití •Při odhadu pravděpodobností přežití jednotlivých časů ti je třeba adekvátně zohlednit cenzorování. Cenzorované časy přežití totiž nelze hodnotit stejně jako kompletní pozorování, neboť nepřispívají k počtu událostí (di), ale zároveň je nelze z hodnocení vyřadit. • •Kaplanův-Meierův odhad pracuje s cenzorováním tak, že tato pozorování vypadávají ze skupiny subjektů v riziku ihned po zaznamenaném čase cenzorování. • •Vzorec pro Kaplanův-Meierův odhad funkce přežití: Počet subjektů v riziku sledované události v čase ti Počet sledovaných událostí v čase ti Intervalově specifický odhad přežití od času ti-1 do času ti Výsledek = schodovitá funkce •Výsledkem Kaplanova-Meierova odhadu je schodovitá funkce s poklesem v časech sledované události. Cenzorování odhad přežití nemění (mění ho pouze zprostředkovaně). graf_t1_n0_m0.emf Interval spolehlivosti pro K-M odhad •Samotný bodový odhad pravděpodobnosti přežití je nedostatečný. • • • • • • • http://www.spandidos-publications.com/article_images/etm/2/3/ETM-02-03-0491-g06.jpg Mají obě pravděpodobnosti přežití stejnou vypovídací hodnotu? Pozor na odhad mediánu přežití •Odhad mediánu přežití může být velmi ovlivněn cenzorováním časů přežití! • •Přesnost odhadu mediánu přežití souvisí s délkou sledování pacientů, ale medián přežití a medián délky sledování nemusí být nutně stejné! Příklad 1 Pacient Čas sledování Událost sledována 1 1,0 měsíce Ano 2 2,4 měsíce Ano 3 3,5 měsíce Ano 4 6,0 měsíců Ano 5 10,2 měsíců Ano Medián délky sledování = 3,5 měsíce obr1.jpeg Medián OS = 3,5 měsíce Příklad 2 Pacient Čas sledování Událost sledována 1 1,0 měsíce Ne (cenzorování) 2 2,4 měsíce Ne (cenzorování) 3 3,5 měsíce Ne (cenzorování) 4 6,0 měsíců Ano 5 10,2 měsíců Ano Medián délky sledování = 3,5 měsíce Medián OS = 6,0 měsíců obr2.jpeg Medián sledování vs. medián OS •Je tedy možné, že medián délky sledování byl 32,7 měsíce a zároveň 3leté OS = 0,54? • Změna mediánu OS Výsledky 2012 Výsledky 2013 Změna mediánu OS •I když medián OS a medián délky sledování nemusí být nutně stejné, medián OS je délkou sledování jednotlivých subjektů jednoznačně ovlivněn. • •Kvalita odhadu OS dále úzce souvisí s počtem pacientů ve sledování (tzv. v riziku sledované události) v čase! Změna mediánu OS Výsledky 2012 Výsledky 2013 logo-IBA logomuni Vyjádření rizik ve čtyřpolní tabulce logo-IBA logomuni logo-IBA logomuni Tomáš Pavlík Plánování, organizace a hodnocení klinických studií Motivace * Sledujeme souvislost věku matky a výskytu náhlého úmrtí kojence (SIDS). Výsledky dány v tabulce: * * * * * * * Pomocí Pearsonova chí-kvadrát nebo Fisherova exaktního testu můžeme rozhodovat o závislosti/nezávislosti dvou sledovaných veličin. Testy ale neumožňují tento vztah kvantifikovat. * Má-li to smysl a chceme-li kvantifikovat (rozhodovat o těsnosti této závislosti) můžeme použít tzv. relativní riziko (RR) a poměr šancí (OR). SIDS Věk matky Do 25 let 25 a více let Celkem Ano 29 15 44 Ne 7301 11241 18542 Celkem 7330 11256 18586 logo-IBA logomuni logo-IBA logomuni Tomáš Pavlík Plánování, organizace a hodnocení klinických studií Srovnávané skupiny * Pomocí RR i OR můžeme srovnat pravděpodobnosti výskytu sledovaného jevu ve dvou různých skupinách: * * 1. skupina s pravděpodobností výskytu události P1: * experimentální skupina – např. léčená novou léčbou * riziková skupina – např. hypertonici * skupina s expozicí určitému faktoru – např. horníci * * 2. skupina s pravděpodobností výskytu události P0: * kontrolní skupina * skupina bez expozice logo-IBA logomuni logo-IBA logomuni Tomáš Pavlík Plánování, organizace a hodnocení klinických studií Relativní riziko = Relative risk * Výpočet relativního rizika (RR) umožňuje srovnat pravděpodobnosti výskytu sledovaného jevu ve dvou různých skupinách. * 1. skupina – experimentální nebo skupina s expozicí určitému faktoru * 2. skupina – kontrolní nebo skupina bez expozice * * * * * Pravděpodobnost výskytu jevu v 1. skupině (experimentální) Pravděpodobnost výskytu jevu ve 2. skupině (kontrolní) Sledovaný jev Skupina Experimentální Kontrolní Celkem Ano a b a + b Ne c d c + d Celkem a + c b + d n logo-IBA logomuni logo-IBA logomuni Tomáš Pavlík Plánování, organizace a hodnocení klinických studií Příklad – relativní riziko * Sledujeme souvislost věku matky a výskytu náhlého úmrtí kojence (SIDS). Výsledky dány v tabulce: SIDS Věk matky Do 25 let 25 a více let Celkem Ano 29 15 44 Ne 7301 11241 18542 Celkem 7330 11256 18586 Riziko výskytu SIDS u dětí matek ve věku do 25 je téměř třikrát vyšší než u dětí matek rodících ve vyšším věku. logo-IBA logomuni logo-IBA logomuni Tomáš Pavlík Plánování, organizace a hodnocení klinických studií Riziko vs. „šance“ (odds) * Riziko a pravděpodobnost – odhad pravděpodobnosti vzniku onemocnění * Relativní riziko – poměr dvou pravděpodobností * * Šance – poměr pravděpodobnosti výskytu jevu a výskytu opačného jevu * * * * nabývá hodnot mezi 0 a nekonečnem * pokud kůň vyhraje s pravděpodobností 10%, jaká je jeho šance na výhru? logo-IBA logomuni logo-IBA logomuni Tomáš Pavlík Plánování, organizace a hodnocení klinických studií Poměr šancí = Odds ratio * Poměr šancí (OR) je další charakteristikou, která umožňuje srovnat výskyt sledovaného jevu ve dvou různých skupinách. * 1. skupina – experimentální nebo skupina s expozicí určitému faktoru * 2. skupina – kontrolní nebo skupina bez expozice * Pravděpodobnost výskytu jevu v 1. skupině (experimentální) Pravděpodobnost výskytu jevu ve 2. skupině (kontrolní) 1 – Pravděpodobnost výskytu jevu v 1. skupině (experimentální) 1 – Pravděpodobnost výskytu jevu ve 2. skupině (kontrolní) Sledovaný jev Skupina Experimentální Kontrolní Celkem Ano a b a + b Ne c d c + d Celkem a + c b + d n logo-IBA logomuni logo-IBA logomuni Tomáš Pavlík Plánování, organizace a hodnocení klinických studií Příklad – odds ratio * Sledujeme souvislost věku matky a výskytu náhlého úmrtí kojence (SIDS). Výsledky dány v tabulce: SIDS Věk matky Do 25 let 25 a více let Celkem Ano 29 15 44 Ne 7301 11241 18542 Celkem 7330 11256 18586 „Šance“ na výskyt SIDS u dětí matek ve věku do 25 je téměř třikrát vyšší než u dětí matek rodících ve vyšším věku. logo-IBA logomuni logo-IBA logomuni Tomáš Pavlík Plánování, organizace a hodnocení klinických studií Grafické srovnání RR a OR A B RR = OR = Výskyt sledovaného jevu Bez výskytu sledovaného jevu logo-IBA logomuni logo-IBA logomuni Tomáš Pavlík Plánování, organizace a hodnocení klinických studií Umělý příklad – pití slazených nápojů * Sledujeme vliv pití slazených nápojů na výskyt zubního kazu. Výsledky dány v tabulce: Zubní kaz Pití slazených nápojů Ano Ne Celkem Ano 34 19 53 Ne 16 31 47 Celkem 50 50 100 logo-IBA logomuni logo-IBA logomuni Tomáš Pavlík Plánování, organizace a hodnocení klinických studií Komentáře k RR, OR * hodnota relativního rizika leží mezi 0 a 1/P0 * pro běžné jevy nelze pozorovat vysoké hodnoty relativního rizika pokud je riziko v kontrolní skupině 66%, maximální RR je 1,5 * * OR je obtížnější interpretovat * může být vhodné konvertovat na RR, musíme ale znát riziko v kontrolní skupině * * * * nevychází stejně, ale oba jsou validní ukazatele účinku * ALE POKUD SE NEJEDNÁ O VZÁCNÝ JEV, OR NELZE INTERPRETOVAT JAKO RR!!! * logo-IBA logomuni logo-IBA logomuni Tomáš Pavlík Plánování, organizace a hodnocení klinických studií Výhody a nevýhody RR a OR * Nevýhoda OR: * obtížná interpretace. * * Výhoda i nevýhoda RR: * nezajímá ho samotná pravděpodobnost výskytu jevu, ale pouze jejich podíl → korektní použití RR je však pouze v případě, že pravděpodobnost výskytu jevu v kontrolní skupině je reprezentativní (není ovlivněna výběrem sledovaných subjektů). * logo-IBA logomuni logo-IBA logomuni Tomáš Pavlík Plánování, organizace a hodnocení klinických studií Prospektivní a retrospektivní studie * Prospektivní studie * U některých subjektů je rizikový faktor přítomen a u jiných ne → sledujeme v čase, zda se vyskytne událost. * * Retrospektivní studie * U některých subjektů se událost vyskytla a u jiných ne → zpětně hodnotíme, zda se liší s ohledem na nějaký rizikový faktor. * logo-IBA logomuni logo-IBA logomuni Tomáš Pavlík Plánování, organizace a hodnocení klinických studií Použití RR a OR * Prospektivní studie – u některých subjektů je rizikový faktor přítomen a u jiných ne → sledujeme, zda se vyskytne událost. * Zjištěná pravděpodobnost výskytu události v kontrolní skupině je reprezentativní, neboť prospektivně zařazujeme všechny pacienty → korektní použití RR. * * Retrospektivní studie – u některých subjektů se událost vyskytla a u jiných ne → zpětně hodnotíme, zda se liší s ohledem na nějaký rizikový faktor. * Zjištěná pravděpodobnost výskytu události v kontrolní skupině není reprezentativní, neboť ji ovlivňujeme zpětným výběrem skupin subjektů. → nekorektní použití RR. → korektní použití OR. logo-IBA logomuni logo-IBA logomuni Tomáš Pavlík Plánování, organizace a hodnocení klinických studií * Relativní redukce rizika (RRR) * * * * * * Absolutní redukce rizika (ARR) Další způsoby vyjádření rozdílu rizika ARR = Bez léčby S léčbou RRR = 1 - RR = 1 - logo-IBA logomuni logo-IBA logomuni Tomáš Pavlík Plánování, organizace a hodnocení klinických studií Další způsoby vyjádření rozdílu rizika ARR = 20% Pro snížení počtu událostí o 20 je třeba léčit 100 pacientů. NNT = NNT = Pro snížení počtu událostí o 1 je třeba léčit 5 pacientů. * Počet pacientů, které je potřeba léčit, abychom zabránili výskytu jedné události – „number needed to treat“ (NNT). * * * www.iba.muni.cz RIZIKOVÁ FUNKCE A POMĚR RIZIK V ANALÝZE PŘEŽITÍ Riziková funkce, kumulativní riziko •Riziková funkce (hazard function) vyjadřuje intenzitu výskytu sledované události v čase t za podmínky, že subjekt přežil do času t: •Kumulativní rizikovou funkci (cumulative hazard function, integrated hazard) získáme integrací rizikové funkce podle času: • • • • • • •Kumulativní riziková funkce odpovídá celkovému riziku výskytu sledované události od začátku sledování až do času t. Vzhledem k tomu, že se jedná o riziko a nikoliv o pravděpodobnost, není funkce H(t) na rozdíl od funkce přežití S(t) shora omezena číslem 1. Různý průběh rizikové funkce čas konstantní riziko čas rostoucí riziko čas rostoucí i klesající riziko čas klesající riziko Poměr rizik •Model proporcionálních rizik (proportional hazards models) : • • • •Výraz exp(xi’β) vyjadřuje tzv. poměr rizik (hazard ratio, HR) daného subjektu vzhledem k subjektu se základním rizikem (tzv. referenční kategorii), který je definován pomocí vektoru vysvětlujících proměnných xi = 0. • •Obecně lze poměr rizik pro subjekty s vektory vysvětlujících proměnných x1 a x2 vyjádřit pomocí vztahu: • • • • • •Vektorem xi = 0 tak většinou označujeme subjekty odpovídající referenční skupině pacientů. Poměr rizik a regresní koeficienty • • • •Vliv vysvětlujících proměnných na riziko výskytu sledované události je vyjádřen prostřednictvím jednotlivých regresních koeficientů, které udávají změnu v riziku výskytu sledované události spojenou se změnou hodnoty vysvětlující proměnné k. • •Regresní koeficienty přímo souvisí s pojmem poměr rizik: • • • • •Jsou-li hodnoty všech ostatních proměnných stejné, pak koeficient βk lze pomocí exponenciální transformace vyjádřit jako • Interpretace regresních koeficientů •Hodnota regresního koeficientu βk představuje hodnotu, o kterou se zvýší přirozený logaritmus rizikové funkce, pokud se hodnota k-té proměnné zvýší o jednu jednotku za předpokladu, že ostatní vysvětlující proměnné se nezmění. • •Kladné znaménko regresního koeficientu znamená, že riziko sledované události je větší u pacienta s vyšší hodnotou odpovídající vysvětlující proměnné. • •Naopak záporný koeficient nám říká, že má daná vysvětlující proměnná s vyšší hodnotou protektivní účinek, tzn. riziko výskytu sledované události je nižší. • • Proměnná Sledovaná kategorie Koeficient beta Poměr rizik (HR) Věk Nad 65 let 0,470 1,60 Léčba Experimentální -0,511 0,60 Poměr rizik – příklad •Sledujme vliv pohlaví (muž) a věku (nad 65 let) na přežití pacientů. Kódování proměnných: muž = 1, žena = 0; věk nad 65 let = 1, věk pod 65 let = 0. • •Výsledek modelu: β1 = 0,405; β2 = 0,693. •Rovnice pro poměr rizik: exp(pohlaví*β1 + věk*β2). Pohlaví (1) Věk (2) Výpočet Poměr rizik (HR) Muž (kategorie 1) Nad 65 let (kategorie 1) exp(pohlaví*β1 + věk*β2) exp(0,405 + 0,693) = 3,0 Muž (kategorie 1) Pod 65 let (kategorie 0) exp(pohlaví*β1 + věk*β2) exp(0,405) = 1,5 Žena (kategorie 0) Nad 65 let (kategorie 1) exp(pohlaví*β1 + věk*β2) exp(0,693) = 2,0 Žena (kategorie 0) Pod 65 let (kategorie 0) exp(pohlaví*β1 + věk*β2) exp(0) = 1 Statistická významnost koeficientů •Je třeba otestovat, jak moc (zda statisticky významně) se regresní koeficient liší od nuly. • •Existují standardní statistické testy. • •Na statistickou významnost na hladině významnosti α = 0,05 % lze usuzovat i z 95% intervalu spolehlivosti. Proměnná Sledovaná kategorie Poměr rizik (HR) 95% interval spolehlivosti Věk Nad 65 let 1,60 1,30 – 2,00 Léčba Experimentální 0,60 0,45 – 0,72 Věk Nad 65 let 1,60 0,80 – 7,40 Léčba Experimentální 0,60 0,13 – 1,66 www.iba.muni.cz Děkuji za pozornost