RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Blok 8 Jak analyzovat přežití pacientů Janoušová, Dušek: Analýza dat pro neurovědy ^j^- Osnova i- 1. Analýza přežití 2. Coxův model proporcionálních rizik Janoušová, Dušek: Analýza dat pro neurovědy ^j^- 1. Analýza přežití Janoušová, Dušek: Analýza dat pro neurovědy ^ Analýza přežití • Analýza doby od vstupní události do výskytu sledované (koncové) události. • Vstupní událost - např.: - narození - začátek léčby - počátek nemoci - vstup do studie - dosažení remise (uzdravení pacienta) - operace - začátek používání přístroje • Koncová (sledovaná) událost - např.: - úmrtí - výskyt progrese onemocnění - výskyt relapsu onemocnění (tzn. návrat onemocnění) - dosažení remise (uzdravení pacienta) - porucha přístroje • Dobu mezi vstupní a koncovou událostí nazýváme jako doba přežití. MU v-"<^ Janoušová, Dušek: Analýza dat pro neurovědy Analýza přežití Uplatnění analýzy přežití: - v lékařském výzkumu: - hodnocení celkového přežití („Overall Survival" - OS) - hodnocení času do progrese („Progression-free Survival" - PFS) - a další - v průmyslu - v zemědělství MU ,....., Janoušová, Dušek: Analýza dat pro neurovědy *|L 6 Cenzorova n í • Doba přežití dané osoby je cenzorována, pokud během pozorování nenastane sledovaná událost - důvody: - ztráta kontaktu s danou osobou (osoba se přestěhuje nebo přestane chodit na prohlídky) - v době uzavření studie se sledovaná událost ještě nevyskytla - pozorovaná osoba zemřela na jinou nemoc Ukončení studie Ztracen ze sledování > Nepozorovaný čas úmrtí ____ Nepozorovaný čas úmrtí Cenzorování ^ Úmrtí na jinou nemoc > Úmrtí v cas Janoušová, Dušek: Analýza dat pro neurovědy ^j^- J^fj Analýza přežití-vstupní data )- • Pro každého člověka dvojice hodnot: TV V V • . f - cas přežiti: - u osob, u nichž sledovaná událost nastala, je to čas od vstupní události do sledované události - u osob, u nichž sledovaná událost nenastala, je to čas od vstupní události do ukončení studie - C - identifikátor cenzorování - pouze 2 hodnoty: - 1... sledovaná událost nastala - 0 ... sledovaná událost nenastala (osoba je cenzorována) • Cenzorovaná pozorování (tzn. osoby, u nichž sledovaná událost nenastala) nesmíme z analýzy vyhodit - obsahují informaci!!! Janoušová, Dušek: Analýza dat pro neurovědy ^ Neparametrické odhady křivky přežití • V klinickém výzkumu i populačním modelování jsou pro popis přežití standardem neparametrické metody - Kaplan-Meierova metoda a metoda Life-tables. 1. Kaplan-Meierova metoda - založena na jednotlivých pozorovaných časech přežití, vhodná zejména pro hodnocení dat klinických studií - vyžaduje přesný záznam doby sledování. 2. Life-tables - založena na agregaci pozorování do časových intervalů, vhodná zejména pro popis přežití na populační úrovni, kde není k dispozici tak kvalitní záznam doby sledování. Janoušová, Dušek: Analýza dat pro neurovědy ^ Kaplan-Meierova křivka přežití 1,0 ■ 0,9 ■ 0,8 ■ _Q O 0,7 - co O 0.6 - <~ U 0,5 - u >řši 0,4 - sP 0,3 - 0,2 - 0,1 0.0 - Celkové přežití pacientů s epilepsií Necenzorovaná osoba Cenzorovaná osoba Vstupní data _i_i_i_i_i_i_i_i_ _i_i Pacient Čas Úmrtí 1 1 1 2 2 1 3 2 0 4 3 0 5 4 1 6 4 1 7 4 0 8 5 0 9 6 0 10 7 1 11 8 0 0 1 2 3 4 5 6 7 & S Doba od zahájení léčby (v letech) Křivka přežití odráží procento žijících osob v daném čase. Křivka přežití je klesající: - pokles křivky přežití nastane v čase koncové události u necenzorované osoby - velikost „schodu'' je dána počtem osob, kteří v daném čase zůstávají „v riziku'' MU v-"<^ Janoušová, Dušek: Analýza dat pro neurovědy ^ ^ Křivka přežití - hodnocení x-letého přežití 1 o 0.9 0,818 0.3 OJ 0,6 0,584 0 5 s> 0,4 o o 0,3 5 02 u ■ 0.0 Celkové přežití pacientů s epilepsií n-- >N (D Q. +-« 3 O > Q *-1 >N (D Q. sOí +-« +-« 0 1 2 3 4 & 6 7 Doba od zahájení léčby (v letech) Kaplan-Meier (Product-limit) analysis (Data_preziti) Note: Censored cases are marked with + 1 2 3+ 4+ 5 6 7+ 8+ 9+ 10 11 + Time 1 2 3 4 4 4 6 7 8 Cumulative Standard Error Survival 0,909 ■►0,818 0,701 0,584 A 0,292 2-leté přežití: 81,8% (tzn. po dvou letech od zahájení léčby žije 81,8% pacientů) 5-leté přežití: 58,4% (tzn. po pěti letech od zahájení léčby žije 58,4% pacientů) Janoušová, Dušek: Analýza dat pro neurovědy 0,087 0,116 0,147 0,163 0,222 IBA W li Křivka přežití- hodnocení x-letého přežití-výpočet intervalu spolehlivosti Výpočet intervalu spolehlivosti pro x-leté přežití: Odhad pravdepodobnosti . - nc ^r-, .. . \ ± 1,96 x SE odhadu prežití v case t Kaplan-Meier (Product-limit) analysis (Data_preziti) Note: Censored cases are marked with + 1 2 3+ 4+ 5 6 7+ 8+ 9+ 10 11 + Time 1 o 2 3 4 4 4 6 7 8 Cumulative Survival 0,909 > 0,818 0,701 0,584 0,292 Standard Error 0,087 0,116 0,147 0,163 0,222 Dolní mez IS: Horní mez IS: 0,818 - 1,96 * 0,116 = 0,591 0,818 + 1,96 * 0,116 = 1,045 0,584 - 1,96 * 0,163 = 0,265 0,818 + 1,96 * 0,116 = 0,903 Závěr: 2-leté přežití: 81,8% (59,1%; 100,0%) 5-leté přežití: 58,4% (26,5%; 90,3%) Janoušová, Dušek: Analýza dat pro neurovědy IBA W 12 Upozornění * Pokud horní mez intervalu spolehlivosti vyjde větší než 1 (tzn. 100%), je třeba toto číslo nahradit hodnotou 1 (resp. 100%). * Pokud dolní mez intervalu spolehlivosti vyjde menší než 0 (tzn. 0%), je třeba toto číslo nahradit hodnotou 0 (resp. 0%). > Procento žijících lidí totiž nemůže být větší než 100% a menší než 0% ! Janoušová, Dušek: Analýza dat pro neurovědy ^j^- 13 Křivka přežití - medián přežití Medián přežití je čas od vstupní události, v němž je pravděpodobnost přežití 50%, tedy čas, kterého se podle očekávání dožije polovina sledovaných pacientů. Celkové přežití pacientů s epilepsií 1,0 - 0,9 - 0,3 - 0,7 - _Q O 0,6 - co O <— U 0,5 ■ u 0,4 - sP 0,3 - 0,2 - 0,1 0,0 - Medián přežití 1 2 3 4 5 & 7 Doba od zahájení léčby (v letech) Závěr: Medián přežití je 7 let. (Tzn. čas, kterého se dožila polovina sledovaných pacientů, je 7 let.) e s Janoušová, Dušek: Analýza dat pro neurovědy IBA W 14 Křivka přežití - medián přežití v softwaru STATISTICA Software STATISTICA provádí interpolaci - počítá aproximativní medián. Nevadí to, pokud je velký počet sledovaných událostí. Celkové přežití pacientů s epilepsií _Q O co O U U 1,0 o,9 o,s oj 0,6 0,5 0,4 0.3 0,2 0 1 0.0 Medián přežití 1 2 3 4 4,9 5 & 7 Doba od zahájení léčby (v letech) Survival Time 25'th percentile (lower quartile) 3,2 50'th percentile (median) -> 4,9 75'th percentile (upper quartile) Závěr: Medián přežití je 4,9 let. e s Janoušová, Dušek: Analýza dat pro neurovědy IBA W 15 Poznámky )- • Sestrojovat křivky přežití za každou cenu je mnohdy zavádějící - zvláště v případě použití stratifikačních kritérií vedoucích k nízkým N ve skupinách. riziko zkreslení a dezinterpretace výsledků!! • Podíl cenzorovaných pozorování je důležitou charakteristikou - je vhodné uvádět: - Podíl pacientů ztracených ze sledování (lost to follow-up). - Podíl pacientů „bez události" na konci studie. • S křivkami přežití by měla být vždy reportována maximální a minimální doba sledování dosažitelná ve studii (dáno začátkem náboru a datem ukončení studie) - samozřejmě ve vztahu k události, která nás zajímá. • Je nutné mít na paměti nízkou věrohodnost „konce" křivky přežití - zůstává-li ve studii 10 pacientů nebo méně, „skoky" v přežití s každou další událostí jsou dramatické. MU v-"<^ Janoušová, Dušek: Analýza dat pro neurovědy ^ ^ Srovnání křivek přežití Častým cílem klinického výzkumu je srovnání přežití dvou a více skupin pacientů Standardem v analýze klinických dat jsou opět neparametrické testy: - Log-ranktest - Gehanův-Wilcoxonův test Log-rank test je zaměřen na srovnání očekávaných a pozorovaných počtů událostí v jednotlivých skupinách Gehanův-Wilcoxonův test umožňuje klást větší důraz na rozdíly v raných fázích sledování pacientů. S(t) v čase Janoušová, Dušek: Analýza dat pro neurovědy IBA W 17 Srovnání křivek přežití - ukázka Celkové přežití +-' c CD 'u 03 CL U S — u >Fši v — "a o a. 1.0 0.9 ■ 0.8 0.7 0.6 0.5 -I 0.4 0.3 0.2 0.1 ] 11 m n m lín ii i i 0.0 -U 4 i m i m 1 i iii n i i Nízké riziko Střední riziko Vysoké riziko 12 24 36 Čas [měsíce] 48 60 MU ..•*■'-, Janoušová, Dušek: Analýza dat pro neurovědy (^j 18 Srovnání dvou křivek přežití - příklad Příklad: Srovnejte přežití pacientů, kteří byli léčeni dvěma různými preparáty. 1,0 0,9 [ — I 0,8 - ■I °>6 r f 0,5 h o H—■ — ZD E ZD O 0,4 [-0,3 0.2 ■ 0 1 ■ 0,0 ■ Celkové přežití +■ -+ _i_i_i_i_i_i_i_i 0 1 2 3 4 5 6 7 & 9 Time Group 1, Group 2, Life Table for Group 1 and Group 2 (Data_preziti_2kat) Group 1: Code 1, Group 2: Code 2 Group 1: Group 2: Cum.% Cum.% 1,00 100,0 100,0 1,78 90,9 100,0 2,56 81,3 100,0 3,33 81,3 100,0 4,11 56,3 87,5 4,89 56,3 87,5 5,67 56,3 72,9 6,45 56,3 72,9 7,22 28,2 72,9 8,00 28,2 Log-rank test: p=0,231 Janoušová, Dušek: Analýza dat pro neurovědy I BA M 19 Srovnání třech křivek přežití - příklad • Příklad: Srovnejte přežití pacientů se třemi diagnózami (CML, CLL a AML). Celkové přežití 1,0 0 9 I 0.8 1" f 0.5 í 0-4 I 0.3 o 0 2 0,1 0,0 + ■ H-1- _I_I_I_I_I_I_I_I 2345678 9 Time Group 1 Group 2 Group 3 Group 1 Group 2 Group 3 ,50 100,0 100,0 100,0 1,33 90,9 100,0 62,5 2,17 81,3 100,0 62,5 3,00 81,3 100,0 46,9 3,83 81,3 100,0 28,1 4,67 56,3 86,7 0,0 5,50 56,3 72,2 0,0 6,33 56,3 72,2 0,0 7,17 28,2 72,2 0,0 8,00 28,2 0,0 p=0,007 Janoušová, Dušek: Analýza dat pro neurovědy IBA W 20 2. Coxův model proporcionálních rizik Janoušová, Dušek: Analýza dat pro neurovědy \(^J Coxův model proporcionálních rizik • Analýza vlivu prognostických faktorů onemocnění na přežití pacientů, na dosažení remise apod. • Příklad: Testování vlivu binární proměnné (např. užívání léčby B) na celkové přežití. Výsledek analýzy: Variable Hazard ratio (HR) 95%conf. Int. P-value (poměr rizik) DRUG B 2.18 1.4-3.5 0.001 Interpretace: U pacientů užívajících v období před vstupem do studie přípravek B, je více jak dvojnásobně vyšší riziko úmrtí ve sledovaném období než u pacientů neužívajících přípravek B. HU ...... Janoušová, Dušek: Analýza dat pro neurovědy ^j^- |^| 22 Coxův model proporcionálních rizik • Příklad: Testování vlivu kategoriální proměnné (např. věk při diagnóze) na celkové přežití. Výsledek analýzy: Age group HR 95% conf. Int. P-value 1: [20-29] 1.0 2: [30-34] 3.31 1.37-8.01 <0.001 3: [35-39] 3.72 1.51-9.14 <0.001 4: [40-54] 6.43 2.56-16.12 <0.001 Interpretace: S rostoucím věkem při diagnóze roste riziko úmrtí ve sledovaném období. Nárůst rizika je vztažen k věkové skupině 20 - 29 let. MU v-"<^ Janoušová, Dušek: Analýza dat pro neurovědy (^J 23 Coxův model proporcionálních rizik • Příklad: Testování vlivu spojité proměnné (např. věk při diagnóze) na celkové přežití. Výsledek analýzy: Variable HR 95%conf. Int. P-value AG F ^ [5 years interval] 1.50 1.3-1.8 <0.001 Interpretace: Nárůst věku při diagnóze o 5 let zvyšuje riziko úmrtí 1,5-krát. Janoušová, Dušek: Analýza dat pro neurovědy ^ ^4 Coxův model proporcionálních rizik-důležité! Coxův model má smysl počítat, pokud se křivky přežití od sebe postupně oddalují. Pokud se křivky oddálí a pak se zase přiblíží nebo pokud se dokonce křivky překříží, tak nelze Coxův model pro výpočet poměru rizik (hazard ratio) použít! OK 0 1 2 3 4 5 Janoušová, Dušek: Analýza dat pro neurovědy IBA W 25 Coxův model proporcionálních rizik - příklad Příklad: Vypočtěte poměr rizika úmrtí podle ECOG skóre. CO =1 o C j mu lati v e Proportion Surviving (Kapia n-Meier) o Complete + Censored 160 Group 0. Group 1. Parameter Estimates (Data_Cox) Standard Error Chi-square P\ \ ilue V 95% Lower CL 95% Upper CL Hazan Ratio 95% Hazard Ratio Lower CL 95% Hazard Ratio Upper CL II ECOG1 0,192764 20,60900 0,000006 0.497283 1,252903 2.399098 1,644-247| 3,500491 Janoušová, Dušek: Analýza dat pro neurovědy IBA M 26 Coxův model proporcionálních rizik - úkol Úkol: Vypočtěte poměr rizika úmrtí podle typu léčby. Celkové přežití 1.0 0,9 — 1 0.8 I I 06 I 0.5 — — — 0 4 0.3 0.2 0,1 0.0 4--—, L----- H-h _i_i_i_i_i_i_i_i_i 01 23456789 Time — Group 1, — Group 2, Parameter Estirrj ijes (Data_preziti_2kat} ^ Chi-square P ralue 95% Lower CL 95% Upper CL Hazarn Ratio 95% Hazard Ratio Lower CL 95% Hazard Ratio Upper CL Skupina 1.204534 0.2724 1 7 -2.58078 0.727986 0.395977 0.075715 2.070905 Janoušová, Dušek: Analýza dat pro neurovědy IBA W 27 Poděkování.. Příprava výukových materiálů předmětu „DSAN01 Analýza dat pro Neurovědy " byla finančně podporována prostředky projektu FRVŠ č. 942/2013 „Inovace materiálů pro interaktivní výuku a samostudium předmětu Analýza dat pro Neurovědy" FOND ROZVOJE VYSOKÝCH ŠKOL Janoušová, Dušek: Analýza dat pro neurovědy ^j^- 28