ZÁKLADY STATISTIKY V KLINICKÝCH STUDIÍCH Adam Svobodník November 21, 2024 1 Program kurzu 1. Proč bych se měl vzdělávat ve statistice? 2. Fáze klinického vývoje 3. Základní pojmy z designu klinických studií 4. Koncept P-hodnoty 5. Specifické designy klinických studií 6. Základy deskriptívni statistiky November 21, 2024 2 1. Proč bych se měl vzdělávat ve statistice? Proč je statistika v klinickém výzkumu „životně" důležitá? Proč je biostatistika v klinickém výzkumu „životně" důležitá? ňtifič ^ $ How a New Hope in Canc fell aPart překlad z angličtT ealth/research/08genes.html?_r=l& SIjcNrUrtlorkiEiuirs Research ..- ...... li o. I7VLE TRAVEL JO* 1 MAiÉltAÍE Search Health :- -:: :s Renovated Apartments Dmis JIM, Vol. 2. Ha. 4, TtCtl: lU.llZU/ULLAOASi^l © IcirtJLutc: of MtthomBt LcaJ StuLvtJcc, lULfJ DERIVING CHEM0SENSITIV1TY FROM CELL LINES: FORENSIC BIOINFORMATICS AND REPRODUCIBLE RESEARCH IN HIGH-THROUGHPUT BIOLOGY By Keith A. Bamjerly1 and Kevin R. Coombes2 University of Texas St The Duke University scandal When Juliet Jacobs found out she had lune cancer- she was :;rr:::=d but realized :ha: her h::-= '.a;1 ;s :-is b^" treatment medicine could :::er. 3: she set a second opinion: then a third. In February of soio - she ended up at Duke University, where she entered a research study whose promise * TWITE* seemed stunnine. Doctors would assess her turn:r ce".".s- ".::k:^| :cr sens pa::^rr.= that would determine which drugs Skilled Nursing and Short-term & Outpatient Rehab 'not exhaustive; Further problems similar to the ones detailed above are described in the supplementary reports. The case studies also share other commonalities. In particular, they illustrate that the most common problems are simple: for example, confounding in the experimental design (all TET before all FEC), mixing up the gene labels (off-by-one errors), and mixing up the group labels (sensitive/resistant); most of these mixups involve simple switches or offsets. These mistakes are easy to maie. particularly if working with Excel or if working with 0/1 labels instead of names (as with binxeg). We have encountered these and like problems before. As part of the 2002 Competitive Analysis of Microarray Data (CAMDA) competition. Stivers et al. (2003) identified and corrected a mix up in annotation affecting roughly a third of the data which was dm^n by a simple one-cell Paradox současnosti Pokrok v technologiích umožňuje komukoliv provádět složité a sofistikované výpočty (např. data mining). Při absenci znalosti základních statistických technik tak roste riziko: - chybných výsledků - nebo chybné interpretace správných výsledků Pro správnou interpretaci výsledků klinických studií je potřeba „klinické" i „statistické" know-how ale také nenahraditelný zd ravý „selský rozum" 2. Fáze klinického vývoje Realita vývoje nového přípravku Stage 1 Drug discovery Stage 2 Pre-clinical development Stage 3 Clinical development Vt?K. » Effectiveness at treating diseases Larger scale safety and effectiveness Long term safety Úloha statistika v klinickém výzkumu 1 compound Dissemination - Publications tracking and coordination - Manuscript development and review - Posters, presentations, webcasts - Public use datasets Analysis - Enrollment tracking - Interim analysis and reporting - Data cleaning - SMC and DSMB table design and creation - Results analysis Implementation - Secure web-based data capture (CFR21 p.11 compliant) - Data and safety monitoring (including site - Clinicaltrials.gov reporting \f monitoring and audits) - Study materials tracking - Regulatory tracking - Committee management (DSMB, SMC) - IND managementissemination - Cross study communication and leadership Study design & Planning - Proposal development - Regulatory approvals - Statistical methods identification - Development of SOPs and governance policies - Sample size calculation - Customized training curriculum for diverse - Custom form development and database design clinical environments - Randomization and blinding „Standardní" proces vývoje nového přípravku Laboratorní vývoj Pre-klinicky vývoj Klinické studie: Faze I 1 Fáze II Fáze III Registrace a zavedení do praxe Post-marketingové studie The binary nature of drug regulation EUROPfAIN MíPlClN£5 řGSNCÍ Current model of licensing "The Magic Moment" Evidence vs. access tradeoff Time (years) Převzato EMA, Eichler HG, 2012 6 Going beyond 'binary'; a better model for drug regulation? Current model of licensing "The Magic Moment" Adaptive Licensing Převzato EMA, Eichler HG, 2012 Fáze klinických studií z hlediska analýzy dat Klinické hodnocení „FÁZE I" • Stanovení základních humánních farmakokinetických parametrů přípravku • Stanovení maximální tolerovatelné dávky MTD (cytostatika apod.) • Sledování nežádoucích účinků (bezpečnost) . „Dose finding" studie • Subjekty hodnocení . 12-20 . Většinou zdraví dobrovolníci . Nikdy ne vulnerabilní osoby • Design . Ideální uspořádání experimentu vede k odhadu základních parametrů křivky "dose - response" • Z etických důvodů využívány adaptivní designy: následující dávka je stanovena na základě odpovědi subjektu hodnocení na dávku předchozí . První dávka je stanovena na základě preklinického hodnocení přípravku (animální testy) „Dose-finding" studie 3 subjects, initial dose Another 3 subjects, higher dose NO Another 3 subjects Initial dose Another 3 subjects, higher dose NO End of study Klinické hodnocení „FÁZE II" • Ověření účinnosti testovaného přípravku . Hodnocení tolerance nebo bezpečnosti • Opodstatnění testování přípravku v rozsáhlejších KH • Subjekty hodnocení .20 - 200 . počet hodnocených subjektů . fixní . nábor po skupinách . sekvenční design (průběžné hodnocení odpovědi každého SH) • Design • Ojediněle randomizace • Jednoramenná KH . Účinek a toxicita srovnávány se standardně používanou terapií nebo placebem • „Pilot trial" (NA) .„Pivotal trial" (MB) Klinické hodnocení „FÁZE III" . Srovnání účinnosti a bezpečnosti testovaného přípravku se standardem (aktivní kontrolou) nebo placebem • Vytvoření podkladů pro povolení k užívání . "Cost - effectivness" analýzy • Subjekty hodnocení . 100- 1 000 . počet hodnocených subjektů . fixní . nábor po skupinách . sekvenční design (průběžné hodnocení odpovědi každého SH) • Design . Paralelní . „Cross - over" • Faktoriální . Randomizace Klinické hodnocení „FÁZE III": Paralelní design Tento typ uspořádání je charakteristický pro KH fáze III kde je srovnávána účinnost a bezpečnost dvou nebo více terapeutických postupů. Základním prvkem designu je randomizace SH do jednotlivých léčebných skupin, v průběhu celého KH je zachováno jedinečné přiřazení SH do léčebných skupin. subjekty hodnocení zařazené do klinické studie R A N D 0 M 1 Z A C E hodnocený přípravek kontrolní léčba Klinické hodnocení „FÁZE III": Crossover uspořádání Tento typ uspořádání je nejčastěji používaný v KH kde předpokládáme velkou interindividuální variabilitu v účinnosti a bezpečnosti hodnocených léčivých přípravků. Základem je časově oddělená aplikace všech srovnávaných přípravků všem SH. subjekty hodnocení zařazené do klinické studie R A N D 0 * M 1 Z A C E 1. sekvence 2.sekvence 1, perioda hodnocený přípravek kontrolní léčba wash-out perioda 2. perioda kontrolní léčivý přípravek hodnocený léčivý přípravek Klinické hodnocení „FÁZE IV" . Potvrzení vlastností hodnoceného přípravku za „reálných" podmínek . Detailní analýza nežádoucích účinků . Hodnocení kvality života • Úpravy dávkovacího režimu přípravku . „Cost-effectiveness" studie • Design . Deskriptívni studie (analýza běžných informačních databází o pacientech) • „Cross - sectional" studie (analýza voleného strukturovaného vzorku pacientů) • „Case - control" studie (retrospektivní studie založené na párové volbě kontrolní skupiny) . Kohortní studie (retrospektivní nebo prospektivní srovnání kohorty s kontrolní skupinou) 3. Základní pojmy z designu klinických studií Randomizace Metoda a proces náhodného (pseudonáhodného) rozdělování subjektů hodnocení do dvou nebo více léčebných skupin. Investigational Group Základní klasifikace randomizačních technik . Nepřípustné: Randomizace SH na základě: -> Pořadového čísla vstupu do KH Iniciál SH -> Data narození -> Data vstupu do KH • Méně vhodné: -> Kompletní randomizace . Doporučené: -> Permutační bloková randomizace -> Stratif i kovaná permutační bloková randomizace ^Adaptivní randomizace - Minimalizace - Metoda "Play the winner" - Metoda "falešné mince" nebo "osudí" Kompletní randomizace - riziko nevyváženého počtu SH v léčebných skupinách N = 100SH P(A)= 0,5 ... pravděpodobnost randomizace SH do ramene A P(B) = 0,5 .. pravděpodobnost randomizace SH do ramene B P(r)............pravděpodobnost ekvivalentního počtu SH v obou ramenech studie (r)[x=n/2] n n 2 J = 8% c Závěr: Při použití kompletní randomizace je pravděpodobnost shodného počtu SH ve dvou léčebných skupinách se 100 SH celkem pouze 8%. Kompletní randomizace - riziko nevyváženého počtu SH v léčebných skupinách Příklad nevyváženého počtu SH v multicentrickém KH (Chaow and Liu 1998) Př.: Multicentrické KH, 4 centra (1-4), 3 ramena (A,B,C), N = 96 SH Randomizace provedená separátně pro každé centrum generátorem náhodných čísel Centrum Skupina Z A B C 1 7 10 7 24 2 9 6 9 24 3 9 6 9 24 4 6 11 7 24 Z 31 33 31 96 Závěr: V multicentrických KH s limitovaným počtem SH roste riziko nerovnoměrné distribuce počtu SH v léčebných skupinách v rámci jednotlivých center. Stratífikovaná permutační bloková randomizace Princip: Př.: KH: N = 80 SH, 2 ramena (A,B), blok o velikosti B = 4 1) Volba stratifikačních kriterií: •pohlaví: muž x žena • věk: <50 x >50 2) Vytvoření čtyř podskupin S H na základě všech možných kombinací prognostických faktorů 3) Bloková randomizace v rámci podskupin: Blok S ku pi na Muži Zeny <50 >50 <50 >50 1 A A B A B A B A B B A B A B A B 2 B A B A B B A B A A A A A B B B Adaptivní randomizace: Minimalizace . Princip: Každý SH je randomizován do léčebné skupiny na základě rozložení prognostických faktorů z dosavadního průběhu KH . Př.: KH se sledovanými třemi prognostickými faktory. Dosavadní průběh KH: Terapie Place bo Lék n 106 107 <50 57 56 Věk >50 49 51 <10 45 44 Klín. par. 1 >10 61 63 1 25 26 2 52 51 Stadium 3 29 30 Další SH: Věk = 68 let; Klinický parametr 1 = 7,4; Stadium = 3 Počet SH se stejnou kombinací prognostických faktorů: Placebo rameno: 49+45+29 = 123 Lék: 51+44+30 = 125 SH bude s pravděpodobností P > 0,5 (3/4 nebo 2/3) randomizován do ramene s placebem. Adaptivní randomizace FIXED RANDOMIZATION /-\ Intervention Outcomes OUTCOME-ADAPTIVE RANDOMIZATION /-\ Intervention Outcomes Outcomes affect randomization probability* Propensity score matching Metoda IPD MAIC částečně nahrazuje randomizaci v metaanalýzách: - disbalanci ve vybraných známých baseline charakteristikách pacientů srovnávaných skupin Original, unadjusted population Clinical trial patients Iftfffff Real-world patients flffflff November 21, 2024 Adjusted population after PS matching Retained clinical trial patients Dropped clinical trial patient Dropped real-word patients flf Patients In the clinical trial get "paired up" with a similar real-world patient. Patients that don't find a match get dropped. Adjusted population after PS weighting AN OVA Tí. lit.H More similar patients in each group get up-weighted, while the less similar patients get down-weighted. All patients are retained. 30 r/PP populace ITT a PP analýza/populace lntention-to-treat (ITT) analytický přístup vychází z hodnocení dat všech SH randomizovaných do léčebných skupin bez ohledu na to zda - splnily vstupní kriteria KH - užívaly přípravek přidělený randomizačním kódem - dodržely protokol KH - předčasně ukončily účast v KH Per-protocol (PP) analýza vychází pouze z dat SH u kterých byl v průběhu celého KH dodržen protokol. Plán statistických analýz, blind review meeting Interim analýza Interim analýza Klasický přístup Sekvenční design Interim analvza: Rozhodnutí o dalším pokračování studie na základě zhodnocení platnosti vstupních předpokladů z dostupných dat Závěrečné zhodnocení, ověření platnosti vstupních předpokladů Vstupní předpoklady, odhady o účinnosti experimetnální léčby, definice hypotézy Experimentální léčba Interim analýza Interim analýza (IA) je jednorázové nebo opakované statistické testování primární hypotézy před protokolárně plánovaným ukončením KH. Cílem IA je zvážit možnost ukončení KH v případě že další pokračování již nepřinese novou informaci. O'Brien-Flemming interim monitoring boundaries for the primary endpoint are based on predetermined number of planned interim analysis with overall type error of cc=0.05. ä'78 5/79 10(79 3ÍB0 10/BO 4/B1 10/81 Date Interim analýza Chybné provedení interim analýzy zvyšuje pravděpodobnost falešně pozitivního výsledku studie, proto se její provedení musí řídit následujícími pravidly: - Počet a časování plánovaných interim analýz musí být uveden v protokolu studie (tedy před jejím zahájením) - Pravidla pro průkaz superiority experimentální léčby jsou přísnější při interim analýze než při závěrečném zhodnocení studie Subgroup analýzy Příkladová studie: ISIS-2 > > > 500- I 400 300 - 200 100 17 187 pacientů Význam aspirinu (ASP) a streptokinázy (SK) pro dlouhodobé přežití po podezření na IM Studie prokázala (na celém souboru) výrazné snížení mortality při užívání ASP, SK a jejich kombinace Placebo Intuston antf tib«u 560/ 4300 (13.2%) Placebo (13.2%) ASP 401/42« |10.7\) Aapirtti: Stnaptofcinaae: O Iď 440/4300(10 4%) Ol\ Analýza podskupin podle dne a měsíce narození pacientů ukázala, že ASP a SK nemají vliv na přežití pacientů narozených ve znamení Váhy a Blíženci Sn-«.p«omn»e« an65 y 53.3 (47.0, 60.8) 58.6 (49.8, 66.7) 54.4 (44.8, 60.2) 47.4 (36.2, 60.4) 1-1 i-m-T ■-1 -1 11 17 21 21 North America Region Europe Asia/Pacific 53.8 (47.3, 61.3) 52.3 (46.0, 63.8) 73.4 (47.3, NE) 49.4 (37.0, 57.0) 53.8 (42.3, 78.7) 55.1 (32.2, NE) i-■—j i—1 i-n-! —i —■-1 -1 16 11 14 23 17 29 ECOG performance status ^ 58.2 (52.1,66.0) 47.3 (41.3, 60.8) 85.9 (53.8, NE) 38.8 (32.2, 49.8) \\ -□-1 H 11 16 28 16 ~. ., Visceral Disease site .. . Non-visceral 48.1 (42.3, 53.8) 60.8 (53.8, 72.3) 44.8 (32.2, 53.8) 59.7 (47.4, 85.3) i—■! 1-) -1 1-1 13 14 23 20 De novo metastatic 54.6 (47.0, 69.1) 60.4 (49.8, 93.8) 1—r -□-1 10 24 Disease-free interval <12 months 45.7 (36.1,51.1) 37.7 (27.1,56.4) I-r >12 months 66.3 (52.1,79.7) 47.4 (37.7,57.0) I-□-1 □-1 12 29 17 15 Yes Prior endocrine therapy Nq 53.3 (48.0, 62.9) 55.1 (47.3, 71.4) 44.6 (34.3, 52.8) 60.4 (49.8, 93.8) 1-■-1 r—1 H -■-1 16 10 18 25 Yes Prior chemotherapy No 51.6 (45.6, 58.6) 58.4 (50.5, 71.7) 44.6 (36.2, 54.4) 58.9 (47.7,81.0) 1-CH 1-1 -1 ■-1 13 14 18 24 Yes Bone-only disease No 63.5 (53.9, 79.7) 51.6 (46.9, 57.6) 52.3 (42.3, 59.7) 49.8 (38.8, 60.4) 1-□-] —1 □-1 16 13 15 23 1 Number of disease sites 2 >3 59.1 (53.8, 73.9) 60.8 (47.9, 87.2) 48.1 (41.3, 53.8) 54.4 (45.4, 70.3) 54.5 (33.5, NE) 45.8 (32.4, 57.0) 1-B-j i-m-1 i-1 -1 --1 ■□-1 15 15 12 18 37 15 0.01 0.25 0.5 0.75 1 1.25 1.5 1.75 2 - In favor of PAL+LET In favor of PBO+LET-^ Příklady chybných závěrů subgroup analýz, které byly později vyvráceny Observation Refutation Aspirin is ineffective in secondary prevention of stroke in women1"1 31 Antihypertensive treatment for primary prevention is ineffective in womenWJ 34 Antihypertensive treatment is ineffective or harmful in elderly people35 36 Angiotensin-Converting enzyme inhibitors do not reduce mortality and hospital admission 38 in patients with heart failure who are also taking aspirin17 ß blockers are ineffective after acute myocardial infarction in elderly people,"and in patients 40 with inferior myocardial infarction41 Thrombolysis is ineffective >6 hours after acute myocardial infarction" 43 Thrombolysis for acute myocardial infarction is ineffective or harmful in patients 44 with a previous myocardial infarction*3 Tamoxifen citrate is ineffective in women with breast cancer aged <50 years45 46 Benefit from carotid endarterectomy for symptomatic stenosis is reduced in patients 48 taking only low-dose aspirin due to an increased operative risk47 Amlodipine reduces mortality in patients with chronic heart failure due to non-ischaemk 50 cardiomyopathy but not in patients with ischaemic cardiomyopathy4' Table 1: Examples of subgroup analyses that have shown apparently clinically important heterogeneity of treatment effect which has subsequently been shown to be false Doporučení pro použití subgroup analýz Panti 1. Rules of subgroup analysis: a proposed guideline for design, analysis, interpretation, and reporting Trial design • Subgroups analyses should be denned before starting the trial and should be limited to a small number of dinicaly important questions. • Expert dmical input into the design of subgroup analyses is needed to ensure that al relevant baseline clinical and other data are recorded. • The direction and magnitude of anticipated subgroup effects should be stated at the outset. • The exact definitions and categories of the subgroup variables should be defined explicitly at the outset in order to avoid post hoc data-dependent variable or category definitions. For continuous or hierarchical variables the cutoff points for analysis should be predefined. • Stratification of randomisation by important subgroup variables should be considered. • If important subgroup- treatment effect interactions are anticipated, trials should ideally be powered to detect them reliably • Trial stopping rules should take mto account anticipated subgroup-treatment effect interactions and not simply the overall effect of treatment. • if relative treatment effect is fckery to be related to baseline risk, the analysis plan should include a stratification of the results by predicted risk. The risk score or model should be selected in advance so that the relevant baseline data can be recorded. Analysis and reporting • The above design issues should be reported in the methods section along with details of how and why subgroups were selected. • Significance of the effect of treatment m rtdrvidual subgroups should not be reported, rates of fake negative and false positive results are extremely high. The only reliable statistical approach is to test for a subgroup-treatment effect interaction. • Al subgroup analyses that were done should be reported— ■e, not only the number of subgroup variables but also the number of different outcomes analysed by subgroup, different lengths of folow-up etc. • Significance of pre hoc subgroup-treatment effect inter actons should be adjusted when multiple subgroup analyses are done. • Subgroup analyses should be reported as absolute risk reductions and relative risk reductions. Where relevant the statistical significance of differences in absolute risk reductions should be tested. • Ideally, only one outcome should be studied and this should usually be the primary trial outcome, irrespective of whether this is one outcome or a cfcnicaly important composite outcome. • Comparability of treatment groups for prognostic factors should be checked wrthm subgroups. • If multiple subgroup-treatment effect interactions are identified, further analysis rs needed to check whether thee effects are independent. Interpretation • Reports of the significance of the effect of treatment in individual subgroups should be ignored, especialy reports of lack of benefit in a particular subgroup in a trial in which there is overal benefit, unless there is a significant subgroup treatment effect interaction • Genuine unanucoated subgroup-treatment effect interactions are rare (assuming that expert clinical opinion was sought in order to pre-define potentiafy important subgroups) and so apparent interactions that are discovered post hoc should be interpreted with caution. No test of significance rs i eliable in this situauon. • Pre hoc subgroup analyses are not intnnsically valid and should stil be interpreted with caution. The false positive rate for tests of subgroup-treatment effect interaction when no true interaction exists rs 5% per subgroup. • The best test of vakdity of subgroup-treatment effect interactions is their reproducibility in other trials. • Few trials are powered to detect subgroup effects and so the false negative rate for tests of subgroup-treatment effect interaction when a true interaction exists wtl usualy be high. Panel 2: The four main clinical indications for subgroup analysts Potential heterogeneity of treatment effect related to risk • Differences in risks of treatment • Differences in risk without treatment Potential heterogeneity of treatment effect related to pathophysiology • Multiple pathologies underlying a clinical syndrome • Differences in the biological response to a single pathology • Genetic variation Clinically important questions related to the practical application of treatment • Does benefit differ with severity of disease? • Does benefit differ with stage in the natural history of disease? • K benefit related to the timing of treatment after a clinical event? • rs benefit dependent on comorbidity7 Underuse of treatment in routine clinical practice due to uncertainty about benefit • Underuse of treatment in specific groups of patients eg, elderly people • Confinement of treatment according a narrow range of values of a relevant physiological variable—eg, treatment thresholds for cholesterol level or blood pressure Subgroup analysis: Fundamental principles Subgroup analysis in POLARIX study (forest plot) Pola-R-CHP (N=440) R-CHOP (N=439) Total 2-year 2-year Hazard Baseline Risk Factors N n Rate n Rate Ratio Age group «60 271 140 74 1 131 71-9 09 >60 608 300 779 308 69-5 0 7 Sex Male 473 239 759 234 65-9 0 7 Female 406 201 77-7 205 75-2 09 ECOGPS 0-1 737 374 78-4 363 71-2 08 2 141 66 67 2 75 650 08 IPI score IPI 2 334 167 793 167 78-5 1 0 IPI 3-5 545 273 752 272 65-1 0 7 Bu>ky disease Absent 494 247 827 247 70-7 06 Present 385 193 690 192 69-7 1-0 Geographic region Western Europe. United States, 603 302 786 301 72.0 08 Canada, and Australia Asia 160 81 74.3 79 65.6 0.6 Rest of world 116 57 70.8 59 67.3 0.9 Ann Arbor stage I—II 99 47 891 52 65-5 06 III 232 124 807 108 73-6 08 IV 548 269 726 279 66-1 08 Baseline LDH ULN 575 291 75-4 284 67-2 07 No. of extranodal sites 0-1 453 227 802 226 74-5 08 22 426 213 73-0 213 65-8 07 Cell-of-orlgin GCB 352 184 751 168 769 10 ABC 221 102 83-9 119 588 04 Unclassified 95 44 730 51 862 19 Unknown 211 110 73-8 101 643 0-7 Double expressor by IHC DEL 290 139 75-5 151 63-1 06 Non DEL 438 223 77-7 215 75-7 09 Unknown 151 78 760 73 698 08 Double- or triple-hit lympnoma Yes 45 26 690 19 88 9 38 No 620 305 76-8 315 70-3 07 Unknown 214 109 785 105 664 06 Pola-R-CHP R-CHOP Better Bener (0 6 to 1 5) (0-5 to 0-9) (0 5 to 0 9) (0-6 to 1-4) (0 6 to 10) (0 5 to 1 4) (0 6 to 16) (0 5 to 0 9) (0-4 to 0 8) (0-7 to 1 5) (06 to 1-1) (04 to 15) (0 6 to 1-5) (0 2 to 18) (0-5 to 13) (06 to 1-1) (0-5 to 13) (0 5 to 10) (0 5to1 1) (0-5 to 1-0) (0 7 to 15) (0-2 to 0-6' (08 to 4 5 (0-4 to 12! (04 to 1 0) (0 6 to 1-3) (04 to 1-5) (0-8 to 17-6) (0 5 to 10) (0 4 to 11) 025 Subgroup analyses need to be interpreted carefully to avoid misinterpretation The main mistake in interpretation of subgroup analyses: - Restriction of the therapy use only to selected subgroups despite the positive effect in the total population How to interpret correctly subgroup analyses Pola-R-CHP R-CHOP (N=440) (N=439) Baseline Risk Factors Total N n 2-year Rate n 2-year Rate Hazard Ratio 95% Walrl CI Pola-R-CHP Better R-CHOP Better Aae jiu_p «60 >60 271 608 140 300 741 77 9 131 308 71-9 69-5 09 0 7 (0 6 to 15) (05 to 0-9) r i-1 V^i ■ ' 1-1 ^^^^ Sex Male Female 473 406 239 201 759 77-7 234 205 65-9 75-2 0 7 09 (0-5 to 0 9) (0 6 to 14) 1—■—1 1—■ ECOG PS 0-1 2 737 141 374 66 78-4 67 2 363 75 71-2 650 08 08 (0-6 to 1 0) (0 5 to 14) ■ 1-m- IPI score IPI 2 IPI 3-5 334 545 167 273 79-3 752 167 272 78-5 65-1 1 0 07 (0 6to1«) (0 5 to 0 9) 1—■—1 1-1 Bulky disease Absenl Present 494 385 247 193 827 690 247 192 70-7 69-7 06 1-0 (0 4 to 0 8) (0 7 to 15) 1->-1 l-i 1-1 Geographic region Western Europe. United States. Canada, and Australia Asia Rest of world 603 160 116 302 81 57 786 74.3 70.8 301 79 59 72.0 65.6 67.3 08 0.6 0.9 (06 to 1-1) (0 4 to 1-5) (0-6 to 1-5) 1-■- 1-■ H -1 Ann Arbor stage III III IV 99 232 548 47 124 269 89 1 80 7 72 6 52 108 279 85-5 73-6 66-1 06 o a 08 (0 2 to 18) • (0 5 to 13) (0'6to1-1) i m Baseline LDH SULN >ULN 300 575 146 291 789 754 154 284 75-6 67-2 0-8 07 (0-5 to 1-3) (0 5 to 10) i—■-- ■ —1 No of extranodal sites 0-1 22 453 426 227 213 80-2 73-0 226 213 74-5 65-8 08 07 (OStol 1) (0 5 to 10) i—> i—■ Cell-of-orlgin GCB ABC Unclassified Unknown 352 221 95 211 184 102 44 110 751 83-9 730 73-6 168 119 51 101 769 58-8 862 64-3 10 04 19 0-7 (0 7 to 15) (0-2 to 0-6 *■ (0-8 to 4-5 (0-4 to 1-2) ■-1 1-1 «-1 Double expressor by IHC DEL Non DEL Unknown 290 438 151 139 223 78 75-5 77-7 760 151 215 73 63-1 75-7 698 06 09 06 (0 4 to 1 0) (0 6 to 13) (0 4 to 1-5) i—■— i—■-i-■— —1 -1 Double- or Hole-hit lympnoma Yes No Unknown 45 620 214 26 305 109 690 76-8 78-5 19 315 105 88 9 70-3 664 38 0-7 06 (0-8 to 17-6) (0-5 to 10) (0 4 to 1-1) i—1 »^ I I-1 025 1 5 Outcome of one subgroup analysis itself is r not sufficient to conclude that the treatment works better/worse in some subgroups. To conclude, that the treatment works better/worse in particular subgroup we need to have (at least): - Similar and consistent findings from several independent analyses - Biological plausibility-justification based on disease biology, pathology etc. - Statistical considerations (sample size, power and type I error control) Interpretation of subgroup analyses results Pola-R-CHP R-CHOP (N=440) (N=439) Baseline Risk Factors Total N n 2-year Rate n 2-year Rate Hazard Ratio 95% Wald CI Pola-R-CHP Better R-CHOP Better Aae jiu_p «60 >60 271 608 140 300 741 77 9 131 308 71-9 69-5 09 0 7 (0 6 to 15) (05 to 0-9) I-1 1 ■ ' 1-1 Sex Male Female 473 406 239 201 759 77-7 234 205 65-9 75-2 0 7 09 (0-5 to 0 9) (0 6 to 14) I-■-1 I-■ ECOG PS 0-1 2 737 141 374 66 78-4 67 2 363 75 71-2 650 08 08 (0-6 to 1 0) (0 5 to 14) ■ 1-m- IPI score IPI 2 IPI 3-5 334 545 167 273 79-3 752 167 272 78-5 65-1 1 0 07 (0 6to1«) (0 5 to 0 9) 1—■—1 1-1 Bulky disease Absenl Present 494 385 247 193 827 690 247 192 70-7 69-7 06 10 (0 4 to 0 8) (0 7 to 15) 1->-1 l-i 1-1 Geographic region Western Europe. United States. Canada, and Australia Asia Rest of world 603 160 116 302 81 57 786 74.3 70.8 301 79 59 72.0 65.6 67.3 08 0.6 0.9 (0'6to 1-1) (0 4 to 1-5) (06 to 1-5) 1-■- 1-■ H -1 Ann Arbor stage III III IV 99 232 548 47 124 269 89 1 80 7 72 6 52 108 279 65- 5 73-6 66- 1 06 o a 08 (0 2 to 18) • (0 5 to 13) (06 to 1-1) i m Baseline LDH SULN >ULN 300 575 146 291 789 754 154 284 75-6 67-2 0-8 07 (05 to 1-3) (0 5 to 10) i—■-■ ■ —1 No of extranodal sites 0-1 22 453 426 227 213 80-2 73-0 226 213 74-5 65-8 08 07 (OStol 1) (0 5 to 10) i—> i—■ Cell-of-orlgin GCB ABC Unclassified Unknown 352 221 95 211 184 102 44 110 751 83-9 730 73-6 168 119 51 101 769 58-8 862 64-3 10 04 19 0-7 (0 7 to 15) (0-2 to 0-6 *■ (0-8to4-5 (0-4to1-2) ■-1 1-1 -•-1 Double expressor by IHC DEL Non DEL Unknown 290 438 151 139 223 78 75-5 77-7 760 151 215 73 63-1 75-7 698 06 09 08 (0 4 to 1 0) (0 6 to 13) (0 4 to 1-5) i—■— i—■ i-■— —1 -1 Double- or Hole-hit lympnoma Yes No Unknown 45 620 214 26 305 109 690 76-8 78-5 19 315 105 88 9 70-3 664 38 0-7 06 (0-8 to 17-6) (0-5 to 1-0) (0 4 to 11) i—1 »^ I I-1 025 1 5 The study was not designed and powered to enable conclusions on treatment effect in individual subgroups Study results need to be interpreted only for the whole ITT population because we do not know the impact of other confounding factors (imbalance of prognostic factors) on subgroup analysis No valid conclusions about significantly better or worse results for any of the investigated subgroups could be made Metaanalýzy Meta-analýza Meta-analyza KH je technologie zobecnění výsledků několika nezávisle provedených KH. Tato technologie je založena na definování vstupních a vylučujících kriterií pro jednotlivá KH a na aplikaci speciálních statistických technik. Základem meta-analýz je hodnocení heterogenity výsledků jednotlivých KH. V případě průkazu výrazné heterogenity je tato interpretována, v případě průkazu homogenity jsou výsledky zobecňovány. Cílem meta-analýz je přinést ucelenou a klinicky relevantní informaci na základě výsledků jednotlivých KH, která mohou mít nejednotné závěry. Vybrané problémy: - „publication bias" („funnel shape") - vícenásobné publikace výsledků z jedné populace SH - nejednotnost hodnocení léčebné odpovědi a AE Vývoj počtu meta-analýz v čase Levels of evidence Lékaře by mělo zajímat především Meta-Analysis Systematic Review Randomized Controlled Trial Cohort studies Case Control studies Case Series/Case Reports Nejspolehlivější data o srovnání účinnosti a bezpečnosti více přípravků Mohou a nemusí být vhodným zdrojem dat srovnání účinnosti více přípravků \ Head-to-Head Animal research/Laboratory' studies Grafické znázornění výsledků meta-analýz Individual study risk ratios & 95% Cl Cumulative risk ratios & 95% CI O.01 01 1 10 100 Cl o? amy Year n Fio/drg. 1965 42 Nasti 1967 70 Evirat 1969 29 Rosenberg 1971 S3 Rosenberg 1971 63 Andersen 1972 240 Nygaard 1972 15 Nygaard 1972 104 Nygaard 1972 102 Nygaard 1972 17 Nygaard 1972 '8 Evans 1973 67 Stokes 1974 176 Gddnng 1975 SO Farmer 1975 9/ Nichols 1975 20 Aieunde' 197« 62 Stone 1976 90 Stone 1976 83 Stone 1976 89 Kjeilgren 1977 106 Feathers 1977 39 197« 159 Jostamdl 1981 60 1982 too Coppa 1983 241 Loid 1963 47 vVtikor 1063 57 Gomer-Abmo 1984 66 Schliessel 1984 51 Gottrup 1985 87 Pe't- 1987 70 Overal 2659 ......■* ......'4 ■ •■■■■■■» ....... n 42 112 14 229 312 552 567 67 773 790 606 695 1070 1120 1217 1237 1299 1389 1477 15GC 1672 1711 »870 1930 2030 2271 2318 2375 2441 2502 2589 2659 c 5 1 10 Favors arr.biot c Favors ro antibotc Favors antib.otc Favors noaniibioic „Mixed treatment comparisons" a Jndirect comparisons" AvB trials (Direct comparison) C C Naive Approaches Unadjusted indirect comparisons • Meta-analysis using data of single arms: MA using all data for intervention A, MA using all data for intervention B, MA using all data for intervention C,... Breaks randomisation - Should never be used! • A correct analysis has to be based on the estimated effects of each RCT 4. Koncept P-hodnoty Koncept P-value • Co přesně a „laicky" znamená hladina významnosti „P", napr. (p<0,0001)? • Jak je zvolen počet pacientů potřebných pro zařazení do konkrétní studie? • Je důležitější hladina významnosti, nebo zjištěný rozdíl v účinnosti mezi rameny? Modelová klinická studie ověřující účinnost nové léčby i Klinicky vs. statisticky významný rozdíl Situace A: N=20 P(A) = 80% P(B) = 50% P= 0,160 X Situace B: N=20 000 P(A) = 80% P(B) = 81% P<0,05 Hladina významnosti: -P value" I I Typy hypotéz v klinických studiích Primární hypotéza Equivalence testing Superiority testing Better Typy hypotéz v klinických studiích o Superiority Equivalence A Non-inferiority • „assay sensitivity" • „bio-creep" and „techno-creep" Typy hypotéz v klinických studiích Favors active control drug NI Margin p * Inferior and nol non-inferior Favors test drug Non-inferior and superior Non-inferior and not superior Non-inf erioritv not shown Non-inferior and inferior 0 Treatment difference (Test drug - Control) Kolik pacientů je potřeba na studii? November 21, 2024 59 James Lind, 1747, Kolik pacientů je zapotřebí pro studii? Klinická studie s 12 pacienty, léčebná ramena: • cider • vitriol 3x denně • mořská voda • bylinná směs a balsám z Peru • vinný ocet • dva pomeranče a jeden citrón denně TREATISE O F THE SCURVY. IN THREE PARTS. Kolik pacientu je zapotřebí pro studii? Ovarian cancer screening and mortality in the UK Collaborative Trial of Ovarian Cancer Screening (UKCTOCS): a randomized controlled trial n assessed fot eligibility Klinická studie: 1 243 282 pacientů, 202 638 randomizovaných 8192 ineligible 78 225 serf-reported as not meeting inclusion criteria 172149 declined to participate 777626dkinot respond 10192 not recruited because target reached 2452 excluded 1402 did not meet inclusion criteria 1050 declined to participate 202 638 randomised IO1359 assigned no screening 50640 assigned MMS 2389 were not screened 28 died 27ovahes removed 2334 declined 60 excluded* 42 oophorectomy before recruitment 18 exited registry before recruitment 6 excluded' 12 oophorectomy before 2 ovarian cancer diagnosed before randomisation 2 exited 1 eg is try before 57 were not screened 2d*d 5 ovaries removed 55O declined 6 excluded* 11 oophorectomy before 2 ovarian cancer diagnosed before randomisation 3 exited registry before IO1299 included in primáty analysis 5G623 included in primary analysis 50624 included in primary analysis Jete follow-up :1med flagging with lional registries ted registry before c it 2014 1150 incomplete follow-up 3 declined flagging wrtl national registries 1147 exited registry before Dec 3L 2014 563 incomplete follow-up 2 declined flagging national registries 5Gl exiled registry befoie Dec 31,2014 th 100149 complete follow-up 50060 complete follow up 50084completefotlow up Proč je důležité optimalizovat prospektivně velikost vzorku? . Etické aspekty . Ekonomické aspekty • Požadavek regulačních autorit (SÚKL, FDA) • Riziko neplánovaného počtu subjektů hodnocení . Malý vzorek - ztráta času, nemožnost prokázat rozdíl mezi srovnávanými rameny . Velký vzorek - ztráta času a prostředků, průkaz klinicky nevýznamného rozdílu mezi srovnávanými rameny Jak je možné prakticky „ušetřit" počet pacientů potřebných pro studii? DESIGN □ Vhodně zvolená primární hypotéza □ Použití vhodných randomizačních technik □ Specifické designy jako např. N-of-1, apod. □ Pokud je to možné, využít cross-over design (možná úspora až 60-80% pacientů) □ Group-sequential design (možná úspora cca 30% pacientů) ale má svoje rizika, adaptivní design bez ovlivnění hladiny významnosti ENDPOINTY □ Vhodná volba typu endpointu (spojitá vs. diskrétní data) □ Využití kompozitních endpointu □ U Time-to-event dat co nejdelší sledování (možná úspora cca 30% pacientů) Vliv endpointu na velikost vzorku Příklad výpočtu velikosti vzorku (binární endopint) Rameno P (placebo): Pokles bolesti u 30% SH Rameno E (akupunktura): Pokles bolesti u 40% SH Zvýšení podílu SH s poklesem symptomů o 10% je považováno za klinicky signifikantní a= 0,05 (3=0,20......síla testu (1-p)......0,80 p< = 0,30 N = 376 SH v jednom rameni KH p2= 0,40 Vliv endpointu na velikost vzorku Příklad výpočtu velikosti vzorku (spojitý endopint) Rameno P (placebo): Pokles bolesti na 4,0 (stupnice 0-10) Rameno E (akupunktura): Pokles bolesti na 3,0 (stupnice 0-10) Snížení bolesti o 1,0 je považováno za klinicky signifikantní a= 0,05 (3=0,20......síla testu (1-p)......0,80 u1 = 3 u2= 4 SD = 2 N = 64 SH v jednom rameni KH Vliv endpointu na velikost vzorku Vliv délky sledování na velikost vzorku u „time-to-event" dat Pacient 1 •- Pacient 2 Pacient 3 Pacient 4 FU =2 roky, ztráta 50% dat FU =3 roky, ztráta 25% dat Death Relapí Death Death 01/01/2000 01/01/2001 Kalendářní čas 01/01/2002 Multiplicita Multiplicita Představme si, že hodíme 100x mincí a padne nám 100x orel.... Jaká je pravděpodobnost, že mince není „cinknutá"? Pravděpodobnost nastání této situace je 1/2100 Představme si, že máme 2100 mincí a každou hodíme 100x Jaká je pravděpodobnost, že alespoň u jedné mince padne 100x orel? 63,2 % Počet primárních endpointů INTERNATIONAL CONFERENCE ON HARMONISATION OF TECHNICAL REQUIREMENTS FOR REGISTRATION OF PHARMACEUTICALS FOR HUMAN USE ICH Harmonised Tripartite Guideline Statistical Principles for Clinical Trlals I This Guideline has been c has been subject to consul Process. At Step 4 of the regulatory bodies of the Ei 2.2.2 Primary and Secondary Variables The primary variable ('target' variable, primary endpoint) should be the variable capable of providing the most clinically relevant and convincing evidence directly related to the primary objective of the trial. There should generally be only one primary variable. This will usually be an efficacy variable, because the primary objective of most confirmatory trials is to provide strong scientific evidence regarding efficacy. Safety/tolerability may sometimes be the primary variable, and will always be an important consideration. Measurements relating to quality of life and health economics are further potential primary variables. The selection of the primary variable should reflect the accepted norms and standards in the relevant field of research. The use of a reliable and validated variable with which experience has been gained either in earlier studies or in published literature is recommended. There should be sufficient evidence that the primary variable can provide a valid and reliable measure of some clinically relevant and important treatment benefit in the patient population described by the inclusion and exclusion criteria. The primary variable should generally be the one used when estimating the sample size (see section 3.5). Počet primárních endpointů Co-Primary Endpoints ■ In some cases, benefit on one endpoint may not be sufficient — In acute cardiac failure, immediate (e.g., within two hours) relief of symptoms may be necessary — Mid-term (e.g., 14 days) mortality may also be necessary ■ In such cases, we refer to co-primary endpoints ■ Both are necessary; not either/or Composite Endpoints ■ Different to co-primary ■ Here, either of the separate endpoints may be sufficient — Common example in stroke . . . 28-day mortality or myocardial infarction or recurrent stroke — Having any one (or more) of these endpoints would be considered a treatment failure Hierarchické testování HIERARCHICKÉ TESTOVÁNÍ Figure S2: Type I Error Control. Depiction of type I error control for co-primary endpoints PFS and OS, with alpha split, alpha recycling, and statistical Testing hierarchy. (l)PFSAvsC ITT a = 0 01 Atezolizutnab + platirram-based chemotherapy Atezoliziimab monotherapy Placebo + platinum-based chemotherapy One-sided a = 0 025 0-015 If (1) is positive: 001 (2) OS A vs C ITT If (1) is negative: a = 0-015 If (1) is positive: a =0 025 If (2) is positive: a B C (3) OS B vs C ITT a is same as in (2) If (3) is positive: (4) OS B vs C IC2/3 patients a is same as in (2) Příkladová studie: Alokace hladiny významnosti Endpointy Typy endpointu v klinickych studifch Examples of Outcome Types Qualitative: • Binary: Complete remission (yes vs no), Patient status (death vs alive) • NominahAdverse event type • Ordinal: Disease state (improved vs stable vs worsened), Neutropenia grade (1-4) Quantitative: • Discrete: pain scale (0=no pain, 10=worst pain imaginable) • Continuous: Gene expression, Tumor size in mm, Visual analog scale in mm, Quality of Life score Time-to-event: Time to death, Time to progression, Time to response Typy endpointü v klinickych studifch Common Endpoints in Cancer Clinical Trials Serial No Endpoint Definition Unique feature 1. 2. 3. 4. 5. 6. 7. 3. 10. 11. 12. 13. 14. 15. IS. Overall survival Progression-free survival Time to progression Event-Free Survival Disease-free survival Time to Treatment Failure Time to Next Treatment Duration of Clinical Benefit Duration of Response Objective Response Rate Complete Response Pathological Complete Response Disease Control Rate Clinical Benefit Rate Health-Related Quality of Life Milestone suivival Time from randomization to death. Time from randomization to disease progression or death, whichever comes first. Time from randomization to disease progression. Time from randomization to disease progression, discontinuation of treatment for any reason, or death. Time from randomization to disease recurrence. Time from initiation of chemotherapy to premature discontinuation of treatment. Time from initiation of treatment to beginning the next line of therapy. Time from randomization to progression or death in patients who had a complete or partial response or a stable disease for over 24 weeks. Time from randomization to progression or death in patients who had a complete or partial response. Proportion of patients with partial or complete response to therapy. Lack of detectable evidence of tumor. Lack of residual invasive cancer in resected breast tissue or regional lymph nodes. Percentage of patients with complete response, partial response, or stable disease as a result of their therapy. Percentage of patients with complete response, partial response, or at least months of stable disease as a result of their therapy. Assessment of patient quality of life with respect to health status. Survival probability at a prespecified time point. The 'gold standard' primary clinical endpoint. Used to assess therapies targeting ad\ranced or metastatic malignancies. Only uses time to progression and does not include time to death. Used to evaluate highly toxic treatments. Used to assess adjunctive and curative therapies. Used with other endpoints to assess reasons for discontinuing treatment. Used as a meaningful endpoint for patients with low grade, incurable malignancies. Used in settings where disease stabilization is meaningful. Used to assess therapies for durable response. Used to assess neoadjuvant therapies. Included as a major goal of multiple myeloma treatment. Used in accelerated approval for neoadjuvant therapies targeting breast cancer. Used to assess the tumorstatic efficacy of a therapy. Used to capture tumorstatic efficacy of a therapy and stable disease. Used to directly measure patient quality of life. Used to ei^luate a cross-section of OS data. Delgado A, Guddati AK. Clinical endpoints in oncology - a primer. Am J Cancer Res. 2021 Definice vybraných time-to-event endpointů Clinical Endpoints AMERICAN THYROID ASSOCIATION Progression Persistent disease Recurrent disease Local recureence Regional recurrence Distant recurrence Disease left following initial surgery: residual tumor in the area of the primary tumor and/or regional lymph node Biochemical and/or new structural disease in patient rendered disease-free Evidence of thyroid cancer in the thyroid bed Nodal disease in central retropharyngeal, or lateral compartments of lymph node Disease recurrence beyond the regional nodal basins Treatment ..relapse. Die Distant metastasis locoregional Recurrence Distant Any Cancer Recurrence cause Diagnosis Treatment Time-to-event Endpoints in Cancer Time to progress Progression-free survival Progression-free interval Relapse-tree survival Recurrence-free survival Disease-free survival Overall survival Disease-specific survival The time from diagnosis/treatment to the progression of tumor (in any aspect). The time from diagnosis/treatment to the progression of tumor (in any aspect) or death (for any cause). The time from treatment to locoregional recurrence The time from treatment to the relapse (local, regional, distant). The time from treatment to locoregional recurrence or death (for any cause) The time from treatment to locoregional recurrence, metastasis or death (for any reason) The time from diagnosis/treatment to death (for any reason). The time from diagnosis/treatment to death (cancer-specific). TTP PFS PFI RFS RFS DFS OS DSS Regulatory perspective: FDA Table 2. Advantages and Disadvantages of Important Lancer Approval Endpoints FDA guideline defines endpoints to be used in cancer clinical trials Clinical Trial Endpoints for the Approval of Cancer Drugs and Biologies Guidance for Industry U.S. 1111:; ii 111 n ■ 11 I Lea 1111 ;. n :l I I~.iiii.iii Services FduiI and Drug AdminisLrdtiun iI 111 .i i: '■■ f i li 11' i I vi ■:■ II i1 li 11' CctiIct far Um^ Hvalualimi und Hi'srarilL [CULK] C-nlET fur Uiul-^iL- E-'uluulicn und Kc-cur-h (CB£h) Hi 11 ::-.l)-:-i _nlh Clinical/Mcdim! fcjiüpi^:>t Symptom Endpoints (patient reported outcomes) Disease- Free Survival or Event-Free Survival Objective Response Rale Complete Response Adv^ntapw Easily and precisely measured • Generally based on objective and quantitative assessment Disadvantages > May be affected by swiltb-over of control to treatnienl or subsequent therapies • Keeds longer follow-up ' Includes rlOucancer deatlis smaller sample size compared wittl survival studies • Generally assessed earlier and with smaller sample size compared wittl survival studies • Generally based on objective and quantitative assessment r (31:[ice;Lily LisspsM-d earlier find v.ill) smaller sample size compared wittl survival studies • Effect on tumor attributable to dnjg(s). [lot natural history • Generally based on objective and quantitative assessment • Generally assessed earlier and will: smaller sample size compared wild survival studies • Effect on tumor attributable to drug(s)r not natural history • Generally based on objective and quantitative assessment_ Generally assessed earlier and with smaller sample size compared witb survival studies Measurement of stable disease included ■ Generally based on objective and quantitative assessment endpoint • Potentially subject to assessment bias. particularly in open label studies i Lack of validated instruments in many disease areas ■ Definitions vary aniung studies ■ Balanced timing of assessments among treatment arms is critical • Potentially subject to assessment bias, particularly in open-label studies ■ Definitions vary among studies • Balanced timing of assessments among treatment amis is critical < Includes noncancer deaths • Definitions vary among Studies ■ Frequent radiological or oilier assessments • May not always correlate with survival ■ Definitions vary among studies • Frequent radiological or otber assessments ■ May not always correlate with survival < Potentially subject to assessment bias, particularly in open-label studies ■ Definitions vary among Studies ■ Frequent radiological or oilier assessments • Balanced timing of assessments among treatment arms is critical ■ May not always correlate with survival Regulatory perspective: FDA Rationale for the use of PFS as primary study endpoint > PFS is not confounded by subsequent therapy Clinical Trial Endpoints for the Approval of Cancer Drugs and Biologies Guidance for Industry U.S. UrrjjrtTTunt ufHraLlh and Human Service I'nuil and Ilruy Adminivlralitm L'Jn-r:iilu£y Cr-nUT lA I TirlJnLCL' Ccnlc-r frtT L valuation and Hrscuch (Cl!EH) t rairr Ich- Hiding LvjiLiuiiii.ii nod btcwiiirli (l.:ili-:Ki > For a given sample size, the magnitude of effect on PFS can be larger than the effect on overall survival. > Treatment effect measured by PFS can be a surrogate endpoint to support accelerated approval, a surrogate endpoint to support traditional approval, or it can represent direct clinical benefit based on the specific disease, context of use, magnitude of the effect, the disease setting, location of metastatic sites, available therapy, the risk-benefit relationship, and the clinical consequences of delaying or preventing progression Regulatory perspective: EMA EMA guideline defines the rules for the use of PFS and OS in cancer clinical trials Guideline on the clinical evaluation of anticancer medicinal products Adopted by CHMP far release for consul tat Start of public consultation End of consultation [deadline for comment Adoption at the ONCWP > If PFS is the selected primary endpoint, OS should be reported as a secondary and vice versa. > When OS is reported as secondary endpoint, the estimated treatment effect on OS should ensure that there are no relevant negative effects on this endpoint, in most cases by showing trends towards superiority. > In situations where there is a large effect on PFS, or if there is a long expected survival after progression, and/or a clearly favourable safety profile, precise estimates of OS may not be needed for approval. Number needed to treat Number needed to treat (NNT) Tento ukazatel je jen jinou formou vyjádření ARR a počítá se jako převrácená hodnota ARR, tedy 1/ARR. Při použití předchozího uvedeného příkladu by tedy hodnota NNT byla 1 / 0.1=10. Tato hodnota se interpretuje jako počet pacientů, které je nutné léčit úspěšnější léčbou abychom zabránili jednomu negativnímu výstupu léčby ve srovnání s méně efektivní léčbou. V našem případě to tedy znamená, že na 10 pacientů léčených léčbou A bude jeden pacient u kterého zabráníme úmrtí do pěti let ve srovnání se situací, kdy jsou všichni pacienti léčeni léčbou B. To gain a rapid picture of the benefit (B) or harm of a given treatment, it is sometimes useful to calculate the number of people that would need to be treated to save or lose one life. That number is simply the reciprocal of the difference in absolute (not relative) risk (R). Considering again the example of thrombolytic therapy for an acute Ml, the absolute risk difference is 12% - 9%, or 3% (B), so the number needed to treat (NNT) is 1/0.03 or 33. In the setting of an acute Ml, one would need to treat 33 patients with thrombolytic therapy to save one life. On the other hand, the absolute risk difference for an intracranial hemorrhage is 1% (R), so the number needed to harm (NNH) is 1/0.01 or 100. One would need to give 100 patients thrombolytic therapy to cause one fatal intracranial hemorrhage. These simple calculations do not weigh the relative value of the benefit and the harm, but the NNT and the NNH can provide a useful snapshot of benefits and risks. NNT: How is it calculated? Let's have a clinical trial comparing interventional treatment A with control treatment B: Treatment A: Treatment B: Progression in 25% pts Progression in 50% pts If If If IT If If If IT ll ll ll IT If If If IT ft ft fill tilt tilt Calculation of NNT: Risk of progression on treatment A: 0,25 Risk of progression on treatment B: 0,50 NNT = 1 / (0,50-0,25) = 4 Interpretation of NNT: Four patients need to be treated by treatment A to avoid progression in one patient (in comparison to treatment B). Relativní riziko = Relative risk 1 - Výpočet relativního rizika (RR) umožňuje srovnat pravděpodobnosti výskytu sledovaného jevu ve dvou různých skupinách. * 1. skupina - experimentální nebo skupina s expozicí určitému faktoru 2. skupina - kontrolní nebo skupina bez expozice Pravděpodobnost výskytu jevu v 1. skupině (experimentální) p RR-- =^ Pravděpodobnost výskytu jevu ve 2. skupině (kontrolní) ^ Sledovaný jev Skupina Experimentální Kontrolní Celkem Ano a b a + b Ne c d c-í- d Celkem a + c b + d n a RR = ÍL=a±c_ Po h b + d Poměr šancí = Odds ratio OR I Poměr šancí (OR) je další charakteristikou, která umožňuje srovnat výskyt sledovaného jevu ve dvou různých skupinách. -1. skupina - experimentální nebo skupina s expozicí určitému faktoru ■* 2. skupina - kontrolní nebo skupina bez expozice Pravděpodobnost výskytu jevu v 1. skupině (experimentální) P{ 1 - Pravděpodobnost výskytu jevu v 1. skupině (experimentální) O, Pravděpodobnost výskytu jevu ve 2. skupině (kontrolní) 1 - Pravděpodobnost výskytu jevu ve 2. skupině (kontrolní) \-p, i- Sledovaný jev Skupina Experimentální Kontrolní Celkem Ano a b a + b Ne c d c + d Celkem a + c b + d n 1 - p \-Pn a c_ b Grafické srovnání RR a OR tttttt RR = _ 10 tit = 2 5 10 B OR = i Výskyt sledovaného jevu Bez výskytu sledovaného jevu mm Mtt m iHiiif = | = 3.5 7 Hazard Ratio (HR) Hazard ratio is a measure of how often a particular event happens in one group compared to how often it happens in another group, over time Calculation of Hazard ratio HR = Risk of event on experimental treatment Risk of event on control treatment 1Experimental treatment is better - 1 No difference . H Control treatment ^ is better Hazard ratio in forest plot Experimental treatment better T Confidence interval Control treatment better < 1 1 > 1 Hazard ratio 95% confidence interval for Hazard Ratio (e.g. HR=0.68: 0.42-0.88) must not include 1 to be statistically significant. Kvalita života QALY Parametr QALY (quality-adjusted life years) umožňuje indexové posouzení délky a kvality života jako benefitu použití léčebného postupu Best possible health state + o...... 1 Death Worst possible health state Calculating QALYs: an example Intervention A: Four years in health state 0.75 3 QALYs Intervention B: Four years in health state 0.5 2 QALYs Quality of life weights Intervention A I QALYs gained Intervention B Death 1 Time Death 2 Additional number of QALYs generated by A 1 QALY Intervention £/QALYat 1990 prices Cholesterol testing and diet therapy (all adults aged 40-69) 220 Neurosurgical intervention for head injury 240 GP advice to stop smoking 270 Neurosurgical intervention for subarachnoid haemorrhage 490 Antihypertensive treatment to prevent stroke (ages 45-64) 940 Pacemaker implantation 1,100 Hip replacement 1,180 Valve replacement for aortic stenosis 1,410 Cholesterol testing and treatment (all adults aged 40-69) 1,480 Docetaxel (as opposed to paclitaxel) in treatment of recurrent metastatic breast cancer 1,890* CABG (left main-vessel disease, severe angina) 2,090 Kidney transplantation 4,710 Breast cancer screening 5,780 Heart transplantation 7,840 Cholesterol testing and treatment incrementally (all adults aged 25-39) 14,150 Home haemodialysis 17,260 CABG (one-vessel disease, moderate angina) 18,830 Hospital haemodialysis 21,970 Erythropoietin treatment for anaemia in dialysis patients (assuming 10% reduction in mortality) 54,380 Addition of interferon-c(2b to conventional treatment in newly diagnosed multiple myeloma 55,0605 Neurosurgical intervention for malignant intracranial tumours 107,780 Erythropoietin treatment for anaemia in dialysis patients (assuming no increase in survival) 126,290 * Adjusted to 1990 prices using Hospital and Community Health Service Pay and Prices Index, Unit Costs of Health and Social Care. PPSSRU, 1996. (2,431 200.7 x 155.6= 1,890.s Translated into 1990 prices, as above QALY: příklad u diabetiků Plné zdraví Diabetik s poškozením zraku Hemodialyzovaný diabetik QALY 1.0 0.814 -►0.734 0.68 -> 0.49 0.0 Diabetik bez komplikací Diabetik s nízkou amputací DK Smrt Ilavská, Tomek 2006: Farmakoekonomické posouzení léčby diabetologii, podle: Clarke P et al (2002) Med Decision Making, 22 (4) (UKDPS 62), Teng TO et al (2000) Med Care, 38 (6) QALY a DALY_ Inkrementální náklady: ICER Inkrementální náklady jsou definovány jako rozdíl mezi náklady dvou technologií, které jsou neslučitelné. Pro srovnání dvou technologií z hlediska jejich nákladů a přínosů se používá tzv inkrementální poměr, který vyjadřuje náklady na jednotku účinnosti nové technologie ve srovnání se stávající: ICER = (NÁKLADY Hl- NÁKLADY Sľ> I (PŘÍNOSY Hl- PŘÍNOSY SI) Hl- hodnocená intervence SI-srovnávaná intervence Incremental Cost-Effectiveness Ratio (ICER) (Ci- c0) ICER = (Ei- c, = cost in intervention group Co = cost in control group E, = effect in intervention group = effect in control group INCREMENTAL COST - EFFECTIVENESS RATE (ICER) Cost Effectiveness Ratios: Costs B A Costs A Effects A Incremental Cost Effectiveness Ratio: Costs B - Costs A Effects B - Effects A Effectiveness Redukce rizika Absolutní redukce rizika (ARR) Tento parametr vyjadřuje pouze rozdíl v absolutní hodnotě rizika negativního výstupu léčby mezi srovnávanými skupinami. Pokud je tedy např. primárním cílem studie prodloužit pětileté celkové přežití pacientů s určitou onkologickou diagnózou a ve skupině A bude absolutní riziko úmrtí do pěti let 10% a ve skupině B 20%, tak absolutní redukce rizika při použití léčby A je 20%-10%, tedy 10%. Relativní redukce rizika (RRR) Při výpočtu relativní redukce rizika se absolutní hodnoty negativního výstupu léčby neodečítají ale dělí, tedy při použití výše uvedeného příkladu je relativní redukce rizika při použití léčby A 50% (10% / 20% = 0.5 = 50%). 5. Specifické designy klinických studií CO NÁM (NE)ŘÍKAJÍ KLINICKÉ STUDIE? Austin Bradford Hill:,,.....RCTs do not answer the practicing doctor's question: what is the most likely outcome when this particular drug is given to a particular patient?" i Klinická studie nám „pouze" říká, jaká bude průměrná odpověď na léčbu u skupiny pacientů splňujících všechna vstupní a vylučující kritéria dané klinické studie. PROBLÉM TRADIČNÍCH KLINICKÝCH STUDIÍ Heterogeneity of Treatment Effect fffffffffffffffff <— PŘÍKLAD ROLE PERSONALIZOVANÉ MEDICÍNY V REÁLNÉ KLINICKÉ PRAXI KLINICKÁ STUDIE INDIVIDUÁLNI PACIENT > Každý jednotlivý pacient má nekonečné množství vlastností ovlivňujících účinnost/bezpečnost konkrétní léčby > Treatment guidelines jsou většinově tvořeny na základě průměrného efektu pro průměrného pacienta > Využití klinických studií pro stanovení odpovědi konkrétního pacienta na léčbu vychází z konceptu „reference class forecasting": > Efekt léčby konkrétního pacienta odhadujeme na základě průměrného efektu u obdobné skupiny pacientů > Jak moc je náš pacient podobný skupině pacientů zařazených do studie? JAK (NE)ŘEŠÍTRADIČNÍ KLINICKÉ STUDIE HETEROGENITU ODPOVĚDÍ NA LÉČBU? All patients I přesto, že v této konkrétní klinické studii se ukázal jasný klinicky signifikantní rozdíl účinnosti léčby dle věku a pohlaví, studie konstatovala homogenitu léčebného efektu napříč všemi podskupinami (!) (statistický test interakce podskupin byl nevýznamný z důvodu malého počtu pacientů) „Forest plots" mají za cíl zobrazit heterogenitu/homogenitu efektu léčby napříč podskupinami pacientů ■ Non-white ■ White From Ml to randomization ■ <7 days ■ >7 days Infarct related artery ■ LAD ■ Other Ejection fraction ■ -=50% m tSOH Diabetes ■ Yes ■ Ho K Hip class ■ Infarct related artery ■ I IV Jaká je optimální léčba pro mladé ženy nebo starší muže? Umíme odpovědět na základě výsledků této studie? 1 0.5 1.5 Posuzování efektu léčby v rámci podskupin na základě jednorozměrných analýz podskupin je chybné a zavádějící. Jsou dokumentovány konkrétní příklady kdy tento přístup vedl k dramaticky chybným závěrům (např. neúčinnost aspirinu v sekundární prevenci iktu u žen). Hazard PCI better ratio Medical therapy better N-of-1 (single-patient) studie • multi-crossover studie s cílem zjistit účinek léčby u individuálního pacienta a nastavit co nejefektivněji léčebný postup • každý léčivý přípravek podán opakovaně v několika cyklech pro potvrzení účinku • zobecnění závěrů pro širší populaci pacientů díky analýze série podobně designovaných N-of-1 studií pomocí pokročilých statistických metod, např: • metody meta-analýzy • lineární smíšené modely • Bayesovské modely Jaký je princip a jaké jsou limitace N-of-1 studií? Cílem studie je najít nejvhodnější léčbu pro konkrétního pacienta prostřednictvím testování různých typů léčby u jednoho pacienta odděleně v čase Typické uspořádání N-of-1 studie 7 Cycle 1 Washout period i \ l\ l\ í\ é\ M 1' B 8 1 B ! Evaluation | Open label extension \ n n i Cycle 2 1 Cycle 3 JL JL Multiple crossover phase 6 weeks Evaluation phase Open label extension 4 weeks 6 months N-of-1 trial 10 weeks Run-in A (or washout) A (or washout) * 16 3 12 Příklad výstupu N-of-1 studie: S o O 1 5 9 13 17 21 25 29 33 37 41 45 49 53 _Time (days)| N-of-1 studie: příklad Patient consent and evaluation for the study (N = 106) Proceeding with MP (n = 86) I Not proceeding with MP (n = 20) Worsening condition (n = 6) Withdrew consent (n = 5) Lack of proof of progression (n = 3) Brain metastasis (n = 2) No malignant cells in the biopsy (n = 1) Unable to obtain tissue for analysis (n = 3) Not treated following MP (n = 18) Patients treated Worsening condition (n = 9) (n = 68) Withdrew consent (n = 4) i Brain metastasis (n = 2) i '-1 No malignant cells in the biopsy (n = 2) ' ' Needed to start treatment (n = 1) Treated according to MP Not treated according to MP (n=66) (n = 2) SI c o ° E SSI 05 > 2 5 Q_ CO 16-14-12-10-8-6-4-2-0- Progression-free survival (TTP) of last line of prior therapy i Progression-free survival of MP treatment I ■ I I I I I I I Patients With Progression-Free Survival Ratio > 1.3 MP: molecular profiling „N-of-1" studie: Výhody a nevýhody Výhody: -eliminacevlivu inter-individuálních rozdílů mezi pacienty Nevýhody: - výsledek léčby může být ovlivněn více faktory (např. sekvencí předchozí léčby, změnou biologie onemocnění apod.) - Komplikovaná extrapolace a zobecnění výsledků „Genotype-driven" studie: klasifikace dle zohlednění histologie/aberace „histology-based i A I Clinician's ciicics Histology-bas9d / r! \ \ fjQf( multiple aberrations „UMBRELLA" design „histology-independent", ^aberration -specific" WW n \ Lung Clinician's choice „BASKET" design V Histologv-inde pendent aberration-specific „Umbrella" design 1-é—-- DIFFERENT // MEDICINES 0 SflľlE stejný histologický typ onemocnění paralelně testovány různé přípravky u podskupin pacientů s různými typy mutací hodnotí se specificita účinnosti u jednotlivých molekulárních aberací „Umbrella" design: Výhody a nevýhody Výhody: - snížený počet „screening failures" - větší počet pacientů profitujících z léčby - možnost posouzení více léčebných modalit v rámci jedné stud Nevýhody: - větší počet ramen studie (statistické konsekvence) - celkově vyšší počet zařazených pacientů - logisticky náročnější průběh studie „Basket" design - odlišné histologické typy onemocnění - stejný typ mutace/ mechanismu účinku „Basket" design: Výhody a nevýhody Výhody: - možnost nalezení specifické léčby pro nádory odlišné histologie Nevýhody: - možnost podcenění odlišné odpovědi u nádorů různých histolog (např. BRAF u melanomu a kolorekt) Adaptivní design - Studie s adaptivním designem využívají nakumulované informace k modifikace dalšího průběhu studie: „l/l/e learn as we go" - FDA definice: .........an adaptive design clinical study is defined as a study that includes a prospectively planned opportunity for modification of one or more specified aspects of the study design and hypotheses based on analysis of data (usually interim data) from subjects in the study. - Hlavní prvky adaptivního designu: + Interim analýza + adaptivní randomizace Klasifikace studií: design Study designs Descriptive studies - designed to describe occurrence of disease by time, place and person Experimental (intervention studies) - Investigator intentionally alters one or more factors to study the effects of so doing L Uncontrolled trials - experimental trials without control or comparison groups (e.g. phase l/ll clinical trials) □ Prevalence surveys □ Case-series □ Surveillance data □ Analyses of routinely collected data (registries, mortality data, etc.) Controlled trials - trials with control groups (e.g. phase III trials) - controlled trials can be clinical trials (unit of randomization is an individual) or community trials (unit of randomization is a community or cluster) Analytic studies designed to examine etiology and causal associations Non-experimental (observational studies) - Does not involve intervention; investigator observes without intervention other than to record, count, and analyze results □ Cohort (retrospective and prospective) □ Case-control □ Cross-sectional □ Ecological Randomized (RCTs) - interventions allocated randomly (all participants or clusters have the same chance of being allocated to each of the study groups) Quasi-randomized - allocation done using schemes such as: according to date of birth (odd or even), number of the hospital record, date at which they are invited to participate in the study (odd or even), or alternatively into the different study groups Non-randomized - allocation to different groups done arbitrarily (without any underlying random process) Case-control studies (studie případů a kontrol) Case-Control Study m H tí Exposed Unexposed Exposed fit # Hi >—lim hSP^ UnexP°sed Controls 5 i past onset of study Základní charakteristika: V současnosti identifikujeme skupinu s výskytem sledovaného jevu (případy) a bez výskytu jevu (kontroly). Tyto skupiny „párujeme" dle předem zvolených parametrů (např. věk, pohlaví apod.) a retrospektivně analyzujeme rozdíl ve výskytu faktoru potenciálně ovlivňujících výskyt sledovaného jevu. ONeýhody: - Ne vždv dohledatelné údaie z historie Výhody: - Relativně levné a rychlé - Ne vždy dohledatelné údaje z historie - Pomáhají identifikovat potenciální zdroje aktuálního - Absence randomizace problému - Nesnadné dohledání kontrol Case-control studies (studie případů a kontrol): příklad BRITISH MEDICAL JOURNAL LONDON SATURDAY SEPTEMBER 30 1950 SMOKING AND CARCINOMA OF THE LUNG PRELIMINARY REPORT RICHARD DOLL, M.D., M.R.C.P. Member of the Statistical Research Unit of the Medical Research Council A. BRADFORD HILL, Ph.D., D.Sc. Professor of Medical Statistics, London School of Hygiene and Tropical Medicine: Research Unit of the Medical Research Council Honorary Director of the Statistical Smokers and Non-smokers The simplest comparison that can be made to show whether there is any association at all between smoking an5 carcinoma of the lung is that between the proportion of lung-carcinoma patients who have been smokers and the proportion of smokers in the comparable group of subjects without carcinoma of the lung. Such a comparison is shown in Table IV. Table IV.—Proportion of Smokers and Non-smokers in Lung-carcinoma Patients and in Control Patients with Diseases Other Than Cancer Disease Group No. of Non-smokers No. of Smokers Probability Test Malts: Lung-carcinoma patient* (649) 2 (0-3%) 647 P (exact method) = 00OWKK)64 Control patients with diseases other than cancer (649) 27 (4-2%) 622 Females: Lung-carcinoma patients (60) 19 (31-7%) 41 X* - 5-76; n = I 0-01niiiiciils to die lJi'iL.:i Mjiulvsiil-isI Skill 11II A-Mh I. ronJ jiiJ Diuy AdiiiuusUaliiKi. JSH 1 :..:.,]•' n 1061. RocLvillc. MD 20X52. All comments should be identified with the docket :.uii.lv: listed in the nutiee i>f availability thai publishes m the Federal Register. Fur questions rejijidmy this draft document, oi the Real-World Evidence Program. pk-.be email (•nrRMcd^aiPph^-ReniWMiiari ni.i.i.-n fa. hh-. ^.v VS. Department of Health and Human Senket Food and Drug Administration (enter for Drug Ktiluation and Research « HI li: Center for Biologies Evaluation and Research (CBKR) October 2021 R< ..I tt ■>■ Iii I »lii.i I;, •! u in 1.1 Evidence (RWD.'RWE) Oh Oh MX delivering rapid access to and analysis of representative, longitudinal RWD throughout a product's lifecycle Develop a capacity that will enable the Agency to rapidly and securely access and analyse large amounts of healthcare data Accelerate the implementation of a learning regulatory system based on electronic health records and other routinely collected RWD Promote use of high-quality real-world data (RWD) in decision making Sdílení dat z klinických studií: Data transparency revolution 1948: Publikována první klinická studie 1940 +4+ '"'Project Data Sphere feßbLINCC OWNERSHIP STEWARDSHIP 2006: 7r/a/s:„Whose data set is it anyway?" I960 I I I I I I II — 1980 -h 2020 -- mt t-r- —- tm YODA PROJECT Forginga unified scientific community linicalStudý ; DaiaReouest.com ' ® EDITORIALS The BMJ requires data sharing on request for all trials Heeding calls from the Institute of Medicine, WHO, and the Nordic Trial Alliance, we are extending our policy Datový standard pro sdílení dat z klinických studií cdisc Data Tabulations (SDTM) Uppsala Monitoring WHODľUg Centre "HTM Data Validation Passed? Analysis Database (ADaM) MedDRA AOaM DäU Validation Tables, Ustings, and Figures • Do roku 2000 bez standardizace 1997-založení CDISC 2016 - FDA vyžaduje SDTM 2019 - FDA vyžaduje ADaM 2020 - PMDA vyžaduje SDTM & ADaM 6. Základy deskriptívni statistiky Typy statistických analýz v klinických studiích Deskriptívni statistika a intervalové odhady znaků f i m výběr dle optimálního plánu V OO00OOO0O0 variabilita hodnot ve výběrovém souboru VÝSLEDKY Srovnání více skupin a testování hypotéz v\ /17 výběr subjektů pro vstup do hodnocení / studie v -Y- RANDOMIZACE vzájemně srovnatelné vzorky (faktor F) rameno A' rameno B měření znaku X \ 0O0O0 OooC.......) ........................................*■ •«......................................... variabilita hodnot X variabilita hodnot X v rameni A v rameni B % 4 VÝSLEDKY Novembe Praktické aspekty analýzy dat v KHL Základní typy dat a jejich využití jako endpointů Data nominální Rovná se ? Otázky „Ano/Ne' Confidence interval Popu Lation 95% chance your population mean will fall between lower and upper Limit 95% Confidence Interval: To 95%, the mean vaLue of the popuLation is in this range. H Lower 1 ^^^^ I Upper ■ 1 limit limit 1 Confidence interval -3 -1 0 2 3 MATHS _0'J- Confidence intervals provide a range of plausible values for an unknown population parameter. They are constructed based on sample data and provide an estimate of the parameter along with a level of confidence. For example, a 95% confidence interval indicates that if the sampling process is repeated many times, 95% of the intervals constructed would contain the true population parameter. Confidence intervals are useful for quantifying the uncertainty associated with an estimate and providing a range of values within which the true parameter is likely to fall. Confidence interval Hypothesis testing Experiment Does Experiment Not Reject H0 Rejects H0 H0 is Actually True H0 is Actually False Correct Outcome Incorrect Outcome Type 1 Error (a) Incorrect Outcome Type II Error (ß) Correct Outcome Power (1- (3) Hypothesis testing is a statistical procedure used to make decisions or draw conclusions about a population based on sample data. The process involves formulating a null hypothesis (HO) and an alternative hypothesis (Ha). The null hypothesis represents the status quo or no effect, while the alternative hypothesis suggests a specific effect or difference. The steps of hypothesis testing typically include choosing a significance level (a), calculating a test statistic, and comparing it to a critical value or p-value to determine the statistical significance of the results. Aplikovaná analýza přežití Aplikace analýzy přežití Analýza přežití je v současnosti nejvíce používána ve dvou oborech: ..Lifetime data" v lékařském výzkumu ,Overall Survival (OS)" - „Time to Progression (TTP)" - „Time to Treatment Failure (TTF)" - ^Duration of Response" - „Relapse Free Survival" - jme ..Reliability studies" v průmyslu - zátěžové zkoušky součástek Nejčastější cíle analýzy dat přežití v medicíně □ Deskriptívni popis a modelování přežití pacientů v jedné skupině, odhad charakteristik křivky přežití (medián přežití apod.) □ Srovnání přežití ve dvou nebo více skupinách pacientů např. s odlišnou léčbou □ Vícerozměrná analýza vlivu prognostických faktorů na přežití Základní charakteristika dat přežití Základní vlastností dat typu přežití je skutečnost, že určitá pozorování mohou být „censorována", což znamená, že sledovaný jev (např. úmrtí, relaps apod.) u pacienta ve sledovaném období nenastal. Tato „censorovaná" pozorování však není možné ignorovat, protože v sobě nesou zásadní informaci o účinnosti hodnocené léčby. Praktický příklad dat přežití Data pacientu s angina pectoris ve studii s 15letym follow-up (Mayo Clinic, Gehan 1969) Survival time [years] Number of patients known to Number of patients lost to survive at beginning of interval follow up 0-1 2418 /A 1-2 1962 /39\ 2-3 1697 / 22 1 3-4 1523 23 4-5 1329 24 5-6 1170 107 6-7 938 133 O 7-8 722 102 ŕ m 8-9 546 68 9-10 427 64 10-11 321 45 11-12 233 53 12-13 146 33 13-14 95 \ 27 / 14-15 59 W 15-16 30 Příklad cenzorovaných dat v klinických studiích Modelová klinická studie: Analyzovaný počet pacientů:..........................4 pacienti Primární endpoint:..................... Overall Survival (OS) Období náběru (=Accrual Period):.....................12 měsíců Minimální follow up:.................24 měsíců Příklad cenzorovaných dat v klinických studiích Náběr Follow up Pacient •-1 D eat Pacient 2 Lost to fol ow up Pacient 3 Death Pacient 4 Withd rawn 01/01/2000 01/01/2001 Kalendářní čas 01/01/2002 31/12/2002 Příklad cenzorovaných dat v klinických studiích Subjekt 2 Subjekt 3 Subjekt 4 0 Follow up n 12 měsíců Follow-up W 24 měsíců 36 měsíců D=death, L-lost to follow-up, W-withdrawn_ Kumulovaná pravděpodobnost přežití: modelová studie Cíl studie: Zhodnocení přínosu udržovací léčby na prodloužení doby do relapsu u dětských pacientů s akutní lymfoblastickou leukémií Design studie: Po dosažení kompletní remise (CR) po primární léčbě, byli pacienti randomizováni do dvou ramen: - Placebo - 6-mercaptopurine (6-MP) Primární endpoint: Time to Progression (TTP) Výsledek modelové studie Celkem randomizováno 42 pacientů (1:1): Placebo: 21 z 21 pacientů relabovalo 6-MP: 12 z 21 pacientů při ukončení studie stále v CR Doba sledování pacientů v týdnech: Placebo: 1,1,2,2,3,4,4,5,5,8,8,8,8,11 ,1 1,12,12, 15, 17,22,23 6-MP: 6, 6, 6, 6*, 7, 9*, 10, 10*, 11*, 13, 16, 17*, 19*, 20*, 22, 23, 25*, 32*, 32*, 34*, 35* (*cenzorovaná pozorování) Možnosti analýzy dat modelové studie 1/ Srovnání průměru nebo mediánu doby do relapsu - není možné, neznáme u cenzorovaných pacientů 21 Srovnání podílu relapsů v obou skupinách (100% pro placebo, 43% pro 6-MP) - nepřináší nám informaci o prodloužení doby do relapsu - u cenzorovaných pacientů je možné, že při delším follow- up by k relapsu došlo Nutnost použití jiné techniky odhadu přežití: kumulativní pravděpodobnost přežití Základní princip odhadu kumulativní pravděpodobnosti přežití A p je spočítána pro každý časový interval samostatně A P(1) P(2) P(3) A P(4) A p v jednotlivých časech P(5) P(6) A P(7) A P(8) jsou na sobě nezávislé P(9) A p(10) A P(11) A P(12) 1 M 2M 3M 4M 5M 6M 7M 8M 9M 10 M 11 M 12 M Čas [měsíce] Výpočet kumulativní pravděpodobnosti přežití Podmíněná pravděpodobnost přežití 1. měsíc od data diagnózy: počet pacientů vstupujících do studie - počet pacientů zemřelých 1. měsíc P(1) = počet pacientů vstupujících do studie Podmíněná pravděpodobnost přežití 6. měsíc od data diagnózy: a počet pacientů „at risk" v 6. měsíci - počet pacientů zemřelých 6. měsíc p(6) = počet pacientů „at risk" v 6. měsíci Kumulativní pravděpodobnost přežití 12 měsíců od data diagnózy P(12)= p(1)xp(2)xp(3).........xp(12) Výpočet kumulativní pravděpodobnosti přežití: Placebo Doba do Počet Počet Počet pacientů Podmíněná Kumulativní progrese cenzorovaných relapsů „at risk" pravděpodobnost přežití pravděpodobnost přežití dJ nj P(t) 1 0 2 21 19/21=0,905 0,905 2 0 2 19 17/19=0,895 0,905 x 0,895 = 0,810 3 0 1 17 16/17=0,941 0,810x0,941 = 0,762 4 0 2 16 14/16=0,875 0,762 x 0,875 = 0,667 5 0 2 14 12/14=0,857 0,667 x 0,857 = 0,571 8 0 4 12 8/12=0,667 0,571 x 0,667 = 0,381 11 0 2 8 6/8=0,750 0,381 x 0,750 = 0,286 12 0 2 6 4/6=0,667 0,286 x 0,667 = 0,191 15 0 1 4 3/4=0,750 0,191 x 0,750 = 0,143 17 0 1 3 2/3=0,667 0,143 x0,667 = 0,095 22 0 1 2 1/2=0,500 0,095 x 0,500 = 0,048 23 0 1 1 0/1=0,000 0,048 x 0,000 = 0,000 Kaplan-Meier křivka přežití Survival in Placebo arm Placebo o o 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Time Výpočet kumulativní pravděpodobnosti přežití: Aktivní rameno Doba do Počet Počet Počet pacientů Podmíněná Kumulativní progrese cenzorovaných relapsů „at risk" pravděpodobnost přežití pravděpodobnost přežití nj Pj=(nrdj)/ni P(t) 6 1 3 21 18/21=0,857 0,857 7 0 1 17 16/17=0,941 0,857 x 0,941 = 0,807 9 1 0 16 10 1 1 15 14/15=0,933 0,807 x 0,933 = 0,753 11 1 0 13 13 0 1 12 11/12=0,917 0,753 x0,917 = 0,690 16 0 1 11 10/11=0,909 0,690 x 0,909 = 0,628 17 1 0 10 19 1 0 9 20 1 0 8 22 0 1 7 6/7=0,857 0,628 x 0,857 = 0,538 23 0 1 6 5/6=0,833 0,538 x 0,833 = 0,448 Kaplan-Meier křivka přežití Survival in 6-MP arm "T- 6-MP CD "D —"5 O T3 O 0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 Time Srovnání přežití v obou ramenech Comparison of survival in treatment arms Placebo 6-MP o o 3- 0 10 15 20 Time 25 30 35 40 Srovnání výpočtu RR, OR a HR v jedné studii Křivky přežití pro přípravek A a Placebo jsou v průběhu follow-up vzájemně odlišné Hazard Ratio (HR) vyjadřuje poměr rizika nastání události v průběhu celého follow-up a je tedy nejspolehlivějším vyjádřením srovnání rizika v obou ramenech Při interpretaci křivek přežití bývá často přeceňován jejich „konec" který je však z důvodu velmi nízkého počtu pacientů „at risk" velmi nespolehlivý pro jakékoliv smysluplné interpretace. Hazard ratio Vyjadřuje odhad poměru rizika úmrtí, progrese, nebo relapsu (podle definice endpointu) mezi srovnávanými skupinami HR = Riziko relapsu na experimentální léčbě Riziko relapsu na placebu Léčba je lepší Bez efektu Léčba je horší Interval spolehlivosti (např. pro HR=0,68: 0,42-0,88) nesmí obsahovat hodnotu 1 aby byl výsledek statisticky signifikantní. Role statistika v klinických studiích Zapojení statistika do klinické studie Study preparation, designing, sample size calculation, protocol writing Start of the study End of clinical part of the study Submission of study results to regulatory authority/ application for registration Statistical analysis Randomization Preparation of Statistical Analysis Plan (SAP) according to ICH E3 Creation of (blinded) data listings for data Completion of review and/or Finalization of statistical analysis SAP Sometimes requested 1st Enrollment of subjects, data draft of SAP entry Data entry, data validation medical review, medical (WHODrug, MedDRA coding) (blind) Data Review Meeting (BDRM) Determination of reasons for exclusion from analysis sets Approval of disposition of subjects in analysis sets Additional Additional exploratory exploratory analyses analyses _ Statistical outputs, i.e. TFLs including Completion of all unblinded Writingof Clinical Study files needed for listings Report (CSR) B submission and validation A// data included in DB Data are clean = No open queries SAE reconciliation done Protocol deviations identified and approved SAP signed Preparation of manuscripts for publications November 21, 2024 154 Proces statistického zpracování dat klinického hodnocení Data Management Statistical Analysis Reporting Data management processes SIAP, SAP written according the study protocol, charter, (e-)CRF Locked database Interpretation of results, discussion of results with client/medical writer. Input/ review of CSR. Additional/ exploratory analyses Zapojení statistika do klinické studie Protokol studie ICH harmonisation for better health ICH Guidelines •Stability • Impurities testing • GMP • Carcinogenicity • Genotoxicity • Reprotoxicity • Clinical trials • Pharmacogenomics • MedDRA •ctd • Electronic Standards TABLE OF CONTENTS Abbreviation* And Definition* (»ť Term* PROTOCOL SYNOPSIS Table I Schedule of Study Visits, Procedures & Measurement* Figure I Study Diagram Background Information And Rationale 1.1 Introduction 1.2 Name And Description Of Investigational Product Or lh-M.M|>:ii»!i t >l IJ: T u i - U: 11;. •! t 1.3 Findings From Non-Clinical And Clinical Studies 1.3.1 \. ■ 'i ■( :: Studies 1.3.2 Clinical Studies 1.4 Selection Of Drugs And Dosages 1.3 Compliance Statement I r» Discussion of Relevant literature And Data Study Objectives _ I Primary Objective 2.2 Secondary Objectives Investigational Plan 3.1 (icncial Schema Of Study Design (ovcvicw) 3.1.1 Screening Phase 3.1.2 Treatment Phase 3.IJ Follow-Up Phase (if applicable) 3.2 Randomization And Blinding 3.3 Study Duration. Enrollment And Number Of Sites 3.3.1 Duration Of Study 3.3.2 Total Number Of Study Sites Total Number Of Subjects Projected M Study Population 3.4.1 Inclusion Criteria 3.4.2 Exclusion Criteria Study Procedures 4.1 42 Screening Visit Treatment Pha*e 4.2.1 Visit 1 4.2.2 Visit 2 (etc ) Follow-Cp Phase 4.4.1 Visit Unscheduled Visits Concomitant Medication Rescue Medication Administration Subject Completion Withdrawal 4.8.1 Farty Termination Study Visit Study Evaluations and Measures S.I Screening And Baseline Fvaluation* (Procedures & Measurements) 5 1.1 I" . . I. txam* 5 1.2 Laboratory Test* 5.1.3 Other Procedures Efficacy (-valuation* 5.2.1 Diagnostic Tests. Scales. Measures. Ftc Pharmacokinetic [valuation (if applicable) _' '. _ 5.2 5J 5 -i Statistical Considerations 6.1 Primary Fndpoint 62 Secondary Endpoint* 6.3 Statistical Methods 6.3.1 Baseline Data 6.3.2 Efficacy Analysis 6.3.3 Safety Analyst* 6.4 Sample Si/c And Power 6.5 Interim Analysts (if applicable ^^^TTu'y^cdiTaTor^A'ö'o^ 7.1 Description 7 1.1 Packaging 7 1.2 labeling 7 1.3 Dosing 7.1.4 Treatment Compliance And Adherence 7.1.5 Drug Accountability 8 Safety Management S I Clinical Adver*c I vent* Adverse Event Reporting Definition Of An Adverse Event Definition Of A Serious Adverse Fvcnt (SAF*) 1RB IIC Notification Ol SAF* Investigator Reporting Of SAFs to Sponsor 8.7 Medical Fmcrgcncic* Study Administration 9.1 Treatment Assignment Method* 9.1.1 Randomization 9.1.2 Blinding 9.1.3 Unblindmg Data Collection And Management Regulatívy And Ethical Consideration* 9 3.1 Data And Safer* Monitoring Plan 9.3.2 Risk Assessment 9.3.3 Potential Benefits Of Trial Participation 9 3 4 Risk-Benefit Assessment Informed Consent Assent Process Payment To Subjects Families Confidentiality t2 sj m 8.5 16 9.2 9.3 94 w 9.6 Publication References November 21, 2024 156 Publikace výsledků studie v renomovaném časopise není zárukou jejich správnosti! o N s O R T TRANSPARENT REPORTING of TRIALS Login Go Home CONSORT Statement Extensions / + AIITrials Please join CONSORT in supporting the All Trials campaign to get all ON! Unfortunately significance tests of baseline differences are still common(23) (32) (210): they were reported in half of 50 RCTs trials published in leading general journals in 1997 11 S3) Such significance tests assess the probability that observed baseline differences could have occurred by chance: however we already know that any differences are caused by chance Tests of baseline differences are not necessarily wrong just illogical (2111 Such hypothesis testing is superfluous and can mislead investigators and their readers Rather comparisons at baseline should be based on consideration of the prognostic strength of the variables measured and the size of any chance imbalances that have occurred (211) Welco coNsonn m--. Trials enVc^^^r^^Hrancu: CONSORT Group to illeviat reporting of randomized conl The main product of CONSC which is an evidence-based minimum set of recommendations for reporting RCTs It offers a standard way for authors to prepare reports of tnal findings facilitating their complete and transparent reporting and aiding their critical appraisal and interpretation http //www bmj com/content'348 Read more Read more news stories bmj. P-values in ba contrcHp common in hi Mj Knol, RHH Groer Table 1. Total number of RCTs, number of RCTs reporting p-values in the baseline table, and number of RCTs without baseline table published in 2008. 2009 or 2010 in major general medical and cardiovascular journals Total p-value in baseline table No baseline table Journal N N (%) N JAMA 149 86 (58.5%) 2 NEJM 321 169 (54.3%) 10 Circulation 141 59 (47.2%) 16 European Heart Journal 86 43 (43.9%) 12 Annals of Internal Medicine 74 15 (21.1%) 3 BMJ 150 1 1 (7.7%) 7 Lancet 254 5 (2.0%) 10 Total 1175 388 (34.8%) 60