Analýza přežití v lékařském datovém souboru Upozornění: Z výsledků jednotlivých úkolů vytvořte komentovaný protokol pro lékaře. Načtěte do STATISTIKY datový soubor nadory_zaludku_upraveny_sta. 1. Najděte Kaplanův-Meierův odhad funkce přežití pro všechny pacienty, nakreslete graf a vypočtěte medián doby přežití. Funkce přežívání Ukončené Cenzorované 0 10 20 30 40 50 60 70 80 Čas přežívání 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 Kumulat.podílpřežívajících Medián = 30,1 měsíce 2. Najděte Kaplanovy-Meierovy odhady funkce přežití pro dvě skupiny pacientů rozlišených podle nižšího a vyššího stadia (stadium 1 a 2 považujeme za nižší, stadium 3 a 4 za vyšší) a nakreslete jejich grafy. Pro obě skupiny vypočtěte medián doby přežití. Vytvořte kontingenční tabulku zachycující rozdělení úmrtí podle nižšího a vyššího stadia. Zjistěte, kolik procent pacientů s nižším resp. vyšším stadiem zemřelo. Na hladině významnosti 0,05 testujte hypotézu, že přežívání v těchto dvou skupinách se neliší. Kumulativní podíl přeživajících (Kaplan-Meier) Ukončené Cenzorované nižší stadium vyšší stadium 0 10 20 30 40 50 60 70 80 Čas -0,1 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 Kumulat.podílpřežívajících Medián pro nižší stadium = 33,1 měsíce, medián pro vyšší stadium = 19 měsíců Kontingenční tabulka (nadory_zaludku_upraveny.sta) Četnost označených buněk > 10 (Marginální součty nejsou označeny) smrt r_stadium nižší stadium r_stadium vyšší stadium Řádk. součty Četnost Sloupc. četn. Četnost Sloupc. četn. Četnost žije 14 2 16 45,16% 12,50% zemřel/a 17 14 31 54,84% 87,50% Vš.skup. 31 16 47 Pacientů s nižším stadiem žije 45,2 %, s vyšším stadiem 12,5 %. Výsledky Gehanova – Wilcoxonova testu: testová statistika = 2,071201, p = ,03834, hypotézu o shodě přežívání v daných dvou skupinách zamítáme na hladině významnosti 0,05. 3. Stejné úkoly jako v bodě 2 proveďte pro dvě skupiny pacientů rozlišených podle gradingu. Kumulativní podíl přeživajících (Kaplan-Meier) Ukončené Cenzorované grade 2 grade 3 0 10 20 30 40 50 60 70 80 Čas 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 Kumulat.podílpřežívajících Medián pro grade 2 = 45,2 měsíce, medián pro grade 3 = 28 měsíců Kontingenční tabulka (nadory_zaludku_04042012.sta) Četnost označených buněk > 10 (Marginální součty nejsou označeny) smrt grading 2 grading 3 Řádk. součty Četnost Sloupc. četn. Četnost Sloupc. četn. Četnost žije 4 9 13 50,00% 26,47% zemřel/a 4 25 29 50,00% 73,53% Vš.skup. 8 34 42 Pacientů s grade 2 žije 50 %, s grade 3 26,5 %. Výsledky log - rank testu: testová statistika = -1,67070 p = ,09478, hypotézu o shodě přežívání v daných dvou skupinách nezamítáme na hladině významnosti 0,05. 4. Stejné úkoly jako v bodě 2 proveďte pro dvě skupiny pacientů rozlišených podle relapsu. Kumulativní podíl přeživajících (Kaplan-Meier) Ukončené Cenzorované relaps byl relaps nebyl 0 10 20 30 40 50 60 70 80 Čas -0,1 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 Kumulat.podílpřežívajících Medián pro pacienty s relapsem = 22 měsíců, bez relapsu = nelze vypočítat Kontingenční tabulka (nadory_zaludku_04042012.sta) Četnost označených buněk > 10 (Marginální součty nejsou označeny) smrt vyskyt relapsu relaps nebyl vyskyt relapsu relaps byl Řádk. součty Četnost Sloupc. četn. Četnost Sloupc. četn. Četnost žije 15 1 16 62,50% 4,35% zemřel/a 9 22 31 37,50% 95,65% Vš.skup. 24 23 47 Pacientů bez relapsu žije 62,5 %, s relapsem 4,4 %. Výsledky Gehanova – Wilcoxonova testu: testová statistika = -3,12220 p = ,0018, hypotézu o shodě přežívání v daných dvou skupinách zamítáme na hladině významnosti 0,05. 5. Najděte Kaplanovy-Meierovy odhady funkce přežití pro 4 skupiny pacientů rozlišených podle proměnné N (nodus) a nakreslete jejich grafy. Na hladině významnosti 0,05 testujte hypotézu, že přežívání v těchto čtyřech skupinách se neliší. Zamítnete-li nulovou hypotézu, zjistěte, které dvojice skupin pacientů se liší na hladině významnosti 0,05. Návod: při provádění dvouvýběrových testů použijte Bonferroniho korekci, tzn., že hladinu významnosti 0,05 podělíte počtem porovnávaných skupin (v tomto případě 6 2 4 =      ) a p-hodnotu porovnáváte s 0,05/6. Pro všechny čtyři skupiny vypočtěte medián doby přežití. Vytvořte kontingenční tabulku zachycující rozdělení úmrtí podle variant proměnné N (nodus). Zjistěte, kolik procent pacientů v jednotlivých skupinách zemřelo. Kumulativní podíl přeživajících (Kaplan-Meier) Ukončené Cenzorované N0 N1 N2 N3 0 10 20 30 40 50 60 70 80 Čas -0,1 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 Kumulat.podílpřežívajících Medián pro pacienty s N0 = 55 měsíců, N1 = 32 měsíců, N2 = 30 měsíců, N3 = 12 měsíců. Kontingenční tabulka (nadory_zaludku_04042012.sta) Četnost označených buněk > 10 (Marginální součty nejsou označeny) smrt N 0 N 1 N 2 N 3 Řádk. součty Četnost Sloupc. četn. Četnost Sloupc. četn. Četnost žije 4 11 1 0 16 66,67% 40,74% 14,29% 0,00% zemřel/a 2 16 6 7 31 33,33% 59,26% 85,71% 100,00% Vš.skup. 6 27 7 7 47 Pacientů s N0 žije 66,7 %, s N1 40,7 %, s N2 14,3 % a pacienti s N3 umřeli všichni. Výsledek chí-kvadrát testu: testová statistika = 9,679051, počet stupňů volnosti = 3, phodnota = ,02151. Hypotézu o shodě přežívání v daných čtyřech skupinách zamítáme na hladině významnosti 0,05. Provedení log-rank testu s Bonferroniho korekcí: nejprve se provede jen test pro dvě skupiny, které se nejvíce liší, a to skupiny N0 a N3. Vypočtenou p-hodnotu porovnáme s číslem 0,05/6 = 0,0083. Výsledky log - rank testu: testová statistika = -2,52446 p = ,01159, hypotézu o shodě přežívání v daných dvou skupinách nezamítáme na hladině významnosti 0,0083. 6. Ze stránky http://www.math.muni.cz/veda-a-vyzkum/vyvijeny-software/274-matlabtoolbox.html stáhněte balík kerns i nápovědu k němu. Pomocí funkce kshazard.m nakreslete Kaplanův-Meierův odhad funkce přežití pro všechny pacienty (eventuálně pro vybrané skupiny pacientů, jak jsou specifikovány v úkolech 2 – 5) a porovnejte tento graf s grafem vytvořeným v systému STATISTICA. 0 10 20 30 40 50 60 70 80 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Kaplan-Meier estimate of survival function 7. Pomocí funkce kshazard.m nakreslete odhad rizikové funkce s různými typy jader a různými šířkami vyhlazovacího okna pro všechny pacienty (eventuálně pro vybrané skupiny pacientů, jak jsou specifikovány v úkolech 2 – 5) a pokuste se o interpretaci. Ukázka odhadu rizikové funkce pro všechny pacienty: 0 10 20 30 40 50 60 70 80 0 0.005 0.01 0.015 0.02 0.025 0.03