Cvičení č. 12.: Analýza přežití Datový soubor mamma.sta obsahuje vybrané údaje o 1000 pacientkách, které byly léčeny v Masarykově onkologickém ústavu v Brně s diagnózou rakoviny prsu. Seznam proměnných: VEK … věk v době stanovení diagnózy DS … doba sledování v měsících SMRT … varianta 0 – nezemřela, varianta 1 – zemřela STRANA … varianta 1 – pravá, varianta 2 – levá CHT … chemoterapie, varianta 0 – nebyla, varianta 1 – byla CHT_TYP … typ chemoterapie, varianta 0 – CHT nebyla, varianta 1 – CMF, varianta 2 – FAC, varianta 3 – jiná HT … hormonální terapie, varianta 0 – nebyla, varianta 1 – byla LR … lokální recidiva, varianta 0 – nebyla, varianta 1 – byla MTS … metastázy, varianta 0 – nebyly, varianta 1 – byly MP … menopauza, varianta 1 – premenopauzální, varianta 2 – postmenopauzální HISTOL … histologie, varianta 1 – duktální, varianta 2 – lobulární, varianta 3 – modulární, varianta 4 – ostatní STADIUM … stadium nádorového onemocnění, varianty 1, 2, 3, 4 Úkol 1.: Popište datový soubor pomocí tabulek četností, kontingenčních tabulek, číselných charakteristik a grafů. Např. charakteristiky věku: Histogram věku: Četnostní tabulky proměnných SMRT, STRANA: Výsečový diagram proměnné STADIUM: Čiselné charakteristiky proměnné DS: Atd. Úkol 2.: Najděte Kaplanův – Meierův odhad funkce přežití pro celý soubor: Úkol 3.: Zjistěte charakteristiky doby přežití pro pacientky pre- a postmenopauzální, najděte K-M odhad funkce přežití pro 1. a 2. skupinu a na hladině výzanmnosti 0,05 testujte hypotézu, že doby přežití se pro 1. a 2. skupinu neliší. Výsledky G-W testu: Test. statist. = 2,229505 p = ,02578. Na hladině významnosti 0,05 tedy zamítáme hypotézu, že doby přežití se v daných dvou skupinách pacientek neliší. Úkol 4.: Zjistěte charakteristiky doby přežití pro skupiny pacientek v různých stádiích nádorového onemocnění. Najděte K-M odhad funkce přežití pro každou skupinu a na hladině významnosti 0,05 testujte hypotézu, že doby přežití se v těchto skupinách neliší. Kontingenční tabulka proměnných SMRT a STADIUM: Výsledky porovnání přežívání ve více skupinách: Chí-kvadrát= 33,78385, sv = 3, p = ,00000. Na hladině významnosti 0,05 tedy zamítáme hypotézu, že doby přežití se v daných čtyřech skupinách pacientek neliší. Samostatný úkol: Proveďte porovnání přežívání ve skupinách pacientek rozdělených podle ostatních nominálních proměnných, např. podle proměnné STRANA, CHT apod.