Úvod Bi7491 Regresní modelování Úvod Obecné informace Institut biostatistiky a analýz Lékařská fakulta, Masarykova univerzita Ondřej Májek, 2020 Bi7491 Regresní modelování - Úvod Cíle předmětu Na konci tohoto kurzu bude student schopen: • definovat různé typy regresních modelů, • navrhnout a vytvořit regresní model vhodný pro řešení zadaného problému, • posoudit kvalitu sestaveného modelu, • interpretovat výsledky regresní analýzy. Institut biostatistiky a analýz Lékařská fakulta, Masarykova univerzita Ondřej Májek, 2020 Bi7491 Regresní modelování - Úvod Předběžný plán předmětu • Úvod, Motivace, Opakování (27.2.2020) • Regrese s normálním modelem I (5.3.2020) • Regrese s normálním modelem II (12.3.2020) • Případová studie – normální lineární model (26.3.2020) • Logistická regrese (2.4.2020) • Písemka (zřejmě 9.4.2020); Jiné zobecněné lineární modely • Případová studie – logistický regresní model (16.4.2020) • Smíšený model a longitudinální modely (30.4.2020) • Prediktivní modelování, prostor pro vypracování projektu/konzultace, předtermín • zpravidla 2 hodiny přednáška + 1 hodina cvičení (počítače, balík R) • konzultace dle potřeby po předchozí domluvě Institut biostatistiky a analýz Lékařská fakulta, Masarykova univerzita Ondřej Májek, 2020 Bi7491 Regresní modelování - Úvod Požadavky na ukončení • docházka na cvičení (lze 2 absence) • písemka v průběhu semestru • vypracování praktického úkolu – zvolíte si datový soubor a podrobíte jej regresní analýze • zkoušková písemka • ústní část zkoušky – diskuse nad praktickým úkolem a písemnou částí • aktivita v hodinách – PTEJTE SE ☺ Institut biostatistiky a analýz Lékařská fakulta, Masarykova univerzita Ondřej Májek, 2020 Bi7491 Regresní modelování - Úvod Literatura • Andersen P. K., Skovgaard, L.T. (2010) Regression with Linear Predictors, Springer. • Harrel F. E., Jr. (2001): Regression Modeling Strategies. With Applications to Linear Models, Logistic Regression and Survival Analysis. Springer, Springer Series in Statistics, New York. • Forbelská, M: Materiály k výuce lineárních statistických modelů a zobecněných lineárních modelů • Dalgaard, P (2008) Introductory statistics with R, sec. ed., Springer. • Vittinghoff, E., Glidden, DV., Shiboski, SC., McCulloch, CE. (2005) Regression methods in biostatistics, Springer. • Šmilauer, P: Moderní regresní metody http://regent.jcu.cz/MRM.pdf • Pekár, S., Brabec, M. (2009) Moderní analýza biologických dat -- Zobecněné lineární modely v prostředí R Institut biostatistiky a analýz Lékařská fakulta, Masarykova univerzita Ondřej Májek, 2020 Bi7491 Regresní modelování - Úvod Elektronické texty • Biostatistika pro matematickou biologii http://portal.matematickabiologie.cz/index.php?pg=aplikovana-analyza- klinickych-a-biologickych-dat--biostatistika-pro-matematickou-biologii • Regresní modelování http://portal.matematickabiologie.cz/index.php?pg=analyza-a-hodnoceni- biologickych-dat--regresni-modelovani • Statistické modelování http://portal.matematickabiologie.cz/index.php?pg=analyza-a-hodnoceni- biologickych-dat--statisticke-modelovani Úvod Čím se budeme zabývat a k čemu to bude? Institut biostatistiky a analýz Lékařská fakulta, Masarykova univerzita Ondřej Májek, 2020 Bi7491 Regresní modelování - Úvod Čím se budeme zabývat – (Víceprediktorové) regresní modely – Hledání vztahu mezi několika prediktory (vysvětlujícími proměnnými) a nějakým výsledkem (vysvětlovanou proměnnou) Institut biostatistiky a analýz Lékařská fakulta, Masarykova univerzita Ondřej Májek, 2020 Bi7491 Regresní modelování - Úvod Účel regresního modelování 1. Zjištění „čistého“ vlivu konkrétního prediktoru na výsledek Protože ostatní proměnné nás mohou mást (zavádějící faktory) 2. Pochopení vztahu mezi více vysvětlujícími proměnnými a nějakým výsledkem Vliv proměnných se pro různé subjekty může lišit (interakce) 3. Předpověď výsledku pro nově pozorované subjekty Institut biostatistiky a analýz Lékařská fakulta, Masarykova univerzita Ondřej Májek, 2020 Bi7491 Regresní modelování - Úvod 1. Zjištění „čistého“ vlivu Konzumace kávy se zdá být spojena s vyšším rizikem ischemické choroby srdeční Institut biostatistiky a analýz Lékařská fakulta, Masarykova univerzita Ondřej Májek, 2020 Bi7491 Regresní modelování - Úvod 1. Zjištění „čistého“ vlivu Důvodem je však spojení konzumace kávy s kouřením, které má vliv na riziko ischemické choroby srdeční. Konzumace kávy samotná proti chorobě spíše chrání. Institut biostatistiky a analýz Lékařská fakulta, Masarykova univerzita Ondřej Májek, 2020 Bi7491 Regresní modelování - Úvod 2. Vztahy mezi prediktory Interakce - modifikace vlivu Slábnutí negativního vlivu u starších osob (kouření na srdeční choroby) Mladší: Starší: Institut biostatistiky a analýz Lékařská fakulta, Masarykova univerzita Ondřej Májek, 2020 Bi7491 Regresní modelování - Úvod 3. Předpověď výsledku Zdroj: http://www.szu.cz/tema/prevence/score Tabulka rizika úmrtí v důsledku srdečně-cevního onemocnění v následujících 10 letech (pro českou populaci) věk + pohlaví + kouření + systolický krevní tlak + celkový cholesterol → riziko úmrtí Institut biostatistiky a analýz Lékařská fakulta, Masarykova univerzita Ondřej Májek, 2020 Bi7491 Regresní modelování - Úvod Diskuse Lze zadání vašich diplomových projektů formulovat jako regresní problém? (prediktory, výsledek, zkreslující proměnné,interakce)