logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Kalina Lineární regrese Neparametrické varianty Nelineární regrese? 14. Regrese logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, S. Littnerová, J. Kalina Fisherův exaktní (přímý) test Typ regrese Počet nezávislých proměnných Počet závislých proměnných Předpoklady Funkce Jednoduchá lineární regrese (MNČ) 1 1 Gauss-Markovova věta lineární Vícenásobná lineární regrese n 1 - lineární Neparametrické metody (Theil-Sen, Siegel Repeated Medians) 1 1 Gauss-Markovova věta lineární ? n 1 - lineární Zobecněné lineární modely (GLM) n 1 Gauss-Markovova věta po transformaci logistická, logaritmická Zobecněné aditivní modely (GAM) n 1 Lasso regrese, Ridge regrese Bayesovské metody logo-IBA Jednoduchá lineární regrese —V případě existence vzájemného vztahu (korelace) lze tento vztah podrobněji popsat. —Cíl regresní analýzy: popsat závislost hodnot proměnné Y na hodnotách proměnné X. —V případě lineární regrese je tento popis dán lineárním modelem tvaru y = ax + b. —Existují i techniky nelineární regrese. —Nemáme-li dostatek informací k teoretickému souboru, snažíme se odhadnout typ funkce pomocí dvourozměrného diagramu. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, J. Kalina logo-IBA Předpoklady lineární regrese —Hlavním předpokladem je splnění požadavků Gauss-Markovovy věty: 1. 2. 3. —Splnění těchto předpokladů je zajištěno v případě, kdy jsou rezidua normálně rozdělena, nezávislá na prediktorech (které jsou nezávislé). Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, J. Kalina E(\varepsilon_i)=0, V(\varepsilon_i)= \sigma^2 < \infty, {\rm cov}(\varepsilon_i,\varepsilon_j) = 0, \forall i \neq j logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, S. Littnerová, J. Kalina Jednoduchá lineární regrese —Varianta bez interceptu (abs. členu) logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, S. Littnerová, J. Kalina Vyjádření rizik ve čtyřpolní tabulce - motivace —Sledujeme souvislost věku matky a výskytu náhlého úmrtí kojence (SIDS). Výsledky dány v tabulce. —Pomocí Pearsonova chí‐kvadrátu nebo Fisherova exaktního testu můžeme rozhodovat o závislosti/nezávislosti dvou sledovaných veličin. Testy ale neumožňují tento vztah kvantifikovat. — —Má‐li to smysl a chceme‐li kvantifikovat (rozhodovat o těsnosti této závislosti) můžeme použít tzv. relativní riziko a poměr šancí.