M5VM05 Statistické modelování 11. Konkrétní GLM modely - II. Jan Koláček (kolacek@math.muni.cz) Ustav matematiky a statistiky, Přírodovědecká fakulta, Masarykova univerzita, Brno Jan Koláček (PřF MU) M5VM05 Statistické modelování 1/22 Motivace Na minulé přednášce jsme si uvedli zobecněné lineární modely pro alternativní, binomická a poissonovská data. Tato přednáška navazuje na přednášku minulou Nejprve budeme zkoumat problémy příliš velkého nebo příliš malého rozptylu v datech. Dále pak nastíníme modelování multinomických dat a jeho využití v testování nezávislosti v kontingenčních tabulkách. Jan Koláček (PřF MU) M5VM05 Statistické modelování Overdispersion, underdispersion Předpokládáme, že náhodný výběr Yn = (Y\,...,Yn)T z rozdělení exponenciálního typu se řídí GLM modelem, tj. i=l Předpokládejme, že platí i=l = ^ > 0, kde co i > 0 jsou známé apriorní váhy a 0 > 0 je neznámý rušivý parametr. Škálová deviace D = 2 Z*(^;Y)-Z*(#Y) ,2 / [ Y j ( 6j/inax @i) T ( @i,max ) ~l~ T ( ) * z=l 1 = —D* a D* nazveme neškálovou deviací (unsealed deviance). Jan Koláček (PřF MU) M5VM05 Statistické modelování Overdispersion, underdispersion Protože platí 1 1 D = -D* - x2(n -k) ED = -ED* « n - fc, pak D* n — Další často používanou mírou vhodnosti modeluje tzv. zobecněná Pea statistika a proto dalším momentovým odhadem založeným na této statistice je fc2 = n — k Jan Koláček (PřF MU) M5VM05 Statistické modelování Overdispersion, underdispersion Přehled rušivých parametrů Rozdělení