M5VM05 Statistické modelování 11. Konkrétní GLM modely - II. Jan Koláček (kolacek@math.muni.cz) Ustav matematiky a statistiky, Přírodovědecká fakulta, Masarykova univerzita, Brno Jan Koláček (PřF MU) M5VM05 Statistické modeloval 1/22 Motivace Na minulé přednášce jsme si uvedli zobecněné lineární modely pro alternativní, binomická a poissonovská data. Tato přednáška navazuje na přednášku minulou. Nejprve budeme zkoumat problémy příliš velkého nebo příliš malého rozptylu v datech. Dále pak nastíníme modelování multinomických dat a jeho využití v testování nezávislosti v kontingenčních tabulkách. Jan Koláček (PřF MU) M5VM05 Statistické modeloval 2/22 Overdispersion, underdispersion Předpokládáme, že náhodný výběr Y„ = (Yi,... ,Yn)T z rozdělení exponenciálního typu se řídí GLM modelem, tj. f(y, Ô) = flňVi, Oi) = exp | £ yi6i~i{^6i) + d{Vi,
°> (V i kde (x>i > 0 jsou známé apriorní váhy a
0 je neznámý rušivý parametr. Škálová deviace D = 2 fQ3m„;Y)-fQ3;Y) 1 " = 7,2Ľ Wi [Yi(6i,max ~ Oi) ~ l{hmax) + 7(6,0] T i = l = Id* a D* nazveme neškálovou deviací (unsealed deviance). an KoláCek (PřF MU) M5VM05 Statistické modelování Overdispersion, underdispersion Protože platí 1 1 d = —d* ~ x2(n — k) ED=-ED*^n-k,
D* = D* n — k' Další často používanou mírou vhodnosti modelu je tzv. zobecněná Pearsonova statistika a proto dalším momentovým odhadem založeným na této statistice je X2 n—k' Jan Koláček (PřF MU) M5VM05 Statistické modelováni Overdispersion, underdispersion Přehled rušivých parametrů Rozdělení