1 Statistická inference II - cvičení 16-02-23 Řešení příkladů z domácí úlohy - SI I Příklad č.l (dvojrozměrné normální rozdělení) Nechť náhodnou proměnnou X je největší výška mozkovny u mužů (skuli.pH, v mm) a náhodnou proměnnou Y je morfologická výška tváře u mužů (face.H; v mm); data: one-sample-correlation-skull-mf.txt. Nechť E[X] = p\ je střední hodnota největší výšky mozkovny a Far[X] = o\ je rozptyl největší výšky mozkovny, E[Y] = P2 je střední hodnota morfologické výšky tváře a Var[Y] = a\ je rozptyl morfologické výšky tváře. Předpokládejme, že největší výška mozkovny X má normální rozdělení N(pi,o~2) a morfologická výška tváře Y má normální rozdělení N{p2,(J2). Potom (X, Y)T má dvourozměrné normální rozdělení A^/^S) s parametry fi = (pi,p2)T> coz je vektor středních hodnot a a2, a\ a p, což jsou parametry kovarianční matice S, přičemž síla lineárního vztahu těchto dvou proměnných je daná velikostí a znaménkem p. Potom 6 = (pi, P2, a2-, p)T. (a) Nakreslete hustotu dvourozměrného normálního rozdělení A^Aí, s) pomocí funkce image() a superponujte ji konturovým grafem hustoty toho stejného rozdělení pomocí funkce contourQ. (b) Nakreslete dvourozměrný jádrový odhad hustoty pomocí funkcí kde2d() a imageQ a superponujte ho konturovým grafem hustoty dvourozměrného normálního rozdělení A^/^S) pomocí funkce contourQ. Namísto 6 použijte vektor 6 = (x\, X2, s2, s^^r)T odhadnutý z dat, kde r je Pearsonův korelační koeficient. Příklad č.2 (směs dvou dvourozměrných normálních rozdělení) Nechť (Xi, Yi)T pochází z rozdělení A^/íi, Si), kde X\ je průměrná délka dolní končetiny (lowex.L; v mm) a Y\ je délka trupu (tru.L; v mm) u mužů. Nechť (X2, Y2)T pochází z rozdělení A^/^) S2), kde X2 je průměrná délka dolní končetiny (lowex.L; v mm) a Y2 délka trupu (tru.L; v mm) u žen; data: two-samples-correlations-trunk.txt. Předpokládejme, že průměrná délka dolní končetiny X a délka trupu Y pochází (1) ze směsi pN2(fi1, Ti1)+(l-p)N2{^2^ s2), kde 0 = (pn, P12, o^, af2, pi, p2i, P22, o"|2, p2) a (2) z dvourozměrného rozdělení A^/i, S), kde parametry představují společný vektor středních hodnot a společnou kovarianční matici, t.j. 6 = (pi, P2, o\, o\, p)T. (a) Nakreslete teoretickou hustotu (2) pomocí funkce image() a superponujte ji konturovým grafem teoretické hustoty (2) pomocí funkce contourQ. (b) Nakreslete teoretickou hustotu (1) pomocí funkce imageQ a superponujte ji konturovým grafem teoretické hustoty (1) pomocí funkce contourQ. (c) Nakreslete dvourozměrný jádrový odhad hustoty realizací (1) pomocí funkce imageQ a superponujte ho konturovým grafem teoretické hustoty (1) pomocí funkce contourQ. Poznámka: (1) 0 = (pn, pi2, ofi, <5f2, pí, P21, P22, ofi' ^22' Pz)T aP = n\j(n\ +ri2); parametry jsou odhadnuté z dat. (2) 0 = (pi, P2, cř\, P)T' parametry jsou odhadnuté ze společného výběru. Příklad č.3 (testovací statistika, simulační studie) Na základě simulační studie prověřte, že pokud (a) X ~ N(p, a2), kde p = 0, a2 = 1; 1 (b) X ~ [(1 -p)N(fi,a2) + pN(fi,a2)}, kde p = 0.05, fi = 0 a = 2, potom testovací statistika (n-l)g2 F= a2 má asymptoticky x2 rozdelení s n — 1 stupni volnosti. Použijte rozsahy náhodných výběrů n = 15 a n = 100. Pro každou simulaci X vypočítejte F0{,sm, kde m = 1,2,..., M, přičemž M = 1000. Superponujte histogram vygenerovaných testovacích statistik v relativní škále s teoretickou křivkou hustoty F. Příklad č.4 (kvadratická aproximace profilové funkce věrohodnosti) (a) Nakreslete škálovaný logaritmus profilové funkce věrohodnosti normálního rozdělení pro fi. Na ose x bude fi a na ose y ln£p(/i|x) = Zp(/x|x) — lp(ji\x). Porovnejte ln£p(/i|x) s kvadratickou aproximací vypočítanou pomocí Taylorova rozvoje ln£p(/x|x) = m(Lpffijx)) ~ — |Z(/2)(/x — ji)2. (b) Nechť skóre funkce S(fi) = -j^ ln Lp(/x|x). Vezmeme-li derivaci kvadratické aproximace uvedené výše, dostaneme S(fi) ~ —X(/2)(/x — /2) nebo —X_1/2(/2)1S'(/i) ~ X1/2(/2)(/x — Potom zobrazením pravé strany na ose x a levé strany na ose y dostaneme asymptoticky lineární funkci s jednotkovým sklonem. Asymptoticky také platí Z1/2(X)(fi — X) ~ N(0,1). Je postačující mít rozsah osy x rovný (—2,2), protože funkce je asymptoticky (lokálně) lineární na tomto intervalu. Rozumně škálujte osu y. Zobrazte pro (a) n = 10, (b) n = 100 a (c) n = 1000. Použijte (1) X ~ N(0,1) a (2) X ~ (1 — p)N(0,1) + pN(0, 2), kde p = 0.05. Okomentujte rozdíly mezi (a), (b) a (c), stejně jako rozdíly mezi (1) a (2). Příklad č.5 (maximálně věrohodný odhad fi a a2) Vygenerujte pseudonáhodná čísla z X ~ iV(4,1), n = 1000. (a) Napište logaritmus profilové funkce věrohodnosti pro fi a a2 a prověřte, zda jsou maximálně věrohodné odhady fi & a2 dostatečně blízko k jejich skutečným hodnotám. Nakreslete grafy Z(/x|x) a Z(cr2|x), kde zvýrazníte polohu maxim těchto funkcí. (b) Napište logaritmus funkce věrohodnosti pro 0 = (/i, prověřte, zda je maximálně věrohodný odhad 0 dostatečně blízko k jeho skutečné hodnotě. (c) Nakreslete graf l(0\x) použitím funkce imageQ a superponujte ho s konturovým grafem použitím funkce contourQ. Zvýrazněte polohu maxima. Příklad č.6 (maximálně věrohodné odhady) Za předpokladu normality rozdělení náhodné proměnné X vypočítejte maximálně věrohodné odhady střední hodnoty fi (ozn. ji) a rozptylu a2 (ozn. a2) pomocí logaritmů funkcí věrohodnosti Z(/x|x), resp. l(a2\x). Porovnejte tyto odhady s aritmetický průměrem x a rozptylem s2. Musí platit ji = x a a2 = ^-is2. Realizacemi náhodné proměnné X jsou hodnoty x;t, i = 1, 2,..., n, proměnných: (a) délka pravé klíční kosti (length.R; data: paired-means-clavicle2.txt); (b) morfologická výška tváře (face.H; data: one-sample-correlation-skull-mf.txt); (c) šířka lebky (skuli.B; data: one-sample-mean-skull-mf.txt). 2 Příklad č.7 (maximálně věrohodné odhady multinomické rozdělení) (a) Mějme data more-samples-probabilities-pubis.txt. Nakreslete logaritmus standardizované C(9\x), kde 6 = (pi,P2)T, Evropské populace (n\ = 30, ri2 = 20 a 123 = 10) pomocí funkce contourQ. Dokreslete do obrázku její maximum v bodě 6 = (pi,P2)T• 3