M9750 Robustní a neparametrické statistické metody cvičení 6 - robustní odhady vícerozměrného parametru 1. Zkoumejte chování vícerozměrného výběrového průměru a Jamesova - Steinova odhadu na základě náhodného výběru z p-rozměrného normálního rozdělení o rozsahu n = 30 se střední hodnotou 0 = (1,..., 1)' a varianční maticí S = a2lp. Pro jednoduchost volte p = 3 a a2 = 1. (a) Pro daný náhodný výběr spočítejte oba příslušné odhady a spočtěte jejich empirickou střední čtvercovou chybu. (b) Celý postup opakujte 10 000 krát. Na základě těchto simulací odhadněte střední čtvercovou chybu obou odhadů (průměr empirických středních čtvercových chyb). (c) Výsledky z bodu (b) porovnejte. Výsledek porovnejte i s teoretickou hodnotou střední čtvercové chyby pro výběrový průměr. (d) Pro porovnání zkoumejte i positive part Jamesův - Steinův odhad. 2. Uvažujte data heptathlon z knihovny HSAUR (proměnné hurdles a shot). (a) Data si nejprve vykreslete a tipněte si, která pozorování budou mít největší a která nej menší hloubku. (b) Ke každému pozorování do grafu přidejte jeho hloubku. (c) Nakreslete graf kontur Tukeyho hloubky. (d) Najděte oblast s největší hloubkou a Tukeyho medián. (e) Přidejte jej do grafu, stejně tak i marginální a L\ medián. Výsledky porovnejte. 3. Pracujte se stejnými daty. (a) Proveďte jednorozměrnou exploratorní analýzu proměnných hurdles a shot. Obsahují proměnné nějaké odlehlé hodnoty? (b) Proveďte mnohorozměrnou exploratorní analýzu. Vykreslete si bagplot. Obsahují data nějaká odlehlá pozorování? 4. Pracujte s daty water z knihovny HSAUR. Pomocí bagplotů porovnejte vztah mezi úmrtností a tvrdostí pitné vody v severních a jižních městech Anglie. Funkce, které by se mohly hodit: apply, points, abline, funkce mvrnorm z knihovny MASS, funkce depth, isodepth, med z knihovny depth a funkce bagplot z knihovny aplpack.