MA012 Statistika II cvičení 9 Ondřej Pokora (pokora@math.muni.cz) Ustav matematiky a statistiky, Přírodovědecká fakulta, Masarykova univerzita, Brno (podzim 2015) Ondřej Pokora, PřF MU (2015) MA012 Statistika II - cvičení 9 i/e m V letech 1953 - 1983 byly měřeny ztráty vody pri distribuci do domácností. Výsledky měření jsou uloženy v souboru voda.csv. Proměnná x označuje množství vyrobené vody, proměnná Y ztrátu. Ověřte, zda se v datech vyskytuje autokorelace 1. rádu a případně ji odstraňte. reseni-09-1 .R [Vhodný model: polynom 7. stupně, autokorelace 1. řádu se nezamítá, normalita reziduí u nového modelu se nezamítá.] Příklad 2 V proměnné longley v R jsou uloženy makroekonomické údaje USA z let 1947-1962. Modelem lineární regrese zkoumejte závislost zaměstnanosti na HDP a velikosti populace starší 14 let: Employed ~GNP +Population. Ověřte, zda se v datech vyskytuje autokorelace 1. řádu a případně se ji pokuste odstranit. Uvažte i autokorelaci ve tvaru AR(1) v závislosti na roce sběru dat (Yeaoc). reseni-09-2.R MA012 Statistika II - cvičení 9 2/6 m V proměnné LakeHuron v R jsou uloženy roční údaje o hloubce jezera Huron (ve stopách) v letech 1875 - 1972. Nalezněte vhodný regresní model (nevýše 7. stupně) a ověřte, zda se v datech vyskytuje autokorelace 1. řádu. Případně se ji pokuste odstranit. Zkoumejte také normalitu reziduí. reseni-09-3.R Příklad 4 (z přednášky) V souboru výdaje, csv jsou uložena data o 20 náhodně vybraných domácnostech. Sloupce proměnné „ domácnosti" obsahují postupně tyto údaje: výdaje za potraviny a nápoje (Y), počet členů domácnosti (X\), počet dětí (X2), průměrný věk výdělečně činných (X3) a příjem domácnosti (X^). Metodou postupné regrese zkonstruujte model s nejlepší podmíněností regresorů. reseni-09-4.R MA012 Statistika II - cvičení 9 3/6 m Příklad 3 Příklad 5 V souboru cement. csv jsou uloženy údaje, které se týkají chemického složení portlandského cementu: y množství tepla v kaloriích na gram cementu X\ Tricalcium aluminate 3CaO.AI203 v % %2 Tricalciam silicate 3CaO.Si02 v % X3 Tetracalcium alumino ferrite 4CaO.AI203.Fe203 v % X4 Dicalcium silicate 2 Ca O. S i 02 v % Testujte multikolinearitu v lineárním modelu závislosti množství tepla na obsahu 4 hlavních složek cementu. Metodou postupné regrese nalezněte vhodný model. Poté ověřte normalitu reziduí. reseni-09-5.R [MuItikolinearita se nezamítá, vhodný model: y = jSq + j^iXi + JS2X2 + js4x4, normalita reziduí se nezamítá.] MA012 Statistika II - cvičení 9 V proměnné mtcars v R jsou uložena data pro modelování závislosti spotřeby paliva osobních automobilů (proměnná mpg, počet mil/galon) na vlastnostech motoru, které jsou popsány následujícími proměnnými: cyl počet válců disp objem válců (kubické palce) hp výkon (počet koní) drat převodový poměr zadní nápravy wt hmotnost vozidla (kilolibry) qsec zrychlení (počet sekund z O na 1/4 míle) vs uspořádání válců (1 - „ V", O - za sebou) am převodovka (O - automat, 1 - manuál) gear počet převodových stupňů carb počet karburátorů Testujte multikolinearitu v daném modelu. Metodou postupné regrese nalezněte vhodný model. Ověřte také normalitu reziduí. reseni-09-6.R [MuItikolinearita se nezamítá, vhodný model mpg = jSq + jSiwt + j62cyl, normalita reziduí se nezamítá.] Ondřej Pokora, PřF MU (2015) MA012 Statistika II - cvičení 9 6/6