Bayesiánská analýza - cvičení 6 Toto cvičení je založeno na znalosti sedmé a deváté kapitoly z učebnice Koop (2003): Bayesian econometrics, případně na odpovídajících kapitolách podkladového učebního textu Bayesiánská analýza. Co bude náplní cvičení? ^ Odhad a posteriorní analýza modelů s panelovými daty. ^ Odhad a posteriorní analýza probit modelu. Zadání příkladů 1. Nákladová funkce aerolinií K dispozici máme data z panelové studie skupiny amerických aeroline. Pokoušíme se odhadnout jednoduchý model celkových nákladů produkce těchto aerolinií: log(cosíjt) = Pi + j32 log(outputit) + /33 log( f uel_priceit) + j3iload_factorit + eit Výstup (output) je měřen v příjmech z osobomil. Nákladní faktor (load factor) je míra využití kapacit, jedná se o průměrnou míru s jakou jsou sedadla v letadlech naplněna. Komplikovanější modely nákladů by mohly zahrnovat ceny jendotlivých faktorů (materiál, kapitál) případně kvadratický člen v logaritmu výstupu, který by umožňoval proměnlivé úspry z rozsahu. Příklad i data pocházejí z Greeneovy „Econometric Analysis" z roku 2002, kapitola 13, příklad 13.1. Data jsou obsažena přímo ve zdrojovém souboru panel_greene . m. Jedná se o část většího souboru dat poskytnutých panu Greeneovi profesorem Moshe Kimem, původně byla data sestavena asociací Christensen Associates of Madison z Wisconsinu. Výsledky odhadu metodou nejmenších čtverců jsou následující (v závorce jsou odhadnuté směrodatné odchylky): log(costu) = 9.5169(0.22924) + 0.88274(0.013255) \og{outputlt) + 0.45398(0.020304) log(fuel_priceu) - 1.62751(0.34540)Zoaeř_/actorit R2 = 0.9882898, s2 = 0.015528, e'e = 1.335442193 V souboru panel_greene .m je tento model odhadován bayesovsky v rámci pooled modelu, individual ef-fects modelu (s nehierarchickou a hierarchickou apriorní hustotou) a v rámci modelu náhodných koeficientů. Prohlédněte si vytvořený algoritmus, porovnejte ho s postupem z Koop (2003) a analyzujte a diskutujte dosažené výsledky. Pro úsporu času není řešena problematika porovnávání modelů (Chibovou metodou) a konvergenční diagnostiky, pokuste se tak v rámci některého z vybraných modelů implementovat Chibovu metodu výpočtu marginální věrohodnosti a ověřit konvergenci s využitím konvergenčních diagnostik. Apriorní hustoty jsou spíše neinformativního charakteru a snaží se být pro všechny modely stejné pro účely případné komparace výsledků. 1 2. Nákladová funkce nemocnie Soubor data_hospital .mat obsahuje panelová data relevantní pro odhad nákladové funkce nemocni. Obsahuje data TV = 382 nemocnie za T = 5 let. Všechny proměnné (kromě umělých proměnných) jsou logaritmovány. Proměnné jsou: • costs = logaritmus provozních nákladů nemocnice (v tisících dolarech); • beds = logaritmus počtu lůžek nemocnice; • inpatient = logaritmus počtu hospitalizovaných návštěvníků; • outpatient = logaritmus počtu ambulantně ošetřených návštěvníků; • casejmix = logaritmus indexu vážností případů (vyšší hodnoty odpovídají náročnějším případům); • K = logaritmus kapitálové zásoby (v tisících dolarech); • nonprofit = 1 pro neziskové nemocnice (= 0 jinak); • forprofit = 1 pro „ziskové" nemocnice (= 0 jinak). (a) V souboru hospital. m jsou odhadnuty souhrny regresní model a model individuálních vlivů (s nehie-rarchickou a hierarchickou apriorní hustotou). (b) Interpretujte dosažené výsledky. (c) Pokuste se v rámci některého z vybraných modelů implementovat Chibovu metodu výpočtu marginální věrohodnosti a ověřte konvergenci s využitím konvergenčních diagnostik. 3. Hodnocení efektů nové metody výuky ekonomie V tomto příkladu je analyzována efektivnost nové metody výuky ekonomie. Závisle proměnná je v tomto případě GRADE, což je indikátor toho, zda-li se studentovy známky při závěrečných zkouškách zlepšily v období po zavedení PSI, nové metody výuky ekonomie. Vysvětlujícími proměnnými jsou GPA (grade point average), tedy jakési průměrná bodová známka, TUCE, což je skóre z předběžných zkoušek, které ověřují vstupní znalosti problematiky, a binární proměnná PSI je indikátorem toho, zda-li se student účastnil (PSI = 1) nebo neúčastnil (PSI = 0) nové metody výuky. Jedním z úkolů je zjistit, jaké proměnné ovlivňují zlepšení studenta při závěrečných zkouškách, respektive zvyšují (či snad snižují) pravděpodobnost, že dojde k jeho zlepšení. Hlavním úkolem je však zhodnotit efektivitu nové výukové metody, jestli tedy studenti zapojeni do tohoto programu zvýší svou pravděpodobnost, že se zlepší. Na základě výsledků této analýzy je pak vhodné zhodnotit i mezní efekt účasti v programu pro studenty s různými kvalitami vyjádřenými v podobě GPA. Data (převzatá z Greene (2002)) jsou obsažena v souboru probit_teaching.m. V rámci tohoto souboru je provedena i celá analýza problému. Dat není mnoho a apriorní informaci použijeme spíše neinformativní. Je však dobré vyzkoušet si i různé volby informatívnej ších apriorních hustot a provést citlivostní analýzu (v důsledku malého počtu dat je síla datové informace vzhledem k informaci apriorní relativně malá). V souboru nejsou doplněny konvergenční diagnostiky a porovnávání modelů, což však není problém v případě potřeby doplnit. Zamyslete se tedy nad dosaženými výsledky a náležitě je prodiskutujte. 2