Bayesiánská analýza – úkol 03 Obecné poznámky: Pokud pracujeme s nějakým vlastním algoritmem, není od věci jeho funkčnost vyzkoušet na umělých datech generovaných z procesu, jehož parametry si nastavíme (v tomto případě totiž víme, co nám má vyjít). 1. Aneta Derková, Magdalena Horká, Natálie Tomanová, Luděk Matějíček · Nerozumím tvrzení, že „výpočet parametrů, na nichž je závislý rozptyl jsme vypočítali z pozorovaných dat“. Apriorní nastavení středních hodnot rovnice rozptylu na nulové hodnoty je možné (pokud se navíc jedná spíše o neinformativní apriorní hustotu vzhledem k apriorním směrodatným odchylkám), i když z hlediska věcného to implikuje, že rozptyl je v průměru nulový (apriori). Střední hodnota parametru alfa_0 tak mohla být nastavena na nenulovou hodnotu odpovídající předpokládané variabilitě výnosů. · Očekával bych v textu i prezentaci výsledků pro odhad AR(1)-GARCH(1,1) modelu (pro srovnání). · Pro ověření výsledků mohla být dodána i zdrojová data. · Nešlo by na základě výstupů z R doprogramovat i funkce na výpočet marginálních věrohodností obou modelů (třeba jen zjednodušenou metodou Gelfanda a Deye)? Šlo by případně z obrázků (výstupů) srovnání odhadnutých výnosů a výnosů implikovaných modelem nějak oba typy modelů porovnat kvantitativně? Asi by v tomto případě bylo vhodné zaměřit se na srovnání ne přímo výnosů ale jejich variability (s využitím predikčních p-hodnot). Celkové hodnocení: S ohledem na některé nedostatky (a s přihlédnutím k obtížnosti zadaného úkolu) bych celkově splnění úkolu hodnotil na 80 %. 2. Barbora Drinková, Veronika Navrátilová · V rámci prezentace výsledků je tam několik nedotažených (nevyplněných tabulek), i když zbylé prezentované výsledky vypadají solidně. · Z pohledu na skripty bylo generováno 1000 nikoliv 100 vzorků. · Ve funkci pro výpočet logaritmu theta_g mohly být kromě podmínek nezápornosti zavedeny i podmínky na stabilitu GARCH procesu (což by i pro nastavení algoritmu mohlo být lepší, než je zavádět při generování kandidáta z kandidátské hustoty (ztrácíme tím informaci o neakceptovaných kandidátech, čímž se nadhodnocuje akceptační pravděpodobnost). · V rámci úkolu mohl být zpracován i model s AR(1) procesem pro rovnici výnosů a vypočítány marginální věrohodnosti modelu. Celkové hodnocení: S přihlédnutím na obtížnost zadaného úkolu a některé nedodělky (zejména v prezentaci výsledků) bych celkově splnění úkolu hodnotil na 70 %. 3. Michaela Hanešová, Lucia Kubincová · Součástí odevzdaného úkolu mohly být i „support“ funkce. · Ve funkci pro výpočet logaritmu theta_g mohly být kromě podmínek nezápornosti zavedeny i podmínky na stabilitu GARCH procesu (což by i pro nastavení algoritmu mohlo být lepší, než je zavádět při generování kandidáta z kandidátské hustoty (ztrácíme tím informaci o neakceptovaných kandidátech, čímž se nadhodnocuje akceptační pravděpodobnost). · Postup při výpočtu marginální věrohodnosti a predikčních p-hodnot je samozřejmě obdobný tomu, jak jsme dělali na cvičení (stačí si pohrát s věrohodnostní funkcí, která bude odpovídat GARCH modelu). · V rámci úkolu mohl být zpracován i model s AR(1) procesem pro rovnici výnosů. Celkové hodnocení: S přihlédnutím na obtížnost zadaného úkolu a některé nedodělky bych celkově splnění úkolu hodnotil na 80 %. 4. Michaela Keckésová, Magdaléna Švorcová, Lucie Červená, Denis Mihalka, Daniel Musil · Součástí odevzdaného řešení mohly být i data a skripty. · V rámci Modelu II pro AR(1) proces není v rovnici výnosů zpožděná hodnota náhodných složek (u_{t-1}), což by odpovídalo ARMA(1,1) procesu. Zavedení tohoto členu totiž výrazněji změní podobu věrohodnostní funkce, což právě mohlo být problém pro výpočet marginální věrohodnosti. · Co výpočet predikčních p-hodnot? · V rámci úkolu mohl být zpracován i model s AR(1) procesem pro rovnici výnosů. Celkové hodnocení: S ohledem na obtížnost zadaného úkolu a chybějící zdrojové kódy bych celkově splnění úkolu hodnotil na 85 %. 5. Klára Andrýsková, Bibiána Birošová, Tatiana Keseliová, Luisa Krampolová, Tomáš Pospíšil · Oceňuji počítání podmíněné hustoty pro vektor gama v rámci funkce (nikoliv skriptu). V odevzdaném archivu mohly být i „support“ funkce. · Ve funkci pro výpočet logaritmu theta_g mohly být kromě podmínek nezápornosti zavedeny i podmínky na stabilitu GARCH procesu (což by i pro nastavení algoritmu mohlo být lepší, než je zavádět při generování kandidáta z kandidátské hustoty (ztrácíme tím informaci o neakceptovaných kandidátech, čímž se nadhodnocuje akceptační pravděpodobnost). · S ohledem na snadnost implementace AR(1) procesu v rámci AR(1)-GARCH(1,1) modelu, mohl být i tento model odhadnut a spolu s výsledky odhadu prezentován. · Marginální věrohodnost (zjednodušenou metodou Gelfanda a Deye) není zas tak obtížné vypočítat, protože věrohodnostní funkci modelu známe (viz podkladová literatura). Podobně mohly být spočítány i predikční p-hodnoty. V podstatě stejným způsobem, jako jsme dělali na cvičeních. Celkové hodnocení: S ohledem na obtížnost zadaného úkolu a některé nedodělky bych celkově splnění úkolu hodnotil na 87 % (s ohledem na pěknou prezentaci výsledků). 6. Libor Knapec, Yaroslav Korobka, Dáša Miháliková, Tereza Vlčková · Oceňuji počítání podmíněné hustoty pro vektor gama v rámci funkce (nikoliv skriptu). V odevzdaném archivu mohly být i „support“ funkce. · Apriorní hodnoty směrodatných odchylek některých parametrů (parametr omega) byly nastaveny až moc neinformativně (sm. odchylka 0.31 odpovídá výnosu 31 %!). · Ve funkci pro výpočet logaritmu theta_g mohly být kromě podmínek nezápornosti zavedeny i podmínky na stabilitu GARCH procesu (což by i pro nastavení algoritmu mohlo být lepší, než je zavádět při generování kandidáta z kandidátské hustoty (ztrácíme tím informaci o neakceptovaných kandidátech, čímž se nadhodnocuje akceptační pravděpodobnost). · S ohledem na fungující základní model mohl být odhadnut a prezentován i model s AR(1) procesem pro rovnici výnosů. · Mohl být učiněn alespoň pokus o výpočet marginální věrohodnosti a predikčních p-hodnot. Celkové hodnocení: S ohledem na obtížnost zadaného úkolu, pěknou prezentaci (části výsledků) a nedokončenou část úkolu bych celkově splnění úkolu hodnotil na 87 %. 7. Alžbeta Breznická, Veronika Števaňáková, Zuzana Knapeková, Jakub Olšán · Součástí odevzdaného úkolu mohly být i „support“ funkce (např. funkce „my_gamma.m“). · Oceňuji snahu použít optimalizační funkci (fminunc) v Matlabu pro nastavení RW-MH algoritmu. · Ve funkci pro výpočet logaritmu theta_g mohly být kromě podmínek nezápornosti zavedeny i podmínky na stabilitu GARCH procesu (což by i pro nastavení algoritmu mohlo být lepší, než je zavádět při generování kandidáta z kandidátské hustoty (ztrácíme tím informaci o neakceptovaných kandidátech, čímž se nadhodnocuje akceptační pravděpodobnost). · V rámci úkolu mohl být zpracován i model s AR(1) procesem pro rovnici výnosů. Postup při výpočtu marginální věrohodnosti a predikčních p-hodnot je obdobný tomu, jak jsme dělali na cvičení (stačí využít věrohodnostní funkcí odpovídající odhadovanému GARCH modelu). Celkové hodnocení: S přihlédnutím na obtížnost zadaného úkolu a neřešení části úkolu celkově splnění úkolu hodnotil na 80 %. 8. Yelyzaveta Saliy · Součástí odevzdaného úkolu mohly být všechny použité funkce (nejen funkce „my_gamma.m“). · Ve funkci pro výpočet logaritmu theta_g mohly být kromě podmínek nezápornosti zavedeny i podmínky na stabilitu GARCH procesu (což by i pro nastavení algoritmu mohlo být lepší, než je zavádět při generování kandidáta z kandidátské hustoty (ztrácíme tím informaci o neakceptovaných kandidátech, čímž se nadhodnocuje akceptační pravděpodobnost). · Prezentované tabulky jsou místy zmatené (např. průměrná míra akceptace 1 pro parametr „Hodnota“). Pokud parametry theta_g1, theta_g2 a theta_g3 mají stejnou aposteriorní střední hodnotu jako apriorní (a nulové směrodatné odchylky) tak to odpovídá ne moce dobré identifikaci těchto parametrů (resp. nevhodným nastavením M-H algoritmu. · V rámci úkolu mohl být zpracován i model s AR(1) procesem pro rovnici výnosů. Postup při výpočtu marginální věrohodnosti a predikčních p-hodnot je obdobný tomu, jak jsme dělali na cvičení (stačí využít věrohodnostní funkcí odpovídající odhadovanému GARCH modelu). Použití klasického odhadu GARCH modelu není to, co bylo v tomto úkolu požadováno. Celkové hodnocení: S ohledem na větší nepřesnosti při zpracování úkolu (a při zohlednění náročnosti tohoto úkolu) bych úkol hodnotil jako splněný na 60 %. 9. Nikola Gregušková, Michal Hlína, Jakub Moučka, Luce Vetráková · Oceňuji originalitu skriptů a funkcí (což se projevilo i v rychlosti průběhu skriptu). Bohužel součástí odevzdaných skriptů nebyl datový soubor, takže v tuto chvíli nemohu replikovat výsledky a dodat případné bližší komentáře k problematickým bodům řešení. · Z odhadů je patrný problém při odhadech parametrů alpha a beta, u kterých by byla velká náhoda, pokud posteriorní charakteristiky vycházejí zcela stejně (možná je to ale jen chyba přepisu výsledků do textového dokumentu). · Ve funkci pro výpočet logaritmu theta_g mohly být kromě podmínek nezápornosti zavedeny i podmínky na stabilitu GARCH procesu (což by i pro nastavení algoritmu mohlo být lepší, než je zavádět při generování kandidáta z kandidátské hustoty (ztrácíme tím informaci o neakceptovaných kandidátech, čímž se nadhodnocuje akceptační pravděpodobnost). · Pokud se dívám na funkci lik_GARCH, tak se nejedná o věrohodnostní funkci, ale (jádro) posteriorní hustoty, což k výpočtu marginální věrohodnosti není to pravé. Věrohodnostní funkce je uvedena v Rachevovi na straně 207, vztah (11.13), což znamená, že tam nemají co dělat apriorní (jádra) hustot). Uznávám, že pro korektní využití metody Gelfanda a Deye je potřeba definovat i tu integrační konstantu, což není v Rachevovi přímo uvedeno a je potřeba podívat se i do další literatury (nebo na internet). Nicméně, ta úrovňová konstanta by myslím neměla být nic jiného než sum(log(1/sqrt(2*pi*sigma_t^2) + log(eta_t)). Pokud se toto nezohlední, budou vycházet tak obrovská čísla. · Rachev nepoužívá přesnost chyby, protože u něj je přesnost chyby 1/(sigma_t)^2. Epsilon v GARCH modelu má standardizované normální rozdělení, které je odmocninou z podmíněného rozptylu transformováno. · V rámci prezentace výsledků v tabulkách není nutné plně kopírovat popisky tabulek z Matlabu, a klidně je možné sjednotit značení na české a psát např. apriorní střední hodnota apod. Ne každému čtenáři (zvláště tomu neznalému Bayesiánské ekonometrie) může být jasný význam např. „Geweke CD“, takže i to by stálo za to v poznámce k tabulce popsat. Také by bylo dobré uvádět i u původních strukturálních parametrů jejich aposteriorní rozdělení a samozřejmě graficky prezentovat použitá data. · Výpočet Bayesova faktoru nemusí být korektní při použití hodně neinformativních apriorních hustot. Celkové hodnocení: S ohledem na obtížnost zpracování a víceméně nejkompletnější zpracování bych splnění úkolu hodnotil na 97 %.