Bayesiánská analýza VII. Lineární regresní model s panelovými daty Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 1 / 51 Obsah tématu 1 Souhrnný model 2 Model individuálních vlivů 3 Model náhodných koeficientů 4 Chibova metoda porovnání modelů 5 Empirická ilustrace 6 Model stochastických hranic Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 2 / 51 Úvod Panelová data — časová i prostorová dimenze. Souhrnný model (pooled model), model individuálních vlivů (individual effects model), model náhodných koeficientů (random coefficients model). Chibova metoda marginální věrohodnosti. Model stochastických mezí (stochastic frontier model). Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 3 / 51 Značení yit a it: t-té pozorování (pro t = 1, . . . , T) pro i-tého jednotlivce (i = 1, . . . , N). Xi = [ιT ˜Xi ]. TN-rozměrné vektory: y =      y1 · · yN      =      1 · · N      Matice TN × K: X =      X1 · · XN      Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 4 / 51 Souhrnný model Obsah tématu 1 Souhrnný model 2 Model individuálních vlivů 3 Model náhodných koeficientů 4 Chibova metoda porovnání modelů 5 Empirická ilustrace 6 Model stochastických hranic Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 5 / 51 Souhrnný model Princip Stejný regresní vztah pro všechny jednotlivce: yi = Xi β + i . Předpoklady: 1 i ∼ N(0T , h−1 IT ). 2 i a j jsou nezávislé pro i = j. 3 Všechny prvky Xi jsou pevná čísla (tj. nenáhodné veličiny) nebo v případě, že jsou náhodnými veličinami, jsou nezávisle na všech prvcích j a mají hustotu pravděpodobnosti p(Xi |λ) kde λ je vektor parametrů, který neobsahuje β ani h. it a is jsou vzájemně nezávislé pro t = s → zobecnění i má kovarianční matici Ω (řešení jako SUR model). Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 6 / 51 Souhrnný model Bayesovská analýza Věrohodnostní funkce: p(y|β, h) = N i=1 h T 2 (2π) T 2 exp − h 2 (yi − Xi β) (yi − Xi β) . Přepsání do podoby: p(y|β, h) = h NT 2 (2π) NT 2 exp − h 2 (y − Xβ) (y − Xβ) . Např. nezávislá apriorní normální-gama hustota β ∼ N(β, V ) a h ∼ G(s−2, ν) → Gibbsův vzorkovač. Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 7 / 51 Model individuálních vlivů Obsah tématu 1 Souhrnný model 2 Model individuálních vlivů 3 Model náhodných koeficientů 4 Chibova metoda porovnání modelů 5 Empirická ilustrace 6 Model stochastických hranic Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 8 / 51 Model individuálních vlivů Princip Příklad z oblasti marketingu: yit je prodej nápoje značky i v čase t. Prodeje závisí např na ceně + existují i nezachytitelné kvantity (věrnost značce): yit = αi + βxit + it αi = individuální vliv (individual effect). Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 9 / 51 Model individuálních vlivů Věrohodnostní funkce Regresní model: yi = αi ιT + ˜Xi ˜β + i Z předpokladů: p(y|α, ˜β, h) = N i=1 h T 2 (2π) T 2 exp − h 2 (yi − αi ιT − ˜Xi ˜β) (yi − αi ιT − ˜Xi ˜β) . α = (α1, . . . , αN) . Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 10 / 51 Model individuálních vlivů Nehierarchická apriorní hustota Model: y = X∗ β∗ + . X∗: matice rozměru TN × (N + k − 1). X∗ =        ιT 0T · · 0T ˜X1 0T ιT · · · ˜X2 · 0T · · · · · · · · 0T · 0T · · · ιT ˜XN        β∗ =        α1 · · αN ˜β        . Klasická ekonometrie = fixed effects model (X∗ s umělými proměnnými). Např. nezávislá normální-gama apriorní hustota: β∗ ∼ N(β∗ , V ), h ∼ G(s−2 , ν). Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 11 / 51 Model individuálních vlivů Hierarchická aprirorní hustota Velká dimenze vektoru parametrů → hierarchická aprirorní hustota. N + k parametrů → problém pokud T relativně malé vzhledem k N. Obvyklý předpoklad pro i = 1, . . . , N: αi ∼ N(µα, Vα) αi a αj vzájemně nezávislé pro i = j. Hierarchická struktura: pokud µα a Vα neznámé parametry. Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 12 / 51 Model individuálních vlivů Konkretizace aprirorních hustot Předpokládáme nezávislost µα a Vα: µα ∼ N(µα , σ2 α), V −1 α ∼ G(V −1 α , να). Zbylé parametry s nehierarchickou apriorní hustotou (nezávislé normální-gama rozdělení): ˜β ∼ N(β, V β), h ∼ G(s−2 , ν). Klasická ekonometrie: tzv. random effects model. Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 13 / 51 Model individuálních vlivů Posteriorní analýza při nehierarchickém prioru LRM s nezávislou normální-gama apriorní hustotou (Gibbs): β∗ |y, h ∼ N(β∗, V ), h|y, β∗ ∼ G(s−2 , ν), V = (V −1 + hX∗ X∗ )−1 , β∗ = V (V −1 β∗ + hX∗ y), ν = TN + ν, s2 = N i=1(yi − αi ιT − ˜Xi ˜β) (yi − αi ιT − ˜Xi ˜β) + νs2 ν . Standardní analýza konvergence, predikční analýza a porovnání modelů. Numerický problém, pokud N příliš velké (V matice rozměru (N + k − 1) × (N + k − 1) + inverze) → teorém o inverzi dělené matici (snížení dimenze invertovaných matic). Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 14 / 51 Model individuálních vlivů Posteriorní analýza při hierarchickém prioru Odvození = násobení věrohodnostní funkce a apriorních hustot a analýzu výsledného výrazu pro ˜β, h, α, µα a Vα → jádrové (podmíněné) hustoty → Gibbsův vzorkovač. Posteriorní rozdělení pro ˜β a h podmíněné veličinou α analogické jako LRM s nezávislou normální-gama apriorní hustotou. p(˜β|y, h, α, µα, Vα) a p(h|y, ˜β, α, µα, Vα) nezávisí na µα a Vα → ekvivalence vzhledem k p(˜β|y, h, α) a p(h|y, ˜β, α). Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 15 / 51 Model individuálních vlivů Posteriorní analýza pro β a h ˜β|y, h, α, µα, Vα ∼ N(β, V β), h|y, ˜β, α, µα, Vα ∼ G(s−2 , ν), V β = V −1 β + h N i=1 ˜Xi ˜Xi −1 , β = V β V −1 β β + h N i=1 ˜Xi [yi − αi ιT ] , ν = TN + ν, s2 = N i=1(yi − αi ιT − ˜Xi ˜β) (yi − αi ιT − ˜Xi ˜β) + νs2 ν . Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 16 / 51 Model individuálních vlivů Posteriorní analýza pro α Podmíněná posteriorní hustota pro αi je nezávislá na αj pro i = j: αi |y, ˜β, h, µα, Vα ∼ N(αi , V i ), V i = Vαh−1 TVα + h−1 , αi = Vα(yi − ˜Xi ˜β) ιT + h−1µα TVα + h−1 . Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 17 / 51 Model individuálních vlivů Posteriorní analýza pro hierarchické parametry Podmíněné hustoty pro hierarchické parametry µα a Vα: µα|y, ˜β, h, α, Vα ∼ N(µα, σ2 α), V −1 α |y, ˜β, h, α, µα, Vα ∼ G(V −1 α , να), σ2 α = Vασ2 α Vα + Nσ2 α µα = Vαµα + σ2 α N i=1 αi Vα + Nσ2 α , να = να + N, V α = N i=1(αi − µα)2 + V ανα να . Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 18 / 51 Model náhodných koeficientů Obsah tématu 1 Souhrnný model 2 Model individuálních vlivů 3 Model náhodných koeficientů 4 Chibova metoda porovnání modelů 5 Empirická ilustrace 6 Model stochastických hranic Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 19 / 51 Model náhodných koeficientů Princip Uvolněný předpoklad o společném sklonu regresní (nad)roviny: yi = Xi βi + i . Problém odhadu pro malé T (vzhledem k N) → hierarchická konstrukce apriorní hustoty. Motivace: příklad z marketingu → navíc odlišný marginální efekt změny ceny na prodeje (věrnost značce skrze mezní vlivy ceny). Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 20 / 51 Model náhodných koeficientů Věrohodnostní funkce Z předpokladů o chybovém členu a tvaru regresního modelu: p(y|β, h) = N i=1 h T 2 (2π) T 2 exp − h 2 (yi − Xi βi ) (yi − Xi βi ) . β = (β1 , . . . , βN ) označuje všechny regresní koeficienty. Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 21 / 51 Model náhodných koeficientů Hierarchická apriorní hustota βi pro i = 1, . . . , N jsou nezávislé výběry z normálního rozdělení: βi ∼ N(µβ, Vβ). Druhá fáze hierarchické apriorní hustoty: µβ ∼ N(µβ , Σβ), V −1 β ∼ W (νβ, V −1 β ). Wishartovo rozdělení: E(V −1 β ) = νβV −1 β + neinformativní varianta pro νβ = 0. Přesnost chyby: h ∼ G(s−2 , ν). Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 22 / 51 Model náhodných koeficientů Posteriorní analýza při nehierarchickém prioru – β Gibbsův vzorkovač (standardní odvození): Vzájemně nezávislé podmíněné posteriorní hustoty parametrů βi , pro i = 1, . . . , N: βi |y, h, µβ, Vβ ∼ N(βi , V i ), V i = (hXi Xi + V −1 β )−1 , βi = V i (hXi yi + V −1 β µβ). Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 23 / 51 Model náhodných koeficientů Posteriorní analýza při nehierarchickém prioru – µβ a Vβ Relevantní hustoty pro µβ a Vβ: µβ|y, β, h, Vβ ∼ N(µβ, Σβ) V −1 β |y, β, h, µβ ∼ W (νβ, [νβV β]−1 ), Σβ = NV −1 β + Σ−1 β −1 , µβ = Σβ V −1 β N i=1 βi + Σ−1 β µβ , νβ = N + νβ, V β = N i=1 (βi − µβ)(βi − µβ) + V β. Výraz N i=1 βi : k-rozměrný vektor obsahující součty prvků βi . Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 24 / 51 Model náhodných koeficientů Posteriorní analýza při nehierarchickém prioru – h Podmíněná posteriorní hustota pro přesnost chyby: h|y, β, µβ, Vβ ∼ G(s−2 , ν), ν = TN + ν, s2 = N i=1(yi − Xi βi ) (yi − Xi βi ) + νs2 ν . Gibbsův vzorkovač: výběry z normálního, gama a Wishartova rozdělení. Predikční analýza a kovergenční testy proveditelné standardním způsobem. Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 25 / 51 Chibova metoda porovnání modelů Obsah tématu 1 Souhrnný model 2 Model individuálních vlivů 3 Model náhodných koeficientů 4 Chibova metoda porovnání modelů 5 Empirická ilustrace 6 Model stochastických hranic Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 26 / 51 Chibova metoda porovnání modelů Úvod Problém Savage-Dickeyho poměru hustot např. pro test Vα = 0 (volba V −1 α = ∞ → volba velkého čísla a s tím problém hrubé aproximace). Problém vysoké dimenze parametrů (metoda Gelfanda a Deye nepřesná). Řešení v podobě Chibovy metody. Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 27 / 51 Chibova metoda porovnání modelů Značení a princip Obecné značení: θ, p(y|θ), p(θ) a p(θ|y). Jednoduché zjištění: p(θ|y) = p(y|θ)p(θ) p(y) . p(y) nezávisí na parametrech θ ⇒ vyhodnocení pravé strany rovnice v jakémkoliv bodě θ∗. Výsledkem bude marginální věrohodnost → pro jakýkoliv bod θ∗: p(y) = p(y|θ∗)p(θ∗) p(θ∗|y) . Základní identita marginální věrohodnosti (basic marginal likelihood identity); p(θ∗) je zkrácený zápis pro p(θ = θ∗). Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 28 / 51 Chibova metoda porovnání modelů Problém Neznáme všechny plné hustoty. Jak vyhodnotit posteriorní hustotu v bodě (tj. spočítat p(θ∗|y))? Zde pro případ více dimenzionálního vektoru parametrů a Gibbsova vzorkovače. Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 29 / 51 Chibova metoda porovnání modelů Problém dimenzionality Modelová struktura s nízko dimenzionálním vektorem θ a vysoce dimenzionálním vektorem z (často latentní data). Gibbsův vzorkovač s rozšířenými daty: sekvenční výběry z p(θ|y, z) a p(z|y, θ), Zde z jako vektor individuálních vlivů (tedy z = α) nebo vektor náhodných koeficientů (z = β). Vyintegrování vysoce dimenzionálního vektoru z a práce s nízko dimenzionálním vektorem θ. Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 30 / 51 Chibova metoda porovnání modelů Obecný postup Zákony pravděpodobnosti implikují: p(θ∗ |y) = p(θ∗ |y, z)p(z|y)dz. Výpočet p(θ∗|y, z(s)) pro každý výběr s = 1, . . . , S a výsledek se zprůměruje. Pokud z(s) pro s = 1, . . . , S jsou výběry z Gibbsova vzorkovače, potom p(θ∗|y) = 1 S S s=1 p(θ∗ |y, z(s) ) konverguje k p(θ∗|y) pro S jdoucí k nekonečnu. Výpočet marginální věrohodnosti pokud jsme schopni spočítat p(y|θ∗), p(θ∗) a p(θ∗|y, z) (plné hustoty). Použití jakékoliv hodnoty θ∗ (nejlépe např. θ∗ jako posteriorní střední hodnota). Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 31 / 51 Chibova metoda porovnání modelů Problém modelu panelových dat Neznáme p(θ∗|y, z). Snadné řešení → předpokládejme rozdělení θ do dvou bloků, θ1 a θ2 a máme Gibbsův vzorkovač se sekvenčními výběry z p(θ1|y, z, θ2), p(θ2|y, z, θ1) a p(z|y, θ1, θ2). Jsme schopni získat θ (s) 1 , θ (s) 2 a z(s) pro s = 1, . . . , S. K využití Chibovy metody musíme spočítat p(θ∗ 1, θ∗ 2|y), kde θ∗ 1 a θ∗ 2 jsou jakékoliv prvky. Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 32 / 51 Chibova metoda porovnání modelů Řešení problému I Pravidla pravděpodobnosti říkají: p(θ∗ 1, θ∗ 2|y) = p(θ∗ 1|y)p(θ∗ 2|y, θ∗ 1), p(θ∗ 1|y) = p(θ∗ 1|y, θ2, z)p(θ2, z|y)dθ2dz, p(θ∗ 2|y, θ∗ 1) = p(θ∗ 2|y, θ∗ 1, z)p(z|y, θ∗ 1)dz. Odhady pro p(θ∗|y) a p(θ∗ 1|y). p(θ∗ 1|y) = 1 S S s=1 p(θ∗ 1|y, z(s) , θ (s) 2 ) konverguje k p(θ∗ 1|y) pro S jdoucí k nekonečnu. Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 33 / 51 Chibova metoda porovnání modelů Řešení problému II Jak spočítat p(θ∗ 2|y, θ∗ 1)? Samostatně s využitím Gibbsova vzorkovače. Druhý Gibbsův vzorkovač pro sekvenční výběry z p(θ2|y, z, θ∗ 1) a p(z|y, θ∗ 1, θ∗ 2). Výstup k získání odhadu p(θ∗ 2|y, θ∗ 1). Vzorky θ (s∗) 2 a z(s∗) pro s∗ = 1, . . . , S∗ → p(θ∗ 2|y, θ∗ 1) = 1 S∗ S∗ s∗=1 p(θ∗ 2|y, z(s∗) , θ (s∗) 1 ) konverguje k p(θ∗ 2|y, θ∗ 1) pro S∗ jdoucí k nekonečnu. Odhady p(θ∗ 1|y) a p(θ∗ 2|y, θ∗ 1) → p(θ∗ 1, θ∗ 2|y). Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 34 / 51 Chibova metoda porovnání modelů Zobecnění Rozdělení vektoru θ do B bloků (tj. θ = (θ1, . . . , θB) ). Platí p(θ∗ 1, θ∗ 2, . . . , θ∗ B|y) = p(θ∗ 1|y)p(θ∗ 2|y, θ∗ 1) . . . p(θ∗ B|y, θ∗ 1, . . . , θ∗ B−1) Původní Gibbsův vzorkovač k výpočtu p(θ∗ 1|y), druhý Gibbsův vzorkovač k výpočtu p(θ∗ 2|y, θ1) a analogicky až B-tý Gibbsův vzorkovač pro výpočet p(θ∗ B|y, θ∗ 1, . . . , θ∗ B−1). Chibova metoda výpočetně náročnější ×všech B Gibbsových vzorkovačů s totožnou strukturu. Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 35 / 51 Chibova metoda porovnání modelů Ukázka pro modely panelových dat Model individuálních vlivů s hierarchickou apriorní hustotou: B = 4 (tj. θ1 = ˜β, θ2 = h, θ3 = µα a θ4 = V −1 α ) a z = α. Model náhodných koeficientů: B = 3 (tj. θ1 = h, θ2 = µβ a θ3 = V −1 β ) a z = β. Známá podoba podmíněných hustot → výpočet p(θ∗|y). Potřeba vyhodnocení p(θ∗) a p(y|θ∗). Apriorní hustoty přímo spočítatelné × vyhodnocení věrohodnostní funkce o něco složitější (máme p(y|θ, z) a tedy ne p(y|θ)). Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 36 / 51 Chibova metoda porovnání modelů Úprava věrohodnostní funkce Analytická integrace pro přechod z p(y|θ, z) na p(θ|y) na základě vlastností vícerozměrného normálního rozdělení. Model individuálních vlivů s hierarchickou apriorní hustotou: p(y|˜β, h, µα, V −1 α ) = N i=1 p(yi |˜β, h, µα, V −1 α ), kde p(yi |˜β, h, µα, V −1 α ) ∼ N(µi , Vi ), µi = µαιT + ˜Xi ˜β Vi = VαιιT + h−1 IT . Model náhodných koeficientů: p(y|h, µβ, V −1 β ) = N i=1 p(yi |, h, µβ, V −1 β ), kde p(yi |h, µβ, V −1 β ) ∼ N(µi , Vi ), µi = Xi µβ Vi = Xi VβXi + h−1 IT . Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 37 / 51 Empirická ilustrace Obsah tématu 1 Souhrnný model 2 Model individuálních vlivů 3 Model náhodných koeficientů 4 Chibova metoda porovnání modelů 5 Empirická ilustrace 6 Model stochastických hranic Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 38 / 51 Empirická ilustrace Úvod Bude časem doplněno. . . Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 39 / 51 Model stochastických hranic Obsah tématu 1 Souhrnný model 2 Model individuálních vlivů 3 Model náhodných koeficientů 4 Chibova metoda porovnání modelů 5 Empirická ilustrace 6 Model stochastických hranic Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 40 / 51 Model stochastických hranic Princip Ekonomická teorie: stochastic frontier model. Model individuálních vlivů s odlišnou hierarchickou apriorní hustotou. Analýza efektivity produkce firem či jiných agentů. Ekonomická teorie → ekonometrický model. Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 41 / 51 Model stochastických hranic Úvod do modelu Ekonomický model produkce: výstup firmy i v čase t, Yit, je vyráběn s využitím vektoru vstupů, X∗ it, kde i = 1, . . . , N a t = 1, . . . , T. Firmy využívají běžnou, nejlepší možnou dostupnou technologii závislou na neznámých parametrech, β: Yit = f (X∗ it; β) . Hranice výrobních možností (production frontier). Odchylka skutečného výstupu od maximálně dosažitelného = měřítko neefektivity: Yit = f (X∗ it; β) τi . 0 < τi ≤ 1: míra efektivity specifická pro jednotlivé firmy. τi = 1: firma i plně efektivní. Předpoklad: každá firma úroveň efektivity neměnnou v čase (lze uvolnit). Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 42 / 51 Model stochastických hranic Úvod do modelu (pokračování) Chybový člen ζit: Yit = f (X∗ it; β) τi ζit. Zahrnutí chybového členu (chyb měření) = stochastická hranice. Pokud hranice výrobních možností, f (), v log-lineární podobě (např. Cobb-Douglasova produkční funkce nebo produkční funkce TRANSLOG) → logaritmování: yit = Xitβ + it − zi , β = (β1, . . . , βk) , yit = ln (Yit), it = ln (ζit), zi = − ln (τi ) a Xit je protějškem X∗ it (vstupy transformovány logaritmy). Veličina zi = nefektivita a díky 0 < τi ≤ 1 nezáporná náhodná veličina. Xit s úrovňovou konstantou a koeficientem β1. Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 43 / 51 Model stochastických hranic Úvod do modelu (dokončení) Podoba modelu individuálních vlivů: výraz β1 − zi odpovídá αi . Ekonomická teorie dává vodítko k výběru hierarchické apriorní hustoty. Pro nelog-lineární produkční funkci (např. CES produkční funkce) potřeba kombinace s technikami M-H algoritmu. Setřízení proměnných a matic: yi = Xi β + i − zi ιT . Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 44 / 51 Model stochastických hranic Věrohodnostní funkce Předpoklad nezávislosti zi a j pro všechna i a j: p (y|β, h, z) = N i=1 h T 2 (2π) T 2 exp − h 2 (yi − Xi β + zi ιT ) (yi − Xi β + zi ιT ) . z = (z1, . . . , zN) . z: vektor neznámých parametrů. „klasická“ ekonometrie: věrohodnostní funkce definována jako p(y|β, h, θ) = p(y|β, h, z)p(z|θ)dz, kde p(z|θ) odpovídá předpokladu o rozdělení neefektivity (závisí na vektoru neznámých parametrů θ). Matematicky ekvivalentní postup bayesovskému přístupu využívajícímu p(z|θ) jako hierarchickou apriorní hustotu ⇒ volba označení „věrohodnostní funkce“ a „hierarchická apriorní hustota“ je čistě sémantickou záležitostí. Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 45 / 51 Model stochastických hranic Hierarchická apriorní hustota Koeficienty hranice výrobních možností a přesnost chyby: β ∼ N β, V , h ∼ G s−2 , ν . Míra neefektivity: hierarchická apriorní hustota. zi > 0 → ne hierarchická hustota odpovídající normální hustotě pravděpodobnosti. Obvykle omezené normálnímu rozdělení nebo rozdělení z rodiny gama rozdělení, zde exponenciální rozdělení (zi a zj a priori nezávislé pro i = j): zi ∼ G (µz, 2) . zi > 0 ⇒ µz > 0 (snadnější práce s µ−1 z než přímo s µz): µ−1 z ∼ G µ−1 z , νz . Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 46 / 51 Model stochastických hranic Apriorní hustota pro hyperparametry Apriorní hyperparametry pro µ−1 z a νz na základě předpokladů o rozdělení efektivity. Např. nechť τ∗ označuje apriorní medián tohoto rozdělení. Pokud očekáváme spíše efektivní firmy v našem vzorku: hodnota τ∗ vysoká (např. 0.95), jinak nižší. Literatura: νz = 2 implikuje relativně neinformativní prior. Z nastavení µz = − ln (τ∗): medián apriorního rozdělení efektivity τ∗. Strategie stanovení priorů prostřednictvím snadno interpretovatelných hyperparametrů v kontextu výchozí ekonomické teorie (např. τ∗) + následná zpětná transformace pro nalezení hyperparametrů použitých v modelu (např. µz a νz). Omezení z ekonomické teorie: např. restrikce, že hranice výrobních možností je monotónně rostoucí ve vstupech nebo nákladová funkce je konkávní nebo možnost technologického úpadku ⇒ omezení parametrů ve tvaru nerovností. Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 47 / 51 Model stochastických hranic Bayesovský výpočet Gibbsův vzorkovač: podmíněné hustoty jako v modelu individuálních vlivů s hierarchickou apriorní hustotou (s výjimkou z a µz). Parametry hranice výrobních možností: β|y, h, z, µz ∼ N β, V , V = V −1 h N i=1 Xi Xi −1 , β = V V −1 β + h N i=1 Xi [yi + zi ιT ] . Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 48 / 51 Model stochastických hranic Bayesovský výpočet (pokračování) Standardní výsledky pro přesnost chyby: h|y, β, z, µz ∼ G s−2 , ν , ν = TN + ν, s2 = N i−1 (yi + zi ιT − Xi β) (yi + zi ιT − Xi β) + νs2 ν . Nezávislé podmíněné posteriorní hustoty pro neefektivity odpovídají normálnímu rozdělení omezenému na kladné hodnoty: p (zi |yi , Xi , β, h, µz) ∝ fN zi |Xi β − yi − (Thµz)−1 , (Th)−1 1 (zi ≥ 0) . yi = T t=1 yit T a Xi je matice rozměru (1 × k) obsahující průměrné hodnoty každé vysvětlující proměnné pro každého jednotlivce i. 1 (zi ≥ 0) je indikační funkce rovna jedničce pokud zi ≥ 0 a nule v ostatních případech. Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 49 / 51 Model stochastických hranic Bayesovský výpočet (dokončení) Podmíněná posteriorní hustota pro µ−1 z : µ−1 z |y, β, z ∼ G (µz, νz) , νz = 2N + νz, µz = N + νz 2 N i=1 zi + µz . Výběry z omezeného normálního rozdělení (neomezené + vyhození zi < 0 nebo specifické algoritmy). Tradiční způsob predikční analýzy a provedení MCMC diagnostik; porovnání modelů např. pomocí Chibovy metody. Metody i pro čistě průřezovou verzi tohoto modelu (tzn. T = 1 × nepřijatelné použití určitých nepravých priorů → nepravé posteriory). Intuitivně: T = 1 ⇒ parametry z, µz, β, h = N + K + 2 parametrů × jen N pozorování. Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 50 / 51 Model stochastických hranic Empirická ilustrace Bude časem doplněno. . . Bayesiánská analýza (BAAN) VII. Panelová data Podzim 2015 51 / 51