Základy ekonometrie XII. Modely panelových dat Základy ekonometrie (ZAEK) XII. Panelová data Podzim 2015 1 / 32 Obsah tématu 1 Souhrnný model 2 Modely individuálních vlivů Model fixních vlivů Model náhodných vlivů Rozšíření modelů individuálních vlivů Základy ekonometrie (ZAEK) XII. Panelová data Podzim 2015 2 / 32 Úvod a značení Panelová data = časová i průřezová dimenze (státy, firmy, domácnosti → jednotlivci resp. jednotky – individuals). Yit = pozorování závisle proměnné pro i-tého jednotlivce v čase t. Xit = pozorování vysvětlující proměnné pro i-tého jednotlivce v čase t. i = 1, . . . , N t = 1, . . . , T Základy ekonometrie (ZAEK) XII. Panelová data Podzim 2015 3 / 32 Souhrnný model Obsah tématu 1 Souhrnný model 2 Modely individuálních vlivů Model fixních vlivů Model náhodných vlivů Rozšíření modelů individuálních vlivů Základy ekonometrie (ZAEK) XII. Panelová data Podzim 2015 4 / 32 Souhrnný model Úvod Pooled model. Všechna pozorování jako jeden model: Yit = α + βXit + it Při splnění klasických předpokladů OLS je BLUE. V případě heteroskedasticity metody GLS. Nic nového × souhrnný model nevhodný pro většinu aplikací. Základy ekonometrie (ZAEK) XII. Panelová data Podzim 2015 5 / 32 Modely individuálních vlivů Obsah tématu 1 Souhrnný model 2 Modely individuálních vlivů Model fixních vlivů Model náhodných vlivů Rozšíření modelů individuálních vlivů Základy ekonometrie (ZAEK) XII. Panelová data Podzim 2015 6 / 32 Modely individuálních vlivů Úvod Individual effects models: fixed effects model a random effects model. Příklad z ekonomie práce (pro motivaci): Y = příjem; X = roky vzdělání. Data z průzkumu v průběhu několika let. Model: Yit = α + βXit + it. Stejný vztah pro všechny jednotlivce (α = predikovaný příjem nevzdělaného člověka). Základy ekonometrie (ZAEK) XII. Panelová data Podzim 2015 7 / 32 Modely individuálních vlivů Ilustrace problému souhrnného modelu I 10 12 14 16 18 20 7 8 9 10 11 12 13 14 15 Pocet let vzdelani Prijem Regresni primka pro zvyhodnene jednotlivce Regresni primka pro znevyhodnene jednotlivce Obrázek: Vztah mezi příjmem a vzděláním pro dva jednotlivce. Základy ekonometrie (ZAEK) XII. Panelová data Podzim 2015 8 / 32 Modely individuálních vlivů Ilustrace problému souhrnného modelu II 10 12 14 16 18 20 7 8 9 10 11 12 13 14 Pocet let vzdelani Prijem Regresni primka pro zvyhodnene jednotlivce Regresni primka vyrovnani pro souhrnny model Regresni primka pro znevyhodnene jednotlivce Obrázek: Vztah mezi příjmem a vzděláním pro dva jednotlivce. Základy ekonometrie (ZAEK) XII. Panelová data Podzim 2015 9 / 32 Modely individuálních vlivů Další ilustrace problému souhrnného modelu 15 20 25 30 30 40 50 60 70 80 90 Cena Mesicnipoptavka(vtis.) Regresni primka prvni znacky napoju Primka vyrovnani pro souhrnny model Regresni primka druhe znacky napoju Obrázek: Vztah mezi cenou a poptávkou po dvou druzích nápojů. Základy ekonometrie (ZAEK) XII. Panelová data Podzim 2015 10 / 32 Modely individuálních vlivů Model individuálních vlivů Jediná vysvětlující proměnná: Yit = αi + βXit + it. αi = individuální vliv (individual effect). Panelová data = bohatší datová báze a možnost práce s heterogenitou analyzovaných subjektů. Základy ekonometrie (ZAEK) XII. Panelová data Podzim 2015 11 / 32 Modely individuálních vlivů Model fixních vlivů Obsah tématu 1 Souhrnný model 2 Modely individuálních vlivů Model fixních vlivů Model náhodných vlivů Rozšíření modelů individuálních vlivů Základy ekonometrie (ZAEK) XII. Panelová data Podzim 2015 12 / 32 Modely individuálních vlivů Model fixních vlivů Úvod Využití umělých proměnných. Konstrukce N umělých proměnných, D(j) pro j = 1, . . . , N. D (j) it = 1 pro j-tého jednotlivce a 0 jinak (TN rozměrný vektor). Příklad: N = 4 a T = 2 D(3) =               0 0 0 0 1 1 0 0               . Základy ekonometrie (ZAEK) XII. Panelová data Podzim 2015 13 / 32 Modely individuálních vlivů Model fixních vlivů Odhad Regrese: Yit = α1D (1) it + α2D (2) it + . . . + αND (N) Nt + βXit + it. Lineární regresní model (hodně vysvětlujících proměnných) – zobecnění i pro „vícenásobnou“ regresi. Standardní analýza a odhad. Základy ekonometrie (ZAEK) XII. Panelová data Podzim 2015 14 / 32 Modely individuálních vlivů Model fixních vlivů Interpretace Standardní. Regresní přímka pro i-tého jednotlivce: Yit = αi + βXit + it Specifikace individuálního vlivu. Základy ekonometrie (ZAEK) XII. Panelová data Podzim 2015 15 / 32 Modely individuálních vlivů Model fixních vlivů Problém Regrese s obrovskýým množstvím vysvětlujících proměnných. Např. data z průzkumu N = 5000 osob v průběhu T = 5 let. Vícenásobná regrese: odhad N + k koeficientů. V regresním modelu při dané informaci v datech: růst počtu parametrů → snížení přesnosti odhadu. Přesný odhad pro N = 100 a k = 2 × N = 10 a k = 2; nemožné pro k ≥ N. V modelu fixních vlivů: pokud T malé → stejný problém s přesností odhadu. Základy ekonometrie (ZAEK) XII. Panelová data Podzim 2015 16 / 32 Modely individuálních vlivů Model fixních vlivů Možné řešení Práce s diferencemi: ∆Yit = Yit − Yi,t−1. ∆Yit = β∆Xit + ∆ it. Jen jeden resp. k koeficientů k odhadu. Pokud ∆ it splňují klasické předpoklady → OLS je BLUE. Pokud it splňuje klasické předpoklady → ∆ it nesplňuje → cov(∆ it, ∆ i,t−1) = 0. Autokorelaci konzistentní estimátor: Neweyho-Westův estimátor (Whitney K. Newey a Kenneth D. West). Newey, West (1987): A Simple, Positive Semi-definite, Heteroskedasticity and Autocorrelation Consistent Covariance Matrix, Econometrica, vol. 55(3), 703–708. Základy ekonometrie (ZAEK) XII. Panelová data Podzim 2015 17 / 32 Modely individuálních vlivů Model fixních vlivů Další problémy s diferencováním Počáteční podmínky. Hlavně však koeficienty proměnných neměnících se v čase (příklad výnosů ze vzdělání: počet let studia rodičů, umělé proměnné vyjadřující rasu či pohlaví apod.). Pokud Zi v čase neměnná vysvětlující proměnná: Yit = αi + β1Zi + β2Xit + it Diferencování: ∆Yit = ∆β2Xit + ∆ it. Neexistuje způsob odhadu β1. V programech obvyklý estimátor pracující s centrovanými hodnotami pro každou jednotku (stejný problém s odhadem vlivů v čase neměnných proměnných). Základy ekonometrie (ZAEK) XII. Panelová data Podzim 2015 18 / 32 Modely individuálních vlivů Model fixních vlivů Testování hypotéz Regresní model → jakýkoliv test hypotéz. Pokud klasické předpoklady: t-statistiky, F-statistiky pro sdružené hypotézy. H0 : α1 = . . . = αN N − 1 restrikcí! F = (R2 UR − R2 R)/(N − 1) (1 − R2 UR)/(TN − N − k) . Základy ekonometrie (ZAEK) XII. Panelová data Podzim 2015 19 / 32 Modely individuálních vlivů Model náhodných vlivů Obsah tématu 1 Souhrnný model 2 Modely individuálních vlivů Model fixních vlivů Model náhodných vlivů Rozšíření modelů individuálních vlivů Základy ekonometrie (ZAEK) XII. Panelová data Podzim 2015 20 / 32 Modely individuálních vlivů Model náhodných vlivů Úvod Nepoužívá umělé proměnné → předpoklad, že individuální vliv je náhodná veličina (random effects model). Yit = αi + βXit + uit αi = α + υi (náhodná veličina). Alternativně: Yit = α + βXit + it it = υi + uit. Netřeba N umělých proměnných! Základy ekonometrie (ZAEK) XII. Panelová data Podzim 2015 21 / 32 Modely individuálních vlivů Model náhodných vlivů Předpoklady Obvykle: uit splňuje klasické předpoklady → N(0, σ2 u) (idiosyncratický rozptyl). Obvyklý předpoklad: υit ∼ N(0, σ2 υ) (průřezový rozptyl). Vlastnosti it: E( it) = 0, var( it) = σ2 u + σ2 υ, cov( it, jt) = 0 i = j, cov( it, js) = 0 i = j, s = t, cov( it, is) = σ2 υ s = t, Základy ekonometrie (ZAEK) XII. Panelová data Podzim 2015 22 / 32 Modely individuálních vlivů Model náhodných vlivů Analýza Pro téhož jednotlivce jsou náhodné složky korelovány v čase. OLS není BLUE → GLS. Při OLS chybné použití var(β) → nekorektní použití t-testů apod. Dobré ekonometrické programy spočítají korektní směrodatnou odchylku (různé GLS estimátory). Možnost OLS odhadu s panel-corrected standard errors. Při nesplnění klasických předpokladů pro uit (heteroskedasticita a autokorelace) → použití GLS estimátorů kombinujících myšlenky z částí věnovaných daným problémům. Základy ekonometrie (ZAEK) XII. Panelová data Podzim 2015 23 / 32 Modely individuálních vlivů Model náhodných vlivů Testování hypotéz Standardní přístup (při korektních odhadech rozptylu GLS estimátoru). Test použití souhrnného modelu nebo modelu náhodných vlivů. Test H0 : σ2 u = 0 vhodnosti souhrnného modelu (Breuschův-Paganův LM test). Test věrohodnostního poměru; obvykleji test Lagrangeových multiplikátorů (nutný jen odhad souhrnného modelu). Pokud ekonometrický software tyto testy neumí, možno OLS odhad souhrnného modelu a statistika: LM = TN 2(T − 1) N i=1[ T t=1 it]2 N i=1 T t=1 2 it − 1 2 it pro i = 1, . . . , N a t = 1, . . . , T; OLS rezidua ze souhrnného modelu. χ2 1 rozdělení. Základy ekonometrie (ZAEK) XII. Panelová data Podzim 2015 24 / 32 Modely individuálních vlivů Model náhodných vlivů Další problémy Model náhodných vlivů: možnost korelace it a vysvětlujících proměnných → potřeba metody instrumentálních proměnných. Např.: výnosy ze vzdělání a nepozorovaný talent (korelován s příjmem i roky vzdělání). V modelu panelových dat: nepozorovaný talent skrze αi (výhoda panelových dat – analýza heterogenity). Model náhodných vlivů: individuální vliv skrze chybu regrese! (mnohdy automatická korelace s vysvětlující proměnnou) Neplatí pro model fixních vlivů. Základy ekonometrie (ZAEK) XII. Panelová data Podzim 2015 25 / 32 Modely individuálních vlivů Model náhodných vlivů Hausmanův test RE model pokud individuální vliv nekorelován s náhodnou složkou, jinak FE model nebo IV estimátor pro model náhodných vlivů. Hausmanův test vhodnosti RE modelu. H0: individuální vliv nekorelován s žádnou z vysvětlujících proměnných. Myšlenka: pokud H0 pravdivá, jsou RE i FE estimátory konzistentní. Pokud H0 neplatí: RE nekonzistentní → odlišný od FE. Přesný vztah komplikovaný × přibližná podoba pracuje s (βRE − βFE )2; χ2 k−1 rozdělení (k vysvětlujících proměnných nezahrnujících úrovňovou konstantu ani umělé proměnné v rámci FE estimátoru). Základy ekonometrie (ZAEK) XII. Panelová data Podzim 2015 26 / 32 Modely individuálních vlivů Model náhodných vlivů IV odhad v modelu náhodných vlivů Komplikované. Populární Hausmanův-Taylorův estimátor a Arellanův-Bondův estimátor (estimátor metody zobecněných momentů, aplikovaný v dynamických panelech). Možnost jejich použití v praxi (ekonometrické programy a snadnost použití). Intuice: viz např. Koop (2008). Rozdělení proměnných: v čase proměnné a nekorelované X (1) it ; v čase proměnné a korelované X (2) it ; v čase neměnné a nekorelované Z (1) i ; v čase neměnné a korelované Z (2) i Počet těchto proměnných: K1, K2, L1, L2; potřeba K2 + L2 instrumentálních proměnných. Základy ekonometrie (ZAEK) XII. Panelová data Podzim 2015 27 / 32 Modely individuálních vlivů Rozšíření modelů individuálních vlivů Obsah tématu 1 Souhrnný model 2 Modely individuálních vlivů Model fixních vlivů Model náhodných vlivů Rozšíření modelů individuálních vlivů Základy ekonometrie (ZAEK) XII. Panelová data Podzim 2015 28 / 32 Modely individuálních vlivů Rozšíření modelů individuálních vlivů Časový vliv Zachycení odlišností v každém čase (např. hospodářský cyklu): Yit = αi + γt + βXit + uit Model fixních vlivů: zavedení umělých proměnných pro každý časový okamžik. Model náhodných vlivů: γt = γ + ωt Yit = (α + γ) + βXit + it kde it = υi + ωt + uit. Analogické problémy → specifická podoba GLS estimátoru pro korelované náhodné složky. Základy ekonometrie (ZAEK) XII. Panelová data Podzim 2015 29 / 32 Modely individuálních vlivů Rozšíření modelů individuálních vlivů Metody časových řad pro panelová data Metody testů panelových jednotkových kořenů a panelových kointegračních testů. Např. Yit = α + ρYi,t−1 + β1X (1) it + β2X (2) it + β3Z (1) i + β4Z (2) i + it Yi,t−1 velmi pravděpodobně korelováno s náhodnou složkou (obsahuje individuální vliv υi → obsažen v it i i,t−1 – obsaženo ve výrazu pro Yi,t−1). Potřeba IV estimátoru (zmíněné dříve). Základy ekonometrie (ZAEK) XII. Panelová data Podzim 2015 30 / 32 Modely individuálních vlivů Rozšíření modelů individuálních vlivů Model náhodných koeficientů Příklad pro jedinou vysvětlující proměnnou: Yit = αi + βi Xit + it Možnost různých mezních vlivů → další rozměr heterogenity. Např. v marketingu: spotřebitelé reagují různě na reklamní akce (někteří loajální své značce ⇒ nulová reakce na speciální nabídku pro nový produkt; nektěři ochotni více experimentovat s novými produkty ⇒ promo akce na nový produkt vede z jejich strany ke koupi tohoto produktu). Různá βs v aplikacích z marketingu. Příklad výnosů ze vzdělání: různý stupeň výhod z dodatečného školního vzdělávání. Základy ekonometrie (ZAEK) XII. Panelová data Podzim 2015 31 / 32 Modely individuálních vlivů Rozšíření modelů individuálních vlivů Model náhodných koeficientů – pokračování Různé koeficienty pro různé jednotlivce. Proč ne samostatné regrese? Pokud není velké T → N regresí nemusí dát přesné odhady. Vícenásobná regrese: odhad N(k + 1) koeficientů (k je počet vysvětlujících proměnných). Model náhodných koeficientů: různé koeficienty × dodává určitou společnou strukturu pro všechny jednotlivce, kdy βs je ze společného rozdělení. Řada možných rozdělení (např. normální rozdělení); příklad z marketingu pro dva různé typy spotřebitelů → rozdělení umožňující dvě možné hodnoty koeficientu sklonu. Odhad v rámci některých programů; v současnosti velký zájem o tyto modely a jejich technickou analýzu (populární bayesovské metody a tzv. hierarchické modely). Základy ekonometrie (ZAEK) XII. Panelová data Podzim 2015 32 / 32