Základy ekonometrie I. Úvod do ekonometrie a práce s daty Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 1/66 Obsah tématu Q Úvod do ekonometrie • Ekonomický model • Ekonometrický model Q Práce s daty • Typy ekonomických dat • Grafické metody práce s daty • Popisné statistiky a korelace Q Ekonometrický software a studijní literatura 4 □ Mg M 1 M 1 ^ > -O^O Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 2 / 66 Obsah tématu Q Úvod do ekonometrie • Ekonomický model • Ekonometrický model Q Práce s daty • Typy ekonomických dat • Grafické metody práce s daty • Popisné statistiky a korelace Q Ekonometrický software a studijní literatura 4 □ Mg M 1 M 1 ^ > -O^O Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 3 / 66 Co je ekonometrie? • Není jednotná definice. • „Ekonometrie je vše, co dělají ekonometři. • „Ekonometrie je věda zabývající se aplikací statistických metod pro analýzu ekonomických fenoménů." • Propojení a rozšíření poznatků ekonomické teorie, matematické ekonomie, ekonomické statistiky a matematické statistiky. • Počátek 30. let 20. století: založení Ekonometrické společnosti (Econometric Society) a časopisu Econometrica. 4 □ Mg M 1 M 1 ^ > -O^O Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 4 / 66 „Nobelova cena" za ekonomii • 1969 - první „Nobelova cena" za ekonomii (The Sveriges Riksbank Prize in Economic Sciences in Memory of Alfred Nobel) pro Ragnara Frische a Jana Tinbergena za „rozvoj a aplikaci dynamických modelů pro analýzu ekonomických procesů." Ragnar Frisch (1895-1973) Jan Tinbergen (1903-1994) Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 5 / 66 Kdo je ekonometr? • Ekonom - využívá ekonomickou teorii pro podporu svých empirických analýz. • Matematik - formuluje ekonomickou teorii způsobem vhodným pro statistické testování. • Účetní - hledá a sbírá ekonomická data a propojuje teoretické proměnné s pozorovatelnými. • Aplikovaný statistik - odhaduje ekonomické vztahy a predikuje možné výstupy. • Teoretický statistik - rozvíjí statistické techniky s ohledem na specifika empirických problémů v ekonomii. 4 □ Mg M 1 M 1 ^ > -O^O Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 6 / 66 Ekonometrie Ekonometrie Teoretická Aplikovaná Klasická Bayesiánská Klasická Bayesiánská • Klasická - převažující přístup (Základy ekonometrie, Časové řady, Ekonometrie). • Bayesiánská - současný rozvoj díky pokrokům ve výpočetní technice (Bayesiánská analýza). 4 □ Mg M 1 M 1 ^ > -O^O Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 7 / 66 K čemu je ekonometrie dobrá? • Jak prakticky, efektivně, systematicky a vědecky používat data k zodpovězení různých ekonomických otázek a problémů. • Ovlivní devizové intervence centrální bankou ekonomiku? A jak hodně? • Mají dlouhodobě nezaměstnaní větší problém nalézt zaměstnání než krátkodobě nezaměstnaní? • ovlivní zvýšení minimální mzdy zaměstnanost a nezaměstnanost? • Předchází růst akciových trhů růstu ekonomiky nebo je tomu naopak? • Jsou akciové trhy v různých částech světa propojeny? Jak silně? A ovlivnila toto propojení nějak finanční krize z roku 2008? • Jaký vliv na trestnou činnost bude mít dodatečná finanční injekce na vyslání více uniformovaných policistů do ulic zkoumaného města? • Jaký efekt má investice do určitého typu reklamní kampaně na prodejnost konkrétního výrobku? • Co a jak ovlivňuje rozhodnutí zákazníka o nákupu některého z řady vzájemně si konkurujících výrobků? • Jsou spolu trhy vlakové a autobusové přepravy na konkrétní trase propojeny? Jak silně reagují zákazníci na změny cen jednoho z druhů přepravy? Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 8 / 66 Jaké další otázky může ekonometrie zodpovědět? • Nástroje velmi univerzální (viz např. témata projektů ze Základů ekonometrie). • Jaké faktory ovlivňují výši spropitného, které dávají hosté v restauracích? • Jaké dopady má zavedení či zvýšení ekologické daně na registraci ojetých automobilů? • Jaké faktory ovlivňují počet sexuální partnerů studentů? • Co může ovlivňovat výkon běžce na 10 km? • Co rozhoduje o spotřebě alkoholu mezi studenty? • Jaké charakteristiky filmů ovlivňují pravděpodobnost získání ocenění Český lev? 4 □ Mg M 1 M 1 ^ > -O^O Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 9 / 66 Jaké odpovědi nám může ekonometrie pomoci najít? • Zahálení u televize a počítače má na studijní průměr negativní dopady. S každou hodinou, kterou student průměrně denně stráví těmito aktivitami, se mu průměr zhorší o 0,036. • Při rozhodování, který cvičící se zdá být nejlepším nám model vyhodnotil Ing. Michala Kvasničku, Ph.D. • Pokud počet narozených dětí stoupne o jedno, ovlivní to celkovou populaci asi o 3,63881 jedince. • Další člověk, který se přistěhuje, způsobí pokles populace o -1,30902 jedince. • Pokud se respondent pokoušel osvojit si elfské písmo či trpasličí runy, pravděpodobnost návštěvy promítání filmu Hobit se snižuje o celých 42 %. • V práci jsem zjistil, že jediným významným faktorem ovlivňujícím dobu běhu je uběhnutá vzdálenost. • Bohužel jsem z mého výzkumu nic nezjistila, ale byla to pro mě zajímavá zkušenost. < n ► Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 10 / 66 Ekonometrie a testovaní hypotéz Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 Úvod do ekonometrie Ekonomický model Obsah tématu Q Úvod do ekonometrie • Ekonomický model • Ekonometrický model Q Práce s daty • Typy ekonomických dat • Grafické metody práce s daty • Popisné statistiky a korelace Q Ekonometrický software a studijní literatura 4 □ Mg M 1 M 1 ^ > -O^O Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 12 / 66 Úvod do ekonometrie Ekonomický model Příklady ekonomických modelů • Empirická analýza - využití dat k testování teorie nebo k odhadu vztahů mezi veličinami. • Pro testování ekonomických teorií - konstrukce ekonomického modelu. • Příklady: • Ekonomický model kriminality. • Pracovní školení a produktivita pracovníků. • Formální ekonomický model = základ ekonometrické analýzy. 4 □ Mg M 1 M 1 ^ > -O^O Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 13 / 66 Úvod do ekonometrie Ekonomický model Ekonomický model kriminality - úvod Gary Becker - nositel Nobelovy ceny, model kriminálního chování (1968). Gary S. Becker (*1930) • Maximalizace užitku - výnosy a náklady kriminální činnosti. • Množství času věnovaného trestné činnosti jako funkce různých faktorů. < □ ► 4 & * < 5 ► « 5 ► Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 37 Úvod do ekonometrie Ekonomický model Ekonomický model a lity y Xl X2 *3 X4 *5 X6 Xl y = f(xi,X2,X3,X4,X5,X6,X7) hodiny strávené kriminálními aktivitami, „hodinová mzda" z kriminální aktivity, hodinová mzda v legálním zaměstnání, další příjem (mimo zaměstnání a trestnou činnost), pravděpodobnost dopadení, pravděpodobnost odsouzení v případě dopadení, očekávaný trest v případě odsouzení, věk. 4 □ Mg M 1 M 1 ^ > -O^O Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 15 / 66 37 Úvod do ekonometrie Ekonomický model Ekonomický model kriminality - specifikace • Reprezentativní faktory ovlivňující rozhodování o páchání trestné činnosti. • Funkce f(-) obvykle nespecifikována, závisí na podobě užitkové funkce (málokdy známa). • Ekonometrická analýza - odhad vlivu jednotlivých faktorů na páchání trestné činnosti jednotlivců. 4 □ Mg M 1 M 1 ^ > -O^O Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 16 / 66 Pracovní školení a produktivita pracovníků - úvod • Vládou financovaný program školení pracovníků (práce s počítačem, 20 týdnů, účast na jednotlivých částech dobrovolná) - analýza efektivity. • Zkoumání vlivu školení na produktivitu pracovníka. • Menší potřeba ekonomické teorie - dostačující ekonomická intuice, že vzdělání, pracovní zkušenosti a školení ovlivňují produktivitu. • Ekonomický předpoklad - pracovníci placeni v závislosti na své produktivitě. 4 □ Mg M 1 M 1 ^ > -O^O Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 17 / 66 Pracovní školení a produktivita pracovníků - model wage = f(educ, exper, training) wage = hodinová mzda, educ = roky strávené ve škole, exper = roky pracovních zkušeností, training = počet týdnů zapojení do programu školení pracovníků.. • Možné další faktory ovlivňující mzdu x rovnice dostatečně pokrývá řešený problém. 4 □ Mg M 1 M 1 ^ > -O^O Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 18 / 66 Úvod do ekonometrie Ekonometrický model Obsah tématu Q Úvod do ekonometrie • Ekonomický model • Ekonometrický model Q Práce s daty • Typy ekonomických dat • Grafické metody práce s daty • Popisné statistiky a korelace Q Ekonometrický software a studijní literatura 4 □ Mg M 1 M 1 ^ > -O^O Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 19 / 66 Úvod do ekonometrie Ekonometrický model Ekonomický a ekonometrický model • Specifikace ekonomického modelu =>• ekonometrický model. • Specifikace funkční závislosti mezi proměnnými, f(-). • Vypořádání se s přímo nepozorovanými proměnnými, např.: • „mzda" jednotlivců z trestné činnosti - proměnná dobře definována, ale obtížně pozorovatelná; • pravděpodobnost zatčení - pro jednotlivce obtížně zjistitelná, možno využít globální statistiku zatčení a odvodit odpovídající „proxy" proměnnou. 4 □ Mg M 1 M 1 ^ > -O^O Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 20 / 66 Úvod do ekonometrie Ekonometrický model Ekonometrický model kriminality crime = a + fi\wagem + foothinc + fofreqarr + ^freqconv + l35avgsen + fcage + e crime = nějaké měřítko četnosti kriminální aktivity, wagem = mzda z legálních aktivit, othinc = příjem z jiných zdrojů (akcie apod.), freqarr = četnost zatčení před vykonáním trestného činu aproximuje pravděpodobnost zatčení, freqconv = četnost odsouzení, avgsen = průměrná délka trestu po odsouzení, age = věk. < □ ► 4 & * < 5 ► « 5 ► Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 Úvod do ekonometrie Ekonometrický model Ekonometrický model a lity - vysvětlení • Volba proměnných dle ekonomické teorie. • náhodná složka: e = nepozorované faktory, „mzda" z trestné činnosti, rodinné zázemí, chyby v měření kriminální aktivity, pravděpodobnosti zatčení apod. • parametry: a, f}\,..., (3q = měřítko směru a síly vztahu mezi vysvětlovanou proměnnou, crime, a vysvětlujícími proměnnými, faktory determinujícími kriminalitu v modelu. Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 22 / 66 ■0 0,0 37 Úvod do ekonometrie Ekonometrický model Ekonometrický model pracovního školenia produktivita pracovníků wage = a + ftieduc + fcexper + fotraining + e wage = hodinová mzda, educ = roky strávené ve škole, exper = roky pracovních zkušeností, training = počet týdnů zapojení do programu školení pracovníků. • e = faktory kvality vzdělání, rodinného zázemí a další, které ovlivňují mzdu. • /?3 = parametr vyjadřující vliv školení na mzdu. 4 □ Mg M 1 M 1 ^ > -O^O Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 23 / 66 Úvod do ekonometrie Ekonometrický model Další otázky • Ekonometrická analýza i bez detailů konstrukce ekonomického modelu (odvození mnohdy náročné). • Přímé vyjádření ekonomického modelu skrze ekonometrický model (na základě ekonomických úvah o možných proměnných). • Obvyklý postup x omezení ekonomické analýzy. • Stanovení hypotéz prostřednictvím neznámých parametrů (např. mzda z legálního zaměstnání wagem nemá vliv na kriminální chování 44> I3i = 0). Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 24 / 66 Úvod do ekonometrie Ekonometrický model Schéma postupu ekonometrického modelování la. Ekonomická teorie (ekonomický model) ►lb. Formulace odhadnutelného teoretického modelu (ekonometrický model) —> 2. Sběr dat —3. Odhad modelu 4. Je model statisticky odpovídající? Ne Ano ' Přeformulace 5. Interpretace modelu modelu 6. Využití k další analýze Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 25 / 66 Úvod do ekonometrie Ekonometrický model Postup ekonometrického modelování O Formulace ekonometrického modelu - na základě ekonomické teorie či ekonomické intuice o vztahu mezi zkoumanými proměnnými. O Sběr relevatních dat - z dostupných zdrojů nebo vlastní tvorba (např. dotazníky). O Volba vhodné odhadové metody - např. pro jednorovnicový nebo vícerovnicový model. Q Statistické hodnocení modelu - ověření předpokladů kladených na odhadové techniky, data nebo model. Q Teoretické hodnocení modelu - např. soulad parametrů (znamének) s ekonomickou teorií. O Využití modelu - testování ekonomických hypotéz, predikce, návrhy pro praktické rozhodování (na vládní nebo soukromé úrovni; dle povahy řešeného problému). 4 □ Mg M 1 M 1 ^ > -O^O Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 26 / 66 Obsah tématu Q Úvod do ekonometrie • Ekonomický model • Ekonometrický model Q Práce s daty • Typy ekonomických dat • Grafické metody práce s daty • Popisné statistiky a korelace Q Ekonometrický software a studijní literatura 4 □ Mg M 1 M 1 ^ > -O^O Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 27 / 66 Práce s daty Typy ekonomických dat Obsah tématu Q Úvod do ekonometrie • Ekonomický model • Ekonometrický model Q Práce s daty • Typy ekonomických dat • Grafické metody práce s daty • Popisné statistiky a korelace Q Ekonometrický software a studijní literatura 4 □ Mg M 1 M 1 ^ > -O^O Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 28 / 66 Časové řady • Pozorování proměnných pro nějakou jednotku (stát, firma, apod.) v čase. Yt t = l,...,T • Málokdy splněn předpoklad o nezávislosti pozorování v čase. • Frekvence dat. • Sezónní charakter - potřeba očištění. 4 □ Mg M 1 M 1 ^ > -O^O Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 29 / 66 Časové řady - příklad Tabulka: Minimální mzda, nezaměstnanost a další data pro Puerto Rico Obsno Year Avgmin Avgcov Unemp GNP 1 1950 0.20 20.1 15.4 878.7 2 1951 0.21 20.7 16.0 925.0 3 1952 0.23 22.6 14.8 1015.9 37 1986 3.35 58.1 18.9 4281.6 38 1987 3.35 58.2 16.8 4496.7 Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 Časové řady - příklad (komentář) • Data z Wooldridge (2009), dostupná v gretlu (prminwge.gdt). • Původně: Castillo-Freeman and Freeman (1992) - vliv minimální mzdy v Puerto Rico. Obsno = pozorování; Year = rok; Avgmin = průměrná (hodinová) minimální mzda v roce; Avgcov = průměrná míra pokrytí procento pracovníků beroucích minimální mzdu; Unemp = míra nezaměstnanosti; GNP = hrubý národní produkt. < □ ► 4 & * < 5 ► « 5 ► Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 Průřezová data • Data pro řadu různých jednotek (jednotlivci, domácnosti, firmy, města, státy) v daném časovém okamžiku. Yi i = l,...,N • Charakter náhodného výběru - někdy problém. • Souhrnná průřezová data (pooled cross sections) - různé jednotky pro více časových okamžiků (vhodné pro analýzu strukturálních změn mezi obdobími, např. změna daňových sazeb). 4 □ Mg M 1 M 1 ^ > -O^O Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 32 / 66 Průřezová data - příklad 1 Tabulka: Průřezová data o mzdách a dalších individuálních charakteristikách Obsno Wage Educ Exper Female Married 1 3.10 11 2 1 0 2 3.24 12 22 1 1 3 3.00 11 2 0 0 4 6.00 8 44 0 1 5 5.30 12 7 0 1 525 11.56 16 5 0 1 526 3.50 14 5 1 0 Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 33 / 66 Práce s daty Typy ekonomických dat Průřezová data - příklad 1 (komentář) • Data z Wooldridge (2009), dostupná v gretlu (wagel.gdt). • Zkrácená data o 526 pracovnících za rok 1976. Obsno = pozorování; Wage = hodinová mzda; Educ = počet let vzdělání; Exper = počet let pracovních zkušeností; Female = indikátor pohlaví; Married = indikátor rodinného vztahu. 4 □ Mg M 1 M 1 ^ > -O^O Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 34 / 66 Práce s daty Typy ekonomických dat Průřezová data - příklad 2 Tabulka: Data o mírách růstu a dalších charakteristikách Obsno. Country Gpcrgdp GovconsöO SecondöO 1 Argentina 0.89 9 32 2 Austria 3.32 16 50 3 Belgium 2.56 13 69 4 Bolivia 1.24 18 12 61 Zimbabwe 2.30 17 6 Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 35 / 66 Průřezová data - příklad 2 (komentář) • Data z Wooldridge (2009). • Původně: De Long a Summers (1991) - studie měr růstu mezi zeměmi. Obsno = pozorování; Country = stát; Gpcrgdp = průměrný růst HDP na osobu mezi lety 1960-1958; GovconsQO = vládní spotřeba jako procento HDP; SecondQO = procento dospělých se sekundárním vzděláním. Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 Práce s daty Typy ekonomických dat Souhrnná průřezová data - příklad Tabulka: Ceny domů a další charakteristiky ve dvou letech Obsno. Year Hprice Proptax Sqrft Bdrms 1 1993 85500 42 1600 3 2 1993 67300 36 1440 3 3 1993 134000 38 2000 4 250 1993 243600 41 2600 4 251 1995 65000 16 1250 2 252 1995 182400 20 2200 4 520 1995 57200 16 1100 2 Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 37 / 66 Souhrnná průřezová data - příklad (komentář) • Data z Wooldridge (2009). • Data o prodejních cenách domů v letech 1993 (250 pozorování) a 1995 (270 pozorování). Obsno = pozorování; Year = rok; Hprice = cena domu; P rop tax = daň z nemovitosti; Sqrft = rozloha domu ve čtverečních stopách; Bdrms = počet ložnic. Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 38 / 66 Problém náhodného výběru - příklad • Zkreslení odhadu při nenáhodném výběru. • Prezidentské volby USA (1936); průzkum veřejného mínění Literary Gazette —> Alf M. London drtivě porazí Franklina D. Roosevelta (57 % x 43 %). • Skutečnost: Roosevelt drtivě zvítězil (59 % x 41 %). • Proč rozpor mezi průzkumem a realitou? • Výběr náhodného vzorku na základě telefonních seznamů a seznamů majitelů automobilů. • V roce 1936 - málo vlastníků automobilů a telefonů; vlastníci obvykle bohatší vrstvy volící Republikány => náhodný vzorek podstřelil počet Demokratů => zkreslení odhadů. • Co internetové průzkumy dnes? 4 □ Mg M 1 M 1 ^ > -O^O Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 39 / 66 Práce s daty Typy ekonomických dat Panelová data • Časová i prostorová dimenze. • Data o stejných jednotkách (státech, městech, firmách) a jejich charakteristikách v průběhu několika let. Yit i = l,...,N t = l,...T • Náročnější na získávání. • Možnost kontroly dodatečných vlivů. • Informace o změnách chování v čase. 4 □ Mg M 1 M 1 ^ > -O^O Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 40 / 66 Práce s daty Typy ekonomických dat Panelová data - příklad Tabulka: Panelová data kriminality ve městech Obsno. Město Rok Murders Population Unem Police 1 1 1986 5 350000 8.7 440 2 1 1990 8 359200 7.2 471 3 2 1986 2 64300 5.4 75 4 2 1990 1 65100 5.5 75 297 149 1986 10 260700 9.6 286 298 149 1990 6 245000 9.8 334 299 150 1986 25 543000 4.3 520 300 150 1990 32 546200 5.2 493 M 1 Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 Práce s daty Typy ekonomických dat Panelová data - příklad (komentář) • Data z Wooldridge (2009). • Data o kriminalitě ve 150 městech ve Spojených státech v průběhu dvou let (1986 a 1990). Obsno = pozorování; City = město; Year = rok; Murders = počet vražd; Population = počet obyvatel; Unem = míra nezaměstnansoti; Police = počet příslušníků policie. Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 42 / 66 Práce s daty Typy ekonomických dat Transformace dat • Dle potřeby empirické analýzy. • Diference: AYt = Yt - Yt-i. • Tempo růstu (procentní změna): o/0A Yt = - 1 = Yt ~ (x 100[%]) Yt-i Yt-i • Diference logaritmů (aproximace tempa růstu): %AYt ss ln(yř) - ln(yř_i) (xl00[%]) Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 43 / 66 Práce s daty Grafické metody práce s daty Obsah tématu Q Úvod do ekonometrie • Ekonomický model • Ekonometrický model Q Práce s daty • Typy ekonomických dat • Grafické metody práce s daty • Popisné statistiky a korelace Q Ekonometrický software a studijní literatura Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 44 / 66 Práce s daty Grafické metody práce s daty Obrázek: Časová řada vývoje směnného kurzu GBP vzhledem k USD. Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 45 / 66 Práce s daty Grafické metody práce s daty Histogramy 0.4 celkový počet zemí - 90 0 5000 10000 15000 HDP na obyvatele (v USD) Obrázek: Histogram HDP na osobu pro 90 zemí světa. 4 □ Mg M 1 M 1 ^ > -O^O Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 46 / 66 Práce s daty Grafické metody práce s daty Absolutní a relativní četnost Tabulka: Tabulka četnosti pro HDP na osobu. Interval (USD) Četnost Absolutní Relativní 0-2000 33 36.67 % 2001-4000 22 24.44 % 4001-6000 7 7.78 % 6001-8000 3 3.33 % 8001-10000 4 4.44 % 10001-12000 2 2.22 % 12001-14000 9 10.00 % 14001-16000 6 6.67 % 16001-18000 4 4.44 % Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 47 / 66 Práce s daty Grafické metody práce s daty Bodové grafy (grafy XY) Nikaragua ■j/ m/ w m tK 1 * 7ľ\ 7T\ \m/ 7T\ o 1— 500 1000 1500 2000 2500 Počet obyvatel na tisíc hektarů rozlohy Obrázek: Bodový graf odlesnění vzhledem k hustotě obyvatelstva. Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 Práce s daty Popisné statistiky a korelace Obsah tématu Q Úvod do ekonometrie • Ekonomický model • Ekonometrický model O Práce s daty • Typy ekonomických dat • Grafické metody práce s daty • Popisné statistiky a korelace Q Ekonometrický software a studijní literatura n mjmImIi S -O^O Práce s daty Popisné statistiky a korelace Výběrová střední hodnota a rozptyl • Náhodný výběr: Yi,..., Y/y. • Výběrový průměr (výběrová střední hodnota): Vw Y N • Výběrová směrodatná odchylka: eHi (v/ - v N - 1 • Výběrový rozptyl: sy 4 □ Mg M 1 M 1 ^ > -O^O Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 50 / 66 Práce s daty Popisné statistiky a korelace Histogram a zvonové rozdělení -4-3-2-101234 X Obrázek: Histogram pro zvonové rozdělení. Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 51 / 66 Práce s daty Popisné statistiky a korelace Očekávaná hodnota a rozptyl • Náhodná veličina Y. • Očekávaná hodnota a populační střední hodnota: E(Y) = [i N E(Y) = ^y/p(y/) diskrétní případ, výběrový prostor {yi,.. .y/v} /oo yf(y)dy spojitý případ -oo • Populační rozptyl: var(Y) = a2 var(Y) = E[(Y-tf] = E(Y2)-ŕ Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 52 / 66 Práce s daty Popisné statistiky a korelace Příklad - očekávaný výnos akcie S pravděpodobností 70 % (0.7) budou trhy stabilní (výnos 1 %); s 10 % pravděpodobností dojde k pádu trhů (výnos —10 %); 20% pravděpodobnost růstu nálady na trzích (výnos 5 %). P(y/) = Pr( Y = y,). E(Y) = p (0.05) 0.05 + p (0.01) 0.01 + p (-0.10) (-0.10) = 0.20 x 0.05 + 0.70 x 0.01 + 0.10 x (-0.10) = 0.007. Očekávaná hodnota výnosu akcie v příštím měsíci 0.7% (o něco méně než 1%). Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 53 / 66 Práce s daty Popisné statistiky a korelace Příklad - očekávaná nejistota výnosu akcie • Pro příklad rizika očekávaného výnosu akcie máme možné realizace pro y2: (0.05)2 = 0.0025, (O.Ol)2 = 0.0001 a (-0.10)2 = 0.01. E(y2) = p(0.0025) x 0.0025 + p(0.0001) x 0.0001 + p (0.01) x 0.01 = 0.20 x 0.0025 + 0.70 x 0.0001 + 0.10 x 0.01 = 0.00157. var(y) = E (y2) - [E(y)]2 = 0.00157 - (0.007)2 = 0.001521. • Odmocněním získáme hodnotu 0.039. Očekávaný výnos je tedy 0.7% s nejistotou odpovídající ±3.9%. 4 □ Mg M 1 M 1 ^ > -O^O Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 54 / 66 Korelace Práce s daty Popisné statistiky a korelace • Vztah mezi dvěma proměnnými, X a Y. • Korelace (korelační koeficient): E~1(y,-y)(x,-x) yE£i(v,-y)yEÍU(x,-x)2 Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Vlastnosti korelace Práce s daty Popisné statistiky a korelace O r e (-1,1). O r > 0 . .. pozitivní korelace; r < 0 . .. nekorelovanost; r = 1 nebo r = @ rXy = rYX- O ocx = 1. negativní korelace; r = 0 1 ... perfektní korelace. 4 □ Mg M 1 M 1 ^ > -O^O Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 56 / 66 Práce s daty Popisné statistiky a korelace Možné interpretace hodnot korelace • De Vaus (2002) - Analyzing Social Science Data: 50 Key Problems in Data Analysis. • Nutno brát s rezervou. Hodnota korelace (v abs. hodnotě) Interpretace 0.01 - 0.09 triviální, žádná 0.10 - 0.29 nízká až střední 0.30 - 0.49 střední až podstatná 0.50 - 0.69 podstatná až velmi silná 0.70 - 0.89 velmi silná 0.90 - 1.00 téměř perfektní Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 57 / 66 Práce s daty Popisné statistiky a korelace Příklad - ceny domů • Datový soubor hprice.gdt, Koop (2008) • Data o N = 546 domech prodaných ve Windsoru, v Kanadě, v průběhu léta roku 1987. • V = prodejní cena domu, X = rozloha domu ve čtverečních stopách =>. rXy = 0.54 O Domy s větší rozlohou mají tendenci mít vyšší hodnotu než domy s rozlohou malou. O Existuje pozitivní souvislost mezi rozlohou a prodejní cenou. O Variabilita v rozloze domů vysvětluje 29 % (tzn. 0.542 — 0.29) variability cen domů. • Z = počet ložnic => ryz = 0.37: domy s větším počtem ložnic mají tendenci mít vyšší hodnotu než domy s menším počtem ložnic. • rxz =0.15 => domy s vyšší rozlohou mají tendenci mít vyšší počet ložnic (korelační koeficient relativně nízký => slabý vztah mezi velikostí domu a počtem ložnic). Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 58 / 66 Práce s daty Popisné statistiky a korelace Korelace a kauzalita • Korelace 7^ kauzalita. • Možná existence třetí proměnné. • Přímá a nepřímá kauzalita. • Důležité znalosti o zkoumaném problému. 4 □ Mg M 1 M 1 ^ > -O^O Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 59 / 66 Práce s daty Popisné statistiky a korelace Korelace a bodový graf - příklad 1 200 r— 180 -160 -140 -120 -100 -80 -60 -40 -20 — 2000 4000 6000 8000 10000 12000 14000 16000 18000 Rozloha (čtvereční stopy) Obrázek: Bodový graf rozlohy domů vzhledem k jejich ceně. Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 60 / 66 Práce s daty Popisné statistiky a korelace Korelace a bodový graf - příklad 2 Obrázek: Bodový graf dvou dokonale korelovaných proměnných. Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 61 / 66 Práce s daty Popisné statistiky a korelace Korelace a bodový graf - příklad 3 %* m M * ... Obrázek: Bodový graf nekorelovaných proměnných. Základy ekonometrie (ZAEK) 4 □ Mg M 1 M 1 ^ > -O^O I. Úvod do ekonometrie a práce s daty Podzim 2015 62 / 66 Práce s daty Popisné statistiky a korelace Korelační matice • Korelace pro více proměnných. X Y Z X 1.000 Y 0.318 1.000 Z -0.131 0.097 1.000 Základy ekonometrie (ZAEK) < □ ► 4 S" ► 4 I. Úvod do ekonometrie a práce s daty Práce s daty Popisné statistiky a korelace Populační korelace a kovariance • Příklad: rizikovost portfolia; investice do akcií společnosti na výrobu deštníků a na výrobu zmrzliny. • Populační kovariance: cov{X, Y) = E{XY) - E{X)E{Y) • Populační korelace: v ; y/var{X)var{Y) • Výběrové statistiky jako odhad populačních protějšků. Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 64 / 66 Ekonometrický software a studijní literatura Obsah tématu Q Úvod do ekonometrie • Ekonomický model • Ekonometrický model Q Práce s daty • Typy ekonomických dat • Grafické metody práce s daty • Popisné statistiky a korelace Q Ekonometrický software a studijní literatura Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Ekonometrický software a studijní literatura Software a literatura • Software: komerční vs. open source; „klikací" vs. skriptové nebo kombinované. • Literatura: spousta učebnic, odlišnosti v rozsahu témat a náročnosti; různý styl výkladu. • Přehled - viz první kapitola učebního textu. 4 □ Mg M 1 M 1 ^ > -O^O Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim 2015 66 / 66