Kapitola 10.: Úvod do analýzy časových řad Cíl kapitoly Po prostudování této kapitoly budete umět - očistit časovou řadu od důsledků kalendářních variací - graficky znázornit okamžikovou i intervalovou časovou řadu - vypočítat popisné a dynamické charakteristiky časové řady - odhadnout trend časové řady metodami regresní analýzy a pomocí klouzavých průměrů Časová zátěž Na prostudování této kapitoly a splnění úkolů s ní spojených budete potřebovat asi 8 hodin studia. 10.1. Motivace Při analýze časových řad chceme získat představu o charakteru procesu, který tato řada reprezentuje. Průběh časové řady graficky znázorňujeme pomocí spojnicového resp. sloupkového diagramu. K jejímu popisu používáme různé charakteristiky, a to jak statické tak dyna- mické. K modelování časových řad slouží celá řada metod, např. dekompoziční metoda, Boxova – Jenkinsonova metodologie, lineární dynamické modely, spektrální analýza časových řad. Zde se omezíme na speciální případ dekompoziční metody, kdy pomocí regresní analýzy a pomocí klouzavých průměrů odhadneme trend časové řady. 10.2. Základní pojmy 10.2.1. Pojem časové řady Časovou řadou rozumíme řadu hodnot n1 tt y,,y  určitého ukazatele uspořádanou podle přirozené časové posloupnosti t1 < ... < tn. Jsou-li časové intervaly (t1, t2), ..., (tn-1, tn) stejně dlouhé (ekvidistantní), zjednodušeně zapisujeme časovou řadu jako y1, ..., yn. Přitom ukazatel je veličina, která charakterizuje nějaký sociálně ekonomický jev v určitém prostoru a v určitém čase (okamžiku či intervalu). 10.2.2. Druhy časových řad a) Časová řada okamžiková: příslušný ukazatel udává, kolik jevů existuje v daném časovém okamžiku (např. počet obyvatelstva k určitému dnu). b) Časová řada intervalová: příslušný ukazatel udává, kolik jevů vzniklo či zaniklo v určitém časovém intervalu (např. počet sňatků během roku). Nejsou-li jednotlivé časové intervaly ekvidistantní, musíme provést očištění časové řady od důsledků kalendářních variací. 10.2.3. Příklad: Máme k dispozici údaje o tržbě obchodní organizace (v tis. Kč) v jednotlivých měsících roku 1995: 2400, 2134, 2407, 2445, 2894, 3354, 3515, 3515, 3225, 3063, 2694, 2600. Vypočtěte očištěné údaje. Řešení: Průměrná délka měsíce je 365/12 dne. Očištěná hodnota pro leden je tedy 84,2354 3112 365 2400y )o( 1    , pro únor 18,2318 2812 365 2134y )o( 2    . Pro ostatní měsíce analogicky dostaneme 2361,71; 2478,96; 2839,54; 3400,58, 3448,86; 3448,86; 3269,79; 3005,36; 2731,42; 2551,08. Výpočet pomocí systému STATISTICA: Vytvoříme nový datový soubor o třech proměnných: trzba, dm (délky jednotlivých měsíců) a ot (očištěná tržba) a 12 případech. Do proměnné trzba zapíšeme zjištěné hodnoty. Do proměnné dm vložíme délky jednotlivých měsíců, tj. 31, 28, 30, …, 31. Do Dlouhého jména proměnné ot napíšeme =trzba*365/(12*dm). 1 trzba 2 dm 3 ot 1 2 3 4 5 6 7 8 9 10 11 12 2400 31 2354,839 2134 28 2318,185 2407 31 2361,707 2445 30 2478,958 2894 31 2839,543 3354 30 3400,583 3515 31 3448,858 3515 31 3448,858 3225 30 3269,792 3063 31 3005,363 2694 30 2731,417 2600 31 2551,075 10.2.4. Grafické znázornění časové řady a) Okamžikovou časovou řadu graficky znázorňujeme pomocí spojnicového diagramu. Na vodorovnou osu vynášíme časové okamžiky t1, ..., tn, na svislou osu odpovídající hodnoty y1, ..., yn. Dvojice bodů (ti, yi), i = 1, ..., n spojíme úsečkami. 10.2.5. Příklad Časová řada obsahuje údaje o počtu zaměstnanců určité akciové společnosti v letech 1999 – 2006 vždy k 31.12. 1999 2000 2001 2002 2003 2004 2005 2006 622 627 631 635 641 641 632 625 Znázorněte tuto časovou řadu graficky. Řešení pomocí systému STATISTICA: Vytvoříme datový soubor o dvou proměnných nazvaných rok a pocet a 8 případech. Grafy – Bodové grafy – odškrtneme Lineární proložení – Proměnné X – rok, Y – počet – OK – OK. 2x klikneme na pozadí grafu – vybereme Graf: obecné – zaškrtneme Spojnice – OK. 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 rok 620 622 624 626 628 630 632 634 636 638 640 642 pocet b) Intervalovou časovou řadu nejčastěji znázorňujeme sloupkovým diagramem. Je to soustava obdélníků, kde šířka obdélníku je rovna délce intervalu a výška odpovídá hodnotě ukazatele v daném intervalu. Ke znázornění intervalové časové řady lze použít i spojnicový diagram, přičemž na vodorovnou osu vynášíme středy příslušných intervalů. 10.2.6. Příklad Máme k dispozici údaje o produkci určitého podniku (v tisících výrobků) v letech 1991-1996. 1991 1992 1993 1994 1995 1996 114 106 107 102 116 137 Znázorněte tuto časovou řadu graficky. Řešení pomocí systému STATISTICA: Vytvoříme datový soubor o dvou proměnných nazvaných rok a produkce a 6 případech. Grafy – Bodové grafy – odškrtneme Lineární proložení – Proměnné X – rok, Y – produkce – OK – OK. 2x klikneme na pozadí grafu – vybereme Graf: obecné – zaškrtneme Spojnice – Přidat nový graf – typ Sloupcový graf – OK. Do sloupců označených jako Nový1, Nový2 okopírujeme hodnoty proměnných rok a produkce. Ve Všech možnostech: Sloupce upravíme šířku sloupce na 1. 1990 1991 1992 1993 1994 1995 1996 1997 rok 100 105 110 115 120 125 130 135 140 produkce 10.3. Popisné charakteristiky časových řad 10.3.1. Průměr okamžikové časové řady Nejprve vypočteme průměry pro jednotlivé dílčí intervaly (t1, t2), (t2, t3), ..., (tn-1, tn): 2 yy ,, 2 yy , 2 yy n1n3221    . Jsou-li všechny tyto intervaly stejně dlouhé, vypočteme prostý chronologický průměr okamžikové časové řady:                   n 2i n 1n 2i i 1i1i 2 y y 2 y 1n 1 2 yy 1n 1 y . Nemají-li intervaly stejnou délku, vypočteme di = ti – ti-1, i = 2, ..., n a použijeme vážený chronologický průměr okamžikové časové řady:         n 2i i i1i n 2i i d 2 yy d 1 y . 10.3.2. Příklad Časová řada vyjadřuje počet obyvatelstva ČR (v tisících) v letech 1989 až 2008 vždy ke dni 31.12. rok počet obyvatel rok počet obyvatel 1989 10362,102 1999 10278,098 1990 10364,124 2000 10266,546 1991 10312,548 2001 10206,436 1992 10325,697 2002 10203,269 1993 10334,013 2003 10211,455 1994 10333,161 2004 10220,577 1995 10321,344 2005 10251,079 1996 10309,137 2006 10287,189 1997 10299,125 2007 10381,13 1998 10289,621 2008 10467,542 Charakterizujte tuto časovou řadu chronologickým průměrem. Řešení: 23,10295 2 542,10467 13,10381124,10364 2 102,10362 19 1 y         . Výpočet pomocí systému STATISTICA: Vytvoříme datový soubor o 21 proměnných a jednom případu. Do prvních 20 proměnných vložíme zjištěné hodnoty, do Dlouhého jména poslední proměnné napíšeme =(v1/2+sum(v2:v19)+v20/2)/19 Dostaneme výsledek 10 295,23. 10.3.3. Průměr intervalové časové řady Průměr intervalové časové řady počítáme podle vzorce    n 1i iy n 1 y . 10.3.4. Příklad Vypočtěte průměrnou hodnotu roční časové řady HDP ČR (v miliardách Kč) v letech 1995 až 2008. 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 1466,51683,31811,11996,52080,82189,22352,22464,42577,12814,82983,93222,43535,53689 Řešení:   5,249036895,1466 14 1 y   . Výpočet pomocí systému STATISTICA: Použijeme Popisné statistiky z nabídky Základní statistiky/tabulky. 10.4. Dynamické charakteristiky časových řad 10.4.1. Absolutní přírůstky 1. diference: n,,2i,yyy 1iii   2. diference:   n,,3i,yy2yyyy 2i1ii1iii 2   atd. (Diferencování má velký význam při odhadu trendu časové řady regresními metodami.) Průměrný absolutní přírůstek: 1n yy 1n y 1n n 2i i         10.4.2. Relativní přírůstek n,,2i, y y 1i i i     (Relativní přírůstek po vynásobení 100 udává, o kolik procent se změnila hodnota v čase ti oproti času ti-1.) 10.4.3. Koeficient růstu (tempo růstu) n,,2i, y y k 1i i i   (Koeficient růstu po vynásobení 100 udává, na kolik procent hodnoty v čase ti-1 vzrostla či poklesla hodnota v čase ti.) 10.4.4. Průměrný koeficient růstu 1n 1 n1n n32 y y kkkk    10.4.5. Průměrný relativní přírůstek 1k  10.4.6. Příklad Pro časovou řadu HDP ČR v letech 1995 až 2008 (v miliardách Kč) vypočtěte základní charakteristiky dynamiky a graficky znázorněte relativní přírůstky a koeficienty růstu. rok 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 HDP 1466,5 1683,31811,1 1996,5 2080,82189,2 2352,2 2464,42577,1 2814,8 2983,93222,4 3535,5 3689 Výpočet pomocí systému STATISTICA: Vytvoříme nový datový soubor o 2 proměnných a 14 případech. První proměnnou nazveme ROK, druhou HDP. Výpočet 1. diferencí: 1iii yyy  pro i = 2,...,n Statistiky – Pokročilé lineární/nelineární modely – Časové řady/predikce – Proměnné HDP – OK – OK (transformace, autokorelace, kříž. korelace, grafy) – Oddělit-sloučit - OK (transformovat vybrané řady) – vykreslí se graf. Graf proměnné: HDP D(-1) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Čísla případů 50 100 150 200 250 300 350 HDP 50 100 150 200 250 300 350 Vrátíme se do Transformace proměnných – Uložit proměnné. Otevře se nové datové okno, kde v proměnné HDP_1 jsou uloženy 1. diference. HDP HDP_1 1 1466,5 2 1683,3 216,8 3 1811,1 127,8 4 1996,5 185,4 5 2080,8 84,3 6 2189,2 108,4 7 2352,2 163,0 8 2464,4 112,2 9 2577,1 112,7 10 2814,8 237,7 11 2983,9 169,1 12 3222,4 238,5 13 3535,5 313,1 14 3689,0 153,5 Výpočet relativních přírůstků: 1i i i y y    pro i = 2,...,n Vrátíme se do Transformace proměnných – označíme proměnnou, kterou chceme transformovat (HDP) – vybereme Posun – OK, (Transformovat vybrané řady) – vykreslí se graf. Vrátíme se do Transformace proměnných – Uložit proměnné. Tato transformovaná veličina se uloží do tabulky pod názvem HDP_1 (proměnná s 1. diferencemi se přejmenuje na HDP_2). Přidáme novou proměnnou RP a do jejího Dlouhého jména napíšeme vzorec =HDP_2/HDP_1. Výpočet koeficientů růstu: 1i i i y y k   pro i = 2,...,n Do tabulky přidáme proměnnou KR a do jejího Dlouhého jména napíšeme vzorec =HDP/HDP_1. Získáme tabulku HDP HDP_2HDP_1 RP KR 1 1466,5 2 1683,3216,8 1466,5 0,14781,1478 3 1811,1127,8 1683,3 0,07591,0759 4 1996,5185,4 1811,1 0,10241,1024 5 2080,884,3 1996,5 0,04221,0422 6 2189,2108,4 2080,8 0,05211,0521 7 2352,2163,0 2189,2 0,07451,0745 8 2464,4112,2 2352,2 0,04771,0477 9 2577,1112,7 2464,4 0,04571,0457 102814,8237,7 2577,1 0,09221,0922 112983,9169,1 2814,8 0,06011,0601 123222,4238,5 2983,9 0,07991,0799 133535,5313,1 3222,4 0,09721,0972 143689,0153,5 3535,5 0,04341,0434 15 3689,0 Průměrný absolutní přírůstek: 96,170 13 5,14663689    , tzn., že v období 1995–2008 rostl HDP průměrně o 170,96 miliard Kč ročně. Průměrný koeficient růstu: 0735,1 5,1466 3689 13 k , tzn., že v období 1995–2008 rostl HDP průměrně o 7,35 % ročně. Pomocí Grafy - 2D Grafy – Spojnicové grafy (Proměnné) vykreslíme průběh relativních přírůstků a koeficientů růstu. Graf relativních přírůstků 2 3 4 5 6 7 8 9 10 11 12 13 14 0,02 0,04 0,06 0,08 0,10 0,12 0,14 0,16RP Graf koeficientů růstu 2 3 4 5 6 7 8 9 10 11 12 13 14 1,02 1,04 1,06 1,08 1,10 1,12 1,14 1,16 KR 10.5. Aditivní model časové řady 10.5.1. Popis modelu Předpokládejme, že pro časovou řadu y1, ..., yn platí model yt = f(t) + εt, t = 1, ..., n, kde f(t) je neznámá trendová funkce (trend), kterou považujeme za systematickou (deterministickou) složku časové řady (popisuje hlavní tendenci dlouhodobého vývoje časové řady), εt je náhodná složka časové řady zahrnující odchylky od trendu. Náhodná složka splňuje předpoklady E(εt) = 0, D(εt) = σ2 , C(εt, εt+h) = 0, εt ~ N(0, σ2 ) (říkáme, že εt je bílý šum). 10.5.2. Cíl regresní analýzy trendu Regresní analýza trendu má objasnit vztah mezi závisle proměnnou veličinou Y a časem t. Předpokládáme, že trend f(t) závisí (lineárně či nelineárně) na neznámých parametrech β0, β1, ..., βk a známých funkcích φ0(t), φ1(t), ...., φk(t), které již neobsahují žádné neznámé parametry, tj. f(t) = g(t;β0, β1, ..., βk). Odhady b0, b1, ..., bk neznámých parametrů β0, β1, ..., βk lze získat např. metodou nejmenších čtverců a pak vyjádřit odhad )t(f  neznámého trendu v bodě t pomocí odhadů b0, b1, ..., bk a funkcí φ0(t), φ1(t), ...., φk(t), tj. )t(f  = g(t;b0, b1, ..., bk). 10.5.3. Nejdůležitější typy trendových funkcí Volba typu trendové funkce se provádí - na základě teoretických znalostí a zkušeností se zkoumanou veličinou Yt - pomocí grafu časové řady - pomocí informativních testů založených na jednoduchých charakteristikách časové řady a) Lineární trend Analytické vyjádření: t)t(f 10  Informativní test: 1. diference jsou přibližně konstantní. b) Kvadratický trend Analytické vyjádření: 2 210 tt)t(f  Informativní test: 1. diference mají přibližně lineární trend, 2. diference jsou přibližně kon- stantní. c) Exponenciální trend Analytické vyjádření: t 10)t(f  . Model lze linearizovat logaritmickou transformací: 10 lntln)t(fln  Informativní test: koeficienty růstu jsou přibližně konstantní. d) Modifikovaný exponenciální trend Analytické vyjádření: t 10)t(f  . Informativní test: řada podílů sousedních 1. diferencí je přibližně konstantní. e) Logistický trend Analytické vyjádření: t 101 )t(f    Informativní test: průběh 1. diferencí je podobný Gaussově křivce a podíly t1t 1t2t y1y1 y1y1     jsou přibližně konstantní. f) Gompertzova křivka Analytické vyjádření: t 1 0)t(f   Informativní test: podíly t1t 1t2t ylnyln ylnyln     jsou přibližně konstantní. Modely (a), (b), (c) jsou lineární nebo se dají linearizovat a odhady parametrů získáme metodou nejmenších čtverců. Modely (d), (e), (f) jsou nelineární a odhady parametrů se získávají speciálními numerickými metodami. 10.5.4. Orientační ověřování kvality modelu - Index determinace (tj. podíl vysvětlené a celkové variability závisle proměnné veličiny) by měl být blízký 1. - Body grafu   tfˆ,yt , t = 1, 2, ..., n by se měly řadit do přímky se směrnicí 1. - Při srovnání několika modelů se stejným počtem parametrů volíme ten model, pro který je střední kvadratická chyba odhadu (     n 1t 2 t tfˆy n 1 MSE ) nejnižší. 10.5.5. Příklad Uvažme časovou řadu HDP ČR v letech 1995 až 2008 (v miliardách Kč) – viz př. 10.4.6. a) Graficky znázorněte průběh této časové řady. b) Z grafu časové řady lze usoudit, že časová řada má lineární trend t)t(f 10  . Odhadněte jeho parametry a nakreslete průběh trendu do grafu časové řady. c) Zjistěte odhad HDP v roce 2009. d) Vypočtěte index determinace a sestrojte graf   tfˆ,yt , t = 1, ..., 14. Řešení pomocí systému STATISTICA: Vytvoříme datový soubor se třemi proměnnými rok, t, HDP a 14 případy. Do proměnné t uložíme hodnoty 1, …, 14. ad a) Graficky znázorníme průběh této časové řady: Grafy – Bodové grafy – Proměnné rok, HDP – OK – vypneme proložení – OK. 1994 1996 1998 2000 2002 2004 2006 2008 2010 rok 1200 1400 1600 1800 2000 2200 2400 2600 2800 3000 3200 3400 3600 3800 HDP ad b) Odhadneme parametry lineárního trendu. Statistika – Vícerozměrná regrese – Proměnné závislé: HDP, nezávislé: t – OK – OK. Otevře se nové okno Výsledky – vícenásobná regrese. Na záložce Základní výsledky zvolíme Výpočet: výsledky regrese a získáme tabulku, kde ve sloupci B jsou odhady regresních parametrů. Výsledky regrese se závislou proměnnou : HDP (HDP_CR.sta) R= ,99052776 R2= ,98114525 Upravené R2= ,97957402 F(1,12)=624,44 p<,00000 Směrod. chyba odhadu : 97,936 N=14 b* Sm.chyba z b* b Sm.chyba z b t(12) p-hodn. Abs.člen t 1273,565 55,2867023,035640,000000 0,990528 0,039639 162,255 6,49309 24,988880,000000 Odhad trendu:   t255,162565,1273tfˆ  . Podle tohoto modelu by tedy HDP v roce 1994 činil 1 273, 565 mil. Kč (realita byla 1 255, 986) a v každém dalším roce by vzrostl o 162, 255 mil. Kč. Vytvoření grafu časové řady s odhadnutým trendem: Na záložce Uložit zvolíme Uložit rezidua a předpovědi. K nim do tabulky uložíme ještě proměnné rok a HDP a pomocí vícenásobného bodového grafu vytvoříme požadovaný graf. HDP Předpovědi 1994 1996 1998 2000 2002 2004 2006 2008 2010 rok 1200 1400 1600 1800 2000 2200 2400 2600 2800 3000 3200 3400 3600 3800 ad c) Odhad HDP roce 2009: Pro výpočet predikované hodnoty zvolíme Rezidua/předpoklady/předpovědi - Předpovědi závisle proměnné čas: 15 - OK. Ve výstupní tabulce je hledaná hodnota označena jako Předpověď: 3 707,392. Předpovězené hodnoty (HDP_CR.sta) proměnné: HDP Proměnná b-váha Hodnota b-váha * Hodnot t Abs. člen Předpověď -95,0%LS +95,0%LS 162,2552 15,00000 2433,827 1273,565 3707,392 3586,933 3827,852 ad d) Index determinace je ID2 = 0,981, jak je uvedeno v záhlaví výstupní tabulky regresní analýzy. Znamená to, že lineární trend vysvětluje variabilitu HDP z 98,1%. Graf závislosti predikovaných hodnot na hodnotách časové řady vytvoříme tak, že uložíme předpovězené hodnoty. Pak pomocí Bodového grafu vykreslíme závislost predikce na Y. 1,2E6 1,4E6 1,6E6 1,8E6 2E6 2,2E6 2,4E6 2,6E6 2,8E6 3E6 3,2E6 3,4E6 3,6E6 3,8E6 1,2E6 1,4E6 1,6E6 1,8E6 2E6 2,2E6 2,4E6 2,6E6 2,8E6 3E6 3,2E6 3,4E6 3,6E6 3,8E6 Jak index determinace, tak graf   tfˆ,yt svědčí o tom, že model dobře vystihuje charakter dané časové řady. 10.6. Odhad trendu časové řady pomocí klouzavých průměrů 10.6.1. Podstata klouzavých průměrů Předpokládáme, že časová řada se řídí aditivním modelem yt = f(t) + εt, t = 1, ..., n. Odhad trendu v bodě t získáme určitým zprůměrováním původních pozorování z jistého okolí uvažovaného časového okamžiku t. Můžeme si představit, že podél dané časové řady klouže okénko, v jehož rámci se průměruje. Nechť toto okénko zahrnuje d členů nalevo od bodu t a d členů napravo od bodu t. Hovoříme pak o vyhlazovacím okénku šířky h = 2d + 1. Prvních a posledních d hodnot trendu neodhadujeme, protože pro    n,,1dnd,,1t   není vyhlazovací okénko symetrické. Odhad trendu ve středu vyhlazovacího okénka je dán vztahem:          d2 0k kdtdt1dtdt y 1d2 1 yyy 1d2 1 )t(fˆ  , t = d+1, ..., n-d. 10.6.2. Šířka vyhlazovacího okénka Velmi důležitou otázkou je stanovení šířky vyhlazovacího okénka. Je-li okénko příliš široké, bude se odhad trendu blížit přímce (říkáme, že je přehlazen) a zároveň se ztratí velký počet členů na začátku a na konci časové řady. Je-li naopak okénko úzké, bude se odhad trendu blížit původním hodnotám (říkáme, že odhad je podhlazen). Nejčastěji se volí šířka okénka h = 3, 5, 7, pro časovou řadu čtvrtletních hodnot 4. 10.6.3. Příklad Máme k dispozici čtvrtletní časovou řadu průměrných měsíčních mezd v České republice v době od 1/2001 do 3/2009: čas mzda čas mzda čas mzda 1/2002 14204 4/2004 19980 3/2007 21470 2/2002 15772 1/2005 17678 4/2007 23435 3/2002 15422 2/2005 18763 1/2008 22531 4/2002 17315 3/2005 18833 2/2008 23182 1/2003 15407 4/2005 20841 3/2008 23144 2/2003 17084 1/2006 18903 4/2008 25381 3/2003 16522 2/2006 20036 1/2009 22328 4/2003 18697 3/2006 19968 2/2009 22992 1/2004 16722 4/2006 21952 3/2009 23350 2/2004 17817 1/2007 20399 3/2004 17738 2/2007 21462 a) Odhadněte trend této časové řady pomocí klouzavých průměrů s vyhlazovacím okénkem šířky 4. b) Graficky znázorněte průběh časové řady s odhadnutým trendem. Řešení pomocí systému STATISTICA: Vytvoříme datový soubor ctvrtletni_mzda.sta o dvou proměnných CAS a MZDA a 31 přípa- dech. Statistiky – Pokročilé lineární/nelineární modely – Časové řady/predikce – Proměnné Y – OK– OK (transformace, autokorelace, kříž. korelace, grafy) – Vyhlazování – zaškrtneme N- bod. klouzavý průměr, N = 4 – OK (Transformovat vybrané řady) – vykreslí se graf, vrátíme se do Transformace proměnných – Uložit proměnné. Otevře se nová datová tabulka, kde v proměnné MZDA_1 jsou uloženy klouzavé průměry pro N = 4. K datovému souboru přidáme proměnnou CAS, kterou okopírujeme z původního datového souboru. ctvrtletni_mzda.sta 1 CAS 2 MZDA 3 MZDA_1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 1/2002 14204,00 2/2002 15772,00 3/2002 15422,0015828,63 4/2002 17315,0016143,00 1/2003 15407,0016444,50 2/2003 17084,0016754,75 3/2003 16522,0017091,88 4/2003 18697,0017347,88 1/2004 16722,0017591,50 2/2004 17817,0017903,88 3/2004 17738,0018183,75 4/2004 19980,0018421,50 1/2005 17678,0018676,63 2/2005 18763,0018921,13 3/2005 18833,0019181,88 4/2005 20841,0019494,13 1/2006 18903,0019795,13 2/2006 20036,0020075,88 3/2006 19968,0020401,75 4/2006 21952,0020767,00 1/2007 20399,0021133,00 2/2007 21462,0021506,13 3/2007 21470,0021958,00 4/2007 23435,0022439,50 1/2008 22531,0022863,75 2/2008 23182,0023316,25 3/2008 23144,0023534,13 4/2008 25381,0023485,00 1/2009 22328,0023487,00 2/2009 22992,00 3/2009 23350,00 Pro zobrazení proměnných MZDA a MZDA_1 do jednoho grafu přejdeme na záložku Přehledy a grafy. Vedle možnosti Zobrazit víc proměnných zvolíme Graf. Označíme obě proměnné – OK. Vykreslí se následující graf: -2 0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 MZDA MZDA; trns. 12000 14000 16000 18000 20000 22000 24000 26000 28000 Value 12000 14000 16000 18000 20000 22000 24000 26000 28000 Vidíme, že díky vhodné volbě šířky vyhlazovacího okénka se podařilo odhadnout trend dané časové řady. Shrnutí Časovou řadou rozumíme řadu číselných hodnot určitého ukazatele, který se v čase mění. Rozlišujeme časové řady okamžikové (příslušný ukazatel udává, kolik jevů existuje v daném časovém okamžiku) a časové řady intervalové (příslušný ukazatel udává, kolik jevů vzniklo či zaniklo v určitém časovém intervalu). Nejsou-li jednotlivé časové intervaly stejně dlouhé, musíme provést očištění časové řady od důsledků kalendářních variací. Okamžikové časové řady znázorňujeme pomocí spojnicového diagramu, intervalové pak pomocí sloupkového diagramu. Okamžikovou časovou řadu charakterizujeme chronologickým průměrem, intervalovou aritmetickým průměrem. K popisu časových řad používáme také dynamické charakteristiky: absolutní a relativní přírůstky a koeficienty růstu. K nejdůležitějším úkolům analýzy časových řad patří odhad trendu, tj. deterministické složky časové řady, která vystihuje popisuje hlavní tendenci dlouhodobého vývoje časové řady. Odhad trendu lze provádět např. metodami regresní analýzy nebo pomocí klouzavých průměrů. Regresní odhad trendu vyžaduje, aby vývoj časové řady odpovídal nějaké funkci. Její parametry pak odhadujeme metodou nejmenších čtverců (to v případě lineárních či linerizovatelných modelů) nebo vhodnou numerickou metodou (např. Levenbergovou – Marquardtovou). Naproti tomu metoda klouzavých průměrů, která patří k tzv. adaptivním metodám, je založena na předpokladu, že časová řada mění v čase svůj charakter, tudíž trend nelze popsat pomocí jediné funkce. Předpokládáme však, že v krátkých úsecích svůj charakter zachovává a tedy každému úseku lze jednu funkci přiřadit. V případě výše popsaných klouzavých průměrů jde o konstantní funkci. Kontrolní otázky 1. Jak se liší časová řada okamžiková od intervalové? 2. Kdy se používá prostý a kdy vážený chronologický průměr? 3. Jak je definována druhá absolutní diference? 4. Uveďte vzorec pro výpočet průměrného koeficientu růstu. 5. Má-li časová řada kvadratický trend, jak se chovají její první diference? 6. Co to znamená, když náhodná složka časové řady je bílým šumem? 7. Popište princip metody klouzavých průměrů. Autokorekční test 1. Jaké číslo patří v následující tabulce místo otazníku? yt 156 175 kt 0,975 ? a) 0,891 b) 1,094 c) 1,122 2. Jaké číslo patří v následující tabulce místo otazníku? yt 25 32 δt xxx ? a) 0,219 b) 0,280 c) 0,781 3. Jaký je průměrný absolutní přírůstek za celou dobu sledování? t 1 … 21 yt 185 … 249 a) 1,015 b) 3,048 c) 3,200 4. Pokud mají 1. diference časové řady přibližně lineární trend, pak vhodným modelem trendové funkce časové řady je a) Gomperzova křivka b) parabola c) exponenciála 5. Střední kvadratickou chybu odhadu trendu nelze počítat podle vzorce: a)     n 1t 2 t tfˆy n 1 MSE b)    n 1t 2 t tfˆy n 1 MSE c)       n 1t tt tfˆytfˆy n 1 MSE Správné odpovědi: 1c), 2b), 3c), 4b) 5c) Příklady 1. V jednotlivých čtvrtletích roku 2006 se v ČR uskutečnilo 4 896, 16 545, 23 368 a 8051 sňatků. Vypočtěte očištěné údaje. Výsledek: 4 964; 16 590,45; 23 177,5; 7985,37 2. V následující tabulce jsou uvedeny údaje o počtu nezaměstnaných (v tisících) v ČR v letech 2001 – 2008. Vypočtěte chronologický průměr. rok 2001 2002 2003 2004 2005 2006 2007 2008 počet418,3374,1399,1425,9410,2371,3244,5223,9 Výsledek: 363,7 3. Pro časovou řadu z let 1989 – 2007 spotřeby cigaret na jednoho obyvatele ČR za rok graficky znázorněte průběh koeficientů růstu a vypočtěte a interpretujte průměrný relativní pří- růstek. rok početrok počet 19891776 19992090 19902152 20001882 19912025 20011664 19921950 20021893 19931912 20032192 19942040 20042243 19952185 20052275 19962165 20062338 19972354 20072345 19981852 Výsledek: Graf koeficientů růstu 2 4 6 8 10 12 14 16 18 0,75 0,80 0,85 0,90 0,95 1,00 1,05 1,10 1,15 1,20 1,25 KR Průměrný relativní přírůstek: 0,0156, tzn., že v letech 1989 – 2007 rostla spotřeba cigaret na jednoho obyvatele za rok v průměru o 1,56 %. 4. Časová řada 112, 149, 238, 354, 580, 867 udává zisk (v tisících dolarů) jisté společnosti v prvních šesti letech její existence. a) Z grafu časové řady a chování koeficientů růstu lze usoudit, že časová řada má exponenciální trend t 10)t(f  . Odhadněte jeho parametry. b) Najděte odhad zisku společnosti v 7. a 8. roce její existence. e) Vypočtěte index determinace. Výsledek: ad a) Model t 10)t(f  linearizujeme na model 10 lntln)t(fln  a metodou nejmenších čtverců získáme odhady ln b0, ln b1. Odlogaritmováním dostaneme b0 = 68,57875, b1 = 1,522265. ad b) Odhad zisku společnosti v 7. roce existence: 1299,035 tisíc dolarů, v 8. roce : 1977,476 tisíc dolarů. ad c) Index determinace je 0,996. 5. Časová řada 215, 219, 222, 235, 202, 207, 187, 204, 174, 172, 201, 272 udává roční objemy vývozu piva (v miliónech litrů) z Československa v letech 1980 až 1991. Odhadněte trend této časové řady pomocí klouzavých průměrů s vyhlazovacím okénkem šířky 5 Výsledek: rok 1982 1983 1984 1985 1986 1987 1988 1989 kp5 218,6 217 210,6 207 194,8 188,8 187,6 204,6