Dekompozice časové řady na složky Náhodná složka Je obsažená v každé reálné řadě zachycující v delším časovému úseku vývoj ekonomického ukazatele, mj. proto, že ekonomické prostředí je charakterizováno znatelnou mírou neurčitosti/stochastičnosti způsobené působením velkého množství i relativně slabých vlivů, které se v individuálním v časovém období projevují. Občas se sice setkáme i s ekonomických časovými řadami, ve kterých není náhodná složka zastoupena, např. časová řada daňových sazeb , nebo časová řada úrokových sazeb centrální banky (diskontní sazba PRIBOR),ale jde prakticky vždy o ukazatele, jejichž hodnoty jsou výsledkem arbitrárních rozhodnutí decizního subjektu, nikoliv působení exogenních ekonomických veličin či jiných vlivů. Drtivá většina „běžných“ ekonomických časových řad náhodnou složku obsahuje. Aditivní dekompozice časové řady , kde - představuje trendovou složku - představuje sezónní složku - představuje cyklickou složku - představuje náhodnou (stochastickou) složku Multiplikativní dekompozice časové řady , kde - představuje trendovou složku - představuje sezónní složku - představuje cyklickou složku - představuje náhodnou (stochastickou) složku Analýze náhodné složky je v moderní analýze časových řad (nejméně stejně jako v ekonometrii) věnována větší pozornost, než kterékoliv z ostatních složek řady, přestože míra její významnosti na hodnotách časové řady může být jen několik málo procent. Je to dáno mj. tím, že v modelech časových řad, podobně jako v modelech ekonometrických jsou o náhodné složce vysloveny fundamentální předpoklady[i], které samy o sobě nebo s doplněním případných dalších umožňují konstruovat poměrně náročné matematicko-statistické postupy zasahující v řadě případů velmi hluboko do vnitřní struktury utváření jednotlivých hodnot řady. [1] Stacionarita časové řady V širším slova smyslu lze říci, že stacionarita časové řady prezentuje vlastnost, kdy chování časové řady je „stochasticky„ ustálené. Rozlišují se přitom dva základní typy stacionarity: - striktní stacionarita, která znamená, že pravděpodobnostní chování příslušného stochastického procesu, který generuje hodnoty časové řady , je invariantní vůči posunům v čase. tj. pravděpodobnostní rozdělení náhodného vektoru je stejné jako rozdělení vektoru pro libovolné konečné . - slabá (kovarianční) stacionarita: je méně omezující než striktní stacionarita, neboť zde stačí, aby příslušný proces byl invariantní vůči posunům v čase pouze v rámci momentů rozdělení do druhého řádu, tj. pro libovolné platí pro každé : (1) (2) pro libovolné , speciálně tedy také pro (3) Střední hodnota a rozptyl stacionární řady jsou tedy konstantní (stejné pro všechny hodnoty) v čase. Trend (nekonstantní), sezónnost, cykličnost nebo proměnný rozptyl hodnot jsou tedy s vlastností stacionarity neslučitelné a pro její dosažení musí být přednostně z řady odstraněny. Také kovarianční struktura řady musí být v čase neměnná ( např. charakter závislosti mezi 1 a 3.čtvrtletím musí zůstat stejný pro všechny členy čtvrtletní časové řady ve všech letech, která řada pokrývá ) . Poznámka1 Pokud u náhodného procesu existují konečné momenty aspoň do 2. řádu včetně, pak ze striktní stacionarity evidentně vyplývá slabá. Je-li navíc náhodný proces normální (tj. každý konečně n-rozměrný výběr z tohoto procesu má sdružené normální rozdělení), pak jsou oba typy stacionarity vzájemně ekvivalentní. Ve většině úvah (a tedy všech následujících) budeme pracovat se slabou stacionaritou (kterou budeme označovat zkráceně jako stacionarita). Při popisu Boxovy-Jenkinsovy metodologie je vhodné začít právě modelováním stacionárních časových řad. I pojem autokovarianční a autokorelační funkce zavedeme ( z tohoto důvodu) jen pro stacionární časové řady. Autokovarianční a autokorelační funkce Časové řady se často vyznačují silnou korelovaností v čase. Např. pokud časová řada tříměsíčního PRIBORu v daný den činila 3,45% p.a., pak v nejbližších dnech se spíše bude pohybovat v rozmezí od 3,40 do 3,50%, než někde kolem 6%. Běžným nástrojem pro kvantitativní popis tohoto jevu je autokovarianční nebo autokorelační funkce. Autokovarianční funkce[2] pro zpoždění délky (zkráceně autokovariance pro zpoždění ) se definuje jako (4) , Zřejmě máme pro : Analogicky, Autokorelační funkce pro zpoždění délky (zkráceně autokorelace pro zpoždění ) (anglická zkratka ACF) se definuje jako (5) Poznámka2 Označení autokorelační funkce pro výraz (5) je plně oprávněné, protože vzhledem k předpokladu stacionarity je zřejmě (6) Jak autokovarianční tak autokorelační funkce jsou funkce sudé (platí pro ně vztah , ), takže se pro jejich popis stačí omezit na nezápornou hodnotu (argumentu označujícího zpoždění ). Přitom zřejmě bude vždy platit * a . Grafické zpodobnění pro jednotlivá (diskrétní) k se nazývá korelogram. Korelogram popisuje pomocí několika hodnot korelací krátkodobou dynamiku dané stacionární řady. Na jeho horizontální ose jsou uvedeny hodnoty (kladných) časových zpoždění, k nimž se v podobě sloupcového/úsečkového grafu vynášejí hodnoty autokorelační funkce pro danou hodnotu zpoždění. Dlouhodobou dynamiku zachycuje obvykle trend (nebo cyklická složka). Bývá to právě několik (nemnoho) minulých hodnot , pomocí jejichž korelací s vysvětluje model stacionární časové řady současnou hodnotu této řady - to je v kontrastu s klasickým modelem lineární regrese, kde daná vysvětlovaná proměnná je vysvětlována pomocí jiných (vysvětlujících) proměnných a konvenční OLS-odhad parametrů zahrnuje korelaci mezi a . Odhad parametrů autokovarianční a autokorelační funkce Pro analyzovanou stacionární časovou řadu se používá (7) odhad střední hodnoty , (8) odhad autokovarianční funkce , (9) odhad autokorelační funkce , Aby měly tyto odhady praktický význam, požaduje se obvykle, aby a navíc . V praxi se nicméně tento požadavek často opomíjí. Někdy se také ve vzorci (8) dělí číslem místo . Tím se sice sníží vychýlenost odhadu, ale na druhé straně se zvětší střední čtvercová chyba odhadu definovaná jako (10) Tak či onak, se při velkém n blíží skutečné hodnotě , stejně jako se blíží , takže se jedná o asymptoticky nestranné odhady. Chování autokorelační funkce je v rámci Boxovy-Jenkinsovy metodologie důležitým ukazatelem, neboť napovídá, jaký typ modelu je vhodné pro danou řadu použít. Říkáme, že toto chování identifikuje příslušný model. Přitom je pro identifikaci důležité především určit hodnotu , za kterou začíná být autokorelační funkce nulová ( se pak označuje za bod useknutí ). Současně je ale možné zjistit, že taková hodnota vůbec neexistuje. Např. pro model MA (1) tvaru (11A) , kde je bílý šum a je parametr, platí (11B) pro Takže zde je . Přitom pro konkrétní analyzovanou řadu ale teoretickou autokorelační funkci neznáme. Proto je nutné mít představu o tom, jak spolehlivě ji zastupuje odhadnutá autokorelační funkce , kterou pro danou řadu můžeme podle vzorce (9) snadno spočítat. Zvlášť důležité je pak správně odpovědět na otázku, jak blízko nule musí být , abychom s předem danou spolehlivostí mohli tvrdit, že pak pro tento účel se často používá tzv. Bartlettova aproximace: je-li pro , pak za předpokladu (asymptotické) normality je (12) pro Parciální autokorelační funkce a odhad jejích parametrů Kromě autokorelační funkce se používá také parciální autokorelační funkce značená jako (s anglickou zkratkou PACF). Hodnota je zde definována jako parciální autokorelační koeficient mezi a při pevných hodnotách . Např. místo symbolu bychom mohli užít obsažnějšího označení . Zřejmě i zde platí a . Vzhledem k definici parciální autokorelace je jejím přirozeným odhadem veličina odhadnutý parametr v modelu (13) , kde je bílý šum . V reálných výpočtech se nicméně užívá rekurentní způsob výpočtu tohoto odhadu podle vzorců (14) a pro , kde (14A) pro poznámka: výpočet probíhá rekurentně, každé získáme pomocí nižších řádů, viz např. podle (14A): Podobně jako autokorelační funkce může mít také parciální autokorelační funkce bod useknutí. (konkrétně pro autoregresní procesy), takže i ona je důležitým identifikačním nástrojem. Přitom se tentokrát užívá tzv. Quenouilleova aproximace: Je-li pro , potom za předpokladu (asymptotické) normality je (15) pro . ________________________________ 1 Zdaleka ne vždy však je praktický přínos z takto provedené analýzy úměrný míře složitosti těchto postupů a určitá část výzkumu v této oblasti je víceméně experimentováním s hypotézami, jejichž verifikace v realitě je možná jen ve velmi omezené míře. [2] Nejde zde o funkci ve smyslu slova matematické analýzy, protože tato „funkce“ je definována pouze pro celočíselné hodnoty časových zpoždění, nýbrž formálně zde jde o posloupnost. ________________________________ [i] Typickými z nich jsou, že náhodné složky v různých obdobích jsou vzájemně nekorelované a mají stejné rozdělení (nebo aspoň stejné dva první momenty).