Lineární proces [linear process] Teoretickým základem modelů tzv.Boxovy-Jenkinsovy metodologie je lineární proces, který je definován jako (1) , kde je tzv. bílý šum [white noise] [= posloupnost nekorelovaných, stejně rozdělených náhodných veličin s nulovou střední hodnotou a konstantním konečným rozptylem ] a je operátor časového posunu. Dále se předpokládá, že mocninná řada proměnné z konverguje pro (tj. uvnitř a na jednotkovém kruhu v komplexní rovině). Za tohoto předpokladu lze ukázat, že nekonečné řady náhodných veličin (1) pro jednotlivá t konvergují podle kvadratického středu[1], přičemž limitní hodnoty tvoří stacionární posloupnost s nulovou střední hodnotou Jiné vyjádření lineárního procesu (1), které je užitečné např. při konstrukci předpovědí, je možné v případě, že tento proces je invertibilní a lze ho zapsat jako (2) neboli (2A) , Přitom postačující podmínkou invertibility je předpoklad analogický předpokladu (2), že (3) mocninná řada konverguje pro , tj. uvnitř a na jednotkovém kruhu v komplexní rovině. Poznámka1 Existuje řada důvodů, proč modely postavené na principu lineárního procesu jsou vhodné pro modelování reality. Nechť pro stacionární proces s nulovou střední hodnotou předpovídáme hodnotu na základě znalosti minulých hodnot . Optimální předpovědí ve smyslu minimální chyby MSE je pak , přičemž chyba této předpovědi je (4) Má vlastnosti bílého šumu a označuje se jako inovace [innovation]. Označení je vcelku logické, protože inovační proces odpovídá nepredikovatelnému pohybu v hodnotách . Jestliže je navíc proces normálně rozdělen, pak podmíněná střední hodnota má tvar lineární kombinace hodnot a vztah (4) můžeme přepsat jako (5) , což je právě invertovaný tvar (2) lineárního procesu. Poznámka2 Protože platí , musí zřejmě platit (6) (6A) , , atd. Tyto vztahy lze použít pro převod parametrů na parametry a naopak. Formálně lze také uplatnit zápis (7) . Proces klouzavých součtů MA [moving average process][2] Proces klouzavých součtů řádu se značí má tvar (11) kde jsou parametry a je tzv. operátor klouzavých součtů. Proces tedy zřejmě vzniká useknutím lineárního procesu (1) v bodě, který odpovídá zpoždění . Proces je vždy stacionární, má nulovou střední hodnotu a rozptyl o velikosti (12) a má autokorelační funkcí (13) pro pro Autokorelační funkce má tedy bod useknutí roven řádu modelu . ověření: Parciální autokorelační funkce procesu nemá bod useknutí, ale je omezena lineární kombinací geometricky klesajících posloupností a sinusoid s geometricky klesajícími amplitudami. Proces je invertibilní, jestliže všechny kořeny polynomu leží vně jednotkového kruhu v komplexní rovině (tj. , neboť potom je splněn předpoklad (3). Proces - proces klouzavých součtů 1. řádu (14) má autokorelační funkci , pro s bodem useknutí . ověření: vyjdeme z definice (6) obecného AR-procesu a vypočítáme protože ze čtyř členů v čitateli je jen jeden nenulový a protože podle (14) dále platí ( Při odvozování respektujeme pravidlo nekorelovanosti náhodných složek pro . ) protože při se ve jmenovateli neobjeví žádné dvě složky se stejným indexem. □ . Jeho parciální autokorelační funkce má tvar (bez bodu useknutí): (15) pro Takže je v případě invertibility procesu opravdu geometricky klesající posloupnost (16) Podmínka invertibility zde má totiž velmi jednoduchý tvar . Protože , musí pro invertibilní proces být . Tato nerovnost platí dokonce pro všechna . MA(1) - polynom má tvar , tedy , po anulování , jediný (a to reálný) kořen MA(1)-polynomu je tedy roven . ( může být přirozeně také záporné.) Má-li kořen tohoto polynomu (pro invertibilitu) ležet vně jednotkového kruhu, musí platit buď (P1) nebo (P2) * Podmínka (P1) může být splněna jen při kladném a při splnění tj. * Podmínka (P2) může být splněna jen při záporném a při splnění tj. Obě eventuality pokrývá souhrnná podmínka . Proces - proces klouzavých součtů 2. řádu (17) má autokorelační funkci (18) s bodem useknutí . ověření: . protože při s čitateli výrazu pro neobjeví žádné dvě složky se stejným indexem. Při odvozování respektujeme pravidlo nekorelovanosti náhodných složek pro . □. Podmínka invertibility (2) má pro proces tvar (19) , , takže oblast invertibility procesu v rovině s vodorovnou osou pro hodnoty a se svislou osou pro hodnoty vyplní vnitřek trojúhelníka s vrcholy , a . Důkaz: MA(2)-polynom má tvar , tedy , po anulování neboli . Kořeny AR (2)-polynomu získáme jako řešení této kvadratické rovnice s podmínkou (pro reálný i komplexní případ). Řešení této kvadratické rovnice je . a) Jsou-li kořeny reálné, různé, pak musí být splněny podmínky (A) , tedy a současně (B) , tedy (B1) a také (B2) Pokud je , pak je podmínka (A) splněna vždy. Kořen je záporný, protože (při záporném jmenovateli) má kladný čitatel. Kořen je kladný, neboť (při záporném jmenovateli) má záporný čitatel (bez ohledu na znaménko odečítáme kladnou odmocninu, jejíž absolutní hodnota je při větší než absolutní hodnota .) Podmínka (B1) má zde tvar tj. tj. , tj. tj. tj. tj. tj. tj. Podmínka (B2) má zde tvar tj. Tj . tj. tj. tj. , tj. tj. . □ . Dohromady to pro vztahy obou parametrů znamená tyto podmínky: ( * ) ( ** ) a současně Protože je , musí být pravá strana ( * ) menší než 1, z čehož plyne Protože je , musí být levá strana ( * ) větší než -1, z čehož plyne Řešením je tedy oblast tvořící trojúhelník s body A=[ -1,0 ] , B=[ 1,0 ] a C= [ 0, -1 ] Pokud je , pak podmínka představuje skutečné omezení. Znaménko prvního kořene závisí na znaménku : Pokud , pak je čitatel záporný (kladný obsah odmocniny je v absolutní hodnotě menší než ), kořen je záporný Pokud pak je čitatel zřejmě kladný (kladné jsou oba sčítance součtu), kořen je kladný Znaménko druhého kořene rovněž závisí na znaménku : Pokud pak je čitatel záporný (jmenovatel kladný), kořen je tedy záporný Pokud pak je čitatel kladný (jmenovatel kladný), kořen je tedy kladný. Pokud je tedy , pak jsou oba kořeny záporné a musí platit současně: Dále jen pokud je ,tj. , jinak první nerovnost nemůže platit nikdy Potenciálním řešením je množina při podmínkách , Pokud je naopak , pak jsou oba kořeny kladné a musí platit současně: Potenciálním řešením je množina při podmínkách , Všem vyžadovaným restrikcím vyhovující řešení ale nemůže existovat, protože vzhledem k podmínkám nemůže platit b) Jsou-li kořeny komplexně sdružené pak musí být splněny podmínky (A*) , tedy tj. a současně Platí-li , není podmínka (A*) splněna nikdy (a tedy kořeny komplexně sdružené být nemohou) Pro případné komplexně sdružené kořeny tedy musí platit . Podmínka představuje zde relevantní omezení. Kořeny mají tedy tvar Absolutní hodnoty obou komplexně sdružených kořenů spočteme jako Podmínka představující požadavek, aby oba ležely vně jednotkového kruhu, je dána nerovností ,neboli při kladném tj. tj. tj. . Takže obor komplexně sdružených kořenů je dán oborem kladných parametrů splňujících složené podmínky . Omezení vyplývající z toho (aby pravá strana intervalu přípustných hodnot musí být větší než levá) , tedy . Z omezení a plyne, že Řešením je tedy oblast tvořící lichoběžník s body A = [ -1,0 ], B = [ 1,0 ], D = [ 2, 1 ], E = [ -2, 1 ], c) Je-li kořen reálný dvojnásobný, pak musí být diskriminant nulový, tj. , neboli , čili , což mj. implikuje, že V tomto případě je kořen roven , tedy s respektováním podmínky máme . Pokud ,je kořen záporný a podmínka invertibility zní . Odtud máme , neboli , tedy (a k němu příslušný musí být v rozmezí ) Pokud naopak , je kořen kladný a podmínka invertibility zní . Odtud plyne . , tedy (a k němu příslušný musí ležet v rozmezí ) . Je třeba si ale uvědomit, že v těchto případech by byl proces určen vlastně jen jedním parametrem, protože oba jsou pevně svázány vztahem . Autoregresní proces AR [autoregressive process] obecný autoregresní proces řádu se značí má tvar (21) neboli (21A) , kde jsou parametry a je tzv. autoregresní operátor. Proces zřejmě vzniká useknutím lineárního procesu v bodě, který odpovídá velikosti zpoždění . Proces je stacionární, jestliže všechny kořeny polynomu leží vně jednotkového kruhu v komplexní rovině (tj. pro všechna ), protože pak je splněn předpoklad (3). Proces má v tom případě nulovou střední hodnotu a jeho rozptyl je roven (22) . ověření: Definiční vyjádření procesu (21) vynásobíme , a uplatníme střední hodnotu: (23) . Vztah (23) podělíme rozptylem veličiny . Dostaneme: . Zřejmě máme a , takže dostaneme , resp. a po vynásobení obou stran strany rozptylem , z čehož plyne (22). □ . a jeho autokorelační funkce splňuje diferenční rovnici (24) pro . Poznámka Pro odvození (24) stačí vynásobit všechny členy rovnosti (21) výrazem a přejít ke středním hodnotám, přičemž vzhledem k možnosti vyjádření stacionárního procesu jako lineárního procesu (1), je pro : (21) a dále , takže Neboli □ . Z teorie diferenčních rovnic přitom plyne, že její řešení (24) lze vyjádřit ve tvaru (25) pro , kde jsou navzájem různé kořeny polynomu s vlastnostmi a jsou pevné koeficienty: a) Pokud jsou kořeny komplexně sdružené, pak mohou být nahrazeny jediným členem tvaru s . b) Pokud kořeny nejsou navzájem různé, tzn. některý z nich je násobný, pak se pro kořen s násobností r ve vyjádření objeví složitější člen typu , který je však výrazně překrýván průběhem členu . Tak či onak, je autokorelační funkce procesu v podstatě lineární kombinací klesajících geometrických posloupností a sinusoid různých frekvencí s geometricky klesajícími amplitudami. soustava Yule-Walkerových rovnic Jestliže zapíšeme výraz (23) jen pro , pak dostaneme tzv. soustavu Yuleových-Walkerových rovnic pro vyjádření parametrů pomocí autokorelací (a naopak). (26) ………………………………………. . Soustava Yuleových-Walkerových rovnic umožňuje vypočíst hodnoty autokorelační funkce na základě znalosti parametrů autoregresního procesu obecně p-tého řádu jako řešení soustavy p lineárních rovnic o p neznámých . Parciální autokorelační funkce procesu má bod useknutí rovný řádu modelu . To plyne přímo z definice parciální autokorelační funkce, což činí z této funkce důležitý nástroj pro identifikaci autoregresních procesů. Proces je vždy invertibilní. Je to zřejmé, neboť (23) je již zápis tohoto modelu v invertovaném tvaru. Proces - autoregresní proces 1. řádu (27) je stacionární při V tomto případě má nulovou střední hodnotu a rozptyl procesu je roven (28) . Jeho autokorelační funkce má tvar (29) pro ve tvaru geometricky klesající posloupnosti (oscilující pro záporné a bez bodu useknutí). Speciálně je pro (30) , což znamená, že * první autokorelace procesu se rovná právě jeho autoregresnímu parametru. Proto důležitou roli v modelu hraje znaménko parametru . a) Pokud platí (pozitivní autokorelovanost), pak je patrná setrvačnost ve znaménkách sousedních hodnot (s relativně malým překřížením časové osy) b) Pokud platí (negativní autokorelovanost), pak to signalizuje relativně velmi časté přechody hodnot přes časovou osu, a velmi časté změny ve znaménkách sousedních hodnot časové řady. Parciální autokorelační funkce procesu má tvar (31) , pro s bodem useknutí . AR(1)-polynom má tvar , tedy , po anulování , jediný reálný kořen AR (1)-polynomu je tedy roven . ( může být i záporné, byť je to neobvyklé). Má-li kořen tohoto polynomu (pro stacionaritu) ležet vně jednotkového kruhu, musí platit (R1) nebo (R2) Podmínka (R1) může být splněna jen při záporném a při splnění Podmínka (R2) může být splněna jen při kladném a při splnění . Obě eventuality pokrývá souhrnná podmínka . Proces - autoregresní proces 2.řádu (32) je stacionární pro (32A) , , takže příslušná oblast stacionarity v rovině s vodorovnou osou pro hodnoty a svislou osou pro hodnoty vyplní vnitřek trojúhelníka s vrcholy , a . V tom případě má proces nulovou střední hodnotu a rozptyl roven (33) . a jeho autokorelační funkce má tvar pro , kde * , jsou navzájem různé kořeny polynomu ( ; pro dvojnásobný kořen je tvar funkce analogický), nemá bod useknutí a má tvar lineární kombinace dvou geometricky klesajících posloupností nebo tvar sinusoidy s geometricky klesající amplitudou. Parciální autokorelační funkce procesu má bod useknutí roven . AR(2)-polynom má tvar , tedy , po anulování neboli . Kořeny AR (2)-polynomu získáme jako řešení této kvadratické rovnice s podmínkou (pro reálný i komplexní případ). Řešení (obecně komplexní) příslušné kvadratické rovnice je . a) Jsou-li kořeny reálné, různé, pak musí být splněny podmínky (A) , tedy a zároveň (B) , tedy (B1) a současně také (B2) Pokud je , pak je podmínka (A) splněna vždy a neznamená reálné omezení. První kořen je kladný, protože (při kladném jmenovateli) má kladný čitatel. Podmínka stacionarity je tedy: neboli tj. Druhý kořen je záporný, neboť (při kladném jmenovateli) má záporný čitatel (bez ohledu na znaménko odčítáme odmocninu, jejíž abs.hodnota je při větší než abs.hodnota .) Podmínka stacionarity je tedy: neboli tj. Takže v tomto případě musejí parametry splňovat nerovnosti . Útvarem, který tato omezení pokrývá, je trojúhelník tvořený body A=[ -1,0 ] , B=[ 1,0 ] a C= [ 0, 1 ] Pokud je , pak podmínka (A) představuje reálné omezení neboli . Tento útvar je vymezen plochou ležící mezi (nad) parabolou a osou Znaménko prvního kořene závisí ale na znaménku parametru , přičemž absolutní hodnota výrazu v odmocnině je vždy menší než absolutní hodnota : Jestliže uvažujeme (nacházíme se v pravém dolním kvadrantu), - pak kořen je kladný, protože (při záporném jmenovateli) má záporný čitatel . Podmínka stacionarity tedy zní , tj. , tedy ,tedy ,tj. - a kořen je též kladný, protože (při záporném jmenovateli) má i tento záporný čitatel (menší než parametr ) Podmínka stacionarity tedy zní , tj. ,tj. ,tedy , neboli při dostáváme tj. nerovnost přesně opačnou než byla podmínka vyvozená pro kořen . Jestliže uvažujeme naopak (nacházíme se v levém dolním kvadrantu), - pak kořen je záporný, protože (při záporném jmenovateli) má kladný čitatel . Podmínka stacionarity zde tedy zní tj , tedy ,tj. a při - a kořen je také záporný, protože (při záporném jmenovateli) má i tento kladný čitatel (menší než kořen ) Podmínka stacionarity tedy zní tj ,tj. , tedy , neboli při dostáváme tzn. nerovnost přesně opačnou než byla podmínka vyvozená pro kořen . Znamená to tedy, že pokud je nelze ani v případě ani v opačném případě nalézt žádnou dvojici komplexně sdružených kořenů, která by vyhovovala podmínkám kladeným na stacionaritu procesu AR(2). b) Jsou-li kořeny komplexně sdružené pak musí být splněny podmínky (A*) , tedy tj. a současně (B) , tedy (B1) a současně také (B2) Zřejmě (pro komplexně sdružené kořeny) nemůže být , neboť podmínka (A*) by nebyla splněna nikdy Pro případné komplexně sdružené kořeny tedy musí platit . Podmínka představuje zde relevantní omezení. Kořeny mají tedy tvar Absolutní hodnoty obou komplexně sdružených kořenů spočteme jako Podmínka představující požadavek, aby oba ležely vně jednotkového kruhu, je dána nerovností , tj. , tj. , tj. neboli při záporném , tj. . Vyšetřujeme tedy množinu bodů, pro které současně platí tyto tři nerovnosti: , a také splňujících složené podmínky Omezení vyplývající z toho (aby pravá strana intervalu přípustných hodnot byla větší než levá) , odtud , tedy . Z hraniční podmínky pro odtud dále vyplývá omezení pro : tj. Takže obor komplexně sdružených kořenů je zde dán oborem parametrů , kde a kde se navíc může pohybovat jen v rozmezí a v rozmezí . První nerovnost v prvním omezení pak ještě vede k podmínce , která se projeví dvěma lineárními omezeními a . Řešením je tedy oblast tvořící lichoběžník s body A = [ -1,0 ], B = [ 1,0 ], D=[ -2, -1 ], E = [ 2, -1 ], Útvarem, který pokrývá jak oblast dvojice reálných, tak komplexně sdružených kořenů, je trojúhelník tvořený body D=[ -2, -1 ] , B=[ 1,0 ] a E = [ 2, -1 ],] c) By-li by kořen reálný dvojnásobný, pak musí být diskriminant nulový, tj. , neboli , čili , což mj. implikuje, že V tomto případě je kořen roven , tedy s respektováním podmínky máme . Pokud tedy , je kořen kladný a podmínka stacionarity zde zní . Odtud plyne , tedy a k němu příslušný musí ležet v rozmezí Pokud naopak , je kořen záporný a podmínka stacionarity zní . Odtud plyne . , tedy a k němu příslušný musí ležet v rozmezí . Je třeba si ale uvědomit, že v těchto případech by byl proces určen vlastně jen jedním parametrem, protože oba jsou pevně svázány vztahem . Smíšený proces ARMA [autoregressive and moving averages process] Smíšený proces řádu a značený jako má tvar: (41) neboli (41A) , kde operátory a byly zavedeny v procesech a . Podmínka stacionarity (resp. invertibility) smíšeného procesu je shodná s podmínkou procesu (resp. invertibility procesu .) Stacionární proces má nulovou střední hodnotu a jeho autokorelační funkce splňuje diferenční rovnici (42) . pro s řešením (43) pro , kde jsou navzájem různé kořeny polynomu . Autokorelační funkce procesu nemá bod useknutí a je v podstatě lineární kombinací klesajících geometrických posloupností a sinusoid různých frekvencí s geometricky klesajícími amplitudami, ale s výjimkou počátečních hodnot (tato výjimka se uplatní jen v případě ) . Parciální autokorelační funkce procesu nemá bod useknutí a je omezena lineární kombinací klesajících geometrických posloupností a sinusoid různých frekvencí s geometricky klesajícími amplitudami, ale s výjimkou počátečních hodnot (výjimka se uplatní, jen když ). Proces je představován zápisem (44) a je stacionární pro . V tom případě má nulovou střední hodnotu a rozptyl roven (45) . ověření (45): Z definice procesu ve (44) víme, že platí , takže , po roznásobení pak Z nekorelovanosti vůči a vůči dostáváme a (46) Vztah (46) nyní podělíme rozptylem veličiny Dostaneme: a následně, protože a (47) , po úpravě a následně obdržíme shodu s (45) . � . a má autokorelační funkci (48) . (49) . pro bez bodu useknutí ve tvaru klesající geometrické posloupnosti s výjimkou ověření (48): podle (…. ) a (44) máme (50) Výraz v čitateli předchozího zlomku (50) lze rozepsat následovně: Vyjádříme-li jednotlivé členy předchozího devítičlenu, dostaneme: (c1) (c2) protože (c3) protože (c4) v důsledku nekorelovanosti a . (c5) v důsledku nekorelovanosti a . (c6) v důsledku nekorelovanosti a (c7) v důsledku nekorelovanosti a . (c8) (c9) v důsledku nekorelovanosti a Nyní postupně vše nenulové dosadíme do (50) : Dále dosadíme z (45) a konečně máme � . (50) Výraz v čitateli předchozího zlomku (50) lze rozepsat následovně: Při je všech 6 posledních členů rovných nule. První člen je roven Podmínkou invertibility procesu je . Parciální autokorelační funkce procesu je omezena klesající geometrickou posloupností počínaje od . Zobecnění stacionární proces s úrovňovou konstantou Dosud uvedené stacionární procesy se vyznačovaly nulovou střední hodnotou. Jejich zobecnění pro situace, kdy je střední hodnota nenulová (ale zůstává v čase neměnná) není však nijak obtížné: Vezmeme-li Proces klouzavých součtů řádu se střední hodnotou má tvar (51) Smíšený proces se střední hodnotou má tvar (52) neboli (52A) , kde Konstrukce modelů v Boxově-Jenkinsově metodologii Podobně jako v ekonometrii, sestává úplná tvorba modelu v Boxově-Jenkinsově metodologii z následujících třech kroků: (A) identifikace modelu Znamená to např. že pro analyzovanou časovou řadu identifikujeme jí adekvátní model (B) odhad parametrů (kvantifikace) modelu. V rámci modelu se (dejme tomu) jedná o model tvaru při (C) diagnostika modelu. V rámci odhadnutého modelu v (b) je tento model verifikován na hladině významnosti a prověří se jeho verifikační schopnosti. Pokud diagnostické výsledky z kroku (C) nejsou dostatečně přesvědčivé, je potřebné všechny tři kroky zopakovat pro alternativní model (často se ale jedná jen o korekci zamítnutého modelu, ke které nám provedená diagnostika poskytla dílčí návod). (A) - Identifikace modelu Příspěvek autokorelační a parciální autokorelační funkce k identifikaci modelu: Obecnější poznatky o tvaru autokorelační a parciální autokorelační funkce stacionárních a invertibilních procesů , , přináší tabulka: * , * neexistuje neexistuje * ve tvaru U-křivky * ve tvaru U-křivky po prvních q-p hodnotách neexistuje * omezená U-křivkou * omezená U-křivkou po prvních p-q hodnotách Odpovídající identifikační postup pak spočívá v prohlídce grafického záznamu odhadnutého korelogramu a parciálního korelogramu modelované časové řady, kdy se snažíme řadě přiřadit nejvhodnější typ modelu právě pomocí charakteristik z tabulky. V případě pochybností testujeme potenciální bod useknutí pomocí Bartlettovy aproximace s přibližným (asymptotickým) kritickým oborem (nejčastěji na hladině ) pro autokorelační funkci (53) pro některé Druhou možností je aplikovat Quenouilleovu aproximaci s kritickým oborem (na hladině ) pro parciální autokorelační funkci (54) pro některé . Identifikace pomocí informačních kritérií Jde o modernější přístup k identifikaci, který snižuje míru subjektivity posuzování analytika a v jistém smyslu identifikaci automatizuje. K problému identifikace obecného modelu pro danou časovou řadu se zde přistupuje jako k problému odhadu parametrů na základě optimalizačního kritéria (60) , kde je vhodné kritérium, k jehož konstrukci musíme pro danou řadu odhadnout model , přičemž minimalizaci provádíme pro předem zvolenou síť hodnot . Adekvátnější než předchozí postup (60) je však uplatnit některé z kritérií teorie informace, kdy se penalizují zbytečně vysoké řády l a k a často tak docílit u odhadů jejich konzistence. Nejběžnější kritéria založená na tomto principu jsou (A) AKAIKEho informační kritérium [Akaike information criterion 1974] (61) (B)SCHWARTZovo informační kritérium [Schwartz (Bayesian) information criterion 1978] (62) (C) Hannanovo-Quinnovo kritérium [Hannan-Quinn information criterion 1979] (63) (A) modifikované AKAIKEho informační kritérium [Hurwich a Tsai criterion 1989] (64) pro krátké řady, kde je odhadnutý rozptyl bílého šumu procesu a v čitateli druhého členu je počet odhadovaných parametrů (se započtením eventuálně nenulové úrovňové konstanty , přičemž n je délka dané řady). Korektně by ale místo prvních členů v (61), resp. (62) měla být použita minimální hodnota logaritmované věrohodnostní funkce daného modelu vynásobená koeficientem (-2/n). Kritérium BIC sice poskytuje silně konzistentní odhad řádu modelu (který konverguje skoro jistě, tj. s pravděpodobností 1), ale s velkým rozptylem (tj. odhad ale postrádá vydatnost). U kritéria AIC je tomu přesně naopak: příslušný odhad řádu modelu je zde bohužel nekonzistentní, ale je vydatný. Odhad parametrů ARMA modelu V počáteční fázi kvantifikace modelu se postupuje tak, že se využijí existující vztahy mezi parametry daného modelu a jeho autokorelacemi, kdy např. v modelu platí, že . Takovéto odhady odvozené z momentů se však zpravidla považují jen za předběžné a slouží tedy jako počáteční odhady pro vlastní odhadové procedury, prováděné většinou iteračně vhodnou numerickou metodou. model momentové odhady kontrolní nerovnosti pro * , * , , , , kde Dílčí doplnění DM: Jak patrno, momentové odhady vycházejí ze vztahů vyvozených pro teoretické hodnoty mezi parametry a rozptyly , jenže jsou uvažovány „inverzně“: Např. vzorec pro rozptyl bílého šumu u procesu MA (1) je vyvozen z výrazu pro rozptyl procesu MA(1) uplatněného ve vzorci pro autokorelační funkci tohoto procesu. Stejně tak je tomu u procesu MA (2) ,neboť zde . Podobně, vzorec pro rozptyl bílého šumu u procesu AR (1) je vyvozen ze vztahu (28) pro výpočet rozptylu tohoto procesu s uvážením toho, že navíc platí Stejně tak je tomu u procesu AR (2) ,neboť zde . Odhadové procedury pro konstrukci finálních odhadů v uvažovaných modelech jsou vysloveně záležitostí metod nasazených v příslušném software. Např. v modelu zapsanému ve tvaru (21) lze použít klasický OLS-odhad spolu s klasickým OLS-odhadem jeho kovarianční matice, který je za předpokladu stacionarity procesu konzistentní. Lze totiž ukázat, že regresory v (21) splňují podmínku , kde V je regulární matice a stejně tak i podmínku ortogonality . Z vyjádření stacionárního procesu ve tvaru lineárního procesu (1) speciálně plyne, že (63) . V případě stacionárního a invertibilního modelu (vyjádřeného pro jednoduchost s nulovou střední hodnotou) (41) se nejčastěji používají NLLS –odhady realizované pomocí některé z metod Gauss-Newtonovy třídy. Příslušná NLLS –odhadová procedura zde spočívá v minimalizaci součtu čtverců (64) , kde pro s vhodně zvolenými hodnotami . Odhad rozptylu bílého šumu se potom obvykle získá tak, že minimální hodnotu (64) vydělíme délkou řady n. Za předpokladu normality a při dost velkém n jsou odhadové výsledky velmi blízké ML-odhadu (podmíněnému volbou ) získanému maximalizací logaritmované věrohodnostní funkce (65) [3] Tabulka: Přibližné hodnoty směrodatných odchylek odhadnutých parametrů ve vybraných stacionárních a invertibilních modelech Boxovy-Jenkinsovy metodologie: . Diagnostika modelu Diagnostika modelu je v rámci Box-Jenkinsovy metodologie velmi propracovaná. Spočívá v tom, že pomocí různých diagnostických/verifikačních nástrojů ověřujeme adekvátnost sestaveného modelu (tj. prověřujeme, zda je skutečně konformní s analyzovanými daty). Přitom obvykle musíme brát v úvahu několik aspektů: 1. kontrola stacionarity modelu. Především zde kontrolujeme, zda odhadnutý model skutečně splňuje podmínku stacionarity, tj. zda kořeny jeho odhadnutého autoregresního polynomu leží vně jednotkového kruhu v komplexní rovině (resp. zda ekvivalentně jejich převrácené hodnoty, což jsou kořeny autoregresního polynomu zapsaného s opačným uspořádáním mocnin leží uvnitř takovéhoto kruhu). Je také možné řadu rozdělit do několika úseků a testovat shodnost odhadnutých úrovní, rozptylů a autokorelací (popř. momentů vyšších řádů, zejména šikmost mezi jednotlivými úseky). Jiný postup (tzv. impuls response) spočívá v analýze toho, jakou odezvu má v odhadnutém modelu impuls m (většinou standardizovaný na velikost jedno nebo vícenásobek směrodatné odchylky bílého šumu), který nastal v jediném časovém okamžiku nebo opakovaně od daného časového okamžiku a přirozeně určuje následné hodnoty procesu – odhadnutá ARMA struktura se převede do tvaru lineárního procesu (1) a od daného okamžiku se sem dosazuje inovační proces s jedinou nenulovou hodnotu v tomto okamžiku nebo inovační proces se stále stejnými nenulovými hodnotami od tohoto okamžiku. Je-li analyzovaná řada stacionární, měla by s rostoucí časovou vzdáleností od okamžiku impulsů: (1) odezva pro jediný impuls postupně odeznít až na nulovou hodnotu (2) odezva pro opakovaný impuls se stabilizovat na určité (nenulové) úrovni. 2. kontrola struktury ARMA procesu Rozumí se jí především shoda korelační struktury odhadnuté z dat (tj. autokorelační a parciální autokorelační funkce) s korelační strukturou vypočtenou z odhadnutého modelu, který ověřujeme. Jiná kontrola struktury modelu souvisí s testováním nekorelovanosti pro vypočtený bílý šum pomocí Q-testů. (nazývaných také jako portmanteau testy ) 3. grafická prohlídka vypočteného bílého šumu Velmi důležitým diagnostickým nástrojem je vypočtený bílý šum z odhadnutého modelu řady (analogicky jako rezidua v regresním model). Jeho grafický průběh, odhadnutý korelogram apod. mohou indikovat případné vady modelu (ve standardní situaci obvykle očekáváme pro vypočtený bílý šum nulovou hodnotu, konstantní rozptyl, nekorelovanost a normalitu). 4. Testování nekorelovanosti bílého šumu Používá se např. Batlettova aproximace nebo Q-testy. Typy nestacionarity V podstatě lze rozlišit dva základní typy nestacionarity: 1) Deterministická nestacionarita představovaná deterministickým trendem, např.: (71) , kde je bílý šum s rozptylem Po eliminaci tohoto (lineárního) trendu se řada stane stacionární (v daném případě ve formě bílého šumu). 2) Stochastická nestacionarita představovaná určitým typem stochastického procesu pro nebo , např. : (72) , kde je opět bílý šum s rozptylem , kde se obvykle předpokládá, že Nestacionaritu (72) lze v jistých případech modelovat pomocí speciálních stochastických modelů a s využitím těchto modelů následně stacionarizovat. Konkrétně model (72) je tzv. náhodná procházka s driftem [random walk with drift]. Příslušnou časovou řadu lze v tomto případě jednoduše stacionarizovat přechodem k řadě prvních diferencí , protože dle modelu (71) je (73) , tzn. jedná se o bílý šum posunutý na úroveň , což je evidentně stacionární řada. Podstata stochastické nestacionarity modelu (72) je ale lépe viditelná při jeho přepisu do tvaru (74) . Řada má tedy nejen deterministický trend (zde lineární se sklonem ), ale také stochastický trend spočívající v postupné kumulaci hodnot bílého šumu. Interpretačně zajímavé jsou také podmíněné hodnoty: (75) (76) , : ověření: ověření: ověření: Ze vztahu (75) je vidět, že řada má tendenci nevracet se k předchozí úrovni, ale v průměru směřovat k vyšším hodnotám pro nebo k nižším hodnotám pro . I kdyby platilo , pak tato náhodná procházka bez driftu protne na rozdíl od bílého šumu vodorovnou osu s nulovou úrovní jen zřídka. Ze vztahů(76) zase vyplývá, že střední hodnota a rozptyl (volatilita) této řady jsou neomezené, zatímco autokorelační funkce má hodnoty velmi blízké jedné a k nule klesá tempem pomalejším než lineárním. Poznámka 1 Uvažujme poněkud obecnější zápis vztahu (72) (72*) . Je patrné, že (72*) je speciální zápis (72*) při . Je-li ,pak se zřejmě jedná o stacionární proces s nenulovou střední hodnotou (77) . , který lze také přepsat pomocí prvních diferencí jako (78) . Pro podmíněnou střední hodnotu (75) stacionárního procesu tedy zřejmě platí: (79A) , (79B) , tzn. na rozdíl od náhodné procházky s driftem má nyní proces tendenci nedriftovat a vracet se k předchozí úrovni [tzv. mean reverting] . Konečně zbývající případ je již velmi neobvyklý a specifický, minimálně se vyskytující v reálných situacích: v tomto případě se jedná o explozívní proces [tzv. explosive process], který roste s mocninami - např. proces začne být od určitého času t srovnatelný s deterministickou posloupností bez ohledu na tvar bílého šumu . Poznámka 2 Pro předchozí modely ještě jednou odlišnost jejich stacionarizace: V modelu (71) s deterministickým trendem pro dosažení stacionarity stačí pomocí regrese eliminovat trend. Diferencování by se zde pro stacionarizaci nemělo používat, neboť vede k modelům s reziduální složkou ve tvaru (neinvertibilního) MA-procesu (80) V modelu (72) náhodné procházky s driftem stačí pro dosažení stacionarity jednou diferencovat. Pokud jde o případnou regresní eliminaci stochastického trendu, není zde jasné, co vlastně eliminovat. Mohli bychom sice přejít k ještě obecnějšímu rozšíření modelu (77) do tvaru (77*A) . nebo s deterministickým i stochastickým trendem, ale zde by případná eliminace trendu pomocí regrese narazila na již zmíněný problém, že t-poměr nemusí mít (ani asymptoticky) t-rozdělení Model (77*) ze také zapsat ve tvaru , kde , , tzn., že speciálně při se vlastně jedná o stacionární AR(1) proces s lineárním trendem. Testy na jednotkový kořen [unit root tests] Možnost stacionarizace časové řady pomocí diferencování svědčí o přítomnosti (přibližně) jednotkového kořene v autoregresním operátoru příslušného modelu. Např. v modelu (72) má autoregresní operátor zřejmě jako svůj jediný kořen právě kořen rovný 1. Rozhodnutím o přítomnosti takovéhoto jednotkového kořene (nebo vícenásobného) je často klíčovým bodem analýzy. Na přítomnost jednotkového kořene by asi bylo možné soudit z tvaru odhadnutého korelogramu, kdy indikací jeho přítomnosti je velmi pomalý pokles korelogramu od jednotkové hodnoty k nule (jednotlivé odhadnuté autokorelace s rostoucí délkou řady konvergují v nestacionárním modelu k jedné). Protože ale subjektivním pohledem na korelogram by se nedaly odlišit nestacionární modely typu od stacionárních s téměř jednotkovým kořenem , je žádoucí použít vyvinuté statistické testy na příslušné hladině významnosti. Dickey-Fullerův test Dickey-Fullerův test byl prvním z testů vyvinutých pro testování jednotkového kořen. Přitom byly navrženy tři jeho verze označované souhrnně jako -testy. (1) -test tvaru proti alternativě pro , tzn. jednostranný test náhodné procházky proti stacionárnímu procesu, neboť případná nestacionarita při je v realitě málo významná. (2) -test tvaru proti alternativě pro ,tzn. jednostranný test náhodné procházky proti procesu s nenulovou hladinou. (3) -test tvaru proti alternativě pro , tzn. jednostranný test náhodné procházky proti procesu s lineárním trendem. Zápis nulové hypotézy je pro všechny tři vyšetřované případy tentýž, tzn.: (81) při , zatímco obecný zápis alternativy je (82) při , kde a (1) (2) Přitom v případě alternativ (2) nebo (3) jde jen o to, zda a vůbec nás nezajímá případná významnost úrovňové konstanty ani parametru sklonu , tím spíše ne jejich číselné hodnoty, které by při výskytu nestacionarity stejně nemusely být korektně spočteny. Testovou statistikou je ve všech třech variantách Dickey-Fullerova testu klasický t-poměr (prostě se testuje významnost regresního parametru v modelu (81) tzn. , kde odhady parametrů získáme metodami získanými dříve a s kritickým oborem . Zde však (za platnosti nulové hypotézy stacionarity) statistika DF nemá (a to ani asymptoticky a ani při platnosti ) t-rozdělení jako v případě klasického t.-poměru, ale má nestandardní (a nepojmenované) rozdělení, pro které bylo nutné kritické hodnoty naprogramovat simulačně a zvlášť pro jednotlivé typy alternativ (1),(2),(3) a pro různé délky řad n. viz tabulka níže. Obecně zde platí, že dané rozdělené má tlustší konce než příslušné t-rozdělení, takže jeho kritické hodnoty jsou v absolutní hodnotě více než dvojnásobně v porovnání s odpovídajícími hodnotami t-rozdělení. Např. 5% kritická hodnota a při je kritická hodnota -3,41 v absolutní hodnotě více než 2x větší než adekvátní kritická hodnota -1,645 po klasický t-test), tj. pro zamítnutí nulové hypotézy proto potřebujeme významnější hodnotu t-poměru (pracujeme totiž s nestacionárním regresorem). Kritické hodnoty uvedli poprvé již Dickey a Fuller, většina software ale využívá sofistikovanější výpočet odpovídajících p-hodnot podle McKinnona [1996]. hladina významnosti 10%=0,1 5%=0,05 1%=0,01 kritické hodnoty pro -test -1,62 -1,95 -2,58 kritické hodnoty pro -test -2,57 -2,86 -3,43 kritické hodnoty pro -test -3,12 -3,41 -3,96 Rozšířený Dickey-Fullerův test Předchozí test je aplikovatelná jen tehdy, jestliže reziduální složka představuje nezávislý bílý šum. Jestliže závisle proměnná obsahuje autokorelovanost, která není v modelu – řádně zohledněna, potom má DF-test chybu prvního druhu (tj.pravděpodobnost zamítnutí ) větší než deklarované . Pro takový případ byl navržen Rozšířený Dickey-Fullerův test (ADF-test) [augmented DF-test], který místo (81) formuluje nulovou hypotézu jako (83) pro , Přičemž testová statistika a kritické hodnoty pro jednotlivé varianty (1),(2),(3) tj. po -test, -test, -test zůstávají stejné jako před rozšířením (test se opět týká jen parametru , přidané autoregresní členy v jen absorbují dynamickou strukturu obsaženou v závisle proměnné. Pro stanovení řádu p přidaných autoregresních členů se doporučuje aplikovat informační kritéria uvedená výše. Phillipsův-Perronův test PF_test je podobný ADF –testu s tou odlišností, že zohlednění případné neuatokorelovanosti reziduí se neprovádí rozšířením o autoregresní člen jako tam, ale přímo korekcí odhadnuté směrodatné odchylky ve jmenovateli původního DF-testu. V podstatě se jedná o aplikaci Neweyové-Westova odhadu typu HAC (typu heteroskedasticity and autocorrelation consistent estimator), jako v případě autoregresního modelu s autokorelovanými reziduy. KPSS-test [Kwaitkovski, Phillips, Schmidt, Shin [1992] Tento test reaguje na skutečnost, že DF-test někdy mívá slabou rozlišovací schopnost. Má-li teoretický model tvar , pak by nulová hypotéza jednotkového kořene měla být zamítnuta. Nelze-li ji zamítnout, pak to korektně znamená, že buď opravdu platí nestacionarita nebo že máme k zamítnutí jen nepostačující informaci (např. jen krátký úsek řady ). KPSS-test byl proto navržen tak, že hypotézy , mají tvar přesně opačný, než jak je tomu u ADF-testu (jako nulová se testuje stacionarita vůči alternativní hypotéze nestacionarity). Přitom se doporučuje provádět ADF-test a KPSS-test vždy simultánně a za směrodatný brát pouze takový výstup, kdy (a) se zamítá a současně zamítnout nelze (v tom případě je potvrzena stacionarita) (b) nelze zamítnout a současně se zamítá (v tom případě je potvrzena nestacionarita). Zbývající dvě kombinace výsledků se berou jako neprůkazné. Uvedené testy na jednotkový kořen (včetně dalších bývají součástí moderních softwarových testovacích systémů. Proces ARIMA Pro časové řady se stochastickým trendem typu (72) , které lze stacionarizovat diferencováním, jsou v rámci Box-Jenkinsovy metodologie určeny procesy ARIMA. Integrovaný smíšený proces řádu značený jako [integrated] má tvar (84) (84A) je d-tá diference časové řady a tento proces je stacionární (i invertibilní) model . Jiným i slovy: V takovém modelu ARIMA se nejprve provede stacionarizace pomocí vhodné diference modelované řady a takto vzniklá již stacionární řada se modeluje pomocí smíšeného modelu ARMA. Nezřídka se ovšem pro volí souhrnný zápis tvaru (85) Speciálním případem je integrovaný I(d) proces zapisovaný obvykle v jednoduchém tvaru , který vlastně vzniká načítáním bílého šumu /odtud „integrovaný“) např. pro je (86) Poznámka3: Tzv. driftový parametr modeluje případnou nenulovou úroveň procesu tj. deterministický trend ve tvaru polynomu d-tého řádu pro původní řadu . Pro a je model ARIMA pro řadu invariantní vůči případnému posunu řady o libovolnou konstantu. Proto je v tomto případě zbytečné řadu modelovanou jako ARIMA nejprve centrovat odečtením výběrového průměru. Poznámka4: Operátor na levé straně (85) se někdy nazývá zobecněný autoregresní operátor. Je pro něj charakteristické to, že odpovídající polynom má p kořenů ležících vně jednotkového kruhu v komplexní rovině a navíc d-násobný jednotkový kořen. Obecnějším typem jsou modely ARUMA , které mají aspoň jeden z těchto kořenů na jednotkové kružnici , ale různý od jednotkového kořene, a explozivní modely , které mají aspoň jeden z těchto kořenů uvnitř jednotkového kruhu. Konstrukce modelu je založena na tvorbě stacionárního modelu pro příslušně diferencovanou časovou řadu (přitom ale nesmíme opomenout případnou počáteční transformaci řady za účelem její linearizace, která se provádí ještě před diferencováním). Řád diferencování d přitom v realitě obvykle nepřekročí dvojku (rutinní časové řady ekonomického a finančního charakteru obvykle mívají a speciálně řady spotřebitelských indexů či nominálních mezd mohou někdy mít . Možností, jak stanovit řád diferencování d pro analyzovanou řadu, jsou zejména: - testy na jednotkový kořen - subjektivní prohlídka řad , , a jejich odhadnutých korelogramů a parciálních korelogramů – speciálně pomalý (lineární) pokles odhadnutých autokorelací je indikací pro další diferencování řady - porovnání výběrových směrodatných odchylek (volatilit) řad , , - volí se ten řád diferencování, který odpovídá případu s nejmenší volatilitou; při vyšších hodnotách se však volatility mohou začít s navyšováním d d růst a mluví se pak o tzv. prediferencování. - - aplikace informačních kritérií modifikovaných pro modely . ________________________________ [1] Řekneme, že posloupnost náhodných veličin konverguje k náhodné veličině podle středu (je cauchyovská podle středu), jestliže lim , resp. lim . [2] MA proces nemá žádnou přímou souvislost s dříve popsanou metodou klouzavých průměrů užívanou pro eliminaci trendu časové řady. [3] Poznámka výchozí (nelogaritmovaná) věrohodnostní funkce má tvar