Lineární proces [linear process] Teoretickým základem modelů tzv.Boxovy-Jenkinsovy metodologie je lineární proces, který je definován jako (1) , kde je tzv. bílý šum [white noise] [= posloupnost nekorelovaných, stejně rozdělených náhodných veličin s nulovou střední hodnotou a konstantním konečným rozptylem ] a je operátor časového posunu. Dále se předpokládá, že mocninná řada proměnné z konverguje pro (tj. uvnitř a na jednotkovém kruhu v komplexní rovině). Za tohoto předpokladu lze ukázat, že nekonečné řady náhodných veličin (1) pro jednotlivá t konvergují podle kvadratického středu[1], přičemž limitní hodnoty tvoří stacionární posloupnost s nulovou střední hodnotou Jiné vyjádření lineárního procesu (1), které je užitečné např. při konstrukci předpovědí, je možné v případě, že tento proces je invertibilní a lze ho zapsat jako (2) neboli (2A) , Přitom postačující podmínkou invertibility je předpoklad analogický předpokladu (2), že (3) mocninná řada konverguje pro , tj. uvnitř a na jednotkovém kruhu v komplexní rovině. Poznámka1 Existuje řada důvodů, proč modely postavené na principu lineárního procesu jsou vhodné pro modelování reality. Nechť pro stacionární proces s nulovou střední hodnotou předpovídáme hodnotu na základě znalosti minulých hodnot . Optimální předpovědí ve smyslu minimální chyby MSE je pak , přičemž chyba této předpovědi je (4) Má vlastnosti bílého šumu a označuje se jako inovace [innovation]. Označení je vcelku logické, protože inovační proces odpovídá nepredikovatelnému pohybu v hodnotách . Jestliže je navíc proces normálně rozdělen, pak podmíněná střední hodnota má tvar lineární kombinace hodnot a vztah (4) můžeme přepsat jako (5) , což je právě invertovaný tvar (2) lineárního procesu. Poznámka2 Protože platí , musí zřejmě platit (6) (6A) , , atd. Tyto vztahy lze použít pro převod parametrů na parametry a naopak. ormálně lze také uplatnit zápis (7) . Proces klouzavých součtů MA [moving average process][2] Proces klouzavých součtů řádu se značí má tvar (11) kde jsou parametry a (11B) je tzv. operátor klouzavých součtů. Proces tedy zřejmě vzniká useknutím lineárního procesu (1) v bodě, který odpovídá zpoždění . Proces je vždy slabě stacionární,protože: a) má nulovou střední hodnotu b) konstantní rozptyl (nezávislý na t) o velikosti (12) a c) má autokorelační funkcí (nezávislou na t) ve tvaru (13) pro * pro ověření (11): uplatněním operátoru E na (11) dostaneme vzhledem k nulové střední hodnotě všech členů bílého šumu , ověření (12): podle (11) máme vzhledem k nekorelovanosti a homoskedasticitě , ověření (13): vyjdeme z definice (13) a současně využijeme již dokázané (12) protože všechny ostatní kovariance jsou vzhledem k nekorelovanosti členů nulové. ’ . Autokorelační funkce má tedy bod useknutí roven řádu modelu . ověření: bude doplněno dodatečně Parciální autokorelační funkce procesu nemá bod useknutí, ale je omezena lineární kombinací geometricky klesajících posloupností a sinusoid s geometricky klesajícími amplitudami. Proces je invertibilní, jestliže všechny kořeny polynomu leží vně jednotkového kruhu v komplexní rovině (tj. , neboť potom je splněn předpoklad (3). Proces - proces klouzavých součtů 1. řádu (14) má autokorelační funkci , pro s bodem useknutí . ověření: vyjdeme z definice (6) a vypočítáme protože ze čtyř členů v čitateli je jen jeden nenulový a dále platí ( Při odvozování respektujeme pravidlo nekorelovanosti náhodných složek pro . ) protože při se ve jmenovateli neobjeví žádné dvě složky se stejným indexem. □ . Jeho parciální autokorelační funkce má tvar (bez bodu useknutí): (15) pro ověření: bude doplněno dodatečně Takže je v případě invertibility procesu opravdu neomezená geometricky klesající posloupnost (16) Podmínka invertibility zde má totiž velmi jednoduchý tvar . Protože , musí pro invertibilní proces platit . Tato nerovnost platí dokonce pro všechna . ověření: protože , pro libovolné , platí pro všechna . Proces je invertibilní, pokud (zde jen reálný) kořen polynomu leží vně jednotkového kruhu v komplexní rovině (tj. ) Tento (jediný, reálný) kořen je v tomto případě roven a má-li platit , musí být , tedy . Je-li , pak a jelikož musí platit Je-li , pak a jelikož musí platit Proces - proces klouzavých součtů 2. řádu (17) má autokorelační funkci (18) s bodem useknutí . ověření: . protože při se ve jmenovateli neobjeví žádné dvě složky se stejným indexem. Při odvozování respektujeme pravidlo nekorelovanosti náhodných složek pro . □ . Podmínka invertibility (2) má pro proces tvar (19) , , takže oblast invertibility procesu v rovině s vodorovnou osou pro hodnoty a se svislou osou pro hodnoty vyplní vnitřek trojúhelníka s vrcholy , a . ověření: bude dokončeno později Proces je invertibilní, jestliže oba kořeny polynomu leží vně jednotkového kruhu v komplexní rovině, tj. (17) , tzn. a . A) Pokud je kořen dvojnásobný reálný, pak neboli , odtud , tedy pro kladné resp. pro záporné. 1. podmínka je nesplnitelná, takže zbývá druhá: . Pak B) Pokud jsou kořeny reálné různé, pak neboli , odtud: má tedy platit , tzn. obsah odmocn.kladný B1 a též , tj. obsah odmocn.kladný. B2 Z B1 máme , tzn. tj. : Z B2 máme , tzn. tj. : BA) Jestliže ,pak a spolu s podmínkou různých reálných kořenů dostaneme ............................. možných řešení). BB) Jestliže ,pak a spolu s podmínkou dostaneme množinu řešení jako C) Pokud jsou kořeny komplexně sdružené, pak neboli , odtud: má tedy platit , kde bude dokončeno později Autoregresní proces AR [autoregressive process] Autoregresní proces řádu se značí má tvar (21) neboli (21A) , kde jsou parametry a (21B) je tzv. autoregresní operátor. Poznámka: Všimněme si, že tvar autoregresního operátoru (21B) je odlišný od operátoru klouzavých součtů (11B) Proces zřejmě vzniká useknutím lineárního procesu v bodě, který odpovídá velikosti zpoždění . Proces je stacionární, jestliže všechny kořeny polynomu leží vně jednotkového kruhu v komplexní rovině (tj. pro všechna ), protože pak je splněn předpoklad (3). Proces má v tom případě nulovou střední hodnotu a jeho rozptyl je roven (22) . ověření: Definiční vyjádření procesu (21) vynásobíme , a uplatníme střední hodnotu: (23) . Vztah (23) podělíme rozptylem veličiny . Dostaneme: . Zřejmě máme a , takže dostaneme , resp. , a po vynásobení obou stran strany rozptylem , z čehož plyne (22) . □ . a jeho autokorelační funkce splňuje diferenční rovnici (24) pro . Poznámka Pro odvození (24) stačí vynásobit všechny členy rovnosti (21) výrazem a přejít ke středním hodnotám, přičemž vzhledem k možnosti vyjádření stacionárního procesu jako lineárního procesu (1), je pro : (21) a dále , takže Neboli □ . Z teorie diferenčních rovnic přitom plyne, že její řešení (24) lze vyjádřit ve tvaru (25) pro , kde jsou navzájem různé kořeny polynomu s vlastnostmi a jsou pevné koeficienty: a) Pokud jsou kořeny komplexně sdružené, pak mohou být nahrazeny jediným členem tvaru s . b) Pokud kořeny nejsou navzájem různé, tzn. některý z nich je násobný, pak se pro kořen s násobností r ve vyjádření objeví složitější člen typu , který je však výrazně překrýván průběhem členu . Tak či onak, je autokorelační funkce procesu v podstatě lineární kombinací klesajících geometrických posloupností a sinusoid různých frekvencí s geometricky klesajícími amplitudami. soustava Yule-Walkerových rovnic Jestliže zapíšeme výraz (24) jen pro , pak dostaneme tzv. soustavu Yuleových-Walkerových rovnic pro vyjádření parametrů pomocí autokorelací (a naopak). (26) ………………………………………. . Parciální autokorelační funkce procesu má bod useknutí rovný řádu modelu . To plyne přímo z definice parciální autokorelační funkce, což činí z této funkce důležitý nástroj pro identifikaci autoregresních procesů. Proces je vždy invertibilní. Je to zřejmé, neboť (21) je již zápis tohoto modelu v invertovaném tvaru. Proces - autoregresní proces 1. řádu (27) je stacionární pro V tomto případě má nulovou střední hodnotu a rozptyl procesu je roven (28) . ověření: V definičním vyjádření procesu (27) vynásobíme obě strany : . Následně uplatníme střední hodnotu: a podělíme rozptylem veličiny . Dostaneme: . Nyní máme a , takže dostaneme , tedy , a po , z čehož plyne (28) , protože dále vzhledem k nekorelovanosti členů a v (27) . □ . Autokorelační funkce -procesu má tvar (29) pro ve tvaru geometricky klesající posloupnosti (oscilující pro záporné a bez bodu useknutí) . Speciálně je pro (30) , což znamená, že * první autokorelace procesu se rovná právě jeho autoregresnímu parametru. Proto důležitou roli v modelu hraje znaménko parametru . a) Pokud platí (pozitivní autokorelovanost), pak je patrná setrvačnost ve znaménkách sousedních hodnot (s relativně malým překřížením časové osy) b) Pokud platí (negativní autokorelovanost), pak to signalizuje relativně velmi časté přechody hodnot přes časovou osu, a velmi časté změny ve znaménkách sousedních hodnot časové řady. Parciální autokorelační funkce procesu má tvar (31) , pro s bodem useknutí . ověření: bude doplněno dodatečně Proces - autoregresní proces 2.řádu (32) je stacionární pro (32A) , , takže příslušná oblast stacionarity v rovině s vodorovnou osou pro hodnoty a svislou osou pro hodnoty vyplní vnitřek trojúhelníka v vrcholy s vodorovnou osou pro hodnoty a se svislou osou pro hodnoty vyplní vnitřek trojúhelníka s vrcholy , a . V tom případě má proces nulovou střední hodnotu a rozptyl roven (33) . a jeho autokorelační funkce má tvar pro , kde * , jsou navzájem různé kořeny polynomu ( ; pro dvojnásobný kořen je tvar funkce analogický), nemá bod useknutí a má tvar lineární kombinace dvou geometricky klesajících posloupností nebo tvar sinusoidy s geometricky klesající amplitudou. Parciální autokorelační funkce procesu má bod useknutí roven . ověření (33): V definičním vyjádření procesu (32) vynásobíme obě strany : . Na obě strany uplatníme střední hodnotu: a podělíme je rozptylem veličiny . Dostaneme: . Jelikož máme , , takže dostaneme a následně , a po , z čehož již plyne (33) □ . Smíšený proces ARMA [autoregressive and moving averages process] Smíšený proces řádu a značený jako má tvar: (41) neboli (41A) , kde operátory a byly zavedeny v procesech a . Podmínka stacionarity (resp. invertibility) smíšeného procesu je shodná s podmínkou procesu (resp. invertibility procesu .) Stacionární proces má nulovou střední hodnotu a jeho autokorelační funkce splňuje diferenční rovnici (42) . pro s řešením (43) pro , kde jsou navzájem různé kořeny polynomu . Autokorelační funkce procesu nemá bod useknutí a je v podstatě lineární kombinací klesajících geometrických posloupností a sinusoid různých frekvencí s geometricky klesajícími amplitudami, ale s výjimkou počátečních hodnot (tato výjimka se uplatní jen v případě ) . Parciální autokorelační funkce procesu nemá bod useknutí a je omezena lineární kombinací klesajících geometrických posloupností a sinusoid různých frekvencí s geometricky klesajícími amplitudami, ale s výjimkou počátečních hodnot (výjimka se uplatní, jen když ). Proces je představován zápisem (44) a je stacionární pro . V tom případě má nulovou střední hodnotu a rozptyl roven (45) . ověření: Z definice procesu ve (44) víme, že platí , takže , po roznásobení pak máme Vzhledem k nekorelovanosti hodnot bílého šumu v časech t,t-1 máme Podobně je zřejmé, že , protože z (44) plyne, že hodnoty nemohou záviset na aktuálních bílého šumu (závisí jen na jeho minulé a předminulé hodnotě.) Po obou těchto zjednodušeních máme tedy (46) Vztah (46) podělíme rozptylem veličiny . Dostaneme : Vzhledem ke stacionaritě máme a rovněž z relace (44) zapsané o 1 období dříve tzn. vyplývá, že . Máme tedy a po vynásobení : (47) Vydělením obou stran (47) výrazem obdržíme shodu s (45) . � . Proces má autokorelační funkci ve tvaru (48) . (48A) . pro bez bodu useknutí ve tvaru klesající geometrické posloupnosti s výjimkou Podmínkou invertibility procesu je . ověření: podle (6) a (44) máme Výraz ve čitateli předchozího zlomku lze rozepsat následovně: (49) Vyjádříme-li jednotlivé členy předchozího devítičlenu (49), dostaneme: (49A) (49B) (49C) (49D) nekorelovanost s dřívějšími hodnotami (49E) nekorelovanost hodnot bílého šumu (49F) nekorelovanost hodnot bílého šumu (49G) nekorelovanost s dřívějšími hodnotami (49H) stacionarita procesu v čase (49J) nekorelovanost hodnot bílého šumu Souhrnně tedy dostaneme pro : (48) . Parciální autokorelační funkce procesu je omezena klesající geometrickou posloupností počínaje od . Zobecnění: stacionární proces s úrovňovou konstantou Dosud uvedené stacionární procesy se vyznačovaly nulovou střední hodnotou. Jejich zobecnění pro situace, kdy je střední hodnota nenulová (ale zůstává v čase neměnná) není však nijak obtížné: Vezmeme-li Proces klouzavých součtů řádu se střední hodnotou má tvar (51) Smíšený proces se střední hodnotou má tvar (52) neboli (52A) , kde Konstrukce modelů v Boxově-Jenkinsově metodologii Podobně jako v ekonometrii, sestává úplná t vorba modelu v Boxově-Jenkinsově metodologii z následujících třech kroků: (A) identifikace modelu Znamená to např. že pro analyzovanou časovou řadu identifikujeme jí adekvátní model . (B) odhad parametrů (kvantifikace) modelu. V rámci modelu se (dejme tomu) jedná o model tvaru při (C) diagnostika modelu. V rámci odhadnutého modelu v (b) je tento model verifikován na hladině významnosti a prověří se jeho verifikační schopnosti. Pokud diagnostické výsledky z kroku (C) nejsou dostatečně přesvědčivé, je potřebné všechny tři kroky zopakovat pro alternativní model (často se ale jedná jen o korekci zamítnutého modelu, ke které nám provedená diagnostika poskytla dílčí návod). (A) - Identifikace modelu Příspěvek autokorelační a parciální autokorelační funkce k identifikaci modelu: Obecnější poznatky o tvaru autokorelační a parciální autokorelační funkce stacionárních a invertibilních procesů , , přináší tabulka: * , * neexistuje neexistuje * ve tvaru U-křivky * ve tvaru U-křivky po prvních q-p hodnotách neexistuje * omezená U-křivkou * omezená U-křivkou po prvních p-q hodnotách Odpovídající identifikační postup pak spočívá v prohlídce grafického záznamu odhadnutého korelogramu a parciálního korelogramu modelované časové řady, kdy se snažíme řadě přiřadit nejvhodnější typ modelu právě pomocí charakteristik z tabulky. V případě pochybností testujeme potenciální bod useknutí pomocí Bartlettovy aproximace s přibližným (asymptotickým) kritickým oborem (nejčastěji na hladině ) pro autokorelační funkci (53) pro některé Druhou možností je aplikovat Quenouilleovu aproximaci s kritickým oborem (na hladině ) pro parciální autokorelační funkci (54) pro některé . Identifikace pomocí informačních kritérií Jde o modernější přístup k identifikaci, který snižuje míru subjektivity posuzování analytika a v jistém smyslu identifikaci automatizuje. K problému identifikace obecného modelu pro danou časovou řadu se zde přistupuje jako k problému odhadu parametrů na základě optimalizačního kritéria (60) , kde je vhodné kritérium, k jehož konstrukci musíme pro danou řadu odhadnout model , přičemž minimalizaci provádíme pro předem zvolenou síť hodnot . Adekvátnější než předchozí postup (60) je však uplatnit některé z kritérií teorie informace, kdy se penalizují zbytečně vysoké řády l a k a často tak docílit u odhadů jejich konzistence. Nejběžnější kritéria založená na tomto principu jsou (A) AKAIKEho informační kritérium [Akaike information criterion] (61) (B) SCHWARTZovo informační kritérium[Schwartz (Bayesian) information criterion] (62) , kde je odhadnutý rozptyl bílého šumu procesu a v čitateli druhého členu je počet odhadovaných parametrů (se započtením eventuálně nenulové úrovňové konstanty , přičemž n je délka dané řady). Korektně by ale místo prvních členů v (61), resp. (62) měla být použita minimální hodnota logaritmované věrohodnostní funkce daného modelu vynásobená koeficientem (-2/n). (C) Hannanovo-Quinnovo kritérium [Hannan-Quinn information criterion 1979] (63*) (A) modifikované AKAIKEho informační kritérium [Hurwich a Tsai criterion 1989] (64*) pro krátké řady, kde Kritérium BIC sice poskytuje silně konzistentní odhad řádu modelu (který konverguje skoro jistě, tj. s pravděpodobností 1), ale s velkým rozptylem (tj. odhad ale postrádá vydatnost). U kritéria AIC je tomu přesně naopak: příslušný odhad řádu modelu je zde bohužel nekonzistentní, ale je vydatný. Informační kritéria jsou složena ze dvou členů a jsou konstruována tak, že první z těchto členů upřednostňuje složité modely (s vysokými k,l ), neboť zde příslušný odhadnutý rozptyl bílého šumu se zvětšujícími se k,l klesá, zatímco druhý člen upřednostňuje jednoduché modely, protože výraz se zvětšujícími se k,l roste. Kritéria zohledňují protichůdné tendence vývoje obou členů, přičemž výsledná volba je založena na minimalizaci součtu z obou z nich. Odhad parametrů ARMA modelu V počáteční fázi kvantifikace modelu se postupuje tak, že se využijí existující vztahy mezi parametry daného modelu a jeho autokorelacemi, kdy např. v modelu platí, že . Takovéto odhady odvozené z momentů se však zpravidla považují jen za předběžné a slouží tedy jako počáteční odhady pro vlastní odhadové procedury, prováděné většinou iteračně vhodnou numerickou metodou. model momentové odhady kontrolní nerovnosti pro * , * , , , , kde Odhadové procedury pro konstrukci finálních odhadů v uvažovaných modelech jsou vysloveně záležitostí metod nasazených v příslušném software. Např. v modelu zapsanému ve tvaru (21) lze použít klasický OLS-odhad spolu s klasickým OLS-odhadem jeho kovarianční matice, který je za předpokladu stacionarity procesu konzistentní. Lze totiž ukázat, že regresory v (21) splňují podmínku , kde V je regulární matice a stejně tak i podmínku ortogonality . Z vyjádření stacionárního procesu ve tvaru lineárního procesu (1) speciálně plyne, že (63) . V případě stacionárního a invertibilního modelu (vyjádřeného pro jednoduchost s nulovou střední hodnotou) (41) se nejčastěji používají NLLS –odhady realizované pomocí některé z metod Gauss-Newtonovy třídy. Příslušná NLLS –odhadová procedura zde spočívá v minimalizaci součtu čtverců (64) , kde pro s vhodně zvolenými hodnotami . Odhad rozptylu bílého šumu se potom obvykle získá tak, že minimální hodnotu (64) vydělíme délkou řady n. Za předpokladu normality a při dost velkém n jsou odhadové výsledky velmi blízké ML-odhadu (podmíněnému volbou ) získanému maximalizací logaritmované věrohodnostní funkce (65) [3] Tabulka: Přibližné hodnoty směrodatných odchylek odhadnutých parametrů ve vybraných stacionárních a invertibilních modelech Boxovy-Jenkinsovy metodologie: . Diagnostika modelu Diagnostika modelu je v rámci Box-Jenkinsovy metodologie velmi propracovaná. Spočívá v tom, že pomocí různých diagnostických/verifikačních nástrojů ověřujeme adekvátnost sestaveného modelu (tj. prověřujeme, zda je skutečně konformní s analyzovanými daty). Přitom obvykle musíme brát v úvahu několik aspektů: 1. kontrola stacionarity modelu. Především zde kontrolujeme, zda odhadnutý model skutečně splňuje podmínku stacionarity, tj. zda kořeny jeho odhadnutého autoregresního polynomu leží vně jednotkového kruhu v komplexní rovině (resp. zda ekvivalentně jejich převrácené hodnoty, což jsou kořeny autoregresního polynomu zapsaného s opačným uspořádáním mocnin leží uvnitř takovéhoto kruhu). Je také možné řadu rozdělit do několika úseků a testovat shodnost odhadnutých úrovní, rozptylů a autokorelací (popř. momentů vyšších řádů, zejména šikmost mezi jednotlivými úseky). Jiný postup (tzv. impuls response) spočívá v analýze toho, jakou odezvu má v odhadnutém modelu impuls m (většinou standardizovaný na velikost jedno nebo vícenásobek směrodatné odchylky bílého šumu), který nastal v jediném časovém okamžiku nebo opakovaně od daného časového okamžiku a přirozeně určuje následné hodnoty procesu – odhadnutá ARMA struktura se převede do tvaru lineárního procesu (1) a od daného okamžiku se sem dosazuje inovační proces s jedinou nenulovou hodnotu v tomto okamžiku nebo inovační proces se stále stejnými nenulovými hodnotami od tohoto okamžiku. Je-li analyzovaná řada stacionární, měla by s rostoucí časovou vzdáleností od okamžiku impulsů: (1) odezva pro jediný impuls postupně odeznít až na nulovou hodnotu (2) odezva pro opakovaný impuls se stabilizovat na určité (nenulové) úrovni. 2. kontrola struktury ARMA procesu Rozumí se jí především shoda korelační struktury odhadnuté z dat (tj. autokorelační a parciální autokorelační funkce) s korelační strukturou vypočtenou z odhadnutého modelu, který ověřujeme. Jiná kontrola struktury modelu souvisí s testováním nekorelovanosti pro vypočtený bílý šum pomocí Q-testů. (nazývaných také jako portmanteau testy ) 3. grafická prohlídka vypočteného bílého šumu Velmi důležitým diagnostickým nástrojem je vypočtený bílý šum z odhadnutého modelu řady (analogicky jako rezidua v regresním model). Jeho grafický průběh, odhadnutý korelogram apod. mohou indikovat případné vady modelu (ve standardní situaci obvykle očekáváme pro vypočtený bílý šum nulovou hodnotu, konstantní rozptyl, nekorelovanost a normalitu). 4. Testování nekorelovanosti bílého šumu Používá se např. Bartlettova aproximace nebo Q-testy. Typy nestacionarity V podstatě lze rozlišit dva základní typy nestacionarity: 1) Deterministická nestacionarita představovaná deterministickým trendem, např.: (71) , kde je bílý šum s rozptylem Po eliminaci tohoto (lineárního) trendu se řada stane stacionární (v daném případě ve formě bílého šumu). 2) Stochastická nestacionarita představovaná určitým typem stochastického procesu pro nebo , např. : (72) , kde je opět bílý šum s rozptylem , kde se obvykle předpokládá, že Tuto nestacionaritu lze v jistých případech modelovat pomocí speciálních stochastických modelů a s využitím těchto modelů pak následně stacionarizovat. Konkrétně model (72) je tzv. náhodná procházka s driftem [random walk with drift]. Příslušnou časovou řadu lze v tomto případě jednoduše stacionarizovat přechodem k řadě prvních diferencí , protože dle modelu (71) je (73) , tzn. jedná se o bílý šum posunutý na úroveň , což je evidentně stacionární řada. Podstata stochastické nestacionarity modelu (72) je ale lépe viditelná při jeho přepisu do tvaru (74) . Při opakovaném dosazování do (72) totiž dostáváme: atd. Řada má tedy nejen deterministický trend (zde lineární se sklonem ), ale také stochastický trend spočívající v postupné kumulaci hodnot bílého šumu. Interpretačně zajímavé jsou také podmíněné hodnoty: (75) (76) , ověření (75): ověření (76): Ze vztahu (75) je vidět, že řada má tendenci nevracet se k předchozí úrovni, ale v průměru směřovat k vyšším hodnotám pro nebo k nižším hodnotám pro . I kdyby platilo , pak tato náhodná procházka bez driftu protne na rozdíl od bílého šumu vodorovnou osu s nulovou úrovní jen zřídka. Ze vztahů (76) zase vyplývá, že střední hodnota a rozptyl (volatilita) této řady jsou neomezené, zatímco autokorelační funkce má hodnoty velmi blízké jedné a k nule klesá tempem pomalejším než lineárním. Poznámka 1 Uvažujme poněkud obecnější zápis vztahu (72) (72*) . Je patrné, že (72) je speciální zápis (72*) při . Je-li ,pak se zřejmě jedná o stacionární proces s nenulovou střední hodnotou (77) . , který lze také přepsat pomocí prvních diferencí jako (78) . Pro podmíněnou střední hodnotu (75) stacionárního procesu tedy zřejmě platí: (79A) , (79B) , tzn. na rozdíl od náhodné procházky s driftem má nyní proces tendenci nedriftovat a vracet se k předchozí úrovni [tzv. mean reverting]. Konečně zbývající případ je již velmi neobvyklý a specifický, minimálně se vyskytující v reálných situacích: v tomto případě se jedná o explozívní proces [tzv. explosive process], který roste s mocninami - např. proces začne být od určitého času t srovnatelný s deterministickou posloupností bez ohledu na tvar bílého šumu . Poznámka 2 Pro předchozí modely ještě jednou odlišnost jejich stacionarizace: V modelu (71) s deterministickým trendem pro dosažení stacionarity stačí pomocí regrese eliminovat trend. Diferencování by se zde pro stacionarizaci nemělo používat, neboť vede k modelům s reziduální složkou ve tvaru (neinvertibilního) MA-procesu (80) V modelu (72) náhodné procházky s driftem stačí pro dosažení stacionarity jednou diferencovat. Pokud jde o případnou regresní eliminaci stochastického trendu, není zde jasné, co vlastně eliminovat. Mohli bychom sice přejít k ještě obecnějšímu rozšíření modelu (77) do tvaru (77*) . nebo s deterministickým i stochastickým trendem, ale zde by případná eliminace trendu pomocí regrese narazila na již zmíněný problém, že t-poměr nemusí mít (ani asymptoticky) t-rozdělení. Model (77*) lze také zapsat ve tvaru , kde , , tzn., že speciálně při se vlastně jedná o stacionární AR(1) proces s lineárním trendem. Testy na jednotkový kořen [unit root tests] Možnost stacionarizace časové řady pomocí diferencování svědčí o přítomnosti (přibližně) jednotkového kořene v autoregresním operátoru příslušného modelu. Např. v modelu (72) má autoregresní operátor zřejmě jako svůj jediný kořen právě kořen rovný 1. Rozhodnutí o přítomnosti takovéhoto jednotkového kořene (nebo vícenásobného jednotkového kořene) je často klíčovým bodem analýzy. Na přítomnost jednotkového kořene by asi bylo možné soudit z tvaru odhadnutého korelogramu, kdy indikací jeho přítomnosti je velmi pomalý pokles korelogramu od jednotkové hodnoty k nule (jednotlivé odhadnuté autokorelace s rostoucí délkou řady konvergují v nestacionárním modelu k jedné). Protože ale subjektivním pohledem na korelogram by se nedaly odlišit nestacionární modely typu od stacionárních s téměř jednotkovým kořenem , je žádoucí použít vyvinuté statistické testy na příslušné hladině významnosti. Dickey-Fullerův test Dickey-Fullerův test byl prvním z testů mezi testy na jednotkový kořen. Přitom byly navrženy tři jeho verze označované souhrnně jako -testy. (1) -test tvaru proti alternativě pro , tzn. jednostranný test náhodné procházky proti stacionárnímu procesu, neboť případná nestacionarita při je v realitě málo významná. (2) -test tvaru proti alternativě pro ,tzn. jednostranný test náhodné procházky proti procesu s nenulovou hladinou. (3) -test tvaru proti alternativě pro , tzn. jednostranný test náhodné procházky proti procesu s lineárním trendem. Zápis nulové hypotézy je pro všechny tři vyšetřované případy tentýž, tzn.: (81) při , zatímco obecný zápis alternativy je (82) při , kde a pro případ (1) pro případ (2) Přitom v případě alternativ (2) nebo (3) jde jen o to, zda a vůbec nás nezajímá případná významnost úrovňové konstanty ani parametru sklonu , tím spíše ne jejich číselné hodnoty, které by při výskytu nestacionarity stejně nemusely být korektně spočteny. Testovou statistikou je ve všech třech variantách Dickey-Fullerova testu klasický t-poměr (prostě se testuje významnost regresního parametru v modelu (81) tzn. , kde odhady parametrů získáme metodami získanými dříve a s kritickým oborem . Zde však (za platnosti nulové hypotézy stacionarity) statistika DF nemá (a to ani asymptoticky a ani při platnosti ) t-rozdělení jako v případě klasického t.-poměru, ale má nestandardní (a nepojmenované) rozdělení, pro které bylo nutné kritické hodnoty naprogramovat simulačně a zvlášť pro jednotlivé typy alternativ (1),(2),(3) a pro různé délky řad n. viz tabulka níže. Obecně zde platí, že dané rozdělené má tlustší konce než příslušné t-rozdělení, takže jeho kritické hodnoty jsou v absolutní hodnotě více než dvojnásobně v porovnání s odpovídajícími hodnotami t-rozdělení. Např. 5% kritická hodnota a při je kritická hodnota -3,41 v absolutní hodnotě více než 2x větší než adekvátní kritická hodnota -1,645 po klasický t-test), tj. pro zamítnutí nulové hypotézy proto potřebujeme významnější hodnotu t-poměru (pracujeme totiž s nestacionárním regresorem). Kritické hodnoty uvedli poprvé již Dickey a Fuller, většina software ale využívá sofistikovanější výpočet odpovídajících p-hodnot podle McKinnona [1996]. hladina významnosti 10%=0,1 5%=0,05 1%=0,01 kritické hodnoty pro -test -1,62 -1,95 -2,58 kritické hodnoty pro -test -2,57 -2,86 -3,43 kritické hodnoty pro -test -3,12 -3,41 -3,96 Rozšířený Dickey-Fullerův test Předchozí test je aplikovatelný jen tehdy, jestliže reziduální složka představuje nezávislý bílý šum. Jestliže závisle proměnná obsahuje autokorelovanost, která není v modelu (81) řádně zohledněna, potom má DF-test chybu prvního druhu (tj.pravděpodobnost zamítnutí ) větší než deklarované . Pro takovýto případ byl navržen rozšířený Dickey-Fullerův test (ADF-test) [augmented DF-test], který místo (81) formuluje nulovou hypotézu jako (83) pro , Přičemž testová statistika a kritické hodnoty pro jednotlivé varianty (1),(2),(3) tj. po -test, -test, -test zůstávají stejné jako před rozšířením; test se opět týká jen parametru , přidané autoregresní členy v (83) jen absorbují dynamickou strukturu obsaženou v závisle proměnné. Pro stanovení řádu p přidaných autoregresních členů se doporučuje aplikovat informační kritéria uvedená výše. Phillipsův-Perronův test PP-test je podobný ADF–testu s tou odlišností, že zohlednění případné neuatokorelovanosti reziduí se neprovádí rozšířením o autoregresní člen jako tam, ale přímo korekcí odhadnuté směrodatné odchylky ve jmenovateli původního DF-testu. V podstatě se jedná o aplikaci Neweyové-Westova odhadu typu HAC (typu heteroskedastisticity and autocorrelation consistent estimator), jako v případě autoregresního modelu s autokorelovanými reziduy. KPSS-test [Kwaitkovski, Phillips, Schmidt, Shin [1992] Tento test reaguje na skutečnost, že DF-test někdy mívá slabou rozlišovací schopnost. Má-li teoretický model tvar , pak by nulová hypotéza jednotkového kořene měla být zamítnuta. Nelze-li ji zamítnout, pak to korektně znamená, že buď opravdu platí nestacionarita nebo že máme k zamítnutí jen nepostačující informaci (např. jen krátký úsek řady ). KPSS-test byl proto navržen tak, že hypotézy , mají tvar přesně opačný, než jak je tomu u ADF-testu (jako nulová se testuje stacionarita vůči alternativní hypotéze nestacionarity). Přitom se doporučuje provádět ADF-test a KPSS-test vždy simultánně a za směrodatný brát pouze takový výstup, kdy (a) se zamítá a současně zamítnout nelze (v tom případě je potvrzena stacionarita) (b) nelze zamítnout a současně se zamítá (v tom případě je potvrzena nestacionarita). Zbývající dvě kombinace výsledků se berou jako neprůkazné. Uvedené testy na jednotkový kořen (včetně dalších bývají součástí moderních softwarových testovacích systémů. Proces ARIMA Pro časové řady se stochastickým trendem typu (72), které lze stacionarizovat diferencováním, jsou v rámci Box-Jenkinsovy metodologie určeny procesy ARIMA. Integrovaný smíšený proces řádu značený jako [integrated] má tvar (84) (84A) je d-tá diference časové řady a současně je tento proces (84) je stacionární (a invertibilní) model . Jinými slovy: V takovém modelu ARIMA se nejprve provede stacionarizace pomocí vhodné diference modelované řady a takto vzniklá již stacionární řada se modeluje pomocí smíšeného modelu ARMA. Nezřídka se ovšem pro volí souhrnný zápis tvaru (85) Speciálním případem (85) je integrovaný I(d) proces zapisovaný obvykle v jednoduchém tvaru , který vlastně vzniká načítáním bílého šumu (odtud pojmenování „integrovaný“): např. pro je (86) Poznámka3: Tzv. driftový parametr modeluje případnou nenulovou úroveň procesu tj. deterministický trend ve tvaru polynomu d-tého řádu pro původní řadu . Pro a je model ARIMA pro řadu invariantní vůči případnému posunu řady o libovolnou konstantu. Proto je v tomto případě zbytečné řadu modelovanou jako ARIMA nejprve centrovat odečtením výběrového průměru. Poznámka4: Operátor na levé straně (85) se někdy nazývá zobecněný autoregresní operátor. Je pro něj charakteristické to, že odpovídající polynom má p kořenů ležících vně jednotkového kruhu v komplexní rovině a navíc d-násobný jednotkový kořen. Obecnějším typem jsou modely ARUMA, které mají aspoň jeden z těchto kořenů na jednotkové kružnici, nicméně různý od jednotkového kořene, a explozivní modely , které mají aspoň jeden z těchto kořenů uvnitř jednotkového kruhu. Konstrukce modelu je založena na tvorbě stacionárního modelu pro příslušně diferencovanou časovou řadu (přitom ale nesmíme opomenout případnou počáteční transformaci řady za účelem její linearizace, která se provádí ještě před diferencováním). Řád diferencování d přitom v realitě obvykle nepřekročí dvojku (rutinní časové řady ekonomického a finančního charakteru obvykle mívají a speciálně řady spotřebitelských indexů či nominálních mezd mohou někdy mít . Možností, jak stanovit řád diferencování d pro analyzovanou řadu, jsou zejména: - testy na jednotkový kořen - subjektivní prohlídka řad , , a jejich odhadnutých korelogramů a parciálních korelogramů – speciálně pomalý (lineární) pokles odhadnutých autokorelací je indikací pro další diferencování řady - porovnání výběrových směrodatných odchylek (volatilit) řad , , - volí se ten řád diferencování, který odpovídá případu s nejmenší volatilitou; při vyšších hodnotách se však volatility mohou začít s navyšováním d růst a mluví se pak o tzv. přediferencování. - - aplikace informačních kritérií modifikovaných pro modely . ________________________________ [1] Řekneme, že posloupnost náhodných veličin konverguje k n.v. podle středu (je cauchyovská podle středu), jestliže lim , resp. lim [2] MA proces nemá žádnou přímou souvislost s dříve popsanou metodou klouzavých průměrů užívanou pro eliminaci trendu časové řady. [3] Poznámka výchozí (nelogaritmovaná) věrohodnostní funkce má tvar