Trendy s konstantními parametry Obecně lze trendové funkce lze rozdělit v podstatě do dvou skupin: A. trendy lineární v parametrech ( a nelineární pouze v proměnných ) V tomto případě lze trendovou složku psát ve tvaru funkce lineární v parametrech (1) tzn . ve tvaru lineárně-aditivního schématu případně (2) Vztah (2) se nazývá tvar lineární v parametrech po transformaci vysvětlované proměnné nebo také (podle W.Eichhorna) zobecněná kvazilineární funkce.[1] Výpočet parametrů trendových funkcí lineárních v parametrech (1) nečiní problém a provádí se prostou metodou nejmenších čtverců MNČ/OLS. Protože všechny vysvětlující proměnné jsou nestochastické, je situace s respektováním podmínek standardního lineárního regresního modelu usnadněna: a) Přítomnost jedničkového vektoru zajišťuje nulovou střední hodnotu náhodných složek . (Konstantu lze interpretovat jako výchozí úroveň ukazatele v čase 0) b) Je automaticky zajištěna nestochastičnost všech vysvětlujících proměnných (jde zpravidla o jednoduché transformace trendu). Není proto třeba ověřovat pro konzistenci odhadové funkce nutnou podmínku , protože ta je zde splněna vždy. c) V „matici plánu„ se nemohou vyskytnout přesné lineární závislosti mezi „vysvětlujícími„ proměnnými (takže nemůže vzniknout problém multikolinearity)[2]. Pokud navíc nevolíme funkce příliš „blízké“ (např. a ), nehrozí ani multikolinearita přibližná. V obou předchozích případech přijímáme aditivní připojení náhodné složky , takže stochastický/regresní tvar trendové (1) funkce je tedy (1St) a obdobně Stochastický/regresní tvar trendové (2) závislosti je (2St) . Standardní OLS-kritérium pro výpočet trendových parametrů má tvar pro případ (1St) přes , ale pro případ (2St) V jednom i ve druhém případě lze užít prostou metodou nejmenších čtverců MNČ/OLS bez korekcí, avšak za uvědomění stojí, že v případě (4) OLS-kritérium neminimalizuje rozdíl prostých, nýbrž transformovaných (funkcí ) pozorovaných a vyrovnaných hodnot časové řady.[3] B. trendy nelineární v parametrech ( případně nelineární i v proměnných ) . V tomto obecném případě lze trendovou funkci psát ve tvaru (3) případně ještě obecněji (4) . Odpovídající stochastická specifikace tvar trendové (3) funkce je následně (3St) a obdobně Stochastický/regresní tvar trendové (4) závislosti je pak (4St) . V tomto případě již nelze k výpočtu parametrů (tzn. k jejich konzistentnímu odhadu) použít standardní OLS-odhadovou funkci. K minimalizaci výrazu (4) je zapotřebí (s výjimkou ojedinělých příznivých podob nelinearity) uplatnit některou z metod nelineární optimalizace, jako je NLLS (nelineární metoda nejmenších čtverců) nebo NLLAD (nelineární metoda nejmenších absolutních odchylek) s kritérii pro specifikaci (4St) a NLLS přes resp. pro specifikaci (4St) a NLLAD přes Poznámka: Nejobecnější myslitelný tvar trendové nelineární specifikace by byl (4St) . Ten je však natolik neurčitý a výpočetně problematický, že se neužívá. Je patrné, že konzistentní odhad trendových parametrů dostaneme v prvém případě nasazením prosté metody nejmenších čtverců OLS, zatímco ve druhém je nutné uplatnit nelineární prostou metodu nejmenších čtverců NLLS. Alternativním postupem pro výpočet trendových parametrů může dále být např. metoda nejmenších absolutních odchylek LAD, jejíž minimalizační kritérium je pro případ (3) pro případ (4) . Nejpoužívanější matematické funkce při trendovém vyrovnání/extrapolaci 1. Lineární trend indikace přítomnosti: první diference jsou přibližně konstantní 2. Kvadratický trend indikace přítomnosti: druhé diference jsou zhruba konstantní 3. Kubický trend indikace přítomnosti: třetí diference jsou zhruba konstantní 3. Polynomický trend s-tého stupně indikace přítomnosti: diference s-tého stupně jsou přibližně konstantní 4. Mocninný trend indikace přítomnosti: 5a Logaritmický trend indikace přítomnosti: 5. Exponenciální trend [ ] indikace přítomnosti: podíly sousedních hodnot [ ]resp. první diference logaritmů jsou přibližně konstantní. 6. Modifikovaný exponenciální trend indikace přítomnosti: podíly sousedních prvních diferencí jsou přibližně konstantní 7. Logistický trend s parametry indikace přítomnosti: a) histogram prvních diferencí [ ]je tvarem podobná křivce (hustotě) normovaného normálního rozdělení . b) podíly sousedních prvních diferencí reciprokých hodnot jsou přibližně konstantní. Inflexní bod logistické křivky je v bodě 8. Gompertzův trend nebo ekvivalentně [ ] indikace přítomnosti: podíly prvních logaritmovaných diferencí jsou přibližně konstantní Inflexní bod má Gompertzova křivka v bodě 9a. Odmocninný trend indikace přítomnosti: 9b. Hyperbolický trend 4. Mocninný trend indikace přítomnosti: závisí na t. Diferencované logaritmy konvergují s rostoucím t k nule 5a Logaritmický trend indikace přítomnosti: závisí na t. Diference „expomocnin„ konvergují s rostoucím t k nule 1A) výpočet parametrů lineárního trendu Pro jejich určení lze nejsnáze uplatnit výraz pro OLS-minimalizační kritérium z výchozí regresní specifikace (3) , zde konkretizované na (21) . a) Uplatněním standardního postupu – derivováním (21) podle obou neznámých parametrů dostaneme soustavu dvou nutných podmínek extrému (22A,B) , resp. a po očividných úpravách , resp. neboli (23A,B) , resp. Přeskupením výrazů na obou stranách dospějeme k soustavě normálních rovnic pro odhadnuté parametry - zde značené - ve tvaru (24A) (24B) , jejímž řešením je dvojice (25A,B) Po úpravách součtových výrazů , a vydělením čitatele i jmenovatel dostaneme pro (26) a následně pro b) Ke stejným výrazům dospějeme aplikací standardního vzorce pro OLS-odhady parametrů , tedy , pokud v něm konkretizujeme matici X jako . Potom máme Zřejmě máme , . Výpočtem (řešením pro neznámé ) dostaneme dvojici odhadů (25A,B). Že jde skutečně o minimum, se snadno přesvědčíme stejně snadno jako v případě minimalizace pro lineární regresní model. Předpověď budoucí hodnoty má tvar (27) . Příslušný procentní předpovědní interval (při neznalosti ) je (28) , kde je vyrovnaná hodnota závisle proměnné je počet stupňů volnosti (rozdíl mezi počtem pozorování a počtem trendových parametrů) je 1-p/2 (.100) % kvantil Studentova t-rozdělení o n-3 stupních volnosti je hodnota : , přičemž je matice nestochastických „regresorů“. S ohledem na specifický výraz pro momentovou matici v daném případě dostaneme (29) je směrodatná odchylka reziduí (rozdílu mezi pozorovanými a vyrovnanými hodnotami časové řady) (30) . 1B) výpočet parametrů kvadratického trendu Aplikace standardního vzorce pro OLS vede k výrazům (31) Odtud vyplývá soustava normálních rovnic ve tvaru (32A,B,C) Někdy je výhodné pracovat s vyjádřením trendu ve tvaru (33) , kde , kde Předpověď budoucí hodnoty má tvar (34) . Příslušný procentní předpovědní interval je (35) , kde je vyrovnaná hodnota závisle proměnné je počet stupňů volnosti (rozdíl mezi počtem pozorování a počtem trendových parametrů) je kvantil Studentova t-rozdělení o n-3 stupních volnosti je hodnota: (36) , přičemž je matice nestochastických „regresorů“. je směrodatná odchylka reziduí (rozdílu mezi pozorovanými a vyrovnanými hodnotami časové řady) (37) 1C) výpočet parametrů reciprokého/hyperbolického trendu Aplikace standardního vzorce pro OLS vede k výrazům (41) 1D) výpočet parametrů logaritmického trendu Aplikace standardního vzorce pro OLS má zde podobu (42) , takže pro parametrické odhady (budou konzistentní a nestranné) máme , , 1E) výpočet parametrů exponenciálního trendu (51) zpravidla Trend je charakteristický tím, že koeficient růstu tj. podíl dvou sousedních hodnot a současně podíl dvou sousedních diferencí má konstantní hodnotu . Parametr se uvažuje kladný. Růstová tendence nastává v případě , tendence poklesu v případě , K výpočtu parametrů exponenciálního trendu je vhodné uplatnit váženou metodu nejmenších čtverců WLS s vhodně transformovaný vahami. (Nelze totiž předpokládat multiplikativní tvar a logaritmicko-normální rozdělení náhodné složky v původním modelu před transformací) . V konkrétním případě exponenciálního trendu se aplikuje WLS pro minimalizaci výrazu (52) , v němž jsou předem zvolené váhy. Minimalizace se však v této metodě vztahuje k výrazu (53) , u kterého váhy závisí na vahách tak, abychom minimalizací obou výrazů (52),(53) dostali aspoň přibližně shodné odhady parametrů . Ukazuje se, že pro přijatou logaritmickou transformaci je vhodné položit (54) K nejčastější volbě vah přistupujeme tehdy, jestliže nemáme důvod preferovat v minimalizačním kritériu některá jednotlivá pozorování, takže pak pro transformované váhy bude platit . Minimalizací výrazu (53) s těmito vahami obdržíme soustavu normálních rovnic (55A) (55B) , neboť po dosazení (54) do (53) máme (53*) , a tedy (56A) (56B) Anulováním pravých stran (56A), (56B) a po jednoduchých úpravách máme , což po přemístění členů a vynásobení (-1) vede k (55A), (55B) . □ . Soustavu (55A), (55B) lze maticově zapsat jako Odtud je snadno vidět, že má explicitní řešení pro oba parametry ve tvaru (56A) (56B) Oba parametry získáme exponenciálním povýšením výrazů na pravých stranách. Vlastnost, že exponenciální trend má koeficient růstu a současně podíl dvou sousedních diferencí konstantní je okamžitě patrná: Vyjdeme-li z (51) , pak a tedy (konstantní) a rovněž tak . □ . 1F) výpočet parametrů modifikovaného exponenciálního trendu (61) a zpravidla také . Tento trend je tříparametrickým zobecněním předchozího případu (parametry ). Hodí se pro modelování trendu s konstantním podílem sousedních diferencí, pokud je navíc tento trend asymptoticky omezen (přibližuje-li se k saturační úrovni). Jedna z orientačních metod odhadu parametrů modifikovaného exponenciálního trendu (pokud nemůžeme použít exaktní iterační postupy nelineární optimalizace), spočívá v tomto postupu: Rozdělíme soubor pozorovaných hodnot na tři stejně velké třetiny o délce . Pokud není přesně dělitelné třemi, pak vynecháme jedno nebo dvě počáteční pozorování. Pak sečteme pozorování v jednotlivých třetinách, přičemž dostaneme (62A) (62B) (62C) , kde indexování „1“ v resp. v značí součet pozorovaných hodnot, případně trendových hodnot z první třetiny časové řady. Řešením této soustavy tří rovnic dostaneme postupně jednotlivé odhady parametrů ve tvaru (63A) (63B) (63C) Poznámka: Např. parametr v (63B) získáme odečtením rovnice (62A) od (62B): Podobně odečtením rovnice (62B) od (62C) dostaneme: a po vydělením obou vztahů obdržíme . Parametr pak nakonec snadno získáme z (62A) při známých . □ . Vzhledem k tomu, že při pevně zvoleném parametru se model stane lineárním modelem, lze také použít takový postup, že se odhadnou parametry pro různé hodnoty a následně se zvolí taková varianta, která minimalizuje SSE. � . ověření indikace přítomnosti modifikovaného exponenciálního trendu: podíly sousedních 1. diferencí jsou zhruba konstantní: Protože zřejmě platí , vyplývá odtud pro diference a následně . Konstantnost představuje parametr . Limitní chování modifikovaného exponenciálního trendu Při přijatých omezeních na parametry funkce (61) a , platí Při přijatých omezeních na parametry funkce (61) a , platí Chování modifikovaného exponenciálního trendu asymptoticky (pro ) směřuje k saturační úrovni dané hodnotou parametru , přičemž v blízkosti 0 by hodnoty mohly být i záporné (záleží na součtu parametrů ). 1G) výpočet parametrů logistického trendu Tento opět tříparametrický trend je popsán schématem (71) , při Logistický trend má inflexi (tj. bod, ve kterém přechází konvexní průběh trendu v konkávní, příp. naopak) v bodě a je asymptoticky omezen (se saturační úrovní ). Jeho zderivováním podle časové proměnné t (tu považujeme za spojitou) , dostaneme [4] (72) , což je další důležitý ukazatel růstu trendové křivky (tato první derivace trendové křivky se v tomto kontextu nazývá růstová funkce). Je zřejmé, že rychlost růstu logistického trendu závisí přímo úměrně na dosažené úrovni a na vzdálenosti hodnoty trendu od saturační úrovně , tj. . Derivace je přitom symetrická kolem bodu inflexe . Z toho, co bylo řečeno, plyne, že logistickou křivku lze přiřadit k tzv. S-křivkám symetrickým kolem inflexního bodu . Pokud jde o odhad parametrů logistického trendu, lze použití několik odlišných metod: a) protože logistický trend lze považovat za reciprokou podobu modifikovaného exponenciálního trendu, lze aplikovat výše popsanou odhadovou proceduru pro odhad modifikovaného exp. trendu na časovou řadu s reciprokými hodnotami . b) Použijeme diferenčního parametrického odhadu, kdy se místo s původní časovou řadou pracuje s řadou prvních diferencí . Přitom se postupuje takto: V derivační formulaci trendu (72) se aproximuje trendová složka skutečnými pozorováními , takže se dostane: (73) Jestliže dále přijmeme aproximaci (derivace pomocí diference) (74) , v níž označuje řadu prvních diferencí, pak ze (73) snadnou úpravou dostaneme (75) Pomocí metody nejmenších čtverců pak získáme v lineárním regresním modelu (modelu s jediným regresorem), tzn.ve stochastické formulaci (75) (75*) (75**) , kde odhady , pro , a odtud následně odhady parametrů jako (76) a pro Abychom získali odhad pro poslední parametr , aproximujeme ve vztahu (71) trendovou složku skutečnými pozorováními a upravíme tento vztah do tvaru (77) (protože ) Po zlogaritmování a sečtení přes těchto vztahů přes [5] dostaneme nakonec vztah (78) který se nazývá Rhodesův vzorec. Z něho se už snadno vypočte odhad parametru „vyexponováním„. Ověření toho, že logistický trend je reciproké vyjádření modifikovaného exponenciálního trendu je velmi jednoduché: stačí (71) zapsat v reciproké podobě a hned vidíme, že výraz odpovídá zápisu modifikovaného exponenciálního trendu (61) , pokud vyjádříme parametry tohoto trendu jako Ověření lokalizace inflexního bodu u logistické křivky Vzhledem k tomu, že inflexe je místem, kde konvexnost přechází v konkávnost (nebo vice versa) musíme spočíst druhou derivaci ( podle času t ). trendové křivky. Postupně dostaneme: (79A) a následně neboli (79B) Nulovou hodnotu může druhá derivace nabýt jen tam, kde je obsah čitatele zlomku nulový, protože při daných omezeních na parametry nemůže pro žádné reálné platit . Pro nulový čitatel vyplývá tedy navazující podmínka , resp. a vzhledem k nenulovosti pro může mít tento součin hodnotu 0 jen tam, kde platí neboli a tedy . Hodnotu lokalizující inflexi pak už snadno získáme zlogaritmováním: , odkud odvodíme polohu inflexního bodu □ . ověření indikace přítomnosti logistického trendu: podíly sousedních 1. diferencí reciprokých hodnot jsou zhruba konstantní. Protože platí vyplývá odtud pro Diference a tedy opravdu platí □ . Konstantnost tedy představuje stejně jako u modifikovaného exponenciálního trendu parametr . 1H) Gompertzův trend a výpočet jeho parametrů Trend ve tvaru této křivky vzniká (ostatně stejně jako logistický trend) transformací modifikovaného exponenciálního trendu. (81) resp. ekvivalentně při [ ] Obvykle – pro dosažení charakteristického tvaru křivky – přijímáme: Pro hodnoty parametrů z tohoto intervalu má Gompertzův trend inflexi v bodě (82) První derivace této křivky (tzv. růstová funkce) ale tentokrát není symetrická kolem inflexního bodu, ale je sešikmená (protáhlejší) doprava. Z tohoto důvodu se Gompertzův trend řadí mezi tzv. S-křivky nesymetrické kolem inflexního bodu. Odhad parametrů se provede způsobem obdobným jako v případě modifikovaného exponenciálního trendu, místo původní řady se ale použije logaritmovaná původní řada (s hodnotami [6]) Ověření lokalizace inflexního bodu u Gompertzovy křivky Vzhledem k tomu, že inflexe je místem, kde konvexnost přechází v konkávnost (nebo vice versa) musíme spočíst druhou derivaci ( podle času t ). trendové křivky. Postupně dostaneme: (83) a následně Vytkneme-li z obou členů (nenulový) výraz s exponenciálou, obdržíme (84) Nulovou hodnotu může druhá derivace nabýt jen tam, kde je obsah hranaté závorky nulový, tedy v bodě splňujícím podmínku , po vytknutí tedy přičemž vzhledem k nenulovosti součinu před závorkou může tento výraz nabýt nulovou hodnotu je tam, kde je obsah hranaté závorky nulový, tj. tam, co platí neboli a tedy . Hodnotu lokalizující inflexi pak už snadno získáme zlogaritmováním: ,odkud máme polohu inflexe □ . ověření indikace přítomnosti Gompertzova trendu: indikace přítomnosti: podíly prvních logaritmovaných diferencí jsou přibližně konstantní Z logaritmického vyjádření Gompertzova trendu (81) dostaneme pro , a následně tedy pro první dvě logaritmované diference: . Odtud máme pro jejich podíl , takže ona přibližná konstanta je parametr . 1J) výpočet parametrů odmocninného trendu Aplikuje-li standardní OLS – odhadové schéma pro tento model, který je lineární v parametrech, dostaneme (91) , takže pro parametrické odhady (budou konzistentní a nestranné) máme , , V případech, kdy je levostranná regresní proměnná transformací původní veličiny časové řady , lze aplikovat metodu nejmenších čtverců OLS jen s výhradou. Minimalizace reziduí prováděná pomocí OLS nebude totiž založena na kritériu , nýbrž na kritériu , kde je použitá transformující funkce, nejčastěji logaritmická funkce nebo exponenciála. Pro takovéto případy by měla být užita nelineární (prostá) metoda nejmenších čtverců NLLS (Non-Linear Least Squares Method), jejímž minimalizačním kritériem je právě . Výpočet je ale nutné provést některou z numerických iteračních metod, protože výsledný vzorec pro odhadnuté parametry nelze vyjádřit explicitně. Hlavní zásady výběru výstižného trendu 1) Zpravidla preferujeme trendovou křivku s co nejmenším počtem parametrů (obvykle do 3). Zásadou je úspornost (parsimony), která je zde ještě více opodstatněná než v klasické regresní analýze, neboť vodítka pro tvar nelinearity zde až na ojedinělé výjimky nemůžeme vyvodit z ekonomické teorie. Jednou z možností, jak otestovat potřebu/nepotřebu nutnosti zařazení další trendové transformace může být výpočet korigovaného koeficientu determinace . Jinou racionální úvahu lze založit na určení statistické významnosti příslušného trendového parametru (k tomu lze užít klasické testování pomocí t-testu). V trendové analýze není zdaleka tak osudové riziko specifikační chyby spočívající ve vynechání některé z relevantních proměnných jako je tomu v analýze regresní. 2) Před první volbou trendové křivky je vhodné se podívat na graf pozorovaných hodnot časové řady, který bývá prvotním vodítkem výchozí trendové specifikace. Z něho lze dost často vyvodit řád nestacionarity např. tím, že vytvoříme řadu prvních nebo druhých diferencí. Pokud ani diference vyšších řádů nevedou ke stacionární řadě a řada vykazuje monotónní akcelerující růst, je to indikací pro volbu exponenciálního trendu (s případným posunem výchozí úrovně. Určitým indikátorem je pak graf průběhu reziduálních hodnot, z něhož lze často vyvodit alší transformující funkci času, která byla v základní specifikaci opomenuta (např. mnohočlen 2. nebo 3 stupně). 3) Nesmíme zapomenout na to, že trendová analýza slouží především ke krátkodobým predikcím. Vzhledem k tomu, že polynomy 4. a vyšších řádů se vyznačují značnou citlivostí při predikcích, je to důvodem pro jejich vynechání z oboru možných trendových funkcí. (Ekonomické ukazatele se chování principiálně ustáleněji než např. fyzikální/technické, kde může být účelné nasazení např. splinových funkcí). 4) Pokud ekonomický ukazatel vykazuje evidentně rozdílný průběh ve sledovaném minulém období, obvykle to velmi komplikuje rozhodnutí o výběru trendu. V takovémto případě – pokud se nevzdáme pokusu o predikci vůbec – přistupujeme zpravidla k prolongování chování z údajů posledního období nebo z údajů toho minulého období, o němž lze důvodně předpokládat, že vývoj zde pozorovaný se vyskytne i v nejbližší budoucnosti. 5) Přítomnost heteroskedasticity (standardně testované v regresní analýze) není v případě trendové analýzy časové řady zpravidla vážnějším problémem.[7] U testování konvenčními testy nevzniká specifický problém, jen u Whiteova testu může být větší než obvykle pravděpodobnost výskytu součinové kombinace dvou elementárních trendových funkcí s některou z dalších zařazených (vznikla by dokonalá multikolinearita). U Goldfeld-Quandtova testu se zřejmě nemůžeme opřít o obsahovou vazbu variability reziduí s proměnlivostí některé z vysvětlujících proměnných, takže jeho nasazení ztrácí původní význam. V testování převažují prvky technické nad věcnými. 6) Naopak, důležitým prvkem trendové analýzy je vyšetřování síly a stupně autokorelace náhodných složek sledované časové řady. Náhodné složce časové řady je vůbec věnována značná pozornost. Proto také obvykle první pohled na výsledky směřuje k vyšetření reziduálních hodnot, přičemž základní představu o jejich případné autokorelovanosti poskytne Durbin-Watsonův koefiecient autokorelace 1.řádu. 7) Další z průvodních problémů standardní lineární regrese – multikolinearita – se v trendové analýze vyskytnout nemůže: K dokonalé multikolinearitě nemůže vést žádná lineární kombinace elementárních trendových komponent (jsou-li tyto rozdílné) a eventualita výskytu přibližné multikolinearity nemůže pocházet ze stochastičností „vysvětlujících proměnných„ (jsou-li elementární trendové komponenty svou povahou nestochastické). 8) Případný přínos apriorní informace: Je poměrně skromný počet případů, kdy lze k výběru nejvhodnější trendové funkce uplatnit poznatky plynoucí z externí ekonomické reality. Přece však některé existují: Ve vývoji průměrné mzdy jako nejcharakterističtějším případ lze pozorovat tendenci pravidelného každoročního procentního nárůstu (který ovšem nemusí být každoročně stejný). Je to přímým důsledkem „zvyklostí“, které jsou zažité při mzdovém vyjednávání odborářů ( a od nichž se sekundárně odvíjí i mzdový nárůst pracovníků ve státních podnicích a státní správě). Obdobně, pokud by valorizace důchodů probíhala tak, že bude každoročně přidávána konstantní hodnota v Kč, bylo by to indikací lineárního trendu. Pokud by se přidávalo „o zhruba stejné procento“ (jako je to zvykem u mezd) , signalizovalo by to průběh vyjádřený exponenciální křivkou. Kritéria posuzování přesnosti předpovědí Střední chyba odhadu [mean error] ME Jde o obvykle velmi malou hodnou (řádů a níže) indikující „míru nelinearity“ při výpočtu. Pro posouzení vlastní míry přesnosti predikční výpovědi žádný smysl nemá. Součet čtvercových chyb odhadu [sum of squared errors] SSE Je to stejné kritérium, jako kritérium nejmenších čtverců v regresním modelu (lineárním i nelineárním). Lze ho rozumně použít jen při srovnání uvažované s jinak specifikovanou trendovou funkcí (pro shodný počet pozorování). Měrovou jednotkou této míry je zde „čtverec„ původní měrné jednotky. Střední čtvercová chyba odhadu [mean squared error] MSE se uplatňuje často coby kvadratická ztrátová („loss„) funkce. Lze ji dekomponovat na tři složky takto: , kde na pravé straně je proporční vychýlení vzdálenost průměru předpovědí od průměru předpovídaných hodnot proporční rozptyl vzdálenost rozptylu předpovědí od rozptylu předpovídaných hodnot proporční kovariance pokrývá zbývající nesystematickou část předpovědní chyby. U dobré předpovědní techniky jsou první dvě složky relativně malé a výrazně převládá nesystematická složka. Součet všech tří z jich je 1. Odvození se získá z rozkladu Odmocninová střední čtvercová chyba [root mean squared error] RMSE Výhodou oproti MSE je vyjádření ve stejných jednotkách jako mají původní data. Střední absolutní chyba odhadu [mean absolute error] MAE Její předností je – zejména v datových souborech s výraznými odchylkami některých pozorování od „standardních“ (tzv.outliers) - že nepenalizuje tak silně jako MSE či RMSE tyto „extrémní“ odchylky. Dále uváděné míry již na měřítku hodnot předpovídané proměnné nezávisejí: Střední absolutní procentuální chyba odhadu [mean absolute percentage error] MPE Zpravidla nabývá hodnot mezi 0-100%, přičemž výsledek menší/lepší než 100% říká, že daný předpovědní model je lepší než model náhodné procházky s předpověďmi trvale na nulové úrovni, tj. trvale s MAPE=100%. Kritérium je však problematicky použitelné, pokud hodnoty časové řady jsou příliš malé ( oscilují kolem 0 ). Korigovaná střední absolutní procentuální chyba odhadu [adjusted mean absolute percentage error] AMAPE Koriguje asymetrii předchozího kritéria MAPE: dává totiž stejný výsledek i při prohození skutečných a předpovídaných hodnot v tomto smyslu: Skutečná hodnota 0,6 a předpověď 0,8 přispějí do součtu v AMAPE stejně jako skutečná hodnota 0,8 a předpověď 0,6. Střední procentní chyba odhadu [mean percentage error] MPE Je víceméně doplňkovým kritériem k ME, kdy v součtu vystupují relativní odchylky místo absolutních. Theilův koeficient nesouladu [Theil’s U-coefficient] ThU[8] , kde n……..... délka původní časové řady (užité pro odhad modelu) h……..... délka předpovídaného období [ h>0 ] n + h .... délka původní časové řady prodloužená o předpovídané období. Někdy je ovšem toto kritérium formulováno obecněji, přičemž odchylky jsou brány vůči nějakému jednoduchému či naivnímu modelu- tzv. benchmark. Hodnota U leží vždy mezi 0 a 1, přičemž hodnota 0 značí perfektní shodu předpovědí se skutečností. Publikace Hindls R., Hronová S, Novák, I.: Metody statistické analýzy pro ekonomy uvádí jinou verzi Theilova koeficientu (zde označenou ThC) Theilův koeficient nesouladu [Theil’s C-coefficient] ThC , kde n…….. délka původní časové řady (užité pro odhad modelu) h…….. délka časové řady po zkrácení [ h>0 ] o q pozorovaných hodnot n + h .... délka původní časové řady prodloužená o předpovídané období. extrapolovaná hodnota na i období dopředu, a to modelem odhadnutým na základě prvních r pozorování časové řady . Pokud se hodnota nachází v rozmezí 3-5%, lze mluvit o velmi uspokojivém výsledku. Model lze s velkou pravděpodobností považovat za použitelný k předpovědím. Pokud se hodnota nachází v rozmezí 5-10%, lze mluvit o jakžtakž uspokojivém výsledku. Model lze s mírnou nadějí považovat za použitelný k předpovědím Pokud se hodnota nachází nad úrovní 10%, nelze mluvit o uspokojivém výsledku. Model lze téměř s jistotou zavrhnout z hlediska použitelnosti k předpovědím. K předchozím kritériím lze přidat ještě dvě další míry, u nichž se omezujeme na posouzení toho, jak model předpovídá znaménka budoucích hodnot (tj. zda tyto hodnoty budou kladné nebo záporné) nebo změny ve směru vývoje budoucích hodnot (zda růst přejde v pokles apod.) Někdy – při strategických úvahách – jde o důležitější aspekty než číselné co nejpřesnější vyjádření předpovídaných hodnot. Procento správných předpovědí znaménka PCPS , kde Charakteristika (zřejmě v rozmezí 0% -100%) není nijak moc vypovídající, neboť pouze informuje o tom, zda mají skutečné a predikované hodnoty stejná znaménka. V případě, že se hodnoty analyzované časové řady pohybují ve vysokých kladných číslech (běžná situace u velké části ekonomických ukazatelů) je prakticky bezcenná (hodnota PCPS bude s velkou pravděpodobností identicky 100). Procento správných (jednokrokových) předpovědí změn směru vývoje PCPD , kde Na rozdíl od předchozího PCPS respektuje tento indikátor podstatně více charakter posuzování předpovědí u ekonomických časových řad. Posuzuje poměr stejnosměrnosti vůči protisměrnosti skutečného vývoje a předpovědi (oproti ) v situaci, kdy známe skutečnou hodnotu řady v minulém období . Vystižení správného směru vývoje z hodnoty predikcí (růst /pokles) je někdy důležitější než samotné (přesné) určení konkrétní hodnoty. ________________________________ [1] Kvazilineární funkce může být zapsána schématem , kde je spojitá monotónní funkce a dále , jsou vhodné konstanty ( nenulové). Zobecněnou kvazilineární funkci lze zapsat ve tvaru: , kde jsou vesměs spojité a ryze monotónní funkce. Oproti kvazilineární funkci se nevyžaduje symetrie vnitřních funkcí , vůči jednotlivým argumentům. [2] S přirozenou podmínkou, že funkce jsou vzájemně různé. [3] Odhady parametrů získané pomocí jednoho a druhého kritéria tedy nebudou obecně shodné. [4] [5] Z dostaneme a dělíme [6] Je tímto zřejmé, že postup nelze uplatnit na ekonomickou časovou řadu s některými hodnotami zápornými. [7] Pracujeme s časovou řadou, jejíž hodnoty – aspoň v nedlouhém časovém období – jsou zpravidla dosti vzájemně blízké a rozptyl náhodných složek obvykle významněji nekolísá. [8] Henri Theil byl významný nizozemský ekonometr a matematický ekonom [1924-2000], následník Jana Tinbergena na Erasmus University v Rotterdamu, později působil na universitě v Chicagu a na University of Florida.