Regresní analýza trendu v časových řadách Pojem časové řady: Časovou řadou rozumíme řadu hodnot n1 tt y,,y K určitého ukazatele uspořádanou podle přirozené časové posloupnosti t1 < ... < tn. Jsou-li časové intervaly (t1, t2), ..., (tn-1, tn) stejně dlouhé (ekvidistantní), zjednodušeně zapisujeme časovou řadu jako y1, ..., yn. Přitom ukazatel je veličina, která charakterizuje nějaký jev v určitém prostoru a určitém čase (okamžiku či intervalu). Druhy časových řad a) Časová řada okamžiková: příslušný ukazatel udává, kolik jevů existuje v daném časovém okamžiku (např. počet obyvatelstva k určitému dnu). b) Časová řada intervalová: příslušný ukazatel udává, kolik jevů vzniklo či zaniklo v určitém časovém intervalu (např. počet sňatků během roku). Nejsou-li jednotlivé časové intervaly ekvidistantní, musíme provést očištění časové řady od důsledků kalendářních variací. Příklad: Máme k dispozici údaje o tržbě obchodní organizace (v tis. Kč) v jednotlivých měsících roku 2013: 2400, 2134, 2407, 2445, 2894, 3354, 3515, 3515, 3225, 3063, 2694, 2600. Vypočtěte očištěné údaje. Řešení: Průměrná délka měsíce je 365/12 dne. Očištěná hodnota pro leden 84,2354 3112 365 2400y )o( 1 = ⋅ ⋅= , pro únor 18,2318 2812 365 2134y )o( 2 = ⋅ ⋅= . Pro ostatní měsíce analogicky dostaneme 2361,71; 2478,96; 2839,54; 3400,58, 3448,86; 3448,86; 3269,79; 3005,36; 2731,42; 2551,08. Výpočet pomocí systému STATISTICA: Vytvoříme nový datový soubor o třech proměnných: trzba, dm (délky jednotlivých měsíců) a ot (očištěná tržba) a 12 případech. Do proměnné trzba zapíšeme zjištěné hodnoty. Do proměnné dm vložíme délky jednotlivých měsíců, tj. 31, 28, 30, …, 31. Do Dlouhého jména proměnné ot napíšeme =trzba*365/(12*dm). 1 trzba 2 dm 3 ot 1 2 3 4 5 6 7 8 9 10 11 12 2400 31 2354,839 2134 28 2318,185 2407 31 2361,707 2445 30 2478,958 2894 31 2839,543 3354 30 3400,583 3515 31 3448,858 3515 31 3448,858 3225 30 3269,792 3063 31 3005,363 2694 30 2731,417 2600 31 2551,075 Grafické znázornění okamžikové časové řady Použijeme spojnicový diagram. Na vodorovnou osu vynášíme časové okamžiky t1, ..., tn, na svislou osu odpovídající hodnoty y1, ..., yn. Dvojice bodů (ti, yi), i = 1, ..., n spojíme úsečkami. Příklad: Časová řada obsahuje údaje o počtu zaměstnanců určité akciové společnosti v letech 1989 – 1996 vždy k 31.12. 1989 1990 1991 1992 1993 1994 1995 1996 622 627 631 635 641 641 632 625 Znázorněte tuto časovou řadu graficky. Řešení pomocí systému STATISTICA: Vytvoříme datový soubor o dvou proměnných nazvaných rok a pocet a 8 případech. Grafy – Bodové grafy – odškrtneme Lineární proložení – Proměnné X – rok, Y – počet – OK – OK. 2x klikneme na pozadí grafu – vybereme Graf: obecné – zaškrtneme Spojnice – OK. 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 rok 620 622 624 626 628 630 632 634 636 638 640 642 pocet Grafické znázornění intervalové časové řady Použijeme sloupkový diagram. Je to soustava obdélníků, kde šířka obdélníku je rovna délce intervalu a výška odpovídá hodnotě ukazatele v daném intervalu. Ke znázornění intervalové časové řady lze použít i spojnicový diagram, přičemž na vodorovnou osu vynášíme středy příslušných intervalů. Příklad: Máme k dispozici údaje o produkci určitého podniku (v tisících výrobků) v letech 1991-1996. 1991 1992 1993 1994 1995 1996 114 106 107 102 116 137 Znázorněte tuto časovou řadu graficky. Řešení pomocí systému STATISTICA: Vytvoříme datový soubor o dvou proměnných nazvaných rok a produkce a 6 případech. Grafy – Bodové grafy – odškrtneme Lineární proložení – Proměnné X – rok, Y – produkce – OK – OK. 2x klikneme na pozadí grafu – vybereme Graf: obecné – zaškrtneme Spojnice – Přidat nový graf – typ Sloupcový graf – OK. Do sloupců označených jako Nový1, Nový2 okopírujeme hodnoty proměnných rok a produkce. Ve Všech možnostech: Sloupce upravíme šířku sloupce na 1. 1990 1991 1992 1993 1994 1995 1996 1997 rok 100 105 110 115 120 125 130 135 140 produkce Aditivní model časové řady Předpokládejme, že pro časovou řadu y1, ..., yn platí model yt = f(t) + εt, t = 1, ..., n, kde f(t) je neznámá trendová funkce (trend), kterou považujeme za systematickou (deterministickou) složku časové řady (popisuje hlavní tendenci dlouhodobého vývoje časové řady), εt je náhodná složka časové řady zahrnující odchylky od trendu. Náhodná složka splňuje předpoklady E(εt) = 0, D(εt) = σ2 , C(εt, εt+h) = 0, εt ~ N(0, σ2 ) (říkáme, že εt je bílý šum). Odhad trendu časové řady pomocí klouzavých průměrů Podstata klouzavých průměrů Předpokládáme, že časová řada se řídí aditivním modelem yt = f(t) + εt, t = 1, ..., n. Odhad trendu v bodě t získáme určitým zprůměrováním původních pozorování z jistého okolí uvažovaného časového okamžiku t. Můžeme si představit, že podél dané časové řady klouže okénko, v jehož rámci se průměruje. Nejprve musíme zvolit délku okna h > 1, v němž se bude počítat průměrná hodnota h pozorovaných hodnot iy , i = z, z+1, …, z+h – 1 v po sobě jdoucích časech ztt = , 1ztt += , …, 1hztt −+= . Hodnota z představuje začátek okna. a) Nechť šířka h vyhlazovacího okénka je liché číslo: h = 2d + 1. Pak ∑ + = −++ + = 1d2 1i 1izdz y 1d2 1 yˆ pro z = 1, …, n – 2d. Vypočtený průměr se přiřadí časovému okamžiku, který odpovídá středu okna. b) Nechť šířka h vyhlazovacího okénka je sudé číslo: h = 2d. Pak      += ∑∑ = + = −++ d2 1i iz d2 1i 1izdz yy d4 1 yˆ pro z = 1, …, n – 2d. Odhad trendu v bodě t se vypočte jako průměr ze dvou klouzavých průměrů, které příslušejí časovým okamžikům nejblíže vlevo a vpravo od středu okna. Tento průměr se přiřadí nejblíže většímu okamžiku od středu okna. Hodnoty centrovaného klouzavého průměru a trendové funkce ( )tf ) jsou definovány v časech 1dtt += , 2dtt += , …, dntt −= . Šířka vyhlazovacího okénka Velmi důležitou otázkou je stanovení šířky vyhlazovacího okénka. Je-li okénko příliš široké, bude se odhad trendu blížit přímce (říkáme, že je přehlazen) a zároveň se ztratí velký počet členů na začátku a na konci časové řady. Je-li naopak okénko úzké, bude se odhad trendu blížit původním hodnotám (říkáme, že odhad je podhlazen). Nejčastěji se volí šířka okénka h = 3, 5, 7, pro čtvrtletní hodnoty pak 4. Příklad: Časová řada 215, 219, 222, 235, 202, 207, 187, 204, 174, 172, 201, 272 udává roční objemy vývozu piva (v miliónech litrů) z Československa v letech 1980 až 1991. a) Odhadněte trend této časové řady pomocí klouzavých průměrů s vyhlazovacím okénkem šířky 3 a poté 5. b) Graficky znázorněte průběh časové řady s odhadnutým trendem. Řešení pomocí systému STATISTICA: Vytvoříme datový soubor export_piva.sta o dvou proměnných ROK a VYVOZ a dvanácti případech. Statistiky – Pokročilé lineární/nelineární modely – Časové řady/predikce – Proměnné Y – OK– OK (transformace, autokorelace, kříž. korelace, grafy) – Vyhlazování – zaškrtneme N-bod. klouzavý průměr, N = 3 – OK (Transformovat vybrané řady) – vykreslí se graf, vrátíme se do Transformace proměnných – Uložit proměnné. Otevře se nový spreadsheet, kde v proměnné VYVOZ_1 jsou uloženy klouzavé průměry pro N = 3. Totéž uděláme pro případ N = 5. Ve spreadsheetu se proměnná VYVOZ_1 přepíše na VYVOZ_2 a nová proměnná se uloží jako VYVOZ_1. Nově vzniklé proměnné nazveme KP3 a KP5. K datovému souboru přidáme proměnnou ROK, do jejíhož Dlouhého jména napíšeme =1979+v0. export_piva.sta 1 rok 2 VYVOZ 3 KP3 4 KP5 1 2 3 4 5 6 7 8 9 10 11 12 1980 215,000 1981 219,000 218,667 1982 222,000 225,333 218,600 1983 235,000 219,667 217,000 1984 202,000 214,667 210,600 1985 207,000 198,667 207,000 1986 187,000 199,333 194,800 1987 204,000 188,333 188,800 1988 174,000 183,333 187,600 1989 172,000 182,333 204,600 1990 201,000 215,000 1991 272,000 Grafické znázornění časové řady s odhadnutým trendem provedeme pomocí vícenásobných bodových grafů. 1978 1980 1982 1984 1986 1988 1990 1992 160 180 200 220 240 260 280 1978 1980 1982 1984 1986 1988 1990 1992 160 180 200 220 240 260 280 Cíl regresní analýzy trendu Regresní analýza trendu má objasnit vztah mezi závisle proměnnou veličinou Y a časem t. Předpokládáme, že trend f(t) závisí (lineárně či nelineárně) na neznámých parametrech β0, β1, ..., βk a známých funkcích φ0(t), φ1(t), ...., φk(t), které již neobsahují žádné neznámé parametry, tj. f(t) = g(β0, β1, ..., βk; φ0(t), φ1(t), ...., φk(t)). Odhady b0, b1, ..., bk neznámých parametrů β0, β1, ..., βk lze získat např. metodou nejmenších čtverců a pak vyjádřit odhad )t(f ) neznámého trendu v bodě t pomocí odhadů b0, b1, ..., bk a funkcí φ0(t), φ1(t), ...., φk(t), tj. )t(f ) = g(b0, b1, ..., bk; φ0(t), φ1(t), ...., φk(t)). Nejdůležitější typy trendových funkcí Volba typu trendové funkce se provádí - na základě teoretických znalostí a zkušeností se zkoumanou veličinou Yt - pomocí grafu časové řady - pomocí informativních testů založených na jednoduchých charakteristikách časové řady a) Lineární trend Analytické vyjádření: t)t(f 10 β+β= Informativní test: 1. diference ( n,,2t,yyy 1ttt K=−=∆ − ) jsou přibližně konstantní. Příklad lineárního trendu: 0 10 20 30 40 50 60 70 80 90 100 čas 6 7 8 9 10 11 12 Y b) Kvadratický trend Analytické vyjádření: 2 210 tt)t(f β+β+β= Informativní test: 1. diference mají přibližně lineární trend, 2. diference ( ( ) n,,3t,yy2yyyy 2t1tt1ttt 2 K=+−=∆−∆=∆ −−− ) jsou přibližně konstantní. Příklad kvadratického trendu: 0 5 10 15 20 25 30 35 40 čas -2 -1 0 1 2 3 4 5 6 7 Y c) Exponenciální trend Analytické vyjádření: t 10)t(f ββ= . Informativní test: koeficienty růstu ( n,,2t, y y k 1t t t K== − ) jsou přibližně konstantní. Příklad exponenciálního trendu: 0 2 4 6 8 10 12 14 16 18 20 22 čas -10 -5 0 5 10 15 20 25 30 Y d) Modifikovaný exponenciální trend Analytické vyjádření: t 10)t(f ββ+α= . Informativní test: řada podílů sousedních 1. diferencí je přibližně konstantní. Příklad modifikovaného exponenciálního trendu 0 5 10 15 20 25 30 čas 0 20 40 60 80 100 120 Y e) Logistický trend Analytické vyjádření: t 101 )t(f ββ+ α = Informativní test: průběh 1. diferencí je podobný Gaussově křivce a podíly t1t 1t2t y1y1 y1y1 − − + ++ jsou přibližně konstantní. Příklad logistického trendu: 0 2 4 6 8 10 12 14 16 18 20 22 čas -0,4 -0,2 0,0 0,2 0,4 0,6 0,8 1,0 1,2 1,4 1,6 1,8 2,0 2,2 Y f) Gompertzova křivka Analytické vyjádření: t 1 0)t(f β αβ= Informativní test: podíly t1t 1t2t ylnyln ylnyln − − + ++ jsou přibližně konstantní. Příklad Gompertzovy křivky 0 5 10 15 20 25 30 čas 0,18 0,20 0,22 0,24 0,26 0,28 0,30 0,32 Y Příklad: Je dána časová řada potratů (v tisících) v ČR v letech 1990 až 2007 – viz datový soubor potrat_1990_2007.sta. Předpokládejte, že tato časová řada má kubický trend. Odhadněte parametry trendové funkce. Vypočtěte index determinace ID2 . Proveďte celkový F-test. Proveďte dílčí t-testy. Proveďte analýzu reziduí. Sestrojte 95% intervaly spolehlivosti pro parametry trendové funkce. Stanovte střední absolutní procentuální chybu predikce (MAPE). Graficky znázorněte průběh časové řady s odhadnutým trendem, 95% pásem spolehlivosti a 95% predikčním pásem. Řešení v systému STATISTICA: Vytvoříme datový soubor o 5 proměnných rok, počet, t, t2, t3 a 18 případech. Do proměnné rok uložíme 1990 až 2007, do proměnné počet zapíšeme zjištěné hodnoty, do proměnné t uložíme pořadová čísla 1 až 18, do proměnné t2 druhé mocniny pořadových čísel, do proměnné t3 třetí mocniny pořadových čísel. Grafické znázornění časové řady: Grafy – Bodové grafy – Proměnné X ROK, Y POCET – OK – vypneme Lineární proložení– OK. Formát – Všechny možnosti – Graf: Obecné – zaškrtneme Spojnice – OK. Vznikne spojnicový diagram. Bodový graf z pocet proti rok Tabulka1 4v*18c 1988 1990 1992 1994 1996 1998 2000 2002 2004 2006 2008 rok 30000 40000 50000 60000 70000 80000 90000 1E5 1,1E5 1,2E5 1,3E5 pocet Trendová funkce ( ) 3 3 2 210 ttttfˆ β+β+β+β= Získání odhadů parametrů: Statistiky – Vícenásobná regrese – Proměnné Závislé, Nezávislé t, t2, t3 - OK Výsledky regrese se závislou proměnnou : pocet (potrat_1990_2007.sta) R= ,98734800 R2= ,97485606 Upravené R2= ,96946808 F(3,14)=180,93 p<,00000 Směrod. chyba odhadu : 4856,5 N=18 b* Sm.chyba z b* b Sm.chyba z b t(14) p-hodn. Abs.člen t t2 t3 151202,6 5726,843 26,40243 0,000000 -4,24339 0,487857 -22092,2 2539,917 -8,69801 0,000001 5,73022 1,150334 1525,7 306,288 4,98136 0,000201 -2,37604 0,704909 -35,8 10,615 -3,37071 0,004572 Odhadnutá trendová funkce má tedy tvar: ( ) 32 t8,35t7,1525t2,220926,151202tf −+−= ) , kde t = 1, …, 18. Index determinace je 0,975, tedy kubická trendová funkce vysvětluje variabilitu dané časové řady z 97,5 %. Výsledky regrese se závislou proměnnou : pocet (potrat_1990_2007.sta) R= ,98734800 R2= ,97485606 Upravené R2= ,96946808 F(3,14)=180,93 p<,00000 Směrod. chyba odhadu : 4856,5 N=18 b* Sm.chyba z b* b Sm.chyba z b t(14) p-hodn. Abs.člen t t2 t3 151202,6 5726,843 26,40243 0,000000 -4,24339 0,487857 -22092,2 2539,917 -8,69801 0,000001 5,73022 1,150334 1525,7 306,288 4,98136 0,000201 -2,37604 0,704909 -35,8 10,615 -3,37071 0,004572 Testová statistika celkového F-testu je 180,93, p-hodnota je blízká 0, tedy na hladině významnosti 0,05 zamítáme hypotézu o nevýznamnosti modelu jako celku. Všechny čtyři dílčí t-testy mají p-hodnoty menší než 0,05, tedy na hladině významnosti 0,05 zamítáme hypotézy o nulovosti parametrů β0, β1, β2, β3. Posouzení nezávislosti reziduí pomocí Durbinovy – Watsonovy statistiky: Statistiky – Vícenásobná regrese – proměnná Závislá: y, nezávislá t, t2, t3 – OK – na záložce Residua/předpoklady/předpovědi vybereme Reziduální analýza - Detaily – Durbin-Watsonova statistika: Durbin- Watson.d Sériové korelace Odhad 1,326973 0,262189 Hodnota D-W statistiky je poněkud nízká, ale podle testu autokorelace je vše v pořádku. Posouzení homoskedasticity reziduí Reziduální analýza – Bodové grafy – Předpovědi vs. rezidua Předpovězené hodnoty vs. rezidua Závislá proměnná : pocet 20000 40000 60000 80000 1E5 1,2E5 1,4E5 Předpov. hodnoty -10000 -8000 -6000 -4000 -2000 0 2000 4000 6000 8000 10000 12000 Rezidua 0,95 Int.spol. Testování nulovosti střední hodnoty reziduí: Pro proměnnou Rezidua z tabulky uložené pomocí Reziduální analýzy provedeme jednovýběrový t-test: Statistiky Základní statistiky/tabulky – t-test, samost. vzorek – OK – proměnné Rezidua – OK. Test průměrů vůči referenční konstantě (hodnotě) (Tabulka8) Proměnná Průměr Sm.odch. N Sm.chyba Referenční konstanta t SV p Rezidua -0,000217 4407,230 18 1038,794 0,00 -0,000000 17 1,000000 Na hladině významnosti 0,05 nezamítáme hypotézu, že střední hodnota reziduí je 0. Ověření normality reziduí Sestrojíme N-P plot reziduí a současně provedeme S-W test: Normální p-graf z Rezidua Tabulka8 13v*18c -10000 -8000 -6000 -4000 -2000 0 2000 4000 6000 8000 10000 12000 Pozorovaný kvantil -2,0 -1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 2,0 Oček.normál.hodnoty Rezidua: SW-W = 0,9361; p = 0,2478 S-W test poskytuje p-hodnotu 0,2478, tedy na hladině významnosti 0,05 nezamítáme hypotézu o normalitě reziduí. Sestrojení 95% intervalů spolehlivosti pro parametry trendu: Ve výstupní tabulce výsledků regrese přidáme za proměnnou Úroveň p dvě nové proměnné dm (pro dolní meze 95% intervalů spolehlivosti) a hm (pro horní meze 95% intervalů spolehlivosti). Do Dlouhého jména proměnné dm resp. hm napíšeme: =v3-v4*VStudent(0,975;14) resp. =v3+v4*VStudent(0,975;1) Výsledky regrese se závislou proměnnou : pocet (potrat_1990_2007.sta) R= ,98734800 R2= ,97485606 Upravené R2= ,96946808 F(3,14)=180,93 p<,00000 Směrod. chyba odhadu : 4856,5 N=18 b* Sm.chyba z b* b Sm.chyba z b t(14) p-hodn. dm =v3-v4* hm =v3+v4 Abs.člen t t2 t3 151202,6 5726,843 26,40243 0,000000 138919,722 163485,435 -4,24339 0,487857 -22092,2 2539,917 -8,69801 0,000001 -27539,807 -16644,647 5,73022 1,150334 1525,7 306,288 4,98136 0,000201 868,806265 2182,64988 -2,37604 0,704909 -35,8 10,615 -3,37071 0,004572 -58,549301 -13,01365 Vidíme, že 138920 < β0 < 163485 s pravděpodobností aspoň 0,95, -27540 < β1 < -16645, 868,8 < β2 < 2182,6 -58,5 < β3 < -13 s pravděpodobností aspoň 0,95. Výpočet MAPE: Ve tabulce s uloženými rezidui odstraníme proměnné 8 – 13, přidáme proměnnou chyby a do jejího Dlouhého jména napíšeme =100*abs(v7/v2). Pak spočteme průměr této proměnné a zjistíme, že MAPE = 4,27%. Graf časové řady s proloženým kvadratickým trendem a pásem spolehlivosti a predikčním pásem získáme takto: Grafy – Bodové grafy – Proměnné X ROK, Y POCET – OK – Detaily Proložení Polynomiální. Ve vytvořeném grafu 2x klikneme na pozadí, vybereme Graf: Regresní pásy – Přidat nový pár pásů – Typ Spolehlivostní – OK. Totéž provedeme ještě jednou a nyní zaškrtneme Typ Predikční. Bodový graf z pocet proti rok potrat_1990_2007.sta 5v*18c pocet = 2,8763E11-4,3076E8*x+2,1503E5*x^2-35,7815*x^3; 0,95 Int.spol.; 0,95 Int.před. 1988 1990 1992 1994 1996 1998 2000 2002 2004 2006 2008 rok 20000 40000 60000 80000 1E5 1,2E5 1,4E5 pocet Příklad: Časová řada 112, 149, 238, 354, 580, 867 udává zisk (v tisících dolarů) jisté společnosti v prvních šesti letech její existence. a) Graficky znázorněte průběh této časové řady. b) Vypočtěte koeficienty růstu a graficky je znázorněte. c) Z grafu časové řady a chování koeficientů růstu lze usoudit, že časová řada má exponenciální trend t 10)t(f ββ= . Odhadněte jeho parametry. d) Najděte odhad zisku společnosti v 7. a 8. roce její existence. e) Zjistěte index determinace a sestrojte graf ( )( )tfˆ,yt , t = 1, ..., 6. Řešení pomocí systému STATISTICA: Vytvoříme datový soubor se dvěma proměnnými čas a Y a 6 případy. ad a) Graficky znázorníme průběh této časové řady: Grafy – Bodové grafy – Proměnné čas, Y – OK – vypneme proložení – OK. 0 1 2 3 4 5 6 7 0 100 200 300 400 500 600 700 800 900 ad b) Výpočet koeficientů růstu: Statistiky – Pokročilé lineární/nelineární modely – Časové řady/predikce – Proměnné Y – OK – OK (transformace, autokorelace, kříž. korelace, grafy) – Posun – Posun řad vzad - OK (transformovat vybrané řady) – návrat do transformace proměnných – Uložit proměnné. Ve výstupní tabulce máme proměnné Y a Y_1: Tabulka41 Y 2 Y_1 0 1 2 3 4 5 6 7 112,000 112,000 149,000 149,000 238,000 238,000 354,000 354,000 580,000 580,000 867,000 867,000 Za proměnnou Y_1 přidáme proměnnou KR a do jejího Dlouhého jména napíšeme =v2/v1. Tabulka41 Y 2 Y_1 3 KR 0 1 2 3 4 5 6 7 112,000 112,000 149,000 1,330357 149,000 238,000 1,597315 238,000 354,000 1,487395 354,000 580,000 1,638418 580,000 867,000 1,494828 867,000 Vytvoření grafu koeficientů růstu: Klikneme pravým tlačítkem na název proměnné KR – Grafy bloku dat – Spojnicový graf: celé sloupce 1 2 3 4 5 6 7 1,30 1,35 1,40 1,45 1,50 1,55 1,60 1,65 1,70 KR Vidíme, že koeficienty růstu jsou přibližně konstantní. ad c) Parametry modelu t 10)t(f ββ= odhadneme pomocí nelineární regrese: Statistiky – Pokročilé lineární/nelineární odhady - Nelineární odhady - Vlastní regrese(MNČ) - OK. Do odhadované funkce vepíšeme y=beta0*beta1^cas - OK Otevře se okno s názvem Odhad nelineárního modelu metodou nejmenších čtverců. Na liště Základní výsledky máme na výběr mezi Levenbergovou - Marquardtovou a Gaussovou - Newtonovou iterační metodou - jednu z nich zvolíme. Na liště Detailní výsledky máme v případě problémů možnost změnit počet iterací, požadovanou přesnost a počáteční hodnoty parametrů. Pokračujeme OK - otevře se okno Výsledky. Na liště Základ zvolíme Souhrn: Odhady parametru a získáme tabulku: Model je: y=beta0*beta1^cas (zisk_spolecnosti.sta) Záv.prom.:Y Hladina spolehlivosti:95.0% ( alfa =0.050) Odhad Standard chyba t-hodn. sv = 4 p-hodn. Dol. sp. Mez Hor. sp. Mez beta0 beta1 65,35424 3,575415 18,27879 0,000053 55,42730 75,28119 1,53973 0,015590 98,76297 0,000000 1,49644 1,58301 Odhadnutý model má tvar: cas 53973,135424,65y ⋅= Oba parametry jsou významné na hladině významnosti 0,05. ad d) Odhad zisku společnosti v 7. a 8. roce existence: Ve výstupní tabulce regrese odstaníme všechny proměnné kromě proměnné Odhad a sloupec parametrů transponujeme (Data – Transponovat – Soubor – OK) Přidáme dvě nové proměnné Y7, Y8 a do Dlouhého jména proměnné Y7 napíšeme =v1*v2^7 (resp. do Dlouhého jména proměnné Y8 napíšeme =v1*v2^8). 1 beta0 2 beta1 3 y7 4 y8 Odhad 65,3542445 1,53972973 1340,866 2064,571 Předpověď zisku v 7. roce existence společnosti je tedy 1340,866 tisíc dolarů a v 8. roce 2064,571 tisíc dolarů. ad e) Index determinace je ID2 = 0,9987, jak je uvedeno v záhlaví tabulky regresní analýzy. Graf závislosti predikovaných hodnot na hodnotách časové řady vytvoříme tak, že na liště Rezidua vybereme Pozorování vs. Předpovědi. 0 100 200 300 400 500 600 700 800 900 0 100 200 300 400 500 600 700 800 900 Jak index determinace, tak graf ( )( )tfˆ,yt svědčí o tom, že model byl zvolen správně. Můžeme též nakreslit dvourozměrný tečkový diagram s odhadnutou regresní křivkou: Na liště Základ vybereme Prolož. 2D funkce & pozor. hodn. Model: y=beta0*beta1^cas y=(65,3542)*(1,53973)^x 0 1 2 3 4 5 6 7 cas 0 200 400 600 800 1000 1200 1400 Y