Regresní analýza trendu v časových řadách Pojem časové řady: Časovou řadou rozumíme řadu hodnot n1 tt y,,y K určitého ukazatele uspořádanou podle přirozené časové posloupnosti t1 < ... < tn. Jsou-li časové intervaly (t1, t2), ..., (tn-1, tn) stejně dlouhé (ekvidistantní), zjednodušeně zapisujeme časovou řadu jako y1, ..., yn. Přitom ukazatel je veličina, která charakterizuje nějaký jev v určitém prostoru a určitém čase (okamžiku či intervalu). Druhy časových řad a) Časová řada okamžiková: příslušný ukazatel udává, kolik jevů existuje v daném časovém okamžiku (např. počet obyvatelstva k určitému dnu). b) Časová řada intervalová: příslušný ukazatel udává, kolik jevů vzniklo či zaniklo v určitém časovém intervalu (např. počet sňatků během roku). Nejsou-li jednotlivé časové intervaly ekvidistantní, musíme provést očištění časové řady od důsledků kalendářních variací. Příklad: Máme k dispozici údaje o tržbě obchodní organizace (v tis. Kč) v jednotlivých měsících roku 2013: 2400, 2134, 2407, 2445, 2894, 3354, 3515, 3515, 3225, 3063, 2694, 2600. Vypočtěte očištěné údaje. Řešení: Průměrná délka měsíce je 365/12 dne. Očištěná hodnota pro leden 84,2354 3112 365 2400y )o( 1 = ⋅ ⋅= , pro únor 18,2318 2812 365 2134y )o( 2 = ⋅ ⋅= . Pro ostatní měsíce analogicky dostaneme 2361,71; 2478,96; 2839,54; 3400,58, 3448,86; 3448,86; 3269,79; 3005,36; 2731,42; 2551,08. Výpočet pomocí systému STATISTICA: Vytvoříme nový datový soubor o třech proměnných: trzba, dm (délky jednotlivých měsíců) a ot (očištěná tržba) a 12 případech. Do proměnné trzba zapíšeme zjištěné hodnoty. Do proměnné dm vložíme délky jednotlivých měsíců, tj. 31, 28, 30, …, 31. Do Dlouhého jména proměnné ot napíšeme =trzba*365/(12*dm). 1 trzba 2 dm 3 ot 1 2 3 4 5 6 7 8 9 10 11 12 2400 31 2354,839 2134 28 2318,185 2407 31 2361,707 2445 30 2478,958 2894 31 2839,543 3354 30 3400,583 3515 31 3448,858 3515 31 3448,858 3225 30 3269,792 3063 31 3005,363 2694 30 2731,417 2600 31 2551,075 Grafické znázornění okamžikové časové řady Použijeme spojnicový diagram. Na vodorovnou osu vynášíme časové okamžiky t1, ..., tn, na svislou osu odpovídající hodnoty y1, ..., yn. Dvojice bodů (ti, yi), i = 1, ..., n spojíme úsečkami. Příklad: Časová řada obsahuje údaje o počtu zaměstnanců určité akciové společnosti v letech 1989 – 1996 vždy k 31.12. 1989 1990 1991 1992 1993 1994 1995 1996 622 627 631 635 641 641 632 625 Znázorněte tuto časovou řadu graficky. Řešení pomocí systému STATISTICA: Vytvoříme datový soubor o dvou proměnných nazvaných rok a pocet a 8 případech. Grafy – Bodové grafy – odškrtneme Lineární proložení – Proměnné X – rok, Y – počet – OK – OK. 2x klikneme na pozadí grafu – vybereme Graf: obecné – zaškrtneme Spojnice – OK. 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 rok 620 622 624 626 628 630 632 634 636 638 640 642 pocet Grafické znázornění intervalové časové řady Použijeme sloupkový diagram. Je to soustava obdélníků, kde šířka obdélníku je rovna délce intervalu a výška odpovídá hodnotě ukazatele v daném intervalu. Ke znázornění intervalové časové řady lze použít i spojnicový diagram, přičemž na vodorovnou osu vynášíme středy příslušných intervalů. Příklad: Máme k dispozici údaje o produkci určitého podniku (v tisících výrobků) v letech 1991-1996. 1991 1992 1993 1994 1995 1996 114 106 107 102 116 137 Znázorněte tuto časovou řadu graficky. Řešení pomocí systému STATISTICA: Vytvoříme datový soubor o dvou proměnných nazvaných rok a produkce a 6 případech. Grafy – Bodové grafy – odškrtneme Lineární proložení – Proměnné X – rok, Y – produkce – OK – OK. 2x klikneme na pozadí grafu – vybereme Graf: obecné – zaškrtneme Spojnice – Přidat nový graf – typ Sloupcový graf – OK. Do sloupců označených jako Nový1, Nový2 okopírujeme hodnoty proměnných rok a produkce. Ve Všech možnostech: Sloupce upravíme šířku sloupce na 1. 1990 1991 1992 1993 1994 1995 1996 1997 rok 100 105 110 115 120 125 130 135 140 produkce Aditivní model časové řady Předpokládejme, že pro časovou řadu y1, ..., yn platí model yt = f(t) + εt, t = 1, ..., n, kde f(t) je neznámá trendová funkce (trend), kterou považujeme za systematickou (deterministickou) složku časové řady (popisuje hlavní tendenci dlouhodobého vývoje časové řady), εt je náhodná složka časové řady zahrnující odchylky od trendu. Náhodná složka splňuje předpoklady E(εt) = 0, D(εt) = σ2 , C(εt, εt+h) = 0, εt ~ N(0, σ2 ) (říkáme, že εt je bílý šum). Odhad trendu časové řady pomocí klouzavých průměrů Podstata klouzavých průměrů Předpokládáme, že časová řada se řídí aditivním modelem yt = f(t) + εt, t = 1, ..., n. Odhad trendu v bodě t získáme určitým zprůměrováním původních pozorování z jistého okolí uvažovaného časového okamžiku t. Můžeme si představit, že podél dané časové řady klouže okénko, v jehož rámci se průměruje. Nejprve musíme zvolit délku okna h > 1, v němž se bude počítat průměrná hodnota h pozorovaných hodnot iy , i = z, z+1, …, z+h – 1 v po sobě jdoucích časech ztt = , 1ztt += , …, 1hztt −+= . Hodnota z představuje začátek okna. a) Nechť šířka h vyhlazovacího okénka je liché číslo: h = 2d + 1. Pak ∑ + = −++ + = 1d2 1i 1izdz y 1d2 1 yˆ pro z = 1, …, n – 2d. Vypočtený průměr se přiřadí časovému okamžiku, který odpovídá středu okna. b) Nechť šířka h vyhlazovacího okénka je sudé číslo: h = 2d. Pak      += ∑∑ = + = −++ d2 1i iz d2 1i 1izdz yy d4 1 yˆ pro z = 1, …, n – 2d. Odhad trendu v bodě t se vypočte jako průměr ze dvou klouzavých průměrů, které příslušejí časovým okamžikům nejblíže vlevo a vpravo od středu okna. Tento průměr se přiřadí nejblíže většímu okamžiku od středu okna. Hodnoty centrovaného klouzavého průměru a trendové funkce ( )tf ) jsou definovány v časech 1dtt += , 2dtt += , …, dntt −= . Šířka vyhlazovacího okénka Velmi důležitou otázkou je stanovení šířky vyhlazovacího okénka. Je-li okénko příliš široké, bude se odhad trendu blížit přímce (říkáme, že je přehlazen) a zároveň se ztratí velký počet členů na začátku a na konci časové řady. Je-li naopak okénko úzké, bude se odhad trendu blížit původním hodnotám (říkáme, že odhad je podhlazen). Nejčastěji se volí šířka okénka h = 3, 5, 7, pro čtvrtletní hodnoty pak 4. Příklad: Časová řada -4,483, -39,534, -99,57, -152,99, -150,45, -80,239, -64,413, -120,825, -117,415, -70,811, -69,793, -26,438, 38,624, 39,761, 87,915, 67,246, 149,587, 121,241, 191,128, 305,71, 351,22 udává bilanci zahraničního obchodu ČR (v miliardách Kč) v letech 1993 až 2013. a) Odhadněte trend této časové řady pomocí klouzavých průměrů s vyhlazovacím okénkem šířky 3 a poté 5. b) Graficky znázorněte průběh časové řady s odhadnutým trendem. Řešení pomocí systému STATISTICA: Načteme datový soubor bilance.sta o dvou proměnných rok a bilance a 21 případech. Statistiky – Pokročilé lineární/nelineární modely – Časové řady/predikce – Proměnné bilance – OK– OK (transformace, autokorelace, kříž. korelace, grafy) – Vyhlazování – zaškrtneme N-bod. klouzavý průměr, N = 3 – OK (Transformovat vybrané řady) – vykreslí se graf, vrátíme se do Transformace proměnných – Uložit proměnné. Otevře se nový spreadsheet, kde v proměnné bilance_1 jsou uloženy klouzavé průměry pro N = 3. Totéž uděláme pro případ N = 5. Ve spreadsheetu se proměnná bilance_1 přepíše na bilance_2 a nová proměnná se uloží jako bilance_1. Nově vzniklé proměnné nazveme KP3 a KP5. K datovému souboru přidáme proměnnou rok, do jejíhož Dlouhého jména napíšeme =1992+v0. bilance.sta 1 rok 2 BILANCE 3 KP3 4 KP5 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 1993 -4,483 1994 -39,534 -47,862 1995 -99,570 -97,365 -89,405 1996 -152,990 -134,337 -104,557 1997 -150,450 -127,893 -109,532 1998 -80,239 -98,367 -113,783 1999 -64,413 -88,492 -106,668 2000 -120,825 -100,884 -90,741 2001 -117,415 -103,017 -88,651 2002 -70,811 -86,006 -81,056 2003 -69,793 -55,681 -49,167 2004 -26,438 -19,202 -17,731 2005 38,624 17,316 14,014 2006 39,761 55,433 41,422 2007 87,915 64,974 76,627 2008 67,246 101,583 93,150 2009 149,587 112,691 123,423 2010 121,241 153,985 166,982 2011 191,128 206,026 223,777 2012 305,710 282,686 2013 351,220 Grafické znázornění časové řady s odhadnutým trendem provedeme pomocí vícenásobných bodových grafů. 1992 1994 1996 1998 2000 2002 2004 2006 2008 2010 2012 2014 rok -200 -100 0 100 200 300 400 1992 1994 1996 1998 2000 2002 2004 2006 2008 2010 2012 2014 rok -200 -100 0 100 200 300 400 Cíl regresní analýzy trendu Regresní analýza trendu má objasnit vztah mezi závisle proměnnou veličinou Y a časem t. Předpokládáme, že trend f(t) závisí (lineárně či nelineárně) na neznámých parametrech β0, β1, ..., βk a známých funkcích φ0(t), φ1(t), ...., φk(t), které již neobsahují žádné neznámé parametry, tj. f(t) = g(β0, β1, ..., βk; φ0(t), φ1(t), ...., φk(t)). Odhady b0, b1, ..., bk neznámých parametrů β0, β1, ..., βk lze získat např. metodou nejmenších čtverců a pak vyjádřit odhad )t(f ) neznámého trendu v bodě t pomocí odhadů b0, b1, ..., bk a funkcí φ0(t), φ1(t), ...., φk(t), tj. )t(f ) = g(b0, b1, ..., bk; φ0(t), φ1(t), ...., φk(t)). Nejdůležitější typy trendových funkcí Volba typu trendové funkce se provádí - na základě teoretických znalostí a zkušeností se zkoumanou veličinou Yt - pomocí grafu časové řady - pomocí informativních testů založených na jednoduchých charakteristikách časové řady a) Lineární trend Analytické vyjádření: t)t(f 10 β+β= Informativní test: 1. diference ( n,,2t,yyy 1ttt K=−=∆ − ) jsou přibližně konstantní. Příklad lineárního trendu: 0 10 20 30 40 50 60 70 80 90 100 čas 6 7 8 9 10 11 12 Y b) Kvadratický trend Analytické vyjádření: 2 210 tt)t(f β+β+β= Informativní test: 1. diference mají přibližně lineární trend, 2. diference ( ( ) n,,3t,yy2yyyy 2t1tt1ttt 2 K=+−=∆−∆=∆ −−− ) jsou přibližně konstantní. Příklad kvadratického trendu: 0 5 10 15 20 25 30 35 40 čas -2 -1 0 1 2 3 4 5 6 7 Y c) Exponenciální trend Analytické vyjádření: t 10)t(f ββ= . Informativní test: koeficienty růstu ( n,,2t, y y k 1t t t K== − ) jsou přibližně konstantní. Příklad exponenciálního trendu: 0 2 4 6 8 10 12 14 16 18 20 22 čas -10 -5 0 5 10 15 20 25 30 Y d) Modifikovaný exponenciální trend Analytické vyjádření: t 10)t(f ββ+α= . Informativní test: řada podílů sousedních 1. diferencí je přibližně konstantní. Příklad modifikovaného exponenciálního trendu 0 5 10 15 20 25 30 čas 0 20 40 60 80 100 120 Y e) Logistický trend Analytické vyjádření: t 101 )t(f ββ+ α = Informativní test: průběh 1. diferencí je podobný Gaussově křivce a podíly t1t 1t2t y1y1 y1y1 − − + ++ jsou přibližně konstantní. Příklad logistického trendu: 0 2 4 6 8 10 12 14 16 18 20 22 čas -0,4 -0,2 0,0 0,2 0,4 0,6 0,8 1,0 1,2 1,4 1,6 1,8 2,0 2,2 Y f) Gompertzova křivka Analytické vyjádření: t 1 0)t(f β αβ= Informativní test: podíly t1t 1t2t ylnyln ylnyln − − + ++ jsou přibližně konstantní. Příklad Gompertzovy křivky 0 5 10 15 20 25 30 čas 0,18 0,20 0,22 0,24 0,26 0,28 0,30 0,32 Y Příklad: Je dána časová řada potratů (v tisících) v ČR v letech 1993 až 2013 – viz datový soubor potraty_CR.sta. Předpokládejte, že tato časová řada má kubický trend. Odhadněte parametry trendové funkce. Vypočtěte index determinace ID2 . Proveďte celkový F-test. Proveďte dílčí t-testy. Proveďte analýzu reziduí. Sestrojte 95% intervaly spolehlivosti pro parametry trendové funkce. Stanovte střední absolutní procentuální chybu predikce (MAPE). Graficky znázorněte průběh časové řady s odhadnutým trendem, 95% pásem spolehlivosti a 95% predikčním pásem. Řešení v systému STATISTICA: Načteme datový soubor potraty_CR.sta o dvou proměnných rok, počet a 21 případech. Přidáme tři nové proměnné t, t2 a t3. Do proměnné t uložíme pořadová čísla 1 až 21, do proměnné t2 druhé mocniny pořadových čísel, do proměnné t3 třetí mocniny pořadových čísel. Grafické znázornění časové řady: Grafy – Bodové grafy – Proměnné X rok, Y pocet – OK – vypneme Lineární proložení – OK. Formát – Všechny možnosti – Graf: Obecné – zaškrtneme Spojnice – OK. Vznikne spojnicový diagram. Bodový graf z pocet proti rok potraty_CR.sta 5v*21c 1992 1994 1996 1998 2000 2002 2004 2006 2008 2010 2012 2014 rok 30000 40000 50000 60000 70000 80000 90000 pocet Trendová funkce ( ) 3 3 2 210 ttttfˆ β+β+β+β= Získání odhadů parametrů: Statistiky – Vícenásobná regrese – Proměnné Závislé počet, Nezávislé t, t2, t3 - OK Výsledky regrese se závislou proměnnou : pocet (potraty_CR.sta) R= ,98289265 R2= ,96607796 Upravené R2= ,96009172 F(3,17)=161,38 p<,00000 Směrod. chyba odhadu : 2452,3 N=21 b* Sm.chyba z b* b Sm.chyba z b t(17) p-hodn. Abs.člen t t2 t3 87825,07 2587,863 33,93729 0,000000 -4,43177 0,502979 -8767,76 995,088 -8,81104 0,000000 6,36704 1,188830 556,08 103,828 5,35572 0,000052 -2,84112 0,730560 -12,08 3,107 -3,88896 0,001180 Odhadnutá trendová funkce má tedy tvar: ( ) 32 t08,12t08,556t76,876707,87825tf −+−= ) , kde t = 1, …, 21. Index determinace je 0,966, tedy kubická trendová funkce vysvětluje variabilitu dané časové řady z 96,6 %. Výsledky regrese se závislou proměnnou : pocet (potraty_CR.sta) R= ,98289265 R2= ,96607796 Upravené R2= ,96009172 F(3,17)=161,38 p<,00000 Směrod. chyba odhadu : 2452,3 N=21 b* Sm.chyba z b* b Sm.chyba z b t(17) p-hodn. Abs.člen t t2 t3 87825,07 2587,863 33,93729 0,000000 -4,43177 0,502979 -8767,76 995,088 -8,81104 0,000000 6,36704 1,188830 556,08 103,828 5,35572 0,000052 -2,84112 0,730560 -12,08 3,107 -3,88896 0,001180 Testová statistika celkového F-testu je 161,38, p-hodnota je blízká 0, tedy na hladině významnosti 0,05 zamítáme hypotézu o nevýznamnosti modelu jako celku. Všechny čtyři dílčí t-testy mají p-hodnoty menší než 0,05, tedy na hladině významnosti 0,05 zamítáme hypotézy o nulovosti parametrů β0, β1, β2, β3. Posouzení nezávislosti reziduí pomocí Durbinovy – Watsonovy statistiky: Statistiky – Vícenásobná regrese – proměnná Závislá: y, nezávislá t, t2, t3 – OK – na záložce Residua/předpoklady/předpovědi vybereme Reziduální analýza - Detaily – Durbin-Watsonova statistika: Durbin- Watson.d Sériové korelace Odhad 1,469592 0,096446 Hodnota D-W statistiky je poněkud nízká, ale podle testu autokorelace je vše v pořádku. Posouzení homoskedasticity reziduí Reziduální analýza – Bodové grafy – Předpovědi vs. rezidua Předpovězené hodnoty vs. rezidua Závislá proměnná : pocet 35000 40000 45000 50000 55000 60000 65000 70000 75000 80000 85000 Předpov. hodnoty -6000 -4000 -2000 0 2000 4000 6000 8000 Rezidua 0,95 Int.spol. Testování nulovosti střední hodnoty reziduí: Pro proměnnou Rezidua z tabulky uložené pomocí Reziduální analýzy provedeme jednovýběrový t-test: Statistiky Základní statistiky/tabulky – t-test, samost. vzorek – OK – proměnné Rezidua – OK. Test průměrů vůči referenční konstantě (hodnotě) (Tabulka23) Proměnná Průměr Sm.odch. N Sm.chyba Referenční konstanta t SV p Rezidua 0,000186 2260,908 21 493,3705 0,00 0,000000 20 1,000000 Na hladině významnosti 0,05 nezamítáme hypotézu, že střední hodnota reziduí je 0. Ověření normality reziduí Sestrojíme N-P plot reziduí a současně provedeme S-W test: Normální p-graf z Rezidua Tabulka23 8v*21c -6000 -4000 -2000 0 2000 4000 6000 8000 Pozorovaný kvantil -2,5 -2,0 -1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 2,0 2,5 Oček.normál.hodnoty Rezidua: SW-W = 0,8823; p = 0,0161 S-W test poskytuje p-hodnotu 0,0161, tedy na hladině významnosti 0,05 zamítáme hypotézu o normalitě reziduí. Sestrojení 95% intervalů spolehlivosti pro parametry trendu: Ve výstupní tabulce výsledků regrese přidáme za proměnnou p-hodn. dvě nové proměnné dm (pro dolní meze 95% intervalů spolehlivosti) a hm (pro horní meze 95% intervalů spolehlivosti). Do Dlouhého jména proměnné dm resp. hm napíšeme: =v3-v4*VStudent(0,975;17) resp. =v3+v4*VStudent(0,975;17) Výsledky regrese se závislou proměnnou : pocet (potraty_CR.sta) R= ,98289265 R2= ,96607796 Upravené R2= ,96009172 F(3,17)=161,38 p<,00000 Směrod. chyba odhadu : 2452,3 N=21 b* Sm.chyba z b* b Sm.chyba z b t(17) p-hodn. dm =v3-v4*VSt hm =v3+v4*VSt Abs.člen t t2 t3 87825,07 2587,863 33,93729 0,000000 82365,1582 93284,9871 -4,43177 0,502979 -8767,76 995,088 -8,81104 0,000000 -10867,21 -6668,3052 6,36704 1,188830 556,08 103,828 5,35572 0,000052 337,017114 775,134431 -2,84112 0,730560 -12,08 3,107 -3,88896 0,001180 -18,637869 -5,5277001 Vidíme, že 82365 < β0 < 93285 s pravděpodobností aspoň 0,95, -10867 < β1 < -6668, 337 < β2 < 775, -18,6 < β3 < -5,2 s pravděpodobností aspoň 0,95. Výpočet MAPE: Ve tabulce s uloženými rezidui odstraníme proměnné 8 – 13, přidáme proměnnou chyby a do jejího Dlouhého jména napíšeme =100*abs(v7/v2). Pak spočteme průměr této proměnné a zjistíme, že MAPE = 2,47 %. Graf časové řady s proloženým kvadratickým trendem a pásem spolehlivosti a predikčním pásem získáme takto: Grafy – Bodové grafy – Proměnné X rok, Y pocet – OK – Detaily Proložení Polynomiální. Ve vytvořeném grafu 2x klikneme na pozadí, vybereme Graf: Regresní pásy – Přidat nový pár pásů – Typ Spolehlivostní – OK. Totéž provedeme ještě jednou a nyní zaškrtneme Typ Predikční. 1992 1994 1996 1998 2000 2002 2004 2006 2008 2010 2012 2014 rok 30000 40000 50000 60000 70000 80000 90000 pocet Příklad: Časová řada 112, 149, 238, 354, 580, 867 udává zisk (v tisících dolarů) jisté společnosti v prvních šesti letech její existence. a) Graficky znázorněte průběh této časové řady. b) Vypočtěte koeficienty růstu a graficky je znázorněte. c) Z grafu časové řady a chování koeficientů růstu lze usoudit, že časová řada má exponenciální trend t 10)t(f ββ= . Odhadněte jeho parametry. d) Najděte odhad zisku společnosti v 7. a 8. roce její existence. e) Zjistěte index determinace a sestrojte graf ( )( )tfˆ,yt , t = 1, ..., 6. Řešení pomocí systému STATISTICA: Vytvoříme datový soubor se dvěma proměnnými čas a Y a 6 případy. ad a) Graficky znázorníme průběh této časové řady: Grafy – Bodové grafy – Proměnné čas, Y – OK – vypneme proložení – OK. 0 1 2 3 4 5 6 7 0 100 200 300 400 500 600 700 800 900 ad b) Výpočet koeficientů růstu: Statistiky – Pokročilé lineární/nelineární modely – Časové řady/predikce – Proměnné Y – OK – OK (transformace, autokorelace, kříž. korelace, grafy) – Posun – Posun řad vzad - OK (transformovat vybrané řady) – návrat do transformace proměnných – Uložit proměnné. Ve výstupní tabulce máme proměnné Y a Y_1: Tabulka41 Y 2 Y_1 0 1 2 3 4 5 6 7 112,000 112,000 149,000 149,000 238,000 238,000 354,000 354,000 580,000 580,000 867,000 867,000 Za proměnnou Y_1 přidáme proměnnou KR a do jejího Dlouhého jména napíšeme =v2/v1. Tabulka41 Y 2 Y_1 3 KR 0 1 2 3 4 5 6 7 112,000 112,000 149,000 1,330357 149,000 238,000 1,597315 238,000 354,000 1,487395 354,000 580,000 1,638418 580,000 867,000 1,494828 867,000 Vytvoření grafu koeficientů růstu: Klikneme pravým tlačítkem na název proměnné KR – Grafy bloku dat – Spojnicový graf: celé sloupce 1 2 3 4 5 6 7 1,30 1,35 1,40 1,45 1,50 1,55 1,60 1,65 1,70 KR Vidíme, že koeficienty růstu jsou přibližně konstantní. ad c) Parametry modelu t 10)t(f ββ= odhadneme pomocí nelineární regrese: Statistiky – Pokročilé lineární/nelineární odhady - Nelineární odhady - Vlastní regrese(MNČ) - OK. Do odhadované funkce vepíšeme y=beta0*beta1^cas - OK Otevře se okno s názvem Odhad nelineárního modelu metodou nejmenších čtverců. Na liště Základní výsledky máme na výběr mezi Levenbergovou - Marquardtovou a Gaussovou - Newtonovou iterační metodou - jednu z nich zvolíme. Na liště Detailní výsledky máme v případě problémů možnost změnit počet iterací, požadovanou přesnost a počáteční hodnoty parametrů. Pokračujeme OK - otevře se okno Výsledky. Na liště Základ zvolíme Souhrn: Odhady parametru a získáme tabulku: Model je: y=beta0*beta1^cas (zisk_spolecnosti.sta) Záv.prom.:Y Hladina spolehlivosti:95.0% ( alfa =0.050) Odhad Standard chyba t-hodn. sv = 4 p-hodn. Dol. sp. Mez Hor. sp. Mez beta0 beta1 65,35424 3,575415 18,27879 0,000053 55,42730 75,28119 1,53973 0,015590 98,76297 0,000000 1,49644 1,58301 Odhadnutý model má tvar: cas 53973,135424,65y ⋅= Oba parametry jsou významné na hladině významnosti 0,05. ad d) Odhad zisku společnosti v 7. a 8. roce existence: Ve výstupní tabulce regrese odstaníme všechny proměnné kromě proměnné Odhad a sloupec parametrů transponujeme (Data – Transponovat – Soubor – OK) Přidáme dvě nové proměnné Y7, Y8 a do Dlouhého jména proměnné Y7 napíšeme =v1*v2^7 (resp. do Dlouhého jména proměnné Y8 napíšeme =v1*v2^8). 1 beta0 2 beta1 3 y7 4 y8 Odhad 65,3542445 1,53972973 1340,866 2064,571 Předpověď zisku v 7. roce existence společnosti je tedy 1340,866 tisíc dolarů a v 8. roce 2064,571 tisíc dolarů. ad e) Index determinace je ID2 = 0,9987, jak je uvedeno v záhlaví tabulky regresní analýzy. Graf závislosti predikovaných hodnot na hodnotách časové řady vytvoříme tak, že na liště Rezidua vybereme Pozorování vs. Předpovědi. 0 100 200 300 400 500 600 700 800 900 0 100 200 300 400 500 600 700 800 900 Jak index determinace, tak graf ( )( )tfˆ,yt svědčí o tom, že model byl zvolen správně. Můžeme též nakreslit dvourozměrný tečkový diagram s odhadnutou regresní křivkou: Na liště Základ vybereme Prolož. 2D funkce & pozor. hodn. Model: y=beta0*beta1^cas y=(65,3542)*(1,53973)^x 0 1 2 3 4 5 6 7 cas 0 200 400 600 800 1000 1200 1400 Y