Regresní analýza trendu v časových řadách
Pojem časové řady: Časovou řadou rozumíme řadu hodnot n1 tt y,,y K určitého ukazatele uspořádanou podle přirozené
časové posloupnosti t1 < ... < tn. Jsou-li časové intervaly (t1, t2), ..., (tn-1, tn) stejně dlouhé (ekvidistantní), zjednodušeně
zapisujeme časovou řadu jako y1, ..., yn. Přitom ukazatel je veličina, která charakterizuje nějaký jev v určitém prostoru a
určitém čase (okamžiku či intervalu).
Druhy časových řad
a) Časová řada okamžiková: příslušný ukazatel udává, kolik jevů existuje v daném časovém okamžiku (např. počet
obyvatelstva k určitému dnu).
b) Časová řada intervalová: příslušný ukazatel udává, kolik jevů vzniklo či zaniklo v určitém časovém intervalu (např. počet
sňatků během roku). Nejsou-li jednotlivé časové intervaly ekvidistantní, musíme provést očištění časové řady od důsledků
kalendářních variací.
Příklad: Máme k dispozici údaje o tržbě obchodní organizace (v tis. Kč) v jednotlivých měsících roku 2013: 2400, 2134,
2407, 2445, 2894, 3354, 3515, 3515, 3225, 3063, 2694, 2600. Vypočtěte očištěné údaje.
Řešení: Průměrná délka měsíce je 365/12 dne. Očištěná hodnota
pro leden 84,2354
3112
365
2400y )o(
1 =
⋅
⋅= ,
pro únor 18,2318
2812
365
2134y )o(
2 =
⋅
⋅= .
Pro ostatní měsíce analogicky dostaneme
2361,71; 2478,96; 2839,54; 3400,58, 3448,86; 3448,86; 3269,79; 3005,36; 2731,42; 2551,08.
Výpočet pomocí systému STATISTICA:
Vytvoříme nový datový soubor o třech proměnných: trzba, dm (délky jednotlivých měsíců) a ot (očištěná tržba) a 12
případech. Do proměnné trzba zapíšeme zjištěné hodnoty. Do proměnné dm vložíme délky jednotlivých měsíců, tj. 31, 28,
30, …, 31. Do Dlouhého jména proměnné ot napíšeme =trzba*365/(12*dm).
1
trzba
2
dm
3
ot
1
2
3
4
5
6
7
8
9
10
11
12
2400 31 2354,839
2134 28 2318,185
2407 31 2361,707
2445 30 2478,958
2894 31 2839,543
3354 30 3400,583
3515 31 3448,858
3515 31 3448,858
3225 30 3269,792
3063 31 3005,363
2694 30 2731,417
2600 31 2551,075
Grafické znázornění okamžikové časové řady
Použijeme spojnicový diagram. Na vodorovnou osu vynášíme časové okamžiky t1, ..., tn, na svislou osu odpovídající
hodnoty y1, ..., yn. Dvojice bodů (ti, yi), i = 1, ..., n spojíme úsečkami.
Příklad: Časová řada obsahuje údaje o počtu zaměstnanců určité akciové společnosti v letech 1989 – 1996 vždy k 31.12.
1989 1990 1991 1992 1993 1994 1995 1996
622 627 631 635 641 641 632 625
Znázorněte tuto časovou řadu graficky.
Řešení pomocí systému STATISTICA:
Vytvoříme datový soubor o dvou proměnných nazvaných rok a pocet a 8 případech.
Grafy – Bodové grafy – odškrtneme Lineární proložení – Proměnné X – rok, Y – počet – OK – OK. 2x klikneme na pozadí
grafu – vybereme Graf: obecné – zaškrtneme Spojnice – OK.
1988 1989 1990 1991 1992 1993 1994 1995 1996 1997
rok
620
622
624
626
628
630
632
634
636
638
640
642
pocet
Grafické znázornění intervalové časové řady
Použijeme sloupkový diagram. Je to soustava obdélníků, kde šířka obdélníku je rovna délce intervalu a výška odpovídá
hodnotě ukazatele v daném intervalu. Ke znázornění intervalové časové řady lze použít i spojnicový diagram, přičemž na
vodorovnou osu vynášíme středy příslušných intervalů.
Příklad: Máme k dispozici údaje o produkci určitého podniku (v tisících výrobků) v letech 1991-1996.
1991 1992 1993 1994 1995 1996
114 106 107 102 116 137
Znázorněte tuto časovou řadu graficky.
Řešení pomocí systému STATISTICA:
Vytvoříme datový soubor o dvou proměnných nazvaných rok a produkce a 6 případech.
Grafy – Bodové grafy – odškrtneme Lineární proložení – Proměnné X – rok, Y – produkce – OK – OK. 2x klikneme na
pozadí grafu – vybereme Graf: obecné – zaškrtneme Spojnice – Přidat nový graf – typ Sloupcový graf – OK. Do sloupců
označených jako Nový1, Nový2 okopírujeme hodnoty proměnných rok a produkce. Ve Všech možnostech: Sloupce
upravíme šířku sloupce na 1.
1990 1991 1992 1993 1994 1995 1996 1997
rok
100
105
110
115
120
125
130
135
140
produkce
Aditivní model časové řady
Předpokládejme, že pro časovou řadu y1, ..., yn platí model
yt = f(t) + εt, t = 1, ..., n, kde
f(t) je neznámá trendová funkce (trend), kterou považujeme za systematickou (deterministickou)
složku časové řady (popisuje hlavní tendenci dlouhodobého vývoje časové řady),
εt je náhodná složka časové řady zahrnující odchylky od trendu. Náhodná složka splňuje
předpoklady
E(εt) = 0,
D(εt) = σ2
,
C(εt, εt+h) = 0,
εt ~ N(0, σ2
) (říkáme, že εt je bílý šum).
Odhad trendu časové řady pomocí klouzavých průměrů
Podstata klouzavých průměrů
Předpokládáme, že časová řada se řídí aditivním modelem
yt = f(t) + εt, t = 1, ..., n.
Odhad trendu v bodě t získáme určitým zprůměrováním původních pozorování z jistého okolí
uvažovaného časového okamžiku t. Můžeme si představit, že podél dané časové řady klouže
okénko, v jehož rámci se průměruje.
Nejprve musíme zvolit délku okna h > 1, v němž se bude počítat průměrná hodnota
h pozorovaných hodnot iy , i = z, z+1, …, z+h – 1 v po sobě jdoucích časech
ztt = , 1ztt += , …, 1hztt −+= . Hodnota z představuje začátek okna.
a) Nechť šířka h vyhlazovacího okénka je liché číslo: h = 2d + 1. Pak ∑
+
=
−++
+
=
1d2
1i
1izdz y
1d2
1
yˆ pro
z = 1, …, n – 2d. Vypočtený průměr se přiřadí časovému okamžiku, který odpovídá středu okna.
b) Nechť šířka h vyhlazovacího okénka je sudé číslo: h = 2d. Pak 



 += ∑∑
=
+
=
−++
d2
1i
iz
d2
1i
1izdz yy
d4
1
yˆ
pro z = 1, …, n – 2d. Odhad trendu v bodě t se vypočte jako průměr ze dvou klouzavých
průměrů, které příslušejí časovým okamžikům nejblíže vlevo a vpravo od středu okna. Tento
průměr se přiřadí nejblíže většímu okamžiku od středu okna.
Hodnoty centrovaného klouzavého průměru a trendové funkce ( )tf
)
jsou definovány v časech
1dtt += , 2dtt += , …, dntt −= .
Šířka vyhlazovacího okénka
Velmi důležitou otázkou je stanovení šířky vyhlazovacího okénka. Je-li okénko příliš široké,
bude se odhad trendu blížit přímce (říkáme, že je přehlazen) a zároveň se ztratí velký počet členů
na začátku a na konci časové řady. Je-li naopak okénko úzké, bude se odhad trendu blížit
původním hodnotám (říkáme, že odhad je podhlazen). Nejčastěji se volí šířka okénka h = 3, 5,
7, pro čtvrtletní hodnoty pak 4.
Příklad: Časová řada 215, 219, 222, 235, 202, 207, 187, 204, 174, 172, 201, 272 udává roční objemy vývozu piva
(v miliónech litrů) z Československa v letech 1980 až 1991.
a) Odhadněte trend této časové řady pomocí klouzavých průměrů s vyhlazovacím okénkem šířky 3 a poté 5.
b) Graficky znázorněte průběh časové řady s odhadnutým trendem.
Řešení pomocí systému STATISTICA:
Vytvoříme datový soubor export_piva.sta o dvou proměnných ROK a VYVOZ a dvanácti případech.
Statistiky – Pokročilé lineární/nelineární modely – Časové řady/predikce – Proměnné Y – OK– OK (transformace,
autokorelace, kříž. korelace, grafy) – Vyhlazování – zaškrtneme N-bod. klouzavý průměr, N = 3 – OK (Transformovat
vybrané řady) – vykreslí se graf, vrátíme se do Transformace proměnných – Uložit proměnné. Otevře se nový spreadsheet,
kde v proměnné VYVOZ_1 jsou uloženy klouzavé průměry pro N = 3. Totéž uděláme pro případ N = 5. Ve spreadsheetu se
proměnná VYVOZ_1 přepíše na VYVOZ_2 a nová proměnná se uloží jako VYVOZ_1. Nově vzniklé proměnné nazveme
KP3 a KP5. K datovému souboru přidáme proměnnou ROK, do jejíhož Dlouhého jména napíšeme =1979+v0.
export_piva.sta
1
rok
2
VYVOZ
3
KP3
4
KP5
1
2
3
4
5
6
7
8
9
10
11
12
1980 215,000
1981 219,000 218,667
1982 222,000 225,333 218,600
1983 235,000 219,667 217,000
1984 202,000 214,667 210,600
1985 207,000 198,667 207,000
1986 187,000 199,333 194,800
1987 204,000 188,333 188,800
1988 174,000 183,333 187,600
1989 172,000 182,333 204,600
1990 201,000 215,000
1991 272,000
Grafické znázornění časové řady s odhadnutým trendem provedeme pomocí vícenásobných bodových grafů.
1978 1980 1982 1984 1986 1988 1990 1992
160
180
200
220
240
260
280
1978 1980 1982 1984 1986 1988 1990 1992
160
180
200
220
240
260
280
Cíl regresní analýzy trendu
Regresní analýza trendu má objasnit vztah mezi závisle proměnnou veličinou Y a časem t.
Předpokládáme, že trend f(t) závisí (lineárně či nelineárně) na neznámých parametrech β0, β1, ..., βk a známých funkcích
φ0(t), φ1(t), ...., φk(t), které již neobsahují žádné neznámé parametry, tj.
f(t) = g(β0, β1, ..., βk; φ0(t), φ1(t), ...., φk(t)).
Odhady b0, b1, ..., bk neznámých parametrů β0, β1, ..., βk lze získat např. metodou nejmenších čtverců a pak vyjádřit odhad
)t(f
)
neznámého trendu v bodě t pomocí odhadů b0, b1, ..., bk a funkcí φ0(t), φ1(t), ...., φk(t), tj.
)t(f
)
= g(b0, b1, ..., bk; φ0(t), φ1(t), ...., φk(t)).
Nejdůležitější typy trendových funkcí
Volba typu trendové funkce se provádí
- na základě teoretických znalostí a zkušeností se zkoumanou veličinou Yt
- pomocí grafu časové řady
- pomocí informativních testů založených na jednoduchých charakteristikách časové řady
a) Lineární trend
Analytické vyjádření: t)t(f 10 β+β=
Informativní test: 1. diference ( n,,2t,yyy 1ttt K=−=∆ − ) jsou přibližně konstantní.
Příklad lineárního trendu:
0 10 20 30 40 50 60 70 80 90 100
čas
6
7
8
9
10
11
12
Y
b) Kvadratický trend
Analytické vyjádření: 2
210 tt)t(f β+β+β=
Informativní test: 1. diference mají přibližně lineární trend, 2. diference
( ( )
n,,3t,yy2yyyy 2t1tt1ttt
2
K=+−=∆−∆=∆ −−−
) jsou přibližně konstantní.
Příklad kvadratického trendu:
0 5 10 15 20 25 30 35 40
čas
-2
-1
0
1
2
3
4
5
6
7
Y
c) Exponenciální trend
Analytické vyjádření:
t
10)t(f ββ= .
Informativní test: koeficienty růstu ( n,,2t,
y
y
k
1t
t
t K==
−
) jsou přibližně konstantní.
Příklad exponenciálního trendu:
0 2 4 6 8 10 12 14 16 18 20 22
čas
-10
-5
0
5
10
15
20
25
30
Y
d) Modifikovaný exponenciální trend
Analytické vyjádření:
t
10)t(f ββ+α= .
Informativní test: řada podílů sousedních 1. diferencí je přibližně konstantní.
Příklad modifikovaného exponenciálního trendu
0 5 10 15 20 25 30
čas
0
20
40
60
80
100
120
Y
e) Logistický trend
Analytické vyjádření: t
101
)t(f
ββ+
α
=
Informativní test: průběh 1. diferencí je podobný Gaussově křivce a podíly
t1t
1t2t
y1y1
y1y1
−
−
+
++
jsou
přibližně konstantní.
Příklad logistického trendu:
0 2 4 6 8 10 12 14 16 18 20 22
čas
-0,4
-0,2
0,0
0,2
0,4
0,6
0,8
1,0
1,2
1,4
1,6
1,8
2,0
2,2
Y
f) Gompertzova křivka
Analytické vyjádření:
t
1
0)t(f
β
αβ=
Informativní test: podíly
t1t
1t2t
ylnyln
ylnyln
−
−
+
++
jsou přibližně konstantní.
Příklad Gompertzovy křivky
0 5 10 15 20 25 30
čas
0,18
0,20
0,22
0,24
0,26
0,28
0,30
0,32
Y
Příklad:
Je dána časová řada potratů (v tisících) v ČR v letech 1990 až 2007 – viz datový soubor potrat_1990_2007.sta.
Předpokládejte, že tato časová řada má kubický trend. Odhadněte parametry trendové funkce.
Vypočtěte index determinace ID2
.
Proveďte celkový F-test.
Proveďte dílčí t-testy.
Proveďte analýzu reziduí.
Sestrojte 95% intervaly spolehlivosti pro parametry trendové funkce.
Stanovte střední absolutní procentuální chybu predikce (MAPE).
Graficky znázorněte průběh časové řady s odhadnutým trendem, 95% pásem spolehlivosti a 95% predikčním pásem.
Řešení v systému STATISTICA:
Vytvoříme datový soubor o 5 proměnných rok, počet, t, t2, t3 a 18 případech. Do proměnné rok uložíme 1990 až 2007, do
proměnné počet zapíšeme zjištěné hodnoty, do proměnné t uložíme pořadová čísla 1 až 18, do proměnné t2 druhé mocniny
pořadových čísel, do proměnné t3 třetí mocniny pořadových čísel.
Grafické znázornění časové řady:
Grafy – Bodové grafy – Proměnné X ROK, Y POCET – OK – vypneme Lineární proložení– OK.
Formát – Všechny možnosti – Graf: Obecné – zaškrtneme Spojnice – OK. Vznikne spojnicový diagram.
Bodový graf z pocet proti rok
Tabulka1 4v*18c
1988 1990 1992 1994 1996 1998 2000 2002 2004 2006 2008
rok
30000
40000
50000
60000
70000
80000
90000
1E5
1,1E5
1,2E5
1,3E5
pocet
Trendová funkce ( ) 3
3
2
210 ttttfˆ β+β+β+β=
Získání odhadů parametrů:
Statistiky – Vícenásobná regrese – Proměnné Závislé, Nezávislé t, t2, t3 - OK
Výsledky regrese se závislou proměnnou : pocet (potrat_1990_2007.sta)
R= ,98734800 R2= ,97485606 Upravené R2= ,96946808
F(3,14)=180,93 p<,00000 Směrod. chyba odhadu : 4856,5
N=18
b* Sm.chyba
z b*
b Sm.chyba
z b
t(14) p-hodn.
Abs.člen
t
t2
t3
151202,6 5726,843 26,40243 0,000000
-4,24339 0,487857 -22092,2 2539,917 -8,69801 0,000001
5,73022 1,150334 1525,7 306,288 4,98136 0,000201
-2,37604 0,704909 -35,8 10,615 -3,37071 0,004572
Odhadnutá trendová funkce má tedy tvar:
( ) 32
t8,35t7,1525t2,220926,151202tf −+−=
)
, kde t = 1, …, 18.
Index determinace je 0,975, tedy kubická trendová funkce vysvětluje variabilitu dané časové řady z 97,5 %.
Výsledky regrese se závislou proměnnou : pocet (potrat_1990_2007.sta)
R= ,98734800 R2= ,97485606 Upravené R2= ,96946808
F(3,14)=180,93 p<,00000 Směrod. chyba odhadu : 4856,5
N=18
b* Sm.chyba
z b*
b Sm.chyba
z b
t(14) p-hodn.
Abs.člen
t
t2
t3
151202,6 5726,843 26,40243 0,000000
-4,24339 0,487857 -22092,2 2539,917 -8,69801 0,000001
5,73022 1,150334 1525,7 306,288 4,98136 0,000201
-2,37604 0,704909 -35,8 10,615 -3,37071 0,004572
Testová statistika celkového F-testu je 180,93, p-hodnota je blízká 0, tedy na hladině významnosti 0,05 zamítáme hypotézu
o nevýznamnosti modelu jako celku.
Všechny čtyři dílčí t-testy mají p-hodnoty menší než 0,05, tedy na hladině významnosti 0,05 zamítáme hypotézy o nulovosti
parametrů β0, β1, β2, β3.
Posouzení nezávislosti reziduí pomocí Durbinovy – Watsonovy statistiky:
Statistiky – Vícenásobná regrese – proměnná Závislá: y, nezávislá t, t2, t3 – OK – na záložce
Residua/předpoklady/předpovědi vybereme Reziduální analýza - Detaily – Durbin-Watsonova statistika:
Durbin-
Watson.d
Sériové
korelace
Odhad 1,326973 0,262189
Hodnota D-W statistiky je poněkud nízká, ale podle testu autokorelace je vše v pořádku.
Posouzení homoskedasticity reziduí
Reziduální analýza – Bodové grafy – Předpovědi vs. rezidua
Předpovězené hodnoty vs. rezidua
Závislá proměnná : pocet
20000 40000 60000 80000 1E5 1,2E5 1,4E5
Předpov. hodnoty
-10000
-8000
-6000
-4000
-2000
0
2000
4000
6000
8000
10000
12000
Rezidua
0,95 Int.spol.
Testování nulovosti střední hodnoty reziduí:
Pro proměnnou Rezidua z tabulky uložené pomocí Reziduální analýzy provedeme jednovýběrový t-test: Statistiky Základní
statistiky/tabulky – t-test, samost. vzorek – OK – proměnné Rezidua – OK.
Test průměrů vůči referenční konstantě (hodnotě) (Tabulka8)
Proměnná
Průměr Sm.odch. N Sm.chyba Referenční
konstanta
t SV p
Rezidua -0,000217 4407,230 18 1038,794 0,00 -0,000000 17 1,000000
Na hladině významnosti 0,05 nezamítáme hypotézu, že střední hodnota reziduí je 0.
Ověření normality reziduí
Sestrojíme N-P plot reziduí a současně provedeme S-W test:
Normální p-graf z Rezidua
Tabulka8 13v*18c
-10000
-8000
-6000
-4000
-2000
0
2000
4000
6000
8000
10000
12000
Pozorovaný kvantil
-2,0
-1,5
-1,0
-0,5
0,0
0,5
1,0
1,5
2,0
Oček.normál.hodnoty
Rezidua: SW-W = 0,9361; p = 0,2478
S-W test poskytuje p-hodnotu 0,2478, tedy na hladině významnosti 0,05 nezamítáme hypotézu o normalitě reziduí.
Sestrojení 95% intervalů spolehlivosti pro parametry trendu:
Ve výstupní tabulce výsledků regrese přidáme za proměnnou Úroveň p dvě nové proměnné dm (pro dolní meze 95%
intervalů spolehlivosti) a hm (pro horní meze 95% intervalů spolehlivosti). Do Dlouhého jména proměnné dm resp. hm
napíšeme: =v3-v4*VStudent(0,975;14) resp. =v3+v4*VStudent(0,975;1)
Výsledky regrese se závislou proměnnou : pocet (potrat_1990_2007.sta)
R= ,98734800 R2= ,97485606 Upravené R2= ,96946808
F(3,14)=180,93 p<,00000 Směrod. chyba odhadu : 4856,5
N=18
b* Sm.chyba
z b*
b Sm.chyba
z b
t(14) p-hodn. dm
=v3-v4*
hm
=v3+v4
Abs.člen
t
t2
t3
151202,6 5726,843 26,40243 0,000000 138919,722 163485,435
-4,24339 0,487857 -22092,2 2539,917 -8,69801 0,000001 -27539,807 -16644,647
5,73022 1,150334 1525,7 306,288 4,98136 0,000201 868,806265 2182,64988
-2,37604 0,704909 -35,8 10,615 -3,37071 0,004572 -58,549301 -13,01365
Vidíme, že 138920 < β0 < 163485 s pravděpodobností aspoň 0,95, -27540 < β1 < -16645, 868,8 < β2 < 2182,6
-58,5 < β3 < -13 s pravděpodobností aspoň 0,95.
Výpočet MAPE:
Ve tabulce s uloženými rezidui odstraníme proměnné 8 – 13, přidáme proměnnou chyby a do jejího Dlouhého jména
napíšeme =100*abs(v7/v2). Pak spočteme průměr této proměnné a zjistíme, že MAPE = 4,27%.
Graf časové řady s proloženým kvadratickým trendem a pásem spolehlivosti a predikčním pásem získáme takto:
Grafy – Bodové grafy – Proměnné X ROK, Y POCET – OK – Detaily Proložení Polynomiální. Ve vytvořeném grafu 2x
klikneme na pozadí, vybereme Graf: Regresní pásy – Přidat nový pár pásů – Typ Spolehlivostní – OK. Totéž provedeme
ještě jednou a nyní zaškrtneme Typ Predikční.
Bodový graf z pocet proti rok
potrat_1990_2007.sta 5v*18c
pocet = 2,8763E11-4,3076E8*x+2,1503E5*x^2-35,7815*x^3; 0,95 Int.spol.; 0,95 Int.před.
1988 1990 1992 1994 1996 1998 2000 2002 2004 2006 2008
rok
20000
40000
60000
80000
1E5
1,2E5
1,4E5
pocet
Příklad: Časová řada 112, 149, 238, 354, 580, 867 udává zisk (v tisících dolarů) jisté společnosti v prvních šesti letech její
existence.
a) Graficky znázorněte průběh této časové řady.
b) Vypočtěte koeficienty růstu a graficky je znázorněte.
c) Z grafu časové řady a chování koeficientů růstu lze usoudit, že časová řada má exponenciální trend
t
10)t(f ββ= .
Odhadněte jeho parametry.
d) Najděte odhad zisku společnosti v 7. a 8. roce její existence.
e) Zjistěte index determinace a sestrojte graf ( )( )tfˆ,yt , t = 1, ..., 6.
Řešení pomocí systému STATISTICA:
Vytvoříme datový soubor se dvěma proměnnými čas a Y a 6 případy.
ad a) Graficky znázorníme průběh této časové řady:
Grafy – Bodové grafy – Proměnné čas, Y – OK – vypneme proložení – OK.
0 1 2 3 4 5 6 7
0
100
200
300
400
500
600
700
800
900
ad b) Výpočet koeficientů růstu:
Statistiky – Pokročilé lineární/nelineární modely – Časové řady/predikce – Proměnné Y – OK – OK (transformace,
autokorelace, kříž. korelace, grafy) – Posun – Posun řad vzad - OK (transformovat vybrané řady) – návrat do transformace
proměnných – Uložit proměnné.
Ve výstupní tabulce máme proměnné Y a Y_1:
Tabulka41
Y
2
Y_1
0
1
2
3
4
5
6
7
112,000
112,000 149,000
149,000 238,000
238,000 354,000
354,000 580,000
580,000 867,000
867,000
Za proměnnou Y_1 přidáme proměnnou KR a do jejího Dlouhého jména napíšeme =v2/v1.
Tabulka41
Y
2
Y_1
3
KR
0
1
2
3
4
5
6
7
112,000
112,000 149,000 1,330357
149,000 238,000 1,597315
238,000 354,000 1,487395
354,000 580,000 1,638418
580,000 867,000 1,494828
867,000
Vytvoření grafu koeficientů růstu:
Klikneme pravým tlačítkem na název proměnné KR – Grafy bloku dat – Spojnicový graf: celé sloupce
1 2 3 4 5 6 7
1,30
1,35
1,40
1,45
1,50
1,55
1,60
1,65
1,70
KR
Vidíme, že koeficienty růstu jsou přibližně konstantní.
ad c) Parametry modelu t
10)t(f ββ= odhadneme pomocí nelineární regrese:
Statistiky – Pokročilé lineární/nelineární odhady - Nelineární odhady - Vlastní regrese(MNČ) - OK. Do odhadované funkce
vepíšeme y=beta0*beta1^cas - OK
Otevře se okno s názvem Odhad nelineárního modelu metodou nejmenších čtverců. Na liště Základní výsledky máme na
výběr mezi Levenbergovou - Marquardtovou a Gaussovou - Newtonovou iterační metodou - jednu z nich zvolíme.
Na liště Detailní výsledky máme v případě problémů možnost změnit počet iterací, požadovanou přesnost a počáteční
hodnoty parametrů.
Pokračujeme OK - otevře se okno Výsledky. Na liště Základ zvolíme Souhrn: Odhady parametru a získáme tabulku:
Model je: y=beta0*beta1^cas (zisk_spolecnosti.sta)
Záv.prom.:Y
Hladina spolehlivosti:95.0% ( alfa =0.050)
Odhad Standard
chyba
t-hodn.
sv = 4
p-hodn. Dol. sp.
Mez
Hor. sp.
Mez
beta0
beta1
65,35424 3,575415 18,27879 0,000053 55,42730 75,28119
1,53973 0,015590 98,76297 0,000000 1,49644 1,58301
Odhadnutý model má tvar: cas
53973,135424,65y ⋅=
Oba parametry jsou významné na hladině významnosti 0,05.
ad d) Odhad zisku společnosti v 7. a 8. roce existence: Ve výstupní tabulce regrese odstaníme všechny proměnné kromě
proměnné Odhad a sloupec parametrů transponujeme (Data – Transponovat – Soubor – OK)
Přidáme dvě nové proměnné Y7, Y8 a do Dlouhého jména proměnné Y7 napíšeme =v1*v2^7 (resp. do Dlouhého jména
proměnné Y8 napíšeme =v1*v2^8).
1
beta0
2
beta1
3
y7
4
y8
Odhad 65,3542445 1,53972973 1340,866 2064,571
Předpověď zisku v 7. roce existence společnosti je tedy 1340,866 tisíc dolarů a v 8. roce 2064,571 tisíc dolarů.
ad e) Index determinace je ID2
= 0,9987, jak je uvedeno v záhlaví tabulky regresní analýzy.
Graf závislosti predikovaných hodnot na hodnotách časové řady vytvoříme tak, že na liště Rezidua vybereme Pozorování vs.
Předpovědi.
0 100 200 300 400 500 600 700 800 900
0
100
200
300
400
500
600
700
800
900
Jak index determinace, tak graf ( )( )tfˆ,yt svědčí o tom, že model byl zvolen správně.
Můžeme též nakreslit dvourozměrný tečkový diagram s odhadnutou regresní křivkou:
Na liště Základ vybereme Prolož. 2D funkce & pozor. hodn.
Model: y=beta0*beta1^cas
y=(65,3542)*(1,53973)^x
0 1 2 3 4 5 6 7
cas
0
200
400
600
800
1000
1200
1400
Y