Cvičení 11.: Odhad trendu časové řady Příklad 1.: Máme k dispozici údaje o počtu bytů předaných do užívání v Československu v letech 1960 až 1970: 73 766 86 032 85 221 82 189 77 301 77 818 75 576 79 297 86 571 85 656 112 135. Odhadněte trend této časové řady pomocí klouzavých průměrů s vyhlazovacím okénkem šířky 5 a graficky znázorněte. Řešení: Načteme datový soubor byty.sta o dvou proměnných ROK a POCET a jedenácti případech. Statistiky – Pokročilé lineární/nelineární modely – Časové řady/predikce – Proměnné POCET – OK– OK (transformace, autokorelace, kříž. korelace, grafy) – Vyhlazování – zaškrtneme Nbod. klouzavý průměr, N = 5 – OK (Transformovat vybrané řady) – vykreslí se graf, vrátíme se do Transformace proměnných – Uložit proměnné. Otevře se nové datové okno, kde v proměnné POCET_1 jsou uloženy klouzavé průměry pro N = 5. Proměnnou POČET_1 okopírujeme do původního datového souboru do nové proměnné KP5 (pozor – roky 1960, 1961, 1969 a 1970 nemají přiřazený odhad). 1 ROK 2 POCET 3 KP5 1 2 3 4 5 6 7 8 9 10 11 1960 73766 1961 86032 1962 85221 80901,8 1963 82189 81712,2 1964 77301 79621,0 1965 77818 78436,2 1966 75576 79312,6 1967 79297 80983,6 1968 86571 87847,0 1969 85656 1970 112135 Pomocí Grafy – Bodové grafy – Vícenásobný graf vytvoříme graf časové řady počtu bytů s odhadnutým trendem. 1958 1960 1962 1964 1966 1968 1970 1972 ROK 70000 75000 80000 85000 90000 95000 100000 105000 110000 115000 Příklad 2.: Na stránkách Českého statistického úřadu jsme získali časovou řadu hrubého domácího produktu ČR na jednoho obyvatele v letech 1990 – 2008 (v tisících Kč): 1 rok 2 HDP 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 1990 61 1991 79 1992 90 1993 111 1994 128 1995 148 1996 171 1997 183 1998 200 1999 209 2000 221 2001 239 2002 252 2003 263 2004 287 2005 304 2006 327 2007 355 2008 369 Předpokládejte, že trend této řady je lineární. Odhadněte jeho parametry a proveďte reziduální analýzu. V případě autokorelace reziduí se pokuste o její eliminaci. (Data jsou uložena v souboru HDP_na_obyvatele.sta) Výsledky: Výstupní tabulka regresní analýzy: Výsledky regrese se závislou proměnnou : HDP (HDP_na_obyvatele.sta) R= ,99739894 R2= ,99480465 Upravené R2= ,99449905 F(1,17)=3255,2 p<0,0000 Směrod. chyba odhadu : 6,9218 N=19 b* Sm.chyba z b* b Sm.chyba z b t(17) p-hodn. Abs.člen rok -32855,4 579,5543 -56,6908 0,000000 0,997399 0,017482 16,5 0,2899 57,0540 0,000000 D-W statistika: 0,5856 (rezidua jsou pozitivně autokorelovaná) Odhad korelačního koeficientu v autokorelaci: Vstup: REZIDUA (Tabulka9) Transformace: žádná Model:(1,0,0) PČ Rezid. = 23,683 Paramet. Param. Asympt. SmCh Asympt. t( 18) p Dolní 95% spol Horní 95% spol p(1) 0,734248 0,186619 3,934468 0,000972 0,342175 1,126321 Výstupní tabulka regresní analýzy s novou závisle proměnnou (součet predikovaných hodnot z původní regrese a reziduí z autokorelace): Výsledky regrese se závislou proměnnou : nove y (HDP_na_obyvatele.sta) R= ,99869298 R2= ,99738767 Upravené R2= ,99723400 F(1,17)=6490,6 p<0,0000 Směrod. chyba odhadu : 4,9390 N=19 b* Sm.chyba z b* b Sm.chyba z b t(17) p-hodn. Abs.člen rok -33105,3 413,5355 -80,0542 0,000000 0,998693 0,012396 16,7 0,2069 80,5642 0,000000 D-W statistika: 1,7232 (rezidua již nevykazují autokorelaci) Regresní odhad HDP pro rok 2009: 377,4 (neodpovídá realitě, HDP na obyvatele poklesl na 358,3) Nepovinný úkol: doplňte údaje za léta 2009 – 2014 a celý úkol 2 proveďte znovu. Příklad 3.: Sledujeme prodej CD nosičů vydaných hudebním nakladatelstvím v letech 1993 - 2001 (v tisících kusů): 3 10 15 21 35 42 58 81 110. Trend prodeje popište exponenciální trendovou funkcí t 10)t(f ββ= . Odhadněte neznámé parametry. Najděte index determinace. Nakreslete průběh časové řady s proloženým trendem. Výsledky: ( ) t 3836,1976,5tfˆ ⋅= ID2 = 99,5% Graf: Model: y=beta0*beta1^t y=(5,97601)*(1,38357)^x 0 1 2 3 4 5 6 7 8 9 10 t -20 0 20 40 60 80 100 120 140 160 y