Stanovení chyby předpovědi Uvažujme opět standardní normální lineární regresní model, u kterého jsme již předtím ověřili jeho způsobilost k prognózování minimálně ve smyslu ověření stability modelové struktury. Budeme pracovat s modelem v zápisu (pro predikované období o délce ) (1) [][] je [m-členný] sloupcový vektor hodnot vysvětlované (endogenní) proměnné, kterých nabude v predikovaném období je [m x k– rozměrná] matice hodnot vysvětlujících (exogenních) proměnných realizovaných v predikovaném období je [ k-členný ] sloupcový vektor regresních parametrů ( hodnoty parametrů přejímáme beze změn z pozorovaného období) je [ m-členný ] sloupcový vektor náhodných složek predikovaného období Předpokládáme přitom, že a) , , tzn. že náhodné složky s nulovou střední hodnotou v pozorovaném období zůstanou centrované i v předpovídaném období. b) , ; tzn. že rozptyly náhodných složek pozorovaného i predikovaného období jsou shodné (rovné ). c) , ; tzn. že náhodné složky predikovaného období jsou nekorelované navzájem i s náhodnými složkami pozorovaného období. Souhrnná kovarianční matice má tedy tvar d) Náhodné složky jsou nekorelované s vysvětlujícími proměnnými v pozorovaném i v predikovaném období, tj. pro pro . Model můžeme přehledněji znázornit maticovým zápisem Bodovou předpověď m-členného vektoru závisle proměnné získáme pomocí predikční funkce[1] tvaru (2) , kde je [ Txk –rozměrná ] matice pozorovaných hodnot vysvětlujících proměnných. Predikční funkce 2), jež je zřejmě lineární funkcí , je nestrannou funkcí vektoru předpovědí v tom smyslu, že pro ni platí (3) [ X[p] je nestochastická ] [ b je nestranný odhad ] To znamená, že střední hodnota predikční funkce je rovna střední hodnotě [2] Poznámka Neznamená to však , že [3] Tvrzení: Lze ukázat, že predikční funkce 2) má ze všech nestranných predikčních funkcí (lineárními v ) nejmenší v maticovém smyslu kovarianční matici vektoru reziduí v období předpovědi, tj. následujícího vektoru Vektor chyb definujeme jako odchylku (chybu) předpovídané hodnoty od skutečné : (4) Všimněme si, že zdrojem chyb předpovědi vektoru skutečných hodnot je jednak variabilita náhodné složky , jednak výběrová chyba odhadové funkce zpravidla pořízené metodou nejmenších čtverců OLS : Střední chyba vektoru chyb predikčního vektoru v (4) je nulová, protože platí Před odvozením kovarianční matice tohoto vektoru upravíme do tvaru (5) Poznámka Vektor reziduí předpovídaných hodnot závisí tedy na náhodných složkách pozorovaného i náhodných složkách predikovaného období. Za přijatých předpokladů a) – d) lze pro kovarianční matici náhodného predikčního vektoru (5) psát : [4] [nekorelovanost ] [ ] [ ] Poznámka Speciální případ jediné predikované hodnoty tzn. případ : V tomto případě jsou a skalární hodnoty a matice se redukuje na řádkový vektor o složkách. Standardní chybu (směrodatnou odchylku) bodové předpovědi skutečné hodnoty vysvětlované proměnné dostaneme nahrazením rozptylu jeho nestranným odhadem získaným například metodou OLS. Pak [5] Lze ukázat, že vyhovuje-li model předpokladu normality, pak bodová predikční funkce založená na odhadu metodou OLS má též normální rozdělení, tedy: (6) Protože, jak již jsme dokázali výše v (3) (3*) a dále [ Cov(b)= s^2. (X’X)^-1 ] [s^2 je skalár] ________________________________ [1] Predikční funkce je náhodný vektor o m složkách. [2] Jde o totožnost středních hodnot stejnolehlých složek příslušných náhodných vektorů. [3] Podle 1) je a náhodnost vektoru pramení z náhodnosti , zatímco v případě vyplývá náhodnost tohoto vektoru z náhodnosti (a přeneseně tudíž pochází z ). [4] Bereme v úvahu nekorelovanost a . [5] Pokud m=1, pak je vektor a veličina je skalár , pokud m >1, pak se vezme diagonální prvek matice pořadím příslušný dané složce vektoru parametrů .