Dvoustupňová metoda nejmenších čtverců 2SLS ( 2-stage least squares ) v soustavě simultánních regresních rovnic autoři metody : R.L.Bassman [1957], H.Theil [1958] Dvoustupňová metoda nejmenších čtverců je nejrozšířenější užívaná metoda poskytující (přinejmenším) konzistentní odhady strukturních parametrů regresních rovnic v interdependentních ekonometrických modelech. Základní myšlenkou metody je postup, který vhodným způsobem nahrazuje v jednotlivých regresních rovnicích strukturního tvaru modelu běžné endogenní proměnné vyskytující se na pravé straně (jako vysvětlující) strukturních rovnic jinými veličinami, které by nebyly korelovány s náhodnými složkami rovnic. Právě tyto korelace (mezi vysvětlujícími běžnými endogenními proměnnými a náhodnými složkami) jsou příčinou, proč odhady parametrů takové rovnice pomocí prosté metody nejmenších čtverců OLS nejsou konzistentní. K nahrazení vysvětlujících běžných endogenních proměnných využívá metoda 2SLS substituci pomocí odhadnuté matice redukovaného tvaru modelu, která je odhadována metodou OLS. Ve druhém kroku se pak provádí - opět metodou OLS - regrese vysvětlované běžné endogenní proměnné na takto nahrazené vysvětlující běžné endogenní proměnné a na všechny v této rovnici přítomné predeterminované proměnné. Formální popis metody (uvažujeme libovolnou i-tou regresní rovnic): V rovnici zapsané jako [1] [] se nejdříve provede odhad matice parametrů redukované formy P[i] ze vztahu [][2] [] Odhad pořízený metodou OLS má zřejmě tvar [3] Jestliže zavedeme - s označením - matici reziduí při regresi vysvětlujících běžných endogenních proměnných na všechny predeterminované proměnné , tj. [ ][ ] [ ] lze snadno ukázat, že tato rezidua jsou nekorelovaná s predeterminovanými proměnnými obsaženými ve sloupcích matice X , tj. platí = 0. Místo původní rovnice se tedy odhaduje modifikovaná rovnice [ ] V ní vystupují vysvětlující běžné endogenní proměnné již očištěné o své stochastické složky . [4] 2SLS-odhadovou funkci vektoru parametrů nyní získáme – opět provedením OLS regrese - vysvětlovaných běžných endogenních proměnných na takto modifikované vysvětlující běžné endogenní proměnné a predeterminované proměnné . Dostaneme (1) [ ] což lze vzhledem k platnosti vztahů a zapsat jako (2)[ ][ ] Vlastnosti 2SLS -odhadové funkce Lze ukázat, že 2SLS-odhadová funkce má tyto vlastnosti: 1) Odhady parametrů jsou konzistentní, tj. platí plim T®¥ = 2) Odhady parametrů [ ] nejsou nestranné, protože [ ] [ ]=[ ][ ][5][ , ]kde , protože [ ] [ ]=[ ][ ,] a tedy [ ] [ ]=[ ][ ,] a tedy 3) Odhady parametrů jsou vydatné v rámci okruhu metod s omezenou informací (metody s úplnou informací však poskytují vydatnější odhady) Poznámka Podmínkou existence 2SLS-estimátoru je, aby byly definovány všechny veličiny v předchozích výrazech ( kromě toho stejně jako u OLS předpokládáme, že matice má hodnost q = počet všech predeterminovaných proměnných modelu, takže není singulární). Dále musí platit ( k zajištění existence inverze v (1), resp. (2) aby byla splněna podmínka neboli, aby počet predeterminovaných proměnných přítomných v celé soustavě (modelu) byl přinejmenším rovný počtu vysvětlujících proměnných (predeterminovaných i běžných endogenních) i-té rovnice. Jiný způsob odvození dvoustupňové metody nejmenších čtverců Odvození dvoustupňové metody nejmenších čtverců lze provést ještě jiným způsobem, při kterém je obyčejná metoda nejmenších čtverců nasazena pouze jednou, avšak nikoliv na původní ale na určitým způsobem transformovanou původní modelovou rovnici. Postup lze vyložit následovně: Jedním z vyslovených předpokladů modelu je, že momentová matice je pozitivně definitní a regulární. Existuje k ní tedy regulární matice R rozměrů , tak, že platí (připomeňme, že má rozměry a nemůže být tedy – až na výjimku, kdy – regulární) . Nyní vynásobíme původní rovnici zleva maticí . Dostaneme vztah který lze zapsat jednodušeji jako , kde , , V dimenzích máme , , , Parametry takto transformované rovnice[6] (transformace se týká jen proměnných, nikoliv parametrů) nyní odhadneme pomocí metody OLS. Dostaneme : , což rozepsáno znamená (3) Vzhledem k tomu, že platí , podobně a , dostaneme zjednodušení (4) Přitom platí dále, že a tedy také, že Odtud je patrné, že výsledek dosažený oběma postupy je shodný. Rozdělení 2SLS-odhadové funkce pro konečný rozsah výběru je sice (díky Peteru C.B. Phillipsovi) známo ( cca od roku 1982 ), ale je natolik komplikované, že se prakticky nedá použít (není nejspíše ani tabelováno). Proto se v úlohách, které jsou spojeny s konstrukcí intervalů spolehlivosti a postupy testování hypotéz omezujeme na rozdělení asymptotické ( tj. rozdělení, které má 2SLS-odhadová funkce při neomezeně rostoucím rozsahu výběru T ® ¥ ). Podmínky pro odvození asymptotického rozdělení 2SLS estimátoru Lze ukázat, že za poměrně obecných předpokladů je asymptotické rozdělení 2SLS-odhadové funkce normální. Těmito předpoklady jsou všechny dosud vyslovené předpoklady a dále tyto dodatečné: ( e ) Soustava strukturních rovnic neobsahuje mezi predeterminovanými žádné zpožděné endogenní proměnné[7]. ( f ) Náhodné složky jsou vzájemně nezávislé (tj. nejen nekorelované) pro všechna t.[8] (g ) Limitní matice T ® ¥ existuje jako nestochastická regulární matice s konečnými prvky; jde o konvergenci v pravděpodobnosti, kdy limitou je matice konstant (nikoliv náhodných veličin)[9]. (h ) Náhodné složky [ ]splňují pro libovolné podmínku , T ® ¥ kde je sdružená distribuční funkce složek vektoru .[10][] [ ] Za uvedených podmínek platí, že asymptotické rozdělení 2SLS-estimátoru je normální se střední hodnotou a kovarianční maticí , kde T ® ¥ [ ]je rozptyl náhodných složek i-té rovnice. Obvyklý zápis tohoto rozdělení je T ® ¥ Tento výsledek je významem srovnatelný s platností Gaus-Markovovy věty v prostředí normálního lineárního regresního modelu. Poznámka 2 Pokud je rozdělení vektoru [ ]sdružené normální , pak je podmínka (h) automaticky splněna. Konzistentní odhad prvků pro jednotlivé rovnice získáme obvyklým způsobem , kde za rezidua vezmeme odhady náhodných složek [ ]získané dvoustupňovou metodou nejmenších čtverců 2SLS. Testy statistických rozdělení budou tedy založeny na normálním - rozdělení. POMOCNÁ TVRZENÍ VZTAHUJÍCÍ SE K METODÉ 2SLS Tvrzení 1 , protože dimenze matic Tvrzení 2 Tvrzení 3 dimenze matic Tvrzení 4 (v důsledku T1) Tvrzení 5 , protože lze psát : „vytahujeme“ sloupců matice z celkem sloupců matice .[11] Pro snadnost zápisu předpokládáme, že jde o prvních sloupců. Pak lze psát Poznámka 3 Všimněme si však, že nelze psát , protože srovnatelným způsobem nelze „vytáhnout“ běžných endogenních proměnných obsažených v matici z matice všech predeterminovaných proměnných soustavy (obě tyto matice jsou „disjunktní“, protože obsahují (ve sloupcích) zcela rozdílné proměnné. Levý horní prvek v invertované matici 2SLS-estimátoru nelze tedy zjednodušit. Totéž platí pro výraz Ani tady nemůžeme „vytáhnout“ vysvětlovanou proměnnou z matice . ________________________________ [1] Uvažujeme zde omezený strukturní tvar, do kterého jsou tedy už zahrnuta omezení o nepřítomnosti některých vysvětlujících proměnných (modelu) mezi vysvětlujícími proměnnými i-té rovnice – pro jsou zde dimenze matic Y[i] , X[i] pouze m[i] resp. q[i] ( nikoliv m,q ). [2] V tomto případě musí být napravo celá matice X (nestačí jen X[i ]), protože některé z levostranných proměnných obsažené v Y[i ] budou zpravidla závislé i na těch predeterminovaných proměnných (z X), které nejsou obsaženy (jako vysvětlující) v i-té rovnici tj. v X[i ]. [3] Nalevo není celá matice parametrů redukovaného tvaru, ale jen ta její část, která se váže k vyjádření závisle proměnných v Y[i ]pomocí (obecně všech) predeterminovaných proměnných. Ostatními běžnými endogenními veličinami modelu ( těmi, co jsou v Y, ale ne v Y[i ]) se nezabýváme. [4] Odečtením V[i ]od Y[i ]zbavíme vysvětlující běžné endogenní proměnné těch jejich stochastických částí, které jsou korelované s náhodnými složkami e[i ]a v důsledku toho bude následný odhad parametrů na pravé straně již konzistentní. [5] Proměnné v Zi nejsou nestochastické, takže nelze psát [6] Všimněme si, že transformací pozorování původní rovnice jistým způsobem “zkracujeme“, protože násobením zleva maticí přecházíme z původních T řádků jen na q řádků. [7] Podmínka (e) není ultimativní, ale usnadňuje odvození asymptotického rozdělní 2SLS-estimátoru [8] Je zřejmé, že předpokladu normality náhodných složek je tato podmínka automaticky splněna. [9] Smyslem podmínky (f) je zajistit, aby prvky příslušných matic nevykazovaly „směrem do nekonečna“ explozivní chování, a aby bylo možno operovat s rostoucím T se submaticemi matic , , a jejich inverzemi. [10] Smyslem podmínky (h) je zajistit aplikovatelnost centrálních limitních vět na asymptotické (normální) rozdělení a vyloučit z okruhu uvažovatelných rozdělení ta, která mají tzv.„heavy tails“. Sdružené normální rozdělení (náhodných složek) této podmínce vyhovuje [11] Zbývajících q-q[i] predeterminovaných proměnných (těch, které jsou přítomny v modelu, ale nikoliv v jeho i-té rovnici) „odřezáváme“ násobením nulovou maticí.