Obecná metoda instrumentálních proměnných (G)IV (General Instrumental Variables method) v soustavě simultánních regresních rovnic autor metody: J.D. Sargan [1958] Metoda instrumentálních proměnných je jistým zobecněním dvoustupňové metody nejmenších čtverců 2SLS. Poskytuje, stejně jako 2SLS, vždy (přinejmenším) konzistentní odhady strukturních parametrů regresních rovnic v interdependentních ekonometrických modelech. Základní motivací metody je nalézt určité pomocné proměnné - tzv. instrumentální proměnné - které sehrají stejnou úlohu , jako má transformace při odvození odhadové funkce 2SLS (viz druhý postup odvození 2SLS) Hledají se tedy takové proměnné - jejich matici ve vztahu k i-té rovnici označme jako - které budou vyhovovat vztahu kde a přitom takové, že a) budou nekorelované s náhodnými složkami i-té strukturní rovnice b) budou co nejvíce korelované s vysvětlujícími proměnnými i-té rovnice Podmínka a) je nutná k tomu, aby byl odhad takto pořízený konzistentní. Podmínka b) je potřebná k tomu, aby proměnné-instrumenty zastupující vysvětlující veličiny v rovnici je nahrazovaly co nejvýstižněji Z podmínek je zřejmé, že instrumentální proměnné lze vybírat (pouze) z predeterminovaných proměnných modelu (běžné endogenní jsou korelované s náhodnými složkami). Problém nespočívá v tom, čím nahradit v i-té rovnici přítomné predeterminované proměnné, ale čím nahradit přítomné běžné endogenní veličiny. Zbývá tedy provést co nejvhodnější výběr z predeterminovaných proměnných modelu. Je tedy zřejmé, že instrumentální proměnné budou definované pomocí maticového vztahu kde je určující matice definující instrumentální proměnné (matice tzv.instrumentů) je matice instrumentálních proměnných pro i-tou rovnici ( je matice všech predeterminovaných proměnných modelu) . Volba instrumentálních proměnných (matice ) je tedy rovnocenná určení matice instrumentů . Index příslušnosti k rovnici lze vynechat, pokud pro odhad každé rovnice modelu použijeme tutéž skupinu instrumentálních proměnných (je to obvyklé, nikoliv nutností). V tomto případě bychom psali , kde[] [ ] je matice instrumentů definujících instrumentální proměnné pro odhad parametrů všech rovnic. požadavků, které byly na instrumenty položeny, plyne, že IV-odhadová funkce strukturních parametrů modelu má tvar [] Poznámka podmínkou existence IV-estimátoru je, aby byly existovala inverzní matice k matici [ ] [ ]K tomu je opět přinejmenším nutné[ ], aby byla splněna podmínka : jinak by matice [ ]nemohla být ani čtvercová (tím méně ne regulární).[1][ ](obvykle předpokladáme ) Vlastnosti IV-odhadové funkce Lze ukázat, že IV-estimátor strukturních parametrů modelu má tyto vlastnosti: 1) Odhady parametrů ( tj. [ ]) jsou konzistentní, neboť platí [] v důsledku (asymptotické ) nekorelovanosti proměnných a náhodných složek 2) Odhady parametrů [i] ( neboli [ ]) nejsou nestranné, protože [] ale výraz vzhledem k možné závislosti běžných endogenních proměnných přítomných ve a náhodných složek . 3) Odhady parametrů ( tj. [ ]) nejsou, až na výjimku, kdy metoda IV přechází v 2SLS, obecně vydatné (ani v rámci metod s omezenou informací). 4) Odhady parametrů ( tj. [i ]) jsou (za stejných předpokladů (e), (f), (g), (h) jako u 2SLS) vždy asymptoticky normální , tedy platí Konzistentní odhad prvků pro jednotlivé rovnice získáme obvyklým způsobem: kde za rezidua vezmeme odhady náhodných složek [ ]získané metodou IV. Je tedy zřejmé, že otázka nejlepšího výběru (poskytujícího nejvydatnější IV-odhad) mezi různými IV-estimátory spočívá v optimální definici matice . Jinými slovy, vyšetřujeme, pro jakou volbu matice nastává maximální možná korelace mezi instrumenty v (resp. mezi instrumentálními proměnnými v ) a vysvětlujícími proměnnými i-té rovnice ? Pro měření korelace mezi dvěma skupinami náhodných veličin (majících stejný počet pozorování) se užívá vektorový korelační koeficient definovaný jako: Hodnota tohoto koeficientu se pohybuje mezi 0 (nezávislost) a 1 (přesná závislost) . Výraz, který v kovarianční maticí IV-estimátoru v sobě obsahuje fragment výrazu pro tzv. zobecněný rozptyl. Ten je definován jako Mezi vektorovým korelačním koeficientem a zobecněným rozptylem platí tedy vztah z čehož je patrné, že pro taková , pro která je minimalizována hodnota je právě maximalizována korelace mezi [ ]a . Vyšetříme, kdy taková korelace nabude maximální možné hodnoty; v tomto případě poskytne IV-odhadová funkce [ ]nejvydatnější odhad. Lze přitom ukázat, že platí: Znamená to tedy, že nemůže být překročena horní hranice daná (vektorovou) korelací mezi množinou instrumentálních proměnných a množinou všech predeterminovaných proměnných. Této maximální korelovanosti je dosaženo pro volbu Při této volbě matice dostaneme : Pak je IV- odhadová funkce rovna Znamená to tedy, že : 1) 2SLS-odhadová funkce je speciálním případem IV-odhadové funkce při volbě matice instrumentů jako 2) 2SLS-odhadová funkce poskytuje ve srovnání s jakoukoliv jinou volbou matice nejvydatnější odhad. tj. ve smyslu asymptotické vydatnosti je 2SLS-odhadová funkce dominantní vůči všem ostatním IV-estimátorům. Skutečnost, že aplikací techniky IV nelze překonat metodu 2SLS může být jistým zklamáním. V nelineárních modelech tomu tak není, zde můžeme za instrumenty vzít též nelineární kombinace z predeterminovaných proměnných. Ani NL2S estimátor (nelineární dvoustupňová metoda nejmenších čtverců) není zde definován jednoznačně : existují např. BNL2S (best) a MNLS (minimal) estimátor . Počet instrumentálních proměnných n musí být v rozmezí mezi a , tedy Pokud uplatníme instrumentální proměnné v maximálním možném počtu tj. jako všechny predeterminované proměnné, pak - využijeme maximum informace obsažené v modelových proměnných, což povede k vydatnému odhadu , ale - budeme pracovat s obsažnějšími maticemi a případně nižší spolehlivostí výsledku Pokud uplatníme instrumentální proměnné v minimálním přípustném počtu tj. jako výběr predeterminovaných proměnných, pak - nevyužijeme všechnu potřebnou informaci obsaženou v modelových proměnných, což bude mít za následek méně kvalitní (byť konzistentní) odhadu , ale - výpočet bude úspornější a počet stupňů volnosti modelu vyšší. Kompromisem může být vzetí instrumentálních proměnných v podobě lineární kombinace sestávající z prvních hlavních komponent momentové matice . Poznámky DM 1. Vektorový korelační koeficient vyjadřuje maximální možnou dosažitelnou korelovanost mezi dvěma skupinami náhodných veličin (formálně uloženými ve sloupcích matic ). Koeficient v obecné definici nevyžaduje shodu počtů proměnných ve srovnávaných skupinách. Omezení na interval <0,1> odpovídá tomu, že (odlišně vztahu dvou náhodných proměnných, kde při růstu jedné může druhá klesat nebo růst a párový korelační koeficient toto zohlední znaménkem), nelze o srovnatelném shodném resp. protisměrném pohybu dvou skupin proměnných hovořit (každá z proměnných ve skupinách poskytujících „největší“ korelaci se může chovat odlišně). je skalární hodnota, je matice [T;mi+qi] je matice [mi+qi;mi+qi] je matice [T;mi+qi] je matice [mi+qi;mi+qi] Determinant v čitateli je rozměrů [2mi+2qi;2mi+2qi] Koeficient vektorové alienace je definován jako (??) Při řešení konkrétních úloh se uplatňují tyto přístupy k volbě instrumentálních proměnných (definujících matici A): a) prostý výběr počtu z celkem predeterminovaných proměnných . Matice instrumentů bude zde mít tvar , přičemž v této obdélníkové matici budou jedničkové prvky pouze v hlavní “pseudodiagonále” . U predeterminovaných proměnných, které jsou vzaty jako instrumentální, je v příslušném sloupci A[1] jednička – vynechávaným odpovídají nulové sloupce. b) – členná lineární kombinace složená z predeterminovaných proměnných V tomto případě má příslušná matice tvar Koeficienty lineární kombinace jsou obsaženy ve sloupcích této matice. c) prvních hlavních komponent sestrojených z matice predeterminovaných proměnných Koeficienty této lineární kombinace (opět obsažené ve sloupcích matice ) představují prvky vlastních vektorů příslušných momentové matici . Z celkem hlavních komponent se omezujeme na „největších“ z nich. ________________________________ [1] Počet instrumentů potřebných k odhadu i-té rovnice musí být tedy roven počtu vysvětlujících proměnných této rovnice. Podrobněji v části pojednávající o identifikačním problému.