Obecná metoda instrumentálních proměnných

(G)IV (General Instrumental Variables method)

v soustavě simultánních regresních rovnic

autor  metody:  J.D. Sargan [1958]


Metoda instrumentálních proměnných je jistým zobecněním dvoustupňové metody nejmenších čtverců
2SLS. Poskytuje, stejně jako 2SLS, vždy (přinejmenším) konzistentní odhady strukturních parametrů
regresních rovnic v interdependentních ekonometrických modelech.


Základní motivací metody je nalézt určité pomocné proměnné - tzv. instrumentální proměnné - které
sehrají stejnou úlohu , jako má transformace  při odvození odhadové funkce 2SLS  (viz druhý postup
odvození 2SLS)


Hledají se tedy takové proměnné - jejich matici ve vztahu k i-té rovnici označme jako  - které
budou vyhovovat vztahu


kde

a přitom takové, že

a)  budou nekorelované s náhodnými složkami i-té strukturní rovnice

b)  budou co nejvíce korelované s vysvětlujícími proměnnými i-té rovnice


Podmínka a)         je nutná k tomu, aby byl odhad takto pořízený konzistentní.

Podmínka b)            je potřebná k tomu, aby proměnné-instrumenty zastupující

                                   vysvětlující veličiny v rovnici je nahrazovaly co nejvýstižněji


Z podmínek je zřejmé, že instrumentální proměnné lze vybírat (pouze) z predeterminovaných
proměnných modelu (běžné endogenní jsou korelované s náhodnými složkami). Problém nespočívá v tom,
čím nahradit v i-té rovnici přítomné predeterminované proměnné, ale čím nahradit  přítomné běžné
endogenní veličiny.


Zbývá tedy provést co nejvhodnější výběr z predeterminovaných proměnných modelu. Je tedy zřejmé, že
instrumentální proměnné budou definované pomocí maticového vztahu


                                                          kde

     je určující matice definující instrumentální proměnné (matice tzv.instrumentů)

      je matice instrumentálních proměnných pro i-tou rovnici

(        je matice všech predeterminovaných proměnných modelu) .


Volba instrumentálních proměnných (matice ) je tedy rovnocenná určení matice instrumentů . Index
příslušnosti k rovnici lze vynechat, pokud pro odhad každé rovnice modelu použijeme tutéž skupinu
instrumentálních proměnných (je to obvyklé, nikoliv nutností).


V tomto případě bychom psali                                                                 ,
kde[]

[                                   ]

        je matice instrumentů definujících instrumentální proměnné pro odhad        parametrů všech
rovnic.

        požadavků, které byly na instrumenty položeny, plyne, že IV-odhadová funkce strukturních
parametrů modelu má tvar

                                                []


Poznámka  podmínkou existence IV-estimátoru je, aby byly existovala inverzní matice k  matici [ ]
[ ]K tomu je opět přinejmenším nutné[ ], aby byla splněna podmínka : jinak by matice [ ]nemohla být
ani čtvercová (tím méně ne regulární).[1][ ](obvykle předpokladáme  )


                                   Vlastnosti IV-odhadové funkce

                        Lze ukázat, že IV-estimátor strukturních parametrů modelu má tyto
vlastnosti:

1)         Odhady parametrů   ( tj. [ ]) jsou konzistentní, neboť platí

                                                []

v důsledku (asymptotické ) nekorelovanosti proměnných  a náhodných složek


2)         Odhady parametrů   [i] ( neboli [ ])  nejsou nestranné, protože

                                                 []

ale výraz   vzhledem k možné závislosti běžných endogenních proměnných přítomných ve  a náhodných
složek  .


3)  Odhady parametrů  ( tj. [ ]) nejsou, až na výjimku, kdy metoda IV přechází v  2SLS, obecně
vydatné (ani v rámci metod s omezenou informací).


4)       Odhady parametrů   ( tj. [i ]) jsou (za stejných předpokladů (e), (f), (g), (h)  jako u

2SLS) vždy asymptoticky normální , tedy platí

Konzistentní odhad prvků  pro jednotlivé rovnice získáme obvyklým způsobem:


kde za rezidua    vezmeme odhady náhodných složek [ ]získané metodou IV.


Je tedy zřejmé, že otázka nejlepšího výběru (poskytujícího nejvydatnější IV-odhad) mezi různými
IV-estimátory spočívá v optimální definici matice . Jinými slovy, vyšetřujeme, pro jakou volbu
matice  nastává maximální možná korelace mezi instrumenty v  (resp. mezi instrumentálními
proměnnými v ) a vysvětlujícími proměnnými i-té rovnice ?

Pro měření korelace mezi dvěma skupinami náhodných veličin (majících stejný počet pozorování) se
užívá vektorový korelační koeficient  definovaný jako:


Hodnota tohoto koeficientu se pohybuje mezi 0 (nezávislost) a 1 (přesná závislost) .

Výraz, který v kovarianční maticí IV-estimátoru  v sobě obsahuje fragment výrazu pro tzv. zobecněný
rozptyl.  Ten je definován jako


Mezi  vektorovým korelačním koeficientem a zobecněným rozptylem platí tedy vztah


z čehož je patrné, že pro taková , pro která je minimalizována hodnota  je právě maximalizována
korelace mezi [ ]a .


Vyšetříme, kdy taková korelace nabude maximální možné hodnoty; v tomto případě poskytne IV-odhadová
funkce [  ]nejvydatnější odhad. Lze přitom ukázat, že platí:


Znamená to tedy, že nemůže být překročena horní hranice daná (vektorovou) korelací mezi množinou
instrumentálních proměnných a množinou všech predeterminovaných proměnných.

Této maximální korelovanosti je dosaženo pro volbu


Při této volbě matice  dostaneme :


Pak je IV- odhadová funkce rovna


Znamená to tedy, že :

1)     2SLS-odhadová funkce je speciálním případem IV-odhadové funkce při volbě

       matice instrumentů jako

2)  2SLS-odhadová funkce poskytuje ve srovnání s jakoukoliv jinou volbou matice  nejvydatnější
odhad. tj. ve smyslu asymptotické vydatnosti je 2SLS-odhadová funkce dominantní vůči všem ostatním
IV-estimátorům.


Skutečnost, že aplikací techniky IV nelze překonat metodu 2SLS může být jistým zklamáním.
V nelineárních modelech tomu tak není, zde můžeme za instrumenty vzít též nelineární kombinace
z predeterminovaných proměnných. Ani NL2S estimátor (nelineární dvoustupňová metoda nejmenších
čtverců) není zde definován jednoznačně : existují např. BNL2S (best) a MNLS (minimal) estimátor .


Počet instrumentálních proměnných  n  musí být v rozmezí mezi  a  , tedy


Pokud uplatníme instrumentální proměnné v maximálním možném počtu    tj. jako všechny
predeterminované proměnné, pak

- využijeme maximum informace obsažené v modelových proměnných, což povede k vydatnému odhadu , ale

            -  budeme pracovat s obsažnějšími maticemi a případně nižší spolehlivostí výsledku


Pokud uplatníme instrumentální proměnné v minimálním přípustném počtu  tj. jako výběr
predeterminovaných proměnných, pak

- nevyužijeme všechnu potřebnou informaci obsaženou v modelových proměnných, což bude mít za
následek méně kvalitní (byť konzistentní) odhadu , ale

- výpočet bude úspornější a počet stupňů volnosti modelu vyšší.


Kompromisem může být vzetí instrumentálních proměnných v podobě lineární kombinace sestávající
z prvních  hlavních komponent momentové matice .


Poznámky DM


1. Vektorový korelační koeficient vyjadřuje maximální možnou dosažitelnou korelovanost mezi dvěma
skupinami náhodných veličin (formálně uloženými ve sloupcích matic  ). Koeficient v obecné definici
nevyžaduje shodu počtů proměnných ve srovnávaných skupinách. Omezení na interval <0,1> odpovídá
tomu, že (odlišně vztahu dvou náhodných proměnných, kde při růstu jedné  může druhá klesat nebo
růst a párový korelační koeficient toto zohlední znaménkem), nelze o srovnatelném shodném resp.
protisměrném pohybu dvou skupin proměnných hovořit (každá z proměnných ve skupinách poskytujících
„největší“ korelaci se  může chovat odlišně).


   je skalární hodnota,

 je matice [T;mi+qi]     je matice [mi+qi;mi+qi]

 je matice [T;mi+qi]      je matice [mi+qi;mi+qi]

Determinant v čitateli je rozměrů [2mi+2qi;2mi+2qi]


Koeficient vektorové alienace je definován jako (??)


Při řešení konkrétních úloh se uplatňují tyto přístupy k volbě instrumentálních proměnných
(definujících matici A):


a) prostý výběr počtu   z celkem  predeterminovaných proměnných . Matice instrumentů bude zde mít
tvar , přičemž v této obdélníkové matici budou jedničkové prvky pouze v hlavní “pseudodiagonále” .


U predeterminovaných proměnných, které jsou vzaty jako instrumentální, je v příslušném sloupci A[1]
jednička – vynechávaným odpovídají nulové sloupce.


b) – členná lineární kombinace složená z predeterminovaných proměnných

     V tomto případě má  příslušná matice tvar


Koeficienty lineární kombinace jsou obsaženy ve sloupcích této matice.


c) prvních  hlavních komponent sestrojených z matice predeterminovaných

proměnných


Koeficienty této lineární kombinace (opět obsažené ve sloupcích matice ) představují prvky
vlastních vektorů příslušných momentové matici . Z celkem  hlavních komponent se omezujeme na
„největších“   z nich.
________________________________

[1] Počet instrumentů potřebných k odhadu i-té rovnice musí být tedy roven počtu vysvětlujících
proměnných této rovnice. Podrobněji v části pojednávající o identifikačním problému.