Link: OLE-Object-Data Vliv změn měřítkování proměnných na hodnoty statistických charakteristik Je zajisté užitečné vědět, které statistické charakteristiky modelu jsou dotčeny změnou měrových jednotek vysvětlujících veličin nebo vysvětlované veličiny. Pokud bychom toto neznali, byli bychom v pochybnostech, zda získané výsledky jsou nebo nejsou ovlivněny takovýmito změnami a nemohli bychom vyvozovat příslušné statistické závěry s náležitou jistotou. Předpokládejme, že původní hodnoty vysvětlujících veličin jsou ve vektorech a původní hodnoty vysvětlované proměnné jsou ve vektoru . Nechť nyní dojde ke změně měřítka, takže nové "měřítkované" proměnné jsou , resp. a pro vztahy mezi původními a novými proměnnými platí vztahy , resp. , kde nenulové reálné koeficienty , resp. reálný skalár představují změny měřítek, tj. přepočtené hodnoty nových měrových jednotek vzhledem k jednotkám původním. Abychom vyšetřili dopad změn měřítek na hodnoty statistických charakteristik, musíme vyjádřit vektorově/maticové vztahy mezi původními a změněnými modelovými proměnnými. Toho dosáhneme zápisem vztahů mezi prostými a ovlnkovanými veličinami. (1) resp. , kde je diagonální matice typu s jednotlivými na hlavní diagonále (ostatní prvky jsou nulové) a je skalární konstanta, kterou násobíme jednotlivé složky vektoru . (Pokud každou složku vektoru zestonásobíme, pak . ) Nyní zapíšeme vztahy mezi původními měrovými jednotkami, ve kterých jsou vyjádřeny jednotlivé proměnné, a změněnými měrovými jednotkami[1]. V důsledku toho, že matice je (jako diagonální matice s nenulovými prvky) regulární, můžeme psát (2) resp. , Nejprve vyšetříme jednotlivé fragmenty vystupující ve výrazech pro důležité statistické charakteristiky. Postupně máme[2] a odtud dále a) U dalších veličin dostáváme b1) b2) a odtud c1) c2) Odtud dostaneme jednak opět např. , jednak také a tedy následně c3) d) t-statistiky měřítkovaných proměnných nedoznají žádných změn, neboť Zde jsme uplatnili okolnost, že matice je diagonální. Máme tedy např. a vezmeme-li druhé odmocniny z diagonálních prvků , dostaneme podobně e) Durbin-Watsonův koeficient autokorelace reziduí[3], který je definován jako , se rovněž nezmění. Rezidua se změní srovnatelně s vysvětlovanou proměnnou [4] Příklad: Nejčastěji vyjadřujeme změnu měřítek v celých mocninách 10 jako měřítka měnících se součinitelů. Změna jednotek se zde provede pouhým posunem desetinné čárky. Přitom se hodnoty regresních koeficientů a k nim příslušných směrodatných odchylek změní přímo úměrně příslušnému 10^k-násobku vysvětlované proměnné a současně nepřímo úměrně 10^j-násobku vysvětlující veličiny, u které tento koeficient (resp. jeho směrodatná odchylka) stojí. Ilustrace: Mějme regresi se dvěma vysvětlujícími proměnnými Předpokládejme, že měrové jednotky, v nichž vyjadřujeme vysvětlující proměnnou ztisícinásobíme a jednotky, v nichž vyjadřujeme vysvětlující proměnnou , zdesetinásobíme (ke změně úrovňové konstanty přímý důvod nemáme). Současně zestonásobíme hodnoty vysvětlované proměnné . Budeme mít tedy modifikace Za uvedených předpokladů máme Nejprve vyšetříme jednotlivé fragmenty vystupující ve výrazech pro důležité statistické charakteristiky. Postupně máme Uvedené změny budou mít za následek to, že v nově určeném vektoru regresních koeficientů bude úrovňová konstanta 100-násobkem původní, regresní koeficient u proměnné desetinou a regresní koeficient u proměnné desetinásobkem původních regresních koeficientů Na základě dříve dosažených výsledků lze tedy konstatovat, že a) regresní koeficienty se změní v proporcích 100 resp. 1/10 a 10 vůči původním b) směrodatné odchylky regresních koeficientů se rovněž změní v proporcích 100 resp. 1/10 a 10 vůči původním . c) t-statistiky regresních koeficientů se nezmění c) rozptyl závisle proměnné se zvýší 10^4 násobně e) reziduální směrodatná odchylka se zvýší 100 násobně f) koeficient determinace se nezmění g) Durbin-Watsonův koeficient autokorelace reziduí se nezmění Ještě jednou shrneme důsledky pro nejčastěji vyskytující se případy: 1. regresní koeficienty 1A. při změně měřítka závisle proměnné ( skalár) změní se ve stejném poměru než daná závisle proměnná, protože 1B. při změně měřítka jediné (i-té) nezávisle proměnné (skalár nacházející se na i-tém místě hlavní diagonály matice D, ostatní diagonální prvky jsou 1) změní se v opačném poměru než daná závisle proměnná 1C při změně měřítka závisle a jediné nezávisle proměnné ,, 2. směrodatné odchylky parametrů 2A při změně měřítka závisle proměnné ( skalár) změní se ve stejném poměru jako závisle proměnná, protože 2B při změně měřítka nezávisle proměnné (skalár) změní se v opačném poměru než daná vysvětlovaná proměnná 2C při změně měřítka závisle i některé z nezávisle proměnných t-statistiky regresních parametrů 3A. při změně měřítka závisle proměnné ( skalár) tj.nezmění se 3B. při změně měřítka nezávisle proměnné tj.nezmění se 3C. při změně měřítka závisle i některé z nezávisle proměnných tj, nezmění se 4 koeficient determinace 4A. při změně měřítka závisle proměnné 4B. při změně měřítka nezávisle proměnné 4C. při změně měřítka závisle i některé z nezávisle proměnných 5 standardní chyba (směrodatná odchylka) reziduí 5A. při změně měřítka závisle proměnné 5B. při změně měřítka nezávisle proměnné 5C. při změně měřítka závisle i některé z nezávisle proměnných 3. rozptyl závisle proměnné 6A. při změně měřítka závisle proměnné 6B. při změně měřítka nezávisle proměnné 6C. při změně měřítka závisle i některé z nezávisle proměnných ------------------------------- [1] S ohledem na symetrii matice platí: , [2] Ovlnkované symboly píšeme ve vztazích napravo; odpovídá to interpretaci, kdy se tážeme, jak budou původní veličiny touto změnou ovlivněny. [3] Znamená to mj., že žádná z obvyklých testových statistik nebude změnou měrových jednotek dotčena. [4] Jako jsme označili t-tý řádek matice