Dvojparametrický model

  • předpokládejme, že naměřená data $y_i$ závisejí na některé primární veličině (např. vlnové délce nastavené v monochromátoru) $x_i$ podle známé modelové funkce z(x), ovšem s neznámou amplitudou a a pozadím b
  • nejistota v hodnotách $x_i$ je zanedbatelná (podstatně menší než vzdálenost sousedních bodů)
  • nejistota v měření má normální rozdělení s rozptylem $\sigma$

pro předpokládanou hodnotu parametrů a a b je v bodě $x_i$ očekávána střední hodnota závislé proměnné $a*z(x_i)+b$, tedy hustota měřené N-tice

$$\prod_i^N \frac{1}{\sqrt{2\pi}\sigma} \exp \left[-\frac{(y_i-a z(x_i)-b)^2}{2\sigma^2}\right]$$

maximum (logaritmu) věrohodnosti odpovídá (pro toto norm. rozdělení) minimu součtu $S=\sum_i (y_i-a z(x_i)-b)^2$:

$$ \frac{\partial S}{\partial a}=0 \rightarrow \sum_i y_i z(x_i)= \hat{b} \sum_i{z(x_i)} + \hat{a} \sum_i{z(x_i)^2}$$$$ \frac{\partial S}{\partial b}=0 \rightarrow \sum_i y_i= \hat{b} N + \hat{a} \sum_i{z(x_i)}$$

determinant $d=N \sum_i^N z(x_i)^2 - (\sum_i^N z(x_i))^2 = \sum_i^N \sum_{j=i+1}^N (z(x_i)-z(x_j))^2$ je nenulový, pokud aspoň dvě hodnoty $z(x_i)$ jsou různé

pak

$$\hat{a}=\frac{1}{d} \sum_i y_i {[\sum_j { (z(x_j)-z(x_i))}]} = \frac{1}{d} \left( N \sum_i y_i z(x_i) - \sum_i y_i \sum_j z(x_j) \right)$$$$\hat{b}=\frac{1}{d} \sum_i y_i {[\sum_j {z(x_j) (z(x_j)-z(x_i))}]} = \frac{1}{d} \left( \sum_i y_i \sum_j z(x_j)^2 - \sum_i y_i z(x_i) \sum_j z(x_j) \right)$$

Střední hodnoty těchto veličin ozn. $a_0$, $b_0$ a $D(\hat{a})=\sigma^2 N/d$, $D(\hat{b})=\sigma^2 \sum_j z(x_j)^2/d$ a $D(\hat{a},\hat{b})=-\sigma^2 \sum_j z(x_j)/d$

odhad parametrů eliptickou oblastí při známém $\sigma$

Veličina $$\chi=\frac{1}{1-\rho^2}\left[\frac{(\hat{a}-a_0)^2}{\sigma^2(\hat{a})} -2\rho \frac{(\hat{a}-a_0)(\hat{b}-b_0)}{\sigma(\hat{a})\sigma(\hat{b})} + \frac{(\hat{b}-b_0)^2}{\sigma^2(\hat{b})} \right]$$

má rozdělení $\chi_{2}^2$. Podmínka $\chi=\lambda$ definuje elipsu, její vnitřek je pak konfidenční oblast s daným pravděpodobnostním obsahem. V naší interpretaci to odpovídá pravděpodobnosti, že stejně velká elipsa se středem v určených parametrech $\hat{a},\hat{b}$ bude obsahovat skutečnou hodnotu parametru $a_0,b_0$.

odhad parametrů eliptickou oblastí při neznámém $\sigma$

Pokud $\sigma$ neznáme, lze ji odhadnout pomocí náhodné proměnné $$\widehat{\sigma^2}=S_0/N=\sum_i (y_i-\hat{a} z(x_i)-\hat{b})^2 /N$$ ($S_0$ je reziduální suma čtverců - minimum fce S) - veličina $\widehat{\sigma^2} N/\sigma^2$ má rozdělení $\chi_{N-2}^2$ (počet stupňů volnosti). Nevychýlený odhad $\sigma^2$ je tedy $S_0/(N-2)$.

Podíl $(\sigma^2 \chi^2)/(S_0/(N-2))$ má pak Fisherovo rozdělení. Elipsy popisující odhady parametrů pak mají nejen náhodný střed, ale i velikost: odhady disperzí jsou náhodné veličiny

$$\hat{\delta}(\hat{a})=\sqrt{\frac{S_0}{N-2}} \sqrt{\frac{N}{d}}$$$$\hat{\delta}(\hat{b})=\sqrt{\frac{S_0}{N-2}} \sqrt{\frac{1}{d}} \sum_i{z(x_i)^2}$$
In [ ]: