{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "Dvojparametrický model\n", "===================================\n", "\n", "- předpokládejme, že naměřená data $y_i$ závisejí na některé primární veličině (např. vlnové délce nastavené v monochromátoru) $x_i$ podle známé modelové\n", "funkce *z(x)*, ovšem s neznámou amplitudou *a* a pozadím *b*\n", "- nejistota v hodnotách $x_i$ je zanedbatelná (podstatně menší než vzdálenost sousedních bodů)\n", "- nejistota v měření má normální rozdělení s rozptylem $\\sigma$\n", "\n", "pro předpokládanou hodnotu parametrů *a* a *b* je v bodě $x_i$ očekávána střední hodnota závislé proměnné $a*z(x_i)+b$, tedy hustota měřené N-tice\n", "\n", "$$\\prod_i^N \\frac{1}{\\sqrt{2\\pi}\\sigma} \\exp \\left[-\\frac{(y_i-a z(x_i)-b)^2}{2\\sigma^2}\\right]$$\n", "\n", "maximum (logaritmu) věrohodnosti odpovídá (pro toto norm. rozdělení) minimu součtu $S=\\sum_i (y_i-a z(x_i)-b)^2$:\n", "\n", "$$ \\frac{\\partial S}{\\partial a}=0 \\rightarrow \\sum_i y_i z(x_i)= \\hat{b} \\sum_i{z(x_i)} + \\hat{a} \\sum_i{z(x_i)^2}$$\n", "$$ \\frac{\\partial S}{\\partial b}=0 \\rightarrow \\sum_i y_i= \\hat{b} N + \\hat{a} \\sum_i{z(x_i)}$$\n", "\n", "determinant $d=N \\sum_i^N z(x_i)^2 - (\\sum_i^N z(x_i))^2 = \\sum_i^N \\sum_{j=i+1}^N (z(x_i)-z(x_j))^2$ je nenulový, pokud aspoň dvě hodnoty $z(x_i)$ jsou různé" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "pak\n", "\n", "$$\\hat{a}=\\frac{1}{d} \\sum_i y_i {[\\sum_j { (z(x_j)-z(x_i))}]}$$\n", "$$\\hat{b}=\\frac{1}{d} \\sum_i y_i {[\\sum_j {z(x_j) (z(x_j)-z(x_i))}]}$$\n", "\n", "Střední hodnoty těchto veličin ozn. $a_0$, $b_0$ a $D(\\hat{a})=\\sigma^2 N/d$, $D(\\hat{b})=\\sigma^2 \\sum_j z(x_j)^2/d$ a $D(\\hat{a},\\hat{b})=-\\sigma^2 \\sum_j z(x_j)/d$\n", "\n", "odhad parametrů eliptickou oblastí při známém $\\sigma$\n", "\n", "---------------------------------------" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "$$\\chi=\\frac{1}{1-\\rho^2}\\left[\\frac{(\\hat{a}-a_0)^2}{\\sigma^2(\\hat{a})} -2\\rho \\frac{(\\hat{a}-a_0)(\\hat{b}-b_0)}{\\sigma(\\hat{a})\\sigma(\\hat{b})} + \\frac{(\\hat{b}-b_0)^2}{\\sigma^2(\\hat{b})} \\right]$$\n", "\n", "má rozdělení $\\chi_{2}^2$. Podmínka $\\chi=\\lambda$ definuje elipsu, její vnitřek je pak konfidenční oblast s daným pravděpodobnostním obsahem. V naší interpretaci to odpovídá pravděpodobnosti, že bude elipsa se středem $\\hat{a},\\hat{b}$ bude obsahovat skutečnou hodnotu parametru $a_0,b_0$\n", "\n", "odhad parametrů eliptickou oblastí při neznámém $\\sigma$\n", "\n", "---------------------------------------" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Pokud $\\sigma$ neznáme, lze ji odhadnout pomocí náhodné proměnné \n", "$$\\widehat{\\sigma^2}=S_0/N=\\sum_i (y_i-\\hat{a} z(x_i)-\\hat{b})^2 /N$$\n", "($S_0$ je *reziduální suma čtverců* - minimum fce S) - veličina $\\widehat{\\sigma^2} N/\\sigma^2$ má rozdělení $\\chi_{N-2}^2$ (počet stupňů volnosti). Nevychýlený odhad $\\sigma^2$ je tedy $S_0/(N-2)$.\n", "\n", "Podíl $\\frac{\\sigma^2 \\chi/2}{S_0/(N-2)}$ má pak Fisherovo rozdělení. Elipsy popisující odhady parametrů pak mají nejen náhodný střed, ale i velikost: odhady disperzí jsou náhodné veličiny.\n", "\n", "\n", "$$\\hat{\\delta}(\\hat{a})=\\sqrt{\\frac{S_0}{N-2}} \\sqrt{\\frac{N}{d}}$$\n", "\n", "$$\\hat{\\delta}(\\hat{b})=\\sqrt{\\frac{S_0}{N-2}} \\sqrt{\\frac{1}{d}} \\sum_i{z(x_i)^2}$$\n", "\n", " " ] } ], "metadata": { "kernelspec": { "display_name": "Python 3", "name": "python3" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.4.1" } }, "nbformat": 4, "nbformat_minor": 0 }