{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "Náhodná proměnná\n", "=================\n", "\n", "- obor hodnot = všechny možné případy\n", "- konečný/spočetný (diskrétní)\n", "\n", "(rozlišovat NP versus hodnota NP)\n", "\n", "v případě spojitých náhod. proměnných (obor reálných čísel) zavádíme *hustotu pravděpodobnosti*\n", "\n", "$$f(x)=lim_{dx\\rightarrow 0} \\frac{P(x \\leq \\xi \\leq x+dx)}{dx} $$\n", "\n", "- je nenulová, ale může být >1 \n", "- lze rozšířit i na diskrétní proměnné (KO:jak?)\n", "\n", "příklad kvantové mechaniky\n", ": spektrum energií může být zčásti diskrétní, zčásti spojité\n", "\n", "výhodné popsání **distribuční funkcí** $F(x)=P(\\xi < x)$\n", "- neklesajici, od 0 do 1\n" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "### funkce (= transformace) NP\n", "\n", "- přenos z intervalů původní proměnné do nové proměnné\n", "- je-li transformace $y=h(x)$ vzájemně jednoznačná\n", "\n", "pro hustotu g(y) v nové proměnné\n", "\n", "$$ g(y)=f(x) \\frac{dx}{dy} =\\frac{f(x)}{|h'(x)|} = \\frac{f(h^{-1}(y))}{| h'(h_i(y))|} $$\n", "\n", "$h^{-1}$ je inverzní k $h$\n", "\n" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "### v případě více proměnných (náhodný vektor)\n", "\n", "$$F(x_1, x_2, ... x_n) = P(\\xi_1 \\lt x_1 \\wedge \\xi_2 \\lt x_2 \\wedge ... \\xi_n \\lt x_n)$$\n", "\n", "souvisí s hustotou NP analogicky s 1-D případem\n", "\n", "\n", "některé proměnné lze \"odintegrovat\" (tzv. *marginalizace*)\n", "\n", "zbude-li jediná proměnná, jde o *marginální rozdělení* (projekce do daného\n", "směru)\n", "\n", "$$F_{\\xi_1}(x_1)=F_\\xi (x_1, \\infty, ... , \\infty)$$\n", "\n", "fixování jedné komponenty (či více) vytváří *řez rozdělovací funkce* (podmíněné rozdělení)\n", "\n", "(nutno ji normovat pomocí marginálního rozdělení)\n", "\n", "$$f_p(x_1, x_2, ... | \\xi_n=x_{0}) =\\frac{f(x_1, x_2, ..., x_{n0})}{f_{\\xi_n}(x_{n0})}$$\n", "\n", "- nezávislost komponent\n", "\n", "$$F_\\xi(x_1,x_2) = F_{\\xi_1}(x_1) F_{\\xi_2}(x_2)$$" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Vlastnosti náhodných proměnných\n", "===============================\n", "\n", "### charakteristiky\n", "\n", "očekávaná hodnota funkce *g* náhodné proměnné $$E(g)= \\int_{\\Omega} { g(X) f(X) dX }$$\n", "\n", "*střední hodnota* (matem. očekávání = expektance) $E(\\xi)$\n", "\n", "event. pracujeme s očekávanou hodnotou z funkce NP - např.\n", "\n", "$$D(\\xi)=E\\{[x-E(\\xi)]^2\\}=\\int_{-\\infty}^\\infty \\left[x-\\int_{-\\infty}^{\\infty} x f(x) d x\\right]^2 f(x) d x$$\n", "\n", "*disperze* - $\\sigma^2$ - jeden z centrálních momentů\n", "\n", "- algebraické $\\nu_k=E(\\xi^k)$\n", "- centrální $\\mu_k=E((\\xi-\\nu_1)^k)$\n", "\n", "*asymetrie* (\"skewness\", 3. řád) - $\\gamma_1 = \\frac{\\mu_3}{\\sqrt{\\mu_2^3}}$ \n", "*exces* (a.k.a. \"špičatost\", 4. řád) - $\\gamma_2 = \\frac{\\mu_4}{\\mu_2^2} - 3$ \n", "\n", "korekce zavedena, aby pro normální rozdělení $\\gamma_1 = \\gamma_2 = 0$\n", "\n", "### momenty funkcí více proměnných\n", "\n", "analogická definice střední hodnoty (či střední hodnoty funkce)\n", "\n", "dostáváme nyní i smíšené momenty:\n", "\n", "- smíšený druhý centrální moment (kovariace, korelační moment)\n", "\n", "$$D(\\xi_1,\\xi_2) = E ( [\\xi_1-E(\\xi_1)] [\\xi_2-E(\\xi_2)] ) = E(\\xi_1\\xi_2) - E(\\xi_1) E(\\xi_2)$$\n", "\n", "odtud korelační koeficient\n", "\n", "$$\\rho(\\xi_1,\\xi_2) = D(\\xi_1,\\xi_2) / \\sqrt{D(\\xi_1) D(\\xi_2)}$$ \n", "\n", "pro nezávislé vektory nulový, max. 1 pro plně korelované (\"úměrné\")\n", "\n", "- !! existují závislé NP, které mají nulový korel. koeficient: **nekorelovanost**\n", "je slabší vlastnost než **nezávislost** \n" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "korelační moment lze zavést u n-rozměrného náh. vektoru pro lib. dvojici \n", "komponent z marginálního rozdělení (odintegrováním zbylých složek)\n", "\n", "$D_{ij}=D(\\xi_i,\\xi_j)$ - matice (kovarianční, disperzní) je symetrická, \n", "na diagonále disperze komponent\n", "\n", "Matice je singulární, pokud existuje lineární kombinace složek, která je \n", "nulová (jedna komponenta je lineární kombinací jiných). Jinak lze zavést \n", "inv. matici $D^{-1}$, a kromě \n", "\n", "korelační matice $\\rho_{ij}=\\rho(\\xi_i,\\xi_j)=D_{ij}/\\sqrt{D_{ii} D_{jj}}$\n", "\n", "spočítat i _globální korelační koeficient_ pro danou komponentu, určující \n", "její maximální míru korelace s libovolnou lin. kombinací zbylých složek: \n", "platí\n", "\n", "$$\\rho_i=\\sqrt{1-1/(D_{ii} {D^{-1}}_{ii})}$$" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "### Charakteristická funkce\n", "\n", "$$X(t)=E(e^{i \\xi t})=\\int{e^{i xt} f_\\xi(x) dx}$$\n", " \n", "přičtení konstanty $A$ znamená vynásobení $exp(iAt)$, faktor *a* změní výsledek\n", "$X_{a\\xi}(t)=X_\\xi(at)$\n", "\n", "\n", "$$X_{\\xi + \\theta}(t)=X_\\xi(t) X_\\theta(t)$$\n", "pro normální rozdělení\n", "$X(t)=\\int{e^{i xt} e^{(x-m)^2/2\\sigma^2} dx}=e^{imt-t^2\\sigma^2/2}$ " ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "### Generující funkce\n", "\n", "$$M(t)=E(e^{\\xi t})=\\int{e^{xt} f_\\xi(x) dx}$$\n", "\n", "rozvojem exponenciály získáme souvislost s momenty (necentrálními)\n", "\n", "$$M(t)=E \\left[ 1+\\xi t +\\frac{1}{2!} {\\xi t} + \\dots \\right]=\\sum_{n=0} \\frac{1}{n} {\\mu'}_n t^n$$\n", "\n", "odkud lze vyjádřit\n", "\n", "$${\\mu'}_{n} = \\frac{\\partial^n M(t)}{\\partial t^n}$$ v bodě $t=0$ " ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "lineární kombinace NP\n", "--------------------------\n", "\n", "$\\Theta = \\sum_i {a_i \\xi_i}$ +A\n", "\n", "- **střední hodnota** $E(\\Theta)=\\sum_i {a_i E(\\xi_i)} + A$\n", "([důkaz](../mmzm_kombinace_dukaz/))\n", "\n", "- **disperze**\n", "\n", "$$D(\\Theta)=E(\\sum_i \\sum_j{a_i a_j [\\xi_i-E(\\xi_i)] [\\xi_j-E(\\xi_j)]} = \\sum_i {a_i^2 D(\\xi_i)} + \\sum_i \\sum_{j\\neq i} {a_i a_j D(\\xi_i, \\xi_j)} $$\n", "\n", "pro nekorelované proměnné druhý člen odpadá\n", "\n", "- **rozdělení** \n", "\n", "hustota pravděp. h(y) nové NP: \n", "\n", "1. vynásobení **konstantou** $a$: $h(y)=f(y/a)/|a|$\n", "2. **součet** $y=x_1 + x_2$\n", "\n", "dle distribuční funkce\n", "\n", "$$F(y) = \\int_{x_1+x_2\\lt y} {f(x_1,x_2) dx_1 dx_2 } = \\int_{-\\infty}^\\infty dx_2 \\int_{-\\infty}^{y-x_2} {f(x_1,x_2)} dx_1 $$\n", "\n", "pro nezávislé proměnné: $f(x_1,x_2)=f_1(x_1) f_2(x_2)$ při zavedení proměnné $t$ se substitucí $x_1=t-x_2$\n", "\n", "$$F(y)=\\int_{-\\infty}^y dt \\int_{-\\infty}^\\infty {f_2(x_2) f_1(t-x_2) dx_2 } = \\int_{-\\infty}^y f(t) dt ,$$\n", "\n", "kde $f(t)=\\int f_1(t-x) f_2(x) dx$ je (Fourierova) konvoluce hustot; analogicky pro součin nezávislých proměnných $y=x_1 * x_2$ dostáváme hustotu pravděpodobnosti jako (Mellinovu) konvoluci\n", "\n", "$$ f(t)=\\int f_1(t/x) f_2(x) dx/|x|$$ " ] } ], "metadata": { "kernelspec": { "display_name": "Python 3", "language": "python", "name": "python3" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.4.1" }, "toc": { "toc_cell": false, "toc_number_sections": true, "toc_threshold": 6, "toc_window_display": false }, "widgets": { "state": {}, "version": "1.1.1" } }, "nbformat": 4, "nbformat_minor": 0 }