12 Počet pravděpodobnostiV této kapitole jsou použité příklady z knihy: Musilová & Musilová (2006).
Rozdělení pravděpodobnosti diskrétní náhodné veličiny $X$ vyjadřuje tzv. pravděpodobnostní funkce $P(X)$ s hodnotami pravděpodobnosti $p(x_i)=p_i$, kde $\sum_i p_i=1$. Rozdělení pravděpodobnosti spojité náhodné veličiny $X$ udává funkce hustoty rozdělení pravděpodobnosti (hustoty pravděpodobnosti) $f(x)$, pro kterou platí $ \int_\Omega f(x)\,\text{d} x=1$, kde $\Omega$ je definiční obor veličiny $X$. Pro hodnoty $x\notin\Omega$ platí $f(x)=0$. Významná rozdělení pravděpodobnosti jsou:
-
Rovnoměrné rozdělení pravděpodobnosti diskrétní i spojité náhodné veličiny $X$, které přiřazuje všem jejím hodnotám stejnou pravděpodobnost. Rovnoměrné rozdělení má ve všech bodech daného intervalu $\langle a,b\rangle,$ konstantní hustotu pravděpodobnosti
$$ f(x)=\left\{\begin{matrix}\dfrac{1}{b-a} & \mbox{pro } x\in\langle a,b\rangle\\0 & \mbox{pro } x\notin\langle a,b\rangle\end{matrix}\right. $$12.1 Poissonovo rozdělení pravděpodobnosti diskrétní náhodné veličiny $X$, které lze vyjádřit pomocí zvoleného parametru $\lambda>0$ jako
$$ p_i=\dfrac{\lambda^{x_i}}{x_i!}\,\text{e}^{-\lambda}. $$12.2Normální (Gaussovo) rozdělení pravděpodobnosti spojité náhodné veličiny $X$, které je definováno hustotou pravděpodobnosti ve tvaru tzv. Gaussovy funkce
$$ f(x)=\dfrac{1}{\sigma\sqrt{2\pi}}\,\text{e}^{-\frac{{(x-\mu)}^2}{2\sigma^2}}, $$12.3kde parametr $\mu$ znamená střední hodnotu veličiny $X$, parametr $\sigma$ jeho směrodatnou odchylku (viz dále).
Ve statistické fyzice se také střední počet rozlišitelných částic (např. molekul) ve stavu senergií $E$ určuje pomocí tzv. Maxwellovy-Boltzmannovy rozdělovací funkce. Pro nerozlišitelné částice platí tzv. Fermiho-Diracovo rozdělení pro fermiony (elektrony, protony, neutrina, atd.) a Boseho-Einsteinovo rozdělení pro bosony (např. fotony). V matematické statistice se často používá tzv. Studentovo rozdělení (viz např. Pánek, 2001), atd. V návaznosti na rozdělení pravděpodobnosti můžeme určit celou řadu statistických nástrojů, pomocí nichž můžeme analyzovat náhodnou veličinu $X$ (reprezentující například soubor naměřených hodnot). Mezi nejdůležitější z nich patří:
-
Váha – v případě diskrétní náhodné veličiny $X$ s jednotlivými hodnotami $x_i$ zavádíme tzv. váhu $w_i$, kterou můžeme zpravidla stanovit na základě tzv. vnitřních nejistot (chyb) $\delta x_i$ hodnot $x_i$ (například chyby měření, atd.), tedy na základě relace
$$ w_i\sim \dfrac{1}{\delta{x_i}^2}.$$12.4Dále zavedeme tzv.{sumu vah} $S_w$ a tzv. střední váhu $w_s$,
$$ S_w=\sum_{i=1}^Nw_i,\quad w_s=\dfrac{1}{N}\sum_{i=1}^Nw_i=\dfrac{S_w}{N}, $$12.5kde $N$ je celkový počet diskrétních hodnot $x_i$. Mezi váhami a hodnotami pravděpodobnosti existuje tedy volná relace – pokud suma vah $S_w=1$, potom $w_i=p_i$. Obdobným způsobem můžeme v případě spojité náhodné veličiny zavést tzv. váhovou funkci $w(x)$, jejíž
suma
bude dána jako $\int_\Omega w(x)\,\text{d} x$. Je tedy opět zjevné, že pokud tento integrál bude normován (bude roven jedné) bude platit $w(x)=f(x)$, váhová funkce se takto stává hustotou pravděpodobnosti. Střední hodnota (aritmetický průměr), která se obvykle značí $\bar{x}$, $\langle{x}\rangle$ nebo také $\mu$. V případě diskrétní náhodné veličiny $X$ bude střední hodnota definována jako suma všech hodnot $x_i$ veličiny $X$ dělená jejich počtem nebo jako suma násobků všech hodnot veličiny $X$ s příslušnými hodnotami pravděpodobnostní funkce, tedy
$$ \langle{x}\rangle=\dfrac{1}{N}\sum_{i=1}^Nx_i=\sum_{i=1}^Nx_ip_i.$$12.6V případě použití druhého vztahu mluvíme také o tzv. očekávané hodnotě, značené $E(X)$, resp. o váženém aritmetickém průměru. Jemný rozdíl mezi těmito pojmy závisí na definici prvku $x_i$ veličiny $X$, případně na způsobu volby tzv. statistické váhy. tzv. váhovanou střední hodnotu (váhovaný aritmetický průměr) stanovíme jako
$$ \langle{x}\rangle=\frac{1}{S_w}\sum_{i=1}^Nx_iw_i. $$12.7Střední hodnotu (neváhovanou a váhovanou) spojité náhodné veličiny $X$ stanovíme jako
$$ \langle{x}\rangle=E(X)=\int_\Omega x\,f(x)\,\text{d} x,\quad \langle{x}\rangle=\frac{\int_\Omega x\,w(x)\,\text{d} x}{\int_\Omega w(x)\,\text{d} x}. $$12.8Rozptyl a směrodatná odchylka jsou nejčastěji označované jako $D(X)$, $\text{var}(X)$, případně $\sigma^2(X)$ (rozptyl) a $\sigma(X)$ (směrodatná odchylka). Rozptyl (disperze) je definován jako střední hodnota druhých mocnin odchylek od střední hodnoty (aritmetického průměru) veličiny $X$, směrodatná odchylka je odmocninou z rozptylu. Pro diskrétní náhodnou veličinu $X$ se stejnou váhou (pravděpodobností) všech hodnot $x_i$ je rozptyl definován jako
$$ D(X)=\frac{1}{N}\sum_{i=1}^N(x_i-\langle{x}\rangle)^2=\langle{x^2}\rangle-\left\langle{x}\right\rangle^2. $$12.9V případě různých pravděpodobností diskrétních hodnot náhodné veličiny $X$ bude rozptyl určen vztahem
$$ D(X)=\sum_{i=1}^N p_i\cdot(x_i-\langle{x}\rangle)^2=-\langle{x}\rangle^2+\sum_{i=1}^N x_i^2\cdot p_i. $$12.10Pro spojitou náhodnou veličinu $X$ je rozptyl definován vztahem
$$ D(X)=\int_\Omega(x-\langle{x}\rangle)^2\,f(x)\,\text{d} x\,=-\langle{x}\rangle^2+\int_\Omega x^2f(x)\,\text{d} x. $$12.11Pro směrodatnou odchylku obecně platí $\sigma(X)=\sqrt{D(X)}$.
-
Nejpravděpodobnější hodnotu $P_{\max}(X)$ pro diskrétní náhodnou veličinu $X$ stanovíme jako hodnotu $x_i$ s nejvyšší hodnotou pravděpodobnostní funkce $p_i$, tedy $P_{\max}(X)=(x_i,{\max}\,(p_i))$. V případě spojité náhodné veličiny $X$ určíme nejpravděpodobnější hodnotu $P_{\max}(X)$ jako maximum funkce hustoty pravděpodobnosti $f(x)$ v definičním oboru $\Omega$ veličiny $X$, tedy $P_{\max}(X)={\max}\,(f(x))$ pro $x\in\Omega$.
Medián ($\tilde{x}_{0,5}$) a čtvrtkvantily ($\tilde{x}_{0,25},\,\tilde{x}_{0,75}$, také nazývané dolní a horní kvartil) jsou hodnoty $x_i$, v nichž je monotónně uspořádaný statistický soubor rozdělen na příslušné množství stejně početných částí. Medián tedy dělí statistický soubor na dvě stejně početné poloviny. Výhodou mediánu oproti střední hodnotě je jeho neovlivnitelnost extrémně vychýlenými hodnotami. Například u souboru $\{1,\,2,\,2,\,3,\,27\}$ medián $\tilde{x}_{0,5}=2$, střední hodnota $\langle{x}\rangle=7$. V případě spojité náhodné veličiny $X$ určíme medián a čtvrtkvantily (případně jakkoli jinak definované kvantily) z integrálních rovnic
$$ \int_{-\infty}^{\tilde{x}_{0,5}}f(x)\,\text{d} x\,=\dfrac{1}{2},\quad \int_{-\infty}^{\tilde{x}_{0,25}}f(x)\,\text{d} x\,=\dfrac{1}{4},\quad \int_{-\infty}^{\tilde{x}_{0,75}}f(x)\,\text{d} x\,=\dfrac{3}{4}. $$12.12Distribuční funkce $F(x)$ vyjadřuje pravděpodobnost, že hodnota náhodné veličiny $X$ s daným rozdělením pravděpodobnosti bude menší nebo rovna $x$. V případě diskrétní náhodné veličiny $X$ bude distribuční funkce $F(x)$ daná předpisem
$$ F(x)=P(X\leq x)=\sum_{x_i\leq x}p_i, $$12.13bude tedy v bodech $x_i$ nespojitá a mezi body $x_i$ konstantní. Pro spojitou náhodnou veličinu $X$ můžeme distribuční funkci $F(x)$ zapsat jako integrál funkce hustoty pravděpodobnosti,
$$ F(x)=\int_{-\infty}^x f(t)\,\text{d} t. $$12.14Každá distribuční funkce $F(x)$ je neklesající a zprava spojitá, její asymptotické vlastnosti lze vyjádřit jako $\lim\limits_{x\to+\infty}F(x)=1, \lim\limits_{x\to-\infty}F(x)=0$, pro libovolnou dvojici $x_1,x_2$ platí $P(x_1<x\le x_2)=F(x_2)-F(x_1)$.
Příklady
Střelec provedl $N=150$ výstřelů na terč, který je tvořen soustavou $n=5$ mezikruží $MK_i$, $i=1,.\,.\,.\,,5$. Mezikruží $MK_i$ přitom zasáhl $N_i$-krát, kde $N_1=15,\,N_2=20,\,N_3=35,\,N_4=45,\,N_5=35$. Za zásah mezikruží $MK_i$ získal $i$ bodů. Náhodnou veličinu $X$ s diskrétním rozdělením definujeme jako počet bodů, získaných pro jeden náhodný výstřel.
Určete:
-
rozdělení $\left\{\left(x_i,p_i\right)\right\}$ veličiny $X$,$\left\{\left(1,\dfrac{1}{10}\right),\left(2,\dfrac{2}{15}\right),\left(3,\dfrac{7}{30}\right), \left(4,\dfrac{3}{10}\right),\left(5,\dfrac{7}{30}\right)\right\}$
-
pravděpodobnost, že pro náhodný výstřel získá střelec alespoň $I$ bodů, $I=1,2,3,4,5$,$P_1=1,\,P_2=\dfrac{9}{10},\,P_3=\dfrac{23}{30},\,P_4=\dfrac{8}{15},\,P_5=\dfrac{7}{30}$
-
střední hodnotu veličiny $X$,$3,\!4\bar{3}$
-
směrodatnou odchylku veličiny $X$,$1,\!26$
-
pravděpodobnost, že při výstřelu získá střelec počet bodů v intervalu $i\in\langle 2,4\rangle$.$\dfrac{2}{3}$
Na letištních záchodech jsou čtyři kabinky. Je dána distribuční funkce obsazení kabinek: $F(0)=0,\!1,\,F(1)=0,\!35, F(2)=0,\!6,\,F(3)=0,\!95,\,F(4)=1$.
Určete:
-
rozdělení náhodné veličiny $X$, odpovídající počtu obsazených kabinek,$\left\{\left(0;\,0,\!1\right),\left(1;\,0,\!25\right),\left(2;\,0,\!25\right), \left(3;\,0,\!35\right),\left(4;\,0,\!05\right)\right\}$
-
střední hodnotu veličiny $X$ a její rozptyl,$2;\,1,\!2$
-
pravděpodobnost, že budou obsazeny alespoň dvě kabinky.$0,\!65$
Je dána funkce $f(x)=k\cdot x$ pro $0\leq x\leq 2$ a $f(x)=0$ v ostatních případech. Určete:
-
konstantu $k$ tak, aby funkce byla hustotou pravděpodobnosti,$k=\dfrac{1}{2}$
-
střední hodnotu a rozptyl,$\dfrac{4}{3},\,\dfrac{2}{9}$
-
nejpravděpodobnější hodnotu,2
-
medián a čtvrtkvantily $\tilde{x}_{0,25},\tilde{x}_{0,75}$,$\tilde{x}_{0,5}=\sqrt{2},\,\tilde{x}_{0,25}=1,\,\tilde{x}_{0,75}=\sqrt{3}$
-
distribuční funkci.
$F(x)=0\quad \forall$ $x<0$,
$F(x)=\dfrac{1}{4}x^2\quad \forall$ $0\le x\le 2$,
$F(x)=1\quad \forall$ $x>2$
Je dána funkce $f(x)=\dfrac{k}{(x+1)^2}$ pro $x\geq 0$ a $f(x)=0$ pro $x<0$. Určete:
-
konstantu $k$ tak, aby funkce byla hustotou pravděpodobnosti,$k=1$
-
distribuční funkci,
$F(x)=0\quad \forall$ $x\leq 0$,
$F(x)=\dfrac{x}{x+1}\quad \forall$ $x>0$
-
nejpravděpodobnější hodnotu, medián a čtvrtkvantily $\tilde{x}_{0,25},\tilde{x}_{0,75}$.$0,\,\,\tilde{x}_{0,5}=1,\,\tilde{x}_{0,25}=\dfrac{1}{3},\,\tilde{x}_{0,75}=3$
Jsou dány funkce $f(x)=\dfrac{k}{x^2}$ pro $1\leq x\leq 2$, $f(x)=0$ v ostatních případech, $g(x)=c\big(x-x^2\big)$ pro $0\leq x\leq 1$, $g(x)=0$ v ostatních případech. Určete:
-
konstanty $k$ a $c$ tak, aby funkce byly hustotami pravděpodobnosti,$k=2,\,c=6$
-
příslušné distribuční funkce,
$F_1(x)=0\quad\forall$ $x<1$,
$F_1(x)=2\dfrac{x-1}{x}\quad\forall 1\leq x\leq 2$,
$F_1(x)=1\quad\forall x>2$,
$F_2(x)=0 \quad\forall x<0$,
$F_2(x)=3x^2–2x^3\quad\forall 0\leq x\leq 1$,
$F_2(x)=1\quad \forall x>1$
-
nejpravděpodobnější hodnotu, střední hodnotu, rozptyl a medián pro každé z rozdělení.$f:\,1,\,2\ln 2,\,2–4\ln^2\,2,\,\dfrac{4}{3},\,\,g:\,\dfrac{1}{2},\,\dfrac{1}{2},\,\dfrac{1}{20},\,\dfrac{1}{2}$
Házíme dvěma kostkami. Náhodnou veličinou $X$ označme součet bodů na obou kostkách při jednom hodu. Určete:
-
rozdělení veličiny $X$,$\left\{\!\left(1,0\right)\!,\left(2,\dfrac{1}{36}\right)\!,\left(3,\dfrac{1}{18}\right)\!, \left(4,\dfrac{1}{12}\right)\!,\left(5,\dfrac{1}{9}\right)\!,\left(6,\dfrac{5}{36}\right)\!,\left(7,\dfrac{1}{6}\right)\!, \left(8,\dfrac{5}{36}\right)\!,\left(9,\dfrac{1}{9}\right)\!,\right.\\\left(10,\dfrac{1}{12}\right)\!, \left.\left(11,\dfrac{1}{18}\right)\!,\left(12,\dfrac{1}{36}\right)\!\right\}$
-
distribuční funkci,
$F(x)=0$ $\forall$ $x<2$,
$F(x)=\dfrac{1}{36}\quad\forall$ $x\in\langle 2,3)$,
$F(x)=\dfrac{1}{12}\quad \forall$ $x\in\langle 3,4)$,
$F(x)=\dfrac{1}{6}\quad \forall$ $x\in\langle 4,5)$,
$F(x)=\dfrac{5}{18}\quad \forall$ $x\in\langle 5,6)$,
$F(x)=\dfrac{5}{12}\quad \forall$ $x\in\langle 6,7)$,
$F(x)=\dfrac{7}{12}\quad \forall$ $x\in\langle 7,8)$,
$F(x)=\dfrac{13}{18}\quad \forall$ $x\in\langle 8,9)$,
$F(x)=\dfrac{5}{6}\quad \forall$ $x\in\langle 9,10)$,
$F(x)=\dfrac{11}{12}\quad \forall$ $x\in\langle 10,11)$,
$F(x)=\dfrac{35}{36}\quad \forall$ $x\in\langle 11,12)$,
$F(x)=1\quad \forall$ $x\geq 12$
-
střední hodnotu, rozptyl a nejpravděpodobnější hodnotu,$7;\,5,\!83;\,7$
-
pravděpodobnost, že součet bodů na kostkách bude ležet v intervalu $\langle 5,7\rangle$.$\dfrac{5}{12}$