Přechod na menu, Přechod na obsah, Přechod na patičku
     

Číselné charakteristiky náhodných veličin


Kvantily náhodných veličin

Nechť $\alpha \in (0,1)$, pak $\alpha$-kvantil náhodné veličiny $X$ je číslo $K_\alpha(X)$, které splňuje následující vlastnosti

\begin{align} P(X \geq K_\alpha(X)) \geq 1-\alpha \tag{1.10} \end{align} \begin{align} P(X \leq K_\alpha(X)) \geq \alpha. \tag{1.11} \end{align}

Pro speciálně zvolené $\alpha$ používáme názvy:

  1. medián $\dots \alpha=0,5$
  2. dolní kvartil $\dots \alpha=0,25$
  3. horní kvartil $\dots \alpha=0,75$
  4. decily $\dots \alpha=0,1; \dots; 0,9$
  5. percentily $\dots \alpha=0,01; \dots; 0,99$

Rozdíl mezi horním a dolním kvartilem se nazývá kvartilové rozpětí a značíme ho

\begin{align} q = K_{0,75}(X) – K_{0,25}(X). \tag{1.12} \end{align}

Pro výpočet empirického $\alpha$-kvantilu na základě uspořádaného datového souboru $x_{(1)} \leq \dots \leq x_{(n)}$ používáme následující vztahy:

Pokud se $n\alpha$ rovná celému číslu $c$, pak

\begin{align} x_\alpha = \frac{x_{(c)}+x_{(c+1)}}{2}. \tag{1.13} \end{align}

Pokud se $n\alpha$ nerovná celému číslu, pak toto číslo zaokrouhlíme nahoru, na nejbližší celé číslo $c$ a platí

\begin{align} x_\alpha = x_{(c)} \tag{1.14} \end{align}

Střední hodnota

Nechť $X$ je náhodná veličina definována na pravděpodobnostním prostoru ($\Omega, \mathcal{A}, P$). Pokud je náhodná veličina $X$ diskrétního typu a má pravděpodobnostní funkci $p(x)$, potom můžeme její střední hodnotu vyjádřit pomocí vztahu

\begin{align} E(X)=\sum_{x=-\infty}^\infty x \cdot p(x) \tag{1.15} \end{align}

za předpokladu, že případná nekonečná řada absolutně konverguje. Jinak řekneme, že střední hodnota neexistuje. Střední hodnota $E(X)$ je číslo, které charakterizuje polohu číselných realizací náhodné veličiny $X$ na číselné ose.

Nechť $Y=g(X)$ je transformovaná náhodná veličina diskrétní náhodné veličiny $X$. Pak střední hodnotu transformované náhodné veličiny vyjádříme pomocí vztahu

\begin{align} E(Y)=E(g(X))=\sum_{x=-\infty}^\infty g(x) \cdot p(x). \tag{1.16} \end{align}

Nechť jsou $X$ a $Y$ náhodné veličiny, které mají střední hodnoty $E(X),E(Y)$ a nechť existuje $E(X\cdot Y)$. Pak střední hodnota transformované veličiny je

\begin{align} E(X\cdot Y) = \sum_{x=-\infty}^\infty \sum_{y=-\infty}^\infty xy \cdot p(x,y). \tag{1.17} \end{align}

Střední hodnotu označujeme i jako první počáteční moment. Rovněž existuje i druhý počáteční moment, pro který platí

\begin{align} E(X^2)=\sum_{x=-\infty}^\infty x^2 \cdot p(x). \tag{1.18} \end{align}

Vlastnosti střední hodnoty

Mějme libovolné konstanty $a,b$ a náhodné veličiny $X,X_1,\dots, X_n$ definovány na stejném pravděpodobnostním prostoru.

  1. $E(a)=a$
  2. $E(a+bX)=a+bE(X)$
  3. $E(X-E(X))=0$
  4. $\displaystyle E\Bigl(\sum_{i=1}^n X_i \Bigl) = \sum_{i=1}^n E(X_i)$
  5. $\displaystyle E\Bigl(\prod_{i=1}^n X_i \Bigr) = \prod_{i=1}^n E(X_i) \quad$ pro $X_1,\dots, X_n$ stochasticky nezávislé

Kovariance

Nechť $(X,Y)^{\boldsymbol\prime}$ je náhodný vektor a nechť existují střední hodnoty $E(X)$ a $E(Y)$ daného náhodného vektoru. Pak číslo

\begin{align} C(X,Y)&=E([X-E(X)][Y-E(Y)])= \notag\\ &=\sum_{x=-\infty}^\infty \sum_{y=-\infty}^\infty [x-E(X)][y-E(Y)] \cdot p(x,y) \tag{1.19} \end{align}

nazveme kovariancí náhodných veličin $X$ a $Y$. Kovariance je číslo, které charakterizuje společnou variabilitu číselných realizací náhodných veličin $X$ a $Y$ kolem středních hodnot. Pokud je kovariance nulová $(C(X,Y)=0)$, řekneme, že náhodné veličiny $X$ a $Y$ jsou nekorelované, takže mezi nimi neexistuje žádná lineární závislost.

Vlastnosti kovariance

Mějme libovolné konstanty $a_1,a_2,b_1,b_2$ a náhodné veličiny $X,X_1,\dots,X_n$, $Y_1,\dots,Y_m$ definovány na stejném pravděpodobnostním prostoru.

  1. $C(a_1,X_2)=C(X_1,a_2)=C(a_1,a_2)=0$
  2. $C(a_1+b_1X_1,a_2+b_2X_2)=b_1b_2C(X_1,X_2)$
  3. $C(X,X)=D(X)$
  4. $C(X_1,X_2)=C(X_2,X_1)$
  5. $C(X_1,X_2)=E(X_1X_2)-E(X_1)E(X_2)$
  6. $\displaystyle C\Bigl(\sum_{i=1}^n X_i, \sum_{j=1}^m Y_j \Bigr)=\sum_{i=1}^n \sum_{j=1}^m C(X_i,Y_j)$

Rozptyl

Nechť $X$ je náhodná veličina a nechť existuje střední hodnota $E(X)$ této náhodné veličiny. Pak číslo

\begin{align} D(X) &= E([X – E(X)]^2)= \sum_{x=-\infty}^\infty [x-E(X)]^2 \cdot p(x) \tag{1.20} \end{align}

nazýváme rozptylem náhodné veličiny $X$.

Rozptyl je nezáporné číslo, které charakterizuje variabilitu číselných realizací náhodné veličiny $X$ kolem střední hodnoty. Číslo $\sqrt{D(X)}$ nazýváme směrodatnou odchylkou náhodné veličiny $X$. Často sa používá značení $\sigma(X)$.

Vlastnosti rozptylu

Mějme libovolné konstanty $a,b$ a náhodné veličiny $X,X_1,\dots, X_n$ definovány na stejném pravděpodobnostním prostoru.

  1. $D(a)=0$
  2. $D(a+bX)=b^2D(X)$
  3. $D(X)=E(X^2)-[E(X)]^2$
  4. $\displaystyle D\Bigl(\sum_{i=1}^n X_i \Bigr)=\sum_{i=1}^n D(X_i)+2\sum_{i=1}^{n-1}\sum_{j=i+1}^n C(X_i, X_j)$

    ale pokud jsou všechny kovariance nulové, pak jsou náhodné veličiny $X_1,\dots, X_n$ nekorelované a platí vztah

    $\displaystyle D\Bigl(\sum_{i=1}^n X_i \Bigr)=\sum_{i=1}^n D(X_i)$

Koeficient korelace

Koeficient korelace náhodných veličin $X$ a $Y$ je číslo

\begin{align} R(X,Y)&=E \left(\frac{X-E(X)}{\sqrt{D(X)}} \cdot \frac{Y-E(Y)}{\sqrt{D(Y)}} \right)= \notag \\ \notag \\ &= \frac{\displaystyle\sum_{x=-\infty}^\infty \sum_{y=-\infty}^\infty [x-E(X)][y-E(Y)] \cdot p(x,y)}{\displaystyle\sqrt{\sum_{x=-\infty}^\infty [x-E(X)]^2 \cdot p(x)} \quad \sqrt{\sum_{y=-\infty}^\infty [y-E(Y)]^2 \cdot p(y)}} \tag{1.21} \end{align}

za podmínky $\sqrt{D(X)} \sqrt{D(Y)} \neq 0$ a za předpokladu, že všechny střední hodnoty existují, jinak $R(X,Y)=0$.

Koeficient korelace je číslo, které charakterizuje míru těsnosti lineární závislosti číselných realizací náhodných veličin $X$ a $Y$. Hodnoty se pohybují v intervalu $ \langle -1, 1 \rangle $.

Vlastnosti koeficientu korelace

Mějme libovolné konstanty $a_1,a_2,b_1,b_2 $ a náhodné veličiny $X,X_1,X_2$ definovány na stejném pravděpodobnostním prostoru.

  1. $R(a_1,X_2)=R(X_1,a_2)=R(a_1,a_2)=0$
  2. $R(a_1+b_1X_1,a_2+b_2X_2)=$ sgn$(b_1b_2)R(X_1,X_2)$
  3. $R(X,X)=1$ pro $D(X) \neq 0$, jinak $R(X,X)=0$
  4. $R(X_1,X_2)=R(X_2,X_1)$
  5. $R(X_1,X_2)=\frac{C(X_1,X_2)}{\sqrt{D(X_1)} \sqrt{D(X_2)}}$ pro $D(X_1)D(X_2) \neq 0$, jinak $R(X_1,X_2)=0$

Šikmost a špičatost

Nechť $X,X_1,X_2$ jsou náhodné veličiny, $k,k_1,k_2$ jsou reálná čísla, $r,s$ jsou přirozená čísla. Číslo $E([X-k]^r)$ se nazývá $r$ -tý moment náhodné veličiny $X$. Číslo $E([X_1-k_1]^r[X_2-k_2]^s)$ se nazývá $r\times s$ -tý smíšený moment náhodného vektoru $(X_1,X_2)^{\boldsymbol\prime}$. O počátečních momentech mluvíme, pokud: $k=k_1=k_2=0$. Pro centrální momenty platí, že: $k=E(X), k_1=E(X_1), k_2=E(X_2)$.

Šikmost náhodné veličiny $X$ je definována vztahem

\begin{align} \gamma_3(X) &= \frac{E([X-E(X)]^3)}{\sqrt{[D(X)]^3}} = \notag \\ \notag \\ &= \frac{E(X^3)-3E(X^2)E(X)+2[E(X)]^3}{D(X)\sqrt{D(X)}} \tag{1.22} \end{align}

a měří nesouměrnost rozložení četností kolem střední hodnoty.

  • $\gamma_3 = 0 \rightarrow$ nulová šikmost (značí symetrické rozdělení hodnot náhodné veličiny nalevo a napravo od střední hodnoty)
  • $\gamma_3 \gt 0 \rightarrow$ pozitivní zešikmení (hodnoty se více kumulují v levém okolí střední hodnoty a odlehlejší hodnoty jsou vpravo od střední hodnoty)
  • $\gamma_3 \lt 0 \rightarrow$ negativní zešikmení (naopak jako při pozitivním zešikmení)

Špičatost náhodné veličiny $X$ je definována vztahem

\begin{align} \gamma_4(X) &= \frac{E([X-E(X)]^4)}{\sqrt{[D(X)]^4}} – 3 = \notag \\ \notag\\ &= \frac{E(X^4)-4E(X^3)E(X)+6E(X^2)[E(X)]^2-3[E(X)]^4}{[D(X)]^2}-3 \tag{1.23} \end{align}

a měří koncentraci rozložení četností kolem střední hodnoty.

  • $\gamma_4 = 0 \rightarrow$ nulová špičatost
  • $\gamma_4 \gt 0 \rightarrow$ pozitivní špičatost (většina hodnot náhodné veličiny leží blízko její střední hodnoty)
  • $\gamma_4 \lt 0 \rightarrow$ negativní špičatost (rovnoměrnější rozdělení a plošší křivka)

V obou případech, šikmosti i špičatosti, předpokládáme, že střední hodnoty existují a směrodatná odchylka je kladná.

Pro třetí a čtvrtý počáteční moment platí následující vztahy

\begin{align} E(X^3)=\sum_{x=-\infty}^\infty x^3 \cdot p(x) \tag{1.24} \end{align} \begin{align} E(X^4)=\sum_{x=-\infty}^\infty x^4 \cdot p(x). \tag{1.25} \end{align}

Číselné charakteristiky náhodného vektoru

Nechť $\textbf{X} = (X_1,\dots,X_n)'$ je náhodný vektor. Reálný vektor $E(\textbf{X})=(E(X_1),\dots,E(X_n))'$ nazýváme vektorem středních hodnot.

Reálná čtvercová symetrická matice $var(\textbf{X})$ se nazývá varianční matice náhodného vektoru $\textbf{X} = (X_1,\dots,X_n)'$.

\begin{align} var(\textbf{X}) = \begin{pmatrix} D(X_1)&C(X_1,X_2)&\dots&C(X_1,X_n) \\ \dots&\dots&\dots&\dots \\ C(X_n,X_1)&C(X_n,X_2)&\dots&D(X_n) \end{pmatrix} \tag{1.26} \end{align}

Reálná čtvercová symetrická matice $cor(\textbf{X})$ se nazývá korelační matice náhodného vektoru $\textbf{X} = (X_1,\dots,X_n)'$.

\begin{align} cor(\textbf{X}) = \begin{pmatrix} 1&R(X_1,X_2)&\dots&R(X_1,X_n) \\ \dots&\dots&\dots&\dots \\ R(X_n,X_1)&R(X_n,X_2)&\dots&1 \end{pmatrix} \tag{1.27} \end{align}
RNDr. Marie Budíková, Dr. |
ÚMS, Přírodovědecká fakulta, Masarykova univerzita |
Návrat na úvodní stránku webu, přístupnost |
Stránky Přírodovědecké fakulty MU
| Technická spolupráce:
| Servisní středisko pro e-learning na MU
| Fakulta informatiky Masarykovy univerzity, 2015

Centrum interaktivních a multimediálních studijních opor pro inovaci výuky a efektivní učení | CZ.1.07/2.2.00/28.0041