Nechť $\alpha \in (0,1)$, pak $\alpha$-kvantil náhodné veličiny $X$ je číslo $K_\alpha(X)$, které splňuje následující vlastnosti
\begin{align} P(X \geq K_\alpha(X)) \geq 1-\alpha \tag{1.10} \end{align} \begin{align} P(X \leq K_\alpha(X)) \geq \alpha. \tag{1.11} \end{align}Pro speciálně zvolené $\alpha$ používáme názvy:
Rozdíl mezi horním a dolním kvartilem se nazývá kvartilové rozpětí a značíme ho
\begin{align} q = K_{0,75}(X) – K_{0,25}(X). \tag{1.12} \end{align}Pro výpočet empirického $\alpha$-kvantilu na základě uspořádaného datového souboru $x_{(1)} \leq \dots \leq x_{(n)}$ používáme následující vztahy:
Pokud se $n\alpha$ rovná celému číslu $c$, pak
\begin{align} x_\alpha = \frac{x_{(c)}+x_{(c+1)}}{2}. \tag{1.13} \end{align}Pokud se $n\alpha$ nerovná celému číslu, pak toto číslo zaokrouhlíme nahoru, na nejbližší celé číslo $c$ a platí
\begin{align} x_\alpha = x_{(c)} \tag{1.14} \end{align}Nechť $X$ je náhodná veličina definována na pravděpodobnostním prostoru ($\Omega, \mathcal{A}, P$). Pokud je náhodná veličina $X$ diskrétního typu a má pravděpodobnostní funkci $p(x)$, potom můžeme její střední hodnotu vyjádřit pomocí vztahu
\begin{align} E(X)=\sum_{x=-\infty}^\infty x \cdot p(x) \tag{1.15} \end{align}za předpokladu, že případná nekonečná řada absolutně konverguje. Jinak řekneme, že střední hodnota neexistuje. Střední hodnota $E(X)$ je číslo, které charakterizuje polohu číselných realizací náhodné veličiny $X$ na číselné ose.
Nechť $Y=g(X)$ je transformovaná náhodná veličina diskrétní náhodné veličiny $X$. Pak střední hodnotu transformované náhodné veličiny vyjádříme pomocí vztahu
\begin{align} E(Y)=E(g(X))=\sum_{x=-\infty}^\infty g(x) \cdot p(x). \tag{1.16} \end{align}Nechť jsou $X$ a $Y$ náhodné veličiny, které mají střední hodnoty $E(X),E(Y)$ a nechť existuje $E(X\cdot Y)$. Pak střední hodnota transformované veličiny je
\begin{align} E(X\cdot Y) = \sum_{x=-\infty}^\infty \sum_{y=-\infty}^\infty xy \cdot p(x,y). \tag{1.17} \end{align}Střední hodnotu označujeme i jako první počáteční moment. Rovněž existuje i druhý počáteční moment, pro který platí
\begin{align} E(X^2)=\sum_{x=-\infty}^\infty x^2 \cdot p(x). \tag{1.18} \end{align}Mějme libovolné konstanty $a,b$ a náhodné veličiny $X,X_1,\dots, X_n$ definovány na stejném pravděpodobnostním prostoru.
Nechť $(X,Y)^{\boldsymbol\prime}$ je náhodný vektor a nechť existují střední hodnoty $E(X)$ a $E(Y)$ daného náhodného vektoru. Pak číslo
\begin{align} C(X,Y)&=E([X-E(X)][Y-E(Y)])= \notag\\ &=\sum_{x=-\infty}^\infty \sum_{y=-\infty}^\infty [x-E(X)][y-E(Y)] \cdot p(x,y) \tag{1.19} \end{align}nazveme kovariancí náhodných veličin $X$ a $Y$. Kovariance je číslo, které charakterizuje společnou variabilitu číselných realizací náhodných veličin $X$ a $Y$ kolem středních hodnot. Pokud je kovariance nulová $(C(X,Y)=0)$, řekneme, že náhodné veličiny $X$ a $Y$ jsou nekorelované, takže mezi nimi neexistuje žádná lineární závislost.
Mějme libovolné konstanty $a_1,a_2,b_1,b_2$ a náhodné veličiny $X,X_1,\dots,X_n$, $Y_1,\dots,Y_m$ definovány na stejném pravděpodobnostním prostoru.
Nechť $X$ je náhodná veličina a nechť existuje střední hodnota $E(X)$ této náhodné veličiny. Pak číslo
\begin{align} D(X) &= E([X – E(X)]^2)= \sum_{x=-\infty}^\infty [x-E(X)]^2 \cdot p(x) \tag{1.20} \end{align}nazýváme rozptylem náhodné veličiny $X$.
Rozptyl je nezáporné číslo, které charakterizuje variabilitu číselných realizací náhodné veličiny $X$ kolem střední hodnoty. Číslo $\sqrt{D(X)}$ nazýváme směrodatnou odchylkou náhodné veličiny $X$. Často sa používá značení $\sigma(X)$.
Mějme libovolné konstanty $a,b$ a náhodné veličiny $X,X_1,\dots, X_n$ definovány na stejném pravděpodobnostním prostoru.
$\displaystyle D\Bigl(\sum_{i=1}^n X_i \Bigr)=\sum_{i=1}^n D(X_i)+2\sum_{i=1}^{n-1}\sum_{j=i+1}^n C(X_i, X_j)$
ale pokud jsou všechny kovariance nulové, pak jsou náhodné veličiny $X_1,\dots, X_n$ nekorelované a platí vztah
$\displaystyle D\Bigl(\sum_{i=1}^n X_i \Bigr)=\sum_{i=1}^n D(X_i)$
Koeficient korelace náhodných veličin $X$ a $Y$ je číslo
\begin{align} R(X,Y)&=E \left(\frac{X-E(X)}{\sqrt{D(X)}} \cdot \frac{Y-E(Y)}{\sqrt{D(Y)}} \right)= \notag \\ \notag \\ &= \frac{\displaystyle\sum_{x=-\infty}^\infty \sum_{y=-\infty}^\infty [x-E(X)][y-E(Y)] \cdot p(x,y)}{\displaystyle\sqrt{\sum_{x=-\infty}^\infty [x-E(X)]^2 \cdot p(x)} \quad \sqrt{\sum_{y=-\infty}^\infty [y-E(Y)]^2 \cdot p(y)}} \tag{1.21} \end{align}za podmínky $\sqrt{D(X)} \sqrt{D(Y)} \neq 0$ a za předpokladu, že všechny střední hodnoty existují, jinak $R(X,Y)=0$.
Koeficient korelace je číslo, které charakterizuje míru těsnosti lineární závislosti číselných realizací náhodných veličin $X$ a $Y$. Hodnoty se pohybují v intervalu $ \langle -1, 1 \rangle $.
Mějme libovolné konstanty $a_1,a_2,b_1,b_2 $ a náhodné veličiny $X,X_1,X_2$ definovány na stejném pravděpodobnostním prostoru.
Nechť $X,X_1,X_2$ jsou náhodné veličiny, $k,k_1,k_2$ jsou reálná čísla, $r,s$ jsou přirozená čísla. Číslo $E([X-k]^r)$ se nazývá $r$ -tý moment náhodné veličiny $X$. Číslo $E([X_1-k_1]^r[X_2-k_2]^s)$ se nazývá $r\times s$ -tý smíšený moment náhodného vektoru $(X_1,X_2)^{\boldsymbol\prime}$. O počátečních momentech mluvíme, pokud: $k=k_1=k_2=0$. Pro centrální momenty platí, že: $k=E(X), k_1=E(X_1), k_2=E(X_2)$.
Šikmost náhodné veličiny $X$ je definována vztahem
\begin{align} \gamma_3(X) &= \frac{E([X-E(X)]^3)}{\sqrt{[D(X)]^3}} = \notag \\ \notag \\ &= \frac{E(X^3)-3E(X^2)E(X)+2[E(X)]^3}{D(X)\sqrt{D(X)}} \tag{1.22} \end{align}a měří nesouměrnost rozložení četností kolem střední hodnoty.
Špičatost náhodné veličiny $X$ je definována vztahem
\begin{align} \gamma_4(X) &= \frac{E([X-E(X)]^4)}{\sqrt{[D(X)]^4}} – 3 = \notag \\ \notag\\ &= \frac{E(X^4)-4E(X^3)E(X)+6E(X^2)[E(X)]^2-3[E(X)]^4}{[D(X)]^2}-3 \tag{1.23} \end{align}a měří koncentraci rozložení četností kolem střední hodnoty.
V obou případech, šikmosti i špičatosti, předpokládáme, že střední hodnoty existují a směrodatná odchylka je kladná.
Pro třetí a čtvrtý počáteční moment platí následující vztahy
\begin{align} E(X^3)=\sum_{x=-\infty}^\infty x^3 \cdot p(x) \tag{1.24} \end{align} \begin{align} E(X^4)=\sum_{x=-\infty}^\infty x^4 \cdot p(x). \tag{1.25} \end{align}Nechť $\textbf{X} = (X_1,\dots,X_n)'$ je náhodný vektor. Reálný vektor $E(\textbf{X})=(E(X_1),\dots,E(X_n))'$ nazýváme vektorem středních hodnot.
Reálná čtvercová symetrická matice $var(\textbf{X})$ se nazývá varianční matice náhodného vektoru $\textbf{X} = (X_1,\dots,X_n)'$.
\begin{align} var(\textbf{X}) = \begin{pmatrix} D(X_1)&C(X_1,X_2)&\dots&C(X_1,X_n) \\ \dots&\dots&\dots&\dots \\ C(X_n,X_1)&C(X_n,X_2)&\dots&D(X_n) \end{pmatrix} \tag{1.26} \end{align}Reálná čtvercová symetrická matice $cor(\textbf{X})$ se nazývá korelační matice náhodného vektoru $\textbf{X} = (X_1,\dots,X_n)'$.
\begin{align} cor(\textbf{X}) = \begin{pmatrix} 1&R(X_1,X_2)&\dots&R(X_1,X_n) \\ \dots&\dots&\dots&\dots \\ R(X_n,X_1)&R(X_n,X_2)&\dots&1 \end{pmatrix} \tag{1.27} \end{align}Centrum interaktivních a multimediálních studijních opor pro inovaci výuky a efektivní učení | CZ.1.07/2.2.00/28.0041