Základy zpracování geologických dat
Rozdělení pravděpodobnosti
§R. Čopjaková
§
§
rozdeleni cetnosti
Od četnosti k pravděpodobnosti
zahušťujeme
měření
zahušťujeme
měření
n f
n f
Hustota rozdělení pravděpodobností
frekvenční funkce
pravděpodobnostní funkce
§Spojité náhodné veličiny
§Diskrétní náhodné veličiny
Rozdělení pravděpodobnosti
Normální rozdělení (spojité)
§Hustota rozdělení pravděpodobnosti (neboli frekvenční funkce)
§Normální rozdělení pravděpodobnosti s parametry μ a σ2 je definováno hustotou pravděpodobnosti ve
tvaru
§
–
–kde m = (Ex) je střední hodnota normálního rozdělení
– a σ2 je rozptyl, (σ je směrodatná odchylka)
–
– základní soubor výběrový soubor
– μ x
–
• σ2 Sx2
•
§Střední hodnota (Ex) normálního rozložení by se měla blížit aritmetickému průměru naměřených
hodnot
§Normální rozdělení se značí
–
Soubor:Normalni rozdeleni hustota.svg
Hustota normálního rozdělení pravděpodobnosti (tzv. Gaussova křivka)
\operatorname{N}(\mu,\sigma^2)
Normální rozdělení
§
§Plocha pod křivkou hustoty má velikost 1.
§Protože hustota je symetrická kolem m, znamená to, že m dělí plochu pod křivkou na dvě stejné
části - každá z nich má tedy velikost 1/2.
§Ve vzdálenosti jedné směrodatné odchylky se nacházejí inflexní body fce
§Pravděpodobnost P, že náhodná veličina bude mít hodnotu padnoucí do intervalu je rovna ploše
vyšrafované v grafu.
§
§
§
§
normalni rozdeleni graf1
rozptyl směrodatná odchylka
Rozptyl Sx2 určuje průměrnou čtvercovou odchylku od aritmetického průměru
Směrodatná odchylka Sx nám umožňuje odhadnout interval, ve kterém očekáváme naměřenou hodnotu
Pravděpodobnost P, že měření bude zatíženo chybou o velikosti padnoucí do intervalu je rovna
ploše vyšrafované v grafu.
Frekvenční křivka normálního rozdělení
A
B
P
m - s
m + s
0,682
m -2s
m + 2s
0,954
m– 3s
m + 3s
0,997
m – ∞
m + ∞
1,000
normalni rozdeleni graf
Normální rozdělení
§Hustota rozdělení pravděpodobností
Hustota rozdělení pravděpodobností
a)Pro stejné s a různé m
b)
b)
b)
b)
b)
b)
b)Pro různé s a stejné m
§Normální rozdělení má zásadní význam v teorii pravděpodobnosti a matematické statistice a řídí se
jím (alespoň "přibližně") mnoho náhodných veličin. Nejběžnějším typem takových veličin jsou náhodné
chyby (chyby měření). Proto se normálnímu rozdělení někdy říká rozdělení chyb.
§
§Rovněž mnohé náhodné veličiny v geologii se řídí tímto rozdělením nebo jejich rozdělení jím může
být velmi dobře aproximováno.
§
§Někdy se rovněž můžeme setkat s označením Gaussova křivka pro označení hustoty normálního
rozdělení, podle jednoho z praotců tohoto rozdělení.
§
§Normální rozdělení je jednovrcholové rozdělení symetrické okolo střední hodnoty, kterou budeme
značit µ. Hustota pravděpodobnosti má zvonovitý tvar - maxima dosahuje ve střední hodnotě.
§"Konce" tohoto rozdělení vypadají, jako by se již dotýkaly osy x, nikdy se jí však nedotknou, i
když jsou jí tím blíže, čím více se vzdalujeme od střední hodnoty µ - ať již doleva či doprava.
§
§Normální rozdělení je jednoznačně určeno střední hodnotou a rozptylem, jež jsou jeho parametry.
Pokud tedy tyto dvě charakteristiky známe, můžeme určit lehce již vše ostatní - to je tvar celého
rozdělení.
§
§Dobře aproximuje řadu jiných (i diskrétních) pravděpodobnostních rozdělení.
§
§Při řešení pravděpodobnostních úloh se často předpokládá, že sledovaná náhodná veličina má
normální rozdělení, ačkoliv její skutečné rozdělení má jen podobný tvar, tzn. je jednovrcholové a
přibližně symetrické. Tento postup je samozřejmě teoreticky podložen, jak dále uvidíme, a je velmi
výhodný, neboť usnadňuje teoretické řešení mnoha problémů i praktické výpočty.
Vztah mezi frekvenční a distribuční funkcí
§pro distribuční fci diskrétní náhodné veličiny platí: F(x) = P(X ≤ x) a tedy
f(x)
F(x)
\begin{displaymath} F(x) = \sum_{x_i \leq x} p(x_i) \end{displaymath} histogramy
Normální rozdělení
§Distribuční funkce normálního rozdělení – spojitá funkce
§
§
§
§Plocha pod křivkou hustoty má velikost 1. Jinými slovy, integrál z hustoty pravděpodobnosti
normálního rozdělení přes celý definiční obor náhodné veličiny je roven jedné.
F(x) = \int_{-\infty}^x \frac{1}{\sigma\sqrt{2\pi}} \mathrm{e}^{-\frac{{(t-\mu)}^2}{2\sigma^2}}
\;\mathrm{d}t
Vztah mezi frekvenční a distribuční funkcí spojité náhodné veličiny
§Pro případ normálního rozdělení
~AUT0005
distribuční funkce se dá vyjádřit
pomocí integrálu:
$F(x)$ \begin{displaymath} F(x) = \int_{-\infty}^{x} f(t) \ {\rm d} t \end{displaymath}
Velikost vybarvené plochy pod frekvenční funkcí odpovídá
hodnotě distribuční funkce F v bodě z
§ Pravděpodobnost P, že náhodná veličina bude mít hodnotu padnoucí do intervalu je rovna
ploše vyšrafované v grafu frekvenční funkce nebo úseku na ose y pro x z intervalu v grafu
distribuční funkce.
§
~AUT0002
Transformace normálního rozdělení na standardizované normální rozdělení
§Frekvenční funkce normálního rozdělení
§
§
§
§Náhodnou veličinu X s normálním rozdělením N(m, s2) transformuji pomocí tzv. Z-transformace na
veličinu se standardním normálním rozdělením, tedy s m = 0 a s2 = 1
§
§ Z-transformace
§
§Normované (nebo standardizované) normální rozdělení má tedy hustotu pravděpodobnosti
§
§
§
§Standardizované normální rozdělení se značí N(O, 1)
§Využívá se často při práci s vícerozměrnými soubory dat
§
V geologii mají normální rozdělení např. tyto náhodné veličiny
§ topografický reliéf
§ hustota hornin
§ obsah hlavních oxidů v horninách
§stanovení stáří hornin