Počet pravděpodobnosti jako základ matematické statistiky Pomocí metod popisné statistiky dokážeme přehledně shrnout informace, které se týkají výhradně objektů výběrového souboru. Pokud jsme však data získali na základě dobře navrženého výzkumného plánu, můžeme provádět induktivní úsudky o chování sledovaných proměnných v celém základním souboru. Metody statistické indukce se ovšem opírají o počet pravděpodobnosti. Počet pravděpodobnosti Je to disciplína, která se zabývá studiem zákonitostí v náhodných pokusech. Matematickými prostředky modeluje situace, v nichž hraje roli náhoda. Pod pojmem náhoda rozumíme působení faktorů, které se živelně mění při různých provedeních téhož pokusu a nepodléhají naší kontrole. Pokusem rozumíme jednorázové uskutečnění konstantně vymezeného souboru definičních podmínek. Předpokládáme, že pokus můžeme mnohonásobně nezávisle opakovat za dodržení definičních podmínek (ostatní podmínky se mohou měnit, proto různá opakování pokusu mohou vést k různým výsledkům). Dále předpokládáme, že opakováním pokusu vzniká opět pokus. Deterministický pokus je takový pokus, jehož každé opakování vede k jedinému možnému výsledku. (Např. zahřívání vody na 100°C při atmosférickém tlaku 1015 hPa vede k varu vody.) Náhodný pokus je takový pokus, jehož každé opakování vede k právě jednomu z více možných výsledků, které jsou vzájemně neslučitelné. (Např. hod kostkou vede k právě jednomu ze šesti možných výsledků.) Zavedení měřitelného prostoru Neprázdnou množinu možných výsledků náhodného pokusu značíme Q a nazýváme ji základní prostor. Možné výsledky značíme 0 (nezápornost - axióm) P3: P(A! , A2) + P(A! ^ A2) = P(A0 + P(A2) P4: 1+P(A! ^ A2) > P(A0 + P(A2) P5: P(Ai , A2) < P(Ai) + P(A2) (subaditivita) P6: ^ ^ A2 = o _ P(Ai , A2) = P(A0 + P(A2) (aditivita) P7: P(A2 \ A0 = P(A2) - P(A! ^ A2) P8: Ai A2 _^ P(A2 \ Ai) = P(A2) - P(A2) (subtraktivita) P9: Ai ^ A2 _^ P(Ai) < P(A2) (monotonie) P10: P(Í2) = 1 (normovanost - axióm) Pil: P(A) + P( A) = 1 (komplementarita) P12: P(A) < 1 P13: A ^ Aj = (9 pro i ^j _^ P(Ai , A2 , ...) = P(Ai) + P(A2) + ... (spočetná aditivita - axióm) pi4: p(tA) - £ n n f' - -' V ■> (Pro neslučitelné jevy A1;An dostáváme P([_j\) = \^ )•) i- (Vlastnosti Pl,P12 odpovídají vlastnostem relativní četnosti z popisné statistiky, vlastnost P14 je známa jako věta o sčítání pravděpodobností.) Klasická pravděpodobnost V Kolmogorovově axiomatické definici se nic nepraví o tom, jak na daném měřitelném prostoru konkrétně pravděpodobnost zavést. V případě, že základné prostor je konečný a všechny možné výsledky mají stejnou šanci na uskutečnění, můž eme použít klasickou pravděpodobnost: Klasická pravděpodobnost je funkce, která jevu A přiřazuje číslo , kde m(A) je počet možných výsledků přízni- vých nastoupení jevu A a m(Q) je počet všech možných výsledků. Příklad na klasickou pravděpodobnost (s využitím vlastností pravděpodobnosti): V dodávce 100 kusů výrobků nemá požadovaný průměr 10 kusů, požadovanou délku 20 kusů a současně nemá požadovaný průměr i délku 5 kusů. Jaká je pravděpodobnost, že náhodně vybraný výrobek z této dodávky má požadovaný průměr i délku? v Řešení: Jev A spočívá v tom, že výrobek má požadovaný průměr a jev B v tom, že výrobek má požadovanou délku. Počítáme P(A ^B)=P/V7 = 1-P(A B) = 1 - \P(A) + P(B) - P(7^B)] = 1 - (-r$+ 'njj_ ^) = 0,75. Opakované závislé pokusy - hypergeometrické rozložení pravděpodobností Máme N objektů, mezi nimi je M objektů označeno, U^- \^ . Náhodně bez vracení vybereme n objektů (U^- ^ ). Pravděpodobnost, že ve výběru je právě x označených objektů (ITiaMJV_ . < ^ L1I|M): /MN_M p x 'x n_x W Pravděpodobnost, že ve výběru je nejvýše xi označených objektů: Pravděpodobnost, že ve výběru je aspoň x0 označených objektů: mimJVb x_X) Příklad na hypergeometrické rozložení: Máme skupinu 20 lidí, mezi nimi 4 muže. Vybíráme bez vracení (tj. nikdo nemůže být vybrán opakovaně) pětici z této skupiny. Jaký je nejpravděpodobnější počet mužů mezi vybranými? Řešení: Vypočítáme všechny možné pravděpodobnosti a najdeme počet mužů s největší pravděpodobností. Vzhledem k technice výběru (bez vracení) jde o hypergeometrické rozložení pravděpodobností s parametry N = 20, M = 4, n = 5. Počítáme pro x = 0, 1, 2, 3, 4. íV(- íV(- "001 (Pro kontrolu - součet vypočítaných pravděpodobností je 1.) Vidíme, že nejvyšší pravděpodobnost - 0,4696 - je dosažena v případě, kdy mezi pěticí vybraných osob je právě 1 muž. Stochasticky nezávislé jevy Za stochasticky nezávislé považujeme takové jevy, kdy informace o nastoupení jednoho jevu nijak neovlivní šance, s nimiž očekáváme nastoupení druhého jevu. V popisné statistice jsme zavedli četnostní nezávislost dvou množin Gi, G2 v daném výběrovém souboru pomocí multiplikativního vztahu pjL}^ _ V počtu pravděpodobnosti řekneme, že jevy A1; A2 A jsou stochasticky nezávislé, jestliže P(A! ^ A2) = P(Ai) P(A2). Pro tři jevy budeme požadovat, aby i jevy A! ^. A2 a A3 byly stochasticky nezávislé, což vede ke vztahu P(Ai ^A2^ A3) = P(Ai) P(A2) P(A3). Tak můžeme pokračovat pro libovolný počet jevů, tedy jevy Ai,An ^ A jsou stochasticky nezávislé, jestliže platí systém multiplikativních vztahů: P(A; ^ Aj) = P(A;) P(Aj) (dvojmístný multiplikativní vztah) P(A; ^ Aj ^Ak) = P(A;) P(Aj) P(Ak) (trojmístný multiplikativní vztah) P(Ai ^ ... w^n) = P(Ai) ... P(An) (n-místný multiplikativní vztah) Jevy Ai, A2, ... ^ A jsou stochasticky nezávislé, jestliže pro všechna přirozená n > 2jsou stochasticky nezávislé jevy Ai,An ^ A. (Lze snadno ukázat, že jev nemožný resp. jev jistý a libovolný jev jsou stochasticky nezávislé jevy. Jestliže v posloupnosti stochasticky nezávislých jevů nahradíme libovolný počet jevů jevy opačnými, stochastická nezávislost se neporuší. Rovněž tak průniky a sjednocení stochasticky nezávislých jevů jsou stochasticky nezávislé.) Příklad na stochasticky nezávislé jevy: Nechť A1, A2, A3 jsou stochasticky nezávislé jevy, P(A1) = 1/4, P(A2) = 1/3, P(A3) = 1/2. Jaká je pravděpodobnost, že a) nastane právě jeden z jevů A1, A2, A3 b) nastanou právě dva z jevů A1, A2, A3 c) nastanou nejvýše dva z jevů A1, A2, A3 ? Řešení: ad a) = ^r^ri%+ ^^rA^ = - j - i - - i j. - i - - i - j >= ad b) +fimm)=\ ad c)l-P(A1)P(A2) P(A3)=4; Opakované nezávislé pokusy: Nezávisle opakujeme týž náhodný pokus. Nechť jev A; znamená úspěch v i-tém pokusu, přičemž p(Ai)= q, i = 1,2,... 1. Binomické rozložení pravděpodobností Pravděpodobnost, že v prvních n pokusech úspěch nastane právě x-krát (): \?-\:- • K výpočtu v systému STATISTICA slouží funkce Binom(x; q; n) Pravděpodobnost, že v prvních n pokusech úspěch nastane nejvýše xrkrát (U< < ): S* K výpočtu v systému STATISTICA slouží funkce IBinom(x1; q; n) Pravděpodobnost, že v prvních n pokusech úspěch nastane aspoň x0-krát (0< <• ): Výpočet lze provést takto: 1 - IBinom(x0 -1; q; n) Pravděpodobnost, že v prvních n pokusech úspěch nastane aspoň x0-krát a nejvýše xrkrát: Výpočet lze provést takto: IBinom(x1; q; n) - IBinom(x0 - 1; q; n) Příklad na binomické rozložení pravděpodobností: Firma se účastní čtyř nezávislých výběrových řízení. Pravděpodobnost, že uspěje v kterémkoliv z nich, je pro všechny konkurzy stejná a je rovna 0,7. Jaká je pravděpodobnost, že firma uspěje a) právě 2x b) aspoň 2x c) nejvýše 2x? v Řešení: Počet pokusů n = 4, pravděpodobnost úspěchu q = 0,7 adbíP^T^T^'j 7Q?+'\ KJ3+'') V71* 2. Geometrické rozložení pravděpodobností Pravděpodobnost, že prvnímu úspěchu bude předcházet x neúspěchů: Pp=l_ x } K výpočtu v systému STATISTICA slouží funkce Geom(x; q) Pravděpodobnost, že prvnímu úspěchu bude předcházet nejvýše x1 neúspěchů: K výpočtu v systému STATISTICA slouží funkce IGeom(x!; q) Pravděpodobnost, že prvnímu úspěchu bude předcházet aspoň x0 neúspěchů: xO , Výpočet lze provést takto: 1 - IGeom(x0-l; q) Příklad na geometrické rozložení pravděpodobností: Jaká je pravděpodobnost, že při hře „Člověče, nezlob se!" nasadíme figurku nejpozději při třetím hodu? v Řešení: i Počet neúspěchů: x = 0, 1,2, pravděpodobnost úspěchu: ^ Pravděpodobnost, že figurku nasadíme nejpozději při třetím hodu, je 42,13%. Příklad na geometrické rozložení pravděpodobností: Studenti biologie zkoumají barvu očí octomilek. Pravděpodobnost, že octomilka má bílou barvu očí, je 0,25, červenou 0,75. Jaká je pravděpodobnost, že až čtvrtá zkoumaná octomilka má bílou barvu očí? v Řešení: Počet neúspěchů: x = 3, pravděpodobnost úspěchu: q Ľ P^= 7SQ2í= " ec$6(25=~" Oí Pravděpodobnost, že až čtvrtá zkoumaná octomilka má bílou barvu očí, je 10,55%. 3. Negativní binomické rozložení pravděpodobností Pravděpodobnost, že k-tému úspěchu bude předcházet x neúspěchů: Pravděpodobnost, že k-tému úspěchu bude předcházet nejvýše x1 neúspěchů: Pravděpodobnost, že k-tému úspěchu bude předcházet aspoň x0 neúspěchů: x0 , Příklad na negativní binomické rozložení pravděpodobností: Hráč hází kostkou tak dlouho, dokud mu nepadnou tři šestky. Jaká je pravděpodobnost, že bude muset hodit kostkou 10 x? v Řešení: i Počet neúspěchů x = 7, protože v 7 z 10 hodů nepadne šestka. Pravděpodobnost úspěchu ^ -~ — - ~ n -« o ^ — Hledaná pravděpodobnost je 4,65%. Podmíněná pravděpodobnost Opakovaně nezávisle provádíme týž náhodný pokus a sledujeme nastoupení jevu A v těch pokusech, v nichž nastoupil jev A /T T ^ A H. Podmíněnou relativní četnost A za podmínky H jsme v popisné statistice zavedli vztahem p/VrT_ PO (za předpokladu, že p(H) > 0). Tato podmíněná relativní četnost se s rostoucím počtem pokusů ustaluje kolem konstanty P^VH_ , kterou považujeme za podmíněnou pravděpodobnost jevu A za podmínky H. Ilustrace podmíněné pravděpodobnosti Příklad na podmíněnou pravděpodobnost: Jaká je pravděpodobnost, že při hodu kostkou padlo sudé číslo, je-li známo, že padlo číslo menší než 5? Řešení: q . .ř , A ... padlo sudé číslo, A_ | ( , H ... padlo číslo menší než 5, jh_ i , ' Vlastnosti podmíněné pravděpodobnosti Je zřejmé, že jevy A1, A2 jsou stochasticky nezávislé, právě když P(A1/A2) = P(A0 a právě když P(Ä2/A1) = P(A2). Okamžitě z definice plyne: P(Ä! ^ A2) = P(A0 P(A2/A0 pro P(A0 > 0, P(Ai ^ A2) = P(A2) P(Ai/A2) pro P(A2) > 0. Tento multiplikativní vztah lze zobecnit ve větu o násobení pravděpodobností: P(Ai ^ A2 ^ ... ^ An) = P(A0 P(A2/A!) P(A3/A! ^ A2)... P(An/A! ^ ... ^ AnA) pro P(Ai ^ ... ^ A^) J). Příklad na větu o násobení pravděpodobností: Ze sady 32 karet náhodně vytahujeme po jedné kartě, kterou nikdy nevracíme zpět. Jaká je pravděpodobnost, že eso se objeví až ve 4. tahu? v Řešení: A ... v i-tém tahu nebylo vybráno eso, i = 1, 2, 3, 4 PA^i ^ ^ _PA-PAI4-PAI4r^ P{ Eso se objeví až ve 4. tahu s pravděpodobností 0,0911. Vzorec pro úplnou pravděpodobnost a Bayesův vzorec Jestliže Hi, Hn Ajsou jevy, které tvoří rozklad jistého jevu (tj. jsou neslučitelné ajejich sjednocením je celý základní prostor - říkáme, že tvoří úplný systém hypotéz), pak pravděpodobnost libovolného jevu A ^ A lze vypočítat pomocí vzorce pro úplnou pravděpodobnost: PA r(M Ilustrace vzorce pro úplnou pravděpodobnost Podmíněnou pravděpodobnost libovolné hypotézy za podmínky, že nastal jev A - tzv. aposteriorní pravděpodobnost P(Hk/A) - lze vypočítat pomocí Bayesova vzorce: (Původní pravděpodobnost P(Hk) se nazývá apriorní pravděpodobnost). Thomas Bayes (1702 - 1761): Anglický kněz a matematik Příklad na vzorec pro úplnou pravděpodobnost a Bayesův vzorec: U jistého druhu elektrického spotřebiče se s pravděpodobností 0,01 vyskytuje výrobní vada. U spotřebiče s touto výrobní vadou dochází v záruční lhůtě k poruše s pravděpodobností 0,5. Výrobky, které tuto vadu nemají, se v záruční lhůtě porouchají s pravděpodobností 0,01. Jaká je pravděpodobnost, že a) u náhodně vybraného výrobku nastane v záruční lhůtě porucha, b) výrobek, který se v záruční lhůtě porouchá, bude mít dotyčnou výrobní vadu? Řešení: H1 - výrobek má dotyčnou výrobní vadu H2 - výrobek nemá tuto výrobní vadu A - výrobek se v záruční době porouchá Pak je: P(H0 = 0,01, P(H2) = 0,99, P(A/H1) = 0,5, P(A/H2) = 0,01 ad a) P(A) = PCHO^A/řy + P(H2).P(A/H2) = 0,01.0,5 + 0,99.0,01 = 0,0149 ad b)