Pravděpodobnost (pracovní verze) 1. Definice pojmů •Jednoduchý/náhodný pokus (simple experiment) §Akt vedoucí k jednomu výsledku - např. hod kostkou, zatočení ruletou, vytažení karty z balíčku, výběr osoby na ulici §Výsledkem je výskyt jednoduchého jevu/události •Jednoduchý jev (elementary event) §člen základní množiny §výsledek jednoduchého pokusu - např. hodnota 1 na kostce, 0 na ruletě, sedmička srdcová, modrooká paní •Jev/třída jevů (event, event class) §sada jednoduchých jevů - např. lichá čísla, „srdce“, „piky“ •Základní množina/prostor (S) (Sample space) §sada všech jednoduchých jevů •Spojené jevy (joint events) – nastávají když výsledek pokusu spadá pod jevy A(„srdce“) i B(„král“) např. „srdcový král“, popřípadě A nebo B např. „srdce“ nebo „král“ §Průnik (∩) (intersection) – např. průnik jevů A a B = A ∩ B nebo-li A a B §současné nastání dvou nebo více jevů §Sjednocení (U) (union) - např. sjednocení jevů = A U B nebo-li A nebo B §sečtení dvou nebo více jednoduchých jevů bez průniku •Doplněk (~A) (complement) §doplňkem jevu A je sada všech zbývajících jevů z S •Vzájemně vylučující se/neslučitelné (mutual exclusive) jevy §nemohou nastat současně, jejich ∩ = 0 •Vyčerpávající (exhaustive) jevy §jevy vyplňují celý S, jejich U = S •Pravděpodobnost (p) (probability) §míra jistoty nastání každého jevu ze základního prostoru - např. pravděpodobnost že padne 1 na kostce •Podmíněná pravděpodobnost (p (A|B)) (conditional probability) § pravděpodobnost výskytu jevu A za předpokladu, že zároveň nastane jev B – §např. experiment: hod dvěma kostkami, událost: součet hodnot, otázka: jaká je pravděpodobnost výskytu události 4 když na jedné kostce padne 5? •Statistická nezávislost (statistical independence) §nepodmíněná pravděpodobnost jevu A a podmíněná pravděpodobnost jevu A stane-li se zároveň B jsou si rovny §tj. p(A) = p(A | B) §nebo když p (A ∩ B) = p (A) * p (B) § • • Definice pravděpodobnosti •p(A) = pravděpodobnost jevu A §za předpokladu, že máme konečný počet jednoduchých jevů v S a každý jednoduchý jev z S má stejnou pravděpodobnost nastání pak platí, že p(A) = n (A) / n (S) §Př. Krabička 10 kuliček – 5 bílých, 3 červené, 2 černé • experiment: bez dívání vybereme jednu kuličku • jednoduchý jev: jedna konkrétní kulička, máme tedy 10 jednoduchých jevů tvořících S, jevy jsou vzájemně se vylučující a každý má pravděpodobnost 1/10 • zajímají nás události: „bílá, „červená“, „černá“ • • Otázka: Jaká je p že vytáhnu „červenou“? • • p(červená)= n (červená) / n (S) = 3 / 10 = .30 • Podobně p (bílá) = .50 a p (černá) = .20 • p(červená a bílá) = 0 • •Pravděpodobnostní funkce přisuzuje každému jevu A z S číslo p(A), pravděpodobnost jevu A, tak že platí („axiomy“/zákony): •1 . p (A) ≥ 0 pro každé A •2. p (S) = 1 •3. Pokud (A1,, A2, ……., An ) jsou vzájemně neslučitelné, • pak p(A1 U A2 ) = p(A1) + p(A2) • • Pravidla pravděpodobnosti 1.p(~A) = 1 – p(A) („doplňková pravděpodobnost“) §Př. Jaká je pravděpodobnost že vyberu „ne červenou“ kuličku tj. jinou než „červenou“? §p(~červená) = 1 - p (červená) = .7 • § 2.0 ≤ p(A) ≤ 1 („rozsah pravděpodobnosti“) • (důkaz: pokud by nějaký jev měl p větší než 1 pak by podle pravidla 1 měl doplněk jevu p zápornou a to by odporovalo axiomu 1) • 3.p(Ø) = 0, pro jakékoli S („nemožný jev“) §Př. Jaká je pravděpodobnost že vyberu „bezbarvou“ kuličku tj. jinou než „červenou“ nebo „bílou“ nebo „černou“? §p(bez barvy)=0 § 4.p (A U B) = p (A) + p (B) – p (A ∩ B) (tzv.“nebo“ pravidlo) §Př. Balíček 52 karet. Jaká je pravděpodobnost „krále“ nebo „srdce“? §P (král) = 1/13, p(srdce)=1/4, p (král ∩ srdce)=1/52 (jeden z králů je srdcový) § p (král nebo srdce) = 1/13 + 1/4 – 1/52 = 16/52 = 4/13 §Speciální případ: když jsou jevy vzájemně se vylučující, pak p (A ∩ B) =0 – a proto p (A U B) = p (A) + p (B) §Př. p(červená nebo bílá) = .30 + .50 = .80 • 5. 5.Pokud A,…., L tvoří segmenty S, pak p (A U ...... U L) = p (A) + …p (L) = 1 §Pokud jsou jevy A až L vylučující se a vyčerpávající, pak tvoří celý prostor S a součet jejich pravděpodobností musí být 1 §Př. p(červená nebo bílá nebo černá kulička) = .30 + .20 + .50 = 1.00 – 1. Ilustrace: doplněk S(52) A (král) ~A (nekrál) S(52 karet) B(srdce) A(král) A ∩ B (srdcový král) A U B = A + B - A ∩ B = 13 + 4 – 1 = 16/52 Průnik a sjednocení A ∩ ~B (pikový + listový + kárový král) 12 1 3 A(král) B (dáma) C (eso) S(52) A, B a C jsou vzájemně se vylučující jevy A, B a C jsou vzájemně se vylučující a vyčerpávající jevy A (bílá) B (červená) C (černé) S(10 kuliček) §p (A | B) nebo-li p(A když B) = n (A ∩ B) / n (B) • = n (A ∩ B) / n (S) / n (B) / n (S) • = p (A ∩ B) / p (B) • §Př. Výběr vzorku dětí ve škole limitujeme pouze na dívky. Vznikne nám nový základní prostor Snový zahrnující pouze část jednoduchých jevů z původního S. V novém prostoru Snový zahrnujícím pouze dívky jaká je pravděpodobnost výběru levorukého člověka? Přičemž víme že 51% studentů je dívek, 35% studentů je levorukých, a 10% studentů jsou levoruké dívky. • • Otázka: p(levoruký, když dívka) = počet levorukých dívek / celkový počet dívek • • p(levoruká a dívka)= počet levorukých dívek / celkový počet studentů= .10 • p(dívka)=celkový počet dívek / celkový počet studentů= .51 • p(levoruký, když dívka) = p(levoruký a dívka) / p(dívka) = .10 / .51 = .196 • • p(dívka, když levoruký) = .10 / .35 = .29 • • • • Podmíněná pravděpodobnost Statistická nezávislost §Výskyty jevů A a B jsou statisticky nezávislé pokud výskyt jevu A neovlivňuje výskyt jevu B a opačně • §Tedy když pravděpodobnost výskytu jevu A a pravděpodobnost výskytu jevu A když B jsou si rovny – tj. p (A) = p (A | B) §př. p (dívka) =.51 •P(dívka, když levoruký)=.29 •Výsledek: .51 ≠ .29, proto jevy nejsou nezávislé (souvisí spolu) • §nebo alternativně když p (A ∩ B) = p (A) * p (B) §př. p (dívka a levoruký) = .10 – p (dívka) = .51 – p (levoruký) = .35 – výsledek: .10 ≠.51 *.35, proto jevy nejsou nezávislé – –Pozor! Nezávislost ≠ vzájemná výlučnost (neslučitelnost) –(Pro nadšence matematický důkaz: pokud A a B jsou vzájemně neslučitelné, pak p (A ∩ B) = 0. Pokud by A a B byly zároveň nezávislé, pak p (A ∩ B) = p(A)*p(B), a protože p (A ∩ B) = 0, tak to nemůže být pravda pokud p(A) nebo p(B) není nula) –(Pro nadšence intuitivní důkaz: Předpokládejme že všichni muži jsou buďto „plešatící“ nebo „hustovlasí“ (dva vzájemně se vylučující jevy). Pokud by „plešatící“ a „hustovlasí“ byli na sobě nezávislé jevy, pak by mezi „plešatícími“ byla stejná proporce „hustovlasých“ jako je celková proporce „hustovlasých“ mezi muži, tedy p(A | B) = p(A), což je těžké si představit J ) Prezentace spojených jevů v tabulkách §Př. Základní množina S = studenti kampusu v Bohunicích, každý student je buďto dívka nebo chlapec, a odpověděl buďto „ano“ nebo „ne“ na otázku zda chodí každé ráno rád do školy. Chlapec (chlapec a „ano“) (chlapec a „ne“) Dívka (dívka a „ano“) (dívka a „ne“) Ano Ne §Nechť v tomto kampusu pravděpodobnosti vybrat chlapce je.55 a dívku .45, a pravděpodobnost odpovědi ano je .40 a „ne“ .60. P (chlapec)= .55 (chlapec a „ano“) (chlapec a „ne“) P(Dívka) = .45 (dívka a „ano“) (dívka a „ne“) P(Ano) = .40 P(Ne) = .60 §p(chlapec),p(dívka),p(ano),p(ne) = marginální pravděpodobnosti (neboť se vyskytují na okraji tabulky) §Každá marginální p = suma (Σ) všech spojených pravděpodobností v určitém konkrétním řádku nebo sloupci tabulky §Př. p(chlapec) = p(chlapec a „ano“) + p (chlapec a „ne“) p(dívka) = p (dívka a „ano“) + (dívka a „ne“) p (ano) = p(chlapec a „ano“) + p(dívka a „ano“) p (ne) = p(chlapec a „ne“) + p(dívka a „ne“) § P (chlapec)= .55 (chlapec a „ano“) (chlapec a „ne“) P(Dívka) = .45 (dívka a „ano“) (dívka a „ne“) P(Ano) = .40 P(Ne) = .60 §Jevy/třídy jevů vyskytující se podél okraje jsou vzájemně neslučitelné a vyčerpávající (sada těchto jevů tedy formuje S) = dimenze §Př. 2 dimenze: jevy „ano“ a „ne“ a jevy „chlapec“ a „dívka“ §Statistická nezávislost : každá kategorie nebo jev podél jednoho okraje musí být nezávislý na každém jevu podél druhého okraje = pravděpodobnost každého spojeného jevu se musí rovnat součinu pravděpodobností korespondujících (v řádku a sloupci) marginálních jevů - p (A ∩ B) = p (A) * p (B) §Př. Pokud dimenze „pohlaví“ a „odpověď ano/ne“ jsou nezávislé, – pak p(chlapec a „ano“) = p(chlapec) * p(„ano“) = .55 * .40 = .22 – Stejně postupujeme v ostatních případech a vznikne tabulka: P (chlapec)= .55 p(chlapec)p („ano“) =.55 * .40 = .22 p(chlapec)p(„ne“) = .55 * .60 = .33 P(Dívka) = .45 p(dívka)p(„ano“) =.45 * .40 = .18 p(dívka)p(„ne“) = .45 * .60 = .27 P(Ano) = .40 P(Ne) = .60 •Pro závislé dimenze §pravděpodobnosti spojených jevů ≠ součiny marginálních pravděpodobností: P (chlapec)= .55 p(chlapec)p („ano“) =.10 p(chlapec)p(„ne“) = .45 P(Dívka) = .45 p(dívka)p(„ano“) =.30 p(dívka)p(„ne“) = .15 P(Ano) = .40 P(Ne) = .60 •Pro tuto základní množinu S (např. odpovědi dívek poté co dostali od svého milého kytici růží) pohlaví a odpověď spolu souvisejí •Prozkoumáme-li podmíněné pravděpodobnosti, §P(ano | chlapec) = .10 / .55 = .18 §P(ano | dívka) = .30 / .45 = .67 pak vidíme že dívky mnohem pravděpodobněji/častěji odpovídají ano v porovnání s chlapci §Pokud by ale obě dimenze byly nezávislé (jako v 1.tabulce) pak by tyto podmíněné pravděpodobnosti měly být stejné, §P(ano | chlapec) = .22 / .55 = .40 §P(ano | dívka) = .18 / .45 = .40 takže znám-li pohlaví nedává mi to informaci o tom jak bude student odpovídat § §