MVOll Statistika I 2. Podmíněná pravděpodobnost Jan Koláček (kolacek@math.muni.cz) Ústav matematiky a statistiky, Přírodovědecká fakulta, Masarykova univerzita, Brno Jan Koláček (PřF MU) MVOll Statistika I 1/1 Motivační příklad Příklad 1 V pytlíku jsou 3 zelené a 2 červené kuličky. „Kamarád'' mi nabízí následující hru: „ Vytáhneš si jednu kuličku, nebudeš ji vracet do pytlíku a pak vytáhneš ještě jednu. Za hru mi zaplatíš 35 Kč. Pokud však vytáhneš 2 zelené kuličky zaplatím ti výhru 100 Kč. " Mám si s ním zahrát? P(1.#A2.#) = P(1.#)-P(2.#|1.#) =0,3 3 5 2 4 „Očekávaná" výhra: 0,3 • 100 = 30 Kč Pokud by se kulička vracela: P(1.#A2.#) = P(l.#) • P(2.#) =0,36 3 5 3 5 Jan Koláček (PřF MU) MV011 Statistika I 2/1 Motivační příklady Pokud bychom si předchozí přepsali pomocí jevů: A.....1.4 B.....2.4 Nevracíme kuličku jevy A a b na sobě závisí Pak P(Af]B) = P(A)-P(B\A) Vracíme kuličku jevy A a B jsou na sobě nezávislé, tj. P(A n b) =P(A)-P(B) Jan Koláček (PřF MU) MV011 Statistika I Motivační příklady Příklad 2 V pytlíku je 10 kuliček označených čísly 1,... ,10. „Kamarád" náhodně vytáhne jednu kuličku, prozradí nám jen, že její číslo je menší než 5 a řekne: „ Vsaďte 1 Kč a když číslo bude sudé, dám vám 2 Kč. " Vsadíme si? Otázka: Jaký je rozdíl mezi P(A\B) Označme jevy: A ... „číslo je sudé" B ... „číslo je < 5" Klasická PST: 4 možná čísla, z nich 2 sudá, tj. P(A\B) = l =0,5. P (A n b)? Jan Koláček (PřF MU) MV011 Statistika I 4/1 Motivační příklady A\B ... „číslo je sudé za podmínky, že je < 5", tj. P(A\B) = | Af~)B ... „číslo je sudé a současně je < 5", tj. P(A n b) = Ä Otázka: Jak spolu souvisí P(A\B) a P(A n b)? A ... „číslo je sudé", tj. P(A) = Á B.....číslo je < 5", tj. p(b) = ^ 2 4 P(A\B) p(a n b) 10 2 4 10 Podmíněná pravděpodobnost Definice 1 Nechť (Cí,A,P) je pravděpodobnostní prostor, B £ A, P (B) > 0. Pak číslo P(A\B) = p (A n B) P (B) nazývame podmíněnou pravděpodobností jevu A za podmínky (že nastal jev) B (conditional probability). Z definice plyne ► P (A DB) = P(A\B)P(B) platí i pro P(B) = 0, neboť a n b C £> a p(b) = 0 P (A n b) = 0 ► Symetricky platí také P (A DB) = P(B\A)P(A) Jan Koláček (PřF MU) MV011 Statistika I 6/1 Podmíněná pravděpodobnost Značení: Mějme pevně daný náhodný jev B £ A, pro který platí P(B) > 0. Označme PB : A^ (0,1) : PB(A)=P(A\B) Pb Je pravděpodobnost na (Cl, A) pro každé B £ A, pro které P{B) > 0, Jan Koláček (PřF MU) MV011 Statistika I 7/ Podmíněná pravděpodobnost Reklamní agent v nákupním centru má 25 balónků; 10 červených, 6 modrých a 9 zelených. Balónky rozdává náhodně zákazníkům. Jaká je pravděpodobnost, že prvním čtyřem lidem dá samé červené? Aj ... „z-tý zákazník dostane červený balónek", P{A\ H a2 H a3 n a4) =? p(a1 n a2 n a3 n a4) = p(ax) p(a2|Ai) p(a3|Ai n a2)p(a4|A! n a2 n a3) 10 25 _9_ 24 _8_ 23 7_ 22 = 0,0166 Jan Koláček (PřF MU) MV011 Statistika I 8/ Podmíněná pravděpodobnost Věta 3 (Věta o násobení pravděpodobností) Platí n P [f] A) =P(A1)-P(A2\A1)-P(A3\A1nA2)- ... ■ P{An\Ax n • • • nA„_i) .1=1 pro P ( "n Ai ) > 0. i=l Jan Koláček (PřF MU) MV011 Statistika I 9/1 Úplný systém Definice 4 Nechť [Cí,A,P) je pravděpodobnostní prostor. Náhodné jevy {an}^°=1 £ A tvoří úplný systém jevů na [Cí,A,P), jestliže platí 00 Aj H Aj = 0, pro i ^ j, a |j an = O. n=l Jan Koláček (PřF MU) MV011 Statistika I 10/ Příklad Příklad 4 V krabici je 8 nových žárovek, o nichž víme, že 6 splňuje normu a 2 normu nesplňují. Víme, že žárovka, která splňuje normu, praskne v následujícím roce s pravděpodobností 0,2 a žárovka nesplňující normu praskne s pravděpodobností 0,5. Jaká je pravděpodobnost, že náhodně vybraná žárovka praskne? A2. B B\AV B\A2. „ž. splňuje normu", P(Ai) 2 8 | = 0,75 „ž. je vadná", P(A2) = | = 0,25 „ž. praskne", P(B) =? „dobrá ž. praskne", P(B\Ai) = 0,2 „vadná ž. praskne", P(B\A2) = 0,5 B {B H Ai} U {B H A2}. . .disjunktní sjednoc. P(B) = P({BnA!}) +P({BnA2}) = P(B|Ai) P(Ai) + P(B|A2) P(A2) = 0,275 0,2 0,75 0,5 0,25 Jan Koláček (PřF MU) MV011 Statistika I Věta o úplné pravděpodobnosti Věta 5 (Vzorec pro úplnou pravděpodobnost) Nechť posloupnost {An}™=1 tvoří úplný systém jevů na (Cl,A,P) takový, že P(Ai) > 0 pro i = 1,2,.... Pak platí 00 P(B) = '£P(Ai)P(B\Ai). i=l Jan Koláček (PřF MU) MV011 Statistika I 12/1 Příklad Příklad 5 (Poklad) Trezor má 3 zásuvky se vzácnými mincemi. V první zásuvce jsou 2 zlaté mince, ve druhé je 1 zlatá a 1 stříbrná a ve třetí jsou 2 stříbrné mince. Náhodně zvolíme zásuvku a vytáhneme minci. Jaká je pravděpodobnost, že jsme vytáhli zlatou? Zz\ . . „otevřeme z-tou zásuvku", i = 1,2,3 P{Z1)=P(Z2)=P{Z3) = \ A.. . „vytáhneme zlatou minci", P (A) =? A\Z\... „vytáhneme zlatou z 1. zásuvky" P{A\ZX) = 1 A\Z2-. . „vytáhneme zlatou ze 2. zásuvky" P(A\Z2) = \ A\Z$.. . „vytáhneme zlatou ze 3. zásuvky" P(A\Z3) = 0 P (A) = P(A\Z1)P(Z1) +P(A\Z2)P(Z2)+P(A\Z3)P(Z3) = \ 1 3 Jan Koláček (PřF MU) 1 I 2 3_ MV011 Statistika I 0 1 3 13/ Příklad Ad Příklad 1 Podmínky hry jsou stejné. Kamarád „vylepší" hru: „Místo tebe budu tahat já a prozradím ti barvu druhé kuličky. Za to mi zaplatíš navíc dalších 20 Kč. Pokud budou obě vytažené kuličky zelené, zaplatím ti výhru 100 Kč." Mám si s ním z 3 h r* ci t ^ Chceme P(l.«|2.«), připomeňme P(l.» A 2.») =0,3 Podle definice P(l.«|2.») P(UA2.<) P(2.») Podle Věty 5 P(2V) =P(2.«|1.«)P(1.«)+P(2.«|1.«)P(1.«) =0,6 2 4 3 5 3 4 2 5 A tedy P(l.#|2.#) _ 03 _I 0,6 —I 0,5 ^> „Očekávaná" výhra: 0,5 • 100 = 50 Kč Jan Koláček (PřF MU) MV011 Statistika I 14/ Příklad Shrnutí P(l.»|2.») Označíme jevy Ai .....1.4 A2.....1.4 B.....2.4 Pak P(l.«A2.t) P(2.») P(2.«|1.»)P(1.») P(2.«|1.»)P(1.») + P(2.«|1.»)P(1.») P(Ai|B) p(AinB) P(B|Ai)P(Ai) P(B) P(B|Ai)P(Ai) +P(B|A2)P(A2) Bayesův vzorec Jan Koláček (PřF MU) MV011 Statistika I 15/1 Bayesův vzorec Věta 6 (Bayesův vzorec) Nechť posloupnost {An}™=1 tvoří úplný systém jevů na (Cl,A,P) takový, že P(Ai) > 0 pro i = 1,2,... a B G A, kde P(B) > 0. Pak P(AAB) P(A;)P(B|A;) 1 00 pro j = 1,2,____ Z P(Aí)P(B\Aí) i=l Terminologie ► Apriorní pravděpodobnost ... P(Aj) Aposteriorní pravděpodobnost . . .P(Aj\B) (aktualizovaná pravděpodobnost) Jan Koláček (PřF MU) MV011 Statistika I 16/ Bayesův vzorec reverend Thomas Bayes (71701 - 7.4.1761) presbytariánský kněz v Tunbridge Wells za života publikoval dvě práce: teologickou Divine Benevolence (Laskavost Boží) a anonymně obhajobu diferenciálního počtu nejduležitější dílo: An essay towards solving a problem in the doctrine of chances (Esej o řešení problému v doktríně o možnostech) vydal po jeho smrti R. Price jakožto důkaz Boží existence Jan Koláček (PřF MU) MV011 Statistika I 17/1 Příklad Bayesovský filtr na spam (Paul Graham, http://www.paulgraham.com/spam.html) Spam P (Spam) W P(W\Spam) P(W\Spam) „dopis je spam" apriorní pravděpodobnost, globálně nastavená (0,5 - 0,8) „dopis obsahuje slovo W" pst, že spam obsahuje slovo W, stanovuje se z uložené pošty a spam u pst, že nespam obsahuje slovo W P(Spam\W) P(W\Spam)P(Spam) P(W\Spam)P(Spam) + P(W\Spam)P(Spam) Jan Koláček (PřF MU) MV011 Statistika I 18/1 Přiklad „žárovka splňuje normu", P(A\) = é = 0,75 Ad Příklad 4 : Náhodně vybraná žárovka praskla. Jaká je pravděpodobnost, že splňovala normu? Připomeňme Ai . A2 . B\AX ■ B\A2 . Ax B . 8 „žárovka je vadná", P(A2) = é = 0,25 „dobrá žárovka praskne", P(B\A\) =0,2 „vadná žárovka praskne", P(B\A2) = 0,5 „žárovka, která praskne, splňuje normu", P(A\\B) =? P (MB) P(A1 n B) P(B) P(B\A1)P(A1) P(B|A1)P(A1)+P(B|A2)P(A2) 0,2-0,75 0,2-0,75 + 0,5-0,25 = 0,54 Jan Koláček (PřF MU) MV011 Statistika I 1 3 Ad Příklad 5 : Náhodně vybraná mince je zlatá. Jaká je pravděpodobnost, že byla vybrána z 1. zásuvky? Připomeňme Zz . .. „otevřeme z-tou zásuvku", i = 1,2,3, P(Z\) = P(Z2) = P{Z"$) - A . .. „vytáhneme zlatou minci", P (A) = 0,5 A\Z\ . .. „vytáhneme zlatou z 1. zásuvky" P(A|Zi) = 1 A\Z2 . .. „vytáhneme zlatou ze 2. zásuvky" P(A\Z2) = i A\Z$ . .. „vytáhneme zlatou ze 3. zásuvky" P(A\Z$) = 0 Z\\A ... „zlatá mince byla vytažena z 1. zásuvky", P{Z\\A) =? P(Zi|A) = P(A|Zi)P(Zi) P(A|Z1)P(Z1) +P(A|Z2)P(Z2) +P(A|Z3)P(Z3) Nezávislost jevů Ad Příklad 1: Pokud by se kulička vracela: P(1.#A2.#) =P(1.#)-P(2.#) =0,36 Obecně 3 5 3 5 P(A n B) = P(A)P(B) Intuice: jevy A,B na sobě nezávisí P(A|B) = ^=P(A)aP(B|A) = ^)=P(B) P(B) P(A) Jan Koláček (PřF MU) MV011 Statistika I 21 / Nezávislost jevů Definice 7 Nechť [Cí,A,P) je pravděpodobnostní prostor. Pak řekneme, že jev A G A a jev B G jsou nezávislé (independent) (vzhledem k pravděpodobnosti P), jestliže P(A H B) =P(A)P(B). Věta 8 Libovolný náhodný jev A G A 3 jev jistý jsou nezávislé. ► Libovolný náhodný jev A G A a jev nemožný jsou nezávislé. ► Necht A G A a B G A jsou nezávislé jevy. Pak také AaB,ÄaB,ÄaB jsou nezávislé. i Jan Koláček (PřF MU) MV011 Statistika I 22/1 Skupinová nezávislost Definice 9 Nechť (Cl, A,P) je pravděpodobnostní prostor a A\,... ,An G A- Řekneme, že náhodné jevy A\,..., An jsou skupinově (sdružené) nezávislé, jestliže pro libovolné k G {1,...,n} a libovolnou množinu indexů {z'i,...,z^} C {1,...,n\ platí í k \ k 7=1 Nechť M = {Az- G .4,/ G ^7}, kde J je daná indexová množina (i nekonečná). Řekneme, že náhodné jevy systému M jsou nezávislé, jestliže pro každou konečnou množinu indexů ... ,zn}, kde Zy G J7\_/ = 1,... ,n platí Jan Koláček (PřF MU) MV011 Statistika I 23/1 Příklad Příklad 6 Dvakrát házíme kostkou. Uvažujme následující jevy A B C . v 1. hodu padne sudé číslo . v 2. hodu padne liché číslo . v obou hodech padne číslo stejné parity Protože platí P(A) P(B) P(C) — 3^ _ 36 6-3 36 3-3- 1 2 1 2 -3-3 36 1 2 p(A n b) = p(A n c) = p(b n c) = p(A n B n c) _o_ 36 3^ — 1 36 — 4 3^ — 1 36 — 4 3^ — 1 36 — 4 P(A)P(B) P(A)P(C) P(B)P(C) 0 ^ P(A)P(B)P(C)/ jsou jevy A, B a C po dvou nezávislé, ale ne skupinově nezávislé. Jan Koláček (PřF MU) MV011 Statistika I 24/1 Poznámka Frekventistická škola vs. Bayesovská škola Jan Koláček (PřF MU) MV011 Statistika I 25/1 Příklad Pravděpodobnost rakoviny prsu u žen ve věku 40 - 50 let je 0,014. Podle studií naznačí mamograf u žen, které rakovinu nemají, nesprávně přítomnost nemoci pouze asi v 10 % případů. Pokud naopak rakovinu mají, odhalí ji asi v 75 % případů. Jaká je pravděpodobnost nemoci, jestliže výsledek vyšetření na mamografu byl pozitivní? R .. . „žena má rakovinu", P(R) = 0,014, apriorní pst MP .. . „mamograf ukázal pozitivní výsledek" MP\R .. . „pozitivní mamograf pro nemocnou ženu", P(MP\R) = 0,75 MP\R .. . „pozitivní mamograf pro zdravou ženu", P(MP\R) =0,1 P(R\MP) =? Jan Koláček (PřF MU) MV011 Statistika I 26/1 Příklad Pravděpodobnost rakoviny prsu u žen ve věku 40 - 50 let je 0,014. Podle studií naznačí mamograf u žen, které rakovinu nemají, nesprávně přítomnost nemoci pouze asi v 10 % případů. Pokud naopak rakovinu mají, odhalí ji asi v 75 % případů. Jaká je pravděpodobnost nemoci, jestliže výsledek vyšetření na mamograf u byl pozitivní? R ... „žena má rakovinu", P(R) = 0,014, apriorní pst MP ... „mamograf ukázal pozitivní výsledek" MP\R ... „pozitivní mamograf pro nemocnou ženu", P(MP\R) = 0,75 MP\R ... „pozitivní mamograf pro zdravou ženu", P(MP\R) = 0,1 P(R\MP) =? P(R\MP) P(MP\R)P(R) P(MP\R)P(R) + P(MP\Ř)P(Ř) _0,75 • 0,014_ 0,75-0,014 + 0,1- (1-0,014) 0,096 Jan Koláček (PřF MU) MV011 Statistika I 26/1 Srovnání přístupů Příklad 9 Máme chorobu, která bez léčby zabije 50 % nemocných, a zajímá nás, zda nově vyvinutý lék je účinný. Je podán pěti pacientům a všichni přežijí. Vyplývá z toho, že lék alespoň nějak funguje (na určité hladině pravděpodobnosti)? Frekventistický přístup: A . .. „všech pět pacientů přežije" Lék není účinný =^> pst přežití je pořád \ =^> P(A\N) Bayesovský přístup: N .. . „lék je NEúčinný", P(N) = 0,5, apriorní pst A\N .. . „všech pět pacientů přežije, přestože dostali neúčinný lék", P(A\N) = ^ A\N .. . „všech pět pacientů přežije, protože dostali účinný lék", P(A\N) = 1 1 2 i = 0,03125 P(N\A) = P(A\N)P(N) jl 1 32 ' 2 P(A\N)P(N) + P(A\N)P(N) + ,11 = ^ = 0,0303 ii+l.i 33 Jan Koláček (PřF MU) MV011 Statistika I 27/1