Pravděpodobnost nebo statistika? ooooo Pravděpodobnost oooooooooooooooooooooooooooo Matematika III - 9. přednáška Pravděpodobnost - opakování a zobecnění pojmů Michal Bulant Masarykova univerzita Fakulta informatiky 10. 11. 2014 Pravděpodobnost nebo statistika? ooooo Pravděpodobnost oooooooooooooooooooooooooooo Q Pravděpodobnost nebo statistika? Q Pravděpodobnost Pravděpodobnost nebo statistika? ooooo Pravděpodobnost oooooooooooooooooooooooooooo • Martin Panák, Jan Slovák, Drsná matematika, e-text. » Karel Zvára, Josef Štěpán, Pravděpodobnost a matematická statistika, Matfyzpress, 4. vydání, 2006, 230 stran, ISBN 80-867-3271-1. • Marie Budíková, Štěpán Mikoláš, Pavel Osecký, Teorie pravděpodobnosti a matematická statistika (sbírka příkladů), Masarykova univerzita, 3. vydání, 2004, 117 stran, ISBN 80-210-3313-4. » Marie Budíková, Statistika, Masarykova univerzita, 2004, distanční studijní opora ESF, http: //www.math.muni.cz/~budikova/esf/Statistika.zip. • Marie Budíková, Tomáš Lerch, Štěpán Mikoláš, Základní statistické metody, Masarykova univerzita, 2005, 170 stran, ISBN 80-210-3886-1. nastoupení alespoň jednoho z jevů A,, i £ /, odpovídá jevu Pravděpodobnost nebo statistika? ooooo Pravděpodobnost oo«ooooooooooooooooooooooooo Terminologie připomíná souvislosti s popisem skutečných jevů a jejich statistickým popisem: • celý základní prostor Q se nazývá jistý jev, prázdná podmnožina 0 £ A se nazývá nemožný jev, • jednoprvkové podmnožiny {lo} £ Q se nazývají elementární jevy, • společné nastoupení jevů A, i 6 /, odpovídá jevu n,-e/A> nastoupení alespoň jednoho z jevů A,, i £ /, odpovídá jevu • A, B 6 A jsou neslučitelné jevy, je-li A n B = 0, Pravděpodobnost nebo statistika? ooooo Pravděpodobnost oo«ooooooooooooooooooooooooo Terminologie připomíná souvislosti s popisem skutečných jevů a jejich statistickým popisem: • celý základní prostor Q se nazývá jistý jev, prázdná podmnožina 0 £ A se nazývá nemožný jev, • jednoprvkové podmnožiny {lo} £ Q se nazývají elementární jevy, • společné nastoupení jevů A, i 6 /, odpovídá jevu n,-e/A> nastoupení alespoň jednoho z jevů A, i £ /, odpovídá jevu • A, B 6 A jsou neslučitelné jevy, je-li A n B = 0, • jev /4 má za důsledek jev B, když A c B, Pravděpodobnost nebo statistika? ooooo Pravděpodobnost oo«ooooooooooooooooooooooooo Terminologie připomíná souvislosti s popisem skutečných jevů a jejich statistickým popisem: • celý základní prostor Q se nazývá jistý jev, prázdná podmnožina 0 £ A se nazývá nemožný jev, • jednoprvkové podmnožiny {lo} £ Q se nazývají elementární jevy, • společné nastoupení jevů A, i 6 /, odpovídá jevu n,-e/A> nastoupení alespoň jednoho z jevů A,, i £ /, odpovídá jevu • A, B 6 A jsou neslučitelné jevy, je-li A n B = 0, • jev /4 má za důsledek jev B, když A c B, » je-li /4 G A, pak se jev B = Q\A nazývá opačný jev k jevu A píšeme ß = Ac. Pravděpodobnost nebo statistika? ooooo Pravděpodobnost ooo»oooooooooooooooooooooooo Definice (Kolmogorovova definice pravděpodobnosti) Pravděpodobnostní prostor je jevové pole A podmnožin (konečného) základního prostoru ft, na kterém je definována funkce P:i->ls následujícími vlastnosti: • je nezáporná, tj. P(A) > 0 pro všechny jevy A, • je aditivní, tj. P(U/e//4,') = Yliel pro každý nejvýše spočetný systém po dvou neslučitelných jevů, • pravděpodobnost jistého jevu je 1. Funkci P nazýváme pravděpodobností na jevovém poli (Q, A). Pravděpodobnost nebo statistika? ooooo Pravděpodobnost ooo»oooooooooooooooooooooooo Definice (Kolmogorovova definice pravděpodobnosti) Pravděpodobnostní prostor je jevové pole A podmnožin (konečného) základního prostoru ft, na kterém je definována funkce P:i->ls následujícími vlastnosti: • je nezáporná, tj. P(A) > 0 pro všechny jevy A, • je aditivní, tj. P(U/e//4,') = Yliel pro každý nejvýše spočetný systém po dvou neslučitelných jevů, • pravděpodobnost jistého jevu je 1. Funkci P nazýváme pravděpodobností na jevovém poli (Q, A). Důsledek Pro všechny jevy A, B £ A platí « P(0) =0, 0 < P(A) < 1, 00.0 Pravděpodobnost nebo statistika? ooooo Pravděpodobnost ooo»oooooooooooooooooooooooo Definice (Kolmogorovova definice pravděpodobnosti) Pravděpodobnostní prostor je jevové pole A podmnožin (konečného) základního prostoru ft, na kterém je definována funkce P:i->ls následujícími vlastnosti: • je nezáporná, tj. P(A) > 0 pro všechny jevy A, • je aditivní, tj. P(U/e//4,') = Yliel pro každý nejvýše spočetný systém po dvou neslučitelných jevů, • pravděpodobnost jistého jevu je 1. Funkci P nazýváme pravděpodobností na jevovém poli (Q, A). Důsledek Pro všechny jevy A, B £ A platí « P(0) =0, 0 < P(A) < 1, « P(AC) = 1 - P(A), 00.0 Pravděpodobnost nebo statistika? ooooo Pravděpodobnost ooo»oooooooooooooooooooooooo Definice (Kolmogorovova definice pravděpodobnosti) Pravděpodobnostní prostor je jevové pole A podmnožin (konečného) základního prostoru ft, na kterém je definována funkce P:i->ls následujícími vlastnosti: • je nezáporná, tj. P(A) > 0 pro všechny jevy A, • je aditivní, tj. P(U/e//4,') = Yliel pro každý nejvýše spočetný systém po dvou neslučitelných jevů, • pravděpodobnost jistého jevu je 1. Funkci P nazýváme pravděpodobností na jevovém poli (Q, A). Důsledek Pro všechny jevy A, B £ A platí « P(0) =0, 0 < P(A) < 1, « P(AC) = 1 - P(A), • K6 ^ P(A) < P(B), P(B \A) = P{B) - P(A), 00.0 Pravděpodobnost nebo statistika? ooooo Pravděpodobnost ooo»oooooooooooooooooooooooo Definice (Kolmogorovova definice pravděpodobnosti) Pravděpodobnostní prostor je jevové pole A podmnožin (konečného) základního prostoru ft, na kterém je definována funkce P:i->ls následujícími vlastnosti: • je nezáporná, tj. P(A) > 0 pro všechny jevy A, • je aditivní, tj. P(U/e//4/) = Yliel pro každý nejvýše spočetný systém po dvou neslučitelných jevů, • pravděpodobnost jistého jevu je 1. Funkci P nazýváme pravděpodobností na jevovém poli (Q,A). Důsledek "* Pro všechny jevy A, B (z A platí « P(0) =0, 0 < P (A) < 1, « P(AC) = 1 - P (A), • K6 ^ P (A) < P(B), P{B\A) = P(B) - P(A), • P(AUB) = P(A) + P(B) - - P(AHB) Pravděpodobnost nebo statistika? ooooo Pravděpodobnost oooo»ooooooooooooooooooooooo Podobná tvrzení platí i pro nekonečné posloupnosti jevů: Tvrzení Pro libovolnou nejvýše spočetnou množinu jevů pl^tí: • Je-li Aí C A2 C • • •, pak oo PÍJÁ-) = lim P(Ai), ^-^ i—>oo /=1 Pravděpodobnost nebo statistika? ooooo Pravděpodobnost oooo»ooooooooooooooooooooooo Podobná tvrzení platí i pro nekonečné posloupnosti jevů: Tvrzení Pro libovolnou nejvýše spočetnou množinu jevů (/4,')/^i platí: • Je-li A1 C A2 C • • •, psk oo P(I)A) = lim P(Ai), ^-^ i—>oo • Je-li Aí D A2 5 • • •, psk oo P(PlA-) = lim P(Ai), ' ' i—>oo /=1 Pravděpodobnost nebo statistika? ooooo Pravděpodobnost oooo»ooooooooooooooooooooooo Podobná tvrzení platí i pro nekonečné posloupnosti jevů: Tvrzení Pro libovolnou nejvýše spočetnou množinu jevů (/4,')/^i platí: • Je-li /4i C A2 C • • •, pak oo P(I)A) = lim P(Ai), ^-^ i—>oo • Je-li Aí D A2 5 • • •, psk oo P(PlA-) = lim P(Ai), ' ' i—>oo • P(U^iA-)i- =i P{A,), - - p(A)). Pravděpodobnost nebo statistika? ooooo Pravděpodobnost ooooo»oooooooooooooooooooooo Příklad Náhodný pokus spočívá v hodu kostkou. Jev A znamená, že padne liché číslo, jev B, padne-li prvočíslo. a) Určete základní prostor Q. b) Uveďte všechny možné výsledky příznivé nastoupení jevů A, B. c) Pomocí A, B a operací s jevy vyjádřete: • padne sudé číslo, » padne číslo 2, » padne číslo 2 nebo 3 d) Určete nej menší jevové pole (Q,A), obsahující jevy A i B. Pravděpodobnost nebo statistika? ooooo Pravděpodobnost oooooo»ooooooooooooooooooooo Připomeňme si klasickou konečnou pravděpodobnost. Pravděpodobnost nebo statistika? ooooo Pravděpodobnost oooooo»ooooooooooooooooooooo Připomeňme si klasickou konečnou pravděpodobnost. Definice Nechť Q je konečný základní prostor a nechť jevové pole A je právě systém všech podmnožin v Q. Klasická pravděpodobnost je pravděpodobnostní prostor (Q.,A, P) s pravděpodobnostní funkcí P : A -> R, _™ = W_ Zjevně takto zadaná funkce skutečně definuje pravděpodobnost, kdy všem elementárním jevům přiřazujeme stejnou pravděpodobnost. Pravděpodobnost nebo statistika? ooooo Pravděpodobnost ooooooo»oooooooooooooooooooo Že s klasickou pravděpodobností nevystačíme, ukazují následující příklady: Příklad • Cestou z Kotlářské na Botanickou jsem ztratil zadání písemky. Určete pravděpodobnost jevu lox slovně vyjádřeného: ztracená písemka se nachází nej blíže k zastávce trolejbusu X. Pravděpodobnost nebo statistika? ooooo Pravděpodobnost ooooooo»oooooooooooooooooooo Že s klasickou pravděpodobností nevystačíme, ukazují následující příklady: Příklad • Cestou z Kotlářské na Botanickou jsem ztratil zadání písemky. Určete pravděpodobnost jevu lox slovně vyjádřeného: ztracená písemka se nachází nej blíže k zastávce trolejbusu X. • Určete pravděpodobnost, jevu lo^: při opakovaném hodu mincí padne hlava poprvé při k-tém pokusu. Pravděpodobnost nebo statistika? ooooo Pravděpodobnost ooooooo»oooooooooooooooooooo Že s klasickou pravděpodobností nevystačíme, ukazují následující příklady: Příklad • Cestou z Kotlářské na Botanickou jsem ztratil zadání písemky. Určete pravděpodobnost jevu lox slovně vyjádřeného: ztracená písemka se nachází nej blíže k zastávce trolejbusu X. • Určete pravděpodobnost, jevu lo^: při opakovaném hodu mincí padne hlava poprvé při k-tém pokusu. Pravděpodobnost nebo statistika? ooooo Pravděpodobnost ooooooo»oooooooooooooooooooo Že s klasickou pravděpodobností nevystačíme, ukazují následující příklady: Příklad » Cestou z Kotlářské na Botanickou jsem ztratil zadání písemky. Určete pravděpodobnost jevu lox slovně vyjádřeného: ztracená písemka se nachází nej blíže k zastávce trolejbusu X. • Určete pravděpodobnost, jevu lo^: při opakovaném hodu mincí padne hlava poprvé při k-tém pokusu. V prvním případě je třeba pracovat s nekonečně mnoha stejně pravděpodobnými elementárními jevy: písemku jsem ztratil v bodě (x,y) , ve druhém pak musíme připustit teoretickou možnost, že hlava nepadne nikdy, a prostorem jevů tedy bude N U {oo}. Pravděpodobnost nebo statistika? ooooo Pravděpodobnost oooooooo#ooooooooooooooooooo V praktických problémech se často setkáváme s daleko složitějšími modely, kde základní prostor není konečnou množinou. Uvažme rovinu M2 dvojic reálných čísel a v ní podmnožinu Q se známým obsahem vol Q (tedy např. takovou, že Q je Riemannovsky měřitelná)). Náhodné jevy budou reprezentovány podmnožinami A C Q a za jevové pole A bereme nějaký vhodný systém podmnožin, u kterých umíme určit jejich obsah. Nastoupení nebo nenastoupení jevu je dáno výběrem bodu v Q, kterým se trefíme nebo netrefíme do množiny reprezentující jev A. Pravděpodobnost nebo statistika? ooooo Pravděpodobnost oooooooo#ooooooooooooooooooo V praktických problémech se často setkáváme s daleko složitějšími modely, kde základní prostor není konečnou množinou. Uvažme rovinu M2 dvojic reálných čísel a v ní podmnožinu Q se známým obsahem vol Q (tedy např. takovou, že Q je Riemannovsky měřitelná)). Náhodné jevy budou reprezentovány podmnožinami A C Q a za jevové pole A bereme nějaký vhodný systém podmnožin, u kterých umíme určit jejich obsah. Nastoupení nebo nenastoupení jevu je dáno výběrem bodu v Q, kterým se trefíme nebo netrefíme do množiny reprezentující jev A. Podobně jako u klasické pravděpodobnosti definujeme pravděpodobnostní funkci P : A ->• R vztahem P(A) - ^ H[A)~ volft' kde A jsou podmnožiny v rovině, které odpovídají námi vybraným jevům. Pravděpodobnost nebo statistika? ooooo Pravděpodobnost ooooooooo^oooooooooooooooooo Příklad Jaká je pravděpodobnost, že dvě náhodně zvolená čísla z intervalu (0,1) budou mít součet menší než 1 a součin větší než 2/9? Pravděpodobnost nebo statistika? ooooo Pravděpodobnost ooooooooo^oooooooooooooooooo Příklad Jaká je pravděpodobnost, že dvě náhodně zvolená čísla z intervalu (0,1) budou mít součet menší než 1 a součin větší než 2/9? Příklad (Buffonova úloha) Rovina je rozdělena rovnoběžkami umístěnými rovnoměrně ve vzdálenosti d. Do roviny je náhodně umístěna jehla délky I < d. Jaká je pravděpodobnost, že jehla protne některou rovnoběžku? Pravděpodobnost nebo statistika? ooooo Pravděpodobnost oooooooooo»ooooooooooooooooo Motto: Je dokázáno, že slavení narozenin je zdraví prospěšné. Statistika ukazuje, že lidé, kteří oslavili nejvíce narozenin, se dožívají nejvyššího věku. Pravděpodobnost nebo statistika? ooooo Pravděpodobnost oooooooooo»ooooooooooooooooo Motto: Je dokázáno, že slavení narozenin je zdraví prospěšné. Statistika ukazuje, že lidé, kteří oslavili nejvíce narozenin, se dožívají nejvyššího věku. Vtip - co je na něm špatně? Statistik procházel bezpečnostní kontrolou na letišti, když byla v jeho kufru nalezena bomba. Vysvětloval: „Podle statistik je pravděpodobnost přítomnosti bomby v letadle 1:1000. Takže šance, že na palubě budou dvě bomby, je 1:1000000. Tím pádem jsem mnohem více v bezpečí ..." Pravděpodobnost nebo statistika? ooooo Pravděpodobnost ooooooooooosoooooooooooooooo Obvyklé je také klást dotazy s dodatečnou podmínkou. Např. • Jaká je pravděpodobnost, že při hodu dvěma kostkami padly dvě pětky, je-li součet hodnot deset? Pravděpodobnost nebo statistika? ooooo Pravděpodobnost ooooooooooosoooooooooooooooo Obvyklé je také klást dotazy s dodatečnou podmínkou. Např. • Jaká je pravděpodobnost, že při hodu dvěma kostkami padly dvě pětky, je-li součet hodnot deset? • Mějme urnu s 10 koulemi. Desetkrát jsem vytáhl kouli, zkontroloval její barvu a vrátil do urny. Jestliže byla vždy bílé barvy, s jakou pravděpodobností jsou všechny koule v urně bílé? Pravděpodobnost nebo statistika? Pravděpodobnost ooooo ooooooooooosoooooooooooooooo Obvyklé je také klást dotazy s dodatečnou podmínkou. Např. • Jaká je pravděpodobnost, že při hodu dvěma kostkami padly dvě pětky, je-li součet hodnot deset? • Mějme urnu s 10 koulemi. Desetkrát jsem vytáhl kouli, zkontroloval její barvu a vrátil do urny. Jestliže byla vždy bílé barvy, s jakou pravděpodobností jsou všechny koule v urně bílé? • Na dostizích jsou známy pravděpodobnosti vítězství jednotlivých koní. Jak se tyto pravděpodobnosti změní, pokud uprostřed závodu spadne jezdec jednoho z koní ze sedla? Pravděpodobnost nebo statistika? ooooo Pravděpodobnost oooooooooooo»ooooooooooooooo Připomeňme, že formalizovat takové úvahy umíme následovně. Definice Nechť H je jev s nenulovou pravděpodobností v jevovém poli A v pravděpodobnostním prostoru (Q,A,P). Podmíněná pravděpodobnost P(A\H) jevu A (z A vzhledem k jevu H je definována vztahem P(A\H) P {A n H) P(H) ' Pravděpodobnost nebo statistika? ooooo Pravděpodobnost oooooooooooo»ooooooooooooooo Připomeňme, že formalizovat takové úvahy umíme následovně. Definice Nechť H je jev s nenulovou pravděpodobností v jevovém poli A v pravděpodobnostním prostoru (Q,A,P). Podmíněná pravděpodobnost P(A\H) jevu A (z A vzhledem k jevu H je definována vztahem P(A\H) P{A n H) P(H) ' Přirozená definice nezávislosti je, že hypotéza H a jev A jsou nezávislé tehdy, je-li P (A) = P{A\H). Z výše uvedeného snadno vyplývá symetričtější definice: Pravděpodobnost nebo statistika? ooooo Pravděpodobnost oooooooooooo»ooooooooooooooo Připomeňme, že formalizovat takové úvahy umíme následovně. Definice Nechť H je jev s nenulovou pravděpodobností v jevovém poli A v pravděpodobnostním prostoru (Q,A,P). Podmíněná pravděpodobnost P(A\H) jevu A (z A vzhledem k jevu H je definována vztahem P(A\H) P{A n H) P(H) ' Přirozená definice nezávislosti je, že hypotéza H a jev A jsou nezávislé tehdy, je-li P (A) = P{A\H). Z výše uvedeného snadno vyplývá symetričtější definice: Definice Říkáme, že jevy A a B jsou nezávislé, jestliže P{AH B) = P(A)P(B). Pravděpodobnost nebo statistika? ooooo Pravděpodobnost ooooooooooooosoooooooooooooo Definice Říkáme, že jevy Ai,A2, .. jsou nezávislé, jestliže pro každou /c-tici A-n, • • • , A-,k z nich platí / k \ k P o*■ =iľw- \ J=l ) 7=1 Pravděpodobnost nebo statistika? ooooo Pravděpodobnost ooooooooooooosoooooooooooooo Definice Říkáme, že jevy Ai,A2, .. jsou nezávislé, jestliže pro každou /c-tici A-n, • • • , A-,k z nich platí / k \ k P o*)=up(AiJ). \ Příklad V urně jsou 4 lístky označené 000, 110, 101, 011. Uvažujme pro / = 1,2,3 náhodné jevy A; = {náhodně vytažený lístek má na /-tém místě 1}. Pravděpodobnost nebo statistika? ooooo Pravděpodobnost ooooooooooooosoooooooooooooo Definice Říkáme, že jevy Ai,A2, .. jsou nezávislé, jestliže pro každou /c-tici A-n, • • • , A-,k z nich platí / k \ k P o*)=up(AiJ). \ Příklad V urně jsou 4 lístky označené 000, 110, 101, 011. Uvažujme pro / = 1,2,3 náhodné jevy A; = {náhodně vytažený lístek má na /-tém místě 1}. Snadno se vidí, že P(A1) = P(A2) = P(A3) = \, dále, že P(Ai n A2) = P{AÍ n a3) = P(A2 n A3) = { P(A1nA2nA3) = o. a ze 4Ľ3*4l3*4 = k4 = * ^ -OOO Pravděpodobnost nebo statistika? ooooo Pravděpodobnost ooooooooooooosoooooooooooooo Definice Říkáme, že jevy Ai,A2, .. jsou nezávislé, jestliže pro každou /c-tici A-n, • • • , A-,k z nich platí / k \ k P o*)=up(AiJ). \ Příklad V urně jsou 4 lístky označené 000, 110, 101, 011. Uvažujme pro / = 1,2,3 náhodné jevy A; = {náhodně vytažený lístek má na /-tém místě 1}. Snadno se vidí, že P(A1) = P(A2) = P(A3) \, dále, že P{A! n A2) = P{AÍ n A3) = P{A2 n A3) = \ a že P{A\ n A2 n A3) = 0. Jevy A\, A2, A3 jsou tedy po dvou nezávislé, ale nejsou nezávislé. Pravděpodobnost nebo statistika? ooooo Pravděpodobnost oooooooooooooo»ooooooooooooo Přepsáním formule pro podmíněnou pravděpodobnost dostáváme P{A n fi) = P{B r\A) = P(A)P(B\A) = P(B)P(A\B). Věta (Bayesovy věty) Pro pravděpodobnost jevů A a B platí 9 P{A\B) = P(A\B) - P(A)P(B\A) Pravděpodobnost nebo statistika? ooooo Pravděpodobnost oooooooooooooo»ooooooooooooo Přepsáním formule pro podmíněnou pravděpodobnost dostáváme P(A n fi) = P{B r\A) = P(A)P(B\A) = P(B)P(A\B). Věta (Bayesovy věty) Pro pravděpodobnost jevů A a B platí 9 P{A\B) = P(A\B) - P(A)P(B\A) Důkaz. První tvrzení je přepsáním předchozí formule, druhé z prvého plyne dosazením P(B) = P(A)P(B\A) + P(AC)P(B\AC). □ Pravděpodobnost nebo statistika? ooooo Pravděpodobnost ooooooooooooooo«oooooooooooo Příklad a) Z urny, v níž je a bílých a b černých koulí, vybereme postupně (bez vracení) dvě koule. Jaká je pravděpodobnost, že druhá kouleje bílá, za předpokladu, že první byla bílá. b) Ze skupiny 100 výrobků, která obsahuje 10 zmetků, vybereme náhodně bez vracení 3 výrobky. Určete pravděpodobnost, že: » třetí je zmetek za podmínky, že první 2 byly kvalitní. • první 2 jsou kvalitní a třetí zmetek. Pravděpodobnost nebo statistika? ooooo Pravděpodobnost ooooooooooooooo«oooooooooooo Příklad a) Z urny, v níž je a bílých a b černých koulí, vybereme postupně (bez vracení) dvě koule. Jaká je pravděpodobnost, že druhá kouleje bílá, za předpokladu, že první byla bílá. b) Ze skupiny 100 výrobků, která obsahuje 10 zmetků, vybereme náhodně bez vracení 3 výrobky. Určete pravděpodobnost, že: » třetí je zmetek za podmínky, že první 2 byly kvalitní. • první 2 jsou kvalitní a třetí zmetek. Příklad Dva střelci vystřelí nezávisle na sobě do téhož terče každý jednu ránu. Po střelbě byl v teči nalezen 1 zásah. Určete pravděpodobnost, že zásah patří 1. střelci, pokud tento trefuje terče s pravděpodobností 0,8, zatímco druhý střelec s pravděpodobností 0,4. Pravděpodobnost nebo statistika? ooooo Pravděpodobnost oooooooooooooooo»ooooooooooo Příklad V testu jsou u každé otázky 4 možné odpovědi. Pokud student nezná odpověď, tak hádá (uhodne s pravděpodobností |). Dobrý student zná 75% odpovědí, slabý 30%. Jestliže byla určitá otázka zodpovězena správně, určete pravděpodobnost, že student jen hádal, jde-li o: • dobrého studenta, « špatného studenta, « náhodného studenta, kdy navíc víme, že dobrých studentů jsou 2/3. Pravděpodobnost nebo statistika? ooooo Pravděpodobnost ooooooooooooooooo»oooooooooo Příklad Turistický oddíl si předává zprávy Morseovou abecedou s těmito vlastnostmi: pokud je odvysílána tečka, pak ve 40% případů je přijata čárka (jinak tečka), pokud je odvysílána čárka, je v 1/3 případů přijata tečka (jinak čárka). Zpráva obsahuje tečky a čárky v poměru 5 : 3. Určete pravděpodobnost, • že byla vyslaná tečka, pokud je přijatá čárka, • že byla vyslaná tečka, pokud je přijatá tečka. Pravděpodobnost nebo statistika? ooooo Pravděpodobnost ooooooooooooooooo»oooooooooo Příklad Turistický oddíl si předává zprávy Morseovou abecedou s těmito vlastnostmi: pokud je odvysílána tečka, pak ve 40% případů je přijata čárka (jinak tečka), pokud je odvysílána čárka, je v 1/3 případů přijata tečka (jinak čárka). Zpráva obsahuje tečky a čárky v poměru 5 : 3. Určete pravděpodobnost, • že byla vyslaná tečka, pokud je přijatá čárka, • že byla vyslaná tečka, pokud je přijatá tečka. Příklad Osoby X a Y přijdou na smluvené místo kdykoliv mezi 9.00 a 10.00a. Určete pravděpodobnost, že: O první z příchozích nebude muset na druhého čekat déle než 10 minut, 0 osoba Y přijde až jako druhá, jestliže přijde po 9.30. Pravděpodobnost nebo statistika? ooooo Pravděpodobnost oooooooooooooooooo»ooooooooo Pozitivní skutečnost Negativní skutečnost Test pozitivní True positive Falše positive Test negativní Falše negative True negative Senzitivita Specifičnost 1 ► 1 -O^O Pravděpodobnost nebo statistika? ooooo Pravděpodobnost ooooooooooooooooooo»oooooooo Předpokládejme, že krevní test na HIV pozitivní osoby má 99% správnost v případě osoby skutečně HIV pozitivní (vysoká citilivost -sensitivity). Zároveň předpokládejme, že u HIV negativní osoby dopadne test pozitivně v 0,2% případů (relativně vysoká specifičnost - specificity). Pravděpodobnost nebo statistika? ooooo Pravděpodobnost ooooooooooooooooooo»oooooooo Předpokládejme, že krevní test na HIV pozitivní osoby má 99% správnost v případě osoby skutečně HIV pozitivní (vysoká citilivost -sensitivity). Zároveň předpokládejme, že u HIV negativní osoby dopadne test pozitivně v 0,2% případů (relativně vysoká specifičnost - specificity). Náhodně z populace vybereme osobu a otestujeme pozitivně. S jakou pravděpodobností je skutečně HIV pozitivní, jestliže četnost výskytu HIV v populaci je p promile (tj. p osob z tisíce je skutečně HIV pozitivní). Pravděpodobnost nebo statistika? ooooo Pravděpodobnost ooooooooooooooooooo»oooooooo Předpokládejme, že krevní test na HIV pozitivní osoby má 99% správnost v případě osoby skutečně HIV pozitivní (vysoká citilivost -sensitivity). Zároveň předpokládejme, že u HIV negativní osoby dopadne test pozitivně v 0,2% případů (relativně vysoká specifičnost - specificity). Náhodně z populace vybereme osobu a otestujeme pozitivně. S jakou pravděpodobností je skutečně HIV pozitivní, jestliže četnost výskytu HIV v populaci je p promile (tj. p osob z tisíce je skutečně HIV pozitivní). Označme A jev, že je daná osoba HIV pozitivní, a B jev, že daná osoba má pozitivní test. Dle druhé Bayesovy věty je hledaná pravděpodobnost P(A\B)- P/1000-99/100 p/1000 • 99/100 + (1000 - p)/1000 • 2/1000 Pravděpodobnost nebo statistika? ooooo Pravděpodobnost oooooooooooooooooooo»ooooooo Jestliže zvolíme za p nějaké konkrétní četnosti, dostaneme příslušné očekávatelné spolehlivosti testu. V následující tabulce je spočten výsledek pro několik p: P 100 10 1 0,1 P(A\B) 0,982 0,8333 0,3313 0,0471 Výsledek asi neodpovídá naší intuici a může se zdát šokující ve vztahu k použití takovýchto testů. Pravděpodobnost nebo statistika? ooooo Pravděpodobnost oooooooooooooooooooo»ooooooo Jestliže zvolíme za p nějaké konkrétní četnosti, dostaneme příslušné očekávatelné spolehlivosti testu. V následující tabulce je spočten výsledek pro několik p: P 100 10 1 0,1 P(A\B) 0,982 0,8333 0,3313 0,0471 Výsledek asi neodpovídá naší intuici a může se zdát šokující ve vztahu k použití takovýchto testů. Poznámka Sami si můžete podobný výpočet udělat pro tzv. triple test na Downův syndrom, prováděný ve 2. trimestru těhotenství s 70% citlivostí a 5% „false-positive rate" či pro statistiky svého oblíbeného spamfilteru (např. SpamAssassin s někde udávanou citlivostí 99,64% a specifičností 98.23%). - Pravděpodobnost nebo statistika? ooooo Pravděpodobnost ooooooooooooooooooooo»oooooo Triple test je vyšetření krevního séra na hodnoty choriogonadotropinu, estriolu a alfa-fetoproteinu. Provádí se v druhém trimestru těhotenství a má sloužit k detekci rizik genetických poruch a poruch vývoje nervové trubice. Detekuje poruchy s úspěšností 70% a naopak 5% zdravých případů rozpozná jako porušené. Budoucím matkám, u kterých triple test ukáže zvýšené riziko vad plodu, je obvykle doporučeno nějaké další zpřesňující vyšetření, například amniocentéza (odběr plodové vody). 4Ľ3k4l3*4 = k4 = * -š -OOO Pravděpodobnost nebo statistika? ooooo Pravděpodobnost ooooooooooooooooooooo»oooooo Triple test je vyšetření krevního séra na hodnoty choriogonadotropinu, estriolu a alfa-fetoproteinu. Provádí se v druhém trimestru těhotenství a má sloužit k detekci rizik genetických poruch a poruch vývoje nervové trubice. Detekuje poruchy s úspěšností 70% a naopak 5% zdravých případů rozpozná jako porušené. Budoucím matkám, u kterých triple test ukáže zvýšené riziko vad plodu, je obvykle doporučeno nějaké další zpřesňující vyšetření, například amniocentéza (odběr plodové vody). Uvádí se, že u těhotné ženy ve věku 20-24 let je pravděpodobnost narození dítěte s Downovým syndromem cca 1:1500, u těhotné ženy ve věku 35-39 let je pravděpodobnost narození dítěte s Downovým syndromem cca 1:200. Pravděpodobnost nebo statistika? ooooo Pravděpodobnost ooooooooooooooooooooo»oooooo Triple test je vyšetření krevního séra na hodnoty choriogonadotropinu, estriolu a alfa-fetoproteinu. Provádí se v druhém trimestru těhotenství a má sloužit k detekci rizik genetických poruch a poruch vývoje nervové trubice. Detekuje poruchy s úspěšností 70% a naopak 5% zdravých případů rozpozná jako porušené. Budoucím matkám, u kterých triple test ukáže zvýšené riziko vad plodu, je obvykle doporučeno nějaké další zpřesňující vyšetření, například amniocentéza (odběr plodové vody). Uvádí se, že u těhotné ženy ve věku 20-24 let je pravděpodobnost narození dítěte s Downovým syndromem cca 1:1500, u těhotné ženy ve věku 35-39 let je pravděpodobnost narození dítěte s Downovým syndromem cca 1:200. Prozkoumejme (alespoň z matematického hlediska) význam provádění tohoto testu za uvedených předpokladů, kdy se rodí cca 100 tis. dětí ročně, z toho cca 10% ženám ve věku 35-39 let a cca 12% ženám ve věku 20-24 let. Pravděpodobnost nebo statistika? ooooo Pravděpodobnost oooooooooooooooooooooo»ooooo Pozitivní skutečnost Negativní skutečnost Test pozitivní True positive Falše positive Test negativní Falše negative True negative Senzitivita Specifičnost Pravděpodobnost nebo statistika? ooooo Pravděpodobnost oooooooooooooooooooooo»ooooo Pozitivní skutečnost Negativní skutečnost Test pozitivní True positive Falše positive Test negativní Falše negative True negative Senzitivita Specifičnost Triple test Pozitivní skutečnost Negativní skutečnost Test pozitivní 70% 5% Test negativní 30% 95% Senzitivita Specifičnost Pravděpodobnost nebo statistika? ooooo Pravděpodobnost oooooooooooooooooooooo»ooooo Pozitivní skutečnost Negativní skutečnost Test pozitivní True positive Falše positive Test negativní Falše negative True negative Senzitivita Specifičnost Triple test Pozitivní skutečnost Negativní skutečnost Test pozitivní 70% 5% Test negativní 30% 95% Senzitivita Specifičnost Za dříve uvedených předpokladů snadno vypočteme, že pravděpodobnost, že dítě „starší" matky bude skutečně postiženo Downovým syndromem, pokud vyšel pozitivní test, je pouhých cca 6,6%. U mladých žen se pak tato pravděpodobnost pohybuje kolem 0,9% a je tedy na zváženou, zda toto plošné testování v dané věkové skupině provádět, pokud navíc uváděné riziko potratu při případné amniocentéze se pohybuje kolem jedrjpJio^cojTjile... i Pravděpodobnost nebo statistika? ooooo Pravděpodobnost ooooooooooooooooooooooo»oooo Uvažujme (reálný) vzorek deseti tisíc žen ve věku 35-39 let: Starší ženy Pozitivní skutečnost Negativní skutečnost Test pozitivní 35 497,5 532,5 Test negativní 15 9452,5 9467,5 50 9950 Proto lze pravděpodobnost, že dítě „starší" matky bude skutečně postiženo Downovým syndromem, pokud vyšel pozitivní test, spočítat jako 6,6%. Pravděpodobnost nebo statistika? ooooo Pravděpodobnost ooooooooooooooooooooooo»oooo Uvažujme (reálný) vzorek deseti tisíc žen ve věku 35-39 let: Starší ženy Pozitivní skutečnost Negativní skutečnost Test pozitivní 35 497,5 532,5 Test negativní 15 9452,5 9467,5 50 9950 Proto lze pravděpodobnost, že dítě „starší" matky bude skutečně postiženo Downovým syndromem, pokud vyšel pozitivní test, spočítat jako 6,6%. A pro 12 tis. žen ve věku 20-24 let dostaneme: Mladší ženy Pozitivní skutečnost Negativní skutečnost Test pozitivní 5,6 599,6 605,2 Test negativní 2,4 11392,4 11394,8 8 11992 Pravděpodobnost, že dítě „mladší" matky bude skutečně postižerjo -o«.o Pravděpodobnost nebo statistika? ooooo Pravděpodobnost oooooooooooooooooooooooo^ooo Evidentně prostý výběr náhodné osoby a použití jediného testu, byť velmi citlivého a specifického, nejsou vhodné ani na otestování skutečného stavu populace, ani na preventivní vyšetření jednotlivců, pokud nemáme další podpůrné informace a lepší nástroje. Pravděpodobnost nebo statistika? ooooo Pravděpodobnost oooooooooooooooooooooooo^ooo Evidentně prostý výběr náhodné osoby a použití jediného testu, byť velmi citlivého a specifického, nejsou vhodné ani na otestování skutečného stavu populace, ani na preventivní vyšetření jednotlivců, pokud nemáme další podpůrné informace a lepší nástroje. Právě matematická statistika dává nástroje na kvalifikovanější postupy v medicínské i průmyslové diagnostice, ekonomických modelech, vyhodnocování experimentálních dat atd. Pravděpodobnost nebo statistika? ooooo Pravděpodobnost ooooooooooooooooooooooooo»oo Příklad Alešovi zbylo 2500 Kč z pořádání tábora. Aleš není žádný ňouma: 50 Kč přidal z kasičky a rozhodl sejít hrát ruletu na automaty. Aleš sází pouze na barvu. Pravděpodobnost výhry při sázce na barvu je 18/37. Pravděpodobnost nebo statistika? ooooo Pravděpodobnost ooooooooooooooooooooooooo»oo Příklad Alešovi zbylo 2500 Kč z pořádání tábora. Aleš není žádný ňouma: 50 Kč přidal z kasičky a rozhodl sejít hrát ruletu na automaty. Aleš sází pouze na barvu. Pravděpodobnost výhry při sázce na barvu je 18/37. Začíná sázet na 10 Kč a pokud prohraje, v další sázce vsadí dvojnásobek toho, co v předchozí (pokud na to ještě má, pokud ne, tak končí s hrou - byť by měl ještě peníze na nějakou menší sázku). Pokud nějakou sázku vyhraje, v následující sázce hraje opět o 10 Kč. Jaká je pravděpodobnost, že při tomto postupu vyhraje dalších 2550 Kč? (jakmile bude 2550 Kč v plusu, tak končí). 4Ľ3k4l3*4 = k4 = * -š -O^O Pravděpodobnost nebo statistika? ooooo Pravděpodobnost oooooooooooooooooooooooooo»o Řešení Nejprve spočítejme, kolikrát po sobě může Aleš prohrát. Začíná-li s 10 Kč, tak na n vsazení potřebuje 10+20+- • -+10-2"-1 = io- (^2=10- (y~r) = itH2"-1)- Jak snadno nahlédneme, číslo 2550 je tvaru 10(2" — 1) a to pro n = 8. Aleš tedy může sázet osmkrát po sobě bez ohledu na výsledek sázky, na devět sázek by potřeboval již 10(29 — 1) = 5110 Kč a to v průběhu hry nikdy mít nebude (jakmile bude mít 5100 Kč, tak končí). Aby tedy jeho hra skončila neúspěchem, musel by prohrát osmkrát v řadě. Pravděpodobnost prohry při jedné sázce je 19/37, pravděpodobnost prohry v osmi po sobě následujících (nezávislých) sázkách je tedy (19/37)8 = 0,0048, tedy docela mizivá. 1Ľ3k4l3*1 = k4 = * -š -00.0 Pravděpodobnost nebo statistika? ooooo Pravděpodobnost ooooooooooooooooooooooooooo* Řešení Pravděpodobnost, že v těchto osmi hrách vyhraje 10 Kč (při daném postupu) je tedy 1 — (19/37)8. Na to, aby vyhrál 2550 Kč, potřebuje 255 krát vyhrát po desetikoruně. Tedy opět podle pravidla součinu je pravděpodobnost výhry Tedy pravděpodobnost výhry je nižší, než kdyby vsadil rovnou vše na jednu barvu.