Matematika IV - 7. přednáška Pravděpodobnost - opakování a zobecnění pojmů Michal Bulant Masarykova univerzita Fakulta informatiky 12. 4. 2010 □ S Obsah přednášky Pravděpodobnost nebo statistika? Pravděpodobnost Náhodné veličiny □ s • Martin Panák, Jan Slovák, Drsná matematika, e-text. • Karel Zvára, Josef Štěpán, Pravděpodobnost a matematická statistika, Matfyzpress, 4. vydání, 2006, 230 stran, ISBN 80-867-3271-1. • Marie Budíková, Štěpán Mikoláš, Pavel Osecký, Teorie pravděpodobnosti a matematická statistika (sbírka příkladů), Masarykova univerzita, 3. vydání, 2004, 117 stran, ISBN 80-210-3313-4. • Marie Budíková, Štěpán Mikoláš, Pavel Osecký, Popisná statistika, Masarykova univerzita, 3. vydání, 2002, 48 stran, ISBN 80-210-1831-3. • Marie Budíková, Tomáš Lerch, Štěpán Mikoláš, Základní statistické metody, Masarykova univerzita, 2005, 170 stran, ISBN 80-210-3886-1. EfflEHHSffilEB Plán přednášky oooooooooooooooo Pravděpodobnost nebo statistika? Pra\ □ s - = ■€. -o<\(y Motto 42,35 procenta všech statistik je nesmyslných. Statistika v širším slova smyslu je jakékoliv zpracování číselných dat o nějakém souboru objektů a jejich více či méně přehledná prezentace. □ s Podstatou matematické statistiky je pro daná data zjišťovat, jaké vlastnosti mají objekty, které jsou daty popisovány. Zpravidla jde o sběr dat o části souboru objektů, jejich následnou analýzu a konečně o vyslovení důsledků pozorování pro celý soubor. Podstatou matematické statistiky je pro daná data zjišťovat, jaké vlastnosti mají objekty, které jsou daty popisovány. Zpravidla jde o sběr dat o části souboru objektů, jejich následnou analýzu a konečně o vyslovení důsledků pozorování pro celý soubor. Výsledkem práce matematického statistika je sdělení o velkém souboru objektů na základě studia malé (zpravidla náhodně vybrané) části z nich, společně s kvalitativním odhadem věrohodnosti výsledného sdělení. Podstatou matematické statistiky je pro daná data zjišťovat, jaké vlastnosti mají objekty, které jsou daty popisovány. Zpravidla jde o sběr dat o části souboru objektů, jejich následnou analýzu a konečně o vyslovení důsledků pozorování pro celý soubor. Výsledkem práce matematického statistika je sdělení o velkém souboru objektů na základě studia malé (zpravidla náhodně vybrané) části z nich, společně s kvalitativním odhadem věrohodnosti výsledného sdělení. Teorie pravděpodobnosti studuje modely popisující chování abstraktních souborů (pravděpodobnost jevů zjevového pole), statistika studuje skutečné náhodné výběry z nějakého základního souboru a zdůvodňuje výběr teoretického pravděpodobnostního modelu, resp. kvalitativní informace o jeho parametrech. Příklad Za soubor objektů vezměme všechny studenty přednášky Matematika III (podzim 2007), jako číselný údaj můžeme uvažovat O průměrné bodové hodnocení studenta u zkoušky, a mnoho dalších údajů. Příklad Za soubor objektů vezměme všechny studenty přednášky Matematika III (podzim 2007), jako číselný údaj můžeme uvažovat O průměrné bodové hodnocení studenta u zkoušky, O průměrnou známku u zkoušky z tohoto (2,92 ) a z jiných pevně vybraných předmětů (IBOOO - 2,95; IB102 - 2,89) , a mnoho dalších údajů. Příklad Za soubor objektů vezměme všechny studenty přednášky Matematika III (podzim 2007), jako číselný údaj můžeme uvažovat O průměrné bodové hodnocení studenta u zkoušky, O průměrnou známku u zkoušky z tohoto (2,92 ) a z jiných pevně vybraných předmětů (IB000 - 2,95; IB102 - 2,89) , O nejčastější známku (resp. úspěšnou známku) z tohoto předmětu (F - 92 krát, E - 91 krát), nejméně častou známku (B - 15 krát), a mnoho dalších údajů. Příklad Za soubor objektů vezměme všechny studenty přednášky Matematika III (podzim 2007), jako číselný údaj můžeme uvažovat O průměrné bodové hodnocení studenta u zkoušky, O průměrnou známku u zkoušky z tohoto (2,92 ) a z jiných pevně vybraných předmětů (IB000 - 2,95; IB102 - 2,89) , O nejčastější známku (resp. úspěšnou známku) z tohoto předmětu (F - 92 krát, E - 91 krát), nejméně častou známku (B - 15 krát), O průměrný počet bodů dosažených na jednotlivých termínech zkoušky (1. - 16,8; 2. - 8,9; 3. - 8,1; příklad, za nějž bylo uděleno nejvíce (nejméně) procent možných bodů - min. kostra (IB, 82,5%), resp. rekurence (2A, 3,6%) a mnoho dalších údajů. Příklad Za soubor objektů vezměme všechny studenty přednášky Matematika III (podzim 2007), jako číselný údaj můžeme uvažovat O průměrné bodové hodnocení studenta u zkoušky, O průměrnou známku u zkoušky z tohoto (2,92 ) a z jiných pevně vybraných předmětů (IB000 - 2,95; IB102 - 2,89) , O nejčastější známku (resp. úspěšnou známku) z tohoto předmětu (F - 92 krát, E - 91 krát), nejméně častou známku (B - 15 krát), O průměrný počet bodů dosažených na jednotlivých termínech zkoušky (1. - 16,8; 2. - 8,9; 3. - 8,1; příklad, za nějž bylo uděleno nejvíce (nejméně) procent možných bodů - min. kostra (IB, 82,5%), resp. rekurence (2A, 3,6%) O počet pracovních hodin týdně odpracovaných mimo fakultu, a mnoho dalších údajů. Příklad Za soubor objektů vezměme všechny studenty přednášky Matematika III (podzim 2007), jako číselný údaj můžeme uvažovat O průměrné bodové hodnocení studenta u zkoušky, O průměrnou známku u zkoušky z tohoto (2,92 ) a z jiných pevně vybraných předmětů (IB000 - 2,95; IB102 - 2,89) , O nejčastější známku (resp. úspěšnou známku) z tohoto předmětu (F - 92 krát, E - 91 krát), nejméně častou známku (B - 15 krát), O průměrný počet bodů dosažených na jednotlivých termínech zkoušky (1. - 16,8; 2. - 8,9; 3. - 8,1; příklad, za nějž bylo uděleno nejvíce (nejméně) procent možných bodů - min. kostra (IB, 82,5%), resp. rekurence (2A, 3,6%) O počet pracovních hodin týdně odpracovaných mimo fakultu, O číselná data vypovídající o historii dřívějšího studia a mnoho dalších údajů. Zastavme se u prvního údaje. Samotný aritmetický průměr bodů nám mnoho neřekne nejen o kvalitě přednášky a o kvalitě přednášejícího, ale ani o samotném hodnocení. Zajímá nás také hodnota, která bude „uprostřed souboru", tj. počet bodů, pro které je stejně studentů pod ní a nad ní. Obdobně první a poslední čtvrtina, desetina apod. Všem takovým údajům říkáme statistiky posuzované veličiny. V uvedených příkladech se jim říká medián, kvartil, decil apod. Zastavme se u prvního údaje. Samotný aritmetický průměr bodů nám mnoho neřekne nejen o kvalitě přednášky a o kvalitě přednášejícího, ale ani o samotném hodnocení. Zajímá nás také hodnota, která bude „uprostřed souboru", tj. počet bodů, pro které je stejně studentů pod ní a nad ní. Obdobně první a poslední čtvrtina, desetina apod. Všem takovým údajům říkáme statistiky posuzované veličiny. V uvedených příkladech se jim říká medián, kvartil, decil apod. Z obecné zkušenosti nebo jako výsledek úvah mimo matematiku víme, že rozumné hodnocení by mělo mít tzv. normální rozdělení (odpovídá tzv. Gaussově křivce). Tento pojem patří do teorie pravděpodobnosti a k jeho zavedení potřebujeme poměrně dost matematiky. Zastavme se u prvního údaje. Samotný aritmetický průměr bodů nám mnoho neřekne nejen o kvalitě přednášky a o kvalitě přednášejícího, ale ani o samotném hodnocení. Zajímá nás také hodnota, která bude „uprostřed souboru", tj. počet bodů, pro které je stejně studentů pod ní a nad ní. Obdobně první a poslední čtvrtina, desetina apod. Všem takovým údajům říkáme statistiky posuzované veličiny. V uvedených příkladech se jim říká medián, kvartil, decil apod. Z obecné zkušenosti nebo jako výsledek úvah mimo matematiku víme, že rozumné hodnocení by mělo mít tzv. normální rozdělení (odpovídá tzv. Gaussově křivce). Tento pojem patří do teorie pravděpodobnosti a k jeho zavedení potřebujeme poměrně dost matematiky. Porovnáním výsledku třeba i docela malého náhodného výběru studentů s teoretickým modelem můžeme zjistit odhad parametrů takového rozdělení a činit závěry, zda je hodnocení „rozumné". Zároveň lze popsat věrohodnost našich závěrů. Daleko zajímavější vývody ovšem můžeme činit, když porovnáním statistik pro různé veličiny budeme moci dovozovat informace o souvislostech. Pokud např. neexistuje žádná doložitelna souvislost mezi historií předchozího studia a výsledky v dané přednášce, je jedním z možných vysvětlení vývod, zeje přednáška (nebo její hodnocení) prostě špatná. Daleko zajímavější vývody ovšem můžeme činit, když porovnáním statistik pro různé veličiny budeme moci dovozovat informace o souvislostech. Pokud např. neexistuje žádná doložitelna souvislost mezi historií předchozího studia a výsledky v dané přednášce, je jedním z možných vysvětlení vývod, zeje přednáška (nebo její hodnocení) prostě špatná. Závěr úvodních úvah: • V matematice pracujeme s abstraktním matematickým popisem pravděpodobnosti. • Vývody pro konktrétní soubory dat, pro které je zvolený model relevantní, dává matematická statistika. • To, zda je takový popis adekvátní pro konkrétní výběr dat, je také možné podpořit nebo zavrhnout pomocí metod matematické statistiky. □ s Q Pravděpodobnost nebo statistika? Pravděpodobnost n S - = -E -00*0 Připomeneme (a trochu zobecníme) pojmy a výsledky z prvního semestru. Budeme pracovat s neprázdnou pevně zvolenou množinou Q všech možných výsledků, kterou nazýváme základní prostor. Připomeneme (a trochu zobecníme) pojmy a výsledky z prvního semestru. Budeme pracovat s neprázdnou pevně zvolenou množinou Q všech možných výsledků, kterou nazýváme základní prostor. Prvky wefi představují jednotlivé možné výsledky. Připomeneme (a trochu zobecníme) pojmy a výsledky z prvního semestru. Budeme pracovat s neprázdnou pevně zvolenou množinou Q všech možných výsledků, kterou nazýváme základní prostor. Prvky wefi představují jednotlivé možné výsledky. Systém podmnožin A základního prostoru se nazývá jevové pole a jeho prvky se nazývají jevy, jestliže • Q G A, tj. základní prostor, je jevem, • je-li A, B G A, pak A \ B G A, tj. pro každé dva jevy je jevem i jejich množinový rozdíl, • je-li A j G A, i G / nejvýše spočetný systém jevů, pak také jejich sjednocení je jevem, tj. U,-e/>4; G A. Důsledek • Komplement Ac = Q \ A jevu A je jevem, který nazýváme opačný jev k jevu A. n S - = -E -00*0 Důsledek * • Komplement Ac = Q \ A jevu A je jevem, opačný jev k jevu A. • Průnik dvou jevů opět jevem, protože pro podmnožiny A, B C Q platí A\(Q\B) = AnB. který nazýváme každé dvě Takový systém množin A se pak nazývá cr-algebra. □ s Důsledek * • Komplement Ac = Q \ A jevu A je jevem, opačný jev k jevu A. • Průnik dvou jevů opět jevem, protože pro podmnožiny A, B C Q platí A\(Q\B) = AnB. který nazýváme každé dvě Takový systém množin A se pak nazývá cr-algebra. Jevové poleje tedy systém podmnožin základního prostoru uzavřený na konečné průniky, spočetná sjednocení a množinové rozdíly. Jednotlivé množiny A G A nazýváme náhodné jevy (vzhledem k .4). □ s Terminologie připomíná souvislosti s popisem skutečných jevů a jejich statistickým popisem: • celý základní prostor Q se nazývá jistý jev, prázdná podmnožina 0 G A se nazývá nemožný jev, □ s Terminologie připomíná souvislosti s popisem skutečných jevů a jejich statistickým popisem: • celý základní prostor Q se nazývá jistý jev, prázdná podmnožina 0 G A se nazývá nemožný jev, • jednoprvkové podmnožiny {co} G Q se nazývají elementární jevy, □ S Terminologie pripomína souvislosti s popisem skutečných jevů a jejich statistickým popisem: • celý základní prostor Q se nazývá jistý jev, prázdná podmnožina 0 G A se nazývá nemožný jev, • jednoprvkové podmnožiny {co} G Q se nazývají elementární jevy, • společné nastoupení jevů A,, i g /, odpovídá jevu n,-e/A, nastoupení alespoň jednoho z jevů A,, i g /, odpovídá jevu U/e/A, Terminologie pripomína souvislosti s popisem skutečných jevů a jejich statistickým popisem: • celý základní prostor Q se nazývá jistý jev, prázdná podmnožina 0 G A se nazývá nemožný jev, • jednoprvkové podmnožiny {co} G Q se nazývají elementární jevy, • společné nastoupení jevů A,, i g /, odpovídá jevu n,-e/A, nastoupení alespoň jednoho z jevů A,, i g /, odpovídá jevu U/e/A, • A, B G A jsou neslučitelné jevy, je-li A n B = 0, □ s Terminologie pripomína souvislosti s popisem skutečných jevů a jejich statistickým popisem: • celý základní prostor Q se nazývá jistý jev, prázdná podmnožina 0 G A se nazývá nemožný jev, • jednoprvkové podmnožiny {co} G Q se nazývají elementární jevy, • společné nastoupení jevů A,, i g /, odpovídá jevu n,-e/A, nastoupení alespoň jednoho z jevů A,, i g /, odpovídá jevu U/e/A, • A, B G A jsou neslučitelné jevy, je-li A n B = 0, • jev A má za důsledek jev B, když A c B, Terminologie pripomína souvislosti s popisem skutečných jevů a jejich statistickým popisem: • celý základní prostor Q se nazývá jistý jev, prázdná podmnožina 0 G A se nazývá nemožný jev, • jednoprvkové podmnožiny {co} G Q se nazývají elementární jevy, • společné nastoupení jevů Aj, i g /, odpovídá jevu n,-e/A, nastoupení alespoň jednoho z jevů A,, i G /, odpovídá jevu U/e/A, • A, B G A jsou neslučitelné jevy, je-li A n B = 0, • jev A má za důsledek jev B, když A c B, • je-li A G A, pak se jev B = Q \ A nazývá opačný jev k jevu A, píšeme B = Ac. Definice (Kolmogorovova definice pravděpodobnosti) Pravděpodobnostní prostor je jevové pole A podmnožin (konečného) základního prostoru Q, na kterém je definována funkce P : A —> M s následujícími vlastnosti: • je nezáporná, tj. P (A) > 0 pro všechny jevy A, • je aditivní, tj. P(U;e/A) = J2í^i P(A')> Pro každý nejvýše spočetný systém po dvou neslučitelných jevů, • pravděpodobnost jistého jevu je 1. Funkci P nazýváme pravděpodobností na jevovém poli (Q,A). □ s Definice (Kolmogorovova definice pravděpodobnosti) Pravděpodobnostní prostor je jevové pole A podmnožin (konečného) základního prostoru Q, na kterém je definována funkce P : A —> M s následujícími vlastnosti: • je nezáporná, tj. P (A) > 0 pro všechny jevy A, • je aditivní, tj. P(U;e/A) = J2í^i P(A')> Pro každý nejvýše spočetný systém po dvou neslučitelných jevů, • pravděpodobnost jistého jevu je 1. Funkci P nazýváme pravděpodobností na jevovém poli (Q,A). Důsledek Pro všechny jevy A, B e A platí 9 P(0) = 0, 0 < P(A) < 1, Definice (Kolmogorovova definice pravděpodobnosti) Pravděpodobnostní prostor je jevové pole A podmnožin (konečného) základního prostoru Q, na kterém je definována funkce P : A —> M s následujícími vlastnosti: • je nezáporná, tj. P (A) > 0 pro všechny jevy A, • je aditivní, tj. P(U;e/A) = J2í^i P(A')> Pro každý nejvýše spočetný systém po dvou neslučitelných jevů, • pravděpodobnost jistého jevu je 1. Funkci P nazýváme pravděpodobností na jevovém poli (Q,A). Důsledek Pro všechny jevy A, B e A platí 9 P(0) = 0, 0 < P(A) < 1, • P{AC) = 1 - P{A), Definice (Kolmogorovova definice pravděpodobnosti) Pravděpodobnostní prostor je jevové pole A podmnožin (konečného) základního prostoru Q, na kterém je definována funkce P : A —> M s následujícími vlastnosti: • je nezáporná, tj. P (A) > 0 pro všechny jevy A, • je aditivní, tj. P(U;e/A) = J2í^i P(A')> Pro každý nejvýše spočetný systém po dvou neslučitelných jevů, • pravděpodobnost jistého jevu je 1. Funkci P nazýváme pravděpodobností na jevovém poli (Q,A). Důsledek ^ Pro všechny jevy A, B e A platí 9 P(0) = 0, 0 < P(A) < 1, • P{AC) = 1 - P{A), »ACB^ P{A) < P{B), P{B \ A) = = P{B)- - P{A), Definice (Kolmogorovova definice pravděpodobnosti) Pravděpodobnostní prostor je jevové pole A podmnožin (konečného) základního prostoru Q, na kterém je definována funkce P : A —> M s následujícími vlastnosti: • je nezáporná, tj. P (A) > 0 pro všechny jevy A, • je aditivní, tj. P(U;e/A) = J2í^i P(A')> Pro každý nejvýše spočetný systém po dvou neslučitelných jevů, • pravděpodobnost jistého jevu je 1. Funkci P nazýváme pravděpodobností na jevovém poli (Q,A). Důsledek Pro všechny jevy A, B e A platí 9 P(0) = 0, 0 < P(A) < 1, • P{AC) = 1 - P{A), *ACB^ P{A) < P{B), P{B \A) = P{B) • P{A U ß) = P{A) + P(ß) - P{A n ß) P(A), Podobná tvrzení platí pro nekonečné posloupnosti jevů: Pro libovolnou nejvýše spočetnou množinu jevů (A)/^i plstí: • Je-li A1CA2<^---,pak P((JA) = lim P(A-), ;=1 Podobná tvrzení platí i pro nekonečné posloupnosti jevů: Pro libovolnou nejvýše spočetnou množinu jevů (A-mi platí: a Je-li Ax a2o ••, pak oo ;=i = lim /—>oo P(Ai), 9 Je-li A-í 5 A? 5 • ••, pak oo p(f)Ai) /=1 = lim /—>oo P(Ai), Podobná tvrzení platí i pro nekonečné posloupnosti jevů: Pro libovolnou nejvýše spočetnou • Je-li A1CA2<^---,pak množinu jevů (A-mi platí: oo ;=i = lim /—>oo P(Ai), 9 Je-li A-í ^A2 D • •, pak oo ;=1 = lim /—>oo P(Ai), • p(UZi A)< E~i P{Ai), Podobná tvrzení platí i pro nekonečné posloupnosti jevů: Pro libovolnou nejvýše spočetnou množinu jevů (A)~! platí: a Je-li Ax a2o ••, pak oo ;=i = lim /—>oo P(A), 9 Je-li Ax 5 A> 5 • ••, pak oo ;=i = lim /—>oo P(A), • p(UZi A) < E~i P(A,), • P(f)Zi A) > i - E~i(i- P(A)) □ s - = .= -o^O Klasická pravděpodobnost Připomeňme si klasickou konečnou pravděpodobnost. □ s - = ■€. -o<\(y Klasická pravděpodobnost Připomeňme si klasickou konečnou pravděpodobnost. Definice Nechť Q je konečný základní prostor a nechť jevové pole A je právě systém všech podmnožin v Q. Klasická pravděpodobnost je pravděpodobnostní prostor (Q,A, P) s pravděpodobnostní funkcí P : A -»■ M, _________™Jm_________ Zjevně takto zadaná funkce skutečně definuje pravděpodobnost, kdy všem elementárním jevům přiřazujeme stejnou pravděpodobnost. □ s - Že s klasickou pravděpodobností nevystačíme, ukazují následující příklady: Příklad • Cestou z Kotlářské na Botanickou jsem ztratil zadání písemky. Určete pravděpodobnost jevu uox slovně vyjádřeného: ztracená písemka se nachází nejblíže k zastávce trolejbusu X. □ s Že s klasickou pravděpodobností nevystačíme, ukazují následující příklady: Příklad • Cestou z Kotlářské na Botanickou jsem ztratil zadání písemky. Určete pravděpodobnost jevu uox slovně vyjádřeného: ztracená písemka se nachází nejblíže k zastávce trolejbusu X. 9 Určete pravděpodobnost, jevu w^: při opakovaném hodu mincí padne hlava poprvé při k-tém pokusu. □ s Že s klasickou pravděpodobností nevystačíme, ukazují následující příklady: Příklad • Cestou z Kotlářské na Botanickou jsem ztratil zadání písemky. Určete pravděpodobnost jevu uox slovně vyjádřeného: ztracená písemka se nachází nejblíže k zastávce trolejbusu X. 9 Určete pravděpodobnost, jevu w^: při opakovaném hodu mincí padne hlava poprvé při k-tém pokusu. □ s Že s klasickou pravděpodobností nevystačíme, ukazují následující příklady: Příklad • Cestou z Kotlářské na Botanickou jsem ztratil zadání písemky. Určete pravděpodobnost jevu uox slovně vyjádřeného: ztracená písemka se nachází nejblíže k zastávce trolejbusu X. • Určete pravděpodobnost, jevu w^: při opakovaném hodu mincí padne hlava poprvé při k-tém pokusu. V prvním případě je třeba pracovat s nekonečně mnoha stejně pravděpodobnými elementárními jevy: písemku jsem ztratil v bodě (x,y) , ve druhém pak musíme připustit teoretickou možnost, že hlava nepadne nikdy, a prostorem jevů tedy bude N U {oo}. □ s Peterburgský ,,paradox" (Bernoulli, 1738) Typický příklad klasické pravděpodobnosti jsou jevy související s házením mincí. Představme si následující pravidla kasina: □ s Typický příklad klasické pravděpodobnosti jsou jevy související s házením mincí. Představme si následující pravidla kasina: Casino rules Návštěvník tí platí vklad C a poté r ází mincí. V banku je na začátku dolar a při každém hodu se bank zdvojnásobí. Padne-li hlava, hráč zí ská obsah banku. Je-li tedy T počet hodů potřebných k první hlavě, hráč obdrží výhru 2T Jaká je „fér hodnota" pro vklad C? ' Typický příklad klasické pravděpodobnosti jsou jevy související s házením mincí. Představme si následující pravidla kasina: Casino rules Návštěvník tí platí vklad C a poté r ází mincí. V banku je na začátku dolar a při každém hodu se bank zdvojnásobí. Padne-li hlava, hráč zí ská obsah banku. Je-li tedy T počet hodů potřebných k první hlavě, hráč obdrží výhru 2T Jaká je „fér hodnota" pro vklad C? ________ ' A co vy? Zaplatili byste za možnost zahrát si tuto hru třeba 20$? Pravděpodobnost, že padne hlava je u férové mince 1/2 , je proto P(T = k) = 2~ <. Sečteme-li všechny pravděpodobnosti výsledků vynásobených výhrami 2k, dostaneme očekává nou výhru |.2+;.*+. oo = £* = 1 oo. Zdá se proto, že se vyplatí vložit velký vklad, protože libovolný vklad C se nám „časem" vrátí. Odvození Pravděpodobnost, že padne hlava je u férové mince 1/2, je proto P (T = k) = 2~k. Sečteme-li všechny pravděpodobnosti výsledků vynásobených výhrami 2k, dostaneme očekávanou výhru 1 1 i.2+i.ŕ+...=j:i oo. Zdá se proto, že se vyplatí vložit i velký vklad, protože libovolný vklad C se nám „časem" vrátí. Ve skutečnosti simulací hry zjistíme, že nezávisle na počtu pokusů se prakticky všechny výhry budou pohybovat v rozmezí malých hodnot. Důvodem je, že vysoké výhry jsou velice nepravděpodobné a proto je při reálných úvahách nelze brát vážně. Odvození Pravděpodobnost, že padne hlava je u férové mince 1/2, je proto P (T = k) = 2~k. Sečteme-li všechny pravděpodobnosti výsledků vynásobených výhrami 2k, dostaneme očekávanou výhru 1 1 i.2+i.ŕ+...=j:i oo. Zdá se proto, že se vyplatí vložit i velký vklad, protože libovolný vklad C se nám „časem" vrátí. Ve skutečnosti simulací hry zjistíme, že nezávisle na počtu pokusů se prakticky všechny výhry budou pohybovat v rozmezí malých hodnot. Důvodem je, že vysoké výhry jsou velice nepravděpodobné a proto je při reálných úvahách nelze brát vážně. Tento paradox je vysvětlován nelinearitou funkce užitečnosti peněz (utility function), případně nezbytností diskontovaní jejich hodnoty. ooooooooo«oooooo Podmíněná pravděpodobnost a nezávislost Je dokázáno, že slavení narozenin je zdraví prospěšné. Statistika ukazuje, že lidé, kteří oslavili nejvíce narozenin, se dožívají nejvyššího věku. □ s ooooooooo«oooooo Podmíněná pravděpodobnost a nezávislost Je dokázáno, že slavení narozenin je zdraví prospěšné. Statistika ukazuje, že lidé, kteří oslavili nejvíce narozenin, se dožívají nejvyššího věku. Obvyklé je také klást dotazy s dodatečnou podmínkou. Např. • Jaká je pravděpodobnost, že při hodu dvěma kostkami padly dvě pětky, je-li součet hodnot deset? ooooooooo«oooooo Podmíněná pravděpodobnost a nezávislost Je dokázáno, že slavení narozenin je zdraví prospěšné. Statistika ukazuje, že lidé, kteří oslavili nejvíce narozenin, se dožívají nejvyššího věku. Obvyklé je také klást dotazy s dodatečnou podmínkou. Např. • Jaká je pravděpodobnost, že při hodu dvěma kostkami padly dvě pětky, je-li součet hodnot deset? • Mějme urnu s 10 koulemi. Desetkrát jsem vytáhl kouli, zkontroloval její barvu a vrátil do urny. Jestliže byla vždy bílé barvy, s jakou pravděpodobností jsou všechny koule v urně bílé? ooooooooo«oooooo Podmíněná pravděpodobnost a nezávislost Je dokázáno, že slavení narozenin je zdraví prospěšné. Statistika ukazuje, že lidé, kteří oslavili nejvíce narozenin, se dožívají nejvyššího věku. Obvyklé je také klást dotazy s dodatečnou podmínkou. Např. • Jaká je pravděpodobnost, že při hodu dvěma kostkami padly dvě pětky, je-li součet hodnot deset? • Mějme urnu s 10 koulemi. Desetkrát jsem vytáhl kouli, zkontroloval její barvu a vrátil do urny. Jestliže byla vždy bílé barvy, s jakou pravděpodobností jsou všechny koule v urně bílé? • Na dostizích jsou známy pravděpodobnosti vítězství jednotlivých koní. Jak se tyto pravděpodobnosti změní, pokud uprostřed závodu spadne jezdec jednoho z koní ze sedla? □ s Připomeňme, že formalizovat takové úvahy umíme následovně. Definice Nechť /-/je jev s nenulovou pravděpodobností v jevovém poli A v pravděpodobnostním prostoru (Q,A,P). Podmíněná pravděpodobnost P{A\H) jevu A e A vzhledem k jevu H je definována vztahem P{A\H) P(A n H) □ S Připomeňme, že formalizovat takové úvahy umíme následovně. Definice Nechť /-/je jev s nenulovou pravděpodobností v jevovém poli A v pravděpodobnostním prostoru (Q,A,P). Podmíněná pravděpodobnost P{A\H) jevu A e A vzhledem k jevu H je definována vztahem P{A\H) P(A n H) Přirozená definice nezávislosti je, že hypotéza H a jev A jsou nezávislé tehdy, je-li P (A) = P(A\H). Z výše uvedeného snadno vyplývá symetričtější definice: □ g - = Připomeňme, že formalizovat takové úvahy umíme následovně. Definice Nechť /-/je jev s nenulovou pravděpodobností v jevovém poli A v pravděpodobnostním prostoru (Q,A,P). Podmíněná pravděpodobnost P{A\H) jevu A e A vzhledem k jevu H je definována vztahem P{A\H) P(A n H) Přirozená definice nezávislosti je, že hypotéza H a jev A jsou nezávislé tehdy, je-li P (A) = P(A\H). Z výše uvedeného snadno vyplývá symetričtější definice: Definice Říkáme, že jevy A a B jsou nezávislé, jestliže P(AnB) = P(A)P(B). Definice Říkáme, že jevy -4i,42,... jsou nezávislé, jestliže pro každou /c-tici Aj1} ■ ■ ■ ,Ajk z nich platí p UK■ =IPW- u=i / j=l u S ~ = ■€. ^Q.O' Definice Říkáme, že jevy -4i,42,... jsou nezávislé, jestliže pro každou /c-tici Aj1} ■ ■ ■ ,Ajk z nich platí \J=1 j=l Příklad ^ V / = Ai urně jsou 4 lístky označené 000, = 1,2,3 náhodné jevy = {náhodně vytažený lístek má 110, na / 101, -tém 011. Uvažujme místě 1}. pro Definice Říkáme, že jevy A\,A2,... jsou nezávislé, jestliže pro každou /c-tici Aj1} ■ ■ ■ ,Ajk z nich platí p UK■ =IPW- U=1 j'=i Příklad V urně jsou 4 lístky označené 000, 110, 101, 011. Uvažujme pro / = 1, 2, 3 náhodné jevy A; = {náhodně vytažený lístek má na /-tém místě 1}. Snadno se vidí, že P(Ai) = P(A2) = P(A3) = \, dále, že P{A1 n A2) = P{A1 n A*) = P(A2 n A3) = | P{AX n A2 n 43) = 0. a ze Definice Říkáme, že jevy Ai,A2,... jsou nezávislé, jestliže pro každou /c-tici Aj1} ■ ■ ■ ,Ajk z nich platí p UK■ =IP(A>). U=1 j'=i Příklad V urně jsou 4 lístky označené 000, 110, 101, 011. Uvažujme pro / = 1, 2, 3 náhodné jevy A; = {náhodně vytažený lístek má na /-tém místě 1}. Snadno se vidí, že P(AX) = P(A2) = P(A3) = \, dále, že P{Ai n A2) = P{AX n A3) = P{A2 n A3) = \ a že P (Ai n A2 n ^3) = 0. Jevy Ai,A2, A3 jsou tedy po dvou nezávislé, ale nejsou nezávislé. OOOOOOOOOOOO0OOO Bayesovy věty Přepsáním formule pro podmíněnou pravděpodobnost dostáváme P(AnB) = P(BnA) = P{A)P{B\A) = P{B)P{A\B). Věta (Bayesovy věty) Pro pravděpodobnost jevů A a B platí OP(A\B) = ^^. O P(A\B) - ______P(A)P(B\A)______ OOOOOOOOOOOO0OOO Bayesovy věty Přepsáním formule pro podmíněnou pravděpodobnost dostáváme P(AnB) = P(BnA) = P{A)P{B\A) = P{B)P{A\B). Věta (Bayesovy věty) Pro pravděpodobnost jevů A a B platí OP(A\B) = ^^. O P(A\B) - ______P(A)P(B\A)_____ První tvrzení je přepsáním předchozí formule, druhé z prvého plyne dosazením P{B) = P{A)P{B\A) + P{AC)P{B\AC). D Předpokládejme, že krevní test na HIV pozitivní osoby má 99% správnost v případě osoby skutečně HIV pozitivní (vysoká citilivost -sensitivity). Zároveň předpokládejme, že u HIV negativní osoby dopadne test pozitivně v 0,2% případů (relativně vysoká specifičnost - specificity). Předpokládejme, že krevní test na HIV pozitivní osoby má 99% správnost v případě osoby skutečně HIV pozitivní (vysoká citilivost -sensitivity). Zároveň předpokládejme, že u HIV negativní osoby dopadne test pozitivně v 0,2% případů (relativně vysoká specifičnost - specificity). Náhodně z populace vybereme osobu a otestujeme pozitivně. S jakou pravděpodobností je skutečně HIV pozitivní, jestliže četnost výskytu HIV v populaci je p promile (tj. p osob z tisíce je skutečně HIV pozitivní). Príklad - preventivní screening Předpokládejme, že krevní test na HIV pozitivní osoby má 99% správnost v případě osoby skutečně HIV pozitivní (vysoká citilivost -sensitivity). Zároveň předpokládejme, že u HIV negativní osoby dopadne test pozitivně v 0,2% případů (relativně vysoká specifičnost - specificity). Náhodně z populace vybereme osobu a otestujeme pozitivně. S jakou pravděpodobností je skutečně HIV pozitivní, jestliže četnost výskytu HIV v populaci je p promile (tj. p osob z tisíce je skutečně HIV pozitivní). Označme A jev, že je daná osoba HIV pozitivní, a B jev, že daná osoba má pozitivní test. Dle druhé Bayesovy věty je hledaná pravděpodobnost P(A\B) p/1000•99/100 p/1000 • 99/100 + (1000 - p)/1000 • 2/1000 □ S Jestliže zvolíme za p nějaké konkrétní četnosti, dostaneme příslušné očekávatelné spolehlivosti testu. V následující tabulce je spočten výsledek pro několik p: P 100 10 1 0,1 P(A\B) 0,982 0,8333 0,3313 0,0471 Výsledek asi neodpovídá naší intuici a může se zdát šokující ve vztahu k použití takovýchto testů. Príklad - preventivní screening, pokr. Jestliže zvolíme za p nějaké konkrétní četnosti, dostaneme příslušné očekávatelné spolehlivosti testu. V následující tabulce je spočten výsledek pro několik p: P 100 10 1 0,1 P(A\B) 0,982 0,8333 0,3313 0,0471 Výsledek asi neodpovídá naší intuici a může se zdát šokující ve vztahu k použití takovýchto testů. Poznámka Sami si můžete podobný výpočet udělat pro tzv. triple test na Downův syndrom, prováděný ve 2. trimestru těhotenství s 90% citlivostí a 5% „false-positive rate" či pro statistiky svého oblíbeného spamfilteru (např. SpamAssassin s někde udávanou citlivostí 99,64% a specifičností 98.23%). Evidentně prostý výběr náhodné osoby a použití jediného testu, byť velmi citlivého a specifického, nejsou vhodné ani na otestování skutečného stavu populace, ani na preventivní vyšetření jednotlivců, pokud nemáme další podpůrné informace a lepší nástroje. □ s Evidentně prostý výběr náhodné osoby a použití jediného testu, byť velmi citlivého a specifického, nejsou vhodné ani na otestování skutečného stavu populace, ani na preventivní vyšetření jednotlivců, pokud nemáme další podpůrné informace a lepší nástroje. Právě matematická statistika dává nástroje na kvalifikovanější postupy v medicínské i průmyslové diagnostice, ekonomických modelech, vyhodnocování experimentálních dat atd. □ s Q Pravděpodobnost nebo statistika? Prax Náhodné veličiny n S - = -E -00*0 Vratme se k jednoduchému a názornému příkladu statistik kolem výsledků studentů v daném předmětu, který je a není podobný klasické pravděpodobnosti a s ní související statistice při házení kostkou. Vratme se k jednoduchému a názornému příkladu statistik kolem výsledků studentů v daném předmětu, který je a není podobný klasické pravděpodobnosti a s ní související statistice při házení kostkou. Na jedné straně jsme připustili pouze konečný počet možných bodových hodnocení (celá čísla od 0 do 30), zároveň ale není patrně vhodné představovat si výsledky jednotlivých studentů jako analogii nezávislého házení kostkou (to by byla skutečně divně vedená přednáška). Vratme se k jednoduchému a názornému příkladu statistik kolem výsledků studentů v daném předmětu, který je a není podobný klasické pravděpodobnosti a s ní související statistice při házení kostkou. Na jedné straně jsme připustili pouze konečný počet možných bodových hodnocení (celá čísla od 0 do 30), zároveň ale není patrně vhodné představovat si výsledky jednotlivých studentů jako analogii nezávislého házení kostkou (to by byla skutečně divně vedená přednáška). Místo toho máme na základním prostoru Q všech studentů definovánu funkci bodového ohodnocení X : Q —> R. Je to typický příklad náhodné veličiny. U každé náhodné veličiny potřebujeme umět pracovat s vhodnou množinou jevů. Zpravidla požadujeme, abychom mohli pracovat s pravděpodobnostmi příslušnosti hodnoty X do předem zadaného intervalu. Přirozenější interpretací výsledku pokusu je totiž často spise než zjištění, zda náhodný jev nastal či nenastal, nějaká hodnota: • součet bodů na dvou kostkách, □ s Přirozenější interpretací výsledku pokusu je totiž často spise než zjištění, zda náhodný jev nastal či nenastal, nějaká hodnota: • součet bodů na dvou kostkách, • počet bakterií v daném množství roztoku nebo □ s Přirozenější interpretací výsledku pokusu je totiž často spise než zjištění, zda náhodný jev nastal či nenastal, nějaká hodnota: • součet bodů na dvou kostkách, • počet bakterií v daném množství roztoku nebo • počet studentů, kteří uspěli u zkoušky. Přirozenější interpretací výsledku pokusu je totiž často spise než zjištění, zda náhodný jev nastal či nenastal, nějaká hodnota: • součet bodů na dvou kostkách, • počet bakterií v daném množství roztoku nebo • počet studentů, kteří uspěli u zkoušky. Přirozenější interpretací výsledku pokusu je totiž často spise než zjištění, zda náhodný jev nastal či nenastal, nějaká hodnota: • součet bodů na dvou kostkách, • počet bakterií v daném množství roztoku nebo • počet studentů, kteří uspěli u zkoušky. Od pravděpodobnostního prostoru (Q,A, P) tedy potřebujeme přejít k obdobné dvojici (R, £>) tak, abychom podmnožinám R, ležícím v cr-algebře B byli schopni přiřadit pravděpodobnost odvozenou z (Q, A, P). Na prostoru R uvažujme nejmenší jevové pole B obsahující všechny /(-rozměrné intervaly. Množinám v B říkáme borelovske množiny (nebo také měřitelné množiny) na Rfc. Na prostoru R uvažujme nejmenší jevové pole B obsahující všechny /(-rozměrné intervaly. Množinám v B říkáme borelovske množiny (nebo také měřitelné množiny) na Rfc. Speciálně pro k = 1 jde o množiny, které obdržíme z intervalů konečnými průniky a nejvýše spočetnými sjednoceními. Na prostoru Rfc uvažujme nejmenší jevové pole B obsahující všechny /(-rozměrné intervaly. Množinám v B říkáme borelovske množiny (nebo také měřitelné množiny) na Rfc. Speciálně pro k = 1 jde o množiny, které obdržíme z intervalů konečnými průniky a nejvýše spočetnými sjednoceními. Definice Náhodná veličina je taková funkce X každou Borelovskou borelovsky měřitelní Množinová funkce X na pravděpodobnostním prostoru (Q,A, P) Q -► R, že vzor X~1{B) patří do A pro množinu B G B na R (tj. X : Q -► R je tzv. 0- PX(B) = PiX-1 (B)) se nazývá rozdělen ' pravděpodobnost náhodné veličiny X. Na prostoru Rfc uvažujme nejmenší jevové pole B obsahující všechny /(-rozměrné intervaly. Množinám v B říkáme borelovske množiny (nebo také měřitelné množiny) na Rfc. Speciálně pro k = 1 jde o množiny, které obdržíme z intervalů konečnými průniky a nejvýše spočetnými sjednoceními. Definice Náhodná veličina X na pravděpodobnostním prostoru (Q,A, P) je taková funkce X : Q —> R, že vzor X_1(ß) patří do „4 pro každou Borelovskou množinu B G B na R (tj. X : Q —> R je tzv. borelovsky měřitelná). Množinová funkce PX{B) = P{X-\B)) se nazývá rozdělení pravděpodobnosti náhodné veličiny X. Náhodný vektor (Xi,... ,Xk) na (Q, A, P) je /c-tice náhodných veličin. Definice náhodné veličiny zajišťuje, že pro všechny —oo < a < b < oo existuje pravděpodobnost P(a < X < b), kde používáme stručné značení projev A = (w G Q; a < X{uo) < b)). Definice Distribuční funkcí (distribution , cumulative density function) náhodné veličiny X je funkce F :R- ^Rdef novaná pro všechny x G R vztahem F(x) = P(X R definovaná pro všechny (xi,..., .. ,X/() je funkce Xk) G Rfc vztahem F(x ) = P(Xi < xi A • •AXt xn. Q Je-li X spojitá, pak je F(x) diferencovatelná a její derivace se rovná hustotě X, tj. platí F'(x) = f{x). □ s o ■š ► ■= -O QvO