Pravděpodobnost a popisná statistika Helena Durnová 22. března 2012 Obsah 1 Úvodní poznámky 2 1.1 Náhodné jevy........................... 2 1.2 Závislé a nezávislé jevy ..................... 3 1.3 Příklady: jevové pole....................... 3 2 Klasická pravděpodobnost 4 2.1 Geometrická pravděpodobnost ................. 4 3 Bayesův vzorec 6 3.1 Podmíněná pravděpodobnost.................. 6 3.2 Úplná pravděpodobnost..................... 7 4 Popisná statistika 8 4.1 Distribuční funkce........................ 8 5 Pravděpodobnost a popisná statistika 1 - otázky a příklady ke kolokviu 12 1 Kapitola 1 Úvodní poznámky Toto je pracovní verze studijního textu pro předmět Pravděpodobnost a popisná statistika pro studenty matematiky Pedagogické fakulty Masarykovy univerzity v Brně. Obtížnější příklady jsou označeny hvězdičkou (*). Připomínky vítám. Pište, prosím, na adresu hdurnova@ped.muni.cz 1.1 Náhodné jevy Motivační úloha Jaká je pravděpodobnost toho, že při současném hodu dvěma kostkami padne číslo 10? Možné součty: 10 = 6 + 4 = 5 + 5 Jaká je pravděpodobnost toho, že při současném hodu dvěma kostkami padne číslo 9? Možné součty: 9 = 6 + 3 = 5+ 4 Možných rozkladů čísel 9 a 10 je stejně, přesto součet 9 padá častěji než součet 10 (empiricky zjištěno). Náhodný pokus Definice 1.1 Neprázdnou množinu všech možných výsledků náhodného pokusu nazýváme základní prostor a označujeme íž. Prvky množiny íž označujeme ut, kde t £ T je vhodný index. Definice 1.2 Systém podmnožin A základního prostoru íž, který a) obsahuje základní prostor; b) s každými dvěma podmnožinami obsahuje i jejich rozdíl; a c) s každým konečným [spočetným] systémem množin obsahuje i jejich sjednocení nazýváme jevové pole. 2 1.2 Závislé a nezávislé jevy Závislé jevy: opakované výběry bez vracení - používáme větu o násobení pravděpodobností Nezávislé jevy: opakované výběry s vracením, opakované hody kostkou - pravděpodobnosti násobíme 1.3 Příklady: jevové pole Náhodný pokus: házení kostkou Možné výsledky: 1, 2, 3, 4, 5, 6; tj. íž = {1,2,3,4,5,6} (jednotlivá čísla označují skutečnost, že padlo dané číslo) A = {0, 0} — triviální jevové pole [Otázka: musí být prázdná množina prvkem A?] B = {0,0, {2,4,6}} C = {0,O,{1,3,5},{2,4,6}} V = {0, íž, {1}, {2}, {3}, {4}, {5}, {6}} Náhodný jev: libovolný prvek jevového pole (množina). [Úkol: nazvěte některé náhodné jevy podle A,B,C, V.\ Definice 1.3 Dvojice (Cl, A) se nazývá měřitelný prostor. Označení: Jev jistý: Cl Jev nemožný: 0 Jev elementární: u pro lú £ íž Společné nastoupení jevů A{: G IAi Nastoupení alespoň jednoho z jevů A-i: \ \i G IAi Jev opačný k jevu A: Aí = Q \ Aí Definice 1.4 Pravděpodobností rozumíme reálnou množinovou funkci P : A —)■ R, která je a) nezáporná; b) spočetně aditivní; a c) normovaná. Trojici (Q,A,P) (tj. základní prostor, jevové pole, pravděpodobnostní funkce) nazýváme pravděpodobnostní prostor. 3 Kapitola 2 Klasická pravděpodobnost P(A) - ^> (počet příznivých jevů lomeno počet všech možných jevů). Lze použít pouze tehdy, jsou-li pravděpodobnosti všech elementárních jevů stejné. Věta 2.1 (Věta o sčítání pravděpodobností) Nechť A±, a2,..., An £ A jsou libovolné jevy. Pak platí: n n n—l n iai i=i i=i j=i+i ■ ■ ■ + (-i)n-1p(A1n A2n.. .n An) Příklad 2.2 Z množiny zvané základní soubor rozsahu n vybereme k-krát po jednom prvku, který vždy vrátíme zpět. Získáme uspořádanou k-tici, která se nazývá uspořádaný výběrový soubor k prvků s vracením. Předpokládejme, že v základním souboru je právě r prvků označeno. Vypočtěte pravděpodobnosti jevů A, B, C, které jsou definovány takto: A - každý z prvků základního souboru se ve výběrovém souboru vyskytne nejvýše jedenkrát B - předem daný prvek základního souboru se ve výběrovém souboru vyskytne nejvýše jedenkrát C - ve výběrovém souboru se vyskytne právě x označených prvků 2.1 Geometrická pravděpodobnost P(A) ~ ^ F[A) ~ V(E) Buffonova úloha o jehle - řešení i s obrázky viz http://mant.upol.cz/soubory/OdevzdanePrace/B08/b08-20-ls.pdf 4 Kapitola 3 Bayesův vzorec 3.1 Podmíněná pravděpodobnost Nechť je dán základní prostor íž, jev A a jev B. Pravděpodobnost toho, že za podmínky B nastal jev A, vypočteme takto: P(A\B)-P(AnB^ P{B) Např. ÍŽ{1, 2, 3, 4, 5, 6} - výsledky hodu kostkou jev A = {3,4, 5, 6} - padne číslo větší než 2 jev B = {1,6} - padne 1 nebo 6 P{A) = \,P{B) = \ P{A\B) = \ = \ 3 Z Násobení pravděpodobností Z klasické definice pravděpodobnosti víme, že P{ADB) = \n\ Problém: jak určit \A D B\l Ze vzorce pro podmíněnou pravděpodobnost plyne, že P(Ar\B) = P(A\B)P(B) a analogicky P(Ar\B) = P(B\A)P(A) Pro pravděpodobnost průniku 3 a více jevů A±, a2,..., An pak platí: 5 p(Ai n a2 n... n an) = p(a1)p(a2\a1) ■ ■ • P(An|Ai n a2 n... n An_x) Definice 3.1 (Nezávislé jevy) Říkáme, že jev a nezávisí na jevu b, pokud platí p{a\b) = p (a) a pak tedy také p(B\a) = p {B) Zřejmě potom platí, že p(ahb) = p{a)p{b) Sčítání pravděpodobností Vyjdeme-li z klasické definice pravděpodobnosti, zřejmě a = (a n b) U (a n B), kde -B je doplněk jevu b. Tedy p(a) = p{a n b) + p {a n b) Dále zřejmě p {a U b) = p(a) + p {B) - p {a n B) Pro pravděpodobnost sjednocení více jevů použijeme princip inkluze a exkluze. 3.2 Upíná pravděpodobnost p(a) = p(b1)p(a\b1) + p{b2)p{a\b2) + ■■■ + p{bn)p{a\bn) Bayesova věta odpovídá na otázku, jaká je pravděpodobnost, že nastal jev Bi, víme-li, že nastal jev A: Yrk=lp{bk)p{a\bk 6 Kapitola 4 Popisná statistika Kdy nestačí klasická dennice pravděpodobnosti? - geometrická pravděpodobnost je jen model klasické pravděpodobnosti - podstatné: nastoupení lib. jevu má stejnou možnost, tj. žádný jev nemá přednost před ostatními Statistická definice pravděpodobnosti - nazývaná také frekvenční či empirická Opakujeme-li n-krát nezávisle daný pokus a nastane-li v těchto pokusech sledovaný jev A m-krát, potom jeho relativní četnost je rovna zlomku m/n. Bude-li při rostoucím počtu pokusů relativní četnost kolísat ve stále užších mezích kolem určitého čísla, můžeme předpokládat, že toto číslo je pravděpodobností jevu A. - absolutní četnost - relativní četnost Borelovské pole a borelovská množina: Minimální jevové pole na lZn obsahující třídu všech intervalů (—00, x\ > x (—oo,a?2 > x (—00,0:3 > ••• x (—00, xn_i > x(—oo,xn_i > se nazývá borelovské pole, jeho prvky borelovské množiny. Náhodná veličina formálně: Nechť (fž, A, P) je pravděpodobnostní prostor. Zobrazení X : íž —> 1Z se nazývá náhodná veličina (vzhledem k jevovému poli A), právě tehdy, když úplný vzor každé borelovské množiny je jevem, tj. MB B : {lo G íí : Xlo G B} G A. Náhodná veličina může být diskrétní nebo spojitá. 4.1 Distribuční funkce • neklesající 7 • zprava spojitá • linxji^oo $(x) = 1, lim^^-oo $(x) = 0 • 0 < $(x) < 1 • pro xq £ M platí: P{X = x) = ${xq) — \imx^x - §{x) • pro a,b eR,a < b platí p (a < X < b) = $(&) - 3>(a) Diskrétní náhodná veličina • pravděpodobnostní funkce ir{x) — nezáporná — normovaná, tj. Yl^oo71^) = 1 • distribuční funkce: <&(x) = Y2t=-oo vr(í) Spojitá náhodná veličina • hustota pravděpodobnosti (f(x) — nezáporná — normovaná, tj. tp(x) = 1 • distribuční funkce 3>(x) = Jf=_00 tp(t)dt Základní a výběrový soubor • základní soubor E (neprázdná množina) • podmnožina základního souboru G - prvky s danou vlastností • výběrový soubor (neprázdná podmnožina výběrového souboru) • rozsah výběrového souboru n • absolutní četnost G ve výběrovém souboru N(G) • relativní četnost G ve výběrovém souboru p{G) = N^ 8 Vlastnosti relativní četnosti • p(0) = 0 • 0 < p(G) < 1 . p(E) = 1 • P(G) < 1 • p(G)+P(G) = l . p{G1 U G2) + (Gi n G2) = +p(G2) . l + (GinG2) >p(G!)+p(G2) . p(GiUG2) + 0
P(G2 \ G2) = p(G2) - p(Gi) • G1 CG2^P(G1)