Pravděpodobnost Počet pravděpodobnosti 3 3. Počet pravděpodobnosti Cíl kapitoly Teorie pravděpodobnosti tvoří samostatnou vědní disciplínu. Následující dvě kapitoly Vás seznámí s některými základními pasážemi této teorie. Výběr pojmů, kterými se budeme zabývat, je zvolen s ohledem na základní poslání těchto kapitol. Měly by sloužit především jako teoretická báze pro následující složitější úvahy. Vybraných pojmů z teorie pravděpodobnosti je využíváno v oblasti konstrukce bodového a intervalového odhadu (kapitola 5), statis- tických testů (kapitola 6 a 7) a s také regresního a korelačního počtu (s těmito pojmy se seznámíte ve druhé části tohoto předmětu). V této kapitole Vás uvedeme do základních pojmů z teorie pravděpodobnosti, které vycházejí z její definice. V této souvislosti budete seznámeni s některými základním vztahy a vlastnostmi při počítání s pravděpodobnostmi. Kapitola Vás také seznámí s některými pojmy a veličinami z kombinatoriky, které jsou při výpočtu pravděpodobnosti nezbytné. Časová zátěž 4 hodiny (4. týden v říjnu) Pojem " pravděpodobnost" je často užívaným vyjádřením nejistoty ohledně výsledku nějaké činnosti, projektu, stavu či události. Hledání pravděpodob- nosti souvisí s mírou této nejistoty, kdy máme k dispozici pouze sadu indicií, na jejichž základě se domníváme na konkrétní podobu výsledku této činnosti. Všechny situace, posuzované v rámci hledání jejich pravděpodobnosti je mož- no zahrnout pod souhrnné označení jev. V praxi můžeme rozdělit na tři typy ­ jevy jisté, nemožné a náhodné. Jev jistý Jev jistý je možno charakterizovat jako jev, při němž při dodržení určitých podmínek nastane vždy stejný výsledek. Obvyklým příkladem jevu jistého jsou například fyzikální zákony. (Zahřejeme-li vodu na 100 stupňů celsia, dojde za normálních podmínek k jejímu varu.) Jev nemožný Opakem jevu jistého je jev nemožný. Je možno jej charakterizovat jako jev, kdy při dodržení určitých podmínek určitý výsledek ne- nastane nikdy. (Zahřejeme-li vodu na 100 stupňů celsia, nikdy se nezmění v led.) Jev náhodný Všechny ostatní typy jevů jsou zahrnovány pod označení náhodného jevu. Náhodným jevem je tedy takový jev, při němž i při dodržení stejných podmínek mohou nastat různé výsledky. (Není možné, aby v každém měsíci roku byl počet nezaměstnaných osob stále stejný, ne- bot' jejich počet je dán nejen objektivními důvody ­ např. ekonomické prostředí, ale i nepředpokládanými faktory ­ například impulsivní roz- hodnutí pracovníka o podání výpovědi). 44 Při zkoumání ekonomických vztahů a závislostí se budeme prakticky výhrad- ně setkávat s náhodnými jevy. Náhodné jevy jsou označovány jako výsledky náhodných pokusů. (Náhodným pokusem je v našem příkladě například hod- nota počtu nezaměstnaných osob v příslušném měsíci roku.) Pojem náhodného jevu je výchozím pojmem počtu pravděpodobnosti. Pro formální účely (např. výpočty) jsou jednotlivé náhodné jevy zpravidla o- značovány velkými písmeny abecedy (A, B, C, . . . ). Pro náhodné jevy platí některé typické vlastnosti a vztahy: Rovnocenné jevy A = B pokaždé, kdy nastal jev A, nastává také jev B a naopak. Průnik jevů A B jev A nastane současně s jevem B. Průnik bývá nazýván logickým součinem jevů. Sjednocení jevů A B pokud nastane alespoň jeden z jevů A a B. Sjednocení bývá nazýváno logickým součtem jevů. Pro sjednocení dvou jevů platí, že A B = A + B. Rozdíl jevů A - B jestliže nastane jev A a současně nenastane jev B, neboli A-B = AB. Jev opačný k jevu A jev, jenž spočívá v nenastoupení jevu A. Označuje tedy jev " nenastane A". Neslučitelné jevy A B = jestliže výskyt jednoho z jevů vylučuje výskyt druhého jevu. Budeme uvažovat náhodný pokus hod klasickou herní kostkou. Náhodným jevem potom je hodnota (počet bodů), která při jednotlivých hodech padne. Příkladem sjednocení jevů je například jev, kdy sledujeme, zda na kostce budou alespoň tři body (jedná se o sjednocení jevů ­ padne jeden, dva či tři body). Průnikem jevů " padne 3" a " padne 1" by byl jev " na kostce je alespoň jeden bod". 3.1 Pravděpodobnost K pojmu pravděpodobnost je možno přistoupit ze dvou pohledů. Výchozím je tzv. klasický přístup, kdy vycházíme z předpokladu, že všechny jevy jsou rovnocenné a vzájemně se vylučují. Žádný jev tedy není zvýhodněn proti jinému, každý z výsledků náhodného pokusu očekáváme stejně. V případě, že uvedené podmínky nejsou dodrženy, či není možno zajistit jejich ověření, je nutno zvolit tzv. statistický přístup k definování pravděpodobnosti. 3.1.1 Klasická definice pravděpodobnosti Klasická pravděpodobnost Necht' může při určitém pokusu dojít k n stejně možným výsledkům, z nichž m má za následek nastoupení jevu A, zatímco zbylých n - m jej vylučuje. 45 3. Počet pravděpodobnosti Pak pravděpodobnost jevu A je rovna podílu všech příznivých jevů A (tedy výsledků, kdy nastává jev A) k počtu všech možných jevů (výsledků). Tedy platí P(A) = m n . Pravděpodobnost může nabývat hodnot mezi nulou a jednou, tedy pro prav- děpodobnost libovolného jevu A platí 0 P(A) 1, kde 0 označuje pravděpodobnost jevu nemožného a 1 je pravděpodobnost jevu jistého. Pravděpodobnost je udávána obvykle v procentním vyjádření. Lze tedy například říci, že pravděpodobnost jevu jistého je stoprocentní. Příklad 3.1 Určete pravděpodobnost, že při hodu klasickou šestistěnnou hrací kostkou (1 ­ 6 bodů na jednotlivých stranách) padne a) 5 bodů, b) nepadne 5, c) sudé číslo. Řešení Při hodu hrací kostkou je k dispozici šest různých výsledků, které se vzájemně vylučují. Platí tedy, že n = 6. a) Jev A představuje jev " padne pětka". Počet příznivých výsledků, tedy jevů, při nichž nastává jev A je m = 1 (nebot' na kostce je jen jedna pětka). Proto pravděpodobnost, že padne 5 je rovna b) Pravděpodobnost jevu " nepadne pětka" lze vypočítat dvěma způsoby. Bud' vyjdeme z toho, že tento jev představuje jev opačný k jevu A a jeho pravděpodobnost je rovna rozdílu jedné a pravděpodobnosti jevu A (viz výše). Platí tedy P(A) = 1 - P(A) = 1 - 0,167 = 0,833 = 83,3%. Nebo dosadíme přímo do definičního vztahu. Počet všech příznivých jevů m je roven počtu všech výsledků, při nichž nepadne pětka. Tedy se jedná o jevy " padne jednička", " padne dvojka", " padne trojka", " padne čtyřka" a " padne šestka". Platí P(A) = m n = 5 6 = 0,833 = 83,3%. c) Jev " padne sudé číslo" představuje jev, při němž tvoří množinu příz- nivých výsledků tři jevy ­ " padne dvojka", padne " čtyřka" a " padne šestka". Pravděpodobnost, že padne sudé číslo je tedy rovna P(A) = m n = 3 6 = 0,5 = 50%. 46 Příklad 3.2 Při zkoušce ze statistiky tvoří zkouškové okruhy 30 otázek. U zkoušky si student náhodně vytáhne 3 z nich. K úspěšnému absolvování zkoušky postačí, aby zkoušený student odpověděl správně na 2 z vytažených otázek. Student Martin se před zkouškou nestihl připravit na všechny otázky, je přesvědčen pouze o 70% z nich, že by je zodpověděl správně. Určete pravděpodobnost, že Martin u zkoušky uspěje a vytáhne si právě dvě otázky, na které zná odpověd'. Řešení Počet všech jevů n tedy určíme jako všechny trojice z třiceti prvků, což je kombinační číslo n = 30 3 . Počet všech příznivých jevů m pak určíme jako všechny příznivé možnosti, které jsou nakloněny nastoupení tohoto jevu. Aby student zkoušku vykonal, musí si vytáhnout dvě otázky, které ovládá, což jsou všechny dvojice z 21 prvků (které tvoří 70% otázek, které student ovládá). Třetí vytažená otázka již může padat mezi ty otázky, které již student neovládá. Budou to tedy všechny jednočlenné množiny z 9 prvků. Výsledný počet příznivých možností je tedy roven: m = 21 2 9 1 . Hledanou pravděpodobnost vypočítáme dosazením do definičního vztahu. Dostáváme P(A) = 21 2 9 1 30 3 = 2120 21 9 1 302928 321 = 210 9 5 29 28 = 0,466 = 46,6%. Pravděpodobnost, že si Martin vytáhně právě dvě otázky, které ovládá, je přibližně 47%. Výpočet kombinačních čísel a vlastnosti při počítání s nimi je samostatnou částí teorie pravděpodobnosti. Jejich základní nástin je uveden v příloze této kapitoly. Více naleznete například v klasických učebnicích matematiky pro střední školy, nebo v Přehledu středoškolské matematiky od J. Poláka na stranách 288­300. 3.1.2 Statistická definice pravděpodobnosti V případě, že nejsou splněny podmínky pro použití klasické definice pravdě- podobnosti, nebo chceme-li ověřit splnění podmínky o stejně možných všech výsledcích náhodného pokusu, provedeme jeho hromadné (mnohonásobné) opakování a jejich statistické vyhodnocení. Určíme počet pokusů, ve kterých nastal sledovaný jev A (tedy jeho četnost) a určíme jeho relativní četnost p(A). Při rostoucím počtu na sobě nezávisle provedených pokusů, má tato 47 3. Počet pravděpodobnosti relativní četnost tendenci kolísat kolem určité číselné hodnoty. Tuto hod- notu je možno považovat za pravděpodobnost jevu A. Uvedená skutečnost je východiskem pro tzv. statistickou definici pravděpodobnosti, která zní: Provádíme-li dostatečně velký počet pokusů, v nichž zaznamenáváme výskyt jevu A, pak hodnota relativní četnosti výskytu tohoto jevu kolísá kolem určité hodnoty, kterou nazýváme pravděpodobností P(A) jevu A. Tedy platí P(A) = m n , kde m je absolutní četnost výskytu jevu A a n je celkový počet pokusů. Pro hodnotu pravděpodobnosti ve smyslu statistické definice platí stejná pra- vidla jako pro pravděpodobnost ve smyslu klasické definice. Pro pravděpo- dobnost ve smyslu statistické definice navíc platí, že při rostoucím počtu pokusů se snižuje kolísání kolem pevné hodnoty a dostáváme tak přesnější výsledek. Příklad 3.3 V pěti pracovních dnech prvního týdne provozu nové výrobní linky byla zjišt'ována její spolehlivost. Byl zaznamenáván počet vadných kusů v jednot- livých dnech. Zjištěné hodnoty jsou v následující tabulce: pracovní den celkový počet vyrobených součástek počet vadných kusů Pondělí 1506 46 Úterý 1442 42 Středa 1334 41 Čtvrtek 1706 53 Pátek 1205 36 Odhadněte nejpravděpodobnější počet vadných součástek, které daná linka vyprodukuje za celý měsíc, je-li předpokládán měsíční objem výroby 30 000 kusů. Řešení Abychom určili počet vadných kusů za celý měsíc, určíme nejprve pravděpo- dobnost výskytu vadného kusu. Tuto pravděpodobnost určíme pomocí její statistické definice, tedy pomocí relativních četností vadných kusů v rámci celého objemu výroby. V případě, že tyto relativní četnosti budou kolísat velmi málo kolem jejich průměrné hodnoty, lze ztotožnit tuto hodnotu s prav- děpodobností. Výsledky jsou v následující tabulce: 48 pracovní den celkový počet vyrobených součástek počet vadných kusů relativní četnost Pondělí 1506 46 0,0305 Úterý 1442 42 0,0291 Středa 1334 41 0,0307 Čtvrtek 1706 52 0,0305 Pátek 1205 36 0,0299 Průměr 0,0302 Pravděpodobnost výskytu vadné součástky je tedy 0,0302, neboli 3,02%. Při měsíčním objemu výroby (O) bude pravděpodobný počet vadných (V ) součástek roven V = P(A) O = 0,0302 30000 906 výrobků. 3.1.3 Pravidla pro počítání s pravděpodobnostmi Pravděpodobnost sjednocení dvou jevů je rovna součtu pravděpo- dobnosti jednotlivých jevů zmenšené o pravděpodobnost průniku (tedy jevu, kdy nastanou oba jevy současně). P(A B) = P(A) + P(B) - P(A B) V případě, že se jedná o jevy neslučitelné (jejich průnik je roven nule) je pravděpodobnost sjednocení rovna součtu pravděpodobností P(A B) = P(A) + P(B). Pravděpodobnost průniku dvou jevů (současného nastoupení dvou jevů) u nezávislých jevů lze určit jako součin pravděpodobností jed- notlivých jevů. P(A B) = P(A) P(B) Pravděpodobnost opačného jevu k jevu A určíme jako doplněk pravděpodobnosti jevu A do jedné P(A) = 1 - P(A). Příklad 3.4 Určete pravděpodobnost, že při hodu dvěma hracími kostkami a) padne alespoň jedna šestka (jev A), b) padne součet 7 nebo součet 8 (jev B), c) nepadne ani součet 7, ani součet 8. 49 3. Počet pravděpodobnosti Řešení Počet všech jevů n tedy určíme jako všechny možných výsledků. Jelikož házíme dvěma kostkami, je počet možných výsledků 62 = 36. a) Jev A (padne šestka alespoň na jedné kostce), lze vyjádřit jako sjedno- cení dvou dílčích jevů A1 (první kostka) a A2 (druhá kostka). Hledáme tedy pravděpodobnost sjednocení dvou jevů a můžeme užít prvního pravidla P(A B) = P(A) + P(B) - P(A B). Pravděpodobnost jevu A1, resp. A2 je rovna pravděpodobnosti, že pad- ne šestka na jedné kostce tedy 1/6. Pravděpodobnost průniku obou jevů je pravděpodobnost, že na obou kostkách padne 6. Jelikož k danému jevu může dojít pouze v jednom ze všech možných výsledků, je tato pravděpodobnost rovna 1/36. Pro celkovou pravděpodobnost tedy do- stáváme P(A) = P(A1 A2) = P(A1) + P(A2) - P(A1 A2) = = 1 6 + 1 6 - 1 36 = 11 36 = 0,306 = 30,6%. b) Opět vyjádříme jev B jako sjednocení dvou jevů B1 (na kostkách padne součet 7) a B2 (padne součet 8). Ve prospěch nastoupení jevu B1 hovoří 6 příznivých výsledků (výsledky 1+6, 2+5, 3+4, 4+3, 5+2, 6+1), jeho pravděpodobnost je tedy rovna P(B1) = 6 36 . Podobně spočítám pravděpodobnost jevu B2 (v jeho prospěch hovoří 5 výsledků 2+6, 3+5, 4+4, 5+3, 6+2). Jeho pravděpodobnost tedy určíme jako podíl příznivých a všech možných jevů, tedy jako P(B2) = 5 36 . Celkovou pravděpodobnost jevu B určíme jako součet těchto dílčích hodnot, nebot' pravděpodobnost průniku je rovna 0 (nelze očekávat, že součet bude 7 a zároveň 8). Platí tedy P(B) = P(B1 B2) = P(B1) + P(B2) - P(B1 B2) = = 6 36 + 5 36 = 11 36 = 0,306 = 30,6%. c) Jev C lze považovat za jev opačný k jevu B. Proto jeho pravděpodob- nost určíme na základě 3. pravidla P(C) = 1 - P(B) = 1 - 11 36 = 25 36 = 0,694 = 69,4%. 50 Příklad 3.5 Pravděpodobnost, že výrobní linka bude pracovat po celý pracovní den bez poruch je 80%. Vypočítejte pravděpodobnost, že u dvou stejných výrobních linek nedojde během pracovního dne k poruše. Řešení Hledáme pravděpodobnost, že ani u jednoho ze strojů nedojde k poruše. Zajímá nás tedy pravděpodobnost průniku dvou jevů ­ jevu A (nedojde k poruše na první lince) a jevu B (nedojde k poruše na druhé lince). Jelikož se jedná o identické linky, lze předpokládat, že pravděpodobnost po- ruchy bude na obou linkách stejná. Stejně tak lze předpokládat, že chování jedné linky neovlivní chování druhé linky (jevy jsou tedy nezávislé). Proto můžeme užít druhého pravidla pro počítání s pravděpodobnostmi. P(A B) = P(A) P(B) = 0,8 0,8 = 0,64 = 64%. Současný provoz obou výrobních linek bude bezporuchový s pravděpodob- ností 64%. Shrnutí kapitoly Míru nejistoty ohledně výsledků nějaké ho jevu nazýváme pravděpodobností. Teorie pravděpodobnosti vychází z existence tzv. náhodného jevu, tedy jevu, jehož výsledek není předem znám. K určení konkrétní hodnoty pravděpo- dobnosti je možno využít dvou definičních vztahů. První z nich, obvykle nazývaný jako klasický, vychází z předpokladu rovnocennosti všech možných výsledků náhodného jevu. V tomto případě je pravděpodobnost počítána jako poměr výsledků, které hovoří ve prospěch sledované skutečnosti a všech možných výsledků. V případě, že nelze dodržet předpoklad rovnocennosti všech výsledků, je využíváno tzv. statistické definice pravděpodobnosti. Pravděpodobnost je potom ztotožňována s relativní četností výskytu jednotlivých výsledků. Před- pokladem užití druhé definice je však dostatečný počet měření (náhodných pokusů). Otázky k zamyšlení 1. Nalezněte a vyjmenujte některé jevy, které splňují vybrané vlastnosti (sjednocení, rozdíl, opačný jev apod.). 2. Jevy A a B jsou neslučitelné a víme, že P(A) = 0,3 a P(B) = 0,2. Určete pravděpodobnost, že ˇ nastane jev A i B, ˇ nastane A nebo B, ˇ nenastane A. 3. Ve vyrobené sérii 50 výrobků je jich 6 nekvalitních. Když se náhodně vybere 10 z nich, jaká je pravděpodobnost, že jsou mezi nimi nejvýše 2 nekvalitní? 51 3. Počet pravděpodobnosti Příloha kapitoly 3 Vybrané pojmy z kombinatoriky Kombinace Kombinací nazveme každou množinu k prvků vybraných z n prvků, přičemž se žádné z prvků neopakují (jedná se o výběr bez vracení). Počet těchto kombinací se značí C(k, n) a vypočítáme je C(k, n) = n k = n! k!(n - k)! = n (n - 1) (n - 2) . . . (n - (k + 1)) 1 2 3 . . . k Symbol n k označuje tzv. kombinační číslo. Čteme jej jako " n nad k". Vlastnosti kombinačních čísel: 1. Kombinační číslo lze vyjádřit jako n k = n! k!(n-k)! . 2. n k = n n-k 3. n k + n k+1 = n+1 k+1 4. n 0 = n n = 1 5. n 1 = n n-1 = n Příklad 3.6 Ze šesti kandidátu je do volební komise nutno vybrat tři osoby. Kolika způ- soby je to možné? Řešení Hledáme trojice ze šesti prvků, tedy kombinace 3 třídy ze šesti prvků. Počet možností určíme jako C(3, 6) = 6 3 = 6! 3!(6 - 3)! = 6 5 4 1 2 3 = 20. Příklad 3.7 Určete počet všech tanečních párů z 15 chlapců a 10 děvčat. Řešení Předpokládáme, že taneční pár tvoří výhradně dvojice chlapec­dívka. Počet všech párů proto určíme jako počet všech dvojic ze všech přítomných snížený o počet dvojic chlapec­chlapec a dívka­dívka. Počet všech dvojic jsou všechny dvojice z 25 osob. C(2, 25) = 25 2 = 25! 2!(25 - 2)! = 25 24 1 2 = 300. Počet dvojic tvořených dvěma chlapci jsou všechny dvojice z 15 chlapců C(2, 15) = 15 2 = 15! 2!(15 - 2)! = 15 14 1 2 = 105. 52 Počet dvojic tvořených dvěma děvčaty jsou všechny dvojice z 10 dívek C(2, 10) = 10 2 = 10! 2!(10 - 2)! = 10 9 1 2 = 45. Celkový počet tanečních párů pak dostáváme jako TP = 300 - 105 - 45 = 150. Z 10 dívek a 15 chlapců lze vytvořit 150 různých tanečních párů. Kombinace s opakováním Každou množinu k prvků vybraných z n prvků, přičemž se dané prvky mohou v této množině opakovat, se nazývá k-člennou kombinací z n prvků. Značíme ji C (k, n) a vypočítáme ji podle vztahu C (k, n) = n + k - 1 k . Příklad 3.8 V prodejně se suvenýry je k dispozici 12 různých druhů pohlednic, přičemž od každého druhu je k dispozici několik kusů. Určete kolika možnými způsoby si z nich lze vybrat a) libovolných 15 pohlednic, b) libovolných 7 pohlednic, c) 7 různých pohlednic. Řešení a) Jelikož nám nezáleží na tom, zda vybrané pohlednice budou či nebu- dou stejné, počítáme kombinace s opakováním. Patnáct pohlednic tedy můžeme získat následujícím počtem způsobů: C (15, 12) = 15 + 12 - 1 15 = 26 15 = 7726160. b) Opět nám nezáleží na tom, zda se obrázek na některé z pohlednic ne- bude v našem výběru opakovat. Proto počet možností jak vybrat 7 libovolných pohlednic vypočítáme jako sedmičlennou kombinaci s opa- kováním ze 12 prvků. Dostáváme následující počet možností C (7, 12) = 7 + 12 - 1 7 = 18 7 = 31824. c) V tomto případě nám záleží na tom, abychom si koupili 7 různých pohlednic. Počet možností tedy získáme jako kombinace bez opakování 7 třídy z 12 prvků. Získáváme následující počet možností C(7, 12) = 12 7 = 792. 53 3. Počet pravděpodobnosti 54