1 Kombinatorika V kombinatorice řešíme úlohy typu kolik je možných řešení daného problému, kolika způsoby lze něco provést, obecně kolik konečných množin lze vytvořit zadaným způsobem. Základem pro řešení těchto úloh jsou dvě poměrně jednoduchá pravidla - součtu a součinu. Kombinatorické pravidlo součtu říká, že pokud množina A1 má n1 prvků, množina A2 má n2 prvků a průnik obou množin je prázdný, pak sjednocení A1 A2 má n1 + n2 prvků. Kombinatorické pravidlo součinu říká, že pokud množina A1 má n1 prvků a množina A2 má n2 prvků, pak kartézský součin A1 × A2 obsahující uspořádané dvojice [a1, a2], a1 A1, a2 A2 má n1.n2 prvků. Uvědomme si, že pravidlo součinu není možné použít, pokud výběr z druhé množiny závisí na výběru z první. V takovém případě použijeme kombinaci pravidla součinu a součtu. Obě pravidla jsou rozšiřitelná na libovolný konečný počet množin. Mezi typové kombinatorické úlohy patří kombinace a variace s opakováním nebo bez. V těchto úlohách hledáme počet výběrových souborů sestavených ze základní množiny předepsaným způsobem. Jednotlivé pojmy jsou vysvětleny níže. variace - záleží na pořadí výběru (záleží na pořadí prvků ve výběrovém souboru, výběrový soubor chápeme jako uspořádanou k-tici) kombinace - nezáleží na pořadí výběru (nezáleží na pořadí prvků ve výběrovém souboru, výběrový soubor chápeme jako množinu) s opakováním - stejný prvek ze základního souboru lze do daného výběrového souboru vybrat opakovaně bez opakování - prvek ze základního souboru lze vybrat nejvýše jednou k-té třídy - výběrový soubor má k prvků z n prvků - základní soubor má n prvků Permutace je zvláštní případ variace bez opakování pro n = k. Pro počty jednotlivých výběrových souborů lze odvodit následující vztahy (vždy k-té třídy z n prvků): variace s opakováním V (k, n) = nk pozn 1.1: Volíme k-krát po sobě, při každém výběru máme k dispozici n možností, celkem tedy nk. variace bez opakování V (k, n) = n!/(n - k)! pozn 1.2: Volíme k-krát po sobě, při prvním výběru máme k dispozici n možností, při druhém n - 1 (už vybrané prvky se nemohou opakovat) a tak dále, až při k-tém výběru zbývá n - k + 1 možností, celkem n.(n - 1).(n - 2) . . . (n - k + 1)) = n!/(n - k)!. kombinace bez opakování C(k, n) = n!/(n - k)!k! = n k pozn 1.3: Kombinace bez opakování tvoříme stejně jako variace bez opakování, jediným rozdílem je, že u kombinací nezáleží na pořadí, všechny variace, které se liší pouze pořadím prvků, tvoří jednu kom- binaci. Z jedné kombinace lze permutací jejích prvků utvořit celkem k! různých variací bez opakování lišících se pouze pořadím prvku. Tedy V (k, n) = C(k, n)k!, tím je vztah odvozen kombinace s opakováním C (k, n) = n + k - 1 k pozn 1.4: Nabízí se použít podobný postup, jako při odvození počtu kombinací bez opakování. Byl by ovšem chybný, protože kombinace mohou obsahovat i stejné prvky, změnou jejichž pořadí nevznikají různé variace. Extrémním případem je kombinace obsahující všechny prvky stejné, jíž odpovídá pouze jediná variace. Není ovšem třeba házet flintu do žita, místo toho použijeme velmi užitečný postup, jímž je převedení problému, který řešit neumíme, na ekvivalentní problém, který vyřešit umíme. Kombinaci s opakováním můžeme jednoznačně určit, určíme-li pro každý prvek počet výskytů v kombinaci. Tedy n-ticí celých nezáporných čísel, jejichž součet je k. Hledáme-li například pětimístné kombinace na množině {a, b, c} (n = 3, k = 5), pak n-tice [1, 4, 0] určuje kombinaci abbbb. Počet 1 takových n-tic ovšem ještě neumíme určit, proto si pomůžeme další redukcí. Každé číslo v n-tici vyjádříme počtem jedniček rovným velikosti čísla, jednotlivá čísla od sebe budeme oddělovat číslicí 0 namísto čárky. Kombinaci abbbb popsanou n-ticí [1, 4, 0] v takovém kódování vyjádříme řetězcem 1011110. Platí, že každý binární řetězec délky n + k - 1 obsahující k jedniček a n - 1 nul popisuje právě jednu kombinaci s opakováním. Každý takový řetězec jednoznačně určíme, pokud z celkem n+k -1 pozic vybereme k pro jedničky (nebo n-1 pro nuly, výsledek je stejný). Celkem jich existuje n + k - 1 k = n + k - 1 n - 1 , což je také počet kombinací k-té třídy z n prvků s opakováním. Pro řešení obecnějších úloh neexistuje univerzální postup, lze však použít několik osvědčených postupů. Dekompozice znamená rozklad úlohy na podúlohy, které je možné snadno vyřešit (v poměrně jednoduché podobě je použita v příkladu 1.3). Redukce je převedení úlohy na ekvivalentní, snáze řešitelný problém (je demonstrována na příkladu 1.2 a použili jsme ji při odvození počtu kombinací s opakováním). Příklad 1.1 Kolika způsoby lze rozdělit x předmětů do y (rozlišitelných) přihrádek, jsou-li předměty a) rozlišitelné, b) nerozlišitelné? a) Postupně bereme předměty a každý z nich umist'ujeme do některé z přihrádek. Vybíráme tedy vlastně přihrádku pro každý z předmětů, základní soubor je tvořen přihrádkami a má velikost y, výběrový soubor je tvořen přihrádkami, v nichž jsou vložené předměty a má velikost x. pozn 1.5: Řešení úlohy začneme vždy analýzou zadání, která nám umožní vybrat vhodnou metodu pro její řešení. Pokud si nejsme jistí, zda jde o variaci, kombinaci nebo jinou úlohu, nemá cenu nad tím příliš dlouho přemýšlet, spíše si představíme praktické provedení úlohy. V daném případě můžeme například vzít do ruky první přihrádku a začít do ní skládat předměty (v libovolném počtu, od žádného po všechny). To postupně opakujeme se všemi přihrádkami. Přitom každý předmět musí ležet pouze v jedné přihrádce a musíme vypotřebovat všechny předměty. Tenhle postup (nazvěme jej výběr předmětů) neodpovídá žádné základní úloze (variaci, kombinaci - rozmyslete). Navíc je dost komplikovaný (vyzkoušejte si jej pro nějaký malý počet předmětů a krabiček). Proto se pokusíme vymyslet lepší postup a okamžitě se nabízí možnost brát do ruky předměty a každý z nich vložit do některé krabičky. Krabičky nyní hrají roli základního souboru, počet předmětů určuje velikost výběrového souboru. Tenhle postup (výběr z přihrádek) zatím může vést na základní kombinatorickou úlohu, proto se jej budeme držet. Do každé přihrádky lze umístit libovolný počet předmětů, jde tedy o výběr (z přihrádek) s opa- kováním. pozn 1.6: Pokud by do každé přihrádky bylo možné umístit nejvýše jeden předmět, šlo by o výběr bez opakování, každou přihrádku by bylo možné vybrat nejvýše jednou. Pokud by bylo možné umístit do přihrádky např. nejvýše dva předměty, šlo by o složitější kombinatorickou úlohu. Předměty jsou rozlišitelné, záleží tedy na pořadí, v němž přihrádky vybíráme. pozn 1.7: Rozlišitelné jsou předměty i přihrádky, ale jejich rozlišitelnost znamená v obou případech něco jiného. Rozlišitelnost přihrádek je nutná pro to, aby přihrádky mohly tvořit základní soubor, nemůžeme vybírat z něčeho, co se od sebe neliší. (Samozřejmě ale je možné formulovat úlohu tak, že přihrádky budou nerozlišitelné, pouze půjde o daleko náročnější úlohu pro matematické náruživce). Rozlišitelnost předmětů znamená, že záleží na tom, který předmět se v dané přihrádce nachází, při našem postupu (výběr z přihrádek) to znamená, že záleží na pořadí výběru. Pokud by předměty nebyly rozlišitelné, pak by záleželo jen na počtu předmětů v každé z přihrádek, při našem postupu by tedy nezáleželo na pořadí výběru. Žádná další doplňující pravidla pro výběr už nejsou v zadání uplatněna. Hledáme tedy počet x- prvkových výběrů z y-prvkové množiny přihrádek, ve výběru záleží na pořadí a prvky je možné vybírat opakovaně. Tudíž hledáme počet variací s opakováním x-té třídy z y prvků, kterých je yx . 2 pozn 1.8: To s těmi doplňujícími pravidly je důležité. Jakýmkoli dalším netriviálním požadavkem přeformulujeme úlohu tak, že už nebude odpovídat úloze základní a její řešení může být značně zkomplikováno. b) Jediné, v čem se úloha liší od případu a), je nerozlišitelnost předmětů. Hledáme tedy počet kombinací s opakováním x-té třídy z y prvků, kterých je y + x - 1 x . pozn 1.9: Přidáme ještě několik obecných rad pro řešení kombinatorických úloh. ˇ Za prvé, jak už bylo řečeno, základní soubor musí být tvořen rozlišitelnými objekty, aby bylo z čeho vybírat. ˇ Za druhé, ve výběrovém souboru musejí být obsazeny všechny pozice (zato ze základního ne- musí být vybrány všechny prvky). Pokud tedy obsahuje zadání obecný kvantifikátor (např. rozdělujeme všechny předměty do přihrádek, každý člověk bydlí v některé ulici, . . . ), pak se (velmi pravděpodobně) vztahuje k výběrovému souboru (a tedy počet předmětů nebo lidí udává velikost výběrového souboru, pro každý předmět/člověka vybíráme přihrádku/ulici . . . ) ˇ Za třetí, je užitečné si úlohu názorně představit, jak bylo popsáno například v poznámce 1.5. Také je, zejména u složitějších úloh, dobré vyřešit je pro nějaké malé konkrétní hodnoty volných proměnných (v našem příkladě třeba pro 3 předměty a 2 přihrádky), tento postup navíc slouží pro kontrolu dosažených výsledků. ˇ Za čtvrté, neaplikujeme slepě naučený matematický aparát, raději se pokusíme myslet. Ne každá úloha patří mezi typové. Celou řadu problémů je možné vyřešit jednoduchou úvahou bez znalostí pojmů variace a kombinace Příklad 1.2 Kolika způsoby lze k nerozlišitelných předmětů umístit do n rozlišitelných přihrádek tak, aby v každé přihrádce byl aspoň jeden předmět (k n)? Nebýt podmínky aspoň jednoho předmětu v každé přihrádce, šlo by o kombinace s opakováním k-té třídy z n prvků. pozn 1.10: Opět vybíráme pro každý předmět jednu z přihrádek, předměty jsou nerozlišitelné, proto kombinace, do přihrádky se vleze více předmětů, lze ji tedy vybrat vícekrát, proto s opakováním. Podmínku je možné splnit tak, že do každé přihrádky vložíme jeden předmět. Mělo by být zřejmé, že rozdělit předměty tak, aby v každé přihrádce byl nejméně jeden, nebo dát do každé přihrádky jeden předmět a ostatní rozdělit libovolně jsou identické postupy, které dávají stejný počet způsobů rozdělení. Vložení jednoho předmětu do každé přihrádky lze vzhledem k nerozlišitelnosti předmětů to lze udělat pouze jedním způsobem. Zbylých k - n předmětů pak můžeme rozdělit libovolně. Počet takovýchto rozdělení je roven počtu kombinací s opakováním (k - n)-té třídy z n prvků. Podle pravidla součinu je pak počet všech způsobů rozdělení dán součinem počtu způsobů v obou krocích a je také roven počtu kombinací s opakováním (k - n)-té třídy z n prvků, tedy k - n + n - 1 k - n = k - 1 k - n . pozn 1.11: Pokud by byly předměty rozlišitelné, podobný postup aplikovat nelze. Důvodem je, že při odděleném splňování podmínky a rozdělování zbylých předmětů se rozlišuje, při kterém z kroků byly předměty do příslušné přihrádky vloženy, což není v souladu se zadáním. Máme-li například dva předměty a jednu přihrádku, existuje jediné rozdělení, ale výše popsaným postupem získáme dvě rozdělení lišící se pořadím vkládání předmětů do přihrádky. Tento rozpor není možné nějak jednoduše obejít, pro řešení je nutné použít princip inkluze a exkluze. Příklad 1.3 Kolika způsoby lze rozdělit 7 bílých a 2 černé kuličky do 9 přihrádek? Ze zadání by mělo vyplynout, že kuličky dané barvy považujeme za nerozlišitelné, přihrádky za rozlišitelné, budeme vybírat přihrádky pro kuličky a bude možné vybírat přihrádky opakovaně. Úlohu lze rozdělit na rozdělení bílých kuliček a rozdělení černých kuliček, celkový počet způsobů 3 rozdělení pak bude součinem počtu způsobů rozdělení bílých a černých kuliček. Obě podúlohy vedou na kombinace 7. nebo 2. třídy z 9 prvků s opakováním, řešení je tedy 9 + 2 - 1 2 × 9 + 7 - 1 2 = 289 575. Příklad 1.4 Kolika způsoby si mohou 4 děti rozdělit 10 modrých, 15 červených a 8 zelených kuliček tak, aby každé dítě mělo alespoň jednu kuličku od každé barvy? Nejprve použijeme stejnou úvahu jako v příkladu 1.2, každému dítěti dáme jednu kuličku od každé barvy a zbytek rozdělíme libovolně. Poté použijeme pravidlo součinu podobně jako v příkladu 1.3. Že dělení zbývajících kuliček jedné barvy odpovídá kombinacím s opakováním, přičemž základní soubor tvoří děti a velikost výběrového je dána počtem kuliček, by už mělo být jasné. Výsledek je 4 + 6 - 1 6 × 4 + 11 - 1 11 × 4 + 4 - 1 4 = 1 070 160. Příklad 1.5 Kolik podmnožin má n-prvková množina? Ukážeme si dva odlišné způsoby řešení této úlohy, jeden založený na redukci a vedoucí na va- riace, druhý založený na dekompozici, využívající binomickou větu a vedoucí na kombinace. Každou podmnožinu můžeme popsat binárním řetězcem délky n, kde 0 na i-té pozici zna- mená, že i-tý prvek množiny patří do podmnožiny, 1 znamená, že do podmnožiny nepatří. Počet podmnožin je stejný jako počet binárních řetězců délky n, a ten je roven počtu variací n-té třídy z dvou prvků s opakováním (pro každou pozici v řetězci vybíráme ze dvou číslic, číslice se mohou opakovat a záleží na jejich pořadí). n-prvková množina má tedy 2n podmnožin. pozn 1.12: Říkáme, že počet podmnožin n-prvkové množiny a počet binárních řetězců délky n je stejný. Aby to tak bylo, musí platit následující: každý řetězec popisuje nějakou podmnožinu, každá podmnožina je popsána nějakým řetězcem a toto přiřazení je jednoznačné. Jinými slovy existuje bijekce mezi množinou podmnožin a binárních řetězců. Jiná možnost je najít počet i-prvkových podmnožin a posčítat přes všechna i od 0 do n (podle kombinatorického pravidla součtu). i-prvkovou podmnožinu získáme neuspořádaným výběrem i prvků z n-prvkové množiny bez opakování, je jich tedy n i . Celkový počet podmnožin je n i=0 n i . Tuto sumu upravíme s využitím binomické věty (druhá rovnost): n i=0 n i = n i=0 n i 1i 1n-i = (1 + 1)n = 2n . Příklad 1.6 Hokejový zápas skončil 10:7 po třetinách 3:5, 7:6, kolik možných průběhů zápas měl? Najdeme počet průběhů každé třetiny a vynásobíme. Počet průběhů třetiny je dán např. pořadím gólů, které dali domácí. Je-li skóre třetiny a:b, pak počet možných průběhů je a + b a (= a + b b ). Všech možných průběhů je 1120. Příklad 1.7 Kolik je v obrázku pravoúhelníků? Kolik z nich obsahuje šrafovaný čtvereček? x 4 Pravoúhelník je zadán jednoznačně dvěma vodorovnými a dvěma svislými souřadnicemi (opět existuje bijekce, tedy je stejný počet pravoúhelníků jako příslušných souřadnic). Při výběru souřadnic nezáleží na pořadí a souřadnice musejí být různé. Na výběr je 7 vodorovných a 6 svislých souřadnic, existuje tedy 7 2 × 6 2 = 315 pravoúhelníků. Pokud má pravoúhelník obsahovat šrafovaný čtvereček, musí jeho levá vodorovná souřadnice ležet vlevo od pravoúhelníku (4 možnosti), podobně pro zbývající souřadnice, celkem je 4.3.3.3 = 108 možností. Příklad 1.8 Kolik řešení má rovnice x1 + . . . + xk = n v oboru přirozených čísel? Řešení opět spočívá ve vhodné transformaci problému. Můžeme si představit, že máme n jedniček, které chceme postupně přičítat k jednotlivým proměnným xi, kterých je celkem k a které jsou na počátku rozdělování vynulovány. Pro každou jedničku vybírat jednu z proměnných, k níž ji přičteme, pochopitelně neuspořádaně (všechny jedničky jsou stejné) a s opakováním (ke každé proměnné je možné přičíst jedniček více). Celkem je n + k - 1 n možností. pozn 1.13: Můžeme také postupovat velmi podobně, jako při odvozování počtu kombinací s opa- kováním (poznámka 1.4). Řešení popíšeme binárním řetězcem složeným z n jedniček a k-1 nul, kde nuly budou mít význam oddělovačů mezi jednotlivými proměnnými a jedničky mezi dvěma nulami vždy přičteme k příslušné proměnné. Příklad 1.9 Tři muži a dvě ženy hledají místo, 3 podniky ve městě berou pouze muže, 2 pouze ženy, 2 muže i ženy, kolika způsoby je možné rozmístit uchazeče do podniků (každý z nich je schopný přijmout více uchazečů)? Muži si vybírají ze tří podniků, ženy ze dvou, jde o uspořádaný výběr (lidé jsou rozlišitelní) s opakováním, celkem je 53 .42 = 2 000 možností. Příklad 1.10 Kolika způsoby je možné rozdělit k předmětů do n rozlišitelných přihrádek, má- li být v předem určené přihrádce právě r předmětů a jsou-li předměty a) rozlišitelné, b) ne- rozlišitelné? a) Nejprve vybereme r předmětů do určené přihrádky, to lze udělat k r způsoby. Zbylých k-r předmětů rozdělíme libovolně do n-1 přihrádek, přičemž jde o uspořádaný výběr z přihrádek s opakováním. Celkem je podle pravidla součinu k r (n - 1)k-r možností. b) Rozdělujeme libovolně k - r předmětů do n - 1 přihrádek, přičemž jde o neuspořádaný výběr s opakováním. Celkem je n + k - r - 2 k - r možností. Důsledkem kombinatorického pravidla součtu a součinu je princip inkluze a exkluze. Označme i fakt, že objekt má i-tou vlastnost z nějaké množiny vlastností a i fakt, že ji nemá. Označme N(i1 . . . ik j1 . . . jl ) počet objektů, které mají vlastnosti i1 . . . ik a nemají vlastnosti j1 . . . jl , přičemž o ostatních vlastnostech se nic bližšího nepředpokládá. Princip inkluze a exkluze lze vyjádřit následovně: N(1 . . . n) = N - i1 N(i1 ) + i1,i2 N(i1 , i2 ) - i1,i2,i3 N(i1 , i2 , i3 ) + . . . Odvození principu inkluze a exkluze přesahuje rozsah tohoto textu, doporučujeme rozmyslet si význam jednotlivých členů na příkladu 1.11. 5 Příklad 1.11 Z 67 zaměstnanců ústavu mluví 47 anglicky, 35 německy, 20 francouzsky, 23 an- glicky a německy, 12 anglicky a francouzsky, 11 německy a francouzsky a 5 všemi třemi jazyky. Kolik zaměstnanců ústavu neovládá žádný z těchto cizích jazyků? Označíme A, N, F, AN, AF, NF, ANF počty zaměstnanců mluvících příslušnými jazyky, O počet všech zaměstnanců. Podle principu inkluze a exkluze platí ANF = O - A - N - F + AN + AF + NF - ANF = 6. pozn 1.14: Na tomto příkladu lze vysvětlit funkci principu inkluze a exkluze. Když hledáme počet zaměstnanců nemluvících žádným jazykem, odečteme od počtu všech zaměstnanců počet mluvících anglicky, německy a francouzsky. Přitom jsme ale zaměstanance mluvící anglicky i německy odečetli dvakrát, musíme je tedy zase přičíst. Takhle se pokračuje do té doby, kdy je každý zaměstnanec ko- rektně odečtený právě jednou. Princip inkluze a exkluze nám umožňuje provést korektní odečtení automaticky, bez toho, že bychom kontrolovali správnost odečtení toho kterého zaměstnance. Do- poručujeme si nakreslit obrázek a rozmyslet si význam jednotlivých skupin. Příklad 1.12 Kolika způsoby lze k rozlišitelných předmětů umístit do n rozlišitelných přihrádek tak, aby v každé přihrádce byl aspoň jeden předmět? Podobným problémem jsme se zabývali v příkladu 1.2, tam šlo ovšem o nerozlišitelné předměty. Zkusíme si ukázat možný způsob uvažování, který nás přivede k řešení úlohy. Zadání je jasné, máme nějaké předměty, ty budeme dávat do přihrádek, tedy pro každý předmět potřebujeme vybrat nějakou přihrádku, přičemž předměty jsou rozlišitelné, tudíž záleží na pořadí výběru přihrádek (neboli není důležité pouze to, že dáme nějaký předmět do přihrádky, důležité také je, který předmět tam dáme). Tato část zadání by vedla na variace s opakováním, máme ale ještě doplňující podmínku (aspoň jeden předmět v každé přihrádce). Chceme-li dělit předměty do přihrádek tak, aby v každé byl aspoň jeden předmět, uděláme to v reálném světě pravděpodobně tak, že dáme jeden předmět do každé přihrádky (aby byla podmínka splněna) a ostatní rozdělíme libovolně. Zkusíme to stejně i při výpočtu, můžeme nejdřív vybrat n předmětů, které umístíme po jednom do každé přihrádky. Vybíráme-li napřed předmět pro první přihrádku, poté pro druhou atd., jde o uspořádaný výběr bez opakování n-té třídy z k prvků, který lze provést k!/(k - n)! způsoby (všimněme si, že vybíráme z předmětů, ne z přihrádek). pozn 1.15: Ke stejnému výsledku dospějeme, pokud nejprve vybereme k n způsoby n předmětů, které pak k! permutacemi rozdělíme mezi přihrádky. Zbývajících (k - n) předmětů rozdělíme libovolně, přičemž máme celkem nk-n možností. Aniž bychom to zmínili, použili jsme dekompozici probému na podproblém splnění podmínky a pod- problém rozdělení zbývajících předmětů. Za předpokladu, že výše zmíněným postupem vygenerujeme právě všechna různá rozdělení odpovídající zadání, a to právě každé jednou, bychom mohli (podle kombinatorického pravi- dla součinu) vynásobit počty řešení obou podproblémů a obdržet výsledek. Musíme ovšem ještě ověřit platnost předpokladu. Jeho první část splněna je, druhá nikoli, protože stejná rozdělení jsou započtena vícekrát. Bližší vysvětlení přináší následující komentář (1.16). pozn 1.16: Abstraktní matematické úvahy jsou často poměrně obtížné. Vyplatí se tedy vyřešit nějakou jednoduchou variantu příkladu s pevně dosazenými čísly (za volné proměnné n a k). To nám umožní jednak zjistit, zda v doposud udělaných úvahách nebyla chyba, jednak může napovědět další postup. Je dobré volit čísla co nejmenší, přitom ale musíme mít na paměti, že některé záludnosti problému se mohou projevit až při vyšších číslech. V našem případě postačí dělení 3 předmětů do 2 přihrádek. Nejprve najdeme všechna rozdělení splňující zadání, je jich celkem 6. Pak zjistíme, že našemu postupu odpovídá 12 řešení (6 možností, jak obsadit každou přihrádku jedním předmětem, 2 možnosti, jak rozdělit zbývající předmět). Nyní se zarazíme a začneme hledat chybu. Po chvilce uvažování patrně dojdeme k závěru, že problém je následující: představme si, že v první přihrádce se nachází předměty A a B a v druhé přihrádce předmět C. To je rozdělení splňující zadání. V našem postupu jej ovšem můžeme získat dvěma způsoby (do první přihrádky se může předmět A dostat v prvním kroku a předmět B ve druhém, nebo naopak), je tedy započítán dvakrát. 6 Náš postup tedy zatím nevyšel, ale můžeme se jej ještě pokusit nějak zachránit. Určitě si všimneme, že každé rozdělení odpovídající zadání je započítáno pro daný počet předmětů a krabiček právě dvakrát, stačilo by tedy získaný počet rozdělení dělit dvěma. Otázka je, zda tento postup lze zobecnit pro libovolné n a k a odpověd' zní ne (viz komentář 1.17). pozn 1.17: Zjistíme, kolikrát je v našem postupu započítáno jedno rozdělení odpovídající zadání. Uvažme jednu přihrádku, v níž je r předmětů. V našem postupu rozlišujeme první předmět (vložený v prvním kroku) od ostatních (vložených v druhém kroku), rozlišujeme tedy celkem r různých rozdělení pouze pro tuto přihrádku. Je-li v jednotlivých přihrádkách ri předmětů, pak je toto jediné rozdělení splňující zadání v našem postupu započteno n i=1 ri. Toto číslo je různé pro různá rozdělení, proto jím dělit nejde. Může nás také napadnout odečíst vícenásobně přičtená rozdělení. Podrobnější analýzou zjistíme, že tento postup by byl obtížně průchodný. S dekompozicí jsme tedy neuspěli. Jsme opět na začátku řešení a snažíme se vymyslet jiný postup. Pokud se nám nepodařilo najít počet rozdělení splňujících podmínku, zkusíme najít počet rozdělení, která podmínku nesplňují a odečíst je od počtu všech řešení. Jak vypadá rozdělení, které podmínku nesplňuje? Některé přihrádky jsou prázdné. Určitě by pomohlo vědět, které přihrádky to jsou. Můžeme si předem vybrat, ve kterých přihrádkách nic nebude a potom posčítat přes všechny výběry prázdných přihrádek. Můžeme nějak snadno vyřešit úlohu, v níž by předem zadané přihrádky byly prázdné a v ostatních byl aspoň jeden předmět? To určitě ne, prázdné přihrádky prostě jenom odstraníme a zůstane nám problém, který právě řešíme. pozn 1.18: Přesně vzato, nemáme stejný problém, ale podobný problém s menším n (počtem přihrádek). Tudy by měl (nemám to vyzkoušené) vést postup využívající matematickou indukci (problém s jednou přihrádkou lze vyřešit triviálně), výsledkem by byly pravděpodobně nepříčetně vypadající sumy. Můžeme ale vyřešit úlohu, v níž předem vybrané přihrádky budou prázdné a o ostatní se nebudeme zajímat. Pomůže nám to nějak? Ale ano, máme přece princip inkluze a exkluze. Tím máme popsaný princip řešení. Vyberme r přihrádek, které budou prázdné. Tento výběr lze provést celkem n r způsoby. Do zbylých přihrádek můžeme předměty rozdělit celkem (n - r)k způsoby (pro každý výběr prázdných přihrádek). Získaná čísla budeme střídavě odečítat a přičítat od počtu všech rozdělení, jak velí princip inkluze a exkluze. Všech rozdělení splňujících zadání je nk - n 1 (n - 1)k + n 2 (n - 2)k - n 3 (n - 3)k + . . . = n r=0 (-1)r n r (n - r)k . Příklad 1.13 Do výtahu pětiposchod'ové budovy nastoupilo osm lidí, kolika různými způsoby mohou vystoupit, má-li v každém poschodí vystoupit aspoň jeden člověk? Opět typický příklad na princip inkluze a exkluze, nejprve najdeme počet všech způsobů vy- stoupení, pak odečteme případy, kdy v jednom z pater nikdo nevystoupil atd. Řešení je 58 - 5 1 48 + 5 2 38 - 5 3 28 + 5 4 18 = 126 000 pozn 1.19: Člen s 08 ve výsledku chybí, jednak je nulový, jednak pokud mají lidé z výtahu vystoupit, nemůže se stát, že by v žádném patře nikdo nebyl. pozn 1.20: Vezmeme-li místo obvyklých lidí například nerozlišitelné klony, pak patra pro jednotlivé osoby vybíráme neuspořádaně (variace s opakováním musíme nahradit kombinacemi s opakováním). Výsledek má pak tvar 4 r=0 (-1)r 5 r 8 + 5 - r - 1 5 - r - 1 = 35 7 Z druhé strany je úloha ekvivalentní neuspořádanému výběru s opakováním z pěti pater pro tři klony, kterých je 7 4 = 35. Ukázání shodnosti obou výsledků (zejména pro obecný počet lidí a pater) přenecháme jako (náročné) cvičení. 8 2 Pravděpodobnost Uvažme příklad házení kostkou. Tento experiment má šest možných výsledků (elementárních jevů) a můžeme při něm rozlišit 26 různých jevů (každá podmnožina množiny výsledků je jev, např. podmnožina {1, 3, 5} odpovídá jevu "padne liché číslo"). Jevy lze tedy chápat množinově, což je důležité pro matematické zavedení pravděpodobnosti. Pravděpodobnost jevu lze definovat několika způsoby. V klasická definici je dána podílem počtu výsledků pokusu příznivých jevu a počtu všech možných výsledků pokusu. V našem příkladě je šest možných výsledků, přičemž tři jsou příznivé jevu "padne liché číslo", tudíž pravděpodobnost tohoto jevu je 1/2. (Předpokládá se ovšem, že všechny výsledky pokusu jsou "stejně pravděpodobné".) pozn 2.1: Toto vypadá trochu jako definice kruhem. Ale možná tušíme, že pojem "stejně pravděpodobné" můžeme zavést daleko intuitivněji, než samotnou pravděpodobnost. Statistická definice je založena na opakovaném provádění pokusu a je určena podíl počtu po- kusů příznivých jevu a počtu všech pokusů v limitě pro nekonečný počet pokusů. Matema- tická (axiomatická) definice pravděpodobnosti nedává návod na konkrétní vyčíslení, ale vyjadřuje některé důležité vlastnosti pravděpodobnosti. Pravděpodobnost je v ní zavedena jako zobrazení P z množiny jevů A do množiny reálných čísel splňující následující podmínky (množinu výsledků pokusu označíme , A je množina všech podmnožin ): 1. P(X) 0 pro každý jev X A 2. P() = 1 3. P(A B) = P(A) + P(B) pro každé dva vzájemně se vylučující (A B = ) jevy A, B A Příklad 2.1 Systém je tvořen dvěma bloky, pravděpodobnost poruchy prvního bloku je 0,05, pravděpodobnost poruchy druhého bloku je 0,15. Jaká je pravděpodobnost poruchy systému, jestiže bloky pracují a) v sérii, b) paralelně? a) Označíme A1, A2 jevy selhání prvního a druhého bloku. Hledáme P(A1 A2) (pravděpodobnost selhání aspoň jednoho bloku). Nemůžeme ji určit číselně, pokud neznáme vztah mezi jevy A1, A2, můžeme však najít interval, v němž bude ležet. Nejmenší hodnota pravděpodobnosti bude, po- kud A1 bude podmnožinou A2 (naopak to nejde kvůli velikostem pravděpodobnosti). V takovém případě se první blok rozbije pouze tehdy, pokud nebude fungovat ani druhý blok, pravděpodobnost poruchy systému v takovém případě bude 0,15. Druhý extrém získáme, pokud se jevy A1, A2 bu- dou vzájemně vylučovat, pravděpodobnost poruchy systému pak bude 0,20. b) Hledáme P(A1 A2) (pravděpodobnost selhání obou bloků). Ta je zjevně zdola omezena nulou (vzájemně se vylučující jevy), shora 0,05 (v případě, že jev A1 je podmnožinou jevu A2). pozn 2.2: Můžeme ještě uvážit případ nezávislých jevů. V takovém případě jsou pravděpodobnosti v případě b) P(A1 A2) = P(A1)P(A2) (z definice nezávislosti jevů), v případě a) P(A1 A2) = P(A1) + P(A2) - P(A1 A2) (sjednocení rozdělíme na vzájemně disjunktní podmnožiny, jejichž pravděpodobnosti pak podle třetího axiomu sečteme). Příklad 2.2 Hodíme n× mincí, jaká je pravděpodobnost, že právě k× padne líc? Využijeme klasickou definici pravděpodobnosti. Pokus má celkem 2n možných výsledků (pro každou minci volíme ze dvou výsledků), příznivých je n k (volíme k pozic pro líce), pravděpodobnost je n k /2n . pozn 2.3: Také n k pozic pro líce, (1/2)k, že na zvolených pozicích padne líc, (1/2)n-k, že na zbývajících padne rub. 9 Příklad 2.3 Z balíčku 32 karet vybereme 2, jaká je pravděpodobnost, že budou mít stejnou barvu a) pokud karty vracíme, b) bez vracení? První karta pouze určí barvu, do které se má vejít druhá. a) 8/32, b) 7/31. Příklad 2.4 Z balíčku 32 karet vybereme k, jaká je pravděpodobnost, že budou mít stejnou barvu (karty vracíme)? Všech možností je 32k , příznivých 4.8k (8 karet od dané barvy, 4 různé barvy). Příklad 2.5 Určete pravděpodobnost, že mezi k lidmi nemají žádní dva narozeniny ve stejný den (uvažujte nepřestupný rok). Budeme vybírat narozeninové dny pro jednotlivé lidi. Jde o uspořádaný výběr k-té z 365 prvků, pro všechny jevy je s opakováním, pro příznivé bez opakování. Výsledek je 365! (365-k)!365k . Příklad 2.6 Z balíčku 32 vybereme náhodně 4 karty, jaká je pravděpodobnost, že mezi nimi bude aspoň jedno eso? Řešení najdeme jako doplněk k pravděpodobnosti, že mezi vybranými kartami eso nebude. pozn 2.4: Převést pravděpodobnostní úlohu na inverzní je často používaný postup. V tomto případě je jasné, že znalost počtu es ve výběru zjednoduší řešení úlohy. Bylo by možné sečíst pravděpodobnost toho, že ve výběru bude postupně 1, 2, 3 nebo 4 esa (tedy aspoň jedno), jednodušší je ale spočítat pravděpodobnost toho, že ve výběru eso nebude a tu pak odečíst od jedné. Výběry z karet jsou variace bez opakování (na pořadí záleží), vybíráme-li ze všech 32 karet, do- staneme všechny výsledky, vybíráme-li z 28 (bez es), dostaneme výsledky nepříznivé hledanému jevu. Pravděpodobnost je 1 - 28! (28-4)! / 32! (32-4)! = 0,4306. Příklad 2.7 Dvakrát hodíme mincí, jaká je pravděpodobnost, že padne v obou hodech stejná strana? Jsou celkem 4 možné výsledky pokusu (LL, LR, RL, RR - variace s opakováním), z toho 2 příznivé (LL, RR), pravděpodobnost je 1/2. pozn 2.5: Na příkladu je vhodné promyslet si, kdy záleží na pořadí výběru a kdy ne. Představme si následující argumentaci: Nezáleží na tom, kterou mincí hodím jako první. Proto nezáleží na pořadí, v jakém dostanu výsledek, rozhodující je počet kombinací, nikoli variací. Jsou tedy tři různé výsledky pokusu (dva líce, dva ruby, líc a rub). Hledaná pravděpodobnost je 2/3. Ve skutečnosti samozřejmě mince ze své podstaty (jako fyzikální objekty) rozlišitelné jsou. Kom- binace rub a líc padá dvakrát častěji než kombinace LL, RR, protože může být realizována bud' lícem na první a rubem na druhé minci, nebo naopak. Uvedeme a vyvrátíme ještě jednu námitku: Ptáme-li se, kolik líců padne při hodu dvěma mincemi, pak jistě existují pouze 3 (a ne 4) možné různé výsledky. Pro pravděpodobnost (ve smyslu klasické definice) je však nutné, aby tyto výsledky pokusu byly stejně pravděpodobné, což ovšem v uvedeném příkladě neplatí. Pokud je někdo výše uvedenými argumenty nepřesvědčen a stále považuje výsledek 2/3 za správný, lze proti němu tuto skutečnost vhodně využít v hazardní sázkové hře. Příklad 2.8 Dva hráči střídavě házejí mincí, vyhrává ten, kterému jako prvnímu padne líc. Jaká je pravděpodobnost výhry prvního a druhého hráče? První hráč vyhraje, pokud v nějakém lichém hodu padne líc a ve všech předchozích rub. Označíme- li pořadí hodu n, pak pravděpodobnost vítězství právě v tomto hodu je (1/2)n . Tyto pravděpodobnosti posčítáme přes všechny liché hody (to nám umožňuje skutečnost, že vítězství v různých hodech jsou 10 vzájemně se vylučující jevy, lze tedy použít pravidlo součtu) a dostáváme P1 = i=0(1/2)2i+1 = 2/3 (sčítáme geometrickou řadu, kde platí i=0 aqi = a/(1-q)). Podobným způsobem (nebo také jako doplněk do 1) zjistíme, že pravděpodobnost vítězství druhého hráče je 1/3. Příklad 2.9 Jaká je pravděpodobnost, že při hodu třema kostkami padne součet a) 11 b) 12? Je celkem 63 = 216 možných výsledků pokusu. Vypíšeme všechny dávající daný součet: a) 6, 4, 1 6× 6, 3, 2 6× 5, 5, 1 3× 5, 4, 2 6× 5, 3, 3 3× 4, 4, 3 3× b) 6, 5, 1 6× 6, 4, 2 6× 6, 3, 3 3× 5, 5, 2 3× 5, 4, 3 6× 4, 4, 4 1× Vidíme, že 27 výsledků pokusu odpovídá součtu 11 a 25 součtu 12. Příslušné pravděpodobnosti jsou a) 0,125, b) 0,1157. Příklad 2.10 Jaká je pravděpodobnost, že při současném hodu 6 kostkami padne: a) na každé kostce jiné číslo, b) samé šestky, c) právě 5 šestek, d) aspoň 4 šestky, e) všechna čísla sudá, f) všechna čísla stejná? Pokus má 66 možných výsledků. a) Jednotlivé číslice lze na kostky rozmístit 6! permutacemi (obecněji jde o kombinace bez opa- kování šesté třídy (šest kostek) z šesti prvků (šest číslic)). Pravděpodobnost je 0,01543. b) Samým šestkám odpovídá jediný výsledek, pravděpodobnost je 2,14.10-6 . c) Vybereme jednu kostku ze šesti (kombinace první třídy ze šesti prvků bez opakování), na níž padne něco jiného než šestka (je na ní možných pět různých výsledků - variace první třídy z pěti prvků s opakováním). Na ostatních kostkách padnou šestky, což je možné realizovat jediným způsobem. Celkem máme 6.5 = 30 příznivých výsledků, pravděpodobnost je 6,43.10-5 . d) Posčítáme případy, kdy šestky padnou na čtyřech, pěti a šesti kostkách (dílčí počty najdeme způsobem popsaným pod písmenem c). Máme celkem 6 2 52 + 6 1 51 + 6 0 50 výsledků příznivých jevu, pravděpodobnost je 8,037.10-3 . e) Vybíráme šestkrát ze tří sudých čísel, celkem je 36 příznivých výsledků, pravděpodobnost je 0,015625 (= (1/2)6 , v každém hodě máme poloviční pravděpodobnost, že padne sudé číslo). f) Celkem je šest různých výsledků příznivých jevu, pravděpodobnost je 1,286.10-5 . Příklad 2.11 Čtyři osoby si odložily čtyři klobouky, poté si je náhodně rozdělily, jaká je pravděpodobnost, že si aspoň jedna osoba vzala svůj klobouk? Úlohu budeme řešit jako doplněk problému, kdy si žádná osoba nevzala svůj klobouk. Počet odpovídajících rozdělení najdeme pomocí principu inkluze a exkluze. Existuje celkem 4!=24 (per- mutace, resp. variace bez opakování) libovolných rozdělení klobouků, od nichž postupně bu- deme odečítat (a přičítat) rozdělení, v nichž předem vybrané osoby dostanou svůj klobouk a ostatní jsou rozděleny náhodně. Počet rozdělení, v nichž žádná osoba nedostane svůj klobouk, je 4! - comb413! + comb422! - comb431! + comb440! = 9, (kombinační číslo udává počet kom- binací příslušného počtu osob, které dostanou vlastní klobouk, faktoriál je rozdělení zbývajících klobouků). Celkem 15 rozdělení klobouků z 24 splňuje původní zadání, hledaná pravděpodobnost je 0,625. pozn 2.6: Matematicky otrlejší jedinci se mohou zabavit problémem, v němž svůj klobouk dostanou aspoň dvě osoby/právě dvě osoby a poté zobecnit pro libovolný počet osob a libovolný počet osob s vlastním kloboukem. 11 Příklad 2.12 Pět osob vystupuje náhodně z výtahu v osmipatrové budově, jaká je pravděpodobnost, že vystoupí a) všichni ve stejném patře, b) všichni v šestém patře, c) každý v jiném patře? Existuje celkem 85 = 32 768 různých způsobů rozmístění osob do jednotlivých pater. Z nich 8 vyhovuje podmínce a), 1 podmínce b), u podmínky c) vybíráme uspořádaně 5 z 8 pater bez opa- kování, celkem je 8!/3! = 6 720. Odpovídající pravděpodobnost jsou a) 2,44.10-4 , b) 3,05.10-5 , c) 0,205. Příklad 2.13 Jaká je pravděpodobnost, že a) při hodu šesti kostkami padne aspoň jedna jednička, b) při hodu dvanácti kostkami aspoň dvě jedničky? a) Pokus má celkem 66 = 46 656 různých výsledků (opět si uvědomme, že se nám jedná o to, aby každý výsledek pokusu byl stejně pravděpodobný, musíme tedy rozlišovat, na jakých kostkách příslušné hodnoty padnou, počítáme tedy variace, nikoli kombinace). Aspoň jednu jedničku získáme nejvýhodněji jako doplněk do ani jedné jedničky. Ani jedna jednička znamená výběr z pěti zbývajících hodnot, takových výběrů je celkem 56 = 15 625, výběrů s aspoň jednou jedničkou je 31 031 a pravděpodobnost je 0,6651. b) Od celkového počtu různých výsledků (612 = 2 176 782 336) odečteme hody bez jedničky (51 2) a s právě jednou jedničkou ( 12 1 511 11 ) a zjistíme, že příslušná pravděpodobnost je 0,6187. pozn 2.7: Proč se pravděpodobnosti liší a proč je druhá z nich menší? pozn 2.8: Zatímco u tohoto příkladu je hledání řešení přímočaré, u podobně formulovaného příkladu s klobouky (2.11) bylo nutné použít princip inkluze a exkluze. Bylo to opravdu nutné? Pokud ano, v jaké odlišnosti zadání tkví příčina? Příklad 2.14 Dítě dostalo sáček s pěti žlutými a pěti červenými bonbóny, jaká je pravděpodobnost, že mezi šesti náhodně vybranými bonbóny budou právě dva červené? Bonbóny vybíráme bez vracení, přičemž na pořadí výběru nezáleží (podrobněji viz poznámku 2.9), jednotlivé bonbóny samozřejmě rozlišujeme (jako fyzikální objekty se od sebe liší). 6 bonbónů z 10 lze vybrat celkem 10 6 způsoby, přičemž právě 2 červené (a 4 žluté) lze vybrat 5 2 5 4 způsoby, příslušná pravděpodobnost je 0,238. pozn 2.9: U příkladu s kostkami (2.13) jsme zdůrazňovali, že počítáme variace, najednou ale tvrdíme, že vystačíme s kombinacemi. Tento rozpor si zaslouží vysvětlení. Požadujeme, aby výsledky pokusu, z nichž počítáme pravděpodobnost, byly stejně pravděpodobné. V praxi jsou stejně pravděpodobné vždy variace, protože variace odpovídají reálnému provedení experimentu. Bonbóny také vybíráme v nějakém pořadí. V příkladě s bonbóny ale každé kombinaci odpovídá stejný počet variací, všechny kombinace jsou stejně pravděpodobné. V příkladě s kostkami tomu tak nebylo. Příčina je v tom, že u bonbónů jde o výběr bez opakování (kde každé kombinaci odpovídá stejný počet variací lišící se permutacemi navzájem různých prvků), zatímco u kostek šlo o výběr s opakováním, kde počet variací odpovídajících jedné kombinaci je různý (stejné prvky už permutovat nemůžeme). Pokud bychom počítali opravdu variace, pak máme celkem 10!/4! všech výběrů, z nichž 6 2 (5!/3!)(5!/1!) splňuje podmínku (vybíráme 2 červené, 4 žluté a 2 pozice ze 6, na nichž vybereme žluté bonbóny). Výsledná pravděpodobnost bude samozřejmě stejná. 12 3 Podmíněná pravděpodobnost Mějme jevy A, B. Zavedeme podmíněnou pravděpodobnost jevu A za podmínky B vztahem P(A|B) = P (AB) P (B) (pravděpodobnost podmínky musí být nenulová). pozn 3.1: Definice je zcela intuitivní, vysvětlíme si ji na příkladě. Představme si, že každý den sledujeme počasí a všímáme si, zda prší (jev A) a zda je zataženo (jev B). Pozorováním zjistíme, že např. v 40% dnů je zataženo, v 32% dnů prší a ve 24% dnů je zataženo a prší (jev A B, může pršet také např. z polojasné oblohy). Podmíněná pravděpodobnost toho, že prší, za podmínky, že je zataženo, je podle definice 60%. Tedy pokud nevíme nic o oblačnosti, pak lze tvrdit, že prší s pravděpodobností 32%, ale pokud už jsme zjistili, že je zataženo (je splněna podmínka), pak je (podmíněná) pravděpodobnost deště 60%). Přímo z definice lze odvodit užitečný multiplikativní vztah (věta o násobení pravděpodobnosti) P(A B) = P(B)P(A|B). pozn 3.2: Ten můžeme číst následovně: pravděpodobnost současného výskytu jevů A a B je dána součinem pravděpodobnosti, že nastane jev B a (podmíněné) pravděpodobnosti toho, že při splnění podmínky B nastane jev A (tato podmíněná pravděpodobnost se obecně liší od pravděpodobnosti jevu A, což demonstruje i příklad s deštěm a oblačností). Mějme nějaký úplný systém hypotéz {Hi} (tj. systém jevů s nenulovou pravděpodobností, které se navzájem vylučují a jejichž sjednocení je jistý jev). Pak pro libovolný jev platí věta o úplné pravděpodobnosti P(A) = i P(Hi)P(A|Hi). pozn 3.3: Vrat'me se k příkladu s počasím. Jednoduchou množinovou úvahou zjistíme, že pravděpodobnost toho, že není zataženo a prší, je 8%, pravděpodobnost toho, že není zataženo, je 60% a podle definice je podmíněná pravděpodobnost deště za předpokladu, že není zataženo, 13,33%. Nyní déšt' tvoří jev A, úplný systém hypotéz je tvořen jevy "je zataženo", "není zataženo". K dešti může dojít bud' tak, že je zataženo a prší, nebo není zataženo a prší, pravděpodobnost deště je součtem uvedených dílčích pravděpodobností. S pravděpodobností 40% je zataženo a za této podmínky je pravděpodobnost deště 60%, tedy s pravděpodobností 24% je zataženo a prší, podobně zjistíme, že s pravděpodobností 8% není zataženo a prší, celkem tedy prší s pravděpodobností 32%. Mělo by být patrné, že věta o úplné pravděpodobnosti je jednoduchá a dobře srozumitelná. Dvojí aplikací definice podmíněné pravděpodobnosti získáme Bayesův vzorec, který mění jev a podmínku: P(A|B) = P(B|A)P(A) P(B) . pozn 3.4: Pokud například víme, že s pravděpodobností 40% je zataženo, s pravděpobností 32% prší a podmíněná pravděpodobnost deště za podmínky zataženo je 60%, pak pomocí Bayesova vzorce zjistíme, že pravděpodobnost zatažené oblohy za splnění podmínky, že prší, je 75%. To je ve shodě s dříve uvedeným tvrzením, že v 24% ze všech pozorování prší a je zataženo, zatímco v 8% prší a zataženo není. pozn 3.5: Námi uvedený Bayesův vzorec je zjednodušenou podobou dvou původních Bayesových vzorcům, které jsou doplněny o větu o úplné pravděpodobnosti aplikovanou na jev A (1.BV), popř. i jev B (2.BV). 13 Příklad 3.1 Jaká je pravděpodobnost, že při hodu dvěma kostkami padly dvě pětky, víme-li, že součet ok na obou kostkách je dělitelný pěti? Jev A jsou v našem případě dvě pětky, podmínka B součet dělitelný pěti. Nejprve najdeme pravděpodobnosti obou jevů. Při hodu dvěma kostkami je 36 možných výsledků, z nichž jeden vyhovuje jevu A a sedm (1+4, 2+3, 3+2, 4+1, 4+6, 5+5, 6+4) jevu B. Platí tedy P(A) = 1/36, P(B) = 7/36. Pravděpodobnost průniku obou jevů, tedy toho, že padnou dvě pětky a výsledek je dělitelný pěti, je také 1/36. Odtud už najdeme P(A|B) = (1/36)/(7/36) = 1/7. Výsledek má jednoduchou interpretaci: platnost podmínky B nám ze všech 36 výsledků pokusu vybere 7, mezi nimi je 1 vyhovující také jevu A (tedy 1 ze 7), odpovídající podmíněná pravděpodobnost je 1/7. Příklad 3.2 V nádobě je a bílých a b černých koulí, vybereme 2 bez vracení. Jaká je pravděpodobnost, že druhá koule byla bílá (jev 2B) za podmínky, že první koule byla bílá (jev 1B)? Z celkem a+b způsobů, jimiž lze vybrat první kouli, vyhovuje a jevu 1B. Z celkem (a+b)(a+b-1) způsobů, jimiž lze vybrat první dvě koule, vyhovuje a(a - 1) jevu 1B 2B. (Ve všech případech jde o uspořádaný výběr bez opakování.) Máme tedy P(1B) = a/(a + b), P(1B 2B) = a(a - 1)/[(a + b)(a + b - 1)] a podle definice P(2B|1B) = (a - 1)/(a + b - 1). pozn 3.6: Výsledek má velmi intuitivní interpretaci: Vybereme-li v prvním tahu bílou kouli, zbývá jich v nádobě a + b - 1, z čehož a - 1 je bílých, (podmíněná) pravděpodobnost tažení bílé v druhém tahu je (a - 1)/(a + b - 1). Naopak je-li v prvním tahu vybrána černá koule, je ze zbývajících a + b - 1 koulí a bílých a za této podmínky je pravděpodobnost tažení bílé koule v druhém tahu a/(a + b - 1). Příklad má zejména demonstrovat, že není třeba bát se podmíněné pravděpodobnosti. Příklad 3.3 V nádobě jsou vloženy lístky, na nichž jsou napsány číslice 0-9, každá právě jednou. Vybereme postupně bez vracení tři z nich, jaká je pravděpodobnost, že (uspořádány v pořadí výběru) dají číslo 125? Úlohu lze vyřešit kombinatorickou úvahou (ze 720 variací bez opakování 1 vyhovuje danému jevu), využijeme ale větu o násobení pravděpodobnost. Podle ní platí P(712203) = P(71)P(22|71)P(03|71 22). Jednotlivé podmíněné pravděpodobnosti opět najdeme jednoduše, když si uvědomíme, že v prvním tahu máme 1 příznivou možnost z 10, v druhém 1 z 9, ve třetím 1 z 8 (podmínky v našem případě neříkají nic jiného, že tažený lístek ještě v nádobě je, tedy např. byla-li v prvním tahu vybrána 7, pak před druhým tahem je 2 ještě uvnitř nádoby). Hledaná pravděpodobnost je pak podle věty o součinu pravděpodobnosti rovna 1/(10.9.8)=1/720. pozn 3.7: Uvědomme si rozdíl významů pravděpodobnosti tažení 2 v druhém tahu a tažení 2 v druhém tahu za podmínky tažení 7 v prvním tahu. Druhou z pravděpodobností jsme nalezli v příkladu. První z nich najdeme následovně: v 9/10 případů je v prvním tahu tažena jiná číslice, než 2. V ta- kovém případě je v druhém tahu 1/9 šance na tažení 2. Pokud vytáhneme 2 už v prvním tahu (s pravděpodobností 1/10, pak už ji v druhém tahu pochopitelně vytáhnout nemůžeme. Podle věty o úplné pravděpodobnosti je P(22) = P( 21)P(22| 21) + P(21)P(22|21) = 9/10.1/9 + 1/10.0 = 1/10. Totéž platí pro libovolnou číslice a libovolný z prvních deseti tahů. Stejný výsledek lze získat i kom- binatorickou úvahou. Předchozí tahy ale ovlivňují pravděpodobnost tažení dané číslice v následujícím tahu. Pokud už byla tažena, je pravděpodobnost jejího znovuvytažení nulová, pokud ještě nebyla tažena, pravděpodobnost jejího tažení vzrůstá (ubývá konkurence). Příklad 3.4 1.dělník vyrobí za směnu 60 výrobků, z toho 10% zmetků, 2. dělník 40 výrobků, z toho 5% zmetků. Jaká je pravděpodobnost, že je výrobek zmetek a pochází od 1. (2.) dělníka? Jaká je pravděpodobnost, že je-li výrobek zmetek, pochází od 1. (2.) dělníka? Na úloze budeme procvičovat zejména převod slovního zadání do matematického pravděpodobnostního popisu a rozpoznání jednotlivých typů pravděpodobnosti. 14 Úloha je jednoduchá, ale vyžaduje jistou pečlivost a důslednost. Nejprve tedy označíme jed- notlivé jevy: D1 a D2, že výrobek pochází od 1. (2.) dělníka, Z, že je výrobek zmetek, jiné jevy neuvažujeme. Nyní zjistíme, jaké pravděpodobnosti známe. V zadání jsou explicitně uvedeny dvě (poznáme podle procent), zjevně jde o podmíněné pravděpodobnosti, že výrobek je zmetek za předpokladu, že pochází od 1. (2.) dělníka. S trochou úsilí také najdeme pravděpodobnosti, že náhodně vybraný výrobek pochází od 1. (2.) dělníka (ze 100 výrobků vyrobených za směnu pochází 60 (tedy 60%) od 1. dělníka a 40 (tedy 40%) od 2. dělníka). Známe tedy P(Z|D1) = 10%, P(Z|D2) = 5%, P(D1) = 60%, P(Z|D1) = 40%. V první části úlohy hledáme pravděpodobnost toho, že je výrobek zmetek a pochází od 1. (2.) dělníka, tedy P(Z D1) (P(Z D2)). Podle věty o násobení pravděpodobnosti je P(Z D1) = P(D1)P(Z|D1) = 6% (1. dělník vyrobí 60% z celkového počtu výrobků, z těchto 60% představují 10% zmetky, celkem tedy 6% z celkového počtu výrobků jsou zmetky vyrobené 1. dělníkem. A skutečně přímo ze zadání vyplývá, že 1. dělník vyrobí za směnu 6 zmetků, což je 6% z celkového počtu 100 výrobků.), podobně P(Z D2) = 2%. V druhé části o výrobku předpokládáme, že je zmetek a hledáme pravděpodobnost, že pochází od 1. (2.) dělníka. K tomu potřebujeme kromě už nalezených pravděpodobností průniků znát také pravděpodobnost, že je výrobek zmetek. Tu najdeme pomocí věty o úplné pravděpodobnosti (méně učeně, sečteme pravděpodobnosti průniků, které už známe, je-li z celkového počtu výrobků 6% zmetků vyrobených 1. dělníkem a 2% zmetků vyrobených 2. dělníkem, pak z celkového počtu výrobků je 8% zmetků), P(Z) = 8%. Podmíněné pravděpodobnosti potom jsou P(D1|Z) = P(Z D1)/P(Z) = 75%, P(D2|Z) = 25% (a skutečně z 8 zmetků vyrobených za směnu pochází 6 (75%) od 1. a 2 (25%) od 2. dělníka). Příklad 3.5 V urně je n bílých a n černých koulí. Postupně všechny koule vybereme ven z urny, vždy po dvou. Jaká je pravděpodobnost, že v každé dvojici je jedna koule bílá a jedna černá? Označíme P(n) hledanou pravděpodobnost. Uvažme výběr první dvojice koulí. Označíme Bi, Ci jev, že v i-tém tahu byla vybrána bílá (černá) koule, i {1, 2}. Jev, že jedna koule ve dvojici je bílá a jedna černá, lze zapsat následovně ve tvaru (B1 C2) (C1 B2) (bud'to je první koule z dvojice bílá a druhá černá, nebo naopak). Pravděpodobnost tohoto jevu najdeme následovně: pravděpodobnost P(B1C2) vyjádříme jako součin pravděpodobnosti tažení bílé koule v prvním tahu (z 2n koulí je n bílých) a podmíněné pravděpodobnost tažení černé koule v druhém tahu (z 2n - 1 zbývajících koulí je při splnění podmínky tažení bílé v prvním tahu n černých), P(B1 C2) = P(B1)P(C2|B1) = n 2n n 2n-1 . Stejnou pravděpodobnost dostáváme i pro jev popsaný druhým průnikem a protože oba jevy se vzájemně vylučují, můžeme jejich pravděpodobnosti sečíst. Při výběru první dvojice koulí tedy uspějeme s pravděpodobností 2 n 2n n 2n-1 . Pokud jsme v prvním tahu uspěli, máme stejný problém, jako na počátku, pouze s menším počtem koulí. Zjevně tedy platí rovnice P(n) = 2 n 2n n 2n-1 P(n - 1). Jejím řešením je (důkaz mate- matickou indukcí lze ponechat jako cvičení) P(n) = 2n (n!)2 (2n)! . pozn 3.8: Úlohu lze poměrně snadno vyřešit i kombinatoricky. Pro výpočet pravděpodobnosti jsou rozhodující variace, jak už bylo několikrát vysvětleno. 2n koulí lze vybrat celkem (2n)! způsoby. Počet výběrů příznivých jevu určíme následovně. Pro každou bílou kouli určíme, v jaké dvojici se bude nacházet (n! možností), totéž provedeme i pro černé koule. V rámci každé dvojice je ještě nutné stanovit pořadí koulí, pro jednu dvojici jsou 2 možnosti, pro n celkem 2n možných uspořádání. Celkem tedy 2n(n!)2 ze všech možných výběrů vyhovuje jevu a jeho pravděpodobnost je P(n) = 2n (n!)2 (2n)! . Příklad 3.6 Z 23 studentů MMZM/PVE je pro 8 pravděpodobnost získání zápočtu 0,9, pro 12 0,6 a pro 3 0,4. Určete pravděpodobnost, že náhodně vybraný student získá zápočet. Použijeme větu o úplné pravděpodobnosti, podle níž je příslušná pravděpodobnost 8 23 0,9+ 12 23 0,6+ 3 23 0,4 = 0,6783. 15 pozn 3.9: Např. člen 8 23 0,9 udává pravděpodobnost, že student patří do první skupiny studentů a získá zápočet. Tento člen je dán součinem pravděpodobnosti, že náhodně vybraný student patří do první skupiny (8/23) a podmíněné pravděpodobnosti, že student získá zápočet za podmínky, že patří do první skupiny (0,9). Posčítáním přes všechny skupiny studentů získáme hledanou pravděpodobnost (jev získání zápočtu je shodný s jevem získání zápočtu a příslušností do sjednocení tří skupin studentů). Příklad 3.7 Expert posuzuje skupinu obrazů, mezi nimž je 8 originálů a 2 kopie. Pravděpodobnost chyby experta je 1/6. Jestliže expert označí náhodně vybraný obraz za originál, stanovte pravděpodobnost, že jde skutečně o originál. Zavedeme následující označení jevů: Oobraz je originál, K-obraz je kopie, EO-expert označí obraz za originál, EK-expert označí obraz za kopii. Ze zadání známe P(O) = 8/10, P(K) = 2/10. Chyba experta znamená, že expert označí obraz za originál za podmínky, že jde o kopii, případně naopak. Máme tedy P(EO|K) = 1/6, P(EK|O) = 1/6 (a samozřejmě také P(EO|O) = 5/6, P(EK|K) = 5/6). Hledáme přitom P(O|EO), podle definice tedy musíme najít P(O EO) a P(EO). Platí P(O EO) = P(EO|O)P(O) = 2/3, P(EO) = P(OEO)+P(KEO) = P(EO|O)P(O)+P(EO|K)P(K) = 7/10. Odtud P(EO|O) = 20/21. pozn 3.10: Zápis řešení je poměrně hutný, doporučujeme dobře rozmyslet jednotlivé kroky. Hodně nejasností může vyřešit pečlivé přečtení zadání a rozmyslení významu jednotlivých jevů, jejichž pravděpodobnosti se počítají. 16 4 Nezávislé jevy Jevy A1, . . . , An označujeme jako stochasticky nezávislé, jestliže platí: i < j {1, . . . , n} : P(Ai Aj) = P(Ai)P(Aj), i < j < k {1, . . . , n} : P(Ai Aj Ak) = P(Ai)P(Aj)P(Ak), . . . P(A1 . . . An) = P(A1) . . . P(An). pozn 4.1: Tedy vybereme-li libovolnou podmnožinu jevů, musí být pravděpodobnost současného na- stoupení (průniku) těchto jevů rovna součinu pravděpodobnosti jednotlivých jevů. Je nutné prověřit všechny multiplikativní vztahy, jak ukazuje i příklad 4.1. pozn 4.2: Jsou-li jevy A, B stochasticky nezávislé, platí P(A|B) = P(A), jinými slovy, pravděpodobnost nastoupení jevu A není ovlivněna nastoupením jevu B. Toto tvrzení lze rozšířit pro libovolný konečný počet jevů. Příklad 4.1 V nádobě jsou čtyři lístky s čísly 000, 110, 101, 011. Označíme Ai jev, že na i-tém místě náhodně taženého čísla je číslice 1 (i {1, 2, 3}). Jsou jevy A1, A2, A3 nezávislé? Pravděpodobnosti jednotlivých jevů a jejich průniků nalezneme snadno, např. jevu A1 A2 (první dvě číslice jsou jedna, třetí může být libovolná) vyhovuje jedno číslo (110) ze čtyř, pravděpodobnost je 1/4. Máme P(A1) = P(A2) = P(A3) = 1/2, P(A1 A2) = P(A1 A3) = P(A2 A3) = 1/4, P(A1 A2 A3) = 0. Binární multiplikativní vztahy splněny jsou, ternární (pro všechny) jevy ovšem ne a proto jevy nejsou nezávislé. pozn 4.3: Výsledek má jednoduchou interpretaci: víme-li, že první číslicí vybraného čísla je 1 (nastoupil jev A1), táhli jsme bud' číslo 110 nebo 101, pravděpodobnost nalezení 0 a 1 na libovolné z obou zbývajících pozic je 1/2, stejně jako v případě, že první číslicí je 0. Obecněji známe-li jednu číslici vybraného čísla, ještě to nic neříká o zbývajících číslicích (nejenže nejsou jednoznačně určeny, ale jejich (podmíněné) pravděpodobnosti jsou stejné jako v případě, že žádnou číslici neznáme). Známe-li však dvě číslice, je jednoznačně určeno celé číslo a tedy i zbývající číslice, proto třetí jev z {Ai} není nezávislý na zbývajících dvou. pozn 4.4: Jevy by byly nezávislé, pokud bychom doplnili "chybějící" čísla 100, 010, 001, 111. Příklad 4.2 Jevy A, B, C, jsou nezávislé, pro jejich pravděpodobnosti platí P(A) = 0,5, P(B) = 0,5, P(C) = 0,25. Jaká je pravděpodobnost nastoupení alespoň jednoho jevu? Pravděpodobnost nastoupení alespoň jednoho jevu najdeme jako doplněk k pravděpodobnosti, že nenastoupí ani jeden jev (neboli že nastoupí jevy doplňkové, které jsou také nezávislé - rozmys- lete). Platí P(A B C) = 1 - [1 - P(A)][1 - P(B)][1 - P(C)] = 13/16. pozn 4.5: Bylo by projevem čirého zoufalství počítat pravděpodobnost alespoň jednoho jevu jako součet pravděpodobností jednotlivých jevů. Takto sčítat pravděpodobnosti lze pouze u vzájemně se vylučujících jevů (tam je to dokonce součástí definice pravděpodobnosti), ovšem ne v případě, že jevy nemají prázdné průniky. V daném případě by nás ještě navíc měla zarazit pravděpodobnost větší, než 1. Příklad 4.3 Systém je složen ze dvou bloků, jev Ai znamená, že i-tý blok funguje. Jevy A1, A2 jsou nezávislé. Známe P(A1) = 1, P(A2) = 2. Jaká je pravděpodobnost, že systém funguje, jsou-li bloky zapojeny a) sériově, b) paralelně? V prvním případě P(A1 A2) = 12, v druhém P(A1 A2) = 1 - [1 - P(A)][1 - P(A)] = 1 + 2 - 12. (Obecnější verzí tohoto příkladu je příklad 2.1). 17 pozn 4.6: Všimněme si druhé části úlohy: pravděpodobnost sjednocení dostaneme jako součet pravděpodobností jednotlivých jevů (1 +2) minus pravděpodobnost průniku (12), který byl započten dvakrát. Přesně tak to vyžaduje princip inkluze a exkluze. Příklad 4.4 Opakovaně házíme kostkou, za úspěch považujeme padnutí šestky. Pravděpodobnost úspěchu je = 1/6. Určete a) pravděpodobnost, že prvnímu úspěchu předchází x neúspěchů, b) pravděpodobnost, že k-tému úspěchu předchází x neúspěchů, c) pravděpodobnost, že z n pokusů je k úspěšných. Výsledky všech hodů kostkou jsou navzájem nezávislé. a) Prvních x pokusů je neúspěšných, poslední je úspěšný, pravděpodobnost je (1 - )x . b) Poslední pokus je úspěšný. V předcházejících x + k - 1 pokusech bylo k - 1 úspěchů a x neúspěchů. Pokud by pořadí neúspěchů (a tedy i úspěchů) bylo předem určené, byla by odpovídající pravděpodobnost (1 - )x k , pro libovolné pořadí musíme posčítat přes všechna možná rozložení neúspěchů do prvních x+k-1 pokusů (kombinace bez opakování). Máme tedy x + k - 1 x (1- )x k . c) Pro pevně dané rozložení úspěchů a neúspěchů je pravděpodobnost k úspěchů a n neúspěchů k (1 - )n-k , po posčítání přes všechna možná rozložení úspěchů máme n k k (1 - )n-k . Příklad 4.5 Na mostě se vlaky potkají max. jednou denně, a to s pravděpodobností 0,2. S ja- kou pravděpodobností se vlaky během týdne potkají a) právě třikrát b) nejvýše třikrát, c) aspoň třikrát? Využijeme část c) předchozího příkladu (4.4). Za úspěch budeme považovat setkání vlaků. a) P(S = 3) 7 3 0,23 0,84 = 0,1142. b) P(S 3) = P(S = 3) = P(S = 2) + P(S = 1) + P(S = 0) = 0,9666. c) Bylo by možné postupovat obdobně, jako v případě b. Místo toho chytře využijeme to, co už známe (uvědomte si přitom, jak se uplatní že různé počty setkání během jednoho týdne jsou vzájemně vylučující se jevy). P(S 3) = 1 - P(S 3) + P(S = 3) = 0,1481. Příklad 4.6 Dvacetkrát hodíme třemi mincemi, jaká je pravděpodobnost, že aspoň jednou pad- nou tři líce? Pravděpodobnost úspěchu v jednom hodu je (1/2)3 = 1/8. Pravděpodobnost úspěchu aspoň v jednom z dvaceti hodů získáme jako doplněk k neúspěchu ve všech hodech: P = 1 - (1 - 1/8)20 = 0,9308. 18 5 Náhodné veličiny Náhodná veličina (náhodná proměnná) je veličina, která laicky řečeno nabývá určitých hodnot s určitou pravděpodobností. Matematicky korektní definici lze najít v matematicky korektní lite- ratuře. Náhodná veličina se používá k popisu výsledku pokusu (výsledek může mít sám o sobě číselnou povahu, jak je tomu u měření fyzikální veličiny, nebo je možné výsledky očíslovat, např. v příkladech s kartami přiřadíme každé kartě číslo od 1 do 32). Každá hodnota náhodné veličiny popisuje jeden možný výsledek pokusu a přísluší jí pravděpodobnost, s níž tento výsledek nastane (u spojitých veličin hustota pravděpodobnosti, viz dále). Diskrétní náhodná veličina X může nabývat spočetně mnoha hodnot. Ke každé hodnotě přísluší pravděpodobnost () zadaná pravděpodobnostní funkcí . Vlastnosti pravděpodobnostní funkce vyplývají z vlastností pravděpodobnosti; pro každou hodnotu náhodné veličiny leží hodnota pravděpodobnostní funkce v intervalu (0; 1 , součet hodnot pravděpodobnostní funkce přes celý definiční obor náhodné veličiny je roven jedné. pozn 5.1: Hod kostkou je popsán náhodnou veličinou X s oborem hodnot dom(X) = {1, 2, 3, 4, 5, 6} a pravděpodobnostní funkcí () = 1/6 pro {1, 2, 3, 4, 5, 6}, 0 jinak. pozn 5.2: Náhodná veličina popisuje pouze výsledky pokusu, tedy elementární jevy. U hodu kostkou existuje např. jev "padlo liché číslo", který není náhodnou veličinou přímo (tedy prostřednictvím) jedné hodnoty popsán. Důsledkem je mj. fakt, že jevy popsané různou hodnotou náhodné veličiny se navzájem vylučují. Spojitá náhodná veličina je definována bud' na celém reálném oboru, nebo nějaké jeho po částech spojité podmnožině. Nelze ji popsat pomocí pravděpodobnostní funkce (pravděpodobnost odpovídající každé z nespočetně mnoha hodnot je nulová), místo toho používáme hustotu pravděpodobnosti f() = lim0 P ( 4), c) určete P(1 < X < 4). a) Konstantu určíme z normovací podmínky (x) = x=1 k.0,7x = 0,7.k 1 1 - 0,7 = 1, odtud k = 3/7. b) P(X > 4) = x>4 (x) = x=5 3 7 0,7x = 3 7 0,75 1 - 0,7 = 0,74 = 0,2401 c) P(1 < X < 4) = (2) + (3) = 0,357 20 pozn 5.5: Pokud vám způsob, jímž jsme sečetli nekonečné řady v částech a a b, přijde záhadný, zopakujte si geometrické řady. Příklad 5.6 Spojitá náhodná veličina má hustotu pravděpodobnosti f(x) = ax pro x (0; 1), 0 jinak. Určete konstantu a a vypočtěte P(1/3 < X < 2/3). Konstantu určíme z normovací podmínky, 1 0 axdx = 1 2 ax2 1 0 = 1 a = 2. Pro hledanou pravděpodobnost platí (rozvažte zavedení hustoty pravděpodobnosti) P(1/3 < X < 2/3) = 2/3 1/3 2xdx = 1/3. Příklad 5.7 Spojitá náhodná veličina má distribuční funkci F(x) = 0, x < -5 x+5 7 , -5 x < 2 1, x 2 a) Určete hustotu pravděpodobnosti. b) Určete P(-2 < X 2) pomocí hustoty pravděpodobnosti i distribuční funkce. Příklad 5.8 Najděte konstantu c tak, aby funkce f(x) = cx2 (1 - x), 0 < x < 1 0 jinak byla hustotou pravděpodobnosti spojité náhodné veličiny X. Najděte její distribuční funkci a určete pravděpodobnost P(0, X < 0,8). Normovací konstantu opět určíme z normovací podmínky, 1 0 cx2 (1 - x)dx = c x3 x - x4 4 1 0 = c 1 12 = 1 c = 12. Distribuční funkci získáme integrací hustoty pravděpodobnosti, máme F(x) = 0, x (-; 0) 4x3 - 3x4 , x 0; 1 1, x (1; ) Konečně P(0,2 X < 0,8) = F(0,8) - F(0,2) = 0,792. Typová rozdělení Binomické rozdělení Bi(n, ) udává počet úspěchů v sekvenci n nezávislých pokusů, je-li pravděpodobnost úspěchu během jednoho pokusu . Platí (x) = n x x (1 - )n-x , x {1, . . . , n} 0, jinak . Geometrické rozdělení Ge() udává počet neúspěchů předcházejících v sekvenci nezávislých pokusů prvnímu úspěchu, je-li pravděpodobnost úspěchu během jednoho pokusu . Platí (x) = (1 - )x , x N0 0, jinak . 21 pozn 5.6: Pravděpodobnostní funkce obou rozdělení jsou velmi snadno odvoditelné, rozhodně to není něco, co byste si měli pamatovat. S oběma rozděleními jsme se také v mnoha předchozích příkladech setkali. Příklad 5.9 Kolikrát padne šestka, hodíme-li 11× kostkou? Kolik hodů předchází prvnímu pad- nutí šestky. pozn 5.7: Ačkoli je to znevažováním čtenářovy inteligence, považujeme za potřebné podotknout, že odpověd' ve tvaru jednoho čísla očekáváme od věštce, nikoli od statistika. Protože hody kostkou jsou náhodné pokusy, lze příslušné počty vyjádřit pouze pomocí náhodných veličin. Označme X náhodnou veličinu označující počet šestek padnuvších v n pokusech. Veličina má binomické rozdělení s počtem opakování n a pravděpodobností úspěchu (tj. pravděpodobností, že v určitém hodu padne šestka) = 1/6. Počet šestek v n hodech je popsán pravděpodobnostní funkcí (x) = n x 1 6 x 5 6 n-x , x {1, . . . , n} 0, jinak . pozn 5.8: x-krát padne šestka, (n - x)-krát nepadne šestka, to vše násobíme počtem kombinací pořadí pokusů, v nichž šestka padne. Označme Y náhodnou veličinu označující počet hodů předcházejících první šestce. Veličina má geometrické rozdělení s pravděpodobností úspěchu (tj. pravděpodobností, že v určitém hodu padne šestka) = 1/6. Počet hodů předcházejících první šestce je popsán pravděpodobnostní funkcí (x) = 5 6 x 1 6 , x N0 0, jinak . pozn 5.9: V prvních x pokusech padne něco jiného, než šestka, pak padne šestka. Příklad 5.10 Zkouší se telefonní spojení v n = 10 pokusech, pravděpodobnost úspěchu v jed- nom pokusu je = 0,23, jaká je pravděpodobnost, že bude úspěšných celkem x pokusů. Pravděpodobnost je určena binomickým rozložením Bi(10; 0,23), několik konkrétních hodnot je vypsáno v tabulce. n 0 1 2 3 4 5 6 P[%] 7,3 21,9 29,4 23,4 12,2 4,4 1,1 Poissonovo rozdělení Po() udává počet událostí, které nastanou za určitý časový úsek, přicházejí- li události náhodně a nezávisle na sobě a je-li střední počet událostí během jednoho časového úseku . Pro pravděpodobnostní funkci Poissonova rozdělení platí (x) = x x! e- , x N0 0, jinak . Příklad 5.11 Odvod'te pravděpodobnostní funkci Poissonova rozdělení. Víme, že během jednoho časového úseku nastane v průměru událostí. Můžeme si daný úsek rozdělit na n stejně velkých podúseků, přičemž v každém z nich nastane událost se stejnou pravděpodobností (pravděpodobnost je stejná právě proto, že jednotlivé události jsou náhodné a nezávislé). Podúseků musí být dostatečně mnoho a musejí být dostatečně krátké, aby pravděpodobnost, 22 že se v některém podúseku vyskytne více událostí, byla zanedbatelně malá. V každém podúseku tedy bud' událost nastane (to považujeme za úspěch) nebo nenastane. Počet úspěchů v n poku- sech je ale určen binomickým rozdělením, Poissonovo rozdělení je tedy v dané limitě (velké n, malé ) ekvivalentní binomickému. Ještě zbývá najít vztah mezi parametry binomického a Pois- sonova rozdělení. Lze ukázat (a později bude ukázáno), že střední hodnota náhodné proměné s binomickým rozdělením je n, musí tedy platit = n. Z toho, co bylo prozatím řečeno, máme P o()(x) = lim n, 0, n Bi(n,) = lim n, 0, n n! x!(n - x)! x (1 - )n (1 - )x (Kombinační číslo rozepsané do podílu faktoriálů jistě nikoho nezaskočí.) Nadále nebudeme vypi- sovat nepřehlednou limitu, patří ale před každý výraz až do konce tohoto příkladu. Z členů, které ve výrazu máme, je na svém místě pouze x!. Dále nás napadne, že by se dalo dělat něco s podílem n! (n-x)! . Vzhledem k tomu, že x je v dané limitě zanedbatelně malé vůči n, lze jej nahradit nx . Tento člen dá po vynásobení s x výraz x , který se už je součástí hledaného vztahu. Zbývá upravit (1 - )n a (1 - )x . První člen není možné položit rovný jedné (skoro jedna na nekonečno není jedna), ale u druhého to udělat lze (skoro jedna na konečno je jedna). Dále víme, že platí limx0(1 + x)1/x = e. Provedeme následující úpravu: (1 - )n = [1 + (-)]-1/ -n = e-n = e- . Ke všem výrazům samozřejmě patří příslušná limita. Když to všechno poskládáme dohromady, dostáváme (x) = x x! e- . Tím je odvození hotovo. pozn 5.10: Podstatná na celém odvození bylo právě ta limita, tedy rozdělení úseku na dostatečně malé podúseky. Zatímco z pohledu binomického rozdělení se v jednom podúseku může vyskytnout maximálně jedna událost, z pohledu Poissonova rozdělení jich tam může být libovolný počet. Oba přístupy začnou být ekvivalentní teprve v okamžiku, kdy je pravděpodobnost výskytu více než jedné události dostatečně malá. Příklad 5.12 V nemocnici je průměrný počet volání lékaře při směně 3, jaká je pravděpodobnost, že lékař stráví nerušenou noc za předpokladu, že jednotlivá volání jsou náhodné nezávislé jevy? Počet volání se řídí Poissonovým rozdělením s parametrem = 3, hledaná pravděpodobnost je P = P o(3)(0) = 30 0! e-3 = 0,05. Příklad 5.13 Z radioaktivního zdroje vyletí za jednotku času v průměru 10 částic, jaká je pravděpodobnost, že jich vyletí 0, 2, 5, 10, 100? Počet rozpadů za jednotku času se řídí Poissonovým rozdělením, příslušné pravděpodobnosti jsou v tabulce. x 0 2 5 10 100 (x)P o(10) 4,5.10-5 2,3.10-3 3,8.10-2 1,3.10-1 4,9.10-63 pozn 5.11: U tohoto příkladu jsme mlčky předpokládali, že během časového úseku se aktivita zdroje změní pouze zanedbatelně málo. Lze si například představit radioaktivní zdroj, který je složený z 11 radioaktivních částic a zvolit časový úsek tak dlouhý, aby během něj došlo k 10 rozpadům. V takovém případě ale naše úvahy nebudou platit (vzájemné rozpady už nebudou nezávislé), pravděpodobnost rozpadu bude klesat s klesajícím počtem dosud nerozpadnutých částic, počet rozpadlých částic se nebude řídit Poissonovým rozdělením. Na druhé straně bude možné použít binomické rozdělení. Podmínkou pro použitelnost Poissonova rozdělení tedy v našem případě je, že ve zdroji je mnohem více částic, než se jich během daného časového úseku rozpadne. 23 Exponenciální rozdělení Ex() udává dobu čekání na náhodně přicházející událost, je-li střední doba čekání = 1/. Hustota pravděpodobnosti (ano, jde o spojité rozdělení) je f(x) = e-x . Vlastnosti rozdělení demonstruje následující příklad. Příklad 5.14 Radioaktivní částice se náhodně rozpadá, pravděpodobnost rozpadu za malý časový úsek délky t je t. Uvažujte částice, které existovaly v okamžiku t0 = 0. Určete a) Pravděpodobnost P(t), že se částice dožije okamžiku t b) Hustotu pravděpodobnosti rozpadu v okamžiku t. c) Střední dobu života jedné částice t . d) Poločas rozpadu T1/2 (tj. dobu, za kterou se rozpadne) e) Intenzitu rozpadu (tj. počet částic rozpadajících se za jednotku času) v závislosti na čase. a) Nejprve si uvědomíme, co vlastně hledáme. P(t) je pravděpodobnost, že se částice dožije času t, tj. že se v intervalu 0 . . . t nerozpadne. Nehledáme tedy pravděpodobnost toho, že se částice v okamžiku t rozpadne (ta je nulová, proces rozpadu bychom popsali hustotou pravděpodobnosti). Budeme postupovat následovně: předpokládejme, že známe pravděpodobnost, že se částice dožije nějakého času t1 (tuto pravděpodobnost značíme P(t1)). Budeme hledat pravděpodobnost, že se částice dožije času t1 + t, kde t je dostatečně malé (značíme ji P(t1 + t)). Částice se dožije času t1 + právě tehdy, když se dožije času t1 a nerozpadne se během časového úseku délky t. Pravděpodobnost, že se částice dožije času t1, známe. Pravděpodobnost, že se částice rozpadne během krátkého časového úseku délky t, je p(t) = t, pravděpodobnost, že se během tohoto úseku nerozpadne, je tedy q(t) = 1-p(t) = 1-t. Pravděpodobnost toho, že se částice současně dožije času t1 a nerozpadne během úseku t (a tedy že se dožije času t1 + t), je dána součinem dílčích pravděpodobností, tedy P(t1 + t) = P(t1)(1 - t). pozn 5.12: Ten součin tam není proto, že by šlo o nezávislé jevy, ale proto, že druhý jev je podmíněný nastoupením prvního a jeho pravděpodobnost je pravděpodobnost podmíněná nastoupením prvního jevu. Součin je tam tedy kvůli podobě definice podmíněné pravděpodobnosti. Pokud této poznámce nerozumíte, nenechte se jí zmást. Uvedenou rovnici můžeme vhodně upravit a převést na diferenciální rovnici: P(t1 + t) - P(t1) t = -P(t1) dP dt = -P. Odtud už (s uvážením počáteční podmínky P(0) = 1) můžeme přímo psát P(t) = e-t . pozn 5.13: Nabízíme ještě jeden postup: částice se dožije okamžiku t, pokud se nerozpadne celkem v t/t po sobě jdoucích dostatečně krátkých úsecích délky t. Platí tedy P(t) = [q(t)]t/t = (1 - t)t/t = (1 - t)-1/t -t = e-t , kde poslední rovnost plyne ze vztahu limx0(1 + x)1/x = e. b) Hledáme hustotu pravděpodobnosti rozpadu v okamžiku t. Výraz 1-P(t) udává pravděpodobnost, že se částice rozpadne do okamžiku t a představuje tedy distribuční funkci k hledané hustotě. Od- tud f(t) = d dt [1 - P(t)] = e-t . Všimněme si, že okamžik rozpadu částice se řídí exponenciálním rozdělením. c) Střední doba života je t = 0 tf(t)dt = 0 te-t dt = -te-t 0 + 0 e-t dt = - 1 e-t 0 = 1 = . 24 d) Poločas rozpadu udává dobu, během níž se rozpadne právě polovina ze všech částic. Potřebujeme tedy znát závislost počtu částic na čase N(t). To je ovšem náhodná veličina. Bylo by samozřejmě možné zavést počet částic i poločas rozpadu jako náhodné veličiny, tento postup by byl ale ne- praktický. Místo lze vzít za počet částic střední hodnotu příslušné náhodné veličiny. K tomu by bylo nutné provést poměrně složitý statistický výpočet, kterým se nebudeme zdržovat. Prohlásíme počet částic za nekonečně velký a podle statistické definice pravděpodobnosti můžeme hned psát N(t) = N0e-t , kde N0 = N(0). Nyní už najdeme poločas rozpadu T1/2 snadným řešením rovnice N(T1/2) = N0/2 T1/2 = ln 2 = ln 2. e) Intenzita rozpadu je definována jako počet rozpadů za jednotku času, tedy jako I = -dN(t) dt , potom I(t) = N(t) = I0e-t , kde I0 = I(0). 25 6 Náhodné vektory, nezávislé náhodné proměnné Náhodný vektor (X1, . . . , Xn) je n-tice náhodných proměnných, at' už diskrétních, nebo spojitých. Je popsán distribuční funkcí F(1, . . . , n) = P(X1 1, ldots, Xn n) a podle typu bud' pravděpodobnostní funkcí, nebo hustotou pravděpodobnosti. Platí obvyklé převodní vztahy se sumací a odečítáním (popř. integrací a derivací). Kromě těchto tzv. simultánních funkcí se zavádějí také tzv. marginální funkce, ve kterých se vždy sčítá přes všechny hodnoty některých náhodných proměnných. Máme-li např. spojitý náhodný vektor (X1, X2, X3), který je popsán simultánní hustotou pravděpodobnosti f(1, 2, 3), můžeme první složku vektoru X1 popsat marginální hustotou pravděpodobnosti fX1 (1) = f(1, 2, 3)d2d3. Pojem marginální hustota má význam pouze ve vztahu k náhodnému vektoru, jinak jde o ob- vyklou hustotu pravděpodobnosti jedné spojité náhodné proměnné s obvyklou statistickou inter- pretací. Podobně zavádíme marginální pravděpodobnostní funkci a distribuční funkci. Marginální funkce mohou být definovány i pro více než jednu náhodnou proměnnou, zobecnění je přímočaré. Při přechodu od simultánních k marginálním funkcím vždy sumujeme po volných náhodných proměnných (tj. po těch, které nás nezajímají). Naopak z marginálních funkcí obecně není možné zkonstruovat funkci simultánní. Mějme náhodný vektor (X1, . . . , Xn). Náhodné veličiny X1, . . . , Xn označíme za stochasticky nezávislé právě tehdy, pokud pro všechna 1, . . . , n z definičního oboru náhodných proměnných platí F(1, . . . , n) = FX1 (1) . . . FXn (n), neboli pokud je simultánní distribuční funkce součinem marginálních distribučních funkcí (jedné proměnné). Stejné multiplikativní vztahy platí i pro pravděpodobnostní funkci nebo hustotu pravděpodobnosti, stačí prověřit vždy jen jeden mul- tiplikativní vztah. Příklad 6.1 Systém je tvořen dvěma bloky. Pravděpodobnost funkčnosti i-tého bloku je i, pravděpodobnost funkčnosti obou dvou bloků současně je 12 . Zavedeme náhodné proměnné Xi, které budou popisovat funkčnost i-tého bloku (0 bude znamenat nefunkční, 1 funkční blok). Určete simultánní a obě marginální pravděpodobnostní funkce náhodného vektoru (X1, X2). Budeme používat označení , 1, 2 postupně pro simultánní pravděpodobnostní funkci a mar- ginální pravděpodobnostní funkci příslušející první a druhé proměnné. Nejprve si ujasníme, co víme ze zadání. Víme, že pravděpodobnost fungování prvního bloku (bez ohledu na stav druhého) je 1. Tato pravděpodobnost je určena marginální pravděpodobnostní funkcí, tedy 1(1) = 1. Podobně 2(1) = 2. Dále známe pravděpodobnost současného fungování obou bloků a tedy (1, 1) = 12 . Dopočítáme obě marginální funkce. Víme, že první blok bud' funguje nebo nefunguje, více možností není. Máme tedy 1(0) + 1(1) = 1 (pravděpodobnost jistého jevu je 1), odtud 1(0) = 1 - 1, podobně 2(0) = 1 - 2. Zbývá určit tři neznámé hodnoty simultánní funkce ((0, 0), (0, 1), (1, 0)). K tomu podmínka normování stačit nebude, musíme využít znalosti marginální funkce a vztahy mezi marginální a simultánní funkcí. Známe například pravděpodobnost toho, že první blok funguje. Z pohledu obou bloků může první blok fungovat dvěma způsoby: bud' fungují oba bloky, nebo první funguje a druhý ne. Pro pravděpodobnosti to znamená, že 1(1) = (1, 0) + (1, 1). Tato rovnice nám už umožní určit (1, 0) = 1 - 12 (od pravděpodobnosti, že funguje první blok, odečteme pravděpodobnost, že fungují oba bloky, dostaneme tak pravděpodobnost, že první blok funguje a druhý ne). Podobně (0, 1) = 1 - 12 . Podobně nebo z normovací podmínky určíme (0, 0) = 1 - 1 - 2 + 12 . pozn 6.1: Vztah 1(1) = (1, 0) + (1, 1) je pouze speciálním případem obecného vztahu Xi (i) = 1dom(X1) . . . i-1dom(Xi-1) x+1dom(Xi+1) . . . ndom(Xn) (1 . . . n) Při přechodu od simultánní k marginálním funkcím tedy sčítáme přes všechny hodnoty náhodných proměnných, které se vyskytují v simultánní funkci, ale ne v marginální, Rozmyslete si (na příkladu i obecně), co to znamená pro jednotlivé jevy. 26 Příklad 6.2 Spojitý náhodný vektor (X1, X2, X3) má (simultánní) hustotu pravděpodobnosti f(x1, x2, x3) = kx1x2x2 3, x1 (0, 1), x2 (0, 1), x3 (0, 3) 0 jinak a) Určete normovací konstantu k. b) Určete P(0 < X1 < 1/2, 1/3 < X2 < 2/3, 1 < X3 < 2) c) Určete simultánní distribuční funkci a všechny marginální distribuční funkce jedné proměnné. a) Z podmínky 1 = - f(x1, x2, x3)dx1dx2dx3 = k 1 0 x1dx1 1 0 x2dx2 3 0 x3dx3 = k 1 2 1 2 27 3 = k 9 4 dostaneme k = 4/9. b) P(0 < X1 < 1/2, 1/3 < X2 < 2/3, 1 < X3 < 2) = 1/2 0 2/3 1/3 2 1 f(x1, x2, x3)dx1dx2dx3 = 4 9 1/2 0 x1dx1 2/3 1/3 x2dx2 2 1 c) Při hledání distribuční funkce se omezíme na oblast, v níž je hustota nenulová (rozmyslete si, jak bude vypadat v ostatních 26 oblastech). Pro simultánní distribuční funkci máme F(x1, x2, x3) = 1 -infty d1 2 -infty d2 3 -infty d3f(1, 2, 3) = 4 9 1 2 x2 1 1 2 x2 2 1 3 x3 3 = 1 27 x2 1x2 2x3 3 Snadno ověříme, že F(-, -, -) = F(0, 0, 0) = 0, F(, , ) = F(1, 1, 3) = 1, což bylo třeba předpokládat. Pokud jde o marginální distribuční funkce, je jistě možné hledat je tak, že najdeme marginální hustoty (integrací přes nadbytečné proměnné) a z nich určíme příslušné distribuční funkce. Inte- graci přes nadbytečné proměnné ale můžeme provést také přímo v distribuční funkce, a to tak, že nadbytečné proměnné vyčíslíme v nekonečnu (rozmyslete). Pak máme FX1 (x1) = F(x1, , ) = F(x1, 1, 3) = x2 1, FX2 (x2) = x2 2, FX3 (x3) = 1 27 x3 3. pozn 6.2: Všimněme si, že jsme spočítali distribuční funkci pouze na jedné z mnoha oblastí. Pokud je hustota pravděpodobnosti definována po částech různými funkčními předpisy na různých intervalech, nejde to udělat jinak. To je poměrně nepraktické, protože počet oblastí roste exponenciálně s počtem náhodných proměnných tvořících náhodný vektor. Pokud je ale hustota pravděpodobnosti definovaná jedním funčním předpisem na omezené oblasti a všude jinde je nulová, můžeme si pomoci tak, že spočítáme distribuční funkci pouze na této oblasti. Při jejím vyčíslování v bodech ležících mimo tuto oblast budeme postupovat tak, že souřadnici ležící pod oblastí nahradíme souadnicí dolní hranice oblasti, souřadnici ležící nad oblastí nahradíme souřadnicí horní hranice oblasti. Tento postup je pochopitelně možné aplikovat pouze pro kartézský součin jednorozměrných intervalů. Příklad 6.3 Diskrétní náhodný vektor (X1, X2, X3) je popsán (simultánní) pravděpodobnostní funkcí (x1, x2, x3) = kx1x2x2 3, x1 {0, 1}, x2 {0, 1}, x3 {0, 1, 2, 3} 0 jinak a) Určete normovací konstantu k b) Najděte marginální pravděpodobnostní funkci 3 náhodné proměnné X3. c) Najděte marginální pravděpodobnostní funkci 12 náhodného vektoru (X1, X2). 27 a) Normovací konstantu určíme z normovací podmínky: 1 = 1 x1=0 1 x2=0 3 x3=0 (x1, x2, x3) = k 1 x1=0 x1 1 x2=0 x2 3 x3=0 x2 3 = k(0+1)(0+1)(0+1+4+9) = 14k k = 1/14. b) Marginální pravděpodobnostní funkci najdeme sumací simultánní pravděpodobnostní funkce přes volné (nadbytečné) proměnné 3(x3) = 1 x1=0 1 x2=0 (x1, x2, x3) = k 1 x1=0 x1 1 x2=0 x2x2 3 = 1 14 (0 + 1)(0 + 1)x2 3 = 1 14 x2 3 pozn 6.3: Na tomto místě je dobré si uvědomit, že postup, který používáme pro sčítání přes nad- bytečné proměnné (využití distributivnosti sčítání vůči násobení), je sice elegantní, ale nikoli uni- verzální; můžeme jej použít jen díky tomu, že pravděpodobnostní funkce má tvar součinu hodnot jednotlivých náhodných proměnných. Zcela obecně bychom museli sčítat člen po členu, přičemž výsledná pravděpodobnostní funkce by nemusela být vyjádřitelná funkčním předpisem. Tam, kde to bude možné, ale podobná zjednodušení budeme využívat. c) Použijeme stejný postup, jako v části b, pouze sumujeme přes jedinou volnou proměnnou X3 12(x1, x2) = x3 = 02 (x1, x2, x3) = 1 14 x1x2(0 + 1 + 4 + 9) = x1x2. Příklad 6.4 Spojitý náhodný vektor (X1, X2) je popsán hustotou pravděpodobnosti f(x1, x2) = 24x2 1(1 - x1)x2, x1 (0, 1), x2 (0, 1) 0 jinak Najdeme obě marginální hustoty pravděpodobnosti a ověříme platnost multiplikativního vztahu f(x1, x2) = f1(x1)f2(x2). f1(x1) = 1 0 24x2 1(1 - x1)x2dx2 = 12x2 1(1 - x1), f2(x2) = 1 0 24x2 1(1 - x1)x2dx1 = 24(1/3 - 1/4)x2 = 2x2. Multiplikativní vztah je splněn, obě proměnné jsou tedy stochasticky nezávislé. Příklad 6.5 Náhodné veličiny T1, T2, popisující doby života dvou částic, se řídí exponenciálním rozdělením s parametry 1 = 1 s-1 , 2 = 0,5 s-1 a jsou navzájem nezávislé. Jaká je pravděpodobnost, že druhá částice přežije první? Známe obě marginální hustoty pravděpodobnosti náhodného vektoru (T1, T2); platí fTi (ti) = i exp(-iti). Nezávislost obou veličin nám umožní zkonstruovat simultánní hustotu f(t1, t2) = fT1 (t1)fT2 (t2) = 12e-1t1 e-2t2 . Hledanou pravděpodobnost zapíšeme jako integrál hustoty přes oblast, na níž je splněno t1 > t2: P(t1 > t2) = t1>t2 f(t1, t2). Tuto oblast potřebujeme vhodně parametrizovat. Má-li být t2 < t1, pak integrál přes t2 půjde od 0 k t1. Integrál přes t1 pak půjde od 0 do . Integrál přes t2 bude vnitřní, integrál přes t1 vnější. 28 pozn 6.4: Pokud vám není jasné, proč je oblast parametrizována popsaným způsobem, nakreslete si obrázek znázorňující celý definiční obor proměnných T1, T2 a v něm oblast, v níž platí t1 > t2. Je jasné, že chceme-li popsat celou oblast, pak jedna proměnná prochází celý definiční obor (t1 jde od 0 k ), zatímco interval druhé je určen hodnotou první (t2 jde od 0 k t1). Pořadí integrálů je pak určeno závislostí proměnných. Máme tedy P(t1 > t2) = t1>t2 f(t1, t2) = 12 0 e-1t1 t1 0 e-2t2 dt2dt1 = 12 0 e-1t1 - 1 2 e-2t2 t1 0 dt1 = 1 0 e-1t1 1 - pozn 6.5: Vzhledem k tomu, že první částice má střední dobu života 1 s a druhá 2 s, je výsledek rozumný. Příklad 6.6 Předpokládejme, že doba čekání zákazníka u pokladny se řídí exponenciálním rozdělením s parametrem a že doby čekání různých zákazníků jsou navzájem nezávislé. Vybereme- li náhodně n zákazníků, jaká je pravděpodobnost, že a) nejdéle čekající zákazník čekal nejvýše po dobu y b) nejméně čekající zákazník čekal aspoň po dobu z Podobně jako v předchozím příkladě využijeme nezávislosti jednotlivých náhodných proměnných k sestavení simultánní hustoty pravděpodobnosti f(t1, . . . , tn) = n e- n i=1 ti . V případě a jdou integrační meze u všech proměnných od 0 k y (nejdéle čekající zákazník čeká nejvýše y právě tehdy, když každý zákazník čeká nejvýše y). Máme P(tmax < y) = . . . y 0 n e- n i=1 ti dt1 . . . dtn = y 0 e-t dt n = 1 - e-y n . V případě b jdou integrační meze u všech proměnných od z k (nejméně čekající zákazník čeká aspoň z právě tehdy, když každý zákazník čeká aspoň z). Máme P(tmin > z) = . . . z n e- n i=1 ti dt1 . . . dtn = z e-t dt n = e-z n = e-nz . Alternativně lze postupovat podobně, jako u příkladu ??. 29 7 Transformace náhodných proměnných Libovolná rozumná funkce náhodné proměnné (náhodného vektoru) je opět náhodná proměnná. Ve fyzice se s podobnými transformacemi setkáváme poměrně často. Bez ohledu na matematickou korektnost a úplnost se budeme zabývat několika významnými příklady. Obvykle máme dánu transformaci Y = (X) (kde X a Y jsou náhodné proměnné nebo vek- tory), známe distribuční funkci (pravděpodobnostní funkci, hustotu pravděpodobnosti) proměnné X a hledáme odpovídající funkci proměnné Y . Využíváme přitom skutečnosti, že pravděpodobnost určitého jevu je vždy stejná, bez ohledu na to, jakou náhodnou proměnnou je jev popsán. Je-li zobrazení prosté (tj. každé hodnotě proměnné Y odpovídá právě jedna hodnota proměnné X), pak pravděpodobnost odpovídající určité oblasti definičního oboru proměnné X je rovna pravděpodobnosti odpovídající takové oblasti definičního oboru proměnné Y , která vznikne aplikací zobrazení na původní oblast. P(Y (O)) = P(X O) pozn 7.1: Mějme náhodnou proměnnou X (X (0) = 0,4 X (1) = 0,6) a transformovanou proměnnou Y = X + 1. Její pravděpodobnostní funkci získáme ze vztahů typu P(X = 0) = P(Y = 0 + 1 = 1). Máme Y (1) = 0,4, Y (2) = 0,6. Není-li zobrazení prosté, pak určité oblasti definičního oboru proměnné Y může odpovídat více oblastí definičního oboru proměnné X, přes něž je nutné sčítat. P(Y O) = P(X -1 (O)) pozn 7.2: Mějme náhodné proměnné Xi (Xi (0) = 0,4 Xi (1) = 0,6) a transformovanou proměnnou Y = X1 + X2. Její pravděpodobnostní funkci získáme ze vztahů typu P(Y = 1) = P(X1 = 0, X2 = 1) + P(X1 = 1, X2 = 0). Máme Y (0) = 0,16, Y (1) = 0,48, Y (2) = 0,36. pozn 7.3: Uvedené transformační vztahy pro pravděpodobnost vypadají jednoduše, ale v obecném případě mohou být velmi složité. Je nutné vždy pečlivě prozkoumat vlastnosti transformace . pozn 7.4: Uvědomme si, že samotná hustota pravděpodobnosti nemá význam pravděpodobnosti, ten získá až po vynásobení infinitezimální oblastí definičního oboru. Netransformujeme tedy f(x), ale f(x)dx. Příklad 7.1 Planckův vyzařovací zákon pro spektrální hustotu zářivé energie v objemu V má tvar E() = V 8hc 5 1 e hc kT - 1 . Převed'te jej do podoby frekvenční závislosti (tj. nahrad'te náhodnou proměnnou transformova- nou náhodnou proměnnou = c/.) Můžeme si představit, že veličina E udává hustotu pravděpodobnosti, že náhodně vybraný malý dílek energie bude mít vlnovou délku . Od obvyklé hustoty pravděpodobnosti se E liší pouze mul- tiplikativním faktorem - není normována na jedničku, ale na celkovou energii. (Mluvíme o dílcích energie, ačkoli by se mohlo zdát rozumné používat pojem foton. Ale fotony různých vlnových délek nemají stejnou energii, proto je rozdělení počtu fotonů jiné, než rozdělení energií.) V našem případě je transformační zobrazení prosté (injektivní), proto využijeme platnosti vztahu E()|d| = E()|d|, kde = c/, |d| = cd/2 . Po dosazení dostáváme E() = V 8h3 c3 1 e h kT - 1 . 30 pozn 7.5: Často se místo celkové energie používá objemová hustota energie u = dE/dV . K ní pak obvyklým způsobem zavádíme spektrální hustoty obejmové hustoty energie u, popř. u . Mluvíme opravdu o hustotě hustoty. Objemová hustota energie u udává, kolik energie se nachází v jednotce objemu a má rozměr J.m-3. Spektrální hustota u udává, jak je objemová hustota rozložena podle jednotlivých vlnových délek. Její rozměr je J.m-4. Integrujeme-li spektrální hustotu objemové hustoty energie přes vlnovou délku, dostaneme objemovou hustotu energie, integrujeme-li dále přes objem, dostaneme celkovou zářivou energie ve zvoleném objemu. Příklad 7.2 Nezávislé spojité náhodné veličiny X1, X2 jsou popsány hustotami pravděpodobnosti fX1 (x1), fX2 (x2). Určete hustotu pravděpodobnosti transformované náhodné veličiny Y = X1 + X2. Protože zacházet přímo s hustotami není úplně jednoduché, spočítáme nejdřív distribuční funkci FY (y) proměnné Y jako integrál ze simultánní hustoty pravděpodobnosti náhodného vektoru (X1, X2) přes oblast, v níž platí x1 + x2 y. Necháme tedy například (integrační) proměnnou x1 procházet přes celý reálný obor, zatímco x2 půjde od - y - x1. FY (y) = - fX1 (x1) y-x1 - fX2 (x2)dx2 dx1 Dále budeme hledat hustotu fY . Integrál budeme derivovat jako funkci horní meze. fY (y) = d dy - fX1 (x1) y-x1 - fX2 (x2)dx2 dx1 = - fX1 (x1) d dy y-x1 - fX2 (x2)dx2 dx1 = - fX1 (x1)fX2 (y-x1) Hustota pravděpodobnosti součtu dvou náhodných proměnnýcb je tedy konvolucí hustot sčítanců. pozn 7.6: Je-li například rozšíření spektrální čáry dáno součtem působení náhodných vlivů s Gaus- sovým a Lorentzovým profilem, je výsledný profil konvolucí Gaussova a Lorentzova profilu (tzv. Voi- ghtův profil). Příklad 7.3 Nezávislé spojité náhodné veličiny X1, X2 jsou popsány hustotami pravděpodobnosti fX1 (x1), fX2 (x2). Určete hustotu pravděpodobnosti transformované náhodné veličiny a) Y1 = max(X1, X2) b) Y2 = min(X1, X2). a) Maximum dvou veličin je menší, než nějaká konstanta y1 právě tehdy, když každá z obou veličin je menší než konstanta y1. S využitím této skutečnosti (ve třetí rovnosti) lze psát Fmax (y1) =(1) P(Y1 y1) =(2) P(max(X1, X2) y1) =(3) P(X1 y1X2 y1) =(4) P(X1 y1)P(X2 y1) =(5) FX1 (y V této rovnici dále první a pátá rovnost plynou z definice distribuční funkce, druhá je vyjádřením Y pomocí transformace a čtvrtá plyne z nezávislosti obou náhodných proměnných. b) U minima postupujeme podobně, jako u maxima, pouze otočíme nerovnost a distribuční funkci nahradíme jejím doplňkem do jedné. 1-Fmin (y1) =(1) P(Y1 > y1) =(2) P(min(X1, X2) > y1) =(3) P(X1 > y1X2 > y1) =(4) P(X1 > y1)P(X2 > y1) =(5) [1- pozn 7.7: Postupy lze zobecnit na maximum/minimum libovolného počtu proměnných, pouze doplníme další činitele. Zejména pro n proměnných se stejnou distribuční funkcí F platí Fmax (y) = [F(y)]n, 1 - Fmin (y) = [1 - F(y)]n. Zkuste si tímto způsobem vyřešit příklad 6.6. 31 8 Číselné charakteristiky náhodných proměnných Distribuční funkce nese plnou, ale nepříliš informaci o náhodné proměnné. Proto se pro popis náhodných proměnných zavádí jednoduché číselné charakteristiky. Zavedeme střední hodnotu náhodné proměnné X E(X) = 0 xf(x)dx, E(X) = xpi(x) a podobně střední hodnotu funkce náhodné proměnné g(X) E(g(X)) = 0 g(x)f(x)dx, E(g(X)) = g(x)pi(x). Definujeme r-tý moment náhodné proměnné jako M(X, r, k) = E([x - k]r ). Je-li k = 0, mluvíme o počátečním momentu, je-li k = E(X), mluvíme o centrovaném momentu. První počáteční moment se nazývá střední hodnota, druhý centrovaný moment rozptyl (značíme jej D(X)) D(X) = E([X - E(X)]2 ). Pomocí třetího a čtvrtého centrovaného momentu se zavádí šikmost a špičatost. Další významnou třídou číselných charakteristik jsou kvantily. -kvantil, kde je libovolné reálné číslo z intervalu 0, 1 , se značí jako K a platí pro něj F(K) = . Speciálně K0,5 nazýváme medián, K0,25 a K0,75 dolní a horní kvantil, K0,75 - K0,25 je kvartilová odchylka. Označení modus používáme pro nejpravděpodobnější hodnotu (tj. pro bod, v němž má pravděpodobnostní funkce nebo hustota pravděpodobnosti maximum). Pro dvojici náhodných proměnných zavádíme kovarianci C(X1, X2) = E([X1 - E(X1)][X2 - E(X2)]) a koeficient korelace R(X1, X2) = C(X1, X2) D(X1)D(X2) Koeficient korelace udává míru závislosti náhodných veličin, je-li v absolutní hodnotě roven jedné, pak jsou na sobě náhodné veličiny zcela závislé (určení hodnoty jedné z nich určuje automaticky i druhou hodnotu), naopak pro nezávislé náhodné proměnné je koeficient korelace nulový (opačná implikace neplatí, pokud mají dvě náhodné veličiny nulový koeficient korelace, nemusí být ještě nutně nezávislé; tady se projevuje redukce informace obsažené v číselných charakteristikách). Příklad 8.1 Odvod'te užitečný vztah pro výpočet rozptylu D(X) = E(X2 ) - [E(X)]2 . E([X-E(X)]2 ) = E(X2 -2XE(X)+(E(X))2 ) = E(X2 )-E(2XE(X))+E(E(X))2 = E(X2 )-2E(X)E(X)+[E(X)]2 = E Pokud není některý z kroků jasný, představte si příslušnou úpravu na střední hodnotě vyjádřené pomocí sumy/integrálu. Příklad 8.2 Náhodná proměnná X se řídí exponenciálním rozdělením s parametrem 1. Najděte obecný kvantil, medián a kvartilovou odchylku. Hustota pravděpodobnosti má tvar f(x) = e-x = e-x . Integrací najdeme distribuční funkci F(x) = 1 - e-x . Podle definice platí F(K) = 1 - e-K = , odtud už snadno najdeme K = - ln(1 - ). Medián je K0,5 = 0,693, kvartily K0,25 = 0,288, K0,5 = 1,386, kvartilová odchylka je K = 1,099. 32 Příklad 8.3 Vypočtěte střední hodnotu (a případně i rozptyl) náhodné proměnné s rozdělením a) alternativním A() b) binomickým Bi(n, ) c) Poissonovým Po() d) exponenciálním Ex() a) Alternativní rozložení má pravděpodobnostní funkci (0) = 1 - , (1) = . E(X) = 1 0 x(x) = 0.(1 - ) + 1.() = E(X2 ) = 1 0 x2 (x) = 02 .(1 - ) + 12 .() = Odtud E(X) = , D(X) = (1 - ). b) E(X) = n x=0 x n x x (1 - )n-x = n x=1 n! (x - 1)!(n - x)! x (1 - )n-x x jsme pohltili faktoriálem. Pokud ze sumy vytkneme n, upravíme faktoriály zpět na kombinační číslo. Pokud dále vytkneme a zavedeme substituci y = x - 1, m = n - 1, převedeme sumu opět na binomický součet, který, jak víme, je roven jedné. n x=1 n! (x - 1)!(n - x)! x (1-)n-x = n n x=1 (n - 1)! (x - 1)!(n - x)! x-1 (1-)n-x = n m y=1 m! y!(m - y)! y (1-)m-y = n U druhé mocniny postupujeme podobně, pouze je nutné úpravu provést dvakrát. E(X2 ) = n x=0 x2 n x x (1-)n-x = n n-1 x=0 (x+1) n - 1 x x (1-)n-1-x = n[(n-1) +1] Odtud E(X) = n, D(X) = n(1 - ). c) Postup je podobný, jako v části b, v posledním kroku sčítáme Taylorovu řadu e . Používáme substituci y = x - 1. E(X) = x=0 x x x! e- = x=1 x (x - 1)! e- = y=0 y y! e- = e e- = , E(X2 ) = x=0 x2 x x! e- = y=0 (y + 1) y y! e- = ( + 1). Odtud E(X) = , D(X) = . d) Oba integrály jsou praktickým cvičením metody per-partes. E(X) = 0 xe-x = 1 , E(X2 ) = 0 x2 e-x = 2 2 . Odtud E(X) = 1/, D(X) = 1/2 . 33 Příklad 8.4 Spojitý náhodný vektor (X, Y ) má hustotu pravděpodobnosti f(x, y) = (1 - x + y), x (0, 1), y (0, 1) 0 jinak Určete E(X), E(Y ), D(X), D(Y ), C(X, Y ), R(X, Y ). Pro nalezení průměrů a rozptylů jednotlivých proměnných se vyplatí nalézt marginální distribuční funkce. fX (x) = 1 0 (1 - x + y)dy = 1 - x + 1 2 = 3 2 - x, fY (y) = 1 0 (1 - x + y)dx = 1 + x - 1 2 = 1 2 + y. Dále najdeme střední hodnoty a rozptyly. E(X) = 1 0 x 3 2 - x dx = 3 4 - 1 3 = 5 12 , E(Y ) = 1 0 y 1 2 + y dy = 1 4 + 1 3 = 7 12 , E(X2 ) = 1 0 x2 3 2 - x dx = 1 2 - 1 4 = 3 12 , E(Y 2 ) = 1 0 y2 1 2 + y dy = 1 6 + 1 4 = 5 12 . D(X) = 11 144 , D(Y ) = 11 144 . Ted' už můžeme spočítat kovarianci a koeficient korelace. C(X, Y ) = 1 0 1 0 x - 5 12 y - 7 12 (1 - x + y)dxdy = 1 144 R(X, Y ) = C(X, Y ) D(X)D(Y ) = 1 11 . Příklad 8.5 Diskrétní náhodný vektor (X1, X1) je popsán pravděpodobnostní funkcí (x1, x2) = 1 10 (x1 + 2x2 + 1), x1 {0, 1}, x2 {0, 1} 0 jinak . Najděte koeficient korelace R(X1, X2). Najdeme marginální pravděpodobnostní funkce X1 (x1) = 1 x2=0 1 10 (x1 + 2x2 + 1) = 1 10 )(2x1 + 4), X2 (x2) = 1 x1=0 1 10 (x1 + 2x2 + 1) = 1 10 )(4x2 + 3). Určíme střední hodnoty a rozptyly. E(X1) = 6 10 , E(X2) = 7 10 , D(X1) = - 6 10 2 4 10 + 4 10 2 6 10 = 6 25 , D(X2) = - 7 10 2 3 10 + 3 10 2 7 10 = 21 100 . Dále spočítáme kovarianci C(X1, X2) = - 6 10 - 7 10 1 10 + 4 10 - 7 10 2 10 + - 6 10 3 10 3 10 + 4 10 3 10 4 10 = - 1 50 . Odtud už snadno najdeme koeficient korelace R(X1, X2) = - 1 20 sqrt 6 25 21 100 = - 1 3 14 = -0,089. 34 Příklad 8.6 Spojité náhodné proměnné X1, X2 mají rovnoměrné rozdělení na intervalu (0, 1). Jaká je střední hodnota a rozptyl proměnné Y = max (X1, X2)? Distribuční funkce obou původních proměnných je FX (x) = x. V příkladu 7.3 jsme ukázali, že distribuční funkce maxima je FY (y) = y2 a odpovídající hustota pravděpodobnosti je f(y) = 2y. Nyní už snadno spočítáme E(Y ) = 1 0 y2ydy = 2 3 , E(Y 2 ) = 1 0 y2 2ydy = 1 2 , D(Y ) = 1 18 . Příklad 8.7 Rychlosti molekul ideálního plynu se řídí Boltzmannovým rozdělením f(vx, vy, vz) = m 2kT 3/2 exp(- m(v2 x + v2 y + v2 z) 2kT ). Odvod'te Maxwellovo rozdělení velikostí rychlosti a najděte střední rychlost, nejpravděpodobnější rychlost a střední kvadratickou rychlost. 35