MA 0008 - Teorie pravděpodobnosti
PEDAGOGICKÁ FAKULTA MASARYKOVY UNIVERZITY
Břetislav Fajmon
Verze textu: březen 2024
MA 0008 - Teorie pravděpodobnosti 3
Obsah
1 Týden 01: Popisná statistika 7
1.1 Přednáška 01: Statistika v prostředí Excel .................. 7
1.2 Cvičení 01: Zpracování souboru měření - průměr .............. 8
2 Týden 02: Popisná statistika II 10
2.1 Přednáška 02: Statistická a axiomatická definice pravděpodobnosti..... 10
2.2 Shrnutí...................................... 19
2.3 Otázky a cvičení 02: Rozptyl, intervalové četnosti, kvantily......... 19
3 týden 03 24
3.1 Čtyři různé modely popisu pravděpodobnosti................. 24
3.1.1 Klasická pravděpodobnost....................... 24
3.1.2 Geometrická pravděpodobnost..................... 25
3.1.3 Diskrétní pravděpodobnost....................... 27
3.1.4 Spojitá pravděpodobnost........................ 29
3.2 Shrnutí...................................... 30
3.3 Otázky k opakování a cvičení 03........................ 30
3.3.1 Klasická pst............................... 31
3.3.2 Geometrická pst............................. 33
4 Týden 04 36
4.1 Přednáška 04: Věta o součtu pravděpodobností, věta o součinu pravděpodobností, podmíněná pst....................... 36
4.2 Shrnutí...................................... 43
4.3 Otázky k opakování a cvičení 04: pst průniku a sjednocení, podmíněná pst 44
4.3.1 Pst sjednocení či průniku či části množin............... 45
4.3.2 Podmíněná pst............................. 47
5 Týden 05 48
5.1 Bernoulliovy pravděpodobnosti ........................ 48
5.2 Úplná pravděpodobnost ............................ 52
5.3 Bayesův vzorec................................. 54
5.4 Shrnutí...................................... 55
5.5 Otázky k opakování a cvičení 05: Bernoulliovy psti, věta o úplné psti, Bayesův vzorec................................... 56
5.5.1 Binomické psti = Bernoulliho psti................... 57
5.5.2 Úplná pst nebo Bayesův vzorec.................... 58
6 Procvičování příkladů, prověrka 60
7 Týden 07 66
7.1 Přednáška 07: Diskrétní a spojitá náhodná veličina, střední hodnota a rozptyl, distribuční funkce............................. 66
4
Katedra matematiky PedF MUNI v Brně
7.2 Cvičení 07: Diskrétní a spojitá náhodná veličina, distribuční funkce, střední
hodnota a rozptyl................................ 77
8 Týden 08 81
8.1 Některá význačná rozdělení pravděpodobnosti - diskrétní i spojitá..... 81
8.2 Cvičení 08.................................... 85
9 Týden 09 87
9.1 Normální rozdělení psti............................. 87
9.1.1 Normální rozdělení pravděpodobnosti................. 87
9.1.2 řJ-rozdělení............................... 90
9.1.3 Aproximace binomického rozdělení normálním s korekcí....... 97
9.2 Cvičení 09.................................... 99
10 Týden 10 102
10.1 Přednáška 10: Úvod do úsudkové statistiky - statistické testy........ 102
10.1.1 Statistické rozhodování - chyba 1. druhu a chyba 2. druhu..... 102
10.1.2 Statistický test střední hodnoty binomického rozdělení....... 104
10.1.3 Statistický test střední hodnoty průměru z normálního rozdělení . . 107
10.2 Cvičení 10: úvod do statistických testů.................... 111
11 Týden 11 112
11.1 Nestranný a konzistentní odhad parametru rozdělení ............ 112
11.2 r-test typu „ji =konstanta"........................... 118
11.3 Několik poznámek ke statistickému testu................... 123
11.4 Interval spolehlivosti pro střední hodnotu /i průměru X........... 126
11.4.1 Interval spolehlivosti pro /i při známém rozptylu........... 126
11.4.2 Interval spolehlivosti pro /i při neznámém rozptylu ......... 127
11.4.3 Několik důležitých poznámek k intervalům spolehlivosti....... 128
11.5 r-test typu „jii = ^2".............................. 131
11.5.1 Párový test............................... 131
11.5.2 Nepárovýtest.............................. 134
11.6 Předpoklady použitelnosti parametrických testů............... 138
11.7 Shrnutí...................................... 139
11.8 Otázky k opakování a úlohy ke cvičení.................... 140
12 Týden 12 143
12.1 Vlastnosti rozdělení x2............................. 143
12.2 Využití rozdělení \2............................... 147
12.2.1 Testování hypotézy a2 = konst .................... 147
12.2.2 Test druhu rozdělení - \2 test dobré shody.............. 148
12.2.3 Testování nezávislosti v kontingenční tabulce............. 150
12.3 Neparametrický Mannův-Whitneyův test podle pořadí........... 151
12.4 Shrnutí...................................... 154
12.5 Otázky k opakování a cvičení 12........................ 157
MA 0008 - Teorie pravděpodobnosti 5
13 Týden 13 161
13.1 Přednáška 13.................................. 161
13.2 Cvičení 13: Zápočtové příklady 1-2...................... 161
13.3 Cvičení 13: Zápočtové příklady 3-10...................... 162
14 Odpovědi na otázky a výsledky některých cvičení 164
14.1 Výsledky cvičení 1.2 .............................. 164
14.2 Výsledky cvičení 2.3 .............................. 164
14.3 Výsledky cvičení 3.3 .............................. 169
14.4 Výsledky cvičení 4.3 .............................. 171
14.5 Výsledky cvičení 5.5 .............................. 172
14.6 Výsledky cvičení ke kapitole 6......................... 174
14.7 Výsledky cvičení 7.2 .............................. 174
14.8 Výsledky cvičení 8.2 .............................. 176
14.9 Výsledky cvičení 9.2 .............................. 177
14.10Výsledky cvičení 10.2.............................. 180
14.11Výsledky cvičení 11.8.............................. 182
14.12Výsledky cvičení 12.5.............................. 183
6
Katedra matematiky PedF MUNI v Brně
Úvod
Rádi bychom v tomto textu poskytli materiál, který podepře výuku předmětu MA0008 na Pedagogické fakultě Masarykovy Univerzity v Brně.
Představit pravděpodobnost i statistiku v jednom semestru není jednoduché - přesto je kurs někdy zaměřen kromě jistých metod, které mohou pomoci na ZS při prezentaci nebo zpracování statistických údajů v Excelu (tomu bude též věnována pozornost), také na výpočty a některá odvození vysokoškolského rázu. Studenti mají částečné povědomí o statistických metodách z kurzů věnovaných tomu, jak psát bakalářskou práci a jak dělat pedagogický výzkum - tento kurs MA 0008 by měl nejen navázat na takové kursy, ale navíc poskytnout jistou matematickou důkladnost v některých věcech, a odvození a vysvětlení základních faktů, je-li to možné zejména s využitím některých znalostí zejména z matematické analýzy (pravděpodobnost je totiž mezioborem matematiky, protože se snaží popisovat náhodnost jak u diskrétních, tak u spojitých veličin, tj. využívá poznatky „diskrétních" i „spojitých" matematických disciplín).
Při psaní textu budou využity zkušenosti získané z učebního textu (Fajmon, Hlavičková, Novák 2014) společně s mými bývalými kolegy na FEKT VUT, kde byl hojně využit i text (Loftus, Loftusová 1988). Důležitým textem na téma pravděpodobnosti z Brněnské matematické komunity je (Budíková, Králová, Maroš 2009). Na pedagogické fakultě se ovšem musíme také držet patřičně „při zemi" a myslet na středoškolskou úroveň, popřípadě úroveň ZS - materiálem reprezentujícím tuto oblast je učebnice (Robova, Hála, Calda 2013). Děkuji také studentům Petrovi Nezvalovi a Romaně Hodkové za přepis některých částí skript v počítačovém prostředí TEX.
Obsah předmětu je rozdělen na tří části:
• Cvičení 01-02: Popisná statistika - zpracovává informace na základě naměřených dat pomocí tabulek, grafů, funkcí, číselných hodnot. V podstatě vyučováno na ZS. Výuka bude doplněna úkoly zpracovanými v programu Excel.
• Přednáška 01-08, cvičení 03-08: Teorie pravděpodobnosti - zabývá se popisem náhodnosti v experimentech či měřeních veličin, kdy za stejných vstupních podmínek nastávají různé výsledky.
• Přednáška a cvičení 09-12: Usudková statistika - prezentace některých metod analýzy dat, kdy je informace získaná z náhodného výběru jedinců zobecněna na celou populaci. Její součástí je teorie odhadu, testování statistických hypotéz, statistická predikce (předpověď).
Text je v roce 2024 stále dokončován.
Břetislav Fajmon, březen 2024
MA 0008 - Teorie pravděpodobnosti
7
1 Týden 01: Popisná statistika
1.1 Přednáška 01: Statistika v prostředí Excel
Zde má být napsána přednáška o základech statistického zpracování dat v Excelu. Na základě následujících videí jsem zpracoval základní pokyny ke zpracování dvou typů proměnných v Excelu, a jsou přístupné v souboru Olpred-cetnosti.xlsx v materiálech k předmětu v IS.
• https://www.youtube.com/watch?v=2AlnqRN0jKY&ab_channel=AG-IVT
• https://www.youtube.com/watch?v=3bNt_i_bR24&ab_channel=AG-IVT
• https://www.youtube.com/watch?v=c2flHZlZ9UY&list=PLGlp46vbIbJ7uBqh-vaGUAN7a-Gt4-Q3.
• https://www.youtube.com/watch?v=tLlKCplmlCY&list=PLGlp46vbIbJ7uBqh-vaGUAN7a-Gt4-Q3
• https://www.youtube.com/watch?v=GxqV77AbfGw&list=PLGlp46vbIbJ7uBqh-vaGUAN7a-Gt4-Q3
• https://www.youtube.com/watch?v=o55UX0nPSas&list=PLGlp46vbIbJ7uBqh-vaGUAN7a-Gt4-Q3
Na první přednášce je také tradičně prováděno malé statistické šetření: Každý ze studentů anonymně vyplní pět údajů: 1) muž či žena (zaškrtněte); 2) barva očí; 3) druh domácího mazlíčka (nikoli počet mazlíčků, ale co ten váš domácí mazlíček je: např. křeček, kniha, apod.; 4) výška v cm; 5) počet sourozenců v rodině, do které jste se narodili (= počet dětí v rodině včetně vás samotných). Výsledky tohoto výzkumu si projdeme na cvičení, a také je vidíte v souboru 01cvic-obleky-a-anketa.xlsx, kde se můžete podívat na hodnoty měření a jejich průměr a rozptyl v minulých letech.
Zbyde-li na přednášce čas, začněte přednášku číslo 2!!!!!!!!
8
Katedra matematiky PedF MUNI v Brně
1.2 Cvičení 01: Zpracování souboru měření — průměr
Na tomto cvičení se výuka zhruba odehrává podle slajdu 01cviceni-znak-a-prumer.pptx, ale za diskrétní proměnnou zpracovávanou bereme většinou počet dětí v rodině, za intervalovou proměnnou bereme většinou výšku studentů. Pokud cvičení následuje hned po přednášce, lze vzít hodnoty souboru z loňského roku, nebo v souboru 01cvic-obleky-a-anketa.xlsx jsou data o fiktivním počtu prodaných obleků a data o fiktivní výšce u 200 zaměstnanců jisté firmy (zajímavější je asi projít data studentů z minulého roku).
• Statistická jednotka - elementární jednotka podrobená zstatistickému zpracování (např zaměstnanec, student, firma, věc). Jedna zpracovávaná jednotka má zpravidla několik statistických znaků
• Statistický znak = (stat. proměna) - konkrétní vlastnost stat. jednotky (věk zaměstnance, mzda zaměstnance, zaměstnancovo vzdělání,...)
1. kvantitativní znak (quantity = množství)
Lze vyjádřit číselně (počet členů v domácnosti, spotřeba vody,...) Kvantitativní znaky často dále dělíme na:
— diskrétní znaky ... nabývají oddělených číselných hodnot (N), např. počet členů domácnosti, počet výrobků)
— spojité znaky ... nabývají hodnot z intervalu, např. spotřeba vody, doba čekání na příchod zákazníka
2. kvalitativní = nominální = kategoriální znak
Vyjadřuje se slovně (nomen = jméno, název) nebo subjektivním číslem Kvalitativní znaky dělíme na:
— alternativní ... nabývají dvou hodnot (ano-ne, muž-žena, pravda-lež)
— množné ... nabývají 2 a více hodnot (vzdělání: ZS, SS, VS, Ph.D.)
— ordinální ... vyjádřené subjektivní stupnicí (míra spokojenosti s výrobkem vyjádřena na číselné škále 1- hodně, 5- vůbec ne, známka ve škole)
I kvalitativní znaky lze vyjádřit číslem a zpracovat počítačem
— alternativní ... např ano = 1, ne = 0
— množné ... např ZŠ = 1, SŠ = 2, VŠ = 3, Ph.D. = 4
— ordinální ... už je vyjádřeno číslem na stupnici (např 1 až 5)
Ovšem tyto číselné hodnoty jsou subjektivní, např 2 minus 1 je číselně to samé jako 3 minus 2, přesto nelze říci, že existuje stejný odstup mezi "rozhodně ano" a "spíše ano" jako mezi "nevím" a "spíše ano" (nebo ve škole nelze říci, že mezi známkou 1 a 2 je hodnotově stejný rozdíl jako mezi 4 a 5)
Příklad na ZS - práce v hodině
• kvantitativní znaky ... počet sourozenců, výška v cm,velikost nohy
• kvalitativní znaky ... barva očí, chlapec/dívka, oblíbený předmět
MA 0008 - Teorie pravděpodobnosti
9
Jak získáme data? Měřením nebo dotazníkem.
• Základní soubor ... soubor všech jednotek, na kterých má smysl sledovat určité znaky = proměnné. Zpravidla je velmi obsáhlý, někdz nekonečný, tj. změřit všechny jednotky je často nákladné nebo neproveditelné.
A proto provádíme tzv.
• Výběrové šetření ... pro získání informací ze základního souboru vybereme jenom několik jednotek - měřením či dotazníkem. Získáme tzv. výběrový soubor
Tento výběrový soubor by měl bát získán z tzv. reprezentativního vzorku populace = z takové množiny vybraných jedinců, který je věrnou zmenšeninou populace, má tedy stejné vlastnosti. Výběr nestraní, žádnému jednotlivci nebo skupině, tvoří ho jednotky pro základní soubor typické. (Získat takový nestranný vzorek může být dost náročné)
Máme 3 druhy průměru, které můžeme počítat - jejich vysvětlení a zdůvodnění viz cvičení.
1. Aritmetický průměr hodnot: x = ^ • Jľľ=i x*
2. Geometrický průměr hodnot: xq = y/xi
' x2 ' ... ' xn
3. Harmonický průměr hodnot: x h = ^nn j_
Úloha 1.1 50 studentů psalo test z pravděpodobnosti. Jejich bodové zisky byly následující. 5 studentů získalo 4 body, 10 studentů 6 bodů, 12 studentů 8 bodů, 15 studentů 11 bodů a zbylí studenti 12 bodů. Vypočtěte v excelu aritmetický průměr bodů.
Úloha 1.2 Hodnoty růstu firmy v procentech za posledních 5 let byly 101,3%, 108,5%, 100,6%, 98,7% a 102,3%. Vypočtěte průměrný roční nárůst za dané pětileté období.
Úloha 1.3 Slon šel na vycházku po obvodu svého čtvercového výběhu o straně 2 km, po jedné straně šel rychlostí 1 km/h, druhou rychlostí 2 km/h, třetí rychlostí 4 km/h, a poslední opět lkm/h. Jaká byla jeho průměrná rychlost během jeho vycházky?
Odpovědi na otázky a některá cvičení viz 14.1.
Pokyny k jazyku R ignorujte, to je taková alternativa k Excelu, jazyk R doporučuji používat jako dobrou kalkulačku (musíte nainstalovat u sebe, manuály k matematickým funkcím a operacím najdete na internetu i v češtině).
Ve cvičení bude ještě čas začít slajdy 02, přesněji 02cviceni-popisna-statistika.xlsx, a zde jsou úkoly k příkladu s obleky, namísto kterého zpravidla děláme příklad s počty dětí v rodině - najděte četnosti a zpracujte podle úkolů na straně 3 slajdů ... po a),b) pokračujte s částí e) a nalezením kvantilů. Části c),d) se asi stihnou na cvičení druhém.
10
Katedra matematiky PedF MUNI v Brně
2 Týden 02: Popisná statistika II
2.1 Přednáška 02: Statistická a axiomatická definice pravděpodobnosti
Ve slově pravděpodobnost vidíme, že se jedná o něco podobného pravdě, nebo blízké pravdě. Při hledání odpovědi na otázku, co je to pravda, bychom asi slyšeli řadu odpovědí. Na tuto otázku se například zeptal i Pilát Ježíše Krista, když ho vyslýchal před jeho popravou. Neměl dost trpělivosti počkat si na odpověď, kterou už dříve Ježíš řekl svým učedníkům (Jan 14,6 - Bible): Já jsem ta cesta, pravda i život, nikdo nepřichází k Otci než skrze mne. Všeobsáhle mluvící apoštol Jan ve svém evangeliu také říká (Jan 1,17): Milost a pravda se stala skrze Ježíše Krista. Tj. pravda, to nejsou jen slova, ale pravdou lze nazvat též skutečnost (věci, které se odehrály - v pojetí Bible ovšem pravda je něco víc než jen to, co se odehrálo, ale ve slově pravda je obsažena i věrnost, že v životě Ježíše Krista byl Pán Bůh věrný vůči nám lidem). Tedy
• Pravda = skutečnost.
• Pravda = věrný či přesný popis skutečnosti. Z matematického hlediska se jedná i o zákonitosti, které stojí za skutečností, např. 2 + 2 = 4. Z pohledu statistiky se může jednat o záznamy srážek v úhrnu za každý den na daném meteorologickém stanovišti.
V tomto předmětu se budeme zabývat tou částí pravdy, která souvisí se druhým uvedeným bodem: popisem skutečnosti, zejména tedy popisem měření číselných (kvantitativních) veličin, i když někdy lze matematicky zpracovat i veličiny kvalitativní (kvalitu či spokojenost s kvalitou dnes často vyjadřujeme i na číselné stupnici, kde např. 1 = velmi dobrá kvalita, 2 = spíše dobrá kvalita, 3 = průměr, 4 = spíše horší kvalita, 5 = špatná kvalita). Přitom
• Ve statistice (a statistické pravděpodobnosti) většinou jde o popis veličiny a po-steriori1, tj. na základě měření či zkušenosti (slovo zkušenost je pokusem o překlad slova empirie - empirické poznání je poznání, které můžeme číselně změřit či zaznamenat, např. informace o tom, jak nám v našem impériu prší).
• V pravděpodobnosti se jedná o popis veličin a priori2, kdy na základě teoretických informací o povaze daného experimentu chceme popsat matematickým aparátem, jak nám v našem impériu budou padat čísla na kostce, líce či ruby na minci, apod. ještě dříve, než k měření dojde.
V Této přednášce se budeme věnovat dvěma definicím (pojetím) pravděpodobnosti.
Definice 2.1 Statistickou pravděpodobností náhodného jevu A, který při opakování experimentu či měření za stejných vstupních podmínek nastává jen v některých případech,
XZ latinské předložky post či posteá, což znamená potom, poté. 2Z latinského prior = dřívější, tj. a priori = dříve než, předem.
MA 0008 - Teorie pravděpodobnosti
11
definujeme jako takové reálné číslo, ke kterému se blíží relativní četnost výskytu jevu A, pokud celý experiment opakujeme nekonečnékrát, tj.
P (A) = lim
n—¥00 n
Předností této definice je fakt, že pokud jsme schopni dostatečně zajistit, aby měření experimentu bylo vykonáno vždy za stejných vstupních podmínek, máme predikci neboli předpověď pravděpodobnosti výskytu jevu A podloženu reálným měřením. Slabinou definice je to, že přesnou hodnotu limity nikdy nejsme schopni experimentálně zjistit - experiment nelze opakovat nekonečnékrát. Nicméně, při dostatečně velkém n lze tuto pravdě podobnost rozumně odhadnout.
Příklad 2.1 Jaká je pst náhodného jevu A: při hodu kostkou padne šestka? Při statistickém určení psti vycházíme z opakování experimentu, hodíme tedy
• desetkrát, a pro n = 10 dostaneme P (A) = = 0,3;
• stokrát, a pro n = 100 dostaneme P (A) = ^ = 0,2;
• tisíckrát, a pro n = 1000 dostaneme P (A) = = 0,17; stále se nejedná o přesnou hodnotu, ale hodnotu blízkou hledané limitě.
Zatímco právě popsané statistické pojetí psti nebudeme zanedbávat (koneckonců, v řadě případů máme k popisu budoucího chování veličiny pouze její minulá měření), ještě častěji budeme užívat pojetí axiomatické, které je představené v následující definici (pomůcka pro zapamatování definice: potřebujete si pamatovat sedm faktů: 1) co je to íž; 2,3,4) tři axiomy (1), (2), (3) pro náhodné jevy A%] 5,6,7) tři axiomy (PI), (P2), (P3) pro pst P, která je definována jako zobrazení určitých vlastností).
Definice 2.2 Pravděpodobnostním prostorem nazveme uspořádanou trojici (íž, A, V), kde
• íl je tzv. základní prostor neboli množina všech možných elementárních výsledků uj1 daného měření či experimentu;
• A je tzv. jevové pole neboli taková třída podmnožin At (tyto podmnožiny nazýváme náhodné jevyJ množiny íl (nemusí to být nutně všechny podmnožiny množiny íl, ale takové, ...), že platí axiomy
(1) íl E A;
(2) pro A\,Ai E A také A\ — A2 G A (třída A je uzavřená na rozdíl náhodných jevů);
(3) pro Ai,A%,--- E A také \jl*11aí E A (třída A je uzavřená na sjednocení nekonečně mnoha náhodných jevů A±, A2, ■ ■ ■ )■
• P : A —> {/; 00) je zobrazení, které nazveme pravděpodobností na jevovém
poli A, když pro ně platí axiomy
12
Katedra matematiky PedF MUNI v Brně
(PI) .P(ŕž) = 1 (axiom normovanosti);
(P2) P (A) > O y A E A (axiom nezápornosti);
(P3) pro navzájem neslučitelné jevy (Ai Pl A,- = 0 při í ^ j) platí
oo oo
P(\jAl) = ^P(Al)
1=1 1=1
(axiom součtu praváěpoáobností nekonečně mnoha neslučitelných náhoáných jevů).
Právě uvedená axiomatická definice umožňuje korektně definovat všechny různé pravděpodobnostní modely - budeme se jimi zabývat v následující přednášce. Nejprve ovšem několik poznámek k ní:
Poznámka 1. Axiom (3) u jevového pole A lze vyslovit i pro konečně mnoho náhodných jevů A±, A2..., An E A. Nemusíme ho ovšem uvádět jako zvláštní axiom, plyne totiž z uvedeného třetího axiomu volbou 0 = An+i = An+2 = ...: pro Au A2,...,An E A také Uľ=i Al E A (třída A je uzavřená i na sjednocení konečně mnoha náhodných jevů A±, A2, ■ ■ ■).
Poznámka 2. Axiom (P3) u pravděpodobnosti P lze vyslovit i pro konečně mnoho navzájem neslučitelných náhodných jevů A±, A2..., An E A. Nemusíme ho ovšem uvádět jako zvláštní axiom, plyne totiž z uvedeného třetího axiomu volbou 0 = An+i = An+2 =
n n
(A n Aj= 0 pro i j) P(\J Ai) = P(Ai).
i=i i=i
Poznámka 3. K jednotlivým axiomům psti:
ad Pl) Pravděpodobnost jevu íž je rovna jedné, protože íž obsahuje všechny možné výsledky měření, které mohou nastat. Jev íž proto někdy označujeme jako jev jistý, protože nastane vždy.
ad P2) Pravděpodobnost náhodného jevu A bude vždy číslo nezáporné.
ad P3) Jednotlivé náhodné jevy se navzájem vůči sobě vztahují podmínkou aditivity (= podmínkou sečtitelnosti): Pokud výskyt jevu A\ se vylučuje s výskytem jevu A%, pak pst jevu AiU^ lze vyjádřit jako součet pstí dílčích jevů A±, Ai. Tento princip je vlastně analogický principu součtu v kombinatorice. A podobně jako kombinatorice počet sjednocení dvou množin konfigurací, které mají některé prvky ve společném průniku, nelze už vyjádřit jako součet prvků dílčích množin, ale musíme brát v úvahu jejich průnik a užít princip inkluze a exkluze, tak i u pravděpodobnosti obecného sjednocení jevů, z nichž dílčí dvojice jevů nemají prázdný průnik, musíme podobně užít složitější vzorec - budeme se mu věnovat ve třetí přednášce.
Kromě daných tří axiomů psti platí i další vlastnosti (viz následující dvě věty). Ty už nepokládáme za axiomy, protože jejich zdůvodnění plyne z axiomů už uvedených.
MA 0008 - Teorie pravděpodobnosti
13
Věta 2.1
VA, B z jevového pole : A C B ==> P{A)
0, P(B - A) > 0 na základě (P2), vidíme, že P(B) získáme jako součet dvou nezáporných čísel, z nichž jedním je číslo P (A) - proto platí tvrzeníčko věty. □
Příklad 2.2 Náhodný jev A udává, že při hodu vyváženou kostkou padne počet ok roven šesti. Jaká je jeho pst?
Řešení: tuto pst nezjišťujeme experimentem, ale na základě teoretických předpokladů: množina všech možných elementárních výsledků je íl = {loi, lú2, lo^, lo4, lo5, loq} Všechny tyto výsledky nastávají stejně často. Tedy
P(w6) = ^ = 0,1666666666666666ard.
Příklad 2.3 Náhodný jev A udává, že při hodu dvěma kostkami, červenou a modrou, padne součet ok roven pěti. Jaká je jeho pst?
Řešení: viz přednáška.
Věta 2.2 Pro každý náhodný jev A a jev k němu opačný3 A platí P (A) + P (A) = 1.
Důkaz: Celou množinu íl lze rozdělit (rozložit) na dvě disjunktní množiny A, A. Tedy na základě (PI) a (P3) platí P(íl) = 1 = P (A) + P(Ä). □
Právě uvedená větička bude užitečná, namísto výpočtu P (A), když bude pro nás jednodušší vypočítat pst P (A) jevu opačného, a pak vyjádříme P (A) jako 1 — P (A).
Příklad 2.4 Jaká je pst, že při náhodném vybrání čtyř karet z balíčku dvaatřiceti mariášových karet je aspoň jedna karta eso ?
Řešení viz přednáška: a) pomocí jevu A, b) pomocí opačného jevu A; c) pomocí jevu A podle metody Matouše Hájka.
Příklad 2.5 Jaká je pst, že pokud hodíme současně pětikorunou, desetikorunou a dvacetikorunou, padne dvakrát líc a jednou rub?
Řešení viz přednáška.
Příklad 2.6 Hážeme současně pěti kostkami, a sice červenou, modrou, zelenou, žlutou a bílou. Jaká je pst, že právě na dvou z pěti kostech padne počet ok šest?
3 V teorii psti mají všechny množinové pojmy svůj terminologický ekvivalent. Množinově je A doplňkem množiny A, ale v teorii psti mluvíme o A jako o jevu opačném.
14
Katedra matematiky PedF MUNI v Brně
Řešení viz přednáška.
Předchozí čtveřice příkladů dobře ilustruje některé základní problémy a pojmy při popisu náhodnosti zatím jen u házení kostkou nebo mincí. Než kapitolu ukončíme, tak ještě série dvou příkladů, která snad nejlépe ilustruje rozdíl mezi pstí statistickou (empirickou) a pstí axiomatickou (teoretickou):
Příklad 2.7 Byla získána data tím způsobem, že každá z dvaceti osob hodila čtyřikrát korunou (měříme tedy hodnotu veličiny X = počet líců ve čtyřech hodech korunou). V tabulce 14-18 jsou zaznamenány počty líců ve čtyřech hodech u každé z osob. Určete empirické rozdělení pravděpodobnosti veličiny X.
Tabulka 2.1: K př. 2.7: Naměřené hodnoty veličiny X.
osoba 1 2 3 4 5 6 7 8 9 10
X-hodnota 3 1 1 3 1 2 0 2 4 4
osoba 11 12 13 14 15 16 17 18 19 20
X-hodnota 1 2 2 1 2 1 2 3 3 3
Řešení: Nejprve si všimněme, že naše veličina X nabývá pouze pěti hodnot, a to 0, 1, 2, 3 nebo 4. Zpracování této úlohy je založeno na pojmu četnost, který udává počet výskytů dané hodnoty v našem souboru. Například ze všech dvaceti měření je jen jedna hodnota 0, tj. veličina X nabývá hodnoty 0 s četností 1 (budeme značit c(0) = 1). Hodnota 1 se vyskytuje s četností 6, atd. Všechny četnosti jsou zaznamenány v tabulce 2.2:
Tabulka 2.2: K př. 2.7: Tabulka empirických četností hodnot veličiny X.
X-hodnota 0 12 3 4
četnost 1 6 6 5 2
Musí platit jednoduchá kontrola, že součet všech četností ve druhém řádku tabulky je roven počtu hodnot (v našem případě 20).
Uvedené četnosti lze také znázornit v tzv. histogramu četností - viz obr. 2.1, kde výšky jednotlivých obdélníčků jsou rovny konkrétním četnostem a délka základny každého z obdélníčků je rovna 1.
K určení statistického (či empirického = naměřeného) rozdělení pravděpodobnosti nám zbývá poslední krok - vydělit četnosti délkou souboru (= počtem hodnot), v našem případě
MA 0008 - Teorie pravděpodobnosti
15
6H i-1-1
5: -1
4: 3:
2: -1
—
Obrázek 2.1: K příkladu 2.7: Histogram četností veličiny X.
číslem 20. Ta/c dostaneme tabulku (2.3) relativních četností vzhledem k počtu měření. Tyto relativní četnosti můžeme prohlásit za naměřené (statistické) psti různých hodnot veličiny X.
Tabulka 2.3: K př. 2.7: Funkce p{x) empirického rozdělení pravděpodobnosti veličiny X.
X-hodnota 0 12 3 4
P(x) 0,05 0,3 0,3 0,25 0,1
Součet těchto relativních četností je roven jedné, jak bychom asi čekali.
0.3 H i-1-1
0.25: -
0.2: 0.15:
0.1: -1
0(65--
—1' O1 ' ' i' '2' '3' '4' '5
Obrázek 2.2: K př. 2.7: Histogram pravděpodobností veličiny X.
Jediný rozdíl mezi obrázky 2.1 a 2.2 je v tom, že v prvním případě se na osu y nanáší hodnoty četnosti a ve druhém případě pravděpodobnosti. Na pravděpodobnostním histogramu je zajímavé to, že součet obsahů všech obdélníků na obrázku je roven jedné.
Obrázek 2.2 tedy představuje první krok k určení pro určení psti v tom prvním představeném, statistickém pojetí. Pro naprostou přesnost bychom opět museli provést
16
Katedra matematiky PedF MUNI v Brně
limity relativních četností pro celkový počet hodů jdoucí k nekonečnu. V této chvíli se ovšem spokojíme jen s tímto přibližným, ne naprosto přesným statistickým určením psti.
Pokud chceme s využitím histogramu pravděpodobnosti v našem diskrétním případě vyčíslit třeba pravděpodobnost,že při 4 hodech mincí padl líc jednou nebo dvakrát, dostáváme
P{X G< 1, 2 >) = P(X = 1) + P{X = 2) = 0,3 + 0,3 = 0,6, což je rovno součtu obsahů obdélníků histogramu nad hodnotami 1 a 2 (viz obrázek):
0.3 H i-1-1
0.25: -1
0.2: 0.15:
0.1: -
0i65--1
-V 0 i ' ' ' ' 2 x 3 4 '5
Nyní se věnujme popisu celého jevu teoreticky, aniž bychom jakkoli házeli korunou a počítali počty líců, tj. bez měření. Při popisu nám pomůže pst axiomatická (teoretická):
Příklad 2.8 Nalezněte teoretické rozdělení veličiny X, která udává počet líců při čtyřech hodech mincí.
Řešení: Podrobíme naši situaci teoretickým úvahám za předpokladu, že mince je vyvážená a vyrobená ze stejnorodého materiálu. V tabulce 2.4 jsou uvedeny všechny možné výsledky čtyř hodů mincí (druhý sloupec udává vždy počet líců v dané variantě):
Bystrému pozorovateli asi neušlo, že všech možných výsledků je 16. A protože líc padá s pravděpodobností 7;, každý z těchto 16 výsledků je stejně pravděpodobný. A proto můžeme z tabulky určit četnosti počtu líců (viz tabulka 2.5)
a vydělením hodnotou 16 pak i relativní četnosti, které už jsou hodnotami hledané teoretické pravděpodobnostní funkce pix) (viz tabulka 2.6).
Příslušný histogram pravděpodobnosti je znázorněn na obrázku 2.3.
K teoretickému rozdělení pravděpodobnosti v příkladu 2.8 lze jednoduše sestrojit teoretické rozdělení četnosti, a dokonce si můžeme vybrat, kolikrát se má experiment „prakticky" provádět. Například pro 128 opakování experimentu čtyř hodů mincí má teoretické rozdělení četnosti stejný tvar jako pravděpodobnostní histogram 2.3, jen na osu y vynášíme hodnoty reprezentující četnost cii) (obrázek zde už není uveden, od 2.3 se liší jen měřítkem svislé osy):
MA 0008 - Teorie pravděpodobnosti
17
Tabulka 2.4: K př. 2.8: přehled všech možných výsledků při čtyřech hodech mincí.
výsledek počet líců výsledek počet líců
LLLL 4 LRRL 2
LLLR 3 RLRL 2
LLRL 3 RRLL 2
LRLL 3 LRRR 1
RLLL 3 RLRR 1
LLRR 2 RRLR 1
LRLR 2 RRRL 1
RLLR 2 RRRR 0
Tabulka 2.5: K př. 2.8: Tabulka teoretických četností hodnot veličiny X.
X-hodnota 0 12 3 4
četnost 1 4 6 4 1
Tabulka 2.6: K př. 2.8: Funkce p(x) teoretického rozdělení pravděpodobnosti veličiny X.
X-hodnota 0 12 3 4
P(x) 0,0625 0,25 0,375 0,25 0,0625
c(0) = p{0) 128
c(l) = Ki) 128
c(2) = K2) 128
c(3) = K3) 128
c(4) = P(4) 128
= 0,0625 • 128 = 8 = 0,25 • 128 = 32 = 0,375 • 128 = 48 = 0,25 • 128 = 32 = 0,0625 • 128 = 8
Čili kdybychom učinili 128 pokusů, z nichž jeden sestává ze čtyř hodů mincí, náš nejlepší teoretický odhad je ten, že v 8 pokusech by nepadl žádný líc, ve 32 pokusech
18
Katedra matematiky PedF MUNI v Brně
0.35-0.3-0.25-0.2-0.15-0.1-
0.05-
-i' O1 ' ' i' 2' 'Š' 4' 5
Obrázek 2.3: K př. 2.8: Histogram pravděpodobnosti teoretického rozdělení veličiny X.
jeden líc, atd.
Teoretické rozdělení pravděpodobnosti je jakési očekávané rozdělení, které nastane za jistých předpokladů. Například při pokusu 4 hodů mincí těmito předpoklady jsou:
• Mince je vyrobena tak, že rub a líc padá se stejnou pravděpodobností.
• Mincí je házeno „normálně", ne nějakým divným stylem, který by zvýhodňoval buď rub, nebo líc.
• Každý účastník pokusu pravdivě nahlásí své výsledky.
Rozdělení získané empiricky v příkladu 2.7 „zhruba" odpovídá teoretickému rozdělení z příkladu 2.8. Zdá se tedy rozumné uzavřít, že se světem je všechno v pořádku: mince je pravděpodobně dobře vyvážená, lidé jí hážou dobrým způsobem a nahlašují výsledky poctivě.
Pokud by data z příkladu 2.7 vedla na empirické rozdělení pravděpodobnosti uvedené na následujícím obrázku, bylo by patrné, že tři nebo čtyři líce padaly ve čtyřech hodech mnohem častěji, než jsme očekávali, na úkor výsledků 0 líců, 1 líc, 2 líce. To by zpochybnilo některý z našich předpokladů. Uzavřeli bychom, že buď je mince nějak divně vyvážená, nebo lidé jí házejí divným stylem:
0.4 0.3 0.2 0.1
MA 0008 - Teorie pravděpodobnosti
19
2.2 Shrnutí
Při popisu náhodnosti jevů, které se mohou odehrát, vycházíme ze dvou možných popisů: statistická pst vlastně popisuje budoucí náhodnost na základě minulého měření - i když není stoprocentně přesná, je založena na pozorování, měření dané veličiny, a tedy se snaží předpovědět chování veličiny podle toho, jak se (za analogických vnějších podmínek experimentu) chovala dosud. Příklad: pst toho, že na kostce padne šestka, stanovíme na základě toho, že danou kostkou hodíme dostatečněkrát a sledujeme výsledky hodu.
Naproti tomu, axiomatická definice psti se snaží podpořit popis náhodnosti který je teoretický - nevychází z měření, ale z teoretických předpokladů o tom, jak se bude veličina, kterou měříme, při zopakování analogických vnějších podmínek experimentu, chovat. Tyto teoretické předpoklady jsou sestrojeny na základě toho, že při měření veličiny zajistíme takové podmínky, ze kterých dané teoreticky spočtené psti vychází.
Porovnání obou pojetí je vidět na příkladech 2.7 a 2.8. Na obrázku 2.2 vidíme histogram psti získaných měřením = empiricky = statisticky, na obrázku 2.3 histogram psti získaných pouze teoretickými úvahami. Obě pojetí se při popisu náhodnosti používají: někdy máme k dispozici měření konkrétních hodnot nebo je můžeme snadno provést, jindy měření nemáme možnost zjistit a musíme se omezit na odhad dílčích psti na základě předpokládaného charakteru a podmínek dané situace.
2.3 Otázky a cvičení 02: Rozptyl, intervalové četnosti, kvantily
U následujících výroků rozhodněte, zda se jedná o výrok pravdivý či nepravdivý.
Otázka 2.1 Pravděpodobnost se zabývá otázkou: pokud vycházíme z jistého stavu světa, jaké důsledky budou následovat?
Otázka 2.2 Empirické rozdělení pravděpodobnosti je rozdělení, které získáme z naměřených dat.
Otázka 2.3 Empirické pravděpodobnosti jsou vlastně relativní četnosti.
Otázka 2.4 Třetí axiom psti je řečen jen pro sjednocení nekonečně mnoha jevů, nelze ho formulovat pro konečně mnoho disjunktních jevů.
Otázka 2.5 Pst opačného jevu A k jevu A vypočteme, když P (A) vynásobíme jednou polovinou.
Otázka 2.6 Prvky jevového pole A jsou všechny možné podmnožiny A množiny íl, které existují.
Otázka 2.7 Pro každé dva náhodné jevy platí: P (A U B) = P (A) + P {B).
Plán cvičení 02: Hlavní náplní cvičení je příklad na samostatné četnosti analogický úloze 2.1 a intervalové četnosti analogický úloze 2.2. Doplněn je příklad na vážený průměr, který je důležitý. Zhruba osnova:
20
Katedra matematiky PedF MUNI v Brně
• Úloha 2.1 na statistický popis velikostí obleku, nebo lépe: úloha na statistický popis počtu dětí v rodině (soubor získaný v anketě na přednášce). V rámci tohoto příkladu budou vysvětleny dva vzorce pro výpočet rozptylu, ještě v textu není zpracováno - viz cvičení!! ... dodělány úkoly ze str. 3 souboru 02cviceni-popisna-statistika.xlsx.
• Úloha 2.2 ceny bytů v korunách za metr čtvereční ... intervalové rozdělení četností (nebo lépe: statistický popis výšku studenta ze souboru získaného na přednášce); speciálně vysvětlen vzorec pro výpočet kvantilů při intervalovém rozdělení četností; ... udělejte úkoly ze str. 4 souboru 02cviceni-popisna-statistika.xlsx;
• V předchozí úloze vypočtěte zhruba průměr a rozptyl měření, pokud jsou zadány jen intervalové četnosti, a nikoli už původní hodnoty;
• V úloze 2.2 (nebo jí analogické o výšce studenta) určete medián, modus a aritmetický průměr ... jedná se o tři různé „typy průměru" ... příklad analogický str. 5-6 slajdů 02cviceni-popisna-statistika.xlsx.
• V úloze o výšce studenta určete celkovou průměrnou výšku, znáte-li pouze průměrnou výšku mužů a jejich počet a průměrnou výšku žen a jejich počet ... musíme spočítat tzv. vážený průměr dvou skupin závislý na počtu měření v každé z obou skupin ... slajdy 02cviceni, str. 7.
Úloha 2.1 V prodejně obleků prodali během týdne 46 obleků. Velikosti prodaných obleků byly následující- 39 41 40 42 41 40 42 42 40 43 42 41 43 39 42 41 42 39 41 37 43 41 38 43 42 41 40 41 38 40 40 39 41 40 42 40 41 42 40 43 38 39 41 41 42 a 45.
a) sestavte histogram četností a polygon četností z těchto dat
b) sestavte tabulku relativních četností, kumulativních absolutních četností, kumulativních
relativních četností pro tato data
c) určete modus a medián, průměr, rozptyl a směrodatnou odchylku velikostí obleků
d) určete variační rozpětí a mezikvartilové rozpětí velikosti obleků
e) určete 0,45 kvantil, 0,57 kvantil, 0,869 kvantil... (pomocí kumulativních relativních
četností)
Úloha 2.2 V největších 27 městech České republiky jsou následující ceny bytů v korunách za m2. 12 736, 12 975, 13 829, 14 316, 14 546, 14 897, 16 343, 16 369, 17 217, 17 327, 17 332, 18 200, 19 221, 20 162, 20 319, 20 864, 21 456, 21 794, 22 083, 22 215, 22 425, 22 768, 24 567, 25 078, 25 436, 29 031, 4 5 061. Proveďte intervalové rozdělení četností (relativní, kum. absolutní, kum. relativní), průměr, rozptyl, směrodatnou odchylku, variační rozpětí, 0,25-kvantil a 0,85- kvantil.
MA 0008 - Teorie pravděpodobnosti
21
Úloha 2.3 Politický představitel učinil výzkum u 77 lidí o kvalitě své práce. Každý z dotázaných (cizím slovem se takovým lidem říká respondenti, protože to, co dělají je „ respond" - odpovídají) hodnotil číslem ze stupnice 1 až 5, kde 1 = hrozná kvalita práce, 5 = vynikající kvalita práce. Výsledky jsou v tabulce:
2 l 3 3 2 1 3 4 2 1 4
1 4 1 5 3 4 1 l 2 1 2
2 3 1 1 1 2 1 3 4 4 5
1 4 1 4 4 4 2 4 2 3 5
3 l 1 1 5 5 3 2 5 5 3
4 l 3 4 4 3 3 4 3 3 1
4 5 2 3 5 5 4 5 3 4 4
Určete
a) rozdělení četnosti a rozdělení pravděpodobnosti kvality představitelovy práce;
b) střední hodnotu, rozptyl a směrodatnou odchylku této kvality.
Úloha 2.4 V případě spojité veličiny je situace trochu složitější, protože každá hodnota měření je většinou jiná než všechny ostatnŕ. V tabulce četností by tedy byl stejný počet sloupců jako je hodnot měření. To by nám žádnou přehlednou informaci nesdělilo. Zpravidla rozdělíme tedy nejprve reálnou osu na několik (7 až 10) podintervalů (většinou stejné délky) a provedeme tzv. intervalové rozdělení četností, kde četnosti ciui) udávají, kolik hodnot měření padlo do intervalu obsahujícího hodnotu ul (tato hodnota je zpravidla středem daného intervalu).
Uvažujme tento příklad: byla získána data (měřeno v sekundách od okamžiku t = 0) udávající okamžiky, kdy kolem určitého místa projíždělo auto - viz tabulka (čtená po řádcích):
1,5 3,9 7,3 13,7 17,4 22,2 24,7 30,2 30,5 31,2 41,9 42,3 44,5 61,9 62,4 64,1 73,4 81,4 86,1 92 92,7 106,3 111,5 112,1 113 118,9 122,2 122,4 122,6
Řekněme, že nás z jistého důvodu zajímá doba mezi dvěma po sobě jdoucími průjezdy auta - příslušné hodnoty této veličiny (označme ji třeba X) získáme odečtením vždy dvou po sobě jdoucích okamžiků průjezdu:
1,5 2,4 3,4 6,4 3,7 4,8 2,5 5,5 0,3 0,7 10,7 0,4 2,2 17,4 0,5 1,7 9,3 8,0 4,7 5,9 0,7 13,6 5,2 0,6 0,9 5,9 3,3 0,2 0,2
4Někdy se tato situace, že téměř každá naměřená hodnota je jiná než ty ostatní, objeví i u rozdělení diskrétního - pak postupujeme obdobně a provádíme též intervalové rozdělení četností, i když naměřené hodnoty jsou diskrétní, např. ikdyž to jsou pouze přirozená čísla.
22
Katedra matematiky PedF MUNI v Brně
Nyní rozdělíme reálnou osu na třídy četností + vybereme reprezentanty tříd (většinou středy tříd, až na krajní intervaly, které mají (buď jeden nebo oba) nekonečnou délku):
interval (=třída) <0;3) <3;6) <6;9) <9;12) < 12; 15) <15;oo)
reprezentant třídy 1,5 4,5 7,5 10,5 13,5 16,5
a) Proveďte intervalové rozdělení četností.
b) Spočtěte průměr a rozptyl naměřených hodnot na základě přesných hodnot měření.
c) Spočtěte průměr a rozptyl přibližně - pomocí četností tříd a reprezentantů tříd (místo
různých xt ve stejné třídě vezměte daného reprezentanta).
Úloha 2.5 Četnosti měření hodnot xl jsou dány v tabulce:
n%
1 2
3 5
5 7
6 10
8 6
10 3
a) Určete kumulativní relativní četnosti, dolní kvartil a 0,57—kvantil těchto hodnot.
b) Vypočtěte průměr a rozptyl zadaných hodnot.
Úloha 2.6 Intervalové rozdělení četností cen bytů za 1 metr čtvereční v ČR je dáno v tabulce:
rii
(23100; 27600) 10
(27600; 32100) 7
(32100;36600) 4
(36600;41100) 3
(41100;45600) 3
(45600;50100) 2
a) Určete kumulativní relativní četnosti, dolní kvartil a 0,67—kvantil těchto hodnot.
b) Odhadněte průměr a rozptyl zadaných hodnot.
Úloha 2.7 Byla získána data reprezentující cenu za metr čtvereční nového bytu v ČR:
45061 41258 39076 35062 33 653 31235 29031 25436
25078 24 567 22768 2225 22215 22083 21794 21456
20894 20319 20162 19221 18200 17332 17327 17217
16369 16343 14897 14546 i43i6 13829 12975 12761
MA 0008 - Teorie pravděpodobnosti
23
a) Určete intervalové rozdělení četností těchto hodnot.
b) Určete kumulativní relativní četnosti, dolní kvartil a 0,67—kvantil těchto hodnot.
Úloha 2.8 a) Většina dětí ve třídě A má velké problémy s matematikou, kdežto ve třídě B téměř nikdo. Přesto je průměrný výsledek počtu bodů na testech v obou třídách stejný. Jak je to možné?
b) Průměrný počet bodů na prověrkách u studenta S\je stejný jako u studenta S2- Přesto paní učitelka říká, že student S± je objektivně lepší než student S2. Jak je to možné?
Úloha 2.9 Výsledky bodů na prověrce od dvaceti studentů jsou
3, 5, 8, 2,4,10,11, 4, 5, 7, 2, 4, 8, 8,10,1, 5, 7, 8, 2.
a) Určete medián a kvartilové rozpětí těchto hodnot.
b) Vypočtěte průměr a odchylku počtu bodů.
Odpovědi na otázky a některá cvičení viz 14.2.
24
Katedra matematiky PedF MUNI v Brně
3 týden 03
3.1 Čtyři různé modely popisu pravděpodobnosti
Následující čtyři modely pravděpodobnosti se liší svou použitelností při popisu náhodnosti. Vždy záleží na vlastnostech množiny íl všech možných elementárních výsledků měření, které mohou nastat.
3.1.1 Klasická pravděpodobnost
Klasickou pst můžeme užít v následujících podmínkách, a užíváme ji takto:
• íl má konečně mnoho možných elementárních výsledků,
• všechny elementární výsledky mají stejnou možnost nastat.
• Pak lze počítat pst náhodného jevu a G a podle vzorce p (a) = j^j (podíl počtu prvků obou množin)
Příklad 3.1 Dvakrát hodíme hrací kostkou - jaká je pst, že součet hodnot obou hodů je roven 5 ?
Řešení: Množina všech elementárních výsledků na dvou hodech (záleží na pořadí, ve kterém hodu co padlo) je
Í2 = {[1;1],[1;2],[1;3],...,[6; 5], [6; 6]},
náhodný jev a, na který se zaměřujeme, je množina
A = {[1;4],[4;1],[2;3],[3;2]}, a tedy P(^) = ± = I = 0,1111.
ób 9
Příklad 3.2 Z karet na mariáš (32 karet) vybereme náhodně po zamíchání čtyři karty. Jaká je pst, že aspoň jedna z nich bude eso?
Řešení: V množině íž budou elementárními výsledky všechny možné čtveřice karet (ve kterých nezáleží na pořadí, ale jen na tom, jaké karty jsou v té skupině čtyř vytažených). Náhodný jev a, na který se chceme zaměřit, obsahuje všechny čtveřice, ve kterých je právě jedno eso, právě dvě esa, právě tři esa, nebo čtyři esa. Najít celkový počet prvků množiny a znamená najít počty prvků ve všech čtyřech právě popsaných navzájem se vylučujících případech a sečíst je. Vnímavý student, který absolvoval předmět Diskrétní matematika, už nyní ví a píše výsledek, protože klasická pst převede otázku psti na otázku počtu prvků:
\a\ (1) • (?) + q • (228) + q • (T) +1 N (T)
p(a) = = Vi; v3;^v2; V2^v3; u;^ = M305895 ^ M306_
Při výpočtu psti jevu se někdy ukazuje výhodné zapřemýšlet nad tím, zda existuje rychlejší cesta k cíli - zdá se, že nyní by existovala cesta vyčíslení opačného jevu a odečtení
MA 0008 - Teorie pravděpodobnosti
25
jeho psti od hodnoty 1, viz věta 2.2. Opačný jev A znamená, že ze čtyř náhodně vytažených karet nebude žádné eso. Pak
P{A) = 1 - P{A) = l~Wr = 0,4306.
V 4 )
3.1.2 Geometrická pravděpodobnost
Geometrickou pst můžeme užít v následujících situacích, a užíváme ji takto:
• íl má nekonečně mnoho možných elementárních výsledků, dokonce tak velkou, že je oblastí kladné míry (úsečkou kladné délky, plochou kladného obsahu, tělesem kladného objemu).
• všechny elementární výsledky mají stejnou možnost nastat.
• Pak lze počítat pst náhodného jevu A G A podle vzorce P (A) = (podíl měr obou množin, tj. podle charakteru množin podíl délek, obsahů nebo objemů).
Příklad 3.3 Tramvaj jezdí v pracovní době každých 7 minut. Student, který se nedívá na hodinky a přichází na zastávku tramvaje náhodně, bude určitou dobu čekat na příjezd další tramvaje. Jaká je pst, že bude čekat 4 a více minut?
Řešení: Nelze počítat podle klasického modelu, protože množiny íž, A jsou obě nekonečné; ale všimněme si, že při náhodném příchodu studenta na zastávku jsou všechny doby čekání stejně pravděpodobné, tj. splňují předpoklady geometrického modelu psti.
Množina všech možných výsledků je totiž íl = (0; 7), náhodný jev A na který se chceme zaměřit, je A = (4; 7) ... doba čekání na nejbližší tramvaj, která je dlouhá 4 a více minut. Díky splněným oběma předpokladům geometrického modelu psti můžeme využít délky obou množin:
P(A) = ^t4t = ? = 0,4285714 = 0,4286.
Příklad 3.4 Honza a Marek se domluvili, že se setkají na jistém místě mezi osmou a devátou hodinou, kam každý z nich v tu dobu náhodně přijde. Ale řekli si, že ten, kdo přijde první, bude na toho druhého čekat jen 15 minut, a pak odejde. Jaká je pravděpodobnost, že se setkají?
Řešení: Označme 8 + x .. . čas příchodu Honzy (v hodinách); 8 + y ... čas příchodu Marka.
Víme, že oba přijdou určitě do devíti hodin, tedy 0. Všechny tyto body modelující možný výsledek příchodů vytvářejí tedy čtverec v rovině.
26 Katedra matematiky PedF MUNI v Brně
Obrázek 3.4: K př. 3.4: Množina všech možných výsledku.
Tento čtverec Cl = {(x, y) : 0 < x < 1, 0 < y < 1} je množinou všech možných výsledku dané situace (viz obrázek 14.19).
Počet všech možných případů je sice nekonečný, ale jsme schopni spočítat obsah čtverce: S (Cl) = 1-1 = 1.
Označme dále
A ... Honza a Marek se setkají
Příznivým případům jevu A odpovídají ty příchody (x, y) obou studentů, ve kterých se x od y liší nanejvýš o 15 minut, což je asi | hodiny. Pro tyto „příznivé" body čtverce Cl tedy musí platit nerovnost
, 1 \y — x\ < -. \y i - 4
Vyřešme tuto nerovnost. Při odstraňování absolutní hodnoty musíme rozlišit dvě situace:
• Pro y — x > 0 se znaménka nemění, tj y — x < |, odtud y < x + ^.
• Pro y — x < 0 musíme při odstraňování absolutní hodnoty na levé straně nerovnosti změnit znaménka: —y + x < j, odtud y > x — j.
Body splňující obě z uvedených nerovností získáme jako průnik polorovin každou z nerovností určených, tj. 14-20:
Jev A lze tedy vyjádřit jako množinu bodů v rovině:
A = {(x,y) : 0 < x <1,0 x - ^-}.
MA 0008 - Teorie pravděpodobnosti
27
0.2 0.4 x 0.6 0.1
Obrázek 3.5: K př. 3.4: Množina všech příznivých výsledků.
Příznivých případů je také nekonečně mnoho, ale jsme schopni vypočítat míru této nekonečnosti, konkrétně řečeno obsah množiny A: nejjednodušeji S (A) vypočteme z grafického znázornění na obrázku 14-20, když budeme brát v úvahu rozdělení čtverce íl na šestnáct menších čtverečků o straně délky j. Je vidět, že množina A zabírá plochu sedmi z těchto čtverečků, a protože S (Cl) = 1, máme S (A) = ^ • S (Cl) = y^.
Pravděpodobnost jevu A teď určíme jako podíl míry množiny příznivých případů a míry množiny všech možných případů:
P{A) =
S(Cl) 1 " 16 " U'4J75-
3.1.3 Diskrétní pravděpodobnost
Diskrétní pst můžeme užít v následujících situacích, a užíváme ji takto:
• Cl má konečně mnoho možných elementárních výsledků, nebo je jich stejně najko přirozených čísel (říkáme, že Cl je množina nejvýše spočetně nekonečná).
• všechny elementární výsledky mají obecně RŮZNOU možnost nastat (elementární výsledek uj1 nastane s pstí piuji)).
• Pak lze počítat pst náhodného jevu A G A podle vzorce
P(A) = ^ PÍ"*)
V případě diskrétní psti tři axiomy z předchozí kapitoly přecházejí v následující axiomy pro pstní funkci p:
28
Katedra matematiky PedF MUNI v Brně
enK^í) — 1 (axiom normovanosti),
2. piuJi) > 0 pro každý elementární výsledek uj1 6 íl (axiom nezápornosti),
€Ap(uji) (axiom součtu pstí neslučitelných jevů, protože dílčí výsledky uj1 jsou navzájem neslučitelné).
Příklad 3.5 Hážeme hrací kostkou tak dlouho, až poprvé padne šestka; pak skončíme s házením. uj1 je jakákoli přípustná sekvence hodů za těchto podmínek. Určete pst, že na první šestku budeme potřebovat více než tři hody.
Řešení: Nejnižší možný počet hodů je jeden, kdy právě tímto pokusem hned padne šestka:
P(6) = - = 0,1667. 6
Dále může nastat sekvence N6, tj. prvním hodem šestka nepadne a druhým ano - a to s pstí
PiN(i) = ll = ls= °-1389-
Pak se také může stát, že nastane sekvence NN6, a sice s pravděpodobností
P(NN6) = -■-■- = 0,1157. 6 6 6
Teoreticky je možné, že nastane pro přirozené číslo k nastane sekvence N N... N6 s pstí P(NN...N6)
5 5 5 1 /5\fe 1
6 6 6 6 V 6
k-krát '——^~-'
k-krat
Je jasně vidět, že jednotlivé dílčí sekvence nastávají s různými pstmi. Takových sekvencí je vlastně nekonečně mnoho a víme, že musí splňovat vztah
oo
y^P(JVJV... N6) = 1 k=0 k-krát
(axiom normovanosti). Funkce, jejíž hodnoty jsme právě určili, se nazývá pravděpodobnostní funkce. V kapitole 8 si o tomto příkladu řekneme ještě něco více. Nyní se vraťme k zadání příkladu a spočteme pst, že pro první hozenou šestku potřebujeme více než tři hody:
P (A) = p(NNN6) + p(NNNN6) + p(NNNNN6) + ■■■ .
Zdá se, že součet nekonečné řady by mohl dát práci, ovšem využijeme opět věty 2.2 a odečteme hledanou pst od opačného jevu:
_ 1 5 25
P(A) = 1 - P(A) = 1 - (p(6) + p(N6) + p(NN6)) = 1 -(- + — + —) = 0,5787.
6 36 216
MA 0008 - Teorie pravděpodobnosti
29
3.1.4 Spojitá pravděpodobnost
Spojitou pst můžeme užít v následujících situacích, a užíváme ji takto:
• íl má nespočetně nekonečně mnoho možných elementárních výsledků, a tedy se jedná o interval reálných čísel nebo o R+, nebo R.
• Tyto elementární výsledky mají obecně RŮZNOU možnost nastat.
• Pak pro pst jevu (a; b) C ŕž nebo (a; b) C ŕž nebo (a; b) C ŕž nebo (a; 6) C ŕž platí
P(a; 6) = P«a; 6) = P((a; b)) = P {a; b)) =
kde f(x) je nezáporná po částech spojitá funkce.
V případě spojité psti tři axiomy z předchozí kapitoly přecházejí v následující axiomy pro hustotu psti f(x):
1. fix)dx = 1 (axiom normovanosti),
2. Va, b 0 (axiom nezápornosti),
3. P(a;b) = P((a;b) = P((a;b)) = P(a;b)) = f(x)dx (axiom součtu neslučitelných jevů má formu integrálu).
Příklad 3.6 mobily jisté značky a typu mají životnost patnáct let. Jaká je pst, že náhodně koupený mobil tohoto typu vydrží více než deset let?
Řešení: Jak zdůvodníme později, lze odvodit, že za hustotu psti, která dobře modeluje životnost, lze vzít funkci, která je pro záporná x rovna nule, a pro kladná x je fix) klesající exponenciální funkcí, ve které vystupuje číslo 15 z důvodu průměrné životnosti. Tedy za funkci fix) lze vzít funkci
A pokud máme počítat pravděpodobnost, že životnost je větší než deset let (časová jednotka je tedy jeden rok), integrujeme na intervalu od 10 do oo:
pro x < 0;
pro x > 0
'OO
— • e i5 dx = e i5 = 0,5134.
30
Katedra matematiky PedF MUNI v Brně
3.2 Shrnutí
Pokud výsledky jistého pokusu, hry nebo experimentu mohou nastat se stejnou pravděpodobností, používáme k jeho popisu klasickou (3.1.1) nebo geometrickou (3.1.2) pravděpodobnost. Ovšem pokud některé z elementárních výsledků nastávají častěji než jiné, situaci znázorníme pomocí diskrétní (3.1.3) nebo spojité (3.1.4) pravděpodobnosti. Z modelů je vidět, že (3.1.1) je speciálním případem modelu (3.1.3) a že model (3.1.2) je speciálním případem modelu (3.1.4). Tedy dvěma hlavními modely psti je distrétní model (3.1.3) a spojitý model (3.1.4).
Když studujeme jistou veličinu, jako první věc bychom si měli uvědomit, zda se jedná o veličinu diskrétní (ta nabývá hodnot z konečné (např. {1,2,3,4,5,6}) nebo spočetné (např. N, Z) množiny ŕž) nebo veličinu spojitou (ta nabývá hodnot z reálného intervalu íl =< a, b > nebo z celé množiny reálných čísel). Popis těchto dvou typů veličin se totiž v některých věcech liší. A používané vzorce nebo způsob popisu se neustále odvíjí od jednoho z těchto dvou typů. V následujících kapitolách (a i v úlohách praxe) se potřebuje občas určit pravděpodobnost, že náhodná veličina nabývá hodnot z jistého intervalu (a, b). S ohledem na typ veličiny budeme užívat vzorec
V diskrétním případě se funkce pik) nazývá pravděpodobnostní funkce, ve spojitém případě funkci fix) říkáme hustota psti.
3.3 Otázky k opakování a cvičení 03
U následujících výroků rozhodněte, zda se jedná o výrok pravdivý či nepravdivý.
Otázka 3.1 Všech možných výsledků experimentu, který lze popsat pravděpodobnostním modelem, může být nejvýše spočetně mnoho.
Otázka 3.2 Geometrická pravděpodobnost je speciálním případem spojité pravděpodobnosti.
Otázka 3.3 Diskrétní náhodná veličina nemůže nabývat všech hodnot se stejnou pravděpodobností.
Otázka 3.4 U spojité náhodné veličiny X je pravděpodobnost, že X nabude konkrétní hodnoty, vždy rovna nule.
Otázka 3.5 Hustota spojité náhodné veličiny nemůže nikdy mít bod nespojitosti.
Otázka 3.6 Každou nezápornou funkci f(x), pro kterou f(x)dx = 1, lze označit za hustotu jisté náhodné veličiny.
Otázka 3.7 Žádná hodnota pstní funkce pik) nemůže být větší než 1. Otázka 3.8 Žádná funkční hodnota hustoty psti f(x) nemůže být větší než 1.
pro diskrétní veličinu X, pro spojitou veličinu X.
MA 0008 - Teorie pravděpodobnosti
31
3.3.1 Klasická pst
Úlohy 3.1 až 3.10 budou pravděpodobně zvládnuty ve výuce, ostatní jsou k samostatnému procvičení.
Úloha 3.1 Při 500 hodech krabičkou zápalek 385krát krabička dopadla naplocho, 82krat na bok a 33krát na výšku. Odhadněte pravděpobnosti jevu
a) krabička padne naplocho
b) krabička padne na bok
c) krabička padne na výšku
Úloha 3.2 Z osmnácti lístků označených čísly 1-18 vytáhneme náhodně jeden lístek. Jaká je pravděpodobnost, že na vytažením lístku bude:
a) sudé číslo
b) číslo dělitelné 3
c) prvočíslo
d) dělitelné 6
Úloha 3.3 Jaká je pravděpodobnost že při hodu dvěma kostkami (červené a modré) padne:
a) součet 8
b) součet, který je dělitelný pěti
c) součet, který bude sudý
Úloha 3.4 Hazardní hráč hází třemi kostkami, položil G. Galileimu otázku: "Mám vsadit na součet 11 nebo součet 12?" Co mu Galilei odpověděl?
Úloha 3.5 Uvažujeme hod dvěma kostkami. Jev A spočívá v tom, že padla alespoň jedna šestka, jev B spočívá v tom, že součet čísel je roven 6, a jev C spočívá v tom, že součet čísel je menší než 7.
A. ..padne aspoň jedna šestka
B. ..součet hodů je roven 6
C. ..součet čísel je menší než 7
a) Zapište jev B pomocí elementárních jevů. Předpokládejte, že kostky umíme rozlišit.
b) Popište slovně jev C\
c) Jaký je vztah mezi jevy A a C ?
32
Katedra matematiky PedF MUNI v Brně
d) Co můžeme říct o jevech A a B?
e) Jaký je vztah mezi jevy B a C?
f) Popište slovně jev C\B (množinové minus).
Úloha 3.6 V osudí jsou 2 bílé a 4 černé koule. Postupně losujeme koule z osudí, dokud není prázdné, vytažené koule nevracíme zpět.
a) Kolik je možných výsledků losování za předpokladu, že koule stejné barvy neumíme rozlišit?
b) Kolik výsledků je příznivých jevu A, který spočívá v tom, že v prvním tahu byla tažena bílá koule?
c) Kolik výsledků je příznivých jevu B, který spočívá v tom, že obě bílé koule byly taženy během prvních tří tahů?
d) Popište slovně jev B?.
e) Kolik výsledků je příznivých jevu C, který spočívá v tom, že poslední tažená koule je černá?
f) Jaký je vztah mezi jevy B a C?
g) Popište slovně jev A n B n C.
Úloha 3.7 Závod vyrábí určitou součástku, která je podrobena třem různým zkouškám. Jev A spočívá v tom, že náhodně vybraná součástka obstojí při první zkoušce, jev B v tom, že obstojí ve druhé zkoušce, a jev C v tom, že obstojí ve třetí zkoušce. Vyjádřete v množinové symbolice (tj.pomocí jevů A,B,C), že součástka obstojí:
a) jen v první zkoušce,
b) v první a ve druhé zkoušce, ale ne ve třetí zkoušce,
c) právě v jedné zkoušce,
d) alespoň v jedné zkoušce,
e) právě ve dvou zkouškách,
f) alespoň ve dvou zkouškách,
g) ve všech třech zkouškách,
h) nejvýše ve dvou zkouškách.
Úloha 3.8 Zapomněli jste čtyřmístný P IN ke své platební kartě. Pamatujete si, že obsahoval třináctku, tj. jedničku a trojku těsně za sebou (nejsme si však jisti, zda uspořádaná dvojice těchto čísel byla na začátku, uprostřed nebo na konci PINu).
Pamatujeme si ještě to, že zbývající dvě číslice nebyly stejné a lišily se odl i od 3. S jakou pravděpodobností můžeme PIN uhádnout napoprvé při zachování těchto pravidel?
Úloha 3.9 Hodíme čtyřikrát desetikorunou. S jakou pravděpodobností padne dvakrát líc a dvakrát rub?
MA 0008 - Teorie pravděpodobnosti
33
Úloha 3.10 Hráč pokeru (varianta Texas Holďera) dostane 2 karty z dokonale rozmíchaného balíčku 52 karet. S jakou pravděpodobností bude mít v ruce
a) eso a krále
b) dvě esa
c) pár, tj. dvě karty stejné hodnoty?
(Pro porovnání vyjádřete výsledky v procentech a zaokrouhlete na dvě desetinná místa.)
Úloha 3.11 Z 9 přístrojů jsou dva poruchové. Zákaznická firma zakoupí tři přístroje náhodně vybrané z daných devíti - určete pst, že nanejvýš jeden z nich je poruchový.
Úloha 3.12 Z 10 přístrojů jsou tři poruchové. Zákaznická firma zakoupí čtyři přístroje náhodně vybrané z daných desíti - určete pst, že minimálně dva z nich jsou poruchové.
Úloha 3.13 V osudí je pět kuliček bílých a pět černých. Náhodně vybereme (nevracíme zpět) šest z nich. Jaká je pst, že aspoň dvě kuličky z vybraných budou bílé?
Úloha 3.14 Ze skupiny 7 chlapců a 5 dívek náhodně vybereme pětici dětí. Jaká je pst, že mezi vybranými bude nanejvýš jedna dívka?
Úloha 3.15 Ze skupiny 8 chlapců a 7 dívek náhodně vybereme šest dětí. Jaká je pst, že mezi vybranými bude aspoň pět dívek?
Úloha 3.16 Na šachovnici 8x8 náhodně na dvě různá políčka umístíme dvě věže, bílou a černou. S jako p stí se navzájem ohrožují? (pravidla šachu: každá věž ohrožuje nejbližší figuru v daném sloupci i v dané řadě, ve kterých se věž nachází.)
Úloha 3.17 Revizor ze zkušenosti ví, že zhruba ve čtvrtině tramvají najde při kontrole černého pasažéra. Kolik tramvají musí zkontrolovat, aby měl aspoň 95%-ní jistotu, že alespoň jednoho černého pasažéra objeví? (nápověda: při n tramvajích nejlépe vypočteme pst, že aspoň v jedné z nich bude nalezen černý pasažér, jako 1 minus pst, že černý pasažér nebude nalezen v žádné tramvaji).
Úloha 3.18 Student se stihl naučit jen 15 otázek z 20 a u ústní části zkoušky si vybírá tři z nich. Jaká je pst, že aspoň dvě z těchto tří budou ty, které umí?
Úloha 3.19 Jaká je pst, že v náhodném výběru tří karet z balíčku 52 karet (třináct karet v každé barvě) bude aspoň jedno eso nebo aspoň jeden král?
3.3.2 Geometrická pst
První čtyři úlohy v tomto oddílku budou zvládnuty na cvičení, ostatní jsou na samostatné procvičení.
Úloha 3.20 Obrazovka radaru je kruhová o poloměru r. Při zapnutí se na ní náhodně objeví letící bod znázorňující letící objekt.
Určete pravděpodobnost, že svítící objekt bude od středu obrazovky vzdálen méně než o r/2.
34
Katedra matematiky PedF MUNI v Brně
Úloha 3.21 Tyč délky 7m je náhodně rozřezána na tři kusy.
Jaká je pravděpodobnost, že z těchto tří částí lze sestavit trojúhelník?
Úloha 3.22 Stroj vyrábí skleněné trubičky o délce 1 m. Rozlomí-li s trubička kvůli poruše materiálu na dva kusy, s jakou pstí bude jeden z nich delší než 80 cm, a bude jej tedy možno dále využít?
(předpokládejte, že trubička se může zlomit na kterémkoli místě se stejnou pstí).
Úloha 3.23 Vedoucí prodejny nábytku očekává během dne dodávku zboží od dvou různých dodavatelů. Od 1. dodavatele byl informován, že auto může přijet kdykoliv mezi 9 hod a 12 hod, auto druhého dodavatele může přijet kdykoliv mezi 9 hod a 14 hod. Přejímka zboží od kteréhokoli dodavatele trvá hodinu. S jakou pstí se stane, že auto, které přijede později, bude muset čekat na dokončení přejímky zboží z prvního auta?
Úloha 3.24 Vedoucí prodejny nábytku očekává během dne dodávku zboží od dvou různých dodavatelů. Od prvního dodavatele byl informován, že auto může přijet kdykoli mezi 9. a 12. hodinou, druhý dodavatel přijede kdykoli mezi 9. a 14- hodinou. Přejímka zboží od kteréhokoliv dodavatele trvá půl hodiny. S jakou pstí bude muset auto, které přijede později, čekat na dokončení přejímky zboží u auta, které přijelo dřív?
Úloha 3.25 Dva lidé se dohodli, že se setkají na stanoveném místě mezi 18:00 h. a 18:45 h. Ten, kdo přijde první, počká na druhého 30 minut (déle čekat nebude a půjde pryč). Určete pravděpodobnost toho, že se setkají, je-li příchod obou kdykoliv ve stanoveném intervalu stejně možný.
Úloha 3.26 Ve čtverci (0; 8) X (0; 8) se náhodně rozsvítí bod o souřadnicích x;y. Určete pst, že platí y < x3.
Úloha 3.27 Krychle má všechny stěny obarvené. Rozřežeme ji na 1000 stejných krychliček a ty pečlivě promícháme. Vybereme-li náhodně jednu krychličku, s jakou pstí bude mít právě dvě stěny obarvené?
Úloha 3.28 Student Adam přijde na konzultaci ke svému vedoucímu bakalářské práce někdy mezi osmou a desátou, student Jan někdy mezi osmou a jedenáctou. Oba mají stejného vedoucího a lze očekávat, že doba každé konzultace bude asi 30 minut.
Předpokládejte, že každý okamžik příchodu je stejně možný jako ty ostatní, ve studenty vymezených intervalech. Vyčíslete pst, že některý ze studentů bude nějakou dobu čekat, protože vyučující bude mít zrovna schůzku s tím druhým studentem.
Úloha 3.29 Všechny zásahy do terče o poloměru 100 cm jsou pro začínajícího střelce z luku stejně pravděpodobné. Jaká je pst, že svým prvním výstřelem do terče dosáhne pěti nebo deseti bodů? (poloměry jednotlivých hranic oblastí viz obrázek)
MA 0008 - Teorie pravděpodobnosti
35
Úloha 3.30 Hráči s petangovými koulemi trénují, zda koulením po zemi trefí jistý určený bod ve vzdálenosti deset metrů. Umístíme-li do daného bodu souřadnou osu kolmo na směr házení, všechny vrhy na tento cíl procházejí pásem —30 cm až 30 cm. Na začátku jsou hráči nezkušení a všechny dopady na osu v rozmezí —30 cm až 30 jsou stejně pravděpodobné.
Označme A interval —10 cm až 10 cm na měřicí ose, B oblast (—20; —10) U (10; 20) cm na měřicí ose, C oblast (—30; —20) U (20; 30) cm na měřicí ose.
Jaká je šance, že náhodný netrénovaný hráč se trefí do oblasti A?
Úloha 3.31 Po určité době tréninku v situaci předchozího příkladu se hráči strefují do oblasti A s pstí 0,7, do oblasti B s pstí 0,20 a do oblasti C s pstí 0,10. Když vytrénovaný hráč vrhne koulí pětkrát, jaká je šance, že aspoň čtyři z těchto pěti hodů projdou oblastí A? (nápověda: vlastně už se o příklad na geometrickou pst nejedná, pouze je zde návaznost na předchozí příklad; nyní potřebujete spočítat tzv. binomické neboli Bernoulliho psti, viz následující cvičení)
Odpovědi na otázky a některé úlohy viz 14.3.
36
Katedra matematiky PedF MUNI v Brně
4 Týden 04
4.1 Přednáška 04: Věta o součtu pravděpodobností, věta o součinu pravděpodobností, podmíněná pst
Od axiomu (P3) nyní pokročíme ke slibované psti sjednocení obecných náhodných jevů, a pak se budeme zabývat samozřejmě i pstí průniku jevů, protože psti průniku se vlastně objevují právě i ve větě o psti sjednocení jevů. Začneme pstí dvou obecných jevů:
Věta 4.1 (věta o součtu pstí dvou náhodných jevů) Pro libovolné náhodné jevy A\,A2 E A platí:
P{AÍ U A2) = P{Ai) + P{A2) - P{AÍ n A2).
Důkaz by byl velmi jednoduchý: protože na základě axiomu (P3) pro disjunktní jevy Ai - A2 a Ai n A2 platí P{Ai) = P{A1 - A2) + P{A1 n A2) a podobně platí P{A2) = P(A2 — Ai) + P(Ai n A2), dosazením těchto vztahů do pravé strany rovnosti dostaneme P(Ai — A2) + P(A2 — Ai) + P(Ai n A2), což je součet pstí tří disjunktních množin, a tak podle axiomu (P3) přesně roven jejich sjednocení A\ U A2.
Příklad 4.1 Uvažujme situaci5, kdy zásilkový prodejce vyřizuje objednávky zboží telefonicky, emailem, nebo formulářem při osobním odběru. Objednávky dělíme podle typu na malé, střední, velké a prioritní. Lze označit následující náhodné jevy, které mohou nastat:
T ... náhodně vybraná-přišlá objednávka je telefonická;
E ... náhodně vybraná-přišlá objednávka je emailem;
F ... náhodně vybraná-přišlá objednávka je formulářem při osobním odběru; M ... náhodně vybraná-přišlá objednávka je malá;
5 ... náhodně vybraná-přišlá objednávka je střední; V ... náhodně vybraná-přišlá objednávka je velká;
H ... náhodně vybraná-přišlá objednávka je prioritní (high priority). Jsou známa dosavadní data z letošního roku:
typ objedn. malá obj. střední obj. velká obj. high priority obj. celkem
telefon 1021 216 109 14 1360
email 86 371 308 49 814
formulář 1497 230 86 13 1826
celkem 2604 817 503 76 4000
Určete pst toho, že náhodně přišlá-obdržená objednávka bude emailem nebo prioritní.
5Příklad je vzat z učebnice (Robova, Hála, Calda, 2013), ale v trochu jiných souvislostech, s jinou otázkou v zadání.
MA 0008 - Teorie pravděpodobnosti
37
Řešení: jedná se vlastně o pst statistickou, odhadnutou pomocí naměřených dat -takto určit náhodnost v tomto případě je nej rozumnější6.
Dále budeme při výpočtu P(E U H), protože logická spojka NEBO je v množinové symbolice vyjádřená sjednocením, používat klasický model psti, protože každý klient svou volbou „hlasuje" pro jeden typ i jeden způsob objednávky. Je vidět, že průnik obou jevů je neprázdný, tj. existují klienti, kteří si objednali emailem, a současně s nejvyšší prioritou, tj. použijeme větu 4.1:
814 + 76 — 49 841
P(E UH) = P(E) + P(H) - P(E nH)=-- = 4— = 0,21025.
v ; v ; v ; v ; 4000 4000
Věta 4.2 (věta o součtu p stí n náhodných jevů) Pro libovolné náhodné jevy A\, A2, atd. až An platí:
P(A1 U A2 U • • • U An) = P(Aľ) + P (A + 2) + • • • + P(An) -
-P{A1 n A2) - P{A1 n A3)-...- P(A„_i n An) +
+P(A1 nA2n A3) + P(A1 n A2 n A4) + • • • + P(An_2 n An_x n An) -
+(-i)n-1.p(A1nA2n---nAn).
Důkaz bychom museli vést pro n = 3 pomocí Vennova diagramu pro tři množiny v obecné poloze (se všemi možnými neprázdnými průniky), pro n > 4 už Vennovy množiny selhávají, protože už nedokážou postihnout obecnou polohu čtyř a více překrývajících se množin (u čtyř množin bychom jejich vzájemný vztah museli znázornit pomocí čtyř koulí z nichž každá má střed v jiném vrcholu čtyřstěnu, a všechny mají poloměr o něco větší, než je polovina délky hrany čtyřstěnu; už to je náročné, tj. důkaz bychom vedli spíše pomocí charakteristického obecného prvku x).
Ale logika důkazu je celkem jasná: při sečtení pstí jednotlivých množin jsme průniky každých dvou započítali víckrát, takže jejich psti musíme na druhém řádku pravé strany odečíst - ovšem průniky každých tří množin jsme z psti odečetli tolikrát, že tam zase vůbec nejsou započítány, takže jejich psti musíme na třetím řádku pravé strany zase přičíst, atd. až u průniku všech n množin vlastně nevíme, zda jej máme přičíst nebo odečíst, ale to lze snadno zjistit pomocí (—l)ra_1, protože tento člen ctí střídání sčítání a odčítání pstí na každém dalším řádku pravé strany.
Příklad 4.2 Elektrikář vystiskl štítky na zvonky bytového domu se čtyřmi byty a zapojuje je náhodně, protože jeho parťák onemocněl a nepřinesl seznam (a nebere telefon). Jaká je pst, že
a) Všechny zvonky zapojí ke správným bytům?
6Nebudeme se nyní zabývat výpočtem limity hodnot v tabulce v situaci, kdy počet zákazníků nebude 4000, ale bude se blížit k nekonečnu. Taková data nemáme totiž k dispozici. Namísto toho se spokojíme s tím, že pst výsledku bude určená relativní četností, kterou bychom mohli pro rostoucí počet měření-zákazníků neustále zpřesňovat. Také je pravdou, že vzorek čtyř tisíc zákazníků už o klientele firmy něco vypovídá, tj. má smyl zhruba pst odhadnout pomocí relativní četnosti.
38
Katedra matematiky PedF MUNI v Brně
b) Aspoň jeden zvonek zapojí správně?
c) Žádný zvonek nezapojí správně?
Řešení: je asi nabíledni, že jedna z otázek a), b), c) bude řešena pomocí právě uvedené věty 4.2, a ty ostatní dvě otázky nějak jinak. Kdo se v tom má vyznat?
Začneme tím, že si označíme náhodné jevy, které by možná mohly vést k výsledku v každé otázce - v tom je matematika právě pomocná, že dobré označení či popis situace už je prvním krokem k řešení.
Ai ... zvonek k bytu č. 1 bude zapojen správně;
A2 ... zvonek k bytu č. 2 bude zapojen správně;
A3 ... zvonek k bytu č. 3 bude zapojen správně;
A4 ... zvonek k bytu č. 4 bude zapojen správně.
No a nyní vyjádříme slovní popis jevů a,b,c pomocí náhodných jevů A±, A2, A3, A4, snad to bude možné (aniž jsme si tedy vyjádřili množinu íž všech možných výsledků -brzy se k ní dostaneme):
ad a) Ai P1A2 H A3 n A4 ... každý ze zvonků bude zapojen správně, tj. dílčí jevy nastanou současně.
ad b) „Aspoň jeden zvonek bude zpojen ke správnému bytu" lze ekvivalentně vyjádřit výrokem „k 1. bytu bude zvonek zapojen správně NEBO ke 2. bytu bude zvonek zapojen správně NEBO ke třetímu bytu bude zvonek zapojen správně NEBO ke 4. bytu bude zvonek zapojen správně", což je právě A\ U A2 U A3 U A4.
ad c) Po krátkém přemýšlení (ať logickém,nebo množinovém) lze dospět k tomu, že jev c) je opačným jevem k jevu b), neboli jev c) lze vyjádřit jako
Ax U A2 U A3 U AA. Je tedy jasné že P(c) = 1 — P(b).
Začněme výpočtem psti jevu (a): Nyní se musíme zamyslet nad tvarem množiny íž: chceme modelovat přiřazení čtyř zvonků k bytům, tj. množina všech možných výsledků by mohla obsahovat všechny možné čtveřice čísel 1, 2, 3, 4 (ale na to už jsme skoro odborníci - to se pozná, když tyto čtveřice budeme nazývat permutacemi), a přitom pokud např. 2 bude na druhém místě této čtveřice, bude to znamenat, že zvonek 2 je správně zapojen k bytu číslo 2. Nyní pst průniku vypočteme klasickým modelem, protože počet možných čtveřic je konečný a každá při náhodném zapojení má stejnou šanci nastat:
P(a) = P{A-i nA2nÁ3ni4) = ^ = 0,416666
protože příznivý případ správného zapojení všech zvonků je jediný a všech možných zapojení neboli permutací čtyřprvkové množiny je 24.
MA 0008 - Teorie pravděpodobnosti
39
Dostáváme se k výpočtu (b), kde využijeme větu 4.2 pro n = 4: P(A1 UA2UA3U AA = P(^) + P(A2) + P(A3) + P(AA -
-P(A1 n A2) - p(A1 n A3) - P(A1 n AA - P(A2 n A3) - P(A2 n AA - P(A3 n AA + +P{A1 n^n A3) + p(>ii nA2n AA + p(Ai n^n AA + p(A2 n^n A4) --P(A1nA2ílA3ílA4).
Návratem k permutacím a jejich počtům dostaneme výsledek
^(3! + 3! + 3! + 3! - 2! - 2! - 2! - 2! - 2! - 2! + 1 + 1 + 1 + 1 - 1) = 0,625.
No a poslední výsledek c) dostaneme už přes pst opačného jevu: p(c) = 1 — 0,625 = 0,375.
Čili hlavním zájmem našich úvah bylo vypočítat část (b) použitím věty o součtu -doporučuji si pamatovat, že ve větě o součtu se počítá pst sjednocení7, i když se v ní vyskytují průniky jevů! Ovšem sjednocení je v této větě jejím hlavním zájmem.
V další části tohoto oddílu se skutečně zaměříme více na pst průniku jevů - takové psti jsme schopni počítat např. pomocí klasického modelu psti, ale řekneme si výpočtům psti průniku ještě několik důležitých věcí, z nichž nej důležitější je rozdíl při výpočtu psti průniku jevů podmíněných a jevů nezávislých. Tento rozdíl bude vysvětlen na následujících dvou příkladech.
Příklad 4.3 Hážeme třikrát hrací kostkou. Označme náhodné jevy A ... při prvním hodu padne jednička; B ... při druhém hodu padne dvojka; C ... při třetím hodu padne trojka; Jaká je pst náhodného jevu A n B n C ?
Odpověď na tuto otázku získáme podobně, jako získáme počet konfigurací vynásobením dílčích konfigurací při kombinatorickém principu součinu - vynásobíme dílčí psti. Jinými slovy,
P (A nfinC) = P (A) ■ P{B) ■ P{C) = -■-■- = 0,004629.
6 6 6
Situace při výpočtu psti průniku nebude ovšem takto jednoduchá vždy: v příkladu 4.3 totiž dílčí jevy jsou na sobě navzájem náhodně nezávislé, neboli pst padnutí dvojky při druhém hodu není ovlivněna tím, jaký byl výsledek prvního hodu, a pst padnutí trojky
7Pokud bychom například přehodili všechny symboly sjednocení za symboly průniku a symboly průniku za symboly sjednocení, za prvé dostaneme nesmysl, a za druhé u zkoušky bychom za tento nesmysl nedostali žádné body.
40
Katedra matematiky PedF MUNI v Brně
při třetím hodu, pokud kostkou hážeme nestranně, stále stejným stylem, nezávisí na tom, co na kostce padlo při hodu prvním a hodu druhém. Tato skutečnost, že pst průniku je rovna součinu dílčích pstí, nám poslouží jako definice nezávislých jevů8:
Definice 4.1 • Dva náhodné jevy A\,Ai E A se nazývají stochasticky nezávislé (náhodně nezávislé), když P(A± H A2) = P(Ai) ■ P^Az).
• n náhodných jevů Ai, A2, ■ ■ ■ , An E A se nazývají stochasticky nezávislé (= náhodně nezávislé), když
(i) P(Ai n Aj) = • P{Aj) pro 1 < 1 < j < n,
(u) P(A, n Aj n Ak) = P(Ai) ■ P(Aj) ■ P(Ak) pro 1 < i < j < k < n,
(iii) ...
(iv) P(A1 nA2r)A3n---r)An) = p {AJ ■ P(A2) ■ p(A3).....P(An)
(tedy ověřujeme 2n — n — 1 vztahů).
Třeba v příkladu 4.3 jsou jevy A, B nezávislé, protože platí P (A n B) = P (A) ■ P {B). A také jsou jevy A, B, C (stochasticky) nezávislé, protože platí P (A íl B) = P (A) ■ P {B), P(A n C) = P (A) ■ P(C), P (B n C) = P(B) ■ P(C), P (A D B D C) = P (A) ■ P {B) ■ P (C) (nezávislost více než dvou jevů je třeba ověřit platností rovností, kde zkoumáme průniky jakýchkoli množin, které lze z daných množin sestrojit). Čtenář by si mohl možná všimnout, že pst průniku A n B n C v příkladu 4.3 je kladná (náhodný jev může nastat), a přesto je tato trojice jevů stochasticky nezávislá. Pojem nezávislosti jevů přímo tedy nesouvisí s tím, zda průniky utvářené z těchto jevů jsou neprázdné nebo prázdné9, ale spíše jakým způsobem se pravděpodobnost těchto průniků vypočte. Tedy i při neprázdných průnicích jevů jsou tyto dílčí jevy někdy závislé, někdy nezávislé - závislost jevů při neprázdném průniku uvidíme v příkladu následujícím.
Příklad 4.4 Ze sedmi telefonů daného typu na skladu prodejny jsou tři nekvalitní a čtyři kvalitní. Pro zákazníka prodejce náhodně z daných sedmi vybírá tři telefony, které on chce koupit pro svou rodinu. Označme náhodné jevy
K\ ... první náhodně vybraný telefon je kvalitní;
K2 ... druhý náhodně vybraný telefon je kvalitní;
ÍV3 ... třetí náhodně vybraný telefon je NEkvalitní.
Určete pst toho, že nastanou tyto tři náhodné jevy současně při náhodném výběru tří mobilních telefonů.
8Viz např. Budíková, Králová, Martoš, 2009, str. 59.
9Náhodné jevy, jejichž průnik je prázdný, se nazývají neslučitelné, nikoli nezávislé - prosím tyto dva pojmy nezaměňujte. Ovšem vztah logické implikace mezi těmito dvěma pojmy skutečně existuje: pokud například Aíl B (1 C = 9, a, přitom P (A) > 0, P(B) > 0, P(C) > 0, tak jsou náhodné jevy A, B, C stochasticky závislé, protože P (A (1 B íl C]i = P(0) = 0, ale P (A) ■ P(B) ■ P(C) > 0. Tedy jestliže neslučitelné jevy s kladnými pstmi mají prázdný průnik, pak jsou stochasticky závislé.
MA 0008 - Teorie pravděpodobnosti
41
Podobně budeme počítat pst průniku náhodných jevů, ale nyní podle trochu jiného vzorce:
P[KX nK2n N3) = P{Ki) ■ P{K2\Ki) ■ P{NZ\K± n K2).
Nyní totiž pst výběru druhého kvalitního telefonu bude záviset na tom, jaký byl vybrán první telefon. Označení svislé čáry v zápise P(K2\Ki) vyjadřuje jakousi navazující pst -uvažujeme situaci Ki, na kterou bude navazovat situace K2 v tom smyslu, že i když K\ je náhodný jev, který obecně nastat nemusí, v tomto NAVAZOVACÍM MODU budeme předpokládat, že nastal.
P[K\) = |, a nyní se ptáme, jaká je pst, že i druhý vybraný mobil bude kvalitní, pokud ten první byl kvalitní: vypočteme P(K2\Ki) = | (při prvním výběru byl odebrán kvalitní, tj. zbývají 3 příznivé případy, všech možných je už jen 6).
Definice 4.2 P(K2\Ki) označuje pst jevu K2 vázanou podmínkou, že nastal rovněž jev K\ ... podmíněná pst jevu K2 za podmínky, že nastal také jev K\.
V našem příkladu P[K2) má jinou hodnotu než P(K2\Ki) = | = 0,5, neboť K2 je situace, kdy druhý vybraný mobil je kvalitní, aniž je řečeno něco o prvním vybraném. Při prvním výběru mohou nastat dvě situace, které obě musíme uvažovat, protože obě hrají roli pro výběr druhého kvalitního. Tedy
P(K2) = P{Ki) ■ P{K2\Ki) + P{K[) ■ P{K2\K[) = | - | + | ■ | = 0,57143.
7 o 7 o
Tedy vidíme, že P(K2), bez ohledu na to, co se stalo-stane při prvním výběru, je větší než P(K2\Ki). Jedná se tedy o dva různé koncepty a tomu P(K2\Ki) se říká podmíněná pst.
Dokončeme výpočet našeho příkladu 4.4:
PÍK,) ■ PiK.lK,) • P(iV3|Ki n K2) = \ -\ -\ = 0,17143.
7 6 5
Vzorec i označení právě vysvětlené a použité ještě zapišme do věty:
Věta 4.3 Pokud P(Ai n A2 n • • • n An_i) ^ 0, tak pro průnik náhodných jevů A\, A2, až An platí:
P{A1 r\A2r\---r\An) = P{Aľ) ■ P{A2\A1)■ P(A3|^ipA2).....P{An\A1nA2p• • • pAn_ľ).
Pro n = 2 přechází věta do vzorce P(Ai p A2) = P(Ai) ■ P(^2|^4i), odkud lze získat logicky ekvivalentní představu o tom, co je to podmíněná pst jevu A2 za podmínky A\.
tj. podíl psti průniku ^p^i ku psti jevu A\, který předpokládáme, že nastal. Podmíněné psti v příkladu 4.4 jsme vypočetli pomocí klasického modelu přímo, ale v některých jiných příkladech, kde si nebudeme tak jisti, se nám vzorec 4.1 může hodit, protože platí
42
Katedra matematiky PedF MUNI v Brně
i v situacích, kdy se nejedná o model klasické psti.
Abychom nyní uzavřeli diskusi nad pstí průniku, vidíme, že existují dva různé vzorce: jednak vzorec z příkladu 4.3 pro nezávislé jevy (výpočet pomocí součinu dílčích pstí), z příkladu 4.4 pro jevy závislé (výpočet pomocí součinu, ve kterém „nabalujeme" u každého dalšího jevu podmínku, že nastaly-nastanou současně i všechny jevy dosud uvažované). Porovnáním těchto dvou vzorců je vidět, například na dvou jevech A±, A2, že pokud tyto dva náhodné jevy jsou nezávislé, platí P(A2|-<4i) = P(^42), tj. podmínka Ai nezávislá na jevu A2 neovlivní pst jevu A2 - ta je pořád stejná, ať už A\ nastane nebo ne.
Závěrem ještě dva příklady na procvičení řečeného v této kapitole.
Příklad 4.5 Házíme čtyřstěnem, přičemž PADNE ta strana, na kterou celý čtyřstěn dopadne jako na základnu. Přitom
stěna A: obarvena červeně;
stěna B: obarvena zeleně;
stěna C: obarvena modře;
stěna D: rozdělena na tři části trojúhelníky, jeden z nich obarven červeně, druhý zeleně, třetí modře.
Označme náhodné jevy
R ... padne alespoň část stěny červené (R = {A,D});
G ... padne alespoň část stěny zelené (G = {B,D});
B ... padne alespoň část stěny modré (B = {C, D}).
Jsou náhodné jevy R, G, B stochasticky nezávislé? (íl = {A, B,C, D})
Řešení: Musíme ověřit platnost čtyř rovností:
P(R nG) = P(R) ■ P(G) : \ = \-\,
P(RnB) = P(R)-P(B): \ = \\
P(G n B) = P(G) ■ P{B) : \ = \\
P(R nGn5) = P(R) ■ P(G) ■ P(B) : \ + \\ = \
Z rovností a nerovnosti plyne: každé dva z jevů R, G, B jsou stochasticky nezávislé, kdežto všechny tři současně jsou stochasticky závislé. Tj. závislost tří jevů je trochu tajemnější a může nastat, i když každá dvojice z daných tří je nezávislá.
MA 0008 - Teorie pravděpodobnosti
43
Příklad 4.6 Ze sady 100 výrobků je 10 zmetků. Při kontrole jakosti vybereme náhodně tři výrobky z této sady. Určete pst, že
a) první dva vybrané výrobky budou kvalitní a třetí vybraný bude zmetek (K\ p K2 p K%);
b) ze tří vybraných budou dva kvalitní a jeden zmetek (nezáleží na pořadí, ale vypočtěte
tak, že všechna možná příznivá pořadí projdete);
c) totéž jako (b), ale počítejte jiným způsobem - tak nějak najednou, když nezáleží na
pořadí;
d) druhý výrobek ze tří vybíraných bude kvalitní.
Řešení: Použijeme v tomto příkladu vše, co bylo v tomto oddílu řečeno: Ad a) P(Kinif2n^) = fi • 1 • i = 0,0826.
Ad b) Pokud nezáleží na pořadí zmetku ze tří kontrolovaných, mohou nastat tři situace, které jedna druhou vylučuje, tj. jejich psti se podle axiomu (P3) sečtou:
P[KX n^n Ä3) + P[KX nK~2n k3) + p{k[ nK2n k3) =
90 89 10 90 10 89 10 90 89
=-----+-----+-----= 0,2478.
100 99 98 100 99 98 100 99 98
Ad c) užijeme klasické psti, tedy podílu příznivých případů úkolu b) ku počtu všech možných:
P = = 0,2478.
Ad d) Tuto pst jsme už počítali v příkladu 4.4, pouze s jinými hodnotami:
PÍK,) = P(Kl}. P(K2\Kl} + Pm . P(K2m = °° . I + ii . I = 0,9
(výsledek je paradoxní: bez ohledu na pořadí vybíraného výrobku, pst, že vytáhneme výrobek kvalitní, je pořád stejná a rovná ^ ... pokud ji tedy nepodmíníme žádnou infor-mací-požadavkem o tom, jaká je kvalita dříve vybraných výrobků).
4.2 Shrnutí
Kromě axiomu (P3), který stanovuje-popisuje pravidlo pro výpočet sjednocení disjunktních jevů, se teorie psti snaží rozšířit práci s náhodnými jevy i na jevy, které mají neprázdný průnik. Nejprve jsme se v této kapitole věnovali výpočtu psti sjednocení jevů, pro něž průniky kterýchkoli z nich mohou být neprázdné - tuto situaci popisuje věta o součtu psti 4.1 nebo spíše její rozšíření pro tři a více jevů, 4.2. Tato věta je pro konečné množiny u klasické psti vlastně jen obdobou principu inkluze a exkluze, kterým počítáme počet prvků sjednocení množin (obdobou získanou z principu inkluze a exkluze vydělením celé rovnosti počtem prvků množiny ŕž).
44
Katedra matematiky PedF MUNI v Brně
Už v těchto větách o součtu se vyskytuje výpočet psti průniku náhodných jevů. Tuto pst průniku lze počítat různými způsoby například vyjádřit i pst průniku jevů podle vzorce pro klasickou pst, pokud je to možné, a kombinatoricky vyjádřit počet možných konfigurací příznivých a vydělit počtem konfigurací všech. Ovšem často výpočet průniku jevů nelze určit přímo, ale je možné vyjádřit ji jako součin pstí jistých dílčích jevů - buď přímo součin pstí jevů, jejichž průnik počítáme, jak je tomu v příkladu 4.3, nebo jako součin pstí jevů podmíněných určitými situacemi, jako je tomu v příkladě 4.4. Obecně tedy pro pst průniku lze užít vzorec věty 4.3, ten můžeme použít vždy. Vzorec z příkladu 4.3 lze užít jen pro průnik jevů stochasticky nezávislých. Jak je vidět v definici 4.1, stochastickou nezávislost definujeme právě pomocí vlastnosti, že pst průniku jakéhokoli počtu z těchto jevů je roven součinu pstí těchto dílčích jevů.
U jevů stochasticky (= náhodně) závislých lze definovat jistou podmíněnou pst pomocí vzorce 4.1, když P(Ai) ^ 0 pro jev A±, o kterém mluvíme jako o podmínce a jehož nastoupení-výskyt je předpokládán při výpočtu P(^42|^i)- Respektive tuto podmíněnou pst lze definovat u jevů jakýchkoli, jen pro nezávislé jevy zjistíme, že nic nového nezískáme, protože pro ně P(A2\A1) = P(A2).
4.3 Otázky k opakování a cvičení 04: pst průniku a sjednocení, podmíněná pst
U následujících výroků rozhodněte, zda se jedná o výrok pravdivý či nepravdivý.
Otázka 4.1 Podmíněná pst vyjadřuje pst náhodného jevu za předpokladu, že je splněna jistá podmínka.
Otázka 4.2 Podmíněná pst P(B\A) nemůže být rovna nule.
Otázka 4.3 Pst, že žádný ze čtyř bytů nebude při náhodném zapojení zvonků připojen ke správnému jménu, lze vyjádřit jako P(A± P A2 n A% n A4).
Otázka 4.4 Pro stochasticky nezávislé jevy A, B, pro které P (A) > 0, P(B) > 0, platí P(B) = P(B\A).
Otázka 4.5 Vzorec P(A1) ■ P(A2) ■ P{AZ) = P{AX) ■ P(A2\A1) ■ P(A3\A1 P A2) platí jen někdy.
Otázka 4.6 Vzorec P(A1 nA2n A3) = P{A{) ■ P{A2) • P{A3) neplatí vždy.
Otázka 4.7 Vždy platí P(A2\Ai) = P^2^> protože to plyne ze vzorce P(A± Pl A2) = P(A1)-P(A2\A1).
Otázka 4.8 Jevy R, G, B mohou být stochasticky závislé, i když každé dva z nich jsou stochasticky nezávislé.
MA 0008 - Teorie pravděpodobnosti
45
4.3.1 Pst sjednocení či průniku či části množin
Úloha 4.1 120 studentů skládalo tři zkoušky. Na základě informací níže určete pst toho, že náhodně vybraný stud z této skupiny složil pouze 3. zkoušku.
120 studentů skládalo tři zkoušky. Přitom deset procent studentů nesložilo ani jednu z nich. Nebyl nikdo, kdo by složil zkoušku jen z druhého předmětu. Devět studentů z něj složilo úspěšně zkoušku, leč pro změnu neprospělo z prvního předmětu. J±l studentů složilo ze tří zkoušek dvě. 33 studentů nevyhovělo z třetího předmětu. 56 studentů složilo úspěšně zkoušku ze druhého i třetího předmětu, zato však 20 studentů neobstálo ani u jednoho z nich.
(úloha vyžaduje i logiku: které info vzít nejdřív a které potom?)
Úloha 4.2 Tři lidé si v šatně divadla uschovali klobouk. Šatnářka po přestavení vydává klobouky náhodně.
Jaká je pravděpodobnost, že aspoň jedna osoba dostane klobouk správně?
Návod: označte SI ... první člověk dostane správně klobouk,
52 ... druhý člověk dostane správně klobouk,
53 ... třetí člověk dostane správně klobouk.
Úloha 4.3 V dodávce zboží je 50 matic a 150 šroubů. Polovina matic a polovina šroubů je poškozena.
Jestliže náhodně vybereme jednu součástku, jaká je pravděpodobnost, že to bude matice nebo poškozená součástka?
Úloha 4.4 Při zkoušce si student náhodně vybere 3 ze 30 otázek. Aby zkoušku úspěšně absolvoval, musí správně odpovědět aspoň dvě z nich.
Jaká je pst, že student, který umí jen 20 otázek, absolvuje úspěšně zkoušku?
Úloha 4.5 V sáčku je 30 kuliček, z toho je 8 kuliček bílých, 10 modrých a 12 červených. Jaká je pst, že ze sáčku vytáhneme tři kuličky stejné barvy?
Úloha 4.6 V loterii bylo vydáno 1000 losů, z nich 100 vyhrává. S jakou pravděpodobností získáte aspoň jednu výhru, koupíte-li si a) Jeden los? b) Pět losů? c) Deset losů? d) Dvacet losů?
Úloha 4.7 Z 27 žáků osmé třídy jich 10 je doučováno z matematiky a 13 z fyziky. Přitom polovina z těch, co mají doučování z matematiky, je doučována i z fyziky. Jaká je pst, že náhodně vybraný žák z této třídy je doučován aspoň v jednom z daných dvou předmětů?
Úloha 4.8 Z 25 žáků deváté třídy jich 15 má doučování z matematiky a 8 doučování z angličtiny. Přitom pětina z těch, co mají doučování z matematiky, je doučována i z angličtiny. Jaká je pst, že náhodně vybraný student z dané třídy není doučován ze žádného z daných dvou předmětů?
46
Katedra matematiky PedF MUNI v Brně
Úloha 4.9 Prodejce obleku má zkušenost, že zákazníci požadují krejčovskou úpravu u 10 % prodaných kalhot a u 15 % prodaných sak. U 7 % prodaných obleků zákazníci požadují úpravu jak kalhot, tak saka. Prodá-li prodejce za odpoledne čtyři obleky čtyřem různým zákazníkům (předpokládejte, že zákazníci se navzájem neznají a přicházejí do obchodu nezávisle), určete pst, s jakou bude požadována aspoň jedna úprava obleku (kalhot nebo saka nebo obojího).
Úloha 4.10 Prodejce obleků má zkušenost, že zákazníci požadují krejčovskou úpravu u 12 % prodaných kalhot a u 15 % prodaných sak. U 8 % prodaných obleků zákazníci požadují úpravu jak kalhot, tak saka. S jakou p stí u náhodně vybraného prodaného obleku
a) nebude požadována žádná úprava?
b) bude zákazník požadovat jen jednu úpravu (kalhot nebo saka, ne však obojího)?
Úloha 4.11 U skupiny 40 studentů víme, že 80% z nich jde matematika, 70% jde Excel, 60% je dobrých v matematice i Excelu. Jaká je pst, že náhodně vybraný student z této skupiny bude mít problémy s matematikou i s Excelem?
Úloha 4.12 Ve třídě je 25 žáků, z nich 17 má rádo matematiku, 15 má rádo fyziku, a čtyři žáci nemají rádi ani matematiku, ani fyziku. Jaká je pst, že náhodně vybraný žák této třídy má rád matematiku i fyziku současně?
Úloha 4.13 Tři kamarádi se v baru domluvili, že ten, na kterého padne los, zaplatí za všechny útratu. Losují tak, že každý hodí mincí a ten, kterému jeho mince ukáže jinou stranu než mince zbývajících dvou, musí zaplatit. Pokud všechny mince ukážou stejnou stranu. Házení opakují až do rozhodnutí.
a) S jakou pstí se rozhodne již prvním hodem?
b) S jakou pstí nebude ani po druhém hodu rozhodnuto?
c) S jakou pstí nebude ani po čtvrtém hodu rozhodnuto?
d) Lze předem stanovit, po kolikátém hodu již musí být rozhodnuto?
Úloha 4.14 Přístroj se skládá ze tří částí, z nichž každá nezávisle na zbývajících může mít v průběhu určité doby poruchu. Porucha kterékoliv části má za následek poruchu celého přístroje. Spolehlivost (tj. pravděpodobnost, že nedojde k poruše) první části je 0,8, druhé 0,9 a třetí 0,7. Jaká je spolehlivost celého přístroje?
Úloha 4.15 V nádražní hale jsou umístěny tři automaty na kávu. U prvního nastane porucha s prstí 0,1, u druhého s pstí 0,15 a u třetího s pstí 0,05. Jaká je pst, že nastane porucha
a) právě jednoho automatu
b) nejvýše jednoho automatu?
MA 0008 - Teorie pravděpodobnosti
47
4.3.2 Podmíněná pst
Úloha 4.16 Víme, že při dvou hodech kostkou padl celkem součet ok dělitelný pěti (to je podmínka, která nastala). Jaká je pst, že padly dvě pětky (tuto informaci už nevíme, a musíme tedy danou pst spočítat)?
Úloha 4.17 Víme, že při dvou hodech kostkou padla aspoň jedna pětka (to je podmínka, která nastala). Jaká je pst, že součet hodnot obou hodů je dělitelný třemi (tuto informaci už nevíme, a musíme tedy danou pst spočítat)?
Úloha 4.18 Víme, že součet dvou hodů kostkou je dělitelný čtyřmi (to je podmínka, která nastala). Jaká je pst, že při obou hodech padlo sudé číslo (tuto informaci už nevíme, a musíme tedy danou pst spočítat)?
Úloha 4.19 V osudí je 6 bílých, 8 červených a 10 modrých kuliček. Postupně bez vracení vylosujeme dvě kuličky. S jakou pstí bude
a) první modrá
b) druhá modrá, víle-li, že první byla červená
c) druhá modrá (aniž víme, jakou barvu měla první) ?
Odpovědi na otázky a některá cvičení viz 14.4.
48
Katedra matematiky PedF MUNI v Brně
5 Týden 05
5.1 Bernoulliovy pravděpodobnosti
Uvažujme experiment takové povahy, že mohou nastat jen dva různé výsledky, které se navzájem vylučují (nemůže k nim dojít současně): „úspěch" a „neúspěch" („úspěch" nemusí znamenat nic světoborného; označuje se tímto termínem proto, že se jedná o ten ze dvou možných výsledků, na který se ve svých úvahách chceme zaměřit).
Pravděpodobnost úspěchu je p, pravděpodobnost neúspěchu 1 — p. Náhodná veličina X, která udává počet výskytů úspěchu při N nezávislých opakováních experimentu, má tzv. binomické rozdělení pravděpodobnosti (s
parametry N,p) a nabývá hodnot z množiny {0, 1,2,..., N} s pravděpodobností
P(X = r)=^j -f-{l-p)N-T.
Mluví se zde o nezávislých opakováních experimentu. Slovo „nezávislých" znamená, že výskyt úspěchu při prvním opakování experimentu nemá vliv na to, zda při druhém a dalších opakováních nastane úspěch nebo ne. Skutečnost, že veličina X má binomické rozdělení s parametry N, p, budeme označovat
X ~ Bi(N,p).
Podívejme se nyní na konkrétní příklady.
Příklad 5.1 Hážeme čtyřikrát kostkou. Veličina X udává, kolikrát přitom padne šestka. Jaké je rozdělení pravděpodobnosti veličiny X?
Řešení: Pravděpodobnost, že při jednom hodu padne šestka, je rovna p = |. Hody jsou navzájem nezávislé, tj. pokud v prvním hodu padla šestka, nemá to vliv na to, zda ve druhém hodu padne nebo ne. Tedy veličina X, která měří počet šestek při čtyřech hodech, má binomické rozdělení pravděpodobnosti s parametry N = 4, p = jL
5 5 5 5
P(X = 0) = P(ne 6) • P(ne 6) • P(ne 6) • P(ne 6) =-------= 0,482;
6 6 6 6
P(X = 1) = Pojednou padne 6, jinak něco jiného než 6) =
= P(6 padne jako první, jinak ne) + P(6 padne druhá, jinak ne) +
+P(6 padne jako třetí, jinak ne) + P(6 padne čtvrtá, jinak ne) = -1^55 5155 5515 5 5 5 1 _
6666 6666 6666 6666
15 5 5
= (všechna možná pořadí výskytu jednoho úspěchu) ■ — ■-■ — ■- =
6 6 6 6
4\ 1 5 5 5
--------= 0,386;
1/6666 ' '
MA 0008 - Teorie pravděpodobnosti
49
P (X = 2) = P(dvakrát padne šestka, jinak ne) =
115 5
= (všechny možnosti výběru 2 poradí ze 4) -
v y y f ; 6 6 6 6
■ 14) =
= 1 - (p(15) + p(16) + p(17) + p(18) + p(19) + p(20)) =
= 1 - (0,179 + 0,13 + 0,072 + 0,028 + 0,007 + 0,001) = 0,583.
50
Katedra matematiky PedF MUNI v Brně
Pokud by agentura STEN v předchozím příkladu zjistila, že „pro" bylo jen 8 lidí z 20, pak některý z teoretických předpokladů nebyl v pořádku:
• vzorek dotázaných lidí nebyl náhodný (byl z antiswensonovské oblasti státu);
• odpovědi nebyly nezávislé (odpovídající mezi sebou navzájem diskutovali o Swen-sonovi);
• STEN pracovala dobře, ale Swenson byl příliš optimistický se svým odhadem (to je nejpravděpodobnější problém).
Ukažme si ještě graficky tvar binomického rozdělení, například pomocí pravděpodobnostního histogramu.
a) Pokud p = 0,5, rozdělení je vždy symetrické. Například histogram pravděpodobností binomického rozdělení pro N = 3, p = 0,5:
0.35 0.3
0.25 0.2
0.15
0.1 $.05
"D"
Nebo histogram pravděpodobností binomického rozdělení pro N = 6, p = 0,5:
0.3: 0.25
0.2 -j 0.15
0.1 0.05 -j
m
o
MA 0008 - Teorie pravděpodobnosti
51
Nebo histogram pravděpodobností binomického rozdělení pro N = 10, p = 0,5: 0251 i—i
0.2: i 0.15 ^ 0.1^
0.05: _ _
0 ' 2 4 6 8 ' 10
b) Pro p 0,5 a malé N je rozdělení asymetrické, ale pro rostoucí N se stává více a více symetrickým. Histogram pravděpodobností binomického rozdělení pro N = 4, p = 0,1:
3.6:
3.5:
3.4:
3.3:
3.2:
0.1:
-1 0 i 2 3 4 5
Histogram pravděpodobností binomického rozdělení pro N = 4, p = 0,9:
0.6: 0.5: 0.4: 0.3: 0.2: 0.1:
i
1 2 3 4 5
52
Katedra matematiky PedF MUNI v Brně
Histogram pravděpodobností binomického rozdělení pro N = 10, p = 0,1:
O.CS
o.;?
o.
8 10
Histogram pravděpodobností binomického rozdělení pro N = 40, p = 0,1:
0.2 -
0.15
0.1-
0.05 -
2 4 6 8 10 12
5.2 Úplná pravděpodobnost
Uvažujme nyní množinu íl elementárních výsledků experimentu rozloženou (rozklad množiny) na disjunktní podmnožiny Hi, H2, až Hk - viz obrázek (pro k = 7):
0
\ H2
H7 / Ä6 \ ^5
Lze vidět z obrázku, že množinu A lze rozložit na sjednocení navzájem disjunktních jevů H% n A, H4 n A, i/5 n #6 H A A pak uplatníme axiom (P3) a dostaneme
P{A) = P{H3 nA) + P{H4 nA) + P{H5 nA)+ P{H6 n A).
MA 0008 - Teorie pravděpodobnosti
53
Užitím vzorce 4.1 pro každý člen na pravé straně dostaneme P(A) = P(H3) ■ P(A\H3) + P(PT4) ■ P(A\H4) + P(PT5) ■ P(A\H5) + P(PT6) ■ P(A\H6).
Tomuto právě odvozenému vztahu říkáme věta o úplné psti. Jak je vidět z obrázku, důkaz této rovnosti plyne ze vzájemné disjunktnosti množin H3 n A, h4 n A, H5 n A, H$ n A a z axiomu (P3) o psti sjednocení disjunktních množin.
A ještě poslední věc: kdy tuto větu užijeme? Odpověď je nasnadě: když máme k dispozici (nebo můžeme snadno určit) všechny dílčí psti na pravé straně rovnosti - tehdy P (A) lze určit na základě tohoto vztahu. Tedy pokud neznáme P (A), ale celkem snadno určíme psti P(A\Hl), vzorec se zdarem použijeme.
Věta 5.1 (Věta o úplné psti) Množinu íž lze rozložit10 na sjednocení navzájem disjunktních neprázdných podmnožin H\, H2, až Hk. A je náhodný jev, tj. A C íl. Pak platí:
P(A) = P(PTi) • P{A\Hi) + P(H2) ■ P(A\H2) + ■■■ + P(Hk) ■ P(A\Hk).
Příklad 5.3 V čokoládovně se kompletují bonboniéry na třech výrobních linkách.
Linka 1: kompletuje 40% produkce, pokazí (špatně zabalí) 5% bonboniér, které touto linkou procházejí.
Linka 2: kompletuje 45% produkce, pokazí (špatně zabalí) 4% bonboniér, které touto linkou procházejí.
Linka 3: kompletuje 15% produkce, pokazí (špatně zabalí) 2% bonboniér, které touto linkou procházejí.
Zkontrolujeme náhodně bonboniéru zabaleno ve skladu (nevíme, ze které linky) - jaká je pst, že nebude v normě (= není správně zabalena) ?
Řešení: Když jsou data takhle krásně naservírována, užít věty 5.1 nebude problém - horší budou příklady, kdy tak krásně sestavit data musíme sami při řešení. V každém případě, pokud by se nám nepodařilo najít systém neprázdných podmnožin Ht, který vytváří disjunktní pokrytí množiny íž, s příkladem bychom se nemohli vypořádat pomocí vzorce na úplnou pst.
Nyní jsou jevy Hi, H2, H3 jasné:
Hi ... náhodně vybraná bonboniéra ze skladu byla vyrobena na lince 1. Odtud P(Hi) = 0,4.
H2 ... náhodně vybraná bonboniéra ze skladu byla vyrobena na lince 2. Odtud P(H2) = 0,45.
10Rozklad množiny na podmnožiny: Viz základy matematiky, přednáška 7, rozklad množiny příslušný pojmu relace ekvivalence.
54
Katedra matematiky PedF MUNI v Brně
H3 ... náhodně vybraná bonboniéra ze skladu byla vyrobena na lince 3. Odtud P(H3) = 0,15.
Jako A označíme náhodný jev, jehož pst hledáme: A ... Náhodně vybraná bonboniéra ze skladu je zmetkově zabalena.
Je asi docela srozumitelné, když už vyjádříme výsledek úlohy pomocí
P{A) = 0,40 • 0,05 + 0,45 • 0,04 + 0,15 • 0,02 = 0,041.
Výsledek vlastně udává jakýsi obecný počet procent (4,1%) špatně zabalených bonboniér. A proto se nejedná o úlohu, která by byla příliš vzdálena základní škole - vlastně počítáme jakési procento špatné zabalenosti z celku všech bonboniér.
5.3 Bayesův vzorec
Kdybychom ještě zůstali u stejného obrázku jako v předchozím oddílku, a vlastně i u stejného vzorce 4.1, který jsme využili u úplné psti, lze tento vzorec užít ještě jednou a jinak. Uvažujme tentýž příklad tří linek balicích bonboniéry, i se stejnými údaji o objemech produkce a kvalitách balicích linek - z uvedených dat je možné spočítat ještě psti jiného typu, a sice psti P^A), P(H2\A), P(H3\A).
Aby nedošlo k mýlce, zopakujeme si, co označuje podmíněná pst, ať už oba jevy napíšeme v jakémkoli pořadí:
P(A\Hi) ... pst, že náhodně vybraná bonboniéra ve skladu bude zabalena zmetkovitě za podmínky (= už víme, že nastala situace), že tato bonboniéra byla zabalena na lince 1 ... tuto pst jsme dostali už v zadání příkladu 5.3 a je rovna 0,05.
P(Hi\A) ... pst, že náhodně vybraná bonboniéra pochází z linky 1 za podmínky (= už víme, že nastala situace), že tato bonboniéra byla zabalena nekvalitně. Tato pst v zadání příkladu nebyla uvedena, ale je možné ji vyčíslit pomocí vzorce 4.1, čili
P(H\A) P{Hl 0 A)
Pst P (A) = 0,041 je úplná pst z příkladu 5.3, pst P(HiC\A) vypočteme podle vzorce pro pst průniku:
P{HllA) P(A) -P(Ä)-- 0,041 - °'4878-
Věta 5.2 (Bayesův vzorec) Množinu Cl lze rozložit na sjednocení navzájem disjunktních neprázdných podmnožin H\, H2, až Hk. A je náhodný jev, tj. A C Cl. Pak platí:
p(h \á) =_p(Hi) • P(a\hl)_
1 l| ; P{H1)-P{A\H1) + P{H2)-P{A\H2) + --- + P{Hk)-P{A\Hk)
pro každý index i E {1, 2, 3}.
MA 0008 - Teorie pravděpodobnosti
55
Poznámka k tomu, co jsme vlastně spočítali: Pst -P(iři) = 0,40 je tzv. apriorní pst (a priori = předem), neboli pst, jejíž hodnotu známe předem, už v zadání - pst toho, že náhodně zabalená bonboniéra pochází z linky 1.
Pst P(Hi\A) je tzv. aposteriorní pst (a posteriori = poté, tj. po měření, po provedení kontroly vybrané bonboniéry), je pst, jejíž hodnotu známe až po provedení nějaké kontroly v balírně bonboniér či ve skladu balírny: náhodně jsme vybrali bonboniéru a zkontrolovali ji a zjistili, že je nekvalitně zabalená. Po této informaci-kontrole se pst změní na P(Hi\A) = 0,4878 ... pokud kontrolovaná bonboniéra je nekvalitně zabalená, roste šance, že se jedná o bonboniéru balenou na lince 1, protože linka 1 je známá nej větším procentem zmetkovitého balení, a současně je svým objemem produkce zastoupena celkem silně.
Podobně bychom mohli podle Bayesova vzorce vypočítat aposteriorní psti P(H2\A) = 0,439, P(H3\A) = 0,0732. Všimněte si v tom například, že apriorní patnáctiprocentní P(H3) u náhodně kontrolované bonboniéry klesne jen na aposteriorní 7,3%-ní P(H3\A), protože linka třetí má malou zmetkovitost balení, tj. při špatně zabalené čokoládě klesne šance, že byla balena na lince 3.
Dvě pomůcky, které snad pomohou čtenáři si zapamatovat Bayesův vzorec či zkontrolovat jeho správnost:
• Při výpočtu např. P(Hi\A) se na pravé straně objevuje v čitateli podmíněná pst v opačném pořadí jevů, tj. P(A\Hi) ... tu totiž známe a můžeme ji proto do pravé strany dobře dosadit.
• V čitateli pravé strany se vyskytuje P{Hi) ■ P(A\Hi), ve jmenovateli také - ve jmenovateli se totiž vyskytuje suma všech možných součinů P(HS) ■ P(A\HS) pro s 6 {1, 2,... , k}. Jinými slovy, v čitateli pravé strany se vyskytuje jeden z členů jmenovatele.
• To už jsme měli zmínit dříve: ve jmenovateli pravé strany je vlastně počítána úplná pst jevu A podle věty o úplné psti.
5.4 Shrnutí
V této kapitole jsme se seznámili s prvním typem rozdělení pravděpodobnosti, které má široké využití v praxi. Veličina X s rozdělením Bí(N,p) nabývá hodnot z množiny íl = {0,1,2,..., N} s pravděpodobností
Základní témata výpočtu psti rozvíjejí věty 5.1, 5.2. První z nich, větu o úplné pravděpodobnosti, použijeme při možnosti rozložit množinu íl na několik neprázdných navzájem disjunktních částí Hl takových, že P(Hi) máme k dispozici. Pravděpodobnosti P(Ht) představují jakési váhy, pomocí nichž P(A) pak vypočteme jako vážený průměr psti P(A\Hl) - a jako u každého dobrého váženého průměru, i pro váhy P(Hi) platí, že jejich součet je roven jedné.
(5.1)
56
Katedra matematiky PedF MUNI v Brně
Poslední významnou větu, Bayesův vzorec 5.2, lze využít při výpočtu P(Hi\A) ... tyto „opačné" podmíněné psti často neznáme, zatímco P(A\Hl) jsou často známy už ze zadání. Pokud dobře víme, že na pořadí podmínky a neznámého jevu při výpočtu podmíněné psti záleží, tak víme, že tyto dvě psti jsou téměř vždy navzájem různé, a jestliže je nezaměníme, tak tu obtížněji vyčíslitelnou právě můžeme vyjádřit pomocí Bayesova vzorce.
Je sice pravda, že pst P (A n H i) v čitateli Bayesova vzorce lze vyjádřit pomocí P (A) ■ P(Hi\A) i pomocLP(Aj) • P(A\Hi), protože průnik je operace komutativní, tj. větu o psti průniku z kapitoly 3 lze užít „oběma směry". Ale jen naprostý amatér zde při vybavování vzorce nebo při výpočtu příkladu udělá chybu, neboť P(Hi\A) nemá smysl dosazovat, protože právě to neznáme a chceme určit - v čitateli Bayesova vzorce se použije P(Hi) ■ P(A\H).
5.5 Otázky k opakování a cvičení 05: Bernoulliovy psti, věta o úplné psti, Bayesův vzorec
U následujících výroků rozhodněte, zda se jedná o výrok pravdivý či nepravdivý.
Otázka 5.1 Binomické číslo (^) udává, kolika způsoby lze vybrat k prvků z N -prvkové množiny.
Otázka 5.2 Pokud X ~ Bí(N,p), tak veličina X může nabývat pouze hodnot z množiny {1,2,..., N}.
Otázka 5.3 Kromě veličiny X s binomickým rozdělením udávajícím počet výskytů i lze
relativních četností .
také měřit veličinu Y = ^ relativních četností jr. Přitom platí
P(X = i) = P(Y = ±).
Otázka 5.4 Věta o úplné psti platí, i pokud existují takové indexy í, j E {1, 2, ..., n}, že Hi n H j ^ 0.
Otázka 5.5 Psti P(Ht) ve větě o úplné psti hrají roli tzv. vah, tedy
k
^P(H) = l.
i
Otázka 5.6 Psti P(A\Ht) ve větě o úplné psti hrají roli tzv. vah, tedy
k
YJP{A\H) = 1.
i
Otázka 5.7 Pro libovolné náhodné jevy Ht a A platí
P(A)-P(Hi\A) = P(Hi)-P(A\Hi).
Otázka 5.8 Apriorní psti u Bayesova vzorce je například P(Hi), aposteriorní psti je například P(Hi\A).
Otázka 5.9 Bayesův vzorec bychom mohli teoreticky i upravit na tvar
P(A)-P(H\A)
P{H\A) =
P(iíi) • P^Hr) + P(H2) ■ P(A\H2) + ■■■ + P(Hk) ■ P(A\Hk)'
MA 0008 - Teorie pravděpodobnosti
57
5.5.1 Binomické psti = Bernoulliho psti
Úloha 5.1 Příklad s oříšky Bruno si koupil 10 kg oříšků, 30% byly kešu, 40% lískové a 30% vlašské. Je jich tolik, že šance, že při každém vytažení se pst, že vytáhnu kešu se nemění tj. první vytažený bude kešu s psti 0,30, druhý vytažený bude kešu s psti 0,30, atd.
Označme veličiny K=počet kešu oříšků z 5 náhodně vybraných oříšků, L=počet lískových oříšků z 5 náhodně vybraných oříšků.
a) Jaká je pravděpodobnost, že z těch náhodně vybraných nebude žádný kešu oříšek P(K = 0) = 0,75 = 0,1681
b) Jaká je pravděpodobnost, že z těch náhodně vybraných bude 1 kešu oříšek P(K = 1) = 5 • 0, 30 • 0, 704 = 0, 36015
c) Jaká je pravděpodobnost, že z těch náhodně vybraných bude 2 kešu oříšky P(K = 2) = g)0, 3 • 0, 3 • 0, 73 = 0, 3087
d) Jaká je pravděpodobnost, že z těch náhodně vybraných bude 3 kešu oříšky P(K = 3) = g) • 0, 33 • 0, 72 = 0,1323
e) Jaká je pravděpodobnost, že z těch náhodně vybraných bude 4 kešu oříšky P(K = 4) = (J) • 0, 34 • 0, 7 = 0, 02835
f) Jaká je pravděpodobnost, že z těch náhodně vybraných bude 5 kešu oříšků P(K = 5) = 0,35 = 0,00243
g) Vypočítej, že z 5 oříšků je počet lískových oříšků je alespoň 2. P{L > 2) = 1 — P(L < 1) = 1 - P(0) - P(l) = 1 - 0, 65 - g) • 0,4 • 0, 64 = 0, 663
Poznámka: Součet psti a) až f) je roven jedné, protože jsou to psti všech elementárních jevů v případě měření veličiny K.
Úloha 5.2 Každý pracovní den jede výrobní linka a pokazí se za každý den s pst P=0,1 (pst poruchy každý den je stále stejná ... každý večer vymění na lince porouchané věci za nové).
X = počet dní z daných 10, kdy k poruše došlo.
Určete pst, že z deseti pracovních dnů nastane porucha linky právě třikrát.
Úloha 5.3 Hodíme a) deseti, b) dvaceti, c) třiceti mincemi. S jakou psti na polovině z nich padne líc?
Úloha 5.4 Pravděpodobnost, že spotřeba plynu ve všední den určitého období přesáhne stanovenou normu, je 0,2. Jaká je pst, že během pěti náhodně volených pracovních dnů
a) nebude norma překročena
b) bude překročená dvakrát
58
Katedra matematiky PedF MUNI v Brně
5.5.2 Úplná pst nebo Bayesuv vzorec
Úloha 5.5 Máme nějakou cihlovou stavbu. Cihly dováží v poměru 1 : 2 : 2 , tj. průměrně na každých pět cihel 1 dovezou z cihelny Cl (20 %), 2 cihly dovezou z cihelny C2 (40 %) a 2 cihly dovezou z cihelny C3 (40 %).
První cihelna vyrábí super cihly v 80 % případů, Druhá cihelna vyrábí super cihly v 65 % případů, Třetí cihelna vyrábí super cihly v 72 % případů.
a) Vypočítejte průměrné procento super cihly.
b) Náhodně vybraná cihla se prokázala superkvalitní (to už víme) - jaká je pst, že tatoi cihla pochází z cihelny Cl (to nevíme)?
Úloha 5.6 V basketbalu hraje 9 lidí, jeden z nich (průměrný) trefí koš při trestném střílení s pst 0,4- Zbylých osm se trefí při trestném střílení s pst 0,8.
Náhodnost je určena rádiem - hlásí a nebylo řečeno, jaký hráč z týmu hází.
a) Určete pst jevu A ... Náhodně vybraný hráč hází a trefí se;
b) V rádiu řekli, že hráč hodil a trefil se (to víme) - s jakou pstí se jednalo o hráče začátečníka (to nevíme)?
Úloha 5.7 Máme 15 televizorů a 3 z těch televizorů jsou nekvalitní a 12 jsou kvalitní. Někdo si kupuje televizor a chtěl by kvalitní televizor. Pomůže expert, ten kvalitní televizor pozná s pstí |, nekvalitní TV expert označí za kvalitní s pstí jj. Zákazník si náhodně vybere TV, zkonzultuje s expertem, ten si pak koupí.
a) Vypočtěte pst, že nastane jev A ... zákazníkem vybraný TV bude expertem označen za kvalitní.
b) Nastal jev A (to víme) - jaká je pst, že vybraný televizor je skutečně kvalitní?
Úloha 5.8 V zásilce je 400 výrobků, z nichž 150 dodal závod A a 250 závod B. Každý závod měl ve své dodávce 5 vadných výrobků. Jaká je pst, že vybereme vadný výrobek, pokud
a) jej vybíráme náhodně z celé zásilky,
b) nejdříve náhodně vybereme dodávku (hodíme si korunou), a teprve poté z ní výrobek?
Úloha 5.9 Je známo, že 90 % výrobků odpovídá standardu. Byla vypracována zjednodušená kontrolní zkouška, která u standardního výrobku dá kladný výsledek s pravděpodobností 0,95, zatímco u výrobku nestandardního s pravděpodobností 0,2. Jaká je pravděpodobnost, že výrobek, u něhož zkouška dopadla kladně, je standardní?
MA 0008 - Teorie pravděpodobnosti
59
Úloha 5.10 Tři střelci vystřelili každý jednou na vzdálený terč. Z jejich dosavadní výkonnosti odhadujeme, že první zasáhne terč v průměru v 87 případech ze sta, druhý v průměru v 72 případech ze sta a třetí v průměru v 65 případech ze sta. V terči byly zjištěny dva zásahy. S jakou pravděpodobností minul třetí střelec?
Úloha 5.11 Ve třídě je celkem dvanáct dětí, z toho jeden dyskalkulik (tj. nejde mu moc matematika). Dyskalkulik zvládne příklad na procenta v 50% případů, ostatní děti v 70%.
a) Jaká je pst, že náhodně vybrané dítě ve třídě uspěje v příkladu na procenta na
prověrce?
b) Paní učitelka po prověrce opravuje příklady na procenta a nad jednou prověrkou
vykřikne: „Ano, je to správně" (vykřikuje často, takže z toho nelze usoudit, o jakého žáka se jedná). Vyčíslete pst, že se jednalo zrovna o písemku žáka, který má s procenty větší problémy.
Úloha 5.12 Šest lidí trénuje ve střelbě z luku na terč z příkladu 3.29. Petr a Pavel se po nějaké době tréninku trefí do pětky nebo desítky s pstí 0,7, Anežka, Alice a Anna s pstí 0,5, jenom Cyrilovi se ještě nedaří a do pětky nebo desítky se trefuje s pstí 0,35. Jaká je průměrná úspěšnost = pst, že náhodně vybraný hráč se trefí, nevíme který?
Úloha 5.13 Honza a Pavel hodí každý jednou kostkou. Vyhraje ten, komu padne větší číslo (kdyby padla stejná čísla, hod by opakovali). Po hodu se Honza raduje, že vyhrál (to víme) - s jakou pstí mu padla pětka (to nevíme)?
Odpovědi na otázky a některá cvičení viz 14.5.
60
Katedra matematiky PedF MUNI v Brně
6 Procvičování příkladů, prověrka
V této kapitole se jen podíváme na řešení některých typů příkladů, ne nutně všech, které byly probrány v prvních čtyř týdnech na cvičení a mohly by se objevit na prověrce. Další příklady z minulých prověrek byly rozděleny do předchozích kapitol.
Příklad 6.1 Výrobce počítačů používá při přejímce hard disků následující strategii: Z celé dodávky detailně zkontroluje soubor náhodně vybraných disků a najde-li mezi nimi 5% nebo více disků s vadnými sektory, odmítne dodávku převzít. V opačném případě dodávku příjme.
A) S jakou pravděpodobností výrobce ODMÍTNE dodávku 300 disků, která ve skutečnosti obsahuje přesně 4% disků s vadnými sektory, pokud detailně kontroluje soubor
a) 20 náhodně vybraných disků,
b) 40 náhodně vybraných disků?
B) S jakou pravděpodobností výrobce PRIJME dodávku 300 disků, která ve skutečnosti obsahuje přesně 6% disků s vadnými sektory, pokud detailně kontroluje soubor
c) 20 náhodně vybraných disků,
d) 40 náhodně vybraných disků?
Řešení: Ad a): dodávka disků bude odmítnuta, bude-li ve dvaceti vybraných nalezen aspoň jeden vadný disk. Nejjednodušší výpočet je tedy od hodnoty 1 odečíst pst opačného
/288\
jevu, že totiž všech dvacet disků bude dobrých: 1 — j^l = 0,57.
I 20 )
ad b) Podobně jako a) s tím rozdílem, že firma kontroluje 40 disků v dodávce a odmítne ji při dvou a více nalezených vadných discích, tj. od hodnoty 1 odečteme pst, že ze 40
/288\ A2W288\
kontrolovaných bude vadný disk žádný nebo jeden: 1 — 4^f — 1/3oa\ = 0,4923.
I 40 J l 40 J
ad c) dodávka disků bude PŘIJATA, bude-li ve dvaceti vybraných nalezeno méně než
/282\
pět procent vadných, čili žádný vadný: = 0,2781.
I 20 J
ad d) dodávka disků bude PŘIJATA, bude-li ve čtyřiceti vybraných nalezeno méně než
/282\ /18W282\
pět procent vadných, čili žádný nebo jeden: j^U + 1/3oa\ = 0,2778.
I 40 J l 40 J
Příklad 6.2 Je známo, že 4% panelů od určitého výrobce mají odchylku od požadované délky, 3% panelů mají odchylku od požadované šířky. Přitom celá čtvrtina panelů mající odchylku délky má i odchylku šířky. S jakou pravděpodobností bude mít náhodně vybraný panel
a) odchylku délky i šířky?
b) odchylku délky nebo šířky?
c) odchylku délky, ale ne šířky?
MA 0008 - Teorie pravděpodobnosti
61
d) oba rozměry v pořádku?
e) odchylku délky, má-li odchylku šířky?
Řešení: Je výhodné si celou situaci se zadanými údaji kreslit - tomu říkáme grafická podpora řešení úlohy (na obrázku samotném už data ze zadání zpracováváme v jejich vzájemných vztazích). Jedná se o jednoduchou úlohu na pst náhodných jevů znázorněných množinami nebo jejich částmi. Grafickou podporu (obrázek) bychom mohli nazvat Ven-novým diagramem, ovšem do jednotlivých částí množin nezakreslujeme prvky, ale procenty píšeme jejich procentuální počet vzhledem k celku:
ad a) 1%, ad b) 6%, ad c) 3%, ad d) 94%, ad e) § tj. přibližně 33, 33%.
Příklad 6.3 V losovacím klobouku zakrytém šátkem 5 bílých a 8 černých koulí. Postupně losujeme 2 koule, přičemž vylosované koule nevracíme zpět.
a) S jakou pravděpodobností jsou obě vylosované koule bílé?
b) S jakou pravděpodobností jsou vylosované koule různých barev? Zapište výsledky pomocí násobení pravděpodobností, (tj. bez kombinačních čísel)
c) Vypočtěte (a), (b) nyní pomocí kombinačních čísel, která se zaměřují jen na výsledky výběru kuliček tak nějak najednou, bez ohledu na pořadí.
Řešení: Rozmyslete si, že a proč jsou následující postupy správným vyčíslením: ad a) JĽ A.
13 ' 12'
ad W 1 . i + i . 1
> 13 12 ~ 13 12'
ad c) P (a) = -TjsT, P(b) = Vl/13\1/. Po vyčíslení jsou výsledkem stejná čísla jako (a),
l 2 ) { 2 )
(b)H!
Příklad 6.4 Hodili jsme současně dvěma kostkami.
a) S jakou pravděpodobností padla alespoň jedna šestka, víme-li, že padl součet 8?
b) S jakou pravděpodobností padl součet 8, víme-li, že padla aspoň jedna šestka?
c) S jakou pravděpodobností padl součet větší než 10, víme-li, že padla alespoň jedna šestka?
Řešení: Jedná se o příklady na podmíněnou pst, které řešíme podle vzorce 4.1. Je důležitý rozdíl mezi (a) a (b): pst jevu, který víme, že nastal, uvádíme vždy ve jmenovateli.
ad a) |, pokud bychom přemýšleli podle vzorce klasické psti, a všechny případy, které mohou nastat, chápali jako ty případy, ve kterých padl součet 8. Takových je 5, že ano? A z nich případy příznivé jevu, že padla aspoň jedna šestka, jsou dva. Odtud výsledek. Pokud byste stůj co stůj chtěli uplatnit vzorec 4.1, který jste se naučili, tak můžete a výsledek je
2- 2
36 _ _ 36 5
Podobným způsobem jako (a) vypočteme: ad b) ad c)
62
Katedra matematiky PedF MUNI v Brně
Příklad 6.5 Velitel záchranné operace soudí, že člun s trosečníky se nachází někde ve čtverci o straně 200 km. Má k dispozici dvě letadla a posádka každého z nich objeví člun ve vzdálenosti 25 km od letadla ve všech směrech. Jedno letadlo přeletí přes jednu úhlopříčku daného čtverce, druhé přes druhou. Jaká je pst, že aspoň jedno letadlo objeví člun?
Řešení: protože o trosečnících nevíme bližší informace, předpokládáme, že jejich výskyt v libovolném místě čtvercového území je stejně pravděpodobný. Tj. množinou íl uvažovaných pozic bude daný čtverec, jeho mírou bude jeho obsah. Náhodným jevem A (letadlům se při přeletu nad oběma úhlopříčkami čtvercového území podaří spatřit člun) budeme rozumět všechny body čtverce, které jsou v dosahu 25 km od některé z úhlopříček. Míra množiny A bude její obsah. Pst našeho náhodného jevu A tedy vypočteme jako
Zkontrolujte si výpočtem podílu obsahů (na základě svých znalostí geometrie), že tento výsledek je správný. Nejjednodušší je možná odečíst od obsahu 200 • 200 množiny íž obsah čtyř bílých trojúhelníků, které vznikají mimo šrafovanou plochu.
Kdybychom si všimli, že čtyři trojúhelníky, které vzniknou odstřihnutím od šrafované plochy, tvoří dohromady čtverec o straně 200 — 2 • 25 • y/2, můžeme počítat
P(A) S{A) 2002 ~ (20° ~ 2 • 25 • y^)2 _
P{A) W) -2C^- °'582L
Příklad 6.6 Jistá VS přijímá do 1.ročníku studenty ze všech typů SS. Absolventů gymnázia je 65 %, přitom 60% z nich tvoří dívky. Zbylých 35 % přijatých studentů navštěvovalo jiný typ školy a je mezi nimi pouze 30 % dívek.
a) Jaká je pst, že náhodně vybraný student 1. ročníku je dívka?
b) Systém vybral náhodně jednu dívku ze všech studentů prvního ročníku (už víme) -
jaká je pst, že tato dívka je absolventkou gymnázia (ještě nevíme a chceme určit)?
MA 0008 - Teorie pravděpodobnosti
63
Řešení: ad a) Pst je vlastně rovna procentu dívek ze všech možných studentů. Dívky z gymnáziu tvoří z celku všech přijímaných studentů část 0,65 • 0,60, dívky z ostatních typů škol přijaté na VS tvoří z celku část 0,35 • 0,30. Tedy dohromady dívky ze všech typů škol tvoří z celku 1 všech přijatých na VS část
P{A) = 0,65 • 0,60 + 0,35 • 0,30 = 0,495,
kde A ... náhodně vybraný přijatý student je dívka. Tedy náhodně vybraný student prvního ročníku VS je dívka se šancí 49,5%. Argumentace řešení byla provedena pomocí procenta jako části celku, ale vlastně se jedná přesně o tentýž postup jako výpočet úplné psti!!!
Ad b) Nyní použijeme vzorec 4.1: Označme G ... náhodně vybraný student je absolventem-absolventkou gymnázia (víme, že P(G) = 0,65). Dosazením do vzorce 4.1 dostaneme
x,/^, ^ P(GnA) P(G)-P(A\G 0,65-0,60 „ „ „ „
p(G|-4) = - Wr= piv = =0J8787878-
Celá pravděpodobnostní úvaha byla proveditelná i elementárně jinak: čitatel zlomku ve výpočtu vyjadřuje procento dívek z gymnázia, jmenovatel vyjadřuje procento všech dívek.
Příklad 6.7 Doba příchodu studenta do výuky (v minutách) byla zaznamenána do intervalového rozdělení četností:
rii
<-3;0) 15
(0;3) 10
(3; 6) 3
(6; 9) 2
(9; 12) 1
(12; 15) 1
a) Zpracujte tato data v podobě kumulací a relativních kumulací.
b) Jaký je maximální pozdní příchod u 85 procent studentů (tedy 0,85-kvantil)?
c) Odhadněte průměr doby pozdního příchodu (v minutách).
Řešení: Interval (—3; 0) znamená, že studenti přišli včas před začátkem hodiny, což je tedy pozitivní údaj, třebaže je negativní ... s tímto údajem budeme normálně pracovat, stejně jako s jinými intervaly. Počátek 0 znamená začátek hodiny, tj. nyní popisujeme veličinu, která může nabývat kladných i záporných hodnot.
Ad a) nejprve vypočteme, četnosti a kumulace, relativní četnosti a relativní kumulace (počet měření n = 32 dostaneme součtem četností). Viz tabulka na násl. straně.
Ad b) Výpočet kvantilů je složitější. Hledáme-li 0,85-kvantil, najdeme ve sloupci relativních kumulací interval (3; 6), na kterém byla poprvé překročena hodnota 0,85. Tím je určen interval (a; b) v následujícím vzorci:
in + 1) • a - ca xa = a H---—--• (b — a),
n(a; b)
64
Katedra matematiky PedF MUNI v Brně
Tabulka 6.7: Tabulka četností a kumulací doby příchodu studenta do výuky
doba příchodu četnost rel. četnost kum. četnost kum. rel. četnost
<-3;0) 15 0,46875 15 0,46875
(0;3) 10 0,31250 25 0,78125
(3; 6) 3 0,09375 28 0,875
(6; 9) 2 0,0625 30 0,9375
(9; 12) 1 0,03125 31 0,96875
(12; 15) 1 0,03125 32 1
kde ca je kumulace v bodě a dolní meze intervalu. V našem případě tedy (a; b) = (3; 6). Dále n(a, b) = n(3; 6) = 3 je četnost na intervalu (3; 6). Celkem
Q , 0,85-33 -25 ^o,85 = 3 H-----(6 - 3) = 6,05.
Tedy 85% studentů přijde dříve než 6,05 minut po začátku hodiny.
Pozor na možný jiný průběh dosazení, který se moc neliší, ale dává mírně odlišný výsledek: Pokud nejprve vypočteme část čitatele v uvedeném vzorci 0,85 • 33, dostaneme hodnotu 28,05 a řídíme se sloupcem kumulací, kde hledáme nejbližší vyšší hodnotu kumulace, která přesáhne 28 - tou je 30. Tím jsme ovšem určili (a; b) = (6; 9) a celé dosazení do vzorce děláme pro interval (6; 9), dostaneme:
xo,s5 = 6 + °'85 • 323 - 28 • (9 - 6) = 6,075.
Hodnota je mírně odlišná, ale oba způsoby jsou legitimní a dávají nám nějaký odhad 0,85-kvantilu, který je přijatelný.
Ad c) průměr bychom lehce vypočetli, kdybychom měl ovšem všech 32 naměřených časů k dispozici. Protože máme jen intervalové četnosti, průměr pouze odhadneme. Jako naměřené hodnoty vezmeme středy těchto intervalů —1,5, 1,5, 4,5, 7,5, 10,5, 13,5 (v minutách). Vážený aritmetický průměr doby příchodu pomocí četností je tedy odhadnut jako
x = • (15 • (-1,5) + 10 • 1,5 + 3 • 4,5 + 2 • 7,5 + 10,5 + 13,5) = 1,40625. Tedy průměrná doba příchodu studenta do výuky je cca 1,40625 minut po začátku hodiny.
Příklad 6.8 Hážeme hrací kostkou desetkrát za sebou, jaká je pst, že v těchto deseti hodech padne osm a více šestek?
MA 0008 - Teorie pravděpodobnosti
65
Jedná se o klasický příklad na Bernoulliovy psti, pro N = 10 a p = |. Odpověď je: p(8) + p(9) +p(10) =
= 0,00001945.
Příklad 6.9 Student se na test o 10 otázkách vůbec neučil a zaškrtává právě jednu z odpovědí a),b),c) zcela náhodně (hodí si kostkou, pokud mu padne 1 nebo 2, zaškrtne variantu a), pokud 3 nebo 4, zaškrtne variantu b), pokud 5 nebo 6, zaškrtne c)). Jedná se přitom o test, kde právě jedna z variant a),b),c) je správná u každé otázky. Jaká je pst, že při tomto náhodném vyplnění testu bude student mít 3 a více odpovědí dobře?
Opět se jedná o Bernoulliovy psti, přičemž pst jedné správné odpovědi je p = |, a N = 10. Bez počítače, jen s využitím kalkulačky, je nejvhodnější využít psti opačného jevu: p(3) + p(4) + • • • + p(10) = 1 - p(0) - p(l) - p{2) =
= 0,7008586.
66
Katedra matematiky PedF MUNI v Brně
7 Týden 07
7.1 Přednáška 07: Diskrétní a spojitá náhodná veličina, střední hodnota a rozptyl, distribuční funkce
V tomto oddílu-kapitole se podíváme na základní terminologii popisu náhodnosti z vysokoškolského hlediska, tedy popis pravděpodobnosti pro dospělé.
Budeme se tady společně zabývat oběma hlavními modely psti z kapitoly 3: diskrétní rozdělením psti a spojitým rozdělením psti. Všechny pojmy budou vysvětleny na dvou příkladech, které se budou prolínat touto celou kapitolou.
U diskrétního rozdělení psti bylo dosud řečeno (opakování z kapitoly 3), že ji lze užít k popisu, když:
• íl má konečně mnoho možných elementárních výsledků, nebo je jich stejně najko přirozených čísel (říkáme, že íl je množina nejvýše spočetně nekonečná).
• všechny elementární výsledky mají obecně RŮZNOU možnost nastat (elementární výsledek uj1 nastane s psti p (c^)).
• Pak lze počítat pst náhodného jevu A G A podle vzorce
P(A) = ^ PÍ"*)
U spojitého rozdělení psti bylo dosud řečeno (viz kapitola 2), že ji lze užít k popisu, když:
• íl má nespočetně nekonečně mnoho možných elementárních výsledků, a tedy se jedná o interval reálných čísel nebo o R+, nebo R.
• Tyto elementární výsledky mají obecně RŮZNOU možnost nastat.
• Pak pro pst jevu (a; b) C ŕž nebo (a; b) C ŕž nebo (a; b) C ŕž nebo (a; b) C ŕž platí
P(a; b) = P({a; b) = P((a; b)) = P {a; b)) =
kde f(x) je nezáporná po částech spojitá funkce.
Nyní na popis těchto modelů navážeme a řekneme s k nim několik dalších typických termínů z teorie psti. Klíčovým bude pojem distribuční funkce F(x) (pozor, nepleťte si s pojmem „distributivní zákon z algebry 1 - u slova „distributivní" je míněn pasivní význam (rozdělený): činitel násobící závorku je po odstranění závorky rozdělen ke každému členu v závorce; kdežto u slova „distribuční" je míněn aktivní význam (rozdělující): samotná distribuční funkce určuje pravidla, podle kterých se budou hodnoty měřené veličiny rozdělovat, čili podle kterých budou nastávat.")
Podobně jako fyzikové se snaží o jakýsi sjednocující pohled na svět, i matematika se snažila o sjednocující pohled na náhodnost - a do velké míry se jí to podařilo právě
MA 0008 - Teorie pravděpodobnosti
67
pojmem distribuční funkce F(x). (pozor, písmeno F je důležité, protože / bude označovat něco jiného - viz matematická analýza 2, kde J fix)dx = F(x) + c ... do velké míry se tohoto označení mezi funkcí Fix) a její derivací f(x) budeme držet, pokud bude derivace existovat, a tedy bude mít smysl o ní mluvit).
Ale ještě než se dostaneme k pojmu distribuční funkce, musíme projít pojem náhodné veličiny, dva příklady a tři další sjednocující pojmy (takže pojem distribuční funkce bude zlatým hřebem, uvedeným na závěr této kapitoly).
Náhodná veličina X není nic nového, ovšem jejímu přesnému vymezení se trochu v tomto textu vyhneme. To právě je veličina, jejíž hodnoty měříme a jejíž náhodnost chceme popsat - formálně se jedná o zobrazení jistých vlastností, které elementárním výsledkům lo G Cl (čti: malé omega z množiny velké omega) přiřazuje reálná čísla. V obou následujících příkladech upozorníme na to, kde se tato veličina objevuje a proč ji lze chápat jako zobrazení.
Příklad 7.1 Hráč basketbalu háže trestné koše až do okamžiku, kdy se netrefí. Pak přestává házet. Nejvíce však má povoleno hodit pět úspěšných košů. a) popište tuto náhodnou veličinu matematicky; b) Určete rozdělení pravděpodobnosti počtu úspěšných košů, jestliže pravděpodobnost úspěchu při každém hodu je nezávislá na předchozím hodu a je rovna 0,9. c) vypočtěte střední hodnotu a rozptyl veličiny.
Matematický popis každé náhodné veličiny bude zahrnovat šest bodů či charakteristik (i) až (vi). Podívejme se nejprve na první tři:
(i) Co daná veličina měří, X = ...???
X = počet úspěšně trefených košů v právě popsaném procesu (minimáně nula, maximálně pět trefených košů).
(ii) Jakých hodnot veličina X může nabývat? X G {0,1,2,3,4,5}.
Možná zde by bylo vhodné vysvětlit rozdíl či souvislost množiny elementárních výsledků ĺo E Cl a veličinou X:
Cl = {N, TN, TTN, TTTN, TTTTN, TTTTT} - množina elementárních výsledků, jedna sekvence představuje sérii hodů daného hráče, N = netrefil se při konkrétním hodu, T = trefil se při konkrétním hodu.
Veličina X je vlastně zobrazením množiny Cl do množiny {0,1,2,3,4,5}; X(TTTN) = 3 (tj. 3x se hráč trefil), X(TTTTN) = 4 (hráč se v dané sekvenci trefil 4x), atd.
Až na prvky množiny {0,1,2,3,4,5} je nasazeno další zobrazení P zvané pravděpodobnost, které přiřazuje jednotlivým hodnotám množiny {0,1,2,3,4,5} reálné číslo z intervalu (0,1).
(iii) S jakými pstmi nabývá veličina X svých hodnot? Tedy u diskrétní veličiny: Jaké jsou psti p{k) := P(X = k), pro k G {0,1, 2, 3,4, 5}?
68
Katedra matematiky PedF MUNI v Brně
Hodnoty pik) nazýváme hodnoty pstní funkce. Pomocí znalostí získaných v první polovině semestru určíme dílčí psti pomocí psti průniku nezávislých jevů, tj. jako součin dílčích psti v jednotlivých hodech:
p(0) = P{X = 0) = P(N) = 0,1.
pil) = P (X = 1) = P(TN) = 0,9 • 0,1 = 0,09.
p(2) = P (X = 2) = P(TTN) = 0,92 • 0,1 = 0,081.
p(3) = P (X = 3) = P(TTTN) = 0,93 • 0,1 = 0,0729.
p(A) = P (X = 4) = P(TTTTN) = 0,94 • 0,1 = 0,06561
p(5) = P (X = 5) = P(TTTTT) = 0,95 = 0,59049.
Tyto hodnoty pstní funkce pik) můžeme znázornit i graficky:
1-\-1--i-]-+-
Než vysvětlíme tři další charakteristiky, projdeme si tytéž už uvedené tři na druhém slibovaném příkladu. Nyní jen ještě zdůrazněme, že X je diskrétní náhodná veličina, protože nabývá hodnot oddělených, diskrétních (množina hodnot je většinou podmnožinou množiny N nebo Z, může se ovšem jednat i o konečnou nebo spočetnou množinu zlomků).
Aby pravděpodobnostní funkce pik) splňovala vlastnosti psti, musí platit
1. Y^oP(k) = 1 (axiom normovanosti),
2. pik) > 0 pro každé k g {0,1, 2, 3,4, 5, 6} (axiom nezápornosti),
3. P{X g (a; b) = 5ľfce(a-&) P{k) (když chceme určit pst, že veličina X nabude hodnot z intervalu (a;b), sečteme psti pik) pro k g (a; b)). Z určitého důvodu, který bude patrný ze sjednocujícího pojmu distribuční funkce, bereme nterval (a; b) bez levého krajního bodu.
MA 0008 - Teorie pravděpodobnosti 69
Příklad 7.2 Popište matematicky veličinu X vyjadřující dobu příchodu studenta na konkrétní výuku v rozvrhu (v minutách). Zohledňujeme, že 75% studentů přijde v čas v intervalu (—5,0). Předpokládáme, že každý okamžik z intervalu je stejně pravděpodobný. Ostatní přijdou pozdě v intervalu (0,10). Šance jejich pozdního příchodu rovnoměrně klesá až k nule. Student více než minut předem ani později než 10 minut po začátku nepřijde.
(i) Co daná veličina měří, X = ...???
X = doba příchodu studenta vzhledem k času r(0) = 0 (minut).
(ii) Jakých hodnot veličina X může nabývat? X nabývá hodnot v intervalu (—5; 10).
(ŕž je nyní už přímo interval (—5; 10), tj. veličinu X lze chápat jako identitu (—5; 10) —> (—5; 10), zde už její užití (jako identického zobrazení) nic zajímavého nepřináší, ale formálně ji použijeme také, abychom právě též mohli mluvit o veličině X, která nabývá hodnot z intervalu - terminologie s množinou íl už se zde nepoužívá)
(iii) S jakými pstmi nabývá veličina X svých hodnot? Tedy u spojité veličiny: Jaké jsou psti P(X g (a; b))?
Měli bychom zkonstruovat tzv. hustotu psti, která bude vyjadřovat psti pomocí obsahu svého podgrafu na intervalu (a; b). Výsledkem této konstrukce je následující obrázek a dostaneme se k němu těmito úvahami: a) jakýkoli okamžik příchodu v intervalu —5 minut až 0 minut je stejně pravděpodobný ... to lze vyjádřit konstantní funkcí (její hodnotu určíme z požadavku obsahu 0,75 daného obdélníka.
b) ubývající šanci příchodu od okamžiku 0 minut do okamžiku 10 minut vyjádříme klesající lineární funkcí, takže obsah vzniklého trojúhelníku v podgrafu bude roven 0,25, aby celkem obsah celého podgrafu byl roven číslu 0,75 + 0,25.
Délka základny trojúhelníka je pevně dána (od 0 do 10), tj. zbývá určit její výšku ... ta musí být 0,05, aby obsah trojúhelníka byl roven 0,25. Zbývá určit rovnici lineární funkce, jejíž částí grafu je přepona trojúhelníka (tu určíme z faktu, že daná lineární funce prochází body [0; 0,05] a [10; 0]).
Tedy
(0 ...x<-5
0,15 ...a; g (-5,0)
-0, 005x + 0, 05 ...xg(0;10)
0 ...x>10
70
Katedra matematiky PedF MUNI v Brně
- 0.-V5
-O
4^
•D
o
a aby hustota psti f (x) splňovala vlastnosti psti, musí platit
1. f(x)dx = 1 (axiom normovanosti),
2- f (x) > 0 pro každé x E R (axiom nezápornosti),
3. P (X E (a; b) = J^f(x)dx (když chceme určit pst, že veličina X nabude hodnot z intervalu (a; b), vypočteme určitý integrál funkce f (x) pro k E (a; b)). Z určitého důvodu, který bude patrný ze sjednocujícího pojmu distribuční funkce, bereme interval (a; b) bez levého krajního bodu.
A nyní se konečně dostáváme ke sjednocujícím pojmům matematického popisu náhodnosti. Tyto pojmy budou vyloženy definičně i aplikačně (na příklady 7.1, 7.2):
iii) Pravděpodobnost, že veličinu X naměříme v intervalu (a; b):
Tento bod byl, stejně jako body (i), (ii), v příkladech 7.1, 7.2 už vypracován -na tomto místě jen konstatujeme, že pojem pravděpodobnosti popisuje jak veličinu spojitou, tak veličinu diskrétní - jen u diskrétní veličiny počítáme pst pomocí sumy hodnot pstí funkce p(k), kdežto u spojité veličiny pomocí určitého integrálu z hustoty psti fix) na intervalu (a;b).
MA 0008 - Teorie pravděpodobnosti
71
iv) Pojem distribuční funkce F(x) náhodně veličiny X je klíčový sjednocující pojem, definovaný pro spojitou i diskrétní veličinu stejně:
Definice 7.1 F(x) = P(X < x) := P{X E (—oo;x)) (hodnota distribuční funkce F v bodě x je rovna psti, že veličinu X naměříme v intervalu (—oo;x)).
O co se jedná? Distribuční funkce není nic jiného než teoretická relativní kumulativní četnost, která pro rostoucí hodnotu x neustále přičítá dílčí teoretické relativní četnosti neboli dílčí psti.
Jen si musíme pamatovat, že toto přičítání se u diskrétní veličiny (stejně jako v bodě (iii)) děje pomocí sumy a u spojité veličiny pomocí integrálu:
Prosím pamatujte si, že F(x) jako teoretická kumulativní relativní četnost
• nikdy nemůže klesat, vdy pouze roste nebo stagnuje (= má konstantní hodnotu), stejně jako rostla nebo stagnovala kumulativní relativní četnost v popisné statistice;
• je rovna pravděpodobnosti určitého náhodného jevu, tj. nabývá hodnot pouze z intervalu (0; 1);
Tedy F(x) je neklesající funkcí, která je zdola ohraničená konstatní funkcí yix) = 0, shora konstantní funkcí yix) = 1.
Poznámka 1: Pokud se čtenář znalý matematické analýzy zamyslí nad vztahem funkcí /, F u spojité veličiny, vidí, že zde existuje vztah podobný tomu jako mezi funkcí / a k ní primitivní funkcí F, tedy F'(x) = fix), pokud derivace v daném bodě existuje11.
Poznámka 2: A jaký je vztah (u diskrétní i spojité veličiny) mezi pojmy (iii)
nTedy: Pokud u spojité veličiny známe distribuční funkci F(x), lze z ní snadno derivací najít hustotu psti f(x).
a (iv)?
P{X E {a; b)) = F{b)-F{a).
(7.1)
72
Katedra matematiky PedF MUNI v Brně
Skutečně, u spojité veličiny se jedná vlastně o Newton-Leibnizovu formuli výpočtu určitého integrálu pomocí primitivní funkce; a u diskrétni veličiny vztah také očividně platí: Když odečteme kumulativní pst v bodě b od kumulativní psti v bodě a, dostaneme právě součet pstí pik) pro k E (a;b) ... právě zde u diskrétní veličiny potřebujeme, aby interval (a; b) byl zleva otevřený, protože odečtení psti p(a) vylučuje, aby pst p(a) byla současně započítána do výsledku P(X E (a;b)), který tímto rozdílem vznikne.
Ad příklad 7.1: Určeme distribuční funkci F(x) veličiny udávající počet vstřelených košů před prvním neúspěšným košem, a současně úspěšných košů nemůže být více než pět v řadě:
0,3Ws
„ *-3
-«ř-K-1-í-h
Všimněte si několika věcí: a) hodnoty pstní funkce se kumulují = přičítají, výška schodu v celočíselných hodnotách se rovná právě dílčí psti pik) v daném bodě k; b) Funkce F(x) je definovaná pro každé reálné x, neboli v každém bodě x má smysl se ptát, jaká je pst, že naměříme hodnotu z intervalu (—oo,x); c) Na intervalu (k; k + 1) funkce F(x) nic nepřičte, tj. zůstává konstantní; d) And last but not least, vlastnost (c) je pro distribuční funkci diskrétní veličiny vlastně charakteristická: F(x) je po částech konstantní funkce, jejíž graf připomíná schody - mohly bychom ji nazvat schodovitou funkcí, kdybychom takový pojem měli definovaný12.
Ad příklad 7.2: Určeme distribuční funkci F(x) i zde, u spojité veličiny s hustotou psti f(x): Na rozdíl od diskrétní veličiny, kde funkční hodnoty distribuční funkce tvoří posloupnost výšek schodů z intervalu (0; 1), u spojité veličiny se přičítá obsah podgrafu, tj. se nejedná o funkci schodovou, ale o funkci spojitou (k žádným
12A word of caution here: schody u distribuční funkce vždy směřují nahoru při nárůstu proměnné x, nikdy ne dolů - tedy ne všechny schodové funkce jsou funkcemi distribučními, ale jen některé.
MA 0008 - Teorie pravděpodobnosti
73
schodům-skokům nedochází, kumulativní pst se mění spojitě13).
Ale vraťme se k našemu příkladu 7.2. Hustota psti je zadána několika různými
vzorci:
/(*) =
0 ... x < -5
0,15 ...z e (-5,0)
-0,005x + 0,05 ...xe(0;10)
0 ...x>10
Tedy při výpočtu kumulativních pstí F(x) dostaneme také několik vzorců v závislosti na hodnotě x. Máme přitom jednu podporu, která je ovšem dobrá -grafický názor určitého integrálu jako obsahu subgrafu. Proto pro každou část vzorce hustoty fix) můžeme nakreslit obsah plochy určený kumulací psti od minus nekonečna do x:
Lze souhrnně říci že funkční hodnota F(x) vyjadřuje obsah plochy z hustoty fix) od minus nekonečna do hodnoty x. Grafy f(x), F(x):
13Studenti si mohou též představit, že schody jsou tak malé, že se vlastně o žádné schody nejedná -kdybychom obrázek grafu F(x) spojité veličiny miliónkrát zvětšili, stále bychom žádné schody neviděli, zkrátka F(x) je spojitou funkcí proměnné x.
74 Katedra matematiky PedF MUNI v Brně
Z grafu F (x) vidíme, že distribuční funkce je spojitá - to není náhoda, ale u spojité náhodné veličiny to platí vždy, protože u spojité veličiny nikdy nekumulujeme skokem, ale pomocí nárůstu obsahu, čili spojité.
v) Střední hodnota (= očekávaná hodnota) veličiny X, značíme EX: Zjednodušeně řečeno, EX je „teoretický průměr" = průměr, který bychom zhruba naměřili-vypočetli, kdyby se měřená veličina X chovala přesně podle svého teoretického popisu (iii), tj. podle pravděpodobnostní funkce pik) v diskrétním případě, respektive podle hustoty psti fix) ve spojitém případě.
Pokud střední hodnota má fungovat jako „teoretický průměr", hledejme cestu k jejímu spočtení ve vzorci pro průměr měření v popisné statistice:
i n i
_ 1 \ ^ _ 1 \ ^ _ \ ^ Tli
n ^—' n ^—' ^—' n
1 Xi Xi
Relativní četnosti ^ v posledním tvaru sumy v rovnosti lze chápat jako jakési „naměřené" psti. Kdybychom místo nich dosadili teoretické psti p(xt), dostaneme vzorec pro teoretický průměr neboli střední hodnotu veličiny X:
(7.2)
Diskrétní tvar vzorce ... právě popsaná záměna ^ za p(xt). Spojitý tvar vzorce ... vlastně totéž, ale převedeno na spojitý případ podle pravidel a možností infinitezimálního počtu: sečítáme nekonečně mnoho nekonečně malých hodnot, takže
• namísto sumy přes všechny možné hodnoty ... píšeme určitý integrál přes nespočetnou množinu íž;
MA 0008 - Teorie pravděpodobnosti
75
• namísto pstní funkce pik) ... píšeme hustotu psti fix);
• namísto xl ... index i vynecháváme, hodnoty se vyskytují „nahusto" ve spojitě nekonečné (či hustě nekonečné) množině Cl.
Ad příklad 7.1: Průměrný = očekávaný počet vstřelených košů je
5
EX = ^2k-p(k) = 0-0,l+l-0,09+2-0,081+3-0,0729+4-0,06561+5-0, 59049 = 3,6856.
Ad příklad 7.2: Průměrný okamžik příchodu studenta vzhledem k času t = 0 začátku hodiny:
EX =
10
x ■ f(x)dx =
x ■ 0,15 dx
10
x
-0,005x + 0,05) dx =
0,15 •
x
-0,005 •
x
0,05 •
10
5 5
= -0,15 • 12,5 -- + - = -1,0417. 3 2
To tedy znamená, že každý student, pokud bude se chovat podle tohoto teoretického popisu, přijde průměrně asi minutu před začátkem výuky.
vi) Rozptyl DX náhodné veličiny X: udává „teoretickou" míru rozptýlení náhodné veličiny X kolem její střední hodnoty EX ... vlastně se jedná o rozptyl měření, který bychom zhruba naměřili-vypočetli, kdyby se měřená veličina X chovala přesně podle svého teoretického popisu (iii), tj. podle pravděpodobnostní funkce pik) v diskrétním případě, respektive podle hustoty psti fix) ve spojitém případě.
Přesná definice rozptylu náhodné veličiny využívá definici střední hodnoty, ale jedná se o střední hodnotu jiné veličiny než jen X:
DX := E(X - EX)2
Rozptyl DX definujeme jako střední hodnotu veličiny (X — EX)2, což je kvadratická odchylka rozdílu veličiny X od její střední hodnoty EX.
Cesta od definice k výpočtu bude vysvětlena na analogii statistického rozptylu souboru měření :
S2 =
1 n
■x)2
- ■ Víi, • (xí -x)2 = V — n t—* t—* n
■x)2.
(7.3)
Relativní četnosti ^ v posledním tvaru sumy v rovnosti lze chápat jako jakési „naměřené" psti. Kdybychom místo nich dosadili teoretické psti p(xt) a průměr x nahradili střední hodnotou EX, dostaneme vzorec pro teoretický rozptyl neboli rozptyl náhodné veličiny X:
76
Katedra matematiky PedF MUNI v Brně
Úpravou vzorce ještě získáme (ať už se jedná o veličinu diskrétni nebo spojitou):
DX = E(X - EX)2 = E(X2 -2X-EX + (EX)2) = = EX2 - 2EX ■ EX + (EX)2 = E(X2) - (EX)2.
Dosazením do posledního vyjádřeného tvaru vzorce pro střední hodnotu E dostaneme asi nejjednoduší vzorce výpočtu
(tyto vzorce jsou nejjednodušší, protože v diskrétním případě nemusíme vůbec počítat odchylky (xi — EX)); ve spojitém případě je integrace také jednodušší, protože integrujeme funkci, ve které nedochází k odčítání konstanty EX. POZOR, nejen studenti zapomínají při užití těchto posledních vzorců po úspěšném vypočtení sumy-integrálu odečíst konstantu (EX)2 ... to je také potřeba.
Ad příklad 7.1: Rozptyl počtu vstřelených košů je
5
DX = ^k2 -p(k)- (EX)2 = 0-0,1 + 1 -0,09 + 22 • 0,081 + 32 -0,0729 + 42 -0,06561 +
o
+ 52 • 0, 59049 - 3,68562 = 3,2985.
Nás zajímá spíše tzv. směrodatná odchylka \/DX = ^/3,2985 = 1,816, protože tuto hodnotu lze vynést na vodorovnou osu měření veličiny X. Pokud bychom chtěli uplatnit pravidlo šesti směrodatných odchylek, tak říkáme: většina hodnot veličiny X, a sice cca 99% měření, leží v intervalu EX ± 3 • V DX, tedy v našem příkladu počet tref v sekvenci hodů podle daného scénáře leží počet tref v intervalu
3,6856 ± 3 • 1,816 = (-1,7624; 9,1336),
MA 0008 - Teorie pravděpodobnosti
77
což tedy moc zajímavý interval není, protože je možná ještě horší než interval (0; 5). U některých, zejména diskrétních veličin s konečně mnoha možnými hodnotami, interval délky šesti odchylek nesděluje nic nového, než co už známe ze zadání.
Ad příklad 7.2: Průměrný okamžik příchodu studenta vzhledem k času t = 0 začátku hodiny:
DX =
10
x2 ■ f(x)dx- (-1,0417)2
x ■ 0,15 dx
10
x
oas- T
0,15 • 125
-0,005x + 0,05) dx - 1,085 =
10
50
T
-0,005 •
50
0,05 •
1,085 =
o
— - 1,085 = 9,332.
Tedy směrodatná odchylka V DX = ^/9,332 = 3,0548, tedy většina (cca yy/oj příchodů studenta do hodiny vzhledem k okamžiku to = 0 začátku hodiny je v intervalu
-1,0417 ± 3 • 3,0548 = (-10,206; 8,1227) mm.
7.2 Cvičení 07: Diskrétní a spojitá náhodná veličina, distribuční funkce, střední hodnota a rozptyl
Po pečlivém projití přednášky 7 si předem připravte na cvičení prezentaci následujících příkladů. Přitom kromě zadání daného příkladu odpovězte určitě na prvních šest otázek z následujících: (otázky vypracujte všechny u každého z příkladů v této kapitole, i když daný úkol není řečen v zadání):
p~| Co vlastně veličina X měří? X = ...
|~2~| Hodnoty z jaké množiny může veličina X nabývat?
3 Jaká je pstní funkce pik) (u diskrétní veličiny) nebo hustota psti fix) (u spojité
veličiny)? Vypočtěte ji a nakreslete její graf.
4 Jaká je distribuční funkce F{x)l Nalezněte její vzorec a nakreslete její graf.
5 Určete střední hodnotu EX veličiny X.
6_Určete rozptyl DX a směrodatnou odchylku V DX veličiny X. Podle pravidla
o šesti směrodatných odchylkách nakreslete do obrázku v bodu 3 interval, ve kterém naměříme cca 99% hodnot náhodné veličiny X.
78
Katedra matematiky PedF MUNI v Brně
|~7~| Až v tomto bodě spočtěte nějakou další konkrétní pst nebo odpovězte na otázku, kterou se v daném příkladu ptají.
Úloha 7.1 Tým 001: je zadána odpověď nalezněte odpovědi 2_ až 6_. Jan
Kovář jde z tělocvičny do hospody a přemýšlí, kolik vypije piv. Rozhodne se pro následující postup:
1. Pokud mu při hodu kostkou padne 1,2,3,4 nebo 5, dá si pivo; pokud 6, jde domů.
2. Pokud vypil první pivo, háže ještě jednou. Když mu padne 1,2,3 nebo 4, dá si druhé pivo, jinak jde domů.
3. Pokud vypil druhé pivo, háže potřetí. Když mu padne 1,2 nebo 3, dá si třetí pivo, jinak jde domů.
4- Po třetím pivu jde v každém případě domů (musí se učit matematiku). V této situaci máte tři úkoly:
a) Určete pravděpodobnostní funkci počtu piv, které Honza vypije (= pravděpodobnost, s
jakou vypije 0 piv ,1 pivo, 2 piva, 3 piva).
b) Nakreslete graf příslušné distribuční funkce.
c) Vypočtěte střední hodnotu a rozptyl náhodné veličiny X = počet piv vypitých podle
daného postupu.
Úloha 7.2 Tým 002: je zadána odpověď [T~|, nalezněte odpovědi 2_ až 6_. Při
basebalu je hráč dvakrát na pálce. Pravděpodobnost, že při prvním pobytu na pálce zasáhne míček, je 0,25. Pravděpodobnost, že při druhém pobytu na pálce zasáhne míček, je
0,35 ... pokud při prvním pobytu zasáhl; 0,25 ... pokud při prvním pobytu nezasáhl.
Náhodná veličina X udává počet úspěšných pobytů na pálce u daného hráče. Jakých hodnot může nabývat? Určete její rozdělení pravděpodobnosti.
Úloha 7.3 Tým 003: je zadána odpověď _3_, odpověď [T] neurčujte, nalezněte odpovědi 2_, _4_, 5_, 6_. Máte ještě navíc úkol číslo [Y], což jsou otázky a,b,c,d,e ... odpovězte na tyto otázky dvěma způsoby: jednak pomocí 3
včetně obrázku, jednak pomocí |_4j bez obrázku, pouze dosazením hodnot distribuční funkce.
Hustota rozdělení pravděpodobnosti je dána vztahem
0 ... pro x < 0;
f(\_ix ■ ■ ■ Pro x 0; 1); JKX) - \ 0j5 proxe< 1;2)
0 pro x > 2.
MA 0008 - Teorie pravděpodobnosti
79
U každého z úkolů a), b), c), d), e) nakreslete jiný obrázek ... obrázků u těchto úkolů dohromady bude celkem pět.
a) -P(0,1 < X < 0,25) =?; vyšrafujte do grafu v otázce 3, obsah jaké plochy počítáte (pst
u spojité veličiny je vždy vyjádřena obsahem plochy)
b) P(X < 0,25) =?; vyšrafujte do grafu v otázce 3, obsah jaké plochy počítáte (pst u
spojité veličiny je vždy vyjádřena obsahem plochy)
c) P(X > 0,25) =?; vyšrafujte do grafu v otázce 3, obsah jaké plochy počítáte (pst u
spojité veličiny je vždy vyjádřena obsahem plochy)
d) P(0 < X < 1,25) =?; vyšrafujte do grafu v otázce 3, obsah jaké plochy počítáte (pst
u spojité veličiny je vždy vyjádřena obsahem plochy)
e) P(X > 0) =?; vyšrafujte do grafu v otázce 3, obsah jaké plochy počítáte (pst u spojité
veličiny je vždy vyjádřena obsahem plochy)
Úloha 7.4 Tým 004: je zadána odpověd 13 |. ale upřesněte v ní konstantu c; odpověď [T] neurčujte, nalezněte odpovědi 2_, _4_, 5_, 6 .
Určete hodnotu parametru c tak, aby funkce f(x) = c ■ e~'x' byla hustota náhodné veličiny X, a pak nalezněte příslušnou distribuční funkci F(x).
Potom určete střední hodnotu a rozptyl veličiny X. Poznámka: Nemusíte odpovídat na otázku číslo 1 (co vlastně veličina X měří).
Úloha 7.5 Tým 005: je zadána odpověď _4_, odpověď [T] neurčujte, nalezněte odpovědi 2_i JL? Máte ještě navíc úkol číslo [Y], což jsou otázky
a,b,c ... odpovězte na tyto otázky dvěma způsoby: jednak pomocí [3j včetně
obrázku, jednak pomocí |_4j bez obrázku, pouze dosazením hodnot distribuční funkce.
Náhodná veličina X udává životnost žárovky a má distribuční funkci (1 jednotka = 1 hodina )
fO _ ...prox<0 y 1 — e loo ... pro x > 0.
Vypočtěte pravděpodobnost, že náhodně zakoupená žárovka vydrží v provozu (u každého z úkolů a,b,c nakreslete další obrázek - vyšrafujte do grafu v otázce 3, obsah jaké plochy počítáte (pst u spojité veličiny je vždy vyjádřena obsahem plochy))
a) méně než 90 hodin;
b) 80 až 120 hodin;
c) více než 150 hodin.
80
Katedra matematiky PedF MUNI v Brně
Úloha 7.6 Vyřeší všichni do sešitu, je zadána odpověď [T], nalezněte odpovědi 2_ až 6^. Navíc je zde úkol 7_: určete teoretické četnosti výsledku zkoušky
pro 1296 studentů.
Jednomu středoškolskému profesoru se nechtělo opravovat písemky z matematiky, a tak se rozhodl udělit známky podle následujícího klíče:
a) Hodí kostkou. Pokud padne 6, ohodnotí písemku jedničkou; jinak
b) hodí znovu kostkou; pokud padne 5 nebo 6, ohodnotí písemku dvojkou; jinak
c) hodí znovu kostkou; pokud padne 4, 5 nebo 6, ohodnotí písemku trojkou; jinak
d) hodí znovu kostkou; pokud padne 3, 4, 5 nebo 6, ohodnotí čtyřkou; jinak
e) hodnotí písemku pětkou.
Vypočtěte rozdělení pravděpodobnosti, pak příslušné teoretické rozdělení četnosti výsledku zkoušky pro 1296 studentů. Určete střední hodnotu a rozptyl výsledku písemky.
Úloha 7.7 Určete střední hodnotu a rozptyl veličiny X, jejíž hustota psti f(x) je dána na obrázku:
yo.5 -
Úloha 7.8 Stanovte střední hodnotu a rozptyl náhodné veličiny X, jejíž distribuční funkce je dána vztahem
F(x) =
0
x
...xy/2.
Řešení některých příkladů najdete na konci textu v oddílu 14.7.
MA 0008 - Teorie pravděpodobnosti
81
8 Týden 08
8.1 Některá význačná rozdělení pravděpodobnosti — diskrétní i spojitá
Viz slajdy 08prednaska, kde najdete přehled základních rozdělení pravděpodobnosti. Podrobnější povídání doporučuji též v textu (Fajmon, Hlavičková, Novák, 2014) - s tím rozdílem, že geometrické rozdělení pravděpodobnosti v tom textu nenajdete, kdežto tam možná najdete navíc představené hypergeometrické rozdělení.
Celá přednáška je zpracovaná na slajdu 08prednaska a zatím není přepsaná, to, co je nyní uvedeno dále, jsou poznámky a příklady, které ukazují na možnosti prostředí Excel.
Příklad 8.1 Vypočítejte a) 10!, b) kombinační číslo (g0)
a) faktoriál vypočítáme jednoduše, stačí jen zadat =FAKTORIÁL(10), to nám dá výsledek 3628800
b) kombinační číslo získáme podobně jednoduše, v případě kombinačního čísla (g°) zadáme funkci KOMBINACE a to následujícím způsobem: =KOMBINACE(10;3), to nám dá výsledek 120
Nyní se již podíváme na binomické rozdělení psti v excelu.
Příklad 8.2 Vypočítejte binomické rozdělení psti a nakreslete jejich histogramy psti pro
a) N = 30, p = \, b) N = 30, p = \, c) N = 30, p = §
Rešení:
a) N = 30, p = \,
Použijeme funkci BINOM.DIST a to následujícím způsobem: Nejdříve si do sloupečku napíšeme hodnoty 0-30, ty představují počet úspěchů. (Dále v textu je příklad řešen pro případ, kdy v buňce A13 je 0 A14 je 1 atd. až po A43, kde je 30). Následně sestrojíme funkci. =BINOM.DIST(A13;30;0,5;NEPRAVDA). Tím získáme první hodnotu pro 0 úspěchů. Tuto funkci si v excelu "natáhneme" dolů až budeme mít všechny výsledky. Funkce tedy zůstává stejná, jen se nám mění A13 postupně na A14 A15,... až po A43. [=BI-NOM.DIST(A13;30;0,5;NEPRAVDA ), =BINOM.DIST(A14;30;0,5;NEPRAVDA ), =BINOM. DIST(A 15;30;0,5; NEPRA VDA),.... =BINOM. DIST(A4 3;30;0,5; NEPRA VDA)] Výsledky početně i graficky na následující straně - vidíme, že pro hodnoty 5 a menší a pro hodnoty 25 a větší jsou hodnoty těchto psti téměř zanedbatelné:
82
Katedra matematiky PedF MUNI v Brně
Tabulka 8.8: Tabulka pstní funkce binomického rozdělení pro N = 30, p = t.
Počet úspěchů Pravděpodobnost
0 9,31323E-10
1 2,79397E-08
2 4,05125E-07
3 3,78117E-06
4 2,55229E-05
5 0,000132719
6 0,000552996
7 0,001895986
8 0,005450961
9 0,013324572
10 0,027981601
11 0,050875638
12 0,080553093
13 0,111535052
14 0,13543542
15 0,144464448
16 0,13543542
17 0.111535052
18 0,080553093
19 0,050875638
20 0,027981601
21 0,013324572
22 0,005450961
23 0,001895986
24 0,000552996
25 0,000132719
26 2,55229E-05
27 3,78117E-06
28 4,05125E-07
29 2,79397E-08
30 9,31323E-10
Binomické rozdělení pro: N=30 p=0,5
0,16 0,14 0,12 0,1 0,08 0,06 0,04
li.
0123456789 1011 1213141516171819 202122 23 24 25 2627 282930
MA 0008 - Teorie pravděpodobnosti
83
b) N = 30, P = \
Zde použijeme úplně stejný postup jako v prvním případě. Pouze upravíme funkci do podoby =BINOM.DIST(A13;30;1/3;NEPRAVDA) upravili jsme tedy pouze \na\. Celý postup opakujeme. Výsledný histogram:
Binomické rozdělení pro: N=30, p= 1/3
0,18 0,16 0,14 0,12 0,1 0,08 0,06 0,04 0,02 0
012345678 9 10111213141516171819 202122 23 2425 2627 28 2930
c) N = 30, ř> = §
Postup stejný. Pouze místo =BINOM.DIST(A13;30;1/3;NEPRAVDA) použijeme =BINOM.DIST(A13;30;5/6;NEPRAVDA) a opět opakujeme. Výsledný histogram:
Binomické rozdělen pro: N=30, p=5/6
0,25
0,2 0,15
0,1 0,05
„ - . I I I .
0123456789 10111213141516171819 202122 23 24 25 2627 282930
Z příkladů (b),(c) je vidět, že vhledem k hodnotě psti p je oblast významně nenulových pstí posunuta a nejedná se o symetrickou funkci vzhledem k ose x = 15 jako v případě (a).
Příklad 8.3 Příklad na oříšky, ze starého přednáškového textu BMA3 příklad 9.5, pouze výpočet pomocí binomického rozdělení, ale přesný, co dá Excel - hodila by se i tabulka příslušných dílčích pstí v Excelu, které se do toho výsledku sečtou.
84
Katedra matematiky PedF MUNI v Brně
Příklad 8.4 Vegenerujte pomoci Excelu 40 hodnot rozdělení Dl = rovnoměrného fžo(60,61,...,79,80).
Příklad 8.5 a) Vegenerujte pomoci Excelu 40 hodnot počtu hodů správně vyváženou hrací kostkou, které jsou potřeba na padnutí první šestky.
b) Nakreslete histogram prvních deseti pravděpodobností veličiny, která měří počet hodů hrací kostkou potřebný na padnutí první šestky.
Příklad 8.6 a) Vegenerujte pomocí Excelu 40 hodnot Poissonova rozdělení pro A = 10.
b) Nakreslete pomocí Excelu histogram prvních dvaceti pravděpodobností Poissonovsky rozdělené veličiny pro 1) A = 0,5, 2) A = 3, 3) A = 10.
Příklad 8.7 a) Nakreslete pomocí Excelu graf funkce hustoty psti a graf distribuční funkce exponenciálního rozdělení Exp(\ = 0,5), Exp(\ = 3) a Exp(\ = 10) (jedná se tedy o tři příklady v jednom, v každém příkladu dva grafy, tedy dohromady šest grafů - nakreslete ovšem každý graf do jiného obrázku, bude to tedy celkem šest obrázků).
b) Vygenerujte pomocí Excelu čtyřicet hodnot exponenciálně rozdělených veličin z části (a) pro 1) A = 0,5, 2) A = 3, 3) A = 10.
Příklad 8.8 Vegenerujte pomocí Excelu 40 hodnot rozdělení SI = rovnoměrného spojitého na intervalu (70; 100).
Příklad 8.9 a) Nakreslete pomocí Excelu do jednoho obrázku (různými barvami) graf funkce hustoty psti normálního rozdělení No(/i = 75, o = 5), a normálního rozdělení No(fji = 75,(7 = 10).
b) Nakreslete pomocí Excelu do jednoho obrázku (různými barvami) graf distribuční
funkce normálního rozdělení No(/i = 75, a = 5), a normálního rozdělení No(fji = 75,(7 = 10).
c) Vygenerujte pomocí Excelu čtyřicet hodnot normálně rozdělených veličin z části (a)
pro 1) No(/i = 75, a = 5), 2) pro No(ji = 75, a = 10).
MA 0008 - Teorie pravděpodobnosti
85
8.2 Cvičení 08
V tomto cvičení pokračuje studentská povinnost u každého příkladu uvést odpovědi [T] až |~6~|. Ale nyní vše nebudete počítat sami - odpovědi lze nalézt v učebnicích jako rozdělení pravděpodobnosti pod určitým jménem. Tj. vaším úkolem je a) nalézt vzorce-odpovědi [T~| až 6 pod tímto jménem, b) aplikovat tyto vzorce na svůj zadaný příklad.
Úloha 8.1 Tým 006: je zadána odpověď [T~|, nalezněte odpovědi 2 až 6 . Jedná se o diskrétní rovnoměrné rozdělení hodnot z množiny {1, 2,,..., n}; nalezněte dané vzorce, vysvětlete jejich použití a dosaďte do nich.
X= náhodně vygenerované číslo z množiny přirozených čísel {1, 2, ..., 19, 20}. Úloha 8.2 Tým 007: je zadána odpověď [T~|, nalezněte odpovědi 2 až Q
Jedná se o alternativní rozdělení pravděpodobnosti; nalezněte dané vzorce, vysvětlete jejich použití a dosaďte do nich.
X= počet šestek z jednoho hodu kostkou (tj. 0 bebo 1).
Úloha 8.3 Tým 001: je zadána odpověď [T~|, nalezněte odpovědi 2_ až 6_. Jedná se o binomické rozdělení pravděpodobnosti; nalezněte dané vzorce, vysvětlete jejich použití a dosaďte do nich.
X= počet šestek ze dvaceti hodů kostkou (při výpočtu lze v Excelu využít statistickou funkci BINOM.DIST ... pokud poslední parametr funkce nastavíte na 0 nebo nepravda, vypočtou se psti; pokud nastavíte na 1 nebo pravda, vypočtou se hodnoty distribuční funkce).
Úloha 8.4 Tým 002: je zadána odpověď [T~|, nalezněte odpovědi 2_ až 6^. Jedná se o geometrické rozdělení pravděpodobnosti; nalezněte dané vzorce, vysvětlete jejich použití a dosaďte do nich.
Horáček se jde po úspěšné zkoušce z matematiky občerstvit do hospody. Pravděpodobnostní přemýšlení u něj vítězí nad žízní, rozhodne se pít podle následujícího klíče: Padne-li mu při hodu kostkou 1, 2, 3 nebo 4, tak aniž by si cokoli objednal, jde zpět na koleje. Padne-li mu 5 nebo 6, poručí si jedno pivo a hází ještě jednou. Padne-li mu 1, 2, 3 nebo 4, tak zaplatí a jde na koleje učit se matematiku. Padne-li mu 5 nebo 6, poručí si další pivo a hází ještě jednou, atd. (eventuálně až do nekonečna).
a) Odvoďte pravděpodobnostní funkci počtu piv, která Horáček celkem vypije.
b) Vypočtěte očekávaný (střední) počet piv, která Horáček vypije.
Úloha 8.5 Tým 003: je zadána odpověď [T~|, nalezněte odpovědi 2 až 7 . Jedná se o Poissonovo rozdělení pravděpodobnosti; nalezněte dané vzorce, vysvětlete jejich použití a dosaďte do nich.
86
Katedra matematiky PedF MUNI v Brně
X = počet zákazníků restaurace, kteří přijdou za hodinu. Přitom je známo, že do restaurace přijde průměrně dvacet zákazníků za hodinu.
Úkol [Ť]; Určete pst, že v průběhu jedné hodiny přijde právě patnáct zákazníků. Úloha 8.6 Tým 004: je zadána odpověď |T"|, nalezněte odpovědi 2.
az
Jedná se o Exponenciální rozdělení pravděpodobnosti; nalezněte dané vzorce, vysvětlete jejich použití a dosaďte do nich.
Výrobní zařízení má poruchu PRŮMĚRNĚ jednou za 2000 hodin. Předpokládejte, že X = doba čekání na poruchu je náhodná veličina s exponenciálním rozdělením.
Úkol |~7J; Určete hodnotu to tak, aby pst, že zařízení bude pracovat delší dobu než to, byla 0,9.
Úloha 8.7 Tým 005: je zadána odpověď [T] pro dvě veličiny, laľ. Nalezněte pro obě veličiny odpovědi 2_ až _6_ a pro veličinu Y ještě odpověď [Y]. U
veličiny X se jedná o Poissonovo rozdělení pravděpodobnosti, u veličiny Y o exponenciální rozdělení pravděpodobnosti; nalezněte dané vzorce, vysvětlete jejich použití a dosaďte do nich.
Na email vyučujícího přijdou během osmihodinové pracovní doby zhruba tři emaily od studentů, které jsou na sobě navzájem nezávislé. V této situaci měříme dvě veličiny:
X = počet emailů skutečně přišlých během osmi hodin.
Y = doba mezi dvěma následnými (na sobě nezávislými) emaily od studentů vyučujícímu.
Úkol |~7~|; Určete pst, že interval mezi dvěma následnými nezávislými emaily od studentů vyučujícímu bude 10 min až 1 h.
Řešení některých příkladů14 najdete na konci textu v oddílu 14.8.
14Poznámka pro vyučujícího: Ještě možnost počítat ze BMA3-sbirka 6.18 binomické, 6.20 hypergeom., 6.21 spešl váhy a automatická linka, 7.14 Poissonovo.
MA 0008 - Teorie pravděpodobnosti
87
9 Týden 09
9.1 Normální rozdělení psti
9.1.1 Normální rozdělení pravděpodobnosti
Normální rozdělení pravděpodobnosti je rozdělení pro veličiny spojitého typu a má hustotu
/(*) = -/jj—-e -2 • VZ7T ■ a
Odvození vzorce viz video (vhodné pro pedagog, fakultu )
https://www.youtube.com/watch?v=8Y0eKBsGp2M&ab_channel=CuriousAndLearning
Dalo by se spočítat, že střední hodnota veličiny X s rozdělením zadaným touto hustotou je rovna parametru fi, rozptyl je roven parametru a2. Proto budeme značit No(fi, a2). Na obr. 9.6 jsou uvedeny grafy hustoty pro a2 stále rovno jedné a různé střední hodnoty /i, na obr. 9.7 je [i = 6 a mění se hodnoty rozptylu a2 ( Při malém rozptylu je rameno grafu hustoty vysoké a úzké, pro větší rozptyl hustota nabývá nižších funkčních hodnot, ale interval s hodnotami významně odlišnými od nuly je širší). U všech těchto grafů hustot platí /^o/(í)dí=l.
—13 8
Obrázek 9.6: Hustota normálního rozdělení pro různé střední hodnoty \i.
Normální rozdělení se stalo slavným díky tomu, co říká tzv. centrální limitní věta:
Jestliže Xi, X2,..., Xat jsou navzájem nezávislé veličiny, které mají všechny stejné rozdělení (nemusí být normální, ale libovolné, jeho střední hodnota je EX% = ji a rozptyl DX% = a2), pak součtem těchto veličin je náhodná veličina Y (platí Y = Jľi^O se střední hodnotou EY = N ■ [i a rozptylem DY = N ■ a2, která má pro dostatečně velké N (N > 30) normální rozdělení, tj. platí
P(Ye(a;b))= / -e-^W^dt.
88
Katedra matematiky PedF MUNI v Brně
0.8
0.6
0.4
0.2
0
123456789
Obrázek 9.7: Hustota normálního rozdělení pro různé rozptyly a2.
To, že hodně proměnných lze s velkou přesností popsat pomocí normálního rozdělení, je právě důsledkem centrální limitní věty Následující dvě situace to dokreslují.
Příklad 9.1 Y\ udává výšku borovic v daném lese (v metrech). Průměrná výška (= /i) je 50 metrů. Vezměme nyní jeden konkrétní strom, jehož výskaje 54 metrů. Co způsobilo, že vyrostl o 4 metry nad průměr? Hodně různých vlivů:
a) Stromek byl zasazen v obzvlášť příznivém období roku, což způsobilo, že vyrostl o lm
nad průměr.
b) Místo, kde strom roste, získává zdroje hnojiva navíc, což vede k růstu o 2,3m nad
c) Nešťastnou náhodou byl stromek při sazení nalomen, což znamená, že narostl o l,4m
nižší, než mohl.
d) Strom má dobré místo na slunci, což mu pomohlo vyrůst o 2m nad průměr.
e) Skupina příslušníků antagonistického hmyzu si vybrala strom za svůj domov, což mu
vzalo šance vyrůst o 0,6m výš než ostatní stromy.
Zkrátka a dobře, vychýlení 4m nad průměr je dáno součtem všech těchto možných kladných i záporných vlivů. Protože těchto vlivů je většinou poměrně dost, výslednou výšku stromu danou soustem všech těchto vlivů lze s velkou přesností popsat normálním rodělením.
Příklad 9.2 Y2 udává výsledek zkoušky z matematiky. Vezmeme nyní výsledek zkoušky jednoho konkrétního studenta. Co naň mělo vliv?
a) Honza měl den před zkouškou chřipku. To snížilo jeho výkon o 5 bodů.
b) Honza si něco tipl a náhodou to trefil - přidalo mu to 2 body.
prumer.
atd.
MA 0008 - Teorie pravděpodobnosti
89
c) Honza chyběl na klíčové přednášce a neměl u zkoušky její kopii - přišel o 5 bodů.
d) Profesor byl v dobré náladě a při opravování Honzovi 3 body přidal zadarmo. atd.
Opět vidíme, že výsledek Honzovy zkoušky je dán součtem většího počtu navzájem nezávislých náhodných vlivů, a tedy jej lze s velkou přesností popsat normálním rozdělením.
Následující příklad by klidně mohl být uveden jako matematická věta, protože se jedná o důležitý důsledek centrální limitní věty (a někdy je také uváděn jako věta - říká se jí Moivre - Laplaceova věta (čti: moávr laplasova)).
Příklad 9.3 Důsledek centrální limitní věty číslo 1. Specielně i binomické rozdělení lze pro dostatečně velké N dobře popsat (aproximovat, nahradit) normálním rozdělením:
Uvažujme například veličinu X, která udává počet líců při 100 hodech korunou. Tato veličina má binomické rozdělení s parametry
N = 100, p = i; EX = Np = 50; DX = Np(l - p) = 25.
Tuto veličinu lze vyjádřit jako součet veličin X\, X2, ■ ■ ■, Aľioo, kde X, má binomické rozdělení s parametry N = 1, p = |, tj. udává počet líců v jediném hodu mincí (pro N = 1 se binomické rozdělení někdy nazývá alternativní rozdělení, protože veličina může zde nabývat pouze dvou alternativ: 0 (= číselné vyjádření alternativy „neúspěch") nebo 1 (= číselné vyjádření alternativy „úspěch")).
Jako součet stejně rozdělených nezávislých veličin lze tedy X s velkou přesností popsat normálním rozdělením s parametry (pro N = 100^
li = EX = N ■ EX, = Np = bQ, a2 = DX = N ■ DX, = Np(l - p) = 25.
Cili pro dostatečně velké N lze binomické rozdělení s velkou přesností aproximovat normálním rozdělením se stejnou střední hodnotou a rozptylem.
Příklad 9.4 Důsledek centrální limitní věty číslo 2. Tento důsledek budeme potřebovat v následující kapitole, když se budeme snažit popsat rozdělení průměru ze stejně rozdělených veličin: Jestliže X\, X2, ■ ■ ■, X^ jsou stejně rozdělené veličiny, ne nutně normálně rozdělené, a každá z nich má stejnou střední hodnotu /i a stejný rozptyl a2, Tak jejich průměr
1 N
i=i
má normální rozdělení se střední hodnotou ji a rozptylem ^. Skutečně, lze dokázat výpočtem střední hodnoty a rozptylu této veličiny. Od tvrzení původní centrální limitní
90
Katedra matematiky PedF MUNI v Brně
věty se tato věta liší pouze tím, že celý součet veličin je ještě vydělený konstantou N, díky tomu tedy jiná střední hodnota a rozptyl:
, a2
(při výpočtu rozptylu využíváme toho, že se počítá jako druhá mocnina odchylky v argumentu - tedy při vytýkání konstanty násobené sumou náhodných veličin před operátor D tuto konstantu musíme umocnit na druhou).
9.1.2 řJ-rozdělení
Uvažujme náhodnou veličinu X udávající výsledky zkoušky z matematiky, kterou lze s velkou přesností popsat normálním rozdělením (viz příklad 9.2)s hustotou fit) a parametry
fix = 75, o\ = 25.
Její normované hodnoty (viz př. ??, ??, ??) budeme chápat jako hodnoty veličiny U, kde
u=X-iax = X-75 ax 5
a platí
EU = í t-^í-f(t)dt = — (í t-f(t)dt-iix- í fit)dt
J — oo ®x ®x \J — oo J — oo
1 .
= —(aíx - ■ 1) = 0;
DU = Eill2) - E2U = EU2 - 0 = j°° (j^^j ■ f(t)dt =
1 ľ°° 1
it-^x)2-fit)dt = --a2x = l.
°Í J-co
Zajímá-li nás pravděpodobnost, s jakou student dosáhne výsledku mezi 75 a 77 body, musíme spočítat
ľ 1 (t-75)2
P 75 < X < 77 = / -=--e--~dt,
J75
což je obsah vyšrafované plochy na obrázku 9.8.
Tato pravděpodobnost je stejná jako pravděpodobnost, že veličina U nabude hodnot z intervalu určeného příslušnými normovanými hodnotami:
,r ms „,75-75 X — 75 77- 75,
P 75 < X < 77 = Pí---<--— <--- =
5 5 5
f0.4
r 1
= P(0 < U < 0.4) = / -= • e~du,
JO V27T
MA 0008 - Teorie pravděpodobnosti
91
0.08 -0.06 -0.04 -0.02 -
0 60 65 70 75 80 85 90
Obrázek 9.8: Obsah šrafované plochy je roven pravděpodobnosti, že X nabude hodnot z intervalu < 75; 77 >.
Obrázek 9.9: Obsah šrafované plochy je roven pravděpodobnosti, že U nabude hodnot z intervalu < 0; 0.4 >. Tento obsah je stejný jako obsah šrafované plochy z obr. 9.8.
což je obsah šrafované plochy na obrázku 9.9. Platí tedy
.7.7 77-75
ľ 1 (t-75)2 /—T"
/ _— • e 2-25 dt = I f(u)du,
J75 V27T-5
5
kde fiu) je hustota U-rozdělení, tj. libovolný integrál z hustoty normálního rozdělení lze převést na integrál z hustoty rozdělení U.
Veličina U má tedy normální rozdělení No(fi = 0; u2 = 1), které nazýváme standardizovaným normálním rozdělením (v anglické literatuře Z-distribution; hodnoty veličiny s tímto rozdělením se nazývají Z-values nebo také Z-scores).
Výpočty uvedených integrálů jsou dosti pracné (buď musíme užít některou z numerických metod, nebo rozvinout exponenciální funkci v nekonečnou řadu a integrovat člen po členu), a proto se s výhodou používá následujícího postupu: pravděpodobnostní
92
Katedra matematiky PedF MUNI v Brně
výpočty obecného normálního rozdělení se převedou právě popsaným postupem na výpočet integrálu ř7-rozdělení, pro které byla vypočtena a sestavena tabulka integrálů
$(n) = P(U 0:
$(-u) = 1 - (f>(u)
Pravdivost tohoto tvrzení je patrná z toho, že na obou stranách rovnosti v rámečku je obsah téže plochy. Např. $(—0,5) = 1 — $(0,5), protože (viz obr. 9.11) funkce f(u) je symetrická a celkový obsah plochy pod křivkou je roven jedné:
$(-0,5) = S (A) = S(B) = 1 - $(0,5)
Hodnoty funkce $(-u) jsou uvedeny v tabulce 9.9 a 9.10.
Příklad 9.5 Veličinu X udávající výsledek zkoušky lze popsat rozdělením No(n = 75; a2 = 25), S jakou pravděpodobností je výsledek zkoušky
a) v intervalu < 69; 72 > ?
b) menší než 65 ?
c) větší než 80 ?
MA 0008 - Teorie pravděpodobnosti
93
3.4-
3.3
/ 3.2
0.1 B x.
0.5
Obrázek 9.11: Obsahy ploch A a B jsou stejné.
d) v intervalu < /ix — 3ax; /ix + 3ax > ? Řešení: ad a)
P(69 < X < 72) = Pí < < 72 " ^x
ox
ox
ox
5 ~ ~ 5 = P(-l,2 < U < -0,6) = $(-0,6) - $(-1,2) = = 1 - $(0,6) - (1 - $(1,2)) =
= $(1,2) - $(0,6) = 0,8849303 - 0,7257469 = 0,1591834, což je obsah plochy na obrázku 9.12.
Pokud si zvídavý čtenář položil otázku, proč místo některých neostrých nerovností nejsou v tomto odvozování ostré a naopak, pak bych mu rád připomněl, že u spojitých veličin platí
P(X = t0) = 0
pro libovolné to- Díky tomu nezáleží na tom, zda u normálního rozdělení definujeme distribuční funkci předpisem F(t) = P(X < t) nebo F(t) = P(X < t) (tyto dva druhy definice se totiž objevují v matematické literatuře oba, ale žádný velký vliv to nemá - u spojitých veličin to nemá žádný vliv, u diskrétních veličin je schodová distribuční funkce v prvním případě zprava spojitá, ve druhém zleva spojitá, tj. v bodě skoku je v prvním případě funkční hodnota definována na horním schodu, ve druhém případě na dolním).
ad b)
P(X<65) = p{iI^<61^l)=p(u<65-75
= PiU < -2) = $(-2) = 1 - $(2) = = 1 - 0,9772499 = 0,0227501.
94
Katedra matematiky PedF MUNI v Brně
Tabulka 9.9: Hodnoty distribuční funkce $(-u) - l.část.
u $(ií) u $(ií) u $(ií) u $(ií) u $(ií)
0,00 0,5000000 0,30 0,6179114 0,60 0,7257469 0,90 0,8159399 1,20 0,8849303
0,01 0,5039894 0,31 0,6217195 0,61 0,7290691 0,91 0,8185887 1,21 0,8868606
0,02 0,5079783 0,32 0,6255158 0,62 0,7323711 0,92 0,8212136 1,22 0,8887676
0,03 0,5119665 0,33 0,6293000 0,63 0,7356527 0,93 0,8238145 1,23 0,8906514
0,04 0,5159534 0,34 0,6330717 0,64 0,7389137 0,94 0,8263912 1,24 0,8925123
0,05 0,5199388 0,35 0,6368307 0,65 0,7421539 0,95 0,8289439 1,25 0,8943502
0,06 0,5239222 0,36 0,6405764 0,66 0,7453731 0,96 0,8314724 1,26 0,8961653
0,07 0,5279032 0,37 0,6443088 0,67 0,7485711 0,97 0,8339768 1,27 0,8979577
0,08 0,5318814 0,38 0,6480273 0,68 0,7517478 0,98 0,8364569 1,28 0,8997274
0,09 0,5358564 0,39 0,6517317 0,69 0,7549029 0,99 0,8389129 1,29 0,9014747
0,10 0,5398278 0,40 0,6554217 0,70 0,7580363 1,00 0,8413447 1,30 0,9031995
0,11 0,5437953 0,41 0,6590970 0,71 0,7611479 1,01 0,8437524 1,31 0,9049021
0,12 0,5477584 0,42 0,6627573 0,72 0,7642375 1,02 0,8461358 1,32 0,9065825
0,13 0,5517168 0,43 0,6664022 0,73 0,7673049 1,03 0,8484950 1,33 0,9082409
0,14 0,5556700 0,44 0,6700314 0,74 0,7703500 1,04 0,8508300 1,34 0,9098773
0,15 0,5596177 0,45 0,6736448 0,75 0,7733726 1,05 0,8531409 1,35 0,9114920
0,16 0,5635595 0,46 0,6772419 0,76 0,7763727 1,06 0,8554277 1,36 0,9130850
0,17 0,5674949 0,47 0,6808225 0,77 0,7793501 1,07 0,8576903 1,37 0,9146565
0,18 0,5714237 0,48 0,6843863 0,78 0,7823046 1,08 0,8599289 1,38 0,9162067
0,19 0,5753454 0,49 0,6879331 0,79 0,7852361 1,09 0,8621434 1,39 0,9177356
0,20 0,5792597 0,50 0,6914625 0,80 0,7881446 1,10 0,8643339 1,40 0,9192433
0,21 0,5831662 0,51 0,6949743 0,81 0,7910299 1,11 0,8665005 1,41 0,9207302
0,22 0,5870604 0,52 0,6984682 0,82 0,7938919 1,12 0,8686431 1,42 0,9221962
0,23 0,5909541 0,53 0,7019440 0,83 0,7967306 1,13 0,8707619 1,43 0,9236415
0,24 0,5948349 0,54 0,7054015 0,84 0,7995458 1,14 0,8728568 1,44 0,9250663
0,25 0,5987063 0,55 0,7088403 0,85 0,8023375 1,15 0,8749281 1,45 0,9264707
0,26 0,6025681 0,56 0,7122603 0,86 0,8051055 1,16 0,8769756 1,46 0,9278550
0,27 0,6064199 0,57 0,7156612 0,87 0,8078498 1,17 0,8789995 1,47 0,9292191
0,28 0,6102612 0,58 0,7190427 0,88 0,8105703 1,18 0,8809999 1,48 0,9305634
0,29 0,6140919 0,59 0,7224047 0,89 0,8132671 1,19 0,8829768 1,49 0,9318879
MA 0008 - Teorie pravděpodobnosti
95
Tabulka 9.10: Hodnoty distribuční funkce $(-u) - 2.část.
u $(ií) u $(ií) u $(ií) u $(ií)
,50 0,9331928 1,80 0,9640697 2,10 0,9821356 2,40 0,9918025
,51 0,9344783 1,81 0,9648521 2,11 0,9825708 2,41 0,9920237
,52 0,9357445 1,82 0,9656205 2,12 0,9829970 2,42 0,9922397
,53 0,9369916 1,83 0,9663750 2,13 0,9834142 2,43 0,9924506
,54 0,9382198 1,84 0,9671159 2,14 0,9838226 2,44 0,9926564
,55 0,9394392 1,85 0,9678432 2,15 0,9842224 2,45 0,9928572
,56 0,9406201 1,86 0,9685572 2,16 0,9846137 2,46 0,9930531
,57 0,9417924 1,87 0,9692581 2,17 0,9849966 2,47 0,9932443
,58 0,9429466 1,88 0,9699460 2,18 0,9853713 2,48 0,9934309
,59 0,9440826 1,89 0,9706210 2,19 0,9857379 2,49 0,9936128
,60 0,9452007 1,90 0,9712834 2,20 0,9860966 2,50 0,9937903
,61 0,9463011 1,91 0,9719334 2,21 0,9864474 2,51 0,9939634
,62 0,9473839 1,92 0,9725711 2,22 0,9867906 2,52 0,9941323
,63 0,9484493 1,93 0,9731966 2,23 0,9871263 2,53 0,9942969
,64 0,9494974 1,94 0,9738102 2,24 0,9874545 2,54 0,9944574
,65 0,9505285 1,95 0,9744119 2,25 0,9877755 2,55 0,9946139
,66 0,9515428 1,96 0,9750021 2,26 0,9880894 2,56 0,9947664
,67 0,9525403 1,97 0,9755808 2,27 0,9883962 2,57 0,9949151
,68 0,9535213 1,98 0,9761482 2,28 0,9886962 2,58 0,9950600
,69 0,9544860 1,99 0,9767045 2,29 0,9889893 2,59 0,9952012
,70 0,9554345 2,00 0,9772499 2,30 0,9892759 2,60 0,9953388
,71 0,9563671 2,01 0,9777844 2,31 0,9895559 2,70 0,9965330
,72 0,9572838 2,02 0,9783083 2,32 0,9898296 2,80 0,9974449
,73 0,9581849 2,03 0,9788217 2,33 0,9900969 2,90 0,9981342
,74 0,9590705 2,04 0,9793248 2,34 0,9903581 3,00 0,9986501
,75 0,9599408 2,05 0,9798178 2,35 0,9906133 3,20 0,9993129
,76 0,9607961 2,06 0,9803007 2,36 0,9908625 3,40 0,9996631
,77 0,9616364 2,07 0,9807738 2,37 0,9911060 3,60 0,9998409
,78 0,9624620 2,08 0,9812372 2,38 0,9913437 3,80 0,9999277
,79 0,9632730 2,09 0,9816911 2,39 0,9915758 4,00 0,9999683
u
4,50 5,00 5,50
$(ií) 0,9999966 0,9999997 0,9999999
96
Katedra matematiky PedF MUNI v Brně
ad c)
P(X>80) = P [ U > 80 c 75 ) = P (U > 1) = 1 - P (U < 1) =
5
= 1 - $(1) = 1 - 0,8413447 = 0,1586553.
ad d) P(/ix - 3ax < X < jix + 3ax) =
_ p i l^x 3<7x jlx ^ ^ /ix + 3(7^ /ij
= P(-3 < U < 3) = $(3) - $(-3) = $(3) - (1 - $(3)) = = 2$(3) - 1 = 0,9973002
Většina hodnot veličiny X leží tedy v intervalu < /ix — 3ax,/ix + 3ax >. Veličina X nabude hodnoty z tohoto intervalu s pravděpodobností 99,7% (= tzv. pravidlo tří sigma).
Příklad 9.6 Firma vyrábí balíčky ořechů po 200/cs, přičemž | oříšků jsou burské a j lískové, dokonale se promíchají, a pak se teprve sypou do balíčků. Jestliže koupíme jeden balíček ořechů, jaká je pravděpodobnost, že počet lískových ořechů je v intervalu < 47; 56 > ?
Řešení. Náhodná veličina X udávající počet lískových ořechů v jednom balíčku má rozdělení Bi{N = 200, jo = 0,25), čili \ix = 50, o2x = 37,5. Přímý výpočet
P (47 < X < 56) = P(X = 47) + P(X = 48) + • • • + P(X = 56) =
20(A0,25470,75153 + P°°V,25480,75152 + • • • + P°°V,25560,75144 =
47 y V 48 / V 56
= 0,568
MA 0008 - Teorie pravděpodobnosti
97
byl určen pomocí robustní kalkulačky, která má funkci pro obecnou sumu a také funkci pro vyčíslení kombinačních čísel. Při náhradě daného binomického rozdělení normálním rozdělením se stejnou střední hodnotou a rozptylem (a2 = 37,5 ==> ox = 6,12) dostaneme výsledek:
P(47 < X < 56) = P 1-^2- ~U- -6~12~) = $(°'98) " ^~0^ = = $(0,98) - (1 - $(0,49)) = 0,524.
Je vidět, že chyba od přesného výsledku je v řádu procent (druhé desetinné místo). Pokud bychom použili korekce (viz následující příklad 9.7), dostali bychom výsledek P(46, 5 < X < 56, 5) = 0, 569, jehož odchylka od přesného výsledku je většinou v desetinách procenta (třetí desetinné místo).
9.1.3 Aproximace binomického rozdělení normálním s korekcí
Příklad 9.7 Náhodná veličina X udává počet líců při čtyřech hodech mincí. Vypočteme například pravděpodobnost, že počet líců ve čtyřech hodech bude jeden nebo dva,
a) pomocí Bí(N = 4,p = 0,5);
b) pomocí normálního rozdělení;
c) pomocí normálního rozdělení s korekcí. Řešení:
ad a) P{1 < X < 2) = Pl + p2 = 0,25 + 0,375 = 0,625.
ad b) Aproximujme binomické rozdělení normálním rozdělením No([ix = Np = 2, a2 = Np(l-p) = 1);
P(1 0,99 /.
Úloha 9.5 Honza Kovář pravidelně jezdí hrát squash. V každém z 900 po sobě jdoucích dny zaparkuje své auto na placeném parkovacím místě s parkovacím taxametrem, ale nikdy do něj nevhodí kupón. Pravděpodobnost, že policista daný den zkontroluje taxametr, je rovna 0,1. Vypočtěte.
a) kolikrát může Honza očekávat, že dostane pokutu,
b) jaká je směrodatná odchylka rozdělení očekávaného počtu pokut,
c) jaká je pravděpodobnost, že Honza dostane přesně 90 pokut ... vypočtěte přesně pomocí binomického rozdělení,
100
Katedra matematiky PedF MUNI v Brně
d) jaká je pravděpodobnost, že Honza dostane 87 a více pokut ... vypočtěte přesně pomocí binomického rozdělení (asi pomocí nějakého programu nebo programovatelné kalkulačky s cyklem),
e) Vypočtěte body c),d) přibližně pomocí aproximace binomického rozdělení normálním.
Úloha 9.6 Podle údajů ze sčítání lidu v roce 2017 je zhruba 75% domácností vybaveno internetem. Náhodně bylo vybráno 400 domácností.
a) Jaká je pravděpodobnost, že z vybraných 400 domácností má internet zaveden 290 až 305 domácností?
b) Určete, v jakých mezích (souměrných kolem střední hodnoty) bude počet domácností s internetem (ze 400 vybraných) s pravděpodobností95%.
Úloha 9.7 Aniž byste né pravděpoobnosi počítali, doplňte místo otazníků znaky <, >, = a ke každé straně nerovnosti nakreslete obsah plochy, který danou pst představuje. Respektive naopak - nejprve si nakreslete šrafované obsahy počítaných ploch na každé straně nerovnosti (do dvou různých obrázků, ai se v nich vyznáte), a pak teprve napište znaménko nerovnosti:
a) P(U < 0,8) ?? P(U < 0,9);
b) P(U < 0,7) ?? P(U > 0,7);
c) P{U > -2) ?? P(U < 2);
d) P(U < -3) ?? P(U < 3);
e) P(0,9 < U < 1,1) ?? P(l,9 < U < 2,1); /; P(l < U < 2) ?? P(U < 1) + P(U > 2).
Úloha 9.8 Najděte hodnotu u, pro kterou platí (a ke každé psti nakreslete obsah plochy, kterou představuje):
a) P{U > u) = 0, 25;
b) P(U < u) = 0,1;
c) PiU < u) = 0, 99;
d) P{-u < U < u) = 0, 99;
e) P(0 < U < u) = 0, 35; /j P(l < U < u) = 0,2.
Úloha 9.9 Náhodná veličina X má normální rozdělení se střední hodnotou ji = 5 a směrodatnou odchylku o = 4. Vypočtěte následující pravděpodobnosti a doplňte je o obrázky.
a) P(X < 11)
b) P(X > 0)
c) P(Xe<3;7)
MA 0008 - Teorie pravděpodobnosti
101
d) P(fi < X < /i + a)
e) P(fi — a < X < fi +a)
f) P(/i + a < X < /i + 2a)
g) P(/i + 2a < X < /i + 3a)
Úloha 9.10 250 soustruhů pracuje nezávisle na sobě. Každý z nich je v provozu 80% z celkové pracovní doby. Vypočtěte pomocí normálního rozdělení s korekcí, jaké je pravděpodobnost, že náhodně vybraném okamžiku pracovní doby je v provozu 190 až 220 soustruhů.
Úloha 9.11 Pravděpodobnost, že se zasazený strom ujme, je 0,85. Vypočtěte pomocí normálního rozdělení s korekcí, jaká je pravděpodobnost, že z 500 zasazených stromů se jich ujme aspoň 420.
Výsledky některých úloh viz 14.9.
102
Katedra matematiky PedF MUNI v Brně
10 Týden 10
10.1 Přednáška 10: Uvod do úsudkové statistiky — statistické testy
10.1.1 Statistické rozhodování — chyba 1. druhu a chyba 2. druhu
Příklad 10.1 Soudní proces jako příklad rozhodovacího procesu. Uvažujme jednoduchý soudní proces, ve kterém existuje pouze jediný možný trest a soud rozhodne, zda se tomuto trestu obžalovaný podrobí nebo ne. A navíc proti rozhodnutí soudu neexistuje žádné odvolání. Jedná se o jakýsi rozhodovací proces, u kterého mohou nastat čtyři možné výsledky:
1. Obžalovaný je vinen a soud jej odsoudí.
2. Obžalovaný je nevinen a soud jej osvobodí.
3. Obžalovaný je nevinen a soud jej odsoudí. Jedná se o chybné rozhodnutí - tuto chybu budeme označovat jako chybu prvního druhu.
4- Obžalovaný je vinen a soud jej osvobodí. Toto rozhodnutí je rovněž chybné - budeme tuto chybu označovat chybou druhého druhu.
V každém soudním procesu se musí hledat jistá rovnováha mezi tvrdostí a mírností. Jedním extrémem je liberální soudce, který k usvědčení obžalovaného vyžaduje velké množství důkazů. Takový soudce jen zřídka odsoudí nevinného (zřídka se dopustí chyby prvního druhu), ale dosti často osvobodí viníka (chyba druhého druhu). Druhým extrémem je konzervativní soudce, kterému k usvědčení stačí jen několik důkazů. Takový soudce posílá do vězení i jen při stínu podezření, čili častěji odsoudí nevinného (chyba prvního druhu), ale zřídka osvobodí darebáka (= zřídka se dopustí chyby druhého druhu). Slova „konzervativní" a „liberální" jsou termíny z politiky. V dnešní době už nikdo neví, co znamenají. Tato jejich „statistická" definice navrhuje jejich význam, ale také upozorňuje na nebezpečí každého z těchto postojů.
Je otázkou, která z chyb je závažnější - zda chyba prvního druhu, nebo chyba druhého druhu. Všeobecně se má za to, že závažnější je uvěznit nevinného, než osvobodit darebáka. A proto se chybě odsouzení nevinného přisuzuje druh číslo 1 a věnuje se jí větší pozornost. Ale někde musí být stanovena jistá hranice, po jejímž překročení už soud přistoupí k rozhodnutí „vinen" a bez skrupulí člověka potrestá.
Všimněme si jedné věci, která platí jako obecný princip. Pokud se soudce snaží být benevolentní a odsoudí člověka až po nahromadění velkého množství důkazů (snižuje tím možnost výskytu chyby prvního druhu), současně narůstá nebezpečí, že i když je obžalovaný vinen, potřebné množství důkazů se nenajde a soud jej osvobodí (roste možnost výskytu chyby druhého druhu). Není to nic světoborného, ale už jsme dlouho neměli žádný rámeček, a proto jej aspoň uvnitř příkladu můžeme použít:
MA 0008 - Teorie pravděpodobnosti
103
Snižováním možnosti výskytu chyby prvního druhu roste možnost výskytu chyby druhého druhu - a naopak: pokud zvyšujeme možnost výskytu chyby prvního druhu, snižuje se možnost výskytu chyby druhého druhu.
Z uvedeného rámečku je vidět, že žádnou z chyb není možné naprosto vyrušit: pokud totiž snižujeme možnost výskytu chyby prvního druhu až téměř na nulu, roste tím možnost výskytu chyby druhého druhu do obludných rozměrů a rozhodnutí učiněná tímto stylem jsou nerozumná, až nemoudrá. Strategií v rozhodovacích procesech tohoto typu je tedy zvolit pravděpodobnost výskytu chyby prvního druhu malou, ale ne příliš malou.
Shrňme předchozí úvahy do pěti kroků, které popisují celý soudní proces:
1. Stojí proti sobě dvě možná rozhodnutí soudu:
Ho ... obžalovaný je nevinen H\ ... obžalovaný je vinen
Soud musí rozhodnout právě jednu z těchto variant a toto rozhodnutí je nezvratné, neexistuje proti němu odvolání.
2. Vystoupí žalobce, který předloží nashromážděné důkazy pro platnost H\.
3. Vystoupí obhájce a vysvětlí všechny souvislosti za předpokladu, že platí Hq. Snaží se vidět a vysvětlit všechny argumenty obžaloby ve světle toho, že obžalovaný je nevinen.
4- Porota soudu se odebere k rokování. Bere v úvahu jak množství důkazů a jejich závažnost, tak i argumenty obhajoby a možnost, že tyto důkazy neznamenají nutně vinu obžalovaného, ale v jeho neprospěch hrají jen náhodou.
5. Porota se vrací a vyslovuje svůj verdikt: pokud byla překročena míra závažnosti důkazů pro platnost H\, obžalovaný je vinen, pokud ne, obžalovaný je osvobozen. Toto rozhodnutí soudu je nezvratné.
Právě uvedených pět kroků v příkladu 10.1 se vyskytuje v mnoha rozhodovacích procesech, které nazýváme statistické testy. Tyto principy platí obecně, vyslovme je tedy obecně, už oproštěni od příkladu soudce a obžalovaného (ovšem analogie se soudním procesem zde existuje velice přímá):
(Kl) Statistický test obyčejně rozhoduje o tom, zda platí hypotéza Hq (tzv. nulová hypotéza) nebo H\ (tzv. alternativní hypotéza). Tyto dvě hypotézy přitom stojí ve vzájemném rozporu. Ve většině testů Ho tvrdí, že jistá veličina nezávisí na hodnotách určité další veličiny, kdežto H\ tvrdí, že naopak závisí (pro ty, kdo by si chtěli udržet souvislost mezi statistickým testem a soudním procesem, což doporučuji, pomůcka k zapamatování: Ho testu říká nezávisí, a Ho soudního procesu nevinen).
104
Katedra matematiky PedF MUNI v Brně
(K2) Stanovíme kritérium (zpravidla určitou funkci), které ukazuje na míru platnosti alternativní hypotézy H\ (určuje „závažnost důkazů" pro H\). Pak provedeme experiment, ve kterém změříme data potřebná pro dosazení hodnot do našeho kritéria.
(K3) Kritériem bývá jistá funkce, která při různých měřeních nabývá různých hodnot, je to tedy náhodná veličina. Určíme teoretické rozdělení kritéria za předpokladu, že platí hypotéza Ho- Jinými slovy, popíšeme vlastnosti kriterijní veličiny ve světle toho, že platí Ho-
(K4) Na základě teoretického rozdělení kriterijní veličiny stanovíme určitý interval hodnot, kam když padne empirická hodnota kritéria, tak nezviklá naše přesvědčení o platnosti Ho, ale eventuelní dopad hodnoty kritéria mimo tento interval nás povede k názoru, že byla překročena jistá kritická míra, takže usoudíme, že H0 neplatí. Kritickou míru zpravidla určujeme tak, aby pravděpodobnost výskytu chyby prvního druhu (tj. že rozhodneme, že H0 neplatí, když ve skutečnosti H0 platí) byla dostatečně malá, např rovna 0.05 (to se chyby prvního druhu dopustíme nejvýše v pěti procentech případů), ale ne příliš malá, aby nerostla možnost výskytu chyby druhého druhu (tj. že rozhodneme, že Ho platí, když ve skutečnosti Ho neplatí) do nerozumných rozměrů.
(K5) Porovnáme empirickou hodnotu kritéria s kritickou mírou. Pokud je kritická míra překročena (hodnota kritéria leží mimo interval nalezený v bodě 4), zamítáme hypotézu H0 ve prospěch alternativní hypotézy H\. Pokud není kritická míra překročena, hypotézu Ho nezamítáme.
Nyní ještě jednou definice chyby prvního a druhého druhu - pozor, je to důležité, protože je potřeba si tyto pojmy pamatovat nejen v příkladu o soudci, ale také v termínech zamítnutí nebo nezamítnutí Hq:
Tabulka 10.11: Čtyři možné výsledky statistického testu.
skutečnost: Ho platí skutečnost: H\ platí
rozhodnutí: H0 nezamítáme O.K. chyba 2.druhu
rozhodnutí: Hq zamítáme chyba 1. druhu O.K.
Další standardní označení se používá pro pravděpodobnost výskytu chyby 1.druhu (značí se a) a pravděpodobnost výskytu chyby 2.druhu (značíme 0).
10.1.2 Statistický test střední hodnoty binomického rozdělení
V tomto oddílku se pustíme do prvního typu statistického testu. Celý postup bude vysvětlen na příkladu:
MA 0008 - Teorie pravděpodobnosti
105
Příklad 10.2 Expert zaplacený prodejcem tvrdil, že o nový výrobek šamponu bude mít zájem 20 % zákazníků. Při průzkumu u 600 zákazníků jich o nový šampon projevilo zájem 135. Na hladině významnosti a = 0,05 testujte hypotézu H^že zájem o výrobek je zhruba stejný, jak expert předpokládal.
Řešení: Hladina významnosti a = 0,05 je právě pst výskytu chyby 1. druhu - tuto pst volíme na začátku, před provedením úsudku. Jedná se o jakési nastavení přísnosti-benevolence našeho úsudku; a se obvykle volí < 0,05. Projdeme pět kroků našeho usuzování, jak byly naznačeny v předchozím oddílku: nejprve ovšem provedeme nej důležitější krok našeho postupu - označíme X = počet zájemců o nový šampón z každých nezávisle dotázaných 600 lidí.
(Kl) Budeme rozhodovat mezi hypotézami
• Ho (= nulová hypotéza): odhad experta se shoduje zhruba s měřením, a tedy řečeno pomocí střední hodnoty: EX = 120.
• H\ (= alternativní hypotéza): skutečný zájem o šampon se od odhadu experta liší, tj. EX ^ 120.
Je okamžitě vidět, že v anketě X = 135, tj. zájem je „trochu větší než" dvacet procent ze 600 lidí, otázkou ovšem je kritická mez: můžeme pořád tvrdit, že zájem je zhruba 20 procent? Je-není průměrný zájem významně větší než 20 procent? O tom rozhodne tento statistický test.
(K2) Kritériem našeho rozhodování je veličina X = počet zájemců o nový výrobek ze 600 lidí.
V našem jediném měření je X = 135, ale bude tomu tak vždy? Je průměrný zájem skutečně větší než 120 ze 600 lidí?
(K3) Popišme chování veličiny X za předpokladu, že platí Hq - pokud platí Ho, veličina X má zhruba rozdělení Bi(N = 600, jo = 0,20).
To znamená, že X může nabývat hodnot 0,1, 2,..., 600 s pstí
P(k) = (6°°) • 0,2fe • 0,8600-fe.
(K4) Pro předem zvolené a = 0,05 najdeme kritické meze našeho rozhodování: Když počet zájemců bude podstatně větší nebo podstatně menší než 120, zamítneme Ho a prohlásíme, že platí H\. Vyjdeme z grafu pstní funkce pik): máme zde 601 pstí, jejichž součet je roven jedné. „Usekneme" na obou stranách tolik hodnot k, aby pst, že naměřená hodnota veličiny X ležela v intervalu {xm; xv), se rovnala hodnotě (1 - a), tedy 0,95:
106
Katedra matematiky PedF MUNI v Brně
-t-
V
to?
Nyní máme dvě možnosti: a) pracovat s binomickým rozdělení - při hledání xv musíme sečíst sumu asi čtyř set hodnot z obrázku, při hledání sto hodnot.
Počítači je to jedno, najde xm jako 0, 025-kvantil dané binomicky rozdělené veličiny, xv najde jako 0,975-kvantil.
b) Pokud bych neměli k dispozici počítač, ale jen tabulku distribuční funkce U-rozdělení, využijeme skutečnosti z minulé přednášky, že totiž rozdělení binomické lze dobře aproximovat pomocí rozdělení normálního. To provedeme nyní: namísto diskrétních 601 hodnot pstní funkce budeme pracovat se spojitou hustotou, kde najdeme xm, xv pomocí integrací, u kterých známe výsledky:
?(K>x,f)=°(«r
Pro výpočty budeme potřebovat dosadit střední hodnotu binomického rozdělení Np = 120 za /i, a rozptyl binomického rozdělení Np(l — p)) = 96 dosadit za a2. Způsobem popsaným u normálního rozdělení v minulé přednášce převedeme psti na psti vyjádřené rozdělením U a využijeme tabulky:
0,025 m = -1,96 xm = 120-l,96-\/96 = 100,8;
x — 120 /_
0,975 —íi—=— = +1,96 ==> xv = 120+1,96-V96 = 139,2.
(K5) Rozhodnutí našeho statistického testu:
X = 135 G {xm,xv) = (100,8; 139,2),
tedy Ho nezamítáme. Zájem o nový výrobek je zatím zhruba u 20% zákazníků. Neprokázalo se, že by zájem o nový výrobek byl statisticky významně jiný než u 20% zákazníků.
MA 0008 - Teorie pravděpodobnosti
107
(K6) Důležitá poznámka: interval spolehlivosti pro střední hodnotu binomického rozdělení: Vypracuj na přednášce, nebo doplň do skript!!! V roce 2024 snad bude minimálně nahráno na video.
10.1.3 Statistický test střední hodnoty průměru z normálního rozdělení
Příklad 10.3 Je známo, že počet bodů získaných souhrnně na testech z matematiky v průběhu prvního pololetí maturitního ročníku má normální rozdělení pro \i = 500 bodů a směrodatnou odchylku o = 100 bodů.
Firma KAPPA vyvinula program INTEL, jehož cílem je zlepšit znalosti matematiky u středoškolských studentů, zejména pak zlepšit výsledky testů v maturitním ročníku.
Chtějí svůj program INTEL otestovat, a proto náhodně vybrali 25 studentů z CR a program zaslali každému z nich. Po provedení testu z matematiky se ukázalo, že průměr ohodnocení daných 25 studentů je x = 540. Otázka zní: lze nyní říct, že program INTEL zlepšuje výkon v testu, nebo se jen náhodou vybralo 25 studentů s vyšším výkonnostním průměrem v matematice? Jedná se o „skutečný" výsledek (= lze jej zobecnit pro celou populaci?), nebo bylo vyššího průměru dosaženo jen díky náhodným faktorům? Tyto otázky nás přivádějí ke statistickému testu, který rozhodne.
(Kl) Hq: /i = 500 (program intel nemá vliv na zlepšení matematických schopností, tj. střední hodnota bodového ohodnocení testu celé populace studentů i po rozšíření programu všem (celé populaci) zůstane stejná).
Him. /i > 500 (jednostranný test - můžeme předpokládat, že program znalosti matematiky nezhoršuje).
(K2) Kritériem volíme právě veličinu X, která teoreticky popisuje průměr hodnot (= průměr náhodných naměřených hodnot).
(K3) Za předpokladu platnosti H0 má veličina X parametry
2 °2
[i-x = 500, a\ = — = 400 ==> ctt = 20.
(K4) Stanovená kritická ř7-hodnota je pro a = 0,05 rovna iío,95 = 1,64. Odtud kritická hodnota v rozměru veličiny X je
Xk = + o-T- 1,64 = 532,8;
108
Katedra matematiky PedF MUNI v Brně
íw, ^-wv ^ -^H
At*
(K5) Rozhodnutí testu: pokud příslušná ř7-hodnota průměru je > 1,64, zamítáme Ho na hladině významnosti a. V našem případě náhodná veličina X nabyla při měření hodnoty x = 540, tedy příslušná U-hodnota je u = 5402~0500 = 2 > 1,64. Proto zamítáme Ho a uzavíráme, že program „skutečně" zlepšuje matematické schopnosti studentů.
Poznámka. Souvislost statistického testu s pojmem podmíněné pravděpodobnosti: V průběhu právě dokončeného statistického testu jsme vlastně počítali podmíněnou pravděpodobnost P(X > 540|iío platí) (čti: pravděpodobnost, že X nabude hodnoty větší nebo rovny 540, pokud Ho platí; tomu, co v uvedeném zápisu následuje za svislou čarou, se říká podmínka; podmíněná pravděpodobnost je pak pravděpodobnost události zaznamenané před svislou čarou vypočtená za předpokladu, že platí podmínka. Protože a = 0,05 = P(X > 532,8|iío platí), je očividné, že
přesněji (viz obr. 10.16)
a = 0,05 = P(532,8 < X < 5A0\H0 platí) + P(X > 5A0\H0 platí) = S {A) + S{B).
Protože podmíněná pravděpodobnost P(X > 540|iío platí) = S(B) je menší než naše a = 0.05 = S (A) + S(B), uzavíráme, že něco z našich výchozích předpokladů nebylo správné - to „něco" je hypotéza H0- Samozřejmě, že kromě H0 jsme měli i další výchozí předpoklady, např. naše data mohla být ovlivněna tím, že
a) Náš vzorek 25 studentů nebyl náhodný (byl z výběrových škol).
b) Kolega při opisování dat omylem zapsal některá ohodnocení vyšší než ve skutečnosti.
Ale vlivy typu a),b) mohou být vyloučeny správným naplánováním a provedením měření, takže se v podobných případech většinou uzavírá, že nízká pravděpodobnost P(X > 5AO\Ho platí) je důsledkem toho, že nesprávný byl předpoklad platnosti Hq.
P{X> 5401H0 platí) < a;
MA 0008 - Teorie pravděpodobnosti
109
0.02
.015
0.01
.005
0
440 460 480 500 532.8 560
Obrázek 10.16: Ad př. 10.3 - hustota rozdělení veličiny X za předpokladu, že platí H0.
Příklad 10.4 Ředitel firmy KAPPA (data i situace viz předchozí příklad 10.3) zjistil, že konkurenční softwarová firma DELTA rovněž vyvinula program pro výuku matematiky (s názvem KILL). Zavolal si proto svého firemního psychologa a požádal ho, aby zjistil, který z obou konkurenčních programů INTEL a KILL je lepší, tj. který více zvyšuje úroveň matematických znalostí.
Psycholog získal kopie obou programů. První z nich předal 25 náhodně vybraným studentům, druhou jiným 30 náhodně vybraným studentům. Po provedení testu z matematiky získal od těchto studentů výsledky jejich ohodnocení a spočetl průměry příslušných hodnot. U programu INTEL xi = 600, u programu KILL x~2 = 575. Aby zjistil, do jaké míry je jeho měření reprezentativní a zda rozdíl průměrů není pouze náhodný (tj. způsobený např. tím, že program INTEL byl rozdán mezi studenty, kteří byli náhodou chytřejší, ale ne tím, že by INTEL byl lepší než KILL), sáhne ke statistickému testu.
(Kl) Ho: \i\ = /i2 (kdyby se oba programy distribuovaly celé populaci, výsledná střední hodnota ohodnocení by byla u obou stejná).
H±: \i\ [i2 (musíme použít oboustranný test, protože nevíme, který z programů
(K2) Testovým kritériem bude rozdíl náhodných veličin X1 — X2 s konkrétní naměřenou hodnotou x\ — x2 = 600 — 575 = 25.
(K3) Za předpokladu platnosti Ho je rozdělení kritéria X± — X2 normální, vypočteme jeho střední hodnotu a rozptyl:
je lepší).
E{Xi - X2) = EXi - EX2 = 111-112 = 0,
110
Katedra matematiky PedF MUNI v Brně
Dále
D(X1-X2) = DX1 + DX2 = DÍ—-Y/Xl\+D
30
1
30
1
)
10000
25
+
10000
30
a nás bude zajímat směrodatná odchylka ^/733,333 = 27,08. Při výpočtu jsme využili důležitý fakt rozptylu rozdílu dvou nezávislých veličin: rozptyly dílčích veličin sečteme, nikdy je neodečítáme; plyne to z faktu, že rozptyl funguje jako kvadratická odchylka, tedy konstanta (—1) vyjadřující rozdíl se při vytýkání před operátor rozptylu umocní na druhou.
(K4) Pro a = 0,05 jsou kritické řJ-hodnoty oboustranného testu stejné jako u oboustranného testu v kapitole ??: um = —1,96, uv = 1,96.
(K5) Rozhodnutí testu: příslušná ř7-hodnota
programy vyjdou svou kvalitou zhruba nastejno. Nenašlo se dost důkazů pro to, že by oba programy byly odlišné svou kvalitou.
Test v příkladu se liší od předchozího testu pouze krokem (K3), kde jsme museli určit rozdělení rozdílu dvou náhodných veličin.
x7 - - 0 _ 600 - 575 - 0 25 ~ 27
0,92 G (-1,96; 1,96)
NEzamítáme Hi
o
MA 0008 - Teorie pravděpodobnosti
111
10.2 Cvičení 10: úvod do statistických testů
Všechny příklady si připraví studenti - první trojice příklad 10.1, druhá trojice příkaldy 10.2+10.3, třetí trojice příklady 10.4+10.5.
Úloha 10.1 Stokrát jsme hodili kostkou, přitom 25-krát padla šestka. Testujte hypotézu Hq, že kostka je poctivá, tj. že pst, že na ni padne šestka, je rovna |, proti alternativní hypotéze, že pst se nerovná |. To na hladině významnosti a = 0, 05.
Úloha 10.2 Při průzkumu veřejného mínění v souboru 500 dotazovaných respondentů jich 180 vyjádřilo nespokojenost se svou poslední volbou v parlamentních volbách (tj. dnes by volili jinou stranu). Lze na základě tohoto průzkumu tvrdit, že 40% voličů je nespokojených se svou poslední volbou? Testujte na hladině významnosti a = 0,05, proveďte oboustranný test.
Úloha 10.3 (souvisí s příkladem 10.2) Kolik lidí z 500 dotazovaných respondentů by muselo vyjádřit nespokojenost se svou poslední volbou, abychom na hladině významnosti a = 0, 05 byli oprávnění tvrdit, že se počet voličů nespokojených ses svou poslední volbou významně liší od 40% (určitě obě meze, větší i menší)?
Úloha 10.4 Střední doba (=střední hodnota) bezporuchovosti činnosti určitého typu přístroje by měla být 1000 hodin. Přitom z dřívějších měření víme, že směrodatná odchylka doby bezporuchové činnosti jednoho přístroje je o = 100 hodin.
Z velké skupiny přístrojů jsme náhodně vybrali 25 kusů. Průměrná doba jejich bezporuchové činnosti byla 970 hodin. Je tím prokázáno, že celá skupina přístrojů už nevyhovuje požadavku, aby přístroje pracovaly 1000 hodin bez poruchy? To by znamenalo, že přístroje jsou vyráběny v horší kvalitě. Proveďte oboustranný test, a to na hladině významnosti a) a = 0,1, b) a = 0,2.
Úloha 10.5 Určete nejmenší hladinu významnosti, pro kterou bychom v příkladě 10.4 zamítli hypotézu Ho : /i = 1000. (Vlastně: máme určit p-hodnotu statistického testu v předchozím příkladu).
Výsledky některých úloh viz 14.10.
112
Katedra matematiky PedF MUNI v Brně
11 Týden 11
K přednášce 11 najdete v IS slajdy, ty vás provedou naprostým jádrem - text, který následuje, obsahuje trochu víc materiálu.
11.1 Nestranný a konzistentní odhad parametru rozdělení
Ve statistických testech v minulé kapitole jsme tiše předpokládali, že rozptyl a2 je známý. To ale ve skutečnosti většinou není pravda a my jej musíme odhadnout (= přibližně určit). Proto se nyní pustíme do trochy teorie a praxe v odhadování parametrů.
Příklad 11.1 Pět sad součástek o dvaceti kusech bylo podrobeno zkouškám extrémních teplot. U každé sady je v tabulce uveden počet součástek z daných dvaceti, které v teplotní zkoušce obstály:
z 20 obstálo Xj x,-x {x% - x)2
13 0 0
11 -2 4
12 -1 i
15 2 4
U 1 l
V tabulce už byla využita hodnota průměru | = 13. Ve třetím sloupci tabulky jsou
uvedeny čtverce odchylek od průměru, odkud spočteme empirický rozptyl (= průměr čtverců odchylek od průměru ... :-)):
s2 = -Y( Xl-x)2 = - = 2. 5 ^ ; 5
Jedná se o měření hodnot náhodné veličiny, kterou je možné popsat střední hodnotou /i a rozptylem a2. Ovšem tyto hodnoty neznáme - pokusíme se je odhadnout. Otázka zní: Jak dobrým odhadem pro [i je průměr x ? Jak dobrým odhadem pro a2 je empirický rozptyl s2 ?
Hodnoty x, s2 jsou různé pro různé soubory měření, při jejich popisu užíváme náhodné veličiny X\, X2, ..., X^ označované jako náhodný výběr. Zde v teorii odhadů je potřeba tento i následující pojmy uvést přesně.
Definice 11.1 Říkáme, že veličiny X\, X2, ..., X^ tvoří náhodný výběr rozsahu N
z rozdělení pravděpodobnosti o distribuční funkci F(x), pokud
a) jsou navzájem nezávislé;
b) mají stejné rozdělení pravděpodobnosti zadané distribuční funkcí F(x).
Třeba v příkladu 11.1 je x\ = 13, ale stejně dobře jsme mohli naměřit x\ = 10 nebo xi = 17 — tuto náhodnost prvního měření reprezentuje náhodná veličina X\, které nepřiřazujeme žádnou konkrétní hodnotu, pouze jsme si vědomi, že pod (velkým písmenem) X\ se mohou skrývat různé hodnoty. Podobně se mohou skrývat různé hodnoty pod veličinami X2, .. ., X^.
MA 0008 - Teorie pravděpodobnosti
113
Definice 11.2 Libovolnou funkci T/v := T(Xi,X%, ■ ■ ■ ,X^) nad náhodným výběrem X\, Xi, .. ., Xn nazveme statistikou. Specielně
a) Statistiku
— 1 N
i=i
nazveme výběrovým průměrem;
b) Statistiku
— 1 N —
i=i
nazveme výběrovým rozptylem.
Pokud do statistiky T/v dosadíme konkrétní naměřené hodnoty X\, x2, • • • , %Ni dostaneme hodnotu r/v = t( X\, x2, . . . , X]y ), která se nazývá realizací statistiky Tn.
Například pokud dosadíme do vzorců 11.1, 11.2 konkrétní hodnoty měření xl5 dostaneme realizaci x výběrového průměru X a realizaci s2 výběrového rozptylu S2.
No a nyní nás bude zajímat, jak dobrým odhadem neznámé střední hodnoty /i veličiny X je realizace x výběrového průměru X (respektive jak dobrým odhadem neznámého rozptylu a jsou realizace s2, s2 veličin S2, S2).
Definice 11.3 Statistiku Tn nazveme nestranným odhadem parametru 7, pokud ETN = 7 (střední hodnota veličiny TN je rovna hodnotě parametru ry).
Vysvětlení pojmu nestrannosti pomocí konkrétních hodnot měření: pokud budeme opakovaně měřit hodnoty xi:i, x2íl, ..., xN^ a opakovaně počítat realizace tN,i = t(xi:i, x2:i, .. •, xn,í) nestranného odhadu T/v parametru 7 pro i = 1,2,... ,n,..., bude platit vztah
Ař|Š'")Ě(,"5,t!|)=1 (11-3)
platí pro každé malé pevně zvolené reálné kladné e.
Laicky řečeno, pokud T/v je nestranným odhadem parametru 7 rozdělení veličiny X, tak pro rostoucí n (= rostoucí počet realizací r/v,0 je průměr realizací ^ Jľľ=i^,i skoro jistě (= s pravděpodobností rovnou jedné) stále blíže hodnotě 7.
Jinými slovy, nestrannost zaručuje takovou konstrukci vzorce pro T/v, která bere v úvahu všechny možné dostupné realizace ŕ/v,i a nestraní žádné z nich - pro rostoucí počet realizací se aritmetický průměr těchto realizací skoro jistě blíží neznámé hledané hodnotě 7.
114
Katedra matematiky PedF MUNI v Brně
Definice 11.4 Statistiku nazveme konzistentním odhadem parametru 7, pokud
posloupnost náhodných veličin (T/v)5v=i konverguje k hodnotě parametru 7 podle pravděpodobnosti, tj.
lim P (T/v G (7 — e; 7 + e)) = 1 (11.4)
N-¥00
platí pro každé malé pevně zvolené reálné kladné e.
Laicky řečeno, pokud T/v je konzistentním odhadem parametru 7 rozdělení veličiny X, tak pro rostoucí N (= rostoucí počet měření pro výpočet jedné realizace) je hodnota t^ skoro jistě (= s pravděpodobností rovnou jedné) stále blíže hodnotě
7-
Jinými slovy, konzistence zaručuje takovou konstrukci vzorce pro T/v, která je konzistentní (= česky: důsledná) v tom ohledu, že pro rostoucí počet měření při výpočtu jedné realizace se tato realizace skoro jistě blíží neznámé hledané hodnotě 7.
Uvedené definice nyní osvětlíme konkrétně při hledání odhadu střední hodnoty /i a rozptylu a2 veličiny X s normálním rozdělením pravděpodobnosti.
Věta 11.1 Pokud náhodná veličina X má konečnou střední hodnotu \i, tak výběrový průměr X je nestranným a konzistentním odhadem \i.
Skutečně, v minulé kapitole bylo spočteno, že
a) = EX = Ejj ^2*Xl = ji, tj. střední hodnota náhodné veličiny X je rovna parametru /i; tedy odhad X je nestranným odhadem střední hodnoty \i.
b) 4 = rJX = r4 ^X, = 77 a platí
2
lim DX = lim %- = 0,
tj. limita rozptylu odhadu X pro rostoucí počet měření je rovna nule - jinými slovy, realizace odhadu X se pro rostoucí počet měření skoro jistě blíží hodnotě /i, čili X je konzistentním odhadem hodnoty \i.
Čili vzorec pro průměr hodnot x funguje přesně tak, jak potřebujeme - „nestraní" konkrétnímu měření a „skoro jistě" směřuje přímo k určení střední hodnoty /i, a dále je konzistentní (= důsledný) v tom smyslu, že průměr tisíce hodnot je „skoro jistě" lepší odhadem /i než průměr stovky hodnot.
Otázkou nyní je najít nejvhodnější odhad pro neznámý rozptyl a2 veličiny X. Máme k dispozici hodnotu S2 jako míru vychýlení od průměru - je ona tím nejvhodnějším odhadem hodnoty a2?
MA 0008 - Teorie pravděpodobnosti
115
Věta 11.2 Pokud náhodná veličina X má konečnou střední hodnotu [i a konečný rozptyl a2, tak nestranným a konzistentním odhadem rozptylu a2 veličiny X je výběrový rozptyl
i=i
Při vysvětlení obsahu předchozí věty začněme nejprve u odhadu S2 zopakováním vzorce - při vysvětlování významu rozptylu v popisné statistice bylo (snad) řečeno, že empirický rozptyl s2 lze vyjádřit buď z definice jako
N
„2 _
~ N
i=i
nebo po úpravách ve tvaru praktičtějším pro výpočet (= průměr čtverců minus čtverec průměru)
*2=(^Í>2)--2- (11-6)
N
Při matematickém popisu nyní musíme konkrétní měřené hodnoty ve vzorcích nahradit náhodnými veličinami s velkými písmeny a dostáváme
1 N —
i=i
respektive
N
Sz= I ^> X2\ -X2. (11.8)
N
i=i
a) Užijeme nejprve úvah kapitoly předchozí, že totiž o2 = EX2 — ji2, a dále platí =
_2
EX — ir. Vypočtěme střední hodnotu veličiny S2:
E* = E (i £ *? - = jf (E BX!) - EX* =
= ^(£("2+/<2))-(<4+/<2) =
2,2 2 2 2 2 2 a2 N — 1 2
= a +ii -a^-iL =o -o^ = a - — = • a .
Čili střední hodnota statistiky S2 není rovna odhadovanému parametru a2, to znamená, že S2 není nestranným odhadem rozptylu a2. Zkrátka a dobře vzoreček 11.7 není dobře zkonstruován, protože jeho realizace s2 jsou vždy trochu menší než neznámá hledaná hodnota a2
116
Katedra matematiky PedF MUNI v Brně
až na patologické případy a2 = 0 a a2 = oo, které nás nezajímají (matematicky jsou takové náhodné veličiny zkonstruovatelné, ale v praxi měřené veličiny mají vždy konečný kladný rozptyl). Ale k nalezení nestranného odhadu už máme jen krok - můžeme se totiž poučit z výpočtu E S2. Pokud vynásobíme S2 konstantou
N
N-
j (označme novou veličinu S2):
S2:=j-----S2, (11.9)
tak dostaneme
Ešs = JL..ES> = JL..Ľ-í.^ = a>,
N-l N-l N
čili S2 už je nestranným odhadem hodnoty a2. b) Dá se ukázat, že S2 je i konzistentním odhadem rozptylu a2, což plyne z faktu, že
lim (jfj = 0, ale to zde už podrobně provádět nebudeme.
Dále budeme jako nestranný a konzistentní odhad rozptylu a2 veličiny X užívat tedy statistiku S2. Má tedy ještě nějaký smysl „stará a překonaná" hodnota S27 Vrátíme-li se k příkladu 11.1, kde s2 = 2, lze vypočíst s2 = | • 2 = 2,5.
1. Hodnota s2 = 2 má svou váhu - vyjadřuje rozptyl souboru uvedených pěti měření. Jedná se o empirický rozptyl - rozptyl naměřených hodnot.
2. Skutečný rozptyl a2 veličiny přeživších součástek je větší než rozptyl měření u pěti sad - proto je s2 = 2,5 jeho vhodnějším odhadem.
V příkladu 11.1 můžeme uzavřít, že počet přeživších součástek ze sady dvaceti při extrémní teplotní zátěži lze popsat normálním rozdělením s parametry /i = x = 13, a2 = s^ = 2,5.
Jednoduše řečeno, rozptyl s2 vypočtený z několika naměřených hodnot je vždy o něco menší než skutečný rozptyl a2 měřené veličiny. Proto při odhadu a2 musíme vypočtené s2 „trochu zvětšit" vynásobením členem
Další možný tvar vzorce pro S2 lze získat po úpravách s využitím 11.8 a vztahu X =
TP = JL..s>= N
r UŽ*-MM')-
N-l N
a tedy po vykráčení konstantou N a roznásobení závorky dostaneme
MA 0008 - Teorie pravděpodobnosti
117
Definice 11.5 Výraz s s := ^2(xt — x)2 budeme nazývat součet čtverců měření veličiny X.
Při tomto označení platí
S2 = jj-SS (11.11)
a zejména
Š2 = —— -SS. (11.12) N -1 v J
S pojmem součtu čtverců nadále pracuje tzv. analýza rozptylu (ANOVA = ANalysis Of Variance), která se zabývá dalšími statistickými testy zkoumajícími rozptyl (pracuje většinou s tzv. F-rozdělením). Na tu ovšem v tomto kursu už nezbývá prostor.
Podle okolností budeme při výpočtu S2 užívat vzorec 11.2, 11.9, 11.10 nebo 11.12.
Zbývá ještě vyjádření k takzvanému počtu stupňů volnosti odhadu.
Příklad 11.2 Kdybych vám řekl, abyste mi nadiktovali pět reálných čísel, a nedal žádnou další podmínku nebo omezení, mohli byste říct čísla, jaká chcete, například
0,70,314,32,100.
Máte svobodu volby, která čísla vybrat. Jinými slovy, máte pět stupňů volnosti, protože si zcela svobodně a volně vybíráte pět čísel.
Kdyby ale úkol zněl: Nadiktujte mi pět čísel, jejichž průměr je 25, trochu bych vaši volnost omezil - první čtyři čísla byste mohli volit libovolně, například
0,70,314,32,
ale páté číslo je mým požadavkem jednoznačně určeno. Aby průměr pěti čísel byl 25, jejich součet musí být roven 5 • 25 = 125, tj. páté číslo musí být rovno 125 — 416 = —291. Tuto druhou úlohu lze charakterizovat tím, že stupeň její volnosti je 4.
Čili obecně pro N hodnot, u kterých je předem dán jejich průměr, zbývá N — 1 stupňů volnosti.
Podobná situace se objevuje i při odhadování rozptylu populace: Uvažujeme-li soubor měření N hodnot jisté veličiny X, z nich lze určit průměr x. Chceme-li dále odhadnout rozptyl pro tuto konkrétní (už určenou) hodnotu x, máme už jen N — 1 stupňů volnosti (ve vzorci pro s2 hodnotu x potřebujeme znát, protože při určení s2 počítáme totiž míru vychýlení měření právě od hodnoty x).
118
Katedra matematiky PedF MUNI v Brně
Tedy třeba v příkladu 11.1 má odhad rozptylu s2 = 2,5 čtyři stupně volnosti.
Tento přístup určení počtu stupňů volnosti lze užít i na některé další situace v tomto textu. Obecně platí:
Počet stupňů volnosti odhadu = počet měření minus počet parametrů odhadnutých již dříve.
11.2 r-test typu =konstanta"
Příklad 11.3 Je známa následující grafická iluze (viz obr. 11.17), že totiž úsečka a se zdá delší než úsečka b (počítá se délka bez koncových šipek), i když ve skutečnosti jsou obě úsečky stejně dlouhé.
Obrázek 11.17: K př. 11.3: Grafická iluze: délky úseček a, b jsou stejné.
Chceme nyní experimentem ověřit, že úsečka typu a se zdá pozorovateli delší sama o sobě, bez porovnání s úsečkou h. Náhodně vybraným pěti lidem jsme na deset sekund ukázali úsečku a dlouhou 6 cm. Poté jsme je požádali, aby úsečku dané délky nakreslili, a změřili jsme její délku. Byla získána data x\ = 8, x2 = 11, x% = 9, x4 = 5, x5 = 7.
Průměr těchto dat je x = 8 cm. Chceme testovat hypotézu, že střední hodnota /i celé
lidské populace při ohodnocení délky úsečky je významně větší než její skutečná délka 6
cm. V této situaci neznáme rozptyl a2 měřené veličiny a musíme jej odhadnout pomocí
s2. Pak testovacím kritériem nebude _
x — 6
ťT '
MA 0008 - Teorie pravděpodobnosti
119
ale tzv. rozdělení t s hodnotou vypočtenou podle vztahu
r:=^-^,kdeŠ = V7^.
Toto ŕ-rozdělení odvodil jistý pan William Sealy Gosset - ovšem příslušný článek uveřejnil nikoli pod svým vlastním jménem, ale pod jménem Student, a rozdělení je tedy známo pod názvem Studentovo r-rozdělení.
Hustota r-rozdělení závisí na počtu v stupňů volnosti, se kterými se určí odhad rozptylu S2, a má tvar
íAx) ~
podle toho, zda se čtenáři více líbí funkce
(3(p,q) = í u1'? ■ (l-^Wu Jo
(tzv. /3-funkce), nebo funkce
T(r) = / ur~x -e-udu Jo
(tzv. T-funkce). Přechod mezi jednotlivými verzemi vzorce hustoty plyne ze vztahu mezi /3-funkcí a T-funkcí
T{p + q)
a z jedné další drobnosti, že totiž T(|) = \/Ťr. Funkce fv(x) Je opět jedna z funkcí, kterou by člověk nerad potkalpozdě na ulici při návratu domů, ale ukazuje se, že i takové funkce jsou užitečné.
Uveďme zde některé vlastnosti r-rozdělení, které budeme využívat:
a) Hustota fv je symetrickou funkcí vzhledem k ose y, tj. je sudá: platí fv{x) = fv{—x).
b) Kritická r-hodnota je dále od počátku než kritická ř7-hodnota, protože r-rozdělení je
odvozeno při neznámém rozptylu, tj. zahrnuje větší míru náhodnosti a nejistoty než U-rozdělení (veličina t má větší rozptyl než veličina U). Hustota rozdělení t je „nižší a širší" než hustota rozdělení U.
c) Cím lepší je náš odhad neznámého rozptylu a měřené veličiny, tím více se r-rozdělení
bude podobat ř7-rozdělení. A odhad rozptylu bude tím lepší, čím vyšší je počet měření N (tj. čím vyšší je počet stupňů volnosti u).
Vlastnosti b), c) lze znázornit graficky porovnáním ř7-rozdělení s ŕ-rozdělením o různém počtu u stupňů volnosti - (hustota ř7-rozdělení je v obrázcích znázorněna plnou čarou, hustota r-rozdělení čárkovanou čarou):
120
Katedra matematiky PedF MUNI v Brně
v = 60
Z obrázku je vidět, že pro rostoucí počet stupňů volnosti se hustota r-rozdělení (v obrázku její graf vyznačen slabě) svým tvarem stále více blíží ke tvaru funkce hustoty ř7-rozdělení, a pro v = 60 je hustota r-rozdělení prakticky totožná s hustotou ř7-rozdělení (omlouvám se za malou tloušťku čar, ale při silnější tloušťce nebyl na obrázku patrný rozdíl mezi čárkovanou a plnou čarou).
d) Pro určení kritických hodnot tk budeme potřebovat hodnoty integrálů
px PX
Pv{t 6.
(K2) Testovým kritériem bude výběrový průměr X, jehož realizaci x = 8 převedeme na t-hodnotu
8-6 estery
(„est" označuje odhad, z anglického „estimate" [estimitj - protože v dalším textu budeme odhadovat odchylku i pomocí jiných funkcí než X, bude výhodné si tímto označením připomenout, u které veličiny vlastně odchylku nebo rozptyl odhadujeme).
(K3) s2 = 5, a tedy
2 š2" 5 1 esrov = — = _ = 1, x N 5
přičemž počet stupňů volnosti odhadu je N — 1 = 5 — 1 =4, tj. za předpokladu platnosti Hq má veličina Studentovo t-rozdělení pro v = 4.
(K4) Příslušná kritická hodnota tk je na průsečíku řádku u = 4 a sloupce pro a = 0,05 (u pravostranného testu), tj. tk = 2,132.
(K5) = 2 < tk = 2,132 => Hq nezamítáme, nenašli jsme dostatek důkazů pro
potvrzení iluze větší délky.
11.3 Několik poznámek ke statistickému testu
Poznámka A) Logika formulace „nezamítáme i/0" V právě dokončeném příkladu bylo odpovědí „hypotézu Ho nezamítáme". Logiku této formulace snad osvětlí následující příklad.
Příklad 11.4 Když něco někde nenajdu, neznamená to, že to tam není.
S nástupem lyžařské sezóny pan Loftus začal oprašovat svou výstroj a zjistil, že nemůže najít své lyžařské brýle, i když prohledal celý byt. Potom jej ovšem zděsila představa, že si za dva tisíce bude muset koupit brýle nové, a celý byt prohledal ještě jednou, a to důkladněji. Nakonec brýle našel v zadním rohu své skříně!!
Tento příklad je ilustrací jednoho celkem logického principu: pokud naleznu hledaný předmět, určitě vím, že tam je. Ale pokud jej nenaleznu, může to znamenat buď že tam není, nebo že tam je, ale mé hledání nebylo dost důkladné (nemělo dostatečnou sílu).
124
Katedra matematiky PedF MUNI v Brně
Testování hypotéz je také takovým hledáním - hledáme vliv jedné veličiny na druhou veličinu. Pokud nalezneme tento vliv (zamítáme Ho), víme „s jistotou" (na hladině významnosti a), že existuje. Pokud vliv nenalezneme, může to znamenat buď že tento vliv neexistuje, nebo že existuje, ale síla testu nebyla dostatečná pro jeho nalezení.
Výsledek „zamítáme Hqu má docela pevný logický základ (pro a = 0,05 platí s pravděpodobností 95%). Ale říct v případě, kdy nebyla překročena kritická hodnota, že „Ho přijímáme" nebo „Ho platí", je příliš ukvapené, protože při důkladnějším hledání by se mohlo ukázat, že určitý vliv existuje, tj. Ho neplatí. Ustálilo se tedy rčení „nezamítáme Ho11, které odpovídá jisté opatrnosti v učinění konečného závěru.
Fráze „nezamítáme H0íl je tedy opatrným vyjádřením, které je zcela na místě. Znamená to, že říkáme: „Výsledky testu nám neposkytují dostatečné důkazy k závěru, že Hq neplatí."
K příkladu 11.4: Co by to znamenalo, kdyby pan Loftus provedl tak důkladné hledání, že by obrátil celý byt naruby, ale přesto brýle nenašel? Stále by existovala jistá malá šance, že je přehlédl v nějaké zapadlé škvíře, ale protože je nenašel, bylo by rozumné koupit nové.
Podobně i experiment provedený v úžasné síle a rozsahu, pokud neprokáže vliv nezávislé proměnné na závislou proměnnou, nás vede k závěru, že „je rozumné přijmout Ho11.
Příklad 11.5 Chceme otestovat kvalitu jisté techniky pamatování. Vybereme náhodně dvě skupiny lidí. Oběma skupinám je předložen jistý počet navzájem nesouvisejících slov k zapamatování (například 20 slov). Poté jsou lidé z první skupiny okamžitě vyzkoušeni, kolik slov si zapamatovali. Lidé ze druhé skupiny jsou vyzkoušeni až o týden později. Čili nezávislou proměnnou je doba pamatování, závislou proměnnou je počet zapamatovaných slov z daných dvaceti. Stanovíme hypotézy testu:
Ho', počet zapamatovaných slov nezávisí na době pamatování (technika zapamatování byla tak dobrá, že po týdnu si pamatuji stejně dobře jako po bezprostředním naučení slov).
Him. počet zapamatovaných slov závisí na době pamatování (= době držení slov v paměti).
Pokud v testovaných skupinách bude například jen v každé pět lidí a vliv se neprokáže, můžeme uzavřít, že Ho platí, tj. že technika učení je vynikající? Asi ne, protože právě zde bychom se mohli dopustit té chyby, že jsme vliv nenašli, i když je možné, že existuje. Na druhé straně pokud by v každé z testovaných skupin bylo 10000 lidí a stále by se neprokázala existence závislosti, závěr „H0 platí" by asi byl docela rozumný.
Poznámka B) Snížení rozptylu zvyšuje sílu testu V příkladu 11.5 lze vidět jednu celkem přirozenou skutečnost, že totiž výpovědní síla statistického testu se zvyšuje se zvýšením počtu měření. Pro připomenutí síla testu je pozitivní pojem - je to pravděpodobnost, se kterou správně zamítneme Ho, pokud platí H\. Je to tedy jakási síla nalezení vlivu mezi proměnnými testu. Na tuto sílu má především vliv rozptyl neboli
MA 0008 - Teorie pravděpodobnosti
125
.2
4
N
(11.13)
Cokoli, co snižuje rozptyl a^, zvyšuje současně i sílu testu. Jedním činitelem je počet měření N - je vidět ze vzorce, že pokud zvyšujeme N, zvyšuje se hodnota jmenovatele ve zlomku, a tím klesá hodnota rozptylu. Další možností, jak snížit rozptyl, je snížit přímo hodnotu rozptylu a2 celé populace v čitateli zlomku. Pokud si říkáte, že a2 je dáno a nelze je přece měnit, máte pravdu. Ale stejně některé vlivy na rozptyl a2 celé populace můžeme vyloučit vhodným naplánováním experimentu.
Příklad 11.6 Experimentem se má zjistit, zda alkohol v krvi má vliv na reakční dobu řidiče. Náhodně byly vybrány dvě skupiny lidí. První skupině je nabídnut alkohol ve formě ginu s tonikem, druhé skupině pouze tonik. Pak jsou všichni podrobeni měření reakční doby. Testovaný člověk sedí u stolu a před sebou má lampu s červenou žárovkou a tlačítko. Lampa se rozsvěcuje v různých nepravidelných intervalech - jakmile se rozsvítí, je úkolem testovaného co nejrychleji stisknout tlačítko. Je změřena jeho reakční doba (v milisekundách). U každého člověka se měření několikrát opakuje, a pak je vypočten průměr jeho reakční doby.
Samozřejmě uvnitř každé ze skupin se projeví určitá variabilita v průměrné době reakce. Ta je dána různými faktory, z nichž některé nemůžeme ovlivnit, ale jiné ano. Mezi neovlivnitelné faktory patří:
1. Nálada člověka během měření (špatná nálada = delší doba reakce).
2. Osobní předpoklady - někdo má prostě schopnost rychlejší reakce než ostatní.
3. Postoj člověka vůči experimentu (znuděný postoj = delší doba reakce). Mezi ovlivnitelné faktory lze zahrnout
1. Teplotu v místnosti, kde se provádí měření (extrémní teploty => delší doba reakce).
2. Vlhkost v místnosti, kde se provádí měření (vyšší vlhkost => delší doba reakce).
3. Pohlaví (u žen ... kratší doba reakce). 4- Věk (vyšší věk ... kratší doba reakce).
5. Cas dne (měřenípozdě odpoledne ... delší doba reakce).
Některé faktory rozptylu hodnot můžeme významně ovlivnit - jak výběrem sledované populace (omezení se na stejné pohlaví a věk eliminuje rozdíly způsobené těmito faktory), tak zajištěním stejných podmínek měření (stálá vlhkost a teplota místnosti, měření u všech ve stejnou denní dobu). Tímto způsobem plánování a provedení experimentu pak následný statistický test získá větší výpovědní sílu v těch parametrech, které jsou pro nás důležité, a není zkreslen rozdíly v těch ovlivnitelných faktorech, které nás nezajímají.
126
Katedra matematiky PedF MUNI v Brně
11.4 Interval spolehlivosti pro střední hodnotu \x průměru X
Kromě statistických testů jsou při zpracování měření často užitečnější tzv. intervaly spolehlivosti. V této fázi výkladu se seznámíme s intervalem spolehlivosti pro střední hodnotu EX = /i průměru z normálního rozdělení.
11.4.1 Interval spolehlivosti pro [i při známém rozptylu
Střední hodnotu /i měřené veličiny obyčejně neznáme. Kdybychom ji znali, nemusíme provádět ani měření, ani statistický test Určit /i je v podstatě naším cílem.
Jakýmsi odhadem střední hodnoty je výběrový průměr X. Ovšem tento průměr (zejména při nižším počtu měření N) není přesně roven střední hodnotě /i - vlastně víme, že platí P{X = /i) = 0. Potřebovali bychom spíše najít nějaký interval (X — a; X + a) pro nějaké vhodné a „ne příliš velké" a > 0. A to bude vlastně interval spolehlivosti pro střední hodnotu ji. Přesněji řečeno, r%-ní interval spolehlivosti pro střední hodnotu ji průměru X je takový interval, který obsahuje ji s pravděpodobností
r
100*
Příklad 11.7 Životnost 75-wattové žárovky má normální rozdělení se směrodatnou odchylkou o = 25 hodin. U náhodně vybraného vzorku dvaceti žárovek byla naměřena průměrná životnost x = 1024 hodin. Utvořte 95%-ní interval spolehlivosti pro střední hodnotu /i průměrné životnosti.
Řešení tohoto příkladu je instruktivní, proto si dovolím vypnout kurzívu (:-)). Každý interval spolehlivosti je velmi úzce svázán se statistickým testem. Budeme se zabývat zejména oboustrannými intervaly spolehlivosti, proto v našem příkladu je zde vazba na oboustranný U-test s hypotézami
Hq: h = hq (skutečnou střední hodnotu /io neznáme).
Pokud hledáme 95%-ní interval spolehlivosti, je příslušná hladina významnosti a = 0,05. Kritériem testu je výběrový průměr X. Dále vezmeme v úvahu počet měření pro výpočet průměru:
a _ 25
Jak je dobře známo ze BMA3, příslušné kritické hodnoty v tomto případě jsou
usl = —1,96, -ui_a = 1,96. 2 ' ' 2 '
Obě tyto hodnoty lze převést na kritické hodnoty vzhledem k veličině X:
-1,96 = Xm xm = iA0 - 1,96 • 5,59 = ii0 - 10,96;
5,59
MA 0008 - Teorie pravděpodobnosti
127
1,96 = ——— xv = no + 1,96 • 5,59 = n0 + 10,96.
5,59
Interval pro „nezamítnutí Hqu je pak
~X g (/j-o — 10,96; jiQ + 10,96). (H-14)
Ovšem hodnotu /io neznáme. Ale pokud ze vzorce 11.14 vyjádříme místo X hodnotu /Iq, dostaneme vztah pro interval spolehlivosti:
/j-o g (X — 10,96; ~X + 10,96) . (11.15) Odtud pro jednu realizaci x = 1024 dostaneme
Vo g (1024 - 10,96; 1024 + 10,96) = (1013,04; 1034,96), se spolehlivostí 0,95, což je odpověď příkladu 11.7. Obecně s využitím symetrie
lla = —-Ui_a
2 2
lze (1 — a) ■ 100%-ní interval spolehlivosti pro střední hodnotu ji při známém rozptylu psát ve tvaru
li g (X - iíi_| • <7T;X + iíi_| • aY) ■ (11.16)
V některé literatuře se objevuje kromě pojmu „interval spolehlivosti" ještě pojem „konfidenční interval" - to je jen nesprávný (nebo jiný) překlad anglického termínu „confidence interval", ale jedná se o totéž (překladatelé se zase jednou nedomluvili ... :-)).
Pojem intervalu spolehlivosti úzce souvisí se silou příslušného statistického testu - jak už to vyplývá ze vzorce 11.16, čím větší je síla příslušného statistického testu, tím menší je rozptyl a^, a tím užší je interval spolehlivosti.
11.4.2 Interval spolehlivosti pro ji při neznámém rozptylu
Příklad 11.8 Uvažujme stejnou situaci jako v příkladu 11.7 (N = 20, x = 1024J, pouze odchylka a není známá a musíme ji odhadnout - tedy z měření životnosti u dvaceti žárovek byl vypočten rozptyl s2 = 625. Odtud
esto% = — = — = 31,25. x N 20
Tedy esta-^ = ^31,25 = 5,59 - toto číslo je stejné jako v příkladu 11.7, ovšem nyní se nejedná o přesnou hodnotu, ale odhad, čili zde bude v = N — 1 = 19 stupňů volnosti odhadu. Nalezněte 95 %-ní interval spolehlivosti pro střední hodnotu \i výběrového průměru X.
s2 625
128
Katedra matematiky PedF MUNI v Brně
V příslušném statistickém testu použijeme nyní ŕ-rozdélení - nalezneme kritické hodnoty pro oboustanný test (a = 2q = 0,05) a pro v = 19 stupňů volnosti (tabulka 11.12): tv = 2,093, odtud tm = -2,093.
Hypotézy Ho, H\ a kritérium oboustranného testu zde zůstávají stejné jako v 11.7: Ho : \i = Ho, H\ : /i ^ /io, kritériem je výběrový průměr X. Přepočteme nyní kritické hodnoty vzhledem k veličině X:
-2,093 = Xm xm = iA0 - 2,093 • 5,59 = /i0 ~ 11,7;
5,59
2,093 = Xv ~ ^° ^ = ^0 + 2,093-5,59 = ^0 + 11,7.
5,59
Nyní interval pro „nezamítnutí H0íl je
~X g (no — 11,7; Ho + 11,7), (11.17) nás ovšem zajímá spíše tvar (rychle jej naň převedem)
Vo g (X - 11,7;X + 11,7) . (11.18)
Odtud pro příklad 11.8 se spolehlivostí 0,95 a realizaci (= konkrétní měření) průměru x = 1024 dostaneme
Vo g (1024 - 11,7; 1024 + 11,7) = (1012,3; 1035,7),
Vidíme, že při větší míře nejasnosti, kdy rozptyl neznáme a musíme jej odhadnout, je interval spolehlivosti širší (ostatní hodnoty v příkladech 11.7 a 11.8 jsou stejné, takže lze opravdu provést porovnání).
Obecně s využitím symetrie
t°L = —ri_«
2 2
lze (1 — a)-100%-ní interval spolehlivosti pro střední hodnotu ji při neznámém rozptylu psát ve tvaru
[i g (X - ri_a • esta-x; X + ri_a • estery) . (11.19)
11.4.3 Několik důležitých poznámek k intervalům spolehlivosti
Následuje několik poznámek k intervalům spolehlivosti, každá z nich je důležitější než ty ostatní ... :-)
MA 0008 - Teorie pravděpodobnosti
129
a) Vztah mezi intervalem spolehlivosti a pravděpodobností. Je potřeba říci něco velmi důležitého k formulaci „95%-ní interval spolehlivosti pro střední hodnotu ji obsahuje tuto hodnotu s pravděpodobností 0,95". Věta je vyslovena správně ale může být zavádějící - a problém pochopení souvisí s pojmem statistika a realizace statistiky (viz definice 11.2). Interval spolehlivosti je totiž vlastně intervalem, jehož mezemi jsou náhodné veličiny. A pak pro konkrétní měření dosadíme do vzorců 11.16, 11.19 konkrétní realizaci x. Třeba v příkladu 11.7 interval (1013,04; 1034,96) neznámou střední hodnotu ji buď obsahuje (stoprocentně), nebo neobsahuje (stoprocentně).
Souvislost s pravděpodobností se projeví pouze při opakovaném měření a opakované konstrukci realizace intervalu spolehlivosti: pokud bychom například tisíckrát zopakovali experiment změření životnosti u dvaceti žárovek, spočetli tisíc různých realizací xi, x~2..., ^íooo a sestrojili tisíc různých realizací intervalu spolehlivosti podle vzorce 11.16, tak přibližně 95% těchto intervalů (tj. asi 950 z nich) bude neznámou hodnotu /i obsahovat, zbylých pět procent ji obsahovat nebude.
V dalších výpočtech realizací intervalů spolehlivosti pro x budu slovo „realizace" vynechávat, takže pojem interval spolehlivosti se středem v X (středem intervalu je nikoli konkrétní hodnota, ale náhodná veličina) bude splývat s pojmem realizace intervalu spolehlivosti se středem v x (středem intervalu je konkrétní číslo). Matematicky je mezi těmito dvěma pojmy rozdíl, ale v praxi pod intervalem spolehlivosti máme na mysli vždy konkrétní interval vypočtený na základě měření.
b) Jednostranné intervaly spolehlivosti. Pozorný čtenář by možná mohl položit otázku: no dobrá, oboustranný interval spolehlivosti odpovídá jistému oboustrannému statistickému testu (příklad 11.7) - pokud se ale týká jednostranných testů (například test grafické iluze 11.3), existuje také u nich nějaký analogický jednostranný interval spolehlivosti? Odpověď zní „ano, existuje". Jeho odvození je analogické, proveďme jej například pro data testu grafické iluze 11.3:
Ho : /i = fiQ, H\ : /i > /io, kritériem je X, kritickou hodnotu použijeme přesně tu stejnou jako v daném pravostranném testu: tk = 2,132. Převodem normovaného tvaru kritické hodnoty do tvaru aktuálního vzhledem k veličině X dostaneme
!!!! :-)
2,132
xk — 1^0 1
^xk = fi0 + 2,132 • 1 = fi0 + 2,132;
tedy interval pro „nezamítnutí Hqíi je
X G (-00^0 + 2,132)
(11.20)
ale protože nás zajímá spíše interval pro /io, tak z tohoto vztahu vyjádříme ohraničení pro /iq a index 0 vypustíme:
130
Katedra matematiky PedF MUNI v Brně
ji G (X — 2,132; oo) = (5,868; oo) (11.21)
a to je hledaný interval se spolehlivostí 0,95. Vidíme, že oboru 11.20 pravostranného testu odpovídá levostranný interval spolehlivosti 11.21.
I když jsou tedy jednostranné intervaly spolehlivosti zcela přirozené a možné, v dalším textu se na ně nebudeme příliš zaměřovat - spíše nás bude zajímat vymezení pro /i na intervalu konečné délky. Tedy i když budeme provádět jednostranné statistické testy, intervaly spolehlivosti budeme hledat na základě příslušného oboustranného testu se stejnou hladinou významnosti.
Tak tedy i v příkladu 11.3 lze sestrojit oboustranný interval spolehlivosti: Pro u = 4 je kritická hodnota rovna
Íi_ms(4) = 2,776;
1 2
Pak (vzorec 11.19):
/i G (8 - 2,776 • 1; 8 + 2,776 • 1) = (5,224; 10,776).
c) Vztah mezi intervalem spolehlivosti a statistickým testem. Mezi výsledkem
statistického testu a intervalem spolehlivosti existuje jednoznačný vztah:
Statistický test zamítne hypotézu Ho : /i = /io právě tehdy, když /io nenáleží do příslušného intervalu spolehlivosti
Třeba pokud bychom v situaci příkladu 11.7 testovali hypotézu Ho : li = 1000, místo abychom prováděli test, stačí se podívat na příslušný interval spolehlivosti oboustranného testu: 1000 ^ (1013,04; 1034,96), tj. to znamená, že příslušný statistický test zamítne hypotézu Ho-
Nebo podíváme-li se na příklad pravostranného testu 11.3, kde Ho : li = 6, vidíme, že 6 G (5,868; oo) (levostranný interval spolehlivosti vypočten v předchozí poznámce b)), tj. to znamená, že hypotéza Ho příslušného jednostranného testu nebude zamítnuta.
d) Interval spolehlivosti uvádí více informací než statistický test. Omlouvám
se za další členění, ale budu prezentovat tuto poznámku ve čtyřech myšlenkách:
1. Výsledek statistického testu není přesně to, co bychom chtěli znát. Ve skutečnosti chceme znát míru platnosti hypotézy H±, je-li dán výsledek experimentu - ovšem místo toho se ze statistického testu dovídáme pravděpodobnost výsledku experimentu za předpokladu platnosti hypotézy
MA 0008 - Teorie pravděpodobnosti
131
Hq (a stále neznáme míru platnosti Hi, a to ani v případě, kdy je Hq zamítnuto).
2. Statistický test nám ve svém výsledku nedává informaci o rozsahu studovaného vlivu, kdežto interval spolehlivosti ano. Informace o umístění střední hodnoty ji je ve statistických testech, které jsme dosud prováděli, skryta, ale interval spolehlivosti činí tuto informaci zjevnou a překládá ji do srozumitelného měřítka.
Například test 11.3 pouze prohlásí, že se nenašlo dostatek důkazů pro vliv grafické iluze na \i. Ale interval spolehlivosti (nyní už spíše ten oboustranný, tj. pro a = 0,05 byl odvozen v poznámce b)) (5,224; 10,776) navíc naznačuje, že se spolehlivostí 0,95 by střední hodnota místo šesti mohla být stejně dobře rovna i osmi nebo deseti, ale už ne jedenácti nebo dvanácti.
Statistický test zdůrazňuje chybu prvního druhu, ale říká velmi málo o chybě druhého druhu. Na druhé straně interval spolehlivosti naznačuje i chybu druhého druhu - pokud a necháme pevné a zmenšujeme /3, tak interval spolehlivosti zmenšuje svou délku.
Závěr: Z uvedených důvodů je lepší používat intervaly spolehlivosti spíše než jen pouhé testování hypotéz. Někdy statistické zpracování v literatuře příliš zdůrazňuje testy a zapomíná dodat užitečné informace navíc, které lze snadno vyčíst z intervalů spolehlivosti.
11.5 r-test typu ,,/íi = fi2u 11.5.1 Párový test
V tomto oddílu se budeme zabývat statistickými testy při experimentech, kde získáváme dva soubory měření. Zde je potřeba si dát pozor na vztah mezi těmito dvěma soubory (= skupinami) měření, na základě tohoto vztahu rozlišujeme totiž dva typy statistického testu - párový a nepárový test. Párovým testem se budeme zabývat nejdříve - spočívá v tom, že sice získáme dvě skupiny (= dva soubory) měření, ale tyto soubory jsou navzájem těsně svázány v tom smyslu, že ke každé hodnotě v prvním souboru měření lze jednoznačně přiřadit tzv. párovou hodnotu měření ze druhého souboru. Zejména to taky znamená, že počet měření v obou souborech je stejný - a v podstatě bychom mohli říct, že místo dvou souborů měření máme jediný soubor, ve kterém jedna položka je reprezentována uspořádanou dvojicí hodnot.
Párový test tedy užijeme v situaci, kdy sice máme k dispozici dva soubory měření, ale tyto dva soubory měření jsou spolu těsně svázány - obyčejně tak, že v obou skupinách jsou hodnoceni stejní jedinci; nejprve provedeme měření vybrané skupiny jedinců za systému podmínek A, a pak provedeme měření téže skupiny jedinců za systému podmínek B. Proto se tomuto typu experimentů také říká experiment opakovaného měření. Další vhodný název je zde experiment typu „jedna skupina dvakrát", protože jedna skupina jedinců je podrobena měření při dvou různých situacích.
132
Katedra matematiky PedF MUNI v Brně
Příklad 11.9 Chceme experimentem zjistit, jak se změní počet úderů srdce člověka za minutu po vypití šálku kávy (studujeme vliv kofeinu na činnost srdce). Kdybychom k tomuto experimentu přistupovali „nepárovým" přístupem a vybrali náhodně dvě skupiny lidí, z nichž jedna by vypila kávu s kofeinem a druhá kávu bez kofeinu, do měření by byl zanesen jistý rozptyl způsobený tím, že tempo srdečních úderů se liší u různých lidí.
Mnohem vhodnější je zde experiment opakovaného měření, kdy jedna a táž skupina vybraných lidí je vystavena měření po kávě bez kofeinu, a pak po kávě s kofeinem. Potom se vypočte rozdíl obou hodnot vždy u téhož člověka a testuje se, zda je tento rozdíl významný. Byla získána následující data počtu srdečních úderů za minutu u devíti lidí (na každém řádku jsou hodnoty měření jednoho člověka):
První dva sloupečky tabulky představují dva soubory měření párového testu. My ovšem budeme dále pracovat jen s jednorozměrným souborem, a sice s vektorem rozdílů měření ve třetím sloupci. To znamená, že párový test vlastně odpovídá situaci jednorozměrného souboru měření (= oddílu 11.2).
Spočteme průměr x = 4,44 a odhadneme rozptyl pomocí s2. Aby čtenář neměl pocit, že v oddílu 11.5 nebude vzhledem k 11.2 nic nového, vypočteme s2 pomocí pátého možného vzorce, který jsme si ještě neuváděli:
(ono se vlastně jedná o vzorec 11.12, ovšem ve jmenovateli vzorce je v místo N — 1). Dále do čitatele za SS dosadíme ze vzorce 11.11, který zkombinujeme s nejpohodlnějším způsobem výpočtu 11.8:
xn bez kofeinu xl2 s kofeinem rozdíl xl2 — xn
70 76 6
60 61 1
49 52 3
72 71 -1
70 81 11
66 70 4
55 55 0
54 61 7
80 89 9
S2
SS
v
čili pak pro realizaci ss platí
MA 0008 - Teorie pravděpodobnosti
133
a po dosazení
402
ss = 314--= 136,22.
9
Počet stupňů volnosti pro odhad rozptylu je is = N — 1 = 8, a tedy
— ss
s2 = — = 17,03. v
a) Sestrojme nyní 95%-ní interval spolehlivosti pro ji: tk najdeme jako průsečík řádku v = 8 a sloupce 2q = a = 0,05 (oboustranný interval spolehlivosti vychází z oboustranného testu): tk = 2,306. Pak interval pro ji se spolehlivostí 0,95 je
/17 03
x ± \l — ■ tk(v = 8) = 4,44 ± a/—!— • 2,306 = (1,27; 7,61). iV V 9
Z tohoto intervalu spolehlivosti se dovídáme, že kofein zvyšuje činnost srdce, a sice o 1,27 až o 7,61 úderů za minutu.
b) Provedeme i statistický r-test:
(Kl) Hq. /i = 0 (rozdíl hodnot je nulový, tj. počet úderů srdce za minutu je stejný s kofeinem i bez kofeinu - srdeční tep nezávisí na kofeinu); Hi. ^ ^ 0.
(K2) Testovým kritériem bude výběrový průměr X, respektive jeho normovaná hodnota J^L.
est (Jj£
(K3) i2 = 17,03
s2 17 03
est o\ = — = —-= 1,89 est = yA~89 = 1,37. iV 9
Tj. za předpokladu platnosti Hq má veličina Studentovo ŕ-rozdělení s v = 8 stupni volnosti.
(K4) tk = ±2,306 je u oboustranného testu stejné jako u intervalu spolehlivosti a).
(K5) Příslušná r-hodnota je
4,44 - 0
--— = 3,24 > 2,306,
1,37 ' ' '
a tedy zamítáme Ho o nezávislosti, je potvrzen vliv kofeinu na zvýšení srdečního tepu.
Hypotézy Ho nejsou pravdivé téměř nikdy (pokud uvažujeme větší počet desetinných míst), tj. zamítnutí Ho nám nic podstatného neříká. Spíše nás zajímalo, jak velký je vliv kofeinu, a to jsme se dozvěděli z intervalu spolehlivosti.
134
Katedra matematiky PedF MUNI v Brně
11.5.2 Nepárový test
Nyní se pojďme věnovat nepárovému testu neboli zpracování dat při experimentu typu „dvě skupiny jednou".
Příklad 11.10 Chceme zjistit kvalitu jisté techniky pamatováni. Náhodně jsme vybrali deset lidi a rozdělili do dvou skupin po pěti lidech. Skupina 1 (tzv. experimentálni skupina) se naučila 100 zadaných slov novou technikou, skupina 2 (kontrolní skupina ... zažitý nesprávný překlad anglického „control group", správný význam překladu je „řízená skupina", protože „control"= řídit, vést, nikoli kontrolovat) použila obyčejnou klasickou techniku zapamatování. Po týdnu se vyzkouší, kolik si kdo pamatuje z daných 100 slov -jsou získána data
experimentální skupina kontrolní skupina
43 16
37 22
51 24
27 30
32 18
Nyní data na jednom řádku spolu nijak nesouvisí, jedná se o měření u dvou různých lidí. Zdá se, že experimentální skupina má lepší výsledky, ale musíme statisticky prokázat, že to není způsobeno pouze náhodnými vlivy.
V každé ze skupin vypočteme průměr a odhadneme rozptyl, skupina 1: x\ = 38, podle vzorce 11.23 ssi = 352, v\ = 4, a tedy podle 11.22
esti a2 = sl = — = 88.
skupina 2: x2 = 22, podle vzorce 11.23 ss2 = 120, u2 = 4, a tedy podle 11.22
o 120
est2 o = si =-= 30.
No a teď přicházíme k úvahám, které jsou pro další vývoj (i další kapitolu) důležité. V situaci experimentu typu „dvě skupiny jednou" je potřeba se vypořádat se dvěma typy rozptylu, kterými jsou - vnitřní rozptyl a vnější rozptyl.
vnitřní rozptyl: Jedná se o rozptyl představující vzájemnou rozdílnost jedinců v celé populaci (např. rozdílnost lidí, rozdílnost různých součástek stejného typu, apod.). V tomto textu se budeme převážně zabývat situacemi, kdy je splněn tzv. princip homogenního vnitřního rozptylu: jakýkoliv experiment nemá vliv na rozptyl rozdělení celé populace, z níž byla náhodně vybrána skupina jedinců pro měření.
MA 0008 - Teorie pravděpodobnosti
135
Slovy našeho příkladu, rozdílnost výsledků esti způsobená růzností lidí ve skupině 1 je přibližně stejná jako rozdílnost výsledků est2 způsobená růzností lidí ve skupině 2. Jinak řečeno, ať už měříte daný soubor měření za jakékoli podmínky, „rozmanitost" těchto měření jev dané skupině přibližně stejná.
Z Tohoto principu homogenního rozptylu tedy plyne, že odhady esŕi, est2 jsou odhady jednoho a stejného vnitřního rozptylu a2 (díky tomu jsem u písmenka a o pár řádků výše už nepsal žádný index), který vypočteme jako aritmetický průměr obou odhadů:
2 esti a2 + est2 a2 88 + 30
est o =-=-= 59.
2 2
Tedy nejlepší možný odhad vnitřního rozptylu a2 je roven 59 a v dalším budeme pracovat s ním. Počet stupňů volnosti je v = 4 + 4 = 8, protože jsme tento odhad získali pomocí dvou jiných odhadů o počtu stupňů volnosti 4 - stupně volnosti ve výsledném odhadu sečítáme.
vnější rozptyl: Jedná se o rozptyl vyjadřující rozdílnost mezi danými podmínkami měření. Tento rozptyl v případě dvou souborů měření lze odhadnout na základě průměrů xi = 38, x2 = 22. Způsob je následující: Vypočteme rozptyl těchto dvou průměrů podle vzorců 11.23 a 11.22: Protože v = 2 — 1 = 1, máme
ss 382 + 222 - ^ est rN = — =-^-— = 128.
Ale to ještě není všechno - tento odhad je odhadem rozptylu průměru pěti hodnot {N = 5). Abychom získali odhad rozptylu jediné hodnoty měření, musíme v souladu se vzorcem est = (analogie vzorce 11.13) počítat
est r = N ■ est rN = 5 • 128 = 640.
celkový rozptyl: Aby byla plejáda přehledu rozptylů úplná, je možné si položit následující otázku - co se vlastně spočítá, když budeme považovat všech deset hodnot za měření jediné veličiny a vypočteme s2 ze všech deseti měření? Podle logiky výpočtu by to měl být jakýsi celkový rozptyl - a skutečně je tomu tak.
Průměr všech deseti hodnot je x = 30, což je mimochodem aritmetický průměr hodnot xi, x~2- Bude tedy podobně hodnota s2 průměrem hodnot s2, s2,?
Podle vzorce 11.23 ss = 1112, a tedy podle 11.22
= -- = 123,56, v 9
což není hodnota rovná součtu s2 + s\ = 88 + 30 = 118. Ještě méně se zdá, že by odhad celkového rozptylu 123,56 byl součtem odhadu vnitřního rozptylu 59 a odhadu vnějšího rozptylu 640 - ale přesto zde platí jisté součtové vzorce:
a) Celkový počet stupňů volnosti 9 u odhadu celkového rozptylu je součtem volnosti 8 u odhadu vnitřního rozptylu a volnosti 1 u odhadu vnějšího rozptylu.
136
Katedra matematiky PedF MUNI v Brně
b) Celkový součet čtverců 1112 je součtem součtu čtverců 472 vnitřního rozptylu (který vznikl součtem ssi = 352 a ss2 = 120) a 640 u vnějšího rozptylu.
Tolik přehled a jemné intro do problematiky rozptylu - více na to téma nebude prostor, ale čtenáři by se s tématem setkali při už zmiňované analýze rozptylu (ANOVA), která se používá až tehdy, když skupiny měření jsou tři a více. Nyní se vraťme k řešení našeho příkladu.
Odhad vnitřního rozptylu je est a2 = 59, odtud odhad rozptylu průměru
59
esto\ = — = 11,8. x 5
Nyní lze užitím 11.19 určit např. 95 %-ní interval spolehlivosti pro střední hodnotu průměru v každé ze skupin měření: Pro t^iu = 8; a = 2q = 0,05) = 2,306
/ii G 38 ± VT^Š • 2,306 = (30,08; 45,92),
li2 G 22 ± y/llč ■ 2,306 = (14,08; 29,92).
V souvislosti se statistickým testem tohoto příkladu nás ovšem spíše zajímá interval spolehlivosti pro střední hodnotu veličiny X\ — X2. Střed intervalů spolehlivosti bude v tomto případě x~í — x~2 = 38 — 22 = 16, odhad rozptylu je
est ov- -^r- = est a^r- + est a^r- =--1--= 23,6.
Al-AJ Al 2 5 5
Tedy pro tk[y = 8; a = 2q = 0,05) = 2,306
£ti - ii2 e 16 ± y/23fi ■ 2,306 = 16 ± 11,2 = (4,8; 27,2).
Protože výsledný interval spolehlivosti pro rozdíl středních hodnot neobsahuje nulu, víme také, že příslušný statistický test zamítne hypotézu Ho : \i\ = /i2- A skutečně, pojďte se přesvědčit:
(Kl) Ho: /li = Ii2 (střední hodnoty obou skupin ohodnocení jsou stejné, tj. nová technika zapamatování ovlivňuje výsledek přibližně stejně jako ta dřívější). H±: /li Ii2 (nová technika zapamatování má přibližně stejné výsledky jako dřívější technika).
(K2) Testovým kritériem bude rozdíl X± — (K3) Při platnosti Ho má veličina
X\ — X2 — 0 Xi — X2
est a%- ^r- V237)
Studentovo t-rozdělení pro u = 8.
MA 0008 - Teorie pravděpodobnosti
137
(K4) Pro a = 0,05 příslušná kritická hodnota tk je na průsečíku řádku v = 8 a sloupce pro a = 2q = 0,05, tj. tk = 2,306.
(K5) 348~5g2 = 3,29 ^ {—tk',tk). Hq tedy zamítáme - nová technika významně zvyšuje úroveň zapamatování.
Příklad 11.11 Psychologové fyziologie chtějí experimentem ověřit, že podvěsek mozkový je hlavním řídícím centrem sexuálního chování. Rozhodli se získat dvacet dobrovolníků z řad studentů, kteří by se chtěli podrobit operaci mozku. Protože žádní dobrovolníci se nepřihlásili (zejména do experimentální skupiny), byly náhodně vybrány dvě skupiny po deseti krysách.
Krysám z experimentální skupiny byl operací odebrán podvěsek mozkový. Krysám z kontrolní skupiny byla pouze otevřena lebka, ale nic nebylo odebráno (aby byl snížen rozptyl způsobený otevřením lebky).
Protože operaci prováděl nezkušený operatér, některé z krys zahynuly přímo na operačním stole. V experimentální skupině přežilo pět krys, v kontrolní skupině sedm. Psycholové byli rozmrzelí nad nezkušeným studentem, ale pokračovali dále v experimentu. Byla získána data o počtu pohlavních spojení v průběhu jistého časového intervalu. V experimentální skupině (N\ = 5): 0,1,4,4,1. Odtud ~x~y = 2, ssi = ^x2 — = 14,
vi = m - 1 = 4, pak 4 = ^ = % = 3,5.
V kontrolní skupině (N2 = 7): 5, 7,4, 3,4, 6, 6. Odtud x~2~ = 5, ss2 = ^2 x\ ~ =
u2 = N2 - 1 = 6, pak 4 = = f = 2.
Odhad vnitřního rozptylu: Podobně jako u předchozího příkladu (vyjdeme z platnosti principu homogenního rozptylu), i nyní vypočteme jakýsi jeden odhad rozptylu jako průměr odhadů s2, s2, - nebude se jednat ovšem o aritmetický průměr, ale o tzv. vážený průměr. Protože odhad s2, byl sestaven na základě většího počtu stupňů volnosti (většího počtu měření), budeme mu přikládat větší váhu:
esta2 = ^----4 +^-—-4 (11.24)
V\ + l>2 Vl + V2
V našem příkladu est a2 = ^ • 3,5 + ^ • 2 = 2,6. Pak intervaly spolehlivosti pro jednotlivé střední hodnoty a tk(u = 10, a = 2q = 0,05) = 2,228 jsou
/ii G 2 ± J— ■ 2,228 = 2 ± 1,61 = (0,39; 3,61); V 5
[i2 G 5 ± • 2,228 = 2 ± 1,36 = (3,64; 6,36).
Intervaly nemají společný průnik, což znamená, že testovaná hypotéza o rovnosti středních hodnot bude zamítnuta. Dále je možné si všimnout, že interval spolehlivosti pro /i2 má menší délku než interval pro \i\ - to je dáno větším počtem měření ve druhé skupině, pak totiž ve druhé skupině při odhadu rozptylu průměru dělíme sedmi, nikoli pěti.
138
Katedra matematiky PedF MUNI v Brně
V testu, který bude následovat, budeme používat rozdělení X± —Pokud bychom chtěli najít 95 %-ní interval spolehlivosti pro rozdíl \i\ —112, použijeme střed x~[ — x~2 = 2 —5 = —3 a odhad rozptylu
2 o 2 2,6 2,6 est a-rp- -rp- = est a-r?- + est a-r?- =--1--= 0,891.
Al-AJ Al 2 5 7
Pak
ft-/i2G-3i ^0,891 • 2,228 = -3 ± 2,1 = (-5,1; -0,9). Příslušný statistický test:
(Kl) Ho: \i\ = /i2 (odstranění podvěsku mozkového nemá vliv na sexuální chování); H\. iii < /i2 (odstraněnípodvěsku mozkového povede ke snížení sexuální aktivity).
(K2) Testovým kritériem bude veličina X\ — X2.
(K3) Při platnosti Ho má veličina
X\ — X2 — 0 X\ — X2
est a* _ = X1—X2
Studentovo t-rozdělení pro u = 10.
(K4) Pro a = 0,05 příslušná kritická hodnota tk je na průsečíku řádku u = 10 a sloupce pro a = q = 0,05, tj. tk = 1,812. Pozor, intervaly spolehlivosti budeme vždy konstruovat pro a = 2q, ovšem u jednostranného statistického testu musíme vzít hodnotu tk pro a = q\\
(K5) Odpovídající t-hodnota kritéria je ^~|Q1 = —3,178 ^ {—tk',tk). Hq tedy zamítáme.
11.6 Předpoklady použitelnosti parametrických testů
Při odvozování testů (zejména r-testu - odvození je mimo rámec tohoto kursu) muselo být učiněno několi předpokladů:
1. Naměřené hodnoty x, jsou navzájem nezávislé (= předpoklad nezávislosti) -například předpoklad nezávislosti v příkladu 11.10 je porušen, pokud členové skupiny podvádějí a opisují jeden od druhého.
2. Měřená veličina má normální rozdělení (= předpoklad normality).
3. Rozptyl uvnitř experimentální skupiny je stejný jako rozptyl uvnitř kontrolní skupiny, tj. oba rozptyly jsou odhadem stejného (vnitřního) rozptylu a2 celé populace (= princip homogenního rozptylu).
MA 0008 - Teorie pravděpodobnosti
139
Testy, které splňují uvedené tři předpoklady, se nazývají parametrické testy. Pokud některý z předpokladů není splněn, kritérium použité v testu nemá rozdělení t (nebo U, pokud známe rozptyl a2), a tudíž nelze určit kritické hodnoty - pro srovnání středních hodnot se v tom případě užívají tzv. neparametrické testy. Na tu v tomto kursu už nebude moc prostoru - jsou to například Mannův-Whitneův test, Friedmanův test, Wilcoxonův test, znaménkový test, Kruskalův-Wallisův test, Spearmanův test korelace a další.
Upíná diskuse použitelnosti parametrických testů U, t (a v následující kapitole testu F) je mimo rámec tohoto kursu. Ovšem následující poznámky mohou být důležitým vodítkem, který pro běžného „uživatele" statistiky dostačuje:
a) Mějte se na pozoru pouze tehdy, když ŕ-hodnota kritéria je blízká hodnotě tk.
Přepoklady by musely být porušeny velmi hrubě, aby například při jednostanném testu pro a = 0,05 kritická hodnota tk „usekla" ve skutečnosti významně více než 5% obsahu podgrafu hustoty t - i při porušených předpokladech tato kritická hodnota většinou usekne 6 nebo 7 procent, a nikoli třeba 15 procent obsahu. Proto pokud r-hodnota kritéria přesáhne hodnotu tk výrazně, je rozhodnutí zamítnout Hq celkem bezpečné.
b) Zkontrolujte své rozdělení. Nákres histogramu rozdělení je užitečný jak pro ověření
předpokladu normality, tak ověření principu homogenního rozptylu.
c) Porovnejte s2 a s2.. pokud se hodnoty obou odhadů liší výrazně, znamená to porušení
předpokladu homogenního rozptylu. Ale pokud podíl těchto odhadů je menší než 4 při přibližně stejné délce obou souborů měření, není třeba dělat paniku.
d) Porušení předpokladů nemá takový dopad, pokud Ni > 20 a Ni = N2.
e) Pozor na porušení měřítka. Některé proměnné jsou bezproblémové, např. X =
průměrná rychlost (v km za hodinu), protože rozsah stupnice 10 až 20 km má stejnou váhu jako rozsah 70km až 80km.
Ale existují pochybné proměnné v tom smyslu, že měřítko porušují - například Y = ohodnocení otázky v dotazníku počtem bodů ze stupnice 1 až 7. Zde totiž rozsah 3 až 4 body nemusí být ekvivalentní rozsahu stupnice 6 až 7 bodů. Taková stupnice je hodně subjektivní, nemá pevně vymezený absolutní přírůstek, a proto může vést ke zkreslenému tvaru rozdělení.
f) Pokud některý z předpokladů je porušen do té míry, že U-test nebo ŕ-test nelze použít,
je možné zkusit neparametrické testy.
11.7 Shrnutí
Tato kapitola je klíčovou kapitolou z kapitol 10,11,12, protože obsahuje nejčastěji prováděný test porovnání dvou souborů měření - ŕ-test - a také odvozuje a ilustruje
140
Katedra matematiky PedF MUNI v Brně
význam intervalu spolehlivosti.
Úvodem v oddílu 11.1 jsou zopakovány některé vzorce, zejména vzorce pro X, S2 -a dále je vysvětlen a odvozen vzorec pro S2 jako nejlepší nestranný odhad neznámého rozptylu a2 normálního rozdělení.
r-test používáme v situacích analogických U- testu (= u veličiny s normálním rozdělením) s tím jediným rozdílem, že totiž není znám rozptyl a musíme jej
odhadnout pomocí Pro odhad rozptylu průměru je důležitý zejména vzorec 11.13, na který je potřeba nezapomenout.
Celá kapitola předpokládá, že čtenář už ví, co je to statistický test - přesto ty důležité informace ohledně statistických testů opakuje (poznámky 11.3 objasňují terminologii a otázku přístupu ke statistickému testu).
Protože téměř všechno se vším souvisí, zamítne statistický test, který je dostatečně silný, hypotézu Ho prakticky vždy - z toho důvodu je někdy lepší hledat informace nikoli ve statistickém testu, ale v intervalu spolehlivosti (blíže viz poslední poznámku v 11.4.3).
Vyvrcholením kapitoly jsou testy typu \i\ = /i2, které opět nemohou pozorného studenta překvapit, protože test podobného typu byl probrán v předchozí kapitole. Ovšem věcí novou je představení rozdílu mezi párovým a nepárovým testem.
11.8 Otázky k opakování a úlohy ke cvičení
U následujících výroků rozhodněte, zda se jedná o výrok pravdivý či nepravdivý.
Otázka 11.1 Výběrový průměr X je nestranným a konzistentním odhadem parametru /i měření veličiny s normálním rozdělením.
Otázka 11.2 Statistika S2 je nestranným a konzistentním odhadem parametru a2 měření veličiny s normálním rozdělením.
Otázka 11.3 Kritická t- hodnota je blíže počátku než odpovídající (= pro stejnou hladinu významnosti sestrojená) kritická U-hodnota.
Otázka 11.4 Pro rostoucí počet stupňů volnosti graf hustoty t-rozdělení stále více splývá s grafem hustoty normovaného normálního rozdělení.
Otázka 11.5 Je možné, že interval spolehlivosti pro střední hodnotu \i průměru X sestrojený na základě konkrétní realizace x tuto střední hodnotu vůbec neobsahuje.
Otázka 11.6 Pokud hodnota /io nepadne do oboustranného intervalu spolehlivosti pro střední hodnotu /i průměru X, znamená to, že oboustranný test pro Ho : /i = /io tuto hypotézu Ho nezamítne.
Otázka 11.7 Párovým testem je každý test typu \i\ = /i2, který porovnává střední hodnoty dvou náhodných veličin.
MA 0008 - Teorie pravděpodobnosti
141
Otázka 11.8 Vnitřní rozptyl popisuje rozmanitost konkrétních jedinců v populaci - tato rozmanitost přitom nezávisí na podmínkách, při kterých je měření prováděno (je stejná u kontrolní skupiny i experimentální skupiny).
Otázka 11.9 Celkový rozptyl je součtem vnitřního rozptylu a vnějšího rozptylu.
Otázka 11.10 Při nestejných délkách obou souborů měření lze vnitřní rozptyl odhadnout jako aritmetický průměr rozptylů si, s2. jednotlivých souborů měření.
Otázka 11.11 Existují situace, kdy neplatí princip homogenního rozptylu (rozptyl měření v kontrolní skupině je nesrovnatelně větší než rozptyl měření v experimentální skupině).
Každý příklad z následujících bude zadán trojici studentů - vypočtěte přesně jen zadaný úkol. U zkoušky budete muset znát příklady 11.1, 11.4 a 11.6.
Úloha 11.1 Expert zaplacený prodejcem tvrdil, že o nový výrobek šamponu bude mít zájem 30 % zákazníků. Při průzkumu u 500 zákazníků jich o nový šampon projevilo zájem 130. ( příklad je analogický příkladu 10.2, ale interval spolehlivosti ještě ve skriptech (2024) není zpracován, doporučuji přijít na přednášku, na které se tento příklad bude dělat)
a) Na hladině významnosti a = 0,05 testujte hypotézu H^že zájem o výrobek je zhruba stejný, jak expert předpokládal.
b) Zkonstruujte 0, 95%-ní interval spolehlivosti pro střední hodnotu počtu zájemců o nový šampón, na základě testu v (a) a pprovedeného průzkumu.
Úloha 11.2 Zkonstruujte 0, 95%-ní interval spolehlivosti pro jednostranný test u příkladu 10.3 pro střední hodnotu průměrného výsledku počtu bodů z matematiky u těch, co používali navíc výukový program. Malá nápověda: interval spolehlivosti bude mít jednu mez plus nebo minus nekonečno, podobně jako interval pro zamítnutí H0 u jednostranného testu.
Úloha 11.3 Je známa následující grafická iluze: úsečka a se zdá delší než úsečka b (počítá se délka bez koncových šipek), i když ve skutečnosti jsou obě úsečky stejně dlouhé. Pro ověření této iluze jsme dali pěti lidem úkol odhadnout délku úsečky a (a úsečku typu h už jim neukazovali) - odhady délek úsečky a byly po řadě 8, 11, 9, 5, 7 cm.
a) Ověřte tuto iluzi jednostranným stat. testem, pokud délka úsečky a je ve skutečnosti 6
cm.
b) Určete p-hodnotu tohoto jednostranného statistického testu v části (a).
c) Zkonstruujte příslušný jednostranný 95%-ní interval spolehlivosti pro střední hodnotu
průměru odhadované délky v části (a).
Úloha 11.4 U náhodně vybraného vzorku dvaceti žárovek byla naměřena průměrná životnost x = 1024 hodin a spočítán rozptyl měření S2 = 625.
a) Ověřte oboustranným t-testem, zda je průměrná životnost rovna /i = 1000 hodin.
142
Katedra matematiky PedF MUNI v Brně
Obrázek 11.18: Grafická iluze: délky úseček a, b jsou stejné.
b) Utvořte 95-ní interval spolehlivosti pro střední hodnotu /i průměru životnosti. b) určete p-hodnotu testu v části (a).
Úloha 11.5 Sociologové chtějí provést experiment, který má zjistit, zda počet schůzek chlapce s děvčetem závisí na tom, zda je chlapec prvorozený nebo ne. Získá náhodně vybrané čtyři chlapce náctileté prvorozené a šest jiných druhorozených a zjistí, kolik schůzek měl každý z nich během jednoho měsíce. Prvorození: 2, 2,1, 4. Druhorození: 3, 4, 5, 7, 3, 5.
a) Vypočtete příslušné intervaly spolehlivosti (pro střední hodnotu průměru měření) se
spolehlivostí 95% u každé z obou skupin chlapců.
b) Proveďte t-test.
c) Určete p-hodnotu statistického testu v úloze (b).
Úloha 11.6 Chceme testem ověřit, zda kvalita reakcí člověka je stejná za denního i z umělého světla. U náhodně vybrané skupiny deseti lidí byly získány výsledky zkoušky „denní světlo": 9,2,7,12,14,10,6,7,12,10 a hodnoty zkoušky „umělé osvětlení": 7, 2, 4,13, 13, 7, 4, 6, 8, 9 (oba soubory jsou uspořádané, tj. data od i-tého respondenta jsou v obou případech na i-té pozici).
a) Za použití oboustranného t-testu rozhodněte, zda soubor „denní světlo" nabývá
významně vyšších hodnot než soubor „umělé světlo".
b) vypočtěte interval spolehlivosti pro střední hodnotu odchylek v úloze (a),
c) určete p-hodnotu statistického testu v úloze (a). Odpovědi na otázky a některé příklady viz 14.11.
MA 0008 - Teorie pravděpodobnosti
143
12 Týden 12
12.1 Vlastnosti rozdělení %2
Uvažujme veličinu X s normálním rozdělením pravděpodobnosti No([i,a2). Víme, že veličina U = má normované normální rozdělení No(0; 1). Jaké rozdělení má veličina
(v -jiý
y2
U2 = ^—f^l o
Především můžeme říci, že hodnoty veličiny U2 jsou nezáporné. Dále víme, že asi 68% veličiny U leží v intervalu (—1; 1), tj. asi 68% veličiny U2 leží v intervalu (0; 1). Zkrátka a dobře, vlastnosti veličiny U2 lze odvodit z vlastností veličiny U. A protože se veličina U2 ve statistice hojně používá, dostala i své jméno: x2(l) ... čti: chí kvadrát o jednom stupni volnosti.
Označení x2(l) naznačuje, že může nastat i více stupňů volnosti než jeden. A skutečně, pokud dvě hodnoty Ui, U2 veličiny U umocníme na druhou mocninu a sečteme, dostaneme obecně větší hodnotu než X2(l), označujeme ji x2(2) (veličina „chí kvadrát" se dvěma stupni volnosti):
X2(2) = U2 + U2.
Čili střední hodnota veličiny x2(2) je větší než střední hodnota veličiny X2(l). Obecně lze pak vyjádřit veličinu o n stupních volnosti:
X2(n) = ^2 + ^22 + --- + ^2.
Příklady %2 o různých stupních volnosti jsou na obrázku:
144
Katedra matematiky PedF MUNI v Brně
kde T je tzv. gama-funkce. Co se týká střední hodnoty a rozptylu rozdělení %2, vypočteme jen střední hodnotu, rozptyl uvedeme bez důkazu:
E {X\n)} = E(U2 + U2 + • • • + U2) = 1 + 1 + • • • + 1 = n.
Opravdu platí E (Uf) = 1:
e(?—?)2 = -■E(X-li)2 = -(EX2-2liEX + li2) = \ o j o <7z
= \(EX2 - 2(ŕ + (ŕ) = ^(o2 + (ŕ - (ŕ) = 1. o o
Pro výpočet EX2 jsme využili faktu, že o2 = D X = EX2 - E2 X = EX2 - fi2, tj. EX2 = a2 + [i2.
D{x2{n)} = 2n. Další důležitou vlastností je tzv. aditivita rozdělení %2, že totiž
která v podstatě plyne z toho, že x2(n) = Y^i U2.
Podobně jako u jiných rozdělení, i zde byly kritické hodnoty rozdělení spočteny jednou provždy a seřazeny do tabulky, takže při konkrétním užívání kritických hodnot nemusíme počítat žádné nechutné integrály (kritické hodnoty viz tabulky 12.13, 12.14).
Například pokud chceme určit kritickou hodnotu hk tak, že
P(X2(10)>M = 0,05,
tak ve druhé části tabulky najdeme hodnotu 18,307 na průsečíku řádku 10 a sloupce pro 0,05.
Pokud hledáme dk tak, aby
P(x2(10) < 4) = 0,05,
tak v první části tabulky na průsečíku řádku 10 a sloupce 0,95 (protože v tabulce jsou kritické hodnoty uvedené pro pravou část podgrafu) najdeme hodnotu 3,94 (viz též obrázek):
MA 0008 - Teorie pravděpodobnosti
145
Tabulka 12.13: Kritické hodnoty jednostranného testu \2 ~ část 1.
q ->■ v l 0,995 0,990 0,975 0,950 0,900 0,750 0,500
1 392,704-lCrlu 157,088-lCr9 982,069-10"y 393,214-10"s 0,0157908 0,1015308 0,454937
2 0,0100251 0,0201007 0,0506356 0,102587 0,210720 0,575364 1,38629
3 0,0717212 0,114832 0,215795 0,351846 0,584375 1,212534 2,36597
4 0,206990 0,297110 0,484419 0,710721 1,063623 1,92255 3,35670
5 0,411740 0,554300 0,831211 1,145476 1,61031 2,67460 4.35146
6 0,675727 0,872085 1,237347 1,63539 2,20413 3,45460 5,34812
7 0,989265 1,239043 1,68987 2,16735 2,83311 4,25485 6,34581
8 1,344419 1,646482 2,17973 2,73264 3,48954 5,07064 7,34412
9 1,734926 2,087912 2,70039 3,32511 4,16816 5,89883 8,34283
10 2,15585 2,55821 3,24697 3,94030 4,86518 6,73720 9,34182
11 2,60321 3,05347 3,81575 4,57481 5,57779 7,58412 10,3410
12 3,07382 3,57056 4,40379 5,22603 6,30380 8,43842 11,3403
13 3,56503 4,10691 5,00874 5,89186 7,04150 9,29906 12,3398
14 4,07468 4,66043 5,62872 6,57063 7,78953 10,1653 13,3393
15 4,60094 5,22935 6,26214 7,26094 8,54675 11,0365 14,3389
16 5,14224 5,81221 6,90766 7,96164 9,31223 11,9122 15,3385
17 5,69724 6,40776 7,56418 8,67176 10,0852 12,7919 16,3381
18 6,26481 7,01491 8,23075 9,39046 10,8649 13,6753 17,3379
19 6,84398 7,63273 8,90655 10,1170 11,6509 14,5620 18,3376
20 7,43386 8,26040 9,59083 10,8508 12,4426 15,4518 19,3374
21 8,03366 8,89720 10,28293 11,5913 13,2396 16,3444 20,3372
22 8,64272 9,54249 10,9823 12,3380 14,0415 17,2396 21,3370
23 9,26042 10,19567 11,6885 13,0905 14,8479 18,1373 22,3369
24 9,88623 10,8564 12,4011 13,8484 15,6587 19,0372 23,3367
25 10,5197 11,5240 13,1197 14,6114 16,4734 19,9393 24,3366
26 11,1603 12,1981 13,8439 15,3791 17,2919 20,8434 25,3364
27 11,8076 12,8786 14,5733 16,1513 18,1138 21,7494 26,3363
28 12,4613 13,5648 15,3079 16,9279 18,9392 22,6572 27,3363
29 13,1211 14,2565 16,0471 17,7083 19,7677 23,5666 28,3362
30 13,7867 14,9535 16,7908 18,4926 20,5992 24,4776 29,3360
40 20,7065 22,1643 24,4331 26,5093 29,0505 33,6603 39,3354
50 27,9907 29,7067 32,3574 34,7642 37,6886 42,9421 49,3349
60 35,5346 37,4848 40,4817 43,1879 46,4589 52,2938 59,3347
70 43,2752 45,4418 48,7576 51,7393 55,3290 61,6983 69,3344
80 51,1720 53,5400 57,1532 60,3915 64,2778 71,1445 79,3343
90 59,1963 61,7541 65,6466 69,1260 73,2912 80,6247 89,3342
100 67,3276 70,0648 74,2219 77,9295 82,3581 90,1332 99,3341
146
Katedra matematiky PedF MUNI
v Brně
Tabulka 12.14: Kritické hodnoty jednostranného testu \2 ~ část 2.
q ->■ v l 0,250 0,100 0,050 0,025 0,010 0,005 0,001
1 1,32330 2,70554 3,84146 5,02389 6,63490 7,87944 10,828
2 2,77259 4,60517 5,99147 7,37776 9,21034 10,5966 13,816
3 4,10835 6,25139 7,81473 9,34840 11,3449 12,8381 16,266
4 5,38527 7,77944 9,48773 11,1433 13,2767 14,8602 18,467
5 6,62568 9,23635 11,0705 12,8325 15,0863 16,7496 20,515
6 7,84080 10,6446 12,5916 14,4494 16,8119 18,5476 22,458
7 9,03715 12,0170 14,0671 16,0128 18,4753 20,2777 24,322
8 10,2188 13,3616 15,5073 17,5346 20,0902 21,9550 26,125
9 11,3887 14,6837 16,9190 19,0228 21,6660 23,5893 27,877
10 12,5489 15,9871 18,3070 20,4831 23,2093 25,1882 29,588
11 13,7007 17,2750 19,6751 21,9200 24,7250 26,7569 31,264
12 14,8454 18,5494 21,0261 23,3367 26,2170 28,2995 32,909
13 15,9839 19,8119 22,3621 24,7356 27,6883 29,8194 34,528
14 17,1170 21,0642 23,6848 26,1190 29,1413 31,3193 36,123
15 18,2451 22,3072 24,9958 27,4884 30,5779 32,8013 37,697
16 19,3688 23,5418 26,2962 28,8454 31,9999 34,2672 39,252
17 20,4887 24,7690 27,5871 30,1910 33,4087 35,7185 40,790
18 21,6049 25,9894 28,8693 31,5264 34,8053 37,1564 42,312
19 22,7178 27,2036 30,1435 32,8523 36,1908 38,5822 43,820
20 23,8277 28,4128 31,4104 34,1696 37,5662 39,9968 45,315
21 24,9348 29,6151 32,6705 35,4789 38,9321 41,4010 46,797
22 26,0393 30,8133 33,9244 36,7807 40,2894 42,7956 48,268
23 27,1413 32,0069 35,1725 38,0757 41,6384 44,1813 49,728
24 28,2412 33,1963 36,4151 39,3641 42,9798 45,5585 51,179
25 29,3389 34,3816 37,6525 40,6465 44,3141 46,9278 52,620
26 30,4345 35,5631 38,8852 41,9232 45,6417 48,2899 54,052
27 31,5284 36,7412 40,1133 43,1944 46,9630 49,6449 55,476
28 32,6205 37,9159 41,3372 44,4607 48,2782 50,9933 56,892
29 33,7109 39,0875 42,5569 45,7222 49,5879 52,3356 58,302
30 34,7998 40,2560 43,7729 46,9792 50,8922 53,6720 59,703
40 45,6160 51,8050 55,7585 59,3417 63,6907 66,7659 73,402
50 56,3336 63,1671 67,5048 71,4202 76,1539 79,4900 86,661
60 66,9814 74,3970 79,0819 83,2976 88,3794 91,9517 99,607
70 77,5766 85,5271 90,5312 95,0231 100,425 104,215 112,317
80 88,1303 96,5782 101,879 106,629 112,329 116,321 124,839
90 98,6499 107,565 113,145 118,136 124,116 128,299 137,208
100 109,141 118,498 124,342 129,561 135,807 140,169 149,449
MA 0008 - Teorie pravděpodobnosti
147
stupeň volnosti 10
12.2 Využití rozdělení %2 12.2.1 Testování hypotézy a2 = konst
Příklad 12.1 Zajímá nás, zda jistý výukový program je schopen naučit jisté partie aritmetiky při výuce na ZS. Může se totiž stát, že nadaní studenti budou chápat instrukce počítače, kdežto průměrní žáci budou mít potíže s programem komunikovat a naučí se méně, než by pochopili z výkladu živého učitele.
Je známo z dlouhodobého měření, že rozptyl výsledků testu z aritmetiky při klasické výuce je a2 = 25. Pokud by naše obava byla oprávněná, rozptyl výsledků znalostí by byl při použití programu větší (nadaní žáci by byli lepší, průměrní žáci horší než obvykle).
Byl proveden experiment, kdy deset žáků se podrobilo programové výuce. Výsledky znalostí (bodové ohodnocení) byly: 68, 90, 70, 91, 72, 80, 85, 82, 91, 95. Odtud
10
i
i Xj
x)2 = 846,4, a tedy est a2 =
N 1 1
—--— • 846,4 = - • 846,4 = 94,04
N-l N ' 9
a odhad est a2 = 94,04 populačního roptylu je mnohem větší než u2, = 25. Proveďte statistický test, který by potvrdil, že ke zvýšení rozptylu nedošlo náhodou.
Kl: Hq\ rozptyl výsledků znalostí a2 nabytých počítačovú výukou je stejný jako rozptyl Oq = 25 při klasické výuce (tj. a2 = 25).
H\. o2 25 (oboustranný test). K2: Ukazuje se (uvidíme v bodě K3), že vhodným kritériem testu je • — x)2 ■
K3: Za předpokladu platnosti Hq má výraz • Y^i°{xí ~ x)2 rozdělení x2(9). Skutečně, dokažme tento fakt.
Víme, že ■ Y^iix* ~ I1)2 m^ rozdělení x2{n)i protože se jedná o součet n čtverců rozdělení U. Ovšem ji neznáme - jaký je tedy vztah mezi ■ Yli(x* ~ ^)2 a ^ '
Eľ(^-x)2?
Platí
^Xj ^ ^ ^Xj ^ Xj I Xj
-^)2 = I>í-ž)2 + 2-Jj
Xj q "X* ) t tí^ľ
-v)+^2(x-v)2-
148
Katedra matematiky PedF MUNI v Brně
A protože
2 • — x) ■ (x — ji) = 2(x — ji) ■ — x) = 0,
dostaneme
yZ(x* ~ i1)2 = ~ ^2+/2^ ~ ^2-
Máme tedy rovnici
'y^(xl — ji)2 = 'y^{xl — x)2 + n ■ (x — ji)2, kterou po vynásobení hodnotou \ lze převést na tvar
Efa -i1)2 = E(^ ~^)2 + - v)2
a2 a2 -1
=x2W
To, že člen na levé straně má rozdělení x2(n), už bylo řečeno, člen na pravé straně má rozdělení X2(l), protože se jedná o druhou mocninu normovaného rozdělení průměru
2
x se střední hodnotou /i a rozptylem Dohromady tedy dostáváme to, co jsme chtěli spočítat a dokázat pro první člen na pravé straně předchozího vztahu:
y/i-^P^ = X2(n)-X2(l) = X2(n-l). °o
K4: Pro a = 0,05 usekáváme na obou stranách hodnotu 0,025 z obsahu hustoty, tj. 4(9) = 2,70039 (na průsečíku řádku 9 a sloupce 0,975) a hk(9) = 19,0228 (na průsečíku řádku 9 a sloupce 0,025).
K5: Po dosazení naměřených hodnot
22 2 =-~ = 33'86 ^ (2570039; 19,0228) ==> zamítáme HQ,
(Tg 25
rozptyl je (bohužel) významně odlišný od 25, v našem případě významně větší. A to je tragédie počítačové výuky :-)
V případě oboustranného testu najdeme dvě kritické hodnoty na řádku 9, a sice Xm = 2,7 (ve sloupci 0,975) a Xv = 19,02 (ve sloupci 0,025) a Hq bychom zamítli na hladině významnosti a = 0,05, pokud by hodnota kritéria ležela mimo interval (2,7; 19,02).
12.2.2 Test druhu rozdělení — x2 test dobré shody
Příklad 12.2 Rodičům se narodily už čtyři dcery, a přesto by si přáli i syna. Chystají se mít páté dítě s nadějí, že pravděpodobnost narození chlapce je 0,5 (tj. že rození dětí má podobný charakter - co se týká pohlaví dítěte - jako házení korunou). Ale přece jen si vyhledali data o 1024 rodinách s pěti dětmi a zjistili, v kolika rodinách se narodilo kolik chlapců:
MA 0008 - Teorie pravděpodobnosti
149
40 rodin
1 kluk .. 184 rodin
2 kluci .. 300 rodin
3 kluci .. 268 rodin
4 kluci .. 196 rodin
5 kluků .. 36 rodin
Pokud tato data o pohlaví při rození dětí mají stejný charakter jako házení korunou, pak je lze dobře popsat binomickým rozdělením s parametry N = 1024, p = 0,5. Teoretické rozdělení pravděpodobnosti a rozdělení četnosti mají následující průběh:
počet chlapců xl Pí četnost f i
0 1/32 32
1 5/32 160
2 10/32 320
3 10/32 320
4 5/32 160
5 1/32 32
Otázka zní: do jaké míry se shoduje empirické rozdělení četnosti a teoretické rozdělení četnosti, čili: lze nashromážděná data dobře popsat binomickým rozdělením s uvedenými parametry?
Provedeme tzv. test dobré shody (v angličtině: good fit test ... GFT).
Kl: Hq. počet chlapců z pěti narozených dětí lze dobře popsat binomickým rozdělením pro p = 0,5.
Hx: Nelze.
K2: Jaké kritérium zvolit? Vezmeme součet čtverců rozdílů normalizovaných odchylek naměřené a teoretické četnosti Yli ^t~/m'> :
počet chlapců naměřená četnost teoretická četnost (/í — fm)2 (ít-lmY ft
0 40 32 64 2
1 184 160 576 3,6
2 300 320 400 1,25
3 268 320 2704 8,45
4 196 160 1296 8,1
5 36 32 16 0,5
K3: Za předpokladu platnosti Hq má kritérium z bodu K2 rozdělení x2(/c — 1). Tento fakt nebudeme dokazovat.
K4: Kritérium je vhodným reprezentantem míry platnosti Hq: pokud Hq platí, očekáváme, že hodnota kritéria bude malá, pokud neplatí, bude velká. Jedná se tedy o jednostranný test, kde k je počet skupin četnosti, tj. v našem případě k = 6. Tedy pro a = 0,05 je Xfc(5) = 11,0705 („usekáváme" přet procent obsahu hustoty psti zprava).
150
Katedra matematiky PedF MUNI v Brně
K5:
6 /f — f)2 V Um JtJ = 23,9 > 11,07 zamítáme H0, i Jt
binomické rozdělení není příliš dobré pro popis našich dat (tj. pohlaví chlapců při narození se nechová jako počet líců při hodu korunou).
12.2.3 Testování nezávislosti v kontingenční tabulce
Příklad 12.3 Zajímá nás, zda existuje vztah mezi názory na jadernou energii a politickou příslušností. Proto jsme se dotázali nezávisle vybraných 200 lidí, jaký mají názor na jadernou elektrárnu Temelín (neměla by být v provozu - nezajímá mě to - měla by být v provozu), a dále které ze stran ODS, ČSSD dávají větší přednost. Výsledky průzkumu byly sestaveny do kontingenční tabulky (čísla v závorkách vyjadřují empirické pravděpodobnosti = četnosti vydělené číslem 200):
elektr. by neměla být nevím elektr. by měla být
ČSSD 40 (0,2) 70 (0,35) 40 (0,2) 150 (0,75)
ODS 35 (0,175) 5 (0,025) 10 (0,05) 50 (0,25)
75 (0,375) 75 (0,375) 50 (0,25) 200 (1,000)
Při testování, zda existuje závislost mezi oběma proměnnými, můžeme použít test %2:
Kl: Hq. Obě proměnné se chovají nezávisle, čili empirické rozdělení je hodně blízké následujícímu teoretickému rozdělení, kde poslední řádek a poslední sloupec jsou stejné jako v předchozí tabulce (udávající výsledky průzkumu), ovšem ostatní pravděpodobnosti jsou získány vynásobením příslušných pravděpodobností v posledním řádku a sloupci; označme A\... ČSSD (P(Ai) = 0,75); A2... ODS (P(A2) = 0,25); Bx... elektrárna NE {P[BX) = 0,375); B2... nevím (P(B2) = 0,375); B3 ... elektrárna ANO (P(B3) = 0,25). Nyní pokud A%, B3 jsou nezávislé, tak
P{AinBJ) = P{Al)-P{BJ)
(například P(A1 n Bľ) = P{AX) ■ P{BX) = 0,281, atd.). Dostáváme tedy tabulku teoretických pravděpodobností (uvedených v závorce), četnosti jsou získány vynásobením příslušné pravděpodobnosti číslem 200 (četnosti tedy nemusí být celočíselné):
elektr. by neměla být nevím elektr. by měla být
ČSSD 56,2 (0,281) 56,2 (0,281) 37,6 (0,188) 150 (0,75)
ODS 18,8 (0,094) 18,8 (0,094) 12,4 (0,062) 50 (0,25)
75 (0,375) 75 (0,375) 50 (0,25) 200 (1,000)
PL\\ Obě proměnné jsou závislé, čili nelze je dost dobře popsat příslušným teoretickým rozdělením.
MA 0008 - Teorie pravděpodobnosti
151
K2: Kritériem bude ^ j™^ , kde k je počet různých tříd četností (v našem případě počet různých oken tabulky kromě posledního (shrnujícího) řádku a posledního (shrnujícího) sloupce: J • K = 2 ■ 3 = 6), ft jsou příslušné teoretické četnosti (=četnosti z poslední tabulky), fm příslušné naměřené četnosti (z předposlední tabulky).
K3: Za předpokladu platnosti Hq má kriteriální funkce rozdělení %2((J — 1)(K — 1)), kde J je počet podmínek veličiny A, K je počet podmínek veličiny B (tento fakt nebudeme dokazovat). V našem případě %2(1 • 2) = %2(2).
K4: Pro a = 0,05 kritická hodnota Xk{2) = 5,99.
K5:
V- (/* ~ fm)2 (56,2 - 40)2 , (56,2 - 70)2 (12,4 - 10)2
\—f^= 56,2 + 56,2 +---+ 12,4 = ^
toto číslo zdaleka přesahuje kritickou hodnotu testu 5,99, tedy Hq zamítáme, prokázala se závislost obou veličin.
12.3 Neparametrický Mannův-Whitneyův test podle pořadí
Příklad 12.4 Vraťme se k příkladu 12.1, kde jsme chtěli zjistit, jaký vliv na studenty bude mít počítačová výuka matematiky. Proveďme nyní experiment jiného rázu: náhodně vybraných 24 studentů rozdělíme na dvě skupiny po dvanácti lidech. Jedna skupina se účastnila výuky pod dohledem učitele, druhá příslušné počítačové výuky. Potom se žáci podrobili písemce, kde se měřil čas potřebný na vyřešení zadaných úloh. Získala se data:
1... bežná výuka: 43,12, 21,41, 39, 23, 27, 37, 35, 31, 33, 29;
2 ... počítačová výuka: 3,13,1, 5,11,10, 9, 8, 6, 2,4, 7; Pomocí všech naměřených hodnot odhadneme rozptyl:
x 2 SS1 + SS2 908,92 + 154,92
est a =- = - = 48,36
Vx + V2 11 + 11
A nyní můžeme provést r-test:
Kl: Ho: /ii = /i2 (doba potřebná na vyřešení písemky z aritmetiky má stejnou střední hodnotu u obou skupin); Hx: ytzi ^ ii2.
K2: Kritériem je kde ui_2 = 0,
48,36 48,36
est (Ti_2 = \Jest o\ + est o\ = + = 2,84.
K3: Za předpokladu platnosti Hq má naše kritérium rozdělení r(22), protože Vi+V2 = 22.
152
Katedra matematiky PedF MUNI v Brně
K4: Pro a = 0,05 je tk(22) = ±2,09.
K5: Hodnota kritéria: 30'921~46'58 = 8,57, a tak H0 zamítáme.
Ovšem právě provedený ŕ-test nesplňoval předpoklad rovnosti rozptylů v obou skupinách: esíi a2 = ^ = 82,63, kdežto est2 a2 = ^ = 14,08. První odhad je přibližně šestinásobkem druhého, což už přesahuje rozumnou (= čtyřnásobnou) míru. Toto hrubé porušení předpokladu r-testu je důvodem k detailnějšímu prozkoumání dat pomocí neparametrického testu. Vhodným kandidátem nyní je Mannův-Whitneyův test.
Vraťme se datům z právě opuštěného příkladu 12.4 a podrobme jej Mannovu-Whitneyovu testu:
Kl: Uspořádejme všechna měření (z obou souborů dohromady) podle velikosti menej me přitom
a) pořadí dané hodnoty;
b) příslušnost dané hodnoty k experimentální skupině ( B ... běžná výuka, P ... počítačová výuka).
hodnota 1 2 3 4 5 6 7 8 9 10 11 12
pořadí 1 2 3 4 5 6 7 8 9 10 11 12
skupina P P P P P P P P P P P B
13 21 23 27 29 31 33 35 37 39 41 43 13 14 15 16 17 18 19 20 21 22 23 24 PBBBBBBBBBBB
K2: Nyní vypočteme jakési míry Ui, XJi\
U\ = (počet dětí z B, které mají horší skóre než dítě i).
děti ze skupiny P
Tedy pro dítě s hodnotou 1 na prvním místě pořadí má všech dvanáct dětí z B horší skóre. Pro dítě s hodnotou 2 na druhém místě pořadí má opět všech dvanáct dětí z B horší skóre, atd. až pro dítě s hodnotou 11 na jedenáctém místě má stále všech dvanáct dětí z B horší skóre. A konečně změna, pro dítě s hodnotou 13 na třináctém místě má už jen jedenáct dětí z B horší skóre. Dohromady
TJx = 12 + 12 + • • • + 12 +11 = 143.
N-*-'
jedenáctkrát
Podobně
U2 = / (počet dětí z P, které mají horší skóre než dítě i).
děti ze skupiny B
MA 0008 - Teorie pravděpodobnosti
153
Zde pouze pro dítě s hodnotou 12 na dvanáctém místě má jedno dítě z P horší skóre, tj.
£/i = l + 0 + 0 + -- - + 0 = l. v-v-'
jedenáctkrát
Z konstrukce Ui, U~2 je vidět, že tyto míry zachycují závažnost, s jakou má jedna skupina lepší pořadí než druhá. Samozřejmě existují poněkud pohodlnější vzorce pro jejich výpočet:
Ui = ri\ ■ 77-2 H---—^ 2 —- — (pořadí hodnot ze skupiny 2),
U~2 = ni ' ^2 H--"—^J2~—~ ~~ (pořadí hodnot ze skupiny 1)
(mimochodem, platí také XJ\ + U2 = ni-Ti2 - v našem příkladu tedy 143 +1 = 12-12). Kritériem testu bude nyní menší z obou vypočtených hodnot: U = mín(Ui, L^)- V našem příkladu U = mm (143,1) = 1.
K3: Kritická hodnota testu:
a) pro ni, 77-2 < 20: Byly sestaveny tabulky kritických hodnot našeho oboustranného testu, a to pro a = 0,05 tabulka 12.15, pro a = 0,01 tabulka 12.16.
b) pro 77!, 772 > 20: Rozdělení kritéria U je normální se střední hodnotou /i = a směrodatnou odchylkou
77i • 772 • (?7i + 772 + l)
12 ;
čili normovanou hodnotu
jj _ ni-n2
2
ra1-ra2-(ra1+ri2+l)
12
testujeme s běžnými kritickými hodnotami ±1,96 normálního rozdělení pro a = 0,05.
K4+K5: V našem příkladu tedy stanovíme kritickou hodnotu
a) z tabulky pro a = 0,05, ni = 772 = 12: Uk = 37 > U = 1, tj. Ho zamítáme ve prospěch alternativní hypotézy H\.
Všimněte si, že na rozdíl od většiny testů v této přednášce zde zamítnutí Ho nastane tehdy, když hodnota kritéria kritickou hodnotu NEPŘEKROČÍ. Je to dáno konstrukcí kriterijní funkce - pokud převáží malé hodnoty pořadí v jednom souboru, tak hodnota kritéria je malá, ale současně to znamená jasný a zřetelný rozdíl mezi skupinami.
154
Katedra matematiky PedF MUNI v Brně
b) pomocí aproximace normálním rozdělením (nyní méně přesné, ale výpočetně jednodušší):
jj _
A = —4,1 < —1,96 => Hq zamítáme
n1-n2-{n1+n2 + l) 12
ve prospěch alternativní hypotézy H\.
Vidíme, že výsledky neparametrického testu jsou stejné jako výsledky příslušného parametrického testu 12.4 s porušenými předpoklady. Z toho je vidět, že navzdory porušeným předpokladům ŕ-testu je i při silném rozdílu obou souborů výsledek testu správný, To ovšem nemusí být pravdou, pokud rozdíly mezi oběma skupinami nebudou tak jednoznačné, jak to dokumentují další situace v této kapitole.
12.4 Shrnutí
Cílem této kapitoly bylo představit další užitečné rozdělení pravděpodobnosti, a sice rozdělení \2. rozdělení x2(n) (° n stupních volnosti) se definuje jako součet čtverců n normovaných normálních rozdělení U2. Ukazuje se, že mnohé veličiny v praxi jsou rozděleny jako x2, a tedy toto rozdělení se vyskytuje v mnoha statistických testech:
1. V příkladu 12.1 jsme viděli, že rozdělení \2 lze užít v testu typu a2 = konst. Pokud měření jsme získali z populace, jejíž rozptyl je a2, pak kritérium
|2
"o2
má rozdělení x2 ° počtu stupňů volnosti in — 1).
2. V příkladu 12.2 jsme viděli, že \2 lze užít v testu, zda naměřená data odpovídají jistému teoretickému rozdělení pravděpodobnosti (toto je asi nejčastější a nejznámější využití rozdělení %2, kterému se říká test dobré shody). Pokud máme konkrétně n naměřených (či pozorovaných) četností fm, a jim odpovídající teoretické četnosti ft, pak kritérium
ft
má rozdělení \2 o počtu stupňů volnosti {n — 1).
3. V příkladu 12.3 jsme viděli, že x2 lze užít při testu nezávislosti hodnot v kontingenční tabulce o počtu řádků a sloupců J x K (contingent = závislý, podmíněný ... tj. test si klade otázku: do jaké míry jsou data pozorovaná přibližně stejná jako data vypočtená = nezávislá? tj: je mezi dvěma uvedenými veličinami nějaká závislost?). Tento test je specielním příkladem předchozího testu dobré shody, kdy za teoretické
MA 0008 - Teorie pravděpodobnosti
155
Tabulka 12.15: Kritické hodnoty Mannová-Whitneyova testu pro a = 0,05.
n-2
ri\ 3 i 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
1 — 2 - 0 0 0 0 1 1 1 1 1 2 2 2 2
3 - — 0 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8
4 0 1 2 3 4 4 5 6 7 8 9 10 11 11 12 13 13
5 2 3 5 6 7 8 9 11 12 13 14 15 17 18 19 20
6 5 6 8 10 11 13 14 16 17 19 21 22 24 25 27
7 8 10 12 14 16 18 20 22 24 26 28 30 32 34
8 13 15 17 19 22 24 26 29 31 34 36 38 41
9 17 20 23 26 28 31 34 37 39 42 45 48
10 23 26 29 33 36 39 42 45 48 52 55
11 30 33 37 40 44 47 51 55 58 62
12 37 41 45 49 53 57 61 65 69
13 45 50 54 59 63 67 72 76
14 55 59 64 67 74 78 83
15 64 70 75 80 85 90
16 75 81 86 92 98
17 87 93 99 105
18 99 106 112
19 113 119
20 127
156
Katedra matematiky PedF MUNI v Brně
Tabulka 12.16: Kritické hodnoty Mannová-Whitneyova testu pro a = 0,01.
_n2_
m 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
2- ---------------0 0
3- -----0001 1 122223 3
4 --00112234455667 8
5 012334567789 10 11 12 13
6 2 3 4 5 6 7 9 10 11 12 13 15 16 17 18
7 4 6 7 9 10 12 13 15 16 18 19 21 22 24
8 8 10 12 14 16 18 19 21 23 25 27 29 31
9 11 13 16 18 20 22 24 27 29 31 33 36
10 16 18 21 24 26 29 31 34 37 39 42
11 21 24 27 30 33 36 39 42 45 48
12 27 31 34 37 41 44 47 51 54
13 34 38 42 45 49 53 56 60
14 42 46 50 54 58 63 67
15 51 55 60 64 69 73
16 60 65 70 74 79
17 70 75 81 86
18 81 87 92
19 93 99
20 105
MA 0008 - Teorie pravděpodobnosti
157
pravděpodobnosti vezmeme ty, co jsou dány součinem součtových pozorovaných pravděpodobností, nikoli měřením. Za této situace má kritérium
Y2(fm — ft)2 ft
rozdělení %2 o (J — 1) • [K — 1) stupních volnosti.
V závěru kapitoly byl představen jeden příklad neparametrických testů. U parametrických testů byl obyčejně nějaký parametr rozdělení neznámý, a ten byl podroben danému testu (např. /i, a). Nyní u neparametrických testů žádný takový parametr není u daného testu k dispozici - odtud název „neparametrické".
Parametrické testy většinou lépe a rychleji vyvrátí hypotézu Ho, což je jejich cílem, pokud skutečně Ho má být zamítnuta. Když ovšem nejsou splněny tři důležité předpoklady POUŽITELNOSTI těchto testů, máme k dispozici pouze testy neparametrické.
Tabulka 12.17 uvádí přehled statistických testů neparametrických i parametrických, z nichž k některým jsme se v tomto textu vůbec nedostali, společně s přehledem situací a vhodností jejich použitelnosti.
12.5 Otázky k opakování a cvičení 12
U následujících výroků rozhodněte, zda se jedná o výrok pravdivý či nepravdivý.
Otázka 12.1 Rozdělení x2 o n stupních volnosti je součtem n stejně rozdělených veličin U.
Otázka 12.2 Rozptyl veličiny \2 o n stupních volnosti je roven hodnotě 2n.
Otázka 12.3 Protože hustota rozdělení x2 není symetrickou funkcí vzhledem k žádné přímce, některé kritické hodnoty mohou být záporné.
Otázka 12.4 Testy dobré shody lze používat jen u diskrétních náhodných veličin.
Otázka 12.5 Při oboustranném x2 testu jsou kritické hodnoty Xm> xl symetrické vzhledem k průměru, tj. Xm = Ex2 — d, x\ = Ex2 + d pro jistou hodnotu d.
Otázka 12.6 Pro rostoucí n se hustota rozdělení t2{n) blíží hustotě rozdělení x2(n)■
Otázka 12.7 Při testech v kontingenční tabulce je počet tříd četnosti vždy sudý.
Otázka 12.8 Test dobré shody je jednostranným (konkrétně pravostranným) testem.
Otázka 12.9 Mannův-Whitneyův test místo jednotlivých hodnot měření zpracovává jen pořadí těchto měření v souboru uspořádaném podle velikosti hodnot.
158
Katedra matematiky PedF MUNI v Brně
Tabulka 12.17: Přehled parám, i neparam. testů
data účel testu parametrický test nepař amet rický test
jeden vzorek zjistit, zda střední hodnota populace, ze které byl vzorek vybrán, se liší od jisté hodnoty ji0 [/-test či r-test znaménkový test
dva vzorky jednou zjistit, zda střední hodnoty populací, ze kterých byly vzorky vybrány, se rovnají [/-test či r-test pro nezávislé skupiny Mannův-Whitneyův test
jeden vzorek dvakrát zjistit, zda střední hodnoty populací, ze kterých byly vzorky vybrány, se rovnají [/-test či r-test typu „jeden vzorek dvakrát" znaménkový test nebo Wilco-xonův test
více než dva vzorky jednou zjistit, zda populace, ze kterých byly vzorky vybrány, mají tutéž střední hodnotu jednorozměrná ANOVA (F-test) Kruskalův-Wallisův test
jeden vzorek více než dvakrát dvakrát zjistit, zda populace, ze kterých byly vzorky vybrány, mají tutéž střední hodnotu jednorozměrná ANOVA opakovaného měření Friedmanův test
množina položek, z nichž každá má dva parametry zjistit, zda tyto parametry či proměnné jsou korelovány Pearsonův test korelace Spearmanův test korelace
jeden vzorek zjistit, zda populace, ze které byl vzorek vybrán, má jisté teoretické rozdělení test x2 typu 12.2.2 nebo 12.2.3 nebo Kolmogorovův-Smirnovův test
MA 0008 - Teorie pravděpodobnosti
159
Otázka 12.10 Neparametrické testy mají obecně větší sílu (= větší schopnost správně zamítnout Hq, když neplatí).
Úloha 12.1 Prodej Kola-loky má normální rozdělení se střední hodnotou 82000 lahví denně a směrodatnou odchylkou 1500 lahví denně. V zájmu výrobce je snížit tuto směrodatnou odchylku, protože by to učinilo obchod pružnějším. Proto se snaží o novou reklamu výrobku. Prvních deset dnů „nového" prodeje vykazuje tyto výsledky (v počtech prodaných lahví):
81752, 83812, 82104, 82529, 82620, 82033, 81925, 81599,82730,81885.
Ověřte oboustranným testem (z něho to bude také dobře vidět), zda nová reklama snížila směrodatnou odchylku počtu prodaných lahví za den.
Úloha 12.2 Výška mužů v USA má normální rozdělení se střední hodnotou 70 palců (jeden palec = 2,54 cm) a směrodatnou odchylkou dva palce. Antropologa Františka Neználka zajímá, zda muži kmene Bora-Bora mají tentýž rozptyl hodnot své výšky. Získá náhodně vybraný vzorek sedmi mužů kmene Bora-Bora:
69,68,68,67, 70, 71,69.
Může zamítnou nulovou hypotézu o stejných rozptylech?
Úloha 12.3 Honza Kovář pracuje v mincovně. Jeho úkolem je zajistit, aby mince byly dobře vyváženy - aby například při hodu desetikorunou padal rub i líc stejně často. Proto hodí stovkou desetikorun a padne mu 61-krát líc. Testujte následující hypotézy: Ho: pravděpodobnost padnutí líce je 0,5; H\: pravděpodobnost padnutí líce není0,5.
Úloha 12.4 Rozdělení IQ v České Republice je normální (v matematickém slova smyslu) se střední hodnotou 100 a rozptylem 225. Náhodně vybraný vzorek obyvatel Brna prokázal následující rozdělení IQ:
IQ < 55 55 - 70 70-85 85 - 100 100-115 115 - 130 130 - 145 > 145
četnost 20 17 29 52 63 42 13 14
Řekli byste, že brňané dostatečně stejně reprezentují Českou Republiku ve vztahu k IQ? Proveďte statistický test dobré shody v tomto případě.
Úloha 12.5 Je prováděn výzkum, který má potvrdit, že očekávání u člověka ovlivňuje výsledek experimentu. Každému z devíti náhodně vybraných učitelů Katedry matematiky je přidělen jeden náhodně vybraný student. Čtyřem učitelům je neformálně řečeno, že jejich student není zrovna nejchytřejší, pěti ostatním je řečeno, že jejich student je celkem inteligentní. Pak každý vyučující podrobil svého studenta testu ze statistiky, a pečlivě přitom pokládal otázky a zaznamenával počet chyb. Získala se data
160
Katedra matematiky PedF MUNI v Brně
a) U studentů, kteří byli nepřímo představeni jako inteligentní: 6, 8, 5, 12.
b) U studentů, kteří byli nepřímo představeni jako ne zrovna nejchytřejší: 10, 2, 14, 9,
4.
Ověřte neparametrickým testem, zda tato data potvrzují hypotézu, že vyučující, který studenta předem (= a priori) považuje za chytrého, mu napočítá méně chyb.
Úloha 12.6 Dělníky na stavbě zajímá otázka, zda mají ve svých kancelářích více knih politici nebo psychologové; navštíví kancelář několika z nich a spočítají všechny knihy na regálech. Určete pomocí neparametrického testu, zda existuje významný rozdíl v počtu knih u těchto dvou profesí.
a) Politikové (9 lidí): 87, 72, 65, 54, 67, 76, 73, 82, 104.
b) Psychologové (12 lidí): 131, 94, 77, 88, 116, 90, 87, 76, 95, 164, 127, 77.
Ověřte neparametrickým testem, zda tato data potvrzují hypotézu, že vyučující, který studenta předem (= a priori) považuje za chytrého, mu napočítá méně chyb.
Odpovědi na otázky a některá cvičení viz 14.12.
MA 0008 - Teorie pravděpodobnosti
161
13 Týden 13
13.1 Přednáška 13
Už bylo vše probráno, na eventuálníá poslední přednášce budou provedeny resty, které se nestihly, nebo zodpovězeny otázky z následujících zápočtových příkladů.
13.2 Cvičení 13: Zápočtové příklady 1-2
Následující sérii sedmi příkladů proveďte za pomoci Excelu podle následujícího postupu:
a) Odhadněte, jakým modelem popíšeme naměřená data, podle četností nebo interva-
lového rozdělení četností (nakreslete v Excelu histogram četností) - použijte v každém příkladu, co je vhodnější;
b) Pak z měření vypreparujte parametry potřebné pro teoretický popis;
c) pomocí teoretického modelu vypočtěte teoretické četnosti (uveďte v tabulce v Excelu),
d) a nakonec testem \2 (cni' kvadrát) porovnejte, zda je navržený teoretický model ve
shodě s naměřenými daty (test chí kvadrát proveďte také v Excelu, který tento test obsahuje).
Úloha 13.1 51.99882, 54.62071, 58.34618, 52.33503, 54.34023, 50.44404, 48.23762 48.86250, 48.15060, 49.31562, 55.05544, 46.74591, 49.41650, 44.01911, 47.74186 46.58175, 55.90116, 60.99310, 45.26392, 52.18025, 47.90630, 47.18151, 54.81286 55.36082, 50.31988, 55.96361, 57.07858, 50.38156, 41.96963, 54.28295, 51.96203 42.72137, 48.71775, 58.25657, 4441251, 43.88321, 56.95593, 52.75391, 45.94371 38.85037.
Nápověda: pravděpodobně se bude jednat o normální rozdělení S3 - zjistíte po provedení intervalového rozdělení četností.
Úloha 13.2 0.31679, 0.19195, 0.03202, 0.10703, 0.33120, 0.00305, 0.15606, 0.02107, 0.07481, 0.05017, 0.1332, 0.19609, 0.08193, 0.08473, 0.03614, 0.15838, 0.13192, 0.06462, 0.06559, 0.24249, 0.04222, 0.03124, 0.35355, 0.00125, 0.06360, 0.11149, 0.03475, 0.17893, 0.06980, 0.16811, 0.01520, 0.09588, 0.00583, 0.03656, 0.03999, 0.06500, 0.12474, 0.06415, 0.07629, 0.21434.
Nápověda: zkuste exponenciální rozdělení Exp(X).
Úloha 13.3 8.398068, 47.183415, 11.655249, 19.874558, 35.560654, 13.948998, 59.421469, 52.361322, 15.931113, 54.191444 , 2.283628, 22.631475, 44.125797, 53.957976, 57.499843, 29.170605, 11.832367, 34.954316, 25.5474U, 4.719695, 16.023275, 14.554789, 46.299197, 36.764952, 57.274647, 24.112847, 5.281371, 9.604469, 26.929707, 51.412021, 32.699513, 33.283787, 37.283912, 30.088545, 35.840679, 48.711673, 57.638311, 59.552026, 10.683609, 39.997975.
Nápověda: zkuste rovnoměrné spojité rozdělení, model s2. Je to dobře vidět z intervalového rozdělení četností.
162
Katedra matematiky PedF MUNI v Brně
Úloha 13.4 8, 8, 5, 12, 11, 15, 12, 9, 6, 7, 9, 7, 12, 7, 11, 12, 8, 6, 12, 7, 5, 7, 10, 10, 9, 13, 9, 11, 9, 6, 13, 11, 6, 10, 12, 6, 5, 8, 13, 10, 10, 13, 13, 7, 12, 10, 11, 7, 11, 8.
Nápověda: zkuste rovnoměrné diskrétní rozdělení, model Dl. Bude to patrno z intervalového rozdělení četností.
Úloha 13.5 5, 6, 6, 11, 5, 5, 5, 2, 11, 5, 6, 3, 8, 4, 9, 5, 10, 7, 11, 8, 6, 8, 4, 3, 2, 7, 2, 4, 4, 4, 7, 7, 8, 7, 4, 2, 4, 4, 7,6.
Nápověda: zkuste binomické rozdělení, model D3. Zvolte N = 11 (největší hodnotu), a pak z odhadu X = N ■ p odhadněte p ... bude asi blízké jedné polovině.
Úloha 13.6 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 1, 1, 1, 1, 0, 0, 1, 1, 0, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 2, 0, 0, 1, 0, 0, 3, 1, 0.
Nápověda: zkuste Poissonovo rozdělení, model D5.
Úloha 13.7 6, 0, 7, 2, 5, 11, 6, 0, 2, 2, 11, 0, 19, 21, 8, 0, 2, 14, 8, 5, 0, 21, 2, 6, 18, 6, 0, 6, 12, 6, 0, 0, 11, 3, 4, 0, 0, 6, 12, 2, 12, 0, 7, 4, 3, 6, 7, 0.
Nápověda: zkuste geometrické rozdělení, model D4- Zkuste nějak vypreparovat hodnotu p z odhadu střední hodnoty: X = Asi do čitatele odečtěte a přičtěte jedničku, rozdělte pak na dva zlomky, ten první zjednodušíte, a z rovnice vyjádříte p.
13.3 Cvičení 13: Zápočtové příklady 3-10
Vypočtěte následující příklady = odpovězte na otázky:
3) Pro a = 0,05 testujte hypotézu, že střední hodnota průměru měření veličiny je ve skutečnosti rovna 11:
9, 7, 12, 7, 11, 12, 8, 6, 12, 7, 5, 7, 10, 10, 9, 13, 9, 11, 9, 6, 13, 11, 6, 10, 12, 6, 5, 8, 13, 10, 10, 13, 13, 7, 12, 10, 11, 7, 11, 8.
4) Zjistěte jo-hodnotu předchozího testu z otázky 3. Pomoc, kterou asi budete potřebovat: Pokud jste v předchozí otázce použili r-test (což jste udělali dobře), je možné, že budete nyní potřebovat spočítat obsah podgrafu hustoty r-rozdělení v jiných mezích, protože v tabulce r-testu ve skriptech se vyskytuje jen několik kritických hodnot - zkuste použít Excel k nalezení potřebného obsahu podgrafu.
5) Sestrojte 95%-ní interval spolehlivosti pro střední hodnotu průměru 40 hodnot veličiny z otázky 3. V jakém vztahu je tento interval s výsledkem testu v otázce 3?
6) Najděte kvantily následujících diskrétních rozdělení psti, ovšem nestačí výsledek -měli byste využít vektor dostatečného počtu15 hodnot pstí p(k), a také příslušných kumulativních pstí cp(k), které uveďte do tabulky jako součást vašeho řešení.
a) Najděte 0,38-kvantil rozdělení Bi(N = A0,p = 0,3). 5Pokud k nabývá nekonečně mnoha hodnot, nemusíte je všechny vypisovat, stačí ta správná část :-).
MA 0008 - Teorie pravděpodobnosti
163
b) Najděte 0,78-kvantil rozdělení Po(\ = 2), kde A je průměrný počet výskytů jisté náhodné události za hodinu (o jakou náhodnou událost by se mohlo například jednat?).
7) Najděte kvantily následujících spojitých rozdělení psti pomocí distribuční funkce F(x), ovšem nestačí výsledek, musíte provést a popsat celý postup - dále nemůžete využít žádný software, pouze kalkulačku, pokud se týká exponenciálního rozdělení, nebo tabulku distribuční funkce rozdělení U, pokud se týká normálního rozdělení.
a) Najděte 0,78-kvantil rozdělení Exp(\ = 2).
b) Najděte 0,38-kvantil rozdělení No(/i = 50, a = 10).
8) a) Pomocí binomického rozdělení vypočtěte: Experti odhadují, že o šampon V-
protilup bude mít zájem jen 30% jeho bývalých uživatelů, protože po vánocích podražil o padesát procent. Vypočtěte pst (za předpokladu správnosti odhadu expertů), že ze 40 bývalých uživatelů si jej v drogerii nadále koupí aspoň 15 lidí.
b) Pomocí náhrady binomického rozdělení normálním s korekcí vypočtěte přibližně pst z části (a).
9) a) Veličina X má rozdělení Poissonovo s průměrným počtem výskytů náhodné
události A = 2 za hodinu. Jaká je pst, že za konkrétní hodinu měření veličiny dojde ke dvěma a více výskytům této události?
b) Pomocí náhrady Poissonova rozdělení normálním s korekcí vypočtěte přibližně pst z části (a).
10) a) Náhodná veličina Y má rozdělení Exp{\ = 2), kde A je průměrný počet výskytů za hodinu. Vypočtěte psti P(Y < 30min), P(Y > AOmin) ... uveďte celý výpočet, nejen výsledek.
b) Náhodná veličina X má rozdělení No(/i = 50, a = 8). Vypočtěte psti P(X < 55), P(X > 40) ... uveďte celý výpočet, včetně využití tabulek distribuční funkce rozdělení U.
164
Katedra matematiky PedF MUNI v Brně
14 Odpovědi na otázky a výsledky některých cvičení
14.1 Výsledky cvičení 1.2
Zatím nebyly zadány žádné otázky. Výskledky cvičení:
Ad 1.1: Napíšeme do polí BI až B50 čísla: pět čísel 4, deset čísel 6, atd. Pak zadáme do pole např. B51 funkci =PRŮMĚR(B1:B50) a dostaneme hodnotu 8,74.
Ad 1.2: Toto je typický příklad, kde použijeme geometrický průměr. Geometrický průměr využijeme právě u příkladů, kde se počítá průměrný roční (denní, měsíční) zisk, výdělek, produkce,... nějaké veličiny za několik let (dní, měsíců). Všimněte si, že naše údaje v procentech jsou vlastně podíly. A to vždy hodnota růstu firmy za letošní rok lomeno hodnotou růstu, za rok předcházející
Pro výpočet tedy použijeme funkci GEOMEAN ve tvaru =GEOMEAN(C3:C7). Dostaneme výsledek 102,2271%. Výsledek nám tedy říká, že v průměru se každý rok prodalo o 2,27% více než předchozí rok.
Pokud byste chtěli příklad počítat podle vzorečku pro geom. průměr, tak by to vypadalo následovně: xG = ^101, 3 • 108, 5 • 100, 6 • 98, 7 • 102, 3 = 102,2271 %.
Ad 1.3: Pro výpočet tohoto příkladu využijeme harmonický průměr. Harmonický průměr se typicky využívá při počítání hodnot, které jsou převrácenými hodnotami jiné veličiny.
Víme tedy, že budeme počítat průměr harmonický. Zadáme tedy do excelu funkci =HARMEAN(1,2,4,1) a dostaneme že průměrná rychlost slona byla 1,4545 km/h.
Zde jsem nepoužil souřadnice buněk, ale čísla do funkce psal rovnou, jelikož u takto malého počtu hodnot, je to rychlejší.
Pokud byste chtěli počítat pomocí vzorečku, ten by vypadal následovně: xh = = 1,4545.
14.2 Výsledky cvičení 2.3 Odpovědi na otázky
2.1 - A, 2.2-A, 2.3-A, 2.4 - N (ale lze, třetí axiom psti se často použije pro konečně mnoho disjunktních náhodných jevů), 2.5 - N (P(A) musíme odečíst od jedničky), 2.6 - N (nemusí - stačí, když je v A tolik náhodných jevů, že jsou splněny dané tři axiomy jevového pole - íl E A a A je uzavřená na rozdíly dvou libovolných jevů a sjednocení nekonečně mnoha po dvou disjunktních náhodných jevů), 2.7 - N (vzorec platí jen tehdy,
MA 0008 - Teorie pravděpodobnosti
165
když jevy A, B jsou disjunktní).
Výsledky příkladů Ad 2.1: a) V excelu sestavíme následující tabulku:
Tabulka 14.18: Tabulka velikostí prodaných obleků
Velikost obleku Počet prodaných kusů
37 1
38 3
39 5
40 9
41 12
42 10
43 5
44 0
45 1
Hodnoty této tabulky poté označíme a klikneme na "vložení" dále "doporučené grafy" a vybereme "skupinový sloupcový". Tím nám excel vykreslí histogram četností velikostí obleků. Ještě najedeme na histogramu na "prvky grafu," zde necháme zaškrtnuté možnosti "osy, názvy os, název grafu a mřížka". Poté už jen napíšeme název grafu a názvy os. Kliknutím pravým tlačítkem na některý ze sloupců se objeví volba, vybereme FORMÁT DATOVÉ RADY a nastavíme na mezery na cca 3 procenta a překrytí na 0 procent ... objeví se histogram, malá mezera funguje jen jako bílé ohraničení obdélníků:: Při vytváření polygonu pracujem téměř stejně jako u vytváření histogramu, akorát místo "skupinový sloupcový" vybereme "spojnicový". Excel nám vykreslí polygon. Opět v sekci "prvky grafu" doplníme polygon o názvy os a název grafu.
b) Zde naši tabulku doplníme o další tři sloupce, v jednom bude relativní četnost ta se počítá počet všech obleků celkem (tedy 46) děleno počet obleků dané velikost ( 1 u velikosti 37, 3 u velikosti 38 atd.) krát 100 a máme relativní četnost v %. Ve druhém sloupci bude kumulativní absolutní četnost - zde pouze sčítáme četnosti jednotlivých velikostí (např u velikosti 40 bude součet četností velikostí 37, 38, 39 a 40, tedy 1+3+5+9 a to je 18). U komutativní relativní četnosti pracujeme velmi podobně jako u absolutní jen sčítáme již vypočítanou relativní četnost. Výsledkem je tabulka
166
Katedra matematiky PedF MUNI v Brně
Histogram četností prodaných obleků
14
12
37 38 39 40 41 42 43 44 45
velikost obleku
Obrázek 14.19: Histogram četností prodaných obleků.
Polygon četností prodaných obleků
Velikost obleků
Obrázek 14.20: Polygon četností prodaných obleků.
Vel. obleku prod, kusů Rel. četnost Kum. četnost Kum. rel. četnost
37 1 2,17% 1 2,17%
38 3 6,52% 4 8,69%
39 5 10,87% 9 19,57%
40 9 19,57% 18 39,13%
41 12 26,09% 30 65,22%
42 10 21,74% 40 86,96%
43 5 10,87% 45 97,83%
44 0 0% 45 97,83%
45 1 2,17% 46 100,00%
c) Modus - velikost, která má největší četnost - mod = 41. V excelu pomocí =MODE(B6:B51) = 41 (V buňkách B6 až B51 jsou velikosti obleků)
MA 0008 - Teorie pravděpodobnosti
167
Medián - hodnota, která dělí řadu na dvě stejné poloviny v našem případě, jelikož máme sudý počet prvků je medián arit průměr 23. a 24. prvku, jelikož 23. prvek i 24. prvek je velikost 41, tak i med = 41. V excelu pomocí =MEDIAN(B6:B51) = 41 Arit. průměr (zde bez komentáře) x = 40, 83
Rozptyl uděláme rovnou v excelu, protože to je nejjednodušší. =VAR.P(B6:B51) = 2,535
Stejně tak je jednodušší dělat směrodatnou odchylku rovnou v excelu, nebo prostě můžeme jen rozptyl odmocnit. =SMODCH(B6:B59) = 1,592
d) Variační rozpětí uděláme opět v excelu. Zde použijeme funkce MAX a MIN
a odečteme je od sebe. Je to tedy rozdíl mezi největším a nejmenším prvkem. Lze ho tedy určit v tomto případě snadno. Pomocí excelu je to tedy =MAX(B6:B51)-MIN(B6:B51) = 8
Mezikvartilové rozpětí představuje rozdíl mezi třetím a prvním kvarti-lem, tak ho tedy i spočítáme pomocí excelu. =QUARTIL(B6:B51;3)-QUARTIL(B6:B51;1) = 2.
Pokud necháme předešlé dva vzorečky osamote a nebudeme je odečítat, máme rovnou i první a třetí kvartil.
e) Tyto kvantily vypočítáme pomocí funkce PERCENTIL.
Takže =PERCENTIL(B6:B51;45%) = 41, =PERCENTIL(B6:B51;57%) = 41, =PERCENTIL(B6:B51;86,9%) = 42,105.
Ad 2.2: Nejprve si sestrojíme intervaly, do kterých pak naše hodnoty zařadíme. Jak na to? Použijeme Sturgesovo pravidlo, to nám řekne, kolik budeme mít intervalů. Pravidlo vypadá takto: 1 + 3,3- log n = V našem případě tedy 1 + 3,3- log 27 = 5,72 Zvolíme tedy 6 intervalů. Teď ještě šířku intervalu. Tu zjistíme podle vzorečku: největší hodnota minus nejmenší hodnota lomeno počet intervalů. V našem případě tedy. 45061~12736 = 53 87, 5. Zaokrouhlíme na 5 400 (je třeba vždy zaokrouhlit na číslo větší, jinak se může stát, že některá hodnota nespadne do žádného intervalu).
Nyní sestavíme tabulku s rozdělením četností.
Cena bytu Počet měst Rel. četnost Kum. četnost Kum. rel. četnost
12 700 - 18 100 11 40,74% 11 40,74%
18 100 - 23 500 11 40,74% 22 81,48%
23 500 - 28 900 3 11,11% 25 92,59%
28 900 - 34 300 1 3,7% 26 96,29%
34 300 - 39 700 0 0% 26 96,29%
39 700 - 45 100 1 3,7% 27 100%
Následující výpočty budou dělány v excelu.
Výpočet průměru (bez komentáře): x = 20318,41
168
Katedra matematiky PedF MUNI v Brně
Výpočet rozptylu: =VAR.P(A2:A28) = 40 475 082,02
Výpočet směr. odchylky: =SMODCH(A2:A28) = 6 362
Výpočet variačního rozpětí: =MAX(A2:A28)-MIN(A2:A28) = 32 325
Výpočet kvantilů je složitější. Nejprve musíme vynásobit hledaný kvantil číslem n+1. V našem případě 0,25 • 28. Dostaneme číslo 7. Hledáme tedy hodnotu 7. prvku intervalu. Tu zjistíme pomocí vzorce:
(n + 1)-a- ca
xa = a H---——-■ [b — a)
n(a; b)
Kde a - dolní mez intervalu, b - horní mez intervalu a ca - kumulace v bodě dolní meze intervalu
V našem případě tedy:
28-0,25 -0 x0,25 = 127 00 +--- 5400 = 16136.
Nyní výpočet 0,85-kvantilu. Opět uděláme 0,85 • 28. Zde dostaneme hodnotu 23,8. To, že nám nevyšlo číslo celé nám nevadí a počítáme dále. Nalezneme tedy interval, kde je 23,8. hodnota a dosadíme do vzorečku.
28 0 85 _22
x0,85 = 23500 + ——2--- 5400 = 26740.
O
ad 2.3 ad a) Příslušné hodnoty četností v% a pravděpodobností p(ui) jsou v tabulce:
Vi 1 2 3 4 5
c{vi) 19 11 17 19 11
P(Vi) 0,247 0,143 0,221 0,247 0,143
ad b) Využijeme vzorce pro případ známých četností: x = 2,896, s2 = 1,937, s = 1,392.
ad 2.4 Uvedený příklad ilustruje možnost vytváření rozdělení četností i ve spojitém případě.
ad a) Příslušné rozdělení četností pro vytvořené třídy je v tabulce:
interval (=třída) <0;3) <3;6) <6;9) < 9; 12) < 12; 15) <15;oo)
reprezentant třídy 1,5 4,5 7,5 10,5 13,5 16,5
četnost třídy 14 9 2 2 1 1
ad b) X = ^ • J2xi = 4,2276, s2 = 17,3964, s = 4,1709.
MA 0008 - Teorie pravděpodobnosti
169
ad c) X = 4,3966, s2 = 15,1958, s = 3,8982. Hodnoty b) jsou samozřejmě přesnější, ale pokud bychom měli k dispozici jen intervalové rozdělení četností a už neměli přístup k původním hodnotám měření, tak x, s2 a s vypočtené zde nám dávají celkem solidní popis veličiny X (četnosti v posledních dvou intervalech jsou rovny jedné - kdybychom tedy místo středu intervalu brali jako reprezentanta příslušnou jedinou hodnotu, parametry ad c) by byly ještě lepším odhadem přesných ad b) ).
14.3 Výsledky cvičení 3.3 Odpovědi na otázky
3.1-N, 3.2-A, 3.3-N (může a nemusí, ale striktně tro zakázáno není; stene pravděpodobnosti jsou speciálním případem diskrétní pravděpodobnosti), 3.4-A (pro a = b je f{x)dx = 0 pro jakékoli a; odtud také plyne, že v axiomu 3 pro hustotu psti mohou být v intervalu ostré i neostré závorky a výsledek je stále stejný), 3.5-N (například ve 3.6 má hustota f(x) bod nespojitosti v nule), 3.6-A, 3.7-A, 3.8-N (například pro f(x) = 3 na intervalu (0; |) a f(x) = 0 pro ostatní x vidíme, že funkční hodnoty jsou větší než 1, a přesto se jedná o hustotu psti - nezápornou funkci, z níž je integrál od minus nekonečna do plus nekonečna roven jedné).
Výsledky příkladů:
Ad 3.1: a) krabička padne naplocho s psti |||, b) krabička padne na bok s psti c) krabička padne na výšku s psti -j^.
Ad 3.2: a) sudé číslo s psti: n = 18, m = 9 (2,4,6,8,10,12,14,16,18), tj. P (A) = ^ = 0, 5 = 50%.
b) číslo dělitelné 3 bude vytaženo s psti: n = 18, m = 6 (3,6,9,12,15,18), tj. P (A) = ^ = 0, 33 = 33%.
c) prvočíslo bude vytaženo s psti: n = 18, m = 7 (2,3,5,7,11,13,17), tj. P (A) = ^ = 0, 389 = 38, 9%.
d) číslo dělitelné 6 s psti: n = 18, m = 3 (6,12,18), tj. P(A) = ^ = 0,166 = 16, 6%.
Ad 3.3: a) součet 8, možnosti: 2,6;6,2;4,4;5,3;3,5 n=36, m=5, tj. P (A) = ^ = 0,139 = 13, 9%.
b) součet, který je dělitelný pěti, možnosti: 5,5;1,4;4,1;2,3;3,2;4,6;6,4 (součet bude 5 nebo 10)
n=36, m=7, tj. P (A) = ^ = 0,194 = 19,4%.
c) součet, který bude sudý, možnosti: 1,5;5,1...4,4;5,5;6,6
n=36, m=18, tj. P(A) = § = 0, 5 = 50%.
170
Katedra matematiky PedF MUNI v Brně
Ad 3.4: a) pst součtu 11: n = 63 =
(6,4,1) ..P(3)=3!=6
(6,3,2) ..P(3)=3!=6
(4,5,2) ..P(3)=3!=6
(5,5,1) ..P * 2,1(3) = 3! 2! 3
(3,3,5) ..P * 2,1(3) = 3! 2! 3
(4,4,3) ..P * 2,1(3) = 3! 2! 3
m=27
P(A) = = 1 = 0,125 = 12 5%
b) pst součtu 12 n = 63 = 216,
(6.5.1) ...P(3)=3!=6
(6.4.2) . ..P(3)=3!=6
(5.4.3) . ..P(3)=3!=6 (3,3,6)...P*2,1(3) = | = 3 (5,5,2)...P*2,1(3) = | = 3
(4.4.4) ...P*3(3) = | = 1 m=25
P {B) = H = 0,116 = 11,6%
Tedy G.Galilei doporučil vsadit na součet 11, protože -P(ll) > -P(12).
Ad 3.5: a) B = {(1, 5,), (2, 4), (3, 3), (4, 2), (5,1)}; b) padne součet alespoň 7; c) A C C; d) jsou neslučitelné; e) B C C; f) padne součet menší než 6.
Ad 3.6: a) 15 (jednotlivé navzájem odlišné výsledky lze popsat např. pomocí čísel tahů, ve kterých byla vybrána bílá koule - to jsou dvoučlenné kombinace ze šestiprvkové množiny).
b) 5 (tyto výsledky si můžeme představit jako uspořádané šestice (B,B,C,C,C,C),(B,C,B,C,C,C),(B,C,C,B,C,C),(B,C,C,C,B,C),(B,C,C,C,C,B)).
c) 3 (tyto výsledky si můžeme představit jako uspořádané šestice (B,B,C,C,C,C),(B,C,B,C,C,C),(C,B,B,C,C,C).
d) „během prvních tří tahů byla vylosována nejvýše jedna bílá koule" nebo také „v posledních třech tazích byla tažena alespoň jedna bílá koule".
e) 10 (obě bílé koule musí být taženy v prvních pěti tazích, tj.jde o dvoučlenné kombinace z pětiprvkové množiny).
f) B C C.
g) bílé koule byly taženy v prvním a čtvrtém nebo v prvním a pátém tahu. Ad 3.7: a) A n B n C, b) A n B n ľľ,
c) (A n B nč) u (Än B nč) u (Än B n C),
MA 0008 - Teorie pravděpodobnosti
171
d) (A n B n C) u (A n B n C) u (A n B n C) u (A n s n C) u (A n s n C) u (A n 5nc)u(in5nc) = iufiuc,
e) (A n s n č) u (A n š n C) u (Ä n B n C),
f) (A n B n č) u (A n š n C) u (Ä n s n C) u (A n s n C),
g) AnBnC,
h) (Ä n B n Č) u (A n ď n č) u (Ä n s n Č) u (Ä n Š n C) u (A n s n Č) u (A n s n C) u (A n s n C) = (A n B n C).
Ad 3.10: a) 1,21%; b) 0,45%; c) 5,88%.
14.4 Výsledky cvičení 4.3 Odpovědi na otázky
4.1-A, 4.2-N (ale může - nule nemůže být rovno v tomto případě jenom P (B), protože to při výpočtu dosazujeme do jmenovatele), 4.3-A (odpověď je sice ANO, jedná se o de Morganovo pravidlo pro čtyři množiny:
ale počítat tuto pst přímo není vůbec jednoduché, protože náhodný jev At se vyjadřuje pouze tím, jaká volba nesmí být na z-té pozici; zde právě vypočteme pst sjednocení A\ U A2 U A3 U a4 a odečteme od jedničky), 4.4-A, 4.5-A (například tehdy, když všechny dílčí jevy jsou stochasticky nezávislé; protipříkladem je příklad 4.4, kde při výpočtu psti průniku můžeme použít jen pravou stranu rovnosti, nikoli levou), 4.6-A, 4.7-N (v jednom případě tento vzorec nemá smysl, a tedy neplatí, a sice když P (A) = 0), 4.8-A.
Ad 3.9: 2 ' 2 ' 2 ' 2 ' (2)
16
• g) = 0,375.
A1 U A2 U A3 U A4 = A1 n A2 n A3 n A4
172
Katedra matematiky PedF MUNI v Brně
Výsledky příkladů
Ad 4.1 P(Z3 — Zl — Z2) = tJq = O, 05 ... podrobnější vysvětlení viz slajdy na cvičení, nakreslete si též obrázek - viz cvičení samotné.
Ad 4.2 Výsledek viz cvičení dvěma způsoby: nejprve nakreslete množiny S±, S2, S3 v jejich obecné poloze, a všechny prvky umístěte do správné části množiny. Druhý způsob: použijte vzorec pro pst sjednocení.
Ad 4.3 62,5% .
Ad 4.4 P(A) = P(umí právě dvě)+P(umí všechny)= 0,4680 + 0, 2808 = 74, 88% P(složí
20 10 20
ykniiškuW (2HD + ii) = 20 19 10 , 20 10 19 , 10 20 19 , 20 19 18 / ,30 "r 30 30 29 28 ^ 30 29 28 ^ 30 29 28 ^ 30 29 28' v 3) v 3)
Za posledním rovnítkem je vlastně uveden druhý způsob řešení, který spočívá v použití věty o součtu a na jednotlivé členy součtu použijeme větu o součinu, tj. počítáme všechny dílčí psti vytažení otázky, kterou student umí, respektive otázky, kterou student neumí.
Ad 4.5 SMM^ = ±.l..± + m.±.± + £.£.m tedy 9,75%. Před rovnítkem
i za rovnítkem jsou dva různé způsoby řešení téhož: buď můžeme pracovat s kombinačními čísly, kdy se nezajímáme o pořadí v daném tahu, nebo jdeme postupně všechny možnosti vytažení jedné kuličky ve známém vzorci spojujícím pst sjednocení neslučitelných jevů, a každý neslučitelný jev ještě počítáme pomocí vzorce pro průnik závislých jevů. V obojím způsobu dostaneme pst 0,0975.
/900\ /900\ /900\
Ad 4.6 a) 0,1; b) 1 - ^ = 0,4102; c) 1 - ^ = 0,6531; d) 1 - ^ = 0,8810.
Ad 4.13 a) 1 — 0, 53 — 0, 53 = |; b) |2 = y^; c) |4 = 7^; d) ne, počet losování může být teoreticky libovolně velký.
Ad 4.14 0,8-0,9-0,7 = 0,504.
Ad 4.15 a) 0,1 • 0, 85 • 0, 95 + 0, 9 • 0,15 • 0, 95 + 0, 9 • 0, 85 • 0, 05 = 0, 24725, b) 0, 24725 + 0, 9 • 0, 85 • 0, 95 = 0, 974.
io = _5_. i \ io. \ io JL^io A. _l JL IQ _5_
24 12' D) 23' / 23 ' 24 23 ' 23 ^ 23 ' 23 12'
Ad 4.19 a) = ig = JĽ; b) i; c
14.5 Výsledky cvičení 5.5 Odpovědi na otázky
5.1-A, 5.2-N (nabývat může navíc ještě hodnotu 0), 5.3-A (veličina Y udává, s jakou pstí naměříme v N opakováních experimentu relativní četnost úspěchu; její hodnoty nejsou tedy celočíselné, ale psti, kterých nabývá, jsou stále Bernoulliovy psti), 5.4-N (při neprázdném průniku PLl n Hj bychom museli vzorec pozměnit a nějakou pst odečíst, protože pst možných výsledků v průniku jevů bychom počítali dvakrát), 5.5-A, 5.6-N
MA 0008 - Teorie pravděpodobnosti
173
(v situaci zmetkovitosti balení bonboniér například Y^\P{A\Hi) = 0,11. Tyto psti jsou vázány jevem A a jejich součet roven jedné být nemusí), 5.7-A (výrazy na obou stranách počítají pst průniku jevů A n Hl a průnik je operace komutativní, tj. použitím obecné věty o průniku jevů dostaneme obě možnosti), 5.8-A, 5.9-A (odpověď je sice ANO, ale k praktickému výpočtu vzorec není, protože P (A) v čitateli zlomku na pravé straně rovnosti lze zkrátit se jmenovatelem zlomku a dostaneme rovnost P(Hi\A) = P(Hi\A)).
Výsledky příkladů Ad 5.2: P(X = 3) = • 0,13 • 0,97 = 0,0574. Ad 5.3: a) 0,2416; b) 0,1762; c) 0,1445. Ad 5.4: a) 0,3277, b) 0,2048.
Ad 5.5: a) Označme A ... náhodně vybraná cihla je super (bez ohledu z jaké cihelny je). Pak
p(A) = 0,8+0,65+0,65+0,72+0,72 = 1 , Q g + | , Q^ 65 + | • 0, 72 = 0, 708.
b) apriorní pst P (Cl) = 0, 20 je známa už ze zadání; jak se tato hodnota liší od aposteriorní psti P(Ci\A) po prozkoumání náhodně vybrané cihly a zjištění, že tato je superkvalitní? Použijeme Bayesův vzorec
P(c1|.4) = fl^p = = ^JXkt, = °'226' Ted>' Vldíme- Že P° určení superkvality cihly její pst, že pochází z nejlepší cihelny (s největším procentem super kvalit nich cihel), je trochu vyšší.
Ad 5.6: P (A) = °A±p£ = i . 0, 8 + § • 0, 8 = 0, 75555.
Hi ... náhodně vybraný hráč je začátečník ... P(H1) = | = 0, 1111; H2 ... náhodně vybraný hráč je pokročilý ... P(H2) = |. Víme: koš byl trefen ... Nevíme: nastal Hl?
P(Hi\A) = = P(gl^|gl) = ěgš4 = 0,0588 (apriorní pst 0,1111 se po
dodání informace „hráč se trefil" snížila na aposteriorní pst 0,0588).
Ad 5.7: a) P (A) = ^j- + ^ = 0, 68485.
b) P(Hi\A) = oji = 0,9734. Tedy apriorní pst P(Hi) = g = 0,80 se po dodání informace, že tento televizor byl označen expertem za kvalitní, zvýšila na aposteriorní P(Hľ\A) = 0,9734.
174
Katedra matematiky PedF MUNI v Brně
Ad 5.8: a) ^ = 0,025; b) ^ • 0, 5 + ^ • 0, 5 = 0,0267.
Ad 5.9:
0,9-0,95
0,9771.
0,9-0,95+0,1-0,2
Ad 5.10:
0,87-0,72-0,35
0,5001.
0,87-0,72-0,35+0,87-0,28-0,65+0,13-0,72-0,65
14.6 Výsledky cvičení ke kapitole 6
Zde nejsou žádné výsledky, protože všechny příklady v dané kapitole jsou uvedeny včetně řešení.
14.7 Výsledky cvičení 7.2
ad 7.1 ad a) p0 = 0,167; p1 = 0,278; p2 = 0,278; p3 = 0,278. Musí platit ^p, = 1 (přesně to tak není díky tomu, že jednotlivé pravděpodobnosti jsou zaokrouhleny na tři desetinná místa).
ad b) Distribuční funkce je schodová funkce analogická např. distribuční funkci z příkladu 7.1 na přednášce s tím rozdílem, že nyní má čtyři schody v bodech 0, 1, 2, 3 o výškách po, pi, p2, p3.
ad c) EX = | = 1,6667, DX = 1,114222.
ad 7.2 X udává počet úspěšných pobytů na pálce ze dvou možných - může tedy nabývat hodnoty 0, 1 nebo 2. Pravděpodobnost, že ani jeden ze dvou pobytů na pálce nebude úspěšný, vypočteme jako pravděpodobnost průniku jevů (pobytlne)n(pobyt2ne): P(X = 0) = 0,75 • 0,75 = 0,5625. Podobně snadný je výpočet pravděpodobnosti, že oba pobyty byly úspěšné - zde při výpočtu průniku jevů (pobytlano)n(pobyt2ano) podle ?? máme P(X = 2) = P((pobytlano)n(pobyt2ano)) = P(pobytlano)-P(pobyt2ano|pobytlano)= 0,25 • 0,35 = 0,0875. Nej komplikovanější je výpočet pravděpodobnosti, že ze dvou pobytů bude úspěšný právě jeden. Respektive pokud bychom využili toho faktu, že součet diskrétních pravděpodobností je roven jedné, máme P(X = 1) hned: P(X = 1) = 1 — 0,5625 — 0,0875 = 0,35. Z pedagogických důvodů vypočtěme P{X = 1) ještě jinak, že totiž sečteme pravděpodobnost navzájem se vylučujících situací: P(X = 1) = P((pobytlano)n(pobyt2ne))UP((pobytlne)n(pobyt2ano)) = P((pobytlano)n(pobyt2ne))+P((pobytlne)n(pobyt2ano)). Takže dostaneme P(X = 1) = 0,25 • 0,65 + 0,75 • 0,25 = 0,35 - vyšlo to!!
ad 7.3 a) 0,02625 b) 0,03125 c) 1 - 0,03125 = 0,96875 d) 0,625 e) 1 f) F(x) určíme podle nenápadného vzorce v textu, který ani nemá číslo. Tak už to v životě bývá, že ty nej důležitější vzorce a události dějin zůstávají zapomenuty; strašně mě zaráží jedna taková věc z Bible, z knihy Přísloví:
Bylo malé město a v něm hrstka mužů. Tu přitáhl na ně velký král, obklíčil je a zbudoval proti němu mohutné náspy. Našel se pak v něm nuzný moudrý muž, který
MA 0008 - Teorie pravděpodobnosti
175
by byl to město svou moudrostí zachránil, ale nikdo si na toho nuzného muže ani nevzpomněl.
/X f{t)dt. -oo
Tak tedy
Fix) =
0 ... pro x < 0;
Y ... pro x G (0; 1);
1 + ^i ... pro x G (1;2); 1 ... pro x > 2.
ad 7.4 Ze vztahu f(x) = 1 lze určit, že c = |. Pak
F(x) = / f(t)dt =
1 — \ ■ e x ... pro x > 0; ex ... pro x < 0.
2
1 „X
2
Při odstraňování absolutní hodnoty v integrované funkci musíme situaci rozdělit na dva případy (případ x < 0 a případ x > 0), odtud i dvojí tvar funkce F(x).
Při odstraňování absolutní hodnoty rozdělíme integrovaný interval na dvě části, a pak u každé části provádíme per partes. Z grafu hustoty je vidět, že EX = 0, ovšem při výpočtu rozptylu se integrování nevyhneme: DX = EX2 — E2X = EX2 — 0 = 2.
ad 7.5 ad a) P(X < 90) = F(90) = 1 - e~m = 0,593;
ad b) P(X G (80; 120)) = F(120) - F(80) = 1 - e"1'2 - 1 + e"0'8 = 0,148; ad c) P(X > 150) = 1 - F(150) = 1 - 1 + e"1'5 = 0,223.
ad 7.6 Rozdělení pravděpodobnosti a rozdělení četnosti je dáno v tabulce:
známka z/j 1 2 3 4 5
pravděpodobnost piuj) 0,166 0,277 0,277 0,185 0,093
četnost c(uí) 216 360 360 240 120
Dále pomocí hodnot pravděpodobností vypočteme očekávané (průměrné) ohodnocení EX = 2,756 a rozptyl tohoto ohodnocení DX = 1,456.
ad 7.7 EX = fi= 0,7917, EX2 = § = 0,7812, tj. DX = EX2 - E2X = 0,1544.
ad 7.8 EX = 1,22; EX2 = 1,5, tj. DX = EX2 - E2X = 0,0116.
176
Katedra matematiky PedF MUNI v Brně
14.8 Výsledky cvičení 8.2
ad 8.4 a) P (X = 0) = §;
P{X = 1) = §;
P{X = 2) = ±;
atd. P (X = k) = gFpr, atd.
b) EX = J2Zo k ■ p(x = A;) = 0 + l- | + 2- ^ + -- - =
= |-(l + 2-(J)1 + 3-(|)2+4.(i)3 + ...)
a nyní tuto nekonečnou řadu v závorce sečteme tak, že místo jedné třetiny napíšeme x a řadu
s (x) = l + 2- x + 3-x2+4-x3 + ...
sečteme tak, že j i zintegrujeme člen po členu, sečteme (už bude možné sečíst snadno podle vzorce pro součet geometrické řady) a výsledek zderivujeme; až takto získáme součet s(x), dosadíme zase zpět konkrétní hodnotu x = |. Tím jsme vyřídili součet řady v závorce, vrátíme se k celému výpočtu a výsledek je jedna polovina.
Ad 8.5:
a) A = i = ! = 1,66667;
p(x > 2) = 1 — pix = 0) — p(x = 1)
P(X > 2) = l_lM^.e-1.66667_ 1^671. e-l,66667 = X _e-l,66667 _ 1)66667.e-l,66667 =
0,811125.
b) A = f = 5
p(x = 0) = §- e"5 = 0,006738.
c) A = 20
P(x = 15) = ^ • e"20 = 0,05165.
Ad 8.6: X = doba čekání na poruchu č.j. 1=2000 hod.
A= průměrný počet poruch za č.j., zde A = 1 X w Po(A = 1)
Hledání t:
P(x > t) = 0,9 1 -P(x < t) = 0,9 1-F(ť) = 0,9 F(ť) = 0,1
1 - e~X4 = 1 - e"* = 0,1 e~t = 0,9
MA 0008 - Teorie pravděpodobnosti
177
t = -ln(0,9) t =■ 0,10536
Pokud 1 = 2000/i ->■ t = 2000 • 0,10536 hod = 210,721 hod.
Druhá možnost řešení: zkuste spočítat pro časovou jednotku rovnu 1 hodina ... výsledek by měl být stejný.
14.9 Výsledky cvičení 9.2
Ad 9.1: a) P(X < 45) = P{U < ^=60) = P{U < -3) = 1 - 0, 9986501 = 0, 00135;
b P(X > 65) = P(U > ^=60) = P(U > 1) = 1 - 0, 8413447 = 0,15866;
c) P(X >?) = 0, 99 ->■ P(U > = 0, 99, kde
= 2, 33 - nalezeno v tabulce distribuční funkce $. Odtud x = 11,65 + 60, x = 71, 65 min,
Ad 9.2: Jedná se o rovnoměrné rozdělení pravděpodobnosti; hustotou rovnoměrného rozdělení psti je po částech konstantní funkce, kteráse rovna nule mimo interval (8; 10).
Distribuční funkce F(x) = |5f = = na intervalu (8; 10), jinak pro hodnoty menší nebo rovné osmi je rovna nule, pro hodnoty větší nebo rovné deseti je rovna jedné.
r88f f(x)dx = F(8, 75) - F(8, 5) = - ^ = 0, 375 - 0, 25 = 0,125.
Ad 9.3: ii = EX = 75, o2 = DX = 100, odtud o = VĎX = 10.
(x —75)2
fix) = 1Q • e 2-ioo ... s touto hustotou psti praovat nebudeme, ale převedeme
-75
veličinu X na „vycentrovanou" normální veličinu U = ^—^ = -
10 '
Pak rovnost P{X < x) = 0, 25 přechází po vycentrování na tvar
P(U<^) = 0,25.
Pst na levé straně rovnosti je hodnotou distribuční funkce $ v bodě, který najdeme v tabulce. Problém je ten, že funkční hodnoty menší než 0,5 v tabulce nejsou - musíme si vypomoci symetrií funkčních hodnot hustoty psti vzhledem k počátku.
178
Katedra matematiky PedF MUNI v Brně
Odtud už určíme X z našeho převodního vztahu U = takto: —0,68 = 10 , tj. X = 75 - 0,68 • 10 = 68,2.
Ad 9.4: Řešení: Viz (Budíková, Králová, Maroš 2009), str. 76.
Ad 9.5: a) Devadesátkrát. b) DX = Np(l-p) = 900-0,1-0,9 = 81, odtud \ÍDX = 9. c) 0,04428544 s využitím programového prostředí R (jazyk R), d) 0,6466186 s využitím jazyka R. e) pomocí aproximací c) je rovna přibližně 0,046; d) je rovna přibližně 0,6517, tedy odlišnost od přesné hodnoty nastává na třetím desetinném místě.
Ad 9.6: a) (290; 305)
ji = EX = N ■ p = 400 • 0, 75 = 300
a2 = DX = N ■ p ■ (1 - p) = 400 • 0, 75 • 0, 25 = 75 ==> a = VŤ5
t t _ X-300
u - VŤE
P(290 < X < 305) = Pi22^1 < U < 30^|°°) = P(-l, 15470 < u < 0, 57735)
= 0(0,57735) - 0(-l, 15470) = 0(0,57735) - (1 - 0(1,13470)) =
0, 719042 - 1 + 0, 8749281 = 0,594.
b) (—u < U < u) = 0,95 ... z tabulky $ určíme, že u = 1, 96. A tedy
X = 317. Ze symetrie nyní plyne, že v hodnotách menších než 300 je zase hledaná hodnota o 317 — 300 menší, což je 283. Pak 283 až 317 je hledaný rozsah.
Ad 9.7:
a) P(U< 0,8) < P(U< 0,9);
b) P(U< 0,7) > P(U> 0,7);
c) P(U > -2) = P(U < 2);
d) P(U < -3) < P(U < 3);
e) P(0,9 < U < 1,1) > P(l,9 < U < 2,1);
f) P(1);
MA 0008 - Teorie pravděpodobnosti
179
g) P{1 2);
h) 2P{U>\) = 1 -P(-l < U < 1). Ad 9.8:
a) P(£7 > u) = 0, 25;
1 -0,25 = 0,75 u = 0,68
b) PiU < u) = 0,1; 1-0,9 = 0,1
ii = -1,29
c) PiU < u) = 0, 99;
ii = 2,33
d) P(-u < U < u) = 0, 99; ii = 2,58
e) P(0 < ř7 < ii) = 0, 35;
0,5 + 0,35 = 0, 85 ii = 1,04
f) P(l < U < u) = 0,2. A také platí P(U < 1) = 0,841 (viz tabulka distirbuční
funkce $). To společně s pstí 0,2 na intervalu (l;ii) by znamenalo, že PiU < u) = 0, 841 + 0, 2 = 1, 041, a to je spor s tím, že integrál podgrafu od minus nekonečna do plus nekonečna je roven jedné; pst nemůže přesáhnout hodnotu 1, tj. li s požadovanou vlastností neexistuje.
Ad 9.9:
a) P(x < 11) = P(U < ±i=£) = $(1,5) = 0,9332.
b) P(X > 0) = P(U > 2=5) = P{U > -§) = $(§) = 0,8943502.
c) P(e (3; 7) = P(2=5 < U < ^ = p(-0,5 < U < 0,5) = $0,5 - $(-0,5) =
0,6914625 - 1 + 0, 6914625 = 0, 382925.
d) P(/i < X < /i + a) = P{0 < U < 1) = $(1) - $(0) = 0,3413.
e) P(/i + a < X < /i + 2a) = Pil < U < 2) = $(2) - $(1) = 0,1359.
f) P{ii + 2a < X < ii + 3a) = P{2 < U < 3) = $(3) - $(2) = 0,0214.
Ad 9.10: f™f fit) dt = 0(22O653-200) - 0(189653-200) = 0, 9993 - 1 + 0(1, 66) = 0, 9993 -1 + 0, 9515 = 0, 9508.
Ad 9.11: N = 500
p = 0,85
/i = EX = N ■ p = 500 • 0, 85 = 425
a2 = DX = N ■ p{p — 1) = 500 • 0, 85(1 - 0, 85) = 63, 75
a = 763775
180
Katedra matematiky PedF MUNI v Brně
420-425^
p(X > 420) = poj > vemj-= 1 - p{U < -0,626224) = 1 - 0(-O,626224) = 1 - (1 - 0(0,626224)) 0(0,626224) = 0,73565.
S korekcí
p (x > 420) = poj > 41^3;74325) = 0(0, 6888) = °. 7545-
14.10 Výsledky cvičení 10.2
Ad 10.1: Hypotézy
Hq... pst, že padne 6, je rovna | Hi... pst, že padne 6, není rovna |
X Bi(N = 100, p = D
X může nabývat hodnot 0,1, 2,100
pst P(k) = (7). (ir. d)ioo-fc
-t-\-
II
2.1
o25
•too
EX = 100 • l = 16,6666 ze 100 hodů a = 0, 05
Určení dolní meze: YTo™ P(k) = f = 0) 025 pro xm = 10 (též lze zjistit v Excelu pomocí finkce binom.inv(0,025,100,l/6)).
Určení horní meze xv: pro xv = 24 (též lze zjistit v Excelu
pomocí finkce binom.inv(0,975,100,l/6)).
Pokud je počet padlých šestek ze 100 hodů podstatně vyšší-nižší než očekávaných 16,6666, pak můžeme zamítnout Ho a prohlásit, že platí Hi
Rozhodnutí testu: počet šestek je 25 ^ (10; 24), tj. zamítáme Hq, kostka je nevyvážená, šestky padají významně častěji.
MA 0008 - Teorie pravděpodobnosti
181
Druhý způsob řešení: když nemáme Excel, ale jen tabulku funkce $ (například u zkoušky): užijeme rozdělení No(/i = 16,666; a2 = 13,89; a = 3,73) kde střední hodnota i rozptyl jsou stejné jako u rozdělení binomického.
8WI ="l
Rozhodnutí testu: počet šestek je 25 ^ (9, 3333; 23, 9999), tj. zamítáme Hq, kostka je nevyvážená, šestky na ní padají významně častěji.
Ad 10.2: Kl: Vše se bude týkat veličiny x = počet nespokojenců ze 500 dotazovaných v anketě.
H0: ex = 200 (průměrný počet nespokojenců bude 40%); Hľ: ex ^ 200 (průměrný počet nespokojenců bude odlišný od 40%);
K2: Kritériem je naměřená hodnota x = 180.
K3: Veličina x má při platnosti Hq chování Bi(n = 500; jo = 0,4).
K4: Pro a = 0,05 jsou kritické hodoty normálního rozdělení zjistitelné podobně jako v předchozím příkladě na základě kvantilů rozdělení binomického, nebo zrovna aproximujme binomické rozdělení normálním se stejnou střední hodnotou a rozptylem, a je to: Kritické hodnoty normovaného normálního rozdělení U jsou um = —1,96, uv = 1,96.
K5: Naši naměřenou hodnotu x = 180 převedeme na ř7-hodnotu, pro
H = n-p = 500-0,4 = 200; a2 = Np(l-p) = 500-0,4-0,6 = 120, a = Vl2Ô = 10,9544.
Nyní U = \80°~2404° = -1,826 G (-1,96; 1,96), tj. H0 nezamítáme, počet nespokojenců není významně odlišný od 40%.
Ad 10.3: Pouze převedeme kritické hodnoty ±1,96 „do řeči" veličiny x:
— 1,96 = i0 9544 —^ xm = 178,53. i qfi — xv-200 => _ 991 47
x,o/u 10,9544 ^ v
Ad 10.4: Kl: Ho... průměrná životnost se rovná 1000 hodin, tj. nezávisí na změně výroby: ex = 1000; _ H\... průměrná životnost závisí na změně výroby, ex ^ 1000.
182
Katedra matematiky PedF MUNI v Brně
K2: hodnota kritéria je x = ^ • Y^i xl = 970 hodin.
K3: Při platnosti Hq lze veličinu x popsat rozdělením No(fi-x = 1000, = =
M = 400), tedy (JT = 20. K4: a) a = 0,1 je kritický interval (—1,64; 1,64).
b) pro a = 0, 01 je kritický interval (—1,28; 1,28). K5 Hodnotu x = 970 převedeme na ^/-hodnotu: u = 97°-™00 = -1,5. Ad a)
-1,5 G (-1,64; 1,64), tj. H0 nezamítáme. Ad b) -1,5 G" (-1,28; 1,28), tj. H0
zamítáme.
Ad 10.5: jo-hodnota je nejmenší možná hodnota hladiny významnosti a, pro kterou už Ho zamítneme. Z předchozího příkladu je vidět, že jo-hodnota leží mezi čísly 0,1 a 0,2. Určeme ji přesněji: jedná se u oboustranného testu o takovou hodnotu |, že interval (-1,5; 1,5) je kritický, tj. 0,9332 = $ (1,5) = 1 - f, odtud
| = 1 - 0,9332 = 0,0668 p = 0,1336.
14.11 Výsledky cvičení 11.8 Odpovědi na otázky
11.1 - A, 11.2 - N, 11.3 - N, 11.4 - A, 11.5 - A, 11.6 - N, 11.7 - N, 11.8 - A, 11.9 -N, 11.10 - N (průměr se bere nikoli aritmetický, ale vážený), 11.11 - A (pokud se oba rozptyly liší o více než čtyřnásobek, je vhodnější místo paramatrického testu použít test neparametrický).
Výsledky příkladů: Nebyl jsem si jist některými výsledky, tak jsem je smazal. Zkuste spočítat většinou sami. Bude zkontrolováno na cvičení.
Ad 11.1 Musíte sami.
Ad 11.2 Víme: a = 100 bodů, x = 540 bodů se naměřilo jako průměr 25 hodnot r-=
X 25
(N = 25), tedy o\=±- 10000 = 400, tj. aY = V4ÖÖ = 20.
kritickou hodnotu 1*0,95 = 1)64 užijeme i u intervalu spolehlivosti: je to kritická hodnota pravostranného testu, tedy hledaný interval spolehlivosti bude levostranný:
Hx G (540 - 1,64 • 20; 00); ßx G (507,2; 00).
Ad 11.3 ad a) viz přednáška; ad b) P(x > 8) = p
1 -F(8) =p 1P
1 — ŕ(2) = p, a ŕ(2) určíme v Excelu, s funkcí t.dist: 0, 058 = p. ad c) musíte sami, ještě není uvedeno.
Ad 11.4 Ad a) KV.
H0:fjLň= 1000
MA 0008 - Teorie pravděpodobnosti
183
Hi-.fjLňŕ 1000
K2:
x-1000
V N _
est a2 = Š2 = 625 • § = 657,8947 K3:
t(v = 20 - 1 = 19) K4:
tk je na průsečíku řádku v = 19 a sloupce a = 0, 05 = 2q tj. tm = -2,093; tv = 2,093
K5:
1024-1000
v71
4,18555; £ (-2, 093; 2, 093)
20
i/o zamítáme, ad b) musíte sami, ad c) musíte sami. Ad 11.5 Musíte sami. Ad 11.6
a) tk = ±2,262 (2q = 005). H0 zamítáme, hodnoty denního světla jsou vyšší než světla
umělého.
b) př. ííIGl,6±2, 262 • IAT G (0, 522; 2, 678)
c) p-hodnota
2 • (1 -F(3,36)) =
0, 00839 = 2 • (1 - t.dist(3,36; 9)) = p (t.dist je funkce Excelu).
14.12 Výsledky cvičení 12.5 Odpovědi na otázky
12.1 - N (x2 je definováno jako součet veličin U2), 12.2 - A, 12.3 - N (ze vztahu x2(l) = U2 je vidět, že veličina s tímto rozdělením může nabývat pouze kladných hodnot (resp. záporných hodnot nabývá s nulovou pravděpodobností)), 12.4 - N (příslušné četnosti lze počítat i u spojitých veličin, více viz příklad 12.4), 12.5 - N (ne, protože hustota není symetrickou funkcí vzhledem k přímce x = Ex2(n) = n), 12.6 - N (pro rostoucí n se t2{n) blíží rozdělení x2(l) ... stupeň volnosti je pouze jeden), 12.7 - N (např. v příkladu 12.3 stačí, abychom uvažovali tři politické strany místo dvou, a počet tříd by byl J x K = 3 ■ 3 = 9), 12.8 - A, 12.9 - A, 12.10 - N (právě naopak, parametrické testy mají větší sílu, protože neparametrické testy užívají většinou spíše jen pořadí měřených hodnot něž přímo tyto hodnoty).
184
Katedra matematiky PedF MUNI v Brně
ad úloha 12.1. cr0 = 1500, n = 10,
1 1 í 1 \ ^
s2 = - f V x2) - x2 = — ■ 67734929545 - ( — ■ 822989 ) = 384013,29, n \^ J 10 V10 /
pak š2 = f ■ s2 = 426681,433. Test: H0: a2 = 15002; Hť.a2^ 15002;
, , n-S2 10 • 384013,29
kritérium ... —=- =-—2— = 1,7 é (2,70039; 19,0228);
~A 15002
'o
s devíti stupni volnosti pro a = 0,05 tedy H0 zamítáme, snížení odchylky se prokázalo.
ad 12.2. Hodnota kritéria je 5, nemůžeme zamítnout Ho.
ad 12.3. Hodnota kritéria je 4,84, což je statisticky významné, zamítáme Ho.
ad 12.4. Protože normální rozdělení představuje spojitou náhodnou veličinu, dovolte mi celý příklad provést podrobně:
Potřebujeme vlastně jen znát pravděpodobnosti, s jakými nabývá normálně rozdělená veličina hodnot z uvedených intervalů
- četnosti pak získáme vynásobením těchto pravděpodobností číslem 242 (počet vybraných obyvatel);
záhlaví (první sloupec) tabulky vynechávám, aby se vešel poslední sloupec:
< 55 55 - 70 70-85 85 - 100 100-115 115 - 130 130 - 145 > 145
0,0013499 0,0214002 0,1359052 0,3413447 0, 3413447 0,1359052 0,0214002 0,0013499
0,33 5,18 32,89 82,605 82,605 32,89 5,18 0,33
Například hodnotu 0,0013499 lze vypočíst následovně: '55 - 100\ T /0
P(X E (0;55)) = $
15
15
3)-$(-6,67) = $(-3) = 0,0013499.
Četnost pak spočteme jako 242 • 0,0013499 = 0,33. Další hodnoty v tabulce získáme analogicky. Nyní dosazením četností z této tabulky a tabulky zadání do vzorce kritéria testu dostaneme:
krit. =
(0,33 - 20)2 (5,18 - 17)2
(0,33 - 14)s
0,33 5,18 0,33
což je vysoké číslo, mnohem větší než kritická hodnota x2(7), takže zamítáme hypotézu H0 o tom, že Brno je vyváženým reprezentantem IQ v České Republice.
ad 12.5. Použijeme Mannův-Whitneyův test:
hodnota 2 4 5 6 8 9 10 12 14
pořadí 1 2 3 4 5 6 7 8 9
skupina H H I I I H H I H
MA 0008 - Teorie pravděpodobnosti
185
Pak ř/i = Ui = 20 + 15 - 25 = 10, U2 = 20 + 10 - 20 = 10, odtud 10 > Uk = 1, tj. Ho nezamítáme (inverzní vlastnosti pro zamítnutí na rozdíl od většiny testů v tomto textu), oba soubory se statisticky významně neliší (tzv. „haló efekt") se tedy mezi vyučujícími KM nerozšířil statisticky významně.
ad 12.6. Použijeme opět Mannův-Whitneyův test: při určování pořadí např. dvě hodnoty 76 mají pořadí 6,5, dvě hodnoty 77 mají pořadí 8,5, apod.
Z7i = 9 • 12 + ^2~^ - 171 = 15, U2 = 9 • 12 + - 60 = 93,
tedy U = 15 < 26 = Uk a ZAMÍTÁME Ho (inverzní vlastnosti pro zamítnutí na rozdíl od většiny testů v tomto textu), mezi profesemi, co se týká objemu knih v kanceláři, je významný rozdíl.
Seznam literatury:
(Brož, 2002) Mistrovství v Microsoft Excel 2000 a 2002.
(Budíková, Králová, Maroš 2009) Průvodce základními statistickými metodami, Grada Publishing 2009.
(Fajmon, Hlavičková, Novák, 2014) Matematika 3. Učební text FEKT VUT, v rámci jehož druhé části je probírána pravděpodobnost a statistika. Dostupný online.
(Loftus, J., Loftusová, E., 1988) Essence of Statistics, Second Edition, Alfred Knopf, New York 1988. Na základě této knihy jsem kdysi vybudoval svou první výuku pravděpodobnosti a statistiky, dále jsou odtud vzaty tabulky distribuční funkce U, X2 a kritické hodnoty rozdělení t a Mannová-Whitneyho testu.
(Robova, Hála, Calda, 2013) Komplexní čísla, kombinatorika, pravděpodobnost, statistika. Edice Matematika pro SS, Prometheus 2013. Výborná učebnice představující čtyři obory uvedené v názvu, až na kombinace s opakováním, které by mohly být vysvětleny i srozumitelněji (viz výuka či konzultace).
(Rumsey 2006) Deborah Rumsey: Probability for Dummies. Wiley Publishing 2006.
(Rumsey 2016) Deborah Rumsey: Statistics for Dummies. 2nd Edition, John Wiley and Sons 2016.
(Schmuller 2016) Joseph Schmuller: Statistical Analysis with Excel for dummies. 4th Edition, John Wiley and Sons 2016.