BAYESOVSKÉ METODY Marie Hušková OBSAH Předmluva 5 Kapitola 1. Úvod 1.1 Formulace problematiky 7 1.2 Bayesova věta a její použití 10 Kapitola 2. Volba apriorního rozdělení 2.1 Úvod 13 2.2 Konjugované systémy hustot 15 2.3 Princip neurčitosti, Jeffreysova hustota a limitní aposteriomí hustoty 26 2.4 Empirické bayesovské metody 35 Kapitola 3. Statistické rozhodovací funkce 3.1 Formulace problému 38 3.2 Bayesovské rozhodovací funkce 43 Kapitola 4. Úloha odhadu 4.1 Úvod 50 4.2 Bodový odhadj jednorozměrný případ 50 4.3 Bodový odhad; vícerozměrný případ 61 4.4 Věrohodnostní množiny 65 -3- Kapitola 5. Testování hypotéz 5.1 Úvod 70 5«2 Ztrátové funkce používaná při testovaní hypotéz 70 5.3 Testy při *<®0) =0 76 5.4 Testy o střední hodnotě normálního rozdělení 79 Apendix : Přehled použitých rozdělení 86 Literatura 93 \ -4- PŘEDMLUVA Bayesovské metody představují jeden ze základních přístupů teoreticko-pravděpodobnostního myšlení i matematicko-statistických vyhodnocovacích metod. Vychází se z předpokladu, že naše informace (apriorní znalost, zkušenost) a hodnotě neznámého parametru může být vyjádřena pomocí pravděpodobnostního rozdělení, tj. neznámý parametr můžeme považovat za náhodnou veličinu. K závěrům o hodnotě neznámého parametru využijeme jednak apriorní informaci o hodnotě parametru, jednak experimentální výsledky (nezávislé na. této apriorní informaci). Tento přístup byl a dosud je předmětem kritiky mnoha statistiků. Ha bayesovské metody však můžeme hledět jako na metody, které nám poskytují jisté řešení statistických problémů. Bez ohledu na výše zmíněnou kritiku mohou být bayesovské metody užitečné v řadě praktických situací, především v případech, kdy jsou dostupné výsledky obdobných experimentů z minulosti,(např. při kontrole jakosti výrobků). Účelem skript je vyložit základy bayesovských metod v úlohách testování hypotéz a teorie odhadu. Skriptum je rozděleno do šesti kapitol. V první kapitole jsou vyloženy základní principy bayesovské-ho přístupu k řešení statistických problémů. V druhé se čtenář seznámí s možnostmi volby apriorního rozdělení, v další se základy teorie rozhodovacích funkci. Čtvrtá a pátá kapitola je věnována teorii odhadu resp. testování hypotéz. Poslední kapitola obsahuje přehled používaných rozdělení. - 5 - Skriptum bylo napsáno jako pomůcka k přednášce Matematická statistika II., ale může sloužit i širšímu okruhu čtenářů, neboí pokud je mi známo, nebyla dosud v českém jazyce publikována samostatná knížka věnovaná pouze bayesovským metodám. Předpokládá se, že čtenář je seznámen se základy vyšší matematiky a. matematické statistiky na úrovni knihy J. Anděl! Matematická statistika, kap. 1-10, 13—15- Značení je převzato z této knihy. Závěrem bych chtěla poděkovat recenzentovi prof. ing. !F. Fabiánovi, CSc a dr. D. Vorlíčkové za podnětné připomínky a paní I. Marešové za pečlivé přepsání rukopisu. - 6 - 1. ÚVOD 1.1 FORMULACE PROBLJJMATIKY. Nechl X * (XX^)' je náhodný vektor s hustotou r(xj8) vzhledem k o R^. Při klasickém (nikoli bayesovskóm) přístupu k problému odhadu parametru 6 nebo testováni hypotézy o § považujeme § za neznámou konstantu popř. vektor neznámých konstant a k závěrům o hodnotě parametru G použijeme pouze I » (i1,... ,Xn)* a tvar rozdělení X. Při bayesovském přístupu k závěrům o parametru 6 použijeme kromě X ještě informaci (byí neúplnou) o parametru 8, kterou máme k dispozici nezávisle na realizaci X. Mluvíme o tzv. apriorní informaci. Tato informace může mít objektivní 5i subjektivní charakter, popř. může být kombinací informací obou typů. 0 objektivní apriorní Informaci mluvíme, jestliže využijeme informaci z podobných úloh, problémů z minulosti. Subjektivní apriorní informace vyjadřuje názor či zkušenost nějakého subjektu. Apriorní informace se vyjadřuje předpokladem, že 8 je náhodný vektor popř. náhodná veličina s rozdělením, které je více Si méně známo v závislosti na tom, jak úplnou Si neúplnou informaci o § máme. Výjimečně pracujeme s náhodným 6 jako metodou získání závěrů o parametru 6 (náhodnost tedy nevyjadřuje žádnou apriorní informaci, ale slouží jako prostředek jak obdržet závěry o §). V kapitole 3 uvidíme, že znáhodnění parametru 8 je jedna e možností jak zaváat uspořádání na množině rozhodovacích funkcí a definovat kritérium optimality. - 7 - Přiklad 1.1. Uvažujme problém odhadu kvocientu inteligence 6 u určitého dítSte na základě testu s výsledkem X. Dlouholeté výskumy ukazují, že X má rosdělení H(8,100), kde 6 je kvocient inteligence, Se 6 je obecné různé u různých dští a lze ho považovat za náhodnou veličinu s rozdělením H(100,225). Poslední uvedeny fakt lze považovat za objektivní apriorní informaci - závěr ze série předchozích realizací. Příklad 1.2. Ha základe krevní zkoušky se má rozhodnout, zda pacient trpí jistou chorobou. Z předchozích výzkumů je známo, že touto chorobou trpí asi 5 % populace. Toto je opět objektivní apriorní informace dostupná před provedením zkouSky. Při bayesovském přístupu použijeme pro zmíněné rozhodnutí jak výsledku krevní zkoušky, tak apriorní informace o procentu populace trpící touto chorobou. Příklad 1.3. Úkolem fyzika je odhadnout jistou fyzikální konstantu 8. Fyzik má určitou představu o možných hodnotách 8. Připouští několik možných hodnot 6, přikládá jim obecně různé váhy (pravděpodobnosti) a tedy považuje je z tohoto hlediska za náhodné veličiny. Různí fyzikové mohou vyjádřit svou představu o hodnotě parametru 6 obecně různými rozděleními. Tato apriorní informace je subjektivní. Opět k závěrům o hodnotě fyzikální konstanty použijeme jak výsledku (popř. výsledků) příslušného experimentu tak apriorní informace. Přiklad 1.4. Při předpovědi počasí se běžně používají nejen výsledky měření provedených v minulosti a současnosti, ale i subjektivní názory (Informace) zkušených meteorologů. Kromě výsledků měření v současnosti tedy použijeme jak objektivních tak subjektivních apriorních informací. Je nutné si povšimnout rozdílné interpretace rozdělení parametru 6 v jednotlivých příkladech. Zatímco v 1. a 2. příkladě bylo rozdělení parametru 8 získáno z řady (objektivních) měření a 8 lze - 8 - skuteční pokládat za náhodnou veličinu, ve třetím přiklade rozdělení parametru 6 vyjadřuje "stupeň vízy" v Jednotlivá hodnoty parametru 6 (popř. víry, že náleží do určité množiny). V prvníoh dvou příkladech se jedná o běžné rozdělení pravděpodobností s četnostní interpretací tak jak se e ní běžně setkáváme v klasické statistice. Ve třetím příkladě rozdělení pravděpodobností parametru zachycuje "stupen víry" v určitá hodnoty 6, pro různé subjekty je obecně toto rozdělení různé. Z těchto důvodů nepřipadá v úvahu četnostní interpretace. V tomto případě mluvíme obvykle o tzv. subjektivní pravděpodobnosti, o které se předpokládá, že vyhovuje Kolmogorově definici pravděpodobnosti. Rozdíl je pouze v interpretaci. Subjektivní pravděpodobnost vyjadřuje víru subjektu, že určitý jev nastane. Určení subjektivní pravděpodobnosti je velkým problémem. Hej-jednoduSSí způsob určení subjektivní pravděpodobnosti je porovnat relativní věrohodnosti. Hapř. chceme-li najít pravděpodobnost jevu £, tj. P(E), srovnáme věrohodnosti E a jeho doplňkového jevu B°. Přikládáme-li oběma jevům stejnou Šanci, klademe P(E) « P(EC) - 1/2. Přikládáme-li Jevu £ třikrát větSí Šanci než E°, klademe P(B) - 3/4, P(BC) - 1/4. Jiné možnost je porovnávat víry ve dvojice jevů na základě sázek. Za určitých předpokladů potom existuje jediná pravděpodobnost na uvažované ť-algebře jevů. Podrobný postup spolu s diskusí o dalSích možnostech lze najít např. v [2], [5]* Se subjektivní pravděpodobností se setkáváme i v běžném životě. Mluvíme o naději (Šanci) oblíbeného fotbalového družstva. Uvažujeme o možnosti nepříznivého počasí o nejbllžSím víkendu a podobně. Přikládáme vlastně váhy možným výsledkům, obvykle říkáme, že ten či onen výsledek je nejpravděpodobnějSí, méně pravděpodobný či málo pravděpodobný. Nyní obrátíme pozornost na výhody a nevýhody bayesovakého přístupu. Jeho kladem je bezesporu využiti i apriorní informace. Ba - 9 - druhou stranu je bayesovský přistup předmětem kritiky mnoha statistiků, která se týká v podstatě tři bodů, a to konstrukce rozdělení parametru 6 na základě apriorní informace, použití subjektivní apriorní informace a v některých případech připustit, že 8 je náhodná veličina. Část kritiky je filozofického rázu. Většina statistiků nemá námitek vůči postupu v příkladě 1, kde g lze skutečně považovat za náhodnou veličinu a rozdělení parametru g je konstruováno na základě předchozích objektivních měření. V příkladě 3 však může být obtížná považovat fyzikální konstantu 8 za náhodnou veličinu s určitým rozdělením. Subjektivní informace může výrazně ovlivnit závěry o parametru g (na základě apriorní informace dvou různých subjektů můžeme dojít k diametrálně odlišným závěrům). Je-li apriorní informace velmi neurčitá či žádná, může volba apriorního rozdělení parametru g způsobit značná problémy. Je nutné si uvědomit, že různé volby apriorního rozdělení mohou vést k různým závěrům. Poznamenejme, že pro n dostatečně velké a za jistých podmínek regularity závěry o g nezávisí na volbě apriorního rozdělení parametru 6 (viz Věta 2.1). 1.2 BAYESOVA VĚTA A JEJÍ POUŽITÍ Necht g » (81t...,6^)' je náhodný vektor s hustotou q(g) vzhledem k if-konečné míře X na (© , &(@)), kde © je neprázdná borelovská podmnožina R^, &(@) označuje borelovské podmnožiny ® . Kechf J ■ (X-j,...,!^) * je náhodný vektor s podmíněnou hustotou **(x) 6) při daném 8 vzhledem k ť-konečné míře vn na (R^, fón), kde @>n označuje borelovské podmnožiny ILj, tj* P(geB, JeC) - \ ( ^r(x|8)d^x))q(g)dX(e), (1.1) B C kde B a C jsou libovolné měřitelné množiny. - 10 - Yžta 1.1 (Bavesova). Pro podmíněnou hustotu t( §|x) náhodného vektora § při daném x platí q(6)r(x|8) t ff(6jx ) - . / ~ , de-li $q<8>r(ô> / 0, Sq(&)r(xlg)dX(e) & (1.2) * 0 jinak. Důkaz provedeme stejně jako důkaz věty III.3«14 v [i] (str. 54). Ze vztahu (1.1) je vidět, že r(x|6)q(§) je sdružená hustota vektoru (x',6')' vzhledem k v„»)i • Proto podle věty III.3.7 v [i] o marginální hustotě je \ q(G)r(s|e)dÄ(e) marginální hustota vektoru x. Tvrzení věty nyní plyne z vety III.3.13 v [1]. Q.E.D. Tato věta má v bayesovských metodách klíčové postavení. Je-li 6 parametr uvažovaný v minulém paragrafu, nazýváme q( 0) apriorní hustotou, nebol vyjadřuje informaci o 8 ještě před realizací £. Podmíněnou hustotu fr(6]x) parametru § pak nazýváme hustotou aposteriomí. nebol jde o hustotu parametru G po realizaci x. E závěrům o parametru G pak použijeme aposteriorní hustotu r(Jj?|x), která v sobě zahrnuje jak apriorní informaci o parametru § tak informaci plynoucí z realizace £. Poznamenejme, že při klasickém přístupu použijeme k závěrům o parametru § pouze r(jc|6). atr. 8 Příklad 1.1( pokračováni). Apriorní hustota parametru G je N( 100,225), podmíněné rozdělení x při daném G je H(6,100). Pak aposteriorní hustota je B(22Ífffijfo10°i 69,23), je-li x hodnota x. Kvocient inteligence můžeme odhadnout (viz str. 52) 8 střední hodnotou příslušnou aposteriorní hustotě, tedy hodnotou 3§|*x + «j°f°..l00. Příslušný rozptyl je 69,23« Zatímco při klasickém přístupu bychom použili jako odhad G přímo x, jehož rozptyl je 100. Tedy použití bayesovského - 11 -toéoma mat-fc fofofty UK přístupu redlo k odhadu s menším rozptylem než při klasickém přístupu. PovBiimiéme si nyní vzorce (1.2). Existují-li měřitelné funkce h.,(§,x.) a h2(g) takové, že 1. Předpokládejme, že pro daný xe^ platí 0* i*(x|§)d>(g) < 0<^$ r(x|8)q(g)dM§) C + ~. Označme lechí existuje taková borelovská množina A c ® , že pro daná čísla a,b,c (O^a-O, b»0, c > 0) plstit - 14 - ( TTQ(g|x)d>(g) > 1 - a, (2.2) m » ±nf q(§) > O, (2.3) Se A sup q(6) i (1+b)m, G<£ A sup q(6) é (1+c)m. Be © -A Pak platí Důkaz lze najít např. v Li] kap. JVI.3, Věta 1 (str. 288). Věta říká, Se aposteriorní hustoty 7r0(§]x) a ir(e]x) se nebudou příliš lišit, jestliže a a b budou dostatečně malá nezáporná čísla a c nebude příliš velká. Uvědomíme-li ai význam čísel a,b,c, předpoklady znamenají, že na množině A je koncentrována velká část pravděpodobnosti odpovídající Fq(8|x), q(8) musí být na A prakticky konstantní a nenulová a omezená na ®- A. Je-li X^...,^ náhodný výběr z rozdělení r(x[8), pak při dostatečně velkém n je často aposteriorní hustota Tq(Q|$) koncentrována kolem nějakého bodu. Pak lze najít množinu A (většinou k-rozměrný interval) splňující (2.2) a takovou, že ^(A) je velmi malá a široká třída hustot q(Q) splňuje (2.3), pak většinou stačí, aby q(8) byla hladká na A a omezená na ®- A. 2.2 KONJUGOVANÉ SYSTÉMY HUSTOT Hechl I * (1^...,^) je-náhodný výběr z rozdělení s hustotou - 15 - r(i|6) vzhledem k a -konečné míře v, 6e ® / ®« Systém Q apriorních hustot q(6) nazveme systémem kon.lugovanvm ff JfflftffŤf1* Sr(xl6). B^©}. jestliže při dost velkém n a při libovolných hodnotách I - x,, které splňují 0 < C ff r(xJ§)q(e)d*(g) nQ existují nezáporné funkoe ^ a h^ takové, Se rCxilg) - g^xhe^íx.). (2.4) kde Tn(I1,... ,In) je r-rozměrná postačující statistika, r nezávisí na n. Označme Sn - [\f t«Tn(X)j množinu vš. bodů URy, kterých může nabývat náhodný vektor 3^(X). Předpokládejme, Se pro každé teSn platí 0< $ 6n(íl§HX(e) < + ® Pak'systém hustot ifn,t(§>» *6 V B>nol (2'5) je systém konjugovaný s jr(xjB); §« ©}, kde řn,t(Č> - ^JlS^S €fe<*#fl>**Cfi»"1- C2.6) - 16 - Ukážeme «1, ie toto tvrzení skutečně platí. Heohí Xi,...,!^ a Y^,.••»^a J«ou dva nezávislá výběry z rozdělení s hustotou r(x|§). Hechí m>nQ> n>nQ. Sdružená hustota obou výběrů má tvar f rCxJe) . jfr rCyje; i«i j*i takže (2.7) Pro jednoduchost nyní předpokládejme, ie hn(x)> 0 pro každá n>nQ. Bechí US^. Pak existuje taková 1^, že t ■ t^jr). Je-li apriorní hustota parametru 8 rovna řm^t(8)t pak podle Bayeaovy věty je aposteriorní hustota dána vzorcem Tr(ejx) - k fr rUJe) f t($), kde k je normující konstanta. Odtud dále dostaneme TCfife) - k ^(V^.e^^^j.exJ ^(t.^dMg))-1 - Tedy z (2.7) vyplývá kde u » T (x.y), c ■ * . . Odtud je již vidět, že "(g))-1, (2.8) O kde u& Sn+Jn« Tím jsme dokázali, že ¥ patří do systému (2.5). Systém hustot (2.5) někdy nazýváme přirozený konJugovanf systém. Jak uvidíme z následujících příkladů ěasto pracujeme se systémem hustot, který je o něco bohatěí než přirozený konjugovaný sys-témi budeme ho nazývat obvyklým. - 17 - lyni si uredeae přehled konjugorany ch systému hustot, které přísluší nejběžněji poutí raným systémům rozděleni [r(x|6)* . Podrobní probereme případ binomického a normálního (jedno- i vícerozměrného) rozdílení. Binomické rozdilení ■ imilftirT faift)' * 3« dáno* ® - <0,1>. Postačující statistika je Z X±, tedy S - Í0,1,2,...,nm\. Vzhledem i»1 k U.1) je g^yie) - e* d-G)^, y*sn Odtud a z (2.6) plyne f ,.(9) -8* (1-e)"11"7 (B(y+1,mn-y+1)r1 Ge(0,l) n, y n * 1,2,...j y ■ 0,1,2,*..,mn. Tedy přirozený konjugorany systém je systém beta rozdílení s parametry (y+1,an-y+1), kde y - 0,1,...,mn, n > 1,2,3,... Obr/kly konjugorany systém je systém beta rozdělení s parametry (o< , /2>), kde o(> 0, /3>0. Je-li apriorní rozdělení beta rozdělení s parametry (o< , (h ), je apoa- n teriorní rozdělení beta rozdělení s parametry (°< + H 3 + mn -- ^ MarglTiáliTf rozdělení (Z^...,1^)je podle (1.7) B(c* +£xj, (3+ mn -^-x.) x* ■ 0,*..,m PCIi-xiW--5^73-^ * i -i....... Žoleeonoro rozdělení s parametrem Qi ® - (0,+~). Postačující statistika je Z X1# tedy Sn - £o,1,2,...$. i»1 Přirozený konjugovaný systém vzhledem k Lebesguově míře je systém ~ ------y, 1 £ V' gama rozdělení s parametry (m,t), t - 1,2,...» m - 1,2,... Obvyklý - fM- f A 1 konjugovaný systém tvoří systém gama rozdělení s parametry (a,p), 1^ a> 0, p>0. Je-li apriorní rozdělení gama rozdělení (m,t), je apos- n teriorní rozdělení též gama s parametry (m-mj t+Z I4). I'11"t'' , i-1 A '■ ■ J 1 ' Negativně binomické rozdělení a parametry (s.6)t s je známé,® - <0,1>. n , Postačující statistika je £*if sn " fa, 1,2,...}. ^ , , . jr . ( y *»,-;. ■ ' 0. - Přirozený konjugovaný systém je systém beta rozdělení s parametry (sm+1,t), t « 1,2,...; m = 1,2,... Obvyklý konjugovaný systém je systém beta rozdělení s parametry + TL^ XA) • -1,/ M > 1 ''i. '.- * 4 J 1 Exponenciální rozdělení s parametrem 9: © = (0,+«). / Postačující statistika Je 21 X,, tedy S_ - (0,+«). i=1 ^ n Přirozený konjugovaný systém je systém gama rozdělení s parametry ' i (t,m), t > 0, m « 1,2,*.. Obvyklý konjugovaný systém je systém gama rozdělení (t,m), t> 0, . m >0. . . ' f ' i Apriorní hustotě gama rozdělení (t,m) odpovídá aposteriorní hustota n gama rozdělení (t+ 2_ X.., m+n). i«1 1 Rovnoměrné rozdělení na (0.6) i ®= (0,+-). 7, ! Postačující statistika je max X., tedy Sn - (0,+»). 1*i«n 1 n Přirozený konjugovaný systém je systém Paretových rozdělení s para-, , metry (m,t), m - 1,2,...; t> 0. Obvyklý konjugovaný systém je systém Paretových rozdělení (m,t),m>0; t > 0. Apriorní hustotě - Paretovo rozdělení (mít) odpovídá aposteriorní hustota - Paretovo rozdělení (m+n,max(t,X1,...,X_)). j^'^^ BffTiwiraf rortiltai aft 0. Je-li apriórni rozděleni '1" CfjVří^-i/?Baretovo rozděleni Ct^tg.a), pak aposterlorní rozdělení je opit fa-t P .j, rétovo s parametry (min(t1tX1t...,Xa), max(t2,It.....X^, m+n). ■4- ■HVTWfilhí rff»AŽ1^ »Cyi-tfg^. 0*1 >0 známé, ® - R~ '.^L Postačující statistika je £ X^ ■ K1 . i i* í > "Přirozený konjugovaný systém je systém normálníoh rozdělení (a$ofyn), acR1( q ■ 1,2,... M 'tu. ; - r .f, í Obvyklý konjugovaný systém je systém rozdělení I(a,b^), a«.Rv b*>0. 4 '/Je-li apriorní rozdělení H(a,b2), pak aposterlorní ja Ify^.r2), kde I Z±\>2 + a** nb2 + tf2, * 1 nb2 -k^ " (2.9) Marginální rozdělení Ij.je podle (1.7) í! í r 0, m » 1,2,... Obvykle bereme t > 0, m>0. Je-li apriorní hustota gama hustota (t,m/2), pak aposteriorní hustota je téi gama s parametry (t + X (Ii-(U0)2/2t (m+n)/2). Pozort Za neznámý parametr bereme 1/ff2 (nikoli ff2), nebol systém konju govanýoh rozdělení pro 1/ťľ2 má jednoduš&í tvar. 1/ff2 se někdy nazývá parametr přesnosti. Hormální rozdělení g(^.C2). p. i fl"2 neznámé. ® ■ x(0, +«•). Postačujíoí statistika je ( Jí X1t H I2), tedy S„ » R. x(0,+«) a i-1 1 i-1 x n i é^Ct^tgifi.ff2) - 6-"n exp^--Í5t2ní. Odtud a z (2.6) plyne Přirozený konjugovaný systém pro parametry (^,1/6" ) je systém rozdělení vymezený následovně: podmíněné rozděleni ji při daném 1/gr2 je ffCa.ff r ) a marginální rozdělení 1/6* je gama rozdělení (o,d), kde a^R^, r - 1,2,...} 2d - 1,2,..., o>0. Obvykle bereme aeR^, r> 0, c > 0, d > 0. Takovéto rozdělení budeme nazývat normální - gama s parametry (a,r,c,d). Apriornímu rozdělení popsaného typu odpovídá aposteriorní rozdělení normální - gama s parametry (ji* ,r+n,o* ,d*), kde c* - o + d* = d + n/2 (2.17) ■i n . , ' n itl 1 Tedy apriorní sdružená hustota (^.,1/ff ) (tj. hustota normálního - gama rozdelení s parametry (a,r,c,d)) je |u&R.j» cT2>0, což implikuje, že marginálni hustota ^u. je až na násobící konstantu rovna 1 «^2 -(2d+l)/2 <1 • ^" ? ) /*sHľ C2-19) 1/2 Jinými slovy (|H-a)(dr/c) 'má t-rozdělení o 2d stupních volnosti (pro 2d přirozené). Marginální hustota (X.j,...,Xn) je -1/2 •d,,...,^) = ^ ^ (2ir1/2 (2"_n/2 <*ieR* Vícerozměrná rozdělení Mt^i^ rozdělení a parametry (b.p). g = (p1.....J^K s je známé, i k , (*> - \P » (p^...,!^)! 0<.pii1, i - 1,...,k, x. Pí - A- - 22 - Postačující statistika jej Z x-m» 1 - 1,...»k], tedy S_ - lj=1 13 k = Jt = (t.,,...,tk)±± = 0,1,....sni i « 1,...,k| £ t± = snf. Přirozený konjugovaný systém je systém Dirichletových rozdělení s parametry (ttk), ti = 1,...,s, i - 1,...,k, s = 1,2,... Obvykle používáme systém s -t^> O, i ■ 1,...,k. Je-li apriorní rozdělení Dirich- letovo s parametry (t1,...,tk), pak aposteriorní rozdělení je také n n Dirichletovo s parametry (t 1 + X In»• • •»ti_+ £ Xt, ). 1 d=i 13 * 3-1 *J Vícerozměrné normální rozdělení ^^..Iq), kde xq je známá symetrická pozitivně deřinitní matice typu k* k, <3> » R^. Postačující statistika je g - (x.,,...,^), í± - 5 X Podle (2.6) a (A.29) g^Jll*) = expj- §<^-i) Ô1 nk n h^x) = (2f)"T (detž0rn/2 expj- j X 0*-*) 'H^ii'Dl Tedy přirozený konjugovaný systém je systém normálních rozdělení Hjj.ía^Q/n), aeR^, n = 1,2,... Obvykle bereme systém Sfc(a,bXQ), asR^., b>0. Apriorní hustotě Hj^a,]^), B positivně definitní symetrická typu k x k, odpovídá apoeteriorní hustota Hj^a* ,B*), kde a* = (n£"1 + B~1 B* = (ni;1 + B*"1 Vícerozměrné normálni rozdělení ^(^p. ÚL definitní symetrická neznámá matice k x k ně definitní matice kxkj. Postačující statistika je V « (v^i rij £ (*iq" ľ±0> q«1 "1 (n^p1X+ B"1a) (2.21) -1 (2.22) , jíq je známé, x pozitivně ® » \B} symetrická pozitiv- * ♦ • f 1c' Xjq" fV> - 23 - 1*0 = ty 10* * * •,/*k0^* Sn = ^ symetrická pozitivně definitní matice k« . Podle (2.6) a (A.29) a (A.31) gnCYír1) - UetZ-1)1172 exp[- \ trj£"1 v}} 5 «nr1> ^ » Cdet v)"<-k+l)/2 c-1n+k+i ® kde je dáno (A.32), tr\.\ označuje stopu matice. Přirozený konju- govaný systém pro Xl~1 je systém (centrálních) Wishartových rozdělení s r stupni volnosti a parametrickou maticí g, kde r <■ k+1,...,Re . Je-li apriorní rozděleni Wishartovo s a stupni volnosti a parametrickou maticí R, pak aposteriorní rozdělení je opec Wishartovo s a+n stupni volnosti a parametrickou maticí g" splňující g«-1 = g*1 + y . Vícerozměrné normální rozdělení Hfcfyi.X). g i £ > 0 neznámé, 0 » ■ |a, g>0j aeR^, B symetrická pozitivno definitní matice typu kt k\. Postačující statistika je (X,S), kde a Sn B **k* 5 ~ symetrická pozitivno definitní matice typu k x k}. Dle (2.6) a (A.29) platí «n<*.g»tz-£> - (detir1^2 exp J- j(t^> ' £-1(t- jí)}. (2.24) . exp i-trlT1 g\. Odtud plyne, že přirozený konjugovaný systém pro ({i , 2f!> můžeme popsat následovně: podmíněné rozdělení £i při daném £ je Nk(g,r-1 £), q marginální rozdělení ^ je k-rozměrné Wishartovo rozdělení s stupni volnosti a parametrickou maticí V, přičemž agB^, r»1,2,...} - 24 - I je symetrická pozitivně derinitní matice typu k * k, q > k-1. Obvykle pracujeme e r>0 nikoli jen 0 r přirozenými. Sdružená rozdělení p a x má tvar (deti)"172 expj- § tT&-\-fL)(ti-*)')}Tk/2. (2.25) . ckq ( det V)-^2 (det£)-(tl-k-1)/2 expj- \ tr(rV"1)} . Odtud lze integrací získat marginální rozdělení ^ . Stačí vlastně vypočítat integrál $(a.t£r(*-k)/2 ««p[- £ trCE-^p^-sjQé-a)'* r1))J d£-1 a uvědomit si, že funkce pod integrálem je až na násobící konstantu rovna hustotě k-rozměmého Wishartova rozdělení s (q+1) stupni vol-nosti a parametrickou maticí (r(£i-a)fyí-a)'+V~ )~ . Odtud dostaneme, že marginální hustota ^ je až na násobící konstantu rovna (detíyf1 + r^-a)(^-a)'))-(cl+1)/2 - - Qí1 =(det Vf1 . (1 + rýé-ar^-a))) ~. Porovnáním s (A.33) je vidět, ze ^ má k-rozměrné t-rozdělení 11 «• 1 s (q-k+1) stupni volnosti a parametry a a Vj" r~ (q-k+1) . Apriornímu rozdělení (2.25) odpovídá aposteriomí rozdělení, které lze popsat následovně: podmíněná rozdělení \x při danám £ je Hj^ji* ,(r+n) %s)t rozdělení L. je k-rozměrné Wishartovo s (q+n)--stupni volnosti a parametrickou maticí V*, kde ŕ- ff? * (2-26) r1 - r1 + § + ř^rií Cft-ixrf)'- (2.27) K odvození tohoto výsledku lze použít faktu, že aposteriomí hustota je až na násobící konstantu rovna součinu gn(í.;§|/%»3s) dané (2.24) - 25 - a pravé strany (A.29). Je-li £ » S"2ík» kde Ik je jednotková matice typu k x k, je ob-vykly konjugovaný systém pro (^,6" ) tvořen hustotami «p|- ^£ (H-ftrCjt-a)} (r(2W6"2)-1)l/2 . (ff"2)d"1cdr(d)r1exp{-c.«-2! p£ V 0, (2.28) kde parametry (a,r,c,d) probíhají množinu *(0,+*») *(0,+o>} * (0,+«£, — 2 2 —1 tj. podmíněné rozdělení |U při daném (7 je N^Ca.ff r 1^) a marginální rozdělení 5"~2 je gama rozdělení s parametry (c,d). Marginální rozdělení ju je až na násobící konstantu rovno 1 dr(fi-a) 'C^t-ô) -(2d+1)/2 (1 +-gj-5-) , f&&\ ' Apriornímu rozdělení (2.28) odpovídá aposteriorní rozdělení expU Et| Cti-^)'^-^)] ((r+n)(2Fř2)"1)1/2 . (2.30) l 26" . (ff-2)dW2-1 c.,d+n/2 (r(d^)r1 exp^'0, kde ^ je dáno (2.26) o** = c + \ I (Z^I)'(I±-I) + ^f^y (I-a)'(X-a) (2.31) 2.3 PRINCIP NEURČITOSTI, JBFFREYSOVA HUSTOTA, LIMITNÍ APOSTERIORNÍ HUSTOTY Neohí r(x.lg) je podmíněná hustota náhodného vektoru J=(X1,...,Xn)' při dané hodnotě parametru 8 6 © €• &k, © jí /Ď. Pokládáme-li g za náhodný vektor, o němž víme jen to, že 8 « ®, vzniká problém jak volit apriorní rozdělení. Uěkterým řešením tohoto problému se budeme věnovat - 26 - v tomto paragrafu. Podle principu neurčitosti bereme za apriorní rozdělení 0 rovnoměrné rozdělení na ®. Příslušnou hustotu budeme značit qQ(9) a příslušnou aposteriorní hustotu TTq( 6)35). Pro ® nanejvýš spočetnou půjde o hustotu vzhledem k čítací míře. Je-li Lebesgueova míra ® kladná, bude qQ hustota vzhledem k Lebesgueově míře. 7 obou případech je rovna identicky kladné konstantě, pro účely výpočtu aposteriorního rozdělení ji vzhledem k (1.4) můžeme klást rovnu 1. Je-li Q nekonečná spočetná nebo je-li Lebesgueova míra ® nekonečná, je hustota q0(6) nevlastní. Je-li např. (I1,... .J^)' náhodný výběr z alternativního rozdělení s parametrem 8€.(0,1) a nemáme-li o parametru 8 žádné informace, volíme apriorní hustotu (vzhledem k Lebesgueově míře) rovnu q0(6) = 1 pro 8 e(0,1). Příslušná aposteriorní hustota je 1T0(8|x) = (BClaCj+1, n-^jc±+1))"1 81 (1-8) 1 8e(0,1), tj. beta rozdělení s parame-try (X x..-i-1,n-Z.x.,+l). i 1 1 1 Je-li náhodný výběr z N(p,ff2), kde ff2> 0 je známé a ju. je parametr, o němž pouze víme, že pcR-j. Pak podle principu neurčitosti vezmeme za apriorní hustotu (vzhledem k Lebesgueově mí- £e) q0(p.) = 1 u^Ri a odpovídající aposteriorní hustota je opět H(X,n~1). Definujme si nyní náhodnou veličinu Z = 1 - (Lt . Z výše řečeného plyne, že podmíněné rozdělení Z při daném Ž je N(0,9 /n) a že rovněž podmíněné rozdělení Z při daném \i je - 27 - N(0,fr2/n). Tudíž Z a Z jsou nezávislé náhodné veličiny a podobně Z a |U jsou nezávislé náhodné veličiny. Var Z, var I a var ju. jsou konečné a tedy var X = var p + var Z var p = var S + var Z, což implikuje, Se var Z b o a tedy Z je skoro jistě konstanta. Toto je spor s tím, že Z má rozdělení N(0,6*2/n), S2 > 0. V tomto pfípadě tedy není použití principu neurčitosti vhodné, neboí vede k nesmyslným závěrům. Je vidět, že při použití principu neurčitosti musíme postupovat velmi opatrně. Princip neurčitosti má ještě další nevýhodu, změníme--li totiž parametrizaci modelu (tj. místo parametru G vezmeme tj » 8 ), apriorní hustota nového parametru už není rovnoměrná. Nechí je X1,...,Xn výběr z Poissonova rozdělení s parametrem 6 «■( 0, +•»). Apriorní hustotě qn(8) - 1 8c(0,+-) 0 (2.32) = 0 8^(0,+-) přísluší aposteriomí hustota gama rozdělení s parametry (n,lxi+l). 1/2 ^ Definujme nový parametr A » 8 ' , pak apriorní hustota parametru (odpovídající (2.14)) je q(X) - \ *>0 (2.33) = 0 % £,0. Tedy není již konstantní. Je vidět, že nevíme-li nic o hodnotách 8, máme již jakousi informaoi o "X, což je paradoxní závěr. Navíc aposteriomí hustota 7r(7k\x) příslušná apriorní hustotě (2.33) je XXj+1 T(7,J5)BÄL- e" A 1 X>0 rcix±+D >é0 - 28 - Zatímco apriorní hustotě q*U) - 1 A >0 . o * «0 přísluší aposteriomí hustota X > 0 o Tedy aposteriomí hustoty v a t* jsou různé, ačkoli oba postupy, kterými jsme k nim dospěli, jsou z hlediska logického rovnocenné. Tyto úvahy vedly k závěru, že místo podle principu neurčitosti bychom měli volit apriorní rozdělení takové, aby nezáviselo na počáteční parametrizaci modelu. Následující věta nám dává řešení pro případ, že A je Lebesgueova míra a M®) > 0. Nejprve si však připomeneme pojmy regulárního systému hustot a Pisherovy informační matice. Řekneme, že systém hustot $r(xj8), Ge.®\ je regulární. jsou-li splněny tyto podmínky: a) © je neprázdná otevřená množina interval v R^. b) Množina M » \x; r(x|8) > o} nezávisí na 6. c) Pro skoro všechna ze M (vzhledem k 5" -konečné míře v_) exis-tuje konečná parciální derivace r^(x|8) = 3r^^ i«1,...,k. d) Pro každé i a pro vš. 8e<3> platí S r,' (x|8)dv,(x) » 0. M n ~ o) Pro každou dvojici (i,j) existuje konečný integrál r2(íl§) dvn(x) . f) Matice J(g) = (Ji;j(S)) každé 8 e a předpokládejme, že 0 < c <č +••. Budiž H regulární prosté zobrazení množiny ® na ®*6 CB^. Označme 3=H(8) ar-íslg) = r(xlH~1( 3 )). Pak Jr^xjj)) | ^6 je regulár- ní systém hustot. Označíme-li J*(2}) Pisherovu informační matici, pak pro libovolnou množinu B splňující podmínky BC®, B € Qb-^ platí $ cr(x]8) (det J(8))1/2 dg - (2.35) B » [ c1r-(x|2j) (det J*(2)))1/2 «2/• H(B) Důkaz. Regularita systému ^r*(x|ij),2| je zřejmá až na to, že se musí dokázat positivní definitnost matice J*(z})> Necht 6 = = (e^.,.,6^)', ^ ■ (tjv ...,1^)'. Ze vztahu ainrí^lS) 9 ln rMglq) £ >ln r*(xjq) 98± ieí j=l dostaneme pro prvky Jj^C®) a J^Ctj) informačních matic J(8) a J*(;»j) rovnost r w3ln r(xlS) »ln r(g|§)) f y ^u T« M 31Iv (2.36) Označíme-li D = ("5S7)i,u=1,...,k» - 30 - * 6 .Jl:U 1 'M , 1 můžeme (2.36) napsat pomocí matic jako J(§) - D'J*(jj)fi. Přitom D je regulární matice, nebol g je jakobián zobrazení H a toto zobrazení je podle předpokladu regulární. Z pozitivní definitnosti matice J(§) plyne i pozitivní definitnost matice J*(ij) pro vš.^€* Podle věty o substituci v mnohonásobných integrálech platí \ c r(xlg) (det J(g))1/2dg B = \ c r(x|lT1(x|))(det(g'J*(r])Ji))1/2(det fi)"1d2} • H(B) Tvrzení věty nyní plyne, použijeme-li vztah det(D'J*(Tj)£)1/2(det g)"1 - (det(J*(rj))1/2. Q.E.D. Je vidět, že za předpokladů věty je apriorní hustota parametru 6 rovna funkci (det Jíg))1^2 (nebo jakémukoliv kladnému násobku této funkce) a aposteriorní hustota parametru G je rovna cr(x|g). 1 /2 .(det J(§)) a že je to pravděpodobnostní hustota. Funkci k.Cdet J(g))1^2, kde k je libovolné kladné číslo, budeme říkat Jeffreysova apriorní hustota. Z tvrzení věty plyne, že při Jeffrey-sově volbě apriorní hustoty parametrů 6 a j| jsou obě aposteriorní pravděpodobnosti stejné a nemůže dojít k paradoxnímu výsledku jako u principu neurčitosti. Někdy je Jeffreysova hustota nevlastní. Uvedeme si Jeffreysovy hustoty pro některé případy* Pro binomické rozdělení s parametry (m,p), m je známé, je ?eysova hustota beta hui 1 n « n beta (•%+ X x4, "i+mn- 21 x_.). * i=1 1 2 i-1 1 Jeffreysova hustota beta hustota (1/2,1/2). Aposteriorní hustota je n « n - 31 - Pro Poissonovo rozděleni a parametrem A má Jeffreysova hustota tvar '* " q(*) = A"1/2 > > 0, , , / t » 0 > ť»0. í"í.'. ; Je tedy nevlastni a aposteriorní rozděleni je gama s parametry (n, I x.41/2). i-1 1 Pro negativně binomické rozděleni s parametry (a,p), a - známé, je Jeffreysova hustota q(p) - p"1 (1-p)"1/2 P€.(0,1) - 0 p<É(0,D. Jde o nevlastní hustotu a aposteriorní hustota je beta s parametry (an, 5 x.41/2). 1 1 Pro normální rozdělení Híju.ff2)), 6q > 0, je Jeffreysova hustota konstantní (vady této hustoty jsou v první části tohoto paragrafu). Pro normální rozdělení N(p0,ff ), uQ známé, je Jeffreysova hustota rovna o"2 pro O"""2 > 0. Jde o nevlastní hustotu. Aposteriorní hustota 5 "2 je gama rozdělení ( !L (xjL-UQ)2/2, n/2). Pro normální rozdělení Jí(u,6"2), |Lt i ô"2 > 0 neznámé je Jeffreysova hustota dána vzorcem q(/i,ff~2) - 6" , peR,, ff"2>0. Opět jde o nevlastni hustotu a aposteriorní hustota (p,(T ) se dá popsat následovnět podmíněné rozdělení jx při daném 1/5^ je H(x",ff2/n) a marginální rozdělení 1/ff2 je gama s parametry (^I(xi-x)2,n/2). - 32 - Další možná volba apriorní hustoty parametru 6 je vyjít z kon-jugováného systému hustot (většinou tzv. obvyklého) 6| ^); ^ «A] T příslušného {r(x|8)|§6®} (JI je většinou otevřená borelovská množina] a volíme přímo aposteriorní hustotu ^(BJj), kterou dostaneme jako limitu apoeteriomích hustot z íq(§*£)»£«-1} pro % konvergující k nějakému bodu na hranici množiny A . Formálně odpovídá tento způsob tomu, že za apriorní hustotu q*(6) vezmeme limitu apriorních hustot z |q(e, ^), >>e_i\ pro X konvergující k nějakému bodu na hranici množiny -i . Hustota q*(g) je obvykle nevlastní. V řadě případů jsou potom bayesovské odhady a bayesovské testy shodné s klasickými. Aposteriorní hustoty získané právě popsaným způsobem budeme nazývat limitní aposteriorní hustoty. Uvedeme si několik příkladů: Id binomické rozdělení (m,p) je konjugovaný systém systémem beta rozdělení (c*,(J), ot > 0, A>0. Limita aposteriorního rozdělení 1 n n pro ot ~*0 a /l->0 je beta rozdělení ( £ X-t ,mn-51 x.), což odpovídá 1 i-1 1 i-1 1 apriornímu rozdělení q*(p) - (p(1-p))"1 p €■ (0,1) = 0 p et (0,1). Pro Tjiasonovo rozdělení s parametrem 8 je systém konjugovaných hustot tvořen systémem gama rozdělení (a,t), a > 0, t > 0. Limita apos- n teriorního rozdělení pro a-*0, t->0 je gama rozdělení (n, x.X.,). To- i=1 1 též aposteriorní rozdělení dostaneme, jestliže za apriorní rozdělení zvolíme q*(6) ■ 8~1 8 >0 = 0 6*0. Stejnou úvahou dospějeme pro negativně binomické rozdělení (s,p) k tomu, že za aposteriorní rozdělení V*(p|x) vezmeme beta rozdělení (en, ^ xi), které odpovídá apriorní hustotě - 33 - q*(p) = (p(1-p))"1 = O P £ (0,1) p é (0,1). Pro exponenciální rozdělení s parametrem 8 vezmeme za aposteriorní hustotu iT*(6|x) gama hustotu (Zx^n), které odpovídá apriorní hustota q' (8) » 8~1 6 > 0 = o e «10. p p Pro normální rozdělení N(fx,fiQ), 0 známé, vezmeme za aposteriorní hustotu N(x,čT^/n), která odpovídá apriorní hustotě rovnoměrné na R.,. (U apriorního rozdělení N(a,b ) klademe b^*<*>.) Pro normální rozdělení N(^Q,ff2), fX0 známé, vezmeme za aposteriorní hustotu gama s parametry ( X(xi-jUQ)2/2,n/2), která odpovídá apriorní hustotě q*(5"2) - S~2 6~2>0 = 0 <5~2úQ. Pro normální rozdělení Hípt.c2), i 52>0 neznámé, bereme v aposteriorní hustotě r->0, c-*0, d-*-£. Pak podmíněné aposteriorní rozdělení u při daném 1/ff2 je N(x,52/n) a marginální aposteriorní rozdělení 1/52 je gama s parametry (X(xi-x)2/2,(n-1)/2). Toto aposteriorní rozdělení odpovídá apriornímu q*(fA,l/C2) -Oí2)"372 fisR1t 1/6"2> 0. (2.37) Marginální aposteriorní rozdělení (tj. při daném x) náhodné veličiny » kde n Sn - ÍPT £ (xi-i)2» (2'38) - 34 - je t-r'sdělení s (n-1) otupni volnosti. Obdobné výsledky platí i pro vícerozměrné normální rozdělení. 2.4 EMPIRICKÉ BAYBSOVSKŽ METODY \ Jedná se o metody volby apriorního rozdělení q(8), jestliže máme k dispozici výsledky z minulosti v následujícím tvaru. Y.,,...,Yj jsou nezávislé náhodné veličiny. Yi má podmíněnou hustotu r(y|6i) (vzhledem k ď-konečné míře v), 8^e®, i * §^,...,6^ jsou nezávislé náhodné vektory, 6^ má hustotu q(§) (vzhledem k F-konečné míře X). Tedy nepodmíněné rozdělení Y., je za předpokladu konečnosti EY^ resp. var Y^. Na základě Y1f...,YN můžeme odhadnout hustotu rq(y) popř. příslušnou distribuční funkci některou běžnou metodou. Označíme-li ř(y) odhad hustoty r(y) a dosadíme-li do (2.39} dostáváme funkcionální rovnice, které lze obecně jen velmi těžko řešit. Místo řešení funkcionální rovnice někdy minimalizujeme vzdálenost r a r^ vzhledem k q a za odhad q vezmeme hustotu q, pro kterou je dosaženo minimum. Za vzdálenost nejčastěji volíme (2.39) a odtud plyne pro nepodmíněnou střední hodnotu a rozptyl (2.41) (2.40) - 35 - V obecném případě je řešení složité. &eší se jen ve speciálních případech. Další informaoe o tomto postupu lze nalézt v [2] a [7]. Spíše než najít odhad popsanou obecnou metodou se nejdříve podíváme, zda variabilita náhodné veličiny (popsané r(y))f která vznikne složením variability 6 (popsané q(8)) a variability y^^ při pevném B± (popsané r(y|8)) je způsobená hlavně variabilitou 6^ V kladném případě můžeme za odhad q(8) v řadě případů vzít odhad r(y). Variabilitou často míníme rozptyl. Je-li v tomto případě var(yi|8) malá ve srovnání s var 8, pak bereme za odhad q(8) funkci rCy) (pro 6 jednorozměrné). Oba vyložené postupy nemají příliš velkou naději na použití v praxi, nebol v prvním případě je obtížné najít řešení a druhá metoda je příliš intuitivní. Používají se zatím jen v určitých velmi speciálních případech viz např. [li* Mnohem větší naději na úspěch má metoda, kterou si nyní vyložíme. Předpokládáme, že q(8) má určitý funkcionální tvar, u kterého neznáme jen parametry, tj. předpokládáme, že apriorní hustota je q(8;£), kde £ * (oi-j,...,* )* je vektor konstant, který neznáme, víme jen, Že o< e A , kde /) jí Jl^ <&fl. Tedy také marginální hustotu yi známe až na vektor o< , který můžeme odhadnout pornooí y,j,...,y některou klasickou metodou odhadu např* metodou momentů (viz t.11). Při ní klademe ey3 - i £ y| j = 1,2,...,s 11 j-1 1 (za předpokladu konečnosti příslušných momentů) a řešíme vzhledem k £* . Řešení označíme £ . Za apriorní hustotu vezmeme q(8,£). Tato metoda má široké použití. Dá se vhodně kombinovat s konju-govanými rozděleními, které poskytují jen funkcionální tvar rozdělení. Za funkcionální tvar vezmeme rozdělení konjugované s r(y)6) a parametry odhadneme podle výše popsané metody. Ve většině rozdělení uvažovaných v 2.2 vede tato kombinace metod k rozumným výsledkům. - 36 - Empirické bayeaovské metody se pužívají spíše v úlohách odhadu než při testování hypotéz. V kapitole 4 jsou uvedeny 2 příklady odhadu parametru, jestliže apriorní hustota byla získána empirickou bayesovskou metodou. Nechí Y1f...,YN jsou nezávislé náhodné veličiny, Yi s rozdělením N(8^Sp)la představují výsledky z minulosti. 0^,..., 8^ jsou nezávislé náhodné veličiny. 8- má rozdělení N(u , kde u„ a >0 ne- *ě 2 2 2 2 známe. Nepodmíněné rozdělení Y^j© NCju^jC )» kde 6" = 5* + <5 q. Meto- dou momentů získáme odhady a a g- pro a a 6" , a to (2.39/ 1 N -.9 (2.40) Tedy za apriorní rozdělení vezmeme N(u ,on)» kde je-li" e2> 6-S (2.4D 0 je-li 52<5"o A A (odhad musí být nezáporný). - 37 - 3. STATISTICKÉ ROZHODOVACÍ FUNKCE 3.1 FORMULACE PROBLÉMU V této kapitole se "budeme zabývat tzv. statistickými rozhodovacími úlohami, které zahrnují jako speciální případy úlohu odhadu a testování hypotéz. Nejprve si uvedeme nezbytné značení a definioe. Nechí J = (X.j,... ,Xn)' je náhodný vektor s hustotou r(x|8) vzhledem k ď-konečné míře vn na (^»^5» §e® je parametr, © je neprázdná borelovská podmnožina R^. Označme 2 množinu možných rozhodnutí (závěrů) o parametru 6 a d prvek množiny S) . Dále označme L(8,d) ztrátovou funkci, která nám udává číselně jakou ztrátu utrpíme, jestliže skutečná hodnota parametru je 6 a přijmeme rozhodnutí d. Ztrátová funkce je tedy zobrazení z ® * od do R1. Budeme předpokládat, že existuje k konečné takové, že L(g,$) >k pro vš. § c® a vš. de.®. Pokud budeme uvažovat , množina Ä možných rozhodnutí je množina hodnot parametru 8 a A je množina odhadů parametru 8. Měříme-li ztrátu jako čtverec roz dílu parametru 8 a jeho odhadu ťfCX), můžeme psát L^B.ďíX)) = (6-<5t£)): a tedy pro rizikovou funkci máme R^B,S) = E (8-ď(X,))2|6). Pro úlohu testu hypotézy HQ: 8e®0 proti alternativě H1: 6e-®0, ®0 ci <0,1> je Sd = [d0,d^, kde á± = \e± platil • Obvykle předpokládáme, že při správném rozhodnutí je ztráta nulová a při nesprávném rozhodnutí je ztráta rovna nějaké kladné konstantě a Pak můžeme pro ztrátovou funkci psát: L2(8,d±) = 0 Be®± i = 0,1 (3.2) = a a é£®^ a pro rizikovou funkci máme: R2(8,d*) = a EClkTCX) = d^jS) = a . P((q, takové, že Y * g(X) má hustotu r(y|g°) (£ má hustotu r(x|6)). Označme e° - g(§). Pak je rozumné uvažovat ztrátové funkce invariantní vůŽi ^. tj. takové ztrátové funkce L(6,d), že pro každé a d&& existuje' d°€Ä takové, že L(g,d) = L(g(8),d°) pre vš. 8e . Označme d° = g(d). Rozhodovací funkci d~(55) nazveme invariantní vůči grupě . jestliže pro vš. JfiRjj a platí (rtgCap) = g( Podrobnější informace o tomto přístupu lze nalézt např. v [3], \2\* 3.2 BAYESOVSKE ROZHODOVACÍ FUNKCE Bayesovaká rozhodovací funkce ď* definovaná (3.5) závisí na volbě ztrátové funkce a volbě rozdělení parametru 8. Volbě rozdělení parametru 8 byla věnována druhá kapitola. Pokud se týče ztrátové funkce, budeme vycházet z předpokladu, že je dána. Nejběžnější ztrátové funkce používané v úlohách odhadu a testování hypotéz jsou uvedeny v následujících dvou kapitolách. Existuje obecná metoda volby ztrátové funkce na základě preferencí (podrobněji viz např. [2], [jj], [9]). Statistický rozhodovací problém formulovaný v předchozím paragrafu lze modifikovat tak, aby byly vzaty v úvahu náklady na realizaci Z. Místo s bayesovskou rizikovou funkci ^(q,<0 (při bayesovskóm přístupu) pak pracujeme s tzv. totálním rizikem <£(q, 0, bef^. Pak bayesovské rozhodovací funkce odpovídající L1 a Lg jsou shodné, což vzhledem k předpokladu omezenosti ztrátové funkce zdola, vede k tomu, že bez újmy na obecnosti můžeme předpokládat nezápornost ztrátové funkce. Nyní si zformulujeme a dokážeme tvrzení o konkávitě bayesovské-ho rizika ^>*(q) jako funkce rozdělení q parametru 8. Věta 3.2. Pro libovolné hustoty q-j»q2 parametru g vzhledem k F-koneč-né míře X a pro libovolné ©ŕ 6 <0,1> platí je lineární funkci vzhledem ke q. Z vlastností infima pak plyne #Uq1+(1-^)q2) > ^(q.,) + ( 1-d) £*( q2>, za předpokladu, že příslušná, bayesovská rizika existují. Důkaz. Z definice bayesovské rizikové funkce máme: eoOXq-j+O-eOqg.cf) - oC^Cq^ťO + Cl-*) f (q2,íf) pro vš. ďsA, neboí ^q^C 1-o()q2 je opět hustota vzhledem k míře X a Q.E.D. Nyní si všimneme bayesovské rizikové funkce (g) - (3-10) (T(x)^ J « ^ L(g, ■*<*> <£(q, kde apoeteriorní hustota T(8|x) je N(^gx-^f§# 100.6Q)23) a apriorní hustota q(8) je N( 100, 225)« Hajít bayesovskou rozhodovací funkci znamená najít ^ ^(q, ilíX4l\X+I^13}(3X-6)}/X 5 L(8^3)T(8|X)d8 = íl^Xá.l\.X+IiUXí2H2X..l)+I^23]C3X»6)\/X L(8fd4)r(8|X)d8 = 2X~1 min(3,X). Tedy bayesovské rozhodnutí je následující: je-li X = 2 , pak je rozhodnutí d^ nebo d2, je-li X - 13/3 " " d1 nebo d4, je-li X<.13/3 n " d1f je-li X> 13/3 " " d4. - 47 - Ha závěr tohoto paragrafu si zformulujeme větu pro případ, že ® i $ obsahují právě 2 body. Toto je případ, se kterým se nejčastěji setkáváme při testování jednoduché nulové hypotézy proti jednoduché alternativní hypotéze. Předpokládejme, že ztrátová funkce je definována následovně: L(6i,di) =0, i - 1,2 L(81td2) m av LCgg.d.,) «= a2, kde a±> 0, S> = U-pdg}, ® » i^*^' Dále předpokládejme, že P(6 = 8.,) * $ , P(8 = Q2) = 1 - $ , ^6 (0,1) dáno. Pak podle (3.4) pro bayesovskou rizikovou funkci platí a1 ^P(*(J.)-a2l £»6^ + a2(1-pP(0 a b> 0 definujme rozhodovací funkci předpisem b r(xl82) o d2 je-li a r(xl8.,)4b r(xl82) - libovolně je-li a r(xlj8p - b r(xlg2). Pak pro libovolnou rozhodovací funkci + b rC3t|e2))dvn(x> « = a + 5 Ii (3.15) *n > $ I^(x)=d1l (-a ríxl^) + b r =d2\ (-a ríx,^) + D r<* 1§2))dvn(«} * 0 <3'16) Z (3.14-3.16) snadno obdržíme tvrzení věty. Q.E.D. Poznamenejme, že při vedlejší podmínce F(ďt(X)>d^\8-g1) >o( je tvrzení věty shodné s tvrzením Heyman-Pearsonova lemmatu. - 49 - 4. ÚLOHA ODHADU 4.1 ÚVOD Necht X - (X1,...,Xn)' má hustotu r(x|g) vzhledem k ff-konečné míře yn, 6 = (e^...,^) 'e. ® je parametr, 0 / © e í^. Nechí q(g) je apriorní hustota parametru g vzhledem k tf-konečné míře X na (®,6(®)) a r(e|j) příslušná aposteriomí hustota. Úlohu odhadu parametru Q můžeme formulovat jako statistický rozhodovací problém (®,A,R), kde množina možných rozhodnutí <£> je shodná s množinou ®. Rozhodovací funkce ď(X) je pak odhad parametru g a A je množina odhadů parametru g. Nadále budeme používat termín odhad místo rozhodovací funkce. Ztrátová funkce Kg.dtX,)) pak vyjadřuje odlišnost odhadu <Í*(X,) od skutečné hodnoty parametru Q. 4.2 BODOVÍ ODHAD. JEDNOROZMERNÝ PRÍPAD Typickými ztrátovými funkcemi jsou La>w(8,d) =w(6)|8-dla 8e®, d£Ä , (4.1) I*. v (6,d) « kn(8-d) 8 - d»0, 8e® ,de»r (4.2) K0' 1 u = k^d-8) 8 - d^O, kde w(g) je nezáporné měřitelná funkce definovaná na Q; a,kg,k.| jsou kladné konstanty pevně zvolené. Nejčastěji používáme w(6) s 1, a = 1 nebo a = 2ak0 = k1 * 1. Pro w( 8) a 1, a = kQ = k1 » 1 jsou ztrátové funkce totožné. Dále se budeme zabývat pouze L0 _ a L. . . Pro a » 2, w(8) ■ 1 0* 1 budeme používat pro ztrátovou funkci zkrácené značení L9. - 50 - Označme qi(8) = q(8)w(9)(J q(6)w(e)dX(e))"1 pro ^q(8)w(8)ďX(8) t 0 • ® (4.3) = 0 jinak, r(x|8) q.íe) r F.ÍSlx) = ----3- pro i q.. (8) r(x^e)dM8) j* O 1 - Jr(8)j*0) vzhledem k ^ a považuje-me-li ji za apriorní hustotu, pak příslušná aposteriorní hustota je KjOlx); r^x) je marginálni hustota i odpovídající q^(9). Hlavní výsledky o bayesovských odhadech pro ztrátové funkce L9 L. v si zformulujeme ve větě: *0,JC1 Věta 4.1. a) Necht e2w(8)ir(e|x)ä^(e) < +<* pak pro ztrátovou funkci L0 w definovanou (4*1) je bayesoveký odhad $2 w parametru 8 dán vztahem \ 8w(8)t(8l5)dX(e) <3> " (4.6) = 0 jinak pro bayesovské riziko w(q) platí w(q) = E^var^ej^)) , (4.7) - 51 - kde E1 označuje střední hodnotu X, vzhledem k hustotě (4*5) a var., označuje podmíněný rozptyl 6 vzhledem k hustotě (4.4). b) Nechí 0 ^ ^ i8|r(5|B)q(e)d>(e)^+«-> (4.8) pak pro ztrátovou funkci Iv. v definovanou (4*2) je bayesovský od- » ^0**1 . had ^k.) Paran»ti,u ® (100(k0(k0+k.j) )% kvantil aposteriorního ro dělení t(8|x)a pro bayeeovská riziko - (V*iy l CCfk (j)-8)r(5|e)q(«)dVn(S)d«B) II + kn \ 5 v ($)Hx]e)q(e)dvT1(5)d7v(e). Rj -« K0»*1 n Důsledek 4.2. Je-li ve větě 4.1 a) w(0) s 1, pak bayesovský odhad ú2(x) parametru 8 je (8) > 1 - <* . ®48á^(j)^ G>n\8»éV(x)t Poznámka 4.3. Bayesovský odhad (q. *S S (B-íJ w(x))2T1(5|8)dM8) . E^varfelX)). Odtud plyne, že ó0 (x) je bayesovaký odhad a bayesoveké riziko je dáno (4.7). b) Nechí > ^.k/s). Pak Platí Lu k (BM*»-W v CG,o - k^-Q+ttx^-k^Q-^^íx)) je-li 8-^0» *0,K1 což implikuje (pro jednodušší zápia klademe q(8) « 0 pro 8^<3>) «oo \ (L k (e.Ax))-^ k (8, -00 (8)) + >'kl %,k/í3 + (k f(x) + k0 k <5) *0' 1 r O* 1 f u i + k-CdXx,)-^ k (x)) J r(x|e)q(6)d*(e). 1 K0' 1 -oo Použijeme-li nerovnost ř ď f . (x). V pří- K0*K1 padě platnosti opačné nerovnosti postupujeme analogicky. Tedy 100 kQÍkQ+k-j)"" % kvantil aposteriorního rozdělení parametru 8 je bayesovský odhad pro L v a bayesovské riziko Je rovno ■lot, = (kjj+k^i i (225. Podle (4*3) a (4*4) postupně dostaneme, že hustota q-,(8) je N(100,(^ - p-)""1) a hustota *j(e|x) je *r/225rx+1002(r-225) 100. 225.r x H( &55r-f100(r-2žS) » 1ĎŮ(r-2Ž5)+2Í5r)' Z věty 4.1 plyne, že bayesovský odhad je 225rx+1002(r-225) •"2,1^ = Ž25r+150(r-2Ž5r a bayesovské riziko je I 225.100.r j ^ 100(r-225)+225r J kde w(8) = exp^(8-100)2/2r\. Porovnáme-li tento bayesovský odhad I s odhadem získaným při L2, zjistíme, že při x^-100 je j ? a při x >100 platí opačná nerovnost. Tedy při « _ pro x <100 I 8 spíše podhodnotíme a pro x>100 spíše nadhodnotíme ve srovnání f s použitím odhadu (fg*. - 55 - br Přiklad 4.1.i Chceme odhadnout pravděpodobnost 6 výskytu určitého znaku u populace jedinou. Necht X1.....Zn je náhodný výběr z této populace, kde X1 ■ 1 u i-tého vybraného jedince zjištěn znak - 0 jinak, i ■ 1,...,n. Tedy P(X.j«1) - 9 a PÍX^-O) - 1 - 8. Předpokládejme, že 8 má beta rozdělení fc,^), eOO, /3>0 a požadujeme co nejlepší odhad pro 8 v okolí 0 a 1. Zvolíme-li pak při téže hodnotě (9-4tx,)) je ztráta pro 8 v okolí 0 a 1 mnohem větší než např. při 8 v okolí 1/2. Podle (4.6) je pak bayesovaký odhad dán vzorcem ;/ ' p1 «*+?!.,-1 i+n-?x1-2 J e 11 (1-e) 1 1 de = f? *+ixH-3-i>n-4*,-2-- \ e ^ 1 (i-e> 1 1 de B(o< + \ x±, (h + n - \ x± - 1) " Bfe ^Xi-^+n-Iii - 1) " r i ■ - oL + \ - 1 o< + n - 2 není-li 0-c<*ťU aX. x, » 0 nebo 0^./3é1 aX. « n, kde Ix, znamená n i ^ ' i ^ i 1 Je-li 0-*-/l*1 a Z x± * 0, pak é.1 aLx^-n, pak cf * není definováno vztahem (4*6), ale můžeme ho dodefinovat pomocí limity* Y0 e-^O-e^de 1, /a>1) -->'<) ľ x-D x U-*fi+n-2)2(^+í3+n-1) B(<*-1,0-1; n -Bfrc«,fan-ac>- (oc-1)(fr-1)_ = x B(«<-1,p-1)<«*+/»+n-2) " Uf-U(<* +/J-2)(tf +n+(J-2 J » kde jsme použili faktu, že marginálni hustota r., (x) náhodného vektoru X je podle C 4-5) rovna *i<*> - B(Bg:i1:^r1? *™ xi ■ ° n*b°1 n x označuje £ xi (jde o hustotu vzhledem k čítací míře). i=1 Při klasickém přístupu je X " ^ ^- xi ef icientním odhadem. Příklad 4.2. Elektronické součástky jsou zkoušeny za účelem odhadu střední životnosti. Předpokládejme, že doby životnosti jednotlivých součástek představují výběr X.,,... ,XQ z exponenciálního rozdělení s parametrem 1/6. Předchozí měření umožňují předpokládat, že 6 má inverzní gama rozdělení s parametry (/3,o0, <* > 0, {i>q dané hustotou q(e,o<,^) . (PU))"1/*01 e"*"1 •-o =* 0 6^0. Aposteriorní hustota parametru 8 je Tfte|x) - (ru+n))-1(i/^Íxl)^+ne^-n-W[-(^+ii.iii)/e] 8>0 = 0 8^0, 1 n _1 tj. inverzní gama rozdělení s parametry ((^- X.,o(+n). Při kvadrát ioké ztrátové funkci L„ _ s w ■ 1 dané (4*1) je bayesovský odhad <í,w - 57 - dán ««d 1 L *\x) * $ BfC8ls)d8 = ? * * Ď?-. a pro bayesovské riziko platí pro 2, /3>0 o*(q) = EWar(elx)^ = E(^ + I x^2 k + n - 1)~2 U + n - 2)"1 = f2 kde jame použili faktu, že marginální hustota X je (viz (1.7)) rovna - 0, i - 1,... ,n P(o()/íí(1//i+ixi)0<+n 1 a rovna nule jinak. Příklad 1.2 (pokračování ze str. 8 ). Předpokládejme, že dva fyzikové vyjádří svou představu o sledované fyzikální konstantě 8 následovně. Zkušenější z nich říká, že možné hodnoty 8 mají rozdělení N(900,400). Zatímco druhý z nich (méně zkušený) říká, že možné hodnoty 8 mají rozdělení H(800,6400) (větší rozptyl odráží menší zkušenost). Předpokládejme, že výsledek X « x příslušného pokusu má rozdělení N(6,1600). Pak aposteriorní rozdělení při použití apriorní informace zkušenějšího fyzika je N{x±^600t 320) a při použití apriorní informace fyzika méně zkušeného je 1750). Je vidět, že u méně zkušeného fjBika došlo k výraznému snížení rozptylu ve srovnání s fyzikem zkušeným. Při ztrátové funkci L2 dostaneme odhad 8 rovný (x+3600)/5 u zkušeného fyzika a (4.x+800)/5 u méně zkušeného. Tedy odhady jsou různé. Obecně při n pokusech bude aposteriorní rozdělení při použití infor- - 58 - mace zkušenějšího fyzika ,T/3E+3600/n 1600<> N( lÍ4/n ' n + 4° a méně zkušeného fyzika kde X je aritmetický průměr výsledků pokusů. Tedy při provedení více pokusů bude vliv apriorní informace ryhle klesat, což je v souhlase s větou 2.1. Vedle dvou uvedených typů odhadů se používá .ještě' bayesovský ■! odhad 8|j maximálně věrohodného typu, který je definován následovně: max rCxte)q(e) = r(x) éL)q( éL.), 0€(3> pokud maximum existuje. Někdy se též mluví o zobecněném maximálně věrohodném odhadu, nebol při q(9) konstantním dostaneme obyčejný maximálně věrohodný odhad. Poznamenejme, že zobecněný maximálně věrohodný odhad nemusí odpovídat žádné ztrátové funkci. Tato metoda se dá použít i ve vícerozměrném případě. Příklad 4.2 (pokračování ze str. 57). Bayesovský maximálně věrohodný A odhad maximalizuje funkci e~*-n-1 exp i- (J+I^/ej pro © > 0, výpočtem dostaeme ^ 7» d. + n - 1 tj. Sjj - (x). Nyní si uvedeme 2 příklady na odhad parametru, jestliže apriorní rozdělení bylo získáno empirickou bayesovskou metodou, která byla vyložena v § 2.4. - 59 - Príklad 4.3. Necht X^...,]^ jsou nezávislé náhodné veličiny, X± má rozdělení Níe.ffg), kde 6q>0 je známé. Necht Y.,,...^ jsou nezávislé náhodné veličiny, které představují výsledky z minulosti, Yi mají rozdělení N(8 ,ff2), kde 8 i 52 >0 jsou neznámé. Uvažujme úlohu odhadu parametru 8 při ztrátové funkci L2 dané (4.D. Podle (2.39) a (2.41) za odhady 8q a ff2 « Ý jinak. Příklad 4.4. Necht X má Poissonovo rozdělení s parametrem A. Necht Y19...,YH představují výsledky z minulosti a jsou to nezávislé náhodné veličiny, Yi má Poissonovo rozdělení s parametrem *X$ ')|>1,.«.?jí jsou nezávislé náhodné veličiny, ^ má rozdělení gama (<*,/$), > 0, |3>0. Pro nepodmíněnou střední hodnotu a nepodmíněný rozptyl náhodné veličiny Y^ platí - 60 - var Y± » E>± + B(Ä±-(J)2 - 4 + ^ ■ ř A V A V2 A O mm při kvadratické ztrátové funkci Lg dané (4.D je pak A A \ = je-li &2-Ý> 0. 1 + <* íj : ^' -'^ A p — V případě 5 -Y <0 není tento odhad vhodný. Můžeme však postupovat jiným způsobem. Při ztrátové funkci Lg je obecné vyjádření (při libovolné apriorní hustotě qO) vzhledem k Lebesgueově míře) pro odhad > následující ♦o» \ fcr(xU)q(*)dX \m ÍS_ , (x+1)r(x+1) * r(x) Stačí tedy odhadnout r(x) a r(x+1), např. počet Y± . x r(x) = -=- N a dosazením do Ä dostaneme nový odhad který je velmi jednoduchý, ale značně nestabilní při menších N. 4.3 BODOVÝ ODHAD: VÍCEROZMĚRNÝ PŘÍPAD Ve vícerozměrném případě nejčastěji používáme ztrátovou funkci kde A, je symetrická pozitivně semidefinitní matice typu k k k a jJC^) ■ = ((ľ-jCx,),... ,^(5))' je odhad parametru 6 «= (81,..., 8^) '. Za předpo- - 61 - kladu, že prvky varianční matice var{Xl§} jsou konečné, splňuje bayesovský odhad <ŕ!(x) parametru 8 následující vztah (íA(5)-E(8lX=5))'A(á,A(5)-E(9|X=x)) = 0 (4.13) a bayesovské riziko je rovno *(q) při ztráto vé funkci i=1 kde £(x) = (d^íx),... ,^(5))'. Aposteriorní rozdělení parametru 8 je Dirichletovo (o(1+x1,.. .,^+x^). Dále platí » |§=(Q1,...,ek)'j 0*8^1, i-1,...,k» L g± = 1}. Vzhledem k (4*16) bude minima dosaženo pro <*J?^-1 } Proxi = 0,...,n, (m+o^x N m ' a odtud dále obdržíme - 64 - což spolu s (4.17), (4.18) implikuje ,2 f_ .2 ?(q) = (oc0«)(oí0+1k0 4.4 vžrohodnostní množiny Kromě bodového odhadu se při klasickém přístupu k úloze odhadu setkáváme s problémem najít konfidenční množinu pro parametr 6. Přesněji řečeno najít borelovskou množinu D^íljc®, která s předepsanou pravděpodobností 1-° (4.19) Při bayesovském přístupu konfidenčním množinám odpovídají tzv. 100(1-oQ% věrohodnostní množiny (credible region v angličtině) parametru Q. 100(1-o<)% věrohodnostní množina parametru G je definovaná jako libovolná množina C^íjpc® taková, že p( e g coí(%)\ x) = ^ ^(eií) d*(8) - 1 -<* ; (4.20) 1-o< nazýváme věrohodnost. Někdy nahrazujeme poslední rovnost nerovností ^. Protože f(8|x) je hustota na ® , můžeme mluvit o pravděpodobnosti, že 8 náleží do 0^(1). Na rozdíl od klasického přístupu, kdy konfidenční množinu D^ÍX) lze interpretovat jen v termínech pravděpodobnosti pokrytí. Jak uvidíme na příkladech v řadě případů jsou množiny Cet(X) a D^X) totožné. Věrohodnostní množina C^ÍX) není obvykle předpisem (4*20) jednoznačně určena. Snažíme se najít množinu CJ[(X) takovou, že - 65 - - [fc®; *(e|x)> k^}, (4.2D kde k^ je největší konstanta taková, že ^ TT(eJX)ďX(e) = 1 - oc (popř. » 1 -<*). (4.22) Najít C^(X) je mnohdy značně obtížné. Poznamenejme, že C^(J) je všro-hodnostní množina splňující (4.21) a navíc \ d*(9) < ^ MS) Pro vš' Cw^)' (4.23) C£(X) CU(X) Je-li 8 jednorozměrný parametr, hledáme obvykle věrohodnou množiaiu ve tvaru intervalu a mluvíme o 100(1-oQft věrohodnostním intervalu. Nechí X^,...,7^ je náhodný výběr z N(p.,6*2), kde jut a 5"2 > 0 jsou neznámé parametry s apriorním rozdělením normálním-gama s párameiry (a,r, c, d), a ô R.], r > 0, c > 0, 2d je přirozené číslo. Tedy podle str. 22 je marginální aposteriorní rozdělení náhodné veličiny (u-p.*) (d"r/c*)1/2, kde^*, c', d* jsou dány, (2.15), (2.16) resp. (2.1?), je t-rozdšlení o 2d* stupnioh volnosti. Z vlastností t-rozdělení plyne, že Interval (u* - t (2d*))(c*(d*r)-1)1/2, jU*+ t (dMXc'UVr1)172), 1-V2 1 1W2 (4.24) kde *1-0^2(d ) je 100(1-0, b> 0. Chceme nalézt 100(1-«0% věrohodnostní interval. Aposteriorní rozdělení 6 je beta, rozdělení s parametry (a+x,b+n-x), kde x je počet vadných výrobků ve výboru. Zkonstruovat nejkratší věrohodnostní interval s předepsanou věrohod-ností je obtížné z důvodů stejných jako 6**~ . Za 100(1-«*)% věrohodnost 1 rá 1 ä/ ní interval lze vzít interval (G~ (^j a+x, b+n-x), G~ (1-*; a+x, b+n-x)), kde C"1(y; a+x, b+n-x) je kvantilová funkce beta rozdělení s parametry (a+x, b+n-x). ^ i Při a . = 1, x = 0 bereme však spíše interval (0,1-oin+ ) místo — 1 — 1 (1-(1-*/2)(b+n) , 1-( 0 = 0 6 é0. Jsou-li X1,...,Xn (aspoň jedno Xi je různé od 0) počty požárů v jednotlivých týdnech, pak aposteriorní rozdělení je gama s parametry n (n, 1_X.) (je o limitní aposteriorní rozdělení). Úkolem je zkonstruo-1=1 1 vat 100(1-q> ©-]»••• ,©Q jsou neprázdné disjunktní borelovské podmnožiny ©, LJ ®. = <5), můžeme formulovat jako statistický rozhodovací problém (®,A,R), kde A je množina rozhodovacích funkcí, které nabývají pouze hodnot d^,...,d^, kde di označuje rozhodnutí, že platí hypotéza H^, i = 1,.«t,k. 5.2 ZTRÁTOVÉ FUNKCE POUŽÍVANÉ Pftl TESTOVÁNÍ HYPOTÉZ Uvedeme si některé nejčastěji používané typy ztrátových funkcí pro úlohu testu hypotézy HQ proti H1 (pro úlohu diskriminace se používají obdobné). Typ velice často souvisí s tvarem hypotéz. Obecně volíme ztrátovou funkci L s vlastnostmi L(g,d±) = 0 8 e ©±, i = 0,1 L(8,d±) > 0 8 é®± - 70 - 1 Jsou-li obě hypotézy jednoduché, volíme ztrátovou funkci L<§i»di) = 0 i * 0,1 LÍB^d,). = a1 U§.1,dD) = aQ kde a±> 0, g± = qít i = 0,1. Z věty 3*3 pak plyne, že se rozhodneme pro platnost hypotézy Hq, jestliže a-|$r(xle0) > ao(1-^} r<£l§i>» (5.D pro platnost hypotézy R^t jestliže platí nerovnost opačná a v případě rovnosti se můžeme rozhodnout libovolně. V obecném případě používáme většinou jeden ze dvou následujících typů ztrátových funkcí: L.CS.d,) =0 e & ®. (5.2) = aj e 4 ©á i * o, 1, I0(6^.) =0 9e0± (5.3) = k. díe/Sy e^<3>± i = o,i lede dCB,®^) je vzdálenost (obvykle Eukleidova) 8 od množiny ©if n.A :> 0, K^^O, i = 0,1. Zatímco ztrátová funkce L* závisí pouze na xom, zda 8 náleží do ©Q nebo ©1, ztrátová funkce nabývá tím větší hodnoty, čím je skutečná hodnota 6 vzdálenější od hypotézy, pro kterou jsme se rozhodli. Nyní se budeme zabývat vlastnostmi těchto ztrátových funkcí. Pro rizikovou funkci odpovídající L» platí R<(e,cf) = aQ P(d^e)q(§)d*(e) + (5.4) + &1 $ PCďíp^d/^qCgJd^g). Pravděpodobnosti P(ít5)=di/§) pro 6e it i = 0,1 obou vlastně pravděpodobnosti chybných rozhodnutí. Pro libovolnou rozhodovací funkci 5^ a1 = libovolně pro P( 0e©1/X=x) = a ' . i ~ * a0 1 Čísly aQ,a1 připisujeme hypotézám Hq,H1 váhy, které mohou odrážet závažnost té které hypotézy. Příklad 5.1. Doba čekání na autobus na určité zastávce v určitou denní dobu má rovnoměrné rozdělení (0,8). Chceme testovat hypotézu - 72 - H0: 8éd, kde d je dáno, proti alternativě E^i G>d. Ze situace na jiných tratích plyne, že 8 můžeme považovat za náhodnou veličinu s Paretovým rozdělením (a,x0). Jsou-li zjištěná čekací doby X.,,...,!^ je aposteriorní rozdělení parametru 8 opět Paretovo s parametry (a+1, max(x0,X1,... ,Xn))« Tedy platí d P(8-čd|X=x) = \ (1+a)(max x,)a+1 8~a"2 IÍ 6 > max x, }d8 = (5.11) 5 Oiiin 1 1 OíUn 11 1 - (max Xj/d) Oáritíl X a+1 pro d > max O^i^n = 0 pro d Á max O^i^n ti' P(8>dlX=x) = (max x,/d) Oéiín 1 a+1 pro d > max x.,, 0*i«n 1 (5.12) = 1 pro d d pro 8 > d pro 8 0, je bayesovská rozhodovací funkce dl$=x) = dQ pro P(8íLdlX=x)>P(6>d|X=x) = libovolně pro P(8^dlx=x) = P(8 >d\x=x). Vzhledem k (5.11) a (5.12) se rozhodneme pro d1, jestliže d <. max nebo 0 max (max x,\d)a+1>1/2. O&i&n - 73 - Máme-li např. d = 15, xQ - 5, a - 3, x,, = 10, x2 « 3i ^3 = 2» = 5, x5 = H, pak (max x, ld)a+1 = (14l15)4> i • 0áÍí:5 A Rozhodneme se tedy pro d^. Ztrátová funkce L** daná (5*3) je užívána především,je-li jedna z hypotéz jednoduchá a ® je otevřený k-rozměrný interval (konečný nebo nekonečný). Používáme ji též v případě, že ô je jednorozměrný parametr a raáme-li hypotézy h0: 9í Gq, IL,: 6 > BQt nebo je-li 6 = - ;,©.,,«.« ,6j )' k r opěrný parametr a raáme-li hypotézu např. HQ1: B1 -.i Oq, LU 1 : > Op. Je-3 i 9 jednorozmerný parametr, ©otevřený interval, 8qs® , hc: 9 4 6^, H1 s 6 > Oq a je-li ztrátová funkce L#, dána předpisem Lo(8,d0) = 0 8^60 (5-13) = G - 80 8 > qq L^ce.d^ - e0 - e 86 e0 = 0 s > e0 pak baye^ovekí rozhodovací funkce je rovna Úq, jestliže E(e|£=$) ^ e0 (5.H) a je d.j, jestliže platí nerovnost > . Přesvědčíme se, že tato rozhodovací funkce je bayesovské. Podle (3.10) stačí spočítat pro libovolnou rozhodovací funkci ď podmíněnou střední hodnotu ztrátové funkce: ♦ 00 E(L0(e,e0\-«> g \ (E(6lX=x)-Q0)r(x)d-vn(2) - J (e-60)q(G)d*(8). ^xjECel^xke^ Příklad s.1 (pokračování). Při stratové funkci = 8 - d pro B > d L^ÍG.d.,) =0 pro G> d = d - 8 pro 6ád je bayesovská rozhodovací funkce rovna dQ, jestliže max(xn,... ,x^) E(8|x=x) = -^-— . a ^ d. Pro data uvedená v první části příkladu se i při této volbě ztráto vé funkce rozhodneme pro d^. - 75 - 5-3 TESTY PŘI ft«S>Q) ° O Oba typy ztrátových funkcí uvedená v předchozím paragrafu však mají jednu nevýhodu. Je-li q(6) = 0 pro sk. vš. >) 8 e. ®j_ kde i b o nebo 1, pak bychom ae nikdy nemohli rozhodnout pro hypotézu H^, nebot nulovost apriorní hustoty implikuje nulovost aposteriorní hustoty. Takováto situaoe nastane napr. je-li ^ $>T, ® 6 ^]£t r< k, ^ Lebesguova míra a >(©) > 0 (u všech apriorních hustot uvažovaných ve 2. kapitole byla 7i Lebesguova míra). V tomto případě se dá postupovat jedním ze dvou způsobů. Předpokládejme, že M®Q) ■ 0. Místo hypotéz HQ: 6*s ®Q, H1: 6e©1 budeme uvažovat hypotézy Hqi §6®*q, H*: q »®^« kde ©Je \ taková, že ®'Q 3 Q)Q 0 < \ q(6)dX(e) < 1 Caf0 a míra 7v(©q-0 volíme podle konkrétní situace, např. a = 5« Pak při ztrátové funkci (5.2) s aQ = a., (vzhledem k (5.10)) se rozhodneme pro Hq, jestliže , - $(105 jH^) + $(957JHi) < i. Je-li např. x = 110, pak se rozhodneme pro H* , při x ■ 90 se rozhodneme pro H*. Při Hq: § = g0 (jednoduchá hypotéza) používáme též jiný postup. Definujeme nové apriorní rozdělení. Bodu 8q přiřadíme apriorní prav- - 76 - děpodobnost q > 0 a borelovským množinám Bc®-\q^} přiřadíme pravděpodobnost P(§^B) = (1-q) $ q(8)dM§). B Pák aposteriorní rozdělení 8 je q r(x|fin) Ke-gJj-j).-=~2- (5.15) - Ä q r(x|00)+(l-q) J r(x|e)q(8)d*<8) p - <1-^B r(xlg)q(8jdMg) l* * q r(x|§0)+(1-q) ^r(x |g)q(g)d*(§) Marginální hustota X je rovna r*(x) = r(x|60)q + r(x[e)q(§)d*(§). (5.16) Na ® - existují apriorní i aposteriorní hustoty q* a T* vzhledem k *j q*(6) . (1-q)q(e) g*©- feQ\ (5.17) = Cl-q?^pq(fl? gs®- ÍQQ) (5.18) Obdobně lze postupovat i v obecnějších případech, např. je-li ®0 m * ®0> §0GR1* ®d€ ^k-1* Ten-to postup nemusí být vždy vhod- ný, jak nyní uvidíme. Lindlevův paradox. Necht X má rozdělení 11(8, U"2), 6"2> 0 známé, a testujme hypotézu HQ: 9 = 8Q proti H1: 8 / 8Q. Předpokládejme, že apriorní pravděpodobnost, že 9 = 8q je q£.(0,1) a apriorní hustota SnaRfiepi je (1-q)(2TTb2)~1/2 exp|-(6-a)2(2b2)"1}, b^O, aeRr Z (2.10) a (5.16) obdržíme pro marginální hustotu X r*(x) = » exp^~ 1A(x-8n)2?+ t yq n expí " a—sy-íx-a)2?, Í2^F l 2(r 0 J N^rTffW) Fi 2(b2+ff2) J icH, (5.19) - 77 - Dále z (5.15) plyne, že aposteriorní rozdělení je P(0«8o|X*x) = eXpl"^7 (x'80)2} Cr#(x))"1 (5.20) ť(e|x) - . ,> expí--^—rr (x-a)2l (r#(x))~1 (5.21) Urtf+r) * 2(b2+ 1/2. Donadíme-li na levé straně z (5.20), dostaneme po jednoduché úpravě ekvivalentní nerovnost Položme déle pro jednoduchost b2 = 1, a = 0Q, q = 1/2, ^2 = exp (-25). Pak je poslední nerovnost ekvivalentní nerovnosti |í^e'! «1 +e-2V/2 (iog(1 +.a5))i/z, přičemž výraz na pravé straně je větší než 5» Docházíme tedy k paradoxnímu závěru. Pro hypotézu Hq se totiž rozhodneme i v případě x-8, '0 1". zatímco při klasickém přístupu bychom Hq zamítli i na hladině 5,1.10"7. Z toho lze soudit, že bua ztrátová funkce nebo apriorní rozdělení nebyly vhodně zvoleny (např. hodnoty blízké 0Q jsou mnohem pravděpodobnější než hodnoty vzdálenější). Tento paradox publikovaný Lindleyem vyvolal řadu diskusí, z nichž některé byly publikovány, např. v [8]. - 78 - Na závěr paragrafu se zmíníme ještě o jednom typu testů, a to testech podílem aposteriomíoh hustot. Pro test hypotézy HQ: 8<£(3>0 proti hypotéze H1: 8 *í ®0 sestavíme podíl sup F(8|x) sup t(§Is) (5*22) 06® Tento podíl je vždy < 1. Hodnoty podílu blízké jedné indikují platnost hypotézy HQ, zatímco malé hodnoty indikují platnost hypotézy Tato metoda je doporučována, pokud ^ q(§)d\(g) = 0 nebo je nu-le blízký. Neodpovídá obecně žádné ztrátové funkci. Je analogií testu podílem věrohodností v klasické statistice a používá se též jako v klasické statistice pro test lineárních hypotéz v lineárním modelu. Dosazením (2.30) do (5.22) obdržíme po delším výpočtu obecný tvar testové statistiky, který je ve speciálním případě roven funkci P-statistiky používané v klasické statistice. Další podrobnosti o této metodě a jejím využití při testech v lineárních modelech může čtenář najít např. v [5], {VI* 5.4 TESTY 0 STREDNÍ HODNOTĚ NORMÁLNÍHO ROZDĚLENÍ Z látky vyložené v předchozích dvou odstavcích můžeme získat řadu testů o střední hodnotě normálního rozdělení. Uvedeme si některé z nich. a. Nechí x-j,...,:^ je náhodný výběr z normálního rozdělení N(ji^q), ô*q >0 známé a yU. je neznámý parametr. uvažujme úlohu testovat HQ: pí - jiQ proti s |U / u-Q. Předpo kládě jme, že apriorní rozdělení |X je následující: P(|x = jíq) - q a na R1 - {jLq\ hnstotu - 79 - (1-q)(2Tb2)"V2 exp{-(|t-a)2(2b2)"1} , a6H1P b2>0. Pak platí ^■falfrg) ^rrp'1^2 exp[4(xl-1i0)2(2tr2)-1) P(j^0|x=x) " O-q).r(x) kde r(x) je dáno (2.10). Při ztrátové funkci (5.23) Vu,d0) = 0 (i « /i0 (5.24) ■ ao r * /*o Vf^) = 0 p j< pQ b a 1 ř-f»0. kde aQ>0, a^> 0, se rozhodneme pro dg, jestliže (použili jsme <5»9), (5.23) a (2.10)). Při ztrátové funkci WMo* = "^"V* |" * R1 (5*25) = k2 P - ft) -0 K * ř0» kde k.,> 0, k2>0, se rozhodneme pro dQ, jestliže k1 B«f*-|*0)2|í',5) <■ k2 ^"PolW tj. Vi-qK^2-^-^)2) <. k2 Pty-foUf-s), kde (U., a (T2 jsou dány (2.9). Mějme hypotézu H01jxí,|Ll0 proti B.^:^>\xQ a předpokládejme, že o apriorní rozdělení jx je H(a,b ). Při ztrátové funkci - 80 - L0((Lt,d0) = 0 jxts^ (5.26) se vzhledem k (5.14) a (2.9) rozhodneme pro dQ, jestliže I^b2 +a ťr2 ^-s-T * ftr nb* + ťř-g 1 u B. Nechí X1t...,Xn je náhodný výběr z JKjU.éľ2), kde ^ a fr2> O jsou neznámé. Mějme úlohu testovat hQ:u = ju0 proti h1 x / Předpokládej-me, že apriorní rozdělení (|/,fl ) je následujíoíj P(|t « |Uq) = q, podmíněná apriorní hustota C při daném u = pQ je gama rozdělení (c,d), podmíněná apriorní hustota (|i, 5"~2) při podmínce ji £ jlQ je normální-gama s parametry (a,r,c,d) (hustota je dána (2.18)). Pak pro podmíněnou hustotu r(xjp=ju»0) náhodného vektoru X při podmínce |H = jU. 0 platí • ^ «r2)d-1 ezpf-c/^aer2 - -n/2 c* ^2 + ^ a tedy podle (5.15) q r(x|ua|iu) kde r(§) je dáno (2.20). Při ztrátové funkci (5.24), která ne-závisí na 0" > 0 se pak rozhodneme pro dQ, jestliže - 81 - Nyní uvažujme ztrátovou funkci L*.(H»8'"2ldl) = k1 p = |t0, ťf2> 0 = 0 (Ut J* pi0, fr2> O, kde kQ> O, k1 > 0. Pro libovolnou rozhodovací funkci /(x) platí BCl^^.CV^^lS-s) = Cl-qíkoEl^-Uo)2!^} je-li. Při úloze testovat HQ»Ji4ft0 proti E\j:[A>p0 a ztrátová funkci (5.26) pro vš. C >0 se rozhodneme pro dQ, jestližp r a + n % . i, r + n * TO" (stačí dosadit (2.15) do (5.14)). C. Uvažujme 2 nezávislé náhodné výběry X-j,...,^ z Níji^ť?-2) a Y1f... ***,Yn z H^P2,ff )* Pl* í* 2» °" > 0 neznámé a úlohu testovat hypoté- - 82 - zu Hq: fi^jtg proti H1: f*i>f<-2' Předpokládejme, že apriorní rozdělení ,(t2,e-"z) lze popsat následovně. Podmíněné apriorní rozdělení (f^T.ftg) při daném (f2 je b( (a1 ,ag), q1 * °-D), marginál- ? 2 ní apriorní rozdělení &~ je gama s parametry (c,d). Pak aposte- rioroi rozdělení """Cfl-j»fa, ^\parametrů ,jLt2, r"2) j© násle- dující. Podmíněné aposteriorní rozdělení (p-^tjU-g) při daném 6* je H(a* ,•*)', ^Vo^^íAn rO>, kde n1 2 n r1a1+ I Xi 1 1 i=1 x ř-2 rňa.+ Ť2 Y, r1 + n1 a* . 2 —? Marginální aposteriorní rozdělení 6*" je gama s parametry (c*,d*), r2 + n2 kde &* ». d+(n,j+n2)/2 a ^ i=1 1 * i=1 1 r1+ n1 r2n2(Ý-a2)2 r~ t- n~ 42 i=1 Při ztrátové funkci L(řl*|u2'6'"2,d0) s 0 = h -ř2 = o í1 platí pro lib. rozhodovací funkci <^(x,y E(L(Ml,u2,6--2? o f2> o >ř2« 4oo = S S ^(p2-h) (ťlf 2»«r2>U»ť dtt^^diT2 pro cT(^X)=dr - 83 - Fo úpravě zjistíme, že bayesovská rozhodovací funkce bude rovna čLq, jestliže tj. jestliže r1a1 + n^ ^2a2 + n2^ r1 + n1 4 r2 + n2 * Bayesovská rozhodovací funkce bude rovna d^ jestliže platí nerovnost . i str^8,45 Příklad 1.1 (pokračováni). Uvažujme úlohu diskriminace mezi hypotézami H.,: 6 4 90, H2: 90<8<110, YLy. 8>110 (které odpovídají podprůměrné, průměrné a nadprůměrné inteligenci) a předpokládejme, že ztrátová funkce je dána předpisem (d^ označuje rozhodnutí, že platí): L(8,d.,) = 0 8^.90 = 8 - 90 90< 8<: 110 = 2(8-90) 8>110. L(6,d2) = 90 - 8 8 *90 = 0 90^ 8 <:110 = 8 - 90 8 > 110 L(8,d3) = 2(110-8) 8< 90 = 110-6 90 < 8 <: 110 = 0 8^110. Tedy ztráta závisí na vzdálenosti od hypotetické množiny, jestliže jde o 8 ze 'sousední" množiny a na jejím dvojnásobku, jestliže 6 nenáleží ani do hypotetické ani do "sousední" množiny. Přímým výpočtem dostaneme pro lib. rozhodovací funkci 110 +» E(L(e, \ (G-110)i(8lx)d8 jestliže 110 o-Cx) * d2, 90 110 E(L(8, e|x=115) = 0,520. Odtud plyne, že při ztrátové funkci l*(B,á±) =0 8 e ®± * 1 6 £ ®± i = 1,2,3 přičemž Q = (-«,90>, ®2 = (90,110), ®3 = <110,+~), je bayesovská rozhodnutí opět d^. - 85 - APENDIXj PŘEHLED POUŽITÍCH ROZDELENÍ Níže uvedené hustoty jsou hustoty bud vzhledem k čítací míře (pro diskrétní rozdělení) nebo vzhledem k Lebesguově míře (pro spojitá rozdělení). Binomické rozdělení s parametry (m.p) (m ■ 1,2,...; p &<0,1>) má hustotu r(x|m,p) = (m) px(1-p)m-x x - 0,1.....m. (A.1) Platí t ., EX ■ mp, var X • rnp(l-p), J(p) = pfjlp') i (A.2) při m = 1 mluvíme o alternativním rozdělení. Poissonovo rozdělení s parametrem X (A > 0) má hustotu r(xl>) = e~% Xx (x!)"1, x - 0,1,2,... (A.3) Platí EX - X, var X » X, Jtt) « >"1 (A.4) Nef^a;ivně binomické rozdělení s parametry (a.p) (a> 0. pe<0,1>) má hustotu r(x)a,p) « (a+x~1) pa(1-p)x x « 0,1,2,... (A.5) Platí j(p) « _ä- P2(1-P) (A.6) EX = a(1-p)p~1, var X = a(1-p)p"2, Při a » 1 mluvíme o geometričkem rozděleni. Normální rozdělení s parametry J4 a fr2. (ozn. N(ju,6"2), f 6 0) má hustotu - 86 - r(x|fi,ff2) - <2Tff2r1/2 *xt>[-U-\L)2(2<ŕr'i} x«Rr U.7) Platí EX = (X, var X - 32, J(u,6" ) = (^2;2r2) ' (A'8) Gama rozdělení a parametry (a.p) (a>0), p>0) má hustotu r0, (A. 9) = 0 x <.0, 4-00 kde T(p) « [ t5""1 e~* dt. Platí 0 EX = p a"1, var X ■ p a"2. (A.10) Při p » 1 mluvíme o exponenciálním rozdělení* Při p = n/2 a a « 1/2 mluvíme o ^-rozdělení (centrálním) o n stupních volnosti. Beta rozdělení s parametry (a.p) (a> 0, h > 0) má hustotu r(x|a,b) - (B(a,b))-1 xa~1 O-x)*"1 x e (0,1), (A.11) ■ 0 x £ (0,1), 1 kde B(a,b) « \ xa"1 (1-x)b~1 dx. Platí 0 " EX = a(a+b)~1, var X = ab J(a+b)2(a+b+1)]~1. (A.12) Rovnoměrná rozděleni e parametry (a.b) (a0, b > 0) má hustotu r(x(a,b) = (a/b) (b/x)a+1 x>b (A. 15) = 0 x2 platí EX « ab(a-'1)"1, var X = ab2((a-1)2(a-2)l (A. 16) Studentovo (t-) rozdělení o n stupních volnosti a parametrem yj Cp «. R1) má hustotu P(S±1) 2 -n£i Má-li náhodná veličina X rozdělení Y rozdělení^2 o n stup- ních volnosti a jsou-li X a Y nezávislé, pak náhodná veličina T - ^Š- fn má t-rozdôlení o n stupních volnosti a parametrem |i. Platí EX «= jx (A. 18) a pro n>2 platí var X a n-fr • F-rozdělení a n^ a n„ stupni volnosti má hustotu rxn1(nJ--n„ 2 (-1) 1/2 (1 + -1 x) 2 x 1 12 r(|1) P(§2) n2 n2 x«Rr (A.19) Jaou-li náhodná veličiny Z a Y nezávislá a mají-li^2-rozdělení o n^ resp. n2 stupníoh volnosti, má náhodná veličina X/n- - 88 - {•-rozdělení a a stupni volnosti. Pro n2 > 2 platí n2 BP - 5"*5 (A.20) a pro n2>4 var P * -*—;—s-* . (A.21) ^(^+^-2) n1(n2-4)(n2-2)2 * Multinomické rozdělení § ^-ramotrv (n.n) (n « 1,2,...j g » (p^,... • ••íPjj)', Pjl& <0,1>, i«1,..«,k|X = 1, 2) má hustotu r(x|n,p) - x^Jtlj^\ Pi1--.?^ 5 - (x,,...^)', (A.22) ,...,k, x^ jinak. xí = 0,...,n, i « 1,...,k, 1 Zi ■ n 1 i-1 1 Platí EX± ■ ap^ var I± - np^O-Pj) i - 1,...,k, (A.23) covílj^,!^) - -npjPjj i, j - 1,...,kj i jí 3, (A. 24) 1...1 1/p. n j(p i.....w •jfe<5;::|>+n< o -i/^j- u-25> Dirichletovo rozdělení (mnohorozměrné beta rozdělení) s parametry ^ - (°< 1.....0<]e) ' («3 0, i « 1.....k) má hustotu r(cf1+...-Mk) oí.,-1 tf.-l ■ ru,)...^) xi •••xk s-(xi.....xkr (A-26) x±> 0, i - 1,...,k, Í.Xi = 1 1 i»1 x m 0 jinak. Platí cí± oři<0 EL - gi, var X, ^ i u 1 , i - 1,...,k, (A.27) 0 *5(*0 + 1) - 89 - cov(X,,X,) - - a*-1^ , d,i » 1.....k| i é á, (A.28) 1 3 ■ío(*0+1) kde o(n u i»1 Í oC±. Marginální rozdělení X± je beta rozdělení s parametry <*±, oíQ - cC1. k-rozměrné v ^normální rozdělení a parametry fi a<4 (ozn. N^ty^)) (|( f R^iS -ey-metrická pozitivně definltní matice typu k * k) má hustotu r(x|£,ž) - CaTr^Cdet^r172 exp^i^T^X-^l' (A'29> Platí EX = ji , var X = Z . (A.30) k-rozměrné Wishartovo rozdělení (centrální) s n stupni volnosti s parametrickou maticí ž- ( ž - symetrická pozitivně definitní matice typu kx k) má hustotu r(xjn,£) = c^Uetlr1^2 (det s)<»-*-1)/2 . (A.31) . exp|- \ tr(£"1x)\ pro vš. ž 'f f11'!"' Ť*) kde Cv1. - 2nk/2Tk(k-l)/A fr r(£4=Í). (A.32) k,n 3a1 ^ Je-li X-j,...,:^ náhodný výběr z Hk(fi^)t pak náhodná matice ä - i li íí i=»1 má k-rozměrné Wishartovo rozdělení s n stupni volnosti s parametrickou matici X• Náhodná veličina a'§ a 2 ES-jtó U.35) var T - £. (A.36) Nechí má náhodný vektor % « (Y^...,^)' rozdělení Hk(g,£), kde X-je regulární, nechí má náhodná veličina Z ^-rozdělení s n stupni volnosti a | a Z jsou nezávislé. Definujme náhodný vektor X -« (X1,..•,Xk)' předpisem X± = -j| >Jn + i « 1.....k. (A.37) Pak náhodný vektor J má k-rozměrné t-rozdôlení s n stupni volnosti a parametry |U » ,... a £. Dvo.1rozměmé Paretovo rozdělení s parametry (r^r^.a) (r.,0) má hustotu x aCa+DCr^-r-)8^ r(x1tx2J r^rg.a) - -— (ac, ,3^)« R2, (A.34) v ^2—x^ J xT*r1» r21 platí EX1 = fills " a-f ar0-J*i EI, (A. 35) a pro a>2 a(r^>-r1) var X1 - var X2 - (a-1)2(a.2) (A.36) - 92 - LITERATURA Anděl. J.: Matematická statistika, SN TL, Praha 1978. [23 Berger, J. O.: Statistical decision theory, New York Inc, Springer-Verlag, 1980. [3] Blackwell, D. a GÍshick, M. A.: Teorie her a statistického rozhodování, Praha, Academia 1964. [43 Box, G. E. P. a Tiao, G. C.: Bayesian inference in statistical analysis, Reading, Massachusets, Addison-Wesley, 1973. £5} De Groot, M. H.: Optimal statistical decisions, New York, lác-Graw-Hill Company, 1970 (ruský překlad: Optimalnyje statisticeskije řešenija, Moskva, Mir, 1974). [6] Lindley, D. V.: Introduction to probability and statistics from a Bayesian viewpoint, Part 1. Probability, Part 2. Inference, Cambridge, Cambridge University Press, 1965« [7] Maritz, J. S.: Empirical Bayes methods. London, Methuen and Co, 1970. [e] Shafer, G.: Lindley's paradox. Technical Report No. 125, Department of Statistics, Stanford University, Stanford 1975« [9] Winkler,R. L.: Introduction to Bayesian inference and decision. New York, Holt, Rinehart and Winston, Inc., 1972. Knihovno mat.-fy;, fains* m96 1W 00 řraho-Koriln,SoWwHii - 93 -