Bayesovská analýza – má v dnešní době široké uplatnění – lékařská diagnostika, kriminalistika, pojistná matematika apod. – vychází z Bayesova vzorce Definice Nechť (Ω, A, P) je pravděpodobnostní prostor, B ∈ A a P(B) > 0. Potom číslo P(A|B) = P(A ∩ B) P(B) (1) nazýváme podmíněnou pravděpodobností jevu A Bayesův vzorec pro náhodné jevy – úpravou získáme vztah pro výpočet pravděpodobnosti průniku náhodných jevů A a B P(A ∩ B) = P(A|B) · P(B) , – pravděpodobnost průniku náhodných jevů A a B můžeme psát také ve tvaru P(A ∩ B) = P(B|A) · P(A) (2) – dosazením do vztahu pro podmíněnou pravděpodobnost obdržíme Bayesův vzorec P(A|B) = P(B|A) · P(A) P(B) (3) – Zákon inverzní pravděpodobnosti (Bernoulli, Bayes, Laplace) – Přímá pravděpodobnost: známe mechanismus, z kombinatoriky vypočteme pravděpodobnosti výsledků – Inverzní pravděpodobnost: vidíme výsledky, chceme informaci o mechanismu, který je generuje – P(A) je apriorní pravděpodobnost jevu A – P(B|A) je věrohodnost (likelihood) – P(A|B) je aposteriorní pravděpodobnost jevu A, tedy “nová” pravděpodobnost po pozorování jevu B (nová informace). Věta (Vzorec pro úplnou pravděpodobnost) Nechť Ω = n i=1 Ai je disjunktní rozklad, tj. {Ai }n i=1 je posloupnost po dvou neslučitelných (disjunktních) náhodných jevů s P(Ai ) > 0 pro i = 1, 2, . . . , n. Potom P(B) = n i=1 P(B|Ai )P(Ai ). (4) Věta (Bayesův vzorec - 2.verze) Nechť Ω = n i=1 Ai je disjunktní rozklad s P(Ai ) > 0 pro i = 1, 2, . . . , n, nechť B ∈ A a P(B) > 0. Pak P(Aj |B) = P(B|Aj ) · P(Aj ) n i=1 P(B|Ai )P(Ai ) , j = 1, 2, . . . , n. (5) Bayesův vzorec se používá v případě, kdy • máme úplný systém hypotéz A1, A2, . . . , An, které se navzájem vylučují a vyčerpávají všechny možnosti; přitom známe jejich apriorní pravděpodobnosti P(Ai ) • nastal jev B a známe podmíněné pravděpodobnosti P(B|Ai ) • nás zajímají nové aposteriorní pravděpodobnosti P(Aj |B), jež berou v úvahu, že nastal jev B Bayesův vzorec pro náhodné veličiny Podmíněné rozdělení • nechť X a Y jsou spojité náhodné veličiny definované na pravděpodobnostním prostoru (Ω, A, P) se sdruženou hustotou fX,Y (x, y) a marginálními hustotami fX (x), fY (y) • podmíněná hustota náhodné veličiny X při daném Y = y je vyjádřena ve tvaru fX|Y (x|y) = fX,Y (x, y) fY (y) (6) • jsou-li X a Y nezávislé, pak platí fX,Y (x, y) = fX (x) · fY (y), a podmíněná hustota je shodná s marginální hustotou • ze vztahu (6) lze sdruženou hustotu vyjádřit jako součin podmíněné a marginální hustoty fX,Y (x, y) = fX|Y (x|y) · fY (y), (7) analogicky fX,Y (x, y) = fY |X (y|x) · fX (x) (8) • marginální hustotu náhodné veličiny X získáme integrováním sdružené hustoty přes všechny možné hodnoty y fX (x) = fX,Y (x, y), (9) analogicky odvodíme marginální hustotu náhodné veličiny Y fY (y) = fX,Y (x, y) dx (10) • z (9) a (7) vidíme, že fX (x) = fX|Y (x|y) · fY (y), (11) obdobně fY (y) = fY |X (y|x) · fX (x) dx (12) • využijeme vztahů (6) a (8) k odvození Bayesova vzorce fX|Y (x|y) = fY |X (y|x) · fX (x) fY (y) , (13) ten můžeme také získat, položíme-li do rovnosti výrazy na pravé straně u obou rovnic (7) a (8). Typicky y jsou data a x jsou parametry Podmíněné očekávání • mějme podmíněnou hustotu náhodné veličiny X za podmínky, že Y = y fX|Y (x|y) • potom můžeme podmíněné očekávání vyjádřit ve tvaru E(X|Y = y) = x · fX|Y (x|y) dx (14) – je funkcí y – lze ji chápat jako náhodnou veličinu, nahradíme-li y za Y na pravé straně předchozí rovnice, E(X|Y ) je tedy náhodná veličina, která je funkcí Y • střední hodnotu náhodné veličiny E(X|Y ) lze získat E E(X|Y ) = E(X|Y = y) · fY (y) = = x · fX|Y (x|y) dx · fY (y) = = x fX|Y (x|y) · fY (y) dx = = x · fX (x) dx = E(X) (15) • Pro celkový rozptyl obdržíme E Var(X|Y ) + Var E(X|Y ) = Var(X) (16) • výše odvozená formule říká, že rozptyl náhodné veličiny X lze vyjádřit jako součet střední hodnoty podmíněného rozptylu a rozptylu podmíněné střední hodnoty Bayesovský a frekventistický přístup Rozdíly mezi bayesovským a frekventistickým přístupem 1. pravděpodobnost • FP – pravděpodobnost chápeme jako relativní četnost výskytu události v případě, kdy se s počtem opakovaní náhodného pokusu blížíme k nekonečnu • BP – pravděpodobnost měří důvěryhodnost nějakého tvrzení, založeného na informacích, které v daném okamžiku máme událost může být nejistá z důvodu náhodnosti nebo neznalosti – FP řeší pouze první případ nejistoty, zatímco bayesovský přístup řeší oba typy nejistot 2. parametr(-y) • FP – s parametrem se počítá jako s neznámou, leč pevnou konstantou (odhad parametru provádíme momentovou metodou, metodou maximální věrohodnosti) • BP – k neznámému parametru se přistupuje jako k náhodné veličině (díky uvedenému faktu lze odhadnou celé pravděpodobnostní rozdělení) 3. používané funkce • FP – parametry odhadujeme z věrohodnostní funkce • BP – u bayesovských metod navíc pracujeme s apriorní funkcí, tím zahrneme všechny dostupné relevantní informace Optimální teorie kredibility • byla poprvé zformulována roku 1967 (Bühlmann) Rizikový parametr • při stanovení výše pojistného u klienta se nejdříve vyhodnocují ratingová kritéria, na jejichž základě je klient zařazen do jedné z tarifních tříd, podle níž pak pojistitel určí sazbu • každá ratingová třída je homogenní s ohledem na použitá kritéria, ve skutečnosti ale v každé z nich zůstává jistá míra heterogenity – existuje totiž možnost, že se klient bude odlišovat od toho, co očekáváme • předpokládejme, že úroveň rizika každého klienta lze charakterizovat nezáporným rizikovým parametrem θ, resp. θ, který se u jednotlivých klientů liší – díky tomu můžeme klienty odlišit vzhledem k jejich rizikovému profilu • parametr θ v sobě zahrnuje skryté rizikové faktory jednotlivých pojištěnců, nelze jej vypozorovat, jeho přesnou hodnotu tedy neznáme • jelikož θ je různá pro různé klienty, jsme schopni v každé tarifní třídě určit pravděpodobnostní rozdělení πΘ(θ) udávající pravděpodobnost jednotlivých hodnot θ uvnitř dané třídy • distribuční funkce FΘ(θ) = P(Θ ≤ θ) náhodné veličiny Θ udává pravděpodobnost, že náhodně vybraný pojistník z dané tarifní třídy bude mít hodnotu rizikového parametru menší nebo rovnu θ • zkušenost jednotlivých pojistníků je jistým způsobem ovlivněna hodnotou θ • škody, resp. ztráty X vycházejí z podmíněného rozdělení fX|Θ(x|θ) náhodné veličiny X při daném θ Bayesovská metodologie • mějme pro konkrétního klienta tato pozorování X = x, kde X = (X1, X2, . . . , Xn) a x = (x1, x2, . . . , xn) • naším cílem je stanovit takovou sazbu, abychom pokryli škody, resp. ztráty v nadcházejícím období Xn+1 • předpokládejme, že θ je klientův rizikový parametr, jehož hodnotu neznáme a že škody, resp. ztráty X1, X2, . . . , Xn, Xn+1 jsou při daném θ nezávislé • nechť Xj , kde j = 1, 2, . . . , n, n + 1, má podmíněné rozdělení fXj |Θ(xj |θ) • pro známé θ bychom mohli použít fXn+1|Θ(xn+1|θ) pro předpověď škod, resp. ztrát v nadcházejícím období Xn+1 • θ bohužel neznáme, ale známe historii pojistných nároků x, využijeme ji k určení prediktivního rozdělení, což je podmíněné rozdělení Xn+1 při daném X = x • za předpokladu nezávislosti Xj při daném Θ = θ obdržíme sdružené rozdělení X a Θ v následujícím tvaru fX,Θ(x, θ) = fX|Θ(x|θ) · πΘ(θ) nezáv. = n j=1 fXj |Θ(xj |θ) πΘ(θ) (17) • marginální rozdělení X získáme z předchozího vztahu marginalizací – integrováním přes všechny možné hodnoty parametru θ fX (x) = fX,Θ(x, θ)dθ = n j=1 fXj |Θ(xj |θ) πΘ(θ)dθ (18) • má-li Θ diskrétní rozdělení, nahradíme ve (18) integrál sumou • analogicky odvodíme sdružené rozdělení náhodného vektoru (X1, X2, . . . , Xn, Xn+1), značíme fX,Xn+1 (x, xn+1) – na pravé straně (18) zaměníme v součinu n na n + 1 • z předchozích vztahů dostaneme prediktivní rozdělení fXn+1|X (xn+1|x) = fX,Xn+1 (x, xn+1) fX (x) = = 1 fX (x) · n+1 j=1 fXj |Θ(xj |θ) πΘ(θ)dθ (19) • dále πΘ|X (θ|x) = fX,Θ(x, θ) fX (x) = fX|Θ(x|θ) · πΘ(θ) fX (x) = = 1 fX (x) · n j=1 fXj |Θ(xj |θ) πΘ(θ) (20) • dosazením (20) do vztahu (19) pro prediktivní rozdělení máme fXn+1|X (xn+1|x) = fXn+1|Θ(xn+1|θ) · πΘ|X (θ|x)dθ (21) • πΘ|X (θ|x) – posterior, aposteriorní rozdělení fX|Θ(x|θ) – věrohodnostní funkce πΘ(θ) – prior, apriorní rozdělení fX (x) – normalizační faktor, evidence • ve vztahu (20) se normalizační faktor někdy vynechává (např. při odhadu parametrů), jelikož nezávisí na θ πΘ|X (θ|x) ∝ fX|Θ(x|θ) · πΘ(θ) (22)