Směsi rozdělení Vedle skládání je důležitou operací s diskrétními rozděleními mísení Konečné směsi – Studovaný jev = ve skutečnosti více jevů – každý z nich má své rozdělení Např: pojistný nárok ze zdravotního zubního pojištění může být pravidelná kontrola, plomba, vytržení zubu. Každá má jiné rozdělení. Definice: Náhodná veličina Y je n-bodová směs náhodných veličin X1, . . . , Xn jestliže její distribuční funkce je dána vztahem FY (y) = a1FX1 (y) + a2FX2 (y) + · · · + anFXn (y) kde aj > 0 a n j=1 aj = 1. aj ... pravděpodobnost, že Y je realizací n.v. Xj . – Stejný vztah platí pro hustotu nebo pravděpodobnostní funkci – Obecněji, počet rozdělení n může být také parametr. – Směs může popsat vlastnosti které jednoduché rozdělení nemá. Např. 2-bodová směs Gamma rozdělení může být bimodální Smíšená Poissonova rozdělení Příklad: Řidiče lze rozdělit na dobré a špatné. Každá skupina má Poissonovo rozdělení s parametry λ1 < λ2. Rozdělení (smíšené 2-bodové) je pak P(Y = k) = p e−λ1 λk 1 k! + (1 − p) e−λ2 λk 2 k! – Tři parametry, λ1, λ2, p odhadneme např. metodou maximální věrohodnosti Obecné směsi rozdělení Motivace pojištění automobilů • každý řidič je v něm zařazen do jedné z tarifních tříd za účelem stanovení výše pojistného • při klasifikaci bere pojistitel v potaz tarifní proměnné – věk, zkušenosti s řízením, historie nehodovosti atd. • řidiči v rámci jedné tarifní třídy si nejsou úplně stejní – odlišné řidičské schopnosti, rozdílné reakce na silnici apod. – Každý řidič má své rozdělení, popisující jeho rizikovost ( typicky Poissonovo). • směsi rozdělení (i) využíváme k modelování heterogenity uvnitř jednotlivých tarifních tříd (ii) jejich parametry můžeme chápat jako náhodné veličiny • rozdělení náhodných parametrů nazýváme mísícím rozdělením Zavedení rizikového parametru θ • předpokládejme, že úroveň rizika každého klienta lze charakterizovat nezáporným rizikovým parametrem θ • zahrnuje v sobě skryté faktory jednotlivých pojištěnců, jež pojišťovna není s to pozorovat, tj. je neznámý • je realizací (buď diskrétní, nebo spojité) náhodné veličiny Θ • pro každou tarifní třídu jsme schopni určit pravděpodobnostní funkci, resp. hustotu pravděpodobnosti πΘ(θ) náhodné veličiny Θ • pravděpodobnost, že úroveň rizika náhodně vybraného klienta nepřekročí hodnotu θ udává distribuční funkce FΘ(θ) = P(Θ ≤ θ) náhodné veličiny Θ • parametrem θ může být např. střední hodnota Poissonova rozdělení. Pravděpodobnostní a generující funkce směsi rozdělení • pravděpodobnost, že nastane právě k pojistných událostí je vážený průměr pravděpodobností pro jednotlivé θ: pN(k) = pN|Θ(k|θ)dFΘ(θ) = E pN|Θ(k|θ) = = E P(N = k|Θ = θ) (1) • pro spojité Θ: pN(k) = pN|Θ(k|θ) · πΘ(θ)dθ • pro diskrétní Θ: pN(k) = j pN|Θ(k|θj ) · πΘ(θj ) – pN|Θ(k|θ), resp. pN|Θ(k|θj ) představuje podmíněnou pravděpodobnostní funkci náhodné veličiny N za podmínky Θ = θ, resp. Θ = θj • GN|Θ(s|θ) značí podmíněnou generující funkci počtu událostí, je-li θ rizikový parametr nepodmíněná generující funkce počtu událostí je dána vztahem GN(s) = GN|Θ(s|θ)dFΘ(θ), (2) integrujeme přes obor hodnot θ (obvykle od 0 do ∞ pro Po(θ)). • pro spojité Θ: GN(s) = GN|Θ(s|θ) · πΘ(θ)dθ • pro diskrétní Θ: GN(s) = j GN|Θ(s|θj ) · πΘ(θj ) • mísící rozdělení určené distribuční funkcí FΘ(θ) může být jak diskrétního, tak spojitého typu (i) je-li diskrétního typu (Θ je diskrétní náhodná veličina) → diskrétní směs rozdělení (speciálně konečná) (ii) je-li spojitého typu (Θ je spojitá náhodná veličina) → spojitá směs rozdělení Směsi Poissonových rozdělení – jsou oblíbeným nástrojem pro modelování nehomogenních portfolií – Poissonovo rozdělení samo o sobě špatně fituje data pozorovaná na heterogenním pojistném kmeni • uvažujme podmíněnou pravděpodobnostní funkci náhodné veličiny N vzhledem k Θ = θ v následujícím tvaru pN|Θ(k|θ) = e−λθ · (λθ)k k! (počet nehod daného klienta má Po(λθ)) • z (1) odvodíme nepodmíněnou pravděpodobnostní funkci smíšeného Poissonova rozdělení Definice Diskrétní náhodná veličina N se řídí smíšeným Poissonovým rozdělením s parametrem λ > 0 a mísící distribucí FΘ(θ), značíme N ∼ MPo(λ, FΘ(θ)), jestliže pN(k) = e−λθ · (λθ)k k! dFΘ(θ), k = 0, 1, . . . (3) • λ je intenzita nehodovosti, udává průměrnou nehodovost jisté tarifní skupiny • θ je rizikový parametr konkrétního klienta θ > 1 . . . špatný řidič θ = 1 . . . průměrný řidič θ < 1 . . . dobrý řidič Generující funkce: GN(s) = eλθ·(s−1) dFΘ(θ) = eλ·(s−1) θ dFΘ(θ) = = E eλ·(s−1) θ = GΘ eλ·(s−1) = MΘ λ(s − 1) (4) GΘ(s) = E(sΘ) je generující funkce mísícího rozdělení MΘ(t) = E(etΘ) je moment generující funkce mísícího rozdělení Střední hodnota a rozptyl: E(N) = GN(1) = λ·MΘ λ(s −1) s=1 = λ·MΘ(0) = λ·E(Θ) (5) Var(N) = GN(1) + GN(1) − GN(1) 2 = = λ2 · MΘ λ(s − 1) s=1 + GN(1) − GN(1) 2 = = λ2 · MΘ(0) + E(N) − E(N) 2 = = λ2 · E(Θ2 ) + λ · E(Θ) − λ2 · E(Θ) 2 = = λ · E(Θ) + λ2 · E(Θ2 ) − E(Θ) 2 = = λ · E(Θ) + λ2 · Var(Θ) (6) • parametr rizika vybíráme tak, aby E(Θ) = 1 • na rozdíl od Poissonova rozdělení s equidispersion má smíšené Poissonovo rozdělení overdispersion, tj. Var(N) > E(N) Jak popsat smíšená Poissonova rozdělení? Definice Nechť X je náhodná veličina definovaná na pravděpodobnostním prostoru (Ω, A, P). Pak funkce ϕ : R → C daná vztahem ϕX (s) = E(eisX ) = E cos(sX)+i ·sin(sX) , s ∈ R, i = √ −1, (7) se nazývá charakteristická funkce náhodné veličiny X. • charakteristická funkce existuje pro každé pravděpodobnostní rozdělení, zatímco moment generující funkci nelze pro některá rozdělení s těžkým chvostem získat Lemma Existuje-li generující funkce diskrétní náhodné veličiny N, pak platí GN(s) = ϕN(−i · ln(s)) a ϕN(s) = GN(eis ). (8) Definice: Rozdělení náhodné veličiny X je nekonečně dělitelné, jestliže pro všechny hodnoty n = 1, 2, . . . lze jeho charakteristickou funkci ϕX (s) zapsat ϕX (s) = ϕn(s) n , (9) kde ϕn(s) je charakteristická funkce nějaké náhodné veličiny. • normální, Poissonovo, negativně binomické a gamma rozdělení jsou nekonečně dělitelnými rozděleními • binomické rozdělení není nekonečně dělitelné, jelikož jeho nosič (množina suppf = {x ∈ R : f (x) = 0}) je konečný Věta: Nechť G(s) je generující funkce smíšeného Poissonova rozdělení s nekonečně dělitelným mísícím rozdělením. Pak G(s) je též generující funkcí složeného Poissonova rozdělení a lze ji vyjádřit ve tvaru G(s) = eλ G∗(s)−1 , kde G∗(s) je generující funkce sekundárního rozdělení. Požadujeme-li, aby G∗(0) = 0, potom G∗(s) je určena jednoznačně. • vybereme-li jakékoliv nekonečně dělitelné mísící rozdělení, pak lze odpovídající smíšené Poissonovo rozdělení zapsat jako složené Poissonovo rozdělení • Pak pro výpočet můžeme použít např. Panjerovu rekurzi Příklady směsí Poissonových rozdělení a) Negativně binomické rozdělení • je smíšené Poissonovo rozdělení s mísícím gamma rozdělením • pravděpodobnostní funkce negativně binomického rozdělení je ve tvaru pN (k) = k + m − 1 k 1 1 + β m β 1 + β k , m > 0, β > 0, k = 0, 1, . . . • ukážeme, že je shodná s pravděpodobnostní funkcí smíšeného Poissonova rozdělení, kde mísícím rozdělením je gamma rozdě- lení pN (k) = E(pN|Θ(k|θ)) = ∞ 0 pN|Θ(k|θ)dFΘ(θ) = = ∞ 0 e−θ · θk k! dFΘ(θ) • mějme Θ ∼ Gam(α, β) (kde α = n, β = 1 λ ) pN (k) = ∞ 0 e−θ · θk k! · θα−1 · e− θ β Γ(α) · βα dθ = = 1 k!Γ(α) · βα ∞ 0 e−θ· 1+ 1 β · θk+α−1 dθ subst.: θ · 1 + 1 β = z; dθ = β 1 + β dz = = 1 k!Γ(α) · βα ∞ 0 e−z · zk+α−1 β 1 + β k+α = = Γ(k + α) k!Γ(α) · βα β 1 + β k+α = Γ(k + α) k!Γ(α) · βk (1 + β)k · (1 + β)α = = k + α − 1 k β 1 + β k 1 1 + β α • pro m = α se pN (k) = pN(k) b) Další směsi Poissonových rozdělení Název směsi rozdělení Neymanovo rozdělení typu A Mísící rozdělení Poissonovo rozdělení Název směsi rozdělení Poisson-inverzní Gaussovo rozdělení Mísící rozdělení inverzní Gaussovo rozdělení s parametry µ = 1, ν > 0 Název směsi rozdělení Poisson-log-normální rozdělení Mísící rozdělení log-normální rozdělení s parametry µ = −σ2 2 , σ2 > 0 Tabulka: Příklady směsí Poissonových rozdělení • hustota inverzního Gaussova rozdělení s parametry µ > 0 a ν > 0: fX (x) =    ν 2πx3 · e − ν(x−µ)2 2xµ2 , x > 0, 0, jinak. (10) • hustota log-normálního rozdělení s parametry µ ∈ R a σ2 > 0: fX (x) =    1 xσ √ 2π · e− (ln(x)−µ)2 2σ2 , x > 0, 0, jinak. (11)