Teorie extrémních hodnot 1.1 Parametrické modely extrémních hodnot Potřeba parametrického modelování vychází z toho, že se zajímáme o hodnoty, kterých je dosahováno s malými pravděpodobnostmi a které se v pozorovaných datech vyskytují zřídka. Nejprve uveďme dva základní způsoby, jakými mohou být pozorované hodnoty upraveny, aby na ně mohly být užity modely teorie extrémů: 1. Bloková maxima: Data Xi, X2, ■ ■ ■ jsou rozdělena do m bloků o velikosti n, z nich jsou zjištěna bloková maxima Mni,... ,Mnm. Příkladem mohou být roční maxima průtoků vody získaná z denních měření nebo roční maximální ztráty v řadě denních změn ceny akcií. 2. Překročení limitu: Z dat jsou užita pouze pozorování překračující stanovenou vysokou mez (tato metoda je v současnosti preferována, neboť efektivněji využívá informace o extrémních hodnotách obsažené v datech). 1.1.1 Rozdělení extrémních hodnot Parametrickými modely užívanými v analýze blokových maxim jsou rozděleni extrémních hodnot. Tato rozdělení jsou limitními rozděleními pro posloupnost vhodně normovaných maxim Mn z n nezávislých stejně rozdělených veličin (při n —► 00). Hrají roli analogickou roli normálního rozdělení v konvergenci normovaných součtů nezávislých stejně rozdělených veličin. Uveďme distribuční funkce rozdělení extrémních hodnot: Gumbelovo rozdělení: Fréchetovo rozdělení: Weíbullovo rozdělení: (2) (3) Úplné třídy těchto rozdělení dostaneme zavedením parametru polohy jj, a parametru měřítka o > 0: (4) (5) 1 Poznamenejme, že parametr je levým koncovým bodem distribuční funkce Fréchetova rozdělení a pravým koncovým bodem distribuční funkce Weibullova rozdělení. Výše uvedené modely je možné zavedením reparametrizace 7 = ^ převést na jednotný model zobecněného rozděleni extrémních hodnot s distribuční funkcí G,,(x) = exp(-(l + 7x)-1^), 7^0, (6) G0(x) = exp(-e^), 7 = 0, (7) kde 1 + 71 > 0. Parametry polohy a měřítka v původních třídách rozdělení byly zvoleny tak, aby platilo lim GJx) = Gq{x). Pro 7 > 0 dostáváme Fréchetovo rozdělení s levým koncovým bodem —1/7. Pro 7 < 0 dostáváme Weibullovo rozdělení s pravým koncovým bodem 1/|7|. V modelu zobecněného rozdělení extrémních hodnot je 7 parametrem určujícícm tvar rozdělení, tříparametrickou rodinu opět dostaneme zavedením parametru polohy fi a parametru měřítka a > 0: Gw(x)=exp^-(l+7^^) ^j, 7^0, (8) Go,vAx) = exP (_e^) ' 7 = 0, (9) kde 1 + 7 ^ > 0. 1.1.2 Fisherova-Tippettova věta Předpokládejme, že X1}X2,... je posloupnost nezávislých stejně rozdělených náhodných veličin s distribuční funkcí F. Potom Mn = max(Xi,.. .,Xn) má distribuční funkci P(Mn < x) = Fn(x). Limitní chování normovaných maxim charakterizuje Věta 1 (Fisher, Tippett). Pokud existuji posloupností konstant cn > 0, dn G IR tak, že lim P(Mn ~ dn 0, dn G IR, právě když lim nF(cnx + dn) = - lnG(x), x G R. (11) n^oo (Pro G (x) = 0 interpretujeme limitu jako +00.) Důkaz. Nechť platí lim P (Mn ^ V případě G{x) = 0 se z předpokladu, že limn^oo n F (cn x + dn) = 00 dokáže platnost vztahu lim^oo P (Mn < cnx + dn) = 0 sporem: pokud by posledně uvedená limita byla nenulová, mohli bychom vybrat posloupnost {n^} tak, že lim^oo F (cnfe x + drik) < 00. Obrácená implikace se dokáže podobně. □ 1.1.3 Fréchetovo rozdělení U Fréchetovo rozdělení s distribuční funkcí (2) má pravděpodobnost překročení hodnoty x vyjádření Gita(x) = 1 — exp (—x~a^j ~ x~a, x —► 00. Pro momenty Fréchetova rozdělení platí 'o kde l>OQ EXj = / xj dGlia(x) = T(l - j/a), j < a, Jo 00 T(z) = I xz-xe-xdx. Jo Sféru přitažlivosti Fréchetova rozdělení lze charakterizovat pomocí chvostů příslušných rozdělení: 3 Věta 3. F e MDA(Gi,a) F (x) = x-aL(x), a > O, kde L je kladná lebesgueovsky měřitelná funkce na (O, oo) splňující lim = 1, ŕ > 0. (SV) x^co L (x) Podmínka (SV) definuje pomalu se měniči funkcí v nekonečnu. Podle výše uvedeného tvrzení jsou chvosty rozdělení ze sféry přitažlivosti Fréchetova rozdělení pravidelně se měniči funkce v nekonečnu. Rozdělení z MDA(Giia) jsou rozdělení s „těžkými chvosty". Lze například ukázat, že momenty EX3 rozdělení nezáporné náhodné veličiny náležející do MDA(Glia) jsou nekonečné pro j > a. Přiklad. Paretovo rozdělení s distribuční funkcí F(x) = 1 - (—— ^ , a > 0, k > 0, x > 0, \k + x j patří do sféry přitažlivosti Fréchetova rozdělení. Vedle výše uvedené charakterizace pomocí chvostů lze toto ověřit přímo volbou normujících posloupností v (10): Cn = KTl1/01 /a, dn = KTl1/01 — K. 1.1.4 Gumbelovo rozdělení Pro distribuční funkci Gumbelova rozdělení platí Gq(x) = 1 — exp (—e~x) ~ e~x, x —► oo, jeho střední hodnota je rovna Eulerově konstantě A = 0.577216 ... Sféra přitažlivosti Gumbelova rozdělení obsahuje distribuční funkce s omezeným i neomezeným nosičem. Kladné náhodné veličiny z MDA(Go) mají konečné momenty všech řádů. Přiklad. Pro exponenciální rozdělení s distribuční funkcí F(x) = 1 - exp(-/3x), P > 0, x > 0, lze ověřit podmínku (10) volbou 1 ln n P' 'l P Do sféry přitažlivosti Gumbelova rozdělení patří i další často používaná rozdělení, například rozdělení gama, normální či logaritmicko-normální. 4 1.1.5 Weibullovo rozdělení Weibullovo rozdělení má zprava omezený nosič, není proto příliš významné pro modelování extrémních jevů. Pro momenty rozdělení s distribuční funkcí (3) dostaneme vyjádření EXj = í xjdG2,a(x) = (-l)J'r(l - j/a). J — oo Při označení xp = sup{x G IR : F(x) < 1} lze podobně jako u Fréchetova rozdělení charakterizovat sféru přitažlivosti Weibullova rozdělení pomocí chvostů příslušných distribučních funkcí. Věta 4. F G MDA(G2,a) •<=>■ xf 0 (13) Paretovo rozdělení: Wi,a(x) = 1 — x~a, x > 1, (14) beta rozdělení: W2,a(x) = 1 — (—x)~a, — 1 < x < 0. (15) Parametr a je pro Paretovo rozdělení kladný a pro rozdělení beta záporný. Uveďme vyjádření obecných momentů těchto rozdělení. W0: V. .V ./!. Wlta: EP = —, j a, W2,a: EX* = (-iy-^. a- j Podobně jako v případě rozdělení extrémních hodnot můžeme pro popis výše uvedených distribučních funkcí s vhodně zvolenými parametry polohy a měřítka zavést jednotný tvar v závislosti na parametru 7. Dostáváme pak distribuční funkci W^x) = 1 - (1 + 1x)-1/\ (16) 5 kde Paretovu rozdělení odpovídá volba 7 > 0 a nosič x > 0 a rozdělení beta odpovídá volba 7 < 0 a nosič 0 < x < 1/|7|. Z (16) také vyplývá spojitost uvedeného vyjádření v parametru 7 ve smyslu konvergence k distribuční funkci exponenciálního rozdělení při 7^0. Obecný tvar distribuční funkce zobecněného Paretova rozdělení pak opět dostaneme zavedením parametru polohy a měřítka: = , V e R, a > 0. (17) Parametr fi je vždy levým koncovým bodem distribuční funkce (17). Zaveďme nyní označení pro distribuční funkci rozdělení hodnot, které v pozorování veličin s distribuční funkcí F překračují stanovenou mez u, a pro distribuční funkci rozdělení excesů nad mezí u (výší překročení meze), = p(x - u < x\x > u) = F(x + U) ~ F(u) ^ q 0. 1.1.9 Konvergence rozdělení excesů Konvergence rozdělení excesů k zobecněnému Paretovu rozdělení lze užít k charakterizaci sféry přitažlivosti rozdělení extrémních hodnot. Uvažujme distribuční funkci zobecněného rozdělení extrémních hodnot (6). Věta 6. Distribuční funkce F patří do sféry přitažlivosti MDA(G7) právě když existuje kladná funkce f3(u) tak, že lim sup (x) - W^mu)(x)| = 0. U1XF0 0. Data mějme rozdělená do m bloků o velikosti n (může jít například o roční bloky měření prováděných denně). Z těchto bloků použijeme pro analýzu maxima Mni,..., Mnm. Pro dostatečně velký rozsah bloků n může být rozdělení blokových maxim aproximováno distribuční funkcí (8). K odhadu parametrů této distribuční funkce lze užít metodu maximální věrohodnosti. Příslušná logaritmická věrohodnostní funkce má tvar m l(l,fi,a;Mnl,...,Mnm) = ^ln^w(Mni) (24) = — m ln o - (1 +1/7) f> (1 + -,^) .,M^ í=i ^ ' í=i ^ kde glytlp(x) je hustota příslušná distribuční funkci (8). Logaritmická věrohodnostní funkce se maximalizuje za podmínek o > 0, 1 + 7 (Mni — fi)/a > 0 pro všechna i. Poznamenejme, že v tomto případě množina přípustných hodnot pro odhadované parametry závisí na pozorováních. Nejsou tedy splněny podmínky regularity obvykle užívané pro vyvození žádoucích vlastností odhadů. V literatuře se nicméně uvádí, že pro 7 > —1/2 lze dokázat konsistenci a asymptotickou vydatnost odhadů 7, fi, a získaných maximalizací (24). Všimněme si rozporu ve volbě optimálního počtu a rozsahu bloků. Velký počet m použitých bloků znamená více dat pro metodu maximální věrohodnosti a vede tak k odhadům s menším rozptylem. Oproti tomu velký rozsah n jednotlivých bloků znamená přesnější přiblížení skutečného rozdělení blokových maxim pomocí zobecněného rozdělení extrémních hodnot a vede tak k menšímu vychýlení výsledných odhadů. 1.2.2 Analýza extrémních jevů v modelu blokových maxim Předpokládejme, že jsme přiblížili rozdělení blokových maxim v datech pomocí distribuční funkce zobecněného rozdělení extrémních hodnot, s parametry odhadnutými například výše zmíněnou metodou maximální věrohodnosti. Odhadnutý model pak můžeme dále využít například pro 1. stanovení velikosti extrémního jevu, který bude v průměru nastávat se zvolenou frekvencí, 2. stanovení průměrné frekvence výskytu extrémního jevu dané úrovně. Nechť G označuje skutečnou distribuční funkci maxim z bloků o rozsahu n. Zaveďme označení rn,k = qi-i/k(G) 8 pro (1 — l//c)-kvantil rozdělení s distribuční funkcí G, tj. P(Mn > rn,fc) = i Hodnota rn^ je tedy definována jako úroveň, která je v průměru překročena maximem v jednom z k bloků. Nazýváme ji úroveň návratu (return level). Pokud přiblížíme distribuční funkci G distribuční funkcí (8) s odhadnutými parametry 7, ji, a, odvodíme vyjádření odhadu úrovně návratu ve tvaru r„,fc = A+-((-ln(l-l/A;))^-l). 7 Podobně můžeme pro dané u definovat pomocí distribuční funkce G hodnotu k 1 1 n'u G(u) 1 - G(u)' tj- P(Mn >u) = —. Lze tedy říci, že v krhU blocích o rozsahu n očekáváme výskyt jednoho bloku, v němž dojde k překročení úrovně u. Číslo kn^u nazýváme doba návratu (return period) a pro jeho odhad použijeme vztah k -- 1 ^7,/Í,ct (^) 1.2.3 Metody založené na překročení meze Uvažujme distribuční funkci zobecněného Paretova rozdělení (17) s nulovým parametrem polohy: W^(x) = 1 - (1 + 1X/a)-l'\ 7 Ý 0 (25) Wo,a(x) = 1 — exp(—x/a), kde a > 0. Rozdělení je definováno pro i>0v případě 7 > 0 a pro 0 < x < — a/7 pro 7 < 0. Zavedeme označení e{u) = E(X - u\X > u) (26) pro střední hodnotu velikosti překročení meze u za podmínky, že k překročení meze dojde. Jde o střední hodnotu rozdělení s distribuční funkcí (18). Z (17) a (18) lze snadno odvodit, že pro náhodnou veličinu se zobecněným Paretovým rozdělením (25) mají excesy nad danou mezí u opět rozdělení typu (18), se stejným parametrem 7 a parametrem měřítka závislým na u: (x) = (x), a(u) = a + 7 u, (27) 9 kde O < x < oo v případě 7>0a0"'. (29) Pak můžeme graficky znázornit body {(Xijn, en(Xijn)),i = 2...n}, kde Xn)Tl < ■ ■ ■ < Xi^n jsou pořadové statitiky z pozorování Xi,..., Xn. V případě, že pozorování pocházejí ze zobecněného Paretova rozdělení, měl by tento graf vykazovat lineární trend. Místo, kde začíná být průběh grafu přibližně lineární, může případně sloužit k volbě meze u pro účely modelování chvostů rozdělení pomocí zobecněného Paretova modelu. Rostoucí lineární trend bude ukazovat na model s 7 > 0, směřování k horizontálnímu grafu na případ s 7 = 0, klesající trend pak na 7 < 0. 1.2.4 Modelování chvostů rozdělení Mějme Xi,..., Xn pozorování nezávislých stejně rozdělených náhodných veličin. Označme Nu počet pozorování překračujících zvolenou mez u. Z hodnot Xi,... ,Xnu překračujících mez u získáme velikosti excesů Yj = Xj — u. Pro účel proložení rozdělení (25) pozorovanými excesy lze užít metodu maximální věrohodnosti. Logaritmická věrohodnostní funkce /(7,a;Y1,...,YNu) = -Nu\na-(l + l/7) (1 + 7~) (3°} j=i v ° / se maximalizuje za podmínek o > 0, 1 + ^yYj/a > 0 pro všechna j. Pokud pro danou distribuční funkci F budeme aproximovat rozdělení excesů nad mezí u zobecněným Paretovým rozdělením (25), můžeme psát pro x > u F(x) =F(u)F(u\x-u) = F(u) ( 1 + 7^-^ J . (31) 10 Inverzí odtud dostaneme vyjádření kvantilu (označovaného také jako hodnota v riziku VaRa) pro a > F(u): ^^^^{{m)1-1)- (32) Z (31) a (32) odvodíme pro x > u odhad K, í x-u^-lň F{x) = ^ 1+7— (33) n \ a a pro a > 1 — Nu/n odhad &(F)=u+!(feS (34) V (33) a (34) nahrazujeme parametry zobecněného Paretova rozdělení jejich odhady získanými například maximalizací (30). Pravděpodobnost F(u) odhadujeme poměrem Nu/n. Předpokládáme, že počet pozorování přesahujících mez u je dostatečný pro spolehlivý odhad F(u). Oproti tomu při odhadu F(x) pro vysoká x využíváme extrapolace založené na zobecněném Paretově rozdělení. 1.2.5 Hillova metoda Popíšeme přístup vhodný pro odhadování chvostů rozdělení náležejících do sféry přitažlivosti Fréchetova rozdělení (2). Jde o rozdělení charakteristická „těžkými chvosty" (pomalou konvergencí F(x) k nule při x —► oo). Sféru přitažlivosti Fréchetova rozdělení charakterizuje Věta 3. Parametr a se nazývá index chvostu rozdělení s distribuční funkcí F G MDA(Giia). Hillův odhad je odhadem indexu a na základě stejně rozdělených pozorování Xi,... ,Xn. Naznačíme jedno z jeho možných odvození. Označme e*(lnit) = E(lnX - lnu\ InX > lnu) 1 F(u) Ju ilnx — lnu) dF(x). Intergrací per partes a dosazením dle Věty 3 dostaneme vyjádření e*(lnu) = =- / -^dx==- / L(x)x-(a+1)dx. (35) 1 } F(u) Ju x F(u) Ju 1 } 1 } Další zjednodušení (35) je založeno na Karamatově větě pro pomalu se měnící funkce v nekonečnu. 11 Věta 7 (Karamata). Nechi L je pomalu se měnící funkce, která je lokálně omezená v [x0, oo) pro nějaké x > 0. Potom pro k < — 1 platí řádová rovnost ľ°° 1 / ť L(t) dt---xK+1 L(x), x^oo. Aplikací na (35) dostáváme řádovou rovnost L(u)u~aa~ľ _-, e (lntí) ~-=- = a , u —► oo. (36) F(u) Hillův odhad indexu a je převrácená hodnota odhadu e* (lnXfcn), kde Xk,n Je k-tá, největší hodnota v X1}..., Xn. &iHn = ^ElnX,,n-lnXfc,^ . (37) Odhad (37) závisí na volbě k. Doporučuje se grafické znázornění bodů (Hillův graf) {(k, 4HJ),k = 2...n}, které slouží k nalezení oblasti, ve které vycházejí podobné hodnoty odhadu počítané z různých počtů pořadových statistik. Nyní ukážeme, jak lze s pomocí (37) odhadovat pravděpodobnosti F(u) pro distribuční funkci ze sféry přitažlivosti Fréchetova rozdělení. Předpokládejme F(x) = C x~a pro x > u > 0, kde u je vysoká mez. (Pomalu se měnící funkci nahradíme pro dostatečně velké x konstantou.) Pak můžeme psát C = ua F(u), kde index a nahradíme odhadem (37) a u nahradíme pořadovou statistikou X},,n. Potom F(u) je odhadnuto podílem k/na, dostáváme odhad f(x) = k- (^-\ a" . (38) Pokud označíme Xk)n = u, k = Nu, = (s^^j ■> muzeme (38) přepsat ve tvaru f(x) = (i + x~u\ 1/7 který umožňuje srovnání s odhadem (33) založeným na maximálně věrohodných odhadech parametrů zobecněného Paretova rozdělení (při pevně zvolené mezi u). Literatura [1] P.Embrechts, C.Klůppelberg, T.Mikosh: Modelling Extremal Events. Springer, 1997. [2] A.J.McNeil, R.Frey, P.Embrechts: Quantitative Risk Management. Princeton University Press, 2005. [3] R.D.Reiss, M.Thomas: Statistical Analysis of Extréme Values. Birkháuser, 1997. 12