Teorie extrémních hodnot 1.1 Parametrické modely extrémních hodnot Potřeba parametrického modelování vychází z toho, že se zajímáme o hodnoty, kterých je dosahováno s malými pravděpodobnostmi a které se v pozorovaných datech vyskytují zřídka. Nejprve uveďme dva základní způsoby, jakými mohou být pozorované hodnoty upraveny, aby na ně mohly být užity modely teorie extrémů: 1. Bloková maxima: Data Xi, X2, ■ ■ ■ jsou rozdělena do m bloků o velikosti n, z nich jsou zjištěna bloková maxima Mni,... ,Mnm. Příkladem mohou být roční maxima průtoků vody získaná z denních měření nebo roční maximální ztráty v řadě denních změn ceny akcií. 2. Překročení limitu: Z dat jsou užita pouze pozorování překračující stanovenou vysokou mez (tato metoda je v současnosti preferována, neboť efektivněji využívá informace o extrémních hodnotách obsažené v datech). 1.1.1 Rozdělení extrémních hodnot Parametrickými modely užívanými v analýze blokových maxim jsou rozdělení extrémních hodnot. Tato rozdělení jsou limitními rozděleními pro posloupnost vhodně normovaných maxim Mn z n nezávislých stejně rozdělených veličin (při n —>• 00). Hrají roli analogickou roli normálního rozdělení v konvergenci normovaných součtů nezávislých stejně rozdělených veličin. Uveďme distribuční funkce rozdělení extrémních hodnot: Gumbelovo rozdělení: Fréchetovo rozdělení: Weíbullovo rozdělení: (2) (3) Úplné třídy těchto rozdělení dostaneme zavedením parametru polohy /i a parametru měřítka a > 0: (4) (5) 1 Poznamenejme, že parametr /i je levým koncovým bodem distribuční funkce Fréchetova rozdělení a pravým koncovým bodem distribuční funkce Weibullova rozdělení. Výše uvedené modely je možné zavedením reparametrizace 7 = ^ převést na jednotný model zobecněného rozdělení extrémních hodnot s distribuční funkcí G7(x) =exp(-(l + 7x)-1/7), 7^0, (6) G0(x) = exp(-e-x), 7 = 0, (7) kde 1 + 7X > 0. Parametry polohy a měřítka v původních třídách rozdělení byly zvoleny tak, aby platilo lim G-y(x) = Gq{x). Pro 7 > 0 dostáváme Fréchetovo rozdělení s levým koncovým bodem —1/7. Pro 7 < 0 dostáváme Weibullovo rozdělení s pravým koncovým bodem 1/|7|. V modelu zobecněného rozdělení extrémních hodnot je 7 parametrem určujícícm tvar rozdělení, tříparametrickou rodinu opět dostaneme zavedením parametru polohy /i a parametru měřítka o~ > 0: = exp|-(l +I > 7^0, G0^AX) = exP CT J 1 7 = 0, (9) kde 1 + 7 ^ > 0. 1.1.2 Fisherova-Tippettova věta Předpokládejme, že Xl5X2,... je posloupnost nezávislých stejně rozdělených náhodných veličin s distribuční funkcí F. Potom Mn = max(Xi,.. .,Xn) má distribuční funkci P(Mn 0, dn G IR tak, že lim P(Mn ~ dn oo pro nějakou nedegenerovanou distribuční funkci G, potom G je distribuční funkce zobecněného rozdělení extrémních hodnot. 2 Pokud je splněn předpoklad Fisherovy-Tippettovy věty, říkáme, že distribuční funkce F náleží do sféry přitažlivostí (maximum domain of attraction) rozdělení s distribuční funkcí G, značíme F e MDA(G). Poznámka. Při konvergenci normovaných maxim je typ limitního rozdělení (specifikovaný parametrem 7) určen jednoznačně, parametr polohy a měřítka závisí na zvolených posloupnostech normujících konstant. Tyje vždy možno zvolit tak, že limitou je standardní distribuční funkce G7(= G7io,i)- Označme F(x) = 1 — F(x). Sféru přitažlivosti rozdělení extrémních hodnot charakterizuje následující tvrzení: Věta 2. Distribuční funkce F patři do sféry přitažlivosti rozdelení extrémních hodnot s distribuční funkcí G s normujícími konstantami cn > 0, dn G IR, právě když lim nF(cnx + dn) = - lnG(x), iGi (11) n—>oo (Pro G{x) = 0 interpretujeme limitu jako +00.) Důkaz. Nechť platí lim P (Mn oo n—>oo Potom je limn^00F(cnx + dn) = 0 a tvrzení dostaneme z (12) užitím řádové rovnosti — log(l — x) ~ x, x —>• 0. Nyní předpokládejme, že platí (11), kde G{x) ý 0- Potom je P (Mn • 00. Pro momenty Fréchetova rozdělení platí POD EXj = / xj dGlia(x) = T(l - j/a), 3 < a, Jo kde [>CG V{z) = / xz-xe-xdx. Jo Sféru přitažlivosti Fréchetova rozdělení lze charakterizovat pomocí chvostů příslušných rozdělení: 3 Věta 3. F e MDA(Gi,a) F (x) = x-aL(x), a > O, kde L je kladná lebesgueovsky měřitelná funkce na (O, oo) splňující lim = 1, í > 0. (SV) X->CG L (x) Podmínka (SV) definuje pomalu se měnící funkci v nekonečnu. Podle výše uvedeného tvrzení jsou chvosty rozdělení ze sféry přitažlivosti Fréchetova rozdělení pravidelně se měnící funkce v nekonečnu. Rozdělení z MDA(Giia) jsou rozdělení s „těžkými chvosty". Lze například ukázat, že momenty EV rozdělení nezáporné náhodné veličiny náležející do MDA(Glia) jsou nekonečné pro j > a. Příklad. Paretovo rozdělení s distribuční funkcí F(x) = 1 - (—— 1 , a > 0, k > 0, x > 0, \k + x J patří do sféry přitažlivosti Fréchetova rozdělení. Vedle výše uvedené charakterizace pomocí chvostů lze toto ověřit přímo volbou normujících posloupností v (10): cn = ku1/"1 /a, dn = ku1/"1 — k. 1.1.4 Gumbelovo rozdělení Pro distribuční funkci Gumbelova rozdělení platí Gq(x) = 1 — exp (—e~x) ~ e~x, x —>• oo, jeho střední hodnota je rovna Eulerově konstantě A = 0.577216 ... Sféra přitažlivosti Gumbelova rozdělení obsahuje distribuční funkce s omezeným i neomezeným nosičem. Kladné náhodné veličiny z MDA(Go) mají konečné momenty všech řádů. Příklad. Pro exponenciální rozdělení s distribuční funkcí F(x) = 1 - exp(-/3x), (3 > 0, x > 0, lze ověřit podmínku (10) volbou 1 ln n Do sféry přitažlivosti Gumbelova rozdělení patří i další často používaná rozdělení, například rozdělení gama, normální či logaritmicko-normální. 4 1.1.5 Weibullovo rozdělení Weibullovo rozdělení má zprava omezený nosič, není proto příliš významné pro modelování extrémních jevů. Pro momenty rozdělení s distribuční funkcí (3) dostaneme vyjádření EI3= í x]áG2,a{x) = (-l)jT(l-j/a). J —oo Při označení Xf = sup{x G IR : F(x) < 1} lze podobně jako u Fréchetova rozdělení charakterizovat sféru přitažlivosti Weibullova rozdělení pomocí chvostů příslušných distribučních funkcí. Věta 4. F G MDA(G2,a) xF < oo a F(xF - x'1) = xaL(x), a < 0, kde L splňuje podmínku (SV). Příkladem rozdělení z MDA(G2,a) je rozdělení beta definované na intervalu (0,1). 1.1.6 Zobecněné Paretovo rozdělení Při analýze dat podle překročení stanovené vysoké meze hrají významnou úlohu rozdělení s distribučními funkcemi exponenciální rozdělení: W0( > 0 (13) Paretovo rozdělení: Wij0l(x) = 1 — x~a, x > 1, (14) beta rozdělení: W2,a(x) = 1 — (—^)_a, —1 < x < 0. (15) Parametr a je pro Paretovo rozdělení kladný a pro rozdělení beta záporný. Uveďme vyjádření obecných momentů těchto rozdělení. W0: V. XJ ./!. Wlta: EI^ = —, j a, a W2,a: EX' = (-iy a- j Podobně jako v případě rozdělení extrémních hodnot můžeme pro popis výše uvedených distribučních funkcí s vhodně zvolenými parametry polohy a měřítka zavést jednotný tvar v závislosti na parametru 7. Dostáváme pak distribuční funkci W7(x) = 1 - (l + 7x)-1/7, (16) 5 kde Paretovu rozdělení odpovídá volba 7 > 0 a nosič x > 0 a rozdělení beta odpovídá volba 7 < 0 a nosič 0 < x < 1/|7|. Z (16) také vyplývá spojitost uvedeného vyjádření v parametru 7 ve smyslu konvergence k distribuční funkci exponenciálního rozdělení při 7^0. Obecný tvar distribuční funkce zobecněného Paretova rozdělení pak opět dostaneme zavedením parametru polohy a měřítka: = (^^j , /i G IR, a > 0. (17) Parametr /i je vždy levým koncovým bodem distribuční funkce (17). Zaveďme nyní označení pro distribuční funkci rozdělení hodnot, které v pozorování veličin s distribuční funkcí F překračují stanovenou mez u, FM(x) = P(X < x\X >u) = ~ f(^, x > u, 1 — F(u) a pro distribuční funkci rozdělení excesů nad mezí u (výší překročení meze), FM(x) =P(X-u< x\X >u) = f(x + u)~f(u)^ 0• xp, potom lim |FM(x)-Ww(u)(x)| = 0, (20) kde a{u) > 0. 1.1.9 Konvergence rozdělení excesů Konvergence rozdělení excesů k zobecněnému Paretovu rozdělení lze užít k charakterizaci sféry přitažlivosti rozdělení extrémních hodnot. Uvažujme distribuční funkci zobecněného rozdělení extrémních hodnot (6). Věta 6. Distribuční funkce F patří do sféry přitažlivosti MDA(G7) právě když existuje kladná funkce (3{u) tak, že lim sup \FM(x) - WMu)(x)| = 0. U^XF0oo lim Wl\(n1/ax) = Gha(x), (22) n—>oo ' \imW?a{n1/ax) = G2,a{x). (23) 1.2 Analýza dat v modelech extrémních hodnot Dále se budeme zabývat vybranými postupy pro statistickou analýzu extrémních hodnot. Analyzovaná data mohou mít podobu blokových maxim nebo hodnot překračujících danou vysokou mez. 7 1.2.1 Metoda blokových maxim pro nezávislá pozorování Předpokládejme vzájemně nezávislá pozorování pocházející z rozdělení s distribuční funkcí F. Nechť F patří do sféry přitažlivosti zobecněného rozdělení extrémních hodnot (8). Z hlediska modelování extrémních jevů má význam zejména Fréchetovo rozdělení, tedy případ, kdy 7 > 0. Data mějme rozdělená do m bloků o velikosti n (může jít například o roční bloky měření prováděných denně). Z těchto bloků použijeme pro analýzu maxima Mni,..., Mnm. Pro dostatečně velký rozsah bloků n může být rozdělení blokových maxim aproximováno distribuční funkcí (8). K odhadu parametrů této distribuční funkce lze užít metodu maximální věrohodnosti. Příslušná logaritmická věrohodnostní funkce má tvar m Z(7, /i, a; Mnl,..., Mnm) = ^gw(Mni) (24) = —m ln a - (1 + l/7) f> (l + 1=1 1=1 kde g-y)fl)Cr{x) je hustota příslušná distribuční funkci (8). Logaritmická věrohodnostní funkce se maximalizuje za podmínek a > 0, 1 + 7 (Mni — fi)/ 0 pro všechna i. Poznamenejme, že v tomto případě množina přípustných hodnot pro odhadované parametry závisí na pozorováních. Nejsou tedy splněny podmínky regularity obvykle užívané pro vyvození žádoucích vlastností odhadů. V literatuře se nicméně uvádí, že pro 7 > —1/2 lze dokázat konsistenci a asymptotickou vydatnost odhadů 7, /t, a získaných maximalizací (24). Všimněme si rozporu ve volbě optimálního počtu a rozsahu bloků. Velký počet m použitých bloků znamená více dat pro metodu maximální věrohodnosti a vede tak k odhadům s menším rozptylem. Oproti tomu velký rozsah n jednotlivých bloků znamená přesnější přiblížení skutečného rozdělení blokových maxim pomocí zobecněného rozdělení extrémních hodnot a vede tak k menšímu vychýlení výsledných odhadů. 1.2.2 Analýza extrémních jevů v modelu blokových maxim Předpokládejme, že jsme přiblížili rozdělení blokových maxim v datech pomocí distribuční funkce zobecněného rozdělení extrémních hodnot, s parametry odhadnutými například výše zmíněnou metodou maximální věrohodnosti. Odhadnutý model pak můžeme dále využít například pro 1. stanovení velikosti extrémního jevu, který bude v průměru nastávat se zvolenou frekvencí, 2. stanovení průměrné frekvence výskytu extrémního jevu dané úrovně. Nechť G označuje skutečnou distribuční funkci maxim z bloků o rozsahu n. Zaveďme označení rn,k = qi-i/k{G) 8 pro (1 — l//c)-kvantil rozdělení s distribuční funkcí G, tj. P(Mn > rn,fe) = i Hodnota rn^ je tedy definována jako úroveň, která je v průměru překročena maximem v jednom z k bloků. Nazýváme ji úroveň návratu (return level). Pokud přiblížíme distribuční funkci G distribuční funkcí (8) s odhadnutými parametry 7, fi, a, odvodíme vyjádření odhadu úrovně návratu ve tvaru rn,fc = £+?((-ln(l-l/fc))^-l). 7 Podobně můžeme pro dané u definovat pomocí distribuční funkce G hodnotu k 1 1 n'u G(u) 1 - G(u)' tj- P(Mn >u) = —. Lze tedy říci, že v kUjU blocích o rozsahu n očekáváme výskyt jednoho bloku, v němž dojde k překročení úrovně u. Číslo kri)U nazýváme doba návratu (return period) a pro jeho odhad použijeme vztah k -- 1 1.2.3 Metody založené na překročení meze Uvažujme distribuční funkci zobecněného Paretova rozdělení (17) s nulovým parametrem polohy: W^(x) = 1 - (l + 1x/a)-l/\ 7 ŕ 0 (25) Woí(ľ(x) = 1 — exp(—x/a), kde a > 0. Rozdělení je definováno pro x > 0 v případě 7 > 0 a pro 0 < x < —o~/^f pro 7 < 0. Zavedeme označení e(u) = E(X - u\X > u) (26) pro střední hodnotu velikosti překročení meze u za podmínky, že k překročení meze dojde. Jde o střední hodnotu rozdělení s distribuční funkcí (18). Z (17) a (18) lze snadno odvodit, že pro náhodnou veličinu se zobecněným Paretovým rozdělením (25) mají excesy nad danou mezí u opět rozdělení typu (18), se stejným parametrem 7 a parametrem měřítka závislým na u: F(u) (x) = WlMu) (x), a(u) = a + 7 u, (27) 9 kde O < x < oo v případě 7>0a0 0, směřování k horizontálnímu grafu na případ s 7 = 0, klesající trend pak na 7 < 0. 1.2.4 Modelování chvostů rozdělení Mějme Xi,..., Xn pozorování nezávislých stejně rozdělených náhodných veličin. Označme Nu počet pozorování překračujících zvolenou mez u. Z hodnot Xi,... ,X^u překračujících mez u získáme velikosti excesů Yj = Xj — u. Pro účel proložení rozdělení (25) pozorovanými excesy lze užít metodu maximální věrohodnosti. Logaritmická věrohodnostní funkce Z(7,a;Y1,...,YNu) = -Nu\na-(l + l/7) Ěln í1 + ^) ^ j=i se maximalizuje za podmínek a > 0, 1 + ^Yj/a > 0 pro všechna j. Pokud pro danou distribuční funkci F budeme aproximovat rozdělení excesů nad mezí u zobecněným Paretovým rozdělením (25), můžeme psát pro x > u / \ —1/7 F {x) =F{u)F(u\x-u) = F{u) ( 1 + 7^M • (31) 10 Inverzí odtud dostaneme vyjádření kvantilu (označovaného také jako hodnota v riziku VaRa) pro a > F(u): ^-"^{(mT-1)- (32) Z (31) a (32) odvodíme pro x > u odhad Fw = if(1+^—) (33> a pro a > 1 — Nu/n odhad &(F) = u + f (fe)"7"1)- (34) V (33) a (34) nahrazujeme parametry zobecněného Paretova rozdělení jejich odhady získanými například maximalizací (30). Pravděpodobnost F(u) odhadujeme poměrem Nu/n. Předpokládáme, že počet pozorování přesahujících mez u je dostatečný pro spolehlivý odhad F(u). Oproti tomu při odhadu F(x) pro vysoká x využíváme extrapolace založené na zobecněném Paretově rozdělení. 1.2.5 Hillova metoda Popíšeme přístup vhodný pro odhadování chvostů rozdělení náležejících do sféry přitažlivosti Fréchetova rozdělení (2). Jde o rozdělení charakteristická „těžkými chvosty" (pomalou konvergencí F(x) k nule při x —>• oo). Sféru přitažlivosti Fréchetova rozdělení charakterizuje Věta 3. Parametr a se nazývá index chvostu rozdělení s distribuční funkcí F G MDA(Giia). Hillův odhad je odhadem indexu a na základě stejně rozdělených pozorování Xi,... ,Xn. Naznačíme jedno z jeho možných odvození. Označme e*(lnw) = E(lnX - lnw| lnX > lnu) 1 F(u) (Inx — lnu) dF(x). Intergrací per partes a dosazením dle Věty 3 dostaneme vyjádření e*(lnu) = =— / -^dx = =— / L(x)x-(a+1)dx. (35) F(u) Ju x F(u) Ju Další zjednodušení (35) je založeno na Karamatově větě pro pomalu se měnící funkce v nekonečnu. 11 Věta 7 (Karamata). Nechi L je pomalu se měnící funkce, která je lokálně omezená v [xq, oo) pro nějaké x > 0. Potom pro k < — 1 platí řááová rovnost l ť L(t) dt ~--xK+1 L(x), x ->■ oo. k + 1 Aplikací na (35) dostáváme řádovou rovnost e {lnu) ~-=-= a , u —>• oo. (ób) F{u) Hillův odhad indexu a je převrácená hodnota odhadu e* (lnXfcn), kde Xk,n je fc-tá nej větší hodnota v Xl5..., Xn. k - -1 au = I i ^lnXj-n - lnXfc,n J . (37) Odhad (37) závisí na volbě k. Doporučuje se grafické znázornění bodů (Hillův graf) {(k, o£)),fc = 2...n}, které slouží k nalezení oblasti, ve které vycházejí podobné hodnoty odhadu počítané z různých počtů pořadových statistik. Nyní ukážeme, jak lze s pomocí (37) odhadovat pravděpodobnosti F(u) pro distribuční funkci ze sféry přitažlivosti Fréchetova rozdělení. Předpokládejme F(x) = C x~a pro x > u > 0, kde u je vysoká mez. (Pomalu se měnící funkci nahradíme pro dostatečně velké x konstantou.) Pak můžeme psát C = ua F(u), kde index a nahradíme odhadem (37) a u nahradíme pořadovou statistikou XkjU. Potom F(u) je odhadnuto podílem k/na. dostáváme odhad f(x) = k- (-?-) a" . (38) Pokud označíme Xk,n = u, k = Nu, = (ci^^j , můžeme (38) přepsat ve tvaru f(x) = U± (i + 1/7 který umožňuje srovnání s odhadem (33) založeným na maximálně věrohodných odhadech parametrů zobecněného Paretova rozdělení (při pevně zvolené mezi u). Literatura [1] P.Embrechts, C.Klůppelberg, T.Mikosh: Modelling Extremal Events. Springer, 1997. [2] A.J.McNeil, R.Frey, P.Embrechts: Quantitative Risk Management. Princeton University Press, 2005. [3] R.D.Reiss, M.Thomas: Statistical Analysis of Extréme Values. Birkháuser, 1997. 12