Stochastická analýza Doc. RNDr. Martin Kolář, Ph.D. 1 Tento učební text vznikl za přispění Evropského sociálního fondu a státního rozpočtu ČR prostřednictvím Operačního programu Vzdělávání pro konkurenceschopnost v rámci projektu Univerzitní výuka matematiky v měnícím se světě (CZ.1.07/2.2.00/15.0203). 2 Obsah 1 Spojité náhodné veličiny a stochastické procesy 6 1.1 Stochastické procesy . . . . . . . . . . . . . . . . . . . . . . . 6 1.2 Spojité náhodné veličiny . . . . . . . . . . . . . . . . . . . . . 7 1.2.1 Nezávislost a její charakterizace . . . . . . . . . . . . . 8 1.2.2 Příklady spojitých rozdělení . . . . . . . . . . . . . . . 10 1.3 Příklady . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 2 Charakteristická funkce a její vlastnosti 14 2.1 Charakteristická funkce . . . . . . . . . . . . . . . . . . . . . . 14 2.2 Základní vlastnosti Fourierovy transformace . . . . . . . . . . 16 2.3 Věta o inverzní transformaci . . . . . . . . . . . . . . . . . . . 22 2.3.1 Aproximace identity . . . . . . . . . . . . . . . . . . . 22 2.3.2 Důkaz věty o inverzní transformaci . . . . . . . . . . . 23 2.4 Příklady . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 3 Základy L2 -teorie 27 3.1 Prostor L2 ( a, b ) . . . . . . . . . . . . . . . . . . . . . . . . . 27 3.2 Úplnost a Parsevalova rovnost . . . . . . . . . . . . . . . . . . 30 3.2.1 Úplnost a uzavřenost . . . . . . . . . . . . . . . . . . . 31 3.3 Borel-Cantelliho lemma . . . . . . . . . . . . . . . . . . . . . 31 3.4 Příklady . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 4 Wienerův proces 35 4.1 Definice Wienerova procesu . . . . . . . . . . . . . . . . . . . 35 4.2 Haarovy a Schauderovy funkce . . . . . . . . . . . . . . . . . . 36 3 4.3 Ciesielskiho konstrukce . . . . . . . . . . . . . . . . . . . . . . 38 4.4 Příklady . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 5 Lineární a kvadratická variace 45 5.1 Lineární variace . . . . . . . . . . . . . . . . . . . . . . . . . . 45 5.2 Kvadratická variace . . . . . . . . . . . . . . . . . . . . . . . . 47 5.3 Příklady . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 6 Itôův integrál a Itôovo lemma 51 6.1 Itôův integrál . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 6.2 Filtrace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 6.3 Itôovo lemma . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 6.4 Příklady . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 7 Martingaly a Itôovy proces 64 7.1 Definice martingalu . . . . . . . . . . . . . . . . . . . . . . . 64 7.2 Itôův proces a stopping time . . . . . . . . . . . . . . . . . . . 66 7.3 Příklady . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 8 Cameron-Martinova věta 69 8.1 Radon-Nikodýmova derivace . . . . . . . . . . . . . . . . . . . 69 8.2 Cameron-Martinova věta . . . . . . . . . . . . . . . . . . . . . 70 8.3 Girsanovova věta . . . . . . . . . . . . . . . . . . . . . . . . . 72 9 Odvození Black-Scholesovy rovnice 74 9.1 Black-Scholesova rovnice . . . . . . . . . . . . . . . . . . . . . 75 10 Black-Scholesův model 77 10.1 Předpoklady Black-Scholesova modelu . . . . . . . . . . . . . 77 10.2 Rovnovážná pravděpodobnostní míra . . . . . . . . . . . . . . 78 10.3 Odvození Black-Scholesova vzorce pro evropskou call opci . . . 79 11 Rovnice vedení tepla a Wienerův proces 82 11.1 Řešení rovnice vedení tepla na přímce . . . . . . . . . . . . . . 82 11.2 Souvislost řešení rovnice vedení tepla a Wienerova procesu . . 83 4 11.3 Feynman-Kacova formule . . . . . . . . . . . . . . . . . . . . . 84 12 Pravděpodobnostní rozdělení se silnými chvosty 87 12.1 Charakterizace chvostů distribucí . . . . . . . . . . . . . . . . 87 12.2 Charakterizace pomocí funkce přežití . . . . . . . . . . . . . . 88 12.3 Charakterizace pomocí funkce rizika . . . . . . . . . . . . . . . 89 12.4 Stabilní distribuce . . . . . . . . . . . . . . . . . . . . . . . . . 90 13 Lévyho procesy 92 13.1 Limitní rozdělení . . . . . . . . . . . . . . . . . . . . . . . . . 92 13.2 Lévyho procesy . . . . . . . . . . . . . . . . . . . . . . . . . . 93 13.3 Příklady . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 14 Bariérové opce 97 14.1 Binární bariérové opce . . . . . . . . . . . . . . . . . . . . . . 97 5 Kapitola 1 Spojité náhodné veličiny a stochastické procesy 1.1 Stochastické procesy Definice 1.1.1. Stochastický proces X = {X (t) , t ∈ T} je soubor náhodných veličin na pravděpodobnostním prostoru (Ω, A, P). Tedy pro každé t z indexové množiny T je X (t) náhodná veličina. Obvykle t označuje čas. Připomeňme, že náhodná veličina je funkce Z : Ω → R. Každá realizace náhodného procesu X se nazývá trajektorie. X (t) popisuje stav procesu v čase t. Dělení stochastických procesů: • je-li T konečná nebo spočetná množina, říkáme, že X (t) je stochastický proces v diskrétním čase • je-li T interval, říkáme, že X (t) je stochastický proces ve spojitém čase Další rozdělení podle hodnot, které nabývají veličiny X (t): • stochastický proces s diskrétními hodnotami • stochastický proces se spojitými hodnotami Celkem tedy máme následující čtyři typy stochastických procesů: 6 čas hodnoty příklady diskrétní diskrétní standardní náhodná procházka diskrétní spojité zobecněná náhodná procházka spojitý diskrétní Poissonův proces spojitý spojité Wienerův proces, bílý šum Uveďme si příklad Poissonova procesu. Nechť X (t) je počet volání na telefonní ústřednu v časovém intervalu [0, t]. Předpokládáme, že P (X (t + h) − X (t) = 1) ≈ λh t.j. pravděpodobnost, že v intervalu (t, t + h) přišlo jedno volání je přímo úměrná h, a dále P (X (t + h) − X (t) > 1) ≈ 0. Koeficient úměrnosti λ popisuje intenzitu procesu. Stochastická analýza se zabývá integrálním počtem pro funkce, jejichž hodnoty jsou závislé na Wienerově procesu. Například, nechť f (X, t) je cena opce v čase t při ceně podkladové akcie X, pro kterou platí dX X = a dt + b dW kde W je standardní Wienerův proces (přesným smyslem této rovnice se budeme zabývat v dalších kapitolách). Hodnota f tedy zprostředkovaně závisí na hodnotě Wienerova procesu. 1.2 Spojité náhodné veličiny Nechť (Ω, A, P) je pravděpodobnostní prostor modelující uvažovaný systém. 7 Definice 1.2.1. X : Ω → R je spojitá náhodná veličina, jestliže její distribuční funkce F (x) = P (X ≤ x) se dá napsat jako F (x) = x −∞ f (u) du pro nějakou integrovatelnou funkci f : R → [0, ∞). f (u) se nazývá (pravděpodobnostní) hustota náhodné veličiny X. Máme P (X ∈ [x, x + ∆x]) . = f (x) ∆x a P (X ∈ [a, b]) = b a f (u) du. Pro každé jednotlivé x ∈ R tedy platí P (X = x) = 0. Poznámka. Mnoho důkazů pro spojité náhodné veličiny je zcela analogických jako v diskrétním případě. Pravděpodobnostní funkce f (x) se nahradí hustotou f (x) dx, a suma se nahradí integrálem . 1.2.1 Nezávislost a její charakterizace Definice 1.2.2. Náhodné veličiny X a Y jsou nezávislé, jestliže pro každé x, y ∈ R jsou jevy {X ≤ x} a {Y ≤ y} nezávislé. Základní charakteristikou náhodné veličiny je její očekávání. Definice 1.2.3. Očekávání spojité náhodné veličiny X s hustotou f je dáno vztahem E (X) = ∞ −∞ f (x) xdx pokud integrál existuje. Příklad 1.2.4. Nechť pro hustotu náhodné veličiny X platí f (x) = 1 2π pro x ∈ [0, 2π] a f(x) = 0 jinak. Její očekávání je rovno E (X) = ∞ −∞ f (x) xdx = 2π 0 1 2π xdx = 1 2π x2 2 2π 0 = π. 8 Při praktickém výpočtu očekávání funkce náhodné veličiny je důležitá následující věta. Věta 1.2.5. Nechť X je spojitá náhodná veličina s hustotou f (x) a g(x) je spojitá funkce. Pak pro náhodnou veličinu g (X) platí E (g (X)) = ∞ −∞ g (x) f (x) dx. Definice 1.2.6. Sdružená distribuční funkce náhodných veličin X a Y je funkce R2 → [0, 1] taková, že F (x, y) = P (X ≤ x ∧ Y ≤ y) . Definice 1.2.7. Náhodné veličiny X a Y mají sdruženou pravděpodobnostní hustotu f (x, y) : R2 → [0, ∞), jestliže F (x, y) = y −∞ x −∞ f (u, v) dudv pro všechna x, y ∈ R. Analogicky jako u obyčejné hustoty máme P {(X, Y ) ∈ (x, x + ∆x) × (y, y + ∆y)} ≈ f (x, y) ∆x∆y. Definice 1.2.8. Marginální distribuční funkce X a Y jsou FX (x) = P (X ≤ x) = F (x, ∞) , kde F (x, ∞) = limy→∞ F (x, y) a FY (y) = P (Y ≤ y) = F (∞, y) , kde F (∞, y) = limx→∞ F (x, y). 9 Pro marginální hustoty platí: fX (x) = ∞ −∞ f (x, y) dy, fY (y) = ∞ −∞ f (x, y) dx. Následující věta dává ověřitelnou podmínku pro nezávislost náhodných veličin. Věta 1.2.9. Náhodné veličiny X, Y jsou nezávislé právě tehdy, když pro každé x, y ∈ R platí f (x, y) = fX (x) fY (y) . 1.2.2 Příklady spojitých rozdělení Uniformní (stejnoměrné) rozdělení: Náhodná veličina X je stejnoměrná na intervalu [a, b], jestliže f (x) = 1 b − a pro x ∈ [a, b] a f(x) = 0 jinak. Normální rozdělení: Náhodná veličina X má normální rozdělení, jestliže f (x) = 1 √ 2πσ2 e− (x−µ)2 2σ2 pro x ∈ (−∞, ∞), kde µ je střední hodnota a σ2 je rozptyl. Normalizované normální rozdělení N (0, 1) má hustotu f (x) = 1 √ 2π e−x2 2 . Hodnota normalizační konstanty plyne z hodnoty tzv. Laplaceova integrálu: Lemma 1.2.10. Platí ∞ −∞ 1 √ 2π e−x2 2 dx = 1. 10 Důkaz: Označme I = ∞ −∞ 1 √ 2π e−x2 2 dx. Uvažujme druhou mocninu integrálu I2 = ∞ −∞ 1 √ 2π e−x2 2 dx ∞ −∞ 1 √ 2π e−y2 2 dy = 1 2π ∞ −∞ ∞ −∞ e−x2+y2 2 dxdy. Transformujeme integrál do polárních souřadnic, I2 = 1 2π 2π 0 ∞ 0 e−r2 2 rdrdθ = 1 2π 2π 0 1dθ = 1 2π 2π = 1, protože substitucí t = −r2 2 dostaneme ∞ 0 re−r2 2 dr = −∞ 0 −et dt = 0 −∞ et dt = et 0 −∞ = 1. Odtud plyne I = 1. 2-rozměrné (standardizované) normální rozdělení: Dvojice náhodných veličin X, Y má toto rozdělení pokud pro jeho sdruženou hustotu platí f (x, y) = 1 2π 1 − ρ2 exp − 1 2 (1 − ρ2) x2 − 2ρxy + y2 , kde ρ je korelace X a Y , splňující −1 ≤ ρ ≤ 1. Přímým výpočtem dostaneme fX (x) = 1 √ 2π e−x2 2 (1.1) a fY (y) = 1 √ 2π e−y2 2 . Pro ρ = 0 tedy platí f (x, y) = 1 2π e−1 2 (x2+y2 ) = 1 √ 2π e−x2 2 1 √ 2π e−y2 2 = fX (x) fY (y) . Odtud plyne důležitá charakteristika nezávislosti normálně rozdělených náhodných veličin. 11 Věta 1.2.11. Normálně rozdělené náhodné veličiny X a Y jsou nezávislé právě tehdy když jsou nekorelované, t.j. ρ = 0. Toto tvrzení je klíčové pro praktické ověřování nezávislosti náhodných veličin s normálním rozdělením. Obecně je nezávislost daleko silnější vlastnost než nekorelovanost. 12 1.3 Příklady Příklad 1.3.1. Vypočtěte střední hodnotu a rozptyl a) stejnoměrného rozdělení na intervalu [a, b]. b) exponenciálního rozdělení c) Paretova rozdělení d) gamma rozdělení e) beta rozdělení Příklad 1.3.2. Dokažte Větu 1.2.9. Příklad 1.3.3. Najděte příklad dvou spojitých náhodných veličin, které jsou nekorelované, ale nejsou nezávislé Příklad 1.3.4. Vypočtěte třetí a čtvrtý obecný moment stejnoměrného rozdělení na intervalu [a, b]. Příklad 1.3.5. Dokažte vztah (1.1). 13 Kapitola 2 Charakteristická funkce a její vlastnosti V této kapitole se budeme věnovat charakteristickým funkcím, jednomu ze základních nástrojů pro počítání se spojitými náhodnými veličinami. Tento pojem je z hlediska výpočtů identický s Fourierovou transformací pravděpodobnostní hustoty, základní operací používanou v matematické analýze. Budeme se také okrajově věnovat moment generující funkci, která má použití jak pro diskrétní tak spojitá rozdělení. 2.1 Charakteristická funkce Připomenutí: Generující funkce pro diskrétní náhodnou veličinu s hodnotami v N, X : Ω → N je definována jako GX (s) = ∞ n=0 f (n) sn = E sX , kde f (n) = P (X = n) je pravděpodobnostní funkce X. Obecněji můžeme definovat (substitucí s = et ) moment generující funkci, i pro spojité náhodné veličiny. Definice 2.1.1. Moment generující funkce náhodné veličiny X je definována 14 vztahem M (t) = E etX pro t ≥ 0. Je-li X spojitá náhodná veličina s hustotou f, pak M (t) = ∞ −∞ etx f (x) dx. Až na obor integrace a znaménko v exponentu je to přesně Laplaceova transformace funkce f (u Laplaceovy transformace se integruje jen přes kladnou poloosu). Moment generující funkce dovoluje snadno počítat jednotlivé momenty náhodných veličin. Pro střední hodnotu máme E (X) = M (0) . Obecně platí následující tvrzení. Lemma 2.1.2. Pro každé k ∈ N je E Xk = M(k) (0) . Důkaz: Derivujeme integrál podle parametru, M (t) = ∞ −∞ xetx f (x) dx, tedy M (0) = ∞ −∞ xf (x) dx = E (X) . Analogicky k-násobným derivováním dostaneme M(k) (t) = ∞ −∞ xk etx f (x) dx. Tedy 15 M(k) (0) = E Xk . Charakteristická funkce se formálně liší od moment generující funkce jen imaginární jednotkou v exponentu. Výhodou je že na rozdíl od moment generující funkce existuje pro libovolnou pravděpodobnostní hustotu. Definice 2.1.3. Charakteristická funkce náhodné veličiny X je funkce φ : R → C definovaná vztahem φ (t) = E eitX . Je-li f hustota X, pak máme φ (t) = ∞ −∞ f (x) eitx dx. Až na znaménko je to Fourierova transformace hustoty. Využití charakteristické funkce se tedy redukuje na počítání s Fourierovou transformací. 2.2 Základní vlastnosti Fourierovy transfor- mace V této podkapitole budeme uvažovat funkce které jsou současně spojité a integrovatelné v absolutní hodnotě. Prostor takových funkcí budeme označovat L1 ∩ C. Definice 2.2.1. Fourierova transformace funkce f je funkce f (ξ) = ∞ −∞ f (x) e−iξx dx. Tedy je-li f hustota náhodné veličiny X, pak vztah mezi charakteristickou funkcí X a Fourierovou transformací funkce f je φ (−t) = f (t) . 16 Z linearity integrálu plyne, že Fourierova transformace je lineární operace. Pro každé dvě funkce f, g a konstanty a, b platí (af + bg) = a ˆf + bˆg. Lemma 2.2.2. (O změně měřítka) Pro f ∈ L1 ∩ C a R > 0 označme fR(x) = f(Rx) (tedy fR je původní funkce vyjádřená v jiné volbě jednotek). Pak fR(ξ) = 1 R ˆf( ξ R ). Důkaz: Z definice fR(ξ) = ∞ −∞ fR(x)e−iξx dx = ∞ −∞ f(Rx)e−iξx dx. Substitucí y = Rx dostaneme ∞ −∞ f(y)e−i ξ R y 1 R dy = 1 R ∞ −∞ f(y)e−i ξ R y dy = 1 R ˆf( ξ R ). Lemma 2.2.3. (O Fourierově transformaci derivace). Nechť f ∈ L1 ∩ C, f ∈ L1 ∩ C a limx→±∞ f(x) = 0. Pak (f )(ξ) = iξ ˆf(ξ). Derivování se tedy Fourierovou transformací převádí na obyčejné násobení faktorem iξ. Důkaz: Integrováním per partes dostaneme (f )(ξ) = ∞ −∞ f (x)e−iξx dx = [e−iξx f(x)]∞ −∞−(−iξ) ∞ −∞ f(x)e−iξx dx = iξ ˆf(ξ). Obecně, je-li f, f , . . . , f(k) ∈ L1 ∩ C a limx→±∞ fj (x) = 0 pro j = 0, 1, . . . , k − 1, pak k-násobným integrováním per partes dostaneme (f(k))(ξ) = (iξ)k ˆf(ξ). 17 Lemma 2.2.4. (O derivaci Fourierovy transformace) Nechť f ∈ L1 ∩ C a g(x) = xf(x) ∈ L1 ∩ C. Pak ˆf(ξ) je diferencovatelná a platí d ˆf dξ = −iˆg(ξ). Důkaz: Derivováním vztahu ˆf(ξ) = ∞ −∞ f(x)e−iξx dx podle parametru ξ dostaneme d ˆf dξ (ξ) = ∞ −∞ f(x)(−ix)e−iξx dx = −i ∞ −∞ [f(x)x] e−iξx dx = −iˆg(ξ). Pro f, g ∈ L1 je jejich konvoluce definována vztahem f ∗ g(x) = ∞ −∞ f(x − y)g(y)dy. Substitucí y = x − y dostaneme alternativní vyjádření f ∗ g(x) = ∞ −∞ f(y)g(x − y)dy = g ∗ f(x). Konvoluce je tedy komutativní operace. Lemma 2.2.5. (O Fourierově transformaci konvoluce) Nechť f, g ∈ L1 (R). Pak f ∗ g(ξ) = ˆf(ξ)ˆg(ξ). Důkaz: S použitím Fubiniho věty dostaneme f ∗ g(ξ) = ∞ −∞ ( ∞ −∞ f(x − y)g(y)dy)e−iξx dx = = R2 e−iξx f(x − y)g(y)dydx = R2 e−iξ(x−y) f(x − y)e−iξy g(y)dydx = 18 = ∞ −∞ ∞ −∞ e−iξ(x−y) f(x − y)dx e−iξy g(y)dy = ˆf(ξ) ∞ −∞ e−iξy g(y)dy = ˆf(ξ)ˆg(ξ). Lemma 2.2.6. (O transformaci posunutí a o posunutí transformace) Nechť f ∈ L1 ∩ C. Pro a > 0 označme fa(x) = f(x − a). Pak ˆfa(ξ) = ˆf(ξ)e−iaξ . Naopak, feiax(ξ) = ˆf(ξ − a). Důkaz: Na jedné straně substitucí y = x − a dostaneme ˆfa(ξ) = ∞ −∞ f(x−a)e−iξx dx = ∞ −∞ f(y)e−iξ(y+a) dy = e−iaξ ∞ −∞ f(y)e−iξy dy = = e−iaξ ˆf(ξ). Naopak, feiax(ξ) = ∞ −∞ f(x)eiax e−iξx dx = ∞ −∞ f(x)e−i(ξ−a)x dx = ˆf(ξ − a). Důsledek 2.2.7. Nechť Fourierova transformace funkce f(x) je F(ξ). Pak Fourierova transformace funkce f(x) sin ωx je rovna i 2 [F(ξ + ω) − F(ξ − ω)]. Tento vztah s obvykle nazývá modulační identita (f je původní signál, ω je nosná frakvence, součin f(x)eiωx je namodulovaný signál Důkaz: Víme, že sin ωx = eiωx − e−iωx 2i a f(x)eiωx(ξ) = ˆF(ξ − ω). 19 Tedy f(x) sin ωx(ξ) = 1 2i [F(ξ − ω) − F(ξ + ω)] = i 2 [F(ξ + ω) − F(ξ − ω)]. Lemma 2.2.8. (Fourierova transformace Gaussovy funkce) Je-li f(x) = 1 √ 2π e −x2 2 , pak ˆf(ξ) = e −ξ2 2 . Důkaz: Označme opět F(ξ) = ˆf(ξ). Máme f (x) = − 1 √ 2π xe −x2 2 = −xf(x). Na jedné straně je (−xf(x)) = f (ξ) = iξF(ξ), podle lemmatu o transformaci derivace, na druhé straně, z lemmatu o derivaci transformace, je (−ixf)(ξ) = F (ξ). Celkem F splňuje rovnici F (ξ) = −ξF(ξ). Separací proměnných dostaneme řešení F(ξ) = Ce −ξ2 2 . Konstanta C je rovna hodnotě ˆf v bodě nula, tedy Laplaceovu integrálu ˆf(0) = 1 √ 2π ∞ −∞ e −x2 2 dx = 1. 20 Příklad 2.2.9. Označme jako H(x) Heavisideovu funkci, tedy H(x) = 1 pro x ≥ 0 a H(x) = 0 pro x < 0. Je-li f(x) = e−ax H(x) pro nějaké a > 0, pak ˆf(ξ) = 1 a + iξ . Opravdu, ˆf(ξ) = ∞ 0 e−ax e−iξx dx = ∞ 0 e−(a+iξ)x dx = = − 1 a + iξ [e−(a+iξ)x ]∞ 0 = 1 a + iξ . Dále uvažujme funkci f(x) = e−a|x| . Pomocí Heavisideovy funkce ji můžeme napsat jako f(x) = H(x)e−ax + H(−x)eax . Její Fourierova transformace je rovna ˆf(ξ) = 1 a + iξ + 1 a − iξ = 2a a2 + x2 . Věta 2.2.10. (Základní identita pro Fourierovu transformaci) Nechť f, g ∈ L1 ∩ C. Pak platí ∞ −∞ fˆg = ∞ −∞ ˆfg. Důkaz: Z Fubiniho věty dostaneme ∞ −∞ f(x)ˆg(x)dx = ∞ −∞ f(x) ∞ −∞ g(y)e−ixy dydx = R2 f(x)g(y)e−ixy dydx = ∞ −∞ g(y) ∞ −∞ f(x)e−ixy dxdy = ∞ −∞ g(y) ˆf(y)dy. 21 Důležitá pro aplikace je následující věta o inverzní transformaci. Plyne z ní, že charakteriskická funkce jednoznačně určuje rozdělení náhodné veličiny. Věta 2.2.11. ( O inverzní transformaci) Nechť f ∈ L1 ∩ C, f je stejnoměrně spojitá a ˆf ∈ L1 ∩ C. Pak f (x) lze vypočítat z ˆf (ξ) vztahem f(x) = 1 2π ∞ −∞ ˆf(ξ)eiξx dξ. 2.3 Věta o inverzní transformaci K důkazu Věty o inverzní transformaci budeme potřebovat aproximaci iden- tity. 2.3.1 Aproximace identity Definice 2.3.1. Nechť φ ∈ L1 (R), φ(x) ≥ 0 a ∞ −∞ φ(x)dx = 1. Pak systém funkcí φε(x) = 1 ε φ( x ε ) pro > 1 se nazývá aproximací identity příslušnou funkci φ. Z definice ihned plyne, že pro všechna ε platí ∞ −∞ φε(x)dx = 1. V našem případě vezmeme za φ Gaussovu funkci φ(x) = 1 √ 2π e−x2 2 , tedy φε(x) = 1 √ 2πε e− x2 2ε2 . Následující lemma odůvodňuje termín aproximace identity. 22 Lemma 2.3.2. Nechť φε je aproximace identity a f je spojitá omezená funkce na R. Pak f ∗ φε(x) konverguje (stejnoměrně na kompaktních intervalech ) k f(x) pro ε → 0. Důkaz: Nechť |f(x)| ≤ M pro x ∈ R. Máme |f∗φε(x)−f(x)| = | ∞ −∞ [f(x−y)−f(x)]φε(y)dy| = | ∞ −∞ [f(x−εy )−f(x)]φ(y )dy , kde jsme použili substituci y = εy . Nechť δ > 0 je dáno. Vezměme R tak velké, že y /∈ −R,R φ(y)dy < δ, a dále ε > 0 tak, aby |f(x − εy) − f(x)| < δ pro y ∈ −R, R . Máme tedy | ∞ −∞ [f(x − εy ) − f(x)]φ(y )dy ≤ | −R,R [f(x − εy ) − f(x)]|φ(y )dy + +| y /∈ −R,R [f(x − εy ) − f(x)]φ(x)dy| ≤ δ + (2M + 1)δ = 2Mδ. Tedy f ∗ φε(x) → f(x) pro ε → 0. Z nezávislosti odhadu na x plyne stejnoměrná konvergence na kompaktních intervalech. 2.3.2 Důkaz věty o inverzní transformaci V této kapitole uvedeme důkaz věty o inverzní transformaci, založený na aproximaci identity zavedené v předchozí části. Věta 2.3.3. Nechť f ∈ L1 ∩ C, f je stejnoměrne spojitá a ˆf ∈ L1 ∩ C. Pak f(x) = 1 2π ∞ −∞ ˆf(ξ)eiξx dξ. Důkaz: Nechť x ∈ R je libovolný pevně zvolený bod a ε > 0 je dáno. Označme φ(ξ) = 1 √ 2π eiξx−ε2 ξ2 2 . 23 Víme, že ˆφ(y) = 1 ε e− (y−x)2 2ε2 , tedy ˆφ(y) = 1 ε √ 2πg( x − y ε ), kde g(u) = 1 √ 2π e−u2 2 . Budeme uvažovat aproximaci identity příslušnou této funkci a použijeme základní identitu pro Fourierovu transformaci na funkce f a φ. Na jedné straně je ∞ −∞ ˆfφ = 1 √ 2π ∞ −∞ e−ε2ξ2 2 eixξ ˆf(ξ)dξ. Na druhé straně ∞ −∞ f ˆφ = √ 2π ∞ −∞ f(y)gε(x − y)dy = √ 2πf ∗ gε(x). Víme, že f ∗ gε(x) → f(x) stejnoměrně na kompaktech. Ale pro x pevné je ∞ −∞ e−ε2ξ2 2 eixξ ˆf(ξ)dξ → ∞ −∞ eixξ ˆf(ξ) pro ε → 0, neboť první člen pod integrálem konverguje k jedné. Celkem tedy pro ε → 0 dostaneme f(x) = 1 2π ∞ −∞ ˆf(ξ)eiξx dξ. Definice 2.3.4. Inverzní Fourierova transformace je definována vztahem ˇf(ξ) = 1 2π ∞ −∞ f(x)eiξx dξ. Podle předchozí věty je inverzní Fourierova transformace opravdu inverzní operací k Fourierově transformaci, platí tedy ˇ ( ˆ )f = f. 24 Pro aplikace v teorii pravděpodobnosti je klíčový následující důsledek. Důsledek 2.3.5. Charakteristická funkce jednoznačně určuje hustotu náhodné veličiny. 25 2.4 Příklady Příklad 2.4.1. Vypočtěte generující funkci geometrického rozdělení Příklad 2.4.2. Vypočtěte Laplaceovu transformaci funkce sin x, t.j. ∞ 0 e−sx sin xdx Příklad 2.4.3. Najděte charakteristickou funkci stejnoměrného rozdělení na intervalu [−1, 1]. Příklad 2.4.4. Dokažte, že obecný moment náhodné veličiny můžeme vyjádřit pomocí charakteristické funkce, vztahem E(Xk ) = (−i)k φ (k) X (0). Příklad 2.4.5. Vypočtěte charakteristickou funkci exponenciálního rozdělení s hustotou f(x) = λe−λx . 26 Kapitola 3 Základy L2-teorie 3.1 Prostor L2 ( a, b ) V této části budeme uvažovat funkce na obecném intervalu a, b s hodnotami v C a prostor L2 ( a, b ) obsahující funkce, pro které b a |f(x)|2 dx < ∞. L2 ( a, b ) je Hilbertův prostor (nekonečněrozměrná analogie Euklidovského prostoru) se skalárním součinem (f, g) = b a f(x)g(x)dx. Skalární součin indukuje, stejně jako v Euklidovském prostoru, na L2 ( a, b ) normu f = b a |f(x)|2 dx 1 2 a také metriku. Vzdálenost dvou funkcí je číslo ρ(f, g) = f − g = b a |f(x) − g(x)|2 dx 1 2 . Definice 3.1.1. Systém funkcí {φk}∞ k=0 se nazývá ortogonální systém, jestliže (φn, φm) = 0 27 pro každé n = m. Nazývá se ortonormální systém, jestliže navíc platí (φn, φn) = 1 pro všechna n ∈ N. Definice 3.1.2. Nechť {φk}∞ k=0 je ortonormální systém. Čísla ck = b a f(x)¯φk(x)dx se nazývají Fourierovy koeficienty funkce f vzhledem k systému {φk}∞ k=0. Formální funkční řada ∞ k=0 ckφk se nazývá Fourierova řada. Pomocí Fourierových koeficientů definujeme funkce fN = N k=0 ckφk. Zajímá nás, za jakých podmínek konverguje fN pro N → ∞ k funkci f. Konvergencí v tomto případě rozumíme konvergenci v normě prostoru L2 . Následující lemma ukazuje, že fN je nejlepší aproximací f mezi všemi lineárními kombinacemi funkcí φ1, φ2, . . . φN . Lemma 3.1.3. Nechť {φk}∞ k=0 je ortonormální systém a f ∈ L2 . Pak pro libovolná komplexní čísla d1, . . . , dN platí f − N j=0 djφj ≥ f − fN . Rovnost přitom nastane pouze tehdy, je-li dj = cj pro všechna j = 0, . . . , N. Důkaz: Máme f − N j=0 djφj 2 = (f − N j=0 djφj, f − N j=0 djφj) = 28 = (f, f) − (f, N j=0 djφj) − ( N j=0 djφj, f) + ( N j=0 djφj, N j=0 djφj) = = f 2 − N j=0 cj ¯dj − N j=0 ¯cjdj + N j=0 dj ¯dj = = f 2 + N j=0 |cj − dj|2 − N j=0 |cj|2 . První a poslední člen nezávisí na koefientech dj, prostřední člen je nezáporný a minimalizuje se právě tehdy, když dj = cj pro j = 0, . . . , N. Lemma 3.1.4. Fourierova řada ∞ k=0 ckφk konverguje v normě L2 k funkci f právě tehdy, když platí Parsevalova rovnost ∞ j=0 |cj|2 = f 2 . Ve dvoudimenzionálním prostoru se Parsevalova rovnost redukuje na Pythagorovu větu. Pro dvě funkce platí Parsevalova rovnost ve tvaru (f, g) = b a f (x) g (x) = ∞ k=0 ckdk, kde ck jsou Fourierovy koeficienty funkce f, dk jsou Fourierovy koeficienty funkce g a obě Fourierovy řady funkcí f a g konvergují. Definice 3.1.5. Ortonormální systém je úplný jestliže platí: Pokud pro nějakou funkci g ∈ L2 ([a, b]) platí (g, φk) = 0 pro všechna k = 0, 1, ..., pak g = 0. Tedy neexistuje nenulová funkce kolmá na všechny prvky systému. Lemma 3.1.6. Fourierova řada konverguje pro každou funkci f ∈ L2 ([a, b]) právě tehdy, když systém {φk}∞ k=0 je úplný. 29 3.2 Úplnost a Parsevalova rovnost Definice 3.2.1. Ornonormální systém {φk}∞ k=0 se nazývá úplný, jestliže platí: pokud je pro nějakou funkci (f, φn) = 0 pro všechna n, pak f = 0. Neexistuje tedy nenulová funkce kolmá na všechny φn. Věta 3.2.2. Nechť {φk}∞ k=0 je úplný ortonormální systém a (ck) jsou Fourierovy koeficienty funkce f. Pak ∞ k=0 ckφk konverguje v normě L2 k funkci fa platí tedy Parsevalova rovnost ∞ j=0 |cj|2 = f 2 . Důkaz: Víme, že ∞ j=0 |cj|2 < ∞, podle Besselovy nerovnosti. Funkce f je tedy rovna funkci z Riesz-Fischerovy věty. Z úplnosti systému totiž plyne, že koeficienty (ck) určují f jednoznačně. Je-li také g ∼ (ck), pak (f − g) ∼ (0), a tedy f = g. Věta 3.2.3. Nechť f a g jsou funkce z L2 , kde f ∼ (ck), g ∼ (dk). Pak platí b a f¯gdx = ∞ j=0 cj ¯dj. Tedy zobrazení f → (ck) z L2 do l2 je izomorfismus (zachovává skalární součin). Důkaz: Je b a fn¯gdx = n j=0 cm b a φm¯gdx = n j=0 cj ¯dj. Ale pro n → ∞ je fn → f v L2 a pravá strana konverguje k ∞ j=0 cj ¯dj. Celkem tedy b a f¯gdx = ∞ j=0 cj ¯dj. 30 3.2.1 Úplnost a uzavřenost Nechť {φk}∞ k=0 je systém funkcí z L2 . Označme φk prostor všech konečných lineárních kombinací funkcí z {φk}∞ k=0, t.j. g ∈ φk ⇔ g = n k=0 dkφk pro nějaké n ∈ N a dk ∈ C. Definice 3.2.4. Systém {φk}∞ k=0 se nazývá uzavřený, jestliže prostor φk je hustý podprostor L2 . Věta 3.2.5. {φk}∞ k=0 je úplný právě tehdy, když je uzavřený. Důkaz: Tvrzení stačí dokázat pro ortonormální systém, neboť každý systém lze ortonormalizovat. Nechť {φk}∞ k=0 je úplný systém a f ∈ L2 . Podle Věty 1.4.2 je fn → f v L2 , ale fn ∈ φk , tedy φk je hustý. Naopak, nechť {φk}n k=0 je hustý a f ∈ L2 má všechny Fourierovy koeficienty rovny nule, t.j. (f, φn) = 0 pro všechna n. Z hustoty plyne existence posloupnosti funkcí Φn ∈ φk tak, že Φn → f v L2 , t.j. Φn − f → 0 pro n → ∞. Ale fn jsou nejlepší aproximací, tedy i fn → f. Ale fn = 0, tedy i f = 0. Odtud plyne, že {φk}∞ k=0 je úplný systém. 3.3 Borel-Cantelliho lemma Pro počítání s nekonečnými posloupnostmi jevů a náhodných veličin je důležitým nástrojem Borel-Cantelliho lemma. Lemma 3.3.1. (Borel-Cantelli ) Nechť (Ω, A, P) je pravděpodobnostní prostor. Nechť An ⊆ Ω, n = 1, 2, ... je posloupnost jevů. Označme jako A jev, že nastává nekonečně mnoho An, tedy A = ∞ n=1 ∞ m=n Am. Pak platí: 31 1. Jestliže ∞ n=1 P (An) < ∞ (tj. řada konverguje), pak P (A) = 0. 2. Jestliže ∞ n=1 P (An) = ∞ (tj. řada diverguje) a An jsou nezávislé, potom P (A) = 1. Důkaz: Máme ω ∈ A ⇐⇒ ω ∈ ∞ m=n Am pro všechna n = 1, 2, .... Platí A ⊆ ∞ m=n Am pro všechna n. Tedy 0 ≤ P (A) ≤ P ∞ m=n Am ≤ ∞ n=m P (Am) . Ale ∞ n=m P (Am) je limita částečných součtů a z definice konvergence tedy platí ∞ m=n P (Am) → 0 pro n → ∞, čímž je první tvrzení dokázáno. Pro důkaz druhé části, musíme dokázat, že P AC = 0, kde AC = ∞ n=0 ∞ m=n AC m. Máme tedy s využitím nezávislosti a odhadu 1 − x ≤ e−x pro x ≥ 0, P ∞ m=n AC m = lim r→∞ P r m=n AC m = ∞ m=n (1−P(Am)) ≤ ∞ m=n exp(−P(Am)) = 32 = exp(− ∞ m=n P(Am) = 0 kdykoliv ∞ m=n P(Am) = ∞. Tedy P(AC ) = lim n→∞ P ∞ m=n AC m = 0, neboli P(A) = 1, což jsme chtěli dokázat. 33 3.4 Příklady Příklad 3.4.1. Dokažte, že funkce einx a eimx , pro dvě různá celá čísla n, m, jsou na sebe kolmé na intervalu (−π, π). Příklad 3.4.2. Najděte polynom druhého stupně který je kolmý na funkci f(x) = x na intervalu (−1, 1). Příklad 3.4.3. Pomocí Gramm-Schmidtova procesu najděte ortonormální bázi prostoru polynomů druhého stupně na intervalu (0, 1). Příklad 3.4.4. Najděte nenulovou lineární funkci, která je kolmá na funkci f(x) = ex na intervalu (0, e). 34 Kapitola 4 Wienerův proces V této kapitole se budeme zabývat Wienerovým procesem, který slouží jako základní kámen spojitých modelů ve finanční matematice. Historie tohoto procesu těsně souvisí s historií finanční matematiky. Jako první tento proces použil Louis Bachelier v roce 1900, když ve své dizertaci odvodil první vzorec pro cenu opce. Model i výsledek jsou překvapivě blízko o mnoho pozdějšímu modelu Blacka a Scholese. Bachelierova práce ve skutečnosti upadla v zapomenutí a v šedesátých letech ji znovuobjevil významný americký matematik J. Savage, který s ní seznámil ekonomickou komunitu. 4.1 Definice Wienerova procesu Definice 4.1.1. Reálný stochastický proces W (t) na pravděpodobnostním prostoru (Ω, A, P) se nazývá Wienerův proces , jestliže platí: 1. W (0) = 0. 2. (spojitost trajektorií) S pravděpodobností 1 je funkce t → W (t) spojitá v t. 3. (nezávislost a normalita přírůstků) Přírůstky W (t) − W (s) mají rozdělení N (0, t − s). Pro libovolné 0 < t1 < t2 < ... < tn jsou přírůstky W (t1) , W (t2) − W (t1) , ..., W (tn) − W (tn−1) navzájem nezávislé. V následujícím textu budeme považovat pojmy Wienerův proces a Brownův pohyb za synonyma, stejně tak budeme zaměňovat značení W (t) a Wt. 35 Nejdříve se budeme zabývat otázkou, zda takový proces vůbec existuje, a ukážeme si jednu z možných konstrukcí Wienerova procesu. 4.2 Haarovy a Schauderovy funkce Wienerův proces zkonstruujeme jako náhodný součet tzv. Schauderových funkcí, které vzniknou jako integrál z Haarových funkcí. Definice 4.2.1. Pro t ∈ [0, 1] definujeme Haarovy funkce {hk (t)}∞ k=0 následujícím způsobem. Pro k = 0 položíme h0 (t) = 1 pro t ∈ [0, 1]. Dále h1 (t) = 1 pro t ∈ 0, 1 2 −1 pro t ∈ 1 2 , 1 Pro n > 1 nejdříve vyjádříme n ve tvaru n = 2j + k kde j ≥ 0, 0 ≤ k < 2j (tzv. dyadické vyjádření čísla n), a definujeme hn (t) = 2 j 2 h1 2j t − k . 2 j 2 je normalizační konstanta, faktor 2j představuje změnu měřítka a k posun (určuje polohu nosiče). Připomeňme v této souvislosti pojem nosič funkce, supp f = {x ∈ R; f (x) = 0}. Například, supp (h4) = 0, 1 4 . 36 Pro n = 73 máme dyadické vyjádření 73 = 64 + 9 = 26 + 9, tedy úroveň je j = 6 a poloha je k = 9. Podobně pro n = 51 je 51 = 32+19 = 25 +19, tedy úroveň je j = 5 a poloha je k = 19. Věta 4.2.2. Funkce {hk}∞ k=0 tvoří úplný, ortonormální systém v prostoru L2 ([0, 1]). Důkaz: Nejdříve dokážeme ortogonálnost, tedy hn, hm = 0 pro m = n. Nechť n = 2j + k a m = 2j + k . Pro j = j je supp (hn) ∩ supp (hm) buď prázdná nebo jednobodová množina. Tedy 1 0 hn (x) hm (x) dx = 1 0 0 dx = 0. Pro j = j musíme uvažovat dva případy, disjunktní a nedisjunktní nosiče hn a hm. V prvním případě je opět součin identická nula. V druhém případě předpokládejme bez újmy na obecnosti že m > n. Nosič hm musí ležet v intervalu, kde hn je konstantní, tedy 1 0 hnhm = ±2 j 2 1 0 hm = 0. Dále ukážeme, že hn, hn = 1, tedy ortonormalitu systému. Pro n = 1 máme h1 2 = 1 0 h2 1 (x) dx = 1 0 1dx = 1. Pro n > 1 dostaneme hn 2 = 1 0 h2 n (x) dx = 2 j 2 2 1 0 h2 1 2j t − k dt. 37 Po substituci u = 2j t − k dostáváme 2 j 2 2 1 0 h2 1 2j t − k dt = 2j−k −k h2 1 (u) du = 1 0 h2 1 (u) du = 1. Úplnost systému plyne z jeho uzavřenosti. Pro každé f ∈ L2 ([0, 1]) existuje posloupnost konečných lineárních kombinací funkcí z {hk}∞ k=0, která konverguje k f. Opravdu, z Haarových funkcí jako lineární kombinace dostaneme funkce po částech konstantní na dyadických intervalech, pomocí kterých můžeme libovolně dobře aproximovat funkce spojité. Na druhé straně, spojité funkce tvoří hustou podmnožinu v L2 . Odtud plyne tvrzení. Integrováním Haarových funkcí dostaneme Schauderovy funkce. Definice 4.2.3. Pro n = 1, 2, ... definujeme n-tou Schauderovu funkci vztahem sn (t) = t 0 hn (s) ds pro t ∈ [0, 1]. Grafem n-té Schauderovy funkce je rovnoramenný trojúhelník, jehož výška je 1 2j+1 2 j 2 = 2 j 2 −j−1 = 2− j 2 −1 . 4.3 Ciesielskiho konstrukce Následující dvě technická lemmata jsou potřeba k důkazu spojitosti trajektorií v Ciesielskiho konstrukci. Lemma 4.3.1. Nechť {ak}∞ k=1 je posloupnost reálných čísel, 0 ≤ δ < 1 2 a nechť platí |ak| = O kδ , tedy existuje konstanta c > 0 tak, že |ak| ≤ ckδ . Pak řada ∞ k=1 aksk (t) konverguje stejnoměrně pro t ∈ [0, 1]. Důkaz: Zvolme ε > 0. Pro 2n ≤ k < 2n+1 mají funkce sk (t) disjunktní nosiče. Položme bn = max 2n≤k<2n+1 |ak| ≤ c 2n+1 δ . Pak pro 0 ≤ t ≤ 1 platí: 38 ∞ k=2m |ak| |sk (t)| ≤ ∞ n=m bn2n ≤ max k<2n+1 |sk (t)| ≤ c ∞ n=m 2n+1 δ 2−n 2 −1 = = c2(δ−1) ∞ n=m 2n(δ−1 2 ) < ε pro dostatečně velké m, neboť δ − 1 2 < 0 a tedy řada ∞ n=1 2n(δ−1 2 ) konverguje. Lemma 4.3.2. Nechť {Ak}∞ k=1 jsou nezávislé náhodné veličiny na pravděpodobnostním prostoru (Ω, A, P) s rozdělením N (0, 1). Pak pro skoro všechna ω ∈ Ω platí, že |Ak| = O √ log k pro k → ∞ (tedy existuje c ∈ R tak, že |Ak| ≤ c √ log k). Důkaz: Pro x > 0 a k = 1, 2, ... máme: P (|Ak| > x) = 1 √ 2π −x −∞ e−s2 2 ds + 1 √ 2π ∞ x e−s2 2 ds = = 2 √ 2π ∞ x e−s2 2 ds ≤ 2 √ 2π e−x2 4 ∞ x e−s2 4 ds ≤ ce−x2 4 pro nějakou konstantu c, protože e−s2 4 je klesající na [x, ∞). Můžeme vzít např. c = 2√ 2π ∞ −∞ e−s2 4 ds. Položme x = 4 √ log k. Potom P |Ak| > 4 log k ≤ ce−4 log k = c 1 k4 . Protože řada ∞ k=1 1 k4 konverguje, z Borel-Cantelliho lemmatu máme P |Ak| > 4 log k pro nekonečně mnoho k = 0. Tedy pro skoro všechna ω je |Ak| ≤ c √ log k pro nějakou konstantu c. 39 Věta 4.3.3. Nechť W (t) je Wienerův proces. Pak Cov (W (t) , W (s)) = E (W (t) W (s)) = min (t, s) . Důkaz: Nechť s ≥ t ≥ 0. Máme E (W (t) [W (t) + (W (s) − W (t))]) = E W2 (t) +E (W (t) [W (s) − W (t)]) = = t = min (t, s) , protože E (W2 (t)) = t z definice a E (W (t) [W (s) − W (t)]) = 0 z nezávislosti přírůstků. Věta 4.3.4. Pro libovolná 0 ≤ s, t ≤ 1 platí ∞ k=1 sk (s) sk (t) = min (s, t) . Důkaz: Pro libovolné pevné s ∈ [0, 1] definujeme funkce gs (τ) = 1 pro τ ≤ s 0 pro s < τ ≤ 1. Podle Parsevalovy rovnosti (protože Haarovy funkce tvoří ortonormální úplný systém v L2 ([0, 1])) máme pro s ≤ t: s = 1 0 gt (x) gs (x) dx = ∞ 0 akbk, kde pro koeficienty ak, bk platí ak = gt, hk = 1 0 gt (x) hk (x) dx = t 0 hk (x) dx = sk (t) a bk = gs, hk = 1 0 gs (x) hk (x) dx = s 0 hk (x) dx = sk (s) . 40 Celkem tedy min (s, t) = s = ∞ 0 sk (t) sk (s) . Věta 4.3.5. (Ciesielskiho konstrukce Wienerova procesu): Nechť {Ak}∞ k=1 je posloupnost nezávislých náhodných veličin s rozdělením N (0, 1), definovaných na daném pravděpodobnostním prostoru. Pak součet W (t, ω) = ∞ k=1 Ak (ω) sk (t) pro 0 ≤ t ≤ 1 konverguje stejnoměrně v t pro skoro všechna ω, a W (t, ω) je Wienerův proces. Důkaz: Stejnoměrná konvergence plyne z předchozích lemmat. Ze stejnoměrné konvergence řady spojitých funkcí plyne spojitost trajektorie procesu t → W (t, ω). Musíme ověřit, že W (t, ω) je Wienerův proces. Zřejmě W (0) = 0, protože sk (0) = 0 pro všechna k. Dále pomocí charakteristické funkce dokážeme, že W (t)−W (s) pro s < t má rozdělení N (0, t − s). Nechť s < t. Z definice W, nezávislosti Ak ∼ N (0, 1) a znalosti charakteristické funkce rozdělení N(0, 1), E eitAk = e−t2 2 , máme E eiλ(W(t)−W(s)) = E eiλ ∞ k=1Ak(sk(t)−sk(s)) = E( ∞ k=1 eiλAk(sk(t)−sk(s)) ) = = ∞ k=1 E eiλAk(sk(t)−sk(s)) = ∞ k=1 e−λ2 2 [sk(t)−sk(s)]2 = e−λ2 2 ∞ k=1[sk(t)−sk(s)]2 = = e−λ2 2 ∞ k=1 s2 k(t)−2sk(t)sk(s)+s2 k(s) . Trojnásobným použitím pomocného tvrzení ∞ k=1 sk (s) sk (t) = min (s, t) dostaneme 41 e−λ2 2 ∞ k=1 s2 k(t)−2sk(t)sk(s)+s2 k(s) = e−λ2 2 [t−2s+s] = e−λ2 2 [t−s] . To je ale charakteristická funkce rozdělení N (0, t − s). Z jednoznačnosti charakteristické funkce plyne W (t) − W (s) ∼ N (0, t − s) . Zbývá dokázat nezávislost přírůstků. Protože přírůstky mají normální rozdělení, stačí dokázat nekorelovanost, E ([W (ti+1) − W (ti)] [W (tj+1) − W (tj)]) = 0 pro i = j. Nejdříve vypočteme z definice W pro s < t E [W (t) W (s)] = E ∞ k=1 Ak (ω) sk (t) ∞ k=1 Ak (ω) sk (s) = = E ∞ k=1 ∞ l=1 Ak (ω) Al (ω) sk (t) sl (s) = = E ∞ k=1 A2 k (ω) sk (t) sk (s) , protože z nezávislosti E(Ak (ω) Al (ω)) = 0 pro k = l. Tedy E ∞ k=1 A2 k (ω) sk (t) sk (s) = = ∞ k=1 E A2 k (ω) sk (t) sk (s) = ∞ k=1 sk (t) sk (s) = min (t, s) = s, neboť Ak ∼ N (0, 1). Bez újmy na obecnosti můžeme předpokládat ti < tj. Z předchozího výpočtu máme E ([W (ti+1) − W (ti)] [W (tj+1) − W (tj)]) = 42 = E [W (ti+1) W (tj+1) − W (ti) W (tj+1) − W (ti+1) W (tj) + W (ti) W (tj)] = = ti+1 − ti − ti+1 + ti = 0. Přírůstky jsou tedy nekorelované a tím pádem nezávislé. Analogicky se dokáže vzájemná nezávislost více než dvou přírůstků, s využitím vlastností vícerozměrného normálníého rozdělení. 43 4.4 Příklady Příklad 4.4.1. Nakreslete graf Haarovy funkce h11 a h21. Příklad 4.4.2. Najděte nosič Schauderovy funkce s7 a s17. Příklad 4.4.3. Nechť W(t) je standardní Wienerův proces. Dokažte, že pro libovolné k > 0 je proces X(t) = 1 k W(k2 t) také standardní Wienerův proces. Příklad 4.4.4. Vypočtěte skalární součin funkcí s9 a s17. Příklad 4.4.5. Dokažte úplnost systému Haarových funkcí v prostoru L2 ([0, 1]). (nápověda: stačí dokázat hustotu lineárních kombinací Haarových funkcí v prostoru spojitých funkcí) 44 Kapitola 5 Lineární a kvadratická variace V této kapitole se budeme zabývat základní mírou variability funcí. Ukazuje se, že pro charakterizaci trajektorií Wienerova procesu klasický pojem lineární variace nevyhovuje, protože s pravděpodobností jedna všechny trajektorie mají nekonečnou lineární variaci. Proto zavedeme pojem kvadratické variace, která již poskytuje konečnou a nenulovou míru variability trajektorie Wienerova procesu. 5.1 Lineární variace Variace je míra proměnlivosti (variability) funkce na daném intervalu. Nechť f : [a, b] → R je spojitá funkce a nechť D = {a = t1 < t2 < ... < tn = b} je dělení intervalu [a, b]. Lineární variace vzhledem k dělení D je definována jako LV (f, D) = n−1 j=1 |f (tj+1) − f (tj)| . Definice 5.1.1. Lineární variace funkce f je definována jako limita LV (f) = lim D →0 LV (f, D) , kde D je norma dělení, tj. D = max j | tj+1 − tj | . 45 Příklad 5.1.2. Funkce f (x) = x2 na intervalu [0, 1] má lineární variaci LV (f) = f (1) − f (0) = 1. Opravdu, máme f (tj+1) − f (tj) > 0 pro všechna j, neboť f je rostoucí. Lineární variace je tedy LV (f, D) = n−1 j=1 (f (tj+1) − f (tj)) = = f (tn) − f (t1) = f (b) − f (a) = f (1) − f (0) . Obecně, je-li f monotonní na [a, b], pak LV (f) = |f (b) − f (a)| . Příklad 5.1.3. Vypočtěte lineární variaci funkce sin x na intervalu [0, 2π]. Funkce je po částech monotonní na jednotlivých podintervalech délky π 2 , na každém z nich je variace rovna jedné. Sečtením jednotlivých variací dostáváme LV (f) = 4. Nechť f : [0, T] → R je diferencovatelná funkce nabývající extrémů v bodech t1 a t2. Pak LV (f) = |f (t1) − f (0)| + |f (t2) − f (t1)| + |f (T) − f (t2)| = = t1 0 f (x) dx − t2 t1 f (x) dx + T t2 f (x) dx = T 0 |f (x)| dx. Obecně, je-li f diferencovatelná, pak podle věty o střední hodnotě pro každý podinterval [tk, tk+1] existuje bod t∗ k uvnitř tohoto intervalu tak, že f (tk+1) − f (tk) = f (t∗ k) (tk+1 − tk) , tedy n−1 k=1 |f (tk+1) − f (tk)| = n−1 k=1 |f (t∗ k)| (tk+1 − tk) , 46 což je přibližný součet z definice Riemannova integrálu. Limitním přechodem dostaneme LV (f) = lim D →0 n−1 k=1 |f (tk+1) − f (tk)| = T 0 |f (t)| dt. Pro trajektorie Wienerova procesu není lineární variace užitečný pojem, protože je rovna nekonečnu pro skoro všechny trajektorie. 5.2 Kvadratická variace Definice 5.2.1. Nechť D = {t1, ..., tn} je dělení intervalu [0, T], tedy 0 = t1 < t2 < ... < tn = T. Kvadratickou variaci funkce f na intervalu [0, T] definujeme jako KV (f) = lim D →0 n−1 k=1 (f (tk+1) − f (tk))2 , pokud limita existuje. Lemma 5.2.2. Nechť f je diferencovatelná funkce na [0, T], pak KV (f) = 0. Důkaz: Máme KV (f) = lim D →0 n−1 k=1 (f (tk+1) − f (tk))2 = lim D →0 n−1 k=1 |f (t∗ k)| 2 (tk+1 − tk)2 ≤ lim D →0 D n−1 k=1 |f (t∗ k)| 2 (tk+1 − tk) = lim D →0 D T 0 (f (t)) 2 dt = 0, neboť integrál T 0 (f (t))2 dt je konečný. K výpočtu kvadratické variace trajektorie Wienerova procesu budeme potřebovat následující lemma. 47 Lemma 5.2.3. Nechť W (t) je Wienerův proces. Pak E W2 (t) = t E W4 (t) = 3t2 . Důkaz: Z definice víme, že W (t) − W (s) ∼ N (0, t − s). Speciálně pro s = 0 je W (t) ∼ N (0, t), tedy E (W (t)) = 0 a E (W2 (t)) = t. Dále, N (0, t) má hustotu 1√ 2πt e−x2 2t . Ze vztahu E (g (X)) = ∞ −∞ g (x) f (x) dx máme E W4 (t) = ∞ −∞ 1 √ 2πt e−x2 2t x4 dx = 1 √ 2πt ∞ −∞ e−x2 2t x4 dx = 1 √ 2πt e−x2 2t (−t) x3 ∞ −∞ + ∞ −∞ e−x2 2t t3x2 dx = 1 √ 2πt e−x2 2t (−t) x3 ∞ −∞ + 1 √ 2πt 3t ∞ −∞ e−x2 2t x2 dx = 0 + 1 √ 2πt 3t e−x2 2t (−t) x ∞ −∞ + ∞ −∞ e−x2 2t (t) dx = 1 √ 2πt 3t2 ∞ −∞ e−x2 2t dx = = 3t2 ∞ −∞ 1 √ 2πt e−x2 2t dx = 3t2 . Využili jsme toho, že e−x2 2t (−t) x3 ∞ −∞ = 0, jelikož exponenciála klesá rychleji než roste libovolná mocnina x. Věta 5.2.4. Nechť W (t) je Wienerův proces na intervalu [0, T] a nechť D = {0 = t1 < t2 < ... < tn = T} je dělení intervalu [0, T]. Pak n−1 k=1 (W (tk+1) − W (tk))2 → T pro D → 0 v L2 -normě. Důkaz: Označme ∆Wk = W (tk+1) − W (tk) a ∆tk = tk+1 − tk. Chceme 48 dokázat, že E   n−1 k=1 (∆Wk)2 − T 2   → 0 pro D → 0 (tj. konvergenci v L2 ). Máme E n−1 k=1 (∆Wk)2 − (tk+1 − tk) 2 = n−1 k=1 E(∆W4 k − 2 (tk+1 − tk) ∆W2 k + + (tk+1 − tk)2 ) = n−1 k=1 3 (tk+1 − tk)2 − 2 (tk+1 − tk)2 + (tk+1 − tk)2 = = 2 n−1 k=1 (tk+1 − tk)2 ≤ 2 D n−1 k=1 (tk+1 − tk) = 2 D T → 0 pro D → 0. Tedy trajektorie Wienerova procesu mají kvadratickou variaci rovnu T (všechny stejnou). Důsledek 5.2.5. Trajektorie Wienerova procesu mají nekonečnou lineární variaci. Důsledek 5.2.6. Trajektorie Wienerova procesu nejsou diferencovatelné na žádném podintervalu. Pozoruhodné na předchozích výsledcích je, že na jedné straně trajektorie Wienerova procesu je náhodná, ale veličina lim ∆t→0 (∆Wk)2 je deterministická (nezávisí na trajektorii) a rovná se T (stejná pro všechny trajektorie). To je matematický smysl heuristické formule (∆W)2 = ∆t. 49 5.3 Příklady Příklad 5.3.1. Vypočtěte lineární variaci funkce sin 5x na intervalu (0, 2π) Příklad 5.3.2. Dokažte, že funkce sin 1 x nemá konečnou lineární variaci na intervalu (0, 1) Příklad 5.3.3. Vypočtěte lineární variaci funkce x sin 1 x na intervalu (0, 2π) Příklad 5.3.4. Vypočtěte E(W6 t ), buď přímým výpočtem, nebo s použitím následující úlohy. Příklad 5.3.5. Nechť Wt je standardní Wienerův proces. Označme mk(t) = E(Wk t ). Dokažte, že platí mk(t) = 1 2 k(k − 1) t 0 mk−2(s)ds pro k ≥ 2 50 Kapitola 6 Itôův integrál a Itôovo lemma V této kapitole budeme definovat stochastický integrál. Ukazuje se, že na rozdíl od klasického integrálu bude definice záviset na volbě dělícího bodu, ve kterém bereme hodnotu integrované funkce. Pro aplikace ve finanční matematice dostaneme smysluplnou definici jen v případě že za dělící bod vezmeme levý krajní bod intervalu, což vede ke stochastickému integrálu ve smyslu K. Itô. Jedině při této definici má výsledný proces vlastnost martingalu, a je adaptovaný přirozené filtraci, tedy čerpá informace jen z minulosti. Druhá přirozená definice vede ke Stratonovičově integrálu, který má využití v jiných aplikacích, především v inženýrství. 6.1 Itôův integrál Je-li f hladká funkce, pak můžeme přirozeně definovat integrál podle přírůstků funkce f, b a g (u) df (u) = b a g (u) f (u) du = lim D →0 n i=1 g (ti) (f (ti) − f (ti−1)) , kde a = t0 < t1 < ... < tn = b je dělení intervalu [a, b]. Integrál b a g (u) df(u) je tzv. Stieltjesův integrál. 51 Pro aplikace ve financích chceme analogický integrál podle přírůstků Wienerova procesu Wt, b a f (t, ω) dWt (ω) . Trajektorie Wienerova procesu ale není hladká funkce, je tedy otázka jaký smysl má dWt. Stieltjesův a stochastický integrál se tedy liší ve dvou aspektech: – integrál je náhodná veličina (výsledek závisí na trajektorii Wienerova pro- cesu) – Wt není hladká, s pravděpodobností 1 nemá trajektorie derivaci v žádném bodě. Příklad 6.1.1. (motivační) Nechť Wt (ω) je cena akcie v čase t při tržním scénáři ω. Nechť f (t, ω) je obchodní strategie, tj. počet držených akcií v čase t za scénáře ω. Pak f (t, ω) (Wt+1 − Wt) = f (t, ω) ∆W je zisk ze strategie v časovém intervalu [t, t + 1]. Součtem hodnot jednotlivých zisků dostaneme v limitě integrál b a fdW který představuje zisk ze strategie v časovém intervalu [a, b]. Příklad 6.1.2. (závislost na volbě vnitřního bodu) Mějme dělení intervalu [0, T], D = {0 = t0 < t1 < ... < tn = T} a nechť D = max j∈{0,...,n−1} |tj+1 − tj| . Pro pevné λ ∈ [0, 1] položme τk = (1 − λ) tk + λtk+1 pro k = 0, ..., n − 1. Pro λ = 0 dostaneme levý krajní bod τk = tk, pro λ = 1 2 dostaneme prostředek τk = 1 2 (tk + tk+1) a pro λ = 1 dostaneme pravý krajní bod τk = tk+1. 52 Definujeme Riemannovy součty pro T 0 WdW vztahem Rn = n−1 k=0 W (τk) (W (tk+1) − W (tk)) . Dostaneme W (τk) (W (tk+1) − W (tk)) = W (τk) W (tk+1) − W (τk) W (tk) = = W (τk) W (tk+1) ± 1 2 W2 (τk) ± 1 2 W2 (tk) ± 1 2 W2 (tk+1) − W (τk) W (tk) = = − 1 2 [W (tk+1) − W (τk)]2 + 1 2 [W (τk) − W (tk)]2 + 1 2 W2 (tk+1) − W2 (tk) Dále Rn = n−1 k=0 W (τk) (W (tk+1) − W (tk)) = − 1 2 n−1 k=0 [W (tk+1) − W (τk)]2 + + 1 2 n−1 k=0 [W (τk) − W (tk)]2 + 1 2 n−1 k=0 W2 (tk+1) − W2 (tk) . Poslední člen je tzv. teleskopující součet ve kterém se všechny členy s výjimkou prvního a posledního vyruší, a rovná se tedy W2 (T) − W2 (0) . Pro D → 0 podobně jako při výpočtu kvadratické variace máme Rn = − 1 2 (1 − λ) T + 1 2 λT + 1 2 W2 (T) − W2 (0) = W2 (T) 2 + λ − 1 2 T. Dvě přirozené volby hodnoty λ vedou ke dvěma různým stochastickým inte- grálům: pro λ = 1 2 máme T 0 WtdWt = W2(T) 2 ... Stratonovičův integrál, pro λ = 0 máme T 0 WtdWt = W2(T) 2 − T 2 ... Itôův integrál. Ve financích se používá jen Itôův integrál, protože portfolio musíme sestavit před pohybem ceny 53 6.2 Filtrace Připomeňme si z diskrétních modelů, že σ-algebra popisuje systém pozorovatelných jevů. Zachyceje tedy informaci které jevy můžeme pozorovat a které ne. Uvažujme standardní příklad s hodem kostkou. Pravděpodobnostní prostor Ω má šest prvků, Ω = {1, 2, 3, 4, 5, 6} Uvažujme nejdříve σ-algebru všech podmnožin Ω. Při této σ-algebře jsou pozorovatelné všechny jevy. Informace kterou σ-algebra nese je tedy přímo hodnota která na kostce padla. Na druhé straně, uvažujme menší systém tvořený množinami ∅, Ω, {1, 3, 5}, {2, 4, 6} Snadno ověříme uzavřenost na sjednocení a doplňky, je to tedy opět σalgebra. Při takové σ-algebře jsou pozorovatelné jen dva jevy, že padlo sudé číslo nebo liché číslo. Informace kterou σ-algebra nese je tedy pouze sudost nebo lichost hodnoty která na kostce padla. Následující příklad připomíná použití σ-algeber při popisu vývoje informace v čase. Příklad 6.2.1. Uvažujme tři časové okamžiky, t = 0, t = 1 a t = 2 a dvoukrokový model trhu. Náš pravděpodobnostní prostor je tvořen množinou všech úplných scénářů Ω = {(++) , (+−) , (−+) , (−−)} . V čase t = 0 jsou určeny pouze jevy Ω a ∅, tedy σ-algebra popisující tuto informaci je F0 = {∅, Ω} . V čase t = 1 jsou určeny jevy: F+ = {(++) , (+−)} a F− = {(−+) , (−−)}. Tedy σ-algebra popisující tuto informaci je F1 = {∅, Ω, F+, F−} . 54 V čase t = 2 jsou určeny všechny jevy (každá podmnožina Ω), tedy σalgebra popisující tuto informaci je F2 = exp Ω = {∀ podmnožiny Ω} . . Definice 6.2.2. Systém σ-algeber F = {Ft, t ∈ τ} na pravděpodobnostním prostoru (Ω, A, P) se nazývá filtrace, pokud pro všechna t ∈ τ je Ft ⊆ A a Fs ⊆ Ft kdykoliv je s < t. Definice 6.2.3. Nechť W (t) je Wienerův proces na (Ω, A, P). Filtrace F = {Ft, t ≥ 0} se nazývá historie Wienerova procesu, jestliže pro každé t > 0 je Ft σ-algebra generovaná náhodnými veličinami W (s, ω) pro s ≤ t. F popisuje růst informace o trajektorii Wienerova procesu v závislosti na čase. Ft je tedy informace o trajektorii v čase t. Platí Věta 6.2.4. Ft je nejmenší σ-algebra generovaná množinami typu {ω; W (t1, ω) ∈ F1, ..., W (tk, ω) ∈ Fk} , kde k = 1, 2, ... a tj < t pro všechna j = 1, . . . k jsou libovolné časy a Fj ⊆ R jsou libovolné Borelovské množiny. Věta 6.2.5. Funkce h (ω) je Ft-měřitelná, kde F je historie Wienerova procesu právě tehdy, když h je bodová limita součtů funkcí tvaru g1 (W1) ...gk (Wtk ) , kde g1, ..., gk jsou omezené spojité funkce, tj ≤ t pro j = 1, ..., k a k ∈ N. Definice 6.2.6. Nechť W (t) je Wienerův proces na prostoru (Ω, A, P) a nechť F je historie Wienerova prostoru. Říkáme, že proces {G (t, ω) ; t ∈ [0, ∞)} je adaptovaný historii Wienerova procesu (neboli G (t, ω) je neanticipativní ), jestliže pro každé t ≥ 0 je funkce ω → G (t, ω) Ft-měřitelná. Tedy hodnota G (t, ω) závisí jen na historii Wienerova procesu do času t. G (t, ω) nepředvídá proud informací reprezentovaných σ-algebrami Ft. 55 Definice 6.2.7. Stochastický proces S se nazývá jednoduchá funkce na intervalu [0, T], jestliže existuje dělení D = {0 = t0 < ... < tm = T} tak, že S (t, ω) = Sk (ω) pro tk ≤ t < tk+1 (k = 0, ..., m − 1) pro nějaké náhodné veličiny Sk. Definice 6.2.8. Nechť S je jednoduchá funkce. Pak T 0 SdW = m−1 k=0 Sk (ω) (W (tk+1, ω) − W (tk, ω)) se nazývá Itôův stochastický integrál funkce S na intervalu [0, T]. Tedy označíme-li ∆Wk = (W (tk+1, ω) − W (tk, ω)), máme T 0 SdW = m−1 k=0 Sk∆Wk. Definice 6.2.9. Nechť W (t) je Wienerův proces na prostoru (Ω, A, P). Symbolem M budeme označovat třídu stochastických procesů f (t, ω) : [0, ∞) × Ω → R takových, že: – f (t, ω) je neanticipativní, – f (t, ω) je B × A-měřitelná, kde B jsou Borelovské množiny na [0, ∞), – platí P T 0 [f (t)]2 dt < +∞ = 1 Příklad 6.2.10. (Investiční strategie) V intervalu [ti, ti+1) držíme ei (ω) akcií, kde ei (ω) závisí na vývoji ceny Wt (ω) do času ti (Wt je cena akcie v čase t) Φ (t, ω) = m−1 i=0 ei (ω) χ[ti, ti+1), kde χ[ti, ti+1) = 1 pro t ∈ [ti, ti+1) 0 jinak. 56 Pak Φ (t, ω) je počet akcií, které držíme v čase t (za scénáře ω). Φ je jednoduchá funkce. Integrál T 0 Φ (t, ω) dWt (ω) = m−1 i=0 ei (ω) Wti+1 (ω) − Wti (ω) je náš celkový zisk z této strategie od času 0 do času T. Věta 6.2.11. (Itôova izometrie): Nechť S je jednoduchá omezená funkce (tedy Sk jsou omezené náhodné veličiny). Pak E T 0 S (t, ω) dWt (ω) 2 = E T 0 S2 (t, ω) dt . Důkaz: Označme ∆Wj = W (tj+1, ω) − W (tj, ω). Máme z definice E T 0 SdW 2 = E   m−1 j=0 Sj∆Wj 2   = E m−1 j=0 S2 j (∆Wj)2 + 2 m−1 i 0, τa = min t {t ∈ (0, ∞) ; W (t) = a} a τa = ∞ pokud neexistuje t takové, že W (t) = a. Je vidět, že τa je stopping time. Příklad 7.2.3. Maximum na intervalu [0, T] není stopping time. Definujeme M (T) = max t∈[0, T] W (t) maximální hodnotu W (t), a τ = min t {t ∈ [0, T] , W (t) = M (T)} čas dosažení maxima. V čase t nevíme, jestli τ nastal nebo ne (může být potom ještě vyšší hodnota), tedy nejde o stopping time. Věta 7.2.4. (Princip reflexe): Nechť W (t) je Wienerův proces, a > 0 a τ (a) je čas prvního dosažení bodu a. Platí P [τ (a) < t] = 2P [W (t) > a] . 66 Výraz na pravé straně rovnice umíme spočítat: P [W (t) > a] = ∞ a 1 √ 2πt e−r2 2t dx. Důkaz: Je-li W (t) > a, pak ze spojitosti trajektorií Wienerova procesu plyne, že τ (a) < t. Protože τ (a) je stopping time, W (t + τ (a)) − W (τ (a)) je Wienerův proces, který je nezávislý na vývoji před časem τ (a). Tedy W (t) − W (τ (a)) ∼ N (0, t − τ (a)) Ze symetrie normálního rozdělení plyne P [W (t) − W (τ (a)) > 0 | τ (a) < t] = P [W (t) − W (τ (a)) < 0 | τ (a) < t] = 1 2 . Tedy P [W (t) > a] = P [τ (a) < t ∧ W (t) − W (τ (a)) > 0] = = P [τ (a) < t] P [W (t) − W (τ (a)) > 0 | τ (a) < t] = 1 2 P [τ (a) < t] Celkem P [τ (a) < t] = 2P [W (t) > a] . Poznámka. Pokud víme, že τ (a) < t, pak je stejná pravděpodobnost, že se W (t) nachází na úrovni a jako pod úrovní a. 67 7.3 Příklady Příklad 7.3.1. Dokažte, že symetrická náhodná procházka má vlastnost martingalu Příklad 7.3.2. Nechť X1, X2, . . . je posloupnost náhodných veličin, pro které platí E(Xn) = 0 pro všechna n. Dokažte, že posloupnost částečných součtů S0 = 0 a Sn = X1 + X2 + · · · + Xn je martingal. Příklad 7.3.3. Mějme nezávislé náhodné proměnné s E(Xn) = 0 a V ar(Xn) = σ2 pro všechna n. Uvažujme posloupnost částečných součtů z předchozího příkladu. Ukažte, že posloupnost M0 = 0 a Mn = S2 n − nσ2 je martingal vzhledem k posloupnosti Xn. Příklad 7.3.4. Nechť Wt je standardní Wienerův proces. Je proces W2 t martingal? Je proces Wt + 3 martingal? Je proces Wt − t martingal? 68 Kapitola 8 Cameron-Martinova věta 8.1 Radon-Nikodýmova derivace Při oceňování složitějších typů opcí závislých na cestě je potřeba tzv. CameronMartinova věta (nebo její obecnější verze Girsanova věta). Nechť W (t) je standardní Wienerův proces na (Ω, A, P). Nechť W je Wienerův proces s driftem, W (t) = W (t) + γt pro nějakou reálnou konstantu γ = 0. Chceme najít pravděpodobnostní míru Q na Ω tak, aby W (t) byl obyčejný Wienerův proces na pravděpodobnostním prostoru (Ω, A, Q). Poznámka: Prostor Ω, který často ani není explicitně zadán, můžeme ztotožnit s prostorem všech trajektorií Wienerova procesu, tedy s prostorem všech spojitých funkcí na intervalu [0, T]. Změna míry je tedy proces který mění pravděpodobnost jednotlivých trajektorií (přesně řečeno jejich okolí). Radon-Nikodýmova derivace Q vůči P, označovaná dQ dP , umožňuje převádět jednu pravděpodobnostní míru na jinou. Definice 8.1.1. Nechť (Ω, A) je pravděpodobnostní prostor, na kterém jsou dány dvě pravděpodobnostní míry P a Q. Říkáme, že P a Q jsou ekvivalentní, jestliže platí P (A) = 0 ⇐⇒ Q (A) = 0. 69 Definice 8.1.2. Nechť P a Q jsou ekvivalentní míry na (Ω, A) a pro náhodnou veličinu Z = dQ dP platí EQ (X) = Ω XdQ = Ω X dQ dP dP = = Ω XZdP = EP (XZ) = EP dQ dP X , pak Z se nazývá Radon-Nikodýmova derivace pravděpodobnostní míry Q vzhledem k pravděpodobnostní míře P. 8.2 Cameron-Martinova věta Věta 8.2.1. (Cameron-Martin): Nechť {W (t) : t ∈ [0, T]} je standardní Wienerův proces na pravděpodobnostním prostoru (Ω, A, P). Nechť Q je pravděpodobnostní míra, jejíž Radon-Nikodýmova derivace vzhledem k P je dQ dP (ω) = exp −γW (T, ω) − 1 2 γ2 T . Pak W (t) = W (t) + γt je Wienerův proces (a tedy marginal) vzhledem ke Q. Je-li například γ < 0, pak vzhledem k míře Q je pravděpodobnost trajektorie tím větší, čím je větší její hodnota v čase T (viz. obrázek u hesla Girsanovova věta na wikipedii). Opravdu, v Radon-Nikodýmově derivaci druhý člen v exponentu nezávisí na trajektorii a první je přímo úměrný hodnotě procesu v bodě T. K důkazu je třeba moment generující funkce, připomeneme její definici. Definice 8.2.2. Moment generující funkce náhodné veličiny X je definován jako ψ (θ) = E eθX = R eθx f (x) dx, kde f je hustota X. Lemma 8.2.3. Nechť X je náhodná veličina s rozdělením N 0, σ2 70 a θ je parametr. Pak E eθX = e 1 2 θ2σ2 . Důkaz: E eθX = ∞ −∞ eθX dF (x) = ∞ −∞ eθx 1 √ 2πσ2 e− x2 2σ2 dx = 1 √ 2πσ ∞ −∞ eθx− x2 2σ2 dx. Doplníme na čtverec v exponentu, E eθX = 1 √ 2πσ ∞ −∞ e − x2 2σ2 −θx dx = 1 √ 2πσ ∞ −∞ e − x√ 2σ −θ √ 2σ 2 2 +θ2σ2 2 dx = = 1 √ 2πσ e θ2σ2 2 ∞ −∞ e − x√ 2σ −θ √ 2σ 2 2 dx = e θ2σ2 2 , protože 1 √ 2πσ e − x√ 2σ −θ √ 2σ 2 2 je hustota N θ √ 2σ 2 ; σ2 , jejíž integrál přes celou reálnou osu je roven jedné. Důkaz Cameron-Martinovy věty: Chceme dokázat, že W (t) = W (t) + γt je standardní Wienerův proces vůči pravděpodobnostní míře Q, kde dQ dP (ω) = exp −γW (T, ω) − 1 2 γ2 T . Musíme dokázat vlastnosti Wienerova procesu vzhledem ke Q. Máme W (0) = W (0) + γ0 = 0. Spojitost trajektorií plyne ze spojitosti trajektorií W (t) a spojitosti funkce γt. Dále s využitím předchozího lemmatu dokážeme, že W (t) má vůči Q rozdělení N (0, t). Víme, že moment generující funkce určuje jednoznačně 71 pravděpodobnostní rozdělení. Vypočteme moment generující funkce W(t) vůči Q, EQ eθW(t) = EP dQ dP eθW(t) = EP e−γW(T)−1 2 γ2T+θ(W(t)+γt) = = e−1 2 γ2T+θγt EP e−γW(T)+θW(t) = e−1 2 γ2T+θγt EP e−γ(W(T)−W(t))−γW(t)+θW(t) . Víme, že W (t) a W (T)−W (t) jsou nezávislé (z definice Wienerova procesu). Tedy e−1 2 γ2T+θγt EP e−γ(W(T)−W(t))−γW(t)+θW(t) = = e−1 2 γ2T+θγt EP e−γ(W(T)−W(t)) EP e(θ−γ)W(t) . Použitím předchozího lemmatu s hodnotami σ2 = t respektive σ2 = T − t, je tedy výraz roven e−1 2 γ2T+θγt e γ2 2 (T−t) e (θ−γ)2 2 t = e θ2t 2 , neboť − 1 2 γ2 T + θγt + γ2 2 T − γ2 2 t + θ2 2 t − θγt + γ2 2 t = θ2 2 t. To je ale moment generující funkce N (0, t). Zcela analogicky se dokáže, že W (s) − W (t) má rozdělení N (0, s − t) pro s > t vůči Q. 8.3 Girsanovova věta Girsanovova věta zobecňuje Cameron-Martinovu větu na případ obecného driftu. 72 Věta 8.3.1. (Girsanov): Nechť W (t, ω), 0 ≤ t ≤ T je Wienerův proces na (Ω, A, P). Nechť γ (t, ω) je adaptovaný proces vzhledem k historii Wienerova procesu, pro který EP exp 1 2 T 0 γ (t) dt < ∞. Pak existuje pravděpodobnostní míra Q na (Ω, A) taková, že platí Q ∼ P, dQ dP (ω) = exp − T 0 γ (t, ω) dW (t, ω) − 1 2 T 0 γ2 (t, ω) dt a W (t, ω) = W (t, ω) + T 0 γ (s, ω) ds je Wienerův proces vzhledem ke Q. Věta 8.3.2. (obrácená Girsanovova věta): Nechť W (t, ω), 0 ≤ t ≤ T je Wienerův proces na (Ω, A, P). Nechť Q ∼ P. Pak existuje adaptovaný proces γ (t, ω) takový, že W (t, ω) = W (t, ω) + t 0 γ (s, ω) ds je Wienerův proces na (Ω, A, Q). Navíc dQ dP = exp − T 0 γ (t, ω) dW (t, ω) − 1 2 T 0 γ2 (t, ω) dt . 73 Kapitola 9 Odvození Black-Scholesovy rovnice Black-Scholesova rovnice je důsledkem modelu vývoje ceny akcie pomocí Wienerova procesu. Předpokládejme, že pohyb ceny akcie je popsán geometrickým Wienerovým procesem, dS = µSdt + σSdW, neboli dS S = µdt + σdW. Použijeme Itôovo lemma na funkci G (S, t) = lnS . Máme ∂G ∂t = 0, ∂G ∂S = 1 S a ∂2G ∂S2 = 1 S2 . Tedy z Itôova lemmatu dG = µ − σ2 2 dt + σdW a d (ln S) = µ − σ2 2 dt + σdW. Z toho plyne, že ln ST − ln S0 má normální rozdělení se střední hodnotou µ − σ2 2 T a rozptylem σ2 T. Tedy ln ST ∼ N ln S0 + µ − σ2 2 T; σ2 T . ST má tedy lognormální rozdělení (ln ST má normální rozdělení). 74 9.1 Black-Scholesova rovnice V této podkapitole připomeneme odvození Black-Scholesovy rovnice. Budeme předpokládat existenci bezrizikového aktiva s úrokovou mírou r. Vyjdeme z rovnice pro cenu akcie, která sleduje geometrický Wienerův proces dS = µSdt + σSdW. (9.1) Nechť V je cena evropské call opce s danou realizační cenou K a časem expirace T. Zisk z takové opce v čase T je tedy (ST − K)+. V závisí na S a t a je tedy funkcí dvou proměnných V (S, t). Hodnota V (S, t) je cena opce v čase t v situaci, kdy cena akcie je rovna S. Z Itôova lemmatu máme dV = ∂V ∂t dt + ∂V ∂S dS + 1 2 ∂2 V ∂S2 (dS)2 . Za dS dosadíme ze 9.1, tedy dV = ∂V ∂t dt + ∂V ∂S (µSdt + σSdW) + 1 2 ∂2 V ∂S2 (µSdt + σSdW)2 . Podle Itôova lemmatu (dt)2 a dtdW jsou členy vyššího řádu za které dosadíme nulu, zatímco (dW)2 = dt. Dostáváme tedy dV = ∂V ∂t + ∂V ∂S µS + 1 2 ∂2 V ∂S2 σ2 S2 dt + ∂V ∂S σSdW. (9.2) Vhodnou kombinací 9.1 a 9.2 můžeme sestavit portfolio z akcií a opcí, jehož výnos za čas dt je deterministický. Jinak řečeno, můžeme eliminovat stochastický člen dW. Označme Π hodnotu portfolia složeného z 1 opce a −∂V ∂S akcie, tedy Π = − ∂V ∂S S + 1V Pro přírůstek hodnoty portfolia za čas dt máme: dΠ = − ∂V ∂S dS + 1df. 75 Po dosazení z 9.1 dostaneme dΠ = − ∂V ∂S µS + ∂V ∂t + ∂V ∂S µS + 1 2 ∂2 V ∂S2 σ2 S2 dt, stochastický člen se vyruší. dΠ se musí (z neexistence arbitráže) rovnat zisku z bezrizikového aktiva s úrokovou mírou r, tedy dΠ = rΠdt. Dosazením dostaneme ∂V ∂t + 1 2 ∂2 V ∂S2 σ2 S2 dt = r − ∂V ∂S S + V dt, tedy ∂V ∂t + 1 2 ∂2 V ∂S2 σ2 S2 + ∂V ∂S Sr = rV. To je Black-Scholesova parciální diferenciální rovnice. Po vhodných transformacích proměnných dostaneme rovnici vedení tepla (rovnici difuze) ∂V ∂t = ∂2 V ∂S2 Řešením společně s příslušnou podmínkou (známe hodnotu V (T) = (ST − K)+) dostaneme Black-Scholesův vzorec. 76 Kapitola 10 Black-Scholesův model V této kapitole odvodíme Black-Scholesův vzorec za obecnějšího předpokladu než v minulé kapitole. Budeme uvažovat úrokovou míru měnící se v čase. 10.1 Předpoklady Black-Scholesova modelu Předpokládejme, že na trhu existují dvě aktiva, • bezrizikový dluhopis, jehož cena v čase t je Bt. • riziková akcie, jejíž cena v čase t je St. S0 je cena v současnosti, tedy známá hodnota. Dluhopis má známou úrokovou míru rt, kde rt je deterministická funkce času. Tedy cena dluhopisu Bt v čase t splňuje dBt dt = rtBt. Řešením (separací proměnných) dostaneme: dBt Bt = rtdt. Tedy ln Bt = rtdt a Bt = exp t 0 rsds . Cena podílu akcie se řídí stochastickou diferenciální rovnicí tvaru 77 dSt = µtStdt + σStdWt (10.1) kde Wt je standardní Wienerův proces, µt je deterministická funkce času a σ > 0 je konstanta nazývaná volatilita akcie. 10.2 Rovnovážná pravděpodobnostní míra Vyjdeme z předpokladu neexistence arbitráže. Věta 10.2.1. (Základní věta arbitrážní teorie): Pokud neexistuje na trhu arbitráž, potom existuje rovnovážná (risk-neutrální) pravděpodobnostní míra na prostoru tržních scénářů, vůči níž je proces diskontované ceny akcie martingal. Speciálně S∗ 0 = E (S∗ t ) , kde S∗ t je diskontovaná cena v čase t. Věta 10.2.2. Nechť koeficient driftu µt je omezený. Pak stochastická diferenciální rovnice (10.1) má řešení St = S0 exp σWt − σ2 2 t + t 0 µsds . Navíc, vzhledem k risk-neutrální míře musí platit rt = µt. Důkaz: Použijeme Itôovu formuli na funkci g (x, t) = exp σx − σ2 2 t + t 0 µsds a podkladový proces X = W. Pro S = g (x, t) dostaneme dS = σSdW + µtSdt. Tedy S řeší rovnici (10.1). Dále víme, že vzhledem k risk-neutrální míře diskontovaný proces ceny akcie musí být martingal. Diskontovací faktor je cena bezrizikového dluhopisu Bt, tedy 78 S∗ t = St Bt = exp σWt − σ2 2 t + t 0 µsds exp t 0 rsds = exp σWt − σ2 2 t + t 0 (µs − rs) ds . Dále, stejnou aplikací Itôova lemmatu dostaneme, že S∗ t splňuje stochastickou diferenciální rovnici dS∗ t = σS∗ t dWt + S∗ t (µt − rt) dt. Víme, že S∗ t je martingal právě tehdy, když koeficient u dt je identicky roven nule, tedy rt = µt pro všechna t. Důsledek 10.2.3. Vzhledem k rovnovážné pravděpodobnostní míře (tedy pro rt = µt) logaritmus diskontované ceny akcie S∗ t v čase t má normální rozdělení se střední hodnotou ln S0 − σ2 2 t a rozptylem σ2 t. 10.3 Odvození Black-Scholesova vzorce pro evropskou call opci Evropská call opce na akcii s realizační cenou K a časem expirace T dává majiteli právo koupit v čase T akcii za cenu K. Tedy hodnota opce v čase T je VT = (ST − K)+ = ST − K pro ST ≥ K 0 pro ST < K Zajímá nás současná cena opce V0. Podle základní věty arbitrážní teorie plyne, že pokud na trhu neexistuje arbitráž, pak cena opce v čase t = 0 musí být rovna diskontovanému očekávání vzhledem k rovnovážné pravděpodobnostní míře její hodnoty v čase T. Podle předchozí věty tedy platí V0 (S0, K, T) = EQ S∗ T − K BT + , kde S∗ T = ST BT , BT je cena dluhopisu v čase T a S∗ T má rozdělení podle důsledku předchozí věty vzhledem k risk neutrální míře Q. Výpočtem očekávání dostaneme Black-Scholesův vzorec 79 V (S0, K, T) = S0φ (z) − K BT φ z − σ √ T , kde z = ln S0 BT K + σ2 T 2 σ √ T a φ je distribuční funkce normálního rozdělení: φ (z) = z −∞ 1 √ 2π e−x2 2 dx. Pro výpočet příslušného očekávání připomeňme že V0 = EQ S∗ T − K BT + , kde S∗ T = ST BT a ln S∗ T ∼ N ln S0 − σ2 2 T; σ2 t . Jinak řečeno, S∗ T = S0eX , kde X ∼ N −σ2 2 T; σ2 T . Tedy V0 = ∞ −∞ S0ex − K BT + 1 √ 2πσ2T e− x+ σ2 2 T 2 2σ2T dx Určíme skutečný obor integrace (kde je integrovaná funkce nenulová): S0ex − K BT ≥ 0 ⇐⇒ ex ≥ K S0BT ⇒ x ≥ ln K S0BT . Označme M = ln K S0BT . Pak V0 = S0 ∞ M ex 1 √ 2πσ2T e− x+ σ2 2 T 2 2σ2T dx − K BT ∞ M 1 √ 2πσ2T e− x+ σ2 2 T 2 2σ2T dx. V prvním integrálu doplníme v exponentu na čtverec: x − x + σ2 2 T 2 2σ2T = 2σ2 Tx − x + σ2 2 T 2 2σ2T = = 2σ2 Tx − x2 − 2xσ2 2 T − σ2T 2 2 2σ2T = − x − σ2T 2 2 2σ2T 80 a dostáváme: V0 = S0 ∞ M 1 √ 2πσ2T e− x− σ2T 2 2 2σ2T dx − K BT ∞ M 1 √ 2πσ2T e− x+ σ2 2 T 2 2σ2T dx = = S0P (Z1 ≥ M) − K BT P (Z2 ≥ M) , kde Z1 ∼ N 1 2 σ2 T; σ2 T a Z2 ∼ N − 1 2 σ2 T; σ2 T . Tedy celkem V0 = S0P Z1 − 1 2 σ2 T σ √ T ≥ M − 1 2 σ2 T σ √ T − K BT P Z2 + 1 2 σ2 T σ √ T ≥ M + 1 2 σ2 T σ √ T S využitím 1 − φ (M) = φ (−M) dostaneme: V0 = S0φ −M + 1 2 σ2 T σ √ T − K BT φ −M − 1 2 σ2 T σ √ T , což už je Black-Scholesův vzorec. 81 Kapitola 11 Rovnice vedení tepla a Wienerův proces 11.1 Řešení rovnice vedení tepla na přímce Budeme se zabývat rovnicí vedení tepla na přímce, ut(x, t) = uxx(x, t) pro x ∈ R a t ≥ 0, kde u(x, t) je teplota v bodě x a čase t. Teplota v počátečním čase je známa, je daná počáteční podmínkou u(x, 0) = ψ(x). Pro každé pevné t > 0 budeme uvažovat Fourierovu transformaci funkce u v proměnné x. Na jedné straně máme ( ∂2u ∂x2 )(ξ, t) = (iξ)2 ˆu(ξ, t), na druhé straně t hraje při integraci v definici Fourierovy transformace roli parametru, tedy je ( ∂u ∂t )(ξ, t) = ∂ˆu ∂t (ξ, t). Transformovaná rovnice má tedy tvar ∂ˆu ∂t (ξ, t) = −ξ2 ˆu(ξ, t). 82 Pro pevné ξ je to obyčejná diferenciální rovnice v proměnné t, kterou umíme vyřešit, ˆu(ξ, t) = Ce−ξ2t , kde C = ˆu(ξ, 0). Z počáteční podmínky tedy C = ˆψ(ξ). Celkem ˆu(ξ, t) = ˆψ(ξ)e−ξ2t . Zpětnou transformací, podle pravidla o transformaci konvoluce dostaneme u(x, t) = (ψ ∗ Gt)(x, t), kde Gt(x) je zpětná transformace funkce e−ξ2t . Tu najdeme ze znalosti transformace Gaussovy funkce a lemmatu o transformaci po změně měřítka, kde vezmeme R = 1√ 2t . Dostaneme tedy Gt(x) = 1 √ 4πt e−x2 4t , což je tzv. Gaussovo jádro. Řešení počáteční úlohy pro rovnici vedení tepla má tedy tvar u(x, t) = 1 √ 4πt ∞ −∞ e− (x−y)2 4t ψ(y)dy. 11.2 Souvislost řešení rovnice vedení tepla a Wienerova procesu Z definice Wienerova procesu víme, že P {W (t + s) = y | W (s) = x} ∼ 1 √ 2πt e− (y−x)2 2t . Tato funkce je zároveň Gaussovo jádro pro modifikovanou rovnici vedení tepla (s konstantou 1 2 před druhou derivací). Věta 11.2.1. Nechť f : R→ R je omezená funkce. Pak jednoznačné řešení u (t, x) počáteční úlohy pro rovnici vedení tepla: ∂u ∂t = 1 2 ∂2 u ∂x2 83 kde u (t, x) je teplota v bodě x a čase t a u (0, x) = f (x) je počáteční podmínka, je rovno u (t, x) = Ef (Wx t ) = ∞ −∞ Pt (x, y) f (y) dy, kde Pt (x, y) je Gaussovo jádro: Pt (x, y) = 1 √ 2πt e− (y−x)2 2t a Wx t je Wienerův proces začínající v bodě x (místo nuly). Důkaz: Stačí dokázat, že Pt (x, y) řeší rovnici vedení tepla (*) pro každé y. To, že konvoluce s počáteční podmínkou (tedy vlastně lineární kombinace těchto řešení) je také řešení pak plyne derivováním integrálu podle parametru. Máme ∂ ∂t (Pt (x, y)) = 1 √ 2π − 1 2 (t)−3 2 e− (x−y)2 2t + 1 √ 2πt e− (x−y)2 2t t−2 − (x − y)2 2 ∂ ∂x (Pt (x, y)) = 1 √ 2πt e− (x−y)2 2t − x − y t ∂2 ∂x2 (Pt (x, y)) = 1 √ 2πt e− (x−y)2 2t − x − y t 2 + 1 √ 2πt e− (x−y)2 2t − 1 t Tedy ∂2 ∂x2 (Pt (x, y)) = 2 ∂ ∂t (Pt (x, y)) Splnění počáteční podmínky plyne okamžitě z definice funkce u. 11.3 Feynman-Kacova formule Uvažujme parciální diferenciální rovnici: 84 ∂f ∂t + µ (x, t) ∂f ∂x + 1 2 σ2 (x, t) ∂2 f ∂x2 = 0 (tzv. zpětná Kolmogorova rovnice). s koncovou podmínkou f (x, T) = ψ (x) , kde µ, σ, ψ jsou dané funkce a T je pevně daný čas, T > 0. Pro µ ≡ 0 a σ2 ≡ 1 dostaneme ∂f ∂t = − 1 2 ∂2 f ∂x2 tedy zpětnou rovnici vedení tepla. Věta 11.3.1. (Feynman-Kac): Řešení je dáno očekáváním f (x, t) = E (ψ (XT ) | Xt = x) , kde X je Itôův proces daný rovnicí dX = µ (X, t) dt + σ (X, t) dW. Důkaz: Nechť f je řešení parciální diferenciální rovnice. Použijeme Itôovo lemma na funkci f (x, t) a podkladový proces X. Dostaneme df (X, t) = µ (X, t) ∂f ∂x + ∂f ∂t + 1 2 σ2 (X, t) ∂2 f ∂x2 dt + σ (X, t) ∂f ∂x dW, kde µ (X, t) ∂f ∂x + ∂f ∂t + 1 2 σ2 (X, t) ∂2 f ∂x2 = 0, neboť f řeší parciální diferenciální rovnici. Dále integrováním dostaneme T t df = f (XT , T) − f (Xt, t) = T t σ (X, t) ∂f ∂x dW. Vezmeme očekávání (za podmínky Xt = x). Víme, že 85 E T t σ (X, t) ∂f ∂x dW = 0 (základní vlastnost Itôova integrálu) Tedy ze vztahu E (f (XT , T) − f (Xt, t)) = 0 máme f (x, t) = E [f (Xt, t) | Xt = x] = E [f (XT , T) | Xt = x] = E [ψ (XT ) | Xt = x] , což jsme chtěli dokázat. 86 Kapitola 12 Pravděpodobnostní rozdělení se silnými chvosty V této kapitole se budeme věnovat distribucím se silnými chvosty. V BlackScholesově modelu je předpoklad normality rozdělení zdůvodněn zejména centrální limitní větou. Připomeňme, že Black-Scholesův model má tři základní předpoklady: • lognormální rozdělení cen podkladového aktiva • spojitost trajektorií cen aktiva • nezávislost přírůstků cen za disjunktní časové intervaly Na druhé straně, empirické výsledky ukazují odchylky od těchto předpokladů: • silné chvosty pravděpodobnostních rozdělení • skoky v cenách aktiv (při příchodu důležité informace, při přerušení obchodování, ...) • krátkodobé korelace v pohybech cen (do cca 30 minut) 12.1 Charakterizace chvostů distribucí Jedním ze způsobů jak kvantitativně sílu chvostu charakterizovat je pomocí existence nebo neexistence momentů. Připomeňme, že k-tý obecný moment 87 je definován jako mk = R xk f(x)dx, (12.1) kde f(x) je hustota příslušné náhodné veličiny. Pokud mk existuje, tedy integrál je konečný, pak musí platit f(x) < 1 |x|n+1 (12.2) pro |x| → ∞. Pravděpodobnostní rozdělení se řídí tzv. mocninným zákonem, jestliže platí f(x) ≈ A± |x|n+1 (12.3) pro |x| → ∞ (tedy limita podílu obou stran je rovna jedné). V tom případě je zřejmě pro k ≥ n mk = ∞. (12.4) Speciálně pro n ≤ 2 distribuce nemá konečný rozptyl. Zřejmě musí vždy být n > 0, jinak by integrál z f(x) divergoval. 12.2 Charakterizace pomocí funkce přežití Připomeňme, že funkce přežití SX(x) náhodné veličiny X je definována jako pravděpodobnost, že X je větší než x, tedy SX(x) = P(X > x) = 1 − FX(x). Pro relativní míru síly chvostu, řekneme že X1 má lehčí chvost než X2 pokud podíl funkcí přežití X1 a X2 diverguje do nekonečna, tedy lim x→∞ SX1 SX2 = ∞. Pomocí L’Hospitalova pravidla můžeme vypočet limity redukovat na vztah pro hustoty náhodné veličiny, lim x→∞ SX1 SX2 = lim x→∞ SX1 SX2 = 88 = lim x→∞ −fX1 −fX2 . 12.3 Charakterizace pomocí funkce rizika Připomeňme, že funkce rizika (hazard rate function) hX(x) náhodné veličiny X je definována jako podíl hustoty a funkce přežití, tedy hX(x) = f(x) S(x) . Chování funkce rizika také úzce souvisí s chováním chvostů pravděpodobnostního rozdělení. Je-li funkce rizika pravděpodobnostního rozdělení rostoucí, má rozdělení lehké chvosty. Je-li klesající, pak má těžké chvosty. Obecně samozřejmě nemusí být ani rostoucí ani klesající, ale pro standardní rozdělení používaná v praxi tomu tak bude. Hraničním případem je exponenciální rozdělení, pro které je funkce rizika konstantní. Příklad 12.3.1. Jako příklad uveďme Paretovo rozdělení s parametry a, b, tedy s hustotou f(x) = aba (x + b)−a−1 . Funkce přežití je rovna S(x) = ba (x + b)−a . Celkem tedy h(x) = aba (x + b)−a−1 ba(x + b)−a = a x + b , což je zřejmě klesající funkce. Toto rozdělení má tedy těžké chvosty. Analogicky je možné charakterizovat chování chvostů pomocí funkce očekávané ztráty. Ta je definovaná vztahem eX(y) = E(X − y|X > y). Pokud je tato funkce klesající, má rozdělení těžký chvost, pokud je rostoucí, má lehký chvost. 89 12.4 Stabilní distribuce Lévyho rozdělení je speciální případ mocninného zákona, které má navíc vlastnost stability. Objevuje se proto v obecné verzi centrální limitní věty. Používají se při popisu “víceúrovňových jevů“, jako je velikost příjmu, amplituda zemětřesení, atd. Označme Lµ(x) hustotu Lévyho rozdělení s parametrem µ, kde µ ∈ [1, 2]. Platí Lµ(x) ≈ Aµ ± |x|µ+1 , (12.5) kde Aµ ± jsou konstanty popisující přesnou sílu pravého a levého chvostu. Pokud platí Aµ + = Aµ −, (12.6) pak mluvíme o symetrickém Lévyho rozdělení. Obecné Lévyho rozdělení pak charakterizuje ještě parametr asymetrie β = Aµ + − Aµ − Aµ + + Aµ − . (12.7) S výjimkou případu krajních hodnot a µ = 3 2 neexistuje pro hustotu analytické vyjádření. Jednoduchý popis ale existuje pro charakteristickou funkci. Pro krajní hodnoty parametru dostaneme nejdříve pro µ = 1 Cauchyho rozdělení s hustotou L1(x) = A x2 + π2A2 . (12.8) Pro charakteristickou funkci máme obecně následující popis, ˆLµ(ξ) = exp(−aµ|ξ|µ ), (12.9) kde aµ je konstanta úměrná konstantě Aµ. V limitě pro µ = 2 dostaneme Gaussovo rozdělení, pro které ˆL2(ξ) = exp(−cξ2 ). (12.10) Pokud součet n náhodných veličin se stejným rozdělením má opět totéž rozdělení, pak mluvíme o stabilní distribuci. Tato vlastnost je velmi silná a 90 vzácná. Stabilními distribucemi jsou právě Lévyho distribuce (včetně limitního případu Gaussovy distribuce). Lévyho distribuce má také vlastnost nekonečné dělitelnosti, jak uvidíme dále. 91 Kapitola 13 Lévyho procesy 13.1 Limitní rozdělení V obecné verzi centrální limitní věty, bez předpokladu konečnosti rozptylu, hrají stabilní distribuce zcela analogickou roli jako Gaussovo rozdělení hraje v klasickém případě. Stabilní distribuce, tedy Lévyho a Gaussova (jako limitní případ), jsou z definice pevnými body konvoluce. Pro jejich hustoty tedy platí, symbolicky zapsáno, f f = f. (13.1) Navíc ale také fungují jako ”atraktory” pro konvoluci. Libovolná distribuce při velkém počtu nezávislých sčítanců s tímto rozdělením konverguje ke stabilnímu rozdělení. To je obsah Centrální limitní věty. Pro IID náhodné veličiny s konečným rozptylem platí standardní Centrální limitní věta, limitní distribucí je Gaussovo rozdělení. Věta 13.1.1. Nechť Xi, i = 1, 2, . . . , je posloupnost nezávislých stejně rozdělených náhodných veličin s hustotou pravděpodobnosti f, kde ˆf ∈ C2 (R). Nechť E(Xi) = 0 a E(X2 i ) = 1. Pak hustota pravděpodobnosti X1 + · · · + Xn √ n se blíží k hustotě standardizovaného normálního rozdělení, t.j. Pr{a ≤ X1 + · · · + Xn √ n ≤ b} → 1 √ 2π b a e−x2 2 dx 92 pro n → ∞. Důležité při aplikaci této věty je mít na paměti, že chvosty součtu se mohou velmi lišit od chvostů normálního rozdělení. CLV dává aproximaci v centrální oblasti, o chování chvostů neříká nic. Chvosty konečného součtu jsou kvalitativně stále stejné jako pro jednotlivé sčítance. Poznamenejme, že tato verze CLV platí v daleko větší obecnosti. Na místo nezávislosti stačí předpokládat že korelace Xi a Xj klesají dostatečně rychle pro |i − j| → ∞ . Podobně lze oslabit i předpoklad stejného rozdělení. Stačí, aby rozptyly jednotlivých Xi si byly ”dostatečně podobné”. S vlastností atraktoru pro operaci konvoluce normálního rozdělení souvisí další významná vlastnost normálního rozdělení. Mezi všemi distribucemi s daným konečným rozptylem má normální rozdělení nejmenší Shannonovu informační entropii. Ta měří informační obsah daného pravděpodobnostního rozdělení, největší je pro konstantní náhodnou veličinu, kdy hodnotu známe s jistotou. Shannonova informační entropie je definována jako I(f) = − f(x) ln f(x)dx. (13.2) Minimalizace entropie těsně souvisí s tím že při sčítání náhodných veličin ztrácíme informaci. Z hodnoty součtu nemůžeme zjistit téměř nic o hodnotách jednotlivých sčítanců Pokud uvažujeme posloupnost IID náhodných veličin s mocninným zákonem s parametrem µ < 2, tedy s nekonečným rozptylem, pak limitní distribuce je Lévyho distribuce. 13.2 Lévyho procesy V této kapitole se budeme zabývat širokou třídou procesů, které poskytují přirozené zobecnění Wienerova procesu. Jejich hlavní výhodou je fakt že dovolují do pravděpodobnostního popisu vývoje cen aktiv zahrnout skoky a také rozdělení se silnými chvosty. Obě tyto vlastnosti jsou klíčové pro věrohodnost modelu. 93 Definice 13.2.1. Adaptovaný stochastický proces X se nazývá Lévyho proces, jestliže platí: 1. X0 = 0 2. X má přírůstky nezávislé na minulosti, tedy Xt − Xs je nezávislé na hodnotách procesu do času s 3. X má stacionární přírůstky, tedy Xt−Xs má stejné rozdělení jako Xt−s. 4. X je stochasticky spojitý, tedy pro každé a t ≥ 0 platí lim h→0 P(|Xt+h − Xt| ≥ ) = 0 (13.3) Věta 13.2.2. Nechť X je Lévyho proces. Pak existuje jednoznačně určená funkce ψ tak, že φXt (ξ) = etψ(ξ) (13.4) Funkce z předchozí věty se nazývá Lévyho exponent. Definice 13.2.3. X je nekonečně dělitelná náhodná veličina, jestliže pro každé N existují stejně rozdělené nezávislé náhodné veličiny X1, . . . , XN tak, že X = X1 + X2 + · · · + XN . S využitím charakteristické funkce můžeme otázku dělitelnosti převést na problém kdy je (ψX) 1 N charakteristická funkce nějakého pravděpodobnostního rozdělení. Věta 13.2.4. Nechť X je Lévyho proces. Pak Xt je nekonečně dělitelné pro každé t a platí φXt (ξ) = (φX t n (ξ))n (13.5) Příklad 13.2.5. V případě Wienerova procesu je Lévyho exponent zřejmě roven φXt (ξ) = e−t( ξ2 2 ) (13.6) tedy ψ(ξ) = − ξ2 2 (13.7) 94 Pro Wienerův proces s driftem a a volatilitou b dostaneme ψ(ξ) = −iaξ − b2 ξ2 2 (13.8) 95 13.3 Příklady Příklad 13.3.1. Vypočtěte šikmost a špičatost stejnoměrného rozdělení na intervalu (0, 1). Příklad 13.3.2. Odvoďte horní odhad na hodnotu špičatosti pro libovolné pravděpodobnostní rozdělení. Příklad 13.3.3. S využitím předchozích dvou úloh dokažte, že stejnoměrného rozdělení na intervalu (0, 1) není dělitelné. Příklad 13.3.4. Ukažte, že normální rozdělení je nekonečně dělitelné. Příklad 13.3.5. Vypočtěte Shannonovu entropii normálního rozdělení a exponenciálního rozdělení (v obou případech s rozptylem rovným jedné). Porovnejte oba výsledky. Příklad 13.3.6. Dokažte, že standardizované normální rozdělení minimalizuje Shannonovu entropii mezi všemi rozděleními s jednotkovým rozptylem a hladkou hustotou. 96 Kapitola 14 Bariérové opce Nejjednodušší typ opce, kde výplata závisí na celém vývoji ceny akcie, nikoliv jenom na ceně akcie v době realizace je bariérová opce. Máme čtyři základní typy bariérových opcí: • up and in ... opce je bezcenná, pokud hodnota akcie v čase [0, T] nepřekročí hodnotu A. • down and in ... opce je bezcenná, pokud hodnota akcie v čase [0, T] neklesne pod hodnotu a. • up and out ... opce je bezcenná, pokud hodnota akcie v čase [0, T] překročí hodnotu A. • down and out ... opce je bezcenná, pokud hodnota akcie v čase [0, T] klesne pod hodnotu a. 14.1 Binární bariérové opce Uvažujme pro konkrétnost opci typu up and in. Výplatní funkce nabývá pouze dvou hodnot. VT = 1 max t∈[0, T] St ≥ A = 1 pokud maxt∈[0, T] St ≥ A 0 jinak. Převedením na Wienerův proces bez driftu (pomocí Cameron-Martinovy věty) a použitím principu reflexe, vypočteme pravděpodobnost, že max W (t) ≥ A, kde A je aktivující bariéra, St je cena akcie v čase t. 97 Předpoklady jsou jako u Black-Scholesova modelu pro evropskou call opci s konstantní úrokovou mírou. Máme dvě aktiva, bezrizikový dluhopis, jehož cena v čase t je Bt a rizikovou akcii, jejíž cena v čase t je St a cena v čase 0 je S0, což je známá hodnota. Dluhopis má konstantní úrokovou míru r, tedy dBt dt = rBt ⇒ Bt = B0ert . Při odvozování Black-Scholesova vzorce jsme dokázali že St = S0 exp r − σ2 2 t + σW (t) vůči risk-neutrální míře P. Pro jednoduchost předpokládejme, že S0 = 1 a σ = 1. Toho lze docílit vhodnou volbou jednotek času a peněz. Tedy St = exp r − 1 2 t + W (t) . Hodnota opce v čase t = 0 je rovna diskontované očekávané hodnotě v čase T vůči míře P, tedy V0 = e−rt EP (Vt) = e−rt [0P (max0≤t≤T St < A) + 1P (max0≤t≤T St ≥ A)] = = e−rt P max0≤t≤T exp r − 1 2 t + W (t) ≥ A = = e−rt P max0≤t≤T r − 1 2 t + W (t) ≥ α , kde α = ln A. Označme W (t) = r − 1 2 t + W (t) = γt + W (t) Wienerův proces s driftem, kde γ = r − 1 2 . Pomocí Cameron-Martinovy věty najdeme pravděpodobnostní míru Q, vůči níž je W (t) standardní Wienerův proces. Podle Cameron-Martinovy věty máme pro Q: dP dQ = exp γW (T) + 1 2 γ2 T . Vůči Q je W standardní Wienerův proces, tedy W vůči Q se chová stejně jako W vůči P. Odtud dostáváme: 98 V0 = e−rt P (max0≤t≤T [γt + W (t)] ≥ α) = = e−rt EP 1 0 ≤ t ≤ TmaxW (t) ≥ α = = e−rt EQ exp γW (T) + 1 2 γ2 T 1 max0≤t≤T W (t) ≥ α = = e−rt EQ exp γ W (T) − γT + 1 2 γ2 T 1 max0≤t≤T W (t) ≥ α = = e−rt e−1 2 γ2T EQ exp γW (T) 1 0 ≤ t ≤ Tmax W (t) ≥ α = = e−rt e−1 2 γ2T EP [exp (γW (T)) 1 {max0≤t≤T W (t) ≥ α}] . Očekávání obsahuje pouze funkci standardního Wienerova procesu, můžeme tedy sestavit integrál popisující toto očekávání. Je-li max0≤t≤T W (t) < α, je očekávání nulové. Zaměřme se tedy pouze na případ max0≤t≤T W (t) ≥ α. Je-li W (T) ≥ α, pak max0≤t≤T W (t) ≥ α s jistotou. Pravděpodobnostní rozdělení W (T) je N (0, T), a tedy očekávání v tomto případě je rovno (substituce y = x − α, x = y + α, dx = dy) 1 √ 2πT ∞ α eγx e− x2 2T dx == 1 √ 2πT ∞ 0 eγ(y+α) e− (y+α)2 2T dy = = 1 √ 2πT eγα ∞ 0 eγy e− (y+α)2 2T dy. Ve druhém případě, pokud W (t) < α, víme z principu reflexe, že pokud max0≤t≤T W (t) ≥ α, pak W (T) má symetrické rozdělení okolo α. Tedy, je-li p (x) hustota W (T), pak platí p (x) = p (2α − x) 99 pro každé x. Tedy pokud W (t) < α, má eγW(T) očekávání (substituce y = x − α, x = y + α, dx = dy) 1 √ 2πT α −∞ eγx e− (2α−x)2 2T dx = 1 √ 2πT 0 −∞ eγ(y+α) e− (−y+α)2 2T dy = = 1 √ 2πT eγα 0 −∞ eγy e− (−y+α)2 2T dy = 1 √ 2πT eγα ∞ 0 e−γz e− (z+α)2 2T dz. Celkem tedy máme: EP eγW(T) 1 {max0≤t≤T W (t) ≥ α} = = 1 √ 2πT eγα e−γx + eγx e− (x+α)2 2T dx. Doplněním na čtverec dostaneme: 1 √ 2πT eγα ∞ 0 e−γx + eγx e− (x+α)2 2T dx = = eγα e γ2T 2 eγα φ −γT − α √ T + e−γα φ γT − α √ T , kde φ je distribuční funkce standardního normálního rozdělení N (0, 1). Dále, 1 √ 2πT eγα ∞ 0 e−γx + eγx e− (x+α)2 2T dx Nejprve doplníme na čtverec exponent prvního integrálu po roznásobení: −γx − (x + α)2 2T = −2Tγx − (x2 + 2xα + α2 ) 2T = = − x2 + (2α + 2Tγ) x + α2 2T = − (x + α + Tγ)2 − 2αTγ − Tγ2 2T Dostáváme tedy 1 √ 2πT eγα ∞ 0 e− (x+α+T γ)2 2T eαγ e T γ2 2 dx = 1 √ 2πT e2γα e T γ2 2 ∞ 0 e− (x+α+T γ)2 2T dx = = e2γα e T γ2 2 P (Z1 ≥ 0) , kde Z1 ∼ N (−α − Tγ; T). Dále, 100 P (Z1 ≥ 0) = P Z1 + α + Tγ √ T ≥ α + Tγ √ T = 1 − φ α + Tγ √ T = φ −α − Tγ √ T Celkem e2γα e T γ2 2 φ −α − Tγ √ T . Analogicky postupujeme pro druhý integrál. Nejprve doplníme na čtverec exponent druhého integrálu: γx − (x + α)2 2T = 2Tγx − (x2 + 2xα + α2 ) 2T = = − x2 + (2α − 2Tγ) x + α2 2T = − (x + α − Tγ)2 + 2αTγ − Tγ2 2T . Dostáváme tedy 1 √ 2πT eγα ∞ 0 e− (x+α−T γ)2 2T e−αγ e T γ2 2 dx = = 1 √ 2πT e T γ2 2 ∞ 0 e− (x+α−T γ)2 2T dx = e T γ2 2 P (Z2 ≥ 0) , kde Z2 ∼ N (−α + Tγ; T). Dále, P (Z2 ≥ 0) = P Z2 + α − Tγ √ T ≥ α − Tγ √ T = 1 − φ α − Tγ √ T = φ −α + Tγ √ T Celkem dostaneme e T γ2 2 φ Tγ − α √ T . Tedy e T γ2 2 e2γα φ −α − Tγ √ T + φ Tγ − α √ T = e T γ2 2 eαγ eγα φ −α − Tγ √ T + e−γα φ Tγ − α √ T 101 Tedy hodnota opce v čase t = 0 je rovna V0 = e−rt P (max0≤t≤T St ≥ A) = e−rt eγα eγα φ −γT − α √ T + e−γα φ γT − α √ T . 102 Literatura [1] Grimmett G., Stirzaker D.: Probability and Random Processes, Oxford University Press 2001 [2] Ross S.: Stochastic Processes, Wiley 1996 [3] Strauss, W.: Partial Differential Equations, Wiley 1992 [4] Körner T.: Fourier Analysis, Oxford University Press 2004 [5] Hull J. C.: Options, Futures and Other Derivatives, Prentice Hall 2012 [6] Melicherčík I., Olšarová L., Úradníček V.: Kapitoly z finančnej matematiky, EPOS Bratislava 2005 [7] Bouchaud P., Potters, M.: Theory of Financial Risk and Derivative Pricing: From Statistical Physics to Risk Management, Cambridge University Press 2003 [8] Willmott P., Howison S., Dewynne, J.: The Mathematics of Financial derivatives, A Student Introduction, Cambridge University Press 1996 [9] Klugman S., Panjer H., Willmot G.: Loss Models: From Data to Decisions, Wiley 2006 [10] Ševčovič D., Stehlíková B., Mikula K.: Analytické a numerické metódy oceňovania finančných derivátov, Slovenská technická univerzita 2009 [11] Etheridge A.: A Course in Financial Calculus, Cambridge University Press 2002 103 [12] Baxter M., Rennie A.: Financial Calculus: An Introduction to Derivative Pricing, Cambridge University Press 1996 [13] Wilmott P.: Paul Wilmott on Quantitative Finance, 3 Volume Set, Wiley 2006 [14] Wilmott P.: Frequently Asked Questions in Quantitative Finance, Wiley 2007 104