M7180 Funkcionálna analýza II Derivovanie v Banachových priestoroch Peter Šepitka zima 2021 Obsah 1 Slabá a silná derivácia zobrazenia 2 Derivovanie konvexných zobrazení 3 Dotykový funkcionál a hladké priestory Derivácia Konvexnosť Hladkosť Obsah 1 Slabá a silná derivácia zobrazenia 2 Derivovanie konvexných zobrazení 3 Dotykový funkcionál a hladké priestory Derivácia Konvexnosť Hladkosť Pojem derivácie zobrazenia Definícia 1 (Derivácia v smere vektora) Nech X a Y sú Banachove priestory, G ⊆ Y otvorená množina a f : G → Y dané zobrazenie. Hovoríme, že f má v bode x ∈ X deriváciu v smere vektora h ∈ X \ {0}, ak existuje v priestore Y limita lim λ→0 f(x + λh) − f(x) λ . (1) Limitu v (1) potom označujeme symbolom Dhf(x). Definícia 2 (Slabá (Gâuteauxova) derivácia) Nech X a Y sú Banachove priestory a f : G → Y zobrazenie definované na danej otvorenej množine G ⊆ X. Ak pre dané x ∈ G má zobrazenie f deriváciu Dhf(x) v každom smere h ∈ X \ {0} a priradenie h → Dhf(x) je spojitý lineárny operátor z X do Y , potom hovoríme, že zobrazenie f má v bode x slabú (Gâuteauxovu) deriváciu, resp. f je v bode x slabo (gâuteauxovsky) diferencovateľné. Spojitý lineárny operátor df(x) definovaný predpisom [df(x)]h := Dhf(x), h ∈ X, (2) sa nazýva slabá (Gâuteauxova) derivácia zobrazenia f v bode x. Derivácia Konvexnosť Hladkosť Definícia 3 (Silná (Fréchetova) derivácia) Nech X a Y sú Banachove priestory a f : G → Y zobrazenie definované na danej otvorenej množine G ⊆ X. Ak pre dané x ∈ G existuje spojitý lineárny operátor L : X → Y s vlastnosťou lim h→0 f(x + h) − f(x) − Lh h X = 0, (3) potom hovoríme, že zobrazenie f má v bode x silnú (Fréchetovu) deriváciu, resp. f je v bode x silne (fréchetovsky) diferencovateľné. Operátor L sa nazýva silná (Fréchetova) derivácia, resp. totálny diferenciál, zobrazenia f v bode x a označuje sa symbolom f′ (x). Poznámka 1 (Silná (Fréchetova) derivácia) Spojitý lineárny operátor L v Definícii 3 je určený jednoznačne. Skutočne, ak L1, L2 : X → Y sú spojité lineárne operátory spĺňajúce podmienku (3), potom lim h→0 L1h − L2h h X = 0, pričom pre h := αu, α ∈ R+ , máme lim α→0 L1u − L2u u X = 0 pre každý daný nenulový vektor u ∈ X. Z poslednej rovnosti a z linearity L1 a L2 nutne vyplýva, že L1u = L2u pre každé u ∈ X. Preto operátory L1 = L2. Derivácia Konvexnosť Hladkosť Lema 1 Nech X a Y sú Banachove priestory f : G → Y zobrazenie definované na danej otvorenej množine G ⊆ X. Ak pre dané x ∈ G má zobrazenie f silnú deriváciu f′ (x), potom existuje i slabá derivácia df(x) a platí df(x) = f′ (x). Dôkaz Lemy 1. Pedpokladajme, že zobrazenie f má v bode x ∈ G silnú deriváciu f′ (x). Nech h ∈ X \ {0} a λ ∈ C \ {0} sú dané, pričom λ = |λ|eiϕ , ϕ ∈ [0, 2π). Uvažujme výraz v (1) a postupne ho vhodne upravujme s ohľadom na (3), t.j., f(x + λh) − f(x) λ = f(x + λh) − f(x) λh X e−iϕ h X = f(x + λh) − f(x) − [f′(x)](λh) λh X + [f′(x)](λh) λh X e−iϕ h X = f(x + λh) − f(x) − [f′(x)](λh) λh X e−iϕ h X + [f′ (x)]h. Keďže podľa (3) s L := f′ (x) prvý člen v poslednom výraze pre λ → 0 konverguje do nuly, máme limλ→0 f(x+λh)−f(x) λ = [f′ (x)]h. V súlade s Definíciou 2 má teda zobrazenie f v bode x slabú deriváciu df(x) a platí df(x) = f′ (x). Derivácia Konvexnosť Hladkosť Poznámka 2 Poznamenajme, že opačné tvrdenie vo všeobecnosti neplatí, t.j., gâuteauxovská diferencovateľnosť zobrazenia f nemusí nutne implikovať jeho fréchetovskú diferencovateľnosť. Jednoduché protipríklady môžeme nájsť už v základnom kurze matematickej analýzy reálnych funkcií viac (reálnych) premenných, t.j., v prípade konečnorozmerných priestorov X a Y . Napríklad nie je ťažké ukázať, že reálna funkcia f : R2 → R definovaná predpisom f(x, y) :=    x2 y x2+y2 , [x, y] = [0, 0], 0, [x, y] = [0, 0], má v bode [0, 0] slabú deriváciu df(0, 0), t.j., deriváciu Dhf(0, 0) v smere každého nenulového vektora h ∈ R2 , ale nie je diferencovateľná v tomto bode, t.j., neexistuje silná derivácia f′ (0, 0). Poznámka 3 V prípade priestoru Y = C je skúmané zobrazenie f : X → Y funkcionál. Ak v bode x ∈ X má f slabú deriváciu df(x), potom zrejme v súlade s Definíciou 2 je zobrazenie df(x) spojitý lineárny funkcionál na X, t.j., df(x) ∈ X′ . Derivácia Konvexnosť Hladkosť Príklad 1 Uvažujme X = C[0, 1], Y = R a zobrazenie f : X → Y definované predpisom f(x) := 1 0 x2 (t) dt, x ∈ X. (4) Ukážeme, že f má slabú deriváciu na celom priestore X. Zvoľme dané x ∈ X a identicky nenulovú funkciu h ∈ X. Pre smerovú deriváciu Dhf(x) platí Dhf(x) (1),(4) = lim λ→0 1 0 [x(t) + λh(t)]2(t) dt − 1 0 x2(t) dt λ = lim λ→0 1 0 [2x(t) h(t) + λh2 (t)] dt = 2 1 0 x(t) h(t) dt. (5) Derivácia Dhf(x) existuje v každom smere h, pričom priradenie h → Dhf(x) je zrejme lineárny funkcionál na X. Naviac, pre každé h ∈ X máme |Dhf(x)| (5) = 2 1 0 x(t) h(t) dt ≤ 2 1 0 |x(t)| |h(t)| dt ≤ 2 h X 1 0 |x(t)| dt, čo znamená, že sa jedná o lineárny ohraničený, a teda lineárny spojitý funkcionál. Podľa Definície 2 má teda zobrazenie f v bode x slabú deriváciu df(x) tvaru Derivácia Konvexnosť Hladkosť Príklad 1 [df(x)]h (5) = 2 1 0 x(t) h(t) dt, h ∈ X. (6) Dokážeme, že funkcionál df(x) v (6) je dokonca silná derivácia zobrazenia f v bode x. Pomocou (4) a (6) máme lim h→0 f(x + h) − f(x) − [df(x)]h h X (4),(6) = lim h→0 1 0 h2(t) dt h X (7) Limita v (7) existuje a je nulová, nakoľko platí 0 ≤ 1 0 h2(t) dt h X = 1 0 |h(t)|2 dt h X ≤ 1 0 h 2 X dt h X = h X → 0 pre h → 0. Preto podľa Definície 3 funkcionál df(x) = f′ (x) pre každé x ∈ X. Poznámka 4 Nech X a Y sú Banachove priestory a G ⊆ X je otvorená množina. Dá ukázať, že zobrazenie f : G → Y má silnú deriváciu v bode x ∈ G práve vtedy, keď lim λ→0 f(x + λh) − f(x) λ = [df(x)]h existuje rovnomerne vzhľadom na h ∈ SX [0, 1]. Derivácia Konvexnosť Hladkosť Príklad 2 Nech X je reálny Hilbertov piestor. Ukážeme, že v každom nenulovom vektore x ∈ X má norma · X : X → R priestoru X (generovaná odpovedajúcim skalárnym súčinom) silnú deriváciu tvaru x ′ X h = h, 1 x X x , h ∈ X. (8) Zvoľme pevné x ∈ X \ {0}. Potom pre každý nenulový vektor h ∈ X a každé nenulové číslo λ ∈ R platí x + λh X − x X λ = ( x + λh X − x X ) · ( x + λh X + x X ) λ ( x + λh X + x X ) = x + λh 2 X − x 2 X λ ( x + λh X + x X ) = |λ|2 h 2 X + 2λ h, x λ ( x + λh X + x X ) , (9) z čoho ihneď vyplýva relácia lim λ→0 x + λh X − x X λ (9) = lim λ→0 |λ|2 h 2 X + 2λ h, x λ ( x + λh X + x X ) = h, 1 x X x (10) pre každé nenulové h ∈ X. Zo znalosti duálneho priestoru X′ môžeme následne usúdiť, že podľa Definície 2 má norma · X v bode x slabú deriváciu tvaru Derivácia Konvexnosť Hladkosť Príklad 2 [d x X ]h = h, 1 x X x , h ∈ X. (11) Naviac, limita v (10) existuje rovnomerne vzhľadom na vektory h ∈ SX[0, 1]. Zaveďme pre každé dané h ∈ SX [0, 1] a dané λ ∈ R \ {0} označenie V (h) := x + λh X − x X λ − h, 1 x X x . (12) Potom postupne pre h ∈ SX [0, 1] a λ ∈ R \ {0} dostávame V (h) (12),(9) = |λ|2 h 2 X + 2λ h, x λ ( x + λh X + x X ) − h, 1 x X x = |λ|2 λ ( x + λh X + x X ) + h, x 2 x + λh X + x X − 1 x X = |λ|2 λ ( x + λh X + x X ) + h, x x X − x + λh X x X · ( x + λh X + x X ) ≤ |λ| x + λh X + x X + | h, x | | x X − x + λh X | x X · ( x + λh X + x X ) (13) Derivácia Konvexnosť Hladkosť Príklad 2 Vhodnou aplikáciou trojuholníkovej nerovnosti získame x + λh X + x X ≥ 2 x X − |λ|, | x X − x + λh X | ≤ |λ| (14) pre každé h ∈ SX [0, 1] a λ ∈ R. Uvažujúc |λ| < 2 x X máme V (h) (13) ≤ |λ| x + λh X + x X + | h, x | | x X − x + λh X | x X · ( x + λh X + x X ) (14) ≤ |λ| 2 x X − |λ| + | h, x | |λ| x X · (2 x X − |λ|) ≤ |λ| 2 x X − |λ| + x X |λ| x X · (2 x X − |λ|) = 2|λ| 2 x X − |λ| (15) pre každé h ∈ SX [0, 1]. Poznamenajme, že pri prechode na posledný riadok sme využili Cauchyho–Schwarzovu–Buňakovského nerovnosť | h, x | ≤ h X · x X = x X . Kombináciou (12) a (15) napokon dostávame pre každé h ∈ SX[0, 1] reláciu x + λh X − x X λ − h, 1 x X x (12),(15) ≤ 2|λ| 2 x X − |λ| → 0 pre λ → 0. Derivácia Konvexnosť Hladkosť Príklad 2 To dokazuje, že limita v (10) existuje rovnomerne vzhľadom na h ∈ SX[0, 1]. Podľa Poznámky 4 následne platí, že norma · X má skutočne v každom nenulovom vektore x ∈ X silnú deriváciu, pričom platí rovnosť (8). V bode x = 0 nemá norma · X ani slabú deriváciu, nakoľko pre vektor h = 0 limita lim λ→0 0 + λh X − 0 X λ = lim λ→0 |λ| λ h X neexistuje. Príklad 3 Je dôležité poznamenať, že v Banachových priestoroch nemusí byť norma fréchetovsky diferencovateľná. Napríklad v priestore X = l1 nemá odpovedajúca norma · 1 silnú deriváciu v žiadnom bode x ∈ X. Na druhej strane, slabá derivácia normy existuje práve v bodoch {xn}∞ n=1 ∈ X s vlastnosťou xn = 0 pre každé n ∈ N. V tomto prípade sa dá ukázať, že platí [d x 1]{hn}∞ n=1 = ∞ n=1 sg (xn) hn pre každé {hn}∞ n=1 ∈ X. (16) Zobrazenie v (16) je zrejme definované korektne na celom priestore X. Naviac sa jedná o spojitý lineárny funkcionál na X, keďže duálny priestor X′ ≃ l∞ . Derivácia Konvexnosť Hladkosť Obsah 1 Slabá a silná derivácia zobrazenia 2 Derivovanie konvexných zobrazení 3 Dotykový funkcionál a hladké priestory Derivácia Konvexnosť Hladkosť Konvexné funkcie V tejto sekcii sa budeme zaoberať výhradne reálnymi funkciami (zobrazeniami), t.j., funkcionálmi f : X → R, kde X je reálny Banachov priestor. Definícia 4 (Konvexná funkcia) Nech X je Banachov priestor a G ⊆ X je daná konvexná množina. Zobrazenie f : G → R sa označuje ako konvexné na G, ak pre každé dva body x, y ∈ X a každé λ ∈ [0, 1] platí nerovnosť f(λx + (1 − λ)y) ≤ λf(x) + (1 − λ)f(y). (17) Príklad 4 Základnými príkladmi konvexných funkcií na Banachovom priestore X je každá norma na X a každý sublineárny funkcionál na X, t.j., funkcionál f : X → R spĺňajúci f(αx+βy) ≤ αf(x)+βf(y) pre každé x, y ∈ X a pre každé α, β ∈ R. (18) Ďalším dôležitým príkladom konvexnej funkcie je konvexný funkcionál na X. Pripomeňme, že sa jedná o zobrazenie p : X → R s vlastnosťami p(λx) = λp(x), x ∈ X, λ ∈ [0, ∞), p(x + y) ≤ p(x)+ p(y), x, y ∈ X. (19) Derivácia Konvexnosť Hladkosť Veta 1 Nech X je Banachov priestor a G ⊆ X je otvorená konvexná množina. Nech f : G → R je konvexná funkcia, ktorá je ohraničená na okolí daného bodu x0 ∈ G. Potom existujú kladné konštanty L a δ také, že |f(x) − f(y)| ≤ L x − y X pre každú dvojicu vektorov x, y ∈ BX (x0, δ) ⊆ G. (20) Poznámka 5 Tvrdenie Vety 1 možno formulovať i v tvare, že každá funkcia, ktorá je konvexná a lokálne ohraničená na konvexnej množine G ⊆ X, je na G lokálne lipschitzovská. Dôkaz Vety 1. Z predpokladov tvrdenia vyplýva existencia kladných čísiel M a δ s vlastnosťou |f(x)| ≤ M, x ∈ BX (x0, 2δ) ⊆ G. (21) Zvoľme pevne rôzne vektory x, y ∈ BX (x0, δ) ⊆ BX (x0, 2δ) a definujme α := x − y X > 0, z := y + δ α (y − x). (22) Nie je ťažké ukázať, že vektor z v (22) spĺňa vlastnosti Derivácia Konvexnosť Hladkosť Dôkaz Vety 1 (pokračovanie). (i) z − x0 X ≤ 2δ, t.j., z ∈ BX (x0, 2δ), a tak podľa (21) platí |f(z)| ≤ M, (ii) vektor y je konvexnou lineárnou kombináciou x a z, konkrétne platí y (22) = δ α + δ x + α α + δ z. (23) Preto v súlade s konvexnosťou funkcie f máme nerovnosť f(y) (23) = f δ α + δ x + α α + δ z (17) ≤ δ α + δ f(x) + α α + δ f(z), a následne f(y) − f(x) ≤ δ α + δ f(x) − f(x) + α α + δ f(z) = α α + δ [f(z) − f(x)]. (24) Kombináciou nerovností v (24) a (21) dostaneme f(y) − f(x) (24) ≤ α α + δ [f(z) − f(x)] (21) ≤ α α + δ [M + M] ≤ 2M δ α. (25) Nie je ťažké si premyslieť, že nerovnosť (25) platí i pre zámenu x ↔ y, a tak ±[f(x) − f(y)] ≤ 2M δ α, teda |f(x) − f(y)| ≤ 2M δ α = 2M δ x − y X . Posledná nerovnosť tak potvrdzuje platnosť (20) pre voľbu L := 2M δ > 0. Derivácia Konvexnosť Hladkosť Dôsledok 1 Nech X je Banachov priestor a G ⊆ X je otvorená konvexná množina. Nech f : G → R je konvexná funkcia. Potom f je spojitá na množine G práve vtedy, keď je lokálne ohraničená na množine G. Dôkaz Dôsledku 1. Je zrejmé, že spojitosť každej funkcie f na každej množine G ⊆ X implikuje lokálnu ohraničenosť f na G. Ak naviac G je konvexná množina a f je konvexná funkcia, potom podľa Vety 1 z lokálnej ohraničenosti funkcie f na G vyplýva lokálna lipschitzovskosť f na G, a teda vzhľadom na nerovnosť (20) nutne i spojitosť f v každom bode množiny G. Dôkaz je hotový. Poznámka 6 Poznamenajme, že pri skúmaní spojitosti konvexných funkcií na reálnych Banachových priestoroch hrá dôležitú úlohu ich dimenzia. Je možné dokázať, že v prípade konečnorozmerného priestoru X je každá konvexná funkcia f : X → R spojitá na každej otvorenej konvexnej množine G ⊆ X. Na druhej strane vieme, že v prípade dim X = ∞ vždy existujú na X nespojité lineárne funkcionály, a teda v súlade s Príkladom 4 i nespojité konvexné funkcie f : X → R. Derivácia Konvexnosť Hladkosť Definícia 5 (Polospojitosť funkcie) Nech X je metrický priestor a f : X → R je daná funkcia. Hovoríme, že f je polospojitá zhora na X, ak pre každé α ∈ R je množina {x ∈ X, f(x) < α} otvorená v X. (26) Podobne, funkcia f je polospojitá zdola na X, ak pre každá α ∈ R je množina {x ∈ X, f(x) > α} otvorená v X. (27) Poznámka 7 Poznamenajme, že vlastnosť (26), resp. (27) je ekvivalentná s tým, že množina {x ∈ X, f(x) ≥ β}, resp. {x ∈ X, f(x) ≤ β} je uzavretá v X (28) pre každé β ∈ R. Doplňme, že polospojitosť zhora, resp. zdola funkcie f v danom bode x0 ∈ X sa štandarne definuje ako relácia lim sup x→x0 f(x) ≤ f(x0), resp. lim inf x→x0 ≥ f(x0). (29) Platí, že funkcia f je polospojitá zhora (zdola) v každom bode x ∈ X v zmysle (29) práve vtedy, keď spĺňa reláciu (26) (reláciu (27)). Napokon dodajme, že funkcia f je spojitá na celom X práve vtedy, keď je polospojitá zhora i zdola na celom X, t.j., platia relácie (26) a (27) Derivácia Konvexnosť Hladkosť Veta 2 Nech X je Banachov priestor a G ⊆ X je otvorená konvexná množina. Nech f : G → R je konvexná funkcia. Potom nasledujúce tvrdenia sú ekvivalentné. (i) Funkcia f je spojitá na množine G. (ii) Funkcia f je polospojitá zhora na množine G. (iii) Funkcia f je ohraničená zhora na okolí O(x0) ⊆ G nejakého bodu x0 ∈ G. (iv) Funkcia f je spojitá v nejakom bode x0 ∈ G. Dôkaz Vety 2. Platnosť implikácie (i)⇒(ii) vyplýva z Poznámky 7. Ak funkcia f je polospojitá zhora na množine G a x0 ∈ G je nejaký daný bod, potom množina {x ∈ X, f(x) < f(x0) + 1} (30) je v súlade s (26) v Definícii 5 otvorená a neprázdna, nakoľko zrejme obsahuje bod x0. Jedná sa teda o okolie O(x0) bodu x0. A keďže podľa (30) platí f(x) < f(x0) + 1 pre každé x ∈ O(x0), funkcia f je ohraničená zhora na množine O(x0). Platí teda implikácia (ii)⇒(iii). Pre dôkaz implikácie (iii)⇒(iv) stačí v súlade s Vetou 1 a Dôsledkom 1 ukázať, že funkcia f je ohraničená i zdola na okolí O(x0). Predpokladajme, že funkcia f je zhora ohraničená zhora na ne- Derivácia Konvexnosť Hladkosť Dôkaz Vety 2 (pokračovanie). jakom okolí bodu x0, t.j., existujú kladné konštanty M a δ s vlastnosťou f(x) ≤ M, x ∈ BX (x0, δ) ⊆ G. (31) Pre každý bod x ∈ BX (x0, δ) platí, že aj bod 2x0 − x ∈ BX (x0, δ), keďže (2x0 − x) − x0 X = x0 − x X < δ. Množina BX (x0, δ) je zrejme konvexná. Potom pre každý bod x ∈ BX (x0, δ) postupne máme f(x0) = f 1 2 (2x0 − x) + 1 2 x (17) ≤ 1 2 f(2x0 − x) + 1 2 f(x) (31) ≤ 1 2 [M + f(x)] ⇓ 2f(x0) − M ≤ f(x), x ∈ BX (x0, δ). Posledná nerovnosť ukazuje, že funkcia f je ohraničená zdola na okolí BX (x0, δ), t.j., je ohraničená na BX (x0, δ). Podľa vyššie uvedenej diskusie teda platí implikácia (iii)⇒(iv). Pristúpime teraz k dôkazu implikácia (iv)⇒(i). Nech funkcia f je spojitá v bode x0 ∈ G. Uvažujme daný bod y ∈ G, y = x0, a nech ε > 0 je také, že okolie BX (y, ε) ⊆ G. Definujme kladné číslo ω rovnosťou ω := ε 2 y − x0 X . (32) Následne vektor z := y + ω(y − x0) patrí do okolia BX (y, ε), pretože v súlade Derivácia Konvexnosť Hladkosť Dôkaz Vety 2 (pokračovanie). s (32) platí z −y X = ε 2 . Naviac, vektor y je konvexnou lineárnou kombináciou vektorov x0 a z, konkrétne máme rovnosť y = λx0 + (1 − λ)z, kde λ := ω ω + 1 ∈ (0, 1), (33) ako sa možno ľahko presvedčiť. Spojitosť f v bode x0 implikuje vlastnosť (31). Ukážeme teraz, že funkcia f je ohraničená zhora na množine BX (y, λδ) s číslom δ z (31). V prvom rade dokážeme, že otvorená guľa BX (y, λδ) ⊆ G. Skutočne, pre každé x ∈ BX (y, λδ) platí x0 + 1 λ (x − y) ∈ BX (x0, δ) ⊆ G, pretože (34) x0 − x0 + 1 λ (x − y) X = 1 λ x − y X < δ, x (33) = λ x0 + 1 λ (x − y) + (1 − λ)z. (35) Posledná rovnosť ukazuje, že bod x je konvexnou lineárnou kombináciou dvoch bodov, ktoré patria do konvexnej množiny G, t.j., nutne potom platí x ∈ G. Na druhej strane, vďaka konvexnosti funkcie f pre každé x ∈ BX (y, λδ) dostávame Derivácia Konvexnosť Hladkosť Dôkaz Vety 2 (pokračovanie). f(x) (35) = f λ x0 + 1 λ (x − y) + (1 − λ)z (17) ≤ λf x0 + 1 λ (x − y) + (1 − λ)f(z) (34),(31) ≤ λM + (1 − λ)f(z). (36) V súlade s odvodenou nerovnosťou (36) je teda funkcia f naozaj ohraničená zhora na okolí BX (y, λδ) bodu y. Následne, podľa už dokázanej implikácie (iii)⇒(iv), je f spojitá v bode y. Keďže bod y ∈ G bol zvolený ľubovoľne, funkcia f je spojitá na celej množine G, t.j., platí tvrdenie (i). Dôkaz je kompletný. Poznámka 8 Konvexné funkcie majú niektoré vlastnosti podobné ako lineárne funkcionály. Vieme, že lineárny funkcionál je spojitý na celom priestore X práve vtedy, keď je spojitý aspoň v jednom bode x0 ∈ X. S touto vlastnosťou v prípade konvexných funkcií korešponduje ekvivalencia tvrdení (i) a (iv) vo Vete 2. Ďalej vieme, že spojité lineárne funkcionály sú ohraničené na jednotkovej guli BX [0, 1]. Dá sa dokázať, že ak X je separabilný Banachov priestor nekonečnej dimenzie, potom vždy existuje spojitá konvexná funkcia na X, ktorá je neohraničená na BX [0, 1]. Derivácia Konvexnosť Hladkosť Veta 3 Nech X je Banachov priestor a G ⊆ X je otvorená konvexná množina. Nech f : G → R je konvexná funkcia. Potom pre každý vektor x ∈ G existuje limita [d+ f(x)]h := lim λ→0+ f(x + λh) − f(x) λ , λ ∈ R, (37) pre každé h ∈ X. Naviac, zobrazenie d+ f(x) je konvexný funkcionál na X. Dôkaz Vety 3. Zvoľme bod x ∈ G a pevný vektor h ∈ X. Ukážeme, že zlomok f(x + λh) − f(x) λ (38) je ako funkcia reálnej premennej λ na vhodnom pravom okolí bodu 0 neklesajúci a zdola ohraničený. Zrejme existuje δ > 0 také, že vektor x + th ∈ G pre každé t ∈ (0, δ). Pre každé dve hodnoty t1, t2 ∈ (0, δ) s t1 < t2 platí x + t1h = t2 − t1 t2 x + t1 t2 (x + t2h). (39) Jedná o konvexnú lineárnu kombináciu bodov x a x + t2h, a tak máme Derivácia Konvexnosť Hladkosť Dôkaz Vety 3 (pokračovanie). f(x + t1h) (39) = f t2 − t1 t2 x + t1 t2 (x + t2h) ≤ t2 − t1 t2 f(x) + t1 t2 f(x + t2h) ⇓ f(x + t1h) − f(x) ≤ t1 t2 [f(x + t2h) − f(x)] ⇓ f(x + t1h) − f(x) t1 ≤ f(x + t2h) − f(x) t2 , čo potvrdzuje predpovedanú monotónnosť uvedeného zlomku na intervale (0, δ). Bez ujmy na všeobecnosti predpokladajme, že zavedené δ má naviac vlastnosť, že aj vektory x − th ∈ G pre každé t ∈ (0, δ). Potom postupne platí x = 1 2 [x − th] + 1 2 [x + th], t ∈ (0, δ) ⇓ konvexnosť funkcie f ⇓ f(x) ≤ 1 2 f(x − th) + 1 2 f(x + th). (40) Derivácia Konvexnosť Hladkosť Dôkaz Vety 3 (pokračovanie). Z nerovnosti (40) po malých úpravách odvodíme − f(x + t(−h)) − f(x) t ≤ f(x + th) − f(x) t , t ∈ (0, δ). (41) Vychádzajúc z výsledkov vyššie, výraz na pravej strane nerovnosti (41) je neklesajúci na intervale (0, δ), a tak výraz na ľavej strane tejto nerovnosti je nutne nerastúci na intervale (0, δ) (s voľbou h := −h). Preto dostávame − f x + δ 2 (−h) − f(x) δ 2 ≤ − f(x + t(−h)) − f(x) t ≤ f(x + th) − f(x) t ≤ f x + δ 2 h − f(x) δ 2 (42) pre každé t ∈ (0, δ 2 ). Nerovnosti v (42) ukazujú, že zlomok (38) je ohraničený zdola na (0, δ 2 ), a preto s ohľadom na vyššie dokázanú monotónosť existuje limita v (37). Z (42) ďalej vyplýva, že funkcionál d+ f(x) zavedený v (37) spĺňa − [d+ f(x)](−h) (37) = lim λ→0+ − f(x + λ(−h)) − f(x) λ (42),(37) ≤ [d+ f(x)]h (43) Derivácia Konvexnosť Hladkosť Dôkaz Vety 3 (pokračovanie). pre každé h ∈ X. Zostáva dokázať, že funkcionál d+ f(x) je konvexný, t.j., ukázať, že spĺňa vlastnosti v (19). Zrejme v súlade s (37) pre každý vektor h ∈ X platí d+ f(x)[0 · h] = 0 = 0 · d+ f(x)h. Pre ω > 0 platí [d+ f(x)](ωh) (37) = lim λ→0+ f(x + λωh) − f(x) λ = ω lim λ→0+ f(x + λωh) − f(x) λω (37) = ω[d+ f(x)]h, h ∈ X. (44) Napokon dokážeme trojuholníkovú nerovnosť. Nech h, k ∈ X sú dva dané vektory a (0, δ) interval taký, že x + th, x + tk ∈ G pre každé t ∈ (0, δ). Keďže x + t 2 (h + k) = 1 2 (x + th) + 1 2 (x + tk), vektor x + t 2 (h + k) ∈ G pre každé t ∈ (0, δ). Následne platí f x + t 2 (h + k) ≤ 1 2 f(x + th) + 1 2 f(x + tk) ⇓ f x + t 2 (h + k) − f(x) t 2 ≤ f(x + th) − f(x) t + f(x + tk) − f(x) t (45) Derivácia Konvexnosť Hladkosť Dôkaz Vety 3 (pokračovanie). pre každé t ∈ (0, δ). Limitovaním nerovnosti (45) pre t → 0+ získame s ohľadom na označenie v (37) reláciu [d+ f(x)](h + k) ≤ [d+ f(x)]h + [d+ f(x)]k, h, k ∈ X. (46) Podľa (19) je funkcionál d+ f(x) skutočne konvexný a dôkaz je zavŕšený. Poznámka 9 Motivovaní rovnosťou (37) môžeme pre každé dané x ∈ G uvažovať funkcionál [d− f(x)]h := lim λ→0− f(x + λh) − f(x) λ , λ ∈ R, (47) pre každé h ∈ X. Podľa nerovností (41)–(43) je zobrazenie d− f(x) definované korektne na X, pričom platí [d− f(x)]h (43) = −[d+ f(x)](−h) (43) ≤ [d+ f(x)]h pre každé h ∈ X. (48) V prípade reálneho Banachovho priestoru X má f v bode x ∈ G deriváciu Dhf(x) v každom smere h ∈ X \ {0} práve vtedy, keď v (48) platí rovnosť, t.j., −[d+ f(x)](−h) = [d+ f(x)]h pre každé vektor h ∈ X. Naviac, konvexný funkci- Derivácia Konvexnosť Hladkosť Poznámka 9 onál d+ f(x) je v tejto situácii dokonca lineárny. Skutočne, máme pre ω < 0 platí [d+ f(x)](ωh) = −[d+ f(x)](−ωh) (44) = ω[d+ f(x)]h, h ∈ X, (49) [d+ f(x)](h + k) = −[d+ f(x)](−h − k) (46) ≥ −[d+ f(x)](−h) − [d+ f(x)](−k) = [d+ f(x)]h + [d+ f(x)]k, h, k ∈ X. (50) Kombináciou (49) a (50) s (44) a (46) napokon získame [d+ f(x)](h + k) (50),(46) = [d+ f(x)]h + [d+ f(x)]k, [d+ f(x)](ωh) = ω[d+ f(x)]h (51) pre každé h, k ∈ X a každé ω ∈ R. To dokazuje linearitu funkcionálu d+ f(x). Veta 4 Nech X je Banachov priestor a G ⊆ X je otvorená konvexná množina. Nech f : G → R je spojitá konvexná funkcia, ktorá má v danom bode x ∈ G deriváciu Dhf(x) v každom smere h ∈ X \ {0}, pričom funkcionál Dhf(x) je lineárny. Potom funkcia f má v bode x slabú deriváciu df(x). Derivácia Konvexnosť Hladkosť Dôkaz Vety 4. V súlade s Definíciou 2 stačí ukázať ohraničenosť funkcionálu Dhf(x). Vďaka spojitosti v bode x ∈ G je funkcia f ohraničená a následne podľa Vety 1 i lipschitzovská na nejakom dostatočne malom okolí bodu x. V súlade s (20) platí |f(u) − f(v)| ≤ L u − v X pre každú dvojicu vektorov u, v ∈ BX (x, ε) ⊆ G (52) pre isté kladné konštanty L a ε. Zvoľme nenulový vektor h ∈ X a položme δ := ε h X . Potom pre každé λ ∈ C s 0 < |λ| < δ platí x + λh ∈ BX (x, ε) a f(x + λh) − f(x) λ (52) ≤ L λh X |λ| = L h X , |λ| ∈ (0, δ). (53) Využijúc formulu (1) limitovaním nerovnosti (53) pre λ → 0 dostaneme nerovnosť |Dhf(x)| ≤ L h X pre každé h ∈ X, pričom konštanta L > 0 je nezávislá na vektore h ∈ X. Lineárny funkcionál Dhf(x) je teda ohraničený, a preto aj spojitý na priestore X. Preto podľa Definície 2 má funkcia f slabú deriváciu df(x) v bode x. Dôkaz je kompletný. Poznámka 10 V súlade s (51) v Poznámke 9 v prípade reálneho Banachovho priestoru X môžeme predpoklad linearity smerovej derivácie Dhf(x) zrejme vypustiť. Derivácia Konvexnosť Hladkosť Veta 5 Nech X je Banachov priestor. Nasledujúce tvrdenia sú ekvivalentné. (i) Norma · X má na jednotkovej sfére SX [0, 1] rovnomerne slabú deriváciu. (ii) Norma · X má na jednotkovej sfére SX [0, 1] rovnomerne silnú deriváciu. Poznámka 11 Poznamenajme, že vlastnosti normy v tvrdeniach Vety 5(i)–(ii) znamenajú, že v odpovedajúcich ε − δ definíciách ich slabej a silnej derivácie číslo δ > 0 nezávisí na výbere vektora x ∈ SX [0, 1]. Konkrétne, pre každé ε > 0 existuje δ > 0 tak, že v prípade slabej derivácie normy · (obzvlášť, v súlade s Poznámkou 4) platí x + λh X − x X λ − [df(x)]h < ε pre každé |λ| < δ a pre každé x, h ∈ SX [0, 1]. Podobne v prípade rovnomernej existencie silnej derivácie normy · v súlade s limitou (3) v Definícií 3 platí relácia x + h X − x X h X − [f′ (x)]h < ε pre každé h X < δ a pre každé x ∈ SX [0, 1]. Rovnomerná existencia slabej (silnej) derivácie normy na jednotkovej sfére SX [0, 1] má význam v geometrickej teórii Banachovho priestoru X. Derivácia Konvexnosť Hladkosť Obsah 1 Slabá a silná derivácia zobrazenia 2 Derivovanie konvexných zobrazení 3 Dotykový funkcionál a hladké priestory Derivácia Konvexnosť Hladkosť Dotykový funkcionál Nech X je daný Banachov priestor a x ∈ X daný nenulový vektor. Jeden z dôsledkov Hahnovej–Banachovej vety zaručuje existenciu aspoň jedného spojitého lineárneho funkcionálu g : X → C s vlastnosťou g = 1, g(x) = x X . (54) Definícia 6 (Dotykový funkcionál) Pre daný nenulový vektor x ∈ X sa spojitý lineárny funkcionál g : X → C definovaný podmienkami v (54) označuje ako dotykový funkcionál v bode x. Poznámka 12 Názov funkcionálu g v Definícii 6 je motivovaný jeho geometrickou interpretáciou. Nie je náročné ukázať, že pre nadrovinu Eg := {h ∈ X, g(h) = r}, r := x X (55) platí x ∈ Eg ∩ BX [0, r] = Eg ∩ SX [0, r], t.j., jedná sa o dotykovú nadrovinu k sfére SX [0, r] v bode x priestoru X. Derivácia Konvexnosť Hladkosť Veta 6 Nech X je reálny Banachov priestor. Zaveďme označenie f(x) := x X , x ∈ X. (56) Nech x ∈ X je daný nenulový vektor a predpokladajme, že existuje slabá derivácia df(x). Potom df(x) je dotykový funkcionál v bode x, t.j. v zhode s Definíciou 6 spojitý lineárny funkcionál spĺňajúci podmienky df(x) = 1, [df(x)]x = x X . (57) Naviac, v tomto prípade je dotykový funkcionál v bode x určený jednoznačne, t.j., ak g ∈ X′ je nejaký dotykový funkcionál v bode x, potom g = df(x). Dôkaz Vety 6. Z predpokladov tvrdenia v súlade s Definíciou 2 vyplýva, že slabá derivácia df(x) je spojitý lineárny funkcionál na X. Obvzlášť, podľa (2) a (1) platí [df(x)]h = lim λ→0 f(x + λh) − f(x) λ pre každé h ∈ X. (58) Pre každé h ∈ X a λ ∈ R \ {0} máme odhad f(x + λh) − f(x) λ (56) = | x + λh X − x X | |λ| ≤ x + λh − x X |λ| = h X , (59) Derivácia Konvexnosť Hladkosť Dôkaz Vety 6 (pokračovanie). pomocou ktorého v zhode (58) odvodíme |[df(x)]h| (58) ≤ f(x + λh) − f(x) λ (59) ≤ h X , a tak df(x) ≤ 1. Na druhej strane, platí [df(x)] 1 x X x (58),(56) = lim λ→0+ x + λ x X x X − x X λ = 1, (60) a tak df(x) ≥ 1. Napokon dostávame rovnosti v (57), t.j., df(x) = 1, [df(x)]x (60) = x X . Podľa Definície 6 je slabá derivácia df(x) skutočne dotykový funkcionál v bode x. Ukážeme teraz jeho jednoznačnosť. Nech g je nejaký dotykový funkcionál v bode x, t.j., je to spojitý lineárny funkcionál, ktorý spĺňa podmienky v (54). Zvoľme pevne h ∈ X a definujme funkciu ε(λ) := [df(x)]h − x + λh X − x X λ , λ ∈ R \ {0}. (61) V súlade s (58) zrejme limλ→0 ε(λ) = 0. Keďže funkcionál g je spojitý, platí Derivácia Konvexnosť Hladkosť Dôkaz Vety 6 (pokračovanie). lim λ→0 g(x + λh) = g(x) = x X > 0, a tak g(x + λh) > 0 pre λ ∈ (0, δ), (62) kde δ je dostatočne malé kladné číslo. Následne vďaka linearite je funkcionál g ohraničený. Obvzlášť, pre každé λ ∈ (0, δ) máme g(x + λh) (62) = |g(x + λh)| ≤ g · x + λh X (54) = x + λh X ⇓ linearita g ⇓ g(x) + λg(h) ≤ x + λh X (54) −→ λg(h) ≤ x + λh X − x X ⇓ g(h) ≤ x + λh X − X X λ (61) −→ g(h) ≤ [df(x)]h − ε(λ). (63) Limitovaním poslednej nerovnosti pre λ → 0+ napokon získame nerovnosť g(h) ≤ [df(x)]h − lim λ→0+ ε(λ) −→ g(h) ≤ [df(x)]h pre každé dané h ∈ X. Ak v poslednej nerovnosti zvolíme vektor −h a a uvážime linearitu funkcionálov g a [df(x)], dostaneme g(h) ≥ [df(x)]h pre každé h ∈ X. Teda g = df(x). Derivácia Konvexnosť Hladkosť Hladké Banachove priestory Definícia 7 (Hladký priestor) Nech X je Banachov priestor. Hovoríme, že X je hladký v bode x ∈ SX[0, 1], ak existuje práve jeden dotykový funkcionál v bode x. Priestor X sa označuje ako hladký, ak je hladký v každom bode jednotkovej sféry SX[0, 1]. Veta 7 (Šmuljanova) Nech X je reálny Banachov priestor. Potom X je hladký v bode x ∈ SX [0, 1] práve vtedy, keď norma · X má v bode x slabú deriváciu d x X . V tomto prípade jediným dotykovým funkcionálom v bode x je slabá derivácia d x X . Lema 2 Nech X je reálny Banachov priestor a G ⊆ X je otvorená konvexná množina. Nech f : G → R je konvexná funkcia spojitá v bode x ∈ G. Potom f je slabo diferencovateľná v x práve vtedy, keď lim λ→0+ f(x + λh) + f(x − λh) − 2f(x) λ = 0 pre každé h ∈ X. (64) Derivácia Konvexnosť Hladkosť Náčrt dôkazu Lemy 2. Pomocou Vety 3 a jej dôkazu a pomocou komentára v Poznámke 9 nie je ťažké si premyslieť, že relácia (64) je ekvivalentná s existenciou smerovej derivácie Dhf(x) pre každý nenulový vektor h ∈ X. Tvrdenie lemy je potom dôsledkom Vety 4 v kontexte Poznámky 10. Dôkaze Vety 7. Zvoľme pevný vektor x ∈ SX [0, 1]. Nech priestor X je hladký v x. Sporom predpokladajme, že norma · X nemá v bode x slabú deriváciu. Keďže norma je spojitá konvexná funkcia, podľa Lemy 2 existuje nenulový vektor h ∈ X, pre ktorý rovnosť v (64) nie je splnená. Existuje teda ε > 0 a postupnosť {λk}∞ k=1 ⊆ R+ s vlastnosťou limk→∞ λk = 0 a (norma x X = 1) x + λkh X + x − λkh X − 2 λk ≥ ε pre každé k ∈ N. (65) V súlade s dôsledkom Hahnovej–Banachovej vety nech {fk}∞ k=1, {gk}∞ k=1 ⊆ X′ sú postupnosti spojitých lineárnych funkcionálov s vlastnosťami fk = 1 = gk , fk(x + λkh) = x + λkh X, gk(x − λkh) = x − λkh X (66) pre každé k ∈ N. Keďže pre každé k ∈ N platí |fk(λkh)| ≤ λk fk h (66) = λk h , |gf (λkh)| ≤ λk gk h (66) = λk h Derivácia Konvexnosť Hladkosť Dôkaze Vety 7 (pokračovanie). máme limk→∞ fk(λkh) = 0 = limk→∞ gk(λkh). Následne pre k → ∞ máme fk(x) = fk(x + λkh) − fk(λkh) (66) = x + λkh X − fk(λkh) −→ 1− , (67) gk(x) = gk(x − λkh) + gk(λkh) (66) = x − λkh X − gk(λkh) −→ 1− , (68) pretože |fk(x)| ≤ fk x = 1 a |gk(x)| ≤ gk x = 1 pre každé k ∈ N. Ukážeme teraz platnosť nerovnosti (fk − gk)(h) ≥ ε pre každé k ∈ N. (69) Skutočne, kombináciou (65) a (66) postupne máme (fk − gk)(h) = fk(h) − gk(h) = fk(x + λkh) + gk(x − λkh) − fk(x) − gk(x) λk (66) = x + λkh X + x − λkh X ≥−2 −fk(x) − gk(x) λk ≥ x + λkh X + x − λkh X − 2 λk (65) ≥ ε pre každé k ∈ N. Využijeme teraz vlastnosti ∗-slabej topológie v duálnom priestore X′ . Funkcioná- Derivácia Konvexnosť Hladkosť Dôkaze Vety 7 (pokračovanie). ly fk, gk, k ∈ N, sú podľa (66) prvkami uzavretej jednotkovej gule BX′ [0, 1]. Keďže podľa Banachovej–Alaogluovej vety je množina BX′ [0, 1] ∗-slabo kompaktná v X′ , každá z postupností {fk}∞ k=1, {gk}∞ k=1 má aspoň jeden hromadný bod v BX′ [0, 1] vzhľadom na ∗-slabú topológiu. Bez ujmy na všeobecnosti teda môžeme uvažovať, že lim k→∞ fk = f, lim k→∞ gk = g ∗-slabo, f, g ∈ BX′ [0, 1]. (70) Platí teda f = 1 = g a limk→∞ fk(x) = f(x) a limk→∞ gk(x) = g(x). Využijúc relácie (67) a (68) následne dostávame f(x) = 1 = x X a g(x) = 1 = x X . Získané spojité lineárne funkcionály sú v súlade s Definíciou 6 dotykové funkcionály v bode x. Naviac, pomocou nerovnosti (69) platí f(h) − g(h) = (f − g)(h) = lim k→∞ (fk − gk)(h) (69) ≥ ε > 0, t.j., f(h) = g(h). Jedná sa teda o dva rôzne dotykové funkcionály v bode x. Podľa Definície 7 je to však v rozpore s predpokladom hladkosti priestoru X v bode x. Preto nutne norma · X musí mať v bode x slabú deriváciu. Naopak, ak v bode x existuje slabá derivácia d x X , potom podľa Vety 6 v tomto bode existuje práve jeden dotykový funkcionál. V súlade s Definíciou 7 je priestor X hladký v bode x. Derivácia Konvexnosť Hladkosť Uniformne hladké Banachove priestory Definícia 8 (Uniformne hladký priestor) Nech X je Banachov priestor. Hovoríme, že X je uniformne hladký, ak norma · X je rovnomerne slabo diferencovateľná na jednotkovej sfére SX [0, 1]. Poznámka 13 Podľa Šmuljanovej Vety 7 zrejme platí, že každý reálny unimorfne hladký Banachov priestor X je zároveň i hladký priestor. Veta 8 Nech X je Banachov priestor. Platia nasledujúce tvrdenia. (i) Priestor X je uniformne hladký práve vtedy, keď norma · X je rovnomerne silno diferencovateľná na jednotkovej sfére SX [0, 1]. (ii) Reálny priestor X je uniformne hladký práve vtedy, keď platí lim λ→0+ x + λh X + x − λh X − 2 λ = 0 rovnomerne pre x, h ∈ SX [0, 1].