Úvod do variačního počtu 1 Funkcionál a jeho variace Definice 1. Buď V vektorový prostor nad R. Zobrazení ||·|| : V → R se nazývá norma, jestliže (N1) (∀x1, x2 ∈ V )(||x1 + x2|| ≤ ||x1|| + ||x2||) (N2) (∀x ∈ V )(∀α ∈ R)(||αx|| = |α| ||x||) (N3) (∀x ∈ V )(x = 0 ⇒ ||x|| = 0) Poznámka 1. Norma má vlastnosti: 1. ||0|| = 0 2. (∀x ∈ V )(||x|| ≥ 0) Důkaz: 1. 0 = 0x pro libovolné x ∈ V . Tedy podle (N2) je ||0|| = ||0x|| = |0| ||x|| = 0 2. S využitím (N1), (N2) a 1.: ||x|| = 1 2 (||x|| + ||x||) = 1 2 (||x|| + | − 1| ||x||) = 1 2 (||x|| + ||−x||) ≥ 1 2 ||x + (−x)|| = 1 2 ||0|| = 0. Poznámka 2. Buď V vektorový prostor nad R a ||·|| norma na něm. Zobrazení ρ : V 2 → R definované předpisem ρ(x, y) = ||x − y|| je metrikou na V . Důkaz: ρ(x, y) = ||x − y|| = 0 ⇔ x − y = 0 (podle definice 1, (N3) a poznámky 1) ⇔ x = y ρ(x, y) = ||x − y|| = | − 1| ||y − x|| = ||y − x|| = ρ(y, x) ρ(x, z) = ||x − z|| = ||x − y + y − z|| ≤ ||x − y|| + ||y − z|| = ρ(x, y) + ρ(x, z) Definice 2. Buď V vektorový prostor nad R. Zobrazení v : V → R se nazývá funkcionál (na vektorovém prostoru V ). Obraz vektoru x při zobrazení v označíme v[x]. Funkcionál v na prostoru V se nazývá spojitý v x0 ∈ V , pokud ke každému ε > 0 existuje δ > 0 takové, že pro všechny x ∈ V z nerovnosti ||x − x0|| plyne nerovnost |v[x] − v[x0]| < ε. (Funkcionál je tedy chápaný jako zobrazení metrického prostoru V s metrikou zavedenou v poznámce 2 do metrického prostoru R s přirozenou metrikou). Funkcionál na V se nazývá lineární, jestliže pro všechna x, y ∈ V a α ∈ R platí v[x + y] = v[x] + v[y], v[αx] = αv[x]. Poznámka 3. Lineární funkcionál v na vektorovém prostoru V je spojitý právě tehdy, když v je spojitý v 0 (nulovém vektoru). Důkaz: Nechť zobrazení v je spojité v 0 a buď ε > 0 libovolné číslo. K ε existuje δ > 0 takové, že pro každý vektor z ∈ V takový, že ||z|| < δ platí |v[z]| < ε. Buď nyní x ∈ V libovolný vektor. Pro každý vektor y ∈ V takový, že ||x − y|| < δ platí |v[x] − v[y]| = |v[x − y]| < ε, což znamená, že v je zobrazení spojité v x ∈ V . Opačná implikace je triviální. Označení: O = Oε = Oε,V,||·|| = {x ∈ V : ||x|| < ε} 1 Definice 3. Nechť v je funkcionál na reálném vektorovém prostoru V s normou ||·||, a A ⊆ V je vektorový podprostor. A nazveme prostor přípustných vektorů, prvky z A nazveme variace (přírůstky) argumentu funkcionálu v. Variace argumentu funkcionálu v se někdy značí δx. Dále nechť x ∈ V a L(x) je lineární funkcionál na prostoru přípustných vektorů A. Jestliže existuje funkcionál τ na A takový, že lim h→0 τ[h] = 0 a navíc platí ∆v[x] = v[x + h] − v[x] = L(x)[h] + ||h|| τ[h] pro všechny vektory h ∈ A ∩ O. Pak lineární funkcionál L(x) nazveme variace funkcionálu v (v prostoru V s normou ||·|| na vektoru x vzhledem k množině A) a značíme L(x) = δv(x). Definice 4. Buď v funkcionál na reálném vektorovém prostoru V s normou ||·|| , x ∈ V a buď A prostor přípustných vektorů. Řekneme, že funkcionál v nabývá na x ∈ V lokálního maxima (resp. minima) vzhledem k A, jestliže existuje O tak, že pro každý vektor h ∈ O∩A je v[x] ≥ v[x+h] (resp. v[x] ≤ v[x+h]). Řekneme, že funkcionál v nabývá na x ∈ V ostrého lokálního maxima (resp. minima) vzhledem k A, jestliže existuje O tak, že pro každý vektor h ∈ (O ∩ A) \ {0} je v[x] > v[x + h] (resp. v[x] < v[x + h]). (Ostrá) lokální maxima a minima nazýváme souhrnně (ostré ) lokální extrémy funkcionálu v vzhledem k A. Věta 1. Buď v funkcionál na reálném vektorovém prostoru V s normou ||·|| a buď A prostor přípustných vektorů. Pro pevně zvolené vektory x ∈ V a h ∈ A definujme reálnou funkci jedné reálné proměnné ϕ( · ; x, h) předpisem ϕ(α; x, h) = v[x + αh]. Existuje-li variace funkcionálu v na x vzhledem k A, pak δv(x)[h] = d dα ϕ(0; x, h). Důkaz: ∆v[x] = ϕ(α; x, h) − ϕ(0; x, h), ∆α = α − 0 = α d dα ϕ(0; x, h) = lim α→0 ϕ(α; x, h) − ϕ(0; x, h) α = lim α→0 ∆v[x] α = = lim α→0 δv(x)[αh] + ||αh|| τ[αh] α = lim α→0 αδv(x)[h] + |α| ||h|| τ[αh] α = = δv(x)[h] + ||h|| lim α→0 sgn(α)τ[αh] = δv(x)[h] Věta 2. Buď v funkcionál na reálném vektorovém prostoru V s normou ||·|| , x ∈ V a A prostor přípustných vektorů. Jestliže funkcionál v nabývá na x ∈ V svého lokálního extrému vzhledem k A a existuje-li variace δv(x), pak δv(x) = 0 (tj. funkcionál, který každému vektoru z A přiřadí číslo 0). Důkaz: Nechť v nabývá na x ∈ V svého lokálního maxima vzhledem k A a nechť existuje δv(x). Připusťme, že existuje takový vektor h ∈ A takový, že δv(x)[h] > 0. Definujme funkci ϕ( · ; x, h) jako ve Větě 1. Pak je d dα ϕ(0; x, h) > 0. To podle známých vět z diferenciálního počtu funkcí jedné proměnné znamená, že funkce ϕ(·, x, h) (tj. funkce ϕ chápaná jako funkce pouze první proměnné, přičemž druhou a třetí proměnnou považujeme za parametry) je rostoucí v okolí nuly. Existuje tedy ˜α > 0 takové číslo, že pro všechna 2 α ∈ (0, ˜α) je ϕ(α; x, h) > ϕ(0; x, h). Buď ε > 0 libovolné a α ∈ 0, min ˜α, ε ||h|| . Pak αh ∈ A (neboť A je vektorový podprostor) a αh ∈ Oε (neboť ||αh|| = α ||h|| < ε ||h|| ||h|| = ε). Pro αh ∈ A tedy platí, že v[x + αh] = ϕ(α; x, h) > ϕ(0; x, h) = v[x] , což znamená, že funkcionál v nenabývá v x svého lokálního maxima. Analogicky ukážeme, že nemůže existovat vektor h ∈ A takový, aby δv(x)[h] < 0. Celkem tedy pro každý vektor h ∈ A je δv(x)[h] = 0. Pro minimum se důkaz provede analogicky. Definice 5. Buď v funkcionál na reálném vektorovém prostoru V s normou ||·|| a A buď prostor přípustných vektorů. Vektor x ∈ V se nazývá extrémální vektor (stručně extrémála) funkcionálu v (vzhledem k prostoru přípustných vektorů A), jestliže δv(x) = 0, tj. δv(x)[h] = 0 pro každý vektor h ∈ A. 2 Úlohy s pevnými konci 2.1 Úlohy typu b a F s, x(s), x′ (s) ds → extr, x(a) = x1, x(b) = x2 Je-li F dvakrát diferencovatelná funkce tří proměnných, V prostor funkcí definovaných a spojitě diferencovatelných na intervalu [a, b] a na V je zavedena některá z norem ||x||0 = max{|x(t)| : t ∈ [a, b]} ||x||1 = max{max{|x(t)| : t ∈ [a, b]}, max{|x′ (t)| : t ∈ [a, b]}}. Poznámka 4. Definujme funkcionál v : V → R předpisem v[x] = b a F s, x(s), x′ (s) ds. Tento funkcionál je spojitý na prostoru V s normou || · ||1. Důkaz: Buď x ∈ V libovolná funkce a ε > 0 libovolné číslo. Položme p1 = min{x(t) : t ∈ [a, b]}, p2 = max{x(t) : t ∈ [a, b]}, q1 = min{x′ (t) : t ∈ [a, b]}, q2 = max{x′ (t) : t ∈ [a, b]}, M = max max{|Fx(t, ξ, η)| : t ∈ [a, b], ξ ∈ [p1 − ε, p2 + ε], η ∈ [q1 − ε, q2 + ε]}, max{|Fx′ (t, ξ, η)| : t ∈ [a, b], ξ ∈ [p1 − ε, p2 + ε], η ∈ [q1 − ε, q2 + ε]} , δ = min ε, ε 2M(b − a) . 3 Buď g ∈ Oδ,V,|| · ||1 . S využitím věty o střední hodnotě a vět známých z integrálního počtu dostaneme |v[x + g] − v[x]| = b a F s, x(s) + g(s), x′ (s) + g′ (s) ds − b a F s, x(s), x′ (s) ds ≤ ≤ b a Fx s, x(s) + ϑ1(s)g(s), x′ (s) + g′ (s) g(s) + Fx′ (s, x(s), x′ (s) + ϑ2(s)g′ (s) g′ (s)ds , přičemž 0 ≤ ϑ1(s) ≤ 1, 0 ≤ ϑ2(s) ≤ 1 pro všechna s ∈ [a, b]. Tedy |v[x + g] − v[x]| ≤ b a M max{|g(t)| : t ∈ [a, b]}ds + b a M max{|g′ (t)| : t ∈ [a, b]}ds ≤ ≤ ||g||1 2M(b − a) < 2M(b − a)δ ≤ ε. Funkcionál v může být spojitý i na prostoru V s normou || · ||0. Položme A = {h ∈ V : h(a) = h(b) = 0}. Hledáme lokální extrémy funkcionálu v vzhledem k A. Navíc požadujeme, aby pro funkci x ∈ V , v níž se extrém realizuje, platilo x(a) = x1, x(b) = x2, kde x1, x2 ∈ R jsou předem dané konstanty. V případě normy ||·||1 mluvíme o slabých extrémech, v případě normy ||·||0 mluvíme o silných extrémech. (Nabývá-li funkcionál v na x silného extrému vzhledem k A, nabývá na této funkci i slabého extrému.) Využijeme věty 1 a 2: ϕ(α; x, h) = b a F(s, x(s) + αh(s), x′ (s) + αh′ (s))ds , δv(x)[h] = d dα ϕ(0; x, h) = b a Fx(s, x(s), x′ (s))h(s) + Fx′ (s, x(s), x′ (s))h′ (s) ds . Integrací per partes dostaneme b a Fx′ (s, x(s), x′ (s))h′ (s)ds = Fx′ (s, x(s), x′ (s))h(s) b a − b a d ds Fx′ (s, x(s), x′ (s)) h(s)ds a poněvadž h(a) = h(b) = 0, platí δv(x)[h] = b a Fx(s, x(s), x′ (s)) − d ds Fx′ (s, x(s), x′ (s)) h(s)ds = 0 . Tato rovnost má platit pro libovolnou funkci h z prostoru přípustných funkcí A, takže pro t ∈ [a, b] musí být splněna Eulerova rovnice Fx − d dt Fx′ = 0 , 4 v rozepsaném tvaru Fx − Fx′t − Fx′xx′ − Fx′x′ x′′ = 0 . Řešení (integrální křivky) Eulerovy rovnice splňující podmínky x(a) = x1, x(b) = x2 jsou extrémály funkcionálu v. Jsou to funkce podezřelé z toho, že na nich nabývá funkcionál v lokálního extrému. 2.1.1 Řešení Eulerovy rovnice v některých speciálních případech 1. F nezávisí na x′: Fx(t, x) = 0 Rovnice není diferenciální, její řešení nezávisí na volitelných konstantách. Úloha: najít extrém funkcionálu v[x] = b a F(s, x(s))ds s podmínkami x(a) = x1, x(b) = x2 obecně nemá řešení. 2. F závisí pouze na x′: Fx′x′ x′′ = 0 Odtud Fx′x′ = 0 nebo x′′ = 0. Je-li x′′ = 0, pak x(t) = C1t + C2, kde C1, C2 jsou konstanty. Je-li Fx′x′ = 0 a λ je kořenem této (nediferenciální) rovnice s neznámou x′, pak x(t) = λt + C, kde C je konstanta. Extrémálou je tedy úsečka. 3. F nezávisí na t: Fx − Fx′xx′ − Fx′x′ x′′ = 0 Poněvadž d dt F − x′ Fx′ = = Fxx′ + Fx′ x′′ − x′′ Fx′ − x′ Fx′xx′ + Fx′x′ x′′ = x′ Fx − Fx′xx′ − Fx′x′ x′′ , Eulerova rovnice přejde na tvar d dt F − x′ Fx′ = 0 , neboli F − x′ Fx′ = C , kde C je konstanta. 5 2.2 Úlohy typu b a F s, x(s), x′ (s) ds → extr, x(a) = x1, x(b) = x2 Je-li F dvakrát diferencovatelná funkce 2n + 1 proměnných, V prostor (vektorových) funkcí R → Rn definovaných a spojitě diferencovatelných na intervalu [a, b] a na V je zavedena některá z norem ||x||0 = (x1, x2, . . . , xn)T 0 = n i=1 max{|xi(t)| : t ∈ [a, b]} ||x||1 = (x1, x2, . . . , xn)T 1 = n i=1 max{max{|xi(t)| : t ∈ [a, b]}, max{|x′ i(t)| : t ∈ [a, b]}}, pak v[x] = b a F s, x1(s), x2(s), . . . , xn(s), x′ 1(s), x′ 2(s), . . . , x′ n(s) ds je spojitý funkcionál na V s normou || · ||1. Položme A = {h ∈ V : h(a) = h(b) = 0}. Hledáme lokální extrémy funkcionálu v vzhledem k A. Položme hi = (h1, h2, . . . , hn)T ∈ A, kde h1 ≡ 0, h2 ≡ 0, . . . , hi−1 ≡ 0, hi+1 ≡ 0, . . . , hn ≡ 0 a složka hi je libovolná (i = 1, 2, . . . , n). Analogicky jako v 2.1 odvodíme 0 = δv(x)[hi ] = b a Fxi s, x1(s), . . . , xn(s), x′ 1(s), . . . , x′ n(s) hi(s)ds− − b a d ds Fx′ i s, x1(s), . . . , xn(s), x′ 1(s), . . . , x′ n(s) hi(s)ds i = 1, 2, . . . , n, z čehož dostaneme soustavu Eulerových diferenciálních rovnic druhého řádu Fxi − d dt Fx′ i = 0, i = 1, 2, . . . , n Jejím řešením splňujícím podmínky xi(a) = (x1)i, xi(b) = (x2)i, i = 1, 2, . . . , n jsou extrémály funkcionálu v — (vektorové) funkce podezřelé z toho, že na nich nabývá funkcionál v lokálního extrému. 6 2.3 Úlohy typu b a F s, x(s), x′ (s), x′′ (s), . . . , x(n) (s) ds → extr, x(a) = α0, x′ (a) = α1, . . . , x(n−1) (a) = αn−1, x(b) = β0, x′ (b) = β1, . . . , x(n−1) (b) = βn−1 Je-li F (n+1)-krát diferencovatelná funkce n+2 proměnných, V prostor funkcí definovaných a (n+1)-krát spojitě diferencovatelných na intervalu [a, b] a na V je zavedena některá z norem ||x||k = = max max{|x(t)| : t ∈ [a, b]}, max{|x′ (t)| : t ∈ [a, b]}, . . . , max{|x(k) (t)| : t ∈ [a, b]} , k = 0, 1, 2. . . . , n , pak v[x] = b a F s, x(s), x′ (s), x′′ (s), . . . , x(n) (s) ds je spojitý funkcionál na V s normou || · ||n. Položme A = {h ∈ V : h(a) = h′(a) = · · · = h(n−1)(a) = 0 = h(b) = h′(b) = · · · = h(n−1)(b)}. Opět využijeme věty 1 a 2: ϕ(α; x, h) = b a F s, x(s) + αh(s), x′ (s) + αh′ (s), x′′ (s) + αh′′ (s), . . . , x(n) (s) + αh(n) (s) ds , δv(x)[h] = d dα ϕ(0; x, h) = b a Fxh + Fx′ h′ + Fx′ h′′ + · · · + Fx(n) h(n) ds = = b a Fxhds + b a Fx′ h′ ds + b a Fx′′ h′′ ds + · · · + b a Fx(n) h(n) ds Druhý až (n + 1)-ní integrál upravíme pomocí integrace per partes b a Fx′ h′ ds = [Fx′ h]b a − b a d ds Fx′ hds = − b a d ds Fx′ hds b a Fx′′ h′′ ds = Fx′′ h′ b a − b a d ds Fx′′ h′ ds = = − d ds Fx′′ h b a + b a d2 ds2 Fx′′ hds = b a d2 ds2 Fx′′ hds ... b a Fx(n) h(n) ds = (−1)n b a dn dsn Fx(n) hds . 7 Má-li na funkci x ∈ V být extrém funkcionálu v, musí podle 2 být δv(x)[h] = b a Fx − d ds Fx′ + d2 ds2 Fx′′ − · · · + (−1)n dn dsn Fx(n) hds = 0 . pro libovolnou funkci h ∈ A. Odtud dostaneme Eulerovu-Poissonovu diferenciální rovnici Fx − d ds Fx′ + d2 ds2 Fx′′ − · · · + (−1)n dn dsn Fx(n) = 0 . Její řešení (integrální křivky) splňující podmínky x(a) = α0, x′ (a) = α1, . . . , x(n−1) (a) = αn−1, x(b) = β0, x′ (b) = β1, . . . , x(n−1) (b) = βn−1 jsou extrémály uvažované variační úlohy. Jsou to funkce podezřelé z toho, že na nich nabývá funkcionál v svého lokálního extrému. Analogicky jako v 2.2 lze ukázat, že nutnou podmínkou pro extrém funkcionálu v[x] = b a F s, x1(s), x′ 1(s), x′′ 1(s), . . . , x (n1) 1 (s), . . . , xm(s), x′ m(s), x′′ m(s), . . . , x(nm) m (s) ds je soustava rovnic Fxi − d ds Fx′ i + d2 ds2 Fx′′ i − · · · + (−1)ni dni dsni Fx (ni) i = 0 , i = 1, 2, . . . , m. 2.4 Úlohy typu Ω F x, y, u, ∂ ∂x u, ∂ ∂y u dxdy → extr, u(x, y) = g(x, y) pro (x, y) ∈ ∂Ω Nechť F : R5 → R je třikrát diferencovatelná funkce a Ω ⊆ R2 je elementární množina (vzhledem k oběma osám), tj. existují čísla x0, x1, y0, y1 ∈ R a funkce η0, η1, ξ0, ξ1 : R → R takové, že Ω = (x, y) ∈ R2 : x0 ≤ x ≤ x1, η0(x) ≤ y ≤ η1(x) = = (x, y) ∈ R2 : y0 ≤ y ≤ y1, ξ0(y) ≤ ξ1(y) a pro hranici množiny Ω platí ∂Ω = x, η0(x) ∈ R2 : x0 ≤ x ≤ x1 ∪ x, η1(x) ∈ R2 : x0 ≤ x ≤ x1 = = ξ0(y), y ∈ R2 : y0 ≤ y ≤ y1 ∪ ξ1(y), y ∈ R2 : y0 ≤ y ≤ y1 . Nechť dále V je vektorový prostor funkcí ¯Ω → R dvakrát spojitě diferencovatelných na int Ω a spojitých na ¯Ω s normou ||u|| = max max |u(x, y)| : (x, y) ∈ ¯Ω , sup ∂u ∂x (x, y) : (x, y) ∈ int Ω , sup ∂u ∂y (x, y) : (x, y) ∈ int Ω . 8 pak v[u] = Ω F x, y, u(x, y), ∂u ∂x (x, y), ∂u ∂y (x, y) dxdy je spojitý funkcionál na prostoru V . Položme A = {h ∈ V : h(x, y) = 0 pro (x, y) ∈ δΩ}. Opět využijeme věty 1 a 2. Pro zjednodušení zápisu budeme používat označení ∂ ∂x u = ux, ∂ ∂y u = uy. ϕ(α; u, h) = Ω F x, y, u(x, y) + αh(x, y), ux(x, y) + αhx(x, y), uy(x, y) + αhy(x, y) dxdy, δv(u)[h] = d dα ϕ(0; u, h) = = Ω Fu(x, y, u, ux, uy)h + Fux (x, y, u, ux, uy)hx + Fuy (x, y, u, ux, uy)hy dxdy. S využitím Fubiniovy věty a integrace per partes dostaneme Ω Fux ∂h ∂x dxdy = y1 y0    ξ1(y) ξ0(y) Fux ∂h ∂x dx    dy = = y1 y0    Fux x, y, u(x, y), ux(x, y), uy(x, y) h(x, y) ξ1(y) x=ξ0(y) − ξ1(y) ξ0(y) d dx Fux hdx    dy = = − Ω d dx Fux hdxdy, neboť h ξ0(y), y = 0 = h ξ1(y), y . Podobně dostaneme Ω Fuy ∂h ∂y dxdy = − Ω d dy Fuy hdxdy. Má-li tedy funkce u ∈ V být extrémálou funkcionálu v, musí podle vět 1 a 2 platit δv(u)[h] = Ω Fu − d dx Fux − d dy Fuy hdxdy = 0. Aby tato rovnost byla splněna pro libovolnou funkci h ∈ A, musí být funkce v závorce za integrálem identicky nulová na množině Ω. To znamená, že funkce u je řešením parciální diferenciální rovnice Fu − d dx Fux − d dy Fuy = 0. (1) Tato rovnice se nazývá Eulerova-Lagrangeova nebo Ostrogradského rovnice. Poznamenejme, že rovnici (1) extrémály funkcionálu lze odvodit i bez předpokladu, že množina Ω je elementární. V takovém případě bychom využili Greenovy vzorce. 9 3 Úlohy s volnými konci 3.1 Úlohy typu b a F s, x(s), x′ (s) ds → extr, x(a) = x1 Je-li F dvakrát diferencovatelná funkce tří proměnných, V prostor funkcí definovaných a spojitě diferencovatelných na intervalu [a, b] a na V je zavedena některá z norem ||x||0 = max{|x(t)| : t ∈ [a, b]} ||x||1 = max{max{|x(t)| : t ∈ [a, b]}, max{|x′ (t)| : t ∈ [a, b]}} , pak v[x] = b a F s, x(s), x′ (s) ds je spojitý funkcionál na V s normou || · ||1. Položme A = {h ∈ V : h(a) = 0}. Hledáme lokální extrémy funkcionálu v vzhledem k A. Navíc požadujeme, aby pro funkci x ∈ V , v níž se extrém realizuje, platilo x(a) = x1, kde x1 ∈ R je předem daná konstanta. V případě normy ||·||1 mluvíme o slabých extrémech, v případě normy ||·||0 mluvíme o silných extrémech. Využijeme věty 1 a 2: ϕ(α; x, h) = b a F(s, x(s) + αh(s), x′ (s) + αh′ (s))ds , δv(x)[h] = d dα ϕ(0; x, h) = b a Fx(s, x(s), x′ (s))h(s) + Fx′ (s, x(s), x′ (s))h′ (s) ds . Integrací per partes dostaneme b a Fx′ (s, x(s), x′ (s))h′ (s)ds = Fx′ (s, x(s), x′ (s))h(s) b a − b a d ds Fx′ (s, x(s), x′ (s)) h(s)ds a poněvadž h(a) = 0, platí δv(x)[h] = Fx′ (b, x(b), x′ (b))h(b) + b a Fx(s, x(s), x′ (s)) − d ds Fx′ (s, x(s), x′ (s)) h(s)ds = 0. Tato rovnost platí pro každou přípustnou funkci h ∈ A právě tehdy, když funkce x splňuje na (a, b) Eulerovu rovnici Fx = d dt Fx′ a tzv. podmínku transverzality Fx′ (b, x(b), x′ (b)) = 0 . 10 x(t) b x y(t) y1 y s(t) Obrázek 1: K úloze o brachystochroně Úplně stejně můžeme ukázat, že extrémála funkcionálu v, která vyhovuje podmínce x(b) = x2, musí splňovat Eulerovu rovnici a podmínku transverzality Fx′ (a, x(a), x′ (a)) = 0 . 3.1.1 Úloha o brachystochroně V roce 1696 zformuloval Johann Bernoulli problém najít tzv. čáru nejrychlejšího sestupu. Představme si, že hmotný bod, který je na začátku v klidu a pohybuje se pouze působením gravitace, má překonat vodorovnou vzdálenost b. Výchozí bod v takovém případě samozřejmě musí být výše, než bod koncový. Má se najít „převýšení a tvar křivky, po níž se má bod pohybovat, které zaručí, aby čas potřebný k překonání vzdálenosti byl nejmenší. Zavedeme souřadný systém tak, že osa x je vodovorovná a směřuje zleva doprava, osa y je svislá a orientovaná shora dolů. Výchozí bod je v počátku souřadnic, koncový bod má první souřadnici rovnu b a druhou, vyjadřující „převýšení , zatím neurčenou, viz obr. 1. Poloha pohybujícího se bodu závisí na čase. V okamžiku t se bude bod nacházet v bodě (x, y) = x(t), y(t) , od začátku děje urazí dráhu s = s(t) a poklesne o výšku y = y(t) = y x(t) . Dráha s(t), kterou za čas t urazí, je rovna délce brachystochrony od počátečního bodu (0, 0) do bodu x(t), y(t) , tedy s(t) = x(t) 0 1 + y′(x)2 dx, (2) kde ′ označuje derivaci podle proměnné x. Rychlost v pohybujícího se bodu je derivací dráhy podle času, v = ds dt . Označíme-li m hmotnost pohybujícího se bodu, bude nárůst jeho kinetická energie od začátku pohybu ∆Wk = 1 2mv2 a ztráta energie potenciální ∆Wp = mgy. Ze zákona zachování energie 11 tedy dostaneme 1 2 m ds dt 2 = mgy, kde g je tíhové zrychlení. Poněvadž dráha s bodu v čase narůstá, je její derivace podle času kladná a tedy z poslední rovnosti dostaneme ds dt = 2gy. Za levou stranu dosadíme derivaci proměnné s dané rovností (2) podle času. Dostaneme tak obyčejnou diferenciální rovnici 1 + y′(x)2 dx dt = 2gy a po separaci proměnných dt = 1 + y′(x)2 2gy(x) dx. Integrací této rovnosti dostaneme celkový čas pohybu uvažovaného bodu jako t[y] = 1 √ 2g b 0 1 + y′(x)2 y(x) dx. (3) Tento čas závisí na tvaru křivky y = y(x). Hledáme tedy minimum funkcionálu t daného rovností (3). Poněvadž funkce F = 1 + y′2 2gy nezávisí na nezávisle proměnné x, bude Eulerova rovnice podle 2.1.1 tvaru F − y′ Fy′ = const. Jest Fy′ = 1 √ 2gy y′ 1 + y′2 , (4) takže F − y′ Fy′ = 1 2gy 1 + y′2 = const, a Eulerovu rovnici můžeme přepsat ve tvaru y 1 + y′2 = C, (5) kde C je kladná konstanta. Zavedeme substituci u = arccotg y′, tj. y′ = cotg u. Proměnnou u budeme považovat za parametr. Z rovnosti (5) vyjádříme y = C 1 + (cotg u)2 = C(sin u)2 (sin u)2 + (cos u)2 = C 2 (1 − cos 2u). (6) 12 Pak platí cotg u = dy dx = dy du du dx = C 2 2 sin 2u du dx = 2C sin u cos u du dx . Substituce tedy převádí rovnici (6) na obyčejnou diferenciální rovnici se separovanými pro- měnnými dx du = 2C(sin u)2 , jejíž obecné řešení je x = 2C (sin u)2 du = C (1 − cos 2u)du = C 2 (2u − sin 2u) + D, (7) kde D je integrační konstanta. Tato rovnost spolu s (6) představuje obecné řešení Eulerovy rovnice v parametrickém tvaru. Počáteční bod je v počátku souřadnic (0, 0), tj. y = 0 pro x = 0. Podle (6) je y = 0 pro u = 0, takže pro u = 0 musí být x = 0, což vzhledem k (7) znamená 0 = C 2 (0 − sin 0) + D = D. (8) Podle rovnosti (4) je podmínka transverzality tvaru y′(b) 2gy(b) (1 + y′(b)2) = 0 a to znamená, že y′(b) = 0. Poněvadž y′ = dy dx = dy du dy du = 2 sin 2u 2 − 2 cos 2u , je y′ = 0 pro u = π 2 . Tedy pro u = π 2 má být x = b, takže podle (7) a (8) platí b = C 2 (π − sin π) , neboli C = 2b/π. Parametrické vyjádření brachystochrony tedy je x = b π (2u − sin 2u), y = b π (1 − cos 2u), u ∈ 0, π 2 . Jedná se o cykloidu s poloměrem kotálející se kružnice b π . Koncový bod je tedy o 2b π níže, než bod výchozí. 13 3.2 Bolzova úloha Φ x(a), x(b) + b a F s, x(s), x′ (s) ds → extr Je-li F dvakrát diferencovatelná funkce tří proměnných a Φ diferencovatelná funkce dvou proměnných, V prostor funkcí definovaných a spojitě diferencovatelných na intervalu [a, b] s některou z norem ||x||0 = max{|x(t)| : t ∈ [a, b]} ||x||1 = max{max{|x(t)| : t ∈ [a, b]}, max{|x′ (t)| : t ∈ [a, b]}} , pak v[x] = Φ(x(a), x(b)) + b a F(s, x(s), x′ (s))ds je spojitý funkcionál na V s normou || · ||. Položme A = V . Hledáme lokální extrémy funkcionálu v vzhledem k A. V případě normy ||·||1 mluvíme o slabých extrémech, v případě normy ||·||0 mluvíme o silných extrémech. Opět využijeme věty 1 a 2: ϕ(α; x, h) = Φ (x(a) + αh(a), x(b) + αh(b)) + b a F(s, x(s) + αh(s), x′ (s) + αh′ (s))ds , δv(x)[h] = d dα ϕ(0; x, h) = Φx(a) (x(a), x(b)) h(a) + Φx(b) (x(a), x(b)) h(b)+ + b a Fx(s, x(s), x′ (s))h(s) + Fx′ (s, x(s), x′ (s))h′ (s) ds a budeme integrovat per partes b a Fx′ (s, x(s), x′ (s))h′ (s)ds = Fx′ (s, x(s), x′ (s))h(s) b a − b a d ds Fx′ (s, x(s), x′ (s)) h(s)ds takže 0 = δv(x)[h] = Φx(a) x(a), x(b) − Fx′ a, x(a), x′ (a) h(a)+ + Φx(b) x(a), x(b) + Fx′ b, x(b), x′ (b) h(b)+ + b a Fx s, x(s), x′ (s)) − d ds Fx′ (s, x(s), x′ (s) h(s)ds. Tato rovnost platí pro každou přípustnou funkci h ∈ A právě tehdy, když funkce x splňuje na (a, b) Eulerovu rovnici Fx = d dt Fx′ a podmínky transverzality Fx′ a, x(a), x′ (a) = Φx(a) x(a), x(b) , Fx′ b, x(b), x′ (b) = −Φx(b) x(a), x(b) . Poznamenejme, že volbou Φ ≡ 0 dostaneme úlohu předchozího typu bez omezení x(a) = x1. 14 3.3 Úlohy typu τ a F s, x(s), x′ (s) ds → extr, x(a) = x1 Nechť F je dvakrát diferencovatelná funkce tří proměnných, C1([a, ∞)) množina funkcí definovaných, ohraničených a spojitě diferencovatelných na intervalu [a, ∞), V = C1([a, ∞))×R. Na V lze zavést normu ||(x, τ)||0 = max |τ|, max{sup{|x(t)| : t ∈ [a, ∞)}, sup{|x′ (t)| : t ∈ [a, ∞)}} . Pak v[(x, τ)] = τ a F s, x(s), x′ (s) ds je spojitý funkcionál na V . Položme A = {(h, ν) ∈ V : h(a) = 0}. Hledáme lokální extrémy funkcionálu v vzhledem k A za podmínky x(a) = x1. Opět využijeme věty 1 a 2: ϕ(α; (x, τ), (h, ν)) = τ+αν a F s, x(s) + αh(s), x′ (s) + αh′ (s) ds , d dα ϕ α, (x, τ), (h, ν) = = νF τ + αν, x(τ + αν) + αh(τ + αν), x′ (τ + αν) + αh′ (τ + αν) + + τ+αν a Fx s, x(s) + αh(s), x′ (s) + αh′ (s) h(s)ds+ + τ+αν a Fx′ s, x(s) + αh(s), x′ (s)αh′ (s) h′ (s)ds, δv(x, τ)[(h, ν)] = d dα ϕ 0, (x, τ), (h, ν) = = νF τ, x(τ), x′ (τ) + τ a Fx s, x(s), x′ (s) h(s) + Fx′ s, x(s), x′ (s) h′ (s) ds . Integrací per partes a s využitím podmínky h(a) = 0 dostaneme τ a Fx′ (s, x(s), x′ (s))h′ (s)ds = = Fx′ (s, x(s), x′ (s))h(s) τ a − τ a d ds Fx′ s, x(s), x′ (s) h(s)ds = = Fx′ (τ, x(τ), x′ (τ))h(τ) − τ a d ds Fx′ s, x(s), x′ (s) h(s)ds, 15 takže platí 0 = δv(x, τ)[(h, ν)] = = νF τ, x(τ), x′ (τ) + Fx′ τ, x(τ), x′ (τ) h(τ)+ + τ a Fx s, x(s), x′ (s) − d ds Fx′ s, x(s), x′ (s) h(s)ds. Tato rovnost je splněna pro každou dvojici (h, ν) ∈ A právě tehdy, když funkce x splňuje Eulerovu rovnici Fx = d dt Fx′ a podmínky transverzality F τ, x(τ), x′ (τ) = 0 , Fx′ τ, x(τ), x′ (τ) = 0 . 4 Vázané (podmíněné) extrémy 4.1 Úlohy typu b a F s, x(s), x′ (s) ds → extr, x(a) = x1, x(b) = x2, (∀s ∈ [a, b])fj s, x(s) = 0, j = 1, 2, . . ., m Nechť F : R1+2n → R je dvakrát diferencovatelná funkce a Vn je prostor spojitě diferencovatelných vektorových funkcí x : [a, b] → Rn s normou ||x||1 = n i=1 max max{|xi(s)| : s ∈ [a, b]}, max{|x′ i(s)| : s ∈ [a, b]} . Pak v : Vn → R definovaný vztahem v[x] = b a F s, x(s), x′ (s) ds = b a F s, x1(s), . . . , xn(s), x′ 1(s), . . . , x′ n(s) ds je spojitý funkcionál na vektorovém prostoru Vn s normou || · ||1. Nechť dále fj : R1+n → R, j = 1, 2, . . . , m jsou diferencovatelné nezávislé funkce. Položme X = x ∈ Vn : (∀s ∈ [a, b])(∀j ∈ {1, 2, . . . , m})fj s, x(s) = 0 , A = {h ∈ Vn : h(a) = 0 = h(b)} , AX = {h ∈ A : (∀x ∈ X)x + h ∈ X} ; poznamenejme, že množina AX ⊆ Vn obecně není vektorový podprostor. Řekneme, že funkcionál v nabývá na x∗ ∈ Vn lokálního maxima (resp. minima) vzhledem k A na množině X, jestliže x∗ ∈ X a existuje O takové, že pro každou funkci h ∈ O ∩ AX platí v[x∗ + h] ≤ v[x∗] (resp. v[x∗+h] ≥ v[x∗]). Stručně mluvíme o extrémech za podmínek fj(x) = 0, j = 1, 2, . . . , m nebo o vázaných extrémech. 16 Uvažujme nyní prostor Vm s normou || · ||1. Buď L : R1+2n+m → R funkce definovaná vztahem L(s, x, x′ , y) = F(s, x, x′ ) + m j=1 yjfj s, x(s) (složky vektoru y se nazývají Lagrangeovy multiplikátory). Pak funkcionál v∗ : Vn × Vm → R definovaný vztahem v∗ [(x, y)] = b a L(s, x, x′ , y)ds = b a  F s, x(s), x′ (s) + m j=1 yj(s)fj s, x(s)   ds je spojitý. Položíme A∗ = {h ∈ Vn × Vm : h1(a) = h2(a) = · · · = hn(a) = 0 = h1(b) = h2(b) = · · · = hn(b)} . Prostor A lze považovat za podprostor prostoru A∗, neboť zobrazení (h1, h2, . . . , hn) → (h1, h2, . . . , hn, 0, 0, . . . , 0) je prosté. Extrémály funkcionálu v∗ podle 2.2 splňují Eulerovy rovnice Lxi − d ds Lx′ i = 0, i = 1, 2, . . . , n, Lyj − d ds Ly′ j = 0, j = 1, 2, . . . , m. Avšak Ly′ j = 0, neboť hodnota funkce L nezávisí na derivaci funkce yj, a Lyj = ∂ ∂yj F(s, x, x′ ) + m k=1 ykfk(s, x) = fj(x). Extrémály funkcionálu v∗ tedy splňují n + m rovnic Lxi − d ds Lx′ i = 0, i = 1, 2, . . . , n, fj = 0, j = 1, 2, . . . , m. Odtud plyne, že pro extrémálu (x∗, y∗) funkcionálu v∗ platí v∗ [(x∗ , y∗ )] = b a  F s, x∗ (s), x∗′ (s) + m j=1 y∗ j (s)f s, x∗ (s)   ds = = b a F s, x∗ (s), x∗′ (s) = v[x∗ ]. Poněvadž AX ⊆ A ⊆ A∗, platí: Pokud na (x∗, y∗) je lokální extrém funkcionálu v∗ vzhledem k A∗, pak na x∗ je lokální extrém funkcionálu v vzhledem k A na množině X. 17 4.1.1 Úloha o geodetických čarách Mezi všemi křivkami, které spojují dva body na ploše o rovnici f(x, y, z) = 0 se má vybrat ta, která má nejmenší délku. Délka křivky y(x), z(x) : x ∈ [x0, x1] je rovna integrálu ℓ[(y, z)] = x1 x0 1 + y′(x)2 + z′(x)2 dx, ′ označuje derivaci podle proměnné x. Hledáme tedy minimum funkcionálu ℓ za podmínky f(x, y, z) = 0. Máme L(x, y, z, y′ , z′ , λ) = 1 + y′2 + z′2 + λ(x)f(x, y, z), Ly = λfy, Ly′ = y′ 1 + y′2 + z′2 , Lz = λfz, Lz′ = z′ 1 + y′2 + z′2 . Geodetické čáry tedy splňují rovnice λfy = d dx y′ 1 + y′2 + z′2 , λfz = d dx z′ 1 + y′2 + z′2 , f(x, y, z) = 0. Eliminací Lagrangeova multiplikátoru λ z prvních dvou rovnic dostaneme fz d dx y′ 1 + y′2 + z′2 = fy d dx z′ 1 + y′2 + z′2 . Poněvadž d dx y′ 1 + y′2 + z′2 = y′′ 1 + y′2 + z′2 − y′ 2y′y′′ + 2z′z′′ 2 1 + y′2 + z′2 1 + y′2 + z′2 = = y′′ 1 + y′2 + z′2 − y′2 y′′ − y′z′z′′ 1 + y′2 + z′2 3/2 = y′′ + z′ (z′y′′ − z′′y′) 1 + y′2 + z′2 3/2 a d dx z′ 1 + y′2 + z′2 = z′′ + y′ (y′z′′ − y′′z′) 1 + y′2 + z′2 3/2 , můžeme poslední rovnici přepsat na tvar fz y′′ + z′ (z′y′′ − z′′y′) 1 + y′2 + z′2 3/2 = fy z′′ + y′ (y′z′′ − y′′z′) 1 + y′2 + z′2 3/2 . Po úpravě dostaneme, že geodetická čára splňuje rovnice fzy′′ − fyz′′ = fyy′ + fzz′ y′ z′′ − y′′ z′ , f(x, y, z) = 0. 18