Literatura Implicitně zadaná zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Drsná matematika III – 3. přednáška Funkce více proměnných: Inverzní a implicitně definovaná zobrazení, vázané extrémy Jan Slovák Masarykova univerzita Fakulta informatiky 3. 10. 2011 Literatura Implicitně zadaná zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Obsah přednášky 1 Literatura 2 Implicitně zadaná zobrazení Připomenutí z minulé přednášky Věta o implicitní funkci 3 Tečny a normály k implicitně zadaným plochám Gradient funkce Tečné a normálové prostory 4 Vázané extrémy Literatura Implicitně zadaná zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Kde je dobré číst? Zuzana Došlá, Roman Plch, Petr Sojka, Diferenciální počet funkcí více proměnných s programem Maple, MU Brno, 1999, 273 s. Riley, K.F., Hobson, M.P., Bence, S.J. Mathematical Methods for Physics and Engineering, second edition, Cambridge University Press, Cambridge 2004, ISBN 0 521 89067 5, xxiii + 1232 pp. Literatura Implicitně zadaná zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Připomenutí z minulé přednášky Zobrazení F : En → Em, F(x1, . . . , xn) = (f1(x1, . . . , xn), . . . , fm(x1, . . . , xn)) je diferencovatelné nebo spojitě diferencovatelné zobrazení, jestliže tuto vlastnost mají všechny funkce f1, . . . , fm. D1 F(x) =      df1(x) df2(x) ... dfm(x)      =       ∂f1 ∂x1 ∂f1 ∂x2 . . . ∂f1 ∂xn ∂f2 ∂x1 ∂f2 ∂x2 . . . ∂f2 ∂xn ... ... ... ... ∂fm ∂x1 ∂fm ∂x2 . . . ∂fm ∂xn       (x) se nazývá Jacobiho matice zobrazení F v bodě x. Lineární zobrazení D1F(x) definované na přírůstcích v = (v1, . . . , vn) pomocí stejně značené Jacobiho matice nazýváme diferenciál zobrazení F v bodě x z definičního oboru, jestliže lim v→0 1 v F(x + v) − F(x) − D1 F(x)(v) = 0. Literatura Implicitně zadaná zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Zobrazení F : En → Em, jehož všechny souřadné funkce mají spojité parciální derivace v okolí bodu x ∈ En, má diferenciál D1F(x) zadaný Jacobiho maticí (tj. diferenciál je lineární zobrazení s touto maticí). Theorem ("Chain Rule") Nechť F : En → Em a G : Em → Er jsou dvě diferencovatelná zobrazení, přičemž definiční obor G obsahuje celý obor hodnot F. Pak také složené zobrazení G ◦ F je diferencovatelné a jeho diferenciál je v každém bodě z definičního obodu F kompozicí diferenciálů D1 (G ◦ F)(x) = D1 G(F(x)) ◦ D1 F(x). Příslušná Jacobiho matice je dána součinem příslušných Jacobiho matic. Literatura Implicitně zadaná zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Theorem (Věta o inverzním zobrazení) Nechť F : En → En je spojitě diferencovatelné zobrazení na nějakém okolí bodu x0 ∈ En a nechť je Jacobiho matice D1f (x0) invertibilní. Pak na nějakém okolí bodu x0 existuje inverzní zobrazení F−1 a jeho diferenciál v bodě F(x0) je inverzním zobrazením k D1F(x0), tzn. je zadán inverzní maticí k Jacobiho matici zobrazení F v bodě x0. Literatura Implicitně zadaná zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Věta o implicitní funkci Pro jednoduchost vyložíme ideu v rovině E2: Pro spojitě diferencovatelné zobrazení F(x, y) : R2 → R hledejme body (x, y), ve kterých platí F(x, y) = 0. Příkladem může být třeba obvyklá (implicitní) definice přímek a kružnic: F(x, y) = ax + by + c = 0 F(x, y) = (x − s)2 + (y − t)2 − r2 = 0, r > 0. V prvém případě je (při b = 0) předpisem zadaná funkce y = f (x) = − a b x − c b pro všechna x, ve druhém umíme pouze pro (a, b) splňující rovnici kružnice a b = t najít okolí bodu a, na kterém nastane jedna z možností: y = f (x) = t + (x − s)2 − r, y = f (x) = t − (x − s)2 − r. Literatura Implicitně zadaná zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Krajní body intervalu [t − r, t + r] také vyhovují rovnici kružnice, platí v nich ale Fy (s ± r, t) = 0, což vystihuje polohu tečny ke kružnici v těchto bodech rovnoběžné s osou y. V těchto bodech skutečně neumíme najít okolí, na němž by kružnice byla popsána jako funkce y = f (x). Navíc umíme i derivace: f (x) = 1 2 2(x − s) (x − s)2 − r2 = x − s y − t = − Fx Fy . Naopak, pokud budeme chtít najít závislost x = f (y) takovou, aby F(f (y), y) = 0, pak v okolí bodů (s ± r, t) bez problémů uspějeme. Všimněme si, že v těchto bodech je parciální derivace Fx nenulová. Literatura Implicitně zadaná zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Zhrňme pozorování (pro pouhé dva příklady): Pro funkci F(x, y) a bod (a, b) ∈ E2 takový, že F(a, b) = 0, umíme najít funkci y = f (x) splňující F(x, f (x)) = 0, pokud je Fy (a, b) = 0. V takovém případě umím i vypočíst f (x) = −Fx /Fy . Dokážeme, že takto to platí vždy, navíc rozšířené i na libovolné počty proměnných. Poslední tvrzení o derivaci přitom je dobře zapamatovalné (a při pečlivém vnímání věcí i pochopitelné) z výrazu pro diferenciál: 0 = dF = Fx dx + Fy dy = (Fx + Fy f (x))dx. Literatura Implicitně zadaná zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Obdobně pro implicitní výrazy F(x, y, z) = 0, kdy hledáme funkci g(x, y) takovou, že F(x, y, g(x, y)) = 0. Např. graf funkce f (x, y) = x2 + y2 (rotační paraboloid) můžeme implicitně zadat rovnicí 0 = F(x, y, z) = z − x2 − y2 . Jaké dimenze se mohou/mají v problému vyskytovat obecně? Pokud bychom pro naší poslední F chtěli najít křivku c(x) = (c1(x), c2(x)) v rovině takovou, že F(x, c(x)) = F(x, c1(x), c2(x)) = 0, pak to lze, ale výsledek nebude jednoznačný pro danou počáteční podmínku. Literatura Implicitně zadaná zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Obecný postup: Jedna funkce m + 1 proměnných zadává implicitně nadplochu v Rm+1, kterou vyjadřujeme alespoň lokálně jako graf jedné funkce v m proměnných. Proto n funkcí v m + n proměnných bude zadávat průnik n nadploch v Rm+n, což je ve „většině“ případů m–rozměrný objekt. Příklad: dvě rovnice f (x, y, z) = 0, g(x, y, z) = 0 v E3 zadávají (za nějaké podmínky na derivace) křivku v E3. Literatura Implicitně zadaná zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Uvažujme proto spojitě diferencovatelné zobrazení F = (f1, . . . , fn) : Rm+n → Rn . Jacobiho matice tohoto zobrazení bude mít n řádků a m + n sloupců a můžeme si ji symbolicky zapsat jako D1 F = (D1 x F, D1 y F) =    ∂f1 ∂x1 . . . ∂f1 ∂xm ... ... ... ∂fn ∂x1 . . . ∂fn ∂xm ∂f1 ∂xm+1 . . . ∂f1 ∂xm+n ... ... ... ∂fn ∂xm+1 . . . ∂fn ∂xm+n    , kde (x1, . . . , xm+n) ∈ Rm+n zapisujeme jako (x, y) ∈ Rm × Rn, D1 x F je matice s n řádky a prvními m sloupci v Jacobiho matici, zatímco D1 y F je čtvercová matice řádu n se zbylými sloupci. Vícerozměrnou analogií k předchozí úvaze s nenulovou parciální derivací podle y je požadavek, aby matice D1 y byla invertibilní. Literatura Implicitně zadaná zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Theorem (Věta o implicitním zobrazení) Nech F : Rm+n → Rn je spojitě diferencovatelné zobrazení na otevřeném okolí bodu (a, b) ∈ Rm × Rn = Rm+n, ve kterém je F(a, b) = 0 a det D1 y F = 0. Potom existuje spojitě diferencovatelné zobrazení G : Rm → Rn definované na nějakém okolí U bodu a ∈ Rm s obrazem G(U), který obsahuje bod b, a takové, že F(x, G(x)) = 0 pro všechny x ∈ U. Navíc je Jacobiho matice D1G zobrazení G na okolí bodu a zadána součinem matic D1 G(x) = −(D1 y F)−1 (x, G(x)) · D1 x F(x, G(x)). Literatura Implicitně zadaná zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Dokážeme pro nejjednodušší případ rovnice F(x, y) = 0 s funkcí F dvou proměnných. Rozšíříme funkci F na ˜F : R2 → R2 , (x, y) → (x, F(x, y)). Jacobiho matice zobrazení ˜F je D1 ˜F(x, y) = 1 0 Fx (x, y) Fy (x, y) . Z předpokladu Fy (a, b) = 0 vyplývá, že totéž platí i na nějakém okolí bodu (a, b) a tam je funkce ˜F invertibilní a ˜F−1 je jednoznačně definované a spojitě diferencovatelné. Literatura Implicitně zadaná zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy π : R2 → R je projekce na druhou souřadnici, f (x) = π ◦ ˜F−1 (x, 0) je spojitě diferencovatelná funkce. Spočteme F(x, f (x)) = F(x, π(˜F−1(x, 0))). Z definice ˜F(x, y) = (x, F(x, y)) vidíme, že i její inverze má tvar ˜F−1(x, y) = (x, π˜F−1(x, y)). Proto F(x, f (x)) = π(˜F(x, π(˜F−1 (x, 0)))) = π(˜F(˜F−1 (x, 0))) = π(x, 0) = 0. Tím máme dokázánu první část věty a zbývá spočíst derivaci funkce f (x). Literatura Implicitně zadaná zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Tuto derivaci můžeme odečíst opět z věty o inverzním zobrazení pomocí matice (D1 ˜F)−1. 1 0 Fx (x, y) Fy (x, y) −1 = (Fy (x, y))−1 Fy (x, y) 0 −Fx (x, y) 1 . Dle definice f (x) = π˜F−1(x, 0) nás z této matice zajímá první položka na druhém řádku, která je právě Jakobiho maticí D1f . V našem jednoduchém případě je to právě požadovaný skalár −Fx (x, f (x))/Fy (x, f (x)). Důkaz věty je ukončen. Pro obecný případ je zcela stejný, jen pracujeme s násobením matic a vektorů místo skalárů. Literatura Implicitně zadaná zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Gradient funkce Definition Pro spojitě diferencovatelnou funkci F(x1, . . . , xn) : Rn → R se vektor D1 F = ∂f ∂x1 , . . . , ∂f ∂xn nazývá gradient funkce F. V technické a fyzikální literatuře se často zapisuje také jako grad F. Rovnost F(x1, . . . , xn) = b s pevnou hodnotou b ∈ R zadává podmnožinu M ⊂ Rn, která mívá vlastnosti (n − 1)–rozměrné nadplochy. Přesněji: pokud je vektor parciálních derivací nenulový, můžeme lokálně množinu M popsat jako graf spojitě diferencovatelné funkce v n − 1 proměnných. Hovoříme v této souvislosti také o úrovňových množinách Mb. Literatura Implicitně zadaná zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Na derivacích křivek ležících v úrovňové množině Mb se bude diferenciál dF vždy vyčíslovat nulově: F(c(t)) = b pro všechna t, proto d dt F(c(t)) = dF(c (t)) = 0. Pro obecný vektor v = (v1, . . . , vn) ∈ Rn je velikost příslušné směrové derivace funkce F: |dv F| = ∂f ∂x1 v1 + · · · + ∂f ∂xn vn = cos ϕ D1 F v kde ϕ je odchylka vektoru v od gradientu F. Dokázali jsme: Theorem Směr zadaný gradientem v bodě x = (x1, . . . , xn) je právě ten směr, ve kterém funkce F nejrychleji roste. Tečná rovina k neprázdné úrovňové množině Mb v okolí jejího bodu s nenulovým gradientem D1F je určena ortogonálním doplňkem ke gradientu. Literatura Implicitně zadaná zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Násobkům gradientu v tomto případě říkáme normálový vektor nadplochy Mb. Theorem Pro funkci F n proměnných a bod P = (a1, . . . , an) ∈ Mb v jehož okolí je Mb grafem funkce (n − 1) proměnných je implicitní rovnice pro tečnou nadrovinu 0 = ∂f ∂x1 (P) · (x1 − a1) + · · · + ∂f ∂xn (P) · (xn − an). Literatura Implicitně zadaná zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Example (Model osvětlení 3D objektu) Pro 2D povrch známe směr v dopadu světla, tj. máme množinu M zadanou implicitně rovnicí F(x, y, z) = 0 a vektor v. Intenzitu osvětlení bodu P ∈ M pak definujme jako I cos ϕ, kde ϕ je úhel mezi normálou zadanou gradientem a vektorem opačným ke směru světla. (Znaménko říká, kterou stranu plochy osvětlujeme.) Např. v = (1, 1, −1) (tj. „šikmo dolů“) a F(x, y, z) = x2 + y2 + z2 − 1. Pro bod P = (x, y, z) ∈ M I(P) = grad F · v grad F v I0 = −2x − 2y + 2z 2 √ 3 I0. Dle očekávání je plnou intenzitou I0 osvětlen bod P = 1√ 3 (−1, −1, 1) na povrchu koule. Literatura Implicitně zadaná zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Tečné a normálové prostory Obecné dimenze: funkce F = (f1, . . . , fn) : Rm+n → Rn a n rovnic fi (x1, . . . , xm+n) = bi , i = 1, . . . , n. dle věty o implicitní funkci je „většinou“ množina všech řešení (x1, . . . , xm+n) grafem zobrazení G : Rm → Rn. Pro pevnou volbu b = (b1, . . . , bn) je samozřejmě množinou M všech řešení průnik nadploch M(bi , fi ) příslušejících jednotlivým rovnicím fi = bi . Totéž platí pro tečné směry a normálové směry: Afinní podprostor v Rm+n obsahující právě všechny tečny k M bodem P dán rovnicemi: 0 = ∂f1 ∂x1 (P) · (x1 − a1) + · · · + ∂f1 ∂xn (P) · (xm+n − am+n) ... 0 = ∂fn ∂x1 (P) · (x1 − a1) + · · · + ∂fn ∂xn (P) · (xm+n − am+n). Literatura Implicitně zadaná zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Tento podprostor se nazývá tečný prostor k (implicitně zadané) ploše M v bodě P. Normálový prostor v bodě P je afinní podprostor generovaný bodem P a gradienty všech funkcí f1, . . . , fn v bodě P, tj. řádky Jacobiho matice D1F. Spočtěme tečnu a normálový prostor ke kuželosečce v R3. Uvažujme rovnici 0 = f (x, y, z) = z − x2 + y2 kuželu s vrcholem v počátku a rovinu zadanou 0 = g(x, y, z) = z − 2x + y + 1. Bod P = (1, 0, 1) patří jak kuželu tak rovině a průnik M těchto dvou ploch je křivka. Literatura Implicitně zadaná zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Její tečnou v bodě P bude přímka zadaná rovnicemi 0 = − 1 2 x2 + y2 2x x=1,y=0 · (x − 1) − 1 2 x2 + y2 2y x=1,y=0 · y + 1 · (z − 1) = −x + z 0 = −2(x − 1) + y + (z − 1) = −2x + y + z + 1 zatímco rovina kolmá k naší křivce bodem P bude parametricky dána výrazem (1, 0, 1) + τ(−1, 0, 1) + σ(−2, 1, 1) s parametry τ a σ. Literatura Implicitně zadaná zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy V praxi mívají optimalizační úlohy často m + n parametrů, které jsou vázány n podmínkami. V našem jazyce diferenciálního počtu tedy hledáme extrémy spojitě diferencovatelné funkce h na množině bodů M zadaných implicitně rovnicí F(x1, . . . , xm+n) = 0. Pokud je M ve všech svých bodech grafem hladkého zobrazení v m proměnných, musí být každý extrém P ∈ M stacionárním bodem, tj. pro každou křivku c(t) ⊂ M procházející přes P = c(0) musí být h(c(t)) extrémem pro tuto funkci jedné proměnné. Proto musí platit d dt h(c(t))|t=0 = dc (0)h(P) = dh(P)(c (0)) = 0. Tato vlastnost je ekvivalentní tvrzení, že gradient h leží v normálovém podprostoru (přesněji v jeho zaměření). Takové body P ∈ M budeme nazývat stacionární body funkce H vzhledem k vazbám F. Literatura Implicitně zadaná zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Normálový prostor k naší množině M je generován řádky Jacobiho matice zobrazení F a stacionární body jsou proto ekvivalentně určeny následujícím tvrzením, kterému se říká metoda Lagrangeových multiplikátorů: Theorem Nech F = (f1, . . . , fn) : Rm+n → Rn je spojitě diferencovatelná v okolí bodu P, F(P) = 0 a M je zadána implicitně rovnicí F(x, y) = 0 a hodnost matice D1F v bodě P je n. Pak P je stacionárním bodem spojitě diferencovatelné funkce h : Rm+n → R právě, když existují reálné parametry λ1, . . . , λn takové, že grad h = λ1 grad f1 + · · · + λn grad fn. Literatura Implicitně zadaná zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Všimněme si počtu neznámých a rovnic v tomto algoritmu: gradienty jsou vektory o m + n souřadnicích, tedy požadavek z věty dává m + n rovnic. Jako proměnné máme jednak souřadnice x1, . . . , xm+n hledaných stacionárních bodů P, ale navíc také n parametrů λi v hledané lineární kombinaci. Zbývá však požadavek, že hledaný bod P patří implicitně zadané množině M, což představuje dalších n rovnic. Celkem tedy máme n + m rovnic pro n + m proměnných a proto lze očekávat, že řešením bude diskrétní množina bodů P (tj. každý z nich bude izolovaným bodem).