Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Matematika III ­ 3. přednáška Funkce více proměnných: věta o implicitní funkci, vázané extrémy Masarykova univerzita Fakulta informatiky 30. 9. 2008 Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Obsah přednášky 1 Inverzní a implicitní zobrazení Věta o inverzním zobrazení Implicitně zadaná zobrazení 2 Tečny a normály k implicitně zadaným plochám Gradient funkce Tečné a normálové prostory 3 Vázané extrémy Metoda Lagrangeových multiplikátorů Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Doporučené zdroje Martin Panák, Jan Slovák, Drsná matematika, e-text. Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Doporučené zdroje Martin Panák, Jan Slovák, Drsná matematika, e-text. Zuzana Došlá, Ondřej Došlý, Diferenciální počet funkcí více proměnných, MU Brno, 2006, 150 s. Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Doporučené zdroje Martin Panák, Jan Slovák, Drsná matematika, e-text. Zuzana Došlá, Ondřej Došlý, Diferenciální počet funkcí více proměnných, MU Brno, 2006, 150 s. Zuzana Došlá, Roman Plch, Petr Sojka, Diferenciální počet funkcí více proměnných s programem Maple, MU Brno, 1999, 273 s. (příp. http://www.math.muni.cz/~plch/mapm). Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Doporučené zdroje Martin Panák, Jan Slovák, Drsná matematika, e-text. Zuzana Došlá, Ondřej Došlý, Diferenciální počet funkcí více proměnných, MU Brno, 2006, 150 s. Zuzana Došlá, Roman Plch, Petr Sojka, Diferenciální počet funkcí více proměnných s programem Maple, MU Brno, 1999, 273 s. (příp. http://www.math.muni.cz/~plch/mapm). Předmětové záložky v IS MU Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Plán přednášky 1 Inverzní a implicitní zobrazení Věta o inverzním zobrazení Implicitně zadaná zobrazení 2 Tečny a normály k implicitně zadaným plochám Gradient funkce Tečné a normálové prostory 3 Vázané extrémy Metoda Lagrangeových multiplikátorů Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Věta o inverzním zobrazení Věta Nechť F : En En je spojitě diferencovatelné zobrazení na nějakém okolí bodu x0 En a nechť je Jacobiho matice D1F(x0) invertibilní. Pak na nějakém okolí bodu x0 existuje inverzní zobrazení F-1 a jeho diferenciál v bodě F(x0) je inverzním zobrazením k D1F(x0), tzn. je zadán inverzní maticí k Jacobiho matici zobrazení F v bodě x0. Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Věta o inverzním zobrazení Věta Nechť F : En En je spojitě diferencovatelné zobrazení na nějakém okolí bodu x0 En a nechť je Jacobiho matice D1F(x0) invertibilní. Pak na nějakém okolí bodu x0 existuje inverzní zobrazení F-1 a jeho diferenciál v bodě F(x0) je inverzním zobrazením k D1F(x0), tzn. je zadán inverzní maticí k Jacobiho matici zobrazení F v bodě x0. Princip důkazu: Z pravidla pro derivování složené funkce vyplývá, že pokud diferencovatelná inverze existuje, pak musí být její Jacobiho matice inverzí k původní Jacobiho matici (srovnejte s případem 1 proměnné). Důkaz poměrně komplikovaným způsobem vyvozuje, že díky invertovatelnosti Jacobiho matice existuje diferencovatelná inverze. Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Věta o implicitní funkci Pro jednoduchost vyložíme ideu v rovině E2: Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Věta o implicitní funkci Pro jednoduchost vyložíme ideu v rovině E2: Pro spojitě diferencovatelnou funkci F(x, y) : E2 R hledejme body [x, y], ve kterých platí F(x, y) = 0. Příkladem může být třeba obvyklá (implicitní) definice přímek a kružnic: F(x, y) = ax + by + c = 0 F(x, y) = (x - s)2 + (y - t)2 - r2 = 0, r > 0. Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Věta o implicitní funkci Pro jednoduchost vyložíme ideu v rovině E2: Pro spojitě diferencovatelnou funkci F(x, y) : E2 R hledejme body [x, y], ve kterých platí F(x, y) = 0. Příkladem může být třeba obvyklá (implicitní) definice přímek a kružnic: F(x, y) = ax + by + c = 0 F(x, y) = (x - s)2 + (y - t)2 - r2 = 0, r > 0. V prvním případě je (při b = 0) předpisem zadaná funkce y = f (x) = - a b x - c b pro všechna x. Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Věta o implicitní funkci Pro jednoduchost vyložíme ideu v rovině E2: Pro spojitě diferencovatelnou funkci F(x, y) : E2 R hledejme body [x, y], ve kterých platí F(x, y) = 0. Příkladem může být třeba obvyklá (implicitní) definice přímek a kružnic: F(x, y) = ax + by + c = 0 F(x, y) = (x - s)2 + (y - t)2 - r2 = 0, r > 0. V prvním případě je (při b = 0) předpisem zadaná funkce y = f (x) = - a b x - c b pro všechna x. Ve druhém případě umíme pouze pro [a, b] splňující rovnici kružnice a b = t najít okolí bodu a, na kterém nastane jedna z možností: y = f (x) = t + r2 - (x - s)2, y = f (x) = t - r2 - (x - s)2. Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Body [s r, t] také vyhovují rovnici kružnice, platí v nich ale Fy (s r, t) = 0, což vystihuje polohu tečny ke kružnici v těchto bodech rovnoběžné s osou y. V těchto bodech neumíme najít okolí, na němž by kružnice byla popsána jako funkce y = f (x). Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Body [s r, t] také vyhovují rovnici kružnice, platí v nich ale Fy (s r, t) = 0, což vystihuje polohu tečny ke kružnici v těchto bodech rovnoběžné s osou y. V těchto bodech neumíme najít okolí, na němž by kružnice byla popsána jako funkce y = f (x). Navíc umíme spočítat i derivace: f (x) = - 1 2 2(x - s) r2 - (x - s)2 = x - s y - t = - Fx Fy . Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Body [s r, t] také vyhovují rovnici kružnice, platí v nich ale Fy (s r, t) = 0, což vystihuje polohu tečny ke kružnici v těchto bodech rovnoběžné s osou y. V těchto bodech neumíme najít okolí, na němž by kružnice byla popsána jako funkce y = f (x). Navíc umíme spočítat i derivace: f (x) = - 1 2 2(x - s) r2 - (x - s)2 = x - s y - t = - Fx Fy . Naopak, pokud budeme chtít najít závislost x = f (y) takovou, aby F(f (y), y) = 0, pak v okolí bodů (s r, t) bez problémů uspějeme. Všimněme si, že v těchto bodech je parciální derivace Fx nenulová. Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Shrňme pozorování (pro pouhé dva příklady): Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Shrňme pozorování (pro pouhé dva příklady): Pro funkci F(x, y) a bod [a, b] E2 takový, že F(a, b) = 0, umíme najít funkci y = f (x) splňující F(x, f (x)) = 0, pokud je Fy (a, b) = 0. V takovém případě umíme i vypočíst f (x) = -Fx /Fy . Z následující věty plyne, že takto to platí vždy, navíc rozšířené i na libovolné počty proměnných. Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Shrňme pozorování (pro pouhé dva příklady): Pro funkci F(x, y) a bod [a, b] E2 takový, že F(a, b) = 0, umíme najít funkci y = f (x) splňující F(x, f (x)) = 0, pokud je Fy (a, b) = 0. V takovém případě umíme i vypočíst f (x) = -Fx /Fy . Z následující věty plyne, že takto to platí vždy, navíc rozšířené i na libovolné počty proměnných. Poslední tvrzení o derivaci přitom je dobře zapamatovalné (i pochopitelné) z výrazu pro diferenciál: 0 = dF = Fx dx + Fy dy = (Fx + Fy f (x)) dx. Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Věta (O implicitní funkci) Nechť F : En+1 R je spojitě diferencovatelná funkce na otevřeném okolí bodu [x0, y0] En × R, ve kterém je F(x0, y0) = 0 a F y (x0, y0) = 0. Potom existuje spojitá funkce f : En R definovaná na nějakém okolí U bodu x0 En taková, že F(x, f (x)) = 0 pro všechny x U. Navíc má funkce f v okolí bodu x0 parciální derivace splňující f xi (x) = - F xi (x, f (x)) F y (x, f (x)) . Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Příklad Určete lokální extrémy funkce z = f (x, y), která je určena implicitně rovnicí F(x, y, z) = x2 + y2 + z2 - xz - 2yz = 1. Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Příklad Určete lokální extrémy funkce z = f (x, y), která je určena implicitně rovnicí F(x, y, z) = x2 + y2 + z2 - xz - 2yz = 1. Řešení Derivováním rovnosti podle x a y dostáváme: 2x + 2z zx - z - x zx - 2yzx = 0 2y + 2z zy - x zy - 2z - 2yzy = 0, odkud vyjádříme zx = z - 2x 2z - x - 2y , zy = 2z - 2y 2z - x - 2y . Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Řešení (pokr.) Stacionární body musí splňovat: zx = 0, zy = 0, tj. z = 2x = 2y, a tedy y = 2x. Dosazením do původní rovnice dostáváme stacionární body [1, 2, 2] a [-1, - 2, -2]. V těchto bodech je Fz = 0 (je to zároveň jmenovatel všech zde vystupujících zlomků), proto je v jejich okolí implicitně určena jistá funkce z = f (x, y). Dalším derivováním implicitní rovnice vypočteme parciální derivace f 2. řádu: zxx = - 2 2z - x - 2y , zxy = 0, zyy = - 2 2z - x - 2y . Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Řešení (pokr.) Stacionární body musí splňovat: zx = 0, zy = 0, tj. z = 2x = 2y, a tedy y = 2x. Dosazením do původní rovnice dostáváme stacionární body [1, 2, 2] a [-1, - 2, -2]. V těchto bodech je Fz = 0 (je to zároveň jmenovatel všech zde vystupujících zlomků), proto je v jejich okolí implicitně určena jistá funkce z = f (x, y). Dalším derivováním implicitní rovnice vypočteme parciální derivace f 2. řádu: zxx = - 2 2z - x - 2y , zxy = 0, zyy = - 2 2z - x - 2y . Ve stacionárních bodech je Hf negativně, resp. pozitivně definitní, proto zde nastávají lokální maximum, resp. minimum funkce f . Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Nejobecnější případ, kdy definujeme implicitně zadané zobrazení, popisuje následující věta (v případě n=1 kopíruje větu o implicitní funkci). Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Nejobecnější případ, kdy definujeme implicitně zadané zobrazení, popisuje následující věta (v případě n=1 kopíruje větu o implicitní funkci). Věta (O implicitním zobrazení) Nechť F : Em+n En je spojitě diferencovatelné zobrazení na otevřeném okolí bodu [x0, y0] Em × En = Em+n, v němž platí F(x0, y0) = 0 a det D1 y F = 0. Potom existuje spojitě diferencovatelné zobrazení G : Em En definované na nějakém okolí U bodu x0 Em s obrazem G(U), který obsahuje bod y0, a takové, že F(x, G(x)) = 0 pro všechny x U. Navíc je Jacobiho matice D1G zobrazení G na okolí bodu x0 zadána součinem matic D1 G(x) = -(D1 y F)-1 (x, G(x)) D1 x F(x, G(x)). Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Plán přednášky 1 Inverzní a implicitní zobrazení Věta o inverzním zobrazení Implicitně zadaná zobrazení 2 Tečny a normály k implicitně zadaným plochám Gradient funkce Tečné a normálové prostory 3 Vázané extrémy Metoda Lagrangeových multiplikátorů Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Gradient funkce Definition Pro spojitě diferencovatelnou funkci f (x1, . . . , xn) : En R se vektor df = f x1 , . . . , f xn nazývá gradient funkce f . V technické a fyzikální literatuře se často zapisuje také jako grad f . Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Gradient funkce Definition Pro spojitě diferencovatelnou funkci f (x1, . . . , xn) : En R se vektor df = f x1 , . . . , f xn nazývá gradient funkce f . V technické a fyzikální literatuře se často zapisuje také jako grad f . Rovnost f (x1, . . . , xn) = b s pevnou hodnotou b R zadává podmnožinu M En, která mívá vlastnosti (n - 1)­rozměrné nadplochy. Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Gradient funkce Definition Pro spojitě diferencovatelnou funkci f (x1, . . . , xn) : En R se vektor df = f x1 , . . . , f xn nazývá gradient funkce f . V technické a fyzikální literatuře se často zapisuje také jako grad f . Rovnost f (x1, . . . , xn) = b s pevnou hodnotou b R zadává podmnožinu M En, která mívá vlastnosti (n - 1)­rozměrné nadplochy. Přesněji: pokud je vektor parciálních derivací nenulový, můžeme lokálně množinu M popsat jako graf spojitě diferencovatelné funkce v n - 1 proměnných. Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Gradient funkce Definition Pro spojitě diferencovatelnou funkci f (x1, . . . , xn) : En R se vektor df = f x1 , . . . , f xn nazývá gradient funkce f . V technické a fyzikální literatuře se často zapisuje také jako grad f . Rovnost f (x1, . . . , xn) = b s pevnou hodnotou b R zadává podmnožinu M En, která mívá vlastnosti (n - 1)­rozměrné nadplochy. Přesněji: pokud je vektor parciálních derivací nenulový, můžeme lokálně množinu M popsat jako graf spojitě diferencovatelné funkce v n - 1 proměnných. Hovoříme v této souvislosti také o úrovňových množinách Mb (analogie vrstevnic v př. n = 2). Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Na derivacích křivek ležících v úrovňové množině Mb se bude diferenciál df vždy vyčíslovat nulově: f (c(t)) = b pro všechna t, proto d dt f (c(t)) = df (c (t)) = 0. Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Na derivacích křivek ležících v úrovňové množině Mb se bude diferenciál df vždy vyčíslovat nulově: f (c(t)) = b pro všechna t, proto d dt f (c(t)) = df (c (t)) = 0. Pro obecný vektor v = (v1, . . . , vn) En je velikost příslušné směrové derivace funkce f : | dv f | = f x1 v1 + + f xn vn = cos df v kde je odchylka vektoru v od gradientu funkce f . Dokázali jsme: Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Na derivacích křivek ležících v úrovňové množině Mb se bude diferenciál df vždy vyčíslovat nulově: f (c(t)) = b pro všechna t, proto d dt f (c(t)) = df (c (t)) = 0. Pro obecný vektor v = (v1, . . . , vn) En je velikost příslušné směrové derivace funkce f : | dv f | = f x1 v1 + + f xn vn = cos df v kde je odchylka vektoru v od gradientu funkce f . Dokázali jsme: Věta Směr zadaný gradientem v bodě x = (x1, . . . , xn) je právě ten směr, ve kterém funkce f nejrychleji roste. Tečná rovina k neprázdné úrovňové množině Mb v okolí jejího bodu s nenulovým gradientem df je určena ortogonálním doplňkem ke gradientu. Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Násobkům gradientu v tomto případě říkáme normálový vektor nadplochy Mb. Věta Pro funkci f n proměnných a bod P = (a1, . . . , an) Mb v jehož okolí je Mb grafem funkce (n - 1) proměnných je implicitní rovnice pro tečnou nadrovinu 0 = f x1 (P) (x1 - a1) + + f xn (P) (xn - an). Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Example (Model osvětlení 3D objektu) Pro 2D povrch známe směr v dopadu světla, tj. máme množinu M zadanou implicitně rovnicí f (x, y, z) = 0 a vektor v. Intenzitu osvětlení bodu P M pak definujme jako I0 cos , kde je úhel mezi normálou zadanou gradientem a vektorem opačným ke směru světla. (Znaménko říká, kterou stranu plochy osvětlujeme, I0 je tzv. svítivost.) Např. v = (1, 1, -1) (tj. ,,šikmo dolů ) a f (x, y, z) = x2 + y2 + z2 - 1. Pro bod P = (x, y, z) M I(P) = grad f v grad f v I0 = -2x - 2y + 2z 2 3 I0. Dle očekávání je plnou intenzitou I0 osvětlen bod P = 1 3 (-1, -1, 1) na povrchu koule. Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Tečné a normálové prostory Obecné dimenze: funkce F = (f1, . . . , fn) : Em+n En a n rovnic fi (x1, . . . , xm+n) = bi , i = 1, . . . , n. dle věty o implicitní funkci je ,,většinou množina všech řešení (x1, . . . , xm+n) grafem zobrazení G : Em En. Pro pevnou volbu b = (b1, . . . , bn) je samozřejmě množinou M všech řešení průnik nadploch M(bi , fi ) příslušejících jednotlivým rovnicím fi = bi . Totéž platí pro tečné směry a normálové směry: Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Tečné a normálové prostory Obecné dimenze: funkce F = (f1, . . . , fn) : Em+n En a n rovnic fi (x1, . . . , xm+n) = bi , i = 1, . . . , n. dle věty o implicitní funkci je ,,většinou množina všech řešení (x1, . . . , xm+n) grafem zobrazení G : Em En. Pro pevnou volbu b = (b1, . . . , bn) je samozřejmě množinou M všech řešení průnik nadploch M(bi , fi ) příslušejících jednotlivým rovnicím fi = bi . Totéž platí pro tečné směry a normálové směry: Afinní podprostor v Em+n obsahující právě všechny tečny k M bodem P dán rovnicemi: 0 = f1 x1 (P) (x1 - a1) + + f1 xn (P) (xm+n - am+n) ... 0 = fn x1 (P) (x1 - a1) + + fn xn (P) (xm+n - am+n). Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Tento podprostor se nazývá tečný prostor k (implicitně zadané) ploše M v bodě P. Normálový prostor v bodě P je afinní podprostor generovaný bodem P a gradienty všech funkcí f1, . . . , fn v bodě P, tj. řádky Jacobiho matice D1F. Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Tento podprostor se nazývá tečný prostor k (implicitně zadané) ploše M v bodě P. Normálový prostor v bodě P je afinní podprostor generovaný bodem P a gradienty všech funkcí f1, . . . , fn v bodě P, tj. řádky Jacobiho matice D1F. Příklad Spočtěme tečnu a normálový prostor ke kuželosečce v E3. Uvažujme rovnici 0 = f (x, y, z) = z - x2 + y2 kuželu s vrcholem v počátku a rovinu zadanou 0 = g(x, y, z) = z - 2x + y + 1. Bod P = (1, 0, 1) patří jak kuželu, tak rovině a průnik M těchto dvou ploch je křivka. Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Příklad (pokr.) Její tečnou v bodě P bude přímka zadaná rovnicemi Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Příklad (pokr.) Její tečnou v bodě P bude přímka zadaná rovnicemi 0 = - 1 2 x2 + y2 2x x=1,y=0 (x - 1) - 1 2 x2 + y2 2y x=1,y=0 y + 1 (z - 1) = -x + z 0 = -2(x - 1) + y + (z - 1) = -2x + y + z + 1 Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Příklad (pokr.) Její tečnou v bodě P bude přímka zadaná rovnicemi 0 = - 1 2 x2 + y2 2x x=1,y=0 (x - 1) - 1 2 x2 + y2 2y x=1,y=0 y + 1 (z - 1) = -x + z 0 = -2(x - 1) + y + (z - 1) = -2x + y + z + 1 zatímco rovina kolmá k naší křivce bodem P bude parametricky dána výrazem (1, 0, 1) + (-1, 0, 1) + (-2, 1, 1) s parametry a . Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Plán přednášky 1 Inverzní a implicitní zobrazení Věta o inverzním zobrazení Implicitně zadaná zobrazení 2 Tečny a normály k implicitně zadaným plochám Gradient funkce Tečné a normálové prostory 3 Vázané extrémy Metoda Lagrangeových multiplikátorů Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Již dříve jsme se zabývali úlohou nalézt absolutní extrém dané funkce na (uzavřené) množině, což vedlo na vyšetření lokálních extrémů funkce na hranici této množiny. Jinými slovy, na hledání extrémů funkce v bodech, které jsou vázány nějakou další podmínkou. Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Metoda Lagrangeových multiplikátorů V předchozím příkladu jsme viděli, že normálový vektor (tj. gradient) funkce, k níž hledáme extrém, musí být ve vyšetřovaném bodě prvkem normálového prostoru k ploše (v témže bodě). Toto samozřejmě platí i obecně. Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Metoda Lagrangeových multiplikátorů V předchozím příkladu jsme viděli, že normálový vektor (tj. gradient) funkce, k níž hledáme extrém, musí být ve vyšetřovaném bodě prvkem normálového prostoru k ploše (v témže bodě). Toto samozřejmě platí i obecně. Pokud je M ve všech svých bodech grafem hladkého zobrazení, musí být každý extrém P M stacionárním bodem, tj. pro každou křivku c(t) M procházející přes P = c(0) musí být h(c(t)) extrémem pro tuto funkci jedné proměnné. Proto musí platit d dt h(c(t))|t=0 = dc (0)h(P) = dh(P)(c (0)) = 0. Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Metoda Lagrangeových multiplikátorů V předchozím příkladu jsme viděli, že normálový vektor (tj. gradient) funkce, k níž hledáme extrém, musí být ve vyšetřovaném bodě prvkem normálového prostoru k ploše (v témže bodě). Toto samozřejmě platí i obecně. Pokud je M ve všech svých bodech grafem hladkého zobrazení, musí být každý extrém P M stacionárním bodem, tj. pro každou křivku c(t) M procházející přes P = c(0) musí být h(c(t)) extrémem pro tuto funkci jedné proměnné. Proto musí platit d dt h(c(t))|t=0 = dc (0)h(P) = dh(P)(c (0)) = 0. Tato vlastnost je ekvivalentní tvrzení, že gradient h leží v normálovém podprostoru (přesněji v jeho zaměření). Takové body P M budeme nazývat stacionární body funkce h vzhledem k vazbám F. Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy V praxi mívají optimalizační úlohy často m + n parametrů, které jsou vázány n podmínkami. V našem jazyce diferenciálního počtu tedy hledáme extrémy spojitě diferencovatelné funkce h na množině bodů M zadaných implicitně rovnicí F(x1, . . . , xm+n) = 0 (F : Em+n En). Normálový prostor k naší množině M je generován řádky Jacobiho matice zobrazení F a stacionární body jsou proto ekvivalentně určeny následujícím tvrzením, kterému se říká metoda Lagrangeových multiplikátorů: Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy V praxi mívají optimalizační úlohy často m + n parametrů, které jsou vázány n podmínkami. V našem jazyce diferenciálního počtu tedy hledáme extrémy spojitě diferencovatelné funkce h na množině bodů M zadaných implicitně rovnicí F(x1, . . . , xm+n) = 0 (F : Em+n En). Normálový prostor k naší množině M je generován řádky Jacobiho matice zobrazení F a stacionární body jsou proto ekvivalentně určeny následujícím tvrzením, kterému se říká metoda Lagrangeových multiplikátorů: Věta Nechť F = (f1, . . . , fn) : Em+n En je spojitě diferencovatelná v okolí bodu P, F(P) = 0 a M je zadána implicitně rovnicí F(x1, . . . , xm+n) = 0, přičemž hodnost matice D1F v bodě P je n. Pak P je stacionárním bodem spojitě diferencovatelné funkce h : Em+n R právě, když existují reálné parametry 1, . . . , n takové, že grad h = 1 grad f1 + + n grad fn. Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Všimněme si počtu neznámých a rovnic v tomto algoritmu: gradienty jsou vektory o m + n souřadnicích, tedy požadavek z věty dává m + n rovnic. Jako neznámé máme jednak souřadnice x1, . . . , xm+n hledaných stacionárních bodů P, ale navíc také n parametrů i v hledané lineární kombinaci. Zbývá však požadavek, že hledaný bod P patří implicitně zadané množině M, což představuje dalších n rovnic. Celkem tedy máme 2n + m rovnic pro 2n + m proměnných a proto lze očekávat, že řešením bude diskrétní množina bodů P (tj. každý z nich bude izolovaným bodem). Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Absolutní extrémy Výklad o vázaných extrémech jsme začali tím, že pro nalezení absolutních extrémů funkce na kompaktní množině často potřebujeme vyšetření extrémů na množině bodů vázaných nějakou podmínkou. Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Absolutní extrémy Výklad o vázaných extrémech jsme začali tím, že pro nalezení absolutních extrémů funkce na kompaktní množině často potřebujeme vyšetření extrémů na množině bodů vázaných nějakou podmínkou. Ilustrujme si to na příkladu: Příklad Maximalizujte f (x, y) = 2x + y za podmínky x2 4 + y2 1. Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Řešení Množina určená vazební podmínkou je uzavřená a ohraničená, proto zde nabývá jakákoliv spojitá funkce svých extrémů, a to buď ve stacionárních bodech nebo na hranici. Snadno se ale přesvědčíme (df (x, y) = (2, 1)), že uvnitř množiny extrémy nejsou. Proto maximalizujeme funkci f za podmínky x2 4 + y2 = 1. Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Řešení Množina určená vazební podmínkou je uzavřená a ohraničená, proto zde nabývá jakákoliv spojitá funkce svých extrémů, a to buď ve stacionárních bodech nebo na hranici. Snadno se ale přesvědčíme (df (x, y) = (2, 1)), že uvnitř množiny extrémy nejsou. Proto maximalizujeme funkci f za podmínky x2 4 + y2 = 1. Sestrojíme Lagrangeovu funkci L(x, y, ) = 2x + y - (x2 4 + y2 - 1). Pak dostáváme: 0 = Lx = 2 - x 2 0 = Ly = 1 - 2y 0 = x2 4 + y2 - 1. Inverzní a implicitní zobrazení Tečny a normály k implicitně zadaným plochám Vázané extrémy Řešení Množina určená vazební podmínkou je uzavřená a ohraničená, proto zde nabývá jakákoliv spojitá funkce svých extrémů, a to buď ve stacionárních bodech nebo na hranici. Snadno se ale přesvědčíme (df (x, y) = (2, 1)), že uvnitř množiny extrémy nejsou. Proto maximalizujeme funkci f za podmínky x2 4 + y2 = 1. Sestrojíme Lagrangeovu funkci L(x, y, ) = 2x + y - (x2 4 + y2 - 1). Pak dostáváme: 0 = Lx = 2 - x 2 0 = Ly = 1 - 2y 0 = x2 4 + y2 - 1. Odtud snadno x = 4 , y = 1 2, a tedy = 17 2 , x = 8 17 , y = 1 17 (resp. = - 17 2 , x = - 8 17 , y = - 1 17 pro minimum).