Matematika III - 4. přednáška Funkce více proměnných: Zobrazení mezi euklidovskými prostory, inverzní zobrazení a implicitně definované zobrazení Michal Bulant Masarykova univerzita Fakulta informatiky 14. 10. 2009 □ S Q Literatura Q Zobrazení mezi euklidovskými prostory • Zobrazení a transformace • "Chain Rule" • Věta o inverzním zobrazení • Implicitně zadaná zobrazení O Tečny a normály k implicitně zadaným plochám • Gradient funkce • Tečné a normálové prostory Q Vázané extrémy » Metoda Lagrangeových multiplikátorů • Speciální optimalizační metody ooooooooooooooooo Plán přednášky Q Literatura Q Zobrazení mezi euklidovskými prostory • Zobrazení a transformace a "Chain Rule" • Věta o inverzním zobrazení • Implicitně zadaná zobrazení • Tečné a normálové prostory /m plochám Q Vázané extrémy • Metoda Lagrangeových multiplikátorů • Speciální optimalizační metody □ s Doporučené zdroje Martin Panák, Jan Slovák, Drsná matematika, e-text. □ s Doporučené zdroje • Martin Panák, Jan Slovák, Drsná matematika, e-text. • Zuzana Došlá, Ondřej Došlý, Diferenciální počet funkcí více proměnných, MU Brno, 2006, 150 s. □ S • Martin Panák, Jan Slovák, Drsná matematika, e-text. • Zuzana Došlá, Ondřej Došlý, Diferenciální počet funkcí více proměnných, MU Brno, 2006, 150 s. • Zuzana Došlá, Roman Plch, Petr Sojka, Diferenciální počet funkcí více proměnných s programem Maple, MU Brno, 1999, 273 s. (příp. http://www.math.muni.cz/~plch/mapm). • Martin Panák, Jan Slovák, Drsná matematika, e-text. • Zuzana Došlá, Ondřej Došlý, Diferenciální počet funkcí více proměnných, MU Brno, 2006, 150 s. • Zuzana Došlá, Roman Plch, Petr Sojka, Diferenciální počet funkcí více proměnných s programem Maple, MU Brno, 1999, 273 s. (příp. http://www.math.muni.cz/~plch/mapm). 9 Předmětové záložky v IS MU Obsah první písemky určování limit, resp. důkaz neexistence □ s Obsah první písemky • určování limit, resp. důkaz neexistence • výpočty parciálních a směrových derivací □ s - Obsah první písemky • určování limit, resp. důkaz neexistence • výpočty parciálních a směrových derivací • použití diferenciálu - aproximace, tečná nadrovina □ s - • určování limit, resp. důkaz neexistence • výpočty parciálních a směrových derivací • použití diferenciálu - aproximace, tečná nadrovina • využití Taylorovy věty a Hessianu pro aproximaci • určování limit, resp. důkaz neexistence • výpočty parciálních a směrových derivací • použití diferenciálu - aproximace, tečná nadrovina • využití Taylorovy věty a Hessianu pro aproximaci • Jacobián zobrazení a jeho inverze (včetně důkazu existence) • určování limit, resp. důkaz neexistence • výpočty parciálních a směrových derivací • použití diferenciálu - aproximace, tečná nadrovina • využití Taylorovy věty a Hessiánu pro aproximaci • Jacobián zobrazení a jeho inverze (včetně důkazu existence) • určování lokálních a globálních extrémů (vázané extrémy nikoliv). ooooooooooooooooo Plán přednášky Q Literatura Q Zobrazení mezi euklidovskými prostory • Zobrazení a transformace • "Chain Rule" • Věta o inverzním zobrazení • Implicitně zadaná zobrazení • Tečné a normálové prostory /m plochám Q Vázané extrémy • Metoda Lagrangeových multiplikátorů • Speciální optimalizační metody □ s oooooooooooooooo oooooooooooo Zobrazení F : En —> Em je při zvolených kartézských souřadnicích na obou stranách obyčejná m-tice F(xi,... ,xn) = (fi(xi,... ,x„),..., fm(x1,... ,xn)) funkcí fj : En —> R. Řekneme, že F je diferencovatelné nebo spojitě diferencovatelné zobrazení, jestliže tuto vlastnost mají všechny funkce f\,..., fm. □ g - = oooooooooooooooo oooooooooooo Zobrazení F : En —> Em je při zvolených kartézských souřadnicích na obou stranách obyčejná m-tice F(xi,... ,xn) = (fi(xi,... ,x„),..., fm(x1,... ,xn)) funkcí fj : En —> R. Řekneme, že F je diferencovatelné nebo spojitě diferencovatelné zobrazení, jestliže tuto vlastnost mají všechny funkce f\,..., fm. Diferencovatelná zobrazení F : En —> En, která mají inverzní zobrazení G : En —> En definované na celém svém obrazu, se nazývají (diferencovatelné) transformace. □ s - oooooooooooooooo oooooooooooo Zobrazení F : En —> Em je při zvolených kartézských souřadnicích na obou stranách obyčejná m-tice F(xi,... ,xn) = (fi(xi,... ,x„),..., fm(x1,... ,xn)) funkcí fj : En —> R. Řekneme, že F je diferencovatelné nebo spojitě diferencovatelné zobrazení, jestliže tuto vlastnost mají všechny funkce f\,..., fm. Diferencovatelná zobrazení F : En —> En, která mají inverzní zobrazení G : En —> En definované na celém svém obrazu, se nazývají (diferencovatelné) transformace. Příkladem transformace v E2 je přechod mezi polárními a kartézkými souřadnicemi: [r, 6] 1—> [rcos#, r sin#] s inverzí [x,y] !->■ [\/x2 + y2,arctg-], [0,y] •->■ [y, -sgny]. 5 □ s 0*000000000000000 ooooooooooooc Lineární zobrazení dfj(x) : E" —> R lineárně aproximují přírůstky f;. Definice DXF{x) /dfi(x)\ df2(x) / d h d h 9x1 dxo df2 df2 9xi 9x2 W4*)7 Vü 9£ü 9x2 9£x 9x„ 9x„/ (x) se nazývá Jacobiho matice zobrazení F v bodě x. Lineárni zobrazení D1F(x) definované na přírůstcích v = (y\,..., vn) pomocí stejně značené Jacobiho matice nazýváme diferenciál zobrazení F v bodě x z definičního oboru, jestliže lim jr-rÍFÍx + v) - F(x) - D1F(x)(v)) = 0. v->0 \\v\\K □ s - oo«oooooooooooooo ooooooooooooc Důsledek Věty o existenci diferenciálu pro funkce n proměnných je: Necht F : En —> Em je zobrazení, jehož všechny souřadné funkce mají spojité parciální derivace v okolí bodu xef„. Pak existuje diferenciál D1F(x) zobrazení F zadaný Jacobiho maticí. □ s Diferenciál složeného zobrazení Věta ("Chain rule") Necht F : En —>■ Em a G : Em —>■ Er jsou dvě diferencovatelná zobrazení, přičemž definiční obor G obsahuje celý obor hodnot F. Pak také složené zobrazení G o F je diferencovatelné a jeho diferenciál je v každém bodě z definičního obodu F kompozicí diferenciálů D1 (G o F)(x) = D1G{F{x)) o D1F{x). Příslušná Jacobiho matice je dána součinem příslušných Jacobiho matic. □ s - oooo»oooooooooooo oooooooooooo Polární souřadnice vzniknou z kartézských souřadnic transformací F : Ei —>■ Ei, kterou v souřadnicích [x,y] a [r,ip] zapíšeme: y /x2+y2, (p = arctg : □ s oooo»oooooooooooo oooooooooooo Polární souřadnice vzniknou z kartézských souřadnic transformací F : Ei —>■ Ei, kterou v souřadnicích [x,y] a [r,ip] zapíšeme: y /x2+y2, ip = arctg : Funkci gt : E2 —>■ M v polárních souřadnicích g(r, K: D\g o F)(x) = Ďyg{F{x)) o DyF{x) = (dr dr \ dx dy \ dip d(p I dx dy J Tedy -(X,y,t)=cos(V^r-t)7=== + 0 a podobně dy (x, y, ř) = cos(a/*2 +y2 - ř)- y A2+y2 □ g - = Pokud k dané funkci f : R —> R inverzní funkce f-1 existuje (nezaměňujme značení s funkcí x i—> (f (x))-1), pak je dána jednoznačně kterýmkoliv ze vztahů f-1 o f = id«, f o f-1 = id«,. oooooo»oooooooooo Věta o inverzní funkci jedné proměnné - připomenutí Pokud k dané funkci f : R —> R inverzní funkce f_1 existuje (nezaměňujme značení s funkcí x i—> (f (x))_1), pak je dána jednoznačně kterýmkoliv ze vztahů f_1 o f = id«, f o f_1 = id«,. Pokud bychom věděli, že pro diferencovatelnou funkci f je i f_1 diferencovatelná, vztah pro derivaci složené funkce nám (pro y = f (x)) dává i = (id)'(x) = (r1 o o'(x) = (r1)'^)) • f'(x) a tedy přímo víme formuli (zjevně f (x) v takovém případě nemůže být nulové) (f-1)'^)) = jfa. Je-li f diferencovatelná funkce na okolí bodu xo a f'{xo) ^ 0, pak existuje na nějakém okolí bodu yo = f{xo) funkce f_1 inverzní k f a platí vztah Věta o inverzním zobrazení Nechi F : En —>■ En je spojitě diferencovatelné zobrazení na nějakém okolí bodu x* G En a nechi je Jacobiho matice D1F(x*) invertibilní Pak na nějakém okolí bodu x* existuje inverzní zobrazení F_1 a jeho diferenciál v bodě F(x*) je inverzním zobrazením k D1F(x*), tzn. je zadán inverzní maticí k Jacobiho matici zobrazení F v bodě x*. □ s Věta o inverzním zobrazení Nechi F : En —>■ En je spojitě diferencovatelné zobrazení na nějakém okolí bodu x* G En a nechi je Jacobiho matice D1F(x*) invertibilní Pak na nějakém okolí bodu x* existuje inverzní zobrazení F_1 a jeho diferenciál v bodě F(x*) je inverzním zobrazením k D1F(x*), tzn. je zadán inverzní maticí k Jacobiho matici zobrazení F v bodě x*. Princip důkazu: Z pravidla pro derivování složené funkce vyplývá, že pokud diferencovatelná inverze existuje, pak musí být její Jacobiho matice inverzí k původní Jacobiho matici (srovnejte s případem 1 proměnné). Důkaz poměrně komplikovaným způsobem vyvozuje, že díky invertovatelnosti Jacobiho matice existuje diferencovatelná inverze. □ s OOOOOOOO0OOOOOOOO ooooooooooooc Příklad Rozhodněte, zda zobrazení F = (f, g) : R' souřadnicích f (x, y) = xy, g(x, y) definované po x y je prosté v okolí bodu [2,1]. V kladném případě určete Jacobiho matici inverzního zobrazení v bodě F(2,1). □ g - = ooooooooo«ooooooo Věta o implicitní funkci - neformální připomenutí Pokud máme zadánu funkci f(x) vzorcem y = f{x), hovoříme o jejím explicitním zadání. Obecnějším zadáním funkce je rovnice F(x,y) = 0, kde závislá proměnná y představuje neznámou funkci. Pokud tuto rovnici nelze (nebo to nepotřebujeme) vyřešit vzhledem k y, pak hovoříme o funkci zadané implicitně. Avšak i v tomto obecnějším případě budeme schopni vypočítat y'(x) (aniž bychom znali explicitní vzorec pro y(x)), a to pomocí pravidla pro derivaci složené funkce. Příklad ooooooooo«ooooooo Věta o implicitní funkci - neformální připomenutí Pokud máme zadánu funkci f(x) vzorcem y = f{x), hovoříme o jejím explicitním zadání. Obecnějším zadáním funkce je rovnice F(x,y) = 0, kde závislá proměnná y představuje neznámou funkci. Pokud tuto rovnici nelze (nebo to nepotřebujeme) vyřešit vzhledem k y, pak hovoříme o funkci zadané implicitně. Avšak i v tomto obecnějším případě budeme schopni vypočítat y'(x) (aniž bychom znali explicitní vzorec pro y(x)), a to pomocí pravidla pro derivaci složené funkce. Příklad Rovnice y2 = x definuje dvě diferencovatelné funkce yi Y2 Při derivování implicitně zadaných funkcí obsahuje výsledná derivace y' jak proměnnou x tak proměnnou y (na rozdíl od běžného derivování funkce, kdy je ve výsledku pouze proměnná x). Věta o implicitní funkci Pro jednoduchost vyložíme ideu v rovině E^. □ s - = ■€. -o<\(y Pro jednoduchost vyložíme ideu v rovině E^. Pro spojitě diferencovatelnou funkci F{x,y) : E2 —> K hledejme body [x,y], ve kterých platí F(x,y) = 0. Příkladem může být třeba obvyklá (implicitní) definice přímek a kružnic: F(x, y) = ax + by + c = 0 F(x,y) = (x - s)2 + (y - ŕ)2 - r2 = 0, r > 0. Pro jednoduchost vyložíme ideu v rovině E^. Pro spojitě diferencovatelnou funkci F{x,y) : E2 —> K hledejme body [x,y], ve kterých platí F(x,y) = 0. Příkladem může být třeba obvyklá (implicitní) definice přímek a kružnic: F(x, y) = ax + by + c = 0 F(x,y) = (x - s)2 + (y - ŕ)2 - r2 = 0, r > 0. V prvním případě je (při b 7^ 0) předpisem zadaná funkce pro všechna x. Pro jednoduchost vyložíme ideu v rovině E^. Pro spojitě diferencovatelnou funkci F{x,y) : E2 —> K hledejme body [x,y], ve kterých platí F(x,y) = 0. Příkladem může být třeba obvyklá (implicitní) definice přímek a kružnic: F(x, y) = ax + by + c = 0 F(x,y) = (x - s)2 + (y - ŕ)2 - r2 = 0, r > 0. V prvním případě je (při b 7^ 0) předpisem zadaná funkce pro všechna x. Ve druhém případě umíme pouze pro [a, b] splňující rovnici kružnice a b 7^ t najít okolí bodu a, na kterém nastane jedna z možností: y = f (x) = ŕ + \J (x — s)2 — f, y = f (x) = ŕ - V(*-s)2-r. 00000000000*00000 ooooooooooooc Body [s ± r, ŕ] také vyhovují rovnici kružnice, platí v nich ale Fy(s ± r, ŕ) = O, což znamená, že tečna ke kružnici v těchto bodech je rovnoběžná s osou y. V těchto bodech neumíme najít okolí, na němž by kružnice byla popsána jako funkce y = f (x). □ s 00000000000*00000 ooooooooooooc Body [s ± r, ŕ] také vyhovují rovnici kružnice, platí v nich ale Fy(s ± r, ŕ) = O, což znamená, že tečna ke kružnici v těchto bodech je rovnoběžná s osou y. V těchto bodech neumíme najít okolí, na němž by kružnice byla popsána jako funkce y = f (x). Navíc umíme spočítat i derivace: f'(x) 1 2(x - s) V(x-s)2-r^ y □ s 00000000000*00000 ooooooooooooc Body [s ± r, ŕ] také vyhovují rovnici kružnice, platí v nich ale Fy(s ± r, ŕ) = O, což znamená, že tečna ke kružnici v těchto bodech je rovnoběžná s osou y. V těchto bodech neumíme najít okolí, na němž by kružnice byla popsána jako funkce y = f (x). Navíc umíme spočítat i derivace: f'(x) 1 2(x - s) V(x-s)2-r^ y Naopak, pokud budeme chtít najít závislost x = f (y) takovou, aby F(f(y),y) = O, pak v okolí bodů (s ± r, t) bez problémů uspějeme. Všimněme si, že v těchto bodech je parciální derivace Fx nenulová. □ s OOOOOOOOOOOO0OOOO ooooooooooooc Shrňme pozorování (pro pouhé dva příklady): □ s OOOOOOOOOOOO0OOOO ooooooooooooc Shrňme pozorování (pro pouhé dva příklady): Pro funkci F{x,y) a bod [a, b] G E2 takový, že F{a, b) = 0, umíme najít funkci y = f (x) splňující F{x, f (x)) = 0, pokud je Fy{a, b) 7^ 0. V takovém případě umíme i vypočíst f'{x) = —Fx/Fy. Z následující věty plyne, že takto to platí vždy, navíc rozšířené i na libovolné počty proměnných. □ s Věta (O implicitní funkci) Necht F : E„+i —> R je spojitě diferencovatelná funkce na otevřeném okolí bodu [x*,y*] G En x R, ve kterém je dF i F(x*,y*) = 0 a §^(x*,y*) ^ 0. Potom existuje spojitá funkce f : En —> R definovaná na nějakém okolí U bodu x* G E„ taková, že F(x, f(x)) = 0 pro všechny x G Ľ. Navíc má funkce f v okolí bodu x* parciální derivace splňující df_ dx; M g(*.f(*)) □ s Věta (O implicitní funkci) Necht F : E„+i —> R je spojitě diferencovatelná funkce na otevřeném okolí bodu [x*,y*] G En x R, ve kterém je F(x*,y*) = 0 a §^(x*,y*) 7^ 0. Potom existuje spojitá funkce f : En —> R definovaná na nějakém okolí U bodu x* G E„ taková, že F(x, f(x)) = 0 pro všechny x G Ľ. Navíc má funkce f v okolí bodu x* parciální derivace splňující df_ dx; M g(*.f(*)) Poslední tvrzení o derivaci přitom je dobře zapamatovalné (i pochopitelné) z výrazu pro diferenciál: 0 = dF = Fx dx + Fy áy = (Fx + Fy f'(x)) dx. □ S oooooooooooooo»oo ooooooooooooc Příklad Určete lokální extrémy funkce z = f(x,y), která je určena implicitně rovnicí F(x, y, z) = x2 + y2 + z2 — xz — \fŤ.yz = 1. Derivováním rovnosti podle x a y dostáváme: 2x + 2z • zx — z — x • zx — v 2yzx = 0 2y + 2z • Zy — x ■ Zy — viz — v2yzy = 0, odkud vyjádříme z — 2x V2z — 2y 2z — x — v2y 2z — x — v2y ooooooooooooooo«o ooooooooooooc Řešení (pokr. Stacionární body musí splňovat: zx = 0, zy = 0, tj. z = 2x = \/2y, a tedy y = \/2x. Dosazením do původní rovnice dostáváme stacionární body [1, \/2,2] a [—1, — \/2, —2]. V těchto bodech je Fz^0 (je to zároveň jmenovatel všech zde vystupujících zlomků), proto je v jejich okolí implicitně určena jistá funkce z = f(x, y). Dalším derivováním implicitní rovnice vypočteme parciální derivace f 2. řádu: 2z — x — v2y <-xy 0, <-yy 1z — x — v2y □ s ooooooooooooooo«o ooooooooooooc Řešení (pokr. Stacionární body musí splňovat: zx = 0, zy = 0, tj. z = 2x = \/2y, a tedy y = \/2x. Dosazením do původní rovnice dostáváme stacionární body [1, \/2,2] a [—1, — \/2, —2]. V těchto bodech je Fz^0 (je to zároveň jmenovatel všech zde vystupujících zlomků), proto je v jejich okolí implicitně určena jistá funkce z = f(x, y). Dalším derivováním implicitní rovnice vypočteme parciální derivace f 2. řádu: 2z vV <-xy o, <-yy 2z V2y' Ve stacionárních bodech je Hf negativně, resp. pozitivně definitní, proto zde nastávají lokální maximum, resp. minimum funkce f. □ s oooooooooooooooo« ooooooooooooc Nejobecnější případ, kdy definujeme implicitně zadané zobrazení, popisuje následující věta (v případě n=l kopíruje větu o implicitní funkci). □ s oooooooooooooooo« ooooooooooooc Nejobecnější případ, kdy definujeme implicitně zadané zobrazení, popisuje následující věta (v případě n=l kopíruje větu o implicitní funkci). Věta (O implicitním zobrazení) Nechi F : Em+n —>■ En je spojitě diferencovatelné zobrazení na otevřeném okolí bodu [x*,y*] G Em x En = Em+n, v němž platí F(x*,y*) = 0 a det D^F ^ 0. Potom existuje spojitě diferencovatelné zobrazení G : Em —> En definované na nějakém okolí U bodu x* G Em s obrazem G{U), který obsahuje bod y*, takové, že F(x, G{x)) = 0 pro všechny x G U. Navíc je Jacobiho matice D1 G zobrazení G na okolí bodu x* zadána součinem matic D'Gix) = -{DlF)-\x, G(x)) ■ DlF{x, G(x)). □ S ooooooooooooooooo Plán přednášky Q Literatura Q Zobrazení mezi euklidovskými prostory • Zobrazení a transformace a "Chain Rule" • Věta o inverzním zobrazení • Implicitně zadaná zobrazení O Tečny a normály k implicitně zadaným plochám • Gradient funkce • Tečné a normálové prostory Q Vázané extrémy • Metoda Lagrangeových multiplikátorů • Speciální optimalizační metody □ s Definice Pro spojitě diferencovatelnou funkci f(xi,.. •,*n) in- -►M se vektor "-( ' df ,<9V df N "' dxn/ ) nazývá gradient funkce f. V technické a fyzikální literatuře se často za pisuje take jako gr£ d f. » Definice Pro spojitě diferencovatelnou funkci f(xi,.. •,*n) in- -►M se vektor "-( ' df ,<9V df N " ' dxn, ) nazývá gradient funkce f. V technické a fyzikální literatuře se často za pisuje take jako gr- áf. Rovnost f{x\,... ,xn) = b s pevnou hodnotou b G M zadává podmnožinu M C E„, která mívá vlastnosti (n — l)-rozměrné nad plochy. Definice Pro spojitě diferencovatelnou funkci f(xi,.. •,*n) in- -►M se vektor "-( ' df ,<9V df N " ' dxn, ) nazývá gradient funkce f. V technické a fyzikální literatuře se často za pisuje take jako gr- áf. Rovnost f{x\,... ,xn) = b s pevnou hodnotou b G M zadává podmnožinu M C E„, která mívá vlastnosti (n — l)-rozměrné nadplochy. Přesněji: pokud je vektor parciálních derivací nenulový, můžeme lokálně množinu M popsat jako graf spojitě diferencovatelné funkce v n — 1 proměnných. Definice Pro spojitě diferencovatelnou funkci f(xi,.. •,*n) in- -►M se vektor "-( ' df ,<9V df N " ' dxn, ) nazývá gradient funkce f. V technické a fyzikální literatuře se často za pisuje take jako gr- áf. Rovnost f{x\,... ,xn) = b s pevnou hodnotou b G M zadává podmnožinu M C E„, která mívá vlastnosti (n — l)-rozměrné nadplochy. Přesněji: pokud je vektor parciálních derivací nenulový, můžeme lokálně množinu M popsat jako graf spojitě diferencovatelné funkce v n — 1 proměnných. Hovoříme v této souvislosti také o úrovňových množinách Mt, (analogie vrstevnic v př. n = 2). Na derivacích křivek ležících v úrovňové množině Mt, se bude diferenciál df vždy vyčíslovat nulově: f(c(ř)) = b pro všechna ř, proto d dt f(c(ŕ)) = df(c'(ŕ)) = 0. □ S Na derivacích křivek ležících v úrovňové množině Mt, se bude diferenciál df vždy vyčíslovat nulově: f(c(ř)) = b pro všechna ř, proto d dt f(c(ŕ)) = df(c'(ŕ)) = 0. Pro obecný vektor v = (v\,..., vn) G En je velikost příslušné směrové derivace funkce f: \dvf\ df ■1/1 + --- + df (df, v) = cosy>|| df||||i/|| dx\ dxn kde ip je odchylka vektoru v od gradientu funkce f. Dokázali jsme: □ s Na derivacích křivek ležících v úrovňové množině Mt, se bude diferenciál df vždy vyčíslovat nulově: f(c(ř)) = b pro všechna ř, proto d dt f(c(ŕ)) = df(c'(ŕ)) = 0. Pro obecný vektor v = (v\,..., vn) G En je velikost příslušné směrové derivace funkce f: \dvf\ df ■1/1 + --- + df (df, v) = cosy>|| df||||i/|| dx\ dxn kde ip je odchylka vektoru v od gradientu funkce f. Dokázali jsme: Směr zadaný gradientem v bodě x = (xi,..., x„) je právě ten směr, ve kterém funkce f nejrychleji roste. Tečná rovina k neprázdné úrovňové množině Mt, v okolí jejího bodu s nenulovým gradientem df je určena ortogonálním doplňkem ke gradientu. Násobkům gradientu v tomto případě říkáme normálový vektor nadplochy Mt,. Pro funkci f n proměnných a bod P = (a\,..., an) G M t, v jehož okolí je Mt, grafem funkce {n — 1) proměnných je implicitní rovnice pro tečnou nadrovinu 0 = t—{P) • (xi - ai) + • • • + t—(P) ■ (x„ - a„). (JX\ oxn □ s Příklad (Model osvětlení 3D objektu) Pro 2D povrch známe směr v dopadu světla, tj. máme množinu M zadanou implicitně rovnicí f(x,y,z) = 0 a vektor v. Intenzitu osvětlení bodu P G M pak definujme jako locostp, kde ip je úhel mezi normálou zadanou gradientem a vektorem opačným ke směru světla. (Znaménko říká, kterou stranu plochy osvětlujeme, /oje tzv. svítivost.) Např. v = (1,1, —1) (tj. šikmo dolů) a f (x, y, z)=x2+y2 + z2 - 1. Pro bod P = (x, y, z) e M l(P) grád f ■ v grád f\\\\v -2x - 2y + 2z 2^3 'o- Dle očekávání je plnou intenzitou /o osvětlen bod P = 4=(—1, —1,1) na povrchu koule. □ s Obecné dimenze: funkce F = (fi, ...,fn): Em+n —> En a n rovnic /ý(xi,..., xm+n) = bi, i = 1,..., n. Dle věty o implicitní funkci je většinou množina všech řešení (xi,... ,xm+n) grafem zobrazení G : Em —>■ En. Pro pevnou volbu b = {b\,..., bn) je samozřejmě množinou M všech řešení průnik nadploch M(b,, fj) příslušejících jednotlivým rovnicím f; = b\. Totéž platí pro tečné směry a normálové směry: Tečné a normálové prostory Obecné dimenze: funkce F = (f\,..., fn) fi(x1,...,xm+n) = bi, i Em+n —> En a n rovnic = 1, ...,n. Dle věty o implicitní funkci je většinou množina všech řešení (xi,... ,xm+n) grafem zobrazení G : Em —>■ En. Pro pevnou volbu b = {b\,..., bn) je samozřejmě množinou M všech řešení průnik nadploch M(b,, fj) příslušejících jednotlivým rovnicím f; = b\. Totéž platí pro tečné směry a normálové směry: Afinní podprostor v Em+n obsahující právě všechny tečny k M bodem P dán rovnicemi: 0 9xi (P)-(xi-ai) + + T— (P) ■ {Xm+n - am+n) uxn g(p).(xl_31)+...+g(p)(xm+0 3m □ s n)- Tento podprostor se nazýva tečný prostor k (implicitně zadané) ploše M v bodě P. Normálový prostor v bodě P je afinní podprostor generovaný bodem P a gradienty všech funkcí f\,..., fn v bodě P, tj. řádky Jacobiho matice D1F. □ s Tento podprostor se nazýva tečný prostor k (implicitně zadané) ploše M v bodě P. Normálový prostor v bodě P je afinní podprostor generovaný bodem P a gradienty všech funkcí f\,..., fn v bodě P, tj. řádky Jacobiho matice D1F. Příklad * Spočtěme tečnu a normálový prostor ke kuželosečce v E3. Uvažujme rovnici 0 = f(x, y,z)=z- - V*2 + y2 kuželu s vrcholem v počátku a rovinu zadanou 0 = g(x,y,z) =z- 2x + y + l. Bod P = ( 1,0,1) patří jak kuželu, tak rovině a průn k M těchto dvou ploď je křivka. ---------------------' □ s Příklad (pokr.) Její tečnou v bodě P bude přímka zadaná rovnicemi Příklad (pokr.) Její tečnou v bodě P bude přímka zadaná rovnicemi 0 :2x (x-1) x=l,y=0 2Vx2+y2 2Vx2 + y2 + l-(z-l) = -x + z 0 = -2(x - 1) + y + (z - 1) = -2x + y + z + 1 2y •y x=l,y=0 Příklad (pokr.) Její tečnou v bodě P bude přímka zadaná rovnicemi 0 :2x (x-1) x=l,y=0 2Vx2+y2 2y x=l,y=0 2Vx2 + y2 + l-(z-l) = -x + z 0 = -2(x - 1) + y + (z - 1) = -2x + y + z + 1 zatímco rovina kolmá k naší křivce bodem P bude parametricky dána výrazem (1,0,1)+t(-1,0,1) + <7(-2,1,1) s parametry t a a. ■y ooooooooooooooooo Plán přednášky Q Literatura Q Zobrazení mezi euklidovskými prostory • Zobrazení a transformace a "Chain Rule" • Věta o inverzním zobrazení • Implicitně zadaná zobrazení • Tečné a normálové prostory /m plochám Q Vázané extrémy » Metoda Lagrangeových multiplikátorů • Speciální optimalizační metody □ s Již dříve jsme se zabývali úlohou nalézt absolutní extrém dané funkce na (uzavřené) množině, což vedlo na vyšetření lokálních extrémů funkce na hranici této množiny. Jinými slovy, na hledání extrémů funkce v bodech, které jsou vázány nějakou další podmínkou. □ s Již dříve jsme se zabývali úlohou nalézt absolutní extrém dané funkce na (uzavřené) množině, což vedlo na vyšetření lokálních extrémů funkce na hranici této množiny. Jinými slovy, na hledání extrémů funkce v bodech, které jsou vázány nějakou další podmínkou. Ukážeme nejprve názorně graficky na případu funkcí dvou proměnných obecnou metodu. Příklad Určete lokální extrémy funkce f(x,y) = x2y na množině M dané implicitně rovnicí 5x2 + 2y2 = 14. □ s V předchozím příkladu jsme viděli, že normálový vektor (tj. gradient) funkce, k níž hledáme extrém, musí být ve vyšetřovaném bodě prvkem normálového prostoru k ploše (v témže bodě). Toto samozřejmě platí i obecně. ooooooooooooooooo •oooooooooooc Metoda Lagrangeových multiplikátoru V předchozím příkladu jsme viděli, že normálový vektor (tj. gradient) funkce, k níž hledáme extrém, musí být ve vyšetřovaném bodě prvkem normálového prostoru k ploše (v témže bodě). Toto samozřejmě platí i obecně. Pokud je M ve všech svých bodech grafem hladkého zobrazení, musí být každý extrém P G M stacionárním bodem, tj. pro každou křivku c(ř) C M procházející přes P = c(0) musí být h(c(t)) extrémem pro tuto funkci jedné proměnné. Proto musí platit dt h(c(t)){t=0 = dc,{0)h(P) = dh(P)(c'(Q)) = 0. ooooooooooooooooo •oooooooooooc Metoda Lagrangeových multiplikátoru V předchozím příkladu jsme viděli, že normálový vektor (tj. gradient) funkce, k níž hledáme extrém, musí být ve vyšetřovaném bodě prvkem normálového prostoru k ploše (v témže bodě). Toto samozřejmě platí i obecně. Pokud je M ve všech svých bodech grafem hladkého zobrazení, musí být každý extrém P G M stacionárním bodem, tj. pro každou křivku c(ř) C M procházející přes P = c(0) musí být h(c(t)) extrémem pro tuto funkci jedné proměnné. Proto musí platit dt h(c(t)){t=0 = dc,{0)h(P) = dh(P)(c'(Q)) = 0. Tato vlastnost je ekvivalentní tvrzení, že gradient h leží v normálovém podprostoru (přesněji v jeho zaměření). Takové body P G M budeme nazývat stacionární body funkce h vzhledem k vazbám F. V praxi mívají optimalizační úlohy často m + n parametrů, které jsou vázány n podmínkami. V našem jazyce diferenciálního počtu tedy hledáme extrémy spojitě diferencovatelné funkce h na množině bodů M zadaných implicitně rovnicí F(x\,... ,xm+n) = 0 {F ■ Em+n —> En). Normálový prostor k naší množině M je generován řádky Jacobiho matice zobrazení F a stacionární body jsou proto ekvivalentně určeny následujícím tvrzením, kterému se říká metoda Lagrangeových multiplikátorů: □ s V praxi mívají optimalizační úlohy často m + n parametrů, které jsou vázány n podmínkami. V našem jazyce diferenciálního počtu tedy hledáme extrémy spojitě diferencovatelné funkce h na množině bodů M zadaných implicitně rovnicí F(x\,... ,xm+n) = 0 {F : Em+n —> En). Normálový prostor k naší množině M je generován řádky Jacobiho matice zobrazení F a stacionární body jsou proto ekvivalentně určeny následujícím tvrzením, kterému se říká metoda Lagrangeových multiplikátorů: Necht F = (fi,..., fn) : Em+n —>■ En je spojitě diferencovatelná v okolí bodu P, F{P) = 0 a M je zadána implicitně rovnicí F(xi,..., xm+n) = 0, přičemž hodnost matice DXF v bodě P je n. Pak P je stacionárním bodem spojitě diferencovatelné funkce h : Em+n —>■ R právě, když existují reálné parametry Ai,..., A„ takové, že grád h = Xi grád f\ -\--------h A„ grád fn. Všimněme si počtu neznámých a rovnic v tomto algoritmu: gradienty jsou vektory o m + n souřadnicích, tedy požadavek z věty dává m + n rovnic. Jako neznámé máme jednak souřadnice xi,... ,xm+n hledaných stacionárních bodů P, ale navíc také n parametrů A; v hledané lineární kombinaci. Zbývá však požadavek, že hledaný bod P patří implicitně zadané množině M, což představuje dalších n rovnic. Celkem tedy máme 2n + m rovnic pro 2n + m proměnných a proto lze očekávat, že řešením bude diskrétní množina bodů P (tj. každý z nich bude izolovaným bodem). □ s ooooooooooooooooo ooo»ooooooooc Absolutní extrémy Výklad o vázaných extrémech jsme začali tím, že pro nalezení absolutních extrémů funkce na kompaktní množině často potřebujeme vyšetření extrémů na množině bodů vázaných nějakou podmínkou. □ s ooooooooooooooooo ooo»ooooooooc Absolutní extrémy Výklad o vázaných extrémech jsme začali tím, že pro nalezení absolutních extrémů funkce na kompaktní množině často potřebujeme vyšetření extrémů na množině bodů vázaných nějakou podmínkou. Ilustrujme si to na příkladu: í Příklad * Maximalizujte f(x,y) - = 2x + y za podmínky ^- + y2 < 1. J □ s ooooooooooooooooo oooo«oooooooc Řešení Množina určená vazební podmínkou je uzavřená a ohraničená, proto zde nabývá jakákoliv spojitá funkce svých extrémů, a to buď ve stacionárních bodech nebo na hranici. Snadno se ale přesvědčíme (df(x,y) = (2,1)), že uvnitř množiny extrémy nejsou. Proto maximalizujeme funkci f za podmínky \ + y2 = 1. ooooooooooooooooo oooo«oooooooc Řešení Množina určená vazební podmínkou je uzavřená a ohraničená, proto zde nabývá jakákoliv spojitá funkce svých extrémů, a to buď ve stacionárních bodech nebo na hranici. Snadno se ale přesvědčíme (df(x,y) = (2,1)), že uvnitř množiny extrémy nejsou. Proto maximalizujeme funkci f za podmínky ^- + y2 = 1. Sestrojíme Lagrangeovu funkci Z_(x, y, A) = 2x + y - A(^- + y2 - 1). Pak dostáváme: 0 0 Lx = 2- = 1- + y2 A2 2Ay -1. ooooooooooooooooo oooo«oooooooc Řešení Množina určená vazební podmínkou je uzavřená a ohraničená, proto zde nabývá jakákoliv spojitá funkce svých extrémů, a to buď ve stacionárních bodech nebo na hranici. Snadno se ale přesvědčíme (df(x,y) = (2,1)), že uvnitř množiny extrémy nejsou. Proto maximalizujeme funkci f za podmínky ^- + y2 = 1. Sestrojíme Lagrangeovu funkci Z_(x, y, A) = 2x + y - A(^- + y2 - 1). Pak dostáváme: Odtud snadno x (resp. A = ~2~ h y 0 = LX = 2- A^ 0 = Ly = 1- 2Ay 0 _x2 4 + y2 -1. = 2A' a tedy A = 17 y 17 17' y = —A= pro minimum). Speciální optimalizační metody Zmiňme se jen ve stručnosti o speciálních optimalizačních technikách, které se v dnešní praxi používají. Zájemce o bližší seznámení s nimi můžeme odkázat na další předměty MU, např. • Optimalizace - PřF: M0160 (jaro) • Optimalizace - PV027 (jaro) • Lineární programování - PřF: M4110 (jaro) • Matematické programování - PřF: M5170 (podzim) Již dříve jsme zmínili, že funkce nejrychleji roste ve směru gradientu (a nejrychleji klesá ve směru opačném) - proto je přirozené se při hledání maxima vydat z daného bodu ve směru gradientu (analogie chození do kopce nejprudším svahem). Otázka je, jak dlouho "jít" a jak často gradient počítat. Iterace: xn+i = xn + 7„ grád f(xn), pro dostatečně malé 7„, aby f(xn+i) > f(xn). ooooooooooooooooo Metoda gradientu Již dříve jsme zmínili, že funkce nejrychleji roste ve směru gradientu (a nejrychleji klesá ve směru opačném) - proto je přirozené se při hledání maxima vydat z daného bodu ve směru gradientu (analogie chození do kopce nejprudším svahem). Otázka je, jak dlouho "jít" a jak často gradient počítat. Iterace: xn+1 =xn + jn grád f(xn), pro dostatečně malé 7„, aby f(xn+i) > f(x„). Problémy: • náročný opakovaný výpočet 7, • velký počet iterací v případě velmi různorodé křivosti v různých směrech; např Rosenbrockova banánová funkce f(x,y) = (l-x)2 + 100(y-x2)2. □ S ooooooooooooooooo OOOOOOO0OOOOC Newtonova optimalizační metoda Newtonova metoda je dobře známý numerický postup pro nalezení kořenů dané reálné funkce f . Známe-li bod xo "rozumně" blízko kořene, zkonstruujeme v bodě [xo, f(xo)] tečnu ke grafu funkce f a za bod xi zvolíme průsečík tečny s osou x. Tento postup opakujeme. Snadno je vidět, že platí rekurentní vztah *n+l ooooooooooooooooo OOOOOOO0OOOOC Newtonova optimalizační metoda Newtonova metoda je dobře známý numerický postup pro nalezení kořenů dané reálné funkce f . Známe-li bod xo "rozumně" blízko kořene, zkonstruujeme v bodě [xo, f(xo)] tečnu ke grafu funkce f a za bod xi zvolíme průsečík tečny s osou x. Tento postup opakujeme. Snadno je vidět, že platí rekurentní vztah *n+l Tento postup např. poskytuje efektivní postup pro výpočet y/2 s libovolnou přesností; pokud bychom ale chtěli hledat řešení rovnice x1/3 = 0, tak snadno vidíme, že metoda diverguje, ať začneme jakkoli blízko 0. Při hledání extrémů funkcí (i více proměnných) může být Newtona metoda využita pro nalezení stacionárních bodů - v nich musí být derivace nulová, proto jde vlastně o nalezení kořenů derivace iterativním postupem 0,... ,xn > 0. ooooooooooooooooo ooooooooooo»c Simplexová metoda Standardní úlohu řeší klasická Simplexová metoda (George Dantzig, 1947). □ S Standardní úlohu řeší klasická Simplexová metoda (George Dantzig, 1947). Úvodní fáze spočívá v nalezení nějakého vrcholu na polytopu (zobecnění polyedru na více dimenzí), který je tvořen body vyhovujícími podmínkám. V dalších krocích postupuje po hranách do vrcholů s vyšší hodnotou účelové funkce. Standardní úlohu řeší klasická Simplexová metoda (George Dantzig, 1947). Úvodní fáze spočívá v nalezení nějakého vrcholu na polytopu (zobecnění polyedru na více dimenzí), který je tvořen body vyhovujícími podmínkám. V dalších krocích postupuje po hranách do vrcholů s vyšší hodnotou účelové funkce. Sice je ukázán příklad podmínek, kdy simplexová metoda projde nešikovně všech 2" vrcholů (jde o příklad zborcené n-rozměrné krychle), a tedy metoda je v nejhorším případě exponenciální, ale v praxi je obvykle pozoruhodně úspěšná (kolem roku 2000 bylo dokázáno, že očekávaný čas běhu na náhodném vstupu je polynomiální). Příklad ^ Maximalizujte f = = 2x — 3y + 4z za podmínek 4x - 3y + z < 3 x + y+ z < 10 2x + y - z < 10 x > 0,y > 0,z > 0. □ S - = -š -0<\(y