Matematika III - 4. přednáška Funkce více proměnných: Zobrazení mezi euklidovskými prostory, inverzní zobrazení a implicitně definované zobrazení Michal Bulant Masarykova univerzita Fakulta informatiky 14. 10. 2009 □ S Q Literatura Q Zobrazení mezi euklidovskými prostory • Zobrazení a transformace • "Chain Rule" • Věta o inverzním zobrazení • Implicitně zadaná zobrazení O Tečny a normály k implicitně zadaným plochám • Gradient funkce • Tečné a normálové prostory Q Vázané extrémy » Metoda Lagrangeových multiplikátorů • Speciální optimalizační metody ooooooooooooooooo Plán přednášky Q Literatura Q Zobrazení mezi euklidovskými prostory • Zobrazení a transformace a "Chain Rule" • Věta o inverzním zobrazení • Implicitně zadaná zobrazení • Tečné a normálové prostory /m plochám Q Vázané extrémy • Metoda Lagrangeových multiplikátorů • Speciální optimalizační metody □ s Doporučené zdroje Martin Panák, Jan Slovák, Drsná matematika, e-text. □ s Doporučené zdroje • Martin Panák, Jan Slovák, Drsná matematika, e-text. • Zuzana Došlá, Ondřej Došlý, Diferenciální počet funkcí více proměnných, MU Brno, 2006, 150 s. □ S • Martin Panák, Jan Slovák, Drsná matematika, e-text. • Zuzana Došlá, Ondřej Došlý, Diferenciální počet funkcí více proměnných, MU Brno, 2006, 150 s. • Zuzana Došlá, Roman Plch, Petr Sojka, Diferenciální počet funkcí více proměnných s programem Maple, MU Brno, 1999, 273 s. (příp. http://www.math.muni.cz/~plch/mapm). • Martin Panák, Jan Slovák, Drsná matematika, e-text. • Zuzana Došlá, Ondřej Došlý, Diferenciální počet funkcí více proměnných, MU Brno, 2006, 150 s. • Zuzana Došlá, Roman Plch, Petr Sojka, Diferenciální počet funkcí více proměnných s programem Maple, MU Brno, 1999, 273 s. (příp. http://www.math.muni.cz/~plch/mapm). 9 Předmětové záložky v IS MU Obsah první písemky určování limit, resp. důkaz neexistence □ s Obsah první písemky • určování limit, resp. důkaz neexistence • výpočty parciálních a směrových derivací □ s - Obsah první písemky • určování limit, resp. důkaz neexistence • výpočty parciálních a směrových derivací • použití diferenciálu - aproximace, tečná nadrovina □ s - • určování limit, resp. důkaz neexistence • výpočty parciálních a směrových derivací • použití diferenciálu - aproximace, tečná nadrovina • využití Taylorovy věty a Hessianu pro aproximaci • určování limit, resp. důkaz neexistence • výpočty parciálních a směrových derivací • použití diferenciálu - aproximace, tečná nadrovina • využití Taylorovy věty a Hessianu pro aproximaci • Jacobián zobrazení a jeho inverze (včetně důkazu existence) • určování limit, resp. důkaz neexistence • výpočty parciálních a směrových derivací • použití diferenciálu - aproximace, tečná nadrovina • využití Taylorovy věty a Hessiánu pro aproximaci • Jacobián zobrazení a jeho inverze (včetně důkazu existence) • určování lokálních a globálních extrémů (vázané extrémy nikoliv). ooooooooooooooooo Plán přednášky Q Literatura Q Zobrazení mezi euklidovskými prostory • Zobrazení a transformace • "Chain Rule" • Věta o inverzním zobrazení • Implicitně zadaná zobrazení • Tečné a normálové prostory /m plochám Q Vázané extrémy • Metoda Lagrangeových multiplikátorů • Speciální optimalizační metody □ s oooooooooooooooo oooooooooooo Zobrazení F : En —> Em je při zvolených kartézských souřadnicích na obou stranách obyčejná m-tice F(xi,... ,xn) = (fi(xi,... ,x„),..., fm(x1,... ,xn)) funkcí fj : En —> R. Řekneme, že F je diferencovatelné nebo spojitě diferencovatelné zobrazení, jestliže tuto vlastnost mají všechny funkce f\,..., fm. □ g - = oooooooooooooooo oooooooooooo Zobrazení F : En —> Em je při zvolených kartézských souřadnicích na obou stranách obyčejná m-tice F(xi,... ,xn) = (fi(xi,... ,x„),..., fm(x1,... ,xn)) funkcí fj : En —> R. Řekneme, že F je diferencovatelné nebo spojitě diferencovatelné zobrazení, jestliže tuto vlastnost mají všechny funkce f\,..., fm. Diferencovatelná zobrazení F : En —> En, která mají inverzní zobrazení G : En —> En definované na celém svém obrazu, se nazývají (diferencovatelné) transformace. □ s - oooooooooooooooo oooooooooooo Zobrazení F : En —> Em je při zvolených kartézských souřadnicích na obou stranách obyčejná m-tice F(xi,... ,xn) = (fi(xi,... ,x„),..., fm(x1,... ,xn)) funkcí fj : En —> R. Řekneme, že F je diferencovatelné nebo spojitě diferencovatelné zobrazení, jestliže tuto vlastnost mají všechny funkce f\,..., fm. Diferencovatelná zobrazení F : En —> En, která mají inverzní zobrazení G : En —> En definované na celém svém obrazu, se nazývají (diferencovatelné) transformace. Příkladem transformace v E2 je přechod mezi polárními a kartézkými souřadnicemi: [r, 6] 1—> [rcos#, r sin#] s inverzí [x,y] !->■ [\/x2 + y2,arctg-], [0,y] •->■ [y, -sgny]. 5 □ s 0*000000000000000 ooooooooooooc Lineární zobrazení dfj(x) : E" —> R lineárně aproximují přírůstky f;. Definice DXF{x) /dfi(x)\ df2(x) / d h d h 9x1 dxo df2 df2 9xi 9x2 W4*)7 Vü 9£ü 9x2 9£x 9x„ 9x„/ (x) se nazývá Jacobiho matice zobrazení F v bodě x. Lineárni zobrazení D1F(x) definované na přírůstcích v = (y\,..., vn) pomocí stejně značené Jacobiho matice nazýváme diferenciál zobrazení F v bodě x z definičního oboru, jestliže lim jr-rÍFÍx + v) - F(x) - D1F(x)(v)) = 0. v->0 \\v\\K □ s - oo«oooooooooooooo ooooooooooooc Důsledek Věty o existenci diferenciálu pro funkce n proměnných je: Necht F : En —> Em je zobrazení, jehož všechny souřadné funkce mají spojité parciální derivace v okolí bodu xef„. Pak existuje diferenciál D1F(x) zobrazení F zadaný Jacobiho maticí. □ s Diferenciál složeného zobrazení Věta ("Chain rule") Necht F : En —>■ Em a G : Em —>■ Er jsou dvě diferencovatelná zobrazení, přičemž definiční obor G obsahuje celý obor hodnot F. Pak také složené zobrazení G o F je diferencovatelné a jeho diferenciál je v každém bodě z definičního obodu F kompozicí diferenciálů D1 (G o F)(x) = D1G{F{x)) o D1F{x). Příslušná Jacobiho matice je dána součinem příslušných Jacobiho matic. □ s - oooo»oooooooooooo oooooooooooo Polární souřadnice vzniknou z kartézských souřadnic transformací F : Ei —>■ Ei, kterou v souřadnicích [x,y] a [r,ip] zapíšeme: y /x2+y2, (p = arctg : □ s oooo»oooooooooooo oooooooooooo Polární souřadnice vzniknou z kartézských souřadnic transformací F : Ei —>■ Ei, kterou v souřadnicích [x,y] a [r,ip] zapíšeme: y /x2+y2, ip = arctg : Funkci gt : E2 —>■ M v polárních souřadnicích g(r,
K:
D\g o F)(x) = Ďyg{F{x)) o DyF{x) =
(dr dr \
dx dy \
dip d(p I
dx dy J
Tedy
-(X,y,t)=cos(V^r-t)7===
+ 0
a podobně
dy
(x, y, ř) = cos(a/*2 +y2 - ř)-
y
A2+y2
□ g - =
Pokud k dané funkci f : R —> R inverzní funkce f-1 existuje (nezaměňujme značení s funkcí x i—> (f (x))-1), pak je dána jednoznačně kterýmkoliv ze vztahů f-1 o f = id«, f o f-1 = id«,.
oooooo»oooooooooo
Věta o inverzní funkci jedné proměnné - připomenutí
Pokud k dané funkci f : R —> R inverzní funkce f_1 existuje (nezaměňujme značení s funkcí x i—> (f (x))_1), pak je dána jednoznačně kterýmkoliv ze vztahů f_1 o f = id«, f o f_1 = id«,. Pokud bychom věděli, že pro diferencovatelnou funkci f je i f_1 diferencovatelná, vztah pro derivaci složené funkce nám (pro y = f (x)) dává
i = (id)'(x) = (r1 o o'(x) = (r1)'^)) • f'(x)
a tedy přímo víme formuli (zjevně f (x) v takovém případě nemůže být nulové) (f-1)'^)) = jfa.
Je-li f diferencovatelná funkce na okolí bodu xo a f'{xo) ^ 0, pak existuje na nějakém okolí bodu yo = f{xo) funkce f_1 inverzní k f a platí vztah
Věta o inverzním zobrazení
Nechi F : En —>■ En je spojitě diferencovatelné zobrazení na nějakém okolí bodu x* G En a nechi je Jacobiho matice D1F(x*) invertibilní Pak na nějakém okolí bodu x* existuje inverzní zobrazení F_1 a jeho diferenciál v bodě F(x*) je inverzním zobrazením k D1F(x*), tzn. je zadán inverzní maticí k Jacobiho matici zobrazení F v bodě x*.
□ s
Věta o inverzním zobrazení
Nechi F : En —>■ En je spojitě diferencovatelné zobrazení na nějakém okolí bodu x* G En a nechi je Jacobiho matice D1F(x*) invertibilní Pak na nějakém okolí bodu x* existuje inverzní zobrazení F_1 a jeho diferenciál v bodě F(x*) je inverzním zobrazením k D1F(x*), tzn. je zadán inverzní maticí k Jacobiho matici zobrazení F v bodě x*.
Princip důkazu: Z pravidla pro derivování složené funkce vyplývá, že pokud diferencovatelná inverze existuje, pak musí být její Jacobiho matice inverzí k původní Jacobiho matici (srovnejte s případem 1 proměnné). Důkaz poměrně komplikovaným způsobem vyvozuje, že díky invertovatelnosti Jacobiho matice existuje diferencovatelná inverze.
□ s
OOOOOOOO0OOOOOOOO
ooooooooooooc
Příklad
Rozhodněte, zda zobrazení F = (f, g) : R' souřadnicích
f (x, y) = xy, g(x, y)
definované po
x
y
je prosté v okolí bodu [2,1]. V kladném případě určete Jacobiho matici inverzního zobrazení v bodě F(2,1).
□ g - =
ooooooooo«ooooooo
Věta o implicitní funkci - neformální připomenutí
Pokud máme zadánu funkci f(x) vzorcem y = f{x), hovoříme o jejím explicitním zadání. Obecnějším zadáním funkce je rovnice F(x,y) = 0, kde závislá proměnná y představuje neznámou funkci. Pokud tuto rovnici nelze (nebo to nepotřebujeme) vyřešit vzhledem k y, pak hovoříme o funkci zadané implicitně. Avšak i v tomto obecnějším případě budeme schopni vypočítat y'(x) (aniž bychom znali explicitní vzorec pro y(x)), a to pomocí pravidla pro derivaci složené funkce.
Příklad
ooooooooo«ooooooo
Věta o implicitní funkci - neformální připomenutí
Pokud máme zadánu funkci f(x) vzorcem y = f{x), hovoříme o jejím explicitním zadání. Obecnějším zadáním funkce je rovnice F(x,y) = 0, kde závislá proměnná y představuje neznámou funkci. Pokud tuto rovnici nelze (nebo to nepotřebujeme) vyřešit vzhledem k y, pak hovoříme o funkci zadané implicitně. Avšak i v tomto obecnějším případě budeme schopni vypočítat y'(x) (aniž bychom znali explicitní vzorec pro y(x)), a to pomocí pravidla pro derivaci složené funkce.
Příklad
Rovnice y2 = x definuje dvě diferencovatelné funkce
yi
Y2
Při derivování implicitně zadaných funkcí obsahuje výsledná derivace y' jak proměnnou x tak proměnnou y (na rozdíl od běžného derivování funkce, kdy je ve výsledku pouze proměnná x).
Věta o implicitní funkci
Pro jednoduchost vyložíme ideu v rovině E^.
□ s - = ■€. -o<\(y
Pro jednoduchost vyložíme ideu v rovině E^. Pro spojitě diferencovatelnou funkci F{x,y) : E2 —> K hledejme body [x,y], ve kterých platí F(x,y) = 0. Příkladem může být třeba obvyklá (implicitní) definice přímek a kružnic:
F(x, y) = ax + by + c = 0
F(x,y) = (x - s)2 + (y - ŕ)2 - r2 = 0, r > 0.
Pro jednoduchost vyložíme ideu v rovině E^. Pro spojitě diferencovatelnou funkci F{x,y) : E2 —> K hledejme body [x,y], ve kterých platí F(x,y) = 0. Příkladem může být třeba obvyklá (implicitní) definice přímek a kružnic:
F(x, y) = ax + by + c = 0
F(x,y) = (x - s)2 + (y - ŕ)2 - r2 = 0, r > 0.
V prvním případě je (při b 7^ 0) předpisem zadaná funkce pro všechna x.
Pro jednoduchost vyložíme ideu v rovině E^. Pro spojitě diferencovatelnou funkci F{x,y) : E2 —> K hledejme body [x,y], ve kterých platí F(x,y) = 0. Příkladem může být třeba obvyklá (implicitní) definice přímek a kružnic:
F(x, y) = ax + by + c = 0
F(x,y) = (x - s)2 + (y - ŕ)2 - r2 = 0, r > 0.
V prvním případě je (při b 7^ 0) předpisem zadaná funkce
pro všechna x. Ve druhém případě umíme pouze pro [a, b] splňující rovnici kružnice a b 7^ t najít okolí bodu a, na kterém nastane jedna z možností: y = f (x) = ŕ + \J (x — s)2 — f, y = f (x) = ŕ - V(*-s)2-r.
00000000000*00000
ooooooooooooc
Body [s ± r, ŕ] také vyhovují rovnici kružnice, platí v nich ale Fy(s ± r, ŕ) = O, což znamená, že tečna ke kružnici v těchto bodech je rovnoběžná s osou y. V těchto bodech neumíme najít okolí, na němž by kružnice byla popsána jako funkce y = f (x).
□ s
00000000000*00000
ooooooooooooc
Body [s ± r, ŕ] také vyhovují rovnici kružnice, platí v nich ale Fy(s ± r, ŕ) = O, což znamená, že tečna ke kružnici v těchto bodech je rovnoběžná s osou y. V těchto bodech neumíme najít okolí, na němž by kružnice byla popsána jako funkce y = f (x). Navíc umíme spočítat i derivace:
f'(x)
1 2(x - s)
V(x-s)2-r^
y
□ s
00000000000*00000
ooooooooooooc
Body [s ± r, ŕ] také vyhovují rovnici kružnice, platí v nich ale Fy(s ± r, ŕ) = O, což znamená, že tečna ke kružnici v těchto bodech je rovnoběžná s osou y. V těchto bodech neumíme najít okolí, na němž by kružnice byla popsána jako funkce y = f (x). Navíc umíme spočítat i derivace:
f'(x)
1 2(x - s)
V(x-s)2-r^
y
Naopak, pokud budeme chtít najít závislost x = f (y) takovou, aby F(f(y),y) = O, pak v okolí bodů (s ± r, t) bez problémů uspějeme. Všimněme si, že v těchto bodech je parciální derivace Fx nenulová.
□ s
OOOOOOOOOOOO0OOOO
ooooooooooooc
Shrňme pozorování (pro pouhé dva příklady):
□ s
OOOOOOOOOOOO0OOOO
ooooooooooooc
Shrňme pozorování (pro pouhé dva příklady):
Pro funkci F{x,y) a bod [a, b] G E2 takový, že F{a, b) = 0, umíme
najít funkci y = f (x) splňující F{x, f (x)) = 0, pokud je
Fy{a, b) 7^ 0. V takovém případě umíme i vypočíst
f'{x) = —Fx/Fy. Z následující věty plyne, že takto to platí vždy,
navíc rozšířené i na libovolné počty proměnných.
□ s
Věta (O implicitní funkci)
Necht F : E„+i —> R je spojitě diferencovatelná funkce na otevřeném okolí bodu [x*,y*] G En x R, ve kterém je
dF i
F(x*,y*) = 0 a §^(x*,y*) ^ 0. Potom existuje spojitá funkce f : En —> R definovaná na nějakém okolí U bodu x* G E„ taková, že F(x, f(x)) = 0 pro všechny x G Ľ. Navíc má funkce f v okolí bodu x* parciální derivace splňující
df_
dx;
M
g(*.f(*))
□ s
Věta (O implicitní funkci)
Necht F : E„+i —> R je spojitě diferencovatelná funkce na otevřeném okolí bodu [x*,y*] G En x R, ve kterém je F(x*,y*) = 0 a §^(x*,y*) 7^ 0. Potom existuje spojitá funkce f : En —> R definovaná na nějakém okolí U bodu x* G E„ taková, že F(x, f(x)) = 0 pro všechny x G Ľ. Navíc má funkce f v okolí bodu x* parciální derivace splňující
df_
dx;
M
g(*.f(*))
Poslední tvrzení o derivaci přitom je dobře zapamatovalné (i pochopitelné) z výrazu pro diferenciál:
0 = dF = Fx dx + Fy áy = (Fx + Fy f'(x)) dx.
□ S
oooooooooooooo»oo
ooooooooooooc
Příklad
Určete lokální extrémy funkce z = f(x,y), která je určena implicitně rovnicí F(x, y, z) = x2 + y2 + z2 — xz — \fŤ.yz = 1.
Derivováním rovnosti podle x a y dostáváme:
2x + 2z • zx — z — x • zx — v 2yzx = 0 2y + 2z • Zy — x ■ Zy — viz — v2yzy = 0,
odkud vyjádříme
z — 2x V2z — 2y
2z — x — v2y 2z — x — v2y
ooooooooooooooo«o
ooooooooooooc
Řešení (pokr.
Stacionární body musí splňovat: zx = 0, zy = 0, tj. z = 2x = \/2y, a tedy y = \/2x. Dosazením do původní rovnice dostáváme stacionární body [1, \/2,2] a [—1, — \/2, —2]. V těchto bodech je Fz^0 (je to zároveň jmenovatel všech zde vystupujících zlomků), proto je v jejich okolí implicitně určena jistá funkce z = f(x, y). Dalším derivováním implicitní rovnice vypočteme parciální derivace f 2. řádu:
2z — x — v2y
<-xy
0,
<-yy
1z — x — v2y
□ s
ooooooooooooooo«o
ooooooooooooc
Řešení (pokr.
Stacionární body musí splňovat: zx = 0, zy = 0, tj. z = 2x = \/2y, a tedy y = \/2x. Dosazením do původní rovnice dostáváme stacionární body [1, \/2,2] a [—1, — \/2, —2]. V těchto bodech je Fz^0 (je to zároveň jmenovatel všech zde vystupujících zlomků), proto je v jejich okolí implicitně určena jistá funkce z = f(x, y). Dalším derivováním implicitní rovnice vypočteme parciální derivace f 2. řádu:
2z
vV
<-xy
o,
<-yy
2z
V2y'
Ve stacionárních bodech je Hf negativně, resp. pozitivně definitní, proto zde nastávají lokální maximum, resp. minimum funkce f.
□ s
oooooooooooooooo«
ooooooooooooc
Nejobecnější případ, kdy definujeme implicitně zadané zobrazení, popisuje následující věta (v případě n=l kopíruje větu o implicitní funkci).
□ s
oooooooooooooooo«
ooooooooooooc
Nejobecnější případ, kdy definujeme implicitně zadané zobrazení, popisuje následující věta (v případě n=l kopíruje větu o implicitní funkci).
Věta (O implicitním zobrazení)
Nechi F : Em+n —>■ En je spojitě diferencovatelné zobrazení na otevřeném okolí bodu [x*,y*] G Em x En = Em+n, v němž platí F(x*,y*) = 0 a det D^F ^ 0. Potom existuje spojitě diferencovatelné zobrazení G : Em —> En definované na nějakém okolí U bodu x* G Em s obrazem G{U), který obsahuje bod y*, takové, že F(x, G{x)) = 0 pro všechny x G U. Navíc je Jacobiho matice D1 G zobrazení G na okolí bodu x* zadána součinem matic
D'Gix) = -{DlF)-\x, G(x)) ■ DlF{x, G(x)).
□ S
ooooooooooooooooo
Plán přednášky
Q Literatura
Q Zobrazení mezi euklidovskými prostory
• Zobrazení a transformace a "Chain Rule"
• Věta o inverzním zobrazení
• Implicitně zadaná zobrazení
O Tečny a normály k implicitně zadaným plochám
• Gradient funkce
• Tečné a normálové prostory
Q Vázané extrémy
• Metoda Lagrangeových multiplikátorů
• Speciální optimalizační metody
□ s
Definice
Pro spojitě diferencovatelnou funkci f(xi,.. •,*n) in- -►M se
vektor "-( ' df ,<9V df N "' dxn/ )
nazývá gradient funkce f. V technické a fyzikální literatuře se často za pisuje take jako gr£ d f. »
Definice
Pro spojitě diferencovatelnou funkci f(xi,.. •,*n) in- -►M se
vektor "-( ' df ,<9V df N " ' dxn, )
nazývá gradient funkce f.
V technické a fyzikální literatuře se často za pisuje take jako gr- áf.
Rovnost f{x\,... ,xn) = b s pevnou hodnotou b G M zadává podmnožinu M C E„, která mívá vlastnosti (n — l)-rozměrné nad plochy.
Definice
Pro spojitě diferencovatelnou funkci f(xi,.. •,*n) in- -►M se
vektor "-( ' df ,<9V df N " ' dxn, )
nazývá gradient funkce f.
V technické a fyzikální literatuře se často za pisuje take jako gr- áf.
Rovnost f{x\,... ,xn) = b s pevnou hodnotou b G M zadává podmnožinu M C E„, která mívá vlastnosti (n — l)-rozměrné nadplochy. Přesněji: pokud je vektor parciálních derivací nenulový, můžeme lokálně množinu M popsat jako graf spojitě diferencovatelné funkce v n — 1 proměnných.
Definice
Pro spojitě diferencovatelnou funkci f(xi,.. •,*n) in- -►M se
vektor "-( ' df ,<9V df N " ' dxn, )
nazývá gradient funkce f.
V technické a fyzikální literatuře se často za pisuje take jako gr- áf.
Rovnost f{x\,... ,xn) = b s pevnou hodnotou b G M zadává podmnožinu M C E„, která mívá vlastnosti (n — l)-rozměrné nadplochy. Přesněji: pokud je vektor parciálních derivací nenulový, můžeme lokálně množinu M popsat jako graf spojitě diferencovatelné funkce v n — 1 proměnných. Hovoříme v této souvislosti také o úrovňových množinách Mt, (analogie vrstevnic v př. n = 2).
Na derivacích křivek ležících v úrovňové množině Mt, se bude diferenciál df vždy vyčíslovat nulově: f(c(ř)) = b pro všechna ř, proto
d
dt
f(c(ŕ)) = df(c'(ŕ)) = 0.
□ S
Na derivacích křivek ležících v úrovňové množině Mt, se bude diferenciál df vždy vyčíslovat nulově: f(c(ř)) = b pro všechna ř, proto
d
dt
f(c(ŕ)) = df(c'(ŕ)) = 0.
Pro obecný vektor v = (v\,..., vn) G En je velikost příslušné směrové derivace funkce f:
\dvf\
df
■1/1 + --- +
df
(df, v) = cosy>|| df||||i/||
dx\ dxn
kde ip je odchylka vektoru v od gradientu funkce f. Dokázali jsme:
□ s
Na derivacích křivek ležících v úrovňové množině Mt, se bude diferenciál df vždy vyčíslovat nulově: f(c(ř)) = b pro všechna ř, proto
d
dt
f(c(ŕ)) = df(c'(ŕ)) = 0.
Pro obecný vektor v = (v\,..., vn) G En je velikost příslušné směrové derivace funkce f:
\dvf\
df
■1/1 + --- +
df
(df, v) = cosy>|| df||||i/||
dx\ dxn
kde ip je odchylka vektoru v od gradientu funkce f. Dokázali jsme:
Směr zadaný gradientem v bodě x = (xi,..., x„) je právě ten směr, ve kterém funkce f nejrychleji roste. Tečná rovina k neprázdné úrovňové množině Mt, v okolí jejího bodu s nenulovým gradientem df je určena ortogonálním doplňkem ke gradientu.
Násobkům gradientu v tomto případě říkáme normálový vektor nadplochy Mt,.
Pro funkci f n proměnných a bod P = (a\,..., an) G M t, v jehož okolí je Mt, grafem funkce {n — 1) proměnných je implicitní rovnice pro tečnou nadrovinu
0 = t—{P) • (xi - ai) + • • • + t—(P) ■ (x„ - a„).
(JX\ oxn
□ s
Příklad (Model osvětlení 3D objektu)
Pro 2D povrch známe směr v dopadu světla, tj. máme množinu M
zadanou implicitně rovnicí f(x,y,z) = 0 a vektor v. Intenzitu
osvětlení bodu P G M pak definujme jako locostp, kde ip je úhel
mezi normálou zadanou gradientem a vektorem opačným ke směru
světla. (Znaménko říká, kterou stranu plochy osvětlujeme, /oje
tzv. svítivost.)
Např. v = (1,1, —1) (tj. šikmo dolů) a
f (x, y, z)=x2+y2 + z2 - 1. Pro bod P = (x, y, z) e M
l(P)
grád f ■ v
grád f\\\\v
-2x - 2y + 2z 2^3
'o-
Dle očekávání je plnou intenzitou /o osvětlen bod P = 4=(—1, —1,1) na povrchu koule.
□ s
Obecné dimenze: funkce F = (fi, ...,fn): Em+n —> En a n rovnic
/ý(xi,..., xm+n) = bi, i = 1,..., n.
Dle věty o implicitní funkci je většinou množina všech řešení (xi,... ,xm+n) grafem zobrazení G : Em —>■ En. Pro pevnou volbu b = {b\,..., bn) je samozřejmě množinou M všech řešení průnik nadploch M(b,, fj) příslušejících jednotlivým rovnicím f; = b\. Totéž platí pro tečné směry a normálové směry:
Tečné a normálové prostory
Obecné dimenze: funkce F = (f\,..., fn) fi(x1,...,xm+n) = bi, i
Em+n —> En a n rovnic
= 1, ...,n.
Dle věty o implicitní funkci je většinou množina všech řešení (xi,... ,xm+n) grafem zobrazení G : Em —>■ En. Pro pevnou volbu b = {b\,..., bn) je samozřejmě množinou M všech řešení průnik nadploch M(b,, fj) příslušejících jednotlivým rovnicím f; = b\. Totéž platí pro tečné směry a normálové směry: Afinní podprostor v Em+n obsahující právě všechny tečny k M bodem P dán rovnicemi:
0
9xi
(P)-(xi-ai) +
+ T— (P) ■ {Xm+n - am+n)
uxn
g(p).(xl_31)+...+g(p)(xm+0
3m
□ s
n)-
Tento podprostor se nazýva tečný prostor k (implicitně zadané) ploše M v bodě P. Normálový prostor v bodě P je afinní podprostor generovaný bodem P a gradienty všech funkcí f\,..., fn v bodě P, tj. řádky Jacobiho matice D1F.
□ s
Tento podprostor se nazýva tečný prostor k (implicitně zadané) ploše M v bodě P. Normálový prostor v bodě P je afinní podprostor generovaný bodem P a gradienty všech funkcí f\,..., fn v bodě P, tj. řádky Jacobiho matice D1F.
Příklad *
Spočtěme tečnu a normálový prostor ke kuželosečce v E3.
Uvažujme rovnici 0 = f(x, y,z)=z-
- V*2 + y2
kuželu s vrcholem v počátku a rovinu zadanou
0 = g(x,y,z) =z- 2x + y + l.
Bod P = ( 1,0,1) patří jak kuželu, tak rovině a průn k M těchto
dvou ploď je křivka. ---------------------'
□ s
Příklad (pokr.)
Její tečnou v bodě P bude přímka zadaná rovnicemi
Příklad (pokr.)
Její tečnou v bodě P bude přímka zadaná rovnicemi
0
:2x
(x-1)
x=l,y=0
2Vx2+y2
2Vx2 + y2 + l-(z-l) = -x + z 0 = -2(x - 1) + y + (z - 1) = -2x + y + z + 1
2y
•y
x=l,y=0
Příklad (pokr.)
Její tečnou v bodě P bude přímka zadaná rovnicemi
0
:2x
(x-1)
x=l,y=0
2Vx2+y2
2y
x=l,y=0
2Vx2 + y2 + l-(z-l) = -x + z 0 = -2(x - 1) + y + (z - 1) = -2x + y + z + 1
zatímco rovina kolmá k naší křivce bodem P bude parametricky dána výrazem
(1,0,1)+t(-1,0,1) + <7(-2,1,1)
s parametry t a a.
■y
ooooooooooooooooo
Plán přednášky
Q Literatura
Q Zobrazení mezi euklidovskými prostory
• Zobrazení a transformace a "Chain Rule"
• Věta o inverzním zobrazení
• Implicitně zadaná zobrazení
• Tečné a normálové prostory
/m plochám
Q Vázané extrémy
» Metoda Lagrangeových multiplikátorů • Speciální optimalizační metody
□ s
Již dříve jsme se zabývali úlohou nalézt absolutní extrém dané funkce na (uzavřené) množině, což vedlo na vyšetření lokálních extrémů funkce na hranici této množiny. Jinými slovy, na hledání extrémů funkce v bodech, které jsou vázány nějakou další podmínkou.
□ s
Již dříve jsme se zabývali úlohou nalézt absolutní extrém dané
funkce na (uzavřené) množině, což vedlo na vyšetření lokálních
extrémů funkce na hranici této množiny. Jinými slovy, na hledání
extrémů funkce v bodech, které jsou vázány nějakou další
podmínkou.
Ukážeme nejprve názorně graficky na případu funkcí dvou
proměnných obecnou metodu.
Příklad
Určete lokální extrémy funkce f(x,y) = x2y na množině M dané implicitně rovnicí 5x2 + 2y2 = 14.
□ s
V předchozím příkladu jsme viděli, že normálový vektor (tj. gradient) funkce, k níž hledáme extrém, musí být ve vyšetřovaném bodě prvkem normálového prostoru k ploše (v témže bodě). Toto samozřejmě platí i obecně.
ooooooooooooooooo
•oooooooooooc
Metoda Lagrangeových multiplikátoru
V předchozím příkladu jsme viděli, že normálový vektor (tj. gradient) funkce, k níž hledáme extrém, musí být ve vyšetřovaném bodě prvkem normálového prostoru k ploše (v témže bodě). Toto samozřejmě platí i obecně.
Pokud je M ve všech svých bodech grafem hladkého zobrazení, musí být každý extrém P G M stacionárním bodem, tj. pro každou křivku c(ř) C M procházející přes P = c(0) musí být h(c(t)) extrémem pro tuto funkci jedné proměnné. Proto musí platit
dt
h(c(t)){t=0 = dc,{0)h(P) = dh(P)(c'(Q)) = 0.
ooooooooooooooooo
•oooooooooooc
Metoda Lagrangeových multiplikátoru
V předchozím příkladu jsme viděli, že normálový vektor (tj. gradient) funkce, k níž hledáme extrém, musí být ve vyšetřovaném bodě prvkem normálového prostoru k ploše (v témže bodě). Toto samozřejmě platí i obecně.
Pokud je M ve všech svých bodech grafem hladkého zobrazení, musí být každý extrém P G M stacionárním bodem, tj. pro každou křivku c(ř) C M procházející přes P = c(0) musí být h(c(t)) extrémem pro tuto funkci jedné proměnné. Proto musí platit
dt
h(c(t)){t=0 = dc,{0)h(P) = dh(P)(c'(Q)) = 0.
Tato vlastnost je ekvivalentní tvrzení, že gradient h leží v normálovém podprostoru (přesněji v jeho zaměření). Takové body P G M budeme nazývat stacionární body funkce h vzhledem k vazbám F.
V praxi mívají optimalizační úlohy často m + n parametrů, které jsou vázány n podmínkami. V našem jazyce diferenciálního počtu tedy hledáme extrémy spojitě diferencovatelné funkce h na množině bodů M zadaných implicitně rovnicí F(x\,... ,xm+n) = 0 {F ■ Em+n —> En).
Normálový prostor k naší množině M je generován řádky Jacobiho matice zobrazení F a stacionární body jsou proto ekvivalentně určeny následujícím tvrzením, kterému se říká metoda Lagrangeových multiplikátorů:
□ s
V praxi mívají optimalizační úlohy často m + n parametrů, které jsou vázány n podmínkami. V našem jazyce diferenciálního počtu tedy hledáme extrémy spojitě diferencovatelné funkce h na množině bodů M zadaných implicitně rovnicí F(x\,... ,xm+n) = 0 {F : Em+n —> En).
Normálový prostor k naší množině M je generován řádky Jacobiho matice zobrazení F a stacionární body jsou proto ekvivalentně určeny následujícím tvrzením, kterému se říká metoda Lagrangeových multiplikátorů:
Necht F = (fi,..., fn) : Em+n —>■ En je spojitě diferencovatelná v okolí bodu P, F{P) = 0 a M je zadána implicitně rovnicí F(xi,..., xm+n) = 0, přičemž hodnost matice DXF v bodě P je n. Pak P je stacionárním bodem spojitě diferencovatelné funkce h : Em+n —>■ R právě, když existují reálné parametry Ai,..., A„ takové, že
grád h = Xi grád f\ -\--------h A„ grád fn.
Všimněme si počtu neznámých a rovnic v tomto algoritmu: gradienty jsou vektory o m + n souřadnicích, tedy požadavek z věty dává m + n rovnic. Jako neznámé máme jednak souřadnice xi,... ,xm+n hledaných stacionárních bodů P, ale navíc také n parametrů A; v hledané lineární kombinaci. Zbývá však požadavek, že hledaný bod P patří implicitně zadané množině M, což představuje dalších n rovnic. Celkem tedy máme 2n + m rovnic pro 2n + m proměnných a proto lze očekávat, že řešením bude diskrétní množina bodů P (tj. každý z nich bude izolovaným bodem).
□ s
ooooooooooooooooo
ooo»ooooooooc
Absolutní extrémy
Výklad o vázaných extrémech jsme začali tím, že pro nalezení absolutních extrémů funkce na kompaktní množině často potřebujeme vyšetření extrémů na množině bodů vázaných nějakou podmínkou.
□ s
ooooooooooooooooo
ooo»ooooooooc
Absolutní extrémy
Výklad o vázaných extrémech jsme začali tím, že pro nalezení
absolutních extrémů funkce na kompaktní množině často
potřebujeme vyšetření extrémů na množině bodů vázaných nějakou
podmínkou.
Ilustrujme si to na příkladu:
í Příklad *
Maximalizujte f(x,y) - = 2x + y za podmínky ^- + y2 < 1. J
□ s
ooooooooooooooooo
oooo«oooooooc
Řešení
Množina určená vazební podmínkou je uzavřená a ohraničená, proto zde nabývá jakákoliv spojitá funkce svých extrémů, a to buď ve stacionárních bodech nebo na hranici. Snadno se ale přesvědčíme (df(x,y) = (2,1)), že uvnitř množiny extrémy nejsou. Proto maximalizujeme funkci f za podmínky \ + y2 = 1.
ooooooooooooooooo
oooo«oooooooc
Řešení
Množina určená vazební podmínkou je uzavřená a ohraničená, proto zde nabývá jakákoliv spojitá funkce svých extrémů, a to buď ve stacionárních bodech nebo na hranici. Snadno se ale přesvědčíme (df(x,y) = (2,1)), že uvnitř množiny extrémy nejsou. Proto maximalizujeme funkci f za podmínky ^- + y2 = 1. Sestrojíme Lagrangeovu funkci Z_(x, y, A) = 2x + y - A(^- + y2 - 1). Pak dostáváme:
0 0
Lx
= 2-
= 1-
+ y2
A2 2Ay
-1.
ooooooooooooooooo
oooo«oooooooc
Řešení
Množina určená vazební podmínkou je uzavřená a ohraničená, proto zde nabývá jakákoliv spojitá funkce svých extrémů, a to buď ve stacionárních bodech nebo na hranici. Snadno se ale přesvědčíme (df(x,y) = (2,1)), že uvnitř množiny extrémy nejsou. Proto maximalizujeme funkci f za podmínky ^- + y2 = 1. Sestrojíme Lagrangeovu funkci Z_(x, y, A) = 2x + y - A(^- + y2 - 1). Pak dostáváme:
Odtud snadno x (resp. A = ~2~
h y
0 = LX = 2- A^
0 = Ly = 1- 2Ay
0 _x2 4 + y2 -1.
= 2A' a tedy A =
17
y
17
17'
y = —A= pro minimum).
Speciální optimalizační metody
Zmiňme se jen ve stručnosti o speciálních optimalizačních technikách, které se v dnešní praxi používají. Zájemce o bližší seznámení s nimi můžeme odkázat na další předměty MU, např.
• Optimalizace - PřF: M0160 (jaro)
• Optimalizace - PV027 (jaro)
• Lineární programování - PřF: M4110 (jaro)
• Matematické programování - PřF: M5170 (podzim)
Již dříve jsme zmínili, že funkce nejrychleji roste ve směru gradientu (a nejrychleji klesá ve směru opačném) - proto je přirozené se při hledání maxima vydat z daného bodu ve směru gradientu (analogie chození do kopce nejprudším svahem). Otázka je, jak dlouho "jít" a jak často gradient počítat. Iterace:
xn+i = xn + 7„ grád f(xn), pro dostatečně malé 7„, aby f(xn+i) > f(xn).
ooooooooooooooooo
Metoda gradientu
Již dříve jsme zmínili, že funkce nejrychleji roste ve směru gradientu (a nejrychleji klesá ve směru opačném) - proto je přirozené se při hledání maxima vydat z daného bodu ve směru gradientu (analogie chození do kopce nejprudším svahem). Otázka je, jak dlouho "jít" a jak často gradient počítat. Iterace:
xn+1 =xn + jn grád f(xn),
pro dostatečně malé 7„, aby f(xn+i) > f(x„). Problémy:
• náročný opakovaný výpočet 7,
• velký počet iterací v případě velmi různorodé křivosti
v různých směrech; např Rosenbrockova banánová funkce f(x,y) = (l-x)2 + 100(y-x2)2.
□ S
ooooooooooooooooo
OOOOOOO0OOOOC
Newtonova optimalizační metoda
Newtonova metoda je dobře známý numerický postup pro nalezení kořenů dané reálné funkce f . Známe-li bod xo "rozumně" blízko kořene, zkonstruujeme v bodě [xo, f(xo)] tečnu ke grafu funkce f a za bod xi zvolíme průsečík tečny s osou x. Tento postup opakujeme. Snadno je vidět, že platí rekurentní vztah
*n+l
ooooooooooooooooo
OOOOOOO0OOOOC
Newtonova optimalizační metoda
Newtonova metoda je dobře známý numerický postup pro nalezení kořenů dané reálné funkce f . Známe-li bod xo "rozumně" blízko kořene, zkonstruujeme v bodě [xo, f(xo)] tečnu ke grafu funkce f a za bod xi zvolíme průsečík tečny s osou x. Tento postup opakujeme. Snadno je vidět, že platí rekurentní vztah
*n+l
Tento postup např. poskytuje efektivní postup pro výpočet y/2 s libovolnou přesností; pokud bychom ale chtěli hledat řešení rovnice x1/3 = 0, tak snadno vidíme, že metoda diverguje, ať začneme jakkoli blízko 0.
Při hledání extrémů funkcí (i více proměnných) může být Newtona metoda využita pro nalezení stacionárních bodů - v nich musí být derivace nulová, proto jde vlastně o nalezení kořenů derivace iterativním postupem