Literatura Diferenciál složených zobrazení Implicitně zadaná zobrazení Vázané extrémy
Matematika III – 3. týden
Funkce více proměnných: Inverzní zobrazení,
implicitně deﬁnovaná zobrazení a vázané extrémy
Jan Slovák
Masarykova univerzita
Fakulta informatiky
5. 10. – 9. 10. 2015
Literatura Diferenciál složených zobrazení Implicitně zadaná zobrazení Vázané extrémy
Obsah přednášky
1 Literatura
2 Diferenciál složených zobrazení
3 Implicitně zadaná zobrazení
Tečny a normály k implicitně zadaným plochám
Gradient funkce
Tečné a normálové prostory
4 Vázané extrémy
Literatura Diferenciál složených zobrazení Implicitně zadaná zobrazení Vázané extrémy
Kde je dobré číst?
Zuzana Došlá, Roman Plch, Petr Sojka, Diferenciální počet
funkcí více proměnných s programem Maple, MU Brno, 1999,
273 s.
J. Slovák, M. Panák, M. Bulant, Matematika drsně a svižně,
Muni Press, Brno 2013, v+773 s., elektronická edice
www.math.muni.cz/Matematika_drsne_svizne
Literatura Diferenciál složených zobrazení Implicitně zadaná zobrazení Vázané extrémy
Theorem
Nechť F : En → Em a G : Em → Er jsou dvě diferencovatelná
zobrazení, přičemž deﬁniční obor G obsahuje celý obor hodnot F.
Pak také složené zobrazení G ◦ F je diferencovatelné a jeho
diferenciál je v každém bodě z deﬁničního obodu F kompozicí
diferenciálů
D1
(G ◦ F)(x) = D1
G(F(x)) ◦ D1
F(x).
Příslušná Jacobiho matice je dána součinem příslušných Jacobiho
matic.
Literatura Diferenciál složených zobrazení Implicitně zadaná zobrazení Vázané extrémy
Polární souřadnice vzniknou z kartézských transformací
F : R2 → R2, kterou v souřadnicích (x, y) a (r, ϕ) zapíšeme:
r = x2 + y2, ϕ = arctan
y
x
.
Funkci gt : E2 → R v polárních souřadnicích
g(r, ϕ, t) = sin(r-t) .
Funkce nám docela dobře přibližuje vlnění povrchu hladiny po
bodovém vzruchu v počátku v čase t:
Literatura Diferenciál složených zobrazení Implicitně zadaná zobrazení Vázané extrémy
Derivace v kartézských souřadnicích:
∂g
∂x
(x, y, t) =
∂g
∂r
(r, ϕ)
∂r
∂x
(x, y) +
∂g
∂ϕ
(r, ϕ)
∂ϕ
∂x
(x, y)
= cos( x2 + y2 − t)
x
x2 + y2
+ 0
a podobně
∂g
∂y
(x, y, t) =
∂g
∂r
(r, ϕ)
∂r
∂y
(x, y) +
∂g
∂ϕ
(r, ϕ)
∂ϕ
∂y
(x, y)
= cos( x2 + y2 − t)
y
x2 + y2
.
Literatura Diferenciál složených zobrazení Implicitně zadaná zobrazení Vázané extrémy
Theorem
Nechť F : En → En je spojitě diferencovatelné zobrazení na
nějakém okolí bodu x0 ∈ En a nechť je Jacobiho matice D1f (x0)
invertibilní. Pak na nějakém okolí bodu x0 existuje inverzní
zobrazení F−1 a jeho diferenciál v bodě F(x0) je inverzním
zobrazením k D1F(x0), tzn. je zadán inverzní maticí k Jacobiho
matici zobrazení F v bodě x0.
Literatura Diferenciál složených zobrazení Implicitně zadaná zobrazení Vázané extrémy
Věta o implicitní funkci
Pro jednoduchost vyložíme ideu v rovině E2:
Pro spojitě diferencovatelné zobrazení F(x, y) : R2 → R hledejme
body (x, y), ve kterých platí F(x, y) = 0. Příkladem může být
třeba obvyklá (implicitní) deﬁnice přímek a kružnic:
F(x, y) = ax + by + c = 0
F(x, y) = (x − s)2
+ (y − t)2
− r2
= 0, r > 0.
V prvém případě je (při b = 0) předpisem zadaná funkce
y = f (x) = −
a
b
x −
c
b
pro všechna x, ve druhém umíme pouze pro (a, b) splňující rovnici
kružnice a b = t najít okolí bodu a, na kterém nastane jedna z
možností: y = f (x) = t + (x − s)2 − r,
y = f (x) = t − (x − s)2 − r.
Literatura Diferenciál složených zobrazení Implicitně zadaná zobrazení Vázané extrémy
Krajní body intervalu [t − r, t + r] také vyhovují rovnici kružnice,
platí v nich ale Fy (s ± r, t) = 0, což vystihuje polohu tečny ke
kružnici v těchto bodech rovnoběžné s osou y. V těchto bodech
skutečně neumíme najít okolí, na němž by kružnice byla popsána
jako funkce y = f (x).
Navíc umíme i derivace:
f (x) =
1
2
2(x − s)
(x − s)2 − r2
=
x − s
y − t
= −
Fx
Fy
.
Naopak, pokud budeme chtít najít závislost x = f (y) takovou, aby
F(f (y), y) = 0, pak v okolí bodů (s ± r, t) bez problémů uspějeme.
Všimněme si, že v těchto bodech je parciální derivace Fx nenulová.
Literatura Diferenciál složených zobrazení Implicitně zadaná zobrazení Vázané extrémy
Zhrňme pozorování (pro pouhé dva příklady):
Pro funkci F(x, y) a bod (a, b) ∈ E2 takový, že F(a, b) = 0, umíme
najít funkci y = f (x) splňující F(x, f (x)) = 0, pokud je
Fy (a, b) = 0. V takovém případě umím i vypočíst f (x) = −Fx /Fy .
Dokážeme, že takto to platí vždy, navíc rozšířené i na libovolné
počty proměnných.
Poslední tvrzení o derivaci přitom je dobře zapamatovalné (a při
pečlivém vnímání věcí i pochopitelné) z výrazu pro diferenciál:
0 = dF = Fx dx + Fy dy = (Fx + Fy f (x))dx.
Literatura Diferenciál složených zobrazení Implicitně zadaná zobrazení Vázané extrémy
Obdobně pro implicitní výrazy F(x, y, z) = 0, kdy hledáme funkci
g(x, y) takovou, že F(x, y, g(x, y)) = 0. Např. graf funkce
f (x, y) = x2 + y2 (rotační paraboloid) můžeme implicitně zadat
rovnicí
0 = F(x, y, z) = z − x2
− y2
.
Jaké dimenze se mohou/mají v problému vyskytovat obecně?
Pokud bychom pro naší poslední F chtěli najít křivku
c(x) = (c1(x), c2(x)) v rovině takovou, že
F(x, c(x)) = F(x, c1(x), c2(x)) = 0,
pak to lze, ale výsledek nebude jednoznačný pro danou počáteční
podmínku.
Literatura Diferenciál složených zobrazení Implicitně zadaná zobrazení Vázané extrémy
Obecný postup:
Jedna funkce m + 1 proměnných zadává implicitně nadplochu v
Rm+1, kterou vyjadřujeme alespoň lokálně jako graf jedné funkce v
m proměnných.
Proto n funkcí v m + n proměnných bude zadávat průnik n
nadploch v Rm+n, což je ve „většině“ případů m–rozměrný objekt.
Příklad: dvě rovnice f (x, y, z) = 0, g(x, y, z) = 0 v E3 zadávají (za
nějaké podmínky na derivace) křivku v E3.
Literatura Diferenciál složených zobrazení Implicitně zadaná zobrazení Vázané extrémy
Uvažujme proto spojitě diferencovatelné zobrazení
F = (f1, . . . , fn) : Rm+n
→ Rn
.
Jacobiho matice tohoto zobrazení bude mít n řádků a m + n
sloupců a můžeme si ji symbolicky zapsat jako
D1
F = (D1
x F, D1
y F) =



∂f1
∂x1
. . . ∂f1
∂xm
...
...
...
∂fn
∂x1
. . . ∂fn
∂xm
∂f1
∂xm+1
. . . ∂f1
∂xm+n
...
...
...
∂fn
∂xm+1
. . . ∂fn
∂xm+n


 ,
kde (x1, . . . , xm+n) ∈ Rm+n zapisujeme jako (x, y) ∈ Rm × Rn,
D1
x F je matice s n řádky a prvními m sloupci v Jacobiho matici,
zatímco D1
y F je čtvercová matice řádu n se zbylými sloupci.
Vícerozměrnou analogií k předchozí úvaze s nenulovou parciální
derivací podle y je požadavek, aby matice D1
y byla invertibilní.
Literatura Diferenciál složených zobrazení Implicitně zadaná zobrazení Vázané extrémy
Theorem (Věta o implicitním zobrazení)
Nechť F : Rm+n → Rn je zobrazení třídy C1 na otevřeném okolí
bodu (a, b) ∈ Rm × Rn = Rm+n, ve kterém je F(a, b) = 0 a
det D1
y F = 0. Potom existuje zobrazení třídy C1 G : Rm → Rn
deﬁnované na nějakém okolí U bodu a ∈ Rm s obrazem G(U), který
obsahuje bod b, a takové, že F(x, G(x)) = 0 pro všechny x ∈ U.
Navíc je Jacobiho matice D1G zobrazení G na okolí bodu a zadána
součinem matic
D1
G(x) = −(D1
y F)−1
(x, G(x)) · D1
x F(x, G(x)).
Literatura Diferenciál složených zobrazení Implicitně zadaná zobrazení Vázané extrémy
Dokážeme pro nejjednodušší případ rovnice F(x, y) = 0 s funkcí F
dvou proměnných.
Rozšíříme funkci F na
˜F : R2
→ R2
, (x, y) → (x, F(x, y)).
Jacobiho matice zobrazení ˜F je
D1 ˜F(x, y) =
1 0
Fx (x, y) Fy (x, y)
.
Z předpokladu Fy (a, b) = 0 vyplývá, že totéž platí i na nějakém
okolí bodu (a, b) a tam je funkce ˜F invertibilní a ˜F−1 je
jednoznačně deﬁnované a spojitě diferencovatelné.
Literatura Diferenciál složených zobrazení Implicitně zadaná zobrazení Vázané extrémy
Nechť π : R2 → R je projekce na druhou souřadnici, pak
f (x) = π ◦ ˜F−1
(x, 0)
je spojitě diferencovatelná funkce.
Spočteme F(x, f (x)) = F(x, π( ˜F−1(x, 0))).
Z deﬁnice ˜F(x, y) = (x, F(x, y)) vidíme, že i její inverze má tvar
˜F−1(x, y) = (x, π ˜F−1(x, y)). Proto
F(x, f (x)) = π( ˜F(x, π( ˜F−1
(x, 0)))) = π( ˜F( ˜F−1
(x, 0))) = π(x, 0) = 0.
Tím máme dokázánu první část věty a zbývá spočíst derivaci funkce
f (x).
Literatura Diferenciál složených zobrazení Implicitně zadaná zobrazení Vázané extrémy
Tuto derivaci můžeme odečíst opět z věty o inverzním zobrazení
pomocí matice (D1 ˜F)−1.
1 0
Fx (x, y) Fy (x, y)
−1
= (Fy (x, y))−1 Fy (x, y) 0
−Fx (x, y) 1
.
Dle deﬁnice f (x) = π ˜F−1(x, 0) nás z této matice zajímá první
položka na druhém řádku, která je právě Jacobiho maticí D1f . V
našem jednoduchém případě je to právě požadovaný skalár
−Fx (x, f (x))/Fy (x, f (x)).
Důkaz věty je ukončen. Pro obecný případ je zcela stejný, jen
pracujeme s násobením matic a vektorů místo skalárů.
Literatura Diferenciál složených zobrazení Implicitně zadaná zobrazení Vázané extrémy
Gradient funkce
Deﬁnition
Pro spojitě diferencovatelnou funkci F(x1, . . . , xn) : Rn → R se
vektor
D1
F =
∂f
∂x1
, . . . ,
∂f
∂xn
nazývá gradient funkce F.
V technické a fyzikální literatuře se často zapisuje také jako grad F.
Rovnost F(x1, . . . , xn) = b s pevnou hodnotou b ∈ R zadává
podmnožinu M ⊂ Rn, která mívá vlastnosti (n − 1)–rozměrné
nadplochy. Přesněji: pokud je vektor parciálních derivací nenulový,
můžeme lokálně množinu M popsat jako graf spojitě
diferencovatelné funkce v n − 1 proměnných.
Hovoříme v této souvislosti také o úrovňových množinách Mb.
Literatura Diferenciál složených zobrazení Implicitně zadaná zobrazení Vázané extrémy
Na derivacích křivek ležících v úrovňové množině Mb se bude
diferenciál dF vždy vyčíslovat nulově:
F(c(t)) = b pro všechna t, proto
d
dt
F(c(t)) = dF(c (t)) = 0.
Pro obecný vektor v = (v1, . . . , vn) ∈ Rn je velikost příslušné
směrové derivace funkce F:
|dv F| =
∂f
∂x1
v1 + · · · +
∂f
∂xn
vn = cos ϕ D1
F v
kde ϕ je odchylka vektoru v od gradientu F. Dokázali jsme:
Theorem
Směr zadaný gradientem v bodě x = (x1, . . . , xn) je právě ten směr,
ve kterém funkce F nejrychleji roste.
Tečná rovina k neprázdné úrovňové množině Mb v okolí jejího bodu
s nenulovým gradientem D1F je určena ortogonálním doplňkem ke
gradientu.
Literatura Diferenciál složených zobrazení Implicitně zadaná zobrazení Vázané extrémy
Násobkům gradientu v tomto případě říkáme normálový vektor
nadplochy Mb.
Theorem
Pro funkci F n proměnných a bod P = (a1, . . . , an) ∈ Mb v jehož
okolí je Mb grafem funkce (n − 1) proměnných je implicitní rovnice
pro tečnou nadrovinu
0 =
∂f
∂x1
(P) · (x1 − a1) + · · · +
∂f
∂xn
(P) · (xn − an).
Literatura Diferenciál složených zobrazení Implicitně zadaná zobrazení Vázané extrémy
Example (Model osvětlení 3D objektu)
Pro 2D povrch známe směr v dopadu světla, tj. máme množinu M
zadanou implicitně rovnicí F(x, y, z) = 0 a vektor v. Intenzitu
osvětlení bodu P ∈ M pak deﬁnujme jako I cos ϕ, kde ϕ je úhel
mezi normálou zadanou gradientem a vektorem opačným ke směru
světla. (Znaménko říká, kterou stranu plochy osvětlujeme.)
Např. v = (1, 1, −1) (tj. „šikmo dolů“) a
F(x, y, z) = x2 + y2 + z2 − 1. Pro bod P = (x, y, z) ∈ M
I(P) =
grad F · v
grad F v
I0 =
−2x − 2y + 2z
2
√
3
I0.
Dle očekávání je plnou intenzitou I0 osvětlen bod
P = 1√
3
(−1, −1, 1) na povrchu koule.
Literatura Diferenciál složených zobrazení Implicitně zadaná zobrazení Vázané extrémy
Tečné a normálové prostory
Obecné dimenze: funkce F = (f1, . . . , fn) : Rm+n → Rn a n rovnic
fi (x1, . . . , xm+n) = bi , i = 1, . . . , n.
dle věty o implicitní funkci je „většinou“ množina všech řešení
(x1, . . . , xm+n) grafem zobrazení G : Rm → Rn. Pro pevnou volbu
b = (b1, . . . , bn) je samozřejmě množinou M všech řešení průnik
nadploch M(bi , fi ) příslušejících jednotlivým rovnicím fi = bi .
Totéž platí pro tečné směry a normálové směry:
Aﬁnní podprostor v Rm+n obsahující právě všechny tečny k M
bodem P dán rovnicemi:
0 =
∂f1
∂x1
(P) · (x1 − a1) + · · · +
∂f1
∂xn
(P) · (xm+n − am+n)
...
0 =
∂fn
∂x1
(P) · (x1 − a1) + · · · +
∂fn
∂xn
(P) · (xm+n − am+n).
Literatura Diferenciál složených zobrazení Implicitně zadaná zobrazení Vázané extrémy
Tento podprostor se nazývá tečný prostor k (implicitně zadané)
ploše M v bodě P. Normálový prostor v bodě P je aﬁnní
podprostor generovaný bodem P a gradienty všech funkcí f1, . . . , fn
v bodě P, tj. řádky Jacobiho matice D1F.
Spočtěme tečnu a normálový prostor ke kuželosečce v R3.
Uvažujme rovnici
0 = f (x, y, z) = z − x2 + y2
kuželu s vrcholem v počátku a rovinu zadanou
0 = g(x, y, z) = z − 2x + y + 1.
Bod P = (1, 0, 1) patří jak kuželu tak rovině a průnik M těchto
dvou ploch je křivka.
Literatura Diferenciál složených zobrazení Implicitně zadaná zobrazení Vázané extrémy
Její tečnou v bodě P bude přímka zadaná rovnicemi
0 = −
1
2 x2 + y2
2x
x=1,y=0
· (x − 1) −
1
2 x2 + y2
2y
x=1,y=0
· y
+ 1 · (z − 1)
= −x + z
0 = −2(x − 1) + y + (z − 1) = −2x + y + z + 1
zatímco rovina kolmá k naší křivce bodem P bude parametricky
dána výrazem
(1, 0, 1) + τ(−1, 0, 1) + σ(−2, 1, 1)
s parametry τ a σ.
Literatura Diferenciál složených zobrazení Implicitně zadaná zobrazení Vázané extrémy
V praxi mívají optimalizační úlohy často m + n parametrů, které
jsou vázány n podmínkami. V našem jazyce diferenciálního počtu
tedy hledáme extrémy spojitě diferencovatelné funkce h na množině
bodů M zadaných implicitně rovnicí F(x1, . . . , xm+n) = 0.
Pokud je M ve všech svých bodech grafem hladkého zobrazení v m
proměnných, musí být každý extrém P ∈ M stacionárním bodem,
tj. pro každou křivku c(t) ⊂ M procházející přes P = c(0) musí být
h(c(t)) extrémem pro tuto funkci jedné proměnné. Proto musí
platit
d
dt
h(c(t))|t=0 = dc (0)h(P) = dh(P)(c (0)) = 0.
Tato vlastnost je ekvivalentní tvrzení, že gradient h leží v
normálovém podprostoru (přesněji v jeho zaměření). Takové body
P ∈ M budeme nazývat stacionární body funkce H vzhledem k
vazbám F.
Literatura Diferenciál složených zobrazení Implicitně zadaná zobrazení Vázané extrémy
Normálový prostor k naší množině M je generován řádky Jacobiho
matice zobrazení F a stacionární body jsou proto ekvivalentně
určeny následujícím tvrzením, kterému se říká metoda
Lagrangeových multiplikátorů:
Theorem
Nechť F = (f1, . . . , fn) : Rm+n → Rn je spojitě diferencovatelná v
okolí bodu P, F(P) = 0 a M je zadána implicitně rovnicí
F(x, y) = 0 a hodnost matice D1F v bodě P je n. Pak P je
stacionárním bodem spojitě diferencovatelné funkce h : Rm+n → R
právě, když existují reálné parametry λ1, . . . , λn takové, že
grad h = λ1 grad f1 + · · · + λn grad fn.
Literatura Diferenciál složených zobrazení Implicitně zadaná zobrazení Vázané extrémy
Všimněme si počtu neznámých a rovnic v tomto algoritmu:
gradienty jsou vektory o m + n souřadnicích, tedy požadavek z věty
dává m + n rovnic. Jako proměnné máme jednak souřadnice
x1, . . . , xm+n hledaných stacionárních bodů P, ale navíc také n
parametrů λi v hledané lineární kombinaci. Zbývá však požadavek,
že hledaný bod P patří implicitně zadané množině M, což
představuje dalších n rovnic. Celkem tedy máme 2n + m rovnic pro
2n + m proměnných a proto lze očekávat, že řešením bude diskrétní
množina bodů P (tj. každý z nich zpravidla bude izolovaným
bodem).