Matematika III - 3. přednáška Funkce více proměnných: lokální a absolutní extrémy, zobrazení mezi euklidovskými prostory Michal Bulant Masarykova univerzita Fakulta informatiky 2. 9. 2007 • Martin Panák, Jan Slovák, Drsná matematika, e-text. • Zuzana Došlá, Ondřej Došlý, Diferenciální počet funkcí více proměnných, MU Brno, 2006, 150 s. • Zuzana Došlá, Roman Plch, Petr Sojka, Diferenciální počet funkcí více proměnných s programem Maple, MU Brno, 1999, 273 s. (příp. http://www.math.muni.cz/~plch/mapm). » Předmětové záložky v IS MU Definice Vnitřní bod x* G En definičního oboru funkce f je (lokálním) maximem (resp. minimem), jestliže existuje jeho okolí U takové, že pro všechny body x G U platí f (x) < f (x*) (resp. f (x) > f(x*))- Pokud nastáva v předchozích nerovnostech ostrá nerovnost pro všechny x^x', hovoříme o ostrém lokálním extrému. Vnitřní bod x* G En definičního oboru funkce f, ve kterém je diferenciál df{x) nulový nazýváme stacionární bod funkce f. Nutnou podmínkou pro existenci maxima nebo minima v bodě x* (v případě diferencovatelnosti funkce f v x*) je vymizení diferenciálu v tomto bodě, tj. df(x*) = 0. Skutečně, pokud je df(x*) 7^ 0, pak existuje směr v, ve kterém je dvf{x*) ^ 0. Pak ovšem nutně je podél přímky x* + tv na jednu stranu od bodu x* hodnota funkce roste a na druhou klesá. Příklad Funkce f : E2 —> K definovaná předpisem ff ) = /x2+^2' Pro[x,y]^[0,0], \l pro[x,y] = [0,0] má v počátku ostré lokální maximum (přitom zde není spojitá, a tedy ani diferencovatelná). Příklad Funkce f(x,y) = yx2 +y2 je v počátku spojitá a má zde ostré lokální minimum, přestože v tomto bodě není diferencovatelná (grafem funkce je kuželová plocha - viz první přednáška). Pro to, aby nabývala v daném bodě diferencovatelná funkce svého lokálního extrému (maxima nebo minima), je nutnou podmínkou, aby byl daný bod stacionární. Přitom ale (podobně jako u funkcí jedné proměnné) stacionární bod nemusí být bodem lokálního extrému. Např. funkce f(x,y) — (x — xo)(y — yo) má v bodě [xo,yo] stacionární bod (dŕ = §£c/x + %dy = (y - yo)dx + (x - x0)dy), nemá zde však zřejmě lokální extrém (jde o tzv. „sedlo"). Poznat, jakého typu je daný stacionární bod, nám stejně jako v případě funkcí jedné proměnné umožní (díky Taylorově větě) derivace vyšších řádů. Mějme funkci f : R —► R a její stacionární bod xo (tj. r(xo) = 0). Je-li f"{xo) < 0, má funkce v xo ostré lokální maximum (analogicky neostré, resp. minimum). Toto tvrzení vyplynulo z Taylorovy věty (stačí uvážit Taylorův polynom 1. stupně a příslušný zbytek) f{x) = Tx{x) + /?i(x) = = f M + ŕ'(xo)(x - xo) + \ f"{í){x - xo)2 = = f{xo) + \f"{í){*-xo)\ kde £ leží mezi x a xo. Ze spojitosti f" a vlastnosti f"(xo) < 0 pak pro £ dostatečně blízko xo dostáváme f"{£) < 0 a tedy /?i(x) < 0 dostatečně blízko xo . Proto zde f{x) < f(xo) a xo je lokálním maximem. Mějme funkci f : En —> R a její stacionární bod x* (tj. f'(x*) = 0 - nulový vektor parciálních derivací). Z Taylorovy věty pak dostáváme (opět stačí uvážit Taylorův polynom 1. stupně a příslušný zbytek) f(x) = 7i(x) + /?i(x) = = f(x*) + df (x*)(x - x*) + \ d2f (0(x - x*) = = f(x*) + id2f(0(x-x*), kde { = x* + 61!/ (pro 61 G (0,1)) leží „mezi" x a x*. Zbývá do více proměnných „přeložit" podmínku, která říká, že výraz d2f(0(x - x*) = (x - x*)THf(0(x - x*) je nekladný (resp. nezáporný) pro libovolné x. Definice Kvadratická forma h : En —> R je • pozitivně definitní, je-li h(u) > 0 pro všechny u^O • pozitivně semidefinitní, je-li h(u) > 0 pro všechny u e V • negativně definitní, je-li h(u) < 0 pro všechny u^O • negativně semidefinitní, je-li h(u) < 0 pro všechny u G V 9 indefinitní, je-li h(u) > 0 a h(v) < 0 pro vhodné u, v G V. Často rovněž hovoříme o definitnosti matice A kvadratické formy h (jsou spolu ve vztahu h(u) = uTAu = Au ■ u). S těmito pojmy jste se setkali již v části věnované lineárním modelům a měli byste tedy umět rozeznat definitnost kvadratické formy (resp. její matice v dané bázi). Daná symetrická matice A je pozitivně defínitní, právě tehdy když platí některá z těchto ekvivalentních podmínek: • všechny vlastní hodnoty matice A (tj. kořeny A jejího charakteristického polynomu \A — Xln\) jsou kladné, • všechny hlavní minory A jsou kladné (Sylvesterovo kritérium) Daná symetrická matice A je negativně defínitní, právě tehdy když platí některá z těchto ekvivalentních podmínek: • všechny vlastní hodnoty matice A jsou záporné, • hlavní minory A střídají znaménko, počínaje záporným. Nechť f : En —> R je dvakrát spojitě diferencovatelná funkce a x* G En nechť je stacionární bod funkce f. Potom O je-li Hf(x*) positivně (negativně) definitní, má f v x* ostré lokální minimum (maximum), Q je-li H f {x*) indefinitní, nemá f v bodě x* lokální extrém. O má-li f v x* lokální minimum (maximum), je Hf(x*) pozitivně (negativně) semidefinitní, - Všimněme si, že věta nedává žádný výsledek, pokud je hessián funkce ve zkoumaném bodě degenerovaný (nulový). Důvod je opět stejný jako u funkcí jedné proměnné. V takových případech totiž existují směry, ve kterých první i druhá derivace zmizí a my proto v tomto řádu přiblížení neumíme poznat, zda se funkce bude chovat jako ř3 nebo jako ±r4 dokud nespočteme alespoň v potřebných směrech derivace vyšší. Příklad Uvažme funkci f(x,y) = sin(x)cos(y), která připomíná známá kartónová plata na vajíčka a spočtěme její lokální extrémy. Příklad (pok r-) Spočtěme si nejprve prvn' parciál ní derivace: fx(x, y) = cos(x) :os(y), fy(x,y) = -sin(x)sin(y), takže obě derivace budou nulové pro dvě sady bodů O cos(x) = = 0, sin(y) = 0, to je [x,y] = [^*M> pro libovolné k,£ e Z Q cos(y) = = 0, sin(x) = 0, to je [x,y] = [kir,^TT], pro libovolné k,£ € Z. Druhé parciá lni derivace jsou Hr(x,y)=| 'xx 'xy \ i f f ){X \'w 'yyj ,y) = ( / — si n (x) cos(y) — cos(x) s — cos(x) si n (y) — si n (x) sin(y)\ :os(y)y přičemž znaménko + nastává, přičemž znaménko + nastává, Příklad (pokr.) V našich dvou sadách bodů tedy dostáváme následující hessiány: když k a £ jsou různé parity a naopak pro Q Hf(kTT,£TT + Z) = ±(j J" když hr jsou různé parity a naopak pro —. Protože naše funkce má spojitý hessián, který je nedegenerovaný, nastane lokální maximum tehdy a jen tehdy, když náš bod (x*,y*) patří do první skupiny se stejnými paritami k a £. Když budou parity opačné, pak bod z první skupiny bude naopak bodem lokálního minima. Naopak, hessián u druhé skupiny bodů se vyčíslí kladně na některých přírůstcích a záporně na jiných. Stejně se proto bude chovat i celá funkce f v okolí. Příklad (Poznámky) • matice je indefinitní, přestože má oba hlavní minory nekladné (pro semidefinitnost je znaménko minorů pouze nutnou podmínkou!) nalezené lokální extrémy šlo jistě najít snadněji úvahou o nabývání hodnot ±1 funkcí f{x, y) = sin(x) cos(y), neměli bychom ale jistotu, že jde o všechny extrémy. Definice Nechť f : En —> R a M je podmnožinou definičního oboru ŕ. V bodě x* nabývá f absolutního (globálního) maxima (minima) na M, pokud je f{x*) > f{x) (f(x*) < f(x)) pro všechna x G M. Existence extrémů na kompaktní (uzavřené a ohraničené) množině vyplývá z Weierstrassovy věty. Nechť WCf„ je kompaktní množina, f : M —> R spojitá. Pak f nabývá svých absolutních extrémů buď v bodech lokálních extrémů uvnitř M nebo v některém hraničním bodě. Hledání absolutních extrémů funkce na množině tak máme převedeno na nalezení lokálních extrémů (což umíme) a vyšetření hraničních bodů. To je ale často komplikovanější záležitost, které se budeme více věnovat později v části o vázaných extrémech. Příklad Nalezněte extrémy funkce f{x, y) = xy — x2 — y2 + x + y na množině M, která je dána trojúhelníkem, tvořeným souřadnými osami a přímkou x + y — 4 = 0. Řešení Jediným stacionárním bodem je [1,1], kde nastává absolutní maximum f(l, 1) = 1. Absolutní minimum —12 nastává v hraničních bodech [4,0] a [0,4]. Zobrazení F : En —> Em je při zvolených kartézských souřadnicích na obou stranách obyčejná m-tice F(xi,... ,xn) = (fi(xi,... ,x„),..., ŕm(xi,... ,x„)) funkcí f; : En —> R. Řekneme, že F je diferencovatelné nebo spojitě diferencovatelné zobrazení, jestliže tuto vlastnost mají všechny funkce f\,..., fm. Diferencovatelná zobrazení F : En —> En, která mají inverzní zobrazení G : En —> En definované na celém svém obrazu, se nazývají (diferencovatelné) transformace. Příkladem transformace v E2 je přechod mezi polárními a kartézkými souřadnicemi: [r,6] 1—> [rcos6, rs\r\6] s inverzí [x,y] ^ [\/x2 + y2,arctg-], [0,y] 1-» [y, -sgny]. Lineární zobrazení dŕ/(x) : E" —> R lineárně aproximují přírůstky f,. Definice D1 F (x) /dfi(x)\ dŕ2(x) / ď/i ďŕi 9x1 9x9 df2 df2 9xi ÖX2 Vd^W/ Vfl 9ŕm 9x2 9x„ 9ŕm / 9x„/ (X) se nazývá Jacobiho matice zobrazení F v bodě x. Lineárni zobrazení D1F(x) definované na přírůstcích v = (v\,..., vn) pomocí stejně značené Jacobiho matice nazýváme diferenciál zobrazení F v bodě x z definičního oboru, jestliže lim jr-rÍFÍx + v) - Fix) - D1F(x)(v)) = 0. V^Q \\v\\ Důsledek Věty o existenci diferenciálu pro funkce n proměnných je: Nechť F : En —» Em je zobrazení, jehož všechny souřadné funkce mají spojité parciální derivace v okolí bodu xě£„. Pak existuje diferenciál D1F{x) zobrazení F zadaný Jacobiho maticí. Věta („Chain rule") Nechť F : En Em a G : E„ Er jsou dvě diferencovatelná zobrazení, přičemž definiční obor G obsahuje celý obor hodnot F. Pak také složené zobrazení G o F je diferencovatelné a jeho diferenciál je v každém bodě z definičního obodu F kompozicí diferenciálu D1 (G o F)(x) = D1G(F(x)) o D1F{x). Příslušná Jacobiho matice je dána součinem příslušných Jacobiho matic. Polární souřadnice vzniknou z kartézských souřadnic transformací F : Ei —>■ E-i, kterou v souřadnicích [x,y] a [r, p] zapíšeme: r = a/x2 +y2, if = arctg -. x Funkci gt : £2 —*■ K v polárních souřadnicích á"(r,(^, ř) = sin(r-t). Funkce nám docela dobře přibližuje vlnění povrchu hladiny po bodovém vzruchu v počátku v čase ř: Chceme-li vypočítat derivaci funkce zadané parametricky v kartézských souřadnicích, využijeme větu o derivaci složeného zobrazení g o F : E2 —> K: D\g o F)(x) = Dlg{F{x)) o ĎyF{x) = ~ V^ - - t -- — , \ dx dy I Tedy dg c a podobně dJX,y,t)=cos(V^r-t)7=== + 0 g-(x, y, t) = COs(y/x2+y2 - t)- Y d Y '' ' " a/x2 + y 2 Nechť F : En —» En je spojitě diferencovatelné zobrazení na nějakém okolí bodu x* e En a nechť je Jacobiho matice D1F(x*) invertibilní Pak na nějakém okolí bodu x* existuje inverzní zobrazení F_1 a jeho diferenciál v bodě F(x*) je inverzním zobrazením k D1F(x*), tzn. je zadán inverzní maticí k Jacobiho matici zobrazení F v bodě x*. Princip důkazu: Z pravidla pro derivování složené funkce vyplývá, že pokud diferencovatelná inverze existuje, pak musí být její Jacobiho matice inverzí k původní Jacobiho matici (srovnejte s případem 1 proměnné). Důkaz poměrně komplikovaným způsobem vyvozuje, že díky invertovatelnosti Jacobiho matice existuje diferencovatelná inverze. Pro jednoduchost vyložíme ideu v rovine Ei: Pro spojitě diferencovatelnou funkci F{x,y) : E2 —> K hledejme body [x,y], ve kterých platí F(x,y) = 0. Příkladem může být třeba obvyklá (implicitní) definice přímek a kružnic: F(x, y) = ax + by + c = 0 F(x,y) = (x- s)2 + (y - ř)2 - r2 = 0, r > 0. V prvním případě je (při b 7^ 0) předpisem zadaná funkce fí \ a c y = m = —b*--b pro všechna x. Ve druhém případě umíme pouze pro [a, b] splňující rovnici kružnice a b 7^ ř najít okolí bodu a, na kterém nastane jedna z možností: y = ŕ(x) = t + J (x — s)2 — r, Body [s ± r, ŕ] také vyhovují rovnici kružnice, platí v nich ale Fy(s ± r, ŕ) = 0, což vystihuje polohu tečny ke kružnici v těchto bodech rovnoběžné s osou y. V těchto bodech neumíme najít okolí, na němž by kružnice byla popsána jako funkce y = f (x). Navíc umíme spočítat i derivace: f(x) = 1 2(x~s) = x~s = _^l 2 y/(x - s)2 - r2 y-t F/ Naopak, pokud budeme chtít najít závislost x = f {y) takovou, aby F(f(y),y) = 0, pak v okolí bodů (s± r, ř) bez problémů uspějeme. Všimněme si, že v těchto bodech je parciální derivace Fx nenulová. Shrňme pozorování (pro pouhé dva příklady): Pro funkci F(x,y) a bod [a, b] G E2 takový, že F(a, b) = 0, umíme najít funkci y = f (x) splňující F(x, f (x)) = 0, pokud je Fy(a, b) 7^ 0. V takovém případě umíme i vypočíst f'{x) = —Fx/Fy. Dokážeme, že takto to platí vždy, navíc rozšířené i na libovolné počty proměnných. Poslední tvrzení o derivaci přitom je dobře zapamatovalné (i pochopitelné) z výrazu pro diferenciál: 0 = dF = Fx dx + Fy áy = (Fx + Fyf\x)) dx. Věta (O implicitní funkci) Nechť F : En+\ —> R je spojitě diferencovatelná funkce na otevřeném okolí bodu [x*,y*] e f„ x K, ve kterém je F(x*,y*) = 0 a §^(x*,y*) ^ 0. Potom existuje spojitá funkce f : En —> R definovaná na nějakém okolí U bodu x* G En taková, že F(x, f(x)) = 0 pro všechny x G U. Navíc má funkce f v okolí bodu x* parciální derivace splňující dxj M 9F 9x (x, f(x)) dFÁx,f{x)) d y Příklad Určete lokální extrémy funkce z = f(x,y), která je určena implicitně rovnicí F(x, y, z) = x2 + y2 + z2 — xz — V2yz = 1. Derivováním rovnosti podle x a y dostáváme: 2x + 2z • zx — z — x • zx — v 2yzx = 0 2y + 2z • Zy — x ■ Zy — viz — v2yzy = 0, odkud vyjádříme z — 2x V2z — 2y 2z — x — v2y 2z — x — v2y Řešení (pokr.) Stacionární body musí splňovat: zx = 0, zy = 0, tj. z = 2x = y/2y, a tedy y = \/2x. Dosazením do původní rovnice dostáváme stacionární body [1, \/2,2] a [—1, — \/2, —2]. V těchto bodech je Fz^0 (je to zároveň jmenovatel všech zde vystupujících zlomků), proto je v jejich okolí implicitně určena jistá funkce z = f(x, y). Dalším derivováním implicitní rovnice vypočteme parciální derivace f 2. řádu: 2z — x — v2y *-xy 0, <-yy 2z — x — v2y Ve stacionárních bodech je Hf negativně, resp. pozitivně definitní, proto zde nastávají lokální maximum, resp. minimum funkce f. Nejobecnější případ, kdy definujeme implicitně zadané zobrazení, popisuje následující věta (v případě n=l kopíruje větu o implicitní funkci). Věta (0 implicitním zobrazení) Nechť F : Em+n —► En je spojitě diferencovatelné zobrazení na otevřeném okolí bodu [x*,y*] G Em x En = Em+n, v němž platí F{x*,y*) = 0 a det D^F ^ 0. Potom existuje spojitě diferencovatelné zobrazení G : Em —>■ En definované na nějakém okolí U bodu x* G Em s obrazem G{U), který obsahuje bod y*, a takové, že F(x, G(x)) = 0 pro všechny x G U. Navíc je Jacobiho matice D1 G zobrazení G na okolí bodu x* zadána součinem matic D'Gix) = -{D±F)-\x, G(x)) ■ DlF{x, G(x)).