Zobrazeni mezi euklidovskými pr oooooooooooooo Matematika III - 3. přednáška Funkce více proměnných: lokální a absolutní extrémy, zobrazení mezi euklidovskými prostory Michal Bulant Masarykova univerzita Fakulta informatiky 2. 9. 2007 = Q Literatura Q Lokální a absolutní extrémy funkcí více proměnných 9 Lokální extrémy • Absolutní (globální) extrémy Q Zobrazení mezi euklidovskými prostory • Zobrazení a transformace • „Chain Rule" • Věta o inverzním zobrazení • Implicitně zadaná zobrazení Literatura Zobrazeni mezi euklidovskýrr oooooooooooooo = oooooooooooooo í zdroje Zobrazeni mezi euklidovskýrr OOOOOOOOOOOOOO Martin Panák, Jan Slovák, Drsná matematika, e-text. □ s - = oooooooooooooo í zdroje Zobrazeni mezi euklidovskýrr OOOOOOOOOOOOOO • Martin Panák, Jan Slovák, Drsná matematika, e-text. • Zuzana Došlá, Ondřej Došlý, Diferenciální počet funkcí více proměnných, MU Brno, 2006, 150 s. • Martin Panák, Jan Slovák, Drsná matematika, e-text. • Zuzana Došlá, Ondřej Došlý, Diferenciální počet funkcí více proměnných, MU Brno, 2006, 150 s. • Zuzana Došlá, Roman Plch, Petr Sojka, Diferenciální počet funkcí více proměnných s programem Maple, MU Brno, 1999, 273 s. (příp. http://www.math.muni.cz/~plch/mapm). • Martin Panák, Jan Slovák, Drsná matematika, e-text. • Zuzana Došlá, Ondřej Došlý, Diferenciální počet funkcí více proměnných, MU Brno, 2006, 150 s. • Zuzana Došlá, Roman Plch, Petr Sojka, Diferenciální počet funkcí více proměnných s programem Maple, MU Brno, 1999, 273 s. (příp. http://www.math.muni.cz/~plch/mapm). » Předmětové záložky v IS MU Q Lokální a absolutní extrémy funkcí více proměnných 9 Lokální extrémy • Absolutní (globální) extrémy □ 9 - = l -O«. O Zobrazeni mezi euklidovskýrr oooooooooooooo Definice Vnitřní bod x* G En definičního oboru funkce f je (lokálním) maximem (resp. minimem), jestliže existuje jeho okolí U takové, že pro všechny body x G U platí f (x) < f (x*) (resp. f (x) > f(x*))- Pokud nastává v předchozích nerovnostech ostrá nerovnost pro všechny x^x', hovoříme o ostrém lokálním extrému. Zobrazeni mezi euklidovskýrr oooooooooooooo Definice Vnitřní bod x* G En definičního oboru funkce f je (lokálním) maximem (resp. minimem), jestliže existuje jeho okolí U takové, že pro všechny body x G U platí f (x) < f (x*) (resp. f (x) > f(x*))- Pokud nastává v předchozích nerovnostech ostrá nerovnost pro všechny x^x', hovoříme o ostrém lokálním extrému. Vnitřní bod x* G En definičního oboru funkce f, ve kterém je diferenciál ^(x) nulový nazýváme stacionární bod funkce f. Zobrazeni mezi euklidovskýrr oooooooooooooo Definice Vnitřní bod x* G En definičního oboru funkce f je (lokálním) maximem (resp. minimem), jestliže existuje jeho okolí U takové, že pro všechny body x G U platí f (x) < f (x*) (resp. f (x) > f(x*))- Pokud nastáva v předchozích nerovnostech ostrá nerovnost pro všechny x^x', hovoříme o ostrém lokálním extrému. Vnitřní bod x* G En definičního oboru funkce f, ve kterém je diferenciál df{x) nulový nazýváme stacionární bod funkce f. Nutnou podmínkou pro existenci maxima nebo minima v bodě x* (v případě diferencovatelnosti funkce f v x*) je vymizení diferenciálu v tomto bodě, tj. df(x*) = 0. Skutečně, pokud je df(x*) 7^ 0, pak existuje směr v, ve kterém je dvf{x*) ^ 0. Pak ovšem nutně je podél přímky x* + tv na jednu stranu od bodu x* hodnota funkce roste a na druhou klesá. o«oooooooooooo Zobrazeni mezi euklidovskýrr oooooooooooooo Příklad Funkce f : E2 f (x, y) definovaná předpisem íx2+y2, pro [x,y] ^[0,0], pro[x,y] = [0,0] má v počátku ostré lokálni maximum (přitom zde není spojitá, a tedy ani diferencovatelná). = o«oooooooooooo Zobrazeni mezi euklidovskými pr oooooooooooooo Příklad Funkce f : E2 f (x, y) definovaná předpisem íx2+y2, pro [x,y] ^[0,0], pro[x,y] = [0,0] má v počátku ostré lokálni maximum (přitom zde není spojitá, a tedy ani diferencovatelná). Příklad Funkce f(x,y) = yx2 + y2 je v počátku spojitá a má zde ostré lokální minimum, přestože v tomto bodě není diferencovatelná (grafem funkce je kuželová plocha - viz první přednáška). = Pro to, aby nabývala v daném bodě diferencovatelná funkce svého lokálního extrému (maxima nebo minima), je nutnou podmínkou, aby byl daný bod stacionární. Pro to, aby nabývala v daném bodě diferencovatelná funkce svého lokálního extrému (maxima nebo minima), je nutnou podmínkou, aby byl daný bod stacionární. Přitom ale (podobně jako u funkcí jedné proměnné) stacionární bod nemusí být bodem lokálního extrému. Např. funkce f(x,y) — (x — xo)(y — yo) má v bodě [xo,yo] stacionární bod (dŕ = §£c/x + %dy = (y - yo)dx + (x - x0)dy), nemá zde však zřejmě lokální extrém (jde o tzv. „sedlo"). Pro to, aby nabývala v daném bodě diferencovatelná funkce svého lokálního extrému (maxima nebo minima), je nutnou podmínkou, aby byl daný bod stacionární. Přitom ale (podobně jako u funkcí jedné proměnné) stacionární bod nemusí být bodem lokálního extrému. Např. funkce f(x,y) — (x — xo)(y — yo) má v bodě [xo,yo] stacionární bod (dŕ = §£c/x + %dy = (y - yo)dx + (x - x0)dy), nemá zde však zřejmě lokální extrém (jde o tzv. „sedlo"). Poznat, jakého typu je daný stacionární bod, nám stejně jako v případě funkcí jedné proměnné umožní (díky Taylorově větě) derivace vyšších řádů. Mějme funkci f : R —► R a její stacionární bod xo (tj. ^'(xo) = 0). Je-li f"{xo) < 0, má funkce v xo ostré lokální maximum (analogicky neostré, resp. minimum). Mějme funkci f : R —► R a její stacionární bod xo (tj. f'{xo) = 0). Je-li f"{xo) < 0, má funkce v xo ostré lokální maximum (analogicky neostré, resp. minimum). Toto tvrzení vyplynulo z Taylorovy věty (stačí uvážit Taylorův polynom 1. stupně a příslušný zbytek) f{x) = Tx(x) + /?!(*) = = f M + ŕ'(xo)(x - xo) + \ f"{í){x - xo)2 = = f{xo) + \f"{í){*-xo)\ kde £ leží mezi x a xq. □ S - = .= -f)<\o Mějme funkci f : R —► R a její stacionární bod xo (tj. f'{xo) = 0). Je-li f"{xo) < 0, má funkce v xo ostré lokální maximum (analogicky neostré, resp. minimum). Toto tvrzení vyplynulo z Taylorovy věty (stačí uvážit Taylorův polynom 1. stupně a příslušný zbytek) f{x) = Tx{x) + /?i(x) = = f M + ŕ'(xo)(x - xo) + \ f"{í){x - xo)2 = = f{xo) + \f"{í){*-xo)\ kde £ leží mezi x a xo. Ze spojitosti f" a vlastnosti f"(xo) < 0 pak pro £ dostatečně blízko xo dostáváme f"{£) < 0 a tedy /?i(x) < 0 dostatečně blízko xo . Proto zde f{x) < f(xo) a xo je lokálním maximem. Mějme funkci f : En —> R a její stacionární bod x* (tj. f'(x*) = 0 - nulový vektor parciálních derivací). Mějme funkci f : En —> R a její stacionární bod x* (tj. f'(x*) = 0 - nulový vektor parciálních derivací). Z Taylorovy věty pak dostáváme (opět stačí uvážit Taylorův polynom 1. stupně a příslušný zbytek) f(x) = 7i(x) + /?i(x) = = f(x*) + df (x*)(x - x*) + \ d2f (0(x - x*) = = f(x*) + id2r(£)(x-x*), kde { = x* + 6>v (pro 61 G (0,1)) leží „mezi" x a x*. □ g - = ^ -OQ.O" Mějme funkci f : En —> R a její stacionární bod x* (tj. f'(x*) = 0 - nulový vektor parciálních derivací). Z Taylorovy věty pak dostáváme (opět stačí uvážit Taylorův polynom 1. stupně a příslušný zbytek) f(x) = 7i(x) + /?i(x) = = f(x*) + df (x*)(x - x*) + \ d2f (0(x - x*) = = f(x*) + id2r(£)(x-x*), kde { = x* + 61!/ (pro 61 G (0,1)) leží „mezi" x a x*. Zbývá do více proměnných „přeložit" podmínku, která říká, že výraz d2f(0(x - x*) = (x - x*)THf(0(x - x*) je nekladný (resp. nezáporný) pro libovolné x. Definice Kvadratická forma h : En —> R je • pozitivně definitní, je-li Ku) > 0 pro všechny u 7^0 • pozitivně semidefinitní, je-li h{u) > 0 pro všech ny u G V • negativně definitní, je-li h(u) < 0 pro všechny u 7^0 • negativně semidefinitní , je-li h{u) < 0 pro všecl my u e V • indefinitní , je-li h(u) > C a h(v) < 0 pro vhodné u, v G V. ooooo«oooooooo íegativně) definitní kva< Zobrazeni mezi euklidovskýrr oooooooooooooo Definice Kvadratická forma h : En —*■ R je • pozitivně definitní, je-li h(u) > 0 pro všechny u^O • pozitivně semidefinitní, je-li h(u) > 0 pro všechny u G V • negativně definitní, je-li h(u) < 0 pro všechny u^O • negativně semidefinitní, je-li h(u) < 0 pro všechny u G V 9 indefinitní, je-li h(u) > 0 a h(v) < 0 pro vhodné u, v G V. Často rovněž hovoříme o definitnosti matice A kvadratické formy h (jsou spolu ve vztahu h(u) = uTAu = Au ■ u). ooooo«oooooooo íegativně) definitní kva< Zobrazeni mezi euklidovskýrr oooooooooooooo Definice Kvadratická forma h : En —*■ R je • pozitivně definitní, je-li h(u) > 0 pro všechny u^O • pozitivně semidefinitní, je-li h(u) > 0 pro všechny u e V • negativně definitní, je-li h(u) < 0 pro všechny u^O • negativně semidefinitní, je-li h(u) < 0 pro všechny u G V 9 indefinitní, je-li h(u) > 0 a h(v) < 0 pro vhodné u, v G V. Často rovněž hovoříme o definitnosti matice A kvadratické formy h (jsou spolu ve vztahu h(u) = uTAu = Au ■ u). S těmito pojmy jste se setkali již v části věnované lineárním modelům a měli byste tedy umět rozeznat definitnost kvadratické formy (resp. její matice v dané bázi). OOOOOO0OOOOOOO :itivní definitnosti matic Daná symetrická matice A je pozitivně definitní, právě tehdy když platí některá z těchto ekvivalentních podmínek: OOOOOO0OOOOOOO :itivní definitnosti matic Daná symetrická matice A je pozitivně definitní, právě tehdy když platí některá z těchto ekvivalentních podmínek: • všechny vlastní hodnoty matice A (tj. kořeny A jejího charakteristického polynomu \A — Xln\) jsou kladné, OOOOOO0OOOOOOO :itivní definitnosti matic Daná symetrická matice A je pozitivně definitní, právě tehdy když platí některá z těchto ekvivalentních podmínek: • všechny vlastní hodnoty matice A (tj. kořeny A jejího charakteristického polynomu \A — Xln\) jsou kladné, • všechny hlavní minory A jsou kladné (Sylvesterovo kritérium) OOOOOO0OOOOOOO :itivní definitnosti matic Daná symetrická matice A je pozitivně definitní, právě tehdy když platí některá z těchto ekvivalentních podmínek: • všechny vlastní hodnoty matice A (tj. kořeny A jejího charakteristického polynomu \A — Xln\) jsou kladné, • všechny hlavní minory A jsou kladné (Sylvesterovo kritérium) OOOOOO0OOOOOOO :itivní definitnosti matic Daná symetrická matice A je pozitivně definitní, právě tehdy když platí některá z těchto ekvivalentních podmínek: • všechny vlastní hodnoty matice A (tj. kořeny A jejího charakteristického polynomu \A — Xln\) jsou kladné, • všechny hlavní minory A jsou kladné (Sylvesterovo kritérium) Daná symetrická matice A je negativně definitní, právě tehdy když platí některá z těchto ekvivalentních podmínek: OOOOOO0OOOOOOO :itivní definitnosti matic Daná symetrická matice A je pozitivně definitní, právě tehdy když platí některá z těchto ekvivalentních podmínek: • všechny vlastní hodnoty matice A (tj. kořeny A jejího charakteristického polynomu \A — Xln\) jsou kladné, • všechny hlavní minory A jsou kladné (Sylvesterovo kritérium) Daná symetrická matice A je negativně definitní, právě tehdy když platí některá z těchto ekvivalentních podmínek: • všechny vlastní hodnoty matice A jsou záporné, OOOOOO0OOOOOOO :itivní definitnosti matic Daná symetrická matice A je pozitivně definitní, právě tehdy když platí některá z těchto ekvivalentních podmínek: • všechny vlastní hodnoty matice A (tj. kořeny A jejího charakteristického polynomu \A — Xln\) jsou kladné, • všechny hlavní minory A jsou kladné (Sylvesterovo kritérium) Daná symetrická matice A je negativně definitní, právě tehdy když platí některá z těchto ekvivalentních podmínek: • všechny vlastní hodnoty matice A jsou záporné, • hlavní minory A střídají znaménko, počínaje záporným. ooooooo«oooooo Zobrazeni mezi euklidovskýrr oooooooooooooo Nechť f : En —> R je dvakrát spojitě diferencovatelná funkce a x* G En nechť je stacionární bod funkce f. Potom O je-li Hf(x*) positivně (negativně) definitní, má f v x* ostré lokální minimum (maximum), Q je-li H f {x*) indefinitní, nemá f v bodě x* lokální extrém. O má-li f v x* lokální minimum (maximum), je Hf(x*) pozitivně (negativně) semidefinitní, ooooooo«oooooo Zobrazeni mezi euklidovskýrr oooooooooooooo Nechť f : En —> R je dvakrát spojitě diferencovatelná funkce a x* G En nechť je stacionární bod funkce f. Potom O je-/; Hf(x*) positivně (negativně) definitní, má f v x* ostré lokální minimum (maximum), Q je-li Hf(x*) indefinitní, nemá f v bodě x* lokální extrém. O má-li f v x* lokální minimum (maximum), je Hf(x*) pozitivně (negativně) semidefinitní, Všimněme si, že věta nedává žádný výsledek, pokud je hessián funkce ve zkoumaném bodě degenerovaný (nulový). Důvod je opět stejný jako u funkcí jedné proměnné. V takových případech totiž existují směry, ve kterých první i druhá derivace zmizí a my proto v tomto řádu přiblížení neumíme poznat, zda se funkce bude chovat jako ř3 nebo jako ±r4 dokud nespočteme alespoň v potřebných směrech derivace vyšší. OOOOOOOO0OOOOO Zobrazeni mezi euklidovskýrr oooooooooooooo Příklad Uvažme funkci f(x,y) = sin(x)cos(y), která připomíná známá kartónová plata na vajíčka a spočtěme její lokální extrémy. □ g - = ooooooooo«oooo Zobrazeni mezi euklidovskýrr oooooooooooooo Příklad (pok O Spočtěme si nejprve prvn parciál ní derivace: fx(x, y) = cos(x) :os(y), fy(x,y) = - sin(x)sin(y), takže obě derivace budou nulové pro dvě sady bodů O cos(x) = = 0, sin(y) = 0, to je [x, y] = -[2T^^i pro libovolné k,£ e Z Q cos(y) = = 0, sin(x) = 0, to je [x, y] = -[kTT 2T*l pro libovolné k,£ € Z. = ooooooooo«oooo Zobrazeni mezi euklidovskýrr oooooooooooooo Příklad (pok r-) Spočtěme si nejprve prvn' parciál ní derivace: fx(x, y) = cos(x) :os(y), fy(x,y) = -sin(x)sin(y), takže obě derivace budou nulové pro dvě sady bodů O cos(x) = = 0, sin(y) = 0, to je [x,y] = [^*M> pro libovolné k,£ e Z Q cos(y) = = 0, sin(x) = 0, to je [x,y] = [kir,^TT], pro libovolné k,£ € Z. Druhé parciá lni derivace jsou Hr(x,y)=| 'xx 'xy \ i f f ){X \'w 'yyj ,y) = ( / — si n (x) cos(y) — cos(x) s — cos(x) si n (y) — si n (x) sin(y)\ :os(y)y OOOOOOOOOO0OOO Zobrazeni mezi euklidovskýrr oooooooooooooo ' Příklad (pokr.) 1 V našich dvou sadác i bod j tedy dostáváme následující hessiány: O Hf(k7T + ^,£7T) = ± (l 0\ 10 1; , přičemž znaménko + nastává, když k a £ jsou různé \ / parity a naopak pro —, Q Hf{kiT,£iT + l) = ± U 0/ , přičemž znaménko + nastává, když k a £ jsou různé \ / parity a naopak pro —. = OOOOOOOOOO0OOO Zobrazeni mezi euklidovskýrr oooooooooooooo Příklad (pokr.) V našich dvou sadách bodů tedy dostáváme následující hessiány: když k a £ jsou různé parity a naopak pro Q Hf(kTT,eTT + %) = ±(°i J" když hr jsou různé parity a naopak pro —. Protože naše funkce má spojitý hessián, který je nedegenerovaný, nastane lokální maximum tehdy a jen tehdy, když náš bod (x*,y*) patří do první skupiny se stejnými paritami k a £. Když budou parity opačné, pak bod z první skupiny bude naopak bodem lokálního minima. přičemž znaménko + nastává, přičemž znaménko + nastává, OOOOOOOOOO0OOO Zobrazeni mezi euklidovskýrr oooooooooooooo přičemž znaménko + nastává, přičemž znaménko + nastává, Příklad (pokr.) V našich dvou sadách bodů tedy dostáváme následující hessiány: když k a £ jsou různé parity a naopak pro Q Hf(kTT,eTT + %) = ±(°i J" když k a £ jsou různé parity a naopak pro —. Protože naše funkce má spojitý hessián, který je nedegenerovaný, nastane lokální maximum tehdy a jen tehdy, když náš bod (x*,y*) patří do první skupiny se stejnými paritami k a £. Když budou parity opačné, pak bod z první skupiny bude naopak bodem lokálního minima. Naopak, hessián u druhé skupiny bodů se vyčíslí kladně na některých přírůstcích a záporně na jiných. Stejně se proto bude chovat i celá funkce f v okolí. ooooooooooo«oo Zobrazeni mezi euklidovskýrr oooooooooooooo Příklad (Poznámky) • matice 0 1 1 0 je indefinitní, přestože má oba hlavní minory nekladné (pro semidefinitnost je znaménko minorů pouze nutnou podmínkou!) ooooooooooo«oo Zobrazeni mezi euklidovskýrr oooooooooooooo Příklad (Poznámky) • matice je indefinitní, přestože má oba hlavní minory nekladné (pro semidefinitnost je znaménko minorů pouze nutnou podmínkou!) nalezené lokální extrémy šlo jistě najít snadněji úvahou o nabývání hodnot ±1 funkcí f{x, y) = sin(x) cos(y), neměli bychom ale jistotu, že jde o všechny extrémy. Nechť f : En ^R a M je podmnožinou definičního oboru f. V bodě x* " nabývá f absolutního (globálního) maxima (minima) na M, pokud je f(x*) > f{x) (f(x* ) < f(x)) Pro všechna x G M. oooooooooooo»o Zobrazeni mezi euklidovskýrr oooooooooooooo