Hessova matice kvadratické formy Příklad : Určete Hessovu matici kvadratické formy Q(xí , x2, x3) = 3xf + 6x!x3 + xf - 4x2x3 + 8x|. Hessova matice kvadratické formy Příklad : Určete Hessovu matici kvadratické formy Q(xi, x2, x3) = 3xf + 6x!x3 + xf - 4x2x3 + 8x|. Řešení: Spočteme parciální derivace funkce Q(xi, x2, x3) O" = 6 c — 0 w13 — 6 O77 = 0 c — w22 — 2 o77 — w23 — -4 c w31 = 6 c — w32 -4 O" — W33 — 16 Hessova matice kvadratické formy Příklad : Určete Hessovu matici kvadratické formy Q(xi, x2, x3) = 3xf + 6x!x3 + xf - 4x2x3 + 8x|. Řešení: Spočteme parciální derivace funkce Q(xi, x2, x3): O" = 6 c — 0 w13 — 6 O77 = 0 c — w22 — 2 o77 — w23 — -4 c w31 = 6 c — w32 -4 O" — W33 — 16 Již dříve jsme zavedli maticový zápis Q(x) = x'Ax, kde x = (x^ x2, x3)' a 3 0 3 0 1 -2 3 -2 8 Nyní vidíme, že /-/(^, x2, x3) = 2A. Totální diferenciál Nechť z = f(x,y) je funkce definovaná v daném 5-okolí U$([a, b\) bodu [a, b], která má v bodě [a, b] spojité parciální derivace fx, fý. Potom funkci df v proměnných dx, dy, danou vztahem dfa,b(dx, dy) = ťx(a, b)dx + ťy{a, b)dy nazýváme totálním diferenciálem funkce f(x,y) v bodě [a, b]. □ [51 Totální diferenciál Nechť z = f(x,y) je funkce definovaná v daném 5-okolí Us([a, b]) bodu [a, b], která má v bodě [a, b] spojité parciální derivace ťx, fý. Potom funkci df v proměnných c/x, dy, danou vztahem dfa,b{dx, dy) = ťx{a, b)dx + ťy{a, b)dy nazýváme totálním diferenciálem funkce f(x,y) v bodě [a, b]. Příklad : Napište diferenciál funkce z = x3y4 v bodě [2,3]. Totální diferenciál Nechť z = f(x,y) je funkce definovaná v daném 5-okolí Us([a, b]) bodu [a, b], která má v bodě [a, b] spojité parciální derivace ťx, fý. Potom funkci df v proměnných c/x, dy, danou vztahem dfa,b{dx, dy) = fx(a, b)dx + ťy{a, b)dy nazýváme totálním diferenciálem funkce f{x,y) v bodě [a, b]. Příklad : Napište diferenciál funkce z = x3y4 v bodě [2,3]. Řešení: Funkce z = x3y4 má spojité parciální derivace ťx(x,y) = 3x2y4 a y) = 4x3y3 v každém bodě [x, y], tedy i v bodě [2,3]. Dostáváme pak dz = (3x2y4)[253]dx + (4x3y3)[253]dy, dz = 972 dx + 864 dy. Totální diferenciál Pro totální diferenciál platí následující věta. Věta : Má-li funkce f(x, y) v bodě [a, b] spojité parciální derivace prvního řádu, potom existují ô > 0 a funkce /?(/?, k) tak, že pro všechna /?, k splňující [a -\- h, b -\- k] g Uô([a,b\) platí:_ /(a + /?, Ď + /c) - /(a, Ď) = ^(a, b)h + /£(a, b)/c + r](h, k) a zároveň lim ^(frfr) - n Totální diferenciál Pro totální diferenciál platí následující věta. Věta : Má-li funkce f(x, y) v bodě [a, b] spojité parciální derivace prvního řádu, potom existují ô > 0 a funkce /?(/?, k) tak, že pro všechna /?, k splňující [a -\- h, b -\- k] g Uô([a,b\) platí:_ /(a + /?, Ď + /c) - /(a, Ď) = ^(a, b)h + /£(a, b)/c + r](h, k) a zároveň lim Ä = 0. Význam věty: /(a + c/x, ď + c/y) - /(a, b) je přírůstek funkce při přechodu z bodu [a, £>] do bodu [a + c/x, b + c/y]. Předchozí vztah lze tedy zapsat takto Af = f (a + dx, b + dy) - /(a, £>) = dfa,b(dx, dy) + 7?(dx, dy). Jestliže nahradíme přírůstek Af přírůstkem na tečné rovině df, dopustíme se chyby r]{dx, dy), tato chyba se blíží k nule, blížíme-li se k bodu [a, b}. Totální diferenciál n proměnných Analogicky lze zavést diferenciál funkce n-proměnných. Definice : Jestliže funkce z = /(X), X = [x-i,..., xn], a? g N má v oblasti Q spojité parciální derivace 1. řádu, pak_ dfx(dxi ,...,dx„) = ^ (X)dxi + • • • + ťXn{X)dxn nazýváme totálním diferenciálem funkce z = /(X) v bodě X = ... ,x„] g Q. Totální diferenciál n proměnných Analogicky lze zavést diferenciál funkce n-proměnných. Definice : Jestliže funkce z = f(X), X = [x-i,..., xn], n e N má v oblasti Q spojité parciální derivace 1. řádu, pak_ dfx(dxi ,...,dx„) = ^ {X)dx^ + • • • + fXn(X)dxn nazýváme totálním diferenciálem funkce z = f(X) v bodě X = [xi,... ,xn] e Í2. Analogicky případu n = 2 lze formulovat větu, ze které vyplývá, že pokud má funkce f(X), X = [xi,..., x„] v bodě X° = [x^,..., x°] spojité parciální derivace 1. řádu, pak_ f{x° + dxA,..., x° + dx„) - /(x?, (Ab)cř*i + • • • + fXn(X0)dxn. Totální diferenciál vyjadřuje přírůstek na tečné nadrovině, přejdeme-li z bodu X° = [x?,..., x°] do bodu X = [x° + c/x!,..., x° + c/xn]. Taylorův polynom Formulujeme pouze pro funkci dvou proměnných z = f(x, y) mající v jistém okolí Us{[a, b]) bodu [a, b] spojité všechny parciální derivace až do řádu 3 včetně. Označme 7"2(x,y) následující polynom v proměnných x, y: 72(x, y) = r(a, b) + 1 (£(a, fc)(x - a) + /£(a, fc)(y - f>)) + +Jj (&(a, f>)(x - a)2 + 2^(a, f>)(x - a)(y - f>) + ^(a, f>)(y - bf). Formulujeme pouze pro funkci dvou proměnných z = f(x, y) mající v jistém okolí Us{[a, b]) bodu [a, b] spojité všechny parciální derivace až do řádu 3 včetně. Označme 7"2(x,y) následující polynom v proměnných x, y: 72(x, y) = /(a, f>) + ± (£(a, b){x - a) + /£(a, fc)(y - b)) + +Jj (&(a, f>)(x - a)2 + 2^(a, f>)(x - a)(y - f>) + ^(a, f>)(y - bf). Podíváme-li se blíže na polynom T2(x,y), vidíme, že tento polynom má v bodě [a, b] stejnou funkční hodnotu jako funkce /(x,y) a všechny odpovídající si parciální derivace funkcí /(x,y) a 7"2(x,y) až do řádu 2 se v bodě [a,b] sobě rovnají. Polynom 7"2(x,y) nazýváme Taylorovým polynomem řádu 2 příslušným k funkci ř(x,y) v bodě [a, £>]. Taylorův polynom Formulujeme pouze pro funkci dvou proměnných z = f(x, y) mající v jistém okolí Us{[a, b]) bodu [a, b] spojité všechny parciální derivace až do řádu 3 včetně. Označme 7"2(x,y) následující polynom v proměnných x, y: 72(x, y) = /(a, b) + 1 (£(a, fc)(x - a) + /£(a, fc)(y - f>)) + +Jj (&(a, f>)(x - a)2 + 2^(a, f>)(x - a)(y - f>) + ^(a, f>)(y - bf). Podíváme-li se blíže na polynom T2(x,y), vidíme, že tento polynom má v bodě [a, b] stejnou funkční hodnotu jako funkce /(x,y) a všechny odpovídající si parciální derivace funkcí /(x,y) a 7"2(x,y) až do řádu 2 se v bodě [a,b] sobě rovnají. Polynom 7"2(x,y) nazýváme Taylorovým polynomem řádu 2 příslušným k funkci ř(x,y) v bodě [a, £>]. Poznámka : Místo výrazů (x - a), (y - £>) lze také psát c/x, c/y. □ 3 ► < ► < -ě: š >oq,o Taylorův polynom - příklad Příklad : Určete 7"2(x,y) v bodě [0,0] pro kvadratickou formu Q(x, y) = x2 + 5xy + 3y2 □ s Taylorův polynom - příklad Příklad : Určete 7"2(x,y) v bodě [0,0] pro kvadratickou formu Q(x, y) = x2 + 5xy + 3y2 Řešení: Funkční hodnota formy v zadaném bodě Q(0,0) = 0, □ s Taylorův polynom - příklad Příklad : Určete 7"2(x,y) v bodě [0,0] pro kvadratickou formu Q(x, y) = x2 + 5xy + 3y2 Řešení: Funkční hodnota formy v zadaném bodě Q(0,0) = 0, Pro gradient máme VQ(x, y) = (2.x + 5y, 5x + 6y)T, takže VQ(0,0) = (0,0)T, □ s Taylorův polynom - příklad Příklad : Určete 7"2(x,y) v bodě [0,0] pro kvadratickou formu Q(x, y) = x2 + 5xy + 3y2 Řešení: Funkční hodnota formy v zadaném bodě Q(0,0) = 0, Pro gradient máme VQ(x, y) = (2.x + 5y, 5x + 6y)T, takže VQ(0,0) = (0,0)T, a pro Hessovu matici platí h(0,0) = □ s Taylorův polynom - příklad Příklad : Určete 7"2(x,y) v bodě [0,0] pro kvadratickou formu Q(x, y) = x2 + 5xy + 3y2 Řešení: Funkční hodnota formy v zadaném bodě Q(0,0) = 0, Pro gradient máme VQ(x, y) = (2.x + 5y, 5x + 6y)T, takže VQ(0,0) = (0,0)T, a pro Hessovu matici platí h(0,0) = Dostaneme tedy 72(0,0) = /(0,0) + ± (0(x - 0) + 0(y - 0)) + 1 (2(x - O)2 + 2 • 5(x - 0)(y - 0) + 6(y - O)2) = x2 + 5xy + 3y2 Taylorův polynom - příklad Příklad : Určete 7"2(x,y) v bodě [0,0] pro kvadratickou formu Q(x, y) = x2 + 5xy + 3y2 Řešení: Funkční hodnota formy v zadaném bodě Q(0,0) = 0, Pro gradient máme VQ(x, y) = (2.x + 5y, 5x + 6y)T, takže VQ(0,0) = (0,0)T, a pro Hessovu matici platí h(0,0) = Dostaneme tedy 72(0,0) = /(0,0) + ± (0(x - 0) + 0(y - 0)) + 1 (2(x - O)2 + 2 • 5(x - 0)(y - 0) + 6(y - O)2) = x2 + 5xy + 3y2 Věta : Pro kvadratickou formu Q(x,y) platí 7"2(x,y) = Q(x,y). Taylorův polynom - použití Příklad : Pomocí Taylorova polynomu funkce f{x,y) = xy ve vhodném bodě odhadněte 0,911. Taylorův polynom - použití Příklad : Pomocí Taylorova polynomu funkce f(x,y) = xy ve vhodném bodě odhadněte 0,91>1. Řešení: Spočteme parciální derivace funkce f(x,y): fí(x,y) = y.Xy-i f;(x,y) = Xy-ln(x) fxA*,y) = y-(y-i)-xy-2 %(x,y) = y-xy-' ■ln(x) + Xy-' f"(x,y) = xy-lrf(x) Taylorův polynom - použití Příklad : Pomocí Taylorova polynomu funkce f(x,y) = xy ve vhodném bodě odhadněte 0,91>1. Řešení: Spočteme parciální derivace funkce f(x,y): fí(x,y) = y.Xy-i f;(x,y) = Xy-ln(x) fxA*,y) = y-(y-i)-xy-2 %(x,y) = y-xy-' ■ln(x) + Xy-' yy(x,y) = xy-irf(x) Hodnoty těchto derivací ve vhodném bodě [1,1] jsou £(1,1) = 1, £(1,1) = 0, &(1,1) = 0, ^(1,1) = 1, ^(1,1) = 0, takže 72(x,y) = 1 + l(x - 1) + 1 + 1)(y- 1) Taylorův polynom - použití Příklad : Pomocí Taylorova polynomu funkce f{x,y) = xy ve vhodném bodě odhadněte 0,91,1. Řešení: Spočteme parciální derivace funkce f(x,y): Ux,y) = y-Xy-i f^x,y)=Xy.ln(x) VAx,y) = y-(y-i)-*y-2 fZy(x,y) = y-xy-i-ln(x) + xy-i yy(x,y) = Xy.ln?(x) Hodnoty těchto derivací ve vhodném bodě [1,1] jsou £(1,1) = 1, £(1,1) = 0, &(1,1) = 0, r£(1,1) = 1, ^(1,1) = 0, takže T2(x,y) = 1 + l(x- 1) + 1 + l(x - 1)(y- 1) Aplikujeme tento vztah pro odhad 0,91,1 pomocí r2(0,9; 1,1): 0,91'1 « 72(0,9;1,1) = 1 +^(0,9-1) + 1 + §(0,9 - 1)(1,1 -1) = 0,89. □ rS1 ► < ► < 3 >t)q,0 Konvexní množina Konvexita hraje v matematice pro ekonomy významnou roli. Množinu M c R1 nazveme konvexní, jestliže pro každé dva její body A, B jsou všechny body úsečky AB také prvky množiny M. Tuto vlastnost můžeme analyticky vyjádřit symbolickým zápisem: A, B e M^VAg (0,1) : Ad + (1 - A)6 e M Konvexní množina Konvexita hraje v matematice pro ekonomy významnou roli. Množinu M c R1 nazveme konvexní, jestliže pro každé dva její body A, B jsou všechny body úsečky AB také prvky množiny M. Tuto vlastnost můžeme analyticky vyjádřit symbolickým zápisem: A, B e M^VAg (0,1) : Ad + (1 - A)6 e M (výrazu na pravé straně se říká konvexní kombinace A, B) Na obrázku je znázorněn příklad konvexní a nekonvexní množiny. Poznámka : Prázdná a jednobodová množina jsou triviálně konvexní. Průnik dvou konvexních množin je opět konvexní množinou (toto tvrzení lze rozšířit pro průnik více konvexních množin). Platí totéž i pro sjednocení? Konvexní a konkávni funkce Funkci f definovanou na konvexní množině M CRn nazveme konvexní na M, jestliže pro každé dva body A, B e M platí: VA g (0,1) : f(XA + (1 - A)S) < Xf{A) + (1 - X)f(B). Konvexní a konkávni funkce Funkci f definovanou na konvexní množině M cRn nazveme konvexní na M, jestliže pro každé dva body A, B e M platí:_ VA e (0,1) : f(XA + (1 - A)S) < Xf(A) + (1 - X) f (B). Pokud je pro všechna A ^ B a A g (0,1) tato nerovnost ostrá, je funkce / na množině M ryze konvexní. Geometrický význam: "Spojnice každých dvou bodů grafu leží nad grafem." Konvexní a konkávni funkce Funkci f definovanou na konvexní množině M cRn nazveme konvexní na M, jestliže pro každé dva body A, B e M platí:_ VA e (0,1) : f(XA + (1 - A)S) < Xf(A) + (1 - X) f (B). Pokud je pro všechna A ^ B a A g (0,1) tato nerovnost ostrá, je funkce f na množině M ryze konvexní. Geometrický význam: "Spojnice každých dvou bodů grafu leží nad grafem."Pro opačné nerovnosti dostaneme definici konkávni, resp. ryze konkávni funkce. Konvexní a konkávni funkce Funkci f definovanou na konvexní množině M cRn nazveme konvexní na M, jestliže pro každé dva body A, B e M platí:_ VA e (0,1) : f(XA + (1 - A)S) < Xf(A) + (1 - X) f (B). Pokud je pro všechna A ^ B a A e (0,1) tato nerovnost ostrá, je funkce f na množině M ryze konvexní. Geometrický význam: "Spojnice každých dvou bodů grafu leží nad grafem."Pro opačné nerovnosti dostaneme definici konkávni, resp. ryze konkávni funkce. Na obrázku je znázorněn příklad funkce f (x, y) = x2 + y2, která je ryze konvexní v R2. Konvexní a konkávni funkce Funkci f definovanou na konvexní množině M cRn nazveme konvexní na M, jestliže pro každé dva body A, B e M platí:_ VA e (0,1) : f(XA + (1 - A)S) < Xf(A) + (1 - X) f (B). Pokud je pro všechna A ^ B a A e (0,1) tato nerovnost ostrá, je funkce / na množině M ryze konvexní. Geometrický význam: "Spojnice každých dvou bodů grafu leží nad grafem."Pro opačné nerovnosti dostaneme definici konkávni, resp. ryze konkávni funkce. Na obrázku je znázorněn príklad funkce f (x, y) = y2, která je (neryze) konvexní v R2. Konvexní a konkávni funkce Příklady konvexních funkcí v Rn\ • Pro libovolný vektor c e Rn je lineární funkce f(x) = cT x konvexní na Rn (není ale ryze konvexní). Současně je tato funkce i konkávni (není ale ryze konkávni). • Euklidovská metrika ||x|| = yX)/Li xf ie konvexní na 4 □ ► <|f ► Konvexní a konkávni funkce Příklady konvexních funkcí v Rn\ • Pro libovolný vektor c g Rn je lineární funkce f(x) = cT x konvexní na Rn (není ale ryze konvexní). Současně je tato funkce i konkávni (není ale ryze konkávni). Pro konvexní funkce platí řada tvrzení: • Jsou-li f(x) a gf(x) konvexní funkce, pak jejich součet f(x) + g(x) je též konvexní (totéž platí i pro součin f(x) • g(x) v případě nezápornosti funkcí). • Funkce f(x) je (ryze) konvexní funkce <^> —f(x) je (ryze) konkávni. • Pro konvexní funkci f(x) na Rn a libovolnou konstantu c platí: Množina X = {x eRn : f(x) < c} je konvexní. Všechny funkce splňující zadanou podmínku pro Vc g R se souhrne nazývají kvaz i konvexní. Kvazikonvexita je tedy slabší pojem než konvexita. Tento pojem se v ekonomii hodně používá, neboť ekonomové někdy vyjadřují užitek pomocí preferencí a ne pomocí přesně specifikované měřitelné užitkové funkce (ordinalita vs kardinalita). • Euklidovská metrika llx Z)/Li xf Je konvexní na Rn. Hessova matice konvexních a konkávních funkcí Funkci f nazveme konvexní v bodě t, jestliže existuje okolí tohoto bodu, na kterém je konvexní. U funkce jedné proměnné lze konvexitu rozpoznat podle znaménka druhé derivace. Hessova matice konvexních a konkávních funkcí Funkci f nazveme konvexní v bodě t, jestliže existuje okolí tohoto bodu, na kterém je konvexní. U funkce jedné proměnné lze konvexitu rozpoznat podle znaménka druhé derivace. Zobecněním této úvahy pro funkci více proměnných dostaneme tvrzení: Dvakrát diferencovatelná funkce f \e konvexní v bodě t právě když pro každý směr s platí: (t) > 0 (při platnosti ostré nerovnosti dostaneme ryzí konvexitu). Hessova matice konvexních a konkávních funkcí Funkci f nazveme konvexní v bodě t, jestliže existuje okolí tohoto bodu, na kterém je konvexní. U funkce jedné proměnné lze konvexitu rozpoznat podle znaménka druhé derivace. Zobecněním této úvahy pro funkci více proměnných dostaneme tvrzení: Dvakrát diferencovatelná funkce f \e konvexní v bodě t právě když pro každý směr s platí: (t) > 0 (při platnosti ostré nerovnosti dostaneme ryzí konvexitu). Tedy Hessova matice H (i) musí mít následující vlastnost:_ Vs E Rn : £'(t) = S • H(t) • ST > 0 Již víme, že takové matice se nazývají pozitivně semidefinitní (pro ryzí konvexitu pak musí Hessova matice být pozitivně definitní a pro konkavitu jsou nerovnosti opačné, tj. Hessova matice negativně (semi)definitní). Hessova matice konvexních a konkávních funkcí Funkci f nazveme konvexní v bodě t, jestliže existuje okolí tohoto bodu, na kterém je konvexní. U funkce jedné proměnné lze konvexitu rozpoznat podle znaménka druhé derivace. Zobecněním této úvahy pro funkci více proměnných dostaneme tvrzení: Dvakrát diferencovatelná funkce f \e konvexní v bodě t právě když pro každý směr s platí: (t) > 0 (při platnosti ostré nerovnosti dostaneme ryzí konvexitu). Tedy Hessova matice H (i) musí mít následující vlastnost:_ Vs E Rn : £'(t) = S • H(t) • ST > 0 Již víme, že takové matice se nazývají pozitivně semidefinitní (pro ryzí konvexitu pak musí Hessova matice být pozitivně definitní a pro konkavitu jsou nerovnosti opačné, tj. Hessova matice negativně (semi)definitní). Příklad : Je funkce f(x, y,z) = x2 + z • y2 konvexní nebo konkávni v bodě [1,1,1]? Hessova matice konvexních a konkávních funkcí Funkci f nazveme konvexní v bodě t, jestliže existuje okolí tohoto bodu, na kterém je konvexní. U funkce jedné proměnné lze konvexitu rozpoznat podle znaménka druhé derivace. Zobecněním této úvahy pro funkci více proměnných dostaneme tvrzení: Dvakrát diferencovatelná funkce f \e konvexní v bodě t právě když pro každý směr s platí: (t) > 0 (při platnosti ostré nerovnosti dostaneme ryzí konvexitu). Tedy Hessova matice H (i) musí mít následující vlastnost:_ Vs E Rn : £'(t) = S • H(t) • ST > 0 Již víme, že takové matice se nazývají pozitivně semidefinitní (pro ryzí konvexitu pak musí Hessova matice být pozitivně definitní a pro konkavitu jsou nerovnosti opačné, tj. Hessova matice negativně (semi)definitní). Příklad : Je funkce f(x, y,z) = x2 + z • y2 konvexní nebo konkávni v bodě [1,1,1]? Řešení: Spočítáme Hessovu matici: Hessova matice konvexních a konkávních funkcí Funkci f nazveme konvexní v bodě t, jestliže existuje okolí tohoto bodu, na kterém je konvexní. U funkce jedné proměnné lze konvexitu rozpoznat podle znaménka druhé derivace. Zobecněním této úvahy pro funkci více proměnných dostaneme tvrzení: Dvakrát diferencovatelná funkce f \e konvexní v bodě t právě když pro každý směr s platí: (t) > 0 (při platnosti ostré nerovnosti dostaneme ryzí konvexitu). Tedy Hessova matice H (i) musí mít následující vlastnost:_ Vs E Rn : £'(t) = S • H(t) • ST > 0 Již víme, že takové matice se nazývají pozitivně semidefinitní (pro ryzí konvexitu pak musí Hessova matice být pozitivně definitní a pro konkavitu jsou nerovnosti opačné, tj. Hessova matice negativně (semi)definitní). Příklad : Je funkce f(x, y,z) = x2 + z • y2 konvexní nebo konkávni v bodě / 2 0 0 \ Řešení: Spočítáme Hessovu matici: H(1,1,1)= 0 2 2 , například \ 0 2 0 / pro vektor s = (-1 ,-1,2) platí s • H(1,1,1) • sT = -4 < 0, ale pro vektor s = (1,1,1) platí s • H(1,1,1) • sT = 8 > 0 Funkce není v bodě [1,1,1 ] ani [1,1,1]? konvexní ani konkávni. Lokální extrémy Řekneme, že funkce ř:Rn^Rmáv bodě a e Df: O lokální maximum, když existuje jeho 5-okolí Lfc(a) c Df takové, že Vx g Us(á) platí f(x) < f (a) O lokální minimum, když existuje jeho 5-okolí í/j(a) c Df takové, že Vx g Us(á) platí f(x) > f (a) Lokální extrémy Řekneme, že funkce ř:Rn^Rmáv bodě a e Df: O lokální maximum, když existuje jeho 5-okolí Lfc(a) c Df takové, že Vx g Us(á) platí f(x) < f (a) O lokální minimum, když existuje jeho 5-okolí í/j(a) c Df takové, že Vx g Us(á) platí f(x) > f (a) Poznámka: jsou-li nerovnosti splněny na ryzím okolí Uô(a) \ {a} ostře, pak extrémy nazýváme ostré. Poznámka: Funkce f může mít lokální extrémy pouze ve stacionárních bodech (tedy bodech s nulovým gradientem), nebo v bodech, v nichž neexistuje aspoň jedna parciální derivace prvního řádu. Lokální extrémy Řekneme, že funkce ř:Rn^Rmáv bodě a e Df: O lokální maximum, když existuje jeho 5-okolí Us{á) c Df takové, že Vx g Us(á) platí f(x) < f (a) O lokální minimum, když existuje jeho 5-okolí Lfc(a) c Df takové, že Vx g Us(á) platí f(x) > f (a) Poznámka: jsou-li nerovnosti splněny na ryzím okolí Uó(a) \ {a} ostře, pak extrémy nazýváme ostré. Poznámka: Funkce / může mít lokální extrémy pouze ve stacionárních bodech (tedy bodech s nulovým gradientem), nebo v bodech, v nichž neexistuje aspoň jedna parciální derivace prvního řádu. Příklad: Funkce f{x,y) = \/x2 + y2 má minimum v bodě [0,0], kde neexistují parciální derivace. Lokální extrémy Řekneme, že funkce ř:Rn^Rmáv bodě a e Df: O lokální maximum, když existuje jeho 5-okolí Us{á) c Df takové, že Vx g Us(á) platí f(x) < f (a) O lokální minimum, když existuje jeho 5-okolí Lfc(a) c Df takové, že Vx g Us(á) platí f(x) > f (a) Poznámka: jsou-li nerovnosti splněny na ryzím okolí Uó(a) \ {a} ostře, pak extrémy nazýváme ostré. Poznámka: Funkce / může mít lokální extrémy pouze ve stacionárních bodech (tedy bodech s nulovým gradientem), nebo v bodech, v nichž neexistuje aspoň jedna parciální derivace prvního řádu. Příklad: Funkce f(x,y) = x2 + y2 má minimum ve stacionárním bodě [0,0]. Lokální extrémy Řekneme, že funkce ř:Rn^Rmáv bodě a e Df: O lokální maximum, když existuje jeho 5-okolí Us{á) c Df takové, že Vx g Us(á) platí f(x) < f (a) O lokální minimum, když existuje jeho 5-okolí Lfc(a) c Df takové, že Vx g Us(á) platí f(x) > f (a) Poznámka: jsou-li nerovnosti splněny na ryzím okolí Uó(a) \ {a} ostře, pak extrémy nazýváme ostré. Poznámka: Funkce / může mít lokální extrémy pouze ve stacionárních bodech (tedy bodech s nulovým gradientem), nebo v bodech, v nichž neexistuje aspoň jedna parciální derivace prvního řádu. Příklad: Funkce f(x,y) = x2 - y2 má stacionární bod [0,0], kde není extrém, jedná se o sedlový bod. Při rozhodování o tom, zda ve stacionárním bodě nastává lokální extrém, se řídíme pomocí Hessovy matice. Zřejmě je-li ve svém stacionárním bodě funkce f ryze konvexní, tj. má-li zde pozitivně definitní Hessovu matici, pak zde nabývá svého lokálního minima (analogicky maximum a konkavita). Připomeňme, že pozitivně definitní matici lze rozpoznat podle toho, že má všechny řídící hlavní minory. Podmínky pro existenci extrému shrnuje Lokální extrémy Při rozhodování o tom, zda ve stacionárním bodě nastává lokální extrém, se řídíme pomocí Hessovy matice. Zřejmě je-li ve svém stacionárním bodě funkce f ryze konvexní, tj. má-li zde pozitivně definitní Hessovu matici, pak zde nabývá svého lokálního minima (analogicky maximum a konkavita). Připomeňme, že pozitivně definitní matici lze rozpoznat podle toho, že má všechny řídící hlavní minory. Podmínky pro existenci extrému shrnuje Sylvestrovo kritérium Buď f: Rn M a a e Df její stacionární bod. Označme Dk(a), k = 1,..., n determinant submatice vytvořené z prvních k řádků a sloupců Hessovy matice /-/(a). Pak O Jestliže (a) > 0, D2(a) > 0,..., Dn(á) >0, máfva lok. minimum. O Jestliže (a) < 0, D2(a)>0,..., (-1)"D„(a) > 0, má fy a lok. maximum. O Jestliže jsou všechny minory Dk(a), k = 1,..., n nenulové a přitom neplatí žádná z předchozích možností, pak v bodě a není extrém. Lokální extrémy Při rozhodování o tom, zda ve stacionárním bodě nastává lokální extrém, se řídíme pomocí Hessovy matice. Zřejmě je-li ve svém stacionárním bodě funkce f ryze konvexní, tj. má-li zde pozitivně definitní Hessovu matici, pak zde nabývá svého lokálního minima (analogicky maximum a konkavita). Připomeňme, že pozitivně definitní matici lze rozpoznat podle toho, že má všechny řídící hlavní minory. Podmínky pro existenci extrému shrnuje Sylvestrovo kritérium Buď f: Rn M a a e Df její stacionární bod. Označme Dk(a), k = 1,..., n determinant submatice vytvořené z prvních k řádků a sloupců Hessovy matice /-/(a). Pak O Jestliže (a) > 0, D2(a) > 0,..., Dn(a) >0, máfva lok. minimum. O Jestliže (a) < 0, D2(a)>0,..., (-1)"D„(a) > 0, má fy a lok. maximum. O Jestliže jsou všechny minory Dk(a), k = 1,..., n nenulové a přitom neplatí žádná z předchozích možností, pak v bodě a není extrém. Příklad: Hessova matice funkce f(x,y) = x2 + y2 ve stacionárním bodě [0,0] tedy je pozitivně definitní a v bodě [0,0] je minimum. Lokální extrémy Při rozhodování o tom, zda ve stacionárním bodě nastává lokální extrém, se řídíme pomocí Hessovy matice. Zřejmě je-li ve svém stacionárním bodě funkce f ryze konvexní, tj. má-li zde pozitivně definitní Hessovu matici, pak zde nabývá svého lokálního minima (analogicky maximum a konkavita). Připomeňme, že pozitivně definitní matici lze rozpoznat podle toho, že má všechny řídící hlavní minory. Podmínky pro existenci extrému shrnuje Sylvestrovo kritérium Buď f: Rn M a a e Df její stacionární bod. Označme Dk(a), k = 1,..., n determinant submatice vytvořené z prvních k řádků a sloupců Hessovy matice /-/(a). Pak O Jestliže (a) > 0, D2(a) > 0,..., Dn(á) >0, máfva lok. minimum. O Jestliže (a) < 0, D2(a)>0,..., (-1)"D„(a) > 0, má fy a lok. maximum. O Jestliže jsou všechny minory Dk(a), k = 1,..., n nenulové a přitom neplatí žádná z předchozích možností, pak v bodě a není extrém. Příklad: Hessova matice funkce f(x,y) = x2 - y2 ve stacionárním bodě [0,0] je: H(0,0) = ^ q _° )' JeJ' hlavní minory Jsou D1 (°' °) = 2' D2(0,0) = -4, tedy je indefinitní a v bodě [0,0] není extrém. Lokální extrémy - příklad Analytické řešení úlohy hledání volných extrémů funkce fvl" tedy spočívá v nalezení stacionárních bodů (resp. bodů, kde neexistuje gradient) a vyšetření definitnosti Hessovy matice v těchto bodech. Při hledání stacionárních bodů řešíme soustavu n rovnic o n neznámých. Lokální extrémy - příklad Analytické řešení úlohy hledání volných extrémů funkce fvl" tedy spočívá v nalezení stacionárních bodů (resp. bodů, kde neexistuje gradient) a vyšetření definitnosti Hessovy matice v těchto bodech. Při hledání stacionárních bodů řešíme soustavu n rovnic o n neznámých. Příklad : Nalezněte extrémy funkce f(x, y) = x2y + y2x - xy. Lokální extrémy - příklad Analytické řešení úlohy hledání volných extrémů funkce fvl" tedy spočívá v nalezení stacionárních bodů (resp. bodů, kde neexistuje gradient) a vyšetření definitnosti Hessovy matice v těchto bodech. Při hledání stacionárních bodů řešíme soustavu n rovnic o n neznámých. Příklad : Nalezněte extrémy funkce f(x, y) = x2y + y2x - xy. Řešení: První derivace jsou ťx = 2xy + y2 - yjý = x2 + 2xy - x. Položíme-li obě parciální derivace současně nule, má soustava následující řešení: x = y = 0; x = 0, y = 1; x = 1, y = 0; x = 1 /3, y = 1 /3, což dává čtyři stacionární body dané funkce. Lokální extrémy - příklad Analytické řešení úlohy hledání volných extrémů funkce fvl" tedy spočívá v nalezení stacionárních bodů (resp. bodů, kde neexistuje gradient) a vyšetření definitnosti Hessovy matice v těchto bodech. Při hledání stacionárních bodů řešíme soustavu n rovnic o n neznámých. Příklad : Nalezněte extrémy funkce f(x, y) = x2y + y2x - xy. Řešení: První derivace jsou ťx = 2xy + y2 - yjý = x2 + 2xy - x. Položíme-li obě parciální derivace současně nule, má soustava následující řešení: x = y = 0; x = 0, y = 1; x = 1, y = 0; x = 1 /3, y = 1 /3, což dává čtyři stacionární body dané funkce. Hodnoty Hessovy matice ve stacionárních bodech jsou postupně /-/(0,0) = ^ ^ ^ ^, /-/(0,1) = ^ ^ ^ H(1,0) = ^ ° g ^, H(1 /3,1/3)=^ 2/3 ) ■ Pouze Poslední matice je pozitivně definitní, funkce má jen jedno lokální minimum, a to v bodě [1/3,1/3]. Globální extrémy Řekneme, že funkce f dosahuje na množině X v bodě a e X svého O globálního maxima jestliže Vx g X platí f(x) < f (a) O globálního minima jestliže Vx g X platí f(x) > f (a) Poznámka: Místo pojmu globální též používáme pojem absolutní. Opět definujeme ostré extrémy, jestliže nerovnosti jsou ostré pro Vx ^ a. Globální extrémy Řekneme, že funkce f dosahuje na množině X v bodě a g X svého O globálního maxima jestliže Vx g X platí f(x) < f (a) O globálního minima jestliže Vx g X platí f(x) > f (a) Poznámka: Místo pojmu globální též používáme pojem absolutní. Opět definujeme ostré extrémy, jestliže nerovnosti jsou ostré pro Vx ^ a. Weierstrassova věta: Je-li XcKn ohraničená, uzavřená množina a f: Rn R spojitá funkce na X, pak má / na X globální extrémy, a to buď v bodech lokálních extrémů nebo na hranici množiny X. Globální extrémy Řekneme, že funkce f dosahuje na množině X v bodě a g X svého O globálního maxima jestliže Vx g X platí f(x) < f (a) O globálního minima jestliže Vx g X platí f(x) > f (a) Poznámka: Místo pojmu globální též používáme pojem absolutní. Opět definujeme ostré extrémy, jestliže nerovnosti jsou ostré pro Vx ^ a. Weierstrassova věta: Je-li XcKn ohraničená, uzavřená množina a f: Rn R spojitá funkce na X, pak má f na X globální extrémy, a to buď v bodech lokálních extrémů nebo na hranici množiny X. Poznámka: Není-li množina X uzavřená nebo ohraničená, pak globální extrémy nemusí existovat. Pokud extrémy existují, jsou jejich hodnoty určeny jednoznačně. Funkce však může nabývat těchto hodnot obecně ve více bodech. Hranici množiny lze většinou popsat pomocí rovnic. Vyšetřování hranice je úlohou s omezením. Globální extrémy - příklad Určete globální extrémy funkce f(x, y) = ^2x - x2 - 4y2 Globální extrémy - příklad Určete globální extrémy funkce f(x, y) = ^J2x - x2 - 4y2 Řešení: Definičním oborem funkce je množina bodů vyhovujících nerovnici 2x - x2 - 4y2 > 0. Po doplnění na čtverec dostaneme nerovnici (x-1)2 + 4y2 < 1. Globální extrémy - příklad Určete globální extrémy funkce f(x, y) = ^2x - x2 - 4y2 Řešení: Definičním oborem funkce je množina bodů vyhovujících nerovnici 2x - x2 - 4y2 > 0. Po doplnění na čtverec dostaneme nerovnici (x-1)2 + 4y2 < 1. Jedná se tedy o množinu bodů ohraničenou elipsou o středu [1,0] a poloosách rovných 1 a \. Globální extrémy - příklad Určete globální extrémy funkce f(x, y) = ^2x - x2 - 4y2 Řešení: Definičním oborem funkce je množina bodů vyhovujících nerovnici 2x - x2 - 4y2 > 0. Po doplnění na čtverec dostaneme nerovnici (x-1)2 + 4y2 < 1. Jedná se tedy o množinu bodů ohraničenou elipsou o středu [1,0] a poloosách rovných 1 a \. Pro další postup stanovíme podezřelé body. Nejprve vyšetříme stacionární body jako řešení soustavy f = _2II2x_ = o x 2^2x-x2-4y2 ' f =_=§z_= g y 2^2x-x2-4y2 ' Globální extrémy - příklad Určete globální extrémy funkce f(x, y) = ^J2x - x2 - 4y2 Řešení: Definičním oborem funkce je množina bodů vyhovujících nerovnici 2x - x2 - 4y2 > 0. Po doplnění na čtverec dostaneme nerovnici (x-1)2 + 4y2 < 1. Jedná se tedy o množinu bodů ohraničenou elipsou o středu [1,0] a poloosách rovných 1 a \. Pro další postup stanovíme podezřelé body. Nejprve vyšetříme stacionární body jako řešení soustavy f =__= o x 2^2x-x2-4y2 ' f =_=§z_= g y 2^2x-x2-4y2 ' Nalezli jsme bod P^ =[1,0]. Další skupinou podezřelých bodů je hraniční elipsa, a to proto, že hranice je vždy podezřelá a navíc v jejích bodech neexistují parciální derivace. Globální extrémy - příklad Určete globální extrémy funkce f(x, y) = ^J2x - x2 - 4y2 Řešení: Definičním oborem funkce je množina bodů vyhovujících nerovnici 2x - x2 - 4y2 > 0. Po doplnění na čtverec dostaneme nerovnici (x-1)2 + 4y2 < 1. Jedná se tedy o množinu bodů ohraničenou elipsou o středu [1,0] a poloosách rovných 1 a \. Pro další postup stanovíme podezřelé body. Nejprve vyšetříme stacionární body jako řešení soustavy f = _2II2x_ = o x 2^2x-x2-4y2 ' f =_z?/_= g y 2^2x-x2-4y2 ' Nalezli jsme bod P^ =[1,0]. Další skupinou podezřelých bodů je hraniční elipsa, a to proto, že hranice je vždy podezřelá a navíc v jejích bodech neexistují parciální derivace. Porovnáme funkční hodnoty, /(Pí) = V2 • 1 - 12 - 4 • O2 = 1. Pro libovolný bod Pe na hraniční elipse platí: f(Pe) = 0. Tedy funkce má v bodě Pí globální maximum a ve všech bodech hranice nabývá globálního minima. Globální extrémy - příklad Určete globální extrémy funkce f(x, y) = (x - 1 )2 + (y - |)2 na obdélníku, který je určen body A = [0; 0]; B = [2; 0]; C = [2; 1]; D = [0; 1]. Globální extrémy - příklad Určete globální extrémy funkce f(x, y) = (x - 1 )2 + (y - \)2 na obdélníku, který je určen body A = [0; 0]; B = [2; 0]; C = [2; 1]; D = [0; 1]. Řešení: Nalezneme lokální extrémy funkce f. Spočteme parciální derivace ťx = 2x - 2 a f ý = 2y - 1 a nalezneme stacionární bod s = [1, \}. Matice druhých derivací je rovna H{s) = g 2 )" H'avn' minory této matice jsou kladné a proto v bodě s nastává lokální minimum funkce f. Globální extrémy - příklad Určete globální extrémy funkce f(x, y) = (x - 1 )2 + (y - \)2 na obdélníku, který je určen body A = [0; 0]; B = [2; 0]; C = [2; 1]; D = [0; 1]. Řešení: Nalezneme lokální extrémy funkce f. Spočteme parciální derivace ťx = 2x - 2 a fy = 2y - 1 a nalezneme stacionární bod s = [1, \}. Matice kladné a proto v bodě s nastává lokální minimum funkce f. Hranice zadané množiny je tvořena čtyřmi úsečkami AB, BC, CD a DA. Je tedy třeba řešit čtyři optimalizační úlohy s funkcí f a postupně s podmínkami : y = 0, V2\x = 2, V^: y diVA \ x = 0. Pozor! Při této formulaci je zapotřebí zvlášť vyšetřit body A, 6, C, D, protože nehledáme extrémy na celých hraničních přímkách, ale pouze na příslušných úsečkách. Globální extrémy - příklad Úlohy optimalizace f za podmínky V,, kde / = 1,2,3,4 převedeme na ekvivalentní úlohy nalezení lokálních extrémů funkcí F,-, kde F1(x) = /(x,0) = (x-1)2 + l, F2(y) = r(2,y) = (y-1)2 + 1, F3(x) = r(x,1) = (x-1)2 + ±, F4(y) = r(0,y) = (y-!)2 + 1. □ S Globální extrémy - příklad Úlohy optimalizace f za podmínky Vj, kde / = 1,2,3,4 převedeme na ekvivalentní úlohy nalezení lokálních extrémů funkcí F,, kde F1(x) = /(x,0) = (x-1)2 + l, F2(y) = r(2,y) = (y-1)2 + 1, F3(x) = r(x,1) = (x-1)2 + 1, F4(y) = /(0,y) = (y-i)2 + l. Snadno se zjistí, že jednotlivé úlohy mají minimum v bodech postupně: a = [1,0], b = [2, i], c = [1,1] a d = [0, \}. Hodnoty funkce / ve všech podezřelých bodech shrneme v tabulce: x s A B C D a b c d f(x) 0 5 4 5 4 5 4 5 4 1 4 1 1 4 1 Je zřejmé, že nejmenší hodnoty dosahuje funkce v bodě s = [1, \] a největší v bodech A, 6, C, D. □ [fpi ► •< ► < -ě: -e -O Q, O Optimalizace s omezením - grafické řešení Uvažujme úlohu optimalizace funkce f(x,y) = x3 - 3x + y3 - 3y na množině M vymezené nerovnostmi x > 0, y > 0,2x + 2y < 5. Problém si můžeme znázornit graficky. Modře je vyznačena přípustná množina, vrstevnice jsou odstupňovány od nejnižší červené po nejvyšší žlutou. Zřejmě má funkce f na množině M minimum v bodě [1,1] a maximum v bodech [0;2,5] a [2,5;0]. □ S ► 4 -š ► 4 -š -E -O Q. O Optimalizační úloha s omezením ve formě rovností Uvažujme úlohu na vázaný extrém f(x) min , na množině M vymezené soustavou m rovnic g,(x) = 0, / = 1,... m. Jsou - li funkce f\gh i = 1,..., m spojitě diferencované a jsou - li gradienty omezení Vg, lineárně nezávislé vektory (tj. žádné omezení není nadbytečné), pak pro bod optima x* existují jednoznačné hodnoty , ..., A™, takové, že: Vf(x*) + £,=i A/ • Vft-(x*) = 0. Čísla Aí , ..., A™ se nazývají Lagrangeovy multiplikátory a umožňují převedení optimalizační úlohy na řešení systému rovnic. Optimalizační úloha s omezením ve formě rovností Uvažujme úlohu na vázaný extrém f (x) min , na množině M vymezené soustavou m rovnic g,(x) = 0, / = 1,... m. Jsou - li funkce f\gh i = 1,..., m spojitě diferencované a jsou - li gradienty omezení Vg, lineárně nezávislé vektory (tj. žádné omezení není nadbytečné), pak pro bod optima x* existují jednoznačné hodnoty X^1 ..., A™, takové, že: Vr(x*) + £,=i A/ • Vft-(x*) = 0. Čísla X^1 ..., A™ se nazývají Lagrangeovy multiplikátory a umožňují převedení optimalizační úlohy na řešení systému rovnic. Jaký je formální postup? Vytvoří se tzv. Lagrangeova funkce L(x, A) = /(x) + E"i A/ • 0(x) a sestaví se podmínky pro její stacionární body, tzv. podmínky 1. řádu: Vx/.(x,A) = 0, VA/-(x,A) = 0 Jde o systém n + m rovnic pro n + m neznámých (posledních m rovnic vyjadřuje vlastně vazební podmínky). Jestliže má tento systém řešení (x*, A*) a jsou-li f i M konvexní, pak je bod x* globálním minimem funkce f na množině M. Optimalizační úloha s omezením ve formě rovností Ukažme si metodu Lagrangeových multiplikátorů na následující úloze: Najděte patu kolmice spuštěné z bodu [5,1,2] na rovinu 2x + 3y + z = 6. Optimalizační úloha s omezením ve formě rovností Ukažme si metodu Lagrangeových multiplikátorů na následující úloze: Najděte patu kolmice spuštěné z bodu [5,1,2] na rovinu 2x + 3y + z = 6. Řešení: Hledáme tedy bod [x, y, z] ležící v zadané rovině, pro nějž je vzdálenost od bodu [5,1,2] minimální. Místo minimalizace funkce f(x,y,z) = ^{x - 5)2 + (y - 1 )2 + (z - 2)2 můžeme pro zjednodušení výpočtu minimalizovat její druhou mocninu. Abychom mohli použít Lagrangeův multiplikátor, je třeba rovnici omezení anulovat: 2x + 3y + z - 6 = 0. Optimalizační úloha s omezením ve formě rovností Ukažme si metodu Lagrangeových multiplikátorů na následující úloze: Najděte patu kolmice spuštěné z bodu [5,1,2] na rovinu 2x + 3y + z = 6. Řešení: Hledáme tedy bod [x, y, z] ležící v zadané rovině, pro nějž je vzdálenost od bodu [5,1,2] minimální. Místo minimalizace funkce f(x,y,z) = ^/(x - 5)2 + (y - 1 )2 + (z - 2)2 můžeme pro zjednodušení výpočtu minimalizovat její druhou mocninu. Abychom mohli použít Lagrangeův multiplikátor, je třeba rovnici omezení anulovat: 2x + 3y + z - 6 = 0. Sestavme Lagrangeovu funkci úlohy: y, z, A) = (x - 5)2 + (y - 1 )2 + (z - 2)2 + A(2x + 3y + z - 6) a určeme její parciální derivace: /_x(x,y,z, A) = 2(x - 5) + 2A, /_y(x,y, z, A) = 2(y-1) + 3A, /_z(x,y,z,A) = 2(z-2) + A, /_A(x, y, z, A) = 2x + 3y + z - 6. Optimalizační úloha s omezením ve formě rovností Ukažme si metodu Lagrangeových multiplikátorů na následující úloze: Najděte patu kolmice spuštěné z bodu [5,1,2] na rovinu 2x + 3y + z = 6. Řešení: Hledáme tedy bod [x, y, z] ležící v zadané rovině, pro nějž je vzdálenost od bodu [5,1,2] minimální. Místo minimalizace funkce f(x,y,z) = ^/(x - 5)2 + (y - 1 )2 + (z - 2)2 můžeme pro zjednodušení výpočtu minimalizovat její druhou mocninu. Abychom mohli použít Lagrangeův multiplikátor, je třeba rovnici omezení anulovat: 2x + 3y + z - 6 = 0. Sestavme Lagrangeovu funkci úlohy: /_(x, y, z, A) = (x - 5)2 + (y - 1 )2 + (z - 2)2 + A(2x + 3y + z - 6) a určeme její parciální derivace: /_x(x,y,z, A) = 2(x - 5) + 2A, /_y(x,y, z, A) = 2(y-1) + 3A, /_z(x,y,z,A) = 2(z-2) + A, /_A(x, y, z, A) = 2x + 3y + z - 6. Položíme parciální rovnice rovny nule a dostaneme lineární systém, jehož vyřešením získáme bod optima [ff, jf ]. Protože minimalizovaná funkce i přípustná množina jsou konvexní, nalezli jsme bod miniiri^. = ^(