Literatura Derivace a diferenciál Derivace vyšších řádů Taylorova věta Matematika III – 2. týden Limity funcí více proměnných, směrové derivace, diferenciál, Taylorův rozvoj Masarykova univerzita Fakulta informatiky 28. září – 2. října 2015 Literatura Derivace a diferenciál Derivace vyšších řádů Taylorova věta Obsah přednášky 1 Literatura 2 Derivace a diferenciál Derivace ve směru vektoru Totální diferenciál Tečná nadrovina ke grafu funkce 3 Derivace vyšších řádů Iterované parciální derivace Hessián – aproximace 2. řádu 4 Taylorova věta Literatura Derivace a diferenciál Derivace vyšších řádů Taylorova věta Plán přednášky 1 Literatura 2 Derivace a diferenciál Derivace ve směru vektoru Totální diferenciál Tečná nadrovina ke grafu funkce 3 Derivace vyšších řádů Iterované parciální derivace Hessián – aproximace 2. řádu 4 Taylorova věta Literatura Derivace a diferenciál Derivace vyšších řádů Taylorova věta Kde je dobré číst? Zuzana Došlá, Roman Plch, Petr Sojka, Diferenciální počet funkcí více proměnných s programem Maple, MU Brno, 1999, 273 s. J. Slovák, M. Panák, M. Bulant, Matematika drsně a svižně, Muni Press, Brno 2013, v+773 s., elektronická edice www.math.muni.cz/Matematika_drsne_svizne Literatura Derivace a diferenciál Derivace vyšších řádů Taylorova věta Plán přednášky 1 Literatura 2 Derivace a diferenciál Derivace ve směru vektoru Totální diferenciál Tečná nadrovina ke grafu funkce 3 Derivace vyšších řádů Iterované parciální derivace Hessián – aproximace 2. řádu 4 Taylorova věta Literatura Derivace a diferenciál Derivace vyšších řádů Taylorova věta Definition Funkce f : Rn → R má derivaci ve směru vektoru v ∈ Rn v bodě x ∈ En, jestliže existuje derivace dv f (x) složeného zobrazení t → f (x + tv) v bodě t = 0, tj. dv f (x) = lim t→0 1 t (f (x + tv) − f (x)). Literatura Derivace a diferenciál Derivace vyšších řádů Taylorova věta Definition Funkce f : Rn → R má derivaci ve směru vektoru v ∈ Rn v bodě x ∈ En, jestliže existuje derivace dv f (x) složeného zobrazení t → f (x + tv) v bodě t = 0, tj. dv f (x) = lim t→0 1 t (f (x + tv) − f (x)). Speciální volbou přímek ve směru souřadných os dostáváme tzv. parciální derivace funkce f , které značíme ∂f ∂xi , i = 1, . . . , n, nebo bez odkazu na samotnou fukci jako operace ∂ ∂xi . Literatura Derivace a diferenciál Derivace vyšších řádů Taylorova věta Definition Funkce f : Rn → R má derivaci ve směru vektoru v ∈ Rn v bodě x ∈ En, jestliže existuje derivace dv f (x) složeného zobrazení t → f (x + tv) v bodě t = 0, tj. dv f (x) = lim t→0 1 t (f (x + tv) − f (x)). Speciální volbou přímek ve směru souřadných os dostáváme tzv. parciální derivace funkce f , které značíme ∂f ∂xi , i = 1, . . . , n, nebo bez odkazu na samotnou fukci jako operace ∂ ∂xi . Pro funkce v E2 dostáváme ∂ ∂x f (x, y) = lim t→0 1 t (f (x + t, y) − f (x, y)), ∂ ∂y f (x, y) = lim t→0 1 t (f (x, y + t) − f (x, y)). Literatura Derivace a diferenciál Derivace vyšších řádů Taylorova věta Example Se samotnými parciálními nebo směrovými derivacemi nevystačíme pro dobrou aproximaci chování funkce lineárními výrazy: g(x, y) = 1 když xy = 0 0 jinak , h(x, y) = 1 když y = x2 = 0 0 jinak . Literatura Derivace a diferenciál Derivace vyšších řádů Taylorova věta Example Se samotnými parciálními nebo směrovými derivacemi nevystačíme pro dobrou aproximaci chování funkce lineárními výrazy: g(x, y) = 1 když xy = 0 0 jinak , h(x, y) = 1 když y = x2 = 0 0 jinak . Žádná z nich neprodlužuje všechny hladké křivky procházející bodem (0, 0) na hladké křivky. Pro g existují obě parciální derivace v (0, 0) a jiné směrové derivace neexistují, zatímco pro h existují všechny směrové derivace v bodě (0, 0) a platí dv h(0) = 0 pro všechny směry v, takže jde o lineární závislost na v ∈ R2. Literatura Derivace a diferenciál Derivace vyšších řádů Taylorova věta Následující definice věrně sleduje chování diferenciálu funkcí jedné proměnné: Literatura Derivace a diferenciál Derivace vyšších řádů Taylorova věta Následující definice věrně sleduje chování diferenciálu funkcí jedné proměnné: Definition Funkce f : Rn → R je diferencovatelná v bodě x, jestliže 1 v bodě x existují všechny směrové derivace dv f (x), v ∈ Rn, 2 dv f (x) je lineární v závislosti na přírůstku v 3 0 = limv→0 1 v f (x + v) − f (x) − dv f (x) . Literatura Derivace a diferenciál Derivace vyšších řádů Taylorova věta Následující definice věrně sleduje chování diferenciálu funkcí jedné proměnné: Definition Funkce f : Rn → R je diferencovatelná v bodě x, jestliže 1 v bodě x existují všechny směrové derivace dv f (x), v ∈ Rn, 2 dv f (x) je lineární v závislosti na přírůstku v 3 0 = limv→0 1 v f (x + v) − f (x) − dv f (x) . Lineární výraz dv f (závislý na vektorové proměnné v) nazýváme diferenciál funkce f vyčíslený na přírůstku v. Pozor na pochopení obsahu definice limity funkce na Rn! Je třeba vidět v kontextu metriky na Rn. Pro diferenciál je zde pro každé > 0 k dispozici δ > δ takové, že pro přírůstky v menší než δ bude chyba aproximace poměrného přírůstku hodnot pomocí poměrného přírůstku diferenciálu menší než . V literatuře se často také říká totální diferenciál df funkce f . Literatura Derivace a diferenciál Derivace vyšších řádů Taylorova věta Uvažujme f : E2 → R se spojitými parciálními derivacemi. Diferenciál v pevném bodě (x0, y0) je lineární funkce df : R2 → R df = ∂f ∂x dx + ∂f ∂y dy na přírůstcích se souřadnicemi danými právě parciálními derivacemi. Literatura Derivace a diferenciál Derivace vyšších řádů Taylorova věta Uvažujme f : E2 → R se spojitými parciálními derivacemi. Diferenciál v pevném bodě (x0, y0) je lineární funkce df : R2 → R df = ∂f ∂x dx + ∂f ∂y dy na přírůstcích se souřadnicemi danými právě parciálními derivacemi. Obecněji v případě funkcí více proměnných píšeme obdobně df = ∂f ∂x1 dx1 + ∂f ∂x2 dx2 + · · · + ∂f ∂xn dxn (∗) a platí: Theorem Nechť f : En → R je funkce n proměnných, která má v okolí bodu x ∈ En spojité parciální derivace. Pak existuje její diferenciál df v bodě x a jeho souřadné vyjádření je dáno rovnicí (∗). Literatura Derivace a diferenciál Derivace vyšších řádů Taylorova věta Funkce třídy C1 Definition Říkáme, že funkce f : Rn → R je třídy C1 na množině A, jestliže má ve všech bodech množiny A spojité parciální derivace. Píšeme f ∈ C1(A). Viděli jsme, že funkce v C1(A) mají na A diferenciál, tj. jsou na A diferencovatelné. Literatura Derivace a diferenciál Derivace vyšších řádů Taylorova věta Pro f : E2 → R a pevný bod (x0, y0) ∈ E2 uvažme rovinu v E3: z = f (x0, y0) + ∂f ∂x (x0, y0)(x − x0) + ∂f ∂y (x0, y0)(y − y0). Je to jediná rovina procházející (x0, y0), ve které leží derivace a tedy i tečny všech křivek c(t) = (x(t), y(t), f (x(t), y(t))). Říkáme jí tečná rovina ke grafu funkce f . Literatura Derivace a diferenciál Derivace vyšších řádů Taylorova věta Pro f : E2 → R a pevný bod (x0, y0) ∈ E2 uvažme rovinu v E3: z = f (x0, y0) + ∂f ∂x (x0, y0)(x − x0) + ∂f ∂y (x0, y0)(y − y0). Je to jediná rovina procházející (x0, y0), ve které leží derivace a tedy i tečny všech křivek c(t) = (x(t), y(t), f (x(t), y(t))). Říkáme jí tečná rovina ke grafu funkce f . Na obrázku jsou zobrazeny dvě tečné roviny ke grafu funkce f (x, y) = sin(x) cos(y). Červená čára je obrazem křivky c(t) = (t, t, f (t, t)). 0 1 2 3 x 0 -2 4 1 2 -1 5 3 4 0 y 5 6 6 1 2 0 1 2 3 x 0 -2 4 1 2 -1 5 3 4 0 y 5 6 6 1 2 Literatura Derivace a diferenciál Derivace vyšších řádů Taylorova věta Diferenciál zadává tečné (nad)roviny funkce n proměnných. 0 1 2 3 x 0 -2 4 1 2 -1 5 3 4 0 y 5 6 6 1 2 0 1 2 3 x 0 -2 4 1 2 -1 5 3 4 0 y 5 6 6 1 2 Graf funkce f (x, y) = sin(x) cos(y), červená čára je obrazem křivky c(t) = (t, t, f (t, t)). Diferencovatelná funkce f na En v bodě x ∈ En má nulový diferenciál tehdy a jen tehdy, když její složení s libovolnou křivkou procházející tímto bodem zde má stacionární bod. To ovšem neznamená, že v takovém bodě musí mít f aspoň lokálně buď maximum nebo minimum. Stejně jako u funkcí jedné proměnné můžeme rozhodovat teprve podle derivací vyšších. Literatura Derivace a diferenciál Derivace vyšších řádů Taylorova věta Obecně pro f : En → R je tečnou rovinou afinní nadrovina v En+1. Literatura Derivace a diferenciál Derivace vyšších řádů Taylorova věta Obecně pro f : En → R je tečnou rovinou afinní nadrovina v En+1. Tato nadrovina 1 prochází bodem (x, f (x)) 2 její zaměření je grafem lineárního zobrazení df (x) : Rn → R, tj. diferenciálu v bodě x ∈ En. Literatura Derivace a diferenciál Derivace vyšších řádů Taylorova věta Plán přednášky 1 Literatura 2 Derivace a diferenciál Derivace ve směru vektoru Totální diferenciál Tečná nadrovina ke grafu funkce 3 Derivace vyšších řádů Iterované parciální derivace Hessián – aproximace 2. řádu 4 Taylorova věta Literatura Derivace a diferenciál Derivace vyšších řádů Taylorova věta Pro pevný přírůstek v ∈ Rn je vyčíslení diferenciálů na tomto přírůstku opět (diferenciální) operace na funkcích f : En → R f → dv f = df (v). Výsledkem je df (v) : En → R. Jestliže je tato funkce opět diferencovatelná, můžeme iterovat. Pro parciální derivace druhého řádu píšeme ( ∂ ∂xj ◦ ∂ ∂xi )f = ∂2 ∂xi ∂xj f = ∂2f ∂xi ∂xj v případě opakované volby i = j píšeme také ( ∂ ∂xi ◦ ∂ ∂xi )f = ∂2 ∂x2 i f = ∂2f ∂x2 i . Literatura Derivace a diferenciál Derivace vyšších řádů Taylorova věta Úplně stejně postupujeme při dalších iteracích a hovoříme o parciálních derivacích k-tého řádu ∂kf ∂xi1 . . . ∂xik . Theorem Nechť f : En → R je k-krát diferencovatelná funkce se spojitými parciálními derivacemi až do řádu k včetně v okolí bodu x ∈ Rn. Pak všechny parciální derivace nezávisí na pořadí derivování. Literatura Derivace a diferenciál Derivace vyšších řádů Taylorova věta Definition Je-li f : Rn → R libovolná dvakrát diferencovatelná funkce, nazýváme symetrickou matici funkcí Hf (x) = ∂2f ∂xi ∂xj (x) =    ∂2f ∂x1∂x1 (x) . . . ∂2f ∂x1∂xn (x) ... ... ... ∂2f ∂xn∂x1 (x) . . . ∂2f ∂xn∂xn (x)    Hessián funkce f v bodě x. Literatura Derivace a diferenciál Derivace vyšších řádů Taylorova věta Pro křivku c(t) = (x(t), y(t)) = (x0 + ξt, y0 + ηt) mají funkce α(t) = f (x(t), y(t)) β(t) = f (x0, y0) + t · ∂f ∂x (x0, y0)ξ + ∂f ∂y (x0, y0)η + 1 2 t2 fxx (x0, y0)ξ2 + 2fxy (x0, y0)ξη + fyy (x0, y0)η2 stejné derivace do druhého řádu včetně. Funkci β píšeme vektorově: β(t) = f (x0, y0) + tdf (x0, y0) · ξ η + 1 2 t2 (ξ η) · Hf (x0, y0) · ξ η nebo β(t) = f (x0, y0) + tdf (x0, y0)(v) + 1 2 t2Hf (x0, y0)(v, v), kde v = (ξ, η) = c (t) je přírůstek zadaný derivací křivky c(t) a Hessián symetrická 2–forma. Literatura Derivace a diferenciál Derivace vyšších řádů Taylorova věta Plán přednášky 1 Literatura 2 Derivace a diferenciál Derivace ve směru vektoru Totální diferenciál Tečná nadrovina ke grafu funkce 3 Derivace vyšších řádů Iterované parciální derivace Hessián – aproximace 2. řádu 4 Taylorova věta Literatura Derivace a diferenciál Derivace vyšších řádů Taylorova věta Použití Hessiánu připomíná Taylorovu větu funkcí jedné proměnné! 6 5 4 x 3 2 1 0 0 1 2 3 4 y 5 6-2 -1 0 1 2 6 5 4 x 3 2 1 0 0 1 2 3 4 y 5 6-2 -1 0 1 2 Tečná rovina je vynesena spolu s kvadratickým přiblížením pro funkci f (x, y) = sin(x) cos(y). Obecně pro funkce f : En → R, body x = (x1, . . . , x2) ∈ En a přírůstky v = (ξ1, . . . , ξn) klademe Dk f (x)(v) = 1≤i1,...,ik ≤n ∂kf ∂xi1 . . . ∂xik (x1, . . . , xn) · ξi1 · · · ξik . Literatura Derivace a diferenciál Derivace vyšších řádů Taylorova věta Ukažme ve dvou proměnných: Tečná rovina: f (x0, y0) + D1(x0, y0)(x − x0, y − y0) Aproximace pomocí hesiánu: f (x0, y0) + D1(x0, y0)(x − x0, y − y0) + 1 2D2(x0, y0)f (x − x0, y − y0) výraz třetího řádu D3 f (x, y)(ξ, η) = ∂3f ∂x3 ξ3 + 3 ∂3f ∂x2∂y ξ2 η + 3 ∂3f ∂x∂y2 ξη2 + ∂3f ∂y3 η3 a obecně Dk f (x, y)(ξ, η) = k =0 k ∂kf ∂xk− ∂y ξk− η . Literatura Derivace a diferenciál Derivace vyšších řádů Taylorova věta Theorem (Taylorův rozvoj se zbytkem) Nechť f : En → R je k–krát diferencovatelná funkce v okolí Oδ(x) bodu x ∈ En. Pro každý přírůstek v ∈ Rn s velikostí v < δ pak existuje číslo 0 ≤ θ ≤ 1 takové, že f (x + v) = f (x) + D1 f (x)(v) + · · · + 1 (k − 1)! Dk−1 f (x)(v) + 1 k! Dk f (x + θ · v)(v). Náznak důkazu: Pro přírůstek v ∈ Rn volíme c(t) = x + tv v En a zkoumáme ϕ : R → R definovanou složením ϕ(t) = f ◦ c(t). Taylorova věta pro funkce jedné proměnné říká: ϕ(t) = ϕ(0)+ϕ (0)t +· · ·+ 1 (k − 1)! ϕ(k−1) (0)tk−1 + 1 k! ϕ(k) (θ)tk . Zbývá nám tedy jen ověřit, že postupným derivováním složené funkce ϕ dostaneme právě požadovaný vztah. To lze provést indukcí přes řád k.