PŘEDNÁŠKA 9 Funkce dvou proměnných: parciální derivace, diferenciál 9.1. Parciální derivace prvního řádu Mějme funkci f dvou proměnných. Zapišme výraz f(x, y) a „zmrazme“ v něm y (to jest budeme v tomto okamžiku považovat y za konstantní hodnotu). Zderivujme tento vyraz podle x. Výsledkem bude tzv. parciální derivace funkce f vzhledem k proměnné x. Značí se obvykle f′ x(x, y) nebo jinak ∂ ∂x f(x, y). Podobně se definuje f′ y(x, y) = ∂ ∂y f(x, y). Poznámka 9.1. Máme-li předpis z = f(x, y), píšeme z′ x = ∂ ∂x f(x, y), z′ y = ∂ ∂y f(x, y) a rozumíme každý ze symbolů z′ x, z′ y jako celek. Písmeno „d“ se zde tradičně zapisuje v podobě „∂“, aby se zdůraznila odlišnost od derivace dz dx funkce jedné proměnné. Pro výpočet parciálních derivací vesměs využíváme postupů, již známých pro derivaci funkce jedné proměnné. Příklad 9.2. Nalezněme parciální derivace 1. řádu funkce f(x, y) = 3 x3 y2 − sin (x + 4 y) . Řešení. Derivujeme podle x s konstantním y: ∂ ∂x f(x, y) = 9x2 y2 − cos(x + 4y). Derivujeme podle y; pak je x konstantní: ∂ ∂y f(x, y) = 6 x3 y − 4 cos (x + 4 y) . Příklad 9.3. Vypočtěme parciální derivace 1. řádu funkce f(x, y) = arctg(x2 + y2 ). Řešení. Podle vzorce pro derivaci složené funkce dostaneme ∂f ∂x (x, y) = 1 1 + (x2 + y2)2 · ∂f ∂x (x2 + y2 ) = 2x 1 + (x2 + y2)2 , ∂f ∂y (x, y) = 1 1 + (x2 + y2)2 · ∂f ∂x (x2 + y2 ) = 2y 1 + (x2 + y2)2 . Všimneme-li si symetrického charakteru předpisu funkce (f(x, y) = f(y, x) pro všechna x, y), můžeme ∂f ∂y (x, y) obdržet záměnou x a y v již vypočítané derivaci ∂f ∂x (x, y). □ Příklad 9.4. Pro x > 0 vypočtěme parciální derivace 1. řádu funkce f(x, y) = xy . 1 (a) (b) Obrázek 9.1 Řešení. Dle proměnné x je to funkce mocninná, a tudíž bude ∂ ∂x (xy ) = yxy−1 . Podle y pak derivujeme funkci exponenciální o základu x, ∂ ∂y (xy ) = xy ln x. 9.2. Geometrický význam parciálních derivací Parciální derivace funkce podle jednotlivých proměnných udávají směrnice křivek, vznikajících v řezu grafu funkce rovinami rovnoběžnými s příslušnými osami. Toto znamená, že v jakémkoliv bodě (x0, y0), kde má funkce f parciální derivace, hodnota ∂f ∂x (x0, y0) (resp. ∂f ∂y (x0, y0)) udává směrnici tečny ke grafu křivky z = f(x, y0) (resp. z = f(x0, y)). Parciální derivace ∂f ∂x (x0, y0) udává rychlost změny funkce f v bodě (x0, y0) v kladném směru osy x. Analogicky pro ∂f ∂y (x0, y0). Geometrické znázornění je na obrázku 9.1. 9.3. Diferencovatelnost a totální diferenciál Nechť má funkce f : R2 → R v okolí nějakého bodu (x, y) spojité parciální derivace 1. řádu. Analogicky případu funkce jedné proměnné, jejíž diferenciál df udává přírůstek hodnoty funkce, způsobeny nekonečné malou změnou argumentu, je přirozené zavést diferenciál funkce dvou proměnných. Intuitivní „definice“ 9.5. Totálním diferenciálem funkce f je výraz df = ∂f ∂x dx + ∂f ∂x dy, (1) jenž vyjadřuje přírůstek hodnoty f, odpovídající nekonečné malým přírůstkům argumentů dx a dy. 2 Chceme-li popsat tento pojem přesněji, lze říci, že diferenciál df(x, y) v bodě (x, y) je tzv. „bilineární forma“ dvou proměnných h a k: df(x, y)[h, k] = ∂f ∂x (x, y) · h + ∂f ∂y (x, y) · k, (2) to jest výraz, obsahující proměnné h a k a lineární podle každé z nich. Toto však ještě neurčuje jasně to, kdy a jakým způsobem df popisuje změnu f. Pro precizní zavedení pojmu diferenciálu musíme hovořit o diferencovatelnosti funkce dvou proměnných. Definice 9.6. Říkáme, že je funkce f v bodě (x0, y0) diferencovatelná, jestliže existují konstanty A a B takové, že platí lim (h,k)→(0,0) f(x0 + h, y0 + k) − f(x0, y0) − Ah − Bk √ h2 + k2 = 0. (3) Lineární funkce (h, k) → Ah + Bk se nazývá diferenciálem1 funkce f v bodě (x0, y0) a značí se df(x0, y0): df(x0, y0)(h, k) = Ah + Bk. Hovoříme-li o diferencovatelnosti funkce f v bodě (x0, y0), jedná se, v podstatě, o existenci diferenciálu df(x0, y0), což znamená, že její přírůstek v okolí bodu (x0, y0) lze vyjádřit ve tvaru f(x0 + h, y0 + k) − f(x0, y0) = Ah + Bk + α(h, k), (4) kde α(h, k) je výraz vyššího řádu malosti, než je velikost vektoru (h, k): lim (h,k)→(0,0) α(h, k) √ h2 + k2 = 0. Ukáže se, že pro diferencovatelnou funkci výraz Ah + Bk je právě (2), to jest (2) je diferenciálem f ve smyslu definice 9.6. Věta 9.7. Je-li f diferencovatelná v bodě (x0, y0), pak má v tomto bodě parciální derivace a v (3) je A = f′ x(x0, y0), B = f′ y(x0, y0). Poznámka 9.8. Tvrzení, opačné větě 9.7, neplatí: z existence v daném bodě parciálních derivací neplyne diferencovatelnost funkce v tomto bodě. Věta 9.9. Jsou-li parciální derivace funkce f definovány v okolí bodu (x0, y0) a spojité, pak má funkce f v tomto bodě diferenciál. Diferencovatelnost funkce vyjadřuje hladkost jejího grafu v okolí daného bodu (viz dále § 9.8). Mimo jiné, diferencovatelná funkce je vždy spojitá. Věta 9.10. Je-li f diferencovatelná v bodě (x0, y0), pak je v tomto bodě spojitá. 9.4. Využití diferenciálu pro odhad přírůstku funkce Zanedbáme-li v (4) malý člen α(h, k), dostaneme vzorec f(x0 + h, y0 + k) − f(x0, y0) ≈ ∂f ∂x (x0, y0) · h + ∂f ∂y (x0, y0) · k, (5) jehož lze využit pro přibližný výpočet přírůstku funkce. Příklad 9.11. Pomocí diferenciálu odhadněme absolutní a relativní chybu výpočtu objemu rotačního válce s poloměrem podstavy r = 5 a výškou H = 10, jsou-li rozměry r a H známy s chybami ∆r < 0.02, ∆H < 0.01. 1Říká se přesněji „totální“ anebo „Fréchetův“ diferenciál 3 Řešení. Objem rotačního válce s poloměrem podstavy r a výškou H je V = πr2 H. (6) Jsou-li r a H známy s malými chybami ∆r, ∆H, dle vzorce (5) bude výsledná chyba výpočtu objemu ∆V = V (r + ∆r, H + ∆H) − V (r, H) přibližně rovna ∆V ≈ V ′ r ∆r + V ′ H∆H = 2πrH∆r + πr2 ∆H = πr(2H∆r + r∆H), což v uvažovaném případě dává ∆V ≈ 5π (20∆r + 5∆H) < 5π 20 · 2 100 + 5 · 1 100 = 225π 100 = 9π 4 ≈ 7.07. Jelikož dle (6) pro dané rozměry válce je V = 250π, relativní chyba bude přibližně ∆V V = 9π 4·250π = 0.009. □ Příklad 9.12. Pomocí diferenciálu vypočtěme přibližně hodnotu f(2.9, 3.8) pro funkci f(x, y) = x + y + x2 + y2. Řešení. Položme x0 = 3, y0 = 4. Vypočtěme parciální derivace ∂f ∂x = 1 − 1 2 √ x2 + y2 2x = 1 − x √ x2 + y2 , ∂f ∂y = 1 − y √ x2 + y2 a využijme vzorce f(x, y) − f(x0, y0) ≈ df(x0, y0)[x − x0, y − y0] s x0 = 3, y0 = 4, x = 2.9, y = 3.8: f(x, y) − f(x0, y0) ≈ df(x0, y0)[x − x0, y − y0] = ∂f ∂x (x0, y0) · (x − x0) + ∂f ∂y (x0, y0) · (y − y0) = ∂f ∂x (3, 4) · (−0.1) + ∂f ∂y (3, 4) · (−0.2). Po vykonání výpočtů dostaneme f(3, 4) = 3 + 4 − √ 32 + 42 = 2, ∂f ∂x (3, 4) = 1 − 3 √ 32 + 42 = 1 − 3 5 = 0.4, ∂f ∂y (3, 4) = 1 − 4 √ 32 + 42 = 1 − 4 5 = 0.2. Pak bude f(2.9, 3.8) − f(3, 4) ≈ ∂f ∂x (3, 4) · (−0.1) + ∂f ∂y (3, 4) · (−0.2) = 0.4 · (−0.1) + 0.2(−0.2) = −0.08, a vyjde f(2.9, 3.8) ≈ f(3, 4) − 0.08 = 1.92. Kontrola výsledku pomocí počítače dává: f(2.9, 3.8) ≈ 1.9198 . . . . □ 9.5. Parciální derivace složených výrazů Platí jistá zobecnění vzorce pro derivaci složené funkce. Mějme funkci s předpisem u = f(x, y, z) a uvažujme x, y, z jako funkce jiné proměnné t. Obdržíme tak funkci u = u(t). Pak, existují-li příslušné derivace a jsou-li spojité, bude du dt = ∂f ∂x dx dt + ∂f ∂y dy dt + ∂f ∂z dz dt . 4 9.6. Parciální derivace vyšších řádů Parciální derivace vyšších řádů vznikají postupným výpočtem jednotlivých parciálních derivací již nalezených parciálních derivací. Parciální derivace druhého řádu jsou ∂2 f ∂x2 = ∂ ∂x ∂f ∂x , ∂2 f ∂x∂y = ∂ ∂y ∂f ∂x , ∂2 f ∂y∂x = ∂ ∂x ∂f ∂y , ∂2 f ∂y2 = ∂ ∂y ∂f ∂y . Značíme je také f′′ xx, f′′ xy atd. Věta 9.13 (Schwarzova věta). Existují-li v bodě (x0, y0) smíšené parciální derivace ∂2f ∂x∂y (x0, y0) a ∂2f ∂y∂x (x0, y0) a jsou-li v bodě (x0, y0) spojité, pak platí ∂2 f ∂x∂y (x0, y0) = ∂2 f ∂y∂x (x0, y0). 9.7. Gradient Nechť f : R2 → R. Definice 9.14. Gradientem funkce f se nazývá vektor grad f =   ∂f ∂x ∂f ∂y   . Jinak se značí grad f = ∇f. Věta 9.15. V každém bodě (x0, y0) ukazuje vektor grad f(x0, y0) směr největšího růstu funkce f a je kolmý vrstevnici. Zakreslíme-li v každém bodě (x, y) úsečku přímky ve směru gradientu grad f(x, y), obdržíme tzv. pole gradientů funkce f. Obrázek 9.2. Vrstevnice pro f(x, y) = x2 + 4y2 − xy2 a pole gradientů. Směr gradientu je vždy kolmý vrstevnici. 9.8. Tečná rovina a normála Existence diferenciálu funkce jedné proměnné znamená existenci tečné přímky a vyjadřuje hladkost grafu funkce v okolí daného bodu. Toto lze přirozeným způsobem zobecnit pro případ funkce dvou proměnných, budeme-li mluvit o tečné rovině. 5 9.8.1. Tečna ke grafu funkce jedné proměnné Připomeňme si definici diferencovatelnosti funkce jedné proměnné: funkce f je diferencovatelná v bodě x0, jestliže existuje konstanta A taková, že platí lim h→0 f(x0 + h) − f(x0) − Ah h = 0, (7) přičemž se dokáže, že v (7) bude A = f′ (x0). Platí tedy, že je f(x0 + h) − f(x0) − f′ (x0)h = α(h), kde α(h) je veličinou řádu malosti vyššího, než h: limh→0 α(h) h = 0. Tento vzorec lze zapsat ve tvaru f(x0 + h) = f(x0) + f′ (x0)h + α(h). Výraz f(x0) + f′ (x0)h je hodnotou v bodě x = x0 + h funkce x → f(x0) + f′ (x0)(x − x0), jejíž grafem je tečna v bodě (x0, f(x0)). Diferencovatelnost funkce v x0 tedy znamená, má funkce v bodě (x0, f(x0)) tečnu a lze ji v okolí tohoto bodu aproximovat příslušnou lineární funkcí. Tyto úvahy umožňují formulovat jinou definici tečny ke grafu funkce, jíž jsme původně chápali jako limitní polohu sečny. Definice 9.16. Přímka o rovnici y = ax+c, procházející bodem (x0, f(x0)), je tečnou přímkou ke grafu funkce f v bodě (x0, f(x0)), jestliže platí lim x→x0 f(x) − ax − c x − x0 = 0. (8) Podle hořejšího vyjde2 v (8) a = f′ (x0), c = f(x0) − f′ (x0)x0, což odpovídá rovnici tečny y = f(x0) + f′ (x0)(x − x0). 9.8.2. Definice tečné roviny Přirozeným zobecněním definice 9.16 zavádíme pojem tečné roviny. Definice 9.17. Říkáme, že rovina o rovnici z = ax + by + c, procházející bodem (x0, y0, f(x0, y0)), je tečnou rovinou ke grafu funkce f v bodě (x0, y0, f(x0, y0)), jestliže platí lim (x,y)→(x0,y0) f(x, y) − ax − by − c (x − x0)2 + (y − y0)2 = 0. (9) Věta 9.18. Tečná rovina ke grafu funkce f v bodě (x0, y0, f(x0, y0)) existuje tehdy a právě tehdy, když je f v (x0, y0) diferencovatelná. Rovnicí této tečné roviny je z − z0 = f′ x(x0, y0)(x − x0) + f′ y(x0, y0)(y − y0), (10) kde z0 = f(x0, y0). 2Vskutku, přímka y = ax + c prochází bodem (x0, f(x0)), a proto f(x0) = ax0 + c. Musí tedy být c = f(x0) − ax0, což znamená, že má (8) tvar lim x→x0 f(x) − f(x0) − a(x − x0) x − x0 = 0, a dostaneme a = f′ (x0). 6 (a) (b) Obrázek 9.3 Důkaz. Z předpokladu, že rovina y = ax + by + c prochází bodem (x0, y0, f(x0, y0)), obdržíme f(x0, y0) = ax0 + by0 + c. Proto v (9) je c = f(x0, y0) − ax0 − by0 : lim (x,y)→(x0,y0) f(x, y) − f(x0, y0) − a(x − x0) − b(y − y0) (x − x0)2 + (y − y0)2 = 0. Táto vlastnost však znamená diferencovatelnost f v bodě (x0, y0), a proto a = f′ x(x0, y0), b = f′ y(x0, y0). Dostáváme tak rovnici (10). □ Tečná rovina ke grafu z = f(x, y) v bodě (x0, y0, f(x0, y0)) je určena tečnými přímkami o směrnicích f′ x(x0, y0), f′ y(x0, y0) křivek, vznikajících v řezu plochy rovinami x = x0 a y = y0 (obrázek 9.3) 9.8.3. Normála Rovnici (10) lze upravit na tvar f′ x(x0, y0)(x − x0) + f′ y(x0, y0)(y − y0) + (−1)(z − z0) = 0, což znamená, že vektor ⃗n = f′ x(x0, y0), f′ y(x0, y0), −1 (11) je kolmý s vektorem (x − x0, y − y0, z − z0) pro každý bod (x, y, z) tečné roviny v bodě (x0, y0, z0) (připomeňme si, že z0 = f(x0, y0)). Vektor ⃗n je tudíž kolmý s tečnou rovinou v bodě (x0, y0, f(x0, y0)). Definice 9.19. Vektor (11) se nazývá normálním vektorem plochy z = f(x, y) v bodě (x0, y0, f(x0, y0)). Přímka, protínající plochu z = f(x, y) v bodě (x0, y0, f(x0, y0)) ve směru tohoto vektoru, se nazývá normálou. Parametrické rovnice normály jsou x = x0 + tf′ x(x0, y0), y = y0 + tf′ y(x0, y0), z = z0 − t. 9.9. Věta o střední hodnotě Pro funkce dvou proměnných platí obdoba Lagrangeovy věty o střední hodnotě. Věta 9.20. Buď f funkce dvou proměnných, definovaná na nějakém obdélníku M = [a1, a2]×[b1, b2] a mající parciální derivace v každém bodě z M. Pak pro libovolná (x0, y0) 7 a (x, y) v M platí f(x, y) − f(x0, y0) = ∂f ∂x (ξ, y0)(x − x0) + ∂f ∂y (x0, η)(y − x0), kde ξ, η jsou jisté body takové, že ξ leží mezi x0 a x a η leží mezi y0 a y. Důkaz. Stačí přírůstek f(x, y) − f(x0, y0) upravit do podoby f(x, y) − f(x0, y0) = f(x, y0) − f(x0, y0) + f(x, y) − f(x, y0) a dvakrát využit Lagrangeovy věty pro funkce jedné proměnné. □ 9.10. Směrová derivace Mějme nenulový vektor ⃗u ∈ R2 a f : R2 → R. Zaveďme ⃗r = x y ; pak máme ⃗r → f(⃗r). Parciální derivace funkce f podle x udává rychlost změny její hodnoty podle proměnné x, neboli, jinak řečeno, ve směru jednotkového vektoru⃗i vodorovné souřadné osy. Podobné lze říci ohledné f′ y. Směrová derivace udává rychlost změny hodnoty funkce ve směru nějakého jednotkového vektoru ⃗u v obecné poloze. Definice 9.21. Derivace funkce f ve směru ⃗u je ∂f ∂⃗u (⃗r) = lim t→0 f(⃗r + t⃗u) − f(⃗r) t . Jinak by se dalo zapsat ∂f ∂⃗u (⃗r) jako ϕ′ (0), kde ϕ(t) = f(⃗r + t⃗u). Věta 9.22. Má-li funkce f v bodě (x, y) derivaci, pro libovolný vektor ⃗u o velikosti 1 platí ∂f ∂⃗u (x, y) = (grad f(x, y), ⃗u). (12) Zde je (grad f, ⃗u) = ∂f ∂x u1 + ∂f ∂y u2 (skalární součin). Vzorec (12) lze zapsat ve tvaru ∂f ∂⃗u = ∂f ∂x cos α + ∂f ∂y sin α, vyjádříme-li souřadnice jednotkového vektoru ⃗u přes úhel α, jenž tento vektor svírá s kladným směrem vodorovné osy. Potřebujeme-li počítat derivaci ve směru ⃗u, kde je velikost |⃗u| vektoru ⃗u odlišná od 1, použijeme normalizovaný vektor 1 |⃗u| ⃗u. Příklad 9.23. Pro funkci f(x, y) = arctg(x2 + y2 ) vypočtěme ∂f ∂⃗u , kde je ⃗u = 1 2 . Řešení. Dle příkladu 9.3 je ∂f ∂x (x, y) = 2x 1+(x2+y2)2 , ∂f ∂y (x, y) = 2y 1+(x2+y2)2 a tudíž grad f = 2 1 + (x2 + y2)2 x y . Velikost vektoru ⃗u je |⃗u| = √ 5, normalizovaný směrový vektor bude 1√ 5 ⃗u. Pak dle věty 9.22 ∂f ∂⃗u = 2 √ 5(1 + (x2 + y2)2) (x · 1 + y · 2) = 2 √ 5 x + 2y 1 + (x2 + y2)2 . 8