[Další] [Předchozí] [Předchozí – na konec] [Na konec] [Výše]
V úvodu Kapitoly 6 jsme zdůraznili, že vyšetřování extrémů funkcí je jednou z nejdůležitějších částí diferenciálního počtu. V předchozích dvou kapitolách jsme si připravili aparát k tomu, abychom mohli vyšetřovat tzv. vázané extrémy. Je to vlastně v jistém smyslu speciální případ lokálních extrémů, avšak metody uvedené v Kapitole 6 zde nejsou vhodné. V prvním odstavci vysvětlíme tzv. metodu Lagrangeových multiplikátorů, kde extrémy původní funkce vyšetřujeme pomocí přiřazené, tzv. Lagrangeovy funkce. Ve druhém odstavci studujeme vázané extrémy pomocí nerovností mezi průměry čísel.
Začněme následující úlohou.
Určete absolutní minimum a maximum funkce u = f(x,y,z) na množině M : x2 + y2 + z2 ≤ 1, x,y,z ≥ 0 (konkrétní tvar funkce f není v tuto chvíli podstatný).
Vyšetřujeme-li při řešení úlohy funkci f na části hranice tvořené kulovou plochou, vyjádříme z = a funkci f(x,y,) vyšetřujeme na množině M : x2 + y2 ≤ 1, x,y ≥ 0, tj. najdeme stacionární body uvnitř M a vyšetříme funkci na hranici množiny M. Provést toto na části hranice tvořené čtvrtkružnicí znamená vyjádřit y = a dosadit do f, tj. vyšetřovat funkci f(x,,0) pro x [0,1].
Tímto postupem převedeme původní problém vyšetření funkce na hranici na studium extrémů funkce jedné proměnné. Je zřejmé, že tato metoda je nepraktická zejména při větším počtu proměnných. V tomto odstavci si popíšeme tzv. metodu Lagrangeových multiplikátorů, která řešení úlohy podstatně usnadní.
V této kapitole se zabýváme případem, kdy množina M je zadána systémem rovností
g1(x1,…,xn) | = 0 | ||
g2(x1,…,xn) | = 0 | ||
⋮ | (9.1) | ||
gm(x1,…,xn) | = 0, |
Nejprve zformulujme nutnou podmínku pro existenci vázaného extrému.
Věta 9.1. Nechť funkce n proměnných f,g1,…,gm, 1 ≤ m < n, mají spojité parciální derivace 1. řádu v otevřené množině U n a nechť v každém bodě množiny U má matice
|
(9.2) |
hodnost m. Buď M množina všech bodů [x1,…,xn], které vyhovují rovnicím (9.1 ). Má-li funkce f v bodě a = [a1,…,an] M lokální extrém vzhledem k M, existují reálná čísla 1,…,m tak, že jsou splněny rovnosti
|
(9.3) |
Poznámka 9.1. i) Dříve než přistoupíme k důkazu tvrzení, objasněme si význam rovnosti (9.3 ). Zprvu uvažujme nejjednodušší případ n = 2,m = 1. Pak M je křivka v 2 zadaná rovnicí g(x,y) = 0 (píšeme x,y, [x∗,y∗] a g místo x1,x2, a a g1). Rovnost (9.3) můžeme psát ve tvaru rovnosti dvou dvojrozměrných vektorů
ii) V obecném případě nechť f,gk jsou vektory parciálních derivací funkcí f,gk, k = 1,…,m a nechť M je množina určená systémem (9.1 ). Pak v souladu s terminologií z kapitoly o implicitních funkcích vztah (9.3) říká, že f(a) M(a), kde M(a) je normálový prostor k M v bodě a.
iii) Funkce
Důkaz Věty 9.1. Předpokládejme nejprve, že funkce gk jsou afinní, tj.
Vzhledem k tomu, že funkce gk jsou afinní a h Lin{g1(a),…,gm(a)} = Lin{u1,…,um}, je
Nyní vyšetřeme obecný případ, kdy funkce gk nejsou afinní. Pak bod y sestrojený v předchozí části důkazu již nemusí být prvkem množiny M, proto místo tohoto bodu musíme uvažovat jiný bod. Geometricky je jeho nalezení naznačeno na obrázku 9.1 . Označme v1,…,vn−m bázi prostoru Lin{g1(a),…,gm(a)} a uvažujme systém rovnic
|
(9.4) |
kde r n. Pak jsou vzhledem k nezávislosti vektorů gk(a) a výběru vektorů vk splněny předpoklady Věty 8.3 a systém rovnic (9.4) určuje implicitně v okolí bodu [,r] = [0,0] n funkci r = r() : n. Podle Věty 8.3 pro její derivaci podle dostáváme r()=0 = 0, což podle l’Hospitalova pravidla znamená, že
|
(9.5) |
Nyní položme y = a + h + r(). Podobně jako v první části důkazu platí
f(y) | = f(a) + f(a),h + r() + (h) = | ||
= f(a) + |
Věta 9.1 říká, že v případě diferencovatelných funkcí f a gk lokální extrém vzhledem k množině M může nastat pouze ve stacionárním bodě. O tom, zda ve stacionárním bodě nastává, nebo nenastává lokální extrém, rozhodneme pomocí vlastností matice druhých derivací Lagrangeovy funkce L(x,).
Věta 9.2. Nechť funkce f a gk, k = 1,…,m mají spojité parciální derivace druhého řádu v bodě a, který je stacionárním bodem f na M, a 1,…,m jsou příslušné Lagrangeovy multiplikátory, tj. L(a,) = 0. Dále nechť matice (9.2 ) má pro x = a hodnost m. Jestliže pro každé 0≠h Lin{g1(a),…,gm(a)} platí
|
(9.6) |
má funkce f v bodě a ostré lokální minimum (maximum) vzhledem k M. Jestliže existují h, Lin{g1(a),…,gm(a)} taková, že
|
(9.7) |
v bodě a lokální extrém vzhledem k M nenastává.
Důkaz. Především si všimněme, že pro x M je f(x) = L(x), tj. x∗ M je lokálním extrémem f vzhledem k M, právě když je lokálním extrémem Lagrangeovy funkce L. Podobně jako v důkazu Věty 9.1 můžeme body y M vyjádřit ve tvaru y = a + h + r(), kde h Lin{g1(a),…,gm(a)} a r : n splňuje (9.5 ). Pomocí Taylorova vzorce dostáváme
f(y) = | L(y) = L(a) + L(a),h + r() + L(ã)(h + r(), | ||
(h + r() = | f(a) + , | (9.8) |
Předpokládejme, že platí (9.6), pak vzhledem ke spojitosti druhých derivací funkce L stejné nerovnosti platí i pro ã místo a, je-li dostatečně malé. Limitním přechodem pro 0 v (9.8) dostáváme pro dostatečně malé
Nyní předpokládejme, že existují h, Lin{g1(a),…,gm(a)} taková, že platí (9.7). Položme y1 = a + h + r(), y2 = a + + r(). Stejným způsobem jako v předchozí části důkazu lze ukázat, že pro dostatečně malá platí f(y1) > f(a) a f(y2) < f(a), tj. v bodě a lokální extrém f vzhledem k M nenastává. □
Nyní si tvrzení posledních dvou vět shrňme do praktického návodu hledání vázaných extrémů funkcí se spojitými druhými derivacemi.
1. Vytvoříme Lagrangeovu funkci L(x,) = f(x) −∑ k=1mkgk(x).
2. Určíme stacionární body f vzhledem k M, tj. určíme x1,…,xn a 1,…,m jako řešení systému n + m rovnic
3. Ze systému m lineárních rovnic
(a)h1 + ⋯ + (a)hn = 0 | , | ||
⋮ | |||
(a)h1 + ⋯ + (a)hn = 0 |
4. Určíme druhý diferenciál Lagrangeovy funkce vzhledem k proměnným x ve stacionárním bodě a
5. Vyšetříme definitnost vzniklé kvadratické formy n−m proměnných (je to vlastně restrikce kvadratické formy d2L(a,) na tečný prostor M(a)). Je-li tato forma pozitivně (negativně) definitní, nastává v bodě a ostré lokální minimum (maximum), a je-li indefinitní, v bodě a vázaný extrém nenastává.
Příklad 9.1. i) Najděte lokální extrémy funkce u = + + , a > b > c, na množině M : x2 + y2 + z2 = 1.
Řešení. Nejprve sestavíme Lagrangeovu funkci úlohy a určíme stacionární body.
Lx = | − 2x = 0 ⇒ x = 0, | ||
Ly = | − 2y = 0 ⇒ y = 0, | ||
Lz = | − 2z = 0 ⇒ z = 0, | ||
x2 + y2 + z2 = 1. |
P1,2 : | d2L = 2( −)(dy)2 + 2( −)(dz)2, | ||
P3,4 : | d2L = 2( −)(dx)2 + 2( −)(dz)2, | ||
P5,6 : | d2L = 2( −)(dx)2 + 2( −)(dz)2. |
ii) Odvoďte vzorec pro vzdálenost bodu x∗ = [x1∗,…,xn∗] od roviny a1x1 + ⋯ + anxn = b v prostoru n.
Řešení. Označme a = [a1,…,an], x = [x1,…,xn]. Pak můžeme úlohu zapsat ve vektorovém tvaru
iii) Určete obsah elipsy, která vznikne při řezu elipsoidu + + = 1 rovinou Ax + By + Cz = 0 (obsah elipsy je P = ppq, kde p,q jsou délky poloos elipsy).
Řešení. K určení obsahu elipsy potřebujeme určit délky jejích poloos. To jsou vzdálenosti bodů ležících zároveň na elipsoidu i v řezné rovině, které mají nejmenší, resp. největší vzdálenost od počátku. Vzdálenost bodu [x,y,z] od počátku je dána vztahem . Místo této funkce budeme hledat extrémy funkce u = x2 + y2 + z2, která se snáze derivuje, a vypočtený výsledek odmocníme. Řešíme tedy úlohu
Tuto rovnici můžeme přepsat do tvaru kvadratické rovnice 2 + K1 + K2, kde
V tomto odstavci si ukážeme, jak lze v některých speciálních (ale poměrně často se vyskytujících) případech hledat vázané extrémy, aniž by bylo nutné použít aparát Lagrangeových multiplikátorů. I když je tento postup poněkud vzdálený od metod diferenciálního počtu, uvádíme jej zde pro jeho výbornou praktickou použitelnost. Čtenáři doporučujeme všechny úlohy tohoto odstavce vyřešit pro srovnání také metodou Lagrangeových multiplikátorů.
Nejprve připomeňme pojem kvadratického, aritmetického, geometrického a harmonického průměru n-tice čísel. Nechť x1 ,…,xn jsou kladná reálná čísla, označme
n(x1,x2,…,xn) = | , | ||
n(x1,x2,…,xn) = | , | ||
n(x1,x2,…,xn) = | , | ||
n(x1,x2,…,xn) = | . |
Věta 9.3. Nechť x = [x1,…,xn] je n-tice kladných čísel. Platí nerovnosti
Důkaz. Viz skriptum [H-K-S]. □
Kromě nerovností mezi průměry je účinným nástrojem i tzv. Cauchyova nerovnost.
Věta 9.4. Pro libovolné dvě n-tice reálných čísel x = (x1,…,xn),y = (y1,…,yn) platí
Důkaz. Viz [H-K-S]. □
Příklad 9.2. i) Mezi všemi trojúhelníky s konstantním obvodem o určete ten, který má největší obsah.
Řešení. Vyjdeme z Heronova vzorce pro obsah trojúhelníka
ii) Mezi všemi trojicemi kladných čísel x,y,z s konstantním součtem a najděte ta, pro která je součet převrácených hodnot minimální.
Řešení. Z nerovnosti mezi harmonickým a aritmetickým průměrem dostáváme
iii) Na elipsoidu + + = 1 najděte bod v prvním oktantu s vlastností, že objem čtyřstěnu tvořeného souřadnými stěnami a tečnou rovinou k elipsoidu v tomto bodě je minimální.
Řešení. Nejprve připomeňme, že objem čtyřstěnu vypočteme podle vzorce V = x0y0z0, kde [x0,0,0],[0,y0,0],[0,0,z0] jsou průsečíky tečné roviny se souřadnými osami (sestrojíme-li trojboký hranol se základnou tvořenou trojúhelníkem s vrcholy [0,0,0], [x0,0,0], [0,y0,0] a výškou z0, jeho objem je x0y0z0 a je trojnásobkem objemu daného čtyřstěnu). Vyjádřením proměnné z z rovnice elipsoidu nebo pomocí derivace implicitní funkce snadno ověříme, že rovnice tečné roviny k elipsoidu v bodě [,,] je
|
(9.9) |
Odtud dostáváme, že úseky vyťaté tečnou rovinou na souřadných osách jsou x0 = (položíme y = 0 = z v (9.9)), z0 = , z0 = . Řešíme tedy úlohu
iv) Na elipsoidu x2 + + = 1 najděte bod, který je nejblíže rovině x + y + z = 2.
Řešení. Pro vzdálenost bodu [x0,y0,z0] od roviny ax + by + cz = d platí vzorec (viz Příklad 9.1 ii))
|
(9.10) |
která je (pokud jde o bod, v němž je dosaženo minima) ekvivalentní úloze
Cvičení
9.1. Určete vázané extrémy funkce f na množině určené rovnostmi:
a) f(x,y,z) = xy2z3, x + 2y + 3z = a, a,x,y,z > 0 |
b) f(x,y,z) = sinxsiny sinz, x + y + z = |
c) f(x,y,z) = xyz, x2 + y2 + z2 = 1, x + y + z = 0 |
d) f(x,y,z) = xy + yz, x2 + y2 = 2, y + z = 2, x,y,z > 0 |
e) f(x1,…,xn) = x12 + ⋯ + xn2, + ⋯ + = 1, ai > 0, i = 1,…,n |
f) f(x1,…,xn) = +…+, 1x1 + ⋯ + nxn = 1, i,i,xi > 0, i = 1,…,n |
g) f(x1,…,xn) = x11…xnn, x1 + ⋯ + xn = 1, i > 0, i = 1,…,n |
[Další] [Předchozí] [Předchozí – na konec] [Na začátek] [Výše]