KAPITOLA 5 Zřízení ZOO jaké funkce potřebujem – V této kapitole začneme budovat nástroje umožňujících modelování závislostí, které nejsou ani lineární ani diskrétní. S takovou potřebou se často setkáme, když popisujeme systém vyvíjející se v čase a to ne jen v několika vybraných okamžicích, ale „souvisle“, tj. pro všechny možné okamžiky. Někdy je to přímo záměr či potřeba (třeba ve fyzikálních modelech klasické mechaniky), jindy je to vhodné přiblížení diskrétního modelu (třeba u ekonomických, chemických nebo biologických modelů). Klíčovým pojmem budou stále funkce. Čím větší třídu funkcí připustíme, tím obtížnější bude vybudovat nástroje pro naši práci. Když ale bude různých typů funkcí málo, nebudeme patrně umět budovat dobré modely pro reálné situace vůbec. Cílem následujících dvou kapitol bude proto explicitně zavést několik typů elementárních funkcí, implicitně popsat daleko více funkcí a vybudovat standardní nástroje pro práci s nimi. Souhrnně se tomu říká diferenciální a integrální počet jedné proměnné. Zatímco dosud jsme se spíše pohybovali v oblasti matematiky nazývané algebra, nyní se pouštíme do tzv. matematické analýzy. 1. Interpolace polynomy V předchozích kapitolách jsme pracovali často s posloupnostmi hodnot reálných nebo komplexních čísel, tj. se skalárními funkcemi N → K nebo Z → K, kde K byl zvolený číselný obor. Případně jsme pracovali s posloupnostmi vektorů nad reálnými nebo komplexními čísly. Připomeňme si diskusi z odstavce 1.4, kde jsme přemýšleli nad způsoby, jak pracovat se skalárními funkcemi. Na této diskusi není třeba nic doplňovat a rádi bychom (pro začátek) uměli pracovat s funkcemi R → R (reálné funkce reálné proměnné) nebo R → C (komplexní funkce reálné proměnné), případně funkcemi Q → Q (funkce jedné racionální proměnné s racionálními hodnotami) apod. Většinou půjdou naše závěry snadno rozšířit na případy s vektorovými hodnotami nad stejnými skaláry, ve výkladu se ale zpravidla omezíme jen na případ reálných a komplexních čísel. Začneme od nejednodušších funkcí, které umíme zadat explicitně pomocí konečně mnoha algebraických operací se skaláry. 175 KAPITOLA 5. ZŘÍZENÍ ZOO 5.1 5.1. Polynomy. Skaláry umíme sčítat a násobit a tyto operace splňují řadu vlastností, které jsme vyjmenovali už v odstavcích 1.1 a 1.3. Když připustíme konečný počet těchto operací, přičemž jednu proměnnou ponecháme jako neznámou a další vstupující skaláry budou pevně zvolené, dostáváme tzv. polynomy: Polynomy Polynomem nad okruhem skalárů K rozumíme zobrazení f : K → K dané výrazem f (x) = anxn + an−1xn−1 + · · · + a1x + a0, kde ai, i = 0, . . . , n, jsou pevně zadané skaláry, násobení je znázorněno prostým zřetězením symbolů a „+“ označuje sčítání. Pokud je an = 0, říkáme, že polynom f je stupně n. Stupeň nulového polynomu není definován. Skaláry ai označujeme jako koeficienty polynomu f .f . Polynomy stupně nula jsou právě konstantní nenulová zobrazení x → a0. V algebře jsou častěji polynomy definovány jako formální výrazy uvedeného tvaru f (x), tj. jako posloupnosti koeficientů a0, a1, . . . s konečně mnoha nenulovými prvky. V zápětí si ale ukážeme, že v analýze budou oba přístupy ekvivalentní. Je snadné ověřit, že polynomy nad okruhem skalárů tvoří opět okruh, kde násobení a sčítání je dáno operacemi v původním okruhu K pomocí hodnot polynomů, tzn. (f · g)(x) = f (x) · g(x), (f + g)(x) = f (x) + g(x), kde nalevo a napravo musíme správně interpretovat příslušné operace v okruhu polynomů a v samotném okruhu skalárů. 5.1a 5.2. Dělení polynomů se zbytkem. Jak jsme již zmínili, budeme v dalším pracovat výhradně s poli skalárů Q, R nebo C. Pro všechna pole skalárů však platí Tvrzení (O dělení polynomů se zbytkem). Pro libovolné polynomy f stupně n a g stupně m, existují jednoznačně určené polynomy q a r takové, že f = q · g + r a přitom je stupeň r menší než m nebo je r = 0. Důkaz. Začněme jednoznačností. Předpokládejme, že máme dvě požadovaná vyjádření polynomu f s polynomy g, g , r a r , tj. platí f = q · g + r = q · g + r . Pak také odečtením dostaneme 0 = (q − q ) · g + (r − r ). Jestliže q = q , pak také r = r . Je-li q = q , pak člen s nejvyšším stupněm v (q −q )·g nemůže být vykompenzován r − r , což vede na spor. Dokázali jsme tedy jednoznačnost výsledku dělení, pokud existuje. Zbývá dokázat, že umíme polynom f vždy napsat požadovaným způsobem. Pokud by stupeň g byl větší než stupeň f , pak můžeme rovnou psát f = 0 · g + f . Předpokládejme proto n ≥ m a dokažme tvrzení indukcí přes stupeň f . 176 KAPITOLA 5. ZŘÍZENÍ ZOO Pokud je f polynom stupně nula, je tvrzení zřejmé. Přepokládejme tedy, že tvrzení platí pro stupně menší než n > 0 a uvažme výraz h(x) = f (x) − an bm xn−m g(x). Buď je h(x) přímo nulový polynom a pak máme, co jsme hledali, nebo jde o polynom nižšího stupně a tedy jej již umíme napsat potřebným způsobem h(x) = q · g + r a tedy také f (x) = h(x) + an bm xn−m g(x) = (q + an bm xn−m )g(x) + r a tvrzení je dokázáno. Je-li pro nějaký prvek b ∈ K hodnota f (b) = 0, pak to znamená, že v podílu f (x) = q(x)(x −b)+r musí být r = 0. Jinak by totiž nebylo možné dosáhnout f (b) = q(b) · 0 + r, kde stupeň r je nulový. Říkáme, že b je kořen polynomu f . Stupeň q je pak právě n−1. Pokud má q opět kořen, můžeme pokračovat a po nejvýše n krocích dojdeme ke konstatnímu polynomu. Dokázali jsme tedy, že každý nenulový polynom nad polem K má nejvýše tolik kořenů, kolik je jeho stupeň. Odtud již snadno dovodíme i následující pozorování: Důsledek. Je-li K pole s nekonečně mnoha prvky, pak dva polynomy f a g jsou si rovny jako zobrazení, právě když mají shodné koeficienty. Důkaz. Předpokládejme f = g, tj. f − g = 0, jako zobrazení. Polynom (f − g)(x) tedy má nekonečně mnoho kořenů, což je možné pouze tehdy, je-li nulovým polynomem. Uvědomme si, že u konečných polí samozřejmě takové tvrzení neplatí. Jednoduchým příkladem je např. polynom x2 + x nad Z2, který představuje nulové zobrazení. 5.2 5.3. Interpolační polynom. Častá praktická úloha vyžaduje stanovení počítatelné formule pro funkci, pro kterou máme zadány hodnoty v předem daných bodech x0, . . . , xn. Pokud by šlo o nulové hodnoty, umíme přímo zadat polynom stupně n + 1 f (x) = (x − x0)(x − x1) . . . (x − xn), který bude mít nulové hodnoty právě v těchto bodech a nikde jinde. To ale není jediná odpověď, protože požadovanou vlastnost má i nulový polynom. Ten je přitom jediný s touto vlastností ve vektorovém prostoru polynomů stupně nejvýše n. Obdobně to dopadne i v obecném případě: Interpolační polynomy Nechť K je nekonečné pole skalárů. Interpolační polynom f pro množinu po dvou různých bodů x0, . . . , xn ∈ K a předepsaných hodnot y0, . . . , yn ∈ K je polynom stupně nejvýše n nebo nulový polynom, který splňuje f (xi) = yi pro všechna i = 0, 1, . . . , n. Věta. Pro každou množinu n + 1 po dvou různých bodů x0, . . . , xn ∈ K a předepsaných hodnot y0, . . . , yn ∈ K existuje právě jeden interpolační polynom f .tuje právě jeden interp 177 KAPITOLA 5. ZŘÍZENÍ ZOO Důkaz. Začněme jednodušší částí, tj. jednoznačností. Jsou-li f a g dva interpolační polynomy se stejnými definičními hodnotami, pak je jejich rozdíl polynomem stupně n, který má n + 1 kořenů, a proto je f − g = 0. Zbývá existence. Označme si prozatím neznámé koeficienty polynomu f stupně n f = anxn + · · · + a1x + a0. Dosazením požadovaných hodnot dostaneme systém n + 1 rovnic pro stejný počet neznámých koeficientů ai a0 + x0a1 + · · · + (x0)n an = y0 ... a0 + xna1 + · · · + (xn)n an = yn. Existenci řešení tohoto systému rovnic můžeme snadno ukázat přímou konstrukcí patřičného polynomu pomocí tzv. Lagrangeových polynomů pro dané body x0, . . . , xn, viz. další odstavec textu níže. Nyní ale důkaz dokončíme pomocí jednoduchých znalostí z lineární algebry. Tento systém lineárních rovnic má totiž právě jedno řešení pokud je determinant jeho matice invertibilní skalár, tj. pokud je nenulový (viz 3.1 a 2.23). Jde o tzv. Vandermondův determinant, který jsme již diskutovali v příkladu ?? na straně ??. Protože jsme ale už ověřili, že pro nulové pravé strany existuje řešení právě jedno, víme, že tento determinant nenulový být musí. Protože polynomy jsou jako zobrazení stejné, právě když mají stejné koeficienty, věta je dokázána. 5.3 5.4. Užití interpolací. Na první pohled se může zdát, že reálné nebo případně racionální polynomy, tj. polynomiálně zadané funkce R → R nebo Q → Q, tvoří hezkou velikou třídu funkcí jedné proměnné. Můžeme jimi proložit jakékoliv sady předem zadaných hodnot. Navíc se zdají být snadno vyjádřitelné, takže by s jejich pomocí mělo být dobře možné počítat i hodnoty těchto funkcí pro jakoukoliv hodnotu proměnné. Při pokusu o praktické využití v tomto směru ovšem narazíme hned na několik problémů. Prvním z nich je potřeba rychle vyjádřit polynom, kterým zadaná data proložíme. Pro řešení výše diskutovaného systému rovnic totiž budeme obecně potřebovat čas úměrný třetí mocnině počtu bodů, což při objemnějších datech je jistě těžko přijatelné. Podobným problémem je pomalé vyčíslení hodnoty polynomu vysokého stupně v zadaném bodě. Obojí lze částečně obejít tak, že zvolíme vhodné vyjádření intepolačního polynomu (tj. vybereme lepší bázi příslušného vektorového prostoru všech polynomů stupně nejvýše k, než je ta nejobvyklejší 1, x, x2 , . . . , xn ). Ukážeme si pouze jediný příklad takového postupu: 178 KAPITOLA 5. ZŘÍZENÍ ZOO Lagrangeovy interpolační polynomy Lagrangeův interpolační polynom snadno zapíšeme pomocí tzv. elemntárních Lagrangeových polynomů i stupně n s vlastnostmi i(xj ) = 1 i = j 0 i = j . Zřejmě musí být tyto polynomy až na konstantu rovny výrazům (x − x0) . . . (x − xi−1)(x − xi+1) . . . (x − xn) a proto i(x) = j=i(x − xj ) j=i(xi − xj ) . Hledaný Lagrangeův interpolační polynom je pak dán vzta- hem f (x) = y0 0(x) + y1 1(x) + · · · + yn n(x).f (x) = y0 0( Použití Lagrangeových polynomů je obzvlášť efektivní, když opakovaně prokládáme zadané hodnoty závislé proměnné yi pro stále stejné hodnoty nezávislé proměnné xi. Pak totiž máme elementární polynomy i předem připraveny. Toto vyjádření má nevýhodu ve velké citlivosti na nepřesnosti výpočtu při malých rozdílech zadaných hodnot xi, protože se v něm těmito rozdíly dělí. Další nepříjemností je velice špatná stabilita hodnot reálných nebo racionálních polynomů při zvětšující se hodnotě proměnné. Brzy budeme mít nástroje na přesný popis kvalitativního chování funkcí, nicméně i bez nich je zřejmé, že podle znaménka koeficientu u nejvyšší mocniny polynomu se hodnoty velice rychle při rostoucím x vydají buď do plus nebo mínus nekonečna. Ani toto znaménko koeficientu u nejvyššího stupně se ale u interpolačního polynomu při malých změnách prokládaných hodnot nechová stabilně. Názorně to vidíme na dvou obrázcích, kde je proloženo jedenáct hodnot funkce sin(x) s různými malými náhodnými změnami hodnot. Zelenou barvou je vynesena aproximovaná funkce, kolečka jsou malinko posunuté hodnoty a červeně je vynesen jednoznačně zadaný interpolační polynom. Zatímco uvnitř intervalu je aproximace vcelku dobrá, stabilita na okrajích je otřesná. -4 x 2 4 1 2 0 -1 0 -2 -2 -4 x 2 4 1 2 0 -1 0 -2 -2 Kolem interpolačních polynomů existuje bohatá teorie. dát nějaké další odkazy 5.4a 5.5. Poznámka. Numerická nestabilita způsobená případnou blízkostí (některých) z bodů xi je dobře viditelná i na 179 KAPITOLA 5. ZŘÍZENÍ ZOO systému rovnic z důkazu Věty 5.3. Při řešení systémů lineárních rovnic totiž nestabilita do značné míry souvisí s velikostí determinantu matice systému, tj. v našem případě Vandermondova determinantu. Ten umíme vcelku snadno přímo spočíst: Lemma. Pro posloupnost po dvou různých skalárů x0, . . . , xn ∈ K platí V (x0, . . . , xn) = n i>k=0 (xi − xk). Důkaz. Vztah dokážeme indukcí přes počet bodů xi. Evidentně je správný pro n = 1 (a pro n = 0 je úloha nezajímavá). Předpokládejme, že výsledek je správný pro n − 1, tj. V (x0, . . . , xn−1) = n−1 i>k=0 (xi − xk). Nyní považujme hodnoty x0, . . . , xn−1 za pevné a hodnotu xn ponechme jako volnou proměnnou. Rozvojem determinantu podle posledního řádku (viz ??) obdržíme hledaný determinant jako polynom e5.1e5.1 (5.1) V (x0, . . . , xn) = (xn)n V (x0, . . . , xn−1) − (xn)n−1 · · · . Toto je polynom stupně n, protože víme, že jeho koeficient u (xn)n je nenulový dle indukčního předpokladu. Přitom bude zjevně nulový při dosazení kterékoliv hodnoty xn = xi pro i < n, protože bude v takovém případě obsahovat původní determinant dva stejné řádky. Náš polynom tedy bude dělitelný výrazem (xn − x0)(xn − x1) · · · (xn − xn−1), který má sám již stupeň n. Odtud vyplývá, že celý Vandermondův determinant coby polynom v proměnné xn musí být tomuto výrazu roven až na konstantní násobek, tj. V (x0, . . . , xn) = c · (xn − x0)(xn − x1) · · · (xn − xn−1). Porovnáním koeficientů u nejvyšší mocniny v (5.1) a tomto výrazu dostáváme c = V (x0, . . . , xn−1) a tím je důkaz lemmatu ukončen. Opět tedy vidíme, že determinant bude velmi malý, pokud jsou malé vzdálenosti bodů xi. 5.4 5.6. Derivace polynomů. Zjistili jsme, že hodnoty polynomů s rostoucí proměnnou rychle míří k nekonečným hodnotám (viz také obrázky). Proto je zřejmé, že polynomy nemohou nikdy vhodně popisovat jakékoliv periodicky se opakující děje (jako jsou např. hodnoty goniometrických funkcí). Mohlo by se ale zdát, že podstatně lepší výsledky budeme alespoň mezi body xi dosahovat, když si budeme kromě hodnot funkce hlídat, jak rychle naše funkce v daných bodech rostou. Za tímto účelem zavedeme (prozatím spíše intuitivně) pojem derivace pro polynomy. Můžeme přitom pracovat opět 180 KAPITOLA 5. ZŘÍZENÍ ZOO s reálnými, komplexními nebo racionálními polynomy. Rychlost růstu v bodě x ∈ R pro reálný polynom f (x) dobře vyjadřují podíly e5.2e5.2 (5.2) f (x + x) − f (x) x a protože umíme spočíst (nad libovolným okruhem) (x+ x)k = xk +kxk−1 x+· · ·+ k l xl ( x)k−l +· · ·+( x)k , dostaneme pro polynom f (x) = anxn +· · ·+a0 výše vedený podíl ve tvaru f (x + x) − f (x) x = an nxn−1 x + · · · + ( x)k x + · · · + a1 x x = nanxn−1 + (n − 1)an−1xn−2 + · · · + a1 + x(. . . ) kde výraz v závorce je polynomiálně závislý na x. Evidentně pro hodnoty x velice blízké nule dostaneme hodnotu libovolně blízkou následujícícmu výrazu: Derivace polynomů Derivací polynomu f (x) = anxn + · · · + a0 podle proměnné x rozumíme polynom f (x) = nanxn−1 + (n − 1)an−1xn−2 + · · · + a1.f (x) nanx Z definice je jasné, že právě hodnota f (x0) derivace polynomu nám dává dobré přiblížení jeho chování v okolí bodu x0. Přesněji řečeno, přímky y = f (x0 + x) − f (x0) x (x − x0) + f (x0), tj. sečny grafu polynomu procházející body [x0, f (x0)] a [x0+ x, f (x0 + x)] se, se zmenšujícím se x, přibližují přímce y = f (x0)(x − x0) + f (x0), což tedy musí být tečna grafu polynomu f . Hovoříme o lineárním přiblížení polynomu f jeho tečnou. Derivace polynomů je lineární zobrazení, které přiřazuje polynomům stupně nejvýše n polynomy stupně nejvýše n−1. Iterací této operace dostáváme druhé derivace f , třetí derivace f (3) a obecně po k–násobném opakování polynom f (k) stupně n−k. Po n+1 derivacích je výsledkem nulový polynom. Toto lineárním zobrazení je příkladem tzv. cyklického nilpotentního zobrazení, která jsou podrobněji rozebírána v odstavci 3.32 o nilpotentních zobrazeních. 5.5 5.7. Hermiteův interpolační problém. Uvažme opět m+1 po dvou různých reálných hodnot x0, . . . , xm, tj. xi = xj pro všechna i = j. Budeme chtít zase prokládat pomocí polynomů předem dané hodnoty, tentokrát ale budeme vedle hodnot předepisovat i první derivace. Tj. předpíšeme yi a yi pro všechna i. Hledáme polynom f , který bude nabývat těchto předepsaných hodnot a derivací. 181 KAPITOLA 5. ZŘÍZENÍ ZOO Zcela analogicky jako u interpolace pouhých hodnot obdržíme pro neznámé koeficienty polynomu f (x) = anxn + · · · + a0 systém 2(m + 1)rovnic a0 + x0a1 + · · · + (x0)n an = y0 ... a0 + xma1 + · · · + (xm)n an = ym a1 + 2x0a2 + · · · + n(x0)n−1 an = y0 ... a1 + 2xma2 + · · · + n(xm)n−1 an = ym. Opět bychom mohli ověřit, že při volbě n = 2m + 1 bude determinant tohoto systému rovnic nenulový a tudíž bude existovat právě jedno řešení. Nicméně, obdobně ke konstrukci Lagrangeova polynomu lze zkonstruovat takový polynom f přímo. Prostě si vytvoříme jednu sadu polynomů s hodnotami nula nebo jedna jak u derivací tak u hodnot, abychom jejich jednoduchou lineární kombinací uměli dosáhnout potřebné hodnoty. Ověření následující definice a tvrzení necháme na čtenáři: Hermiteův interpolační polynom Hermiteův interpolační polynom definujeme pomocí fundamentálních Hermiteových polynomů: h1 i (x) = 1 − (xi) (xi) (x − xi) ( i(x))2 h2 i (x) = (x − xi) ( i(x))2 , kde (x) = n i=1(x − xi). Tyto polynomy splňují: h1 i (xj ) = δ j i = 1 pro i = j 0 pro i = j (h1 i ) (xj ) = 0 h2 i (xj ) = 0 (h2 i ) (xj ) = δ j i a proto je Hermiteův interpolační polynom dán výrazem f (x) = k i=1 yih1 i (xi) + yih2 i (xi) . 5.5a 5.8. Příklady Hermiteových polynomů. Úplně nejjednodušší případ je zadání hodnoty a derivace v jediném bodě. Tím určíme beze zbytku polynom stupně jedna f (x) = f (x0) + f (x0)(x − x0) tj. právě rovnici přímky zadané hodnotou a směrnicí v bodě x0. Když zadáme hodnotu a derivaci ve dvou bodech, tj. y0 = f (x0), y0 = f (x0), y1 = f (x1), y1 = f (x1) pro dva různé body xi, dostaneme ještě pořád snadno počítatelný problém. 182 KAPITOLA 5. ZŘÍZENÍ ZOO Ukažme si jej ve zjednodušeném provedení, kdy x0 = 0, x1 = 1. Pak matice systému a její inverze budou A = ⎛ ⎜ ⎜ ⎝ 0 0 0 1 1 1 1 1 0 0 1 0 3 2 1 0 ⎞ ⎟ ⎟ ⎠ , A−1 = ⎛ ⎜ ⎜ ⎝ 2 −2 1 1 −3 3 −2 −1 0 0 1 0 1 0 0 0 ⎞ ⎟ ⎟ ⎠ . Přímým vynásobením A · (y0, y1, y0, y1)T pak vyjde vektor koeficientů (a3, a2, a1, a0)T polynomu f , tj. f (x) = (2y0 − 2y1 + y0 + y1)x3 + (−3y0 + 3y1 − 2y0 − y1)x2 + y0x + y0. 5.6 5.9. Interpolace splajny. Obdobně můžeme předepisovat libovolný konečný počet derivací v jednotlivých bodech a vhodnou volbou stupně polynomu obdržíme vždy jednoznačné interpolace. Nebudeme zde uvádět podrobnosti. Bohužel, u všech těchto interpolací pořád zůstávají problémy zmíněné už v případě jednoduchých interpolací hodnot – složitost výpočtů a nestabilita. Použití derivací však podbízí jednoduché vylepšení metodiky: Jak jsme viděli na obrázcích demonstrujících nestabilitu interpolace jedním polynomem dostatečně vysokého stupně, malé lokální změny hodnot zapřičiňovaly dramatické celkové změny chování výsledného polynomu. Nabízí se tedy využití malých polynomiálních kousků nízkých stupňů, které ale musíme umět rozumně navazovat. Nejjednodušší je propojení vždy dvou sousedních bodů lineárním polynomem. Tak se nejčastěji zobrazují data. Z pohledu derivací to znamená, že budou na jednotlivých úsecích konstantní a pak se skokem změní. O něco sofistikovanější možností je předepsat v každém bodě hodnotu a derivaci, tj. pro dva body budeme mít 4 hodnoty a jednoznačně tím určíme Hermiteův polynom 3. stupně, viz výše. Tento polynom pak můžeme použít pro všechny hodnoty nezávislé proměnné mezi krajními hodnotami x0 < x1. Hovoříme o intervalu [x0, x1]. Takové polynomiální příblížení po kouskách už bude mít tu vlastnost, že první derivace na sebe budou navazovat. V praxi ale není pouhé navazování první derivace dostatečné a navíc při naměřených datech nemíváme hodnoty derivací k dispozici. Přímo se proto vnucuje pokus využívat pouze zadané hodnoty ve dvou sousedních bodech, ale požadovat zároveň rovnost prvních i druhých derivací u sousedních kousků polynomů třetího stupně. To totiž bude znamenat stejné množství rovnic a neznámých a pravděpodobně tedy i obdobnou praktickou řešitelnost problému: Kubické splajny Nechť x0 < x1 < · · · < xn jsou reálné hodnoty, ve kterých jsou zadány požadované hodnoty y0, . . . , yn. Kubickým interpolačním splajnem pro toto zadání je funkce S : R → R, která splňuje následující podmínky: 183 KAPITOLA 5. ZŘÍZENÍ ZOO • zúžení S na interval [xi−1, xi] je polynom Si nejvýše třetího stupně, i = 1, . . . , n • Si(xi−1) = yi−1 a Si(xi) = yi pro všechny i = 1, . . . n, • Si(xi) = Si+1(xi) pro všechny i = 1, . . . , n − 1, • Si (xi) = Si+1(xi) pro všechny i = 1, . . . , n − 1.= 1, . . . , n − 1. Kubický splajn1 pro n + 1 bodů sestává z n kubických polynomů, tj. máme k dispozici 4n volných parametrů (první definiční podmínka). Další podmínky přitom zadávají 2n + (n − 1) + (n − 1) rovností, tj. dva parametry zůstávají volné. Při praktickém použití se dodávají předpisy pro derivace v krajních bodech, tzv. úplný splajn, nebo jsou tyto zadány jako nula, tzv. přirozený splajn. Výpočet celého splajnu už není bohužel tak jednoduchý jako u nezávislých výpočtů Hermiteových polynomů třetího stupně, protože data se prolínají vždy mezi sousedními intervaly. Při vhodném uspořádání se však dosáhne matice systému, která má nenulové prvky prakticky jen ve třech diagonálách, a pro takové existují vhodné numerické postupy, které umožní splajn počítat také v čase úměrném počtu bodů. Pro srovnání se podívejme na interpolaci stejných dat jako v případě Lagrangeova polynomu, nyní pomocí splajnů: 0 -4 0 -0,5 2 -1 1 -2 4 x 0,5 0 -4 -0,5 x 2 -1 1 0 0,5 4-2 2. Reálná čísla a limitní procesy Je důležité mít dostatečně velkou zásobu funkcí, se kterými bude možné možné vyjadřovat všechny běžné závislosti, zároveň ale musí být výběr šikovně omezen, abychom uměli vybudovat nějaké univerzální a hlavně účinné nástroje pro práci s nimi. Ve skutečnosti se budeme muset hned z kraje soustředit na to, jak vůbec hodnoty funkcí definovat, když pomocí konečně mnoha násobení a sčítání dostáváme jen polynomy a navíc skutečně počítat umíme jen s čísly racionálními. S těmi ale nevystačíme ani při počítání odmocnin, protože už √ 2 racionální číslo není. Prvním naším krokem tedy musí být pořádné zavedení tzv. limitních procesů, tj. dáme přesný obsah tvrzením, že se nějaké hodnoty blíží jejich hodnotě limitní. 1Ošklivé české slovo „splajn“ vzniklo fonetickým přepisem anglického ekvivalentu „spline“, který znamenal tvárné pravítko užívané inženýry pro kreslení křivek. 184 KAPITOLA 5. ZŘÍZENÍ ZOO Všimněme si také, že výraznou vlastností polynomů je jejich „spojitá“ závislost hodnot na nezávislé proměnné. Intuitivně řečeno, když dostatečně málo změníme x, určitě se nám moc nezmění ani hodnota f (x). Takové chování naopak nemáme u po částech konstantních funkcí f : R → R v okolí „skoků“. Např. u tzv. Heavisideovy funkce f (x) = ⎧ ⎪⎨ ⎪⎩ 0 pro všechny x < 0 1/2 pro x = 0 1 pro všechny x > 0 taková „nespojitost“ nastane pro x = 0. Začneme formalizací takovýchto intuitivních výroků. 5.7 5.10. Reálná čísla. Prozatím jsme docela dobře vystačili s algebraickými vlastnostmi reálných čísel, které říkaly, že R je pole. Už jsme ale používali i relaci uspořádání reálných čísel, kterou značíme „≤“ (viz odstavec 1.38). Vlastnosti (axiomy) reálných čísel, včetně souvislostí uspořádání a ostatních relací, jsou srhnuty v následující tabulce. Dělící čáry naznačují, jak axiomy postupně zaručují, že jsou reálná čísla komutativní grupou vůči sčítání, že R \ {0} je komutativní grupa vůči násobení, R je pole, množina R spolu s operacemi +, · a s relací uspořádání je tzv. uspořádané pole a konečně poslednímu axiomu můžeme rozumět tak, že R je „dostatečně husté“, tj. nechybí nám tam body, jako např. chybí √ 2 v číslech racionálních. Axiomy reálných čísel (R1) (a + b) + c = a + (b + c), pro všechny a, b, c ∈ R (R2) a + b = b + a, pro všechny a, b ∈ R (R3) existuje prvek 0 ∈ R takový, že pro všechny a ∈ R platí a + 0 = a (R4) pro všechny a ∈ R existuje opačný prvek (−a) ∈ R takový, že platí a + (−a) = 0 (R5) a · b) · c = a · (b · c), pro všechny a, b, c ∈ R (R6) a · b = b · a pro všechny a, b ∈ R (R7) existuje prvek 1 ∈ R takový, že pro všechny a ∈ R platí 1 · a = a (R8) pro každý a ∈ R, a = 0 existuje inverzní prvek a−1 ∈ R takový, že platí a · a−1 = 1 (R9) a · (b + c) = a · b + a · c, pro všechny a, b, c ∈ R (R10) relace ≤ je úplné uspořádání, tj. reflexivní, antisymetrická, tranzitivní a úplná relace na R (R11) pro všechny a, b, c ∈ R platí, že z a ≤ b vyplývá také a + c ≤ b + c (R12) pro všechny a, b ∈ R, a > 0, b > 0, platí také a · b > 0 (R13) každá neprázdná ohraničená množina A ⊂ R má supremum.supremum. Pojem supremum musíme ale také zavést pořádně. Má smysl pro každou uspořádanou množinu, tj. množinu s pevně zadanou relací uspořádání, a budeme se s ním takto i později setkávat ve více algebraických souvislostech. Připomeňme, 185 KAPITOLA 5. ZŘÍZENÍ ZOO že v obecné úrovni je uspořádáním jakákoliv binární relace na množině, která má vlastnosti reflexivity, antisymetrie a tranzitivity, viz odstavec 1.38. Supremum a infimum Definice. Uvažme podmnožinu A ⊂ B v uspořádané množině B. Horní závorou množiny A je každý prvek b ∈ B, pro který platí, že b ≥ a pro všechny a ∈ A. Obdobně definujeme dolní závory množiny A jako prvky b ∈ A takové, že b ≤ a pro všechny a ∈ A. Nejmenší horní závora podmnožiny A, pokud existuje, se nazývá supremum této podmnožiny a značíme ji sup A. Obdobně, největší dolní závora, pokud existuje, se nazývá infimum, píšeme inf A. Posledním axiomem v naší tabulce vlastností reálných čísel tedy předpokládáme, že pro každou množinu reálných čísel A platí, že pokud existuje nějaké číslo a větší nebo rovno než všechna x ∈ A, pak existuje také nejmenší takové číslo a. Např. volbou A = {x ∈ Q, x2 < 2} dosteneme jako supremum sup A právě √ 2. Okamžitým důsledkem je také existence infim pro každou zdola ohraničenou množinu reálných čísel (stačí si všimnout, že obrácením znaménka všech čísel zaměníme suprema a infima). Pro formální výstavbu další teorie ale potřebujeme vědět, zda námi požadované vlastnosti reálných čísel lze realizovat, tj. zda existuje taková množina R s operacemi a relací uspořádání, které všech třináct axiomů skutečně splňují. Zatím jsem zkonstruovali korektně jen čísla racionální, která tvoří uspořádané pole, tj. splňují axiomy (R1) – (R12), což si čtenář jistě snadno ověří. Ve skutečnosti lze reálná čísla nejen zkonstruovat, ale také lze ukázat, že až na izomorfismus to jde jediným způsobem. Pro naši potřebu vystačíme s intuitivní představou reálné přímky. Jednoznačnost proto nebudeme diskutovat vůbec a existenci jen naznačíme v dalších odstavcích. 5.7a 5.11. Komplexní rovina. Připomeňme, že komplexní čísla jsou dána jako dvojice reálných čísel, které jsme zvyklí zapisovat jako z = re z + i im z. Dobrou představou o komplexních číslech je proto rovina C = R2 . Se sčítáním a násobením splňuje pole komplexních čísel axiomy (R1)–(R9), není na nich ale žádným rozumným způsobem definováno uspořádání, které by naplnilo axiomy (R10)– R(13). Nicméně s nimi budeme také pracovat a již dříve jsme viděli, že rozšíření skalárů na komplexní čísla je často pro výpočty mimořádně užitečné. Důležitou operací na komplexních čísel je tzv. konjugace. Je to zrcadlení podle přímky reálných čísel, tj. obrácení znaménka u imaginární složky. Značíme ji pruhem nad daným číslem z ∈ C, ¯z = re z − i im z. 186 KAPITOLA 5. ZŘÍZENÍ ZOO Protože je pro z = x + iy z · ¯z = (x + iy)(x − iy) = x2 + y2 , zadává nám tento výraz právě kvadrát vzdálenosti komplexního čísla od nuly. Odmocnině z tohoto reálného nezáporného čísla říkáme absolutní hodnota komplexního čísla z, píšeme e5.3e5.3 (5.3) |z|2 = z · ¯z Absolutní hodnotu máme definovánu také na každém uspořádaném poli skalárů, prostě definujeme absolutní hodnotu |a| takto |a| = a je-li a ≥ 0 −a je-li a < 0. Samozřejmě platí pro každá dvě čísla a, b ∈ K e5.4e5.4 (5.4) |a + b| ≤ |a| + |b|. Této vlastnosti říkáme trojúhelníková nerovnost a splňuje ji také absolutní hodnota komplexních čísel definovaná výše. Zejména pro pole racionálních a reálných čísel, která jsou podmonožinami v komplexní rovině zjevně obě definice absolutní hodnoty splývají. 5.8 5.12. Konvergence posloupností. V dalších odstavcích budeme pracovat s některým z číslených oborů K racionálních, reálných nebo komplexních čísel. V tomto kontextu je tedy třeba chápat absolutní hodnotu a skutečnost, že ve všech případech platí trojúhelníková nerovnost. Cauchyovské posloupnosti Uvažme libovolnou posloupnost čísel a0, a1, . . . v K takovou, že pro libolné pevně zvolené kladné číslo > 0 platí pro všechny dvojice prvků ai, aj posloupnosti, až na konečně mnoho výjimek (které závisí na volbě ), |ai − aj | < . Jinak řečeno, pro každé pevné > 0 existuje index N takový, že předcházející nerovnost platí pro všechna i, j > N. Takové posloupnosti prvků se říká Cauchyovská posloupnost.posloupnosti prvků se Intuitivně jistě cítíme, že buď jsou v takové posloupnosti všechny prvky stejné až na konečně mnoho z nich (pak bude od určitého indexu N počínaje vždy |ai − aj | = 0) nebo se taková posloupnost „hromadí“ k nějaké hodnotě. Dobře je to představitelné v komplexní rovině: ať vybereme jakkoliv malý kruh (o poloměru ), tak se nám jej u Cauchyovské posloupnosti vždy musí podařit položit do komplexní roviny tak, že zakryje všechny body nekonečné posloupnosti ai, až na konečně mnoho z nich. Můžeme si pak představit, že postupným zmenšováním se kruh smrští až do jediné hodnoty a. Pokud by taková hodnota a ∈ K pro Cauchyovskou posloupnost skutečně existovala, očekávali bychom od ní patrně následující vlastnost konvergence: 187 KAPITOLA 5. ZŘÍZENÍ ZOO Konvergující posloupnost Jestliže pro posloupnost čísel a0, a1, · · · ∈ K, pevně zvolené číslo a ∈ K a pro libovolné kladné reálné číslo platí pro všechny i, až na konečně mnoho výjimek (závisejících na volbě ), |ai − a| < , říkáme, že posloupnost ai, i = 0, 1, . . . , konverguje k hodnotě a. Číslu a také říkáme limita posloupnosti ai, i = 0, 1, . . . . Jestliže nějaká posloupnost ai ∈ K, i = 0, 1, . . . , konverguje k číslu a ∈ K, pak pro každé pevně zvolené kladné víme, že |ai − a| < pro všechna i větší než vhodné N ∈ N. Pak ovšem, díky trojúhelníkové nerovnosti, pro každou dvojici indexů i, j ≥ N dostáváme |ai −aj | = |ai −aN +aN −aj | < |ai −aN |+|aN −aj | < 2 . Dokázali jsme tedy: Lemma. Každá konvergující posloupnost čísel je Cauchyov- ská. V poli racionálních čísel se ovšem může snadno stát, že pro Cauchyovské posloupnosti příslušná hodnota a neexistuje. Např. číslo √ 2 můžeme libovolně přesně přiblížit racionálními čísly ai, dostaneme tedy konvergentní posloupnost s limitou √ 2, ale samotná limita již není racionální. Uspořádaná pole skalárů, ve kterém všechny Caychyovské posloupnosti konvergují, se nazývají úplná. Následující tvrzení říká, že axiom (R13) takové chování reálných čísel zaručuje: Věta. Každá Cauchyovská posloupnost reálných čísel ai konverguje k reálné hodnotě a ∈ R. Důkaz. Každá Cauchyovská posloupnost je zjevně ohraničená množina, protože pro libovolnou volbu ohraničíme všechny členy posloupnosti až na konečně mnoho z nich. Definujme si množinu B všech reálných čísel x, pro které platí x < aj pro všechny prvky aj posloupnosti, až na konečně mnoho z nich. Zřejmě má B horní závoru, tudíž podle axiomu (R13) má i supremum. Definujme a = sup B. Nyní pro nějaké pevně zvolené > 0 zvolme N takové, aby |ai − aj | < pro všechny i, j ≥ N. Zejména tedy aj > aN − a aj < aN + pro všechny indexy j > N, takže aN − patří do B, zatímco aN + už nikoliv. Souhrnně z toho dostáváme, že |a−aN | ≤ , a proto také |a − aj | ≤ |a − aN | + |aN − aj | ≤ 2 pro všechny j > N. To ale značí právě, že a je limitou uvažované posloupnosti. Důsledek. Každá Cauchyovská posloupnost komplexních čísel zi konverguje k nějakému komplexnímu číslu z. 188 KAPITOLA 5. ZŘÍZENÍ ZOO Důkaz. Pišme zi = ai + i bi. Protože je |ai − aj |2 ≤ |zi − zj |2 a podobně i pro hodnoty bi, jsou obě posloupnosti reálných čísel ai a bi Cauchyovské. Existují tedy jejich limity a resp. b a snadno ověříme, že z = a + i b je limitou pro posloupnost zi. 5.8a 5.13. Poznámka. Předchozí diskuse nám dává návod na jeden z možných postupů, jak korektně vybudovat reálná čísla. Postupujeme podobně jako při zúplňování přirozených čísel na celá (abychom přidali opačné hodnoty) a celých na racionální (abychom přidali podíly nenulových čísel). Tentokrát k racionálním číslům „přidáme“ limity všech Cauchyovských posloupností. Skutečně se podbízí zavést vhodně relaci ekvivalence na množině všech Cauchyovských posloupností racionálních čísel tak, že dvě Cauchyovské posloupnosti jsou ekvivalentní, když jejich sloučením do jediné posloupnosti (např. tak, že první posloupnost bude představovat liché, zatímco druhá sudé členy výsledné posloupnosti) obdržíme opět posloupcitace nějakého zdroje, případně alternativní možnosti zavedení reálných čísel nost Cauchyovskou. Nebudeme zde podrobně ověřovat, že jde o ekvivalenci, ani zavádět operace násobení a sčítání, ani dokazovat, že všechny požadované axiomy skutečně dojdou naplnění. Není to ale složité počínání. Složitější ambicí je dokázat, že axiomy (R1)–(R13) definují reálné čísla v jistém smyslu jednoznačně. 5.9 5.14. Otevřené a uzavřené množiny. Pro další práci s reálnými nebo komplexními čísly budeme potřebovat podrobnější pochopení pojmů jako blízkost, omezenost, konvergence apod. Hromadné body množiny Uvažme jakoukoliv množinu A bodů v K a předpokládejme, že posloupnost a0, a1, . . . je vybraná z prvků A. Pokud konverguje k hodnotě a ∈ K a navíc je nekonečně mnoho bodů ai ∈ A různých od a, nazýváme a hromadný bod množiny A.množiny A. Hromadné body podmnožiny A racionálních, reálných nebo komplexních čísel jsou tedy ta čísla, která jsou limitami posloupností čísel z A. Všimněme si, že hromadný bod množiny do ní nemusí patřit. Uzavřené množiny Uzavřená podmnožina v K je taková, která obsahuje i všechny své hromadné body. Typickou uzavřenou množinou je tzv. uzavřený interval [a, b] = {x ∈ R, a ≤ x ≤ b} reálných čísel. Zde a je reálné číslo nebo hraniční hodnota chybí a píšeme a = −∞ (mínus nekonečno) a podobně b > a je reálné číslo nebo +∞.je reálné číslo nebo + 189 KAPITOLA 5. ZŘÍZENÍ ZOO Uzavřené množiny jsou tedy ty, které v sobě mají i vše, k čemu umí „dokonvergovat“. Uzavřenou množinu bude tvořit např. posloupnost reálných čísel bez hromadného bodu nebo posloupnost s konečným počtem hromadných bodů spolu s těmito body. Uzavřený je také např. jednotkový kruh v rovině komplexních čísel včetně hraniční kružnice. Snadno ověříme, že libovolný průnik a libovolné konečné sjednocení uzavřených množin opět uzavřená množina. Skutečně, pokud všechny body nějaké posloupnosti patří do průniku našeho systému množin, pak jistě patří do každé z nich a proto do každé z nich patří i všechny hromadné body. Pokud bychom ale chtěli totéž říci o obecném sjednocení systému množin Ai, pak bychom neuspěli, protože např. jednobodové množiny jsou zjevně uzavřené, ale z nich utvořená posloupnost bodů už uzavřená nebývá. Pokud ale jde o konečné sjednocení množin a hromadný bod nějaké posloupnosti ležící v tomto sjednocení, pak takový hromadný bod musí být hromadným bodem i vybrané podposloupnosti, která ale už bude celá v jedné z našich množin. Každá je ale uzavřená, takže i hromadný bod do ní a tedy i celého sjednocení patří. Otevřené množiny a okolí bodů Otevřená množina v K je taková množina, jejíž doplněk je uzavřenou množinou. Okolím bodu a ∈ K nazýváme libovolnou otevřenou množinu O, která a obsahuje. Je-li okolí definované jako Oδ(a) = {x ∈ K, |x − a| < δ} pro kladné číslo δ, hovoříme o δ-okolí bodu a.bodu a. Všimněme si, že pro libovolnou množinu A je a ∈ K hromadným bodem A, právě když v libovolném okolí a leží také alespoň jeden bod b ∈ A, b = a. Lemma. Množina čísel A ⊂ K je otevřená, právě když každý její bod a ∈ A do ní patří i s nějakým svým okolím. Důkaz. Nechť je A otevřená a a ∈ A. Kdyby neexistovalo žádné okolí bodu a uvnitř A, musela by existovat posloupnost an /∈ A, |a − an| ≤ 1/n. Pak je ovšem a ∈ A hromadným bodem množiny K \ A, což není možné, protože doplněk A je uzavřený. Naopak předpokládejme, že každé a ∈ A leží v A i s nějakým svým okolím. To přirozeně zabraňuje, aby nějaký hromadný bod b pro množinu K \ A ležel v A. Je proto K \ A uzavřená a tedy je A otevřená. Z právě dokázaného lemmatu okamžitě vyplývá, že je libovolné sjednocení otevřených množin opět otevřenou množinou a že každý konečný průnik otevřených množin je opět otevřená množina. Typickou otevřenou množinou reálných čísel je otevřený interval (a, b) = {x ∈ R, a < x < b}, kde pro hraniční hodnoty máme stejné možnosti jako výše. Jde o ohraničenou množinu právě, když jsou obě meze intervalu konečná čísla. 190 KAPITOLA 5. ZŘÍZENÍ ZOO V případě reálných čísel jsou δ–okolí právě otevřené intervaly o délce 2δ s a uprostřed. V komplexní rovině je δ–okolí kruh o poloměru δ se středem v a. 5.9a 5.15. Ohraničené a kompaktní množiny čísel. Uzvřené a otevřené množiny představují základní pojmy tzv. topologie. Aniž bychom zacházeli do hlubších podrobností a souvislostí, seznámili jsme se právě s topologií reálné přímky a topologií komplexní roviny. Velice užitečné budou i následující pojmy: Ohraničené a kompaktní množiny Množina A racionálních, reálných nebo komplexních čísel se nazývá ohraničená, jestliže exituje kladné reálné číslo r takové, že |z| ≤ r pro všechny čísla z ∈ A. V opačném případě je neohraničená. Ohraničená a uzavřená množina se nazývá kompaktní.Ohraničená a uza Uzavřené konečné intervaly reálných čísel jsou typickým příkladem množin kompaktních. Přidejme ještě několik topologických pojmů, které nám umožní účinné vyjadřování: Vnitřním bodem množiny A reálných nebo komplexních čísel nazveme takový bod, který do A patří i s nějakým svým okolím. Hraniční bodem množiny A rozumíme takový bod, jehož každé okolí má neprázdný průnik jak s A tak s doplňkem R \ A. Hraniční bod tedy může, ale nemusí patřit do samotné množiny A. Otevřené pokrytí množiny A je takový systém otevřených množin Ui, i ∈ I, že jejich sjednocení obsahuje celé A. Izolovaným bodem množiny A rozumíme bod a ∈ A, který má okolí, jehož průnik s A je právě jednobodová množina {a}. 5.10 5.16. Věta. Pro podmnožiny A reálných čísel platí: (1) neprázdná množina A je otevřená, právě když je sjednocením nejvýše spočetného systému otevřených intervalů, (2) každý bod a ∈ A je buď vnitřní nebo hraniční, (3) každý hraniční bod množiny A je buď izolovaným nebo hromadným bodem A, (4) A je kompaktní, právě když každá v ní obsažená nekonečná posloupnost má podposloupnost konvergující k bodu v A, (5) A je kompaktní, právě když každé její otevřené pokrytí obsahuje konečné pokrytí. Důkaz. (1) Zjevně je každá otevřená množina sjednocením nějakých okolí svých bodů, tj. otevřených intervalů. Jde tedy pouze o to, jestli nám jich vždy stačí spočetně mnoho. Zkusme tedy najít „co největší“ intervaly. Řekneme, že body a, b ∈ A jsou v relaci, jestliže celý otevřený interval (min{a, b}, max{a, b}) je podmnožinou v A. To je zjevně relace ekvivalence (otevřený interval (a, a) je prázdná množina a ta je podmnožinou, symetrie relace i tranzitivita jsou zřejmé). 191 KAPITOLA 5. ZŘÍZENÍ ZOO Třídy této ekvivalence budou zjevně intervaly, které budou navíc po dvou disjunktní. Každý z těchto intervalů jistě musí obsahovat nějaké racionální číslo a tyto musí být různé. Všech racionálních čísel je ale spočetně mnoho, proto máme tvrzení dokázané. (2) Přímo z definic vyplývá, že bod nemůže být vnitřní a hraniční zároveň. Nechť tedy a ∈ A není vnitřní. Pak ovšem existuje posloupnost bodů ai /∈ A s hromadným bodem a. Zároveň a patří do každého svého okolí. Proto je a hraniční. (3) Předpokládejme, že a ∈ A je hraniční a není izolovaný. Pak stejně jako v argumentaci předchozího odstavce existují body ai, tentokrát uvnitř A, jejichž hromadným bodem je a. (4) Předpokládejme, že je A kompaktní, tj. uzavřená a ohraničená, a uvažme nějakou nekonečnou posloupnost bodů ai ∈ A. Tato podmnožina má jistě supremum b i infimum a (nebo můžeme zvolit libovolnou horní a dolní závoru množiny A). Rozdělme nyní interval [a, b] přesně na dvě poloviny [a, 1 2 (b − a)] a [1 2 (b − a), b]. V alespoň jedné z nich musí být nekonečně mnoho prvků ai. Vyberme takovou polovinu, jeden z prvků v ní obsažených a následně tento interval opět rozdělme uvažovaný interval na poloviny. Znovu vybereme tu polovinu, kde je nekonečně mnoho prvků posloupnosti a vybereme si jeden z nich. Tímto způsobem dostaneme posloupnost, která bude Cauchyovská (dokažte si detailně – vyžaduje si jen pozorné hraní s odhady, podobně jako výše). O Cauchyovských posloupnostech ovšem už víme, že mají vždy hromadné body nebo jsou konstantní až na konečně mnoho výjimek. Existuje tedy podposloupnost s námi hledanou limitou. Z uzavřenosti A zase vyplývá, že námi nalezený bod musí opět ležet v A. Opačně, jestliže každá v A obsažená nekonečná podmnožina má hromadný bod v A, znamená to, že všechny hromadné body jsou v A a tedy je A uzavřená. Pokud by nebyla množina A zároveň ohraničená, uměli bychom najít posloupnost stále rostoucí nebo klesající s rozdíly dvou po sobě jdoucích čísel třeba alespoň 1. Taková posloupnost bodů z A ale nemůže mít hromadný bod vůbec. (5) Nejprve se věnujme snadnější implikaci, tj. předpokládejme, že z každého otevřeného pokrytí lze vybrat konečné a dokazujme, že pak A je uzavřená i ohraničená. Jistě lze A pokrýt spočetným systémem intervalů In = (n − 2, n + 2), n ∈ Z, a jakýkoliv výběr konečně mnoha z nich říká, že je množina A ohraničená. Předpokládejme nyní, že a ∈ R \ A je hromadným bodem posloupnosti ai ∈ A a předpokládejme rovnou, že |a − an| < 1 n (jinak bychom mohli vybrat takovou podposloupnost). Množiny Jn = R \ [a − 1 n , a + 1 n ] 192 KAPITOLA 5. ZŘÍZENÍ ZOO pro všechny n ∈ N, n > 0, jsou sjednocení dvou otevřených intervalů a jistě také pokrývají naši množinu A. Protože je možné vybrat konečné pokrytí A, bod a je uvnitř doplňku R \ A včetně nějakého svého okolí a není tedy hromadným bodem. Proto musí být všechny hromadné body A opět v A a tato množina je i uzavřená. Opačný směr důkazu je založený na existenci a vlastnostech suprema. Předpokládejme, že je A kompaktní a že je dáno nějaké její otevřené pokrytí C. Z předchozího je zjevné, že v A existují největší a nejmenší prvek, které jsou zároveň rovny b = sup A a a = inf A. Označme si teď „nejzašší mez“, pro kterou ještě půjde konečné pokrytí z C vybrat, tj. definujeme množinu B = {x ∈ [a, b], existuje výběr konečného pokrytí [a, x] ∩ A}. Evidentně a ∈ B, jde tedy o neprázdnou zhora ohraničenou množinu a existuje proto c = sup B. Jde nám o to dokázat, že ve skutečnosti musí být c = b. Argumentace je trochu nepřehledná, dokud si ji nenačrtneme na obrázku, podstata je ale snadná: Víme, že a ≤ c ≤ b, předpokládejme tedy chvíli, že c < b. Protože je R \ A otevřená, pro c /∈ A existuje okolí bodu c obsažené v [a, b] a zároveň disjunktní s A. To by ale vylučovalo možnost c = sup B. Zbývá tedy v takovém případě c ∈ A a tedy je i nějaké okolí O bodu c v otevřeném pokrytí C. Zvolme si body p < c < q v O. Opět nyní bude existovat konečné pokrytí pro [a, q] ∩ A. To ale značí, že q > c leží v B, což není možné. Původní volba c < b tedy vedla ke sporu, což dokazuje požadovanou rovnost b = c. Nyní ale s pomocí okolí b, které patří do C umíme najít konečné pokrytí v C pro celé A. 5.11 5.17. Limity funkcí a posloupností. Pro diskusi limit je vhodné rozšířit množinu reálných čísel R o dvě nekonečné hodnoty ±∞, tak jak jsme to už dělali při označování intervalů. Okolím nekonečna rozumíme interval (a, ∞), resp. (−∞, a) je okolí −∞. Pojem hromadného bodu množin rozšiřujeme tak, že ∞ je hromadným bodem množiny A ⊂ R jestliže každé okolí ∞ s ní má neprázdný průnik, tj. jestliže je A zhora neohraničená. Obdobně pro −∞. Hovoříme o nevlastních hromadných bodech množiny A. „počítání se nekonečny“ Zavádíme i pravidla pro počítání s formálně přidanými hodnotami ±∞ a pro libovolná „konečná“ čísla a ∈ R: a + ∞ = ∞ a − ∞ = −∞ a · ∞ = ∞, je-li a > 0 a · ∞ = −∞, je-li a < 0a · ∞ Následující definice pokrývá mnoho případů limitních procesů a bude třeba ji zvládnout dokonale. Jednotlivými případy se budeme podrobně zabývat v zápětí. 193 KAPITOLA 5. ZŘÍZENÍ ZOO Reálné a komplexní limity Definice. Uvažme libovolnou podmnožinu A ⊂ R a reálnou funkci f : A → R, případně komplexní funkci f : A → C, definovanou na A. Uvažme dále hromadný bod x0 množiny A (tj. buď reálné číslo nebo případně ±∞). Říkáme, že f má v x0 limitu a ∈ R (nebo a ∈ C) a píšeme lim x→x0 f (x) = a, jestliže pro každé okolí O(a) bodu a lze najít okolí O(x0) bodu x0 takové, že pro všechny x ∈ A ∩ (O(x0) \ {x0}) je f (x) ∈ O(a). Limita reálné funkce se nazývá nevlastní, jestliže je a = ±∞, V opačném případě se nazává vlastní.astní. Je důležité si všimnout, že hodnota f v bodě x0 v definici nevystupuje a f v tomto hromadném bodě vůbec nemusí být definována (a v případě nevlastního hromadného bodu ani nemůže)! Také je zřejmé, že nevlastní limity komplexních funkcí nejsou definovány. 5.12 5.18. Nejčastější varianty definičních oborů. Naše definice limity pokrývá zdánlivě velice rozdílné koncepty: (1) Limity posloupností. Jestliže je A = N, tj. funkce f je definována pouze pro přirozená čísla, hovoříme o limitách posloupností reálných nebo komplexních čísel. Jediným hromadným bodem definičního oboru A je pak ∞ a zpravidla píšeme hodnoty poslounosti f (n) = an a limitu ve tvaru lim n→∞ an = a. Podle definice to pak znamená, že pro každé okolí O(a) limitní hodnoty a existuje index N ∈ N takový, že an ∈ O(a) pro všechny n ≥ N. Ve skutečnosti jsme tedy v tomto speciálním případě přeformulovali definici konvergence posloupnosti (viz 5.12). Přidali jsme pouze možnost nevlastních limit. Říkáme také, že posloupnost an konverguje k a. Přímo z naší definice pro komplexní hodnoty je opět vidět, že komplexní posloupnost má limitu a, právě když reálné části ai konvergují k re a a zároveň imaginární části konvergují k im a. (2) Limita funkce ve vnitřním bodě intervalu. Jestliže je f definována na intervalu A = (a, b) a x0 je vnitřním bodem intervalu, hovoříme o limitě funkce ve vnitřním bodě jejího definičního oboru. Podívejme se, proč je důležité v definici požadovat f (x) ∈ O(a) pouze pro body x = x0 i v tomto případě. Vezměme jako příklad funkci f : R → R f (x) = 0 je-li x = 0 1 je-li x = 0. Pak zjevně limita v nule je dobře definována a v souladu s naším očekáváním bude limx→0 = 0, přestože f (0) = 1 do malých okolí limitní hodnoty 0 nepatří. 194 KAPITOLA 5. ZŘÍZENÍ ZOO (3) Limity zprava a zleva. Je-li A = [a, b] ohraničený interval a x0 = a nebo x0 = b, hovoříme o limitě zprava, resp. zleva, v hraničním bodě definičního oboru funkce f . Jestliže je ale bod x0 vnitřním bodem, můžeme pro účely výpočtu limity definiční obor zúžit na [x0, b] nebo [a, x0]. Výsledným limitám pak říkáme limita zprava, resp. limita zleva pro funkci f v bodě x0. Označujeme ji výrazem limx→x+ 0 f (x), resp. limx→x− 0 f (x). Jako příklad nám může sloužit limita zprava a zleva v x0 = 0 pro Heavisideovu funkci h z úvodu této části. Evidentně je lim x→0+ h(x) = 1, lim x→0− h(x) = 0. Limita limx→0 f (x) přitom neexistuje. Přímo z našich definic je zjevné, že limita ve vnitřním bodu definičního oboru libovolné reálné funkce f existuje, právě když existují limity zprava i zleva a jsou si rovny. 5.12a 5.19. Další příklady limit. (1) Limita komplexní funkce f : A → C existuje tehdy a jen tehdy, jestliže existují limity její reálné a imaginární části. V takovém případě je pak lim x→x0 f (x) = lim x→x0 (re f (x)) + i lim x→x0 (im f (x)). Důkaz je přímočarý a vychází přímo z definice vzdáleností a okolí bodů v komplexní rovině. Skutečně, příslušnost do δ–okolí komplexní hodnoty z je zajištěna pomocí reálných (1/ √ 2)δ–okolí reálné a imaginární složky z. Odtud již tvrzení bezprostředně vyplývá. (2) Nechť f je reálný nebo komplexní polynom. Pak pro každý bod x ∈ R je lim x→x0 f (x) = f (x0). Skutečně, je-li f (x) = anxn + · · · + a0, pak roznásobením (x0 + δ)k = xk 0 + kδxk−1 0 + · · · + δk a dosazením pro k = 0, . . . , n vidíme, že volbou dostatečně malého δ se hodnotou libovolně blízko přiblížíme f (x0). (3) Uvažme nyní docela ošklivou funkci definovanou na celé reálné přímce f (x) = 1 je-li x ∈ Q 0 jestliže x /∈ Q. Přímo z deifnice je zjevné, že tato funkce nemá limitu v žádném bodě (dokonce ani zleva nebo zprava). (4) Následující funkce je ještě záludnější, než jsme viděli v předchozím případě. Funkce f : R → R je definována takto: f (x) = 1 q jestliže x = p q ∈ Q, p a q nesoudělná 0 jestliže x /∈ Q Zjevně tato funkce má limitu ve všech iracionálních reálných bodech x a to rovnu své hodnotě f (x) = 0, zatímco v racionálních bodech neexistují ani jednostranné limity zprava a zleva. Důkaz přenecháváme jako cvičení. 195 KAPITOLA 5. ZŘÍZENÍ ZOO 5.12b 5.20. Věta (O třech limitách). Buďte f , g, h reálné funkce se shodným definičním oborem A a takové, že existuje okolí hromadného bodu x0 ∈ R definičního oboru, kde platí f (x) ≤ g(x) ≤ h(x). Pak pokud existují limity lim x→x0 f (x) = f0, lim x→x0 h(x) = h0 a navíc f0 = h0, pak také existuje limita lim x→x0 g(x) = g0 a platí g0 = f0 = h0. Důkaz. Z definice limity, pro libovolné ε > 0 existuje okolí O bodu x0, ve kterém jsou pro x = x0 hodnoty f (x), h(x) ∈ (g0 − ε, g0 + ε). Z podmínky f (x) ≤ g(x) ≤ h(x) vyplývá, že i g(x) ∈ (g0 − ε, g0 + ε), tedy limx→x0 g(x) = g0. Drobnou modifikací předchozího postupu si čtenář doplní i argumentaci pro nevlastní hodnoty limit. Všimněme si, že věta dává možnost výpočtu limit pro všechny typy diskutované výše, tj. limity posloupností, limity funkcí ve vnitřních bodech, jednostranné limity atd. 5.13 5.21. Věta. Nechť A ⊂ R je definiční obor reálných nebo komplexních funkcí f a g, x0 nechť je hromadný bod A a existují limity lim x→x0 f (x) = a ∈ R, lim x→x0 g(x) = b ∈ R. Potom: (1) limita a je určena jednoznačně, (2) limita součtu f + g existuje a platí lim x→x0 (f (x) + g(x)) = a + b, (3) limita součinu f · g existuje a platí lim x→x0 (f (x) · g(x)) = a · b, (4) pokud navíc b = 0, pak limita podílu f/g existuje a platí lim x→x0 f (x) g(x) = a b . Důkaz. (1) Předpokládejme, že a a a jsou dvě hodnoty limity limx→x0 f (x). Pokud je a = a , pak existují disjunktní okolí O(a) a O(a ). Pro dostatečně malá okolí x0 ale mají hodnoty f ležet v obou naráz, což je spor. Proto je a = a . (2) Zvolme si nějaké okolí a + b, třeba O2 (a + b). Pro dostatečně malé okolí x0 a x = x0 bude jak f (x), tak g(x) v –okolích bodů a a b. Proto jejich součet bude v 2 –okolí kýžené hodnoty a + b. Tím je důkaz ukončen pro konečné limity, případ nevlastních limit je zcela obdobný. (3) Podobně postupujeme u součinu s O 2 (ab). Pro malá okolí x0 se nám hodnoty f i g trefí do –okolí hodnot a a b. Proto jejich součin bude v požadovaném 2 –okolí. (4) Podobný postup ponechán jako cvičení. 196 KAPITOLA 5. ZŘÍZENÍ ZOO Poznámka. Podrobnějším sledováním důkazů jednotlivých bodů věty můžeme její tvrzení rozšířit i na některé nekonečné hodnoty limit: V prvém případě je zapotřebí, aby buď alespoň jedna z limit byla konečná nebo aby obě měly stejné znaménko. Pak opět platí že limita součtu je součet limit s konvencemi z 5.17. Případ „∞ − ∞“ ale není zahrnut. V druhém případě může být jedna z limit nekonečná a druhá nenulová. Pak opět platí, že limita součinu je součin limit. Případ „0 · (±∞)“ není ale zahrnut. V případě podílu může být a ∈ R a b = ±∞, kdy výsledek limity bude nula, nebo a = ±∞ a b ∈ R, kde výsledek bude ±∞ podle znamének čitatele a jmenovatele. Případ „∞ ∞ “ není zahrnut. Zdůrazněme, že naše věta jako speciální případ pokrývá také odpovídající tvrzení o konvergenci posloupností i o limitách zprava a zleva funkcí definovaných na intervalu. Pro úvahy o limitách bývá technicky užitečný i následující jednoduchý důsledek definic, který uvádí do souvislosti limity posloupností a funkcí obecně. 5.13a 5.22. Důsledek. Uvažme reálnou nebo komplexní funkci f definovanou na množině A ⊂ R a hromadný bod x0 množiny A. Funkce f má v bodě x0 limitu y právě, když pro každou posloupnost bodů xn ∈ A konvergující k x0 a různých od x0 má i posloupnost hodnot f (xn) limitu y. Důkaz. Předpokládejme nejprve, že limita f v bodě x0 je skutečně y. Pak pro libovolné okolí V bodu y musí existovat okolí V bodu x0 takové, že pro všechny x ∈ V ∩A, x = x0, je f (x) ∈ U. Pro každou posloupnost xn → x0 bodů různých od x0 ale budou pro všechna n větší než vhodné N i všechny body xn ∈ V . Budou tedy posloupnosti hodnot f (xn) konvergovat k hodnotě y. Předpokládejme naopak, že funkce f nekonverguje k y při x → x0. Pak pro nějaké okolí U hodnoty y existuje posloupnost bodů xm = x0 v A, které jsou bližší k x0 než 1/m a přitom hodnota f (xm) nepatří do U. Tím jsme zkonstruovali posloupnost bodů z A různých od x0, pro které hodnoty f (xn) nekonvergují k y a důkaz je ukončen. Spojitost funkcí 5.14 Definice. Nyní máme nachystány nástroje na korektní formulaci vlastnosti spojitosti, se kterou jsme dříve intuitivně nakládali u polynomů. Nechť f je reálná nebo komplexní funkce definovaná na intervalu A ⊂ R. Říkáme, že f je spojitá v bodě x0 ∈ A, jestliže je lim x→x0 f (x) = f (x0). Funkce f je spojitá na A, jestliže je spojitá ve ve všech bodech x0 ∈ A.x0 ∈ A. 197 KAPITOLA 5. ZŘÍZENÍ ZOO Všiměme si, že pro hraniční body intervalu A říká naše definice, že f v nich má hodnotu rovnou limitě zleva, resp. zprava. Říkáme, že je v takovém bodě spojitá zprava, resp. zleva. Již jsme také viděli, že každý polynom je spojitou funkcí na celém R, viz 5.19(2). Potkali jsme také funkci, která je spojitá v iracionálních reálných číslech a nemá žádné limity v číslech racionálních, viz 5.19(4). Z předchozí věty 5.21 o vlastnostech limit okamžitě vyplývá většina následujících tvrzení 5.14a 5.23. Věta. Nechť f a g jsou spojité funkce na intervalu A. Pak (1) součet f + g je spojitá funkce (2) součin f · g je spojitá funkce (3) pokud navíc g(x0) = 0, pak podíl f/g je dobře definován v nějakém okolí x0 a je spojitý v x0. (4) pokud spojitá funkce h je definována na okolí hodnoty f (x0), pak složená funkce h ◦ f je definována na okolí bodu x0 a je v bodě x0 spojitá. Důkaz. Tvrzení (1) a (2) jsou zřejmá, doplnit důkaz potřebujeme u tvrzení (3). Jestliže je g(x0) = 0, pak také celé –okolí čísla g(x0) neobsahuje nulu pro dostatečně malé > 0. Ze spojitosti g pak vyplývá, že na dostatečně malém δ–okolí bodu x0 bude g nenulové a podíl f/g tam bude tedy dobře definován. Pak bude ovšem i spojitý v x0 podle předchozí věty. (4) Zvolme nějaké okolí O hodnoty h(f (x0)). Ze spojitosti h k němu existuje okolí O bodu f (x0), které je celé zobrazeno funkcí h do O. Do tohoto okolí O spojité zobrazení f zobrazí dostatečně malé okolí bodu x0. To je ale právě definiční vlastnost spojitosti a důkaz je ukončen. Nyní si vcelku snadno můžeme odvodit zásadní souvislosti spojitých zobrazení a topologie reálných čísel: 5.15 5.24. Věta. Nechť f : R → R je spojitá funkce. Pak (1) vzor f −1 (U) každé otevřené množiny je otevřená množina, (2) vzor f −1 (W) každé uzavřené množiny je uzavřená množina, (3) obraz f (K) každé kompaktní množiny je kompaktní množina, (4) na libovolné kompaktní množině K dosahuje spojité zobrazení maxima a minima. Důkaz. (1) Uvažme nějaký bod x0 ∈ f −1 (U). Nějaké okolí O hodnoty f (x0) je celé v U, protože je U otevřená. Pak ovšem existuje okolí O bodu x0, které se celé zobrazí do O, patří tedy do vzoru. Každý bod vzoru je tedy vnitřní a tím je důkaz ukončený. 198 KAPITOLA 5. ZŘÍZENÍ ZOO (2) Uvažme nějaký hromadný bod x0 vzoru f −1 (W) a nějakou posloupnost xi, f (xi) ∈ W, která k němu konverguje. Ze spojitosti f nyní zjevně vyplývá, že f (xi) konverguje k f (x0), a protože je W uzavřená, musí i f (x0) ∈ W. Zřejmě jsou tedy všechny hromadné body vzoru W ve W také obsa- ženy. (3) Zvolme libovolné otevřené pokrytí f (K). Vzory jednotlivých intervalů budou sjednoceními otevřených intervalů a tedy také vytvoří pokrytí množiny K. Z něho lze vybrat konečné pokrytí a proto nám stačilo konečně mnoho odpovídajících obrazů k pokrytí původní množiny f (K). (4) Protože je obrazem kompaktní množiny opět kompaktní množina, musí být obraz ohraničený a zároveň musí obsahovat svoje supremum i infimum. Odtud ale vyplývá, že tyto musí být zároveň maximem a minimem hodnot. 5.16 5.25. Důsledek. Nechť f : R → R je spojitá. Potom (1) obraz každého intervalu je opět interval (2) f na uzavřeném intervalu [a, b] nabývá všech hodnot mezi svou maximální a minimální hodnotou. Důkaz. (1) Uvažme nějaký interval A (a ponechme stranou, jestli je A uzavřený nebo otevřený, ať už zleva nebo zprava) a předpokládejme, že existuje bod y ∈ R takový, že f (A) obsahuje body menší i větší než y, ale y /∈ f (A). Znamená to tedy, že pro otevřené množiny B1 = (−∞, y) a B2 = (y, ∞) jejich vzory A1 = f −1 (B1) a A2 = f −1 (B2) pokrývají A. Tyto množiny jsou přitom opět otevřené, jsou disjunktní a obě mají neprázdný průnik s A. Nutně tedy musí existovat bod x ∈ A, který neleží v B1, je ale jejím hromadným bodem. Musí však ležet v B2 a to u disjunktních otevřených množin není možné. Dokázali jsme tedy, že pokud nějaký bod y nepatří do obrazu intervalu, musí být všechny hodnoty buď zároveň větší nebo zároveň menší. Odtud vyplývá, že obrazem bude opět interval. Všimněme si, že jeho krajní body mohou a nemusí do obrazu patřit. (2) Toto tvrzení je přímým důsledkem předchozího, protože obrazem uzavřeného intervalu musí být opět uzavřený interval. Na závěr naší úvodní diskuse spojitosti funkcí uvedeme ještě tvrzení, která jsou užitečným nástrojem při počítání limit. 5.16a 5.26. Věta (O limitě složené funkce). Nechť f , g : R → R jsou funkce, limx→a f (x) = b. (1) Pokud je g je spojitá v b, potom lim x→a g (f (x)) = g lim x→a f (x) = g(b). (2) Jestliže existuje limita limy→b g(y), potom lim x→a g (f (x)) = lim y→b g(y). Důkaz. Je podobný jako ve větě 5.23(4). Z existence limity g v bodě b vyplývá, že pro jakékoliv okolí V této limity umíme najít dostatečně malé okolí U bodu b, na kterém jsou 199 KAPITOLA 5. ZŘÍZENÍ ZOO už hodnoty g ve V . Pokud ale f má bod b jako limitu v bodě a, pak se do U trefíme všemi hodnotami f pro dostatečně malé okolí a, což ověřuje druhé tvrzení. První pak je přímým důsledkem druhého. 5.17 5.27. Kdo už je v ZOO. Začali jsme budovat náš zvířetník funkcí s polynomy a s funkcemi, které se z nich dají vyrobit „po částech“. Zároveň jsme dovodili spoustu vlastností pro patrně obrovskou třídu spojitých funkcí, nemáme ale zatím moc prakticky zvladatelných příkladů. Jako další si prohlédneme pořádněji podíly polynomů. Nechť f a g jsou dva polynomy, které mohou mít i komplexní hodnoty (tj. připouštíme výrazy anxn + · · · + a0 s komplexními ai ∈ C, ale dosazujeme jen reálné hodnoty za x). Funkce h : R \ {x ∈ R, g(x) = 0} → C, h(x) = f (x) g(x) je dobře definována ve všech reálných bodech kromě kořenů polynomu g. Takové funkce nazýváme racionální funkce. Z věty 5.23 vyplývá, že racionální funkce jsou spojité ve všech bodech svého definičního oboru. V bodech, kde definovány nejsou mohou mít • konečnou limitu, když jde o společný kořen obou polynomů f a g (v tomto případě rozšířením jejich definice o limitní hodnotu v tomto bodě dostaneme funkci i v tomto bodě spojitou) • nekonečnou limitu, když limity zprava a zleva v tomto bodě jsou stejné • různé nekonečné limity zprava a zleva. Názorně je možné tuto situaci vidět na obrázku, který ukazuje hodnoty funkce h(x) = (x − 0.05a)(x − 2 − 0.2a)(x − 5) x(x − 2)(x − 4) pro hodnoty a = 0 (obrázek vlevo tedy vlastně zobrazuje racionální funkci (x − 5)/(x − 4)) a pro a = 5/3. y x 6 5 4 2 4 0 -2 3 -4 -6 210-1 a = 0. y x 6 5 4 2 4 0 -2 3 -4 -6 210-1 a = 1.6667 5.17a 200 KAPITOLA 5. ZŘÍZENÍ ZOO 5.28. Funkce mocninné a exponenciální. Polynomy jsou pomocí sčítání a násobení skaláry seskládány z jednoduchých mocninných funkcí x → xn s přirozených číslem n = 0, 1, 2, . . . . Samozřejmý smysl má také funkce x → x−1 pro všechny x = 0. Tuto definici teď rozšíříme na obecnou mocninnou funkci xa s libovolným a ∈ R. Budeme vycházet z vlastností mocnin a odmocnin, které patrně považujeme za samozřejmé. Pro záporné celé číslo −a proto definujeme x−a = (xa )−1 = (x−1 )a . Dále jistě chceme, aby ze vztahu bn = x pro n ∈ N vyplývalo že b je n–tou odmocninou z x, tj. b = x 1 n . Je třeba ale ověřit, že taková b skutečně existují. Z bionomického rozkladu mocniny dvojčlenu je vidět, že funkce y → yn je pro y > 0 stále rostoucí. Předpokládejme x > 0 a uvažujme množinu B = {y ∈ R, y > 0, yn ≤ x}. To je zřejmě zhora ohraničená množina a zvolíme b = sup B. O mocninné funkci s přirozeným n již víme, že je to funkce spojitá, snadno tedy ověříme. že skutečně platí bn = x. Skutečně, určitě je bn ≤ x a kdyby platila ostrá nerovnost, našli bychom jistě i y s hodnotou b < yn < x, což nutně znamená i b < y a tedy jde o spor s definicí suprema. Konečně, pro hodnoty a ∈ R a x > 1, si povšimněme, že jde pro racionální a o striktně rostoucí výraz (pro větší a je vždy větší výsledek). Proto klademe xa = sup{xy , y ∈ Q, y ≤ a}. Pro 0 < x < 1 buď definujeme analogicky (je třeba si jen pohrát s nerovnítky) nebo klademe přímo xa = (1 x )−a . Pro x = 1 je pak 1a = 1 pro libovolné a. Obecnou mocninnou funkci x → xa máme tedy dobře definovanou pro všechny x ∈ [0, ∞) a a ∈ R. Naši konstrukci ale můžeme také číst následujícím způsobem: Pro každé pevné reálné c > 0 existuje dobře definovaná funkce na celém R, y → cy . Této funkci říkáme exponenciální funkce o základu c. Vlastnosti, které jsme použili při definici mocninné a exponenciální funkce f (y) = cy , tj. c = f (1), lze shrnout do jediné rovnosti pro libovolné reálné kladné x a y: f (x + y) = f (x) · f (y) společně s požadavkem spojitosti. Skutečně, pro y = 0 dostáváme z této rovnosti f (0) = 1, odtud pak 1 = f (0) = f (x−x) = f (x)·(f (x))−1 a konečně pro přirozené n je zjevně f (nx) = (f (x))n . Takto jsme již jednoznačně určili hodnoty xa pro všechny x > 0 a a ∈ Q a požadavkem spojitosti byla již funkce určena všude. Zejména tedy pro exponenciální funkci platí známé vztahy e5.3ae5.3a (5.5) ax · ay = ax+y , (ax )y = ax·y . Na obrázcích vidíme funkce x → ax a x → xb pro jednu konkrétní hodnotu a = 2.5167 a b = 4.5833. 201 KAPITOLA 5. ZŘÍZENÍ ZOO 20 0 0 -2-4 y b 100 4 80 60 2 40 a = 2.5167 a 32,5 y 2 100 80 1,5 60 40 1 20 0 0,5 b = 4.5833 5.17b 5.29. Logaritmické funkce. Viděli jsme právě, že exponenciální funkce f (x) = ax je pro a > 1 stále rostoucí a pro 0 < a < 1 je stále klesající. V obou případech tedy existuje k f (x) funkce inverzní f −1 (x) kterou nazýváme logaritmickou funkcí se základem a. Píšeme lna(x) a definiční vztah tedy je ln(ax ) = x. Rovnosti (5.5) jsou proto ekvivalentní vztahům lna(x · y) = lna(x) + lna(y), lna(xy ) = y · lna(x). Logaritmické funkce jsou definovány jen pro kladné hodnoty argumentu a jsou pro základ a > 1 rostoucí, pro základ 0 < a < 1 klesající na celém definičním oboru. Pro každé a je lna(1) = 0. Brzy uvidíme, že obzvlášť důležitou hodnotou pro a je tzv. Eulerovo číslo e, viz odstavec 5.41. Funkci lne(x) nazýváme přirozeným logaritmem a základ e v označení vynecháváme. tj. píšeme prostě ln(x). 3. Derivace U polynomů jsme již v odstavci 5.6 diskutovali, jak popisovat jednoduše velikost růstu hodnot polynomu kolem daného bodu jeho definičního oboru. Tehdy jsme pozorovali podíl (5.2), který vyjadřoval směrnici sečny mezi body [x, f (x)] ∈ R2 a [x + x, f (x + x)] ∈ R2 pro (malý) přírůstek x nezávisle proměnné. Tehdejší úvaha funguje zrovna stejně pro libovolnou reálnou nebo komplexní funkci f , jen musíme místo intuitivního „zmenšování“ přírůstku x pracovat s pojmem limity. Uvádíme definici pro vlastní i nevlastní derivace, tj. připouštíme i nekonečné hodnoty. Všimněte si, že na rozdíl od limity funkce, u derivace v daném bodě x0 je nutné, aby byla sama funkce v tomto bodě definovaná. Derivace funkce jedné reálné proměnné 5.18 5.30. Definice. Nechť f je reálná nebo komplexní funkce definovaná na intervalu A ⊂ R a x0 ∈ A. Jestliže existuje limita lim x→x0 f (x) − f (x0) x − x0 = a pak řídáme, že f má v bodě x0 derivaci a. Hodnotu derivace zapisujeme jako f (x0) nebo df dx (x0), případně a = d dx f (x0). 202 KAPITOLA 5. ZŘÍZENÍ ZOO Derivace reálné funkce je vlastní, resp. nevlastní, když je takovou příslušná limita. Jednostranné derivace (tj. derivaci zprava a zleva) definujeme zcela stejně pomocí limity zprava a zleva.nujeme zcela stejně p S derivacemi se vcelku snadno počítá, dá nám ale dost práce korektně odvodit derivace i některých z funkcí, které už v našem zvěřinci máme. Proto s předstihem vsunujeme do textu souhrnnou tabulku, jak derivace pro několik z nich vychází. V posledním sloupci je odkaz na odstavec, kde se dá údaj skutečně i s úplným výkladem najít. Všimněme si také, že inverzní funkce k řadě z našich funkcí sice neumíme přímo vyjádřit elementárním způsobem, přesto ale budeme umět počítat jejich derivace, viz. 5.34 Některé derivace funkcí funkce definiční obor derivace polynomy f (x) celé R f (x) je opět po- lynom 5.6 kubické splajny h(x) celé R h (x) je opět splajn 5.9 racionální funkce f (x)/g(x) celé R kromě kořenů jmenovatele g racionální funkce: f (x)g(x)−f (x)g (x) g(x)2 5.33 mocninné funkce f (x) = xa interval (0, ∞) f (x) = axa−1 ?? exponenciála f (x) = ax , a > 0, a = 1 celé R f (x) = ln(a) · ax ?? logaritmus f (x) = lna(x), a > 0, a = 1 interval (0, ∞) f (x) = (ln(a))−1 · 1 x ?? a > 0, a = 1 Z formulace definice lze očekávat, že f (x0) bude umožňovat dobře aproximovat danou funkci pomocí přímky y = f (x0) + f (x0)(x − x0). Takto lze snad vnímat následující lemma, které říká, že nahrazením konstantního koeficientu f (x0) ve vyjádření přímky spojitou funkcí dostaneme přímo hodnoty f . Odchylka hodnot ψ(x) na okolí bodu x0 od hodnoty ψ(x0) pak přímo říká, jak se liší směrnice sečen a tečny v bodě x0. Lemma. Reálná nebo komplexní funkce má v bodě x0 vlastní derivaci, právě když existuje na nějakém okolí O(x0) funkce ψ spojitá v x0 a taková, že pro všechny x ∈ O(x0) platí f (x) = f (x0) + ψ(x)(x − x0). Navíc pak vždy ψ(x0) = f (x0) a sama funkce f je v bodě x0 spojitá. 203 KAPITOLA 5. ZŘÍZENÍ ZOO Důkaz. Nejprve předpokládejme, že f (x0) je vlastní derivace. Pokud má ψ existovat, má jistě pro všechny x ∈ O \ {x0} tvar ψ(x) = (f (x) − f (x0))/(x − x0). V bodě x0 naopak definujme hodnotu derivací f (x0). Pak jistě lim x→x0 ψ(x) = f (x0) = ψ(x0) jak je požadováno. Naopak, jestliže taková funkce ψ existuje, tentýž postup vypočte její limitu v x0. Proto existuje i f (x0) a je ψ(x0) rovna. Z vyjádření f pomocí spojitých funkcí je zřejmé, že je sama spojitá v bodě x0. 5.18a 5.31. Geometrický význam derivace. Předchozí lemma lze názorně vysvětlit geometricky a tím popsat smysl derivace. Říká totiž, že na grafu funkce y = f (x), tj. na příslušné křivce v rovině se souřadnicemi x a y, poznáme, zda existuje derivace podle toho, jestli se spojitě mění hodnota směrnice sečny procházející body [x0, f (x0)] a [x, f (x)]. Pokud ano, pak limitní hodnota této směrnice je hodnotou derivace. Rostoucí a klesající funkce Důsledek. Má-li reálná funkce f v bodě x0 ∈ R derivaci f (x0) > 0, pak pro nějaké okolí O(x0) platí f (b) > f (a) pro všechny body a, b ∈ O(x0), b > a. Je-li derivace f (x0) < 0, pak naopak pro nějaké okolí O(x0) platí f (b) < f (a) pro všechny body a, b ∈ O(x0), b > a. Důkaz. Uvažme prvý případ. Pak podle předchozího lematu platí f (x) = f (x0) + ψ(x)(x − x0) a ψ(x0) > 0. Protože je ale ψ v x0 spojitá, musí existovat okolí O(x0), na kterém bude ψ(x) > 0. Pak ale s rostoucím x nutně poroste i hodnota f (x). Stejná argumentace ověří i tvrzení se zápornou derivací. Funkce, které mají vlastnost f (b) > f (a) kdykoliv b > a pro nějaké okolí bodu x0 se nazývají rostoucí v bodě x0. Funkce rostoucí ve všech bodech nějakého intervalu se nazývá rostoucí na intervalu. Podobně je funkce klesající v bodu, resp. klesající na intervalu, jestliže f (b) < f (a) kdykoliv je a < b. Náš důsledek tedy říká, že funkce která má v bodě nenulovou konečnou derivaci je v tomto bodě buď rostoucí nebo klesající podle znaménka této derivace. Jako ilustraci jednoduchého použití vztahu derivace k růstu hodnot funkce se podívejme na existenci inverzí polynomů. Protože polynomy jen zřídka jsou výhradně rostoucí nebo klesající funkce, nemůžeme očekávat, že by k nim existovaly globálně definované inverzní funkce. Naopak ovšem inverzní funkce k polynomu f existují na každém intervalu 204 KAPITOLA 5. ZŘÍZENÍ ZOO mezi kořeny derivace f , tj. tam kde derivace polynomu je nenulová a nemění znaménko. Tyto inverzní funkce nebudou nikdy polynomy, až na případ polynomů stupně jedna, kdy z rovnice y = ax + b spočteme přímo x = 1 a (y − b). U polynomu druhého řádu obdobně y = ax2 + bx + c vede k formuli x = −b ± b2 − 4a(c − y) 2a , a inverze tedy existuje (a je dána touto formulí) jen pro x na intervalech (−∞, − b 2a ), (− b 2a , ∞). Pro práci s inverzními funkcemi k polynomům nevystačíme s dosavadními funkcemi a dostáváme v našem zvířetníku nové přírůstky. 5.19 5.32. Pravidla pro počítání derivací. Uveďme si nyní několik základních tvrzení o výpočtech derivací. Říkají nám, jak dobře se snáší operace derivování s algebraickými operacemi sčítání a násobení na reálných nebo komplexních funkcích. Poslední z pravidel pak umožňuje efektivní výpočet derivace složených funkcí a říkává se mu „chain rule“. Intuitivně jim můžeme všem velice snadno rozumět, když si derivaci funkce y = f (x) představíme jako podíl přírůstků závislé proměnné y a nezávislé proměnné x: f = y x . Samozřejmě pak při y = h(x) = f (x) + g(x) je přírůstek y dán součtem přírůstků f a g a přírůstek závislé proměnné zůstává stejný. Je tedy derivace součtu součtem derivací. U součinu musíme být malinko pozornější. Pro y = f (x)g(x) je přírůstek y = f (x + x)g(x + x) − f (x)g(x) = f (x + x)(g(x + x) − g(x)) + (f (x + x) − f (x))g(x) Nyní ale když budeme zmenšovat přírůstek x, jde vlastně o výpočet limity součtu součinů a o tom už víme, že jej lze počítat jako součet součinů limit. Proto z naší formulky lze očkávat pro derivaci součinu fg výraz fg + f g, kterému se říká Leibnitzovo pravidlo. Ještě zajímavější je to pro derivaci složené funkce g = h◦ f , kde definiční obor funkce z = h(y) obsahuje obor hodnot funkce y = f (x). Opět vypsáním přírůstků dostáváme g = z x = z y y x . Můžeme tedy očekávat, že pravidlo pro výpočet bude (h ◦ f ) (x) = h (f (x))f (x). Podáme nyní korektní formulace a důkaz: 205 KAPITOLA 5. ZŘÍZENÍ ZOO Pravidla pro derivování Věta. Nechť f a g jsou reálné nebo komplexní funkce definované na okolí bodu x0 ∈ R a mající v tomto bodě vlastní derivaci. Potom (1) pro každé reálné nebo komplexní číslo c má funkce x → c · f (x) derivaci v x0 a platí (cf ) (x0) = c(f (x0)), (2) funkce f + g má v x0 derivaci a platí (f + g) (x0) = f (x0) + g (x0), (3) funkce f · g má v x0 derivaci a platí (f · g) (x0) = f (x0)g(x0) + f (x0)g (x0). (4) Je-li dále h funkce definovaná na okolí obrazu y0 = f (x0), která má derivaci v bodě y0, má také složená funkce h ◦ f derivaci v bodě x0 a platí (h ◦ f ) (x0) = h (f (x0)) · f (x0).f (x0). Důkaz. (1) a (2) Přímé použití věty o součtech a součinech limit funkcí dává výsledek. (3) Přepíšeme vztah pro podíl přírůstků, který jsme zmínili před formulací věty, takto (fg)(x) − (fg)(x0) x − x0 = f (x) g(x) − g(x0) x − x0 + f (x) − f (x0) x − x0 g(x0). Limita tohoto výrazu pro x → x0 dá právě požadovaný výsledek, protože je funkce f spojitá v x0. (4) Podle lematu 5.30 existují funkce ψ a ϕ spojité v bodech x0 a y0 = f (x0) takové, že h(y) = h(y0)+ϕ(y)(y−y0), f (x) = f (x0)+ψ(x)(x−x0) na nějakých okolích x0 a y0. Navíc pro ně platí ψ(x0) = f (x0) a ϕ(y0) = h (y0). Pak ovšem také platí h(f (x)) − h(f (x0)) = ϕ(f (x))(f (x) − f (x0)) = ϕ(f (x))ψ(x)(x − x0) pro x z okolí bodu x0. Součin ϕ(f (x))ψ(x) je ovšem spojitá funkce v x0 a její hodnota v bodě x0 je právě požadovaná derivace složené funkce, opět podle lemmatu 5.30. Derivace podílu 5.19a 5.33. Důsledek. Nechť f a g jsou reálné funkce, která mají v bodě x0 vlastní derivace a g(x0) = 0. Pak pro funkci h(x) = f (x)(g(x))−1 platí h (x0) = f g (x0) = f (x0)g(x0) − f (x0)g (x0) (g(x0))2 . g(x0)) 206 KAPITOLA 5. ZŘÍZENÍ ZOO Důkaz. Dokážeme si nejprve speciální případ vzorce pro h(x) = x−1 . Přímo z definice derivace dostáváme h (x) = lim x→0 1 x+ x − 1 x x = lim x→0 x − x − x x(x2 + x x) = lim x→0 −1 x2 + x x a z pravidel pro počítání limit okamžitě plyne h (x0) = −x−2 . Nyní pravidlo pro derivaci složené funkce říká, že (g−1 ) = −g−2 · g , a konečně pravidlo pro derivaci součinu nám dává právě (f/g) = (f · g−1 ) = f g−1 − fg−2 g = f g − gf g2 . 5.20 5.34. Derivace inverzních funkcí. V odstavci 1.36 jsme při obecné diskusi relací a zobrazení formulovali pojem inverzní funkce. Pokud k dané funkci f : R → R inverzní funkce f −1 existuje (nezaměňujme značení s funkcí x → (f (x))−1 ), pak je dána jednoznačně kterýmkoliv ze vztahů f −1 ◦ f = idR, f ◦ f −1 = idR, a druhý již pak platí také. Pokud je f definováno na podmnožině A ⊂ R a f (A) = B, je existence f −1 podmíněna stejnými vztahy s identickými zobrazeními idA resp. idB na pravých stranách. Pokud bychom věděli, že pro diferencovatelnou funkci f je i f −1 diferencovatelná, pravidlo pro derivaci složené funkce nám okamžitě říká 1 = (id) (x) = (f −1 ◦ f ) (x) = (f −1 ) (f (x)) · f (x) a tedy pak přímo víme vzorec (zjevně f (x) v takovém případě nemůže být nulové) Derivace inverzní funkce e5.5e5.5 (5.6) (f −1 ) (f (x)) = 1 f (x) . To dobře odpovídá intuitivní představě, že pro y = f (x) je přibližně f = y x zatímco pro x = f −1 (y) je to přibližně (f −1 ) (y) = x y . Takto skutečně můžeme derivace inverzních funkcí počítat: Věta. Je-li f diferencovatelná reálná funkce na okolí bodu x0 a v tomto bodě f (x0) = 0, pak existuje na nějakém okolí bodu y0 = f (x0) funkce f −1 inverzní k f a platí vztah (5.6). 207 KAPITOLA 5. ZŘÍZENÍ ZOO Důkaz. Nejprve si povšimněme, že nenulovost derivace znamená, že na nějakém okolí je naše funkce f buď ostře rostoucí nebo klesající, viz důsledek 5.31. Proto na nějakém okolí nutně existuje inverzní funkce. Protože je obrazem ohraničeného uzavřeného intervalu ve spojité funkci opět uzavřený interval, nutně je také pro každou otevřenou množinu U v definičním oboru f i obraz f (U) otevřený. Pak ale přímo z definice spojitosti pomocí okolí je pak tato inverzní funkce také spojitá. Pro odvození našeho tvrzení nyní postačí pozorně znovu pročíst důkaz čtvrtého tvrzení věty 5.32. Jen volíme f místo funkce h a f −1 místo f a místo předpokladu existence derivací pro obě funkce víme, že funkce složená je diferencovatelná (a víme, že její derivace je identita): Skutečně, podle lematu 5.30 existuje funkce ψ spojitá v bodě y0 taková, že f (y) − f (y0) = ϕ(y)(y − y0), na nějakém okolí y0. Navíc pro ni platí ϕ(y0) = f (y0). Pak ovšem po dosazení y = f −1 (x) také platí x − x0 = ϕ(f −1 (x))(f −1 (x) − f −1 (x0)), pro x z nějakého okolí O(x0) bodu x0. Dále platí f −1 (x0) = y0 a protože je f buď ostře rostoucí nebo klesající, je ϕ(f −1 (x)) = 0 pro všechny x ∈ O(x0) \ {x0}. Můžeme tedy psát f −1 (x) − f −1 (x0) x − x0 = 1 ϕ(f −1(x)) = 0, pro všechny x ∈ O(x0) \ {x0}. Pravá strana tohoto výrazu je spojitá v bodě x0 a limita je rovna ϕ(y0) = (f (y0))−1 , proto i limita levé strany existuje a je rovna témuž výrazu. 5.22a 5.35. Derivace mocninné, exponenciální a logaritmické funkce. Obecnou mocninou funkci není tak snadné zderivovat, i když jsme už prozradili, že vzorec e5.6e5.6 (5.7) (xa ) = axa−1 známý pro přirozená a bude platit i pro obecné a. Odvodit tento vzorec však můžeme snadno s pomocí vztahu pro derivaci exponenciální funkce a logaritmické funkce: (xa ) = (ea ln x ) = ea ln x (a ln x) = axa−1 . Podívejme se teď na exponenciály f (x) = ax . Pokud existuje derivace ax ve všech bodech x, bude jistě platit f (x) = lim x→0 ax+ x − ax x = ax lim x→0 a x − 1 x = f (0)ax . Naopak, pokud existuje derivace v nule, pak tento výpočet ověřuje existenci derivace v kterémkoliv bodě a dává její hodnotu. Zároveň jsme ověřili platnost téhož vztahu pro derivace zprava a zleva. Bude nám to ještě dlouho trvat, než ověříme (viz 5.42, 5.47 a 6.43), že derivace exponenciálních funkcí skutečně existují. Již teď si ale všimněme, že jsou to tedy zvláštní případy funkcí, jejichž derivace jsou úměrné hodnotám s konstantním koeficientem úměrnosti. Zároveň uvidíme, že 208 KAPITOLA 5. ZŘÍZENÍ ZOO existuje obzvlášť užitečný základ e, tzv. Eulerovo číslo, pro které bude derivace v nule rovna jedné. Zjevně pak (ax ) = (eln(a)x ) = ln(a)(eln(a)x ) = ln(a) · ax . Z definičního vztahu pro přirozený logaritmus eln x = x snadno spočteme podle pravidla pro derivaci složené funkce (užíváme již, že ex je rovno své derivaci, a také definiční vztah pro logaritmus): e5.7e5.7 (5.8) (ln) (y) = (ln) (ex ) = 1 (ex) = 1 ex = 1 y . 6.1 5.36. Věty o střední hodnotě. Než se pustíme do dalšího tématu na naší pouti za různorodými definicemi funkcí, odvodíme ještě několik jednoduchých výsledků o derivacích. Všechny jsou velice snadno intuitivně jasné z přiložených obrázků a důkazy vlastně jen rozepisují vizuální představu. 6.1 Věta. Nechť funkce f : R → R je spojitá na konečném uzavřeném intervalu [a, b] a diferencovatelná uvnitř tohoto intervalu. Jestliže platí f (a) = f (b), pak existuje c ∈ (a, b) takové, že f (c) = 0. Důkaz. Protože je funkce f spojitá na uzavřeném intervalu (tj. kompaktní množině), má na něm maximum a minimum. Pokud by maximum i minimum mělo stejnou hodnotu f (a) = f (b), pak by funkce f byla konstantní a tedy i její derivace by byla nulová ve všech bodech intervalu (a, b). Předpokládejme tedy, že buď maximum nebo mimimum je jiné a nechť nastává jedno z nich ve vnitřním bodě c. Pak ovšem není možné, aby v c bylo f (c) = 0, protože to by v tomto bodě byla byla funkce f buď rostoucí nebo klesající (viz 5.31) a jistě by tedy v okolí bodu c nabývala větších i menších hodnot, než je f (c). Právě dokázanému tvrzení se říká Rolleova věta. Z ní snadno vyplývá následující důsledek, známý jako věta o střední hodnotě. 6.2 5.37. Věta. Nechť funkce f : R → R je spojitá na intervalu [a, b] a diferencovatelná uvnitř tohoto intervalu. Pak existuje c ∈ (a, b) takové, že f (c) = f (b) − f (a) b − a . Důkaz. Důkaz je prostým zápisem geometrického významu tvrzení: k sečně mezi body [a, f (a)] a [b, f (b)] existuje tečna, která je s ní rovnoběžná (namalujte si obrázek). Rovnice naší sečny je y = g(x) = f (a) + f (b) − f (a) b − a (x − a). 209 KAPITOLA 5. ZŘÍZENÍ ZOO Rozdíl h(x) = f (x) − g(x) udává vzdálenost grafu od sečny (v hodnotách y). Jistě platí h(a) = h(b) a h (x) = f (x) − f (b) − f (a) b − a . Podle předchozí věty existuje bod c, ve kterém je h (c) = 0. Větu o střední hodnotě můžeme také přepsat ve tvaru: e6.1e6.1 (5.9) f (b) = f (a) + f (c)(b − a). V případě parametricky zadané křivky v rovině, tj. dvojice funkcí y = f (t), x = g(t), je stejný výsledek o existenci rovnoběžné tečny k sečně krajními body popsán takto: Důsledek. Nechť funkce y = f (t) a x = g(t) jsou spojité na intervalu [a, b] a diferencovatelné uvnitř tohoto intervalu a g (t) = 0 pro všechny t ∈ (a, b). Pak existuje bod c ∈ (a, b) takový, že platí f (b) − f (a) g(b) − g(a) = f (c) g (c) . Důkaz. Opět spoléháme na použití Rolleovy věty. Položíme proto h(t) = (f (b) − f (a))g(t) − (g(b) − g(a))f (t). Nyní h(a) = f (b)g(a) − f (a)g(b), h(b) = f (b)g(a) − f (a)g(b), takže existuje c ∈ (a, b) takový, že h (c) = 0. Protože je g (c) = 0, dostáváme právě požadovaný vztah. Podobná úvaha jako v posledním tvrzení vede k mimořádně užitečnému nástroji pro počítání limit podílu funkcí. Tvrzení je znám jako L’Hospitalovo pravidlo: 6.3 5.38. Věta. Předpokládejme, že f a g jsou funkce diferencovatelné v okolí bodu x0 ∈ R, ne však nutně v bodě x0 samotném, a nechť existují limity lim x→x0 f (x) = 0, lim x→x0 g(x) = 0. Jestliže existuje limita lim x→x0 f (x) g (x) pak existuje i limita lim x→x0 f (x) g(x) a jsou si rovny. Důkaz. Bez újmy na obecnosti můžeme předpokládat, že v x0 mají funkce f a g nulovou hodnotu. Výsledek je opět jednoduše představitelný pomocí obrázku. Uvažujme body [g(x), f (x)] ∈ R2 parametrizované proměnnou x. Podíl hodnot pak odpovídá směrnici sečny mezi body [0, 0] a [f (x), g(x)]. Zároveň víme, že podíl derivací odpovídá směrnici tečny v příslušném bodě. Z existence limity směrnic tečen tedy chceme dovodit existenci limity směrnic sečen. 210 KAPITOLA 5. ZŘÍZENÍ ZOO Technicky lze využít věty o střední hodnotě v parametrickém tvaru. Předně si uvědomme, že v tvrzení věty implicitně předpokládáme existenci výrazu f (x)/g (x) na nějakém okolí x0 (kromě bodu x0 samotného), zejména tedy pro dostatečně blízké body c k x0 bude g (c) = 0.2 Díky větě o střední hodnotě nyní lim x→x0 f (x) g(x) = lim x→x0 f (x) − f (x0) g(x) − g(x0) = lim x→x0 f (cx) g (cx) , kde cx je číslo mezi x0 a x, závislé na x. Z existence limity lim x→x0 f (x) g (x) vyplývá, že stejnou hodnotu bude mít i limita libovolné posloupnosti vzniklé dosazením hodnot x = xn jdoucích k x0 do f (x)/g (x). Zejména tedy můžeme dosadit jakoukoliv posloupnost cxn pro xn → x0 a proto bude existovat i limita lim x→x0 f (cx) g (cx) a poslední dvě limity zjevně budou mít stejnou hodnotu. Dokázali jsme tedy, že naše hledaná limita existuje a má také stejnou hodnotu. Z důkazu věty je samozřejmé, že její tvrzení platí i pro jednostranné limity. 6.4 5.39. Důsledky. L’Hospitalovo pravidlo můžeme jednoduše rozšířit i pro limity v nevlastních bodech ±∞ a pro případ nevlastních hodnot limit. Je-li, např. lim x→∞ f (x) = 0, lim x→∞ g(x) = 0, potom je limx→0+ f (1/x) = 0 a limx→0+ g(1/x) = 0. Zároveň z existence limity podílu derivací v nekonečnu dostaneme lim x→0+ (f (1/x)) (g(1/x)) = lim x→0+ f (1/x)(−1/x2 ) g (1/x)(−1/x2) = lim x→0+ f (1/x) g (1/x) = lim x→∞ f (x) g (x) . Použitím předchozí věty tedy dostáváme, že v tomto případě bude existovat i limita podílu lim x→∞ f (x) g(x) = lim x→0+ f (1/x) g(1/x) = lim x→∞ f (x) g (x) . Ještě jednodušší je postup při výpočtu limity v případě, kdy lim x→x0 f (x) = ±∞, lim x→x0 g(x) = ±∞. Stačí totiž psát lim x→x0 f (x) g(x) = lim x→x0 1/g(x) 1/f (x) , 2Pro samu existenci limity v obecném smyslu to vždy nutné není, nicméně pro tvrzení L’Hospitalovy věty je to potřebné. Podrobnou diskusi je možné najít (vygooglovat) v populárním článku ‘R. P. Boas, Counterexamples to L’Hôpital’s Rule, The American Mathematical Monthly, October 1986, Volume 93, Number 8, pp. 644–645.’ 211 KAPITOLA 5. ZŘÍZENÍ ZOO což je již případ pro použití L’Hospitalova pravidla z předchozí věty. Lze ale i dokázat, že L’Hospitalovo pravidlo platí ve stejné formě pro nevlastní limity: Věta. Nechť f a g jsou funkce diferencovatelné v okolí bodu x0 ∈ R, ne však nutně v bodě x0 samotném, a nechť existují limity limx→x0 f (x) = ±∞ a limx→x0 g(x) = ±∞. Jestliže existuje limita lim x→x0 f (x) g (x) pak existuje i limita lim x→x0 f (x) g(x) a jsou si rovny. Důkaz. Opět lze vyjít z věty o střední hodnotě. Základem je vyjádření podílu tak, abychom dostali do hry derivaci: f (x) g(x) = f (x) f (x) − f (y) · f (x) − f (y) g(x) − g(y) · g(x) − g(y) g(x) kde y volíme nějaký pevný ze zvoleného okolí x0 a x necháme blížit k x0. Protože jsou limity f i g v x0 nekonečné, můžeme jistě předpokládat, že rozdíly hodnot v x a y jsou u obou funkcí při pevném y nenulové. Pomocí věty o střední hodnotě můžeme nyní nahradit prostřední zlomek podílem derivací ve vhodném bodě c mezi x a y a výraz ve zkoumané limitě dostává tvar f (x) g(x) = 1 − g(y) g(x) 1 − f (y) f (x) · f (c) g (c) , kde c závisí na x i y. Při pevném y a x jdoucím k x0 jde první zlomek zjevně k jedničce. Když zároveň budeme y přibližovat k x0, bude se nám druhý zlomek libovolně přesně blížit k limitní hodnotě podílu derivací. 6.4a 5.40. Příklad použití. Vhodnými úpravami sledovaných výrazů lze využít L’Hospitalova pravidla také na výrazy typu ∞ − ∞, 1∞ , 0 · ∞ apod. Zpravidla jde o prosté přepsání výrazů nebo o využití nějaké hladké funkce, např. exponenciální. příklady budou jistě hodjně v druhé části textu, včetně takových jako je zaprocentovánUkážeme si pro ilustraci takového postupu souvislost aritmetického a geometrického průměru z n nezáporných hodnot xi. Aritmetický průměr M1 (x1, . . . , xn) = x1 + · · · + xn n je speciálním případem tzv. mocninného průměru stupně r: Mr (x1, . . . , xn) = xr 1 + · · · + xr n n 1 r . Speciální hodnota M−1 se nazývá harmonický průměr. Spočtěme si nyní limitní hodnotu Mr pro r jdoucí k nule. Za tímto účelem spočteme limitu pomocí L’Hospitalova pravidla (jde o výraz 0/0 a derivujeme podle r, zatímco xi jsou při výpočtu konstantní parametry). 212 KAPITOLA 5. ZŘÍZENÍ ZOO Následující výpočet, ve kterém užíváme pravidla pro derivování složených funkcí a znalosti hodnot derivace mocninné funkce, musíme číst odzadu. Z existence poslední limity plyne existence předposlední a její hodnota atd. lim r→0 ln(Mr (x1, . . . , xn)) = lim r→0 ln(1 n (xr 1 + · · · + xr n)) r = lim r→0 xr 1 ln x1+···+xr n ln xn n xr 1+···+xr n n = ln x1 + · · · + ln xn n = ln n √ x1 · · · · · xn. Odtud tedy je přímo vidět, že lim r→0 Mr (x1, . . . , xn) = n √ x1 . . . xn, což je hodnota známá pod názvem geometrický průměr. 4. Mocninné řady 5.23 5.41. Jak se počítá ex . Kromě sčítání a násobení už umíme také počítat s limitami posloupností. Podbízí se proto přibližovat nepolynomiální funkce pomocí posloupností spočítatelných hodnot. Když se takto podíváme na funkci ex , hledáme vlastně funkci, jejíž okamžitý přírůstek je v každém bodě roven hodnotě této funkce. To si můžeme dobře představit jako úžasné úročení vkladu se sazbou rovnou okamžité hodnotě. Když budeme roční sazbu úroku realizovat jednou za měsíc, za den, za hodinu atd., budeme pro vklad x dostávat výsledné hodnoty 1 + x 12 12 , 1 + x 365 365 , 1 + x 8760 8760 , . . . Dalo by se tedy tušit, že bude platit: ex = lim n→∞ 1 + x n n . Zároveň tušíme, že čím jemněji budeme postupovat při úročení, tím vyšší bude výnos, takže by posloupnost čísel na pravé straně měla být rostoucí. Podívejme se tedy podrobně na číselnou posloupnost an = 1 + 1 n n . Z binomického rozvoje je zřejmé, že pro každé kladné číslo b a přirozené n platí (1 + b)n > 1 + nb, dostáváme proto pro dva po sobě jdoucí členy naší posloupnosti podíl (1 + 1 n )n (1 + 1 n−1 )n−1 = (n2 − 1)n n n2n(n − 1) = 1 − 1 n2 n n n − 1 > (1 − 1 n ) n n − 1 = 1. 213 KAPITOLA 5. ZŘÍZENÍ ZOO Je tedy naše posloupnost skutečně rostoucí. Zároveň stejným výpočtem ověříme, že posloupnost čísel bn = 1 + 1 n n+1 = 1 + 1 n 1 + 1 n n je klesající a jistě je bn > an. Posloupnost an je tedy zhora ohraničená a rostoucí a proto je její limita dána jejím supremem. Zároveň vidíme, že je tato limita rovna také limitě klesající posloupnosti bn). Tato limita proto zadává jedno z nejdůležitějších čísel v matematice (vedle nuly, jedničky a Ludolfova čísla π), Eulerovo číslo e. Je tedy e = lim n→∞ 1 + 1 n n . 5.24 5.42. Mocninná řada pro ex . Exponenciální funkci jsme definovali jako jedinou spojitou funkci splňující f (1) = e a f (x + y) = f (x) · f (y). Základ e máme vyjádřen jako limitu posloupnosti čísel an, nutně tedy je ex = lim n→∞ (an)x . Počítejme nyní pro jednoduchost s kladným x. Jestliže v hodnotách an z minulého odstavce zaměníme n za n/x, opět dostatneme stejnou limitu a proto také e = lim n→∞ 1 + x n n x , ex = lim n→∞ 1 + x n n . Označme si n-tý člen této posloupnosti un(x) = (1 + x/n)n a vyjádřeme si jej pomocí bionomické věty: e5.11ae5.11a (5.10) un(x) = 1 + n x n + n(n − 1)x2 2!n2 + · · · + n!xn n!nn = 1 + x + x2 2! 1 − 1 n + x3 3! 1 − 1 n 1 − 2 n + . . . + xn n! 1 − 1 n 1 − 2 n . . . 1 − n − 1 n . Protože jsou všechny závorky v součinech menší než jedna, dostáváme také un(x) < vn(x) = n j=0 1 j! xj . Podívejme se nyní na formální nekonečný součet e5.12e5.12 (5.11) ∞ j=0 cj = ∞ j=0 1 j! xj tj. vn(x) je právě součet prvních n členů v tomto formálním nekonečném výrazu. Podíl dvou po sobě jdoucích členů v řadě je cj+1/cj = x/(n+1). Pro každé pevné x tedy existuje N ∈ N takové, že cj+1/cj < 1/2 pro všechny j ≥ N. Pro takto 214 KAPITOLA 5. ZŘÍZENÍ ZOO velké j je ovšem cj+1 < 1 2 cj < 2−(j−N+1) cN . To ale znamená, že částečné součty prvních n členů v našem formálním součtu jsou shora ohraničeny součty vn < N−1 j=0 1 j! xj + 1 N! xN n−N j=0 1 2j . Protože pro každé q platí (1−q)(1+q+· · ·+qk ) = 1−qk+1 , můžeme hodnoty vn také odhadnout vn < N−1 j=0 1 j! xj + 2 N! xN (1 − 2−n+N−1 ) Limita výrazů na pravé straně pro n jdoucí do nekonečna proto jistě existuje a proto existuje i limita rostoucí posloupnosti vn. Nyní si prohlédněme pozorněji posloupnost čísel un, jejíž limitou je ex . Budeme uvažovat n > N pro nějaké pevné N (hodně velké) a zvolíme si k < N pevné (docela malé). Pak pro dostatečně velká N umíme součet prvních k členů ve vyjádření uN v (5.10) aproximovat libovolně přesně výrazem vk. Protože je tato část součtu uN ostře menší než uN samotné, musí posloupnost un konvergovat k téže limitě jako poslounost vn. Dokázali jsme tedy: Mocninná řada pro ex Věta. Exponenciální funkce je pro každé x ∈ R vyjádřena jako limita částečných součtů ve výrazu ex = 1 + x + 1 2! x2 + · · · + 1 n! xn + · · · = ∞ n=0 1 n! xn . 5.25 5.43. Číselné řady. Při dovození mimořádně důležitého tvrzení o funkci ex jsme mimoděk pracovali s několika užitečnými pojmy a nástroji. Sformulujeme si je nyní obecněji: Číselné nekonečné řady Definice. Nekonečná řada čísel je výraz ∞ n=0 an = a0 + a1 + a2 + · · · + ak + . . . , kde an jsou reálná nebo komplexní čísla. Posloupnost částečných součtů je dána svými členy sk = k n=0 an a říkáme, že řada konverguje a je rovna s, jestliže existuje konečná limita částečných součtů s = lim k→∞ sn. Jestliže posloupnost částečných součtů řady má nevlastní limitu, říkáme že řada diverguje k ∞ nebo −∞.tu, á e e ada d 215 KAPITOLA 5. ZŘÍZENÍ ZOO K tomu, aby posloupnost částečných součtů sn konvergovala, je nutné a stačí, aby byla Cauchyovská. Tzn. že |sm − sn| = |an+1 + · · · + am| musí být libovolně malé pro dostatečně velká m > n. Protože je |an+1| + · · · + |am| > |an+1 + · · · + am|, vyplývá z konvergence řady ∞ k=0 |an| i konvergence řady ∞ k=0 an. Absolutně konvergentní řady Říkáme, že řada ∞ k=0 an konverguje absolutně, jestliže konverguje řada ∞ n=0 |an|. Absolutní konvergenci jsme zavedli, protože se často daleko snadněji ověřuje, zároveň ale následující věta ukazuje, že se v případě aboslutně konvergentních řad i jednoduché algebraické operace chovají všechny velice dobře: 5.25a 5.44. Věta. Nechť S = ∞ n=0 an a T = ∞ n=0 bn jsou dvě absolutně konvergentní řady. Pak (1) jejich součet absolutně konverguje k součtu S + T = ∞ n=0 an + ∞ n=0 bn = ∞ n=0 (an + bn), (2) jejich rozdíl absolutně konverguje k rozdílu S − T = ∞ n=0 an − ∞ n=0 bn = ∞ n=0 (an − bn), (3) jejich součin absolutně konverguje k součinu S · T = ∞ n=0 an · ∞ n=0 bn = ∞ n=0 n k=0 an−kbk . Důkaz. První i druhé tvrzení jsou bezprostředním důsledkem obdobných vlastností limit. Třetí tvrzení vyžaduje větší pozornost. Označme si cn = n k=0 an−kbk. Z předpokladů a podle pravidel pro limitu součinu posloupností dostáváme k n=0 an · k n=0 bn → ∞ n=0 an · ∞ n=0 bn . Máme tedy dokázat, že 0 = lim k→∞ k n=0 an · k n=0 bn − k n=0 ck . 216 KAPITOLA 5. ZŘÍZENÍ ZOO Porovnejme si nyní výrazy k n=0 an · k n=0 bn = 0≤i,j≤k aibj , cn = i+j=n 0≤i,j≤k aibj , k n=0 cn = i+j≤k 0≤i,j≤k aibj . Dostáváme tedy odhad k n=0 an · k n=0 bn − k n=0 cn = i+j>k 0≤i,j≤k aibj ≤ i+j>k 0≤i,j≤k |aibj |. K odhadu posledního výrazu nám poslouží jednoduchý trik: aby mohl být součet idexů větší než k, musí být alespoň jeden z nich větší než k/2. Jistě tedy výraz nezmenšíme, když do něj přidáme více členů, tj. vezmeme všechny jako v součinu a odebereme pouze ty, u kterých jsou oba nejvýše k/2. i+j>k 0≤i,j≤k |aibj | ≤ 0≤i,j≤k |aibj | − 0≤i,j≤k/2 |aibj |. Oba výrazy v rozdílu jsou ale částečné součty pro součin S · T , mají tedy také stejnou limitu a proto jejich rozdíl jde k nule. Další věta uvádí podmínky, pomocí kterých umíme ověřit konvergenci řad. 5.26 5.45. Věta. Nechť S = ∞ n=0 an je nekonečná řada reálných nebo komplexních čísel. (1) Jestliže S konverguje, pak limn→∞ an = 0. (2) Předpokládejme, že existuje limita podílů po sobě jdoucích členů řady a platí lim n→∞ an+1 an = q. Pak řada S konverguje absolutně při |q| < 1 a nekonverguje při |q| > 1. Při |q| = 1 může řada konvergovat ale nemusí. (3) Jestliže existuje limita lim n→∞ n |an| = q, pak při q < 1 řada konverguje absolutně, zatímco při q > 1 diverguje. Je-li q = 1, může konvergovat i divergovat. Důkaz. (1) Jestliže limn→∞ an neexistuje nebo je nenulová, exituje pro dostatečně malé číslo > 0 nekonečně mnoho členů ak s |ak| > . Zároveň tedy musí mezi nimi existovat nekončeně mnoho kladných nebo nekonečně mnoho záporných. Pak ovšem při přidání kteréhokoliv z nich do částečného součtu dostáváme rozdíl dvou po sobě jdoucích sn a sn+1 o velikosti alespoň . Posloupnost částečných součtů proto nemůže být Cauchyovská a tedy ani konvergentní. 217 KAPITOLA 5. ZŘÍZENÍ ZOO (2) Protože chceme dokazovat absolutní konvergenci, můžeme rovnou předpokládat ai > 0. Důkaz jsme pro speciální hodnotu q = 1/2 provedli při dovození hodnoty ex pomocí řady. Uvažme nyní q < r < 1 pro nějaké reálné r. Z existence limity podílů dovodíme pro všechna j větší než dostatečně veliké N aj+1 < r · aj ≤ r(j−N+1) aN . To ale znamená, že částečné součty sn jsou pro velká n > N shora ohraničeny součty sn < N j=0 aj + aN n−N j=0 rj = N j=0 aj + 1 − rn−N+1 1 − r . Protože 0 < r < 1, je množina všech částečných součtů shora ohraničená rostoucí posloupnost a proto je její limitou její supremum. Při hodnotě q > r > 1 použijeme obdobný postup, ale z existence limity podílu q hned na začátku odvodíme aj+1 > r · aj ≥ r(j−N+1) aN . To ale znamená, že částečné součty prvních sn jsou zdola ohraničeny součty sn > N j=0 aj + aN n−N j=0 rj . Při r > 1 tento výraz poroste s rostoucím n nad všechny meze a proto ani naše řada nemůže konvergovat. (3) Důkaz je zde velmi podobný předchozímu případu. Z existence limity q < 1 vyplývá, že pro každé q < r < 1 existuje N takové, že pro všechny n > N platí n √ |an| < r. Umocněním pak dostáváme |an| < rn , takže jsme opět v situaci, kdy srovnáváme s geometrickou řadou. Důkaz se proto dokončí stejně jako v případě podílového testu. V důkazu druhého i třetího tvrzení jsme využívali slabšího tvrzení, než je existecne limity. Potřebovali jsme pro studované posloupnosti nezáporných výrazů pouze tvrzení, že od určitého indexu už budou větší nebo menší než dané číslo. K takovému odhadu nám ale postačí pro danou posloupnost bn uvažovat s každým indexem n supremum hodnot členů s indexy vyššími. Tato suprema vždy existují a budou tvořit nerostoucí posloupnost. Její infimum pak označujeme jako limes superior dané posloupnosti a značíme lim sup n→∞ bn. Výhodou je, že limes superior vždy existuje, můžeme proto předchozí výsledek (aniž bychom měnili důkaz) přeformulovat v silnější podobě: Důsledek. Nechť S = ∞ n=0 an je nekonečná řada reálných nebo komplexních čísel. 218 KAPITOLA 5. ZŘÍZENÍ ZOO (1) Je-li q = lim sup n→∞ an+1 an , pak řada S konverguje absolutně při q < 1 a nekonverguje při q > 1. Při q = 1 může řada konvergovat ale nemusí. (2) Je-li q = lim sup n→∞ n |an|, pak při q < 1 řada konverguje absolutně, zatímco při q > 1 diverguje. Je-li q = 1, může konvergovat i divergovat. 5.27 5.46. Mocninné řady. Jestliže máme místo posloupnosti čísel an k dispozici posloupnost funkcí fn(x) se stejným definičním oborem A, můžeme bod po bodu použít definici součtu číselné řady a dostáváme pojem součtu řady funkcí S(x) = ∞ n=0 fn(x). Konvergence mocninné řady Mocninná řada je dána výrazem S(x) = ∞ n=0 anxn . Řekneme, že S(x) má poloměr konvergence ρ ≥ 0, jestliže S(x) konverguje pro každé x splňující |x| < ρ a diverguje při |x| > ρ.při |x| > ρ. 5.27a 5.47. Vlastnosti mocninných řad. Ačkoliv na podstatnou část důkazu následující věty si budeme muset počkat až na konec příští kapitoly, zformulujeme si základní vlastnosti mocninných řad hned: Absolutní konvergence a diferencování člen po členu Věta. Nechť S(x) = ∞ n=0 anxn je mocninná řada a existuje limita ρ = lim n→∞ n |an|. Pak je poloměr konvergece řady S roven r = ρ−1 . Mocninná řada S(x) konverguje na na celém svém intervalu konvergence absolutně a je na něm spojitá (včetně krajních bodů, pokud v nich konverguje také) a existuje její derivace, S (x) = ∞ n=1 nanxn−1 . 219 KAPITOLA 5. ZŘÍZENÍ ZOO Důkaz. Pro ověření absolutní konvergence řady můžeme pro každou pevnou hodnotu x použít odmocninový test z věty 5.45(3). Počítáme přitom lim n→∞ n |anxn| = ρx a řada konverguje abosultně, resp. diverguje, jestliže je tato limita různá od 1. Odtud plyne, že skutečně konverguje pro |x| < r a diverguje pro |x| > r. Tvrzení o spojitosti a derivaci dokážeme později v obecnějším kontextu, viz 6.43–6.45. Všimněme si také, že můžeme při důkazu konvergence použít silnější variantu odmocninového testu a tedy lze poloměr konvergence r pro každou mocninnou řadu přímo zadat fomulí r−1 = lim sup n→∞ n |an|. 5.28 5.48. Poznámky. Pokud koeficienty řady velmi rychle rostou, např. an = nn , pak je r−1 = ∞, tj. poloměr konvergence je nula. Skutečně taková řada pak konverguje pouze v jediném bodě x = 0. Podíváme se na konvergenci mocninných řad S(x) = ∞ n=0 xn , T (x) = ∞ n=1 1 n xn včetně krajních bodů příslušného intervalu. První příklad je geometrická řada, kterou jsme se zabývali již dříve, a její součet je pro všechny x s |x| < 1 S(x) = 1 1 − x , zatímco |x| > 1 zaručuje divergenci. Pro x = 1 dostáváme také zjevně divergentní řadu 1 + 1 + 1 + . . . s nekonečným součtem, při x = −1 jde o řadu 1−1+1−. . . , jejíž částečné součty nemají limitu vůbec. Věta 5.45(2) ukazuje, že poloměr konvergence druhého příkladu je také jedna, protože existuje lim n→∞ 1 n+1 xn+1 1 n xn = x lim n→∞ n n + 1 = x Pro x = 1 tu dostaneme divergentní řadu 1 + 1 2 + 1 3 + . . . , protože umíme odhadnout částečné součty tak, že vždy postupně pro k = 1, 2, 3, . . . , sečteme 2k−1 po sobě jdoucích členů 1/2k−1 , . . . , 1/(2k − 1) a nahradíme všechny 2−k . Do spodního odhadu tedy každá taková část přispěje 1/2 a odhad tedy roste nad všechny meze. Naopak, řada T (−1) = −1 + 1 2 − 1 3 + . . . konverguje. Vyplývá to z obecnějšího platného tvrzení, které ukážeme až v příští kapitole. 220 KAPITOLA 5. ZŘÍZENÍ ZOO 5.29 5.49. Komplexní exponenciála a goniometrické funkce. S mocninnými řadami nám do našeho společenství funkcí přibyla spousta nových příkladů hladkých funkcí, tj. funkcí libovolněkrát diferencovatelných na celém svém definičním oboru. Podobně jako polynomy mají všechny tyto přírůstky do zvěřince navíc vlastnost, že jsou ve skutečnosti zadány vztahem, který definuje funkci C → C. Skutečně, naše úvahy o absolutní konvergenci jsou bezezbytku platné i pro komplexní číselné řady. Proto mocninné řady budou na celém kruhu v komplexní rovině se středem v počátku a poloměrem r představovat konvergentní číselné řady komplexních čísel. Pohrejme si chvíli s nejvýznamnějším a prvním naším příkladem, exponenciálou ex = 1 + x + 1 2 x2 + · · · + 1 n! xn + . . . . Tato mocninnná řada má poloměr konvergence nekonečný a dobře proto definuje hladkou funkci pro všechna komplexní čísla x. Její hodnoty jsou limitami hodnot (komplexních) polynomů s reálnými koeficienty a každý polynom je zcela určený konečně mnoha svými hodnotami. Zejména tedy jsou hodnoty mocninných řad i v komplexním oboru zcela určeny jejich hodnotami na reálných argumentech x. Proto i pro komplexní exponenciálu musí platit i obvyklé vztahy, které jsme pro reálné hodnoty proměnné x již odvodili. Zejména tedy platí ex+y = ex · ey , viz vztah (5.5) a věta 5.44(3). Dosaďme si hodnoty x = i · t, kde i ∈ C je imaginární jednotka, t ∈ R libovolné. eit = 1 + it − 1 2 t2 − i 1 3! t3 + 1 4! t4 + i 1 5! t5 − . . . a zjevně tedy je komplexně konjugované číslo k z = eit číslo ¯z = e−it . Proto |z|2 = z · ¯z = eit · e−it = e0 = 1 a všechny hodnoty z = eit leží na jednotkové kružnici v komplexní rovině. Reálné a imaginární složky bodů na jednotkové kružnici jsme popisovali pomocí goniometrických funkcí cos θ a sin θ, kde θ je patřičný úhel. Derivací parametrického popisu bodů kružnice, t → eit dostáváme vektory „rychlostí“, které budou dány výrazem (pokud zatím nevěříme derivování mocninných řad člen po členu, lze také zderivovat zvlášť reálnou a imaginární složku) t → eit ) = i · eit a jejich velikost proto také bude pořád jednotková. Odtud lze tušit, že celou kružnici oběhneme po dosažení hodnoty parametru rovného délce oblouku, tj. 2π (i když k pořádné definici délky křivky budeme potřebovat integrální počet). Tímto postupem skutečně definujeme Ludolfovo číslo π — je to délka poloviny jednotkové kružnice v euklidovském R2 . 221 KAPITOLA 5. ZŘÍZENÍ ZOO Můžeme se ale nyní aspoň částečně ujistit pohledem na nejmenší kladné kořeny reálné části částečných součtů naší řady, tj. příslušných polynomů. Již při řádu deset nám vyjde číslo π přesně na 5 desetinných míst. Dostali jsem tedy přímou definici goniometrických funkcí pomocí mocninných řad: cos t = re eit = 1 − 1 2 t2 + 1 4! t4 − 1 6! t6 + · · · + (−1)k 1 (2k)! t2k + . . . sin t = im eit = t − 1 3! t3 + 1 5! t5 − 1 7! t7 + · · · + (−1)k 1 (2k + 1)! t2k+1 + . . . Ilustraci konvergence řady pro funkci cos je vidět na obrázku. Jde o graf příslušného polynomu stupně 68. Při postupném vykreslení částečných součtů je vidět, že aproximace v okolí nuly je velice dobrá a prakticky beze změn. S rostoucím řádem se pak zlepšuje i dále od počátku. y t~ 1,5 30 1 0,5 20 0 -0,5 10 -1 -1,5 0-10-20-30 Přímo z definice vyplývá známý vztah eit e−it = sin2 t + cos2 t = 1 a také z derivace (eit ) = i eit vidíme, že (sin t) = cos t, (cos t) = − sin t. Tento výsledek lze samozřejmě ověřit přímo derivací našich řad člen po členu. Označme t0 nejmenší kladné číslo, pro které je e−it0 = − eit0 , tj. první kladný nulový bod funkce cos t. Podle naší definice Ludolfova čísla je t0 = 1 2 π. Pak kvadrát této hodnoty je ei2t0 = e−i2t0 = (e−it0 )2 a jde tedy o nulový bod funkce sin t. Samozřejmě přitom platí pro libovolné t ei(4kt0+t) = (eit0 )4k · eit = 1 · eit . Jsou tedy obě goniometrické funkce sin a cos periodické s periodou 2π. Z našich definic je přitom vidět, že je to nejmenší jejich perioda. 222 KAPITOLA 5. ZŘÍZENÍ ZOO Nyní můžeme snadno odvodit všechny obvyklé vztahy mezi goniometrickými funkcemi. Uvedeme na ukázku několik z nich. Nejprve si všimněme, že definice vlastně říká cos t = 1 2 (eit + e−it )e5.13e5.13 (5.12) sin t = 1 2i (eit − e−it ).e5.14e5.14 (5.13) Součin těchto funkcí jde tedy vyjádřit jako sin t cos t = 1 4i (eit − e−it )(eit + e−it ) = 1 4i (ei2t − e−i2t ) = 1 2 sin 2t. Dále můžeme využít naši znalost derivací: cos 2t = ( 1 2 sin 2t) = (sin t cos t) = cos2 t − sin2 t. Vlastnosti dalších goniometrických funkcí tg t = sin t cos t , cotg t = (tg t)−1 se snadno odvodí z jejich definice a pravidel pro derivování. Grafy funkcí sinus, cosinus, tangens a cotangens jsou na obrázcích (postupně červený a zelený vlevo, červený a zelený vpravo): 1 x 0,5 0 10-5 -0,5 5 -1 0-10 x 3210-1-2 y -3 10 5 0 -5 -10 Cyklometrické funkce jsou inverzní ke goniometrickým. Protože jsou goniometrické funkce všechny periodické s periodou 2π, jsou jejich inverze definované vždy jen v rámci jedné periody a to ještě jen na části, kdy je daná funkce buď rostoucí nebo klesající. Jsou to funkce arcsin = sin−1 s definičním oborem [−1, 1] a oborem hodnot [−π/2, π/2]. Dále arccos = cos−1 s definičním oborem [−1, 1] a oborem hodnot [0, π], viz obrázek vlevo. 223 KAPITOLA 5. ZŘÍZENÍ ZOO 3 2 1 0 -1 x 10,50-0,5-1 3 2 1 x 0 -1 1050-5-10 Zbývají ještě funkce (zobrazené na obrázku vpravo) arctg = tg−1 s definičním oborem [−∞, ∞] a oborem hodnot [−π/2, π/2] a konečně arccotg = cotg−1 s definičním oborem [−∞, ∞] a oborem hodnot [0, π]. Velice často se také využívají tzv. hyperbolické funkce sinh x = 1 2 (ex − e−x ), cosh x = 1 2 (ex + e−x ). Název naznačuje, že by funkce mohly mít něco společného s hyperbolou. Přímý výpočet dává (druhé mocniny se v roznásobených dvojčlenech všechny odečtou a zůstanou smíšené členy) (cosh x)2 − (sinh x)2 = 2 1 2 (ex e−x ) = 1. Body [cosh t, sinh t] ∈ R2 tedy skutečně parametricky popisují hyperbolu v rovině. Pro hyperbolické funkce lze snadno odvodit podobné identity jako pro funkce goniometrické. Mimo jiné je přímo z definice snadno vidět (dosazením do vztahů (5.12) a (5.13)) cosh x = cos(ix), i sinh x = sin(ix). 5.30 5.50. Poznámky. (1) Jestliže mocninnou řadu S(x) vyjádříme s posunutou hodnotou proměnné x o konstantní posuv x0, dostaneme funkci T (x) = S(x − x0). Jestliže je ρ poloměr konveregence S, bude T dobře definovaná na intervalu (x0 − ρ, x0 + ρ). Říkáme, že T je mocninná řada se středem v x0. Mocninné řady proto můžeme přímo definovat takto: S(x) = ∞ n=0 an(x − x0)n , kde x0 je libovolné pevně zvolené reálné číslo. Všechny naše předchozí úvahy jsou pořád platné, jen je třeba mít na paměti, že se vztahují k bodu x0. Zejména tedy taková řada konverguje na intervalu (x0 − ρ, x0 + ρ), kde ρ je její poloměr konvergence. 224 KAPITOLA 5. ZŘÍZENÍ ZOO Dále platí, že má-li mocninná řada y = T (x) hodnoty v intervalu, kde je dobře definována řada S(y), potom i hodnoty funkce S ◦ T jsou vyjádřeny mocninnou řadou, kterou dostaneme formálním dosazením y = T (x) za y do S(y). (2) Jakmile máme k dispozici mocninné řady s obecným středem, lze docela přímočaře počítat koeficienty mocninných řad zadávajících inverzní funkce. Nebudeme zde uvádět seznam formulí, snadno se k nim dostaneme například v Maplu procedurou „series“. Pro ilustraci se podívejme alespoň na dva příklady: Viděli jsme, že ex = 1 + x + 1 2 x2 + 1 6 x3 + 1 24 x4 + . . . . Protože je e0 = 1, budeme hledat pro inverzní funkci ln x mocninnou řadu se středem v x = 1, tj. ln x = a0+a1(x−1)+a2(x−1)2 +a3(x−1)3 +a4(x−1)4 +. . . . Využijeme tedy rovnosti x = eln x a přeskupením koeficientů podle mocnin x dosazením dostaneme: x = a0 + a1 x + 1 2 x2 + 1 6 x3 + 1 24 x4 + . . . + a2 x + 1 2 x2 + . . . 2 + a3 x + 1 2 x2 + . . . 3 + . . . = a0 + a1x + 1 2 a1 + a2 x2 + 1 6 a1 + a2 + a3 x3 + 1 24 a1 + 1 4 + 2 6 a2 + 3 2 a3 + a4 x4 + . . . . Porovnáním koeficientů u stejných mocnin nalevo a napravo a0 = 0, a1 = 1, a2 = − 1 2 , a3 = 1 3 , a4 = − 1 4 , . . . což skutečně odpovídá platnému výrazu (ověříme později): ln x = ∞ n=1 (−1)n−1 n (x − 1)n . Podobně si můžeme pohrát s řadou sin t = t − 1 3! t3 + 1 5! t5 − 1 7! t7 + . . . a zatím neznámou řadou pro její inverzi (všimněme si, že počítáme opět se středem v nule, protože je sin 0 = 0) arcsin t = a0 + a1t + a2t2 + a3t3 + a4t4 + . . . . 225 KAPITOLA 5. ZŘÍZENÍ ZOO Opět dosazením dostáváme t = a0 + a1 t − 1 3! t3 + 1 5! t5 + . . . + a2 t − 1 3! t3 + 1 5! t5 + . . . 2 + . . . = a0 + a1t + a2t2 + − 1 6 a1 + a3 t3+ − 2 6 a2 + a4 t4 + 1 120 a1 − 3 6 a3 + a5 t5 + . . . a proto arcsin t = t + 1 6 t3 + 3 40 t5 + . . . . (3) Všimněme si také, že kdybychom hned zpočátku uvěřili, že funkci ex můžeme napsat jako mocninnou řadu se středem v nule a že se mocninné řady derivují člen po členu, pak bychom snadno obrdrželi diferenční rovnici pro koeficienty an. Víme totiž (xn+1 ) = (n + 1)xn a proto z našeho požadavku, že exponenciála má mít v každém bodě derivaci rovnou své hodnotě, vyplývá an+1 = 1 n+1 an, a0 = 1 a odtud už je jasné, že an = 1 n! . 226 KAPITOLA 6 Diferenciální a integrální počet zvěřinec teď m – naučíme V minulé kapitole jsme si postupně hráli buď s mimořádně velikými třídami funkcí — všechny spojité, všechny diferencovatelné apod. — nebo jen s konkrétními funkcemi — např. exponenciální, goniometrické, polynomy atd. Měli jsme ale přitom jen minimum nástrojů a vše jsme počítali tak říkajíc na koleně. Z kvalitativního pohledu jsme jen naznačili, jak využívat znalost lineárního přiblížení funkce její derivací k diskusi lokálního chování takové funkce kolem daného bodu. Teď dáme dohromady několik výsledků, které umožní snáze pracovat s funkcemi při modelování reálných problémů. Pomocí derivování jsme se naučili zaznamenávat velkosti okamžitých změn. V této kapitole se vyrovnáme i s úlohou, jak sčítat nekonečně mnoho takových „nekonečně malých“ změn, tj. jak „integrovat“. Nejdříve si ale uděláme více jasno o derivacích. 1. Derivování 5.22 6.1. Derivace vyšších řádů. Říkáme, že reálná nebo komplexní funkce f má v bodě x0 derivaci druhého řádu, jestliže derivace f existuje na nějakém okolí bodu x0 a existuje její derivace v bodě x0. Píšeme f (x0) = (f ) (x0) nebo také f (2) (x0). Funkce f je dvakrát diferencovatelná na nějakém intervalu A, jestliže má druhou derivaci v každém jeho bodě. Derivace vyšších řádů definujeme induktivně: Hladké a funkce a k–krát diferencovatelné funkce Říkáme, že reálná nebo komplexní funkce f je (k + 1)– krát diferencovatelná pro nějaké přirozené číslo k v bodě x0, jestliže je k–krát diferencovatelná na nějakém okolí bodu x0 a její k–tá derivace má v bodě x0 derivaci. Pro k-tou derivaci funkce f (x) píšeme f (k) (x). Jestliže existují derivace všech řádů na intervalu, říkáme, že je tam funkce f hladká. Většinou se také užívá konvence, že 0–krát diferencovatelná funkce znamená spojitá funkce. Pro funkce se spojitou k–tou derivací používáme označení třída funkcí Ck (A) na intervalu A, kde k může nabývat hodnot 0, 1, . . . , ∞. Často píšeme pouze Ck , je-li definiční obor znám z kontextu. ý definiční obor znám z 227 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET Ilustrovat můžeme rychle pojem derivace vyššího řádu na polynomech. Protože výsledkem derivování polynomu je opět polynom, ale derivací se vždy o jedničku snižuje jeho stupeň, dostaneme po konečném počtu derivací nulový polynom. Přesněji řečeno, právě po k + 1 derivacích, kde k je stupeň polynomu, dostaneme nulu. Samozřejmě pak existují derivace všech řádů, tj. f ∈ C∞ (R). Při konstrukci splajnů, viz 5.9, jsme pohlídali, aby výsledné funkce byly třídy C2 (R). Jejich třetí derivace budou po částech konstantní funkce. Proto nebudou splajny patřit do C3 (R), přestože jejich všechny derivace vyšších řádů budou nulové ve všech vnitřních bodech jednotlivých intervalů v interpolaci. Promyslete si podrobně tento příklad! Následující tvrzení je jednoduchým kombinatorickým důsledkem Leibnitzova pravidla pro derivaci součinu funkcí: Lemma. Jsou-li f a g dvě funkce mající derivaci řádu k v bodě x0, pak má derivaci řádu k i jejich součin a platí: (f · g)(k) (x0) = k i=0 k i f (i) (x0)g(k−i) (x0) Důkaz. Pro k = 0 je tvrzení triviální, pro k = 1 je to Leibnitzovo pravidlo pro derivaci součinu. Jestliže pravidlo platí pro nějaké k, derivací pravé strany a použitím Leibnitzova pravidla dostaneme obdobný výraz k i=0 k i f (i+1) (x0)g(k−i) (x0) + f (i) (x0)g(k−i+1) (x0) . V této nové sumě je součet řádů derivací u součinů v jednotlivých sčítancích k + 1 a koeficienty u f (j) (x0)g(k+1−j) (x0) jsou součty binomických koeficientů k j−1 + k j = k+1 j . 5.22a 6.2. Násobné kořeny a inverze polynomů. Derivace polynomů jsme spočítali již v odstavci 5.6 a je vidět, že jde o hladké funkce. Derivace je v tomto případě vlastně prosté algebraické zobrazení a podívejme se, jak se nám derivace bude hodit pro diskusi násobných kořenů polynomů. Nejprve zformulujme základní větu algebry, kterou však nebudeme nyní dokazovat: patrně dodám skoro úplný důkaz o pár kapitol později v algebře Věta. Každý nenulový komplexní polynom f : C → C stupně alespoň jedna má kořen. Nutně tedy polynom stupně k > 0 má právě k komplexních kořenů včetně násobností a můžeme jej vždy psát jednoznačně ve tvaru f (x) = (x − a1)c1 · (x − aq)cq kde a1, . . . , aq jsou všechny kořeny polynomu f a 1 ≤ c1, . . . , cq ≤ k jsou jejich násobnosti (tj. přirozená čísla). Derivací f (x) jakožto funkce reálné proměnné x dosta- neme f (x) = c1(x−a1)c1−1 . . . (x−aq)cq +· · ·+cq(x−a1)c1 . . . (x−aq)cq −1 228 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET Jestliže je c1 = 1 a kořen a1 je reálný, bude hodnota derivace f v bodě a1 nenulová, protože první člen výrazu je nenulový, zatímco všechny zbývající po dosazení hodnoty x = a1 zmizí. Oddobně to bude i s ostatními kořeny. Ověřili jsme tedy užitečnou vlastnost, že reálný kořen a polynomu f je vícenásobný tehdy a jen tehdy, když je zároveň kořenem jeho derivace f . (Toto tvrzení si časem rozšíříme i na všechny komplexní kořeny.) 6.5 6.3. Význam druhé derivace. Již jsme viděli, že první derivace funkce je jejím lineárním přiblížením v okolí daného bodu a že ze znaménka nenulové derivace vyplývá, že funkce je v bodě x0 rostoucí nebo klesající. Body, ve kterých je první derivace nulová se nazývají kritické body dané funkce. Je-li x0 kritický bod funkce f , může být chování funkce f v okolí bodu x0 jakékoliv. Vidíme to již z chování funkce f (x) = xn v okolí nuly pro libovolné n. Pro lichá n > 0 bude f (x) rostoucí, pro sudá n naopak bude nalevo klesající a napravo rostoucí, dosáhne tedy v bodě x0 své minimální hodnoty mezi body z (dostatečně malého) okolí bodu x0 = 0. Tentýž pohled můžeme aplikovat na funkci f . Jestliže totiž je druhá derivace nenulová, určuje její znaménko chování derivace první. Proto v kritickém bodě x0 bude derivace f (x) rostoucí při kladné druhé derivaci a klesající při záporné. Jestliže je ale rostoucí, znamenená to, že nutně bude záporná nalevo od kritického bodu a kladná napravo od něj. Funkce f v takovém případě je klesající nalevo od kritického bodu a rostoucí napravo od něj. To znamená, že má funkce f v bodě x0 minimum ze všech hodnot z nějakého malého okolí bodu x0. Naopak, je-li druhá derivace záporná v x0, je první derivace klesající, tedy záporná vlevo od x0 a kladná vpravo. Funkce f bude tedy mít v bodě x0 maximální hodnotu ze všech hodnot na nějakém okolí. Funkce diferencovatelná na (a, b) a spojitá na [a, b] má jistě na tomto intervalu absolutní maximum a minimum. Může ho dosáhnout pouze buď na hranici nebo v bodě s nulovou derivací, tj. v kritickém bodě. Pro diskusi extrémů nám tedy mohou stačit kritické body a druhé derivace pomůžou určit typy extrémů, pokud jsou nenulové. Pro přesnější diskusi ale potřebujeme lepší než lineární aproximace zkoumaných funkcí. Proto se nejprve budeme věnovat úvahám v tomto směru a teprve poté se vrátíme k diskusi průběhu funkcí. 6.6 6.4. Taylorův rozvoj. Jako překvapivě jednoduché využití Rolleovy věty teď odvodíme mimořádně důležitý výsledek. Říkává se mu Taylorův rozvoj se zbytkem. Intuitivně se k němu můžeme dostat obrácením našich úvah kolem mocninných řad. Máme-li totiž mocninnou řadu S(x) = ∞ n=0 an(x − a)n 229 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET a derivujeme-li ji opakovaně, dostáváme mocninné řady (víme, že je možné takový výraz derivovat člen po členu, i když jsme to ještě nedokázali) S(k) (x) = ∞ n=k n(n − 1) . . . (n − k + 1)an(x − a)n−k . V bodě x = a je tedy S(k) (a) = k!ak. Můžeme tedy naopak číst poslední tvrzení jako rovnici pro ak a původní řadu přepsat jako S(x) = ∞ n=0 1 k! S(k) (a)(x − a)n . Jestliže místo mocninné řady máme nějakou dostatečně hladkou funkci f (x), je tedy na místě se ptát, zda ji můžeme vyjádřit jako mocninnou řadu a jak rychle budou konvergovat částečné součty (tj. přiblížení funkce f polynomy). Naše úvaha právě naznačila, že můžeme očekávat v okolí bodu a dobrou aproximaxi polynomy, tzv. Taylorovými polynomy k–tého řádu: Pkf (x) = f (a) + f (a)(x − a) + 1 2 f (a)(x − a)2 + + 1 6 f (3) (a)(x − a)3 + · · · + 1 k! f (k) (a)(x − a)k . Přesná odpověď vypadá podobně jako věta o střední hodnotě, jen pracujeme s vyššími stupni plynomů (tzv. Taylorův rozvoj se zbytkem): Věta. Nechť je f (x) funkce k–krát diferencovatelná na intervalu (a, b) a spojitá na [a, b]. Pak pro každé x ∈ (a, b) existuje číslo c ∈ (a, x) takové, že f (x) = f (a) + f (a)(x − a) + . . . + 1 (k − 1)! f (k−1) (a)(x − a)k−1 + 1 k! f (k) (c)(x − a)k = Pk−1f (x) + 1 k! f (k) (c)(x − a)k . Důkaz. Definujme zbytek R (tj. chybu při aproximaci pro pevně zvolené x) takto f (x) = Pk−1f (x) + R tj. R = 1 k! r(x − a)k pro vhodné číslo r (závislé na x). Nyní uvažujme funkci F(ξ) definovanou F(ξ) = k−1 j=0 1 j! f (j) (ξ)(x − ξ)j + 1 k! r(x − ξ)k . 230 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET Její derivace (přičemž x je pro nás konstantní parametr) je F (ξ) = f (ξ)+ k−1 j=1 1 j! f (j+1) (ξ)(x − ξ)j − 1 (j − 1)! f (j) (ξ)(x − ξ)j−1 − 1 (k − 1)! r(x − ξ)k−1 = 1 (k − 1)! f (k) (ξ)(x − ξ)k−1 − 1 (k − 1)! r(x − ξ)k−1 = 1 (k − 1)! (x − ξ)k−1 (f (k) (ξ) − r), protože výrazy v sumě se postupně vzájemně ruší. Nyní si stačí všimnout, že F(a) = F(x) = f (x) (připoměňme, že x je libovolně zvolená ale pevná hodnota v intervalu (a, b)). Proto podle Rolleovy věty existuje číslo c, a < c < x, takové, že F (c) = 0. To ale je právě požadovaný vztah. 6.6a 6.5. Odhady pro rozvoje se zbytkem. Obzvlášť jednoduchý je Taylorův rozvoj libovolného polynomu f (x) = anxn + an−1xn−1 + · · · + a1x + a0, an = 0. Protože je (n + 1)–ní derivace f identicky nulová, má Taylorův polynom stupně n nulový zbytek a tedy je pro každé x0 ∈ R f (x) = f (x0)+f (x0)(x −x0)+· · ·+ 1 n! f (n) (x0)(x −x0)n a všechny derivace snadno vyčíslíme (např. poslední výraz je vždy tvaru an(x − x0)n ). Tento výsledek je velmi speciálním odhadem chyby v Taylorově rozvoju se zbytkem. Víme totiž předem, že zbytek je odhadnutelný pomocí velikosti derivace a ta je u polynomu od určitého řádu identicky nulová. I obecněji vede odhad velikost k–té derivace na nějakém intervalu k odhadu chyby na témže intervalu. Speciálním případem je také věta o střední hodnotě coby aproximace Taylorovým rozvojem řádu nula, viz (5.9). Dobrým příkladem pro libovolný řád jsou třeba goniometrické funkce. Iterováním derivace funkce sin x dostaneme vždy buď sinus nebo cosinus s nějakým znaménkem, ale v absolutní hodnotě budou hodnoty vždy nejvýše jedna. Dostáváme tedy přímý odhad rychlosti konvergence mocninné řady | sin x − (Pk sin)(x)| ≤ |x|k+1 (k + 1)! . Vidíme tedy, že pro x výrazně menší než k bude chyba malá, pro x srovnatelné s k nebo větší ale bude obrovská. 6.7 6.6. Analytické a hladké funkce. Je-li f v bodě a hladká, pak můžeme napsat formálně mocninnou řadu S(x) = ∞ n=0 1 k! f (k) (a)(x − a)n . 231 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET Taylorova věta nám říká, že pokud tato mocninná řada má nenulový poloměr konvergence, pak je S(x) = f (x) na příslušném intervalu. Takovým funkcím říkáme analytické funkce v bodě a. Funkce je analytická na intervalu, je-li analytická v každém jeho bodě. Ne všechny hladké funkce jsou ale analytické. Ve skutečnosti lze dokázat, že pro každou posloupnost čísel an umíme najít hladkou funkci, jejiž derivace řádů k budou tato čísla ak.1 Abychom si alespoň představili podstatu problému, ukážeme si (jak se později uvidí velice užitečnou) funkci, která má v nule všechny derivace nulové, je však všude kromě tohoto bodu nenulová. Uvažme funkci definovanou vztahem f (x) = e−1/x2 . Evidentně jde o dobře definovanou hladkou funkcí ve všech bodech x = 0. V bodě x = 0 však existuje limita limx→0 f (x) = 0. Můžeme proto dodefinovat f (0) = 0 a získáváme spojitou funkci. Přímým výpočtem s použitím L’Hospitalova pravidla vyjádříme derivaci f (0) = lim x→0 e−1/x2 −0 x = lim x→0 x−1 e1/x2 = 2 lim x→0 x e1/x2 = 0. Derivací f v obecném bodě dostaneme f (x) = e−1/x2 ·2x−3 a libovolnou konečněkrát opakovanou derivací funkce f (x) dostaneme součet konečně mnoha členů tvaru C · f (x) · x−k , kde C je nějaké celé číslo a k je přirozené číslo. Každý výraz x−k e−1/x2 = x−k / e1/x2 je pro x → 0 výrazem typu ∞/∞, na který můžeme opakovaně použít L’Hospitalovo pravidlo. Zjevně po několika derivacích čitatele i jmenovatele bude ve jmenovateli stále stejný výraz, zatímco v čitateli již bude mocnina nezáporná. Celý výraz tedy nutně má v nule limitu nulovou, stejně jako jsme počítali v případě první derivace výše. Protože totéž bude platit pro konečný součet takových výrazů, bude mít nulovou hodnotu v limitě v nule i každá derivace f (k) (x). Jestliže nyní dodefinujeme hodnoty všech derivací naší funkce v nule rovnicí f (k) (0) = 0, a zkusíme derivovat funkci f (k) v nule, dostaneme opět konečný součet výrazů jako výše a proto ukazuje náš předchozí výpočet s pomocí L’Hospitalova pravidla, že skutečně derivace této funkce bude i v nule existovat a bude skutečně rovna opět nule. Získali jsme tedy hladkou funkci na celém R. Je vidět, že skutečně jde o nenulovou funkci všude mimo x = 0, všechny její derivace v tomto bodě jsou ale nulové. Samozřejmě to tedy není analytická funkce v bodě x0 = 0. 1Jde o speciální případ tzv. Whitneyho věty, viz. doplnit citaci a info. 232 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET 6.7a 6.7. Další příklady neanalytických hladkých funkcí. Snadno můžeme naši funkci f (x) z předchozího odstavce modifikovat takto: g(x) = 0 je-li x ≤ 0 e−1/x2 je-li x > 0 . Opět jde o hladkou funkci na celém R. Další úpravou můžeme získat funkci nenulovou ve všech vnitřních bodech intervalu [−a, a], a > 0 a nulovou jinde: h(x) = 0 je-li |x| ≥ a e 1 x2−a2 + 1 a2 je-li |x| < a. Tato funkce je opět hladká na celém R. Poslední dvě funkce jsou na obrázcích, vpravo je použit parametr a = 1. 0,8 0,6 0,4 0,2 x 0 43210 0-0,2-0,4 1 x 0,8 0,6 0,4 0,4 0,2 0,2 0 Nakonec ještě ukážeme, jak lze dostat hladké analogie Heavisideových funkcí. Pro dvě pevně zvolená reálná čísla a < b definujeme funkci f (x) s použitím výše definované funkce g takto: f (x) = g(x − a) g(x − a) + g(b − x) . Zjevně je pro každé x ∈ R jmenovatel zlomku kladný (pro každý z intervalů určených čísly a a b je totiž alespoň jeden ze sčítanců jmenovatele nenulový a tedy je celý jmenovatel kladný). Dostáváme z našeho definičního vztahu proto hladkou funkci f (x) na celém R. Při x ≤ a je přitom jmenovatel zlomku přímo dle definice funkce g nulový, při x ≥ b je čitatel i jmenovatel stejný. Na dalších dvou obrázcích jsou právě funkce f (x) a to s parametry a = 1 − α, b = 1 + α, kde nalevo je α = 0.8 a napravo α = 0.4. 1 0,8 0,6 0,4 0,2 0 x 21,510,50 alpha = .8 1 0,8 0,6 0,4 0,2 0 x 21,510,50 alpha = .40000 233 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET Snadno nyní také vytvoříme hladkou obdobu charakteristické funkce intervalu [c, d]. Označme si jako f (x) výše uvedenou funkci f (x) s parametry a = − , b = + . Nyní pro interval (c, d), s délkou d − c > 2 definujeme funkci h (x) = f (x−c)·f (d −x). Tato funkce je identicky nulová na intervalech (−∞, c − ) a (d + , ∞) a je identicky rovna jedné na intervalu (c + , d − ), přičemž je všude hladká a lokálně je buď konstantní nebo monotóní. Čím menší je > 0, tím rychleji naše funkce přeskočí z nuly na jedničku kolem začátku intervalu nebo zpět na konci intervalu. Vidíme tedy, že hladké funkce jsou velice „plastické“ — z lokálního chování kolem jednoho bodu nemůžeme říci vůbec nic o globálním chování takové funkce. Naopak, analytické funkce jsou zcela určené dokonce jen derivacemi v jediném bodě. Zejména jsou tedy bezezbytku určené svým chováním na libovolně malém okolí jediného bodu ze svého definičního oboru. Jsou tedy v tomto smyslu velice „rigidní“. 6.8 6.8. Lokální chování funkcí. Viděli jsme, že znaménko první derivace určuje u každé diferencovatelné funkce, zda roste nebo klesá na nějakém okolí daného bodu. Pokud je ale derivace nulová, sama o sobě mnoho o chování funcke neříká. Už jsme se ale setkali s významem druhé derivace při popisu kritických bodů. Teď zobecníme diskusi kritických bodů pro všechny řády. Začneme diskusí lokálních extrémů funkcí, tj. hodnot, které jsou ostře větší nebo ostře menší než všechny z nějakého okolí daného bodu. Budeme v dalším uvažovat funkce s dostatečným počtem spojitých derivací, aniž bychom tento předpoklad přímo uváděli. Řekneme, že bod a v definičním oboru funkce f je kritický bod řádu k, jestliže platí f (a) = · · · = f (k) (a) = 0, f (k+1) (a) = 0. Předpokládejme, že f (k+1) (a) > 0. Pak je tato spojitá derivace kladná i na jistém okolí O(a) bodu a. Taylorův rozvoj se zbytkem nám v takovém případě dává pro všechna x z O(a) f (x) = f (a) + 1 (k + 1)! f (k+1) (c)(x − a)k+1 . Je proto změna hodnot f (x) v okolí bodu a dána chováním funkce (x − a)k+1 . Je-li přitom k + 1 sudé číslo, jsou nutně hodnoty f (x) v takovém okolí větší než hodnota f (a) a zjevně je proto bod a bodem lokálního minima. Pokud je ale k sudé číslo, pak jsou hodnoty vlevo menší a vpravo větší než než f (a), extrém tedy ani lokálně nenastává. Zato si můžeme všimnout, že graf funkce f (x) protíná svoji tečnu y = f (a) bodem [a, f (a)]. Naopak, je-li f (k+1) (a) < 0, pak ze stejného důvodu jde o lokální maximum při lichém k a extrém opět nenastává pro k sudé. 234 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET 6.8a 6.9. Konvexní a konkávní funkce. Říkáme, že funkce f je v bodě a konkávní, jestliže se její graf nachází v jistém okolí celý pod tečnou v bodě [a, f (a)], tj. f (x) < f (a) + f (a)(x − a). Říkáme, že funkce f je konvexní v bodě a, jetliže naopak je její graf nad tečnou v bodě a, tj. f (x) ≥ f (a) + f (a)(x − a). Funkce je konvexní nebo konkávní na intervalu, jestliže má tuto vlastnost v každém jeho bodě. Z Taylorova rozvoje druhého řádu se zbytkem dostáváme f (x) = f (a) + f (a)(x − a) + 1 2 f (c)(x − a)2 . Proto je zjevně funkce konvexní, kdykoliv je f (a) > 0, a je konkávní, kdykoliv f (a) < 0. Pokud je druhá derivace nulová, můžeme použít derivace vyšších řádů. Stejný závěr ovšem umíme učinit pouze, pokud první další nenulová derivace po první derivaci bude sudého řádu. Pokud bude naopak první nenulová řádu lichého, bude zjevně body grafu funkce na různých stranách nějakého malého okolí zkoumaného bodu na opačných stranách tečny v tomto bodě. 6.8b 6.10. Inflexní body. Bod a nazýváme inflexní bod funkce f , jestliže graf funkce f přechází z jedné strany tečny na druhou. Napišme si Taylorův rozvoj třetího řádu se zbytkem: f (x) = f (a)+f (a)(x−a)+ 1 2 f (a)(x−a)2 + 1 6 f (c)(x−a)3 . Je-li a nulový bod druhé derivace takový, že f (a) = 0, pak je třetí derivace nenulová i na nějakém okolí a jde proto zjevně o inflexní bod. Znaménko třetí derivace nám v takovém případě určuje, zda graf funkce přechází tečnu zdola nahoru nebo naopak. Pokud je bod a navíc izolovaným nulovým bodem druhé derivace a zároveň inflexním bodem, pak zjevně je na nějakém malém okolí bodu a funkce na jedné straně konkávní a na druhé konvexní. Inflexní body tedy můžeme také vnímat jako body přechodu mezi konkávním a konvexním chováním grafu funkce. 6.8c 6.11. Asymptoty grafu funkce. Poslední dobrou pomůckou pro náčrtek grafu funkce je zjištění asymptot, tj. přímek, ke kterým se blíží hodnoty funkce f . Asymptotou v nevlastním bodě ∞ je proto taková přímka y = ax + b, pro kterou je lim x→∞ (f (x) − ax − b) = 0. Pokud asymptota existuje, platí lim x→∞ (f (x) − ax) = b 235 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET a tedy existuje i limita lim x→∞ f (x) x = a. Pokud ovšem existují poslední dvě limity, existuje i limita z definice asymptoty, jde proto i o podmínky dostatečné. Obdobně se definuje a počítá asymptota i v nevlastním bodě −∞. Tímto způsobem dohledáme všechny potenciální přímky splňující vlastnosti asymptot s konečnou reálnou směrnicí. Zbývají nám případné přímky kolmé na osu x: Asymptoty v bodech a ∈ R jsou přímky x = a takové, že funkce f má v bodě a alespoň jednu nekonečnou jednostrannou limitu. Např. racionální funkce lomené mají v nulových bodech jmenovatele, které nejsou nulovými body čitatele, asymptotu. Spočtěme aspoň jeden jednoduchý příklad: Funkce f (x) = x + 1 x má za asymptoty přímky y = x a x = 0. Skutečně, jednostranné limity zprava a zleva v nule jsou zjevně ±∞, zatímco limita f (x)/x = 1 + 1/x2 je samozřejmě v nevlastních bodech právě ±1, zatímco limita f (x) − x = 1/x je v nevlastních bodech nulová. Derivací obdržíme f (x) = 1 − x−2 , f (x) = 2x−3 . Funkce f (x) má dva nulové body ±1. V bodě x = 1 má funkce lokální minimum, v bodě x = −1 lokální maximum. Druhá derivace nemá nulové body v celém definičním oboru (−∞, 0) ∪ (0, ∞), f tedy nemá naše funkce žádný inflexní bod. -4 0-2-4 y x 4 4 2 0 2 -2 6.8d 6.12. Diferenciál funkce. Při praktickém používání diferenciálního počtu často pracujeme se závislostmi mezi různými veličinami, řekněme y a x, a není dána pevně volba závislé a nezávislé proměnné. Explicitní vztah y = f (x) s nějakou funkcí f je tedy jen jednou z možností. Derivování pak vyjadřuje, že okamžitá změna y = f (x) je úměrná okamžité změně x a to s úměrou f (x) = df dx . Tento vztah se často píše jako df = df dx (x)dx, 236 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET kde df (x) interpretujeme jako lineární zobrazení přírůstků dané df (x)( x) = f (x) · x, zatímco dx(x)( x) = x. Hovoříme o diferenciálu funkce f pokud platí aproximační vlastnost lim x→0 f (x + x) − df (x)( x) x = 0 Z Taylorovy věty tedy vyplývá, že funkce s ohraničenou derivací f má diferenciál df . To zejmena nastane v bodě x, když v něm první derivace existuje a je spojitá. Pokud je veličina x vyjádřena pomocí další veličiny t, tj. x = g(t), a to opět funkcí se spojitou první derivací, pak pravidlo o derivaci složené funkce říká, že i složená funkce f ◦ g má opět diferenciál df = df dx (x) dx dt (t)dt. Můžeme proto vnímat df jako lineární přiblížení dané veličiny v závislosti na přírustcích závislé proměnné, ať už je tato závislost dána jakkoliv. 6.8e 6.13. Křivost grafu funkce. Abychom se pocvičili v základních pravidlech pro derivování složených funkcí apod., budeme graf hladké funkce f (x) teď chvíli diskutovat jako zvláštní případ parametrizované křivky v rovině. Můžeme si ji představit jako pohyb v rovině parametrizovaný pomocí nezávislé proměnné x. Pro libovolný bod x z definičního oboru naší funkce můžeme okamžitě výpočtem první derivace vidět vektor (1, f (x)) ∈ R2 , který představuje okamžitou rychlost takového pohybu. Tečna bodem [x, f (x)] parametrizovaná pomocí tohoto směrového vektoru pak představuje lineární přiblížení křivky. Viděli jsme už také, že v případě, že f (x) = 0, přechází graf naší funkce přes svoji tečnu, tzn. že tečna je i nejlepším přiblížením křivky v bodě x i do druhého řádu. To zpravidla popisujeme tvrzením, že má graf funkce f v bodě x nulovou křivost. Tak jak u první derivace nenulové hodnoty vyjadřovaly rychlost růstu (ať už s jakýmkoliv znaménkem), stejně asi intuitivně očekáváme, že druhá derivace bude popisovat míru zakřivení grafu. Zatím jsme jen viděli, že je graf funkce nad svojí tečnou pro kladnou hodnotu a pod tečnou v případě opačném. Tečnu grafu v pevném bodě P = [x, f (x)] jsme dostali pomocí limity sečen, tj. přímek procházejícími body P a Q = [x + x, f (x + x)]. Chceme-li přiblížit druhou derivaci, budeme body P a Q = P prokládat kružnicí CQ, jejíž střed je na průsečíku kolmic na tečny, vztyčených v bodech P a Q. Z obrázku je patrné, že jestliže tečna v pevném bodě P svírá s osou x úhel α a tečna v Q úhel α + α, pak i úhel zmíněných kolmic v jejich průsečíku bude α. Označíme-li poloměr naší kružnice ρ, pak délka oblouku kružnice mezi body P a Q bude ρ α. Jestliže budeme limitně přibližovat bod Q k pevnému bodu P, bude se zároveň délka oblouku kružnice blížit délce s studované křivky, tj. grafu funkce f (x), 237 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET a kružnice limitně přejde do kružnice CP . Dostáváme tedy pro limitní poloměr ρ kružnice CP základní vztah ρ = lim α→0 s α = ds dα . Křivost grafu funkce f v bodě P definujeme jako číslo 1/ρ. Nulová křivost tedy odpovídá nekonečnému poloměru ρ. Pro výpočet poloměru ρ potřebujeme umět vyjádřit délku oblouku s pomocí změny úhlu α a derivaci této funkce pak vyjádřit pomocí derivací funkce f . Všimněme si již teď, že při rostoucím úhlu θ může délka oblouku buď také růst nebo klesat, podle toho, jestli má kružnice CQ střed nad nebo pod grafem funkce f . Znaménko ρ nám tedy odráží, zda je funkce konkávní nebo konvexní. Je třeba také pomyslet na zvláštní případ, kdy střed limitně „uteče“ do nekonečna, tj. místo kružnice limitně dostaneme přímku a to opět tečnu. Evidentně nemáme přímý nástroj na vyčíslení derivace ds dα . Víme však, že tg α = df/dx a derivováním této rovnosti podle x dostaneme (s využitím pravidla pro derivaci složených funkcí) 1 (cos α)2 dα dx = f . Na levé straně můžeme dosadit 1 (cos α)2 = 1 + (tg α)2 = 1 + (f )2 a proto platí také (viz pravidlo pro derivování inverzní funkce) dx dα = 1 + (tg α)2 f = 1 + (f )2 f . To už jsme ale skoro hotoví, protože přírůstek délky oblouku s v závislosti na proměnné x je dán vztahem ds dx = (1 + (f )2 )1/2 a tedy můžeme již snadno spočíst podle pravidla pro derivování složené funkce ρ = ds dα = ds dx dx dα = (1 + (f )2 )3/2 f . Nyní již můžeme vyčíst vztah křivosti a druhé derivace: čitatel našeho zlomku je, nezávisle na hodnotě první derivace, vždy kladný. Je roven třetí mocnině velikosti tečného vektoru ke studované křivce. Znaménko křivosti tedy je dáno jen znaménkem druhé derivace, což jen znovu potvrzuje naši úvahu o konkávních a konvexních bodech funkcí. V případě, že je druhá derivace nulová, dostaneme i křivost nulovou. Kružnici, pomocí které jsme křivost definovali nazýváme oskulační kružnicí. Zkuste si spočíst křivost jednoduchých funkcí sami a využijte oskulační kružnice při náčrtech jejich grafů. Nejjednodušší je výpočet v kritických bodech funkce f — v těch dostáváme poloměr oskulační kružnice jako reciprokou hodnotu druhé derivace opatřenou znaménkem. 238 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET 6.8f 6.14. Vektorový diferenciální počet v rovině a v prostoru. Jak jsme zmínili hned v úvodu k páté kapitole, pro naše úvahy o derivování bylo vesměs podstatné, že jsme zkoumali funkce definované na reálných číslech a že jejich hodnoty lze mezi sebou sčítat a lze je násobit reálnými čísly. Tj., potřebujeme, aby naše funkce f : R → V měly hodnoty ve vektorovém prostoru V . Budeme jim pro odlišení říkat vektorové funkce. Nyní se budeme podrobněji věnovat zobrazením f : R → R2 a f : R → R3 . Hovoříme o (parametrizovaných) křivkách v rovině a v prostoru. Obdobně bychom mohli pracovat s hodnotami v Rn pro jakoukoliv konečnou dimenzi n. Pro zjednodušení budeme pracovat v pevných standardních bazích ei v R2 a R3 , takže naše křivky budou dány dvojicemi, resp. trojicemi obyčejných reálných funkcí jedné reálné proměnné. Vektorová funkce r v rovině, resp. v prostoru, je tedy dána r(t) = x(t)e1 + y(t)e2, r(t) = x(t)e1 + y(t)e2 + z(t)e3. Derivace takové vektorové funkce je opět vektor, který přibližuje zobrazení r pomocí lineráního zobrazení přímky do roviny či prostoru. V rovině je to tedy dr(t) dt (t) = dx dt (t)e1 + dy dt (t)e2 a podobně v prostoru. V tomto kontextu je také třeba vnímat diferenciál vektorové funkce: dr = dx dt e1 + dy dt e2 + dz dt e3 dt kde výraz na pravé straně chápeme tak, že se přírůstek skalární nezávisle proměnné t lineárně zobrazí pomocí vynásobení vektoru derivace a tím dostaneme příslušný přírůstek vektorové veličiny r. Jestliže vektor r(t) představuje parametrizaci křivky, pak jeho derivace je vektorem rychlosti takto zadané dráhy. Speciální případ vektoru r(t) = te1 + f (t)e2 zadávajícího graf funkce f jsme zkoumali v minulém odstavci. Druhá derivace pak představuje zrychlení takto zadaného pohybu. Všimněme si, že samozřejmě zrychlení nemusí být kolineární s rychlostí. V případě grafu funkce je dokonce zrychlení kolineární s rychlostí pouze v bodech, kde je f nulová, což odpovídá představě, že kolineární může zrychlení být pouze, když je křivost grafu nulová. 6.8g 6.15. Diferencování složených zobrazení. V lineární algebře a geometrii jsou velice užitečná zobrazení, kterým říkáme formy. Jako argumenty mají jeden nebo více vektorů a v každém ze svých argumentů jsou lineární. Zadáváme tak velikost vektorů (skalární součin je symetrická bilineární forma) nebo objem rovnoběžnostěnů (to je n-lineární antisymetrická forma, kde n je dimenze prostoru), viz např. odstavce 2.44 a 4.20. 239 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET Do těchto operací samozřejmě můžeme dosazovat vektory r(t) závisející na parametru. Přímočarou aplikací Leibnitzova pravidla pro derivaci součinu funkcí ověříme následující Věta. (1) Je-li r(t) : R → Rn diferencovatelný vektor a : Rn → Rm lineární zobrazení, pak pro derivaci zobrazení ◦ r platí d( ◦ r) dt = ◦ dr dt . (2) Uvažujme diferencovatelné vektory r1, ..., rk : R → Rn a je k–linerání formu : Rn × . . . ×Rn na prostoru Rn . Pak pro derivaci složeného zobrazení ϕ(t) = (r1(t), . . . , rk(t)) platí dϕ dt = dr1 dt , r2, . . . , rk + · · · + r1, . . . , rk−1, drk dt . (3) Předchozí tvrzení zůstává bezezbytku v platnosti i pokud je samo vektorově hodnotové (a také lineární ve všech k argumentech). Důkaz. (1) V lineární algebře se ukazuje, že lineární zobrazení jsou dána konstantní maticí skalárů A = (aij ) tak, že ◦ r(t) = n i=1 a1iri(t), . . . , n i=1 amiri(t) . Derivaci nyní provádíme po jednotlivých souřadnicích výsledku. Víme ale, že derivace se chová lineárně vůči skalárním lineárním kombinacím, viz Věta 5.32. Proto skutečně dostaneme derivaci ◦ r(t) prostým vyčíslením původního lineárního zobrazení na derivaci r (t). (2) Zcela obdobně dostatneme i druhé tvrzení. V souřadnicích rozepíšeme vyčíslení k–lineární formy na vektorech r1, ..., rk takto (r1(t), . . . , rk(t)) = n i1,...,ik=1 Bi1...ik · (r1)i1 (t) . . . (rk)ik (t), kde skaláry Bi1...ik jsou pro každou volbu indexů dány jako hodnota dané formy (ei1 , . . . , eik ) na zvolené k–tici bázových vektorů. Pravidlo pro derivaci součinu skalárních funkcí nám dá právě dokazované tvrzení. (3) Pokud má vektorové hodnoty, je zadáno konečně mnoha komponentami a můžeme použít předchozí úvahu na každou z nich. Na euklidovském prostoru R3 máme kromě skalárního součinu, který dvěma vektorům přiřadí skalár, také vektorový součin, který dvěma vektorům u a v přiřadí vektor u×v ∈ R3 , viz 4.22.. Tento vektor u × v je kolmý na oba vektory u a v, má velikost rovnou obsahu rovnoběžníka určeného vektory u a v (v tomto pořadí) a orientaci takovou, trojice u, v, u × v byla kladně orientovanou bází. Z předchozí věty okamžitě vyplývají užitečná tvrzení: Důsledek. V prostoru R3 uvažme vektory u(t) a v(t). Pro derivace jejich skalárního součin u(t), v(t) a vektorový součin 240 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET u(t) × v(t) platí d dt u(t), v(t) = u (t), v(t) + u(t), v (t)(6.1) d dt (u(t) × v(t)) = u (t) × v(t) + u(t) × v (t)(6.2) 6.8h 6.16. Křivost křivek. Nyní máme daleko mocnější nástroje pro studium křivek systematičtějším způsobem, než když jsme diskutovali křivost grafů funkcí. Podívejme se obecně na křivky r(t) v prostoru a předpokládejme, že jsou parametrizovány tak, aby jejich tečný vektor měl stále velikost jedna, tj. r (t), r (t) = 1 pro všechna t. Říkáme, že je křivka r(t) parametrizována délkou. Další derivací tohoto jednotkového vektoru r (t) dostaneme vektor r (t), pro který spočteme (využíváme symetrie skalárního součinu) 0 = d dt r (t), r (t) = 2 r (t), r (t) a je tedy vektor zrychlení r (t) vždy kolmý na vektor rychlosti. To odpovídá představě, že volbou parametrizace s konstantní velikostí rychlosti, nemůže být zrychlení ve směru pohybu znatelné, musí tedy celé zrychlení být v rovině kolmé k vektoru rychlosti. Pokud je druhá derivace nenulová, normovaný vektor n(t) = 1 r (t) r (t) nazýváme hlavní normálou křivky r(t). Skalární funkce κ(t) splňující (v bodech, kde je r (t) = 0) r (t) = κ(t)n(t) se nazývá křivost křivky r(t). V nulových bodech druhé derivace definujeme κ(t) také nulovou hodnotou. V nenulových bodech křivosti je dobře definován jednotkový vektor b(t) = r (t) × n(t), který nazýváme binormála křivky r(t). Přímým výpočtem dostáváme 0 = d dt b(t), r (t) = b (t), r (t) + b(t), r (t) = b (t), r (t) + κ(t) b(t), n(t) = b (t), r (t) , což ukazuje, že je tečný vektor k binormále kolmý jak na b(t), tak na r (t). Musí tedy být násobkem vektoru hlavní normály. Píšeme b (t) = −τ(t)n(t) a skalární funkci τ(t) nazýváme torze křivky r(t). Ještě jsme nespočetli rychlost změny hlavní normály, kterou můžeme také psát jako n(t) = b(t) × r (t). n (t) = b (t) × r (t) + κ(t)b(t) × n(t) = −τ(t)n(t) × r (t) + κ(t)(−r (t)) = τ(t)b(t) − κ(t)r (t). Postupně jsme pro všechny body s nenulovou druhou derivací křivky r(t) parametrizované délkou oblouku odvodili význačnou bázi (r (t), n(t), b(t)), které se v klasické literatuře 241 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET říká Frenetův reper a zároveň jsme v této bázi vyjádřili derivace jejích komponent formou tzv. Frenetových–Serretových formulí dr dt (t) = κ(t)n(t), dn dt (t) = τ(t)b(t) − κ(t)r (t) db dt (t) = −τ(t)n(t). Všimněme si, že pokud křivka r(t) leží stále v jedné rovině, pak je její torze identicky nulovou funkcí. Ve skutečnosti platí i obrácené tvrzení, které tu nebudeme dokazovat, vyplývá ale z následujícího klasického výsledku geometrické teorie křivek: Dvě křivky v prostoru parametrizované délkou oblouku lze jednu na druhou zobrazit pomocí euklidovské transformace právě, když jejich funkce křivosti a torze splývají, až na konstatní posuv parametru. Navíc, pro každou volbu hladkých funkcí κ a τ existuje hladká křivka s těmito prametry. Tento výsledek tu nebudeme dokazovat, zájemce může podrobný výklad nalézt v [?]. Přímým výpočtem můžeme zkontrolovat, že křivost grafu funkce f v rovině a křivost κ této křivky zavedené v tomto odstavci splývají. Skutečně, výpočtem derivace složené funkce s pomocí diferenciálu délku oblouky pro graf funkce ve tvaru dt = (1 + (f )2 )dx, tj. dx = (1 + (f )2 )−1/2 dt dostaneme pro náš jednotkový tečný vektor grafu křivky vztah r (t) = (1 + (f )2 )−1/2 , f (1 + (f )2 )−1/2 a poměrně nepřehledným, ale obdobným výpočtem druhé derivace a její velikosti skutečně obdržíme κ2 = r 2 = (f )2 (1 + (f )2 )−3 . 6.8i 6.17. Aproximace derivací a asymptotické odhady. Hned na začátku této učebnice jsme v odstavcích 1.3, 1.9 a dále diskutovali, jak zadávat hodnotu funkce pomocí změn, tj. diferencí. V další části textu budeme obdobně rekonstruovat funkci f z jejích derivací, tj. okamžitých změn. Předtím se ale pozastavme u souvislosti derivací a diferencí. Klíčem nám k tomu bude Taylorova věta. Předpokládejme, že z (dostatečně) diferencovatelné funkce f (x), definované na intervalu [a, b], známe hodnoty fi = f (xi) v bodech x0 = a, x1, . . . , xn = b, přičemž pro všechny indexy i = 1, . . . , n platí xi − xi−1 = h > 0 pro nějakou konstantu h. Taylorův rozvoj pro funkci f v bodě xi pišme ve tvaru f (xi ± h) = fi ± hf (xi) + h2 2 f (xi) ± h3 3! f (3) (xi) + . . . Víme, že když v rozvoji skončíme členem řádu k v h, tj. výrazem obsahujím hk , pak se dopustíme chyby, která je omezená každým odhadem výrazu hk+1 (k + 1)! f (k+1) (x) 242 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET na intervalu [xi − h, xi + h]. Pokud je i (k + 1)–vá derivace f spojitá, můžeme ji odhadnout konstantou. Vidíme pak, že se pro malá h chová Taylorův polynom stupně k stejně jako hk+1 , až na konstantní násobek. Takovému odhadu se říká asymptotický odhad. Definice. Řekneme, že výraz G(h) je pro h → 0 asymptoticky stejný s výrazem F(h) a píšeme G(h) = O(F(h)), jestliže existuje konečná limita lim h→0 G(h) hk = a ∈ R. Označme si hledané odhady hodnot derivací f (x) v bodech xi jako f (j) i . Pro odhady první derivací můžeme okamžitě použít tři různé diference spočtené z Taylorova rozvoje: f (1) i = fi+1 − fi−1 2h − h2 3! f (3) (xi) − . . . f (1) i = fi+1 − fi h − h 2! f (xi) + . . . f (1) i = fi − fi−1 h + h 2! f (xi) + . . . kde jsme prostě jen odečetli příslušné Taylorovy polynomy. Získáváme tak numerická vyjádření pro první derivaci. První z nich má asymptotický odhad chyby f (1) = fi+1 − fi−1 2h + O(h2 ), další dvě mají chybu O(h). Říkáme jim středová diference, dopředná diference a zpětná diference. Kupodivu je středová diference o řád lepší než zbylé dvě. Stejně můžeme postupovat při odhadu druhé derivace. Nejjednodušší kombinace Taylorových polynomů, ze které nám půjde spočíst f (xi) je (potřebujeme vyrušit první derivace i hodnotu v xi, podaří se přitom přímo zrušit i všechny liché derivace) f (2) i = fi+1 − 2fi + fi+1 h2 + h2 12 f (4) (xi) + . . . . Hvoříme o diferenci druhého řádu a stejně jako u středové první diference je asymptotický odhad chyby o jeden řád lepší, než bychom na první pohled čekali: f (2) i = fi+1 − 2fi + fi+1 h2 + O(h4 ). 2. Integrování 6.9 6.18. Newtonův integrál. Nyní se budeme zajímat o opačný postup než tomu bylo u derivování. Budeme chtít ze znalosti okamžitých změn nějaké funkce rekonstruovat její skutečné hodnoty. Jestliže danou funkci f (x) považujeme za derivaci neznámé funkce F(x), pak na úrovni diferenciálů můžeme psát dF = f (x)dx. 243 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET Funkci F nazýváme antiderivace nebo neurčitý integrál funkce f a tradičně píšeme F(x) = f (x)dx. Lemma. Antiderivace F(x) funkce f (x) je na každém intervalu [a, b] určena jednoznačně až na konstantu. Důkaz. Skutečně, pokud je F (x) = G (x) = f (x) na celém intervalu [a, b], pak Taylorův rozvoj prvního řádu se zbytkem pro funkci F − G v bodě a dává F(x) − G(x) = F(a) − G(a) + (f (c) − f (c))(x − a) = F(a) − G(a) pro jisté c ∈ [a, x] a to pro všechna x z nějakého okolí bodu a. Pokud by ale x0 < b bylo supremem všech hodnot x, pro které tento vztah ještě platí, opětovnou volbou tohoto bodu za a dosáhneme rozšíření tohoto vztahu i napravo od něj. Musí tedy platit na celém intervalu. Předchozí lemma nás vede k tomu, že neurčitý integrál obvykle zapisujeme ve tvaru F(x) = f (x)dx + C s neznámou konstantou C. Hodnotu f (x) můžeme také považovat za okamžitý přírůstek plochy vymezené grafem funkce f a osou x a snažit se najít velikost této plochy mezi krajními hodnotami a a b nějakého intervalu. Zkusme tuto představu dát do souvislosti s neurčitým integrálem. Předpokládejme tedy, že na intervalu [a, b] známe reálnou funkci a její neurčitý integrál F(x), tj. F (x) = f (x). Jestliže rozdělíme interval [a, b] na n částí volbou bodů a = x0 < x1 < · · · < xn = b a přiblížíme hodnoty derivací v bodech xi výrazy f (xi) F(xi+1) − F(xi) xi+1 − xi dostáváme součtem přes všechny intervaly našeho dělení odhad hledané velikosti plochy: n−1 i=0 f (xi) · (xi+1 − xi) n−1 i=0 F(xi+1) − F(xi) xi+1 − xi · (xi+1 − xi) = F(b) − F(a) Dá se tedy očekávat, že pro „dostatečně pěkné“ funkce f (x) velikost plochy vymezené grafem funkce a osou x skutečně spočteme jako rozdíl hodnot antiderivace v krajních bodech intervalu. Tomuto postupu se říká Newtonův integrál. Píšeme b a f (x)dx = [F(x)]b a = F(b) − F(a). V případě komplexní funkce f je reálná a imaginární část jejího neurčitého integrálu jednoznačně dána reálnou a 244 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET imaginární částí f , budeme proto v dalším pracovat výhradně s reálnými funkcemi. 6.13 6.19. Integrace „po paměti“. Ještě než si uděláme jasno, jak Newtonův integrál skutečně souvisí s velikostí plochy a jak jej případně lze používat pro modelování praktických problémů, ukážeme několik postupů, jak Newtonův integrál spočítat. Budeme přitom využívat jen naše znalosti o deriva- cích. Nejsnadnější je případ, kdy v integrované funkci umíme derivaci přímo uvidět. K tomu v jednoduchých případech stačí číst tabulky pro derivace funkcí v našem zvěřinci naopak. Dostáváme tak např. následující tvrzení pro všechna a ∈ R a n ∈ Z, n = −1: a dx = ax + C axn dx = a n+1 xn+1 + C eax dx = 1 a eax +C a x dx = a ln x + C a cos(bx) dx = a b sin(bx) + C a sin(bx) dx = −a b cos(bx) + C a cos(bx) sinn (bx) dx = a b(n+1) sinn+1 (bx) + C a sin(bx) cosn (bx) dx = − a b(n+1) cosn+1 (bx) + C a tg(bx) dx = − a b ln(cos(bx)) + C a a2 + x2 dx = arctg x a + C −1 √ a2 − x2 dx = arccos x a + C 1 √ a2 − x2 dx = arcsin t x a + C Ve všech případech je zapotřebí dobře promyslet definiční obor, na kterém je neurčitý integrál dobře definován. K takovýmto tabulkovým pravidlům pro integraci lze relativně snadno dodávat další pravidla jednoduchými pozorováními vhodné struktury integrovaných funkcí. Např. f (x) f (x) dx = ln f (x) + C pro všechny spojitě diferencovatelné funkce f na intervalech, kde jsou nenulové. Samozřejme také z pravidel pro derivaci součtu diferencovatelných funkcí a konstantních násobků diferencovatelných funkcí je zřejmé že obdobná pravidla platí neurčitý integrál také. 245 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET 6.13 6.20. Integrace per partes. Výpočet integrálu pomocí antiderivace (neurčitého integrálu), spolu s pravidlem (F · G) (t) = F (t) · G(t) + F(t) · G (t) pro derivaci součinu funkcí, dává následující formuli pro neurčitý integrál F(x) · G(x) + C = F (x)G(x) dx + F(x)G (x) dx. Tato formule se většinou používá v případě, že jeden z integrálů napravo máme počítat, zatímco druhý umíme počítat lépe. Nejlépe je princip vidět na příkladu. Spočteme I = x sin x dx. V tomto případě pomůže volba F(x) = x, G (x) = sin x. Odtud G(x) = − cos x a proto také I = −x cos x − − cos x dx = −x cos x + sin x + C. Obvyklým trikem je také použít tento postup s F (x) = 1: ln x dx = 1·ln x dx = x ln x− 1 x x dx = x ln x−x+C. 6.13a 6.21. Integrace pomocí substituce. Další užitečný postup je odvozen z derivování složených funkcí. Jestliže F (y) = f (y), y = ϕ(x), pro diferencovatelnou funkci ϕ s nenulovou derivací, potom dF(ϕ(x)) dx = F (y) · ϕ (x) a tedy F(y) + C = f (y) dy lze spočíst jako F(ϕ(x)) + C = f (ϕ(x))ϕ (x) dx. Dosazením x = ϕ−1 (y) pak dostaneme původně požadovanou antiderivaci. Častěji zapisujeme tuto skutečnost takto: f (y) dy = f (ϕ(x))ϕ (x) dx a hovoříme o substituci za proměnnou y. Přímo na úrovni diferenciálů je možné substituci porozumět snadno tak, že (linearizované) přírůstky v proměnné y a v x jsou vzájemně ve vztahu popsaném formálně dy = ϕ (x) dx, což odpovídá vztahu mezi integrovanými veličinami f (y)dy = f (ϕ(x))ϕ (x)dx. Jako příklad ověříme touto metodou předposlední integrál v seznamu v 6.20. Pro integrál I = 1 √ 1 − x2 dx 246 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET zvolíme substituci x = sin t. Odtud dx = cos t dt a dostá- váme I = 1 1 − sin2 t cos t dt = 1 √ cos2 t cos t dt = dt = t + C. Zpětným dosazením t = acrsin x dopočítáme již známý vzorec I = arcsin x + C. Při substitucích je třeba dát pozor na skutečnou existenci inverzní funkce k y = ϕ(x) a při výpočtu určitého integrálu je třeba řádně přepočítávat i meze. Problémům s definičními obory inverzních funkcí se lze někdy vyhnout rozdělením integrace na několik intervalů. 6.15 6.22. Integrace převedením na rekurence. Často vede použití substitucí a metody per partes k rekurentním vztahům, ze kterých teprve lze dopočíst hledané integrály. Budeme ilustrovat na příkladu. Metodou per partes počítáme Im = cosm x dx = cosm−1 x cos x dx = cosm−1 x sin x − (m − 1) cosm−2 x(− sin x) sin x dx = cosm−1 x sin x + (m − 1) cosm−2 x sin2 x dx. Odtud díky vztahu sin2 x = 1 − cos2 x dostáváme mIm = cosm−1 x sin x + (m − 1)Im−2 a počáteční hodnoty jsou I0 = x, I1 = sin x. K těmto typům integrálů se substitucí x = tg t často převádí integrály, kde integrovaná funkce závisí na výrazech tvaru (x2 + 1). Skutečně, např. pro Jk = dx (x2 + 1)k dostáváme zmíněnou substitucí (povšimněme si, že dx = cos−2 t dt) Jk = dt cos2 t sin2 t cos2 t + 1 k = cos2k−2 t dt. Pro k = 2 je výsledkem J2 = 1 2 (cos t sin t + t) = 1 2 tg t 1 + tg2 t + t a proto také po zpětné substituci t = arctg x J2 = 1 2 x 1 + x2 + arctg x + C. Při počítání určitých integrálů je možné celou rekurenci rovnou počítat po vyčíslení v zadaných mezích. Tak například 247 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET je okamžitě vidět, že při integraci přes interval [0, 2π] mají naše integrály hodnoty: I0 = 2π 0 dx = [x]2π 0 = 2π I1 = 2π 0 cos x dx = [sin x]2π 0 = 0 Im = 2π 0 cosm x dx = 0 pro sudá m m−1 m Im−2 pro lichá m . Pro sudé m = 2n tedy dostáváme přímo výsledek 2π 0 cos2n x dx = (2n − 1)(2n − 3) . . . 3 · 1 2n(2n − 2) . . . 2 2π, zatímco u lichých m je to vždy nula (jak bylo možné přímo uhádnout z grafu funkce cos x). 6.16 6.23. Integrace racionálních funkcí lomených. U racionálních funkcí lomených si můžeme při integraci pomoci několika zjednodušeními. Zejména v případě, že je stupeň polynomu f v čitateli větší nebo roven stupni polynomu g ve jmenovateli, je rozumné hned z kraje dělením se zbytkem, viz odstavec 5.2, převést integraci na součet dvou integrálů. První pak bude integrací polynomu a druhý integrací výrazu f/g se stupněm g ostře větším, než je stupeň f . Toho skutečně dosáhneme prostým vydělením polynomu: f = q · g + h, f g = q + h g . Můžeme tedy zrovna předpokládat, že stupeň g je ostře větší než stupeň f . Další postup si ukažme na jednoduchém příkladě. Zkusme si rozebrat, jak se dostaneme k výsledku f (x) g(x) = 4x + 2 x2 + 3x + 2 = −2 x + 1 + 6 x + 2 , který již umíme integrovat přímo: 4x + 2 x2 + 3x + 2 dx = −2 ln |x + 1| + 6 ln |x + 2| + C. Především převedením součtu zlomků na společného jmenovatele tuto rovnost snadno ověříme. Pokud naopak víme, že lze náš výraz rozepsat ve tvaru 4x + 2 x2 + 3x + 2 = A x + 1 + B x + 2 a jde nám pouze o výpočet koeficientů A a B. Můžeme pro ně získat rovnice pomocí roznásobení obou stran polynomem x2 + 3x + 2 ze jmenovatele a porovnáním koeficientů u jednotlivých mocnin x ve výsledných polynomech napravo i nalevo: 4x+2 = A(x+2)+B(x+1) ⇒ 2A+B = 2, A+B = 4. Odtud již přímo vychází náš rozklad. Říká se mu rozklad na parciální zlomky. 248 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET Tento elementární postup lze snadno zobecnit. Jde o čistě algebraickou úvahu opírající se o vlastnosti polynomů, ke kterým se budeme vracet v kapitole ??. Předpokládejme, že jmenovatel g(x) a čitatel f (x) nesdílí žádné reálné ani komplexní kořeny a že g(x) má právě n různých reálných kořenů a1, . . . , an. Pak jsou body a1, . . . an právě všechny body nespojitosti funkce f (x)/g(x). Pro zjednodušení úvahy nejprve pišme g(x) jako součin g(x) = p(x)q(x) dvou nesoudělných polynomů. Díky Bezoutově identitě (viz ??), která je důsledkem obyčejného dělení polynomů se zbytkem, existují polynomy a(x) a b(x) se stupni ostře měnšími než je stupeň g takové, že a(x)p(x) + b(x)q(x) = 1. Vynásobením této rovnosti podílem f (x)/g(x) dostáváme f (x) g(x) = a(x) q(x) + b(x) p(x) . Předpokládejme nyní, že náš polynom g(x) nemá jiné než reálné kořeny, má tedy jednoznačný rozklad na faktory (x − ai)ni , kde ni jsou násobnosti kořenů ai, i = 1, . . . , k. Postupným použitím předchozího postupu s nesoudělnými polynomy p(x) a q(x) dostaneme vyjádření f (x)/g(x) pomocí součtu zlomků ve tvaru r1(x) (x − a1)n1 + · · · + rk(x) (x − ak)mj , kde stupně polynomů ri(x) jsou ostře menší než stupně v jmenovatelích. Každý z nich ale jde velmi snadno rozepsat jako součet r(x) (x − a)n = A1 x − a + A2 (x − a)2 + · · · + An (x − a)n , když začneme od nejvyšších mocnin v polynomu r(x) a postupně počítáme A1, A2, . . . vhodným doplňováním a odebíráním sčítanců v čitateli. Např. 5x − 16 (x − 2)2 = 5 x − 2 (x − 2)2 − 6 1 (x − 2)2 = 5 x − 2 + 6 (x − 2)2 . Zbývá ošetřit ještě případ, kdy reálných kořenů není dostatek. Vždycky ale existuje rozklad g(x) na lineární faktory s případnými komplexními kořeny. Opakování předchozí úvahy pro komplexní polynomy nám dá tentýž výsledek, pokud ale předem víme, že koeficienty polynomů jsou reálné, budou komplexní kořeny v našich výrazech vystupovat vždy po dvojicích komplexně sdružených kořenů. Můžeme proto rovnou pracovat s kvadratickými faktory ve tvaru součtu čtverců (x − a)2 + b2 a jejich mocnin. Naše předchozí úvaha opět dobře funguje a zaručuje, že bude možné hledat příslušné sčítance ve tvaru Bx + C ((x − a)2 + b2)n . 249 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET Obdobně jako v případě reálných kořenů se tedy i v případě mocniny ((x − a)2 + b2 )n takového kvadratického (nerozložitelného) faktoru vždy podaří najít odpovídající rozklad na parciální zlomky tvaru A1x + B1 (x − a)2 + b2 + · · · + Anx + Bn ((x − a)2 + b2)n . Konkrétní výsledky lze také snadno ozkoušet v Maplu pomocí volání procedury „convert(h, parfrac, x)“, které rozloží výraz h polynomiálně závislý na proměnné x na parciální zlomky. Všechny výše uvedené parciální zlomky už umíme integrovat. Připoměňme, že ty poslední zmíněné vedou mimo jiné na integrály diskutované v Příkladě 6.22. Celkově můžeme shrnout, že racionální funkce f (x)/g(x) lze poměrně snadno integrovat, pokud se podaří najít příslušný rozklad polynomu ve jmenovateli g(x). Při výpočtu Newtonových integrálů jsou ale problematické body nespojitosti racionálních funkcí lomených, v jejichž okolí jsou tyto funkce neohraničené. Tomuto problému se budeme obecně ještě věnovat později (viz odstavec 6.30 níže). 6.11 6.24. Riemannův integrál. Myšlenku počítat integrál jako vyjádření plochy vymezené grafem funkce a osou x je třeba zpřesnit. To nyní učiníme a v zápětí dokážeme, že pro všechny spojité funkce tato definice dává stejné výsledky jako Newtonův integrál. Uvažme reálnou funkci f definovanou na intervalu [a, b] a zvolme dělení tohoto intervalu spolu s výběrem reprezentantů ξi jednotlivých částí, tj. a = x0 < x1 < · · · < xn = b a zároveň ξi ∈ [xi−1, xi], i = 1, . . . , n. Normou dělení nazýváme číslo mini{xi − xi−1}. Riemannův součet odpovídající zvolenému dělení s reprezentanty = (x0, . . . , xn; ξ1, . . . , ξn) definujeme jako S = n i=1 f (ξi) · (xi − xi−1). Řekneme, že Riemannův integrál funkce f na intervalu [a, b] existuje, jestliže pro každou posloupnost dělení s reprezentanty ( k) s normou dělení jdoucí k nule existuje limita lim k→∞ S k = S, jejíž hodnota navíc nezávisí na volbě posloupnosti dělení a reprezentantů. Píšeme v takovém případě S = b a f (x)dx. Tato definice nevypadá příliš prakticky, nicméně nám dovolí snadno sformulovat a dokázat některé jednoduché vlastnosti Riemannova integrálu: Věta. (1) Je-li f omezená reálná funkce definovaná na reálném intervalu [a, b] a c ∈ [a, b] nějaký vnitřní bod, potom integrál b a f (x)dx existuje tehdy a jen tehdy, když existují 250 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET oba integrály c a f (x)dx a b c f (x)dx. V takovém případě pak také platí b a f (x)dx = c a f (x)dx + b c f (x)dx. (2) Jsou-li f a g dvě reálné funkce definované na intervalu [a, b] a jestliže existují integrály b a f (x)dx a b a g(x)dx, pak existuje také integrál jejich součtu a platí b a (f (x) + g(x))dx = b a f (x)dx + b a g(x)dx. (3) Je-li f reálná funkce definovaná na intervalu [a, b], C ∈ R je konstanta a jestliže existuje integrál b a f (x)dx, pak existuje také integrál b a C · f (x)dx a platí b a C · f (x)dx = C · b a f (x)dx. Důkaz. (1) Předpokládejme nejprve, že existuje integrál přes celý interval. Jistě se lze při jeho výpočtu omezit na limity Riemannových součtů, jejichž dělení mají bod c mezi svými dělícími body. Každý takový součet dostaneme jako součet dvou dílčích Riemannových součtů. Pokud by tyto dílčí součty v limitě závisely na zvolených rozděleních a reprezentantech, pak by celkové součty nemohly být v limitě na volbách nezávislé (stačí ponechat jednu posloupnost dělení podintervalu stejnou a druhou měnit tak, aby se limita změnila). Naopak, jestliže existují Riemannovy integrály na obou podintervalech, jsou libovolně přesně aproximovatelné Riemannovými součty a to navíc nezávisle na jejich volbě. Pokud do libovolné posloupnosti Riemannových součtů přes celý interval [a, b] přidáme v jejich děleních jeden dělící bod c navíc, změníme hodnotu celého součtu i částečných součtů přes intervaly patřící do [a, c] a [c, b] nejvýše o násobek normy dělení a možných rozdílů omezené funkce f na celém [a, b]. To je číslo jdoucí libovolně blízko k nule při zmenšující se normě dělení. Proto nutně i částečné Riemannovy součty naší funkce nutně konvergují k limitám, jejichž součtem je Riemannův integrál přes [a, b]. (2) V každém Riemannově součtu se součet funkcí projeví jako součet hodnot ve vybraných reprezentantech. Protože je násobení reálných čísel distributivní, vyplývá odtud právě dokazované tvrzení. (3) Stejná úvaha jako v předchozím případě. Následující výsledek je zcela zásadní pro pochopení vztahu mezi integrálem a derivací: 6.12 6.25. Věta (Základní věta diferenciálního počtu). Pro každou spojitou funkci f na konečném intervalu [a, b] existuje její Riemannův integrál b a f (x)dx. Navíc je funkce F(t) zadaná na intervalu [a, b] pomocí Riemannova integrálu F(t) = t a f (x)dx 251 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET antiderivací funkce f na tomto intervalu. Celý důkaz tohoto významného tvrzení bude poněkud delší. V prvním kroku pro důkaz existence integrálu použijeme alternativní definici, ve které nahrazujeme výběr reprezentatů a příslušné hodnoty f (ξi) pomocí suprem hodnot f (x) v příslušném podintervalu, resp. pomocí infim f (x) tamtéž. Hovoříme o horních Riemannových součtech, resp. dolních Riemannových součtech (někdy je v literatuře tento postup označován jako Darbouxův integrál). 6.26. Horní a dolní Riemannův integrál. Protože je naše funkce spojitá, je jistě i omezená na uzavřeném intervalu a proto jsou všechna výše uvažovaná suprema i infima konečná. Je tedy horní Riemannův součet příslušný dělení = (x0, . . . , xn) zadán výrazem S ,sup = n i=1 sup xi−1≤ξ≤xi f (ξ) · (xi − xi−1) zatímco dolní Riemannův součet je S ,inf = n i=1 inf xi−1≤ξ≤xi f (ξ) · (xi − xi−1). Protože pro každé dělení = (x0, . . . , xn; ξ1, . . . , ξn) platí e6.2ae6.2a (6.3) S ,inf ≤ S ,ξ ≤ S ,sup a infima i suprema lze libovolně přesně aproximovat skutečnými hodnotami, lze tušit, že bude Riemannův integrál existovat právě, když bude existovat pro libovolné posloupnosti dělení s normou jdoucí k nule limita horních i dolních součtů a tyto si budou rovny. Dokážeme, že tomu tak skutečně musí být pro všechny omezené funkce: Věta. Nechť je funkce f omezená na uzavřeném intervalu [a, b]. Pak Ssup = inf S ,sup, Sinf = sup S ,inf jsou limity všech posloupností horních, resp. dolních, součtů s normou jdoucí k nule. Riemannův integrál omezené funkce f přes interval [a, b] existuje právě, když Ssup = Sinf. Důkaz. Pokud zjemníme nějaké rozdělení 1 na 2 přidáním dalších bodů, zřejmě bude S 1,sup ≥ S 2,sup, S 1,inf ≤ S 2,inf. Každá dvě dělení mají společné zjemnění, jsou tedy hodnoty Ssup = inf S ,sup, Sinf = sup S ,inf dobrými kandidáty na limity horních a dolních součtů. Skutečně, pokud existuje společná limita horních součtů S nezávislá na zvolené posloupnosti dělení, musí to být právě Ssup, a podobně pro dolní součty. Naopak, uvažme nějaké pevně zvolené dělení s n vnitřními dělícími body intervalu [a, b], a jiné dělení 1, 252 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET jehož norma je hodně malé číslo δ. Ve společném zjemnění 2 bude jen n intervalů, které budou do součtu S 2,sup přispívat případně menším příspěvkem než je tomu v 1. Protože je f omezená funkce na [a, b], bude každý z těchto příspěvků ohraničený univerzální konstantou krát norma dělení (tj. maximální velikost příslušného intervalu v dělení). Při zvolení dostatečně malého δ tedy nebude vzdálenost S 1,sup od Ssup více než dvakrát vzdálenost S ,sup od Ssup. Jestliže nyní zvolíme libovolnou posloupnost k s horními součty, jejichž limitou je Ssup, pak pro pevně zvolené > 0 najdeme vždy k takové, S k,sup, k ≥ N bude k Ssup blíže než o . Pro ale umíme podle předchozí úvahy najít δ tak, že pro všechna dělení s normou menší než δ budememe se součtem blíže než o 2 . Právě jsme proto ukázali, že pro libovolné číslo > 0 umíme najít takové δ > 0, že pro všechna dělení s normou nejvýše δ bude |S ,sup − S | < . To je přesné tvrzení, že číslo Ssup je limitou všech posloupností horních součtů s normami dělení jdoucími k nule. Úplně stejně se dokáže i tvrzení pro součty dolní. Pokud Riemannův integrál neexistuje, existují posloupnosti dělení a reprezentantů s různými limitami Riemannových součtů. Pak ovšem z již dokázaného tvrzení plyne, že budou různé i limity horních součtů a dolních součtů. Naopak, předpokládejme, že Ssup = Sinf, pak ovšem i všechny Riemannovy součty posloupností dělení musí mít tutéž limitu díky nerovnostem (6.3). 6.12b 6.27. Stejnoměrná spojitost. Prozatím jsme ze spojitosti naší funkce f využili pouze to, že každá taková funkce je na konečném uzavřeném intervalu omezená. Zbývá nám ale ukázat, že pro spojité funkce je Ssup = Sinf. Z definice spojitosti víme, že pro každý pevně zvolený bod x ∈ [a, b] a každé okolí O (f (x)) existuje okolí Oδ(x) takové, že f (Oδ(x)) ⊂ O (f (x)). Toto tvrzení lze přepsat takto: jsou-li y, z ∈ Oδ(x), tzn. mimo jiné platí |y − z| < 2δ, je také f (y), f (z) ∈ O (f (x)), tzn. mimo jiné platí |f (y) − f (z)| < 2 . Budeme potřebovat globální variantu takové vlastnosti, říkáme jí stejnoměrná spojitost funkce f : Věta. Nechť je f spojitá funkce na uzavřeném konečném intervalu [a, b]. Pak pro každé číslo > 0 existuje takové číslo δ > 0, že pro všechny z, y ∈ [a, b] splňující |y − z| < δ platí |f (y) − f (z)| < . Důkaz. Protože je každý konečný uzavřený interval kompaktní, umíme jej celý pokrýt konečně mnoha okolími Oδ(x)(x) zmiňovanými v souvislosti se spojitostí výše, přičemž jejich poloměr δ(x) závisí na středu x zatímco čísla budeme uvažovat pořád stejná. Zvolíme konečně za δ minimum ze všech (konečně mnoha) δ(x). Naše spojitá funkce f 253 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET tedy má požadovanou vlastnost (pouze zaměňujeme čísla a δ za jejich dvojnásobky). 6.28. Dokončení důkazu Věty 6.25. Nyní již snadno dokončíme celý důkaz existence Riemannova integrálu. Zvolme si a δ jako v předchozí větě o stejnoměrné spojitosti a uvažujme jakékoliv dělení s n intervaly a normou nejvýš δ. Pak n i=1 sup xi−1≤ξ≤xi f (ξ) · (xi − xi−1) − n i=1 inf xi−1≤ξ≤xi f (ξ) · (xi − xi−1) ≤ n i=1 sup xi−1≤ξ≤xi f (ξ) − inf xi−1≤ξ≤xi f (ξ) · (xi − xi−1) ≤ · (b − a). Vidíme tedy, že se zmenšující se normou dělení jsou k sobě horní a dolní součty libovolně blízké. Proto infima a suprema splývají. To jsme potřebovali ukázat. Pro úplný důkaz základní věty diferenciálního počtu ještě zbývá ověřit tvrzení o existenci antiderivace. Víme již, že pro spojitou funkci f na intervalu [a, b] existuje pro každé t ∈ [a, b] integrál t a f (x)dx. Zvolme, stejně jako v tvrzení o stejnoměrné spojitosti, k pevnému malému > 0 číslo δ > 0 tak, aby |f (x + x) − f (x)| < pro všechna 0 ≤ x < δ na celém intervalu [a, b]. Rozdíl derivace naší funkce F(t) a integrované funkce f (t) je vyjádřen pomocí limity výrazů 1 t t+ t a f (x)dx − t a f (t)dt − f (t) pro t jdoucí k nule. Pokud však volíme 0 < t < δ, pak v absolutní hodnotě je tento výraz odhadnut 1 t t+ t t f (x)dx − f (t) < , protože ve výrazu nalevo můžeme libovolně přesně nahradit integrál jeho Riemannovým součtem a ve sčítancích f (ξi)(xi − xi−1) s ξi ∈ [t, t + t] v jakémkoliv Riemannově součtu jsou f (ξ) vzdáleny od f (t) nejvýše o velikost a tedy nahrazením f (t) za všechny f (ξi) dostáváme nalevo nulový výraz a dopouštíme se chyby nejvýše . To ovšem znamená, že existuje v bodě t derivace funkce F(t) zprava a je rovna f (t). Stejně dokážeme výsledek pro derivaci zleva a celá věta 6.25 je dokázaná. 6.12a 6.29. Důležité poznámky. (1) Věty 6.25 a 6.24 nám říkají, že integrál je lineární zobrazení : C[a, b] → R vektorového prostoru spojitých funkcí na intervalu [a, b] do reálných čísel. Je to tedy lineární forma na prostoru C[a, b]. 254 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET (2) Dokázali jsme, že každá spojitá funkce je derivací nějaké funkce. Newtonův a Riemannův integrál tedy jako koncepty pro spojité funkce splývají. Riemannův integrál spojitých funkcí lze proto spočíst pomocí rozdílu hodnot F(b) − F(a) antiderivace F. (3) V prvním kroku důkazu věty 6.25 jsme dokázali důležité tvrzení, že pro omezenou funkci f na intervalu [a, b] vždy existují limity horních součtů i dolních součtů. Říká se jim také horní Riemannův integrál a dolní Riemannův integrál. Takto lze pro omezené funkce ekvivalentně definovat i Riemannův integrál (jak jsme konečně v důkazu i činili). (4) V dalším kroku v důkazu jsme odvodili důležitou vlastnost spojitých funkcí, které se říká stejnoměrná spojitost na uzavřeném intervalu [a, b]. Zjevně je každá stejnoměrně spojitá funkce také spojitá, naopak to ale na otevřených intervalech platit nemusí. (5) Uvažme funkci f na intervalu [a, b], která je pouze po částech spojitá. To znamená, že je spojitá ve všech bodech c ∈ [a, b] kromě konečně mnoha bodů nespojitosti ci, a < ci < b. Vzhledem k aditivnosti integrálu vůči intervalu přes který se integruje, viz 6.24(1), existuje podle poslední věty v takovém případě integrál F(t) = t a f (x)dx pro všechna t ∈ [a, b] a derivace funkce F(t) existuje ve všech bodech t, ve kterých je f spojitá. Navíc se snadno ověří, že ve zbývajících bodech je funkce F(t) spojitá, je to tedy spojitá funkce na celém intervalu [a, b]. Při výpočtu integrálu pomocí antiderivací je zapotřebí volit její jednotlivé části tak, aby na sebe navazovaly. Pak bude i celý integrál vyčíslen jako rozdíl funkce F(t) v krajních hodnotách. 6.17 6.30. Nevlastní a nekonečné integrály. Např. při diskusi integrace racionálních lomených funkcí jsme viděli, že občas bychom rádi pracovali s určitými integrály přes intervaly, v nichž jsou i body, kde integrovaná funkce f (x) má nevlastní (jednostranné) limity. V takovém případě není integrovaná funkce ani spojitá ani omezená a proto pro ni nemusí platit námi odvozené výsledky. Hovoříme o „nevlastním integrálu“. Jednoduchým východiskem je diskutovat v takovém případě určité integrály na menších intervalech s hranicí blížící se problematickému bodu a zkoumat, zda existuje limitní hodnota takovýchto určitých integrálů. Pokud existuje, řekneme, že příslušný nevlastní integrál existuje a je roven této limitě. Uvedeme postup na jednoduchém příkladě: I = 2 0 dx 4 √ 2 − x je nevlastní integrál, protože uvedená integrovaná funkce f (x) = (2 − x)−1/4 má v bodě b = 2 limitu zleva rovnou ∞. V ostatních bodech je integrovaná funkce spojitá. Zajímáme 255 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET se proto o integrály Iδ = 2−δ 0 dx 4 √ 2 − x = 2 δ y−1/4 dy = − 4 3 y3/4 2 δ = 4 3 23/4 − 4 3 δ3/4 . Všimněme si, že jsme ve výpočtu substitucí dostali integrál s přepočtenou horní mezí δ a dolní mezí 2. Otočením mezí do obvyklé polohy jsme do výrazu přidali jedno znaménko minus navíc. Limita pro δ → 0 zprava zjevně existuje a spočítali jsme tedy nevlastní určitý integrál I = 2 0 dx 4 √ 2 − x = 4 3 23/4 . Stejně budeme postupovat, pokud je zadáno integrování přes neohraničený interval. Hovoříme o nekonečných integrá- lech. Obecně tedy např. pro a ∈ R I = ∞ a f (x) dx = lim b→∞ b a f (x) dx, pokud limita vpravo existuje. Obdobně můžeme mít horní mez integrování konečnou a druhou nekonečnou. Pokud jsou nekonečné obě, počítáme integrál jako součet dvou integrálů s libovolně pevně zvolenou pevnou mezí uprostřed, tj. ∞ −∞ f (x) dx = a −∞ f (x) dx + ∞ a f (x) dx. Existence ani hodnota nezávisí na volbě takové meze, protože její změnou pouze o stejnou konečnou hodnotu měníme oba sčítance, ovšem s opačným znaménkem. Naopak limita při které by stejně rychle šla horní i dolní mez do ±∞ může vést k odlišným výsledkům! Např. a −a x dx = 1 2 x2 a −a = 0, přestože hodnoty integrálů ∞ a x dx s jednou pevnou mezí utečou rychle k nekončených hodnotám. Při výpočtu určitého integrálu z racionální funkce lomené musíme pečlivě rozdělit zadaný interval podle bodů nespojitosti integrované funkce a spočítat jednotlivé nevlastní integrály každý zvlášť. Navíc je nutné rozdělit celý interval tak, abychom vždy integrovali funkci neohraničenou pouze v okolí jednoho z krajních bodů. 6.17a 6.31. Přírůstky do ZOO. Z počítaných příkladů se může zdát, že je obvyklé najít neurčitý integrál pomocí výrazů složených ze známých elementárních funkcí. To je úplně mylný dojem. 256 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET Naopak, drtivá většina spojitých funkcí vede na integrály, které tak vyjádřit neumíme. A to i když integrujeme funkce docela jednoduché. Protože se integrací získané funkce velice často v praxi vyskytují, mnohé mají jména a před nástupem počítačů byly pro potřeby inženýrů vydávány obsáhlé tabulky hodnot takových funkcí. V dalším textu se ještě budeme k metodám, jak numerické aproximace takových funkcí získávat. Uvedeme si nyní aspoň nějaké příklady. Funkce Sinusintegrál je definovaná vztahem Si(x) = x 0 sin t t dt. Důležité jsou také Fresnelovy sinové a cosinové integrály FresnelS(x) = x 0 sin 1 2 πt2 dt FresnelC(x) = x 0 cos 1 2 πt2 dt Na levém obrázku je průběh funkce Si(x), na pravém vidíme obě Fresnelovy funkce. Nové typy funkcí dostáváme také, když do integrovaného výrazu povolíme volný parametr, na kterém pak výsledek závisí. Příkladem může být jedna z nejdůležitějších funkcí v matematice vůbec – tzv. Gamma funkce definovaná vztahem (z) = ∞ 0 e−t tz−1 dt. Lze ukázat, že tato funkce je analytická ve všech bodech z /∈ Z a pro malá z ∈ N můžeme počítat: (1) = ∞ 0 e−t t0 dt = [− e−t ]∞ 0 = 1 (2) = ∞ 0 e−t t1 dt = [− e−t t]∞ 0 + ∞ 0 e−t dt = 0 + 1 = 1 (3) = ∞ 0 e−t t2 dt = 0 + 2 ∞ 0 e−t tdt = 0 + 2 = 2 a pomocí indukce snadno dovodíme, že pro všechna kladná celá čísla n dává tato funkce hodnotu faktoriálu: (n) = (n − 1)! Následující obrázek ukazuje průběh funkce f (x) = ln( (x)), vidíme z něj tedy v logaritmické škále, jak rychle skutečně roste faktoriál. 257 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET Než se pustíme do dalších témat matematické analýzy, uvedeme ještě několik přímých použití pro Riemannův inte- grál. 6.18 6.32. Riemannovsky měřitelné množiny. Sama definice Riemanova integrálu byla odvozena od představy velikosti plochy v rovině se souřadnicemi x a y ohraničené osou x, hodnotami funkce y = f (x) a hraničními přímkami x = a, x = b. Přitom je plocha nad osou x dána s kladným znaménkem zatímco hodnoty pod osou vedou ke znaménku zápornému. Ve skutečnosti víme zatím pouze, co je to plocha rovnoběžnostěnu určeného dvěma vektory, obecněji ve vektorovém prostoru Rn víme, co je to objem rovnoběžnostěnu. Plochy jiných podmnožin je teprve třeba definovat. Pro některé jednoduché objekty jako třeba mnohoúhelníky je definice dána přirozeně předpokládanými vlastnostmi. Námi vybudovaný koncept Riemannova integrálu můžeme teď přímo použít k měření „objemu“ jednorozměrných podmnožin. O podmnožině A ⊂ R řekneme, že je (Riemannovsky) měřitelná, jestliže je funkce χ : R → R χA(x) = 1 jestliže je x ∈ A 0 jestliže je x /∈ A. Riemannovsky integrovatelná, tj. existuje integrál (ať už s konečnou nebo nekonečnou hodnotou) m(A) = ∞ ∞ χA(x) dx. Funkci χA říkáme charakteristická funkce množiny A, hodnotě m(A) říkáme Riemanovská míra množiny A. Všimněme si, že pro interval A = [a, b] jde vlastně o hodnotu ∞ ∞ χA(x) dx = b a dx = b − a, přesně jak jsme očekávali. Zároveň má takováto definice „velikosti“ očekávanou vlastnost, že míra sjednocení konečně mnoha Riemannovsky měřitelných a po dvou disjunktních množin vyjde jako součet. Zejména každá konečná množina A má Riemannovskou míru nulovou. Pokud ale vezmeme spočetné sjednocení, taková vlastnost již neplatí. Např. stačí vzít množinu Q všech racionálních čísel 258 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET jakožto sjednocení jednoprvkových podmnožin. Zatímco každá množina o konečně mnoha bodech má podle naší definice míru nulovou, charakteristická funkce χQ není Riemannovsky integrovatelná. Pro definici plochy (objemu) ve vícerozměrných prostorech budeme umět použít koncept Riemannova integrálu, až jej zobecníme do vícerozměrného případu. Nicméně je dobré si už teď povšimnout, že skutečně původní představa o ploše rovinného útvaru uzavřeného výše uvedeným způsobem grafem funkce bude bezezbytku naplněna. 6.33. Střední hodnota funkce. U konečné množiny hodnot jsme zvyklí uvažovat o jejich střední hodnotě a definujeme ji zpravidla jako aritmetický průměr. Pro Riemannovsky integrovatelnou funkci f (x) na intervalu (konečném nebo nekonečném) [a, b] je definována její střední hodnota výrazem m(f ) = 1 b − a b a f (x) dx. Z definice je m(f ) výška obdélníka (s orientací podle znaménka) nad intervalem [a, b], který má stejnou plochu jako je plocha mezi osou x a grafem funkce f (x). 6.34. Délka prostorové křivky. Námi vybudovaný integrál jde také dobře použít pro výpočet délky křivky ve vícerozměrném vektorovém prostoru Rn . Pro jednoduchost si to předvedeme na případu křivky v rovině R2 se souřadnicemi x, y. Mějme tedy parametrický popis křivky F : R → R2 , F(t) = [g(t), f (t)] a představme si ji jako dráhu pohybu. Derivací tohoto zobrazení dostaneme hodnoty, které budou odpovídat rychlosti pohybu po takovéto dráze. Proto celková délka křivky (tj. dráha uražená za dobu mezi hodnotami t = a, t = b) bude dána integrálem přes interval [a, b], kde integrovanou funkcí h(t) budou právě velikosti vektorů F (t). Chceme tedy spočíst délku s rovnou s = b a h(t) dt = b a (f (t))2 + (g (t))2 dt. Ve speciálním případě, kdy křivka je grafem funkce y = f (x) mezi body a < b obdžíme pro její délku s = b a 1 + (f (x))2 dx Tentýž výsledek lze intuitivně vidět jako důsledek Pythagorovy věty: pro lineární přírůstek délky křivky s odpovídající přírůstku x proměnné x spočteme totiž právě s = x2 + y2 a to při pohledu přímo na naši definici integrálu znamená s = b a 1 + dy dx 2 dx. 259 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET Naopak základní věta diferenciálního počtu (viz 6.25) ukazuje, že na úrovni diferenciálů takto definovaná veličina délky grafu funkce y = y(x) splňuje ds = 1 + (y (x))2dx, přesně dle očekávání. Jako snadný příklad spočteme délku jednotkové kružnice jako dvojnásobek integrálu funkce y = √ 1 − x2 v mezích [−1, 1]. Víme již, že musí vyjít číslo 2π, protože jsme takto číslo π definovali. s = 2 1 −1 1 + (y )2 dx = 2 1 −1 1 + x2 1 − x2 dx = 2 1 −1 1 √ 1 − x2 dx = 2[arcsin x]1 −1 = 2π. Jestliže v předchozím výpočtu budeme počítat s y = r2 − x2 = r 1 − (x/r)2 a meze budou [−r, r], dostaneme substitucí x = rt déku kružnice o poloměru r: s(r) = 2 r −r 1 + (x/r)2 1 − (x/r)2 dx = 2 1 −1 r √ 1 − t2 dt = 2r[arcsin x]1 −1 = 2πr. Výsledek samozřejmě známe z elementární geometrie. Nicméně teď se nám z východisek integrálního počtu podařilo dovodit zásadní skutečnost, že je délka kružnice lineárně závislá na jejím průměru 2r. Číslo π je právě poměr, ve kterém se tato závislost realizuje. 6.35. Plochy a objemy. Riemannův integrál můžeme přímo použít na výpočet ploch či objemů útvarů definovaných pomocí grafu funkce. Jako příklad spočtěme plochu kružnice s poloměrem r. Půlkruh vymezený funkcí √ r2 − x2 má plochu, jejíž dvojnásobek a(r) spočteme substitucí x = r sin t, dx = r cos t dt (s využitím výsledku pro I2 v odstavci 6.22) a(r) = 2 r −r r2 − x2 dx = 2r2 π/2 −π/2 cos2 t dt = 2r2 2 [cos t sin t + t] π/2 −π/2 = πr2 . Opět stojí za pozornost, že tento dobře známý vzoreček je odvozen z principů integrálního počtu a že kupodivu je plocha kruhu nejen úměrná kvadrátu poloměru, ale zároveň je tento poměr daný opět konstantou π. Všimněme si ještě poměru obsahu a obvodu kruhu, tj. πr2 2πr = r 2 . Čtverec o stejném obsahu má stranu o velikosti √ πr a tedy obvod 4 √ πr. Obvod čtverce o obsahu jednotkového kruhu je tedy 4 √ π, což je o přibližně 0.8 více, než je obvod jednotkového kruhu. Lze dovodit, že ve skutečnosti je kružnice 260 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET útvarem s nejmenším obvodem mezi všemi se stejným obsahem. K odvozování takových výsledků se dostaneme v našich poznámkách o tzv. variačním počtu v pozdějších kapitolách. Další obdobou téhož principu je výpočet povrchu nebo objemu rotačního tělesa. Pokud vznikne těleso rotací grafu funkce f kolem osy x v intervalu [a, b], vzniká při přírůstku x nárůst plochy o násobek s délky křivky zadané grafem funkce y = f (x) a velikosti kružnice o poloměru f (x). Plocha se proto spočte formulí A(f ) = 2π b a f (x) ds = 2π b a f (x) 1 + (f (x))2 dx, kde ds je dán přírůstkem délky křivky y = f (x), viz výše. Podkud bychom rotační těleso zadali jeho hranicí prametrizovanou dvojicí funkcí [x(t), y(t)], bude příslušný diferencál tvaru ds = (x (t))2 + (y (t))2dt a pro povrch dostaneme A = 2π b a f (x) ds = 2π b a y(t) (y (t))2 + (x (t))2 dt. Objem stejného tělesa naroste při změně x o násobek tohoto přírůstku a plochy kružnice o poloměru f (x). Proto je dán formulí V (f ) = π b a (f (x))2 dx. Jako příklad užití vzorců pro obsah a objem odvodíme známé formule pro plochu sféry a objem koule o poloměru r. Ar = 2π r −r r 1 − (x/r)2 1 1 − (x/r)2 dt = 2πr r −r dt = 4πr2 Vr = π r −r r2 − x2 dx = 2rπr2 − π 1 3 x3 r −r = 4 3 πr3 . Stejně jako u kružnice i koule je objektem, který má mezi všemi s daným objemem ten nejmenší povrch. To je důvod, proč jsou mýdlové bubliny vždy prakticky tohoto tvaru. 6.36. Integrální kriterium konvergence řad. Pomocí nevlastního integrálu také umíme rozhodnout o konvegenci širší třídy nekonečných řad než doposud: Věta. Buď ∞ n=1 f (n) řada taková, že funkce f : R → R je kladná a nerostoucí na intervalu 1, ∞). Pak tato řada konverguje právě tehdy, když konverguje integrál ∞ 1 f (x) dx. Důkaz. Pokud interpretujeme integrál, jako plochu pod křivkou, je kriterium zřejmé. 261 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET Pokud daná řada diverguje, pak diverguje i řada ∞ n=2 f (n). Pro libovolné k ∈ N máme pro k-tý částečný součet sk (řady bez prvního členu) nerovnost sk = k n=2 f (n) < k 1 f (x) dx, neboť sk je dolním součtem Riemannova integrálu k 1 f (x) dx. Pak ale je ∞ 1 f (x) dx = lim k→∞ k 1 f (x) dx > lim k→∞ sk = ∞ a uvažovaný integrál diverguje. Předpokládeme nyní, že daný integrál konverguje a označme k-tý částečný součet dané řady jako sk. Potom máme nerovnosti ∞ 1 f (x) dx = lim k→∞ k 1 f (x) dx < lim k→∞ sk < ∞, neboť sk je horním součtem Riemannova integrálu k 1 f (x) dx a předpokádáme, že daná řada konverguje. 3. Nekonečné řady Již jsme se při budování našeho zvířetníku funkcí setkali s mocninnými řadami, které přirozeným způsobem rozšiřují skupinu všech polynomů, viz 5.43. Zároveň jsme si říkali, že takto získáme třídu analytických funkcí, ale nedokazovali jsme tehdy ani to, že jsou mocninné řady spojitými funkcemi. Snadno nyní ukážeme, že tomu tak je a že skutečně umíme mocninné řady i diferencovat a integrovat po jednotlivých sčítancích. Právě proto ale také uvidíme, že není možné pomocí mocninných řad získat dostatečně širokou třídu funkcí. Např. nikdy tak nedostaneme jen po částech spojisté periodické funkce, které jsou tak důležité pro modelování a zpracování audio a video signálů. 6.19 6.37. Jak ochočené máme řady funkcí? Vraťme se nyní k diskusi limit posloupností funkcí a součtu řad funkcí z pohledu uplatnění postupů diferenciálního a integrálního počtu. Uvažujme tedy konvergentní řadu funkcí S(x) = ∞ n=1 fn(x) na intervalu [a, b]. Přirozené dotazy jsou: • Jsou-li všechny funkce fn(x) spojité v nějakém bodě x0 ∈ [a, b], je spojitá i funkce S(x) v bodě x0? • Jsou-li všechny funkce fn(x) diferencovatelné v nějakém bodě a ∈ [a, b], je v něm diferencovatelná i funkce S(x) a platí vztah S (x) = ∞ n=1 fn(x)? • Jsou-li všechny funkce fn(x) Riemannovsky integrovatelné na intervalu [a, b], je integrovatelná i funkce S(x) a platí vztah b a S(x)dx = ∞ n=1 b a fn(x)dx? 262 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET Ukážeme si nejprve na příkladech, že odpovědi na všechny tři takto kladené otázky jsou „NE!“. Poté ale najdeme jednoduché dodatečné podmínky na konvergenci řady, které naopak platnosti všech tří tvrzení zajistí. Řady funkcí tedy obecně moc zvladatelné nejsou, nicméně si umíme vybrat velikou třídu takových, se kterými se už pracuje velmi dobře. Mezi ně naštěstí budou patřit mocninné řady. Pak se ale také zamyslíme nad alternativními koncepcemi integrování, které fungují více uspokojivě i větší třídy funkcí . 6.38. Příklady ošklivých posloupností. (1) Uvažme nejprve funkce fn(x) = (sin x)n na intervalu [0, π]. Hodnoty těchto funkcí budou ve všech bodech 0 ≤ x ≤ π nezáporné a menší než jedna, kromě x = π 2 , kde je hodnota 1. Proto na celém intervalu [0, π] budou bod po bodu tyto funkce konvergovat k funkci f (x) = lim n→∞ fn(x) = 0 pro všechna x = π 2 1 pro x = π 2 . Zjevně tedy je limita posloupnosti funkcí fn nespojitou funkcí, ačkoliv jsou všechny funkce fn(x) spojité. Problematický je přitom dokonce vnitřní bod intervalu. Tentýž jev umíme najít i pro řady funkcí, protože součet je limitou částečných součtů. Stačí tedy v předchozím příkladě vyjádřit fn jako n-tý částečný součet. Např. f1(x) = sin x, f2(x) = (sin x)2 −sin x, atd. Levý obrázek vykresluje funkce fn3 (x) pro n = 1, . . . , 10. x 32,5 0,2 1 0,5 0,4 1 20 0,6 1,5 0,8 0 -0,5 0,4 0,2 x 1 -0,4 -0,2 0 0-1 0,5 (2) Podívejme se nyní na druhou otázku, tj. na špatně se chovající derivace. Celkem přirozená je idea na podobném principu jako výše sestavit posloupnost funkcí, které budou mít v jednom bodě stále stejnou nenlovou derivaci, ale budou čím dál tím menší, takže bodově dokonvergují k funkci identicky nulové. Předchozí obrázek napravo vykresluje funkce fn(x) = x(1 − x2 )n na intervalu [−1, 1] pro hodnoty n = m2 , m = 1, . . . , 10. Na první pohled je zjevné, že lim n→∞ fn(x) = 0 263 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET a všechny funkce fn(x) jsou hladké. V bodě x = 0 je jejich derivace fn(0) = (1 − x2 )n − 2nx2 (1 − x2 )n−1 |x=0 = 1 nezávisle na n. Limitní funkce pro posloupnost fn přitom má samozřejmě všude derivaci nulovou! (3) Protipříklad k třetímu tvrzení jsme už viděli v 6.32. Charakteristickou funkci χQ racionálních čísel můžeme vyjádřit jako součet spočetně mnoha funkcí, které budou očíslovány právě racionálními čísly a budou vždy všude nulové, kromě jediného bodu, podle které jsou pojmenovány, kde jsou rovny 1. Riemannovy integrály všech takových funkcí budou nulové, jejich součet ale není Riemannovsky inegrovatelnou funkcí. Právě tento příklad ukazuje na zásadní nedostatek Riemannova integrálu, ke kterému se ještě vrátíme. 6.20 6.39. Stejnoměrná konvergence. Zjevným důvodem neúspěchu ve všech třech předchozích příkladech je skutečnost, že rychlost bodové konvergence hodnot fn(x) → f (x) se bod od bodu velice liší. Přirozenou myšlenkou tedy je omezit se na takové případy, kdy bude naopak konvergence probíhat přibližně stejně rychle po celém intervalu. Definice. Říkáme, že posloupnost funkcí fn(x) konverguje stejnoměrně na intervalu [a, b] k limitě f (x), jestliže pro každé kladné (malé) číslo existuje (velké) přirozené číslo N ∈ N takové, že pro všechna n ≥ N a všechna x ∈ [a, b] platí |fn(x) − f (x)| < . O řadě funkcí řekneme, že konverguje stejnoměrně na intervalu, jestliže stejnoměrně konverguje posloupnost jejích částečných součtů. Graficky si definici můžeme představit tak, že do pásu vzniklého posunutím limitní funkce f (x) na f (x)± pro libovolně malé, ale pevně zvolené kladné , vždy padnou všechny funkce fn(x), až na konečně mnoho z nich. Tuto vlastnost zjevně neměl první a poslední z předchozích příkladů, u druhého ji postrádala posloupnost derivací fn. Následující tři věty lze stručně shrnout tvrzením, že všechna tři obecně neplatná tvrzení v 6.37 platí pro stejnoměrnou konvergenci (pozor ale na jemnosti u derivování). 6.21 6.40. Věta. Nechť fn(x) je posloupnost funkcí spojitých na intervalu [a, b], která na tomto intervalu stejnoměrně konverguje k funkci f (x). Pak je také f (x) spojitá funkce na intervalu [a, b]. Důkaz. Chceme ukázat, že pro libovolný pevně zvolený bod x0 ∈ [a, b] a jakékoliv pevně zvolené malé > 0 bude |f (x) − f (x0)| < pro všechna x dostatečně blízká k x0. Z definice stejnoměrné konvergence je pro nějaké > 0 |fn(x) − f (x)| < 264 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET pro všechna x ∈ [a, b] a všechna dostatečně velká n. Zvolme si tedy nějaké takové n a uvažme δ > 0 tak, aby také |fn(x) − fn(x0)| < pro všechna x z δ-okolí x0 (to je možné, protože všechny fn(x) jsou spojité). Pak |f (x) − f (x0)| ≤ |f (x) − fn(x)| + |fn(x) − fn(x0)| + |fn(x0) − f (x0)| < 3 pro všechna x z námi zvoleného δ-okolí bodu x0. 6.22 6.41. Věta. Nechť fn(x) je posloupnost Riemannovsky integrovatelných funkcí na konečném intervalu [a, b], které na tomto intervalu stejnoměrně konvergují k funkci f (x). Pak také f (x) je Riemannovsky integrovatelná a platí lim n→∞ b a fn(x) dx = b a lim n→∞ fn(x) dx = b a f (x) dx. Důkaz této věty se opírá o zobecnění vlastností Cauchyovských posloupností čísel na stejnoměrnou konvergenci funkcí. Tímto způsobem umíme pracovat s existencí limity posloupnosti integrálů, aniž bychom ji potřebovali znát. Definice. Řekneme, že posloupnost funkcí fn(x) na intervalu [a, b] je stejnoměrně Cauchyovská, jestliže pro každé (malé) kladné číslo existuje (velké) přirozené číslo N takové, že pro všechna x ∈ [a, b] a všechna n ≥ N platí |fn(x) − fm(x)| < . Zřejmě je každá stejnoměrně konvergentní posloupnost funkcí na intervalu [a, b] také stejnoměrně Cauchyovská na témže intervalu, stačí si povšimnout obvyklého odhadu |fn(x) − fm(x)| ≤ |fn(x) − f (x)| + |f (x) − fm(x)| založeného na trojúhelníkové nerovnosti. Toto pozorování nám už stačí k důkazu naší věty, zastavíme se ale napřed u užitečného obráceného tvrzení: Tvrzení. Každá stejnoměrně Cauchyovská posloupnost funkcí fn(x) na intervalu [a, b] stejnoměrně konverguje k nějaké funkci f na tomto intervalu. Důkaz. Z podmínky Cauchyovskosti posloupnosti funkcí vyplývá, že také pro každý bod x ∈ [a, b] je posloupnost hodnot fn(x) Cauchyovskou posloupností reálných (případně komplexních) čísel. Bodově tedy nutně konverguje posloupnost funkcí fn(x) k nějaké funkci f (x). Ukážeme, že ve skutečnosti konverguje posloupnost fn(x) ke své limitě stejnoměrně. Zvolme N tak velké, aby |fn(x) − fm(x)| < pro nějaké předem zvolené malé kladné a všechna n ≥ N, x ∈ [a, b]. Nyní zvolíme pevně jedno takové n a odhadneme |fn(x) − f (x)| = lim m→∞ |fn(x) − fm(x)| ≤ pro všechna x ∈ [a, b]. 265 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET Důkaz Věty. Připomeňme, že každá stejnoměrně konvergentní posloupnost funkcí je také stejnoměrně Cauchyovská a že Riemannovy součty pro jednotlivé členy naší posloupnosti konvergují k b a fn(x) dx nezávisle na výběru dělení a reprezentantů. Proto jestliže platí |fn(x) − fm(x)| < pro všechna x ∈ [a, b], pak také b a fn(x) dx − b a fm(x) dx ≤ |b − a|. Je tedy posloupnost čísel b a fn(x) dx Cauchyovská a proto konvergentní. Současně ale také díky stejnoměrné konvergenci posloupnosti fn(x) platí pro limitní funkci f (x) ze stejného důvodu, že její Riemannovy součty jsou libovolně blízké Riemannovým součtům pro funkce fn s dostatečně velkým n a limitní funkce f (x) bude tedy opět integrovatelná. Zároveň b a fn(x) dx − b a f (x) dx ≤ |b − a| a musí proto jít o správnou limitní hodnotu. Pro příslušný výsledek o derivacích je třeba zvýšené pozornosti ohledně předpokladů: 6.23 6.42. Věta. Nechť fn(x) je posloupnost funkcí diferencovatelných na intervalu [a, b], která na tomto intervalu stejnoměrně konverguje k limitní funkci f (x). Dále nechť jsou všechny derivace gn(x) = fn(x) spojité a nechť konvergují na témže intervalu stejnoměrně k funkci g(x). Pak je také funkce f (x) diferencovatelná na intervalu [a, b] a platí zde f (x) = g(x). Důkaz. Bez újmy na obecnosti můžeme předpokládat, že všechny naše funkce splňují fn(a) = 0 (v opačném případě je pozměníme o konstanty a na výsledku úvah se nic nezmění). Pak ovšem můžeme psát pro všechny x ∈ [a, b] fn(x) = x a gn(t) dt. Protože ale funkce gn stejnoměrně konvergují k funkci g na celém [a, b], tedy tím spíše na intervalech [a, x], kde a ≤ x ≤ b, platí také f (x) = x a g(t) dt. Protože je funkce g coby stejnoměrná limita spojitých funkcí opět spojitou funkcí, dokázali jsme vše potřebné, viz Věta 6.24 o Riemannově integrálu a antiderivaci. Pro nekonečné řady můžeme předchozí výsledky shrnout takto: 6.24 6.43. Důsledek. Uvažme funkce fn(x) na intervalu [a, b]. 266 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET (1) Jsou-li všechny funkce fn(x) spojité na [a, b] a řada S(x) = ∞ n=1 fn(x) konverguje stejnoměrně k funkci S(x), je i funkce S(x) spojitá na [a, b]. (2) Jsou-li všechny funkce fn(x) spojitě diferencovatelné na [a, b], a obě řady S(x) = ∞ n=1 fn(x), T (x) = ∞ n=1 fn(x) konvergují stejnoměrně, pak je také funkce S(x) spojitě diferencovatelná na [a, b] a platí S (x) = T (x), tj. ∞ n=1 fn(x) = ∞ n=1 fn(x). (3) Jsou-li všechny funkce fn(x) Riemannovsky integrovatelné na [a, b] a řada S(x) = ∞ n=1 fn(x) konverguje stejnoměrně k funkci S(x) na [a, b], je tamtéž integrovatelná i funkce S(x) a platí vztah b a ∞ n=1 fn(x) dx = ∞ n=1 b a fn(x) dx. 6.25 6.44. Test stejnoměrné konvergence. Nejjednodušším způsobem pro zjištění stejnoměrné konvergence posloupnosti funkcí je porovnání s absolutní konvergencí vhodné posloupnosti čísel. Říkává se tomu často Weierstrassův test. Předpokládejme tedy, že máme řadu funkcí fn(x) na intervalu I = [a, b] a že navíc známe odhad |fn(x)| ≤ an ∈ R pro vhodné reálné konstanty an a všechna x ∈ [a, b]. Okamžitě můžeme odhadnout rozdíly částečných součtů sk(x) = k n=1 fn(x) pro různé indexy k. Pro k > m dostáváme |sk(x)−sm(x)| = k n=m+1 fn(x) ≤ k n=m+1 |fn(x)| ≤ k n=m+1 ak. Pokud je řada (nezáporných) konstant ∞ n=1 an konvergentní, pak bude samozřejmě posloupnost jejích částečných součtů Caychyovská. Právě jsme ale spočetli, že v takovém případě bude posloupnost částečných součtů sn(x) stejnoměrně Ca- ychyovská. Díky tvrzení dokázanému před chvílí v 6.41 jsme tedy právě dokázali následující 267 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET Věta (Weierstrassův test). Nechť fn(x) je posloupnost funkcí definovaných na intervalu [a, b] a platí |fn(x)| ≤ an ∈ R. Je-li řada čísel ∞ n=1 an konvergentní, pak řada S(x) = ∞ n=1 fn(x) konverguje stejnoměrně. 6.26 6.45. Důsledky pro mocninné řady. Weistrassův test je velice užitečný pro diskusi mocninných řad S(x) = ∞ n=0 an(x − x0)n se středem v bodě x0. Při našem prvním setkání s mocninnými řadami jsme ukázali v 5.46, že každá taková řada konverguje na (x0−δ, x0+δ), kde tzv. poloměr konvergence δ ≥ 0 může být také nula nebo ∞. (viz také 5.50). Zejména jsme v důkazu věty 5.46 pro ověření konvergence řady S(x) používali srovnání s vhodnou geometrickou posloupností. Podle Weistrassova testu je proto řada S(x) stejnoměrně konvergentní na každém kompaktním (tj. konečném) intervalu [a,b] uvnitř intervalu (x0 −δ, x0 +δ). Dokázali jsme tedy Věta. Každá mocninná řada S(x) je ve všech bodech uvnitř svého intervalu konvergence spojitá a spojitě diferencovatelná. Funkce S(x) je také integrovatelná a derivování i integrování lze provádět člen po členu. Ve skutečnosti platí také tzv. Abelova věta, která říká, že mocninné řady jsou spojité i v hraničních bodech svého definičního oboru (včetně případných nekonečných limit). Tu zde nedokazujeme. Právě dokázané příjemné vlastnosti mocninných řad zároveň poukazují na hranice jejich použitelnosti při modelování závislostí nějakých praktických jevů nebo procesů. Zejména není možné pomocí mocninných řad dobře modelovat po částech spojité funkce. Jak uvidíme v zápětí, je možné pro konkrétněji vymezené potřeby nacházet lepší sady funkcí fn(x) než jsou hodnoty fn(x) = xn . Nejznámějšími příklady jsou Fourierovy řady a tzv. wawelety, které přibolížíme v další kapitole. 6.26a 6.46. Laurentovy řady. V kontextu Taylorových rozvojů se ještě podívejme na hladkou funkci f (x) = e−1/x2 z odstavce 6.6. Viděli jsme, že není analytická v nule, protože tam má všechny derivace nulové. Takže zatímco ve všech ostatních bodech x0 je tato funkce dán konvergentní Taylorovou řadou s poloměrem konvergence r = |x0|, v počátku řada konverguje jen v jediném bodě. Pokud ale do mocninné řady pro ex dosadíme za x výraz −1/x2 , dostaneme řadu funkcí S(x) = ∞ n=0 1 n! (−1)n x−2n = 0 n=−∞ (−1)|n| |n|! x2n , která bude konvergovat ve všech bodech x = 0 a dává nám dobrý popis pro chování kolem výjimečného bodu x = 0. 268 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET Podbízí se proto uvažovat následující obecnější řady docela podobné mocninným: Laurantovy řady Řadu funkcí tvaru S(x) = ∞ n=−∞ an(x − x0)n nazýváme Laurentova řada se středem v x0. Řadu nazveme konvergentní, jetsliže konvergují samostatně její části s kladnými a zápornými exponenty.nými a zápornými exp Smysl Laurentových řad je dobře viditelný u racionálních funkcí lomených. Uvažme takovou funkci S(x) = f (x)/g(x) s nesoudělnými polynomy f a g a uvažme kořen x0 polynomu g(x). Je-li násobnost tohoto kořenu s, pak vynásobením dostaneme funkci ˜S(x) = S(x)(x −x0)s , která už bude na nějakém okolí bodu x0 analytická a proto můžeme psát S(x) = a−s (x − x0)s + · · · + a−1 x − x0 + a0 + a1(x − x0) + . . . = ∞ n=−s an(x − x0)n . Uvažujme nyní odděleně části S(x) = S− + S+ = −1 n=−∞ an(x − x0)n + ∞ n=0 an(x − x0)n . Pro řadu S+ víme z Věty 5.46, že její poloměr konvergence R je dán rovností R−1 = lim sup n→∞ n |an|. Když však aplikujeme tutéž úvahu na řadu S− s dosazenými hodnotami 1/x za x, zjistíme, že řada S−(x) konverguje pro |x − x0| > r, kde r−1 = lim sup n→∞ n |a−n|. Tyto úvahy platí bezezbytku i pro komplexní hodnoty x dosazované do našich výrazů. Věta. Laurentova řada S(x) se středem x0 konverguje pro všechna x ∈ C splňující r < |x − x0| < R a diverguje pro všechna x splňující |x − x0| < r nebo |x − x0| > R. Vidíme tedy, že Laurentova řada nemusí konvergovat ve vůbec žádném bodě, protože klidně můžeme dospět k hodnotám R < r. Podíváme-li se ale např. na výše uvedený případ racionálních funkcí lomenných rozvíjených do Laurentovy řady v některém z kořenů jmenovatele, pak zjevně je r = 0 a tedy, dle očekávání, bude konvergovat skutečně na prestencovém okolí tohoto bodu x0, zatímco R bude v tomto případě dáno právě vzdáleností k dalšímu nejbližšímu kořenu jmenovatele. V přápadě našeho prvního příkladu, funkce e−1/x2 je r = 0 a R = ∞. 269 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET 6.49 6.47. Numerická přiblížení integrace. Podobně jako na konci přechozí části textu (viz odstavec 6.17), nyní využijeme Taylorova rozvoje k návrhu co nejlepších a zároveň jednoduchých aproximací integrace. Budeme pracovat s integrálem I = b a f (x)dx analytické funkce f (x) a rovnoměrným dělením intervalu [a, b] pomocí bodů a = x0, x1, . . . , xn = b se vzdálenostmi xi − xi−1 = h > 0. Body uprostřed intervalů v děleních si označíme xi+1/2, hodnoty naší funkce v bodech dělení budeme psát jako f (xi) = fi. Příspěvek jednoho dílku dělení k integrálu spočteme pomocí Taylorova rozvoje a předchozí věty. Záměrně přitom integrujeme symetricky kolem středových hodnot, aby se nám při procesu integrace vzájemně vyrušily derivace lichých stupňů: h/2 −h/2 f (xi+1/2 + t)dt = h/2 −h/2 ∞ n=0 1 n! f (n) (xi+1/2)tn dt = ∞ k=0 h/2 −h/2 1 k! f (k) (xi+1/2)tk dt = ∞ k=0 h2k+1 22k(2k + 1)! f (2k) (xi+1/2). Velmi jednoduchým numerickým přiblížením integrace na jednom dílku dělení je tzv. trapézové pravidlo, které pro aproximaci využívá plochu lichoběžníka určeného body [xi, 0], [xi, fi], [0, xi+1], [xi+1, fi+1]. Tato plocha je Pi = 1 2 (fi + fi+1)h a celkem tedy integrál I odhadujeme hodnotou Itrap = n−1 i=0 Pi = h 2 (f0 + 2f1 + · · · + 2fn−1 + fn). Srovnáme nyní Itrap s přesnou hodnotou I spočtenou pomocí příspěvků po jednotlivých dílcích dělení. Hodnoty fi můžeme vyjádřit pomocí prostředních hodnot a derivací f (k) i+1/2 takto: fi+1/2±1/2 = fi+1/2 ± h 2 fi+1/2 + h2 2!22 f (i + 1/2) ± h3 3!23 f (3) (i + 1/2) + . . . , takže pro příspěvek Pi do odhadu dostáváme Pi = 1 2 (fi +fi+1)h = h fi+1/2 + h2 2!22 f (i+1/2) +O(h5 ). Odtud dostáváme odhad chyby I −Itrap na jednom dílku dělení i = h fi+1/2 + h2 24 fi+1/2 − fi+1/2 − h2 8 fi+1/2 + O(h4 ) = h3 12 fi+1/2 + O(h5 ). 270 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET Celková chyba tedy je odhadnuta jako I − Itrap = 1 12 nh3 f + n O(h5 ) = 1 12 (b − a)h2 f + O(h4 ) kde f vyjadřuje odhad pro druhou derivaci f . Pokud nám lineární aproximace funkce po jednotlivých dílcích nestačí, dalším pokusem může být aproximace kvadratickým polynomem. K tomu ale budeme potřebovat vždy tři body, takže budeme pracovat s dílky dělení po dvou. Předpokládejme tedy že n = 2m a uvažujme xi s lichými indexy. Budeme požadovat fi+1 = f (xi + h) = fi + αh + βh2 fi−1 = f (xi − h) = fi − αh + βh2 což dává (viz podobnost s diferencí pro aproximaci druhé derivace) β = 1 2h2 (fi+1 + fi−1 − 2fi). Plocha přibližného vyjádření integrálu na dvou dílcích dělení mezi xi−1 a xi+1 je nyní odhadnuta výrazem Pi = h −h fi + αt + βt2 dt = 2hfi + 2 3 βh3 = 2hfi + 2h 6 (fi+1 + fi−1 − 2fi) = h 3 (4fi+1 + fi−1 − 2fi). Tomuto postupu se říká Simpsonovo pravidlo. Celý integrál je nyní přiblížen výrazem ISimp = 1 3 h f0 + f2n + 4 liché k fk + 2 sudé k fk . Obdobným postupem jako výše odvodíme, že celková chyba je odhadnuta výrazem I − ISimp = 1 180 (b − a)h4 f (4) + O(h5 ), kde f (4) představuje odhad pro čtvrtou derivaci funkce f . Závěrem této kapitoly se zastavíme u dalších konceptů integrace. Jako první uvedeme modifikaci Riemannova integrálu, která bude později užitečná v úvahách o pravděpodobnosti a statistice. Ve výkladu vesměs už ale zůstaneme spíše v rovině poznámek a postřehů, zájemce o podrobný výklad bude muset vyhledat jiné zdroje. 6.50 6.48. Riemann–Stieltjesův integrál. Při naší představě o integraci jakožto sčítání nekonečně mnoha linearizovaných (nekonečně) malých přírůstků do plochy zadané funkcí f (x) jsme pominuli možnost, že bychom pro různé hodnoty x brali přírůstky různě vážně. To by jistě mohlo být na infinitesimální úrovni zajištěno záměnou diferenciálu dx za ϕ(x)dx pro nějakou vhodnou funkci φ. Takové chování jsme viděli např. při výpočtu délky parametrizované křivky v prostoru. 271 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET Jistě si ale také umíme představit, že v některém bodě x0 je přírůstek do integrované veličiny dán jako αf (x0) nezávisle na na velikosti přírůstku x. Třeba můžeme sledovat pravděpodobnost, že množství promile alkoholu v krvi řidiče při kontrole bude nejvýše x. S docela velkou pravděpodobností získáme hodnotu 0, tedy pro jakýkoliv integrální součet musí dílek obsahující nulu přispět i konstantním nenulovým příspěvkem, nezávisle na normě dělení. Takové chování neumíme namodelovat vynásobením diferenciálu dx nějakou reálnou funkcí. Místo toho můžeme zobecnit Riemannův integrál následovně: Zvolme na konečném intervalu [a, b] reálnou funkci g. Pro každé dělení s reprezentanty ξi a dělícími body a = x0, x1, . . . , xn = b definujeme Riemann–Stieltjesův integrální součet pro funkci f (x) takto: S = n i=1 f (ξi) g(xi) − g(xi−1) . Řekneme pak, že Riemannův–Stieltjesův integrál I = b a f (x)dg(x) existuje a má hodnotu I, jestliže pro každé reálné > 0 existuje norma dělení δ > 0 taková, že pro všechna dělení s normou menší než δ platí |S − I| < . Např., jestliže zvolíme na intervalu [0, 1] za g(x) po částech konstantní funkci s konečně mnoha body nespojitosti c1, . . . , ck a „skoky“ αi = lim x→ci+ − lim x→ci− pak Riemann–Stieltjesův integrál existuje pro každou spojitou f (x) a je roven I = 1 0 f (x)dg(x) = k i=1 αif (ck). Stejnou technikou, jako jsme používali u Riemannova integrálu, lze i nyní zavést horní a dolní součty a horní a dolní Riemann–Stieltjesův integrál, které mají tu výhodu, že pro omezné funkce vždy existují a jejich hodnoty splývají právě, když existuje Riemann–Stieltjesův integrál ve výše uvedeném smyslu. Již u Riemannova integrálu jsme měli problém s integrovatelností funkcí, které byly „příliš rozskákané“. Technicky pro funkci g(x) na konečném intervalu [a, b] zavádíme její variaci vztahem varb a g = sup n i=1 |g(xi) − g(xi−1)| 272 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET kde supremum bereme přes všechna dělení intervalu [a, b]. Pokud je supremum nekonečné, říkáme, že g(x) má neomezenou variaci na [a, b], v opačném případě říkáme, že je g funkce s omezenou variací na intervalu [a, b]. Podobně, jak jsme postupovali u Riemannova integrálu, můžeme docela snadno odvodit následující: Věta. Nechť f (x) a g(x) jsou reálné funkce na konečném intervalu [a, b]. (1) Pokud je g(x) spojitě diferencovatelné, pak Riemannům integrál nalevo a Riemann–Stieltjesův integrál napravo existují současně a jejich hodnoty jsou si rovny b a f (x)g (x)dx = b a f (x)dg(x) (2) Pokud je f (x) spojitá a g(x) má konečnou variaci, pak integrál b a f (x)dg(x) existuje. 6.51 6.49. Kurzweilův integrál. Posledním zastavením bude modifikace Riemannova integrálu, která napravuje nešťastné chování ve třetím bodu v odstavci 6.37, tj. limity neklesajících posloupností integrovatelných funkcí budou opět integrovatelné. Pak budeme moci i v těchto případech měnit pořadí limitního procesu a integrace, jak tomu bylo u stejnoměrné konvergence. Všimněme si napřed v čem je jádro problému. Intuitivně bychom měli předpokládat, že hodně malé množiny musí mít velikost nulovou, a tudíž by změny hodnot funkcí na takovýchto množinách neměly ovlivnit integraci. Navíc, spočetné sjednocení takových „pro integraci zanedbatelných“ množin by mělo mít opět velikost nulovou. Z toho bychom tedy čekali, např. množina racionálních čísel uvnitř konečného intervalu bude mít takovouto vlastnost a tedy její charaktersitická funkce by měla být integrovatelná a hodnota takového integrálu má být nulová. Řekneme, že množina A ⊂ R má nulovou míru, když pro každé > 0 můžeme najít pokrytí množiny A spočetným systémem otevřených intervalů Ji, i = 1, 2, . . . , takových, že ∞ i=1 m(Ji) < . V dalším budeme vždy výrokem „funkce f má na množině B danou vlastnost skoro všude“ myslet skutečnost, že má f tuto vlastnost ve všech bodech, až na podmnožinu A ⊂ B míry nula. Např. tedy charakteristická funkce racionálních čísel je skoro všude nulová, po částech spojitá funkce je skoro všude spojitá atd. Chtěli bychom nyní modifikovat definici Riemannova integrálu tak, abychom uměli při volbě dělení a příslušných Riemannových součtů eliminovat neblahý vliv hodnot integrované funkce na předem známé množině míry nula. Nabízí se zkusit zajistit, aby dílky v uvažovaných děleních s reprezentanty měly tu vlastnost, že kolem bodů takovéto množiny budou kontrolovatelně malé. 273 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET Kladnou reálnou funkci δ na konečném intervalu [a, b] nazýváme kalibr. Dělení intervalu [a, b] s reprezentanty ξi nazýváme δ–kalibrované, jestliže pro všechna i platí ξi − δ(ξi) < xi−1 ≤ ξi ≤ xi < ξi + δ(ξi). Pro další postup je podstatné ověřit, že ke každému kalibru δ lze najít nějaké δ–kalibrované dělení s reprezentanty. Tomuto tvrzení se říká Cousinovo lemma a lze jej dokázat např. obvyklým postupem opřeným o vlastnosti suprem. Pro daný kalibr δ na [a, b] si označíme M množinu všech bodů x ∈ [a, b] takových. že na [a, x] lze δ–kalibrované dělení s reprezentanty najít. Jistě je M neprázdná a ohraničená a má tedy supremum s. Kdyby s = b, pak bychom uměli najít kalibrované dělení s reprezentantem v s a to vede na spor. Nyní již můžeme zavést zobecnění Riemannova integrálu takto: Definice. Funkce f definovaná na konečném intervalu [a, b] má Kurzweilův integrál I = b a f (x)dx, jestliže pro každé > 0 existuje kalibr δ takový, že pro každé δ–kalibrované dělení s reprezentanty platí pro příslušný Riemannův součet S odhad |S − I| < . 6.52 6.50. Vlastnosti Kurzweilova integrálu. Předně si povšimněme, že jsme při definici Kurzweilova integrálu jen omezili množinu všech dělení, pro které Riemannovy součty bereme v úvahu. Pokud tedy bude naše funkce Riemannovsky integrovatelná, musí mít nutně i Kurzweilův integrál a tyto dva integrály jsou si rovny. Ze stejného důvodu můžeme zopakovat argumentaci ve Větě 6.24 o jednoduchých vlastnostech Riemannova integrálu a opět ověřit, že se stejně chová i integrál Kurzweilův. Tj., lineární kombinace integrovatelných funkcí cf (x)+dg(x) je opět integrovatelná a její integrál je c b a f (x)dx + d b a g(x)dx atd. Při důkazu je potřeba jen promyslet drobné modifikace při diskusi zjemněných dělení, která navíc mají být δ– kalibrovaná. Podobně lze rozšířit pro případ monotóních posloupností bodově konvergentních funkcí argumentaci ověřující, že limity stejnoměrně konvergující posloupnosti integrovatelných funkcí fn jsou opět integrovatelné a integrálem limity je limita hodnot integrálů fn. Věta. Uvažme funkci f na intervalu [a, b], která je skoro všude nulová. Pak Kurzweilův integrál b a f (x)d(x) existuje a je roven nule. Důkaz. Jde o pěknou ilustraci myšlenky, že se můžeme zbavit vlivu hodnot na malé množině pomocí chytré volby kalibru. Označme si M příslušnou množinu míry nula, vně které je f (x) = 0 a pišme Mk ⊂ [a, b], k = 1, . . . , pro podmnožinu bodů, pro které je k − 1 < |f (x)| ≤ k. Protože má každá s množin Mk nulovou míru, můžeme ji pokrýt 274 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET spočetným systémem v součtu libovolně malých a po dvou disjukntních otevřených intervalů Jk,i. Definujme si nyní kalibr δ(x) pro x ∈ Jk,i tak, aby celé intervaly (x − δ(x), x + δ(x)) byly stále obsaženy v Jk,i. Mimo množinu M pak δ dodefinujeme libovolně. Pro δ–kalibrované dělení intervalu [a, b] pak můžeme odhadnout příslušný Riemannův součet n−1 j=0 f (ξn)(xi+1 − xi) = n−1 j=0 ξi∈M f (ξn)(xi+1 − xi) ≤ ∞ k=1 n−1 j=0 ξi∈Mk f (ξn) (xi+1 − xi) ≤ ∞ k=1 k n−1 j=0 ξi∈Mk m(Jk,j ) Pokud tedy pro předem známé chceme dosáhnout, aby tento odhad byl menší než , stačí volit pokrytí intervaly Jk,j tak, aby ∞ j=1 m(Jk,j ) = k2k . Pak totiž v posledním výrazu v našem odhadu můžeme dosadit za vnitřní sumu, sečíst geometrickou řadu ∞ k=1 2−k a dostaneme právě prožadované . Důsledek. Kurzweilovskou integrovatelnost dané funkce f (x) ani hodnotu jejího integrálu nezměníme, pozměníme-li hodnoty f (x) na množině míry nula. 6.53 6.51. Vztah Kurzweilova, Newtonova a Lebesgueova integrálu. K dokončení .... absolutně spojité funkce, vztah neurčitého integrálu a antiderivace intergrace v absolutní hodnotě Lebesgueův integrál 275