Obsah Prolog 1 I Obyčejné diferenciální rovnice 11 1 Základní pojmy 13 1.1 Obyčejná diferenciální rovnice prvního řádu . . . . . . . . . . . . . . . . . . . 13 Exkurs: geometrický přístup a elementární metody řešení diferenciálnch rovnic 17 1.2 Systémy diferenciálních rovnic . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 1.2.1 Vektorové a maticové funkce . . . . . . . . . . . . . . . . . . . . . . . 24 1.2.2 Vektorová rovnice prvního řádu . . . . . . . . . . . . . . . . . . . . . . 25 1.3 Skalární rovnice n-tého řádu . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 2 Obecné vlastnosti diferenciálních rovnic 29 2.1 Existence a jednoznačnost řešení skalární ODR . . . . . . . . . . . . . . . . . 30 2.1.1 Eulerovy polygony . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 2.1.2 Picardova posloupnost . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 2.1.3 Frobeniova metoda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 3 Lineární rovnice a systémy 39 4 Autonomní rovnice a systémy 41 II Aplikace 43 5 Makroekonomické modely 45 i ii OBSAH Jako základní studijní literaturu k předmětu M5858 lze používat: 1. J. Kalas, M. Ráb: Obyčejné diferenciální rovnice. MU, Brno 2001 (druhé vydání), 212 stran. Teorie obyčejných diferenciálních rovnic probraná důkladněji, než je v sylabu předmětu M5858. 2. J. Diblík, M. Růžičková: Obyčajné diferenciálne rovnice. EDIS, 2008. Úvod do studia základů teorie obyčejných diferenciálních rovnic. Podrobně jsou probírány zejména lineární rovnice a systémy. 3. M. Ráb: Metody řešení obyčejných diferenciálních rovnic. MU, Brno 1998, 96 stran. Popis některých elementárních metod řešení explicitních obyčejných diferenciálních rov- nic. 4. R. Plch: Příklady z matematické analýzy. Diferenciální rovnice. MU, Brno 1995, 29 stran. Sbírka úloh z elementárních metod řešení explicitních i implicitních obyčejných diferenciálních rovnic. Je doplněna stručným popisem potřebných metod. Jako doplňující literaturu lze doporučit • P. Hartman: Ordinary Differential Equations. John Willey&Sons, New York-LondonSydney, 1964. Klasická monografie o teorii obyčejných diferenciálních rovnic. • L. Perko: Differential Equations and Dynamical systems. Springer, New York-BerlinHedelberg, 2001. Moderněji pojatá monografie o teorii obyčejných diferenciálních rovnic. • J. R. Brannan, W. E. Boyce: Differential Equations. An Introduction to Modern Methods and Applications. Wiley&Sons, 2015. Moderní učebnice s mnoha řešenými příklady. • J. Kaucký: Elementární metody řešení obyčejných diferenciálních rovnic. Nakladatelství ČSAV, Praha 1952. Popis elementárních metod řešení obyčejných diferenciálních rovnic. Je obsáhlejší než skripta 3 • E. Kamke: Differentialgleichungen Lösungsmethoden und Lösungen. Band I, Gewöhliche Differentialgleichungen. Akademische Verlagsgesellschaft Geest & Portig, Leipzig 1951. Důkladná příručka všech rovnic řešitelných elementárními metodami. • J. Kalas, Z. Pospíšil: Spojité modely v biologii. MU, Brno 2001, 265 stran. Doplňky k teorii autonomních systémů, aplikace diferenciálních rovnic především v populační dynamice a teorii šíření epidemií. • P. N. V. Tu; Dynamical Systems: An Introduction with Applications in Economics and Biology. Springer, 1995. Monografie o dynamických systémech (autonomní diferenciální a diferenční rovnice) s aplikacemi. OBSAH iii • N. F. Britton: Essential Mathematical Biology. Springer, London-Berlin-Heidelberg-New York-Hong Kong-Milan-Paris-Tokio, 2003 (second printing). Učebnice deterministických modelů v biologii; první tři kapitoly obsahují aplikace probírané v rámci předmětu M5858. • G. Gandolfo: Economic Dynamic. Springer, 2010. Obsahuje rozmanité matematické metody použitelné v dynamickou ekonomii, nejen diferenciální rovnice. • R. J. Barro, X. Sala-i-Martin: Economic growth. The MIT Press, Cambridge, Massachusetts-London, England, 1999. Aplikace obyčejných diferenciálních rovnic v ekonomii vykládané jiným způsobem než v předchozí monografii. Prolog Nejprve se podíváme na několik zjednodušených modelů nějakých reálných procesů. Na nich potom ukážeme, čím se tento text, a tedy předmět M5858, zabývá. Samočištění jezera Představme si jezero, do kterého přitéká a ze kterého odtéká voda tak, že se jeho objem nemění. Přitom proudění je dostatečně rychlé, aby voda byla stále dokonale promíchaná. Odpařování vody z jezera a déšť mají na množství vody v jezeře zanedbatelný vliv. V jistém okamžiku se do jezera dostane nějaké znečištění. Znečisťující látka (polutant) je ve vodě rozpustná nebo je tvořena malými částicemi, které mají zhruba stejnou hustotu jako voda. Za takové situace se látka v jezeře rovnoměrně rozptýlí, její koncentrace bude v každém okamžiku konstantní a postupně se z jezera odplaví. Chceme tento proces popsat kvantitativně. Označme V objem jezera a v rychlost přítoku a odtoku vody; objem V budeme vyjadřovat v objemových jednotkách (např. m3), rychlost v v objemových jednotkách za jednotku času (např. m3 / den). Předpokládejme, že na počátku, tj. v čase t = 0, se do jezera dostal polutant o celkové hmotnosti m; vyjádříme ji v nějakých jednotkách hmotnosti (např. g). Dále označme x(t) koncentraci polutantu v jezeře v čase t od okamžiku znečištění; koncentraci budeme vyjadřovat v jednotkách hmotnosti na jednotku objemu vody (tedy např. g / m3), čas vyjadřujeme ve stejných jednotkách, k nimž je vztažena rychlost v (tedy např. ve dnech). Chceme znát koncentraci polutantu v libovolném čase od vzniku znečištění, hledáme tedy neznámou funkci x nezávisle proměnné t. Koncentrace polutantu na počátku procesu je rovna x(0) = m V . (1) Zvolme časový interval tak krátký, že se během něho koncentrace polutantu prakticky nezmění. Označme délku tohoto časového intervalu ∆t. Za čas ∆t od okamžiku t bude množství polutantu v jezeře rovno V x(t + ∆t). Toto množství se rovná množství polutantu, které, které bylo v jezeře v čase t, tj. V x(t), zmenšené o množství, které za časový interval délky ∆t odteklo. Za tento interval z jezera odteče voda o objemu v∆t a v něm bylo zhruba (v∆t)x(t) polutantu. Celkem dostáváme V x(t + ∆t) = V x(t) − vx(t)∆t, (2) nebo po snadné úpravě x(t + ∆t) − x(t) ∆t = v V x(t). 1 2 OBSAH Za předpokladu, že funkce x je diferencovatelná, můžeme v této rovnosti provést limitní přechod ∆t → 0 a dostaneme x′ (t) = v V x(t). (3) Hledaná funkce x tedy splňuje rovnici (3), v níž je vázána hodnota neznámé funkce a její derivace. Dále funkce splňuje podmínku (1), v níž je dána hodnota funkce x na počátku procesu. Nyní můžeme snadno přímým výpočtem ověřit, že funkce daná předpisem x(t) = m V e− v V t splňuje rovnici (3) i podmínku (1). Je to klesající funkce, pro kterou platí lim t→∞ x(t) = 0. Koncentrace znečisťující látky v jezeře tedy exponenciálně klesá; v libovolném konečném čase od znečištění je však polutant v jezeře stále přítomný. Růst populace Představme si populaci nějakých organismů. Všechny jedince budeme považovat za stejné; je tedy přiměřenější si představovat bakterie než například obratlovce. Tyto organismy jednak umírají, jednak dávají vznik novým jedincům. Velikost populace v nějakém okamžiku – na začátku popisovaného děje – považujeme za známou. Budeme se snažit popsat, jak se tato velikost vyvíjí v průběhu času. Označme tedy x(t) velikost populace v čase t. Tuto velikost můžeme vyjadřovat třeba v počtu jedinců, v počtu jedinců vztaženém k jednotkové ploše nebo objemu živného média (tedy jako populační hustotu) a podobně. Časová jednotka může být libovolná, je však vhodné ji volit tak, aby byla menší než délka života jedince z uvažované populace, ale řádově s ní srovnatelná. Zvolme nyní časový interval délky ∆t tak krátký, že jedinec, který během něho vznikl (narodil se, oddělil se od jedince rodičovského), přežije jeho konec; dobu ∆t tedy považujeme za mnohem kratší, než je doba života jedince. Velikost populace x(t + ∆t) za časový interval délky ∆t od okamžiku t bude rovna velikosti populace v čase t zmenšené o uhynulé jedince a zvětšené o jedince nově vzniklé. Je přirozené předpokládat, že že množství uhynulých jedinců za jednotku času je úměrné velikosti populace. Koeficient úměrnosti označíme d a nazveme ho úmrtnost (death rate). Tento koeficient lze také interpretovat, jako klasickou pravděpodobnost, že jedinec během jednotkového intervalu zemře; platí tedy 0 < d ≤ 1. Za časový interval délky ∆t uhyne část populace o velikosti dx(t)∆t. Poněvadž všechny jedince považujeme za stejné, předpokládáme také, že každý jedinec během jednotkového času vyprodukuje stejný počet potomků. To znamená, že množství nově vzniklých jedinců za jednotku času je úměrné velikosti populace. Příslušný koeficient úměrnosti označíme b a nazveme porodnost (birth rate). V živé populaci nějací noví jedinci vznikají, proto je b > 0. Velikost části populace tvořené jedinci, kteří nově vznikli v časovém intervalu délky ∆t, vyjádříme tedy součinem bx(t)∆t. Provedenými úvahami jsme dospěli k rovnosti x(t + ∆t) = x(t) + bx(t)∆t − dx(t)∆t, OBSAH 3 kterou můžeme upravit na tvar x(t + ∆t) − x(t) ∆t = (b − d)x(t). Budeme předpokládat, že funkce x je diferencovatelná. Tento předpoklad není realistický, funkce x nabývá hodnot celočíselných (pokud je velikost populace vyjádřena v počtech jedinců) nebo racionálních (pokud je velikost populace vyjádřena jako populační hustota). Pokud je ale populace „dostatečně velká , lze diferencovatelnou funkci považovat za přijatelnou aproximaci velikosti populace měnící se v čase. Za tohoto předpokladu v předchozí rovnosti provedeme limitní přechod ∆t → 0 a dostaneme rovnici x′ (t) = (b − d)x(t). (4) Hledaná funkce tedy opět splňuje rovnici, v níž je vázána její hodnota a hodnota její derivace. Na počátku, v čase t = 0, můžeme velikost populace považovat za známou; označíme ji x0, tj. x(0) = x0. (5) Opět se snadno přímým výpočtem přesvědčíme, že funkce daná předpisem x(t) = x0e(b−d)t splňuje rovnici (4) i podmínku (5). Tato funkce je pro b > d (porodnost větší než úmrtnost) rostoucí, pro b < d klesající a pro b = d konstantní. Dále platí lim t→∞ x(t) =    ∞, b > d, x0, b = d, 0, b < d. To znamená, že v případě b > d velikost populace exponenciálně roste nade všechny meze1. Pokud je b < d, populace vymírá a jedině v mezním případě b = d se velikost populace nemění, zůstává (dynamicky) stálá. Růst populace v omezeném prostředí Model růstu populace (4) má v případě b > d (porodnost větší než úmrtnost) řešení, které exponenciálně roste do nekonečna. To není v konečném světě možné, populace musí narazit na nějaké „meze růstu . Tyto meze si však nemusíme představovat jako nějakou tvrdou hranici, na kterou populace při svém růstu narazí. Spíše se jedná o vliv prostředí, o dostupnost zdrojů, které v něm jsou a podobně. Růst populace se tomuto prostředí nějak přizpůsobuje. Rovnice (4) přepíšeme ve tvaru x′(t) x(t) = b − d. (6) Poněvadž derivace funkce x (velikosti populace) vyjadřuje její změnu, můžeme levou stranu předchozí rovnosti interpretovat jako relativní změnu velikosti populace. A ta je rovna rozdílu 1 Tento výsledek zpopularizoval Thomas Malthus ve své slavné Eseji o principu populace z roku 1798. Nezískal ho však předvedeným výpočtem, ale empiricky — vyhodnocením údajů o velikosti osídlení nových území v Severní Americe. 4 OBSAH porodnosti a úmrtnosti. V prostředí, které považujeme za neomezené, tj. v němž má každý jedinec dostatek zdrojů pro svůj život a reprodukci, jsou porodnost i úmrtnost konstantní, jedná se o vnitřní fyziologické charakteristiky populace. V prostředí, v němž jsou některé zdroje vzácné, mohou porodnost i úmrtnost záviset na dostupnosti těchto zdrojů. A dostupnost zdrojů závisí na velikosti populace — čím je populace větší, tím je pravděpodobnost, že se jedinec dostane ke zdroji menší. Porodnost a úmrtnost populace budou tedy záviset na její velikosti, b = b(x), d = d(x). Označme g(x) = b(x)−d(x). Pak rovnice (6) přejde na tvar x′(t) x(t) = g x(t) , neboli x′ (t) = x(t)g x(t) . (7) Výraz g(x) vyjadřuje relativní přírůstek populace o velikosti x. Nazývá se růstový koeficient (growth rate). Je-li populace malá, zdrojů prostředí připadajících na jedince je dostatek a jedinec má dost energie pro reprodukci; porodnost je tedy velká. Je-li populace velká, zdrojů na jedince je málo a ten je proto schopen vyprodukovat jen málo potomků, pokud vůbec nějaké; porodnost je malá. Navíc velká populace produkuje mnoho zplodin svého metabolismu, tyto odpadní produkty bývají pro jedince toxické, proto je úmrtnost velká, může být i větší než porodnost. Z těchto úvah můžeme učinit závěr, že růstový koeficient velké populace je malý, dokonce záporný. Přesněji řečeno, funkce g definovaná na intervalu [0, ∞) by měla mít vlastnosti g(0) = r > 0, lim x→∞ g(x) < 0. Budeme-li funkci g navíc považovat za spojitou a monotonní, bude existovat taková hodnota K > 0, že g(K) = 0 a (x − K)g(x) < 0 (funkce g je na intervalu [0, K) kladná a na intervalu (K, ∞) záporná). Nejjednodušší funkce, která má tyto vlastnosti je funkce lineární g(x) = r 1 − x K . Obecná rovnice (7) tak získá konkrétní tvar x′ (t) = rx(t) 1 − x(t) K . (8) Přímým výpočtem se přesvědčíme, že funkce x daná předpisem x(t) = Kx0 x0 + (K − x0)e−rt vyhovuje rovnici (8) i podmínce (5). Pokud je x0 < 1 2K, pak funkce x v pravém okolí nuly roste a je konvexní. V jistém čase t1 populace dosáhne velikosti 1 2K a její růst se zpomalí, tj. funkce x bude na intervalu (t1, ∞) konkávní. Pokud je x0 > K, pak funkce x je konvexní a klesající. V případě x0 = K je funkce x konstantní. V každém případě platí lim t→∞ x(t) = lim t→∞ Kx0 x0 + (K − x0)e−rt = K; velikost populace se v průběhu času ustálí na hodnotě K, pokud tuto hodnotu nemá již od začátku. Veličinu K můžeme nazvat kapacita nebo úživnost prostředí. OBSAH 5 Růst majetku Představme si naivního člověka, který má nějaký majetek v penězích. Jeho naivita se projevuje představou, že v bance se budou jeho peníze nějak samovolně množit, proto je uloží. Úrok (podle reklamních materiálů výhodný) je stanovován podle aktuálního ceníku banky. Budeme chtít popsat, jak se v průběhu času hodnota uvažovaného majetku mění. Označme proto x = x(t) velikost majetku v čase t. Ta je vyjádřena v nějaké peněžní jednotce, čas budeme udávat v rocích. Počáteční velikost majetku označíme x0, tedy x(0) = x0. (9) K uložené částce banka připisuje úrok. Jeho nominální velikost se mění, je určena aktuální situací na trhu bankovních služeb a úrokovou sazbou centrální banky, tedy výkonností ekonomiky. Reálná velikost úroku je oproti nominální menší o inflaci a bankovní poplatky. Označme reálnou úrokovou míru v čase t symbolem p(t). Tato veličina bývá vyjádřena v procentech za rok. Úroková míra se nemění plynule, k její změně dochází jen v určitých časových okamžicích. Proto budeme funkci p nezávisle proměnné t považovat za funkci po částech konstantní. V bodech skoku funkce r nemusí být definována, z technických důvodů ji však budeme definovat tak, aby byla spojitá zprava v každém bodě svého definičního oboru, tj. intervalu [0, ∞). Po uplynutí časového intervalu s levým krajním bodem t, který má délku ∆t tak malou, že se v jeho průběhu úroková míra nezmění, bude hodnota majetku rovna její hodnotě na začátku tohoto intervalu změněná o hodnotu reálného (nikoliv připsaného) úroku za tento časový interval, tj. x(t + ∆t) = x(t) + p(t) 100 x(t)∆t. Tuto rovnost upravíme na tvar x(t + ∆t) − x(t) ∆t = 1 100p(t)x(t) a provedeme limitní přechod ∆t → 0. Dostaneme rovnici x′ (t) = 1 100p(t)x(t), (10) v níž je vázána hodnota derivace hledané funkce x a hodnota této funkce. Přímým výpočtem se snadno přesvědčíme, že funkce x splňující rovnici (10) a podmínku (9) je dána výrazem x(t) = x0e 1 100 t 0 p(τ)dτ . Ještě poznamenejme, že funkce po částech spojitá je integrabilní a tedy funkce x je zadána korektně. Z vyjádření majetku x v čase t od začátku (od uložení do banky) vidíme, že za tento čas se majetek zvětší, resp. zmenší, pokud platí nerovnost t 0 p(τ)dτ > 0, resp. t 0 p(τ)dτ < 0, tj. pokud nominální úroková míra je v průběhu času převážně větší, resp. menší, než inflace a poplatky; v reálné ekonomice patrně nastane druhý případ. 6 OBSAH Chladnutí kávy V místnosti je pokojová teplota. Uvaříme si kávu a nalijeme ji do hrnku, nebo v hrnku zalijeme mletou kávu vroucí vodou. Hrnek má tepelně izolované stěny i dno, neprobíhá přes ně žádná výměna tepla. Hrnek nemá žádnou pokličku, hladina kávy není od okolního prostředí nijak izolovaná. Za takové situace lze očekávat, že káva v hrnku bude chladnout. Navíc teplá káva (a kapalina obecně) má menší hustotu, než chladná a to znamená, že ochlazená káva od hladiny klesá a teplá káva ze dna stoupá k hladině. Tímto procesem se káva v hrnku promíchává, takže její teplotu můžeme považovat za stejnou v celém objemu. Chceme popsat vývoj teploty kávy v průběhu času. Za tímto účelem označíme x = x(t) teplotu kávy v čase t; čas je vhodné uvádět v minutách, teplotu ve stupních Celsia. Teplotu v místnosti označíme T a také ji budeme uvádět ve ◦C. Výměna tepla mezi kávou a prostředím probíhá přes hladinu. Označíme její obsah S; můžeme ho vyjádřit v cm2. Experimentálně byl ověřen Newtonův zákon chladnutí: zmenšení teploty za krátký časový interval je úměrné rozdílu teplot, obsahu plochy přes kterou výměna tepla probíhá a času, po který chladnutí probíhá. Příslušný koeficient označíme κ; při zvolených jednotkách bude mít rozměr cm−2min−1. Označíme-li délku časového intervalu ∆t, bude mít tento zákon tvar x(t + ∆t) − x(t) = κS T − x(t) ∆t. Po vydělení výrazem ∆t a limitním přechodu ∆t → 0 dostaneme rovnici x′ (t) = κS T − x(t) . (11) Opět se jedná o rovnici vyjadřující vztah funkční hodnoty a derivace hledané funkce. Na začátku děje byla káva vařící, její teplota byla 100◦C, tj. x(0) = 100. (12) Přímým výpočtem se můžeme přesvědčit, že funkce daná předpisem x(t) = T + (100 − T)e−κSt vyhovuje rovnici (11) i podmínce (12). Jedná se o funkci, která exponenciálně klesá od hodnoty 100◦C k pokojové teplotě T. Teplota kávy se „velice rychle vyrovnává s teplotou místnosti, v konečném čase ale až na tuto teploty neklesne. Dynamika mezd a zaměstnanosti Richard M. Goodwin sestavil ve druhé polovině šedesátých let minulého století matematický model třídního boje. S použitím méně ideologické terminologie se jedná o model časového vývoje mezd a zaměstnanosti, ve kterém lze pozorovat vznik hospodářských cyklů. Jeho podrobné odvození bude uvedeno v kapitole 5, zde pouze naznačíme výsledek. Jedna makroekonomická charakteristika, která v modelu vystupuje je relativní zaměstnanost l (práce, labor) vyjádřená jako podíl zaměstnaných v celkovém množství práceschopného obyvatelstva; jedná se tedy o bezrozměrnou veličinu. Druhá je průměrná mzda w (wage) vyjádřená v peněžních jednotkách. Obě tyto veličiny se v čase mění, tedy l = l(t), w = w(t); tyto funkce budeme považovat za diferencovatelné. Časová změna zaměstnanosti mezd je pak vyjádřena jako derivace těchto funkcí. OBSAH 7 Jedním „ekonomickým zákonem je skutečnost, že při vysoké mzdě (tj. při vysoké garantované minimální mzdě) zaměstnanost klesá (zaměstnavatelům se nevyplatí zaměstnávat drahé pracovníky); naopak, při nízké průměrné mzdě zaměstnanost roste. Odtud plyne, že existuje nějaká „rovnovážná úroveň mezd, při níž se zaměstnanost nemění. Tuto myšlenku vyjádříme přesněji. Za „změnu zaměstnanosti budeme považovat relativní změnu zaměstnanosti l, tedy hodnotu l′(t)/l(t). Její pokles s růstem hladiny mezd budeme specifikovat zjednodušujícím předpokladem, že tato hodnota závisí na průměrné mzdě lineárně, přičemž tato lineární funkce je klesající, tedy l′(t) l(t) = γ − σw(t), (13) kde γ a σ jsou kladné parametry; σ vyjadřuje „citlivost změny zaměstnanosti na růst mezd, γ vyjadřuje relativní růst zaměstnanosti při hypoteticky nulové mzdě. Parametr γ má rozměr 1/čas, parametr σ má rozměr 1/(čas · peněžní jednotka), hodnota γ/σ je „rovnovážná hladina mezd. William Phillips na základě údajů o nominální mzdě a zaměstnanosti v Británii v letech 1861–1957 vypozoroval závislost změny průměrné mzdy na zaměstnanosti; tato závislost není lineární, je vyjádřena známou Phillipsovou křivkou. S rostoucí zaměstnaností roste mzda (pokud chce hospodář při téměř úplné zaměstnanosti najít mezi práceschopným obyvatelstvem nějakého práceochotného, musí ho přeplatit), naopak při malé zaměstnanosti mzda klesá (mezi hladovějícími nezaměstnanými jsou lidé ochotní pracovat za alespoň nějakou mzdu). Přesněji, za změnu mzdy budeme považovat změnu relativní a vyjádříme ji rovností w′(t) w(t) = ϕ l(t) − α, (14) kde ϕ je rostoucí spojitá funkce definovaná na intervalu (0, 1), která má vlastnost lim l→0+ ϕ(l) < α, lim l→1− ϕ(l) > α; limity připouštíme i nevlastní. Parametr α vyjadřuje hodnotu Phillipsovy křivky při „rovnovážné úrovni mezd. Veličiny α i ϕ mají rozměr „čas−1 . Rovnice (13) a (14) můžeme přepsat ve tvaru systému l′(t) = l(t) γ − σw(t) , w′(t) = w(t) ϕ (l(t) − α , (15) v němž jsou vzájemně provázány hodnoty derivace neznámých funkcí l, w a jejich funkční hodnoty. Zákon síly Isaac Newton definoval sílu pomocí jejího účinku na pohyb tělesa, její velikost zavedl jako součin hmotnosti tělesa m a uděleného zrychlení a. Tento postulát budeme precizovat pro velice jednoduchou situaci. Místo tělesa si budeme představovat abstraktní „hmotný bod , tj. těleso o stejné nenulové hmotnosti m ale o nulovém objemu. Dále si budeme představovat, že tento hmotný bod se může pohybovat pouze po přímce. Tuto přímku prohlásíme za souřadnou osu, tj. zvolíme na ní počátek a orientaci. Polohu hmotného bodu pak vyjádříme jako jeho 8 OBSAH souřadnici x; přitom je x reálné číslo. Poněvadž hmotný bod se pohybuje, jeho poloha je v každém okamžiku jiná, souřadnice závisí na čase, x = x(t). Rychlost pohybu je ve fyzice definována jako relativní změna polohy vztažená k času. Změnu polohy za krátký časový interval délky ∆t vyjádříme rozdílem x(t + ∆t) − x(t), tedy rychlost v uvažovaném časovém intervalu je zhruba rovna v(t) ≈ x(t + ∆t) − x(t) ∆t a v limitě ∆t → 0 dostaneme přesně v(t) = x′(t). Zrychlení je analogicky definováno jako relativní změna rychlosti vzhledem k času, tedy zrychlení v uvažovaném krátkém časovém intervalu je zhruba rovno a(t) ≈ v(t + ∆t) − v(t) ∆t a v limitě ∆t → 0 přesně a(t) = v′(t) = x′′(t). Na hmotný bod působí síla F, která nemusí být stejná v každém místě. Její velikost tedy závisí na poloze, tj. na souřadnici bodu, F = F(x) nebo podrobněji F = F x(t) . Postulovaný vztah mezi hmotností m hmotného bodu, jeho zrychlením a a působící silou F je F = ma, se zahrnutím času a souřadnice bodu F x(t) = ma(t) = mx′′ (t), takže x′′ (t) = 1 m F x(t) . (16) Časově proměnná poloha bodu tedy splňuje rovnici, v níž je vázána její hodnota a hodnota její druhé derivace. Shrnutí Všechny matematické modely, které jsme výše sestavili, měly dvě společné vlastnosti: • Ve všech jsme předpokládali, že čas plyne spojitě, je neomezeně dělitelný. Techničtěji vyjádřeno, časový okamžik t je prvkem intervalem [0, ∞) ⊆ R a je možné provádět limitní přechod ∆t → 0; přitom ∆t reprezentuje časový krok, délku krátkého časového intervalu. Okamžik t = 0 v modelech označoval začátek procesu a v tomto okamžiku většinou byl znám stav procesu (1), (5), (9), (12); výjimkou jsou poslední dva modely, u kterých jsme však nenašli (ani nehledali) žádné řešení. • Modelovaný proces byl vyjádřen nebo aproximován nějakou diferencovatelnou funkcí času x = x(t) (v případě modelu změn mezd a zaměstnanosti dvojicí diferencovatelných funkcí l = l(t), w = w(t)). Model představovala rovnice (nebo soustava rovnic) ve které byla vázána hodnota derivace hledané funkce (hledaných funkcí) podle času v jednom časovém okamžiku a její funkční hodnota v témže okamžiku; v modelech (3), (4), (7), (8), (10), (11), (15) byla derivace první, v modelu (16) druhá. OBSAH 9 Rovnice, v nichž vystupuje neznámá funkce jedné reálné proměnné a její derivace, se nazývají diferenciální, podrobněji obyčejné diferenciální rovnice. Budou základním objektem, kterým se budeme zabývat. Jak ukazuje ekonomický model (15) nevystačíme s jednou rovnicí, a jak ukazuje fyzikální model (16) můžeme potřebovat i vyšší derivace, než první. Název „diferenciální rovnice má původ v tradiční symbolice. Např. rovnici (2) můžeme přepsat ve tvaru V x(t + ∆t) − x(t) = −vx(t)∆t, neboli V ∆x(t) = −vx(t)∆t, v níž vystupuje konečný přírůstek hledané funkce x a přírůstek nezávisle proměnné t. Pokud přírůstky budeme považovat za infinitesimální, tj. za „nekonečně malé , poslední rovnice dostane tvar V dx(t) = −vx(t)dt, což je rovnice, v níž vystupují diferenciály dx a dt hledané funkce a její nezávisle proměnné. Ještě můžeme připomenout, že obyčejnou derivaci v tradiční symbolice zapisujeme x′ (t) = dx dt (t) nebo stručně x′ = dx dt ; poslední způsob zápisu je výhodný zejména v situacích, kdy ve formulích vystupuje hledaná časově proměnná veličina (tedy funkce) x, nikoliv její konkrétní hodnota x(t) v časovém okamžiku t (tedy funkční hodnota). Nezávisle proměnná v tomto zápisu není explicitně uvedena, přitom ji potřebujeme nějak označit. Máme-li diferenciální rovnici, chceme znát její řešení, nejlépe v explicitním tvaru. Pro rovnice (3), (4), (8), (10) a (11) jsme takové řešení napsali. Hledání explicitních řešení diferenciálních rovnic je věnován exkurs v sekci 1.1; podrobněji je tato problematika probrána ve skriptech 3. ze seznamu základní studijní literatury. Řešení v explicitním tvaru však nelze nalézt vždy, u systémů rovnic jsou dokonce explicitní řešení dosti vzácná. V takovém případě chceme alespoň znát, zda řešení dané nebo sestavené rovnice existuje, zda je jediné nebo jich je víc, případně na jakém intervalu je řešení definováno. Pokud rovnice má modelovat nějaký skutečný proces, nemůžeme znát úplně přesně hodnoty všech parametrů rovnice, stav procesu na počátku a podobně. V takovém případě je dobré vědět, zda drobná chyba v parametrech nebo počáteční podmínce řešení neznehodnotí. O této problematice pojednává kapitola 2. V obecném modelu růstu populace v omezeném prostředí (7) neznáme konkrétní tvar pravé strany, postulujeme jen nějaké vlastnosti funkce g. Podobně u ekonomického modelu (15) také neznáme přesný tvar pravé strany druhé rovnice, známe jen nějaké vlastnosti funkce ϕ, která na ní vystupuje. A přesto potřebujeme i v těchto případech něco o průběhu řešení vědět. Nelze očekávat, že z „neurčité rovnice získáme přesné kvantitativní informace, ale můžeme se dozvědět alespoň nějaké vlastnosti řešení vyjádřené kvalitativně, např. zda je funkce x rostoucí, klesající, ohraničená, má limitu v nevlastním bodě a podobně. Některé základní poznatky z kvalitativní teorie diferenciálních rovnic jsou uvedeny v kapitole 4. Podívejme se ještě jednou na rovnice (3), (4), (10) a (11). Všechny čtyři lze zapsat v jednotném tvaru x′ (t) = a(t)x(t) + c(t); (17) 10 OBSAH v rovnici (3) je funkce a(t) ≡ r/V , v rovnici (4) je a(t) ≡ b−d, v rovnici (10) je a(t) = 1 100 p(t) a v rovnici (11) je a(t) ≡ −κS, v rovnici (11) je c(t) ≡ κST, v rovnicích (3), (4) a (10) je c(t) ≡ 0. Rovnice tvaru (17) se nazývají lineární. V rovnici (11) člen c(t) = κST vyjadřoval vliv okolního prostředí na popisovaný proces (teplotu místnosti, v níž probíhá chladnutí kávy), ve zbývajících modelech jsme žádné „okolí popisovaného procesu neuvažovali. Proto se lineární rovnice s c ≡ 0 nazývají homogenní (stejnorodé; celý proces se „rodí z jednoho „zdroje , nic vnějšího nebo cizího ho neovlivňuje), rovnice s nenulovým členem c se nazývá nehomogenní. Ve všech uvedených řešeních se vyskytovala přirozená exponenciální funkce. Později uvidíme, že množina řešení lineární rovnice (nebo systému lineárních rovnic) má také „pěkné algebraické vlastnosti — může tvořit konečněrozměrný vektorový prostor. Navíc se lineární rovnice často vyskytují v aplikacích, nebo bývají prvním přiblížením se k modelu zkoumaného procesu. Z těchto důvodů se lineárními rovnicemi zabývá samostatná kapitola 3. Část I Obyčejné diferenciální rovnice 11 Kapitola 1 Základní pojmy 1.1 Obyčejná diferenciální rovnice prvního řádu Převážně budeme pracovat s reálnými funkcemi jedné reálné proměnné, kterou označíme t; v dynamických modelech totiž nezávisle proměnná bývá interpretována jako čas (latinsky tempus). Je-li x : R → R, budeme psát x = x(t) nebo x = x( · ). Obyčejnou derivaci funkce x v bodě t (v čase t) značíme x′(t) nebo jako podíl diferenciálů, tedy x′ (t) = dx dt (t). Zápis x′ = dx dt označuje derivaci funkce x v obecném bodě. Můžeme tedy psát ′ = d dt a obecně pro n-tou derivaci x(n) = dnx dtn nebo stručně (n) = dn dtn . Diferenciální rovnice (podrobněji obyčejná diferenciální rovnice prvního řádu) je rovnice, v níž vystupuje neznámá funkce x = x(t), její první derivace x′ = x′(t) a hodnota nezávisle proměnné t, tedy F(t, x, x′ ) = 0, kde F je nějaká funkce tří proměnných. Řešením rovnice je funkce x, která ji splňuje; podrobněji diferencovatelná funkce x definovaná na nějakém intervalu J, přičemž pro každé t ∈ J je t, x(t), x′(t) v definičním oboru funkce F a platí F t, x(t), x′(t) = 0. Uvedená rovnice se nazývá implicitní nebo nerozřešená vzhledem k derivaci. Pokud se podaří derivaci x′ z rovnice vyjádřit, dostaneme explicitní rovnici nebo rovnici rozřešenou vzhledem k derivaci. Definice 1. Buď G ⊆ R2 množina s neprázdným vnitřkem, f : G → R. Rovnice x′ = f(t, x) (1.1) se nazývá obyčejná diferenciální rovnice prvního řádu rozřešená vzhledem k derivaci. Řešením této rovnice na nedegenerovaném intervalu J ⊆ R se rozumí diferencovatelná funkce x : J → R, která splňuje podmínky t, x(t) ∈ G, x′ (t) = f t, x(t) pro každé t ∈ J; 13 14 KAPITOLA 1. ZÁKLADNÍ POJMY pokud některý krajní bod patří do intervalu J, je v podmínkách příslušná jednostranná deri- vace. Graf řešení rovnice (1.1) se nazývá integrální křivka. Příklad: G = {(t, x) ∈ R2 : t = 0}, f(t, x) = x t . Funkce x(t) = Ct, kde C ∈ R, je řešením rovnice x′ = x t (1.2) na jakémkoliv z intervalů (tα, tω) ⊆ (0, ∞) nebo (tα, tω) ⊆ (−∞, 0). Přestože je tato funkce x definována na celé množině R, není řešením dané rovnice na žádném intervalu, který obsahuje nulu, poněvadž bod 0, x(0) = (0, 0) není prvkem množiny G. Tento příklad ukazuje, že diferenciální rovnice může mít více řešení. Tato nejednoznačnost je způsobena možností volby intervalu, na kterém řešení uvažujeme, nebo tím, že více funkcí definovaných na stejném intervalu je řešením dané rovnice. Definice 2. Nechť x = x(t) je řešením rovnice (1.1) na intervalu J a ˜x = ˜x(t) je řešením rovnice (1.1) na intervalu ˜J. Jestliže ˜J ⊆ J a pro každé t ∈ ˜J je x(t) = ˜x(t), řekneme, že řešení x = x(t) je prodloužením řešení ˜x = ˜x(t) a že řešení ˜x = ˜x(t) je zúžením (restrikcí) řešení x = x(t). Jestliže řešení x = x(t) rovnice (1.1) není zúžením žádného jiného řešení této rovnice, řekneme, že x = x(t) je úplným (neprodlužitelným) řešením rovnice (1.1), (1.3). Nadále v této kapitole budeme pod pojmem „řešení rozumět úplné řešení. Definice 3. Nechť G, f mají stejný význam jako v definici 1 a nechť (t0, ξ) ∈ G je libovolný bod. Úloha najít řešení rovnice (1.1), které splňuje podmínku x(t0) = ξ (1.3) se nazývá počáteční nebo Cauchyova úloha, podmínka (1.3) se nazývá počáteční nebo Cauchyova podmínka. Řešení počáteční úlohy (1.1), (1.3) se nazývá partikulární řešení rovnice (1.1). Příklad: Nechť t0 = 0, ξ ∈ R. Funkce x(t) = ξ t0 t je řešením úlohy (1.2), (1.3). Toto řešení je definováno na intervalu J = (0, ∞), t0 > 0, (−∞, 0), t0 < 0. Definice 4. Nechť g = g(t, C) je funkce dvou proměnných taková, že ke každému (t0, ξ) ∈ G existuje C0 ∈ R takové, že funkce x = x(t) = g(t, C0) je řešením počáteční úlohy (1.1), (1.3). Pak se funkce g nazývá obecné řešení rovnice (1.1). Proměnnou t funkce g v předchozí definici považujeme za nezávisle proměnnou reálné funkce g( · , C) jedné reálné proměnné; proměnnou C považujeme za parametr. Množina funkcí g( · , C) takových, že C ∈ R a g je obecné řešení rovnice (1.1) nemusí obsahovat všechna řešení této rovnice. 1.1. OBYČEJNÁ DIFERENCIÁLNÍ ROVNICE PRVNÍHO ŘÁDU 15 Definice 5. Nechť M je množina všech řešení rovnice (1.1), g je obecné řešení této rovnice a N je množina funkcí jedné proměnné definovaná jako N = {g( · , C) : C ∈ R} . Řešení x∗ ∈ M N rovnice (1.1) definované na intervalu J a takové, že ke každému t0 ∈ J existuje C0 ∈ R, že g(t0, C0) = x∗(t0), se nazývá singulární. (Názorněji řečeno: každým bodem grafu singulárního řešení prochází integrální křivka nějakého partikulárního řešení, které není singulárním. Nebo: v každém bodě t0, x∗(t0) ) = (t0, ξ) singulárního řešení má počáteční úloha (1.1), (1.3) alespoň dvě různá řešení, tj. úloha (1.1), (1.3) není jednoznačně řešitelná.) Řešení ˜x ∈ M N rovnice (1.1) které není singulární, se nazývá výjimečné. Příklad: Nechť G = {(t, x) : t ∈ R, x ≥ 0}, f(t, x) = 2 √ x. Funkce g definovaná předpisem g(t, C) = 0, t < C, (t − C)2, t ≥ C je obecným řešením rovnice x′ = 2 √ x. (1.4) Vskutku, dg(t, C) dt = 0, t < C, 2(t − C), t ≥ C, 2 g(t, C) = 0, t < C, 2|t − C|, t ≥ C = 0, t < C, 2(t − C), t ≥ C, takže každá z funkcí g( · , C) je řešením rovnice (1.4). Pro ξ ≥ 0 a C = t0 − √ ξ platí t0 ≥ C, tedy g(t0, t0 − √ ξ) = (t0 − t0 + √ ξ)2 = ξ při libovolných hodnotách t0 ∈ R a ξ ≥ 0.1 Konstantní funkce x∗, x∗(t) = 0 je evidentně také řešením rovnice (1.4). Pro libovolné t0 ∈ R platí x∗(t0) = 0 = g(t, t0), takže x∗ je singulárním řešením této rovnice. Geometrická interpretace diferenciální rovnice Rovnice (1.1) přiřazuje každému bodu z G právě jednu hodnotu x′ = f(t, x), tedy každému bodu (t0, ξ) ∈ G lze přiřadit směrový vektor tečny k integrální křivce v bodě (t0, ξ), tj. přímky x−ξ = f(t0, ξ)(t−t0). Tento vektor má souřadnice 1, f(t0, ξ) . To znamená, že rovnice (1.1) definuje na G vektorové pole2. Toto pole se nazývá směrové pole rovnice (1.1). Každá integrální křivka rovnice (1.1) je vektorovou čárou3 směrového pole. Směrové pole tedy poskytuje představu o průběhu řešení rovnice (1.1). Vrstevnice funkce f, (tj. křivky zadané rovnicí f(t, x) = c) se nazývají izokliny rovnice (1.1). Jsou to křivky, na nichž mají vektory ze směrového pole stejný směr. 1 Při „mechanickém řešení rovnice (1.4) jakožto rovnice se separovanými proměnnými vyjde x = (t − C)2 , což by znamenalo, že řešení je pro t < C klesající funkcí. Pravá strana rovnice je však nezáporná, takže řešení musí být neklesající. 2 Vektorové pole na množině G je zobrazení ϕ množiny G do (konečně rozměrného reálného) vektorového prostoru, tj. ϕ : G → Rn ; v našem případě je n = 2. 3 Vektorová čára vektorového pole ϕ : G → R2 je křivka v Rn taková, že vektor ϕ(t, x) je tečným vektorem k této křivce v bodě (t, x). 16 KAPITOLA 1. ZÁKLADNÍ POJMY x t Obrázek 1.1: Směrové pole rovnice (1.4). Izokliny jsou vyznačeny tečkovanou čarou, integrální křivky čarou plnou. Integrální křivka odpovídající singulárnímu řešení x∗ ≡ 0 splývá s osou nezávisle proměnné t. Příklad: Najdeme směrové pole rovnice (1.4). Její izokliny jsou dány rovnicí 2 √ x = c; konstanta c je nezáporná, neboť odmocninu v reálném oboru definujeme jako nezápornou funkci. Po triviální úpravě dostaneme x = 1 4 c2. Izokliny jsou tedy přímky rovnoběžné s osou t; na izoklině splývající s osou t i směrový vektor s osou t splývá, tj. má nulový sklon, s rostoucí vzdáleností izokliny od osy t roste sklon směrového vektoru. Situace je znázorněna na Obr. 1.1. Poznámka k terminologii a symbolice Rovnice (1.1) se nazývá diferenciální, přestože se v ní žádný diferenciál neobjevuje; v rovnici vystupují jen nezávisle proměnná, hledaná funkce a její derivace. Terminologie je ale ospravedlněna skutečností, že derivaci můžeme zapsat jako podíl diferenciálů a rovnici (1.1) přepsat do tvaru dx dt = f(t, x), nebo po formální úpravě f(t, x)dt − dx = 0. Diferenciální rovnici tedy můžeme zapsat jako rovnici, v níž se vyskytují závisle a nezávisle proměnná a jejich diferenciály, tedy ve tvaru Φ(t, x, dt, dx) = 0. Z tohoto zápisu však není úplně jasné, která z veličin x a t je závisle a která nezávisle proměnná. To někdy nemusí být nedostatek, ale výhoda. Zejména pokud proměnné x a t interpretujeme geometricky jako souřadnice bodu, není žádná z nich „privilegovaná . 1.1. OBYČEJNÁ DIFERENCIÁLNÍ ROVNICE PRVNÍHO ŘÁDU 17 Exkurs: geometrický přístup a elementární metody řešení diferenciálnch rovnic Ke studiu diferenciálních rovnic mimo jiné vedla úloha z analytické geometrie: napsat rovnici křivky v rovině dané souřadnými osami x a y, pokud známe její tečnu v libovolném bodě; můžeme navíc požadovat, aby křivka procházela daným bodem. Diferenciály dx a dy (podrobněji řečeno diferenciály standardních souřadnicových funkcí) si představujeme jako „nekonečně malé přírůstky křivky ve směru jednotlivých os ; trochu přesněji řečeno, jako přírůstky naměřené na tečně. Tečný vektor ke křivce v obecném bodě tedy má souřadnice (dx, dy). V zadání úlohy je, že známe tečný vektor v každém bodě; řekněme, že to jsou vektory τ(x, y). Nemůžeme ovšem bezprostředně pracovat se vztahem (dx, dy) = τ(x, y), neboť na levé straně by byl vektor „nekonečně krátký , vektor „skoro nulové délky , na pravé straně vektor nenulový; normovat „skoro nulový vektor nedává rozumný smysl. Poněvadž ale známe tečný vektor, známe také vektor normálový ν(x, y); ten je kolmý na vektor tečný τ(x, y), a tedy také na infinitezimální vektor (dx, dy). Jinak řečeno, skalární součin vektorů tečného a normálového je nulový. Pokud tedy normálový vektor v bodě (x, y) rozepsaný do souřadnic je ν(x, y) = f(x, y), g(x, y) , pak musí platit f(x, y)dx + g(x, y)dy = 0. (1.5) Rovnice hledané křivky je tedy řešením této diferenciální rovnice v tradičním zápisu pomocí diferenciálů. Její řešení, tedy hledanou křivku, nazýváme integrální křivkou této rovnice. Požadavku, aby křivka procházela daným bodem (x0, y0), říkáme Cauchyova podmínka. Můžeme ji také zapsat v některém z tvarů y(x0) = y0, nebo x(y0) = x0. (1.6) Diferenciální rovnici (1.5) spolu s Cauchyovou podmínkou nazýváme Cauchyův problém nebo Cauchyova úloha. Slovním spojením „řešit diferenciální rovnici elementárními metodami rozumíme: „úlohu najít řešení diferenciální rovnice nebo Cauchyovy úlohy převést na nějakou jinou – jednodušší – úlohu . Přitom za „jednodušší úlohu považujeme takovou, která se objevuje v kursu matematické analýzy před probíráním diferenciálních rovnic. Často jde o výpočet integrálů, proto se elementárním metodám řešení také říkává „řešení v kvadraturách . Při řešení diferenciálních rovnic elementárními metodami bývá užitečné rovnice zapisovat ve tvaru (1.5) s diferenciály. Příklad: Najdeme rovnici kružnice se středem v počátku souřadnic, která prochází bodem (1, 2). Tečna ke kružnici je v každém bodě kolmá k průvodiči (úsečce spojující uvažovaný bod a střed kružnice), směrový vektor průvodiče v bodě (x, y) je (x, y)−(0, 0) = (x, y). Dostáváme tak diferenciální rovnici xdx + ydy = 0, tedy rovnost diferenciálů xdx = −ydy. Z rovnosti diferenciálů plyne rovnost integrálů (až na integrační konstantu). A poněvadž hledaná kružnice má procházet bodem (1, 2) (můžeme také říci, že křivka z bodu (1, 2) vychází, že bod (1, 2) je jejím počátečním bodem), dostaneme x 1 ξdξ = − y 2 ηdη. 18 KAPITOLA 1. ZÁKLADNÍ POJMY To znamená, že 1 2 x2 − 1 2 12 = − 1 2 y2 − 1 2 22 , po úpravě x2 + y2 = 5. Tento výsledek zcela odpovídá tomu, co nás naučili na střední škole. Exaktní rovnice Jedná se o diferenciální rovnici ve tvaru (1.5), kde funkce f a g splňují identitu ∂f ∂y (x, y) = ∂g ∂x (x, y). (1.7) Výraz na levé straně rovnice (1.5) je za předpokladu (1.7) totálním diferenciálem4 nějaké kmenové funkce F. Připomeňme si, že kmenová funkce splňuje podmínky ∂F ∂x (x, y) = f(x, y), ∂F ∂y (x, y) = g(x, y). (1.8) Je-li F kmenovou funkcí diferenciálu na levé straně rovnice (1.5), pak rovnost F(x, y) = c, kde c je reálná konstanta, je implicitním vyjádřením řešení rovnice (1.5). O tom se snadno přesvědčíme přímým dosazením. Hledání řešení rovnice (1.5) jsme tedy převedli na problém hledání kmenové funkce diferenciálu a na vyšetřování implicitně zadané funkce. Spolu s rovnicí (1.5) uvažujme Cauchyovu podmínku (1.6). Bod (x0, y0) musí samozřejmě ležet v průniku definičních oborů funkcí f a g. Budeme hledat takovou kmenovou funkci F, pro niž platí F(x0, y0) = 0. První z podmínek (1.8) splňuje funkce F daná předpisem F(x, y) = x x0 f(ξ, y)dξ + ϕ(y), (1.9) kde ϕ je nějaká diferencovatelná funkce, pro niž platí ϕ(x0) = 0. Aby byla splněna druhá z podmínek (1.8), musí platit ∂ ∂y   x x0 f(ξ, y)dξ + ϕ(y)   = ∂ ∂y x x0 f(ξ, y)dξ + ϕ′ (y) = g(x, y) ; symbol ′ nyní označuje obyčejnou derivaci podle proměnné y. Z předchozí rovnosti a z podmínky ϕ(y0) = 0 plyne ϕ(y) = y y0  g(x, η) − ∂ ∂η x x0 f(ξ, η)dξ   dη = y y0 g(x, η)dη − x x0 f(ξ, y)dξ + x x0 f(ξ, y0)dξ. Dosazením do rovnosti (1.9) dostaneme hledanou kmenovou funkci F. Řešení Cauchyovy úlohy (1.5), (1.6) je tedy implicitně dáno rovností x x0 f(ξ, y0)dξ + y y0 g(x, η)dη = 0. (1.10) 4 Viz např. Z. Došlá, O. Došlý: Diferenciální počet funkcí více proměnných. MU, Brno 1999, kap. 4 1.1. OBYČEJNÁ DIFERENCIÁLNÍ ROVNICE PRVNÍHO ŘÁDU 19 Analogickým postupem (s opačným pořadím integrování) můžeme najít řešení úlohy (1.5), (1.6) v implicitním tvaru x x0 f(ξ, y)dξ + y y0 g(x0, η)dη = 0. Hledání řešení Cauchyovy úlohy (1.5), (1.6) jsme tedy v případě exaktní rovnice převedli na problém výpočtu integrálů a na vyšetřování implicitně zadané funkce. Speciální případ: rovnice se separovanými proměnnými. Jedná se o rovnici tvaru f(x)dx + g(y)dy = 0, (1.11) v níž funkce f a g jsou funkcemi právě jedné proměnné. Tato rovnice je evidentně exaktní. Křivka, která splňuje rovnici (1.11) a prochází bodem (x0, y0) má podle (1.10) obecnou rovnici x x0 f(ξ)dξ + y y0 g(η)dη = 0. Obecněji můžeme mluvit o rovnicích se separovatelnými proměnnými, pokud v rovnici (1.5) jsou funkce f a g součinem dvou funkcí jedné proměnné. Jedná se tedy o rovnice f1(x)f2(y)dx + g1(x)g2(y)dy = 0. (1.12) Pokud je příslušná Cauchyova podmínka taková, že f2(y0) = 0 = g1(x0), můžeme rovnici (1.12) vydělit výrazem f2(y)g1(x) a dostaneme rovnici se separovanými proměnnými f1(x) g1(x) dx + g2(y) f2(y) dy = 0. Je-li f2(y0) = 0 nebo f1(x0) = 0, ale v ryzím okolí bodu (x0, y0) je f2(y) = 0 = g1(x), provedeme stejnou úpravu a řešení Cauchyovy úlohy dostaneme v implicitním tvaru x x0 f1(ξ) g1(ξ) dξ + y y0 g2(η) f2(η) dη = 0, pokud oba integrály konvergují. V případě, že f2(y0) = 0 (resp. g1(x0) = 0), je přímka daná rovnicí y = y0 (resp. x = x0) integrální křivkou rovnice. Řešení y ≡ y0 (resp. x ≡ x0) může být singulárním řešením této rovnice. Integrační faktor Rovnici (1.12), která obecně není exaktní, jsme vynásobili výrazem ̺(x, y) = 1 g1(x)f2(y) , a tím ji převedli na rovnici exaktní. Můžeme obecně hledat nenulový výraz ̺ = ̺(x, y) takový, že při daných funkcích f = f(x, y), g = g(x, y) je rovnice ̺(x, y)f(x, y)dx + ̺(x, y)g(x, y)dy = 0 (1.13) exaktní. Výraz ̺(x, y) se pak nazývá integrační faktor dané rovnice. V takovém případě musí platit ∂ ∂y ̺f = ∂ ∂x ̺g, tj. ∂̺ ∂y f + ̺ ∂f ∂y = ∂̺ ∂x g + ̺ ∂g ∂x 20 KAPITOLA 1. ZÁKLADNÍ POJMY (pro stručnost zápisu nepíšeme nezávisle proměnné). Z těchto rovností dostaneme vztah g ∂̺ ∂x − f ∂̺ ∂y = ∂f ∂y − ∂g ∂x ̺. (1.14) To znamená, že funkce ̺ splňuje rovnici, v níž se vyskytují její parciální derivace, tj. funkce ̺ je řešením parciální diferenciální rovnice. Řešit parciální diferenciální rovnici není „jednodušší úloha , než řešit obyčejnou diferenciální rovnici. Problém hledání integračního faktoru tedy nemůžeme prohlásit za vyřešený. Pokud by však integrační faktor ̺ byl funkcí pouze jedné proměnné x, ̺ = ̺(x), pak by ∂̺ ∂y = 0 a ∂̺ ∂x = d̺ dx . Parciální rovnice (1.14) by tak přešla na rovnici obyčejnou d̺ dx = 1 g ∂f ∂y − ∂g ∂x ̺, nebo v diferenciálním tvaru 1 ̺ d̺ + 1 g ∂g ∂x − ∂f ∂y dx = 0. (1.15) Pokud je výraz před diferenciálem dx funkcí pouze jedné proměnné x, pak je rovnice (1.15) rovnicí se separovanými proměnnými. Dostáváme tak závěr: Je-li ∂ ∂y 1 g ∂g ∂x − ∂f ∂y = 0, pak existuje integrační faktor ̺ = ̺(x) rovnice (1.5); tento integrační faktor je řešením obyčejné diferenciální rovnice (1.15). Analogicky odvodíme: Je-li ∂ ∂x 1 f ∂f ∂y − ∂g ∂x x = 0, pak existuje integrační faktor ̺ = ̺(y) rovnice (1.5), který je řešením obyčejné diferenciální rovnice se separovanými proměnnými 1 ̺ d̺ + 1 f ∂f ∂y − ∂g ∂x dx = 0. Rovnice na rovnici exaktní transformovatelné Některé speciální rovnice lze vhodnou substitucí nebo úpravou (případně kombinací obou postupů) na rovnici exaktní převést. Jedná se zejména o následující typy rovnic: (i) Rovnice homogenní. Nejprve připomeneme definici: Funkce h : R2 → R se nazývá homogenní řádu k, pokud pro každou reálnou konstantu κ platí h(κx, κy) = κk h(x, y). Homogenní diferenciální rovnice je rovnice tvaru (1.5), v níž obě funkce f a g jsou homogenní stejného řádu. Takovou rovnici můžeme upravit na tvar xk f 1, y x dx + xk g 1, y x dy = 0 a po vydělení výrazem xk dostaneme f 1, y x dx + g 1, y x dy = 0. (1.16) 1.1. OBYČEJNÁ DIFERENCIÁLNÍ ROVNICE PRVNÍHO ŘÁDU 21 Odtud (formálně) plyne dy dx = − f 1, y x g 1, y x . Dále zavedeme substituci u = y x . (1.17) Pak dy dx = − f(1, u) g(1, u) a dále du dx = x dy dx − y x2 = 1 x dy dx − y x = − 1 x f(1, u) g(1, u) + u . Z této rovnosti dostaneme 1 x dx + g(1, u) f(1, u) + ug(1, u) du = 0, což je rovnice se separovanými proměnnými, tedy speciální případ rovnice exaktní. Ještě poznamenejme, že při označení ϕ(ξ) = f(1, ξ) a ψ(ξ) = g(1, ξ) můžeme rovnici (1.16) přepsat na tvar ϕ y x dx + ψ y x dy = 0; takové rovnici říkáme homogenní v užším smyslu. (ii) Rovnice typu f ax + by + c αx + βy + γ dx + g ax + by + c αx + βy + γ dy = 0. (1.18) Rozlišíme tři případy: 1. c = γ = 0. Označíme F(x, y) = f ax + by αx + βy , G(x, y) = g ax + by αx + βy a rovnici přepíšeme jako F(x, y)dx + G(x, y)dy = 0. Přitom platí F(κx, κy) = f aκx + bκy ακx + βκy = f ax + by αx + βy = F(x, y) a stejným výpočtem G(κx, κy) = G(x, y). Obě funkce F a G jsou homogenní řádu nula. Rovnice (1.18) je v tomto případě homogenní a můžeme ji řešit substitucí (1.17). 2. α = β = 0. V tomto případě zavedeme substituci u = ax + by + c γ , takže rovnici přepíšeme ve tvaru f(u)dx + g(u)dy = 0 a z ní vyjádříme dy dx = − f(u) g(u) . Dále platí du dx = 1 γ a + b dy dx = 1 γ a − b f(u) g(u) = ag(u) − bf(u) γg(u) , 22 KAPITOLA 1. ZÁKLADNÍ POJMY takže daná rovnice se transformuje na tvar dx + γg(u) bf(u) − ag(u) du = 0, což je rovnice se separovanými proměnnými. 3. c2 + γ2 = 0 = α2 + β2 . Nejprve výraz ax + by + c αx + βy + γ upravíme. Pokud α = 0, dostaneme ax + by + c αx + βy + γ = 1 α a + (αb − aβ)y + αc − aγ αx + βy + γ , pokud β = 0, dostaneme ax + by + c αx + βy + γ = 1 β b − (αb − aβ)y + γb − βc αx + βy + γ . Nyní mohou nastat dvě možnosti: • αb − aβ = 0. Z předchozího výpočtu pak vidíme, že rovnice je stejného typu, jako v případě 2. • αb − aβ = 0. Za tohoto předpokladu existuje jednoznačné řešení m, n soustavy algebraických lineárních rovnic am + bn = c, αm + βn = γ. S využitím tohoto řešení zavedeme substituce ξ = x + m, η = y + n. (1.19) pak dξ = dx,dy = dη a ax + by + c αx + βy + γ = a(ξ − m) + b(η − n) + c α(ξ − m) + β(η − n) + γ = = aξ + bη − (am + bn) + c αξ + βη − (am + bn) + γ = aξ + bη αξ + βη . To znamená, že substituce (1.19) převede rovnici (1.18) na rovnici stejného typu, jaký je v případě 1. (iii) Rovnice lineární je rovnice, v níž je podíl diferenciálů (derivace) vyjádřen jako výraz lineární v závisle proměnné, tj. dy dx = a(x)y + b(x), nebo dx dy = a(y)x + b(y), kde a, b jsou nějaké integrabilní funkce jedné proměnné, funkce a je nenulová. Budeme se věnovat první z rovnic ve tvaru a(x)y + b(x) dx − dy = 0; (1.20) druhá rovnice z ní vznikne záměnou proměnných. Jedná se o rovnici tvaru (1.5), kde f(x, y) = a(x)y + b(x) a g(x, y) = −1. Poněvadž ∂g ∂x − ∂f ∂y = −a(x) = 0, 1.1. OBYČEJNÁ DIFERENCIÁLNÍ ROVNICE PRVNÍHO ŘÁDU 23 rovnice není exaktní. Budeme tedy pro ni hledat integrační faktor. Poněvadž ∂ ∂y 1 g ∂g ∂x − ∂f ∂y (x, y) = ∂ ∂y a(x) = 0, existuje integrační faktor tvaru ̺ = ̺(x). Ten je řešením rovnice se separovanými proměnnými 1 ̺ d̺ + a(x)dx = 0. Tato rovnice má podle (1.10) řešení v implicitním tvaru zapsaném rovností ̺ ̺0 1 r dr + x x0 a(ξ)dξ = 0, po úpravě ln ̺ ̺0 = − x x0 a(ξ)dξ. Volíme ̺0 = 1 (nejde nám totiž o nalezení všech možných integračních faktorů, ale stačí nám jen jeden) a dostaneme integrační faktor ve tvaru ̺(x) = e − x x0 a(ξ)dξ . Rovnici (1.20) vynásobíme tímto integračním faktorem a dostaneme rovnici exaktní a(x)y + b(x) e − x x0 a(σ)dσ dx − e − x x0 a(ξ)dξ dy = 0, která má podle (1.10) řešení zapsané v implicitním tvaru x x0 a(ξ)y0 + b(ξ) e − ξ x0 a(σ)dσ dξ − y y0 e − x x0 a(σ)dσ dη = 0. (1.21) Nyní vypočítáme x x0 a(ξ)y0 e − ξ x0 a(σ)dσ dξ = −y0 x x0 d dξ e − ξ x0 a(σ)dσ dξ = −y0  e − x x0 a(σ)dσ − 1   , y y0 e − x x0 a(ξ)dξ dη = (y − y0)e − x x0 a(ξ)dξ , dosadíme do (1.21), x x0 b(ξ)e − ξ x0 a(σ)dσ dξ + y0 − ye − x x0 a(ξ)dξ = 0. Odtud vyjádříme řešení rovnice (1.20) ve tvaru y = y0e x x0 a(ξ)dξ + x x0 b(ξ)e x ξ a(σ)dσ dξ. (1.22) (iv) Rovnice Bernoulliova dy dx = a(x)y + b(x)yr , 24 KAPITOLA 1. ZÁKLADNÍ POJMY kde r = 1 je nějaká reálná konstanta. Zavedeme substituci u = y1−r . Pak du dx = (1 − r)y−r dy dx = (1 − r)y−r a(x)y + b(x)yr = (1 − r) a(x)y1−r + b(x) . Bernoulliova rovnice se tedy transformuje na rovnici du dx = (1 − r)a(x)u + (1 − r)b(x), což je rovnice lineární. 1.2 Systémy diferenciálních rovnic 1.2.1 Vektorové a maticové funkce Reálný n-rozměrný vektor x je prvkem prostoru Rn. Složky (standardní souřadnice) vektoru x budeme značit x1, x2, . . . , xn nebo (x)1, (x)2, . . . , (x)n. Matice A o m řádcích a n sloupcích je prvkem prostoru Rmn. Její složku na i-tém řádku a v j-tém sloupci budeme značit aij nebo (A)ij. Vektor z prostoru Rn budeme chápat jako matici o n řádcích a jednom sloupci. Je-li tedy x ∈ Rn a A ∈ Rmn, můžeme psát x =      x1 x2 ... xn      , (x)i = xi, A =      a11 a12 . . . a1n a21 a22 . . . a2n ... ... ... ... am1 am2 . . . amn      , (A)ij = aij, (Ax)i = n k=1 aikxk. Normy vektorů a matic Normu vektoru x =      x1 x2 ... xn      , podrobněji vektorovou 1-normu nebo součtovou normu definujeme předpisem ||x|| = ||x||1 = n i=1 |xi|. Normu matice A =      a11 a12 . . . a1n a21 a22 . . . a2n ... ... ... ... am1 am2 . . . amn      , podrobněji maticovou 1-normu nebo součtovou normu definujeme předpisem ||A|| = ||A||1 = m i=1 n j=1 |aij|. 1.2. SYSTÉMY DIFERENCIÁLNÍCH ROVNIC 25 Na množině vektorů zavádíme metriku ̺(x, y) = ||x − y||, na množině matic zavádíme metriku ̺(A, B) = ||A − B||. Jedná se o součtovou neboli taxíkářskou metrikou, sr. Z. Došlá, O. Došlý: Metrické prostory. MU, Brno 1996, I.1.1.2.iii. • Platí: ||Ax|| ≤ ||A|| ||x||. Této vlastnosti se říká, že maticová norma je souhlasná s vektorovou normou. Důkaz: Pro libovolné i, k ∈ {1, 2, . . . , n} je |aik| ≤ n j=1 |aij|. Odtud plyne ||Ax|| = m i=1 |(Ax)1| = m i=1 n k=1 aikxk ≤ m i=1 n k=1 |aik| |xk| = = n k=1 |xk| m i=1 |aik| ≤ n k=1  |xk| m i=1 n j=1 |aij|   = n k=1 |xk|   m i=1 n j=1 |aij|   . Spojitost, derivace a integrál vektorových a maticových funkcí Vektorová funkce, podrobnněji n-vektorová funkce, x = x(t) je zobrazení x : R → Rn, maticová funkce, podrobněji čtvercová n-rozměrná maticová funkce, A = A(t) je zobrazení A : R → Rn2 , x(t) =      x1(t) x2(t) ... xn(t)      , A(t) =      a11(t) a12(t) . . . a1n(t) a21(t) a22(t) . . . a2n(t) ... ... ... ... an1(t) an2(t) . . . ann(t)      . Na množině R uvažujeme přirozenou metriku, na množině Rn, resp. Rn2 , uvažujeme příslušnou součtovou metriku. Spojitost vektorové, resp. maticové, funkce chápeme jako spojitost příslušného zobrazení metrických prostorů. Podrobněji: vektorová funkce x (resp. maticová funkce A) je spojitá v bodě t0 svého definičního oboru, jestliže ke každému kladnému číslu ε existuje kladné číslo δ tak, že pro všechna t z definičního oboru funkce x z nerovnosti |t − t0| < δ plyne nerovnost ||x(t) − x(t0)|| < ε (resp. ||A(t) − A(t0)|| < ε). Vektorová (resp. maticová) funkce je spojitá právě tehdy, když všechny její složky jsou spojité. Limitu v bodě t0, derivaci v obecném bodě t a integrál v mezích od t do t0 vektorové, resp. maticové, funkce definujeme vztahy (v uvedeném pořadí) lim t→t0 x(t) i = lim t→t0 xi(t), dx dt (t) i = x′ (t) 1 = x′ i(t) ,   t t0 x(s)ds   i = t t0 xi(s)ds, lim t→t0 A(t) ij = lim t→t0 aij(t), dA dt (t) ij = A′ (t) ij = a′ ij(t),   t t0 A(s)ds   ij = t t0 aij(s)ds. 1.2.2 Vektorová rovnice prvního řádu Definice 6. Buď G ⊆ R1+n množina s neprázdným vnitřkem, f : G → Rn. Rovnice x′ = f(t, x) (1.23) 26 KAPITOLA 1. ZÁKLADNÍ POJMY se nazývá systém n obyčejných diferenciálních rovnic prvního řádu nebo n-vektorová obyčejná diferenciální rovnice prvního řádu. Rovnice (1.23) se od rovnice (1.1) liší pouze tím, že některé symboly (konkrétně hledaná funkce x a funkce f na pravé straně) jsou tučné, označují vektorové proměnné. Proto můžeme zopakovat vše, co je uvedeno v 1.1 mezi Definicí 1 a geometrickou interpretací diferenciální rovnice. Všechny pojmy vztahující se k diferenciální rovnici (1.1) jsou po příslušné záměně skalárů za vektory použitelné i na systémy diferenciálních rovnic. Vektorovou rovnici můžeme rozepsat do složek x′ 1 = f1(t, x1, x2, . . . , xn), x′ 2 = f2(t, x1, x2, . . . , xn), ... x′ n = fn(t, x1, x2, . . . , xn). Počáteční podmínku x(t0) = ξ k rovnici (1.23) zadáváme pro systém rozepsaný do složek ve tvaru x1(t0) = ξ1, x2(t0) = ξ2, . . . , xn(t0) = ξn. (1.24) Obecné řešení n-rozměrného systému g( · , C) závisí na n-rozměrné konstantě, tedy na n parametrech. 1.3 Skalární rovnice n-tého řádu Definice 7. Buď G ⊆ R1+n množina s neprázdným vnitřkem, f : G → R. Rovnice x(n) = f t, x, x′ , x′′ , . . . , x(n−1) (1.25) se nazývá obyčejná diferenciální rovnice n-tého řádu rozřešená vzhledem k nejvyšší derivaci. Řešením této rovnice na nedegenerovaném intervalu J ⊆ R se rozumí n-krát diferencovatelná funkce x : J → R, která pro každé t ∈ J splňuje podmínky t, x(t), x′ (t), x′′ (t), . . . , x(n−1) (t) ∈ G, x(n) (t) = f t, x(t), x′ (t), x′′ (t), . . . , x(n−1) (t) . Rovnici n-tého řádu lze převést na systém prvního řádu: • Nechť funkce x je řešením rovnice (1.25). Definujme funkce x1 = x, xk+1 = x′ k pro k = 1, 2, . . . , n − 1. Pak xk+1 = x′ k = x′′ k−1 = x′′′ k−2 = · · · = x (k) 1 = x(k) pro k = 2, 3, . . . , n, x′ = x′ 1, x′′ = x3, x′′′ = x4, . . . , x(n−1) = xn, takže x′ n = x(n) = f t, x, x′ , x′′ , . . . , x(n−1) = f(t, x1, x2, x3, . . . , xn). 1.3. SKALÁRNÍ ROVNICE N-TÉHO ŘÁDU 27 To znamená, že funkce x1, x2, . . . , xn jsou řešením systému rovnic x′ 1 = x2, x′ 2 = x3, ... x′ n−1 = xn, x′ n = f(t, x1, x2, x3, . . . , xn). (1.26) • Naopak, nechť vektorová funkce x = (x1, x2, . . . , xn) je řešením systému rovnic (1.26). Pak pro její složky platí x2 = x′ 1, x3 = x′ 2 = x′′ 1, x4 = x′ 3 = x′′′ 1 , . . . , xn = x (n−1) 1 , takže x (n) 1 = x′ n = f(t, x1, x2, x3, . . . , xn) = f t, x1, x′ 1, x′′ 1, . . . , x (n−1) 1 . To znamená, že první složka řešení systému (1.26) je řešením rovnice (1.25). Celkem jsme ukázali, že rovnice (1.25) je ekvivalentní se systémem (1.26). Z této úvahy také plyne, že počáteční (Cauchyovu) podmínku pro rovnici (1.25) zadáváme ve tvaru x(t0) = ξ1, x′ (t0) = ξ2, x′′ (t0) = ξ3, . . . , x(n−1) (t0) = ξn, (1.27) kde (t0, ξ1, ξ2, . . . , ξn) ∈ G. Úplné řešení, partikulární a obecné řešení rovnice (1.25) definujeme analogicky jako u rovnic prvního řádu. Obecné řešení rovnice n-tého řádu závisí na n parametrech. Příklad: Pohyb hmotného bodu o hmotnosti m, který je vázán na přímku a na který působí síla F závislá na poloze lze popsat skalární rovnicí druhého řádu x′′ = 1 m F(x), kde x = x(t) označuje polohu bodu v čase t, sr. Prolog, str. 7. Stejně dobře ho však lze popsat systémem dvou rovnic x′ = v, v′ = 1 m F(x); v = v(t) označuje rychlost bodu v čase t. 28 KAPITOLA 1. ZÁKLADNÍ POJMY Kapitola 2 Obecné vlastnosti diferenciálních rovnic Aby počáteční úloha pro diferenciální rovnici mohla být popisem (modelem) nějakého reálného procesu, musí mít několik vlastností: 1. Existuje její řešení. Diferenciální rovnici považujeme za vyjádření (nebo alespoň idealizaci nebo aproximaci) nějakého „zákona (přírodního, ekonomického, sociologického, . . . ), tj. pravidla vyabstrahovaného metodami příslušné vědní disciplíny. Proces se podle tohoto pravidla skutečně vyvíjí, tj. řešení počáteční úlohy musí existovat. 2. Řešení počáteční úlohy je jediné. Je-li proces deterministický, ze znalosti počátečního stavu a pravidla vývoje jednoznačně plyne jeho další vývoj. 3. Řešení musí záviset na parametrech rovnice a počátečních podmínkách spojitě. Všechny konstanty (parametry modelu) a počáteční hodnoty můžeme změřit jen s omezenou přesností. A je žádoucí, aby malá chyba měření nezpůsobila velkou změnu řešení v konečném čase. 4. Řešení musí být definováno v dostatečně dlouhém čase. Modelovaný proces určitě nějakou dobu probíhá (abychom si ho vůbec povšimli) a nějakou dobu ještě probíhat bude (aby mělo smysl ho modelovat). Proto je potřebné se zabývat otázkou, jaké podmínky kladené na pravou stranu rovnice, zaručí existenci řešení. Jinak řečeno, jak poznáme, že pravidlo vývoje není z procesu vyabstrahováno naprosto špatně. Jednoznačně se vyvíjejí procesy studované klasickou (nekvantovou) fyzikou. Procesy komplexnější (kterým se věnuje např. vývojová a evoluční biologie, ekonomie, sociologie a podobně) již jednoznačné být nemusí, může dojít k nějakému „větvení procesu. Proto je užitečné studovat, kdy je řešení rovnice jediné a za jakých podmínek může dojít k nejednoznačnosti řešení (tj. k nepredikovatelnosti vývoje). Příjemným zjištěním přitom bude, že dostatečné podmínky pro jednoznačnost řešení počáteční úlohy jsou také dostatečnými podmínkami pro spojitou závislost řešení na parametrech a počátečních hodnotách. Vývoj deterministických procesů můžeme pro nepříliš vzdálený časový horizont predikovat dostatečně přesně, pokud známe deterministické pravidlo vývoje a dostatečně přesně měříme aktuální hodnoty. V této formulaci zůstaly velice vágní pojmy „dostatečně přesně a „nepříliš vzdálený . Co přesně znamenají podstatně závisí na charakteru procesu. 29 30 KAPITOLA 2. OBECNÉ VLASTNOSTI DIFERENCIÁLNÍCH ROVNIC Udržitelnost bývá důležitou vlastností procesů, proto je dobré mít jasno v tom, do jakého času řešení počáteční úlohy existuje. Zejména vyjasnit, zda existuje nějaká konečná hranice, za niž řešení prodloužit nelze, nebo zda je vývoj (potenciálně) nekonečný. V této kapitole nejprve ukážeme, jak rozhodnout o existenci a jednoznačnosti řešení jedné skalární rovnice. Vedlejším produktem prováděných úvah budou základní metody přibližného řešení těchto rovnic. Poté provedené úvahy zobecníme na systémy rovnic (na vektorovou diferenciální rovnici). V poslední části kapitoly ukážeme, jak odhadnout meze, ve kterých se bude řešení rovnice pohybovat. 2.1 Existence a jednoznačnost řešení skalární ODR Uvažujme počáteční úlohu pro obyčejnou diferenciální rovnici prvního řádu ve standardním tvaru x′ = f(t, x), x(t0) = ξ. (2.1) Na rovnost x′ (t) = f t, x(t) definující řešení příslušné diferenciální rovnice se můžeme prostě dívat jako na rovnost dvou funkcí jedné reálné proměnné t. Integrací v mezích od t0 do t dostaneme x(t) − x(t0) = t t0 f s, x(s) ds, neboli x(t) = ξ + t t0 f s, x(s) ds. (2.2) Naopak, derivováním poslední rovnosti podle proměnné t dostaneme x′(t) = f t, x(t) . Navíc, pro funkci definovanou pravou stranou rovnosti (2.2) platí x(t0) = ξ. Vidíme tedy, že počáteční úloha pro diferenciální rovnici (2.1) je ekvivalentní s integrální rovnicí (2.2). K řešení počáteční úlohy (2.1) se budeme snažit přiblížit třemi různými způsoby. Ukážeme, že v limitě jsou tato přiblížení (aproximace) rovna řešení dané úlohy, což znamená, že řešení existuje a navíc je výsledkem nějakého konkrétního limitního procesu. 2.1.1 Eulerovy polygony Řešení úlohy (2.1) se spojitou funkcí f budeme aproximovat funkcí po částech lineární a spojitou. Jinak řečeno, integrální křivku nahradíme lomenou čarou spojující body (t0, ξ), (t1, x1), (t2, x2), . . . . Podrobněji: Zvolíme časové okamžiky t1, t2, t3, . . . (body na ose t) tak, že t0 < t1 < t2 < t3 · · · . Dále položíme x0 = ξ a budeme předpokládat, že známe hodnoty x1, x2, x3, . . . , xk takové, že „dobře aproximují řešení úlohy v okamžicích t1, t2, t3, . . . , tj. x1 ≈ x(t1), x2 ≈ x(t2), . . . , xk ≈ x(tk). 2.1. EXISTENCE A JEDNOZNAČNOST ŘEŠENÍ SKALÁRNÍ ODR 31 Ze spojitosti funkce f plyne, že f t1, x(t1) ≈ f(t1, x1), f t2, x(t2) ≈ f(t2, x2), . . . , f tk, x(tk) ≈ f(tk, xk). Podle (2.2) pro hodnotu řešení x dané úlohy platí x(tk+1) = ξ + tk+1 t0 f s, x(s) ds. Integrál aproximujeme integrálním součtem1 a využijeme spojitost funkce f. Dostaneme ξ + tk+1 t0 f s, x(s) ds ≈ ξ + k i=0 (ti+1 − ti)f ti, x(ti) ≈ ξ + k i=0 (ti+1 − ti)f(ti, xi). Poslední výraz vezmeme jako aproximaci hodnoty řešení v bodě tk+1, tj. xk+1 = ξ + k i=0 (ti+1 − ti)f(ti, xi) ≈ x(tk+1). Z počáteční hodnoty x0 = ξ tímto způsobem postupně získáváme jednotlivé aproximace řešení x1 = x0 + (t1 − t0)f(t0, x0), x2 = x1 + (t2 − t1)f(t1, x1), x3 = x2 + (t3 − t2)f(t2, x2), . . . xk+1 = xk + (tk+1 − tk)f(tk, xk), . . . atd. Výsledek můžeme shrnout: Eulerův polygon příslušný k úloze (2.1) a dělení D = {t0, t1, t2, . . . , tn = t0 + a} je lomená čára, spojující body (t0, x0), (t1, x1),. . . , (tn, xn). Přitom hodnoty xi, i = 0, 1, 2, . . . , n jsou definovány rekurentně vztahy x0 = ξ, xk+1 = xk + (tk+1 − tk)f(tk, xk), k = 0, 1, 2, . . . , n − 1. Eulerův polygon je zkonstruován tak, že aproximuje graf řešení dané úlohy. Lze tedy očekávat, že se zjemňováním dělení intervalu J (tj. s růstem počtu dělících bodů n a se zmenšováním normy dělení ν(D) = max {|ti − ti−1| : i = 1, 2, . . . , n}) se bude Eulerův polygon „přibližovat ke grafu řešení úlohy (2.1), k integrální křivce rovnice. Provedená úvaha ještě nedokazuje, že posloupnost Eulerových polygonů pro ν(D) → 0 skutečně konverguje; a pokud konverguje k nějaké funkci, tak že tato funkce je řešením dané úlohy. Korektní důkaz – který samozřejmě existuje – je analogií konstrukce Riemannova in- tegrálu. Po provedení důkazu je jisté, že řešení dané úlohy existuje a navíc, že ho lze najít jako limitu posloupnosti Eulerových polygonů. Platí tedy: Tvrzení 1. Je-li funkce f : [t0, t0 + a] × R spojitá, pak má úloha (2.1) řešení definované na intervalu [t0, t0 + a]. 1 Přesněji řečeno, jedním z možných tvarů integrálního součtu. Ten uvedený odpovídá aproximaci integrálu pomocí obdélníkového pravidla. 32 KAPITOLA 2. OBECNÉ VLASTNOSTI DIFERENCIÁLNÍCH ROVNIC Zobecněním tohoto tvrzení je Peanova věta o existenci řešení počáteční úlohy, tj. Věta ??. Pokud chceme skutečně Eulerovým polygonem aproximovat řešení nějaké úlohy, je nutné zvolit konkrétní interval [t0, t0 + a] na kterém řešení hledáme, a zvolit konkrétní dělení {t0, t1, t2, . . . , tn = t0 + a} tohoto intervalu. Pro výpočet je nejjednodušší volit konstantní délku kroku h, tj. vzít dělení takové, že ti+1 − ti = h pro všechna i = 0, 1, 2, . . . , n − 1; takové dělení se nazývá ekvidistantní. Bývá ovšem účelné délku kroku měnit podle rychlosti změny hledané funkce, tedy podle velikosti absolutní hodnoty její derivace – s rostoucí hodnotou f(ti, xi) | zkracovat vzdálenost k následujícímu dělícímu bodu tk+1. Ukážeme jednu jednoduchou možnost, jak volit délku kroku „adaptivně , podle velikosti derivace hledané funkce v bodě tk (přesněji: podle derivace zprava Eulerova polygonu v bodě tk). Zvolíme konstantní délku δ strany Eulerova polygonu, tj. požadujeme, aby pro platilo (tk+1 − tk)2 + (xk+1 − xk)2 = δ2 . Poněvadž xk+1 = xk + (tk+1 − tk)f(tk, xk), můžeme z této podmínky vypočítat tk+1 = tk + δ 1 + f(tk, xk)2 . Příklad: Uvažujme počáteční úlohu x′ = 2t + x2 , x(0) = 0. (2.3) Zvolíme konstantní délku kroku h. Pak tk = kh a příslušné rekurentní vztahy jsou x0 = 0, xk+1 = xk + h(2tk + x2 k) = xk + hx2 k + 2kh2 . Při „adaptivní volbě dělících bodů dostaneme dvojici rekurentních vztahů: t0 = 0, x0 = 0, tk+1 = tk + δ 1 + 2tk + x2 k 2 , xk+1 = xk + (tk+1 − tk) 2tk + x2 k . Na obrázku 2.1 jsou zobrazeny Eulerovy polygony na intervalu [0, 1] s konstantní (h = 0,2) i s „adaptivní délkou kroku (δ = 0,2). 2.1.2 Picardova posloupnost Picardova posloupnost postupných aproximací řešení úlohy (2.1) je posloupnost funkcí definovaná rekurentně x0(t) = ξ, xk+1(t) = ξ + t t0 f s, xk(s) ds, k = 0, 1, 2, . . . . 2.1. EXISTENCE A JEDNOZNAČNOST ŘEŠENÍ SKALÁRNÍ ODR 33 0.0 0.2 0.4 0.6 0.8 1.0 0.00.40.81.2 t x Obrázek 2.1: Přibližné řešení počáteční úlohy (2.3) na intervalu [0, 1] pomocí Eulerových polygonů (lomené čáry s vyznačenými body zlomu) a Picardovy posloupnosti (hladká křivka): modrá – Eulerův polygon s ekvidistantním dělením intervalu, h = 0,2; zelená – Eulerův polygon s adaptivní délkou kroku, δ = 0.2; červená – čtvrtý člen Picardovy posloupnosti postupných aproximací x3. Budeme předpokládat, že funkce f je spojitá, a že Picardova posloupnost stejnoměrně konverguje k funkci x. Poněvadž interval [t0, t] je konečný (a tedy kompaktní), funkce f je spojitá stejnoměrně. Odtud plyne, že následující úpravy jsou korektní: x(t) = lim k→∞ xk(t) = lim k→∞ xk+1(t) = ξ + lim k→∞ t t0 f s, xk(s) ds = = ξ + t t0 f s, lim k→∞ xk(s) ds = ξ + t t0 f s, x(s) ds. Stejnoměrná limita Picardovy posloupnosti je tedy řešením integrální rovnice (2.2), takže je také řešením počáteční úlohy (2.1). Stačí tedy ukázat, že Picardova posloupnost konverguje stejnoměrně, případně najít podmínky, za jakých stejnoměrně konverguje. Stejnoměrnou konvergenci Picardovy posloupnosti zaručí Lipschitzova podmínka: Řekneme, že funkce f : J × D → R je Lipsichitzovská s konstantou L > 0 vzhledem k druhé proměnné, pokud pro všechna t ∈ J a všechna x, y ∈ D platí |f(t, x) − f(t, y)| ≤ |x − y|. Předpokládejme nyní, že funkce f v rovnici (2.1) je na množině [t0 −a, t0 +a]×R Lipschitzovská s konstantou L vzhledem k druhé proměnné. Zvolíme libovolné přirozené číslo p a kladné reálné číslo α takové, že α < max 1 2L , a . Pak platí αL < 1. (2.4) 34 KAPITOLA 2. OBECNÉ VLASTNOSTI DIFERENCIÁLNÍCH ROVNIC Pro libovolná k ∈ N, t ∈ [t0 − α, t0 + α] nyní platí 0 ≤ |xk(t) − xk+p(t)| = ξ + t t0 f s, xk−1(s) ds − ξ − t t0 f s, xk+p−1(s) ds = = t t0 f s, xk−1(s) − f s, xk+p−1(s) ds ≤ ≤ t t0 f s, xk−1(s) − f s, xk+p−1(s) ds ≤ ≤ L t t0 |xk−1(s) − xk+p−1(s)| ds ≤ L t0+α t0−α |xk−1(s) − xk+p−1(s)| ds ≤ ≤ 2Lα max {|xk−1(t) − xk+p−1(t)| : t0 − α ≤ t ≤ t0 + α} . Proto také 0 ≤ max {|xk(t) − xk+p(t)| : t0 ≤ t ≤ t0 + α} ≤ ≤ 2Lα max {|xk−1(t) − xk+p−1(t)| : t0 − α ≤ t ≤ t0 + α} . Analogicky dostaneme 0 ≤ max {|xk−1(t) − xk+p−1(t)| : t0 ≤ t ≤ t0 + α} ≤ ≤ 2Lα max {|xk−2(t) − xk+p−2(t)| : t0 − α ≤ t ≤ t0 + α} a tedy 0 ≤ max {|xk(t) − xk+p(t)| : t0 ≤ t ≤ t0 + α} ≤ ≤ (2Lα)2 max {|xk−2(t) − xk+p−2(t)| : t0 − α ≤ t ≤ t0 + α} . Po k analogických krocích krocích dostaneme odhad 0 ≤ max {|xk(t) − xk+p(t)| : t0 ≤ t ≤ t0 + α} ≤ ≤ (2Lα)k max {|x0(t) − xp(t)| : t0 − α ≤ t ≤ t0 + α} . Z nerovnosti (2.4) plyne, že limita výrazu na pravé straně je pro k → ∞ rovna nule. Odtud dále plyne, že Picardova posloupnost funkcí {xk} je na intervalu [t0 − α, t0 + α] stejnoměrně Cauchyovská a tedy stejnoměrně konvergentní. Ukázali jsme tak, že limita Picardovy posloupnosti je řešením počáteční úlohy (2.1) na intervalu [t0 − α, t0 + α]. Ještě ukážeme, že toto řešení je jediné. K tomu účelu připusťme, že existuje další řešení y = y(t) úlohy (2.1) definované na intervalu [t0−α, t0+α], které je různé od limity x Picardovy posloupnosti, tj. max {|x(t) − y(t)| : t0 − α ≤ t ≤ t0 + α} > 0. (2.5) 2.1. EXISTENCE A JEDNOZNAČNOST ŘEŠENÍ SKALÁRNÍ ODR 35 Poněvadž funkce x a y jsou také řešením integrální rovnice (2.2), platí pro každé t z intervalu [t0 − α, t0 + α] nerovnost |x(t) − y(t)| = ξ + t t0 f s, x(s) ds − ξ − t t0 f s, y(s) ds ≤ ≤ t t0 f s, x(s) − f s, y(s) ≤ L t t0 |x(s) − y(s)| ds ≤ ≤ 2Lα max {|x(t) − y(t)| : t0 − α ≤ t ≤ t0 + α} . Z platnosti této nerovnosti pro každé t ∈ [t0, t0 + α] dále plyne nerovnost max {|x(t) − y(t)| : t0 − α ≤ t ≤ t0 + α} ≤ 2Lα max {|x(t) − y(t)| : t0 − α ≤ t ≤ t0 + α} a vzhledem k (2.5) také 1 ≤ 2Lα, což je ve sporu s (2.4). Provedené úvahy můžeme shrnout: Tvrzení 2. Je-li funkce f Lipschitzovská vzhledek ke druhé proměnné, pak má počáteční úloha (2.1) jediné řešení definované na okolí bodu t0. Zobecněním tohoto tvrzení bude Picardova-Lindelöfova věta o existenci a jednoznačnosti řešení systému diferenciálních rovnic, tj. Věta ??. Poněvadž Picardova posloupnost {xk}∞ k=0 konverguje k řešení x počáteční úlohy (2.1), lze její člen s „dostatečně velkým indexem k považovat za přibližné řešení této úlohy. Při odvození konvergence Picardovy posloupnosti jsme také odhadli interval, na kterém tato posloupnost konverguje. Tento odhad čísla α (poloviny délky intervalu konvergence) závisí na neznámé velikosti Lipschitzovy konstanty L. Navíc se jedná o odhad „pesimistický nebo „konzervativní ; Picardova posloupnost obvykle konverguje na širším intervalu, nejen na [t0 − α, t0 + α]. Pokud má funkce f ohraničenou parciální derivaci podle druhé proměnné, pak lze za Lipschitzovu konstantu volit L = sup ∂f ∂x (t, x) : t ∈ J, x ∈ R . V takovém případě totiž podle Lagrangeovy věty o střední hodnotě existuje ϑ ∈ (0, 1), že |f(t, x) − f(t, y)| = ∂f ∂x t, x + ϑ(y − x) (x − y) ≤ L|x − y|. Příklad: Uvažujme znovu počáteční úlohu (2.3). Postupně budeme počítat členy Picardovy 36 KAPITOLA 2. OBECNÉ VLASTNOSTI DIFERENCIÁLNÍCH ROVNIC posloupnosti postupných aproximací: x1(t) = 0 + t 0 (2s + 02 )ds = t2 , x2(t) = 0 + t 0 2s + (s2 )2 ds = t2 + 1 5 t5, x3(t) = 0 + t 0 2s + s2 + 1 5s5 2 ds = t 0 2s + s4 + 2 5 s7 + 1 25s10 ds = = t2 + 1 5t5 + 1 20 t8 + 1 275 t11, x4(t) = 0 + t 0 2s + s2 + 1 5s5 + 1 20s8 + 1 275 s11 2 ds = = t 0 2s + s4 + 2 5 s7 + 7 50s10 + 3 110s13 + 87 22 000 s16 + 1 2 750 s19 + 1 75 625 s22 ds = = t2 + 1 5t5 + 1 20 t8 + 7 550 t11 + 3 1 540t14 + 87 374 000t17 + 1 55 000 t20 + 1 1 739 375t23, atd. 2.1.3 Frobeniova metoda Předpokládejme, že funkce f na pravé straně diferenciální rovnice v počáteční úloze (2.1) je analytická v okolí počátečního bodu (t0, ξ), tj. že na jistém okolí bodu (t0, ξ) lze funkci f vyjádřit konvergentní dvojnou mocninnou řadou se středem (t0, ξ), f(t, x) = ∞ n=0 ∞ m=0 bnm(t − t0)n (x − ξ)m . (2.6) V takovém případě můžeme očekávat, že i řešení úlohy (2.1) bude na nějakém okolí počátečního času t0 analytickou funkcí. Řešení úlohy (2.1) formálně zapíšeme jako mocninnou řadu x(t) = ∞ n=0 an(t − t0)n . (2.7) Pak je x(t0) = a0, takže a0 = ξ. (2.8) Formální mocninnou řadu (2.7) dosadíme do rovnice v (2.1): x′ (t) = ∞ n=0 nan(t − t0)n−1 = a1 + ∞ n=1 (n + 1)an+1(t − t0)n , 2.1. EXISTENCE A JEDNOZNAČNOST ŘEŠENÍ SKALÁRNÍ ODR 37 f t, x(t) = ∞ n=0 ∞ m=0 bnm(t − t0)n ∞ i=0 ai(t − t0)i − ξ m = = ∞ n=0 ∞ m=0 bnm(t − t0)n ∞ i=1 ai(t − t0)i m = = ∞ n=0  bn0(t − t0)n + ∞ m=1 bnm(t − t0)n ∞ i=m j1+···+jm=i aj1 · · · ajm (t − t0)i   = = ∞ n=0 bn0(t − t0)n + ∞ n=0 ∞ m=1 bnm(t − t0)n ∞ i=m j1+···+jm=i aj1 · · · ajm (t − t0)i = = ∞ n=0 bn0(t − t0)n + ∞ m=1 ∞ n=0 bnm(t − t0)n ∞ i=m j1+···+jm=i aj1 · · · ajm (t − t0)i = = ∞ n=0 bn0(t − t0)n + ∞ m=1 ∞ n=m n i=m bn−i,m j1+···+jm=i aj1 · · · ajm (t − t0)n = = ∞ n=0 bn0(t − t0)n + ∞ n=1 n m=1 n i=m bn−i,m j1+···+jm=i aj1 · · · ajm (t − t0)n = = b00 + ∞ n=1  bn0 + n m=1 n i=m bn−i,m j1+···+jm=i aj1 · · · ajm   (t − t0)n = = b00 + ∞ n=1  bn0 + n m=1 n−m k=0 bkm j1+···+jm=n−k aj1 · · · ajm   (t − t0)n . Porovnáním koeficientů u stejných mocnin výrazu t − t0 nyní dostaneme a1 = b00, (2.9) an+1 = 1 n + 1  bn0 + n m=1 n−m k=0 j1+···+jm=n−k aj1 · · · ajm bkm   , n = 1, 2, 3, . . . . (2.10) Vidíme, že koeficienty a1, a2, a3, . . . formální řady (2.7) lze pomocí tohoto rekurentního vztahu jednoznačně vypočítat. Pokud mocninná řada (2.7) získaná tímto způsobem konverguje na nějakém (symetrickém) okolí bodu t0, pak její součet je řešením počáteční úlohy (2.1). Výsledek opět shrneme: Tvrzení 3. Je-li pravá strana rovnice v (2.1) v okolí počátečního bodu (t0, ξ) analytickou funkcí tvaru (2.6) a poloměr konvergence mocninné řady (2.7), jejíž koeficienty jsou dány výrazy (2.8), (2.9) a (2.10), je nenulový, pak součet této řady je na oboru konvergence řešením počáteční úlohy (2.1). Ještě poznamenejme, že analytická funkce f má v bodě (t0, ξ) konečné všechny parciální derivace. Zejména má na každém uzavřeném okolí tohoto bodu ohraničenou parciální derivaci podle proměnné x. Z toho podle 2.1.2 plyne, že daná úloha má jediné řešení. Při hledání analytického řešení počáteční úlohy většinou dosadíme formální tvar řešení do rovnice a pak porovnáme koeficienty; není potřeba si pamatovat a používat formuli (2.10). 38 KAPITOLA 2. OBECNÉ VLASTNOSTI DIFERENCIÁLNÍCH ROVNIC Součet prvních k členů řady, vypočítaných tímto postupem, lze pro „dostatečně velké k považovat za přibližné řešení počáteční úlohy. Příklad: Uvažujme opět počáteční úlohu (2.3). Její řešení budeme hledat ve tvaru mocninné řady x(t) = ∞ n=0 antn . (2.11) Z počáteční podmínky plyne 0 = x(0) = a0, takže x′ (t) = ∞ n=1 nantn−1 = a1 + 2a2t + ∞ n=2 (n + 1)an+1tn , 2t + x(t)2 = 2t + ∞ n=1 antn 2 = 2t + ∞ n=2   n−1 j=1 ajan−j   tn . Porovnáním koeficientů dostaneme a1 = 0, a2 = 1, an+1 = 1 n + 1 n−1 j=1 ajan−j Z tohoto vyjádření úplnou indukcí snadno ukážeme, že všechny koeficienty an jsou nejvýše rovny 1. To znamená, že poloměr konvergence řady (2.11) je alespoň 1. Koeficienty řady můžeme postupně počítat: a0 = 0, a9 = 0, a18 = 0, a1 = 0, a10 = 0, a19 = 0, a2 = 1, a11 = 7 550 , a20 = 1 107 5 236 000 , a3 = 1 3 · 0 · 0 = 0, a12 = 0, a21 = 0, a4 = 1 4 (0 · 1 + 1 · 0) = 0, a13 = 0, a22 = 0, a5 = 1 5 (0 · 0 + 1 · 1 + 0 · 0) = 1 5 , a14 = 1 308 , a23 = 178 677 3 311 770 000, a6 = 1 6 (0 · 0 + 0 · 1 + 1 · 0 + 0 · 0) = 0, a15 = 0, a24 = 0, a7 = 1 7 (1 5 · 0 + 0 · 1 + 0 · 0 + 1 · 0 + 0 · 1 5) = 0, a16 = 0, a25 = 0, a8 = 1 8 (0 · 0 + 1 5 · 1 + 0 · 0 + 0 · 0 + 1 · 1 5 + 0 · 0) = 1 20 , a17 = 2 169 2 618 000 , a26 = 139 471 10 130 120 000 , atd. Porovnáním s výsledkem příkladu v 2.1.2 vidíme, že řada vyjadřující řešení počáteční úlohy se až do členu u sedmé mocniny nezávisle proměnné t shoduje s polynomem, který je čtvrtým členem Picardovy posloupnosti konvergující k řešení této úlohy. Kapitola 3 Lineární rovnice a systémy 39 40 KAPITOLA 3. LINEÁRNÍ ROVNICE A SYSTÉMY Kapitola 4 Autonomní rovnice a systémy 41 42 KAPITOLA 4. AUTONOMNÍ ROVNICE A SYSTÉMY Část II Aplikace 43 Kapitola 5 Makroekonomické modely 45