Drsná matematika Martin Panák, Jan Slovák a "autorský kolektiv" i Projekt netradiční základní učebnice matematiky pro studenty přírodních věd, informatiky, ekonomie apod., přibližující podstatnou část matematiky v rozsahu čtyř semestrálních přednášek. Text by měl být dokončen a vydán v roce 2013. Práce na učebnici jsou podpořeny projektem Univerzitní výuka matematiky v měnícím se světě (CZ.1.07/2.2.00/15.0203) INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ Contents Chapter 1. Rozcvička 5 1. Čísla a funkce 5 2. Kombinatorické veličiny 10 3. Diferenční rovnice 14 4. Pravděpodobnost 18 5. Geometrie v rovině 27 6. Relace a zobrazení 41 Chapter 2. Elementární lineární algebra 73 1. Vektory a matice 73 2. Determinanty 85 3. Vektorové prostory a lineární zobrazení 94 4. Vlastnosti lineárních zobrazení 113 Chapter 3. Linární modely a maticový počet 131 1. Lineární procesy 131 2. Diferenční rovnice 138 3. Iterované lineární procesy 146 4. Více maticového počtu 155 5. Rozklady matic a pseudoinverze 176 Chapter 4. Analytická geometrie 201 1. Afinní a euklideovská geometrie 201 2. Geometrie kvadratických forem 223 3. Projektivní geometrie 231 Chapter 5. Zřízení ZOO 247 1. Interpolace polynomy 247 2. Reálná čísla a limitní procesy 257 3. Derivace 278 4. Mocninné řady 291 Chapter 6. Diferenciální a integrální počet 337 1. Derivování 337 2. Integrování 355 3. Nekonečné řady 374 Chapter 7. Spojité modely 405 1. Fourierovy řady 405 2. Metrické prostory 419 3. Integrální operátory 437 4. Diskrétní transformace 445 iii Předmluva Příprava této učebnice byla motivována přednáškami pro informatické obory na Masarykově univerzitě, kde je celý program založen na precizním matematickém přístupu. Chtěli jsme proto rychle, ale zároveň pořádně, pokrýt zhruba tolik matematických metod, jako je obvyklé u větších kurzů v klasických technických oborech opřených o matematické metody. Zároveň jsme ale nechtěli rezignovat na úplný a matematicky korektní výklad. Chtěli jsme vedle sebe vyložit i obtížnější partie matematiky a spoustu elementárních i obtížnějších konkrétních příkladů, jak s uvedenými postupy ve skutečnosti pracovat. Nechtěli jsme přitom za čtenáře řešit, v jakém pořadí a kolik "teorie" či "praxe" pročítat. Z těchto podnětů vznikl dvousloupcový formát s oddělenými teoretickými úvahami a praktickými postupy, který kopíruje i skutečné rozdělení výkladu na přednáškách na "teoretické přednášky" a "demonstrovaná cvičení". Snažíme se tím vyjít vstříc jak čtenářům, kteří si napřed chtějí procvičit postupy při řešení úloh a teprve pak přemýšlet, proč a jak algoritmy fungují, tak těm druhým, kteří si napřed chtějí dělat jasno o tom proč a jak věci fungují a pak případně zkouší počítat příklady. Zároveň tím snad zbavujeme čtenáře stresu, že by měl přečíst úplně vše. Naopak, měl by mít radost z brouzdání textem a prožitku objevování vlastní cestičky. Text se přitom v obou svých částech snaží prezentovat standardní výklad matematiky s akcentem na smysl a obsah představovaných matematických metod. Řešené úlohy procvičují základní pojmy, ale zároveň se snažíme dávat co nej lepší příklady užití matematických modelů. Teoretický text je prezentován dosti kompaktním způsobem, mnoho prostoru je ponecháno pro dořešení podrobností čtenáři. Uváděné příklady se snaží pokrýt celou škálu složitosti, od banálních až po perličky ke skutečnému přemýšlení. Studenti navíc řešili a odevzdávali každý týden zadávané příklady. Čtenářům bychom rádi pomohli: • přesně formulovat definice základních pojmů a dokazovat jednoduchá matematická tvrzení, • vnímat obsah i přibližně formulovaných závislostí, vlastností a výhledů použití matematických nástrojů, • vstřebat návody na užívání matematických modelů a osvojit si jejich využití. K těmto ambiciózním cílům nelze dojít lehce a pro většinu lidí to znamená hledat si vlastní cestu s tápáním různými směry (s potřebným překonáváním odporu či nechutě). I proto je celý výklad strukturován tak, aby se pojmy a postupy vždy několikrát vracely s postupně rostoucí složitostí a šíří diskuse. Jsme si vědomi, že se tento postup může jevit jako chaotický. Domníváme se ale, že dává mnohem lepší šanci na pochopení u těch, kteří vytrvají. Vstup do matematiky je skoro pro každého obtížný — pokud už "víme", nechce se nám přemýšlet, pokud "nevíme", je to ještě horší. Jediný spolehlivý postup pro orientaci v matematice je hledat porozumnění v mnoha pokusech a to, pokud možno, při četbě v různých zdrojích. Určitě nepovažujeme tento text za dostatečný jediný zdroj pro každého. Doufáme, že může být dobrým začátkem a případně i dlouhodobým pomocníkem, zvláště pro ty, kdo se k jednotlivým částem budou znovu a znovu vracet. Pro ulehčení vícekolového přístupu ke čtení je text doprovázen emotivně laděnými ikonkami, které snad nejen oživí obvyklou strohou strukturu matematického textu, ale naznačí čtenáři, kde by složitější text měl být čten pozorněji, ale určitě ne přeskakován, případně kde by bylo možná lépe náročné pasáže přinejmenším napoprvé vůbec nečíst. Volba jednotlivých ikonek samozřejmě odráží hlavně pocity autorů. Přesto by postupně mohly být dobrým vodítkem pro čtenáře. Sloupec zaměřený na výklad teorie (užší sloupec) a sloupec 1 zaměřující se na příkadovou část jsou přitom značeny odlišnými sadami ikonek. Co se týče sloupce teorie používáme ikonky varující před pracností/složitostí/náročností, např. Další označují ne úplně pohodovou zdlouhavost práce a potřebu trpělivosti či nadhledu, jako jsou tyto A konečně máme také ikonky vyjadřující pohodu nebo radost ze hry, třeba následující Co se týče příkladového sloupce, tak používáme ikonky pro základní příklady, které by čtenář rozhodně měl být schopen zvládnout a pokračovat ve čtení až po jejich vyřešení, ikonky pro obtížnější příklady se zajímavým obratem, či praktickou aplikací, konečně ikonky značí velmi obtížný příklad, resp. poslední z nich indikuje, že při řešení příkladu je vhodné použít výpočetní software. Snažili jsme se sloupce s příklady sepsat tak, aby byly čitelné prakticky víceméně samostatně. Bez ambicí pohrát si s hlubšími důvody, proč uváděné postupy fungují (nebo s prostým cílem "projít s písemkou"), by mělo skoro stačit probírat se jen příklady. Definice pojmů či popisy jejich vlastností používaných při řešení příkladů jsou v teoretickém sloupci zpravidla vyznačeny, aby o ně bylo možno snadno pohledem zavadit. Souvislost řešených příkladů s paralelně studovanou teorií je přitom spíše volná, snažili jsme ale ulehčit přeskakování "z teorie do praxe a zpět" co nejvíce. Obsahově je celá učebnice ovlivněna představou, že pro praktické využití jsou velmi podstatné metody tzv. diskrétní matematiky, zatímco tzv. spojité modely jsou matematicky dobře uchopitelná přiblížení veskrze diskrétního světa kolem nás. Počítat koneckonců stejně umíme vždy jen s konečně mnoha racionálními čísly naráz. Bez spojité matematiky si lze ale těžko dobře představit koncepty jako konvergence procesu k limitnímu stavu nebo robustnost výpočtu. Bylo by bez ní také obtížné pracovat s odhady chyb při numerických procesech. Všechna témata a velmi podstatnou část textu jsme v létech 2005 - 2012 ověřovali při výuce studentů informatiky a později i matematiky na Masarykově univerzitě. Paralelně jsme přitom vytvořili také podklady pro praktické semináře matematického modelování a numerických metod. V nich se studenti věnují skutečnému využití výpočtových nástrojů a modelů. Závěrem stručně shrneme obsah celé učebnice. Samozřejmě předpokládáme, že si každý čtenář, případně přednášející, vybere témata a jejich pořadí. Pokusíme se proto zároveň vymezit bloky, se kterými lze takto nezávisle zacházet. 2 Úvodní motivační kapitola se snaží ilustrovat několik přístupů k matematickému popisu problému. Začínáme nejjednoduššími funkcemi (základní kombinatorické vzorce). Pak naznačujeme, jak pracovat se závislostmi zadanými pomocí okamžitých změn (jednoduché diferenční rovnice), užití kombinatoriky a množinové algebry diskutujeme prostřednictvím konečné klasické pravdepodobnosti. Předvádíme maticový počet pro jednoduché úlohy rovinné geometrie (práce s pojmem pozice a transformace) a závěrem vše trochu zformalizujeme {relace, uspořádní, ekvivalence). Nenechte se zde uvrhnout do chaotického zmatku rychlým střídáním témat — cílem je nashromáždit něco málo netriviálních námětů k přemýšlení a hledání jejich souvislostí i použití, ještě než zabředneme do úrovně problémů a teorií složitějších. Ke všem tématům této úvodní kapitoly se časem vrátíme. Další dvě kapitoly jsou věnovány základům počtu, který umožňuje práci s vícerozměrnými daty i grafikou. Jde o postupy tzv. lineární algebry, které jsou základem a konečným výpočetním nástrojem pro většinu matematických modelů. Nejprve probíráme jednoduché postupy pro práci s vektory a maticemi, třetí kapitola je pak věnována aplikacím maticového počtu v různých lineárních modelech (systémy lineárních rovnic, lineární procesy, lineární diferenční rovnice, Markovovy procesy, lineární regrese). Čtvrtá kapitola pak ilustruje použití maticového počtu v geometrických úlohách. Dozvíme se něco málo o afinní, euklidovské a projektivní geometrii. V tomto okamžiku přerušíme diskusi diskrétních modelů a přejdeme ke spojitým. Chceme co nejnázorněji ukázat, že základní ideje, jak s funkcemi pracovat, bývají jednoduché. Stručně řečeno, velmi jednoduché úvahy spojené s popisem okamžitých změn sledovaných veličin umožňují dělat závěry pro jejich celkové chování. Složitosti se pojí skoro výhradně se zvládnutím rozumně velké třídy funkcí, pro které mají naše postupy být použitelné. Začínáme proto kapitolou, kde diskutujeme jaké funkce potřebujeme pro nelineární modely. Po polynomech a splajnech postupně diskutujeme pojmy spojitosti, limity posloupností a funkcí a derivace funkcí, připomeneme všechny základní elementární funkce a závěrem se seznámíme s mocninnými řadami. Tím je připravena půda pro klasický diferenciální a integrální počet. Ten prezentujeme v kapitole šesté s důrazem na co nejpřímočařejší pochopení souvislostí limitních procesů, integračních procesů a aproximací. Sedmá kapitola se věnuje náznakům aplikací a snaží se co nejvíce připomínat analogie k postupům jednoduché lineární algebry. Místo lineárních zobrazení mezi konečně rozměrnými vektorovými prostory tak pracujeme s lineárními operacemi mezi vektorovými prostory funkcí, definovanými buď integrálními nebo diferenciálními operátory. Zatímco diskusi diferenciální rovnic necháváme na později, zde studujeme nejprve aproximace funkcí s pomocí vzdálenosti definované integrálem (tzv. Fourierovy řady). Pak se věnujeme souvislostem s některými integrálními operátory (např. konvoluce) a integrálními transformacemi (zejména Fourirerova transformace). Po cestě si neodpustíme ilustraci obecného principu, že spojité modely jsou zpravidla ideovým podkladem a zároveň dobrou aproximací pro modely diskrétní. Poslouží nám k tomu stručné nahlédnutí na problematiky tzv. waveletů a diskrétní Fourierovy transformace. V osmé kapitole pokračujeme v našem stručném nastínění analytických spojitých metod, tentokrát pro modely s mnoha proměnnými. Nejprve rozšime základní postupy a výsledky týkající se derivací na funkce více proměnných, včetně funkcí zadaných implicitně a tzv. vázaných extrémů. Hned poté rozšíříme teorii integrování o tzv. násobné integrály. Poté se věnujeme stručně modelům opřeným o známou změnu našich objektů, tj. diferenciálním rovnicím a malinko naznačíme obdobné problémy variační. Závěrem této kapitoly se pak stručně věnujeme numerickým přiblížením a odhadům. Devátá kapitola je věnována popisné statistice, matematické pravděpododobnosti a matematické statistice. Seznámíme se s pojmy pravděpodobnostní prostor, hustota pravděpodobnosti, normální rozdělení, střední hodnota, medián, kvantil, rozptyl, příklady diskrétních a spojitých rozdělení a budeme se náznakem věnovat statistickému zpracování dat, tj. výběrovým statistikým a jejich spolehlivosti. V další kapitole zamíříme zpět do světa diskrétních metod. Zabýváme se v ní základními pojmy a poznatky teorie grafů a jejich využitím v praktických problémech (např. prohledávání do šířky a hloubky, minimální pokrývající kostry, toky v sítích, hry popisované stromy). Závěrem se budeme zajímat o vytvořující funkce. 3 Poslední kapitola se zabýva nejprve obecnými algebraickými strukturami s důrazem na elementárni poznatky z teorie grup. okruhu polynomů. Zmíníme i něco málo aplikací v kódování. Dále se věnujeme úvodu do teorie čísel a vybrané aplikace, včetně šifrování informace. Pořádné poděkování všem zúčastněným, kteří nebudou přímo v autorském kolektivu, studentům apod. ??.??. 2013, kolektiv autorů 4 CHAPTER 1 Rozcvička "hodnota, změna, poloha" — co to je a jak to uchopit? Cílem první kapitoly je uvést čtenáře do fascinujícího světa matematického myšlení. Vybíráme si k tomu co ne-jkonkrétnější příklady modelování reálných situací pomocí abstraktních objektů a souvislostí. Zároveň projdeme několik témat a postupů, ke kterým se postupně budeme vracet a v závěru kapitoly se budeme chvíli věnovat samotnému jazyku matematiky (se kterým budeme jinak zacházet spíše intuitivně). O co jednodušší jsou východiska a objekty, se kterými zde budeme pracovat, o to složitější je pochopit do důsledku jemnosti použitých nástrojů a postupů. Většinou je možné proniknout k podstatě věcí teprve v jejich souvislostech. Proto je také představujeme hned z několika pohledů zároveň. Přecházení od tématu k tématu se možná bude zdát jako zmatečné, ale to se jistě postupně spraví při našich návratech k jednotlivým úvahám a pojmům v pozdějších kapitolách. Název kapitoly lze chápat i jako nabádání k trpělivosti. I nejjednodušší úlohy a úvahy budou snadné jen pro ty, kteří už podobné řešili. K postupnému poznání a ovládnutí matematického myšlení vede jen pozvolná a spletitá cesta. Začneme s tím nejjednodušším: obyčejnými čísly. A. Čísla a funkce S přirozenými, celými, racionálními a reálnými čísly již počítat umíme. Zamyslíme se, proč racionální čísla nestačí (byť v počítači s jinými doopravdy počítat neumíme) a připomeneme si tzv. čísla komplexní (protože ani s reálnými čísly si při výpočtech nevystačíme). 1. Čísla a funkce Lidé odjakživa chtějí mít jasno "kolik" něčeho je, případně "za kolik" to je, "jak dlouho" ^'^W^^^s n^co trv^ aP°d- Výsledkem takových ' mĚlf' - uvan Je většinou nějaké "číslo". Za číslo ^^^^W přitom považujeme něco, co umíme sčítat a násobit a splňuje to obvyklé zákonitosti, ať už všechny nebo jen některé. Například výsledek sčítání nezávisí na pořadí, v jakém čísla sčítáme, máme k dispozici číslo nula, které přičtením výsledek nezmění, číslo jedna, kterým můžeme násobit, aniž bychom změnili výsledek, apod. Nejjednodušším příkladem jsou tzv. čísla přirozená, budeme je značit N = {0, 1, 2, 3, ...}. Všimněme si, že jsme mezi přirozená čísla vzali i nulu, jak je obvyklé zvláště v informatice. Počítat "jedna, dvě, tři, ..." se učí děti už ve školce. O něco později se setkáváme s čísly celými Z = {..., —2, — 1, 0, 1, 2, ...} a nakonec si zvykneme na 1.1. Najděte nějaké reálné číslo, které není racionální. Solution. Jedna z mnoha možných odpovědí je *J2. Již staří Řekové věděli, že předepíšeme-li plochu čtverce a1 = 2, pak nelze najít racionální a, které by předpisu vyhovovalo. Proč? Víme, že každé přirozené číslo n lze jednoznačným způsobem vyjádřit jako součin n = p^ ■ pr^ ... prkk, až na pořadí v součinu, kde p\, ..., Pk jsou po dvou různá prvočísla. Pokud by tedy platilo (p/q)2 = 2 pro přirozená čísla p a q, pak tedy p1 = 2q2. Na levé straně máme v rozkladu na prvočísla 2r se sudým r (případně r = 0), na pravé straně ale bude vždy mocnina dvojky lichá. To je spor s naším tvrzením a tedy předpoklad nemůže platit a žádné racionální číslo nemůže mít za svoji druhou mocninu dvojku. □ 5 A. ČÍSLA A FUNKCE 1. ČÍSLA A FUNKCE 1.2. Remark. Lze dokonce dokázat, že odmocnina přirozeného stupně z přirozeného čísla je buď přirozená, nebo není racionální (viz IIO-II 1.3. Najděte řešení rovnice x2 = b pro libovolné reálné číslo b. Solution. Víme, že tato rovnice má vždy řešení x v oboru reálných čísel, pokud je b nezáporné. Jestliže je b = — 1, pak ale zjevně takové reálné x existovat nemůže. Musíme proto najít větší obor čísel, ve kterém už řešení existovat bude. K reálným číslům nejprve přidáme nové číslo i, tzv. imaginární jednotku a zkusíme dodefinovat sčítání a násobení tak, abychom i nadále zajistili obvyklé chování čísel, jak je shrnuto v odstavci 1.1. Jistě musíme umět nové číslo i násobit reálnými čísly a výsledky sčítat s jakýmikoliv reálnými čísly. Nutně proto musíme v novém číselném oboru komplexních čísel C pracovat s formálními výrazy z = a + i b. Aby byly splněny vlatnosti asociativity a distributivity, zavedeme sčítání tak, že se nezávisle sčítají reálné složky a imaginární složky. Stejně tak chceme násobení tak, jak by se násobily dvojčleny reálných čísel s jediným dodatečným pravidlem i2 = — 1, tj. (a + i b) + (c + i d) = {a + c) + i (b + d), (a + i b) ■ (c + i d) = (ac — bd) + i (bc + ad). □ Reálnému číslu a říkáme reálná složka komplexního čila z, reálnému číslu b pak imaginární složka komplexního čísla z, píšeme re(z) = a, im(z) = b. 1.4. Ověřte, že skutečně platí všechny vlastnosti (KG1-4), (01-4) a (P) skalárů z 1.1. Solution. Nulou je číslo O + z O, jedničkou číslo 1 + i O, obě tato čísla pro jednoduchost opět píšeme jako O a 1. Všechny vlastnosti se ověří přímočarým výpočtem. □ Komplexní číslo je dáno dvojicí reálných čísel, jde tedy o bod v reálné rovině M2. 1.5. Ukažte, že vzdálenost komplexního čísla z = a +i b od počátku (značíme ji \z\) je dána výrazem zž, kde ž komplexně sdružené číslo a — i b. Solution. Součin zž = (a2 + b2) + i (-ab + ba) = a2 + b2 je vždy reálné číslo a dává nám skutečně kvadrát vzdálenosti čísla z od počátku 0. Platí tedy \z\2 = zž- □ desetinná čísla a víme, co znamená 1.19-násobek ceny díky 19% dani z přidané hodnoty. 1.1. Vlastnosti čísel. Abychom mohli s čísly pracovat opravdu, musíme se jejich definici a vlastnostem věnovat pořádněji. V matematice se těm základním tvrzením o vlastnostech objektů, jejichž platnost předpokládáme, aniž bychom se zabývali jejich dokazovaním, říká axiomy. Vhodná volba axiomů předurčuje jak dosah z nich vycházející teorie, tak její použitelnost v matematických modelech skutečnosti. Uveďme si teď základní vlastnosti operací sčítání a násobení pro naše počty s čísly, která píšeme jako písmena a, b, c, .... Obě tyto operace fungují tak, že vezmeme dvě čísla a, b a. aplikací sčítání nebo násobení dostaneme výsledné hodnoty a + b a a ■ b. _ j Vlastnosti skalárů Vlastnosti sčítání: (KG1) (a + b) + c = a + (b + c), pro všechna a, b, c (KG2) a + b = b + a, pro všechna a, b (KG3) existuje 0 taková, že pro všechna a platí a + 0 = a (KG4) pro všechna a existuje b takové, že a + b = 0 Vlastnostem (KG1) - (KG4) říkáme vlastnosti komutativní grupy. Jsou to po řadě asociativita, komutativita, existence neutrálního prvku (říkáme u sčítání také nulového prvku), existence inverzního prvku (říkáme u sčítání také opačného prvku k a a značíme ho —a). Vlastnosti násobení: (01) (a ■ b) ■ c = a ■ (b ■ c), pro všechny a, b, c (02) a ■ b = b ■ a, pro všechny a, b (03) existuje prvek 1 takový, že pro všechny a platí 1 • a = a (04) a ■ (b + c) = a ■ b + a ■ c, pro všechny a, b, c. Vlastnosti (01)-(04) se postupně nazývají asociativita, komutativita, existence jednotkového prvku a distributivita sčítání vůči násobení. Množiny s operacemi +, • a vlastnostmi (KG1)-(KG4), (01)-(04) se nazývají komutativní okruhy. Další vlastnosti násobení: (P) pro každé a ^ O existuje b takové, že a ■ b = 1. (01) je-li a ■ b = O, potom buď a = O nebo b = 0. Vlastnost (P) se nazývá existence inverzního prvku vzhledem k násobení (tento prvek se pak značí a-1) a vlastnost (01) říká, že neexistují "dělitelé nuly". 6 CHAPTER 1. ROZCVIČKA Vlastnosti těchto operací sčítání a násobení budeme soustavně využívat, aniž bychom museli přesně vědět, s jakými objekty skutečně pracujeme. Tak se dostaneme k obecným matematickým i— nástrojům, je však vždy dobré mít představu o typických příkladech. Celá čísla Z jsou dobrým příkladem komutativní grupy, přirozená čísla nikoliv, protože nesplňují (KG4) (a případně neobsahují neutrální prvek, pokud někdo nulu do N nezahrnuje). Když komutativní okruh navíc splňuje i vlastnost (P), hovoříme o poli (často také o komutativním tělese). Poslední uvedená vlastnost (Ol) je automaticky splněna, pokud platí (P). Opačně to ovšem neplatí a tak říkáme, že vlastnost (Ol) je slabší než (P). Např. okruh celých čísel Z nesplňuje (P), ale splňuje (Ol). Hovoříme v takovém případě o oboru integrity. Všimněme si, že množina všech nenulových prvků v poli společně s operací násobení splňuje (Ol), (02), (03), (P), a je proto také komutativní grupa. Jen se místo sčítání mluví o násobení. Jako příklad můžeme vzít všechna nenulová reálná čísla. Prvky nějaké množiny s operacemi + a • splňujícími (ne nutně všechny) výše uvedené vlastnosti (tj. komutativní okruh, obor integrity, pole) budeme nazývat skaláry. Budeme pro ně vesměs užívat malá latinská písmena ze začátku nebo konce abecedy. Všechny vlastnosti (KG1)-(KG4), (01)-(04), (P), (01) z našich úvah je třeba brát jako axiomatickou definici příslušných matematických pojmů. Pro naše potřeby bude stačit si průběžně uvědomovat, že při dalších diskusích budeme důsledně používat pouze tyto vlastnosti skalárů a že i naše výsledky proto budou platné pro všechny objekty s těmito vlastnostmi. V tomto je pravá síla matematických teorií - nejsou platné jen pro konkrétní řešený příklad. Naopak, při rozumné výstavbě mají vždy univerzální použití. Budeme se snažit tento aspekt zdůrazňovat, přestože naše ambice mohou být v rámci daného rozsahu učebnice jen velice skromné. 1.2. Existence skalárů. K tomu, aby ale skutečně bylo možné budovat matematickou teorii, je třeba ověřit, že takové objekty mohou existovat. Pro pořádek si proto budeme postupně ukazovat, jak je možné zkonstruovat základní číselné obory. Pro konstrukci přirozených čísel začneme s předpokladem, že víme, co jsou to množiny. Prázdnou množinu si označíme 0 a definujeme (1.1) neboli O:=0, 1 O := 0, n + í:=nU{n} \, 2 := {O, 1}, ...,n + 1 := {O, 1, ...,n] 1.6. Remark. Vzdálenost \z\ nazýváme též absolutní hodnotou komplexního čísla z. 1.7. Goniometrický tvar komplexního čísla. Nejprve uvažme komplexní čísla tvaru z = cos

/l3 ľcos I arccos | —= ) ) + i sin | arcsin | —= ) ) L V VVTš// V VVTš//. Převod komplexního čísla z goniometrického do algebraického je ještě jednodušší: z,2 (cos(|)+/sin(|))=3^ + /.^ 3 373 - + i--. 2 2 □ 7 A. ČÍSLA A FUNKCE 1. ČÍSLA A FUNKCE 1.10. Vyjádřete z = cos 0 + cos j + i sin j v goniometrickém tvaru. Solution. Pro vyjádření čísla z v goniometrickém tvaru, potřebujeme zjistit jeho absolutní hodnotu a argument. Nejprve určeme absolutní hodnotu: |z| = ^(cosO + cosff + sin2! = ^{l + \)2+ (ý)2 = 73. Nyní pro argument cp platí: cos cp tedy cp = jt/6. Celkem jsme tak získali z re (z) lži V3 V3 im (z) V3 (cos f + i sin f) □ 1.11. Pomocí Moivreovy věty vypočítejte cos |- + i sin |-j .31 Solution. Ihned dostáváme (cos I + / sin |J .31 cos ^ + i sin ^ 6 6 2 cos ^ + i sin ^ 6 6 2' □ 1.12. Zjednodušte ±±i. Solution. Zjednodušením rozumíme zejména odstranění komplexních čísel ze jmenovatele zlomku. Zlomek proto rozšíříme komplexně sdruženým výrazem ke jmenovateli (tím dostaneme ve jmenovateli reálné číslo): l+i _ (1+0(2-0 _ 3+1 2+i (2+0(2-0 5 • Tímto zápisem říkáme, že pokud už máme definovaná všechna čísla 0, 1, 2, ... n, pak číslo n + 1 definujeme jako množinu všech předchozích čísel. Přirozená čísla takto ztotožňujeme s počty prvků konkrétních množin. Číslo n je množina, která má n prvků a dvě přirozená čísla a, b jsou stejná, právě když příslušné množiny mají stejně prvků. V teorii množin se místo slovního spojení "počet prvků množiny" používá pojem "mohutnost množiny". Tento pojem má smysl (narozdíl od toho předchozího) i pro nekonečné množiny. Na první pohled je také vidět obvyklá definice uspořádání přirozených čísel podle velikosti (o číslu a řekneme, že je ostře menší než b tehdy a jen tehdy, když a b a. a c b jako množina). Dalším formálním krokem by měla být definice sčítání a násobení a důkaz všech základních vlastnostní přirozených čísel, včetně výše uvedených axiomů komutativního okruhu. Snadno lze např. ukázat, že každá podmnožina v N má nejmenší prvek a spoustu dalších vlastností o kterých zpravidla už dávno nepřemýšlíme a máme je za samozřejmé. Nebudeme se tu konstrukcí číselných oborů zabývat podrobně a předpokládáme, že čtenář čísla racionální (Q), reálná (M) a komplexní (C) důvěrně zná. Občas budeme jen připomínat teoretické i praktické souvislosti při dalším výkladu. Podrobně bude konstrukce racionálních čísel z přirozených diskutována v 1.40. Konstrukci reálných čísel bude vhodné zmínit při studiu limitních procesů později a již dříve budeme z různých algebraických pohledů zkoumat čísla komplexní. Obrázek naznačuje, jak je možné vnímat číselné obory jako vnořené jeden do druhého (tj. komplexní rovina obsahuje mnohokrát vložená přirozená nebo celá čísla, reálnou přímku atd.). Navíc, jak je v matematice obvyklé, budeme místo s čísly manipulovat s písmeny abecedy, případně jinými znaky, ať už jejich hodnota je nebo není předem známá. □ Další příklady pro osvojení základních vlastností komplexních čísel viz || 1.1121| 1.13. Komplexní čísla nejsou pouze nástrojem, abychom získali "divná" řešení kvadratických rovnic, ale jsou potřeba i k tomu, abychom určili reálná řešení kubických rovnic. Jak vyjádřit řešení kubické rovnice x3 + ax2 + bx + c = 0 pomocí reálných koeficientů a, b, cl Ukažme si metodu, na kterou přišli v šestnáctém století pánové Ferro, Cardano, Tartaglia a možná další. Zaveďme substituci x := t — a/3 (abychom odstranili kvadratický člen v rovnici), dostaneme rovnici: ř3 + pt + q = 0, 1.3. Skalární funkce. Často pracujeme s číselnou hodnotou, která není dána jako konkrétní číslo. Místo toho něco víme o závislosti naší hodnoty na hodnotách jiných. Formálně píšeme, že hodnota y = f (x) naší "závislé" proměnné veličiny y je dána "nezávislou" veličinou x. Přitom můžeme znalost / brát formálně (prostě je to nějaká, blíže nespecifikovaná, závislost) nebo operačně, tj. f (x) je dáno vzorcem poskládaným z (prozatím si představme konečně mnoha) známých operací. Pokud je hodnotou skalár, hovoříme o skalární funkci. Každá funkce je definována na nějaké množině, mluvíme o definičním oboru funkce, a množina všech hodnot je pak tzv. obor hodnot funkce. Také mohou být ale hodnoty funkce / dány pouze přibližně nebo s jistou pravděpodobností. Smyslem matematických úvah pak bývá z neformálního popisu závislostí najít explicitní vzorce pro funkce, které je 8 CHAPTER 1. ROZCVIČKA popisují, nebo aspoň explicitní vyjádření pro konkrétní hodnoty závislých proměnných, případně jejich přiblížení. Podle typu úlohy a cíle pracujeme: • s přesným a konečným výrazem • s nekonečným výrazem • s přiblížením neznámé funkce známým odhadem (většinou s vyčíslenou možnou chybou) • s odhadem hodnot s vyčíslením jejich pravděpodobnosti apod. Skalární funkcí je např. roční mzda pracovníka nějaké firmy (hodnoty nezávislé veličiny, tj. definiční obor funkce, jsou jednotliví pracovníci x z množiny všech sledovaných pracovníků, f(x) je jejich roční mzda za dané období). Stejně tak můžeme sledovat měsíční mzdu konkrétního pracovníka v čase (nezávislou hodnotou je čas v měsících, závislou příjem v jednom každém měsíci). Jiným příkladem je třeba plocha obrazce v rovině, objem tělesa v prostoru, rychlost konkrétního auta v čase atd. Dovedeme si jistě představit, že ve všech uvedených případech může být hodnota dána nějakou volně popsanou souvislostí nebo naměřena přibližně nebo odhadnuta atd. 1.4. Operačně definované funkce. Funkce můžeme mít dány výčtem jejich hodnot - např. ve firmě je jen konečně mnoho zaměstnanců a umíme sestavit tabulku s jejich aktuálními měsíčními platy. Častěji ale máme místo hodnot pravidla, jak k hodnotám dojít. KBBaa^MMHVHBHJ Funkce faktoriál J Důležitou skalární funkcí na přirozených číslech je faktoriál, který definujeme vztahy pro n = 1,2, mená /(0) = 1, f(n)=n-f(n-l) .. Píšeme f (ji) = n \ a definice zjevně zna- ní n-(n- !)•••!. Naše definice funkce faktoriál říká, jak se změní hodnota f (n), když změníme hodnotu n o jedničku. Vzorec pro n\ již explicitně říká, kolik to je doopravdy. V tomto případě to není příliš efektivní vzorec, protože se jeho složitost zvětšuje s rostoucím n, lepší ale těžko hledat. Podívejme se ještě na obyčejné sčítání přirozených čísel jako na operačně definovanou skalární funkci. Definičním oborem je množina všech dvojic (a, b) přirozených čísel. Definujeme a +b jako výsledek procedury, ve které k a několikrát po sobě přičítáme 1. Tak jsme vlastně obecně a + 1 definovali v rovnicích (1.1). Při každém přičtení odebereme z b největší prvek a postupujeme tak, dokud není b prázdná (tj. b se postupně zmenšuje o jedničku a v každém kroku nám říká, kolik ještě zbývá přičíst). Je evidentní, že takto definované sčítání sice je dáno (iterativním) vzorcem, postup ale není vhodný pro praktické kde p = b — a2/3 a q = c + (2a3 — 9ab)/27. Nyní zaveďme neznámé u, v splňující podmínky u + v = t & 3uv + p = Q. Dosazením první podmínky do původní rovnice dostáváme u3 + v3 + (3uv + p)(u + v) + q = 0, dosazením druhé pak u6 + qu3 - — = 0, H 27 což je kvadratická rovnice v neznámé s = u3. Máme tedy u = Lq-±Jq- + p-, V 2 V 4 27 Celkem pak zpětným dosazením x = —p/3u + u — a/3. Ve výrazu pro u je se vyskytuje třetí odmocnina a abychom dostali všechna tři řešení, je nutno pracovat i s komplexními odmocninami. Rovnice x3 = a, a ^ 0, s neznámou x má totiž právě tři řešení v oboru komplexních čísel (Základní věta algebry, viz (||??||)). Všechna tato řešení nazýváme třetí odmocninou z čísla a. Je tedy výraz ^fä v komplexním oboru troj značný. Pokud se chce přisoudit výrazu ^fä jednoznačný význam, tak se za třetí odmocninu uvažuje řešení s nej-menším argumentem. Navíc ještě dodejme, že při popsaném postupu se mohlo vyskytnout dělení nulou. V tom případě je nutno použít jiného (většinou snadnějšího) postupu. 1.14. Řešte rovnici x3 + x2 2x - 1 = 0. Solution. Jak snadno zjistíme, tak rovnice nemá racionální kořeny (metody na určování racionálních kořenů si objasníme v části (|| ?? ||)). Dosazením do získaných vztahů získáme p = b — a2/3 = —7/3, q = —7/27, pro u pak dostáváme ^28 ± 12^147 u = -, 6 kde můžeme teoreticky volit až šest možností pro u (dvě volby znaménka plus či mínus a k tomu tři nezávislé volby třetí odmocniny). Jak však snadno nahlédneme, dostáváme pro x pouze tři různé hodnoty. Dosazením do (|| 1.13||) pak jeden z kořenů má tvar 14 3(28 - 84/V3) ^28 - 84/V3 1 +-----= 1,247, 6 3 9 B. KOMBINATORIKA 2. KOMBINATORICKÉ VELIČINY obdobně pro ostatní dva kořeny (přibližně —0, 445 a —1, 802). Jak jsme předeslali, vidíme, že i když se ve vzorcích pro kořeny vyskytují komplexní čísla, tak výsledek je reálný. □ 6. Kombinatorika V této kapitole si budeme hrát s přirozenými čísly, která budou popisovat různé nedělitelné předměty nacházející se v našem životním prostoru a budeme se zabývat tím, jak spočítat počet jejich uspořádání, přeuspořádání, výběrů a tak podobně. Ve velké většině takovýchto problémů lze vystačit se "selským rozumem". Stačí vhodně používat pravidel součtu a součinu, která si ukážeme na následujících příkladech: 1.15. Maminka chce Jeníkovi a Mařence rozdělit pět hrušek a šest jablek. Kolika způsoby to může udělat? (Hrušky mezi sebou považujeme za nerozlišitelné, stejně tak jablka. Připouštíme, že některé z dětí nic nedostane.) Solution. Pět hrušek samostatně může maminka rozdělit šesti způsoby. (Rozdělení je určeno tím, kolik hrušek dá Jeníkovi, zbytek připadne Mařence.) Šest jablek pak nezávisle sedmi způsoby. Podle pravidla součinu pak obě ovoce současně může rozdělit 6 • 7 = 42 způsoby. □ 1.16. Určete počet čtyřciferných čísel, která začínají cifrou 1 a nekončí cifrou 2, nebo končí cifrou 2 a nezačínají cifrou 1. Solution. Množina uvažovaných čísel je složená ze dvou disjunktních množin, totiž čísel, která začínají cifrou 1 a nekončí cifrou 2 (první množina) a čísel, která nezačínají cifrou 1 a končí cifrou 2. Celkový počet popsaných čísel dostaneme podle pravidla součtu tak, že sečteme počty čísel v těchto dvou množinách. V první z těchto množin máme čísla tvaru "1XXY", kde X je libovolná cifra a F je libovolná číslice mimo dvojky. Můžeme tedy provést deset voleb druhé cifry, nezávisle na tom můžeme provést deset voleb třetí cifry a opět nezávisle devět voleb poslední cifry. Tyto tři nezávislé volby jednoznačně určují dané číslo a podle pravidla součinu máme tedy 10 • 10-9 = 900 takových čísel. Obdobně ve druhé skupině máme 8 • 10 • 10 = 800 čísel (na první cifru máme pouze osm možností, neboť číslo nemůže začínat nulou a jedničku máme zakázánu). Celkem podle pravidla součtu je 900 + 800 = 1700 uvažovaných čísel. □ 1.17. Určete počet způsobů, jak lze na šachovnici (8x8 polí) postavit bílou a černou věž tak, aby se neohrožovaly (nebyly ve stejném řádku ani sloupci). počítání. Tak tomu bude v našem výkladu často - teoreticky korektní definice pojmu či operace neznamená, že úkony s nimi spojené jsou efektivně vykonavatelné. Právě k tomu budeme postupně rozvíjet celé teorie, abychom praktické nástroje získávali. Co se týče přirozených čísel, od školky je umíme sčítat zpaměti a rychle (pokud jsou malá), pro větší známe ze základní školy algoritmus písemného sčítání a s velkými si poradí počítače (pokud nejsou příliš velká). 2. Kombinatorické veličiny Typickým "kombinatorickým" problémem je napočítat, kolika různými způsoby se může něco stát. Např. kolika způsoby lze vybrat v samoobsluze dva různé sendviče z dané nabídky? Myslíme si přitom, že jsou všechny sendviče v regálu po dvou různé nebo rozlišujeme jen různé typy sendvičů? Připouštíme pak, že si také můžeme vzít dva stejné? Nepřeberně takových otázek máme u karetních a jiných her. Při řešení konrétních problémů většinou používáme buď tzv. "pravidlo součinu", když v navzájem nezávislých úkonech kombinujeme každý výsledek s každým, nebo "pravido součtu", když sčítáme počty pro různé neslučitelné možnosti. Prakticky to uvidíme v mnoha příkladech. 1.5. Permutace. Jestliže z množiny n předmětů vytváříme nějaké pořadí jejich prvků, máme pro volbu prvního prvku n možností, další je volen z n — 1 možností atd., až nám nakonec zbude jediný poslední prvek. Zjevně tedy je na dané konečné množině S s n prvky právě n! různých pořadí. Procesu uspořádávání prvků množiny S říkáme permutace prvků množiny S. Výsledkem permutace je pak vždy nějaké pořadí prvků. Jestliže si předem prvky v S očíslujeme, tj. ztotožníme si 5 s množinou S = {1, ... ,n} n přirozených čísel, pak permutace odpovídají možným pořadím čísel od jedné do n. Máme tedy příklad jednoduché matematické věty a naši předchozí diskusi je možné považovat za její důkaz: | Počet permutací | Proposition. Počet p(n) různých pořadí na konečné množině s n prvky je dán známou funkcí faktoriál: (1.2) p{n) = n\ 1.6. Kombinace a variace. Dalším jednoduchým příkladem hodnoty určené vzorcem jsou tzv. kombinační čísla, která vyjadřují, kolika způsoby lze vybrat k různých rozlišitelných předmětů z množiny n předmětů. Zjevně máme n(n - \) ■ ■ ■ (n - k + \) možných výsledků postupného výběru našich k prvků, přitom ale stejnou výslednou &-tici dostaneme v k \ různých 10 CHAPTER 1. ROZCVIČKA pořadích. Pokud nám záleží i na pořadí vybrané &-tice prvků, hovoříme o variaci k—tého stupně. Jak jsme si právě ověřili, počet kombinací a variací udávají následující vzorce, které také nejsou pro výpočet moc efektivní při velikých kun, protože obsahují výrazy pro fak-toriály. ' Kombinace a variace Proposition. Pro počet c(n, k) kombinací k-tého stupně z n prvků, kde 0 < k < n, platí (1.3) (n\ n(n — 1) ...(n — k + 1) n\ c(n, k) 0 k(k Pro počet v(n,k) variací platí (1.4) v(n,k)=n(n-l)---(n-k + l) pro všechny 0 < k < n (a nula jinak). (n-k)\k\ Kombinační číslo Q čteme "n nad k" a nazýváme ho také někdy binomickým číslem. Tento název čísla dostala od tzv. binomického rozvoje, tj. roznásobení n-té mocniny dvojčlenu. Počítáme-li totiž (a + b)n, bude koeficient u mocniny akbn~k pro každé 0 < k < n roven právě počtu možností, jak vybrat &-tici z n závorek v součinu (ty, kde bereme do výsledku a). Platí proto (1.5) (a+b) ,k ui—k a všimněme si, že pro odvození jsme potřebovali pouze dis-tributivitu, komutativitu a asociativitu násobení a sčítání. Formule (1.5) proto platí v každém komutativním okruhu. Jako další jednoduchou ukázku, jak vypadá matematický důkaz si odvoďme několik jednoduchých tvrzení o kombinačních číslech. Pro zjednodušení formulací definujme (1) = 0, kdykoliv je buď k < 0 nebo k > n. 1.7. Proposition. Pro všechna přirozená čísla k a n platí d) 0 = L\) (2) (T+\) = G) + Ui) (3) ZLo © = 2" (4) EU*©^2"-1- Proof. První tvrzení je zjevné přímo z formule (1.3). Jestliže vyčíslíme pravou stranu z tvrzení (2), dostáváme C) + G + i) + nl k\(n-k)\ (k + l)\(n-k (k + l)n\ + (n- k)n\ 1)! (* + l)!(n (72 + 1)! (k + l)!(n - k)\ což je ale levá strana tohoto tvrzení. Solution. Nejprve umístíme např. bílou věž. Pro ni máme na výběr z 82 polí. Ve druhém kroku umístíme věž černou. Nyní máme „k dispozici" 72 polí. Podle pravidla součinu je výsledek 82 • 72 = 3 136. □ V následujících příkladech už budeme při řešení používat pojmů kombinace, permutace, variace (případně s opakováním), které jsme definovali. 1.18. Během schůze má vystoupit 8 řečníků. Stanovte počet všech pořadí, v nichž dva předem určení řečníci nevystupují ihned po sobě. Solution. Označme si zmíněné dva řečníky jako osoby Aafi. Pokud hned po vystoupení osoby A následuje vystoupení osoby B, můžeme na to nahlížet jako na projev jediného řečníka. Počet všech pořadí, v nichž vystupuje B ihned po A, je tedy roven počtu všech permutací ze sedmi prvků. Stejný je pochopitelně také počet všech pořadí, v nichž vystupuje A ihned po B. Neboť počet všech možných pořadí 8 řečníků je 8!, číslo 81 — 2-7! udává hledaný počet pořadí. □ 1.19. Kolik existuje přesmyček slova PROBLÉM takových, že v nich a) písmena B a R stojí vedle sebe, b) písmena B a R nestojí vedle sebe. Solution. a) Dvojici písmen B a R můžeme považovat za jedno nedělitelné dvojpísmeno. Celkem tedy máme k dispozici šest různých písmen a šestipísmených slov složených z různých písmen je 6!. V našem případě však tento počet musíme ještě vynásobit dvěma, neboť naše dvojpísmeno může bít jak BR tak RB. Celkem dostáváme 2-6! různých přesmyček. b) 7! — 2 • 6! (doplněk části a) do počtu všech sedmipísmenných slov složených z různých písmen. □ 1.20. Kolika způsoby může sportovec umístit 10 různých pohárů do 5 polic, jestliže se na každou polici vejde všech 10 pohárů? Solution. K pohárům přidáme 4 navzájem nerozlišitelné předměty, kupř. tužky. Počet všech různých pořadí pohárů a tužek je zřejmě 14!/4! (tužky jsou nerozlišitelné). Každé umístění pohárů do polic ovšem odpovídá právě jednomu seřazení pohárů a tužek. Stačí třeba říci, že poháry před první tužkou v pořadí dáme do první police (při zachování pořadí), poháry před druhou tužkou do druhé police atd. To znamená, že číslo 14!/4! je výsledkem. □ 1.21. Určete počet čtyřciferných čísel sestavených z právě dvou různých cifer. Solution. Dvě různé cifry použité na zápis můžeme vybrat (j0) způsoby, ze dvou vybraných cifer můžeme sestavit 24 — 2 různých 11 B. KOMBINATORIKA 2. KOMBINATORICKÉ VELIČINY čtyřciferných čísel (dvojku odečítáme za dvě čísla složená pouze z jedné cifry). Celkem máme (2°)(24 — 2) = 630 čísel. Nyní jsme ale započítali i čísla začínající nulou. Těch je (j)(23 — 1) = 63. Celkově dostáváme 630 — 63 = 567 čísel. □ 1.22. Určete počet sudých čtyřciferných čísel sestavených z právě dvou různých cifer. Solution. Obdobně jako v předchozím příkladu se nejprve nebudeme ohlížet na cifru nula. Dostaneme tak (j)(24 — 2) + 5 • 5(23 — 1) čísel (nejprve počítáme čísla pouze ze sudých cifer, druhý sčítanec udává počet sudých čtyřciferných čísel složených ze sudé a liché cifry). Opět musíme odečíst čísla začínající nulou, těch je (23 — 1)4 + (22 — 1)5. Hledaný počet cifer tak je Q (24 - 2) + 5 • 5(23 - 1) - (23 - 1)4 - (22 - 1)5 = 272. □ 1.23. Na koncertě je 730 lidí. Mají někteří z nich stejné iniciály? (Neuvažujeme háčky ani čárky) Solution. Písmen v abecedě (včetně CH) je 27. Počet všech možných iniciálu je tedy 272 = 729. Proto aspoň 2 lidé budou mít stejné iniciály. □ 1.24. Noví hráči se sejdou v jednom volejbalovém týmu (6 lidí). Kolikrát si při seznamování (každý s každým) podají ruce? Kolikrát si hráči podají ruce se soupeřem po odehrání zápasu? Solution. Seznamuje se každá dvojice z šesti hráčů. Počet podání rukou je teda roven kombinaci C(2, 6) = $ = 15. Po zápase si každý z šesti hráčů podá ruku šestkrát (s každým z šesti soupeřů). Počet je teda dohromady 62 = 36. □ 1.25. Jak se může rozesadit pět osob v pětimístném autě, když jen dva z nich mají řidičský průkaz? Jak se může rozesadit 20 cestujících a dva řidiči v 25-místném minibuse? Solution. Na místě řidiče máme dvě možnosti a na zbylých místech už je pořadí libovolné, tzn. pro spolujezdce 4 možnosti, pro další místo 3, pak 2 a 1. Celkově 2.4! = 48 možností. Podobně v minibuse máme dvě možnosti na místě řidiče a druhý řidič plus cestující mohou na zbylých 24 místech sedět libovolně. Nejprve vybereme místa, která budou obsazená, tj. (^J) a na těchto místech může být 21! různých pořadí. Dohromady máme 2.(^)21! = 2Í1 možností. □ Tvrzení (3) dokážeme tzv. matematickou indukcí. Tento typ důkazu je vhodný právě pro tvrzení, která říkají, že něco má platit pro všechna přirozená ľ? čísla n. Matematická indukce se skládá ze dvou kroků. V prvním se tvrzení dokáže pro n = 0 (popřípadě n = 1 nebo další hodnoty ň). V druhém, tzv. indukčním, kroku předpokládáme, že tvrzení platí pro nějaké n (a všechny předešlé hodnoty), a za pomoci tohoto předpokladu dokážeme, že tvrzení platí i pro n + 1. Dohromady z toho pak vyvodíme, že tvrzení platí pro všechna přirozená n. Tvrzení (3) zjevně platí pro n = 0, protože Q = 1 = 2°. (Stejně tak je přímo vidět i pro n = 1.) Předpokládejme, že platí pro nějaké n a spočtěme příslušnou sumu pro n + 1 s využitím tvrzení (2) i (3). Dostaneme k=0 X 7 k=0 L X 7 \ / -I = Z()+Z() = ^ = *"- k=-l x 7 k=0 X 7 Všimněme si, že vzorec (3) udává počet všech podmnožin rc-prvkové množiny, neboť je počet všech jejích /c-prvkových podmnožin. Všimněme si také, že tvrzení (3) plyne přímo z (1.5) volbou a = b = 1. Tvrzení (4) dokážeme opět matematickou indukcí, podobně jako (3). Zjevně platí pro n = 0, čímž je hotov první krok. Indukční předoklad říká, že (4) platí pro nějaké n. Spočtěme nyní příslušnou sumu pro n + 1 s využitím tvrzení (2) a indukčního předpokladu. Dostaneme !'("') -g* -K)] = 2" + n2n~l + n2n~l = (n + 1)2". Tím je proveden indukční krok, a tvrzení je dokázáno pro všechna přirozená n. □ Druhá vlastnost z našeho tvrzení umožňuje sestavit všechna kombinační čísla do tzv. Pascalova trojúhelníku, kde každé číslo obdržíme jako součet dvou bezprostředně nad ním ležících sousedů: n = 0 : 1 n = 1 : 11 n = 2: 1 2 1 n = 3: 1 3 3 1 n = 4: 1 4 6 4 1 n =5: 1 5 10 10 5 1 12 CHAPTER 1. ROZCVIČKA Všimněme si, že v jednotlivých řádcích máme právě koeficienty u jednotlivých mocnin z výrazu (1.5), např. poslední uvedený řádek říká (a + by = ď + 5ďb + 10ďbz + 10azb" + 5ať + b . 1.8. Výběr s opakováním. Pořadí n prvků, z nichž mezi některými nerozlišujeme, nazýváme permutace s opakovaním. Nechť je mezi n danými prvky p\ prvků prvního druhu, p2 prvků druhého druhu, ..., Pk prvků &-tého druhu, p\ + p2 + ■ ■ ■ + Pk = n, potom počet pořadí těchto prvků s opakováním budeme značit P(pi,...,pk). Podobně jako u permutací a kombinací bez opakování, pro výběr prvního z nich máme n možností, pro další n — 1 a tak dále, až po poslední, který zbude. Přitom ale za stejná považujeme pořadí nerozlišitelných objektů. Těch je pro každou skupinku o p{ objektech právě p{!, takže zřejmě platí I Permutace s opakováním P(pi Pk) P\\--- Pk]- Volný výběr k prvků z n možností, včetně pořadí, nazýváme variace k-tého stupně s opakováním, jejich počet budeme značit V(n,k). Volný výběr v tomto případě znamená, že předpokládáme, že stále máme pro výběr stejně možností, např. díky tomu, že vybrané prvky před dalším výběrem vracíme nebo třeba házíme pořád stejnou kostkou. Zřejmě platí ■■■j Variace s opakováním | V(n,k) =nk Pokud nás výběr zajímá bez zohlednění pořadí, hovoříme o kombinacích s opakováním a pro jejich počet píšeme C(n, k). Zde se na první pohled nezdá tak jednoduché, jak výsledný počet zjistit. Důkaz následující věty je pro matematiku typický - podaří se nám nový problém převést na problém jiný, který jsme už dříve zvládli. V našem případě je to převedení na problém standardních kombinací bez opakování: | Kombinace s opakováním [ Theorem. Počet kombinací s opakováním k-té třídy z n prvků je pro všechny k > 0 a n > 1 C(n,k) e+r> 1.26. Kolika způsoby lze do tří různých obálek rozmístit pět shodných stokorun a pět shodných tisícikorun tak, aby žádná nezůstala prázdná? Solution. Nejdříve zjistíme všechna rozmístění bez podmínky neprázdnosti. Těch je podle pravidla součinu (rozmísťujeme nezávisle stokoruny a tisícikoruny) C(3,5)2 = Q2. Odečteme postupně rozmístění, kdy je právě jedna obálka prázdná, a poté kdy jsou dvě obálky prázdné. Celkem C(3, 5)2 - 3(C(2, 5)2 - 2) - 3 = Q2 - 3(62 - 2) - 3 = 336. □ 1.27. Určete počet různých vět, které vzniknou přesmyčkami v jednotlivých slovech věty "Skokan na koks" (vzniklé věty ani slova nemusejí dávat smysl). Solution. Určíme nejprve počty přesmyček jednotlivých slov. Ze slova "skokan" dostaneme 6!/2 různých přesmyček (permutace s opakováním P(l, 1, 1, 1, 2)), obdobně ze slova "na" dvě a ze slova "koks"4!/2. Celkem podle pravidla součinu (6!/2)-2-(4!/2) = 8640. □ 1.28. Kolik existuje různých přesmyček slova "krakatit" takových, že mezi písmeny "k" je právě jedno jiné písmeno. Solution. V uvažovaných přesmyčkách je šest možností, jak umístit skupinu dvou "k". Fixujeme-li pevně místa pro dvě písmena "k", pak ostatní písmena můžeme rozmístit na zbylých šest míst libovolně, tedy P(l, 1,2,2) způsoby. Celkem podle pravidla součinu je hledaný počet 6-P(l,1,2,2) 2-2 1080. □ 1.29. Kolika způsoby můžeme do pěti různých důlků vybrat po jedné kouli, vybíráme-li ze čtyř bílých, čtyř modrých a tří červených koulí? Solution. Nejprve řešme úlohu v případě, že bychom měli k dispozici alespoň pět koulí od každé barvy. V tomto případě se jedná o volný výběr pěti prvků ze tří možností, tedy o variace s opakováním (viz ). Máme V(3, 5) = 35. Nyní odečteme ty výběry, ve kterých se vyskytují buď pouze koule stejné barvy (takové výběry jsou tři), nebo právě čtyři koule červené (takových výběrů je 2 • 5 = 10; nejprve vybereme barvu koule, která nebude červená - dvě možnosti - a poté důlek, ve kterém bude - pět možností). Celkem tedy máme 35 - 3 - 10 = 230 možných výběrů. □ 13 C. DIFERENČNÍ ROVNICE 3. DIFERENČNÍ ROVNICE 1.30. Kolika způsoby mohla skončit tabulka první fotbalové ligy, víme-li o ní, že žádné dva z trojice týmů Zbrojovka Brno, Baník Ostrava a Sigma Olomouc spolu v tabulce "nesousedí"?(Ligu hraje 16 mužstev.) Solution. První způsob. Hledaný počet spočítáme podle principu inkluze a exkluze tak, že od počtu všech možných tabulek odečteme počet tabulek, ve kterých sousedí některá dvojice z uvedených tří týmů a přičteme počet těch tabulek, ve kterých sousedí všechny tři týmy. Hledaný počet tedy je 16! 0 2! • 15! + 3! • 14! = 13599813427200. Jiné řešení. Zmíněné tři týmy budeme považovat za "oddělovače". Zbylých třináct týmů musíme rozdělit tak, aby mezi libovolnými dvěma oddělovači byl alespoň jeden tým. Navíc zbylé týmy můžeme mezi sebou nezávisle permutovat a rovněžtak oddělovače. Celkem tedy dostáváme ■ 13! • 3! = 13599813427200 možností. □ 1.31. Pro libovolné pevné n e N určete počet všech řešení rovnice xi +x2-\-----h xk = n v množině nezáporných, kladných celých čísel. Solution. Každé řešení (ri, ..., rk), *Y^i=\ri = n můžeme jednoznačně zašifrovat jako posloupnost jedniček a nul, ve které napíšeme nejprve r\ jedniček, pak nulu, pak r2 jedniček, nulu a tak dále. Posloupnost bude celkem obsahovat n jedniček a k — 1 nul. Každá taková posloupnost navíc zřejmě určuje nějaké řešení dané rovnice. Je tedy řešení tolik, kolik je posloupností, tedy ■ □ C. Diferenční rovnice Diferenční rovnice (jinak řečeno též rekurentní vztahy) jsou vztahy mezi členy nějaké posloupnosti, přičemž následující člen je dán pomocí členů předchozích. Vyřešit diferenční rovnici pak znamená najít explicitní vzorec pro n-tý (libovolný) člen dané posloupnosti. Rekurentní vztah nám totiž po zadání několika prvních členů posloupnosti zadává n -tý člen přímo pouze pomocí postupného vyčíslení všech předchozích členů. Pokud je následující člen posloupnosti určen pouze předchozím členem, hovoříme o diferenčních rovnicích prvního řádu. S nimi se můžeme v životě opravdu setkat, například, pokud si chceme zjistit dobu splácení nějaké půjčky při pevné měsíční splátce, nebo naopak Proof. Důkaz je opřen o trik (jednoduchý, jakmile ho pochopíme). Uvedeme dva různé postupy. Představme si nejprve, že taháme postupně karty z balíku n různých karet a abychom mohli případně některou z nich vytáhnout vícekrát, přidáme si k balíku ještě k— 1 různých žolíků (alespoň jednou určitě chceme jednu z původních karet). Řekněme, že postupně vytáhneme r původních karet a s žolíků, tj. r + s = k. Zdá se, že bychom měli vymyslet postup, jak z těch s žolíků poznat, které karty nám zastupují. Ve skutečnosti nám ale stačí diskuse počtů možností takových voleb. K tomu můžeme použít matematickou indukci a předpokládat, že dokazovaná věta platí pro menší argumenty než jsou nuk. Skutečně, potřebujeme obsáhnout kombinace s-té třídy s opakováním z pouze r původních karet, což dává (r+k~r~1) = c71)' c°ž Je právě počet kombinací s-tého stupně (bez opakování) ze všech žolíků. Tím je věta dokázána. Druhý přístup (bez matematické indukce): Na množině S = {ai, an}, ze které vybíráme kombinace, si zafixujeme uvedené pořadí prvků a pro naše volby prvků z 5 si připravíme n přihrádek, do kterých si již předem dáme v námi zvoleném pořadí po právě jednom prvku z S. Jednotlivé volby xt e S přidáváme do přihrádky, která již tento prvek obsahuje. Nyní si uvědomme, že pro rozpoznání původní kombinace nám stačí vědět, kolik je prvků v jednotlivých přihrádkách. Například, a I bbb I cc I d ******* vypovídá o volbě b, b, c z množiny S = {a, b, c, d}. V obecném případě výběru k prvků z n možných tedy máme řetězec n + k znaků a počet C(n, k) je roven počtu možných umístění přihrádek | mezi jednotlivé znaky. To odpovídá výběru n — 1 pozic z n + k — 1 možných. Protože je /n+k-í\ ( n+k-í \ /n+k-í\ V k )~\n+k-l-k)~ \ n-1 ) je věta dokázána i podruhé. □ 3. Diferenční rovnice V předchozích odstavcích jsme viděli vzorce, které zadávaly hodnotu skalární funkce definované na přirozených číslech (faktoriál) nebo dvojicích čísel (binomická čísla) pomocí předcházejících hodnot. Zatímco v odstavci 1.5 jsou kombinační čísla definována přímo spočítatelným výrazem, lze rozumět vztahům v 1.8 také tak, že místo hodnoty naší funkce zadáváme její změnu při odpovídající změně nezávislé proměnné. 14 CHAPTER 1. ROZCVIČKA Takto se skutečně velice často postupuje při matematické formulaci modelů, které popisují reálné systémy v ekonomice, biologii apod. My si tu povšimneme jen několika jednoduchých případů a budeme se k této tématice postupně vracet. 1.9. Lineární diferenční rovnice prvního řádu. Obecnou diferenční rovnicí prvního řádu rozumíme výraz f(n + 1) = F(n, /(«)), kde F je známá skalární funkce závislá na dvojicích přirozených čísel. Známe-li "počáteční" hodnotu /(O), můžeme spočítat /(l) = F(0, /(O)), poté f (2) = F(l, /(l)) atd. Tímto postupným způsobem můžeme tedy nakonec spočítat hodnotu f (jí) pro libovolné n e N. Všimněme si, že tato úvaha je podobná konstrukci přirozených čísel z prázdné množiny nebo principu matematické indukce. Jako příklad může sloužit definiční formule pro faktoriál, tj- (n + 1)! = (n + 1) -n\ Vidíme, že skutečně vztah pro f(n + \) závisí na n i na hodnotě f(n). Dalším obzvlášť jednoduchým příkladem je f (jí) = C pro nějaký pevný skalár C a všechna n a tzv. lineární diferenční rovnice (1.6) f(n + í) = a ■ f(n) + b, kde a ^ 0, a b jsou známé skaláry. Takovou diferenční rovnici umíme snadno řešit, je-li b = 0. Pak se totiž jedná o dobře známou rekurentní definici geometrické posloupnosti a platí f(\) = af(0), f(2)=af(\)=a2f(0) atd. Máme tedy pro všechna n f (n) = anf(0). To je např. vztah pro tzv. Malthusiánský model populačního růstu, který vychází z představy, že za zvolený časový interval vzroste populace s konstantní úměrou a vůči předchozímu stavu. Dokážeme si obecný výsledek pro rovnice prvního řádu, které se podobají lineárním, ale připouští proměnné koeficienty a a b, (1.7) f(n + !)=«„• f(n) +bn. Nejdříve se ale zamysleme, co mohou takové rovnice popisovat. Lineární diferenční rovnici (1.6) můžeme pěkně interpretovat jako matematický model pro spoření nebo splácení úvěru s pevnou úrokovou mírou a a pevnou splátkou b (tyto dva případy se liší pouze znaménkem u parametru b). chceme zjistit výši měsíční splátky, zadáme-li si dobu, za kterou chceme půjčku splatit. 1.32. Mirek si chce koupit nové auto. Auto stojí 300 000 Kč. Mirek by chtěl auto koupit na měsíční splátky. Prodávající společnost mu nabízí půjčku na koupi auta s ročním úrokem 6%. Mirek bych chtěl auto splatit za tři roky. Jak vysoká bude měsíční splátka? Solution. Označme S Mirkovu měsíční splátku. Předpokládejme, že při "koupi" auta Mirek zaplatí jednu měsíční splátku a pak po měsíci vždy další. Částku, kterou bude Mirek dlužit po uplynutí k měsíců označme dk. Cenu auta označme C a měsíční úrok u (je tedy u = )■ Po prvním měsíci bude Mirek dlužit di = C — S + u (C — S). (Na počátku Mirek splatí jednu splátku, zbytek dluhu se pak úročí). Obecně po uplynutí &-tého měsíce dluží Mirek (1.1) S + ud, k-l- Podle vztahu (1.9) je dk dáno následovně -* 1X /(\+u)k+1 (1 +ufC ^(1 +u)k+1 - 1^ Splacení po třech letech se rovná podmínce úř36 dostáváme (1.2) S = C I --é,-r I = 8857. 0, odkud / (\+u)3bu \ \{1 + U)37_Í) □ Všimněme si, že rekurentní vztah (|| 1.11|) můžeme použít na náš příklad pouze tak dlouho, dokud budou všechna y(n) kladná, tj. dokud bude Mirek skutečně něco dlužit. 1.33. Uvažujme situaci z předchozího příkladu. Jak dlouho by Mirek auto splácel, kdyby chtěl měsíčně splácet 5000 Kč? Solution. Při označení q = 1, 005, C = 300000 nám podmínka dk = 0 dává vztah Cu — S jehož logaritmováním obdržíme ln S - ln(5 - Cu) k =- mg 15 C. DIFERENČNÍ ROVNICE 3. DIFERENČNÍ ROVNICE což pro S = 5000 dává přibližně k = 71,5, tedy splácení půjčky by trvalo 72 měsíců, tj. šest let (poslední splátka by nebyla plných 5 000 Kč). □ 1.34. Určete posloupnost {yn}%Li, která vyhovuje následujícímu rekurentnímu vztahu yn+i = — + 1, n > 1, yi = 1. Lineární rekurentní vtahy se mohou vyskytnout například v geometrických problémech: 1.35. Na kolik nejvýše oblastí může dělit rovinu n přímek? Solution. Označme hledaný počet oblastí pn. Pokud v rovině nemáme dánu žádnou přímku, je celá rovina jedinou oblastí, je tedy p0 = 1. Pokud je v rovině dáno n přímek, tak přidáním n + 1 přibude nejvýše (n + 1) oblastí: oblastí přibude právě tolik, kolika (původními) oblastmi bude přímka procházet (každou takovou oblast rozdělí na dvě části, jedna oblast tedy přibude). Přidaná přímka může mít nejvýše n různých průsečíků s n přímkami, které už v rovnině byly. Část přímky mezi libovolnými dvěma sousedními průsečíky prochází právě jednou oblastí, celkem může přidaná přímka procházet nejvýše n+1 oblastmi, tedy může přibýt maximálně n + 1 oblastí, navíc v rovině bylo před přidáním (n + 1)-ní přímky nejvýše pn oblastí (tak j sme číslo pn totiž definovali). Celkem dostáváme rekurentní vztah pn+i = pn+(n + 1), S proměnnými parametry dostáváme obdobný model, 4pu ovšem s proměnlivými j ak úroky, tak splátkami. ^y^fc Můžeme si představit třeba n jako počet měsíců, 't^./ a„ bude vyjadřovat úrokovou míru v měsíci n, yfíííň.- — b„ příslušnou splátku v měsíci /;. Neděste se zdánlivě složitého sčítání a násobení v následujícím výsledku. Jde o typický příklad technického matematického tvrzení, kdy těžké je "uhodnout", jak zní. Naopak důkaz je už pak jen docela snadné cvičení na základní vlastnosti skalárů a matematickou indukci. Skutečně zajímavé jsou teprve důsledky, viz 1.11 níže. Ve formulaci používáme vedle obvyklých znaků pro součet 22 také obdobné znaky pro součin TT. V dalším budeme vždy používat také konvenci, že pokud u součtu je množina uvedených indexů prázdná, pak je součet nula, zatímco u součinu je ve stejném případě výsledek jedna. 1.10. Proposition. Obecné řešení diferenční rovnice (1.7) prvního řádu s počáteční podmínkou f(0) = y q je dáno vztahem (1.8) f(n) (n-l \ n-2 I n-l \ n^u+z na')bJ i=0 / 7=0 \i=j+l I + b„-i. Proof. Tvrzení dokážeme matematickou indukcí. Zjevně tvrzení platí pro n = 1, kdy se jedná právě o definiční vztah /(l) = a0yo + b0. Předpokládáme-li, že tvrzení platí pro nějaké pevně zvolené n, můžeme snadno spočíst: f(n + 1) = a, (/n-l \ n-2 I n-l (n<-)»+£ n \/=0 / 7=0 \i=j+l + bn (n \ n—l í n n«)»+£ n z=0 / j'=0 Ví =7+1 a-i b j +bn_i cii b j + b„, jak se přímo vidí roznásobením výrazů. □ Opět si všimněme, že jsme pro důkaz nepotřebovali o použitých skalárech nic víc než vlastnosti komutativního okruhu. 1.11. Corollary. Obecné řešení lineární diferenční rovnice (1.6) s a ^ 1 a počáteční podmínkou f(0) = yoje (1.9) 1 - a" f(n) = a"y0 +--b. 1 — a Proof. Dosazením konstantních hodnot za a; a bi do obecného vzorce (1.8) dostáváme n-2 ^ 7=0 (n)=any0+b(l+YJCin-i-iy 16 CHAPTER 1. ROZCVIČKA tady to asi není šikovné — příklady na zbytkové třídy snad budou v druhém sloupci už dříve, nejlépe by bylo i z tohoto udělat příklad a odtud to přesunout (nebo úplně vypustit) Pro vyčíslení součtu součinů v druhém sčítanci si je třeba všimnout, že se jedná o výrazy (1 + a + ■ ■ ■ + an~1)b. Součet této geometrické řady spočteme ze vztahu 1 — a" = (1 — a)(l +« + •••+ an~l) a dostaneme právě požadovaný výsledek. □ Všimněme si, že pro výpočet součtu geometrické řady jsme potřebovali existenci inverze pro nenulové skaláry. To bychom nad celými čísly neuměli. Poslední výsledek tedy platí pro pole skalárů a můžeme jej bez problému použít pro lineární diferenční rovnice, kde koeficienty a, b a počáteční podmínka /(O) = y o jsou racionální, reálné nebo komplexní, ale také nad okruhem zbytkových tříd 1,k s prvočíselným k (zbytkové třídy budeme definovat v odstavci 1.41). Pozoruhodné je, že ve skutečnosti vzorec (1.9) platí i s celočíselnými koeficienty a počáteční podmínkou. Pak totiž předem víme, že všechny f (jí) budou také celočíselné, a celá čísla jsou podmnožinou v číslech racionálních. Musí proto nutně náš vzorec dávat ta správná celočíselná řešení. Při pozornějším pohledu na důkaz je zřejmé, žel —a" je vždy dělitelné 1 — a, takže nás poslední pozorování nemělo překvapit. Nicméně je vidět, že třeba nad skaláry ze Z4 a třeba a = 3 už neuspějeme, protože pak 1 — a = 2 je dělitelem nuly. 1.12. Nelineární příklad. Vraťme se na chvíli k rovnici \\ prvního řádu (1.6), kterou jsme použili na velice primitivní model populačního růstu závisející přímo úměrně na okamžité velikosti populace p. Na první pohled je zřejmé, že takový model vede při úměře a > 1 k příliš rychlému a hlavně neomezenému růstu. Realističtější model bude mít takto úměrnou změnu populace Ap(n) = p(n + 1) — p(n) jen při malých hodnotách p, tj. Ap/p ~ r > 0. Pokud tedy budeme chtít nechat růst populaci o 5% za období při malém p, budeme r volit 0, 05. Při určité limitní hodnotě p = K > 0 ale naopak už populace neroste a při ještě větších už klesá (třeba protože zdroje pro její obživu jsou omezené, jedinci ve veliké populaci si navzájem překáží apod.). Předpokládejme, že právě hodnoty yn = Ap(n)/p(n) se v závislosti na p(n) mění lineárně. Graficky si tedy tuto závislost můžeme představit jako přímku v rovině proměnných p ay, která prochází body [0, r] (tj. při p = 0 máme y = r) a [K, 0] (což dává druhou podmínku, že při p = K se populace nemění). Položíme proto y KP+r- Dosazením yn za y a p (n) za p dostáváme p(n + 1) - p(n) p(n) ze kterého získáme explicitní formuli pro pn buď pomocí vzorce 1.10 nebo přímo: pn = pn-i + n = pn_2 + (n-l)+n = = pn-3 + (n - 2) + (n - 1) + n = ■ ■ n (n + 1) n2 + n + 2 i = \ 1 + □ Rekurentní vztahy mohou mít i složitější podobu než je rekurze prvního řádu. Uveďme si příklady kombinatorických úloh, při jejichž řešení se můžeme rekurze s výhodou využít. 1.36. Kolik existuje slov délky 12 složených pouze z písmen A a B, které neobsahují skupinu BBB7 Solution. Nechť an značí počet slov délky n složených pouze z písmen A, B, neobsahujících skupinu BBB. Pak pro an (n > 3) platí rekurentní vztah dn — dn — \ -\- Cln—2 ~\~ dn—3> neboť slova délky n splňující danou podmínku musí končit buď na A, nebo na AB, nebo na ABB. Slov končících na A je právě a„_i (před posledním A může být libovolné slovo délky n — 1 splňující danou podmínku. Obdobně pro zbylé dvě skupiny. Dále snadno vyčíslíme a\ = 2, a2 = 4, a3 = 7. Postupným dopočítáním a12 = 1705. Též bychom mohli odvodit explicitní vzorec pro n-tý člen takto zadané posloupnosti, dle uvedené teorie. Charakteristický polynom dané rekurentní rovnice je x3 — x2 — x — 1 s jedním reálným a dalšími dvěma komplexními kořeny, které můžeme vyjádřit pomocí vztahů (II1.13H). □ 1.37. Skóre basketbalového utkání mezi týmy Česka a Ruska vyznělo po první čtvtině 12 : 9 pro ruský tým. Kolika způsoby se mohlo vyvíje SolutíônT ^5"- Označíme-li P{k,i) počet způsobů, kterými se mohlo vyvíjet skóre basketbalového utkání, které skončilo k : l, tak pro k, l > 3 platí rekurentní vztah: (k,l) (1-3,0 (1-2,0 (£-1,0 OU-l) -—p(n) +r, + P (Způsoby, kterými se mohlo vyvíjet utkání s vý rozdělíme na šest po dvou disjunktních podmnožin podle toho, které 17 D. PRAVDĚPODOBNOST 4. PRAVDĚPODOBNOST družstvo vstřelilo koš a za kolik bodů (1, 2, či 3).) Ze symetrie úlohy zřejmě platí P(k,i) = P(i,k)- Dále pro k > 3 platí: P(k,2) = P(k-?,,2) + P(k-2,2) + P(k-l,2) + P(k,l) + P(k,0), P(k,l) = P(k-3,l) + P(k-2,l) + P(k-l,l) + P(k,0), P(k,0) = P(k-3,0) + P(k-2,0) + ^(i-1,0). což spolu s počátečními podmínkami P(o,o) = 1» ^*(i,o) = 1» ^(2,0) = 2, ^(3,0) = 4, P(l,l) = 2, -P(2,l) = P(l,l) + P(0,l) + ^(2,0) = 5, P(2,2) = ^(0,2) + ^(1,2) + P(2,i) + P(2,o) = 14, dává p(12i9) = 497178513. □ Remark. Vidíme, že rekurentní vztah v tomto příkladu má složitější formu, než kterou jsme se zabývali v teorii a tudíž neumíme vyčíslit libovolné číslo P(k,i) explicitně, nýbrž pouze postupným výpočtem od počátečních členů. Takové rovnice nazýváme parciální diferenční rovnice, protože členy posloupnosti jsou značeny dvěma nezávislými proměnnými (k,l). O lineárních rekurentních formulích (diferenčních rovnicích) vyšších řádů s konstantími koeficienty si povíme více v kapitole 3. D. Pravděpodobnost Uveďme si několik jednoduchých příkladů na klasickou pravděpodobnost, kdy zkoumáme nějaký pokus, který má konečně mnoho možných výsledků ("všechny případy") a nás zajímá, kdy výsledek pokusu bude náležet nějaké podmnožině možných výsledků ("příznivé případy"). Hledaná pravděpodobnost je pak rovna poměru počtu příznivých případů ku počtu všech případů. Klasickou pravděpodobnost můžeme použít tam, kde předpokládáme (víme), že každý z možných výsledků má stejnou pravděpodobnost toho, že nastane (například při hodech kostkou). 1.38. Jaká je pravděpodobnost, že při hodu šestibokou kostkou padne číslo větší než 4? Solution. Všech možných výsledků je šest (tvoří množinu {1,2,3,4,5,6}), příznivé možnosti jsou dvě ({5,6}). Hledaná pravděpodobnost je tedy 2/6 = 1/3. □ 1.39. Ze skupiny osmi mužů a čtyř žen náhodně vybereme skupinu pěti lidí. Jaká je pravděpodobnost, že v ní budou alespoň tři ženy? Solution. Pravděpodobnost spočítáme jako podíl počtu příznivých případů ku počtu všech případů. Příznivé případy rozdělíme podle toho, kolik je v náhodně vybrané skupině mužů: mohou v ní být buď tj. roznásobením dostáváme diferenční rovnici prvního řádu (kde hodnota p(n) vystupuje v první i v druhé mocnině) (1.10) p(n + l)=p(n)(\-^p(n)+r). K Zkuste si promyslet nebo vyzkoušet chování tohoto modelu pro různé hodnoty r a K. Na obrázku je průběh hodnot pro parametry r = 0, 05 (tj. zi. pětiprocentní nárůst v ideálním stavu), K = 100 (tj. zdroje limitují hodnotu na 100 jedinců) a p(0) jsou dva jedinci. 0 So Všimněme si, že počáteční přibližně exponenciální růst se skutečně později zlomí a hodnota se postupně blíží kýženému limitu 100 jedinců. Pro p blízké jedné a K daleko větší než r bude pravá strana rovnice (1.10) přibližně p(n)(\ + r), tzn. chování je obdobné Malthusiánskému modelu. Naopak při p přibližně K bude pravá strana přibližně p(n). Pro větší počáteční hodnoty p než K budou hodnoty klesat, pro menší než K růst, takže systém bude zpravidla postupně oscilovat kolem hodnoty K. 4. Pravděpodobnost Teď se podíváme na jiný obvyklý případ skalárních hod-[3? _ not funkcí - sledované hodnoty často nejsou známy ani explicitně vzorcem, ani im-plicitně nějakým popisem. Jsou výsled-■íi^'ľl kem nějaké nahodilosti a my se snažíme popsat s jakou pravděpodobností nastane ta či ona možnost. 1.13. Co je pravděpodobnost? Jako jednoduchý příklad může sloužit obvyklé házení kostkou se šesti stěnami s označeními 1, 2, 3, 4, 5, 6. Pokud popisujeme matematický model takového házení "poctivou" kostkou, budeme očekávat a tudíž i předepisovat, že každá ze stran padá stejně často. Slovy to vyjadřujeme "každá předem vybraná stěna padne s pravděpodobností g". Pokud ale si třeba sami nožíkem vyrobíme takovou kostku z kusu dřeva, je jisté, že skutečné relativní četnosti výsledků nebudou stejné. Pak můžeme z velikého počtu pokusů usoudit na relativní četnosti jednotlivých výsledků hodů a tyto ustanovit jako pravděpodobnosti v našem matematickém popisu. Nicméně při sebevětším počtu pokusů nemůžeme vyloučit možnost, že se náhodou povedla 18 CHAPTER 1. ROZCVIČKA velice nepravděpodobná kombinace výsledků a že jsme proto náš matematický model skutečnosti pro naši kostku nevybrali dobře. V dalším budeme pracovat s abstraktním matematickým popisem pravděpodobnosti v nejjednoduším přiblížení. To, do jaké míry je takový popis adekvátní pro konkrétní pokusy či jiný problém, je záležitostí mimo samotnou matematiku. To ale neznamená, že by se takovým přemýšlením neměli zabývat matematikové (nejspíše ve spolupráci s jinými experty). Později se vrátíme k pravděpodobnosti coby teorii popisující chování nahodilých procesů nebo i plně determinovaných dějů, kde ovšem neznáme přesně všechny určující parametry. Matematická statistika pak umožňuje posuzovat, do jaké míry lze očekávat, že vybraný model je ve shodě s realitou, resp. umožňuje určit parametry modelu tak, aby docházelo k co nejlepší shodě s pozorováním a zároveň umí odhadnout míru spolehlivosti zvoleného modelu. K matematické pravděpodobnosti i statistice ovšem budeme potřebovat dosti rozsáhlý matematický aparát, který budeme mezitím několik semestrů budovat. Na příkladu naší neumělé kostky si to můžeme představit tak, že v teorii pravděpodobnosti budeme pracovat s parametry p{ pro pravděpodobnost jednotlivých hodnot stran a budeme požadovat pouze aby všechny tyto pravděpodobnosti byly nezáporné a jejich součet byl Pl + P2 + P3 + P4 + P5 + P6 = 1. Při volbě konkrétních hodnot pt pro konkrétní kostku pak v matematické statistice budeme schopni odhadnout s jakou spolehlivostí tento model naší kostce odpovídá. Naším skromným cílem je teď pouze naznačit, jak abstraktně zachytit pravděpodobnostní úvahy ve formalizovaných matematických objektech. Následující odstavce tak budou ve své podstatě -i— pouhými cvičeními v jednoduchých operacích nad množinami a jednoduché kombinatorice (tj. výpočtech počtu možností, jak mohou být splněny dané podmínky kladené na konečné množiny prvků). 1.14. Náhodné jevy. Budeme pracovat s neprázdnou pevně zvolenou množinou Q všech možných výsledků, kterou nazýváme základní prostor. Pro jednoduchost bude pro nás Q konečná množina s prvky a>\, ... ,a>„, představujícími jednotlivé možné výsledky. Každá podmnožina A c £2 představuje možný jev. Systém podmnožin A základního prostoru se nazývá jevové pole, jestliže • Q e A (t), základní prostor, je jevem), • je-li A, B e A, pak A \ B e A (tj. pro každé dva jevy je jevem i jejich množinový rozdíl), • jsou-li A, B e A, pak A U B e A (tj. pro každé dva jevy je jevem i jejich sjednocení). dva, nebo jeden muž. Skupinek o pěti lidech s jedním mužem je osm (záleží pouze na výběru muže, ženy v ní musí být všechny), skupinek sedvěmamužijepotomc(8, 2)-c(4, 3) = (2)'(3) (vybereme dva muže z osmi a nezávisle na tom tři ženy ze čtyř, tyto dva výběry můžeme nezávisle kombinovat a podle pravidla součinu dostáváme uvedený počet skupin). Všech možných skupin o pěti lidech pak můžeme ses-5). Hledaná pravděpodobnost je tedy 8 + ©© (?) □ Uveďme si příklad, při jehož řešení není vhodné používat klasické pravděpodobnosti: 1.40. Jaká je pravděpodobnost toho, že čtenář této úlohy vyhraje příští týden alespoň milión dolarů v loterii? Solution. Takováto formulace úlohy je neúplná, neposkytuje dostatek údajů. Předveďme "chybné" řešení Základní prostor všech možný jevů je dvouprvkový: buď vyhraje nebo nevyhraje. Příznivý jev je jeden (vyhraje), hledaná pravděpodobnost je tedy 1 /2 (a to je zjevně špatná odpověď). □ Remark. V předchozím příkladě je porušena základní podmínka použití klasické pravděpodobnosti, totiž to, že každý z elementárních jevů má stejnou pravděpodobnost toho, že nastane. 1.41. Do řady v kině o 2n místech je náhodně rozmístěno n mužů a n žen. Jaká je pravděpodobnost, že žádné dvě osoby stejného pohlaví nebudou sedět vedle sebe? Solution. Všech možných rozmístění lidí v řadě je (2n)\, rozmístění splňujících podmínky je 2(n\)2: máme dvě možnosti výběru pozice mužů, tedy i žen - buď všichni muži budou sedět na lichých místech (a tedy ženy na sudých), nebo všchni muži na sudých (a tedy ženy na lichých místech); na nich jsou pak muži i ženy rozmístěny libovolně. Výsledná pravděpodobnost je tedy 2{n\)2 p(n) = ——, p{2) = 0, 33, p(5) = 0, 0079, p(8) = 0, 00016. (2n)\ □ 1.42. Do výtahu osmipatrové budovy nastoupilo 5 osob. Každá z nich vystoupí se stejnou pravděpodobností v libovolném poschodí. Jaká je pravděpodobnost, že vystoupí i) všichni v šestém poschodí, ii) všichni ve stejném poschodí, iii) každý v jiném poschodí? 19 D. PRAVDĚPODOBNOST 4. PRAVDĚPODOBNOST Solution. Základní prostor všech možných jevů je prostor všech možných způsobů vystoupení 5 osob z výtahu. Těch je 85. V prvním případě je jediná příznivá možnost vystoupení, hledaná pravděpodobnost je tedy ^, ve druhém případě máme osm možností, hledaná pravděpodobnost je tedy ^ a konečně ve třetím je počet příznivých případů dán pětiprvkovou variací z osmi prvků (z osmi pater vybíráme pět, ve kterých se vystoupí a dále kteří lidé vystoupí ve vybraných poschodích), celkem je hledaná pravděpodobnost ve třetím případě rovna (viz 1.6 a 1.8) v(5, 8) V(5, 8) = 0, 2050781250. □ 1.43. Náhodně vybereme celé kladné číslo menší než 105. Jaká je pravděpodobnost, že bude složeno pouze z cifer 0, 1,5a zároveň bude dělitelné číslem 5? Solution. Čísel spňujích danou podmínku je 2-34 — 1 (kromě poslední cifry máme na každý řád na výběr ze tří cifer, případné číslice 0 na začátku slova nepíšeme. Všech celých kladných čísel menších než 105 je 105 — 1, podle klasické pravděpodobnosti dostáváme, že hledaná n o 4_ 1 pravděpodobnost je ■ □ 1.44. Ze sáčku s pěti bílými a pěti červenými koulemi náhodně vytáhneme tři (koule do sáčku nevracíme). Jaká je pravděpodobnost, že dvě budou bílé a jedna červená? Solution. Rozdělme uvažovaný jev na sjednocení tří disjunktních jevů: podle toho, kolikátou vytáhneme červenou kouli. Pravděpodobnosti, že vytáhneme koule přesně ve zvoleném pořadí jsou: \ \. f • \. Celkem^. Jiné řešení. Uvažme počet všech možných trojic vytažených koulí (koule jsou mezi sebou rozlišitelné), tedy (g0). Trojic, které obsahují právě dvě bílé koule je potom (^) • (j) (dvě bílé koule můžeme vytáhnout (j) způsoby, k nim pak červenou pěti způsoby). □ 1.45. Z klobouku, ve kterém je pět bílých, pět červených a šest černých koulí, náhodně vytahujeme koule (bez vracení). Jaká je pravděpodobnost, že pátá vytažená koule bude černá? Solution. Spočítáme dokonce obecnější úlohu. Totiž pravděpodobnost toho, že z-tá vytažená koule bude černá, je stejná pro všechna i, 1 < i < 16. Můžeme si totiž představit, že vytáhneme postupně všechny koule. Každá taková posloupnost vytažených koulí (od první vytažené koule po poslední), složená z pěti bílých, pěti červených a šesti černých koulí, má stejnou pravděpodobnost vytažení a pro výpočet hledané pravděpodobnosti můžeme opět použít model 20 Zjevně je i komplement Ac = Q\A jevu A jevem, který nazýváme opačný jev k jevu A. Průnik dvou jevů je opět jevem, protože pro každé dvě podmnožiny A.BcSÍ platí A\(fl\S) = AnS. Slovy se tak dá jevové pole charakterizovat jako systém podmnožin (konečného) základního prostoru uzavřený na průniky, sjednocení a rozdíly. Jednotlivé množiny A e A nazýváme náhodné jevy (vzhledem k .4). Pro naše házení kostkou je Q = {1, 2, 3, 4, 5, 6} ajevové pole je tvořeno všemi podmnožinami množiny Q. Např. náhodný jev {1, 3, 5} pak interpretujeme jako "padne liché číslo". Něco málo terminologie, která by měla dále připomínat souvislosti s popisem skutečných modelů: • celý základní prostor Q se nazývá jistý jev, prázdná podmnožina 0 e A se nazývá nemožný jev, • jednoprvkové podmnožiny {&>} c ^ se nazývají elementární jevy, • společné nastoupení jevů A;, i e /, odpovídá jevu níe/A;-, nastoupení alespoň jednoho zjevů A;-, i e /, odpovídá jevu U;e/A;, • A, B e A jsou neslučitelné jevy, je-li A n B = 0, • jev A má za důsledek jev B, když A c B, Přestavte si příklady všech uvedených pojmů pro jevový prostor popisující házení kostkou nebo obdobně pro házení mincí! CHAPTER 1. ROZCVIČKA 1.15. Definition. Pravděpodobnostní prostor je trojice (Q, A, P), kde A je jevové pole podmnožin (konečného) základního prostoru Q, na kterém je definována skalární funkce P : A -» M s následujícími vlastnostmi: • P je nezáporná, tj. P (A) > 0 pro všechny jevy A, • P je aditivní, tj. ř(AUB) = f (A) + P(B), kdykoliv je A, S eAaADB = 0, • pravděpodobnost jistého jevu je 1, tj. P(£2) = 1. Funkci P nazýváme pravděpodobností na jevovém poli A. Zjevně je okamžitým důsledkem našich definic řada prostých ale užitečných tvrzení. Např. pro všechny jevy platí P(AC) = 1 - P(A). Dále můžeme matematickou indukcí snadno rozšířit adi-tivnost na jakýkoliv konečný počet vzájemně neslučitelných jevů Ai cfi,ie /, tj. P(UieIAi) = YJP(Ai), i El kdykoliv A; n Aj = 0, pro všechna i ^ j, i, j e I. 1.16. Definition. Nechť Q je konečný základní prostor a nechť jevové pole A je právě systém všech podmnožin v £2. Klasická pravděpodobnost je pravděpodobnostní prostor (Q, A, P) s pravděpodobnostní funkcí P(A) = —, IS2I P :A^1 kde | A| značí počet prvků množiny A e A. Zjevně takto zadaná funkce skutečně definuje pravděpodobnost, ověřte si samostatně všechny požadované axiomy. 1.17. Sčítání pravděpodobností. U neslučitelných jevů Ji „ je sčítání pravděpodobností pro výskyt alespoň jednoho z nich přímo požadováno v základní definici x pravděpodobnosti. Obecně je sčítání pravděpodob-l11 1 ností pro výskyty jevů složité. Problém totiž je, že pokud jsou jevy slučitelné, částečně máme v součtu pravděpodobností započteny příznivé výskyty vícekrát. Nejjednodušší je si nejprve představit situci se dvěma slučitelnými jevy A, B. Uvažme nejprve klasickou pravděpodobnost, kde jde vlastně o počítání prvků v podmnožinách. Pravděpodobnost výskytu alespoň jednoho z nich, tj. pravděpodobnost jejich sjednocení, je dána vztahem (1.11) P (A UB) = P(A) + P(B) - P(A n B) protože ty prvky, které patří do množiny A i B, jsme nejprve započetli dvakrát a tak je musíme jednou odečíst. Tentýž výsledek dostaneme i pro obecnou pravděpodobnost P na nějakém jevovém poli. Protože A n B a A \ B jsou nezávislé jevy, P (A) = P(A \B) + P(A n B), klasické pravděpodobnosti. Zmíněných posloupností je P(5, 5, 6) = 5,!^!6!. Počet posloupností, kde na z-tém místě je černá koule, zbytek libovolný, je tolik, kolik je libovolých posloupností pěti bílých, pěti červených a pěti černých koulí, tedy P(5, 5, 5) = Celkem tedy je hledaná pravděpodobnost P(5,5,5) P(5,5, 6) 15! 5!5!5! 16! 6!5!5! □ Vraťme se k házení kostkou a zkusme popsat jevy ze základního prostoru Q vznikající při házení tak dlouho, dokud nepadne šestka, ne však více než stokrát. Pro jeden hod samostatně je základním prostorem šest čísel od jedné do šesti a jde o klasickou pravděpodobnost. Pro celé série našich hodů bude základní prostor daleko větší - bude to množina konečných posloupností čísel od jedné do šestky, které buď končí šestkou, mají nejvýše 100 členů a všechna předchozí čísla jsou menší než šest, nebo jde o 100 čísel od jedné do pěti. Jevem A může být např. podmnožina "házení končí druhým pokusem". Všechny příznivé elementární jevy pak jsou [1,6], [2,6], [3,6], [4,6], [5,6]. Ze známé klasické pravděpodobnosti pro jednotlivé hody umíme odvodit pravděpodobnosti našich jevů v Q. Není to ale jistě klasická pravděpodobnost. Tak pro diskutovaný jev chceme popsat, s jakou pravděpodobností nepadne šestka při prvém hodu a zároveň padne při druhém. Vnucuje se řešení 5 1 _ 5 6 ' 6 ~ 36' P (A) protože v prvém hodu padne s pravděpodobností 1 — ^ jiné číslo než šest a druhý hod, ve kterém naopak požadujeme šestku, je zcela nezávislý na prvním. Samozřejmě toto není poměr počtu příznivých výsledků k velikosti celého stavového prostoru! Obecněji můžeme říci, že po právě 1 < k < 100 hodech pokus skončí s pravděpodobností (f)*-1 • \- Ze všech možností je tedy ne-jpravděpodobnější, že skončí již napoprvé. Jiný příklad, jak z házení kostkou dostat různě pravděpodobné jevy je pozorovat součty při hodu více kostkami. Uvažujme takto: při hodu jednou kostkou je každý výsledek stejně pravděpodobný s pravděpodobností ^. Při hodu dvěmi kostkami je každý předem zvolený výsledek (a, b), tj. dvojice přirozených čísel od jedné do šesti (včetně pořadí), stejně pravděpodobný s pravděpodobností Pokud se budeme ptát po dvou pětkách, je tedy pravděpodobnost poloviční než u dvou různých hodnot bez uvedení pořadí. Pro jednotlivé možné 21 D. PRAVDĚPODOBNOST 4. PRAVDĚPODOBNOST součty uvedené v horním řádku nám vychází počet možností v řádku dolním: Součet 2 3 4 5 6 7 8 9 10 11 12 Počet 1 2 3 4 5 6 5 4 3 2 1 Podobně vyjde pravděpodobnost ^ jednotlivých výsledků hodu třemi kostkami, včetně určeného pořadí. Pokud se budeme ptát na pravděpodobnost výsledného součtu při hodu více kostkami, musíme pouze určit, kolik je možností, jak daného součtu dosáhnout a příslušné pravděpodobnosti sečíst. 1.46. Princip inkluze a exkluze. Sekretářka má rozeslat šest dopisů šesti různým lidem. Dopisy pro různé adresáty vkládá do obálek s adresami náhodně. Jaká je pravděpodobnost, že alespoň jeden člověk dostane dopis určený pro něj? Solution. Spočítejme pravděpodobnost jevu opačného, tedy toho, že ani jeden člověk neobdrží správný dopis. Stavový prostor všech možných jevů odpovídá všem možným pořadím pěti prvků (obálek). Označíme-li jak obálky tak dopisy čísly od jedné do šesti, tak všechny příznivé jevy (tedy žádný dopis nepřijde do obálky se stejným číslem) odpovídají takovým pořadím šesti prvků, kdy i-tý prvek není na /-tém místě (/ = 1,...,6), tzv. pořadím bez pevného bodu. Jejich počet spočítáme pomocí principu inkluze a exkluze. Označíme-li Mt množinu permutací s pevným bodem / (permutace v Mt ale mohou mít i jiné pevné body), tak výsledný počet d permutací bez pevného bodu je roven d = 6! - |Mi U •• • UM6| podobně pro B, ale také máme P (A UB) = P(A \B) + P(B \A) + P(A n B). Dosazením za pravděpodobnosti množinových rozdílů dostáváme opět vztah (1.11). Následující věta je přímým promítnutím tzv. kombi-jf"*~~~^-*, natorického principu inkluze a exkluze do Sjf lil, naší konečné pravděpodobnosti a říká, jakým %fT*í' způsobem vícenásobné započítávání výsledků _JsĽs— kompenzovat v obecném případě. Jde patrně o dobrý příklad matematického tvrzení, kde nejtěžší je najít dobrou formulaci a pak se dá říci, že (intuitivně) je tvrzení zřejmé. -mNtff MKLMZE- A fXKLMl£_ Na obrázku je situace znázorněna pro tři množiny A, B, C a pro klasickou pravděpodobnost. Jednoduše šrafované oblasti v prostém součtu máme dvakrát, dvojitě šrafované třikrát. Pak ty jednoduše šrafované jednou odečteme, přitom ty dvojitě šrafované opět třikrát odečteme, proto je tam nakonec ještě jednou započteme. Obecně, díky aditivní vlastnosti pravděpodobnosti, si můžeme představit, že každý jev rozložíme na elementární (tj. jednobodové) jevy, jakkoliv ve skutečnosti nemusí jednoprvkové podmnožiny do uvažovaného jevového pole patřit. Pak je pravděpodobnost každého jevu dána součtem pravděpodobností jednotlivých elementárních jevů do něj patřících a můžeme při vyjádření pravděpodobnosti nastoupení alespoň jednoho z jevů takto: sečteme všechny pravděpodobnosti výsledků pro všechna A; zvlášť, pak ovšem musíme odečíst ty, které tam jsou započteny dvakrát (tj. prvky v průnicích dvou). Teď si ovšem dovolujeme odečíst příliš mnoho tam, kde ve skutečnosti byly prvky třikrát, tj. korigujeme přičtením pravděpodobností ze třetího členu, atd. Theorem. Buďte A\, ..., Ak e A libovolné jevy na základním prostoru £2 s jevovým polem A Pak platí k k-l k P(U*=1Ať) = £ P(At) - Z Z P(Ai n AJ> i — l i — l j—i-\-l k-2 k-l k + Z Z Z PiADAjDA,) Z=l j=i+l t=j+\ 22 CHAPTER 1. ROZCVIČKA + (-i)'-1ř(A1nA2n-nAt). Proof. Aby se výše naznačený postup stal důkazem, je zapotřebí si ujasnit, že skutečně všechny ko-_<■/«' rekce, tak jak jsou popsány, jsou skutečně s koeficienty jedna. Místo toho můžeme snáze dát dohromady formálnější důkaz matematickou indukcí přes počet k jevů, jejichž pravděpodobnosti sčítáme. Zkuste si průběžně porovnávat oba postupy, mělo by to vést k vyjasnění, co to znamená "dokázat" a co "porozumět". Pro k = 1 tvrzení zjevně platí, vztah pro k = 2 je totožný s rovností (1.11) a tu jsme pro obecné pravděpodobnostní funkce již dokázali také. Předpokládejme tedy, že věta platí pro všechny počty množin až do pevně zvoleného k > 1. Nyní můžeme pracovat v indukčním kroku se vztahem pro k + 1 jevů, když sjednocení prvních k jevů bereme jako A ve vzorci (1.11) výše, zatímco zbývající jev hraje roli B: P(Uf+1Ai) = P((uř=1Ai)UAJt+1) 7=1 ^ 1<í! < — ! a tedy pro hledaný počet d dostáváme vztah d = ói-xí-^Qí"-*)1 £(-!)* (6-*)! = 6! £ (-1)* k\ k=0 s ' k=0 Pravděpodobnost toho, že žádný člověk neobdrží "svůj" dopis je tedy Z (-1)* k\ a hledaná pravděpodobnost pak 6 ■ -z k=0 (-1)* _ 53 k\ ~ 144' □ Remark. Všimněme si, že odpovědna stejnou otázku, se s rostoucím počtem dopisů příliš nemění. Pro n dopisů je pravděpodobnost, že sekretářka nedá žádný do správné obálky ^ (-1)* 1 1 - > -—- = 1 - -, ^- k\ e k=0 jak totiž uvidíme později, uvedená suma konverguje (blíží se) k hodnotě 1/e. Podobně lze řešit příklad || 1.1551| Následující příklad je jednoduchým modelem, který odhaduje pravděpodobnost úmrtí osoby při dopravní nehodě. 1.47. Ročně zahyne na silnicích v ČR přibližně 1200 českých občanů. Určete pravděpodobnost, že někdo z vybrané skupiny pěti set Čechů zemře v následujících deseti letech při dopravní nehodě. Předpokládejte pro zjednodušení, že každý občan má v jednom roce stejnou "šanci" zemřít při dopravní nehodě a to 1200/107. Solution. Spočítejme nejprve pravděpodobnost, že jeden vybraný člověk v následujících deseti letech nezahyne při dopravní nehodě. Pravděpodobnost, že nezahyne v jednom roce, je (1 — j^). Pravděpodobnost, že nezahyne v následujících deseti letech, je pak (1 — yjjš)10. Pravděpodobnost, že v následujících deseti letech nezahyne nikdo z daných pěti set lidí, je opět podle pravidla součinu (jedná se o nezávislé jevy) (1 — j.^-)5000. Pravděpodobnost jevu 23 D. PRAVDĚPODOBNOST 4. PRAVDĚPODOBNOST opačného, tedy toho, že někdo z vybraných pěti set lidí zahyne, je tedy 1 5000 0,4512. □ Remark. Model, který jsme použili v předchozím příkladu k popisu zadané situace, je pouze přibližný. Problém spočívá v podmínce, že každý občan z vyšetřovaného vzorku má stejnou pravděpodobnost toho, že v průběhu roku zahyne, kterou jsme odhadli z počtu usmrcených osob za rok. Počet tragických nehod se totiž rok od roku mění a i kdyby se neměnil, tak se mění populace. Ukažme si jednu s nepřesností příkladu na jiném způsobu řešení: zahyne-li 1200 osob za rok, tak za deset let zahyne 12000. Pravděpodobnost toho, že konkrétní člověk zahyne v průběhu deseti let tedy můžeme odhadnout i zlomkem 12000/107. Pravděpodobnost, že konkrétní osoba nezahyne v průběhu 10 let je tedy (1 — y^) (to jsou první dva členy binomického rozvoje (1 — y^)10)- Celkem dostáváme anolagicky jako v předchozím řešení odhad pravděpodobnosti -0 -) 104/ 500 0,4514. Vidíme, že oba odhady jsou velmi blízké. Snaha použít matematických znalostí k výhře v nejrůznějších hazardních hrách je velmi stará. Podívejme se na jednoduchý příklad. 1.48. Alešovi zbylo 2500 Kč z pořádání tábora. Aleš není žádný ňouma: 50 Kč přidal z kasičky a rozhodl sejít hrát ruletu na automaty. Aleš sází pouze na barvu. Pravděpodobnost výhry při sázce na barvu je 18/37. Začíná sázet na 10 Kč a pokud prohraje, v další sázce vsadí dvojnásobek toho, co v předchozí (pokud na to ještě má, pokud ne, tak končí s hrou -byťby měl ještě peníze na nějakou menší sázku). Pokud nějakou sázku vyhraje, v následující sázce hraje opět o 10 Kč. Jaká je pravděpodobnost, že při tomto postupu vyhraje dalších 2550 Kč? (jakmile bude 2550 Kč v plusu, tak končí) Solution. Nejprve spočítejme, kolikrát po sobě může Aleš prohrát. Za-číná-li s 10 Kč, tak na n vsazení potřebuje 10+20+- • -+10-2' n-l 10-(Z2í) = 10{|rT) = 10^2"- i). Jak snadno nahlédneme, číslo 2550 je tvaru 10(2" — 1) a to pro n = 8. Aleš tedy může sázet osmkrát po sobě bez ohledu na výsledek sázky, na devět sázek by potřeboval již 10(29 — 1) = 5110 Kč a to v průběhu hry nikdy mít nebude (jakmile bude mít 5100 Kč, tak končí). Aby tedy jeho hra skončila neúspěchem, musel by prohrát osmkrát v řadě. Pravděpodobnost prohry při jedné sázce je 19/37, pravděpodbnost princip inkluze a exkluze. \M \ (LÍ=1Ai)| = = \M\ + yJ((-iy Z n...nA;.|V 7=1 ^ l<í'1<---<í';<í: ' Opět je snadné nakreslit si tvrzení pro dvě nebo tři množiny, viz obrázek před větou 1.17. 1.19. Nezávislé jevy. Vraťme se na chvíli k jednoduchému modelu dokonalé hrací kostky. Bude nás zajímat, jak mohou být jevy závislé. Např. pravděpodobnost, že nastanou zároveň jevy "padne liché číslo" a "padne alespoň trojka", je |. To je totéž jako \-\, tedy součin pravděpodobností jednotlivých jevů. To odpovídá představě, že můžeme nezávisle testovat obě podmínky a výsledná pravděpodobnost současného splnění bude dána součinem pravděpodobnostní dílčích. Naopak, jestliže budeme uvažovat neslučitelné jevy, jako jsou např. "padne sudé číslo" a "padne liché číslo", bude pravděpodobnost současného výskytu obou nulová, zatímco součin dílčích pravděpodobností nulový není. To odpovídá přestavě, že tyto dva jevy musí být závislé, protože výskyt jednoho z nich ten druhý už vylučuje. Samozřejmě může nastávat slabší závislost, např. jev "padne liché číslo" je důsledkem jevu "padne trojka" a proto také není dána pravděpodobnost společného výskytu těchto dvou jevů pomocí součinu. Pro pravděpodobnosti P na libovolných jevových polích řekneme že jevy A a B jsou stochasticky nezávislé jestliže platí P(ADB) = P(A) ■ P(B). Zkusme ale tutéž hru s kostkou s více jevy, třebas jev A "padne liché číslo", jev B "padne alespoň 3" a jev C "padne nejvýše 3". Pravděpodobnosti jsou P(A) = j, P(B) = |, P(C) = \, P(A n B n C) = \ = \ ■ \ ■ \, ale po dvojicích dostáváme např. P{Af\ C) = \ \ • \. Obecně tedy definujeme nezávislé jevy takto: Definition. Uvažme libovolný pravděpodobnostní prostor (Q, A, P) a v něm k jevů Ai,...,Ak. Řekneme, že tyto jevy jsou stochasticky nezávislé (vzhledem k pravděpodobnosti P), jestliže pro libovolné z nich vybrané jevy Aix, ..., Ait, 1 < l < k platí P(Ahf)...f)Ait) = P(Ah). .... P(Ait). Zjevně je každý podsystém stochasticky nezávislých jevů opět stochasticky nezávislý. Dále si pro dva stochasticky nezávislé jevy A, B spočtěme P(A n Se) = P(A \B) = P(A) - P(A n B) = = P(A)(l - P(B)) = P(A)P(BC). 24 CHAPTER 1. ROZCVIČKA Odtud už snadno dovodíme, že záměnou jednoho nebo více stochasticky nezávislých jevů za jejich opačné jevy obdržíme opět stochasticky nezávislé jevy. Často je potřebná pravděpodobnost, že nastane alespoň jeden ze stochasticky nezávislých jevů, tzn. hledáme P(Ai U • • • U Ak). Můžeme pak použít elementární vlastnosti množinových operací, tzv. de Morganova pravidla, (UieIAi)c = nie/A- (nie/A;-)e = Uie/A- a dostáváme: (1.12) PÍAiU • • U Ak) = 1 = 1-(1- -P(Aí n---nA£) = P(A1))...(l-P(AJt)). 1.20. Podmíněná pravděpodobnost. Míru závislosti dvou jevů můžeme přeformulovat s představou, že zkoumáme jeden z nich za podmínky, že druhý nastal. U nezávislých by podmínka neměla mít žádný vliv. Např. "jaká je pravděpodobnost, že při hodu dvěmi kostkami padly dvě pětky, je-li součet hodnot deset?". Formalizovat takový postup umíme následovně. Podmíněná pravděpodobnost [ Definition. Nechť H je jev s nenulovou pravděpodobností v jevovém poli A v pravděpodobnostním prostoru (Q, A, P). Podmíněná pravděpodobnost P(A\H) jevu A e A vzhledem k hypotéze //je definována vztahem P(Af\H) P(A\H) P(H) Jak je vidět přímo z definice, hypotéza H a jev A jsou skutečně nezávislé tehdy a jen tehdy, je-li P (A) = P(A\H). Přímo z definice také vyplývá tzv. "věta o násobení pravděpodobností". Máme-li dva jevy A\, A2 splňující P(Ä! HA2) > 0, potom P(A1r)A2) = P(A2)P(A1\A2) = P(Ai)P(A2|Ai). Všechna tato čísla vyjadřují pravděpodobnost toho, že nastanou oba jevy A\ i A2, jenom jinými způsoby. Například v posledním případě nejprve sledujeme, zda nastane první jev. Potom za předpokladu, že ten první nastal, sledujeme zda nastane i ten druhý. Podobně, pro tři jevy A\, A2, A3 splňující P(Ai n A2 n A3) > 0, dostaneme P(Al n A2 n A3) = /5(A1)JP(A2|A1)JP(A3|A1 n A2). Slovy to lze opět popsat tak, že pravděpodobnost výskytu všech tří jevů zároveň můžeme spočítat tak, že se nejprve zabýváme výskytem pouze prvního z nich, potom druhého za předpokladu, že první už nastal a naposledy třetího za předpokladu, že oba předešlé jevy již nastaly. Máme-li obecný počet k jevů Ai, ..., A* splňujících P(A\ n • • • n Ak) > 0, pak věta říká následující: P(Alf). ■ .f)Ak) = P(Al)P(A2\Al). ■ ■P(Ak\Alr\- ■ -nA^). prohry v osmi po sobě následujících (nezávislých) sázkách je tedy (19/37)8. Pravděpodobnost, že v těchto osmi hrách vyhraje 10 Kč (při daném postupu) je tedy 1 — (19/37)8. Na to, aby vyhrál 2500 Kč, potřebuje 255 krát vyhrát po desetikoruně. Tedy opět podle pravidla součinu je pravděpodobnost výhry 255 = 0, 29. HO Tedy pravděpodobnost výhry je nižší, než kdyby vsadil rovnou vše na jednu barvu. □ 1.49. Samostatně si můžete vyzkoušet spočítat předchozí příklad za předpokladu, že Aleš sází stejnou metodou jako v předchozím příkladě, končí však až v okamžiku, kdy nemá žádné peníze (pokud nemá na vsazení dvojnásobku částky prohrané v předchozí sázce, ale má ještě nějaké peníze, začíná sázet znovu od 10 Kč). Nyní si procvičme tzv. "podmíněnou" pravděpodobnost (viz (1.20)). 1.50. Jaká je pravděpodobnost toho, že při hodu dvěma kostkami padne součet 7, víme-li, že ani na jedné z kostek nepadlo číslo 2? Solution. Označme jako B jev, že ani na jedné kostce nepadne dvojka, jev "padne součet 7" označme jako A. Množinu všech možných výsledků budeme značit opět jako Q. Pak P(AnB) 4nf- |Ans| P(A\B) P(B) \B\ mi 1*1 Číslo 7 může padnout čtyřmi různými způsoby, pokud nepadne dvojka, tedy |A n B\ = 4, \B\ = 5 ■ 5 = 25, tedy 4 P(A\B) 25' Všimněme si, že P(A) = \, tedy jevy A a S jsou závislé. □ 1.51. Michal má dvě poštovní schránky, jednu na gmail.com a jednu na seznam.cz. Uživatelské jméno má stejné na obou serverech, hesla různá (ale nepamatuje si, které heslo má na kterém serveru). Při zadávání hesla při přístupu do schránky se splete s pravděpodobností 5% (tj. jestliže chce napsat zadat jemu známé slovo jako heslo, tak jej s pravděpodobností 95% skutečně správně na klávesnici zadá). Michal zadal na serveru seznam.cz jméno a heslo a server mu oznámil, že něco není vpořádku. Jaká je pravděpodobnost, že chtěl zadat správné heslo, ale pouze se "překlepnul" při zadávání? (Předpokládáme, že uživatelské jméno zadá vždy bez chyby.) Solution. Označme A jev, že Michal fyzicky zadal na serveru sez-nam.cz špatné heslo. Tento jev je sjednocením dvou disjunktních jevů: 25 D. PRAVDĚPODOBNOST 4. PRAVDĚPODOBNOST A\ : chtěl zadat správné heslo a přepsal se, A2 : chtěl zadat špatné heslo (to z gmail.com) a buď se přepsal nebo ne. Hledáme tedy podmíněnou pravděpodobnost P(Ai \A), ta je podle vztahu pro podmíněnou pravděpodobnost rovna: P(AiHA) P(Ai) P(Ai) P(Ai|A) = ——-- =-—— =-—-, P(A) P{AXUA2) P{Ax) + P{A2y potřebujeme tedy určit pravděpodobnosti P(A\) a P(A2). Jev A\ je konjunkcí (průnikem) dvou nezávislých jevů: Michal chtěl zadat správné heslo a Michal se při zadávání přepsal. Dle zadání je pravděpodobnost prvního z nich 1 /2, druhého 1 /20, celkem P(A\) = \ ' = 1) (pravděpodobnosti násobíme, protože se jedná o nezávislé jevy). Dále je ze zadání P(A2) p(A2) = To + \ Celkem P(A) = P(Ai) + Ijjj, a můžeme vyčíslit: P(Ai|A) 1 21' □ Metodu geometrické pravděpodobnosti můžeme použít v případě, že daný základní prostor sestává z nekonečně mnoha elementárních jevů, které dohromady vyplňují nějakou oblast na přímce, rovnině, prostoru (u které umíme určit její délku, obsah, objem, ...). Předpokládáme, že pravděpodobnost toho, že nastane elementární jev z určité podoblasti je rovna poměru její velikosti (délce, obsahu, ...) k velikosti celého základního prostoru. 1.52. Z Těšína vyjíždí vlaky co půl hodinu (směrem na Bohumín) a z tohoto směru přijíždějí také každé půl hodiny. Předpokládejme, že vlaky se mezi těmito dvěma stanicemi pohybují rovnoměrnou rychostí 72 km/h a jsou dlouhé 100 metrů, cesta trvá 30 minut, vlaky se míjejí někde na trase. Nevyspalý hazardér Jarek si vybere jeden z těchto vlaků a během cesty z Těšína do Bohumína náhodně vystrčí hlavu z okna na pět vteřin nad kolejiště pro protější směr. Jaká je pravděpodobnost, že mu bude uražena? (Předpokládáme, že jiné než zmíněné vlaky na trati nejezdí.) Solution. Vzájemná rychlost protijedoucích vlaků je 40 m/s, protijedoucí vlak mine Jardovo okno za dvě a půl sekundy. Prostor všech možností je tedy interval (0, 1800 s), prostor "příznivých" možností je potom interval délky 7, 5 s ležící někde uvnitř předchozí úsečky. Pravděpodobnost uražení hlavy je tedy 7, 5/1800 = 0, 004. □ 1.53. Jednou denně někdy mezi osmou hodinou ranní a osmou hodin-nou večerní vyjíždí náhodně autobus z Koločavy do Užhorodu. Jednou denně ve stejném časovém rozmezí jezdí jiný autobus náhodně Skutečně, dle předpokladu jsou i pravděpodobnosti všech průniků, které jsou brány ve výrazu za hypotézy, nenulové. Pokrácením čitatelů a jmenovatelů získáme i napravo právě pravděpodobnost jevu odpovídajícího průniku všech uvažovaných jevů. 1.21. Geometrická pravděpodobnost. V praktických problémech se často setkáváme s daleko složitějšími modely, kde základní prostor není konečnou množinou. Nemáme momentálně k dispozici ani základní nástroje pro dostatečné zobecnění pojmu pravděpodobnosti, nicméně můžeme uvést alespoň jednoduchou ilustraci. Uvažme rovinu M2 dvojic reálných čísel a v ní podmnožinu Q se známým obsahem vol Q (symbol "vol" je od anglického "volume", tj. obsah/objem). Příkladem může sloužit třeba jednotkový čtverec. Náhodné jevy budou reprezentovány podmnožinami A c a za jevové pole A bereme nějaký vhodný systém podmnožin, u kterých umíme určit jejich obsah. Nastoupení nebo nenastoupení jevu je dáno výběrem bodu v Q, kterým se trefíme nebo netrefíme do množiny reprezentující jev A. Uvažme jako příklad problém, kdy náhodně vybereme dvě hodnoty a < b v intervalu [0, 1] C M. Všechny hodnoty a i b jsou stejně pravděpodobné a otázka zní "jaká je pravděpodobnost, že interval (a, b) bude mít velikost alespoň jedna polovina?". Volba čísel a, b je volbou libovolného bodu [a, b] ve vnitřku trojúhelníku Q s hraničními vrcholy [0, 0], [0, 1], [1, 1] (viz obrázek). Úlohu si můžeme představit jako popis problému, kdy se hodně unavený účastník večírku nad ránem pokouší dvěma řezy rozdělit párek na tři díly pro sebe a své dva kamarády. Jaká je pravděpodobnost, že se na někoho dostane aspoň půlka? Odpověď je docela jednoduchá: Podobně jako u klasické pravděpodobnosti definujeme pravděpodobnostní funkci P : A -» M vztahem vol A P(A) =-, vol £2 26 CHAPTER 1. ROZCVIČKA kde A jsou podmnožiny v rovině, které odpovídají námi vybraným jevům. Potřebujeme tedy znát plochu podmnožiny, která odpovídá bodům s b > a + j, tj. vnitřku trojúhelníku A ohraničeného vrcholy [0, j], [0, 1], [j, 1]. Evidentně dostáváme P (A) = |. Zkuste si samostatně odpovědět na otázku "pro jakou požadovanou minimální délku intervalu (a, b) dostaneme pravděpodobnost jedna polovina?". 1.22. Metody Monte Carlo. Jednou z účinných výpočetních metod přibližných hodnot je naopak simulace známé takovéto pravděpodobnosti pomocí relativní četnosti nastoupení vhodně zvoleného jevu. Např. známá formule pro obsah kruhu o daném poloměru říká, že obsah jednotkového kruhu je roven právě konstantě jv = 3, 1415..., která vyjadřuje poměr obsahu kruhu a druhé mocniny jeho poloměru. (Tady si také povšimněme východiska, které jsme nedokázali - proč by měl být obsah kruhu roven konstantnímu násobku druhé mocniny poloměru? Matematicky to budeme umět ukázat, až zvládneme tzv. integrování. Experimentálně si to ale můžeme ověřit níže uvedeným postupem s různými velikostmi strany čtverce.) Pokud zvolíme za Q jednotkový čtverec a za A průnik Q a jednotkového kruhu se středem v počátku, pak vol A = \it. Máme-li tedy spolehlivý generátor náhodných čísel mezi nulou a jedničkou a počítáme relativní četnosti, jak často bude vzdálenost bodu [a, b] (určeného vygenerovanou dvojicí a, b) od počátku menší než jedna, tj. a2 + b2 < 1, pak výsledek bude při velkém počtu pokusů s velikou jistotou dobře aproximovat číslo ijr. Numerickým postupům založeným na tomto principu se říká metody Monte Carlo. 5. Geometrie v rovině V posledních odstavcích jsme intuitivně používali elementární pojmy z geometrie reálné roviny. Teď budeme podrobněji zkoumat, jak se vypořádá-J vat s potřebou popisovat "polohu v rovině", resp. dávat do souvislostí polohy různých bodů roviny. Nástrojem k tomu budou opět zobrazení, tentokrát to ale budou velice speciální pravidla přiřazující dvojicím hodnot (x, y) dvojice (w,z) = F(x, y). Zároveň půjde o předzvěst úvah z oblasti matematiky, které se říká lineární algebra a kterou se budeme podrobně zabývat v dalších třech kapitolách. 1.23. Vektorový prostor M2. Podívejme se na "rovinu" jakožto na množinu dvojic reálných čísel (x,y) e M2. Budeme jim říkat vektory v M2. Pro takové vektory umíme opačným směrem. Cesta tam trvá pět hodin, zpět též pět hodin. Jaká je pravděpodobnost, že se autobusy potkají, jezdí-li po stejné trase? Solution. Prostor všech možných jevů je čtverec 12 x 12, Označíme -li doby odjezdu obou autobusů x, resp. y, pak se tyto na trase potkají právě když \x — y\ < 5. Tato nerovnost vymezuje v daném čtverci oblast "příznivých jevů". Obsah zbylé části spočítáme přímo jednodušeji, neboť je sjednocením dvou pravoúhlých rovnoramenných trojúhelníků o odvěsnách délky 7, tedy je roven 49, obsah části odpovídající "příznivým jevům" je tedy 144 — 49 = 95, celkem je hledaná pravděpodobnost p = ^ = 0, 66. KOLOčAVÁ - !AŽMOWT> □ 1.54. Dvoumetrová tyč je náhodně rozdělena na tři díly. Určete pravděpodobnost, že alespoň jeden díl bude nejvýše 20 cm dlouhý. Solution. Náhodné rozdělení tyče na tři díly je dáno dvěma body řezu, čísly x a y (nejprve tyč rozřízneme ve vzdálenosti x od počátku, nehýbeme s ní a dále ji rozřízneme ve vzdálenosti y od počátku). Pravděpodobnostní prostor je tedy čtverec C o straně 2 m. Umístíme-li čtverec C tak, aby dvě jeho strany ležely na kartézských osách v rovině, tak podmínka, že alespoň jeden díl má být nejvýše 20 cm dlouhý, nám vymezuje ve čtverci následující oblast O: O = {(x, y) e C\ (x < 20) v (x > 180) v (y < 20) v (y > 180) V (\x - y|) < 20}. Jak snadno nahlédneme, zaujímá takto vymezená oblast ^ obsahu čtverce. -%- z □ 27 E. GEOMETRIE V ROVINE 5. GEOMETRIE V ROVINE E. Geometrie v rovině Vraťme se na chvíli ke komplexním číslům. Komplexní rovnina je totiž "normální" rovina, kde ovšem máme dáno něco navíc: 1.55. Interpretujte násobení imaginární jednotkou a vzetí komplexně sdruženého čísla jako geometrickou transformaci v rovině. Solution. Imaginární jednotka i odpovídá bodu (0, 1) a všimněme si, že vynásobení jakéhokoliv čísla z = a+i b imaginární jednotkou dává výsledek i ■ (a + i b) = —b + i a což je v interpertaci v rovině otočení bodu z o pravý úhel v kladném smyslu, tj. proti směru hodinových ručiček. Přiřazení komplexně sdruženého čísla je symetrie podle osy reálných čísel: z = (a + i b) h-> (a — i b) = z,. □ Nyní jeden známý, ale velmi pěkný příklad. 1.56. Určete součet úhlů, které v rovině R2 svírají s osou x postupně vektory (1, 1), (2, 1) a (3, 1) Solution. Uvážíme-li rovinu R2 jakožto Gaussovu rovinu komplexních čísel, tak uvedené vektory odpovídají komplexním číslům 1 + i, 2 + i a 3 + i a máme najít součet jejich argumentů, tedy podle Moivrovy věty argument jejich součinu. Jejich součin je (1 + 0(2 + 0(3 + 0 = (1 + 30(3 + 0 = 10i, tedy ryze imaginární číslo s argumentem jt/2 a tedy hledaný součet je roven právě jt/2. □ 1.57. Napište obecnou rovnici přímky p : x = 2 — t, y = 1 + 3ř, t e R. Solution. Vektor (—1, 3) je směrovým vektorem přímky p. Proto vektor (3, 1) je jejím normálovým vektorem a obecná rovnice přímky p má tvar 3x + y + c = 0 pro jisté c e M. Tuto konstantu c určíme dosazením x = 2, y = 1 (přímka p prochází bodem [2,1] daným volbou t = 0). Získáváme tak c = — 1 a následně výsledek 3x + y — 1 = 0. 1.58. Je dána přímka p : [2,0] + ř(3,2), t e R. Určete její obecnou rovnici a nalezněte průnik s přímkou q : [-1,2] + 5(1,3), s e R. □ definovat sčítání "po složkách", tj. pro vektory u = (x, y) a v = (x', y) klademe u + v = (x + x' ,y + y'). Protože pro jednotlivé složky platí všechny vlastnosti komutativní grupy, evidentně budou tyto vlastnosti platit i pro naše nové sčítání vektorů. Zejména tedy máme tzv. nulový vektor 0 = (0, 0), jehož přičtením k jakémukoliv vektoru v dostaneme opět vektor v. Záměrně teď používáme tentýž symbol 0 pro vektor i jeho skalární složky — z kontextu je vždy jasné, jakou "nulu" máme kdy na mysli. Dále definujeme násobení vektorů a skalárů tak, že pro aelat) = (i,)i)el2 klademe a ■ v = (ax, ay). Zpravidla budeme znak • vynechávat a pouhé zřetězení znaků a v bude označovat skalární násobek vektoru. Přímo se ověří další vlastnosti pro násobení skaláry a, b a sčítání vektorů u, v, např. a (u + v) = a u+a v, (a+b)u = a u+bu, a(b u) = (ab)u, kde opět používáme stejný znak plus pro sčítání vektorů i skalárů. Tyto operace si můžeme dobře představit, jestliže uvažujeme vektory v jako šipky začínající v počátku 0 = [0, 0] a končící v bodě [x, y] v rovině, íga^ýy Takové šipky pak můžeme přikládat jednu za druhou a to přesně odpovídá sčítání vektorů. Násobení skalárem a pak odpovídá natažení dané šipky na a-násobek. LINEAKNl' &OM&INACE. Nyní můžeme udělat podstatný krok: jestliže si zapa-jj; - matujeme dva významné vektory e\ = (1, 0) a e2 = (0, 1), pak každý jiný vektor dostaneme jako u = (x, y) = x e\ + y e2. Výrazu napravo říkáme lineární kombinace vektoru e\ a e2. Dvojici vektorů e = (e\, e2) říkáme báze vektorového prostom R2. Jestliže si ale vybereme jiné dva vektory u, v, které nejsou jeden násobek druhého, tj. jinou bázi v R2, budeme moci udělat totéž. Lineární kombinace w = x u + y v nám 28 CHAPTER 1. ROZCVIČKA pro všechny různé dvojice (x, y) dá právě všechny vektory w v rovině. Nakonec můžeme nahlížet vektory jako naše šipky v abstraktní poloze, tj. zapomeneme na ztotožnění bodů v rovině s dvojicemi čísel. Jenom budou naše šipky všechny "upoutány" v bodě 0, který i— je zároveň nulovým vektorem. Zůstanou nám operace sčítání a násobení skaláry a teprve volbou báze e\, e2 ztotožníme naši rovinu šipek s R2. 1.24. Afinní rovina. Když si pevně vyvolíme nějaký vektor u e R2, můžeme jej přičítat (tj. coby šipku přikládat) k libovolnému bodu P = [x, y]. Máme tak tedy s pevným vektorem definované posunutí, které každý bod roviny P zobrazí na P + u. ^ .P- Zkusme teď úplně zapomenout na souřadnice a vnímat celou rovinu jako množinu, na které fungují naše posunutí. Takovou množinu A = R2 si můžeme představit z pohledu pozorovatele, který sedí v některém pevně zvoleném místě (můžeme mu říkat třeba bod O = [x0, y$] e R2). Předpokládejme, že ji vnímá jako nekonečnou desku bez jakýchkoliv zvolených měřítek a popisů a jenom ví, co to znamená posunout se o libovolný násobek nějakého vektoru u e M2. Takové rovině budeme říkat "afinní rovina". Aby mohl vidět kolem sebe "dvojice reálných čísel", musí si vybrat nějaký bod E\, kterému řekne "bod [1, 0]" a jiný bod E2, kterému začne říkat "bod [0, 1]". Jinými slovy, zvolí si bázi e\ = (1, 0), e2 = (0, 1) mezi vektory posunutí. Do všech ostatních se pak dostane tak, že poskočí "a-krát ve směru e\" a pak "Ŕ-krát ve směru e2" a takovému bodu bude říkat "bod [a, b]". Pokud to bude dělat obvyklým způsobem, nebude výsledek záviset na pořadí, tzn. může také napřed jít b-kiát ve směru e2 a pak teprve ve směru e\. To, co jsme popsali, se nazývá volba {afinního) souřadného systému v rovině, bod O je jeho počátkem, a obecně každý bod P roviny je ztotožněn s dvojicí čísel [a,b], kterou také budeme psát jako posunutí P — O. Budeme dále pracovat v pevně zvolených souřadnicích, tj. s dvojicemi reálných čísel, ale pro lepší orientaci budeme Solution. Souřadnice bodů na přímce jsou dány dle daného parametrického zadání jako x = 2 + 3t a y = 0 + 2t. Vyloučením parametru t ze soustavy těchto dvou rovnic dostáváme obecnou rovnici přímky p: 2x - 3y - 4 = 0. Průnik s přímkou q získáme dosazením parametrického vyjádření bodů přímky q, tedy x = —1+sa.y = 2 + 3s, do obecné rovnice přímky p: 2(-l+5)- 3(2 + 3*)- 4 = 0, odkud s = —12/7 a dosazením do parametrického vyjádření přímky q dostáváme souřadnice průsečíku P: 19 22 P = [--,--]■ 7 7 □ 1.59. Stanovte průsečík přímek p : x + y - 4 = 0, q : x = -\+2t, y = 2 +t, t e R. Solution. Nejdříve poznamenejme, že směrovým vektorem přímky p jewp = (1,-1) (libovolný nenulový vektor kolmý k vektoru (1,1) z obecné rovnice přímky) a směrovým vektorem přímky q je uq = (2, 1). To, že vektor up není násobkem vektoru uq, pak zaručuje, že se přímky protínají (přímky nejsou rovnoběžné). Bod [x, y] je hledaným průsečíkem, právě když jeho souřadnice vyhovují rovnici přímky p a současně existuje reálné číslo t, pro které x = -1 + 2t, y = 2 + t. Dosadíme-li odsud do obecné rovnice p, obdržíme (-l+2ř)+ (2 + ř)-4 = 0. Této rovnici vyhovuje právě t = 1, což dává průsečík se souřadnicemi x = \,y = 3. □ 1.60. Najděte obecnou rovnici přímky p, jež prochází bodem [2,3] a je rovnoběžná s přímkou x — 3y + 2 = 0, a parametrickou rovnici přímky q procházející body [1, 3] a [—2, 1]. Solution. Každá přímka rovnoběžná s přímkou x — 3j+2 = 0je zadána rovnicí x - 3y + c = 0 pro nějaké ceM. Přímka p prochází bodem [2,3]. Musí tedy platit 2-3-3 + c = 0, tj. c = 7. Pro přímku q lze ihned uvést její parametrické vyjádření q : [1, 3] + t (1 - (-2), 3 - 1) = [1, 3] + t (3, 2), t e R. □ 29 E. GEOMETRIE V ROVINE 5. GEOMETRIE V ROVINE 1.61. Zjistěte, zda některé z přímek pi : 2x + 3y — 4 = 0, /?2 : x — y + 3 = 0, pj, : —2x + 2y = —6, p4 : -x - | y + 2 = 0, p5 : x = 2 + t, y = -2 - t, t e R (ne)jsou totožné. Solution. Je vidět, že -2 • {-x - | y + 2) = 2x + 3j - 4. Obecné rovnice pi a p4 tudíž zadávají stejnou přímku. Normálový vektorpřímky pije (2, 3), pro přímku p2je(l, —l),pro p3je(—2,2) a pro /?5 je (1, 1) (kolmý vektor k vektoru (1, —1)). Přímky p2 a pj, jsou rovnoběžné (normálový vektor jedné je násobkem normálového vektoru druhé). Další dvojice rovnoběžných přímek neexistují. Neboť soustava x - y + 3 = 0, -2x + 2y + 6 = 0 zjevně nemá řešení, přímky p\ a p4 tvoří jedinou dvojici totožných přímek. □ 1.62. Určete přímku p,která je kolmá k přímce q : 6x —Ty+13 = 0 a která prochází bodem [—6, 7]. Solution. Protože normálový vektor přímky q je směrový vektor přímky p, můžeme bezprostředně napsat výsledek p : x = -6 + 6ř, v = 7 - 7ř, řeR. □ 1.63. Udejte příklad čísel a, ieR, pro něž je vektor m normálovým vektorem přímky AS, je-li A = [1, 2], S = [2ŕ, b], u = (a — b, 3). Solution. Směrovým vektorem přímky AS je (2b — 1, b — 2) (tento vektor je vždy nenulový), a proto jejím normálovým vektorem je (2 — b, 2b — 1). Položíme-li 2-b = a-b, 2b-1=3, dostáváme a = b = 2. □ 1.64. Určete vzájemnou polohu přímek p, q v rovině, jestliže je p : 2x — j — 5 = 0, q : x + 2y — 5 = 0. Pokud se jedná o různoběžky, nalezněte souřadnice jejich průsečíku. Solution. Z obecných rovnic přímek p, q známe jejich normálové vektory (2, —1), (1, 2). Přímky jsou rovnoběžné právě tehdy, je-li normálový vektor jedné násobkem normálového vektoru druhé, což zřejmě pro přímky p, q splněno není. Jde tedy o různoběžky. Průsečík nalezneme vyřešením soustavy 2x - y - 5 = 0, x + 2y - 5 = 0. vektory zapisovat s kulatými závorkami místo hranatých u souřadnic bodů v afinní rovině. 1.25. Přímky v rovině. Když se náš pozorovatel umí posou-t- h „ vat o libovolný násobek pevného vektoru, pak také ví, «př~ffc> co je to přímka. XjijM; Je to podmnožina p c A v rovině taková, že ex-™tJ istují bod O a nenulový vektor v takové, že p = {P e A; P — O = t ■ v, t e R}. Popišme si P = P (t) e p ve zvolených souřadnicích s volbou v = (a, P): x(t) = x0 + a ■ t, y(t) = y0 + f} ■ t. Protože vektor v = (a, P) je nenulový, musí být aspoň jedno z čísel a, p různé od nuly. Když pro určitost předpokládáme, že třeba a pak vyloučíme t z parametrického vyjádření pro x ny a jednoduchým výpočtem dostaneme -Px + ay = -Px0 + ay0. To je obecná rovnice přímky (1.13) ax + by = c, se známým vztahem dvojice čísel (a,b) = (~p,a) a směrového vektoru přímky v = (a, P) (1.14) aa + bp=0. 30 CHAPTER 1. ROZCVIČKA Výraz nalevo v rovnici přímky (1.13) můžeme vidět jako skalární funkci F závislou na bodech v rovině a s hodnotami v M, samu rovnici pak jako požadavek na její hodnotu. Časem uvidíme, že vektor (a, b) je v tomto případě právě směrem, ve kterém F nejrychleji roste. Proto bude směr kolmý na (a, b) právě tím směrem, ve kterém zůstává naše funkce F konstantní. Konstanta c pak určuje, kterou ze všech rovnoběžných přímek rovnice určuje. Mějme nyní dvě přímky p a q a ptejme se po jejich průniku p n q. Ten bude popsán jako bod, splňující obě rovnice přímek současně. Pišme je takto ax + by = r (1-15) , , cx + a y = s. Opět můžeme levou stranu vnímat jako přiřazení, které každé dvojici souřadnic [x, y] bodů P v rovině přiřadí vektor hodnot dvou skalárních funkcí F\ a Fj_ daných levými stranami jednotlivých rovnic (1.15). Můžeme tedy naše rovnice napsat jako jediný vztah F (v) = w, kde F je přiřazení, které vektor v popisující polohu obecného bodu v rovině (v našich souřadnicích) zobrazí na vektor zadaný levou stranou rovnic, a požadujeme, aby se toto zobrazení strefilo do předem zadané hodnoty w = (r, s). 1.26. Lineární zobrazení a matice. Přiřazení F, se kterými jsme pracovali při popisu průniku přímek, mají jednu velice podstatnou společnou vlastnost: respektují operace sčítání a násobení s vektory a skaláry, tj. respektují lineární kombinace: F (a ■ v + b ■ w) = a ■ F (v) + b ■ F(w) pro všechny a, b e M, v, w e M2. Říkáme, že F je lineárni zobrazení z M2 do M2, a píšeme F : M2 -» M2. Slovy lze podmínku také vyjádřit tak, že lineární kombinace vektorů se zobrazuje na tutéž lineární kombinaci jejich obrazů, tj. lineární zobrazení jsou ta zobrazení, která zachovávají lineární kombinace. Se stejným chováním jsme se setkali i v rovnici (1.13) pro přímku, kde šlo o lineární zobrazení F : M2 -» M a jeho předepsanou hodnotu c. To je také důvodem, proč jsou hodnoty zobrazení z = F(x, y) na obrázku vyobrazeny jako rovina v M3. Stručně budeme zapisovat taková zobrazení pomocí tzv. matic a jejich násobení. Maticí rozumíme obdélníkové schéma skalárů, např. (a A nebo v = (X), c d) \y) hovoříme o (čtvercové) matici A a (sloupcovém) vektoru v. Jejich násobení definujeme takto: A ■ v (a b\ /x\ (ax + by\ c d j \yj \cx +dy) Když z první rovnice vyjádříme y = 2x — 5 a dosadíme za y do druhé, získáme x + 2(2x - 5) - 5 = 0, tj. x = 3. Poté snadno určíme y = 2- 3 — 5 = 1. Přímky se tak protínají v bodě [3, 1]. □ 1.65. Uvažujme rovinu M2 se standardní soustavou souřadnic. Z počátku [0, 0] je vyslán laserový paprsek ve směru (3, 1). Dopadne na zrcadlovou přímku p danou parametricky jako p : [4,3] + ř(-2, 1) a poté se odrazí (úhel dopadu je shodný s úhlem odrazu). V jakém bodě dopadne odražený paprsek na přímku q, danou parametricky jako q : [7,-10] +f (-1,6)? Solution. Směr paprsku svírá s přímkou p úhel 45°, odražený paprsek tedy bude kolmý na dopadající, jeho směrový vektor bude (1, —3) (Pozor na orientaci! Daný směrový vektor můžeme též získat například zrcadlením (osovou symetrií) podle kolmého vektoru k přímce p.) Paprsek dopadne v bodě [6, 2], odražený paprsek tedy bude mít rovnici [6, 2] +ř(l, -3), t > 0. Průnik přímky dané odraženým paprskem s přímkou q je bod [4, 8], což je mimo polopřímku, která je daná odraženým paprskem (ř = —2). Odražený paprsek tedy přímku q neprotne. □ Remark. Odraz paprsku v třírozměrném prostoru je studován v příkladu || 3.541|. 1.66. Z bodu [—2, 0] vyrazila v pravé poledne konstantní rychlostí 1 ms"1 ve směru (3, 2) úsečka délky 1. Rovněž v poledne vyrazila z bodu [5, —2] druhá úsečka délky 1 ve směru (— 1, 1), ovšem dvojnásobnou rychlostí. Srazí se? Solution. Přímky, po kterých se pohybují dané úsečky, můžeme popsat parametrickým vyjádřením: p : [-2,0] + r(3,2), q : [5, -2]+5(-l, 1). Obecná rovnice přímky p je 2x - 3y + 4 = 0. Dosazením parametrického vyjádření přímky q získáme průsečík P = [1,2]. 31 E. GEOMETRIE V ROVINE 5. GEOMETRIE V ROVINE Nyní se snažme zvolit jediný parametr t pro obě úsečky tak, aby nám odpovídající bod na přímkách p, resp. q, popisoval polohu počátku první, resp. druhé, úsečky v čase t. V čase 0 je první úsečka v bodě [—2, 0], druhá v bodě [5, —2]. Za čas t sekund urazí první úsečka t jednotek délky ve směru (3, 2) druhá pak 2t jednotek délky ve směru (—1, 1). Odpovídající parametrizace jsou tedy p : [-2,0] + -J=(3,2), V13 q : [5,-2]+ řV2(-l, 1). Počátek první úsečky dorazí do bodu [ 1, 2] v čase t\ = >/T3 s, počátek druhé úsečky v čase t = 2*Jl s, tedy více než o půl vteřiny dříve. Tedy v době, kdy dorazí do průsečíku P počátek první úsečky, bude již konec druhé úsečky pryč a úsečky se tak nesrazí. □ 1.67. Rovinný fotbalista vystřelí míč z bodu F = [1, 0] ve směru (3, 4) na bránu (úsečku) ohraničenou body A = [23, 36] a B = [26, 30]. Směřuje míč do brány? Solution. Vzhledem k tomu, že se situace odehrává v prvním kvadrantu, stačí uvažovat směrnice vektorů FA, (3,4), FB. Tvoří-li (v tomto pořadí) buďrostoucí nebo klesající posloupnost, míč směřuje na bránu. Tato posloupnost je 36/22, 4/3, 30/25, což je klesající posloupnost, míč tedy směřuje do brány. □ 1.68. Upravte (A — B)T ■ 2C ■ u, přičemž -(-°2 0- »=(-1 ?)• c=c -?)■ Solution. Dosazením —=(:í 0- ".')■ I.4) a násobením matic dostáváme □ 1.69. Uvedte příklad matic A a B, pro něž (a) (A + B) ■ (A-B) ^ A- A-B ■ B; (b) (A + B) ■ (A + B) ^ A ■ A + 2A ■ B + B ■ B. Solution. Připomeňme, že uvažujeme dvojrozměrné (čtvercové) matice A a B. Pro libovolné matice A a S ovšem platí (A + B) ■ (A - B) = A ■ A - A ■ B + B ■ A - B ■ B. Identitu (A + B) ■ (A - B) = A ■ A - B ■ B Podobně, můžeme místo vektoru v zprava násobit jinou maticí B stejného rozměru jako je A. Prostě aplikujeme předchozí formule po jednotlivých sloupcích matice B a obr-držíme jako výsledek opět čtvercovou matici. Neumíme násobit vektor v zprava maticí A protože nám nevychází počty skalárů na řádcích v s počty skalárů ve sloupcích A. Umíme však napsat vektor w do řádku skalárů (tzv. transponovaný vektor) wT = (ab) a ten zprava našimi maticemi A nebo vektory v již násobit umíme. Snadno ověříme tzv. asociativitu násobení (propočítejte pro obecné matice A, S a vektor v detailně): (A • B) ■ v = A ■ (B ■ v). Místo vektoru v můžeme samozřejmě psát i libovolnou matici C správného rozměru. Stejně snadno je vidět i distributivita A-(B + C) = A - B + A-C, neplatí však komutativita a existují "dělitelé nuly". Např. /O 1\ /O 0\ _ /O 1\ /O 0\ /O 1\ _ /O 0\ [p o)\o 1/ \0 °/'V° V V° 0/ ~ \0 O/- Zejména vidíme, že násobení vektorů pevnou maticí zadává linerání zobrazení, a naopak, pomocí hodnot lineárního zobrazení F na dvou pevných vektorech báze už dostaneme celé příslušné zobrazení. Body v rovině jsou tedy obecně vzory hodnot lineárních zobrazení F roviny do roviny, přímky jsou obecně vzory hodnot lineárních zobrazení z roviny do reálné přímky M. S maticemi a vektory umíme rovnice pro přímky a body psát w 'a b )(«) Samozřejmě, ve zvláštních situacích tomu tak být nemusí. Tak třeba průnikem dvou stejných přímek je opět sama přímka (a vzorem vhodné hodnoty pro takové lineární zobrazení bude celá přímka), nulové zobrazení má za vzor nuly celou rovinu. V prvém případě to poznáme tak, že jsou nalevo v rovnicích (1.15) stejné výrazy až na skalární násobek (nebo jinak řečeno, řádky matice A jsou stejné až na skalární násobek). V takovém případě buď nebude v průniku příslušných přímek žádný bod (rovnoběžné různé přímky) nebo tam budou všechny body přímky (stejné přímky). Tuto podmínku může vyjádřit tak, že poměry a/c nb/d musí být stejné, neboli (1.16) ad — bc = 0. Všimněme si, že toto vyjádření už zahrnuje i případy, kdy c nebo d je nulové. 32 CHAPTER 1. ROZCVIČKA 1.27. Determinant matice. Výrazu nalevo v (1.16) říkáme determinant matice A a píšeme pro něj det A ad — bc. Naši diskusi teď můžeme vyjádřit takto: Proposition. Determinant je skalární funkce det A definovaná na všech maticích A a rovnice A-v = u je jednoznačně řešitelná, právě když je det A / O. Zkuste promyslet, že pro tuto úvahu bylo podstatné, \\ že pracujeme s polem skalárů. Například nad celými čísly obecně neplatí. Když prostě spočteme řešení rovnic s celočíselnými koeficienty (tj. matice A má pouze celočíselné vstupy), tak toto řešení celočíselné být nemusí. 1.28. Afinní zobrazení. Podíváme se, jak maticová symbolika umožňuje pracovat s jednoduchými zobrazeními v afinní rovině. Viděli jsme, že ná-sobením maticí je dáno linerání zobrazení. Posunutí v afinní rovině M2 o pevný vektor t = (r, s) e M2 umíme v maticové formě také snadno zapsat: '-GH+-GK)-G:0- Jestliže k výsledku lineárního zobrazení ještě dovolíme přičíst pevný vektor t = (r, s), pak naše zobrazení bude mít tvar (;) h-» A ■ v + t (ax + by + r\ cx + dy + s j afinní zobrazení Takto jsou popsána právě všechna tzv. roviny do sebe. Taková zobrazení nám umožní přepočítávání souřadnic vzniklých různými volbami počátků a bází směrů pro posunutí. Co se stane, když náš pozorovatel z odstavce 1.23 bude tutéž rovinu shlížet z jiného bodu nebo si aspoň vybere jiné body Ei, £2? Zkuste si promyslet, že na úrovni souřadnic to skutečně bude právě změna realizovaná pomocí afinního zobrazení. Časem budeme vidět obecné důvody, proč tomu tak je ve všech dimenzích. tak dostaneme, právě když je —A-B + B-A nulovou maticí, tj. právě když matice A a. B komutují. Příkladem hledaných matic jsou tedy právě ty dvojice matic, které nekomutují (matice součinu se při záměně pořadí násobených matic změní). Můžeme např. zvolit B GO- (13 20\ V5 %) -G 0- neboť při této volbě je A-s = (2o 13)' BA Analogicky pro každou dvojici matic A, B platí (A + B)-(A + B) = A-A + A-B + B- A + B-B. To znamená, že (A + B)-(A + B) = A-A + A-B + A-B + B-B je splněno tehdy a jenom tehdy, když A ■ B = B ■ A. Ve druhém případě jsou tak hledané dvojice matic A, B zcela totožné s případem prvním. □ R2 -» R2 zadaná 1.70. Rozhodněte, zda jsou zobrazení F, G přiřazeními F cm lx - 3y -2x + 5y 2x + 2y - 4 4x - 9y + 3 ) x,ys lineární. Solution. Pro libovolný vektor (x, y)T můžeme vyjádřit '((•)) (, Od- <-(0) G i) GMi4) Odtud vyplývá, že obě zobrazení jsou afinní. Připomeňme, že afinní zobrazení je lineární, právě když se nulový vektor zobrazí sám na sebe. Neboť (OH)- «(©)-(?)■ zobrazení F je lineární, zobrazení G nikoli. □ 1.71. Buď dán pravidelný šestiúhelník ABCDEF (vrcholy jsou označeny poradě v kladném smyslu) se středem v bodě S = [1,0] a vrcholem A = [0, 2]. Určete souřadnice vrcholu C. Solution. Souřadnice vrcholu C získáme otočením bodu A okolo středu S šestiúhelníka o 120° v kladném smyslu: C ^cos(120°) 1 sin(120°) - sin(120 cos(120 ľ) (A S) + S 3 + [1,0] = [--73,-1 2 33 E. GEOMETRIE V ROVINE 5. GEOMETRIE V ROVINE □ 1.72. Určete úhel, který svírají vektory (a) u = (-3, -2), v = (-2, 3); (b) u = (2,6), v = (-3, -9). Solution. Hledaný úhel

2 u\ + U2, U = (U\, U2) € obdržíme výsledky \AB\ = \\A -B\ \BC\ = \\B -C| \AC\ = \\A -C| 1.29. Euklidovská rovina. Přidejme nyní schopnost našeho pozorovatele vidět vzdálenosti. Např. může věřit obvyklému vzorci pro velikost vektoru v = (a, b) Ml Ve? + b2 v jím zvolených afinních souřadnicích. Okamžitě pak můžeme definovat pojmy jako jsou úhel a otočení v rovině. Jednoduše si to můžeme představit takto: náš člověk j^gí, se rozhodne o nějakých bodech E\ a E2, že ^ĚíÝ/ jsou od něj ve vzdálenosti jedna, a zároveň si jfer řekne, že jsou na sebe kolmé. Vzdálenosti ve směrech souřadných os pak jsou dány příslušným poměrem, obecně používá Euklidovu (nebo Pythagorovu) větu. Odtud vyjde právě výše uvedený vzorec. ÉUtíLIPOt/SKr/ l/ZPrti-ENOST Náš pozorovatel roviny může samozřejmě postupovat i jinak. Může použít nějaký standard pro skutečné měření vzdálenosti bodů P a Q v rovině a říci, že to je právě velikost vektoru Q — P, který potřebujeme na posunutí z f do Q. Pak si vybere nějaký z vektorů, které skutečně mají velikost 1 a třeba pomocí trojúhelníku o stranách s velikostmi 3, 4 a 5 zkonstruuje kolmý vektor o velikosti jedna a dále pokračuje jako výše. Euklidovská rovina je afinní rovina s výše zavedeným pojmem vzdálenosti. 1.30. Uhel vektorů. Jak jsme již používali při diskusi komplexních čísel coby bodů v rovině, tzv. gonio-_ metrická funkce cos

+ \], [1 - §V3, V3 + §]. □ 1.77. Najděte matice A takové, že a -ř) Nápověda: jaké geometrické zobrazení v rovině zadává matice A2? Solution. A2 je matice rotace o 60° v kladném smyslu, takže hledané matice jsou /vi ni 2 vi 2 ) tj. jsou to matice rotace o 30°, resp. o 210°. □ (;) - C •)• K)- kde cp e 1.78. Stanovte A • A pro _ /cos cp — sin cp1 ysin

)(-! 0" Inverzní matici je v tomto případě jednoduché najít, protože vektory ve sloupcích jsou kolmé, tj. matice je (skoro) ortogonální. Máme co- Vynásobením příslušných matic dostaneme výsledek výsledek se dá uhádnout i přímo z obrázku. Tento □ 1.80. Zjistěte, jaká lineární zobrazení M2 do M2 jsou zadána maticemi (tj. popište jejich geometrický význam) Solution. Nechť (x, y)T je nadále libovolný reálný vektor. Pro matici A\ dostáváme což znamená, že lineární zobrazení, které tato matice zadává, je (kolmá) projekce na osu x. Podobně vidíme, že matice A2 určuje zrcadlení vzhledem k ose y, protože (:)••(..■•)(:) (:)• Matici A3 lze vyjádřit ve tvaru / cos cp — sin cp \ ysin

i; W w \-> Rý • (v — w) h» ■ (v — w) + w (cos ý(x — wx) — sin ý(y — Wy sin ý(x — Wx) + cos ý(y ~ Wy)) ) + wx \ )) + Wy) 1.32. Zrcadlení. Dalším dobře známým příkladem zobrazení, která zachovávají velikosti, je tzv. zrcadlení vzhledem k přímce. Opět nám bude . ..... stačit popsat zrcadlení vzhledem k přímkám j<%^ procházejícím počátkem O a ostatní se z nich odvodí pomocí posunutí, resp. rotací. Hledejme tedy matici zrcadlení vzhledem k přímce s jednotkovým směrovým vektorem v svírajícím úhel ý s vektorem (1,0). Nejprve si uvědomme, že Z0 C -°0 Obecně můžeme každou přímku otočit do směru vektoru (1,0) a tedy zapsat obecnou matici zrcadlení jako Z f = R ý ■ Zq • R-ý, kdy nejprve otočíme maticí přímku do "nulové" polohy, odzrcadlíme matici Zo a vrátíme zpět otočením R f. Můžeme proto (díky asociativitě násobení matic) spočíst: 2 — (cos ^ ~ sin ^ ysini/^ cosi/r (cos ý sin ý sin ý — cos (cos2 ý — sin2 ý 2 sin ý cos ý (cos2i/^ sin2i/^ sin 21/f — cos2i/r, Použili jsme přitom obvyklé součtové vzorce pro goniometrické funkce. Povšimněme si také, že Z^ • Z0 je dáno: A /l 0 \ / cosi/r siní/A y yO — \j \— sin ^ cosý) )( cos sin i/r \ y— sin i/r cos i/r y 2 sin ý cos i/f \ (cos2 ý — sin2 VO / ^cos2i/f sin 2^ isin2i/f — cos 2^ )Co -°0-C cos 2^ —sin 2^ sin 21/f cos 2^ ) Solution. Rozepsáním obou stran do souřadnic m = («i, w2), 11 = (t>i, U2) obdržíme: 2(||M||2 + ||u||2) = 2(u\ + + v\ + ^f) = u\-\- 2u\V\ + u2 + + 2u2v2 + u|+ -\- u\ — 2u\V\ -\- v\ -\- u\ — 2u2v2 + u| = («1 + t>l)2 + («2 + ť2)2 + («1 - Vi)2 + (u2 - V2)2 = \\u+v\\2 + \\u-vf. □ 1.82. Ukažte, že složením lichého počtu středových souměrností v rovině dostaneme opět středovou symetrii. Solution. Středovou souměrnost v rovině se středem 5 reprezentujme předpisem X 1-» S — (X — S), neboli X 1-» 25 — X. (Obraz bodu X ve středové symetrii podle středu 5 dostaneme tak, že k souřadnicím bodu 5 přičteme souřadnice vektoru opačného k vektoru X — 5.) Postupnou aplikací tří středových souměrností se středy 5, T a U tak dostáváme X h» 25 - X h» 2T - (25 - X) h» 2U - (2T - (25 - X)) = 2(U — T + S) — X, celkem X h» 2(U - T + 5) - X, což je středová souměrnost se středem 5 — T + U. Složení libovolného lichého počtu středových souměrností tak postupně redukujeme až na složení tří středových souměrností, jde tedy o středovou symetrii (v principu se jedná o důkaz matematickou indukcí, zkuste si jej sami zformulovat). □ 1.83. Sestrojte (2n + l)-úhelník, jsou-li dány všechny středy jeho stran. Solution. K řešení využijeme toho, že složením lichého počtu středových souměrností je opět středová souměrnost (viz předchozí příklad). Označme vrcholy hledaného (2n + 1)-úhelníka po řadě A\, A2, ..., A2n+i a středy stran (počínaje středem strany A\A2) postupně 5i, 52, ... S2n+i. Provedeme-li středové souměrnosti po řadě podle těchto středů, tak bod A\ je zjevně pevným bodem výsledné středové souměrnost, tedy jejím středem. K jeho nalezení tedy stačí provést uvedenou středovou souměrnost s libovolným bodem X roviny. Bod A\ leží pak ve středu úsečky XX', kde X' je obrazem bodu X ve zmíněné středové symetrii. Další vrcholy A2, ..., A2n+i získáme zobrazováním bodu A1 ve středových souměrnostech podle 5i, ..., 52«+i- □ Toto pozorování lze zakreslit a zformulovat následovně 1.84. Určete obsah trojúhelníku ABC, je-li A [-2,0], C = [5,9]. [-8,1], B 37 E. GEOMETRIE V ROVINE 5. GEOMETRIE V ROVINE Solution. Vime, že obsah je roven polovině determinantu matice, jejíž první sloupec je dán vektorem B—Au druhý sloupec vektorem C —A, tj. determinantu matice -8) 5 9 Jednoduchý výpočet tak dává výsledek /-2-(-8) 5-(-8)\ V 0- 1 9-1 / i ((_2 - (-8)) • (9 - 1) - (5 - (-8)) • (0 - 1)) = f. Dodejme, že při záměně pořadí vektoru by hodnota determinantu měla opačné znaménko (její absolutní hodnota by tedy zůstala stejná) a že by se vůbec nezměnila, kdybychom vektory (při zachování pořadí) napsali do řádků. □ 1.85. Spočtěte obsah S čtyřúhelníku vymezeného jeho vrcholy [1, 1], [6, 1], [11,4], [2,4]. Solution. Nejprve si označme vrcholy (proti směru pohybu hodinových ručiček) A = [1,1], B = [6, 1], C = [11,4], D = [2, 4]. Pokud rozdělíme čtyřúhelník ABC D na trojúhelníky ABC a ACD, můžeme získat jeho obsah jako součet obsahů těchto trojúhelníků, a to vyčíslením determinantů i - ii 4 - 1 11 1 4- 1 - 1 1 5 10 0 3 10 1 3 3 kde ve sloupcích jsou postupně vektory B —A, C —A (pro d\) a C — A, D — A (pro d2). Potom £ _ dj_ _|_ di _ 5-3-10-0 _|_ 10-3-1-3 _ 15+27 _ ^\ ' 2 ~ 2 1 2 ~~ 2 (díky uspořádání vrcholů v kladném smyslu, vyšli všechny determinanty kladné). Správnost výsledku můžeme snadno potvrdit, neboť čtyřúhelník ABC D je lichoběžníkem se základnami délek 5, 9 a jejich vzdáleností v = 3. □ 1.86. Stanovte rozlohu louky, která je na pozemkové mapě ohraničena body o kótách [-7, 1], [-1,0], [29,0], [25, 1], [24,2] a [17, 5]. (Jednotky neuvažujte. Jsou určeny poměrem pozemkové mapy vůči skutečnosti.) Solution. Uvažovaný šestiúhelník můžeme rozdělit např. na čtyři trojúhelníky s vrcholy [-7, 1], [-1, 0], [17, 5]; [-1, 0], [24, 2], [17, 5]; [-1,0], [25, 1], [24, 2]; [-1, 0], [29, 0], [25, 1]. Jejich obsahy jsou po řadě 24, 89/2, 27/2 a 15, což dává výsledek 24 + 44 \ + 13 \ + 15 = 97. Proposition. Otočení o úhel ý obdržíme následným provedením dvou zrcadlení vzhledem ke směrům, které spolu svírají úhel j ý. Pokud umíme odůvodnit předchozí tvrzení ryze geo-\\ metrickou úvahou (zkuste si zahrát na "syntetického geometra"), dokázali jsme právě standardní vzorce pro goniometrické funkce dvojnásobného úhlu. Hlubší je následující rekapitulace předchozích úvah (skoro si můžeme říci, že už umíme dokázat skutečně zajímavý matematický výsledek): Zobrazení zachovávající velikosti j. 1.33. Theorem. Lineární zobrazení euklidovské roviny je složeno z jednoho nebo více zrcadlení, právě když je dáno maticí R splňující ab + cd = 0, 2 , 2 a + c b2 + d2 1. To nastane, právě když toto zobrazení zachovává velikosti. Otočením je takové zobrazení přitom právě tehdy, když je determinant matice R roven jedné, což odpovídá sudému počtu zrcadlení. Při lichém počtu zrcadlení je determinant roven —1. Proof. Zkusme napřed spočíst, jak může vypadat obecně matice A, když příslušné zo-«2Li.y/ brazení zachovává velikosti. Tj. máme zobrazení O(a b\ /x\ fax + by\ ^ \c d)' \y) = \cx+dy) • 38 CHAPTER 1. ROZCVIČKA Zachovaní velikosti tedy znamená, že pro všechna x a v je x2 +y2 = (ax + by)2 + (ex + cly)2 = (a2 + c2)x2 + (b2 + d2)y2 + 2(ab + cd)xy. Protože má tato rovnost platit pro všechna x a v, musí si být rovny koeficienty u jednotlivých mocnin x2, y2 a x v na pravé i levé straně. Tím jsme spočetli, že rovnosti kladené na matici R v prvním tvrzení dokazované věty jsou ekvivalentní vlastnosti, že příslušné zobrazení zachovává velikosti. Díky vztahu a2 + c2 = 1 můžeme předpokládat, že a = cos

, w) takto definovaného trojúhelníku A(i>, w), kde si pro určitost za P volíme počátek a posunutím se obsah stejně nemění. Ze zadání je vidět, že hledaná hodnota je polovinou plochy rovnoběžníku nataženého na vektory v a w a snadno se spočte (pomocí známého vzorečku: základna krát příslušná výška) nebo prostě vidí z obrázku, že nutně platí vol A(i> + v', w) = vol A(i>, w) + vol A(i/, w) vol A(av, w) = a vol A(v, w). obscik/\~ 1[z.oÍsaU£? UNEATJTA V AZ.GMEMU Stejné oh>&aktQ^- <*.+ b Nakonec ještě přidáme k našemu zadání požadavek vol A(v, w) = — vol A(w, v), který odpovídá představě, že opatříme plochu znaménkem podle toho, v jakém pořadí bereme vektory (tj. jestli se na ni díváme shora nebo zespodu). □ 1.87. Určete obsah trojúhelníka A2A3An, kde A0Ai ... Au jsou vrcholy pravidelného dvanáctiúhelníka vepsaného do kružnice 0 poloměru 1. Solution. Vrcholy dvanáctiúhelníka můžeme ztotožnit s dvanáctými odmocninami z čísla 1 v komplexní rovině. Zvolíme-li navíc Ao = 1, pak můžeme psát Ak = cos(2&7r/12) + i sin(2^7r/12). Pro vrcholy zkoumaného trojúhelníka máme: A2 = cos(7r/3) + i sin(7r/3) = 1/2 + /V3/2, A3 = cos(7r/2) + i sin(7r/2) = i, An = cos(—jt/6) + 1 sin(—7T/6) = V3/2 — i/2, neboli souřadnice těchto bodů v komplexní rovnině jsou A2 = [1/2, V3/2], A3 = [0, 1], Au = h/3/2,-5]. Podle vzorce pro obsah trojúhelníka je potom hledaný obsah S roven 3 - 73 1 A2 -An 1 2 A3 -An = '2 s/3 1 , s/3 2 2 2 s/3 2 Vzhledem ke kladnosti předchozího determinantu jsme mohli z estetických důvodů vynechat jeho absolutní hodnotu. □ 1.88. Které strany čtyřúhelníku zadaného vrcholy [—2, —2], [1, 4], [3, 3] a [2, 1] jsou viditelné z pozice bodu [3, n — 2]? Solution. Jedná se o modelovou úlohu na viditelnost stran konvexního mnohoúhelníku v rovině. V prvním kroku uspořádáme vrcholy tak, aby jejich pořadí odpovídalo směru proti pohybu hodinových ručiček. Když jako první vrchol zvolíme např. A = [—2, —2], je další pořadí B = [2, 1], C = [3, 3], D = [1, 4]. Uvažujme nejprve stranu AB. Ta společně s bodem X = [3, 7t — 2] zadává matici / -2-3 2-3 \-2 - (jv - 2) 1 - (tt - 2), tak, že její první sloupec je rozdílem A — X a druhý sloupec je B — X. To, zdaje vidět z bodu [3, 7t — 2], pak určuje znaménko determinantu -2-3 -2 - (tt - 2) 1 2-3 -(n-2) -5 -Tt ■1 ti -5 ■ (3 -tc) - (-ix-77-) < 0. Záporná hodnota znamená, že strana je vidět. Doplňme, že nezáleží na tom, zda uvažujeme rozdíly A — X a B — X, nebo X — A a X — B. Kdybychom však zaměnili pořadí sloupců, příslušná strana by byla vidět právě tehdy, když by byl determinant kladný. Pro stranu BC analogicky obdržíme 1 2-3 - (Tt - 2) 3-3 3 - (Tt - 2) -1 • (5 -Tt) -1 3-Tt 0 < 0. 0 5 — Tt Tato strana je tudíž vidět. Zbývají strany CD a DA. Pro ně dostáváme po řadě 39 E. GEOMETRIE V ROVINE 5. GEOMETRIE V ROVINE 3-3 1-3 3 - (jľ - 2) 4 - (jľ - 2) 0 -2 5 — 7T 6 — 7T 0 - (-2) • (5 — 77") > 0, 1 - 3 4 — (jt — 2) —2 — 3 -2 - (tt - 2) -2 6 — 7T -2- (-tt) - (-5) • (6-77-) > 0. Z bodu X jsou tedy vidět právě strany určené dvojicemi vrcholů [-2, -2], [2, 1] a [2, 1], [3, 3]. □ 1.89. Uvedte strany pětiúhelníku s vrcholy v bodech [—2, —2], [-2,2], [1,4], [3,1] a [2,-11/6], které je možné vidět z bodu [300, 1]. Solution. Pro zjednodušení zápisů „tradičně" položme A = [—2, —2], S = [2, —11/6], C = [3,1], Z) = [1,4], £" = [-2,2]. Strany BC a CD jsou zjevně z pozice bodu [300, 1] viditelné; naopak strany DE a £A být vidět nemohou. Pro stranu A B raději určeme -2 - 300 2 - 300 1 -302- (-^) - (-298) • (-3) < 0. Odsud plyne, že tato strana je z bodu [300, 1] vidět. □ B - P 1 7 C - P 5 7 A - P 5 5 B - P 7 7 C - P 5 7 A - P — 5 5 < 1.90. Viditelnost stran trojúhelníka. Je dán trojúhelník s vrcholy A = [5, 6], B = [7, 8], C = [5, 8]. Určete, které jeho strany je vidět z bodu P = [0, 1]. Solution. Uspořádáme vrcholy v kladném smyslu, tedy proti směru hodinových ručiček: [5, 6], [7, 8], [5, 8]. Pomocí příslušných determinantů určíme, je-li bod [0, 1] "nalevo" či "napravo" od jednotlivých stran trojúhelníka uvažovaných jako orientované úsečky, > 0, 0. Z nulovosti posledního determinantu vidíme, že body [0, 1], [5, 6] a [7, 8] leží na přímce, stranu AB tedy nevidíme. Stranu BC rovněž tak nevidíme, na rozdíl od strany AC, pro kterou je příslušný determinant záporný. □ 1.91. Určete, které strany čtyřúhelníka s vrcholy A = [95, 99], B = [130, 106], C = [40, 60], D = [130, 120]. jsou viditelné z bodu [2, 0]. Solution. Nejprve je třeba určit strany čtyřúhelníka ("správné" pořadí vrcholů): ACBD. Po spočítání příslušných determinantů jako v předchozích příkladech zjistíme, že je vidět pouze strana CB. □ Pokud vektory v a w napíšeme do sloupců matice A, pak A = (v, w) i—> det A splňuje všechny tři naše požadavky. Kolik takových zobrazení ale může být? Každý vektor umíme vyjádřit pomocí dvou bázových vektorů e\ = (1,0) a «2 = (0, 1) a díky linearitě je tedy každá možnost pro vol A jednoznačně určena už vyčíslením na těchto vektorech. Protože ale pro obsah, stejně jako pro determinant, je zjevně vol A (e\, e{) = vol A(e2, e2) = 0 (kvůli požadované antisymetrii), je nutně každá taková skalární funkce jednoznačně zadána hodnotou na jediné dvojici argumentů (e\, e2). Jsou si tedy všechny možnosti rovny až na skalární násobek. Ten umíme určit požadavkem 1 vol A( R}, kde (/ ~ g), pokud /(O) = g(0). ii) M = {/ : R -> R}, kde (/ ~ g), pokud /(O) = g(l). iii) M je množina přímek v rovině, přičemž dvě přímky jsou v relaci, jestliže se neprotínají. iv) M je množina přímek v rovině, přičemž dvě přímky jsou v relaci, jestliže jsou rovnoběžné. v) M = N, kde (m ~ n), pokud S(m) + S(n) = 20, přičemž S(n) značí ciferný součet čísla n. vi) M = N, kde (m ~ n), pokud C(m) = C(n), kde C(n) = S(n), pokud je ciferný součet S(n) menší než 10, jinak definujeme C(n) = C(S(n)) (je tedy vždy C(n) < 10). Solution. i) Ano. Ověříme tři vlastnosti ekvivalence: i) Reflexivita: pro libovolnou reálnou funkci / je /(O) = /(O). ii) Symetrie: jestliže platí /(O) = g(0), pak i g(0) = f(0). iii) Tranzitivita: jestliže platí /(O) = g(0) ag(0) = h(0), pak platí i /(O) = h(0). ii) Ne. Definovaná relace není reflexivní, např pro funkci sin máme sin 0 ^ sin 1 a není ani tranzitivní. iii) Ne. Relace opět není reflexivní (každá přímka protíná sama sebe) ani tranzitivní. iv) Ano. Třídy ekvivalence pak tvoří množinu neorientovaných směrů v rovině. v) Ne. Relace není reflexivní. 5(1) + 5(1) = 2. vi) Ano. □ 1.93. Máme množinu {3,4,5,6,7}. Napište explicitně relaci i) a dělí b ii) a dělí b nebo b dělí a iii) a a b jsou soudělná 1.94. Nechť je na R2 definována relace R tak, že ((a, b), (c, d)) e R pro libovolná a, b, c, d e R, právě když b = d. Zjistěte, zda se jedná o relaci ekvivalence. Pokud jde o relaci ekvivalence, popište geometricky rozklad, který určuje. 41 F. ZOBRAZENÍ A RELACE 6. RELACE A ZOBRAZENÍ Solution. Z ((a, b), (a, b)) e R pro všechna a, b e M plyne, že relace je reflexivní. Stejně snadno vidíme, že relace je symetrická, neboť v rovnosti (druhých složek) můžeme zaměnit levou a pravou stranu. Je-li ((a, b), (c, d)) e R a ((c, d), (e, /)) e R, tj. platí-li b = d a d = f, lehce dostáváme splnění tranzitivní podmínky ((a, b), (e, /)) e R, tj. b = f. Relace R je relací ekvivalence, kdy body roviny jsou spolu v relaci, právě když mají stejnou druhou souřadnici (přímka jimi zadaná je kolmá na osu y). Příslušný rozklad proto rozdělí rovinu na přímky rovnoběžné s osou x. □ 1.95. Určete, kolik různých binárních relací lze zavést mezi množinou X a množinou všech jejích podmnožin, má-li množina X právě 3 prvky. Solution. Nejprve si uvědomme, že množina všech podmnožin X má 23 = 8 prvků, a tudíž její kartézský součin s množinou X má 8 • 3 = 24 prvků. Uvažovanými binárními relacemi jsou právě podmnožiny tohoto kartézského součinu, kterých je celkem 224. □ 1.96. Uvedte definiční obor D a obor hodnot I relace R = {(a, v), (b, x), (c, x), (c, u), (d, v), (/, y)} mezi množinami A = {a, b, c, d, e, f) a B = {x, y, u, v, w}. Je relace R zobrazení? Solution. Přímo z definice definičního oboru a oboru hodnot relace dostáváme D = {a, b, c, d, f} C A, I = {x, y,u, v} C B. Nejedná se o zobrazení, protože (c, x), (c, u) e i?, tj. c e D má dva obrazy. □ 1.97. O každé z následujících relací na množině {a, b, c, d} rozhodněte, zda se jedná o relaci uspořádání (příp. zda se jedná o úplné uspořádání): Ra = {(a, a), (b, b), (c, c), (d, d), (b, a), (b, c), (b, d)}, Rh = {(a, a), (b, b), (c, c), (d, d), (d, a), (a, d)}, Rc = {(a, a), (b, b), (c, c), (d, d), (a, b), (b, c), (b, d)}, Rd = {(a, a), (b, b), (c, c), (a, b), (a, c), (a, d), (b, c), (b, d), (c, d)}, Re = {(a, a), (b, b), (c, c), (d, d), (a, b), (a, c), (a, d), (b, c), (b, d), (c,d)}. Vyjádření zobrazení / : A —> B jakožto relace /cAxS, f = {(a, f (a)); a e A} známe také pod názvem graf zobrazení f. 9 1.37. Skládám relací a funkcí. U zobrazení je jasná koncepce, jak se skládají. Máme-li dvě zobrazení / : A -> B a g : B -> C, pak jejich složení g o f : A -> C je definováno (g o f)(a) = g(f(a)). Ve značení používaném pro relace totéž můžeme zapsat jako /cAxS, f = {(a, f (a)); a e A} g^BxC, g = {(b, g(b))\ b e B} gof^AxC, gof = {(a,g(f(a)))-aeA}. Zcela obdobně definujeme skládání relací, v předchozích vztazích jen doplníme existenční kvantifikátory, tj. musíme uvažovat všechny "vzory" a všechny "obrazy". Uvažme relace "M/t^ims^- ficAxS.KfixC. Potom So R c A x C, S o R = {(a, c); 3b e B, (a, b) e R, (b, c) e 5}. Zvláštním případem relace je identické zobrazení Solution. Ra je uspořádání, které není úplné (např. (a, c) £ Ra ani (c, a) £ Ra). Relace Rh není antisymetrická (je totiž (a, d) e Rh i (d, a) e Rh), a tudíž se nejedná o uspořádání (jde o ekvivalenci). id, {(a, a) s A x A; a e A} na množině A. Je neutrální vzhledem ke skládání s každou relací s definičním oborem nebo oborem hodnot A. 42 CHAPTER 1. ROZCVIČKA Pro každou relaci i? c A x S definujeme inverzní relaci R-1 = {(b, a); (a, b) € R} C B x A. Pozor, u zobrazení, je stejný pojem užíván ve specifičtější situaci. Samozřejmě, že existuje pro každé zobrazení jeho invezní relace, ta však nemusí být zobrazením. Zcela logicky proto hovoříme o existenci inverzního zobrazení, pokud každý prvek b e B je obrazem pro právě jeden vzor v A. V takovém případě je samozřejmě inverzní zobrazení právě inverzní relací. Všimněme si, že složením zobrazení a jeho inverzního zobrazení (pokud obě existují) vždy vznikne identické obražení, u obecných relací tomu tak být nemusí. 1.38. Relace na množině. V případě A = B hovoříme o relaci na množině A. Říkáme, že relace i? je: • reflexivní, pokud idA c R, tj. (a, a) e R pro všechny a e A, • symetrická, pokud R~l = i?, tj. pokud (a,b) e R, pak i (b, a) e R, • antisymetrická, pokud R~l ľ\R c idA, tj. pokud (a, b) e R a zároveň (b, a) e R, pak a = b, • tranzitivní, pokud R o R c i?, tj. pokud z (a, b) e R a (b, c) e R vyplývá i (a, c) e R. Relace se nazývá ekvivalence, pokud je současně reflex- Z, f((x, y)) = x + y - 10x2; (b) / : N N x N, f (x) = (2x, x2 + 10). 43 F. ZOBRAZENÍ A RELACE 6. RELACE A ZOBRAZENÍ Solution. Hledaný počet určíme tak, že od počtu všech zobrazení odečteme ta, která nejsou surjektivní, to jest ta, jejichž obor hodnot je buď jednoprvkovou nebo dvouprvkovou množinou. Všech zobrazení je y (3, 4) = 34, zobrazení, jejichž oborem hodnot je jednoprvková množina, jsou tři. Počet zobrazení, jejichž oborem hodnot je dvouprvková množina, je (j)(24 — 2) ((3) způsoby můžeme vybrat obor hodnot a máme-li již dva prvky fixovány, máme 24 — 2 možností, jak na ně zobrazit čtyři prvky). Celkem je tedy počet hledaných sur-jektivních zobrazení (1.3) Q (24 - 2) - 3 = 36. □ 1.102. Hasseův diagram uspořádání. Hasseův diagram daného uspořádání < na rc-prvkové množině M je diagram s n vrcholy (každý vrchol odpovídá právě jednomu prvku množiny), přičemž dva vrcholy (prvky) a, b jsou spojeny (víceméně svislou) čarou (tak, že a je "dole" a b "nahoře"), právě když b pokrývá a, tj. a < b a neexistuje c e M tak, ze a < c a c < b. 1.103. Určete počet relací uspořádání na čtyřprvkové množině. Solution. Postupně projdeme všechny možné Hasseovy diagramy uspořádání na nějaké čtyřprvkové množině M a spočítáme, kolik různých uspořádání (tj. podmnožin množiny M x M) má daný Hasseův diagram, viz obr.: • * • # # U •A •V í N ¥- K M 6 v. b ¥ V Y * K <> % i Hl Celkem tedy je 219 uspořádání na čtyřprvkové množině. □ 1.104. Určete počet relací uspořádání množiny {1, 2, 3, 4, 5} takových, že právě dvě dvojice prvků jsou nesrovnatelné. 1.105. Vypište všechny relace na dvouprvkové množině {1,2}, jež současně nejsou reflexivní, jsou symetrické a nejsou tranzitivní. Solution. Reflexní relace jsou právě ty, které obsahují obě dvojice (1, 1), (2, 2). Tím jsme vyloučili relace {(1,1), (2, 2)}, {(1,1), (2, 2), (1,2)}, {(1,1), (2, 2), (2,1)}, {(1,1), (2, 2), (1,2), (2, 1)}. Zbývající relace, které jsou symetrické a nejsou tranzitivní, musejí obsahovat (1, 2), (2, 1). Pokud taková relace obsahuje jednu z těchto dvou uspořádaných dvojic, musí obsahovat rovněž druhou (podmínka Zde je dobré si uvědomit, že relace <, tj. "býti ostře menší než", mezi reálnými (racionálními, celými, přirozenými) čísly není relace uspořádání, protože není reflexivní. Dobrým příkladem uspořádání je inkluze. Uvažme množinu 2A všech podmnožin konečné množiny A (značení je speciálním případem obvyklé notace BA pro množinu všech zobrazení množiny A do množiny B; prvky množiny 2A jsou tedy zobrazení A -» {0, 1}, které "říkají", zda určitý prvek je či není v dané podmnožině). Na množině 2A máme relaci c danou vlastností "být podmnožinou". Je tedy X c Z právě, když je X podmnožinou v Z. Evidentně jsou přitom splněny všechny tři vlastnosti pro uspořádání: skutečně, je-li X c Y a zároveň Y c X musí být nutně množiny X a Y stejné. Je-li X c Y c Z je také X c Z a také reflexivita je zřejmá. Říkáme, že uspořádání < na množině A je úplné, když pro každé dva prvky a, b e A platí, že jsou srovnatelné, tj. buď a < b nebo b < a. Všimněme si, že ne všechny dvojice (X, Y) podmnožin v A jsou srovnatelné v tomto smyslu. Přesněji, pokud je v A více než jeden prvek, existují podmnožiny X a.Y, kdy není ani X c Y ani Y c X. Připomeňme rekurentní definici přirozených čísel N = {0, 1,2,3, ...}, kde 0 = 0, « + 1 = {0,1,2, ,n Na této množině N definujeme relaci < následovně: m < n, právě když m e n nebo m = n. Evidentně jde o úplné uspořádání. Např. 2 < 4, protože 2 = {0, {0}} s {0, {0}, {0, {0}}, {0, {0}, {0, {0}}}} = 4. Jinak řečeno, samotná rekurentní definice zadává vztah n < n + 1 a tranzitivně pak n < k pro všechna k, která jsou tímto postupem definována později. 1.39. Rozklad podle ekvivalence. Každá ekvivalence R na množině A zadává zároveň rozklad množiny m, A na podmnožiny vzájemně ekvivalentních prvků, tzv. třídy ekvivalence. Pro libovolné a e A uvažujeme třídu (množinu) prvků, které jsou ekvivalentní s prvkem a, tj. {b € A; (a,b) e R}. Často budeme psát pro Ra prostě [a], je-li z kontextu zřejmé, o kterou ekvivalenci jde. Zjevně Ra = Rh, právě když (a, b) e R a každá taková třída ekvivalence je tedy reprezentována kterýmkoli v svým prvkem, tzv. reprezentantem. Zároveň Ra n Rh ^ 0, právě když Ra = Rh, tj. třídy ekvivalence jsou po dvou disjunktní. Konečně, A = UaeARa, tj. celá množina A se skutečně rozloží na jednotlivé třídy. Můžeme také třídám rozkladu rozumět tak, že třídu [a] vnímáme jako prvek a "až na ekvivalenci". 44 CHAPTER 1. ROZCVIČKA Konstrukce celých a racionálních čísel. Na přirozených číslech umíme sice sčítat a víme, že přičtením nuly se číslo nezmění. Umíme i definovat odečítání, při něm ale jen někdy existuje výsledek v množině N. Základní ideou konstrukce celých čísel z přirozených je tedy přidat k nim chybějící rozdíly. To můžeme udělat tak, že místo výsledku odečítání budeme pracovat s uspořádanými dvojicemi čísel, které nám samozřejmě vždy výsledek dobře reprezentují. Zbývá jen dobře definovat, kdy jsou (z hlediska výsledku odečítání) takové dvojice ekvivalentní. Potřebný vztah tedy je: (a,b)~ (a',b') a+b' = a'+b. Všimněme si, že zatímco výrazy v prostřední rovnosti v přirozených číslech neumíme, výrazy vpravo už ano. Snadno ověříme, že skutečně jde o ekvivalenci a její třídy označíme jako celá čísla Z. Na nich definujeme operaci sčítání (a s ní i odečítání) pomocí reprezentantů. Např. [(a,b)] + [(c,d)] = [(a + c,b + d)], což zjevně nezávisí na výběru reprezentantů. Lze si přitom vždy volit reprezentanty (a, 0) pro kladná čísla a reprezentanty (0, a) pro čísla záporná, se kterými se nám bude patrně počítat nejlépe. Tento jednoduchý příklad ukazuje, jak důležité je umět nahlížet na třídy ekvivalence jako na celistvý objekt a soustředit se na vlastnosti těchto objektů, nikoliv formální popisy jejich konstrukcí. Ty jsou však důležité k ověření, že takové objekty vůbec existují. U celých čísel nám už platí všechny vlastnosti skalárů (KG1)-(KG4) a (01)-(04), viz odstavce 1.1 a 1.3. Pro násobení je neutrálním prvkem jednička, ale pro žádné číslo a různé od nuly a jedničky neumíme najít číslo a~l s vlastností a ■ a~l = 1, tzn. chybí nám inverzní prvky pro násobení. Zároveň si povšimněme, že platí vlastnost oboru integrity (Ol), viz 1.3, tzn. je-li součin dvou čísel nulový, musí být alespoň jedno z nich nula. Díky poslední jmenované vlastnosti můžeme zkonstruovat racionální čísla Q přidáním všech chybějících inverzí zcela obdobným způsobem, jak jsme konstruovali Z z množiny N. Na množině uspořádaných dvojic (p,q),q ^ 0, celých čísel definujeme relaci ~ tak, jak očekáváme, že se mají chovat podíly p Iq: (p,q)~(p',4) p/q = p' 14 p-q = p - q. Opět neumíme očekávané chování v prostřední rovnosti v množině Z formulovat, nicméně rovnost na pravé straně ano. Zjevně jde o dobře definovanou relaci ekvivalence (ověřte podrobnosti!) a racionální čísla jsou pak její třídy ekvivalence. Když budeme formálně psát p/q místo dvojic (p, q), budeme definovat operace násobení a sčítání právě pomocí formulí, které nám jsou jistě dobře známy. symetrie). Kdyby neobsahovala ani jednu z těchto dvou uspořádaných dvojic, pak by očividně byla tranzitivní. Z celkového počtu 16 relací na dvouprvkové množině jsme tak vybrali {(1,2), (2,1)}, {(1,2), (2,1), (1,1)}, {(1,2), (2,1), (2, 2)}. Je vidět, že každá z těchto 3 relací není reflexivní, je symetrická a není tranzitivní. □ 1.106. Určete počet relací ekvivalence na množině {1, 2, 3, 4}. Solution. Ekvivalence můžeme počítat podle toho, kolik prvků mají jejich třídy rozkladu. Pro počty prvků tříd rozkladu ekvivalencí na čtyřprvkové množině jsou tyto možnosti: Počty prvků ve třídách rozkladu počet ekvivalencí daného typu 1,1,1,1 1 2,1,1 © 2,2 3,1 (í) 4 1 Celkem tedy máme 15 různých ekvivalencí. □ Remark. Obecně počet tříd rozkladu n-prvkové množiny udává Bellovo číslo Bn+k, pro které lze odvodit rekurentní formuli n 1.107. Kolik existuje relací na rc-prvkové množině? Solution. Relace je libovolná podmnožina kartézského součinu množiny se sebou samou. Tento kartézský součin má n2 prvků, a je 2 tedy počet všech relací na n -prvkové množině 2" . □ 1.108. Kolik existuje reflexivních relací na rc-prvkové množině? Solution. Relace na množině M je reflexivní, právě když je diagonální relace AM = {(a, a), kde a e M} její podmnožinou. U zbylých «2—n uspořádaných dvojic v kartézském součinu M x M máme nezávislou volbu, jestli daná dvojice v dané relaci bude či ne. Celkem tedy máme 2 2" ~" různých reflexivních relací na n -prvkové množině. □ 1.109. Kolik existuje symetrických relací na rc-prvkové množině? Solution. Relace na množině M je symetrická, právě když je její průnik s každou množinou {(a,b), (b,á), kde a ^ b, a, b e M} buď celá daná dvouprvková množina, nebo je tento průnik prázdný. Dvouprvkových podmnožin množiny M je a pokud kromě průniků s těmito množinami ještě určíme průnik dané relace s diagonální relací AM = {(a, a), kde a e M}, je tímto daná relace jednoznačně určena. Celkem můžeme provést + n nezávislých voleb mezi dvěma alternativami: každá množina typu {(a, b), (b, á) \ kde a, b e M, a ^ 45 F. ZOBRAZENÍ A RELACE 6. RELACE A ZOBRAZENÍ b} je buď podmnožinou dané relace, nebo ani jeden z jejich prvků v dané relaci neleží a každá dvojice (a, a), a e M, potom také buď v relaci leží nebo ne. Celkem tedy máme 2^+n symetrických relací na n -prvkové množině. □ 1.110. Kolik existuje antisymetrických relací na rc-prvkové množině? Solution. Relace na množině M je antisymetrická, právě když její průnik s každou množinou {(a, b), (b, a)} a ^ b, a, b e M není dvo-jprvkový (jsou tedy tři možnosti jak průnik vypadá, buďje to množina {(a, b)}, nebo {(b, a)}, nebo je průnik prázdný). Průnik s diagonální relací pak může být libovolný. Určením těchto všech průniků je relace jednoznačně určena. Celkem máme 3® 2" antisymetrických relací na n -prvkové množině. □ V [?] jsme si zavedli zbytkové třídy a ukázali, že Zp je těleso pro libovolné prvočíslo p. Přesto se v tomto tělese vyskytují jevy, na které nejsme u reálných či komplexních čísel zvyklí: 1.111. Nenulový mnohočlen s nulovými hodnotami. Najděte nenulový mnohočlen jedné neznámé s koeficienty v Z7, tj. výraz typu a„x" + • • • + ci\x + oq, cii e Z7, a„ 7^ 0, takový, že na množině Z7 nabývá pouze nulových hodnot (tj. dosadíme-li za x libovolný z prvků Z7 a výraz v Z7 vyčíslíme, dostaneme vždy nulu). Solution. Při konstrukci tohoto mnohočlenu se opřeme o Malou Fer-matovu větu, která říká, že pro livovolné prvočíslo p a číslo a s ním nesoudělné platí: a"'1 = l(modp). Hledaný polynom je tedy například polynom x1 — x (polynom x6 — 1 by neměl nulovou hodnotu v čísle 0). □ 1.41. Zbytkové třídy. Jiným dobrým a jednoduchým přík-ladem jsou tzv. zbytkové třídy celých čísel. Pro -^Tff- pevně zvolené přirozené číslo k definujeme ek-vivalenci tak, že dvě čísla a, b e Z jsou xl4—- - ekvivalentní, jestliže jejich zbytek po dělení číslem k je stejný. Výslednou množinu tříd ekvivalence označujeme Z^. Nejjednodušší je tato procedura pro k = 2. To dostáváme Z2 = {0, 1}, kde nula reprezentuje sudá čísla, zatímco jednička čísla lichá. Opět lze snadno zjistit, že pomocí reprezentantů můžeme koerektně definovat násobení a sčítání na každém Z*. Theorem. Zbytkové třídy Z^ jsou komutativním tělesem skalárů (tj. splňují i vlastnost (P) z odstavce 1.3), právě když je k prvočíslo. Pokud k prvočíslem není, obsahuje Z vždy dělitele nuly, není proto ani obor integrity. Proof. Okamžitě je vidět druhé tvrzení — jestliže x ■ y = k pro přirozená čísla x, y, pak samozřejmě je výsledek násobení příslušných tříd [x] ■ [y] nulový. Naopak, jsou-li x a k nesoudělná, existují podle tzv. Be-zoutovy rovnosti, kterou dovodíme později (viz ??) přirozená čísla a a b splňující a x + b k = 1, což pro odpovídající třídy ekvivalence dává [a] ■ [x] + [0] = [a] ■ [x] = [1] a proto je [a] inverzním prvkem k [x]. □ 46 CHAPTER 1. ROZCVIČKA G. Doplňující příklady k celé kapitole 1.112. Nechť t a m jsou kladná celá čísla. Ukažte, že číslo ^ft je buďpřirozené, nebo není racionální. Solution. Ukažte, že pokud uvažovaná odmocnina není přirozená, pak není ani racionální. Pokud ^ft není přirozená, tak existuje prvočíslo r a přirozené s taková, že ŕ dělí t, ť+l nedělí t a m nedělí s (zápis ordr t = s) Předpokládejte, že ^ft = £, p, q e Z, neboli t ■ p" ordr R a jejich dělitelnost číslem m. (L značí levou stranu rovnice, ...) q"1. Uvažte ordr L a □ 1.113. Stanovte (2+3z)(l+/\/3) 1-/V3 Solution. Neboť absolutní hodnota součinu (podílu) dvou libovolných komplexních čísel je součin (podíl) jejich absolutních hodnot a každé komplexní číslo má stejnou absolutní hodnotu jako číslo s ním komplexně sdružené, platí (2+3q(l+iV3) 1-/V3 |2 + 3i| |1+íV3| |1-z\/3| |2 + 3i| = V22 + 32 □ 1.114. Číslo + 5i) ' zapište v co nejjednodušším tvaru. Solution. Úpravy jako postupné umocňování nebo rozvoj podle binomické věty jsou v tomto případě časově náročné. Při vyjádření 573 + 5i = lo(^ + |) = 10 (cos f + i sin f) užitím Moivreovy věty však snadno obdržíme (573 + 5i) 12 = 1012 (cos ^ + i sin = 1012. □ 1.115. Vyjádřete zi + Z2, Z\ ■ Z2, l\, IZ2I, f^, pro a) zi = 1 - 2/, z2 = 4/ - 3 b) zi =2,Z2 = i 1.116. Uvedte vzdálenost d čísel z, ž v komplexní rovině, je-li - = _ • 3 1 2 1 2" Solution. Není obtížné si uvědomit, že komplexně sdružená čísla jsou v komplexní rovině souměrně sdružená podle osy x a že vzdálenost komplexního čísla od osy x je rovna absolutní hodnotě jeho imaginární části. To již dává d = 3. □ 1.117. Setkání se zúčastnilo šest mužů. Pokud si všichni navzájem potřásli rukama, vyčíslete počet potřesení. Solution. Počet potřesení rukou zřejmě odpovídá počtu způsobů, jak lze vybrat neuspořádanou dvojici ze 6 prvků, tj. výsledek je c (6, 2) = = 15. □ 47 G. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 6. RELACE A ZOBRAZENÍ 1.118. Určete, kolika způsoby lze z 15 poslanců vybrat čtyřčlennou komisi, není-li možné, aby jistí 2 poslanci pracovali spolu. Solution. Výsledek je (?)-(?) = 1287. Obdržíme ho tak, že nejprve určíme počet všech možných výběrů čtyřčlenné komise, potom od něj odečteme počet těch výběrů, kdy oba zmínění poslanci budou vybráni (v takovém případě vybíráme pouze 2 další členy komise ze 13 poslanců). □ 1.119. Kolika způsoby můžeme rozdělit 8 žen a 4 muže do 2 šestičlenných skupin (v nichž nerozlišujeme pořadí - jsou neuspořádané) tak, aby v obou skupinách byl alespoň 1 muž? Solution. Rozdělení 12 osob do 2 šestičlenných skupin bez jakýchkoli podmínek je dáno libovolným 6J způsoby. Skupiny ale nejsou rozlišitelné (nevíme, která z nich je první), a proto je počet všech možných rozdělení ^ • (g2). V (!|) případech pak budou všichni muži v jedné skupině (volíme 2 ženy z 8, které skupinu doplní). Správná odpověď je tudíž \ ■ O - © = 434- □ 1.120. Jaký je počet čtyřciferných čísel složených z číslic 1, 3, 5, 6, 7 a 9, ve kterých se žádná z cifer neopakuje? Solution. K dispozici máme šest různých číslic. Ptáme se: Kolik různých uspořádaných čtveřic z nich můžeme vybrat? Výsledek je proto v (6, 4) = 6 • 5 • 4 • 3 = 360. □ 1.121. Řecká abeceda se skládá z 24 písmen. Kolik různých slov majících právě pět písmen z ní lze utvořit? (Bez ohledu na to, zda tato slova mají nějaký jazykový význam.) Solution. Pro každou z pěti pozic ve slově máme 24 možností, neboť písmena se mohou opakovat. Výsledek je tedy V (24, 5) = 245. □ 1.122. K vytrvalostnímu závodu, v němž běžci vybíhají jeden po druhém s danými časovými odstupy, se přihlásilo k závodníků, mezi nimi také tři kamarádi. Stanovte počet startovních listin, v rámci kterých žádní dva z trojice kamarádů nestartují těsně po sobě. Pro jednoduchost uvažujte k > 5. Solution. Ostatních k — 3 závodníků můžeme seřadit (k — 3)! způsoby. Pro uvažované tři kamarády pak máme k — 2 míst (začátek, konec a k — 4 mezer), na které je můžeme rozmístit v (k — 2, 3) způsoby. Podle (kombinatorického) pravidla součinu je tak výsledek (* - 3)! • (k - 2) ■ (k - 3) • (k - 4) = (k - 2)! ■ (k - 3) ■ (k - 4). □ 48 CHAPTER 1. ROZCVIČKA 1.123. Turnaje se zúčastní 32 lidí. Podle požadavků organizátorů se musí libovolným způsobem rozdělit do čtyř skupin tak, aby první skupina měla 10 účastníků, druhá 8, třetí také 8 a poslední čtvrtá potom 6. Kolika způsoby se mohou takto rozdělit? Solution. Můžeme si představit, že z 32 účastníků vytvoříme řadu, kdy prvních 10 utvoří první skupinu, dalších 8 druhou atd. Celkem můžeme účastníky seřadit 32! způsoby. Uvědomme si ovšem, že na rozdělení do skupin nemá vliv, když zaměníme pořadí osob, které patří do stejné skupiny. Proto je počet navzájem různých rozdělení roven P (10, 8, 8, 6) - 321 10!-8!-8!-6! " □ 1.124. Je potřeba ubytovat 9 osob v jednom čtyřlůžkovém, jednom třílůžkovém a jednom dvoulůžkovém pokoji. Zjistěte, kolika způsoby to lze provést. Solution. Jestliže např. hostům ve čtyřlůžkovém pokoji, přiřadíme číslici 1, v třílůžkovém pokoji číslici 2 a v dvoulůžkovém číslici 3, pak vytváříme permutace s opakováním ze tří prvků 1, 2, 3, v nichž jednička se vyskytuje čtyřikrát, dvojka třikrát a trojka dvakrát. Příslušný počet permutací je /> (4, 3, 2) = db = 1260. □ 1.125. Kolika způsoby můžeme do řady posadit 50 lidí tak, aby Pavel s Petrem ob jedno místo a Martin sousedil alespoň s jedním z nich? (Ve skupině je právě jeden Pavel, Petr i Martin) 1.126. Určete počet způsobů, jak lze rozdělit mezi tři osoby A, S a C 33 různých mincí tak, aby osoby A a S měly dohromady právě dvakrát více mincí, než má osoba C. Solution. Ze zadání vyplývá, že osoba C má obdržet 11 mincí. To lze provést (33) způsoby. Každou ze zbývajících 22 mincí může získat osoba A nebo B, což dává 222 možností. Z (kombinatorického) pravidla součinu plyne výsledek (33) • 222. □ 1.127. Kolika způsoby můžete mezi 4 chlapce rozdělit 40 stejných kuliček? Solution. Přidejme ke 40 kuličkám troje zápalky. Poskládáme-li kuličky a zápalky do řady, rozdělí zápalky kuličky na 4 úseky. Náhodně seřaďme chlapce. Dáme-li prvnímu chlapci všechny kuličky z prvního úseku, druhému chlapci všechny kuličky z druhého úseku atd., je již vidět, že všech rozdělení je právě (f) = 12 341. □ 1.128. Podle kvality dělíme výrobky do skupin I, 77, 7/7, IV. Zjistěte počet všech možných rozdělení 9 výrobků do těchto skupin, která se liší počtem výrobků v jednotlivých skupinách. Solution. Zapisujeme-li přímo uvažované devítičlenné skupiny z prvků I, II, III, IV, vytváříme 9) = 220. □ 1.129. Kolika způsoby mohla skončit tabulka první fotbalové ligy, víme-li o ní pouze, že alespoň jeden z týmů z dvojice Ostrava, Olomouc je v tabulce za týmem Brna (ligu hraje 16 mužstev). Solution. Nejprve určíme tři místa, na kterých se umístily celky Brna, Olomouce a Ostravy. Ty lze vybrat c(3, 16) = (g6) způsoby. Z šesti možných pořadí zmíněných tří týmů na vybraných třech místech vyhovují podmínce ze zadání čtyři. Pro libovolné pořadí těchto týmů na libovolně vybraných 49 G. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 6. RELACE A ZOBRAZENÍ třech místech pak můžeme nezávisle volit pořadí zbylých 13 týmů na ostatních místech tabulky. Podle pravidla součinu je tedy hledaný počet tabulek roven (ľ) •4 - 13! = 13948526592000. □ 1.130. Kolik je možných uspořádání (v řadě) na fotce volejbalového týmu (6 hráčů), když i) Gouald a Bamba chtějí stát vedle sebe ii) Gouald a Bamba chtějí stát vedle sebe a uprostřed iii) Gouald a Kamil nechtějí stát vedle sebe Solution. i) Goualda a Bambu můžeme v tomto případě počítat za jednoho, rozlišíme jen jak stojí vzájemně. Máme 2.5! = 240 pořadí. ii) Tady je to podobnéjen pozice Goualda a Bamby je pevně daná. Dostáváme 2.4! = 48 možností. iii) Nejjednodušší je asi odečíst případy, kdy stojí vedle sebe (viz (i)) od všech pořadí. Dostaneme 6! - 2.5! = 720 - 240 = 480. 1.131. Házení mincí. Šestkrát hodíme mincí. i) Kolik je všech různých posloupností panna, orel ii) Kolik je takových, že padnou právě čtyři panny. iii) Kolik je takových, že padnou aspoň dvě panny. 1.132. Kolik existuje přesmyček slova BAZILIKA takových, že se v nich střídají souhlásky a samohlásky? Solution. Protože souhlásky i samohlásky jsou v daném slově čtyři, tak se v každé takové přesmyčce střídají pravidelně souhlásky a samohlásky. Slovo tedy může být typu BABABABA nebo ABABABAB. Na daných čtyřech místech můžeme pak samohlásky permutovat mezi sebou (P0(2, 2) = způsoby) a nezávisle na tom i souhlásky (4! způsoby). Hledaný počet je pak dle pravidla součinu 2 • 4! • ^ = 288. □ 1.133. Kolika způsoby lze rozdělit 9 děvčat a 6 chlapců do dvou skupin tak, aby každá skupina obsahovala alespoň dva chlapce? Solution. Rozdělíme zvlášť děvčata a chlapce: 29(25 — 7) = 12800. □ 1.134. Materiál je tvořen pěti vrstvami, každá z nich má vlákna v jednom z daných šesti směrů. Kolik takových materiálů existuje? Kolik je jich takových, že dvě sousední vrstvy nemají vlákna ve stejném směru? Solution. 65 a 6 55. □ 50 CHAPTER 1. ROZCVIČKA 1.135. Pro libovolné pevné n e N určete počet všech řešení rovnice x\ + x2 H-----h xk = n v množině nezáporných, kladných celých čísel. Solution. Hledáme-li řešení v oboru kladných celých čísel, tak si všimněme, že přirozená čísla x\, ... xk jsou řešením dané rovnice, právě když jsou celá nezáporná čísla y,■ = x,■ — 1, i = 1, ..., k, řešením rovnice Vi + yi H-----\-yk=n - k. Těch je podle ||1.31|| (£). □ 1.136. Na kružnici stojí n pevností (n > 3), očíslovaných po řadě čísly í,...,n. V jeden okamžik f,, každá vystřelí na jednu ze dvou sousedních (pevnost 1 sousedí s pevností n). Označme P(n) počet možných výsledků střelby (za výsledek střelby považujeme množinu čísel právě těch x pevností, které byly při střelbě zasaženy, nerozlišujeme přitom mezi jedním a dvěma zásahy). Dokažte, že P(n) a P(n + 1) jsou nesoudělná. Solution. Označíme-li zasažené pevnosti černým kolečkem a nezasažené bílým, úloha je ekvivalentní úloze určit počet všech možných obarvení n koleček, umístěných na kružnici, černou a bílou barvou tak, aby nebyla žádná dvě bílá kolečka "objedno". Pro lichá n je tento počet roven počtu K(n) obarvení černou a bílou barvou tak, aby žádná dvě bílá kolečka nestála vedle sebe (přečíslujeme pevnosti tak, že začneme u kolečka 1 a číslujeme popořadě vzestupně po lichých číslech a poté vzestupně po sudých). V případě sudého n je tento počet roven K(n/2)2, kvadrátu počtu obarvení n/2 koleček na obvodu kruhu tak, aby žádná dvě bílá nestála vedle sebe (barvíme nezávisle kolečka na lichých a na sudých pozicích). Pro K(n) snadno odvodíme rekurentní formuli K(n) = K(n — 1) + K(n — 2). Navíc snadno spočteme, že K(2) = 3, K(3) = 4, K(4) = 7, tedy K(2) = F(4) - F(0), K(3) = F(5) -K(4) = F(6) — F(2) a indukcí snadno dokážeme K(n) = F(n + 2) — F(n — 2), kde F(n) značí n-tý člen Fibonacciho posloupnosti (F(0) = 0, F(l) = F(2) = 1). Navíc protože (K(2), K(3)) = 1, máme pro n > 3 obdobně jako u Fibonacciho posloupnosti (K(n), K{n - 1)) = (K(n) - K(n - 1), K(n - 1)) = = (K(n - 2), K(n-l)) = --- = 1. Ukážeme nyní, že pro každé sudé n = 2a je P(n) = K(a)2 nesoudělné jak s ř(« | 1) = K(2a + 1), tak s P(n — 1) = K(2a — 1). K tomu stačí následující: pro a > 2 je totiž (K(a), K(2a + 1)) = (K(a), F(2)K(2a) + F(l)K(2a - 1)) = = (K(a), F(3)K(2a - 1) + F(2)K(2a -2) = ... = (K(a), F(a + l)K(a + 1) + F(a)K(a)) = = (K(a), F(a + 1)) = (F(a + 2) - F(a - 2), F(a + 1)) = = (F(a +2) - F(a + 1) - F(a - 2), F(a + 1)) = = (F(a) - F(a - 2), F(a + 1)) = = (F(a - 1), F(a + 1)) = (F(a - 1), F (a)) = 1 (K(a), K(2a - 1)) = (K(a), F(2)K(2a - 2) + F(l)K(2a - 3)) = 51 G. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 6. RELACE A ZOBRAZENÍ = (K(a), F(3)K(2a - 3) + F(2)K(2a - 4)) = = • • • = (K(a), F(a)K(a) + F(a - l)K(a - 1)) = = (K(a), F(a - 1)) = (F(a + 2) - F(a - 2), F(a - 1)) = = (F(a +2) - F (a), F(a - 1)) = = (F(a + 2) - F(a + 1), F(a - 1)) = (F(a), F(a - 1)) = 1. Tím je tvrzení dokázáno. □ 1.137. Kolik peněz naspořím na stavebním spoření za pět let, vkládám-li 3000 Kč měsíčně (vždy k 1. v měsíci), vklad je úročen roční úrokovou mírou 3% (úročení probíhá jednou za rok) a od státu obdržím ročně příspěvek 1500 Kč (státní příspěvek se připisuje vždy až 1. května následujícího roku)? Solution. Označme množství naspořených peněz po n-tém roce jako xn. Potom dostáváme (pro n > 2) následující rekurentní formuli (navíc předpokládáme, že každý měsíc je přesně dvanáctina roku) xn+1 = 1, 03(x„) + 36000 + 1500+ 0. 03-300o(l + ii + ... + !) + 1-v-' úroky z vkladů za aktuální rok + 0,03•^•1500 '-v-' úrok ze státního příspěvku připsaného v aktuálním roce = l,03(x„) + 38115. Tedy n-2 xn = 38115 ^(1, 03)'' + (1, 03)"-1jci + 1500, i=0 přičemž xx = 36000 + 0, 03 • 3000 (l + n + • • • + n) = 36585, celkem /(1,03)4-1\ , x5 = 38115 í Q3-J +(1,03)4-36585 + 1500 = 202136. □ 1.138. Remark. Ve skutečnosti úročení probíhá podle počtu dní, které jsou peníze na účtu. Obstarejte si skutečný výpis ze stavebního spoření, zjistěte si jeho úročení a zkuste si spočítat připsané úroky za rok. Porovnejte je se skutečně připsanou sumou. Počítejte tak dlouho, dokud sumy nebudou souhlasit 1.139. Na kolik maximálně částí dělí rovinu n kružnic? Solution. Pro maximální počet pn oblastí, na které dělí rovinu kružnice odvodíme rekurentní vzorec Pn+i = p„+2n. Všimněme si totiž, že (n + l)-ní kružnice protíná n předchozích maximálně v 2n průsečících (a tato situace skutečně může nastat). 52 CHAPTER 1. ROZCVIČKA Navíc zřejmě p\ = 2. Pro počet pn tedy dostáváme p„ = pn-i + 2(n - 1) = p„-2 + 2(n - 2) + 2(n - 1) «-i /?i + 2z = «2 — « + 2. □ 1.140. Na kolik nejvýše částí dělí třírozměrný prostor n rovin? Solution. Označme hledaný počet r„. Vidíme, že r0 = 1. Podobně jako příkladu (|| 1.351|) uvažujme, že máme v prostoru n rovin, přidejme jednu další a ptejme se, kolik nejvýše částí prostoru přibude. Opět to bude přesně tolik, kolika původními částmi prostoru přidaná rovina prochází. Kolik to může být? Počet částí prostoru, kterými (n + l)-ní rovina prochází je roven počtu částí, na které je přidaná (n + l)-ní rovina rozdělena průsečnicemi s n rovinami, které v prostoru již byly rozmístěny. Těchto částí však může být podle předchozího příkladu nejvýše 1 /2 • (n2 + n + 2), dostáváme tak rekurentní formuli n2 + n + 2 fn + l = f n H--Z-• Danou rovnici opět můžeme vyřešit přímo: (n - l)2 + (n - 1) + 2 n7 rn = r„_i H---- = r„_i H-- n +2 rn-2 + (n - l)2 - (n - 1) + 2 r„-2 + y + 2 (n " I)2 + n +2 r„-3 + y + n- (n - I)1 + n (n — Y) 2 2 (n - 3)2 n 2 2 + 1 + 1 = (n-l) (n-2) + + 1 + 1 + 1 = Y n \ n n n (n + \){2n + 1) n (n + 1) 1 H--—---:--1" n 12 n3 + + 5 53 G. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 6. RELACE A ZOBRAZENÍ kde jsme použili známého vztahu n(n + í)(2n + 1) Z'2 „•2 i=\ který lze snadno dokázat matematickou indukcí. □ 1.141. Na kolik maximálně částí dělí trojrozměrný prostor n koulí? 1.142. Na kolik částí dělí prostor n navzájem různých rovin, které všechny prochází jedním daným bodem? Solution. Pro hledaný počet xn odvodíme rekurentní formuli x„ = x„_! + 2(n - 1), dále x\ = 2, tedy x„ = n(n — 1) + 2. □ 1.143. Z balíčku 52 karet náhodně vybereme 16 karet. Vyjádřete pravděpodobnost, že vybereme právě 10 červených a 6 černých karet. Solution. Nejdříve si uvědomme, že nemusíme zohledňovat pořadí výběru karet. (Ve výsledném zlomku bychom uspořádané výběry získali tak, že bychom číslem 16! vynásobili čitatele i jmenovatele.) Počet všech možných (neuspořádaných) výběrů 16 karet z 52 je (j2). Podobně je počet všech možných výběrů 10 karet z 26 roven (2^) a 6 karet z 26 pak (26). Neboť vybíráme nezávisle na sobě 10 karet z 26 červených a 6 karet z 26 černých, užití (kombinatorického) pravidla součinu dává výsledek /26\ l26\ -s- -0,118. □ 1.144. V urně je 7 bílých, 6 žlutých a 5 modrých koulí. Vylosujeme (bez vracení) 3 koule. Určete pravděpodobnost, že právě 2 jsou bílé. Solution. Celkem máme (7+3+5) způsobů, jak lze vybrat 3 koule. Vylosovat právě 2 bílé umožňuje (2) výběrů bílých a současně výběrů zbylé (třetí) koule. Podle pravidla součinu je tak počet způsobů, jak lze vylosovat právě 2 bílé, roven (7) • Odsud již plyne výsledek ^= 0, 283. □ 54 CHAPTER 1. ROZCVIČKA 1.145. Z karetní hry o 108 kartách (2 x 52 + 4 žolíci) bez vracení vybereme 4 karty. Jaká je pravděpodobnost, že aspoň jedna z nich je eso nebo žolík? Solution. Lehce můžeme určit pravděpodobnost opačného (komplementárního) jevu znamenajícího, že ve vybrané čtveřici není žádná z 12 uvažovaných karet (8 es a 4 žolíků). Tato pravděpodobnost je dána poměrem počtu výběrů 4 karet z 96 a počtu výběrů 4 karet ze 108, tj. je rovna (^f)/^8)-Opačný jev má tudíž pravděpodobnost 1-^= 0, 380. □ 1.146. Při házení kostkou padla jedenáctkrát po sobě čtyřka. Uvedte pravděpodobnost, že padne podvanácté. Solution. Předchozí výsledky (podle našich předpokladů) nijak neovlivňují, co padne na kostce při dalších hodech. Proto je hledaná pravděpodobnost 1 /6. □ 1.147. Z balíčku 32 karet náhodně vypadne 6 karet. Jaká je pravděpodobnost, že jsou všechny téže barvy? Solution. K tomu, abychom získali výsledek = 1,234- 10"4, U) stačí nejprve zvolit jednu ze 4 barev a uvědomit si, že existuje Q způsobů, jak vybrat 6 karet z 8 této barvy. □ 1.148. Tři hráči dostanou po 10 kartách a 2 zbudou (z balíčku připraveného na mariáš nebo prší -32 karet, z toho 4 esa). Je pravděpodobnější, že někdo dostane listovou sedmu, osmu a devítku, nebo to, že zbyla dvě esa? Solution. Protože pravděpodobnost, že nějaký z hráčů dostane uvedené tři karty, je rovna hodnotě zatímco pravděpodobnost, že zbudou dvě esa, je rovna číslu ©' je pravděpodobnější, že nějaký z hráčů dostal zmíněné tři karty. Poznamenejme, že dokázat nerovnost Q (?) lze úpravou obou jejích stran, kdy opakovaným krácením (po vyjádření kombinačních čísel dle definice) lehce dostaneme 6 > 1. □ 1.149. Hodíme n kostkami. Jaká je pravděpodobnost, že mezi čísly, která padnou, nebudou hodnoty 1, 3 a 6? Solution. Úlohu můžeme přeformulovat tak, že n-krát po sobě hodíme 1 kostkou. Pravděpodobnost, že při prvním hodu nepadne 1, 3 nebo 6, je 1/2. Pravděpodobnost, že při prvním a druhém hodu nepadne 1, 3 ani 6, je zjevně 1 /4 (výsledek prvního hodu neovlivňuje výsledek druhého). Vzhledem k tomu, že jev určený výsledkem jistého hodu ajakýkoli jev určený výsledkem jiného hodu jsou vždy (stochasticky) nezávislé, hledaná pravděpodobnost je 1 /2". □ 55 G. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 6. RELACE A ZOBRAZENÍ 1.150. Dva přátelé střílejí nezávisle na sobě do jednoho terče, každý po jednom výstřelu. Pravděpodobnost zásahu terče pro prvního je 0, 4, pro druhého je 0, 3. Nalezněte pravděpodobnost P jevu, že po střelbě bude v terči právě jeden zásah. Solution. Výsledek stanovíme tak, že sečteme pravděpodobnosti těchto dvou neslučitelných jevů: trefil se první střelec a druhý nikoli; první střelec minul, zatímco druhý terč zasáhl. Při nezávislosti jevů (která se zachovává také tehdy, když uvažujeme komplementy některých z jevů) je pravděpodobnost společného nastoupení dána součinem pravděpodobností jednotlivých jevů. Užitím toho dostáváme p = 0, 4 • (1 - 0, 3) + (1 - 0, 4) • 0, 3 = 0, 46. □ 1.151. Dvanáctkrát po sobě házíme třemi mincemi. Jaká je pravděpodobnost, že alespoň v jednom hodu padnou tři líce? Solution. Uvážíme-li, že při opakovaní téhož pokusu jsou jednotlivé výsledky nezávislé, a označí-me-li pro i e {1, ..., 12} jako A;- jev „při /-tém hodu padly tři líce", určujeme = 1 - (1 - P(A0) ■ (1 - P(A2)) ••• (1 - P (A n)). Pro každé i e {1, ..., 12} je však f(A;) = 1/8, neboť na každé ze tří mincí padne líc s pravděpodobností 1 /2 nezávisle na tom, zda na ostatním mincích padl líc, příp. rub. Nyní již můžeme napsat výsledek □ 1.152. V jisté zemi mají parlament, ve kterém zasedá 200 poslanců. Dvě hlavní politické strany, které v zemi existují, si při "volbách" házejí o každý poslanecký mandát zvlášť mincí. Každá z těchto stran má přidělenu jednu stranu mince. Té straně, jejíž strana mince padne, náleží mandát, o který se právě losovalo. Jaká je pravděpodobnost, že každá ze stran získá 100 mandátů? (mince je "poctivá") Solution. Všech možných výsledků losování (uvažovaných jako dvousetčlenné posloupnosti rubů a líců) je 2200. Pokud každá strana získá právě sto mandátů, je ve vylosované posloupnosti právě sto líců a sto rubů. Takových posloupností je (2[J[J) (taková posloupnost je jednoznačně určená výběrem sto členů z dvou set možných, na kterých budou např. líce). Celkem je hledaná pravděpodobnost /200\ 200! viooJ íooi-ioo! • n rKA -jim = ^205- = °' °56- □ 1.153. Sedm Čechů a pět Angličanů náhodně rozdělíme na dvě (neprázdné) skupiny. Jaká je pravděpodobnost, že v jedna ze skupin bude tvořena pouze Čechy? Solution. Všech možností je 212 — 1. Jestliže jsou v jedné skupině pouze Češi, znamená to, že všichni Angličané jsou v jedné skupině (buď v první nebo druhé). Zbývá rozdělit Čechy na dvě neprázdné skupiny, to můžeme 27 — 1 způsoby. Na závěr ještě přičíst rozdělení, kdy jsou skupiny podle národností. 2 • (27 - 1) + 1 212- 1 56 CHAPTER 1. ROZCVIČKA □ 1.154. Z deseti karet, z nichž právě jedna je eso, namátkou vybereme kartu a vrátíme ji zpět. Kolikrát takový výběr musíme provést, aby pravděpodobnost, že aspoň jednou vybereme eso, byla větší než 0, 9? Solution. Označme A; jev „při /-tém výběru bylo vytaženo eso". Neboť jednotlivé jevy A; jsou (stochasticky) nezávislé, víme, že P (Ů ^) = 1 - (1 - P(A0) • (1 - P(A2)) ••• (1 - P(An)) pro každé n e N. Připomeňme, že hledáme n e N takové, aby platilo P ([J Ať) = 1 - (1 - P(A0) • (1 - P(A2)) ••• (1 - P(An)) > 0, 9. Zřejmě je f(A;) = 1/10 pro libovolné / e N. Proto stačí vyřešit nerovnici !-(&)"> 0,9, ze které lze vyjádřit n > !oga n „, kde a > 1. loga 0.9 Vyčíslením potom zjistíme, že daný pokus musíme provést alespoň dvaadvacetkrát. □ 1.155. Texas holďem. Nyní spočítejme několik jednoduchých úloh týkajících se populární karetní hry Texas holďem, jejíž pravidla zde nebudeme uvádět (pokud je čtenář nezná, snadno je dohledá na internetu). Jaká je pravděpodobnost, že i) jako startovní kominaci dostanu dvojici stejných symbolů? ii) ve své startovní dvojici karet budu mít eso? iii) na konci budu mít jednu z šesti nejlepších kombinací karet? iv) vyhraji, pokud držím v ruce eso a trojku (libovolné barvy), na flopu je eso a dve dvojky a na turnu je třetí trojka a všechny tyto čtyři karty mají různou barvu? (poslední karta river ještě není otočena) Solution. i) Počet různých symbolů je 13 a jsou vždy čtyři (pro každou barvu jeden). Proto je počet dvojic se stejnými symboly 13(2) = 78. Počet všech možných dvojic je ^\A) = 1326. Pravděpodobnost stejných symbolů je tedy jj = 0, 06. ii) Jedna karta je eso, to jsou čtyři možnosti a druhá je libovolná, to je 51 možností. Dvojice s oběma esama, kterých je (4) = 6 jsme ale takto započítali dvakrát. Dostáváme tedy 4.51 — 6 = 198 dvojic a pravděpodobnost je = 0, 15. iii) Spočítáme pravděpodobnosti jednotlivých nejlepších kombinací: ROYAL FLUSH: Takové kobinace jsou zřejmě jen čtyři - pro každou barvu jedna. Všech kombinací pěti karet j e (552) = 2598960. Pravděpodobnost je tak rovna asi 1, 5.10-6. Hodně malá :) STRAIGHT FLUSH: Postupka, která končí nejvyšší kartou v rozmezí 6 až K, tj. 8 možností pro každou barvu. Dostáváme 259382%0 = 1, 2.10-5. POKER: Čtyři stejné symboly - 13 možností (pro každý symbol jedna). Pátá karta může být libovolná, to znamená 48 možností. Odtud: = 2, 4.10-4. FULL HOUSE: Tři stejné symboly 13 (3) = 52 možností a k tomu dva stejné symboly je 57 G. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 6. RELACE A ZOBRAZENÍ 12(4) = 72 možností. Pravděpodobnost je 2598960 = 1> 4.10 3. 5J = 5148 možností a pravděpodobnost fcV3^ 2598960 = 2-10"3- STRAIGHT: Nejvyšší katrta postupky je v rozmezí 6 až A, tj. 9 možností. Barva každé karty je pak libovolná, tj. dohromady 9.45 = 9216 možností. Zde jsme ale započítali jak straight flush, tak i royal flush. Ty je potřeba odečíst. Pro zjištění pravděpodobnosti nějaké z šesti nejlepších kombinací to ale ani nemusíme dělat, jen první dvě kombinace nezapočteme. Celkově tedy dostáváme pravděpodobnost zhruba 3, 5.10"3 + 2.10"3 + 1, 4.10"3 + 2, 4.10"4 = 7, 14.10"3. iv) Evidentně je situace hodně dobrá a proto bude lepší spočítat nepříznivé situace, tj. kdy bude mít soupeř lepší kombinaci. Já mám v tuto chvíli full house ze dvou es a tří dvojek. Jediná kombinace, která by mmě mohla porazit v tuto chvíli je buď full house ze tří es a dvou dvojek nebo dvojkový poker. To znamená, že soupeř by určitě musel držet eso nebo poslední dvojku. Pokud drží dvojku a libovolnou jinou kartu, pak určitě vyhraje bez ohledu na kartu na riveru. Kolik je možností pro tuto kartu ke dvojce? 3 + 4 + -- - + 4 + 2 = 45 (jednu trojku a dvě esa už mít v ruce nemůže). Včech zbylých kombinací je (46) = 1035 a pravděpodobnost takové prohry je tak 0,043. Pokud drží v ruce eso, pak se může stát následující. Pokud drží (zbylá) dvě esa, tak opět vyhraje, pokud na riveru nepřijde dvojka - pak by byl split poker. Pravděpodobnost (podmíněná) mé prohry je tedy y035.fl = 10~3. pokud drží soupeř v ruce eso a nějakou jinou kartu, než 2 a A, tak následuje remíza bez ohledu na river. Celková pravděpodobnost výhry je tak skoro 96 %. □ 1.156. Osm karet, čtyři esa a čtyři krále rozdělíme po dvou mezi čtyři hráče. Jaká je pravděpodobnost, že někdo dostane alespoň dvě esa? Výsledek vyjádřete ve tvaru podílu dvou dvojciferných čísel. 1.157. 5.(5b.) Aleš má dvě speciální hrací kostky, na jedné padá vždy šestka, na druhé padá pouze čtyřka, pětka, či šestka, každé číslo se třetinovou pravděpodobností. Jaká je pravděpodobnost, že mu při hodu těmito dvěma kostkami padne vyšší součet než Martinovi, který háže se dvěma poctivými kostkami. Výsledek vyjádřete ve tvaru podílu dvou dvouciferných čísel. 1.158. Volejbalový tým (s liberem, tj. celkem sedm osob) sedí po zápase v hospodě a popíjí zasloužené pivo. Je ale málo kríglů a proto hospodský používá pořád těch sedm samých. Jaká je pravděpodobnost, že příště i) právě jeden nedostane ten svůj, ze kterého pil ii) nikdo nedostane ten svůj iii) právě tři dostanou ten svůj. Solution. i) Pokud šest lidí dostne ten svůj, tak zákonitě i ten šestý, pravděpodobnost je tedy nulová. ii) Nechť M je množina všech uspořádání a jev A;- je uspořádání, kdy i-tý hráč dostane svůj krígl. Chceme spočítat \M — U;A;|. Dostáváme 7! Xl=o ^~T\~ = 1854. A pravděpodobnost I 1854 _ 103 ^ Q 37 J 5040 280 ' 58 CHAPTER 1. ROZCVIČKA iii) Vybereme, kteří tři dostanou ten svůj - Q = 35 možností. Zbylí čtyři musí dostat jiné než svoje. To je opět vzorec z minulého bodu, konkrétně jde o 4! XÍ=o (~T\~ = 9 možností. Máme tedy dohromady 9 • 35 = 315 možností a pravděpodobnost je = □ 1.159. Kolika způsoby lze rozestavit n shodných věží na šachovnici n x n tak, aby bylo každé neobsazené pole ohrožováno některou z věží? Solution. Daná rozestavení jsou sjednocením dvou množin: množiny rozestavení, kdy je alespoň v jednom řádku jedna věž (tedy v každém řádku právě jedna; tato množina má n" prvků - v každém řádku vybereme nezávisle jedno pole pro věž) a množiny rozestavení, kdy je v každém sloupci alespoň (tedy právě) jedna věž (stejnou úvahou jako u první množiny má tato množina rovněž n" prvků). Průnik těchto množin pak má n! prvků (místa pro věže vybíráme postupně od prvního řádku - tam máme n možností, ve druhém pak již pouze n — 1 možností-jeden sloupec je již obsazen,...). Podle principu inkluze a exkluze je počet hledaných rozestavení: 2nn - n\. □ 1.160. Zjistěte pravděpodobnost, že při hodu dvěma kostkami padla alespoň na jedné kostce čtyřka, jestliže padl součet 7. Solution. Příklad řešíme pomocí klasické pravděpodobnosti, kdy podmínku interpretujeme jako zúžení pravděpodobnostního prostoru. Ten má vzhledem k podmínce tedy 6 prvků, z čehož právě 2 jsou příznivé vyšetřovanému jevu. Správná odpověďje 2/6 = 1/3. □ 1.161. Hodíme dvěma kostkami. Určete podmíněnou pravděpodobnost, že na první kostce padla pětka za podmínky, že padl součet 9. Na základě tohoto výsledku rozhodněte o nezávislosti jevů „na první kostce padla pětka" a „padl součet 9". Solution. Označíme-li jev „na první kostce padla pětka" jako A a jev „padl součet 9" jako H, pak platí P(A\H) = ^ = f = I. 36 Uvědomme si, že součet 9 můžeme získat tak, že na první kostce padne 3 a na druhé 6, na první 4 a na druhé 5, na první 5 a na druhé 4 nebo na první 6 a na druhé 3. Z těchto čtyř (stejně pravděpodobných) výsledků jevu A vyhovuje právě jeden. Protože pravděpodobnost jevu A je očividně 1/6^1 /4, nejsou uvedené jevy nezávislé. □ 1.162. Mějme balíček 32 karet. Vytáhneme-li dvakrát po jedné kartě, nalezněte pravděpodobnost, že druhá tažená karta bude eso, když první kartu vrátíme, a také tehdy, když ji do balíčku nevrátíme (druhou kartu potom vybíráme z balíčku 31 karet). Solution. Pokud kartu do balíčku vrátíme, zjevně opakujeme pokus, který má 32 možných (stejně pravděpodobných) výsledků, přičemž právě 4 z nich vyhovují námi uvažovanému jevu. Vidíme, že tomto případě je hledaná pravděpodobnost 1/8. Ve druhém případě, kdy první kartu do balíčku nevrátíme, je ovšem hledaná pravděpodobnost stejná. Postačuje např. uvážit, že při vytažení postupně všech karet je pravděpodobnost vytažení esa jako první karty totožná s pravděpodobností, že druhá 59 G. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 6. RELACE A ZOBRAZENÍ vytažená karta bude eso. Pochopitelně bylo možné využít toho, že máme zavedenu podmíněnou pravděpodobnost. Tak bychom mohli obdržet _± 1. _|_ 28 _1 _ I 32 ' 31 32 ' 31 — 8 • □ 1.163. Uvažujme rodiny se dvěma dětmi a pro jednoduchost předpokládejme, že všechny možnosti v množině Q = {kk, kh, hk, hh}, kde k značí „kluk" a h znamená „holka" při zohlednění stáří dětí, jsou stejně pravděpodobné. Zaveďme náhodné jevy Hi - rodina má kluka, A\ - rodina má 2 kluky. Vypočtěte P {Ai\Hx). Podobně uvažujme rodiny se třemi dětmi, kdy je £2 = {klek, kkh, khk, hkk, khh, hkh, hhk, hhh}. Jestliže H2 - rodina má kluka i holku, A2 - rodina má nejvýše jednu holku, rozhodněte o nezávislosti náhodných jevů A2 a H2. Solution. Uvážením, které ze čtyř prvků množiny Q (ne)vyhovují jevu A\, resp. Hi, lehce získáváme P(A I H \ — p(AinHi) — p(Ai) _ i _ I r — P(Hl) — P(Hl) — 3 — 3- Dále máme zjistit, zda platí P (A2 DH2) = P (A2) ■ P (H2). Opět si stačí pouze uvědomit, že jevu A2 vyhovují právě prvky kkk, kkh, khk, hkk množiny Q, jevu H2 prvky kkh, khk, hkk, khh, hkh, hhk a jevu A2 n H2 prvky kkh, khk, hkk. Odtud plyne P (A2 n H2) = f = I ■ I = P (A2) ■ P (H2), což znamená, že jevy A2 a H2 jsou nezávislé. □ 1.164. Pětkrát jsme hodili mincí. Pokud padl líc, dali jsme do klobouku bílou kuličku. Když padl rub, dali jsme do téhož klobouku kuličku černou. Vyjádřete pravděpodobnost, že v klobouku je více černých kuliček než bílých, je-li v klobouku alespoň jedna černá kulička. Solution. Zaveďme jevy A - v klobouku je víc černých kuliček než bílých, H - v klobouku je aspoň jedna černá kulička. Chceme stanovit P (A\H). Uvědomme si, že pravděpodobnost f (Hc) opačného jevu k jevu H je2~5 a že pravděpodobnost jevu A je stejná jako pravděpodobnost P (Ac) jevu opačného (v klobouku je víc bílých kuliček). Nutně tedy P(H) = 1 - 2"5, P(A) = 1/2. Dále je P(A D H) = P(A), neboť jev H obsahuje jev A (jev A má za důsledek jev H). Celkem jsme obdrželi PiA\H) = ^ = -^ = fl. (i) □ 60 CHAPTER 1. ROZCVIČKA 1.165. V osudí je 9 červených a 7 bílých koulí. Postupně vytáhneme 3 koule (bez vracení). Určete pravděpodobnost, že první dvě budou červené a třetí bílá. Solution. Příklad budeme řešit pomocí věty o násobení pravděpodobností. Nejprve požadujeme vytažení červené koule, což se podaří s pravděpodobností 9/16. Pokud byla poprvé vytažena červená koule, při druhém tahu vytáhneme znovu červenou kouli s pravděpodobností 8/15 (v osudí je 15 koulí, z toho 8 červených). Konečně, pokud byla dvakrát vytažena červená koule, pravděpodobnost, že potom bude vytažena bílá, je 7/14 (v osudí je 7 bílých koulí a 7 červených koulí). Celkem dostáváme ±.±.2-=0 15 16 15 14 □ 1.166. V osudí je 10 koulí, a to 5 černých a 5 bílých. Postupně budeme losovat po jedné kouli, přičemž vytaženou kouli nevrátíme zpět. Stanovte pravděpodobnost, že nejprve vytáhneme bílou, poté černou, pak bílou a v posledním čtvrtém tahu opět bílou kouli. Solution. Použijeme větu o násobení pravděpodobností. V prvním tahu vytáhneme bílou kouli s pravděpodobností 5/10, poté černou s pravděpodobností 5/9, následně bílou s pravděpodobností 4/8 a na závěr bílou s pravděpodobností 3/7. Dohromady to dává _5_ 5 4 3 _ _5_ 10 ' 9 ' 8 ' 7 ~~ 84- □ 1.167. Z balíčku 32 karet náhodně vybereme šestkrát po sobě po jedné kartě, a to bez vracení. Spočtěte pravděpodobnost, že první král bude vybrán až při šestém výběru. Solution. Podle věty o násobení pravděpodobností je výsledek 28 27 26 25 24 J_ ^_ r, 0790 32 ' 31 ' 30 ' 29 ' 28 ' 27 ~~ U' u/z->- □ 1.168. Jaká je pravděpodobnost, že součet dvou náhodně zvolených kladných čísel menších než 1 bude menší než 3/7? Solution. Je vidět, že jde o jednoduchý příklad na geometrickou pravděpodobnost, kdy jako základní prostor Q se nabízí čtverec s vrcholy [0, 0], [1, 0], [1, 1], [0, 1] (volíme dvě čísla mezi 0 a 1). Zajímá nás pravděpodobnost jevu udávajícího, že pro náhodně zvolený bod [x, y] v tomto čtverci bude platit x + y < 3/7; tj. pravděpodobnost toho, že zvolený bod se bude nacházet uvnitř trojúhelníku A s vrcholy [0, 0], [3/7, 0], [0, 3/7]. Nyní již snadno vyčíslíme P(A\ — — (^) /2 _ 2. ^ ' vol Q 1 98 • □ 61 G. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 6. RELACE A ZOBRAZENÍ 1.169. Nechť je náhodně rozlomena tyč na tři části. Stanovte pravděpodobnost, že délka druhé (prostřední) části bude větší než dvě třetiny délky tyče před jejím rozlomením. Solution. Nejprve si označme délku uvažované tyče jako d. Rozlomení tyče ve dvou místech je dáno volbou bodů, kde ji zlomíme. Označme jako x bod, ve kterém je první (např. blíže nějakému předmětu) zlom, a jako x + y bod, ve kterém je druhý zlom. To nám říká, že za základní prostor lze považovat množinu {[jc, y]; x e (0, d), y e (0, d — x)}, tj. trojúhelník s vrcholy v bodech [0, 0], [d, 0], [0, d]. Délka prostřední části je dána hodnotou y. Požadavek ze zadaní lze nyní zapsat v jednoduchém tvaru y > 2d/3, což odpovídá trojúhelníku s vrcholy [0, 2d/3], [d/3, 2d/3], [0, d]. Obsahy uvažovaných pravoúhlých rovnoramenných trojúhelníků jsou d2 /2 a (d/3)2/2, a proto je hledaná pravděpodobnost A. 3^-2 _ 1 ffl ~ 9' 2 □ 1.170. Tyč o délce 2 m je náhodně rozřezána na tři části. Nalezněte pravděpodobnost jevu, že třetí část měří méně než 1, 5 m. Solution. Tento příklad je na užití geometrické pravděpodobnosti, kdy hledáme pravděpodobnost toho, že součet délek prvních dvou částí je větší než čtvrtina délky tyče. Určeme pravděpodobnost opačného jevu, tj. pravděpodobnost, když budou náhodně (a nezávisle na sobě) zvolena dvě místa, ve kterých bude tyč rozřezána, že budou obě v první čtvrtině tyče. Pravděpodobnost tohoto jevu je 1 /42, neboť pravděpodobnost výběru místa v první čtvrtině tyče je zřejmě 1/4 a tento výběr se (nezávisle) jednou opakuje. Pravděpodobnost hledaného (opačného) jevu je tak 15/16. □ 1.171. Mirek a Marek chodí na obědy do univerzitní menzy. Menza má otevřeno od llh do 14h. Každý z nich stráví na obědě půl hodiny a dobu příchodu (mezi 1 lh a 14h) si vybírá náhodně. Jaká je pravděpodobnost, že se na obědě v daný den potkají, sedávají-li oba u stejného stolu? Solution. Prostor všech možných jevů je čtverec 3x3. Označíme-li x dobu příchodu Mirka a y dobu příchodu Marka, tak tito se potkají, právě když \x — y\ < 1 /2. Tato nerovnost vymezuje ve čtverci možných událostí oblast, jejíž obsah je roven 11 /36 obsahu čtverce. Tomuto zlomku je tedy rovna i hledaná pravděpodobnost. □ 1.172. Z Brna vyrazí náhodně někdy mezi polednem a čtvrtou hodinou odpolední Honza autem do Prahy a opačným směrem někdy ve stejném intervalu autem Martin. Oba si dávají půl hodiny pauzu v motorestu v polovině cesty (přístupném pro oba směry). Jaká je pravděpodobnost, že se tam potkají, jezdí-li Honza rychlostí 150 km/h a Martin 100 km/h? (Vzdálenost Brno-Praha je 200 km) Solution. Označíme-li dobu odjezdu Martina x a dobu odjezdu Honzy y a pro menší výskyt zlomků v následujících výpočtech zvolíme za jednotku deset minut, tak stavovým prostorem bude čtverec 24 x 24. Doba příjezdu Martina do motorestu je x + 6, do příjezdu Honzy x + 4. Stejně jako v předchozím příkladu to, že se v motorestu potkají, je ekvivalentní tomu, že doby jejich příjezdu se neliší o více než o půl hodiny, tedy \(x + 6) — (y + 4)| < 3. Tato podmínka nám pak ve stavovém čtverci vymezuje oblast o obsahu 242 — j(232 + 192) (viz obr.) a hledaná pravděpodobnost je 62 CHAPTER 1. ROZCVIČKA Sff< 5, 1 p = (232 + 192; :) 242 □ 1.173. Mirek vyjede náhodně mezi desátou hodinou dopolední a osmou hodinou večerní z Brna do Prahy. Marek vyjede náhodně ve stejném intervalu z Prahy do Brna. Oběma trvá cesta 2 hodiny. Jaká je pravděpodobnost, že se po cestě potkají (jezdí po stejné trase)? Solution. Řešíme naprosto analogicky jako v předchozím příkladě. Prostor všech možných jevů je čtverec 10 x 10, Mirek, vyjíždějící v čase x, potká Marka, vyjíždějícího v čase y právě když \x — y\ < 2. Hledaná pravděpodobnost je p = ^ = ^ = 0,36. 1.174. Dvoumetrová tyč je náhodně rozdělena na tři díly. Určete pravděpodobnost, že ze vzniklých dílů půjde sestavit trojúhelník. Solution. Rozdělení tyče je dáno stejně jako v předchozím příkladě body řezu x a. y a jevovým prostorem je opět čtverec 2x2. Aby z částí bylo možno sestavit trojúhelník, musejí jejich délky splňovat tzv. trojúhelníkové nerovnosti, tedy součet délek libovolných dvou částí musí být větší než délka třetí části. Vzhledem k tomu, že součet délek je roven 2 m, je tato podmínka ekvivalentní podmínce, že každá s částí musí být menší než 1 m. To pomocí řezů x a. y vyjádříme tak, že nesmí platit současně x < 1 a y < 1 nebo současně x > 1 a y > 1 (odpovídá podmínkám, že krajní díly tyče jsou menší než 1), navíc \x — y\ < 1 (prostřední díl musí být menší nezjedná). Tyto podmínky splňuje vyšrafovaná oblast na obrázku a jak snadno nahlédneme, její obsah je 1 /4. 0 1o □ 63 G. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 6. RELACE A ZOBRAZENÍ -x-f □ (a) (b) (c) 1.175. Je rovnice 4*1 — V3*2 = 3, X\ — 2-\/7*2 — —2; 4*i — V3*2 = 16, x\ — 1~Jlxi = —7; 4*i + 2x2 = 7, —2*i — *2 = —3 jednoznačně řešitelná (má právě 1 řešení)? Solution. Soustava lineárních rovnic je jednoznačně řešitelná právě tehdy, když je nenulový determinant matice určené koeficienty na levé straně soustavy. Zejména tedy absolutní členy rovnic (čísla na pravé straně) neovlivňují jednoznačnost řešení soustavy. Musíme tedy ve variantách (a) a (b) dostat stejnou odpověď. Protože 4 -73 1 -277 4- (-2V7) - (-73-l) ^0, 4-(-l)-(2.(-2))=0, -2 -1 mají soustavy ve variantách (a) a (b) právě 1 řešení a poslední soustava nikoliv. Vynásobíme-li druhou rovnici v (c) číslem —2, vidíme, že tato soustava nemá řešení. □ 1.176. V M2 určete vrcholy nějakého rovnostranného trojúhelníka ABC o straně délky 1, s bodem C = [1, 1] a základnou A B rovnoběžnou s přímkou 3x + 4y = 105. 1.177. Vypočítejte obsah S čtyřúhelníku zadaného vrcholy [0,-2], [-1,1], [1,5], [1,-1]. Solution. Při obvyklém označení vrcholů A = [0,-2], S = [1,-1], C = [1,5], D = [-1,1] a neméně obvyklém rozdělení čtyřúhelníku na trojúhelníky ABC a ACD s obsahy Si a 52, dostáváme S = Si + 52 1-0 1-0 -1+2 5 + 2 + 5 1-0 5 + 2 -1-0 1+2 (7 - 1) + i (3 + 7) □ 64 CHAPTER 1. ROZCVIČKA 1.178. Určete obsah čtyřúhelníka ABCD s vrcholy A = [1, 0], B = [11, 13], C = [2, 5] a D = [-2,-5]. Solution. Čtyřúhelník rozdělíme na dva trojúhelníky ABC a ACD. Jejich obsahy pak spočítáme pomocí patřičných determinantů, viz 1.34, 1 1 5 1 1 5 2 10 13 + 2 -3 -5 □ 1.179. Spočítejte obsah rovnoběžníku s vrcholy v bodech [5, 5], [6, 8] a [6, 9]. Solution. Přestože takový rovnoběžník není zadán jednoznačně (není uveden čtvrtý vrchol), trojúhelník s vrcholy [5, 5], [6, 8] a [6, 9] musí být nutně polovinou každého rovnoběžníku s těmito třemi vrcholy (jedna ze stran trojúhelníku se stane úhlopříčkou rovnoběžníku). Proto je hledaný obsah vždy roven determinantu 6-5 6-5 1 1 8-5 9-5 3 4 □ 65 G. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 6. RELACE A ZOBRAZENÍ 1.180. Určete počet relací na množině {1, 2, 3, 4}, které jsou současně symetrické i tranzitivní. Solution. Relace uvedených vlastností je relací ekvivalence na nějaké podmnožině množiny 1.181. Určete počet relací uspořádání na tříprvkové množině. 1.182. Určete počet relací uspořádání na množině {1, 2, 3, 4} takových, že prvky 1 a 2 jsou nesrovnatelné (tedy neplatí 1 < 2 ani 2 < 1, kde < je označení uvažované relace uspořádání). 1.183. Určete počet surjektivních zobrazení / množiny {1, 2, 3, 4, 5} na množinu {1, 2, 3} takových, Solution. Každé takové zobrazení je jednoznačně dáno obrazem prvků {1, 3, 4, 5}, těchto zobrazení je tedy přesně tolik, kolik je zobrazení surjektivních zobrazení množiny {1, 3, 4, 5} na množinu 1.184. Výčtem prvků zadejte S o R, je-li R = {(2, 4), (4, 4), (4, 5)} C N x N, S = {(3, 1), (3, 2), (3, 5), (4, 1), (4, 4)) c N x N. Solution. Uvážením všech výběrů dvou uspořádaných dvojic (2, 4), (4,1); (2, 4), (4, 4); (4, 4), (4,1); (4, 4), (4,4) splňujících, že druhá složka první uspořádané dvojice, která je prvkem i?, je rovna první složce druhé uspořádané dvojice, která je prvkem 5, dostáváme □ že /(l) = f (2). {1, 2, 3}, tedy 36, jak víme z předchozího příkladu. □ 5 o i? = {(2, 1), (2, 4), (4, 1), (4,4)}. □ 1.185. Nechť je dána binární relace R = {(0, 4),(-3,0),(5,7r),(5,2),(0, 2)} mezi množinami A = Z a B = M.. Vyjádřete R~ľ a. R o R~ľ. Solution. Ihned vidíme, že R-1 {(4,0), (0,-3), (Ti, 5), (2, 5), (2,0)}. Odtud pak dále R o R'1 {(4, 4), (0, 0), (TT, Jí), (2, 2), (4, 2), (it, 2), (2, it), (2, 4)}. □ 1.186. Rozhodněte, zdaje relace R určená podmínkou Solution. V prvním případě relace R tranzitivní je, protože platí Ve druhém případě relace R tranzitivní není. Stačí např. uvážit, že 66 CHAPTER 1. ROZCVIČKA (4, 2), (2, 1) e i?, (4, 1) $ R. □ 1.187. Najděte všechny relace na M = {1, 2}, které nejsou antisymetrické. Které z nich jsou tranzitivní? Solution. Hledané relace, jež nejsou antisymetrické, jsou čtyři. Jsou to právě ty podmnožiny {1, 2} x {1, 2}, které obsahují prvky (1, 2), (2, 1) (jinak nemůže být podmínka antisymetrie porušena). Ztěch-to čtyř je tranzitivní pouze jediná relace {(1, 1), (1, 2), (2, 1), (2, 2)} = M x M, protože nezahrnutí dvojic (1,1) a (2, 2) do tranzitivní relace by znamenalo, že nemůže obsahovat 1.188. Existuje relace ekvivalence, která je současně relací uspořádání, na množině všech přímek v rovině? Solution. Relace ekvivalence (příp. relace uspořádání) musí být reflexivní, a proto každá přímka musí být v relaci sama se sebou. Dále požadujeme, aby hledaná relace byla symetrická (ekvivalence) a zároveň antisymetrická (uspořádání). To dává, že přímka může být v relaci pouze sama se sebou. Zavedeme-li ovšem relaci tak, že dvě přímky jsou v relaci právě tehdy, když jsou totožné, dostaneme „velmi přirozenou" relaci ekvivalence i relaci uspořádání. Stačí si uvědomit, že je triviálně tranzitivní. Hledanou relací je právě identické zobrazení množiny všech přímek v rovině. □ 1.189. Určete, zdaje relace na množině Z ekvivalence, uspořádání. Solution. Relace R není ekvivalencí: není symetrická (kupř. (6, 2) e R, (2,6) £ R); není 1.190. Ukažte, že průnik libovolných relací ekvivalence na libovolně dané množině X je rovněž relace ekvivalence a že sjednocení dvou relací uspořádání na X nemusí být relace uspořádání. Solution. Postupně uvidíme, že průnik relací ekvivalence je reflexivní, symetrický a tranzitivní. Všechny relace ekvivalence na X musí obsahovat dvojici (x, x) pro každé x e X, a proto ji musí obsahovat také daný průnik. Pokud v průniku ekvivalencí je prvek (x, y), musí v něm být rovněž prvek (y, x) (stačí využít toho, že každá ekvivalence je symetrická). To, že do průniku ekvivalencí náleží prvky (x, y) a (y, z), znamená, že se jedná o prvky každé z ekvivalencí. Z tranzitivnosti všech jednotlivých ekvivalencí již vyplývá, že do průniku náleží také prvek (x, z)-Zvolíme-li X = {1, 2} a relace uspořádání zároveň (1, 2) a (2, 1). □ R = {(k,l) e Z x Z; \ k\ > \l\] uspořádáním: není antisymetrická (mj. (2, —2) e R, (—2, 2) e R). □ /?i = {(1, 1), (2, 2), (1, 2)}, R2 = {(1, 1), (2, 2), (2, 1)} na X, dostáváme relaci i?1Ui?2 = {(l,l),(2,2),(l,2),(2, 1)}, která zřejmě není antisymetrická, a tedy ani uspořádáním. □ 67 G. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 6. RELACE A ZOBRAZENÍ 1.191. Na množině M = {1, 2, ..., 19, 20} je zavedena relace ekvivalence ~ tak, že a ~ b pro libovolná a, b e M právě tehdy, když první cifry čísel a, b jsou stejné. Sestrojte rozklad daný touto ekvivalencí. Solution. Dvě čísla z množiny M jsou ve stejné třídě ekvivalence, právě když jsou spolu v relaci (první cifra je stejná). Rozklad jí určený se tedy skládá z množin {1, 10, 11,..., 18, 19}, {2, 20}, {3}, {4}, {5}, {6}, {7}, {8}, {9}. □ 1.192. Je dán rozklad se dvěma třídami {b, c), {a, d, e} množiny X = {a, b, c, d, e}. Napište relaci ekvivalence R na množině X příslušnou tomuto rozkladu. Solution. Ekvivalence R je určena tím, že v relaci jsou spolu ty prvky, které jsou ve stejné třídě rozkladu, a to v obou pořadích (R musí být symetrická) a každý sám se sebou (R musí být reflexivní). Proto R obsahuje právě (a, a), (b, b), (c, c), (d, d), (e, e), (b, c), (c, b), (a, d), (a, e), (d, a), (d, e), (e, a), (e, d). □ 1.193. Na následujících třech obrázkách jsou ikony spojeny čarami tak, jak by je možná přiřadili lidé v různých částech světa. Určete, zda jde o zobrazení, zdaje injektivní, surjektivní nebo bijektivní. Solution. V prvním případě jde o zobrazení, které je surjektivní, ale není injektivní, protože had i pavouk jsou označeni jako jedovatí. Druhý případ není zobrazení ale jen relace, protože pes je určen jako domácí zvíře i na jídlo. V třetím případě máme opět zobrazení. Tentokrát není ani injektivní, ani surjektivní. □ 68 CHAPTER 1. ROZCVIČKA 1.194. Mějme množinu {a, b, c, d] a na ní relaci {(a, a), (b,b), (a,b), (b,c), (c,b)}. Jaké členy je potřeba minimálně doplnit do této relace, aby to byla ekvivalence? Solution. Postupně projdeme všechny tři vlastnosti, které definují ekvivalenci. Za prvé je to reflexivita. Musíme tedy doplnit dvojice {(c, c), (d, d)}. Za druhé symetrie -musíme doplnit (b, a) a za třetí musíme udělat tzv. tranzitivní obal. Protože je a v relaci s b a b v relaci s c, musí být i a v relaci s c. Nakonec tedy potřebujeme přidat (a, c) a (c, a). □ 1.195. Uvažme množinu čísel, které mají pět cifer ve dvojkovém zápisu a relaci takovou, že dvě čísla jsou v relaci, právě když jejich ciferný součet má stejnou paritu. Napište příslušné třídy ekvivalence. Solution. Dostáváme dvě třídy ekvivalence (o osmi členech): [10000] = {10000, 10011, 10101, 10110, 11001, 11010, 11100, 11111} odpovídá množině {16, 19, 21, 22, 25, 26, 28, 31} a [10001] = {10001, 10010, 10100, 11000, 10111, 11011, 11101, 11110} odpovídá množině {17, 18, 20, 24, 23, 27, 29, 30}. □ 1.196. Uvažme množinu čísel, které mají tři cifry ve trojkové soustavě a relaci takovou, že dvě čísla jsou v relaci, právě když v této soustavě i) začínají stejným dvojčíslím. ii) končí stejným dvojčíslím. Napište příslušné třídy ekvivalence. Solution. i) Dostáváme šest tříprvkových tříd [100] = {100, 101, 102} odpovídá {9, 10, 11} [110] = {110, 111, 112} odpovídá {12, 13, 14} [120] = {120, 121, 122} odpovídá {15, 16, 17} [200] = {200, 201, 202} odpovídá {18, 19, 20} [210] = {210, 211, 212} odpovídá {21, 22, 23} [220] = {220, 221, 222} odpovídá {24, 25, 26} ii) V tomto případě máme devět dvouprvkových tříd [100] = {100, 200} odpovídá {9, 18} [101] = {101, 201} odpovídá {10, 19} [102] = {102, 202} odpovídá {11, 20} [110] = {110, 210} odpovídá {12, 21} [111] = {111, 211} odpovídá {13, 22} [112] = {112, 212} odpovídá {14, 23} [120] = {120, 220} odpovídá {15, 24} [121] = {121, 221} odpovídá {16, 25} 69 G. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 6. RELACE A ZOBRAZENÍ [122] = {122, 222} odpovídá {17, 26} □ 1.197. Pro jaký maximální definiční obor D a obor hodnot H je zobrazení bijektivní a jaká je v tom případě inverzní funkce? i) X h-» x4 ii) X h-» x3 iii) X h-» —77 Solution. i) D = [0, oo) a H = [0, oo) nebo také D = (—oo, 0] a H = [0, oo). Inverzní funkce je ii) D = H = M a inverze je x h-> ^/x. iii) Z) = M \ {-1} a # = M \ {0}. Inverzní funkce je je h+ ± - 1. □ 1.198. Uvažme relaci nalxl. Bod je v relaci, pokud pro něj platí (x - l)2 + (y + l)2 = 1 Můžeme body popsat pomocí funkce y = f (x)? Nakreslete obrázek bodů v relaci. Solution. Nemůžeme, protože např. y = — 1 má dva vzory: x = 0 a x = 2. Body leží na kružnici se středem v bodě (1, —1) s poloměrem 1. □ 1.199. Nechť pro libovolná celá čísla k, l platí (k,l) e R právě tehdy, když je číslo 4k — 41 celočíselným násobkem 7. Je takto zavedená relace R ekvivalence, uspořádání? Solution. Uvědomme si, že dvě celá čísla jsou spolu v relaci R, právě když dávají stejný zbytek po dělení 7. Jde tedy o příklad tzv. zbytkové třídy celých čísel. Proto víme, že relace R je relací ekvivalence. Její symetrie (např. (3, 10), (10, 3) e Ä, 3 ^ 10) pak implikuje, že se nejedná o uspořádání. □ 1.200. Nechť je na množině N = {3,4,5,...,n,n + 1, ...} definována relace R tak, že dvě čísla jsou v relaci, právě když jsou nesoudělná (tedy neobsahuje-li prvočíselný rozklad uvažovaných dvou čísel ani jedno stejné prvočíslo). Zjistěte, zda je tato relace reflexivní, symetrická, antisymetrická, tranzitivní. Solution. Pro dvojici stejných čísel platí, že (n,n) £ R. Nejedná se tedy o reflexivní relaci. Být „soudělný" nebo „nesoudělný" pro dvojici čísel z N \e zřejmě vlastnost neuspořádané dvojice -nezávisí na uvedeném pořadí uvažovaných čísel, a proto je relace R symetrická. Ze symetrie relace R plyne, že není antisymetrická (např. (3, 5) e fi, 3 ^ 5). Neboť je R symetrická a (n, n) £ R pro libovolné číslo n e N, volba dvou různých čísel, která jsou spolu v této relaci, dává, že R není tranzitivní. □ 70 CHAPTER 1. ROZCVIČKA Řešení cvičení 1.34. y„ = 2(\f - 2. 1.93. i) (3, 3), (4, 4), (5, 5), (6, 6), (7, 7), (3, 6) ověřte, že jde o relaci uspořádání ii) opět (/, /) pro i — 1,..., 7 a k tomu (3, 6), (6, 3) ověřte, že jde o relaci ekvivalence iii) (/, /) pro i — 1, ..., 7 a k tomu (3, 6), (6, 3), (4, 6), (6, 4) ověřte, že nejde o relaci ekvivalence, protože není splněna tranzitivita. 1.104. Tři různé Hasseovy diagramy vyhovujících uspořádání. Celkem 5! + 5! +51/4 — 270. 7.775. a) 1 - 3 - 2/ + 4/ = -2 + 2i, 1 • (-3) - 8/2 + 6/ + 4i = 5 + 10«, 1 + 2i, J42 + (-3)2 = 5, = fi% = 1 . (-3) + 8/2 + 6/ - 4/25 = -ii + Ä/. Z2 \Z2\ 25 25 b) 2 +i, 2/2, 1, l = -2/. 7.725. (3-46 + 2-2)-2-47! 7.737. i) 26 = 64 ii) 0 = 15 iii) Žádná panna je jedna možnost Q — 1, jedna panna (j) — 6 možností. Posloupností s nejvýše jednou pannou je teda jen 7 a proto posloupností, kde jsou aspoň dvě panny je 64 — 7 — 57. 1.141. Maximální počet yn částí, na které rozdělí n kružnic rovinu, je yn — y«-i + 2(n — 1), yi = 2, tedy y„ = n2 - n + 2. Pro maximální počet pn částí, na které potom rozdělí n koulí prostor, pak dostáváme rekurentní vztah pn+i = p„ + y„, pi = 2, tedy celkem pn = |(n2 - 3n + 8). 7.756. 4! • 4! _ 27 1_^T= 35 24 7 757 42 _ř._řj/. 54. 1.176. Směry stran jsou (3V3/2 — 2, 3/2 + 2\/3) a (3V3/2 + 2, 2\/3 — |). Jedna ze dvou možných dvojic potom je a - l 10 + 5, 5 + 10j. a - l 10 + 5, 10 + 5 j, 7.757. 19. 7.782. 87. 71 CHAPTER 2 Elementární lineární algebra neumíte ještě počítat se skaláry? — zkusme to rovnou s maticemi... Mé V minulé kapitole jsme se snad rozehřáli s relativně jednoduchými úlohami, k jejichž řešení nebylo potřeba složitých nástrojů. Vystačili jsme si přitom se sčítáním a násobením skalárů. V této a dalších kapitolách se postupně budeme věnovat jednotlivým tématům souvisleji. Hned tři kapitoly budou věnovány nástrojům pro práci s daty, kdy operace spočívají v obzvlášť jednoduchých úkonech se skaláry, jen je těch skalárů povíce naráz. Hovoříme o "lineárních objektech" a "lineární algebře". Jakkoliv to teď může vypadat jako hodně speciální nástroj, uvidíme později, že složitější objekty a závislosti stejně studujeme hlavně pomocí jejich "lineárních přiblížení". V této kapitole budeme pracovat přímo s konečnými , (V3) a ■ (b ■ v) = (a ■ b) ■ (V4) 1 • v = v w ■ v 14 CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA Vlastnosti (V1)-(V4) našich vektorů, coby n-tic skalárů v K", se snadno ověří pro kterýkoliv okruh skalárů K, protože při ověřování vždy používáme pro jednotlivé souřadnice vektorů pouze vlastnosti skalárů uvedené v 1.1 a 1.3. Budeme takto pracovat např. s 1", Q", C", ale také Z", (Zk)",n = 1,2,3, .... 2.2. Matice nad skaláry. O něco složitějším objektem, který budeme při práci s vektory používat, jsou matice. _——_Matice typu m/n [ Maticí typu m /n nad skaláry schéma Asm řádky a n sloupci / «11 «12 «21 «22 rozumíme obdélníkové «i« \ «2« nn J kde ciij e \am\ «m2 • • • pro všechny 1 < i < m, 1 < j < n. Pro matici A s prvky atj používáme také zápis A = (aij). Vektory (au, ai2, ..., aín) e K" nazýváme (/-té) řádky matice A, i = 1, ..., m, vektory (ci\j, a2j, ..., amj) e W" nazýváme (7—té) sloupce matice A, j = \, ... ,n. Matici můžeme také chápat jako zobrazení A : {1, ...,m} x {1, ...,n} -» K, kde A(/, 7) = ciij. Matice typu 1/n nebo n/1 jsou vlastně právě vektory v K". I obecné matice lze chápat jako vektory v Km'n, prostě zapomeneme na řádkování. Zejména tedy je definováno sčítání matic a násobení matic skaláry: A + B = (ciij + bij), a ■ A = (a ■ a^) kde A = (aij), B = (bij), aéI. Matice — A = (—aij) se nazývá matice opačná k matici A a matice /O ... 0\ 0 = : : v° ••• V se nazývá nulová matice. Zapomenutím řádkování tak získáme následující tvrzení, že matice jsou jen specificky zapsané vektory: Proposition. Předpisy pro A + B, a ■ A, —A, 0 zadávají na množine všech matic typu m In operace sčítání a násobení skaláry splňující axiomy (VI )—(V4). 2.3. Matice a rovnice. Velmi častý nástroj pro popis nějakých matematických modelů jsou systémy lineárních rovnic. Právě matice lze vhodně využít pro jejich zápis. Zavedeme si k tomu účelu pojem skalární součin dvou pak dostáváme: 0, 5 0, 125 0, 2 0,25 0,75 0,2 0, 25 0, 125 0, 6 1 0,25 0,4 540 0 2,75 0,4 0 0,25 2 0,25 0,4 I 8 II 1,6 zpětně vypočítáme -21 600 1 0,25 0,4 1 3 0,8 1 0,5 2,4 540 1080 1080 1 0,25 0,4 540 2160 2160 0 11 1, 0,4 540 2160 -21600 250, y 2 160 - 8 • 250 = 160, x = 540 - 0, 4 • 250 - 0, 25 • 160 = 400. Je tedy potřeba smísit po řadě 400 1, 160 1, 250 1 uvedených barev. □ Xi 1x\ -3*1 2, -3, -3. 2.2. Vypočtěte + 2x2 + 3x3 — 3x2 — X3 + x2 + 2x3 Solution. Zadanou soustavu lineárních rovnic zapíšeme ve tvaru rozšířené matice 12 3 2 -3 -1 -3 1 2 kterou pomocí elementárních řádkových transformací postupně převedeme na schodovitý tvar 1 2 ■1 -7 3 -7 11 -7 1 2 3 2 \ / 1 2 3 2 0 1 1 1 ~ A 0 1 1 1 0 0 4 -4/ W 0 1 -1 Nejdříve jsme přitom dvojnásobek prvního řádku odečetli od druhého a jeho trojnásobek přičetli ke třetímu. Poté jsme sečetli druhý a třetí řádek (součet napsali do třetího řádku) a druhý řádek vynásobili číslem 1 /7. Přejdeme nyní zpět k soustavě rovnic x\ + 2x2 + 3x3 = 2, x2 + x3 = x3 = Ihned vidíme, že X3 = — 1. Dosadíme-li X3 = — 1 do rovnice x2 +X3 = 1, dostaneme x2 = 2. Podobně dosazení získaných hodnot x3 = — 1, x2 = 2 do první rovnice dává x\ = 1. □ Systémy lineárních rovnic tedy lze zapisovat v maticovém tvaru. Ale je to nějaká výhoda, když je stejně umíme řešit, aniž bychom 1, -1. 75 A. SOUSTAVY LINEÁRNÍCH ROVNIC 1. VEKTORY A MATICE hovořili o maticích? Ano je, o řešení můžeme hovořit koncepčněji, snadno v řeči matic určíme, kolik má soustava řešení a jazyk matic pak daleko lépe navádí k počítačovému zpracování problému. Zkusme si tedy osvojit lépe různé operace, které můžeme s maticemi provádět. Jak jsme viděli v předchozích příkladech, tak ekvivalentní úpravy lineárních rovnic odpovídají v řeči matic elementárním řádkovým (sloupcovým) úpravám. Dále jsme viděli, že převedeme-li těmito úpravami matici soustavy do schodovitého tvaru (tomuto procesu říkáme Gaussova eliminace, viz 2.7), tak je již vyřešení soustavy velmi jednoduché. Ukažme si to ještě na dalších příkladech, na kterých uvidíme, že soustava lineárních rovnic může mít nekonečně mnoho řešení. 2.3. Vyřešte soustavu lineárních rovnic 2*1 — *2 + 3x3 = 0, 3xi + 16x2 + 7x3 = 0, 3xi — 5x2 + 4x3 = 0, -7*i + 7x2 + -10jc3 = 0. Solution. Vzhledem k nulovosti pravých stran všech rovnic (jedná se tedy o homogenní systém) budeme upravovat pouze matici systému. Řešení nalezneme převodem na schodovitý tvar pomocí elementárních řádkových transformací, které odpovídají záměně pořadí rovnic, vynásobení rovnice nenulovým číslem a přičítání násobků rovnic. Navíc můžeme kdykoli od maticového zápisu přejít zpět k zápisu rovnic s neznámými x;. Postupně dostáváme: / 2 -1 3 \ / 2 V -7 16 -5 7 7 4 ■10 ) -1 35/2 -7/2 7/2 3 \ 5/2 -1/2 1/2 ) -1 7 0 0 Odtud je vidět, že druhá, třetí a čtvrtá rovnice jsou násobky rovnice 7x2 + x3 = 0. Pokračujme však v úpravách matice: / 2 -1 3 \ /2 -1 3 \ / 2 35/2 5/2 I , 0 35/2 5/2 1 , 0 -7/2 -1/2 0 0 0 0 7/2 1/2 ) \ 0 0 0 / \ 0 Přestože byly zadány čtyři rovnice pro tři neznámé, má celá soustava nekonečně mnoho řešení, neboť pro libovolné x3 e M mají zbylé rovnice 2*i — *2 + 3*3 = 0, 7*2 + *3 = 0 řešení. Nahradíme tak proměnnou *3 parametrem t e M a vyjádříme 3\ 1 0 °7 x2 1 1 *3 = — — t 1 1 Pokud ještě nahradíme t = tvaru (*1, *2, *3) a *i 1 11 (*2 - 3*3) = -— t. 2 1 -Is, obdržíme výsledek v jednoduchém (11a, s, -Is) , sěR. vektorů, který vektorům (a\, ... ,a„) a (*i, ...,*„) přiřadí jejich součin («i, ..., a„) •(*!,..., *„) = «1*1 + • • • + anxn tj. postupně násobíme po dvou souřadnice vektorů a výsledky sčítáme. Každý systém m lineárních rovnic v n proměnných flii*i + fiti2*2 + • • • + a\nx„ = b\ &2\x\ + <*22x2 + • • • + 0-2nxn = ^2 &m\x\ "i- ^m2x2 ~\~ ' ' ' ~\~ &mnxn — bm lze tedy vidět jako požadavek na hodnoty m skalárních součinů neznámého vektoru (*i, ..., *„) s vektory souřadnic (an, ..., ain). Vektor proměnných můžeme také vidět jako sloupec v matici typu n /1, a podobně hodnoty b\, ... ,bn můžeme vnímat jako vektor m a to opět jako 5 jediný sloupec v matici typu n/1. Náš systém rovnic lze pak formálně psát ve tvaru A ■ x = u takto: n\ lxl\ /bl\ \Clm\ . . . dynnJ \xnJ \bmJ kde levou stranu interpretujeme jako m skalárních součinů jednotlivých řádků matice vytvářejících sloupcový vektor, jehož hodnotu rovnice určují. To znamená, že skutečně rovnost /-tých souřadnic zadává podmínku původní rovnice ai\x\ + • • • + 0.inxn = bi a zápis A-x = u tak dává skutečně původní systém lineárních rovnic. 2.4. Součin matic. V rovině, tj. pro vektory dimenze 2, jsme už zavedli počet s maticemi a viděli jsme, že s ním lze pracovat velice efektivně (viz 1.26). Nyní budeme postupovat obecněji a zavedeme ^— všechny nástroje již známé z roviny pro všechny dimenze n. Násobení matic je možné definovat pouze, když to rozměry sloupců a řádků v maticích dovolí, tj. když je pro ně definován skalární součin jako výše: J Součin matic j Pro libovolnou matici A = (a^) typu m/n a libovolnou j matici B = (bjk) typu n/q nad okruhem skalárů K definujeme jejich součin C = A ■ B = (cik) jako matici typu m/q s prvky n cik = ^^dijbjk, pro libovolné í < i < m, \ < k < q. 7=1 76 CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA Je tedy prvek C[ik] součinu právě skalárním součinem i-tého řádku matice nalevo a &-tého sloupce matice napravo. Například máme C -O ■(-. l i) - (3 .o) 2.5. Čtvercové matice. Je-li v matici stejný počet řádků a sloupců, hovoříme o čtvercové matici. Počet řádků a sloupců pak nazýváme také dimenzí matice. Matici /l ... 0\ v° ••• v se říkáj'e 1 proto netvoří obor integrity, zejména tedy nejsou ani (nekomutativním) tělesem. Proof. Asociativita násobení - (Ol): Protože skaláry jsou asociativní, distributivní i komutativní, můžeme pro tři matice A = (ciij) typu m/n, B = (bjk) typu n/p a C = (ckl) typu p Iq spočíst A ■ B □ (A-B)-C A-(B-C) j (Z(Z^ B ■ C 'ft ) -Ckl 'ft -Ckl (Y.bjk.ck^j, Všimněme si, že jsme při výpočtu vycházeli z toho, že je jedno v jakém pořadí uvedené součty a součiny provádíme, tj. využívali jsme podstatně našich vlastností skalárů. Velmi snadno vidíme, že násobení jednotkovou maticí má skutečně vlastnost jednotkového prvku: /l 0 ••• 0\ 0 1 ••• 0 A ■ E \am\ • • • ammJ q a stejně pro násobení E zleva. 2.4. Nalezněte všechna řešení soustavy lineárních rovnic 3*1 + 3x3 — 5x4 = —8, X\ — X2 + X3 — X4 = - —2x\ — X2 + 4x3 — 2x4 = 2x\ + X2 — X3 — X4 = - Solution. Soustavě rovnic odpovídá rozšířená matice -2, 0, -3. / 3 1 -2 V 2 0 -1 -1 1 3 1 4 -1 \ -3 / Záměnou pořadí řádků (rovnic) potom obdržíme matici / 1 2 ■1 1 1 ■1 ■1 4 3 \ 3 0 kterou převedeme na schodovitý tvar: -2\ -3 0 / / 1 -1 1 -1 ~2\ / 1 -1 1 -1 "2\ 2 1 -1 -1 -3 0 3 -3 1 1 -2 -1 4 -2 0 0 -3 6 -4 -4 v 3 0 3 -5 "8 ) V° 3 0 -2 / 1 -1 1 -1 / 1 -1 1 -1 ~2\ 0 3 -3 1 1 0 3 -3 1 1 0 0 3 -3 -3 0 0 3 -3 -3 1° 0 3 -3 "3 / 1° 0 0 0 0 / Soustava bude mít nekonečně mnoho řešení, neboť dostáváme tři rovnice pro čtyři neznámé, které mají právě jedno řešení pro každou volbu proměnné x4 e M. Neznámou x4 proto nahradíme parametrem t e M a od maticového zápisu přejdeme zpět k rovnicím xi - x2 + X2 3x2 Z poslední rovnice máme x3 potom dává X3 3x3 3x3 + t t 3t -2, 1, -3. t — 1. Dosazení za x3 do druhé rovnice 3x2 - 3ř + 3 + t = 1, tj. x2 - (2t 3 v 2) Konečně podle první rovnice je 1 (2t - 2) + t - 1 - t = -2, tj. 1 (2t - 5). Množinu řešení můžeme tudíž zapsat (pro ř (Xi, X2, X3, X4) ( 5 2 2s--, 2s--, 3s 3 3 3s) ve tvaru - 1, 3s s e Nyní se vraťme k rozšířené matici naší soustavy a upravujme ji dále užitím řádkových transformací tak, aby (při schodovitém tvaru) 77 A. SOUSTAVY LINEÁRNÍCH ROVNIC 1. VEKTORY A MATICE první nenulové číslo každého řádku (tzv. pivot) bylo právě číslo 1 a aby všechna ostatní čísla v jeho sloupci byla 0. Platí /1 -1 1 -1 ~2\ l 1 -1 1 -1 -2 \ 0 3 -3 1 1 0 1 -1 1/3 1/3 0 0 3 -3 -3 0 0 1 -1 -1 \o 0 0 0 o ) \ 0 0 0 0 o ) /1 -1 0 0 -1 \ /1 0 0 -2/3 -5/3 \ 0 1 0 - -2/3 -2/3 0 1 0 -2/3 -2/3 0 0 1 -1 -1 0 0 1 -1 -1 0 0 0 0 ) 0 0 0 0 přičemž nejdříve jsme vynásobili druhý a třetí řádek číslem 1 /3, pak přičetli třetí řádek ke druhému a jeho (—1)násobek k prvnímu a na závěr přičetli druhý řádek k prvnímu. Z poslední matice snadno dostáváme výsledek /-5/3\ /2/3\ 2/3 X2 x3 \x4; -2/3 -1 V 0 / + t i V 1 / t e Volné proměnné jsou totiž ty, jejichž sloupce neobsahují žádného piv-ota (v našem případě neobsahuje pivota čtvrtý sloupec, je tedy volná čtvrtá proměnná, tj. používáme ji jako parametr). □ 2.5. Určete řešení systému rovnic 3*i + 3x3 X\ — X2 ~\~ X3 — 2X\ — X2 + 4X3 2xi -\- X2 — x 3 5X4 X4 2x4 X4 -2, o, -3. Solution. Uvědomme si, že soustava rovnic v tomto příkladu se od soustavy z předešlého příkladu liší pouze v hodnotě 8 (místo —8) na pravé straně první rovnice. Provedeme-li totožné řádkové úpravy jako v minulém příkladu, obdržíme / 3 0 3 -5 8 \ ( 1 -1 1 -1 "2\ 1 -1 1 -1 -2 2 1 -1 -1 -3 — 2 -1 4 -2 0 -2 -1 4 -2 0 v 2 1 -1 -1 S) 3 0 3 -5 8 / 1 1 -2\ / 1 -1 1 -1 0 3 -3 1 1 0 3 -3 1 1 0 0 3 3 -3 0 0 3 -3 -3 ^ 0 0 3 3 13 ) 0 0 0 16; kde poslední úpravou bylo odečtení třetího řádku od čtvrtého. Ze čtvrté rovnice 0 = 16 vyplývá, že soustava nemá řešení. Vyzdvihněme, že při úpravě na schodovitý tvar obdržíme rovnici 0 = a pro nějaké a ^ 0 (tj. nulový řádek na levé straně a nenulové číslo za svislou čarou) právě tehdy, když soustava nemá řešení. □ Další příklady na systémy lineárních rovnic naleznete na straně 123 Zbývá ukázat distributivitu násobení a sčítání. Opět díky distributivitě skalárů snadno spočteme pro matice A = (útý) typu m/n, B = (bjk) typu n/p, C = (cjk) typu n/p, D = (dkl) typu p Iq A-(B+C) = [Yaijibjk + cjk)\ j = (£>A*) + (Z%c^)) = A • S + A • C j j (B + C)D = + clk)dH) = ( + E^")) = BD + CD. ^ k k ' Jak jsme již viděli v 1.26, dvě matice dimenze 2 nemusí komutovat: /i o\ /o 1W0 i\ \o o)\o 0) \o 0) (o i\ (1 owo o\ Tím jsme získali zároveň protipříklad na platnost (02) i (01). Pro matice typu 1/1 ovšem oba axiomy samozřejmě platí, protože je mají samy skaláry. Pro větší matice získáme protipříklady snadno tak, že právě uvedené matice umístíme do levého horního rohu příslušných čtvercových schémat a doplníme nulami. (Ověřte si sami!) □ V důkazu jsme vlastně pracovali s maticemi obecnějšího typu, dokázali jsme tedy příslušné vlastnosti obecněji: Asociativita a distributivita násobení matic [— Corollary. Násobení matic je asociativní a distributivní, tj. A ■ (B ■ C) = (A ■ B) ■ C A ■ (B + C) = A ■ B + A ■ C, kdykoliv jsou všechny uvedené operace definovány. Jednotková matice je neutrálním prvkem pro násobení zleva i zprava. 2.6. Inverzní matice. Se skaláry umíme počítat tak, že z rovnosti a-x = b umíme vyjádřit x = a~l - b, *'__kdykoliv inverze k a existuje. Podobně bychom to chtěli umět i s maticemi, máme ale problém, jak poznat, zda taková existuje, a jak ji spočítat. Říkáme, že B je matice inverzní k matici A, když A ■ B = B ■ A = E. Píšeme pak B = A~l a z definice je samozřejmé, že obě matice musí mít být čtvercové se stejnou dimenzi n. Matici, k níž existuje matice inverzní, říkáme invertibilní matice nebo také regulární čtvercová matice. 78 CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA V následujících odstavcích mimo jiné odvodíme, že B je inverzní k A, jakmile platí jedna z požadovaných identit (tj. druhá je pak důsledkem). Pokud A-1 a B~l existují, pak existuje i inverze k součinu A • B (2.1) (A • B)'1 = B~l ■ A-1. Je totiž, díky právě dokázané asociativitě násobení, B~l ■ (A-1 ■ A) ■ B = E = E. (S-1 • A-1) • (A • B) (A-B)- (B~l ■ A-1) A ■ (B ■ B~l) ■ A-1 Protože s maticemi umíme počítat podobně jako se jg^ skaláry, jen mají složitější chování, může nám existence inverzní matice skutečně hodně pomoci s řešením systémů lineárních rovnic: Jestliže vyjádříme soustavu n rovnic pro n neznámých součinem matic A • x an a\„ \ (x1\ (bl\ \pmj a jestliže existuje matice inverzní k matici A, pak lze násobit zleva A-1 a dostaneme A-1 • u = A-1 ■ A ■ x = E ■ x = x, tj. A-1 • u je hledané řešení. Naopak rozepsáním podmínky A • A-1 = E pro neznámé skaláry v hledané matici A-1 dostaneme n systémů lineárních rovnic se stejnou maticí na levé straně a různými vektory napravo. 2.7. Ekvivalentní úpravy matic. Zkusme se praktičtěji zorientovat v předchozí úvaze o systémech rovnic a jejich maticích. Samozřejmě nás nalezení inverzní matice stojí jisté úsilí - větší než přímé vyřešení rovnice. Podstatné však je, že pokud máme mnohokrát za sebou řešit systémy se stejnou maticí A ale různými pravými stranami u, pak se nám nalezení A-1 opravdu hodně vyplatí. Z hlediska řešení systémů rovnic A ■ x = m je jistě přirozené považovat za ekvivalentní matice A a vektory u, které zadávají systémy rovnic se stejným řešením. Zkusme se teď zamyslet nad možnostmi, jak zjednodušovat matici A tak, abychom se k řešení blížili. Začneme jednoduchými manipulacemi s řádky rovnic, které řešení ovlivňovat nebudou, a stejným způsobem pak můžeme upravovat i vektor napravo. Když se nám u čtvercové matice podaří vlevo dostat systém s jednotkovou maticí, bude napravo řešení původního systému. Pokud při našem postupu nějaké řádky úplně vypadnou (při úpravách se vynulují), bude to také dávat další přímé informace o řešení. Naše jednoduché úpravy jsou: B. Manipulace s maticemi V této podkapitole budeme pracovat pouze s maticemi, abychom si osvojili jejich vlastnosti. 2.6. Násobení matic. Provedlte násobení matic a zkontrolujte si výsledek. Všimněte si, že proto, abychom mohli ivě matice násobit je nutná a postačující podmínka, aby měla první matice stejně sloupců, jako druhá řádků. Počet řádků výsledné matice je pak dán počtem řádků první matice, počet sloupců je roven počtu sloupců druhé matice. in IV C -2. 0 GO-0 -')• /12 7 1 -5\ \3 0 5 4 )' 7 lč VI Remark.Body i) a ii) v předchozím příkladu ukazují, že násobení čtvercových matic není komutativní, v bodě iii) vidíme, dané obdélníkové matice můžeme mezi sebou násobit pouze v jednom ze dvou možných pořadí. V bodech iv) a v) si pak všimněme, že (A • B)T = BT -AT. 2.7. Vypočítejte A5 a A 3, je-li li 2 -1 1 -1 2 -1 0 0 1 2.8. Nechť je B Lze matici A převést na matici B pomocí elementárních řádkových transformací (pak říkáme, že jsou řádkově ekvivalentní)? Solution. Obě matice jsou zřejmě řádkově ekvivalentní s trojrozměrnou jednotkovou maticí. Snadno se vidí, že řádková ekvivalence na množině všech matic daných rozměrů je relací ekvivalence. Matice A a B jsou tudíž řádkově ekvivalentní. □ 79 B. MANIPULACE S MATICEMI 1. VEKTORY A MATICE 2.9. Nalezněte nějakou matici B, pro kterou je matice C = B ■ A ve schodovitém tvaru, kde -1 -3 -3 -5 Elementární řádkové transformace /3 5 1 V7 A 3 0 1 Solution. Budeme-li matici A postupně násobit zleva elementárními maticemi (uvažte, jakým řádkovým úpravám toto násobení matic odpovídá) 0 1 1 ' 1 0 0 0 1 0 0 -5 1 0 0 1 — 1 0 0 0 0 0 1 0 V° 0 0 v \ v 0 0 0 v (i 0 0 o\ /l 0 0 °\ 0 1 0 0 0 1 0 0 — -3 0 1 0 , E4 = 0 0 1 0 ^° 0 0 h v-7 0 0 v íl 0 0 0^ /i 0 0 °\ 0 1/3 0 0 77 0 1 0 0 0 0 1 0 , ^6 = 0 -2 1 0 0 0 \ V° 0 0 v íl 0 0 °\ /i 0 0 °\ 0 1 0 0 77 0 1/4 0 0 0 0 1 0 ^8 = 0 0 1 0 -4 0 v 0 0 v obdržíme S = EsE1E6E5E4Et,E2Ei 0 1 °\ 0 1/12 -5/12 0 1 -2/3 1/3 0 -4/3 -1/3 V c /l -3 0 1 0 o \o o -5 0 \ 9/4 1/4 0 0 0 0 j □ VAI11 V A I , a,. V Všimněte si, že C je uzavřená na a + W splňuje f(M + N) f(M) + /(AO i 2.10. Komplexní čísla jako matice. Uvažme množinu matic 1 a> iäM' a násobení matic a dále ukažte, že přiřazení / : C 7(Tľb\ \-b a) f(M ■ N) = f(M) ■ f(N) (na levých stranác rovností se jedná o sčítání a násobení matic, na pravých o sčítání a násobení komplexních čísel). Na množinu C spolu s násobením a sčítáním matic lze tedy nahlížet jako na těleso C komplexních čísel. Zobrazení / se pak nazývá izomorfismem (těles). Je tedy například 69 13N -13 69; / 3 5\ /8 -9\ _ / 69 13\ \-5 3J ' {? 8 ) ~ \-13 69/ • záměna dvou řádků, • vynásobení vybraného řádku nenulovým skalárem, • přičtení řádku k jinému řádku. Těmto operacím říkáme elementární řádkové transformace. Je zjevné, že odpovídající operace na úrovni rovnic v systému skutečně nemohou změnit množinu všech jeho řešení, pokud je náš okruh oborem integrity. mm^mmmmmmJi Analogicky, elementární sloupcové transformace matic jsou • záměna dvou sloupců, • vynásobení vybraného sloupce nenulovým skalárem, • přičtení sloupce k jinému sloupci, ty však nezachovávají řešení příslušných rovnic, protože mezi sebou míchají samotné proměnné. Systematicky můžeme použít elementární řádkové úpravy k postupné eliminaci proměnných, z Postup je algoritmický a většinou se mu říká fesfcr^ Gaussova eliminace proměnných. \ Gaussova eliminace proměnných |_ Proposition. Nenulovou matici nad libovolným okruhem skalárů K lze konečně mnoha elementárními řádkovými transformacemi převést na tzv. (řádkově) schodovitý tvar: • Je-li aft = 0 pro všechna k = 1, ..., j, potom ay = 0 pro všechna k > /, • je-li CL(i-\)j první nenulový prvek na (i — \)-ním řádku, pak cii j = 0. Proof. Matice v řádkově schodovitém tvaru vypadá takto /O ... 0 aXj ......... alm\ 0 ... 0 0 ... a2k ... a2„. 0 V 0 alp I a matice může, ale nemusí, končit několika nulovými řádky. K převodu libovolné matice můžeme použít jednoduchý algoritmus, kterým se postupně, řádek za řádkem, blížíme k výslednému schodovitému tvaru: Algoritmus Gaussovy eliminace (1) Případnou záměnou řádků docílíme, že v prvním řádku bude v prvním nenulovém sloupci nenulový prvek, nechť je to y-tý sloupec. (2) Pro i = 2, ..., vynásobením prvního řádku prvkem atj, /-tého řádku prvkem a\j a odečtením vynulujeme prvek aij na /-tém řádku. (3) Opakovanou aplikací bodů (1) a (2), vždy pro dosud neupravený zbytek řádků a sloupců v získané matici 80 CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA dospějeme po konečném počtu kroků k požadovanému tvaru. Tím je tvrzení dokázáno □ Uvedený postup je skutečně právě obvyklá eliminace proměnných v systémech lineárních rovnic. Zcela analogickým postupem definujeme sloupcově schodovitý tvar matic a záměnou řádkových na sloupcové transformace obdržíme algoritmus převádějící matici na takový tvar. což odpovídá tomu, že (3 + 5/) • (8 — 9/) = 69 — 13/. 2.11. Vyřešte maticové rovnice (3 s)'Xl = (3 4)' X2-Q s) = (3 4)" Solution. Zjevně neznámé X\ a X2 musejí být matice 2x2 (aby uvažované součiny matic existovaly a výsledkem byla matice 2 x 2). Položme X, h bj), x2 = h bň \c\ di J \c2 d2) Remark. Gaussovu eliminaci jsme zformulovali pro obecné a roznásobme matice v první zadané rovnicL Ma platit skaláry z nějakého okruhu. Zdá se být přirozené, že ve schodovitém tvaru ještě vynásobením vhodnými skaláry dosáhneme jednotkových koeficientů na výsledné nenulové "diagonále" nad nulami v matici a dopočítáme řešení. To ale pro obecné skaláry nepůjde, představte si třeba celá čísla Z. Pro řešení systémů rovnic nemá ale vůbec uvedený postup rozumný smysl, když jsou mezi skaláry dělitelé nuly. Promyslete si pečlivě rozdíl mezi K = Z, K = M a případně Z2 nebo Z4. 2.8. Matice elementárních transformací. V dalším budeme už pracovat jen s polem skalárů K, každý nenulový skalár tedy má inverzní prvek. Všimněme si, že elementární řádkové (resp. sloupcové) transformace odpovídají vynásobením zleva (resp. zprava) následujícími maticemi: (1) Přehození /-tého a 7-tého řádku (resp. sloupce) /i 0 o '•. V 1/ (2) Vynásobení /-tého řádku (resp. sloupce) skalárem a: í1 \ 1/ ( a\ + 3ci b\ + 3 (Ar-S)_1 = [-1 1 — 1 I - 1 —4 -2 11 0 -2 3 / \ 3 2-9; -14 -9 42 -10 -5 27 17 10 -49> 2.14. Vypočítejte inverzní matici k matici 'l 0 -2\ 2 -2 1 v5 -5 2 2.15. Nalezněte inverzní matici k matici /8 3 0 0 0\ 5 2 0 0 0 0 0-100 0 0 0 1 2 \0 0 0 3 5/ 2.16. Zjistěte, zda existuje inverzní matice k matici /ll 1 1\ 11-11 1-1 1 -1 v -1 -1 1/ Pokud ano, určete tuto matici C-1. 2.17. Stanovte A-1, je-li (a) A = ^ ^. přičemž i je imaginární jednotka; □ 2.18. Napište inverzní matici k n x n matici (n > 1) 12-n 1 ••• 1 1 \ 1 2-n ■■. ■■. 1 1 V 1 2-n 1 1 2-n) 83 C. PERMUTACE 1. VEKTORY A MATICE C. Permutace Abychom mohli definovat stěžejní pojem kalkulu matic, totiž determinant, je nutné se věnovat permutacím (bijekcím na konečné množině), zejména pak jejich paritě. Pro zápis permutací (tj. bijektivních zobrazení na dané konečné množině) budeme používat tzv. dvouřádkový zápis, (viz 2.14) V prvním řádku uvedeme všechny prvky uvažované množiny, libovolný sloupeček je pak tvořen dvojicí vzor, obraz (v dané permutaci). Protože permutace je bijekce, je druhý řádek vskutku permutací (pořadím) řádku prvního, v souladu s názvoslovím používaným v kombinatorice. 2.19. Rozložte permutaci _/l 2345678 9\ a~\3 1 67 8954 2/ Na součin transpozic. Solution. Nejprve rozložíme permutaci na součin nezávislých cyklů: začneme s prvním prvkem (jedničkou) a ve druhém řádku odečteme, na jaký prvek se v dané permutaci zobrazuje. Je to trojka. Nyní se podíváme na sloupeček začínající trojkou a odečteme z něj, že se zobrazuje na šestku, atd. Pokračujeme tak dlouho, dokud se nám nějaký prvek nezobrazí na počáteční prvek (v tomto případě jedničku). Dostáváme následující posloupnost prvků, které se na sebe v dané permutaci zobrazují: 1 i—> 3 i—> 6 i—> 9 i—> 2 i—> 1. Zobrazení, které zobrazuje prvky výše uvedeným způsobem je tzv. cyklus (viz 2.16), který zapisujeme (1, 3, 6, 9, 2). Nyní vezmeme prvek, který není obsažený v získaném cyklu a opakujeme s ním postup jako z jedničkou. Dostáváme cyklus (4, 7, 5, 8). Z postupu vyplývá, že musí být nezávislý na prvním. Každý prvek z dané množiny ({1, 2, ..., 9}) se již vyskytuje v některém z cyklů, můžeme tedy psát: a = (l,3,6,9,2)o(4,7,5,8). Pro cykly je rozklad na permutace jednoduchý. Je totiž (1, 3, 6, 9, 2) = (1, 3)o(3, 6)o(6, 9)o(9, 2) = (1, 3)(3, 6)(6, 9)(9, 2). Celkem dostáváme: a = (1, 3)(3, 6)(6, 9)(9, 2)(4, 7)(7, 5)(5, 8). □ Remark. Upozorněme, že operace o je skládání zobrazení, je nutné tedy zobrazení ve složení provádět "odzadu" tak, jak jsme u skládání Jestliže existuje lineární kombinace daných řádků s alespoň jedním nenulovým skalárním koeficientem, jejímž výsledkem je nulový řádek, říkáme, že jsou tyto řádky lineárně závislé. V opačném případě, tj. když jedinou možností jak získat nulový řádek je vynásobení výhradně nulovými skaláry, jsou tyto řádky lineárně nezávislé. Obdobně definujeme lineárně závislé a nezávislé sloupce matice. Předchozí výsledky o Gausově eliminaci můžeme teď ď i. intepretovat tak, že počet výsledných nenulových "schodů" v řádkově nebo sloupcově schodovitém tvaru je vždy roven počtu lineárně nezávislých řádků \fi matice, resp. počtu lineárně nezávislých sloupců matice. Označme E h matici z věty 2.9 s h jedničkami na diagonále a předpokládejme, že dvěma různými postupy dostaneme různá h' < h. Pak ovšem podle našeho postupu budou existovat také invertibilní matice P a. Q takové, že P-Eh,-Q = Eh. V součinu Ehi ■ Q bude více nulových řádků ve spodní části matice, než kolik má být jedniček v Eh a přitom se k nim máme dostat už jen řádkovými transformacemi. Zvýšit počet lineárně nezávislých řádků ale pomocí elementárních řdákových transformací nelze. Proto je počet jedniček v matici P -A-Q ve větě 2.9 nezávislý na volbě našeho postupu eliminace a je roven jak počtu lineárně nezávislých řádků v A, tak počtu lineárně nezávislých sloupců v A. Tomuto číslu říkáme hodnost matice a značíme je h (A). Zapamatujme si výsledné tvrzení: Theorem. Nechť A je matice typu m/n nad polem skalárů K. Matice A má stejný počet h( A) Unárně nezávislých řádků a lineárně nezávislých sloupců. Zejména je hodnost vždy nejvýše rovna menšímu z rozměrů matice A. Algoristmus pro výpočet inverzních matic také říká, že čtvercová matice A dimenze m má inverzi, právě když je její hodnost rovna počtu řádků m. 2.12. Matice jako zobrazení. Zcela stejně, jak jsme s maticemi pracovali v geometrii roviny, viz 1.29, můžeme každou čtvercovou matici A interpretovat jako zobrazení A : x A ■ x. Díky distributivitě násobení matic je zřejmé, jak jsou zobrazovány lineární kombinace vektorů takovými zobrazeními: A • (a x + b y) = a (A • x) + b (A • y). Přímo z definice je také vidět (díky asociativitě násobení matic), že skládání zobrazení odpovídá násobení matic v daném pořadí. Invertibilní matice tedy odpovídají bijek-tivním zobrazením. 84 CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA tady byla ještě ukázka matic rotací - patrně budou v příkladech, tak jsou tady vyprocentované Z tohoto pohledu je velice zajímavá věta 2.9. Můžeme ji číst tak, že hodnost matice určuje, jak velký je obraz celého W v tomto zobrazení. Skutečně, je-li A = P ■ Ek ■ Q s maticí Ek s k jedničkami jako v 2.9, pak invertibilní Q napřed jen bijek-tivně "zamíchá" n-rozměrné vektory v W, matice Ek pak "zkopíruje" prvních k souřadnic a vynuluje n—k zbývajících. Tento "^-rozměrný" obraz už pak následně násobení invertibilní P nemůže zvětšit. 2.13. Řešení systémů lineárních rovnic. K pojmům dimenze, lineární nezávislost apod. se vrátíme ve třetí části této kapitoly. Již teď si ale můžeme povšimnout, co právě dovozené výsledky říkají o řešení systému lineárních rovnic. Jestliže budeme uvažovat matici systému rovnic a přidáme k ní ještě sloupec požadovaných hodnot, hovoříme o rozšířené matici systému. Postup, který jsme předvedli odpovídá postupné eliminaci proměnných v rovnicích a vyškrtání lineárně závislých rovnic (ty jsou prostě důsledkem ostatních). Dovodili jsme tedy kompletní informaci o velikosti množiny řešení systému lineárních rovnic v závislosti na hodnosti matice systému. Pokud nám při přechodu na řádkově schodovitý tvar zůstane v rozšířené matici více nenulových řádků než v matici systému, pak žádné řešení nemůže existovat (prostě se daným lineárním zobrazením do požadované hodnoty vůbec netrefíme). Pokud je hodnost obou matic stejná, pak nám při zpětném dopočtu řešení zůstane právě tolik volných parametrů, kolik je rozdíl mezi počtem proměnných n a hodností h (A). 2. Determinanty V páté části první kapitoly jsme viděli (viz 1.27), že pro čtvercové matice dimenze 2 nad reálnými čísly existuje skalární funkce det, která matici äJ^L^? přiřadí nenulové číslo, právě když existuje její inverze. Neříkali jsme to sice stejnými slovy, ale snadno si to ověříte (viz odstavce počínaje 1.26 a vzorec (1.16)). Determinant byl užitečný i jinak, viz odstavce 1.33 a 1.34, kde jsme si volnou úvahou odvodili, že obsah rovnoběžníka by měl být lineárně závislý na každém ze dvou vektorů definujících rovnoběžník a že je užitečné zároveň požadovat změnu znaménka při změně pořadí těchto vektorů. Protože tyto vlastnosti měl, až na pevný skalární násobek, jedině determinant, odvodili jsme, že je obsah dán právě takto. Nyní uvidíme, že podobně lze postupovat v každé konečné dimenzi. V této části budeme pracovat s libovolnými skaláry K a maticemi nad těmito skaláry. Naše výsledky o determinantech tedy budou vesměs platit pro všechny komutativní okruhy, zejména tedy třeba pro celočíslené matice. 2.14. Definice determinantu. Připomeňme, že bijektivní zobrazení množiny X na sebe se nazývá permutace množiny zobrazení zvyklí. Aplikaci daného složení transpozic kupříkladu na prvek 2 můžeme postupně zapsat: [(1, 3)(3, 6)(6, 9)(9, 2)](2) = [(1, 3)(3, 6)(6, 9)]((9, 2)(2)) = [(1,3)(3,6)(6, 9)](9) = [(1,3)(3,6)](6) = (1,3)(3) = 1, tedy vskutku zobrazuje dané zobrazení prvek 2 na prvek 1 (je to totiž pouze jinak zapsaný cyklus (1, 3, 6, 9, 2). V zápisu skládání permutací však znak "o" často vypouštíme a hovoříme o součinu permutací. Při zápisu cyklu zapisujeme pouze prvky, na kterých cyklus (tj. zobrazení) netriviálně působí (tj. zobrazuje je jinam, než na sebe sama). Pevné body cyklu naopak v jeho notaci neuvádíme. Je tudíž nutné vědět, na které množině daný cyklus uvažujeme (většinou zřejmé z kontextu). Cyklus (4, 7, 5, 8) z předchozího příkladu, označme tento cyklus jako c, je tedy zobrazení (permutace), které by ve dvojřádkovém zápisu mělo tvar (1 2345678 9^ 2378654 9; Pokud tedy má již původní permutace nějaké pevné body, tak se v rozkladu na cykly neobjevují. Dále si všimněme, že zápis (1, 2, 3) zadává stejný cyklus jako (2, 3, 1) či (3, 1, 2). Cyklus (1, 3, 2) je však již jiné zobrazení. 2.20. Určete paritu následujících permutací: (l 2 a = {3 1 23456789 6 7 8 9 5 4 2 2 3 4 5 6N 2 4 6 1 5 3, Solution. Z předchozího příkladu víme, že a = (1, 3)(3, 6)(6, 9)(9, 2)(4, 7)(7, 5)(5, 8). Její parita je dána paritou počtu transpozic v jejím rozkladu (ta je narozdíl od počtu transpozic v libovolném rozkladu dané permutace stejná). Transpozic je v rozkladu sedm, permutace je tudíž lichá. Bez znalosti rozkladu a na traspozice, bychom mohli spočítat počet dvojic (a, b) c {1, 2, ..., 9} x {1, 2, ..., 9}, které jsou v inverzi vůči a (viz 2.15: procházíme postupně druhý řádek zápisu permutace a pro každé číslo přičteme počet čísel, která jsou menší než ono číslo a která stojí v řádku za ním. Není těžké si rozmyslet, že počet inverzí v dané permutaci je právě počet dvojic čísel "větší před menším" v druhém řádku. Pro a počítáme (procházíme druhý řádek): za trojkou je jednička i dvojka, tedy přičítáme 2, za jedničkou není pochopitelně žádné menší číslo, přičítáme 0, za šestkou je pětka, čtyřka a dvojka, tedy přičítáme 3, stejně tak za sedmičku, osmičku i devítku, za pětku 85 D. DETERMINANTY 2. DETERMINANTY přičítáme 2, za čtyřku 1 a dvojku nic. Celkem máme 17 inverzí, permutace je tedy vskutku lichá. Obdobně můžeme rozložit r buď na součin transpozic (pomoci rozkladu na nezávislé cykly): r = (1, 2, 4)(3, 6) = (1, 2)(2, 4)(3, 6), nebo zjistíme počet inverzí vr: 1+2 + 3 + 0-1-1=7. Tak jako tak zjišťujeme, že r je rovněž lichá permutace. □ D. Determinanty Ověřte si nejprve na následujícím příkladu, že umíte počítat determinanty matic 2 x 2 a 3 x 3 (pomoci Saarusova pravidla): 2.21. Určete determinanty matic: 6\ 2 2 V 2.22. Spočítejte determinant matice /l 3 5 1 2 2 1 1 1 \0 1 2 Solution. Začneme rozvíjet podle prvního sloupce, kde máme nejvíce (jednu) nul. Postupně dostáváme 13 5 6 12 2 2 1112 0 12 1 Podle Saarusova pravidla — z — z -(- o = z. □ 2.23. Nalezněte všechny hodnoty argumentu a takové, že a 1 1 1 0 a 1 1 Ola 1 0 0 0 -a Pro komplexní a uvedte buď jeho algebraický nebo goniometrický tvar. Solution. Spočítáme determinant rozvinutím podle prvního sloupce matice: n 1 1 1 1 1 2 2 2 3 5 6 3 5 6 1 • 1 1 2 - 1 • 1 1 2 + 1 • 2 2 2 1 2 1 1 2 1 1 2 1 -2 _ 2 + 6 = 2. 1. a 1 0 a 0 1 0 0 1 1 a 0 a 0 1 X, viz 1.7. Je-li X = {1,2,...,«}, lze permutace zapsat pomocí výsledného pořadí ve formě tabulky: G(i) 2 cr(2) n \ a(n)J Prvek x e X se nazývá samodružným bodem permutace er, je-li er (x) = x. Permutace er taková, že existují právě dva různé prvky x, y e X s er(x) = y, zatímco všechna ostatní z e X jsou samodružná, se nazývá transpozice, značíme ji (x, y). Samozřejmě pro takovou transpozici platí také er (y) = x, odtud název. V dimenzi 2 byl vzorec pro determinant jednoduchý -vezmeme všechny možné součiny dvou prvků, po jednom z každého sloupce a řádku matice, opatříme je znaménkem tak, aby při přehození dvou sloupců došlo ke změně celkového znaménka, a výrazy všechny (tj. oba) sečteme: (a b\ \c d) det A = ad — bc. Obecně, uvažujme čtvercové matice A = (a^) dimenze n nad K. Vzorec pro determinant matice A bude také poskládaný ze všech možných součinů prvků z jednotlivých řádků a sloupců: | Definice determinantu |_ i Determinant matice A je skalár det A = |A| definovaný I vztahem |A| = ^ sgn(er)útlfr(1) -«20-1 • ^2a(2) • • • ^na(n) tre£„ kde £„ je množina všech možných permutací na {1, ...,«} a znaménko sgn pro každou permutaci er ještě musíme popsat. Každý z výrazů sgn(cr)fll a(b). Permutace a se nazývá sudá (resp. lichá), obsahuje-li sudý (resp. lichý) počet inverzí. Parita permutace a je (_i)P°cetinverzi a značíme ji sgn(a). Tolik tedy definice znamének našich členů de-termintu. Chceme ale vědět, jak s paritou počítat. Z následujícího tvrzení o permutacích už je jasně vidět, že Saarusovo pravidlo skutečně počítá determinant v dimenzi 3. Theorem. Na množině X {1,2, n\ je pravé n\ různých permutací. Tyto lze seřadit do posloupnosti tak, že každé dvě po sobě jdoucí se liší právě jednou transpozicí. Lze při tom začít libovolnou permutací. Každá transpozice mění paritu. Proof. Pro jednoprvkové a dvouprvkové X tvrzení samozřejmě platí. Budeme postupovat indukcí přes dimenzi. Předpokládejme, že tvrzení platí pro všechny množiny s n — 1 prvky a uvažme permutaci er(l) = a\, ..., a(n) = an. Podle indukčního předpokladu všechny permutace, které mají na posledním místě an, dostaneme z tohoto pořadí postupným prováděním transpozic. Přitom jich bude (n — 1)!. V posledním z nich prohodíme a (n) = an za některý z prvků, který dosud nebyl na posledním místě, a znovu uspořádáme všechny permutace s tímto vybraným prvkem na posledním místě do posloupnosti s požadovanými vlastnostmi. Po n-násobné aplikaci tohoto postupu získáme n(n — 1) = n\ zaručeně různých permutací, tzn. všechny, právě předepsaným způsobem. Všimněme si, že poslední věta dokazovaného tvrzení se nezdá příliš důležitá pro jeho využití. Je však velice důležitou částí postupu v našem důkazu indukcí přes počet prvků yI Zbývá tvrzení věty o paritách. Uvažme pořadí («1, ... ,at, ai+\, ..., a„), ve kterém je r inverzí. Pak zjevně je v pořadí («1, ..., ai+\, a.i, ..., a„) buď r — 1 nebo r + 1 inverzí. Každou transpozici (a;, o,-) lze přitom získat postupným provedením (j — i) + (j — i — l) = 20 — 0 — 1 transpozic sousedních prvků. Proto se provedením libovolné transpozice parita permutace změní. Navíc již víme, že všechny permutace lze získat prováděním transpozic. □ Zjistili jsme, že provedení libovolné transpozice změní paritu permutace a že každé pořadí čísel {1,2, ... ,n} lze získat postupnými transpozicemi sousedních prvků. Dokázali jsme proto: -a2(a2 - 1). dále rozvíjíme podle posledního řádku: r> i \ a 1 D = a ■ (—a) . = la Celkem dostáváme následující podmínku pro a: a4 — a2 + 1 = 0. Substitucí t = a2, pak máme t2 — t + 1 s kořeny t\ = x+\^ = cos(7r/3) + i sin(7r/3), t\ = = cos(7r/3) — i sin(7r/3) = cos(—jt/3) + i sin(—7T/3), odkud snadno určíme čtyři možné hodnoty parametru a: a\ = cos(7r/6) + / sin(7r/6) = V3/2 + i/2, a2 = cos(77r/6) + i sin(77r/6) = — V3/2 — i/2, aj, = cos(—it/6) + i sin(—jt/6) = V3/2 — i/2, a4 = cos(57r/6) + i sin(57r/6) = -V3/2 + //2. □ 2.24. Vandermondův determinant. Dokažte vzorec pro tzv. Van-dermondův determinant, tj. determinant Vandermondovy matice: V„ 1 1 .. 1 CL\ a2 .. an 2 2 a2 .. • an -n-\ a2 -,n-l Y\ (aj -at), l i. Solution. Odečtením prvního řádku od všech ostatních řádků a následným rozvojem podle prvního sloupce obdržíme V„(xi, x2, ..., x„) 1 Xi 0 x2 — X\ Xr^ — x^ ..n-l ..n-l 0 xn x\ xn 2 2 2 2 X2 — X\ X^ — X, x„ „«-í .n-l ..n-l „«-1 2 2 X\ Xn — Xy v«-l _ v«-l A« Al Vytkneme-li z /-tého řádku xi+\ — x\ pro i e {1, 2, — 1}, dostaneme V„(xi, x2, ..., x„) = (x2 — X\) ■ ■ ■ (x„ — X\) 1 X2 + X\ Zn—2 n—j—2 j j=0 X2 Xl Zn—2 n—j—2 j j—0 %n %i 1 -^n ~\~ X\ ... ř-_q Odečtením od každého sloupce (počínaje posledním a konče druhým) xi-násobku předcházejícího lze docílit úpravy 1 X2 + Xl 1 X„ + X\ "-2 n-j-2 j Zn—A 7=0 Z n—2 n—j—2 j j=0 X" Xl 1 x2 „n-2 v«-2 87 E. SOUSTAVY LINEÁRNÍCH ROVNIC PODRUHÉ 2. DETERMINANTY Proto V„(xi, x2, ..., x„) = (x2 — xi) ■ ■ ■ (x„ — xi) V„-i(x2, ..., x„). Neboť je zřejmě ^2— 1? Xn) — Xn Xn — \, platí (uvažme matematickou indukci) V„(Xi,X2, . . . ,Xn) = Y\ (Xj-Xi). l 1, je právě ^n \ sudých a ^n \ lichých permutací. Jestliže složíme dvě permutace za sebou, znamená to provést napřed všechny transpozice tvořící první a pak druhou. Proto pro libovolné permutace a, r] : X -» X platí a proto také sgn(er o rj) = sgn(er) • sgn(/j) sgn(or l) = sgn(o-). 2.16. Rozklad permutace na cykly. Dobrým nástrojem pro praktickou práci s permutacemi je jejich rozklad na tzv. cykly. j Cykly | f Permutace a na množině X = {\, ...,«} se nazývá cyk-1 lus délky k, jestliže je možné najít prvky ai, ... ,ak e X, 2 < k < n, takové, že er(a;) = ai+\, i = 1, ..., k — 1, zatímco a (ak) = a\ a ostatní prvky v X jsou pro a samodružné. Cykly délky dva jsou právě transpozice. Každá permutace je složením cyklů. Cykly sudé délky mají paritu — 1, cykly liché délky mají j^^^^^^^^^J Poslední tvrzení musíme ještě dokázat. Jestliže definu-\^ jeme pro danou permutaci a relaci R tak, že dva prvky x, y e X jsou v relaci právě když or(x) = y pro nějakou iteraci permutace a, pak zjevně jde o relaci ekvivalence (ověřte si podrobně!). Protože je X konečná množina, musí pro nějaké i být al(x) = x. Jestliže zvolíme jednu třídu ekvivalence {x, a(x), ..., al~1(x)} c X a. ostatní prvky definujeme jako samodružné, dostáváme cyklus. Evidentně je pak celá původní permutace X složením všech těchto cyklů pro jednotlivé třídy naší ekvivalence a je jedno v jakém pořadí cykly skládáme. Pro určení parity si nyní stačí povšimnout, že cykly sudé délky lze napsat jako lichý počet transpozic, proto mají paritu — 1. Obdobně cyklus liché délky dostaneme ze sudého počtu transpozic a proto mají paritu 1. 2.17. Jednoduché vlastnosti determinantu. Poznání vlastností permutací a jejich parit z předchozích odstavců nám teď umožní rychle odvodit základní vlastnosti determinantů. Pro každou matici A = (útý) typu m/n nad definujeme matici transponovanou k A. Jde o = (a-j) s prvky a -■ = a^ , která je typu n/m. Čtvercová matice A s vlastností A = AT se nazývá symetrická. Jestliže platí A = — AT, pak se A nazývá antisy-metrická. Jednoduché vlastnosti determinantů skaláry z matici AT Theorem. Pro každou čtvercovou matici A následujícíc tvrzení: (1) \AT\ = \A\ (ciij) platí 88 CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA (2) Je-li jeden řádek v A tvořen nulovými prvky z K, pak \A\ = 0. (3) Jestliže matice B vznikla z A výměnou dvou řádků, pak \A\ = -\B\. (4) Jestliže matice B vznikla z A vynásobením řádku skalárem aéK, pak \B\ = a \A\. (5) Jsou-li prvky k-tého řádku v A tvaru a^ = c^j + by a všechny ostatní řádky v maticích A, B = (bij), C = (c i j) jsou stejné, pak \A\ = \B\ + \C\. (6) Determinant \A\ se nezmění, přičteme-li k libovolnému řádku A lineární kombinaci ostatních řádků. Proof. (1) Členy determinantů \A\ a \AT\ jsou v bijektivní korespondenci. Členu sgn(or)útM1) • a2a(2) ■ ■ ■ ana(n) přitom v AT odpovídá člen (na pořadí skalárů v součinu totiž nezáleží) = sgn(or)ala-i (1) • a2a-i (2) • • • ana-i (n), přičemž musíme ověřit, že je tento člen opatřen správným znaménkem. Parita a a er-1 je ale stejná, jde tedy opravdu o člen v determinantu | AT | a první tvrzení je dokázáno. (2) Plyne přímo z definice determinantu, protože všechny jeho členy obsahují z každého řádku právě jeden člen. Je-li jeden z řádků nulový, budou tedy všechny členy determinantu nulové. (3) Ve všech členech \B\ dojde ve srovnání s determinantem \A\ u permutací k přidání jedné transpozice, znaménko všech členů determinantu tedy bude opačné. (4) Vyplývá přímo z definice, protože členy determinantu \B\ jsou členy \A\ vynásobené skalárem a. (5) V každém členu | A\ je právě jeden součinitel z &-tého řádku matice A. Protože platí distributivní zákon pro násobení a sčítání v K, vyplývá tvrzení přímo z definičního vztahu pro determinanty. (6) Jsou-li v A dva stejné řádky, jsou mezi členy determinantu vždy dva sčítance stejné až na znaménko. Proto je v takovém případě \A\ = 0. Je tedy podle tvrzení (5) možné přičíst k vybranému řádku libovolný jiný řádek, aniž by se změnila hodnota determinantu. Vzhledem k tvrzení (4) lze ale přičíst i skalární násobek libovolného jiného řádku. □ 2.18. Výpočetní důsledky. Podle předchozí věty umíme _ převést elementárními řádkovými transformacemi každou čtvercovou matici A na řádkově schodovitý tvar, aniž bychom v změnili hodnotu jejího determinantu. Jen musíme dávat pozor, abychom vždy k upravovanému řádku pouze přičítali lineární kombinace řádků ostatních. 2.26. Účastníci zájezdu. Dvoudenního autobusového zájezdu se zúčastnilo 45 osob. První den se platilo vstupné na rozhlednu 30 Kč za dospělého, 16 Kč za dítě a 24 Kč za seniora, celkem 1116 Kč. Druhý den se platilo vstupné do botanické zahrady 40 Kč za dospělého, 24 Kč za dítě a 34 Kč za seniora, celkem 1 542 Kč. Kolik bylo mezi výletníky dospělých, dětí a seniorů? Solution. Zaveďme proměnné x udávající „počet dospělých"; y udávající „počet dětí"; z udávající „počet seniorů". Zájezdu se zúčastnilo 45 osob, a proto x + y + z = 45. Celkové vstupné na rozhlednu a do botanické zahrady při zavedení našich proměnných a při zachování pořadí činí 30x+16y+24z a 40x+ 24y + 34z,. My je ovšem známe (1 116 Kč a 1 542 Kč). Máme tak 30x + 16y + 24z = 1116, 40x + 24y + 34z = 1542. Soustavu tří lineárních rovnic zapíšeme maticově jako 1 1 1\ /x\ (45 30 16 24 ] • j y ] = j 1 116 y40 24 34) \z) \1542, Řešením je 1 '\32\ - 12 l22\ 12|, 11, neboť 1 1 1\ _1 i / 16 5 -4\ 30 16 24 ] = - [ 30 3 -3 y40 24 34/ 6 \-40 -8 7 Slovně vyjádřeno, zájezdu se zúčastnilo 22 dospělých, 12 dětí, 11 seniorů. □ 2.27. Za pomoci výpočtu inverzní matice určete řešení soustavy X\ -\- X2 ~\~ Xj -\- XíX = 2, X\ -\- X2 — Xj — XiX = 3, X\ — X2 ~\~ Xj — XiX = 3, X\ — X2 — Xj -\- XiX = 5. Co když však matice soustavy není invertibilní? Potom nemůžeme k jejímu řešení inverzní matice využít. Taková soustava pak má jiný počet než jedno řešení. Jak možná čtenář již ví, tak systém lineárních 89 E. SOUSTAVY LINEÁRNÍCH ROVNIC PODRUHÉ 2. DETERMINANTY rovnic buďnemá řešení, nebo má jedno řešení, nebo jich má nekonečně mnoho (například nemůže mít právě dvě řešení). Prostor řešení je buď vektorový prostor (v případě, že pravá strana všech rovnic v systému je nulová, hovoříme o homogenním systému lineárních rovnic) nebo afinní prostor, viz 4.1, (v případě, ze pravá strana alespoň jedné z rovnic je nenulová, hovoříme o nehomogenním systému lineárních rovnic). Ukažme si tedy různé možné typy řešení soustavy lineárních rovnic na příkladech. 2.28. Pro jaké hodnoty parametrů a, b e 2X3 X! Xi Xi — ax2 + (1 - a)x2 + (1 - a)x2 má lineárni systém = b, = b-3, = 2b - 1 + axj (a) právě 1 řešení; (b) žádné řešení; (c) alespoň 2 řešení? Solution. Soustavu „tradičně" přepíšeme do rozšířené matice a up- ravíme 1 1 1 a a 0 a 2b - 1 -2 2 a + 2 1 —a —2 b 0 1 2 -3 0 0 a b + 2 Dodejme, že v prvním kroku jsme první řádek odečetli od druhého a od třetího a ve druhém kroku pak druhý od třetího. Vidíme, že soustava bude mít právě jedno řešení (které lze určit zpětnou eliminací) tehdy a jenom tehdy, když a ^ 0. Pro a = 0 totiž ve třetím sloupci není první nenulové číslo nějakého řádku. Je-li a = Q & b = —2, dostáváme nulový řádek, kdy volba x3 e M. jako parametru dává nekonečně mnoho různých řešení. Pro a = 0 a. b ^ —2 poslední rovnice a = b + 2 nemůže být splněna - soustava nemá řešení. Poznamenejme, že pro a = 0, b = — 2 jsou řešeními (xu x2, x3) = (-2 + 2t, —3 — 2ř, ř) , íel a pro a ^ 0 je jediným řešením trojice -3a2 - ab - 4a +2b +4 2b + 3a + 4 b + 2\ 0 □ 2.29. Zjistěte počet řešení soustav (a) 12xi + VŠx2 + xx xx + 11X3 5x3 2X3 -9, -9, -7; -| výpočet determinantů eliminací j_ Je-li matice A v řádkovém schodovitém tvaru, pak v každém členu \A\ je alespoň jeden součinitel prvkem pod diagonálou s výjimkou případu, kdy jsou všechny jen na diagonále. Pak je ale jediným nenulovým členem determinantu ten, který odpovídá identické permutaci. Vidíme tedy, že determinant takové matice ve schodovitém tvaru je «11 • «22 ' Předchozí věta tedy poskytuje velice efektivní metodu výpočtu determinantů pomocí Gaussovy eliminační metody, viz odstavec 2.7. Všimněme si také hezkého důsledku prvního tvrzení předchozí věty o rovnosti determinantů mat-^yf^ ice a matice transponované. Zaručuje totiž, že ^ .Cc. kdykoliv se nám podaří dokázat nějaké tvrzení v>\í—» - o determinantech formulované s využitím řádků příslušné matice, pak analogické tvrzení platí i pro sloupce. Např. tedy můžeme okamžitě všechna tvrzení (2)-(6) této věty přeformulovat i pro přičítání lineárních kombinací ostatních sloupců k vybranému. To můžeme hned použít pro odvození následujícího vzorce pro přímý výpočet řešení systémů lineárních rovnic: J Crammerovo pravidlo I Uvažme systém n Unárních rovnic pro n proměnných | s maticí sytému A = (a;i) a sloupcem hodnot b = (b\, ..., b„), tj. v maticovém zápisu řešíme rovnici A ■ x = b. Jestliže existuje inverze A~l, pak jsou jednotlivé komponenty jediného řešení x = (xi, ..., x„) dány vztahem xi = \Ai\\A\-\ kde matice A;- vznikne z matice systému A výměnou /-tého sloupce za sloupec hodnot b. mm^mmmmmmJi Skutečně, jak jsme viděli, inverze k matici systému existuje právě tehdy, když má systém jediné řešení. Jestliže tedy takové řešení x máme, můžeme za sloupec b dosadit do matice A i příslušnou kombinaci sloupců matice A, tj. hodnoty bi = a.i\X\ + • • • + ainxn. Pak ale odečtením x,<--násobků všech ostatních sloupců zůstane v /-tém sloupci pouze x— násobek původního sloupce z A. Číslo x; tedy můžeme vytknout před determinant a získáme rovnost |A;||A|_1 = x,■ | A11A | ~1 = X{, což je požadované tvrzení. Dále si všimněme, že vlastnosti (3)-(5) z předchozí věty říkají, že determinant jakožto zobrazení, které n vektorům dimenze n (řádkům nebo sloupcům matice) přiřadí skalár, je antisymetrické zobrazení lineární v každém svém argumentu, přesně jako jsme podle analogie z dimenze 2 požadovali. 90 CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA 2.19. Další vlastnosti determinantu. Časem uvidíme, že skutečně stejně jako v dimenzi dva je determinant matice roven orientovanému objemu rovnoběžnostěnu určeného jejími sloupci. Uvidíme také, že když uvážíme zobrazení x zadané čtvercovou maticí Anal", pak můžeme determinant této matice vidět jako vyjádření poměru mezi objemem rovnoběžnostěnů daných vektory x\,...xn a jejich obrazy A ■ x\, ..., A ■ xn. Protože skládání zobrazení x A ■ x B ■ (A ■ x) odpovídá násobení matic, je snad docela pochopitelná tzv. Cauchyova věta: _—__Cauchyova věta Theorem. Nechť A = (flý), B = (bij) jsou čtvercové matice dimenze n nad okruhem skalárů K. Pak \A ■ B\ = \A\ ■ \B\. Všimněme si, že z Cauchyovy věty a z reprezentace elementárních rakových transformací pomocí násobení vhodnými maticemi (viz 2.8), okamžitě vyplývají tvrzení (2), (3) a (6) z Věty 2.17. My teď tuto větu odvodíme ryze algebraicky už proto, že x\ předchozí odvolávka na geometrický argument těžko může fungovat pro libovolné skaláry. Základním nástrojem je tzv. rozvoj determinantu podle jednoho nebo více řádků či sloupců. Budeme proto potřebovat něco málo technické přípravy. Čtenář, který by snad tolik abstrakce nestrávil může tyto pasáže přeskočit a vstřebat pouze znění Laplaceovy věty a jejich důsledků. 2.20. Minory matice. Při úvahách o maticích a jejich vlastnostech budeme často pracovat jen s je-iSLJLY/ jich částmi. Budeme si proto muset zavést několik pojmů. J submatice a minory | Nechť A = (atj) je matice typu m/n a 1 < i\ < ... < h < rn, 1 < ji < ... < ji < n jsou pevně zvolená přirozená čísla. Pak matici la, M "■liji \aikji ahh ■ ■ ■ ahji / typu k/l nazýváme submaticí matice A určenou řádky í'i, ..., /t a sloupci ji, ..., ji. Zbývajícími (m — k) řádky a (n — l) sloupci je určena matice M* typu (m — k)/(n — i), která se nazývá doplňková submatice k M v A. Při k = l je definován \M\, který nazýváme subdeterminant nebo minor řádu k matice A. Je-li m = n, pak při k = i je i M* čtvercová a \M* | se nazývá doplněk minoru \M\, nebo doplňkový minor k submatici M v matici A. Skalár -----Nt+j'H-----. |^/*| se nazývá algebraický doplněk k minoru \M\. (b) (c) 4x\ + 2x2 — 5x\ -\- 2x2 — -2x\ — X2 ~\~ 4x\ + 2x2 — 5x\ -\- 2x2 — -2x\ — X2 ~\~ 12X3 x3 6x3 12X3 x3 6x3 o, 0, 4; 0, 1, 0. Solution. Vektory (1,0,-5), (1,0,2) jsou očividně lineárně nezávislé (jeden není násobkem druhého) a vektor (12, V5, 11) nemůže být jejich lineární kombinací (jeho druhá složka je nenulová), a proto matice, jejímiž řádky jsou tyto tři lineárně nezávislé vektory, je invertibilní. Soustava ve variantě (a) má tedy právě jedno řešení. U soustav ve variantách (b), (c) si stačí povšimnout, že je (4,2, -12) = -2(-2, -1,6). V případě (b) tak sečtení první rovnice s dvojnásobkem třetí dává 0 = 8 - soustava nemá řešení; v případě (c) je třetí rovnice násobkem první - soustava má zřejmě nekonečně mnoho řešení. □ 2.30. Najděte (libovolný) lineární systém, jehož množina řešení je právě {(ŕ + 1, 2t, 3t, 40; t e R}. Solution. Takovým systémem je např. 2xi — X2 = 2, 2x2 — X4 = 0, 4x3 — 3x4 = 0. Těmto rovnicím totiž uvedené řešení vyhovuje pro každé t e M a vektory (2,-1,0,0), (0,2,0,-1), (0,0,4,-3) zadávající levé strany rovnic jsou zřejmě lineárně nezávislé (množina řešení obsahuje jeden parametr). □ 2.31. Stanovte hodnost matice /l -3 0 1\ 1 -2 2 -4 1 -1 0 1 V"2 -1 1 -v Poté stanovte počet řešení systému lineárních rovnic = X! -3*1 + x2 + x3 - — 2X2 — -^3 — + 2x2 + X\ — 4X2 + X3 — a také všechna řešení systému Xi + x2 + x3 - —3xi — 2x2 — X3 — + 2x2 + X\ — 4X2 + X3 — X4 X4 2x4 2X4 X4 X4 2x4 4, 5, 1, 3 0, 0, o, o 91 E. SOUSTAVY LINEÁRNÍCH ROVNIC PODRUHÉ 2. DETERMINANTY a systému Xi x\ X\ -1x\ 3x2 2x2 x2 x2 + 2x3 1, -4, 1, -2. + x3 = Solution. Protože je det A = —10, tedy nenulový, jsou sloupce matice A lineárně nezávislé, a tudíž se její hodnost rovná jejímu rozměru. První z uvedených třech systémů je zadán rozšířenou maticí / 1 -3 0 V 1 1 i -2 -1 2 0 -4 1 4\ 5 1 3/ \A\ £ 0. Ovšem levá strana je právě AT s determinantem \AT\ Existuje tedy matice (AT) 1 a soustava má právě 1 řešení (jci, x2, x3, x4)T = (A7)'1 ■ (4, 5, 1, 3)T . Druhý ze systémů má totožnou levou stranu (určenou maticí AT) s prvním. Protože absolutní členy na pravé straně lineárních systémů neovlivňují počet řešení a protože každý homogenní systém má nulové řešení, dostáváme jako jediné řešení druhého systému uspořádanou čtveřici (jci, x2, x3, x4) = (0,0, 0, 0). Třetí systém má rozšířenou matici / 1 -3 0 1 \ 1 -2 2 -4 1 -1 0 1 v -2 -1 1 "2/ což je matice A (pouze poslední sloupec je uveden za svislou čarou). Pokud budeme tuto matici upravovat na schodovitý tvar, musíme obdržet řádek ( 0 0 0 | a ) , kde a ^ 0. Víme totiž, že sloupec na pravé straně není lineární kombinací sloupců na levé straně (hodnost matice je 4). Tento systém nemá řešení. □ 2.32. Nechť je dáno (x\ x2 x3y Najděte taková reálná čísla b\, b2, b3, aby systém lineárních rovnic A ■ x = b měl: (a) nekonečně mnoho řešení; (b) právě jedno řešení; (c) žádné řešení; (d) právě 4 řešení. Submatice tvořené prvními k řádky a sloupci se nazývají vedoucí hlavní submatice, jejich determinanty vedoucí hlavníminory matice A. Zvolíme-li k po sobě jdoucích řádků a sloupců, počínaje /-tým řádkem, hovoříme o hlavních sub-maticích, resp. hlavních minorech. Při speciální volbě k = i = \, m = n říkáme příslušnému doplňkovému minoru algebraický doplněk Aij prvku aij matice A. 2.21. Laplaceův rozvoj determinantu. Pokud je \M\ \^ hlavní minor matice A řádu k, pak přímo z % definice determinantu je vidět, že každý z jednotlivých k\(n — k)\ sčítanců v součinu \M\ s jeho algebraickým doplňkem je členem determinantu \A\. Obecně, uvažme submatici M, tj. čtvercovou matici, určenou řádky i\ < i2 < ■ ■ ■ < ik a sloupci ji < • • • < jk-Pak pomocí (z'i — 1) + • • • + (i* — k) výměn sousedních řádků a (71 — 1) + • • • + (ji — k) výměn sousedních sloupců v A převedeme tuto submatici M na hlavní submatici a doplňková matice přitom přejde právě na doplňkovou matici. Celá matice A přejde přitom v matici B, pro kterou platí podle 2.17 a definice determinantu \B\ = (— 1)"|A|, kde a = ZLife - jh) — 2(1 H-----h k). Tím jsme ověřili: Proposition. Jestliže je A je čtvercová matice dimenze n a \M\ je její minor řádu k < n, pak součin libovolného členu \M\ s libovolným členem jeho algebraického doplňku je členem \A\. Toto tvrzení už podbízí představu, že by se pomocí takových součinů menších determinantů skutečně mohl determinant matic vyjadřovat. Víme, že \A\ obsahuje právě n\ různých členů, právě jeden pro každou permutaci. Tyto členy jsou navzájem různé jakožto polynomy v prvcích (neznámé obecné) matice A. Jestliže tedy ukážeme, že navzájem různých výrazů z předchozího tvrzení je právě tolik, jako je tomu u determinantu \A\, pak dostaneme jejich součtem právě determinant \A\. Zbývá proto ukázat, že uvažované součiny \M\ ■ \M*\ obsahují právě n! různých členů z | A\. Ze zvolených k řádků lze vybrat (^) minorů M a podle předchozího lematu je každý z k! (n — k)! členů v součinech \M\ s jejich algebraickými doplňky členem \A\. Přitom pro různé výběry M nemůžeme nikdy obdržet stejné členy a jednotlivé členy v (-\)^+-+ik+h+-+ii . \m\ ■ \m*\ jsou také po dvou různé. Celkem tedy máme právě požadovaný počet k\(n-k)\(nk) =n\členů. Tím jsme bezezbytku dokázali: j Laplaceova věta j Theorem. Nechť A = (a^) je čtvercová matice dimenze n nad libovolným okruhem skalárů a nechť je pevně zvoleno k jejích řádků. Pak \A\ je součet všech (^) součinů (_\ý\+--+ik+h+-+ji.\M\ ■ \M* | minorů řádu k vybraných ze zvolených řádků, s jejich algebraickými doplňky. 92 CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA Laplaceova věta převádí výpočet | A | na výpočet determinantů nižšího stupně. Této metodě výpočtu se říká Laplaceův rozvoj podle zvolených řádků či sloupců. Např. rozvoj podle z-tého řádku nebo podle 7-tého sloupce: n \A\ = £ayAy 7=1 kde Aíj označuje algebraický doplněk k prvku ay (tj. k mi-noru stupně 1). Při praktickém počítání determinantů bývá výhodné kombinovat Laplaceův rozvoj s přímou metodou přičítání lineárních kombinací řádků či sloupců. 2.22. Důkaz Cauchyovy věty. Důkaz se opírá o trikovou ale elementární aplikaci Laplaceovy věty. ^ y Použijeme prostě dvakrát Laplaceův rozvoj na jS'V"" vhodné matice. Uvažme nejprve následující matici H dimenze 2n (používáme tzv. blokovou symboliku, tj. píšeme matici jakoby složenou ze (sub)matic A, B atd.) -1 "ln 0 b -1 0 11 0 ^ 0 'ln Laplaceovým rozvojem podle prvních n řádků obdržíme právě \H\ = \A\ ■ \B\. Nyní budeme k posledním n sloupcům postupně přičítat lineární kombinace prvních n sloupců tak, abychom obdrželi matici s nulami v pravém dolním rohu. Dostaneme K Mi Ani -1 a\n c\\ 0 o Cln\ 0 V o -1 o ... o / Prvky submatice nahoře vpravo přitom musí splňovat Cij = anbij + ai2b2j H-----h ainbnj neboli jde právě o prvky součinu A ■ B a \ K\ = \H\. Přitom rozvojem podle posledních n sloupců dostáváme \K\ = (-1)"+1+-+2"|A-£| = (-l)2n(n+1)-|A-S| = \A-B\. Tím je Cauchyova věta bezezbytku dokázána. Solution. Pro čtenáře jistě nebude problém najít odpovídající hodnoty v případech a) a c) (stačí volit b\ = b2 + b3 v případě a) a naopak b\ 7^ b2 + bj, v případě c)). Povšimneme si dále, že |A| = 0, soustava tak má buď nekonečně mnoho, nebo žádné řešení. Obecně tvoří množina řešení homogenní soustavy lineárních rovnic vektorový prostor, varianta d) je proto apriori vyloučena. Varianta b) je možná pouze pro regulární matici soustavy (jediným řešením je pak nulový vektor). □ 2.33. Vyřešte systém homogenních lineárních rovnic zadaný maticí /O 72 73 76 o \ 2 0 V3 73 -2 75 273 73 -3 -75 -73 0 2.34. Určete všechna řešení systému *2 + X4 = 1, 3*1 - 2x2 - 3*3 + 4x4 = - 2, Xi + x2 - X3 + X4 = 2, Xl — x3 = 1. Vyřešte 3x - 5y + 2u + 4z = 2, 5x + Vv - Au - 6z = 3, Ix - 4y + + 3z = 2.36. Rozhodněte o řešitelnosti soustavy lineárních rovnic 1, 3xi 2xi 2xi 3xi + + 3x2 3x2 3x2 2x2 + X3 - *3 + X3 + X3 třech proměnných x\, x2, x3. 2.37. Stanovte počet řešení 2 soustav 5 lineárních rovnic AT - x (1,2, 3,4, 5)3 AT - x (1, 1, 1, 1, 1) kde X — (Xi, X2, X3) <3 1 1 5 0\ 0 0 0 0 1 ,2 1 4 3 0; 2.38. Určete řešení soustavy lineárních rovnic axi + 4x2 +2 X3 = 0, 2xi + 3x2 — X3 = 0, v závislosti na parametru a el. 93 E. SOUSTAVY LINEÁRNÍCH ROVNIC PODRUHÉ 3. VEKTOROVÉ PROSTORY A LINEÁRNÍ ZOBRAZENÍ 2.39. V závislosti na hodnotě parametru a e M rozhodněte o počtu řešení soustavy /4 1 4 a \ /Xl\ / 2 \ *2 2 3 6 8 3 2 5 4 \6 -1 2 -8/ x3 w 5 3 v-v 2.40. Rozhodněte, zda existuje homogenní soustava lineárních rovnic tří proměnných, jejíž množinou řešení je (a) {(0,0,0)}; (b) {(0,1,0), (0,0,0), (1,1,0)}; (c) {(jc, 1,0); x e M}; (d) {(x, y, 2y); x,y elj. 2.41. Řešte soustavu lineárních rovnic v závislosti na reálných parametrech a, b. x + 2y + bz = a x - y + 2z = 1 3x-y = 1. 2.42. Nalezněte matici algebraicky adjungovanou a matici inverzní k matici /l 0 2 °\ 0 3 0 4 5 0 6 0 7 0 V Solution. Adjungovaná matice je Mu A12 Al3 AiA 7" A2i A22 A23 A24 A3i A32 A33 A34 \A41 A42 A43 A44yi kde Aý je algebraický doplněk prvku atj matice A, tedy součin čísla (— a determinantu trojrozměrné matice vzniklé z A vynecháním z-tého řádku a 7-tého sloupce. Platí m3 3 0 4 0 0 4 0 6 0 = -24, A12 = - 5 6 0 = 0,... 7 0 8 0 0 8 1 0 0 1 0 2 — 0 3 4 = 0, Au = 0 3 0 = -12. 5 0 0 5 0 6 mim získáme 24 0 20 0 \ T ( -24 0 i l 0 \ 0 -32 0 28 0 -32 0 16 8 0 -4 0 20 0 4 0 0 16 0 - -12) 0 28 0 -12) 2.23. Determinant a inverzní matice. Předpokládejme nejprve, že existuje matice inverzní k matici A, tj. A • A-1 = E. Protože pro jednotkovou matici platí vždy \E\ = 1, je pro každou in-vertibilní matici vždy |A| invertibilní skalár a díky Cauchyově větě platí |A_1| = |A|_1. My však nyní kombinací Laplaceovy věty a Cauchyho věty umíme říci víc. j Vzorec pro inverzní matici |_ Pro libovolnou čtvercovou matici A = (út;j) dimenze n definujeme matici A* = (a*}.), kde a*- = A;; jsou algebraické doplňky k prvkům a ý v A. Matici A* nazýváme algebraicky adjungovaná matice k matici A. Theorem. Pro každou čtvercovou matici A nad okruhem skalárů K platí (2.2) AA* = A*A = \A\ • E. Zejména tedy (1) A-1 existuje jako matice nad okruhem skalárů K, právě když |A|_1 existuje v K. (2) Pokud existuje A-1, pak platí A-1 = |A|_1 - A*. 1 Proof. Jak jsme již zmínili, Cauchyova věta ukazuje, že z existence A-1 vyplývá invertibilita |A| e K. Pro libovolnou čtvercovou matici A spočteme přímým výpočtem A • A* = (o,), kde Q/ = ^aika£j = y^:aikAjk. Pokud i = j je to právě Laplaceův rozvoj |A| podle /-tého řádku. Pokud i 7^ j jde o rozvoj determinantu matice v níž je z-tý a j-tý řádek stejný a proto je q7 = 0. Odtud plyne A • A* = |A| • E a dokázali jsme rovnost (2.2). Předpokládejme navíc, že |A| je invertibilní skalár. Jestliže zopakujeme předešlý výpočet pro A* • A, obdržíme \A\~lA* ■ A = E. Proto náš výpočet skutečně dává inverzní matici A, jak je tvrzeno ve větě. □ Jako přímý důsledek této věty můžeme znovu ověřit Crammerovo pravidlo pro řešení systémů lineárních rovnic, viz 2.18. Skutečně, pro řešení systému A ■ x = b stačí důsledně přečíst v rovnosti x = A-1 • b = \A\~lA* -b poslední výraz jako Laplaceův rozvoj determinantu matice Ai vzniklé výměnou /-tého sloupce v A za sloupec hodnot 3. Vektorové prostory a lineární zobrazení 2.24. Abstraktní vektorové prostory. Vraťme se teď na chvilku k systémům m lineárních rovnic pro n proměnných z 2.3 a předpokládejme navíc, že jde o homogenní systém rovnic A - x = 0, tj. 94 CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA (au M y^mi • • • amnJ \Xnj \P/ Díky vlastnosti distributivity pro násobení matic je zřejmé, že součet dvou řešení x = (x\, ..., x„) a y = (yi, ..., y„) splňuje A-(x+y) = A- x+ A- y = 0 a je tedy také řešením. Stejně tak zůstává řešením i skalární násobek a ■ x. Množina všech řešení pevně zvoleného systému rovnic je proto uzavřená na sčítání vektorů a násobení vektorů skaláry. To byly základní vlastnosti vektorů dimenze n v W, viz 2.1. Teď ale máme vektory v prostoru řešení s n souřadnicemi a "rozměr" tohoto prostoru je dán rozdílem počtu proměnných a hodností matice A. Můžeme tedy snadno mít při řešení 1000 souřadnic a jen jeden nebo dva volné parametry. Celý prostor řešení se pak bude chovat jako rovina nebo přímka, jak jsme je poznali již v 1.25 na straně 30. Už v odstavci 1.9 jsme ale potkali ještě zajímavější příklad prostoru všech řešení homogenní lineární diferenční rovnice (prvního řádu). Všechna řešení jsme dostali z jednoho pomocí násobení skaláry a jsou tedy také uzavřená na součty a skalární násobky. Tyto "vektory" řešení ovšem jsou nekonečné posloupnosti čísel, přestože intuitivně očekáváme, že "rozměr" celého prostoru řešení by měl být jedna. Potřebujeme proto obecnější definici vektorového prostoru a jeho dimenze: Definice vektorového prostoru Vektorovým prostorem V nad polem skalárů rozumíme množinu, na které jsou definovány • operace sčítání splňující axiomy (KG1)-(KG4) z odstavce 1.1 na straně 6, • násobení skaláry, pro které platí axiomy (V1)-(V4) z odstavce 2.1 na straně 74. Připomeňme také naši jednoduchou konvenci ohledně značení: skaláry budou zpravidla označovány znaky z počátku abecedy, tj. a,b,c,..., zatímco pro vektory budeme užívat znaky z konce, u, v, w, x, y, z. Přitom ještě navíc většinou x, y, z budou opravdu n-tice skalárů. Pro úplnost výčtu, písmena z prostředka, např. i, j, k, i budou nejčastěji označovat indexy výrazů. Abychom se trochu pocvičili ve formálním postupu, ověříme jednoduché vlastnosti vektorů, které pro rc-tice skalárů byly samozřejmé, nicméně teďje musíme odvodit z axiomů. 2.25. Proposition. Nechť V je vektorový prostor nad polem skalárů K, dále uvažme a, b,at e K, vektory u, v, u j e V. Potom (1) a ■ u = 0, právě když a (2) (—1) • u = —u, 0 nebo u = 0, Inverzní matici A 1 určíme ze vztahu A 1 = \A\ 1 • A*. Determinant matice A je (rozvojem podle prvního řádku) roven 1 0 2 0 0 3 0 4 5 0 6 0 0 7 0 8 3 0 4 0 3 4 0 6 0 + 2 5 0 0 = 16 7 0 8 0 7 8 Dostáváme tedy / -3/2 0 1/2 0 \ 0 -2 0 1 5/4 0 -1/4 0 v 0 7/4 0 -3/4/ □ 2.43. Najděte algebraicky adjungovanou matici F*, je-li (a 0\ y S 0 J , a, p, y, S e R. ,0 0 l) 2.44. Vypočítejte algebraicky adjungované matice k maticím (3 -2 0 -1\ 0 2 2 1 (1+i 1 -2 -3 -2 ' v \0 1 2 1 y přičemž i označuje imaginárni jednotku. (a) /1 + i 2i\ \3 -2i 6 / F. Vektorové prostory Vlastnosti vektorového prostoru, kterých jsme si všimli u roviny či třírozměrného prostoru, ve kterém žijeme, má celá řada jiných množin. Ukažme si to na příkladech. 2.45. Vektorový prostor ano či ne? Rozhodněte o následujících množinách, jestli jsou vektorovými prostory nad tělesem reálných čísel: i) Množina řešení soustavy xl + x2 + ' ' ' + x9& + x99 + x100 =100xí, xi + x2-\-----h x98 + x99 =99xi, xi + x2-\-----h x98 =98*1, Xl + x2 =2x\. ii) Množina řešení rovnice x\ + x2 + - - - + *100 = 0 iii) Množina řešení rovnice xi + 2x2 + 3x3 + • • • + lOOxioo = 1. 95 F. VEKTOROVÉ PROSTORY 3. VEKTOROVÉ PROSTORY A LINEÁRNÍ ZOBRAZENÍ iv) Množina všech reálnych, resp. komplexních, posloupností. (Reálnou, resp. komplexní posloupností rozumíme zobrazení / : N -» R, resp. / : N -» C. O obrazu čísla n pak hovoříme jako o n-tém členu posloupnosti, většinou jej označujeme dolním indexem, např. an.) v) Množina řešení homogenní diferenční rovnice. vi) Množina řešení nehomogenní diferenční rovnice. vii) {/ : R -> R\f(\) = f (2) = c, c e R} Solution. i) Ano. Jsou to všechny reálné násobky vektoru (1,1,1...,1), 1-v-' 100 jedniček tedy vektorový prostor dimenze 1 (viz dále (2.29)). ii) Ano. Jedná se o prostor dimenze 99 (odpovídá počtu volných parametrů řešení). Obecně je tvoří množina řešení libovolné homogenní soustavy lineárních rovnic vektorový prostor. iii) Ne. Např. dvojnásobek řešení x i = 1, xt = 0, i = 2, ... 100 není řešením dané rovnice. Množina řešení však tvoří tzv. afinní prostor (viz (||??||)). iv) Ano. Množina všech reálných, resp. komplexních, posloupností tvoří zřejmě reálný, resp. komplexní, vektorový prostor. Sčítání posloupností a násobení posloupnosti skalárem je totiž definováno člen po členu, kde se jedná o vektorový prostor reálných, resp. komplexních, čísel. v) Ano. Abychom ukázali, že množina posloupností vyhovujících dané diferenční homogenní rovnici tvoří vektorový prostor, stačí ukázat, že je uzavřená vzhledem ke sčítání i násobení reálným číslem (neboť se jedná o podmnožinu vektorového prostoru) mějme posloupnosti (x/)°^0 a (j7)°^0 vyhovující stejné homogenní diferenční rovnici, tedy anxn+k + an-\xn+k-\ + ' ' ' + a0xk = 0 anyn+k + a„-iyn+k-i + ■ ■ ■ + aoyt = 0. Sečtením těchto rovnic dostaneme ^n(xn+k + Jn+k) + ^n-l(xn+k-l + yn+k-l) + • • • + ao(xk + ä) = 0, tedy i posloupnost (xj + yj)^, vyhovuje stejné diferenční rovnici. Rovněž tak pokud posloupnost (x/)°^0 vyhovuje dané rovnici, tak i posloupnost (uxj)^0 , kde ueK. (3) a ■ (u — v) = a ■ u — a ■ v, (4) (a — b) ■ u = a ■ u — b ■ u, (5) (xLi ai) ■ (Z7=i ui) = Zľ=i E£=i aí ■ ui- Proof. Můžeme rozepsat {a + 0) • u a ■ u + 0 • u = a ■ u což podle axiomu (KG4) zaručuje 0 • u = 0. Nyní u + (-1) • u (V= (1 + (-1)) • u = 0 • u = 0 a odtud —u = (— 1) • u. Dále (v2, V3) a ■ (u + (— 1) • v) = a ■ u + (—a) ■ v = a ■ u — a ■ v, což dokazuje (3). Platí (v2, v3) (a — b) ■ u = a ■ u + (—b) ■ u = a ■ u — b ■ u a tím je ověřeno (4). Vztah (5) plyne indukcí z (V2) a (VI). Zbývá (1): a -0 = a-(u—u) = a -u—a -u = 0, což spolu s prvním tvrzením tohoto důkazu ukazuje jednu implikaci. K opačné implikaci poprvé potřebujeme axiom pole pro skaláry a axiom (V4) pro vektorové prostory: je-li p-u=0a.p^0, pak u = 1 • u = (p~l ■ p) ■ u = p~l -0 = 0. □ 2.26. Lineární (ne)závislost. V odstavci 2.11 jsme pracovali s tzv. lineárními kombinacemi řádků matice. S obecnými vektory budeme zacházet zcela analogicky: j Lineární kombinace a nezávislost |_ Výrazy tvaru a\ ■ v\ + ■ ■ ■ + ■ nazýváme lineární kombinace vektorů v\, ..., e V. Konečnou posloupnost vektorů v\, ..., vk nazveme lineárně nezávislou, jestliže jediná jejich nulová lineární kombinace je ta s nulovými koeficienty, tj. jestliže pro skaláry ai, ... ,ak e K platí vi H-----h ak ■ vk = 0 a2 ak = 0. Je zjevné, že v nezávislé posloupnosti vektorů jsou všechny po dvou různé a nenulové. Množina vektorů M c V ve vektorovém prostoru V nad K se nazývá lineárně nezávislá, jestliže každá konečná &-tice vektorů v\, ..., vk e M je lineárně nezávislá. Množina M vektorů je lineárně závislá, jestliže není lineárně nezávislá. Přímo z definice vyplývá, že neprázdná podmnožina M vektorů ve vektorovém prostoru nad polem skalárů K je závislá právě, když je jeden z jejích vektorů vyjádřitelný jako konečná lineární kombinace pomocí ostatních vektorů v M. Skutečně, alespoň jeden koeficient v příslušné nulové lineární kombinaci musí být nenulový a protože jsme nad polem skalárů, můžeme jím podělit a vyjádřit tak u něj stojící vektor pomocí ostatních. Každá podmnožina lineárně nezávislé množiny M je samozřejmě také lineárně nezávislá (požadujeme stejné podmínky na méně vektorů). Stejně snadno vidíme, že M c V 96 CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA je lineárně nezávislá právě tehdy, když každá konečná podmnožina v M je lineárně nezávislá. 2.27. Generátory a podprostory. Podmnožina M c V se nazývá vektorovým podprostorem jestliže spolu se zúženými operacemi sčítání a ná-±L$ sobení skaláry je sama vektorovým prostorem. Tzn. požadujeme Vút, b € K, Vi;, w € M, a ■ v + b ■ w € M. Rozeberme si hned několik příkladů: Prostor m-tic skalárů Rm se sčítáním a násobením po složkách je vektorový prostor nad R, ale také vektorový prostor nad Q. Např. pro m = 2, jsou vektory (1, 0), (0, 1) e R2 lineárně nezávislé, protože z a ■ (1,0) + b ■ (0, 1) = (0,0) plyne a = b = 0. Dále, vektory (1,0), (72, 0) e R2 jsou lineárně závislé nad R, protože ~J2- (1, 0) = (72, 0), ovšem nad Q jsou lineárně nezávislé! Nad R tedy tyto dva vektory "generují" jednorozměrný podprostor, zatímco nad Q je "větší". Polynomy stupně nejvýše m tvoří vektorový prostor Mm[x]. Polynomy můžeme chápat jako zobrazení / : R -» R a sčítání a násobení skaláry definujeme takto: (/ + g)(x) = f(x) + g(x), (a ■ f)(x) = a ■ f(x). Polynomy všech stupňů také tvoří vektorový prostor R^ [x] a Mm[x] c Rn[x] je vektorový podprostor pro všechna m < n < oo. Podprostory jsou také např. všechny sudé polynomy nebo liché polynomy, tj. polynomy splňující f(-x) = ±f(x). Úplně analogicky jako u polynomů můžeme definovat strukturu vektorového prostoru na množině všech zobrazení R -» R nebo všech zobrazení M -» V libovolné pevně zvolené množiny M do vektorového prostoru V. Protože podmínka v definici podprostoru obsahuje ji ,. pouze univerzální kvantifikátory, je jistě průnik podprostoru opět podprostor. Snadno to ověříme i přímo: Nechť W{, i e /, jsou vektorové podprostory ve V, a, b e K, u, v e níe/W;-. Pak pro všechny i e /, a ■ u + b ■ v e W,■, to ale znamená, že a ■ u + b ■ v e níe/ W,■. Zejména je tedy podprostorem průnik (M) všech podprostoru W C V, které obsahují předem danou množinu vektorů M c V. Říkáme, že množina M generuje podprostor (M), nebo že prvky M jsou generátory podprostoru (M). Zformulujme opět několik jednoduchých tvrzení o generování podprostoru: Proposition. Pro každou neprázdnou podmnožinu M C V platí (1) (M) = {ai ■ u\ + ■ ■ ■ + ak ■ uk; k e N, at e K, u j e M, j = 1,...,*}; (2) M = (M), právě když M je vektorový podprostor; vi) Ne. Součet dvou řešení nehomogenní rovnice anxn+k + an-lxn+k-l + ' ' ' + a0xk = c a„y„+k + a„_i)>„-Hfc_i H-----h a0yk = c, c e R - {0} vyhovuje rovnici a„(xn+k + yn+k) + an-i(xn+k-i + y„+k-\) H-----h a0(xk + yk) = 2c, zejména pak nevyhovuje původní nehomogenní rovnici. Množina řešení však tvoří afinní prostor, viz 4.1. vii) Je to vektorový prostor právě, když c = 0. Vezme-li dvě funkce / ag zdané množiny, pak (f+g)(l) = (f+g)(2) = f (1) + g(l) = 2c. Má-li funkce f + g být prvkem dané množiny, musí být (/ + g)(l) = c, tedy 2c = c, tedy c = 0. □ 2.46. Zjistěte, zda je množina í/i ={(Xl,x2,x3) sR3; |jci| = \x2\ = \x3\] podprostorem vektorového prostoru R3 a množina U2 = {ax2 + c; a,c eR] podprostorem prostoru polynomů stupně nejvýše 2. Solution. Množina U\ není vektorovým (pod)prostorem. Vidíme např., že je (1,1,1) + (-1,1,1) = (0,2,2) £ ř/i. Množina \J2 ovšem podprostor tvoří (nabízí se přirozené ztotožnění s R2), protože {a\x2 + ci) + (a2x2 + c2) = {a\ + a2)x2 + (ci + c2), k ■ (ax2 + c) = (ka) x2 + kc pro všechna čísla a\, c\, a2, c2, a, c, k e R. □ 2.47. Je množina V = {(1, x); x e R} s operacemi © : V x V -> V, (1, y) © (1, z) = (1, z + y) pravšechna O : R x V -> V, z O (1, y) = (1, y ■ z) pro všechna vektorovým prostorem? 97 G. LINEÁRNI ZÁVISLOST A NEZÁVISLOST, BAZE 3. VEKTOROVÉ PROSTORY A LINEÁRNI ZOBRAZENI G. Lineární závislost a nezávislost, báze 2.48. Výpočtem determinantu vhodné matice rozhodněte o lineárni nezávislosti vektoru a (0, 0, 3, 2). Solution. Protože (1,2,3,1), (1,0,-1,1), (2,1,-1,3) 2 0 1 10 ^0, 0 0 3 uvedené vektory jsou lineárně nezávislé. □ 2.49. Nechť jsou dány libovolné lineárně nezávislé vektory u,v,w,z ve vektorovém prostoru V. Rozhodněte, zdajsou ve V lineárně závislé, či nezávislé, vektory u — Iv, 3u + w — z, u — 4v + w + 2z, 4v + Sw + 4z. Solution. Uvažované vektory jsou lineárně nezávislé právě tehdy, když jsou lineárně nezávislé vektory (1,-2,0,0), (3,0,1,-1), (1, -4, 1, 2), (0, 4, 8, 4) v M4. Je však 1-200 3 0 1-1 1-412 0 4 8 4 -36 ^0, tudíž jsou uvažované vektory lineárně nezávislé. □ 2.50. Určete všechny konstanty a e M takové, aby polynomy ax2 + x +2, —2x2 + ax + 3 a x2 + 2x + a byly lineárně závislé (ve vektorovém prostoru Pj,\x\, polynomů jedné proměnné stupně nejvýše 3 nad reálnými čísly). Solution. V bázi 1, x, x2 jsou souřadnice zadaných vektorů (polynomů) následující: (a, 1, 2), (—2, a, 3), (1, 2, a). Polynomy budou lineárně závislé, právě když bude mít matice, jejíž řádky jsou tvořeny souřadnicemi zadaných vektorů menší hodnost, než je počet vektorů, v tomto případě tedy hodnost dvě a menší. V případě čtvercové matice nižší hodnost než je počet řádkuje ekvivalentní nulovosti determinantu dané matice. Podmíka na a tedy zní a 1 —2 a 1 2 tj. a bude kořenem polynomu a3 -úloha má tři řešení a\ = — 1, a2,3 = 0, 5 = (a + l)(a2 1±V21 5), tj. □ (3) jestliže N C M, pak (N) C (M) je vektorový podpros-tor. Podprostor (0) generovaný prázdnou podmnožinou je triviálni podprostor {0} C V. Proof. (1) Množina všech lineárních kombinací ci\U\ + • • • + akuk na pravé straně (1) je jistě vektorový podprostor a samozřejmě obsahuje M. Naopak, každá z jednotlivých lineárních kombinací nutně musí být v (M) a první tvrzení je dokázáno. Tvrzení (2) vyplývá okamžitě z (1) a z definice vektorového podprostoru a obdobně je z prvního tvrzení zřejmé i tvrzení třetí. Konečně, nejmenší vektorový podprostor je {0}, protože prázdnou množinu obsahují všechny podprostory a každý z nich obsahuje vektor 0. □ 2.28. Součty podprostoru. Když už máme představu o generátorech a jimi vytvářených podprostorech, měli bychom rozumět i možnostem, jak několik podprostoru může vytvářet celý vektorový prostor V. j Součty podprostoru | Nechť Vi, i e /, jsou podprostory ve V. Pak podprostor generovaný jejich sjednocením, tj. (Uíe/V/), nazýváme součtem podprostoru V/. Značíme X/e/ ^- Zejména pro konečný počet podprostoru Vi, ..., Vk C V píšeme v1 + ... + vJt = (v1uv2u...uvJt). Vidíme, že každý prvek v uvažovaném součtu podprostoru můžeme vyjádřit jako lineární kombinaci vektorů z podprostoru V/. Protože však je sčítání vektorů komutativní, lze k sobě poskládat členy patřící do stejného podprostoru a pro konečný součet k podprostoru tak dostáváme Vi + V2 + ■ ■ ■ + Vk = {vl + ■ ■ ■ + vk; vi e Vi, i = 1,..., k). Součet W = Vi + • • • + Vi C V se nazývá přímý součet podprostoru, jsou-li průniky všech dvojic triviální, tj. V; n V j = {0} pro všechny i ^ j. Ukážeme, že v takovém případě lze každý vektor w e W napsat právě jedním způsobem jako součet w = vi H-----\- vk, kde V{ e V;. Skutečně, pokud by tento vektor šlo zároveň vyjádřit, jako w = v[ + ■ ■ ■ + v'k, potom 0 = w - w = (vi - v[) H-----\- (vk - v'k). Pokud bude vt — u- první nenulový člen na pravé straně, pak tento vektor z V; umíme vyjádřit pomocí vektorů z ostatních podprostoru. To je ale ve sporu s předpokladem, že V; má se všemi ostatními nulový průnik. Jedinou možností tedy je, že všechny vektory na pravé straně jsou nulové a tedy je rozklad wjednoznačný. 98 CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA Pro přímé součty podprostorů píšeme W = Vi © • • • © Vk luv. 2.29. Báze. Nyní máme vše připravené pro pochopení minimálních množin generátorů tak, jak jsme se s nimi vypořádali v rovině M2. báze vektorových prostorů [ Podmnožina M c V se nazývá báze vektorového prostoru V, jestliže (M) = V a M je lineárně nezávislá. Vektorový prostor, který má konečnou bázi nazýváme konečněrozměrný, počet prvků báze nazýváme dimenzí V. Nemá-li V konečnou bázi, říkáme, že V je nekonečněrozměrný. Píšeme dim V = k, k e N, případně k = oo. Abychom s takovou definicí dimenze mohli být spokojeni, potřebujeme vědět, že různé báze téhož prostoru budou mít vždy stejný počet prvků. To skutečně brzy dokážeme. Všimněme si hned, že triviální podprostor je generován prázdnou množinou, která je "prázdnou" bazí. Má tedy triviální podprostor dimenzi nulovou. Bázi k -rozměrného prostoru budeme obvykle zapisovat jako /c-tici v_ = (vi ..., vk) bázových vektorů. Jde tu především o zavedení konvence: U konečněrozměrných podprostorů budeme totiž vždy uvažovat bázi včetně zadaného pořadí prvků i když jsme to takto, striktně vzato, nedefinovali. Zjevně, je-li (vi, ..., v„) bazí V, je celý prostor V přímým součtem jednorozměrných podprostorů V (vi) (vn). Okamžitým důsledkem výše odvozené jednoznačnosti rozkladu jakéhokoliv vektoru ve V do komponent v přímém součtu dává jednoznačné vyjádření w x\vi H-----\-xnvn a dovoluje nám tedy po volbě báze opět vidět vektory jako řítíce skalárů. K tomuto pohledu se vrátíme v zápětí v odstavci 2.33, jak jen dokončíme diskusi existence bazí a součtů podprostorů v obecné poloze. 2.30. Theorem. Z libovolné konečné množiny generátorů vektorového prostoru V lze vybrat bázi. Každá báze koenčněrozměrného prostoru V má přitom stejný počet prvků. Proof. První tvrzení ukážeme snadno indukcí přes počet generátorů k. Jedině nulový podprostor nepotřebuje žádný generátor a tedy umíme vybrat prázdnou bázi. Naopak, nulový vektor vybrat nesmíme (generátory by byly lineárně závislé) a nic jiného už v podprostorů není. 2.51. Vektory (1, 2, 1), (—1, 1, 0), (0, 1, 1) jsou lineárně nezávislé, a proto společně tvoří bázi M3. (v bázi je nutné zadat i jejich pořadí). Každý trojrozměrný vektor je tak nějakou jejich lineární kombinací. Jakou jejich lineární kombinací je vektor (1,1, 1), nebo-li jaké jsou souřadnice vektoru (1, 1, 1) v bázi dané zmíněnými vektory? Solution. Hledáme a, b, c e R taková, aby a{\, 2, \)+b(-\, 1, 0) + c(0, 1, 1) = (1, 1, 1). Rovnost musí platit v každé souřadnici, dostáváme tak soustavu tří lineárních rovnic o třech neznámých: a — b =1 2a + b+c = 1 a + c = 1, jejíž vyřešením získáme a = \,b ' 2' c 2 , je tedy (1, 1, 1) = \ ■ (1, 2, 1) - \ ■ (-1, 1, 0) + l- ■ (0, 1, 1), neboli souřadnice vektoru (1, 1, 1) vbázi ((1, 2, 1), (—1, 1,0), (0, 1, 1)) ■i i U n jsou ( -2' 2' 1> 2.52. Vyjádřete vektor (5, 1, 11) jako lineární kombinaci vektorů (3, 2, 2), (2, 3, 1), (1, 1, 3), tj. nalezněte čísla p,q,r e M, pro která je (5, 1, 11) = p (3, 2, 2) + q (2, 3, 1) + r (1, 1, 3). 2.53. Uvažme komplexní čísla C jako reálný vektorový prostor. Určete souřadnice čísla 2 + i v bázi dané kořeny polynomu x2 + x + 1. Solution. Protože kořeny daného polynomu j sou — ^+z a — ^ — z máme určit souřadnice (a, b) vektoru 2 + z v bázi (—^ + i^, — \ — i -^). Tato reálná čísla a, b jsou jednoznačně určena požadavkem 1 V3 1 73 a ■ (---h z—) +b ■ (---z—) =2 +i. 2 2' 2 2 ' Rozepsáním rovnosti zvlášť pro reálnou a imaginární složku dostáváme soustavu dvou lineárních rovnic o dvou neznámých: 1 1 --a--b = 2 2 2 V3 73, -a--b = 1. 2 2 Jejím vyřešením získáme a -2 + souřadnice tedy jsou (—2 + —2 — -^). -2 - ^, hledané □ 2.54. Remark. Jak pozorný čtenář jistě postřehl, úloha není zadána jednoznačně, nemáme totiž zadáno pořadí kořenů polynomu, tudíž ani pořadí bázových vektorů. Výsledek je tedy dán až na záměnu souřad- nic. 99 G. LINEÁRNI ZÁVISLOST A NEZÁVISLOST, BAZE 3. VEKTOROVÉ PROSTORY A LINEÁRNI ZOBRAZENI Dále se na tomto místě vyjádřeme k tzv. "usměrňování" zlomků, tedy odstraňování odmocnin z jejich jmenovatele. Autoři nemají vyhraněný názor, zda by se usměrňovat mělo, či ne (Je hezčí nebo ?). V některých případech však je usměrňování nežádoucí: ze zlomku -J= okamžitě odečteme, že jeho hodnota je o něco málo větší než 1 (neboť V 35 je jen o málo menší než 6), kdežto z usměrněného zlomku nevidíme na první pohled nic. 35 2.55. Uvažme komplexní čísla C j ako reálný vektorový prostor. Určete souřadnice čísla 2 + i v bázi dané kořeny polynomu x2 — x + 1. 2.56. Pro jaké hodnoty parametrů a, b, c e M jsou vektory (1, 1, a, 1), (1, b, 1, 1), (c, 1, 1, 1) lineárně závislé? 2.57. Nechť je dán vektorový prostor V a nějaká jeho báze složená z vektorů u, v, w, z. Zjistěte, zda jsou vektory u — 3v + z, v — 5w — z, 3w — lz, u — w + z lineárně (ne)závislé. 2.58. Doplňte vektory 1 — x2 + x3, 1 + x2 + x3, 1 — x — x3 na bázi prostoru polynomů stupně nejvýše 3. 2.59. Tvoří matice (i _°2). (o _i)' (35 o)' (o 3) bázi vektorového prostoru čtvercových dvourozměrných matic? Solution. Uvedené čtyři matice jsou jako vektory v prostoru 2x2 matic lineárně nezávislé. Vyplývá to z toho, že matice /l 0 1 V-2 1 4 o -1 o 3 0 1\ -2 0 3/ je tzv. regulární, což je mimochodem ekvivalentní livovolnému z následujích tvrzení: její hodnost je rovna rozměru; ze z ní pomocí řádkových elementárních transformací obdržet jednotkovou matici; existuje k ní matice inverzní; má nenulový determinant, roven 116; jí zadaná homogenní soustava lineárních rovnic má pouze nulové řešení; každý nehomogenní lineární systém s levou stranou určenou touto maticí má právě jedno řešení; obor hodnot lineárního zobrazení, jež zadává, je vektorový prostor dimenze 4; toto zobrazení je injektivní). □ Abychom měli indukční krok přirozenější, probereme ještě přímo případ k = 1. Máme V = ({v}) a v 7^ 0, protože {v} je lineárně nezávislá množina vektorů. Pak je ovšem {v} zároveň báze vektorového prostoru V. Předpokládejme, že tvrzení platí pro k = n, a uvažme V = (vi, ..., vn+i). Jsou-li vi, ..., vn+i lineárně nezávislé, pak tvoří bázi. V opačném případě existuje index i takový, že vt =a1v1-\-----h flí-iť/-! + ai+1vi+1 H-----h an+1vn+1. Pak ovšem V = (v\, ..., vi+i, ..., vn+\) a již umíme vybrat bázi (podle indukčního předpokladu). Zbývá ověřit, že báze mají vždy stejný počet prvků. Uvažujme bázi (vi, ..., vn) prostoru V a libovolný nenulový vektor u = a\V\ + • • • + a„v„ e V s a{ 7^ 0 pro jisté i. Pak Ví = — (u-(aiVi-\-----hflí-iľí-i +ai+ivi+i -\-----\-a„v„)) at a proto také {u,v\, ..., vi+\, ..., v„) = V. Ověříme, že je to opět báze: Kdyby přidáním u k lineárně nezávislým vektorům v\, ..., t>;_i, vi+\, ..., vn vznikly lineárně závislé vektory, pak by u bylo jejich lineární kombinací. To by znamenalo V = (ví, ..., Vi-i, vt Vn), coz není mozne. Takže jsme dokázali, že pro libovolný nenulový vektor u e V existuje i, 1 < i < n, takové, že (u, v\, ..., Vi-i, Vi+i, ..., v„) je opět báze V. Dále budeme místo jednoho vektoru u uvažovat lineárně nezávislou množinu u\, ..., uk a budeme postupně přidávat u\, u2, ..., vždy výměnou za vhodné vt podle předchozího postupu. Musíme přitom ověřit, že takové vt vždy bude existovat (tj. že se nebudou vektory u vyměňovat vzájemně). Předpokládejme tedy, že již máme umístěné u\, ..., ui. Pak se uí+i jistě vyjádří jako lineární kombinace těchto vektorů a zbylých v j. Pokud by pouze koeficienty u u 1, ..., ui byly nenulové, znamenalo by to, že již samy vektory u\, ..., uí+i byly lineárně závislé, což je ve sporu s našimi předpoklady. Pro každé k < n tak po k krocích získáme bázi ve které z původní báze došlo k výměně k vektorů za nové. Pokud by k > n, pak již v n-tém kroku obdržíme bázi vybranou z nových vektorů w;, což znamená, že tyto nemohou být lineárně nezávislé. Zejména tedy není možné, aby dvě báze měly různý počet prvků. □ Ve skutečnosti jsme dokázali silnější tvrzení, tzv. Steinit-zovu větu o výměně, která říká, že pro každou konečnou bázi v a každý systém lineárně nezávislých vektorů ve V umíme najít podmnožinu bázových vektorů vt, po jejichž záměně za zadané nové vektory opět dostaneme bázi. 100 CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA 2.31. Důsledky Steinitzovy věty o výměně. Díky možnosti volně volit a vyměňovat bázové 1__vektory můžeme okamžitě dovodit pěkné (a intuitivně snad také očekávané) vlastnosti bazí vektorových prostorů: Proposition. (1) Každé dvě báze konečněrozměrného vektorového prostoru mají stejný počet vektorů, tzn. že naše definice dimenze nezávisí na volbě báze. (2) Má-li V konečnou bázi, lze každou lineárně nezávislou množinu doplnit do báze. (3) Báze konečněrozměrných vektorových prostorů jsou právě maximální lineárně nezávislé množiny. (4) Báze prostoru s konečnou dimenzí jsou právě minimální množiny generátorů. Malinko složitější, ale nyní snadno zvládnutelná, je situace kolem dimenzí podprostorů a jejich součtů: Corollary. Nechť W, W\, W2 C V jsou podprostory v prostoru V konečné dimenze. Pak platí (1) dim W < dim V, (2) V = W, právě když dim V = dim W, (3) dim Wi + dim W2 = dim(Wi + W2) + dim(Wi n W2). Proof. Zbývá dokázat pouze poslední tvrzení. To je zřejmé, pokud je dimenze jednoho z prostorů nulová. Předpokládejme tedy dim W\ = r > 1, dim W2 = s > 1 a nechť (wi ..., wt) je báze Wi n W2 (nebo prázdná množina, pokud je průnik triviální). Podle Steinitzovy věty o výměně lze tuto bázi průniku doplnit na bázi (wi, ... ,wt, ut+i ..., ur) pro W\ a na bázi (wi ..., wt, vt+i, ..., vs) pro W2. Vektory Wl, Wt, Ut+l , . . . , Ur, Vt+\ ...,VS jistě generují W\ + W2. Ukážeme, že jsou přitom lineárně nezávislé. Nechť tedy a\Wi + Pak nutně + atwt + bt+iUt+i + ... ----\-brur +ct+ivt+i + + csvs = 0. - (ct+i ■ vt+i H-----h cs ■ vs) = = a\ ■ w\ + • • • + at ■ wt + bt+\ ■ ut+\ + • • • + br ■ ur musí patřit do W2 n Wi. To ale má za následek, že bt+i =■■■ = br = 0, protože tak jsem doplňovali naše báze. Pak ovšem i at ■ wi H-----h at ■ wt + ct+i ■ vt+í H-----h cs ■ vs = 0 a, protože příslušné vektory tvoří bázi W2, jsou všechny koeficienty nulové. Tvrzení (3) nyní vyplývá z přímého přepočítání generátorů. □ 1 1 -1 1 1 1 1 2 1 = 1 2 3 1 3 3 -1 1 3 2.60. V M3 jsou dány podprostory U a V generované po řadě vektory (1,1,-3), (1, 2, 2) a (1, 1, -1), (1, 2, 1), (1, 3, 3). Nalezněte průnik těchto podprostorů. Solution. Podprostor V má dimenzi pouze 2 (nejedná se tedy o celý prostor M3), neboť 11-1 111 0 a neboť libovolná dvojice z uvažovaných třech vektorů je očividně lineárně nezávislá. Stejně snadno vidíme, že také podprostor U má dimenzi 2. Současně je 1 1 1 1 2 1=2^0, -3 2 -1 a proto vektor (1, 1, —1) nemůže náležet do podprostorů U. Průnikem rovin procházejících počátkem (dvojrozměrných podprostorů) v trojrozměrném prostoru musí být alespoň přímka. V našem případu je jím právě přímka (podprostory nejsou totožné). Určili jsme dimenzi průniku - je jednodimenzionální. Všimneme-li si, že 1 -(1, 1, -3)+ 2- (1,2,2) = (3,5, 1) = 1 • (1, 1, -1) +2 • (1, 2, 1), dostáváme vyjádření hledaného průniku ve tvaru množiny všech skalárních násobků vektoru (3, 5, 1) (jedná se o přímku procházející počátkem s tímto směrovým vektorem). □ 2.61. Stanovte vektorový podprostor (prostoru M4) generovaný vektory m = (-1, 3, -2, 1), u2 = (2, -1,-1, 2), u3 = (-4, 7, -3, 0), «4 = (1, 5, —5, 4). vybráním nějaké maximální množiny lineárně nezávislých vektorů w; (tj. vybráním báze). Solution. Sepíšeme vektory w; do sloupců matice a obdrženou matici upravíme pomocí řádkových elementárních transformací. Takto získáme 2 2 -1 -1 2 o 4 -4 -7 7 3 -3 2 Odtud vyplývá, že lineárně nezávislejšou právě vektory u 1, U2, U4, tj. právě ty vektory odpovídající sloupcům, které obsahují první nenulové číslo nějakého řádku. Navíc odsud plyne (viz třetí sloupec) 2 • (-1, 3, -2, 1) - (2, -1,-1,2) = (-4, 7, -3, 0). □ 101 G. LINEÁRNI ZÁVISLOST A NEZÁVISLOST, BAZE 3. VEKTOROVÉ PROSTORY A LINEÁRNI ZOBRAZENI 2.62. Ve vektorovém prostoru M4 jsou dány trojrozměrné podpros-tory U = u2, u3), V = (vi, v2, v3), přičemž /!\ 1 1 0 i -1 U\ = 1 0 , U3 = 1 -i 1 \°) W v) v3 = (1, —1, —1, \)T. Určete dimenzi a libovolnou bázi podprostoru U n V. Solution. Do podprostoru U n V náleží právě ty vektory, které je možné obdržet jako lineární kombinaci vektorů u i a také jako lineární kombinaci vektorů t>;. Hledáme tedy čísla xi, x2, x3, yi, y2, y3 e M taková, aby platilo íx\ (l\ (l\ (l\ 1 1 0 i -i -1 xx 1 + x2 0 + x3 1 = yi -i + y2 i -1 \°) W W V1/ tj. hledáme řešení soustavy X\ + x2 + x3 X\ + x2 X\ + x3 x2 + x3 yi + y2 + y3, vi - y2 - y3, -vi + y2 - y3, -vi - y2 + y3. Při maticovém zápisu této homogenní soustavy (a při zachování pořadí proměnných) je /lil —1 110-1 10 11 \0 1 1 1 /l 1 0 1 o o \o o /l 1 1 o 0 110 0 0 10 \0 0 0 1 Dostáváme tak řešení 1 1\ 1 1 1 /l 1 0 0 V o -i i i -i 0 1 ■ 1 -1 2 0 1 0 2 1 ■1 1 -1 1 2 1 0 0 -1\ -1 2 1 ) 0\ -2 -2 /I 1 1 0 111 0 0 10 \0 0 0 1 /l o o o 0 10 0 0 0 10 \0 0 0 1 1 -1 1 -1\ 2 2 "M -1\ -1 -2 !7 2\ 0 -2 xi = —2ř, x2 = — 2s, x3 = 2s + 2t, y\ = — s — t, y2 = s, y3 = t, t, s e M. Odtud dosazením získáváme obecný vektor průniku /xi+x2 + x3\ I 0 \ X\ + x2 X\ + x3 \ x2+x3 J -2t - 2s 2s 2t 2.32. Examples. (1) K" má (jako vektorový prostor nad K) dimenzi n. Bazí je např. «-tice vektorů ((1,0,...,0),(0, 1, 0)..., (0, 0, 1)). Tuto bázi nazýváme standardní báze v W. Všimněme si, že případě konečného pole skalárů, např. Z*, má celý vektorový prostor K" jen konečný počet k" prvků. (2) C jako vektorový prostor nad M má dimenzi 2, bázi tvoří např. čísla 1 a i. (3) Km[jc], tj. prostor polynomů stupně nejvýše m, má dimenzi m + 1, bazí je např. posloupnost 1, x, x2, ..., xm. Vektorový prostor všech polynomů K[x] má dimenzi oo, umíme však ještě stále najít bázi (i když s nekonečně mnoha prvky): 1, x, x2, .... (4) Vektorový prostor M nad Q má dimenzi oo a nemá spočetnou bázi. (5) Vektorový prostor všech zobrazení / : M -> M má také dimenzi oo a nemá spočetnou bázi. 2.33. Souřadnice vektorů. Jestliže pevně zvolíme bázi (t>i, ..., vn) konečněrozměrného prostoru V, pak můžeme každý vektor w e V vyjádřit jako ¥L-l.\í lineární kombinaci v = a\v\-\- ■ ■ +anvn. Předpokládejme, že to uděláme dvěma způsoby: w = a\Vi + • • • + anvn = b\V\ + • • • + bnvn. Potom ale 0 = (a\ — b\) • V\ -\-----\-(a„ - b„) ■ v„ a proto a{ = b{ pro všechna i = 1, ..., n. Dospěli jsme proto k závěru: V konečněrozměrném vektorovém prostoru lze každý vektor zadat právě jediným způsobem jako lineární kombinaci bázových vektorů. Koeficienty této jediné lineární kombinace vyjadřující daný vektor w e V ve zvolené bázi v = (vi, ..., v„) se nazývají souřadnice vektoru w v této bázi. Kdykoliv budeme mluvit o souřadnicích {a\, ..., an) vektoru w, které vyjadřujeme jako posloupnost, musíme mít pevně zvolenu i posloupnost bázových vektorů y_ = (i>i, ..., vn). Jakkoliv jsme tedy báze zavedli jako minimální množiny generátorů, ve skutečnosti s nimi budeme pracovat jako s posloupnostmi (tedy s uspořádanými množinami, kde je pevně zadáno pořadí bázových prvků). | přiřazení souřadnic vektorům j. Přiřazení, které vektoru u = a\V\ + ■ ■ ■ + anvn přiřadí jeho souřadnice v bázi v, budeme značit stejným symbolem v : V -> K". Má tyto vlastnosti: (1) v_(u + w) = v(u) + v(w); Vm, w e V, (2) v(a ■ u) = a ■ v(u); Va e I, V« e V. 102 CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA Všimněme si, že operace na levých a pravých stranách těchto rovnic nejsou totožné, naopak, jde o operace na různých vektorových prostorech! Při X-"* .• této příležitosti se také můžeme zamyslet nad obecným případem báze M (možná nekonečněrozměrného) prostoru V. Báze pak nemusí být spočetná, pořád ale ještě můžeme definovat zobrazení M : V -» KM (tj. souřadnice vektoru jsou zobrazení z M do K). Uvedené vlastnosti přiřazení souřadnic jsme viděli už dříve u zobrazení, kterým jsme v geometrii roviny říkali lineární (zachovávaly naši lineární strukturu v rovině). Než se budeme věnovat podrobněji závislosti souřadnic na volbě báze, podíváme se obecněji na pojem linearity zobrazení. 2.34. Lineární zobrazení. Pro jakékoliv vektorové prostory (konečné i nekonečné dimenze), definujeme "linearitu" zobrazení mezi prostory ob-dobně, jako jsme to viděli již v rovině M2: Definice lineárních zobrazení Vidíme, že Nechť V a W jsou vektorové prostory nad týmž polem skalárů K. Zobrazení / : V -» W se nazývá lineární zobrazení (homomorfismus) jestliže platí: (1) f(u + v) = f(u) + f(v), Vu,veV (2) f(a ■ u) = a ■ f(u), Va ěK,¥uě V. Samozřejmě, že jsme taková zobrazení již viděli ve formě násobení matic: s maticí typu m /n nad K. Obraz Im/ := f (V) C W je vždy vektorový pod-prostor, protože lineární kombinace obrazů / (w;) je obrazem lineární kombinace vektorů u{ se stejnými koeficienty. Stejně tak je vektorovým podprostorem množina všech vektorů Ker/ := /_1({0}) C V, protože lineární kombinace nulových obrazů bude vždy zase nulovým vektorem. Podprostor Ker / se nazývá jádro lineárního zobrazení f. Lineární zobrazení, které je bijekcí nazýváme izomorfis-mus. Podobně jako u abstraktní definice vektorových prostorů, opět je třeba ověřit zdánlivě samozřejmá tvrzení vyplývající z axiomů: Proposition. Nechť f : V -» W je lineární zobrazení mezi libovolnými vektorovými prostory nad týmž polem skalárů K. Pro všechny vektory € V, a skaláry a\, ..., ak e K platí: (1) /(O) = 0, (2) f(-u) = -f(u), (3) f(ax - Mi H-----Yak-uk)=ax- f{ux) H-----\-ak- f(uk), (4) pro každý vektorový podprostor V\ C V je jeho obraz f{V\) vektorový podprostor ve W, (5) pro každý podprostor W\ C W je množina f~l{W\) = {v e V; f (v) e W\] vektorový podprostor ve V. dim U n V = 2, U n V í°\ -1 -1 1 ' 0 w □ 2.63. Uvedte nějakou bázi podprostoru H(i!Mn)-(T!Mf T vektorového prostoru reálných matic 3x2. Tuto bázi doplňte na bázi celého prostoru. Solution. Připomeňme, že bázi podprostoru tvoří množina lineárně nezávislých vektorů, které generují uvažovaný podprostor. Protože /l 2\ /o ŕ -1(3 4)+2 (2 3 \5 6/ \4 5, -2- + 3 celý podprostor U je generován pouze prvními dvěma maticemi. Ty jsou potom lineárně nezávislé (jedna není násobkem druhé), a tak zadávají bázi. Chceme-li ji doplnit na bázi celého prostoru reálných matic 3x2, musíme najít další čtyři matice (dimenze celého prostoru je zjevně 6) takové, aby výsledná šestice byla lineárně nezávislá. Můžeme využít toho, že známe např. standardní bázi prostoru reálných matic 3x2, který lze přímo ztotožnit s M6. Sepíšeme-li dva vektory báze U a vektory standardní báze celého prostoru v tomto pořadí, výběrem prvních 6 lineárně nezávislých vektorů dostaneme hledanou bázi. Pokud však uvážíme, že kupř. 1 0 0 0 0 0 2 1 0 0 0 0 3 2 1 0 0 0 4 3 0 1 0 0 5 4 0 0 1 0 6 5 0 0 0 1 můžeme ihned bázového vektory 103 H. LINEÁRNÍ ZOBRAZENÍ 3. VEKTOROVÉ PROSTORY A LINEÁRNÍ ZOBRAZENÍ podprostoru U doplnit maticemi (vektory prostoru matic) Proof. Počítáme s využitím axiomů a definic a již dokázaných výsledků (dohledejte si případně samostatně!): na bázi. Upozorněme, že výše uvedený determinant lze vyčíslit velmi snadno - je roven součinu prvků na diagonále, neboť matice je v dolním trojúhelníkovém tvaru (nad diagonálou jsou všechny prvky nulové). □ H. Lineární zobrazení Jak popsat analyticky shodná zobrazení v rovině či prostoru jako je rotace, osová symetrie či zrcadlení, nebo projekci třírozměrného prostoru na dvojrozměrné plátno? Jak popsat zvětšení obrázku? Co mají společného? Jsou to všechno lineární zobrazení. Znamená to, že zachovávají jistou strukturu roviny či prostoru. Jakou strukturu? Strukturu vektorového prostoru. Každý bod v rovině je popsán dvěma v prostoru pak třema souřadnicemi. Pokud zvolíme počátek souřadnic, tak má smysl mluvit o tom, že nějaký bod je dvakrát dál od počátku stejným směrem než jiný bod. Také víme, kam se dostaneme, posuneme-li se o nějaký úsek v jistém směru a pak o jiný úsek v jiném směru. Tyto vlastnosti můžeme zformalizovat, hovoříme-li o vektorech v rovině, či prostoru a o jejich násobcích, či součtech. Lineární zobrazení má pak tu vlastnost, že obraz součtu vektorů je součet obrazů sčítaných vektorů a obraz násobku vektoru je ten stejný násobek obrazu násobeného vektoru. Tyto vlastnosti právě mají zobrazení zmíněná v úvodu tohoto odstavce. Takové zobrazení je pak jednoznačně určeno tím, jak se chová na vektrorech nějaké báze (to je v rovině obrazem dvou vektorů neležících na přímce, v prostoru obrazem tří vektorů neležích v rovině). A jak tedy zapsat nějaké lineární zobrazení / na vektorovém prostoru V7? Začněme pro jednoduchost s rovinou M2: předpokládejme, že obraz bodu (vektoru) (1, 0) je (a, b) a obraz bodu (0, 1) je (c, d). Tím už je jednoznačně určený obraz libovolného bodu o souřadnicích (u, v): f((u, v)) = f(u(\, 0) + i,(0, 1)) = uf(\, 0) + 0) = (ua, ub) + (vc, vd) = (au + cv, bu + dv), což můžeme výhodně zapsat následujícím způsobem: (a c\ /u\ (au + cv\ b d) \v) ~ \bu +dv) Lineární je tedy zobrazení jednoznačně dané maticí. Navíc pokud (e A máme další lineární zobrazení g, dané maticí I , ), tak snadno \g h) spočítáme (čtenář si jistě ze zájmu sám ověří), že jejich složení g o f 'ae + fc be + df /(0) = f(u -u) = f((l f(-u) = /((-!) -u) = — 1) • w) = 0- f(u) = 0, je dáno maticí íci I V' ag + ch bg + dh ) Vlastnost (3) se ověří snadno z definičního vztahu pro dva sčítance indukcí přes počet sčítanců. Z platnosti (3) nyní plyne, že (/(Vi)) = f{V\), je to tedy vektorový podprostor. Je-li naopak f(u) e W\ a f (v) e W\, pak pro libovolné skaláry bude i f (a -u +b ■ v) = a ■ f(u) + b- f (v) e W\. □ 2.35. Jednoduché důsledky. (1) Složení g o f : V -» Z dvou lineárních zobrazení / : V^Wa.g:W^Z)e opět lineární zobrazení. (2) Lineární zobrazení / : V -» W je izomorfismus, právě když Im / = W a Ker / = {0} C V. Inverzní zobrazení k izomorfismu je opět izomorfismus. (3) Pro libovolné podprostory V\, V2 C V a lineární zobrazení / : V -> W platí /(Vi + V2) = /(V0 + f(V2), /(Vi n v2) c f (vo n f(v2). (4) Zobrazení "přiřazení souřadnic" u : V -> K" dané libovolně zvolenou bází u = (u\, ..., un) vektorového prostom V je izomorfismus. (5) Dva konečněrozměrné vektorové prostory jsou izomorfní právě když mají stejnou dimenzi. (6) Složení dvou izomorfismu je izomorfismus. Proof. Ověření prvního tvrzení je velmi snadné cvičení. Pro důkaz druhého si uvědomme, že je-li t / lineární bijekce, pak je vektor w vzorem lin- ' L/ C."." erán i' kombi nace au+bľ. tj. w = f~l (au+bv), ^yj^- - právě když f(w) =au+bv = f (a ■ f-\u) + b ■ f~\v)). Je tedy také w = af~l(u) + bf~l(v) a tedy je inverze k lineární bijekci opět lineární zobrazení. Dále, / je surjektivní, právě když Im / = W a pokud Ker / = {0}, pak f(u) = f (v) zaručuje f(u — v) = 0, tj. u = v. Je tedy v tom případě / injektivní. Další tvrzení se dokáže snadno přímo z definic. Najděte si protipříklad, že v dokazované inkluzi opravdu nemusí nastat rovnost! Zbývající body jsou již zřejmé. □ Opět souřadnice. Uvažujme libovolné vektorové prostory VaW nad K s dim V = n, dim W = m a mějme lineární zobrazení / : V -> W. Pro každou í volbu bází u = (u\, ..., u„) na V, v = (v\, ..., v„) na W, máme k dispozici příslušná přiřazení souřadnic a celou situaci několika právě zmíněných zobrazení zachycuje následující diagram: 104 CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA Spodní šipka /„je definována zbylými třemi, tj. jako zobrazení jde o složení fu,v = v o f of1. Matice lineárního zobrazení Každé lineární zobrazení je jednoznačně určeno svými hodnotami na libovolné množině generátorů, zejména tedy na vektorech báze u. Označme = an-v1+a21-v2-\-----h amlvm f(u2) =a12-v1+a22-v2-\-----h am2vm f(un) — a\n ■ v\ + a2n ■ v2 + ■ ■ ■ + amnvm tj. skaláry útý tvoří matici A, kde sloupce jsou souřadnice hodnot f(uj) zobrazení / na bázových vektorech vyjádření v bázi v na cílovém prostoru W. Matici A = (ciij) nazýváme maticí zobrazení f v bázích u, v. Pro obecný vektor u = x\U\ + ■ ■ ■ +xnun e V spočteme (vzpomeňme, že sčítání vektorů je komutativní a distributivní vůči násobení skaláry) f(u) = xif{u{) H-----\-xnf(un) = x\{a\\V\-\- ■ ■ +am\vm) + • • • + x„(ai„vi+- ■ ■ +amnvm) = (xiútn +• • • +x„ai„)vi + ■ ■ ■ + {x\am\ +■ ■ ■ +xnamn)vm. Pomocí násobení matic lze nyní velice snadno a přehledně zapsat hodnoty zobrazení fu,v(w) definovaného jednoznačně předchozím diagramem. Připomeňme si, že vektory v W chápeme jako sloupce, tj. matice typu r/1 fu,v(u(w)) = v(f(w)) = A ■ u(w). Naopak, máme-li pevně zvoleny báze na V i W, pak každá volba matice A typu m /n zadává jednoznačně lineární zobrazení W -> Km a tedy i zobrazení / : V -> W. Máme-li tedy zvoleny báze prostorů V a.W, odpovídá každé volbě matice typu m/n právě jedno lineární zobrazení V -> W a ukázali jsme bijekci mezi maticemi příslušného rozměru a lineárními zobrazeními V -> W. 2.37. Matice přechodu mezi souřadnicemi. Jestliže za V i W zvolíme tentýž prostor, ale s různými bázemi, a za / identické zobrazení, vyjadřuje postup z předchozího odstavce vektory báze u v souřadnicích vzhledem k v. Označme výslednou matici T. Když pak zadáme vektor u U = X\U\ -\- ' ' ' -\- Xnlln To nás vede k tomu, abychom násobení matic definovali tímto způsobem, tedy aby aby aplikace zobrazení na vektor byla dána maticovým násobením matice zobrazení se zobrazovaným vektorem a aby složení zobrazení bylo dáno součinem matic jednotlivých zobrazení. Obdobně to funguje v prostorech vyšší dimenze. Zároveň tato úvaha znovu ukazuje to, co již bylo dokázáno v (2.5), totiž že násobení matic je asociativní, ale není komutativní, neboť tomu tak je u skládání zobrazení. To je tedy další z motivací, proč se zabývat vektorovými prostory a proč je s pojmem vektorového Připomeňme si nyní, že v první kapitole jsme již pracovali s maticemi některých lineárních zobrazení v rovině M2, zejména rotace kolem bodu a osové symetrie (viz 1.31 a 1.32), Nyní zkusme zapsat matice lineárních zobrazení z M3 do M3. Jak vypadá matice rotace ve třech rozměrech? Začněme speciálními (pro popis jednoduššími) rotacemi kolem souřadnicových os: 2.64. Matice rotací kolem os v M3. Napište matice zobrazení rotací o úhel cp postupně kolem (orientovaných) os x, y, z v M3 . Solution. Při rotaci libovolného bodu kolem dané osy (řekněme x), se příslušná souřadnice daného bodu nemění, v rovině dané dvěma zbylými osami pak již je rotace dána známou maticí typu 2/2. Postupně tedy dostáváme následující matice — rotace kolem osy z: /cos cp — sin cp 0\ sin cp cos cp 0 0 0 1, rotace kolem osy y: cos

_ VI 4 1 2 v souřadnicích vzhledem k m a dosadíme za ut jejich vyjádření pomocí vektorů z _u, obdržíme souřadné vyjádření x = (x\, ..., xn) téhož vektoru v bázi v. Stačí k tomu přeskládat pořadí sčítanců a vyjádřit skaláry u jednotlivých vektorů báze. Ve skutečnosti teď děláme totéž, co v předchozím odstavci pro speciální případ identického zobrazení idy na vektorovém prostoru V. Matice tohoto identického zobrazení je T a tedy nutně musí naznačený přímý výpočet dát x = T ■ x. Situace se zobrazena na diagramu: Výslednou matici T nazýváme matice přechodu od báze u vektorového prostoru V k bázi v téhož prostoru. Přímo z definice vyplývá: J výpočet matice přechodu |_ Proposition. Matici T přechodu od báze u k bázi v získáme tak, ze souřadnice vektorů báze u v bázi v napíšeme do sloupců matice T. Funkce matice přechodu je taková, že známe-li souřadnice x vektoru v bázi u, pak jeho souřadnice v bázi v se obdrží vynásobením sloupce x maticí přechodu (zleva). Protože inverzní zobrazení k identickému je opět totéž identické zobrazení, je matice přechodu vždy invertibilní a její inverze je právě matice přechodu opačným směrem, tj. od báze v k bázi u. 2.38. Více souřadnic. Nyní si ukážeme, jak se skládají souřadná vyjádření lineárních zobrazení. Uvažme ještě další vektorový prostor Z nad K dimenze k s bází w_, lineární zobrazení g : W -> Z a označme příslušnou matici g^^. V W fu,v gv,w Složení go f na horním řádku odpovídá matici zobrazení W -> Kk dole a přímo spočteme (píšeme A pro matici / a B pro matici g ve zvolených bazích): 8v,w o fu,v(x) = w o g o v'1 o v o f o u~l = B-(A-x) = (B- A)-x (g O f)u,w(x) □ pro všechny x e K". Skládání obražení tedy odpovídá násobení příslušných matic. Všimněte si také, že isomorfismy odpovídají právě invertibilním maticím. Stejný postup nám dává odpověď na otázku, jak se změní matice zobrazení, změníme-li báze na definičním oboru i 106 CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA oboru hodnot: V idy V w fu,v W kde T je matice přechodu od w' k u a S je matice přechodu od 1/ k v_. Je-li tedy A původní matice zobrazení, bude nová dána jako A' = S"1 AT. Ve speciálním případě lineárního zobrazení / : V -» V, tj. zobrazení má stejný prostor V jako definiční obor i obor hodnot, vyjadřujeme zpravidla / pomocí jediné báze u prostoru V. Pak tedy přechod k nové bázi w' s maticí před-chodu T od u/ k u bude znamenat změnu matice zobrazení na A' = T~lAT. 2.39. Lineární formy. Obzvlášť jednoduchým a zároveň důležitým případem lineárních zobrazení jsou tzv. lineární formy. Jde o lineární zobrazení z vektorového prostoru V nad polem skalárů K do skalárů K. Jsou-li dány souřadnice na V, je přiřazení jednotlivé /-té souřadnice vektorům právě takovou lineární formou. Přesněji řečeno, pro každou volbu báze v = (vi, ..., v„) máme k dispozici lineární formy v* : V -» K takové, že v*(vj) = 8^, tj. nula pro různé indexy i a. j a. jednička pro stejné. Vektorový prostor všech lineárních forem na V značíme V* a říkáme mu duální prostor vektorovému prostoru V. Předpokládejme nyní, že prostor V má konečnou dimenzi n. Bázi V* sestavenou z přiřazování jednotlivých souřadnic jako výše nazýváme duální báze. Skutečně se jedná o bázi prostoru V*, protože jsou tyto formy zjevně lineárně nezávislé (prověřte si!) a je-li a libovolná forma, pak platí pro každý vektor u = x\v\ + ■ ■ ■ + x„v„ a(u) = x\a(v\) + • • • + x„a(v„) = aŕuOuJXw) H-----h a(vn)v*(u) a je tedy a lineární kombinací forem v*. Při pevně zvolené bázi {1} na jednorozměrném prostoru skalárů K jsou s každou volbou báze v na V lineární formy a ztotožněny s maticemi typu l/n, tj. s řádky y. Právě komponenty těchto řádků jsou souřadnicemi obecných lineárních forem v duální bázi v*. Vyčíslení takové formy na vektoru je pak dáno vynásobením příslušného řádkového vektoru y se sloupcem souřadnic x vektoru u e V v bázi v: a(u) = y ■ x = yixi H-----h y„x„. Zejména tedy vidíme, že pro každý konečněrozměrný prostor V je V* izomorfní prostoru V. Realizace takového izomorfismu je dána např. naší volbou duální báze ke zvolené bázi na prostoru V. V tomto kontextu tedy znovu potkáváme skalární součin řádku n skalárů se sloupcem n skalárů, jak jsme s ním pracovali již v odstavci 2.3 na straně 75. 2.66. Matice obecné rotace v M3. Odvodte matici obecné rotace vil Solution. Úvahu z předchozího příkladu můžeme provést i s obecnými hodnotami. Uvažme libovolný jednotkový vektor (x, y, z). Rotace v kladném smyslu o úhel

(1 — cos || = -Jx2 + Ý = y/v ■ v, zatímco (orientovaný) úhel

M, které je symetrické ve svých argumentech, lineární v každém z nich a takové, že (v, v) > 0 a ||u||2 = (v, v) = 0 pouze při v = 0. Číslu ||u|| = ^(v, v) říkáme velikost vektoru v. Vektory v a w e V se nazývají ortogonální nebo kolmé, jestliže (v, w) =0. Píšeme také v _L w. Vektor v se nazývá normovaný, jestliže ||t>|| = 1. 108 CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA Báze prostoru V složená z ortogonálních vektorů se nazývá ortogonální báze. Jsou-li bázové vektory navíc i normované, je to ortonormální báze. Skalární součin se také často zapisuje pomocí obvyklé tečky, tj. (u, v) = u ■ v. Z kontextu je pak třeba poznat, zda jde o součin dvou vektorů (tedy výsledkem je skalár) nebo něco jiného (stejně jsme značili součin matic a také někdy součin skalárů). Protože je skalární součin lineární v každém ze svých argumentů, bude jistě úplně určen již svými hodnotami na dvojicích bázových vektorů. Skutečně, zvolme si bázi u = (u\, ..., un) prostoru V a označme Sij = (Uí,Uj). Pak ze symetričnosti skalárního součinu plyne = sý a z linearity součinu v každém z argumentů dostáváme: 'X-v'"'-X-V;".- = X-v'-V;<"/- ui) = XA'>V''.V.''- Pokud je báze ortonormální, je matice S jednotkovou maticí. Tím jsme dokázali následující užitečné tvrzení: skalární součin a ortonormální báze Proposition. Skalární součin je v každé ortonormální bázi dán v souřadnicích výrazem (x, y) T x -y. Pro každou obecnou bázi prostoru V existuje symetrická matice S taková, že souřadné vyjádření skalárního součinu je .J (x, y) S-y. 2.41. Ortogonální doplňky a projekce. Pro každý pevně zvolený podprostor W C V v prostoru se skalárním součinem definujeme jeho ortogonální doplněk takto {u e V; u A. v pro všechny v e W}. Přímo z definice je zjevné, že W1- je vektorový podprostor. Jestliže W C V má bázi («i, ..., uk), je podmínka pro W1- dána jako k homogenních rovnic pro n proměnných. Bude tedy mít W1- dimenzi alespoň n — k. Zároveň ale u g W H W1- znamená (u, u) = 0 a tedy i u = 0 podle definice skalárního součinu. Zřejmě je tedy vždy celý prostor V přímým součtem v = wew±. Lineární zobrazení / : V -> V na libovolném vektorovém prostoru se nazývá projekce, jestliže platí / o f = f. no o R = T ■ I 0 0 -73 I • T~l vo í/Vš o 1/3 1/3 - V3/3 1/3 + V3/3\ 1/3 + V3/3 1/3 1/3 - V3/3 ) ,1/3-73/3 1/3 + V3/3 1/3 / Tento výsledek můžeme ověřit dosazením do matice obecné rotace (||2.66||), normováním vektoru (1, 1, 1) dostáváme vektor (x, y, z) = (l/VŠ, 1/V3, 1/V3), cos( (1, 0) a matice konjugace v této 1 b) Pro bázi (1,0 dostáváme 1 h-» 2+i, i h-» 2i — 1, tedy (1,0) i-» (2, 1), (0, 1) i-» (2, —1). Celkem je matice násobení číslem 2 + i v bázi (1, i) tato: ^ Nyní určeme matici v bázi /. Násobením číslem (2 + i) dostáváme: (1 - i) h> (1 - 0(2 + 0 = 3- i, (1 + 0 ^ (1 + 30-Souřadnice (a, b)f vektoru 3 — z v bázi / jsou dány, jak již dobře víme, rovnicí a ■ (1 — 0 + b ■ (1 + 0 = 3 + i, tedy (3 + 0/ = (2, 1). Obdobně (1+30/ = (—1,2). Dohromady jsme získali matici Zamyslete se, proč nám matice násobení číslem 2 + i vyšla stejná v obou bázích. Byla by stejná matice násobení libovolným jiným komplexním číslem v těchto bazích? □ 2.73. Určete matici A, která ve standardní bázi prostoru M3 zadává kolmou projekci do vektorového podprostoru generovaného vektory m = (-1, 1,0) aw2 = (-1,0, 1). Solution. Nejprve poznamenejme, že uvedený podprostor je rovinou procházející počátkem s normálovým vektorem «3 = (1, 1, 1). Uspořádaná trojice (1, 1, 1) je totiž očividným řešením soustavy -xx + x2 + x3 0, 0, tj. vektor «3 je kolmý na vektory u\,u2. Při dané projekci se vektory u\ & u2 musejí zobrazit na sebe a vektor w3 potom na nulový vektor. V bázi složené po řadě z vektorů u\, u2, «3 je proto matice této projekce Pomocí matic přechodu -1 0 1 V takovém případě je pro každý vektor v € V v = f (v) + (v- f (v)) e Im(/) + Ker(/) = V a je-li u e Im(/)a/(i;) = 0, pak je i v = 0. Je tedy přechozí součet podprostoru přímý. Říkáme, že / je projekce na podprostor W = Im(/) podél podprostoru U = Ker(f). Slovy se dá projekce popsat přirozeně takto: rozložíme daný vektor na komponentu ve W a v U a tu druhou zapomeneme. Je-li na V navíc skalární součin, říkáme že jde o kolmou projekci, když je jádro kolmé na obraz. Každý podprostor W 7^ V tedy definuje kolmou projekci na W. Je to projekce na W podél WL, která je dána pomocí jednoznačného rozkladu každého vektoru u na komponenty uw e W a uw± e WL, tj. lineární zobrazení, které uw + uw± zobrazí na iiw 2.42. Existence ortonormální báze. Povšimněme si, že na každém konečněrozměrném reálném vektorovém prostoru jistě existují skalární součiny. Prostě si stačí vybrat libovolnou bázi, prohlásit ji za ortonormální a hned jeden dobře definovaný skalární součin máme. V této bázi pak skalární součiny počítáme podle vzorce v Tvrzení 2.40. Umíme to ale i naopak. Máme-li zadán skalární součin na vektorovém prostoru V, můžeme vcelku jednoduše početně využít vhodných kolmých projekcí a jakoukoliv zvolenou bázi upravit na ortonormální. Jde o tzv. Grammův-Schmidtův ortogonalizační proces. Cílem této procedury bude z dané posloupnosti nenulových generátorů v\, ..., konečněrozměrného prostoru V vytvořit ortogonální množinu nenulových generátorů pro V. Grammova-S chmidtova ortogonalizace Proposition. Nechť (u 1, ..., u\)je lineárně nezávislá k-tice vektorů prostoru V se skalárním součinem. Pak existuje ortogonální systém vektorů (v\, ..., v^) takový, že Vi e ..., Ui), i = 1, ..., k. Získáme je následující procedurou: • Nezávislost vektorů u i zaručuje, že u\ 7^ 0; zvolíme v\ = U\. • Máme-li již vektory v\, ..., vi potřebných vlastností, zvolíme vi+\ = ui+\ + a\V\ + ••• + aivi, kde _ {ue+l,Vj) ' ~ Ikll2 ' Proof. Začneme prvním (nenulovým) vektorem v\ a spočteme kolmou projekci v2 do (vi)1- C {{vuv2}). Výsledek bude nenulový právě, když je v2 nezávislé na v\. Ve všech dalších krocích budeme postupovat obdobně. V £-tém kroku tedy chceme, aby pro ví+i = uí+i + a\V\ + • • • + aivi platilo (vi+i, t>;) = 0, pro všechny i = 110 CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA !,...,£. Odtud plyne 0 = {uí+í + atvi H-----h aivi, vt) = {uí+í, vt) + ^(i;,, vt) a je vidět, že vektory s požadovanými vlastnostmi jsou určeny jednoznačně až na násobek. □ Kdykoliv máme ortogonální bázi vektorového prostoru V, stačí vektory vynormovat a získáme bázi ortonormální. Dokázali jsme proto: Corollary. Na každém konečněrozměrném reálném vektorovém prostoru se skalárním součinem existuje ortonormální báze. V ortonormální bázi se obzvlášť snadno spočtou souřadnice a kolmé projekce. Skutečně, mějme ortonormální bázi (e\, ..., en) prostoru V. Pak každý vektor v = x\e\ + • • • + xnen splňuje ( 1 - 2nnT = |0 1 0 1 - 2 • - I 1 1 1 .0 0 1/ 3 U 1 1, □ Pomocí skalárního součinu můžeme určovat odchylky vektorů: 2.80. Určete odchylku kořenů polynomu x2 — i uvažovaných jako vektory v komplexní rovině. Solution. Kořeny daného polynomu jsou druhé odmocniny z i. Argumenty druhých odmocnin z libovolného nenulového komplexního čísla se podle Moivrovy věty liší o ľl. Jejich odchylka tedy bude vždy n. □ 2.81. Určete cosinus odchylky přímek p, q v M3 daných obecnými rovnicemi jako p : -2x + y + z = 1 x + 3y - 4z = 5 q : x — y = —2 z = 6 Úhel

K, kde pro jakékoliv vektory u,v,w, z a skaláry a,b, c & d platí, stejně jako u skalárního součinu a(au + bv, cw + dz) = aca(u, w) + ada(u, z) + bca(v, w) + bd a(v, z). Pokud navíc platí a(u, w) = a(w, u), hovoříme o symetrické bilineární formě. Jestliže záměna argumentů vede k obrácení znaménka výsledku, hovoříme o antisymetrické bilineární formě. Již v rovinné geometrii jsme zavedli determinant jako bilineární antisymetrickou formu a, tj. a(u, w) = —a(w, u). Obecně víme z věty 2.17, že je determinant v dimenzi n možno nahlížet jako «-lineární antisymetrickou formu. Jako u lineárních zobrazení je zřejmé, že každá k-lineární forma je úplně určena svými hodnotami na všech /c-ticích bázových prvků v pevné bázi. V analogii k lineárním zobrazením tyto hodnoty můžeme vnímat jako /c-rozměrné analogie matic. Ukážeme si to v případě k = 2, kde půjde doopravdy o matice, jak jsme je zavedli. _ \ Matice bilineární formy |_ Jestliže zvolíme bázi u na ľ a definujeme pro danou bilineární formu a skaláry atj = a(ui,Uj), pak zjevně dostaneme pro vektory v, w se souřadnicemi x a v (jakožto sloupce souřadnic) n a (v, w) = ^ aijXtyj = yT ■ A ■ x, íj=i kde A je matice A = (ay). 112 CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA Přímo z definice matice bilinerání formy je vidět, že forma je symetrická nebo antisymetrická, právě když má tutéž vlastnost její matice. Každá bilineární forma a na vektorovém prostoru V definuje zobrazení V -» V*, v h-» a( ,v), tj. dosazením pevného vektoru v za druhý argument dostáváme lineární formu, která je obrazem tohoto vektoru. Zvolíme-li pevně bázi na konečněrozměrném prostoru V a duální bázi na V*, pak jde o zobrazení y i—> (x i—> y^ ■ A ■ x). 4. Vlastnosti lineárních zobrazení Podrobnějším rozborem vlastností různých typů lineárních zobrazení se nyní dostaneme k lepšímu pochopení nástrojů, které nám vektorové prostory pro lineární modelování procesů a systémů nabízejí. 2.45. Začneme čtyřmi příklady v nejnižší zajímavé dimenzi. Ve standardní bázi roviny M2 se standardním skalárním součinem uvažujme následující matice zobrazení / : M2 -» M2: Matice A zadává kolmou projekci podél podprostoru na podprostor W C {(0, a); ael)c V c {(fl,0); ael)c tj. projekce na osu x podél osy y. Evidentně pro toto zobrazení / : M2 -» M2 platí / o / = / a tedy zúžení f \ v daného zobrazení na obor hodnot je identické zobrazení. Jádrem / je právě podprostor W. Matice B má vlastnost B2 = 0, platí tedy totéž o příslušném zobrazení /'. Můžeme si jej představit jako matici derivování polynomů M.i[x] stupně nejvýše jedna v bázi (1, x) (derivacemi se budeme podrobně zabývat v kapitole páté, viz ??). Matice C zadává zobrazení /, které první vektor báze zvětší a-krát, druhý Ŕ-krát. Tady se nám tedy celá rovina rozpadá na dva podprostory, které jsou zobrazením / zachovány a ve kterých jde o pouhou homotetii, tj. roztažení skalárním násobkem (první příklad byl speciální případem s a = 1, b = 0). Např. volba a = 1, b = — 1 odpovídá osové symetrii (zrcadlení) podle osy x, což je totéž jako komplexní konjugace x + iy h» x — iy na dvourozměrném reálném prostoru M2 ~ C v bázi (1,0- Toto je lineární zobrazení dvourozměrného reálného vektorového prostoru C, nikoliv však jednorozměrného komplexního prostoru C. Matice D je maticí rotace o pravý úhel ve standardní bázi a na první pohled je vidět, že žádný jednorozměrný podprostor není zobrazením zachováván. 2.82. Je dána přímka p : [1, 1] + (4, l)ř, t e R Určete parametrické vyjádření všech přímek q, které procházejí počátkem souřadnic a s přímkou p mají odchylku 60°. 2.83. Pomocí Gramova-Schmidtova ortogonalizačního procesu získejte ortogonální bázi podprostoru U = {(xi, X2, x3, x^)J € M4; x\ + x2 + xj, + X4 = 0] prostoru M4. Solution. Množina řešení uvedené homogenní lineární rovnice je zřejmě vektorovým prostorem s bází 1 0 0 0 1 0 W K1) Vektory ortogonální báze získané užitím Gramova-Schmidtova ortogonalizačního procesu budeme značit v\, v2, v3. Nejprve položme v\ = u\. Dále v2 = u2 inu2 1 /II \r U2- -v1 = (--, --,l,0j , resp. zvolme násobek v2 = (—1, —1, 2, 0)T. Následně je 1 1 uX • V\ u\ • v2 t>3 = II3--— V:--— V2 = w3--V:--V2 j j '|2 1 lh,,l|2 2 2 6 l"ll l"2l ( 1 ) V 3 3 3 / Máme tedy celkem 1 -1 -1 Vi = 0 , v2 = 2 , V3 = -1 \°) \ 0 / W Dodejme, že pro jednoduchost příkladu lze bezprostředně uvést ortogonální bázi z vektorů (1,-1,0, 0)y, (0, 0, 1,-1) , (1,1,-1,-iy nebo (-1, 1, 1,-I)1 , (1,-1,1,-iy, (-1,-1,1,1)' □ 113 I. BÁZE A SKALÁRNÍ SOUČINY 4. VLASTNOSTI LINEÁRNÍCH ZOBRAZENÍ 2.84. Napište něj akou bázi reálného vektorového prostoru matic 3x3 nad R s nulovou stopou (součet prvků na diagonále) a napište souřadnice matice v této bázi. 2.85. Zavedte nějaký skalární součin na vektorovém prostoru matic z předchozího příkladu. Spočítejte normu matice z předchozího příkladu, která je indukovaná Vámi zavedeným součinem. 2.86. Určete nějakou bázi vektorového prostoru antisymetrických reálných čtvercových matic typu 4x4. Uvažte standardní skalární součin v této bázi a pomocí tohoto součinu vyjádřete velikost matice / 0 3 1 0\ 0 1 2 1 0 2 2 -2 0/ 2.87. Najděte ortogonální doplněk U1- podprostoru U = {(x\, X2, xs, X4); x\ = x3, x2 = x3 + 6x4} c R4. Solution. Ortogonální doplněk U1- tvoří právě ty vektory, které jsou kolmé na každé řešení soustavy x\ — x3 = 0, x2 — xj, — 6x4 = 0. Vektor je ovšem řešením této soustavy tehdy a jenom tehdy, když je kolmý na oba vektory (1,0, —1,0), (0, 1, — 1, —6). Je tedy U1- = {a ■ (1, 0, -1, 0) + b ■ (0, 1, -1, -6); a, b e □ 2.88. Určete, zda jsou podprostory U = ((2, 1, 2, 2)) a V = ((-1, 0, -1, 2), (-1, 0, 1, 0), (0, 0, 1, -1)) prostoru R4 na sebe kolmé. Pokud ano, je R4 = U © V, tj. je U1- = V? 2.89. V závislosti na parametru t e R stanovte dimenzi podprostoru U vektorového prostoru R3, je-li U generován vektory (a) ui = (1, 1, 1), u2 = (\,t,\), w3 = (2, 2, ř); (b) ui = (t,t,t), u2 = (-4ř,-4ř, 4ř), «3 = (-2, -2, -2). 2.90. Sestrojte ortogonální bázi podprostoru ((1,1,1,1), (1,1,1,-1), (-1,1,1,1)) prostoru R4. Taková rotace je bijekcí roviny na sebe, proto jistě umíme najít (různé) báze na definičním oboru a oboru hodnot, ve kterých bude jeho maticí jednotková matice E (prostě vezmeme jakoukoliv bázi na definičním oboru a její obraz na oboru hodnot). Neumíme ale v tomto případě totéž s jednou bází na definičním oboru i oboru hodnot. Zkusme však uvažovat matici D jako matici zobrazení g : C2 -» C2 ve standardní bázi komplexního vektorového prostoru C2. Pak umíme najít vektory u = (i, 1), v = (—i, 1), pro které bude platit K") v. To ale znamená, že v bázi (u, v) na C2 má zobrazení g matici K (ó ") a povšimněme si, že tato komplexní analogie k případu matice C má na diagonále prvky a = cos(jtt) + i sin(^7r) a kmoplexně sdružené ä. Jinými slovy, argument v goniometrickém tvaru tohoto komplexního čísla udává úhel otočení. Tomu lze snadno porozumět, když si označíme reálnou a imaginární část vektoru u takto xu + iyu = Re u -\- i Im u Vektor v je komplexně sdružený k u. Zajímá nás zúžení zobrazení g na reálný vektorový podprostor V = R2 n (u, v) c C2. Evidentně je V = {u + ú, i(u - ú)) = {xu, -yu) celá reálná rovina R2. Zúžení zobrazení g na tuto rovinu je právě původní zobrazení dané maticí A a z definice násobení komplexní jednotkou jde o otočení o úhel v kladném smyslu ve vztahu ke zvolené bázi xu, —yu (ověřte si přímým výpočtem a uvědomte si také, proč případné prohození pořadí vektorů u a. v povede k témuž výsledku, byť v jiné reálné bázi!). 2.46. Vlastní čísla a vlastní vektory zobrazení. Klíčem k popisu zobrazení v předchozích příkladech byly odpovědi na otázku "jaké jsou vektory splňující rovnici f(u) = a-u pro nějaké vhodné skaláry a?". Zvolme tedy pevně lineární zobrazní / : V -> V na vektorovém prostoru dimenze n nad skaláry K. Jestliže si představíme takovou rovnost zapsanou v souřadnicích, tj. s využitím matice zobrazení A v nějakých bázích, jde o výraz A ■ x — a ■ x = (A — a ■ E) ■ x = 0. Z předchozího víme, že taková soustava rovnic má jediné řešení x = 0, pokud je matice A — a E invertibilní. My 114 CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA tedy chceme najít takové hodnoty a e K, pro které naopak A —a E invertibilní není, a nutnou a dostatečnou podmínkou je (viz Věta 2.23) (2.4) det(A - a ■ E) = 0. Jestliže považujeme k = a za proměnnou v předchozí skalární rovnici, hledáme ve skutečnosti kořeny polynomu stupně n. Jak jsme viděli v případě matice D výše, kořeny mohou, ale nemusí existovat podle volby pole skalárů '. mm^^mm^ Vlastní čísla a vlastní vektory Skaláry k vyhovující rovnici f(u) = k ■ u pro nenulový vektor u e V nazýváme vlastní čísla zobrazení f, příslušné nenulové vektory u pak vlastní vektory zobrazení f. Jsou-li u, v vlastní vektory příslušné k témuž vlastnímu číslu k, pak i pro jejich jakoukoliv lineární kombinaci platí f (au + bv) = af(u) + bf(v) = k(au + bv). Proto tvoří vlastní vektory příslušné k vlastnímu číslu k, společně s nulovým vektorem, netriviální vektorový podpros-tor Vx, tzv. vlastní podprostor příslušný k. Např., je-li k = 0 vlastním číslem, je jádro Ker / vlastním podprostorem V0- Z definice vlastních čísel je zřejmé, že jejich výpočet nemůže záviset na volbě báze a tedy matice zobrazení /. Skutečně, jako přímý důsledek trasformačních vlastností z odstavce 2.38 a Cauchyovy věty 2.19 pro výpočet determinantu součinu dostáváme jinou volbou souřadnic matici A' = P~lAP s invertibilní maticí P a \P~lAP kE\ = \P~lAP -■- \P~l(A - kE)P\ ■ \A - kE\, P~lkEP\ = \p-l\\(A-kE\\P\ protože násobení skalárů je komutativní a \P~l\ = li5!-1. Z těchto důvodů používáme pro matice a zobrazení společnou terminologii: i,-^ Charakteristický polynom matice a obražení Pro matici A dimenze n nad K nazýváme polynom | A — kE\ e K„[A] charakteristický polynom matice A. Kořeny tohoto polynomu jsou vlastní čísla matice A. Jeli A matice zobrazení / : V -» V v jisté bázi, pak |A — kE\ nazýváme také charakteristický polynom zobrazení f. Protože je charakteristický polynom lineárního zobrazení / : V -» V nezávislý na volbě báze V, jsou i jeho koeficienty u jednotlivých mocnin proměnné k skaláry vyjadřující vlastnosti zobrazení /, tj. nemohou záviset na naší volbě báze. Zejména jako jednoduché cvičení na počítání determinantů vyjádříme koeficienty u nejvyšších a nejnižších mocnin (předpokládáme dim V = n a matici zobrazení A = (a^) v nějaké bázi): \A — k ■ E\ = (-l)nkn + (-\)n-\an + ■■■+ ann) ■ kn~l + ••• + |A| -k°. 2.91. V prostoru M4 nalezněte nějakou ortogonální bázi podprostoru všech lineárních kombinací vektorů (1,0, 1,0), (0, 1,0, —7), (4, —2, 4, 14) a podprostoru generovaného vektory (1, 2, 2, —1), (1, 1, -5, 3), (3,2, 8, -7). 2.92. Pro jaké hodnoty parametrů a, b e M jsou vektory (1,1,2,0,0), (1,-1,0,1, a), (1,0,2,3,-2) v prostoru M5 po dvou ortogonální? 2.93. V prostoru M5 uvažujte podprostor generovaný vektory (1,1,-1,-1,0), (1,-1,-1,0,-1), (1,1,0,1,1), (—1, 0, —1, 1, 1). Najděte nějakou bázi jeho ortogonálního doplňku. 2.94. Popište ortogonální doplněk podprostoru V prostoru M4, jeli V generován vektory (-1,2, 0, 1), (3, 1, -2, 4), (-4, 1, 2, -4), (2,3, -2,5). 2.95. V prostoru M5 určete ortogonální doplněk W1- podprostoru W, jestliže (a) W = {(r + s + t, -r + t, r + s, -t, s + t); r, s, t e R}; (b) W je množina řešení soustavy rovnic x\ — xj, = 0, x\ — x2 + x3 — x4 -\- x$ = 0. 2.96. Nechť jsou v prostoru R4 dány vektory (1,-2,2,1), (1,3,2,1). Doplňte tyto dva vektory libovolným způsobem na ortogonální bázi celého R4. (Můžete k tomu využít Gramův-Schmidtův ortogonal-izační proces.) 2.97. Nalezněte nějakou ortonormální bází podprostoru V C M, kde V = {(xi, X2, JC3, x4) e R4 \ x\ + 2x2 + x3 = 0}. Solution. Vidíme, že čtvrtá souřadnice se v omezení na podprostor nevyskytuje, bude tedy vhodné volit jeden z vektorů hledané ortonormální báze vektor (0, 0, 0, 1) a redukovat problém do prostoru R3. I dále se zkusíme vyhnout počítání: vidíme, že položíme-li druhou souřadnici rovnu nule, tak ve vyšetřovaném prostoru leží vektory s opačnou první a třetí souřadnicí, zejména jednotkový vek-tor (-^j, 0, — -^j, 0). Na tento vektor je kolmý libovolný vektor, který má stejnou první a třetí souřadnici. Abychom se dostali do uvažovaného podprostoru, volíme druhou souřadnici rovnu záporné hodnotě součtu první a třetí souřadnice a normujeme, tedy volíme vektor ^'-^'75'°)aJsmehotovL D 115 J. VLASTNI CISLA A VLASTNI VEKTORY 4. VLASTNOSTI LINEÁRNÍCH ZOBRAZENI J. Vlastní čísla a vlastní vektory 2.98. Vlastní čísla a vlastní vektory mohou sloužit k názornému popisu lineárních zobrazení, zejména v M2 a M3. (1) Uvažme zobrazení s maticí ve standardní bázi ÍO 0 R3 - -> R3, A = V o Pak dostáváme -k 0 1 \A - XE\ = 0 1 — X 0 = -x3 1 0 —X s kořeny A12 = 1, A.3 = — 1. Vlastní vektory s vlastní hodnotou X = 1 se spočtou: -10 1 \ (l 0 -V 0 0 0 - 0 o o 10-1/ \o o o s bází prostoru řešení, tj. všech vlastních vektorů s touto vlastní hodnotou «i = (0,1,0), u2 = (1,0,1). Podobně pro k = — 1 dostáváme třetí nezávislý vlastní vektor = (-1,0,1). V bázi u\, u2, «3 (všimněte si, že w3 musí být lineárně nezávislý na zbylých dvou díky větě 2.47 a u 1, u2 vyšly jako dvě nezávislá řešení) má / diagonální matici Celý prostor R3 je přímým součtem vlastních podprostorů, R3 = Vi © V2, dim Vi = 2, dim V2 = 1. Tento rozklad je dán jednoznačně a vypovídá mnoho o geometrických vlastnostech zobrazení /. Vlastní podprostor V\ je navíc přímým součtem jednorozměrných vlastních podprostorů, které lze však zvolit mnoha různými způsoby (takový další rozklad nemá tedy již žádný geometrický význam). (2) Uvažme lineární zobrazení / : R2[x] -» R2[x] definované derivováním polynomů, tj. /(I) = 0, f(x) = 1, f(x2) = 2x. Zahrazení f má tedy v obvyklé bázi (1, x, x2) matici Koeficient u nejvyšší mocniny říká jen, zda je dimenze prostoru V sudá nebo lichá. O determinantu matice zobrazení jsme už zmiňovali, že vyjadřuje, kolikrát dané lineární zobrazení zvětšuje objemy. Zajímavé je, že i součet diagonálních členů matice zobrazení nezávisí na volbě báze. Nazýváme jej stopa matice a značíme TrA. Stopa zobrazení je definována jako stopa jeho matice v libovolné bázi. Ve skutečnosti to natolik překvapivé není, protože v kapitole osmé si jako příklad na metody diferenciálního počtu ukážeme, že stopa je ve skutečnosti lineárním přiblížením determinantu v okolí jednotkové matice, viz ??. V dalším si uvedeme několik podstatných vlastností vlastních podprostorů. 2.47. Theorem. Vlastní vektory lineárního zobrazení f : V -» V příslušné různým vlastním hodnotám jsou lineárně nezávislé. Proof. Nechť ai,...,ak jsou různé vlastní hodnoty J.' 1, zobrazení / a u\, ..., uk vlastní vektory s těmito vlastními hodnotami. Důkaz provedeme indukcí přes počet lineárně nezávislých vektorů mezi zvolenými. ™ t] Předpokládejme, že u\,...,ui jsou lineárně nezávislé a = ciulJe jejich lineární kombinací. Alespoň l = 1 lze zvolit, protože vlastní vektory jsou nenulové. Pak ovšem f(ul+1) = al+1 ■ ul+1 = XLi aw ■ ci ■ ui> tj- y, ci ■ nud = ^Lci'ai'Uí ■ i=\ i=\ f(ul+1) = ^al+1 -Ct -ut i=\ Odečtením druhého a čtvrtého výrazu v rovnostech dostáváme 0 = _ ai) ' ci ' ui- Všechny rozdíly vlastních hodnot jsou však nenulové a alespoň jeden koeficient c; je nenulový. To je spor s předpokládanou nezávislostí takže i vektor ut+i musí být lineárně nezávislý na předchozích. □ Na právě dokázané tvrzení se můžeme podívat jako na rozklad lineárního zobrazení / na součet jednoduchých zobrazení. Pro vesměs různé vlastní hodnoty A; charakteristického polynomu budeme dostávat jednorozměrné vlastní pod-postory V-M ■ Každý z nich pak zadává projekci na tento invariantní jednorozměrný podprostor, na němž je zobrazení dáno jako násobení vlastním číslem A;. Celý prostor V je tak rozložen na přímý součet jednotlivých vlastních podprostorů. Navíc lze tento rozklad na vlastní podprostory snadno spočíst: j báze z vlastních vektorů |_ Corollary. Jestliže existuje n navzájem různých kořenů charakteristického polynomu zobrazení f : V —> V, na n—rozměrném prostoru V, pak existuje rozklad V na přímý součet vlastních podprostorů dimenze 1. To znamená, že existuje báze V složená výhradně z vlastních vektorů a v této bázi 116 CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA má f diagonální matici. Tato báze je určená jednoznačně až na pořadí prvků. Příslušnou bázi (vyjádřenou v souřadnicích vzhledem k libovolně zvolené bázi V) obdržíme řešením n systémů homogenních lineárních rovnic o n neznámých s maticemi (A — Xi ■ E), kde A je matice f ve zvolené bázi. 2.48. Invariantní podprostory. Viděli jsme, že každý vlastní vektor v zobrazení / : V -» V 1___generuje podprostor (v) C V, který je ľľ^^gzT zobrazením / zachováván. Obecněji říkáme, že vektorový podprostor W C V je invariantní podprostor pro lineární zobrazení /, jestliže platí f(W) C W. Jestliže je V konečněrozměrný vektorový prostor a vybereme nějakou bázi (u\, ..., uk) podprostoru W, můžeme ji vždy doplnit na bázi (u\, ..., uk, uk+i, ..., un) celého V a v každé takové bázi má naše zobrazení matici A tvaru (2.5) (o í) kde B je čtvercová matice dimenze k, D je čtvercová matice dimenze n — k a C je matice typu n/(n — k). Naopak, jestliže je v nějaké bázi (u\, ..., un) matice zobrazení / tvaru (2.5), je W = ..., uk) invariantní podprostor zobrazení /. Pochopitelně bude v naší matici zobrazení (2.5) sub-matice C nulová právě tehdy, když bude i podprostor (uk+i, ..., un) generovaný doplněnými vektory báze invariantní. Z tohoto pohledu jsou vlastní podprostory lineárního zobrazení extrémní případy invariantních podprostoru a zejména v případě existence n = dim V různých vlastních čísel zobrazení / dostáváme rozklad V na přímý součet n vlastních podprostoru. V příslušné bázi z vlastních vektorů má pak naše zobrazení diagonální tvar s vlastními čísly na diagonále. 2.49. Ortogonální zobrazení. Podívejme se teď na speciální případ zobrazení / : V -» W mezi prostory se skalárními součiny, která Mfc^ zachovávají velikosti pro všechny vektory U g V. | Definice ortogonálních zobrazení [ Lineární zobrazení / : V -» W mezi prostory se skalárním součinem se nazývá ortogonální zobrazení, jesltiže pro všechny u e V (/(«), /(«)) = («, «)■ Z linearity / a ze symetrie skalárního součinu vyplývá pro všechny dvojice vektorů rovnost (f(u + v),f(u + v)) : (f(u),f(u)) + (f(v),f(v)) + 2(f(u),f(v)). Charakteristický polynom je \A — k ■ E\ = —A3, existuje tedy pouze jediná vlastní hodnota, k = 0. Spočtěme vlastní vektory: Prostor vlastních vektorů je tedy jednorozměrný, generovaný konstantním polynomem 1. 2.99. Příklad i se změnou báze. Určete vlastní čísla a vlastní vektory matice li 1 0\ A = j 1 2 1 V 2 h Popište geometrickou interpretaci tohoto zobrazení a napište jeho matici v bázi: ex = [1,-1,1] e2 = [1,2,0] e3 = [0, 1, 1] Solution. Charakteristický polynom dané matice je 1 - k 1 1 2 — k 1 2 0 1 1 - k -ŕ + 4k2 2k -k(k2 - 4k + 2). Kořeny tohoto polynomu, vlastní čísla, udávají, kdy nebude mít matice plnou hodnost, tedy soustava rovnic bude mít i jiné řešení než řešení x = (0, 0, 0). Vlastní čísla tedy jsou 0, 2 + a/2, 2 — a/2- Spočítejme vlastní vektory příslušné jednotlivým vlastním hodnotám: • 0: Řešíme tedy soustavu Jejím řešením je jednodimenzionální vektorový prostor vlastních vektorů ((1, —1, 1)). • 2 + a/2: Řešíme soustavu -(1 + V2) 1 0 \ /V 1 -V2 1 jx2 1 2 -(1 + V2)/ \X3j 0. 117 J. VLASTNI CISLA A VLASTNI VEKTORY 4. VLASTNOSTI LINEÁRNÍCH ZOBRAZENI Řešením je jednodimenzionální prostor ((1,1 + a/2, 1 + V2)>. • 2 — a/2: Řešíme soustavu '(a/2-1) 1 0 \ /jcA 1 V2 1 x2 = 0. 1 2 (a/2 - 1)/ W Řešením je prostor vlastních vektorů ((1, 1 — a/2, 1 — a/2)). Daná matice má vlastní čísla 0,2+a/2 a 2—a/2, kterým přísluší po řadě jednorozměrné prostory vlastních vektorů ((1, —1, 1)), ((1, 1 + V2, 1 + 72)) a ((1, 1 - a/2, 1 - 72)). Zobrazení tedy můžeme interpretovat jako projekci podél vektoru (1, -1, 1) do roviny dané vektory (1, 1 + 72, 1 + a/2) a (1, 1 -V2, 1 — a/2) složenou s lineárním zobrazením daným "natažením" daným vlastními čísly ve směru uvedených vlastních vektorů. Nyní jej vyjádřeme v uvedené bázi. K tomu budeme potřebovat matici přechodu T od standardní báze k dané nové bázi. Tu získáme tak, že souřadnice vektorů staré báze v bázi nové napíšeme do sloupců matice T. My však snadněji zapíšeme matici přechodu od dané báze k bázi standardní, tedy matici T~l. Souřadnice vektorů nové báze pouze zapíšeme do sloupců: Potom a pro matici B zobrazení v nové bázi pak máme (viz 2.38) B = TAT- □ Procvičme si počítání s vlastními čísly a vlastními vektory na následujících příkladech. 2.100. Naleznete vlastní čísla a jim příslušné vektorové prostory vlastních vektorů matice: A= -1 1 -13 0 2 -2 2y Solution. Nejprve sestavíme charakteristický polynom dané matice: Proto všechny ortogonální zobrazení splňují i zdánlivě silnější požadavek, aby platilo pro všechny vektory u, v e V (f(u),f(v)) = (u, v). V úvodní diskusi o geometrii v rovině jsme ve Větě 1.33 dokázali, že lineární zobrazení M2 -» M2 zachovává velikosti vektorů, právě když jeho matice ve standardní bázi (a ta je ortonormální vzhledem ke standardnímu skalárnímu součinu) splňuje AT ■ A = E, tj. A-1 = AT. Obecně, ortogonální zobrazení / : V -» W musí být vždy injektivní, protože podmínka (f(u), /(«)) = 0 znamená i (u, u) = 0 a tedy u = 0. Je tedy vždy v takovém případě dimenze oboru hodnot alespoň taková, jako je dimenze definičního oboru /. Pak ovšem je dimenze obrazu rovna dimenzi oboru hodnot a víme, že / : V -» Im / je bijekce. Pokud Im/ ^ W, doplníme ortonormální bázi na obrazu / na ortonormální bázi cílového prostoru a matice zobrazení bude obsahovat čtvercovou regulární matici A doplněnou nulovými řádky na potřebnou velikost. Bez újmy na obecnosti tedy předpokládejme W = V. Naše podmínka pro matici ortogonálního zobrazení v ortonormální bázi pak říká pro všechny vektory iayv prostoru K" toto: (A • xf ■ (A • y) = xT ■ (AT ■ A) • y = xT ■ y. Speciálními volbami vektorů standardní báze za x a y dostaneme přímo, že AT ■ A = E, tedy tentýž výsledek jako v dimenzi dvě. Dokázali jsme tak následující tvrzení: -| Matice ortogonálních zobrazení |» Theorem. Nechť V je reálný vektorový prostor se skalárním součinem a f : V —> V je lineární zobrazení. Pak f je ortogonální, právě když v některé ortonormální bázi (a pak už ve všech) má matici A splňující AT = A-1. ■1-k 1 0 -1 3-k 0 2 —2 2 — X X3 - 4k3 +2X + 4. Proof. Skutečně, jestliže zachovává / velikosti, musí mít uvedenou vlastnost v každé ortonormální bázi. Naopak, předchozí výpočet ukazuje, že vlastnost matice v jedné bázi už zaručuje zachovávání velikostí. □ Čtvercovým maticím, které splňují rovnost AT = A-1 říkáme ortogonální matice. Důsledkem předchozí věty je také popis všech matic přechodu S mezi ortonormálními bázemi. Každá totiž musí zadávat zobrazení W -> W zachovávající velikosti a splňují tady také právě podmínku 5_1 = ST. Při přechodu od jedné ortonormální báze ke druhé se tedy matice (libovolných) lineárních zobrazení mění podle vztahu A' = STAS. 118 CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA Rozklad ortogonálního zobrazení. Podívejme se nyní podrobněji na vlastní vektory a vlastní čísla ortogonálních zobrazení na reálném vektorovém prostoru V se skalárním součinem. Uvažujme pevně zvolené ortogonální zobrazení V s maticí A v nějaké ortonormální bázi a zkusme postupovat obdobně jako s maticí rotace D v příkladu 2.45. Nejprve se ale podívejme obecně na invariantní podpros-tory ortogonálních zobrazení a jejich ortogonální doplňky. Jestliže pro libovolný podprostor W C V a ortogonální zobrazení / : V -» V platí f(W) C W, pak také platí pro všechny v e W^, w e W (f(v), w) = (f(v), f o f~\w)) = (v, f~\w)) = 0 protože i f~l(w) e W. To ale znamená, že také f(WL) C WL. Dokázali jsme tedy jednoduché, ale velice důležité tvrzení: Proposition. Ortogonální doplněk k invariantnímu podpros-toruje také invariantní. Kdyby byla vlastní čísla ortogonálního zobrazení reálná, zaručovalo by už toto tvrzení, že bude vždy existovat báze V z vlastních vektorů. Skutečně, zúžení f na ortogonální doplněk invariantního podprostoru je opět ortogonální zobrazení, takže můžeme do báze přibírat jeden vlastní vektor za druhým, až dostaneme celý rozklad V. Nicméně většinou nejsou vlastní čísla ortogonálních zobrazení reálná. Musíme si proto pomoci opět výletem do komplexních vektorových prostorů. Zformulujeme rovnou výsledek: Rozklad ortogonálních zobrazení Theorem. Nechť f : V -» V je ortogonální zobrazení na prostoru se skalárním součinem. Pak všechny kořeny charakteristického polynomu f mají velikost jedna a existuje rozklad V na jednorozměrné vlastní podprostory odpovídající vlastním číslům k = ±1 a dvourozměrné podprostory Px~x> na kterých působí f rotací o úhel rovný argumentu komplexního čísla k v kladném směru. Všechny tyto různé podprostory jsou po dvou ortogonální. Proof. Bez újmy na obecnosti můžeme pracovat s \\ prostorem V = W" se standardním skalárním součinem. Zobrazení tedy bude dáno ortogonální matici A, kterou můžeme stejně považovat za matici lineárního zobrazení na komplexním prostoru Cm (která je jen shodou okolností reálná). Zaručeně bude existovat právě m (komplexních) kořenů charakteristického polynomu, včetně jejich algebraické násobnosti (viz tzv. základní věta algebry, ??). Navíc, protože charakteristický polynom zobrazení bude mít výhradně reálné koeficienty, budou tyto kořeny buď reálné, nebo půjde o dvojice komplexně sdružených kořenů k a k. Příslušné vlastní vektory v Cm k takové dvojici komplexně Tento polynom má kořeny 2, 1 + -v/3, 1 — V3, což jsou tak vlastní čísla zadané matice. Jejich algebraická násobnost je jedna (jsou to jednoduché kořeny charakteristického polynomu), každému tedy bude odpovídat právě jeden (až na nenulový násobek) vlastní vektor (tj. jejich tzv. geometrická násobnost bude také jedna, viz 3.32). Určeme vlastní vektor příslušný vlastnímu číslu 2 (je řešením homogenní lineární soustavy s maticí A — 2E): -3xi + x2 = 0 — lxi + x2 = 0 2xi — 2x2 = 0. Soustava má řešení xi = x2 = 0, x3 e M libovolné, vlastním vektorem příslušným vlastní hodnotě 2 je tedy například vektor (0, 0, 1) (a libovolný jeho nenulový násobek). Analogickým způsobem určíme i zbývající dva vlastí vektory, jakožto řešení soustavy [A — (1 + v/3)£]x = 0, respektive [A — (1 + v/3)£']x = 0. Řešením soustavy (-2 - V3)xi + x2 = 0 -lxi + (2 - V3)x2 = 0 2xi - 2x2 + (1 - V3)x3 = 0 je prostor {^(^ — l)ř, — |, ^ , t € M}. To je tedy prostor vlastních vektorů příslušných vlastní hodnotě 1 + V3 (mimo nulového vektoru, který sice je řešením dané soustavy, ale za vlastní vektor jej nepovažujeme; tuto záležitost již nebudeme více zmiňovat a nebudeme nulový vektor explicitně vylučovat z množiny řešení). Obdobně pak dostaneme, že prostor vlastních vektorů příslušných vlastní hodnotě 1 - 73 je ((-1 - -\, 1)). □ 2.101. Nalezněte vlastní čísla a jim příslušné vektorové prostory vlastních vektorů matice: Solution. Charakteristický polynom matice je k3 — 6k2 + \2k — 8, což je (k — 2)2 s trojnásobným kořenem 2. Číslo 2 je tedy vlastní hodnotou s algebraickou násobností tři. Její geometrická násobnost tedy bude jedna, dvě, nebo tři. Určeme tedy vlastní vektory příslušné této vlastní hodnotě jako řešení soustavy -Xi +x2 = 0, (A - 2E)x = -xi +x2 = 0, 2xi —2x2 = 0. 119 J. VLASTNI CISLA A VLASTNI VEKTORY 4. VLASTNOSTI LINEÁRNÍCH ZOBRAZENI Jejím řešením je dvojrozměrný prostor ((1, —1,0), (0, 0, 1)). Vlastní hodnota 2 má tedy algebraickou násobnost tři, ale geometrickou pouze dva. □ Další základní příklady na vlastní čísla vektory matic naleznete na straně 126 2.102. Pro libovolnou n x n matici A je její charakteristický polynom \ A — k E \ stupně n, je tedy tvaru | A - X E | = cn X" + c„_i X"-1 + ■ ■ ■ + a X + c0, cn^0, přičem platí c„ = (-l)", c„_! = (-l)"-1trA, c0 = |A|. Jestliže je matice A trojrozměrná, obdržíme \ A — X E \ = —X3 + (tr A) X2 + c\ X + \A\. Volbou X = 1 dostáváme \A-E\ = -l + trA+Cl + |A|. Odsud získáváme vyjádření ■XE\ -X3 + (tr A) X2 + (| A - E | + 1 - tr A - | A |) X + \ A Využijte toto vyjádření k určení charakteristického polynomu a vlastních hodnot matice /32 -67 47 A = j 7 -14 13 V"7 15 2.103. Bez počítání napište spektrum lineárního zobrazení / : M3 -» M3 zadaného přiřazením (jci, x2, x3) h-» (jci + x3, x2, x\ + x3). 2.104. Uvedte dimenze vlastních podprostorů jednotlivých vlastních hodnot Xi matice /4 0 0 0\ 14 0 0 5 2 3 0 \0 4 0 3/ 2.105. Pauliho matice Ve fyzice se stav částice se spinem | popisuje Pauliho maticemi. Jsou to následující matice 2x2 nad komplexními čísly cti=(í j)'CT2=0> o')'ct3=0 -O Pro čtvercové matice definujeme jejich komutátor (značený hranatými závorkami) jako \o\, a2] := o\o2 — o2o\ Ukažte, že platí \o\, a2] = 2z'er3 a podobně [eri, er3] = 2z'ct2 a \o2, er3] = 2io\. Dále ukažte, že o2 hodnoty matic o\, a2, cr3 jsou ±1. 1 a že vlastní sdružených vlastních čísel budou řešením dvou komplexně sdružených systémů homogenních lineárních rovnic, neboť příslušné matice systémů rovnic jsou celé reálné, až na samotná dosazená vlastní čísla. Evidentně proto budou také řešení těchto systémů komplexně sdružené vektory. Nyní využijeme skutečnost, že ke každému invariantnímu podprostorů je i jeho ortogonální doplněk invariantní. Nejprve si najdeme všechny vlastní podprostory V±1 příslušné k reálným vlastním hodnotám a zúžíme naše zobrazení na ortogonální doplněk k jejich součtu. Bez újmy na obecnosti tedy můžeme předpokládat, že naše ortogonální zobrazení nemá žádná reálná vlastní čísla a že je dim V = 2n > 0. Zvolme nyní nějaké vlastní číslo X a označme u x vlastní vektor příslušný k vlastnímu číslu X = a + ifi, ^ 0. Zcela stejně jako v případě rotace v rovině zadané v odstavci 2.45 maticí D nás zajímá reálná část součtu dvou jednorozměrných podprostorů (ux) © {ux), kde úx je vlastní vektor příslušný k vlastnímu číslu X. Jde o průnik uvedeného součtu komplexních podprostorů s M2", který je generovaný vektory ux + úx a i(ux — ux), tj. reálný vektorový podprostor Px c M2" generovaný bazí danou reálnou a imaginární částí ux xx=mux, -yx = -imux. Protože A • (ux + úx) = Xux + Xúx a podobně s druhým bázovým vektorem, jde zjevně o invariantní podprostor vůči násobení maticí A a dostáváme A • xx = axx + fiyx, A ■ yx = -ayx + fixx. Protože naše zobrazení zachovává velikosti, musí být navíc velikost vlastní hodnoty X rovna jedné. To ale neznamená nic jiného, než že zúžení našeho zobrazení na Px je rotací o argument vlastní hodnoty X. Všimněme si, že volba vlastního čísla X místo X vede na stejný podprostor se stejnou rotací, pouze ji dostaneme vyjádřenou v bázi xx, yx, tj. musíme v souřadnicích rotovat o úhel s opačným znaménkem. Důkaz celé věty tím dokončen, protože zúžením našeho zobrazení na ortogonální doplněk a opakováním předchozí úvahy dostaneme celý rozklad po n krocích. □ K myšlenkám tohoto důkazu se ještě vrátíme v kapitole třetí, když budeme studovat komplexní rozšíření euklidovských vektorových prostorů, viz 3.26. Remark. Specielně v dimenzi tři musí být alespoň jedno vlastní číslo ±1, protože je trojka liché číslo. Pak ovšem příslušný vlastní podprostor je osou rotace trojrozměrného prostoru o úhel daný argumentem dalších vlastních čísel. Zkuste si rozmyslet, jak poznat, kterým směrem jde rotace a také, že vlastní číslo — 1 znamená ještě dodatečné zrcadlení podle roviny kolmé na osu rotace. K diskusi vlastností matic a lineárních zobrazení se budeme vracet. Před pokračováním obecné teorie si napřed 120 CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA ukážeme v následující kapitole několik aplikací, ještě ale uzavřeme naši diskusi obecnou definicí: Spektrum lineárního zobrazení Ukažte, že pro matice popisující stav částice se spinem 1 2.51. Definition. Spektrum lineárního zobrazení f : V -» V (resp. matice) je posloupnost kořenů charakteristického polynomu zobrazení /, včetně násobností. Algebraickou násobností vlastní hodnoty rozumíme její násobnost jakožto kořenu charakteristického polynomu, geometrická násobnost vlastní hodnoty je dimenze příslušného podprostoru vlastních vektorů. Spektrálním poloměrem lineárního zobrazení (matice) je největší z absolutní hodnot vlastních čísel. V této terminologii můžeme naše výsledky o ortogonálních zobrazeních zformulovat tak, že jejich spektra jsou vždy celá podmnožinou jednotkové kružnice v komplexní rovině. To znamená, že v reálné části spektra mohou být pouze hodnoty ±1, jejichž algebraické a geometrické násobnosti jsou stejné. Komplexní hodnoty spektra pak odpovídají rotacím ve vhodných dvourozměrných podprostorech, které jsou na sebe po dvou kolmé. 1 1 (0 1 0 ^ lo 1 0/ ^ \0 platí stejné komutační relace jako v případě Pauliho matic. Ekvivalentně Lze ukázat, že při označení 1 := ^ , I := ia3, J := ia2, K := io\. tvoří vektorový prostor s bazí (1, /, J, K) algebru kvaternionů (algebra je vektorový prostor s binární bilineární operací násobení; v tomto případě je toto násobení dáno násobením matic). K tomu, aby uvažovaný prostor byl skutečně algebrou kvaternionů, je nutné a stačí ukázat následující vlastnosti: I2 = J2 = K2 = -l&IJ = -JI = K,JK = -KJ = I a KI = -IK = J. 2.106. Lze vyjádřit matici B ve tvaru součinu B = P~l D P pro něj akou diagonální matici D a in-vertibilní matici P ? Pokud je to možné, udejte příklad takové dvojice matic D, P a zjistěte, kolik takových dvojic existuje. Jak jsme viděli v , na základě vlastních hodnot a vektorů dané matice 3x3, umíme často geometricky interpretovat zobrazení, které zadává ve standardní bázi v M3. Umíme to zejména v těchto situacích: Má-li matice vlastní číslo 0 a vlastní číslo 1 s geometrickou násobností 2, tak se jedná o projekci ve směru vlastního vektoru příslušného vlastní hodnotě 0 na rovinu vlastních vektorů příslušných vlastní hodnotě 1. Pokud je vlastní vektor příslušný vlastní hodnotě 0 kolmý na rovinu vlastních vektorů příslušných hodnotě 1, pak se jedná o kolmou projekci. Má-li matice vlastní číslo — 1 s vlastním vektorem kolmým na rovinu vlastních vektorů příslušných vlastní hodnotě 1, jde o zrcadlení podle roviny vlastních vektorů příslušných vlastní hodnotě 1. Má-li matice vlastní číslo 1 s vlastním vektorem kolmým na rovinu vlastních vektorů příslušných vlastní hodnotě — 1, jedná se o osovou symetrii (v prostoru) podle osy dané vlastním vektorem příslušným vlastní hodnotě 1. 2.107. Určete geometrický význam lineárního zobrazení M3 -» M3 zadaného maticí 2 3 4 3 - 1 Solution. Matice má dvojnásobnou vlastní hodnotu —1, jí příslušný prostor vlastních vektorů je ((2,0, 1), (1, 1,0)). Dále má matice vlastní hodnotu 0, s vlastním vektorem (1,4, —3). Zobrazení dané touto maticí ve standardní bázi je tudíž osová souměrnost podle 121 J. VLASTNÍ ČÍSLA A VLASTNÍ VEKTORY 4. VLASTNOSTI LINEÁRNÍCH ZOBRAZENÍ přímky dané posledním vektorem složená s projekcí na rovinu kolmou k poslednímu vektoru, tedy danou obecnou rovnici x + 4y — 3z = 0. □ 2.108. Věta (2.50) nám dává do ruky nástroje, jak poznat matici rotace v M3: má tři různá vlastní čísla s absolutní hodnotou 1, jedno z nich je přímo číslo 1 (jemu příslušný vlastní vektor je osa rotace). Argument zbylých dvou, tedy nutně komplexně sdružených, vlastních čísel potom udává úhel rotace v kladném smyslu v rovině určené bazí ux +ul, i[ux - 2.109. Určete, jaké lineární zobrazení zadává matice Solution. Již známým postupem zjistíme, že matice má následující vlastní čísla a jim příslušné vlastní vektory: 1, (1,2,0); | + ji, 1, (1, 1 + — l — i); | — | i, (1, l—i, —1 + 0- Jde tedy o matici rotace (všechna vlastní čísla mají absolutní hodnotu 1 a jedna z vlastních hodnot je přímo 1), navíc víme, že se jedná o rotaci o arccos(|) = 0, 2957T, což je argument vlastního čísla | + ji. Zbývá určit smysl otáčení. Nejprve je dobré si připomenout, že smysl otáčení se mění s orientací osy (nemá tedy smyslu hovořit o smyslu otáčení, pokud nemáme orientovánu jeho osu. Dle úvah v důkazu věty 2.50, působí daná matice otáčením o arccos(|)) v kladném smyslu v rovině dané bazí ((0, 1, —1), (1, 1, —1)). První vektor báze je imaginární částí vlastního vektoru příslušného vlastní hodnotě | + ji, druhý pak je (společnou) reálnou částí vlastních vektorů příslušných komlexním vlastním hodnotám. Tady je důležité pořadí vektorů v bázi (prohozením vektorů se změní smysl otáčení). Osa otáčení je kolmá na uvažovanou rovinu. Pokud ji orientujeme podle pravidla pravé ruky (daný kolmý směr také dostaneme vektorovým součinem vektorů v bázi) tak bude smysl otáčení v prostoru souhlasit se smyslem otáčení v rovině s uvedenou bazí. V našem případě dostaneme vektorovým součinem (0, 1, —1) x (1, 1, —1) = (0, —1, —1). Jedná se tedy o rotaci o arccos(|) v kladném smyslu kolem vektoru (0, — 1, — 1), neboli o rotaci o arccos(|) v záporném smyslu kolem vektoru (0, 1, 1). □ 122 CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA K. Doplňující příklady k celé kapitole 2.110. Řešte soustavu X\ + -Xi -1x\ X2 ~\~ X3 -\- X4 — 2*5 2X2 + 2*3 + 2*4 — 4*5 — X2 — X3 ~\~ X4 -\- 2*5 + 3*2 + 3*3 — 6X5 3, 5, o, 2. Solution. Rozšířená matice soustavy je / V 1 o -1 -2 L 1 1 2 ■1 -1 1 2 1 0 3\ 5 0 2/ Přičtením prvního řádku ke třetímu a jeho dvojnásobku ke čtvrtému a poté přičtením (—5/2)násobku druhého řádku ke čtvrtému obdržíme /1 1 1 1 -2 3\ / 1 1 1 1 -2 3 \ 0 2 2 2 -4 5 0 2 2 2 -4 5 0 0 0 2 0 3 0 0 0 2 0 3 5 5 2 -10 8 J 0 0 -3 0 -9/2 ) Poslední řádek je zřejmě násobkem předposledního, a tak jej můžeme vynechat. Pivoti se nacházejí v 1., 2. a 4. sloupci, proto jsou volné proměnné x3 a x5, které nahradíme reálnými parametry t, s. Uvažujeme tak soustavu + *2 2x2 + + ř 2t + + JC4 2^4 2s 4s 3, 5, 3. Víme tedy, že x4 = 3/2. Druhá rovnice dává 2x2 + 2t + 3 - As = 5, tj. x2 = l-ř+2i. Z první potom plyne xi + 1 - t + 2s + t + 3/2 - 2s = 3, tj. Xi = 1/2. Celkem máme (2-1) (xi, X2, X3, X4, X5) = (1/2, 1 — t + 2s, t, 3/2, s), t,s el. Také v tomto příkladu znovu uvažujme rozšířenou matici a převeďme ji pomocí řádkových úprav do schodovitého tvaru, kde první nenulové číslo v každém řádku je 1 a kde ve sloupci, ve kterém tato 1 je, jsou ostatní čísla 0. Ještě připomeňme, že čtvrtou rovnici, jež je kombinací prvních třech rovnic, budeme vynechávat. Po řadě vynásobením druhého a třetího řádku číslem 1/2, odečtením třetího řádku od druhého a od prvního a odečtením druhého řádku od prvního získáme 0 1 1 1 1 -2 3\ 0 2 2 2 -4 5 0 0 0 2 0 1 1 1 0 -2 3/2 0 1 1 0 -2 1 0 0 0 1 0 3/2 1 0 0 0 0 0 110-2 0 0 0 1 0 123 k. doplňující príklady k cele kapitole 4. vlastnosti lineárních zobrazeni Pokud opět zvolíme s (t, s € M), dostaneme odsud obecné řešení (||2.1||) ve stejném tvaru, a to bezprostředně. Uvažte příslušné rovnice xx x2 + t 2s X4 1/2, 1, 3/2. □ 2.111. Najděte řešení soustavy lineárních rovnic zadané rozšířenou maticí /3 2 0 V5 2 1 1 0 3 3\ 4 1 5/ Solution. Uvedenou rozšířenou matici upravíme na schodovitý tvar. Nejprve první a třetí řádek opíšeme a do druhého řádku napíšeme součet (—2)násobku prvního a 3násobku druhého řádku a do čtvrtého řádku součet 5násobku prvního a (—3)násobku posledního řádku. Takto získáme /3 2 0 \5 2 1 1 0 3 3\ 4 1 5 /3 0 0 -1 -4 1 1 -2 3 14 3\ -1 -4 1 -2 3 14 3\ 1 0/ / 3 3 0 -; 0 5 \ 0 6 1 Opsání prvních dvou řádků a přičtení 5násobku druhého řádku k 3násobku třetího a jeho 2násobku ke čtvrtému řádku dává 2 -1 -17 -1 1 0/ /3 0 0 V 0 o o 1 -2 -1 10 3 \ 33 12/ Pokud první, druhý a čtvrtý řádek opíšeme a ke třetímu přičteme čtvrtý, dostaneme /3 0 0 o o 2 -1 -17 -1 1 -2 -1 10 3 \ 33 12 /3 0 0 o o 1 -2 9 10 3 \ 6 45 12 Dále je (řádkové úpravy jsou již „obvyklé") /3 3 2 1 3 \ /3 3 2 1 3 \ 0 -3 -1 -2 6 0 -3 -1 -2 6 0 0 -18 9 45 0 0 2 -1 -5 0 -1 10 12 ) \ 0 0 1 -10 -12 J /3 3 2 1 3 (3 3 2 1 3 \ 0 -3 -1 -2 6 0 -3 -1 -2 6 0 0 1 -10 -12 0 0 1 -10 -12 0 2 -1 -5 0 0 19 19 Vidíme, že soustava má právě 1 řešení. Určeme ho zpětnou eliminací (3 3 2 1 3 \ (3 3 2 0 2 \ 0 -3 -1 -2 6 0 -3 1 0 8 0 0 1 -10 -12 0 0 1 0 -2 1° 0 0 1 1 ) \° 0 0 1 1 ) /3 3 0 0 6 \ 1 1 1 0 0 2 \ ( 1 0 0 0 4 \ 0 -3 0 0 6 0 1 0 0 -2 0 1 0 0 -2 0 0 1 0 -2 0 0 1 0 -2 0 0 1 0 -2 \ 0 0 0 1 1 / ^ 0 0 0 1 1 ) 0 0 1 1 / 124 CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA Výsledek je tak x\ = 4, *2 = —2, JC3 = —2, JC4 = 1. □ 2.112. Uvedte všechna řešení homogenního systému x + y = 2z + v, z + 4u + v = 0, —3u =0, z = —v 4 lineárních rovnic 5 proměnných x,y,z,u,v. Solution. Systém přepíšeme do matice tak, že v prvním sloupci budou koeficienty u x, ve druhém sloupci koeficienty u v, až v pátém sloupci koeficienty u v, přičemž všechny členy v každé rovnici převedeme na levou stranu. Tímto způsobem přísluší systému matice /l 1 —2 0 -1\ 0 0 14 1 0 0 0-30 \0 0 1 0 1 / Přičteme-li (4/3)násobek třetího řádku ke druhému a odečteme-li poté druhý řádek od čtvrtého, obdržíme /l 1 0 0 0 o \o o 1 0 1 o 4 -3 0 ■1\ /l 1 o o o o \o o 1 o o o o -3 o -1\ 1 o Dále vynásobíme třetí řádek číslem —1/3 a přičteme 2násobek druhého řádku k prvnímu, což dává /l 1 0 0 0 o \o o 1 o o o o -3 0 -1\ 1 o °7 (l 1 0 0 1\ 0 0 10 1 0 0 0 1 0 \0 0 0 0 0/ Z poslední matice můžeme přímo vypsat všechna řešení t, s e M M M i 0 z = t 0 + s -1 0 0 w \°) K1) neboť máme matici ve schodovitém tvaru, přičemž první nenulové číslo v každém řádku je 1 a ve sloupci, kde se taková 1 nachází, jsou na ostatních pozicích 0. Výše uvedené řešení ve tvaru lineární kombinace dvou vektorů je určeno právě sloupci bez prvního nenulového čísla nějakého řádku, tj. druhým a pátým sloupcem, kdy volíme 1 jako druhou složku pro druhý sloupec a jako pátou složku pro pátý sloupec a kdy čísla v příslušném sloupci bereme s opačným znaménkem a umisťujeme je na pozici danou sloupcem, ve kterém je první 1 v jejich řádku. Dodejme, že výsledek je ihned možné přepsat do tvaru (x, y, z, u, v) = (—t — s, t, —s, 0, s) , t, s e □ 2.113. Rozložte na transpozice následující permutace: 2 3 4 5 6 6 5 4 3 2 »0 o- 125 k. doplňující príklady k cele kapitole 4. vlastnosti lineárních zobrazeni 2 3 4 5 4 12 5 23 4 56789 461 10 25983 7 8\ 3 7/' 2.114. Určete paritu následujících permutací: 2 3 4 5 6 5 6 4 1 2 2 3 4 5 6 7 12 3 8 23 4 56789 7 1 10 2 5 4 9 3 «0 »>0 O' 7 8\ 4 5)' 5 2.115. Stanovte vlastní hodnoty matice /-13 5 4 2\ 0 -10 0 -30 12 9 \-12 6 4 2.116. Víte-li, že čísla 1,-1 jsou vlastní hodnoty matice /-ll 5 4 1\ -3010 -21 11 8 2 -9 5 3 1/ uvedte všechna řešení charakteristické rovnice | A — k E \ ■■ polynomu | A — k E | jako k\, k2, A.3, A4, je I A j = k\ ' k2 ' ky ' A.4 V 0. Nápověda: Označíme-li kořeny tr A 2.117. Udejte příklad čtyřrozměrné matice s vlastními čísly k\ k2 jako kořene charakteristického polynomu byla 3 a aby (a) dimenze podprostoru vlastních vektorů k2 byla 3; (b) dimenze podprostoru vlastních vektorů k2 byla 2; (c) dimenze podprostoru vlastních vektorů k2 byla 1. 2.118. Nalezněte vlastní čísla a vlastní vektory matice: -1 -| 0 -I o \ k\ -\- k2 -\- A.3 -\- A.4. 6 a k2 = 7 takové, aby násobnost 2.119. Určete charakteristický polynom | A — k E |, vlastní čísla a vlastní vektory matice (A -1 6\ 2 1 ,2 -1 2.120. Určete geometrický význam zobrazení v M3, které je zadáno maticí Í0 0 1^ 0 1 0 .1 0 0, 2.121. Rozhodněte, zda || Aluuut>|| < 1, kde v = (3, 2, 1), kde A 126 CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA Řešení cvičení 2.7. 2.72. Taková matice X existuje právě jedna, a to -32^ /18 -32\ V5 -Z)' /l 10 -4\ 2.14. A-1 = 1 12 -5) V> 5 -v I2 -3 0 0 -5 8 0 0 0 2.15. 0 0 -1 0 0 0 0 0 -5 2 \0 0 0 3 -v 2.76. C~ /0 1 1 0 \ 0 10-1 1-10 0 \i -i-i i/ 2.77. V prvním případě dostáváme 4 0 D- ve druhém potom 2.18. Platí 1 1 1\ 1 0 1 1 1 1 1 0 n — 1 vi 1 i o) 2.21. -3,17,-1 2.27. -1 IX 1 1 1 N /l i 1 1\ 1 1 -1 -1 1 1 i -1 -1 1 -1 1 -1 4 1 -i 1 -1 v -i -i V1 -i -1 !/ Následně lze snadno získat 13 3 3 1 XI = -, X9 4 = ~ ~4' x3 = ~4' X4 _ 4' 2.33. Řešeními jsou právě všechny skalární násobky vektoru (l + V3, -V3, 0, 1, O) . 2.34. xi = 1 + t, x2 = |, 2.35. Soustava nemá řešení. X3 = t, X4 127 K. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 4. VLASTNOSTI LINEÁRNÍCH ZOBRAZENÍ 2.36. Soustava má řešení, protože je (3\ (3\ /1\ 2 3 c -1 8 2 -3 — > * 1 4 W 2.37. Systém lineárních rovnic 3xi xi 7xi 5xi nemá řešení, zatímco systém 7xi 5xi x2 x2 2x3 X3 4x3 3x3 2a'3 4x3 3x3 1, X3 1, 2, 3, 4, 5 1, 1, 1, 1, 1 má právě jedno řešení x\ — — 1, x2 2.38. Množina všech řešení je {(—lOř, (a+4)/, (3a — 8)ř) ; t e 2.39. Pro a — 0 nemá uvažovaný systém řešení; pro a ^ 0 má nekonečně mnoho řešení. 2.40. Při zachování pořadí jsou správné odpovědi „ano", „ne", „ne" a „ano". 2.41. i) Pro b ŕ -7 je x = z = (2 + a)/{b + 7), y = (3a - b - l)/(b + 7) (lb). ii) Pro b a / — 2 (lb) nemá řešení (lb). pro a — — 2 je řešením x = z, 3; — 1 (2b). 2.43. Ze znalosti inverzní matice F~l dostáváme S -B -1 (lb) a F * = (aá - ySy) F'1 = -ľ 0 0 pro libovolná a, fi, y, 8 el. 2.44. Hledanými maticemi jsou /l (a) 0 V o 3 -4\ -1 6 -10; (b) / 6 -21 \ \-3 + 2i 1 + // 2.47. Lehce se ověří, že se jedná o vektorový prostor. První souřadnice neovlivňuje výpočty součtů vektorů ani hodnoty skalárních násobků vektorů: jedná se o přeznačený prostor (K, +, ■)• 2.52. Úloha má j ediné řešení p — 2, q — —2, r — 3. 2.55. (2+^,2--L). 2.56. Vektory jsou závislé, je-li splněna alespoň jedna z podmínek a — b — 1, a — c — i, b — c — 1. 2.57. Vektory jsou lineárně nezávislé. 2.58. Stačí připojit např. polynom x. 128 CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA 2.70. 2.74. 2.75. 1/4 -V6/4 3/4 Jě/A -1/2 -a/6/4 3/4 a/6/4 1/4 5/6 -1/6 l/3\ -1/6 5/6 1/3 1/3 1/3 1/3, 5/9 2/9 -4/9^ 2/9 8/9 2/9 -4/9 2/9 5/9 2.81. cos = 2.82. 91 : (2- -^-,2V3 + \)t, q2 : (2+ -2V3 + \)t. 2.85. Například skalární součin, který vyplývá z izomorfismu prostoru všech reálných matic 3 x 3 s R9. Použijeme-li součin z R9 dostáváme skalární součin, který dvěma maticím přiřadí součet součinů po dvou odpovídajících si složek. Pro danou matici dostaneme 0 \ \ = V l2 + 22 + O2 + O2 + 22 + O2 + l2 + (-2)2 + (-3)2 2.88. Vektor, který zadává podprostor U, je kolmý na každý ze tří vektorů, které generují V. Podprostory jsou tak na sebe kolmé. Avšak není pravda, že R4 — U © V. Podprostor V je totiž pouze dvojdimenzionální, protože (-1, 0, -1, 2) = (-1, 0, 1, 0) - 2 (0, 0, 1, -1). 2.89. V prvním případě je dim U — 2 pro t e {1,2}, jinak je dim U — 3. Ve druhém případu je dim U — 2 pro t ^ 0 a dim U — 1 pro t — 0. 2.90. Gramovým-Schmidtovým ortogonalizačním procesem lze obdržet výsledek ((1, 1, 1, 1), (1, 1, 1, -3), (-2, 1, 1,0)). 2.97. Při zachování pořadí podprostorů ze zadání jsou ortogonálními bázemi např. ((1,0, 1,0), (0, 1,0, -7)) a ((1, 2, 2, -1), (2, 3, -3, 2), (2, -1, -1, -2)). 2.92. Výsledek je a — 9/2, b — —5, neboť musí mj. platit 1+6 + 4 + 0 + 0 = 0, 1-6 + 0 + 3-2fl = 0. 2.93. Hledaná báze obsahuje jediný vektor. Jejím nějaký nenulový skalární násobek vektoru (3, -7, 1,-5,9). 2.94. Ortogonální doplněk (komplement) V1- je množina všech skalárních násobků vektoru (4, 2, 7, 0). 2.95. (a) W1- = ((1, 0, -1, 1, 0), (1, 3, 2, 1, -3)); (b) W1- = ((1,0, -1,0,0), (1, -1, 1, -1, 1)). 129 K. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 4. VLASTNOSTI LINEÁRNÍCH ZOBRAZENÍ 2.96. Hledaných doplnění je pochopitelně nekonečně mnoho. Jedním (skutečně jednoduchým) je např. (1,-2,2,1), (1,3,2,1), (1,0,0,-1), (1.0,-1,1). 2.702. Je | A - X E | = -X3 + 12X2 - MX + 60, tj. Xx = 3, X2 = 4, X3 = 5. 2.703. Výsledkem je posloupnost 0, 1, 2. 2.704. Dimenze je 1 pro Xi = 4 a 2 pro A2 = 3. 2.706. Matice 7? má dvě různá vlastní čísla, a proto takové vyjádření existuje. Např. platí (5 6\ _ j /72 -V2\ /li 0 \ j / V2 V2\ \6 5J-HV2 V2/'I,0 -1/H-V2 V2/" Existují právě dvě diagonální matice D, a to C -O' (o ?.)■ ovšem sloupce matice P 1 můžeme nahradit za jejich libovolné nenulové skalární násobky, tedy uvažovaných dvojic D, P je nekonečně mnoho. 2.77i. i) (1, 7)(2, 6)(5, 3), ii) (1, 6)(6, 8)(8, 7)(7, 3)(2, 4), iii) (1, 4)(4, 10)(10, 7)(7, 9)(9, 3)(2, 6)(6, 5) 2.114. i) 17 inverzí, lichá, ii) 12 inverzí, sudá. iii) 25 inverzí, lichá 2.115. Daná matice má pouze jedno vlastní číslo, a to —1. 2.116. Kořen —1 polynomu | A — X E \ je trojnásobný. 2.777. Kupř. (a) ř 0 0 ř 0 0 °\ 0 7 0 0 (b) 0 7 1 0 0 0 7 0 0 0 7 0 V> 0 0 V ř 0 0 V> °\ 0 0 V (c) 0 7 1 0 0 0 0 7 0 1 2.118. Trojnásobná vlastní hodnota—1, příslušný vektorový prostor je ((1,0,0), (0,2. 1)). 2.779. Charakteristický polynom je — (X—2)2(X—9), tj. vlastní čísla j sou 2 a 9 s přišlu nými (poradě) vlastními vektory (1,2, 0), (-3,0, 1) a (1,1,1). 2.720. Zrcadlení podle roviny ((1, 0, 1), (0, 1, 0)). 2.121. Daný vektor je vlastním vektorem dané matice s vlastní hodnotou 1/2. Je tedy ||A1000i;|| = ||(-)1000i;|| = (Í)1000l|w|l x2 + 90 xx > 110 Účelová funkce (funkce udávající zisk při daném počtu vyrobených šroubků a matic) je 40xi + 60x2. Předchozí soustava nerovnic zadává v M2 určitou oblast a optimalizace zisku znamená najít v této oblasti bod (případně body), ve kterém bude mít účelová funkce nejvyšší hodnotu, tj. najít největší k takové, že přímka 40xi + 60x2 = k bude mít s danou oblastí neprázdný průnik. Graficky můžeme najít řešení například tak, že umístíme přímku p do roviny tak, aby splňovala rovnici 40xi + 60x2 = 0 a začneme ji rovnoběžně posunovat "nahoru" tak dlouho, dokud bude mít nějaký společný průnik s danou oblastí. Je zřejmé, že tímto posledním průnikem může být buď bod, nebo hraniční přímka dané oblasti (pokud by byla rovnoběžná s p). Dostaneme tak (viz. obrázek), bod x\ = 110 a x2 = 5. Maximální možný zisk tedy činí 40 • 110 + 60 • 5 = 4700 Kč. □ 3.2. Minimalizace nákladů na krmení. Hříbárna v Nišovicích u Volyně nakupuje na zimu krmivo: seno a oves. Výživné hodnoty krmiv a požadované denní dávky pro jedno hříbě jsou v tabulce g/kg Seno Oves POŽADAVKY Sušina 841 860 Alespoň 6300 g SNL 53 123 Nejvýše 1150 g Škrob 0,348 0,868 Nejvýše 5,35 g Vápník 6 1,6 Alespoň 30 g Fosfor 2,8 3,5 Nejvýše 44 g Sodík 0,2 1,4 Přibližně 7 g CENA 1,80 1,60 Každé hříbě musí v krmné dávce denně dostat alespoň 2 kg ovsa Průměrná cena včetně dopravy činí 1, 80 Kč za 1 kg sena a 1, 60 Kč za 1 kg ovsa Sestavte denní dávku krmení pro jedno hříbě tak, aby náklady byly minimální. 3.3. Optimální dělení materiálu. Na vnitřní dřevěné obložení chaty je třeba • maximálně 120 ks prken délky 35 cm • 180 až 330 ks prken délky 120 cm • alespoň 30 ks prken délky 95 cm pro neznámý vektor x a známý vektor b. V pevně zvolených souřadnicích pak máme matici A zo-brazení cp a souřadné vyjádření vektoru b. Jak jsme si povšimnuli už v úvodu druhé kapitoly, množina všech řešení tzv. homogenní úlohy A ■ x = 0 je vektorovým podprostorem. Pokud je dimenze V konečná, řekněme n, a dimenze obrazu zobrazení cp je k, pak řešením této soustavy pomocí převodu na řádkově schodovitý tvar (viz 2.7) zjistíme, že dimenze podprostoru všech řešení je právě n — k. Skutečně, protože sloupce matice zobrazení jsou právě obrazy bázových vektorů, je v matici systému právě k lineárně nezávislých sloupců a tedy i stejný počet lineárně nezávislých řádků. Proto nám zůstane při převodu na řádkový schodovitý tvar právě n — k nulových řádků. Při řešení systému rovnic nám tak zůstane právě n — k volných parametrů a dosazením vždy jednoho z nich s hodnotou jedna a vynulováním ostatních získáme právě n — k lineárně nezávislých řešení. Všechna řešení jsou pak dána právě všemi lineárními kombinacemi těchto n — k řešení. Každé takové (n — &)-tici řešení říkáme fundamentální systém řešení daného homogenního systému rovnic. Dokázali jsme: Theorem. Množina všech řešení homogenního systému rovnic A ■ x = 0 pro n proměnných s maticí A hodnosti k je vektorovým podprostorem v W dimenze n — k. Každá báze tohoto podprostoru tvoří fundamentální systém řešení daného homogenního systému. 3.2. Nehomogenní systémy rovnic. Uvažme nyní obecný systém rovnic A ■ x = b. Znovu si uvědomme, že sloupce matice A jsou ve skutečnosti obrazy vektorů standardní báze v W v lineárním zobrazení cp odpovídajícím matici A. Pokud má existovat řešení, musí být b v obrazu cp a tedy musí být lineární kombinací sloupců v A. Jestliže tedy rozšíříme matici A o sloupec b, můžeme, ale nemusíme, také zvětšit počet lineárně nezávislých sloupců a tedy i řádků. Pokud se tento počet zvětší, pak b v obrazu není a tedy systém rovnic nemůže mít řešení. Jestliže ale naopak máme stejný počet nezávislých řádků i po přidání sloupce b k matici A, znamená to, že sloupec b musí být lineární kombinací sloupců matice A. Koeficienty takové kombinace jsou právě řešení našeho systému rovnic. Uvažme nyní dvě pevně zvolená řešení x a y našeho systému a nějaké řešení z systému homogenního se stejnou maticí. Pak zjevně A-(x-y) = b-b = 0 A ■ (x +z) = 0 + b = b. 132 CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET Můžeme proto shrnout: 3.3. Theorem. Řešení nehomogenního systému lineárních rovnic A ■ x = b existuje právě, když přidáním sloupce b k matici A nezvýšíme počet lineárně nezávislých řádků. V takovém případě je prostor všech řešení dán všemy součty jednoho pevně zvoleného partikulárního řešení systému a všech řešení systému homogenního se stejnou maticí. V literatuře se tomuto tvrzení často říká Frobeniova věta a obvyklá formulace je "systém má řešení, právě když je hodnost jeho matice rovna hodnosti matice rozšířené". 3.4. Optimalizační lineární modely. Ve vedlejším sloupci jsme tuto kapitolu začali problémy natěračů. Budeme v tom pokračovat. Představme si, že náš velice specializovaný natěrač v černobílém světě je ochoten natírat fasády buď malých rodinných domků nebo naopak velikých veřejných budov a že pochopitelně používá jen černou a bílou barvu. Může si zcela volně vybírat, v jakém rozsahu bude dělat x jednotek plochy prvého typu nebo y jednotek druhého. Předpokládejme však, že jeho maximální pracovní zátěž je ve sledovaném období L jednotek plochy, jeho čistý výnos (tj. po odečtení nákladů) je na jednotku plochy c\ u malých domků a c2 u veřejných staveb. Zároveň má k dispozici maximálně W kg bílé a S kg černé barvy. Konečně na jednotku plochy rodinného domu potřebuje w\ kg bílé barvy a b\ kg černé, zatímco u veřejných staveb jsou to hodnoty u>2 a b2. Když si to celé shrneme do (ne)rovnic, dostáváme omezení (3.1) (3.2) (3.3) X\ + X2 < L wiXi + W2X2 < W b\xx + b2x2 < B. Celkový čistý výnos natěrače h(xi, x2) = c\X\ + c2x2 bychom přitom rádi měli co nej větší. Každá z uvedených nerovnic samozřejmě zadává v rovině proměnných (x\,X2) polorovinu, ohraničenou přímkou zadanou příslušnou rovnicí, a jistě musíme také předpokládat, že jak x\ tak x2 jsou nezáporná reálná čísla, protože záporné velikosti ploch natěrač neumí. Ve skutečnosti máme tedy omezení na hodnoty (x\, x2), které může být buď nesplnitelné nebo je dáno jako vnitřek mnohoúhleníku s maximálně pěti vrcholy, viz obrázek. Obecně hovoříme o problému lineárního programování, jestliže hledáme buď maximum nebo minimum lineární formy h na W na množině ohraničené pomocí systému lineárních nerovnic, kterým říkáme lineární omezení. Vektoru na pravé straně pak říkáme vektor omezení, lineární formě h také účelová funkce. Formulace s nerovnostmi < u omezujících podmínek, nezápornými proměnnými a maximalizaci účelové funkce Koupit lze jen prkna délky 4 metry. Celkový odpad nesmí být větší než 360 cm. Určete, kolik nejméně prken můžeme nakoupit (a jak je rozřezat), aby bylo vyhověno podmínkám úlohy. 133 A. PROCESY S LINEÁRNÍMI OMEZENÍMI 1. LINEÁRNÍ PROCESY říkáme standardní maximalizační problém. Naopak, standardní minimalizační problém je hledání minima účelové funkce při omezujících podmínkách s nerovnostmi >, přičemž opět uvažujeme nezáporné proměnné. Je snadné nahlédnout, že každý obecný problém lineárního programování lze převést na kterýkoliv ze standardních. Kromě změn znamének můžeme ještě pracovat s rozdělením případných proměnných bez omezení znaménka na rozdíl dvou kladných. Bez újmy na obecnosti se tedy budeme dále věnovat jen standardnímu maximalizačnímu problému. Jak takový problém řešit? Hledáme maximum lineární formy h na podmnožinách M vektorového prostoru, které jsou zadány lineárními nerovnostmi, tj. v rovině pomocí průniku polorovin, obecně budeme v další kapitole hovořit o poloprostorech. Všimněme si, že každá lineární forma na reálném vektorovém prostoru h : V -» M (tj. libovolná lineární skalární funkce) v každém vybraném směru buď stále roste nebo stále klesá. Přesněji řečeno, jestliže vybereme pevný počáteční vektor w e V a "směrový" vektor v € V, pak složením naší formy h s parametrizací dostaneme t h-» h(u + t v) = h(u) + t h(v). Tento výraz je skutečně s rostoucím parametrem t vždy buď rostoucí nebo klesající, případně konstantní (podle toho, zda je h(v) kladné nebo záporné, případně nulové). Jistě tedy musíme očekávat, že problémy podobné tomu s natěračem budou buď nesplnitelné (když je množina zadaná omezením prázdná) nebo bude výnos neohraničený (když omezení zadají neomezenou část celého prostoru a forma h v některém z neomezených směrů bude nenulová) nebo budou mít maximální řešení v alespoň jednom z "vrcholů" množiny M (přičemž zpravidla půjde o jediný vrchol, může ale jít o ^ecdľo™' konstatní maximální honotu na části horanice oblasti M). Dantzigovi, algoritmech, odkaz 3.5. Formulace pomocí lineárních rovnic. Ne vždy je nalezení optima tak snadné jako v předchozím případě. Problém může zahrnovat velmi mnoho proměnných a velmi mnoho omezení a jen rozhodnout, zda je množina M splnitelných bodů neprázdná je problematické. Nemáme tu prostor na úplnou teorii, zmíníme ale alespoň dva směry úvah, které ukazují, že ve skutečnosti bude řešení naleznutelné vždy podobně, jako tomu bylo v dvojrozměrném problému v předchozím odstavci. Začneme srovnáním se systémy lineárních rovnic - těm už totiž rozumíme dobře. Zapišme si rovnice (3.1)—(3.3) vektorově v obecném tvaru: A - x < b, kde x je nyní n-rozměrný vektor, b je m-rozměrný vektor a A odpovídající matice a nerovností myslíme jednotlivé nerovnosti po řádcích. Maximalizovat chceme součin c-x pro daný řádkový vektor koeficientů lineární formy h. Jestliže si pro každou z rovnic přidáme jednu pomocnou proměnnou a apod. 134 CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET ještě si primyslíme proměnnou z jako hodnotu Unární formy h, můžeme celý problém přepsat jako systém lineárních rovnic (o * £)'(*) = (°) kde matice je složena z bloků o 1 + n + m sloupcích a 1 + m řádcích a tomu odpovídají jednotlivé komponenty vektorů. Dodatečně přitom požadujeme pro všechny souřadnice X i xs nezápornost. Pokud tedy má daný systém rovnic řešení, hledáme v této množině řešení takové hodnoty proměnných z, x a xs, aby všechna x byla nezáporná a z maximální možné. K diskusi, jak to obecně může dopadat se vrátíme z pohledu afinní geometrie v odstavci 4.11 na straně 210. Konkrétně v našem problému černobílého natěrače bude systém Unárních rovnic vypadat takto: /Z\ l\ -a -c2 0 0 0\ xx /0\ 0 1 1 10 01 x2 _ i L 0 u>i w2 0 1 0 ' x3 ~ W v0 bx b2 0 0 1/ x4 \Sy w 3.6. Dualita v lineárním programování. Uvažujme reálnou matici Asm řádky a n sloupci, vektor omezení b a řádkový vektor c zadávající účelovou funkci. Z těchto dat můžeme sestavit dva problémy lineárního programování pro x e W a. y e W". Maximalizační problém: Maximalizuj c ■ x za podmínky A • x < b a zároveň x > 0. Minimalizační problém: Minimalizuj yT ■ b za podmínky yT ■ A > cT a zároveň y > 0. Říkáme, že tyto problémy jsou vzájemně duální. K odvození dalšícU vlastností problémů lineárního programování zavedeme trochu terminologie. Řekneme, že jde o idxřešitelný problém, jestliže existuje nějaký přípustný vektor x, který vyboví všem omezujícícm podmínkám. Řešitelný maximalizační, resp. minimalizační problém je ohraničený, jestliže je účelová funkce na množině vyUovující omezením obraničená sUora, resp. zdola. Lemma. Je-li x e W přípustný vektor pro standarní maximalizační problém a y e W" je přípustný vektor pro duální minimalizační problém, pak pro účelové fuknce platí c ■ x < yT ■ b Proof. Jde vlastně jen o snadné pozorování: x > 0 a cT < yT ■ A, ale také y>0a.A-x Q- Proof. Předpokládejme, že platí oba vztahy z předp- koladu impliace ve větě. Pak tedy můžeme v následujím výpočtu počítat s rovnosti, protože sčítance s ostrou nerovností mají stejně u sebe nulové koeficienty: m n X•v'/'' X-V/ Xaiixi XX-v'"'>v.'' i — l i — l j—l i — l j—l a z stejného důvodu také m n n Tím máme dokázánu jednu implikaci z tvrzení díky větě o dualitě. Předpokládejme nyní, že x a y jsou skutečně optimální vektory. Víme tedy, že platí m m n n X-Vŕ/'' - IZ^^j - X('/V/- i=\ i=\ j=l j=l ale zároveň jsou si levé a pravé strany rovny. Nastává tedy všude rovnost. Přepíšeme-li prvou rovnost jako m , n ^ i=\ ^ j=i 136 CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET vidíme, že může být naplněna jen za podmínek ve větě, protože jde o nulový součet samých nezáporných čísel. Z druhé rovnosti stejně plyne i druhé zbylé tvrzení a důkaz je ukončen. □ Věty o dualitě a ekvilibriu jsou užitečné při řešení problémů lineárního programování, protože nám ukazují souvislosti mezi nulovostí jednotlivých dodatečných proměnných a naplňování omezujících podmínek. 3.8. Poznámky o lineárních modelech v ekonomii. Náš velice schematický problém černobílého natěrače z odstavce 3.4 můžeme použít jako ilustraci jednoho z typických ekonomických modelů, tzv. model plánování výroby. Jde přitom o zachycení problému jako celku, tj. se zahrnutím vnitřních i vnějších vztahů. Levé strany rovnic (3.1), (3.2), (3.3) i účelové funkce h(x\,x2) jsou vyjádřením různých výrobních vztahů. Podle povahy problému pak jsou požadovány na pravé straně buď přesné hodnoty (pak řešíme systém rovnic) nebo požadujeme kapacitní omezení a optimalizaci účelu (a pak dostáváme právě problémy lineárního programování). Můžeme tak tedy obecně řešit problém alokace zdrojů při dodavatelských omezeních a přitom buď minimalizovat náklady nebo maximalizovat zisk. Z tohoto pohledu lze také nahlížet dualizaci problémů. Jestliže by náš natěrač chtěl hypoteticky nastavit svoje náklady spojené se svojí prací yL, bílou barvou yw a černou barvou yB, pak bude chtít minimalizovat účelovou funkci L ■ y l + Wyw + By b při omezujících podmínkách yL + wxyw + bxyB > cx yL + w2yw + b2yB > c2. To je právě duální problém k původnímu a hlavní věta 3.7 říká, že optimální stav je takový, kdy účelové funkce mají stejnou hodnotu. V ekonomických modelech najdeme mnoho modifikací. Jednou z nich jsou úlohy finančního plánování, související s optimalizací portfolia. Určujeme přitom objemy investic do jednotlivých investičních variant s cílem držet se daných omezení na rizika a optimalizovat přitom zisk, resp. při očekávaném objemu minimalizovat rizika. Dalším obvyklým modelem jsou marketingové aplikace, např. alokace nákladů na reklamy v různých médiích nebo umísťování reklam do časových termínů. Omezujícími podmínkami bude disponibilní rozpočet, rozložení cílových skupin apod. Velmi obvyklé jsou modely výživových problémů, tj. návrh návek různých komponent výživy s daným složením a omezujícími požadavky na celkové objemy výživových látek. A. PROCESY S LINEÁRNÍMI OMEZENÍMI 2. DIFERENČNÍ ROVNICE Problémy lineárního programování se objevují při personálních úlohách, kdy jsou pracovníci s různými kvalifikacemi a dalšími předpoklady rozdělováni do směn. Obvyklé jsou také problémy směšování, problémy dělení a problémy distribuce zboží. 2. Diferenční rovnice Diferenčními rovnicemi jsme se stručně zabývali již v první kapitole, byť pouze těmi prvního řádu.Nyní si ukážeme obecnou teorii pro lineární rovnice s konstantními koeficienty, která poskytuje nejen velmi praktické nástroje, ale je také pěknou ilustrací pro koncepty vektorových podprostorů a lineárních zobrazení. Homogenní lineární diferenční rovnice řádu k \— 3.9. Definition. Homogenní lineární diferenční rovnice řádu k je dána výrazem oqx„ + a\xn-\ + ■ ■ ■ + a^Xn-i =0, a$ ^ 0 ak ^ 0, kde koeficienty at jsou skaláry, které mohou případně i záviset na n. Říkáme také, že taková rovnost zadává homogenní lineární rekurenci řádu k a často zapisujeme hledanou posloupnost jako funkci x„ = f in) =--f(n - 1)------f(n - k). Řešením této rovnice nazýváme posloupnost skalárů xt, pro všechna i e N, případně i e Z, které vyhovují rovnici s libovolným pevným n. 1 Libovolným zadáním k po sobě jdoucích hodnot xt jsou určeny i všechny ostatní hodnoty jednoznačně. Skutečně, pracujeme nad polem skalárů, takže hodnoty ao i ak jsou invertibilní a proto z definičního vztahu lze vždy spočíst hodnotu x„ ze známých ostatních hodnot a stejně tak pro x„ . Indukcí tedy okamžitě dokážeme, že lze jednoznačně dopočíst všechny hodnoty jak pro kladná tak pro záporná celá n. Prostor všech nekonečných posloupností x; je vektorový prostor, kde sčítání i násobení skaláry je dáno po složkách. Přímo z definice je zjevné, že součet dvou řešení homogenní lineární rovnice nebo skalární násobek řešení je opět řešení. Stejně jako u homogenních systémů lineárních tedy vidíme, že množina všech řešení je vektorový podprostor. Počáteční podmínka na hodnoty řešení je dána jako /c-rozměrný vektor v Kk. Součtu počátečních podmínek odpovídá součet příslušných řešení a obdobně se skalárními násobky. Dále si všimněme, že dosazením nul a jedniček do zadávaných počástečních k hodnot snadno získáme k lineárně nezávislých řešení naší rovnice. Jakkoliv jsou tedy zkoumané vektory nekonečné posloupnosti skalárů, samotný prostor všech řešení je konečněrozměrný, předem víme, že 138 CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET jeho dimenze bude rovna řádu rovnice k, a umíme snadno určit bázi všech těchto řešení. Opět hovoříme o fundamentálním systému řešení a všechna ostatní řešení jsou právě jejich lineární kombinace. Jak jsme si již ověřili, vybereme-li k po sobě jdoucích indexů i, i + 1, ..., i + k — 1, zadává homogenní lineární diferenční rovnice lineární zobrazení Kk -» K°° ^-rozměrných vektorů počástečních hodnot do nekonečně rozměrných poslouností týchž skalárů. Nezávislost různých takových řešení je ekvivalentní nezávislosti počátečních hodnot, ale tu umíme snadno rozpoznat pomocí determinantu. Máme-li &-tici řešení (x[,1], ..., pak jde o nezávislá řešení právě, když následující determinant, tzv. Casoratián je nenulový pro jedno (a pak už všechna) n tu r[i] ln+k-l Jk] xn [k] Xn + l ln+k-l 3.10. Řešení homogenních rekurencí s konstantními koeficienty. Těžko bychom hledali univerzální postup, jak hledat řešení obecných homogenních lineárních diferenčních rovnic, tj. přímo spočítatelný výraz pro obecné řešení xn. V praktických modelech ale velice často vystupují rovnice, kde jsou koeficienty konstantní. V tomto přípdě se daří uhodnout vhodnou formu řešení a skutečně se nám podaří najít k lineárně ä— nezávislých možností. Tím budeme mít problém vyřešený, protože všechny ostatní budou jejich lineární kombinací. Pro jednoduchost začneme rovnicemi druhého řádu. Takové potkáváme obzvlášť často v praktických problémech, kde se vyskytují vztahy závisející na dvou předchozích hodnotách. Lineární diferenční rovnicí druhého řádu s konstantními koeficienty (resp. lineární rekurencí druhého řádu s konstantními koeficienty) tedy rozumíme předpis (3.4) f(n+2) = a-f(n + \)+b-f(n)+c, kde a,b, c jsou známé skalární koeficienty. Např. v populačních modelech můžeme zohlednit, že jedinci v populaci dospívají a pořádně se rozmnožují až o dvě období později (tj. přispívají k hodnotě f(n + 2) násobkem b ■ f (n) s kladným b > 1), zatímco nedospělí jedinci vysílí a zničí část dospělé populace (tj. koeficient a pak bude záporný). Navíc si je třeba někdo pěstuje a průběžně si ujídá konstantní počet c < 0 v každém jednotlivém období. Speciálním takovým příkladem s c = 0 je např. Fibonac-ciho posloupnost čísel y0, y\, ..., kde yn+2 = y„+i + y„. Jestliže při řešení matematického problému nemáme žádný nový nápad, vždy můžeme zkusit, do jaké míry funguje známé řešení podobných úloh. Zkusme proto dosadit do rovnice (3.4) s koeficientem c = 0 podobné řešení jako u rovnic lineárních, tj. f (jí) = X" pro nějaké skalární X. B. Rekurentní rovnice Různé lineární závislosti mohou být dobrým nástrojem pro popsání rozličných modelů růstu. Začněme s velmi populárním populačním modelem, který využívá lineární diferenční rovnici druhého řádu: 3.4. Fibonacciho posloupnost. Na začátku jara přinesl čáp na louku dva čerstvě narozené zajíčky, samečka a samičku. Samička je schopná od dvou měsíců stáří povít každý ■Si měsíc dva malé zajíčky (samečka a samičku). Nově narození zajíci plodí potomky po jednom měsíci a pak každý další měsíc. Každá samička je březí jeden měsíc a pak opět porodí samečka a samičku. Kolik párů zajíců bude na louce po devíti měsících (pokud žádný neuhyne a žádný se tam "nepřistěhuje")? Solution. Po uplynutí prvního měsíce je na louce pořád jeden pár, nicméně samička zabřezne. Po dvou měších se narodí první potomci, takže na louce budou dva páry. Po uplynutí každého dalšího měsíce se narodí (tedy přibude) tolik zajíců, kolik zabřezlo zaječic před měsícem, což je přesně tolik, kolik bylo před měsícem párů schopných mít potomka, což je přesně tolik, kolik bylo párů před dvěma měsíci. Celkový počet pn zajíců po uplynutí n-tého měsíce tak je tak součtem počtů párů v předchozích dvou měsících. Pro počet párů zajíců na louce tedy dostáváme homogenní lineární rekuretní formuli (3-1) Pn+2 = Pn + 1 + Pn, n = 1, . . . , která spolu s počátečními podmínkami p\ = 1 a p2 = 1 jednoznačně určuje počty párů zajíců na louce v jednotlivých měsících. Linearita formule znamená, že všechny členy posloupnosti (pn) jsou ve vztahu v první mocnině, rekurence je snad jasná a homogenita značí, že v předpisu chybí absolutní člen (viz dále pro nehomogenní formule). Pro hodnotu n-tého členu můžeme odvodit explicitní formuli. V hledaní formule nám pomůže pozorování, že pro jistá r je funkce r" řešením diferenční rovnice bez počátečních podmínek. Tato r získáme tak, že dosadíme do rekurentního vztahu: r"+2 = r"+1 + ŕ a po vydělení r" dostaneme r2 = r + 1, což je tzv. charakteristická rovnice daného rekurentního vztahu. Naše rovnice má kořeny ^—j^- a 1+v^ a tedy posloupnosti a„ = (1~2V^)" a bn = (1+2V^)", n > 1, vyhovují danému vztahu. Vztah také splňuje jejich libovolná tzv. lineární kombinace, tedy posloupnost cn = san + tbn, s, t e M. Čísla s a t můžeme zvolit tak, aby 139 B. REKURENTNÍ ROVNICE 2. DIFERENČNÍ ROVNICE výsledná kombinace splňovala dané počáteční podmínky, v našem případě ci = 1, c2 = 1. Pro jednoduchost je vhodné navíc ještě dodefinovat nultý člen posloupnosti jako c0 = 0 a spočítat s a. t z rovnic pro cq a ci. Zjistíme, že s = —ŕ = 4= a tedy Dosazením dostáváme (3.2) Pn (1 + 75)" - (1 - 75)" 2"(V5) Takto zadaná posloupnost splňuje danou rekurentní formuli a navíc počáteční podmínky c0 = 0, c\ = 1, jedná se tedy o tu jedinou posloupnost, která je těmito požadavky zadána. Všimněte si, že hodnota vzorce (|| 3.21|) je celočíselná pro libolné přirozené n (zadává totiž celočíselnou Fibonacciho posloupnost), i když to tak na první pohled nevypadá. □ 3.5. Zjednodušený model chování hrubého národního produktu. Uvažujme diferenční rovnici (3.3) yk+2 - a(l + b)yk+1 + abyk = 1, kde yk je národní produkt v roce k. Konstanta a je takzvaný mezní sklon ke spotřebě, což je makroekonomický akazatel, který udává jaký zlomek peněz, které mají obyvatelé k dispozici, utratí, a konstanta b popisuje, jak závisí míra investic soukromého sektoru na mezním sklonu ke spotřebě. Předpokládáme dále, že velikost národního produktu je normována tak, aby na pravé straně rovnice vyšlo číslo 1. Spočítejte konkrétní hodnoty pro a = |,& = |,y0 = l,yi = l. Solution. Nejprve budeme hledat řešení homogenní rovnice (pravá strana nulová) ve tvaru ŕ. Číslo r musí být řešením charakteristické rovnice 1 a(\ + b)x + ab = 0, tj. x — x + 0, která má dvojnásobný kořen j. Všechna řešení homogenní rovnice jsou potom tvaru a(\)n + bn(^)n. Dále si všimněme, že najdeme-li nějaké řešení nehomogenní rovnice (tzv. partikulární řešení), tak pokud k němu přičteme libovolné řešení homogenní rovnice, obdržíme jiné řešení nehomogenní rovnice. Lze ukázat, že takto získáme všechna řešení nehomogenní rovnice. V našem případě (tj. pokud jsou všechny koeficienty i nehomogenní člen konstantami) je partikulárním řešením konstanta yn = c. Dosazením do rovnice máme c — c + ^c = 1, tedy c = 4. Všechna řešení diferenční rovnice yk+2 i yk+i + - ■ yk n+2 aX n + l bX" = Xn(X2 -aX-b) = 0. Tento vztah bude platit buď pro X = 0 nebo při volbě hodnot Aj = ^(a + V'a2 + 4b), X2 = ^(a - Va^T^)- Zjistili jsme tedy, že skutečně opět taková řešení fungují, jen musíme vhodně zvolit skalár X. To nám ale nestačí, protože my chceme naj ít řešení pro j akékoliv počáteční hodnoty / (0) a /(l), a zatím jsme našli jen dvě konkrétní posloupnosti splňující danou rovnici (a nebo dokonce jen jednu, pokud je ^2 = ^l)- Jak jsem již dovodili i u zcela obecných lineárních rekurencí, součet dvou řešení fi(n) a f2(n) naší rovnice f (n+2) — a ■ f(n +1) — b ■ f (n) = Oje zjevně opět řešením téže rovnice a totéž platí pro konstatní násobky řešení. Naše dvě konkrétní řešení proto poskytují daleko obecnější řešení f(n) = ClX"l+ C2X\ pro libovolné skaláry C\ a C2 a pro jednoznačné vyřešení konkrétní úlohy se zadanými počátečními hodnotami f(0) a f (1) nám zbývá jen najít příslušné konstanty C\ a C2. (A také si musíme ujasnit, zda to pro všechny počáteční hodnoty půjde). 3.11. Volba skalárů. Ukažme si, jak to může fungovat alespoň na jednom příkladě. Soustředíme se přitom na problém, že kořeny charakteristického polynomu nevychází obecně ve stejném oboru skalárů, jako jsou koeficienty v rovnici. Řešme tedy problém: (3.5) 1 yn+2 = yn+\ + y0 = 2, yi = 0. V našem případě je tedy Ai_2 = ^(1 ± 73) a zjevně y0 = Ci + C2 = 2 yi ^Ci(l + V3) + ^C2(l-V3) 1 je splněno pro právě jednu volbu těchto konstant. Přímým výpočtem C\ = 1 — \ V3, C2 = 1 + |V3 a naše úloha má jediné řešení f(n) = (1 - 1^3)^(1 + 73)" + (1 + 1^3)^(1 - 73)". Všimněme si, že i když nalezená řešení pro rovnice s celočíselnými koeficienty vypadají složitě a jsou vyjádřena pomocí iracionálních (případně komplexních) čísel, o samotném řešení dopředu víme, že je celočíselné též. Bez tohoto "úkroku" do většího oboru skalárů bychom ovšem obecné řešení napsat neuměli. S podobnými jevy se budeme potkávat velice často. Obecné řešení nám také umožňuje bez přímého vyčíslování konstant diskutovat kvalitativní chování posloupnosti čísel f(n), tj. zda se budou s rostoucím n blížit k nějaké pevné 140 CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET hodnotě nebo budou oscilovat v nějakém rozsahu nebo utečou do neomezených kladných nebo záporných hodnot. 3.12. Obecný případ homogenních rekurencí. Zkusme nyní stejně jako v případě druhého řádu dosadit volbu xn = k" pro nějaký ( zatím neznámý) skalár k do obecné homogenní rovnice z definice 3.9. Dostáváme pro každé n podmínku k"~k(a0kk + atk k-l + ak)=0 což znamená, že buď k = 0 nebo je A kořenem tzv. charakteristického polynomu v závorce. Charakteristický polynom ale už není závislý na n. Předpokládejme, že má charakteristický polynom k různých kořenů k\, ..., kk. Můžeme za tímto účelem i rozšířit uvažované pole skalárů, např. Q na M nebo M na C, protože výsledkem výpočtu pak stejně budou řešení, která opět zůstanou v původním poli díky samotné rovnici. Každý z kořenů nám dává jedno možné řešení xn = (ki)" ■ Abychom byli uspokojeni, potřebujeme k lineárně nezávislých řešení. K tomu nám postačí ověřit nezávislost dosazením k hodnot pro n = 0, ..., k— 1 pro k možností A; do Casoratiánu viz 3.9. Dostaneme tak tzv. Vandermondovu matici a je pěkným (ale ne úplně snadným) cvičením spočíst, že pro všechna k a jakékoliv /c-tice různých k{ je determinant takovéto matice nenulový, viz příklad ||2.24|| na straně 87. To ale znamená, že zvolená řešení jsou lineárně nezávislá. Nalezli jsme tedy fundamentální systém řešení homogenní diferenční rovnice v případě, že všechny kořeny jejího charakteristického polynomu jsou po dvou různé. Uvažme nyní násobný kořen k a dosaďme do definiční rovnice předpokládané řešení xn = nk". Dostáváme podmínku a0nk" + ■ ■ ■ + ak(n — k)kn 0. Tuto podmínku je možné přepsat pomocí tzv. derivace polynomu (viz ?? na straně ??), kterou značíme apostrofem: k(a0k" +■■■ + akk"-kY = 0 a hned na začátku kapitoly páté uvidíme, že kořen polynomu / je vícenásobný právě, když je kořenem i jeho derivace /'. Naše podmínka je tedy splněna. Při vyšší násobnosti i kořenu charakteristického ^vN polynomu můžeme postupovat obdobně a Sfo využijeme skutečnosti, že £-násobný kořen je kořenem všech derivací polynomu až do i — 1 včetně. Derivace přitom postupně vypadají takto: 0) "O) jsou tedy tvaru 4 + a(^)n + bn(^)n. Požadujeme y0 = yi = 1 a tyto dvě rovnice dávají a = b = —3, tedy řešení naší nehomogenní rovnice je y n = 4 - 3 Opět, protože víme, že posloupnost zadaná touto formulí splňuje danou diferenční rovnici a zároveň dané počáteční podmínky, jedná se vskutku o tu jedinou posloupnost, která je těmito vlastnostmi charakterizována. □ V předchozím příkladu jsme použili tzv. metodu neurčitých koeficientů. Ta spočívá v tom, že na základě nehomogenního členu dané diferenční rovnice "uhodneme" tvar partikulárního řešení. Tvary partikulárních řešení jsou známy pro celou řadu nehomogenních členů. Např. rovnice (3.4) yn+k + „+*_! H-----h akyn = Pm{n), kde P (m) je polynom stupně n a příslušná charakteristická rovnice má reálné kořeny má (skoro vždy) partikulární řešení tvaru Qm(n), Qm(n) je polynom stupně m. Další možnou způsobem řešení je tzv. medota variace konstant, kdy nejprve najdeme řešení zhomogenizované rovnice a poté uvažujeme konstanty q jako funkce ci (jí) proměnné n a hledáme partikulární řešení dané rovnice ve tvaru k y(n) = ^Ci(n)fi(n). Ukažme si na obrázku hodnoty /) pro i < 35 a rovnicí f(n) = 9-f(n - 1) - 3-f(n - 2) + i /(O) = f(l) = 1. 0,9- 0,85: 0,8; 0,75: 0,7- 0 5 10 15 20 25 30 35 Dále si procvičme, jak řešit lineární diferenční rovnice druhého řádu s konstantními koeficienty. Posloupnost vyhovující dané 141 B. REKURENTNÍ ROVNICE 2. DIFERENČNÍ ROVNICE rekurentní rovnici druhého řádu je dána jednoznačně, pokud zadáme navíc nějaké dva její sousední členy. Znovu si povšimněme dalšího využití komplexních čísel: pro určení explicitního vzorce pro n-tý člen posloupnosti reálných čísel můžeme potřebovat výpočty s čísly komplexními (to nastává tehdy, pokud má charakteristický polynom dané diferenční rovnice komplexní kořeny). 3.6. Nalezněte explicitní vzorec pro posloupnost vyhovující následující lineární diferenční rovnici s počátečními podmínkami: Xnjr2 = 2xn -\- ľl, X\ = 2, X2 = 2. Solution. Zhomogenizovaná rovnice je Xn_|_2 = 2xn. Její charakteristický polynom je x2 —2, jeho kořeny jsou ±V2. Řešení zhomogenizované rovnice je tedy tvaru a{4lf + b(-V2)n, pro libovolné a,beR. Partikulární řešení budeme hledat metodou neurčitých koeficientů. Nehomogenní část dané rovnice je lineární polynom n, partikulární řešení proto budeme nejprve hledat ve tvaru lineárního polynomu v proměnné n, tedy kn + l, kde k, l e M. Dosazením do původní rovnice dostáváme k(n +2) +1 = 2(kn +l)+n. Porovnáním koeficientů u proměnné n na obou stranách rovnice dostáváme vztah k = 2k + 1, tedy k = —1, porovnáním absolutních členů pak vztah 2k + l = 21, tedy l = —2. Celkem je tedy partikulárním řešením je posloupnost —n — 2. Řešení dané nehomogenní diferenční rovnice druhého řádu bez počátečních podmínek jsou tedy tvaru a{~j2)n + b{—~j2)n — n — 2, a, b e M. Nyní dosazením do počátečních podmínek určíme neznámé a, b e M.. Pro početní jednoduchost použijeme malého triku: z počátečních podmínek a daného rekurentního vztahu vypočteme člen x0 : x0 = \(x2 — 0) = 1. Daný rekurentní vztah spolu s podmínkami x0 = 1 a x\ = 1 pak zřejmě splňuje tatáž posloupnost, která splňuje původní počáteční podmínky. Máme tedy následující vztahy pro a, b: x0: a(V2f + b(-V2f - 2 = 1, tedy a+b = 3, x\ : ~j2a — ~j2b = 5, /(*) /'(*) a0X" + i n—k + akX" ■ ■ ■ + ak(n - k)Xn-k~l a0n(n-l)Xn-2+- ■ ■ +ak(n-k)(n-k-l)Xn-k-2 a0nX" 1 + a0n...(n- í)Xn~1-1 + ... + ak(n — k)... (n — k — Í)X n-k-l-l Podívejme se na případ trojnásobného kořenu X a hledejme řešení ve tvaru n2X". Dosazením do definiční podmínky dostaneme rovnost 2-i n—k a^n X" + ■ ■ ■ + ak(n — k) X Zjevně je levá strana rovna výrazu X2 f"(X) + Xf'(X) a protože je X kořenem obou derivací, je podmínka splněna. Indukcí snadno dokážeme, že i obecnou podmínku pro hledané řešení ve tvaru xn = nlXn, a0nlX" + ... ak(n — k)lX' í i n—k o, dostaneme jako vhodnou lineární kombinaci derivací charakteristického polynomu začínající výrazem 1 Xl+l fl+l> + -XH(t + \)fw + ... a dostali jsme se tedy blízko k úplnému důkazu následující: Theorem. Každá homogenní lineární diferenční rovnice řádu k nad libovolným číselným oborem K obsaženým v komplexních číslech K má za množinu všech řešení k—rozměrný vektorový prostor generovaný posloupnostmi x„ = nlXn, kde Xjsou (komplexní) kořeny charakteristického polynomu a mocniny l probíhají všechna přirozená čísla od nuly až do násobnosti příslušného kořenu X. Proof. Výše použité vztahy násobnosti kořenů a derivací uvidíme později, a nebudeme tu dokazovat tvrzení, že každý komplexní polynom má právě tolik kořenů, včetně násobnosti, jaký má stupeň. Zbývá tedy ještě dokázat, že nalezená &-tice řešení je lineárně nezávislá. I v tomto případě lze induktivně dokázat nenulovost příslušného Ca-soratiánu, jako jsme odkazovali u případu Vandermondova determinantu výše. Pro ilustraci postupu ukážeme, jak výpočet vypadá pro případ jednonásobného kořenu X\ a dvojnásobného kořenu 142 CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET A2 charakteristického polynomu: C(A", Aj, řiAj) xi+2 2 a2 řiAIJ (n + 1)^+1 (n + 2)Xn2+2 -\ r7 -\ 2r7 A1A2 1 n i 2« A1A2 1 Al 1 A2 72 A i A,', 1 (n + (n + 2)A? 1 ; Ai 1 ř7 1 2ř7 "A1A2 . A2 Al(Al — A2) Ai — A2 Al(Al — A2) Aí 12 v^M A2)2 ^ 0. V obecném případě vedeme podobně důkaz nenulovosti příslušného Casoratiánu indukcí. □ 3.13. Reálné báze řešení. Pro rovnice s reálnými koeficienty povedou reálné počáteční podmínky vždy na reálná řešení. Přesto ale budou příslušná fundamentální řešení z právě odvozené věty často existovat pouze v oboru komplexním. Zkusme proto najít jiné generátory, se kterými se nám bude pracovat lépe. Potože jsou koeficienty charakteristického polynomu reálné, každý jeho kořen bude buď také reálný nebo musí kořeny vystupovat po dvou komplexně združených. Jestliže si řešení popíšeme v goniometrickém tvaru jako A" = |AI" (cos n

— i sin ncj)), okamžitě je vidět, že jejich součtem a rozdílem dostáváme jiná dvě lineárně nezávislá řešení xn = |A|" cos ncj), yn = \k\n sinncp. Difereční rovnice se velmi často vyskytují jako model dynamiky nějakého systému. Pěkným tématem na přemýšlení je proto souvislost absolutních hodnot jednotlivých kořenů a stabilizace řešení, buď všech nebo v závislosti na počátečních podmínkách. Nepůjdeme zde do podrobností, protože teprve v páté kapitole budeme probírat pojem konvergence hodnot k nějaké hodnotě limitní apod., jistě je tu ale prostor pro zajímavé numerické experimenty např. s oscilacemi vhodných populačních nebo ekonomických modelů. 3.14. Nehomogenní lineární diferenční rovnice. Stejně jako u systémů lineárních rovnic můžeme dostat všechna řešení nehomogenních lineárních b(n), diferenčních rovnic a0(n)xn +ai(n)xn-i -\-----h ak(n)x„. kde koeficienty a{ a b jsou skaláry, které mohou záviset na n, aa0(n) ak(n) ^ 0. jejichž řešením dostáváme a = 6+5^2, b = 6 5^2. Řešením je posloupnost JW = «±^(^). + «Z^(_^)._B_2. □ 3.7. Určete reálnou bázi prostoru řešení homogenní diferenční rovnice -"-«+4 = %n+3 -*"« + ! -*•«> Solution. Charakteristický polynom dané rovnice je x4 — x3 — x + 1. Hledáme-li jeho kořeny, řešíme reciprokou rovnici x4 - x3 - x + 1 = 0 Standardním postupem nejprve vydělíme rovnici výrazem x2 a poté zavedeme substituci t = x + ^, tedy t2 = x2 + -\ + 2. Obdržíme rovnici t2 -t -2 = 0, s kořeny t\ = — 1, t2 = 2. Pro obě tyto hodnoty neznámé t pak řešíme zvlášť rovnici danou substitučním vztahem: 1 x + - X -1. Ta má dva komplexní kořeny x\ = + = cos(27r/3) + i sin(27r/3) a x2 = — \ — i^- = cos(27r/3) — i sin(27r/3). Pro druhou hodnotu neznámé t dostáváme rovnici 1 x + - = 2 x s dvojnásobným kořenem 1. Celkem je tedy bazí hledaného vektorového prostoru posloupností, které jsou řešením dané diferenční rovnice, následující čtveřice posloupností: {—^ + r^}^,, {—^ — (konstantní posloupnost) a {n}™=1. Hledáme-li však reálnou bázi, musíme nahradit dva generátory (posloupnosti) z této báze s komplexními hodnotami generátory reálnými. Protože tyto generátory jsou geometrické řady, jejichž libovolné členy jsou komplexně sdružená čísla, můžeme vzít jako vhodné generátory posloupnosti dané polovinou součtu, resp. polovinou /-násobku rozdílu, daných komplexních generátorů. Takto dostaneme následující reálnou bázi řešení: {1}^ (konstantní posloupnost), {n}^=l, {cos(« • 2tt/3)}^1, □ {sin(n • 2jr/3)}~ ! 143 B. REKURENTNÍ ROVNICE 2. DIFERENČNÍ ROVNICE 3.8. Najděte posloupnost, která vyhovuje nehomogenní diferenční rovnici s počátečními podmínkami: x„_|_2 = xn+i + 2xn + 1, x\ = 2, X2 = 2. Solution. Obecné řešení zhomogenizované rovnice je tvaru a (—1)" + b2n. Partikulárním řešením je konstanta —1/2. Obecné řešení dané nehomogenní rovnice bez počátečních podmínek je tedy a(-l)n+b2n Dosazením do počátečních podmínek zjistíme konstanty a = —5/6, b = 5/6. Dané rovnici s počátečními podmínkami tedy vyhovuje posloupnost 5 5,1 — (-1)" + -2""1 - -. 6 3 2 □ 3.9. Určete posloupnost reálných čísel, která vyhovuje následující nehomogenní diferenční rovnici s počátečními podmínkami: 2x n+2 ~Xn + \ + Xn + 2, X\ — 2, X2 — 3. Solution. Obecné řešení zhomogenizované rovnice je tvaru a (—1)" + b(1/2)". Partikulárním řešením je konstanta 1. Obecné řešení dané nehomogenní rovnice bez počátečních podmínek je tedy a(-\)"+b(^j +1. Dosazením do počátečních podmínek zjistíme konstanty a = l,b = 4. Dané rovnici s počátečními podmínkami tedy vyhovuje posloupnost (-1)"+4(T) +i. 3.10. Řešte následující diferenční rovnici: Xn+4 = -"-«+3 -"-«+2 + -*•« + ! Xn. □ Solution. Z teorie víme, že prostor řešení této diferenční rovnice bude čtyřdimenzionální vektorový prostor, jehož generátory zjistíme z kořenů charakteristického polynomu dané rovnice. Charakteristická rovnice je x4 - x3 + x2 - x + 1 = 0. Jedná se o reciprokou rovnici (to znamená, že koeficienty u (n—k)-té a k-té mocniny x, k = 1, ..., n, jsou shodné). Zavedeme tedy substituci Postupujeme tak, že najdeme jedno řešení a přičteme celý vektorový prostor dimenze k řešení odpovídajících systémů homogenních. Skutečně takto dostáváme řešení a protože je rozdíl dvou řešení nehomogenní rovnice zjevně řešením homogenní, dostáváme takto řešení všechna. U systému lineárních rovnic se mohlo stát, že nemusel vůbec mít řešení. To u našich diferenčních rovnic možné není. Zato ale bývá nesnadné nalézt to jedno potřebné partikulární řešení nehomogenního systému, pokud je chování skalárních koeficientů v rovnici složité. U lineárních rekurencí je to podobné. Omezíme se tu na jediný případ, kdy příslušný homogenní systém má koeficienty konstantní a b(n) je polynom stupně s. Řešení pak lze hledat ve tvaru polynomu x„ = ao + a\n + • • • + asns s neznámými koeficienty a,■, i = 1, ..., s. Dosazením do diferenční rovnice a porovnáním koeficientů u jednotlivých mocnin n dostaneme systém 5 + 1 rovnic pro 5 + 1 proměnných a{. Pokud má tento systém řešení, našli jsme řešení našeho původního problému. Pokud řešení nemá, může stačit zvětšit stupeň s hledaného polynomu. Např. rovnice xn — x„_2 = 2 nemůže mít konstantní řešení, ale dosazením xn = a0+ain dostáváme řešení a i = 1 (a koeficient a0 může být libovolný) a proto je obecné řešení naší rovnice x„ = d +C2(-1)" +n. Všimněme si, že skutečně matice příslušného systému rovnic d°Plnit odkaz na pro polynom nižšího stupně nula je nulová a rovnice 0-a0 = 2 vedlejším sloupci, snad tam je i diskuse řešitelnosti pomocí variace nema resem. 3.15. Lineární filtry. Uvažujme nyní nekonečné posloupnosti konstant. (. . . , X—n, X—n + 1' X — i, Xq, X\, a budeme, podobně jako u systémů lineárních rovnic, pracovat s operací T, která zobrazí celou posloupnost x na posloupnost z = Tx se členy z„ ü{)Xn + ü\xn-\ + • • • + akxn- posloupnostmi x můžeme opět pracovat jako s vektory vzhledem ke sčítání i násobení skaláry po složkách. Pouze bude tento velký vektorový prostor nekonečněrozměrný. Naše zobrazení T je zjevně lineárním zobrazením na takovém vektorovém prostoru. Posloupnosti si představme jako diskrétní hodnoty nějakého signálu, odečítané zpravidla ve velmi krátkých časových jednotkách, operace T pak může být filtrem, který signál zpracovává. Bude nás zajímat, jak odhadnout vlastnosti, které takový "filtr" bude mít. Signály jsou velice často ze své podstaty dány součtem několika částí, které jsou samy o sobě víceméně periodické. 144 CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET Z naší definice je ale zřejmé, že periodické posloupnosti x„, tj. posloupnosti splňující pro nějaké pevné přirozené číslo p Xn+p — xn budou mít i periodické obrazy z = T x Zn+p = O-0xn+p + ^lXn-l+p + • • • + 0-kx n—k+p aoxn + a\xn-\ + • • • + akxn-k Zn se stejnou periodou p. Pro pevně zvolenou operaci T nás bude zajímat, které vstupní periodické posloupnosti zůstanou přibližně stejné (případně až na násobek) a které budou utlumeny na nulové hodnoty. Ve druhém případě tedy hledáme jádro našeho lineárního zobrazení T. To je ale dáno právě homogenní diferenční rovnicí aoxn + a\xn-\ + • • • + akxn-k kterou jsme se už naučili řešit. 0, a0 7^ 0 ak ^ 0, 3.16. Špatný equalizer. Jako příklad uvažujme velmi jednoduchý lineární filtr zadaný rovnicí Zn (T' x)n — xn+2 + xn- Výsledky takového zpracování signálu jsou naznačeny na následujících čtyřech obrázcích pro postupně se zvyšující frekvenci periodického . signálu xn = cos(qm). Červený je původní 3ils2^ - signál, zelený je výsledek po zpracování filtrem. Nerovnoměrnosti křivek jsou důsledkem nepřesného kreslení, oba signály jsou samozřejmě rovnoměrnými raději spravit obrázky - černobílé sinusovkami a pondne :-) u = x + ^. Po vydělení rovnice x (nula nemůže být kořenem) a r2 substituci (všimněte si, že x2 + \ = u2 — 2) dostáváme 9 1 1 9 x — x + 1---1—— = u — u — 1=0. x x2 Dostáváme tedy neznámé m i 2 = 1±2V^- Odtud pak z rovnice x2 —ux + 1=0 určíme čtyři kořeny xl, 2,3,4 1 ± V5± V-10±2V5 Nyní si všimněme, že kořeny charakteristické rovnice jsme mohli "uhodnout" rovnou. Je totiž x5 + 1 = (x + l)(x4 x3 + x2 - X + 1), a tedy jsou kořeny polynomu x4 — x3 + x2 — x + 1 i kořeny polynomu x5 + 1, což jsou páté odmocniny z —1. Takto dostáváme, že řešením charakteristikého polynomu jsou čísla xi 2 = cos( j)±sin( j) ax34 = cos^) ± sin^). Tedy reálnou bází prostoru řešení dané diferenční rovnice je například báze posloupností cos^), sin^), cos(^-) a siní3^1), což jsou siny a kosiny argumentů příslušných mocnin kořenů charakteristického polynomu. Všimněme si, že jsme mimochodem odvodili algebraické výrazy pro cos(f) = sin(f) = ^10-2^ cos(^) = a sin(^) = 710+2^5 ^zhledem k tomu, že všechny kořeny rovnice mají absolutní hodnotu 1, tak jsou to reálné, resp. imaginární, části příslušných kořenů). □ 3.11. Určete explicitní vyjádření posloupnosti vyhovující diferenční rovnici x„+2 = 2x„+i — 2x„ se členy xi = 2, x2 = 2. Solution. Kořeny charakteristického polynomu x2 —2x+2jsou 1+/ a 1 — i. Báze (komplexního) vektorového prostoru řešení je tedy tvořena posloupnostmi j„ = (1 + /)" a z„ = (1 — /)". Hledanou posloupnost můžeme vyjádřit jako lineární kombinaci těchto poslopností (s komplexními koeficienty). Je tedy x„ = a ■ yn + b ■ zn, kde a = a\ + ia2, b = b\ +ib2. Z rekurentního vztahu dopočteme x0 = j(2x\ —x2) = 0 a dosazením « = 0a« = ldo uvažovaného vyjádření x„ dostáváme 1 = x0 = a\ + ia2 + b\ + ib2 2 = xi = (úti + ia2)(\ + i) + (bi + ib2){\ - i), 145 B. REKURENTNÍ ROVNICE 3. ITEROVANÉ LINEÁRNÍ PROCESY a porovnáním reálné a komplexní složky obou rovnic dostáváme lineární soustavu čtyř rovnic o čtyřech neznámých doplnit podrobný výpočet pomocí uvedených nástrojů, asi ve druhém sloupci - pak bychom zde dali odkaz! a\ + b\ = 1 a2 + b2 = 0 ai — a2 + b\ + b2 = 2 ai + a2 — b\ + b2 = 0 s řešením a\ =b\ = b2 = \aa2 = —1/2. Celkem můžeme hledanou posloupnost vyjádřit jako Posloupnost můžeme však vyjádřit i pomocí reálné báze (komplexního) vektorového prostoru řešení, totiž posloupností un = \{yn + zn) = (V2)"cos(f) a vn = \i(Zn - y„) = (^2)" sin(f). Matice přechodu od komplexní báze k reálné je 1 i, T :-- j' 2 2' (Í ÍY inverzní matice je T 1 = "^,pro vyjádření posloupnosti x„ pomocí reálné báze, tj. souřadnice (c, d) posloupnostixn vbázi {«„, vn}, pak máme T-i Q-'G)-G) máme tedy alternativní vyjádření posloupnosti xn, ve kterém se nevyskytují komplexní čísla (ale zase jsou v něm odmocniny): x„ = (V2rcos(^)+(V2rsin(^), které jsme samozřejmě mohli získat též řešením dvou lineárních rovnic o dvou neznámých c, d, totiž 1 =x0 = c ■ w0 + d ■ v0 = c a 2 = x\ = c ■ u\ + d ■ v\ = c + d. □ 3.12. Dokažte, že každý člen posloupnosti zadané rekurentním vztahem x„ = 2x„_i + 8x„_2 — 9, n>2 se členy x\ = 1, x2 = 25, je druhou mocninou přirozeného čísla. 3.13. Určete explicitní vyjádření posloupnosti vyhovující diferenční rovnici xn+2 = 3x„+i + 3x„ se členy x\ = 1 a x2 = 3. 3.14. Určete explicitní vzorec pro n-tý člen jediné posloupnosti {xn}^Li vyhovující následujícím podmínkám: X„_|_2 = xn + \ ~ xm , X\ = \, X2 = 5. Všimněme si, že v oblastech, kde je výsledný signál přibližně stejně silný jako původní, dochází k dramatickému posuvu fáze signálu. Levné equalizery skutečně podobně špatně fungují. 3. Iterované lineární procesy 3.17. Iterované procesy. V praktických modelech se často setkáváme se situací, kdy je vývoj systému v jednom časovém období dán lineárním procesem, zajímáme se ale o chování sys- __ tému po mnoha iteracích. Často přitom samotný lineární proces zůstává pořád stejný, z pohledu našeho matematického modelu tedy nejde o nic jiného než opakované násobení stavového vektoru stále stejnou maticí. Zatímco pro řešení systémů lineárních rovnic jsme potřebovali jen minumum znalostí o vlastnostech lineárních zobrazení, k pochopení chování iterovaného systému budeme účelně používat znalosti vlastních čísel, vlastností vlastních vektorů a další strukturní výsledky. V jistém smyslu se pohybujeme v podobném prostředí jako u lineárních rekurencí a skutečně můžeme náš popis filtrů v minulých odstavcích takto také popsat. Představme si, že pracujeme se zvukem a uchováváme si stavový vektor = (-*-«> ■ ■ ■ , xn—k+l) všech hodnot od aktuální až po poslední, kterou ještě v našem lineárních filtru zpracováváme. V jednom časovém intervalu (ve vzorkovací frekveci audio signálu mimořádně krátkém) pak přejdeme ke stavovému vektoru Yn + l = (xn + \, Xn, . . . , X„_j-_|_2), kde první hodnota xn+i = a\xn + • • • + akxn_k+i je spočtena jako u homogenních diferenčních rovnic, ostatní si jen posunujeme o jednu pozici a poslední zapomeneme. Příslušná čtvercová matice řádu k, splňující Yn+\ = A ■ Yn, bude vypadat takto: 1 a2 . 0 . ^k-l 0 1 ' 0 0 \0 0 ... 1 0./ Pro takovou jednoduchou matici jsme si odvodili explicitní postup pro úplné řešení otázky, jak vypadá formule pro řešení. Obecně to tak snadno nepůjde ani pro velice podobné systémy. Jedním z typických případů je studium dynamiky populací v různých biologických systémech. Všimněme si také, že vcelku pochopitelně má matice A za charakteristický polynom právě p(k) =kk - axXk~l jak snadno dovodíme pomocí rozvoje podle posledního sloupce a rekurencí. To je vysvětlitelné i přímo, protože řešení xn = k", k ^ 0, vlastně znamená, že matice A 146 CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET vynásobením převede vlastní vektor (kk, ..., k)T na jeho A-násobek. Musí být tedy takové k vlastním číslem matice A. 3.18. Leslieho model růstu populací. Představme si, že zk- oumáme nějaký systém jednotlivců (pěstovaná zvířata, hmyz, buněčné kultury apod.) rozdělený do m skupin, třeba podle stáří, fází vývoje hmyzu apod. Stav Xn je tedy dán vektorem X„ = («i, ..., um) závisejícím na okamžiku ř„, ve kterém systém pozorujeme. Lineární model vývoje takového systému je dán maticí A dimenze n, která zadává změnu vektoru Xn na Xn+i = A ■ Xn při přírůstku času z ř„ na ř„+1. Uvažujme jako příklad tzv. Leslieho model růstu, ve kterém vystupuje matice I fl h h ■■■ fm-l fm\ ti 0 0 ... o o 0 r2 0 ... 0 0 A = 0 0 r3 ' • - 0 0 ' \0 0 0 ... rm_! 0/ jejíž parametry jsou svázány s vývojem populace rozdělené do m věkových skupin tak, že ft označuje relativní plodnost příslušné věkové skupiny (ve sledovaném časovém skoku vznikne z N jedinců v /-té skupině ftN jedinců nových, tj. ve skupině první), zatímco r; je relativní úmrtnost /-té skupiny během jednoho období. Pochopitelně lze použít takový model s libovolným počtem věkových skupin. Všechny koeficienty jsou tedy nezáporná reálná čísla a čísla ti jsou mezi nulou a jedničkou. Všimněme si, že pokud jsou všechna r rovna jedné, jde vlastně o lineární rekurenci s konstantními koeficienty a tedy buď exponenciálním růstem/poklesem (pro reálné kořeny k charakteristického polynomu) nebo oscilováním spojeným s případným růstem či poklesem (pro komplexní kořeny). Než se pustíme do obecnější teorie, trochu si pohrajeme s tímto konkrétním modelem. Přímým výpočtem pomocí Laplaceova rozvoje podle posledního sloupce spočteme charakteristický polynom pm(k) matice A pro model s m skupinami: pm(k) = \A- kE\ = -kpm-i(X) + (-l)m_1/mri ... rm_i. Vcelku snadno dovodíme indukcí, že tento charakteristický polynom má tvar PmW = (—l)m(Am — a{km 1 — ••• — am-{k — am) s vesměs nezápornými koeficienty a\, ..., am, pokud jsou všechny prametry r; a /) kladné. Např. je vždy — f m t\ ■ ■ ■ tm — 1 ■ 3.15. Určete explicitní vzorec pro n-tý člen jediné posloupnosti {x«}^Li vyhovující následujícím podmínkám: ~xn+3 = 2x„_|_2 + 2x„_|_i +X„, X\ = 1, %2 = 1, X3 = 1. 3.16. Určete explicitní vzorec pro n-tý člen jediné posloupnosti {x«}^Li vyhovující následujícím podmínkám: -xn+3 = 3xn+2 + 3x„+i +Xn, X\ = 1, x2 = 1, x3 = 1. C. Populační modely Populační modely, kterými se budeme zabývat, budou rekurentní vztahy ve vektorových prostorech. Neznámou veličinou tedy nebude posloupnost čísel nýbrž posloupnost vektorů. Roli koeficientů pak budou hrát matice. Začneme s jednoduchým (dvourozměrným) příkladem. 3.17. Spoření. S kamarádem spoříme na společnou dovolenou následujícím způsobem. Na začátku dám 10 EUR a on 20 EUR. Každý další měsíc pak dá každý z nás tolik, co minulý měsíc plus polovinu toho, co dal ten druhý z nás předchozí měsíc. Kolik budeme mít za rok dohromady naspořeno? Kolik peněz budu platit dvanáctý měsíc? Solution. Obnos peněz, který budu platit n-tý měsíc já označím xn a to, co bude platit kamarád označím y„. První měsíc tedy dáme x\ = 10, yi = 20. Pro další platby můžeme psát rekurentní rovnice: yn+i = y„ + jXn Pokud označíme společný vklad zn = Xn+yn, pak sečtením uvedených rovnic dostaneme vztah zn+i = zn + \zn = \zn- To je geometrická řada a dostáváme tedy z,„ = 3.(|)"_1. Za rok budeme mít celkem naspořeno z\ + z2 + • • • + zn- Tento částečný součet umíme lehce spočítat 3 3 (-)12 - 1 zi(l + - + ••• + (-)11) = 30V23 _ i = 7725. Za rok tedy dohromady naspoříme více než 7724 euro. Rekurentní soustavu rovnic popisující systém spoření můžeme napsat pomocí matice následovně fe:) - G i) Ci) 147 C. POPULAČNÍ MODELY 3. ITEROVANÉ LINEÁRNÍ PROCESY Jde tedy opět o geometrickou řadu. Jejími prvky jsou teď ovšem vektory a kvocient není skalár, ale matice. Řešení lze nicméně najít obdobně (•:) ( ,) (•) Mocninu matice působící na vektor (jci, yi) můžeme nalézt, když vyjádříme tento vektor v bázi vlastních vektorů. Charakteristický polynom matice je (1 — k)2 — ^ — 0 a vlastní čísla jsou tedy Ai 2 = §, \-Příslušné vlastní vektory jsou po řadě (1, 1) a (1, —1). Pro počáteční vektor (x\, yi) = (10, 20) spočítáme a proto To znamená, že já zaplatím 12. měsíc *12 15 (;) M') 1297 eur a můj kamarád v podstatě stejně. □ Remark. Předchozí příklad lze řešit i bez matice následujícím přepsáním rekuretní rovnice: Xn + i = Xn + jyn = jXn + jZn- Předcházející příklad byl vlastně modelem růstu (v daném případě růstu množství naspořených peněz). Nyní přejděme k modelům růstu popisujícím primárně růst nějaké populace. Leslieho model růstu, který jsme detailně rozebrali v teorii, velmi dobře popisuje nejen populace ovcí (podle kterých byl sestaven), ale uplatňuje se například i při modelování následuj ích populací: 3.18. Zajíci podruhé. Ukažme si, jak můžeme Leslieho modelem popsat populaci zajíců na louce, kterou jsme se zaobírali v příkladu (|| 3.41|). Uvažujme, že zajíci umírají po dovršení devátého měsíce věku (v původním modelu byl věk zajíců neomezen). Označme počty zajíců (resp. zaječic) podle stáří v měsících v čase t (měsíců) jako x\(i), x2(t),..., x9(t), tak počty zajíců v jednotlivých věkových skupinách budou po jednom měsíci x\(t + 1) = x2(ř) + x3(ř) + • • • + x9(t), Xi(t + 1) = x,_i(ř), pro i = 2,3, ..., 10, neboli /o i i i i i i i i\ innnnnnnn /*l(í+ 1)\ ' x2(ř+ 1) \ x3(ř+ 1) x4(ř+ 1) x5(t+ 1) x6(ř+ 1) x7(ř+ 1) . xg(ř+ 1) \x9(ř+ 1)/ 1111111 00000000 010000000 001000000 000100000 000010000 000001000 .000000 1 00 \o o o o o o o i o/ /xi ' x2 Charakteristický polynom uvedené matice je k — k — k — k — k — X3—X2 — X — l. Kořeny této rovnice nejsme schopni explicitně vyjádřit, Zkusme kvalitativně odhadnout rozložení kořenů polynomu pm. Bohužel, detaily budeme umět přesně vysvětlit a ověřit až po absolvování příslušných partií tzv. matematické analýzy v kapitole páté a později, přesto by ale postup měl být intuitivně jasný. Vyjádříme si charakteristický polynom ve tvaru pm(X) = ±Xm(l-q(X)) kde q(X) = a\X~l + ■ ■ ■ + amX~m je ostře klesající a nezáporná funkce pro X > 0. Evidentně bude proto existovat právě jedno kladné X, pro které bude q(X) = 1 a tedy také pm (X) = 0. Jinými slovy, pro každou Leslieho matici existuje právě jedno kladné reálné vlastní číslo. Pro skutečné Leslieho modely populací bývají všechny koeficienty r; i /_,■ mezi nulou a jedničkou a typicky nastává situace, kdy jediné reálné vlastní číslo k\ je větší nebo rovno jedné, zatímco absolutní hodnoty ostatních vlastních čísel jsou ostře menší nezjedná. Jestliže začneme s libovolnýmn stavovým vektorem X, který bude dán jako součet vlastních vektorů X = X\ + • • • + Xm s vlastními hodnotami X{, pak při iteracích dostáváme A ■ X X\X\ + ... XkmX„ takže za předpokladu, že \kt\ < 1 pro všechna i > 2, budou všechny komponenty ve vlastních podprostorech velmi rychle mizet, kromě kompomenty kiX\. Rozložení populace do věkových skupin se tak budou rychle blížit poměrům komponent vlastního vektoru k dominantnímu vlastnímu číslu k\. Například pro matici (uvědomme si význam jednotlivých koeficientů, jsou převzaty z modelu pro chov ovcí, tj. hodnoty r zahrnují jak přirozený úhyn tak případné aktivity chovatelů na jatkách) / 0 0.2 0 0.8 0 0 0.95 0 0 0 0.8 0 0 0.7 0 0.6 0 0 0 0.6 o o o vyjdou vlastní hodnoty přibližně 1.03, 0, -0.5, -0,27 + 0.74/, -0.27 -0.74/ s velikostmi 1.03, 0, 0.5, 0.78, 0.78 a vlastní vektor příslušný dominantnímu vlastnímu číslu je přibližně XT = (30 27 21 14 8). Zvolili jsme rovnou jediný vlastní vektor se součtem souřadnic rovným stu, zadává nám proto přímo výsledné procentní rozložení populace. Pokud bychom chtěli místo tříprocentního celkového růstu populace setrvalý stav a předsevzali si ujídat více ovce třeba z druhé věkové skupiny, řešili bychom úlohu, o kolik 148 CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET máme zmenšit r2, aby bylo dominantní vlastní číslo rovno jedné. 3.19. Matice s nezápornými prvky. Reálné matice, které nemají žádné záporné prvky mají velmi speciální vlastnosti. Zároveň jsou skutečně tady by se hodilo trochu historie, ^J^mh^Ř' časté v praktických modelech. Naznačíme vlastne jen ^ '^w^émíi\_ proto teď proto tzv. Perwnovu-Frobeniovu naznačíme cäst ' -l výsledků Perrona, k teorii, která se právě takovým maticím věnuje. obecnější situaci se Začneme definicí několika pojmů, abychom mohli naše vůlfc úvahy vůbec formulovat. nedopracujeme. ^ . f I Kladné a primitivní matice I Definition. Za kladnou matici budeme považovat takovou čtvercovou matici A, jejíž všechny prvky útý jsou reálné a ostře kladné. Primitivní matice je pak taková čtvercová matice A, jejíž nějaká mocnina A* je kladná. inspirováno materiálem na webu, viz http://www-users.math.umd.edu/ ~mmb/475/spec.pdf Připomeňme, že spektrálním poloměrem matice A nazýváme maximum absolutních hodnot všech jejích (komplexních) vlastních čísel. Spektrálním poloměrem lineárního zobrazení na (konečněrozměrném) vektorovém prostoru rozumíme spektrální poloměr jeho matice v některé bázi. 2 Normou matice A e W1 nebo vektoru x e W1 rozumíme součet absolutních hodnot všech jejich prvků. U vektorů x píšeme pro jejich normu \x\. Následující výsledek je mimořádně užitečný a snad i dobře srozumitelný. Jeho důkaz se svou náročností dosti vymyká této učebnici, uvádíme ale alespoň jeho stručný nástin. Pokud by čtenář měl problém s plynulým čtení nástinu důkazu, doporučujeme jej přeskočit. Theorem (Perronova). Jestliže je A primitivní matice se spektrálním poloměrem X e M, pak je X jednoduchým kořenem charakteristického polynomu matice A, který je ostře větší než absolutní hodnota kteréhokoliv jiného vlastního čísla matice A. K vlastnímu číslu X navíc existuje vlastní vektor x s výhradně kladnými prvky x;-. Náznak důkazu. V důkazu se budeme opírat o intu-rws\\\ ici elementární geometrie. Částečně budeme použite koncepty upřesňovat uz v analytické geometrii ve čtvrté kapitole, některé analytické aspekty budeme studovat podrobněji v kapitolách páté a později, přesné důkazy některých analytických kroků v této učebnici nepodáme vůbec. Snad budou následující úvahy nejen osvětlovat dokazovaný teorém, ale budou také samy o sobě motivací pro naše další studium geometrie i matematické analýzy. Začneme docela srozumitelně znějícím pomocným lemmatem: Lemma. Uvažme libovolný mnohostěn P obsahující počátek 0 e W1. Jestliže nějaká iterace lineárního zobrazení Ý '■ W1 -» M." zobrazuje P do jeho vnitřku, pak je spektrální poloměr zobrazení Ý ostře menší nezjedná. jeden z nich však velmi dobře odhadnout, Xi = 1, 608 (proč musí být menší než (75 + l)/2)?). Populace bude tedy podle tohoto modelu růst přibližně s geometrickou řadou 1, 608ř. 3.19. Jezírko. Mějme jednoduchý model jezírka, ve kterém žije populace bílé ryby (plotice, ouklej, podoustev, ostroretka atd.). Předpokládáme, že druhého roku se dožije 20 % rybího plůdku a od tohoto stáří už jsou ryby schopny se reprodukovat. Z mladých ryb přežije z druhého do třetího roku přibližně 60 % a v dalších letech je už úmrtnost zanedbatelná. Dále předpokládáme, že roční přírůstek nových plůdků je třikrát větší než počet ryb (schopných reprodukce). Tato populace by evidentně jezírko brzy přeplnila. Rovnováhu chceme dosáhnout nasazením dravé ryby, např. štiky. Předpokládejme, že jedna štika sní ročně asi 500 dospělých bílých ryb. Kolik štik pak musíme do jezírka nasadit, aby populace stagnovala? Solution. Pokud označíme p počet plůdku, m počet mladých ryb a r počet dospělých ryb, pak je stav populace v dalším roce popsán následovně: 'p\ ( 3m + 3r m J h-» j 0, 2p r I \0, 6m + rr kde 1 — r je relativní úmrtnost dospělé ryby způsobená štikou. Příslušná matice popisující tento model je tedy Pokud má populace stagnovat, pak musí mít tato matice vlastní hodnotu 1. Jinými slovy, jednička musí být kořenem charakteristického polynomu této matice. Ten je tvaru X2(r— X)+0, 36 — 0, 6.(r — X) = 0. To znamená, že r musí splňovat r - 1 + 0,36-0, 6(r - 1) = 0 0, 4r - 0, 04 = 0 Do dalšího roku tedy může přežít jen 10 % z dospělých ryb a zbytek by měla sníst štika. Označíme-li hledaný počet štik x, pak dohromady sní 500x ryb, což by mělo odpovídat podle předchozího výpočtu 0, 9r. Poměr počtu bílé ryby ku počtu štik by tedy měl být r- = To je přibližně jedna štika na 556 kusů bílé ryby. □ Obecněji můžeme zpracovat předcházející model takto: 3.20. Nechť je v populačním modelu dravec-kořist určen vztah mezi počtem dravců Dk a kořisti Kk v daném a následujícím měsíci (k e N U {0}) lineárním systémem (a) Djt+i = 0,6Dk + 0,5*:*, Kk+l = -0,16Djt + 1,2 Kk; 149 C. POPULAČNÍ MODELY 3. ITEROVANÉ LINEÁRNÍ PROCESY (b) (c) Dk+i Kk+i 0,6Dk + 0,5 Kk, -0,175 D, + 1,2 Kk; Dk+1 = 0,6 D, + 0,5*:*, Kk+l = -0,135 D, + l,2Kk. Analyzujte chovaní tohoto modelu po velmi dlouhé době. Solution. Všimněme si, že jednotlivé varianty se od sebe navzájem liší pouze v hodnotě koeficientu u Dk ve druhé rovnici. Můžeme proto všechny tři případy vyjádřit jako kde budeme postupně klást a = 0, 16, a = 0, 175, a = 0, 135. Hodnota koeficientu a zde reprezentuje průměrný počet kusů kořisti zahubených jedním (očividně „nenáročným") dravcem za měsíc. Při označení T bezprostředně dostáváme (0,6 0,5\ \-a 1,2/ k e N. Pomocí mocnin matice T tak můžeme určit vývoj populací dravce a kořisti po velmi dlouhé době. Snadno stanovíme vlastní čísla (a) ki = 1, k2 = 0, 8; (b) kt = 0, 95, k2 = 0, 85; (c) ki = 1,05, k2 = 0,75 matice T a jim (při zachování pořadí) příslušné vlastní vektory (a) (5,4)r, (5,2)r; (b) (10,7)r, (2, lf; (c) (10,9)r , (10, 3)T. Pro k e N tudíž platí (a) k_(5 5\ (l 0 \* (5 5\~\ \4 2/ ' \0 0, 8/ ' \4 2/ ' T*-ŕ10 2\ f0,95 0 V ŕ10 2V*-\7 1/ ' V 0 0,85/ ' \ 7 1/ ' rpk _ (10 10\ (1,05 0 \k (10 10y1 \9 3 / ' y 0 0,75/ ' \ 9 3/ - Odtud dále pro velká & e N plyne (b) (c) Uvažme matici A zobrazení ý ve standardní bázi. Protože vlastní čísla Ak jsou k-té mocniny vlastních čísel matice A, můžeme rovnou bez újmy na obecnosti předpokládat, že samotné zobrazení již zobrazuje P do vnitřku P. Zjevně tedy nemůže mít ý žádnout vlastní hodnotu s absolutní hodnotou větší než jedna. Důkaz dále povedeme sporem. Předpokládejme, že existuje vlastní hodnota k s |A| = 1. Máme tedy dvě možnosti. Buď je kk = 1 pro vhodné k nebo takové k neexistuje. Obrazem f je uzavřená množina (to znamená, že pokud se body v obrazu budou hromadit k nějakému bodu jvK", bude y opět v obrazu) a hranici P tento obraz vůbec nepro-tíná. Nemůže tedy mít ý pevný bod na hranici P ani nemůže existovat žádný bod na hranici, ke kterému by se mohly libovolně blížit body v obrazu. První argument vylučuje, že by nějaká mocnina k byla jedničkou, protože to by takový pevný bod na hranici P jistě existoval. Ve zbývajícím případě jistě existuje dvourozměrný podprostor W C M", na nějž se ý zužuje coby rotace o iracionální argument a jistě existuje bod y v průniku W s hranicí P. Pak by ale byl bod y libovolně přesně přiblížen body z množiny \/r (y) při průchodu přes všechny iterace a tedy by musel sám být také v obrazu. Došli jsme tedy ke sporu a lemma je ověřeno. Nyní se dáme do důkazu Perronovy věty. Naším prvním krokem bude ověření existence vlastního vektoru, který má všechny prvky kladné. Uvažme za tím účelem tzv. standardní simplex S = {x = (x\, ..., xn)T, \x\ = l,Xi >0,i = 1, ..., n}. Protože všechny prvky v matici A jsou nezáporné, obraz A ■ x bude mít samé nezáporné souřadnice stejně jako x a alespoň jedna z nich bude vždy nenulová. Zobrazení x \-> \A ■ x\~l(A ■ x) proto zobrazuje S do sebe, Toto zobrazení 5^5 splňuje všechny předpoklady tzv. Browerovy věty o pevném bodě a proto existuje vektor y e S takový, že je Určitě budeme chtít mít později v , . , u t> i '~ analýze něco víc o tímto zobrazením zobrazen sam na sebe. To ale znamená, ze větách o pevném bodě. Tady dplníme odkaz!! A ■ y = k y, k = \ A ■ y\ a našli jsme vlastní vektor, který leží v S. Protože ale má nějaká mocnina Ak podle našeho předpokladu samé kladné prvky a samozřejmě je také Ak ■ y = kky, všechny souřadnice vektoru y jsou ostře kladné (tj. leží ve vnitřku S) a k > 0. Abychom dokázali zbytek věty, budeme uvažovat zobrazení zadané maticí A ve výhodnější bázi a navíc ho vynásobíme konstantou k~l: B = k'HY'1 ■ A-Y), kde Y je diagonálni matice se souřadnicemi y{ právě nalezeného vlastního vektoru y na diagonále. Evidentně je B také primitivní matice a navíc je vektor z = (1, ..., l)r jejím vlastním vektorem, protože zjevně Y ■ z = y- Jestliže nyní dokážeme, že \i = 1 je jednoduchým kořenem charakteristického polynomu matice B a všechny 150 CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET ostatní kořeny mají absolutní hodnotu ostře menší než jedna, bude Perronova věta dokázána. K tomu se nám teď bude hodit dříve dokázané pomocné lemma. Uvažujme matici S jako matici lineárního zobrazení, které zobrazuje řádkové vektory (a) (Ui u„) h-» u ■ B tj. pomocí násobení zprava. Díky tomu, že je z = (1, ..., l)r vlastním vektorem matice B, je součet souřadnic řádkového vektoru v X u'b'j = X u i 1, U=i i=l kdykoliv je u e S. Proto toto zobrazení zobrazuje simplex S na sebe a má také jistě v S vlastní (řádkový) vektor w s vlastní hodnotou jedna (pevný bod, opět dle Browerovy věty). Protože nějaká mocnina Bk obsahuje samé ostře pozitivní prvky, je nutně obraz simplexu S v k-té iteraci zobrazení daného B uvnitř S. To už jsme blízko použití našeho lematu, které jsme si pro důkaz připravili. Budeme i nadále pracovat s řádkovými vektory a označme si P posunutí simplexu S do počátku pomocí vlastního vektoru w, který jsme právě našli, tj. P = —w + S. Evidentně je P mnohostěn obsahující počátek a vektorový podprostor V C W generovaný P je invariantní vůči působení matice B pomocí násobení řádkových vektorů zprava. Zúžení našeho zobrazení na P tedy splňuje předpoklady pomocného lemmatu a proto nutně musí být všechny jeho vlastní hodnoty v absolutní hodnotě menší než jedna. Ještě se musíme vypořádat se skutečností, že právě uvažované zobrazení je dáno násobením řádkových vektorů zprava maticí B (zatímco nás původně zajímalo chování zobrazení, zadaného maticí B pomocí násobení sloupcových vektorů zleva). To je ale ekvivalentní násobení transponovaných sloupcových vektorů transponovanou maticí B obvyklým způsobem zleva. Dokázali jsem tedy vlastně potřebné tvrzení o vlastních číslech pro matici transponovanou k naší matici B. Transponování ale vlastní čísla nemění. Dimenze prostoru V je přitom n — 1, takže důkaz věty je ukončen. □ 3.20. Jednoduché důsledky. Následující velice užitečné tvrzení má při znalosti Perronovy věty až překvapivě jednoduchý důkaz a ukazuje, jak silná ě^zl, je vlastnost primitívnosti matice zobrazení. Corollary. Jestliže A = (úty) je primitivní matice a x e W její vlastní vektor se všemi souřadnicemi nezápornými a vlastní hodnotou X, pak X > 0 je spektrální poloměr A. Navíc platí min/g {i, ...,„} ^ aj i=l < k < max i = l (5 5) í1 °)-(5 5V \4 2/ \0 OJ \4 2) J_ /-10 25\ 10 V-8 20J' (b) (c) 1 - f7° H o) C" 0"' -e t)- (10 10\ A, 05* 0\ (10 10Y \9 3 / ' y 0 0/ ' \9 3/ 1,05* (-30 100\ 60 V-27 90) ' -30 100^ -27 90 neboť právě pro velká k e N můžeme položit (a) (b) (c) (\ 0 \ _ (1 0\ \0 0,8/ ~ \0 OJ' (0,95 0 V (0 0\ \ 0 0, 85/ ~ \0 OJ ' /1,05 0 V /1,05* 0\ \ 0 0,75/ ~ V 0 0/ Podotkněme, že ve variantě (b), tj. pro a vlastní vektory počítat. Obdrželi jsme tak (a) 0, 175, nebylo nutné (b) (c) 1 /-10 25\ (D0\ 10 V "8 20J'\KQJ = J_(5 (-2D0 + 5K0)\ 10 \4(-2DQ + 5KQ)J' (£)-(!! 2)-(2)-©= U)5^/-30 100\ (D0\ \KkJ~ 60 V"27 90J'\KQJ _ 1,05* /10(-3A) + 10Z0)\ 60 V 9 ("3Z)o + 10^o) / ' i(-3D0 + 10Z0 -3D0 + lOZo Tyto výsledky lze interpretovat následovně: (a) Pokud 2 Do < 5Kq, velikosti obou populací se ustálí na nenulových hodnotách (říkáme, že jsou stabilní); jestliže 2Dq > 5Kq, obě populace vymřou. 151 C. POPULAČNÍ MODELY 3. ITEROVANÉ LINEÁRNÍ PROCESY (b) Obě populace vymřou. (c) Pro3D0 < 10K0 nastáva populační exploze obou druhů; pro 3 A) > 10^o °bě populace vymřou. To, že extrémně malá změna velikosti a může vést ke zcela odlišnému výsledku, je zapříčiněno neměnností hodnoty a v závislosti na velikosti obou populací. Poznamenejme, že toto omezení, kdy a v našich modelech považujeme za konstantní, nemá oporu ve skutečnosti. Přesto získáváme odhad velikosti a pro stabilní populace. □ 3.21. Remark. Jiný model soužití populací dravce a kořisti poskytuje model pánů Lotky a Volterra, který popisuje vztah mezi populacemi soustavou dvou obyčejných diferenciálních rovnic. Podle tohoto modelu obě populace oscilují, což je i v souladu s pozorováními. V lineárních modelech hrají významnou roli tzv. primitivní matice (3.19). 3.22. Které z matic (0 l/A \1 6/7) ' B D /1/3 1/2 1/2 1/3 0 1/6 1/6 1/3 \l/6 0 5/6 2/3/ jsou primitivní? Solution. Neboť /1/7 6/49 \ 3 \6/7 43/49/' / 0 1 0 C = I 1/4 0 1/2 \3/4 0 1/2, /O 1 0 0\ 0 0 0 1 10 0 0 \0 0 1 0/ '3/8 1/4 l/4\ 1/4 3/8 1/4 3/8 3/8 1/2, matice A a C jsou primitivní; a neboť '1/2 0 l/3\ /O 0 1 1/2 ] • j 1 vl/2 0 1/6/ \0 bude prostřední sloupec matice B" vždy (pro n e rem (0, 1, 0)T, tj. matice B nemůže být primitivní. Součin /1/3 1/2 0 0 \ /0\ / 0 \ 1/2 1/3 0 0 0 1/6 1/6 1/3 \l/6 0 5/6 2/3/ 0 a 0 a/6 + bß \5a/6 + 2b/3/ N) vekto- a, b e implikuje, že matice D2 bude mít v pravém horním rohu nulovou dvourozměrnou (čtvercovou) submatici. Opakováním této implikace dostáváme, že stejnou vlastnost mají matice D3 = DD2,D4 = DD3, ..., D" = D ■ Dn~l, ..., tudíž matice D není primitivní. Matice E je permutační (v každém řádku a sloupci má právě jeden nenulový prvek, Proof. Uvažme vlastní vektor x z dokazovaného tvrzení. Protože je A primitivní, můžeme zvolit pevně k tak, aby Ak už měla samé pozitivní prvky, a pak je samozřejmě i Ak -x = kkx vektor se samými ostře kladnými souřadnicemi. Nutně proto je k > 0. Z Perronovy věty víme, že spektrální poloměr \i je vlastním číslem a zvolme takový vlastní vektor y k \i, že rozdíl x — y má samé kladné souřadnice. Potom nutně pro všechny mocniny n 0 < A" • (x - y) = k"x - n"y, ale zároveň platí k < \i. Odtud již vyplývá k = \i. Zbývá odhad spektrálního poloměru pomocí minima a maxima součtů jednotlivých sloupců matice. Označme je bmm a bmax, zvolme za x vektor se součtem souřadnic jedna a počítejme: y tát k n / n s. n j=i \=i 7 j=i n , n s. n □ Všimněme si, že např. všechny Leslieho matice z 3.18, kde jsou všechny uvažované koeficienty /) a r, ostře kladné, jsou primitivní a tedy na ně můžeme plně použít právě odvozené výsledky. Perronova-Frobeniova věta je zobecněním Perronovy věty na obecnější matice, které tu nebudeme uvádět. Další informace lze najít např. 99 odkaz do literatury i na dalsi využiti... 3.21. Markovovy řetězce. Velice častý a zajímavý případ lineárních procesů se samými nezápornými prvky v matici je matematický model systému, který se může nacházet v m různých stavech s různou pravděpodobností. V jistém okamžiku je systém ve stavu i s pravděpodobností x; a k přechodu z možného stavu i do stavu j dojde s pravděpodobností ř;,. Můžeme tedy proces zapsat takto: V čase n je systém popsán pravděpodobnostním vektorem (ui(n), um(n)) To znamená, že všechny komponenty vektoru x jsou reálná nezáporná čísla a jejich součet je roven jedné. Komponenty udávají rozdělení pravděpodobnosti jednotlivých možností stavů systému. Rozdělení pravděpodobností pro čas n + 1 bude dáno vynásobením pravděpodobnostní maticí přechodu T = (Mj), tj. Xn + l = T • Xn. Protože předpokládáme, že vektor x zachycuje všechny možné stavy a proto s celkovou pravděpodobností jedna 152 CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET přejde opět do některého z nich, budou všechny sloupce matice T tvořeny také pravděpodobnostními vektory. Takovému procesu říkáme (diskrétní) Markovův proces a výsledné posloupnosti vektorů x0,xi, ... říkáme Markovův řetězec xn. Všimněme si, že každý pravděpodobnostní vektor x je skutečně Markovovým procesem zobrazen na vektor se součtem souřadnic jedna: ' J j i j Nyní můžeme v plné síle použít Perronovu-Frobeniovu teorii. Protože je součet řádků matice T vždy roven vektoru (1, ..., 1), je zcela elementárně vidět, že matice T — E je singulární a jednička proto bude zaručeně vlastním číslem matice T. Pokud je navíc T primitivní matice (tj. např. když jsou všechny prvky nenulové), z Důsledku 3.20 víme, že je jednička jednoduchým kořenem charakteristického polynomu a všechny ostatní mají absolutní hodnotu ostře menší nezjedná. Theorem. Markovovy procesy s maticí, která nemá žádné nulové prvky nebo jejíž některá mocnina má tuto vlastnost, splňují: • existuje jediný vlastní vektor x ^ pro vlastní číslo 1, který je pravděpodobnostní, • iterace Tkxq se blíží k vektoru xm pro jakýkoliv počáteční pravděpodobnostní vektor xq. Proof. První tvrzení vyplývá přímo z kladnosti souřadnic vlastního vektoru dovozené v Perronově větě. Předpokládejme nejprve, že jsou algebraické a x geometrické násobnosti vlastních čísel matice T ste-i'J 1 jné. Pak každý pravděpodobnostní vektor x0 můžeme (v komplexním rzšíření C") napsat jako lineární kombinaci XQ = CiXqo + c2u2 H-----h cnun, kde u2... ,un doplňují x^ na bázi z vlastních vektorů. Pak ovšem /c-násobná iterace dává opět pravděpodobnostní vektor Xk T ■ xo = ciXoo + X2c2u2 H-----\-Xnc„u„. Protože jsou všechna vlastní čísla X2, ■ ■ ■ X„ v absolutní hodnotě ostře menší nezjedná, všechny komponenty vektoru xk, kromě té první, se velmi rychle blíží v normě k nule. Přitom ale je stále xk pravděpodobnostní, takže musí být ci = 1 a druhé tvrzení máme ověřeno. Ve skutečnosti ale i při různé algebraické a geometrické násobnosti vlastních čísel dojdeme ke stejnému závěru pomocí podrobnějšího studia tzv. kořenových podprostorů pro matici T, ke kterým se dostaneme v souvislosti s tzv. Jordánovým rozkladem matic ještě v této kapitole, viz poznámka 3.33. a to 1). Není obtížné si uvědomit, že mocniny permutační matice jsou opět permutační matice. Matice E proto také není primitivní. To lze rovněž ověřit výpočtem mocnin E2, E3, E4. Matice E4 je totiž jednotková. □ Nyní uveďme poněkud obsáhlejší model. 3.23. Model šíření jednoletých bylin. Budeme uvažovat rostliny, které na začátku léta vykvetou, na jeho vrcholu vyprodukují semena a samy uhynou. Některá ze semen vyklíčí ještě na konci podzimu (ozimé rostliny), jiná přečkají zimu v zemi a vyklíčí na začátku jara (jarní rostliny). Ozimé rostlinky (sazenice), které přes zimu nezmrz- nou, jsou na jaře větší než jarní a většinou z nich vyrostou větší rostliny než z jarních sazenic. Větší rostlina vyprodukuje více semen. Pak se celý vegetační cyklus opakuje. Rok je tedy rozdělen na čtyři vegetační období a v každém z těchto období můžeme rozlišit několik "forem" rostliny: Období stadia rostliny začátek jara začátek léta vrcholné léto podzim malé a velké sazenice malé, střední a velké kvetoucí rostliny semena sazenice a prezimuj ící semena Označme xi(t), resp. x2(t), počet malých, resp. velkých, sazenic na začátku jara roku t a yi (ŕ), resp. y2(t), resp. yj,(t), počet malých, resp. středních, resp. velkých rostlin v létě téhož roku. Z malých sazenic mohou vyrůst malé nebo střední rostliny, z velkých sazenic mohou vyrůst střední nebo velké rostliny. Kterákoliv ze sazenic samozřejmě může uhynout (uschnout, být spasena krávou a podobně) a nevyroste z ní nic. Označme bij pravděpodobnost, že ze sazenice 7-té velikosti, 7 = 1,2, vyroste rostlina i-té velikosti, / = 1,2,3. Pak je 0 < bn < 1, bn = 0, 0 < 0 < b32 < 1, bn + >2i < 1, 0 < b22 < 0, '21 < 1, b22 + b32 < 1 bsi = 0, (promyslete si, co každá z těchto nerovností vyjadřuje). Pokud pravděpodobnost považujeme za klasickou, můžeme bn vypočítat jako podíl příznivých výsledků (z malé vyrostla malá rostlina) a všech možných výsledků (počet malých sazenic), tj. bn = y\(t)/x\(t). Odtud yi{t) Analogicky dostaneme rovnost ixi(ř). y3(t) = b32x2(t). Označíme-li na chvíli y2ti(t), resp. y2t2(t) počet středních rostlin vyrostlých z malých, resp. velkých sazenic, je y2(t) = j2,i(0 + J2,2(0 a 153 C. POPULAČNÍ MODELY 3. ITEROVANÉ LINEÁRNÍ PROCESY bii = y2,i(t)/xi(t), b22 = y2,2(t)/x2(ť) a tedy y2(t) = b2lxx(t) + b22x2(t). Označíme x(t) (xx(t)\ y (t) = | y2(t) ^3(0, a předchozí rovnosti zapíšeme v maticovém tvaru y(t) = Bx(t). Označíme-li po řadě ci i, c\2 a c\3 počty semen, které vyprodukuje jedna malá, střední a veľká rostlina, a z(t) celkový počet vyprodukovaných semen v létě roku t, platí z(t) = cnyi(0 + c12y2(t) + c13y3(t), nebo v maticovém tvaru z(t) = C y (t) při označení C = (cn cn cí3) . Aby matice C popisovala modelovanou realitu, budeme předpokládat, že platí nerovnosti 0 < cn < c12 < c13. Označme nakonec w\(t) a w2(t) počet semen, které vyklíčí ještě na podzim a počet semen, která přezimují, v tomto pořadí, ad\\, resp. d2\ pravděpodobnost, že semeno vyklíčí na podzim, resp. nevyklíči (prezimuje), a f n, resp. f22 pravděpodobnost, že ozimá sazenice, resp. že přezimující semeno během zimy nezmrzne. Pravděpodobnosti vyklíčení d\\, d2\ zřejmě musí splňovat nerovnosti 0 < d\\, 0 < í/21, d\\ + d2\ = 1, a poněvadž rostlinka snáze zmrzne, než semeno ukryté v zemi, budeme o pravděpodobnostech f n, f22 přežití zimy předpokládat 0 < fll < Í22 < 1- Při označení dostaneme podobnými úvahami jako výše rovnosti w(t) = Dz(t), x(t + 1) = Fw(t). I v obecném případě totiž dostaneme k vlastnímu podprostoru (jc^) jednoznačně určený invariantní (n — 1)-rozměrný komplement, na kterém už všechna vlastní čísla jsou v absolutní hodnotě menší nezjedná a proto se příslušná komponenta v xk také bude neomezeně blížit k nule jako výše. □ 3.22. Iterace stochastických matic. Matice Markovových procesů, tj. matice jejichž všechny sloupce mají součet svých komponent roven jedné se nazývají stochastické matice. Standardní úlohy spojené s Markovovými procesy zahrnují odpovědi na otázky po očekávané střední době přechodu mezi předem určenými stavy systému apod. Momentálně nejsme na řešení vymazat příslib, 4.^ 1 4. 'i 1 v • '.' 1 1 pokud to nenastane, těchto uloh pripravení, vrátíme se ale k teto tematice později. \ nahradit odkazem Přeformulujeme předchozí větu do jednoduchého, ale asi do literatury docela překvapivého důsledku. Konvergencí k limitní matici v následujcím tvrzení myslíme skutečnost, že když si předem určíme možnou chybu e > 0, tak najdeme hranici na počet iterací k po níž už všechny komponenty uvedené matice se od té limitní budou lišit o méně než e. Corollary. Nechť T je primitivní stochastická matice z Markovova procesu a xm je stochastický vlastní vektor k dominantnímu číslu 1 jako ve větě výše. Pak iterace Tk konvergují k limitní matici T^, jejíž všechny sloupce jsou rovny im. Proof. Sloupce v matici Tk jsou obrazy vektorů standardní báze v příslušném iterovaném lineárním zobrazení. To ale jsou obrazy pravděpodobnostních vektorů a proto všechny konvergují k x^. □ Nyní se ještě na rozlučku s Markovovými procesy zamyslíme nad problémem, zda existují pro daný systém stavy, do kterých se má systém tendenci dostat a setrvat v nich. O stavu systému řekneme, že je přechodový, jestliže v něm systém setrvává s pravděpodobností ostře menší než jedna. Za absorbční označíme stav, ve kterém systém setrvává s pravděpodobností 1, a do kterého se lze dostat s nenulovou pravděpodobností z kteréhokoliv z přechodových stavů. Konečně, Markovův řetězec x„ je absorpční, jestliže jsou jeho všechny jeho stavy buď absorpční nebo přechodové. Je-li v absorpčním Markovově řetězci prvních r stavů systému absorpčních, pro stochastickou matici T systému to znamené, že se rozpadá na "blokově" horní trojúhelníkový tvar (o 2) kde E je jednotková matice, jejíž rozměr je dán počtem absorpčních stavů, zatímco R je kladná matice a Q nezáporná. V každém případě iteracemi této matice budeme pořád dostávat stejný blok nulových hodnot v levém dolním bloku a tedy 154 CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET zcela jistě nebude primitivní, např. (E R + R ■ Q\ \0 Q2 ) I o takových maticích lze získat hodně informací pomocí plné Perronovy-Frobeniovy teorie a se znalostí pravděpodobnosti a statistiky také odhadovat střední doby, po kterých se systém dostane do jednodo z abosrpčních stavů apod. 4. Více maticového počtu Na vcelku praktických příkladech jsme viděli, že porozumění vnitřní struktuře matic a jejim vlastnostem je silným nástrojem pro konkrétní výpočty nebo analýzy. Ještě více to platí pro efektivitu numerického počítání s maticemi. Proto se budeme zase chvíli věnovat abstraktní teorii. Budeme přitom zkoumat další speciální typy lineárních zobrazení na vektorových prostorech ale také obecný případ, kdy je struktura zobrazení popsána tzv. Jordánovou větou. 3.23. Unitární prostory a zobrazení. Už jsme si zvykli, že je užitečné pracovat rovnou v číselném oboru komplexních čísel a to i v případě, kdy nás zajímají jen reálné objekty. Navíc v mnohých oblastech jsou komplexní vektorové prostory nutnou součástí úvah. Jasným příkladem je například tzv. kvantové počítání, které se stalo velmi akční oblastí teoretické informatiky, přestože kvantové počítače zatím zkonstruovány ve funkční podobě nebyly. Proto navážeme na ortogonální zobrazení a matice z konce druhé kapitoly následující definicí: ______| Unitární prostory | Detinition. Unitární prostor je komplexní vektorový prostor V spolu se zobrazením V x V -» C, (u, v) h» u ■ v, které splňuje pro všechny vektory u,v,w e V a skaláry a e C (1) u ■ v = v ■ u (zde pruh značí komplexní konjugaci), (2) (au) ■ v = a(u ■ v), (3) (u + v) ■ w = u ■ w + v ■ w, (4) je-li íí / O, pak u ■ u > 0 (zejména je výraz reálný). Toto zobrazení nazýváme skalární součin na V. Reálné číslo y/v ■ v nazýváme velikostí vektoru v a vektor je normovaný, jestliže má velikost jedna. Vektory u a v nazýváme ortogonální, jestliže je jejich skalární součin nulový, bázi sestavenou z po dvou ortogonálních a normovaných vektorů nazýváme ortonormální báze V. Na první pohled jde o rozšíření definice euklidovských vektorových prostorů do komplexního oboru. Nadále budeme také používat alternativní značení (u, v) pro sklární součin vektorů u a. v. Zcela stejně jako v reálném oboru také okamžitě z definice vyplývají následující jednoduché vlastnosti skalárního součinu pro všechny vektory ve y a Poněvadž násobení matic je asociativní, můžeme pro počty jednotlivých stadií rostlin v následujícím roce z předchozích rovností sestavit rekurentní formule: x(t + 1) =Fw(t) = F(Dz(t)) = (FD)z(t) = (FD)(Cy(t)) = =(FDC)y(t) = (FDC)(Bx(t)) = (FDCB)x(t), y(t + 1) =Bx(t + 1) = B(Fw(t)) = (BF)w(t) = (BF)(Dz(i)) = =(BFD)z(t) = (BFD)(Cy(t)) = (BFDC)y(t), z(t + 1) =Cy(t + 1) = C(Bx(t + 1)) = (CB)x(t + 1) = (CB)(Fw(t =(CBF)w(t) = (CBF)(Dz(t)) = (CBFD)z(t), W(t + 1) =Dz(t + 1) = D(Cy(t + 1)) = (DC)y(t + 1) = =(DC)(Bx(t + 1)) = (DCB)x(t + 1) = (DCB)(Fw(t)) = ==(DCBF)w(t). Při označení Ax = FDCB, Ay = BFDC, Az = CBFD, Aw = DCBF, je zjednodušíme na formule x(ř+l) = Axx(t), y(ř+l) = Ayy(t), z(ř+l) = Azz(t), w(t+\) = Aw Z těchto formulí již můžeme vypočítat složení populace rostlin v libovolném období libovolného roku, pokud známe složení populace v nějakém období počátečního (nultého) roku. Nechť je například známo složení populace v létě, tj. počet z(0) vysetých semen. Pak složení populace na začátku jara ř-tého roku je x(t) = Axx(t - 1) = A2xx(t -!) = ■■ =A'-1FDz(0). Ax-lx(\) = A^FwiO) Povšimněme si, že matice Az = CBFD je typu lxl; není to tedy matice, ale skalár. Můžeme tedy označit k = Az, vypočítat (3.5) X = «™ = (c„ cn ca)(£ = = (cnbn + cnb2i cnb22 + C13632) (y^ífei) = = bucndufu + ^21^12^11/11 + ^22^12^21/22 + ^32^13^21/22 a předchozí výpočet uspořádat do výhodného tvaru x(t) = (FDCB)'-1 FDz(0) = FD(CBFD)'-zCBFDz(0) t-2. = FD(CBFD) z(0) = FZ)Apz(0) = A/"1 FZ)z(0); tímto způsobem zůstanou pouze dvě násobení matic. 155 C. POPULAČNÍ MODELY 4. VÍCE MATICOVÉHO POČTU Uvedeme konkrétní hodnoty matic B, C, D, F; jedná se o párame- skaláry v try hypotetické rostliny, které ale byly inspirovanou skutečnou trávou Vulpia ciliata: BJli mU=(i 10.00). «=(;»). 00,) u ■ u 0 0 0,2, Nyní můžeme vypočítat jednotlivé matice, které zobrazují vektor popisující složení populace v nějakém vegetačním období na vektor složení populace v temže období následujícího roku: /0,0075 0,0750 0,7500\ ar = ir;::: i av = 10,0325 0,3250 3,2500), 0,6500\ 1,3000/ 1,3325, ah ,0,0100 0,1000 1,0000/ ,0325 1,3000\ x ,0325 1,3000/ ■ Hodnota k = az = 1,3325 vyjadřuje meziroční relativní přírůstek populace. Přesvědčete se, že každá z matic ax, ay, aw má jedinou nenulovou vlastní hodnotu k = 1,3325; ostatní vlastní hodnoty jsou rovny 0. Ukážeme ještě jedno využití uvedeného modelu. Může nás zajímat, jak "pružně" reaguje meziroční relativní přírůstek k na na změnu jednotlivých "demografických parametrů", jak např. změna pravděpodobnosti přežití semene přes zimu ovlivní meziroční přírůstek. Tuto otázku poněkud upřesníme. Za pružnost reakce charakteristiky k na parametr s, označenou e (k, s) prohlásíme relativní změnu hodnoty k vztaženou k relativní změně parametru s. Ještě přesněji: označíme k(s) meziroční přírůstek závislý na parametru s. Potom Ak(s) = k(s + As) — k(s) vyjadřuje absolutní změnu relativního přírůstku k při absolutní změně parametru s o As. Relativní změna k tedy je Ak(s)/k(s). Relativní změna přírůstku parametru s je As/s. Hledaná pružnost je tedy podíl těchto relativních změn, tj. Ak(s)/k(s) s k(s + As) - k(s) e(k, s) = - =--. As/s k(s) As Konkrétně, meziroční relativní přírůstek populace závislý na přežití semen přes zimuje podle (||3.5||) M/22) = d2i(b22Ci2 + b32cn) f22 + dn(bncn fn +621^12/11) a pro konkrétní zvolené hodnoty ostatních parametrů M/22) = 13/22 + 0,0325. Poněvadž /22 = 0,1, můžeme počítat A(0,1) = 1,3325, A(0,l+As) = l,3325+13As, AA(0,1) = \3As, takže 0,1 \3As e(K 0,1) = , —— = 0,976 U ■ U € K 0 právě tehdy, když u ■ (av) = á(u ■ v) u ■ (v + w) = u ■ v + u ■ w u ■ 0 = 0 • u = 0 ^aibj(Ui ■ v j), i j i J kde poslední rovnost platí pro všechny konečné lineární kombinace. Podrobné ověření je skutečně jednoduchým cvičením, např. první vztah plyne okamžitě z definiční vlastnosti (1). Standardním příkladem skalárního součinu na komplexním vektorovém prostoru C" je (xu ...,x„)T ■ (ji, ...,xn)T =x1ý1 H-----\-xnýn. Díky konjugování souřadnic druhého argumentu toto zobrazení splňuje všechny požadované vlastnosti. Prostor C" s tímto skalárním součinem budeme nazývat standardní unitární prostor v dimenzi n. Maticově můžeme tento skalární součin psát jako x ■ y = ýT - x. Zcela obdobně jako u euklidovských prostorů a ortogonálních zobrazení budou důležitá lineární zobrazení, která respektují skalární součiny. I Unitární zobrazení | Lineární zobrazení

W mezi unitárními prostory se nazývá unitární zobrazení, jestliže pro všechny vektory u, v e V platí u ■ v = cp(u) ■ (p(v). Unitární isomorfismus je bijektivní unitární zobrazení. 1,3325 As 3.24. Vlastnosti prostorů se skalárním součinem. Ve stručné diskusi euklidovských prostorů v předchozí kapitole jsme už některé jednoduché vlastnosti prostorů se skalárním součinem odvodili, důkazy v komplexním oboru jsou velmi podobné. V dalším budeme pracovat s reálnými i komplexními prostory zároveň a budeme psát K pro M nebo C, v reálném případě je konjugace prostě identické zobrazení (tak jak skutečně zúžení konjugace na reálnou přímku v komplexní rovině je). Stejně jako u reálných prostorů definujeme obecně pro libovolný vektorový podprostor U C V v prostoru se skalárním součinem jeho ortogonální doplněk U~L = {v € V; u ■ v = 0 pro všechny u e U}, což je zjevně také vektorový podprostor ve V. Budeme v dalších odstavcích pracovat výhradně s konečněrozměrnými unitárními nebo euklidovskými prostory. Řada našich výsledků ale má přirozené rozšíření pro tzv. Hilbertovy prostory, což jsou jisté nekonečněrozměrné 156 CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET prostory se skalárním součinem, ke kterým se aspoň stručně vrátíme později. Proposition. Pro každý konečněrozměrný prostor V dimenze n se skalárním součinem platí: (1) Ve V existuje ortonormální báze. (2) Každý systém nenulových ortogonálních vektorů ve V je lineárně nezávislý a lze jej doplnit do ortogonální báze. (3) Pro každý systém lineárně nezávislých vektorů (iii, ..., iik) existuje ortonormální báze (vi,...,v„) taková, že její vektory postupně generují stejné podpros-tory jako vektory uj, tzn. (v\, ..., Ví) = (u\ ..., Uj), 1 < i < k. (4) Je-li (u\, ..., u„) ortonormální báze V, pak souřadnice každého vektoru u e V jsou vyjádřeny vztahem u = (u ■ +••• + («• un)u„. (5) V libovolné ortonormální bázi má skalární součin souřadný tvar u ■ v = x ■ y = xxýx H-----h xnýn kde x a y jsou sloupce souřadnic vektorů u a v ve zvolené bázi. Zejména je tedy každý n—rozměrný prostor se skalárním součinem izomorfní standardnímu euklidovskému W nebo unitárnímu C". (6) Ortogonální součet unitárních podprostorů V\ +■ ■ ■ + Vt ve V je vždy přímý součet. (7) Je-li A C V libovolná podmnožina, pak A1- C V je vektorový (tedy i unitární) podprostor a (A-1)1- C V je právě podprostor generovaný A. Navíc platí V = (A) © A\ (8) V je ortogonálním součtem n jednorozměrných unitárních podprostorů. Proof. (1), (2), (3): Daný systém vektorů nejprve doplníme do libovolné báze (u\, ..., un) prostoru V a spustíme na ni Grammovu-Schmidtovu *ft ortogonalizaci z 2.42. Tak získáme ortogonální ě§r*.^^SjÄ bázi s vlastnostmi požadovanými v (3). Přitom ale z algoritmu Grammovy-Schmidtovy ortogonalizace vyplývá, že pokud již původních k vektorů tvořilo ortogonální systém vektorů, pak v průběhu ortogonalizace zůstanou nezměněny. Dokázali jsme tedy zároveň i (2) a (1). (4) : Je-li u = cl\U\ + • • • + a„u„, pak u ■ Ui = ai(ui ■ u i) H-----\-a„(u„ ■ u i) = aŕ|l"i II2 = ai (5) : Podobně spočteme pro libovolné vektory u = x\U\ + ----h x„u„, v = yiui H-----h ynun u ■ v = (xiui H-----h x„u„) ■ (yi«i H-----h y„u„) = xiýi H-----Yxnýn. (6) : Potřebujeme ukázat, že pro libovolnou dvojici Ví, V) ze zadaných podprostorů je jejich průnik triviální. Je-li však m € Ví a zároveň u e V), pak je u _L u, tj. u ■ u = 0. To je ale možné pouze pro nulový vektor u e V. Analogicky můžeme spočítat pružnost reakce relativního přírůstku X populace na ostatních "demografických parametrech". Výsledky jsou shrnuty v tabulce parametr pružnost reakce parametr pružnost reakce bn 0,006 Cil 0,006 bn 0,019 C\l 0,244 bn 0,225 Cl3 0,751 t>23 0,750 f U 0,024 dn 0,024 fn 0,976 0,976 Z ní můžeme vidět, že přírůstek k je nejvíce ovlivňován množstvím přezimujících semen (parametr d2i) a jejich přežíváním (parametr f22). Toto zjištění není nijak překvapivé, zemědělcům je tento fakt dobře známý již od neolitu. Výsledek však ukazuje, že matematický model skutečně nějak adekvátně realitu popisuje. Další zajímavé a detailně popsané modely růstu nalezne čtenář v souboru příkladů za touto kapitolou. 3.24. Uvažujte následující Leslieho model: farmář chová ovce. Porodnost ovcí je dána pouze věkem a je průměrně 2 ovce na jednu ovci mezi jedním a dvěma lety věku, pět ovcí na ovci mezi dvěma a třemi lety věku a dvě ovce na ovci mezi třemi a čtyřmi roky věku. Ovce do jednoho roku nerodí. Z roku na rok umře vždy polovina ovcí a to rovnoměrně ve všech věkových skupinách. Po čtyřech letech posílá farmář ovce na jatka. Farmář by rád ještě prodával (živá) jehňátka do jednoho roku na kožešinu. Jakou část jehňátek může každý rok prodat, aby mu velikost stáda zůstávala z roku na rok stejná? V jakém poměru budou potom rozděleny počty ovcí v jednotlivých věkových skupinách? Solution. Matice daného modelu (bez zásahu farmáře) je /0 2 5 2\ _ I \ 0 0 0 0 \ 0 0 \0 0 \ OJ Farmář může ovlivnit kolik ovcí do jednoho roku mu ve stádu zůstane do dalšího roku, může tedy ovlivnit prvek Z12 matice L. Zkoumáme, tedy model 2 0 /o a 0 5 2\ 0 0 ±00 Vo o i o/ a hledáme a tak, aby daná matice měla vlastní hodnotu 1 (víme, že má pouze jednu reálnou kladnou). Charakteristický polynom této matice je X - 2alř -aX 1 -a, 157 D. MARKOVOVY PROCESY 4. VÍCE MATICOVÉHO POČTU požadujeme-li, aby měl kořen 1, musí být a = \ (dosadíme za k číslo 1 a položíme rovno nule). Farmár tedy může prodat 1 _ I 2 5 10 ovci, které se mu v daný rok narodí. Odpovídající vlastní vektor k vlastnímu číslu 1 dané matice je (20, 4, 2, 1) a v těchto poměrech se taky ustálí populace ovcí. □ 3.25. Uvažujme Leslieho model růstu pro populaci krys, které máme rozděleny do tří věkových skupin: do jednoho roku, od jednoho do dvou let a od dvou let do tří. Předpokládáme, že se žádná krysa ne-dožívá více než tří let. Průměrná porodnost v jednotlivých věkových skupinách připadajících na jednu krysu je následující: v 1.skupině je to nula a ve druhé i třetí 2 krysy. Krysy, které se dožijí jednoho roku umírají až po druhém roce života (úmrtnost ve druhé skupině je nulová). Určete úmrtnost v první skupině víte-li, že daná populace krys stagnuje (počet jedinců v ní se nemění). D. Markovovy procesy 3.26. Mlsný hazardér. Hazardní hráč sází na to, která strana mince padne. Na začátku hry má tři kremrole. Na každý hod vsadí jednu kremroli a když jeho tip vyjde, tak k ní získá jednu navíc, pokud ne, tak kremroli prohrává. Hra končí, pokud všechny kremrole prohraje, nebo jich získá pět. Jaká je pravděpodobnost, že hra neskončí po čtyřech sázkách? Solution. Před 7-tým kolem (sázkou) můžeme popsat stav, ve kterém se hráč nachází náhodným vektorem Xj = (Mí), PiU), Pid), PsU), PaU), PÁD), kde pi je pravděpodobnost, že hráč má i kremroli. Pokud má hráč před 7-tou sázkou i kremroli (i=2,3,4), tak po sázce má s poloviční pravděpodobností (i — 1) kremroli a s poloviční pravděpodobností (i + 1) kremroli. Pokud dosáhne pěti kremroli nebo všechny prohraje už se počet kremroli nemění. Vektor Xj+\ tak získáme podle podmínek v přiklání z Xj vynásobením maticí /l 0,5 0 0 0 0 0 0,5 0 0 0 0 0,5 0 0,5 0 0 0 0 0,5 0 0,5 0 0 0 0 0,5 0 0 0 0 0 0,5 v Na začátku máme X, M o 0 1 o W (7) : Nechť u,v e A^. Pak (au + b v) ■ w = 0 pro všechny w e A, a, b e K (z distributivity skalárního součinu). Tím jsme ověřili, že A1- je unitární podprostor ve V. Nechť (vi, ..., vk) je nějaká báze (A), vybraná z prvků A, («1,..., uk) ortonormální báze vzniklá z Grammovy-Schmidtovy ortogonalizace vektorů (v\, ..., vk). Doplňme ji na ortonormální bázi celého V (obojí existuje podle již dokázaných částí věty). Protože se jedná o ortogonální bázi, je nutně (uk+i, ..., un) = (u\, ..., w^)1" = A1- a A c (uk+i, ..., u,,)1- (jak plyne z vyjádření souřadnic v ortonormální bázi). Je-li u _L (uk+i, ..., u„), pak u je nutně lineární kombinací vektorů u \, ... ,uk, to je ale právě tehdy, když je lineární kombinací vektorů v\, ..., vk, což je ekvivalentní příslušnosti u do (A). (8) : Je pouze ekvivalentní formulaci existence ortonormální báze. □ 3.25. Důležité vlastnosti velikosti. Nyní máme vše připraveno pro základní vlastnosti spojené s naší definicí velikostí vektorů. Hovoříme také o normě definované skalárním součinem. Všimněme si také, že všechna tvrzení se týkají vždy konečných množin vektorů a jejich platnost proto nezávisí na dimenzi prostoru V, ve kterém se vše odehrává. Theorem. Pro libovolné vektory u,v v prostoru V se skalárním součinem platí (1) Hw + v\\ < IIuII + IIvII, přitom rovnost nastane, právě když jsou u a v lineárně závislé. (trojúhelníková nerovnost) (2) \u ■ v\ < IIm II ||u||, přitom rovnost nastane, právě když jsou u a v lineárně závislé. (Cauchyova nerovnost) (3) Pro každý ortonormální systém vektorů (e\, ..., ek) platí |2 NI2 > \u-ei\2 + + \u ■ ek\ (Besselova nerovnost). (4) Pro ortonormální systém vektorů (e\, ..., ek) patří vektor u do podprostoru e (e\, ..., ek) právě když INI2 = \u ■el\2 + --- + \u -ek\2. (Parsevalova rovnost) (5) Pro ortonormální systém vektorů (e\, ..., ek) a vektor u e V je vektor w = (u ■ \u ■ v\2 a rovnost nastane právě tehdy, když w = 0, tj. když jsou uav lineárně závislé. (1): Opět stačí počítat ||w + i;||2 = \\u\\2 + \\v\\2 + u ■ v + v ■ u = ||K||2 + ||u||2 + 2Re(M-u) < ||M||2 + ||i;||2+2|M.i;| < ||M||2 + ||u||2 + 2||M||||i;| = (II"II + NI)2 Protože se přitom jedná o kladná reálná čísla, je opravdu || u + v || < || m || + || ľ ||. Navíc, při rovnosti musí nastat rovnost ve všech předchozích nerovnostech, to však je ekvivalentní podmínce, že u a v jsou lineárně závislé (podle předchozí části důkazu). (3), (4): Nechť (e\, ..., ek) je ortonormální systém vektorů. Doplníme jej do ortonormální báze (e\, ..., e„) (to vždy jde podle předchozí věty). Pak, opět podle předchozí věty, je pro každý vektor u e V n n k II"II2 = ^(u ■ ediU—ě-) = Jjw -ei\2 > Jjw -ei\2 i — l i — l i — l To je ale právě dokazovaná Besselova nerovnost. Přitom rovnost může nastat právě tehdy, když u ■ =0 pro všechny i > k, a to dokazuje Parsevalovu rovnost. (5): Zvolme libovolný v e {e\, ..., ek) a doplňme daný ortonormální systém na ortonormální bázi (e\,...,en). Nechť («1,..., un) a (jci, ..., jet, 0, ..., 0) jsou souřadnice u a v y této bázi. Pak ||M-i;||2 = \Ul-Xl\2-\-----|_|Mí,_Xí,|2_|_|Mí_+1|2_|-----|_|Mj2 a tento výraz je zjevně minimalizován při volbě jednotlivých vektorů x\ = u\, ..., xk = uk. □ 3.26. Vlastnosti unitárních zobrazení. Vlastnosti ortogonálních zobrazení mají přímočarou obdobu v komplexním oboru. Můžeme je snadno ' -~' . -: zformulovat a dokázat společně: Proposition. Uvažme lineární zobrazení (endomorfismus) cp : V —> V na prostoru se skalárním součinem. Pak jsou následující podmínky ekvivalentní: (1) cp je unitární nebo ortogonální transformace (2) cp je lineární isomorfismus a pro každé u, v e V platí cp(u) ■ v = u ■ (p~l (v) (3) matice A zobrazení cp v libovolné ortonormální bázi splňuje A~l = AT (pro euklidovské prostory to znamená A~l = AT) (4) matice A zobrazení cp v některé ortonormální bázi splňuje A~l = AT (5) řádky matice A zobrazení cp v ortonormální bázi tvoří ortonormální bázi prostoru W se standardním skalárním součinem po čtyřech sázkách bude situaci popisovat náhodný vektor A4X, 3_ 16 0 _5_ 16 0 w tedy pravděpodobnost, že hra skončí do čtvté sázky (včetně) je polovina. Všimněme si ještě, že matice A popisující vývoj pravděpodobnostního vektoru X je pravděpodobnostní, tedy má součet prvků v každém sloupci 1. Nemá ale vlastnost vyžadovanou v Perronově-Frobeniově větě a snadným výpočtem zjistíte (nebo přímo uvidíte bez počítání), že existují dva lineárně nezávislé vlastní vektory příslušné k vlastnímu číslu 1 - případ, kdy hráči nezůstane žádná krémrole, tj. x = (1, 0, 0, 0, 0, 0)T, nebo případ kdy získá 5 krémrolí a hra tím pádem končí a všechny mu už zůstávají, tj. x = (0, 0, 0, 0, 0, 1)T. Všechna ostatní vlastní čísla (přibližně 0, 8, 0, 3, —0, 8, —0, 3) jsou v absolutní hodnotě ostře menší nezjedná. Proto komponenty v příslušných vlastních podprostorech při iteraci procesu s libovolnou počáteční hodnotou vymizí a proces se blíží k limitní hodnotě pravděpodobnostího vektoru tvaru (a, 0, 0, 0, 0, l—a), kde hodnota a závisí na počtu krémrolí, se kterými hráč začíná. V našem případě je to a = 0, 4, kdyby začal se 4 krémrolemi, bylo by to a = 0, 2 atd. □ 3.27. Na základě teploty ve 14.00 se rozdělují dny na teplé, průměrné a chladné. Dle celoročních statistik následuje po teplém dni teplý v polovině případů a průměrný ve 30 % případů, po průměrném dnu průměrný ve 40 % případů a chladný ve 30 % případů, po chladném dnu chladný v polovině případů a ve 30 % případů průměrný. Bez dalších informací zjistěte, kolik lze během roku očekávat teplých, průměrných a chladných dnů. Solution. Pro každý den musí nastav právě jeden ze stavů „teplý den", „průměrný den", „chladný den". Pokud vektor x„ má za složky pravděpodobnosti toho, že jistý (označený jako n-tý) den bude teplý, průměrný, chladný (při zachování pořadí), potom složky vektoru /0,5 0,3 0,2\ xn+l = j 0, 3 0, 4 0, 3 • x„ \0,2 0,3 0,5/ udávají postupně pravděpodobnosti, že následující den bude teplý, průměrný, chladný. Pro ověření stačí dosadit 159 D. MARKOVOVY PROCESY 4. VÍCE MATICOVÉHO POČTU přičemž např. pro třetí volbu musíme dostat pravděpodobnosti, že po chladném dnu bude následovat teplý, průměrný, chladný (v tomto pořadí). Vidíme tak, že úloha je Markovovým řetězcem s pravděpodobnostní maticí přechodu /0,5 0,3 0,2\ T = I 0, 3 0, 4 0, 3 ] . \0,2 0,3 0,5/ Neboť jsou všechny prvky této matice kladné, existuje pravděpodobnostní vektor X0O = {Xoo> xoo' xoo) ' k němuž se blíží vektor x„ pro zvětšující se n nezávisle na tom, jaký byl vektor xn pro mnohem menší n. Navíc podle důsledku Perronovy-Frobeniovy věty je x^ vlastním vektorem matice T pro vlastní číslo 1. Má tedy platit 4 = 0,5*^ + + 0,2x1 4 = 0,3*^ + 0,44 + 0,3x1 4 = 0,2x1 + 0,3^ + 0,5x1 i = 4 + x2 xoo + x3 xoo kde poslední podmínka znamená, že vektor x^ je pravděpodobnostní. Snadno se vypočítá, že tato soustava má jediné řešení 1 _ 2 _ 3 _ 1 Lze tedy očekávat přibližně stejný počet teplých, průměrných a chladných dnů. Zdůrazněme, že součet všech čísel z libovolného sloupce matice T musel být roven 1 (jinak by se nejednalo o Markovův proces). Protože TT = T (matice je symetrická), je součet všech čísel z libovolného řádku matice také roven 1. O matici s nezápornými prvky a s vlastností, že součet čísel v každém řádku a rovněž součet čísel v každém sloupci je 1, mluvíme jako o dvojnásobně (dvojitě, dvojně) stochastické. Důležitou vlastností každé dvojnásobně stochastické primitivní matice (pro jakýkoli rozměr - počet stavů) je, že jí příslušný vektor x^ má všechny složky stejné, tj. po dostatečně dlouhé době vyhodnocování se všechny stavy v odpovídajícím Markovově procesu jeví jako stejně časté. □ 3.28. Půjčovna aut. Firma půjčující každý týden auta má dvě pobočky - jednu v Brně a jednu v Praze. Auto zapůjčené v Brně lze vrátit i v Praze a naopak. Po čase se zjistilo, že na konci týdne je vždy v Praze vráceno zhruba 80 % z aut vypůjčených v Praze a 90 % z aut vypůjčených v Brně. Jak je potřeba rozdělit auta mezi pobočky, aby na obou byl na začátku týdne vždy stejný počet aut jako předchozí týden? (6) sloupce matice A zobrazení cp v ortonormální bázi tvoří ortonormální bázi prostoru W se standardním skalárním součinem Proof. (1) =)- (2): Zobrazení^ je prosté, proto musí být i na. Platí přitom cp(u) ■ v = cp(u) ■ cp(cp~l (v)) = u ■ cp~l (v). (2) =)- (3): Standardní skalární součin je v K" vždy dán pro sloupce x, y skalárů výrazem x ■ y = xT Eý, kde E je jednotková matice. Vlastnost (2) tedy znamená, že matice A zobrazení cp je invertibilní a platí (Ax)Tý = xT A~ly. To znamená xT (ÄTy — A~ly) = 0 pro všechny x e K". Zejména dosazením výrazu v závorce za x zjistíme, že to je možné pouze při A1 = A~l. (3) •<=>- (4): Je-li A1 = A~l v některé ortonormální bázi, pak to zaručuje platnost podmínky (2) (cp(u) ■ v = (Ax)TEý = xT EA~ly = u ■ cp~l (v)) a tedy i (3). (4) =)- (5) Dokazované tvrzení je vyjádřeno prostřednictvím matice A zobrazení cp vztahem AÄT = Ti, to je ale zaručeno podmínkou (4). (5) =)- (6): Protože pro determinant platí \ÄT A\ = \E\ = \AAT\ = \A\\A\ = 1, existuje inverzní matice A-1. Přitom je AAT A = A, proto i AT A = E což vyjadřuje právě (6). (6) =)- (1): Ve vybrané ortonormální bázi je cp(u) ■ cpiv) = iAx)TiAy) = xATÄý = xT Ěý = xT ý kde x a y jsou sloupce souřadnic vektorů u a. v. Tím je zaručeno zachovávání skalárního součinu. □ Charakterizace z předchozí věty si zaslouží několik fpoznámek. Matice A e Mat„(K) s vlastností A-1 = A1 se nazývají unitární matice pro kom-" plexní skaláry (a v případě M jsme jim již říkali ortogonální matice). Z definiční vlastnosti plyne, že součin unitárních (resp. ortogonálních) matic je unitární (resp. ortogonální), stejně pro inverze. Unitární matice tedy tvoří podgrupu U in) c Gl„ (C) v grupě všech invertibilních komplexních matic s operací součinu. Ortogonální matice tvoří podgrupu Oin) c G1„(M) v grupě reálných invert-ibilných matic. Hovoříme o unitární grupě a o ortogonální grupě. Jednoduchý výpočet 1 = det£ = det(AÄr) =detAďětA = | det A|2 ukazuje, že determinant unitární matice má vždy velikost rovnu jedné, v případě reálných skalárů pak determinant musí být ±1. Dále, je-li Ax = kx pro unitární či ortogonální matici, pak (Ax) • (Ax) = x • x = |A|2(x • x). Proto jsou reálné vlastní hodnoty ortogonálních matic v reálném oboru rovny ±1, vlastní hodnoty unitárních matic jsou vždy komplexní jednotky v komplexní rovině. Stejně jako u ortogonálních zobrazení také docela snadno ověříme, že ortogonální doplňky k invariantním podprostorům vzhledem k unitárnímu cp : V -> y jsou vždy také invariatní. Skutečně, je-li cpiU) cU,ueUa.ve U1- 160 CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET libovolné, pak (piv) -(p((p~\u)) = v -(p~\u). Protože je zúžení (p\V také unitární, musí to tedy být bijekce, zejména je (p~l (u) e U. Pak ovšem (p(v) ■ u = 0, protože v e U-1. To znamená, že i (p(v) e U^. Odtud ovšem v komplexním oboru okamžitě dotáváme užitečný Corollary. Nechť (p : V -» V je unitární zobrazení komplexních vektorových prostorů. Pak je V ortogonálním součtem jednorozměrných vlastních podprostorů. Proof. Jistě existuje alespoň jeden vlastní vektor v e V. Pak je zúžení (p na invariantní podprostor (v)1- opět unitární a jistě má opět nějaký vlastní vektor. Po n takovýchto krocích obdržíme hledanou ortogonální bázi z vlastních vektorů. Po vynormování vektorů získáme ortonormální bázi. □ Nyní už je možné snadno pochopit detaily důkazu spektrálního rozkladu ortogonálního zobrazení z 2.50 na konci druhé kapitoly — reálnou matici ortogonálního zobrazení interpretujeme jako matici unitárního zobrazení na komplexním rozšíření euklidovského prostoru a pečlivě sledujeme důsledky struktury kořenů reálného charakteristického polynomu nad komplexním oborem. Automaticky přitom dostáváme invariantní dvourozměrné podprostory zadané dvojicemi komplexně sdružených vlastních čísel a tedy příslušné rotace pro zúžené původní reálné zobrazení. 3.27. Duální a adjungovaná zobrazení. Při diskusi vek-J< ,. torových prostorů a lineárních zobrazení jsme již ve druhé kapitole letmo zmínili duální vektorový prostor V* všech lineárních forem na vektorovém ifi1 prosotru V, viz 2.39. Pro každé lineární zobrazení mezi vektorovými prostory Ý '■ V -» W můžeme přirozeně definovat jeho duální zobrazení ý* '■ W* -» V* vztahem (3.6) (v, Ý* i01)) = {ý(v), kde ( , ) značí vyčíslení formy (druhý argument) na vektoru (první argument), v e V a a e W* jsou libovolné. Zvolme si báze v na V, w na W a pišme A pro matici zobrazení ý v těchto bazích. Pak snadno spočteme v duálních bazích matici zobrazení ý* v příslušných duálních bazí na duálních prostorech. Skutečně, definiční vztah říká, že pokud bychom reprezentovali vektory z W* v souřadnicích jako řádky skalárů, pak je zobrazení ý* je dáno toutéž maticí jako ý, pokud jí násobíme řádkové vektory zprava: M (Ý(v), a) = (ai, - - -, ct„) ■ A {v, (a)). Jak bude vypadat situace po jisté dlouhé době, pokud jsou auta mezi pobočky na začátečátku náhodně rozdělena? Solution. Hledaný začáteční počet aut v Brně označme iBav Praze xP. Stav rozmístění aut mezi pobočkami je tedy popsán vektorem x = ( Xb ). Uvážíme-li takový násobek vektoru x, že součet jeho \xpj složek je 1, pak dávají jeho složky procentuální rozmístění aut. Na konci týdne bude podle zadání stav popsán vektorem /O, 1 0,2\ (xB\ AJ ^ . /O, 1 0,2\ (o, 9 0,8JUl = V>, 9 0,8 j tedy P°piSUje náš (lineární) systém půjčování aut. Pokud má být na konci týdne v pobočkách stejně aut jako na začátku, pak hledáme takový vektor x, pro který platí Ax = x. To znamená, že hledáme vlastní vektor matice A příslušný vlastnímu číslu 1. Charakteristický polynom matice A je (0, 1—A)(0, 8—A)—0, 9.0, 2 = (k — l)(k + 0,1) a 1 je tedy opravdu vlastní hodnota matice A. Příslušný vlastní vektor x = \ B\ splňuje rovnici \xpj ( 0^9^ ^0^2^ O'5) = ^ ^ t0 teC^ n^so^e^ vektoru Pro zjištění procentuálního rozložení hledáme takový násobek, aby xB + xP = 1. To splňuje vektor jj ^ = Správné rozložení aut mezi Brnem a Prahou je takové, že 18% aut bude v Brně a 82% aut v Praze. Pokud zvolíme libovolný počáteční stav x = ( %B ), pak bude stav za n týdnů popsán vektorem x„ = A"x. Nyní je výhodné vyjádřit počáteční vektor x v bázi vlastních vektorů matice A. Vlastní vektor k vlastnímu číslu 1 už jsme našli a podobně se nalezne vlastní vektor k vlastnímu číslu —0, 1. Tím je například vektor ^ Počáteční vektor tedy můžeme vyjádřit jako lineární kombinaci x = a + b ^ Stav po n týdnech je pak >ruhý sčítE /0,18\ vo, 82/' Druhý sčítanec se pro n —> oo blíží nule a proto se stav ustálí na tedy složce počátečního vektoru ve směru prvního vlastního vektoru. Koeficient a lze jednoduše vyjádřit pomocí počátečních počtů aut: a = ^±ňJL_ □ To znamená, že maticí duálního zobrazení ý* je transponovaná matice AT, protože a ■ A = (AT ■ aT)T. 3.29. Sledovanost televizí. V jisté zemi vysílají jisté dvě televizní stanice. Z veřejného výzkumu vyplynulo, že po jednom roce přejde 1 /6 diváků první stanice ke druhé stanici, 1 /5 diváků druhé stanice přejde k první stanici. Popište časový vývoj počtu diváků sledujících dané stanice jako Markovův proces, napište jeho matici, nalezněte její vlastní čísla a vlastní vektory. 161 D. MARKOVOVY PROCESY 4. VÍCE MATICOVÉHO POČTU 3.30. Studenti na přednášce. Studenty můžeme rozdělit řekněme do tří skupin - na ty, co jsou přítomni na přednášce a vnímají, na ty, co jsou rovněž přítomni, ale nevnímají a na ty, co sedí místo přednášky v hospodě. Nyní budeme hodinu po hodině sledovat, jak se mění počty studentů v těchto skupinách. Základem je vypozorovat, jaké jsou jednotlivé pravděpodobnosti změn stavu studenta. Dejme tomu, že by to mohlo být následovně: Student, který vnímá: s pravděpodobností 50% zůstane vnímat, 40% přestane vnímat a 10% odejde do hospody. Student, který je na přednášce a nevnímá: začne vnímat s pravděpodobností 10%, zůstane ve stejném stavu 50%, odejde do hospody 40%. Student, který sedí v hospodě má nulovou pravděpodobnost, že se vrátí na přednášku. Jak se bude tento model vyvíjet v čase? Jak se situace změní, pokud budeme předpokládat aspoň desetiprocentní pravděpodobnost toho, že se student vrátí z hospody na přednášku (tu ovšem samozřejmě nevnímá)? Solution. Ze zadání se jedná o Markovovův proces s mat-/0,5 0,1 0\ icí I 0,4 0,5 0 1. Její charakteristický polynom je \0, 1 0,4 1/ (0,5 - A)2(l — A) — 0,4(1 - A) 0. Evidentně je tedy 1 vlastní číslo této matice (další kořeny jsou pak 0,3 a 0,7). Postupem času se tedy studenti rozdělí do skupin tak, že stav bude popsán příslušným vlastním vektorem. Ten je řešením rovnice -0,5 0,1 0\ M 0, 4 —0, 5 0 } j y j = 0, což jsou právě násobky vektoru 0, 1 0,4 0/ \zj (0.0.1). Jinými slovy, všichni studenti po čase skončí v hospodě. Tento výsledek je zřejmý i bez počítání - tím, že je nulová pravděpodopnost odchodu studenta do školy, se budou studenti postupně hromadit v hospodě. Přidáním desetiprocentní možnosti odchodu studenta do školy se toto změní. Příslušná matice bude /0, 5 0, 1 0 \ 0, 4 0, 5 0, 1 ]. Opět platí, že se stav usáli na vlastním vektoru v0, 1 0,4 0,9/ příslušnému vlastnímu číslu 1. Ten je v tomto případě řešením rovnice -0,5 0, 1 0 \ lx\ 0, 4 -0, 5 0, 1 ] ( y \ = 0. 0, 1 0,4 -0, 1/ \zj Řešením je například vektor (1, 5, 21). Poměrné rozložení studentů v jednotlivých skupinách pak dá násobek tohoto vektoru, který má součet složek roven 1, tj. vektor (j=, j=, ^). Opět tedy většina stu- -27' 27' 27^ dentů skončí v hospodě, někteří ale ve škole budou. □ 3.31. Ruleta. Hráč rulety má následující strategii: přišel hrát se 100 Kč. Vždy všechno, co aktuálně má. Sází vždy na černou (v ruletě je 37 Předpokládejme nadále, že se pohybujeme ve vektorovém prostoru se skalárním součinem. Jestliže tedy zvolíme pevně jeden vektor v € V, dosazování vektorů za druhý argument ve skalárním součinu nám dává zobrazení V -» V* = Hom(V, K) V b v i-» (w i-» (v, w) e K). Podmínka nedegenerovanosti skalárního součinu nám zaručuje, že toto zobrazení je bijekcí. Zároveň víme, že jde skutečně o lineární zobrazení nad komplexními nebo reálnými skaláry, protože jsme pevně zvolili druhý argument. Na první pohled je vidět, že vektory ortonormální báze jsou takto zobrazeny na formy tvořící bázi duální, a každý vektor můžeme prostřednictvím skalárního součinu chápat také jako lineární formu. V případě vektorových prostorů se skalárním součinem proto převádí naše ztotožnění vektorového prostoru se svým duálem také duální zobrazení ý* na zobrazení ý* : W -» V zadané formulí (3.7) (ý(u), v) = (u, \j/*(v)), kde stejným značením závorek jako v definičním vztahu (3.6) nyní myslíme skalární součin. Tomuto zobrazení se říká adjungované zobrazení k \jr. Ekvivalentně lze brát vztah (3.27) za definici adjungo-vaného zobrazení ý* , např. dosazením všech dvojic vektorů ortonormální báze za vektory u a. v dostáváme přímo všechny hodnoty matice zobrazení ý*. Předchozí výpočet pro duální zobrazení v souřadnicích nyní můžeme zopakovat, pouze musíme mít na paměti, že v ortonormálních bazích na unitárních prostorech vystupují souřadnice druhého argumentu konjugované: (ý(v), w) = (wi, w„) ■ A \WnJ (v, ý* (w)) Vidíme proto, že je-li A matice zobrazení \jr v ortonormální bázi, pak matice adjungovaného zobrazení ý* je matice transponovaná a konjugovaná, kterou značíme A* = ÄT. Matici A* se říká adjungovaná matice k matici A. Všimněme si, že adjungované matice jsou dobře definované pro jakékoliv obdélníkové matice a nepleťme šije s maticemi algebraicky adjungovanými, které jsme u čtvercových matic používali při úvahách o determinantech. Můžeme si tedy shrnout, že má-li jakékoliv lineární zobrazení ý '■ V W mezi unitárními prostory v ortonormálních bazích matici A, bude mít jeho duální zobrazení 162 CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET v bazích duálních matici AT. Pokud přitom zotožníme pomocí skalárního součinu vektorové prostory s jejich duálními prostory, pak nám duální zobrazení představuje adjungované zobrazení ý* : W -» V (které je zvykem značit stejně jako to zobrazení duální), které ale má matici A*. Rozdíl mezi maticemi duálního a adjungovaného zobrazení je tedy v dodatečné konjugaci, ta ale samozřejmě je důsledkem toho, že zotožnění unitárního prostoru s jeho duálním prostorem není komplexně lineární zobrazení (neboť z druhé pozice ve skalárním součinu se skaláry vytýkají konjugované). 3.28. Samoadjungovaná zobrazení. Zvláštním případem lineárních zobrazení jsou tedy ta, která splývají se svým adjungovaným zobrazením: ý* = f: ý. Takovým zobrazením říkáme samoadjungovaná. Ekvivalentně můžeme říci, že jsou to ta zobrazení, jejichž matice A v jedné a tedy ve všech ortonormálních bazích splňují A = A*. V případě euklidovských prostorů jsou samoadjungovaná zobrazení tedy ta, která mají v některé ortonormální bázi (a pak už všech) symetrickou matici. Často se jim proto říká symetrické matice a symetrická zobrazení. V komplexním oboru se maticím splňujícím A = A* říká hermiteovské matice. Občas se také hermiteovským maticím říká samo adjungované matice. Všimněme si, že hermiteovské matice tvoří reálný vektorový podprostor v prostoru všech komplexních matic, není však podprostorem v komplexním oboru. Remark. Obzvlášť zajímavý je v této souvislosti následující postřeh. Jestliže hermiteovskou matici A vynásobíme imaginární jednotkou, dostáváme matici B = i A, která má vlastnost B* = i AT = —B. Takovým maticím říkáme anti-hermiteovské. Tak jako je tedy každá reálná matice součtem své symetrické a antisymetrické části A = ^(A + AT)+l-(A-AT), je v komplexním oboru obdobně A = I(A + A*) + /1(A_A*) 2 2i a můžeme proto vyjádřit každou komplexní matici právě jedním způsobem jako součet A = B + iC s hermiteovskými maticemi B a C. Jde o obdobu rozkladu komplexního čísla na reálnou a ryze imaginární komponentu a skutečně se často v literatuře setkáme i se značením B = reA = -(A + A*), C = im A = — (A - A*). 2 2i V řeči lineárních zobrazení to tedy znamená, že každý komplexní lineární automoríismus můžeme takto jednoznačně vyjádřit pomocí dvou samoadjungovaných zobrazení. čísel, z toho je 18 černých, 18 červených a nula). Hráč skončí, pokud nic nemá, nebo pokud získá 800 Uvažte tuto úlohu jako Markovův proces a napište jeho matici. Solution. V průběhu a na konci hry může mít hráč pouze následující peněžní obnosy (v Kč): 0, 100, 200, 400, 800. Budeme-li na danou situaci nahlížet jako na Markovův proces, toto budou jeho stavy a snadno také sestavíme jeho matici: /l a a a 0 0 0 0 o o o 0 b 0 0 0 0 0 \0 0 0 b 1/ kde a = || a b = Všimněme si, že matice je pravděpodobnostní a singulární. Vlastní hodnota 1 je dvojnásobná. Hra nebude konvergovat k jedinému vektoru Xoo, nýbrž skončí na jednom z vlastních vektorů příslušných vlastní hodnotě 1, totiž (1, 0, 0, 0, 0) (hráč prohraje vše), nebo (0, 0, 0, 0, 1) (hráč vyhraje 800 Kč). Navíc snadno nahlédneme, žehrá skončí po třech sázkách, tedy posloupnost {A"}^=1, jekonstantní pro n > 3: a + ab + ab2 a + ab 0 0 0 0 0 0 0 0 0 0 A" /l 0 o o a 0\ 0 0 V a snadno zjistíme, že hra skončí s pravděpodobností a + ab + ab2 = 0, 885 prohrou a s pravděpodobností cca 0, 115 výhrou 800 Kč. (Maticí A°° vynásobíme počáteční vektor (0, 1, 0, 0, 0) a dostáváme vektor (a + ab + ab2, 0, 0, 0, b3).) □ 3.32. Uvažujme situaci z předchozího případu a předpokládejme, že pravděpodobnost výhry i prohry je 1/2. Označme matici procesu A. Bez použití výpočetního software určete A100. 3.33. Roztržitý profesor. Uvažujme následující situaci: Roztržitý profesor s sebou nosí deštník, ale s pravděpodobností 1 /2 jej zapomene tam, odkud odchází. Ráno odchází do práce. V práci chodí na oběd do restaurace a zpět. Po skončení práce odchází domů. Uvažujme pro jednoduchost, že nikam jinam po dostatečně dlouhou dobu profesor nechodí a že v restauraci zůstává deštník na profesorově oblíbeném místě, odkud si ho může následující den vzít (pokud nezapomene). Uvažte tuto situaci jako Markovův proces a napište jeho matici. Jaká je pravděpodobnost, že se po mnoha dnech po ránu deštník bude nalézat v restauraci? (Je vhodné za časovou jednotku vzít jeden den - od rána do rána.) 163 D. MARKOVOVY PROCESY 4. VÍCE MATICOVÉHO POČTU Solution. /H/16 3/8 l/4\ A = j 3/16 3/8 1/4 ] V 1/8 1/4 1/2/ Spočítejme třeba prvek a\, tedy pravděpodobnost, že deštník začne den doma a skončí doma (bude tam i druhý den ráno): deštník může putovat třemi disjunktními cestami: D Profesor ho hned ráno zapomene doma: p\ = ^. DPD Profesor si ho vezme do práce, pak ho zapomene vzít na oběd a poté ho večer odnese domů: Pi = \- \-\ = \- DPRPD Profesor bere deštník všude a nikde ho nezapomene: p3 = 1 i i i _ j_ 2 ' 2 ' 2 ' 2 ~~ 16- Celkem a\ = Pl + p2 + p3 = ^. Vlastní vektor této matice příslušný dominantní vlastní hodnotě 1 je (2, 1, 1), je tedy hledaná pravděpodobnost 1/(2 + 1 + 1) = 1/4. □ 3.34. Algoritmus na určování důležitosti stránek. Internetové vyhledávače umí na internetu vyhledat (skoro) všechny stránky obsahující dané slovo či frázi. Jak ale setřídit vyhledané stránky tak, aby uživatel dostal pokud možno seznam seřazený podle relevance daných stránek? Jednou z možností je následující algortitmus: soubor všech nalezených stránek považujme za systém a každou z nalezených stránek za jeden z jeho možných stavů. Popíšeme náhodné procházení těchto stránek jako Markovův proces. Pravděpodobnosti přechodu mezi jednotlivými stránkami jsou dány odkazy: každý odkaz, řekněme ze stránky A na stránku B určuje pravděpodobnost (l/(celkový počet odkazů ze stránky A)), se kterou se dostaneme ze stránky A na stránku B. Pokud z některé stránky nevedou žádné odkazy, tak ji uvažujeme jako stránku, ze které vedou odkazy na všechny ostatní. Tímto dostaneme pravděpodobnostní matici M (prvek m;i odpovídá pravděpodobnosti, se kterou se dostaneme z i-té stránky na j-tou). Bude-li tedy člověk náhodně klikat na odkazy v nalezených stránkách (pokud se dostane na stránku, ze které nevede odkaz, vybere si náhodně další), tak pravděpodobnost toho, že se v daný okamžik (dostatečně vzdálený od počátku klikání) bude nalézat na i-té stránce odpovídá i-té složce jednotkového vlastního vektoru matice M, odpovídajícího vlastnímu číslu 1. Podle velikosti těchto pravděpodobností pak určíme důležitost jednotlivých stránek. Tento algoritmus lze modifikovat tím, že budeme předpokládat, že uživatel po nějaké době přestane klikat z odkazu na odkaz a opět začne náhodně na nějaké nové stránce. Řekněme, že s pravděpodobností d vybere náhodně novou stránku a s pravděpodobností (1-d). V takovéto situaci je nyní pravděpodobnost přechodu mezi libovolnými dvěma 3.29. Spektrální rozklad. Uvažujme samoadjungované zo- fbrazení ^ : ľ ^ ľ s maticí A v nějaké ortonormální bázi a zkusme postupovat obdobně jako v 2.50. Opět se nejprve obecně podíváme na invariantní pod-prostory samoadjungovaných zobrazení a jejich ortogonální doplňky. Jestliže pro libovolný podprostor W C V a samoadjungované zobrazení ý '■ v ~* v platí ý(w) C w, pak také platí pro všechny v e W^, w e W (Ý(v)i w) = (ľ. Ý(w)) = 0-To ale znamená, že také ^(W-1) C W^. Uvažme nyní matici A samoadjungovaného zobrazení v nějaké ortonormální bázi a A ■ x = kx pro nějaký vlastní vektor x e C". Dostáváme k{x, x) = {Ax, x) = {x, Ax) = (x, kx) = k{x, x). Kladným reálným číslem (x, x) můžeme krátit a proto musí být k = k, tj. vlastní čísla jsou vždy reálná. Komplexních kořenů má charakteristický polynom det(A — kE) tolik, kolik je dimenze čtvercové matice A, a všechny jsou ve skutečnosti reálné. Dokázali jsme tak důležitý obecný výsledek: Proposition. Ortogonální doplněk k invariantnímu podpros-toru pro samoadjungované zobrazení je také invariantní. Navíc jsou všechna vlastní čísla hermiteovské matice A vždy reálná. Ze samotné definice je zřejmé, že zúžení samoadjungovaného zobrazení na invariantní podprostor je opět samoadjungované. Předchozí tvrzení nám tedy zaručuje, že bude vždy existovat báze V z vlastních vektorů. Skutečně, zúžení Ý na ortogonální doplněk invariantního podprostoru je opět samoadjungované zobrazení, takže můžeme do báze přibírat jeden vlastní vektor za druhým, až dostaneme celý rozklad V. Vlastní vektory příslušející různým vlastním číslům jsou navíc kolmé, protože z rovností Ý(u) = Ý(v) = lJiV vyplývá k{u, v) = (ý(u), v) = (u, ý(v)) = p,(u, v) = fi(u, v). Obvykle bývá náš výsledek formulován pomocí projekcí na vlastní podprostory. O projektoru P : V -> V říkáme, že je kolmý, je-li Im P _L Ker P. Dva kolmé projektory P, Q jsou vzájemně kolmé, je-li Im P _L Im Q. Theorem (O spektrálním rozkladu). Pro každé samoadjungované zobrazení \js : V ^ V na vektorovém prostoru se skalárním součinem existuje ortonormální báze z vlastních vektorů. Jsou-li k\, ..., kk všechna různá vlastní čísla Ý a P i, ..., Pt příslušné kolmé a navzájem kolmé projektory na vlastní podprostory k odpovídajícím vlastním číslům, pak Ý = klPl + ■■■ + kkPk. Dimenze obrazů těchto projektorů je přitom vždy rovna algebraické násobnosti vlastních čísel 164 CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET 3.30. Ortogonální diagonalizace. Zobrazení, pro která lze \. najít ortonormální bázi jako v předchozí větě o spektrálním rozkladu se nazývají ortogonálně diagonalizovatelná. Jsou to samozřejmě právě ta zobrazení, pro která umíme najít ortonormální bázi tak, aby v ní jejich matice zobrazení byla diagonální. Zamysleme se, jak mohou vypadat. Pro euklidovský případ je to snadné: diagonální matice jsou zejména symetrické, jedná se tedy právě o samoadjun-govaná zobrazení. Jako důsledek získáváme tvrzení, že ortogonální zobrazení euklidovského prostoru do sebe je ortogonálně diagonalizovatelné, právě když je zároveň samoad-jungované (jsou to právě ta samoadjungovaná zobrazení s vlastními hodnotami ±1). U komplexních unitárních prostorů je situace složitější. Uvažme libovolné lineární zobrazení cp : V -» V unitárního prostoru a nechť cp = + íř7 Je (jednoznačně daný) rozklad cp na hermiteovskou a antihermiteovskou část. Má-li cp ve vhodné ortonormální bázi diagonální matici D, pak D = re Z) + zim Z), kde reálná a imaginární část jsou právě matice ý a (plyne z jednoznačnosti rozkladu). Zejména tedy platí Ý°f] = f]°Ýa-(P0(P* = ■ (2) jsme již diskutovali. (2) •<=>- (3): Stačí provést přímý výpočet qxp* = (ý + irj)(ý — irj) = V'"2 + ??2 + ~ ý1!) (p*(p = (ý — + it)) = V'"2 + ??2 + Kýt) — Odečtením dostaneme 2i(r)ý — Ýw)- (2) =>■ (1): Nechť u e V je vlastní vektor normálního zobrazení A > B > D. 3.35. Jirka má ve zvyku si každý večer zaběhat. Má tři trasy -krátkou, střední a dlouhou. Pokud si někdy zvolí krátkou trasu, následující den si to vyčítá a rozhodne se libovolně (tj. se stejnou pravděpodobností) pro dlouhou, nebo střední. Jestliže si v některý den zvolí dlouhou trasu, v následujícím dnu volí zcela libovolně jednu z tras. Pokud běžel středně dlouhou trasu, cítí se dobře a druhý den si se stejnou pravděpodobností vybere buď střední, nebo dlouhou. Předpokládejte, že takto běhá každý večer už velmi dlouhou dobu. Jak často volí krátkou a jak často dlouhou trasu? Jaká je pravděpodobnost, že si zvolí dlouhou trasu, když si ji zvolil přesně před týdnem? Solution. Zřejmě se jedná o Markovův proces se třemi možnými stavy, a to volbami krátké, střední a dlouhé trasy. Toto pořadí stavů dává pravděpodobnostní matici přechodu 0 0 l/3\ 1/2 1/2 1/3 ,1/2 1/2 1/3, Stačí si uvědomit, že např. druhý sloupec odpovídá volbě střední trasy v minulém dnu, která znamená, že s pravděpodobností 1 /2 bude opět zvolena střední trasa (druhý řádek) a s pravděpodobností 1 /2 bude zvolena dlouhá trasa (třetí řádek). Neboť je /1/6 1/6 l/9\ T2 = 5/12 5/12 4/9 , \5/12 5/12 4/9/ můžeme využít důsledků Perronovy-Frobeniovy věty pro Markovovy procesy. Není obtížné vypočítat, že vlastním vektorem, který přísluší 165 D. MARKOVOVY PROCESY 4. VÍCE MATICOVÉHO POČTU vlastnímu číslu 1 a který je pravděpodobnostní, je právě (í 1 íY \7' 7' 7/ Hodnoty 1/7, 3/7, 3/7 pak udávají po řadě pravděpodobnosti, že v náhodně určeném dnu volí trasu krátkou, střední, dlouhou. Nechť si Jirka v jistý den (v čase n e N) vybere dlouhou trasu. Tomuto rozhodnutí odpovídá pravděpodobnostní vektor xn = (0, 0, 1)T . Pro následující den tedy platí / 0 0 l/3\ /0\ /l/3\ xn+l = 1/2 1/2 1/3 0 = 1/3 , \l/2 1/2 1/3/ V1/ IW až po sedmi dnech je xn+i — Vyčíslením dostáváme jako složky xn+i hodnoty 0,142 861225...; 0,428 569 387...; 0,428 569 387... Tedy pravděpodobnost, že zvolí dlouhou trasu za podmínky, že si ji zvolil před sedmi dny, činí přibližně 0, 428 569 ~ 3/7 = 0, 428 571. □ 3.36. Výrobní linka nefunguje spolehlivě: jednotlivé výrobky se od sebe co do kvality nezanedbatelně liší. Navíc jistý pracovník ve snaze zvýšit kvalitu neustále zasahuje do výrobního procesu. Při rozdělení výrobků do tříd I, II, III podle kvality se zjistilo, že po výrobku třídy I následuje výrobek stejné kvality v 80 % případů a třídy II v 10 % případů, po výrobku třídy II se nezmění kvalita v 60 % případů a změní se na třídu I ve 20 % případů a že po výrobku třídy III následuje výrobek stejné kvality v polovině případů a se stejnou četností pak výrobky tříd I, II. Spočtěte pravděpodobnost, že 18. výrobek je třídy I, pokud 16. výrobek v pořadí náležel do třídy III. Solution. Nejprve úlohu vyřešme bez uvážení Markovova řetězce. Sledovanému jevu vyhovují případy (16. výrobek je třídy III) • 17. výrobek byl zařazen do třídy I a 18. do třídy I; • 17. výrobek byl zařazen do třídy II a 18. do třídy I; • 17. výrobek byl zařazen do třídy III a 18. do třídy I po řadě s pravděpodobnostmi • 0, 25 • 0, 8 = 0, 2; • 0, 25 • 0, 2 = 0, 05; • 0, 5 • 0, 25 = 0, 125. normální cp byl invariantní (je totiž zúžení normálního zobrazení na invariantní podprostor opět normální). Uvažme vlastní vektor w e V s vlastní hodnotou k, v e (u)-1. Platí cp(v) ■ u = v ■ cp* (u) = {v, ku) = ku ■ v = 0 a tedy opět cp(v) e (w)-1- (1) •<=>. (4): Výraz . \atj|2 je právě stopa matice AA*, to je matice zobrazení 0 pro všechny vektory x. Navíc zjevně B* = (A* • A)* = A* • A = B. 166 CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET Hermiteovských maticím B s takovou vlastností říkáme pozitivně semidefinitní a pokud nastane nulová hodnota pouze pro x = 0, pak jim říkáme pozitivně definitní. Obdobně hovoříme o pozitive definitních a a positivně semidefinitních zobrazeních ý '■ v ~* v- Pro každé pozitivně semidefinitní zobrazení ý '■ v -» v umíme najít jeho odmocninu, tj. zobrazení r] takové, že r) o r) = ý. Nejjednodušeji to uvidíme v ortonormální bázi, ve které bude mít ý diagonální matici. Taková podle našich předchozích úvah vždy existuje a matice A zo-brazení ý v ní bude mít na diagonále nezáporná reálná vlastní čísla zobrazení ý. Kdyby totiž bylo některé z nich záporné, nebyla by splněna podmínka nezápornosti již pro některý z bázových vektorů. Pak ovšem stačí definovat zobrazení r) pomocí matice B s odmocninami příslušných vlastních čísel na diagonále. 3.32. Spektra a nilpotentní zobrazení. Na závěr této části se vrátíme k otázce, jak se mohou chovat lineární zobrazení v úplné obecnosti. Budeme i nadále pracovat s reálnými nebo komplexními vektorovými prostory. Připomeňme, že spektrum lineárního zobrazení f : v -» v je posloupnost kořenů charakteristického polynomu zobrazení /, včetně násobností. Algebraickou násobností vlastní hodnoty rozumíme její násobnost jako kořenu charakteristického polynomu, geometrická násobnost vlastní hodnoty je dimenze příslušného podprostoru vlastních vektorů. Lineární zobrazení / : v -» v se nazývá nilpotentní, jestliže existuje celé číslo k > 1 takové, že iterované zobrazení /* je identicky nulové. Nej menší číslo k s touto vlastností se nazývá stupněm nilpotentnosti zobrazení /. Zobrazení / : v -» v se nazývá cyklické, jestliže existuje báze («!,..., un) prostoru v taková, že f(u\) = 0 a f(ui) = Ui-i pro všechna i = 2, ..., n. Jinými slovy, matice / v této bázi je tvaru /O 1 0 ...\ A= 0 0 1 .. V ; "7 Je-li f (v) = a ■ v, pak pro každé přirozené k je fk(v) = ak ■ v. Zejména tedy může spektrum nilpotentního zobrazení obsahovat pouze nulový skalár (a ten tam vždy je). Přímo z definice plyne, že každé cyklické zobrazení je nilpotentní, navíc je jeho stupeň nilpotentnosti roven dimenzi prostoru v. Operátor derivování na polynomech, D(xk) = kxk~l, je příkladem cyklického zobrazení na prostorech Kn [x] všech polynomů stupně nejvýše n nad skaláry K. Kupodivu to platí i naopak a každé nilpotentní zobrazení je přímým součtem cyklických. Důkaz tohoto tvrzení nám dá hodně práce, proto napřed zformulujeme výsledky, ke kterým směrujeme, a pak se teprve dáme do technické práce. Ve výsledné větě o Jordánově rozkladu vvystupují vektorové Lehce tak získáváme výsledek 0, 375 = 0, 2 + 0, 05 + 0, 125. Nyní na úlohu nahlížejme jako na Markovův proces. Ze zadání plyne, že pořadí možných stavů „výrobek je třídy I", „výrobek je třídy II", „výrobek je třídy III" odpovídá pravděpodobnostní matice přechodu /0,8 0,2 0,25^ 0, 1 0, 6 0, 25 v0, 1 0, 2 0, 5 Situaci, kdy výrobek patří do třídy III, zadává pravděpodobnostní vektor (0, 0, \)T. Pro následující výrobek dostáváme pravděpodobnostní vektor /0,25\ /0,8 0,2 0,25\ /0\ 0, 25 ) = ( 0, 1 0, 6 0, 25 ] • ( 0 0,5/ \0, 1 0,2 0,5 / \1. a pro další výrobek v pořadí potom vektor /0,375\ /0,8 0,2 0,25\ /0,25\ 0, 3 ] = I 0, 1 0, 6 0, 25 ] • I 0, 25 ] , v0, 325/ \0, 1 0, 2 0, 5 / \ 0, 5 / jehož první složka je hledanou pravděpodobností. Doplňme, že první metoda řešení (bez zavedení Markovova procesu) vedla k výsledku zřejmě rychleji. Uvědomme si, jak výrazně by se však první metoda znepřehlednila, kdybychom např. místo 18. výrobku uvažovali 20., 22. nebo až 30. výrobek v pořadí. Ve druhé metodě se lze omezit na do jisté míry „bezmyšlenkovité" násobení (umocňování) matic. Při zavedení Markovova procesu jsme také současně vyšetřovali situace, kdy 18. výrobek náleží do tříd II a III. □ 3.37. Opakovaně házíme hrací kostkou. Napište pravděpodobnostní matici přechodu T pro Markovův řetězec „maximální počet ok dosažených do «-tého hodu včetně" pro pořadí stavů 1, ..., 6. Poté určete T" pro každé n e N. Solution. Ihned můžeme uvést /1/6 0 0 1/6 2/6 0 1/6 1/6 3/6 1/6 1/6 1/6 1/6 1/6 1/6 1/6 5/6 0 \l/6 1/6 1/6 1/6 1/6 1/ kde první sloupec je určen stavem 1 a pravděpodobností 1/6 pro jeho zachování (v dalším hodu padne 1) a pravděpodobností 1/6 jeho přechodu do libovolného ze stavů 2, ..., 6 (po řadě padne 2, ..., 6), druhý sloupec je zadán stavem 2 a pravděpodobností 2/6 pro jeho zachování (v dalším hodu padne 1 nebo 2) a pravděpodobností 1 /6 pro 0 0 °\ 0 0 0 0 0 0 4/6 0 0 167 D. MARKOVOVY PROCESY 4. VÍCE MATICOVÉHO POČTU (»" (»)-(« -(í)' (i)" -(i)" přechod do jakéhokoli ze stavů 3, ... ,6 (padne 3, ..., 6), až poslední sloupce získáme ze skutečnosti, že stav 6 je trvalý (pokud již padla šestka, nemůže padnout vyšší počet ok). Rovněž pro n e N lze přímo určit / ar (§)"-(*)" (§r (§)"-(§)" (§)"-(§)" ar (*)"-(§)" (*)"-(§)" «)"-(*)" (§)"-(*)" ffl"-(ž)' v Mi)" Mi)" Mi)" Hodnoty v prvním sloupci totiž odpovídají postupně pravděpodobnostem, že n-krát po sobě padne 1, n-kiát po sobě padne 1 nebo 2 a alespoň jednou 2 (odečítáme proto pravděpodobnost uvedenou v prvním řádku), n-krát po sobě padne 1, 2 nebo 3 a alespoň jednou padne 3, až v posledním řádku je pravděpodobnost, že aspoň jednou během n hodů padne 6 (tu lze snadno určit z pravděpodobnosti opačného jevu). Podobně např. ve čtvrtém sloupci jsou postupně nenulové pravděpodobnosti jevů „n-kiát po sobě padne 1, 2, 3 nebo 4", „n-kiát po sobě padne 1, 2, 3, 4 nebo 5 a alespoň jednou 5" a „alespoň jednou během n hodů padne 6". Interpretace matice T jako matice přechodu jistého Markovova procesu tak umožňuje rychlé vyjádření mocnin T", n e N. □ 3.38. Sledujte určitou vlastnost daného živočišného druhu, která je podmíněna nezávisle na pohlaví jistým genem - dvojicí alel. Každý jedinec získává po jedné alele od obou rodičů zcela náhodně a nezávisle na sobě. Existují formy genu dané různými alelami a, A. Ty určují tři možné stavy aa, a A = Aa, AA vyšetřované vlastnosti. (a) Předpokládejte, že každý jedinec jisté populace se bude rozmnožovat výhradně s jedincem jiné populace, ve které se vyskytuje pouze vlastnost podmíněná dvojicí a A. Právě jeden jejich (náhodně zvolený) potomek bude ponechán na stanovišti a také on se bude rozmnožovat výhradně s jedincem té jiné populace atd. Stanovte výskyt kombinací aa, a A, AA v uvažované populaci po dostatečně dlouhé době. (b) Řešte úlohu uvedenou ve variantě (a), pokud je jiná populace tvořena pouze jedinci s dvojicí alel A A. (c) Náhodně zvolené dva jedince opačného pohlaví zkřížíte. Z jejich potomstva opět náhodně vyberete dva jedince opačného pohlaví, které zkřížíte. Pokud takto budete pokračovat velmi dlouho dobu, vypočtěte pravděpodobnost, že oba křížení jedinci budou mít dvojici alel A A, příp. aa (proces křížení skončí). (pod)prostory a lineární zobrazení na nich s jediným vlastním číslem k a maticí A o 0 1 o o o Takovýmto maticím (a odpovídajícím invariantním podpros-torům) se říká Jordánův blok. Theorem (Jordánova věta o kanonickém tvaru). Nechť V je vektorový prostor dimenze n a f : V -» V je lineární zobrazení s n vlastními čísly včetně algebraických násobností. Pak existuje jednoznačný rozklad prostoru V na přímý součet podprostorů V = Vi © • • • © Vk takových, že f (Ví) C Ví, zúžení f na každé Ví má jediné vlastní číslo a zúžení f — A, • id na Ví je buď cyklické nebo nulové zobrazení. Věta tedy říká, že ve vhodné bázi má každé lineární zobrazení blokově diagonální tvar s Jordánovými bloky podél diagonály. Celkový počet jedniček nad diagonálou v takovém tvaru je roven rozdílu mezi celkovou algebraickou a geometrickou násobností vlastních čísel. 3.33. Poznámky. Všimněme si, že jsme Jordánovu větu již dříve plně dokázali v případech, kdy jsou všechna vlastní čísla různá nebo když jsou geometrické a algebraické násobnosti vlastních čísel stejné. Zejména jsme ji plně dokázali pro unitární, normální a samoadjungovaná zobrazení. Další užitečné pozorování je, že pro každé linerání zobrazení přísluší ke každému vlastnímu čislu jednoznačně určený invariantní podprostor, který odpovídá Jordánovým blokům s příslušnou vlastní hodnotou. Také si všimněme jednoho velice užitečného důsledku Jordánovy věty (který jsme už použili u diskuse chování Markovových řetězců). Předpokládejme, že jsou vlastní hodnoty našeho zobrazení / všechny v absolutní hodnotě menší než jedna. Potom opakované působení lineárního zobrazení na jakémkoliv vektoru v € V vede k rychlému zmenšování všech souřadnic fk(v) nad všechny meze. Skutečně, předpokládejme pro jednoduchost, že na celém V má zobrazení / jediné vlastní číslo k a / — k id y je cyklické (tj. omezujeme se na jediný Jordánův blok), a nechť v\, ..., vi je příslušná báze. Pak podmínka z věty říká, že f(v2) = kv2 + v\, f2(v2) = k2v2 + kv\ + kv\, a podobně pro ostatní vt a vyšší mocniny. V každém případě při iterování dostáváme stále vyšší a vyšší mocniny k u všech nenulových komponent, přičemž nejnižší z nich může být nejvýše o stupeň nilpotentnosti nižžší než násobnost iterace. Tím je tvrzení dokázáno (a stejný argumet s aboslutní hodnotou vlastních čísel ostře větší než jedna vede k neomezenému růstu všech souřadnic iterací fk(v)). 168 CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET Zbytek této části třetí kapitoly je věnován důkazu \. Jordánovy věty a několika k tomu potřebným Živ pojmům. Je výrazně obtížnější než dosavadní text a čtenář jej může případně přeskočit až do začátku 5. části této kapitoly. 3.34. Kořenové prostory. Na příkladech jsme viděli, že vlastní podprostory popisují dostatečně geometrické vlastnosti jen některých lineárních zobrazení. Zavedeme nyní jemnější nástroj, tzv. kořenové podprostory. Definition. Nenulový vektor u e V se nazývá kořenovým vektorem lineárního zobrazení cp : V -» V, jestliže existuje a e K a celé číslo k > 0 takové, že (cp — a ■ iáv)k(u) = 0, tj. k-tá iterace uvedeného zobrazení zobrazuje u na nulu. Množinu všech kořenových vektorů příslušných k pevnému skaláru k doplněnou o nulový vektor nazýváme kořenovým prostorem příslušným ke skaláru ÁeK, značíme TZx- Je-li u kořenový vektor a k z definice je vybráno nej-menší možné, pak (cp—a-idv)k~l (u) \e vlastní vektor s vlastní hodnotou a. Je tedy TZx = {0} pro všechny skaláry k, které neleží ve spektru zobrazení cp. Proposition. Pro lineární zobrazení cp : V -» V platí (1) Pro každé k e Kj'e IZi C V vektorový podprostor. (2) Pro každé k, fi e K je IZi invariantní vzhledem k lineárnímu zobrazení (cp — fi ■ idy), zejména tedy je IZi invariantní vzhledem k cp. (3) Je-li fi ^ k, pak (cp — fi ■ idy)|^ je invertibilní. (4) Zobrazení (cp — k ■ idy)|^ je nilpotentní. Proof. (1) Ověření vlastností vektorového podprostoru je jednoduché a ponecháváme jej čtenáři. (2) Předpokládejme, že (cp — k ■ idy)*(m) = 0 a uvažme v = (cp — \jl ■ idv)(u). Pak (cp—k ■ idy)*(i;) = = (cp — k ■ idv)k((cp - k ■ idy) + (k - n) ■ idv)(u) = (cp — k ■ idy)*+1(w) + (k - fi) ■ (cp - k ■ idv)k(u) = o (3) Je-li u € Ker(cp — n ■ idy)|^, pak (cp — k-Ídy)(«) = (cp — fl-Ídy)(«) + (fl — k)-U = (fl — k) ■ U Odtud 0 = (cp — k ■ idy)* (m) = (p, — k)k ■ u a je tedy nutně u = 0 pro k (4) Zvolme bázi e\, ..., ep podprostoru TZx- Protože podle definice existují čísla k{ taková, že (cp — k- idv)ki (e{) = 0, je nutně celé zobrazení (cp — k ■ idv)\nk nilpotentní. □ 3.35. Faktorové prostory. Našim dalším cílem je ukázat, že dimenze kořenových prostorů je vždy rovna algebraické násobnosti příslušných vlastních čísel. Nejprve však zavedeme šikovné technické nástroje. (d) Řešte úlohu uvedenou ve variantě (c) bez kladení podmínky, že křížení jedinci mají stejné rodiče. Pouze tedy křížíte jedince jisté velké populace mezi sebou, potom křížíte potomky mezi sebou atd. Solution. Případ (a). Jedná se o Markovův proces zadaný maticí '1/2 1/4 0 1/2 1/2 1/2 0 1/4 1/2, přičemž pořadí stavů odpovídá pořadí dvojic alel aa, a A, A A. Hodnoty v prvním sloupci plynou z toho, že potomek jedince s dvojicí alel aa a jedince s dvojicí alel a A má s pravděpodobností 1/2 dvojici aa a s pravděpodobností 1/2 dvojici a A. Analogicky postupujeme pro třetí sloupec. Hodnoty ve druhém sloupci potom vyplývají z toho, že každý ze čtyř případů dvojic alel aa, a A, Aa, AA je stejně pravděpodobný u jedince, jehož oba rodiče mají dvojici alel a A. Uvědomme si, že na rozdíl od počítání pravděpodobností, kdy musíme rozlišovat dvojici a A od Aa (která z alel pochází od kterého z rodičů), vlastnosti podmíněné dvojicemi a A a Aa jsou samozřejmě stejné. Pro určení výsledného stavu stačí nalézt pravděpodobnostní vektor, který přísluší vlastnímu číslu 1 matice T, protože matice '3/8 1/4 l/8\ 1/2 1/2 1/2 vl/8 1/4 3/8y splňuje podmínku Perronovy-Frobeniovy věty (všechny její prvky j sou kladné). Hledaný pravděpodobnostní vektor je \4 2 4/ což již dává pravděpodobnosti 1/4, 1/2, 1/4 výskytu po řadě kombinací aa, a A, A A po velmi dlouhé (teoreticky nekonečné) době. Případ (b). Pro pořadí dvojic alel AA, aA, aa nyní dostáváme pravděpodobnostní matici přechodu 'l 1/2 0\ 0 1/2 1 v0 0 Oj Ihned vidíme všechna vlastní čísla 1, 1/2 a 0 (odečteme-li je od diagonály, hodnost obdržené matice nebude 3, tj. touto maticí zadaná homogenní soustava bude mít netriviální řešení). Těmto vlastním číslům přísluší po řadě vlastní vektory 1 169 D. MARKOVOVY PROCESY 4. VÍCE MATICOVÉHO POČTU Proto je Odsud pro libovolné neN plyne 1 -1 1 \ /l 0 0 0 1 -2 0 0 0 0 0 1 / Vo 0 0 Zřejmě pro velká n e N můžeme nahradit 2 " za 0, což implikuje Pokud tedy plodí potomky jedinci původní populace výhradně s členy populace, ve které se vyskytuje pouze dvojice alel AA, nutně po dostatečně velkém počtu křížení dojde k tomu, že dvojice a A a aa zcela vymizí (bez ohledu na jejich původní četnost). Případ (c). Tentokráte budeme mít 6 možných stavů (v tomto pořadí) AA, AA; aA,AA; aa, AA; aA,aA; aa,aA; aa,aa, přičemž tyto stavy jsou dány různými případy genotypů rodičů. Matice odpovídajícího Markovova řetězce je /l 1/4 0 1/16 0 0 1/2 0 1/4 0 0 0 0 0 1/8 0 0 0 1/4 1 1/4 1/4 0 0 0 0 1/4 1/2 0 0 0 1/16 1/4 v Pokud budeme např. uvažovat situaci (druhý sloupce), kdy jeden z rodičů má dvojici alel AA a druhý a A, pak zjevně může nastat každý ze čtyř případů (jde-li o dvojice alel jejich dvou náhodně zvolených potomků) AA, AA; AA,aA; aA,AA; aA,aA se stejnou pravděpodobností. Pravděpodobnost setrvání ve druhém stavu je proto 1/2 a pravděpodobnost přechodu ze druhého stavu do prvního je 1/4 a do čtvrtého také 1 /4. Definition. Nechť U C V je vektorový podprostor. Na množině všech vektorů ve V definujeme ekvivalenci takto: vi ~ v2 právě tehdy, když v\ — v2 e U. Axiomy ekvivalence jdou ověřit snadno. Množina V/U tříd této ekvivalence, spolu s operacemi definovanými pomocí reprezentantů, tj. [v] + [w] = [v + w], a ■ [u] = [a ■ u], tvoří vektorový prostor, který nazýváme faktorový vektorový prostor prostoru V podle podprostoru U. Ověřte si korektnost definice operací a platnost všech axiomů vektorového prostoru! Třídy (vektory) ve faktorovém prostoru V/U budeme často označovat jako formální součet jednoho reprezentanta se všemi vektory podprostoru U, např. u+U e V/U, u e V. Nulový vektor ve V/U je právě třída 0 + U, tj. vektor u e V reprezentuje nulový vektor ve V/U, právě když je u e U. Jako jednoduché příklady si rozmyslete V/{O} = V, V/V = {0} a faktorový prostor roviny M2 podle libovolného jednorozměrného podprostoru (zde je každý jednorozměrný podprostor U C M2 přímkou procházející počátkem), kde třídy ekvivalence jsou rovnoběžky s touto přímkou. Proposition. Nechť U C V je vektorový podprostor a (u\, ..., u „) je taková báze V, ze (u\, ..., uk)jebáze U. Pak dim V/U = n — k a vektory uk+i + U, ... ,un + U tvoří bázi V/U. Proof. Protože V = {u\, ..., un), je i V/U = (u\ + U, ... ,un + U). Přitom aleje prvních & generátorů nulových, takže je V/U = (uk+i + U, ..., un + U). Předpokládejme, že ak+í -(uk+i +U)-\-----\-a„-(u„+U) = (ak+i-uk+í-\-----h ) + U = 0 e V/U. To je ale ekvivalentní příslušnosti lineární kombinace vektorů uk+\, ..., un do podprostoru U. Protože U je generováno zbylými vektory, je nutně tato kombinace nulová, tj. všechny koeficienty a; jsou nulové. □ 3.36. Indukovaná zobrazení na faktorových prostorech. Předpokládejme, že U C V je invariantní pod-prostor vzhledem k lineárnímu zobrazení cp : V -> V a zvolme takovou bázi u\, ... ,un prostoru V, že prvních k vektorů této báze je bazí U. vieřo bázi má cp blokovou matici A -budeme umět dokázat následující tvrzení: (o í} Pak Lemma. (1) Zobrazení cp indukuje lineární zobrazení cpv/u : V/U -+ V/U, cpv/u (v + U) = cp(v) + U s maticí D v indukované bázi uk+\ + U, ..., u„ + U na V/U. (2) Charakteristický polynom cpV/u dělí charakteristický polynom cp. Proof. Pro v, w e V, u e U, a e K máme cp(v + u) e cp(v) + U (protože U je invariantní), (cp(v) + U) + (cp(w) + U) = cp(v + w) + U a a ■ (cp(v) + U) = a ■ cp(v) + U = 170 CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET cp(a ■ v) + U (protože cp je lineární), je tedy zobrazení (pV/u dobře definované a lineární. Navíc je přímo z definice matice zobrazení patrné, že matice cpV/u v indukované bázi na V/U je právě matice D (při počítání obrazů bázových prvků nám koeficienty z matice C přispívají pouze do třídy U). Charakteristický polynom indukovaného zobrazení cpV/u je tedy | D — k ■ E\, zatímco charakteristický polynom původního zobrazení cp je \A — k ■ E\ = \B — k ■ E\\D — k ■ E\. □ Corollary. Nechť V je vektorový prostor nad K dimenze n a nechť cp : V -» V je lineární zobrazení, jehož spektrum obsahuje n prvků (tj. všechny kořeny charakteristického polynomu leží v K a počítáme je včetně násobnosti). Pak existuje posloupnost invariantních podprostorů {0} = Vq C V\ C ... C V„ = V s dimenzemi dim V, = i. V bázi u\, ..., u„ prostoru V takové, že Ví = (u\, ..., u{), má cp horní trojúhelníkovou matici: A ••• *\ V o ... knJ kde k\, ..., k„je posloupnost prvků spektra. Proof. Konstrukci podprostorů V{ provedeme induktivně. Nechť ki, ... ,kn jsou prvky ve spektru zobrazení cp, tzn. charakteristický polynom zobrazení cp je tvaru (k — k\).....(k — k„). Zvolme V0 = {0}, Vi = (m), kde u\ je libovolný vlastní vektor s vlastní hodnotou k\. Podle předešlé věty je charakteristický polynom zobrazení cpv/Vl tvaru (k — k2).....(k — kn). Předpokládejme, že jsme již sestrojili lineárně nezávislé vektory u\, ..., uk a invariantní podprostory V{ = («i ..., «;), i = 1, ..., k < n, takové, že charakteristický polynom cpv/Vk je tvaru (k-kk+í).....(k-k„) acp(ui) e (V«;- + V-i) pro všechna i = 1, ..., k. Zejména tedy existuje vlastní vektor uk+i + Vk e V/Vk zobrazení cpv/Vk s vlastní hodnotou kk+i. Uvažme nyní prostor Vk+i = {u\, ..., uk+i). Kdyby byl vektor uk+i lineární kombinací vektorů u\, ... ,uk, znamenalo by to, že uk+i + Vk je nulová třída v V/Vk, to ale není možné. Je proto dimVýt+i = k + 1. Zbývá studovat indukované zobrazení cpv/Vk+x. Charakteristický polynom tohoto zobrazení je stupně n — k — 1 a dělí charakteristický polynom zobrazení cp. Přitom doplněním vektorů u\, ..., uk+i do báze V dostaneme blokovou matici zobrazení cp s horní trojúhelníkovou submaticí B v horním levém rohu a nulou v levém dolním rohu, jejíž diagonální prvky jsou právě skaláry ki, ..., kk+i. Proto mají kořeny charakteristického polynomu indukovaného zobrazení požadované vlastnosti. □ 3.37. Poznámky. Pokud existuje rozklad celého prostoru V na přímý součet vlastních podprostorů, ex-^^?* . istuje báze z vlastních podprostorů a předchozí '"^ar|ír věta vlastně neříká vůbec nic zajímavého. Její i^J^ — síla ovšem spočívá v tom, že jediným jejím předpokladem je existence dim V kořenů charakteristického Nyní bychom měli opět určit mocniny T" pro velká n e N. Uvážením podoby prvního a posledního sloupce ihned zjistíme, že 1 je vlastním číslem matice T. Velmi lehce lze najít vlastní vektory (l,0,0,0,0,0)r, (0,0,0,0,0, l)T příslušné vlastnímu číslu 1. Přechodem ke čtyřrozměrné podmatici matice T (vynecháním právě prvního a šestého řádku a sloupce) nalezneme poté zbylá vlastní čísla 1 1 1 - VŠ 1 + y/5 2' 4' 4 ' 4 ' Vzpomeneme-li si na řešení příkladu nazvaného Mlsný hazardér, nemusíme T" počítat. V tomto příkladu jsme dostali stejné vlastní vektory příslušné číslu 1 a ostatní vlastní čísla měla rovněž absolutní hodnotu ostře menší 1 (jejich přesné hodnoty jsme nevyužívali). Dostáváme tak totožný závěr, že proces se blíží k pravděpodobnostnímu vektoru (a,0, 0, 0,0, 1 -a)T , kde a e [0, 1] je dáno výchozím stavem. Protože pouze na první a šesté pozici výsledného vektoru mohou být nenulová čísla, stavy aA,AA; aa,AA; aA,aA; aa,aA po mnohonásobném křížení vymizí. Uvědomme si dále (plyne z předešlého a z příkladu Mlsný hazardér), že pravděpodobnost toho, aby proces končil A A, A A, se rovná relativní četnosti výskytu A v počátečním stavu. Případ (d). Nechť hodnoty a, b, c e [0, 1] udávají (při zachování pořadí) relativní četnosti výskytu dvojic alel AA, a A, aa v dané populaci. Chceme získat vyjádření relativních četností dvojic AA, a A, aa v potomstvu populace. Probíhá-li výběr dvojic pro páření náhodně, lze při velkém počtu jedinců očekávat, že relativní četnost páření jedinců s dvojicemi alel AA (u obou) je a2, relativní četnost páření jedinců, z nichž jeden má dvojici alel A A a druhý a A, je 2ab, relativní četnost páření jedinců s dvojicemi alel a A (u obou) je b2 atd. Potomek rodičů s dvojicemi A A, A A musí dvojici alel A A zdědit. Pravděpodobnost, že potomek rodičů s dvojicemi AA, a A bude mít AA, je zřejmě 1/2 a pravděpodobnost, že potomek rodičů s dvojicemi a A, a A bude mít AA, je pak 1 /4. Jiné případy pro potomka s dvojicí alel A A uvažovat nemusíme (pokud má jeden rodič dvojici alel aa, potomek nemůže mít dvojici AA). Relativní četnost výskytu dvojice alel AA v potomstvu je tedy , 1 , 1 , b2 a1 ■ 1 + 2ab---\-b • - = a +ab-\--. 2 4 4 171 D. MARKOVOVY PROCESY 4. VÍCE MATICOVÉHO POČTU Analogicky stanovíme postupně relativní četnosti dvojic a A aaa\ potomstvu ve tvarech b2 ab + bc + 2ac -\-- c + bc -\--. 4 Na tento proces můžeme nahlížet jako na zobrazení T, které transformuje vektor (a,b, c)T. Platí (a\ j a2 + ab +b2/4 b | h» lab + bc + 2ac + b2/2 c) \ c2+bc + b2/4 Podotkněme, že za definiční obor (a pochopitelně i obor hodnot) T vlastně bereme pouze vektory kde a, b, c e [0, 1], a + b + c = 1. Chtěli bychom zadat operaci T pomocí násobení vektoru (a, b, c)T jistou konstantní maticí. To však očividně není možné (zobrazení T není lineární). Nejedná se tedy o Markovův proces a nelze zjednodušit určování, co se stane po velmi dlouhé době, jako v předešlých případech. Můžeme ale vypočítat, co se stane, když aplikujeme zobrazení T dvakrát po sobě. Ve druhém kroku dostáváme a2 + ab + b2/4 T : [ab + bc + 2ac + b2/2 h» ř2 , kde polynomu (včetně násobností). To je ovšem zaručeno, je-li pole K algebraicky uzavřené, např. pro komplexní čísla C. Přímým důsledkem pak jsou zajímavá tvrzení o determinantu a stopě zobrazení: jsou vždy součinem, resp. součtem prvků ve spektru. Tuto skutečnost můžeme použít i pro všechny reálné matice. Můžeme je totiž vždy považovat za komplexní, spočítat potřebné, a protože determinant i stopa jsou algebraické výrazy v prvcích matice, výsledkem budou právě hledané reálné hodnoty. Když je na vektorovém prostoru V zadán skalární součin, můžeme v každém induktivním kroku důkazu předchozího tvrzení využít skutečnosti, že vždy V/Vk — a B u h-» (u + Vk) e V/Vk- To znamená, že v každé třídě rozkladu V/Vk existuje právě jeden vektor z V^. Skutečně, tuto vlastnost má faktorový prostor podle libovolného pod-prostoru v unitárním prostoru - pokud u, v e V^- jsou v jedné třídě, pak jejich rozdíl patří do Vk n V^, tedy jsou stejné. Můžeme tedy jako reprezentanta Uk+i nalezené třídy, tedy vlastního vektoru cpV/vk, zvolit právě vektor z V^. Touto modifikací dojdeme k ortogonální bázi s vlastnostmi požadovanými v tvrzení o triangulovatelnosti. Proto existuje i taková ortonormální báze: Corollary (Schurova věta o ortogonální triangulovatelnosti). Nechť cp : V -» V je libovolné lineární zobrazení (reálného nebo komplexního) unitárního prostoru s m = dim V vlastními hodnotami (včetně násobonosti). Pak existuje ortonormální báze prostoru V taková, že (p v ní má horní trojúhelníkovou matici s vlastními čísly X\, ... ,Xm na diagonále. V je lineární zobrazení. ,11. 3 I 9 ( b2\ ( , ^ % = j c2 + bc + — J + I ab + bc + 2ac + — J I c2 + bc + Lze ukázat (využitím a + b + c = \), že b2 b2 b2 t\=a2+ab-\--, tl = ab + bc + 2ac -\--, ň=c2 + bc-\--, 2 4 2 4 3.38. Theorem. Nechť cp V Součet kořenových prostorů příslušných různým vlastním hodnotám X\ ..., A.* je přímý. Navíc je pro každou vlastní hodnotu A dimenze podprostoru IZi rovna její algebraické násobnosti. Proof. Důkaz provedeme indukcí přes počet k kořenových prostorů. Předpokládejme, že tvrzení vždy platí pro méně než k prostorů a že pro vektory u\ € TZ)^, ... ,uk € 1Zxk platí «! + ••• + uk = 0. Pro vhodné j pak (cp — kk- idy)7 (uk) = 0 a zároveň jsou y{ = (cp — kk ■ iávy (ui) nenulové vektory v 1Zxi, i = 1, - - -, k — 1, pokud Ui jsou nenulové, viz. předchozí věta. Přitom ale k yi H----+ yk-i = ^(

V/IZx nechť je zobrazení 172 CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET indukované cp na faktorovém prostoru. Předpokládejme, že dimenze TZx je menší než násobnost kořenu k charakteristického polynomu. Podle lemma 3.36 to znamená, že A je i vlastní hodnotou zobrazení ý. Nechť (v + TZx) e V/TZx je příslušný vlastní vektor, tj. ý(v + TZx) = k ■ (v + TZx) což podle definice značí v £ TZx a cp(v) = k ■ v + w pro vhodné w e TZx- Máme tedy w = (cp — k ■ idy) (u) a (cp — k ■ iávy (w) = 0 pro vhodné j. Celkem jsme dovodili (cp — k ■ idy)7"1-1 (v) = 0 což je ve sporu s volbou v £ TZx- Tím jsme dokázali, že dimenze TZx je rovna násobnosti kořene k charakteristického polynomu cp. □ Corollary. Pro každé lineární zobrazení cp : V -» V, jehož celé spektrum je v K, je V = TZxx © • • • © TZxn přímým součtem kořenových podprostorů. Zvolíme-li vhodně báze těchto podprostorů, pak cp má v této bázi blokově diagonální tvar s horními trojúhelníkovými maticemi v blocích a vlastními hodnotami kt na diagonále. 3.39. Nilpotentní a cyklická zobrazení. Nyní již máme r skoro vše připraveno pro diskusi kanonických tvarů matic. Zbývá jen vyjasnit vztah mezi cyk-ML::^ lickými a nilpotentními zobrazeními a poskládat dohromady již připravené výsledky. Theorem. Nechť cp V -» V je nilpotentní lineární zobrazení. Pak existuje rozklad V na přímý součet podprostorů V = V\ © • • • © V* takových, že zúžení cp na kterýkoliv z nich je cyklické. Proof. Ověření je docela přímočaré a spočívá v konstrukci takové báze prostoru V, že akce zobrazení cp na bázových vektorech přímo ukazuje rozklad na < /,// cyklická zobrazení. Postup bude ale poněkud zd-t louhavý. Nechť k je stupeň nilpotentnosti zobrazení cp a označme = im(cff ),i = 0, ..., k, tzn. {0} = Pk C Pk-i C • • • C Pi C Po = V. P Vyberme libovolnou bázi e kde pk_i > 0 je dimenze Pk Kercp, tj. vždy iex + • • • + ŔPit_1ep~1i = 0, proto jsou všechny b j Pak ale i a j = 0, protože se jedná o kombinaci bázových vektorů. Celkem jsme tedy ověřili lineární nezávislost všech 2pk-i zvolených vektorů. Doplňme je do báze -i ' „k-2 "Pk-\ „k-2 „k-2 -Pk-X ' ''M-i+ľ »*-2 "Pk-2 tj- / a2 + ab + b2/4 \ I a2+ab+b2/4 T : lab+bc + 2ac+ b2/2 \ lab + bc + 2ac + b2/2 \ c2 + bc + b2/4 ) \ c2 + bc + b2/4 Získali jsme tak překvapivý výsledek, že dalším aplikováním transformace T se vektor obdržený v prvním kroku nezmění. To znamená, že výskyt uvažovaných dvojic alel je po libovolně dlouhé době totožný jako v první generaci potomstva. Pro velkou populaci jsme tak dokázali, že evoluční vývoj by se realizoval během jediné generace, kdyby nedocházelo k mutacím nebo k selekci. □ 3.39. Nechť jsou dány dvě urny, které obsahují dohromady n bílých a n černých koulí. V pravidelných časových intervalech je z obou uren vylosována jedna koule a přemístěna do druhé urny, přičemž počet koulí v obou urnách je na začátku (a tedy po celou dobu) právě n. Zadejte tento Markovův proces pravděpodobnostní maticí přechodu T. Solution. Tento příklad se používá ve fyzice jako model prolínání dvou nestlačitelných kapalin (již v roce 1769 ho zavedl D. Bernoulli) nebo analogicky jako model difúze plynů. Stavy 0,1, ... ,n budou odpovídat kupř. počtu bílých koulí v jedné pevně zvolené urně. Tento údaj totiž současně zadává, kolik černých koulí je ve zvolené urně (všechny ostatní koule jsou pak ve druhé z uren). Pokud v jistém kroku dojde ke změně stavu j e {1, ...,«} na j — 1, znamená to, že ze zvolené urny byla vytažena bílá koule a z druhé černá. To se stane s pravděpodobností J J J n n n^ Přechodu ze stavu j e {0, ..., n—1} do j +1 odpovídá vytažení černé koule ze zvolené urny a bílé z té druhé s pravděpodobností n ~ j n - j (n - j)2 n n nA Soustava zůstane ve stavu j e {1, ..., n — 1}, jestliže z obou uren byly vytaženy koule stejné barvy, což má pravděpodobnost l _ n- j n_- j j 2j (n - j) n n n n n'- Dodejme, že ze stavu 0 se nutně (s pravděpodobností 1) přechází do stavu 1 a že ze stavu n se s jistotou přechází do stavu n — 1. Uvážením výše uvedeného dostáváme hledanou matici nL 1 1(« 0 (n - l)2 0 0 \0 0 o o 22 2 • 2(n - ■2) 0 0 0 (n - 2)2 22 0 0 0 0 (n - l)2 2- (n - 1)1 1 173 D. MARKOVOVY PROCESY 4. VÍCE MATICOVÉHO POČTU pro pořadí stavů 0,1, ... ,n. Při užití tohoto modelu ve fyzice nás samozřejmě zajímá složení uren po uplynutí určité doby (po daném počtu výměn v závislosti na předešlém složení uren). Bude-li počáteční stav např. 0, můžeme pomocí mocnin matice T sledovat, s jakou pravděpodobností přibývají ve zvolené urně bílé koule. Také lze potvrdit očekávaný výsledek, že počáteční rozdělení koulí bude ovlivňovat jejich rozdělení po delší době zanedbatelným způsobem. Kdybychom jednotlivé koule očíslovali, místo výběru po jedné kouli z uren vylosovali nějaké z čísel 1, 2, ..., 2n a kouli, jejíž číslo bylo vytaženo, přemístili do druhé urny, obdrželi bychom Markovův proces se stavy 0, 1, ..., 2n (počet koulí ve zvolené urně), kdy se tak už nerozlišuje barva koulí. Tento Markovův řetězec je rovněž ve fyzice důležitý. (P. a T. Ehrenfestovi jej zavedli v roce 1907.) Používá se jako model výměny tepla mezi dvěma izolovanými tělesy (teplota je reprezentována počtem koulí, tělesa urnami). □ 3.40. Dva hráči A, B hrají o peníze opakovaně jistou hru, která může skončit pouze vítězstvím jednoho z hráčů. Pravděpodobnost výhry hráče A je v každé jednotlivé hře p e [0, 1 /2) a oba sází vždy (v libovolné hře) jen 1 Kč, tj. po každé hře s pravděpodobností p dá 1 Kč hráč B hráči A a s pravděpodobností 1 — p naopak 1 Kč dá hráč A hráči B. Hrají ovšem tak dlouho, dokud jeden z nich nepřijde o všechny peníze. Jestliže má hráč A na začátku x Kč a hráč B má y Kč, určete pravděpodobnost, že hráč A vše prohraje. Solution. Tato úloha se nazývá Ruinovaní hráče. Jedná se o speciální Markovův řetězec (viz také příklad Mlsný hazardér) s mnoha důležitými aplikacemi. Hledaná pravděpodobnost činí (3.6) x+y' Povšimněme si, jaká je tato hodnota pro konkrétní volby p, x, y. Kdyby hráč B chtěl mít téměř jistotu a požadoval, aby pravděpodobnost, že hráč A s ním prohraje 1 000 000 Kč, byla alespoň 0,999, potom stačí, aby měl 346 Kč, je-li p = 0, 495 (či 1 727 Kč, je-li p = 0, 499). Proto je ve velkých kasinech možné, aby „vášniví" hráči mohli hrát téměř spravedlivé hry. □ 3.41. V rámci jisté společnosti fungují dvě navzájem si konkurující oddělení. Vedení společnosti se rozhodlo, že každý týden bude poměřovat relativní (vzhledem k počtu zaměstnanců) zisky dosažené těmito dvěma odděleními. Do oddělení, které bude úspěšnější, pak budou přeřazeni dva pracovníci z druhého oddělení. Tento proces prostoru Pk-2- Navíc jsou obrazy přidaných bázových prvků v Pk-i, nutně tedy musejí být lineárními kombinacemi bázových prvků e\~l, ..., ep~\- Můžeme proto zaměnit zvolené vektory ek~2i+l, ..., ekp~22 vektory ek~2 -cp(ek~2). Tím docílíme, že doplněné vektory do báze Pk-2 patří do jádra zobrazení cp. Předpokládejme to přímo o zvolené bázi (1). Předpokládejme dále, že již máme sestrojenu bázi pod-prostoru Pk-i takovou, že ji můžeme poskládat do schématu -i ' '1 ' „*-3 k-l k-l Pk-\ k-2 k-2 ek~3 ek~3 k-i k-i "' Pk-l' M-1+ľ ..., e k-2 Pk-2 k-3 e- - ek~3 Pk-2' Pk-2 + ľ k-l k-l Pk-2' Ä-2 + ľ- »*-3 "Pk-3 Qk-l 'Pk-3 ... e k-l Pk-l kde hodnota zobrazení cp na libovolném bázovém vektoru se nachází nad ním, nebo je nulová, pokud nad zvoleným vektorem báze již nic není. Pokud je Pk-i ^ V, opět musí existovat vektory e\ 1 1, ..., ekPk*t L, které se zobrazují na k-l vektory epk_t a můžeme je doplnit do báze Pk-i-\, řekněme „k-l-l „k-l-l Pk-í+l' • • • ' pk-e-i' Přitom postupným odečítáním hodnot iterací zobrazení

n. Odtud plyne, že pokud matice J zobrazení cp obsahuje dk (k) Jordánových bloků řádu k s vlastní hodnotou k, pak defekt matice (J — k ■ E)1 je di(k) + 2d2(k) + . ..ldt{\) + ídl+l(k) + ... Odtud spočítáme n - n(k) = dx(X) + 2d2(k) + --- + £dl(k) + £dl+1(k) + .. dk(k) = rk-i(k) - 2rk(k) + rk+l(k) (kde poslední řádek vznikne kombinací předchozího pro hodnoty l = k - 1, k, k + 1). 3.41. Poznámka. Důkaz věty o existenci Jordánova kanon-i^k^ ického tvaru byl sice konstruktivní, nedává nám 1f% ale dokonale efektivní algoritmický postup pro jejich hledání. Nyní shrneme již odvozený iWtz- postup explicitního výpočtu báze, v níž má dané zobrazení cp : V -» V matici v kanonickém Jordánově tvaru. (1) Najdeme kořeny charakteristického polynomu. (2) Jestliže jich je méně než n = dim V, včetně násobností, kanonický tvar neexistuje. (3) Je-li n lineárně nezávislých vlastních vektorů, získáme bázi V z vlastních vektorů a v ní má cp diagonální matici. (4) Nechť k je vlastní hodnota s geometrickou násobností menší než algebraickou a v\, ..., vk nechť jsou příslušné vlastní vektory. To by měly být vektory na horním okraji schématu z důkazu věty 3.39, je ovšem nutné najít vhodnou bázi aplikacemi iterací cp — k ■ idy. Zároveň přitom zjistíme, ve kterém řádku se vektory nacházejí, a najdeme lineárně nezávislá řešení u>; rovnic (cp — kiá)(x) = Ví z řádků pod nimi. Postup opakujeme iterativně (tj. pro Wi atd.). Najdeme tak "řetízky" bázových vektorů zadávajících podprostory, kde cp — k id je cyklické. Postup je praktický pro matice, kde násobnosti vlastních hodnot jsou malé, nebo aspoň diskutované stupně nilpotentnosti jsou malé. Např. pro matici dostaneme dvourozměrný podprostor vlastních vektorů ((1,0,0), (0,1,0)). Potřebujeme proto najít řešení rovnic (A—2E)x = (a, b, 0)T pro vhodné konstanty a, b. Tento systém je ovšem řešitelný pouze pro a = b a jedno z možných řešení je v = (0, 0, 1), a = b = 1. Celá hledaná báze pak je (1,1,0), (0,0,1), (1, 0, 0). Všimněme si, že jsme měli spoustu voleb a bazí s požadovanými vlastnostmi je tedy mnoho. má probíhat tak dlouho, až jedno z oddělení zanikne. Získali jste zaměstnání v této společnosti a můžete si vybrat jedno z těchto dvou oddělení, kde budete pracovat. Chcete si zvolit to, které nebude v důsledku vnitropodnikové konkurence zrušeno. Jaká bude Vaše volba, když jedno oddělení má nyní 40 zaměstnanců, druhé 10 a když odhadujete, že to v současnosti menší z nich bude mít větší relativní zisky v 54 % případů? Další využití Markovových řetězců viz příloha za kapitolou. E. Unitární prostory Již v minulé kapitole jsme definovali skalární součin v reálných vektorových prostorech (2.40), v této kapitole rozšiřujeme jeho definici i na komplexní vektorové prostory (3.23). 3.42. Grupy O(n) a U(n). Uvážíme-li všechna lineární zobrazení z M3 do M3, která zachovávají daný skalární součin, tedy vzhledem k definicím délky vektorů a odchylky dvou vektorů lineární zobrazení zachovávající délky a úhly, tak tato tvoří zřejmě vzhledem ke skládání zobrazení grupu (viz 1.1; složení dvou takových zobrazení je z definice zobrazení zachovávající délky a úhly, jednotkovým prvkem je identické zobrazení, inverzním prvkem k danému zobrazení je zobrazení k němu inverzní - díky podmínce na zachvávání velikostí existuje). Matice těchto zobrazení tedy tvoří vzhledem k násobení matic grupu (viz ), říkáme jí ortogonální grupa, značíme 0(n). Je to pod-grupa všech invertibilních zobrazení z W do W. Požadujeme-li navíc po maticích zobrazení, aby měly determinant roven jedné, hovoříme o speciální ortogonální grupě SO(n) (obecně může být determinantem matice z 0(n) číslo 1 či — 1). Obdobně definujeme unitární grupu U(n) jakožto grupu všech (komplexních) matic, které odpovídají komplexně lineárním zobrazením z C" do C", která zachovávají daný skalární součin v unitárním prostoru. Stejně pak SU (n) značí podgrupu matic v U (n) s jednotkovým determinantem (obecně může být determinantem libovolná komplexní j ednodnotka). 3.43. Uvažujme vektorový prostor V funkcí M -> C. Určete, zdaje zobrazení cp z unitárního prostoru V lineární. i) cp(u) = ku, kde A e C ii) cp(u) = u* iii) cp(u) = u2(= u.u) iv) m = f V je pro vhodné funkce unitární prostor nekonečné dimenze. Skalárním součin se definuje vztahem f.g = f (x)g(x)dx. 175 E. UNITÁRNÍ PROSTORY 5. ROZKLADY MATIC A PSEUDOINVERZE Solution, je, není, není, je □ 5. Rozklady matic a pseudoinverze 3.44. Ukažte, že pokud je H hermiteovská matice, pak je U = exp(z'ŕŕ) = X^lo(—1777 (iH)n unitární matice a spočtěte její determinant. Solution. Z definice exp lze ukázat, že platí exp(A + B) = exp(A). exp(S) tak, jak jsme zvyklí u exponenciálního zobrazení v oboru čísel. Vzhledem k tomu, že obecně platí (u + v)* = u* + v* a (cv)* = čv*, tak dostáváme oo ^ oo ^ u* = (^(-ir-(iHrr = X(-i)"-r(-^*)" *—' n\ *—' n\ «=o «=o a protože H* = H, tak U* = - T(-iy-(-iHT = exp(-iH) «=0 a proto U*U = exp(/íř)exp(-/íř) = exp(0) = 1 □ 3.45. Hermiteovské matice A, B, C splňují [A, C] = [B, C] = 0 a [A, 5] 0, kde [, ] je komutátor matic definovaný vztahem [A, B] = A B — BA. Ukažte, že aspoň jeden podprostor matice C musí mít dim > 1. Solution. Budeme dokazovat sporem. Předpokládáme tedy, že všechny vlastní podprostory operátoru C mají dim = 1. Pak můžeme pro libovolný vektor u psát u = ^kckuk, kde uk jsou lineárně nezávislé vlastní vektory operátoru C vlastním číslem kk (a ck = u.uk) Pro tyto vlastní vektory pak zjevně platí 0 = [A, C]uk = ACuk — CAuk = XkAuk — C(Auk) Odtud vidíme, že Auk je vlastním vektorem matice C s vlastní hodnotou kk. To ovšm znamená, že Auk = k£uk pro nějaké číslo k£. Stejně tak odvodíme Buk = kfuk pro nějaké číslo kf. Pro komutátor matic A a S pak dostáváme [A, B]uk = ABuk - BAuk = kfk^uk - k^kfuk = 0 To ovšem znamená [A, B]u = [A, S] ^cjtiťjt - £cjt[A, B]uk = 0 k k a protože u bylo libovolné, znamená to, že [A, B] = 0, což je spor. □ V minulé části jsme s soustředili na geometrický popis K> _ struktury zobrazení. Teď naše výsledky přeložíme do jazyku tzv. rozkladů matic, což je obzvlášť důležité téma pro numer-■ ické postupy a maticový počet obecně. I při počítání s reálnými čísly užíváme pro zjednodušení rozklady na součiny. Nejjednodušším je vyjádření každého reálného čísla jednoznačně ve tvaru a = sgn(út) • \a\, tj. jako součin znaménka a abolutní hodnoty. V dalším textu si uvedeme stručně přehled několika takových rozkladů pro různé typy matic, které bývají nesmírně užitečné při numerických výpočtech s maticemi. Například jsme vhodný rozklad pro pozitivně semidefmitní symetrické matice využili v odstavci 3.31 pro konstrukci odmocniny z matice. 3.42. LU-rozklad. Začneme přeformulováním několika výsledků, které jsme už dávno odvodili. V jfo :} odstavcích 2.7 a 2.8 jsme upravovali matice A^Tv, nad skaláry z libovolného pole na řádkový schodovitý tvar. K tomu jsme používali elementární úpravy, které spočívaly v postupném násobení naší matice invertibilními dolními trojúhelníkovými maticemi Pí, které postihovaly přičítání násobků řádků pod právě zpracovávaným. Předpokládejme pro jednoduchost, že naše matice A je čtvercová a že při Gausově eliminaci nejsme nuceni přehazovat řádky, a proto všechny naše matice Pt mohou být dolní trojúhelníkové s jedničkami na diagonálách. Konečně, stačí si povšimnout, že inverzní matice k takovýmto Pt jsou opět dolní trojúhelníkové s jedničkami na diagonálách a dostáváme U = P ■ A = Pk ■ ■ ■ Pi ■ A kde U je horní trojúhelníková matice a tedy A = L-U kde L je dolní trojúhelníková matice s jedničkami na diagonále a U je horní trojúhelníková. Tomuto rozkladu se říká LU-rozklad matice A. V případě obecné matice můžeme při Gausově eliminaci na řádkově schodovitý tvar potřebovat navíc permutace řádků, někdy i sloupců matice. Pak dostáváme obecněji A = P ■ L ■ U ■ Q, kde P a. Q jsou nějaké permutační matice. 3.43. Poznámky. Přímým důsledkem Gausovy eliminace ^ bylo také zjištění, že až na volbu vhodných bází na definičním oboru a oboru hodnot je každé zo-i^L brazení / : V -> W zadáno maticí v blokově diagonálním tvaru s jednotkovou maticí, s rozměrem daným dimenzí obrazu /, a s nulovými bloky všude kolem. To lze 176 CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET přeformulovat takto: Každou matici A typu m/n nad polem skalárů K lze rozložit na součin (o o) <2, kde P a Q jsou vhodné invertibilní matice. Pro čtvercové matice jsme v 3.32 ukázali při diskusi vlastností lineárních zobrazení / : V -» V na komplexních vektorových prostorech, že každou čtvercovou matici A dimenze m umíme rozložit na součin A = P ■ B ■ P~\ kde B je blokově diagonální s Jordánovými bloky příslušnými k vlastním číslům na diagonále. Skutečně jde o pouhé přepsání Jordánovy věty, protože násobení maticí P a její inverzí z opačných stran odpovídá v tomto přípaě právě změně báze na vektorovém prostoru V a citovaná věta říká, že ve vhodné bázi má každé zobrazení Jordánův kanonický tvar. Obdobně jsme také při diskusi samoadjungovaných zobrazení dokázali, že pro reálné symetrické nebo komplexní Hermiteovské matice existuje vždy rozklad na součin A = P ■ B ■ P*, kde B je diagonální matice se všemi (vždy reálnými) vlastními čísly na diagonále, včetně násobností. Skutečně, jde opět o součin s maticemi vystihující změnu báze, nicméně připouštíme nyní pouze změny mezi mezi ortonormálními bázemi a proto i matice přechodu P musí být ortogonální. Odtud P'1 = P*. Pro reálná ortogonální zobrazení jsme odvodili obdobné vyjádření jako u symetrických, pouze naše B bude blokově diagonální s bloky rozměru dva nebo jedna vyjadřujícími buď rotaci nebo zrcadlení nebo identitu vzhledem k příslušným podprostorům. 3.44. Věta o singulárním rozkladu. Nyní se vrátíme k obecným lineárním zobrazením mezi (obecně různými) vektorovými prostory. Jestliže na nich je definován skalární součin a omezíme se přitom na ortonormální báze, musíme postupovat o hodně rafinovaněji, než v případě bazí libovolných: Theorem. Nechť A je libovolná matice typu m/n nad reálnými nebo komplexními skaláry. Pak existují čtvercové unitární matice U a V dimenzí m a n, a reálná diagonální matice s nezápornými prvky D dimenze r, r takové, ze min{m, n] USV* (o t) a r je hodnost matice A A*. Přitom je S určena jednoznačně až na pořadí prvků a prvky diagonální matice D jsou druhé odmocniny vlastních čísel di matice AA*. Pokud je A reálná matice, pak i matice U a V jsou ortogonální. 3.46. Použití v kvantové fyzice. V kvantové fyzice se fyzikální veličině nepřiřazuje číselná hodnota, tak jak tomu je v kla-sické fyzice, nýbrž hermiteovský operátor. To není nic jiného, než hermiteovsé zobrazení, které ovšem může vést, a často taky vede, mezi unitárními prostory nekonečné dimenze (Můžeme si to představit třeba jako matici nekonečného rozměru). Vektory v tomto unitárním prostoru potom reprezentují stavy daného fyzikálního systému. Při měření dané fyzikální veličiny můžeme dostat jen hodnoty, které jsou vlastními hodnotami příslušného operátoru. Například místo souřadnice x máme operátor souřadnice x. Jeli stav systému popsán vektorem v, pak platí x(v) = xv, tzn. je to násobení vektoru reálným číslem x. Na první pohled je tento hermiteovský operátor jiný než naše příklady z konečné dimenze. Evidentně je totiž každé reálné číslo vlastním číslem (x má tzv. spojité spektrum). Podobně, místo rychlosti (přesněji hybnosti) máme operátor p = —zjk Vlastní vektory jsou řešení diferenciální rovnice —i^ = Xv. I v tomto případě je spektrum spojité. To je vyjádřením faktu, že příslušná fyzikální veličina je spojitá (může nabývat libovolné reálné hodnoty). Naproti tomu máme fyzikální veličiny, např. energie, které mohou nabývat jen diskrétní hodnoty (energie je kvantována). Příslušné operátory jsou pak opracdu podobné hermiteovským maticím, jen mají nekonečný počet vlastních čísel. 3.47. Ukažte, že x a p jsou hermiteovské a že [x, p] = i Solution. Pro libovolný vektor v platí „ „ „ „ „ „ dv d(xv) [x, p]v = xpv — pxv = x(—i—) + i--= iv dx dx a odtud už přímo vyplývá naše tvrzení. □ 3.48. Ukažte [i — p, x + p] = 2i Solution. Evidentně platí [x, x] — 0 a [p, p] = 0 a zbytek vyplývá z linearity komutátoru a z minulého příkladu. □ 3.49. Jordánův tvar. Najděte Jordánův tvar matice A a napište příslušný rozklad. Jaká je geometrická interpretace rozkladu této matice? i) A ii) A g j) 177 E. UNITÁRNÍ PROSTORY 5. ROZKLADY MATIC A PSEUDOINVERZE Solution. i)Nejprve spočítáme charakteristický polynom matice A -1 \A - XE\ X 1 4-X X-3X + 2 Vlastní čísla matice A jsou kořeny tohoto polynomu, to znamená X 1,2 = 1,2. Prtotože matice je řádu dva a máme dvě různé vlastní hodnoty, je Jordánův tvar diagonální matice J = ^ ^ ■ Vlastní vektor (x, y) příslušný vlastní hodnotě 1 splňuje 0 = (A — E)x = (ój) i^y)' ^ ^ = ^ ^° Jsou násobky vektoru (1.2) . Podobně zjistíme, že vlastním vektorem k vlastní hodnotě 2 je (1.3) . Matici P pak dostaneme napsáním těchto vlastních vektorů do sloupců, tj. P = ^ Pro matici A pak máme A = P ■ J ■ P~l. Inverzní matice k P má tvar P~l = ^ l^a dohromady dostáváme (-6 4) = (2 3) (o 2) (-2 l) Tento rozklad nám říká, že matice A určuje takové lineární zobrazení, které má v bázi vlastních vektorů (1,2), (1,3) výše uvedený diagonální tvar. To znamená, že ve směru (1, 2) se nic neděje a ve směru (1, 3) se každý vektor protáhne na svůj dvojnásobek. ii) Charakteristický polynom matice A je v tomto případě |A - XE\ ■1 - X 1 -4 3 - X Dostáváme tedy dvojnásobný kořen X (x, y) splňuje : X - 2X + 1 = 0 1 a příslušný vlastní vektor 0 = (A - E)x GO- To jsou, opět jako v minulém přikladu, násobky vektoru (1,2). To, že řešením této rovnice nejsou dva lineárně nezávislé vektory, říká, že Jordánův tvar v tomto případě nebude diagonální, ale bude to matice Bázi, ve které má matice A tento tvar, tvoří vlastní vektor (1, 2) a vektor, který se na tento vektor zobrazí zobrazením A — E. Je tedy řešením soustavy rovnic ( "2 1J1L/-2 1|1\ \ -4 2 | 2 / \ 0 0 I 0 / To jsou násobky vektoru (1, 3). Dostáváme tedy stejnou bázi jako v minulém přikladu a můžeme psát (-4 3) = (2 3) (o l)(-2 l) Zobrazení teď působí na vektor tak, že složka ve směru (1,3) zůstává stejná a ke složka ve směru (1, 2) se bude násobit součtem koeficientů, které určují složky ve směrech (1, 3) a (1, 2). □ Proof. Předpokládejme nejprve m < n a označme cp : W -» W" zobrazení mezi reálnými nebo komplexními prostory se standardními skalárními součiny, zadané maticí A ve standardních bazích. Tvrzení věty můžeme přeformulovat tak, že existují ortonormální báze na W a Km ve kterých bude mít cp matici S z tvrzení věty. Jak jsme viděli dříve, matice A*A je pozitivně semidefmitní. Proto má samá reálná nezáporná vlastní čísla a existuje ortonormální báze w v W, ve které má příslušné zobrazení cp* o cp diagonální matici s vlastními čísly na diagonále. Jinými slovy, existuje unitární matice V taková, že A*A = VBV* pro reálnou diagonální matici s nezápornými vlastními čísly (d\, d2, ..., dr, 0, ..., 0) na diagonále, d{ 7^ 0 pro všechny i = 1, ..., r. Odtud B = V*A*AV = (AVT(AV). To je ale je ekvivalentní tvrzení, že prvních r sloupců matice A V je ortogonálních a zbývající jsou nulové, protože mají nulovou velikost. Označme nyní prvních r sloupců v\, ... ,vr e W". Platí tedy (ví,Ví) = d{, i = 1, ..., r, a normované vektory u i = -jjVi tvoří ortonormální systém nenulových vektorů. Doplňme je na ortonormální bázi u = u 1, ..., un celého Km. Vyjádříme-li naše původní zobrazení cp v bazích w na K" a u na Km, dostáváme matici \[B. Přechody od standardních bází k nově vybraným odpovídají násobení zleva ortogonálními maticemi U a zprava V~l = V*. Pokud je m > n, můžeme aplikovat předchozí část důkazu na matici A*. Odtud pak přímo plyne požadované tvrzení. Pokud pracujeme nad reálnými skaláry, jsou všechny naše kroky v důkazu výše také realizovány v reálném oboru. □ Tento důkaz věty o singulárním rozkladu je konstruktivní a můžeme jej opravdu použít pro výpočet unitárních, resp. ortogonálních, matic U, V a diagonálních nenulových prvků matice S. 3.45. Geometrická interpretace. Diagonálním hodnotám matice D z předchozí věty se říká singulární hodnoty matice A. Přeformulujme si tuto větu v reálném případě geometrietěji. Pro příslušné lineární zobrazení cp : K" -> Km mají singulární hodnoty skutečně jednoduchý geometrický význam: Nechť K c M" je jednotková sféra pro standardní skalární součin. Obrazem cp(K) pak vždy bude (případně degenerovaný) m-rozměrný elipsoid. Singulární čísla matice A jsou přitom velikosti hlavních poloos a věta navíc říká, že původní sféra vždy připouští ortogonální sdružené průměry, jejichž obrazem budou právě všechny poloosy tohoto elipsoidu. 178 CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET Pro čtvercové matice je vidět, že A je invertibilní právě, když všechna singulární čísla jsou nenulová. Poměr největšího a nejmenšího singulárního čísla je důležitým parametrem pro robustnost řady numerických výpočtů s maticemi, např. pro výpočet inverzní matice. Poznamejme také, že existují rychlé metody výpočtů, resp. odhadů, vlastních čísel, proto lze se singulárním rozkladem velmi efektivně pracovat. 3.46. Věta o polárním rozkladu. Věta o singulárním rozkladu je východiskem pro mnoho mimořádně / užitečných nástrojů. Uvažujme nyní nad několika přímými důsledky (které samy o sobě jsou dosti netriviální). Tvrzení věty říká pro libovolnou matici A, ať už reálnou nebo komplexní, A = USW* s diagonální S s nezápornými reálnými čísly na diagonále a unitárními U, W. Pak ovšem také A = USU*UW* a pojmenujme si matice P = USU*, V = UW*. První z nich, P je hermiteovská (v reálném případě symetrická) a pozitivně semidefmitní, protože jde jen o zápis zobrazení s reálnou diagonální maticí S v jiné ortonormální bázi, zatímco V je coby součin dvou unitárních opět unitární (v reálném případě ortogonální). Navíc A* = WSU* a tedy AA* = USSU* = P2 a naše matice f je vlastně odmocninou ze snadno spočítatelné hermiteovské matice A A*. Předpokládejme, že A = P V = QU jsou dva takové rozklady matice A na součin positivně semidefmitní hermiteovské a unitární matice a předpokládejme, že A je invertibilní. Pak ovšem je AA* = PVV*P QUU*Q = Q2 pozitivně definitní a proto jsou matice Q = P = V AA* jednoznačně určené a invertibilní. Pak ovšem také U = V = P~lA. Beze zbytku jsme tedy odvodili velice užitečnou analogii rozkladu reálného čísla na znaménko (ortogonální matice v případě dimenze jedna jsou právě ±1) a absolutní hodnotu (matice P, ke které umíme odmocninu). Theorem (Věta o polárním rozkladu). Každou čtvercovou komplexní matici A dimenze n lze vždy vyjádřit ve tvaru A = P ■ V, kde P je hermiteovská a positivně definitní čtvercová matice téže dimenze a V je unitární. Přitom P = V AA*. Jeli A invertibilní, je rozklad jednoznačný a V = (V AA*)-1 A. Pokud pracujeme nad reálnými skaláry, je P symetrická a V ortogonální. Když budeme tutéž větu aplikovat na A* místo A, dostaneme tentýž výsledek, ovšem s obráceným pořadím hermiteovských a unitárních matic. Matice v příslušných pravých a levých rozkladech budou samozřejmě obecně různé. 3.50. Najděte Jordánův tvar matice A a napište příslušný rozklad. Jaká je geometrická interpretace rozkladu této matice? * = i {-2 V) * * = i (4 ~i) " G 9> Přibližné řešení pak splňuje Rx = Q Tb a to v našem případě znamená 5x + 9y = 9 (přibližné řešení tedy není jednoznačné). QR rozklad matice A je a tedy dostáváme G^G)>» 3.57. Minimalizujte \\Ax — b\\ pro A 0 I a napište QR rozklad matice A. Solution. Normalizovaný první sloupec matice A je 000 /2\ e\ = 4= I — 1 I. Z druhého sloupce odečteme jeho složku ve 1-1/ směru e\. Máme 3 a proto dostaneme ■l\ /-l Tím jsme vyrobili ortogonální vektor, který normujeme a dostaneme e2 = I 1 1. Třetí sloupec matice A je už lineárně závislý Odtud vidíme, že B pro vhodné matice P, Q a R. Nyní však Q BA /D~l P\(D 0\ _ / E 0\ V Q fi/lo oj" ve^ V má být hermiteovská, proto je Q D = 0 a tedy i Q = 0 (matice D je diagonální a invertibilní). Obdobně požadavek na hermitovskost A B vede na nulovost P. Zároveň ještě platí Na pravé straně ale je v pravém dolním rohu nula, proto také R = 0 a tvrzení je dokázáno. (4): Uvažme zobrazení

Km, x h-> Ax, a přímé součty K" = (Ker (p)-1 ©Ker Imcp je lineární isomorfismus. Zvolíme-li vhodně ortonormální báze na (Kercp)1- a Imp a doplníme je na ortonormální báze na celých prostorech, bude mít

n. Např. máme experimentem dáno mnoho naměřených reálných hodnot b j a chceme najít lineární kombinaci několika funkcí f t, která bude co nejlépe aproximovat hodnoty b j. Skutečné hodnoty zvolených funkcí v bodech y j e M zadají matici ciij = fjiyd, jejíž sloupce jsou dány hodnotami jednotlivých funkcí /_,■ v uvažovaných bodech, a naším úkolem je tedy určit koeficienty x j e M tak, aby součet kvadrátů odchylek od skutečných hodnot m n m n Z**'- - (Z*^.-)))2 = Z&- - (Z w))2 i=\ 7=1 i=\ 7=1 byl minimální. Jinými slovy, hledáme lineární kombinaci funkcí fi takovou, abychom "dobře" proložili zadané hodnoty bi. Díky předchozí větě jsou hledané optimální koeficienty A{~l)b. Abychom měli konkrétnější představu, uvažujme pouze dvě funkce f\(x) = x, fiix) = x2 a předpokládejme, že "naměřené hodnoty" jejich neznámé kombinace g(x) = y\x + y2x2 v celočíselných hodnotách pro x mezi 1 a 10 jsou bT = (1.4410.644.4814.5631.1239.2054.8871.28 85.92104.16). Tento vektor vzniknul výpočtem hodnot x + x2 v daných bodech posunutých o náhodné hodnoty v rozmezí ±8. Matice A = (bij) je tedy v našem případě rovna (i 23456789 10) 4 9 16 25 36 49 64 81 lOOj a hledané koeficienty v kombinaci jsou \0.99J i(-D Výsledné proložení je možné dobře vidět na obrázku, kde zeleně jsou proloženy zadané hodnoty b lomenou čarou, zatímco červený je graf příslušné kombinace g. Výpočty byly provedeny v systému Maple pomocí příkazu leastsqrs(B,b). Pokud jste s Maplem (nebo jiným podobným softwarem) spřáteleni, zkuste si zaexperimentovat s podobnými úlohami. (můžeme ověřit spočítáním determinantu). Hledaná sloup-cově-ortogonální matice je tedy 1 11 ° Q = -rA~l V3~ Dále spočítáme 2 -1 -1^ R = QTA = Te (o 73" -VšMlí \ -1 _ "3 ~3 Vě l o 373 -3v3 ) Řešením rovnice Rx = QTb]tx = y = z- Násobky vektoru (1,1,1) tedy minimalizují \\Ax — b\\. Zobrazení určené maticí A je projekce na rovinu s normálovým vektorem (1,1, 1). □ 3.58. Lineární regrese. Znalosti, které jsme se v této kapitole naučili lze s výhodou použít v praxi při řešení problémů pomocí lineární regrese. Jde o to nalézt nejlepší přiblížení nějaké funkční závislosti pomocí lineární funkce. Máme tedy zadánu funkční závislost v několika bodech (například zkoumáme hodnotu majetku lidí v závislosti na jejich inteligenci, na majetku rodičů, počtu společných známých s panem Kalouskem,...), tj. f(a\, ...,aln) = yi,..., f(a\, a\, ..., akn) = yk, k > n (máme tedy více rovnic než neznámých) a chceme tuto závislost "co nejlépe" odhadnout pomocí lineární funkce, tj. vyjádřit hodnotu majetku jakožto lineární funkci f(x\, ..., x„) = b\X\ + b2x2 + • • • + bnxn + c. Pokud navíc definujeme "co nejlépe" tím, že chceme minimalizovat Z(v< Z(/''v'1 r) i=l \ j=\ v závislosti na reálných konstantách b\, ..., bn, c. Našim cílem je najít takovou lineární kombinanci sloupců matice A = (a'j) (s koeficienty ri,..., bn), která bude mít co nejmenší vzdálenost od vektoru (yi, ..., yk) v M.k, tedy vlastně najít kolmou projekci vektoru (yi, ..., yk) na podprostor generovaný sloupci matice A. Podle věty 3.49 je touto projekcí vektor (b\, ..., bn)T = A(_1)(yi, ..., bn). 183 F. ROZKLADY MATIC 5. ROZKLADY MATIC A PSEUDOINVERZE 3.59. Metodou nejmenších čverců řešte soustavu 2x + y + 2z = 1 x + y + 3z = 2 2x + y + z = 0 x + z = -1 Solution. Naše soustava nemá řešení, neboť její matice má hodnost 3, rozšířená matice soustavy pak hodnost 4. Nejlepším přiblížením vektoru b = (1, 2, 0, —1) tvořeném pravými stranami rovnic soustavy můžeme tedy dle věty 3.49 dosáhnout pomocí vektoru A(~l)b. (AA(~l)b je pak ono nejlepší přiblížení, neboli kolmá projekce vektoru b na prostor generovaný sloupci matice A.) Protože sloupce matice A jsou lineárně nezávislé, je její pseudoin-verzní matice určena vztahem (ATA)~lAT. Je tedy = (-6/5,7/3, l/3)r. Projekce (nejlepší přiblížení k sloupci pravých stran) je pak vektor (3/5,32/15,4/15,-13/15). □ X 184 CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET G. Doplňující příklady k celé kapitole 3.60. Určete jedinou posloupnost vyhovující rekurentnímu vztahu x„ = lx„-\ — 10x„_2 + Sn — 22, s počátečními členy x\ = 6, x2 = 8. 3.61. Model vývoje populace velryb. Pro vývoj populace jsou podstatné samice a u nich není důležitý věk, ale plodnost. Z tohoto hlediska můžeme samice rozdělit na novorozené neboli juve-nilní, tj. dosud neplodné samice, mladé plodné samice, dospělé samice s nej větší plodností a samice postmenopauzní, které již plodné nejsou, ale mají velký význam při ochraně mláďat nebo vyhledávání zdrojů potravy. Budeme modelovat vývoj takové populace v čase. Za časovou jednotku zvolíme dobu dosažení dospělosti. Novorozená samice, která tuto dobu přežije, dospěje k plodnosti. Vývoj mladé samice do plné plodnosti a vývoj dospělé samice k menopauze závisí na podmínkách prostředí. Přechod do další plodnostní kategorie je tedy náhodný jev. Stejně je náhodným jevem i úmrtí samice. Mladá plodná samice má za jednotku času průměrně méně mláďat, než samice plodná. Tyto poznatky vyjádříme formalizovane. Označme xi(ŕ), resp. x2(t), resp. X3(ř),resp. x\(i), množství juvenilních, resp. mladých, resp. plně plodných, resp. postmenopauzních, samic v čase t. Množství může vyjadřovat počet jedinců, ale také počet jedinců vztažených na jednotkový areál (tzv. populační hustotu), případně také celkovou biomasu a podobně. Dále označme p\ pravděpodobnost, že juvenilní samice přežije jednotkový časový interval a tedy během něho dospěje, a p2, resp. p3, pravděpodobnost, že během jednotkové doby mladá, resp. plně plodná, samice, která neuhyne, dospěje do následující kategorie, tj. mladá do plné plodnosti a plně plodná k menopauze. Dalším náhodným jevem je umírání (pozitivně řečeno: přežívání) samic, které nedospějí do další kategorie; označme pravděpodobnosti přežití po řadě q2, 13 a q4 pro mladé, plně plodné a postmenopauzní samice. Každé z čísel p\, p2, p3, q2, q3, q4 jakožto pravděpodobnost je z intervalu [0, 1]. Mladá samice může přežít, dospět do plné plodnosti nebo uhynout; tyto jevy jsou neslučitelné, společně tvoří jev jistý a možnost úmrtí nelze vyloučit. Platí tedy Pi + qi < 1- Z podobných důvodů platí p3 + q3 < 1. Nakonec ještě označíme f2, resp. f3 průměrný počet dcer mladé, resp. plně plodné, samice. Tyto parametry splňují nerovnost 0 < f2 < f3. Očekávaný počet novorozených samic v následujícím časovém období je součtem dcer mladých a plně plodných samic, tj. xx(t + 1) = f2X2(t) + f3X3(t). Označme na okamžik x2] 1 (ř +1) množství mladých samic v čase t +1, které byly v předchozím období, tj. v čase t juvenilními, & x22(t+\) množství mladých samic, které již v čase t byly plodné, jednotkový časový interval přežily, ale nedosáhly plné plodnosti. Pravděpodobnost p\, že juvenilní samice přežije jednotkový časový interval, můžeme vyjádřit jako klasickou, tj. jako poměr x2,i(ř + l)/xi(ř), a podobně můžeme vyjádřit pravděpodobnost q2 jako poměr x2t2(t + \)/x2(t). Poněvadž mladé samice v čase t + 1 jsou právě ty, které dospěly z juvenilního stádia, a ty, které již plodné byly, přežily a nedospěly k plné plodnosti, platí x2(t + 1) = x2,i(ř + l)+x2a(t + 1) = pixx(t) +q2x2(t). 185 g. doplňující príklady k cele kapitole 5. rozklady matic a pseudoinverze Analogicky odvodíme očekávaný počet plně plodných samic jako X3(í + 1) = p2X2(t) + 2 0 h o />3 o o 2, n e N. Proto vyjádříme T", n € N. Jedná se o Markovův proces, a tudíž je 1 vlastní číslo matice T. Druhé vlastní číslo 0, 1 vyplývá kupř. z toho, že stopa (součet prvků na diagonále) je rovna součtu všech vlastních čísel (každé vlastní číslo bereme tolikrát, jaká je jeho algebraická násobnost). Těmto vlastním číslům pak přísluší vlastní vektory Dostáváme tak (0- (-'O- r = (i -i)'(o 1/10) (1 -1) ' tj. pro n e N je Dosazení a roznásobení dává T" (1 -i)'(o 1/10) (1 -1) = (2 iy/1- 0W2 i\- \1 -1/ v° 10"7 V1 -1/ ' C -i)""=Hi i) ;ní dává 1/2+10-" 2-2-10-"\ 3 \1 - 10-" 1+2-10-7' Odtud, z (113.711) a (113.811) plyne /2 11 1 \r I---, - H--I , n € N. V3 6 • 10" 3 6 • 10" / ■*n + l Zvláště vidíme, že pro velká n je pravděpodobnost úspěchu «-tého pokusu blízká 2/3. □ 3.66. Student na koleji je značně společensky unaven (v důsledku toho není schopen plně vnímat smyslové podněty a koordinovat své pohyby). V tomto stavu se přesto rozhodne, že na právě probíhající večírek pozve známou, která má pokoj na jednom konci chodby. Na opačném konci chodby však bydlí někdo, koho pozvat rozhodně nehodlá. Je ovšem natolik „unaven", že rozhodnutí udělat krok zvoleným směrem se mu podaří realizovat pouze v 53 ze 100 pokusů (ve zbylých 47 jde přesně na 193 G. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 5. ROZKLADY MATIC A PSEUDOINVERZE opačnou stranu). Za předpokladů, že vyjde v polovině chodby a že vzdálenost k oběma dveřím na koncích chodby odpovídá jeho 20 krokům, stanovte pravděpodobnost, že nejdříve dorazí ke správným dveřím. 3.67. Nechť n e N osob hraje tzv. tichou poštu. Pro jednoduchost předpokládejte, že první osoba zašeptá druhé právě jedno (libovolně zvolené) ze slov „ano", „ne". Druhá osoba pak potichu řekne třetí osobě to ze slov „ano", „ne", o kterém si myslí, že ho řekla první osoba. Takto to pokračuje až k n-té osobě. Jestliže pravděpodobnost toho, že při libovolném předání se zamění (nechtě, úmyslně) šířené slovo na to druhé, je p e (0, 1), stanovte pro velká n e N pravděpodobnost, že n-tá osoba určí správně slovo zvolené první osobou. Solution. Na tuto úlohu lze nahlížet jako na Markovův řetězec se dvěma stavy nazvanými Ano a Ne, kdy řekneme, že proces je ve stavu Ano v čase m e N, pokud si m-tá osoba bude myslet, že předávané slovo je „ano". Pro pořadí stavů Ano, Neje pravděpodobnostní matice přechodu T=(i-p / y \ P 1-/7 Součin matice Tm~l a pravděpodobnostního vektoru počáteční volby první osoby potom udává pravděpodobnosti toho, co si bude myslet m-tá osoba. Mocniny této matice ovšem počítat nemusíme, neboť všechny prvky matice T j sou kladná čísla. Navíc tato matice je dvojnásobně stochastická. Víme tudíž, že pro velká n e N bude pravděpodobnostní vektor blízký vektoru (1/2, 1/2)r. Pravděpodobnost, že n-tá osoba řekne „ano", je proto přibližně stejná jako pravděpodobnost, že řekne „ne", a to nezávisle na tom, pro které slovo se rozhodla první osoba. Pro velký počet zúčastněných tak platí, že zhruba polovina z nich uslyší „ano" (zopakujme, že nezávisle na tom, které slovo bylo na začátku vybráno). Pro úplnost zjistěme, jak by úloha dopadla, kdybychom předpokládali, že pravděpodobnost záměny „ano" na „ne" je u libovolné osoby p e (0, 1) a pravděpodobnost záměny „ne" na „ano" je obecně odlišné q e (0, 1). V tomto případě pro stejné pořadí stavů dostáváme pravděpodobnostní matici přechodu \ p i-?/ která vede (pro velká n e N) k pravděpodobnostnímu vektoru blízkému vektoru (S— p \p + q' p + q což kupř. plyne z vyjádření matice T"-TT-M $ + 7)]" Rovněž tentokrát při dostatečném počtu lidí nezáleželo na volbě slova, kterou učinila první osoba. Stručně řečeno, v tomto modelu platí, že nezáleží na původním rozhodnutí, protože o tom, jakou informaci si lidé předávají, rozhodují oni sami; přesněji řečeno, lidé sami rozhodují o četnosti výskytu „ano" a „ne", pokud je jich dostatečný počet (a chybí-li jakékoli ověřování). Doplňme ještě, že výše uvedený závěr byl experimentálně ověřen. V psychologických pokusech byl mj. jedinec opakovaně vystaven vjemu, který šlo vnímat dvěma různými způsoby, a to v časových intervalech zaručujících, aby si subjekt pamatoval předešlý vjem. Viz např. „T. Havránek a kol.: Matematika pro biologické a lékařské vědy, Praha, Academia 1981", kde je uveden experiment, v němž je zábleskem osvětlován v pevných časových odstupech nejednoznačný obraz (třeba náčrt 194 CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET krychle vnímatelný jako nadhled i podhled). Takový proces je totiž Markovovým řetězcem s maticí přechodu (i-P 9 \ V p i-*/' kde p, q e (0, 1). □ 3.68. V jisté hře si můžete vybrat jednoho ze dvou soupeřů. Pravděpodobnost, že porazíte lepšího, je 1/4, zatímco horšího ze soupeřů porazíte s pravděpodobností 1/2. Soupeři ale nejsou rozlišeni, a tak nevíte, který z nich je ten lepší. Čeká Vás velké množství her (pro každou můžete zvolit jiného soupeře) a samozřejmě chcete dosáhnout celkově co největšího podílu vítězných her. Uvažte tyto dvě strategie: 1. Pro první hru si vyberete soupeře náhodně. Pokud nějakou hru vyhrajete, pokračujete se stejným soupeřem; jestliže ji prohrajete, změníte pro další hru soupeře. 2. Pro první dvě hry si vyberete (jednoho) soupeře náhodně. Dále se řídíte výsledkem předchozích dvou her, kdy na další dvě hry změníte soupeře, právě když obě předchozí prohrajete. Kterou ze strategií (moudře) zvolíte? Solution. Obě strategie jsou vlastně Markovovým řetězcem. Pro jednoduchost horšího ze soupeřů označujme jako osobu A a lepšího ze soupeřů jako osobu B. V prvním případě pro stavy „hra s osobou A", „hra s osobou 5" (a toto jejich pořadí) dostáváme pravděpodobnostní matici přechodu (1/2 3/4\ V/2 1/4/" Tato matice má všechny prvky kladné, a proto stačí najít pravděpodobnostní vektor Xqo, který přísluší vlastnímu číslu 1. Platí Jeho složky odpovídají pravděpodobnostem, že po dlouhé řadě her bude soupeřem osoba A, resp. B. Lze tedy očekávat, že 60 % her bude hráno proti horšímu ze soupeřů. Neboť 2 _ 3 1 2 1 5 = 5 ' 2 + 5 ' 4' vítězných her bude kolem 40 %. Pro druhou strategii zaveďme stavy „dvě hry po sobě s osobou A" a „dvě hry po sobě s osobou 5", které vedou na pravděpodobnostní matici přechodu /3/4 9/16\ V/4 7/16/ Snadno určíme, že nyní je t X r- \13 13/ Proti horšímu ze soupeřů by se tak hrálo (9/4)krát častěji než proti lepšímu z nich. Připomeňme, že pro první strategii to bylo (3/2)krát častěji. Druhá strategie je proto výhodnější. Ještě poznamenejme, že při druhé strategii bude přibližně 42,3 % her vítězných. Stačí totiž vyčíslit 11 9 1 4 1 0, 423 = — =---+---. 26 13 2 13 4 □ 195 G. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 5. ROZKLADY MATIC A PSEUDOINVERZE 3.69. Petr se pravidelně setkává se svým kamarádem. Je ovšem „proslulý" svou nedochvilností. Snaží se ale změnit, a proto platí, že v polovině případů přijde včas a v jedné desetině případů dokonce ještě dříve, pokud na minulé setkání přišel pozdě. Jestliže minule přišel včas nebo dříve, než měl přijít, vrátí se ke své „bezstarostnosti" a s pravděpodobností 0,8 dorazí pozdě a pouze s pravděpodobností 0,2 včas. Jaké je pravděpodobnost, že na dvacáté setkání přijde pozdě, když na jedenácté přišel včas? Solution. Zřejmě se jedná o Markovův proces se stavy „Petr přijde pozdě", „Petr přijde včas", „Petr přijde dříve" a s pravděpodobnostní maticí přechodu (pro uvedené pořadí stavů) /0,4 0,8 0, 8\ 7= 0,5 0,2 0,2 . \0, 1 0 0/ Jedenácté setkání je určeno pravděpodobnostním vektorem (0, 1, 0)T (s jistotou víme, že Petr přišel včas). Dvacátému setkání pak odpovídá pravděpodobnostní vektor /0\ /0,571578 368\ T9 ( 1 ] = ( 0,371316 224 ] . \0/ \0, 057 105 408/ Hledaná pravděpodobnost je tudíž 0, 571 578 368 (přesně). Dodejme, že je 70,571316224 0,571578 368 0,571578 368\ T9 = 0,371512 832 0,371316224 0,371316224). \0,057170944 0,057105 408 0,057105 408/ Odtud vidíme, jak málo záleží na tom, zda přišel na jedenácté setkáni pozdě (první sloupec), včas nebo dříve (druhý a současně třetí sloupec). □ 3.70. Dva studenti A a 5 tráví každé pondělní odpoledne hraním jisté počítačové hry o to, kdo z nich večer zaplatí společnou útratu v restauraci. Hra může rovněž skončit remízou, kdy večer oba platí právě polovinu útraty. Výsledek předešlé hry částečně ovlivňuje hru následující. Pokud tedy před týdnem vyhrál student A, potom s pravděpodobností 3/4 vyhraje opět a s pravděpodobností 1/4 skončí hra remízou. Remíza se opakuje s pravděpodobností 2/3 a s pravděpodobností 1/3 vyhraje ve hře následující po remíze student b. Pokud před týdnem vyhrál student b, pak s pravděpodobností 1 /2 své vítězství zopakuje a s pravděpodobností 1/4 vyhraje student A. Nalezněte pravděpodobnost, že dnes bude každý platit polovinu útraty, jestliže první hru před velmi dlouhou dobou vyhrál student A. Solution. Vlastně je zadán Markovův proces se stavy „vyhraje student A", „hra skončí remízou", „vyhraje student 5" (v tomto pořadí) pravděpodobnostní maticí přechodu /3/4 0 l/4\ r = j 1/4 2/3 1/4 ] . V 0 1/3 1/2/ Chceme najít pravděpodobnost přechodu z prvního stavu do druhého po velkém počtu n e N kroků (týdnů). Matice T je primitivní, protože / 9/16 1/12 5/16 \ T2 = I 17/48 19/36 17/48 ) . \ 1/12 7/18 1/3 / Stačí tak najít vlastní pravděpodobnostní vektor x^ matice T příslušný vlastnímu číslu 1. Snadno lze spočítat, že (2 3 2_V x°°-\r 7' 7/ ■ 196 CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET Víme, že vektor se jen velmi málo liší od pravděpodobnostního vektoru pro velká n a téměř nezávisí na počátečním stavu, tj. pro velká n e N můžeme klást /2/7 2/7 2/7\ T" « j 3/7 3/7 3/7 ] . \2/7 2/7 2/7/ Hledaná pravděpodobnost je prvkem této matice na druhé pozici v prvním sloupci (je druhou složkou vektoru jc^). Poměrně rychle jsme nalezli výsledek 3/7. □ 3.71. Adam, Bedřich a Čeněk si házejí balónem. Adam jej s pravděpodobností | hodí Čeňkovi, s pravděpodobností | Bedřichovi. Bedřich jej s pravděpodobností | hodí Adamovi a s pravděpodobností | Čeňkovi. Konečně Čeněk jej hodí s pravděpodobností | Adamovi a s pravděpodobností ^ Bedřichovi. Sestavte matici tohoto Markovova procesu a určete, s jakou pravděpodobností se míč bude nacházet po velkém počtu hodů u Bedřicha (každý potřebuje stejný čas na odhození balónu). 3.72. Sheldon a Leonard si hážou balónem přes síť. Pravděpodobnost, že Sheldon dokáže přehodit síť jsou 3/5 (s pravděpodobností 2/5 zůstane míč na jeho straně). Pravděpodobnost, že Leonard přehodí síť jsou 4/5 (s pravděpodobností 1/5 zůstane míč na jeho straně). Jaká je pravděpodobnost, že po velkém počtu pokusů obou pánů bude míč na Sheldonově straně? Formulujte úlohu jako Markovův proces a uvedte jeho matici. 197 g. doplňující príklady k cele kapitole 5. rozklady matic a pseudoinverze Řešení cvičení 3.2. Denní dávka by měla sestávat z 3, 9 kg sena a 4, 3 kg ovsa. Náklady na dávku potom budou 13, 82 Kč. 3.3. 3.12. x„ = 4" + 2 • (-2)" + 1 = (2" + (-1)")2. 3.13. -J—í 3 + ^ží\" _ _L í 3- Vži Y Ifl"V2ľ\ 2 j V2l\ 2 j' 3.14. x„ — 2\/3sin(n • (tt/6)) — 4cos(n • (jr/6)). 3.75. x„ = -3(-l)" - 2cos(« • (2tt/3)) - 2^3 sin(« • ((2tt/3)). 3.76. x„ = (-l)"(-2n2 + 8n - 7). 3.25. Leslieho matice daného modelu je (úmrtnost v první skupině označíme a) Podmínka stagnace populace odpovídá tomu, že matice má vlastní hodnotu 1, neboli polynom X3 — 2aX — 2a má mít kořen 1, t.j a — 1/4. 3.29. (i i) Matice má dominantní vlastní hodnotu 1, příslušný vlastní vektor je (|, 1). Protože je vlastní hodnota dominantní, tak se poměr diváků se ustálí na poměru 6:5. 3.32. Stejně jako v (||3.311|) skončí hra po třech sázkách. Jsou tedy opět všechny mocniny A, počínaje A3 shodné. . 100 3.47. Můžeme využít výsledku úlohy označované jako Ruinovaní hráče. Pravděpodobnost, že zanikne to oddělení, které má nyní 40 zaměstnanců, je podle tohoto příkladu rovna 1 _ ( 0.46 f 1 \_ 1-0,46/ 7/8 3/4 1/2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 V> 1/8 1/4 1/2 V 1 / 0,46 \25 \ 1-0,46 / = 0, 56. Stačilo dosadit p — 1 — 0, 54, y — 10/2 a x — 40/2 do (||3.6||). Prozíravější je tedy zvolit v tuto chvíli menší oddělení. 3.57. • Tvrzení je pravdivé. (B := AT A, bij — (i-tý řádek AT) ■ (j-tý sloupec A)= b p — (j-tý řádek AT) ■ (i-tý sloupec A)=(j-tý sloupec A) ■ (i-tý řádek AT) • Tvrzení zřejmě neplatí. Uvažte např. A — ^ 3.53. '10 0 \ /l 1 1 -2 0)[0 1 -1 .0 11 0 0 0 3.60. x„ = 2"+1 - 5""1 + 2n + 1. 3.64. 36 : 6 : 1. 198 CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET 3.66. Znovu se jedná o speciální případ Ruinovaní hráče. Stačí zadání vhodně přeformulovat. Pro p = 0, 47, y = 20 a x = 20 z (||3.6||) plyne výsledek 1 _ (_04Z_f ° 1 \_ 1-0,47/ 0,917 = 1 \_ 1-0,47/ 3.71. Matice procesu je | j 0 ^ 1, vlastní vektor příslušný vlastní hodnotě 1 je (y, 1, y|), hledaná A 1 o) pravděpodobnost pak 13^Q+11+25^18 = ^j. 23 /I 1\ /2 4\ 3.72. \\ \\, resp. I ^ f J , vlastní vektor příslušný vlastní hodnotě 1 je (1, 4/3), resp. (4/3, 1), hledaná pst 4/7.5 5 5 5 199 CHAPTER 4 Analytická geometrie poloha, incidence, projekce ? — a zase skončíme u matic... Vrátíme se teď k našemu pohledu na geometrii, když jsme zkoumali polohy bodů v rovině v 5. části první kapitoly, viz 1.23. Budeme se nejprve zajímat o vlastnosti prostorových objektů vymezených pomocí bodů, přímek, rovin apod. Podstatné přitom bude vyjasnění, jak jejich vlastnosti souvisí s pojmem vektorů a zda závisí na pojmu velikosti vektorů. V další části pak použijeme lineární algebru pro studium objektů, které už lineárně definované nejsou. Opět přitom budeme potřebovat trochu více maticového počtu. Výsledky budou důležité později při diskusi technik pro optimalizace, tj. hledání extrémů funčkních hodnot. Projektivní rozšíření afinních prostorů nám v závěru kapitoly ukáže, jak lze překvapivě snadno dosáhnout zjednodušení i stability algoritmických postupů typických pro práci s počítačovou grafikou. 1. Afinní a euklideovská geometrie Když jsme si ujasňovali strukturu řešení systémů J/7 lineárních rovnic v první části předchozí ^StJŠjr' kapitoly, zjistili jsme v ostavci 3.1, že všechna t^mjré^^- řešení nehomogenních systémů rovnic sice netvoří vektorové podprostory, vždy ale vznikají tak, že k jednomu jedinému řešení přičteme celý vektorový prostor řešení příslušné homogenní soustavy. Naopak, rozdíl dvou řešení nehomogenní soustavy je vždy řešením soustavy homogenní. Obdobně se chovají lineární diferenční rovnice, jak jsme již viděli v odstavci 3.14. 4.1. Afinní prostory. Návod na teoretické uchopení takové situace dává již diskuse geometrie roviny, viz odstavec 1.25 a dále. Tam jsme totiž popisovali přímky a body jako množiny řešení systémů lineárních rovnic. Přímka pro nás pak byla "jednorozměrným" prostorem, přestože její body byly popisovány dvěmi souřadnicemi. Parametricky jsme ji zadávali tak, že k jednomu bodu (tj. dvojici souřadnic) jsme přičítali násobky pevně zvoleného směrového vektoru. Stejně budeme postupovat i teď v libovolné dimenzi. _^0___j Standardní afinní prostor [ Standarní afinní prostor A„ je množina všech bodů v W = A„ spolu s operací, kterou k bodu A = Solution. Zřejmě postačuje vyřešit uvedenou soustavu rovnic. Jde o dvě lineární rovnice o třech neznámých. Jejím řešením je jednoparametrický systém (x, y, z) = (ř, 3ř — 7, 5ř — 14), což je již hledané parametrické vyjádření. Můžeme ale postupovat také odlišně. Potřebujeme totiž najít nenulový (směrový) vektor, který bude kolmý na (normálové) vektory (1, —2, 1), (2, 1, —1). Ten můžeme najít jednak vyřešením soustavy rovnic X\ — 2X2 + x3 = 0 2X\ + X2 — Xj, =0, vystihující, že skalární součin hledaného vektoru (xi,x2,x3) s vektory (1,—2,1) i (2, 1,-1) bude nulový (jde o zhomogenizovaný původní systém). Řešením je jednoparametrický systém kolmých vektorů (ŕ, 3ř, 5ř)- Vektor (jci, x2, x3) můžeme také určit přímo, pomocí 201 A. AFINNÍ GEOMETRIE 1. AFINNÍ A EUKLIDEOVSKÁ GEOMETRIE tzv. vektorového součinu (viz 4.24): (1, -2, 1) x (2, 1, -1) = (1, 3,5). Všimneme-li si navíc, že např. uspořádaná trojice (x, y, z) = (2,-1,-2) vyhovuje dané soustavě, dostaneme výsledek [2,-1,-2]+ t (1,3, 5), řel. Čtenář jistě postřehnul, že alternativní postup pouze geometricky interpretoval řešení nehomogenní lineární soustavy rovnic. □ 4.2. V M4 je parametricky dána rovina q : [0, 3, 2, 5] + t (1, 0, 1, 0) + s (2, -1, -2, 2), í,s é1 Vyjádřete tuto rovinu implicitně. Solution. Úkolem je najít soustavu lineárních rovnic čtyř proměnných x, y, z, u (čtyři proměnné jsou dány dimenzí prostoru), jíž budou vyhovovat právě souřadnice bodů uvedené roviny. Poznamenejme, že hledaná soustava bude obsahovat 2 = 4 — 2 lineárně nezávislé rovnice. Příklad vyřešíme tzv. eliminací parametrů. Body [x, y, z,u] e q splňují x = t + 2s, y = 3 — s, z = 2 + t - 2s, u = 5 + 2s, přičemž í,s é1. Odtud můžeme ihned přejít k maticovému zápisu ll 2 -1 0 0 0 °\ 0 -1 0 -1 0 0 3 1 -2 0 0 -1 0 2 v 0 2 0 0 0 -1 5 j kde první dva sloupce jsou směrové vektory roviny, za svislou čarou následuje záporně vzatá jednotková matice a za druhou svislou čarou jsou souřadnice bodu [0,3,2,5]. Tento přepis vzniká tak, že na výše uvedenou soustavu rovnic nahlížíme jako na soustavu rovnic pro neznámé t, s, x, y, z,u a všechny členy přitom převádíme na jednu stranu rovnic. Získanou matici převedeme pomocí elementárních řádkových transformací do tvaru, kdy před první svislou čarou bude maximální možný počet nulových řádků. Přičtením (— l)násobku prvního ..., an) e A„ a vektoru v = (v\, ..., vn) e W = V přiřadíme bod A + v = (cii + vi, ..., a„ + v„) ě8" = A„. Tyto operace splňují následující tři vlastnosti: (1) A + 0 = A pro všechny body A e A„ a nulový vektor Oeľ, (2) A + (v+w) = (A+v)+w pro všechny vektory v, w e V a body A e A„, (3) pro každé dva body A, B e A„ existuje právě jeden vektor v e V takový, že A+v = B. Značíme jej v = B —A, někdy také AB. Vektorový prostor W nazýváme zaměření standardního afinního prostoru A„. Všimněme si několika formálních nebezpečí. Používáme stejný symbol "+" pro dvě '^m~j!fé'( různé operace: přičtení vektoru ze zaměření KÍ^^^^Z? k bodu v afinním prostoru, ale také sčítání vektorů v zaměření V = W. Také nezavádíme zvláštní písmena pro samotnou množinu bodů afinního prostoru, tj. A„ pro nás představuje jak samotnou množinu bodů, tak i celou strukturu definující afinní prostor. Proč vlastně chceme rozlišovat množinu bodů prostoru An od jeho zaměření V, když se jedná jakoby o stejné W? Jde o velice podstatný formální krok k pochopení geometrie v W: Geometrické objekty jako přímky, body, roviny apod. nejsou totiž přímo závislé na vektorové struktuře na množině W a už vůbec ne na tom, že pracujeme s «-ticemi skalárů. Potřebujeme jen umět říci, co to znamená pohybovat se "rovně v daném směru". K tomu právě potřebujeme na jedné straně vnímat třeba rovinu jako neohraničenou desku bez zvolených souřadnic, ale s možností posunout se o zadaný vektor. Když přejdeme navíc k takovému abstraktnímu pohledu, budeme umět diskutovat "rovinnou geometrii" pro dvourozměrné podprostory, tj. roviny ve vícerozměrných prostorech, "prostorovou" pro třírozměrné atd., aniž bychom museli přímo manipulovat /í-ticemi souřadnic. Tento pohled je zachycen v následující definici: 4.2. Definition. Afinním prostorem A se zaměřením V rozumíme množinu bodů V, spolu se zobrazením V x V V, (A,v) ^ A + v, kde V je vektorový prostor a naše zobrazení splňuje vlastnosti (l)-(3) z definice standardního afinního prostoru. Pro libovolný pevně zvolený vektor u e V je tak definováno posunutí rv : A -> „4. jako zúžené zobrazení rv : V ~ V x {v} V, Ah^ A + v. Dimenzí afinního prostoru A rozumíme dimenzi jeho zaměření. Nadále nebudeme rozlišovat ve značení důsledně množinu bodů A a množinu vektorů V, budeme místo toho hovořit o bodech a vektorech affmího prostoru A. 202 CHAPTER 4. ANALYTICKÁ GEOMETRIE Z axiomů okamžitě plyne pro libovolné body A, B, C v afinním prostoru A (4.1) A - A = 0 e V (4.2) B-A = -(A-B) (4.3) (C - B) + (B - A) = C - A. Skutečně, (4.1) vyplývá z toho, že A + 0 = 0 a takový vektor musí být jednoznačný (první a třetí definiční vlastnost). Postupným přičtením B — A a. A — B k A (v uvedeném pořadí), zjevně dostaneme podle druhé definiční vlastnosti opět A, tedy jsme přičetli nulový vektor a to dokazuje (4.2). Obdobně z definiční vlastnosti 4.1 (2) a jednoznačnosti vyplývá (4.3). Všimněme si, že volba jednoho pevného bodu A0 e A nám určuje bijekci mezi V a A. Při volbě pevné báze m ve V tak dostáváme pro každý bod A e „4. jednoznačné vyjádření A = Ao + x\u\ + • • • + xnu„. Hovoříme o afinní soustavě souřadnic (Ao; u\, ..., un) zadané počátkem afinní souřadné soustavy Ao a bazí zaměření u nebo také o afinním repéru (Ao, u). Slovy můžeme shrnout situaci takto: Afinní souřadnice bodu A v soustavě (A0, u) jsou souřadnicemi vektoru A—A0 v bázi u zaměření V. Volba afinního souřadného systému ztotožňuje jakýkoliv n -rozměrný afinní prostor A se standardním afinním prostorem A„. 4.3. Afinní podprostory. Jestliže si vybereme v A jen «,<#«v body, které budou mít některé předem vybrané ííl^£ souřadnice nulové (třeba poslední jednu). /■'%nltSw% Dostaneme opět množinu, která se bude chovat — jako afinní prostor. Takto budeme skutečně parametricky popisovat tzv. afinní podprostory ve smyslu následující definice. .^^■w^ Podprostory afinního prostoru | Definition. Neprázdná podmnožina Q C A afinního prostoru A se zaměřením V se nazývá afinnípodprostor v A, jeli podmnožina W = {B — A; A, B e Q} C V vektorovým podprostorem a pro libovolné A e Q, vsWjeA + vsQ. Je podstatné mít obě podmínky zahrnuty v definici, protože je snadné najít příklady podmnožin, které budou splňovat první, ale nikoliv druhou podmínku. Přemýšlejte např. o přímce v rovině s vyjmutým jedním bodem. Pro libovolnou množinu bodů M c A v afinním prostoru se zaměřením V definujeme vektorový podprostor Z(M) = {{B - A; B, A e M}) c V všech vektorů generovaných rozdíly bodů z M. Zejména je V = Z (A) a každý afinní podprostor Q C A splňuje sám axiomy afinního prostoru se zaměřením Z(Q). a současně (—4)násobku druhého řádku ke třetímu řádku a dvojnásobku druhého ke čtvrtému řádku dostáváme /1 2 -1 0 0 0 °\ 0 -1 0 -1 0 0 3 1 -2 0 0 -1 0 2 2 0 0 0 -1 5 ) /1 2 -1 0 0 0 0 \ 0 -1 0 -1 0 0 3 0 0 1 4 -1 0 -10 \0 0 0 -2 0 -1 11 / Odkud plyne výsledek x + 4y - z - 10= 0, -2y - u + 11 = 0. Koeficienty za první svislou čarou v řádcích, které jsou před touto svislou čarou nulové, určují totiž koeficienty obecných rovnic roviny. Upozorněme, že kdybychom např. přepsali soustavu rovnic do matice /1 0 0 0 1 2 °\ 0 1 0 0 0 -1 3 0 0 1 0 1 -2 2 0 0 1 0 2 5 J která odpovídá situaci, kdy proměnné x, y, z, u zůstávají na levé straně rovnic, totožná úprava /1 0 0 0 1 2 °\ ( 1 0 0 0 1 2 0 \ 0 1 0 0 0 -1 3 0 1 0 0 0 -1 3 0 0 1 0 1 -2 2 -1 -4 1 0 0 0 -10 0 0 1 0 2 5 ) \ 0 2 0 1 0 0 11 dává výsledek ve tvaru -x - 4y + z = -10, 2y + u = 11. Při přepisování soustavy do matice je tudíž nutné zohledňovat, zda svislá čára odděluje levou stranu rovnic od pravé (či nikoliv). Jak jsme částečně viděli v tomto příkladu, metoda eliminace parametrů může být zdlouhavá a při jejím použití se lze snadno dopustit chyb. Jiné řešení. Řešení můžeme do značné míry urychlit naší "šikovností". Pokud si všimneme, že dva lineárně nezávislé normálové vektory, tj. vektory kolmé na vektory (1, 0, 1, 0), (2, —1, —2, 2). jsou např. (0, 2, 0, 1), (—1, 0, 1, 2), dosazením x = 0, y = 3, z = 2, u = 5 do rovnic 2y + u = a, —x + z + 2u = b bychom obdrželi a = 11, b = 12, následně hledané implicitní vyjádření 2y + u = 11, —x + z + 2u = 12. □ 203 A. AFINNÍ GEOMETRIE 1. AFINNÍ A EUKLIDEOVSKÁ GEOMETRIE 4.3. Nalezněte parametrické vyjádření roviny procházející body A = [2, 1, 1], £ = [3,4,5], C = [4,-2,3]. Poté parametricky vyjádřete otevřenou polorovinu obsahující bod C a vymezenou přímkou zadanou body A, B. Solution. K parametrickému vyjádření roviny potřebujeme jeden bod ležící v této rovině a dva směrové (lineárně nezávislé) vektory. Stačí zvolit bod A a vektory B - A = (1, 3, 4) a C - A = (2, -3, 2), které jsou očividně lineárně nezávislé. Bod [x, y, z] náleží do dané roviny právě tehdy, když existují čísla í, s ě R, pro která je x =2 + 1 ■ t+2-s, y = í + 3- t - 3-s, z = 1 + 4 ■ t + 2 ■ s; tj. hledané parametrické vyjádření roviny je [2, 1, 1] + t (1, 3, 4) + s (2, -3, 2), t, s e R. Volba s = 0 zjevně dává přímku, která prochází body A, B. Pro t = 0, s > 0 dostáváme polopřímku začínající v bodě A a procházející bodem C. Libovolně pevně zvolené t e R a měnné s > 0 pak zadávají polopřímku s počátkem na hraniční přímce a s body v polorovině, ve které se nachází bod C. To znamená, že hledanou otevřenou polorovinu můžeme vyjádřit parametricky takto [2, 1, 1] + t (1, 3, 4) + s (2, -3, 2), ř e R, s > 0. □ 4.4. Určete vzájemnou polohu přímek p : [1,0, 3] + t (2,-1,-3), íel, q : [1,1, 3] + s (1,-1,-2), s e R. Solution. Hledejme společné body zadaných přímek (průnik podpros-torů). Dostáváme soustavu 1 + 2t = 1 + s, 0 - t = 1 - s, 3 - 3ř = 3 - 2s. Z prvních dvou rovnic vyplývá, že t = 1, s =2. To ovšem nevyhovuje třetí rovnici. Soustava tak nemá řešení. Neboť směrový vektor (2, —1, —3) přímky p není násobkem směrového vektoru (1, —1, —2) přímky q, přímky nejsou rovnoběžné. Jedná se proto o mimoběžky. □ 4.5. Pro jaká čísla a e M jsou přímky p : [4, -4, 8] +ř(2, 1, -4), íel, q : [a, 6, -5] + s (1, -3,3), s e R různoběžné? Přímo z definic je také zřejmé, že průnik libovolné množiny afinních podprostorů je buď opět afinní podprostor nebo prázdná množina. Afinní podprostor (M) v A generovaný neprázdnou podmnožinou M c i je průnikem všech afinních podprostorů, které obsahují všechny body podmnožiny M. ^| Afinní obal a parametrický popis podprostorů [• Afinní podprostory si můžeme pěkně popsat pomocí jejich zaměření, jakmile si zvolíme jeden jejich bod Aq e M v generující množině bodů M. Skutečně, dostáváme (M) = {A0 + v; v € Z(M) c Z (A)}, tj. pro generování afinního podprostorů vezmeme vektorový podprostor Z (M) v zaměření generovaný všemi rozdíly bodů z M a ten pak přičteme k libovolnému z nich. Hovoříme také o afinním obalu množiny bodů M y A. Naopak, kdykoliv zvolíme podprostor U v zaměření Z (A) a jeden pevný bod A e A, pak podmnožina A + U vzniklá všemi možnými součty jediného bodu A se všemi vektory v U je afinní podprostor. Takový postup vede k pojmu parametrizace podprostorů: Nechť Q = A + Z(Q) je afinní podprostor v A„ a («i, ..., uk) je báze Z(Q) c R". Pak vyjádření podprostorů Q = {A + tlUl + ■■■ + tkuk; t\, ...,tk el) nazýváme parametrický popis podprostorů Q. Již jsme viděli jinou možnost zadávání afinních podprostorů: Jestliže máme zvoleny afinní souřadnice, pak lze zaměření podprostorů popsat pomocí homogenního systému lineárních rovnic v těchto souřadnicích. Dosazením souřadnic jednoho bodu našeho podprostorů Q do získaného systému rovnic dostaneme pravou stranu nehomogenního systému se stejnou maticí a celý podprostor Q je pak právě množinou řešení tohoto systému. Zadání podprostorů Q systémem rovnic v daných souřadnicích nazýváme implicitní popis podprostorů Q. Následující obecná věta říká, že takto umíme ve skutečnosti zadat všechny afinní podprostory a tím také ukazuje geometrickou podstatu vlastností množiny všech řešení systémů lineárních rovnic. 4.4. Theorem. Nechť (Aq, u) je afinní souřadný systém v n-rozměrném afinním prostoru A. Afinní podprostory dimenze k v A, vyjádřené v daných souřadnicích, jsou právě množiny řešení řešitelných systémů n — k lineárně nezávislých lineárních rovnic v n proměnných. Proof. Uvažujme libovolný řešitelný systém n — k lineárně nezávislých rovnic a;(x) = bi, b{ e R, i = l,...,n-k. Je-li A = (au...,anf e R" libovolné pevně zvolené řešení tohoto (nehomogenního) systému rovnic a je-li U C R" vektorový podprostor všech řešení zhomogenizovaného systému a{ (x) = 0, pak dimenze 204 CHAPTER 4. ANALYTICKÁ GEOMETRIE U je k a podmnožina všech řešení daného systému je tvaru {B; B = A + ..., yn)T, y = (yi..., yn)T e U} C R", viz. 3.1. Příslušný afinní podprostor je tím popsán parametricky ve výchozích souřadnicích (A0; u). Naopak, uvažme libovolný afinní podprostor Q C A„ a zvolme nějaký jeho bod B za počátek afinního souřadného systému (B, v) pro afinní prostor A. Protože Q = B+Z(Q), potřebujeme popsat zaměření podprostoru Q jako podprostor řešení homogenního systému rovnic. Zvolme tedy bázi v na Z (A) tak, aby prvních k vektorů tvořilo bázi Z(Q). Pak v těchto souřadnicích jsou vektory v e Z(Q) dány rovnostmi a j (v) = 0, j = k + 1, ..., n, kde cti jsou lineární formy z tzv. duální báze k v, tj. funkce přiřazení jednotlivých souřadnic v naší bázi v. Náš vektorový podprostor Z(Q) dimenze k v n -rozměrném prostoru R" je tedy skutečně dán jako řešení homogenního systému n — k nezávislých rovnic. Popis zvoleného afinního podprostoru v námi nově vybraném souřadném systému (B; v) je proto dán systémem homogenních lineárních rovnic. Zbývá nám se vypořádat důsledky přechodu z původního zadaného souřadného systému (A; u) do našeho přizpůsobeného (B; v). Z obecné úvahy o transformacích souřadnic v následujícím odstavci vyplyne, že výsledný popis podprostoru bude opět pomocí systému rovnic, tentokrát ale už obecně nehomogenních. □ 4.5. Transformace souřadnic. Dvě libovolně zvolené afinní soustavy souřadnic (A0,w), (Bq,v) se obecně liší posunutím počátku o vektor (#o — A0) a jinou bazí zaměření. Transformační rovnice mezi příslušnými souřadnicemi tedy vyčteme ze vztahu pro obecný bod X e A X = B0 +x\vi H-----\-x'nvn = B0 + (A0 - B0)+xlul + + xniin. Označme y = (vi, ..., y„)T sloupec souřadnic vektoru (A0 — Bq) v bázi v a M = (ay) buď matice vyjadřující bázi u prostřednictvím báze v. Potom A = yi+ a\\x\ H-----h ai„x„ Xn — Vft ~\~ dn\X\ -(-••• -\- ClnnXn tj. maticově x' = y + M ■ x. Jako příklad si můžeme vujádřit dopad takové změny (i „ báze na souřadné vyjádření podmnožin pomocí systémů lineárních rovnic. Nechť má v souřadnicích (A0; u) náš systém rovnic tvar S ■ x Solution. Přímky jsou různoběžné tehdy a jenom tehdy, když má soustava 4 + 2t = a + s, -4 + t = 6 - 3s, 8 - 4t = -5 + 3s právě 1 řešení. V maticovém zápisu řešíme (první sloupec odpovídá proměnné ř, druhý pak s) Vidíme, že soustava má právě 1 řešení tehdy a jenom tehdy, když je druhý řádek násobkem třetího. To je splněno pouze pro a = 3. Dodejme, že průsečíkem je v tomto případě bod [6, —3, 4]. □ 4.6. V R3 stanovte vzájemnou polohu přímky p zadané implicitně rovnicemi x + y - z = 4, x - 2y + z = -3 a roviny q : y = 2x — 1. Solution. Normálový vektor q je (2, —1,0) (uvažte zápis q : 2x — y + 0z = 1). Lze postřehnout, že platí (1,1,-1)+ (1,-2, 1) = (2,-1,0), tj. že normálový vektor roviny q je lineární kombinací normálových vektorů p. Zaměření přímky (zadané nenulovým směrovým vektorem kolmým na uvedené dva normálové vektory) je proto podprostorem zaměření roviny q (směrový vektor přímky je nutně kolmý na vektor (2, — 1, 0)). Lehce jsme zjistili, že přímka p je rovnoběžná s rovinou q. Zajímá nás, zda se protínají (zda p leží v q). Soustava rovnic x x 2x + y 2y y + 4, -3, 1 má nekonečně mnoho řešení, neboť sečtením prvních dvou rovnic dostaneme právě třetí z rovnic. Přímka p tak musí ležet v rovině q. □ Následuje standardní příklad na průnik vektorových prostorů. ^ Čtenář by měl být schopen následující příklad vyřešit. Doporučujeme nepokračovat ve čtení této učebnice, I1 dokud tomu tak nebude. 205 A. AFINNÍ GEOMETRIE 1. AFINNÍ A EUKLIDEOVSKÁ GEOMETRIE 4.7. Nalezněte průnik podprostorů <2i a Q2, je-li Qi : [4, -5, 1, -2] + íi (3, 5, 4, 2) + t2 (2, 4, 5, 1) + t3 (0, 3, 1, 2), £2 : [4, 4, 4, 4] + Sl (0, -6, -2, -4) + s2 (-1, -5, -3, -3), kde ři, Í2, Í3, s\, s2 e M. Solution. Bod X = [jei, ] e M náleží do Qi fl Q2 právě tehdy, když je xx - 4 - (3\ l2\ í0\ -5 5 4 3 X3 - 1 + ři 4 + Í2 5 + Í3 1 -2 W V1/ w pro nějaká čísla ti, t2, t3 e M a současně když je xx "4" /°\ 4 + *i -6 + s2 -5 X3 - 4 -2 -3 4 pro nějaká si, «2 ^ M. Porovnáním získáváme /3\ /2\ /0\ /4-4\ M 5 4 3 4 + 5 -6 -5 4 + Í2 5 + Í3 1 — 4- 1 + Sl -2 + s2 -3 W V1/ \* + V Při maticovém zápisu (pro pořadí proměnných t\, t2, t3, s\, s2 a po převodu vektorů u $i a s2 na levou stranu) řešme pomocí řádkových operací /3 5 4 V 2 0 1 (3 2 0 0 1 0 \ 6 5 9 0 2 9 18 10 27 2 3 3 0 7 3 6 5 9 4 3 6) 1° -1 6 12 7 18; /3 00000\ 0 2 0 0 0 0 0 0 1 2 0 3 \ 0 0 0 0 1 0 ) Odtud vidíme, že t\ = t2 = s2 = 0 a pro s\ = t e M je t3 Podotkněme, že k určení Q\ n Q2 stačilo znát bud'ŕi, t2, t3 nebo s\,s2 Vraťme se nyní k vyjádření 2t. X\ ~4~ *2 4 X3 4 x4 4 -6 -2 v-v + ^2 -5 -3 + ř -2 v-v Průnikem zadaných podprostorů je tedy přímka (5 [4,4,4,41 + ^(0,3,1,2), sel Pro kontrolu rovněž dosaďme -2ř) *1 - 4 - /3\ (2\ /0\ -5 5 4 3 X3 - 1 + ři 4 + h 5 + Í3 1 JC4 -2 V1/ IV s maticí systému 5. Potom S ■ x = S ■ AT1 • (y + M ■ x) - S ■ AT1 • y = b. Proto v nových výše uvažovaných souřadnicích (S0; v) bude mít náš systém rovnic tvar (5 • M~l) ■ x' = b' = b + (S ■ M~l) • y. Pokud tedy máme nějakou podmnožinu popsánu systémem lineárních rovnic v jednom afinním repéru, pak tomu tak bude i ve všech ostatních afinních souřadných systémech. To plně dokončuje důkaz předchozí věty. 4.6. Příklady afinních podprostorů. (1) Jednorozměrný (standardní) afinní prostor je množina všech bodů reálné přímky A\. Její zaměření je jednorozměrný vektorový prostor M (a nosná množina také W). Afinní souřadnice dostaneme volbou počátku a měřítka (tj. báze ve vektorovém prostoru W). Všechny vlastní afinní podprostory jsou 0-rozměrné, jsou to právě všechny body reálné přímky M. (2) Dvourozměrný (standardní) afinní prostor je množina všech bodů prostoru A2 se zaměřením M2. (Nosnou množinou je M2.) Afinní souřadnice dostaneme volbou počátku a dvou nezávislých vektorů (směrů a měřítek). Vlastní afinní podprostory jsou pak všechny body a přímky v rovině (0-rozměrné a 1-rozměrné). Přímky přitom jednoznačně zadáme jejich jedním bodem a jedním generátorem zaměření (tzv. parametrický popis přímky). (3) Trojrozměrný (standardní) afinní prostor je množina všech bodů prostoru A3 se zaměřením M3. Afinní souřadnice dostaneme volbou počátku a tří nezávislých vektorů (směrů a měřítek). Vlastní afinní podprostory jsou pak všechny body, přímky a roviny (0-rozměrné, 1-rozměrné a 2-rozměrné). (4) Podprostor všech řešení jedné lineární rovnice a ■ x = b pro neznámý bod \_x\, ..., xn] e A„, známý nenulový vektor koeficientů (a\, ..., an) a skalár b e M je afinní podprostor dimenze n — 1 (říkáme také, že je jeho kodimenze 1), tj. tzv. nadrovina v A„. 4.7. Afinní kombinace bodů. Zavedeme nyní obdobu lineárních kombinací vektorů. Nechť Ao, - - -, Ak jsou body v afinním prostoru A. Jejich afinní obal ({A0 ..., Ak}) můžeme zapsat jako {A0 + ři(Ai - A0) + • • • + tk(Ak - A0); h, ... ,tk el) a v libovolných afinních souřadnicích (tj. každý bod A; je vyjádřen sloupcem skalárů) můžeme tutéž množinu zapsat jako (A0, Ak) = {Í0A0+Í1AÍ+- • -+tkAk; u e M, = l^ i=0 206 CHAPTER 4. ANALYTICKÁ GEOMETRIE Afinní kombinace bodů Obecně výrazy f0A0 + t\A\ + • • • + tkAk s koeficienty splňujícícmi Xž=oř' = 1 rozumíme body A0 + X/=iř* ~~ Aq) a nazýváme je afinní kombinace bodů. Body Ao ..., Ak jsou v obecné poloze, jestliže generují &-rozměný afinní podprostor. Z našich definic je vidět, že to nastane, právě když pro kterýkoliv bod A; z nich platí, že vektory vzniklé pomocí rozdílů tohoto bodu A; a ostatních bodů A j jsou lineárně nezávislé vektory. Všimněme si také, že zadání posloupnosti (dim A) + 1 bodů v obecné poloze je ekvivalentní zadání afinního repéru se středem v prvním z nich. 4.8. Simplexy. Afinní kombinace je obdobná konstrukce pro body afinního prostoru jako byla lineární kombinace pro vektorové prostory. Skutečně, afinní podprostor generovaný body A0 ..., Ak je roven množině všech afinních kombinací svých generátorů. Můžeme však nyní dobře zobecnit i pojem "mezi dvěma body na přímce". V dvojrozměrném případě tomu odopovídá vnitřek trojúhelníku. Obecně budeme postupovat takto: ^„^mw^ &-rozměrné simplexy | Nechť Ao, - - -, Ak je k + 1 bodů afinního prostoru A v obecné poloze. Množina A = A(A0, ..., Ak) definovaná jako množina všech afinních kombinací bodů A; s pouze nezápornými koeficienty, tj. k A = {t0A0 + tlAl + --- + tkAk;ti e [0, 1] c R, ^f,- = 1}, se nazývá ^-rozměrný simplex generovaný body A;. Jednorozměrný simplex je úsečka, dvourozměrný trojúhelník, nula-rozměrný simplex je bod. Všimněme si, že každý ^-rozměrný simplex má právě k + 1 stěn, které jsou postupně zadány rovnicemi ř; = 0, i = 0, ..., k. Přímo z definice je vidět, že jde opět o simplexy, a to s dimenzí k — 1. Hovoříme o hranici simplexu. Např. trojúhelník má za svou hranici tři hrany, každá z nich pak dva body. Zadání podprostoru jako množiny afinních kombinací bodů v obecné poloze je ekvivalentní parametrickému popisu. Obdobně pracujeme s parametrickými popisy simplexů. 4.9. Konvexní množiny. Podmnožina M afinního prostoru se nazývá konvexní, jestliže s každými svými dvěma body A, B obsahuje i celou úsečku A (A, B). Přímo z definice je vidět, že každá konvexní množina obsahuje s každými k + 1 body v obecné poloze i celý jimi definovaný simplex (formální ověření je také obsaženo v důkazu následující věty). Konvexními množinami jsou např. (1) prázdná podmnožina, (2) afinní podprostory, + (3 - 2r) M 3 1 w + t -6 -2 v-v □ 4.8. Zjistěte, zda leží body [0, 2, 1], [-1, 2, 0], [-2, 5, 2] a [0, 5, 4] zťv jedné rovině. Solution. Libovolná dvojice zadaných bodů z afinního prostoru R3 určuje vektor (viz definice afinního prostoru; jeho souřadnice jsou dány po složkách rozdíly souřadnic daných dvou bodů). To, že dané čtyři body leží v rovině je ekvivalentní tomu, že jsou tři vektory dané jedním vybraným bodem a vždy jedním ze tří zbylých lineárně závislé. Vybereme např. bod [0, 2, 1] (na výběru nezáleží), pak uvažujeme vektory [0,2,1] - [-1,2,0] = (1,0,1), [0,2,1] - [-2,5,2] = (2, -3, -1) a [0, 2, 1] - [0, 5, 4] = (0, -3, -3). Vidíme, že součet dvojnásobku prvního vektoru a třetího vektoru je roven druhému vektoru, vektory jsou tedy lineárně závislé (jinak má taky matice, jejíž řádky jsou tvořeny souřadnicemi daných vektorů, hodnost nižší než tři; v tomto případě se tedy jedná o matici 0 -3 -3 která má hodnost dva). Dané body tedy leží v rovině. □ 4.9. Na kolik částí mohou dělit prostor (R3) tři roviny? Pro každou možnost popište odpovídající případ. 4.10. Rozhodněte, zda leží bod [2, 1,0] uvnitř konvexního obalu bodů [0, 2, 1], [1, 0, 1], [3, -2, -1], [-1,0, 1]. Solution. Sestavíme nehomogenní lineární soustavu, pro koeficienty t\, Í2, h, Í4, afinní kombinace daných bodů, která dává první bod (jsou určeny jednozačně, pokud dané body neleží v rovině). /Ol 3 -1\ M /2\ 2 0 -2 0 h _ 1 11-11 ti ~ 0 \1 1 1 1 / W vv Poslední rovnice udává, že jde o afinní kombinaci. Jejím řešením dostáváme (t\, t2, h, ř4) = (1, 0, 1/2, —1/2), nejedná se tedy o konvexní kombinaci, (nelze odvodit pomocí projekcí na jednotlivé osy). □ 4.11. V R3 je dán čtyřstěn ABCD, kde A = [4, 0, 2], B = [-2, -3, 1], C = [1, -1, -3], D = [2, 4, -2]. Rozhodněte, zda leží bod X = [0, — 3, 0] uvnitř tohoto čtyřstěnu. 207 A. AFINNÍ GEOMETRIE 1. AFINNÍ A EUKLIDEOVSKÁ GEOMETRIE Solution. Daný bod uvnitř daného čtyřstěnu neleží. Vyjádříme-li X jakožto afinní kombinaci jeho vrcholů (řešením soustavy čtyř lineárních rovnic o čtyřech neznámých a, b, c ad dané rovností X = aA+bB + cC + dD), obdžíme X = \ A + \B + \C - \D. To znamená, že X neleží v daném čtyřstěnu, tj. v konvexním obalu bodů A, B, C a D (a, b, c i d by musela být v intervalu (0, ) 1). □ 4.12. Afinní transformace souřadnic bodů V afinní bázi {[1, 2, 3], (1, 1, 1), (1,-1, 2), (2, 1, 1)} v £Sk K3 jsou vyjádřeny souřadnice bodu X jako [2,2,3]. Určete jeho souřadnice ve standardní bázi, tj. v bázi y 1 {[0,o, oj, (i,o, 0), (0, i,0), (0,o, i)}. Solution. Souřadnice [2, 2, 3] v bázi {[1, 2, 3], (1, 1, 1), (1, -1, 2), (2, určují předpisem[l,2,3] + 2-(l, 1, 1) +2-(1, -l,2) + 3-(2, 1, 1) = [11,5, 12] souřadnice bodu X ve standardní bázi. □ 4.13. Afinní transformace předpisu zobrazení. Nalezněte předpis afinního zobrazení / v souřadné soustavě dané bází u = {(1, 1), (—1, 1)} a počátkem [2, 0], které je ve standardní bázi v M2 dáno jako Solution. Matice přechodu od dané báze u ke standardní bázi k je G-.')■" Matici zobrazení v bázi ([2, 0], u) získáme tak, že nejprve transformujeme souřadnice v bázi ([2, 0], u) na souřadnice ve standardní bázi, tedy v bázi ([0, 0], (1, 0), (0, 1)), poté aplikujeme matici zobrazení / ve standardní bázi a na závěr výsledek transformujeme zpět do souřadnic v bázi ([2, 0], u). Transformační rovnice přechodu od suouřadnic yi, yi v bázi ([2, 0], u) k souřadnicím x\, x2 v standardní bázi jsou Odtud máme, že C) (: ) (C) Q) ( )(::)•(.') Pro předpis zobrazení pak dostáváme /(Ji, y2) = - (4 I)[G 0(0 -.')(£)♦©)♦(!)]♦(-. - (-. •.')(:)•( v) □ (3) úsečky, polopřímky p = {P + t ■ v; ŕ > 0}, (4) obecněji k- rozměrné poloprostory a = {P +tl-vl + --- + tk-vk; tu...,tkeR,tk>0}, (5) úhly v dvojrozměrných podprostorech j6 = {P + h ■ vi + h ■ v2; h > 0, t2 > 0}. Přímo z definice také plyne, že průnik libovolného systému konvexních množin je opět konvexní. Průnik všech konvexních množin obsahujících danou množinu M nazýváme konvexní obal K(M) množiny M. Theorem. Konvexní obal libovolné podmnožiny M c A je s KAM) = {Mi + • • • + Ms; X ř< = !' ř< - °' Ai e M} Proof. Označme S množinu všech afinních kombinací na pravé straně dokazované rovnosti. Nejprve ověříme, že je S konvexní. Zvolme tedy dvě sady parametrů ti, i = 1, .., s\, ťj, j = \, ..., s2 s požadovanými vlastnosti. Bez újmy na obecnosti můžeme předpokládat, že s\ = s2 a že v obou kombinacích vystupují stejné body z M (jinak prostě přidáme sčítance s nulovými koeficienty). Uvažme libovolný bod úsečky zadané takto získanými body: e(tlAl + --- + tsAs) + (l-e)(ť1Al + --- + ťsAs), 0 < e < 1. Zřejmě jsou opět všechny v S. Zbývá ukázat, že konvexní obal bodů A i, ..., As nemůže být menší než S. Samotné body A; odpovídají volbě parametrů t j = 0 pro všechny ji a t,■ = 1. Předpokládejme, že tvrzení platí pro všechny množiny s nejvýše s — 1 body. To znamená, že konvexní obal bodů A\, ..., As_i je (podle předpokladu) tvořen právě těmi kombinacemi z pravé strany dokazované rovnosti, kde ts = 0. Uvažme nyní libovolný bod A = Mi + • • • + Ms e 5, řs < 1, a afinní kombinace €(Mi + "- + íJ-iVi) + (l-f(l-řs))Aí- 0 !) = I-1' ~2- ~3]- Souřadnice hledaného obrazu X" jsou X" = X' + (0, 0, 1) = [—1, —2, —2]. Při zrcadlení bodu [3, 2, 1] jsme samozřejmě mohli použít přímo matice získané v příkladu || 2.791|. □ B. Eukleidovská geometrie 4.19. Určete vzdálenost přímek v M3. p : [1,-1,0] +f (-1,2, 3), a q : [2, 5,-1] + ř(-l, -2, 1). Solution. Vzdálenost je dána jako velikost kolmého průmětu libovolné příčky (spojnice) daných přímek do ortogonálního doplňku vektorového podprostoru generovaného jejich zaměřeními. Tento ortogonální doplněk zjistíme například pomocí vektorového součinu: ((-1, 2, 3), (-1, -2, l))x = ((-1, 2, 3) x (-1, -2, 1)) = ((8,-2, 4)) = ((4,-1,2)). Spojnicí daných přímek je například úsečka [1, —1, 0][2, 5, —1], promítneme tedy vektor [1, —1, 0] — [2, 5, —1] = (—1, —6, 1). Pro vzdálenost přímek pak dostáváme: |(-1,-6,1). (4,-1,2)| 4 PÍP, B. Přímo z definice je zřejmé, že stačí vyjádřit obraz f(A0) počátku souřadnic v A v souřadnicích na B, tj. vyjádřit vektor /(A0) — B0 v bázi v jako sloupec souřadnic y0 a vše ostatní je pak určeno násobením maticí zobrazení

p(A,C) (4) V každé kartézké souřadné soustavě (Aq, e) mají body A = A0 + aiei-\-----\-anen, B = A0 +&i l«2l Odtud již vyplývá, že nejmenší možné vzdálenosti je skutečně dosaženo, a to právě pro náš bod P. Vypočtená vzdálenost je skutečně ||«2ll- Obdobně ukážeme obecný výsledek. Pro volbu libovolných bodů A e Kafi e Qje jejich rozdíl dán jako součet vektorů ux e Z(TZ) + Z(Q) a u2 e (Z(TZ) + Z(Q))-1, přičemž komponenta u2 nezávisí na volbě bodů. Přičtením vhodných vektorů ze zaměření 1Z&Q zjevně obdržíme body A' a B', jejichž vzdálenost je právě || u21|. □ Rozšíříme nyní náš stručný přehled elementárních úloh v analytické geometrii. 4.17. Příklady standardních úloh. (1) Najděte vzdálenost bodu A e £„ od podprostoru Q c £„: Postup při řešení je dán ve větě 4.16. (2) V £2 veďte bodem A přímku q svírající s danou přímkou p daný úhel: Připomeňme, že na úrovni rovinné geometrie jsme s odchylkami vektorů již pracovali (viz např. 2.43). Najdeme vektor uéM2 ležící v zaměření přímky q a zvolíme vektor v mající od u zadanou odchylku. Hledaná přímka je dána bodem A a zaměřením (v). Úloha má dvě nebo jedno řešení. (3) Spočtěte patu kolmice vedené bodem na danou přímku: Postup je uveden v důkazu předposledního bodu věty 4.16. (4) V £3 určete vzdálenost dvou přímek p, q: Zvolíme libovolně jeden bod z každé přímky, A e p, B e q. Komponenta vektoru A — B v ortogonálním doplňku (Z(p) + Z(q))1- má velikost rovnu vzdálenosti p a q. (5) V £3 najděte osu dvou mimobězek p a q: Osou zde rozumíme příčku, která realizuje nejmenší možnou vzdálenost daných mimobězek pomocí bodů průniku. Opět lze postup dovodit z důkazu věty 4.16 (poslední bod). Nechť r] je podprostor generovaný jedním bodem A e p a součtem Z(p) + (Z(p) + Z(q))^-. Pokud nejsou přímky p a q rovnoběžné, půjde o rovinu. Pak průnik r) n q spolu se zaměřením (Z(p) + Z(q))1- dávají parametrický popis hledané osy. Pokud jsou přímky rovnoběžné, bude mít úloha nekonečně mnoho řešení. 214 CHAPTER 4. ANALYTICKÁ GEOMETRIE 4.18. Odchylky. Stejně jako vzdálenost, i řada dalších geometrických pojmů jako odchylky, orientace, objem apod. je v bodových prostorech £„ mTV, zaváděna prostřednictvím vhodných pojmů ve vektorových euklidovských prostorech. Připomeňme, že odchylku dvou vektorů jsme definovali na konci třetí části druhé kapitoly, viz 2.43. Skutečně, z Cauchyovy nerovnosti plyne 0 < < 1, má tedy smysl definice odchylky cp(u, v) vektorů u, v e V v reálném vektorovém prostoru se skalárním součinem vztahem u ■ v cos (p(u, v) =-, 0 < (p(u, v) < 2jz. INI NI To je zcela v souladu s praxí v dvourozměrném euklidovském prostoru M2 a naší filozofií, že pojem týkající se dvou vektorů je ve své podstatě záležitostí dvourozměrné geometrie. V euklidovské rovině jsme také již používali goniometrické funkce cos a sin, které jsme definovali pouze geometrickou úvahou, ke které se vrátíme na začátku kapitoly páté, kdy také budeme moci precizně ověřit geometrický názor, že je funkce cos in intervalu [0, 7t] klesající. Ve vícerozměrných prostorech je proto odchylka dvou vektorů vždy měřena v rovině, kterou tyto vektory generují (nebo je nula) a náš definiční vztah odpovídá zvyklostem ve všech dimenzích. V libovolném reálném vektorovém prostoru se skalárním součinem přímo z definic plyne ||n-u||2 = |N|2 + N|2-2(M.u) = |N|2 + N|2-2|NINI coscp(u,v). To je patrně dobře známá kosinová věta z rovinné geometrie. Dále platí pro každou ortonormální bázi e zaměření V a nenulový vektor u e V vztah INI2 = 2>-ei|2. Podělením této rovnice číslem ||w||2 dostáváme vztah 1 = ^(cosi ) + pi t>i ) +qi {u2, vt ) - p2{v1,v1) - q2{v2,v1) = 0, ((-3,2, -5, -7, —3), u2 ) + pi (uuv2) +qx (u2,v2) - p2 (vu v2) - q2 (v2, v2) = 0. Vyčíslením těchto skalárních součinů získáváme soustavu lineárních rovnic 6pi - \qx - 9p2 - 3q2 = 7, -4pi + 6qi + 6q2 = 6, 9pi - 33p2 - q2 = 31, 3pt - 6qi - p2 - 9q2 = -11, kterou vyřešíme pomocí řádkových transformací v maticovém zápisu / 6 -4 9 V 3 0 -9 0 -33 -1 7 \ 31 -11 / 1 0 0 0 0 10 0 0 0 10 y 0 0 0 1 -1 -1 2 / Ře ením této soustavy je tedy čtveřice (pi, qi, p2, q2) = (0, -1, -1, 2). Určili jsme Xl-X2 = (-3, 2, -5, -7, -3)-u2+Vl-2v2 = (-3, 4, -2, -4, 2). Velikost vektoru (—3, 4, —2, —4, 2) a současně vzdálenost rovin o\, a2 činí 7 = V(-3)2 + 42 + (-2)2 + (-4)2 + 22. Vzdálenost q\ od £2 jsme určovali odlišným způsobem ne vzdálenost o\ od er2. Uvedené metody jsme samozřejmě mohli použít v obou případech. Zkusme znovu vypočítat vzdálenost rovin o\, a2 postupem použitým k vyčíslení vzdálenosti rovin q\, q2. Hledejme tedy ortogonální doplněk vektorového podprostoru generovaného vektory (2,1,0,0,1), (-2,0,1,1,0), (2,2,4,0,3), (2,0,0,-2,-1) Snadno získáme Odchylka podprostoru U\, U2 je reálné číslo a = (p(Uu U2) e [0, f ] splňující: (1) Je-li dim Ui = dim U2 = l,Ui = (u), U2 = (v), pak \u.v\ cos a u v (2) Jsou-li dimenze U\, U2 kladné a U\ D U2 = {0}, pak je odchylka minimem všech odchylek jednorozměrných podprostoru a = min{ u\ má tedy symetrickou pozitivně semidefinitní matici at a a ý je zobrazení adjungované k cp. Viděli jsme, že každé takové zobrazení má pouze nezáporná reálná vlastní čísla a že má ve vhodné ortonormální bázi diagonální matici s těmito vlastními čísly na diagonále, viz 3.29 a 3.31. Nyní můžeme odvodit obecný postup pro výpočet odchylky a = (p{U\, ř/2). Theorem. V předchozím označení nechť je X nejvetší vlastní hodnota matice at a. Pak (cos a)2 = X. Proof. Nechť u e U\ je vlastní vektor zobrazení ý o

:x + y+2z + l=0. Solution. Vidíme, že normálový vektor roviny q je (1, 1,2). Sečtení rovnic zadávajících přímku p při opsání první z nich dává x + 3y + z = 0, 2y + 2z = 0. Odsud plyne, že y = —z a x = 2z,. Vektor (2, —1, 1) je proto směrovým vektorem přímky p; jinak řečeno, můžeme zapsat (p očividně prochází počátkem) p : [0, 0,0] + ř(2,-1, 1), tel. Pro úhel cp vektorů (1,1, 2), (2, —1, 1) platí 2-1+2 1 cos<» =-—-— = -. Vě-Vě 2 Je tedy cp = 60°. To je ovšem velikost úhlu, který svírá směrový vektor p s normálovým vektorem q. Hledaný úhel je doplňkem tohoto úhlu, a tak je výsledek 30 ° = 90 ° - 60 °. □ 219 B. EUKLEIDOVSKÁ GEOMETRIE 1. AFINNÍ A EUKLIDEOVS KÁ GEOMETRIE 4.29. V reálné rovině nalezněte přímku, která prochází bodem [—3,0] as přímkou p : VŠx + 3y + 5 = 0 svírá úhel 60°. Solution. Nejprve si uvědomme, že podmínkám úlohy musí vyhovovat právě dvě přímky. Obecná rovnice přímky v rovině má tvar ax + by + c = 0, přičemž lze volit a2 + b2 = 1. Nalezněme tedy taková čísla a,b, c e M, aby byly splněny uvedené podmínky. Dosadíme-li x = —3, y = 0 do této rovnice (přímka má procházet bodem [—3, 0]), dostaneme c = 3a. Podmínka, že přímka má svírat úhel 60 ° s přímkou p, potom dává V3a + 3b - = cos 60c 2 12 v3= V3a + 3b Další úpravou obdržíme ±l=a + V3b a umocněním 1 = a2 + 3b2 + 2V3ab. Využijeme-li a2 + b2 = 1, získáme 0 = 2b2 + 2V3ab, tj. 0 = b (b + V3a) . Celkem tak máme možnosti (připomeňme, že c = 3a a a2 + b2 = 1) ±1, 0, c = ±3; + 1 u J* ±-, b = =p- 2 2 Snadno se ověří, že těmito koeficienty určené přímky x + 3 = 0, 1 73 3 ■ x —— y + 0 2 2^2 zadání skutečně vyhovují. □ Jiný přístup k řešení téhož problému jako v předchozím příkladě, ukazuje řešení příkladu následujícího: 4.30. Bodem [1,2] e přímky vedte přímku, která má odchylku 30° od p: [0, l] + ř(l,l). Solution. Odchylka dvou přímek je dána úhlem, který svírají jejich směrové vektory. Stačí tedy najít směrový vektor v_ hledané přímky. Ten získáme například rotací směrového vektoru přímky p o 30°. Matice rotace o 30° je cos 30° sin 30° - sin 30' cos 30° Mí D Hledaný vektor v je tedy (i ?)oH# + ö (1) VólVk(A;uu...,uk) (2) (VolVk(A;Ul,...,uk))2 uk ■ 2 a vektory u\, ..., w„_i e V. Dosadíme-li těchto n — 1 vektorů jako prvních n — 1 argumentů n-lineárníhho zobrazení definovaného pomocí determinantu při výpočtu objemu výše, pak nám zbude jeden volný argument, tj. lineární forma na V. Protože však máme k dispozici skalární součin, odpovídá každá lineární forma právě jednomu vektoru. Tento vektor v € V nazveme vektorový součin vektorů u\, ..., w„_i, tj. pro každý vektor w e V platí (v, w) = [U\, -1, w\ Značíme v = u\ x ... x w„_i. Jsou-li v nějaké ortonormální bázi souřadnice našich vektorů v (yi y«Y w Oi , x„) a u, (uij, ... u„j)T, naše definice má vyjádření yixi H-----h ynxn un tni Ul(n-l) X\ ln(n — l) Xfi. Rotovat jsme mohli i v opačném smyslu. Hledaná přímka (jedna ze dvou možných) má tedy parametrické vyjádření 0 „VŠ i 73 . [1,2] +1----, — + - 1 2 2 2 2 0' □ 4.31. Určete obecnou rovnici všech rovin, které svírají odchylku 60° s rovinou x+y+z—l = 0 a obsahují přímku p : [1, 0, 0]+ř (1, 1, 0). 4.32. Určete odchylku rovin ct : [1,0, 2]+ (1,-1, l)ř + (0, 1,-2)5 p: [3,3,3] + (l,-2,0)ř + (0, 1,1)5 Solution. Průsečnice má směrový vektor (1, —1, 1), kolmá rovina na ni má pak s danými rovinami průniky generované vektory (1, 0, —1) a (0, 1, 1). Tyto jednorozměrné podprostory svírají úhel 60°. □ 4.33. Je dána krychle ABCDA'B'C'D' (ve standardním označení, tj. ABCD a A'B'C D' jsou stěny, A A' pak hrana). Určete odchylku vektorů AB' a AD'. Solution. Uvažujme krychli o hraně 1 a umístěme ji v M3 tak, že bod A bude mít ve standardní bázi souřadnice [0, 0, 0], bod B pak souřadnice [1, 0, 0] a bod C souřadnice [1, 1,0]. Potom má bod B' souřadnice [1, 0, 1] a bod D' souřadnice [0, 1, 1]. Pro vyšetřované vektory tedy můžeme psát AB' = B' - A = [1,0, 1]-[0,0,0] = (1,0, 1), AD' = D' - A = [0, 1, 1] - [0, 0, 0] = (0, 1, 1). Podle definice odchylky

) =-= -, 11(1,0,1)1111(0,1,1)11 2' tedy cp = 60°. □ Další příklady na odchylky viz . 4.34. Určete cos a, kde a je odchylka dvou sousedních stěn pravidelného osmistěnu (těleso, jehož stěny tvoří osm rovnostranných trojúhelníků). Solution. Odchylky libovolných dvou sousedních stěn jsou ze symetrie osmistěnu shodné. Rovněž tak nezáleží na jeho velikosti. Uvažujme osmistěn s délkou hrany 1, který je umístěn do standardní kartézské souřadné soustavy v M3 tak, že jeho těžiště je v bodě [0, 0, 0]. Jeho vrcholy jsou pak v bodech A = [^, 0, 0], B = [0, ^, 0], C = [-^, 0, 0], D = [0, 0], E = [0, 0, -^] a F = [0, 0, ^]. 221 B. EUKLEIDOVSKÁ GEOMETRIE 1. AFINNÍ A EUKLIDEOVS KÁ GEOMETRIE Určeme odchylku stěn CD F a BCF. Taje dána odchylkou vektoru kolmých na jejich průnik a ležících v daných stěnách, tedy vekorů kolmých na CF. Těmi jsou vektory dané výškami z bodů D, resp. F na stranu C F v trojúhelnících CD F, resp. BCF. Výšky v rovos-tranném trojúhelníku splývají s těžnicemi, jedná se tedy o úsečky SD a SB, kde S je střed strany CF. Protože známe souřadnice bodů C a F, má bod S souřadnice [—-^,0, ^p] a pro vektory máme SD = {4,-4, -4) a SB = (^, Celkem cosa (Ji _V2 _V2\ /-Vi V2 _V^n 1 ^ 4 ' 2' 4 ^ ^ 4 ' 2 ' 4 ^ _ K^.-Í.-^IIIK^.^.-Í)!! 3' Je tedy a = 132°. □ 4.35. V euklidovském prostoru M5 vypočtěte odchylku

i = (1,-1,2, 1,0), v2 = (0, 1,3,2, 0), u3 = (1,0, 0,1,0), i;4 = (L3, 1,0, 0) a jako pu označme ortogonální projekci (kolmý průmět) vektoru u do zaměření podprostorů V (do vektorového podprostorů generovaného vektory v\, v2, v3, v 4). Určíme-li pu, ze vzorce " Pu I I (4.1) cos

F, F(u, u) = (cp(u), u) zadává bijekci mezi symetrickými lineárními zobrazeními a kvadratickými formami na V. Proof. Skutečně, bilineární forma s pevně zadaným ji ,. druhým argumentem je lineární formou au( ) = F( , u) a v přítomnosti skalárního součinu je nutně dána vztahem a(u)(v) = v ■ w pro vhodný vektor w. ifí1 ' Klademe cp(u) = w. Přímo ze vztahu v souřadnicích výše pak vyplývá, že cp je lineární zobrazení s maticí A. Je tedy samoadjungované. Naopak, každé symetrické zobrazení cp zadává vztahem F(u,v) = (cp(u),v) = (u,cp(v)) symetrickou bilineární formu a jejím zúžením kvadratickou formu. □ Z tohoto tvrzení vyplývá okamžitý důsledek, že pro každou kvadratickou formu / existuje ortonormální báze zaměření, ve které má / diagonální matici (a diagonální hodnoty jsou jednoznačně určeny až na pořadí). Díky ztotožnění kvadratických forem se zobrazeními můžeme také korektně zavést hodnost kvadratické formy jakožto hodnost její matice v kterékoliv bázi (tj. hodnost je rovna dimenzi obrazu příslušného zobrazení cp). 4.28. Klasifikace kvadrik. Vraťme se k naší rovnici (4.4). Naše výsledky o kvadratických formách nám umožňují dosáhnout rovnice ve tvaru ^hx2 + ^jbixi+b = 0. Můžeme tedy přímo předpokládat, že ji v takovém tvaru máme a v dalším kroku pro souřadnice x; s kt ^ 0 provedeme doplnění do čtverců, které "pohltí" kvadráty i lineární členy týchž neznámých (tzv. Lagrangeův algoritmus, kterému se budeme obecněji věnovat níže) . Tak nám zůstanou nejvýše ty neznámé, pro které byl jejich koeficient u kvadrátu nulový, a získáme tvar i=\ Pif + X hixj +c = °- j splňující k j = 0 To odpovídá posunutí počátku souřadnic o vektor se souřadnicemi pi a zároveň volbě báze zaměření tak, abychom dostali požadovaný diagonální tvar v kvadratické části. Ve výše odvozeném ztotožnění forem se symetrickými zobrazeními to znamená, že cp je diagonální na ortogonálním doplňku svého jádra. Pokud nám opravdu zůstaly nějaké lineární členy, můžeme upravit ortonormální bázi zaměření na jádru zobrazení cp tak, aby odpovídající lineární forma (0,0,1,0,0), (1,1,0,1,1), (1,1,0,1,0). Protože dimenze prostoru Z(U) n (Z(U) n Z(V))-1- je 1, můžeme pou ít vzorec (||4.11|), kde u = (1, 0, 0, 1, 1) a pu je kolmá projekce u do Z(V) n (Z(U) n Z(V))L. Má být pu = a (1, 1,0, 1, 1) +b(l, 1,0, 1,0) a má platit ( pu - u, (1, 1, 0, 1, 1)) = 0, ( Pu - u, (1, 1, 0, 1, 0)) = 0, což vede na soustavu rovnic 4a + 3b = 3, 3a + 3b = 2 s jediným řešením a = 1, b = —1/3. Tímto jsme určili pu = (|,|,0,|,l) a z (||4.11|) již plyne cos^ = M|MZM^ = ^; tj_ ^ = 0,49 (^28°), □ 4.36. Nyní ukážeme jednoduché využití Cauchyovy nerovnosti. Dokažte, že pro každé n e N a pro libovolná kladná čísla xi,X2, ... ,x„ e M platí n2< (I + I + ... + ±) \Xi x2 xn/ H-----h — ) ■ (xi+x2-\-----h x„). Poté uvedte, kdy nastává rovnost. Solution. Postačuje uvážit Cauchyovu nerovnost \u-v\< \\u\\\\v\\ v euklidovském prostoru W pro vektory u = (—!=, -í=,..., —l—), v = (v^r, v^> • • •, v*T) Takto dostaneme (4.2) Dokazovanou nerovnost potom obdržíme umocněním (||4.2||). Dále víme, že Cauchyova nerovnost přejde v rovnost, právě když bude vektor u násobkem vektoru v, což již implikuje x\ = x2 = ■ ■ ■ = xn. □ 4.37. Spočtěte objem rovnoběžnostěnu v M3 s podstavou v rovině z = 0 a s hranami zadanými dvojicemi vrcholů [0, 0, 0], [—2, 3, 0]; [0, 0, 0], [4, 1,0] a [0, 0, 0], [5,7,3]. 225 B. EUKLEIDOVSKÁ GEOMETRIE 2. GEOMETRIE KVADRATICKÝCH FOREM Solution. Rovnoběžnostěn je zadán vektory (4,1,0), (—2,3,0), (5, 7, 3). Vime, že jeho objem je roven determinantu -2 5 3 7 0 3 3 • 14 = 42. Doplňme, že při změnách pořadí vektoru bychom obdrželi výsledek ±42, neboť determinant udává orientovaný objem rovnoběžnostěnu. Ještě poznamenejme, že objem rovnoběžnostěnu by se dle výpočtu determinantu nezměnil, pokud by třetí vektor byl [a, b, 3] pro libovolná čísla a, b e R. Jeho objem pochopitelně závisí pouze na kolmé vzdálenosti rovin dolní a horní podstavy a jejich obsahu 4 -2 1 14. □ [4,0,2], B = Rozhodněte, zda 4.38. V R3 je dán čtyřstěn ABCD, kde A = [-2, -3, 1], C = [1, -1, -3], D = [2, 4, -2] leží bod X = [0, —3,0] uvnitř tohoto čtyřstěnu. Solution. Objem čtyřstěnu je šestina objemu rovnoběžnostěnu, jehož tři hrany z bodu A jsou B — A = (—6, —3, — 1), C — A = (—3, —1, — 5) a Z) — A = (—2,4, —4) a ten je dán absolutní hodnotou determinantu ' -6 -3 -1 -3 -1 -5 -2 4 -4 124 124. Celkem je tedy objem čtyřstěnu □ 4.39. Je dán rovnoběžník [0,0,1], [2,1,1], [3,3,1], [1,2,1]. Určete bod X na přímce p : [0,0,1] + (1, 1, l)ř tak, aby rovnoběžnostěn určený daným rovnoběžníkem a bodem X měl objem 1. Solution. Sestavíme determinant, jehož absolutní hodnota udává objem rovnoběžnostěnu při pohyblivém bodu X: 3t. Požadujeme, aby byl roven 1, či —1, tedy t = 1/3 nebo t = —1/3. □ 4.40. Jsou dány vektory u = (u\, u2, u3) au = (vi,v2, v3). Doplňte je třetím jednotkovým vektorem tak, aby rovnoběžnostěn daný těmito třemi vektory měl co největší objem. Solution. Označme hledaný jednotkový vektor jako t_ = (t\, t2, ř3). Podle Tvrzení ||??|| je objem rovnoběžnostěnu ^(O; u, v_, t) dán jako byla násobkem prvního prvku duální báze. Umíme tedy již dosáhnout výsledného tvaru k ^hy] + byk+1+c = 0, i = l kde k je hodnost matice kvadratické formy /. Pokud je b ^ 0, můžeme ještě další změnou počátku dosáhnout vynulování konstanty c v rovnici. Celkem si tedy shrňme, že lineární člen se může (ale nemusí) objevit jen pokud je hodnost / menší než n, c e R může být nenulové pouze když je b = 0. Výsledné rovnice nazýváme kanonickými analytickými tvary kvadrik. 4.29. Případ £2. Pro ilustraci předchozího postupu projděme celou diskusi ještě jednou pro nejjednodušší případ netriviální dimenze. fc: Původní rovnice má tvar anx2 + a^y2 + 1a\2xy + a\x + a2y + a = 0. Volbou vhodné báze zaměření a následným doplněním čtverců dosáhneme tvaru (opět používáme stejného značení x, y pro nové souřadnice): aiix2 + a^y2 + a\x + a2y + a = 0 kde at může být nenulové pouze v případě, že au je nulové. Posledním krokem obecného postupu, tj. v dimenzi n = 2 jen případnou volbou posunutí, dosáhneme právě jedné z rovnic: 0 = x2 /a2 + y2 /b2 + 1 prázdná množina 0 = x2 /a2 + y2 /b2 — 1 elipsa 0 = x2 /a2 — y2 /b2 — 1 hyperbola 0 = x2/a2 — 2py parabola 0 = x2 /a2 + y2 /b2 bod 0 = x2 /a2 — y2 /b2 2 různoběžné přímky 0 = x2 — a2 2 rovnoběžné přímky 0 = xz 0 = x2 + a2 2 splývající přímky prázdná množina Počátek kartézkých souřadnic je středem zkoumané kuželosečky, nalezená ortonormální báze zaměření zadává směr poloos, výsledné koeficienty a, b pak dávají velikosti poloos v nedegenerovaných směrech. 4.30. Afinní pohled. V předchozích dvou odstavcích jsme hledali podstatné vlastnosti a standardizované analytické popisy objektů zadávaných v eukli-^5 dovských prostorech kvadratickými rovnicemi. Hledali jsme přitom co nejjednodušší rovnice v mezích daných volností výběru kartézských souřadnic. Geometrická formulace našeho výsledku pak může být taková, že pro dva různé objekty - kvadriky, zadané v obecně různých kartézských souřadnicích, existuje euklidovská transformace na £n (tj. afinní bijektivní zobrazení zachovávající velikosti) tehdy a jen tehdy, pokud výše uvedený algoritmus 226 CHAPTER 4. ANALYTICKÁ GEOMETRIE vede na stejný analytický tvar, až na pořadí souřadnic. Navíc můžeme při našem postupu přímo získat kartézské souřadnice, ve kterých jsou naše objekty dány výslednými kanonickými tvary, a tím i explicitní vyjádření euklidovské transformace, která naše objekty na sebe převádí (jak víme bude vždy složena z operací posunutí, otočení a zrcadlení vůči nadrovině). Pochopitelně se můžeme ptát, do jaké míry umíme podobnou věc v afinních prostorech s volností výběru jakékoliv afinní souřadné soustavy. Např. v rovině to bude znamenat, že neumíme rozlišit kružnici od elipsy, samozřejmě bychom přitom měli odlišit hyperbolu a všechny ostatní typy kuželoseček. Hlavně ale splynou mezi sebou všechny hyperboly atd. Ukážeme si hlavní rozdíl postupu na kvadratických formách a k záležitosti se pak ještě vrátíme ve třetí části této kapitoly. Uvažme nějakou kvadratickou formu / na vektorovém prostoru V a její analytické vyjádření f(u) = xT Ax vzhledem ke zvolené bázi na V. Pro vektor u = x\U\ + • • • +xnu„ pak také zapisujeme formu / ve tvaru f(xl,...,xn) = Yjaijxixj, ij V předchozích odstavcích jsme již s využitím skalárního součinu ukázali, že pro vhodnou bázi bude matice A diagonální, tj. že pro příslušnou symetrickou formu F bude platit F(ui,Uj) = 0 při i ^ j. Každou takovou bázi nazýváme polární báze kvadratické formy /. Samozřejmě si pro takový účel můžeme vždy skalární součin vybrat. Dokážeme si ale toto tvrzení znovu bez využití skalárních součinů tak, že získáme daleko jednodušší algoritmus na to, jak takovou polární bázi najít mezi všemi bázemi. Tím se zároveň dovíme podstatné informace o afinních vlastnostech kvadratických forem. Následující věta bývá v literatuře uváděna pod názvem Lagrangeův algoritmus. Theorem. Nechť V je reálný vektorový prostor dimenze n, f : V -» M kvadratická forma. Pak na V existuje polární báze pro f. Proof. (1) Nechť A je matice / v bázi u = {u\, ..., un) na y a předpokládejme au ^ 0. Pak můžeme psát f(x\, ..., xn) = a\\x\ + 7.a\iX\Xi + • • • + a22x\ + ... = a.yy(a\\X\ + a\2x2 + • • • + a\nxn)2 + členy neobsahující x\. Provedeme tedy transformaci souřadnic (tj. změnu báze) tak, aby v nových souřadnicích bylo x\ = a\\X\ + a\2x2 + • • • + a,i„xn, x?2 = xi, ■ ■ ■, x'n = xn. To odpovídá nové bázi (spočtěte si jako cvičení příslušnou matici přechodu!) V\ = a^u\, v2 = U2 — a^a\jU\, ..., vn = un — a^a\nu\ abolutní hodnota determinantu U\ h h h h u2 v2 h = U\ «2 «3 v3 h V\ V2 V3 t_-(u_XV) < \\t_\\ U M X V\\ = \\U X V\\. Použité znaménko nerovnosti vyplývá z Cauchyovy nerovnosti, přičemž víme, že rovnost nastává právě pro ř = c(u x v), c e M. Velikost objemu hledaného rovnoběžnostěnu tedy může být maximálně rovna velikosti obsahu rovnoběžníka daného vektory u, v (tj. velikosti vektoru (u x v)). Rovnost nastane právě když (u x v) \(u xv)\ C. Geometrie kvadratických forem □ 4.41. Určete polární bázi formy / : 2x\x2 + x\ + 4x2X3 + 6x3. Solution. Její matice je i, f (x\, X2, X3) — 3x? + Podle bodu (1) Lagrangeova algoritmu (viz věta 4.30) provedeme úpravy 1 2 f(xux2, x3) = -(3xí + x2)2 + -x\ + 4x2x3 + 6x2 1,32 , = -^y\ + -(-y2 + 2y3)2 - 3^1 + 2^2 a vidíme, že forma má hodnost 2 a matice přechodu do příslušné polární báze w se získá posbíráním provedených transformací: 2 2 z3 = y3= x3, z2 = -y2 + 2y3 = -x2 + 2x3, Z\ = y\ = 3*i + x2, tedy matice přechodu od standardní báze k polární bázi je /3 1 0\ T= 0 f \° 0 X/ Matici jsme získali tak, že jsme odvozené vyjádření souřadnic v polární bázi pomocí souřadnic ve standardní bázi napsali do řádků uvažované matice (čtenář si rozmyslí, že sloupce této matice jsou souřadnice vektorů standardní báze v polární bázi). Souřadnice vektorů polární báze pak snadno odečteme z matice T~l (jsou to její sloupce). T~l = 0 § -3 \0 0 1 hledanápolárníbázetedyje((i,0, 0), §,0), (1,-3,1)). □ 227 C. GEOMETRIE KVADRATICKÝCH FOREM 2. GEOMETRIE KVADRATICKÝCH FOREM 4.42. Určete polární bázi formy / : M3 -» M3. /(xi,x2,x3) 2x\X3 -\- x2,. Solution. Matice dané formy je /o o ŕ A = ( 0 1 0 V o o, Hned v prvním kroku můžeme přehodit proměnné: yi = x2, y2 = x\, y3 = x3. Aplikace bodu (1) Lagrangeova algoritmu je pak triviální (nejsou tu žádné společné členy), pro další krok ale nastane situace zbodu(4). Zavedeme tedy transformaci z 1 = yi,z2 = y2,z?, = y3~yi-Pak f(xl,x2,x3) = z\ + 2z2(z3 + z2) = z\ + ^(2z2 + Z3)2 - ^zj. Celkem dostáváme z,\ = y\ = x2, z2 = yi = zs = V3 — y2 = X3 — X \. Matice přechodu T do příslušné polární báze je tedy 0 1 0\ /O 1 0\ 1 0 0 -1 0 1 a T~ 1 0 0 .0 1 1, polární báze je tedy ((0, 1,0), (1, 0, 1) (0, 1, 1)). 4.43. Nalezněte polární bázi kvadratické formy / : M3 □ l, která je ve standardní bázi dána předpisem f(X\, X2, X3) = X\X2 + X1X3. Solution. Aplikací uvedeného Lagrangeova algoritmu dostáváme: f(X\, X2, X3) = 2X\X2 + X2X3 provedeme substituci podle bodu (4) algoritmu y2 — X2 — x\, y\ — x\, y3 — = 2xx{xx + y2) + (xi + y2)x3 = 2x\ + 2xiy2 + x:x3 + y2x3 = 1 1,1,1 1 2 1 2 - 2^2xi +yi + 2X3) ~ y2 substituce yi = 2xi + y2 + j-X3 -x3 + y2x3 1 1 1 ± ± 1113 2?i - 2^ " 8X3 + ^3 = 2^ " 2{2yi ~ 2X3)2 + 8X3 substituce y3 \yi- 3x3 1 2yí + ň: •3 • V souřadnicích yi, yi, X3 má tedy daná kvadratická forma diagonální tvar, to znamená že báze příslušná těmto souřadnicím je polární bází dané kvadratické formy. Pokud ji máme vyjádřit musíme získat matici přechodu od této polární báze ke standardní bázi. Z definice matice přechodu jsou pak její sloupce bázovými vektory polární bázi. Matici přechodu získáme tak, že buď vyjádříme staré proměnné (xi, x2, x3) pomocí nových proměnných (yi, V3, X3), nebo ekvivalentně vyjádříme nové proměnné pomocí starých (což jde jednodušeji), pak ale musíme spočítat inverzní matici. a tak, jak lze očekávat, v nové bázi bude příslušná symetrická bilinerání forma splňovat g(v\,Vi) = 0 pro všechny i > 0 (přepočtěte!). Má tedy / v nových souřadnicích analytický tvar al~l1x'l2 +h, kde h je kvadratická forma nezávislá na proměnné x\. Z technických důvodů bývá lepší zvolit v nové bázi v\ = u 1, opět dostaneme výraz f = f\ +h, kde f\ závisí pouze na x'j, zatímco v h se x\ nevyskytuje. Přitom pak g(v\, t>i) = au. (2) Předpokládejme, že po provedení kroku (1) dostaneme pro h matici (řádu o jedničku menšího) s koeficientem u x'22 různým od nuly. Pak můžeme zopakovat přesně stejný postup a získáme vyjádření / = f\ + f2 + h, kde v h vystupují pouze proměnné s indexem větším než dvě. Tak můžeme postupovat tak dlouho, až buď provedeme n — 1 kroků a získáme diagonální tvar, nebo v řekněme /-tém kroku bude prvek právě získané matice nulový. (3) Nastane-li poslední možnost, ale přitom existuje jiný prvek cijj 7^ 0 s j > i, pak stačí přehodit i-tý prvek báze s 7-tým a pokračovat podle předešlého postupu. (4) Předpokládejme, že jsme narazili na situaci cijj = 0 pro všechny j > i. Pokud přitom neexistuje ani žádný jiný prvek a.jk 7^ 0 s j > i, k > i, pak jsme již úplně hotovi, neboť jsme již dosáhli diagonální matici. Předpokládejme, TJZdjk 7^ 0. Použijeme pak transformaci v j = u j + uk, ostatní vektory báze ponecháme (tj. x'k = xk —Xj, ostatní zůstávají). Pakh(vj, Vj) = h(uj, uj) +h(uk, uk) + 2h(uk, uj) = 2ajk 7^ 0 a můžeme pokračovat podle postupu v (1). □ 4.31. Afinní klasifikace kvadratických forem. Po výpočtu polární báze Lagrangeovým al-goritmem můžeme ještě vylepšit bázové vektory pomocí násobení skalárem tak, aby v příslušném analytickém vyjádření naší formy vystupovaly v roli koeficientů u kvadrátů jednotlivých souřadnic pouze skaláry 1, —1 a 0. Následující věta o setrvačnosti říká navíc, že počet jedniček a mínus jedniček nezávisí na našich volbách v průběhu algoritmu. Tyto počty nyzýváme signaturou kvadratické formy. Opět tedy dostáváme úplný popis kvadratických forem ve smyslu, že dvě takové formy jsou převoditelná jedna na druhou pomocí afinní transformace tehdy a jen tehdy, když mají stejnou signaturu. Theorem. Pro každou nenulovou kvadratickou formu hodnosti r na reálném vektorovém prostoru V existuje celé číslo 0 < p < r ar nezávislých lineárních forem 0 zatímco pro v e <2je/(i;) < 0. Nutně tedy platí P f) Q = {0}, a proto dim P + dim Q < n. Odtud plyne p + (n — q) < n, tj. p < q. Opačnou volbou podprostorů však získáme i q < p. Je tedy p nezávislé na volbě polární báze. Pak ovšem pro dvě matice se stejnou hodností a stejným počtem kladných koeficientů v diagonálním tvaru příslušné kvadratické formy získáme stejný analytický tvar. □ Při diskusi symetrických zobrazení jsme hovořili o defmitních a semidefitních zobrazeních. Tatáž diskuse má jasný smysl i pro symetrické bilineární formy a kvadratické formy. Kvadratickou formu / forma na reálném vektorovém prostoru V nazýváme (1) positivně definitní, je-li f(u) > 0 pro všechny vektory (2) positivně semidefinitní, je-li f(u) > 0 pro všechny vektory u e V, (3) negativně definitní, je-li f(u) < 0 pro všechny vektory (4) negativně semidefinitní, je-li f(u) < Opro všechny vektory u e V, (5) indefinitní, je-li f(u) > 0 a /(u) < 0 pro vhodné vektory u, v e V. Stejné názvy používáme i pro symetrické reálné matice, jsou-li maticemi patřičných kvadratických forem. Signaturou symetrické matice pak rozumíme signaturu příslušné kvadratické formy. 4.32. Theorem (Sylvestrovo kritérium). Symetrická reálná matice A je positivně definitní, právě když jsou všechny její hlavní minory kladné. , , 3 3 2 -1 / 1 4 1 3 3 2 v0 0 1 Jedna z polárních bazí dané kvadratické formy je tedy například báze (je dána sloupci poslední matice) ((1/3, 1/3, 0), (-2/3, 4/3, 0), (-1/2, 1/2, 1)). □ 4.44. Určete typ kuželosečky dané rovnicí: 3x2 — 3x\x2 + x2 — 1 = 0. Solution. Pomocí algoritmu úpravy na čtverec postupně dostáváme: 3x] - 3xxx2 + x2 - 1 = ^(3-*4 - ^x2)2 - ^2 + x2 - 1 = 1 , 4 3 1 , 1 = -y? - -(-*2 - -) + - - i = 3n 3 4 T 3 1 2 4 2 2 = 2^"3/2"3-Podle seznamu kuželoseček 4.29 se tedy jedná o hyperbolu. □ 4.45. Pomocí doplnění na čtverce vyjádřete kvadriku -x2 + 3y2 + z2 + 6xy - 4z = 0 ve tvaru, ze kterého lze vyčíst její typ. Solution. Všechny členy obsahující x připojíme k —x2 a provedeme doplnění na čtverec. Tím získáme -(x - 3y)2 + 9y2 + 3y2 + z2 - 4z = 0. Žádné „nežádoucí" členy obsahující y nemáme, a proto postup opakujeme pro proměnnou z, což dává -(x - 3y)2 + 12y2 + (z - 2)2 - 4 = 0. Odtud plyne, že existuje transformace proměnných, při které obdržíme (rovnici můžeme nejdříve vydělit 4) rovnici + y2 + l2 - 1 = 0. □ O typu kuželosečky můžeme rozhodnout i bez úpravy na některý z tvarů uvedený v seznamu 4.29. Jak již víme, každou kuželosečku můžeme napsat ve tvaru anx2 + 2úti2xy + a^y2 + 2a\3x + 2a23y + út33 = 0. 229 C. GEOMETRIE KVADRATICKÝCH FOREM 2. GEOMETRIE KVADRATICKÝCH FOREM Determinanty A = det A au ayi «12 «22 «11 a\2 «13 «12 a22 a23 a S «13 a32 a33 jsou tzv. invarianty kuželosečky, což znamená, že se nemění při euklidovské transformaci souřadnic (rotace a posunutí) navíc různé typy kuželoseček mají různá znaménka těchto determinantů. i A / O vlastní (regulární) kuželosečky: elipsa pro 8 > 0, hyperbola pro 8 < 0 a parabola pro 8 = 0 Aby šlo o reálnou elipsu, nikoliv imaginární, musí být navíc («11 + «22)A < 0. • A = 0 nevlastní kuželosečky (singulární, degenerované), přímky Snadno se přesvědčíme, že znaménka, resp. nulovost, uvedených determinantů jsou skutečně invariantní vůči změně souřadnic. Označme X = lvi a A je matice kvadratické formy. Pak příslušná kuželosečka má tvar XTAX = 0. Kuželosečku ve středovém základním tvaru dostaneme otočením a posunutím, tedy transformací do nových souřadnic*', /, pro které platí x = x' cos a — y7 siná + c\ y = x' sin a + y' cos a + c2, tedy maticově pro nové souřadnice X' platí (4.3) X — srna c\ cos a c2 MX'. 0 1 Dosazením vztahu X = MX' do rovnice kuželosečky, pak dostáváme rovnici kuželosečky v nových souřadnicích, tj. XTAX = 0 (MX')T A(MX') = 0 X'TMT A MX' 0. Označme A' matici kvadratické formy kuželosečky v nových souřadnicích. Pak tedy A' = MT AM, kde matice M = /cos a —siná cA siná cos a c2 j má jednotkový determinant, tedy 0 0 1/ det A' = det MT det A det M = det A = A. Nutně také deteminant A33, který je algebraickým doplňkem prvku «33 je nezávislý na změně souřadnic, protože pro nulové posunutí - tedy pouze otočení - je vztah det A' = det MT det A det M také Symetrická reálná matice A je negativně definitní právě, když (—1)' I Ai I > 0pro všechny hlavní submatice Ai. Proof. Budeme si muset podrobněji rozebrat, jak vypadají transformace použité v Lagrangeově al-% goritmu pro konsturkci polární báze. Transformace použité v prvním kroku tohoto algoritmu mají vždy horní trojúhelníkovou matici T a navíc, při použití technické modifikace zmíněné v důkazu věty 4.30, má tato matice jedničky na diagonále: /l "n2\ 0 1 o \: : / Taková matice přechodu od báze u k bázi v má několik pěkných vlastností. Zejména její hlavní submatice Tk tvořené prvními k řádky a sloupci jsou matice přechodu podprostorů Pk = {m, ..., iik) od báze (u\, ..., uk) k bázi (y\ ..., vk). Hlavní submatice Ak matice A formy / jsou maticemi zúžení formy / na Pk. Při přechodu od u k v_ daném maticí přechodu T jsou tedy matice Ak a A'k zúžení na podprostory Pk ve vztahu Ak = TkTA'k(Tk)~l. Inverzní matice k horní trojúhelníkové matici s jedničkami na diagonále je přitom opět horní trojúhelníková matice s jedničkami na diagonále, můžeme tedy podobně vyjádřit i A' pomocí A. Podle Cauchyovy věty jsou tedy determinanty matic Ak a A'k stejné. Celkem jsme tak dokázali velice užitečné pomocné tvrzení: Nechť je f kvadratická forma na V, dim V = n, a nechť je u báze V taková, že při hledání polární báze La-grangeovým algoritmem není nikdy potřebné použít body (3) a (4). Pak je výsledkem analytické vyjádření kde r je hodnost formy f, X\, ... ,Xr 7^ 0 a pro hlavní submatice (původní) matice A kvadratické formy f platí \Ak\ = X\X2 ... Xk, k < r. V námi uvažovaném postupu se při každé postupné transformaci vždy další sloupec pod diagonálou v matici A vynuluje. Odtud je již jasné, že případná nenulovost hlavních mi-norů v matici A zaručí nenulovost dalšího diagonálního členu v A. Touto úvahou jsme dokázali tzv. Jacobiho větu: Corollary. Nechť f je kvadratická forma hodnosti r na vektorovém prostoru V s maticí A v bázi u. V Lagrangeově algoritmu není zapotřebí jiného kroku než doplnění čtverců právě, když pro hlavní submatice v A platí \A\\ 7^ 0, ..., \Ar\ 7^ 0. Pak existuje polární báze (a obdržíme ji výše odvozeným algoritmem), ve které má f analytické vyjádření ti . . . 2 , lA2l 2 , , \Ar\ 2 f(xi, ...,xn) = \ Ai\x1 + ——x2 H----+ —--xr. \M\ \Ar-i\ Jsou-li tedy všechny hlavní minory kladné, pak podle právě dokázané Jacobiho věty je jistě / positivně definitní. Předpokládejme naopak, že forma / je positivně definitní. Pak pro vhodnou regulární matici P platí 230 CHAPTER 4. ANALYTICKÁ GEOMETRIE A = PTEP = PTP. Je tedy \A\ = \P\2 > 0. Nechť w je zvolená báze, ve které má forma / matici A. Zúžení / na podprostory Vk = {u\, ..., uk) je opět positivně definitní forma fk, jejíž maticí v bázi u\, ..., uk je hlavní submatice Ak. Proto je podle předchozí části důkazu také \Ak\ > 0. Tvrzení o negativně definitních vyplývá z předchozího a skutečnosti, že A je positivně definitní právě, když —A je negativně definitní. □ 3. Projektivní geometrie V mnoha elementárních textech o analytické geometrii autoři končí afinními a euklidovskými objekty popsanými výše. Na spoustu praktických úloh euklidovská nebo afinní geometrie stačí, na jiné I- bohužel ale nikoliv. Tak třeba při zpracovávání obrazu z kamery nejsou zachovávány úhly a rovnoběžné přímky se mohou (ale nemusí) protínat. Dalším dobrým důvodem pro hledání širšího rámce geometrických úloh a úvah je požadovaná robustnost a jednoduchost numerických operací. Daleko jednodušší jsou totiž operace prováděné prostým násobením matic a velice těžko se totiž od sebe odlišují malinké úhly od nulových, proto je lepší mít nástroje, které takové odlišení nevyžadují. Základní ideou projektivní geometrie je rozšíření afinních prostorů o body v nekonečnu způsobem, který bude dobře umožňovat manipulace s lineárními objekty typu bodů, přímek, rovin, projekcí, apod. 4.33. Projektivní rozšíření afinní roviny. Začneme tím nejjednodušším zajímavým případem, geometrií v rovině. Jestliže si body roviny A2 představíme jako rovinu z = 1 v V?, pak každý bod P naší afinní roviny představuje vektor u = (x, y, 1) e M3 a tím i jednorozměrný podpros-tor (u) c M3. Naopak, skoro každý jednorozměrný pod-prostor v M3 protíná naši rovinu v právě jednom bodě P a jednotlivé vektory takového podprostoru jsou dány souřadnicemi (x, y, z) jednoznačně, až na společný skalární násobek. Žádný průnik s naší rovinou nebudou mít pouze podprostory s body o souřadnicích (x, y, 0). ^.^mw^ Projektivní rovina | Detinition. Projektivní rovina V2 je množina všech jednorozměrných podprostorů v M3. Homogenní souřadnice bodu P = (x : y : z) v projektivní rovině jsou trojice reálných čísel určené až na společný skalární násobek, přičemž alespoň jedno z nich musí být nenulové. Přímka v projektivní rovině je definována jako množina jednorozměrných podprostorů (tj. bodů v V2), které vyplní dvourozměrný pod-prostor (tj. rovinu) v M3. Abychom měli před očima konkrétní příklad, podívejme se v afinní rovině M2 na dvě rovnoběžné přímky (cos a — sin a 0\ siná cos a 0 } adetA^ = 0 0 l) /l 0 cA det A33 = 8. Pro samotné posunutí je matice M = I 0 1 c2 ] a \0 0 l) tento subdeterminant neovlivňuje. 4.46. Určete typ kuželosečky 2x2 — 2xy + 3y2 — x + y — 1=0. Solution. Determinant A 2 -1 -1- i2 2 -1 ■1 3 j_ i "2 2 f ^0 jde tedy o regulární kuželosečku. Navíc je 8 = 5 > 0 tedy jde o elipsu. Dále (au + a22) A = (2 + 3) • (—x) < 0, jde tedy o reálnou elipsu. □ 4.47. Určete typ kuželosečky x2 — 4xy — 5y2 + 2x + 4y + 3 = 0. 1 -2 1 -2-5 2: 1 2 3 Solution. Determinant A dále je 8 1 -2 -2 -5 -34 £ 0, 9 < 0, jde tedy o hyperbolu. □ 4.48. Určete rovnici kuželosečky (a poté její typ), která prochází body [-2,-4], [8,-4], [0,-2], [0,-6], [6,-2]. Solution. Do obecné rovnice kuželosečky aiix2 + a22y2 + 2a\2xy + a\x + a2y + a = 0 postupně dosadíme souřadnice zadaných bodů. Takto obdržíme soustavu 4an + I6a22 + \6a\2 — 2a\ 64útn + 16^22 — 64úti2 + 8«! 36aii + 4a22 36a22 4a22 24al2 + 4a2 + a = o, 4a2 + a = o, 2a2 + a = o, 6a2 + a = o, 2a2 + a = 0. V maticovém zápisu provedeme úpravy (4 16 16 -2 64 16 -64 8 0 4 0 0 0 36 0 0 ^36 4 -24 6 -i : y 1=0, L2 : y - x + 1 = 0. -4 1\ -4 1 -2 1 -6 1 -2 l) 1\ (4 16 16 -2 -4 0 4 0 0 -2 1 0 0 64 -8 12 -9 0 0 0 24 -36 27 \0 0 0 0 3 -2) 231 C. GEOMETRIE KVADRATICKÝCH FOREM 3. PROJEKTIVNÍ GEOMETRIE /48 0 0 0 0 -1\ 0 12 0 0 0 -1 0 0 64 0 0 0 0 0 0 24 0 3 \0 0 0 0 3 -2/ Hodnotu a můžeme zvolit. Zvolíme-li a = 48, dostaneme a2 = 32. au = 1, a22 = 4, au = 0, Kuželosečka má tudíž rovnici x2 + 4y2 - 6x + 32y + 48 = 0. V této rovnici doplníme výrazy x2 — 6x, 4y2 + 32y na druhé mocniny dvojčlenů, což dává (x - 3)2 + 4(y + 4)2 - 25 = 0, resp. (x-3)2 (y+4)2 1 =0. 52 (ir Vidíme, že se jedná o elipsu se středem v bodě [3, —4]. □ 4.49. Další charakteristiky kuželoseček. Zabývejme se ještě podrobněji některými dalšími pojmy, které se pojí s kuželosečkami. Osa kuželosečky je přímka, podle které je kuželosečka osově souměrná. Z kanonického vyjádření kuželosečky v polární bázi (4.29) plyne, že elipsa má dvě osy (x = 0 a y = 0), parabola má jenu osu (x = 0) a hyperbola má dvě osy (x = 0 a y = 0). Průniky os se samotnou kuželosečkou se nazývají vrcholy kuželosečky. Čísla a, b z kanonického vyjádření kuželosečky (které udávají vzdálenost vrcholů od počátku) se nazývají délky poloos. V případě elipsy a hyperboly se osy navzájem protínají v počátku. Podle tohoto bodu je pak kuželosečka zřejmě středově souměrná. Takový bod se nazývá středem kuželosečky. Kromě vrcholů a středů existují ještě další význačné body ležící na ose kuželosečky. Pro elipsu jsou to ohniska elipsy E, F charakterizované vlastností \EX\ + \FX\ = 2a pro libovolný bod X ležící na elipse. Následující příklad ukazuje, že takové body E a. F skutečně existují. 4.50. Existence ohnisek. Pro elipsu o velikostech poloos a > b jsou body E = [—e, 0] a F = [e, 0], kde e = \Ja2 — b2 jejími ohnisky (v polárních souřadnicích). Solution. Uvažujme body X = [x, y], které splňují podmínku |2?X| + \FX\ = 2a a ukážeme, že to jsou právě body elipsy. V souřadnicích má tato rovnice tvar V(x + e)2 + y2 + V(jc - e)2 + f = 2a Umocněním rovnice a její úpravou dostaneme ekvivalentní rovnici (a2 - e2)x2 + a2/ = a2(a2 - e2). Jestliže budeme body přímek L\ a L2 chápat jako konečné body v projektivním prostoru V2, budou zjevně jejich homogenní souřadnice (x : y : z) splňovat rovnice y - x - z = 0, L2: y Je vidět, že průnikem L\ n L2 bude v tomto kontextu bod (—1 : 1 : 0) e V2, tj. nevlastní bod odpovídající společnému zaměření obou přímek. Afinní souřadnice v projektivní rovině. Pokud začneme naopak projektivní rovinou V2 a budeme v ní chtít uvidět afinní rovinu jako její "konečnou" část, pak můžeme místo roviny z = 1 vzít v M3 jakoukoliv jinou rovinu a neprocházející počátkem l3. Konečné body pak budou ty jednorozměrné podprostory, které mají neprázdný průnik s rovinou a. Pokračujme v našem příkladu rovnoběžných přímek z předchozího odstavce a podívejme se, jak budou jejich rovnice vypadat v souřadnicích v afinní rovině, která bude dána jako y = 1. Za tím účelem stačí dosadit y = 1 do předchozích rovnic: x + z = 0. L[:l 0, L'2:l x+z = 0 Nyní jsou "nekonečné" body naší původní afinní roviny dány vztahem z = 0 a vidíme, že naše přímky L[ a L'2 se protínají v bodě (1,1,0). To odpovídá geometrické představě, že rovnoběžné přímky L\, L2 v afinní rovině se protínají v nekonečnu a to v bodě (1 : 1 : 0). 4.35. Projektivní prostory a transformace. Náš postup v afinní rovině se přirozeným způsobem zobecňuje na každou konečnou dimenzi. Volbou libovolné afinní nadroviny A„ ve vektorovém prostoru která ne- prochází počátkem, můžeme ztotožnit body P e A„ s jednorozměrnými podprostory, které tyto body generují. Zbylé jednorozměrné podprostory vyplní nadrovinu rovnoběžnou s A„ a říkáme jim nekonečné body nebo také nevlastní body v projektivním rozšíření V„ afinní roviny A„. Zjevně je vždy množina nevlastních bodů v V„ projektivním prostorem dimenze o jedničku nižším. Afinní přímka má ve svém projektivním rozšíření pouze jediný nevlastní bod (oba konce přímky se "potkají" v nekonečnu a projektivní přímka proto vypadá jako kružnice), projektivní rovina má projektivní přímku nevlastních bodů, trojrozměrný projektivní prostor má projektivní rovinu nevlastních bodů atd. Ještě obecněji zavádíme projektivizaci vektorového prostoru: pro libovolný vektorový prostor V dimenze n +1 definujeme V(V) = {P C V; P C V, dim V = 1}. Volbou libovolné báze w ve V dostáváme tzv. homogenní souřadnice na V(V) tak, že pro P e V(V) použijeme jeho libovolný nenulový vektor u e V a souřadnice tohoto vektoru v bázi u. Bodům projektivního prostoru V(V) říkáme 232 CHAPTER 4. ANALYTICKÁ GEOMETRIE geometrické body, zatímco jejich nenulové generátory ve V nazýváme říkáme aritmetické reprezentanty. Při zvolených homogenních souřadnicích je možné jednu z jejich hodnot zafixovat na jedničku (tj. vyloučíme všechny body projektivního prostoru s touto souřadnicí nulovou) a získáme tak vložení n-rozměrného afinního prostoru A„ C V(V). To je přesně konstrukce, kterou jsme použili v našem příkladu projektivní roviny. 4.36. Perspektivní projekce. Velmi dobře jsou výhody projektivní geometrie vidět na perspektivní projekci M3 -» M2. Přestavme si, že pozorova-^r^-J tel sedící v počátku pozoruje "polovinu světa", J^>- tj. body (X, Y, Z) e R3 se Z > 0 a obraz vidí "promítnutý" na plátně daném rovinou Z = / > 0. Bod (X, Y, Z) "reálného světa" se mu tedy promítá na bod (x, y) na průmětně takto: X y Y 'ž- To je nejen nelineární formule, ale navíc při Z malém bude velice problematická přesnost výpočtů. Při rozšíření této transformace na zobrazení Vj, -» V2 dostáváme zobrazení (X : Y : Z : W) h» (x : y : z) = (—fX : — fY : Z), tj. popsané prostým lineárním vztahem Y Z W Tento jednoduchý výraz zadává perspektivní projekci pro konečné body v M3 C V3, které dosazujeme jako výrazy s W = 1. Přitom jsem elgantně odstranili problémy s body, jejichž obraz utíká do nekonečna. Skutečně, je-li Z-ová souřadnice skutečného bodu scény blízká nule, bude hodnota třetí homogenní souřadnice obrazu mít souřadnici blízkou nule, tj. bude představovat bod blízký nekonečnu. 4.37. Afinní a projektivní transformace. Každé prosté J.* ,. lineární zobrazení

V vektorového prostoru na sebe jsou invertibilní, všechna projektivní zobrazení projektivního prostoru V„ na sebe jsou tedy invertibilní též. Říká se ü-- Dosazením e2 rovnici elipsy b2 a vydělením a2b2 dostaneme kanonickou 2 + b2 1. □ Remark. Číslo e z předchozího příkladu se nazývá excentricita (výstřednost) elipsy. Podobně definujeme ohniska hyperboly jako body E, F, které splňují \ \EX\ — \FX\\ = 2a pro libovolný bod X ležící na hyperbole. Můžete si ověřit, že tuto vlastnost splňují v polární bázi body [—e, 0] a [e, 0], kde e = \Ja2 + b2. Ohnisko paraboly je bod F, který má v polární bázi souřanice F = [0, |] a je charakterizován tím, že jeho vzdálenost od libovolného bodu X paraboly je stejná jako jako vzdálenost X od přímky y = — £. 4.51. Určete ohniska elipsy x2 + 2y2 = 2. Solution. Z rovnice přímo odečteme, že velikosti poloos jsou a 42 Vä2 1. Poté již snadno dopočítáme z předchozího příkladu (||4.50||): b2 = 1, souřadnice ohnisek jsou tedy [—1, 0] a [1, 0]. □ 4.52. Dokažte, že součin vzdáleností ohnisek elipsy od její libovolné tečny je konstantní a zjistěte velikost této konstanty. Solution. Uvažme polární bázi. V ní má matice elipsy diagonální tvar diag(^, —1) a rovnice poláry (tečny) v bodě X=[x0, yol má yo -b2- tvar ^x + My = 1. Vzdálenost ohnisek E,F= 0] od této přímky 233 C. GEOMETRIE KVADRATICKÝCH FOREM 3. PROJEKTIVNÍ GEOMETRIE je rovna a jejich součin je tedy 1 ±e^ 1 1 xl 4_ Zo fl4 b4 1 -e 2 H 1 1 XÄ 4_ Zo a4 "i" b4 Dosadíme-li e2 = a2 —b2 a Q = \—x-\ (bod X leží na elipse), zjistíme, že předchozí výraz je roven b2. □ 4.53. Jakou velikost mají poloosy elipsy, když je součet jejich velikostí roven vzdálenosti mezi ohnisky a taje rovna 1. Solution. Řešíme soustavu a+b = 1 1 2e = 2Vfl2 - b2 a najdeme řešení a = |, b = |. 4.54. Pro jaké směrnice k jsou přímky vedené z bodu [—4, 2] sečnami a kdy tečnami elipsy dané rovnicí x2 y2 — + — = 1 9 4 Solution. Směrový vektor přímky je (1, k) a proto je parametrické vyjádření přímky x = —4 + t, y = 2 + kt. Průsečík s elipsou pak splňuje (-4 + t)2 (2 + kt)2 _ 9 4 Tato kvadratická rovnice má diskriminant roven D = -^(7*+ 16) To znamená, že v intervalu k e (—y, 0) má dvě řešení, tj. přímka je sečna, a pro směrnici k = — — a k = 0 jediné řešení, tj. přímka je tečna. □ 4.55. Najděte rovnici tečny k elipse 3x2 + 7y2 = 30, jejíž vzdálenost od středu elipsy je rovna 3. Solution. Střed elipsy je v počátku souřadnic a pro vzdálenost d přímky ax + b y + c = 0 od počátku se odvodí d = , ^ . Tečna ze zadání tedy splňuje a2 + b2 = Rovnice tečny v bodě [xT, yr] je 3xxT + lyyj — 30 = 0. Pro souřadnice bodu dotyku tak dostáváme soustavu (3xT)2 +(lyT)2 Jejím řešením je xT 3x\ + ly\ ±J54, yT 100 30 Vzhledem k symetrii elipsy dostáváme čtyři řešení ±3 J ji ± iJj^y — 30 = 0. □ jim také regulární kolineace nebo projektivní transformace. Odpovídají v homogenních souřadnicích invertibilním maticím dimenze n + 1. Dvě takové matice zadávají stejnou projektivní transformaci, právě když se liší o konstantní násobek. Jestliže si zvolíme první souřadnici jako tu, jejíž nulovost určuje nevlastní body, budou transformace, které zachovávají nevlastní body, dány maticemi, jejichž první řádek musí být až na první člen nulový. Jestliže budeme chtít přejít do afinních souřadnic konečných bodů, tj. zafixujeme si hodnotu první souřadnice na jedničku, musí být první prvek na prvním řádku být také rovný jedné. Matice kolineací zachovávajících konečné body našeho afinního prostoru tedy mají tvar: /l 0 ••• 0\ 'i «n • • • «i« □ kde b a A : \bn anl ■ (bi, ... ,b„)T e M" a A = (a^) je invert-ibilní matice dimenze n. Působení takové matice na vektoru (1, xi, ..., xn) je právě obecná afinní transformace, kde b zadává posunutí a A její lineární část. Jsou tedy afinní zobrazení právě ty kolineace, které zachovávají nadrovinu nevlastních bodů. 4.38. Určení kolineací. K zadání afinního zobrazení je nutné a stačí libovolně zadat obraz afinního &, repéru. V právě uvedeném popisu afinních transformací jako speciálního případu projektivních zobrazení to odpovídá vhodné volbě obrazu vhodné aritmetické báze vektorového prostoru V. Obecně ale neplatí, že obraz aritmetické báze V jednoznačně určí kolineací. Ukažme si podstatu problému na jednoduchém příkladu afinní roviny. Jestliže si zvolíme v rovině čtyři body A, B, C, D tak, aby každá z nich utvořená trojice byla v obecné poloze (tj. žádné tři z nich neleží na jedné přímce), můžeme si libovolně zvolit jejich obraz v kolineací následujícím způsobem: Zvolme jakkoliv jejich čtyři obrazy A', B', C, D' se stejnou vlastností a zvolme si jejich homogenní souřadnice u, v, w, z, u', v', w', z' v M3. Vektory z a z' pak můžeme jistě zapsat pomocí lineárních kombinací z = c\u + c2v + c3w, z' = c\u' + c'2v' + c'3w', přičemž všech šest koeficientů musí být nenulových, neboť jinak by některá trojice z našich bodů nebyla v obecné poloze. Nyní si zvolíme nové aritmetické reprezentanty bodů A, B a C po řadě jako ú = c\u, v = c2v a w = c3w astejněií' = c\u', v' = c2v' a w' = c3w' pro body A', B' a O. Tato volba zadává jediné lineární zobrazení

de naJíl, L u A ^ nejaký elementární projektivní přímky. Lze ale dokáží jakkoliv malé otevřené oblasti v afinním prostoru klasický důkaz jako T iji'tjii . , i , ilustraci pro dif. Lze ale dokázat daleko simejsi tvrzeni, ze zobrazeni počet ^ dodat ^n odkaz, jinak tady jen říci, že se tomu (např. koule bez hranice), do téhož afinního prostoru, které nebudeme věnovat zobrazuje přímky na přímky, je ve skutečnosti zúžením jednoznačně určené projektivní transformace projektivního rozšíření VW+1 původního afinního prostoru W. A tyto transformace tedy nutně zachovávají i dvojpoměry. Dualita. Projektivní nadroviny jsou definovány v n-rozměrném projektivním prosotu ViV) jako projek-tivizace n-rozměrných vektorových podprostorů ve vektorovém prostoru V. Jsou tedy v homogenních souřadnicích definovány jako jádra lineárních forem a e V*, které jsou opět určeny až na skalární násobek. Ve zvolené aritmetické bázi jsou tedy projektivní nadroviny dány řádkovým vektorem a = (ao, ■ ■ ■, an). Přitom ale jsou formy a dány jednoznačně, až na skalární násobek. Každá nadrovina ve V tedy je identifikována s právě jedním geometrickým bodem v projektivizaci duálního prostoru ViV*). Hovoříme o duálním projektivním prostoru a dualitě mezi body a nadrovinami. Na formách působí lineární zobrazení zadávající danou kolineací pomocí násobení řádkových vektorů zprava toutéž maticí a = (q?o, ■ ■ ■, a„) h-» a ■ A, tj. matice duálních zobrazení je AT. Duální zobrazení ovšem zobrazuje formy opačným směrem z "cílového prostoru" ne "počáteční", proto potřebujeme pro současné studium vlivu regulární kolineace na body a jejich duální nadroviny zobrazení inverzní ke kolineaci /. To je dáno maticí A-1. Matice příslušného působení kolineace na formách je proto (A T) ~1. Protože je přitom inverzní matice rovna algebraicky adjungované matici A*lg, až na násobek inverzí determinantu, viz vztah (2.2) na str. 94, můžeme rovnou pracovat s projektivní transformací prostoru V(V*) zadanou maticí (A*lg)r (nebo bez transoponování, pokud násobíme řádkové vektory zprava). Okamžitě z definic je vidět, že projektivní bod X patří nadrovině a, když pro jejich aritmetické souřadnice platí a ■ x = 0. To samozřejmě zůstává v platnosti i po působení libovolnou kolineací, protože opět ia ■ A"1) • (A • x) = a ■ x = 0. 4.41. Samodružné body, středy a osy. Uvažujme regulární kolineaci / zadanou v nějaké aritmetické bázi projektivního prostoru ViV) pomocí matice A. CHAPTER 4. ANALYTICKÁ GEOMETRIE Samodružným bodem kolineace / rozumíme bod A, který je zobrazen na sebe, tj. f (A) = A, samodružnou nadrovinou kolineace f rozumíme nadrovinu a, která je zobrazována na sebe, tj. f (a) c a. Přímo z definice tedy vidíme, že samozdružné body mají za aritmetické reprezentanty právě vlastní vektory matice A. V geometrii roviny jsme se s mnoha typy kolineací již jistě setkali: symetrie podle středu, zrcadlení podle přímky, posunutí, stejnolehlost atd. Možná vzpomeneme i na různé typy promítání, např. promítání jedné roviny v M3 na druhou z nějakého středu S e M3. Všimněme si, že kromě samodružných bodů se u všech takových afinních zobrazení objevovaly také samodružné přímky. Např. u symetrie podle středu se zachovávají také všechny přímky tímto středem procházející, u posunutí se (obdobně) zachovávají nevlastní body roviny. Zastavíme se u tohoto jevu v obecné dimenzi. Nejprve zavedeme potřebné velmi klasických pojem související s incidencí bodů a nadrovin. Trs nadrovin procházejí bodem A e V(V) je množina všech nadrovin, které obsahují bod A. Z definice je zřejmé, že pro každý bod A je příslušný trs nadrovin sám nadrovinou v duálním prostoru V(V*) (je zadán jednou homogenní lineární rovnicí v aritmetických souřadnicích). Pro kolineaci / : V(V) -» V(V) řekneme, že bod S eV(V) je středem kolineace f jestliže všechny nadroviny v trsu nadrovin určeném bodem S jsou samodružné. Řekneme, že nadrovina a je osou kolineace f, jestliže jsou všechny její body samodružné. Přímo z definice je zřejmé, že osa kolineace je středem kolineace duální, zatímco trs nadrovin zadávajících střed kolineace je sám osou kolineace duální. Protože matice kolineace na původním a duálním prostoru se liší pouze transpozicí, jejich vlastní čísla splývají (vlastní vektory jsou sloupcové, resp. řádkové, k týmž vlastním číslům). Např. v projektivní rovině (a ze stejného důvodu v každém reálném projektivním prostoru sudé dimenze) má každá kolineace alespoň jeden samodružný bod, protože charakteristické polynomy příslušných lineárních zobrazení jsou lichého stupně a tedy mají alespoň jeden reálný kořen. Nebudeme se již zde dále věnovat obecné teorii, ale budeme aspoň krátce ilustrovat její užitečnost na několika výsledcích pro projektivní roviny. Proposition. Projektivní transformace roviny různá od identity má buď právě jeden střed a právě jednu osu, nebo nemá ani střed ani osu. Proof. Uvažme kolineaci / na VR3 a uvažme, že by měla dva různé středy A a B. Označme i přímku zadanou těmito středy a zvolme bod X v projektivní rovině mimo i. Jsou-li p a q po řadě přímky procházející dvojicemi bodů (A, X) a (B, X), pak také f(p) = p a f(q) = q a tedy zejména je i bod X samodružný. To ale znamená, že všechny Ť Tvrzení pro případ P £ f vyplývá z následujícího důsledku symetrie bilineární formy F. Pokud bod Q leží na poláře bodu P, pak bod P leží na poláře bodu Q. □ Pomocí polárně sdružených bodů můžeme také nalézt bez použití Lagrangeova algoritmu rovnice os kuželoseček i střed kuželosečky. Napišme matici kuželosečky jako blokovou matici A = (\ a), \a a J kde A = (flij) pro i, j = 1,2, a \e vektor o souřadnicích (a 13, 023) a a =«33. To znamená, že kuželosečka je zadaná rovnicí uT Au + 2aT u + a = 0 pro vektor u = (x, y). Nyní ukážeme 4.60. Osy kuželosečky jsou poláry nevlastních bodů určených vlastními vektory matice Ä. Solution. Protože je matice A symetrická, má v bázi svých vlastních vektorů diagonální tvar D = ^ kde k, fi e Ma tato báze je ortogonální. Označíme-li matici přechodu k této bázi U (sloupce j sou jednotkové vlastní vektory), pak má matice kuželosečky bázi vlastních vektorů tvar ÍUT 0\(Ä a\(U 0\ _ í D UTa\ \0 l)\aT a)\0 l)~\aTU a ) V této bázi má tedy kanonické vyjádření až na posunutí dané vektorem UTa. Konkrétně, označíme-li jednotkové vlastní vektory v^v^, máme k(x + ——f + fi(y +-^)2 =---+----a. k fi k fi To znamená, že vlastní vektory jsou směrové vektory os kuželosečky (tzv. hlavní směry) a rovnice os v této bázi jsou x = —^y2*- a y = Souřadnice os uk a wM ve standardní bázi proto splňují vjuk = -^p a v^u^ = neboli vf(kux + a) = 0 a v^diu^ + a) = 0. Tyto rovnice jsou ekvivalentní 237 C. GEOMETRIE KVADRATICKÝCH FOREM 3. PROJEKTIVNÍ GEOMETRIE rovnicím v)r (Aux + a) = 0 a u^(Amm + a) = 0 a to jsou rovnice polár nevlastních bodů určených vektory vx a uM. □ 4.61. Remark. Důsledkem tvrzení z předchozího příkladu je fakt, že střed kuželosečky je polárně sdružený se všemi nevlastními body. Souřadnice s středu pak splňují rovnici Äs + a = 0. Pokud det(A) ^ 0, pak má rovnice As + a =0 pro souřadnice středu kuželosečky pro 8 = det(A) ^ 0 právě jedno řešení, a pro 8 = 0 žádné řešení. To znamená, že z vlastních kuželoseček má elipsa a hyperbola jeden vlastní střed a parabola žádný (střed paraboly je v nevlastním bodě). 4.62. Dokažte, že tečna paraboly v libovolném bode svírá stejný úhel s osou paraboly, jako se spojnicí ohniska a bodu dotyku. Solution. Polárou (tj. tečnou) bodu X=[x0, yo] k parabole zadané kanonickou rovnicí v polární bázi je přímka splňující /l 0 0\M (x0, y0, 1) 0 0 -p v = x0x - py - py0 = 0 \0 -p 0 ) \\) Kosinus úhlu, který tečna svírá s osou paraboly (x = 0) je daný skalárním součinem příslušných jednotkových směrových vektorů. Jednotkový směrový vektor tečny je —j==(p, x0) a proto pro kosinus platí i :(P,X0).(0, 1) Xq p2+x20 ^Pz + xo Nyní ukážeme, že kosinus úhlu, který tečna svírá se spojnicí ohniska F=[0, \] a bodem dotyku X je stejný. Jednotkový směrový vektor spo- 1 jmceje '4 + (yo -1)2 Pro kosinus úhlu pak máme 1 1 --(xo, yo - -)■ Px0 (x0yo + -r-) p2+x2Jx2+(y0-Z)2 2 /p2+4 Dosazením y0 = ^ a úpravou výrazu dostaneme Tento příklad ukazuje, že paprsky světla dopadající rovnoběžně s osou na parabolické zrcadlo, se odrážejí do ohniska a naopak, paprsky světla vyzařovaného z ohniska se odráží stejným sněrem (rovnoběžně s osou). To je principem mnoha zařízení, např. parabolický reflektor, parabolická anténa. □ 4.63. Najděte rovnici tečny v bodě P=[l, 1] ke kuželosečce 4x2 + 5y2 - Sxy + 2y - 3 = 0 body roviny mimo L jsou samodružné. Každá přímka různá od i má tedy všechny body mimo i samodružné a proto je i její průnik s i samodružný. Je tedy / identické zobrazení a dokázali jsme, že neidentická projektivní transformace může mít nejvýše jeden střed. Tatáž úvaha pro duální projektivní rovinu nám dává výsledek o nejvýše jediné ose. Jestliže má / střed A, pak všechny přímky procházející A j sou samodružné a odpovídaj í proto dvourozměrnému pod-prostoru vlastních řádkových vektorů příslušné matice pro transformaci /. Proto bude existovat dvourozměrný prostor sloupcových vlastních vektorů ke stejnému vlastnímu číslu a ten bude reprezentovat právě přímku samodružných bodů, tedy osu. Tatéž úvaha v obráceném pořadí dokazuje i opačné tvrzení — jestliže má projektivní transformace roviny osu, má i střed. □ Pro praktické problémy je užitečné i pro reálnou rovinu pracovat v jejích komplexním projektivním rozšíření a geometrické chování transformací je pak velmi dobře čitelné z případné existence reálných či imaginárních středů a os. 4.42. Projektivní klasifikace kvadrik. Závěrem se ještě vrátíme ke kuželosečkám a kvadrikám. V «-rozměrném afinním prostoru W zadáváme kvadriku Q v afinních souřadnicích pomocí obecné kvadratické rovnice (4.4), viz str. 224. Pohlížíme-li na afinní prostor W jako na afinní souřadnice v projektivním prostoru VM"+l, můžeme chtít tutéž množinu Q popsat pomocí homogenních souřadnic v projektivním prostoru. V nich by mělo jít o výraz, jehož všechny členy jsou druhého řádu, protože pouze vynulování takového homogenního výrazu bude mít pro homogenní souřadnice bodu smysl nezávisle na zvoleném konstantním násobku souřadnic (x0, xi, ... ,xn). Hledáme tedy takový výraz, jehož zúžením na afinní souřadnice, tj. dosazením x0 = 1, získáme původní výraz z (4.4). To je ale mimořádně jednoduché, prostě dopíšeme dostatek x0 ke všem výrazům - žádný ke kvadratickým členům, jedno k lineárním a x20 ke konstantnímu členu v původní afinní rovnici pro Q. Získáme tak dobře definovanou kvadratickou formu / na vektorovém prostoru W+1, jejíž nulové body korektně definují tzv. projektivní kvadriku Q. Průnik "kužele" Q c nulových bodů této formy s afinní rovinou x0 = 1 je původní kvadrika Q, jejíž body označujeme jako vlastní body kvadriky, zatímco další body Q \ Q v projektivním rozšíření jsou body nevlastní. Klasifikace reálných či komplexních projektivních kvadrik, až na projektivní transformace, je úlohou, kterou jsme již zvládli — jde prostě o nalezení kanonické polární báze, viz odstavec 4.29. Z této klasifikace dané v reálném případě signaturou formy, v komplexním pouze hodností, vcelku snadno můžeme dovodit i klasifikace kvadrik afinních. Stačí si všímat množiny nekonečných bodů v projektivním 238 CHAPTER 4. ANALYTICKÁ GEOMETRIE rozšírení naší afinní kvadriky. Ukážeme si podstatu postupu na případu kuželoseček v afinní a projektivní rovině. Projektivní klasifikace dává následující možnosti, popsané v homogenních souřadnicích (x : y : z) v projektivní rovině VM3: • imaginární regulární kuželosečka zadaná x2 + y2 + z2 = Solution. Projektivizací dostaneme kuželosečku zadanou kvadratickou formou (x, y, z)A(x, y, z)T s maticí 0 • reálná regulární kuželosečka s rovnicí x2 + y2 — z2 • dvojice imaginárních přímek s rovnicí x2 + y2 = 0 • dvojice reálných přímek s rovnicí x2 — y2 = 0 0 • dvojnásobná přímka x2 = 0. Klasifikaci uvažujeme jako reálnou, tj. klasfikace kvadratických forem je dána nejen hodností, ale i signaturou, nicméně body kvadrik pak uvažujeme i v komplexním rozšíření. Tak je třeba chápat uvedené názvy, např. imaginární kuželosečka nemá žádné reálné body. 4.43. Afinní klasifikace kvadrik. Pro afinní klasifikaci musíme omezit projektivní transformace na ty, které zachovávají přímku nevlastních bodů. To ale můžeme také realizovat opačným postupem — pro zvolený projektivní typ kuželosečky Q, tj. její kužel Q c M3 budeme postupně různě volit afinní rovinu a c M3 neprocháející počátkem a sledovat, jak se mění množina bodů Q n a, které jsou v afinních souřadnicích realizovaných pomocí roviny a vlastními body Q. V případě reálné regulární kuželosečky tedy máme k dispozici skutečný kužel Q zadaný rovnicí z2 = x2 + y2 a za rovinu a berme třebas tečné roviny jednotkové sféry. Začneme-li s rovinou z = 1, dostaneme jako průnik samé konečné body v ní ležící jednotkové kružnice Q. Postup-nýnm nakláněním a budeme dostávat protaženější a protaženější elipsy, až dosáhneme náklonu a rovnoběžného s jednou z přímek kužele. V tom okamžiku se již objeví jeden (dvojnásobný) nekonečný bod naší kuželosečky, jejíž konečné body ale stále tvoří jednu souvislou komponentu, a dostáváme parabolu parabola. Pokračováním naklánění vzniknou nekonečné body dva a množina konečných bodů přestane být souvislá a tak dostáváme poslední regulární kvadriku v afinní klasifikaci, hyperbolu. Z uvedeného postupu si můžeme vzít poučení, které nám snadno umožní pokračovat do vyšších dimenzí. Předně, si všimněme, že průnikem naší kuželosečky s projektivní přímkou nevlastních bodů je vždy opět kvadrika v dimenzi o jedničku nižší, tj. v našem případě šlo o prázdnou množinu nebo dvojnásobný bod nebo dva body jakožto typy kvadrik na projektivní přímce. Dále jsme zjistili, že afinní transformaci převádějící jednu z možných realizací zvoleného projektivního typu na druhou jsme našli jen tehdy, když příslušné kvadriky v nevlastní přímce byly projektivně ekvivalentní. Takovýmto způsobem lze pokračovat v klasifikaci kvadrik v dimenzi tři a dále. Podle předchozí věty je tečna polárou bodu P, který má homogenní souřadnice (1:1: 1). Ta je dána rovnicí (1, 1, l)A(x, y, z)T = 0, což v našem případě dává rovnici 2y - 2z = 0 Přechodem zpět k nehomogenním souřadnicím dostaneme rovnici tečny y = 1. □ 4.64. Určete souřadnice bodu dotyku osy y s kuželosečkou zadanou rovnicí 5x2 + 2xy + y2 - 8x = 0 Solution. Osa y, tj. přímka x = 0, je polárou hledaného bodu P s homogenními souřadnicemi (p) = (pi : p2 : p3). To znamená, že rovnice x = 0 je ekvivalentní rovnici poláry F(p,v) = pT Av = 0, kde v = (x, y, z)T-To je splněno právě v případě, když Ap = (a, 0, 0)T pro nějaké a e M. Tato podmínka dává pro matici naší kuželosečky / 5 1 -4\ A = ( 1 1 0 \-4 0 0 soustavu rovnic 5pi + P2 - 4p3 = aj P\+ P2 = 0 -4Pl = 0 Buď můžeme najít souřadnice bodu P pomocí inverzní matice, p = A~l(a, 0, 0)T, nebo vyřešit tuto soustavu rovnic přímo, zpětným dosazováním. V tomto případě takto dostaneme lehce řešení p = (0, 0, — ha). Osa y se tedy dotýká kuželosečky v počátku. □ 4.65. Určete bod dotyku přímky x = 2 s kuželosečkou z předchozího přikladu. Solution. Přímka má v projektivním rozšíření rovnici x — 2z, = 0, a proto v tomto případě dostaneme pro bod dotyku P podmínku Ap = (a, 0, —2a), což dává soustavu 5pi + P2 - 4p3 = a Pi + P2 = 0 —4pi = —2a 239 C. GEOMETRIE KVADRATICKÝCH FOREM 3. PROJEKTIVNÍ GEOMETRIE Jejím řešením je p = (ja,—^a,^a). Tyto homogenní souřadnice jsou ekvivalentní souřadnicím (2, —2, 1) a proto proto má bod dotyku souřadnice [2, —2]. □ 4.66. Najděte rovnice tečen sestrojených z bodu P= [3, 4] ke kuželosečce zadané rovnicí 2x2 - 4xy + y2 - 2x + 6y - 3 = 0 Solution. Předpokládejme, že bod dotyku T hledané tečny má homogenní souřadnice dané násobky vektoru t = (t\,t2, t3). Podmínka, že T leží na kuželosečce je tT At = 0, což dává 2t2 - At\h + t% - 2t\h + 6t2t3 -3^=0 Podmínka, že bod P leží na poláře bodu T je pT At = 0, kde p = (3, 4, 1) jsou homogenní souřadnice bodu P. Tato rovnice v našem případě dává 2 -2 -1\ /V (3, 4, 1) | -2 1 3 | ( t2 | = -3ři + t2 + 6ř3 = 0 ■1 3 -3j\t3/ Nyní můžeme dosadit například t2 = 3t\ — 6t3 do předchozí (kvadratické) rovnice. Potom dostaneme -t\ +4ht3 - 3t\ = 0 Protože pro t3 = 0 rovnice není splněna, můžeme přejít k nehomogenním souřadnicím (*■}-, 1), pro které dostáváme "(|)2 + 4(|)-3 = 0 a | = 3(|)-6, tj. £i = i a = -3, nebo ^ = 3 a ^ = 3. Body dotyku tedy mají homogenní souřadnice (1 : —3 : 1) a (3 : 3 : 1). Rovnice tečen dostaneme jako poláry těchto bodů. Výsledné rovnice tečen jsou Ix - 2y - 13 = Oax = -3. □ 4.67. Napište rovnici tečny vedené počátkem ke kružnici zadané rovnicí x2 + y2 - lOx - 4y + 25 = 0 Solution. Bo dotyku (t\ : t2 : t3) splňuje 1 0 -5\ /V (0, 0, 1) | 0 1 -2 ) j t2 | = —5ři - 2t2 + 25 = 0 -5 -2 25 j \t3/ Odtud vyjádříme např. t2 a dosadíme do rovnice kuželosečky (kružnice), kterou musí bod (t\ : t2 : t3) také splňovat. Dostaneme kvadratickou rovnici 29t\ — 250ři + 525 = 0, která má řešení t\ = 5 a t\ = Souřadnici t2 dopočítáme a získáme body dotyku [5, 0] a [^, ^]. Hledané tečny jsou pak poláry těchto bodů. Ty mají rovnice y = 0 a 20x — 2\y = 0. □ 240 CHAPTER 4. ANALYTICKÁ GEOMETRIE 4.68. Najděte rovnice tečen ke kružnici x2 + y2 =5 rovnoběžných s přímkou 2x + y + 2 = 0. Solution. V projektivním rozšíření se tyto tečny protínají v nevlastním bodě splňujícím 2x + y + z = Otj. v bodě s homogenními souřadnicemi (1 : — 2 : 0). Jsou to tedy tečny spuštěné z tohoto bodu ke kružnici a postupovat můžeme stejně jako v předchozím příkladě. Matice kuželosečky (kružnice) je diagonální s diagonálou (1, 1, —5) a proto bod dotyku (t\ : t2 : t3) hledaných tečen splňuje t\ — 2t2 = 0. Dosazením o rovnice kružnice dostaneme 5t\ = 5. Odtud máme ti = ±1 abody dotyku proto jsou [2, 1] a [—2, —1]. □ Tečna v nevlastním bodě kuželosečky se nazývá asymptota kuželosečky. Počet asymptot kuželosečky se tedy rovná počtu průsečíků kuželosečky s přímkou nevlastních bodů, tj. elipsa nemá žádnou reálnou asymptotu, parabola má jednu (která je ovšem nevlastní přímkou) a hyperbola dvě. 4.69. Určete nevlastní body a asymptoty kuželosečky zadané rovnicí 4x2 - 8xy + 3y2 - 2y - 5 = 0 Solution. Nejprve napíšeme rovnici kuželosečky v homogenních souřadnicích. 4x2 - 8xy + 3y2 - 2yz - 5z2 = 0 Nevlastní body kuželosečky jsou pak body určené homogenními souřadnicemi (x : y : 0) splňující tuto rovnici, to znamená 4x2 - Sxy + 3y2 = 0. Pro podíl - dostaneme dvě řešení: - = — 4a- = — |. Zadaná ť y y 2 y 2 kuželosečka je tedy hyperbola s nevlastními body P= (—1:2:0) a Q= (—3 : 2 : 0). Asymptoty jsou potom poláry bodů P a Q, tj. 4 -4 0 \ X -4 3 -1 \y 0 -1 -5/ \1 (-1,2,0) -4 3 -1 y =-12x + 10y-2 = 0 4 -4 0 \ ľ -4 3 -1 0 -1 -5/ \1 (-3,2,0) -4 3 -1 y =-20x + 18y - 2 = 0 Další příklady na kuželosečky naleznete na straně 243. □ 4.70. Harmonický dvojpoměr. Je-li dvojpoměr čtyř bodů ležících na přímce roven — 1, hovoříme o tzv. harmonické čtveřici. Harmonickou čtveřici lze snadno zkonstruovat: mějme čtyřúhelník ABCD. Označme K průsečík přímek AS a CD, M průsečík přímek AD a 241 C. GEOMETRIE KVADRATICKÝCH FOREM_3. PROJEKTIVNÍ GEOMETRIE BC. Dále nechť L, resp. N, je průsečík přímky KM s přímkou A C, resp. BD. Potom body K, L, M, N tvoří harmonickou čtveřici. 242 CHAPTER 4. ANALYTICKÁ GEOMETRIE D. Doplňující příklady k celé kapitole 4.71. Parametricky vyjádřete průnik následujících rovin v R3: er : 2x + 3y — z + 1 = 0 a p : x — 2y + 5 = 0. 4.72. Nalezněte osu mimoběžek p : [1, 1, 1] + ř(2, 1, 0), q : [2, 2, 0] + f (1, 1, 1). 4.73. l.(8b.) Určete příčku mimoběžek p : [0, 1, 1] + t(l, 2, 3), q : [0, 5, 5] + s(2, 1, 0), tj. body f a Q, kde P e p a. Q e q, takové, že přímka P Q prochází bodem [—7, 7, 12]. 4.74. Jarda stojí v bodě [—1, 1, 0] a má tyč délky 4. Může se touto tyčí současně dotknout přímek p a q, kde p : [0,-1,0] +f (1,2, 1), q : [3,4, 8]+5(2, 1,3)? (Tyč musí procházet bodem [— 1, 1,0].) 4.75. Rozhodněte, za existuje úsečka P Q, kde P e p, Q e q, přičemž přímky p a q jsou dány vztahy p : [1, -1, 2]+ř(l, 0, 1), t e R, q: [2, -3, l]+*(-l, -1, l)sel a navíc bod [0, 1, 3] leží na úsečce P Q. 4.76. V prostom M3 je dána zrcadlová rovina y = 0. Určete délku dráhy, kterou urazí světelný paprsek při cestě z bodu [1, 2, 3] odrazem o zrcadlovou rovinu do bodu [2, 1, 2]. 4.77. Je dána krychle ABCDEFGH. Nechť bod T leží na hraně BF, \BT\ = \\BF\. Určete kosinus odchylky rovin AT C a B DE. 4.78. Je dána krychle ABCDEFGH. Nechť bod T leží na hraně AE, \AT\ = \\AE\ a 5 je střed strany AD. Určete kosinus odchylky rovin BDT a SCH. 4.79. Je dána krychle ABCDEFGH. Nechť bod T leží na hraně BF, \BT\ = ±\BF\. Určete kosinus odchylky rovin AT C a B DE. 2 2 4.80. Určete tečnu k elipse ^ + y = 1 rovnoběžnou s přímkou x + y — 1 = 0. Solution. Rovnoběžky s danou přímkou se s ní protínají v nevklastním bodě (1 : — 1 : 0). Z tohoto bodu spustíme tečny k dané elipse. Bod dotyku T= (t\ : t2 : t3) leží na jeho poláře a proto splňuje — |- = 0, tj. h = j^t\. Dosazením do rovnice elipsy pak dostáváme t\ = ±y. Body dotyku hledaných tečen tak jou [y, |] a [—y, —|]. Tečny jsou pak poláry těchto bodů. Ty mají rovnice x + y = 5 a x + y = — 5. □ 243 D. doplňující príklady k cele kapitole_3. projektivní geometrie 4.81. Určete nevlastní body a asymptoty kuželosečky zadané rovnicí 2x2 + 4xy + 2y2 - y + 1 = 0 Solution. Rovnice nevlastních bodů 2x2 + 4xy + 2y2 = 0, tj. 2(x + y)2 = 0 má řešení — y. Jediným nevlastním bodem je tedy (1 : — 1 : 0) (daná kuželosečka je parabola). Asymptota je polára tohoto bodu a tou je nevlastní přímka z = 0 (jedná se tedy o parabolu). □ 4.82. Dokažte, že součin vzdáleností bodu libovolného bodu hyperboly od jejích asymptot je konstantní a určete velikost této konsatnty. Solution. Označme bod na hyperbole P. Rovnice asymptot hyperboly v kanonickém tvaruje bx ± ay = 0. Jejich normály jsou tedy (b, ±a) a odtud určíme průměty Pi, P2 bodu P na asymptoty. Pro vzdálenost bodu P od asymptot pak dostáváme \PP\ 2\ = -r==- Hledaný součin je tedy roven •Ja2+b2 "2^2+b^p2 = > protože bod P leží na hyperbole. □ 4.83. Určete úhel asymptot hyperboly 3x2 — y2 =3. Solution. Pro kosinus úhlu, který svírají asymptoty hyperboly v kanonickém tvaru lze odvodir cos a = ^2 ■ V našem případě tak dostáváme úhel 60°. □ 4.84. Určete středy kuželoseček: (a) 9x2 + 6xy - 2y - 2 = 0 (b) x2 + 2xy + y2 + 2x + y + 2 = 0 (c) x2 - 4xy + 4y2 + 2x - 4y - 3 = 0 (d) ^ + ^ = 1 Solution. (a) Soustava Äs + a = 0 pro výpočet vlastních středů má tvar 9si +3í2 = 0 3^! - 2 = 0 a jejím vyřešením dostaneme střed [|, —2]. (b) v tomto případě máme 5i+52 + l = 0 Sl+^2 + 5 = 0 a proto žádný vlastní střed neexistuje (kuželosečka je parabola). Pokud přejdeme do homogenních souřadnic, dostaneme nevlastní střed (1 : — 1 : 0). (c) Souřadnice středu v tomto případě splňují 5i- 252 + l = 0 -25i +452 - 2 = 0 a řešením je tedy celá přímka středů. Je to proto, že kuželosečka je degenerovaná do dvojice rovnoběžných přímek. (d) Z rovnic pro výpočet středu okamžitě plyne, že středem je (a, jí). Souřadnice středu tedy udávají posunutí počátku souřadnic k repéru, ve kterém má elipsa základní tvar. □ 244 CHAPTER 4. ANALYTICKÁ GEOMETRIE 4.85. Určete rovnice os kuželosečky dané rovnicí 6xy + Sy2 + 4y + 2x — 13 = 0. Solution. Hlavní směry kuželosečky (směrové vektory os) jsou vlastní vektory matice Charakteristická rovnice má tvar k2—Sk—9 = 0 a vlastní číslajsou proto k i = — l,k2 = 9. Příslušné vlastní vektory j sou pak (3, —l)a(l, —3). Osy jsou polárami nevlastních bodů určených těmito směry. Pro (3, —1) tak dostáváme rovnici osy — 3x + y + 1 = 0 a pro (1, —3) osu — 9x — 21 y — 5 = 0. □ 4.86. Určete rovnice os kuželosečky dané rovnicí 4x2 + 4xy + y2 + 2x + 6y + 5 = 0. (4 2\ Solution. Vlastní čísla matice I ^ ^ I jsou k\ = 0, k2 = 5 a příslušné vlastní vektory (—1, 2) a (2, 1). Pro osy pak dostáváme rovnice 5 = 0a2x + j + l =0. První z nich očividně není splněna pro žádný bod. Existuje tedy jen jedna osa (zadaná kuželosečka je parabola). □ 4.87. Rovnicí x2 + 3xy - y2 + x + y + 1 = 0. je dána kuželosečka. Určete její střed, osy, asymptoty a ohniska. 245 D. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 3. PROJEKTIVNÍ GEOMETRIE Řešení cvičení 4.9. 2, 3, 4, 6, 7, 8. Polohy rovin, které realizují dané počty si rozmyslete samostatně. 4.31. Pro normálový vektor (a, b, c) hledaných rovin máme rovnice a + b — 0 (kolmost na p) a volbou a — —b — 1 (vektor (0, 0, 1) nevyhovuje podmínkám, takže vhodným pronásobením můžeme dosáhnout — 5, celkem pak hledané rovnice přímek jsou x — y ± Vó —1=0. 4.77. Přímka (2ř, t, It) + [-5, 0, -9]. 4.72. [3,2, l][8/3, 8/3,2/3]. 4.73. P = [-1, -1, -2], Q = [-4, 3, 5]. 4.74. Příčka [1, 1, l][-3, 1, -1], délky V2Ô, tyč stačit nebude. 4.75. Neexistuje. Přímka procházející daným bodem a protínající jak p tak q je daná body P = [1, —1, 2] (e p) a Q = [2, —3, 1] (e q). Daný bod však na úsečce P Q neleží. 4.76. VTL 4.77. 4.78. ^. 4.79. podmínky a = —b = 1) pak dostáváme z podmínky pro odchylku 246 CHAPTER 5 Zřízení ZOO jaké funkce potřebujeme pro naše modely? — pořádný zvěřinec... V této kapitole začneme budovat nástroje umožňujících modelování závislostí, které nejsou ani lineární ani diskrétní. S takovou potřebou se často setkáme, když popisujeme systém vyvíjející se v čase a to ne jen v několika vybraných okamžicích, ale "souvisle", tj. pro všechny možné okamžiky. Někdy je to přímo záměr či potřeba (třeba ve fyzikálních modelech klasické mechaniky), jindy je to vhodné přiblížení diskrétního modelu (třeba u ekonomických, chemických nebo biologických modelů). Klíčovým pojmem budou stále funkce. Čím větší třídu funkcí připustíme, tím obtížnější bude vybudovat nástroje pro naši práci. Když ale bude různých typů funkcí málo, nebudeme patrně umět budovat dobré modely pro reálné situace vůbec. Cílem následujících dvou kapitol bude proto explicitně zavést několik typů elementárních funkcí, implicitně popsat daleko více funkcí a vybudovat standardní nástroje pro práci s nimi. Souhrnně se tomu říká diferenciální a integrální počet jedné proměnné. Zatímco dosud jsme se spíše pohybovali v oblasti matematiky nazývané algebra, nyní se budeme postupně blížit k tzv. matematické analýze. 1. Interpolace polynomy V předchozích kapitolách jsme pracovali často s posloupnostmi hodnot reálných nebo komplexních čísel, tj. se skalárními funkcemi N -» K nebo Z -» K, kde K byl zvolený číselný obor. Případně jsme pracovali s posloupnostmi vektorů nad reálnými nebo komplexními čísly. Připomeňme si diskusi z odstavce 1.4, kde jsme přemýšleli nad způsoby, jak pracovat se skalárními funkcemi. Na této diskusi není třeba nic doplňovat a rádi bychom (pro začátek) uměli pracovat s funkcemi M -» M (reálné funkce reálné proměnné) nebo M -» C (komplexní funkce reálné proměnné), případně funkcemi Q -» Q (funkce jedné racionální proměnné s racionálními hodnotami) apod. Většinou půjdou naše závěry snadno rozšířit na případy s vektorovými hodnotami nad stejnými skaláry, ve výkladu se ale zpravidla omezíme jen na případ reálných a komplexních čísel. Začneme od nejednodušších funkcí, které umíme zadat explicitně pomocí konečně mnoha algebraických operací se skaláry. A. Interpolace polynomy Na úvod této kapitoly se budeme snažit odhadnout funkce pomocí polynomů. Předpokládejme, že o neznámé funkci máme pouze kusé informace, totiž její hodnoty v několika bodech, popřípadě i hodnoty její první či druhé derivace v těchto bodech. Budeme se snažit najít polynom (co nejmenšího stupně) splňující tyto závislosti. Nalezněte polynom P splňující následující podmínky: ^ P(2) = 1, P(3) = 0, P(4) = -1, P(5) = 6. i. Řešme příklad nejprve sestavením soustavy čtyř lineárních rovnic o čtyřech neznámých. Předpokládáme polynom ve tvaru a3x3 + a2x2 + a\X\ + a0. Víme, že polynom stupně nejvýše tři splňující podmínky v zadání je dán jednoznačně. «0 + 2fli + 4a2 + 8^3 = 1 ao + 3a\ + 9a2 + 21 a3 = 0 «0 + 4a i + 16^2 + 64út3 = —1 «0 + 5fli + 25^2 + 125^3 = 6. 247 A. INTERPOLACE POLYNOMY 1. INTERPOLACE POLYNOMY Každá rovnice vznikla zjedná z podmínek v zadání. Druhou možností řešení je vytvořit hledaný polynom pomocí fundamentálních Lagrangeových polynomů (viz 5.4): (jc-3)(jc-4)(jc-5) P(x) = 1-------- + 0- (...) + (2-3)(2-4)(2-5) (x-2)(x-3)(x-5) (x-2)(x-3)(x-4) ' (4 - 2)(4 - 3)(4 - 5) ' (5-2)(5-3)(5-4) 4 , ,101 = -z3 - I2z2 + — z - 29. Koeficienty tohoto polynomu jsou samozřejmě jediným řešením výše sestavené soustavy lineárních rovnic. □ 5.2. Nalezněte polynom P splňující následující podmínky: P(l + i) = i, P(2) = 1, P(3) = -i. 5.3. Pro navzájem různé body x0, ..., xn e M uvažme elementární Lagrangeovy polynomy (5.4) Z,(x) := x€R,i=o,...,„. Dokažte, že platí n 22 Z; (x) = 1 pro všechna x e M. Solution. Zřejmě je Eí«(*o) = l + 0 + --- + 0=l, *=o SZť(JCi) = 0+l + --- + 0=l, XZť(jc„) = 0 + 0 + --- + l = l. To znamená, že polynom Xľ=o ^ (x) stupně nejvýše n nabývá v n + 1 bodech x0, ..., xn stejné hodnoty 1. Takový polynom (stupně nejvýše n) však existuje právě jeden, a to konstantní polynom y = 1. □ 5.4. Nalezněte polynom f splňující následující podmínky: P(l) = 0, P'(l) = 1, P(2) = 3, P'(2) = 3. Solution. Opět ukážeme dvě možnosti řešení. Dané podmínky určují čtyři lineární rovnice pro koeficienty hledaného polynomu. Budeme-li hledat polynom třetího stupně, 5.1. Polynomy. Skaláry umíme sčítat a násobit a tyto Mtés- <®ip operace splňují řadu vlastností, které jsme ■^nh vyjmenovali už v odstavcích 1.1 a 1.3. Když připustíme konečný počet těchto operací, přičemž jednu proměnnou ponecháme jako neznámou a další vstupující skaláry budou pevně zvolené, dostáváme tzv. polynomy: j Polynomy | Polynomem nad okruhem skalárů ] / : K -» K dané výrazem [ rozumíme zobrazení 1 /(*) anx" + an-\xn 1 + • • • + a\x + clq, kde cii, i = 0, ..., n, jsou pevně zadané skaláry, násobení je znázorněno prostým zřetězením symbolů a "+" označuje sčítání. Pokud je a„ ^ 0, říkáme, že polynom / je stupně n. Stupeň nulového polynomu není definován. Skaláry a; označujeme jako koeficienty polynomu J^^^^^^^^^^^J^ Polynomy stupně nula jsou právě konstantní nenulová zobrazení x a0- V algebře j sou častěji polynomy definovány jako formální výrazy uvedeného tvaru f(x), tj. jako posloupnosti koeficientů Clo, Cl\, . . . s konečně mnoha nenulovými prvky. V zápětí si ale ukážeme, že v analýze budou oba přístupy ekvivalentní. Je snadné ověřit, že polynomy nad okruhem skalárů tvoří opět okruh, kde násobení a sčítání je dáno operacemi v původním okruhu K pomocí hodnot polynomů, tzn. (/ • *)(*) = /(*) • řW, (/ + *)(*) = /(*) + sW, kde nalevo a napravo musíme správně interpretovat příslušné operace v okruhu polynomů a v samotném okruhu skalárů. 5.2. Dělení polynomů se zbytkem. Jak jsme již zmínili, budeme v dalším pracovat výhradně s poli skalárů Q, M nebo C. Pro všechna pole skalárů však platí Proposition (O dělení polynomů se zbytkem). Pro libovolné polynomy f stupně n a g stupně m, existují jednoznačně určené polynomy q a r takové, že f = q ■ g + r a přitom je stupeň r menší než m neboje r = 0. Proof. Začněme jednoznačností. Předpokládejme, že I J' „ máme dvě požadovaná vyjádření polynomu / s polynomy g, g', r a r1, tj. platí f = q■S +r = q ■g + r . Pak také odečtením dostaneme 0 = (q — q') ■ g + (r — r1). Jestliže q = q', pak také r = r1. Je-li q ^ q', pak člen s nej vyšším stupněm v (q< — q') ■ g nemůže být vykompenzován r — r', což vede na spor. Dokázali jsme tedy jednoznačnost výsledku dělení, pokud existuje. Zbývá dokázat, že umíme polynom / vždy napsat požadovaným způsobem. Pokud by stupeň g byl větší než stupeň /, pak můžeme rovnou psát / = 0 • g + f. 248 CHAPTER 5. ZŘÍZENÍ ZOO Předpokládejme proto n > m a dokažme tvrzení indukcí přes stupeň /. Pokud je / polynom stupně nula, je tvrzení zřejmé. Přepokládejme tedy, že tvrzení platí pro stupně menší než n > 0 a uvažme výraz h(x) = f (x) — ^Lx"~m g (x). Buď je h(x) přímo nulový polynom a pak máme, co jsme hledali, nebo jde o polynom nižšího stupně a tedy jej již umíme napsat potřebným způsobem h(x) = q ■ g + r a tedy také f(x) = h(x) + ^x"-mg(x) = (q + ^ŕ~m)g(x) + r a tvrzení je dokázáno. □ Je-li pro nějaký prvek b e K hodnota f (b) = 0, pak to znamená, že v podílu f (x) = q(x)(x —b)+r musí být r = 0. Jinak by totiž nebylo možné dosáhnout f (b) = q(b) ■ 0 + r, kde stupeň r je nulový. Říkáme, že b je kořen polynomu f. Stupeňg jepakprávěn—1. Pokud máq opět kořen, můžeme pokračovat a po nejvýše n krocích dojdeme ke konstatnímu polynomu. Dokázali jsme tedy, že každý nenulový polynom nad polem K má nejvýše tolik kořenů, kolik je jeho stupeň. Odtud již snadno dovodíme i následující pozorování: Corollary. Je-li K pole s nekonečně mnoha prvky, pak dva polynomy f a g jsou si rovny jako zobrazení, právě když mají shodné koeficienty. Proof. Předpokládejme / = g, tj. / — g = 0, jako zobrazení. Polynom (/ — g)(x) tedy má nekonečně mnoho kořenů, což je možné pouze tehdy, je-li nulovým polynomem. □ Uvědomme si, že u konečných polí samozřejmě takové tvrzení neplatí. Jednoduchým příkladem je např. polynom x2 + x nad Z2, který představuje nulové zobrazení. 5.3. Interpolační polynom. Často je užitečné zadat snadno počítatelný vztah pro funkci, pro kterou máme zadány hodnoty v předem daných bodech : xq, ... ,xn. Pokud by šlo o nulové hodnoty, umíme přímo zadat polynom stupně n + 1 f (x) = (x - x0)(x - x{)... (x - xn), v/ (• který bude mít nulové hodnoty právě v těchto bodech a nikde jinde. To ale není jediná polynomiální odpověď, protože požadovanou vlastnost má i nulový polynom. Ten je přitom jediný s touto vlastností ve vektorovém prostoru polynomů stupně nejvýše n. Obdobně to dopadne i v obecném případě: ^j^^^M^m^ Interpolační polynomy [ Nechť K je nekonečné pole skalárů. Interpolační polynom f pro množinu po dvou různých bodů x0, ... ,xn e K a předepsaných hodnot y0, ..., yn e K je polynom stupně nejvýše n nebo nulový polynom, který splňuje f (xi) = y; pro všechna i = 0, 1, ..., n. dostáváme tedy přesně tolik rovnic, kolik je neznámých koeficientů polynomu (nechť např. P(x) = a3x3 + a2x2 + a\x + a0): P(l) = (a3+a2 + ai+a0 =0, P'(\) = 3a3 +2a2+ai = 1, P(2) = 8^3 + 4a2 + 2a\ + a$ = 3, P'(2) = I2a3 + 4a2 + ax = 3. Vyřešením tohoto systému obdžíme polynom P(x) = —2x3 + 10x2 — 13x +5. Jiné řešení. Použijeme fundamentální Hermiteovy polynomy: h\(x) = 0 2 0 + (- -(x -1) h\(x) = (5 — 2x)(x - -D2, h\{x) = (x - 1)(* - 2)2, h\{x) = (x -2)(x- D2- Celkem (x - 1) I (2 - xf = (2x - l)(x - 2)1 P(x) = 0-h\(x)+3-h\(x)+l-h\(x)+3-h22(x) = -2x3 + 10x2-13x+5. □ 5.5. Pomocí Lagrangovy interpolace spočítejte přibližnou hodnotu cos2 1. Použijte k tomu hodnoty funkce v bodech |, | a|. Solution. Nejprve určíme funkční hodnoty v zadaných bodech: cos2(f) = 1/2, cos2(f) = 1/4, cos2(f) = 0. Dále určíme elementární Larangeovy polynomy, přitom můžeme spočítat hodnoty přímo v zadaném bodě: ío(l) Celkem tedy (1 -f)(l - -) i71 71 \ f 71 3 A4 1> (1- "f)(l- - -) ,71 y3 71 \ f 71 4 A 3 2J (1 -f)(l 3> f 71 71 \ f 71 71 \ ^2 ~ 1^2 ~ J' 8(7r" - 3)(7T - -2) O 7T2 9(7r -4)(7T -2) y 7T2 2(7r" -4)(7T- -3) Z. 7T2 •9(7r -4)(7T -2) * y 7T2 + 0 (5tt - 12) (tt - 2) i^2 0.288913. Vidíme, že při výpočtu třetí elementrání polynom nebyl potřeba. Skutečná hodnota je cos2 1 = 0.291927. □ 249 A. INTERPOLACE POLYNOMY 1. INTERPOLACE POLYNOMY 5.6. Franta potřebuje počítat hodnoty funkce sin, ale má k dispozici jen mobilní telefon s jednoduchou kalkulačkou, která umí základní operace. Protože si pamatuje hodnoty funkce sin v bodech 0, |,||a| a ví, že přibližné hodnoty it, \/2 a \/3 jsou 3.1416, 1.4142 a 1.7321, rozhodl se, že použije k přibližnému výpočtu interpolaci. Pomozte mu sestrojit přibližný vztah s využitím všech hodnot. Solution. Sestrojíme elementární Larangeovy polynomy: l0(x) h(x) h(x) U(x) (x - f )(x - f )(x - f )(x - f) (0-f)(0-f)(0-f)(0-f) 1.4783x4 - 5.8052x3 + 8.1057x2 - 4.7746x + 1, (x - 0)(x - f )(x - f )(x - f) (f -0)(|-f)(f -f)(f-§) -13.3046x4 +45.2808x3 - 49.2419x2 + 17.1887x, (x - 0)(x - f )(x - f )(x - f) (f - 0)(f - f )(f - f)(f - f) 23.6526x4 - 74.3070x3 +71.3298x2 -20.3718x, (x - 0)(x - f )(x - f )(x - f) (f - 0)(f - f )(f - f)(f - f) -13.3046x4 +38.3146x3 - 32.8279x2 + 8.5943x, (x - 0)(x - f )(x - f )(x - f) (f -o)(f-f)(f -|)(f -f) 1.4783x4 - 3.4831x3 + 2.6343x2 - 0.6366x. Hodnota interpolačního polynomou je pak 1 V2 73 P(x) = 0 • o(i) + -h(x) + — h(x) + — Z3(x) + U(x) = 0.0288x4 - 0.2043x3 +0.0214x2 + 0.9956x. □ Doplňující otázky: Může Franta tento přibližný výsledek použít i pro výpočet funkce sin na intervalu [j, jt]? A pokud ne, jak by měl postupovat? Jak by vypadaly přibližné vztahy, pokud by Franta ne použil všechny uzly, ale pro každý bod jen tři uzly nejbližší? 5.7. Další den potřeboval Franta spočítat dvojkový logaritmus 25. ^ i'/, (Ve skutečnosti potřeboval přirozený logaritmus, ale protože ví, že ln 2 je zhruba 0.6931, vystačí si i s dvojkovým.) Nejprve tedy vzal uzly 16 a 32 s funkčními hodnotami 4 a 5 a sestrojil interpolační polynom (přímku) P(x) = j^x + 3, takže f (25) = y| = 4.5625. Kvůli zpřesnění výsledku přidal další uzel 8 s funkční hodnotou 3. V tomto případě vyšel interpolační polynom roven P(x) = — j^x2 + j^x + |, což dává P (25) = A.1266. Franta chtěl výsledek ještě zpřesnit, přidal tedy rovnou dva uzly, a to 2 a 4 s funkčními hodnotami 1 a 2. Jaké však bylo jeho překvapení, když Theorem. Pro každou množinu n + 1 po dvou různých bodů xq, ..., xn G IK a předepsaných hodnot yo, ..., y„ e K existuje právě jeden interpolační polynom f. 1 Proof. Začněme jednodušší částí, tj. jednoznačností. Jsou-li / a g dva interpolační polynomy skljly/ se stejnými definičními hodnotami, pak je jejich rozdíl polynomem stupně n, který má n + 1 kořenů, a proto je / — g = 0. Zbývá existence. Označme si prozatím neznámé koeficienty polynomu / stupně n f = a„x" + • • • + a\x + aQ. Dosazením požadovaných hodnot dostaneme systém n + 1 rovnic pro stejný počet neznámých koeficientů a; a0 + x0fli H-----h (x0)"an = y0 a0 + xnai H-----h (xn)nan = yn. Existenci řešení tohoto systému rovnic můžeme snadno ukázat přímou konstrukcí patřičného polynomu pomocí tzv. Lagrangeových polynomů pro dané body x0, ...,x„, viz. další odstavec textu níže. Nyní ale důkaz dokončíme pomocí jednoduchých znalostí z lineární algebry. Tento systém lineárních rovnic má totiž právě jedno řešení pokud je determinant jeho matice invertibilní skalár, tj. pokud je nenulový (viz 3.1 a 2.23). Jde o tzv. Vandermondův determinant, který jsme již diskutovali v příkladu ||2.24|| na straně 87. Protože jsme ale už ověřili, že pro nulové pravé strany existuje řešení právě jedno, víme, že tento determinant nenulový být musí. Protože polynomy jsou jako zobrazení stejné, právě když mají stejné koeficienty, věta je dokázána. □ v . t 250 CHAPTER 5. ZŘÍZENÍ ZOO 5.4. Užití interpolací. Na první pohled se může zdát, že reálné nebo případně racionální polynomy, tj. polynomiálně zadané funkce M -» M nebo I>, tvoří hezkou velikou třídu funkcí jedné proměnné. Můžeme jimi proložit jakékoliv sady předem zadaných hodnot. Navíc se zdají být snadno vyjádřitelné, takže by s jejich pomocí mělo být dobře možné počítat i hodnoty těchto funkcí pro jakoukoliv hodnotu proměnné. Při pokusu o praktické využití v tomto směru ovšem narazíme hned na několik problémů. Prvním z nich je potřeba rychle vyjádřit polynom, kterým zadaná data proložíme. Pro řešení výše diskutovaného systému rovnic totiž budeme obecně potřebovat čas úměrný třetí mocnině počtu bodů, což při objemnějších datech je jistě těžko přijatelné. Podobným problémem je pomalé vyčíslení hodnoty polynomu vysokého stupně v zadaném bodě. Obojí lze částečně obejít tak, že zvolíme vhodné vyjádření intepolačního polynomu (tj. vybereme lepší bázi příslušného vektorového prostoru všech polynomů stupně nejvýše k, než je ta nejobvyklejší 1, x, x2, ..., x"). Ukážeme si pouze jediný přiklad takového postupu: _j Lagrangeovy interpolační polynomy I Lagrangeův interpolační polynom snadno zapíšeme pomocí tzv. elemntárních Lagrangeových polynomů lt stupně n s vlastnostmi ti(Xj) 1 i = j 0 iŕj Zřejmě musí být tyto polynomy až na konstantu rovny výrazům (x — xq) ... (x — x,_i)(x — xi+\)... (x — x„) a proto Uj^i (X - Xj) li(x) Hledaný Lagrangeův interpolační polynom je pak dán vztahem f(x) = y0lo{x) + yili(x) H-----h y„t„(x). Použití Lagrangeových polynomů je obzvlášť efektivní, když opakovaně prokládáme zadané hodnoty závislé proměnné yt pro stále stejné hodnoty nezávislé proměnné xt. Pak totiž máme elementární polynomy lt předem připraveny. Toto vyjádření má nevýhodu ve velké citlivosti na nepřesnosti výpočtu při malých rozdílech zadaných hodnot xt, protože se v něm těmito rozdíly dělí. Další nepříjemností je velice špatná stabilita hodnot reálných nebo racionálních polynomů při zvětšující se hodnotě proměnné. Brzy budeme mít nástroje na přesný popis kvalitativního chování funkcí, nicméně i bez nich je zřejmé, že podle znaménka koeficientu u nejvyšší mocniny polynomu se hodnoty velice rychle při rostoucím x vydají buď do plus mu vyšla hodnota P (25) = 5.892, která je určitě nesprávná vzhledem k tomu, že logaritmus je rostoucí funkce. Dokážete vysvětlit, kde se vzala taková chyba? Solution. Franta trochu pátral na internetu a zjistil, že chyba při interpolaci se dá vyjádřit ve tvaru f(x) - Pn(x) (X — X0)(X — X\) . . . (X — Xn) + (n + 1)! kde bod § není znám, ale leží v intervalu daném nejmenším a největším uzlem. Člen v čitateli zlomku způsobuje, že přidávání dalších vzdálených uzlů přesnost spiše zhoršuje. □ 5.8. O týden později potřeboval Franta určit Napdlo ho problém otočit a použít tzv. inverzní interpolaci, tedy zaměnit roli uzlů a funkčních hodnot a určit přibližnou hodnotu vhodné funkce v nule. Jak postupoval? Solution. *Jl je nulový bod funkce x2 — 1. Franta vzal uzly x0 = 2, x\ = 2.5, X2 = 3, příslušné funkční hodnoty jsou -3, -0.75 a 2. Pak prohodil úlohu uzlů a funkčních hodnot a získal elementární Lagrangeovy polynomy k(x) h(x) h(x) (x + 0.75)(x -2) 4 (-3 + 0.75X-3-2) ~ 45' 16 2 16 32 --x--x H--, 99 99 33 6,3 9 —x1 H--x H--. 55 11 55 1 —x 9 2 15' Pro VŤ" tak dostal přibližnou hodnotu 2 • Z0(0) + 2.5 • h (0) + 3 • l2(0) 437 165 2.6485. Doplňující otázky: Frantovi se do výpočtu jednoho elementráního polynomu vloudila chyba, pokuste se ji vypátrat. Má tato chyba vliv na výslednou hodnotou? Jak bychom mohli využít také hodnotu derivace v bodě 2.5? □ 5.9. Nalezněte přirozený splajn 5, který splňuje podmínky 5(-l) = 0, 5(0) = 1, 5(1) = 0. Solution. Hledaný přirozený splajn bude složen ze dvou kubických polynomů, jednoho, řekněme 5i, pro interval [—1,0], druhého, řekněme S2 pro interval [0, 1]. Slůvko "přirozený" navíc určuje, že hodnoty druhých derivací polynomů 5i, resp. S2, budou nulové v bodě — 1, resp. 1. Díky předepsané společné hodnotě v bodě 0 víme že absolutní člen obou polynomů je 1, ze symetrie úlohy plyne, že společná hodnota první derivace v bodě 0 je nulová. Můžeme tedy psát 5i(x) = ax3 + bx2 + 1 a S2(x) = cx3 + dx2 + 1, pro neznámé reálné parametry a,b,c nd. Dosazením těchto tvarů do čtyř podmínek 251 A. INTERPOLACE POLYNOMY 1. INTERPOLACE POLYNOMY Si(-l) = 0, 5i"(-l) = 0, 52(1) = lineární rovnice pro tyto parametry: -a+b+1 —6a + 2b c + d +1 6c + 2d Jejich vyřešením pak S\ (x) = — \x2 + 1. Celkem tedy 5(x) = 0a 52"(1) = 0 dostáváme čtyři = 0, = 0, = 0, = 0. 1 v3 3V2 -±x3 ,2 ±x3 - 2X + 1 \x2 +1 ^x2 + 1, 52(x) pro x e [—1,0], pro x e [0, 1]. ±x3 2X □ 5.10. Nalezněte splajn 5, který splňuje podmínky 5(-l) = 0, 5(0) = 1, 5(1) = 0, 5(-l) = 1, 5(1) 1. 0, 1, 0, 1 Solution. Hledaný splajn se od splajnu z předchozí úlohy liší pouze hodnotami derivací v bodech —1 a 1. Obdobně jako v předchozí úloze tak dostáváme části 5i a 52 splajnu ve tvaru 5i (x) = ax3 + bx2 + 1 a 52(x) = cx3 + dx2 + 1, pro neznámé reálné parametry a, b, c a d. Dosazením do podmínek 5i(-l) = 0, 5^-1) = 1, 52(1) = 0 a 52(1) = 1 dostáváme nyní soustavu -a + b + 1 = 3a — 2b = c+d+1 = 3c + 2d = s řešením a = —1, b = —2, c = 3 a d funkce 5(x) J A — H-X -|- 1 piU X t l\J, 1J. □ 5.11. Nalezněte polynom nejvýše druhého stupně, který v bodech xq = —1, X\ = 1, x2 = 2 nabývá po řadě hodnot y0 = 1, yi = -3, y2 = 4. 5.12. Sestrojte Lagrangeův interpolační polynom pro -4, tedy hledaný splajn je -x3-2x2 + l pro jc e [-1,0], 3x3 - 4x2 + 1 prox e [0, 1]. Xi -2 -1 1 2 yi 1 -1 -1 1 Pak uvedte libovolný polynom vyššího než třetího stupně, jenž vyhovuje podmínkám uvedeným v tabulce. 5.13. Nalezněte polynom p(x) = ax3 + bx2 + cx + d, pro který platí nebo mínus nekonečna. Ani toto znaménko koeficientu u ne-jvyššího stupně se ale u interpolačního polynomu při malých změnách prokládaných hodnot nechová stabilně. Názorně to vidíme na dvou obrázcích, kde je proloženo jedenáct hodnot funkce sin(x) s různými malými náhodnými změnami hodnot. Je na nich vynesena aproximovaná funkce, kolečka jsou malinko posunuté hodnoty a jimi proložený jednoznačně zadaný interpolační polynom. Zatímco uvnitř intervalu je aproximace vcelku dobrá, stabilita na okrajích je otřesná. 2--4 \ -2 J N / ■ \ -2- Kolem interpolačních polynomů existuje bohatá teorie, zájemce odkazujeme na speciální literaturu. 5.5. Poznámka. Numerická nestabilita způsobená případnou blízkostí (některých) z bodů x; je dobře viditelná i na systému rovnic z důkazu Věty 5.3. Při řešení systémů lineárních rovnic totiž nestabilita do značné míry souvisí s velikostí determinantu matice systému, tj. v našem případě Vandermon-dova determinantu. Ten umíme vcelku snadno přímo spočíst: Lemma. Pro posloupnost po dvou různých skalárů xq, ..., x„ e K platí V(x0, - - - ,x„) <>k=0 Xk)- Proof. Vztah dokážeme indukcí přes počet bodů x,. Evidentně je správný pro n = 1 (a pro n = 0 je úloha nezajímavá). Předpokládejme, že výsledek je správný pro n — 1, tj- V(x0, ..., x„_i) n-l ne <>k=0 xk)- Nyní považujme hodnoty x0, ..., x„_i za pevné a hodnotu x„ ponechme jako volnou proměnnou. Rozvojem determinantu podle posledního řádku (viz ??) obdržíme hledaný determinant jako polynom (5.1) V(x0, ...,x„) = (x„)"V(x0, ...,x„_i) - (x„)" 1 ••• . Toto je polynom stupně n, protože víme, že jeho koeficient u (x„)" je nenulový dle indukčního předpokladu. Přitom bude zjevně nulový při dosazení kterékoliv hodnoty x„ = Xi pro i < n, protože bude v takovém případě obsahovat 252 CHAPTER 5. ZŘÍZENÍ ZOO původní determinant dva stejné řádky. Náš polynom tedy bude dělitelný výrazem (-*-« -"-o)(-"-« ' ' ■ (-*-« -*-«—1)> který má sám již stupeň n. Odtud vyplývá, že celý Vander-mondův determinant coby polynom v proměnné x„ musí být tomuto výrazu roven až na konstantní násobek, tj. v(x0, , Xn) — C ' {xn X§){xn X\) ' ' ' {xn Xn — \). Porovnáním koeficientů u nejvyšší mocniny v (5.1) a tomto výrazu dostáváme c = v(x0, ... a tím je důkaz lemmatu ukončen. xn-i) □ Opět tedy vidíme, že determinant bude velmi malý, pokud jsou malé vzdálenosti bodů xt. 5.6. Derivace polynomů. Zjistili jsme, že hodnoty polynomů s rostoucí proměnnou rychle míří k 1__nekonečným hodnotám (viz také obrázky). Proto je zřejmé, že polynomy nemohou nikdy vhodně popisovat jakékoliv periodicky se opakující děje (jako jsou např. hodnoty goniometrických funkcí). Mohlo by se ale zdát, že podstatně lepší výsledky budeme alespoň mezi body x;- dosahovat, když si budeme kromě hodnot funkce hlídat, jak rychle naše funkce v daných bodech rostou. Za tímto účelem zavedeme (prozatím spíše intuitivně) pojem derivace pro polynomy. Můžeme přitom pracovat opět s reálnými, komplexními nebo racionálními polynomy. Rychlost růstu v bodě x e M pro reálný polynom f(x) dobře vyjadřují podíly f(x + Ax) - f(x) (5.2) Ax a protože umíme spočíst (nad libovolným okruhem) (x+Ax)* = xk+kxk~l Ax+- • •+(*)** (Ax)*"'+- • -+(Ax/\ dostaneme pro polynom f(x) = anx" +■ ■ ■ +a0 výše vedený podíl ve tvaru fix"'1 Ax +•••+( Ax)* /(x+Ax)-/(x) -=a, Ax = nanxn~l + (n \)an. Ax „«-2 Ax +ai — Ax H-----h ai + Ax(...) kde výraz v závorce je polynomiálně závislý na Ax. Evidentně pro hodnoty Ax velice blízké nule dostaneme hodnotu libovolně blízkou následujícícmu výrazu: J Derivace polynomů [ ^ Derivací polynomu f (x) = anxn + ■ ■ ■ + ao podle proměnné x rozumíme polynom /'(*) nanxn 1 + (n 1K_!x"-2 + p{0) = \, />(!) = 0, p{2) = \, p(3) = 10. 5.14. Určete polynom p nejvýše třetího stupně splňující p(0) = 2, p{\) = 3, p(2) = 12, p(5) = 147. 5.15. Nechť jsou libovolně zvoleny hodnoty y0, ..., yn e M v navzájem různých bodech x0, ..., x„ ě! Kolik existuje polynomů stupně právě n + 1, které nabývají v uvedených bodech zadaných hodnot? 5.16. Stanovte Hermiteovy interpolační polynomy P, Q, jestliže má být P(-l) = -ll, P(l) = l, P'(-l) = 12, P'(l)=4; <2(-l) = -9, G(l) = -1, <2'(-l) = l0, G'(l)=2. 5.17. Nahradíte funkci / Hermitéovým polynomem, víte-li Xi -1 1 2 f(Xi) /'(Xi) 4 8 -4 -8 -8 11 5.18. Bez počítání uvedte Hermiteův interpolační polynom, je-li požadováno, aby x0 = o, X\ = 2, X2 = i, yo = 0, y\ = 4, yi = i, y'o = 0, Á = 4, Á = 2. 5.19. Nalezněte polynom nejvýše třetího stupně, který v bodě x = 1 nabývá hodnoty y = 4, v bodě x = 2 hodnoty y = 9 a který má v bodě x = 0 derivaci rovnu —2, zatímco v bodě x = 1 je jeho derivace rovna 1. Poté určete polynom nejvýše třetího stupně, jenž v bodech x = lax = —1 nabývá hodnoty y = 6 a jenž má v bodě x = 1 a zároveň v bodě x = — 1 derivaci rovnu 2. 5.20. Kolik existuje navzájem různých polynomů stupně nejvýše 4, které v bodech xq — 5, X\ = 55 nabývají po řadě hodnot y0 = 55, yi = 5 a jejichž první a druhá derivace v bodě x0 je nulová? 5.21. Napište libovolný polynom P vyhovující těmto podmínkám: P(0) = 6, P(l) = 4, P(2)=4, P'(2) = l. 5.22. Sestrojte přirozený kubický interpolační splajn pro body x0 = — 1, x\ = 0, x2 = la hodnoty y0 = 1, y\ = 0, y2 = 1 v těchto bodech. 5.23. Zkonstruujte přirozený kubický interpolační splajn pro funkci /(x) = |x|, xe[-l,l], pokud jsou zvoleny body x0 = — 1, x\ = 0, x2 = 1. 5.24. Napište přirozený kubický interpolační splajn pro body x0 = —3, x\ = 0, x2 = 3 253 B. TOPOLOGIE KOMPLEXNÍCH ČÍSEL A JEJICH PODMNOŽIN 1. INTERPOLACE POLYNOMY a hodnoty y0 -3, yi =0,y2 = 3. 5.25. Bez počítání uvedte přirozený kubický interpolační splajn pro body jco = — 1, jci = 0 a i2 = 2 a hodnotu y0 = yi = y2 = 1 v těchto bodech. 5.26. Určete úplný kubický interpolační splajn pro body xq = —3, x\ = —2, x2 = —1 a pro hodnoty y0 = 0, yi = 1, y2 = 2, y'0 = 1, /2 = 1. 5.27. Sestrojte přirozený kubický interpolační splajn pro funkci y l+x2 při volbě bodů Xq = 0, X\ = 1, X2 = 3. Více příkladů k interpolačním polynomům najdete na straně 307. B. Topologie komplexních čísel a jejich podmnožin 5.28. Nalezněte hromadné, izolované, hraniční a vnitřní body množin N, , X = {ieR;00 pro ieK\N. neN neOi(b)nN Odsud máme Ogb (b) n N = 0, tj. žádné b e R \ N není hraničním bodem N. Současně víme, že každý bod dané množiny, který není vnitřním bodem, je nutně jejím hraničním bodem. Množina hraničních bodů tak obsahuje N. Shrneme-li to, množina hraničních bodů N je N. Množina Q. Racionální čísla tvoří tzv. hustou podmnožinu množiny všech reálných čísel. To znamená, že ke každému reálnému číslu konverguje posloupnost racionálních čísel (představme si např. nekonečný desetinný rozvoj reálného čísla a jemu odpovídající Z definice je jasné, že právě hodnota /'(x0) derivace polynomu nám dává dobré přiblížení jeho chování v okolí bodu xq. Přesněji řečeno, přímky y f(x0 + Ax) - f(x0) Ax (x -x0) + f(x0), tj. sečny grafu polynomu procházející body [xo, f(xo)] a [xo + Ax, f (xq + Ax)] se, se zmenšujícím se Ax, přibližují přímce y = f'(x0)(x - x0) + /(x0), což tedy musí být tečna grafu polynomu /. Hovoříme o lineárním přiblížení polynomu / jeho tečnou. Derivace polynomů je lineární zobrazení, které přiřazuje polynomům stupně nejvýše n polynomy stupně nejvýše n—1. Iterací této operace dostáváme druhé derivace /", třetí derivace /(3) a obecně po ^-násobném opakování polynom f(k) stupně n — k. Po n + 1 derivacích je výsledkem nulový polynom. Toto lineárním zobrazení je příkladem tzv. cyklického nilpotentního zobrazení, která jsou podrobněji rozebírána v odstavci 3.32 o nilpotentních zobrazeních. 5.7. Hermiteův interpolační problém. Uvažme opět m+1 ^ssa. po dvou různých reálných hodnot x0, ..., xm, tj. jíó :j Xi x j pro všechna i ^ j. Budeme chtít zase prokládat pomocí polynomů předem dané hod-'^!jr^i^\~ noty, tentokrát ale budeme vedle hodnot předepisovat i první derivace. Tj. predpíšeme y{ a ýi pro všechna i. Hledáme polynom /, který bude nabývat těchto předepsaných hodnot a derivací. Zcela analogicky jako u interpolace pouhých hodnot obdržíme pro neznámé koeficienty polynomu f(x) = anxn + ■ ■ ■ + a0 systém 2(m + l)rovnic a0 +x0ai H-----h (x0)"a„ = y0 a0 + %mal + - - - + (Xm)"an ci\ + 2x$a2 + • • • + n(xo) n-1 ym y'o d\ -\- 2,Xmú.2 ~r" + n(xm)n lan = y Opět bychom mohli ověřit, že při volbě n = 2m + 1 bude determinant tohoto systému rovnic nenulový a tudíž bude existovat právě jedno řešení. Nicméně, obdobně ke konstrukci Lagrangeova polynomu lze zkonstruovat takový polynom / přímo. Prostě si vytvoříme jednu sadu polynomů s hodnotami nula nebo jedna jak u derivací tak u hodnot, abychom jejich jednoduchou lineární kombinací uměli dosáhnout potřebné hodnoty. Ověření následující definice a tvrzení necháme na čtenáři: 254 CHAPTER 5. ZŘÍZENÍ ZOO Hermiteův interpolační polynom Hermiteův interpolační polynom definujeme pomocí fundamentálních Hermiteových polynomů: K (x) h2 (x) 1 ľ(Xi) (X - Xi) (M*))' (X - Xi) (ti (x))2 , kde l(x) = nľ=i(x ~~ xi)- Tyto polynomy splňují: h] (Xj) 1 pro i = j 0 pro i ^ j (hD'ixj) h2(Xj) WW 0 0 a proto je Hermiteův interpolační polynom dán výrazem k f {x) = YJ{yih](xi)+y'ih2{xi)). 5.8. Příklady Hermiteových polynomů. Úplně nej-jednodušší případ je zadání hodnoty a derivace v jediném bodě. Tím určíme beze zbytku polynom stupně jedna f {x) = f(x0) + f'(x0)(x - x0) tj. právě rovnici přímky zadané hodnotou a směrnicí v bodě x0. Když zadáme hodnotu a derivaci ve dvou bodech, tj. Jo = f(x0), y0 = f'(x0), yi = f(xi), ix = f'(xi) pro dva různé body xt, dostaneme ještě pořád snadno počítatelný problém. Ukažme si jej ve zjednodušeném provedení, kdy x0 = 0, x\ = 1. Pak matice systému a její inverze budou /O 1 0 o 1 1 o o V3 2 1\ 1 o °7 /2 3 o o 1 -2 1 0 1\ -1 o °7 Přímým vynásobením a ■ (y0, yi, yo, y)r pak vyjde vektor koeficientů («3, «2, «1, «o)r polynomu /, tj. f{x) = (2y0 - 2yj + y'0 + y\)x3 + (-3y0 + 3yi - 2y'0 - y\)x2 + y'0x + y0. 5.9. Interpolace splajny. Obdobně můžeme předepisovat libovolný konečný počet derivací v jed-Š> notlivých bodech a vhodnou volbou stupně polynomu obdržíme vždy jednoznačné interpolace. Nebudeme zde uvádět podrobnosti. Bohužel, u všech těchto interpolací pořád zůstávají problémy zmíněné už v případě jednoduchých interpolací hodnot -složitost výpočtů a nestabilita. Použití derivací však podbízí jednoduché vylepšení metodiky: Jak jsme viděli na obrázcích demonstrujících nestabilitu interpolace jedním polynomem dostatečně vysokého stupně, posloupnost, kdy v následujícím členu přidáváme další cifru rozvoje). O této posloupnosti lze navíc předpokládat, že všechny její členy jsou navzájem různé (na poslední pozici konečného desetinného rozvoje se můžeme záměrně dopouštět chyby nebo kupř. číslu 1 přiřadíme desetinný rozvoj 0, 999 ... apod.). Množina hromadných bodů Q v M je proto celé M a každý bod x e M \ Q je hraniční. Zvláště dostáváme, že libovolné á-okolí Oi (i.\ = (i. - 8, i- +8 I , kde p, q € Z, q ^ 0, \qj \q q J racionálního čísla p/q musí obsahovat nekonečně mnoho racionálních čísel, což dává neexistenci izolovaných bodů. Číslo V2/10" není racionální pro žádné n e N. Předpokladem opaku (opět p, q e Z, q¥=0) -, tj. V2 V2 /> . f- 10" p 10" q q totiž okamžitě obdržíme spor - o číslu V2 víme, že není racionální. Libovolné okolí racionálního čísla p/q tak zároveň obsahuje nekonečně mnoho reálných čísel p/q + V2/10" (n e N), která nejsou racionální (množina Q jako těleso je uzavřená vzhledem k odečítání). Všechny body p/q e Q jsou tudíž rovněž hraniční a vnitřní body množina Q nemá. Množina X = [0, 1). Nechť a e [0, 1) je zvoleno libovolně. Posloupnosti {a + {1 — zjevně konvergují po řadě khod- notám a, 1. Snadno jsme tak ukázali, že množina hromadných bodů obsahuje interval [0, 1]. Jiné hromadné body neexistují: pro jakékoli b £ [0,1] existuje 8 > 0 takové, že Os (b) n [0, 1] = 0 (pro b < 0 postačuje položit á = —baprob > 1 potom á = b — 1). Protože každý bod intervalu [0, 1) je hromadným bodem, množina izolovaných bodů je prázdná. Pro a e (0, 1) označme menší z kladných čísel a, 1 — a jako<5fl. Uvážíme-li 0Sa (a) = (a-8a,a+8a)£ (0, 1), a € (0, 1), vidíme, že libovolný bod intervalu (0, 1) je vnitřním bodem intervalu [0, 1). Pro každé 8 e (0, 1) je os (0) n [0, i) = (-s, s) n [0, i) = [0, s), Os (1) n [0, 1) = (1 - 8, 1+8)0 [0, 1) = (1 - 8, 1), tj. každé á-okolí bodu 0 obsahuje jisté body intervalu [0, 1) a hodnoty z intervalu (—8,0) a každé á-okolí bodu 1 má neprázdný průnik s intervaly [0, 1), [1,1+ 8). Body 0 a 1 jsou tedy hraničními body. Celkem jsme zjistili, že množina všech vnitřních bodů odpovídá intervalu (0, 1) a množina hraničních bodů je {0, 1}. Stačí si uvědomit, že bod nemůže být současně vnitřní a hraniční a že hraniční bod musí být izolovaný, nebo hromadný. □ 255 B. TOPOLOGIE KOMPLEXNÍCH ČÍSEL A JEJICH PODMNOŽIN 1. INTERPOLACE POLYNOMY 5.29. Určete suprema a infima množin v (-1)" A = (-3,0]U(1,7T)U{6}; B : n e N ; c = (-9, 5.30. Nalezněte sup A a inf A pro n + (-\y C 5.31. Jsou dány následující množiny: N = {1,2, ...,n, ...}, M = \--;neN [ n t7 = (0,2]U[3,5]\{4}. Určete inf N, sup M, inf J a sup J v M. 5.32. Napište příklad množiny M c M, která nemá v M infimum, ale má zde supremum; a udejte příklad množiny N C M., která nemá v M supremum, ale má zde infimum. 5.33. Uvedte podmnožinu X množiny M, pro kterou je sup X < inf X. 5.34. Udejte příklad množin A, S, C c R takových, aby platilo ADB = 0, AHC = 0, SnC = 0, sup A = inf B = inf C = sup C. 5.35. Vyznačte v komplexní rovině následující množiny: i) {zeC||z-l| = |z + l|}, ii) {z e C| 1 < |z - i\ < 2}, iii) {z s C| Re(z2) = 1}, iv) {z e q Re(i) < ±}. Solution. • imaginárni osa, • mezikruží okolo i, • hyperbola a2 — b2 = 1, • vnějšek jednotkového kruhu se středem v 1. -L. malé lokální změny hodnot zapříčiňovaly dramatické celkové změny chování výsledného polynomu. Nabízí se tedy využití malých polynomiálních kousků nízkých stupňů, které ale musíme umět rozumně navazovat. Nejjednodušší je propojení vždy dvou sousedních bodů polynomem stupně nejvýše jedna. Tak se nejčastěji zobrazují data. Z pohledu derivací to znamená, že budou na jednotlivých úsecích konstantní a pak se skokem změní. O něco sofistikovanější možností je předepsat v každém bodě hodnotu a derivaci, tj. pro dva body budeme mít 4 hodnoty a jednoznačně tím určíme Hermiteův polynom 3. stupně, viz výše. Tento polynom pak můžeme použít pro všechny hodnoty nezávislé proměnné mezi krajními hodnotami xo < x\. Hovoříme o intervalu [xo, x\]. Takové polynomiální přiblížení po kouskách už bude mít tu vlastnost, že první derivace na sebe budou navazovat. V praxi ale není pouhé navazování první derivace dostatečné a navíc při naměřených datech nemíváme hodnoty derivací k dispozici. Přímo se proto vnucuje pokus využívat pouze zadané hodnoty ve dvou sousedních bodech, ale požadovat zároveň rovnost prvních i druhých derivací u sousedních kousků polynomů třetího stupně. To totiž bude znamenat stejné množství rovnic a neznámých a pravděpodobně tedy i obdobnou praktickou řešitelnost problému: j Kubické splajny | Nechť x0 < x\ < • • • < xn jsou reálné hodnoty, ve kterých jsou zadány požadované hodnoty y0, ... ,yn. Kubickým interpolačním splajnem pro toto zadání je funkce S : M -» M, která splňuje následující podmínky: • zúžení S na interval [x;_i,x;] je polynom Si nejvýše třetího stupně, i = 1, ..., n • 5;(x;_i) = y;_i a Sí(xí) = y;- pro všechny i = 1, • S^Xi) = Si+l(xi) pro všechny i = 1, — 1, • S"(xi) = S! . n, Ji + 1 (xí) pro všechny / = !,.... 1. Kubický splajn1 pro n + 1 bodů sestává z n kubických polynomů, tj. máme k dispozici 4n volných parametrů (první definiční podmínka). Další podmínky přitom zadávají 2n + (n — 1) + (n — 1) rovností, tj. dva parametry zůstávají volné. Při praktickém použití se dodávají předpisy pro derivace v krajních bodech, tzv. úplný splajn, nebo jsou tyto zadány jako nula, tzv. přirozený splajn. Výpočet celého splajnu už není bohužel tak jednoduchý jako u nezávislých výpočtů Hermitéových polynomů třetího stupně, protože data se prolínají vždy mezi sousedními intervaly. Při vhodném uspořádání se však dosáhne matice systému, která má nenulové prvky prakticky jen ve třech diagonálách, a pro takové existují vhodné numerické postupy, které umožní splajn počítat také v čase úměrném počtu bodů. Ošklivé české slovo "splajn" vzniklo fonetickým přepisem anglického ekvivalentu" spline", který znamenal tvárné pravítko užívané inženýry pro kreslení křivek. 256 CHAPTER 5. ZŘÍZENÍ ZOO Pro srovnání se podívejme na interpolaci stejných dat jako v případě Lagrangeova polynomu, nyní pomocí splajnů: □ C. Limity V následujících příkladech se budeme zabývat výpočtem limit posloupností, tedy tím, jak posloupnosti "vypadají v nekonečnu". Tj. pokud bychom chtěli předepsat n-tý člen posloupnosti pro hodně velké n, tak nám jej limita posloupnosti (pokud existuje) velmi dobře přiblíží. Limitám posloupností a posléze funkcí věnujeme v příkladovém sloupci hodně prostoru, proto s nimi začínáme dříve (a I končíme později), než ve sloupci teorie. Začněme s limitami posloupností. Potřebné definice nalezne čtenář na straně 260. 2. Reálná čísla a limitní procesy Je důležité mít dostatečně velkou zásobu funkcí, se kterými bude možné možné vyjadřovat všechny běžné závislosti, zároveň ale musí být výběr šikovně omezen, abychom uměli vybudovat nějaké univerzální a hlavně účinné nástroje pro práci s nimi. Ve skutečnosti se budeme muset hned z kraje soustředit na to, jak vůbec hodnoty funkcí definovat, když pomocí konečně mnoha násobení a sčítání dostáváme jen polynomy a navíc skutečně počítat umíme jen s čísly racionálními. S těmi ale nevystačíme ani při počítání odmocnin, protože už a/2 racionální číslo není. Prvním naším krokem tedy musí být pořádné zavedení tzv. limitních procesů, tj. dáme přesný obsah tvrzením, že se nějaké hodnoty blíží jejich hodnotě limitní. Všimněme si také, že výraznou vlastností polynomů je jejich "spojitá" závislost hodnot na nezávislé proměnné. Intuitivně řečeno, když dostatečně málo změníme x, určitě se nám moc nezmění ani hodnota f(x). Takové chování naopak nemáme u po částech konstantních funkcí / : M -» M v okolí "skoků". Např. u tzv. Heavisideovy funkce2 /(*) 0 pro všechny x < 0, 1 /2 pro x = 0, 1 pro všechny x > 0 taková "nespojitost" nastane pro x = 0. Začneme formalizací takovýchto intuitivních výroků. Reálná čísla. Prozatím jsme docela dobře vystačili s algebraickými vlastnostmi reálných čísel, které říkaly, že M je pole. Už jsme ale používali i relaci uspořádání reálných čísel, kterou značíme "<" (viz odstavec 1.38). Vlastnosti (axiomy) reálných čísel, včetně souvislostí uspořádání a ostatních relací, jsou srhnuty v následující tabulce. Dělící čáry naznačují, jak axiomy ? Heaviside byl byl anglický inženýr, v matematice samouk, který ale . 5.36. Spočítejte následující limity posloupností: i) lim 2«2+3« + l « + l ii) lim 2" 2+3n+l, iii) lim ' „^oo 2«2+3« + l iv) lim„_ v) lim 2"-2-" -oo 2n+2-" ' v/4n2+n vi) lim ~jAn2 + n — 2n. Solution. i) lim 2«2+3« + l n + 1 lim 2«+3+J 3 , 1 OO. ii) lim 2+i n^oo 3«2+« + l 1 + * _ 1 iii) lim „ "+1 , „^oo 2«2+3« + l 2«+3+i oo lim ^ =0. iv) 2«_2_ n lim - n^-oo 2" + 2~n 2- - 1 n^-°° j=z + 1 v) Podle věty o třech limitách (5.21): Vn e N : ^ < ^J±» < M2_i_M_|_J_ 16 Dále pak lim = lim ^ = 2, lim H2_|_M_|_J_ 16 lim vi) 2n+lj 2. Tedy i lim ^!±» = 2. «^►00 " lim V An2 + n — 2n = lim (JAn2 + n - 2n)(VÄn2+n + 2n) •J An2 + n+ 2n n lim —-:_ «^oo ^4„2 _|_ „ _|_ 2n 1 lim - _ n^oo ~J4n2+n 1 + 2 257 C. LIMITY 2. REÁLNÁ ČÍSLA A LIMITNÍ PROCESY □ 5.37. Buď c e M+ (kladné reálné číslo). Ukážeme, že lim tfč = 1. Solution. Uvažme nejprve c > 1. Funkce tfč je vzhledem k n klesající a její hodnoty jsou stále větší než 1 a proto musí mít posloupnost j/č limitu a tou je infmium jejich členů. Předpokládejme, že by tato limita byla větší než 1, řekněme l+e,kdee > 0. Pak by podle definice limity byly všechny hodnoty dané posloupnosti od jistého m menší než 1 + s + T, tj. zejména ?fč < 1 + s + Potom by však c 1, n e N. Můžeme tedy položit tfň = 1 + an pro jistá čísla an > 0, n e N. Užitím binomické věty získáváme n = (1 + o„)" = 1 + {^jan + + ••• + <. " > 2 (n e N). Odsud plyne odhad (všechna čísla an jsou nezáporná) n > tj. po úpravě máme 0 < a„ < 09 n «„ = - (n - 1) , —---a2n, n>2(/!eN), n-Y Podle Věty o třech limitách je n > 2 (n e N). 0 = lim 0 < lim an < lim n^-oc n^-oc n^-oc V 77 — 1 0. Obdrželi jsme tak výsledek lim ?[ň = lim (1 + a„) = 1 + 0 = 1. Poznamenejme, že další užití Věty o třech limitách mj. dává 1 = lim 1 < lim y~c < lim ýň~ = 1 pro libovolné reálné číslo c > 1. postupně zaručují, že jsou reálná čísla komutativní grupou vůči sčítání, že M \ {0} je komutativní grupa vůči násobení, M je pole, množina M spolu s operacemi +, • a s relací uspořádání je tzv. uspořádané pole a konečně poslednímu axiomu můžeme rozumět tak, že M je "dostatečně husté", tj. nechybí nám tam body, jako např. chybí \[2 v číslech racionálních. | Axiomy reálných čísel [ (Rl) (a + b) + c = a + (b + c), pro všechny a,b, c eM. (R2) a + b = b + a, pro všechny fl.iel (R3) existuje prvek 0 e M takový, že pro všechny a e M platí a + 0 = a (R4) pro všechny a e M existuje opačný prvek (—a) e M takový, že platí a + (—a) = 0 (R5) a ■ b) ■ c = a ■ (b ■ c), pro všechny a, b, c eM. (R6) a ■ b = b ■ a pro všechny fl.iel (R7) existuje prvek 1 e M takový, že pro všechny a e M platí 1 • a = a (R8) pro každý a e M, a ^ 0 existuje inverzní prvek a~l e M takový, že platí a ■ a~l = 1 (R9) a ■ (b + c) = a ■ b + a ■ c, pro všechny a, b, c eM. (R10) relace < je úplné uspořádání, tj. reflexivní, antisy- metrická, tranzitivní a úplná relace na M (Rll) pro všechny a,b, c e M platí, že z a < b vyplývá také a + c < b + c (R12) pro všechny a, b e M, a > 0, b > 0, platí také a ■ b > 0 (R 13) každá neprázdná shora ohraničená množina A c M má supremum. Pojem supremum musíme ale také zavést pořádně. Má smysl pro každou uspořádanou množinu, tj. množinu s pevně zadanou relací uspořádání, a budeme se s ním takto i později setkávat ve více algebraických souvislostech. Připomeňme, že v obecné úrovni je uspořádáním jakákoliv binární relace na množině, která má vlastnosti reflexivity, antisymetrie a tranzitivity, viz odstavec 1.38. j Supremum a infimum [ Definition. Uvažme podmnožinu A c S v uspořádané množině B. Horní závorou množiny A je každý prvek b e B, pro který platí, že b > a pro všechny a e A. Obdobně definujeme dolní závory množiny A jako prvky b e A takové, že b < a pro všechny a e A. Nejmenší horní závora podmnožiny A, pokud existuje, se nazývá supremum této podmnožiny a značíme ji sup A. Obdobně, největší dolní závora, pokud existuje, se nazývá infimum, píšeme inf A. □ Posledním axiomem v naší tabulce vlastností reálných čísel tedy předpokládáme, že pro každou množinu reálných čísel A platí, že pokud existuje nějaké číslo a větší nebo rovno než všechna x e A, pak existuje také nejmenší takové 258 CHAPTER 5. ZŘÍZENÍ ZOO číslo a. Např. volbou A = {x e Q, x2 < 2} dostaneme jako její supremum sup A právě 72. Okamžitým důsledkem je také existence infim pro každou zdola ohraničenou množinu reálných čísel (stačí si všimnout, že obrácením znaménka všech čísel zaměníme suprema a infima). Pro formální výstavbu další teorie ale potřebujeme vědět, zda námi požadované vlastnosti reálných čísel lze realizovat, tj. zda existuje taková množina R s operacemi a relací uspořádání, které všech třináct axiomů skutečně splňují. Zatím jsem zkonstruovali korektně jen čísla racionální, která tvoří uspořádané pole, tj. splňují axiomy (Rl) - (R12), což si čtenář jistě snadno ověří. Ve skutečnosti lze reálná čísla nejen zkonstruovat, ale také lze ukázat, že až na izomorfismus to jde jediným způsobem. Pro naši potřebu vystačíme s intuitivní představou reálné přímky. Jednoznačnosti i existenci se ještě budeme věnovat později. 5.11. Komplexní rovina. Připomeňme, že komplexní čísla jsou dána jako dvojice reálných čísel, které jsme zvyklí zapisovat jako z = rez + i imz. Dobrou představou o komplexních číslech je proto rovina C = R2. Se sčítáním a násobením splňuje pole komplexních čísel axiomy (R1)-(R9), není na nich ale žádným rozumným způsobem definováno uspořádání, které by naplnilo axiomy (R10)-R(13). Nicméně s nimi budeme také pracovat a již dříve jsme viděli, že rozšíření skalárů na komplexní čísla je často pro výpočty mimořádně užitečné nebo dokonce nutné. Důležitou operací na komplexních čísel je tzv. konjugace. Je to zrcadlení podle přímky reálných čísel, tj. obrácení znaménka u imaginární složky. Značíme ji pruhem nad daným číslem z e C, ž = rez - i imz-Protože je pro z = x + iy 5.39. Určete limitu z • z = (x + iy)(x - iy) = xz zadává nám tento výraz právě kvadrát vzdálenosti komplexního čísla od nuly. Odmocnině z tohoto reálného nezáporného čísla říkáme absolutní hodnota komplexního čísla z, píšeme (5.3) \z\2 = z-ž. Absolutní hodnotu máme definovánu také na každém uspořádaném poli skalárů K, prostě definujeme absolutní hodnotu \a \ takto kzl = a je-li a > 0 -a je-li a < 0. Samozřejmě platí pro každá dvě čísla a, b e (5.4) \a+b\ < \a\ + \b\. lim (V2.T2.T2... 272) Solution. Ke stanovení limity postačuje její členy vyjádřit ve tvaru 2j • 2? - 2s • • -2^" = 22+?+s+"'+?r. Dostáváme tak Ij-Ij-Ij- j-_L »2i"4i"8"1 r2n lim f72 • 72 • 72 • • • 272) = lim 2 3(2 + ? + !"' Pomocí známého vzorce pro součet geometrické řady je odkud plyne lim (72-72-72-.. 272)=21=2. □ 5.40. Stanovte lim (V- \nz n n — 2 n-\\ n2 ) 5.41. Vypočítejte 7«3 — H"2 + 2 + 7«7 — 2n5 — n3 — n + sin2 n lim 5.42. Určete limitu lim 2 - 75«4 + 2n3 +5 n\ + (n-2)\- (n -4)! n50 +n\- (n - 1)! 5.43. Udejte příklad posloupností majících nevlastní limity se členy x„, y„,n eN, pro které je lim (xn + y„) = 1, lim (x„ y2) = +00. 5.44. Napište všechny hromadné body posloupnosti dané členy (-l)"2n n e N. 5.45. Spočtěte je-li 74«2 + 5n + 3 lim sup a„ a lim inf a„, n2 + An — 5 9 nn --- sin —, n e N. n2 + 9 A 259 C. LIMITY 2. REÁLNÁ ČÍSLA A LIMITNÍ PROCESY 5.46. Určete lim inf (<-■>" K)'+- t) 5.47. Nyní přejděme k určování limit funkcí. Definice viz strana 267. Určete (a) (b) (c) (d) lim sin x; X^-JT/3 lim X + X 2 x2 - 3x + 2' lim I arccos-I ; x^+oo \ x + 1 / lim arctg —, lim arctg x , lim arctg (sin x) . x^—oo x x^—oo x^—oo Solution. Případ (a). Připomeňme, že funkce je spojitá v jistém bodě, když je v tomto bodě její limita rovna funkční hodnotě. O funkci y = sin x však víme, že je spojitá na M. Dostáváme tak TT V3 ~2~" Případ (b). Přímé dosazení x = 2 dává nulový čitatel i jmenovatel. Přesto je příklad velmi snadno řešitelný. Jednoduché krácení lim sin x = sin X^7l/3 3 lim X + X (x-2)(x+3) x + 3 2 + 3 c lim-= lim-=-= 5 ►2 x2 - 3x + 2 x^2 (x - 2) (x - 1) x^2x - 1 2-1 totiž vedlo ke správnému výsledku (díky spojitosti obdržené funkce v bodě xo = 2). Uvědomme si zde, že limitu můžeme počítat pouze z funkčních hodnot v libovolně malém okolí daného bodu x0 a že přitom limita nezávisí na hodnotě přímo v tomto bodě. Při počítání limit tedy můžeme využívat krácení a rozšiřování výrazů, které nemění hodnoty uvažované funkce v libovolně zvoleném ryzím okolí bodu x0. Případ (c). Dvojnásobná záměna pořadí limity a vnější funkce převádí původní limitu na 3 (arccos ( lim -) ) \x->+oo X + 1// Lehce určíme, že lim - :^+oo x + 1 Této vlastnosti říkáme trojúhelníková nerovnost a splňuje ji také absolutní hodnota komplexních čísel definovaná výše. Zejména pro pole racionálních a reálných čísel, která jsou podmnožinami v komplexní rovině, zjevně obě definice absolutní hodnoty splývají. 5.12. Konvergence posloupností. V dalších odstavcích \^ budeme pracovat s některým z číslených oborů K racionálních, reálných nebo komplexních čísel. V tomto kontextu je tedy třeba chápat absolutní hodnotu a skutečnost, že ve všech případech platí trojúhelníková nerovnost. Budeme chtít formalizovat představu, že se hodnota nějakých čísel blíží dané limitě. Základním objektem pro nás proto budou posloupnosti čísel a{, kde index i bude zpravidla probíhat všechna přirozená čísla. Posloupnosti budeme zapisovat buď volně jako nebo jako nekonečné vektory (a0, ai, ...), případně v obdobě k zápisu matic jako j Cauchyovské posloupnosti j_ Uvažme libovolnou posloupnost čísel (a0, a\, ...) v takovou, že pro libolné pevně zvolené kladné číslo e > 0 platí pro všechny dvojice prvků at, a j posloupnosti, až na konečně mnoho výjimek (které závisí na volbě e), < e. Jinak řečeno, pro každé pevné e > 0 existuje index takový, že předcházející nerovnost platí pro všechna i, j > N. Takové posloupnosti prvků se říká Cauchyovská posloup- nost. 1 Intuitivně jistě cítíme, že buďjsou v takové posloupnosti všechny prvky stejné až na konečně mnoho z nich (pak bude od určitého indexu počínaje vždy |a; — a j 0) nebo se taková posloupnost "hromadí" k nějaké hodnotě. Dobře je to představitelné v komplexní rovině: ať vybereme jakkoliv malý kruh (o poloměru e), tak se nám jej u Cauchyovské posloupnosti vždy musí podařit položit do komplexní roviny tak, že zakryje všechny body nekonečné posloupnosti až na konečně mnoho z nich. Můžeme si pak představit, že postupným zmenšováním se kruh smrští až do jediné hodnoty a, viz obrázek. \ / TOZLOUTNOSr , -7° KOHTLEXNlM OS OSEL- Pokud by taková hodnota a e K pro Cauchyovskou posloupnost skutečně existovala, očekávali bychom od ní patrně následující vlastnost konvergence: -| Konvergující posloupnost |_ Jestliže pro posloupnost čísel (a0, a\, ...)vK, pevně zvolené číslo a e K a pro libovolné kladné reálné číslo e platí 260 CHAPTER 5. ZŘÍZENÍ ZOO pro všechny i, až na konečně mnoho výjimek (závisejících na volbě e), \cii — a\ < e, říkáme, že posloupnost (fl;)^0 konverguje k hodnotě a. Číslu a říkáme limita posloupnosti (fl;)^0. Jestliže nějaká posloupnost čísel a{ e K, i = 0, 1, ..., konverguje k číslu a e K, pak pro každé pevně zvolené kladné e víme, že |a; — a\ < e pro všechna i větší než vhodné iVeN. Pak ovšem, díky trojúhelníkové nerovnosti, pro každou dvojici indexů i, j > N dostáváme \ai—aj \ = \ai —aN +aN —aj\ < |út;- — aN\ + \aN — aj\ <2e. Dokázali jsme tedy: Lemma. Každá konvergující posloupnost čísel je Cauchy-ovská. V poli racionálních čísel se ovšem může snadno stát, že pro Cauchyovské posloupnosti příslušná hodnota a neexistuje. Např. číslo a/2 můžeme libovolně přesně přiblížit racionálními čísly a{, dostaneme tedy konvergentní posloupnost s limitou V2, ale samotná limita již není racionální. Uspořádaná pole skalárů, ve kterém všechny Caychy-ovské posloupnosti konvergují, se nazývají úplná. Následující tvrzení říká, že axiom (R13) takové chování reálných čísel zaručuje: Theorem. Každá Cauchyovská posloupnost reálných čísel at konverguje k reálné hodnotě aěR Proof. Každá Cauchyovská posloupnost je zjevně ohraničená množina, protože pro libovolnou volbu e ohraničíme všechny členy posloupnosti až na konečně mnoho z nich. Definujme si množinu B všech reálných čísel x, pro které platí x < aj pro všechny prvky a j posloupnosti, až na konečně mnoho z nich. Zřejmě má B horní závoru, tudíž podle axiomu (R13) má i supremum. Definujme a = sup B. Nyní pro nějaké pevně zvolené e > 0 zvolme N takové, aby |a; — cij\ < e pro všechny i, j > N. Zejména tedy a j > aN — e a aj < aN + e pro všechny indexy j > N, takže aN — e patří do B, zatímco aN + e už nikoliv. Souhrnně z toho dostáváme, že \a — aN\ < e, a proto také \a — aj\ < \a — aN \ + \aN — aj\ < 2e pro všechny j > N. To ale značí právě, že a je limitou uvažované posloupnosti. □ Corollary. Každá Cauchyovská posloupnost komplexních čísel Zi konverguje k nějakému komplexnímu číslu z. Proof. Pišme zi = a{ + ibi. Protože je |a; — cij\2 < \z.i — Zj\2 a podobně i pro hodnoty bi, jsou obě posloupnosti reálných čísel a{ a&; Cauchyovské. Existují tedy jejich limity a resp. b a snadno ověříme, že z = a + i b je limitou pro posloupnost z.i ■ □ Neboť je funkce y = arccosx spojitá v bodě 0, ve kterém nabývá hodnoty jt/2, a funkce y = x3 je spojitá v bodě jt/2, platí lim larccos-| = (arccos | lim -| | = (—\ . x^+ck\ X + lJ V \^+ocx + l)) \2/ Případ (d). Funkce y = arctgx má vlastnosti „užitečné při počítání limit" - je spojitá a prostá (rostoucí) na celé reálné ose. Tyto vlastnosti vždy (bez dalších podmínek či omezení) umožňují vnořit vyšetřovanou limitu do argumentu takové reálné funkce. Proto uvažujme arctg Zřejmě je (lim — ] , arctg ( lim x4 ] , arctg ( lim sin x ] x^— oo x / \x^>— OO / \Jt^»— oo / lim X4 = +00 a limita limr 1 lim - = 0, — oo x x^> — oc , sinx neexistuje, což již implikuje lim arctg — = arctg 0 = 0, lim arctg x4 = lim arctg y = — oo x x^>— oo y^+oo 2 a neexistenci poslední limity. 5.48. Určete limitu □ 1 — COS X Solution. 1 — COS X lim >o x2 sin(x2) lim lim . x^o x2 sin(x2) 2sin2(f) _ y'o x2 sin(x2) lim x^0 i sin2 (f) (f) sin(x2) lim 1 1 oo = oo. 2 , - >o sin2(x2) 2 Předchozí výpočet je nutné chápat "odzadu". Protože existují limity na pravé straně (ať už vlastní či nevlastní) a výraz ^ • oo má smysl (viz Poznámka za větou 5.22), existuje i původní limita. Kdybychom původní limitu rozdělili na součin limit 1 lim(l - cosx) • lim , x^o x^o xz sm(xz) jednalo by se o součin typu 0 • oo, tedy nedefinovaný výraz, ale tento fakt nevypovídá nic o exitenci původní limity. □ 5.49. Určete následující limity: i) linu x-2 ii) lim x^0 ' sin(sin x) iii) lim x^0 iv) lim^o'?* Solution. i) lim 2 six2' lim lim 2 y/(x - 2)(x +2) x^2 Vx + 2 261 C. LIMITY 2. REÁLNÁ ČÍSLA A LIMITNÍ PROCESY ... ,. x -2 (5.27) siny n) hm = hm-= I, x^2 Vx2 _ 4 y^O 3; kde isme využili toho, že lim sin x = 0. x^O sin2 x sin x iii) lim-= lim sin x • lim-=0-1=0, x^O x x^O x^O x opět původní limita existuje, protože existují obě limity na pravé straně rovnosti a jejich součin je definován. iv) Při výpočtu této limity musíme být obezřetní, protože obě jednostranné limity v bodě nula existují, jejich hodnoty se však liší, zkoumaná limita tedy neexistuje: lim 2 (x-2f ' (b) (d) lim* lim* x+2 >2 (x-2ý ' ► +00 - V tomto příkladu se budeme věnovat tzv. neurčitým výrazům. Přesněji řečeno, budeme se zabývat situacemi, cdy se o ně nejedná. Čtenáři doporučujeme, aby neurčité výrazy vnímal jako pojem pomocný, který mu má pouze usnadnit orientování se při prvním počítání limit, neboť obdržený neurčitý výraz pouze znamená, že jsme „nic nezjistili". Víme, že limita součtu je součet limit, limita součinu je součin limit a že limita podílu je podíl limit, pokud jednotlivé limity existují a nezískáme-li některý z výrazů 00 — 00, 0 • 00, 0/0, 00/00, o kterých právě hovoříme jako o neurčitých. Pro úplnost dodejme, že tato pravidla můžeme kombinovat (pro limity všech složek určené současně) a že za neurčitý výraz pak považujeme také ten, jenž obsahuje alespoň jeden neurčitý výraz. Např. tedy výrazy -00 + 00 o 00 00, 3+00 (—oo)j+oo 0 • (00 — 00)" označujeme jako neurčité a o výrazech 0 0 -00 — 00, 3 + 00 (—oo)3 00 můžeme říci, že jsou „určité" (pro ně jsme schopni ihned příslušnou limitu stanovit - výrazy odpovídají po řadě hodnotám —00, 0, 0). 5.13. Remark. Předchozí diskuse nám dává návod na jeden z možných postupů, jak korektně vybudovat reálná čísla. Postupujeme podobně jako při zúplňování přirozených čísel na celá (abychom přidali opačné hodnoty) a celých na racionální (abychom přidali podíly nenulových čísel). Tentokrát k racionálním číslům "přidáme" limity všech Cauchyovských posloupností. Skutečně se podbízí zavést vhodně relaci ekvivalence na množině všech Cauchyovských posloupností racionálních čísel tak, že dvě Cauchyovské posloupnosti (fl;)^0 a (AO^o jsou ekvivalentní, když vzdálenosti |a; — bt | konvergují k nule (to je totéž jako požadavek, že jejich sloučením do jediné posloupnosti tak, že první posloupnost bude představovat liché, zatímco druhá sudé členy výsledné posloupnosti) obdržíme opět posloupnost Cauchyovskou). Nebudeme zde teď podrobně ověřovat, že jde o ekviva-\A lenci, ani zavádět operace násobení a sčítání, ani dokazovat, že všechny požadované axiomy skutečně dojdou naplnění. Mohou se o to ale pokusit čtenáři samostatně, protože to není složité počínání. Všechny uvedené definice lze opřít o již existující sčítání a násobení jednotlivých členů posloupností, stejně jako definici vzdálenosti čísel. Jediný náročnější bod je v důkazu, že takto definovaných "nových" reálných čísel již bude dost, tj. že již bude platit axiom (R13) o existenci suprema. Tady je asi nejjednodušší ukázat, že každé úplné pole splňuje tento axiom, tj. že stačí ověřit, že Cauchyovské posloupnosti vždy konvergují (a to v našem případě již není složité). Stejně tak je docela snadné dokázat, že axiomy (R1)-(R13) definují reálné čísla jednoznačně až na izomorfismus, tj. až na bijektivní zobrazení, která zachovávají jak algebraické operace, tak uspořádání. Ještě se k těmto poznámkám později vrátíme v souvislosti se zúplněním metrických prostorů, která budeme diskutovat ve druhé části 7. kapitoly na straně 425. 5.14. Uzavřené množiny. Pro další práci s reálnými nebo komplexními čísly budeme potřebovat po-skljly/ drobnější pochopení pojmů jako blízkost, omezenost, konvergence apod. Pro jakoukoliv podmnožinu A bodů v K nás budou zajímat nejen její body a e A ale také body, ke kterým se umíme dostat limitně, tj. pomocí limit posloupností. J Hromadné body množiny |_ Uvažme jakoukoliv množinu A bodů v K. Bod x e K nazýváme hromadný bod množiny A, jestliže existuje posloupnost vybraná z prvků A, jejíž všechny členy jsou různé od x a která konvergujel^hodriohíx^^^^J Hromadné body podmnožiny A racionálních, reálných nebo komplexních čísel jsou tedy ta čísla x, která jsou limitami takových posloupností čísel z A, které samotný bod x 262 CHAPTER 5. ZŘÍZENÍ ZOO neobsahují. Všimněme si, že hromadný bod množiny do ní může, ale nemusí, patřit. Pro každou neprázdnou množinu A c K a pevný bod x e K je množina všech vzdáleností |x — a\, a e A, zdola ohraničená množina reálných čísel, má tedy infimum d(x, A), kterému říkáme vzdálenost bodu x od množiny A. Všimněme si, že d(x, A) = 0, právě když buď x e A nebo je x aspoň hromadným bodem A (dokažte si podrobně z definic). Uzavřené množiny | Uzávěr Ä množiny A c K je množina všech bodů, které mají od A vzdálenost nulovou (všimněme si, že pro vyvázanou množinu není vzdálenost bodů od ní definována, je tedy automaticky 0 = 0). Uzavřená podmnožina v K je taková, která splývá se svým uzávěrem. Jsou to tedy právě množiny, které obsahují i všechny své hromadné body. Typickou uzavřenou množinou je tzv. uzavřený interval [a, b] = {x e R, a < x < b} reálných čísel, kde a a b jsou daná reálná číslo. Pokud některá z hraničních hodnot intervalu chybí, píšeme a = —oo (mínus nekonečno) nebo podobně b = +oo, a takové uzavřené intervaly značíme (—oo, b], [a, oo) a (—oo, oo). Uzavřené množiny jsou tedy ty, které v sobě mají i vše, k čemu umí "dokonvergovat". Uzavřenou množinu bude tvořit např. posloupnost reálných čísel bez hromadného bodu nebo posloupnost s konečným počtem hromadných bodů spolu s těmito body. Uzavřený je také např. jednotkový kruh v rovině komplexních čísel včetně hraniční kružnice. Snadno ověříme, že libovolný průnik a libovolné konečné sjednocení uzavřených množin opět uzavřená množina. Skutečně, pokud všechny body nějaké posloupnosti patří do průniku našeho systému množin, pak jistě patří do každé z nich a proto do každé z nich patří i všechny hromadné body. Pokud bychom ale chtěli totéž říci o obecném sjednocení systému množin A;, pak bychom neuspěli, protože např. jednobodové množiny jsou zjevně uzavřené, ale z nich utvořená posloupnost bodů už uzavřená nebývá. Pokud ale jde o konečné sjednocení množin a hromadný bod nějaké posloupnosti ležící v tomto sjednocení, pak takový hromadný bod musí být hromadným bodem i vybrané podposloupnosti, která ale už bude celá v jedné z našich množin. Každá je ale uzavřená, takže i hromadný bod do ní a tedy i celého sjednocení patří. 5.15. Otevřené množiny. Dalším užitečným příkladem podmnožin jsou otevřené intervaly reálných čísel (a, b) = {x e R; a < x < b}, V případě (a) podíl limit čitatele a jmenovatele dává výraz 4/0. Zápis, ve kterém dělíme nulou, je sám o sobě přinejmenším nežádoucí (později bychom se mu měli být schopni vyvarovat). Přesto nám umožní stanovit výsledek: nejedná se o neurčitý výraz. Všimněme si, že jmenovatel se blíží k nule zprava (pro x ^ 2 je (x — 2)6 > 0). To zapisujeme jako 4/ + 0. Čitatel a jmenovatel tak mají stejné znaménko v jistém ryzím okolí bodu x0 = 2 a lze říci, že jmenovatel je v limitě „nekonečněkrát menší" než čitatel, tj. x + 2 lim + 00, - >2 (x - 2)6 což odpovídá položení 4/ + 0 = +oo (podobně se klade 4/ — 0 = — oo). Při určování druhé limity lze postupovat analogicky. Protože čísla flEKaa5 mají stejná znaménka, dostáváme x + 2 x + 2 lim + 00 7^ —oo lim - >T+ (x - 2)5 ' ~" ' ~" x^2- (x - 2)5 ' tj. oboustranná limita neexistuje. Tomu odpovídá zápis 4/ ± 0 (nebo obecnější a/ ±0, a ^ 0, a e R*), který je „určitým výrazem". Při důsledném oddělování symbolů +0 a —0 od ±0 vždy a/±0 pro a ^ 0 znamená, že limita neexistuje. Případy (c), (d). Je-li f(x) > 0 pro všechna uvažovaná x e R, platí f(x)g{x) = eHfWs(x)) = es(*Hn/M_ Využijeme-li toho, že exponenciální funkce je spojitá a prostá na reálné přímce, můžeme nahradit limitu za lim f{x) X—>XQ lim (g(x)-hi f(x)) Připomeňme, že jedna z těchto limit existuje právě tehdy, když existuje druhá; a doplňme X—>Xq X—>Xq X—>Xq = a € R = lim fix)g(x) X^-Xq = ď, ) = +oo = lim fix)g{x) X^-Xq = +00 ) = —oo = lim fix)g{x) X^-Xq = 0. Můžeme tudíž psát lim fix)g(x) X^-Xq lim g(x)- lim ln f(x) X—^A'q X—^A'q jestliže obě limity vpravo existují a neobdržíme-li neurčitý výraz 0 • oo. Není obtížné si uvědomit, že tento neurčitý výraz lze získat pouze 263 C. LIMITY 2. REÁLNÁ ČÍSLA A LIMITNÍ PROCESY ve třech případech odpovídajících zbylým neurčitým výrazům 0°, oo°, 1°°, kdy postupně je lim fix) =0 a lim g(x) = 0, X^-XQ X^-XQ lim f(x) = +oo a lim g(x) = 0, X^-XQ X^-XQ lim f(x) = 1 a lim g(x) = ±oo. X^-XQ X^-XQ V ostatních případech nám tedy znalost (a pochopitelně existence) limit lim f{x), lim gix) X^XQ X^Xq umožňuje uvést výsledek (při dodefinování některých zápisů) lim fix)g{x) = ( lim fix) (\ um \ x—>x lim fix) x^x0 J lim g(x) "0 Protože lim x^>+oc K) 2, lim — = 0, lim x = +00, je lim x^+00 1, lim x x^>+oc lim x^>+oc nebo lim x x = lim (jc* ) = 0. Poslední výsledek pak bychom mohli vyjádřit zápisem 0° 0 či oo°° = oo, oo-1 = 0 (zdůrazněme, že se nejedná o neurčité výrazy). Přestože jsme kladli důraz na to, aby čtenář raději upřednostňoval úvahy o limitním chování funkcí před škatulkováním výrazů na určité a neurčité (a tyto pojmy vnímal jen jako pomocné), je snad dobře patrný důvod, proč se budeme nadále zabývat především neurčitými výrazy. □ 5.51. Vypočítejte lim siní + jzx +oo 2 cos x — 1 — X2 y+l +x5 _4x lim lim lim x^>+oc Too 3X + 2X + x2 ' 4X - 8x6 - 2X - 167 _ 3X - 45x - Vnjtx+l2' x — sin x + x arctg x Vl + 2x + x2 kde opět a i b jsou pevná reálná čísla nebo nekonečné hodnoty ±oo. Jde o typickou otevřenou množinu v následujícím smyslu: -| Otevřené množiny a okolí bodů [ Otevřená množina v K je taková množina, jejíž doplněk je uzavřenou množinou. Okolím bodu a e K nazýváme libovolnou otevřenou množinu O, která a obsahuje. Je-li okolí definované jako Osia) = {x e K, \x - a\ < 8} pro kladné číslo 8, hovoříme o 8-okolí bodu a. Všimněme si, že pro libovolnou množinu A je a e K hromadným bodem A, právě když v libovolném okolí a leží také alespoň jeden bod b e A, b ^ a. Lemma. Množina čísel A C Kj'e otevřená, právě když každý její bod a e A do ní patří i s nějakým svým okolím. Proof. Nechť je A otevřená na e A. Kdyby neexistovalo žádné okolí bodu a uvnitř A, musela by existovat posloupnost an £ A, \a — an \ < l/n. Pak je ovšem a e A hromadným bodem množiny K \ A, což není možné, protože doplněk A je uzavřený. Naopak předpokládejme, že každé a e A leží v A i s nějakým svým okolím. To přirozeně zabraňuje, aby nějaký hromadný bod b pro množinu K\ A ležel v A. Je proto K\ A uzavřená a tedy je A otevřená. □ Z právě dokázaného lemmatu okamžitě vyplývá, že je libovolné sjednocení otevřených množin opět otevřenou množinou a že každý konečný průnik otevřených množin je opět otevřená množina. V případě reálných čísel jsou á-okolí právě otevřené intervaly o délce 28 s a uprostřed. V komplexní rovině je 8-okolí kruh o poloměru 8 se středem v a. 5.16. Ohraničené a kompaktní množiny čísel. Uzavřené a otevřené množiny představují základní pojmy tzv. topologie. Aniž bychom zacházeli do hlubších podrobností a souvislostí, seznámili jsme se právě s topologií reálné přímky a topologií komplexní roviny. Velice užitečné budou i následující pojmy: -| Ohraničené a kompaktní množiny ^. Množina A racionálních, reálných nebo komplexních čísel se nazývá ohraničená, jestliže existuje kladné reálné číslo r takové, že |z| < r pro všechny čísla z e A. V opačném případě je neohraničená. Ohraničená a uzavřená množina se^nazývá^ompotoiĹ^J Uzavřené konečné intervaly reálných čísel jsou typickým příkladem množin kompaktních. Přidejme ještě několik topologických pojmů, které nám umožní účinné vyjadřování: 264 CHAPTER 5. ZŘÍZENÍ ZOO Vnitřním bodem množiny A reálných nebo komplexních čísel nazveme takový bod, který do A patří i s nějakým svým okolím. Hraniční bodem množiny A rozumíme takový bod, jehož každé okolí má neprázdný průnik jak s A tak s doplňkem K\A. Hraniční bod tedy může, ale nemusí patřit do samotné množiny A. Otevřené pokrytí množiny A je takový systém otevřených množin U i, i e I, že jejich sjednocení obsahuje celé A. Izolovaným bodem množiny A rozumíme bod a e A, který má okolí, jehož průnik s A je právě jednobodová množina {a}. i 0TÉV1?EHE/ / ToiqďTI 5.17. Theorem. Pro podmnožiny A reálných čísel platí: (1) neprázdná množina A je otevřená, právě když je sjednocením nejvýše spočetného systému otevřených intervalů, (2) každý bod a £Aje buď vnitřní nebo hraniční, (3) každý hraniční bod množiny A je buď izolovaným nebo hromadným bodem A, (4) A je kompaktní, právě když každá v ní obsažená nekonečná posloupnost má podposloupnost konvergující k bodu v A, (5) A je kompaktní, právě když každé její otevřené pokrytí obsahuje konečné podpokrytí. Proof. (1) Zjevně je každá otevřená množina sjednocením nějakých okolí svých bodů, tj. otevřených intervalů. Jde tedy pouze o to, jestli nám jich y t vždy stačí spočetně mnoho. Zkusme tedy najít "co největší" intervaly. Řekneme, že body a, b e A jsou v relaci, jestliže celý otevřený interval (min{út, b}, max{út, b}) je podmnožinou v A. To je zjevně relace ekvivalence (otevřený interval (a, a) je prázdná množina a ta je podmnožinou, symetrie relace i tranzitivita jsou zřejmé). Třídy této ekvivalence budou zjevně intervaly, které budou navíc po dvou disjunktní. Každý z těchto intervalů jistě musí obsahovat nějaké racionální číslo a tyto musí být různé. Všech racionálních čísel je ale spočetně mnoho, proto máme tvrzení dokázané. Solution. Vydělíme-li v případě první z limit čitatele i jmenovatele polynomem x2, obdržíme sinx + Ttx lim - x^+oo 2 cos x 1 lim x^+oo smx i —T" + 77 2 cos x — 1 _ r2 Ohraničenost výrazů I sinx I < 1, 12 cos x — 11 < 3 pro x e ax2 ^ +ooprox -» +oo pak dávají výsledek lim x^>+oc r2 + 7Z 2 cos x — 1 r2 1 0 + 7T 0-1 -7T. V předešlé úvaze jsme vlastně použili Větu o třech limitách a zápis c/oo = 0 platný pro c e M (nebo přímo ohr./oo = 0, kde „ohr." značí ohraničenou funkci). Tento postup lze zobecnit. Pro limitu tvaru fi(x) + f2(x) + ■ ■ ■ + fm(x) lim pncemz xo gi(x) + g2(x) H----+ g„(x) fi(x) lim x^x0 fi(x) ,. gi(x) lim 0, 0, m platí lim x^x0 gl (x) Mx) + f2(x) + --- + fm(x) i e {2, i € {2,..., n}, lim fi(x) >*0 gl (x) +g2(x)-\----+ gn (X) x^*0 gl (x) pokud limita na pravé straně existuje. Je přitom výhodné si uvědomit (třetí z limit lze určit např. pomocí 1'Hospitalova pravidla, se kterým se seznámíme později), že c jc^ jc^ cv^ lim — = 0, lim — = 0, lim — = 0, lim — = 0 c x^+oo pro c e 0 < a < j3, 1 < a < Odtud ihned plyne lim y+l + x5 4x >+0o y+2x+x2 4X - 8x6 - 2X = lim x^>+oc 167 3-3* 3; lim x^+0o y _ 45x _ yn^ + 12 Uvědomíme-li si, že je lim x^>+oc 7t Ujt12 -oo. 77" lim arctgx = — > 1, x^+qo 2 stejně snadno dostaneme lim x^>+oc x — sin x + x arctg x Vl +2x +x2 x arctg x lim -—— = lim arctgx x^>+oc \l x2 x^>+oc 2' □ 265 C. LIMITY 2. REÁLNÁ ČÍSLA A LIMITNÍ PROCESY 5.52. Určete limity / 1 1 1 1 \ lim (--1---1---1-----1--) ; n-*» V1-2 2-3 3-4 (n-X)-n) lim ( J— + J— + • • • + '-) - Solution. Neboť pro každé přirozené číslo k > 2 je (provádíme tzv. rozklad na parciálni zlomky - budeme jej probírat u integrování racionálních lomených funkcí) 1 1 1 (k-l)k k-1 k platí lim lim lim / 1 1 1 1 \ _ \l-2 + 2- 3 + 3- 4 + '"+(ř2-l)-ř2/ /l 1 1 1 1 1 1 1\ VT~2 + 2~3 + 3~4 + "' + n - 1 ~ ň / Poznamenejme, že stanovení této limity je důležité: určuje součet jedné z tzv. teleskopických řad (se kterou pracoval již Johann I. Bernoulli). Ke stanovení druhé limity využijeme Větu o třech limitách. Odhady 1 11 In V^TI i +••• + > : + ••• + ■ Vři2 + n Vři2 + n 1 1 +••• + V«2 + 1 V«2 + n V«2 + 1 pro n e N dávají + ••• + V«2 + n Vři2 + n 1 n V«2 +1 V«2 +1 n lim _ V«2 + n < lim (v«2 + 1 + + V«2 + n) n < lim__ n^°° V«2 +1 Protože lim lim V«2 + n n^oo ^/„2 1, lim lim V«2 + i -/"2 1, je rovnez lim / 1 1 1 \ ■ + ■ + • •• + . = 1. VV«2 + i V«2 + 2 V«2 + ři/ □ 5.53. Spočtěte (a) (b) lim vm7- vr lim cos x — smx >Jt/4 cos (2x) (2) Přímo z definic vyplývá, že bod nemůže být vnitřní a hraniční zároveň. Nechť tedy a e A není vnitřní. Pak ovšem existuje posloupnost bodů at ^ As hromadným bodem a. Zároveň a patří do každého svého okolí. Proto je a hraniční. (3) Předpokládejme, že a e A je hraniční a není izolovaný. Pak stejně jako v argumentaci předchozího odstavce existují body at, tentokrát uvnitř A, jejichž hromadným bodem je a. (4) Předpokládejme, že je A kompaktní, tj. uzavřená a ohraničená, a uvažme nějakou nekonečnou posloupnost bodů cit £ A. Tato podmnožina má jistě supremum b i infi-mum a (nebo můžeme zvolit libovolnou horní a dolní závoru množiny A). Rozdělme nyní interval [a, b] přesně na dvě poloviny [a, \(b — a)] a [j(b — a), b]. V alespoň jedné z nich musí být nekonečně mnoho prvků a;. Vyberme takovou polovinu, jeden z prvků v ní obsažených a následně tento vybraný interval opět rozdělme na poloviny. Pak znovu vybereme tu polovinu, kde je nekonečně mnoho prvků posloupnosti a vybereme si jeden z nich. Tímto způsobem dostaneme posloupnost, která bude Cauchyovská (dokažte si detailně - vyžaduje to jen pozorné hraní si s odhady, podobně jako výše). O Cauchyovských posloupnostech ovšem už víme, že mají vždy hromadné body nebo jsou konstantní až na konečně mnoho výjimek. Existuje tedy podposloupnost s námi hledanou limitou. Z uzavřenosti A zase vyplývá, že námi nalezený bod musí opět ležet v A. Opačně, jestliže každá v A obsažená nekonečná podmnožina má hromadný bod v A, znamená to, že všechny hromadné body jsou v A a tedy je A uzavřená. Pokud by nebyla množina A zároveň ohraničená, uměli bychom najít posloupnost stále rostoucí nebo klesající s rozdíly dvou po sobě jdoucích čísel třeba alespoň 1. Taková posloupnost bodů z A ale nemůže mít hromadný bod vůbec. (5) Nejprve se věnujme snadnější implikaci, tj. předav pokládejme, že z každého otevřeného pokrytí lze vybrat konečné a dokazujme, že pak A je uzavřená i ohraničená. Jistě lze A pokrýt spočetným systémem intervalů /„ = (n — 2, n + 2), n e Z, a jakýkoliv výběr konečného podpokrytí z nich říká, že je množina A ohraničená. Předpokládejme nyní, že a e M \ A je hromadným bodem posloupnosti a; e A a předpokládejme rovnou, že \a — a„\ < ^ (jinak bychom mohli vybrat takovou podposloupnost). Množiny \[a 1 1 -,a + -] n n pro všechny n e N, n > 0, jsou sjednocení dvou otevřených intervalů a jistě také pokrývají naši množinu A. Protože je možné vybrat konečné pokrytí A, bod a je uvnitř doplňku M \ A včetně nějakého svého okolí a není tedy hromadným bodem. Proto musí být všechny hromadné body A opět v A a tato množina je i uzavřená. 266 CHAPTER 5. ZŘÍZENÍ ZOO Opačný směr důkazu je založený na existenci a vlastnostech suprema. Předpokládejme, že je A kompaktní a že je dáno nějaké její otevřené pokrytí C. Z předchozího je zjevné, že v A existují největší a nejmenší prvek, které jsou zároveň rovny b = sup A a a = infA. Označme si teď "nejzašší mez", pro kterou ještě půjde konečné pokrytí z C vybrat, tj. definujeme množinu B = {x e [a, b], existuje konečné podpokrytí [a, x] n A}. Evidentně a e B, jde tedy o neprázdnou shora ohraničenou množinu a existuje proto c = sup B. Jde nám o to dokázat, že ve skutečnosti musí být c = b. Argumentace je trochu nepřehledná, dokud si ji nenačrt-neme na obrázku, podstata je ale snadná: Víme, že a < c < b, předpokládejme tedy chvíli, že c < b a c £ A. Protože je M \ A otevřená, pro c £ A existuje okolí bodu c obsažené v [a, b] a zároveň disjunktní s A. To by ale vylučovalo možnost c = sup B. Zbývá tedy v takovém případě c < hc é Aa tedy je i nějaké okolí O bodu c v otevřeném pokrytí C. Zvolme si body p < c < q v O. Opět nyní bude existovat konečné pokrytí pro [a, q] n A. To ale značí, že q > c leží v B, což není možné. Původní volba c < b tedy vedla ke sporu, což dokazuje požadovanou rovnost b = c. Nyní ale s pomocí okolí b, které patří do C umíme najít konečné pokrytí v C pro celé A. □ 5.18. Limity funkcí a posloupností. Pro diskusi limit je vhodné rozšířit množinu reálných čísel M o dvě nekonečné hodnoty ±00, tak jak jsme to už dělali při označování intervalů. Okolím nekonečna rozumíme interval (a, 00), resp. (—00, a) je okolí —00. Pojem hromadného bodu množin rozšiřujeme tak, že 00 je hromadným bodem množiny A c M jestliže každé okolí 00 s ní má neprázdný průnik, tj. jestliže je A shora neohraničená. Obdobně pro —00. Hovoříme o nevlastních hromadných bodech množiny A. _—"počítání se nekonečny" [ (c) Zavádíme i pravidla pro počítání s formálně přidanými hodnotami ±00 a pro libovolná "konečná" čísla ael: a + 00 = 00 a — 00 = —00 a ■ 00 = 00, je-li a > 0 a ■ 00 = — 00, je-li a < 0 a ■ (—00) = —00, je-li a > 0 a ■ (—00) = 00, je-li a < 0 a ±00 0, pro všechna a 7^ 0. Následující definice pokrývá mnoho případů limitních procesů a bude třeba ji zvládnout dokonale. Jednotlivými případy se budeme podrobně zabývat v zápětí. lim Vx1 (Vx2 + 2x + 3 - ^x2 +2x + l) . Solution. Všechny uvedené limity vypočítáme pomocí vhodného rozšíření zadaného výrazu. V případě první limity vynásobíme čitatele i jmenovatele výrazem Vl +x + Vl - x a využijeme známého vztahu (a — b) (a + b) = a2 — b2. Takto obdržíme ,. Vl +x - Vl -x ,. (1+jc)-(1 -jc) lim-= lim x^o x lim o x (Vl +x + Vl - x) 2 2 o vi +x + Vi -x VT + VT 1. Podobně vypočítáme cos x — sin x (cos x + sin x) (cos x — sin x) lim -= lim >Jt/4 cos (2x) >jt/4 (cosx + sinx) cos (2x) lim cos2 x — sin2 x lim jt/4 (cos x + sin x) cos (2x) 1 1 V2 jr/4 cos x + sin x VI i VI 2 2 T 2 U provedeného krácení připomeňme identitu cos (2x) = cos2 x — sin2 x, x e M. Abychom mohli při určování poslední limity použít (a - b) [a2 +ab + b2) = a3 - b3, k rozšíření potřebujeme výraz (x2 + 2x + 3)2+Vx2 + 2x + 3-Vx2 + 2x + 2+y/(x2 + 2x + 2)2, který odpovídá a2 + ab + b2, resp. volíme a = Vx2 + 2x + 3, b = Vx2 + 2x + 2. Tímto rozšířením převedeme limitu ze zadání na V? ((x2 + 2x + 3) - (x2 + 2x + 2)) lim ^----- -, ^+0° j{x2 +2x + 3)2 + +2x + 3 ■ vV +2x + 2 + j\x2 +2x + 2)2 tj- lír lim =-^—^- =. x^+°° j(x2 +2x + 3)2 + vV +2*+ 3 • vV +2*+2 + ^(x2 + 2* + 2)2 Poslední limitu umíme snadno vyčíslit. Víme totiž, že je určena pouze jedním členem v čitateli a jedním ve jmenovateli, a to axp pro 267 C. LIMITY 2. REÁLNÁ ČÍSLA A LIMITNÍ PROCESY nej větší p (v tomto případě je uvažovaný člen ve jmenovateli rozdělen na několik sčítanců). Platí tudíž lim Reálné a komplexní limity ^(x2 + 2x + 3)2 + jx2+2x + 3-jx2+2x+2 + j' (x2 +2x+2) lim x^+qo 3// -i2 3 (*2) + lim /x* 1 3// 2\2 ^+0° 3Vx4 3 Celkem tak je lim x^>+oc (l/x2 + 2x + 3 - ^x2 + 2x + 2)) = -. □ 5.54. Pro libovolné n e N určete limitu (1 +2nx)n - (l+nx)2n lim---. x^O X1 Solution. Podle binomické věty je (1 + 2nx)n = 1 + ^J2nx + (2«x)2 + P (x) x3, x e M, (1 +nx)2n = 1 + c"m2;) (nx)2 + g (x) x3, x e pro jisté polynomy P, Q. Raději vyzdvihněme, že předchozí vyjádření skutečně platí pro všechna n e N. Pro n = 1 si stačí uvědomit, že klademe @ = 0 a že polynomy P, Q mohou být identicky rovny nule. Dostáváme tedy (1 +2nx)n = 1 + 2n2x + 2n3 (n - l)x2 + P (x) x3, x e M, (1 + nx)2n = 1 +2n2x + n3 (2n - 1)x2 + Q (x) x3, x e M. Pouhé dosazení a jednoduché úpravy již dávají (1 +2nx)n - (l+nx)2n lim x^O lim x^O XL lim (-«3 + (P(x) - Q(x)) x) = -n3 + 0 = -«3 (2n3 (n - 1) - «3 (2n - 1)) x2 + (P (x) - g (x)) x3 □ 5.55. Spočítejte lim (tgx)tg(2x) x^7l/4 Solution. Limity typu 1 (jako je v zadání) lze počítat podle vzorce lim f(x)g{x) = eMo X^-XQ Definition. Uvažme libovolnou podmnožinu A c M a reálnou funkci / : A -» M, případně komplexní funkci / : A -» C, definovanou na A. Uvažme dále hromadný bod x0 množiny A (tj. buď reálné číslo nebo případně ±00). Říkáme, že / má v x0 limitu ael, případně komplexní limitu a e C, a píšeme lim f(x) = a, X^-XQ jestliže pro každé okolí O (a) bodu a lze najít okolí O(xo) bodu x0 takové, že pro všechny x e A n (O(x0) \ {x0}) je f(x) e O(a). V případě reálné funkce může také být limitní hodnotou a = ±00 a v takovém případě se limita a reálné funkce nazývá nevlastní. V případě a e M je o limitu vlastní. 1 Je důležité si všimnout, že hodnota / v bodě x0 v definici nevystupuje a / v tomto hromadném bodě vůbec nemusí být definována (a v případě nevlastního hromadného bodu ani nemůže)! Často také hovoříme o ryzím okolí O(x) \ {x}, ve kterém nás funkční hodnoty zajímají. Nevlastní limity komplexních funkcí zatím definovat nebudeme. 5.19. Nejčastější varianty definičních oborů. Naše definice limity pokrývá zdánlivě velice rozdílné koncepty: (1) Limity posloupností. Jestliže je A = N, tj. funkce / je definována pouze pro přirozená čísla, hovoříme o limitách posloupností reálných nebo komplexních čísel. Jediným hromadným bodem definičního oboru A je pak 00 a zpravidla píšeme hodnoty poslounosti f (ji) = an a limitu ve tvaru lim a„ = a. Podle definice to pak znamená, že pro každé okolí O (a) limitní hodnoty a existuje index N e N takový, že a„ e O(a) pro všechny n > N. Ve skutečnosti jsme tedy v tomto speciálním případě přeformulovali definici konvergence posloupnosti (viz 5.12). Přidali jsme pouze možnost nevlastních limit. Říkáme také, že posloupnost a„ konverguje k a. Přímo z naší definice pro komplexní hodnoty je opět vidět, že komplexní posloupnost má limitu a, právě když reálné části at konvergují k re a a zároveň imaginární části konvergují k im a. (2) Limita funkce ve vnitřním bodě intervalu. Jestliže je / definována na intervalu A = (a, b) a x0 je vnitřním bodem tohoto intervalu, hovoříme o limitě funkce ve vnitřním bodě jejího definičního oboru. Většinou v tomto případě píšeme lim f(x) = a. X^-XQ 268 CHAPTER 5. ZŘÍZENÍ ZOO Podívejme se, proč je důležité v definici požadovat f(x) e O (a) pouze pro body x ^ x0 i v tomto případě. Vezměme jako přiklad funkci / : M. -» M. fix) 0 je-li x £ 0 1 je-li x = 0. Pak zjevně limita v nule je dobře definována a v souladu s naším očekáváním bude lirn^o f(x) = 0, přestože hodnota /(O) = 1 do malých okolí limitní hodnoty 0 nepatří. (3) Limity funkce zprava a zleva. Je-li A = [a,b] ohraničený interval a x0 = a nebo x0 = b, hovoříme o limitě zprava, resp. zleva, funkce / v bodě x0. Jestliže je bod x0 vnitřním bodem definičního oboru funkce /, můžeme pro účely výpočtu limity definiční obor zúžit na [x0, b] nebo [a, x0]. Výsledným limitám pak také říkáme limita zprava, resp. limita zleva pro funkci / v bodě x0. Označujeme je výrazy Mmx_>,x+ f (x), resp. íirax^x- f (x). Jako príklad nám může sloužit limita zprava a zleva v x0 = 0 pro Heavisideovu funkci h z úvodu této části. Evidentně je lim h (x) x^0+ 1, lim h (x) 0. Limita lirn^o f (x) přitom neexistuje. Přímo z našich definic je zjevné, že limita ve vnitřním bodu definičního oboru libovolné reálné funkce / existuje, právě když existují limity zprava i zleva a jsou si rovny. 5.20. Další příklady limit. (1) Limita komplexní funkce / : A -» C existuje tehdy a jen tehdy, jestliže existují limity její reálné a imaginární části. V takovém případě je pak lim f{x) x^xq lim (re fix)) + i lim (im fix)). x^-xq x^-xq Důkaz je přímočarý a vychází přímo z definice vzdáleností a okolí bodů v komplexní rovině. Skutečně, příslušnost do á-okolí komplexní hodnoty z je zajištěna pomocí reálných (l/V2)<5-okolí reálné a imaginární složky z. Odtud již tvrzení bezprostředně vyplývá. (2) Nechť / je reálný nebo komplexní polynom. Pak pro každý bod x e M je lim fix) = fix0). x^xq Skutečně, je-li fix) = anxn + ■ ■ ■ + a0, pak roznásobením (x0 + S)k = x^ + kSx^1 + ■ ■ ■ + Sk a dosazením pro k = 0, ..., n vidíme, že volbou dostatečně malého 8 se hodnotou libovolně blízko přiblížíme /(jco). (3) Uvažme nyní docela ošklivou funkci definovanou na celé reálné přímce fix) 1 je-li x e Q 0 jestliže x ^ Přímo z definice je zjevné, že tato funkce nemá limitu v žádném bodě (dokonce ani zleva nebo zprava). jestliže limita na pravé straně existuje a/(x) ^ 1 pro x z jistého ryzího okolí bodu x0 e M. Určeme proto / sin x 1 \ sin (2x) lim (tg* - l) tg (2x) x^7l/4 lim l x^jt/4 \COSX / COS (2x) sin x—cos x 2 sin x cos x lim ■ x^7l/4 COSX -2 sinx cos2 x — sin2 x i V2 lim — x^jt/4 COSX + Sinx V2 i V2 2 T 2 Odtud máme lim (tgx)tg(2x) x^7l/4 Doplňme, že použitý vzorec platí obecněji pro „typ lcokoll"? tj. bez kladení jakýchkoli podmínek týkajících se limity lim^^ gix), která tak ani nemusí existovat. □ 5.56. Ukažte, že je lim smx l. x^0 X Solution. Uvažujme jednotkovou čtvrtkružnici v prvním kvadrantu a její bod [cosx, sinx], x e (0, Jt/2). Délka kruhového oblouku mezi body [cosx, sinx] a [l, 0] je rovna x. Zřejmě tedy je smx < x, x e Hodnotu tgx potom vyjadřuje délka úsečky s krajními body [l, sinx/cosx] a [1,0]. Vidíme, že je (příp. si nakreslete obrázek) x < tgx, x e (o, ^ . Tato nerovnost rovněž vyplývá z toho, že trojúhelník s vrcholy [0, 0], [1, 0], [1, tg x] má očividně větší obsah než uvažovaná kruhová výseč. Dohromady jsme získali sinx smx < x < cosx tj- 1 < < smx cosx smx 1 > - > cosx, x e x e x e Z Věty o třech limitách nyní plynou nerovnosti 1 Dokázali jsme tak, že smi lim 1 > lim - > lim cos x = cos 0=1. x^0+ x^0+ X x^0+ smx lim - ^^0+ X 1. Funkce y = (sin x)/x definovaná pro x ^ Oje ovšem sudá, a tudíž je sinx .. sinx lim x^0- X lim ^^o+ x 1. 269 C. LIMITY 2. REÁLNÁ ČÍSLA A LIMITNÍ PROCESY Protože obě jednostranné limity existují a jsou si rovny, existuje oboustranná limita a platí pro ni sin x sin x lim- = lim - = 1. jt^o x jt^0± x Poznamenejme ještě, že uvedenou limitu by sice šlo velmi snadno vyčíslit za pomoci ľHospitalova pravidla, nicméně k odvození ľHos-pitalova pravidla je používána právě tato limita, tudíž se při jejím výpočtu na zmíněné pravidlo odvolávat nemůžeme. □ 5.57. Stanovte limity (4) Následující funkce je ještě záludnější, než jsme viděli v předchozím případě. Funkce / takto:3 /(*) i 0 jestliže x £ Q. jestliže x . je definována p a q nesoudělná Zvolíme-li libovolný bod x, ať už racionální či ira-cionální, a veliké přirozené m, bude x v právě EU jednom z intervalů [-, Ľ^-) pro nějaké n (je-li x = 2-, uvažujeme jen nesoudělná m > q). Za Sk si zvolíme minimum ze vzdáleností bodu x od hranic těchto intervalů pro uvažovaná m menší než k. Samozřejmě vždy platí 8k < (n \n / \\n / 1\ uaiii\jzJ±i_jiii^ víuj pian uk ..... -) , lim ( 1 H—- ) , lim ( 1--) ; Uvažme nyní nějaké e > 0 a k taková, že \ < e. Pak pro sin x x arcsin x lim-, lim —-—, lim-; x^o x x^o sin x x 3tg2x sin(3x) tg (3x) lim-—, lim-, lim >o 5x2 >o sin (5jc) >o sin (5jc) lim _ lim e5x — e x x^o x x^o sin (2x) Solution. Při určování těchto limit využijeme znalosti limit (a e M) / a\n sinx ex — 1 lim(l + -J =efl; lim-= 1; lim-= 1. Víme tedy, že je x^o x x^o x ( 1\" (n-l\n lim ( 1 - - ) = lim (-) n^oo y n) n^oo \ n / Substituce m = n — 1 dává lim (n — 1\" / m \ -) = lim -) n ) m^oo \m + 1/ (—) \m + 1/ Celkem máme e = lim lim _m_\ m + l) m lim -. m^oo m + l m ■ lim -. m^oo m + l Druhá z limit je zjevně rovna 1. Když změníme označení (nahradíme R za ni), můžeme napsat výsledek e = lim (n + l) Dále platí lim + = lim (l + \\ = lim (7l + 1) ) e° = l všechna y v ryzím á-okolí bodu x je buď f(y) = 0, jde-li o iracionální hodnotu, nebo f(y) < j pro r > k, jde-li o hodnotu racionální. V každém případě je tedy |/(y)| < e. Tato funkce má proto limitu ve všech reálných bodech x nulovou. Jen v iracionálních bodech je ale tato limita rovna funkční hodnotě. 5.21. Theorem (O třech limitách). Buďte f, g, h reálné funkce se shodným definičním oborem A a takové, že existuje ryzí okolí hromadného bodu xq e M definičního oboru, kde platí fix) < gix) < h(x). Potom, pokud existují limity lim f{x) = f o, lim hix) = h0 X^XQ X^XQ a navíc fo = ho, pak také existuje limita a platí g0 = f0 = h0. lim g{x) = go X—>XQ TéCi imnr Proof. Za předpokladů věty existuje pro libovolné s > 0 okolí Oixo) bodu x0 e A c M, ve kterém jsou pro Této funkci se říkává Thomaeova funkce podle německého matematika J. Thomae z druhé poloviny 19. století. 270 CHAPTER 5. ZŘÍZENÍ ZOO všechna x ^ x0 hodnoty f (x) i h (x) obsaženy v intervalu (/o -e, f0 + e).Z podmínky f (x) < g (x) < h (x) vyplýva, že i g (x) e (fo -s,f0 + s), tedy lim*^*0 g (x) = f0. Drobnou modifikací předchozího postupu si čtenář doplní i argumentaci pro nevlastní hodnoty limit nebo limity v nevlastním bodu x0. Určitě bude dobré si tyto případy podrobně promyslet! □ Všimněme si, že věta dává možnost výpočtu limit pro všechny typy diskutované výše, tj. limity posloupností, limity funkcí ve vnitřních bodech, jednostranné limity atd. 5.22. Theorem. Nechť A c R je definiční obor reálných nebo komplexních funkcí f a g, xq nechť je hromadný bod A a existují limity lim f{x) a e lim gix) X^XQ Potom: (1) limita a je určena jednoznačně, (2) limita součtu f + g existuje a platí lim ifix)+gix)) = a + b, X^XQ (3) limita součinu f ■ g existuje a platí lim i fix) ■ gix)) = a-b, X^XQ (4) pokud navíc b ^ 0, pak limita podílu f/g existuje a platí fix) a lim -= —. *->*o gix) b Proof. (1) Předpokládejme, že a a. a' jsou dvě hodnoty limity lim*^*0 fix). Pokud je a ^ a', pak existují disjunktní okolí O (a) a 0{a'). Pro dostatečně malá okolí x0 ale mají hodnoty / ležet v obou naráz, což je spor. Proto je a = a'. (2) Zvolme si nějaké okolí a + b, třeba 02€ia + b). Pro dostatečně malé okolí x0 a x ^ x0 bude jak fix), tak gix) v e-okolích bodů a a b. Proto jejich součet bude v 2e-okolí kýžené hodnoty a + b. Tím je důkaz ukončen. (3) Podobně postupujeme u součinu s 0€i(ab). Pro malá okolí x0 se nám hodnoty / i g trefí do e-okolí hodnot a a b. Proto jejich součin bude v požadovaném e2 -okolí. (4) Podobný postup ponechán jako cvičení. □ Remark. Podrobnějším sledováním důkazů jednotlivých bodů věty můžeme její tvrzení rozšířit i na některé nekonečné hodnoty limit reálných funkcí: V prvém případě je zapotřebí, aby buď alespoň jedna z limit byla konečná nebo aby obě měly stejné znaménko. Pak opět platí, že limita součtu je součet limit s konvencemi z 5.18. Případ "oo — oo" ale není zahrnut. V druhém případě může být jedna z limit nekonečná a druhá nenulová. Pak opět platí, že limita součinu je součin limit. Případ "0 • (±oo)" není ale zahrnut. V případě podílu může být a e tai = ±oo, kdy výsledek limity bude nula, nebo a = ±oo a b e M, kde lim (1 - -\ = lim (íl = 0. Upozorněme, že první z předešlých vyčíslení vyplývá z limit / 1 V" 1 e, lim — = 0 n^-oc fi lim \ nL) m^oo \ m) a druhé potom z lim H)' lim n = +oo, přičemž klademe e~°° se o určitý výraz). Snadno lze získat 0 (zápis označuje lim* 0 - jedná Zřejmě je a limita sin x sin x lim-= lim sin x ■ lim- x^o x x^o x^o x lim 0-1=0. x^o SIM lim 1 ^^o siní neexistuje (zapisujeme 1/ ± 0). Kdybychom tedy k výpočtu limity x lim sin x užili pravidla o limitě součinu, obdrželi bychom l-l/±0=l/±0. To znamená, že tato limita neexistuje (opět jde o určitý výraz). Ke stanovení arcsin x lim- x^0 x použijeme identitu x = sin(arcsinx) platnou pro x e (—1, 1), tj. v jistém okolí bodu 0. Pomocí substituce y = arcsin x dostáváme arcsm x arcsm x y lim- = lim-= lim- ^^o x x^o sin (arcsinx) y^osinj 1. Poznamenejme, že y —> 0 plyne z dosazení x = 0 do y = arcsin x a ze spojitosti této funkce v počátku (to také zaručuje, že jsme tuto substituci mohli „bez obav" zavést). Ihned vidíme, že je 3tg2x lim >o 5x2 lim X- 3 45 sin x sin x x x cos Sz x ) siní siní lim-• lim-• lim 1 5 x^0 x x^0 x x^OCOS2! 3 3 -111 = -. 5 5 271 C. LIMITY 2. REÁLNÁ ČÍSLA A LIMITNÍ PROCESY Vhodné rozšíření a substituce dávají sin (3jc) / sin (3x) lim-= lim >o sin (5jc) (sin (3x) 5x 3 \ -.-. _ i 3x sin (5jc) 5 / sin (3jc) 5x 3 lim-• lim >o 3x y o sin (5jc) 5 siny z lim-• lim y^o y z^osinz 5 Pomocí předešlého výsledku pak lehce spočítáme 'sin (3x) .- = 1.1.- = -. lim x^o sin tg (3x) = /sin(3x) 1 \ sin(5x) *->■() \sin (5jc) cos (3x) / sin(3x) lim-• lim 1 >o sin (5jc) Podobně můžeme stanovit ,5x lim x^o o cos (3x) 1 3 _ 3 5 ' ~ 5" lim I e2x x^o \ (5 - 2)jc 9 e3* -lim e • lim- jc=>0 jc=>0 3x ? -1 y^o y 1 -° lim--- • 3 (5 - 2) j •3 1-1-3 a rovnez lim o sin (2x) 5x _ y lim í lim 2x / e5* - 1 e"* - 1\ i I---I o \ sin (2x) sin (2x) / sin (2x) e~x — 1 2x lim 5x 5x _ y sin (2jc) 2 2x 5 sin (2jc) >o 5x lim >o sin (2jc) 2 e~; lim — lim 2x e" - 1 z 5 e" -lim-• lim-•--lim- u^o u z^osinz 2 v^o v 5 1 „ 2 + 2=3- >o sin (2x) — ■ lim —— z^o sin z h) □ 5.58. Vypočtěte limity lim 1 — cos (2x) x siní Solution. Využijeme faktu, že lim x^o 1 — COS x smi lim x^o x Snadno získáváme 1 — cos (2x) lim x^o x smx lim x^o lim x^o cos i - sin x) x smx (l — cos2x) + sin2x x sinx 2 sin x sin x lim-:- = lim 2- x^o x sinx x^o x 2; výsledek bude ±oo podle znamének čitatele a jmenovatele. Případ "—" není zahrnut. Zdůrazněme, že naše věta jako speciální případ pokrývá také odpovídající tvrzení o konvergenci posloupností i o limitách zprava a zleva funkcí definovaných na intervalu. Pro úvahy o limitách bývá technicky užitečný i následující jednoduchý důsledek definic, který uvádí do souvislosti limity posloupností a funkcí obecně. 5.23. Corollary. Uvažme reálnou nebo komplexní funkci f definovanou na množině A C Mfl hromadný bod xq množiny A. Funkce f má v bodě xq limitu y právě, když pro každou posloupnost bodů xn e A konvergující k xq a různých od xq má i posloupnost hodnot f(x„) limitu y. TE5r \WNVE£&£NC£-I i i ■4-\— \. * x3 ^ Proof. Předpokládejme nejprve, že limita / v bodě x0 je skutečně y. Pak pro libovolné okolí V bodu y musí existovat okolí V bodu x0 takové, že pro všechny x e V7 n A, x ^ xo> je f(x) £ U. Pro každou posloupnost x„ -» x0 bodů různých od x0 ale budou pro všechna n větší než vhodné ./V i všechny body x„ e V7. Budou tedy posloupnosti hodnot f(xn) konvergovat k hodnotě y. Předpokládejme naopak, že funkce / nekonverguje k y při x -» x0. Pak pro nějaké okolí U hodnoty y existuje posloupnost bodů xm ^ x0 v A, které j sou bližší k x0 než 1 /m a přitom hodnota f(xm) nepatří do U. Tím jsme zkonstruovali posloupnost bodů z A různých od x0, pro které hodnoty f(xn) nekonvergují k y a důkaz je ukončen. □ Nyní máme nachystány nástroje na korektní formulaci vlastnosti spojitosti, se kterou jsme dříve intuitivně nakládali u polynomů. | Spojitost funkcí j Definition. Nechť / je reálná nebo komplexní funkce definovaná na intervalu A c M. Říkáme, že / je spojitá v bodě xq e A, jestliže je lim f{x) = fix0). X^XQ Funkce / je spojitá na množině A, jestliže je spojitá ve ve všech bodech xq e A. 212 CHAPTER 5. ZŘÍZENÍ ZOO Všiměme si, že pro hraniční body intervalu A říká naše definice, že / v nich má hodnotu rovnou limitě zleva, resp. zprava. Říkáme, že je v takovém bodě spojitá zprava, resp. zleva. Již jsme také viděli, že každý polynom je spojitou funkcí na celém M, viz 5.20(2). Potkali jsme také funkci, která je spojitá jen v iracionálních reálných číslech, přestože má limity i ve všech číslech racionálních, viz 5.20(4). Z předchozí Věty 5.22 o vlastnostech limit okamžitě vyplývá většina následujících tvrzení 5.24. Theorem. Nechť f a g jsou (reálné nebo komplexní) funkce definované na intervalu A a spojité v bodě xq e A. Pak (1) součet f + g je funkce spojitá v xq (2) součin f ■ g je funkce spojitá v xq (3) pokud navíc g (xq) ^ 0, pak podíl f /g je dobře definován v nějakém okolí xq a je spojitý v xq. (4) pokud je spojitá funkce h je definována na okolí hodnoty f(xo) reálné funkce f, pak složená funkce h o f je definována na okolí bodu xq a je v bodě xq spojitá. Proof. Tvrzení (1) a (2) jsou zřejmá, doplnit důkaz tt> _ potřebujeme u tvrzení (3). Jestliže je g(x0) 7^ 0, pak také celé e-okolí čísla g(x0) neobsahuje nulu pro dostatečně ■ malé e > 0. Ze spojitosti g pak vyplývá, že na dostatečně malém á-okolí bodu x0 bude g nenulové a podíl f/g tam bude tedy dobře definován. Pak bude ovšem i spojitý v x0 podle předchozí věty. (4) Zvolme nějaké okolí O hodnoty h(f (x0)). Ze spojitosti h k němu existuje okolí O' bodu f(x0), které je celé zobrazeno funkcí h do O. Do tohoto okolí O' spojité zobrazení / zobrazí dostatečně malé okolí bodu x0. To je ale právě definiční vlastnost spojitosti a důkaz je ukončen. □ Nyní si vcelku snadno můžeme odvodit zásadní souvislosti spojitých zobrazení a topologie reálných čísel: 5.25. Theorem. Nechť f : M -» R je spojitá funkce. Pak (1) vzor f~l(U) každé otevřené množiny U je otevřená množina, (2) vzor f~1(W) každé uzavřené množiny W je uzavřená množina, resp. lim x^0 1 — COS x lim x^0 COS x 1 + COS x * lim sin2 x 1 + cos x lim 1 — cos x >o x2 (1 + cosx) >o x2 (1 + cosx) (sin x \' lim- x^0 X / lim 1 >o 1 + cosx 1 2" Dodejme, že jsme také mohli hned použít vyjádření 1 — cos (2x) = 2 sin2 x, x e M. D. Spojitost funkcí □ 5.59. Zkoumejte existenci limit a spojitost funkce (x — 1) sgnx v bodech 0 a 1. Solution. Spočítejme nejprve jednostranné limity v bodě nula: linwo-(* " l)"sgn" = linw0-(* -!) = -!, linwo+(* " l)"sgn" = linWo+ ~i = —1> odtud lim (x — 1) ~sgn x = — 1, nicméně funkční hodnota této funkce j e x^0 v bodě 0 rovna 1, tudíž zkoumaná funkce není v bodě 0 spojitá. Dále je lim^!-(x - 1)-^ = limMl- = -oo, limx^1+(x - l)-ssn* = limx^1+ ^ = 00. V bodě 1 tedy existuje levostranná i pravostranná limita dané funkce, jejich hodnoty se ovšem liší, funkce tudíž nemá v bodě 1 limitu (a tak není v tomto bodě ani spojitá). □ 5.60. Bez použití Věty o třech limitách dokažte, že funkce x e {i; n e N} ; x e M\ {i; n e N} R(x) x, 0, je spojitá v bodě 0. Solution. Funkce i? je spojitá v bodě 0, právě když je limi?(x) = R(0) = 0. x^0 Z definice limity ukážeme, že tato limita se skutečně rovná 0. Při „obvyklém" značení je a = 0, x0 = 0. Nechť á > 0 je nadále libovolné. Pro jakékoli x e (—8, 8) )e R(x) =0, nebo R(x) = x, a tudíž (v obou případech) dostáváme R(x) e (—8, 8). Jinými slovy, vezmeme-li libovolné á-okolí (—8, 8) hodnoty a a přiřadíme-li mu (—8, 8) (jako okolí bodu x0), pak pro každé x e (—8, 8) (z uvažovaného okolí x0) platí, že R(x) e (—8,8) (zde na interval (—8,8) nahlížíme jako na okolí a). To odpovídá znění definice limity (nemuseli jsme ani požadovat, aby bylo X ^ Xq). 273 D. SPOJITOST FUNKCÍ 2. REÁLNÁ ČÍSLA A LIMITNÍ PROCESY Uvažovaná funkce R se nazývá Riemannova funkce (proto označení R). V literatuře se ovšem uvádí v různých modifikacích. Např. o funkci /(*) x e 1, K x = p- q q 0, X <£ Q 1 pro nesoudělná p, q e Z a g > 1; se „často" hovoří jako o Riemannově. 5.61. Dodefinujte funkci □ f (x) = (x2 - 1) si 2x - 1 sin ■ 1 x / ±1 (i e 1) v bodech —1,1 tak, aby byla spojitá na R. Solution. Daná funkce je spojitá ve všech bodech svého definičního oboru. V bodech —1,1 bude spojitá, právě když položíme 2x /(-l) /(l) == lim 1) sin lim 1) sin ■ x*-2x Pokud by jedna z těchto limit neexistovala (příp. byla nevlastní), funkci by nešlo spojitě dodefinovat. Očividně je 2x - 1 sin 1 < 1, x ^ ±1 (x e R), odkud plyne Protože 1 I < f (x) < \x2 - 1 I , x ^ ±1 (x € R). lim I x2 — 1 Jt->±1 1 o, z Věty o třech limitách již dostáváme výsledek /(±1) := 0. □ 5.62. Zjistěte, jestli má rovnice e2x — x4 + 3x3 — 6x2 = 5 alespoň jedno kladné řešení. Solution. Uvažujme funkci /(*) :-- ^2x x4 + 3x3 - 6x2 x > 0, pro niž je /(O) = -4, lim f(x) = lim e2x = +oo. Ze spojitosti funkce / na celém jejím definičním oboru tudíž vyplývá, že nabývá všech hodnot y e [—4, +oo). Zvláště její graf nutně protíná kladnou poloosu x, tj. rovnice f(x) =0 má řešení. □ 5.63. V jakých bodech x e M je funkce i^arctg ^| y = cos | arctg | | 12xzl +11 s maximálním definičním oborem spojitá? k(x+2)-x3 \ \ 11 -x12 )) + sin (sin (sin x)) (3) obraz f(K) každé kompaktní množiny K je kompaktní množina, (4) na libovolné kompaktní množině K dosahuje spojitá funkce svého maxima a minima. Proof. (1) Uvažme nějaký bod x0 e f~l(U). Nějaké í' „ okolí O hodnoty /(x0) je celé v U, protože je U otevřená. Pak ovšem existuje okolí O' bodu x0, které ~Ä se celé zobrazí do O, patří tedy do vzoru. Každý bod í7 vzoru je tedy vnitřní a tím je důkaz ukončený. (2) Uvažme nějaký hromadný bod x0 vzoru f~l(W) a nějakou posloupnost x;, /(x;) e W, která k němu konverguje. Ze spojitosti / nyní zjevně vyplývá, že /(x;) konverguje k /(x0), a protože je W uzavřená, musí i /(x0) e W. Zřejmě jsou tedy všechny hromadné body vzoru množiny W ve W také obsaženy. (3) Zvolme libovolné otevřené pokrytí f (K). Vzory jednotlivých intervalů budou sjednoceními otevřených intervalů a tedy také vytvoří pokrytí množiny K. Z něho lze vybrat konečné pokrytí a proto nám stačí konečně mnoho odpovídajících obrazů k pokrytí původní množiny f(K). (4) Protože je obrazem kompaktní množiny opět kompaktní množina, musí být obraz ohraničený a zároveň musí obsahovat svoje supremum i infimum. Odtud ale vyplývá, že tyto musí být zároveň maximem a minimem hodnot. □ 5.26. Corollary. Nechť f : R -> R je spojitá. Potom (1) obraz každého intervalu je opět interval, (2) f na uzavřeném intervalu [a, b] nabývá všech hodnot mezi svou maximální a minimální hodnotou.4 Proof. (1) Uvažme nejprve nějaký otevřený interval A a předpokládejme, že existuje bod y e R takový, že f (A) obsahuje body menší i větší než y, ale y £ f (A). Znamená to tedy, že pro otevřené množiny Bi = (—oo, y) a B2 = (y, oo) jejich vzory A\ = f~l(Bi) n A a A2 = f~1(B2) n A pokrývají A. Tyto množiny jsou přitom opět otevřené, jsou disjunktní a obě mají neprázdný průnik s A. Stejnou úvahou jako v důkazu prního bodu v 5.17 dospějeme k závěru, že musí existovat bod x e A, který neleží v A i, je ale jejím hromadným bodem. Musí pak tedy ležet v A2 a to u disjunktních otevřených množin není možné. Dokázali jsme tedy, že pokud nějaký bod y nepatří do obrazu intervalu, musí být všechny hodnoty buď zároveň větší nebo zároveň menší. Odtud vyplývá, že obrazem bude opět interval. Všimněme si, že jeho krajní body tohoto intervalu mohou a nemusí do obrazu patřit. Pokud obsahuje definiční interval A i některý ze svých hraničních bodů, musí jej spojitá junkce zobrazit opět buď na hraniční nebo vnitřní bod obrazu vnitřku A. Tím je tvrzení ověřeno. 4Tomuto tvrzení se (zejména v české literatuře) říká Bolzanova věta. Bernard Bolzano pracoval na začátku 19. století v Praze. 274 CHAPTER 5. ZŘÍZENÍ ZOO (2) Toto tvrzení je přímým důsledkem předchozího, protože obrazem ohraničeného uzavřeného intervalu (tj. kompaktní množiny) musí být opět uzavřený interval. □ Na závěr naší úvodní diskuse spojitosti funkcí uvedeme ještě tvrzení, která jsou užitečným nástrojem při počítání limit. 5.27. Theorem (O limitě složené funkce). Nechť f, g : M -» M. jsou funkce, limx^a f (x) = b. (1) Pokud je funkce g spojitá v bodě b, potom 5.64. Rozhodněte, zda je funkce lim g (/(*)) = g (lim f (x)) g (b). (2) Jestliže existuje limita limy^b g(y) a zároveň pro všechna x z nějakého ryzího okolí bodu a platí f (x) 7^ b, potom Um g (/(*)) = hm g (y). x^a y^b Proof. První tvrzení se dokazuje podobně jako tvrzení 5.24(4). Ze spojitosti g v bodě b vyplývá, že pro jakékoliv okolí V hodnoty g (b) umíme najít dostatečně malé okolí U bodu b, na kterém jsou už všechny hodnoty g ve V7. Pokud ale / má bod b jako limitu v bodě a, pak se do U trefíme všemi hodnotami / pro dostatečně malé ryzí okolí bodu a, což již ověřuje první tvrzení. Pokud nemáme k dispozici spojitost funkce g v bodě b, bude předchozí argumentace obecně platit také, když zajistíme, aby dostatečně malá ryzí okolí bodu a byla funkcí / zobrazena do ryzího okolí bodu b. □ 5.28. Kdo už je v ZOO. Začali jsme budovat náš zvířetník funkcí s polynomy a s funkcemi, které se z nich dají vyrobit "po částech". Zároveň jsme dovodili spoustu vlastností pro patrně obrovskou třídu spojitých funkcí, nemáme ale zatím moc prakticky zvladatelných příkladů, kromě polynomů. Jako další příklad si prohlédneme podíly polynomů. Nechť f a g jsou dva polynomy, které mohou mít i komplexní hodnoty (tj. připouštíme výrazy anx" + ■ ■ ■ + a$ s komplexními ai e C, ale dosazujeme jen reálné hodnoty za proměnnoux). Funkce A:1\{jíéR, g(x) = 0} -» C, /(*) h(x) g(x) je dobře definována ve všech reálných bodech x kromě kořenů polynomu g. Takové funkce nazýváme racionální funkce. Z Věty 5.24 vyplývá, že racionální funkce jsou spojité ve všech bodech svého definičního oboru. V bodech, kde definovány nejsou, mohou mít • konečnou limitu, když jde o společný kořen obou polynomů / a g, přičemž jeho násobnost je v / alespoň taková jako v g (v tomto případě rozšířením jejich fix) X, 0, X, 0, X, 1 l jt-3' x < 0; 0 < x < 1; x = 1; 1 < x < 2; 2 < x < 3; x > 3 spojitá; spojitá zleva; spojitá zprava v bodech — jt, 0, 1, 2, 3, 7t. 5.65. Dodefinujte funkci fix) = arctg ^1 + ■ sin2x5, pro x = 0 tak, aby byla v tomto bodě spojitá. 5.66. Uvedte pel, pro které je funkce x € R \ {0} sin (6x) f{x) = ^—L, x6EM\{0}; 3x /(O) spojitá v počátku. 5.67. Zvolte reálnou hodnotu a tak, aby funkce x4 - 1 h (x) =-, x>l; h (x) = a, x 0 splněna pro všechna reálná x. Solution. Všimněme si, že pro a = 2 je nerovnost tri valně splněna (levá strana je konstanta 1). Pro a ^ 2 je levá strana kvadratickou funkcí fix) proměnné x, přičemž je /(O) = 1. Vzhledem ke spojitosti funkce f(x) tak bude nerovnost f(x) > 0 platit pro všechna reálná x, právě když rovnice f(x) =0 nebude mít řešení v M (graf funkce / pak bude celý "nad" osou x) a to nastane, právě když diskriminant kvadratické rovnice (a — 2)x2 — (a — 2)x + 1=0 bude záporný. Dostáváme tak nutnou a postačující podmínku D = ia - 2)2 - Ma - 2) = (a - 2) (a - 6) < 0. Taje splněna pro a e (2, 6). Celkem je nerovnice splněna pro všechna reálná x pro a e [2,6). □ 275 E. DERIVACE 2. REÁLNÁ ČÍSLA A LIMITNÍ PROCESY 5.70. V M řešte rovnici 2X + V + 4X + 5X + Solution. Funkce na levé straně rovnice je součtem tří rostoucích funkcí na M, je tedy sama rostoucí funkcí na celém M. Hodnota levé strany je pro x = 0 rovna 5, což je tedy jediným řešením dané rovnice. □ 5.71. VB řešte rovnici 2X + 3X + 6X = 1. definice o limitní hodnotu v tomto bodě dostaneme funkci i v tomto bodě spojitou), • nevlastní limitu, když nevlastní limity zprava a zleva v tomto bodě jsou stejné, • různé nevlastní limity zprava a zleva. Názorně je možné tuto situaci vidět na obrázku, který ukazuje hodnoty funkce (x - 0.05a) (x - 2 - 0.2a) (jc - 5) h(x) =- x(x - 2){x - 4) pro hodnoty a = 0 (obrázek vlevo tedy vlastně zobrazuje racionální funkci (x — 5)/(x — 4)) a pro a = 5/3. 5.72. Rozhodněte, zda polynom -37 + 5x21 - 4x9 + 5x4 - 2x - 3 má v intervalu (—1, 1) alespoň jeden reálný kořen. E. Derivace Ukažme si nejprve, že derivace funkcí uvedené v tabulce v odstavci 5.31 jsou skutečně správně. Určíme je přímo z definice derivace. 5.73. Z definice (viz 5.31) určete hodnoty derivací funkcí x" (x je proměnná, n kladná celá konstanta), y/x, sinx. Solution. Nejprve podotkněme, že označíme-li v definici derivace výraz x — x0 jako h, pak dostáváme ľ f(x)-f(x0) f(x0 + h)-f(x0) lim -= lim-. x->x0 X — Xq h^o h V následujících výpočtech budeme pracovat s druhým vyjádřením téže limity. 5.29. Funkce mocninné a exponenciální. Polynomy jsou pomocí sčítání a násobení skaláry seskládány z jednoduchých mocninných funkcí x h-> x" s přirozeným exponentem n = 0, 1, 2, .... Samozřejmý smysl má také funkce x x~l pro všechna i / O. Tuto definici teď rozšíříme na obecnou mocninnou funkci x" s libovolným a e M. Budeme vycházet z vlastností mocnin a odmocnin, které patrně považujeme za samozřejmé. Pro záporné celé číslo —a proto definujeme (X -1 Dále jistě chceme, aby ze vztahu b" = x pro n e N vyplývalo, že b je n-tou odmocninou z x, tj. b = x«. Je třeba ale ověřit, že taková b pro kladná reálná x skutečně existují. Z bionomického rozkladu mocniny dvojčlenu je vidět, že funkce y y" je pro y > 0 stále rostoucí. Předpokládejme x > 0 a uvažujme množinu B = {y e M, y > 0, y" < x}. To je zřejmě shora ohraničená množina a zvolíme b = sup B. O mocninné funkci s přirozeným n již víme, že je to funkce spojitá, snadno tedy ověříme, že skutečně platí b" = x. Skutečně, určitě je b" < x a kdyby platila ostrá nerovnost, našli bychom jistě i y s hodnotou b" < y" < x, což nutné znamená i b < y a tedy jde o spor s definicí suprema. Máme tedy již korektně definovánu mocninnou funkci pro všechna racionální a = ^,x" = (xv)% = (x?)p. Konečně, pro hodnoty a e lai > 1 si povšimněme, že jde pro racionální a o striktně rostoucí výraz (pro větší a je vždy větší výsledek). Proto klademe ŕ = supiy ,yeQ, y < a}. 276 CHAPTER 5. ZŘÍZENÍ ZOO Pro 0 < x < 1 buď definujeme analogicky (je třeba si jen pohrát s nerovnítky) nebo klademe přímo x° = (\)~a ■ Pro x = 1 je pak \a = 1 pro libovolné a. Obecnou mocninnou funkci x h-» xf1 máme tedy dobře definovanou pro všechny x e [0, oo) a a e M. Naši konstrukci ale můžeme také číst následujícím způsobem: Pro každé pevné reálné c > 0 existuje dobře definovaná funkce na celém M., y h-» cy. Této funkci říkáme exponenciální funkce o základu c. Vlastnosti, které jsme použili při definici mocninné a exponenciální funkce f(y) = cy, tj. c = /(l), lze shrnout do jediné rovnosti pro libovolné reálné kladné x a y: fix I v) f{x) ■ ./(v) společně s požadavkem spojitosti. Skutečně, pro y = 0 dostáváme z této rovnosti / (O) = 1, odtudpakl = /(O) = f(x—x) = f (x)-(f (x))~l akonečně pro přirozené n je zjevně f (nx) = (f(x))n. Takto jsme již jednoznačně určili hodnoty xa pro všechny x>0aaeQa požadavkem spojitosti byla již funkce určena všude. Zejména tedy pro exponenciální funkci platí známé vztahy (5.5) a ■ aJ ^+y (ax) 5.30. Logaritmické funkce. Viděli j sme právě, že exponenciální funkce f (x) = ax je pro a > 1 stále rostoucí a pro 0 < a < 1 je stále klesající. V obou případech tedy existuje k f (x) funkce inverzní f~l(x) kterou nazýváme logaritmickou funkcí se základem a. Píšeme lnfl(x) a definiční vztah tedy je lna(ax) = x. Rovnosti (5.5) jsou proto ekvivalentní vztahům lna (x ■ y) = lna (x) + lna (y), lnfl (xy) = y ■ lna (x). (x+h)n-Xn . ("Ix""1/! + (")x""2/l2 + •••+/!" (x")' = lim lim nx"'1 + + •••+/! «-i ) «x .n-1 , ._. V* + h - ~Jx (yjx + h - y/x)(y/x + h + y/x) (y/x) = lim-= lim-, - h^o h h^o /i(Vx +h + yfx) lim h lim 1 Ä^O /!(^x + h + y/x) h^O y/x + h + y/x 1 2^/x' sin(x + h) — sinx (sinx) = lim- h^O h sin x cos /i + cos x sin /i — sin x = lim- h^O h cosx sin/i sinx(cos/i — 1) = lim--h hm- h^O h h^O h cosx • lim sin/i 2(sin|)2 lim h^O h h^O h siní cos x • 1 + lim sin t - t^o t cosx. 5.74. Zderivujte a výsledek upravte: i) x sin x, jj\ sin x □ iii) ln(x + V-*2 — a2), 0, |x| > \a\, iv) arctan ^^Jí—|x| < 1, v) xx. Solution, (i) Podle pravidla o derivování součinu funkcí, tedy Leibni-zova pravidla, viz 5.33 dostáváme (x sinx)' = x' • sinx + x • (sinx)' = sinx + x cosx. (ii) Podle pravidla o derivování podílu funkcí (5.34) je sinx (sinx)'• x — sinx • x' x cosx —sinx Logaritmické funkce jsou definovány jen pro kladné hodnoty argumentu a jsou pro základ a > 1 rostoucí, pro základ 0 < a < 1 klesající na celém definičním oboru. Pro každé a je lnfl(l) =0. Brzy uvidíme, že obzvlášť důležitou hodnotou pro a je tzv. Eulerovo číslo e, viz odstavec 5.42. Funkci lne(x) nazýváme přirozeným logaritmem a základ e v označení vynecháváme, tj. píšeme prostě ln(x). (iii) Použijeme pravidla pro derivování složené funkce (5.33). Označíme-li h(x) = ln(x), f(x) = x + -Jx7- — a2, máme ln(x + Vx2 - a2)' = h(f(x))' = h(f(x)) ■ f'(x) (x + V*2 - a2)' x + Vx2 — a2 1 + + Vx2 - a2' 277 E. DERIVACE 3. DERIVACE kde jsme pro derivování výrazu ~Jx2 — a2 použili opět pravidlo o derivování složené funkce, (iv) Opět derivujeme složenou funkci: x \ 1 / x arctan 1— xz VT^x2 + n-x2 1 + l-xz x2 + 1 VT^lc2 VT^x2 (v) Funkci je nejprve převedeme na funkci o konstatním základu (nejlépe o základu e), kterou už umíme derivovat. (**)' = ((elnx)x)' = (exlnxY (x lnx)' • e x\xíx (1 + lnx) -xx 3. Derivace U polynomů jsme již v odstavci 5.6 diskutovali, jak ^äfc* popisovat jednoduše velikost růstu hod-■^h//, not polynomu kolem daného bodu jeho definičního oboru. Tehdy jsme pozorovali podíl (5.2), který vyjadřoval směrnici sečny mezi body [x, f(x)] e R2 a [x + Ax, /(x + Ax)] e R2 pro (malý) přírůstek Ax nezávisle proměnné. Tehdejší úvaha funguje zrovna stejně pro libovolnou reálnou nebo komplexní funkci /, jen musíme místo intuitivního "zmenšování" přírůstku Ax pracovat s pojmem limity. Uvádíme definici pro vlastní i nevlastní derivace, tj. připouštíme i nekonečné hodnoty. Všimněte si, že na rozdíl od limity funkce, u derivace v daném bodě xo je nutné, aby byla sama funkce v tomto bodě definovaná. -| Derivace funkce jedné reálné proměnné 5.75. Určete derivaci funkce y = xsin x,x > 0. Solution. Platí ^.sin x ^' _ ^£sm x m x ^' ^sinx lnx (cosx lnx + ^ xsm x ^CQS x jn x _|_ 5.31. Definition. Nechť / je reálná nebo komplexní funkce □ definovaná na intervalu A c R a x0 e A. Jestliže existuje limita lim X^-XQ f(x) - /(Xo) x — x() □ 5.76. Pro kladná x uvedte derivaci funkce /(x) = xlnx. 5.77. Pro x e (0, 7t/2) spočtěte derivaci funkce y = (sinx)cosx. Doporučujeme čtenáři si vymyslet funkce, které potom sám zderivuje. Výsledek si může ověřit v celé řadě matematických výpočetních programů. V následujícím přikladu si uvědomíme geometrický význam derivace bodě, totiž, že určuje směrnici tečny ke grafu v daném bodě (viz 5.32) 5.78. Za pomoci diferenciálu přibližně určete arccotg 1, 02. Solution. Diferenciál funkce / se spojitou první derivací v bodě xo je roven /' (x0) dx = f (x0) (x - x0). Rovnice tečny ke grafu funkce / v bodě [x0, /(xo)] je pak y - f (*o) = /' (*o) (x - x0). pak řídáme, že / má v bodě xq derivaci a. Hodnotu derivace zapisujeme jako /'(xo) nebo j^(xo), případně a = ^-/(xo). Derivace reálné funkce je vlastní, resp. nevlastní, když je takovou příslušná limita. Jednostranné derivace (tj. derivaci zprava a zleva) definujeme zcela stejně pomocí limity zprava a zleva. O funkci mající v bodě x0 derivaci říkáme, že je v tomto bodě diferencovatelná. O funkci diferencovatelné v každém bodě intervalu říkáme, že je diferencovatelná na tomto intervalu. S derivacemi se vcelku snadno počítá, dá nám ale dost práce korektně odvodit derivace i některých z funkcí, které už v našem zvěřinci máme. Proto s předstihem vsunujeme do textu souhrnnou tabulku, jak derivace pro několik z nich vychází. V posledním sloupci je odkaz na odstavec, kde se dá údaj skutečně i s úplným výkladem najít. Všimněme si také, že inverzní funkce k řadě z našich funkcí sice neumíme přímo vyjádřit elementárním způsobem, přesto ale budeme umět počítat jejich derivace, viz. 5.35 některé derivace funkcí 278 CHAPTER 5. ZŘÍZENÍ ZOO funkce definiční obor derivace polynomy f (x) celé R fix) je opět polynom 5.6 kubické splajny celé R h'ix) má spoji- 5.9 h (x) tou pouze první derivaci racionálni funkce celé R kromě kořenů g racionální funkce: f'(x)g(x)-f(x)g'(x) g(x)2 5.34 f(x)/g(x) mocninné interval fix) = ax*-1 5.36, funkce (0, oo) 5.44 f (x) = x* exponenciála celé R fix) = ln(fl) -ax 5.36, fix) = ď, 5.44 a > 0, a ^ 1 logaritmus interval fix) = 5.36, f (x) = lnfl(x), (0, oo) iMa))~l ■ \ 5.44 a > 0, a ^ 1 Odtud je vidět, že diferenciál funkce je přírůstek funkce na tečně. Hodnoty na tečně ovšem aproximují hodnoty fix), je-li rozdíl x — x0 "malý". Získáváme tak vzorec pro přibližné určení funkční hodnoty pomocí diferenciálu ve tvaru fix) ~ f (x0) + f (x0) ix - x0). Položíme-li tedy fix) := arccotg x, x0 := 1, obdržíme arccotg 1,02 & arccotg 1 + (1, 02 - 1) = f - 0, 01 Z formulace definice lze očekávat, že /'(x0) bude umožňovat dobře aproximovat danou funkci pomocí přímky y = fixo) + fix0)ix - x0). Takto lze rozumět následujícímu lemmatu, které říká, že nahrazením konstantního koeficientu /'(xo) -ťľ ve vyjádření přímky spojitou funkcí dostaneme přímo hodnoty /. Odchylka hodnot Ýix) na okolí bodu xo od hodnoty Ýixo) pak přímo říká, jak se liší směrnice sečen a tečny v bodě xq. t>EW*í£. /' Lemma. Reálná nebo komplexní funkce fix) má v bodě xq vlastní derivaci, právě když existuje na nějakém okolí Oíxq) funkce Ý spojitá v xq a taková, že pro všechny x e Oíxq) platí fix) = fix0) + Ýix)ix - x0). Navíc pak vždy Ýixo) = fixo) a sama funkce f je v bodě xq spojitá. Proof. Nejprve předpokládejme, že /'(x0) je vlastní derivace. Pokud má ý existovat, má jistě pro všechny x e Ještě podotkněme, že bod x0 sice volíme tak, aby výraz x — x0 byl blízký nule, ale současně musíme být schopni v tomto bodě vyčíslit funkce / a /'. □ 5.79. Za pomoci diferenciálu přibližně určete arcsin 0, 497. 5.80. Za pomoci diferenciálu vyčíslete a := arctgl,02; b := VŤÔ. 5.81. Pomocí diferenciálu přibližně vyjádřete (a) sin(H); (b) sin(^). 5.82. Určete parametr c e M tak, aby tečna ke grafu funkce ln^t) v bodě [1,0] procházela bodem [2, 2]. Solution. Podle zadání má mít tečna směrnici |5y = 2. Směrnice je určena derivací funkce v daném bodě, dostáváme tedy podmínku 2 — ln (ex) 2*Jx x=x tedy c = pj. Pro c = je však hodnota fce ln(^) v bodě 1 rovna —2. Tedy žádné takové c neexistuje. □ 5.83. Rozhodněte, zda má polynom x (x — 4)5 alespoň v jednom bodě intervalu (0, 4) tečnu rovnoběžnou s osou x. 5.84. Nechť/? e (0, +oo). Napište rovnici tečny k parabole 2py = x2 v obecném bodě [xo, ?]. 5.85. Nalezněte rovnici normály ke grafu funkce y = \ — ei, x e R v bodě, který je průsečíkem tohoto grafu s osou x. 5.86. Najděte rovnice tečny a normály ke křivce y = ix + 1) V3 - x, x e M v bodě [-1, 0]. 5.87. Nechť je dána funkce 2, neboli 2 - ln(c) = 4, In(c-x) y = -^Tx—-■ oo 279 F. EXTREMÁLNÍ ÚLOHY 3. DERIVACE Stanovte rovnice tečny a normály ke grafu této funkce v bodě [1, ?]. 5.88. V jakých bodech je tečna paraboly y = 2 +x - x2, x eR rovnoběžná s osou x? 5.89. Uvedte rovnice tečny t a normály n ke grafu funkce y = V*2 - 3x + 11, x e M v bodě [2, ?]. Uvedte také všechny body, ve kterých je tečna rovnoběžná s osou x. 5.90. Pod jakým úhlem protíná graf funkce y = In x osu x? (Úhlem protnutí rozumíme úhel tečny s kladnou poloosou x v kladném smyslu otáčení.) 5.91. Určete rovnice tečny a normály ke křivce dané rovnicí x3 + y3 - 2xy = 0 v bodě [1, 1]. 5.92. Dokažte, že platí < ln (1 + x) < x pro všechna x > 0. F. Extremální úlohy Jednoduché pozorování 5.32 o geometrickém významu derivace nám také říká, že extrémy diferencovatelné reálné funkce jedné reálné proměnné mohou nastat pouze v bodech, kde je derivace dané funkce nulová. Tohoto prostého faktu lze využít při řešení množství zajímavých praktických úloh. 5.93. Určete x-ovou souřadnici xA bodu paraboly y = x2, který je nejblíže bodu A = [1,2]. Solution. Není obtížné uvědomit si, že příklad má právě jedno řešení a že úkolem je vlastně najít absolutní minimum funkce f(x) = V(x - l)2 + (x2 - 2)2, x e R. Funkce / má zjevně nejmenší hodnotu ve stejném bodě jako funkce g(x) = (x - l)2 + (x2 - 2)2, x e R. Neboť g'(x) = 4x3 - 6x - 2, x e R, řešením rovnice 0 = 2x3 — 3x — 1 dostáváme nejprve stacionární bod x = — 1 a po vydělení polynomu 2x3 — 3x — 1 polynomem x + 1 také zbývající dva stacionární body a ~~2~~ • Protože funkce g je polynomem (má derivaci na celé reálné ose), z geometrického významu úlohy již získáváme O \ {x0} tvar Ý(x) = (/(*) - f(xo))/(x - x0). V bodě x0 naopak definujme hodnotu derivací /'(x0). Pak jistě lim ý(x) = f'(x0) = Ý(xo) jak je požadováno. Naopak, jestliže taková funkce ý existuje, tentýž postup vypočte její limitu v x0. Proto existuje i /'(x0) a je Ý(xo) rovna. Z vyjádření / pomocí spojitých funkcí je zřejmé, že je sama spojitá v bodě x0. □ 5.32. Geometrický význam derivace. Předchozí lemma lze názorně vysvětlit geometricky a tím popsat smysl derivace. Říká totiž, že na grafu funkce ;t_^ y = f (x), tj. na příslušné křivce v rovině se souřadnicemi x a y, poznáme, zda existuje derivace podle toho, jestli se spojitě mění hodnota směrnice sečny procházející body [xo, /(*o)] a [x, /(*)]■ Pokud ano, pak limitní hodnota této směrnice je hodnotou derivace. Rostoucí a klesající funkce v bodě Corollary. Má-li reálná funkce f v bodě xq e R derivaci f'(xo) > 0, pak pro nějaké okolí 0(xq) platí f(x) > f(xo) pro všechny body x e O(xo), x > xq a f(x) < f(xo) pro všechny body x e O(xq), x < xq. Je-li derivace /'(xq) < 0, pak naopak pro nějaké okolí O(xq) platí f(x) < /(xq) pro všechny body x e O(xq), x > xq, a f(x) > /(xq) pro všechny body x e O(xq), x < xq. 1 Proof. Uvažme prvý případ. Pak podle předchozího lematu platí f(x) = f(x0) + Ý(x)(x ~ xo) a Ý(xo) > 0-Protože je ale ý v xo spojitá, musí existovat okolí O(x0), na kterém bude ý(x) > 0- Pak ale s rostoucím x > x0 nutně poroste i hodnota f(x) > f(x0) a naopak pro x < x0. Stejná argumentace ověří i tvrzení se zápornou derivací. □ Funkce, které mají na nějakém okolí bodu x0 vlastnost f(x) > f(x0), kdykoliv x > x0, a f(x) < f(x0), když x < xq, se nazývají rostoucí v bodě xq. Funkce rostoucí ve všech bodech nějakého intervalu se nazývá rostoucí na intervalu. Samozřejmě pro funkce rostoucí na intervalu platí f(b) > f (a) pro všehcny a < b z tohoto intervalu. Podobně je funkce klesající v bodu x0, jestliže má na nějakém okolí bodu x0 vlastnost f(x) < /(x0), kdykoliv x > xq, a f(x) > /(xq), když x < xq. Funkce je klesající na intervalu, jestliže je klesající ve všech bodech tohoto intervalu. Náš důsledek tedy říká, že funkce, která má v bodě nenulovou konečnou derivaci, je v tomto bodě buď rostoucí nebo klesající podle znaménka této derivace. 280 CHAPTER 5. ZŘÍZENÍ ZOO Pokud má funkce / v okolí bodu x0 spojitou derivaci /'(jco) 7^ 0, pak je tato funkce na nějakém okolí bodu x0 rostoucí nebo klesající, podle znaménka derivace. Skutečně, jako spojitá nenulová funkce má f'(x0) v nějakém okolí x0 stále stejné znaménko. Jako ilustraci jednoduchého použití vztahu derivace k růstu hodnot funkce se podívejme na existenci inverzí polynomů. Protože polynomy jen zřídka jsou výhradně rostoucí nebo klesající funkce, nemůžeme očekávat, že by k nim existovaly globálně definované inverzní funkce. Naopak ovšem inverzní funkce k polynomu / existují na každém intervalu mezi kořeny derivace /', tj. tam kde derivace polynomu je nenulová a nemění znaménko. Tyto inverzní funkce nebudou nikdy polynomy, až na případ polynomů stupně jedna, kdy z rovnice 1+V3 2 • spočteme přímo y = ax + b 1 x = -(y - b), a U polynomu druhého stupně obdobně y = ax2 + bx + c vede ke vztahu -b ± ^Jb2 -4a(c - y) x =-, 2a a inverze tedy existuje (a je dána touto formulí) jen pro x na intervalech (—oo, — (—^, oo). Pro práci s inverzními funkcemi k polynomům nevystačíme s dosavadními funkcemi a dostáváme v našem zvířetníku nové přírůstky. 5.33. Pravidla pro počítání derivací. Uveďme si nyní několik základních tvrzení o výpočtech derivací. Říkají nám, jak dobře se snáší operace derivování s algebraickými operacemi sčítání a násobení na reálných nebo komplexních funkcích. Poslední z pravidel pak umožňuje efektivní výpočet derivace složených funkcí a říkává se mu "řetězové pravidlo". Intuitivně jim můžeme všem velice snadno rozumět, když si derivaci funkce y = f (x) představíme jako podíl přírůstků závislé proměnné y a nezávislé proměnné x: Ay Ax' Samozřejmě pak při y = h(x) = f(x) + g(x) je přírůstek y dán součtem přírůstků fugu přírůstek závislé proměnné zůstává stejný. Je tedy derivace součtu součtem derivací. U součinu musíme být malinko pozornější. Pro y = f (x)g (x) je přírůstek Ay = f (x + Ax)g(x + Ax) - f (x)g (x) = f(x+Ax)(g(x+Ax)-g(x)) + (/(x+Ax)- f(x))g(x) □ 5.94. Do rovnoramenného trojúhelníku o základně z a výšce v (nad základnou) vepište obdélník (jedna jeho strana bude částí základny trojúhelníku) s největším obsahem. Stanovte obsah S tohoto obdélníku. Solution. Pro vyřešení příkladu postačuje uvažovat úlohu, kdy se snažíme vepsat do pravoúhlého trojúhelníku s odvěsnami délek z/2 a v obdélník s maximálním možným obsahem, přičemž dvě jeho strany musí být částmi odvěsen tohoto trojúhelníku. Úlohu takto převedeme na otázku maximalizace funkce m = x(v-2f) na intervalu I = [0, z/2]. Neboť je f'(x) = v — ^j- pro všechna x e 7 a dále /(O) = /(§)= 0, f(x) > 0, x e 7, v jediném svém stacionárním bodě x0 = z/4 nutně nabývá funkce / maxima na 7. Proto jsou strany hledaného obdélníku dlouhé z/2 (dvojnásobek x0: uvažujeme původní úlohu) au/2 (to lze získat dosazením z/4 za x do výrazu v — 2vx/z). Odsud dostáváme, že S = vz/4. □ 5.95. Mezi obdélníky, jejichž dva vrcholy leží na ose x a další dva s kladnými druhými souřadnicemi na parabole y = 8 — 2x2, najděte obdélník s maximálním obsahem. Solution. Základna obdélníku s maximálním obsahem měří 4/V3, jeho výška pak 16/3. Tento výsledek lze obdržet nalezením absolutního maxima funkce S(x) =2x(8-2x2) na intervalu 7 = [0, 2]. Neboť tato funkce je na 7 nezáporná, v krajních bodech 7 nulová a má derivaci na celém 7, přičemž její derivace je nulová pouze v jednom bodě intervalu 7, a to v bodě x = 2/VŠ, nabývá zde maximální hodnoty. □ 5.96. Je dána elipsa 3x2 +y2 = 2. Napište rovnici tečny, která vytíná v prvním kvadrantu trojúhelník o nejmenším obsahu a určete jeho velikost. Solution. Přímka zadaná rovnicí ax + by + c = 0 má s osami průsečíky [—^,0], [0, — |] a obsah trojúhelníka s vrcholy v těchto 2 bodech a v počátku je 5 = Rovnice tečny v bodě [xT, yT] je 3xxr + yyT —2 = 0. Obsah trojúhelníka určený touto tečnou je tedy S = 3x^yT ■ V prvním kvadrantu přitom máme xT, yT > 0. Minimalizovat tento obsah znamená maximalizovat součin xTyT = 281 F. EXTREMÁLNÍ ÚLOHY 3. DERIVACE xj^jl — 3x\, což je v prvním kvadrantu to samé, jako maximalizovat (xTyT)2 = x2T(2 — 3x2T) = —3(x2T — |)2 + |. Hledané minimum obsahu je tedy vxr = -j=. Tečná má rovnici ^3x + y = 2 a velikost tohoto obsahu je Smin = 2-jp. □ 5.97. Ve čase t = 0 se začaly pohybovat tři body P, Q, R v rovině a to bod P z bodu [—2, 1] směrem (3, 1) rovnoměrnou rychlostí >/lÔ m/s, bod Q z bodu [0, 0] směrem (—1, 1) rovnoměrně zrychleným pohybem se zrychlením 2\/2 m/s2 a bod R z bodu [0, 1] směrem (1,0) rovnoměrnou rychlostí 2 m/s. V jakém čase bude obsah trojúhelníku P Q R minimální? Solution. Rovnice bodů P, Q, R v čase jsou P Q R [-2, 1] + (3, l)ř, [0, 0] + (-l, l)ř\ [0, 1] + (2, 0)ř. Obsah trojúhelníka PQR je určený např. polovinou absolutní hodnoty determinantu, jehož řádky jsou souřadnice vektorů P Q & Q R (viz 1.34). Minimalizujeme tedy determinant: -2 + t t2 -2t t -1 + ŕ2 2ť - t + 2. ±75- Vzhle" Derivace je 6ř2 — 1, extrémy tedy nastávají pro t dem k tomu, že uvažujeme pouze nezáporný čas, vyšetřujeme pouze t = Druhá derivace uvažované funkce je v tomto bodě kladná, funkce obsahu zde tedy nabývá svého lokální minima. Navíc je její hodnota v tomto bodě kladná a menší, než hodnota v bodě 0 (krajní bod intervalu, na kterém hledáme extrém), jedná se tudíž o globální minimum obsahu v čase. □ 5.98. V devět hodin ráno vylezl starý vlk z nory Nav rámci ranní rozcvičky začal běhat proti směru hodinových ručiček po kružnici o poloměru lkm, kolem svého oblíbeného pařezu f a to rovnoměrnou rychlostí 4 km/h. Ve stejnou dobu vyrazila Karkulka z domu D k babičce sídlící v chaloupce C rychlostí 4 km/h (po přímce). Kdy si budou nejblíž a jaká tato vzdálenost bude? Souřadnice (v kilometrech): ./V = [2, 3], P = [2,2], D = [0, 0],C = [5,5]. Solution. Vlk se pohybuje po jednotkové kružnici, jeho úhlová rychlost je tedy stejná jako jeho absolutní rychlost a jeho dráhu můžeme v závislosti na čase popsat následujícími parametrickými rovnicemi: x(t) = 2- cos(4ř), y(t) = 2- sin(4ř), Nyní ale když budeme zmenšovat přírůstek Ax, jde vlastně o výpočet limity součtu součinů a o tom už víme, že jej lze počítat jako součet součinů limit. Proto z naší formulky lze očká vat pro derivaci součinu f g výraz f g' + f g, kterému se říká Leibnizovo pravidlo. Ještě zajímavěji se chová derivace složené funkce g = ho f, kde definiční obor funkce z = h(y) obsahuje obor hodnot funkce y = f (x). Opět vypsáním přírůstků dostáváme , _ Az _ Az Ay S Ax Ay Ax' Můžeme tedy očekávat, že pravidlo pro výpočet bude (hof)'(x)=h'(f(x))f'(x). Podáme nyní korektní formulace a důkaz: J Pravidla pro derivování |_ Theorem. Nechť f a g jsou reálné nebo komplexní funkce definované na okolí bodu xq e M a mající v tomto bodě vlastní derivaci. Potom (1) pro každé reálné nebo komplexní číslo c má funkce x h-» c • f(x) derivaci v platí (cf)'(x0) = c(f'(x0)), (2) funkce f + g má v xq derivaci a platí (f + g)'(xo) = f'(x0) + g'(x0), (3) funkce f ■ g má v xq derivaci a platí (/ • S)'(*o) = f'(x0)g(x0) + /(*o)s'(*o)- (4) Je-li dále h funkce definovaná na okolí obrazu yo = f(xo), která má derivaci v bodě yo, má také složená funkce h o f derivaci v bodě xq a platí (h o /)'(*„) = h'(f(x0)) ■ f'(x0). 1 Proof. (1) a (2) Přímé použití věty o součtech a součinech limit funkcí dává výsledek. (3) Přepíšeme vztah pro podíl přírůstků, který jsme zmínili před formulací věty, takto (fg)(x) - (fg)(x0) .g(x) - g(x0) f(x)- f(x0) . . - = fix)-H--g(x0). X — Xq X — Xq X — Xq Limita tohoto výrazu pro x -> xq dá právě požadovaný výsledek, protože je funkce / spojitá v xq. (4) Podle lematu 5.31 existují funkce ý a 9 spojité v bodech xq a jo = / (*o) takové, že h(y) = h(y0)+(p(y)(y-yQ), f(x) = f(x0)+Ý(x)(x-XQ) na nějakých okolích x0 a y0. Navíc pro ně platí Ý(xo) = f(xo) a cp(yo) = h'(y0). Pak ovšem také platí A(/(*)) - Hf(x0)) = cp(f(x))(f(x) - f(x0)) = /2. Řešit algebraicky rovnici p' (ř) = 0 se nám nepodaří (ani to nelze), zbývá pouze najít řešení numericky (pomocí výpočetního softwaru). Je jasné, že extrémů bude nekonečně mnoho: při každém kolečku je směr pohybu vlka v jistý časový okamžik rovnoběžný se směrem Karkulky, jejich vzdálenost se tedy po jistou dobu snižuje; Karkulka se však neustále vzdaluje konstantní rychlostí od středu kruhu, kolem kterého obíhá vlk. Zjistíme, že první lokální minimum nastává pro t = 0, 31 a poté pro t = 0, 97, kdy bude vzdálenost vlka a Karkulky asi 5 metrů. Je zřejmé, že půjde i o globální minimum. Situace, kdy neumíme explicitně vyřešit daný problém, je v praxi velmi častá a použití numerických metod výpočtu má velký význam. □ 5.99. Halleyova úloha, 1686. Hráč stojí před basketbalovým košem 'íA^y? ve vzdálenosti l od obroučky, která je ve výšce h nad bo-■ZSiWk dem odhodu. Určete minimální počáteční rychlost vq, kterou musí udělit míči, aby skóroval, a příslušný elevační úhel

0. Pozici míče (během jeho letu) vyjádříme body [x(ř), y(t)] pro t e [0, řo], přičemž požadujeme, aby x(0) = 0, y(0) = 0, x(ř0) = l, y(řo) = h. Zřejmě je x' (ř) = vq cos cp, y (ř) = vq sin cp — gt pro t e (0, řo), kde g je normální tíhové zrychlení (konstanta gravitačního zrychlení). Hodnoty x' (ř) a / (ř) totiž po řadě udávají horizontální a vertikální rychlost míče. Integrováním těchto rovnic získáme 1 gt2 + C2 x(ř) = vqí cos cp + ci, yit) = vqí sin cp 2 pro t e (0, řo) a c\, c2 e M. Z počátečních podmínek lim x(ř) = x(0) = 0, lim y(ř) = y(0) = 0 plyne, že ci = c2 = 0. Dosazení zbývajících podmínek 283 F. EXTREMÁLNÍ ÚLOHY 3. DERIVACE lim x(t) = x(t0) = l, t->t0- tak již dává l = VqÍq cos cp, Podle první rovnice je (5.1) ř0 = lim y(t) = y(t0) = h ŕ->ŕ0- h = vqíq sin cp \g) tj- tg>-7ftg

± 2ľQ-_4 00 tj- (5.3) tg

0. Také nyní nám substituce (tentokráte q = v1,) umožní přejít ke kvadratickému výrazu (na levé straně nerovnice) a následně získat (v2-g[h + VF+ř]) (v2-g[h- VF+ř]) >o. Protože h < V/P + P, musí být v2 > h + V/i2 + P Nejmenší přípustné hodnotě (5.4) v0 = potom odpovídá (viz (||5.3||)) tj. v0 h + V/i2 + P h + j h2 + ľ2 (5.5) tg

2h l ■ l l Tím jsme ukázali, že při počáteční rychlosti uvedené v (||5.4||) může hráč koš dát. Při trestném hodu, kdy hráč odhazuje míč ve výšce 2 m, je /i = l,05m, Z = 4, 225 m, g = 9, 80665 m • s"2, a tudíž minimální počáteční rychlost míče činí 9,806 65 m • s 1, 05 + V(l,05)2 + (4, 225)2 7, 28 m-s"1. Této rychlosti odpovídá úhel

0cosřo_ x(t) = x(ř0) = R, limř_>řo_ y(t) = y(ř0) = —h poté R = votocoscp, —h = votosincp Z první rovnice plyne R můžeme nyní snadno odvodit s pomocí vztahu pro derivaci exponenciální funkce a logaritmické funkce: (xay lnxy ln x (a lnx)' = ax1 a-l 5.37. Věty o střední hodnotě. Než se pustíme do dalšího tématu na naší pouti za různorodými definicemi funkcí, odvodíme ještě několik jednoduchých ?2í? výsledků o derivacích. Všechny jsou velice snadno intuitivně jasné z přiložených obrázků a důkazy vlastně jen rozepisují vizuální představu. Theorem. Nechť funkce f : M —> M. je spojitá na konečném uzavřeném intervalu [a,b] a diferencovatelná uvnitř tohoto intervalu. Jestliže platí f (a) = f (b), pak existuje c e (a, b) takové, že f'(c) = 0. popovi* VSTA- Proof. Protože je funkce / spojitá na uzavřeném intervalu (tj. kompaktní množině), má na něm maximum a minimum. Pokud by maximum i minimum mělo stejnou hodnotu f (a) = f(b), pak by funkce / byla konstantní a tedy i její derivace by byla nulová ve všech bodech intervalu (a,b). Předpokládejme tedy, že buď maximum nebo mimimum je jiné. Pak ovšem nastává jedno z nich ve vnitřním bodě c. Kdyby v platilo f'(c) ^ 0, pak by v tomto bodě byla byla funkce / buďrostoucí nebo klesající (viz 5.32) a jistě by tedy v okolí bodu c nabývala větších i menších hodnot, než je f(c). Je tedy nutně f'(c) = 0. □ Právě dokázanému tvrzení se říká Rolleova věta.5 Z ní snadno vyplývá následující důsledek, známý jako La-grangeova věta o střední hodnotě.6 5.38. Theorem. Nechť funkce f : M —> M. je spojitá na intervalu [a, b]a diferencovatelná uvnitř tohoto intervalu. Pak existuje c e (a, b) takové, že f'(c) f(b) - f (a) to VQ cos

Ní' h«j>n0te_ Proof. Důkaz je prostým zápisem geometrického významu tvrzení: k sečně mezi body '^1^ [a, f (a)] a [b, f(b)] existuje tečna, která je s ní rovnoběžná (podívejte se na obrázek). Rovnice naší sečny je y = g(x) = f (a) + -^—^-(x - a). b — a Rozdíl h(x) = f(x) — g(x) udává vzdálenost grafu od sečny (v hodnotách y). Jistě platí h (a) = h(b) a h'(x) = f'(x) f(b) - f (a) b — a Podle předchozí věty existuje bod c, ve kterém je h'(c) = 0. □ Větu o střední hodnotě můžeme také přepsat ve tvaru: (5.9) f(b) = f (a) + f'(c)(b — a). V případě parametricky zadané křivky v rovině, tj. dvojice funkcí y = f (t), x = g (t), je stejný výsledek o existenci rovnoběžné tečny k sečně krajními body popsán ve tvaru tzv. Cauchyovy věty o střední hodnotě: Corollary. Nechťfunkce y = f (t) a x = g (t) jsou spojité na intervalu [a, b] a diferencovatelné uvnitř tohoto intervalu a g'(t) ^ 0pro všechny t € (a, b). Pak existuje bod c e (a, b) takový, že platí f (b) - f (a) = g(b) - g(a) g'(c) ' Proof. Opět spoléháme na použití Rolleovy věty. Položíme proto h(t) = (f (b) - f (a)) g (t) - (g (b) - g (a)) f (t). Nyní h{a) = f (b) g (a) - f (a) g (b), h(b) = f (b) g (a) -f(a)g(b), takže existuje c e (a, b) takový, že h'(c) = 0. Protože je g'(c) ^ 0, dostáváme právě požadovaný vztah. □ a tak můžeme předchozí dvě rovnice vyjádřit jedinou rovnicí gR2 (5.6) h = R tg (p 2vl cos2 cp' přičemž

pCos2cp = 0. Využitím vztahu 2 tg cp cos2 cp = sin 2cp pak (||5.6||) převedeme do tvaru (5.7) Derivování podle cp nyní dává R'(cp)vf)siľi2cp + 2R(cp)vf)cos2cp — 2gR(cp)R'(cp) — 2hv^ (2 cos

QSÍn2

0+ nebo cp -> jt/2— hodnota R zmenšuje) a má derivaci v každém bodě tohoto intervalu, maxima musí nabývat tam, kde je derivace nulová. To znamená, že R(cp) může být maximální pouze tehdy, když je (5.8) R (cp) =htg2cp. Dosaďme proto (||5.8||) do (||5.7||). Získáváme 287 F. EXTREMÁLNÍ ÚLOHY 3. DERIVACE h tg 2

q cos2 cp = gh tg2 2x0 gix) x^x0 í/fix) což je již případ pro použití ĽHospitalova pravidla z předchozí věty. Lze ale i dokázat, že ĽHospitalovo pravidlo platí ve stejné formě pro nevlastní limity: Theorem. Nechť f a g jsou funkce diferencovatelné v okolí bodu xq e M, ne však nutně v bodě xq samotném, a nechť existují limity lirn^^ fix) Jestliže existuje limita pak existuje i limita lim X^-XQ lim = ±00 a limx^X(j gix) = ±00 fix) g'(x) ' /(*) Provedené úvahy a získaný výsledek lze uplatnit také v jiných atletických disciplínách a sportech. Při golfu je třeba h blízké 0, a tudíž právě při úhlu = lim 4 arccos Jh = 4 arccos 0 = t rad = 450 míček dopadne do největší vzdálenosti Uvědomme si, že pro h = 0 nelze náš výpočet použít ( 0, a proto j sme si mohli pomoci příslušnou jednostrannou limitou. □ Další rozličné úlohy na hledání extrémů funkcí jedné proměnné viz 311 G. ĽHospitalovo pravidlo 5.101. Ověřte, že je limita (a) (b) (c) (d) (e) (f) (g) sin (2x) — 2 sin x 0 lim--- typu -; x^o 2ex - x2 -2x -2 0 lnx 00 lim - typu —; x^0+COtgX OO lim (—--) \x — 1 lnx/ typu 00 — 00; x^x0 gix) lim (ln (x — 1) • lnx) typu 0 • 00; x^l + 1 r, lim (cotgx)'"* typu 00 ; (sinxXí2 ^ cos —J typu 0° 289 G. ĽHOSPITALOVO PRAVIDLO 3. DERIVACE Poté ji spočtěte užitím 1'Hospitalova pravidla. Solution. Bezprostředně můžeme potvrdit, že je (a) lim (sin (2x) — 2 sinx) = 0 — 0 = 0, x^O (b) (c) (d) (e) (f) (g) lim (2ex -x2 -2x -2) = 2- 0- 0- 2 = 0; x^O X ' lim lnx = — oo, lim cotgx = +oo; X 1 lim -= +oo, lim -= +oo; x^i+ x — 1 x^i+ lnx lim lnx =0, lim ln (x — 1) = — oo; lim cotgx = +oo, lim - = 0; x^o+ x^o+ lnx sinx 1 lim-= 1, lim — = +oo; x^0 X x^0 Xz 7tX lim cos — = 0, lim lnx =0. x^l— 2 x^l — Případ (a). Aplikování l'Hospitalova pravidla převádí limitu sin (2x) — 2 sin x lim na limitu lim o 2ex - x2 -2x -2 2 cos(2x) — 2 cos x >o 2ex - 2x - 2 která je ovšem typu 0/0. Dalšími dvěma aplikacemi 1'Hospitalova pravidla dostáváme —4 sin (2x) + 2 sinx lim- x^o 2ex - 2 a (výše uvedená limita je opět typu 0/0) — 8 cos (2x) + 2 cos x —8 + 2 lim-=-= —3. x^o 2ex 2 Celkem tak máme (vrátíme se k původní limitě) sin (2x) — 2 sin x lim---= —3. x^o 2ex — x1 — 2x — 2 Dodejme, že opakované užití 1'Hospitalova pravidla v jednom příkladu je běžné. Nadále budeme klást, že se limity podílů derivací získané 1'Hospi-talovým pravidlem přímo rovnají původním limitám podílů. Takto si můžeme počínat, pokud obdržené limity na pravých stranách budou existovat, tj. o platnosti zápisů se vlastně budeme přesvědčovat dodatečně. a jsou si rovny. Proof. Opět lze vyjít z věty o střední hodnotě. Základem je vyjádření podílu tak, abychom dostali do hry derivaci: /(*) _ /(*) /(*) - f(y) g(*) - g(y) g(x) f(x) - f(y) ' g(x) - g(y) ' g(x) kde za y volíme nějaký pevný bod ze zvoleného okolí x0 a x necháme blížit k x0. Protože jsou limity / i g vx0 nekonečné, můžeme jistě předpokládat, že rozdíly hodnot v x a y jsou u obou funkcí při pevném y nenulové. Pomocí věty o střední hodnotě můžeme nyní nahradit prostřední zlomek podílem derivací ve vhodném bodě c mezi x a y a výraz ve zkoumané limitě dostává tvar /(*) 1 g(y) 1 f(y) /(*) f'(c) g'(c) ' kde c závisí na x i y. Při pevném y a x jdoucím k x0 jde první zlomek zjevně k jedničce. Když zároveň budeme y přibližovat k x0, bude se nám druhý zlomek libovolně přesně blížit k limitní hodnotě podílu derivací. □ 5.41. Příklad použití. Vhodnými úpravami sledovaných výrazů lze využít LHospitalova pravidla také na výrazy typu oo — oo, 1°°, 0 • oo apod. Zpravidla jde o prosté přepsání výrazů nebo o využití nějaké hladké funkce, např.{f^y^™ilstf. r r J J J > ť nodjne v drune časti exponenciální. textu, včetně t ti • -i i 'i -i takových jako je Ukážeme si pro ilustraci takového postupu souvislost ar- ZaProcentován itmetického a geometrického průměru z n nezáporných hodnot Xi. Aritmetický průměr x\ H-----V x„ M (xi je speciálním případem tzv. mocninného průměru stupně r: Mr(xu...,xn)=(^±—±*y. Speciální hodnota M~l se nazývá harmonický průměr. Spočtěme si nyní limitní hodnotu Mr pro r jdoucí k nule. Za tímto účelem spočteme limitu pomocí LHospitalova pravidla (jde o výraz 0/0 a derivujeme podle r, zatímco x; jsou při výpočtu konstantní parametry). Následující výpočet, ve kterém užíváme pravidla pro derivování složených funkcí a znalosti hodnot derivace mocninné funkce, musíme číst odzadu. Z existence poslední limity plyne existence předposlední a její hodnota atd. lim ln(Af (Xi r^0 lim r^0 , ■*«)) = x[ inxiH-----\-xrn lnx, _n_ lim ln(i(^ + ...+^)) lnxi + • • • + lnx„ myxi 290 CHAPTER 5. ZŘÍZENÍ ZOO Odtud tedy je přímo vidět, že Případ (b). Tentokráte derivování čitatele a jmenovatele dává lim Af (x\, ..., x„) = íjx\ .. .x„, což je hodnota známá pod názvem geometrický průměr. 4. Mocninné řady 5.42. Jak se počítá e*. Kromě sčítání a násobení už umíme také počítat s limitami posloupností. Podbízí se proto přibližovat nepolynomiální funkce pomocí posloupností spočítatelných hodnot. Když se takto podíváme na funkci ex, hledáme vlastně funkci, jejíž okamžitý přírůstek je v každém bodě roven hodnotě této funkce. To si můžeme dobře představit jako úžasné úročení vkladu se sazbou rovnou okamžité hodnotě. Když budeme roční sazbu úroku realizovat jednou za měsíc, za den, za hodinu atd., budeme pro výnos vkladu x po jednom roce dostávat výsledné hodnoty / X \12 / X \ 365 / x \ 8760 + • (1 + 36š) ' (1 + 876ô) • - Dalo by se tedy tušit, že bude platit: / x\n ex = lim (1 + -) . Zároveň tušíme, že čím jemněji budeme postupovat při úročení, tím vyšší bude výnos, takže by posloupnost čísel na pravé straně měla být rostoucí. Podívejme se tedy podrobně na číselnou posloupnost K)* jejíž limita má být Eulerovo číslo e. Bude se nám přitom hodit velice užitečná Bernoulliova nerovnost. Lemma. Pro každé reálné číslo b > — 1, b ^ 0, a přirozené n>2 platí (1 + b)n > 1 + nb. Proof. Pro n = 2 dostáváme (1 + b)2 = 1 + 2b + b2 > 1 + 2b. Dále postupujeme indukcí za předpokladu b > — 1. Předpokládejme, že tvrzení platí pro nějaké k > 2 a počítejme (1 + b)k+l = (1 + b)k(l + b) > (1 + kb)(l + b) = 1 + (k + l)b + kb2 > 1 + (k + l)b Tvrzení zřejmě platí také pro b = — 1. □ lnx lim -= lim lim sin2 x >0+COtgX x^0+ —J— x^0+ X sin x Poslední limitu umíme snadno určit (dokonce ji známe). Z sinx lim — sinx = 0, lim -= 1 x^0+ x^0+ X plyne výsledek 0 = 0-1. Také jsme mohli znovu použít 1'Hospitalovo pravidlo (nyní pro výraz 0/0) s výsledkem — sin2x —2-sinx-cosx —2-0-1 lim -= lim -=-= 0. ^^0+ X x^0+ 1 1 Případ (c). Pouze převodem na společného jmenovatele x lnx — (x — 1) lim x^l + \x — 1 lnx/ lim >i+ (x — 1) lnx jsme obdrželi typ 0/0. Je xlnx-(x-l) lnx + f - 1 lnx lim - = lim -:-= lim >i+ (x - 1) lnx x^\+ *=± + lnx 1 - - + lnx ' X X Máme podíl 0/0, pro který (opět dle 1'Hospitalova pravidla) platí lim lnx lim . x . ^1+1-1+lnx \ + i 1 + 1 X XL X Návratem k původní limitě zapíšeme výsledek 1 1 lim (JL. - ±) = I. x^i+ \x — 1 lnx / 2 Případ (d). Uvedený výraz převedeme na typ oo/oo (přesněji řečeno, na typ —oo/oo) vytvořením zlomku ln (x - 1) lim ln (x — 1) • lnx x^l + Podle 1'Hospitalova pravidla je ln (x - 1) lim x^l + lim x^l + 1 ln x lim x^l + 1 x-l 1 _ l ln2 x x 1 ln x lim -x ln x x^l+ X 1 Pro tento neurčitý výraz (typu 0/0) lze pokračovat 1'Hospitalovým pravidlem a stanovit lim -x ln2 x lim x^l + -ln2x — 2x lnx • x^l+ X — 1 Případy (e), (f), (g). Protože lim (cotg x) i" * x^0+ (sinx\ *2 - x / 1 lim lim o + o 0. ln(cotg x) ln x lim (cos —) x^i- \ 2 ) ln x lim (ln;c-ln(cos z§-)) 291 G. ĽHOSPITALOVO PRAVIDLO 4. MOCNINNÉ ŘADY postačuje vypočítat limity uvedené v argumentu exponenciální funkce. Pomocí ľHospitalova pravidla a jednoduchých úprav získáváme i -i lim x^0+ In (cotg x) ln x —x lim - x^o+ cos x • sin x typ typ -oo 1 lim cotg x sin2 x ■1 ■1 lim — — *^o+ cos2 x — sin x 1 — 0 ■1; lni lim x^O XL typ 0 lim^L£ x cos x—sin x r2 lim x cos x — smx 0 ty? q lim 2x x^o 2x2 sin x cos x — x sin x — cos x >o 4x sin x + 2x2 cos x lim smx lim >o 4 sin x + 2x cos x — cos x 0 ty? q -i >o 4 cos x + 2 cos x — 2x sin x 4 + 2 — 0 a tudíž lim (cotg x) 'n * lim ^ sin x ^ x2 e s 1 e' 1 Obdobně lze postupovat při určování poslední limity. Platí / 7xx\ lim ) (ln x) • In I cos — I \ 2 / lim lim ln (cos ?y) i ln x typ -oo oo -oo oo sin: i _ i ln2 x x ix x sin x- • In2 * — lim — cos ^ 2 Neboť je tento výraz typu 0/0, mohli bychom pokračovat 1'Hospitalo-vým pravidlem; místo toho ale přejdeme od x sin m?- ■ ln2 x lim k součinu limit lim ^x sin lim cos Ij- ln2x cos ?y 1 • lim ln2x cos ?y Teprve nyní aplikujeme 1'Hospitalovo pravidlo pro 0 lim ln2x *->i- cos z*- typ q 21nx • i lim--r-— (_|) sinf Celkem máme lim (lnx • ln (cos ^pj) =^-1-0 = 0, tj- lim f cos ln x □ Pro dva po sobě jdoucí členy a„ naší posloupnosti můžeme nyní s využitím Bernoulliovy nerovnosti odhadnout jejich podíl i\« + (5±i)» (n2 _ iyn =ri4v—>fi--)—=i. \ n1) n — í \ n/n — l Je tedy naše posloupnost skutečně rostoucí. Následující obdobný výpočet (opět s využitím Bernoulliovy nerovnosti) ověřuje, že posloupnost čísel je klesající a jistě je bn > an. n+2 ->n + \ > n n ín2 + 2n + l\ n + \\n±l) n + \\n2 + 2n ) —ŕi+—r n + 1 V n(n+2)J n í n + 2 \ -I 1 +-1- I = 1- n + 1 V n(n+2)J n+2 Posloupnost an je tedy shora ohraničená a rostoucí a proto je její limita dána jejím supremem. Zároveň vidíme, že je tato limita rovna také limitě klesající posloupnosti b„, protože lim b„ = lim (1 H—)a„ = lim a„. Tato limita proto zadává jedno z nej důležitějších čísel v matematice (vedle nuly, jedničky a Ludolfova čísla jx), Eu-lerovo číslo e. Je tedy e = lim n^-oc K)" 5.43. Mocninná řada pro e*. Exponenciální funkci jsme definovali jako jedinou spojitou funkci splňující /(l) = e a f(x + y) = f(x) ■ f(y). Základ e máme vyjádřen jako limitu posloupnosti čísel a„, nutně ^ tedy je, pro každé pevné reálné číslo x, ex = lim (an)x. Počítejme nyní pro jednoduchost s pevně zvoleným kladným x. Jestliže v hodnotách an z minulého odstavce zaměníme n za n/x, opět dostatneme stejnou limitu (rozmyslete si podrobně) a proto také lim lim 292 CHAPTER 5. ZŘÍZENÍ ZOO Označme n-tý člen této posloupnosti u„ (x) = (l+x/rc)" a vyjádřeme jej pomocí bionomické věty: x n(n — \)x2 n\x" un(x) = l+n- +-—--+ • • • + ——- n L\nL nln" Jí 1 +x + ' (5.10) + + 3! (' " ň) (' " ň) +íif1_iv1_íy.7i-^i) n\ \ n) \ n ) \ n ) Protože jsou všechny závorky v součinech menší než jedna, dostáváme také " 1 in(x) < vn(x) = 2_, —x Ji Pokud se přitom budeme dívat na «„ pro hodně veliká n, budou první sčítance těchto výrazů hodně blízké hodnotám Y^xk. Skutečně pro všechna x platí J Mocninná řada pro ď |» 5.44. Theorem. Exponenciální funkce ex je pro každé x e M vyjádřena jako limita částečných součtů lim^oo vk ve výrazu 1 1 °° 1 ex = 1 + x H--x2 H-----1--x" H----= V — x" . 2! y<\ nl «=o x\f _ ax Funkce ex je diferencovatelná a platí (ex)' = e Proof. Technický důkaz věty je pouze rozpracováním výše uvedené úvahy. Nejprve ukážeme, že formální nekonečný součet má, jakožto limita částečných součtů v„, skutečně smysl, a pak dalším jemným odhadem ukážeme, že skutečně dává požadovanou hodnotu hodnotu liirin^oo un. Uvažme tedy formální nekonečný součet (5.11) oo oo 1 7=0 7=0 ve kterém je vn (x) právě součet prvních n členů. Podíl dvou po sobě jdoucích členů v řadě je /cj = x/(n + 1). Pro každé pevné x tedy existuje N e N takové, žecj+i/cj < 1 /2 pro všechny j > N. Pro takto velká j je ovšem cJ+i < jCj < 2~^~N+l) cN. To ale znamená, že částečné součty prvních n členů v našem formálním součtu jsou shora ohraničeny součty Vn < N-l n-N ^ j\ N\ 7=0 J 7=0 5.102. Jak jsme již impicitně zmínili, použití 1'Hospitalova pravidla může vést k limitě, která neexistuje, ačkoliv původní limita existuje: určete limitu x + sinx lim - x^oo x Solution. Limita je typu ^, použitím 1'Hospitalova pravidla dostáváme x + sinx 1 + cosx lim -= lim -, x=>oo x x^-oc 1 a protože neexistuje limita lirn^oo cosx, neexistuje ani limita Hindoo 1 + cos x. Původní limita ovšem existuje, je totiž x — 1 x + sinx x + 1 - < - < -, a podle věty o třech limitách je x + sin x x + sin x x + 1 1 = lim - < lim - < lim -= 1. x^oo x x^oo x x^oo x □ 5.103. Určete lnx 1 i lim -, lim xln—, lim xe*; x^+oo x jc=>0+ X jc=>0+ lim x e *-, lim , jc=>0 X1UU x^+qo x^0 lim (ln x — x) ; x J/x + 1 lim -, lim —=, __ x^+oo x + lnx • cosx x^+oo ľyx _|_ 3 x^+00 ^jx2 _|_ 1 lim Solution. Snadno lze zjistit (např. n-násobným užitím 1'Hospitalova pravidla), že pro libovolné n e N je x" ex lim — =0, tj. lim — = +00. jc^+oo Qx jc^+oo XH Z Věty o třech limitách potom pro reálná čísla a > 0 ihned plyne zobecnění lim — =0, tj. lim — = +00. jc^+oo Qx jc^+oo Xa Uvážíme-li, že grafy funkcí y = ex a y = lnx (inverzní funkce k y = e*) jsou symetrické vzhledem k přímce y = x, víme dále lnx x lim -= 0, tj. lim - = +00. x^+00 x x^+00 lnx Získali jsme tak první výsledek. Ten přitom dává rovněž 1'Hospi-talovo pravidlo, podle kterého je lnx 7 1 lim -= lim — = lim — = 0. x^+qo X x^+qo 1 x^+qo X 293 G. ĽHOSPITALOVO PRAVIDLO 4. MOCNINNÉ ŘADY Upozorněme, že ľHospitalovo pravidlo lze použít k vyčíslení každé z dalších pěti uvedených limit. Je ovšem možné určit tyto limity jednoduššími způsoby. Např. substituce y = l/x vede na 1 lim x ln — x^o+ x lim x e1 x^0+ ln y lim — = 0; y^+oo y lim — y^+oo y + 00. Samozřejmě x -» 0+ dává y = 1/x —> +oo (píšeme 1/ + 0 = +oo). Pomocí substitucí u = — 1 /x, v = 1 /x2 po řadě dostáváme lim x e x^O- _ J_ e ť1 lim x^O X 100 = lim--= V50 lim — = 0, -oo; přičemž x -» 0— odpovídá u = —1/x -» +oo (píšeme —1/ — 0 = +oo) a x -» 0 potom v = 1 /x2 -» +oo (znovu 1/ + 0 = +oo). Již dříve jsme také objasnili, že platí lim (ln x — x) lim —x x^+oo -oo. Případné pochyby snad rozptýlí limita lnx — x lim x^+oo lnx lim x^>+oc V lnx/ -oo, která dokazuje, že při zmenšení absolutní hodnoty uvažovaného výrazu (aniž by došlo ke změně znaménka) stále výraz v absolutní hodnotě roste nade všechny meze. Stejně snadno umíme určit lim lim x^+oo x + lnx • COSX x^+oo x y/x + 1 Z/x lim w = lim -^= = +oo; x^>+oc 1; Vx + 3 *^+°° sVx lim lim +°° Vx2 + 1 Vx2 1. Viděli jsme, že ľHospitalovo pravidlo nemusí být nejlepší metodou výpočtu limity jednoho z typů 0/0, oo/oo. Na předchozích třech příkladech lze ilustrovat, že jej ani nelze vždy (pro neurčité výrazy) aplikovat. Kdybychom jej použili k řešení prvního z nich, obdrželi bychom pro x > 0 podíl 1 x 1 + ln x • sin x x + cos x — x ln x • sin x který je složitější než původní. Dokonce pro x -» +oo limitu nemá. Není tedy splněn jeden z předpokladů 1'Hospitalova pravidla. Ve Protože pro každé q platí (1 —q) (1 +q +■ ■ ■ +qk) = 1 —q' můžeme hodnoty vn také odhadnout jfc+i ^ 1 . 2 j=0 j' x"(\ _2-»+"-i) Limita výrazů na pravé straně pro n jdoucí do nekonečna proto jistě existuje a tedy existuje i limita rostoucí posloupnosti vn. Nyní si prohlédněme pozorněji posloupnost čísel un, jejíž limitou je e*. Budeme chtít uvažovat n > N pro nějaké pevné N (hodně velké) a. k < N pevné j J' (docela malé) a označíme si u„]k prvních k členů ve 1 'i výrazu (5.10) pro u„. Pro dané x a e > 0, umíme zvolit k tak, aby u„]k + e > un, pro všechna n > k (skutečně, zbylé členy jsou všechny kladné a ještě menší, než ty ve vn, které jsme odhadli výše). Přitom zároveň pro naše pevné k můžeme volbou dostatečně velikého N zařídit, aby pro všechna n > N bylo také unk < vk < unk+e (protože pro pevné k máme ve výrazech pro u„tk jen konečně mnoho závorek a volbou velikého n budou všechny libovolně blízko k jedničce). Celkem tedy pro libovolné e vedou naše volby indexů k a n k odhadu \vk — un\ < e. Když budeme volit posloupnost Ci = l/i, dostaneme takové podposloupnosti vki a uni s hodnotami vzdálnými nejvýše o l/i a proto také lim vk = lim un, což jsme měli dokázat. Podívejme se ještě na derivaci funkce ex v bodě x = 0. Přímo z definice musíme spočít limitu lim x^0 (1+x + ix2 +•••)" 1 lim x^0 x + \x2 + ±x3 + Pro každé pevné i ^0 přitom počítáme s limitním výrazem lim ("lim V — xk~l \ = 1 + lim ("lim V — jc*_1Y x k=l ' x k=2 ' Nyní pro každé e > 0 můžeme najít N tak, aby lililn^oo X/fc=A< li-"1-1 < C Pr° vŠecnna —^ n. Protože je \an+1\ H-----\-\am\ > \an+1 -\-----\-am\, vyplývá z konvergence řady Xitlo \an\ i konvergence řady Zoo k=0 a»- Absolutně konvergentní řady Říkáme, že řada an konverguje absolutně, jestliže konverguje řada Y^=o \a«\- Absolutní konvergenci jsme zavedli, protože se často sgig£ daleko snadněji ověřuje, zároveň ale následující věta ukazuje, že se v případě aboslutně konvergentních řad i jednoduché algebraické operace chovají všechny velice dobře: 5.46. Theorem. Nechť S = X^Lo an a T = X^Lo ^« Jsou dvě absolutně konvergentní řady. Pak (1) jejich součet absolutně konverguje k součtu oo oo oo S + T = ^an + ^bn = ^(an + bn), n—0 n—0 n—0 (2) jejich rozdíl absolutně konverguje k rozdílu T = ^an - ^bn = y^(q„ druhém případě pak (libovolný počet opakovaných) použití 1'Hospi-talova pravidla vede na neurčité výrazy. Pro poslední limitu nás 1'Hos-pitalovo pravidlo vrátí do zadání: dává nejdříve zlomek 1 VxTTT 2x 2*Jx2+l a následně 2x 2V*2 + 1 Odsud můžeme odvodit, že limita je rovna 1 (hledáme nezápornou hodnotu a e M takovou, aby platilo a = a~l), pouze když dříve dokážeme, že vůbec existuje. □ Další příklady na výpočet limit užitím ĽHospitalova pravidla nalezneet na straně 321. H. Nekonečné řady Nekonečné řady se přirozeně vyskytují v celé řadě (problémů). 5.104. Sierpiňského koberec. Jednotkový čtverec se rozdělí na devět shodných čtverců a odstraní se prostřední čtverec. Caždý ze zbývajících čtverců se znovu rozdělí na devět shodných čtverců a v každém z nich se odstraní prostřední čtverec. Určete obsah zbylého obrazce po prodloužení tohoto postupu do nekonečna. Solution. V prvním kroku se odstraní 1 čtverec o obsahu 1 /9. Ve druhém kroku se odstraní 8 čtverců o obsahu 9~2, tj. o celkovém obsahu 8 • 9~2. V každé další iteraci se odstraní osminásobek počtu čtverců z předešlého kroku, přičemž obsah každého z nich je devítinou obsahu jednoho čtverce z předchozího kroku. Součet obsahů všech odstraněných čtverců je lil i »í i 9 * 92 T 93 -T Z8" gn+1 • «=0 Obsah zbylého obrazce (tzv. Sierpiňského koberce) tak činí 1 Z «=0 8" 9/Í+1 i-£Z(§)" = i «=0 0. □ «=0 «=0 «=0 5.105. Kochova vločka, 1904. Vytvořte "sněhovou vločku" následujícím postupem. Na začátku uvažujte rovnostranný trojúhelník s jednotkovou délkou strany. Každou z jeho stran rozdělte na třetiny a nad prostředními třetinami sestrojte rovnostranné trojúhelníky, kdy základny (prostřední třetiny stran původního trojúhelníku) odstraníte. Takto z původního trojúhelníku dostanete šesticípou hvězdu. Celý postup opakujte tak, že každou úsečku obdrženou v předchozím kroku 295 H. NEKONEČNÉ ŘADY 4. MOCNINNÉ ŘADY rozdělíte na třetiny a prostřední třetinu nahradíte za rovnostranný trojúhelník bez základny. Sněhovou vločku pak získáte nekonečným opakováním tohoto postupu. Dokažte, že vzniklý útvar (vločka) má nekonečný obvod. Poté určete jeho obsah. Solution. Obvod původního trojúhelníku je roven 3. V každém kroku konstrukce se prodlouží obvod útvaru o třetinu, neboť ze tří částí každé úsečky vzniknou čtyři stejné délky. Odsud vyplývá, že obvod vločky lze vyjádřit jako limitu d„ = 3 (\)n a lim d„ = +oo. Útvar se zřejmě během konstrukce zvětšuje. Ke stanovení jeho obsahu nám tudíž stačí zachytit, o kolik se jeho obsah zvětší v jednotlivých krocích. Počet jeho stran se v libovolném kroku stává čtyřnásobným (úsečky se rozdělí na třetiny, kdy místo prostřední třetiny máme dvě úsečky), přičemž délka nových stran je třetinová. V následujícím kroku se obsah útvaru zvětší právě o obsahy stejných rovnostranných trojúhelníků, jejichž počet je stejný jako počet úseček v předchozím kroku a jejichž strany mají délku třetin těchto úseček. Když takto přecházíme od rovnostranného trojúhelníku k šesticípé hvězdě při první realizaci uvedeného postupu, obsah se zvětší o 3 rovnostranné trojúhelníky (jejich počet odpovídá počtu stran původního útvaru) s délkou stran 1 /3 (ta je třetinová). Označme obsah původního trojúhelníku jako So- Pokud si uvědomíme, že zmenšením strany rovnostranného trojúhelníku na třetinu se jeho obsah zmenší devětkrát, dostaneme obsah šesticípé hvězdy ve tvaru So + 3-f. Podobně v dalším kroku obdržíme obsah útvaru jako So + 3-f+4-3-|. Počet přidávaných trojúhelníků je čtyřnásobný a délky jejich stran třetinové. Nyní již není obtížné odvodit, že obsah vločky je roven limitě lim (So + 3 • f +4 • 3 • | + • • • +4" • 3 • ^r) = ^(1 + i + H + --- + HÍ)") = So 1 + éä(1 + Í + - + (!)") So 1 + | Hm Z (If :k=0 So k=0 So 3 1_4 So- Obsah vločky je tedy 8/5 obsahu původního trojúhelníka, tj. 8 o ? >->0 4 2 73 5 • Zopakujme, že tato vločka je příkladem toho, jak nekonečně dlouhá křivka může ohraničovat konečnou plochu. □ (3) jejich součin absolutně konverguje k součinu ( ~ \ / ~ \ ~ / " \ S ■ T = I 2_,an I • I 2-a i = 2-i\2-i a»-kbk I • \n=0 / \h=0 / n=0 \k=0 / Proof. První i druhé tvrzení jsou bezprostředním důsledkem obdobných vlastností limit. Třetí tvrzení vyžaduje větší pozornost. Označme si n — ^ @n - C„ — 7 Un-kUk. k=0 Z předpokladů a podle pravidel pro limitu součinu posloupností dostáváme \n=0 / \h=0 / \h=0 / \n=0 / Máme tedy dokázat, že 0= lim k^oo n=0 / \h=0 / n=0 / Porovnejme si nyní výrazy \n=0 / \h=0 / 0k i + i>k +j> 0k 0 1. Při \q\ = 1 může řada konvergovat ale nemusí. (3) Jestliže existuje limita lim pak při q < 1 řada konverguje absolutně, zatímco při q > 1 nekonverguje. Je-li q = 1, může konvergovat i divergovat. Proof. (1) Víme, že existence a případná hodnota limity posloupnosti komplexních čísel je dána pomocí limit posloupností reálných ~_sr a imaginárních složek. První tvrzení tedy stačí dokázat pro posloupnosti reálných čísel. Jestliže rim„^ooút„ neexistuje nebo je nenulová, existuje pro dostatečně malé číslo e > 0 nekonečně mnoho členů ak s \ak\ > e. Zároveň tedy musí mezi nimi existovat nekončené mnoho kladných nebo nekonečně mnoho záporných. Pak ovšem při přidání kteréhokoliv z nich do částečného součtu dostáváme rozdíl dvou po sobě jdoucích s„ a.sn+\ o velikosti alespoň e. Posloupnost částečných součtů proto nemůže být Cauchyovská a tedy ani konvergentní. (2) Protože chceme dokazovat absolutní konvergenci, můžeme rovnou předpokládat, že členy řady jsou reálná čísla at > 0. Důkaz jsme pro speciální hodnotu q = 1/2 provedli při odvození hodnoty ď pomocí řady. Uvažme nyní q < r < 1 pro nějaké reálné r. Z existence limity podílů dovodíme pro všechna j větší než dostatečně veliké /V < r ■ a < r^~N+l) aN. To ale znamená, že částečné součty s„ jsou pro velká n > N shora ohraničeny součty n-N + aN ^ rj 7=0 N 7=0 + 1 - f -N+l 1 7=0 Protože 0 < r < 1, je množina všech částečných součtů shora ohraničená rostoucí posloupnost a proto je její limitou její supremum. Při hodnotě q > r > 1 použijeme obdobný postup, ale z existence limity podílu q hned na začátku odvodíme -U-N+1) aN > 0. > r ■ To ale znamená, že absolutní hodnoty velikostí jednotlivých členů řady nejdou k nule a proto tato řada nemůže konvergovat podle již dokázané části věty. (3) Důkaz je zde velmi podobný předchozímu případu. Z existence limity q < 1 vyplývá, že pro každé q < r < 1 existuje /V takové, že pro všechny n > N platí ^/|a„| < r. Umocněním pak dostáváme \an\ < r" , takže jsme opět 5.106. Sečtěte řadu OO / -> « = 1 OO (b) Z Jr; «=o OO (c) z (42/1-1 + 42^) ' n = l 00 (d) Z f; n = \ 00 (e) S (3« + l)(3«+4)-«=0 Solution. Případ (a). Podle definice je součet řady OO / «=1 ^((7Ť-7l) + (7!-7f) + --- + fe-Ä)) = „1^(1 + (-7! + 7!) + --- + (-* + ^)-vfe) = 1-Případ (b). Zjevně se jedná o pětinásobek konvergentní geometrické řady s kvocientem q = 1/3, a tudíž je Z 3« — 5 Z (3) — 5 • ,1 — 2 Případ (c). Platí (při substituci m = n — 1) 3 00 1 2 00 Z (42^2) + Tě Z ( Z (42H-1 + «=1 42« 4 ^42« « = 1 16) t-i 42m m—0 14 Y1 (J-Y 16 ^ V16/ 16 t-i V42"-2; «=1 14 1 16 1- 14 15 - m=0 * 16 Řadu lineárních kombinací jsme zde vyjádřili jako lineární kombinaci řad (přesněji řečeno, jako součet řad s vytknutím konstant), což je platná úprava, pokud obdržené řady jsou absolutně konvergentní. Případ (d). Z částečného součtu I 1 2. 1 1. 1 3 1 32 1 33 1 + £, n en bezprostředně získáváme Je tedy Sn _ _j_ _i_ _2_ i 3 — 32-1-33-1- Protože lim 3«+l i + -- + -- + 3 i" 32 i" 33 -I- = 0, dostáváme + — n e N. Z é = lim § (s„ «=1 hm Z "^•0oi=i 3* :£(*)' = i fa->) Případ (e). Stačí použít vyjádření (jde o tzv. rozklad na parciální zlomky) 1 11 11 (3« + l)(3«+4) 3 3« + l 3 3«+4 které dává 297 H. NEKONEČNÉ ŘADY 4. MOCNINNÉ ŘADY lim i (1 S (3„ «=0 4 T 4 7 T 7 lim i (1 - 3 V 3«+4^ 1 + l)(3«+4) + + -J___m T 3« + l 3«+4^ □ 5.107. Ověřte, že platí X „2 < X 2»- ř7 —1 ř7—0 Solution. Ihned je vidět, že 1 - -1' 22 ^ 32 < Z 22 — 2' 42 ^ 52 ^ 62 ^ 72 < ^ 42 — 4' resp. obecný odhad 1 i i__j__ (2")2 (2"+1-l)2 ^ (2")2 2 < 2' « 1 TT i n e N. Odsud (porovnáním členů obou řad) dostáváme zadanou nerovnost, z níž mj. plyne absolutní konvergence řady X^Li ^2 ■ Ještě upřesněme, zeje T — — — <2— T — ^ n2 ~ 6 ^ ^ — 2" ■ ř7 —1 ř7—0 □ 5.108. Vyšetřete konvergenci řady 00 V ln*±l. «=1 Solution. Pokusme se uvedenou řadu sečíst. Platí 00 £ ln zlH = Hm(ln2. + ln!+ln! + ...+ln5±i) n = \ , 9, — lim ln (n + 1) = +00. □ «=1 lim in"-4"^+i) Rada tudíž diverguje k +00. 5.109. Prokažte, že řady £ arctg " +2"+3^+4; Z -#±^_ «=0 nekonvergují. Solution. Protože lim arctg "2+2"+31V"+4 = lim arctg ^ JI _i. f-v-i I 1 11_i. f-v-i a lim 3~_ 2_ = l|m % = +00, není splněna nutná podmínka konvergence lim an =0řady^^ an. □ n _ jt_ 2 v situaci, kdy srovnáváme s geometrickou řadou. Důkaz se proto dokončí stejně jako v případě podílového testu. □ V důkazu druhého i třetího tvrzení jsme využívali slabšího tvrzení, než je existence limity. Potřebovali jsme pro studované posloupnosti nezáporných výrazů pouze tvrzení, že od určitého indexu už budou větší nebo menší než dané číslo. K takovému odhadu nám ale postačí pro danou posloupnost bn uvažovat s každým indexem n supremum hodnot členů s indexy vyššími. Tato suprema vždy existují a budou tvořit nerostoucí posloupnost. Její infimum pak označujeme jako limes superior dané posloupnosti a značíme lim sup bn. Výhodou je, že limes superior vždy existuje, můžeme proto předchozí výsledek (aniž bychom měnili důkaz) přeformulovat v silnější podobě: Corollary. Nechť S = y^0 a„ je nekonečná řada reálných nebo komplexních čísel. (1) Je-li q = Hm sup pak řada S konverguje absolutně při q < 1 a nekonver-guje při q > 1. Při q = 1 může řada konvergovat ale nemusí. (2) Je-li q = lim sup \Í\an\, pak při q < 1 řada konverguje absolutně, zatímco při q > 1 diverguje. Je-li q = 1, může konvergovat i divergovat. 5.48. Mocninné řady. Jestliže máme místo posloupnosti _ čísel an k dispozici posloupnost funkcí f„(x) se stejným definičním oborem A, můžeme bod po bodu použít definici "uu/1^ součtu číselné řady a dostáváme pojem součtu řady funkcí S(x) = YJfn(x). «=0 „J Konvergence mocninné řady Jm Mocninná řada je dána výrazem 00 s(x) = y^ ■ «=0 Řekneme, že S(x) má poloměr konvergence p > 0, jestliže S(x) konverguje pro každé x splňující \x\ < p a nekonver-guje při 1*1 > p. | 298 CHAPTER 5. ZŘÍZENÍ ZOO 5.49. Vlastnosti mocninných řad. Ačkoliv na podstatnou část důkazu následující věty si budeme muset počkat až na konec příští kapitoly, zformulujeme si základní vlastnosti mocninných řad hned: Absolutní konvergence a diferencování 5.110. Jaký je součet řady Theorem. Nechť S(x) = Z^lo a„x" je mocninná řada a existuje limita r = lim j/\an\. Pak je poloměr konvergece řady S roven p = r~l. Mocninná řada S(x) konverguje na na celém svém intervalu konvergence absolutně a je na něm spojitá (včetně krajních bodů, pokud v nich konverguje také) a na tomto intervalu existuje její derivace ^2 nanx" 1 n = l Proof. Pro ověření absolutní konvergence řady můžeme pro každou pevnou hodnotu x použít odmocninový test z věty 5.47(3). Počítáme přitom lim ý\anxn | = rx a řada konverguje absolutně, resp. nekonverguje, jestliže je tato limita různá od 1. Odtud plyne, že skutečně konverguje pro \x\ < p a diverguje pro \x\ > p. Tvrzení o spojitosti a derivaci dokážeme později v obecnějším kontextu, viz 6.43-6.45. □ Všimněme si také, že můžeme při důkazu konvergence použít silnější variantu odmocninového testu a tedy lze poloměr konvergence r pro každou mocninnou řadu přímo zadat vztahem r-1 = lim sup \/\an\. 5.50. Poznámky. Pokud koeficienty řady velmi rychle rostou, např. an = n", pak je r = oo, tj. poloměr konvergence je nula. Skutečně taková řada pak konverguje pouze v jediném bodě x = 0. Podíváme se na příklady konvergence mocninných řad S(x) T(x) Z n—0 n — 1 včetně krajních bodů příslušného intervalu. První příklad je geometrická řada, kterou jsme se zabývali již dříve, a její součet je pro všechna x, \x\ < 1, 1 S(x) 1 zatímco \x\ > 1 zaručuje divergenci. Pro x = 1 dostáváme také zjevně divergentní řadu 1 + 1 + 1 + ... s nekonečným Solution. Z nerovností (uvažte graf přirozeného logaritmu) 1 < Inn < n, b>3, /iéN plyne VT < Víňň < iYň, n > 3, n e N. Podle Věty o třech limitách je lim Vinn = 1, tj. lim -=== = 1. «^►00 «^oo v ta n Řada tedy není konvergentní. Neboť má nezáporné členy, musí divergovat k +oo. □ 5.111. Zjistěte, zda řada oo (a) Z (n + l).3» «=0 (b) Z ^ n = l oo (c) y 1 « = 1 konverguje. Solution. Všechny tři uvedené řady mají nezáporné členy, a tak mohou v jednotlivých variantách nastat jen dvě možnosti - součet je konečný, součet je roven +oo. Platí (a) ZöT (« + l)-3" «=0 «=0 n2+l Z(|) 1\" 1 < +oo; (b) Z ^ > Z ^ = Z \ = +oo; n — 1 n — 1 n — 1 oo oo (c) Z —j— > Z 1 = n—\ n—\ Odtud plyne, že řada (a) konverguje; (b) diverguje k +00; (c) diverguje k +00. □ Další zajímavé příklady k číselným řadám naleznete na straně 322. I. Mocninné řady V předchozí podkapitole jsme zkoumali, jestli lze přiřadit smysl součtu nekonečně mnoha čísel. Nyní se budeme zajímat o to, jaký může mít význam součet nekonečně mnoha funkcí. 5.112. Určete poloměr konvergence následujících mocninných řad: 00 i) z ^ «=1 u) z l— xn n = \ (1+0" Solution. 299 I. MOCNINNÉ ŘADY 4. MOCNINNÉ ŘADY i) Podle je 1 lim sup "n+\ Daná mocnina řada tedy konverguje pro reálná x e (—j, j), případně pro komplexní \x\ < j. Všimněme si, že řada je divergentní pro x = j (jde o harmonickou řadu) a naopak konverguje pro x = — j (alternující harmonická řada). Rozhodnout o konvergenci pro libovoné x ležící v komplexní rovině na kružnici o poloměru ^ je těžší otázka a přesahuje rámec našeho kurzu. ii) lim sup 1 (l + 0" lim sup 1 +i V2 2 ' □ 5.113. Určete poloměr konvergence r mocninné řady (a) Ž^«; «=i oo (b) X(-4n)"Jt"; n = l OO 2 (c) Z(i + í)" «=i oo (d) Z «=i Solution. Platí (2+(-i)T (a) lim y\a„ | = lim ^ = ^; «^►00 «^00 v" 0 0 (b) lim VI a« I = lim 4« = +00; (c) lim VKJ = lim (1 + \)n = e; _ fr~5 (d) lim sup VI a« I = lim sup 2 = lim 2+(-l)» "i±x SUP 2+(-l)» ř7^*00 ř7^*00 1. Proto je poloměr konvergence (a) r = 8, (b) r = 0, (c) r = 1/e, (d) r = 1. □ 5.114. Stanovte poloměr konvergence r mocninné řady Ze'" «=1 ^«3+«-3* \?«4+2«3 + 1-jt" (x - 2)". Solution. Poloměr konvergence libovolné mocninné řady se nezmění, pokud posuneme její střed nebo nahradíme koeficienty členů tak, že se nezmění jejich absolutní hodnota. Určeme tedy poloměr konvergence řady Z n = l + 1-JT" Protože lim VF = ( lim V") =1 pro a > 0, součtem, při x = — 1 jde o řadu 1 — 1+1 —... , jejíž částečné součty nemají limitu vůbec, tj. řada osciluje. Věta 5.47(2) ukazuje, že poloměr konvergence druhého příkladu je také jedna, protože existuje lim ř7^*00 n + l x lim ř7^*00 n + 1 1 + 1 + 2 ^ 3 ^ Pro x = 1 tu dostaneme divergentní řadu 1 + protože umíme odhadnout částečné součty tak, že vždy postupně pro k = 1,2,3,..., sečteme 2k~l po sobě jdoucích členů 1/2*-1, ..., 1/(2* — 1) a nahradíme všechny 2~k. Do spodního odhadu tedy každá taková část přispěje 1/2 a odhad tedy roste nad všechny meze. Naopak, řada T(—\) ■1 + + konverguje i když samozřejmě nemůže konvergovat absolutně. Vyplývá to z obecnějšího platného tvrzení, které ukážeme až v příští kapitole. 5.51. Goniometrické funkce. S mocninnými řadami nám do našeho společenství funkcí přibyla spousta nových příkladů hladkých funkcí, tj. funkcí libovolněkrát f diferencovatelných na celém svém definičním oboru. Podobně jako polynomy mají všechny tyto přírůstky do zvěřince navíc vlastnost, že jsou ve skutečnosti zadány vztahem, který definuje funkci C -» C. Skutečně, naše úvahy o absolutní konvergenci jsou bezezbytku platné i pro komplexní číselné řady. Proto mocninné řady budou, po dosazeni komplexních čísel za x, na celém kruhu v komplexní rovině se středem v počátku a poloměrem r představovat konvergentní číselné řady komplexních čísel. Pohřejme si chvíli s nej významnějším příkladem, expo-nenciálou 1 9 1 + x + -x2 + + -r + .... Tato mocninnná řada má poloměr konvergence nekonečný a dobře proto definuje hladkou funkci pro všechna komplexní čísla x. Její hodnoty jsou limitami hodnot (komplexních) polynomů s reálnými koeficienty a každý polynom je zcela určený konečně mnoha svými hodnotami. Zejména tedy jsou hodnoty mocninných řad i v komplexním oboru zcela určeny jejich hodnotami na reálných argumentech x. Proto i pro komplexní exponenciálu musí platit i obvyklé vztahy, které jsme pro reálné hodnoty proměnné x již odvodili. Zejména tedy platí viz vztah (5.5) a věta 5.46(3). Dosaďme si hodnoty x kde i e C je imaginární jednotka, t e M libovolné. 1 + it 1 1 i—ť 3! 1 1 H--ť + i—ť 4! 5! 300 CHAPTER 5. ZŘÍZENÍ ZOO a zjevně tedy je komplexně konjugované číslo k z = e" číslo e . Proto z ■ z 1 a všechny hodnoty z = &" leží na jednotkové kružnici v komplexní rovině. Reálné a imaginární složky bodů na jednotkové kružnici jsme popisovali pomocí goniometrických funkcí cos 6 a sin 6, kde 6 je patřičný úhel. Derivací parametrického popisu bodů kružnice, í h> e" dostáváme vektory "rychlostí", které budou dány výrazem (pokud zatím nevěříme derivování mocninných řad člen po členu, lze také zderivovat zvlášť reálnou a imaginární složku) ŕ h-» {&")' = i ■ e" a jejich velikost proto také bude pořád jednotková. Odtud lze tušit, že celou kružnici oběhneme po dosažení hodnoty parametru rovného délce oblouku, tj. 2it (k pořádné definici délky křivky budeme potřebovat integrální počet, pak toto tvrzení ověříme). Tímto postupem můžeme definovat tzv. Ludolfovo číslo9 it — je to délka poloviny jednotkové kružnice v euklidovském M2. Můžeme se ale nyní aspoň částečně ujistit pohledem na nej menší kladné kořeny reálné části částečných součtů naší řady, tj. příslušných polynomů. Již při řádu deset nám vyjde číslo jt přesně na 5 desetinných míst. Dostáváme tedy přímou definici goniometrických funkcí pomocí mocninných řad: cos t = re e 1 i - -t2 + —ŕ--ŕ + 2 4! 6! 1 t2k + ... sin t = im e ••• + (-1)* (2k) 1 3 1 5 1 7 —r H--ť--ť + 3! 5! 7! 1 (2k + 1)! P+1 + ... můžeme dále přejít k řadě Z 4*" H = l se stejným poloměrem konvergence r = jv/3. □ 5.115. Napište mocninnou řadu se středem v počátku, jejíž součet je na intervalu (—3,3) funkce x2-x-W Solution. Neboť i -12 (x-4)(x+3) 7 \x-4 x+3) J- - _J_ - _1 ( x-4 1-| 4 ^ l + f + i2+--- + ^ + x+3 l-(-f) dostáváme H1-f + í + - + í# + x2-x-l2 J_ x^___L V {~x)" "28 ^ 4" 21 ^ 3" «=0 «=0 «=0 v (-1)"+ 21-3" •)• -±-\xn 28-4") ■ □ 5.116. Nalezněte přibližnou hodnotu čísla sin 1° s chybou ostře menší než 10~10. Solution. Víme, že je sin x 3! x3 5! x5 7! X' Dosadíme-li x = 77/180, pak částečné součty řady vpravo budou aproximacemi sin 1°. Zbývá určit počet členů, které je třeba sečíst, aby chyba byla prokazatelně menší než 10~10. Číselná řada _jľ___i_ (jl_Ý 1 _L (Ji-)5__L (jl.Ý _i_ — V ( 71 \2n+1 180 3! V180/ 5! V180/ 7! V 180/ 2-, (2n + l)\ V180/ «=0 je alternující s vlastností, že posloupnost absolutních hodnot jejích členů je klesající. Pokud libovolnou takovou konvergentní řadu nahradíme jejím částečným součtem, chyba, jíž se tím dopustíme, bude menší než absolutní hodnota prvního členu uvažované řady nezahrnutého do částečného součtu. (Důkaz tohoto tvrzení uvádět nebudeme.) Chyba aproximace sin ľ 1 ^7 «=0 (-1)" v2« + l 1)! Z (2„ ■ X x e 180 1803-3! je tak menší než 1805-5! < 10 -10 9Číslo udávající poměr mezi průměrem a obvodem používaly už Babyloňané a Řekové ve starověku. Označení Ludolfovo číslo je 5nj Určete poloměr konvergence r mocninné řady odvozeno od jména německého matematika Ludolfa van Ceulena, který Archimedovým postupem aproximace pomocí pravidelných mnohoúhel- ^ 22n ■»! niku spočetl ji na 35 platných desetinných míst již v 16. století. n_0 ^2"^! □ 301 I. MOCNINNÉ ŘADY 4. MOCNINNÉ ŘADY 5.118. Stanovte poloměr konvergence pro ZÍ^Li 2^" x". 5.119. Bez počítání uveďte poloměr konvergence mocninné řady Z n = l 5 « — 1 n-3"-1 A 5.120. Nalezněte obor konvergence mocninné řady Z n = l Jn + l n 3V« 5.121. Určete, pro jaká x e M řada Z «=1 (-3)" v/«4+2«3 + lll (x - 2)" konverguje. 5.122. Je pro libovolnou posloupnost reálných čísel {fl«}^0 poloměr konvergence mocninných řad oo oo ř7—0 ř7 —1 stejný? 5.123. Rozhodněte o platnosti implikací: (a) Pokud existuje vlastní limita lim ^/ô2, pak mocninná řada oo Z an(x — X0)" « = 1 konverguje absolutně alespoň ve dvou různých bodech x. (b) Z neabsolutní konvergence řad Z^Li a«' Z^Li ^« plyne> ze rovněž řada Z^Li(6a« — 5bn) konverguje. (c) Jestliže pro číselnou řadu Z^Lo a» Je lim a\ = 0, pak tato řada konverguje. (d) Pokud řada Z^Li an konverguje, potom řada oo ZOn n « = 1 konverguje absolutně. 5.124. Určete cos ^ s chybou menší než 10~5. 5.125. Pro konvergentní řadu oo (-1)" «=o Tří+100 odhadněte chybu aproximace jejího součtu částečným součtem s9 999- 5.126. Funkci y = ex definovanou na celé reálné přímce vyjádřete jako nekonečný polynom se členy tvaru an(x — 1)" a funkci y = 2X definovanou na M vyjádřete jako nekonečný polynom se členy anx" . 5.127. Nalezněte funkci /, k níž pro x e M konverguje posloupnost funkcí fn(x) n2x2 + l ' n en. Si Ilustraci konvergence řady pro funkci cos je vidět na dalším obrázku. Jde o graf příslušného polynomu stupně 68. Při postupném vykreslení částečných součtů je vidět, že aproximace v okolí nuly je velice dobrá a prakticky beze změn. S rostoucím řádem se pak zlepšuje i dále od počátku. Přímo z definice vyplývá známý vztah e" e lt = sin21 + cos2 t = 1 a také z derivace (e")' = i e" vidíme, že (sin t)' = cos ř, (cos t)' = — sin t. Tento výsledek lze samozřejmě ověřit přímo derivací našich řad člen po členu. Označme ř0 nejmenší kladné číslo, pro které je = — tj. první kladný nulový bod funkce cos t. Podle naší definice Ludolfova čísla je ř0 = \ti . Pak kvadrát této hodnoty je e i2t0 -i2t0 (Q-itof a jde tedy o nulový bod funkce sin t. Samozřejmě přitom platí pro libovolné t J(4kt0+i) (ei">)4k ■ él = 1 • é Jsou tedy obě goniometrické funkce sin a cos periodické s periodou 2n. Z našich definic je přitom vidět, že je to nejmenší jejich perioda. Nyní můžeme snadno odvodit všechny obvyklé vztahy mezi goniometrickými funkcemi. Uvedeme na ukázku několik z nich. Nejprve si všimněme, že definice vlastně říká (5.12) (5.13) cosi = -(é' +e '') 2 siní = — (eíř -e"íř). 2i ' 302 CHAPTER 5. ZŘÍZENÍ ZOO Součin těchto funkcí jde tedy vyjádřit jako siní cos t = — (e'' - e-iř)(eiř + e~u) 4i = —(ei2t-e-i2t) = isin2ř. 4i 2 Dále můžeme využít naši znalost derivací: cos 2t = (- sin 2t)' = (sin t cos t)' = cos21 — sin21. Vlastnosti dalších goniometrických funkcí sin t tg ŕ cos t cotgř = (tgř)" se snadno odvodí z jejich definice a pravidel pro derivování. Grafy funkcí sinus, cosinus, tangens a cotangens jsou na obrázcích (postupně červený a zelený vlevo, červený a zelený vpravo): A A 1y \ í \ 0,5 iq / -5 1 1 5 1 no l 1 1 "°'T V V! Cyklometrické funkce jsou inverzní ke goniometrickým. Protože jsou goniometrické funkce všechny periodické s periodou 2jt, jsou jejich inverze definované vždy jen v rámci jedné periody a to ještě jen na části, kdy je daná funkce buď rostoucí nebo klesající. Jsou to funkce arcsin = sin-1 s definičním oborem [—1, 1] a oborem hodnot [—jt/2, jv/2]. Dále arccos = cos-1 s definičním oborem [—1, 1] a oborem hodnot [0, 7t], viz obrázek vlevo. Zbývají ještě funkce (zobrazené na obrázku vpravo) arctg = tg"1 Je tato konvergence stejnoměrná na R? 5.128. Konverguje řada _n_ «4. « = 1 n4+x2 ' kde x e stejnoměrně na celé reálné ose? 5.129. Odhadněte (a) kosinus deseti stupňů s přesností alespoň 10~5; (b) určitý integrál JQ1/2 ^-j- s přesností alespoň 10~3. 5.130. Určete mocninný rozvoj se středem v bodě x0 = 0 funkce X f{x) = jé1 dt, x € R. o 5.131. Užitím integrálního kritéria nalezněte hodnoty a > 0, pro které řada oo y - « = 1 konverguje. 5.132. Určete, pro která x e M konverguje řada oo ^ y_\_x3„ ^ 2" • n ■ ln(«) 5.133. Určete všechna x e R, pro která konverguje mocninná řada oo x x^_ Ľ «2 ■ i=\ 5.134. Pro jaká x e M řada Zln(ř?!) nx « = 1 konverguje? 5.135. Rozhodněte, zda řada oo «=1 konverguje absolutně, příp. relativně, nebo zda diverguje k +oo, resp. k — oo, či nic z toho (říkáme, že osciluje). 5.136. Stanovte součet číselné řady oo y — n.J,n « = 1 pomocí součtu vhodné mocninné řady. 5.137. Prox e (-1, 1) sečtěte x - 4x2 + 9x3 - 16x4 H---- 5.138. Je-li | x | < 1, určete součet řady oo (a) Z x2-1; n = \ (b) z«2* «=1 303 J. PŘÍRŮSTKY DO ZOO 4. MOCNINNÉ ŘADY 5.139. Spočtěte Z n = l 2n-l (-2)"-' pomocí součtu mocninné řady Z(-l)" (2n + l)x n=0 2n pro jisté x e (—1, 1). 5.140. Pro x e M sečtěte řadu 1 Jin + l y -J_x 2"-«! «=0 J. Přírůstky do ZOO 5.141. Stanovte maximální podmnožinu M, kde může být funkce y = arctg (x21 + sinx) s(^č-21 +cos x 256x 2+jc2 definována. 5.142. Napište maximální definiční obor funkce _ arccos (ln x) y ~ Vx2-1 ' 5.143. U vedle definiční obor, obor hodnot a inverzní funkci funkce „ _ x-l 2-3x ' 5.144. Je funkce (a) y (b) y (c) y (d) y (e) y (f) y (g) y (h) y cos x . r3 > COS X i 1 . v3 ' COS x . r4 > COS X i 1 . r4 t -l, sin x + tg I; ln |±£; 1— x ' sinhx = ^—^ coshx cos x . r3 > COS X i 1 . r3 "I- -l, COS x . r4 , COS X i 1 . r4 t r, s maximálním definičním oborem lichá? 5.145. Je funkce (a) y (b) y (c) y (d) y (e) y (f) y (g) y (h) y s maximálním definičním oborem sudá? 5.146. Rozhodněte, zdaje funkce sin x + tg I ln j±i; 1— X ' sinhx = — coshx = — X . s definičním oborem M a oborem hodnot (—it/2, it/2) a konečně arccotg = cotg-1 s definičním oborem M a oborem hodnot (0, 7t). Velice často se také využívají tzv. hyperbolické funkce sinhx = -(e* 2y c), coshx = -(ex +e x). 2 Název naznačuje, že by funkce mohly mít něco společného s hyperbolou. Přímý výpočet dává (druhé mocniny se v roznásobených dvojčlenech všechny odečtou a zůstanou smíšené členy) (coshx) — (sinhx) 2-(ex e~x) 2y ' 1. Body [cosh ř, sinh ř] tedy skutečně parametricky popisují hyperbolu v rovině. Pro hyperbolické funkce lze snadno odvodit podobné identity jako pro funkce goniometrické. Mimo jiné je přímo z definice snadno vidět (dosazením do vztahů (5.12) a (5.13)) coshx = cos(z'x), i sinhx = sin(z'x). 5.52. Poznámky. (1) Jestliže mocninnou řadu 5(x) vyjádříme s posunutou hodnotou proměnné x o konstantní posuv x0, dostaneme funkci T(x) = S(x — x0). Jestliže je p poloměr konveregence 5, bude T dobře definovaná na intervalu (xq — p, xq + p). Říkáme, že T je mocninná řada se středem v xq. Mocninné řady proto můžeme přímo definovat takto: 5(x) = ^ an (x - x0)", «=o kde x0 je libovolné pevně zvolené reálné číslo. Všechny naše předchozí úvahy jsou pořád platné, jen je třeba mít na paměti, že se vztahují k bodu x0. Zejména tedy taková řada konverguje na intervalu (x0 — p, x0 + p), kde p je její poloměr konvergence. Dále platí, že má-li mocninná řada y = T (x) hodnoty v intervalu, kde je dobře definována řada 5(y), potom i hodnoty funkce S o T jsou vyjádřeny mocninnou řadou, kterou dostaneme formálním dosazením y = T (x) za y do 5(y). (2) Jakmile máme k dispozici mocninné řady s obecným středem, lze docela přímočaře počítat koeficienty mocninných řad zadávajících inverzní funkce. Nebudeme zde uvádět seznam formulí, snadno se k nim dostaneme například v Maplu procedurou "series". Pro ilustraci se podívejme alespoň na dva příklady: Viděli jsme, že 1 1 , 1 1 + x + -x2 + - 2 6 24 Protože je e° = 1, budeme hledat pro inverzní funkci ln x mocninnou řadu se středem v x = 1, tj. lnx = ao+ai(x—\)+a2(x—\)2+as(x—\Ý+a4(x—\)4+.... 304 CHAPTER 5. ZŘÍZENÍ ZOO Využijeme tedy rovnosti x = e = ln(e*) a přeskupením koeficientů podle mocnin x po dosazení příslušných řad dostaneme: / 1 2 1 3 1 4 \ x = au + fli I x -\—x -\—x H--x + ... I 0 V 2 6 24 / ŕ 1 2 Y / 1 2 Y + a2lx + -x + ... I + a3\x + -x + +... = a0 + flix + + a^jx2 + +a2 + a3^ í 1 ŕ1 2\ 3 \ 4 +124«! +14 + g Y1 + 2a3+a4r + " " Porovnáním koeficientů u stejných mocnin nalevo a napravo 1 1 1 .- a3 = -, a4 = --,... což skutečně odpovídá platnému výrazu (ověříme později): ao = 0, «1 = 1, a2 In x 00 t « = 1 Podobně si můžeme pohrát s řadou 1 3 1 j 1 7 smí = t--ť H--ť--ť + ... 3! 5! 7! a zatím neznámou řadou pro její inverzi (všimněme si, že počítáme opět se středem v nule, protože je sinO = 0) arcsint = a0 + a\t + a2t2 + a3ř + a4r + .... Opět dosazením dostáváme t = a0 + ax - ^ř3 + j^ř + ...^ + / 1 3 1 5 V a2\t--ť H--ť + ... ) + ... V 3! 5! / ao + a\t + a2r + ^— — a\ + a3^t3+ ( 2 \4 / 1 3 \ I--a2 + a4\t + I -fli--a3 + a* \ť + ... V 6 7 V120 6 / a proto 1 3 3 5 arcsmř = t + -r H--r +____ 6 40 (3) Všimněme si také, že kdybychom hned zpočátku uvěřili, že funkci ex můžeme napsat jako mocninnou řadu se středem v nule a že se mocninné řady derivují člen po členu, pak bychom snadno obrdrželi diferenční rovnici pro koeficienty an. Víme totiž (x"+1)' = (n + l)x", a proto z našeho požadavku, že exponenciála má mít v každém bodě derivaci rovnou své hodnotě, vyplývá an + l = a0 = 1 a odtud už je jasné, že a„ = ^. (a) y (b) y (c) y (d) y (e) y sin x ■ In I x I; arccotgx; x8 - V3x6 + 3x2 - 6; COS (jt tgx+x x); 3+7 cos x s maximálním definičním oborem lichá, sudá. 5.147. Je funkce (a) y = ln (cos x) ; (b) j = tg (3x) + 2 sin (6x) s maximálním definičním oborem periodická? 5.148. Nakreslete grafy funkcí /(x)=e|x|, iěM; g(x) = ln|x| \{0}. 5.149. Načrtněte graf funkce y=2~ x e 5.150. Hyperbolickými funkcemi rozumíme sinhx = Ě% ~e x, x e M; coshx tghx 2 ^ ' "uim'v 2 sinhx v _ m). v coshx X G cotgh x -, x € K; x el\{0). cosh x ' ' ^ sinh x ' Stanovte derivace těchto funkcí na jejich definičních oborech. 5.151. V libovolném bodě x e M vypočítejte derivaci argumentu hyperbolického sinu, tj. derivaci inverzní funkce (značené jako argsinh) k funkci y = sinh x na M. Remark.Inverzní funkce k hyperbolickým funkcím y = cosh x, x e [0, +oo), y = tghx, x e M a y = cotghx, x e (—oo, 0) U (0, +oo) se nazývají hyperbolometrické (řadíme k nim rovněž y = argsinh x). Označují se po řadě argcosh, argtgh, argcotgh (čteme argument hyperbolického kosinu, argument hyperbolického tangens, argument hyperbolického kotangens) a j sou definovány pro x e [1, +oo),x e (—1, 1), resp. x e (—oo, —1) U (1, +oo). Dodejme, že platí (argcosh x)' (argtgh x)' : (argcotgh x)' : x2-l ' 1 1-JC2' 1 1-JC2 ' X > 1, |x| < 1, Ixl > 1. 5.152. Sečtěte: 2 12 12 2 + 1 H---1---1---1---1---h 2! 3! 4! 5! 6! Solution. Porovnáme-li tvar součtu s rozvojem funkcí sinh a cosh do mocninných řad, dostáváme výsledek sinh(l) +2cosh(l). 305 J. PŘÍRŮSTKY DO ZOO_4. MOCNINNÉ RADY □ 306 CHAPTER 5. ZŘÍZENÍ ZOO K. Doplňující příklady k celé kapitole 5.153. Určete polynom P(x) co nejmenšího stupně splňující podmínky P(l) = 1, P(2) = 28, P(0) = 2, P'(0) = 1, P'(l) = 9. 5.154. Určete polynom P(x) co nejmenšího stupně splňující podmínky P(0) = 0, P(l) = 4, P(-l) = -2, /"(O) = 1, P'(l) = 7. 5.155. Určete polynom P(x) co nejmenšího stupně splňující podmínky P(0) = —1, P(l) = —1, = 10, P'(0) = -1, P'(l) = 6. 5.156. Z definice limity dokažte, že je lim (x3 - 2) = -2. 5.157. Z definice limity určete (l+x)2-3 lim -, *->-i 2 tj. napište á(e)-předpis jako v minulém příkladu. 5.158. Ukažte z definice limity, že ,. 3 (x - 2)4 lim -= +oo. 5.159. Určete obě jednostranné limity lim arctg —, lim arctg —. x^0+ X x^O- X Na základě výsledku rozhodněte o existenci limity 1 lim arctg —. x^O X 5.160. Existuje některá z limit sinx 5x4 + 1 lim——, lim-? x^O X3 x^O X 5.161. Vypočtěte limitu tg x — sin x lim-t- x^o sin x 5.162. Určete 2 sin3 x + 7 sin2 x + 2 sin x — 3 lim -t---. x^jt/6 2 sin x + 3 sin x — 8 sinx + 3 5.163. Pro libovolné m, n e N určete i™ - 1 lim -. x^l X" - 1 307 K. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 4. MOCNINNÉ ŘADY 5.164. Určete lim (V x2 + x — x) 5.165. Stanovte lim (x \/l +x2 - x2) 5.166. Vypočítejte 5.167. Určete 5.168. Spočtěte ,. V2- vr + cos x lim — x^o sin2 a' sin (4x) lim >o Vx + 1 - l VI +tgx - VI - tgx lim - x^o- siní 5.169. Stanovte 2X + Vl +x2 -x9 - 7x5 + 44x2 lim - :-. 3* + V6x6 + ji2 - 18x5 - 592a4 5.170. Nechť lim^-oo f(x) = 0. Je pravda, že lirn,_oo (/(x) • g(x)) = 0 pro každou rostoucí funkci g : M -» M? 5.171. Určete limitu )2«-l 5. i 72. Spočítejte sinx — x lim---. *->■()- XJ 5.173. Pro x > e určete znaménko derivace funkce /(*) = arctg 5. i 74. Stanovte všechna lokální maxima a minima funkce y = x ln2 X definované na intervalu (0, +oo). 5.175. Existuje aeI, pro které má funkce y = ax + sinx v bodě x0 = 57r/4 absolutní minimum na intervalu [0, 2n]l 5.176. Nalezněte absolutní minimální hodnotu, jež v nějakém bodě svého definičního oboru nabývá funkce 308 CHAPTER 5. ZŘÍZENÍ ZOO y = ex — lnx, x > 0. 5.177. Určete maximální hodnotu funkce y = VŠxe~x, x e R. 5.178. Stanovte absolutní extrémy polynomu p(x) = x3 — 3x + 2 na intervalu [—3, 2]. 5.179. Nechť je uražená vzdálenost (v metrech) hmotného tělesa popsána funkcí s(ř) = -(ř - 3)2 + 16, f e [0,7], kde t je čas v sekundách. Stanovte (a) počáteční (tj. v čase t = Os) rychlost tělesa; (b) čas a polohu, ve kterých má těleso nulovou rychlost; (c) rychlost a zrychlení tělesa v čase t = 4 s. Doplňme, že rychlost je derivace dráhy a zrychlení je derivace rychlosti. 5.180. Z definice derivace /' funkce / v bodě xo spočtěte /' pro f(x) = ^fx v libovolném bodě x0 > 0. 5.181. Rozhodněte o existenci derivace funkce f(x) = xarctg i, ieK\{0), /(O) = 0 v bodě x0 = 0. 5.182. Má funkce y = sin ^arctg ^| 12x21 + 11 | • ^j^^ ^ + sin(sin(sin(sinx))), x e M derivaci v bodě x0 = jv3 + 371? 5.183. Zjistěte, jestli má funkce f(x) = (x2 - l)sin^, /(-1)=0 derivaci v bodě x0 = — 1. 5.184. Udejte přiklad funkce / : R -> R, která je spojitá na celé reálné ose, ale v bodech x\ = 5, x2 = 9 nemá derivaci. 5.185. Uvedte funkce / a g, které nemají derivaci v žádném reálném bodě, ale jejich kompozice / og má derivaci na celé reálné přímce. 5.186. Pomocí základních vzorců spočtěte derivaci funkce (a) y = (2 — x2) cosx + 2x sinx, x e R; (b) y = sin (sinx) , x e M; (c) y = sin (ln (x3 + 2x)) , x e (0, +oo); (d) v = |±f^, xeR. 5.187. Libovolným způsobem určete derivaci funkce (a) y = sjx s]x Jx^, x e (0, +oo); (b) y = ln |tg || , x e R \ {njt; n e Z}. 5.188. Napište derivaci funkce y = sin (sin (sinx)), x e R. 309 K. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 4. MOCNINNÉ ŘADY 5.189. Pro funkci f(x) = arccos ^+ -v/x3" s největším možným definičním oborem vypočítejte /' na maximální podmnožině reálných čísel, kde tato derivace existuje. 5.190. V libovolném bodě x £ {njt; n e Z} určete první derivaci funkce y = vsinx. 5.191. Pro x e M derivujte výraz xVl +x2 + ď (x2 -2x +2). 5.192. Vyčíslete/'(l), je-li f(x) = (x - l)(x - 2)2(x - 3)3, x e R. 5.193. Stanovte derivaci funkce y = -fiS> |x|^l(xeM). 5.194. Derivujte (v reálné proměnné x) x ln2 (x + Vl +x2^j - 2y/l + x2 ln (x + Vl + x2) + 2x všude, kde derivace existuje. Obdržený výraz zjednodušte. 5.195. Určete /' na maximální množině, jestliže f(x) = \ogx e. 5.196. Vyjádřete derivaci součinu čtyř funkcí [f(x)g(x)h(x)k(x)] ' ve tvaru součtu součinů daných funkcí či jejich derivací za předpokladu, že všechny tyto funkce mají derivaci. 5.197. U vedle derivaci funkce _ x3 (x + l)2jx~+2 y (x+3)2 pro x > 0. 5.198. Vrtulník dálniční hlídky letí 3 km nad rovnou silnicí rychlostí 120 km/h. Pilot zaměří radarem auto jedoucí proti směru letu vrtulníku a naměří, že auto se při vzdušné vzdálenosti 5 km od vrtulníku k němu přibližuje rychlostí 160 km/h. Spočítejte rychlost auta (vůči předmětu pohozenému na vozovce). Solution. Pro jednoduchost budeme v celém příkladu vynechávat fyzikální jednotky, a to kilometry pro dráhu a hodiny pro čas (rychlost tedy bude v km/h). Pozici vrtulníku v čase t vyjádřeme bodem [y(r), 3] a auta potom bodem [x(ř), 0]; tj. 1 jednotka na osách odpovídá 1 km a současně osy volíme tak, aby „auto jelo po ose x". Jako s(r) označme vzdušnou vzdálenost vrtulníku od auta a jako ř0 ten časový okamžik, ze kterého jsou údaje v zadání. Spočtěme rychlost auta vzhledem k předmětu umístěnému do počátku soustavy souřadnic. Můžeme předpokládat, že x(ř) > y(r) > 0. Za tohoto předpokladu je x' (ř) < 0, / (ř) > 0 pro uvažovaná t. Auto se totiž blíží k bodu [0, 0] zprava -hodnota x(ř) se zmenšuje pro zvětšující se ř, a tudíž x' (ř) < 0. Podobně dostáváme / (ř) > 0 a také s' (ř) < 0. Ještě dodejme, že např. / (ř) udává, jak rychle se mění funkce y v čase ř, tedy rychlost vrtulníku. Víme, že je s (t0) = 5, s' (t0) = -160, y (to) = 120 310 CHAPTER 5. ZŘÍZENÍ ZOO a že platí (s(t) je přepona pravoúhlého trojúhelníku) (5.9) (x(ř)-y(ř)) 2 + 32 = /(ř). Odtud plyne (x(t) > y(t) > 0) (x (t0) - y (k))2 + 32 = 52, tj. x (t0) - y (t0) = 4. Derivováním identity (||5.9||) získáváme 2(x(t)-y(t)) (x' (t) - y (t)) =2s(t)s'(t) a následně pro t = t0 2 • 4 (jť (f0) - 120) = 2-5-(-160), tj. x' (t0) = -80. Vypočítali jsme, že auto se blíží k předmětu na vozovce rychlostí 80 km/h. Stačí si uvědomit, s jakými jednotkami jsme pracovali. To, že jsme jako výsledek obdrželi zápornou hodnotu, je pak zapříčiněno naší volbou souřadnicového umístění. □ 5.199. Pro jaká a e M je kubický polynom P vyhovující vztahům P(0) = 1, P'(0) = 1, P(l) = 2a + 2, P'(l) = 5a + 1, monotónní funkcí na celém M? Solution. Z podmínek P (0) = 1 a P' (0) = 1 plyne, že P (x) = bx3 +cx2 +x+l,kdeb, cěM, zbylé dvě podmínky určují dvě rovnice pro neznámé b a c: b+c+2 = 2a+2, 3b+2c+l = 5a+l s jediným řešeními = c = a,polynomy vyhovující zadaným vztahům jsou tedy tvaru P(x) = ax3 +ax2 +x+l, a e M. Podmínka na to, aby byl monotónní funkcí na celém M, je ekvivalentní tomu, že polynom nemá lokální extrém. Extrémy mohou nastat v kritických bodech, tedy v bodech, kde jeho derivace mění znaménko. Pokud tedy derivace nebude na celém M měnit znaménko, funkce bude monotónní. Derivace je P'(x) = 3ax2 +2ax + 1 a nebude měnit znaménko, bude-li její diskriminant nekladný. Dostáváme tedy podmínku 4a2 -12a < 0 4a(a -3) < 0, což odpovídá a e [0, 3]. Pro a = 0 však P sice je monotónní funkcí, nikoliv však kubickým polynomem. Dané podmínky splňují právě a e (0, 3]. □ 5.200. Regiomontanův problém, 1471. V muzeu na stěně visí obraz. Jeho dolní okraj je a metrů nad zemí a horní okraj pak b metrů nad zemí (tj. výška obrazu je b — a). Na obraz se dívá turista, jehož oči jsou ve výšce h < a metrů nad zemí. (Důvodem nerovnosti h < a může např. být, že se tak dá umožnit výhled stejně vysokým návštěvníkům muzea stojícím v několika řadách.) Jak daleko od stěny má turista stát, aby maximalizoval velikost svého úhlu pohledu na obraz? 311 K. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 4. MOCNINNÉ ŘADY Solution. Jako x označme vzdálenost (v metrech) turisty od stěny a jako cp jeho úhel pohledu na obraz. Dále zaveďme (viz obrázek) úhly a, f3 e (0, 7t/2) vztahy Naším úkolem je maximalizovat cp = a — f3. Doplňme, že pro h > b lze postupovat analogicky a že pro h e [a, b] se zřejmě úhel cp stále zvětšuje při zmenšujícím se x (cp = ix pro x = 0 a h e (a, b)). Z podmínky h < a plyne, že úhel cp je ostrý, tj. cp e (0, Jt/2). Protože je funkce y = tg x rostoucí na intervalu (0, n/2), můžeme přejít k maximalizování hodnoty tg cp. Platí _ b—h_a—h tgcp = tg (a - P) tg «-tg jg l+tgortg/3 x(b— a) 1 + 2 Jt2 + (fc-A)(a-A) ' Jt2+(fc-A)(a-A) ' Stačí nám tedy najít globální maximum funkce f(x) - x(b-a) Z vyjádření fix) vidíme, že x e [0, +oo). (b-a)[x2+(b-h)(a-h)]-2x2(b-a) _ (b-a)[(b-h)(a-h)-x2 [x2+(b-h)(a-h)] [x2+(b-h)(a-h)] X e (0, +oo) f(x) > 0 pro x e (o, y/(b - h)(a - h)j , fix) < 0 pro x e (V (Ŕ — h)(a — h), +oo^ . Funkce / má proto globální maximum v bodě x0 = y/(b — h)(a — h) (připomeňme nerovnosti h < a < b). Určit bod x0 lze samozřejmě i jinými způsoby. Můžeme např. místo hledání maxima kladné funkce / na intervalu (0, +oo) pomocí diferenciálního počtu hledat globální minimum funkce g(x) = -f- = x-^-nna-n, = *+ (b-h)(a-h) (Q } °v ' f(x) x(b—a) b—a x(b—a) ' v ' ' využitím tzv. A-G nerovnosti (mezi aritmetickým a geometrickým průměrem) 21+22. > y/yi v2, vi,y2>0, ve které rovnost nastává právě pro yi = y2. Volba 312 CHAPTER 5. ZŘÍZENÍ ZOO totiž dává g(x) = yx(x) + y2(x) > 2 Vvi(x)y2(x) = ^ J(b-h) (a-h). Pokud tak existuje x > 0, pro které je yi(jc) = ^2(1), má funkce § v bodě x globální minimum. Rovnice yl(x) = y2(x), tj. 7^ = ^^, má jediné kladné řešení x0 = — — Dvěma odlišnými způsoby jsme stanovili ideální vzdálenost turisty od stěny. Hodnotě x0 odpovídá cpo = arctg 2 ^ = arctg-- jcg+(fo-ň)(a-ň) fe 2 sl(b-k)(a-K)' Při pohledu z úrovně podlahy (kdyby se díval brouk) je h = 0, a tudíž je x0 = Vac, l ^Jh2+x2 v2 ^h\ + (d-x)2 jednoduchou úpravou dostáváme x 4hW = a —d-x- v2 ' ^h2+(d-x)2 313 K. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 4. MOCNINNÉ ŘADY Tento tvar je pro nás užitečný, neboť (viz obrázek) Existuje tudíž nejvýše jeden stacionární bod; a ten je určen vztahem (5.10) sin^i srn 0, existuje právě jeden stacionární bod xq. Z nerovností T'(x) < 0 pro x e [0, x0) a T'(x) > 0 pro x e (x0, d] již plyne, že ve stacionárním bodě x0 je globální minimum. Shrňme předchozí. Paprsek je zadán bodem lomu R (hodnotou x0) a bod R je potom určen identitou (||5.10||), která se ve fyzice označuje jako Snellův zákon. Podíl rychlostí v\ a v2 je pro uvedená homogenní prostředí konstantní a vyjadřuje důležitou veličinu, jež popisuje rozhraní optických prostředí. Nazývá se index lomu a značí se n. Obvykle se požaduje, aby první z prostředí bylo vakuum, tj. klade se v\ = c a v2 = v, se ziskem (absolutního) indexu lomu n = c/v. Pro vakuum je n = 1. Také pro vzduch se používá n = 1, neboť při standardních podmínkách (tj. při tlaku 101 325 Pa, teplotě 293 K a absolutní vlhkosti 0, 9 g m~3) je pro vzduch n = 1, 000272. U ostatních prostředí se uvádí n > 1 (např. se klade n = 1,31 pro led, n = 1,33 pro vodu, n = 1,5 pro běžné sklo). Index lomu ovšem rovněž závisí na vlnové délce uvažovaného elektromagnetického vlnění (kupř. pro vodu a světlo se jedná o rozsah od n = 1,331 až po n = 1,344), kdy index lomu zpravidla klesá s rostoucí vlnovou délkou. Rychlost světla v optickém prostředí s indexem lomu n > 1 totiž závisí na frekvenci světla. Hovoří se o tzv. disperzi světla. Právě disperze světla způsobuje, že se paprsky světla různých barev lámou pod různými úhly. (Nejvíce se láme paprsek fialového světla a nejméně paprsek světla červeného.) To je mj. příčina vzniku duhy. Můžeme dále vzpomenout slavný Newtonův pokus se skleněným jehlanem (optickým hranolem) z roku 1666. Na závěr ještě doplňme, že naše úloha měla vždy řešení, protože jsme mohli volit bod R libovolně. Pokud by byl s rychlostmi v\ a v2 zadán také úhel cpi (naším úkolem by třeba bylo vypočítat, kde paprsek vycházející z bodu A protne přímku y = c pro jisté c < 0, když rozhraní optických prostředí je součástí osy x), pak by úhel cp2 e (0, 7t/2) splňující (||5.10||) nemusel existovat. Takové situaci odpovídá úplný odraz světla (k lomu světla vůbec nedojde). □ 5.202. Duha. Proč má duha kruhový tvar? dešťovou kapkou. Viz obrázek. Paprsek dopadající na povrch kapky v bodě A se "rozdvojí". Část světla se odrazí (pod úhlem cpi od normály) a část se zlomí dovnitř kapky pod vyznačeným úhlem cpr. Paprsek uvnitř kapky se odrazí od povrchu kapky v bodě B. Protože je | O A \ = \ OB |, úhel odrazu je roven cpr. Samozřejmě během tohoto odrazu se opět část světla lomí ven z kapky. Paprsek odražený uvnitř kapky však dopadá na povrch kapky v bodě C a láme se směrem k pozorovateli pod úhlem Solution. V příkladu nazvaném Snellův zákon jsme si objasnili, co je příčinou vzniku duhy. (Duha vzniká rozkladem slunečního světla na vodních kapkách.) Nyní na tento příklad navážeme. Přesněji, detailně se podíváme, co se děje se světlem při jeho průchodu 314 CHAPTER 5. ZŘÍZENÍ ZOO (pi od normály. Doplňme, že zanedbáváme možnost vzniku tzv. sekundární (vedlejší) duhy, kdy se paprsek v kapce odrazí dvakrát (a pochopitelně i vícečetné odrazy). Vyjádříme si úhel a := ZA/C. Neboť LOA1 = (pt a LOAB = 0. Mátaksmyslanalyzovatfunkci(viz(||5.11||)a(||5.12||)) a(y) = 4 arcsin -^—2 arcsin -|, y e [0, i?]. Volbou vhodné jednotky délky (pro kterou je R = 1) přejdeme k funkci a(x) = 4arcsin^ — 2arcsinx, x e [0, 1]. Po výpočtu derivace a'(x) = —jL= - 2, x e (0, 1) snadno určíme, že rovnice a'(x) = 0 má jediné řešení x0 = ^l^f - e (0, 1), pokud nz e (1, 4). Položme n = 4/3 (což je přibližně index lomu pro vodu). Dále je a'(x) > 0, x e (0, x0), a'(x) < 0, x e (x0, 1). Zjistili jsme, že v bodě x0 = /--Si- = | y§ = 0, 86 má funkce a globální maximum o-(xo) = 4 arcsin -A? - 2 arcsin ^-4 = 0, 734 rad ^ 42 °. Přestože je zajímavé, že vrchol duhy nemůže být nad úrovní přibližně 42 ° vůči tomu, kdo ji pozoruje, ještě zajímavější jsou vyčíslení a(0, 74) = 39, 4°, a(0, 94) = 39, 2 °, a(0, 8) = 41, 2 °, a(0, 9) = 41, 5 °. 315 K. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 4. MOCNINNÉ ŘADY Ta totiž implikují (funkce a roste na intervalu [0, x0] a klesá na intervalu [x0, 1]), že více než 20 % hodnot a leží v úzkém pásu zhruba od 39 ° do 42 ° a 10 % v pásu o šířce menší než 1 °. Pokud navíc uvážíme např. a<(0, 84) = 41,9°, a(0, 88) = 41, 9°, vidíme, že paprsky, pro které je a blízké hodnotě 42 °, mají nej větší intenzitu. Vyzdvihněme, že se jedná o případ tzv. principu minimální odchylky, kdy platí, že k největší koncentraci rozptýleného světla dochází právě u paprsků s minimální odchylkou. Celková úhlová odchylka paprsku se totiž rovná úhlu 8 = jt — a. Kapky, ze kterých směřují paprsky k pozorovateli vidícímu duhu, tak leží na povrchu kuželu s centrálním úhlem 2a (x0). Nadzemní část tohoto kuželu se pak jeví pozorovateli právě jako kruhový oblouk duhy (viz obrázek). Při západu Slunce by tedy měla duha tvar půlkružnice. Uvažte také, že duha se realizuje vzhledem k pozorovateli - není nikde v prostoru. Na závěr poznamenejme, že onen kruhový tvar duhy podrobně zdokumentoval již René Descartes, který duhu vědecky zkoumal v letech 1635-1637. □ 5.203. ĽHospitalova kladka. Ke stropu je v bobě A uvázáno lano délky r. Na jeho druhém konci je připevněna kladka. Ve vzdálenosti d (v bodě B) od bodu A je ke stropu přivázáno druhé lano délky l > -Jd2 + r2, které prochází kladkou. Na tomto druhém laně je zavěšeno závaží. V jaké pozici se závaží včy ustálí (systém přejde do stacionární polohy)? Při řešení úlohy zanedbejte hmotnost i velikost lan a kladky. Viz obrázek. Solution. Systém bude ve stacionární poloze, pokud bude minimalizována jeho potenciální energie, tj. vzdálenost závaží od stropu f(x) bude maximální. To však znamená, že pro r > d se kladka pouze přesune pod bod B. Nadále proto budeme předpokládat, že r < d. Podle Pythagorovy věty je vzdálenost kladky od stropu Vr2 — x2 a vzdálenost kladky a závaží je l-y/(d- x)2 + r2 - x2 , coz dává fix) = Vr2 - x2 + l - y/id - x)2 + r2 - x2 . Poloha systému je zcela popsána hodnotou x e [0, r] (viz obrázek), a tudíž stačí najít globální maximum funkce / na intervalu [0, r]. Nejprve spočítáme derivaci f W = Jfi X_x2 ~ J(d-xÝ+fi -x* = Vr2 -*2 + r, dva kořeny uvažovaného polynomu v proměnné x určitě v intervalu (0, r) neleží.) Zbývá rozhodnout, zda ,. / .9, o í> , r, ~ e (0, r). r2 w r2 +8tŕ 1 X0 - -4ď- - 4 r Když však uvážíme, žer, d > 0 ar < d, snadno získáme i 0 < x0 < t r r. í + VT^T Vzhledem ke spojistosti funkce /' na intervalu (0, r) může dojít ke změně jejího znaménka pouze v bodě x0. Z limit lim f'(x) = -já=, lim /'(x) = -oo jc^0+ V^+í-2 x^r- tak již vyplývá, že f'(x) > 0, x € (0, x0), /'(jc) < 0, x € (x0, r). Funkce / má proto globální maximum na intervalu [0, r] v bodě x0. □ 5.204. Nejmenovaná poštovní společnost má ve svých podmínkách uvedeno, že délka jí přepravo-váného balíku nesmí být větší než 108 palců a že součet jeho délky a maximálního obvodu nesmí přesáhnout hodnotu 165 palců. Nalezněte balík nej většího objemu, který podle svých podmínek společnost může doručit. Solution. Nechť M označuje hodnotu 165 in (tj. palců) a x délku balíku (v palcích). Hledaný balík bude mít zřejmě takový tvar, že jeho průřez pro libovolné t e (0, x) bude mít stejný (ten maximální) obvod, který (rovněž vyjádřen v palcích) budeme značit jako o. Chceme, aby balík měl maximální objem, a tudíž aby průřez daného obvodu měl maximální obsah. Není obtížné si uvědomit, že rovinný útvar, který má při daném obvodu maximální obsah, je kruh. Tím jsme dospěli k závěru, že hledaný balík nej většího objemu má tvar válce o výšce x a poloměru podstavy r = o/2jt. Jeho objem je V =itr2x = 4^, přičemž musí být o + x < M a také x < 108 in. Uvažujme proto balík, pro který je právě o+x = M. Ten má objem V(x) = = *3-2m^2+m2* , kde x e (0, 108]. Spočítáme-li derivaci yl(x) = 3,2-4M,+M2 = 3(*-M)M)^ x £ (0> 10g) snadno zjistíme, že funkce V roste na intervalu (0, 55] = (0, M/3] a klesá na intervalu [55, 108] = [M/3, min {108, M}]. Největší objem tak dostáváme pro x = M/3, přičemž v (f) = m =0,011789 M3 « 0, 867 8 m3. Pokud by společnost v přepravních podmínkách požadovala, aby měl balík tvar kvádru, příp. jistého hranolu, můžeme předchozí úvahy zopakovat pro daný průřez o obsahu 5, aniž bychom specifikovali, jak tento průřez vypadá. Stačí si uvědomit, že nutně S = ko2 pro jisté k > 0, které je právě určeno tvarem průřezu. (Když se pouze změní velikost mnohoúhelníku, jenž je průřezem, tak se změní ve stejném poměru také jeho obvod. Obsah se však např. zdevítinásobí při trojnásobné velikosti - trojnásobném obvodu.) Objem balíku je tedy funkcí V(x) = Sx = ko2x = k (M — x)2x, x e (0, 108]. 317 K. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 4. MOCNINNÉ ŘADY Konstanta k neovlivňuje bod, kde je globální maximum funkce V, a proto toto maximum nastává opět pro x = M/3. Např. pro nejobjemnější kvádr s podstavou čtverce je o = M — x = 2M/3, tj. délka strany jeho podstavy je a = M/6 a objem potom V =a2x = ^ = 0,009259 M3 ^0,6816m3. Pro balík ve tvaru koule, kdy je x průměrem, podmínku o + x < M můžeme ihned přepsat do tvaru jtx + x < M, tj. x < M/(jt + 1) < 108 in. Pro x = M/(jt + 1) tak získáváme maximální objem V = \jt (f)3 = -^-3 = 0,007 370M3 ^0, 542 6 m3. 3 V2/ 6(jt+1)3 ' ' Podobně pro balík ve tvaru krychle, kdy x udává délku hrany, podmínka o + x < M znamená, že x < M/5 < 108 in. Takže pro x = M/5 dostáváme maximální objem V = x3 = (f)3 = 0, 008 M3 « 0, 588 9 m3. Ještě doplňme, že krychle, která má stejný objem jako nalezený válec, má délku hrany a = A= = 0, 227 595 M ~ 0, 953 849 m. 3^/jt Uvědomme si, že pro ni je součet její délky a obvodu roven 5a = 1, 138 M, tj. o bezmála 14 % překračuje hodnotu stanovenou společností. □ 5.205. Rozlehlý vojenský prostor (nadále zkráceno na VP) s půdorysem čtverce o rozloze 100 km2 je kolem dokola ohraničený úzkou cestou. Z výchozího místa v jednom rohu VP se lze dostat do cílového místa uvnitř VP tak, že se jde 5 km po cestě a poté 2 km kolmo k ní. Ovšem můžete jít libovolnou dobu po cestě rychlostí 5 km za hodinu a potom šikmo přes VP rychlostí 3 km za hodinu. Kolik (kilo)metrů musíte jít po cestě, abyste došli na místo určení co nejdříve? Solution. K tomu, abychom po cestě ušli x km, přičemž x e [0, 5], potřebujeme x/5 hodin. Naše cesta přes VP pak bude měřit V22 + (5 - x)2 = Vx2 - lOx + 29 kilometrů a ujdeme ji za Vx2 — lOx + 29/3 hodin. Celkem bude naše cesta trvat f(x) = ±x + |Vx2 - lOx +29 hodin (připomeňme, že x e [0, 5]). Jediný nulový bod funkce f'(x) = \ + \ , 2X~5 je x = 7/2. Protože derivace /' existuje v každém bodě intervalu [0, 5] a protože /(D = H) = >f, funkce / má v bodě x = 7/2 absolutní minimum. Po cestě bychom tudíž měli jít 3, 5 km. □ 5.206. Jste ve člunu na jezeře ve vzdálenosti d km od pobřeží. Chcete se dostat co nejrychleji do určeného místa na pobřeží ve vzdušné vzdálenosti y/d2 + P km od Vás (viz obrázek). Jak si budete počínat, pokud dokážete veslovat rychlostí v\ km/h a po břehu běžet rychlostí v2 km/h? Jak dlouho Vám bude cesta trvat? Solution. Optimální strategie je zřejmě dána tím, že dorazíte ke břehu v jistém bodě [0, x] pro x e [0, l] a poté budete běžet podél břehu do cílového místa [0, l] (viz obrázek), kdy je tedy trajektorie složena ze dvou úseček (příp. z jedné pro x = ľ). Doplout ke břehu v bodě [0, x] Vám bude trvat hodin a běh po pobřeží pak 318 CHAPTER 5. ZŘÍZENÍ ZOO — hodin. Jde o to, aby celkový čas byl minimální, tj. je potřeba minimalizovat funkci t(x) Vd2 +x2 . l-x_ na intervalu [0, l]. Navíc lze předpokládat, že v\ < v2. (Pro v\ > v2 je nepochybně nejrychlejší veslovat přímo k cílovému místu, čemuž odpovídá x = l.) Nejprve vypočítáme první derivaci ť(x) a poté druhou Dále vyřešíme rovnici Jejím umocněním obdržíme Jednoduchá úprava tak již dává Vx-fS+X2 V2' d2 ť(x) = v^(s+x2Y ť(x)=0, tj. x e (0, l) x e (0,1). X _ Dl ■Jífi+X2 ~ V2' + x2). tj- Uvědomme si, že uvažujeme pouze x e (0, l). Zajímá nás proto, zdaje < Z, po úpravě ^ < V2 *Ji2+£ Pokud je tato nerovnost splněna, je rovněž v\ < v2 a funkce ť mění znaménko pouze v bodě xo _n_ € (o,/), a to ze záporného na kladné (uvažte limx^0+ť (x) < 0 a t" (x) > 0, x e (0, /)). To znamená, že v tomto případě je v bodě x0 globální minimum funkce t na intervalu [0, /]. Jestliže nerovnost (||5.206||) splněna není, pak je ť (x) < 0 pro všechna x e (0, l), odkud plyne, že globální minimum funkce t na [0, l] je v pravém krajním bodě (funkce t je na svém definičním oboru klesající). Nejrychlejší cesta tedy bude trvat (v hodinách) t (x0) d2 +x20 i_Xo 1 + dv2 + Iv] V2 Vi — d2 + v-±d + V2- platí-li (115.20611), a když (115.20611) neplatí. ViV2 □ 319 K. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 4. MOCNINNÉ ŘADY 5.207. Firma hledá obdélníkovou parcelu o rozměrech 5a xb se záměrem ji po obvodu celou oplotit a pak ještě ploty kolmými na první stranu rozdělit na 5 stejně velkých parcel o rozměrech a xb. Pro jaké hodnoty a, b bude rozloha parcely S = 5ab maximální, má-li být celková délka plotů 2 400 m? Solution. Přeformulujme zadání: Chceme maximalizovat součin 5ab při splnění podmínky (5.13) 66 +10a = 2 400, a,b>0. Lehce lze ukázat, že funkce o definovaná pro a e [0, 240] nabývá maximální hodnoty v bodě a = 120. Proto je výsledek a = 120 m, b = 200 m. Doplňme, že uvedená hodnota b bezprostředně plyne z (||5.13||). □ 5.208. Do rovnostranného trojúhelníka o straně a je vepsán pravoúhelník (jedna jeho strana leží na straně trojúhelníka, zbylé dva vrcholy leží na zbylých stranách trojúhelníka). Jaký může mít maximálně obsah? 5.209. Zvolte rozměry otevřeného bazénu se čtvercovým dnem o objemu 32 m3 tak, aby na natření jeho stěn a dna bylo potřeba nejmenší množství barvy. 5.210. Číslo 28 rozložte na 2 nezáporné sčítance tak, aby součet druhé mocniny prvního sčítance a třetí mocniny druhého sčítance byl minimální. 5.211. Pomocí první derivace nalezněte reálné číslo a > 0, pro které je součet a + l/a minimální. Poté tuto úlohu řešte bez použití diferenciálního počtu. 5.212. Vepište do půlkruhu o poloměru r obdélník s největším možným obvodem. Uvedte jeho obvod. 5.213. Existuje-li mezi obdélníky o obvodu 4c obdélník s maximálním obsahem, stanovte délky jeho stran. 5.214. Zjistěte výšku v a poloměr podstavy r nejobjemnějšího kužele, který se vejde do koule o poloměru R. 5.215. Ze všech trojúhelníků s konstantním obvodem o > 0 vyberte ten, jenž má největší obsah. 5.216. Na parabole 2x2 — 2y = 9 najděte body s minimální vzdáleností od počátku soustavy souřadnic. 5.217. Vaším úkolem je vyrobit j ednolitrovou plechovou konzervu „obvyklého" tvaru rotačního válce tak, aby na její výrobu bylo potřeba co nejméně plechu. Určete správný poměr mezi její výškou v a poloměrem podstavy r. 5.218. Určete vzdálenost bodu [3, —1] el2 od paraboly y = x2 — x + 1. 5.219. Určete vzdálenost bodu [—4, —2] e M2 od paraboly y = x2 + x + 1. 5.220. V čase t = 0 vyjelo auto z bodu A = [5, 0] rychlostí 4 jednotky za sekundu směrem (—1, 0). Ve stejném čase vyjelo druhé auto z bodu B = [—2, —1] rychlostí 2 jednotky za sekundu směrem (0, 1). Kdy si budou auta nejblíže a jaká bude tato vzdálenost? 320 CHAPTER 5. ZŘÍZENÍ ZOO 5.221. Včaseř = 0 vyjelo auto z bodu A = [0, 0] rychlostí 2 jednotky za sekundu směrem (1, 0). Ve stejném čase vyjelo druhé auto z bodu B = [1,-1] rychlostí 3 jednotky za sekundu směrem (0, 1). Kdy si budou auta nejblíže a jaká bude tato vzdálenost? 5.222. Určete maximální možný objem kužele o povrchu 3jv cm2 (do povrchu kužele počítáme i obsah podstavy). Povrch kužele spočítáme jako P = jtr(r + v), objem jako V = \itr2v, kde r je poloměr podstavy a v výška kužele. 5.223. O dům je opřený žebřík dlouhý 13 stop. Náhle základna žebříku podklouzne a žebřík začne sjíždět k zemi (stále zůstává opřený o dům). Když je základna žebříku 12 stop od domu, klouže od něj rychlostí 5 stop/s. Jak rychle v tomto okamžiku (a) klesá vršek žebříku po zdi; (b) se mění obsah trojúhelníku vymezeného žebříkem, domem a zemí; (c) se mění úhel, který svírá žebřík se zemí? 5.224. Předpokládejte, že vlastníte dostatek finančních prostředků bez možnosti investovat mimo svou továrnu s působností na cenově regulovaném trhu s takřka neomezenou poptávkou a omezeným přístupem k některým klíčovým surovinám, což Vám umožňuje produkovat nejvýše 10000 výrobků denně. Víte, že pro hrubé výnosy v a náklady n jako funkce proměnné x, udávající v tisících průměrný počet výrobků vyrobených za den, platí v(x) = 9x, n(x) = x3 - 6x2 + 15x, x e [0, 10]. Při jakém objemu výroby budete mít z Vaší továrny největší zisky? 5.225. Určete lim (cotg x--) . x^0 \ X ) Solution. Uvědomíme-li si, že je 1 lim cotgx = +oo, lim — = +oo, 1 lim cotgx = — oo, lim — = — oo, jt-»0- jt-»0- X vidíme, že v případě obou jednostranných limit dostáváme typ oo — oo. Můžeme tedy uvažovat najednou oboustrannou limitu. Funkci kotangens zapíšeme jako podíl kosinu a sinu a zlomky převedeme na společného jmenovatele, tj. x cosx — sinx lim (cotgx--) = lim jc^O \ X/ x^0 >o xsmx Obdrželi jsme výraz 0/0, pro který platí (podle 1'Hospitalova pravidla) x cosx —sinx cosx — x sinx — cosx —xsinx lim -= lim-= lim >o xsinx x->o sinx+x cosx x->o sinx + x cosx Druhým použitím 1'Hospitalova pravidla pro typ 0/0 pak již dostaneme —xsinx — sinx —x cosx 0 — 0 lim -= lim-=-= 0. .x^o sinx + x cosx ^^o cosx + cosx — x sinx 1 + 1 — 0 □ 5.226. Určete limitu 7TX hm (1 -x) tg—. x^l— z 321 K. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 4. MOCNINNÉ ŘADY 5.227. Stanovte lim ( .2 Sm_ (\ ~xtg x) ■ 5.228. Pomocí 1'Hospitalova pravidla určete 5.229. Vypočtěte ^((3"-2"H lim ( —----i—) \21nx x2 - 1/ 5.230. Užitím 1'Hospitalova pravidla spočtěte limitu lim x^*+oo (cos*-) 5.231. Vypočtěte lim (1 — cosx)s x^O 5.232. Určete následující dvě limity lim x i" *:, lim x 'n > x^0+ x^+qo přičemž a e Ije libovolné. 5.233. Libovolným způsobem ověřte, že je ex - 1 lim-= 1. x^O X 5.234. Aplikací podílového (tzv. ďAlembertova) kritéria (viz 5.47) určete, jestli nekonečná řada (a) £ «=1 oo (b) Z ff; «=i oo (c) Z J^T «=1 konverguje. Solution. Protože (an > 0 pro všechna ň) (a) Um 2*1 = Um = lim f±fg = lim ^ = í < 1; «^oo fl" n->oo 3 + -2 ■(" + !) «^oo 3(" + !) «^oo 3" 3 (b) lim 2s±l = lim (-^ • gf) = lim 4r = 0 < 1; V «^oo fl" «^oo + ^/ «^00« + ! (C) lim 2^±i = lim (, i"+T'n, • = lim ^ • lim ^ = lim 4 • W „^oo an n^oo ^(„ + i)2.(„ + 1)! „» y „^oo (« + 1)2 «" „^oo"2 lim (1 + i)" = 1 - e > 1, «^oo V »' řada (a) konverguje; (b) konverguje; (c) nekonverguje (diverguje k +oo). □ 322 CHAPTER 5. ZŘÍZENÍ ZOO (a) Z in" OH « = 1 5.235. Aplikací odmocninového (tzv. Cauchyova) kritéria určete, jestli nekonečná řada _L_. > + l)' OO (n±l)n2 (b) Z «=i OO (c) Z arcsin" «=i konverguje. Solution. Opět máme řady s nezápornými členy, přičemž je (a) lim zfä^ = lim j—^ = 0 < 1; «^0O «^0O v * L) (b) lim »fa = lim VfT = "7 (3 = f < 1; «^00 «^00 V«3-3 3/ lim (c) lim = lim arcsin ^£ = arcsin 0 = 0 < 1. To znamená, že všechny zadané řady konvergují. □ 5.236. Rozhodněte, zda řada 00 (a) Z(-l)" ln(l + £); n = l 00 2 (b) Z «=1 00 (c) y (-3)" «=1 konverguje. Solution. Případ (a). Podle ľHospitalova pravidla je _ Klu) _ íim x^-\-oo a proto platí lim ——x—- = lim ———TT-= lim —^- = 1, 0 < ln (1 + 2" 00 2 pro všechna dostatečně velká n e N. Ovšem o řadě Z^Li 2^ vmie' že je konvergentní. Musí tak být 00 Zin (1 + ^) < +00, «=1 tj. řada v zadání konverguje (absolutně). Případ (b). Podílové kritérium dává lim ř7^*00 9(«+l)2 .„i .. 22"+1 i- 2-4" nm _____"2 = hm 4rrr = 1™ rxr = +°°- «^00 (« + l)!-2«2 «^00 " + 1 «^00 " + 1 Řada tedy nekonverguje. Případ (c). Nyní použijeme obecnou verzi odmocninového kritéria lim sup y\a„ I = lim sup 6+(3_l)n = f < 1, z níž plyne (absolutní) konvergence řady. □ 5.237. Libovolným způsobem dojděte k rozhodnutí o konvergenci alternující řady (a) Z(-l)" n «2+3«-l . (3«-2)2 n = \ í\\\ "S-1 ŕ_1 \n —1 3« 4-3«3+9«- IP) 2-,\ í) (5«3-2)4" _í\n-l 3«4-3«3+9«-l n = l Solution. Případ (a). Z toho, že je 323 K. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 4. MOCNINNÉ ŘADY lim = lim = I jL o, ihned vyplývá neexistence limity Blim(-l)-^. Řada tudíž nekonverguje (není splněna nutná podmínka konvergence). Případ (b). Viděli jsme, že při použití podílového (nebo odmocninového) kritéria polynomy v čitateli ani jmenovateli členů řady neovlivňují hodnotu počítané limity. Uvažujme tedy řadu oo Z(-i)""1^' 4 « = 1 pro kterou je lim "n+\ ;ZH + oo. n = \ n = \ □ 324 CHAPTER 5. ZŘÍZENÍ ZOO 5.240. Sečtěte řadu oo (a) Z(^-Tir); n = \ 3' (b) Z Jr; «=o (c) Z (42/1-1 + 4E « = 1 00 (d) Z f; «=1 (e) Z (3^ s ii + l)(3«+4)" «=0 Solution. Případ (a). Podle definice je součet řady «=1 ^((7Ť-7f) + (71-7!)+--- + fe-vfe)) = n^(1 + (-7! + 7!)+--- + (-^ + 7i)-7fcŤ) = L Případ (b). Zjevně se jedná o pětinásobek konvergentní geometrické řady s kvocientem q = 1/3, a tudíž je Z pr = 5 Z (3) = 5 • yn = y- «=0 «=0 3 Případ (c). Platí (při substituci m = n — 1) 1 2ľ (42/í-1 H" 4>") 4 2ľ (42/1-2) H" 16 2ľ (42/Í-2; « —1 « —1 ft — 1 U T 16/ ^ 42m 16 ^ V 16/ Jd 1 _ 14 " 16 ' l-l — 15- m=0 m=0 16 Řadu lineárních kombinací jsme zde vyjádřili jako lineární kombinaci řad (přesněji řečeno, jako součet řad s vytknutím konstant), což je platná úprava, pokud obdržené řady jsou absolutně konvergentní. Případ (d). Z částečného součtu ^ = 3 + 322 + 3T + --- + f, n bezprostředně získáváme £2. — -l 4- -1 4- ... 4- !Ľ± 4- S— n í= M Je tedy v — I_i_J__i_J__i_..._i_J___«_ n e N Protože lim = 0, dostáváme §ž(ir=i(i-i) v1 3 / i=l v 3 Případ (e). Stačí použít vyjádření (jde o tzv. rozklad na parciálni zlomky) 1 1111 (3« + l)(3«+4) 3 3« + l 3 3«+4 které dává , neNU{0), V _I_ = hm I h _ I 4- ± - ± 4- i - -- 4- • • • 4- ^___M ^ (3« + l)(3«+4) 3 V 4 T 4 7 T 7 10 T T 3« + l 3«+4J n=0 «=>oo lim i (l i i 325 K. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 4. MOCNINNÉ ŘADY □ 5.241. Ověřte, že platí oo ^ °° i z ? < ^ ?• n — 1 «—0 Solution. Ihned je vidět, že 1<1 J- + i<2-J--i -1 + -J- + -1 + - < 4 • - - 1 1 - 1' 22 + 32 < Z 2- ~ 2' 42 + 52 + 62 + 7- < ^ 4- ~ 4' resp. obecný odhad _j__u ... 4__1_ < 2" • 1 — -L n f N (2«)2 T (2"+!-l)2 < Z (2«)2 ~~ 2"' " fc iNL Odsud (porovnáním členů obou řad) dostáváme zadanou nerovnost, z níž mj. plyne absolutní konver- ^00 1 gence řady Z^Li ^- Ještě upřesněme, že je Z „2— 6 <2-X2«- n—1 «—0 5.242. Vyšetřete konvergenci řady 5.244. Jaký je součet řady V 1 «=2 Solution. Z nerovností (uvažte graf přirozeného logaritmu) 1 < Inn < n, n > 3, n e N plyne < 3, n e N. Podle Věty o třech limitách (5.21) je lim >/lnn = 1, tj. lim -J= = 1. □ Y ln2±i. «=1 Solution. Pokusme se uvedenou řadu sečíst. Platí oo V ln s±i = lim (lnf+ln| + ln| + -- - + lns±i) = 1 " «^oo " lim ln 2-3|49;("+1) = lim ln (n + 1) = +oo. «^►00 í l i n «^oo Řada tudíž diverguje k +oo. □ 5.243. Prokažte, že řady oo -, _ oo V m-pfo »-+2"+3V"+4 ■ V 3"+1 «=0 n=\ nekonvergují. Solution. Protože i- t «2+2«+3V"+4 >• , ;r 7t hm arctg T,v ť = lim arctg ^- = j «^oo "+1 «^oo " A a lim v_ = lim % = není splněna nutná podmínka konvergence lim an = 0 řady Z^L«0 fl"' ^ 326 CHAPTER 5. ZŘÍZENÍ ZOO Řada tedy není konvergentní. Neboť má nezáporné členy, musí divergovat k +00. 5.245. Zjistěte, zda řada □ (*) Zôr 1 «=0 (n + l)-3" ' (b) Z ^jP; «=1 00 (c) Z^— v 7 n—mn « = 1 konverguje. Solution. Všechny tři uvedené řady mají nezáporné členy, a tak mohou v jednotlivých variantách nastat jen dvě možnosti - součet je konečný, součet je roven +00. Platí (a) Zôr (n + l)-3" «=0 «=0 Z(|) < +00; (b) Z ^ > Z b = Z H +00; 77 — 1 77 — 1 77 — 1 (c) z —i— > Z 1 = + v ' t—' n—mn — n n — l n — l oo. Odtud plyne, že řada (a) konverguje; (b) diverguje k +00; (c) diverguje k +00. 5.246. Ukažte, že tzv. harmonická řada Z1 t—1 n «=1 diverguje. Solution. Pro libovolné přirozené k je součet prvních 2k členů řady větší než k/2: 1111111 1 + 2+3 + 4+5 + 6 + 7-+8+---' □ 1.1_1 "4+4-2 i.i.i.i—i ' 8 + 8 + 8 + 8 — 2 součet členů od 2l +1 do 2l+1 je totiž vždy větší než 2'-krát (jejich počet) číslo 1 /2l (nejmenší z nich), což je dohromady 1 /2. □ 5.247. Rozhodněte o následujících řadách, jestli konvergují či divergují: 00 o z? «=1 00 ii) Z 4= n = \ i") Z - 1 n = \ 2i00000 «=1 Solution. i) Budeme zkoumat konvergenci podílovým kritériem: 2{n + 1) lim -= 2 > 1, 2n+l lim an + \ = lim n + l In 77 —>OQ 77 —>OQ Z ~n~ řada tedy diverguje. 327 K. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 4. MOCNINNÉ ŘADY ii) Odhadneme řadu ze spodu: víme, že pro libovolné přirozené n platí ^ < Pro posloupnost částečných součtů s„ zkoumané řady a posloupnost částečných součtů harmonické řady s'n tedy platí: n ^ H \ A protože harmonická řada diverguje (viz předchozí příklad), diverguje i její posloupnost částečných součtů {s,n}^Ll, tedy diverguje i posloupnost částečných součtů {s„}^=1, tedy diverguje i zadaná posloupnost. iii) Diverguje, jedná se o násobek harmonické řady. iv) Jedná se o geometrickou řadu s koeficientem , ta bude konvergovat, bude-li absolutní hodnota koeficientu menší než 1. Víme, že 1 i , 1 - i, ,1 1 i fl f V2 11 + i1 1 2 1 '2 2' V4 4 2 řada tedy konverguje a umíme ji dokonce sečíst: ~ 1 1 1+i V-=-=- =-= 1 - i. □ 5.248. Do čtverce o délce strany a > 0 je vepsán čtverec, jehož strany jsou spojnicemi středů stran zadaného čtverce. Do vepsaného čtverce je stejným způsobem vepsán další čtverec atd. Stanovte součet obsahů a součet obvodů všech těchto (nekonečně mnoha) čtverců. 5.249. Nechť je dána posloupnost řádků půlkruhů, přičemž v ři-tém řádku je 2" půlkruhů o poloměru 2~" pro každé neN. Jaký bude obsah libovolného obrazce složeného ze všech těchto půlkruhů, když nebudou umístěny přes sebe? 5.250. Vyřešte rovnici l-L6ATli,2T-to3v-L,"4r-t',5v-1____- 5.251. Určete 1 - tgx + tg2x - tg3 x + tg4x - tg5x + - tg2x+v T + -2-' / . \ 2«—i 1 3«—i n = \ 5.252. Sečtěte Z ^n2 +2n + l. «=i 5.253. Dokažte konvergenci a nalezněte součet řady oo 3"+2" S 6" «=1 5.254. Stanovte součet řady oo (a) Z n = \ oo (b) Z ^- «=o 5.255. Sečtěte 1-3 T 3-5 T 5-7 T ^ (2«-l)(2« + l) ' « = 1 328 CHAPTER 5. ZŘÍZENÍ ZOO 5.256. Pomocí rozkladu na parciální zlomky vyčíslete «=2 (b) Z i «3+3«2+2« ' « = 1 5.257. Sečtěte konvergentní řadu 5.258. Určete součet řady Z 5.259. V závislosti na 4«2-l 1 «=0 T 1 n2+3n ' « = 1 .= y (-i)"-' =1_i + i_i,i_i,i_i+... a • « 2^3 4^5 6^7 8 ^ « = 1 vyjádřete součty řad (l-|-Í) + (|-o-|)+-- (l+3--2-)+(5-+^-4-)+-- které z výše uvedené řady vznikly přerovnáním (tj. změnou pořadí členů). 5.260. Zjistěte, zda řada oo X 2"+(-2)" 5« «=0 konverguje. 5.261. Dokažte následující tvrzení: Jestliže řada Z^Ln a» konverguje, pak je lim sin(3a„ + 7t) = 0. «=> oo oo _ oo oo 5.262. Pro jaké a el; /íeZ; y € M\{0} konvergují řady Z ^ Z ^r1; Z pr? « = 120 «=240 «=360 5.26.?. Rozhodněte, zda řada ^ ^ 5n+2n 2 «=21 konverguje absolutně, konverguje neabsolutně (relativně), nebo nekonverguje. 5.264. Zjistěte, jestli je limita lim (\ + \ + • • • + S1) „=.00 V«2 «2 «2 J vlastní. Upozorněme, že k tomu nelze využít součtů oo , oo «=1 «=2 5.265. Najděte všechna reálná čísla A > 0, pro která řada oo Z(-l)"ln(l + A2n) «=i konverguje. 5.266. Zopakujme, že harmonická řada diverguje; tj. platí oo Z 1 = +oo. « = 1 Rozhodněte, zda také řada 329 K. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 4. MOCNINNÉ ŘADY i 4....4.Í 4.Í4....4.I 4- i. 4- ... 4- i. 4-... ''• + ^ + -- - + gg+YlY + ''" + TT9+T2T + ''' diverguje. 5.267. Udejte příklad divergentních číselných řad Z^Li fi» > Z£=i s kladnými členy, pro které řada Z^Li (3a« — 2&„) absolutně konverguje. 5.268. Zjistěte, zda jednotlivé řady Zi- i \n (»!)' . Ví i \« »'-»4+n ^ ^ (2«)!' ^y ' n^+2n<>+n «=1 «=1 konvergují absolutně, konvergují neabsolutně, či nekonvergují. 5.269. Konverguje řada /_i\« + l^"-j-^«-H_r) n = l 5.270. Nalezněte hodnoty parametru p e R, pro které řada Z (-1)" sin" f n = l " konverguje. 330 CHAPTER 5. ZŘÍZENÍ ZOO Řešení cvičení 5.2. P (x) = (-f - p)x2 +(2 + 3i)x -l-^-i. 5.11. 3x2 -2x -4. 5.72. (2X2 - 5) /3; např. (fx2 - f)3. 5.13. a = l,b = -2, c = 0,d= 1. 5.74. x3 + x2 - x + 2. 5.75. Nekonečně mnoho. 5.76. P(x) = x3 - 2x2 + 5x - 3; Q (x) = x3 - 2x2 + 3x - 3. 5.17. x5 -2x4 -5x+2. 5.18. x2. 5.19. x3 - 2x + 5; x3 - x + 6. 5.20. Nekonečně mnoho. 5.27. Např. x2 - 3x + 6. 5.22. 5i(x) = i (x + l)3 - | (x+ 1) + l,x e [-1,0]; 52(x) = -^x3 + f x^x e [0, 1]. 5.23. 5i(x) = \ (x + l)3 - \ (x+ 1) + l,x e [-1,0]; 52(x) = -^x3 + f x2, x e [0, 1]. 5.24. Si (x) = x; 52 (x) = x. 5.25. 5i(x) = 1; 52(x) = 1. 5.26. Si (x) = x + 3, x e [-3 + i - 1, -3 + i]; i e {1, 2}. 5.27. 5i(x) = 1 - ±±x + 2Ťj x3; 52(x) = \ - \ (x - 1) + ^ (x - l)2 - ^ (x - l)3. 5.29. sup A — 6, iníA — —3; 1 sup B — —, inf Z> = — 1; sup C — 9, inf C = -9. 5.30. Lehce lze ukázat, že m A = 3 sup A — -, inf A = 0. 5.37. Zřejmě je inf N =1, sup M = 0, inf J" = 0, sup J" = 5. 5.32. Lze položit kupř. M := Z \ N; JV := N. 5.33. Uvažte jakoukoli jednoprvkovou množinu Z C M. 5.34. Množina C musí být jednoprvková. Nechť je tedy např. C — {0}. Nyní můžeme zvolit A — (—1,0), B = (0, 1). 5.40. Platí / 1 2 n-2 n-\\ íl+n-l n - l\ 1 lim l— + — + ... + —— + —ť- = lim -t.---— = -. n^oo ynz nz nz nz / «=>oo y «z 2/2 5.47. Snadno lze ukázat, že V«3 — lln2 + 2 + ŽJn1 — 2n5 — n3 — n + sin2 n lim - -= —oo. 2 - V5n4 + 2«3 + 5 331 K. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 4. MOCNINNÉ ŘADY 5.42. Limita je rovna 1. 5.43. Kupř. lze položit x„ :— n. y„ :— — n + 1, n e N. 5.44. Správná odpověďje ±1. 5.45. Výsledek je lim sup an — 1, lim inf an — 0. 5.46. Platí / „/ 1\" njt\ V2 5.63. Uvedená funkce je spojitá na celém M. 5.64. V bodech — jt, 0, tt je spojitá; v bodě 2 je spojitá pouze zprava a v bodě 3 pouze zleva; v bodě 1 není spojitá ani z jedné strany. 5.65. Je nutné položit /(O) := 0. 5.66. Funkce je spojitá právě pro p — 2. 5.67. Správná odpověďje a — 4. 5.68. Je sin8 x lim x^0+ XJ sin8 .v lim —= 0. 5.77. Jediné řešení x — — 1. 5.72. Ano. 5.76. f'{x) = 2xXn%-x -lnx 5.77. (sinx)1+cos,: (cotg2x - ln(sinx)' 5.79. | - ^0, 003. 5.80. a « |+0, 01; £«4, 125. 5.S7.(a)I-#;(b)f + #. 2 360 5.83. Ano. má. 5.84. y = ^ x 2p' 5.85. y = 2x. 5.86. y = j/4(x + 1); y = —^ (x + 1). 5.87. y-^ = 0ž-^)fc 5.88. [i,2l]. 20 5 ln 5-26 (X - 1). 5.89. f : y - I r; n : y -6x + 15; 3^ J 2 11 5.90. tt/4. 5.97. y = 2 — x; y = x. 5.92. Nerovnosti plynou např. z Věty o střední hodnotě (tzv. Lagrangeovy věty) aplikované na funkci y — ln(l +f), t e [0,x]. 5.777. r = +oo. 5.778. 1. 5.779. 3. 332 CHAPTER 5. ZŘÍZENÍ ZOO 5.720. [-1, 1]. 5.727.x e [2- 5,2+ ±j. 5.722. Ano. 5.723. (a) Platí. (b) Neplatí. (c) Neplatí. (d) Platí. 5.724. 1 102-2 ^ 1044! ' 5.725. Chyba náleží do intervalu (0, 1/200). ^26.X~0^(x-l)-X~0^x". 5.127. f (x) — x, x e M; ano. 5.728. Nikoli. 5.729. (a) 1 - -4— + -4—; (b) ± - i. v ' 182-2! 184-4!' w 2 5-25 J.iJĽ. 2^«=0 (2« + l)«! ^ 5.131. a > 1. 5.732. [-Š/2, ^2). 5.733. Pro x e [-1, 1]. 5.734. x > 2. 5.135. Konverguje absolutně. 5.736. In (3/2). d-1j/- (1+JC)3- 5.738. (a) iln|^;(b)-^. 5.739. 2/9. 5.740. x e~. 5.747. M. 5.742. (l,e]. 5.743. (-00, f) U (§, +00); (-00, -i) U (-i, +00); y = g±}, x / -i. 5.144. (a) ano; (b) ne; (c) ne; (d) ne; (e) ano; (f) ano; (g) ano; (h) ne. 5.145. (a) ne; (b) ne; (c) ano; (d) ano; (e) ne; (f) ne; (g) ne; (h) ano. 5.146. Lichá funkce je uvedena ve variantách (a), (e); sudá v (c), (d). 5.147. Je periodická s primitivní periodou (a) 2tt; (b) jr/3. 5.148. Funkce f a g jsou sudé - k vykreslení jejich grafů tak postačují grafy funkcí y — ex, x e [0, +00) a y — lnx, x € (0, +00). 5.149. Zadaná funkce je sudá, a proto k načrtnutí jej ího grafu stačí znát graf funkce y — 2X, x e (—00, 0]. 5.150. (sinhx)' — coshx; (coshx)' — sinhx; (tghx)' — —(cotghx)' —--K-. 5.151. 5.753. x4 + 2X3 - x2 + x - 2. 5.754. x4 + 2X3 - 2X2 + x + 2. 5.755. x4 + 3X3 - 3X2 - x - 1. 5.156. Pro každé e > 0 stačí e-okolí bodu —2 přiřadit á-okolí bodu 0 předpisem SH-Í, S — s, přičemž bez újmy na obecnosti lze požadovat, aby e < 1. Pokud by totiž bylo e > 1, lze položit 8 = 1. 333 K. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 4. MOCNINNÉ ŘADY 5.157. Existence limity a rovnost ,. (l+.v)2-3 3 lim -= — x^-i 2 2 např. opět plyne z volby 8 := e pro e e (0, 1). 5.158. Neboť — (x — 2)4 < x pro x < 0, dostáváme 3 (x — 2)4/2 > —x pro x < 0. 5.759. Neboť 1 jt 1 it lim arctg — = —, lim arctg — = — —-, x^o+ x 2 .v-»o- x 2 uvažovaná oboustranná limita neexistuje. 5.160. První z limit je rovna +oo, druhá neexistuje. 5.161. Limitu lze spočítat více způsoby. Nabízí se např. tg x — sin x / tg x — sin x cotg x \ lim---= lim I —---•-) x^O sin3 x x^o \ sur x cotg x / 1 — cosx 1 — cosx = lim-t— = lim x^O cosx • sin2x x^o cosx (l — cos2x) 1 1 = lim-= -. x^o cosx (1 + cosx) 2 5.762. Platí 2 sin3 x + 7 sin2 x + 2 sin x — 3 sinx+1 lim---=-= lim -= —3. x^n/6 2 sin3 x + 3 sin- x - 8 sinx + 3 *->jt/6 sinx - 1 5.763. Je xm - 1 m lim -= —. xn — 1 n 5.164. Po rozšíření výrazem Vx2 + x + . lze lehce dostat 5.765. Platí 5.766. Je Vx2 + X +x lim (s/ x2 + x — x) = —. lim (x \/l +x2 - x2) = i V2 — Vl + cosx V2 lim-r-=-. x^O sin x 8 5.167. Rozšířením zlomku ze zadání je možné obdržet sin (4x) lim ►0 Vx + 1 - 1 5.768. Platí VI + tgx - VI - tgx . lim -= 1. x^o- sinx 5.169. Zřejmě je 2X + Vl + x2 - x9 - 7x5 + 44X2 7 lim - —- = —. 3* + Vóx6 + x2 - 18x5 - 592X4 18 334 CHAPTER 5. ZŘÍZENÍ ZOO 5.170. Výrok není pravdivý. Uvažte kupř. /(.v) := -, x e (-00, 0); g (x) :— x, x e R. x 5.171. 2n-l 5.172. sin x — x lim — oo. 5.775. f (x) < 0.x > e. 5.174. V bodě xj — e-2 nabývá zadaná funkce lokálního maxima a v bodě x2 = 1 potom lokálního minima. 5.175. Neexistuje: pro a — \[2/2 nastává v daném bodě pouze lokální extrém. 5.776. 2 = e i -ln ±. e e 5.777. -L. Ve 5.778. 4 = p (-1) = p (2), -16 = p (-3). 5.779. (a) u(0) = 6 m/s; (b) t = 3 s, s(3) = 16 m; (c) u(4) = -2m/s, a(4) = -2 m/s2. 5.181. Derivace neexistuje: jednostranné derivace, a to n/2 (jednostranná derivace zprava) a —?r/2 (jednostranná derivace zleva), se nerovnají. 5.782. Ano. 5.183. Nikoli. 5.184. f(x) := |x - 5| + |x - 9 |. 5.185. Např. f = g pro funkci / definovanou tak, že v racionálních bodech nabývá hodnoty 1, zatímco v iracionálních hodnoty — 1. 5.186. (a) x2 sinx; (b) cos (sin*) • cosx; (c) |f^±f cos (m (A-3 + 2x)); (d) ■ 5.787. (a) I x"5 ; (b) cosecx = O^. 5.188. cosx • cos (sinx) ■ cos (sin (sinx)). 5.794. In2 (x + Vl +x2j,x e R. 5.195. f (x) = -± (log^ e)2, x > 0, x / 1. 5.796. [f(X)g(x)h(x)k(x)] ' = f'(X)g(X)h(x)k{x) + f(x)g'(X)h(X)k(X) + f(x)g(x)h'(X)k(X) + f(x)g(x)h(X)k'(X). 5.208. Vepsaný pravoúhelník má strany x, V3/2(a — x), tedy obsah \/3/2(a — x)x. Maximum pro x — a/2, tedy maximální obsah je (a/3/8)o2. 5.209. 4 m x 4 m x 2 m. 5.189. f (x) = 335 K. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 4. MOCNINNÉ ŘADY 5.270. 28 = 24 + 4. 5.277. a = 1. 5.272. 2VŠr. 5.213. Jedná se o čtverec (s délkou strany c). 5.214. v = f/?, r = 2^7?. 5.275. Největší obsah V3 o2/36 má rovnostranný trojúhelník. 5.276. [2, -1/2], [-2, -1/2]. 5.277. v = 2r. 5.218. Nejbližší bod [1. 1], vzdálenost 2-Jl. 5.219. Nejbližší bod [-1, 1], vzdálenost 3-Jl. 5.220. t — 1, 5s, vzdálenost VB" jednotek. 5.227. V čase t — s si budou auta nejblíže a to jednotky. 5.222. P — jtrv + jtr2 ==>■ v = P~^f' =^ V — \r(P — xr2). Extrém r — dosazením do objemu V = cm3. 5.221. (a) 12 ft/s; (b) -59, 5 ft2/s; (c) -1 rad/s. 5.224. Při produkci zhruba 3 414 výrobků denně. 5.225. Trojnásobné použití 1'Hospitalova pravidla dává sin x — x 1 5.226. 2/jt. 5.227. 5.228. 5.229. 112. 5.230. Platí lim ^— — xj tgx = l. ,iÍ^((3-2")l)-ln2- lim x—>-\-oo (cosx") = 2 2 5.237. Dvojnásobnou aplikací 1'Hospitalova pravidla lze obdržet lim (1 -cosA)sin* =e°=l. x^O 5.232. V obou případech je výsledek e 0; p e {-2, -1, 0, 1, 2}; y e (-oo, -1) U (1, +oo). 5.263. Konverguje absolutně. 5.264. Limita je rovna 1/2. 5.265. A e [0, 1). 5.266. Součet uvedené řady je konečný - řada konverguje. 5.267. Např. an = n/3, bn = n/2, n e N. 5.268. První řada konverguje absolutně; druhá neabsolutně. 5.269. Ano. 5.270. p e R. 337 CHAPTER 6 Diferenciální a integrální počet zvěřinec teďmáme, ale co s ním? — naučíme se s ním zacházet... V minulé kapitole jsme si postupně hráli buď s mimořádně velikými třídami funkcí — všechny spojité, všechny diferencovatelné apod. — nebo jen s konkrétními funkcemi — např. exponenciální, goniometrické, polynomy atd. Měli jsme ale přitom minimum nástrojů a vše jsme počítali tak říkajíc na koleně. Z kvalitativního pohledu jsme jen naznačili, jak využívat znalost lineárního přiblížení funkce její derivací k diskusi lokálního chování takové funkce kolem daného bodu. Teď dáme dohromady několik výsledků, které umožní snáze pracovat s funkcemi při modelování reálných problémů. Pomocí derivování jsme se naučili zaznamenávat velkosti okamžitých změn. V této kapitole se vyrovnáme i s úlohou, jak sčítat nekonečně mnoho takových "nekonečně malých" změn, tj. jak "integrovat". Nejdříve si ale uděláme více jasno o derivacích. V poslední části kapitoly se vrátíme k řadám funkcí a doplníme přitom i několik chybějících krůčků v naší dosavadní argumentaci. 1. Derivování 6.1. Derivace vyšších řádů. Jestliže má první derivace ^ f'(x) reálné nebo komplexní funkce / v bodě x0 derivaci (f')'(x0), říkáme že existuje druhá derivace funkce /, resp. derivace druhého řádu. Píšeme pak f"(x0) = (/')'(*0) nebo také f(2)(x0). Funkce / je dvakrát diferencovatelná na nějakém intervalu, jestliže má druhou derivaci v každém jeho bodě. Derivace vyšších řádů definujeme induktivně: &-krát diferencovatelné funkce I Reálná nebo komplexní funkce / je v bodě x0 (k + 1)-krát diferencovatelná pro nějaké přirozené číslo k, jestliže je /c-krát diferencovatelná na nějakém okolí bodu x0 a její k-tá derivace má v bodě x0 derivaci. Pro /c-tou derivaci funkce f(x) píšeme f(k\x). Pro k = 0 rozumíme 0-krát diferencovatelnými funkcemi funkce spojité. Jestliže existují derivace všech řádů na intervalu, říkáme, že je tam funkce / hladká. Pro funkce se spojitou /c-tou derivací používáme označení třída funkcí Ck (A) na intervalu A, kde k může A. Derivace vyšších řádů Nejprve zaveďme konvenci, jak značit derivace vyšších řádů: druhou derivaci funkce / jedné proměnné budeme značit /" nebo f(2\ derivace od třetího řádu výše pak pouze f(3\ f(4\... f(n\ Na připomenutí ale zahájíme trochu rafinovaným příkladem "pouze" na první derivace. 6.1. Určete následující derivace: i) (x2 ■ sinx)", ii) (**)", iv) (x")(n), v) (sinx)(n). (2xsinx + x2cosx)' = 2 sin x + Solution, (a) (x2 ■ sinx)" 4x cos x — x2 sin x. (b) (x*)" = [(1 +lnx)xxY = xx~1 +xx(l +lnx)2 (C) (^-\0) = _I___§_ K ' \\nx> x2(lnx)2 x2(lnx)4' (d) (x")(n) = [(x")']("_1) = (nxn-1)(n-1) = ... = n!. (e) (sinx)(n) = re(z" sinx) + im(z" cos x). 6.2. Derivujte výraz □ yVT^l ■ (x + 2)3 e* (x + 132)2 proměnné x > 1. 339 A. DERIVACE VYŠŠÍCH ŘÁDŮ 1. DERIVOVÁNÍ Solution. Úlohu vyřešíme pomocí tzv. logaritmické derivace. Nechť je / libovolná kladná funkce. Víme, že je [ln/(x)]' = ^, tj. /'(*) = /(*)• [In/(*)]', pokud derivace f'(x) existuje. Užitečnost tohoto vzorce je dána tím, že pro jisté funkce je jednodušší derivovat jejich logaritmus než je samé. Takový je právě výraz v zadání. Dostáváme totiž tfx~^l ■ (x + 2)3 e*0 + 132)2 (ýYx~^T ■ (x + 2)3 V ýVx^T ■ (x + 2)3 ex(x + 132)2 J T-(x + 2ý r ' + 132)2 ' |_ ln- ex(x + 132)2 ex(x Zfx~^X ■ (x + 2)3 r ex(x + 132)2 3 ln (x + 2) + - ln (x - 1) - x lne - 21n (x + 132) 1 x+2 4(x-l) x + 132 □ 6.3. Nechť n e N je libovolné. Najděte n-tou derivaci funkce y lnf±f, x e (-1,1). Solution. Vzhledem k vyjádření m{±£ = ln(l+x) - ln(l-x) , x e (-1, 1) zavedeme pomocnou funkci /(jc):=ln(fljc + l), x e (-1, 1), a = ±1. Pro x e (—1, 1) lze snadno (postupně) vypočíst /'(*) ax-\-\' „2 (ax + l)2 ' /(3)(x)_ 2« ŕ'Hx) (ax+lý ' -6a4 (flJC + 1)4 " Na základě těchto výsledků můžeme usoudit, že M (-l)n-l(n - l)\a" (6.1) fin)(x)= \ \ J-, jc e (-1,1), n e N. (ax + 1)" Správnost tohoto vzorce ověříme matematickou indukcí. Protože pro n = 1, 2, 3, 4 platí, zbývá ukázat, že z jeho platnosti pro k e N plyne jeho platnost pro k + 1. Neboť přímý výpočet dává (-l)*-'(fc-l)!a* (-*)a _ (-!)*&! ŕ(*+Dfr^ = ((-1)^'»-1)!^V _ _ _ _ / W \ (fljc + 1)* / (ax + l)k+l (ax + l)k+l vzorec (||6.11|) platí pro všechna n e N. Podle něj je lnW(l+x)=(-1f;;[)"„-1)!, In^d-x) = -^ML x e (-1, 1). Odtud již dostáváme výsledek (ln^)w = (B-l)!(^-^) pro x e (— 1, 1) a n e N. □ 6.4. Určete druhou derivaci funkce y = tg x na celém jejím definičním oboru, tj. pro cos x ^ 0. 6.5. Stanovte pátou a šestou derivaci polynomu p (x) = (3x2 + 2x + l) • (2x - 6) • (2x2 - 5x + 9) , x e R. 6.6. Bez počítání uvedte 12. derivaci funkce y = e2x + cos x + x10 - 5x7 + 6x3 - 1 lx + 3, x e M. 6.7. Napište 26. derivaci funkce nabývat hodnot 0, 1, ..., oo. Často píšeme pouze Ck, definiční obor znám z kontextu. je- Pojem derivace vyššího řádu mažeme rychle ilustrovat na polynomech. Protože výsledkem derivování polynomu je opět polynom, ale derivací se vždy o jedničku snižuje jeho stupeň, dostaneme po konečném počtu derivací nulový polynom. Přesněji řečeno, právě po k + 1 derivacích, kde k je stupeň polynomu, dostaneme nulu. Samozřejmě pak existují derivace všech řádů, tj. / e C°° (R). Při konstrukci splajnů, viz 5.9, jsme pohlídali, aby výsledné funkce byly třídy C2(M). Jejich třetí derivace budou po částech konstantní funkce. Proto nebudou splajny patřit do C3(M), přestože jejich všechny derivace vyšších řádů budou nulové ve všech vnitřních bodech jednotlivých intervalů v interpolaci. Promyslete si podrobně tento příklad! Následující tvrzení je jednoduchým kombinatorickým důsledkem Leibnizova pravidla pro derivaci součinu funkcí: Lemma. Jsou-li f a g dvě funkce mající derivaci řádu k v bodě xq, pak má derivaci řádu k i jejich součin a platí: f(i)(xo)g(k- Proof. Pro k = 0 je tvrzení triviální, pro k = 1 je to Leibnizovo pravidlo pro derivaci součinu. Jestliže pravidlo platí pro nějaké k, derivací pravé strany a použitím Leibnizova pravidla dostaneme obdobný výraz £Q0 ;=o x 7 x f(i+1)(xo)g( -i\x0) + f(i\x0)g(k- ■/ + !) (*o) V této nové sumě je součet řádů derivací u součinů v jednotlivých sčítancích k + 1 a koeficienty u f'"U„)g (A) + 0 (x0) jsou součty binomických koeficientů (T)- D 6.2. Násobné kořeny a inverze polynomů. Derivace polynomů jsme spočítali již v odstavci 5.6 a je vidět, že jde o hladké funkce. Derivace je v tomto případě vlastně prosté algebraické zobrazení a podívejme se, jak se nám derivace bude hodit pro diskusi násobných kořenů polynomů. Nejprve zformulujme základní větu algebry, jejíž důkaz odložíme do ??. Theorem. Každý nenulový komplexní polynom f : C —> C stupně alespoň jedna má kořen. Nutně tedy polynom stupně k > 0 má právě k komplexních kořenů včetně násobností a můžeme jej vždy psát jednoznačně ve tvaru /(*) = (x -ai)Ci ■ (x-aq)c«, kde a\, ... ,aq jsou všechny kořeny polynomu / a 1 0 bude f(x) rostoucí, pro sudá n naopak bude nalevo klesající a napravo rostoucí, dosáhne tedy v bodě xo své minimální hodnoty mezi body z (dostatečně malého) okolí bodu x0 = 0. Tentýž pohled můžeme aplikovat na funkci /'. Jestliže totiž je druhá derivace nenulová, určuje její znaménko chování derivace první. Proto v kritickém bodě x0 bude derivace f'(x) rostoucí při kladné druhé derivaci a klesající při záporné. Jestliže je ale rostoucí, znamenená to, že nutně bude záporná nalevo od kritického bodu a kladná napravo od něj. Funkce / v takovém případě je klesající nalevo od kritického bodu a rostoucí napravo od něj. To znamená, že má funkce / v bodě x0 minimum ze všech hodnot z nějakého malého okolí bodu x0. Naopak, je-li druhá derivace záporná v x0, je první derivace klesající, tedy záporná vlevo od x0 a kladná vpravo. Funkce / bude tedy mít v bodě x0 maximální hodnotu ze všech hodnot na nějakém okolí. Funkce diferencovatelná na (a,b) a spojitá na [a,b] má jistě na tomto intervalu absolutní maximum a minimum. f(x) = sinx + xz pro iéí Ukažme si ještě některé zajímavé příklady na užití diferenciálního počtu. Nejpve však zmiňme Jensenovu nerovnost, která hovoří o konvexních, resp. konkávních funkcích a kterou dále využijeme. 6.8. Jensenova nerovnost. Pro ostře konvexní funkci / na intervalu I a pro libovolné body x\, ..., xn e Za reálná čísla c\, taková, že c\ + • • • + cn = 1, platí ,c„ > 0 (n \ n X ci ) < X i = \ / i=\ C i f (Xi) , přičemž rovnost nastane, právě když je x\ = ■ ■ ■ = x„. Solution. Důkaz lze nalézt např. v ||??|| □ Remark. Jensenovu nerovnost lze z formulovat i více intuitivně: těžiště /í^rjf hmotných bodů umístěných na grafu ostře konvexní funkce r*č.j J leží nad tímto grafem. 6.9. Dokažte, že mezi všemi (konvexními) n-úhelníky vepsanými do kružnice má největší obsah právě pravidelný «-úhelník (pro libovolné n > 3). Solution. Očividně stačí uvažovat n-úhelníky, uvnitř kterých leží střed kružnice. Každý takový n-úhelník vepsaný do dané kružnice 0 poloměru r rozdělíme podle obrázku na n trojúhelníků s obsahy 5;, 1 e {1, ..., n}. Vzhledem k tomu, že sinf = s-, cos^ = ^, ie{l.....b], 2 r ' 2 r ' 1 ' platí 5; = Xi h i = r2 sin ^ cos ^ = ^ r2 sin cpi, i e {1, ..., n}. Odsud plyne, že obsah celého «-úhelnfku je S= X5ť = \r2 X sin<£>,-. Z = l Z = l Chceme tedy maximalizovat součet Xľ=i s^n(Pi' přičemž pro hodnoty 0), obvod se také zvětší a-krát a obsah a2-krát (jde o plošnou míru). Takže IQ nezávisí na velikosti obrazce, nýbrž pouze na jeho tvaru. Uvažujme proto pravidelný n-úhelník vepsaný do jednotkové kružnice. Podle obrázku je h = cos cp = cos -, £ = sin cp = sin -, což dává vyjádření pro jeho obvod o = n ■ x = 2n sin — i obsah 5 = n ■ \hx = n cos - sin -. Pro pravidelný n-úhelník tak je Ann cos f sin f _ lM — a„2 ,ir,2 zr — „ COlg n , 4«2 sin2 — n což můžeme ověřit kupř. pro čtverec (n = 4) s délkou strany a, kdy máme „2 in — 4lTa — - — - cote - 1 ^ — (4a)2 — 4 — 4 CUL& 4 • Provedeme-li limitní přechod pro n —> oo s použitím limity lim S£i = 1, jc^O x dostaneme izoperimetrický podíl pro kružnici cos J _ cos 0 IQ = lim £ cotg £ = lim ^ = £^5 = 1. ^ „=v^ " & " „=v^ Sln 7t 1 Pochopitelně jsme také mohli pro kružnici o poloměru r přímo vypočítat j n — Izii — M7"2) _ i 7 U - o2 — (Inr)2 - í- Pro hranici kruhové výseče o poloměru r a středovém úhlu cp e (0,27T)je 2tt^ /<2 4jt5 _ 4jt g- Hledáme tedy maximum funkce f( 0, ~ £)' + T^r(x - § J=o J' Její derivace (přičemž x je pro nás konstantní parametr) je 7=1 W /w+1)(É)(jc-$y i a-i)! /(^)(x-§) '-) i (k-i) ■r(x - £) k-l 1 /w(§)(x-§) (*-l)! 1 k-l 1 (*- 1)! r(x - £) yfc—1 (JC_^-1(/W(|)_r)) (*)/ (k-\)\ protože výrazy v sumě se postupně vzájemně ruší. Nyní si stačí všimnout, že F (a) = F(x) = f(x) (připomeňme, že x je libovolně zvolená ale pevná hodnota v intervalu (a, b)). Proto podle Rolleovy věty existuje číslo c, a < c < x, takové, že F'(c) = 0. To aleje právě požadovaný vztah. □ 6.5. Odhady pro rozvoje se zbytkem. Obzvlášť jednoduchý je Taylorův rozvoj libovolného polynomu f(x) = anx" + an_ix"~l + • • • + a\x + oq, an ^ 0. Protože je (n + l)-ní derivace / identicky nulová, má Taylorův polynom stupně n nulový zbytek a tedy je pro každé x0 e R f (x) = f(x0) + f'(x0)(x -*<,) + ... + l/(»)(x0)(x - x0)n n\ a všechny derivace snadno vyčíslíme (např. poslední výraz je vždy tvaru a„(x — xq)"). Tento výsledek je velmi speciálním odhadem chyby v Taylorově rozvoji se zbytkem. Víme totiž předem, že zbytek je odhadnutelný pomocí velikosti derivace a ta je u polynomu od určitého řádu identicky nulová. I obecněji vede odhad velikost k-té derivace na nějakém intervalu k odhadu chyby na temže intervalu. Speciálním případem je také věta o střední hodnotě coby aproximace Tay-lorovým rozvojem řádu nula, viz (5.9). Funkce / tedy nabývá maximální hodnoty pro 0 s vlastností c\ + • • • + cn = 1. Dále víme, že v této nerovnosti nastane rovnost právě tehdy, když je x\ = ■ ■ ■ = xn. Volbou A ' X' i e {1, pak dostaneme Jednoduchými úpravami přejdeme k nerovnici 2 „ „ < iy £l — A f—i Xi a poté (uvažte, že Xľ=i °t = $ n 2 x j. i = l 343 A. DERIVACE VYŠŠÍCH ŘÁDŮ 1. DERIVOVÁNÍ přičemž opět rovnost nastává právě pro (6.3) x\ = ■ ■ ■ = x„, tj- ^ ~kn Odsud vyplývá, že S je nejmenší, právě když platí (||6.3||). Tato nejmenší hodnota S je fi /(4n A). Zbývá stanovit délky nastříhaných částí oi. Pokud je (||6.3||) splněno, musí zjevně být o; = kki pro každé i € {1, ... ,n} a jistou konstantu k > 0. Z n n n Z 0; = l a současně J o; = í: ^ h = k A i — l i — l i — l ihned plyne, že k = l/A, tj. Oi = %l, i e {1, ..., n}. Podívejme se na konkrétní situaci, kdy máme provázek o délce 1 m rozříznout na dva menší a z nich potom vytvořit čtverec a kruh tak, aby součet jejich obsahů byl co nejmenší. Pro čtverec a kruh je po řadě (viz příklad nazvaný Izoperimetrický podíl) M=£, *2 = 1, tj. A=A1+A2 = 4^. Délky příslušných částí tak jsou (v metrech) °i = A • 1 = 4+T = 0- 56< 02 = ^-1 = ^=0,44. Obsah čtverce o obvodu 0, 56 m (s délkou strany a = 0, 14 m) je 0, 019 6 m2 a obsah kruhu s obvodem 0, 44 m (a poloměrem r = 0, 07 m) pak činí přibližně 0, 015 4 m2. Můžeme ověřit, že (v m2 i ji____ 4jtA 4(4+jt) 0,035 = 0, 019 6 + 0,015 4. □ Taylorovy rozvoje. Derivace vyšších řádů nutně potřebujeme k tomu, abychom určili Taylorův rozvoj dané funkce. 6.12. Určete Taylorovy rozvoje Tk (k-tého řádu v bodě x) z následujících funkcí: i) T03 z funkce sin x, ii) T? z funkce —. ' 1 X Solution. (i) Spočítáme hodnoty první až třetí derivace funkce / = sin v bodě 0: /'(0) = cos(0) = 1, f(2)(0) = - sin(0) = 0, /(3)(0) = — cos(0) = — 1, dále /(0) = 0 Taylorův rozvoj 3-tího řádu funkce sin(jc) v bodě 0 je tedy 1 a T0 (sin(jc)) = x (ii) Opět /(l) = e, /'(l) = /(2)(D = /(3)(D = x ex x ex x x=l ex2 2ex 2- + — x x3 x = l + 6ex 6ex -2e x = l Dostáváme tedy Taylorův rozvoj třetího řádu funkce y v bodě 1: -3 3x2 . 5 TH-)=e + -(x-iy -M -1) x e(--+ V 3 2 2x + -). Dobrým příkladem pro rozvoj libovolného stupně jsou goniometrické funkce sin a cos. Iterováním derivace funkce sinx dostaneme vždy buď sinus nebo cosinus s nějakým znaménkem, ale v absolutní hodnotě budou hodnoty vždy nejvýše jedna. Dostáváme tedy přímý odhad rychlosti konvergence mocninné řady \x\k+1 I sin x — (71 n sin) (x) I < -. Ukazuje, že pro x výrazně menší než k bude chyba malá, pro x srovnatelné s k nebo větší ale bude obrovská. Srovnej s obrázkem aproximace funkce cos x Taylorovým polynomem stupně 68 v odstavci 5.51. Jak jsme zmínili v úvodu diskuse Taylorova rozvoje funkcí, pokud začneme s mocninnou řadou f(x) se středem v bodě a, pak její částečné součty splývají s Taylorovými polynomy Tkaf(x). Následující tvrzení je jednou z jednoduchých formulací opačné implikace, tj. kdy je daná funkce f(x) ve skutečnosti mocninnou řadou. Corollary (Taylorova věta). Předpokládejme, že funkce f(x) je na intervalu (a — b, a + b) hladká a že všechny její derivace jsou zde omezeny stejnoměrně konstantou M > 0, tj- \fik)(x)\ < M, k = 0, 1, ..., x e (a - b, a + b). Pak mocninná řada S(x) = Z^Lo \l.f^(a)(x ~ aT konverguje na intervalu (a — b, a + b) k funkci f(x). Proof. Důkaz je shodný s úvahou v konkrétním případě fukce cosx výše. Promyslete si podrobnosti! □ 6.6. Analytické a hladké funkce. Je-li / v bodě a hladká, pak můžeme napsat formálně mocninnou řadu 5(x) «=o Y^^ŕ'HaXx-ay. Pokud tato mocninná řada má nenulový poloměr konvergence a zároveň platí 5(x) = f(x) na příslušném intervalu, pak říkáme, že / je analytická funkce v bodě a. Funkce je analytická na intervalu, je-li analytická v každém jeho bodě. Ne všechny hladké funkce jsou ale analytické. Ve skutečnosti lze dokázat, že pro každou posloupnost čísel an umíme najít hladkou funkci, jejiž derivace řádů k budou tato čísla ak.1 Abychom si alespoň představili podstatu problému, ukážeme si (jak se později uvidí velice užitečnou) funkci, která má v nule všechny derivace nulové, je však všude kromě tohoto bodu nenulová. Uvažme funkci definovanou vztahem fix) -l/x1 Jde o speciální případ tzv. Whitneyho věty, viz. doplnit citaci a 344 CHAPTER 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET Evidentně jde o dobře definovanou hladkou funkcí ve všech bodech x ^ 0. Ověříme, že bodě x = 0 existuje limita lim^o f(x) = 0. Můžeme proto dodefinovat /(O) = 0 a získáváme spojitou funkci. Přímým výpočtem s použitím LHospitalova pravidla vyjádříme derivaci a stačí přitom počítat derivaci zprava, protože jde o sudou funkci. /'(O) lim -i/*2 _0 lim 1 lim 0. Derivací funkce f(x) v obecném bodě i / O dostaneme f'(x) = e~1/x -2x~3 a opakovaným derivováním výsledků dostaneme vždy součet konečně mnoha členů tvaru C • e -l/x1 kde C je nějaké celé číslo a j je přirozené číslo. Budeme tedy předpokládat, že jsme už dokázali, že derivace řádu k naší funkce f(x) existuje a je v nule nulová. Při výpočtu následující derivace budeme opět počítat stejně jako v případě k = 0 výše. Budeme počítat limitu výrazu f{k)(x)/x pro x -» 0+, tj. konečný součet limit výrazů x~i t~xl%1 = x~i I exl%1. To jsou samé výrazy typu oo/oo, na které můžeme opakovaně použít LHospitalovo pravidlo. Zjevně po několika derivacích čitatele i jmenovatele (a obdobné úpravě jako v případu výše) bude ve jmenovateli stále stejný výraz, zatímco v čitateli již bude mocnina nezáporná. Celý výraz tedy nutně má v nule limitu nulovou, stejně jako jsme spočítali v případě první derivace výše. Totéž tedy bude platit pro konečný součet takových výrazů a zjistili jsme, že bude v nule existovat i každá derivace f(k\x) a její hodnota bude nula. Ukázali jsme, že naše funkce f(x) je hladká na celém M, je samozřejmě nenulovou funkci všude mimo x = 0, všechny její derivace v tomto bodě jsou ale nulové. Samozřejmě to tedy není analytická funkce v bodě x0 = 0. 6.7. Příklady neanalytických hladkých funkcí. Snadno Ji< můžeme naši funkci f(x) z předchozího odstavce modifikovat takto: 0 je-li x < 0 q-I/x2 je_JJ x > Q Opět jde o hladkou funkci na celém M. Další úpravou můžeme získat funkci nenulovou ve všech vnitřních bodech intervalu [—a, a], a > 0 a nulovou jinde: h(x) 0 je-li \x\ > a je-li \x\ < a. Tato funkce je opět hladká na celém M. Poslední dvě funkce jsou na obrázcích, vpravo je použit parametr a = 1. □ 6.13. Určete Taylorův polynom T06 funkce sin a pomocí věty (6.4) odhadněte chybu polynomu v bodě jt/4. Solution. Podobně jako v předchozím příkladu určíme ro6(sin(x)) = x 1 x3 + 1 121? Dle věty 6.4 pak odhadneme velikost zbytku (chyby) R. Podle věty existuje ce (0, j) takové, že - COS(c)7T7 R (it/4) 7!47 < - = 0, 0002. 7! □ 6.14. Najděte Taylorův polynom 3. stupně funkce y = arctg x, x e M. v bodě x0 = 1. 6.15. Určete Taylorův rozvoj 3. řádu v bodě xq = 0 funkce (a) y = v ' J COS x ' ,2 (b) y = e 2 ; (c) y = sin (sin x) ; (d) y = tg x; (e) y = ď sin x definované v jistém okolí bodu x0. 6.16. Stanovte Taylorův rozvoj 4. řádu funkce y = lnx2, x e (0, 2) v bodě x0 = 1. 6.17. Nalezněte odhad chyby přibližného vyjádření ln(l +x) pro x e (-1,0). 6.18. Napište Taylorův polynom 4. stupně funkce y = sinx, x else středem v počátku. Pomocí tohoto polynomu přibližně vyčíslete sin 1° a stanovte limitu lim x x^0+ x 6.19. Uvedte Taylorův polynom se středem v počátku stupně alespoň 8 funkce y = e2x, x e M. 6.20. Polynom x3 — 2x + 5 vyjádřete jako polynom v proměnné u = x - 1. 6.21. Rozviňte funkci ln(l + x) do mocninné řady v bodech 0 a 1 a určete všechna x e M, pro která tyto řady konvergují. Solution. Nejprve určeme rozvoj v bodě 0. Rozvinout funkci do mocninné řady v daném bodě je to stejné, jako určit její Taylorův rovoj v daném bodě. Snadno nahlédneme, že [ln(x + l)](n) = (-l) (x + 1)"' takže vyčíslením derivací v nule máme ln(x + 1) = ln 1 + ^ anxn , «=i kde 345 A. DERIVACE VYŠŠÍCH ŘÁDŮ 1. DERIVOVÁNÍ (_l)»+i(n_ i)! (_i) n + l Můžeme tedy psát ln(x + 1) nl 1 2 1 3 1 4 X--X + -x--X + 2 3 4 t—l n n = \ Pro poloměr konvergence potom použijeme limitu podílu následujících koeficientů členů mocninné řady 1 1 lim„_ lim *+1 1. Řada tedy konverguje pro libovolné x e (—1,1). Pro x = — 1 dostáváme harmonickou řadu (se znaménkem minus), pro x = 1 dostáváme aternující harmonickou řadu, která podle Leibnizova kriteria konverguje. Daná řada proto konverguje právě pro x e (—1, 1]. Pro rozvoj v bodě 1 dostáváme podobně vyčíslením výše uvedených derivací z || 6.211| ln(x + 1) = ln(2) + l-(x - 1) - l-(x - lf + = \n(2) + YJ-^r(x - l)\ 1 3 -23 (x - 1)J «=i n ■ 2" pro poloměr konvergence této řady pak dostáváme 1 1 lim„ 1. lim„_ 2"+' (n+l) 1 2"n První řada konverguje pro —1 < x < 1, druhá pro — 1 < x < 3. □ 6.22. Rozviňte funkci (a)y = lnj±f, x e (-1, 1); -2x (b) y = ex + x1- eT^, x e do Taylorovy řady se středem v počátku. Solution. Pokud lze funkci vyjádřit jako součet mocninné řady (s kladným poloměrem konvergence) na jejím oboru konvergence, pak je tato řada nutně Taylorovou řadou uvažované funkce (svého součtu). To nám umožní snadno najít příslušné Taylorovy řady. Případ (a). Víme, že je oo ln(l+x) = Z (-^—x", jte(-l,l), «=i tj- oo ln(l - x) = Z Celkem máme (-D" (-x)" y1 x". t—' n x e (-1, 1). In l-x ln(l +x) - ln(l - x) = Z «=i «=i Z «=1 2 v2«-l 2«-l X Nakonec ještě ukážeme, jak lze dostat hladké analogie Heavisideových funkcí. Pro dvě pevně zvolená reálná čísla a < b definujeme funkci f(x) s použitím výše definované funkce g takto: fix) g(x - a) g(x - a) + g(b - x) Zjevně je pro každé x e M jmenovatel zlomku kladný (pro každý z intervalů určených čísly a a b je totiž alespoň jeden ze sčítanců jmenovatele nenulový a tedy je celý jmenovatel kladný). Dostáváme z našeho definičního vztahu proto hladkou funkci f(x) na celém M. Při x < a je přitom jmenovatel zlomku přímo dle definice funkce g nulový, při x > b je čitatel i jmenovatel stejný. Na dalších dvou obrázcích jsou právě funkce f(x) a to s parametry a = í — a,b = í+a, kde nalevo je a = 0.8 a napravo a = 0.4. Snadno nyní také vytvoříme hladkou obdobu charakteristické funkce intervalu [c, ď\. Označme si jako f€(x) výše uvedenou funkci f(x) s parametry a = — e, b = +e. Nyní pro interval (c, d), s délkou d — c > 2e definujeme funkci h€(x) = f€(x — c) ■ f€(d — x). Tato funkce je identicky nulová na intervalech (—oo, c — e) a (d + e, oo) a je identicky rovna jedné na intervalu (c + e, d — e), přičemž je všude hladká a lokálně je buď konstantní nebo monotóní. Čím menší je e > 0, tím rychleji naše funkce přeskočí z nuly na jedničku kolem začátku intervalu nebo zpět na konci intervalu. Vidíme tedy, že hladké funkce jsou velice "plastické" — z lokálního chování kolem jednoho bodu nemůžeme říci vůbec nic o globálním chování takové funkce. Naopak, analytické funkce jsou zcela určené dokonce jen derivacemi v jediném bodě. Zejména jsou tedy bezezbytku určené svým 346 CHAPTER 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET chováním na libovolně malém okolí jediného bodu ze svého definičního oboru. Jsou tedy v tomto smyslu velice "rigidní". 6.8. Lokální chování funkcí. Viděli jsme, že znaménko _ první derivace určuje u každé diferencovatelné funkce, zda roste nebo klesá na nějakém okolí daného bodu. Pokud je ale t////' ■ derivace nulová, sama o sobě mnoho o chování funcke neříká. Už jsme se ale setkali s významem druhé derivace při popisu kritických bodů. Teď zobecníme diskusi kritických bodů pro všechny řády. Začneme diskusí lokálních extrémů funkcí, tj. hodnot, které jsou ostře větší nebo ostře menší než všechny ostatní hodnoty z nějakého okolí daného bodu. Budeme v dalším uvažovat funkce s dostatečným počtem spojitých derivací, aniž bychom tento předpoklad přímo uváděli. Řekneme, že bod a v definičním oboru funkce / je kritický bod řádu k, jestliže platí f'(a) f(k)(a)=0, f«+L>{a)rO (k+l), Předpokládejme, že f{k+l)(a) > 0. Pak je tato spojitá derivace kladná i na jistém okolí O(a) bodu a. Taylorův rozvoj se zbytkem nám v takovém případě dává pro všechna x z O (a) f(x) = f (a) + 1 f(k+l)(c)(x-a) k+l (k + l)V Je proto změna hodnot f(x) v okolí bodu a dána chováním funkce (x — a)k+1. Je-li přitom k + l sudé číslo, jsou nutně hodnoty f(x) v takovém okolí větší než hodnota f (a) a zjevně je proto bod a bodem lokálního minima. Pokud je ale k sudé číslo, pak jsou hodnoty vlevo menší a vpravo větší než než f (a), extrém tedy ani lokálně nenastává. Zato si můžeme všimnout, že graf funkce f(x) protíná svoji tečnu y = f (a) bodem [a, f (a)]. Naopak, je-li f(k+l\a) < 0, pak ze stejného důvodu jde o lokální maximum při lichém k a extrém opět nenastává pro k sudé. 6.9. Konvexní a konkávni funkce. Říkáme, že diferencovatelná funkce / jev bodě a konkávni, jestliže se její graf nachází v jistém okolí celý pod tečnou v bodě [a, f (a)], tj. požadujeme f(x) < f (a) + f'(a)(x - a). Říkáme, že funkce / je konvexní v bodě a, jetliže naopak je její graf nad tečnou v bodě a, tj. f(x) > f (a) + f'(a)(x - a). Funkce je konvexní nebo konkávni na intervalu, jestliže má tuto vlastnost v každém jeho bodě. Předpokládejme navíc, že má funkce / spojité druhé derivace v okolí bodu a. Z Taylorova rozvoje druhého řádu pro x e (—1, 1). Případ (b). Podobně ze známé identity e* = V ± x" , iéM, ní ' ' «=0 plyne «=o «=o a x2 e~2x = x2 X i (-2*)" = Z {-^f- xn+2. x e «=0 ' «=0 Platí tudíž ď2 +x2e~2x = T *2"+(-2)"*"+2 1 ní ' x e «=0 □ R 6.23. Určete Taylorovu řadu se středem v počátku funkce (a) y x e (-1, 1); (l+x)2 ' (b) y = arctgx, x e (—1, 1). Solution. Případ (a). Využijeme vzorec rk = X(-*)" = X(-l)"*". x e (-1,1) «=o «=o o součtu geometrické řady. Jeho derivováním dostáváme i " (l+x)2 (oo \ ' oo X(-i)"*" = x< «=0 / n=\ (-l)"ř2x"-\ X G (-1,1), přičemž (x0)' = 0, a tak je dolní index n = 1. Vidíme, že i «=1 Případ (b). Derivaci funkce y = arctg t umíme vyjádřit jako oo oo (arctgí)' = 7^7f = XHT = X(-l)"í2", te(-l,l). «=0 «=0 Protože pro x e (—1, 1) je X f (arctg t)' dt = arctgx — arctg 0 = arctgx x / oo \ oo/ x \ / X(-l)"ř2" )dt = X \(-l)n Jt2" dt) o \«=o / «=o V o / (-1)" v2« + l ^ 2n + l X n=0 máme již výsledek arctgx = X ^x2n+l, jce(-l.l). «=o □ 6.24. Najděte Taylorovu řadu se středem x0 = 0 funkce X f(x) = f ucosu2du, x e R. o Solution. Z vyjádření cos t = T Vtt t , t e ' (lny. ' «=0 plyne 347 A. DERIVACE VYŠŠÍCH ŘÁDŮ 1. DERIVOVÁNÍ oo «=0 a následně (pro iéM) wcosw2 = u Z 75^7 (w2)2" = Ž y$-u4"+1> 11 e «=0 se zbytkem dostáváme x x / oo n \ /(jc) = J u cos u2 du = / I Z m4"+1 ) o o V«=o / oo / n x \ oo = Z I 72^)T J" "4" + 1 ^"1 = Z (2„)! (4n+2) x4"+2 " «=0 \ 0 / «=0 6.25. Na intervalu konvergence (—1, 1) stanovte součet řady oo Z n (n + 1) jc" . Solution. Platí □ «=i oo oo / oo \ ' X"(n + l)Jc" = Z" = í Z njc"+1 ) = « —1 n — 1 \n — 1 / (ľ»->"-' = p Z(.ť)'l = \ý 1 (-i+MÍ n = \ >(-l + (l-x)3 1 \-x 1 provšechnax e (—1, 1). □ 6.26. Rozviňte do mocninné řady funkci cos2(x) (tj. určete Taylorův rozvoj funkce) v bodě 0 a určete pro která reálná čísla tato řada konverguje. 6.27. Rozviňte do mocninné řady funkci sin2(x) v bodě 0 a určete pro která reálná čísla tato řada konverguje. 6.28. Rozviňte do mocninné řady funkci ln(x3 + 3x2 + 3x + 1) v bodě 0 a určete, pro která x e M konverguje. 6.29. Rozviňte do mocninné řady funkci ln y/x v bodě 1 a určete, pro která x e M konverguje. Další příklady na Taylorovy polynomy a řady naleznete na straně 400. Nyní uvedeme několik "klasických" příkladů, ve kterých budeme vyšetřovat průběh různých funkcí. 6.30. Stanovte obor hodnot funkce e*-l e* + l ' /(*) x e Solution. Přímka y = 1 je zjevně asymptotou funkce / v +oo a přímka y = — 1 asymptotou v — oo, neboť lim e"-1 x^-oc Z nerovnosti lim 1, lim e*-l _ 0^ e* + l — 0+1 -1. > 0, x e dále plyne, že / je spojitá a rostoucí na M. Oborem hodnot je tedy interval (-1, 1). □ 2 6.31. Uvedte všechny intervaly, kde je funkce y = e~x , x e M konkávni. 6.32. Uvažujte funkci y = arctg^-, x^O(xeM). 1 f (x) = f (a) + f'(a)(x -a)+ ^-f"(c)(x - a)2. Proto je zjevně funkce konvexní, kdykoliv je f "(a) > 0, a je konkávni, kdykoliv f" (a) < 0. Pokud je druhá derivace nulová, můžeme použít derivace vyšších řádů. Stejný závěr ovšem umíme učinit pouze, pokud první další nenulová derivace po první derivaci bude sudého řádu. Pokud bude naopak první nenulová řádu lichého, bude zjevně body grafu funkce na různých stranách nějakého malého okolí zkoumaného bodu na opačných stranách tečny v tomto bodě. 6.10. Inflexní body. Bod a nazýváme inflexní bod diferencovatelné funkce /, jestliže graf funkce / přechází z jedné strany tečny na druhou. Předpokládejme, že / má spojité třetí derivace a napišme si Taylorův rozvoj třetího řádu se zbytkem: /(*) = / (a)+f'(a) (x-a)+\f" (a) (x-a)2+\ f"'(c) (x-af. 2 o Je-li a nulový bod druhé derivace takový, že f "(a) ^ 0, pak je třetí derivace nenulová i na nějakém okolí a jde proto zjevně o inflexní bod. Znaménko třetí derivace nám v takovém případě určuje, zda graf funkce přechází tečnu zdola nahoru nebo naopak. Pokud je bod a navíc izolovaným nulovým bodem druhé derivace a zároveň inflexním bodem, pak zjevně je na nějakém malém okolí bodu a funkce na jedné straně konkávni a na druhé konvexní. Inflexní body tedy můžeme také vnímat jako body přechodu mezi konkávním a konvexním chováním grafu funkce. 6.11. Asymptoty grafu funkce. Uvedeme ještě jednu dobrou pomůckou pro náčrtek grafu funkce. Zkusíme zjistit tzv. asymptoty, tj. přímky, ke kterým se blíží hodnoty funkce /. Asymptotou v nevlastním bodě oo je taková přímka y = ax + b, pro kterou je lim (f(x) — ax — b) = 0. x^-oc Říkáme jí také asymptota se směrnicí. Pokud taková asymptota existuje, platí lim (f(x) — ax) = b a tedy existuje i limita ,. fix) lim - = a. x^oo x Pokud ovšem existují poslední dvě limity, existuje i limita z definice asymptoty, jde proto i o podmínky dostatečné. Obdobně se definuje a počítá asymptota i v nevlastním bodě —oo. Tímto způsobem dohledáme všechny potenciální přímky splňující vlastnosti asymptot se směrnicí. Zbývají 348 CHAPTER 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET nám případné přímky kolmé na osu x: Asymptoty v bodech a el jsou přímky x = a takové, že funkce / má v bodě a alespoň jednu jednostrannou limitu nekonečnou. Hovoříme tako o asymptotách bez směrnice. Např. racionální funkce lomené mají v nulových bodech jmenovatele, které nejsou nulovými body čitatele, asymptotu. Spočtěme aspoň jeden jednoduchý příklad: Funkce f(x) = x + ^ má za asymptoty přímky y = x a x = 0. Skutečně, jednostranné limity zprava a zleva v nule jsou zjevně ±00, zatímco limita f(x)/x 1 + 1/x2 je samozřejmě v nevlastních bodech právě ±1, zatímco limita f(x) — x = 1/x je v nevlastních bodech nulová. Derivací obdržíme f'(x) = l-x-\ f"(x)=2x-\ Funkce f'(x) má dva nulové body ±1. V bodě x = 1 má funkce lokální minimum, v bodě x = — 1 lokální maximum. Druhá derivace nemá nulové body v celém definičním oboru (—00, 0) U (0, 00), proto nemá naše funkce žádný inflexní bod. n—1—1—1—1—1—1—1—1—1—1—re -i—1—1—1—1—1—1—1—1—1—1—n 2 4 6.12. Diferenciál funkce. Při praktickém používání diferenciálního počtu často pracujeme se závislostmi mezi různými veličinami, řekněme y a x, a není dána pevně volba závislé a nezávislé proměnné. Explicitní vztah y = f (x) s nějakou funkcí / je tedy jen jednou z možností. Derivování pak vyjadřuje, že okamžitá změna y = f (x) je úměrná okamžité změně x a to s úměrou f'(x) fa-(x). Tento vztah se často píše jako df(x) dl dx (x)dx, kde df(x) interpretujeme jako lineární zobrazení přírůstků dané df(x)(Ax) = f'(x) ■ Ax, zatímco 1 a /(—x) = f(x) pro všechna x e M, tj. funkce / je kladná a sudá. Bod [0, 1] jako jediný průsečík grafu / s osami proto dostaneme dosazením x = 0. Limitní chování funkce má smysl uvažovat pouze v ±00 (neexistují body nespojitosti), kde lehce určíme (6.4) lim $\x |3 + 1 = lim ^[T]3 >±oo ±00 lim I x + OO. Nyní přistoupíme ke zkoumání průběhu funkce pomocí jejích derivací. Pro x > 0 je f(x) = v'x3 + 1 = (x3 + 1) a tedy (6.5) /'(x)=4(x3 +lp3x2 = 5 3, (x3 + 1)' > 0, x > 0. Odtud vyplývá, že funkce / je rostoucí na intervalu (0, +00). Vzhledem ke své spojitosti v počátku je však nutně / rostoucí na [0, +00). Neboť se jedná o sudou funkci, víme dále, že na intervalu (—00, 0] klesá. Má tak jediné lokální minimum v bodě x0 = 0, které je současně (ostrým) minimem globálním. Protože nekonstantní spojitá funkce zobrazuje interval na interval, je oborem hodnot / právě [1, +00) (uvažte /(x0) = 1 a (||6.4||)). Všimněme si, že díky sudosti funkce jsme nemuseli počítat derivaci /' na záporné poloose, kterou lze však snadno určit náhradou | x | = (—x) -x3 se ziskem /'(x) = i (-x3 + I)" (-3x: < 0, x < 0. Při výpočtu /'(0) můžeme vyjít přímo z definice nebo pomocí limit v2 „ v2 lim v/(*3+i)2 0 lim v/h3+i)2 349 A. DERIVACE VYŠŠÍCH ŘÁDŮ 1. DERIVOVÁNÍ stanovit jednostranné derivace a následně /'(O) = 0. Ve skutečnosti jsme nemuseli počítat první derivaci ani na kladné poloose. K tomu, abychom obdrželi, že / roste na (0, +oo), si stačilo uvědomit, že funkce y = šfx a v = x3 + 1 jsou rostoucí na M a že kompozice rostoucích funkcí je funkce rostoucí. Snadno pro x > 0 však z (||6.5||) vypočítáme druhou derivaci tj. po úpravě máme (6.6) f"(x) -- 7(*3+i)4 2x f( > o, x > 0. x3 + 1 Podobně můžeme spočítat 2xf{ X3 +1) f-lx^{-x3+l)-l{-^) -x3 + 1 2x > 0, -x3 + 1 pro x > 0 a poté /"(0) = 0. Dále pak limitním přechodem: 2x = = 0 = lim 2x lim x^0+ 3+iy *^o- 7(-*3+i)3 I) Je / rľze konvexní na intervalu (0, +oo). Podle nerovnosti (||6. Také dostáváme ryzí konvexnost funkce / na (—oo, 0). K tomuto závěru ovšem opět nebylo potřeba druhou derivaci pro x < 0 počítat: stačilo využít sudosti zadané funkce. Celkem jsme pak obdrželi, že / je konvexní na celém svém definičním oboru (nemá inflexní body). K vykreslení grafu funkce ještě potřebujeme nalézt asymptoty (vyčíslení funkce v jistých bodech přenecháváme čtenáři). Neboť je funkce / spojitá na M, asymptoty bez směrnice mít nemůže. Přímka y = ax + b je pak asymptotou se směrnicí pro x -» oo tehdy a jenom tehdy, když existují (jako vlastní) obě limity tel-~ \im(f(x)-ax) = b. x^-oc —oo. Z limit lim = a, JC^OO x Analogické tvrzení platí pro x - lim lim lim (/(x) Jx^+l lim ^- = 1, lim ( 1 • x) = lim (ýx3 + 1 - x) lim J(xl + l)2+xjx^+l+x2 j{x3 + lf+xjx3+~l+x2 lim ) 1 3x2 0 ^{xl + lf+xJxl+A+x2 tak již plyne, že přímka y = x je asymptotou v +oo. Když znovu uvážíme, že funkce / je sudá, bezprostředně obdržíme přímku y = —x jako asymptotu v — oo. □ 6.37. Vyšetřete průběh funkce /(*) cos 2x ' Solution. Do definičního oboru náleží všechna x e M, pro která je cos2x 0. Rovnice cos2x = 0 je splněna právě pro 2x = f + kjt, k e Z, tj. - 71 ' te Z Taylorovy věty tedy vyplývá, že funkce s ohraničenou derivací /' má diferenciál df. To zejména v bodě x nastane, když je v něm první derivace f'(x) existuje a je spojitá. Pokud je veličina x vyjádřena pomocí další veličiny ř, tj. x = g(t), a to opět funkcí se spojitou první derivací, pak pravidlo o derivaci složené funkce říká, že i složená funkce f o g má opět diferenciál d f dx d f (t) = -j-(x) — (t)dt. dx dt Můžeme proto vnímat d f jako lineární přiblížení dané veličiny v závislosti na přírůstcích závislé proměnné, ať už je tato závislost dána jakkoliv. 6.13. Křivost grafu funkce. Abychom se pocvičili v základních pravidlech pro derivování složených funkcí apod., budeme graf hladké funkce f(x) teď chvíli diskutovat jako zvláštní případ parametrizované křivky v rovině. Můžeme si ji představit jako pohyb v rovině parametrizovaný pomocí nezávislé proměnné x. Pro libovolný bod x z definičního oboru naší funkce můžeme okamžitě výpočtem první derivace vidět vektor (1, f'(x)) e M2, který představuje okamžitou rychlost takového pohybu. Tečna bodem [x, fix)'] parametrizovaná pomocí tohoto směrového vektoru pak představuje lineární přiblížení křivky. Viděli jsme už také, že v případě, že fix) = 0 a zároveň f"'ix) ^ 0, přechází graf naší funkce přes svoji tečnu, tzn. že tečna je i nejlepším přiblížením křivky v bodě x i do druhého řádu. To zpravidla popisujeme tvrzením, že má graf funkce / v bodě x nulovou křivost. Tak jak u první derivace nenulové hodnoty vyjadřovaly rychlost růstu (ať už s jakýmkoliv znaménkem), stejně asi intuitivně očekáváme, že druhá derivace bude popisovat míru zakřivení grafu. Zatím jsme jen viděli, že je graf funkce nad svojí tečnou pro kladnou hodnotu a pod tečnou v případě opačném. Tečnu grafu v pevném bodě P = [x, fix)] jsme dostali pomocí limity sečen, tj. přímek procházejícími body P a Q = [x + Ax, fix + Ax)]. Chceme-li přiblížit druhou derivaci, budeme body P a Q ^ P prokládat kružnicí Cq, jejíž střed je na průsečíku kolmic na tečny, vztyčených v bodech P a Q. Z obrázku je patrné, že jestliže tečna v pevném bodě P svírásosoux úhela atečnav Q úhela+Aa, pak i úhel zmíněných kolmic v jejich průsečíku bude Aa. Označíme-li poloměr naší kružnice p, pak délka oblouku kružnice mezi body P a. Q bude p A a. Jestliže budeme limitně přibližovat bod Q k pevnému bodu P, bude se zároveň délka oblouku kružnice blížit délce s studované křivky, tj. grafu funkce / (x), a kružnice limitně přejde do kružnice CP. Dostáváme tedy pro limitní poloměr p kružnice CP základní vztah As ds P lim Aa^O Aa da Křivost grafu funkce / v bodě P definujeme jako číslo 1/p. Nulová křivost tedy odpovídá nekonečnému poloměru p. 350 CHAPTER 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET Pro výpočet poloměru p potřebujeme umět vyjádřit délku oblouku s pomocí změny úhlu a a derivaci této funkce pak vyjádřit pomocí derivací funkce /. Všimněme si již teď, že při rostoucím úhlu 6 může délka oblouku buď také růst nebo klesat, podle toho, jestli má kružnice C q střed nad nebo pod grafem funkce /. Znaménko p nám tedy odráží, zda je funkce konkávni nebo konvexní. Je třeba také pomyslet na zvláštní případ, kdy střed limitně "uteče" do nekonečna, tj. místo kružnice limitně dostaneme přímku a to opět tečnu. Evidentně nemáme přímý nástroj na vyčíslení derivace Víme však, že tg a = df/dx a derivováním této rovnosti podle x dostaneme (s využitím pravidla pro derivaci složených funkcí) 1 da --= f ■ (cos a)2 dx Na levé straně můžeme dosadit -—1—7 = 1 + (tg a)2 = 1 + (cosa)z v D ' {f')2 a proto platí také (viz pravidlo pro derivování inverzní funkce) dx_ = l + (tgcQ2 = 1 + (f)2 da f" f" To už jsme ale skoro hotoví, protože přírůstek délky oblouku s v závislosti na proměnné x je dán vztahem £ = (i + (f)2Ý/2 dx a tedy můžeme již snadno spočíst podle pravidla pro derivování složené funkce ds ^ da dx da ds dx (1 + (J')2)3'2 f" Nyní již můžeme vyčíst vztah křivosti a druhé derivace: čitatel našeho zlomku je, nezávisle na hodnotě první derivace, vždy kladný. Je roven třetí mocnině velikosti tečného vektoru ke studované křivce. Znaménko křivosti tedy je dáno jen znaménkem druhé derivace, což jen znovu potvrzuje naši úvahu o konkávních a konvexních bodech funkcí. V případě, že je druhá derivace nulová, dostaneme i křivost nulovou. Kružnici, pomocí které jsme křivost definovali nazýváme oskulační kružnicí. Zkuste si spočíst křivost jednoduchých funkcí sami a využijte oskulační kružnice při náčrtech jejich grafů. Ne-jjednodušší je výpočet v kritických bodech funkce /, protože v těch dostáváme poloměr oskulační kružnice jako reciprokou hodnotu druhé derivace opatřenou znaménkem. 6.14. Vektorový diferenciální počet. Jak jsme zmínili hned v úvodu k páté kapitole, pro naše úvahy % o derivování bylo vesměs podstatné, že jsme zkoumali funkce definované na reálných číslech a že jejich hodnoty lze mezi sebou sčítat a lze je násobit reálnými čísly. Potřebujeme proto, aby naše funkce / : M -» V měly hodnoty ve vektorovém Jako definiční obor tak obdržíme množinu M\{f + kf; k e Z}. Zřejmě je f(-x) = SSSL^L = S£H_= f(x) J ' cos(—2x) cos 2x J • ' pro všechna x z definičního oboru, a tudíž je / s definičním oborem symetrickým kolem počátku sudou funkcí, což vyplynulo ze sudosti funkce y = cos x. Když dále uvážíme, že kosinus je periodický s periodou 2n (tj. y = cos2x má periodu jt), dostaneme, že postačuje uvažovat funkci / pro x e V := [0, Jt] \ {f + kf; k e Z} = [0, f) U (f, 3-f) U (3f, ir], neboť průběh zadané funkce na celém jejím definičním oboru lze odvodit s použitím toho, že je sudá a periodická s periodou 2jt. Zabývejme se proto pouze body nespojitosti x\ = jt/4 ai2 = 3jv/4 a stanovme pro ně příslušné jednostranné limity +oo, lim -ssf = n cos 2x lim -^f o_ cos 2x x^lf- +oo, lim -^f jt COS 2x lim o_ cos 2x -OO, -oo. Přihlédneme-li ke spojitosti / na intervalu (tv/4, 3tv/4), vidíme, že / na tomto intervalu nabývá všech reálných hodnot. Oborem hodnot / je tedy celé M. Rovněž jsme zjistili, že body nespojitosti jsou tzv. druhého druhu, kdy aspoň jedna jednostranná limita je nevlastní (příp. neexistuje). Tím jsme současně dokázali, že přímky x = jt/4 a x = 3n/4 jsou asymptotami bez směrnice. Kdybychom předchozí výsledky formulovali bez omezení se na interval [0, 7t], tak můžeme např. říci, že ve všech bodech Xk j + kf, ke má / nespojitost druhého druhu a že každá přímka x = ^ + kf, keZ je asymptotou bez směrnice. Současně z periodičnosti funkce / vyplývá, že jiné asymptoty neexistují. Zvláště nemůže mít žádné asymptoty se směrnicí, ani nemohou existovat (jako nevlastní) limity liirr^+oo /(je), lirn^-oo f(x). Ještě určíme průsečíky s osami. Průsečík [0, 1] s osou y nalezneme vyčíslením /(O) = 1. Při hledání průsečíků s osou x uvažujeme rovnici cos x = 0, x e V s jediným řešením x = jt/2. Snadno dále získáme intervaly [0, jt/4), (jt/2, 3n/4), kde je funkce / kladná, a intervaly (jt/4, 7t/2), (3n/4, jt], kde je záporná. Nyní přistoupíme k výpočtu derivace - sin x cos 2x — 2 cos x (— sin 2x) cos2 2x sin x (cos2 x — sin2 x) +2 cos x (2 sin x cos x) cos 22x sin3 x + 3 cos2 x sin x (sin2 x + cos2 x + 2 cos2 x) sin x cos2 2x (2cos2x + l) sinx cos2 2x x e V. cos2 2x Body, ve kterých je /'(x) = 0, jsou očividně řešením rovnice sinx = 0, x e V, tj. derivace je nulová v bodech x3 = 0, x4 = it. Z nerovností 2cos2x + 1 > cos2 2x > 0, sinx > 0, x e V D (0, jt) 351 A. DERIVACE VYŠŠÍCH ŘÁDŮ 1. DERIVOVÁNÍ plyne, že v každém vnitřním bodě množiny V funkce / roste, a tudíž / roste na každém podintervalu V. Südost / potom implikuje, že klesá v každém bodě x e (—jt,0),x ^ —3jt/4,x ^ —jt/4. Funkce má proto ostré lokální extrémy právě v bodech xk = kjv, k e Z. Vzhledem k periodičnosti / tyto extrémy jednoznačně popíšeme pozorováním, že pro x3 = x0 = 0 dostáváme lokální minimum (zopakujme funkční hodnotu / (0) = 1) a pro x4 = x\ = ix lokální maximum s funkční hodnotou / (jt) = —1. Spočítejme druhou derivaci /"(*) = [4 cos x(— sin x) sin x-\-{2 cos2 x-\-\) cos x\ cos2 2x—4 cos 2x(— sin 2x)(2 cos2 x-\-l) sin x cos4 2x íC2 v c:„2 . [—4 cos x sin x-\-2 cos3 x+cos a;] (cos2 x— sin x)— 4(—2 sin x cos x){2 cos2 x+l) sin x cos3 2x -6 cos3 x sin2 x-\-2 cos5 x+cos3 x-\-4 cos x sin4 cos x sin2 x-\-16 sin2 x cos3 x+8 sin2 x cos x cos3 2x [10 sin2 x cos2 x-\-2 cos4 x+cos2 x+4 sin4 x-\-l sin2 cos x cos3 2x ' x e V. Poznamenejme, že jednoduchými úpravami lze také vyjádřit (3+4 cos2 x sin2 x+8 sin2 x) cos x nebo Protože cos3 2x (l 1 —4 cos4 x —4 cos2 cos x cos3 2x ' x eV x e V. 10 sin2 x cos2 x + 2 cos4 x + cos2 x + 4 sin4 x + 7 sin2 x > 0, x e M, resp. 3+ 4cos2x sin2x + 8 sin2 x = 11 — 4cos4x — 4cos2x > 3, x e M, je f" (x) = 0 pro jisté x e V tehdy a jen tehdy, když cos x = 0. Tomu ale vyhovuje pouze x5 = jt/2 e V. Je vidět, že v tomto bodě mění /" znaménko, tj. jedná se o inflexní bod. Jiný inflexní bod neexistuje (druhá derivace /" je spojitá na V). K dalším změnám znaménka /" dochází v nulových bodech jmenovatele, které jsme již dříve určili jako body nespojitosti x\ = jt/4 a x2 = 37r/4. Znaménko se tedy mění právě v bodech x\, x2, x5, a tak z nerovnosti f"(x) > 0 pro x -» 0+ vyplývá, že / je konvexní na intervalu [0, Jt/4), konkávni na (jt/4,7T/2], konvexní na [jt/2, 3n/4) a konkávni na (3n/4, jv]. Konvexnost a konkávnost funkce / na jiných podintervalech je dána její periodičností a následujícím jednoduchým pozorováním. Je-li funkce sudá a konvexní na intervalu (a, b), kde 0 < a < b, potom je konvexní rovněž na (—b, —a). Zbývá jen vyčíslit derivaci (k odhadu rychlosti růstu funkce) v in-flexním bodě se ziskem /' (jt/2) = 1. S pomocí všech předchozích výsledků lze již lehce sestrojit graf funkce /. □ 6.38. Vyšetřete průběh funkce ln(x) a načrtněte její graf. Solution. i) Nejprve určíme definiční obor funkce: M+ \ {!}. prostoru V. Budeme jim pro odlišení říkat vektorové funkce jedné reálné proměnné nebo stručněji vektorové funkce. Nyní se budeme podrobněji věnovat reálným funkcím s hodnotami v rovině nebo prostoru, tj. / : M -> M2 a / : M -> M3. Hovoříme o (parametrizovaných) křivkách v rovině a v prostoru. Obdobně bychom mohli pracovat s hodnotami v W pro jakoukoliv konečnou dimenzi n. Pro zjednodušení budeme pracovat v pevných standardních bazích e{ v M2 a M3, takže naše křivky budou dány dvojicemi, resp. trojicemi obyčejných reálných funkcí jedné reálné proměnné. Vektorová funkce r v rovině, resp. v prostoru, je tedy dána r(ř) = x{t)ex + y(t)e2, r(t) = x{t)ex + y(t)e2 + z(t)e3. Derivace takové vektorové funkce je opět vektor, který přibližuje zobrazení r pomocí lineárního zobrazení přímky do roviny či prostoru. V rovině je to tedy dr(t) dt (ŕ) =r'(t) =x'(t)ex +y'(t)e2 a podobně v prostoru. V tomto kontextu je také třeba vnímat diferenciál vektorové funkce: / dx dy dz \ , dr = I —ex + — (rl,...,rk_l,-). (3) Předchozí tvrzení zůstává bezezbytku v platnosti i pokud <ř má také hodnoty ve vktorovém prostoru (a je lineární ve všech k argumentech). Proof. (1) V lineární algebře se ukazuje, že lineární zobrazení jsou dána konstantní maticí skalárů A = (útý) tak, že (n n ^aliri(t),...,^amiri(t)Y z=i z=i ' Derivaci nyní provádíme po jednotlivých souřadnicích výsledku. Víme ale, že derivace se chová lineárně vůči skalárním lineárním kombinacím, viz Věta 5.33. Proto skutečně dostaneme derivaci ty o r(t) prostým vyčíslením původního lineárního zobrazení ty na derivaci r1 (t). (2) Zcela obdobně dostatneme i druhé tvrzení. V souřadnicích rozepíšeme vyčíslení /c-lineární formy na vektorech r\,..., rk takto n <í>(rx(t),...,rk(t)) = X Bh-h-(ri)h(t)...(rk)ik(t), í'i,...,í';t=i kde skaláry S;i..Jit jsou pro každou volbu indexů dány jako hodnota dané formy ®(eix, ..., eik) na zvolené /c-tici bázových vektorů. Pravidlo pro derivaci součinu skalárních funkcí nám dá právě dokazované tvrzení. (3) Pokud má <ř vektorové hodnoty, je zadáno konečně mnoha komponentami a můžeme použít předchozí úvahu na každou z nich. □ Na euklidovském prostoru M3 máme kromě skalárního součinu, který dvěma vektorům přiřadí skalár, také vektorový součin, který dvěma vektorům u a. v přiřadí vektor u x v e M3, viz 4.24. Tento vektor h x uje kolmý na oba vektory u a. v, má velikost rovnou obsahu rovnoběžníka určeného vektory u a v (v tomto pořadí) a orientaci takovou, aby trojice u, v, u x v byla kladně orientovanou bází. Z předchozí věty okamžitě vyplývají užitečná tvrzení: Corollary. V prostoru M3 uvažme vektory u(t) a v(t). Pro derivace jejich skalárního součinu (u(t), v(t)) a vektorového ii) Nalezneme intervaly monotónnosti funkce: nejprve nalezneme nulové body derivace: ln(jc) - 1 ln2(x) Tato rovnice má kořen e. Dále vidíme, že f'(x) je na intervalu (0, 1) i (1, e) záporná, tedy je f(x) na intervalu (0, 1) i na (1, e) klesající, dále je f'(x) na intervalu (e, od) kladná a tedy f(x) rostoucí. Má tedy funkce / jediný extrém v bodě e a to minimum, (také bychom o tom mohli rozhodnout pomocí znaménka druhé derivace funkce / v bodě e, je totiž ř2)(e) > 0) iii) Určíme inflexní body: m ln(x) — 2 f2\x) = -=0 x ln (x) Tato rovnice má kořen e2, který musí být inflexním bodem (extrém to již být nemůže vzhledem k předchozímu bodu). iv) Asymptoty. Funkce má asymptotu přímku x = 1. Dále hledejme asymptoty s konečnou směrnicí k: — 1 k = limx^oo^^- = lim - = 0. x x^oo ln(x) Pokud asymptota existuje, má tedy směrnici 0. Pokračujme tedy ve výpočtu x lim--0 • x = lim ln(x) = oo, x^oo ln(x) x^qo a protože limita není konečná, asymptota s konečnou směrnicí neexistuje. Průběh funkce:_ □ 353 A. DERIVACE VYŠŠÍCH ŘÁDŮ 1. DERIVOVÁNÍ Nyní přejděme od vyšetřování funkcí k dalším tématům spojených s derivacemi funkcí. Nejprve demonstrujme pojem křivosti a os-kulační kružnice na elipse. 6.39. Určete křivost elipsy x2 + 2y2 = 2 v jejích vrcholech (|| 4.491|). Udejte též rovnice oskulačních kružnic v těchto vrcholech. Solution. Protože elipsa je v daných souřadnicích již v základním tvaru (nejsou přítomny ani smíšené ani lineární členy), je zadaná báze již bází polární. Jejími osami jsou souřadnicové osy x a y, vrcholy pak body [V2, 0], [-72, 0], [0, 1] a [0, -1]. Spočítejme nejprve křivost ve vrcholu [0, 1]. Uvážíme-li souřadnici y jakožto funkci souřadnice x (v okolí bodu [0, 1] je jednoznačně určena), pak derivací rovnice elipsy podle proměnné x dostáváme 2x + Ayý = 0, tedy / = — ^ (ý značí derivaci funkce y(x) podle proměnné x; nejedná se vlastně o nic jiného, než o vyjádření derivace funkce dané implicitně, viz ??). Derivací této rovnice podle x pak obdržíme y = — \{^~ p-)- V bodě [1, 0] pak dostáváme ý = 0 a y" = — ^ (ke stejným výsledkům bychom došli, kdybychom explicitně vyjádřili z rovnice elipsy y = \*J2 — x2 a derivovali; výpočet by byl jen o něco složitější, jak si jistě čtenář sám ověří). Poloměr oskulační kružnice bude tedy dle vzahu v 6.13 (l + (/)2)^ = _2 (y»)2 respektive 2 a znaménko nám řfká, že kružnice bude "pod" grafem funkce. Z úvah v 6.13 a 6.16 vyplývá, že její střed bude ve směru opačném k normále této křivky, tedy na ose y (funkce y jakožto funkce proměnné x má derivaci v bodě [0, 1], tečna k jejímu grafu v tomto bodě bude tudíž rovnoběžná z osou x, normála je pak kolmá na tečnu, což je v tomto bodě osa y. Poloměr je 2, střed tak bude v bodě [0, 1 — 2] = [0,-1]. Celkem bude rovnice oskulační kružnice elipsy x2 + 2y2 = 2 v bodě [0, 1] znít x2 + (y + l)2 = 4. Analogicky určíme rovnici oskulační kružnice v bodě [0, —1]: x2 +(y — l)2 = 4. Křivosti elipsy (jakožto křivky) v těchto bodech jsou pak rovny | (absolutní hodnota křivosti grafu funkce). Pro určení oskulační kružnice v bodě [72, 0] budeme uvažovat rovnici elipsy, jakožto předpis pro proměnnou x pomocí proměnné y, tedy x j ako funkci y. (v okolí bodu [ *J2, 0] není totiž určena proměnná y jako funkce x jednoznačně, nemůžeme tedy použít předchozí postup - technicky by to dopadlo tak, že bychom dělili nulou). Postupně dostáváme: 2xx' + 4y = 0, tedy x' = -2y-, a x" = -2(± - ^). V bodě [a/2, 0] je tudíž x' = 0 a x" = —~J2 a poloměr oskulační kružnice je podle 6.13 p = — = Normála směřuje v bodě [V2, 0] po ose x do — oo, střed oskulační kružnice tedy bude na ose x na druhou stranu ve vzdálenosti , tudíž v bodě [ V2 — , 0] = [^,0]. Celkem rovnice oskulační kružnice ve vrcholu [V2, 0] bude (x — -r^)2 + y2 = j. Křivost je v obou těchto vrcholech rovna y/2. součinu u(t) x v(t) platí (6.1) ^-(u(t), i,(0) = (u'(t), i,(0) + (u(t), i/(0) dt d (6.2) — (i<(0 X t>(0) — M (0 X V (t) + u(t) X V (0 dt 6.16. Křivost křivek. Nyní máme daleko mocnější nástroje pro studium křivek systematičtějším způsobem, než když jsme diskutovali křivost grafů funkcí. Podívejme se obecně na křivky r(t) v prostoru a předpokládejme, že jsou parametrizovány tak, aby jejich tečný vektor měl stále velikost jedna, tj. (r'(0, r1 (t)) = 1 pro všechna t. Říkáme, že je křivka r(t) parametrizována délkou. Další derivací tohoto jednotkového vektoru r1 (t) dostaneme vektor r" (t), pro který spočteme (využíváme symetrie skalárního součinu) 0 = l(/(oy(0) =2(r"(0y(0) dt a je tedy vektor zrychlení r"(0 vždy kolmý na vektor rychlosti. To odpovídá představě, že při volbě parametrizace s konstantní velikostí rychlosti nemůže být zrychlení ve směru pohybu znatelné, musí tedy celé zrychlení být v rovině kolmé k vektoru rychlosti. Pokud je druhá derivace nenulová, nazýváme normovaný vektor 1 nit) =-r"(t) lir" (011 hlavní normálou křivky r(t). Skalární funkce k(Í) splňující (v bodech, kde je r" (t) £ 0) r"(t) = k(t)n(t) se nazývá křivost křivky r(t). V nulových bodech druhé derivace definujeme k(í) také nulovou hodnotou. V nenulových bodech křivosti je dobře definován jednotkový vektor h(t) = r1 (t) x n (t), který nazýváme binor-mála křivky r(t). Přímým výpočtem dostáváme 0 = ^-(b(t), r'(t)) = (b'(t), r'(0) + (b(t), r"(t)) dt = (b'(t), r'(0) + k(t)(b(t), n(t)) = (b'(t), r'(0), což ukazuje, že je tečný vektor k binormále kolmý jak na b(t), tak na /(0- Musí tedy být násobkem vektoru hlavní normály. Píšeme b'(t) = -x(t)n(t) a skalární funkci r(t) nazýváme torze křivky r(t). Ještě jsme nespočetli rychlost změny hlavní normály, kterou můžeme také psát jako n(t) = b(t) x r1 (t). n'(t) = b'(t) x r'(t) + k(t)b(t) x n(t) = -x(t)n(t)xr'(t)+k(t)(-r'(t)) = r(t)b(t) - k(t)r'(t). 354 CHAPTER 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET Postupně jsme pro všechny body s nenulovou druhou derivací křivky r(t) parametrizované délkou oblouku odvodili význačnou bázi (ř' (t), n(t), b(t)), které se v klasické literatuře říká Frenetův reper a zároveň jsme v této bázi vyjádřili derivace jejích komponent formou tzv. Frenetových—Serretových formulí dr1 dt (t) = ic(t)n(t), dn dt db (t) = r(t)b(t)-k(ty(t) -x(t)n(t). Všimněme si, že pokud křivka r(t) leží stále v jedné rovině, pak je její torze identicky nulovou funkcí. Ve skutečnosti platí i obrácené tvrzení, které tu nebudeme dokazovat, vyplývá ale z následujícího klasického výsledku geometrické teorie křivek: Dvě křivky v prostoru parametrizované délkou oblouku lze jednu na druhou zobrazit pomocí euklidovské transformace, právě když jejich funkce křivosti a torze splývají, až na konstatní posuv parametru. Navíc, pro každou volbu hladkých funkcí /car existuje hladká křivka s těmito prametry. Tento výsledek tu nebudeme dokazovat, zájemce může podrobný výklad nalézt v [?]. Přímým výpočtem můžeme zkontrolovat, že křivost grafu funkce y = f (x) y rovině a křivost k této křivky zavedené v tomto odstavci splývají. Skutečně, výpočtem derivace složené funkce s pomocí diferenciálu délky oblouku pro graf funkce ve tvaru dt = (1 + (fx)2)l/2dx, dx = (1 + (fx)2)~l,2dt (píšeme zde fx = dostaneme pro náš jednotkový tečný vektor grafu křivky vztah /(O = (/(0,3/(0) = ((i + (A)2r1/2, A(i + (A)2)"1/2) a poměrně nepřehledným, ale obdobným výpočtem druhé derivace a její velikosti skutečně obdržíme fd2f, k2 = ||l (i + (fx) y 6.17. Aproximace derivací a asymptotické odhady. Hned na začátku této učebnice jsme v odstavcích 1.3, 1.9 a dále diskutovali, jak zadávat hodnotu funkce pomocí změn, tj. diferencí. V další části - textu budeme obdobně rekonstruovat funkci / z jejích derivací, tj. okamžitých změn. Předtím se ale pozastavme u souvislosti derivací a diferencí. Klíčem nám k tomu bude Taylorův rozvoj se zbytkem. Předpokládejme, že z (dostatečně) diferencovatelné funkce f(x), definované na intervalu [a,b], známe hodnoty f = f(xi) v bodech x$ = a, x\, x2, ..., x„ = b, přičemž pro všechny indexy i = 1, ..., n platí x,■ — x;_i = h > 0 pro nějakou konstantu h. Taylorův rozvoj pro funkci / v bodě Xi pišme ve tvaru f(Xi±h) fi±hf'(xi) + ^f"(xi)±^f3) (*«) + □ 6.40. Remark. Vrcholy elipsy (obecně uzavřené hladké křivky v rovině) lze definovat jako body, ve kterých má funkce křivosti nějaký extrém. To, že elipsa měla čtyři vrcholy není náhoda. Platí tzv."Věta o čtyřech vrcholech", sice že uzavřená křivka třídy C3 má alespoň čtyři vrcholy. (Křivka třídy C3 je lokálně dána parametricky body [/(O, g(t)] e R2, t e (a, b) c R, kde / i g jsou funkce třídy C3 (R).) Křivost elipsy v jakémkoli jejím bodě se tedy nalézá mezi křivostmi v jejích vrcholech, tj. mezi | a B. Integrování Nejprve několik jednoduchých příkladů, které by měl zvládnout každý. 6.41. Integrováním "po paměti" vyjádřete (a) f e~x dx, x e R; i (b)/- (d) /^±i dx, x e (—2, 2); 4-x2 1 dx, x e dx, x 7^ — 1. Solution. Snadno získáváme (a) J e~x dx = — f —e~x dx + C; '4-x' dx = f ■ ■■ dx arcsin f + C; x2+3 dx dx -+i V3 i" 1 73 3x2+3 1 + ■ dx x3+3x+2 dx = ln x3 + 3x + 2 \ + C, kde jsme využili vzorec J dx fU) ln|/(*)| + C. □ 6.42. Spočtěte neurčitý integrál T +4e~ - ^ +9sin5x + 2cos: + 3-jc) dx pro x 3, x 7^ j + kjt, k e Z. Solution. Pouze spojením dříve odvozených vzorců dostáváme 355 B. INTEGROVÁNÍ 1. DERIVOVÁNÍ j(7.+4e¥-^ + 9sin5x+2cos|-^7 + 3lI) dx ^ + 6e^ + - f cos5x + 4 sin f - 3tgx - ln | 3 -x \ + C. □ Pro vyjádření následujících integrálů použijeme metody per partes (viz 6.20). 6.43. Vypočtěte f x cos x dx, x e M a J ln x dx, x > 0; Solution. u = Inx u' = - x v' = 1 v = x lnx dx x cos x dx x lnx m = X ldx = x lnx — x + C. m' = 1 i/ = cos x i; = smx x sin x + cos x + C. x sin x — / sin x dx □ 6.44. Metodou per partes vypočítejte (a) f (x2 + l) e~x dx, x e M, (b) J(2x — 1) lnx dx, x > 0, (c) J arctgx dx, x e M, (d) J e* sin x dx, x e M., Solution. Nejdříve vyzdvihněme, že metodou per partes lze vypočítat každý integrál ve tvaru f P(x) ahx dx, f P(x)sin(bx) dx, f P(x)cos(bx) dx, f P(x) \ogna x dx, f xfc log^ (kx) dx, f P (x) aresin (bx) dx, f P (x) arctg (bx) dx, f /J(x)arccos (bx) dx, f /J(x)arccotg (bx) dx, f ahx sin (cx) dx, f ahx cos (cx) dx, kde f je libovolný polynom a a e (0, 1) U (1, +oo), t Proto víme, že (a) céI \ {0}, n s N, k > 0. / (x2 + l) e~x dx .2+1 F (x) = x G'(x) = e~x (x2 + 1) e~x + fixe F'(x) G(x) --dx = Ix —e~ F (x) = 2x G'(x) = e~ F'(x) G(x) -. (x2 + l) e~x - 2x e~x + / 2 e~x dx = - (x2 + l) e" 2x e~x — 2e~x + C = -e~x (x2 + 2x + 3) + C; (b) J(2x — 1) lnx dx (x2 — x) ln x — J : F(x) --G'(x) -dx = lnx = 2x - F'(x) = l/x G(x) = x2 - (x2 — x) ln x + J 1 — x dx (x2 - x) x) lnx + x — y + C; (c) Víme, že když v rozvoji skončíme členem řádu k y h, tj. výrazem obsahujím hk, pak se dopustíme chyby, která je omezená odhadem výrazu hk+i _f(k+l) (X) (k + 1)1 na intervalu [x; — h,xi +h]. Pokud je (k + l)-vní derivace / spojitá, můžeme ji odhadnout konstantou. Vidíme pak, že se pro malá h chová chyba aproximace pomocí Taylorova polynomu stupně k stejně jako hk+l, až na konstantní násobek. Takovému odhadu se říká asymptotický odhad. Definition. Řekneme, že výraz G(h) je pro h toticky stejný s výrazem F(h) a píšeme G(h) jestliže existuje konečná limita 0 asymp-0(F(h)), lim G(h) a e h^o F(h) Označme si hledané odhady hodnot derivací f (x) v bodech x; jako f-^ a pišme Taylorův rozvoj stručně takto: fi ±i r II rill fi ± f(h + —h2 ± J-^-h3 + Pro odhady první derivace můžeme okamžitě použít tři různé diference spočtené z Taylorova rozvoje: fi (i) fi (i) fi + l - fi-l 2h _ fi + l - fi h 4/(3)(Xí)" h „ ^f"(Xi) + f (i) 2!' fí ~ fi~l + - f"(Xi) + h 2V V ' kde jsme prostě jen odečetli příslušné polynomy. Získáváme tak numerická vyjádření pro první derivaci. První z nich má asymptotický odhad chyby fi + l - fi-l f (1) 2h + 0(hz), další dvě mají chybu 0(h). Říkáme jim středová diference, dopředná diference a zpětná diference. Kupodivu je středová diference o řád lepší než zbylé dvě. Stejně můžeme postupovat při odhadu druhé derivace. Abychom uměli spočíst /"(x;) z vhodné kombinace Tayu-lorových polynomů, potřebujeme vyrušit první derivace i hodnotu v x;. Nejjednodušší kombinace vyruší i všechny liché derivace: (2) fi i + 1 2fi + fi+l fr2 f(4) h2 +12J (*.) + ■■■■ Hovoříme o diferenci druhého řádu a stejně jako u středové první diference je asymptotický odhad chyby o jeden řád lepší, než bychom na první pohled čekali: (2) fi+i - 2f + f+i_ + o(/j2) h2 356 CHAPTER 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET 2. Integrování 6.18. Newtonův integrál. Nyní se budeme zajímat o opačný postup než tomu bylo u derivování. r~f-W/, Budeme chtít ze znalosti okamžitých změn nějaké funkce rekonstruovat její skutečné hodnoty. Jestliže danou funkci f (x) považujeme za derivaci neznámé funkce F(x), pak na úrovni diferenciálů můžeme psát dF = f(x)dx. Funkci F nazýváme primitivní funkce nebo neurčitý integrál funkce / a tradičně píšeme F(x) f(x)dx. Lemma. Primitivní funkce F(x) k funkci f(x)je na každém intervalu [a, b] určena jednoznačně až na aditivní konstantu. Proof. Tvrzení je okamžitým důsledkem Lagrangeovy věty o střední hodnotě, viz 5.38. Skutečně, pokud je F'(x) = G'(x) = f(x) na celém intervalu [a, b], funkce (F — G)(x) má ve všech bodech c intervalu [a, b] nulovou derivaci. Pak ale podle věty o střední hodnotě pro všechny body x v tomto intervalu F(x) - G(x) = F(a) - G(a) + 0 • (x - a). Musí tedy být rozdíl hodnot funkcí F a. G stejný na celém intervalu [a,b]. □ Předchozí lemma nás vede k tomu, že neurčitý integrál obvykle zapisujeme ve tvaru F(x) f(x)dx + C s neznámou konstantou C. Hodnotu reálné funkce f(x) můžeme také považovat za okamžitý přírůstek plochy vymezené grafem funkce / a osou x a snažit se najít velikost této plochy mezi krajními hodnotami a a b nějakého intervalu. Zkusme tuto představu dát do souvislosti s neurčitým integrálem. Předpokládejme tedy, že na intervalu [a, b] známe reálnou funkci a její neurčitý inte-grál F(x), tj. F'(x) = f(x). Jestliže rozdělíme interval [a, b] na n částí volbou bodů a = xq < x\ < • • • < x„ = b a přiblížíme hodnoty derivací v bodech x;- výrazy F(x,_i_l) — F(Xj) xi + l ~ xi dostáváme součtem přes všechny intervaly našeho dělení odhad hledané velikosti plochy: "_1 "_1 Z7/ \ Z7/ \ V r, n / n V F(Xi + 0~ F(Xi) , > f(Xi) ■ (xi + i - Xi) ~ 2^--(xi + i - Xi) i=0 i=0 xi + l ~ xi F(b) - F (a). f arctg x dx F(x) = arctg x G'(x) = 1 G(x) = x x arctgx - / jf^ dx =x arctgx - \ J dx x arctgx - \ ln (l + x2) + C; (d) J ex sin x dx F(x)--G'(x) smx F'(x) G(x) -. cosx -ď cos x + J ď cos x dx F(x) = ď F'(x) = ď G'(x) = cosx G(x) = sinx —ď cosx + ď sinx — Jď sinx dx, odkud plyne Jď sinx dx = j ď (sinx — cosx) + C. □ Pro vyjádření následujících integrálů je výhodné použít substituční metodu (viz 6.21). 6.45. Vhodnou substitucí stanovte (a) J V2x — 5 dx, x > 5 . (7+ln x)1 (C) Z (l+sinjc (d) f^^- dx, x > 0; V1 +sinz x Solution. Platí (a) Ý dx, x 7^ 2 dx, x e M. k e f \/2x — 5 dx t = 2x — 5 dt = 2 dx J y/tdt ±t~2 +C U(2x - 5)3 + C; (b) (7+ln x)' dx t = 7 + lnx dt = - dx X (7+ln xf ffdt = j + C + C; (c) (l+sin xÝ dx t = 1 + sin x dt = cos x dx ľ- + c i 1 +sin x + C; (d) ■■ dx Vl+sin2 u = t + Vi + t2 > 0 ^ dt t = smx dt = cos x dx 'i+ť- - dt du = (\ + du _ 1 -dt ľ i du = ln u + C J u ln (ŕ + y/l + t2^ + C = ln (sinx + \/l + sin2x) + C. □ 357 B. INTEGROVÁNÍ 2. INTEGROVÁNÍ 6.46. Určete integrály j er áx s'm2(x)—cos2(x)' b) Jx2V2x + ldx. Solution. Pro výpočet prvního z integrálů zvolíme substituci t = tg x, kterou lze často s výhodou uplatnit. áx sin (x) — cos2(x) substituce t = tg x dt = Z^áx = (1+ lg2W) dx = (\ + t2)dx MI1 W ~ l+tg2M ~ cos2(x) - 1 - 1 l+tg2(x) 1+!2 1 1 -dř = - - 1 2 1 2 V lg+1 / Nyní určeme druhý integrál: J x2 V2x + 1 áx = t - 1 + C ř + 1 = \/2x + 1 i; 2x r(2x + 1) 1 9 3 4 /" 9 ,- 2 3 = -x2(2x + 1)2 - - / x2V2x + 1 dx - -(2x + 1)2 + C, což můžeme chápat jako rovnici, kde neznámou je hledaný integrál. Převedením na jednu stranu pak J x2 V2x + 1 dx = 1 9 3 2 /" ,- = -x2(2x + 1)2--/ xV2x + 1 = 7 7 J u = x u' = 1 v' = V2x + 1 v = ±V2x + 1 x2(2x + 1)5 1(1 1 \3 x V 2x + 1-- 3 3 y (2x + 1)2 dx^ -x2(2x + 1)5 7 —xV"2x + 1 H--(2x + 1) 21 105 -x2(2x + 1)2--x(2x + 1)2 H--(2x + 1)2 + C 7 35 105 □ 6.47. Užitím základních vzorců vypočtěte (a) J -j= dx, x 0; (b) Jtg2x dx, x £ I + for, k eZ; W J+2**,* e: (d) J 6 sin 5x + cos | + 2 e~ úřx, x e ] Solution. Případ (a). Ihned určíme /4= í/x = Jx"1/3 í/x = 4 + c x2 +C, Dá se tedy očekávat, že pro "dostatečně pěkné" funkce f(x) velikost plochy vymezené grafem funkce a osou x skutečně spočteme jako rozdíl hodnot primitivní funkce v krajních bodech intervalu. Tomuto postupu se říká Newtonův integrál. Píšeme rb f(x)dx = [F(x)]ba = F(b) - F (a) a hovoříme také o (Newtonově) určitém integrálu v mezích a, b. V případě komplexní funkce / je reálná a imaginární část jejího neurčitého integrálu jednoznačně dána reálnou a imaginární částí /, budeme proto dále bez dalších komentářů pracovat s reálnými funkcemi a ke komplexním se vrátíme v aplikacích, jak je to bude třeba. 6.19. Integrace "po paměti". Ještě než si uděláme jasno, ■jak Newtonův integrál skutečně souvisí s velikostí plochy a jak jej případně lze používat pro modelování praktických problémů, ukážeme několik postupů, jak Newtonův integrál spočítat. Budeme přitom využívat jen naše znalosti o derivacích. Nej snadnější je případ, kdy v integrované funkci umíme derivaci přímo uvidět. K tomu v jednoduchých případech stačí číst tabulky pro derivace funkcí v našem zvěřinci naopak. Dostáváme tak např. následující tvrzení pro všechna aEEa«eZ,«^-l: a dx = ax + C ax" dx = -^-x"+1 + C n + l e" dx=l- ďx +C - dx = a ln x + C /a««*x)* = !*.<*«> +c a sin(Ŕx) dx = — | cos(ŕx) + C a cos(ŕx) úrŕ(bx) dx = h{„+l) sin"+1(£x) + C a sin(öx) cos" (bx) dx a_ n + l b(n + l) cosn+í(bx) + C a tg(bx) dx =--ln(cos(Ŕx)) + C dx = aretg (i) + C a2 + x2 -1 \/a2 — x2 dx = arecos (|) + C / —== dx = aresin (t— \ + C. J V'a2 - x2 V at 358 CHAPTER 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET Ve všech případech je zapotřebí dobře promyslet definiční obor, na kterém je neurčitý integrál dobře definován. K takovýmto tabulkovým pravidlům pro integraci lze relativně snadno dodávat další pravidla jednoduchými pozorováními vhodné struktury integrovaných funkcí. Např. fix) dx = ln|/(jc)| + C pro všechny spojitě diferencovatelné funkce / na intervalech, kde jsou nenulové. Samozřejmé také z pravidel pro derivaci součtu diferencovatelných funkcí a konstantních násobků diferencovatelných funkcí je zřejmé že obdobná pravidla platí neurčitý integrál také. 6.20. Integrace per partes. Výpočet integrálu pomocí primitivní funkce (neurčitého integrálu), spolu s pravidlem (F ■ G)'it) = F'(t) ■ Git) + Fit) ■ G'it) pro derivaci součinu funkcí, dává následující formuli pro neurčitý integrál F(x)-Gix) + C = / F'(x)Gix)dx+ / F(x)G'ix)dx. Tato formule se většinou používá tak, že jeden z integrálů napravo je ten, který máme spočíst, zatímco druhý umíme spočítat snáze. Nejlépe je princip vidět na příkladu. Spočteme / = / x sin x dx. V tomto případě pomůže volba F(x) = x, G'{x) = sinx. Odtud G ix) = — cos x a proto také / = —x cos x ■ cos x dx = —x cos x + sin x + C. Obvyklým trikem je také použít tento postup s F'(x) = 1: ln x dx = J 1-lnx dx = x In x—J —x dx = x ln x—x+C. 6.21. Integrace pomocí substituce. Další užitečný postup je odvozen z derivování složených funkcí. Jestliže F'iy) = fiy), y = (*)) +C = J ficpix))cp'(x)dx. Dosazením x = cp~l (y) pak dostaneme původně požadovanou primitivní funkci. Častěji zapisujeme tuto skutečnost takto: f(y)dy = / fi(pix))ql (x) dx přičemž zápisu, ve kterém přičítáme C e I, je třeba rozumět tak, že všechny primitivní funkce získáme právě pomocí konstantního posunutí libovolné primitivní funkce. To ovšem platí pouze na intervalu. Jinak řečeno, hodnota C je obecně různá pro x < 0 a pro x > 0. Měli bychom tedy uvažovat hodnoty C\ a C2- Pro jednoduchost budeme ale používat zápis bez indexů a uvádění příslušných intervalů. Navíc si budeme pomáhat položeními aC = C pro a el\{0)aC + i = C pro feeB, která jsou založena na skutečnosti, že {C; CeR) = {aC; C e R] = {C + b; C e R] = R. Zcela korektní vyjádření bychom pak obdrželi např. substitucemi C = aC, C = C + b. Tato zjednodušení prokáží svou užitečnost při počítání náročnějších příkladů. Činí totiž postupy a úpravy přehlednějšími. Případ (b). Postupné úpravy integrované funkce vedou na [tg2xdx = f^dx = f j ° J cosz x j 1—COS2 X dx f —K— dx — f 1 dx = tg x — x + C, j cosz x j ° ' kde jsme si pomohli znalostí derivace (tgx)' = ^, x ^ f+/br, k e Z. Případ (c). Stačí si uvědomit, že se jedná o speciální případ vzorce fj$dx=ln\fix)\ + C, jenž můžeme přímo ověřit derivováním (ln| f(x) \ + C)' = (ln[±/(x)])'+(C)' = = ±£M = fg. Platí tudíž 1 +sin x dx = In (1 + sinx) + C. Případ (d). Protože integrál součtu je součtem integrálů (pokud mají jednotlivé integrály smysl) a nenulovou konstantu lze z integrálu vytknout kdykoli, je J 6 sin 5x + cos |+2e^" o. Solution. Případ (a). Jde o jednoduchý příklad na tzv. první substituční metodu, jejíž podstatou je zapsat integrál ve tvaru (6.8) f((p(x))cp'(x)dx a hovoříme o substituci za proměnnou y. Přímo na úrovni diferenciálů je možné substituci porozumět snadno tak, že (linearizované) přírůstky v proměnné y a v x jsou vzájemně ve vztahu popsaném formálně dy = qJ (x) dx, což odpovídá vztahu mezi integrovanými veličinami f(y)dy = f((p(x))cp' (x)dx. Jako příklad ověříme touto metodou předposlední integrál v seznamu v 6.20. Pro integrál 1 VT^x2 : dx zvolíme substituci x = sin t. Odtud dx = cos t dt a dostáváme 1 sin21 cos t dt 1 V cos21 : COS t dt dt = t + C. Zpětným dosazením t = acrsin x dopočítáme již známý vztah I = arcsin x + C. Při substitucích je třeba dát pozor na skutečnou existenci inverzní funkce k y = cp(x), při výpočtu určitého Newtonova integrálu je třeba také správně přepočítávat meze integrování. Problémům s definičními obory inverzních funkcí se lze někdy vyhnout rozdělením integrace na několik intervalů. 6.22. Integrace převedením na rekurence. Často vede J.i.- použití substitucí a metody per partes k rekurentním vztahům, ze kterých teprve lze dopočíst hledané integrály. Budeme ilustrovat na příkladu. Metodou per partes počítáme Im = J cos™ x dx = J cosm_1 x cosx dx = cosm_1 x sinx — (m — 1) J cosm_2x(— sinx) sinx dx = cosm_1 x sinx + (m — 1) / cosm_2x sin2 x dx. Odtud díky vztahu sin x = 1 — cos2 x dostáváme mlm = cosm_1 x sinx + (m — l)/m_2 a počáteční hodnoty jsou Iq = x, I\ = sinx. K těmto typům integrálů se substitucí x = tg t často převádí integrály, kde integrovaná funkce závisí na výrazech tvaru (x2 + 1). Skutečně, např. pro dx (x2 + 1)* 360 CHAPTER 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET dostáváme zmíněnou substitucí (povšimněme si, že dx cos-2 t dt) dt h cos2 ř /siniI + 1\ \ cos2 t ) cos2* 2tdt. Pro & = 2 je výsledkem 1 - (cos t sin ř + ř) 2 = arctg Hir^+arctgx) a proto také po zpětné substituci t = arctg x x + arctg xj + C. Při počítání určitých integrálů je možné celou rekurenci rovnou počítat po vyčíslení v zadaných mezích. Tak například je okamžitě vidět, že při integraci přes interval [0, 2jt] mají naše integrály hodnoty: r-2jr dx = Mn* = lit h h 2n cos x dx = [sin x] 2n 0 0 2n cos™ x dx o 0 pro sudá m !Ľ—^-Im-2 pro lichá m Pro sudé m = 2n tedy dostáváme přímo výsledek [2,T 2„ , (2« - 1)(2« - 3)...3 • 1 / cos x dx =-2n, J0 2n(2n — 2)... 2 zatímco u lichých m je to vždy nula (jak bylo možné přímo uhádnout z grafu funkce cosx). 6.23. Integrace racionálních funkcí lomených. U racionálních funkcí lomených si můžeme při integraci pomoci několika zjednodušeními. Zejména v případě, že je stupeň polynomu / v čitateli větší nebo roven stupni polynomu g ve jmenovateli, je rozumné hned z kraje dělením se zbytkem, viz odstavec 5.2, převést integraci na součet dvou integrálů. První pak bude integrací polynomu a druhý integrací výrazu f/g se stupněm g ostře větším, než je stupeň / (takovým funkcím říkáme ryze racionální lomené). Toho skutečně dosáhneme prostým vydělením polynomu: / h f = q ■ g+h, - =q + -. 8 8 Můžeme tedy zrovna předpokládat, že stupeň g je ostře větší než stupeň /. Další postup si ukažme na jednoduchém příkladě. Zkusme si rozebrat, jak se dostaneme k výsledku f(x) _ 4x + 2 -2 6 g(x) x2 + 3x +2 x 4- 1 x 4- 2' který již umíme integrovat přímo: f 4x +2 x2 4- 3x 4- 2 dx -21n|x + 1| 4-61n|x + 2| + C. pro jisté funkce / a r-^dz = 6fz2 l+z I J" 2z + 2 1 - 6z5 dz dz = z2 + 2z z+l ln | z + 1 |) + C = 2Vx - 6^/x + \2Zfx - 6 ln {Šfx + l) + C, kde jsme opět substitucí lehce určili (pro z ^ — 1) v = z + 1 dv = dz J z+l f ^ = In I v I + C = In I z + 1 I + C. □ 6.50. Kombinací metody per partes a substituční metody určete (a) f x3 e~*2 dx, x e R; (b) Jxarcsinx2 0. Solution. Touto úlohou lze ilustrovat možnosti kombinování substituční metody a metody per partes (v rámci jednoho příkladu). Nejprve použijeme substituci y = ^fx, abychom odstranili odmocninu z argumentu exponenciální funkce. Tím přejdeme k integrálu y2 = x ' T e^^ dx — ~ j j 2 y d y = dx Nyní pomocí per partes určíme Jyeydy F(y) = y G'(y) = e- yey F'(y) = 1 G(y) = &y - ey + C. 2fy&y dy. yey - Jeydy Celkem tedy je /e^dx = 2yď - 2& + C = 2e^ (y/x - l) + C. Především převedením součtu zlomků na společného jmenovatele tuto rovnost snadno ověříme. Pokud naopak víme, že lze náš výraz rozepsat ve tvaru 4x + 2 A B + x2+3x + 2 x + 1 x + 2' jde nám pouze o výpočet koeficientů Aafi. Můžeme pro ně získat rovnice pomocí roznásobení obou stran polynomem x2 + 3x + 2 ze jmenovatele a porovnáním koeficientů u jednotlivých mocnin x ve výsledných polynomech napravo i nalevo: 4x+2 = A(x+2)+S(x + l) 2A + B = 2, A+B = 4. Odtud již přímo vychází náš rozklad. Říká se mu rozklad na parciální zlomky. Tento elementární postup lze snadno zobecnit. Jde o čistě algebraickou úvahu opírající se o vlastnosti polynomů, ke kterým se budeme vracet v kapitole ??. Předpokládejme, že jmenovatel g(x) a čitatel f(x) nesdílí žádné reálné ani komplexní kořeny a že g(x) má právě n různých reálných kořenů a\, ..., an. Pak jsou body a\, ... an právě všechny body nespojitosti funkce f (x)/g(x). Pro zjednodušení úvahy nejprve pišme g(x) jako součin g(x) = p(x)q(x) dvou nesoudělných polynomů. Dfky Bezoutově identitě (viz ??), která je důsledkem obyčejného dělení polynomů se zbytkem, existují polynomy a(x) a b(x) se stupni ostře menšími než je stupeň g takové, že a(x)p(x) + b(x)q(x) = 1. Vynásobením této rovnosti podílem / (x)/g (x) dostáváme /(*) a(x) b(x) g(x) q(x) ' p(x) Předpokládejme nyní, že náš polynom g(x) nemá jiné než reálné kořeny, má tedy jednoznačný rozklad na faktory (x — a/)"', kde «; jsou násobnosti kořenů at, i = 1, ..., k. Postupným použitím předchozího postupu s nesoudělnými polynomy p(x) a q(x) dostaneme vyjádření f(x)/g(x) pomocí součtu zlomků ve tvaru r\(x) rk(x) (x - fll)»i " ' (x - ak)m' ' kde stupně polynomů r;(x) jsou ostře menší než stupně v jmenovatelích. Každý z nich ale jde velmi snadno rozepsat jako součet r(x) Ai . A2 A„ + + ••• + (x — a)" x — a ' (x — a)2 ' (x — a)" když začneme od nejvyšších mocnin v polynomu r(x) a postupně počítáme A\, A2, ... vhodným doplňováním a odebíráním sčítanců v čitateli. Např. 5x — 16 . x — 2 , 1 5 (x - 2)2 (x - 2)2 (x - 2)2 2 + (x - 2)2 362 CHAPTER 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET Zbývá ošetřit ještě případ, kdy reálných kořenů není dostatek. Vždycky ale existuje rozklad g (x) na lineární faktory s případně komplexními kořeny. Opakování předchozí úvahy pro komplexní polynomy nám dá tentýž výsledek. Pokud ale předem víme, že koeficienty polynomů jsou reálné, budou komplexní kořeny v našich výrazech vystupovat vždy po dvojicích komplexně sdružených kořenů. Můžeme proto rovnou pracovat s kvadratickými faktory ve tvaru součtu čtverců (x — a)2 + b2 a jejich mocnin. Naše předchozí úvaha opět dobře funguje a zaručuje, že bude možné hledat příslušné sčítance ve tvaru Bx + C ((x - a)2 + b2)n ' Obdobně jako v případě reálných kořenů se tedy i v případě mocniny ((je — a)2 + b2)" takového kvadratického (nerozložitelného) faktoru vždy podaří najít odpovídající rozklad na parciální zlomky tvaru A\x + B\ Anx + Bn (x - a)2 + b2 {{x - a)2 + b2)n ' Konkrétní výsledky lze také snadno ozkoušet v Maplu pomocí volání procedury "convertth, parfrac, x)", které rozloží výraz h racionálně závislý na proměnné x na parciální zlomky. Všechny výše uvedené parciální zlomky už umíme integrovat. Připomeňme, že ty poslední zmíněné vedou mimo jiné na integrály diskutované v Příkladě 6.22. Celkově můžeme shrnout, že racionální funkce f(x)/g(x) lze poměrně snadno integrovat, pokud se podaří najít příslušný rozklad polynomu ve jmenovateli g(x). Při výpočtu Newtonových integrálů jsou ale problematické body nespojitosti racionálních funkcí lomených, v jejichž okolí jsou tyto funkce neohraničené. Tomuto problému se budeme obecně ještě věnovat později (viz odstavec 6.30 níže). 6.24. Riemannův integrál. Myšlenku počítat integrál jako vyjádření plochy vymezené grafem funkce a osou x je třeba zpřesnit. To nyní učiníme a v zápětí dokážeme, že pro všechny spojité funkce tato definice dává stejné výsledky jako Newtonův integrál. Uvažme reálnou funkci / definovanou na intervalu [a,b] a zvolme dělení tohoto intervalu spolu s výběrem reprezentantů §; jednotlivých částí, tj. a = xq < x\ < • • • < x„ = b a zároveň §z e [xi-i, Xi], i = l,...,n. Normou dělení nazýváme číslo S = min;{x; — Riemannův součet odpovídající zvolenému dělení s reprezentanty S = (xo, ..., jt„; §i, ..., §„) definujeme jako i=\ (Xi □ 6.53. Dokažte, že 1 - 4 1 1 3 - sin x = — cos(2x) H--cos(4x) H--. 2 4 J 16 16 Solution. Snadnější, než porovnávat dané výrazy přímo, je ukázat, že funkce na pravé a levé straně rovnosti mají shodné derivace. Je totiž Ľ = 2 cos x sin3 x = sin(2x) sin2 x, P' = j sin(2x) + i sin(4jc) = sin2x(| + ^cos(2x)) = sin(2x) sin2 x. Levá a pravá strana se tedy liší o konstantu. Tuto konstantu určíme porovnáním funkčních hodnot v jednom bodě, například bodě 0. Hodnota obou funkcí je v nule nulová, jsou si tedy rovny. □ C. Integrace racionálních lomených funkcí 6.54. Integrujte (a) |^á,i/2; dx, x 7^ —4; J (x2-6x + 13) Solution. Případy (a), (b). Platí f-^-dx = ■J X—L a podobně (x+4y dx y = x — 2 dy = dx y = x +4 dy = dx J^dy = 61n|y |+C = 61n|x-2|+C í^dy 6 -2y2 + c (x+4)< + c. Vidíme, že integrování typů parciálních zlomků, které odpovídají reálným kořenům jmenovatele racionální lomené funkce, je velmi snadné. Navíc zcela obecně lze obdržet y = x — jco | _ r a dy = dx \~ -J y A ln | x — x0 | + C f^dx j X— Xq J ±dy = Ahi\y\+C I (x-x0y ■ dx y = x - X0 dy = dx A ífndy 7TT + C Ay- -n + l + c (l-n)(x-x0r pro každé A, x0 e M, n > 2, n e N. Případ (c). Nyní máme integrovat parciální zlomek odpovídající dvojici komplexně sdružených kořenů. Ve jmenovateli je tedy polynom stupně 2 a v čitateli stupně nejvýše 1. Pokud je stupně 1, zapíšeme parciální zlomek tak, abychom v čitateli měli násobek derivace jmenovatele a k tomu přičítali zlomek, v jehož čitateli je již pouze konstanta. Takto dostaneme r _^±i^ dx = U dx + 13 r 2 f „ = J x2-4x+l5 2 J x2-4x + l5 J x2-4x + l5 fln (x2 -4x + 15) + 13/^^1^ = f ln (x2 - 4x + 15) + y I dx (vit) +1 dy |ln(x2 |ln(x2 dx ln (ji 4x + 15 + 13 VTT dy y2+l 4x + 15) + -i2= arctg y + C 4x + 15 + 13 arctg : + C. 363 C. INTEGRACE RACIONÁLNÍCH LOMENÝCH FUNKCÍ 2. INTEGROVÁNÍ Opět můžeme obecně vyjádřit Ax+B (x-x0)2+a2 a spočítat dx I 2(*-*o) (x-x0)2+a2 dx + (B + Ax0) J i (x-x0)2+a2 dx / 1 2(x-x0) (x-x0)2+a2 dx y = (X - X0) + a2 I _ , dy dy = 2 (x — xq) dx I y ln | y | + C = ln[(x - x0)2 + a2] + C, X—XQ (x-x0)2+a2 dx ±2I^ aL -i (x-x dx +i z = dz a I _ I f ĚL \ a J 1 ľ dz z2+l - arctg z + C = - arctg + C tj- Ax+B (x-x0)2+a2 dx ln ((x - x0)2 + a2) + ^ arctg ^ + C, kde hodnoty A, B, x0 e M, a > 0 jsou libovolné. Případ (d). Zbývají parciální zlomky pro vícenásobné komplexní kořeny ve tvaru r Ax\B „„, A,5,i0Ěl,fl>0,«eM\(ll, [(x-x0)2+a2] u 1 které analogicky upravíme na 2(*-*p) [(x-x0)2+a2 p + (B + Ax0) ■ [(x-xo)2+a 2+n2Y ■ Poté určíme 2(*-*o) [(x-x0)2+a2 J = (x — x0)2 + a2 dy = 2 (x — xq) oo jejíž hodnota navíc nezávisí na volbě posloupnosti dělení a jejich reprezentantů. Píšeme v takovém případě t-b S = I f(x)dx. Tato definice nevypadá příliš prakticky, nicméně nám dovolí snadno zformulovat a dokázat řadu jednoduchých vlastností Riemannova integrálu: Theorem. (1) Je-li f omezená reálná funkce definovaná na intervalu [a, b] a c e [a, b] je nějaký vnitřní bod tohoto intervalu, potom integrál f(x)dx existuje tehdy a jen tehdy, když existují oba integrály §c f(x)dx a f(x)dx. V takovém případě pak také platí rb re pb f (x)dx = / f (x)dx + / f (x)dx. (2) Jsou-li f a g dvě reálné funkce definované na intervalu [a,b] a jestliže existují integrály f(x)dx a g(x)dx, pak existuje také integrál jejich součtu a platí f (x)dx + / g(x)dx. (f(x)+g(x))dx (3) Je-li f reálná funkce definovaná na intervalu [a, b], C € M je konstanta a jestliže existuje integrál f(x)dx, pak existuje také integrál C ■ f(x)dx a platí b i-b C ■ f (x)dx = C ■ f (x)dx. Ja Proof. (1) Předpokládejme nejprve, že existuje integrál přes celý interval. Jistě se lze při jeho výpočtu omezit na limity Riemannových součtů, jejichž dělení mají bod c mezi svými dělícími body. Každý takový součet dostaneme jako součet dvou dílčích Riemannových součtů. Pokud by tyto dílčí součty v limitě závisely na zvolených rozděleních a reprezentantech, pak by celkové součty nemohly být v limitě na volbách nezávislé (stačí ponechat jednu posloupnost dělení podintervalu stejnou a druhou měnit tak, aby se limita změnila). Naopak, jestliže existují Riemannovy integrály na obou podintervalech, jsou libovolně přesně aproximovatelné Rie-mannovými součty a to navíc nezávisle na jejich volbě. Pokud do libovolné posloupnosti Riemannových součtů přes celý interval [a, b] přidáme v jejich děleních jeden dělící bod c navíc, změníme hodnotu celého součtu i částečných součtů přes intervaly patřící do [a, c] a [c, b] nejvýše o násobek normy dělení a možných rozdílů omezené funkce / na celém [a, b]. To je číslo jdoucí libovolně blízko k nule při 364 CHAPTER 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET zmenšující se normě dělení. Proto nutně i částečné Rieman-novy součty naší funkce nutně konvergují k limitám, jejichž součtem je Riemannův integrál přes [a,b]. (2) V každém Riemannově součtu se součet funkcí projeví jako součet hodnot ve vybraných reprezentantech. Protože je násobení reálných čísel distributivní, vyplývá odtud právě dokazované tvrzení. (3) Stejná úvaha jako v předchozím případě. □ Následující výsledek je zcela zásadní pro pochopení vztahu mezi integrálem a derivací: 6.25. Theorem (Základní věta integrálního počtu). Pro každou spojitou funkci f na konečném intervalu [a,b] existuje její Riemannův integrál f(x)dx. Navíc je funkce F(ť) zadaná na intervalu [a, b] pomocí Riemannova integrálu F(x) = / f(t)dt J a primitivní funkcí k f na tomto intervalu. Celý důkaz tohoto významného tvrzení bude poněkud delší. V prvním kroku pro důkaz existence integrálu použijeme alternativní definici, ve které nahrazujeme výběr reprezentatů a příslušné hodnoty /(§/) pomocí suprem Mi hodnot f(x) v příslušném podintervalu x{\, resp. pomocí infim m; funkce f(x) tamtéž. Hovoříme o horních Riemannových součtech, resp. dolních Riemannových součtech (někdy je v literatuře tento postup označován jako Darbouxův integrál). 6.26. Horní a dolní Riemannův integrál. Protože je naše jjři funkce spojitá, je jistě i omezená na uzavřeném intervalu a proto jsou všechna výše uvažovaná suprema I i infima konečná. Je tedy horní Riemannův součet příslušný dělení a = (x0, ..., xn) zadán výrazem Ss.sup = X( SUP f^) ' (Xi-Xi-l) = ^MiiXi-Xi-i) i=1*i-i(5*2+6*+3)-^/^ = ± ln (5x2 + 6x + 3) - ^ arctg t + C ± ln (5x2 + 6x + 3) - ^ arctg ^f + C; (c) dx (x-4)(x-2)(x2+2x+2) dx 1 ľ dx , 1 ľ ií+l^ dx = 1 ln i J_ r jfa___l_ r dx _|__l_ r_ 52 J x-4 20 J x-2 130 J x2+2x+2 lnU-2| + T^(2/^±2 52 20 x2+2x+2 26č)ln (x-4Ý (x-2)13 t = x + 1 dt = dx dx +7 f + _|_ln(x2+2x+2)+_7_J jc2+2jc+2 , 1 260 ln 26č)ln (jc-4)5(jc2+2jc+2) (x-2)13 130 J (jc + 1)2+1 _i__i_ r dt 130 J t2 + \ ~ (x-4ý{x2+2x+2) (x-2)13 + T^arctgř + C i 260 ln (x-4ý{x2+2x+2) (x-2)13 + 14 arctg (x + 1) + C; (d) i 3(*-l) x3-x + l dx ■■ dx 3 J (jc-1)2 1 3 J x2+x + \ dx (x + \)\ 3(x-l) 1 f_ 9 j (^)2 + 1 365 C. INTEGRACE RACIONÁLNÍCH LOMENÝCH FUNKCÍ 2. INTEGROVÁNÍ i 3(*-l) t _ 2x + l I V3 \-__L dt = -j^dx | ■^arctgř + C = -3^ 3(x-l) 2 r dt _ 3V3 J + 1 - (e) 2x+l dx = j ■ 2x+4 (x2+4x + l3)2 J (x2+4x + l3)2 t = x2 +4x + 13 ' dx — 3 J _dx_ (jc2+4jc + 13)2 dx _ - f - - 3 f úřř = (2jc +4)dx \ J '2 J [(x+2)2+9] - f 27 J + 1 jt+2 t dx i x2+4x + l3 I (u du («2+l)2 1 x2+4x + 13 1 x2+4x+l3 Tš arctg ~T i(iarctgM + i^)+C + C = j+2 3 (f) ^ arctg-±?- 5x2-l2 x+& +i -12jc3+62jc2-156jc + 169 5/" 2-6x + 13 + I (jc2-6jc + 13)2 2*-6 + C; 5x2-12 (x2-6x + 13)2 6 jc2+4jc + 13 dx = J dx 5/ (x-3)2+4 + 15/ (x2-6x + l3) dx + \3 f dx (x2-6x+13)2 f/7dkr + 15/raw^ + 13/ * x2 - 6x + 13 | dt = \ dx \ du = (2x — 6)dx - £=2 2 11 r 16 J dx +i 4 arctg t - — + 13 7 c u. [(x-3)2+4]2 8 J | arctg -j- jt-3 15 -6jc + 13 + f (iarctgř + i 15 13 x-3 13 _ arctg — - ztzšxTTi + ~6 arctg — + ~6 \t2+i] 2 | arctg ^ + jf 15 x2—6jc + 13 13jc-159 + 13 + c = - + c +1 x-3 53 x—3 16 arCt§ ~T~ + 8(a-2-6* + 13) 8 (jc-3)2+4 + c. + c □ 6.56. Spočítejte dx, (jc-1)2(jc2+2jc+2) Solution. Protože je stupeň polynomu v čitateli nižší než ve jmenovateli, tyto polynomy nemají společný kořen a je zadáno vyjádření jmenovatele ve tvaru součinu kořenových činitelů, známe tvar rozkladu integrované funkce na parciální zlomky B (x-l)2(x2+2x+2) _A_ + _ x-l t (jc-i)2 + Cx+D x2+2x+2 pro A, B,C, D e M. Pokud tuto rovnici vynásobíme jmenovatelem levé strany, dostaneme identitu x = A (x-l) (x2 + 2x + 2) + B (x2 + 2x + 2) + (Cx + D) (x - l)2 , která má platit pro všechna x e M \ {1}. Na obou jejích stranách jsou ale polynomy, a tak rovnost musí nastat rovněž pro x = 1. Dosazením této hodnoty ihned obdržíme, že 1 = 5(1 + 2 + 2), tj. B = 1/5. Mohli bychom volit další reálná (příp. komplexní) čísla a dosazovat je do uvedené rovnice. Nelze však již očekávat, že bychom Theorem. Nechť je funkce f omezená na uzavřeném intervalu [a, b]. Pak Ssup = ľnf >SsiSUp, S;nf = SUp Ssinf jsou limity všech posloupností horních, resp. dolních, součtů s normou jdoucí k nule. Riemannův integrál omezené funkce f přes interval [a, b] existuje, právě když Ssup = Smf. Proof. Pokud zjemníme nějaké rozdělení Si na H2 přidáním dalších bodů, zřejmě bude Každá dvě dělení mají společné zjemnění, jsou tedy hodnoty Jsup inf Ss,SUp, Jinf sup Se inf dobrými kandidáty na limity horních a dolních součtů. Skutečně, pokud existuje společná limita horních součtů S nezávislá na zvolené posloupnosti dělení, musí to být právě 5sup, a podobně pro dolní součty. Naopak, uvažme nějaké pevně zvolené dělení H s n vnitřními dělícími body intervalu [a,b], a jiné dělení Si, jehož norma je hodně malé číslo 8. Ve společném zjemnění H2 bude jen n intervalů, které budou do součtu Ss2,Sup přispívat případně menším příspěvkem než je tomu v Ei. Protože je / omezená funkce na [a, b], bude každý z těchto příspěvků ohraničený univerzální konstantou krát norma dělení (tj. maximální velikost příslušného intervalu v dělení). Při zvolení dostatečně malého 8 tedy nebude vzdálenost Selsup °d Ssup více než dvakrát vzdálenost Ss,sup od Ssup. Jestliže nyní zvolíme libovolnou posloupnost ak s horními součty, jejichž limitou je Ssup, pak pro pevně zvolené e > 0 najdeme vždy k takové, SskzSup, k > N bude k 5sup blíže než o e. Pro ale umíme podle předchozí úvahy najít 8 tak, že pro všechna dělení s normou menší než 8 budememe se součtem blíže než o 2e. Právě jsme proto ukázali, že pro libovolné číslo e > 0 umíme najít takové 8 > 0, že pro všechna dělení s normou nejvýše 8 bude l^s.sup — Ss\ < e. To je přesné tvrzení, že číslo Ssup je limitou všech posloupností horních součtů s normami dělení jdoucími k nule. Úplně stejně se dokáže i tvrzení pro součty dolní. Pokud Riemannův integrál neexistuje, existují posloupnosti dělení a reprezentantů s různými limitami Rieman-nových součtů. Pak ovšem z již dokázaného tvrzení plyne, že budou různé i limity horních součtů a dolních součtů. Naopak, předpokládejme, že Ssup = 5inf, pak ovšem i všechny Riemannovy součty posloupností dělení musí mít tutéž limitu díky nerovnostem (6.3). □ 6.27. Stejnoměrná spojitost. Prozatím jsme ze spojitosti naší funkce / využili pouze to, že každá taková funkce je na konečném uzavřeném intervalu U omezená. Zbývá nám ale ukázat, že pro spo- jité funkce je 5, sup >inf- 366 CHAPTER 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET Z definice spojitosti víme, že pro každý pevně zvolený bod x e [a, b] a každé okolí 0€(f(x)) existuje okolí Og(x) takové, že f(Os(x)) C 0€(f(x)). Toto tvrzení lze přepsat takto: jsou-li y, z e Og(x), tzn. mimo jiné platí \y -z\ < 2á, je také /()>), /(z) e Of (f(x)), tzn. mimo jiné platí l/O0-/(z)l <2e. Budeme potřebovat globální variantu takové vlastnosti, říkáme jí stejnoměrná spojitost funkce /: Theorem. Nechť je f spojitá funkce na uzavřeném konečném intervalu [a, b]. Pak pro každé číslo e > 0 existuje takové číslo 8 > 0, že pro všechny z, y € [a, b] splňující \y — z\ < 8 platí\ f (y) ~ f(z)\ < e. Proof. Protože je každý konečný uzavřený interval kompaktní, umíme jej celý pokrýt konečně mnoha okolími Os(X)(x) zmiňovanými v souvislosti se spojitostí výše, přičemž jejich poloměr 8(x) závisí na středu x, zatímco čísla e budeme uvažovat pořád stejná. Zvolíme konečně za 8 minimum ze všech (konečně mnoha) 8(x). Naše spojitá funkce / tedy má požadovanou vlastnost (pouze zaměňujeme čísla e a. 8 za jejich dvojnásobky). □ 6.28. Dokončení důkazu Věty 6.25. Nyní již snadno \. dokončíme celý důkaz existence Riemannova \i, integrálu. Zvolme si e a á jako v předchozí větě o stejnoměrné spojitosti a uvažujme jakékoliv dělení H s n intervaly a normou nejvýš 8. Pak X SUP /té) ' iXi~Xi- inf m (X i — Xi-i) *ZI sup /(£) inf /(£) -i<É<*; • (Xi < e ■ (b - a). Vidíme tedy, že se zmenšující se normou dělení jsou k sobě horní a dolní součty libovolně blízké. Proto infima a suprema splývají. To jsme potřebovali ukázat. Pro úplný důkaz základní věty integrálního počtu ještě zbývá ověřit tvrzení o existenci primitivní funkce. Víme již, že pro spojitou funkci / na intervalu [a, b] existuje pro každé t e [a, b] integrál f(x)dx. Zvolme, stejně jako v tvrzení o stejnoměrné spojitosti, k pevnému malému e > 0 číslo 8 > 0 tak, aby \f(x + Ax)- f(x)\ 0, x 7^ e. Solution. Případ (a). Výhodou výše popsané metody integrovaní racionálních lomených funkcí je její univerzálnost (umíme díky ní najít primitivní funkce každé racionální lomené funkce). Někdy je však výhodnější použití substituční metody nebo per partes. Např. je J2 I \+xl dx y = X-dy = 2x dx dy I dy l+y2 2(l+y2) ■ 5 arctgy + C = j arctgx2 + C. Případ (b). Pomocí substituce získáváme integrál racionální lomené funkce y = ln x I f x\n3 5 ln x_ x+x ln2 x—2x 5y i" ln3 5 ln x I * jc+ln2 x-2 ■ - dx -y+2 y-l ' y2+2y+2 dy dy = ■ dx 1 y-l^J 2 J y2+2y+2Uy ^ J J (j + l)2+l2 In I y - 1 I - \ ln I ln x — 1 dy ln (y2 + 2y + 2) + 3 arctg (y + 1) + C = \ ln (ln2x + 21nx + 2) + 3 arctg (lnx + 1) + C. □ Pro libovolnou funkci / spojitou a ohraničenou na ohraničeném intervalu (a, b) platí tzv. Newtonův-Leibnizův vzorec b (6.9) / f(x)dx = [F(x)]ba := lim F(x) - lim F(x), J x^b- x^a+ pro Ax jdoucí k nule. Pokud však volíme 0 < Ax < 8, pak v absolutní hodnotě je tento výraz odhadnut 1 / fx+Ax \ Äl(i mdt) fix) protože ve výrazu nalevo můžeme libovolně přesně nahradit integrál jeho Riemannovým součtem a ve sčítancích f(Ši)(Xi — x;_i) s Ši e [x, x + Ax] v jakémkoliv Rieman-nově součtu jsou /(§) vzdáleny od f (x) nejvýše o velikost e. Proto nahrazením f(x) za všechny /(§/) dostáváme nalevo nulový výraz a dopouštíme se chyby nejvýše e. To ovšem znamená, že existuje v bodě x derivace funkce F(x) zprava a je rovna f (x). Stejně dokážeme výsledek pro derivaci zleva a celá věta 6.25 je dokázaná. 6.29. Důležité poznámky. (1) Věty 6.25 a 6.24 nám říkají, že integrál je lineární zobrazení C[a,b] vektorového prostoru spojitých funkcí na intervalu [a, b] do reálných čísel. Je to tedy lineární forma na prostoru C[a, b]. (2) Dokázali jsme, že každá spojitá funkce je derivací nějaké funkce. Newtonův a Riemannův integrál tedy jako koncepty pro spojité funkce splývají. Riemannův integrál spojitých funkcí lze proto spočíst pomocí rozdílu hodnot F(b) — F (a) primitivní funkce F. (3) V prvním kroku důkazu věty 6.25 jsme dokázali důležité tvrzení, že pro omezenou funkci / na intervalu [a,b] vždy existují limity horních součtů i dolních součtů. Říká se jim také horní Riemannův integrál a dolní Riemannův integrál a používá se pro ně často značení faf(x)dx af^f(x)dx. Takto lze pro omezené funkce ekvivalentně definovat i Riemannův integrál (jak jsme konečně v důkazu i činili). (4) V dalším kroku v důkazu jsme odvodili důležitou vlastnost spojitých funkcí, které se říká stejnoměrná spojitost na uzavřeném intervalu [a,b]. Zjevně je každá stejnoměrně spojitá funkce také spojitá, naopak to ale na otevřených intervalech platit nemusí. Příkladem může sloužit třeba funkce f(x) = sin(l/x) na intervalu (0, 1). (5) Uvažme funkci / na intervalu [a, b], která je pouze po částech spojitá. To znamená, že je spojitá ve všech bodech c e [a, b] kromě konečně mnoha bodů nespojitosti c i, a < Ci < b, ve kterých ovšem má konečné jednostranné limity. Vzhledem k aditivnosti integrálu vůči intervalu přes který se integruje, viz 6.24(1), existuje podle poslední věty v takovém případě integrál Fix) f(t)dt pro všechna x e [a, b] a derivace funkce F(x) existuje ve všech bodech x, ve kterých je / spojitá. Navíc se snadno ověří, že ve zbývajících bodech je funkce F(x) spojitá, je to 368 CHAPTER 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET tedy spojitá funkce na celém intervalu [a, b]. Při výpočtu integrálu pomocí primitivních funkcí je zapotřebí volit její jednotlivé části tak, aby na sebe navazovaly. Pak bude i celý integrál vyčíslen jako rozdíl funkce F(x) v krajních hodnotách. (6) Lagrangeova věta o střední hodnotě diferencovatelné funkce má analogii, které se říká integrální věta o střední hodnotě. Uvažme funkci f(x) spojitou na intervalu [a, b] a její primitivní funkci F(x). Věta o střední hodnotě říká, že existuje vnitřní bod a < c < b takový, že í f{x) dx = F(b) - F(a) = F'(c)(b - a) = f(c)(b - a). ■j a Toto tvrzení lze vcelku snadno odvodit přímo z definice Riemannova integrálu a pak jej je možné přímočaře využít v závěrečném kroku důkazu základní věty integrálního počtu. 6.30. Nevlastní integrály. Při diskusi integrace racionálních lomených funkcí jsme viděli, že bychom rádi pracovali také s určitými integrály přes kv? intervaly, v nichž jsou i body, kde integrovaná funkce f(x) má nevlastní (jednostranné) limity. V takovém případě není integrovaná funkce ani spojitá ani omezená a proto pro ni nemusí platit námi odvozené výsledky. Hovoříme o "nevlastním integrálu". Jednoduchým východiskem je diskutovat v takovém případě určité integrály na menších intervalech s hranicí blížící se problematickému bodu a zkoumat, zda existuje limitní hodnota takovýchto určitých integrálů. Pokud existuje, řekneme, že příslušný nevlastní integrál existuje a je roven této limitě. Uvedeme postup na jednoduchém příkladě: dx 10 y/2 - X je nevlastní integrál, protože uvedená integrovaná funkce f(x) = (2 — x)~1/4 má v bodě b = 2 limitu zleva rovnou oo. V ostatních bodech je integrovaná funkce spojitá. Zajímáme se proto o integrály ľ2~s dx ľ2 I _1/4 ^ V2 y /4 [23/4 _ ^3/4_ Všimněme si, že jsme ve výpočtu substitucí dostali integrál s přepočtenou horní mezí 8 a dolní mezí 2. Otočením mezí do obvyklé polohy jsme do výrazu přidali jedno znaménko minus navíc. Limita pro 8 -» 0 zprava zjevně existuje a spočítali jsme tedy nevlastní určitý integrál dx t/2 4 -23/4. 3 Stejně budeme postupovat, pokud je zadáno integrování přes neohraničený interval. Často v tomto případě hovoříme kde F'(x) = f(x), x e (a, b). Zdůrazněme, že za uvedených podmínek vždy existuje primitivní funkce F a jako vlastní obě limity v (|| 6.91|). K výpočtu určitého integrálu nám tedy stačí najít an-tiderivaci a určit příslušné jednostranné limity (příp. jen funkční hodnoty, je-li primitivní funkce spojitá v krajních bodech uvažovaného intervalu). 6.60. Určete (a)/ 1 x+l dx, x > 0; dx, x ^ i. (x +4)-Jx2+3x-4 dx, x e (—oo, —4) U (1, +oo); V J J l+J-x2+x+2 (0/ 1 dx, x e (—1,2); dx, x ^ 1. (x-\)~J x2+x + \ Solution. V tomto příkladu budeme ilustrovat použití substituční metody při integrování výrazů s odmocninami. Případ (a). Má-li počítaný integrál tvar /f{p(yx~, p(?fx~,..., p(Ífx~) dx pro jistá čísla p(l), p(2), ..., p(j) e N a racionální lomenou funkci / (více proměnných), doporučuje se substituce ť = x, kde n je (nejmenší) společný násobek čísel p(l), ..., pij). Touto substitucí lze totiž převést integrand (integrovanou funkci) na racionální lomenou funkci, kterou umíme integrovat vždy. Dostáváme dx dx — -^i ^\/x — t I p m9 dt = dx \ $ *"> («*+«*) 10/^ = 1°/(7-^ + ^-^ + ^-ř-+V)^ = 10 lln ř + 7 " 2T + W ~ 47 " ln (1 + 0 ] + C = dt ln- + 10 (i+ iyi)io ^ \°i Případ (b). Pro integrály 5 _|__10 2^ + c. f f (x, p2 + l (ř2-l)2 dt i" (ř+l ř-1 ř2+l) dt 369 C. INTEGRACE RACIONÁLNÍCH LOMENÝCH FUNKCÍ 2. INTEGROVÁNÍ ln 11 + 1 | - ln 11 - 1 | - 2 arctg t + C ln Úpravy ln /x+l + 1 x—l ln + 1 ln ln I x + l _ 1 x-1 1 1 2 arctg, + C. ln I ln I +i I VI x + l |+V| x-l VI + 1 — V x — 1 21n (vi jc + 1 _ ln (vT7+T|+VU-i I) | x + l — x —1 I + VU - 1 I) -ln2 pro x e (—oo, —1) U (1, oo) dále umožňují zapsat í\^idx =21n (VU + ll + VU- II) -2arctgyi±i + C. Případy (d), (e), (f). Nyní se zaměříme na integrály J / {x, Vclx2 + bx + c^j dx, kde očekáváme a ^ 0 a. b2 — 4ac ^ 0 pro jinak libovolná čísla a,b, c e M. Připomeňme, že / je racionální lomený výraz. Rozlišíme dva případy, kdy kvadratický polynom ax2 +bx +c má reálné kořeny a kdy reálné kořeny nemá. Pokud je a > 0 a polynom ax2 + bx + c má reálné kořeny x\, x2, vyjádříme V ax2 + bx + c = yfä {x — x\)2 í—22. = ^Jq Xi x-X2 x—x\ a položíme r = fzfy- Pokud je a < 0 a polynom ax + bx + c má reálné kořeny x\ < x2, vyjádříme V ax2 + bx + c = a (x — xi) 2 X2-x -a (x — x\) a zavedeme t = . Pokud polynom ax + bx + c nemá reálné kořeny (nutně musí být a > 0), volíme substituci V ax2 +bx + c = ±y/a~ ■ x ± t při jakékoli volbě znamének. Poznamenejme, že znaménka samozřejmě volíme tak, abychom dostali co nejjednodušší výraz pro následné integrování. Ve všech uvedených případech potom tyto substituce vedou opět na racionální lomené funkce. Platí tedy (d) r_dx_ _ r_dx_ _ r dx _ J řvJ-4-l./v2_i_Qv_4 _ J (x+4)J(x-l)(x+4) ~ J (x+4)Jx2+3x-4 .2 _ x-l (x+4)\ x+4 x dx ^x+4 ~ ~ lOf (1-t2)2 I (i-t2)2 dt (li )í \-? dt = J 2 I l-'2 I 5 1-t2 dt fsgn(l-ř2)/lí/ř = fsgn(4í)ř + C Ísgn(x)J^ + C; (e) x dx dx 1+V'-x2+x+2 f2 _ x+l - -1__1 ~ t2+l 1 - ~6t dt I dx l+V-(*-2)(* + l) dx l+(Jc + l)v (t2+D í2+i -6t (t2+ l)(t2+3t+l) dt = f- dt P-+1 (ř2 + l)2 t2+3t+l -6t dt ľ ( 4 VŠ___2_ ■> \ 5 2Í+3+V5 t2+l V5 5 -2Í-3+V5 , dt o nevlastních integrálech 1. druhu, zatímco integrály z neohraničených funkcí na konečných intervalech jsou nevlastní integrály 2. druhu. Obecně tedy např. pro a e M f(x)dx= lim / f(x)dx, pokud limita vpravo existuje. Obdobně můžeme mít horní mez integrování konečnou a druhou nekonečnou. Pokud jsou nekonečné obě, počítáme integrál jako součet dvou integrálů s libovolně pevně zvolenou pevnou mezí uprostřed, tj. f(x) dx f(x)dx-\- I f(x)dx. Existence ani hodnota nezávisí na volbě takové meze, protože její změnou pouze o stejnou konečnou hodnotu měníme oba sčítance, ovšem s opačným znaménkem. Naopak limita při které by stejně rychle šla horní i dolní mez do ±oo může vést k odlišným výsledkům! Např. 1 x dx 0, přestože hodnoty integrálů Ja°° x dx s jednou pevnou mezí utečou rychle k nekončených hodnotám. Při výpočtu určitého integrálu z racionální funkce lomené musíme pečlivě rozdělit zadaný interval podle bodů nespojitosti integrované funkce a spočítat jednotlivé nevlastní integrály každý zvlášť. Navíc je nutné rozdělit celý interval tak, abychom vždy integrovali funkci neohraničenou pouze v okolí jednoho z krajních bodů. 6.31. Přírůstky do ZOO. Z počítaných příkladů se může zdát, že je obvyklé najít neurčitý integrál pomocí výrazů složených ze známých elementárních funkcí. To je úplně mylný dojem. ^ Naopak, drtivá většina spojitých funkcí vede na integrály, které tak vyjádřit neumíme. A to i když integrujeme funkce docela jednoduché. Protože se integrací získané funkce velice často v praxi vyskytují, mnohé mají jména a před nástupem počítačů byly pro potřeby inženýrů vydávány obsáhlé tabulky hodnot takových funkcí. V dalším textu se ještě budeme vracet k metodám, jak numerické aproximace takových funkcí získávat. Uvedeme si nyní aspoň nějaké příklady. V metodách pro zpracování signálu je velice důležitá funkce sin(x) sinc(x) =-. x Docela přímočaře, byť pracně, lze ověřit, že jde o hladkou funkci s limitními hodnotami /(0) = 1, /'(0)=0, /"(0) = -| Je tedy okamžitě vidět, že tato sudá funkce bude mít v bodě x = 0 absolutní maximum a s narůstající absolutní hodnotou 370 CHAPTER 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET x se bude vlnit se stále se zmenšující amplitudou. Funkce Sinusintegrál je definovaná vztahem Sí(jc) = / sinc(ř) dt. Jo Dôležitejšou také Fresnelovy sinové a kosinové integrály FresnelS(x) = / sin(j7t ŕ) dt Jo FresnelC(x) = / cos(jjtt2)dt. Jo Na levém obrázku je průběh funkce Si(x), na pravém vidíme obě Fresnelovy funkce. Nové typy funkcí dostáváme také, když do integrovaného výrazu povolíme volný parametr, na kterém pak výsledek závisí. Příkladem může být jedna z nej důležitějších funkcí v matematice vůbec — tzv. Gamma funkce. Je definovaná vztahem /■OO r(z) = / e-'ť^dt. Jo Lze ukázat, že tato funkce je analytická ve všech bodech z £ Z a pro malá z e N můžeme počítat: r(l) = / e"ř řdt = [- e"ř]~ = 1 Jo e"ř t1 dt = [- e_ř ř]~ + / e_ř dt = 0 + 1 = 1 r(2) T(3) = / e-'t2dt = 0 + 2 / e-'tdt = 0 + 2 = 2 Jo Jo a pomocí indukce snadno dovodíme, že pro všechna kladná celá čísla n dává tato funkce hodnotu faktoriálu: r(n) = (n - 1)! Následující obrázek ukazuje v logaritmickém měřítku závislé proměnné průběh funkce f(x) = ln(r(x)). Vidíme z něj tedy, jak rychle skutečně roste faktoriál. ^ln 2t + 3 + VŠ -2t - 3 + y/5 2VŠ ln 2 arctg t + + C = 2 arctg ^ + C = + 2^1n^±L-— 2 arctg, + C; (f) dx (x-l)Jx2+x + l \/x2 + x + 1 = x + ř x2 + x + 1 = x2 + 2xr + t2 dx -2ft2-h-l) (2t-l)2 2ř-l -2(?-t+\) (2t-l)2 P +2t-2 l2- 2í-1 2í-1 V_3 1 3 Í+1-V3 VI_ 3 Í+1+V3 2 +2ř-2 1 ^ dt V3 ln ř + 1 - V3 V3 ln t + 1 + 73 + c f ln ž+l-VŠ Í+1+V3 V3 , v/jc2+jc + 1-jc + 1-V3 + C = ^ ln ■ ^- J V*2+*+l-*+l+V3 + c. □ 6.61. Pomocí vhodné substituce spočítejte dx dx, x e -oo, -Vš-i )u(^i,+oo). x+*Jx2+x — 1 Solution. Přestože kvadratický polynom pod odmocninou má reálné kořeny x\, x2, nebudeme příklad řešit pomocí substituce ř2 = fžf^-Sice bychom tak postupovat mohli, ale raději použijeme metodu, kterou jsme zavedli pro případ komplexních kořenů. Tato metoda totiž dává velmi jednoduchý integrál racionální lomené funkce, jak vidíme z výpočtu dx :+Jx2+x-l \/x2 + X — 1 = X + t x2 + x - 1 = x2 + 2xř + ř2 dx l-2ř -2í2 +2H-2 -2Ž2 +2H-2 (ř+2)(l-2ř) Vx2 + x — 1 — ; (l-2t)2 t - 2 In 11 + 2 I ln ř + C 21n x2+x — 1—x+2 ln Vx^T i + c. Dodejme, že každou doporučenou substituci (viz dříve uvedené příklady) lze ve většině konkrétních úloh nahradit jinou substitucí, která umožní dospět k výsledku výrazně snazším způsobem. Nespornou výhodou doporučených substitucí však je univerzálnost: jejich zavedením lze vypočítat všechny integrály příslušných typů. □ Další metody integrování naleznete na straně 393 D. Určité integrály 6.62. Vyčíslete určité integrály 371 D. URČITÉ INTEGRÁLY 2. INTEGROVÁNÍ ]tg2xdx, f- dx. Solution. Pro x ^ j + kjt, kde k e Z, je J tg2 x dx = tg x — x + C, jak jsme vypočítali dříve. Odsud vyplýva, že ftg2xdx = [tgx -x]^ = V3 - f - - f) = ^ - f. n/6 Určité integrály lze pochopitelně počítat také přímo. Substituce y = tg x kupř. dává jt/3 jt/3 f tg2xdx = f ^dx J ° J cos x jt/6 V3 jt/6 V3 y = tg x; dy dx sin2 x tg2 x I lT^dy= / 1-TT^^ = b-arctgv]^V3 = -2. fi. l+tg2* l+y2 V3 _ _ 1/V3 ~~ VŠ 1/V3 1/V3 Pouze je třeba nezapomenout změnit při substituci meze integrálu na hodnoty získané dosazením V3 = tg (tx/3), l/VŠ = tg (tt/6). Druhý integrál vyčíslíme metodou per partes pro určitý integrál. (Poznamenejme, že primitivní funkce funkce y = x cos-2 x jsme také stanovili již dříve.) Platí jt/4 ■ dx F(x) = x G'(x) = -X F'(x) = 1 G(x) = tgx [* Mf - 7V dx = [x tgx]l/4 + "f=g± dx o o I71'/4 i n„ /-___..\W4 _ 3T i i„ V2 _ jt-2 ln 2 4 [x tgx]^/4 + [ln (cosx)]^4 = f + In ^ □ 6.63. Vyčíslete určité integrály (b) í -t4=ť x2-l (C) Jo (e2*+3 + cos2*) d*\ Solution. Platí (a) ^ Xa(x) 1 jestliže je x e A 0 jestliže je x ^ A. riemannovsky integrovatelná, tj. existuje integrál (ať už s konečnou nebo nekonečnou hodnotou) m (A) XA(x)dx. Funkci xa říkáme charakteristická funkce množiny A, hodnotě m (A) říkáme Riemanovská míra množiny A. Všimněme si, že pro interval A = [a, b] jde vlastně o hodnotu rb Xa(x) dx = I dx = t> — a, přesně jak jsme očekávali. Zároveň má takováto definice "velikosti" očekávanou vlastnost, že míra sjednocení konečně mnoha riemannovsky měřitelných a po dvou disjunktních množin vyjde jako součet. Zejména každá konečná množina A má Riemannovskou míru nulovou. 372 CHAPTER 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET Pokud ale vezmeme spočetné sjednocení, taková vlastnost již neplatí. Např. stačí vzít množinu Q všech racionálních čísel jakožto sjednocení jednoprvkových podmnožin. Zatímco každá množina o konečně mnoha bodech má podle naší definice míru nulovou, charakteristická funkce xq není riemannovsky integrovatelná. Povšimněme si, že horní Riemannův integrál z charakteristické množiny x a odpovídá infmiu součtů délek konečně mnoha disjunktních intervalu, kterými umíme pokrýt danou množinu A, zatímco dolní integrál je supremem součtu délek konečně mnoha disjunktních intervalů, které umíme vložit do množiny A. Takto lze postupovat i ve vyšších dimenzích při definici tzv. Jordánovy míry. Pro definici plochy (objemu) ve vícerozměrných prostorech budeme umět použít i přímo koncept Riemannova integrálu, až jej zobecníme do vícerozměrného případu. Nicméně je dobré si už teďpovšim-nout, že skutečně původní představa o ploše rovinného útvaru uzavřeného výše uvedeným způsobem grafem funkce bude bezezbytku naplněna. 6.33. Střední hodnota funkce. u konečné množiny hodnot jsme zvyklí uvažovat o jejich střední hodnotě a definujeme ji zpravidla jako aritmetický průměr. Pro riemannovsky integrovatelnou funkci /(je) na intervalu (konečném nebo nekonečném) [a, b] je definována její střední hodnota výrazem 1 fh m(f) =-- / f(x)dx. b - a Ja Z definice je m(f) výška obdélníka (s orientací podle znaménka) nad intervalem [a,b], který má stejnou plochu jako je plocha mezi osou x a grafem funkce f(x). Platí tedy obecně integrální věta o střední hodnotě Proposition. Je-li f(x) riemannovsky integrovatelná reálná funkce na intervalu [a, b], pak existuje číslo m(f), pro které platí ľb f(x) dx = m(f)(b — a). 6.34. Délka prostorové křivky. Námi vybudovaný integrál jde také dobře použít pro výpočet délky křivky ve vícerozměrném vektorovém prostoru W. Pro jednoduchost si to předvedeme na případu ^r^^fe-i- křivky v rovině M2 se souřadnicemi x, y. Mějme tedy parametrický popis křivky F : M -» M2, F(t) = [g(t), f (t)] a představme si ji jako dráhu pohybu. Pro jednoduchost předpokládejme, že funkce /(ŕ) a g(t) mají po částech spojitou derivaci. Derivací zobrazení F(t) dostaneme hodnoty, které budou odpovídat rychlosti pohybu po takovéto dráze. Proto celková délka křivky (tj. dráha uražená za dobu mezi hodnotami t = a, t = b) bude dána integrálem přes interval 1 ( i \ 1 1 i I + ^7)dx = I dx + I ľJ^27 dx o p = ex dp = ex dx f ^ dp + [tg x]0 = \j — i +i ■ dp + tgl V3 e/V3 ds f I ^Tds+tgl [arctgí]^ + tgl . _£_ Y5 ,- — dv\ 3 J S'I+1 V3 aP I 1/V3 f (arctg i) + tgl; □ 6.64. Dokažte, že platí V2 1 < - dx < — 20 - j vT+í - io o Solution. Neboť 0 < *1 < -*L= — V2 — VT+í < x> x e [0, 1], z geometrického významu určitého integrálu plyne # = / ^ dx < f -jZ- dx < f x9 dx o o o 10 ■ □ 6.65. Bez symbolů derivace a integrace vyjádřete ( / ř5 ln (ř + 1) dt x e (-1, 1), je-li derivováno podle x. Solution. O integrování se často hovoří jako o inverzní operaci k derivování. V tomto příkladu této „inverznosti" využijeme. Funkce x F(x) := f ŕ ln(ř + 1) dt, x e (-1, 1) o je očividně antiderivací funkce /(x) := x5 ln(x + 1) na intervalu (—1, 1), tj. jejím derivováním dostaneme právě /. Platí tedy ( J ŕ ln (ř + 1) dt ft5 ln(ř + 1) dt -x5 ln (x + 1) □ E. Nevlastní integrály 6.66. Rozhodněte, zda +0O J xjx 1 Solution. Nevlastní integrál udává obsah obrazce mezi grafem kladné funkce arctg x y= ~x~4T> x -1 a osou x (zlévaje obrazec ohraničen přímkou x = 1). Integrál j e proto kladným reálným číslem, nebo je roven +oo. Víme, že j < arctgx < f, x e [1, +oo). Odsud ovšem dostáváme 373 E. NEVLASTNÍ INTEGRÁLY 2. INTEGROVÁNÍ +00 +OQ +OQ _ 3 , r- arr.tp r * tt- r _ß_ f = f / jc-3 < / ^ dx<% f X"2 dx = Jt, 1 1 1 tj. zvláště +00 Xyfx □ Vzorec (||6.9||) lze použít také tehdy, když je funkce / neohraničená nebo interval (a, b) je neohraničený. Mluvíme o tzv. nevlastních integrálech. Pro nevlastní integrály však limity na pravé straně mohou být nevlastní, příp. nemusejí vůbec existovat. Pokud jedna z limit neexistuje nebo obdržíme výraz 00 — 00, znamená to, že integrál neexistuje (00 — 00 tedy v tomto případě nemá charakter neurčitého výrazu). Říkáme, že integrál osciluje. V každém jiném případě máme výsledek (připomeňme, že 00 + 00 = +00, —00 — 00 = —00, ±00 + a = ±00 pro a e M). 6.67. Určete 00 (a) J sin x dx ; (b) / dx . x4+x2 9 o (d) / %. -1 Solution. Případ (a). Ihned stanovíme 00 f sin x dx = [— cosx]^° = lim (— cosx) + cos 1. j x=>oo Protože limita na pravé straně neexistuje, uvažovaný integrál osciluje. Případy (b), (c). Stejně lehce vypočítáme 1 1 v ' 1 Um (-i - arctgx) +{ + arctg 1=0-| + 1 + | = 1- | a ještě snazší pak je /§ = [V^]0 = 4-0 = 4, o kde je primitivní funkce v počátku spojitá zprava (uvažovaná limita je tak rovna funkční hodnotě). Případ (d). Kdybychom bezmyšlenkovitě vypočítali -1 -1 -2, obdrželi bychom zjevně chybný výsledek (zápornou hodnotu při integrování kladné funkce). Důvodem, proč Newtonův-Leibnizův vzorec nejde takto aplikovat, je nespojitost uvažované funkce v počátku. Využijeme-li však tzv. pravidla návaznosti b c b J f(x)dx = J f(x)dx + J f(x)dx, a a c které platí vždy, když mají integrály na pravé straně smysl, nalezneme správný výsledek [a,b], kde integrovanou funkcí h(t) budou právě velikosti vektorů F'(t). Chceme tedy spočíst délku s rovnou s= í h(t)dt= í V(/'(ř))2 + (g'(t))2 dt. •J a J a Ve speciálním případě, kdy křivka je grafem funkce y = f(x) mezi body a < b obdžíme pro její délku ,-b s = / V1 + (f'(x)Ý dx J a Tentýž výsledek lze intuitivně vidět jako důsledek Pythagorovy věty: pro lineární přírůstek délky křivky As odpovídající přírůstku Ax proměnné x spočteme totiž právě As = V(Ax)2 + (Ay)2 a to při pohledu přímo na naši definici integrálu znamená Naopak základní věta diferenciálního počtu (viz 6.25) ukazuje, že na úrovni diferenciálů takto definovaná veličina délky grafu funkce y = y (x) splňuje ds = a/1 + (/ (x))2dx, přesně dle očekávání. Jako snadný příklad spočteme délku jednotkové kružnice jako dvojnásobek integrálu funkce y = \/l — x2 v mezích [— 1, 1]. Víme již, že musí vyjít číslo 27t, protože jsme takto číslo jt definovali. s =2 y/\ + (y)2dx=2 / J\ + -1 J-i 1 - x2 ■ dx 1 vr^i? dx = 2[arcsinx]_, = 27t. Jestliže v předchozím výpočtu budeme počítat s y = -J r2 — x2 = ryj 1 — (x/r)2 a meze budou [—r, r], dostaneme substitucí x = rt deku kružnice o poloměru r: s(r) =2 Jl + (x/r)2 -— dx = 2 , ,_ 1 - (x/r)2 J_t y/T~f2 dt = 2r[arcsinx]i1 = 27rr. Výsledek samozřejmě známe z elementárni geometrie. Nicméně teď se nám z východisek integrálního počtu podařilo dovodit zásadní skutečnost, že je délka kružnice lineárně závislá na jejím průměru 2r. Číslo it je právě poměr, ve kterém se tato závislost realizuje. 374 CHAPTER 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET 6.35. Plochy a objemy. Riemannův integrál můžeme přímo použít na výpočet ploch či objemů útvarů definovaných pomocí grafu funkce. Jako příklad spočtěme plochu kružnice s poloměrem r. Půlkruh vymezený funkcí \Jr2 — x2 má plochu, jejíž dvojnásobek a (r) spočteme substitucí x = r sin ř, dx = r cos t dt (s využitím výsledku pro I2 v odstavci 6.22) a(r) ľ - ľn/2 2 Vr2 - x2 dx = 2? I cos21 dt J-r J-tt/2 2r2 [cos t sin t + ťfl^n = Jtr2 Opět stojí za pozornost, že tento dobře známý vzoreček je odvozen z principů integrálního počtu a že kupodivu je plocha kruhu nejen úměrná kvadrátu poloměru, ale zároveň je tento poměr daný opět konstantou jt. Všimněme si ještě poměru obsahu a obvodu kruhu, tj. 77" r2 r 27rr 2 Čtverec o stejném obsahu má stranu o velikosti y/jtr a tedy obvod 4^/jtr. Obvod čtverce o obsahu jednotkového kruhu je tedy což je o přibližně 0.8 více, než je obvod jed- notkového kruhu. Lze dovodit, že ve skutečnosti je kružnice útvarem s nejmenším obvodem mezi všemi se stejným obsahem. K odvozování takových výsledků se dostaneme v našich poznámkách o tzv. variačním počtu v pozdějších kapitolách. Další obdobou téhož principu je výpočet povrchu nebo objemu rotačního tělesa. Pokud vznikne těleso rotací grafu funkce / kolem osy x v intervalu [a, b], vzniká při přírůstku Ax nárůst plochy o násobek As délky křivky zadané grafem funkce y = f (x) a. velikosti kružnice o poloměru f(x). Plocha se proto spočte formulí A(f) = 2tt b r-b f(x)ds=2n /(jc)Vl + (f'(x))2 dx, kde ds je dán přírůstkem délky křivky y = f (x), viz výše. Podkud bychom rotační těleso zadali jeho hranicí prametrizo-vanou dvojicí funkcí [x(t), y(t)], bude příslušný diferencál tvaru ds = V (x! (ŕ))2 + (/ (í))2 dt a pro povrch dostaneme A = 2jt / y(tW(y'(t))2 + (x'(t))2 dt. ■j a Objem stejného tělesa naroste při změně Ax o násobek tohoto přírůstku a plochy kružnice o poloměru f(x). Proto je dán formulí V(f)=7t / (J(x)Ydx. ■j a Jako příklad užití vzorců pro obsah a objem odvodíme známé formule pro plochu sféry a objem koule o poloměru lim (--) - 1 - 1 - lim = oo - 2 + oo = +oo. Podotkněme, že ze sudosti funkce y = x~2 také plyne f dx = 2 rdx j xz J r -1 0 2 • oo = +oo. □ 6.68. Vyčíslete určité integrály oo i (x+2ý dx; (a) Jí (b) f_2 In I x I dx; (C) dx- (d) £ s£ dx; (e) f 2 —p— dx. v ' j\ xmx Solution. Platí (a) dx (x+2ý f lim (x +2) = -4-[(*+2)-4]0 = -4-2-4) = -Ho-á) = á; (b) 2 0 2 2 J In I x I dx = f In | x | dx + J In | x | dx = 2 f In x dx -2-2 0 0 2 j [x lnx]p — J 1 dx F (x) = lnx G'(x) = 1 F'(x) G(x) = x 2 ([x ln; [x] 2 ( 2 ln 2 — lim (x ln x) — 2 + x^0+ 41n2 - 4; (c) fe-pdx J s/X Í = y/X J dt = ttt= dx 2s/x I —2 (lim e~ř v-»oo 2je-'dt = 2[-ďt]\ (d) u = 1/x du — 1 2 J uď du f uď du F(u) = u F'(u) = 1 G'(u) = ď G(u) = ď [u ď] Ml —1 / ďdu = [«e"]:L - [e"]!^ -oo 1 i r;«- nil _ 2. lim u ď — oo (e) f ^ J jtln + lim e" w^* —oo ln2 iln2 Jo r — lnx i r j = ff-=[inr]c x I 0 ln (ln2) — lim lnr = ln (ln2) + oo = +oo. □ 375 E. NEVLASTNÍ INTEGRÁLY 3. NEKONEČNÉ ŘADY 6.69. Vypočítejte nevlastní integrály oo oo J*2 e"**; f u -oo Solution. Protože je nevlastní integrál speciálním případem určitého integrálu, máme k dispozici základní metody, jak jej můžeme počítat. Metodou per partes získáváme J x2 e x dx 7 - -x e X+2I x e x dx F (x) = x2 G'(x) = e~x F (x) = x G'(x) F'(x) = 2x G (x) = -e"- ' F'(x) = 1 G(x) = -e" - lim 4 + 2 \-x e"*"T + 2 f e"* dx = Jt^oo e l ju J 0 - 2 lim 4 + 2 [-e-xlľ° = 0 + 2 ( lim -e~x + l) = 2. Jt^oo e l ju Vt^oo / Substituční metoda potom dává dx I e2x + l oo [arctg y] dx y dy = ď dx lim arctg v = f, J ),2 + l 3^*00 kde nové meze integrálu plynou z limit lim ď = O, lim ď +oo. □ 6.70. Spočtěte „2n + l „—x2 dx, n e N. Solution. Přiklad řešme nejprve substituční metodou a následně opakovaně aplikujme per partes se ziskem y = x2 | j 00 dy = 2x dx I 2 íf ^ 6 ^ o 2n + \ ~—x dx F(y) = f G'(y) = c-y F'(y) = ný G(y) = ,«-i (oo \ oo [-/ e">]~ + n / y""1 e-> dy ) = \ f f'1 e~y dy o /o F(v) = Z"1 G'(y) = e"> F'(y) = (n- l)f~ -y G(y) = -e" | ^[_y.-i e-,]~ + („-!) J/"2 e"> dy) 2^/Z"2 e-y dy o n(n-l)-2 / y e~y dy o o F(y) = y G'(y) = e-y F'(y) = 1 G (y) = -e-y ^([-ye-T + Je-^y) n! ľ „-J-l00 _ tú 2 L e Jo — 2 • □ 6.71. V závislosti na a e M+ určete integrál dx. r. Ar=2it i rjl- (x/r)2 Vi - (x/r)2 27rr I dt = Anr2 dt Vr = n (r— x ) dx 7t 2 r x -Ttr3. Stejně jako u kružnice i kouleje objektem, který má mezi všemi s daným objemem ten nejmenší povrch. To je důvod, proč jsou mýdlové bubliny vždy prakticky tohoto tvaru. 6.36. Integrální kriterium konvergence řad. Pomocí nevlastního integrálu také umíme rozhodnout o konvegenci širší třídy nekonečných řad než doposud: Theorem. Buď^^Li f(n) řada taková, že funkce f : M -» M. je kladná a nerostoucí na intervalu (1, oo). Pak tato řada konverguje právě tehdy, když konverguje integrál f(x)dx. Proof. Pokud interpretujeme integrál, jako plochu pod křivkou, je kriterium zřejmé. Pokud daná řada diverguje, pak diverguje i ; Y>. • řada 2Z,T=2 /(")■ Pro libovolné/c e N máme v'j~-^>- pro žc-tý částečný součet s'k (řady bez prvního členu) nerovnost 4 = £/(«) < / /(x)dx' n=2 -'X neboť s'k je dolním součtem Riemannova integrálu J"* f(x) dx. Pak aleje poo pk / f(x)dx = lim / f(x)dx > lim s'k = oo Ji k^°°Ji k^°° a uvažovaný integrál diverguje. Předpokládeme nyní, že daný integrál konverguje a označme žc-tý částečný součet dané řady jako sk. Potom máme nerovnosti ŕ f(x)dx = lim / f(x)dx < lim sk < oo, k^oo k^oo neboť Sk je horním součtem Riemannova integrálu J"* f(x) dx a předpokádáme, že daná řada konverguje. □ 3. Nekonečné řady Již jsme se při budování našeho zvířetníku funkcí setkali s mocninnými řadami, které přirozeným způsobem rozšiřují skupinu všech polynomů, viz 5.45. Zároveň jsme si říkali, že takto získáme třídu analytických funkcí, ale nedokazovali jsme tehdy ani to, že jsou mocninné řady spojitými 376 CHAPTER 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET funkcemi. Snadno nyní ukážeme, že tomu tak je a že skutečně umíme mocninné řady i derivovat a integrovat po jednotlivých sčítancích. Právě proto ale také uvidíme, že není možné pomocí mocninných řad získat dostatečně širokou třídu funkcí. Např. nikdy tak nedostaneme jen po částech spojisté periodické funkce, které jsou tak důležité pro modelování a zpracování audio a video signálů. 6.37. Jak ochočené máme řady funkcí? Vraťme se nyní k diskusi limit posloupností funkcí a součtu řad funkcí z pohledu uplatnění postupů diferenciálního a integrálního počtu. Uvažujme tedy konvergentní řadu funkcí S(x) = YJfn(x) « = 1 na intervalu [a,b]. Přirozené dotazy jsou: • Jsou-li všechny funkce f„(x) spojité v nějakém bodě x0 e [a, b], je spojitá i funkce S(x) v bodě x0? • Jsou-li všechny funkce /„ (x) diferencovatelné v nějakém bodě a e [a, b], je v něm diferencovatelná i funkce S(x) a platí vztah S' (x) = YZi f ú (*)? • Jsou-li všechny funkce f„(x) riemannovsky inte-grovatelné na intervalu [a, b], je integrovatelná i funkce S(x) a platí vztah fha S(x)dx = Z^Li fa fn(x)dxl Ukážeme si nejprve na příkladech, že odpovědi na všechny tři takto kladené otázky jsou "NE!". Poté ale najdeme jednoduché dodatečné podmínky na konvergenci řady, které naopak platnosti všech tří tvrzení zajistí. Řady funkcí tedy obecně moc zvladatelné nejsou, nicméně si umíme vybrat velikou třídu takových, se kterými se už pracuje velmi dobře. Mezi ně naštěstí budou patřit mocninné řady. Poté se také zamyslíme nad alternativními koncepcemi integrování, které fungují více uspokojivě i pro větší třídy funkcí. F. Délky, obsahy, povrchy, objemy 6.72. Určete délku křivky dané parametricky x = sin2 ř, y = cos2 ř, pro t s [0, §]. Solution. Podle ||??|| je délka křivky daná integrálem V(x'(ř))2 + (/(O)2 dř = / 2 V(sin2ř)2 + (-sin2ř)2 dř V2sin2řdř = V2. Pokud si uvědomíme, že daná křivka je částí přímky y=l-x (neboť sin2 t +cos21 = 1) a sice úsečka s koncovými body [0, 1] (pro hodnotu t = 0) a [1, 0] (pro hodnotu t = j) tak okamžitě můžeme psát její délku, tedy yfl. □ 6.73. Určete délku křivky dané parametricky x = t2, y = t3 pro t e [0, VŠ]. Solution. Délku l určíme opět využitím vztahu || ??||: l = í V'4í2 + 9ŕ dt = í ?V9t2 + 4 dř Jo Jo 1 f5 .- 2 3 - 335 = U ^rT4d, = -[0»-+4).ig = — □ 6.74. Určete plochu ležící napravo od přímky x = 3 a dále ohraničenou grafem funkce y = -^—r a osou x. ošklivých posloupností. (1) Uvažme Solution. Plocha je dána nevlastním integrálem /3°° ^ dx 6.38. Příklady nejprve funkce f „(x) = (sin x)" na intervalu [0, 7t]. Hodnoty těchto funkcí budou ve všech bodech 0 < x < jt nezáporné a menší než jedna, kromě x = j, kde je hodnota 1. Proto na celém intervalu [0, 7t] budou bod po bodu tyto funkce konvergovat k funkci Vypočteme jej metodou rozkladu na parciální zlomky: 1 f{x) = lim f„ix) 0 pro všechna 1 pro x = j. V.0 . X3 - 1 1 X = 1 1 = C - B Ax + B C + x2 + x + 1 x — 1 (Ax + B)ix - 1) + C(x2 + x + 1), 1 C = -, Zjevně tedy je limita posloupnosti funkcí /„ nespojitou funkcí, ačkoliv jsou všechny funkce f„ix) spojité. Problematický je přitom dokonce vnitřní bod intervalu. Tentýž jev umíme najít i pro řady funkcí, protože součet je limitou částečných součtů. Stačí tedy v předchozím příkladě vyjádřit /„ jako n-tý částečný součet. Např. fix) = x2 : 0 = A + C a můžeme psát 1 B A x3 - 1 dx 1 f°° ( 1 _ x +2 \ 3 A x2+x + l) dx. 377 F. DÉLKY, OBSAHY, POVRCHY, OBJEMY 3. NEKONEČNÉ ŘADY Nyní určíme zvlášť neurčitý integrál f x2++x+l dx: x + 2 sinx, /2(i) = (sinx)2 — sinx, atd. Levý obrázek vykresluje funkce fm(x) pro m = n3, n = 1, ..., 10. t i dx = X2 + X + 1 -—rdx + - (x + i)2 + | 2 substituce u prvního integrálu ř = x2 + X + 1 dř = 2(X + i) dx 1/1^ + 1/-1-_: ř 27 (x + I)2 + | 1 9 3 /" 1 1 + h2 +! dx 1 34 -ln((xz +x + 1) + -- ds 1 23,/ / V*5) +1 substituce u prvního integrálu 5 =X + \ ds = dx ds substituce u druhého integrálu u = 73s du V3 s ds (2) Podívejme se nyní na druhou otázku, tj. na špatně se chovající derivace. Celkem přirozená je idea na podobném principu jako výše sestavit posloupnost funkcí, které budou mít v jednom bodě stále stejnou nenlovou derivaci, ale budou čím dál tím menší, takže bodově dokonvergují k funkci identicky nulové. Předchozí obrázek napravo vykresluje funkce fn(x) = x(l x2)" 1 ■ ln(x2 + x + 1) + 2 73 du 2'""" " 2 J u2 + l = - ln(x2 + x + 1) + arctan(w) = 1 o r /2x + l\ = - ln(x2 + x + 1) + V 3 arctan (-— ) 2 V V3 / Celkem pak pro nevlastní integrál můžeme psát: 1 na intervalu [—1, 1] pro hodnoty n = m2, m = 1, ..., 10. Na první pohled je zjevné, že lim /„ (x) = 0 ř7=>00 a všechny funkce /„ (x) jsou hladké. V bodě x = 0 je jejich derivace /„'(O) = (d x2)" 2«x2(l -x2)""1)!^ 1 1 dx 1 T 1 , r /2x + l\lá - lim ln |x - 11--lníx2 + x + 1) - V3 arctan -— ) 3^L ' 2 V 73 J U - lim í-ln|<5 - 1| - - ln(S2 + S + 1) - VŠ arctan ( 28 "L 1 ) ) 3ä—\3 2 V V3 // 1 1 V3 7 — ln2H— lnl3H--arctan —= 3 6 3 V3 1 1 V3 7 -lnl3--ln2H--arctan —= — 6 3 3 V3 1 -- lim ln 3 &^oo x - 1 Vx2 + X + 1 1 r /2á + l\ - lim v 3 arctan I-=— I 3í^~ V V3 / 1 1 7 1 73 - ln 13 H--= arctan —=--ln2--it. 6 V3 V3 3 6 nezávisle na n. Limitní funkce pro posloupnost /„ přitom má samozřejmě všude derivaci nulovou! (3) Protipříklad k třetímu tvrzení jsme už viděli v 6.32. Charakteristickou funkci x —oo). Přitom f n (X) dx n + 1 1 #0. 378 CHAPTER 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET 6.39. Stejnoměrná konvergence. Zjevným důvodem neúspěchu ve všech třech předchozích příkladech je skutečnost, že rychlost bodové konvergence hodnot f„(x) -» f(x) se bod od bodu velice liší. Přirozenou myšlenkou tedy je omezit se na takové případy, kdy bude naopak konvergence probíhat přibližně stejně rychle po celém intervalu. ' Stejnoměrná konvergence Definition. Říkáme, že posloupnost funkcí f„(x) konverguje stejnoměrně na intervalu [a, b] k limitě f(x), jestliže pro každé kladné číslo e existuje přirozené číslo N e N takové, že pro všechna n > /V a všechna x e [a, b] platí \fn(x)-f(x)\ 0 bude \f(x)-f(x0)\ 0 \fn(x) - f(x)\ < e pro všechna x e [a, b] a všechna dostatečně velká n. Zvolme si tedy nějaké takové n a uvažme 8 > 0 tak, aby také \fn(x) ~ fn(Xo)\ < 0, jce(l,4] +oo. fx-l x^l+ 0. □ 6.77. Určete průměrnou rychlost vp tělesa v časovém intervalu [1,2], pokud je jeho rychlost v 1+ř Jednotky neuvažujte. Solution. K vyřešení příkladu si stačí uvědomit, že hledaná průměrná rychlost je střední hodnota funkce v na intervalu [1, 2]. Platí tak 2 5 1 přičemž 1 +12 1+t2 x, t dt = dx/2. dt = f r^7= dx = V5 — V2, ■J 2 y x □ 379 F. DÉLKY, OBSAHY, POVRCHY, OBJEMY 3. NEKONEČNÉ ŘADY 6.78. Vypočítejte délku s části křivky označované jako traktrix dané parametrickým popisem f(t) = r cosi + r ln (tg §) , g(t)=rsint, te[jt/2,a], kde r > 0, a e (Jt/2, 7t). Solution. Protože fit) -r siní + 2tg j -cos2 j -r sin ř + g'(ŕ) = r cos ř na intervalu [jt/2, a], pro délku s dostáváme jt/2 r2 cos4 t + r2 cos2 ř dt dt f ^ dt J sin t jt/2 jt/2 -r [ln (sin t)fK/2 -r ln (siná) □ 6.79. Spočtěte objem tělesa vzniklého otáčením omezené plochy, jejíž hranicí je křivka x4 — 9x2 + y4 =0, kolem osy x. Solution. Pokud je [x, y] bodem křivky x4 — 9x2 + y4 =0, zřejmě tato křivka prochází rovněž body [—x, y], [x, —y], [—x, —y]. Je tedy souměrná vzhledem k oběma osám x, y. Pro y = 0 dostáváme x2 (x — 3) (x + 3) = 0, tj. osu x protíná hraniční křivka v bodech [—3, 0], [0, 0], [3, 0]. V prvním kvadrantu ji pak můžeme vyjádřit jako graf funkce fix) = l/9x2 -x4, x e [0, 3]. Hledaný objem je proto dvojnásobkem (zde uvažujeme x > 0) integrálu 3 3 f 7tf2(x) dx = jt f ~j9x2 — x4 dx. o o Pomocí substituce t = \/9 — x2 (xdx = —tát) pak snadno spočítáme / V9x2 - ŕ dx = fx ■ V9 - x2 dx o o a tak obdržíme výsledek 1 &jt . f t2 dt □ 6.80. Torricelliho trychtýř, 1641. Nechť část větve hyperboly xy = 1 pro x > a, kde a > 0, rotuje kolem osy x. Ukažte, že obdržené rotační těleso má konečný objem V a současně nekonečný povrch S. Solution. Víme, že platí + 0O v Jt f (i)2 dx jt T'\dx = jt ( lim -i - (-i) | = £ a S +0O 2jt f - +oo _— +oo l \z ^--O- ľ V*4 + l ^ 1^ ľ I fa 1 + (-^) dx =2jt f a 2jt ( lim ln x — ln a ) ■ dx > 2jt f +oo. Skutečnost, že uvažované těleso (tzv. Torricelliho trychtýř) nelze natřít za pomoci konečného množství barvy, ale lze jej naplnit konečným množstvím kapaliny, se nazývá Torricelliho paradox. Uvědomme si však, že reálný nátěr barvou má nenulovou tloušťku, což jsme při výpočtu nijak nezohlednili. Kdybychom jej kupř. natírali 6.41. Theorem. Nechť f„ (x) je posloupnost riemannovsky integrovatelných funkcí na konečném intervalu [a, b], které na tomto intervalu stejnoměrně konvergují k funkci fix). Pak také f(x)je riemannovsky integrovatelná a platí lim / fn(x)dx = / ( lim f„(x)\dx = / f(x)dx. Důkaz této věty se opírá o zobecnění vlastností Cauchy-ovských posloupností čísel na stejnoměrnou konvergenci funkcí. Tímto způsobem umíme pracovat s existencí limity posloupnosti integrálů, aniž bychom ji potřebovali znát. Stejnoměrně Cauchyovské posloupnosti Definition. Řekneme, že posloupnost funkcí /„ (x) na intervalu [a, b] je stejnoměrně Cauchyovská, jestliže pro každé (malé) kladné číslo e existuje (velké) přirozené číslo takové, že pro všechna x e [a, b] a všechna n > N platí \fnix) - fm(x)\ < e. Zřejmě je každá stejnoměrně konvergentní posloupnost funkcí na intervalu [a, b] také stejnoměrně Cauchyovská na temže intervalu, stačí si povšimnout obvyklého odhadu \f„ix) - fm(x)\ < \fn(x) - f(x)\ + \f(x) - fm(x)\ založeného na trojúhelníkové nerovnosti. Toto pozorování nám už stačí k důkazu naší věty, zastavíme se ale napřed u užitečného obráceného tvrzení: Proposition. Každá stejnoměrně Cauchyovská posloupnost funkcí f„ (x) na intervalu [a, b] stejnoměrně konverguje k nějaké funkci f na tomto intervalu. Proof. Z podmínky Cauchyovskosti posloupnosti funkcí vyplývá, že také pro každý bod x e [a, b] je posloupnost hodnot f„(x) Cauchyovskou posloupností reálných (případně komplexních) čísel. Bodově tedy nutně konverguje posloupnost funkcí f„(x) k nějaké funkci fix). Ukážeme, že ve skutečnosti konverguje posloupnost f„(x) ke své limitě stejnoměrně. Zvolme tak velké, aby \fnix) - fm(x)\ < e pro nějaké předem zvolené malé kladné e a všechna n > N, x e [a, b]. Nyní zvolíme pevně jedno takové n a odhadneme \fn(x) - f(x)\ = lim \fn(x) - fm(x)\ < e pro všechna x e [a, b]. □ Důkaz Věty. Připomeňme, že každá stejnoměrně konvergentní posloupnost funkcí je také stejnoměrně Cauchyovská a že Riemannovy součty pro jednotlivé členy naši posloupnosti konvergují k fha f „(x) dx nezávisle na výběru dělení a reprezentantů. Proto, jestliže platí \fnix) ~ fm(x)\ < C 380 CHAPTER 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET pro všechna x e [a, b], pak také rb ľb fn(x)dx - j fm(x)dx e\b Je tedy posloupnost čísel f fn (x) dx Cauchyovská a proto konvergentní. Současně ale také díky stejnoměrné konvergenci posloupnosti f „(x) platí pro limitní funkci f (x) ze stejného důvodu, že její Riemannovy součty jsou libovolně blízké Riemannovým součtům pro funkce /„ s dostatečně velkým n a limitní funkce / (x) bude tedy opět integrovatelná. Zároveň rb i-b f„(x)dx f(x) dx e\b a musí proto jít o správnou limitní hodnotu. □ Pro příslušný výsledek o derivacích je třeba zvýšené pozornosti ohledně předpokladů: 6.42. Theorem. Nechť f„ (x)je posloupnost funkcí diferencovatelných na intervalu [a, b], a předpokládejme f„(xo) -» f(xo) v nějakém bodě xq e [a,b]. Dále nechť jsou všechny derivace g„ (x) = f'n(x) spojité a nechť konvergují na temže intervalu stejnoměrně k funkci g(x). Pak je také funkce f(x) = f* g(t) dt diferencovatelná na intervalu [a, b], funkce f„(x) konvergují k f(x) a platí f'(x) = g(x). Proof. Jestliže budeme místo f„(x) uvažovat funkce fn(x) = f„(x) — f„(x0), budou předpoklady i závěry ve větě platné nebo neplatné pro obě posloupnosti zároveň. Bez újmy na obecnosti můžeme proto předpokládat, že všechny naše funkce splňují /„ (x0) = 0. Pak ovšem můžeme psát pro všechny x e [a, b] fn(x) gn(t)dt. x0 Protože ale funkce gn stejnoměrně konvergují k funkci g na celém [a,b], konvergují funkce f„(x) k funkci /(*) g(t)dt. XQ Protože je funkce g coby stejnoměrná limita spojitých funkcí opět spojitou funkcí, dokázali jsme vše potřebné, viz Věta 6.24 o Riemannově integrálu a primitivní funkci. □ Pro nekonečné řady můžeme předchozí výsledky shrnout takto: 6.43. Corollary. Uvažme funkce f„(x) na intervalu [a, b]. (1) Jsou-li všechny funkce f„(x) spojité na [a, b] a řada S(x) = YJfn(x) n = \ konverguje stejnoměrně k funkci S(x), je i funkce S(x) spojitá na [a,b]. zevnitř, jediná kapka barvy by nepochybně trychtýř nekonečné délky "ucpala". □ Další příklady na výpočet délek křivek, obsahů rovinných útvarů a objemů částí prostoru naleznete na straně 401. 6.81. Aplikace integrálního kriteria konvergence. Nyní se opět vraťme k (číselným) řadám. Díky intergrálnímu kriteriu konvergence (viz 6.33) umíme rozhodnout o konvergenci širší třídy řad: Rozhodněte, zda následující sumy konvergují či divergují: oo a) Z-r^» ' t—1 nmn 7 « = 1 oo b> Za- «=1 Solution. Všimněme si nejprve, že ani u jedné z uvažovaných řad neumíme o její konvergenci rozhodnout na základě podílového či odmocninového kriteria (všechny limity lim | £2+11 j ijm «/^" jsou «^►00 a" «^00 rovny 1). Pomocí integrálního kriteria pro konvergenci řad pak dostáváme: a) -dx = -dt = lim [ln(ř)]n = 00, i jcln(jc) Jo t s^oo u daná řada tedy diverguje. b) — dx = lim X1 &^oo 1, a daná řada tedy konverguje. □ 6.82. Pomocí integrálního kritéria rozhodněte o konvergenci řady Z n = l 1 (« + l)ln> + l) Solution. Funkce f(x) (,+Din^+i)' *e[l,+oo) je zjevně na svém definičním oboru kladná a nerostoucí, a proto řada v zadání konverguje, právě když konverguje integrál f(x)dx. Užitím substituce y = ln (x + 1) (kdy je dy = dx/(x + 1)) můžeme vyčíslit +00 +00 dx= / -j = _. □ (x+l)lnHx + l) -\ y 1 ln 2 Řada tedy konverguje. G. Stejnoměrná konvergence 6.83. Konverguje posloupnost funkcí y„ = e4«2, iéM, neN stejnoměrně na M? Solution. Posloupnost {y„}„ef>] bodově konverguje ke konstantní funkci y = 1 na M, neboť lim e4«2 = eu = 1, iéM. 381 G. STEJNOMĚRNÁ KONVERGENCE 3. NEKONEČNÉ ŘADY Z vyčíslení y„ ^/2nj = e > 2 pro každé neN však vyplývá, že se nejedná o stejnoměrnou konvergenci. (V definici stejnoměrné konvergence postačuje uvážit e e (0, 1).) □ 6.84. Určete, zda řada •Jx-n Z £ « = 1 +xz stejnoměrně konverguje na intervalu (0, +oo). Solution. Při označení je fn(x) _ ^fx-n ~ ÍF+I2' n(nA-3x2) x > 0, n e N, x > 0, n e N. 2VI(«4+x2)z Nechť n e N je nadále libovolné. Nerovnosti f'n(x) > 0 pro x e (O, n2/Vfj a /n'(x) < 0 pro x e (n2/VŽ, +ooj implikují, že maximum funkce /„ nastává právě v bodě x = n2/VŠ. Protože 4« h = 1 4 ^ «2 « = 1 < +00, podle Weierstrassova kritéria řada Z^Li/nW konverguje stejnoměrně na intervalu (0, +oo). □ 6.85. Pro x e [—1, 1] sečtěte (-!)"+' x« + l « = 1 (n + 1) Solution. Nejprve upozorněme, že symbolem pro neurčitý integrál budeme označovat jednu konkrétní primitivní funkci (při zachování proměnné), kterou je vhodné chápat jako tzv. funkci horní meze, přičemž dolní mez je nula. Užitím věty o integraci mocninné řady pro x e (—1, 1) obdržíme Z oo (-1)" = 1 «(« + !) v« + l Z «=i /zB°°=i ((-ir+1fx"-1dx)dx = I (/Z^LiC--^)""1 dx)dx = f (/ 1 - x + x2 - x3 + ■ ■ ■ dx)dx I{Ijhdx)dx -. Jelikož J X (^~^-x"^dx= J In (1 + x) + Ci dx, ze spojitosti uvažovaných funkcí víme, že Y^-x" = ln(l+x) +Ci, x e (-1,1). «=i Volba x = 0 potom dává 0 = ln 1 + Cu tj. Ci = 0. Dále je (2) Jsou-li všechny funkce f„(x) spojitě diferencovatelné na intervalu [a,b], řada S(x) = Z^Li fn(x) konverguje pro nějaké xq e [a, b] a řada T(x) = Z^Li /«(x) konverguje stejnoměrně na [a, b], pak také řada S(x) konverguje a je spojitě diferencovatelná na [a, b]a platí S(x) = T(x),tj (OO \ ! OO £/»(*)) =11 fn (X). (3) Jsou-li všechny funkce f„(x) riemannovsky inte-grovatelné na [a, b] a řada S(x) = YJfn(x) « = 1 konverguje stejnoměrněkfunkci S(x) na [a, b],je tamtéž integrovatelná i funkce S(x) a platí vztah Ja \=1 ' n=l Ja 6.44. Test stejnoměrné konvergence. Nejjednodušším [C> způsobem pro zjištění stejnoměrné konvergence posloupnosti funkcí je ^ porovnání s absolutní konvergencí ■ vhodné posloupnosti čísel. Říkává se tomu často Weierstrassův test. Předpokládejme tedy, že máme řadu funkcí /„ (x) na intervalu I = [a, b] a že navíc známe odhad \fn(x)\ < an e R pro vhodné reálné konstanty an a všechna x e [a, b]. Okamžitě můžeme odhadnout rozdíly částečných součtů k Ski*) = ^/»W n = l pro různé indexy k. Pro k > m dostáváme \sk(x)-sm(x)\ = n —m + 1 n —m +1 n—m + l Pokud je řada (nezáporných) konstant Z^Li an konvergentní, pak bude samozřejmě posloupnost jejích částečných součtů Caychyovská. Právě jsme ale spočetli, že v takovém případě bude posloupnost částečných součtů s„ (x) stejnoměrně Caychyovská. Díky tvrzení dokázanému před chvílí v 6.41 jsme tedy právě dokázali následující Theorem (Weierstrassův test). Nechť /„ (x) je posloupnost funkcí definovaných na intervalu [a,b]a platí \ f„ (x) | < a„ e R. Je-li řada čísel Z^Li an konvergentní, pak řada S(x) = Z^Li fn(x) konverguje stejnoměrně. 382 CHAPTER 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET 6.45. Důsledky pro mocninné řady. Weistrassův test je velice užitečný pro diskusi mocninných řad S(x) = ^an(x - x0)n n=0 se středem v bodě x0. Při našem prvním setkání s mocninnými řadami jsme ukázali v 5.48, že každá taková řada konver-'■"^Tj^"'' guje na (x0 — 8, x0 + 8), kde tzv. poloměr kon-vergence 8 > 0 může být také nula nebo oo. ^J\W* - (viz také 5.52). Zejména jsme v důkazu věty 5.48 pro ověření konvergence řady S(x) používali srovnání s vhodnou geometrickou posloupností. Podle Weistrassova testu je proto řada S(x) stejnoměrně konvergentní na každém kompaktním (tj. konečném) intervalu [a,b] uvnitř intervalu (jco — 8, x0 + 8). Dokázali jsme tedy Theorem. Každá mocninná řada S(x) je ve všech bodech uvnitř svého intervalu konvergence spojitá a spojitě diferencovatelná. Funkce S(x) je také integrovatelná a derivování i integrování lze provádět člen po členu. Ve skutečnosti platí také tzv. Ábelova věta, která říká, že mocninné řady jsou spojité i v hraničních bodech svého definičního oboru (včetně případných nekonečných limit). Tu zde nedokazujeme. Právě dokázané příjemné vlastnosti mocninných řad zároveň poukazují na hranice jejich použitelnosti při modelování závislostí nějakých praktických jevů nebo procesů. Zejména není možné pomocí mocninných řad dobře modelovat po částech spojité funkce. Jak uvidíme v zápětí, je možné pro konkrétněji vymezené potřeby nacházet lepší sady funkcí f„(x) než jsou hodnoty f„(x) = x" . Ne-jznámějšími příklady jsou Fourierovy řady a tzv. wawelety, které přibolížíme v další kapitole. 6.46. Laurentovy řady. V kontextu Taylorových rozvojů se ještě podívejme na hladkou funkci /(*) -l/x£ z odstavce 6.6. Viděli jsme, že není analytická v nule, protože tam má všechny derivace nulové. Takže zatímco ve všech ostatních bodech x0 je tato funkce dána konvergentní Taylorovou řadou s poloměrem konvergence r = |x0|, v počátku řada konverguje jen v jediném bodě. Pokud ale do mocninné řady pro ď dosadíme za x výraz — 1 /x2, dostaneme řadu funkcí S(x) OQ ^ 2^ -l)nx -2« ° ( -1)N ,.2« «=0 která bude konvergovat ve všech bodech i / 0a dává nám dobrý popis pro chování kolem výjimečného bodu x = 0. Podbízí se proto uvažovat následující obecnější řady docela podobné mocninným: / ln(l + x) dx = j per partes i l+x - X jcln(l +x) - f l+x dx u = In (1 + x) u' -v' = 1 v x ln (1 + x) - f 1 - dx = x ln (1 + x) - x + In (1 + x) + C2 (x +- 1) ln (x + 1) - x + C2. Protože zadaná řada konverguje v bodě x = 0 se součtem 0, analogicky jako pro Ci z 0 = 1 • ln 1 - 0 + C2 vyplývá, že C2 = 0. Celkem tedy získáváme n(n Yn + \ n = \ (n + 1) (x + 1) ln(jc + 1) - x, xe(-l,l). Navíc podle Ábelovy věty (viz 6.45)je součet uvažované řady roven (případné nevlastní) limitě funkce (x + l)ln(x + l) — x v bodech —1 a 1. V našem případě jsou obě limity vlastní (v bodě 1 je dokonce funkce spojitá a hodnota limity v bodě 1 je pak rovna funkční hodnotě 21n2 — 1. Pro výpočet hodnoty limity v bodě —1 použijeme LHospitalova pravidla: lim (x + 1) ln (x + 1) — x ->■-! + lim t ln t + 1 lnř lim -- + 1 = ř^0+ - lim t^0+ — -i-t1 Í-+1 lim —ř + 1 = 1. Konvergenci řady v bodech ±1 lze samozřejmě ověřit přímo. Dokonce lze přímo i odvodit Z «=i (n + l) 1 (rozepsáním (n + l) 1 n + l ' □ 6.86. Součet řady. Pomocí věty 6.41 "o záměně limity a integrálu posloupnosti stejnoměrně konvergentních funkcí" nyní sečteme číselnou řadu Z «=i 1 n2"' i n 2" ' Využijeme toho, že / ^ 2 Solution. Na intervalu (2, oo) konverguje řada funkcí Z^Li ^rr ste" jnoměrně. To plyne například z Weierstrasova kriteria: každá z funkcí p^i- je klesající na intervalu (2, oo), její hodnota tedy nepřevyšuje 2^n"; řada Z^Li ^rr Je ovšem konvergentní (jedná se o geometrickou řadu s kvocientem ^. Podle Weierstrasova kriteria tedy řada funkcí S^Li ^rr tedy konverguje stejnoměrně. Dokonce umíme výslednou funkci explicitně vyjádřit. Její hodnota v libovolném x e (2, oo) je hodnotou geometrické řady s kvocientem £, označíme-li tedy limitu jako /(x),je fix) oq 1 A-i Yn + l n = \ 1 1 X2 1 - 1 x(x — 1) 383 G. STEJNOMĚRNÁ KONVERGENCE 3. NEKONEČNÉ ŘADY Použitím (6.43) (3) dostáváme dx y — = y n — l n — l ytl + l dx 1 2 XÍX - 1) dx lim 1 1 — dx lim [(ln(<5 - 1) - ln(<5) - ln(l) + ln2] <5^oo lim | ln <5^oo ln2 + ln(2) = ln lim ( lim--- ) + ln2 □ 6.87. Uvažme funkci f (x) = Z^Li ne "x ■ Určete fln3 f(x)dx. In 2 Solution. Obdobně jako v předchozím případě z Weierstrasova kriteria pro stejnoměrnou konvergenci vypývá, že řada funkcí Z^Li ne~nx konverguje stejnoměrně na intervalu (ln2, ln3), neboť každá z funkcí ne-nx je mengf než íl na (ln2, ln3) a řada Z^Li 5^ konverguje, což plyne třeba z podílového kriteria pro konvergenci řad: lim ln + l lim (n + 1)2 -(«+1 «2" ,. ln + 1 1 lim--= -. n^oo 2 n 2 Celkem podle (6.43) (3) platí ln3 f(x)dx ln2 ln3 °° ln2 Z ne n = \ 00 /-In 3 Z « = 1 /iťT"* dx ln2 Z[ e Mt2-Z(2„ 3„) - 1 2 ~ 2" «=i «=i x 7 □ 6.88. Určete následující limitu (postup výpočtu zdůvodněte): lim cos cos© dx. Solution. Určeme nejprve lim j—fm. Posloupnost těchto funkcí lim-ituje bodově a máme cos(f) 1 lim (ll??ll) (1 + lim (1 + *)" e* \ Laurantovy řady j_ Řadu funkcí tvaru | oo 5(x) = ^ an(x - x0)" n — — oo nazýváme Laurentova řada se středem v xq. Řadu nazveme konvergentní, jestliže konvergují samostatně její části s kladnými a zápornými exponenty. mm^mmmmmmJi Smysl Laurentových řad je dobře viditelný u racionálních funkcí lomených. Uvažme takovou funkci S(x) = f(x)/g(x) s nesoudělnými polynomy fugu uvažme kořen x0 polynomu g (x). Je-li násobnost tohoto kořenu s, pak vynásobením dostaneme funkci 5(x) = 5(x)(x — x0)s, která už bude na nějakém okolí bodu x0 analytická a proto můžeme psát 5(x) + ••• + x0 + a0 + ai(x - x0) + (x - x0)s oo = a"(x ~ xo)"- n ——s Uvažujme nyní odděleně části — 1 oo 5(x) = S- + 5+ = an(x — xo)n + ^2a"(x ~~ xo)"- « = -oo «=0 Pro řadu S+ víme z Věty 5.48, že její poloměr konvergence R je dán rovností i?-1 = lim sup ?j\an\. Když však aplikujeme tutéž úvahu na řadu 5_ s dosazenými hodnotami 1/x za x, zjistíme, že řada 5_(x) konverguje pro |x — xq| > r, kde r~l = lim sup $\a_n |. Tyto úvahy platí bezezbytku i pro komplexní hodnoty x dosazované do našich výrazů. Theorem. Laurentova řada S(x) se středem xq konverguje pro všechna x e C splňující r < |x — xq| < R a diverguje pro všechna x splňující \x — xq\ < r nebo \x — xq\ > R. Vidíme tedy, že Laurentova řada nemusí konvergovat ve vůbec žádném bodě, protože klidně můžeme dospět k hodnotám R < r. Podíváme-li se ale např. na výše uvedený případ racionálních funkcí lomenných rozvíjených do Lau-rentovy řady v některém z kořenů jmenovatele, pak zjevně je r = 0 a tedy, dle očekávání, bude konvergovat skutečně na prestencovém okolí tohoto bodu x0, zatímco R bude v tomto případě dáno právě vzdáleností k dalšímu nejbližšímu kořenu jmenovatele. V případě našeho prvního příkladu, funkce -l/x1 je r = 0 a R = oo. 384 CHAPTER 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET 6.47. Numerická přiblížení integrace. Podobně jako na konci přechozí části textu (viz odstavec 6.17), 1__nyní využijeme Taylorova rozvoje k návrhu co nejlepších a zároveň jednoduchých aproximací integrace. Budeme pracovat s integrálem I = /" f(x)dx analytické funkce f(x) a rovnoměrným dělením intervalu [a, b] pomocí bodů a = x0, x\, ..., xn = b se vzdálenostmi x,■ — x;_i = h > 0. Body uprostřed intervalů v děleních si označíme xi+i/2, hodnoty naší funkce v bodech dělení budeme psát jako f (xi) = f. Příspěvek jednoho dílku dělení k integrálu spočteme pomocí Taylorova rozvoje a předchozí věty. Záměrně přitom integrujeme symetricky kolem středových hodnot, aby se nám při procesu integrace vzájemně vyrušily derivace lichých stupňů: A/2 ■a/2 i + 1/2 /■a/2 / l \ + t)dt = / Y-f(n)(xi+l/2)f)dt 00 / rh/2 1 \ Z(/ JifOHxi+itfrdt) k=0\J-h/2^ ) Z k=0 h2k+l 22k(2k + 1)! f(2k)(xi+l/2). Velmi jednoduchým numerickým přiblížením integrace na jednom dílku dělení je tzv. lichoběžníkové pravidlo, které pro aproximaci využívá plochu lichoběžníka určeného body [xí,0], [xí, f], [0, xi+i], [xi+i, fi+i]. Tato plocha je Pi = \{fi + fi+úh a celkem tedy integrál / odhadujeme hodnotou n — l /uch = X pi = 2(/o + 2/1 + " ' + 2f"~l + fn)- i=0 Srovnáme nyní 7iich s přesnou hodnotou I spočtenou pomocí příspěvků po jednotlivých dílcích dělení. Hodnoty f i můžeme vyjádřit pomocí prostředních hodnot a derivací ,(*) 'i+1/2 f£\ takto: fi ; + l/2±l/2 /I+ 1/2 ± - fi i + 1/2 + h2 2Ä22 h3 3T23 f "(i + 1/2) /(3)(i + 1/2) + takže pro příspěvek Pí do odhadu dostáváme Pí = \(f+f+i)h h(f+l/2 + ^f"'(i+1/2)) +0(h5). Odtud dostáváme odhad chyby I dělení / h „ h(fi + 1/2 + 24/1 + 1,2 ^/i"+l/2 + 0(h5). Ziich na jednom dílku h2 f+1/2--f?+l/2 + 0(h4)) Lze ukázat, že daná posloupnost konverguje stejnoměrně. Potom podle (6.41) lim COS dx cos (-) lim —±L n^oo (1 + £) 1 — = 1 ex dx Ověření stejnoměrné konvergence dané posloupnosti necháváme na čtenáři (podotýkáme jenom, že diskuze je složitější než v předchozích příkladech). □ 385 G. STEJNOMĚRNÁ KONVERGENCE 3. NEKONEČNÉ ŘADY Celková chyba tedy je odhadnuta jako / - /uch = j2nh3f" + n °(h") = - a)h2f" + °(h") kde /" vyjadřuje odhad pro druhou derivaci /. Pokud nám lineární aproximace funkce po jednotlivých dílcích nestačí, dalším pokusem může být aproximace kvadratickým polynomem. K tomu ale budeme potřebovat vždy tři body, takže budeme pracovat s dílky dělení po dvou. Předpokládejme tedy že n = 2m a uvažujme x; s lichými indexy. Budeme požadovat fi+l = f(Xi+h) = fi+ah+ph2 fi.l= f(xi-h) = fi-ah+ph2 což dává (viz podobnost s diferencí pro aproximaci druhé derivace) P = ^(fi+i + fi-i-2fi). Plocha přibližného vyjádření integrálu na dvou dílcích dělení mezi Xi-i a xí+i je nyní odhadnuta výrazem ŕ 2 Pi = fi+at + fit2 dt = 2hfi + -ph3 J-h 3 = 2hfi + ^-(fi+1 + fi.1-2fi) o = ^{4fi+i+fi-i-2fi). Tomuto postupu se říká Simpsonovo pravidlo. Celý integrál je nyní přiblížen výrazem ^Simp = liché k sudé k Obdobným postupem jako výše odvodíme, že celková chyba je odhadnuta výrazem / - /simp = ^(b - a)h4f4) + 0(h5), kde /(4) představuje odhad pro čtvrtou derivaci funkce /. Závěrem této kapitoly se zastavíme u dalších konceptů integrace. Jako první uvedeme modifikaci Riemannova integrálu, která bude později užitečná v úvahách o pravděpodobnosti a statistice. Ve výkladu vesměs už ale zůstaneme spíše v rovině poznámek a postřehů, zájemce o podrobný výklad bude muset vyhledat jiné zdroje. 6.48. Riemann-Stieltjesův integrál. Při naší představě o integraci jakožto sčítání nekonečně mnoha linearizovaných (nekonečně) malých přírůstků do plochy zadané funkcí f(x) jsme pominuli možnost, že bychom pro různé hodnoty x brali přírůstky různě vážně. To by jistě mohlo být na infinitesimální úrovni zajištěno záměnou diferenciálu dx za cp(x)dx pro nějakou vhodnou funkci , jako af(x0) nezávisle na na velikosti přírůstku x. Třeba můžeme sledovat pravděpodobnost, že množství promile alkoholu v krvi řidiče při kontrole bude nejvýše x. S docela velkou pravděpodobností získáme hodnotu 0, tedy pro jakýkoliv integrální součet musí dílek obsahující nulu přispět i konstantním nenulovým příspěvkem, nezávisle na normě dělení. Takové chování neumíme namodelovat vynásobením diferenciálu dx nějakou reálnou funkcí. Místo toho můžeme zobecnit Riemannův integrál následovně: Zvolme na konečném intervalu [a, b] reálnou neklesající funkci g. Pro každé dělení H s reprezentanty §; a dělícími body a = xq, X\, ..., xn = b definujeme Riemann—Stieltjesův integrální součet pro funkci f{x) takto: n i=\ Řekneme pak, že Riemannův-Stieltjesův integrál I = í fix)dgix) ■J a existuje a má hodnotu I, jestliže pro každé reálné e > 0 existuje norma dělení 8 > 0 taková, že pro všechna dělení H s normou menší než 8 platí |5S-/| <€. Např., jestliže zvolíme na intervalu [0, 1] za g(x) po částech konstantní funkci s konečně mnoha body nespojitosti c\, ..., c t a "skoky" cti = lim gix) - lim gix) pak Riemann-Stieltjesův integrál existuje pro každou spojitou / (x) a je roven n\ k 1= f(x)dgix) = y\aifick). Jo ,-=i Stejnou technikou, jako jsme používali u Riemannova integrálu, lze i nyní zavést horní a dolní součty a horní a dolní Riemann-Stieltjesův integrál, které mají tu výhodu, že pro omezné funkce vždy existují a jejich hodnoty splývají, právě když existuje Riemann-Stieltjesův integrál ve výše uvedeném smyslu. Již u Riemannova integrálu jsme měli problém s inte-grovatelností funkcí, které byly "příliš rozskákané". Technicky pro funkci g (x) na konečném intervalu [a, b] zavádíme její variaci vztahem n \arhag = sup^\g(xi) - g(xi-i)\, S i=\ 387 G. STEJNOMĚRNÁ KONVERGENCE 3. NEKONEČNÉ ŘADY kde supremum bereme přes všechna dělení H intervalu [a,b]. Pokud je supremum nekonečné, říkáme, že g(x) má neomezenou variaci na [a, b], v opačném případě říkáme, že je g funkce s omezenou variací na intervalu [a, b]. Podobně, jak jsme postupovali u Riemannova integrálu, můžeme docela snadno odvodit následující: Theorem. Nechť f(x) a g(x) jsou reálné funkce na konečném intervalu [a, b]. (1) Pokud je g (x) neklesající a spojitě diferencovatelná, pak Riemannům integrál nalevo a Riemann—Stieltjesův integrál napravo existují současně a jejich hodnoty jsou si rovny b ľb f(x)g'(x)dx = / f(x)dg(x) J a (2) Pokud je f(x) spojitá a g(x) je neklesající funkce s konečnou variací, pak integrál f(x)dg(x) existuje. 6.49. Kurzweilův integrál. Posledním zastavením bude modifikace Riemannova integrálu, která >, napravuje nešťastné chování ve třetím bodu v odstavci 6.37, tj. limity neklesajících posloupností integrovatelných funkcí budou opět integrovatelné. Pak budeme moci i v těchto případech měnit pořadí limitního procesu a integrace, jak tomu bylo u stejnoměrné konvergence. Všimněme si napřed v čem je jádro problému. Intuitivně bychom měli předpokládat, že hodně malé množiny musí mít velikost nulovou, a tudíž by změny hodnot funkcí na takovýchto množinách neměly ovlivnit integraci. Navíc, spočetné sjednocení takových "pro integraci zanedbatelných" množin by mělo mít opět velikost nulovou. Jistě bychom tedy čekali, že např. množina racionálních čísel uvnitř konečného intervalu bude mít takovouto vlastnost a tedy její charakteristická funkce by měla být integrovatelná a hodnota takového integrálu má být nulová. Řekneme, že množina A c Rmánulovou míru, když pro každé e > 0 můžeme najít pokrytí množiny A spočetným systémem otevřených intervalů Jh i = 1,2, ..., takových, že oo ^m(Ji) < e. i=\ V dalším budeme vždy výrokem "funkce / má na množině B danou vlastnost skoro všude" myslet skutečnost, že má / tuto vlastnost ve všech bodech, až na podmnožinu A c B míry nula. Např. tedy charakteristická funkce racionálních čísel je skoro všude nulová, po částech spojitá funkce je skoro všude spojitá atd. Chtěli bychom nyní modifikovat definici Riemannova integrálu tak, abychom uměli při volbě dělení a příslušných Riemannových součtů eliminovat neblahý vliv hodnot integrované funkce na předem známé množině míry nula. Nabízí se zkusit zajistit, aby dílky v uvažovaných děleních 388 CHAPTER 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET s reprezentanty měly tu vlastnost, že kolem bodů takovéto množiny budou kontrolovatelně malé. Kladnou reálnou funkci 8 na konečném intervalu [a, b] nazýváme kalibr. Dělení H intervalu [a, b] s reprezentanty %i nazýváme á-kalibrované, jestliže pro všechna i platí & - 8&) < jcť_i < & < Xi < & + Pro další postup je podstatné ověřit, že ke každému kalibru 8 lze najít nějaké á-kalibrované dělení s reprezentanty. Tomuto tvrzení se říká Cousinovo lemma a lze jej dokázat např. obvyklým postupem opřeným o vlastnosti suprem. Pro daný kalibr 8 na [a, b] si označíme M množinu všech bodů x e [a, b] takových, že na [a, x] lze á-kalibrované dělení s reprezentanty najít. Jistě je M neprázdná a ohraničená a má tedy supremum s. Kdyby s ^ b, pak bychom uměli najít kalibrované dělení s reprezentantem v s a to vede na spor. Nyní již můžeme zavést zobecnění Riemannova integrálu takto: Definition. Funkce / definovaná na konečném intervalu [a,b] má Kurzweilův integrál ŕ 1=1 f (x) dx, jestliže pro každé e > 0 existuje kalibr á takový, že pro každé á-kalibrované dělení s reprezentanty H platí pro příslušný Riemannův součet Ss odhad | Se — I \ < e. 6.50. Vlastnosti Kurzweilova integrálu. Předně si povšimněme, že jsme při definici Kurzweilova integrálu jen omezili množinu všech dělení, pro které Riemannovy součty bereme v úvahu. Pokud tedy bude naše funkce riemannovsky integrovatelná, musí mít nutně i Kurzweilův integrál a tyto dva integrály jsou si rovny. Ze stejného důvodu můžeme zopakovat argumentaci ve Větě 6.24 o jednoduchých vlastnostech Riemannova integrálu a opět ověřit, že se stejně chová i integrál Kurzweilův. Zejména je lineární kombinace integrovatelných funkcí cf(x) + dg(x) opět integrovatelná a její integrál je c fha f(x)dx + d fha g(x)dx atd. Při důkazu je potřeba jen promyslet drobné modifikace při diskusi zjemněných dělení, která navíc mají být á-kalibrovaná. Podobně lze rozšířit pro případ monotóních posloupností bodově konvergentních funkcí argumentaci ověřující, že limity stejnoměrně konvergující posloupnosti integrovatelných funkcí /„ jsou opět integrovatelné a integrálem limity je limita hodnot integrálů /„. Konečně, Kurweilův integrál se chová tak, jak bychom si přáli, i vůči množinám s nulovou mírou: Theorem. Uvažme funkci f na intervalu [a, b], která je skoro všude nulová. Pak Kurzweilův integrál fh f(x)d(x) existuje a je roven nule. Proof. Jde o pěknou ilustraci myšlenky, že se můžeme zbavit vlivu hodnot na malé množině pomocí chytré volby 389 G. STEJNOMĚRNÁ KONVERGENCE 3. NEKONEČNÉ ŘADY kalibru. Označme si M příslušnou množinu míry nula, vně které je f(x) = 0 a pišme Mk c [a, b], k = 1, ..., pro podmnožinu bodů, pro které je k — 1 < \f(x)\ < k. Protože má každá s množin Mk nulovou míru, můžeme ji pokrýt spočetným systémem v součtu libovolně malých a po dvou disjukntních otevřených intervalů Jki. Definujme si nyní kalibr 8(x) pro x e Jki tak, aby celé intervaly (x — 8(x),x + 8(x)) byly stále obsaženy v Jkj. Mimo množinu M pak 8 dodefinujeme libovolně. Pro á-kalibrované dělení H intervalu [a, b] pak můžeme odhadnout příslušný Riemannův součet n-l 7=0 n-l 7=0 n-l Z Z 1/(^)1(^+1 ~X') k=l j=0 oo / n — l k Pokud tedy pro předem známé e chceme dosáhnout, aby tento odhad byl menší než e, stačí volit pokrytí intervaly Jkj tak, aby oo 7=1 Pak totiž v posledním výrazu v našem odhadu můžeme dosadit za vnitřní sumu, sečíst geometrickou řadu Xitli 2"* a dostaneme právě prožadované e. □ Corollary. Kurzweilovskou integrovatelnost dané funkce f(x) ani hodnotu jejího integrálu nezměníme, pozměníme-li hodnoty f(x) na množině míry nula. 6.51. Poznámky o integraci. K dokončení.... absolutně spojité funkce, vztah neurčitého integrálu a primitivní funkce, intergrace v absolutní hodnotě, Lebesgueův integrál 390 CHAPTER 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET H. Doplňující příklady k celé kapitole 6.89. Nechť je dána funkce / a bod z, přičemž platí f(z) = 0, f'(z) = 0, f"(z)=0, f(3\z) = l. Která z následujících tvrzení: (a) tečnou ke grafu funkce / v bodě [z, f (z)] je osa x; (b) funkce / není polynomem druhého stupně; (c) funkce / v bodě z roste; (d) funkce / nemá v bodě z ostré lokální minimum; (e) bod z je inflexním bodem funkce / jsou zcela jistě pravdivá? 6.90. Vyšetřete celkový průběh funkce Tedy určete (má-li smysl): (a) definiční obor (ten je zadán) a obor hodnot; (b) případnou sudost, lichost, periodicitu; (c) body nespojitosti a jejich druh (včetně příslušných jednostranných limit); (d) průsečíky s osami x, y; (e) intervaly, kde je funkce kladná a kde záporná; (f) limity lim^.oo f(x), \\mx^+QO fix); (g) první a druhou derivaci; (h) kritické a tzv. stacionární body, ve kterých je první derivace nulová (příp. body, ve kterých neexistuje první nebo druhá derivace); (i) intervaly monotonie; (j) ostré i neostré lokální a absolutní extrémy; (k) intervaly, kde je funkce konvexní a kde konkávni; (1) infiexní body; (m) asymptoty bez směrnice a se směrnicí; (n) hodnoty funkce / a její derivace /' ve „významných" bodech; (o) graf. 6.91. Vyšetřete průběh funkce /(*) = Vyšetřením průběhu funkce / se (nejen v tomto příkladu) rozumí „udat definiční obor, obor hodnot a případnou lichost, sudost, periodicitu; spočítat limity lim f(x) a lim f(x), x^> — oo x^+oo jestliže existují; určit body nespojitosti a jejich druh včetně příslušných jednostranných limit (pokud existují), nulové body (pokud existují) a intervaly, kde je funkce kladná a kde záporná; stanovit první (a druhou, je-li potřeba) derivaci a intervaly, na kterých funkce roste, klesá, čije konštantní; nalézt stacionární (kritické) body a všechny lokální extrémy (pokud existují); určit infiexní body a intervaly, kde je funkce konvexní a kde konkávni; vypočítat hodnoty ve význačných bodech (tj. vyčíslit funkci ve stacionárních a v inflexních bodech, pomůže-li to při kreslení grafu, a uvést průsečíky s osami, existují-li); načrtnout její graf s asymptotami". 6.92. Vyšetřete průběh funkce fix) = *3-3f_f*+1. 6.93. Vyšetřete průběh funkce f(x) = j/že-*. 6.94. Vyšetřete průběh funkce fix) = arctg 2Z7. 391 H. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 3. NEKONEČNÉ ŘADY 6.95. Vyšetřete průběh funkce mimo jiné nalezněte extrémy, inflexní body. asymptoty a načrtněte její graf. 6.96. Vyšetřete průběh funkce, mimo jiné nalezněte extrémy, inflexní body, asymptoty. ln(x2 - 3x + 2) + x. 6.97. Vyšetřete průběh funkce, mimo jiné nalezněte extrémy, inflexní body a asymptoty. (x2 -2)ex2~l. 6.98. Vyšetřete průběh funkce, mimo jiné nalezněte extrémy, inflexní body a asymptoty. ln(2x2 - x - 1). 6.99. Vyšetřete průběh funkce (mimo jiné nalezněte extrémy, inflexní body a asymptoty): x2 - 2 x - 1 ' 6.100. Použitím základních vzorců určete libovolnou primitivní funkci k funkci (a) y = x sjx *Jx^, x e (0, +oo); (b) y = (2X + 3X)2 , x s R; (Ov = 7^, ,€(-1,1); (d>y = rar. *é(-!<¥)• 6.707. Využijte derivací funkcí y = tg x a y = cotg x k nalezení neurčitých integrálů funkcí (a) y = cotg2x, x e (0, n); ^) sin2 x cos2 x' X ^ 2 ) 6.702. Uvedte primitivní funkci k funkci na intervalu (—2, 2). 6.7 OJ. Určete jj^dx, xeR. 6.104. Stanovte !irk&dx, xeR. 6.105. Prox e (0, 1) vypočtěte f ( f f1,-, + i 3 „ + 4 sin x — 5 cos x) dx. 6.106. Vyjádřete neurčité integrály (a) J arctgx dx, iěI; (b) / ^ dx, x > 0 pomocí integrační metody per partes. 6.107. Opakovaným užitím pravidla per partes pro všechna x e M vypočtěte (a) J x2 sin x dx; (b) / x2 ď dx. 6.108. Například integrací per partes určete f x In2 x dx 392 CHAPTER 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET pro x > 0. 6.109. Pomocí metody per partes spočtěte /(2- ex dx na celé reálné ose. 6.110. Integrujte (a) J(2x+ 5)10í/x. x e x > 0; (c) Je* x2 dx, x e (d) /15 n-x' ■ dx, x e (—1, 1); (e) f^fdx, x > 0; (g) JJ^dx, arctg yjľ V=č(1+at) dx, x > 0; x e M; x > 0 (jc-1)v/jc2+jc + 1 e2*+3 (h) J sin y/x dx, aplikací substituční metody. 6.111. Pro x e (0, 1) pomocí vhodných substitucí převedte integrály Jx2^dx; /■ * na integrály racionálních lomených funkcí. 6.112. Pro x e (—jt/2, jt/2) vypočtěte f-- J 1 +sin x pomocí substituce t = tg x. 6.113. Libovolným způsobem určete / 6. i i 4. Spočtěte (a) fx" lnx dx, x > 0, n 7^ — 1; (b) / x e M. 6.115. Pro x > 0 stanovte (2+5xý sfx VÍ+1 dx , x > 0. v (c) / í/x; =< í/x. Solution. Všechny tři zadané integrály jsou tzv. binomické, tj. lze je zapsat jako f xm (a + bxn)p dx pro jistá čísla a, b e M, m, n, p e Q. Binomické integrály se tradičně řeší aplikací substituční metody. Pokud p e Z (nikoli nutně p < 0), volí se substituce x = ť, kde 5 je společný jmenovatel čísel man; pokud *2±i e Z a p g Z, klade ^ Z), zavádí ť, kde s je jmenovatel čísla p; a pokud + p e Z (p ^ m + l se a + Z?x" se a + Z?x" = ť x", kde 5 je jmenovatel p. V těchto třech případech je potom zaručen přechod k integrování racionální lomené funkce. Snadno tak vypočítáme (a) P e S&MČ-dx = jx-l(2 + 5xfdx x = f dx = 4í3 dt 4/(2 + 5ř4)3 dt 4 / (8 + 60ř4 + 150ř8 + 125ř12) dt = 4 (8ř + 12ř5 + f ř9 + \f ŕ13) + C (8V*"+ 12> 'xs + xy + 3 1 13 + C; 393 H. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 3. NEKONEČNÉ ŘADY (b) i^^dx=ix ~2 (i+x*y dx p i Z, 2±i e 1 + x? = ŕ x = (t3 - l)4 12 /13 (t3 - 1) dt dx 12í2 (ŕ3 - 1) dt I 12 /16 - t3 dt = 12 - J) + C = 12^(1 + V^)4 - í) + C; (c) f-^=dx = f (1 + x4 dx I t2 (t-i)(t+i)(t2+i) _ i 4 /> Č Z, ^ Č Z, f+pe 1 + x4 = ŕ4x4 x = (ŕ4-l)_4" dx = -t3 (ŕ - 1) * = -±/(á-íŽT + iq-T)* í*-i 1 (In 11 - 1 I - In 11 + 1 I + 2 arctg í) + C ln^+2arctg(yíTT) + C. □ 6.116. Pro x e (-|, |) integrujte (a) /■ (b) / (c) /; 1+4 cos2 x+3 sin2 x dx; i 1 +sin2 x dx; dx. 2—cos x Solution. Integrály ve tvaru J /(sinx, cosx) dx pro jistou racionální lomenou funkci / se obvykle řeší substituční metodou. Je-li /(sinx, — cosx) = —/(sinx, cosx), volí se t = sinx; je-li /(— sinx, cosx) = —/(sinx, cosx), volí se t = cosx; a je-li / (—sinx, — cosx) = /(sinx, cosx), pak t = tgx. Jestliže neplatí žádný z uvedených vztahů, používá se substituce t = tg |. Ukážeme si to na zadaných integrálech. Případ (a). Ve jmenovateli je 1+4 cos2 x + 3 sin2 x = 4 + cos2 x a v čitateli pouze funkce sinus v liché mocnině, tj. substituce t = cosx, kdy je dt = — sinx dx, umožňuje nahradit všechny siny a kosiny, a tak obdržet f s'"3*. 2 í/x = r si"^-72*) jx = r zfeft = r(i _ s ) = t 5 J l+4cos2JC+3sin2jc J 4+cos2 * J 4+ř2 Jv 4+ř2 y cosx 4+ř2 f arctg 2|£ + C. arctg I + C Případ (b). Neboť je sinus (i kosinus) v sudé mocnině, v rámci substituce t = tgx provedeme nahrazení sin2x = -+T, cos2x — 1 ^--1 l+řz čímž získáme i i+ř2' dx ž dt, I dx 1+sin2 x i+ l+2t2 dt ^ arctg (V2ř) + C ^ arctg (V2tgx) + C. Případ (c). Nyní použijeme univerzální substituci t = tg |, kdy je smx l+ř2 cosx 1-ž2 1+ř2 úřx TÍTdL S její pomocí určíme dx 2—cos x J^^ř = 2/^ = arctg (Vir) + C = 2# arctg (VŠtg |) + C. 6.117. Provedte naznačené dělení polynomů □ 394 CHAPTER 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET pro x e M. 6.118. Vyjádřete funkci 2x3-x4+3.rz-r + l jc2-2jc+4 _ 3;t4+2jtJ-jt2 + l y ~ 3x+2 jako součet polynomu a ryze lomené racionální funkce. 6.119. Rozložte racionální lomený výraz Id jc3+3jc2-4jc-12 ' 2.+2x^+x2 na součet parciálních zlomků. 6.120. Vyjádřete funkci ve tvaru parciálních zlomků. 6.121. Rozložte výraz na parciální zlomky. 6.122. Vyjádřete racionální lomenou funkci x4-2x3 Ix2-I0x+31 jc3-3jc2+9jc + 13 v _ -5x+2 ■>" ~ X4-V3+2.V2 ve tvaru součtu parciálních zlomků. 6.123. Rozložte na parciální zlomky funkci y- 1 xó(x + í) " y (x-2) x2 (3x2+x+4)2 ' 6.124. Uvedte tvar rozkladu na parciální zlomky racionální lomené funkce _ _ 2x2-114 y ~ (x-2) Neurčité koeficienty nepočítejte! 6.125. Upravte funkci y - x4-2.r3 na součet polynomu a ryze lomené racionální funkce Q. Získanou funkci Q poté vyjádřete ve tvaru součtu parciálních zlomků. 6.726. Napište primitivní funkci racionální lomené funkce (a) y = x^2; 0» y = x^2. 6.127. Vyjádřete 6.128. Vypočtěte neurčitý integrál funkce y = < 24.14.n2. x e M- 6.129. Určete 6.130. Integrujte JtsTT x ^ 1. 6.131. Spočtěte integrál 6.732. Prox g (0, ^) vypočítejte 395 H. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 3. NEKONEČNÉ ŘADY (a) J sin3 x cos4 x dx; (b) I^dx; (c) f 2 sin2 | dx; (d) J cos2 x dx; (e) J cos5 x Vsinx dx; J sin2 x cos4 x ' (h) [-£-. v 7 J sin x 396 CHAPTER 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET 6.133. Nechť j e dána funkce y = \ x | na intervalu I = [— 1, 1] a dělení S„ = (-l,-2=±,...,—,0, I 2=1 1) intervalu 7 pro libovolné n e N. Určete SSř!i sup a SSř!i inf (tedy horní a dolní Riemannův součet odpovídající danému dělení). Na základě tohoto výsledku rozhodněte, zdaje funkce y = \ x | na [— 1, 1] integrovatelná (v Rie-mannově smyslu). 6.134. Vyčíslete lim 6.135. Kolik existuje různých primitivních funkcí k funkci y = cos (lnx) na intervalu (0, 10)? 6.136. Zavedte funkci / na intervalu I = [0, 1] tak, aby k ní na I neexistovala primitivní funkce. 6.137. Pomocí Newtonova integrálu vyčíslete jt (a) J sin x dx; 0 1 (b) J arctgx dx; o 3jr/4 (c) f dx; v ' J 1 +sin x ' -jt/4 e (d) j \mx\dx. l/e 6.138. Spočtěte 2 f-^= dx. J ./lXr2 6.139. Pro libovolná reálná čísla a < b určete J sgnx í/x. Připomeňme, že sgnx = 1, je-li x > 0; sgnx = — 1, je-li x < 0; a sgnO = 0. 6.140. Vyčíslete určitý integrál 1 3 Sj^dx. o 6.141. Např. opakovaným užitím pravidla per partes spočítejte jt/2 6.142. Stanovte 6.143. Vyčíslete integrál za pomoci substituční metody. 6.144. Vypočtěte f e2x cosx dx. o i J x2 e~x dx. -i -i (a) / 397 H. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 3. NEKONEČNÉ ŘADY ln 2 (b) / i dx. 0 6.145. Které z kladných čísel jt/2 71 p := J cos7 x dx, q := j cos2 x dx o o je větší? 6.146. Určete znaménka těchto tří čísel (hodnot integrálů) 2 ti 2tt a := j ŕ 2X dx; b := / cosx dx; c := / ^ 8, n e N. 6.20. (x - l)3 + 3 (x - l)2 + (x - 1) + 4. 6.26. V(-l)"-x2", (2n)l konverguje pro libovolné reálné x. 6.27. 00 92«-l «=i konverguje pro libovolné reálné x. 6.28. ~3(-l)"+i /(*) = > -x" , «=l konverguje pro x € (—1, 1]. 6.29. Je dobré si uvědomit, že rozvíjíme j ln(x). /(x) = ^(-iy+1-(x-iy, Konverguje na intervalu (0, 2]. 6.37. (-f, f). 6.32. Konvexní je na intervalech (—oo, 0) a (0, 1/2); konkávni na intervalu (1/2, +oo). Má pouze jednu asymptotu, a to přímku y = jr/4 (v ±oo). 6.33. (a) y = 0 v —oo; (b) x = 2 - bez směrnice, y = 1 v ±oo. 6.34. y = 0 pro x -> ±oo. 6.35. y = ln 10, y = x + ln 3. 6.77. y_7í Pro a e (0, 1), oo jinak. 6.89. Všechna. 6.90. Oborem hodnot je (—oo, 0] U [4, +oo). Funkce / není lichá, sudá ani periodická. Má jediný bod nespo-jitosti, a to xo = — 1, přičemž lim f(x) = —oo, lim f(x) = +00. x=> — 1+ x=> — 1 — Funkce protíná osu x pouze v počátku. Je kladná pro x < — 1 a nekladná pro x > — 1. Lehce lze ukázat, že lim f(x) = +00, lim f(x) = —00; X=>— OO x^+00 402 CHAPTER 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET Odtud plyne, že / roste na intervalech [—2, —1), (—1,0] a klesá na intervalech (—oo, —2], [0, +00). Ve stacionárním bodě x\ — 0 nabývá ostrého lokálního maxima a ve stacionárním bodě x2 — —2 má ostré lokální minimum y2 — 4. Je konvexní na intervalu (—00, —1), konkávni na intervalu (—1, +00). Nemá inflexní bod. Přímka x — — 1 je asymptotou bez směrnice. Asymptotou se směrnicí v ±00 je přímka y — —x + 1. Dodejme např. /(-3) = 9/2, /'(-3) = -3/4, /(l) = -1/2, /'(l) = -3/4. 6.97. Funkce je definována i spojitá na R \ {0}. Není lichá, sudá ani periodická. Je záporná právě na intervalu (1, +00). Jediným průsečíkem grafu s osami je bod [1, 0]. V počátku má / tzv. nespojitost druhého druhu a jejím oborem hodnot je R, neboť lim f(x) — +00, lim f(x) — —00, lim f(x) — +00. Platí /'(*) =-^P\ x€M\{0}, f"(x) = x € R \ {0}. Jediným stacionárním bodem je x\ — —\/2. Funkce/roste na intervalu [xi, 0), klesá na intervalech (—00, xi], (0, +00). V bodě x\ má tudíž lokální minimum yi — 3/^4. Inflexní body daná funkce nemá. Je konvexní na celém svém definičním oboru. Asymptotou bez směrnice je přímka x — 0, přímka y — —x je pak asymptotou se směrnicí v ±00. 6.92. Funkce je definována i spojitá na M\{1}. Není lichá, sudá ani periodická. Průsečíky grafu / s osami jsou body [l-V2,0] a [0, —1]. V bodě xo — 1 má funkce / nespojitost druhého druhu a jejím oborem hodnot je R, což bezprostředně plyne z limit lim f(x) — —00, lim f(x) — +00, lim f(x) — +00. JC—>■ 1— Jt-»1 + x^±qo /(x) = (x-l)2 + IlT, X€M\{1}, /'(*) = 2*^^, X€M\{1}, r(x) = 2^^, X€M\{1}. Jediným stacionárním bodem je x\ — 2. Funkce / roste na intervalu [2, +00), klesá na intervalech (—00, 1), (1,2]. Vboděxi tudíž nabývá hodnoty lokálního minima y 1 — 3. Je konvexní na intervalech (-00,1 - yŤ), (1, +00) a konkávni na intervalu (l-V2, l). Bod x2 — 1 - -^2 je tak inflexním bodem. Přímka x = 1 je asymptotou bez směrnice. Asymptoty se směrnicí daná funkce nemá. 6.93. Funkce je definována i spojitá na celém R. Není lichá, sudá ani periodická. Nabývá kladných hodnot na kladné poloose, záporných na záporné. Průsečíkem grafu / s osami je pouze bod [0, 0]. Snadno se určí derivace /'(x) = A^-#Fe-*, x€M\{0}, /'(0) — +00, Po úpravě není obtížné spočítat ,.x2 f"(x) = #Fe"* x€M \ {0}. 3Vjcz 9vx^ Jediným nulovým bodem první derivace je bod xq — 1/3. Funkce / roste na intervalu (—00, 1/3] a klesá na intervalu [1/3, +00). V bodě xo má proto absolutní maximum yo — l/VŠě- Neboť lim^^-oo f(x) — —00, jejím oborem hodnot je (—00, yo]. Inflexní body jsou xi = t=^, x2 = 0, x3 = ii3a přičemž funkce / je konvexní na intervalech (xi, x2), (X3, +00), konkávni na intervalech (—00, x\), (x2, X3). Jedinou asymptotou je přímka y — 0 v +00, tj. limx^+0o f(x) — 0. 6.94. Funkce je definována i spojitá na R \ {2}. Není lichá, sudá ani periodická. Je kladná právě na intervalu (0, 2). Jediným průsečíkem grafu funkce / s osami je bod [0, 0]. V bodě xq — 2 nastává tzv. skok o velikosti 7T, jak vyplývá z limit Platí lim f(x) = |, lim f(x) = -|. x—>2— x—>2-\- f'M = x^xTŤ ^Mx{2}, 403 H. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 3. NEKONEČNÉ ŘADY První derivace nemá nulový bod. Funkce / proto roste v každém bodě svého definičního oboru. Neboť lim /(*) = -§, lim /(*) = -£, oborem hodnot je množina (—tt/2, ti/2) \ {—jr/4}. Funkce / je konvexní na intervalu (—00, 1), konkávni na intervalech (1,2), (2, +00). Bod jci = 1 je tedy inflexním bodem, přičemž f(l) = it/4. Jedinou asymptotou je přímka y = —jr/4 v ±00. 6.95. Def. obor M+, globální maximum x = e, infl. bod x = Ve3, rostoucí na int (0, e), klesající na (e, 00), konkávni (0, Ve3, konvexní (Ve3, 00), asymptoty x = 0 a y = 0, lirn^o /(a) = —00, lim^oo f(x) = 0. 6.96. Def. obor R \ [1,2]. Lokální maximum x = 1~2v/^, na celém definičním oboru konkávni, asymptoty x = 1, x = 2. 6.97. Def. obor M. Lokální minima v — 1, 1, maximum v 0. Funkce sudá. Inflexní body bez asymptot. 6.98. Def. obor M \ [—j, 1]. Glob. extrémy nemá. Bez inflexních bodů. asymptoty x = — 5, x = 1. 6.99. Def. obor M\ {1}. Bez extrémů. Bez infl. bodů, na int. (—00, 1) konvexní, (1, 00) konkávni, Asymptota bez směrnice x = 1. Asymptota se směrnicí y = x + 1. 6.700. (a) A x^í; (b) jíl + 2lfg + ^; (c) Ä; (d) in (1 + sinx). 6.707. (a) -cotgx - x + C; (b) tgx - cotgx + C. 6.102. ex +3arcsin §. 6.701. iln(l+x4) + C. 6.704. 272 arctg ^ + C. 6.105. In I* 1 j + \ arcsinx — 4cosx — 5sinx + C. 6.106. (a) x arctg x - MI+£Í2 + C; (b) ^ + C. 6.707. (a) -x2 cosx + 2x sinx + 2cosx + C; (b) e* (x2 - 2x + 2) + C. 6.708. ^ (21n2x - 21nx + l) + C. 6.709. (2x-x2)ex + C. 6.770. (a) <2-T+5)" + C; (b) + C; (c) -i e"*3 + C; (d) 5 arcsin3 x + C; (e) ^ + C; (f) arctg2 Vx" + C; (g) ^ arctg e*) + C; (h) 2 sin Vx - 2Vx cos Vx + C. 6.777. Např. 1 — x = f2x dává ľ —iif; a Vx2 + x + 1 = x + v vede na f t2^ ,. ť J (i+í2) ' r+2;y-2 6.772. ^ arctg (V2tg x) + C. 6.113.x -2Vx+21n(l + Vx) +C. 6.774. (a) Inx - ^ + C; (b) ^ + C. 6.777. 2X3 + 3X2 - 2x - 13 + ^f±g. 6.77&A3_ lA.+ 2 + _|_ 6.779. (a) -1* + -1, - -1,; (b) 2 1,1,* -2 "T" x+2 x+3" x x2 T x2 + l T (x2 + l)2' 6.120. Ar + X - 1. x-2 x3 x 6.121. -Xr' 4X~2 x + 1 ^ x2-4x+W 6.122. 1 2 , 2x-3 x2 x x2-x+2' 6.123. i - 1 + 1 - X X2 X3 x+1 A /24 -i- 4- Ä. + £ , Di+£ , F-v+G O.i^. A_2 -t- x2 + x + (3x2+x+4)2 "I" 3.v2+.v+4- 6.725. 1 + 1 _ I + 404 CHAPTER 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET 6.726. (a)31n|x-2|;(b)^?. 6.727. \ ln (x2 + 4x + 8) - \ arctg ^±2 + C. 6.128. -4= arctg 2s±I + + C. 3^3 6 V3 3(x2+x + l) 6.729. i ln -&±iii- + ^ arctg + C. 6.730. i ln |x - 11 - i ln (x2 + x + 1) - arctg + C. 6.737. ln (| x - 1 | (x - 2)4) - ^ + x + C. 6.732. (a) - + C; (b) ^ + f + C; (c) x — sin x + C; (d) f + ^ + C; (e) \ sini x - | siní x + j\ sin t x + C; (f) + 2tgx - ^ + C; (g) i ln |tg 11 - + C; (h) ln |tg f | + C. 6.733. S3n, sup = =±1, Ss„, M = ano, je. 6.734. J2 Vx t/x = f (2^2 - l). 6.135. Nekonečně mnoho. 6.136. Např. funkce / může nabývat hodnoty 1 v racionálních bodech intervalu I a být nulová v iracionálních bodech. 6.737. (a) 2; (b) f - (c) 2 In (l + V2); (d) 2 - f. 6.138. VŠ - -v/2. 6.739. |fc| - 6.740. ±ln2. 6.747. i (e7" - 2). 6.742. e -Se"1. 6.743. I. 6.744. (a) 4; (b) ^p- 6.745. /? < q. 6.146. a > 0; b = 0; o 0. 6.747. C 1; (b) a < 1; (c) a = 0. 6.764. Právě pro /? > 1, q e R a pro p = 1, # > 1. 6.765. (a) platí; (b) neplatí; (c) platí. 6.766. 1 102-2 ^ 1044!' 6.767. Chyba náleží do intervalu (0, 1/200). 6.768. 1 — 3x + jjx4; nad tečnou. 6 /69 V°° x2n O.IOV. 2^n=0 (2n)! ^ ' 6.770. y = arctgx. 6.777. Právě pro x € |, |^ je 5+2jc «=0 i 00 / t\" 6.775. (-l)'' + 122í / 7T\2r + l /« = 1/2+zyT-i5r('-í) Řada konverguje pro všechna x e R. 6-174. Z^^^-D^Z^o3^^- 6.775. /(x) = x, x € R; ano. 6.776. Nikoli. oj??. z,r=0fef-2"- 6.778. (^l-^ + ^^b)!-^. 6 779 V°° _i_x2""1"1 o.7/y. 2^=0 (2«+i)«! 6.180. y — arctgx. 6.787. Právě pro x e (—§, |^ je i 5+2jc «=0 6.782. (a) v(0) = 6 m/s; (b) t = 3 s, s(3) = 16 m; (c) u(4) = -2 m/s, a(4) = -2 m/s2 406 CHAPTER 7 Spojité modely Jak zvládáme nelineární objekty? — zase hlavně lineárními nástroji... V této kapitole ukážeme využití nástrojů diferenciálního a integrálního počtu ve vybraných problémech, ve kterých si vystačíme s funkcemi jedné reálné nezávislé proměnné. Půjde o postupy a nástroje docela podobné těm z kapitoly třetí, tj. manipulace s lineárními kombinacemi vybraných generátorů a lineárními transformacemi (např. hledání jejich jader nebo vzorů předepsaných obrazů). Jen místo konečně rozměrných vektorů budeme pracovat s prostory funkcí, tzn. uvažované vektorové prostory často nebudou mít konečnou dimenzi. K těmto i dalším praktickým oblastem se vrátíme v příští kapitole v kontextu funkcí více proměnných, diferenciálních rovnic i variačního počtu. Nejprve budeme aproximovat funkce pomocí lineárních kombinací z předem pevně zvolených sad generátorů. Po cestě si ale budeme muset ujasnit, jak vlastně lze pracovat s pojmy jako je vzdálenost. Půjde o náznaky teorie tzv. metrických prostorů a tato část je zároveň přípravou na analýzu v euklidovských prostorech W. V zásadě přitom budeme pokračovat v postupech, které již z euklidovských vektorových prostorů dobře známe. Zjistíme, že naše intuice z euklidovských prostorů nízké dimenze se docela dobře hodí i obecně. Pak se budeme stručně zabývat integrálními operátory, tj. lineárními zobrazeními na funkcích, které jsou definovány pomocí integrování. Půjde zejména o tzv. Fourierovu analýzu. Při našich úvahách se přitom budeme jako obvykle zamýšlet i nad diskrétními variantami dříve diskutovaných spojitých operací. V celé kapitole budeme pracovat s funkcemi jedné reálné proměnné, které ale budou mít buď reálné nebo (velmi často) komplexní hodnoty. 1. Fourierovy řady 7.1. Prostory funkcí. Jako obvykle začneme výběrem J/7 vhodných množin funkcí, se kterými chceme ý^|&Pmy pracovat. Přitom chceme mít dost funkcí na tCmJ^s^- praktickou použitelnost našich modelů, ale také musí být dostatečně "pěkné", abychom je uměli integrovat a derivovat tak, jak bude třeba. Budeme vesměs pracovat s funkcemi definovanými na nějakém intervalu I = [a, b] c M, případně nekonečném A. Ortogonální systémy funkcí Chceme-li zobrazit nějaký trojrozměrný objekt v rovině, uvážíme jeho (například kolmou) projekci do této roviny. Obdobně, chceme-li "vyjádřit" nějakou složitější funkci pomocí jednodušších, můžeme uvážit její projekci do (reálného) vektorového prostoru generovaného těmito jednoduššími funkcemi. Potom budeme schopni například integrovat složitější funkce stejně, jako jsme integrovali (či derivovali) funkce vyjádřené pomocí mocninných řad (pokud bude prostor jednodušších funkcí "dostatečně" velký, tak s libovolnou přesností). Na vhodném (nekonečném) vektorovém prostoru funkcí na daném intervalu, můžeme zavést i skalární součin. Skalární součin tedy nezavedeme na prostoru všech funkcí na daném intervalu, ale na jistém jeho podprostoru, který však bude dostačně veliký pro naše výpočty (mimo jiné bude obsahovat všechny spojité funkce na daném intervalu). Skalární součin nám umožní počítat projekce tak, jak jsme byli zvyklí u vektorových prostorů. Pokud máme dán konečně rozměrný vektorový (pod)prostor funkcí a chceme určit projekci nějaké fukce na něj, tak Grammovým-Schmidtovým ortogonalizačním procesem (viz 2.42) nejprve spočítáme ortogonální (či ortonormální) bázi tohoto podprostoru a pak známým způsobem (2.3) dopočítáme kolmou projekci. 7.1. V prostoru reálných funkcí na intervalu [1, 2], je dán vektorový podprostor (x2, 1/x). Doplňte funkci 1 /x na jeho ortogonální bázi a určete kolmou projekci funkce x na tento podprostor. Solution. Nejprve doplníme funkci 1 /x na ortogonální bázi. Jedním z vektorů báze tedy bude funkce 1 /x. Uvažovaný vektorový prostor je generován dvěma lineárně nezávislými funkcemi, bude tedy mít dimenzi 2 (a všechny vektory v něm jsou tvaru a-^+b-x2, kde a, b e M). Zbývá nám tedy najít pouze ještě jeden vektor báze, který bude kolmý na funkci f\ = 1 /x. Podle Grammova-Schidtova ortogonalizačního procesu ho hledáme ve tvaru f2 = x2 +k--, teK. Reálnou konstantu 407 B. FOURIEROVY ŘADY 1. FOURIEROVY ŘADY k určíme z podmínky kolmosti: tedy 1 , 1 1 , 11 {-^x2 +k ■-) = {-,ŕ)+k{-,-), jc jc jc jc jc :, x2) Jj2 \ ■ x2 dx (1,1) ŕi.idx Hledaná ortogonální báze tedy je (\,x2 — |). Nyní spočítáme projekci funkce x na tento podprostor (viz (2.3)): <*,7> 1 (^^-7> - + 2 15 - 3 x 34 x 3-,x2 ':) ■ (X2 - f ) □ 7.2. Uvažujme reálný vektorový prostor funkcí na intervalu [1, 2] generovaný funkcemi -, \, \. Doplňte funkci - na ortogonální bázi x x x x tohoto prostoru. Solution. Analogicky jako v předcházejícím příkladu, použijeme Grammova-Schmidtova ortogonalizačního procesu (s daným skalárním součinem). Dostáváme tak postupně Mx) =-, fiix) - ^ - y l3 h(X) = — — ^2 + □ 7.3. Určete projekce funkcí a x na vektorový prostor z příkladu 7.21|. Určete vzdálenosti od tohoto vektorového prostoru. Solution. Projekce : ||_/\ + fjA + \h, vzdálenost ^. Projekcex : 2/i+(-|+ln(2))/2+(-| ln(2)+ff)/3, vzdálenost cca 0,03496029493. Vidíme, že vzdálenost funkce, která má podobný průběh jako generátory, je menší. □ 7.4. V prostoru reálných funkcí na intervalu [0, it], je dán vektorový podprostor (sin(x), x). Doplňte funkci x na jeho ortogonální bázi a určete kolmou projekci funkce j sin(x) na tento podprostor. 7.5. V prostoru reálných funkcí na intervalu [0, 7t], je dán vektorový podprostor (cos(x),x). Doplňte funkci cos(x) na jeho ortogonální bázi a určete kolmou projekci funkce | cos(x) na tento podprostor B. Fourierovy řady Základním studovaným periodickým dějem, s nímž se setkáváme v aplikacích, je obecné jednoduché harmonické kmitání v mechanice. Jedná se o pohyb hmotného bodu po přímce. Je dobře známo, že funkce /, jež udává polohu hmotného bodu na přímce v závislosti na čase ř, má tvar (7.1) f(t) = a sin (cůt + b) pro jisté konstanty a, a> > 0, b e M. určené polohou a rychlostí bodu v počátečním čase. Funkci y = f(t) lze získat např. vyřešením homogenní lineární diferenciální rovnice intervalu (tj. krajní hodnoty a i b mohou také nabývat hodnot ±oo, stále však půjde o uzavřené množiny). \ Prostory po částech hladkých funkcí L Množina funkcí 1 budeme také uvažovat množinu všech po částech spojitých funkcí / jejichž všechny derivace až do řádu k včetně patří do 5° (tj. nemusí existovat ve všech bodech, ale existují jejich jednostranné limity ve všech bodech). Budeme pro ni používat značení 6^. V případě neomezeného intervalu / budeme také pracovat často s podmnožinou 5* C 5* všech funkcí s kompaktním nosičem (tzn. že funkce jsou identicky nulové vně nějakého konečného uzavřeného intervalu). |/(x)|úřx < oo, (f(x))2dx < oo. 1 Na ohraničených intervalech samozřejmě mají všechny funkce kompaktní nosič v tomto smyslu. Když nás nebude zajímat, na jakém intervalu pracujeme, budeme proto psát jen «Sj ve všech případech. V případě konečného intervalu [a, b] nebo za předpokladu kompaktního nosiče jsou naše funkce z 6° vždy riemannovsky integrovatelné na zvoleném intervalu / jak v absolutní hodnotě tak v kvadrátu, tzn. (7.2) / + ary = 0 Naše úvahy lze rozšiřovat na podstatně větší definiční obory funkcí, často ale za cenu značné technické námahy. Budeme občas zmiňovat prostory kurweilovsky (nebo lebesgueovsky) integrovatelných funkcí, pro které jsou výsledky daleko ucelenější a pěknější. Zájemce odkazujeme na rozsáhlou specializovanou literaturu. Ve skutečnosti se budeme držet stejné strategie jako u racionálních a reálných čísel - počítáme jen s pěknými funkcemi a máme "nějak zvládnuto", jak vypadají limity cauchyovských posloupností ve zvolených metrikách (které většinou potřebujeme jen formálně). 7.2. Vzdálenost funkcí. Z námi již dokázaných vlastností limit a derivování je okamžitě vidět, že Sh, resp. 6^, jsou vektorové prostory. Na konečnědi-menzionálních prostorech jsme uvažovali _ vzdálenost vekotorů pomocí rozdílů hodnot jednotlivých jejich souřadnic. Na prostorech funkcí můžeme postupovat podobě a využít absolutní hodnoty reálných nebo komplexních čísel (resp. euklidovské vzdálenosti) následujícím způsobem: j Vzdálenost funkcí | 408 CHAPTER 7. SPOJITÉ MODELY Definition. Pro funkce / a g z SP je jejich Li-vzdálenost definována vztahem \f \f(x) - g(x)\dx Obdobně je L2-vzdálenost funkcí f a. g definována vztahem / rb \ 1/2 ll/-Sll2= I / \f(x) - g(x)\2dx) . Velikostí funkce H/Hj vzdálenost od funkce nulové. nebo II/|| 2 rozumíme její V prvním případě L i-vzdálenost funkcí f a g s pouze reálnymi hodnotami vyjadřuje plochu uzavřenou mezi grafy těchto funkcí, nezávisle na tom, která funkce má větší či menší hodnoty. Protože uvažujeme po částech spojité funkce f a g, může být jejich vzdálenost rovna nule pouze když se od sebe liší nanejvýš svými hodnotami v bodech nespo-jitosti, tj. v nejvýše konečně mnoha bodech na ohraničených intervalech. Skutečně, jestliže se dvě naše funkce liší v jednom bodě jco, ve kterém jsou spojité, liší se i na nějakém dostatečně malém okolí tohoto bodu a toto okolí přispěje do vzdálenosti nenulovou hodnotou integrálu. Máme-li tři funkce /, g a h, pak samozřejmě b ľb \h(x) - f(x)\dx = / \h(x) - g(x) + g(x) - f(x)\dx \h(x) - g(x)\dx + / \g(x) - f (x)\dx, a platí tedy obvyklá trojúhelníková nerovnost. Všimněme si, že odvození této nerovnosti využívá pouze trouhelníkovou nerovnost platnou pro velikost skalárů, platí proto i pro funkce /, g e SP s komplexními hodnotami. Podobné je to pro druhou definici. Kvadrát velikosti ||/||2 funkce / je ll/H22 \f(x)\2dx a je odvozen z dobře definovaného symetrického bilineárního zobrazení reálných funkcí do skalárů (f,8) = í f(x)g(x)dx dosazením / za obě funkce. U komplexních hodnot ale obdržíme podobně tuto velikost ze skalárního součinu s použitím komplexní konjugace, (f,8) f(x)g(x) dx, jak jsme viděli u unitárních prostorů v třetí kapitole: Určitě tedy bude platit i trojúhelníková nerovnost, protože celou diskusi můžeme odehrát v maximálně třírozměrném prostoru se skalárním součinem generovaném danými funkcemi f,gah. vyplývající z aplikace Newtonova zákonu síly pro daný pohyb. Doplňme, že funkce / má zřejmě periodu T = 2n/co (v mechanice se však častěji mluví o kmitočtu neboli frekvenci 1 /T) a že kladná hodnota a (vyjadřující maximální výchylku kmitajícího bodu od počátku) se nazývá amplituda, hodnota b (vyjadřující polohu bodu v počátečním čase) počáteční fáze a hodnota co pak úhlová frekvence kmitavého pohybu. Podobně se můžeme zabývat funkcí z = g(t), která udává napětí v závislosti na čase t v elektrickém obvodu s indukčností L a kapacitou C a která je řešením diferenciální rovnice (7.3) z" + co2z =0. Rozdíl mezi rovnicemi (||7.2||) a (||7.3||) (kromě odlišné fyzikální interpretace) je pouze v konstantě co. Pro rovnici (||7.2||) je co2 = k/m, kde k je konstanta úměrnosti a m je hmotnost hmotného bodu; a pro rovnici (117.311) je co2 = (LC)"1. Ve skutečnosti každý periodický děj, který lze zadat funkcí ve tvaru (||7.1||), se označuje jako harmonické kmitání a pro konstanty a, a>,b se používá takřka výhradně výše zmíněné označení převzaté z jednoduchého harmonického kmitání hmotného bodu v mechanice. Když využijeme jednoho ze součtových vzorců sin (a + P) = cos a sin jí + siná cos jí, a, jí e M, můžeme funkci / (viz (||7.1||)) zapsat jako (7.4) f(t) = c cos (cot) + d sin (cot) , přičemž c = a sinb, d = a cosb. Rovněž tedy funkce / z (||7.4||) vystihuje harmonické kmitání s amplitudou a = Vc2 + d2 a s počáteční fází b e [0, 2jt) splňující sin b = c/a, cos b = d/a. Důležitou úlohou v aplikačních problémech je skládání (tzv. superpozice) různých harmonických kmitání. Klíčovou pozici potom zaujímá superpozice konečného počtu harmonických kmitání vyjádřených funkcemi ve tvaru f„(x) = a„ cos (ncox) + b„ sin (ncox) pro n e {í,...,m}. Tyto jednotlivé funkce mají základní periodu 2jt/(nců). Jejich součet (7.5) lan cos (ncox) + bn sin (ncox) ] n = \ je proto periodickou funkcí s periodou 2jt/co. Obecně platí, že superpozicí libovolných konečně mnoha jednoduchých harmonických kmitání majících souměřitelné periody je periodický proces, jehož periodou je nej menší společný násobek primitivních period jednotlivých kmitání. Součet (||7.5||) doplněný o vhodné posunutí (7.6) Oo 2 «=i + y [an cos (ncox) + bn sin (ncox) ] je právě m-tým částečným součtem funkcionální řady (7.7) 2 «=i + y [an cos (ncox) + bn sin (ncox) ] Z fyzikálního hlediska jde o složený periodický proces, jenž může sloužit jako přirozená aproximace superpozice nekonečného počtu 409 B. FOURIEROVY ŘADY 1. FOURIEROVY ŘADY jednoduchých harmonických kmitání (tzv. harmonických složek) funkcionální řady (||7.7||). Nabízí se zde otázka, zda je možné naopak každý periodický proces "rozumně" vyjádřit superpozicí konečného a případně nekonečného počtu jednoduchých harmonických kmitání - zda každý periodický proces je výsledkem takové superpozice. Formulováno přesněji z pohledu matematiky, zda lze každou periodickou funkci vyjádřit jako konečný součet (||7.6||), příp. alespoň jako součet řady (||7.7||). Kladnou odpověď pro významnou a širokou třídu periodických funkcí samozřejmě dostáváme pouze pro součet nekonečný (viz teoretická část). Již jsme řekli, že periodické procesy hrají důležitou roli ve většině fyzikálních i technických oborů. Tradičně vyzdvihněme alespoň akustiku, mechaniku, elektrotechniku, kde se nepopiratelně ukazuje nutnost zodpovězení uvedené otázky. Kromě toho však hledání odpovědi vedlo ke vzniku svébytné matematické partie -teorie Fourierových řad. Ta se poté začala využívat při řešení dalších tříd problémů (mj. k řešení většiny důležitých typů obyčejných a parciálních diferenciálních rovnic) a přispěla k rozvoji samotných teoretických základů matematiky (např. k přesnému vymezení tak fundamentálních pojmů, jakými jsou funkce a integrál). Název Fourierovy řady je pak na počest francouzského matematika a fyzika Jeana B. J. Fouriera, který jako první prakticky využil trigonometrické výrazy (||7.6||) ve své práci z roku 1822 věnované problematice vedení tepla (problematikou se začal zabývat v roce 1804 apráci sepsal již v roce 1811). Význam tohoto Fourierova počinu pro teoretickou fyziku, přestože se fyzice věnoval spíše okrajově, byl nesmírný: zavedl tím do oboru matematické metody, které dodnes patří ke klasickým nástrojům teoretické fyziky. Fourierova matematická teorie tepla se také stala základem pro George S. Ohma při odvození jeho slavného zákonu vedení elektrického proudu. Upozorněme ještě, že jiní matematikové studovali vlastnosti součtů (||7.6||) o mnoho let dříve než Fourier (kupř. L. Euler). Nedosáhli však zásadního výsledku směrem k možnému praktickému využití jako on. 7.6. Určete Fourierovy koeficienty funkce (a) g(x) = sin(2x) cos (3x) , x e [—jt, Jt\, (b) g (x) = cos4 x, x s [—Jt, it]. Solution. Případ (a). Neboť pro x e M je sin (2x) cos (3x) = sin (2x) [cos (2x) cos x — sin (2x) sin x] \ sin (4x) cos x — sin2 (2x) sin x = \ cos x sin (4x) 1—cos(4x) smx — j sin x + j cos x sin (4x) + ^ sin x cos (4x) = — ^ sin x + ^ sin (5x) , vidíme, že Fourierovy koeficienty jsou nulové s výjimkou b\ = —1/2, bs = 1/2- Případ (b). Podobně z cos4 x [cos2 x]' l+cos(2x) n2 [l + 2 cos (2x) + cos2 (2x) ] _ i ~~ 4 3 + t\ cos (2x) + i cos (4x) 1+2 cos (2x) + l+cos(4jt) x e 8 1 2 y ' ' 8 plyne, že a0 = 3/4, a2 = 1/2, a4 = 1/8 a že ostatní koeficienty jsou nulové. 7.3. (Ne)konečnost dimenze a ortogonalita. Zůstaňme v\ na chvíli u naši defmice L2-velikosti || ||2 na vektorovém prostoru /fP. Zjevně operace na 1,1 * ^l- . konci posledního odstavce splňuje jak linearitu v prvním argumentu, tak symetrii (f, 8) = (8, f)> tj. v reálném případě je to symetrické bilineární zobrazení. Zároveň je pro spojité funkce splněna i podmínka nenulovosti velikosti pro nenulové funkce, zatímco pro naše po částech spojité funkce znamená nulovost velikosti nulovost funkce až na nejvýše spočetnou množinu bodů (konečnou na každém konečném intervalu). Pro vektorový podprostor spojitých funkcí jsme tedy skutečně definovali skalární součin. U obecnějších funkcí bychom, technicky vzato, měli ztotožňovat funkce, které se liší na konečných intervalech jen v konečně mnoha hodnotách. V naších dalších úvahách ale tato technická nepříjemnost nebude hrát podstatnou roli (a příležitostně se k ní budeme vracet v poznámkách). V konečněrozměrném případě reálných nebo komplexních vektorových prostorů jsme uvažovali skalární součiny a velikost vektorů již ve druhé a třetí kapitole. Všimněme si teď, že při dovozování vlastností jsme vždy pracovali s dvojicemi nebo konečnými množinami vektorů. Nyní to ale můžeme dělat s funkcemi naprosto stejně a pokud zúžíme naši definici skalárního součinu na vektorový podprostor generovaný (podle potřeby nad reálnými nebo komplexními čísly) jen konečně mnoha funkcemi f\, ..., fk. Dostaneme opět dobře definovaný skalární součin na tomto konečněrozměrném vektorovém podprostoru. Jako přiklad uvažme funkce f,■ = xl, i = 0, ..., k. Jimi je v 6° generován (k + l)-rozměrný vektorový podprostor M,t[x] všech polynomů stupně nejvýše k. Skalární součin dvou takových polynomů je dán integrálem. Každý polynom stupně nejvýše k je vyjádřen jednoznačným způsobem jako lineární kombinace generátorů f0, ..., fk. Pokud by navíc naše generátory měly tu vlastnost, že (7.1) (fi,fj) 0 pro i # j, 1 pro i = j, jde o tzv. ortonormální bázi. Připomeňme si v této souvislosti proceduru Gramovy-Schmidtovy ortogonalizace, viz 2.42, která z libovolného systému lineárně nezávislých generátorů fi vytvoří nové (opět lineárně nezávislé) ortogonální generátory gt téhož prostoru, tj. {gt, gj) =0 pro všechny i j. Spočteme je přitom postupně jako gi = f\ a vzorci gi+i = fi+i + a-igi H-----h atgt, pro l>\. Cli (fi 410 CHAPTER 7. SPOJITÉ MODELY Aplikujme tuto proceduru pro ilustraci na tři polynomy 1, x, x2 na intervalu [—1, 1]. Dostaneme gi = 1, 1 g2 = X g3 = X x ■ 1 í/x ■ 1 = x — 0 = x ílII J-i 1 íl II J-l x2 ■ 1 dx • 1 iS2ir 7-i 3 Příslušná ortogonální báze prostoru R2[x] všech polynomů stupně nejvýše tři na intervalu [—1, 1] je tedy 1, x, x2 — 1 /3. Normalizací, tj. vhodným násobením skalárem tak, aby prvky v bázi měly velikost jedna, dostaneme ortonormální bázi hi =y/l, h2 = y|x, h3 = ^/|(3x2 - 1/3). Takovým ortonormálním generátorům Hlk [x] se říká Legen-dreovy polynomy. 7.4. Ortogonální systémy funkcí. Právě jsme si připomněli výhody, které ortonormální báze podprostorů mají pro konečněrozměrné vektorové prostory. V předchozím příkladu Legendreových polynomů generujících i2[x] C V = Rk[x], k > 2, bude pro libovolný polynom h e Vfunkce H = (h, h\)h\ + {h, h2)h2 + {h, h3)h3 jednoznačně určenou funkcí, která minimalizuje naši L2-vzdálenost \\h — H\\ mezi všemi funkcemi v M,t[x], viz. 3.25. Koeficienty pro nejlepší aproximaci zadané funkce pomocí funkce z vybraného podprostorů je možné tedy získat prostě integrací v definici skalárního součinu. Uvedený příklad podbízí následující zobecnění: Když provedeme proceduru Gramovy-Schmidtovy ortogonalizace pro všechny monomy 1, x, x2, ..., tj. pro spočetný systém generátorů, co z toho vznikne? ^.mhJ Ortogonální systémy funkcí [ Libovolný konečný nebo spočetný systém lineárně nezávislých funkcí v 0, jestliže pro každé x e M platí f (x + T) = f (x). Je zjevné, že součty a skalární násobky periodických funkcí se stejnými periodami jsou opět periodické funkce s touž periodou. Integrál f*°+T f(x)dx periodické funkce / přes interval délky periody T nezávisí na volbě xo e M. Poslední tvrzení se dokáže snadno: Zvolme si dva takové levé hraniční body integrace x0 a yo- Pomocí substituce t = x + kT s vhodným k převedeme f™+T f(x)dx na případ, kdy y0 e [x0,x0 + T]. Nyní rozdělením intervalu integrace na tři části dokončíme důkaz. Ortogonalitu Fourierova systému funkcí si můžeme spočíst docela snadno pomocí výletu do komplexních čísel, který se nám bude velice hodit později: Připomeňme, že e" = cos(x) + i sin(x). Přímým derivováním součinu reálných funkcí ověříme, že pro funkce z(x) a cp(x) s reálnou proměnnou x a s reálnými hodnotami platí {z(x) J = jt/4. Tentokráte jsou však nulové koeficienty an, n e N U {0}. K nalezení zbývajících koeficientů užitím metody per partes a (||7.8||) (součinem 2 lichých funkcí je funkce sudá) získáme xo + T T j f (x) sin (ncox) dx x0 ' 2 f (X-0 1) sin Zf-dx 4 f(x 2 3) sin zf-dx [-(x - 1)^ cos + sin "-f-]] - [-(x - 3) £ cos ^] Ihned odsud vidíme, že pro sudá n je bn = 0. Sinovu Fourierovou řadu díky tomu upravíme do tvaru oo Z [(^ [(-I)"-U + ^r sin 2f) sin =f] n = l v rí -4 -i- (-d m ^ U2«-1]jt [2«-1]2jt2 / n = l sin [2n — \]nx □ 7.11. Funkci g(x) = cosx, x e (0, Jt) zapište jako součet kosinové a sinové Fourierovy řady. Solution. Samozřejmě platí cosx = cosx, x e (—tt, jt), přičemž na kosinus na levé straně nahlížíme jako na sudé rozšíření funkce g a na pravé straně jako na kosinovou Fourierovu řadu, která je dána jednoznačně. Pro sinovou řadu pak musí být an = 0, n e N U {0} a snadno také spočítáme 415 B. FOURIEROVY ŘADY 1. FOURIEROVY ŘADY b\ = - f cosx sin x dx = ^ f sin (2x) dx = 0, o o bn = — f cos x sin (nx) dx o = - f sin ([n + l]x) + sin ([n — l]x) dx o COs([ř? + l]x) i COs([ř7 — \]x) n+1 ' n-1 Jestliže uvážíme, že bn = 0 pro lichá neN a bn získáme OO i- 8« 2«[(-l)" + l] («2-l)jT n e N \ {1}. 4« («2-l)jT pro sudá n, cosx = 2Z, n = l (4n2-l)n sin (2nx) x e (0, 7t). □ 7.12. Napište Fourierovu řadu 77--periodické funkce, která se rovná kosinu na intervalu (—jt/2,Jt/2), a kosinovou Fourierovu řadu 2jt-periodické funkce y = | cosx |. Solution. Není obtížné si uvědomit, že hledáme pouze jednu Fourierovu řadu (druhá část zadání je reformulací té první). Sestrojme tedy Fourierovu řadu pro funkci g(x) = cosx, x e [—jt/2, Jt/2]. Ze sudosti g plyne bn = 0, n e N. Současně máme jt/2 útQ = ^ J cos x úřx = ^, -jt/2 jt/2 a„ = — J cos x cos (2«x) dx -jt/2 jt/2 -jt/2 sin([2ř? + l]x) - sin([2ř? — l]x) 2n + l 2n-l 4 (-!)"+' JT 4«2-l -| jt/2 jt/2 (-1)" , (-!)"+' 2« + l 2«-l pro každé n e N. Všimněme si, že výpočet «o bylo možné zahrnout do výpočtu obecného a„. Hledanou Fourierovou řadou je 1 + 1Z jt jt « = 1 4«z-l cos(2nx) □ 7.13. Funkci g(x) = ď rozviňte do (a) Fourierovy řady na intervalu [0, 1); (b) kosinové Fourierovy řady na intervalu [0, 1]; (c) sinové Fourierovy řady na intervalu (0, 1]. Solution. V celé úloze budeme využívat vztahů (7.9) ď [a sin (ax) + cos (ax) ] ex cos (ax) dx l+a2 + C, a e (7.10) x ■ ,fl w e*[sin(fr) -lcos(fr)] e sin (/3x) dx =----\- C, B e které lze obdržet dvojí aplikací metody per partes. S jejich pomocí postupně vypočítáme (a) Funkce sin(x) a cos(x) se liší jen o fázový posun, tj. cosímx — jt/2) = sin(mx). Proto jsou oba sčítance v reálné části našeho výrazu stejné. Musí tedy dát nulu oba. Tím jsme ověřili ortogonalitu našeho systému funkcí. Zároveň vidíme, že pro m = n je výsledkem reálné číslo f* dx = 2it a přitom zjevně musí opět být velikosti jak sin(«x) tak cos(«x) stejné. Nutně proto pro kladná n dostáváme velikosti 2 _ n „J„/„^\||2 Jen pro n |cos(«x)|| =7t, ||sin(«x)| 0 dostáváme || 11|2 = 2it. _j Fourierovy řady J_ Jt. Řadu funkcí F(x) = + ^^{an cos(«x) + b„ sin(řix)) «=i z Věty 7.5, s koeficienty 1 jt jt <0+2jt g(x) cos(«x) dx, x0 XQ+2jT g(x) sin(«x) dx, x0 nazýváme Fourierova řada funkce g na intervalu [xq, xq + 2jt]. Koeficienty a„ a b„ se nazývají Fourierovy koeficienty funkce g. ^m,^^^mm.^m.^^m^\ V praktickém použití chceme pracovat s Fourierovými I„ řadami s libovolnou délkou periody funkcí T místo hodnoty 2jt. Stačí k tomu jen přejít k funkcím cos(y-řix), sin(y-řix). Jednoduchou substitucí proměnných t = a>x, kde to = y-, ověříme ortogonalitu našeho nového systému funkcí a přepočítáme koeficienty ve Fourierově řadě F(x) funkce g na intervalu [x0, x0 + T]: F(x) = — + cos(nMX) + b„ sin(«(wx)), «=i které mají hodnoty an — — xo+r g(x) cos(«(Wx) dx, x0 xo+T g(x) sm(ncox) dx. x0 7.7. Vyjádření s exponenciálou. Před chvílí jsme při ověřování ortogonality funkcí cos(«x), sin(řix) vyšli ze základního vztahu pro parametrizaci jednotkové kružnice v komplexní rovině pomocí goniometrických funkcí. Uvažujmeme-li co = 2jt/T jako rychlost obíhání kružnice, kde T je čas jednoho oběhu, dostáváme tutéž parametrizaci ve tvaru: émt = cos cot + i sin cot. 416 CHAPTER 7. SPOJITÉ MODELY Pro (reálnou nebo komplexní) funkci f (t) a všechna celá čísla n si v tomto kontextu definujeme její komplexní Fourierovy koeficienty jako komplexní čísla T/2 f(t)e dt. T/2 Přímo z definice jsou přitom jasné vztahy mezi koeficienty an a bn Fourierových řad (po přepočtu formulí pro tyto koeficienty pro funkce s obecnou periodou délky T) a těmito komplexními koeficienty cn. Pro přirozená n dostáváme (a„ - ib„), (a„ + ib„) a při výhradně reálných hodnotách funkce / jsou samozřejmě cn a c_„ komplexně konjugované hodnoty. Vyjádřili jsme tedy Fourierovu řadu F (i) pro funkci f (t) ve tvaru F(t)= £ cnémnt. Takto lze psát Fourierovy řady pro funkce s reálnými i komplexními hodnotami, v obou případech ale budou obecně její koeficienty komplexní. K tomuto vyjádření se ještě několikrát vrátíme, např. až budeme diskutovat prakticky mimořádně užitečnou Fourierovu transformaci. Všimněme si ještě, že při pevně zvoleném T vyjadřuje výraz co = 2it/T právě změnu ve frekvenci způsobenou nárůstem n o jedničku. Je to tedy právě diskrétní krok, se kterým při výpočtu koeficientů Fourierovy řady měníme frekvence. V pozdější části této kapitoly ukážeme, že Fourierovy řady pracují s úplným ortogonálním systémem na L-:—f-j- ^ 1+«2jt2 ' n = l 2it Z «=i «[l + (-l)"+1e] sin(«jrjc) 1+«2jt2 □ 7.14. Funkci g(x) = jt2 — x2 na intervalu [—jt, 7t] vyjádřete jako součet Fourierovy řady. Pomocí tohoto vyjádření sečtěte číselné řady oo , oo n = \ n = \ Solution. Také nyní bychom mohli využít sudosti zadané funkce g a metodou per partes spočítat nenulové koeficienty an. V teoretické části je však odvozena Fourierova řada pro funkci f(x) = x2 na intervalu [—1, 1]. Tím j e vlastně dokázána identita oo n = l X G (-1, 1). Odtud pak (s přihlédnutím k rovnosti g(—jt) = g(7t)) plyne g(x) «=i 1=1 ' Stačilo (-!)"+' cos(njt) „2 -, x e [—Jt, Jt]. přičíst jt2 a původní řadu vynásobit —1. Dále je třeba si uvědomit, že v argumentu kosinů bude pouze nx místo njtx. Perioda je tak jt -násobná (mění se 2/T a meze integrálu ve vzorci pro an) a při integrování kosinů nyní nedostáváme jt ve jmenovatelích (při výpočtu a0 se projeví změna horní meze). Proto jsme museli původní řadu ještě vynásobit jt2. Jestliže čtenář není schopen projít si příslušné výpočty 417 B. FOURIEROVY ŘADY 1. FOURIEROVY ŘADY v hlavě a hned si uvědomit, kde vzniknou odlišnosti, doporučujeme mu, aby Fourierovu řadu funkce g raději vypočítal přímo. Když dosadíme x = 0 a x = jt, obdržíme již ^ ,1 oo , jt 2 = !^ + 4Z^ «=i n=l a n — 1 « —1 Jinak řečeno, nalezli jsme další způsob, jak lze vyjádřit 12 ' 7T 12(1 J_ . J___L . 22 "I" 32 42 -I- + é + é + Ä + □ 7.15. Pomocí Fourierovy řady funkce g(x) = ď, x e [0, 2jt), vyčíslete £~ i Solution. Platí (viz také (||7.9||), (||7.10||)) i jV í/x = 1 (e2- - 1) , o 2ji a0 - f ď cos («x) dx = - k j ^ ' ji 2jt ŕ„ = ^- J" e* sin («x) 0 dvojnásobným využitím metody per partes dostáváme: 2 4 / x2 cos(2jYL)dx = 2 / x2 cos(jrnx)dx J-i Jo r(-D". 77" "-nezbývající koeficient je 2 ŕ 7 ŕ , 2 cín = — I x dx = 2 I x dx = —. 2j-i Jo 3 Celá řada dávající periodické rozšíření x2 z intervalu [—1, 1] je tedy /(*) 1 A l 4 ^ COS(7Tř2x). h = l Z Weierstrassova kritéria je přímo zřejmé, že tato řada konverguje stejnoměrně a tedy bude f(x) spojitá. Z Věty 7.8 ale už víme, že ve skutečnosti je f(x) = x2 na celém intervalu [—l, l], protože aproximujeme spojitou funkci na celém M a konvergence musí být stejnoměrná. Aproximuje tedy naše řada funkci x2 na intervalu [0, l] výrazně lépe, než bychom to uměli s periodickým rošírením dané funkce jen z tohoto intervalu. Pojďme ale v našich ilustracích dále. Díky stejnoměrné konvergenci můžeme využít věty o derivování a integrování řad člen po členu a spočítat Fourierovy řady pro funkce x a x3. Jednodušší bude derivování: 1 9 , 2 ^ (-l)"+l -(x ) = x = — > -sm(7r«x). 2 7T n n = l Tato řada už evidentně nemůže konvergovat stejnoměrně, protože periodické rozšíření funkce x není spojitou funkcí. kterou jsme vypočítali pro funkci g(x) = |x|,x e [—it,it). Protože je tato funkce spojitá na [—jt, 7t) a | — 7T | = 17T |, víme, že dokonce platí jt _ 4- ^ cos([2«-l]:t) n = l Dosazení x = 0 nám dává 00 1 _ tcí 0 — i - 4 V _i_ ti T _ä_ — U 2 n ^ (2«-l)2' J" ^ (2«-l)2 8 • n — 1 n — 1 □ 7.17. Sečtěte řady V J- V ^ «4' ^ «4 n — 1 n — 1 Solution. Nejdříve připomeňme, že součty řad t—1 nl 6 ' ^—' nl n — 1 n — 1 12 jsme určili už dříve. V této úloze naznačíme, jakým způsobem lze postupovat při počítaní součtů řad X „2* * Z n — 1 n—1 pro obecné & e N. Využijeme identit (7.11) (7.12) x2 = - 3 (-i)" Zsm (nx) -—, x e (0, 2tt), « = 1 47T ^—, cos (nx) ^—, sin (nx) + 4X—~2~^~4jt^l- • ^6(0,2^-), «=1 «=1 n které vyplývají z konstrukcí Fourierových řad postupně pro funkce g(x) = x a g(x) = x2 na intervalu [0, 2jt). Podle (||7.11||) je 00 n = l " Dosazením do (||7.12||) získáme cos(nx) _ 3jt2-6jTJt+2jr2 Z „2 « = 1 12 x e (0, 27T). Pouhé dosazení pak dokáže platnost tohoto vztahu také v krajních bodech x = 0, x = 27T. Řada na levé straně má zjevně majo-rantu X^Li ^z> a proto konverguje absolutně a stejnoměrně na [0, 2jz~\. Můžeme ji tak integrovat člen po členu: 00 Zsminx) «3 n = l Z n = l sin(ny) „3 IH^dy 0 n = l 2_ŕ„„j_^2 . ..3 ^_..2,9^2, = J 3^-6^+2^ Jy = ,3_W+27r2, ^ Jce[0j2jr]_ 0 Upozorněme, že ve skutečnosti lze člen po členu integrovat každou Fourierovu řadu. Analogicky dalším integrováním obdržíme 419 B. FOURIEROVY ŘADY 1. FOURIEROVY ŘADY Z n = l 1—cos (ha;) Z n = l x /■ o COs(ř7j) „4 12 AT CO = /Z2f22^ 0 n = l dy = ^™W*2 ^ x e [0> 2jr]_ Dosazení x = 7T vede na v i+(-i)«+i Ľ «4 «=1 Z «=1 1— cosQítt) _ jr_ «4 — 48 ■ S přihlédnutím k tomu, že čitatel na levé straně je nulový pro sudá n a je roven 2 pro lichá n, lze obdrženou řadu zapsat jako (7.13) Z vyjádření Z «=1 7T (2n - l)4 48 «=1 pak plyne Z „4 Z (2„)4 + Z (2«-l)4 « = 1 « = 1 iyi + y_i_ 16 ^ «4 ^ ^ (2«-l)4 Z n = l 16 _ 15 ^ (2«-l)4 Z n = l « = 1 16 1 / 15 ' 2 ' 48 « = 1 __ 90 ' čímž jsme sečetli první řadu. Součet druhé je v_i__v _j_ = v_ä ^ (2«-l)4 ^ (2«)4 ^ (2«- l)4 S „4 16 ^ «4 « = 1 1 ji* 1 jt* 7jt4 2 48 16 90 720 - Jak jsme řekli, obdobně lze postupovat při sčítání řad co co , V — v {~l> / ■ n2k ' / ■ n2k pro další k e N. Je proto přirozené ptát se např. na součet řady Z^Li 7^3- O nalezení jejího součtu se však matematikové marně pokoušejí (bez přehánění) už celá staletí. To může čtenáře oprávněně překvapit, neboť naznačený postup bychom měli být schopni provést i pro všechny liché mocniny. Můžeme třeba vyjít z identity cos(nx) Zcos(ř n « = 1 -ln (2sin|) , x e (0, 2tt), kterou lze mimochodem opět dokázat tím, že funkci na pravé straně rozvineme do Fourierovy řady. Kdybychom stejně jako výše dvakrát integrovali člen po členu řadu na levé straně a v limitě dosadili x -» 0+, získali bychom právě řadu Z^Li ^3 ■ Mělo by tedy stačit dvojí integrování funkce na pravé straně a výpočet jedné limity. Integrování pravé strany ovšem vede na tzv. vyšší funkci, kterou není možné běžným způsobem vyjádřit pomocí funkcí elementárních, s nimiž pracujeme. □ 7.18. Pomocí Parsevalovy rovnosti pro Fourierův ortogonální systém ověřte, že Z n = l 1 (2«-l)4 96 • Funkce ((p) = "žlnLl se nazývá Riemannova zeta funkce. Docela snadno lze ale přímo odvodit, že bodově konvergovat bude (viz. naše úvahy o alternujících řadách v ??), proto jsme skutečně dostali rovnost (viz. Věta ??). Obdobně můžeme člen po členu integrovat a dostaneme 1 2 4 ^ (-1)" -x H--- y —-— sin(7T«x) n = \ a výslednou Fourierovu řadu dostaneme dosazením za x z předchozí rovnosti. 7.11. Obecné Fourierovy řady a wavelety. V případě obecného ortogonálního systému funkcí /„ a z něj vytvářených řad se často hovoří o obecných Fourierových řadách vzhledem k ortogonálnímu systému funkcí /„. Fourierovy řady a další z nich vycházející nástroje jsou využívány ke zpracování různých signálů, obrázků apod. Povaha použitých periodických goniometrických funkcí v klasických Fourierových řadách a jejich prosté škálování pomocí zvětšující se frekvence zároveň omezují jejich použitelnost. V mnoha oblastech aplikací proto vyvstala přirozená potřeba nalézt šikovnější úplné ortogonální systémy funkcí, které budou vycházet z předpokládané povahy dat a které bude možné efektivněji zpracovávat. Obvyklým požadavkem pro rychlá numerická zpracování bývá rychlá škálovatelnost měřítek a možnost snadného posuvu o konstantní hodnoty. V takový systém lze například doufat, jestliže zvolíme vhodnou spojitou funkci ý s kompaktním nosičem, ze které sestrojíme spočetně mnoho funkcí Ýjk, j, k e Z, pomocí translací a dilatací: Ýjk(x)=2j/2Ý(2jx-k). Pokud zároveň vyhovíme dvěma podmínkám: • tvar mateřské funkce ý dobře vystihuje možné chování dat, • její potomci Ýjk tvoří úplný ortogonální systém, pak nejspíš bude dobře stačit k aproximaci konkrétního zpracovávaného signálu jen několika málo funkcí. Hovoříme o tzv. waveletech. Nemáme zde prostor pro podrobnosti, jde o mimořádně živý směr výzkumu i základ komerčních aplikací. Zájemce snadno najde spoustu literatury. Poznamenejme však, že ve skutečnosti se velmi často používají pouze diskrétní verze našich objektů, tzn. hodnoty všech funkcí Ýjk jsou pouze tabelovány v diskrétní (hodně velké) množině bodů a jsou v tomto smyslu i ortogonální. Dobrým příkladem jsou standardy JPEG2000, které tuto techniku používají a jsou nástrojem pro profesionální komprimaci obrazových dat ve filmovém průmyslu, nebo formát DjVu komprimace publikací. Jedny z prvních waveletů sestrojila Ingrid Daubechies. Na obrázku niže je tzv. Daubechies mateřská wavelet Z)4(x) a její dcera D4(2~3x — 1). 420 CHAPTER 7. SPOJITÉ MODELY 3 4 Průběh funkce D4 není popsán analytickým způsobem. Funkce je zadána pouze tabelovanými hodnotami pro konečnou (byť velmi velkou) množinu argumentů. Je zvolena tak, aby měla ve svých různých částech všechny vlastnosti, které jsou třeba pro grafická data potřebné — pomalý i rychlý růst, ostrý zlom v obou extrémech apod. Složitost konstrukce spočívá samozřejmě v tom, abychom skutečně dostali pomocí výše uvedené konstrukce ortogonální systém! 2. Metrické prostory V této části kapitoly se trochu abstraktněji zamyslíme nad pojmy vzdálenost a konvergence. Bude se nám to hodit v zápětí při důkazech již formulovaných výsledků o Fourierových řadách a v nejrůznějších kontextech se k těmto pojmům budeme vracet. Berme proto další stránky jako velmi užitečný (a snad ještě stále stravitelný) výlet do matematiky pro zdatné či odvážné. 7.12. Metriky a normy. Při odvozování techniky Fourierových řad jsme volně hovořili o (\. vzdálenosti na prostoru funkcí. Nyní se u ±11$ tohoto pojmu zastavíme pořádněji. Euklidovská vzdálenost ve vektorových prostorech W splňuje, stejně jako tomu bylo u naší L i-vzdálenosti d(f, g) = \\f — g\\ j na prostoru spojitých absolutně inte-grovatelných funkcích, následující tři abstraktní požadavky. Mějme v dalších odstavcích pořád na paměti tyto dva příklady. ' Axiomy metriky a normy Množina X spolu se zobrazením d : X x X -» splňující pro všechny prvky x, y, z £ X podmínky (7.2) d(x, y) > 0 a d(x, y) = 0, právě když x = y , (7.3) d(x,y) = d(y,x), (7.4) d(x,z) M na pravé straně a konstantou a > 0. Nechť je T > 0 primitivní perioda funkce / a nechť je na [—7/2, T/2] známa její Fourierova řada, tj. identita (7.15) f (x) Ao 2 +Z «=i 2itnx 2itnx An cos--h Bn sin- x e 7.19. Dokažte, že má-li rovnice (||7.14||) periodické řešení na M, pak perioda tohoto řešení musí být rovněž periodou funkce /. Dále dokažte, že rovnice (||7.14||) má právě jedno periodické řešení s periodou T právě tehdy, když je (7.16) a ^ 2nn pro každé n e N. Solution. Nechť j e funkce y = g(x), x eM. řešením rovnice (||7.14||) a má periodu p > 0. Aby bylo vůbec možné dosadit funkci g do diferenciální rovnice druhého řádu, musí existovat její druhá derivace g". Protože funkce g, g', g", ... mají stejnou periodu, také funkce g"(x)+a2g(x) = f(x) je periodická s periodou p. Jinak řečeno, funkce / je periodická jako lineární kombinace funkcí s periodou p. Tím jsme dokázali první tvrzení říkající, že p = IT pro jisté l e N. 421 B. FOURIEROVY ŘADY 2. METRICKÉ PROSTORY Nyní předpokládejme, že funkce y = g(x), x e M je periodickým řešením rovnice (||7.14||) s periodou Tas vyjádřením Fourierovou řadou (7.17) g(x) = — + ían cos (conx) + bn sin (conx)], x «=i kde co = 2jt/T. Vyhovuje-li g rovnici (||7.14||), musí mít tato funkce spojitou druhou derivaci na M. Platí tedy oo g'(x) = 22 [conbn cos (conx) — conan sin (conx)], x e M, n = l (7.18) oo g"(x) = [—ío2n2an cos ( {^«}«eN tehdy a jenom tehdy, když je -co2n2 + a2 = - i^f-f + a2 £ 0 pro každé n e N, tj. když platí (||7.16||). V tomto případě je jediné řešení (||7.14||) s periodou T určeno jediným řešením A*, ^ Bf, (7.21) an -, n e N -co2n2 + a2' " —co2n2 + a2, soustavy rovnic (||7.20||). Podotkněme, že jsme mlčky využili stejnoměrnou konvergenci řady v (||7.18||). Ta mj. vyplývá z hlubších výsledků obecné teorie Fourierových řad, kterým se však nebudeme podrobněji věnovat. □ 7.20. Pomocí řešení předchozí úlohy nalezněte všechna 2jt -periodická řešení diferenciální rovnice f +2y = Z sin(nx) x e «=i Solution. Rovnice je ve tvaru (||7.14||) pro a = \Í2 a spojitě diferencovatelnou funkci oo n = \ s primitivní periodou T = 2tx. Podle úlohy ||7.19|| podmínka V2 ^ N implikuje, že 2it -periodické řešení existuje právě jedno. Budeme-li jej hledat jako součet řady oo ^ + 22 ían cos (nx) + bn sin (nx)], x e M, h = l Je-li X vektorový prostor nad M a splňující : X i je funkce (7.5) ||jc|| > 0, přičemž ||x|| = 0, právě když x = 0 , (7.6) ||Ax|| = |A| ||x||, pro všechny skaláry k , (7.7) ||x + y|| < ||x|| + ||y||, pak funkci || || nazýváme norma na X a prostor X je normovaný vektorový prostor. Norma vždy zadává metriku d(x, ^^||^^^J^^^^J Na začátku předchozí části této kapitoly jsme tedy ve skutečnosti definovali vzdálenost funkcí pomocí tzv. L\-normy. V euklidovských vektorových prostorech pak šlo také o normu ||x||, která je indukována z bilineárního skalárního součinu vztahem ||x||2 = (x, x), a obdobně jsme pracovali s normou na prostorech unitárních. Úplně stejně jsme pak obdrželi na spojitých funkcích L2-normu. Samozřejmě metriky zadané normou mají velmi specifické vlastnosti, protože jejich chování lze na celém prostoru X odvodit z vlastností v libovolně malém okolí nulového prvku x = 0 e X. 7.13. Konvergence. Na zcela abstraktních metrických prostorech lze zavést pojem (blízkých) okolí jednotlivých prvků, konvergence posloupností prvků a související "topologické" pojmy prakticky úplně stejně, jako jsme to udělali pro reálná a komplexní čísla a jejich posloupnosti na začátku páté kapitoly, viz. 5.12-5.17. Můžme tyto odstavce skoro zkopírovat, jen u Věty 5.17 narazíme na výrazně složitější důkazy. Začneme konceptem konvergentních posloupností v metrickém prostoru X s metrikou d: -| Cauchyovské posloupnosti [ I Uvažme libovolnou posloupnost prvků x0, x\, ... v X takovou, že pro libolné pevně zvolené kladné reálné číslo e platí pro všechny dvojice prvků x;, x j posloupnosti, až na konečně mnoho výjimek (které závisí na volbě e), d(xi, Xj) < e. Jinak řečeno, pro každé pevné e > 0 existuje index yV takový, že předcházející nerovnost platí pro všechna i, j > N. Takové posloupnosti prvků se říká cauchyovská posloupnost. Stejně jako u reálných či komplexních čísel bychom rádi, aby každá cauchyovská posloupnost prvků x; e X konvergovala k nějaké hodnotě x v následujícím smyslu: | Konvergentní posloupnosti |_. Jestliže pro posloupnost prvků x0, x\, ... e X, pevně zvolený prvek x e X a pro libovolné kladné reálné číslo e platí pro všechna i, až na konečně mnoho výjimek (závisejících na volbě e), d(xi, x) < e, 422 CHAPTER 7. SPOJITÉ MODELY říkáme, že posloupnost x,■, i = 0, 1, ..., konverguje k prvku x, kterému říkáme limita posloupnosti x,■, í = 0, 1, ... v met-^ri^ém^o^toru^X^ Díky trojúhelníkové nerovnosti dostáváme pro každou dvojici prvků xt, x j z konvergentní posloupnosti, s dostatečně velikými indexy (značení jako v definici výše), d(xi, x j) < d(xi, x) + d(x, x j) < 2e, a proto je každá konvergentní posloupnost také cauchyovská. Metrické prostory, kde platí i obrácené tvrzení, tj. že každá cauchyovská posloupnost je konvergentní nazýváme úplné metrické prostory. 7.14. Topologie, konvergence a spojitost. Stejně jako v případě reálných čísel můžeme zformulovat konvergenci pomocí "otevřených okolí". I„«»«J Otevřené a uzavřené množiny | Otevřené e-okolí prvku x v metrickém prostoru X (stručně e-okolí) je množina 0€{x) = {y eX; d(x, y) < e}. Podmnožina U C X je otevřená, jestliže obsahuje s každým svým bodem i nějaké jeho e-okolí. Pomnožina W C X je |j^zovj^^ doplněk X\W otevřenou množinou. Namísto e-okolí hovoříme také o (otevřené) e-kouli se středem v x. v případě normovaného prostoru si vystačíme s e-koulemi se středem v nule, jejichž přičtením k danému prvku x dostaneme právě jeho e-okolí. Hromadné body podmnožiny A c X opět definujeme jako takové prvky x e X, ke kterým konverguje nějaká posloupnost bodů z A neobsahující samotný bod x. Snadno uvidíme, že množina je uzavřená, právě když obsahuje všechny své hromadné body: Skutečně, přímo z definice plyne, že množina A je uzavřená, právě když pro každý bod x 4i A existuje nějaké e > 0 takové, že celé e-okolí 0€(x) má s A prázdný průnik. Pokud by tedy A byla uzavřená a x byl hromadný bod množiny A, který do A nepatří, pak jistě v libovolném takovém e-okolí takového x leží nekonečně mnoho bodů množiny A, což je spor. Naopak předpokládejme, že A obsahuje všechny své hromadné body a uvažme x e X \ A. Pokud by v každém e-okolí bodu x existoval bod x€ e A, pak postupně volbami e = l/n dostaneme posloupnost bodů xn e A konvergující k x. Pak by ovšem x musel být hromadným bodem, a tedy v A, takže opět máme spor. Pro každou podmnožinu A v metrickém prostoru X definujeme její vnitřek jako množinu těch bodů v A, které do A patří i s celým svým nějakým okolím. Dále definujeme uzávěr Ä množiny A jako sjednocení původní množiny A s množinou všech jejích hromadných bodů. víme navíc, že platí (viz (||7.19||) a (||7.21||)) a0 = a„ = 0, b„ = „2(21_„2). n eN. Zadaná rovnice má tedy jediné 2it-periodické řešení oo y=2Zf^ry xeR. n = \ V ; □ C. Metrické prostory 7.21. Ukažte, že definice metriky jakožto funkce d definované na X x X, pro neprázdnou množinu X splňující (7.22) d(x, y) = 0, právě když x = y, x, y e X, (7.23) d(x,z) 0, x, y e X, (7.25) d(x, y) = d(y, x), x, y € X. Položíme-li však x = z v (||7.23||), z (||7.22||) dostaneme (||7.24||). Podobně z volby y = z v (||7.23||) spoužitím (||7.22||) plyne í/(jc, y) < d(y, x) pro všechny body x, y e X. Záměnou proměnných x ay dále obdržíme d(y, x) < d(x, y), tj. (||7.25||). Dokázali jsme, že definice jsou ekvivalentní. v literatuře lze nalézt i další ekvivalentní způsoby pro zavedení metrik. Stejně tak lze dohledat mnoho mírně odlišných definic, které ovšem vedou na jiné objekty než metriky (nejdůležitější mezi nimi jsou pseudometriky, ultrametriky a semimetriky). První axiomatickou definici "tradiční" metriky pak vyslovil Maurice Fréchet v roce 1906. Název metrika pochází ale od Felixe Hausdorffa, který tento pojem poprvé použil ve své práci z roku 1914. □ 7.22. Uvažujte množinu všech podmnožin libovolné konečné množiny a rozhodněte, zda je zobrazení pro všechny uvažované podmnožiny X, Y definované vztahem (a) di(X, Y) := | (X U Y) \ (X f) Y) |; (b) d2(X, Y) := (XU^u^ny) 1, X U Y ŕ 0, d2(0, 0) := 0 metrikou. (Symbolem | X \ se rozumí počet prvků množiny X.) Solution. v konkrétních úlohách o rozhodnutí, zda je nějaké zobrazení metrikou, budeme ověřování prvních dvou podmínek z definice metriky vynechávat. Čtenář by si měl sám hned uvědomit, že jsou splněny pro d\ i d2. Omezíme se tedy pouze na rozbor trojúhelníkové nerovnosti. Případ (a). Pro libovolné množiny X, Y, Z platí (7.26) (xuz)\(inz)c [(x u Y) \ (x n Y)] u [(Y u z) \ (ľ n Z)]. Pokud totiž x e (XUZ)\(Xr\Z), pak nastává právě jedna z možností x e X a současně x £ Z, x 4i X a současně x e Z. Má tak smysl zvažovat tyto 4 možnosti 423 C. METRICKÉ PROSTORY 2. METRICKÉ PROSTORY x s X, x g Z, x € Y, x € X, x g Z, x g Y, x £ X, x e Z, x e Y, x £ X, x e Z, x £ Y, které mohou nastat pro x e (X U Z) \ (X n Z). Ve všech těchto 4 případech je však x prvkem právě jedné z množin (X U ľ) \ (I íl ľ), (ľ U Z) \ (ľ íl Z). Tím jsme obdrželi inkluzi (||7.26||), z níž ihned plyne požadovaná trojúhelníková nerovnost di(X, Z) = | (X U Z) \ (X n Z) | < I [(X u F) \ (X n F)] u [(Y uz)\(ľnz)]|< I (x u ľ) \ (x n ľ) | +1 (ľ u z) \ (ľ n z) | = dr(X, Y)+dl(Y, Z). Případ (b). Lze postupovat podobně jako pro d\. Symbolem X' budeme označovat doplněk (komplement) množiny X. Z rovností (X U Y) \ (X n Y) = (X n Y' n Z) u (X n Y' n z') u(X'nľnz)u(X'nľn z'), (ľ u Z) \ (ľ n Z) = (X n f n z') u (X n F' n Z) u (X' n y n z') u (X' n F' n Z), [(x u z) \ (x n Z)] u [ľ \ (x u Z)] = (xnF nz')u(xnF' nz')u(X'nY nz)u(X' nr nz)u(X' nF nz'), které lze opět snadno dokázat výčtem možností, plyne zesílení (||7.26||) ve tvaru [(x u z) \ (x n Z)] u [F \ (x u Z)] c [(X u ľ) \ (X n F)] u [(F u Z) \ (ľ n Z)]. Dále využijeme nerovnost (mz)x(inz) < [(iuz)\(inz)]u[ľ\(iuz)] y [ \ 7 -L (A XUZ — XUZU[ľ\(XUZ)] ' -f— yJ• Ta je založena pouze na počítání s nezápornými čísly, neboť obecně platí f < fg, y>0, z>0, xe[0,z]. Ze zřejmého vztahu XUZU[ľ\(XUZ)]=XUľUZ tak již dostáváme d2(X, Z) = (xuzMxnz) < (xuz)x(xnz) XUZ [(xuy)x.(xny)]u[(yuz)x.(ynz)] [(iuz)\(inz)]u[ľ\(iuz)] XUZU[ľ\(IUZ)] — (xuy)x(xny) |+| (juz)^(jnz) XUYUZ (xuy)x(xny) + (yuz)x,(ynz) xuyuz| — d2(X,Y) + d2(Y, Z), Z = 0 nebo F = 0 je však xuy| 1 yuz pokud X U Z ^ 0 a ľ ^ 0. Pro X očividně trojúhelníková nerovnost splněna také. V obou případech se tudíž jedná o metriky. Metrika d\ má spíše pomocný charakter a nelze říci, že by měla tak široké uplatnění jako d2, kterou lze dohledat v literatuře pod názvem Jaccardova metrika. Pojmenována byla podle biologa Paula Jaccarda, který v roce 1908 pomocí funkce 1 — d2 účinně vystihl míru podobnosti mezi hmyzími populacemi. □ 7.23. Nechť je d(x, y) \- x-y x, y e 1 + 1 x-y Dokažte, že d je metrika na M. Solution. Opět dokážeme jenom trojúhelníkovou nerovnost (ostatní je zřejmé). Zaveďme pomocnou rostoucí funkci (7.27) f(t) := j^-j, t > 0. Snadno jako u reálných čísel ověříme, že libovolný průnik a libovolné konečné sjednocení uzavřených množin v metrickém prostoru je opět uzavřená množina. U otevřených množin je to opět naopak: libovolné sjednocení oteřených množin je opět otevřená množina, ale jen konečný průnik otevřených množin je obecně opět otevřená množina. Dokažte si obě tvrzení podrobně sami! Sami si také podrobně ověřte, že vnitřek množiny A je právě sjednocením všech otevřených množin v A obsažených, zatímco uzávěr A je průnikem všech uzavřených množin obsahujících A. Uzavřené a otevřené množiny představují základní pojmy tzv. topologie. Aniž bychom zacházeli do hlubších podrobností a souvislostí, seznámili jsme se právě s topologií metrických prostorů. Pojem konvergence můžeme nyní zformulovat tak, že posloupnost prvků x; v metrickém prostoru X, i = 0, 1, ..., konverguje k x e X, právě když pro každou otevřenou množinu U obsahující x jsou všechny body naší posloupnosti, až na konečně mnoho výjimek, obsaženy v U. Stejně jako u reálných čísel můžeme také definovat spojitá zobrazení mezi metrickými prostory: Zobrazení / : W -> Z je spojité jestliže vzor f~l(V) každé otevřené množiny ľ C Zje otevřená množina ve W. Samořejmě to neznamená nic jiného než tvrzení, že pro každý prvek z = f(x) e Z a kladné číslo e existuje kladné číslo 8 tak, že pro všechny prvky y e W se vzdáleností dw(x, y) < 8 je také dz(z, f(y)) < e. Zcela stejně jako u reálných funkcí je zobrazení / mezi metrickými prostory spojité právě tehdy, když respektuje konvergence posloupností. 7.15. Lp-normy. Nyní máme k dispozici obecné nástroje, se kterými se můžeme podívat na příklady metrických prostorů tvořených konečněrozměrnými vektory nebo funkcemi. Omezíme se na obzvlášť užitečnou ' třídu norem. Začneme na reálných nebo komplexních konečně-rozměrných vektorových prostorech W a C" a definujeme pro pevné reálné číslo p > 1 a libovolný vektor Z = (Zl, ■ ■ ■ , z„) (I>IP) 1/p Dokážeme, že takto je definována norma. První dvě vlastnosti z definice jsou zřejmé. Zbývá dokázat trojúhelníkovou nerovnost. Vyjdeme přitom z tzv. Hôlderovy nerovnosti: Lemma. Pro pevné reálné číslo p > 1 a každé dvě n—tice nezáporných reálných čísel x;- a y i platí n / « \ 1/p / « \ Z—(Z-<) (Z>) 1/q kde \/q = \ — 1/p. 424 CHAPTER 7. SPOJITÉ MODELY Proor Označme si X a Y výrazy v součinu na pravé \. straně dokazované nerovnosti. Pokud jsou 3^, všechna čísla x;- nebo všechna yt nulová, pak tvrzení platí. Předpokládejme tedy X ^ Oa Y ŕ 0. Hôlderova nerovnost je užitečným přímým důsledkem konvexity exponenciální funkce. Definujme čísla vk a wk tak, aby platilo xk = X e Vk/P Protože 1/p + l/q = 1, můžeme uvažovat afinní kombinaci hodnot -vk + -wk a díky konvexitě exponenciály dostáváme p q Qvk/p+wk/q < J. £»i , 1 &wk — p q Odtud již přímo dopočítáme J¥Xkyk-^)P+1q{j)q a sečtením přes k = 1, . . . , n 1 ~XY ^ 1 qYP ^ 1 pXf i — l i — l i — l Na pravé straně ovšem jednotlivé sumy dávají právě Xp a Yq a celý výraz je tedy roven 1 /'p + 1/q = 1. Vynásobením této nerovnosti číslem XY dostáváme právě dokazovanou nerovnost. □ Teď už budeme umět dokázat, že || || je skutečně norma: _j MlNKOWSKÉHO NEROVNOST [ ^ i Pro každé p > 1 a všechny «-tice nezáporných reálných čísel (xi, ..., x„) a (ji, ..., y„) platí K ověření této praktické nerovnosti vede následující trik využívající Hólderovu nerovnost. Jistě platí (všimněme si, že P > 1) "ZMxt+ytV-1 < (Z*?) ■ľZto+y'P-1*) í=i \-=i ^ \-=i ' l/q i = l a stejně tak l/q n / " \ l/> / " \ Z^+y,)'-1 < (Z^í) •(Z^+^(p"1)9) Nyní sečtením posledních dvou nerovností, s využitím skutečnosti, že p + q = pq a tedy (/? — l)g = pq — q = p, dostaneme < 1/9 (\ i/P / " \ J z* (X ) ale 1 — l/q = l/p, takže jde právě o dokazovanou Minkowského nerovnost. Skutečnost, že / je rostoucí, ani není třeba ověřovat výpočtem první derivace. Stačí úvaha nebo jednoduchá úprava m - / W = TÍ7 - TT7 = > 0. s>r>0. Platí proto d{x, z) x-z x-y+y-z 1+1 x-z, x-y__|_ _ < x-y + y-z 1 + 1 x-y+y-z I — 1 + 1 x-y | + | y-z,\ y-z < x-y , y-z i+ly-z 1 + 1 x-y l + l y-z I 1 + 1 x-y | + | y-z | — 1 + | x-y d(x, y) + d(y, z), x, y, z e I □ 7.24. Určete vzdálenost funkcí /(*) = = vT+í2"' x e [1,2] jako prvků normovaného vektorového prostoru 5[1,2] spojitých funkcí na intervalu [1,2] s normou (a) ll/lli = fi\f(x)\dx; (b) H/ll^ = max{|/(x)|; x s [1,2]}. Solution. Případ (a). Stačí vypočítat ■■ dx = 2 2 f\f(x)-g(x) \ dx = fx + 1 1 n+x2 + VTT7 n 2 § + VŠ - V2. Případ (b). Nyní chceme určit max | f{x) - gix) | = max (x + -7=) - *e[l,2] *e[l,2] V Vl+x2/ Při hledání extrémů funkcí je velmi silným a účinným nástrojem jejich derivování. Ihned z nerovnosti 1 + >0, iě[1,2] vidíme, že max (x + -7=r) jce[l,2] V -Jl+x2J 2 + 2 -2 + ^- 71+^ ~ + VŠ" Rostoucí funkce na uzavřeném intervalu totiž nabývá své maximální hodnoty v jeho pravém krajním bodě. □ 7.25. Zjistěte, jestli je posloupnost {x„}„eN, kde xx = 1, xn = 1 + \ + • • • + i, n e N \ {1}, cauchyovská v M. Uvažujte nejprve běžnou metriku danou rozdílem v absolutní hodnotě (tj. indukovanou normou, kterou je absolutní hodnota) a poté metriku d(x, y) := lif^, x, y e M. Solution. Připomeňme, že (7.28) Z 1 = °°' lJ- Platí tak CX) 1 k—m lim I x Z k—m + l 00, m e N. 00, m e N. 425 C. METRICKÉ PROSTORY 2. METRICKÉ PROSTORY Odsud je vidět, že posloupnost {xn} nemůže být cauchyovská. Nalezli jsme odpověďpro běžnou metriku. Mohli jsme však hned využít toho, že posloupnost {xn} není podle (||7.28||) konvergentní, a vzpomenout si, že se nacházíme v úplném metrickém prostoru, kde cauchyovské a konvergentní posloupnosti splývají. Pro metriku d si stačí uvědomit, že zobrazení / zavedené v (||7.27||) je spojitou bijekcí mezi množinami [0, oo) a [0,1) s vlastností, že /(O) = 0. Libovolná posloupnost je tak konvergentní "v původním významu", právě když konverguje v metrickém prostoru M s metrikou d. Stejně tak platí, že posloupnost je cauchyovská v M vzhledem k běžné metrice právě tehdy, když je cauchyovská vzhledem k d. □ 7.26. Je metrický prostor 1; (b) ||/||M=max{|/(*)|;*e[-l,l]} úplný? Solution. Případ (a). Pro každé n e N definujme funkci fn(x) = 0, x e [-1,0), fn(x) = 1, x e [±, l], fn(x) = nx, x e [0, ±) . Takto získaná funkční posloupnost {/„}„£n C n, m, n e N. Zabývejme se případnou limitou posloupnosti {/„} v n(s). Spojitá funkce / proto musí splňovat f(x) = 0, x e [-1,0], f (x) = 1, x e [s, 1] pro libovolně malé s > 0. Tedy nutně f (x) = 0, x e [-1, 0], f (x) = 1, x e (0, 1]. Tato funkce však není spojitá na [—1, 1] - nepatří do uvažovaného metrického prostom. Posloupnost {/„} tak nemá limitu v 0 (chcete-li, ke každému s/2) existuje n (s) e N, pro které platí s (7.29) max | fm(x) - fn(x) | < -, m,n> n (s). *e[-l,l] 2 Zvláště tak pro každé x e [—1,1] dostáváme cauchyovskou číselnou posloupnost {/„(x)}„eN c M. Neboť metrický prostor M s běžnou metrikou je úplný, každá (pro x e [—1,1]) posloupnost {f„(x)} je konvergentní. Označme f (x) := lim f„(x), x e [-1, 1]. Ověřili jsme si tedy, že na každém konečněrozměrném reálném nebo komplexním vektorovém prostoru máme třídu norem || || pro všechna p > 1. Kromě toho ještě klademe max{ \zí 1, ,n což je zjevně také norma. Všimněme si, že Hólderovu nerovnost můžeme v kontextu těchto norem zapsat pro všechna x = (x\, ..., xn), y = (yu v„)jako pro všechna p > 1 a q splňující 1 /p + 1 /q p = 1 klademe q = oo. 1, přičemž pro 7.16. Lp-normy pro posloupnosti a funkce. Nyní docela snadno zavedeme normy i na vhodných nekonečněrozměrných vektorových prostorech. Začněme posloupnostmi. Vektorový prostor £p, p > 1, je množina všech posloupností reálných nebo komplexních posloupností x0, x\, ... takových, že < oo. Všechny posloupnosti s omezenými absolutními hodnotami členů tvoří prostor £00. Limitním přechodem pro n -> 00 okamžitě z Minkowského nerovnosti vidíme, že výraz (í>ľ) i/p je norma na íp. Obdobně klademe na íoo Hxlloo = sup{|x;|,/ = 0, 1,...} a opět dostáváme normu. Konečně, vraťme se k prostorům funkcí ^[a,b] na konečném intervalu [a, b] nebo 1 a pro všechny funkce v takovém prostoru funkcí existují Riemannovy integrály t-b \f(x)\pdx a můžeme tedy definovat b \ l/P \f(x)\pdx\ . Riemannův integrál jsme definovali pomocí limitního přechodu vycházejícího z tzv. Riemannových součtů, které odpovídají dělením H s reprezentanty V našem případě tedy jde o konečné součty i = \ 426 CHAPTER 7. SPOJITÉ MODELY Hólderova nerovnost použitá na Riemannovy součty součinu dvou funkcí fix) a. g(x) dá n YJ\f&)\\g(Ši)\(Xi-Xi-i) = i=\ n i=\ , n \l/p/» \ 1/9 přičemž napravo máme zjevně právě součin Riemannových součtů pro integrály a \\g\\q. Limitním přechodem tak ověřujeme tzv. Hôlderovu nerovnost pro integrály: f(x)8(x)dx < U f{Xy dx\ U g(xy dx\ platnou pro všechny nezáporné reálné funkce fugy našem prostoru po částech spojitých funkcí s kompaktním nosičem Přesně stejným postupem jako v předchozím odstavci odvodíme z Hólderovy nerovnosti nerovnost Minkowského v její integrální formě: Ip 1 (a pro p = 1 jsme tuto skutečnost ověřili už dávno). Pro celý prostor 5° [a, b] po částech spojitých funkcí budeme sice také slovo norma v tomto kontextu používat, měli bychom ale přitom vědět, že musíme ztotožňovat funkce, které se od sebe liší jen hodnotami v bodech nespojitosti. Mezi těmito normami je výjimečný případ p = 2, který jsme již dříve realizovali pomocí skalárního součinu. V tomto případě jsme mohli odvodit trojúhelníkovou nerovnost daleko jednodušeji pomocí Schwarzovy nerovnosti. Pro funkce z oov(||7.29||) obdržíme max | f{x) - f„ix) | < | < s, n> n(e). To ovšem znamená, že posloupnost {/„}„£n stejnoměrně konverguje k funkci / na [— 1, 1]. Jinak řečeno, {/„ }„eN konverguje k / vzhledem k zadané normě. Již dříve jsme navíc zjistili, že stejnoměrnou limitou spojitých funkcí je funkce spojitá. Díky tomu nemusíme dokazovat, že / e / ' První dvě vlastnosti metriky jsou očividně splněny. K dokázaní trojúhelníkové nerovnosti si stačí všimnout, že dim, n) e (1, 4/3], jeli m n. Stejně lehce lze najít všechny cauchyovské posloupnosti. Těmi jsou tzv. skorostacionární posloupnosti - od jistého indexu konstantní (konstantní až na konečně mnoho výjimek). Každá cauchy-ovská posloupnost je tedy konvergentní a uvažovaný prostor úplný. Zaveďme množiny A„ := [m e N; dim, n) < 1 + ^} , n e N. Neostrá nerovnost v jejich definici zaručuje, že se jedná o uzavřené množiny. Neboť A„ = {n,n + 1, ...}, (||7.30||) neplatí. Při vynechaní podmínky (||7.31||) by to znamenalo, že metrický prostor není úplný, což není pravda. Pro jistotu dodejme, že lim sup{úř(x, y); x, y e A„} = lim (l + 2« + l, 1^0. □ 7.28. Dokažte, že metrický prostor l2 je úplný. Solution. Uvažujme libovolnou cauchyovskou posloupnost {x„}„eN v prostoru l2. Každým členem této posloupnosti je ovšem zase posloupnost, tj. xn = {x^}«-eN, n e N. Poznamenejme, že samozřejmě nezáleží na rozsahu indexování - zda n, k e N, resp. n, k e N U {0}. Zaveďme pomocné posloupnosti yk pro JeN tak, že yk = {fk}nm = {4)„eN • 427 C. METRICKÉ PROSTORY 2. METRICKÉ PROSTORY Je-li {x„} cauchyovská v Z2, pak tím spíše musí být cauchyovská každá z posloupností yk v M (posloupnosti yk jsou posloupnostmi reálných čísel). z úplnosti M (vzhledem k běžné metrice) plyne, že všechny posloupnosti yk jsou konvergentní. Jejich limity označme jako zk, k e N. Stačí nám dokázat, že z = {zk}ken £ h a že posloupnost {xn} konverguje pro n -» oo v Z2 právě k posloupnosti z. Posloupnost {■*«}«eN C h je cauchyovská, a tak ke každému s > 0 existuje n(s) e N s vlastností, že Z [ŕm — x^)2 < s, m,n > «(e), m, n € N. Zvláště je X — -4) < e' m,n> n(s), m,n,l € N, yfc=l odkud limitním přechodem pro m -» oo lze obdržet ' 2 Z (z*-4) ^ e' « > «(e), «,Z e N, tj. (tentokráte Z -» oo) (7.32) ^(zk - xl)2 < s, n>n(s),neN. Speciálně máme a současné Ž (z*-4) < 00. n > n(e), n € N Z (-4)2 < 00> n e N, což plyne přímo z {x„}„eN c Z2. Protože k=\ Z(^-4) =Z z,2-2z,4 + (4)^ musí být n e N, Z z\ < 00. Tím jsme dokázali, že z e Z2- Skutečnost, že {xn} konverguje pro n -> 00 k z v Z2, vyplývá z (||7.32||). □ 7.29. V metrickém prostoru X2 mezi metrickými prostory s metrikami d\ a tZ2 řekneme, že je izometrie, jestliže pro všechny prvky x,y e X platí tZ2( Xi a í2 : X -> X2 do dvou zúplnění prostoru X a pišme d, di a d2 pro příslušné metriky. Evidentně je na husté podmnožině Li(X) c Xi dobře definované zobrazení cp : tl(X) T1 X X 2 • Jeho obrazem je hustá podmnožina i2(X) C X2 a toto zobrazení je navíc zjevně izometrií. Stejně tak funguje i opačné zobrazení ti o u1. 428 CHAPTER 7. SPOJITÉ MODELY Každé izometrické zobrazení samozřejmě zobrazuje cauchyovské posloupnosti na cauchyovské posloupnosti. Zároveň budou takové cauchyovské posloupnosti konvergovat ke stejnému prvku v zúplnění právě, když totéž bude platit o jejich obrazech v izometrii 0 tak existuje n (e) e N splňující 2' Y £=h(e) + 1 Z každého z intervalu [—1/«, 1/«] pro n e {1, ..., n (s)} můžeme vybrat konečně mnoho bodů x" , ..., xnm{n) tak, aby pro libovolné x e [-l/n, 1/n] bylo mm j'e{l,...,m(«)) /5" Uvažujme takové posloupnosti {y„ }„eN z Z2, jejichž členy s indexy n > n(s) jsou nulové a současně platí yi e {*},..., x^(1)} , ..., y„(E) e jx"(e), ..., x^^ J . Všech takových posloupností je konečně mnoho a tvoří e-síť pro A, neboť 5 + 52 ^ 5"W + 2 < £ ' V 1-i " ' 2 7^t-1+ S. Libovolnost s > 0 potom implikuje, že množina A je totálně omezená, což již dává její kompaktnost. Rozhodnout o kompaktnosti množiny B je velmi snadné. Každá kompaktní množina totiž musí být uzavřená, a to množina B není. Jejím uzávěrem je B = {{x„}„m e Zoo; | x„ | < \, n e N} . Množina B pak je kompaktní. Důkaz je výrazně jednodušší než pro množinu A, a proto jej přenecháváme čtenáři jako cvičení. D. Integrální operátory Konvoluce je jedním z nástrojů k vyhlazování funkcí: 7.32. Určete konvoluci f\ * f2, kde 1 — pro i / O x x pro x e [0, 1] □ /iW Í2ÍX) 0 Solution. Hodnota konvoluce v bodě ř je dána integrálem fToo /íWAí' — x) áx. Integrovaná funkce je nenulová pokud je druhý z činitelů nenulový, tedy pokud (t — x) e [—1,1], tj. x e [ŕ — 1, ř + 1]. Hodnotu konvoluce v bodě t tak můžeme interpretovat jako integrální průměr funkce f\ přes interval (ř — 1, ř + 1). Při integrování přes tento interval musíme rozlišit, náleží-li číslo 0 tomuto intervalu, či nikoliv. V případě, že interval nulu obsahuje, tak musíme integrál rozdělit na dva nevlastní integrály. Hodnotu menšího z nich však můžeme odečíst díky lichosti funkce i, a zbude nám integrál f'^ -\_ dx (rozmyslete si, že předpis funguje i pro záporné i). Dostáváme tak: fl * Í2(t) rt+l 1 Jí—1 x rl+t l Jl-t x dx dx ln|{±i| pro t e (—oo, —1] U [1, oo], pro t e [-1, 1]. dostaneme snadno: ď(x, i) = lim d(Xi, zí) < lim d(Xi, y i) + lim tZ(y;-, zi) = d(x, y) + íZ(y, z). Zjevně je také zúžení právě zadefinované metriky d na původní prostor X shodný s původní metrikou, protože původní body jsou reprezentovány konstatními posloupnostmi. Zbývá nám ještě dokázat hustota X v X a úplnost nově zkonstruovaného metrického prostoru. Chceme tedy dokázat, že pro pevně vybranou cauchyovskou posloupnost x = {xí} vždy ke každému sebemenšímu e > 0 najdeme v původním prostoru nějaké y takové, že vzdálenost konstatní posloupnosti prvků y od zvolené posloupnosti x; nebude větší než e. Protože je však posloupnost x; cauchyovská, budou všechny dvojice x„, xm jejích členů sobě blíže než o e pro dostatečně veliké indexy man. Pak ale nutně také výběrem y = x„ pro jeden takový index budou již sobě prvky y a xm blíže než o e a tedy i v limitě bude platit, že d(ý, x) < e. Závěrem je tedy ještě třeba ukázat, že cauchyovské posloupnosti bodů rozšířeného prostoru X vzhledem k metrice d jsou už nutně konvergentní. Jinak řečeno, chceme ukázat, že opakováním předchozí konstrukce již nedostaneme nové body. To uděláme tak, že budeme umět postupně body cauchyovské posloupnosti xk přiblížit body yk z původního prostoru X tak, aby výsledná posloupnost y = {y;} byla limitou původní posloupnosti vzhledem k metrice d. Protože již víme, že je X v X hustou podmnožinou, můžeme pro každý prvek xk z naší dané posloupnosti vybrat prvek z,k £ X tak, aby pro konstantní posloupnost žk platilo d(xk,ž,k) < l/k- Uvažme nyní posloupnost ž = {zo, z,i, ■ ■ ■}■ Původní posloupnost x je cauchyovská, tj. pro pevně zvolené číslo e > 0 najdeme index n(e) takový, že íZ(x„, xm) < e/2, kdykoliv budou m i n větší než n(e). Bez obav můžeme přitom předpokládat, že námi zvolený index n(e) je větší nebo roven číslu 4/e. Nyní dostáváme pro m i n větší než n (e): d(Zm, Zn) — d(Zm> Zn) — d(Zm> xm) -\- d(xm, xn) -\- d(xn, Zn) < l/m+e/2 + l/n < 2C- + ^ □ Jde tedy o cauchyovskou posloupnost zí prvků v X a tedy ž ě X. Zkoumejme, zda vzdálenost d(xn, z) skutečně jde k nule, jak jsme se snažili konstrukcí zajistit. Z trojúhelníkové nerovnosti ď(z,x„) < ď(z,z„) + ď(z„,x„). 430 CHAPTER 7. SPOJITÉ MODELY Podle našich předchozích odhadu ale jdou oba sčítanci napravo k nule a tím je důkaz ukončen. □ V dalších třech odstavcích si uvedeme tři docela jednoduché věty o úplných metrických prostorech, které mají spoustu důležitých aplikací jak v samotné matematické analýze, tak v ověřování konvergence numerických metod. 7.19. Banachova věta o kontrakci. Zobrazení F : X -» X na metrickém prostoru X s metrikou d se _ nazývá kontrahující zobrazení, jestliže pro nějakou reálnou konstantu 0 < C < 1 a všechny prvky x, y v X platí d(F(x), F(y)) < Cd(x,y). Theorem. Je-li F kontrahující zobrazení na úplném metrickém prostoru X, pak existuje jeho pevný bod z € X, tj. F(z) = z. Proof. Důkaz docela přímočaře sleduje intuitivní představy, že když je zobrazení kontrahující, mělo by se jeho iterované působení na nějaké počáteční hodnotě z0 £ X "hromadit" k nějakému bodu. K tomu pochopitelně potřebujeme úplnost, jinak by limitní bod už nemusel v X existovat. Zvolme tedy libovolné z0 ^ X a uvažme posloupnost zi, i =0, 1,... z\ = F(zo), Z2 = F(zi), Zi+i = F(zí), ... Podle předpokladů platí d(zi+i,Zi) =d(F(zi),F(zi-i)) < Cd(Zi,Zi-i) <■■■< Čd(zi,z0). Z trojúhelníkové nerovnosti pak pro všechna přirozená čísla j dostáváme d(Zi+j,Zi) < y^:d(zi+k, Zj+k-i) k=l j < Y, Ci+k~l d(zi, zo) = C d(zi, zo) Z C C 0. Solution. Naším úkolem je vypočítat Hf)(o>) f t~a? &-imt dt. Derivování (podle oo) a poté užití metody per partes (pro F' -it &-at2, G = e~ioJt) dává (T(f)(oo))' J -it t~a? &-imt dt 4= ( lim f e~at ^2tc \ í^oo la -tt(t- li J2m \2at_^ -imt - lim f e t^.-^ 2a -at2 - I i(-io)) „-at2 2a e~at e~,Cút dt 2a e~aŕ - f lim e~at - ľ f e~at e~imt dt 2a t^_0o J 2a — oo (7b e~Ímtdt) =-5»)- 0 7.20. Cantorova věta o průniku. Pro libovolnou množinu A v metrickém prostoru X s metrikou d nazýváme reálné číslo diam A sup d(x, y) x,yeA průměrem množiny A. O množině A říkáme, že je omezená, jestliže diam A < oo. Theorem. Je-li A\ D A2 D ■ ■ ■ D A; D ... neklesající řetězec neprázdných uzavřených podmnožin v úplném metrickém prostoru X a diam A; —> 0, pak existuje právě jeden bod x e X patřící do průniku všech Ai. Proof. Vyberme z každé množiny A; jeden bod zi- Protože diam Ai -> 0, můžeme pro sebemenší kladné e najít index n(e) tak, aby všechny A; s indexy i > n(e) už měly průměr menší než e. Pak ale nutně pro takto veliké indexy i, j bude také d(zi, Zj) < e a tedy je naše posloupnost cauchy-ovská. Bude proto mít limitní bod z e X, který pochopitelně musí být hromadným bodem všech A; a proto patří do všech Ai (když jsou všechny uzavřené) a tedy patří do jejich průniku. Dokázali jsme tedy existenci z, zbývá odůvodnit jednoznačnost. Předpokládejme tedy, že máme body z a y, oba v průniku všech A;. Jejich vzdálenost pak ale musí být menší než průměr všech A;, ten ale konverguje k nule. Tím je důkaz ukončen. □ 7.21. Theorem (Bairova věta). Je-li X úplný metrický prostor, pak průnik libovolného spočetného systému otevřených hustých množin A;- je množina hustá v metrickém prostoru X. Proof. Máme dán systém hustých a otevřených množin A{ v X, i = 1, 2..., a chceme ukázat, že množina A = □ n^Ai má s libovolnou otevřenou množinou U C X neprázdný průnik. Budeme postupovat induktivně s pomocí předchozí věty. Jistě existuje z\ e A\ n U, protože je ale množina A\ otevřená, patří bod z\ do tohoto průniku i s uzávěrem svého e\ okolí U\ pro dostatečně malé e\. Označme si uzávěr této či-koule U\ jako B\. Předpokládejme dále, že již jsou vybrány body zí a jejich otevřená e;-okolí U i pro i = 1, ..., n. Protože je množina An+\ otevřená a hustá v X, jistě existuje bod Zn+i £ A„+i n Ú„, protože je ale An+\ n U„ otevřená, = patří do ní bod z„+i i s dostatečně malým en+i okolím Un+\. Pak jistě také pro uzávěry platí 5„+1 = řŽ„+1 c Ú„ a tedy uzavřená množina 5„+1 je obsažena v An+\nř/„. Jistě přitom můžeme předpokládat i e„ < 1/n. Jestliže takto induktivně postupujeme od původního =bodu z,i a množiny B\, dostáváme neklesající posloupnost neprázdných uzavřených množin Bn, jejichž průměr jde k nule. Existuje tedy společný bod z všech těchto množin, tj. z e nZA = r\%xBi c n~!A„ n u, což jsme chtěli dokázat. □ 432 CHAPTER 7. SPOJITÉ MODELY 7.22. Ohraničené a kompaktní množiny. Pro reálná čísla se nám osvědčily následující pojmy, které nám ulehčovaly vyjadřování. Pro metrické prostory je můžeme převzít skoro beze změn: Vnitřním bodem podmnožiny A v metrickém prostoru je takový prvek, který do A patří i s nějakým svým e-okolím. Hraniční bod množiny A je takový prvek x e X, jehož každé okolí má neprázdný průnik jak s A tak s doplňkem X\A. Hraniční bod tedy může, ale nemusí patřit do samotné množiny A. Otevřené pokrytí množiny A je takový systém otevřených množin Ui C X, i e I, že jejich sjednocení obsahuje celé A. Izolovaným bodem množiny A rozumíme prvek a e A, který má v metrickém prostoru X e-okolí, jehož průnik s A je právě jednobodová množina {a}. Množina A prvků metrického prostoru se nazývá ohraničená nebo omezená, jestliže je její průměr konečný, tj. existuje kladné reálné číslo r takové, že d(x, y) < r pro všechny prvky x, y e A. V opačném případě je neohraničená nebo neomezená. Metrický prostor X se nazývá kompaktní, jestliže v něm má každá posloupnost x;- e X podposloupnost konvergující k nějakému bodu x e X. U reálných čísel jsme si uváděli několik charakterizací kompaktnosti. U metrických prostorů to je o něco složitější s pojmem ohraničenosti. Pro libovolné podmnožiny A, B c X v metrickém prostoru X s metrikou d definujeme vzdálenost Hledejme proto funkce y(co) = T(f)(co), které vyhovují diferenciální rovnici , co ^ 2a ^ y, tj- \dy dco, (7.33) Při zápisu y = dy/dco je dy___m díú 2a J1 lJ' y L*JJ 2a není-li funkce y rovna nule (zjevně y = 0 je řešením (||7.33||)). Integrováním dostáváme lnM = -fJ-ln|C|, tj. 3> = ±le-£, přičemž C e M\{0}. Zahrnutím nulového řešení tak můžeme vyjádřit všechna řešení diferenciální rovnice (||7.33||) jako funkce y(co) = Ke-i, řel. Doplňme určení konstanty K, pro niž získáváme právě T(f)(co). Později (v souvislosti s tzv. normálním rozdělením ve statistických metodách) se dozvíme, že no ^2 z čehož plyne J e x dx = y/jt, / e"^ dt = -j= / e"*2 dx-& — oo —co Platí proto T^'m = \h~fa=Wa asoučasně nf)(0) = Ke° = K. Celkem máme ^f^ = Wae~ □ dist(A,S)= sup {d(x, y)}. xeA,yeB Je-li A = {x} jednobodová množina, hovoříme o vzdálenosti dist(x, B) bodu od množiny. Řekneme, že je metrický prostor X totálně omezený, jestliže ke každému kladnému číslu e > 0 existuje konečná množina A taková, že distíx, A) < e pro všechny body x e X. Připomeňme, že metrický prostor je omezený, jestliže má celé X konečný průměr. Je okamžitě vidět, že totálně omezený prostor je také omezený. Skutečně, průměr konečné množiny je vždy konečný a jeli A množina z definice totální omezenosti příslušná k e, pak vzdálenost dvou bodů d(x, y) můžeme vždy shora odhadnout součtem distíx, A), dist(j, A) a diamA, což je konečné číslo. V případě metriky na podmožině konečněrozměrného euklidovského prostoru tyto pojmy splývají, neboť omezenost množiny zaručuje omezenost všech jednotlivých souřadnic v pevně vybrané ortonormální bázi a odtud již plyne i totální omezenost (ověřte si podrobně samostatně). Theorem. Následující podmínky na metrický prostor X jsou ekvivalentní 7.37. Stanovte funkci /, jejíž Fourierovou transformací je funkce f (co) = -±= 222, co^O. _1_ sin co Í2ŤŽ a> ' Solution. Inverzní Fourierova transformace dává co f{t) = f ÉSJH éM dco = ( 0 _L J j sinj» é<ůt da + fžzf émt dco -co 0 ) Jestliže použijeme substituci, kdy nahradíme —co za co v integrálu přes interval (—oo, 0], získáme fit) (oo oo \ / sšjží e~imt dco + fs^f émt dco ) o o / — / [cos (cot) — i sin (cot) + cos (cot) + i sin (cot) ] dco 2n I f ^ cos (cot) dco. o Poznamenejme, že předchozí vyjádření lze obdržet už z toho, že funkce y = s maximálním definičním oborem je sudá. Pomocí identity sinx • cos (xy) = j (sin [x(l + j)] + sin [x(l — j)]) , x, y e M, která mj. vyplývá ze součtových vzorců (pro sinus), dostáváme 433 D. INTEGRÁLNÍ OPERÁTORY 2. METRICKÉ PROSTORY (oo OO \ J sinMl+01 dú) + J sin[fl,(l-f)] ^ j 0 0 ^ / Substituce H = ffl(l + í),u = ffl(l-ř) potom dávají /oo oo \ fit) = ±[ [™±±du- fs-^dv) =0, t > 1; /(O (oo oo \ / ^ diť - / ^ ) =0, o o v / (oo oo \ oo ľ 䣻 rfK + f 2™ dv ) = ^ f ^ du, ju j v I n j u ' 0 0/0 (oo oo \ _ f Ě!Lídu + f ĚnJLdv\ =0, o o v / J_ 2jt ř e (-1,1); t < -1. Dokázali jsme tak, že funkce / je nulová pro 11 \ > la konstantní (nutně nenulová) pro 11 | < 1. (Po celou dobu předpokládáme, že inverzní Fourierova transformace existuje.) Určeme funkční hodnotu /(O). Pro funkci git) = \, m\ platí -1 o Odtud plyne, že /(O) = g(0)/2 = 1/2. Ještě vyzdvihněme vyčíslení integrálu oo f^-du = * Ju 2 ' 0 které jsme rovněž obdrželi. □ 7.38. Vyřešte integrální rovnici oo J" /(jc) sin (xř) dt = e~x, x > 0 o pro neznámou funkci /. Solution. Pokud obě strany rovnice vynásobíme číslem y/2/jt, obdržíme na levé straně právě sinovou Fourierovu transformaci. Stačí tedy aplikovat na rovnici inverzní transformaci. Takto dostaneme oo f{t) = 1 J e"x sin(xř) dx, t > 0. o Dvojnásobným použitím metody per partes pak lze spočítat J e~x sin (xř) dx = í~ sm (xt) — t cos (xř) ] + C, a tudíž je J e x sin (xř) 0. □ 7.39. Fourierova transformace a difrakce. Intenzita světla je fyzikální veličina kvantitativně vyjadřující přenos energie vlněním. Intenzita obecné světelné vlny je definována jako časová střední hodnota velikosti Poyntingova vektoru, který je vektorovým součinem (1) X je kompaktní, (2) každé otevřené pokrytí X obsahuje konečné pokrytí, (3) X úplný a totálně omezený. Náznak důkazu. Jestliže je splněna druhá podmínka věty, pak je vcelku snadno vidět, že musí být prostor X totálně omezený. Skutečně, stačí si vybrat pokrytí X pomocí všech e-koulí se středy v bodech x e X. Z něho musí jít vybrat konečné pokrytí a množina středů x; koulí, které se v tomto konečném pokrytí vyskytují, již naplňuje podmínku z definice totální omezenosti. K důkazu implikace (2) ==>■ (3) tedy chybí ještě důkaz úplnosti. Uvažme cauchyovskou posloupnost x; .. dokončit aspoň návod na důkaz, nejlépe implikacemi (3) ==>■ (1) a (1) =>■ (2) □ 7.23. Kompaktnost na spojitých funkcích. Jako příklad odlišného chování pojmu kompaktnosti v euklidovských prostorech a v prostorech funkcích si uvedem velice užitečné tvrzení známé pod jménam Arzelaova-Askoliho věta. Theorem. Množina M c C[a, b] je kompaktní, právě když je omezená uzavřená a stejnoměrně spojitá. 7.24. Důkaz věty 7.8 o Fourierových řadách. Obecný kontext metrik a konvergencí nám nyní umožní vrátit se k důkazu věty, ve které jsme dali částečný obrázek o bodové i jiné konvergenci Fourierových řad. Nejde 1 nám přitom o nutné podmínky konvergencí a v literatuře lze najít mnoho jiných formulací. Naše Věta 7.8 ale byla docela jednoduchá a postihla velké množství užitečných případů. Pro začátek si bude dobré uvědomit, jak se mohou lišit konvergence vůči různým Lp normám. Pro zjednodušení budeme vždy pracovat v zúplnění prostoru 5^ nebo Slc vzhledem k příslušné normě, aniž bychom dumali nad tím, o jaké přesně prostory jde (i když bychom je mohli popisovat docela snadno pomocí Kurzweilova integrálu). Hólderova nerovnost (použitá na funkce / a konstantu 1) dává na \ a \/p + \/q = 1, C > \ fix)\ na celém intervalu [a, b] (takové stejnoměrné omezení konstantou vždy existuje, když je / e / bude pro jakékoliv p > 1 vždy silnější než L\-konvergence (a drobně upraveným odhadem ukážeme i obdobné silnější tvrzení, že Lq konvergence je silnější než Lp konvergence, kdykoliv je q > p, zkuste si sami). Pro 434 CHAPTER 7. SPOJITÉ MODELY použití druhého odhadu ale musíme požadovat stejnoměrnou omezenost posloupnosti funkcí /„, tj. omezení funkcí /„ konstantou C musí být nezávislé na n. Pak totiž můžeme odhadnout \f„(x) — f(x)\ < 2C a dostáváme z našeho odhadu, že L i-konvergence je silnější než Lp-konvergence. Jsou tedy všechny Lp-normy na našem prostoru 5° [a, b] rovnocenné z hlediska konvergence stejnoměrně omezených posloupností funkcí. Nej těžší (a také nej zajímavější) bude dokázat první tvrzení Věty 7.8, které bývá v literatuře označováno jako Dirichletova podmínka (a byla údajně odvozena již v roce 1824). Dokážeme proto nejprve, jak z této vlastnosti bodové konvergence vyplývají tvrzení (2) a (3) dokazované věty. Bez újmy na obecnosti můžeme předpokládat, že pracujeme na intervalu [—jt, Jt], tj. s periodou T = 2jt. Jako první krok si připravíme jednoduché odhady pro koeficienty Fourierovy řady. Samořejmý je odhad 1 < — jt \f(x)\dx a totéž pro všechna bn, neboťjak cos(x), tak sin(x) jsou v absolutní hodnotě ohraničené jedničkou. Pokud je ale / spojitá funkce v S1 [a, b], můžeme integrovat per partes a dostaneme 1 . f(x) cos(nx)dx an(f) Jt 1 njt 1 -i n [f (x) sm(nx)r_n niť)- 1 njt f'(x) sin(«x) dx Píšeme zde an(f) pro příslušný koeficient funkce / atd. Vidíme tedy, že čím "hladší" funkce, tím rychleji se blíží Fourierovy koeficienty k nule. Iterací této procedury skutečně dostaneme odhad pro funkce / v [—Jt, Jt] se spojitými derivacemi až do řádu k včetně \cin(f)\ < 1 \f(k+1\x)\dx a totéž pro bn(f). Jinak řečeno, pro dostatečně hladké funkce / jsou n^-násobky jejich Fourierových koeficentů an a bn ohraničeny L i -normou jejich k-té derivace f(k\ Předpokládejme tedy, že máme spojitou funkci / v prostoru S1 [a,b], jejíž částečné součty Fourierovy řady bodově konvergují k /. Můžeme pak odhadnout \sN(x) - f(x)\ y (ait cos(fcje) + bk sin(fcje)) oo Z + 1**1)- k=N+l Pravou stranu můžeme dále odhadnout pomocí koeficientů a'n a b'n derivace /' (s použitím Hólderovy nerovnosti pro q = 2, viz navzájem kolmých vektorů elektrického a magnetického pole. Pro monochromatickou rovinnou vlnu šířící se ve směru osy y platí 1 cs0- E2ydt, kde c je rychlost světla a e0 je permitivita vakua. Monochromatická vlna je posána harmonickou funkcí Ey = ý(x, t) = A cos( je úhlová frekvence a pro libovolné pevné t je nejmenší periodou tzv. vlnová délka k. Přitom k představuje rychlost šíření vlny k = 2f-. Platí 1 fT 1 fT I = csq- / E2 dt = csq— / A2 cos2 (cůt - kx) dt ? Jo -c Jo 91 /"T 1 + cos(2(tt)ř - kx)) = cs0Az- /---dt * Jo 2 1 91 r sin(2((Wř — kx)) 1T = 2C£°A^t +-2^-ío 1 91 , sin(2( 1 1 9, sin(2((wr — kx)) — sin(2(—kx)) = -cs0Az (1 +--- = -cs0Az 2 2(ůx 2 Druhý člen v závorce můžeme zanedbat, protože je vždy menší než = 2I7 < Pro reálné detektory světla, je tedy nepatrný oproti 1. Intenzita světla je přímo úměrná druhé mocnině amplitudy. Difrakcí rozumíme takovou odchylku od přímočarého šíření světla, která nemůže být vysvětlena jako důsledek odrazu či lomu (či změnou směru paprsku v prostředí se spojitě se měnícím indexem lomu). S difrakcí se setkáváme při šíření prostorově ohraničeného svazku světla. Difrakční jevy jsou nejvýrazněji a snadno pozorovatelné tehdy, když světlo prochází otvory či překážkami, jejichž velikost je řádově srovnatelná s vlnovou délkou světla. Při Fraunhoferově difrakci v následujícím příkladu prochází rovinná monochromatická vlna velmi úzkou obdélníkovou štěrbinou a promítá se na vzdálenou plochu, například posvítíme-li laserovým ukazovátkem drobnou štěrbinou na stěnu. Obraz, který dostaneme je Fourierovou transformací funkce propustnosti stínítka - štěrbiny. Zvolme rovinu difrakčního stínítka za souřadnicovou rovinu z = 0. Nechť kolmo na tuto rovinu dopadá rovinná vlna A exp(z'&z) (nezávisí na místě dopadu (x, y) na stínítku). Označme s(x, y) funkci propustnosti stínítka, pak lze výsledné vlnění dopadající na projekční plochu v místě (§, rf) popsat jako integrální součet všech vln (Huygensův-Fresnelův princip), které prošly stínítkem a šíří se dále prostředím ze všech bodů (x, y, 0) (jako kulová vlna) do bodu (§, r], z): tj) Ý(Š, rf) s(x, y)e p/2 rq/2 -ik(&+rff) -ik(^x+tjy) dx dy dy dx Lp a Lq normy pro nekonečné řady s p rf) p/2 p/2 -mx áx p/2 J -q/2 q/2 e-ikny áy q/2 ~ g—ik^x ~ p/2 - £-iktjy - -p/2 _ —ikrj _ q/2 -q/2 435 D. INTEGRÁLNÍ OPERÁTORY 2. METRICKÉ PROSTORY 2 sm(k%p/2) 2 ún(krjq/2) ún(k^p/2) sin(krjq/2) A-—--;- = Apq- k% kr, 11 k^p/2 Graf funkce f (x) = vypadá následovně: kľ]q/2 Graf funkce i/>(§, rf) sin ^ sin r/ pak takto: Popisovaná difrakce pak takto: r MO 'ľud - Orad L-1-10 rad Protože lirn^o = 1, je intenzita ve středu obrazu přímo úměrná 70 = A2p2q2. Fourierovu transformaci si můžete prohlédnout jednoduše, když posvítíte laserovým ukazovátkem skrz drobnou škvírku mezi palcem a ukazováčkem, bude to obraz funkce její 1/2 7.15, a Besselovy nerovnosti pro obecné Fourierovy řady. viz 7.5.(2)) \sN(x) - f(x)\ < Y, i(141 + \K\) (oo 1 v 1/2 / oo v 2 Z tT) (Z(Ki2 + i4i2)) k=N+l 7 \=N+1 7 Dostali jsme takto nejen důkaz stejnoměrné konvergence naší řady k předjímané hodnotě, ale také odhad rychlosti konvergence: sup|^(x) -f(x)\ < (^J||/'||2) • -L. re! / V N Tím je dokázáno tvrzení 7.8.(2) za předpokladu platnosti Dirichletovy podmínky 7.8.(1). 7.25. L2-konvergence. V dalším kroku našeho důkazu odvodíme L2-konvergenci Fourierových řad za předpokladu stejnoměrné konvergence. Důkaz se opírá o obvyklou techniku aproximace nespojitých objektů spojitými, kterou popíšeme jen bez podrobností. V případě zájmu či potřeby by mělo být vcelku snadné detaily doplnit. Sformulujeme si napřed potřebné tvrzení obecně: Lemma. Podmožina spojitých funkcí f v <5P[a,b] na konečném intervalu [a, b] je v tomto prostoru hustá podmnožina vzhledem k L2-normě. Myšlenka důkazu je dobře vidět na příkladu aproximace Heavisidovy funkce h na [—it, 7t]. Pro každé jt > 8 > 0 definujeme funkci f s jako x/8 pro \x\ < 8 a fs(x) = h(x) jinak. Zjevně jsou všechny funkce fs spojité, protože jsme bod nespojitosti překlenuli pomocí vhodné lineární funkce na intervalu, jehož velikost je kontrolována pomocí 8. Velmi jednoduše se spočte, že \\h — fs\\2 —> 0, neboť funkce / je omezená v absolutní hodnotě a tedy příspěvek integrace přes stále se zmenšující interval musí jít k nule. Zcela stejným způsobem můžeme ošetřit všechny body nespojitosti obecné funkce /, kterých je maximálně konečně mnoho a tedy jsou skutečně všechny uvažované funkce hromadnými body posloupností spojitých funkcí. Nyní je již náš důkaz jednoduchý, protože pro zadanou funkci / můžeme odhadnout vzdálenost od částečných součtů její Fourierovy řady pomocí spojitého přiblížení f€ takto (všechny normy v tomto odstavci jsou L2 normy): ll/-íjv(/)ll < ll/-/e|| + ll/e-íiv(/e)ll + l|íiv(/e)-íiv(/)ll a jednotlivé sčítance napravo umíme kontrolovat. 436 CHAPTER 7. SPOJITÉ MODELY První z nich je nejvýše e, podle předpokladu o stejnoměrné konvergenci pro spojité funkce můžeme dosáhnout stejně malého ohraničení i druhého sčítance. U třetího je dobré si všimnout, že jde vlastně o velikost částečného součtu Fourierovy řady pro / — f€. Je tedy jistě \\f - f-sN(f - f€)\\ < a proto také (díky trojúhelníkové nerovnosti) <2||/-/e|| <2e. Celkem jsme tedy odhadli celou vzdálenost pro dostatečně bllízké spojité funkce a dostačně velká N číslem 4e. Tím je dokazovaná L2 konvergence potvrzena. 7.26. Dirichletovo jádro. A konečně se dáme do důkazu \\ prvního tvrzení věty 7.8. Přímo z definice Fourierovy řady F(t) funkce f(t) as využitím jejího vyjádření s komplexní exponenciálou v 7.7 dostáváme pro částečné součty sN(t) výraz 1 N V sN(t) = j^_ k=-N T/2 /We' -iojkx ^Jojkt T/2 kde T je základní perioda, se kterou pracujeme a co = 2n/T. Tento výraz můžeme přepsat jako rT/2 Sn{í) = j KN(t — x)f (x) dx ■ '-T/2 a funkci KN(y) i N Zdeňky k=-N nazýváme Dirichletovo jádro. Všimněme si, že součet je kouskem geometrické řady s poměrem členů eímy. Můžeme ji tedy přímo vyjádřit pro všechna y ^ 0 následujícím způsobem (po cestě násobíme čitatel i jmenovatel výrazem — e~íft>:v/2, abychom uměli přepsat následně pomocí reálné funkce sin): y Q-iNmy _ QÍ(N+l)a)y KN(y) =--:- l — e-i(N+\/2)my _t_ ei(N+\/2)my "J1 QÍojy/2 _Q—icoy/2 1 sm((N + l/2)coy) T sin( 0 splňující počáteční podmínku lim u(x,t) = /(je). Poznámky: Symbolem ut = zde rozumíme parciální derivaci funkce u podle t (tj. derivujeme podle t, přičemž x považujeme za kon-stantní) a podobně uxx = ^f- označuje druhou parciální derivaci podle x (kdy dvakrát derivujeme podle x a na ř nahlížíme při derivování jako na konstantu). Fyzikální interpretací úlohy je, že se snažíme určit teplotu m (je, ř) v tepelně izolované a homogenní tyči nekonečné délky (rozsah proměnné x), je-li dána počáteční teplota tyče funkcí /. Tyč má konstantní průřez a teplo se v ní může šířit pouze vedením. Koeficient a2 je pak roven podílu —, kde a je koeficient tepelné vodi- CQ vosti, c je specifické teplo a q je hustota. Zvláště se tedy předpokládá, že a2 > 0. Solution. Na rovnici vedení tepla aplikujeme Fourierovu transformaci vzhledem k proměnné x. Platí ovšem T (ut) (co, t) 727 / —oo / ut(x, t)e~imxdx -oo u(x,t)e-imx dx^j , kde je derivováno podle t, tj. je T(ut) (co, t) = (T(u) (co, t))' = (T(u))t (co, t). Současně víme, že T {a2 uxx^j (co, i) = a2 T (uxx) (co, i) = —a2co2 T (u) (co, i). Při označení y(co, i) = T (u) (co, i) tak přecházíme k rovnici yt = -a2co2 y. Podobnou diferenciální rovnici jsme již při počítání Fourierových transformací řešili, a tudíž pro nás není obtížné stanovit všechna její řešení y(co, t) = K(co) e-fl2íU\ K(co) e R. Zbývá určit K(co). Transformace počáteční podmínky dává T(f) (co) = lim F(u) (co, t) = lim y(co, t) = K(co)e° = K(co), a proto je y(co, t) = T (/) (tu) e-a2°j2t, K(co) e R. Nyní se pomocí inverzní Fourierovy transformace vraťme k původní diferenciální rovnici s řešením oo u(x, t) = -7= f y(co, t) émx dco = f F (f) (co) e~a m 1 émx dco = —oo oo / oo \ -1= / Í-J= / f(s)e-imsds\ e-fl2ft>2ř émx dco -. —oo V —oo / oo / oo \ / f(s)[-^ f e-a2m2'e-im(s-x)dco\ ds. -oo V —oo / 1_ ~2H 431 D. INTEGRÁLNÍ OPERÁTORY 2. METRICKÉ PROSTORY Vypočítáním Fourierovy transformace F(f) funkce fit) = e pro a > 0 jsme při přeznačení proměnných obdrželi ■dp -at2 1 / e~cP e~irPdp = -j=e~*, o 0. 2jt j V 2c 2, Dle tohoto vztahu (uvažte c = at > 0, p = co, r = s — x) platí oo a tedy _J_ f -a u (x, t) 2m2t 0—im(s—x) dco fläh 2a~Jjžt J f (s) e i*2' ds. □ 7.41. Stanovte Laplaceovu transformaci £(f)(s) funkce (a) fit) = ď'; (b) fit) = Ciď1' + c2ď2'; (c) f(t) = cos (bt); (d) f(t) = sin (bt); (e) fit) = cosh ibt); (f) f it) = sinh ibt), přičemž hodnoty b e Eac1,c2 e C jsou libovolné a kladné s e M je větší než reálné části čísel a,a\,a2 e Ca rovněž je větší než b ve variantách (e) a (f). Solution. Případ (a). Bezprostředně z definice Laplaceovy transformace plyne oo oo C if) is) = f ďf ďst dt = f e-(s-fl)ř dt = Um (^r) -(s—a) s—a ' Případ (b). Pomocí výsledku varianty (a) a linearity nevlastního integrálu dostáváme oo oo C if) is) =ci f eait ďst dt+c2f ď2t ďst dt = + s—a\ S—02 Případ (c). Protože cos ibt) = \ (ébt + ~~ibt^ volba ci = 1/2 = c2,a\ = ib,a2 = —ib v předchozí variantě již dává C if) is) = f (\éht + \ďiht) ďst dt = —L_ + i 2(s-ib) ^ 2(s+ib) s2+b2 ' Případy (d), (e), (f). Analogicky volby (d) c\ = —i/2, c2 = i/2, ci\ = ib, a2 = —ib; (e) c\ = 1/2 = c2, ci\ = b, a2 = —b; (f) c\ = 1/2, c2 = —1/2, ci\ = b, a2 = —b vedou na (d) C if) is)- h ■ (e) C if) is) (f) C if) is) s2+b2 ' s . s2-b2 ' b s2-b2 ■ □ U periodických funkcí jsou jejich integrály přes intervaly délky periody nezávislé na volbě krajních bodů intervalu integrace. Proto můžeme pomocí změny souřadnic použít pro částečné součty též výraz rT/2 s n ix) = KNiy)fix + y) dy. J-T/2 Teď konečně máme vše připraveno. Nejprve se budeme věnovat případu, kdy je funkce / v bodě x spojitá a diferencovatelná. Chceme pro tento případ dokázat, že Fourierova řada Fix) v bodě x konverguje k hodnotě fix). Dostáváme rT/2 sNix)-fix)= (f(x + y)-f (X))KN(y) dy. ■J-T/2 Integrovaný výraz můžeme přepsat do tvaru, který bude připomínat opět Fourierovy koeficienty pro vhodné funkce: fix + y) - fix) £^-TL^± sin((tf + 1/2)^) = sin(a>y/2) = cpxiy)icosicúy/2) siniNcoy) + sin(a>y/2) cosiNcoy)), kde jsme si označili funkci fjx + y) - fjx) Cfxiy) = -—-7t7- sm( i*-^* - Sčítání vektorů a násobení vektorů skaláry pak bylo dáno odpovídajícími operacemi s takovými funkcemi. Stejným způsobem jsme pak pracovali i s vektorovými prostory funkcí jedné reálné proměnné, když jejich hodnotami byly skaláry (nebo případně i vektory). Nejjednodušší lineární zobrazení a mezi vektorovými prostory zobrazovala vektory do skalárů (tzv. lineární formy). Byla definována jako součet součinů souřadnic %i vektorů s pevně zvolenými hodnotami a{ = a(e;) na generátorech et, tj. pomocí jednořádkových matic: (xi, ,xn)T h-> (cři, ... ,a„) • (xu ...,xn)T. Složitější zobrazení s hodnotami opět v tom samém prostoru pak byla obdobně zadána čtvercovými maticemi. Velice podobně umíme přistoupit k lineárním operacím na prostorech funkcí. Budeme chvíli pro jednoduchost pracovat s reálným vektorovým prostorem S všech po částech spojitých reálných funkcí s kompaktním nosičem definovaných na celém M. nebo na intervalu I = [a, b]. Lineárním zobrazením S -» M. budeme říkat (reálné) lineární funkcionály. Příklady takových funkcionálů můžeme velmi snadno zadat dvěma způsoby — pomocí vyčíslení funkce (případně jejích derivací) v jednotlivých pevně zvolených bodech nebo pomocí integrování. Příkladem funkcionálů L tedy může být vyčíslení v jediném pevném bodě xq e I L(f) = f(x0) a přiklad s integrováním může být zadán pomocí pevně zvolené funkce g(x) L(f) f(x)g(x)dx. Funkce g(x) zde hraje roli váhy, se kterou při definici Riemannova integrálu bereme jednotlivé hodnoty reprezentující funkci f(x). Nejjednodušším příkladem takového funkcionálů je samozřejmě Riemannův integrál samotný, tj. případ s g (x) = 1 pro všechny body x. Dobrou představu dává volba funkce g(x) 0 je-li \x\ > e 2^ je-li \x\ — 1 spočtěte Laplaceovu transformaci £ (g) (s) funkce g(t) = te-' a pro s > 1 Laplaceovu transformaci £ (h) (s) funkce h(t) = t sinhř. Solution. Užitím metody per partes získáváme OO OO / _í 11 \ £ (g) (S)= ft e"ř e~st dt = ft e-^1^ dt = lim ( *v£f ) - 0 -o o V ( ] ' fe-(,+1)' dt - _ f um e~(m)' - sL-\ J -(s+i) - (S+i)2 (S+i)2) (S+\y Derivování Laplaceovy transformace obecné funkce — / (tj. nevlastního integrálu) podle parametru s dává (OO \ 1 OO OO J-f(t)e-stdt) =J-f(t) (e"")' dt = Jtf(t) t~stdt. 0/0 o To znamená, že derivace Laplaceovy transformace £(—f)(s) je Laplaceova transformace funkce tf(ť). Laplaceovu transformaci funkce y = sinhř jsme ale dříve určili jako funkci y = ^r~[- Proto platí £(h) (s)= (-^tt)' 2s (s2-l)2- Povšimněme si, že tímto způsobem jsme rovněž mohli určit £ (g) (s). □ Základní Laplaceovy transformace uvádíme v následující tabulce: 439 D. INTEGRÁLNÍ OPERÁTORY 3. INTEGRÁLNÍ OPERÁTORY y(t) C(y)(s) teai feat únoot cos cot eat únoot eat (cos cot + - sin cot) t sin cot sinře-sř dř Aíoj—s)t dř 1 5 — z°° e" s co + i- s — ioo (s — íců)(s + ioo) s2 + co2 s2 + co2 □ 7.45. Označme £(y)(s) Laplaceovu transformaci funkce y(t). Metodou per partes dokažte, že platí Solution. (7.35) a indukcí: C(y')(s) = sC(y)(s) - y(0) C(y")(s) = s2C(y) - sy(Q) - / (0) C(y(n))(S) = S"C(y)(S) - ^^"''/""(O)- 7.46. Najděte funkci y(t) vyhovující diferenciální rovnici y" (i) + 4y(ř) = sin2ř a počátečním podmínkám y(0) = 0 a ý (0) = 0. Solution. Z předchozího příkladu ||7.45||: s2C(y)(s) + 4£(y)(s) = C(sm2t)(s) Přitom □ tj- £(sin2ř)(í) £(y)(s) = s2 + 4' 2 (s2 + 4)2 pro jakákoliv e > 0. Integrál funkce g přes M je jednotkový a náš lineární funkcionál můžeme vnímat jako (rovnoměrné) zprůměrování hodnot funkce / přes e-okolí počátku. Obdobně můžeme pracovat s funkcí 0 je-li 1*1 > e _J_ + _L ■2_«2 ,2 |x| < e se kterou jsme pracovali v odstavci 6.6. To je funkce hladká na celém M s kompaktním nosičem v intervalu (—e, e). Náš funkcionál má tentokrát význam vážené kombinace hodnot, tentokrát však bereme rychle se zmenšující váhy jednotlivých argumentů se vzrůstající vzdáleností od počátku. Jistě má g konečný integrál přes celé M, nebude to ale jednička. Vydělením g tímto integrálem bychom opět obdrželi funkcionál, který bude mít význam nerovnoměrného průměrování dané funkce /. Jiný velice obvyklý příklad je tzv. Gaussián což je funkce opět s jedničkovým integrálem přes celé M (což časem také ukážeme), tentokrát mají všechny argumenty x v příslušném "průměru" nenulovou váhu, byť s rostoucí vzdáleností od počátku velmi rychle zanedbatelně malou. Další takový příklad s jedničkovým integrálem přes celé M jsme viděli před chvílí při diskusi Dirichletových jader g(x) = KN(x) u Fourierových řad. 7.28. Konvoluce funkcí. Integrální funkcionály z předchozího odstavce můžeme lehce modifikovat, abychom obdrželi "rozmlžené zprůměrování" hodnot funkce / kolem daného bodu y e M: Ly(f) f (x)g (y -x)dx -J Konvoluce funkcí jedné reálné proměnné Volný parametr y v naší definici funkcionálu Ly(f) může být vnímán jako nová nezávislá proměnná a naše operace Ly tedy ve skutečnosti zobrazuje funkce opět na funkce f(y)=Ly(f) f(x)g(y - x)dx. Této operaci se říká konvoluce funkcí fug, značíme ji / * g. Většinou se konvoluce definuje pro reálné nebo komplexní funkce na M s kompaktním nos*^^^^^^ Pomocí transformace t = z — x se snadno spočte (f*g)(z)= f(x)g(z-x)dx f(z-t)g(t)dt = (g*f)(z). 440 CHAPTER 7. SPOJITÉ MODELY Je tedy konvoluce coby binární operace * : Sc x Sc -» Sc na dvojicích funkcí s kompaktními nosiči komutativní. Stejně tak můžeme konvoluce uvažovat s pomocí integrace přes konečný interval, musíme se jen postarat o to, aby byly dobře definovány funkce, které v nich vystupují. Zejména je to tedy dobře možné u peridodických funkcí a integrování přes interval délky periody. Konvoluce je mimořádně užitečný nástroj pro modelování způsobu, jak pozorujeme data měřená v experimentu nebo jak se projevuje prostředí při přenosu informací (např. analogový audio nebo video signál ovlivňovaný šumy apod.). Argument / je přenášenou informací, funkce g je volena tak, aby co nejlépe vystihovala vlivy prostředí či zvoleného technického postupu při zpracovávání signálu, resp. jakýchkoliv dat. Odhadnout "lokálnost" konvoluce - pomocí rozložení vah kolem nuly a ohranicenosti funkce /. 7.29. Gibbsův efekt. Jeden velmi užitečný případ konvoluce jsme vlastně již viděli dříve. V odstavci 7.26 jsme interpretovali částečný součet Fourierovy řady pro funkci / jako konvoluci s d=— Dirichletových jádrem KN(y) = ^ 772 Aíúky -T/2 r Tato interpretace nám umožní vysvětlit tzv. Gibbsův jev zmíněný v odstavci 7.9. Pomocí předchozího odhadu lokálnosti konvoluce dovodit, že se konvoluce s dlrchletovymi jádry budou kolem skoku chovat obdobně jako je tomu u HeAV-isideovy funkce a pro ni to udělat explicitně. 7.30. Fourierova transformace. Konvoluce jsou jedním z mnoha případů obecných integrálních operátorů na prostorech funkcí L(f)(y) = / f(x)k(y,x)dx. J a Funkce k(y, x) závislá na dvou proměnných, k : R2 -» R, se nazývá jádro integrálního operátoru L. Definiční obor takových funkcionálů je nutné volit s ohledem na vlastnosti jádra tak, aby vždy existoval použitý integrál. Teorie integrálních operátorů s jádry a rovnic, které je obsahují, je velice užitečná a zajímavá zároveň, bohužel pro ni zde teď ale nemáme dost prostoru. Zaměříme se alespoň na jeden mimořádně důležitý případ, tzv. Fourierovu transformaci T, která úzce souvisí s Fourierovými řadami. Připomeňme, že funkce f(t), která je dána svojí konvergující Fourierovou řadou, je rovna Zpětnou transformací dostáváme y(t)-1^^ 1 g sin2ř — p cos 2t. □ 7.47. Najděte funkci y(f) vyhovující diferenciální rovnici / (ř) + 6/ (ř) + 9y(ř) = 50 sin t a počátečním podmínkám y(0) = 1 a / (0) = 4. Solution. Laplaceovou transformací dostáváme s2C(y)(s) -s-4 + 6(sC(y)(s) - 1) + 9£(y)(s) = 50£(siní)00, tj- (s2 +6s + 9)£(y)(s) 50 s2 + 1 + s +10, C(y)(s) 50 + s +10 (s2 + \)(s + 3)2 (s+3)2' Rozkladem na parciální zlomky prvního členu dostaneme 50 As + B C D s2 + 1 + s + 3 + (s + 3ý (s2 + l)(s + 3ý tedy 50 = (As + B)(s + 3)2 + C(s2 + l)(s + 3) + D(s2 + 1). Dosazením s = — 3 dostáváme 50 = 10D tedy D = 5 a porovnáním koeficientů u s3 0 = A + C, tedy A = -C. Porovnáním koeficientů u s pak 4 0 = 9 A + 6B + C = 8A + 6B, tedy B = -C. Porovnáním absolutních členů dostaneme 50 = 9B+3C+D = 12C+3C+5 tedy C = 3, B = 4, A = Protože s + \0 s + 3 + 1 -3. 1 + 7 (s + 3)2 (s + 3)2 s+3 (s + 3)2' platí C(y)(s) 3s+4 , _3_ , 5 i J_ i 7 ^ s+3 (s+3)2 s+3 (s+3)2 s2+l 12 J=3s. , _j_ , _±_ , _ s2 + l ^ s2+l ^ s+3 ^ (s+3)2- Odtud inverzní Laplaceovou transformací dostáváme řešení ve tvaru y(t) = -3 cosi + 4 siní + 4e~3t + \2te~3t. □ 441 D. INTEGRÁLNÍ OPERÁTORY 3. INTEGRÁLNÍ OPERÁTORY 7.48. Nalezněte Laplaceovu transformaci Heavisideovy funkce H (t) kde c„ jsou komplexní Fourierovy koeficienty, a>„ = n2n/T se základní periodou T, viz odstavec 7.7. Při pevně zvoleném T vyjadřuje výraz Aco = 2jt/T právě změnu ve frekvenci způsobenou nárůstem n o jedničku. Je to tedy právě diskrétní krok, se kterým při výpočtu koeficientů Fourierovy řady měníme frekvence. Koeficient 1 /T a posunuté Heavisideovy funkce Ha(t) = H(t — a) H(t) 0 pro t < 0, \ pro ř = 0, 1 pro ř > 0. Solution. C(H(t))(s) H(t)e-Stát f We- dt o dt i C(Ha(t))(s) C(H(t -a))(s) e-s(t+a) dt : 7(0-D-7. >o H{t - a)e~stdt o e-asC(H(t))(s) = — ve vztahu 1 /-r/2 Cn = ~ I 1 J-T/2 je pak roven Aco/2jt, takže můžeme řadu pro f(t) přepsat jako ~ i / rTi2 f(t)= V —(Aťu/ /(i)e"iVáe" dt T/2 0 □ 7.49. Ukažte, že platí (7.36) C(f(t) ■ Ha(t))(s) = e-asC(f(t + a))is) Solution. /■co C{f(t)-Ha(t))(s) = j f it) H it - a)e~st dt = / f(t)e~st dt f(t + a)e-s(t+a) dt = nahlavu Představme si nyní hodnoty con pro všechna n e Z jako vybrané reprezentanty pro malé intervaly [a>„, con+i] o délce Aco. Pak náš výraz ve vnitřní velké závorce v posledním vztahu pro f (t) ve skutečnosti vyjadřuje sčítance Rie-mannových součtů pro nevlastní integrál i r°° — / g(co)tiatdco 2lt J-oo kde g((ú) je funkce nabývající v bodech a>„ hodnoty g(con)= / f(x)t-l(ú"x dx. J-T/2 e-asC(f(t+a))(s). Pracujeme s po částech spojitými funkcemi s kompaktním nosičem, proto je naše funkce / integrovatelná v absolutní f(t+ a)e~hodíiotě přes celé M. Limitním přechodem T -> oo dojde ke zjemňování normy Aco našich dělících intervalů v Rieman-nově součtu. Zároveň se dostaneme v posledním výrazu k integrálu □ g(o)) 7.50. Solution. Nalezněte funkci y(t) vyhovující diferenciální rovnici a počátečním podmínkám: f(x)e-imx dx. y"(t)+Ay(t) = f(t), yiO) = 0, /(0) kde funkce fit) je po částech spojitá: 1, Předchozí úvahy ukazují, že pro docela velkou množinu Riemannovsky integrovatelných funkcí / na M. umíme zadefmovat dvojici vzájmně inverzních integrálních operátorů: | fourierova transformace |_ fit) cos(2ř) pro 0 < t < n, 0 pro t > n. Pro každou po částech spojitou reálnou nebo kompaktní funkci /naMs kompaktním nosičem definujeme 1 Úloha je modelem netlumeného kmitání pružiny (bez zahrnutí tření a jiných vlivů, například nelinearit v tuhosti pružiny apod.), které je buzené vnější silou jen během počáteční doby a poté ustane. Funkci fit) lze zapsat jako lineární kombinaci Heavisideovy funkce u(ť) a jejího posunutí, tj. Fif)ico) = fico) <2jt /(0e- dt. Této funkci / říkáme Fourierova transformace funkce /. Přechozí úvahy ukazují, že bude také platit 1 fit) = F-íif)it) fit) = cos(2ŕ)(w(ŕ) - M0) '2it fico)eWJ' dco. Protože Ciy")is) = s2Ciy) - syiO) - /(0) = s2Ciy) + 1, Tím říkáme, že k právě definované Fourierově transformaci T existuje inverzní operace T~x, které říkáme inverzní fi—_l 442 CHAPTER 7. SPOJITÉ MODELY Všimněme si, že Fourierova transformace a její inverze jsou integrální operátory se skoro shodným jádrem k(co, t) = e±iúJt. Samozřejmě tyto transformace mají smysl pro mnohem větší definiční obory, zájemce odkazujeme na speciální literaturu. 7.31. Jednoduché vlastnosti. Fourierova transformace zajímavým způsobem převrací lokální a globální chování funkcí. Začněme jednoduchým příkladem, ve kterém najdeme funkci f(t), která se ztransformuje na charateri-stickou funkci intervalu [—Q, Q], tj. f (co) = 0 pro \a>\ > Q a / = 1 pro \ců\ < Q. Inverzní transformace T~x nám dává fit) 1 dco 1 '2jt J-q 2 1 rr(e '2jx 1 V2Ťřt 2i 2Q. sin(fiř) ~ V2ŤŤ £2* Až na konstantní násobek a škálování proměnné, jde tedy o velice důležitou f unci sinc(x) = ^x-. Přímým výpočtem limity v nule (LHospitalovo pravidlo) spočteme, že /(O) = 2Q(2jt)~l/2, nejbližší nulové body jsou v t = ±jr/Q a funkce poměrně rychle klesá k nule mimo počátek x = 0. Na obrázku je tato funkce znázornená rozvlněnou křivkou pro Q = 20. Zároveň je vynesena křivkou oblast, ve které se s rostoucím Q naše funkce f(t) stále rychleji vlní. Omega = 20.000 Vidíme, že charakteristická funkce intervalu [—£2, £2] přechází Fourierovou transformací na funkci /, která má velmi výraznou kladnou hodnotu v malém okolí nuly, přičemž hodnota v nule je pevným násobkem Q. Čím je tedy Q větší, tím více se soustředí / do okolí počátku. Dále si spočteme Fourierovu transformaci derivace f'(t) pro nějakou funkci /. Stále předpokládáme, že / má kompaktní nosič, tj, zejména F(f) i F(f) skutečně existují. dostáváme s využitím předchozích příkladů 7. a 8. k výpočtu Laplaceovy transformace pravé strany s2C(y) + \ + 4C(y) = £(cos(2í)(w(í) - M0)) = £(cos(2ř) • u(t)) - £(cos(2ř) • un(t)) = £(cos(2ř)) - e~ns£(cos(2(ř + jt)) (1 s2 + 4 Odtud Ciy) i + (i ')- s2 + 4 (s2 + A)2' Inverzní transformací dostávávme řešení ve tvaru y(t) 2 ^"v^-v i 4 Podle vztahu (||7.36||), ale s sin(2ř) + \t sin(2ř) + /T1 (e~™ ^2^2) ■ ■(e-** S ) V (í2+4)2/ \C-l(e-nsC(t sin(2ř))) (s2 +4)2/ = (t - jt) sin(2(ř - tt)) ■ Hn(ť). Protože je Heavisideova funkce pro t < jt nulová a pro t > jt rovna 1, dostáváme řešení ve tvaru yit) ■j sin(2ř) + \t sin(2ř) pro 0 < ř < jt ¥ sin(2ř) pro t > jx □ 7.51. Najděte funkci y(t) vyhovující diferenciální rovnici y"(t) = cos (jtt) - yit), t e (0, +00) a počátečním podmínkám y(0) = c\, ý (0) = c2. Solution. Nejdříve podotkněme, že z teorie obyčejných diferenciálních rovnic vyplývá, že úloha má právě jedno řešení. Dále připomeňme C (/") (s) =s2C (/) (s) - s lim f(t) - lim f'(t) a £(cos (bt))(s) s2+b2' Aplikování Laplaceovy transformace na zadanou diferenciální rovnici proto dává s2C (y) (s) -sc1-c2 = -^T-C (y) (s), tj- Cis c2 (7.37) L(y)(s) = [S2 + 1) [S2 + Jt2) sz + 1 sl + 1 Stačí tudíž najít funkci y splňující (||7.37||). Rozkladem na parciální zlomky získáváme (s2 + l)(s2+JT2) = ~rď\ (?+T ~ ■ Z výše uvedeného vyjádření C (cos (bt)) (s) a dříve dokázaného C (sin t) (s) tak již dostáváme hledané řešení s2+l yit) 7t2-l (cos t — cos ijtt)) + c\ cos t + c2 sin t. □ 443 D. INTEGRÁLNÍ OPERÁTORY 3. INTEGRÁLNÍ OPERÁTORY 7.52. Vyřešte soustavu diferenciálních rovnic x" (f)+jť (ř) = y(t)-f (t)W, x' (t)+2x(t) = -y(t)+y (ř)+e"ř při počátečních podmínkách x(0) = 0, y(0) = 0, x'(0) = 1, / (O) = 0. Solution. Opět aplikujeme Laplaceovu transformaci. Tím s využitím £ (e±ř) o = éi převedeme první rovnici na s2 C (x) (s) — s lim x(t) — lim x1 (t) + sC (x) (s) — lim x(t) = C (y) (s) - (s2 Ľ (y) (s) - s lim y(t) - lim y (t)) + ^ a druhou potom na sC (x) (s) - lim x(t) + 2C (x) (s) = -C (y) (s) + sC (y) (s) - lim y(t) + ^. Vyčíslíme-li limity (dle počátečních podmínek), obdržíme lineární rovnice s2C (x) (í) - 1 + sC (x) (s) = C (y) (s) - s2 C (y) (s) + -±? sC (x) (s) + 2Ľ (x) (s) = -C (y) (s) + sC (y) (s) + ^ s právě jedním řešením C (x) (s) 2s-l 2(s-l)(s + l)2 C (y) (s) 3s 2(S2-1)Z Opět si pomůžeme rozkladem na parciální zlomky se ziskem C (x) (s) 11,31 11 31 ,11 8 s-1 + 4 (S + 1)2 8 s + 1 4 (S + 1)2 4 s2-T Neboť již dříve jsme vypočítali + £{te-') (s) (s+D- -, £ (sinh ŕ) 00 s2-l ' Ĺ (t sinh t) (i) 2s (*2-l)2' dostáváme x(ř) = I ř e"ř + -\ sinh ř, y(ř) = | ř sinh ř. Čtenář může sám ověřit, že tyto funkce x a y jsou skutečně hledaným řešením. Ověření však důrazně doporučujeme provést (např. z toho důvodu, že Laplaceovy transformace funkcí y = é, y = sinhř a y = t sinh t jsme získali pouze pro s > 1). □ 7.53. Najděte řešení soustavy diferenciálních rovnic: x'(ř) = -2x(ř) + 3y(í) + 3ř2, y (ř) = -4x(ř) + 5y(í) + é, x(0) = 1, y(0) = -1 Solution. C(x')(s) = C(-2x + 3y + 3t2)(s), C(y')(s) = C(-4x + 5y + e')(s). Přitom levé strany lze zapsat pomocí (||7.35||) a pravé lze rozepsat vzhledem k linearitě operátoru C Protože £(3f2)(s) = ^ a.£(e')(s) = dostáváme systém lineárních rovnic sC(x)(s)-\ = -2£(x)(S) + 3£(y)(S) + jš, sC(y)(s) + 1 -4£(jc)(5) + 5£(y)(í) + Počítejme metodou per partes 1 1 <2jt /'(Oe- dt V27T icoT(f)(co) '27T /(0e- Vidíme tedy, že Fourierova transformace převádí (limitní) operaci derivování na (algebraickou) operaci prostého násobení proměnnou. Samozřejmě můžeme tento vzorec iterovat a dostáváme F{f")(co) = -co2 T{f), F(fn)) = inconF{f). 7.32. Vztah ke konvolucím. Další mimořádně důležitou vlastností je vztah mezi konvolucemi a Fourierovou transformací. Spočtěme, jak dopadne transformace konvoluce h = f * g, kde opět pro jednoduchost předpokládáme, že funkce mají kompaktní nosiče. Při výpočtu prohodíme pořadí integrování, což je krok, který ověříme teprve v diferenciálním a integrálním počtu později, viz ??. V dalším krůčku pak zavedeme substituci t — x = u. T(h)(co) 1 OO / /-OO '2it 1 2tx /(*) OO V — OO xj e~i0 f(x)g(t -x)dx) erimt dt {^j g(t - x)e-ia* dt) dx f(x) {^j g(u) e-íft<"+*) duj dx = (/ /We"íffl dxj ■ {^j g(u)e-iom duj = V2jrF(f) ■ T(g) Podobný výpočet ukazuje i obrácené tvrzení, že Fourierova transformace součinu je, až na konstantu, konvoluce transformací. Hf • g) i '2it s-l ■ Jak jsme si uváděli výše, konvoluce f * g velice často modeluje proces našeho pozorování nějaké sledované veličiny /. Pomocí Fourierovy transformace a její inverze nyní můžeme snadno rozpoznat původní hodnoty této veličiny, pokud známe konvoluční jádro g. Prostě spočteme F(f * g) a podělíme obrazem F(g). Tak získáme Fourierovu transformaci původní funkce /, kterou obdržíme explicitně pomocí inverzní Fourierovy transformace. Hovoříme o dekonvoluci. 7.33. Diracova delta-funkce. Vraťme se nyní ještě k prvnímu příkladu s inverzní transformací k charakteristické funkci f q intervalu [—Q, Q]. Zkusme provést limitní přechod pro £2 jdoucí k nekonečnu a označme \/2ŤžS(t) kýženou limitní "funkci" pro -7r_1(/ň)(0- Inverzní obraz 444 CHAPTER 7. SPOJITÉ MODELY součinu s libovolným obrazem T (g) umíme vyjádřit pomocí konvoluce: l '2it g(t)T-l(fQ)(z-t)dt. Při limitním přechodu Q. -» oo přejde výraz nalevo k F~l(F(g))(z) = g(z), zatímco napravo dostáváme r (z) g(t)8(z, - f)dt. Naše hledaná <5(r) tedy vypadá na "funkci", která je všude nulová, kromě jediného bodu t = 0, kde je tak "nekonečná", že integrováním jejího součinu s libovolnou integrovatelnou funkcí g dostaneme právě hodnotu g v bodě t = 0. Není to samozřejmě funkce v našem smyslu, nicméně jde o objekt často používaný. Říká se jí Diracova funkce S a korektně ji lze popsat jako tzv. distribuci. Z nedostatku času nebudeme distribuce podrobněji rozebírat a omezíme se na konstatování, že si lze dobře Diracovo 8 představit jako jednotkový impulz v jediném bodě. Fourierova transformace jej pak pretransformuje na konstantní funkci JT(8)(a>) = -j==. Naopak mnohé funkce, které nejsou integrovatelné v absolutní hodnotě na M transformuje Fourierova transformace na výrazy s Diracovým 8. Např. Jr(cos(nt))(a>) = J—(8(n — a>) + S(n + &>)), což můžeme docela snadno vidět výpočtem Fourierovy transformace funkce f q cos(«x) a následným limitním přechodem £2 -» oo. Dodělat výpočet nebo odkázat do příkladů ... (jeto snadné rozepsáním cos((n — w)x)+cos((n + (ú)x) pomocí součtových vzorců a zapomenutím sudé části výrazu pro fourierovu transformaci). Obdobně dostaneme Fourierovyu transformaci pro funkci sinus, můžeme pro to využít také skutečnost, že transformace derivace této funkce se bude lišit jen o násobek imaginární jednotkou a proměnnou. Tyto transformace jsou základem Fourierovy analýzy signálů. Jestliže totiž signál je čistou sinusoidou na dané frekvenci, pak to pomocí Fourierovy transformace identifikujeme jako dva bodové impulzy právě v kladné a záporné hodnotě frekvence. Pokud je signál lineární kombinací několika takových čistých signálů, dostaneme stejnou lineární kombinaci bodových impulzů. Protože ale vždycky zpracováváme signál jen v nějakém konečném časovém intervalu, dostáváme ve skutečnosti místo bodových impulzů rozvlněnou křivku podobnou funkci sine s výrazným maximem právě v hodnotě příslušné frekvence. Z velikosti tohoto maxima přitom umíme také přímo vyčíst původní amplitudu signálu. 7.34. Fourierova sinová a cosinová transformace. Pokud použijeme Fourierovu transformaci na lichou funkci f(t), tj. f(—t) = —f(t), příspěvek integrace součinu f(t) a funkce Po úpravě dostaneme maticově A(s)x(s) = b(s), kde jsme označili Cramerovo pravidlo říká, že a b (s) C(x)(s) \Ail |a| |A| |Ai| |A2| Odtud s+ 2 -3 4 5-5 C(y)(s) = ■ s2 - 3s + 2 M |a| kde 1 + -2- s + 2 4 -3 5-5 1 + 1 (s-5)(l + 5) + 3(-l + ^T) C(x)(s) C(y)(s) = 1 = (í + 2)(-l + ^T) (s-5)(s3+6) s- 1)(í 1 2) A-24. (s - 1)(S - 2) '(5+2)(2-,s) 453 + 24 ) Rozkladem na parciální zlomky vyjádříme Laplaceovy obrazy řešení £(x)(5) = 2s2 £(x)(5) 18 -2 3 _ , _28_ 2 s-1 21 4(s-2) 15 «3 87 4s ' __i _27___7__12 _ 21 l2 ~T t_l t_? o3 o (s-1)2 1 s-1 s-2 a zpětnou transformací dostáváme řešení Cauchyovy úlohy: x(t) -- y(t) ft - 3té + 2%é - ^eLt - f ŕ - f -18ř - 3té +2lé - le2t - 6t2 - 21. 87 □ 7.54. Diskrétní kosinová transformace. Základem JPEG komprese dat je tzv. diskrétní kosinová transformace. Ta je dána ortogonální maticí C = (cu)1 i=i definovanou následovně \2k - 1)(Z - 1)7 cu = au cos 0 2n )7T^ kde aki = au = y ^ pro l > 1. Vektor reprezentující data pak ortogonálně rozložíme a některé bázové vektory (sloupce matice C ) vypustíme. Tím je provedena redukce dat s rozumnou aproximací původních dat. Zpětná transformace je jednoduchá. Protože je C ortogonální, je dána násobením transponovanou maticí. Ukažte, že pro n = 2 je matice C rovna ^ j a že je ortogonální. Spočítejte ortogonální rozklad vektoru (3, 4) vzhledem k bázi tvořené sloupci matice a určete vlastní čísla a vlastní vektory. Solution. Počítejme <*-ŠG -O-G -O-šfoS)-'- Matice C je tedy ortogonální a její sloupce tvoří ortonormální bázi e\ = (-^j, -A=), e2 = (7^, — --jj)- Koeficienty ortogonálního rozkladu vektoru u = (3, 4) dostaneme jednoduše použitím transponované matice 445 D. INTEGRÁLNÍ OPERÁTORY 3. INTEGRÁLNÍ OPERÁTORY Ortogonální rozklad má tedy následující tvar 0) Vžij) V2-(-i) Charakteristický polynom matice C je (k+ ^|)(^— 7f) — \ = ® a vlastní čísla jsou tedy Ai 2 = ±1 (jma ani ortogonální matice nemůže mít). Příslušné vlastní vektory jsou určeny po řadě rovnicemi <75 0, (-^ + 1), + -^ 0 a jsou to tedy například vektory (-^, 1 — -^), (-^, -1 75) (které jsou automaticky ortogonální). □ Remark. Zkuste si nakreslit obrázek působení zobrazení určeného maticí A na nějaký vektor v rovině. 7.55. Diskrétní kosinová transformace 2. Ukažte, že symetrická matice /O 1 ... 0 0\ 1 0 0 0 0 0 ... 0 1 yo o ... 10/ má vlastní hodnoty kt cos cpi, kde cpi In n + l sl 0: C(f'(t))(s) f'(t)t-st dt [f(t)e-sX + s -/(0) + s£(f)(s). f(t)e-st dt Vlastnosti Laplaceovy transformace a řadu dalších zejména v technické praxi používaných transformací je možné snadno dohledat v literatuře. 446 CHAPTER 7. SPOJITÉ MODELY 4. Diskrétní transformace Fourierova analýza signálů naznačená v předchozím odstavci byla dříve např. v radiotechnice realizována pomocí speciálních analogových obvodů. Dnes při zpracování signálů pomocí počítačových obvodů pracujeme pouze s diskrétními daty. Předpokládáme, že v (diskrétní) časové proměnné je dán nějaký pevný (malinký) vzorkovací interval x a že se náš signál opakuje s periodou /Vr (pro hodně veliké přirozené N), což je maximální perioda zachytitelná v našem diskrétním modelu). Naše 447 E. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE 4. DISKRÉTNÍ TRANSFORMACE E. Doplňující příklady k celé kapitole 7.56. Rozviňte do Furierovy řady funkci sin2(x) na intervalu [—jt, jt]. 7.57. Rozviňte do Furierovy řady funkci cos2(x) na intervalu [—jt, jt]. 7.58. Určete konvoluci funkcí f\ a f2, kde _ f 1 pro x € [-1,0] ■>x ~ \Q jinak _ \x Pro x e 1] Í2 ~ 10 jinak 448 CHAPTER 7. SPOJITÉ MODELY Řešení cvičení 7.4. x, sin(x), projekce funkci A sin(x) nezmění, neboť leží v prostoru samotném. 7.5. cos(x), ^ cos(x) + x. Projekce funkci ^ cos(x) nezmění, neboť leží v prostoru samotném. 7.34. t — — ' 2 1 -t ■ fl * /2(0 ■4 pro f e [-2, -1] 2t 0 pro t e [-1, 1] pro t e [1, 2] jinak 7.56. 7.57 ■ cos(2x). j + j cos(2x). 7.58. Určete konvoluci funkcí f\ a fi, kde fl * f2(f) 2 0 pro t e [-1, 0] pro t e [0, 1] jinak 449