Drsná matematika
Martin Panák, Jan Slovák a „autorský kolektív"
i
Projekt netradiční základní učebnice matematiky pro studenty přírodních věd, informatiky, ekonomie apod., přibližující podstatnou část matematiky v rozsahu čtyř semestrálních přednášek.
Text by měl být dokončen a vydán v roce 2013. Práce na učebnici jsou podpořeny projektem Univerzitní výuka matematiky v měnícím se světě (CZ.1.07/2.2.00/15.0203)
ISTERSTVO ŠKOLSTVÍ, OPValílÉvinI ^tíT^ľ ÄDEŽE A TĚLOVÝCHOVY pro konkurancMchopnost 'ANA °
INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ
evropský
sociální fond V ČR EVROPSKÁ UNIE
ii
Obsah
Kapitola 1. Rozcvička 5
1. Čísla a funkce 5
2. Kombinatorické veličiny 9
3. Diferenční rovnice 13
4. Pravděpodobnost 16
5. Geometrie v rovině 25
6. Relace a zobrazení 37
Kapitola 2. Elementární lineárni algebra 72
1. Vektory a matice 72
2. Determinanty 83
3. Vektorové prostory a lineárni zobrazení 91
4. Vlastnosti lineárních zobrazení 107
Kapitola 3. Linární modely a maticový počet 132
1. Lineárni procesy 132
2. Diferenční rovnice 138
3. Iterované lineárni procesy 145
4. Více maticového počtu 153
5. Rozklady matic a pseudoinverze 171
Kapitola 4. Analytická geometrie 199
1. Afinní a eukhdeovská geometrie 199
2. Geometrie kvadratických forem 218
3. Projektivní geometrie 225
Kapitola 5. Zřízení ZOO 247
1. Interpolace polynomy 247
2. Reálná čísla a limitní procesy 256
3. Derivace 274
4. Mocninné řady 286
Kapitola 6. Diferenciální a integrální počet 341
1. Derivování 341
2. Integrování 356
3. Nekonečné řady 374
Kapitola 7. Spojité modely 411
1. Fourierovy řady 411
2. Metrické prostory 423
3. Integrální operátory 439
4. Diskrétní transformace 446
Kapitola 8. Spojité modely s více proměnnými 460
1. Funkce a zobrazení na M" 460
2. Integrování podruhé 488
3. Diferenciální rovnice 510
4. Poznámky o numerických metodách 532
5. Vybrané pokročilejší partie 533
Kapitola 9. Statistické a pravděpodobnostní metody 547
iii
1. Popisná statistika 547
2. Pravděpodobnost 555
3. Matematická statistika 579
4. Bayesovská a neparametrická statistika 580
Kapitola 10. Algebraické struktury 590
1. Grupy 590
2. Okruhy polynomů 605
3. Systémy polynomiálních rovnic 616
4. Uspořádané množiny a Booleovská algebra 634
5. Kódování 645
Kapitola 11. Kombinatorické metody, grafy a algoritmy 667
1. Grafy a algoritmy 667
2. Aplikace kombinatorických postupů 687
iv
Předmluva
Příprava této učebnice byla motivována přednáškami pro informatické obory na Masarykově univerzitě, kde je celý program založen na precizním matematickém přístupu.
Chtěli jsme proto rychle, ale zároveň pořádně, pokrýt zhruba tolik matematických metod, jako je obvyklé u větších kurzů v klasických technických oborech opřených o matematické metody. Zároveň jsme ale nechtěli rezignovat na úplný a matematicky korektní výklad. Chtěli jsme vedle sebe vyložit i obtížnější partie matematiky a spoustu elementárních i obtížnějších konkrétních příkladů, jak s uvedenými postupy ve skutečnosti pracovat. Nechtěli jsme přitom za čtenáře řešit, v jakém pořadí a kolik „teorie" či „praxe" pročítat.
Z těchto podnětů vznikl dvousloupcový formát s oddělenými teoretickými úvahami a praktickými postupy, který kopíruje i skutečné rozdělení výkladu na přednáškách na „teoretické přednášky" a „demonstrovaná cvičení".
Snažíme se tím vyjít vstříc jak čtenářům, kteří si napřed chtějí procvičit postupy při řešení úloh a teprve pak přemýšlet, proč a jak algoritmy fungují, tak těm druhým, kteří si napřed chtějí dělat jasno, o tom proč a jak věci fungují, a pak případně zkouší počítat příklady. Zároveň tím snad zbavujeme čtenáře stresu, že by měl přečíst úplně vše. Naopak, měl by mít radost z brouzdání textem a prožitku objevování vlastní cestičky.
Text se přitom v obou svých částech snaží prezentovat standardní výklad matematiky s akcentem na smysl a obsah představovaných matematických metod. Řešené úlohy procvičují základní pojmy, ale zároveň se snažíme dávat co nejlepší příklady užití matematických modelů.
Teoretický text je prezentován dosti kompaktním způsobem, mnoho prostoru je ponecháno pro dořešení podrobností čtenáři. Uváděné příklady se snaží pokrýt celou škálu složitosti, od banálních až po perličky ke skutečnému přemýšlení. Studenti navíc řešili a odevzdávali každý týden zadávané příklady.
Čtenářům bychom rádi pomohli:
• přesně formulovat definice základních pojmů a dokazovat jednoduchá matematická tvrzení,
• vnímat obsah i přibližně formulovaných závislostí, vlastností a výhledů použití matematických nástrojů,
• vstřebat návody na užívání matematických modelů a osvojit si jejich využití.
K těmto ambiciózním cílům nelze dojít lehce a pro většinu lidí to znamená hledat si vlastní cestu s tápáním různými směry (s potřebným překonáváním odporu či nechutě). I proto je celý výklad strukturován tak, aby se pojmy a postupy vždy několikrát vracely s postupně rostoucí složitostí a šíří diskuse. Jsme si vědomi, že se tento postup může jevit jako chaotický. Domníváme se ale, že dává mnohem lepší šanci na pochopení u těch, kteří vytrvají.
Vstup do matematiky je skoro pro každého obtížný — pokud už „víme", nechce se nám přemýšlet, pokud „nevíme", je to ještě horší. Jediný spolehlivý postup pro orientaci v matematice je hledat porozumnění v mnoha pokusech a to, pokud možno, při četbě v různých zdrojích. Určitě nepovažujeme tento text za dostatečný jediný zdroj pro každého. Doufáme, že může být dobrým začátkem a případně i dlouhodobým pomocníkem, zvláště pro ty, kdo se k jednotlivým částem budou znovu a znovu vracet.
Pro ulehčení vícekolového přístupu ke čtení je text doprovázen emotivně laděnými ikonkami, které snad nejen oživí obvyklou strohou strukturu matematického textu, ale naznačí čtenáři, kde by složitější text měl být čten pozorněji, ale určitě ne přeskakován, případně kde by bylo možná lépe náročné pasáže přinejmenším napoprvé vůbec nečíst.
Volba jednotlivých ikonek samozřejmě odráží hlavně pocity autorů. Přesto by postupně mohly být dobrým vodítkem pro čtenáře. Sloupec zaměřený na výklad teorie (užší sloupec) a sloupec zaměřující
1
se na příkladovou část jsou přitom značeny odlišnými sadami ikonek. Co se týče sloupce teorie, používáme ikonky varující před pracností/složitostí/náročností, např.
Další označují ne úplně pohodovou zdlouhavost práce a potřebu trpělivosti či nadhledu, jako jsou
tyto
A konečně máme také ikonky vyjadřující pohodu nebo radost ze hry, třeba následující
Co se týče příkladového sloupce, tak používáme ikonky
pro základní příklady, které by čtenář rozhodně měl být schopen zvládnout a pokračovat ve čtení až po jejich vyřešení, ikonky
pro obtížnější příklady se zajímavým obratem, či praktickou aplikací, konečně ikonky
značí velmi obtížný příklad, resp. poslední z nich indikuje, že při řešení příkladu je vhodné použít výpočetní software.
Snažili jsme se sloupce s příklady sepsat tak, aby byly čitelné prakticky víceméně samostatně. Bez ambicí pohrát si s hlubšími důvody, proč uváděné postupy fungují (nebo s prostým cílem „projít písemkou"), by mělo skoro stačit probírat se jen příklady. Definice pojmů či popisy jejich vlastností používaných při řešení příkladů jsou v teoretickém sloupci zpravidla vyznačeny, aby o ně bylo možno snadno pohledem zavadit. Souvislost řešených příkladů s paralelně studovanou teorií je přitom spíše volná, snažili jsme ale ulehčit přeskakování „z teorie do praxe a zpět" co nejvíce.
Obsahově je celá učebnice ovlivněna představou, že pro praktické využití jsou velmi podstatné metody tzv. diskrétní matematiky, zatímco tzv. spojité modely jsou matematicky dobře uchopitelná přiblížení veskrze diskrétního světa kolem nás. Počítat koneckonců stejně umíme vždy jen s konečně mnoha racionálními čísly naráz. Bez spojité matematiky si lze ale těžko dobře představit koncepty jako konvergence procesu k hmitnímu stavu nebo robustnost výpočtu. Bylo by bez ní také obtížné pracovat s odhady chyb při numerických procesech.
Všechna témata a velmi podstatnou část textu jsme v létech 2005 - 2012 ověřovali při výuce studentů informatiky a později i matematiky na Masarykově univerzitě. Paralelně jsme přitom vytvořili také podklady pro praktické semináře matematického modelování a numerických metod. V nich se studenti věnují skutečnému využití výpočtových nástrojů a modelů.
Závěrem stručně shrneme obsah celé učebnice. Samozřejmě předpokládáme, že si každý čtenář, případně přednášející, vybere témata a jejich pořadí. Pokusíme se proto zároveň vymezit bloky, se kterými lze takto nezávisle zacházet.
2
Úvodní motivační kapitola se snaží ilustrovat několik přístupů k matematickému popisu problémů. Začíname nejjednoduššími funkcemi (základní kombinatorické vzorce). Pak naznačujeme, jak pracovat se závislostmi zadanými pomocí okamžitých změn (jednoduché diferenční rovnice), užití kombinatoriky a množinové algebry diskutujeme prostřednictvím konečné klasické pravděpodobnosti. Předvádíme maticový počet pro jednoduché úlohy rovinné geometrie (práce s pojmem pozice a transformace) a závěrem vše trochu zformalizujeme (relace, uspořádní, ekvivalence). Nenechte se zde uvrhnout do chaotického zmatku rychlým střídáním témat — cílem je nashromáždit něco málo netriviálních námětů k přemýšlení a hledání jejich souvislostí i použití, ještě než zabředneme do úrovně problémů a teorií složitějších. Ke všem tématům této úvodní kapitoly se časem vrátíme.
Další dvě kapitoly jsou věnovány základům počtu, který umožňuje práci s vícerozměrnými daty i grafikou. Jde o postupy tzv. lineární algebry, které jsou základem a konečným výpočetním nástrojem pro většinu matematických modelů. Nejprve probíráme jednoduché postupy pro práci s vektory a maticemi, třetí kapitola je pak věnována aplikacím maticového počtu v různých lineárních modelech (systémy lineárních rovnic, lineární procesy, lineární diferenční rovnice, Markovovy procesy, lineární regrese). Čtvrtá kapitola pak ilustruje použití maticového počtu v geometrických úlohách. Dozvíme se něco málo o afinní, euklidovské a projektivní geometrii.
V tomto okamžiku přerušíme diskusi diskrétních modelů a přejdeme ke spojitým. Chceme co nejnázorněji ukázat, že základní ideje, jak s funkcemi pracovat, bývají jednoduché. Stručně řečeno, velmi jednoduché úvahy spojené s popisem okamžitých změn sledovaných veličin umožňují dělat závěry pro jejich celkové chování. Složitosti se pojí skoro výhradně se zvládnutím rozumně velké třídy funkcí, pro které mají naše postupy být použitelné.
Začínáme proto kapitolou, kde diskutujeme, jaké funkce potřebujeme pro nelineární modely. Po polynomech a splajnech postupně diskutujeme pojmy spojitosti, limity posloupností a funkcí a derivace funkcí, připomeneme všechny základní elementární funkce a závěrem se seznámíme s mocninnými řadami. Tím je připravena půda pro klasický diferenciální a integrální počet. Ten prezentujeme v kapitole šesté s důrazem na co nejpřímočařejší pochopení souvislostí limitních procesů, integračních procesů a aproximací.
Sedmá kapitola se věnuje náznakům aplikací a snaží se co nejvíce připomínat analogie k postupům jednoduché lineární algebry. Místo lineárních zobrazení mezi konečně rozměrnými vektorovými prostory tak pracujeme s lineárními operacemi mezi vektorovými prostory funkcí, definovanými buď integrálními nebo diferenciálními operátory.
Zatímco diskusi diferenciálních rovnic necháváme na později, zde studujeme nejprve aproximace funkcí s pomocí vzdálenosti definované integrálem (tzv. Fourierovy řady). Pak se věnujeme souvislostem s některými integrálními operátory (např. konvoluce) a integrálními transformacemi (zejména Fourirerova transformace). Po cestě si neodpustíme ilustraci obecného principu, že spojité modely jsou zpravidla ideovým podkladem a zároveň dobrou aproximací pro modely diskrétní. Poslouží nám k tomu stručné nahlédnutí na problematiky tzv. waveletů a diskrétní Fourierovy transformace.
V osmé kapitole pokračujeme v našem stručném nastínění analytických spojitých metod, tentokrát pro modely s mnoha proměnnými. Nejprve rozšíříme základní postupy a výsledky týkající se derivací na funkce více proměnných, včetně funkcízadaných implicitně a tzv. vázaných extrémů. Hned poté rozšíříme teorii integrování o tzv. násobné integrály. Poté se věnujeme stručně modelům opřeným o známou změnu našich objektů, tj. diferenciálním rovnicím a malinko naznačíme obdobné problémy variační. Závěrem této kapitoly se pak stručně věnujeme numerickým přiblížením a odhadům.
Devátá kapitola je věnována popisné statistice, matematické pravděpododobnosti a matematické statistice. Seznámíme se s pojmy pravděpodobnostní prostor, hustota pravděpodobnosti, normální rozdělení, střední hodnota, medián, kvantit, rozptyl, příklady diskrétních a spojitých rozdělení a budeme se náznakem věnovat statistickému zpracování dat, tj. výběrovým statistikám a jejich spolehlivosti.
V další kapitole zamíříme zpět do světa diskrétních metod. Zabýváme se v ní základními pojmy a poznatky teorie grafů a jejich využitím v praktických problémech (např. prohledávání do šířky a hloubky, minimální pokrývající kostry, toky v sítích, hry popisované stromy). Závěrem se budeme zajímat o vytvořující funkce.
3
Poslední kapitola se zabývá nejprve obecnými algebraickými strukturami s důrazem na elementární poznatky z teorie grup a okruhů polynomů. Zmíníme i něco málo aplikací v kódování. Dále se věnujeme úvodu do teorie čísel a vybraným aplikacím, včetně šifrování informace.
Pořádné poděkování všem zúčastněným, kteří nebudou přímo v autorském kolektivu, studentům apod.
??. ??. 2013, kolektiv autorů
4
KAPITOLA 1
Rozcvička
,hodnota, změna, poloha" - co to je a jak to uchopit?
Cílem první kapitoly je uvést čtenáře do fascinujícího světa matematického myšlení. Vybíráme si k tomu co nejkonkrétnější příklady modelování reálných situací pomocí abstraktních objektů a souvislostí. Zároveň projdeme několik témat a postupů, ke kterým se postupně budeme vracet a v závěru kapitoly se budeme chvíli věnovat samotnému jazyku matematiky (se kterým budeme jinak zacházet spíše intuitivně).
O co jednodušší jsou východiska a objekty, se kterými zde budeme pracovat, o to složitější je pochopit do důsledku jemnosti použitých nástrojů a postupů. Většinou je možné proniknout k podstatě věcí teprve v jejich souvislostech. Proto je také představujeme hned z několika pohledů zároveň.
Přecházení od tématu k tématu se možná bude zdát jako zmatečné, ale to se jistě postupně spraví při našich návratech k jednotlivým úvahám a pojmům v pozdějších kapitolách.
Název kapitoly lze chápat i jako nabádání k trpělivosti. I nej-jednodušší úlohy a úvahy budou snadné jen pro ty, kteří už podobné řešili. K postupnému poznání a ovládnutí matematického myšlení vede jen pozvolná a spletitá cesta.
Začneme s tím nejjednodušším: obyčejnými čísly.
1. Čísla a funkce
Lidé odjakživa chtějí mít jasno, „kolik" něčeho je, případně „za kolik" to je, , jak dlouho" něco trvá apod. Výsledkem takových úvah je většinou nějaké „číslo". Za číslo přitom považujeme něco, co ;///'//'/ umíme sčítat a násobit a splňuje to obvyklé zákonitosti, ať už všechny nebo jen některé. Například výsledek sčítání nezávisí na pořadí, v jakém čísla sčítáme. Máme k dispozici číslo nula, které přičtením výsledek nezmění, číslo jedna, kterým můžeme násobit, aniž bychom změnili výsledek, apod.
Nejjednodušším příkladem jsou tzv. čísla přirozená, budeme je značit N = {0, 1,2,3,...}. Všimněme si, že jsme mezi přirozená čísla vzali i nulu, jak je obvyklé zvláště v informatice.
Počítat , jedna, dvě, tři, ..." se učí děti už ve školce. O něco později se setkáváme s čísly celými Z — {...,—2,-1,0,1,2,...} a nakonec si zvykneme na desetinná čísla a víme, co znamená 1.19-násobek ceny díky 19% dani z přidané hodnoty.
Vlastnosti čísel. Abychom mohli s čísly pracovat opravdu, musíme se jejich definici a vlastnostem věnovat pořádněji. V matematice se těm základním tvrzením o vlastnostech objektů, jejichž platnost předpokládáme, aniž bychom se zabývali jejich dokazovaním, říká
A. Čísla a funkce
S přirozenými, celými, racionálními a reálnými čísly již počítat umíme. Zamyslíme se, proč racionální čísla nestačí (byť v počítači s jinými doopravdy počítat neumíme) a připomeneme si tzv. čísla komplexní (protože ani s reálnými čísly si při výpočtech nevystačíme).
1.1. Najděte nějaké reálné číslo, které není racionální.
Řešení. Jedna z mnoha možných odpovědí je ~Jl. Již staří Řekové věděli, že předepíšeme-li plochu čtverce a2 = 2, pak nelze najít racionální a, které by předpisu vyhovovalo. Proč?
Víme, že každé přirozené číslo n lze jednoznačným způsobem vyjádřit jako součin n = p[l ■ p1^ ... prkk, až na pořadí v součinu, kde pi, ..., Pk jsou po dvou různá prvočísla.
Pokud by tedy platilo (p/q)2 = 2 pro přirozená čísla p a q, pak tedy p2 = 2q2. Na levé straně máme v rozkladu na prvočísla 2r se sudým r (případně r = 0), na pravé straně ale bude vždy mocnina dvojky lichá. To je spor s naším tvrzením a tedy předpoklad nemůže platit a žádné racionální číslo nemůže mít za svoji druhou mocninu dvojku. □
5
KAPITOLA 1. ROZCVIČKA
axiomy. Vhodná volba axiomů předurčuje jak dosah z nich vycházející teorie, tak její použitelnost v matematických modelech skutečnosti.
Uvedme si teď základní vlastnosti operací sčítání a násobení
pro naše počty s čísly, která píšeme jako písmena a,b,c,____Obě
tyto operace fungují tak, že vezmeme dvě čísla a, b a aplikací sčítání nebo násobení dostaneme výsledné hodnoty a + b a a ■ b.
| Vlastnosti skalárů
Vlastností sčítání:
(KG1) (a + b) + c = a (KG2)
(KG3) (KG4)
a + b — b existuje číslo 0
(b + c), pro všechna a,b,c ro všechna a, b
a, pro
) tak, že pro všechna a platí
pro všechna a existuje o takové, ze a
:0
Vlastnostem (KG1)-(KG4) říkáme vlastnosti komutativní grupy. Jsou to po řadě asociativita, komutativita, existence neutrálního prvku (říkáme u sčítání také nulového prvku), existence inverzního prvku (říkáme u sčítání také opačného prvku k a a značíme ho —a). Vlastností násobení:
(01) (a ■ b) ■ c — a ■ (b ■ c), pro všechna a, b, c
(02) a ■ b — b ■ a, pro všechna a, b
(03) existuje číslo 1 tak, že pro všechna a platí 1 • a — a
(04) a ■ (b + c) — a ■ b + a ■ c, pro všechna a, b, c
Vlastnosti (01)-(04) se postupně nazývají asociativita, komutativita, existence jednotkového prvku a distributivita sčítání vůči násobení.
Množiny s operacemi +, • a vlastnostmi (KG1)-(KG4), (01)-(04) se nazývají komutativní okruhy. Další vlastnosti násobení:
(P) pro každé a ^ 0 existuje b takové, že a • b — 1. (Ol) je-li a ■ b — 0, potom buď a — 0 nebo b — 0.
Vlastnost (P) se nazývá existence inverzního prvku vzhledem k násobení (tento prvek se pak značí a-1) a vlastnost (Ol) říká, že neexistují „dělitelé nuly". ^^^^^^^J
Vlastnosti těchto operací sčítání a násobení budeme soustavně využívat, aniž bychom museli přesně vědět, s jakými objekty skutečně pracujeme. Tak se dostaneme k obecným matematickým nástrojům, je však vždy i- dobré mít představu o typických příkladech. Celá čísla Z jsou dobrým příkladem komutativní grupy, přirozená čísla nikoliv, protože nesplňují (KG4) (a případně neobsahují neutrální prvek, pokud někdo nulu do N nezahrnuje).
Když komutativní okruh navíc splňuje i vlastnost (P), hovoříme o poli (často také o komutativním tělese).
Poslední uvedená vlastnost (Ol) je automaticky splněna, pokud platí (P). Opačně to ovšem neplatí a tak říkáme, že vlastnost (Ol) je slabší než (P). Např. okruh celých čísel Z nesplňuje (P), ale splňuje (Ol). Hovoříme v takovém případě o oboru integrity.
Všimněme si, že množina všech nenulových prvků v poli společně s operací násobení splňuje (Ol), (02), (03), (P), a je proto také komutativní grupa. Jen se místo sčítání mluví o násobení. Jako příklad můžeme vzít všechna nenulová reálná čísla.
1.2. Poznámka. Lze dokonce dokázat, že odmocnina přirozeného stupně z přirozeného čísla je buď přirozená, nebo není racionální (viz l|G||
1.3. Najděte řešení rovnice x2 = b pro libovolné reálné číslo b.
Řešení. Víme, že tato rovnice má vždy řešení x v oboru reálných čísel, pokud je b nezáporné. Jestliže je b = — 1, pak ale zjevně takové reálné x existovat nemůže. Musíme proto najít větší obor čísel, ve kterém už řešení existovat bude.
K reálným číslům nejprve přidáme nové číslo i, tzv. imaginární jednotku a zkusíme dodefinovat sčítání a násobení tak, abychom i nadále zajistili obvyklé chování čísel, jak je shrnuto v odstavci 1.1.
Jistě musíme umět nové číslo i násobit reálnými čísly a výsledky sčítat s jakýmikoliv reálnými čísly. Nutně proto musíme v novém číselném oboru komplexních čísel C pracovat s formálními výrazy z = a + i b.
Aby byly splněny vlatnosti asociativity a distributivity, zavedeme sčítání tak, že se nezávisle sčítají reálné složky a imaginární složky. Stejně tak chceme násobení tak, jak by se násobily dvojčleny reálných čísel s jediným dodatečným pravidlem f = — 1, tj.
(a + i b) + (c + i d) = {a + c) + i (b + d), (a + i b) ■ (c + i d) = (ac — bd) + / (bc + ad).
□
Reálnému číslu a říkáme reálná složka komplexního čísla z, reálnému číslu b pak imaginární složka komplexního čísla z, píšeme
re(z) = a, im(z) = b.
1.4. Ověřte, že skutečně platí všechny vlastnosti (KG1-KG4), (01-04)a(P) skalárů z 1.1.
Řešení. Nulou je číslo 0 + i 0, jedničkou číslo 1 + i 0, obě tato čísla pro jednoduchost opět píšeme jako 0 a 1. Všechny vlastnosti se ověří přímočarým výpočtem. □ Komplexní číslo je dáno dvojicí reálných čísel, jde tedy o bod v reálné rovině R2.
1.5. Ukažte, že vzdálenost komplexního čísla z = a +i b od počátku (značíme ji \z |) je dána výrazem zz, kde ž je komplexně sdružené číslo a — i b.
Řešení. Součin
zz = {a2 + b2) + i (-ab + ba) = a2 + b2
je vždy reálné číslo a dává nám skutečně kvadrát vzdálenosti čísla z od počátku 0. Platí tedy \z\2 = zz. □
6
KAPITOLA 1. ROZCVIČKA
Prvky nějaké množiny s operacemi + a • splňujícími (ne nutně všechny) výše uvedené vlastnosti (tj. komutativní okruh, obor integrity, pole) budeme nazývat skaláry. Budeme pro ně vesměs užívat malá latinská písmena ze začátku nebo konce abecedy.
Všechny vlastnosti (KG1)-(KG4), (01)-(04), (P), (Ol) z našich úvah je třeba brát jako axiomatickou definici příslušných matematických pojmů. Pro naše potřeby bude stačit si průběžně uvědomovat, že při dalších diskusích budeme důsledně používat pouze tyto vlastnosti skalárů a že i naše výsledky proto budou platné pro všechny objekty s těmito vlastnostmi.
V tomto je pravá síla matematických teorií - nejsou platné jen pro konkrétní řešený příklad. Naopak, při rozumné výstavbě mají vždy univerzální použití. Budeme se snažit tento aspekt zdůrazňovat, přestože naše ambice mohou být v rámci daného rozsahu učebnice jen velice skromné.
1.2. Existence skalárů. K tomu, aby ale skutečně bylo možné 1' „ budovat matematickou teorii, je třeba ověřit, že takové objekty mohou existovat. Pro pořádek si proto budeme | postupně ukazovat, jak je možné zkonstruovat základní číselné obory. Pro konstrukci přirozených čísel začneme s předpokladem, že víme, co jsou to množiny.
Prázdnou množinu si označíme 0 a definujeme
(1.1)
neboli
0 := 0, n + 1 := n U {n},
0 := 0, 1 := {0}, 2 := {0, 1}, ..., n + 1 := {0, 1, ..., n}.
Tímto zápisem říkáme, že pokud už máme definovaná všechna čísla 0, 1, 2,... n, pak číslo n + 1 definujeme jako množinu všech předchozích čísel.
Přirozená čísla takto ztotožňujeme s počty prvků konkrétních množin. Číslo n je množina, která má n prvků a dvě přirozená čísla a, b jsou stejná, právě když příslušné množiny mají stejně mnoho prvků. V teorii množin se místo slovního spojení „počet prvků množiny" používá pojem „mohutnost množiny". Tento pojem má smysl (narozdíl od toho předchozího) i pro nekonečné množiny.
Na první pohled je také vidět obvyklá definice uspořádání přirozených čísel podle velikosti (o číslu a řekneme, že je ostře menší než b tehdy a jen tehdy, když a / b a a c b jako množina). Dalším formálním krokem by měla být definice sčítání a násobení a důkaz všech základních vlastnostní přirozených čísel, včetně výše uvedených axiomů komutativního okruhu. Snadno lze např. ukázat, že každá podmnožina v N má nejmenší prvek a spoustu dalších vlastností, o kterých zpravidla už dávno nepřemýšlíme a máme je za samozřejmé.
Nebudeme se tu konstrukcí číselných oborů zabývat podrobně a předpokládáme, že čtenář čísla racionální (Q), reálná (M) a komplexní (C) důvěrně zná. Při dalším výkladu budeme občas jen jen připomínat teoretické i praktické souvislosti. Podrobně bude konstrukce racionálních čísel z přirozených diskutována v 1.40. Konstrukci reálných čísel bude vhodné zmínit při studiu hmitních procesů později a již dříve budeme z různých algebraických pohledů zkoumat čísla komplexní. Obrázek naznačuje, jak je možné vnímat číselné obory jako vnořené jeden do druhého (tj. komplexní rovina obsahuje mnohokrát vložená přirozená nebo celá čísla, reálnou přímku atd.).
1.6. Poznámka. Vzdálenost \z\ nazýváme též absolutní hodnotou komplexního čísla z.
1.7. Goniometrický tvar komplexního čísla. Nejprve uvažme komplexní čísla tvaru z = cos
^hb__mai_j Počet permutací >__>^
Tvrzení. Počet p(n) různých pořadí na konečné množině s n prvky je dán známou funkcí faktoriál:
(1.2)
p(n)
kde p = b — a2/3 a q = c + (2a3 — 9ab)/21. Nyní zavedme neznámé u, v splňující podmínky u + v = t a 3uv + p = 0. Dosazením první podmínky do původní rovnice dostáváme
u3 + v3 + (3uv + p)(u + v) + q = 0,
dosazením druhé pak
u6 + qu3 - — = 0, H 27
což je kvadratická rovnice v neznámé s = u3. Máme tedy
' 2 V 4 27'
Celkem pak zpětným dosazením
(1.1)
-p/3u + u — a/3.
Ve výrazu pro u se vyskytuje třetí odmocnina. Abychom dostali všechna tři řešení, je nutno pracovat i s komplexními odmocninami. Rovnice x3 = a, a ^ 0, s neznámou x má totiž právě tři řešení v oboru komplexních čísel (Základní věta algebry, viz (10.20)). Všechna tato řešení nazýváme třetí odmocninou z čísla a. Je tedy výraz ^fä v komplexním oboru trojznačný. Pokud se chce přisoudit výrazu šfa jednoznačný význam, pak se za třetí odmocninu uvažuje řešení s nejmenším argumentem.
Navíc ještě dodejme, že při popsaném postupu se mohlo vyskytnout dělení nulou. V tom případě je nutno použít jiného (většinou snadnějšího) postupu.
1.14. Řešte rovnici
x3 +x2
2x - 1 = 0.
Řešení. Jak snadno zjistíme, tak rovnice nemá racionální kořeny (metody na určování racionálních kořenů si objasníme v části (||??||)). Dosazením do získaných vztahů získáme p = b — a2/3 = —7/3, q = —7/27, pro u pak dostáváme
V28 ± 127^147
u = -,
6
kde můžeme teoreticky volit až šest možností pro u (dvě volby znaménka plus či mínus a k tomu tři nezávislé volby třetí odmocniny). Jak však snadno nahlédneme, dostáváme pro x pouze tři různé hodnoty. Dosazením do (|| 1.11|) pak jeden z kořenů má tvar
14
3(28 - 84/V3)
V28 - 84/V3 1
+------= 1,247.
6 3
9
KAPITOLA 1. ROZCVIČKA
1.6. Kombinace a variace. Dalším jednoduchým příkladem hodnoty určené vzorcem jsou tzv. kombinační čísla, která vyjadřují, kolika způsoby lze vybrat k různých rozlišitelných předmětů z množiny n předmětů. ^— Zjevně máme
n(n - l)---(n - k+ 1) možných výsledků postupného výběru našich k prvků, přitom ale stejnou výslednou &-tici dostaneme v k \ různých pořadích. Pokud nám záleží i na pořadí vybrané &-tice prvků, hovoříme o variaci k-tého stupně.
Jak jsme si právě ověřili, počet kombinací a variací udávají následující vzorce, které také nejsou pro výpočet moc efektivní při velikých kan, protože obsahují výrazy pro faktoriály.
j Kombinace a variace |^___^_——_
Tvrzení. Pro počet c (n, k) kombinací k-tého stupně z n prvků, kde 0 < k < n, platí
rn\ n(n-l)...(n-k+l) Kkj ~ k(k - 1) ... 1 n\
c{n, k)
(1.3)
(n-k)\k\ Pro počet v(n, k) variací platí (1.4) v(n, k) — n(n — 1) ... (n
pro všechna 0 < k < n (a nula jinak).
Kombinační číslo čteme „n nad k" a nazýváme ho také někdy binomickým číslem. Tento název čísla dostala od tzv. binomického rozvoje, tj. roznásobení n-té mocniny dvojčlenu. Počítáme-li totiž (a + b)n, bude koeficient u mocniny akbn~k pro každé 0 < k < n roven právě počtu možností, jak vybrat &-tici z n závorek v součinu (ty, kde bereme do výsledku a). Platí proto
(1.5) (a + b)n = 'jr/(n')akbn~k-
Všimněme si, že pro odvození jsme potřebovali pouze distributi-vitu, komutativitu a asociativitu násobení a sčítání. Formule (1.5) proto platí v každém komutativním okruhu.
Jako další jednoduchou ukázku, jak vypadá matematický důkaz, si odvodme několik jednoduchých tvrzení o kombinačních číslech. Pro zjednodušení formulací definujme (^) — 0, kdykoliv je buď& < 0 nebo k > n.
1.7. Tvrzení. Pro všechna přirozená čísla kan platí
d) O = L\\
(2) Cíl) = GD + G+i)>
(3) EZ=oG)=2",
(4) £2=o*GD = w2""1-
Důkaz. První tvrzení je zjevné přímo z formule (1.3). Jestliže vyčíslíme pravou stranu z tvrzení (2), dostáváme
n\ ( n \ n\ n\
k) + \k+l)~ k\(n — k)\ + (k+ \)\(n-k - 1)! _ (k+l)n\ + (n-k)n\
(k+ l)!(n -k)\ _ (» + !)! ~~ (k +!)!(« -k)ť
Obdobně pro ostatní dva kořeny (přibližně —0, 445 a —1, 802). Jak jsme předeslali, vidíme, že i když se ve vzorcích pro kořeny vyskytují komplexní čísla, tak výsledek je reálný. □
B. Kombinatorika
V této kapitole si budeme hrát s přirozenými čísly, která budou popisovat různé nedělitelné předměty nacházející se v našem životním prostoru a budeme se zabývat tím, jak spočítat počet jejich uspořádání, přeuspořádání, výběrů a tak podobně. Ve velké většině takovýchto problémů lze vystačit se „selským rozumem". Stačí vhodně používat pravidel součtu a součinu, která si ukážeme na následujících příkladech:
1.15. Maminka chce Jeníkovi a Mařence rozdělit pět hrušek a šest jablek. Kolika způsoby to může udělat? (Hrušky mezi sebou považujeme za nerozlišitelné, stejně tak jablka. Připouštíme, že některé z dětí nic nedostane.)
Řešení. Pět hrušek samostatně může maminka rozdělit šesti způsoby. (Rozdělení je určeno tím, kolik hrušek dá Jeníkovi, zbytek připadne Mařence.) Šest jablek pak nezávisle sedmi způsoby. Podle pravidla součinu pak obě ovoce současně může rozdělit 6 • 7 = 42 způsoby. □
1.16. Určete počet čtyřciferných čísel, která začínají cifrou 1 a nekončí cifrou 2, nebo končí cifrou 2 a nezačínají cifrou 1.
Řešení. Množina uvažovaných čísel je složená ze dvou disjunktních množin, totiž čísel, která začínají cifrou 1 a nekončí cifrou 2 (první množina) a čísel, která nezačínají cifrou 1 a končí cifrou 2. Celkový počet popsaných čísel dostaneme podle pravidla součtu tak, že sečteme počty čísel v těchto dvou množinách. V první z těchto množin máme čísla tvaru „1XXY", kde X je libovolná cifra a F je libovolná cifra mimo dvojky. Můžeme tedy provést deset voleb druhé cifry, nezávisle na tom můžeme provést deset voleb třetí cifry a opět nezávisle devět voleb poslední cifry. Tyto tři nezávislé volby jednoznačně určují dané číslo a podle pravidla součinu máme tedy 10 • 10-9 = 900 takových čísel. Obdobně ve druhé skupině máme 8 • 10 • 10 = 800 čísel (na první cifru máme pouze osm možností, neboť číslo nemůže začínat nulou a jedničku máme zakázánu). Celkem podle pravidla součtu je 900 + 800 = 1700 uvažovaných čísel. □
1.17. Určete počet způsobů, jak lze na šachovnici (8x8 polí) postavit bílou a černou věž tak, aby se neohrožovaly (nebyly ve stejném řádku ani sloupci).
10
KAPITOLA 1. ROZCVIČKA
což je ale levá strana tohoto tvrzení.
Tvrzení (3) dokážeme tzv. matematickou indukcí. Tento typ důkazu je vhodný právě pro tvrzení, která říkají, že ]XÁ něco má platit pro všechna přirozená čísla n. Mate-matická indukce se skládá ze dvou kroků. V prvním se tvrzení dokáže pro n — 0 (popřípadě n — 1 nebo další hodnoty n). V druhém, tzv. indukčním, kroku předpokládáme, že tvrzení platí pro nějaké n (a všechny předešlé hodnoty), a za pomoci tohoto předpokladu dokážeme, že tvrzení platí i pro n + 1. Dohromady z toho pak vyvodíme, že tvrzení platí pro všechna přirozená n.
Tvrzení (3) zjevně platí pro n — 0, protože Q — 1 — 2°. (Stejně tak je přímo vidět i pro n — 1.) Předpokládejme, že platí pro nějaké n a spočtěme příslušnou sumu pro n + 1 s využitím tvrzení (2) i (3). Dostaneme
n + l
E
k=0
n + 1 k
n + l
E
k=0
n
k- 1
k=-\
n + l
2" +2"
7« + l
Všimněme si, že vzorec (3) udává počet všech pod-množin n-prvkové množiny, neboť (£) je počet všech jejích ^-prvkových podmnožin. Všimněme si také, že tvrzení (3) plyne přímo z (1.5) volbou a — b — 1.
Tvrzení (4) dokážeme opět matematickou indukcí, podobně jako (3). Zjevně platí pro n — 0, čímž je hotov první krok. Indukční předoklad říká, že (4) platí pro nějaké n. Spočtěme nyní příslušnou sumu pro n + 1 s využitím tvrzení (2) a indukčního předpokladu. Dostaneme
n + l / 1X n + l
E*
k=0
n + 1 k
E*
jt=0 n
k=-l
t C
n
k- 1
D
n k
n + l
E*
k=0
k=0
2" H
E*
k=0
+«2
n-l
-EM
k=0
(n + 1)2".
Tím je proveden indukční krok a tvrzení je dokázáno pro všechna přirozená n. □
Druhá vlastnost z našeho tvrzení umožňuje sestavit všechna kombinační čísla do tzv. Pascalova trojúhelníku, kde každé číslo obdržíme jako součet dvou bezprostředně nad ním ležících sou-
sedů:
n = 0 1
n = 1 1 1
n = 2 1 2 1
n = 3 1 3 3 1
n — 4 1 4 6 4
n = 5 1 5 10 10 5
1
Všimněme si, že v jednotlivých řádcích máme právě koeficienty u jednotlivých mocnin z výrazu (1.5), např. poslední uvedený řádek říká
(a + bf
■ 5cľb ■
10a V
10a V
■5ab4
Řešení. Nejprve umístíme např. bílou věž. Pro ni máme na výběr z 82 polí. Ve druhém kroku umístíme věž černou. Nyní máme „k dispozici" 72 polí. Podle pravidla součinu je výsledek 82 • 72 = 3 136.
□
V následujících příkladech už budeme při řešení používat pojmů kombinace, permutace, variace (případně s opakováním), které jsme definovali.
1.18. Během schůze má vystoupit 8 řečníků. Stanovte počet všech pořadí, v nichž dva předem určení řečníci nevystupují ihned po sobě.
Řešení. Označme si zmíněné dva řečníky jako osoby A a B. Pokud hned po vystoupení osoby A následuje vystoupení osoby B, můžeme na to nahlížet jako na projev jediného řečníka. Počet všech pořadí, v nichž vystupuje B ihned po A, je tedy roven počtu všech permutací ze sedmi prvků. Stejný je pochopitelně také počet všech pořadí, v nichž vystupuje A ihned po B. Neboť počet všech možných pořadí 8 řečníků je 8!, číslo 8! — 2 • 7! udává hledaný počet pořadí. □
1.19. Kolik existuje přesmyček slova PROBLÉM takových, že v nich
a) písmena B a R stojí vedle sebe,
b) písmena B a R nestojí vedle sebe.
Řešení, a) Dvojici písmen B a R můžeme považovat za jedno nedělitelné dvojpísmeno. Celkem tedy máme k dispozici šest různých písmen a šestipísmenných slov složených z různých písmen je 6!. V našem případě však tento počet musíme ještě vynásobit dvěma, neboť naše dvojpísmeno může být jak BR tak RB. Celkem dostáváme 2-6! různých přesmyček.
b) 7! — 2 • 6! (doplněk části a) do počtu všech sedmipísmenných slov složených z různých písmen). □
1.20. Kolika způsoby může sportovec umístit 10 různých pohárů do 5 polic, jestliže se na každou polici vejde všech 10 pohárů?
Řešení. K pohárům přidáme 4 navzájem nerozlišitelné předměty, kupř. tužky. Počet všech různých pořadí pohárů a tužek je zřejmě 14!/4! (tužky jsou nerozlišitelné). Každé umístění pohárů do polic ovšem odpovídá právě jednomu seřazení pohárů a tužek. Stačí třeba říci, že poháry před první tužkou v pořadí dáme do první police (při zachování pořadí), poháry před druhou tužkou do druhé police atd. To znamená, že číslo 14!/4! je výsledkem. □
1.21. Určete počet čtyřciferných čísel sestavených z právě dvou různých cifer.
11
KAPITOLA 1. ROZCVIČKA
druhu a p
1.8. Výběr s opakováním. Pořadí n prvků, z nichž mezi některými nerozlišujeme, nazýváme permutace s opakovaním.
Nechť je mezi n danými prvky p\ prvků prvního druhu, p2 prvků druhého druhu, až p\ prvků &-tého
■ p2 H-----h Pk — n. Potom počet pořadí těchto prvků
s opakováním budeme značit P(pi,pk).
Podobně jako u permutací a kombinací bez opakování, pro výběr prvního z nich máme n možností, pro další n — 1 a tak dále, až po poslední, který zbude. Přitom ale za stejná považujeme pořadí nerozlišitelných objektů. Těch je pro každou skupinku o pt objektech právě p i!, takže zřejmě platí
-| Permutace s opakováním ^,____»-_
P(pi,...,pk)
Pii
■Pk<-
Volný výběr k prvků z n možností, včetně pořadí, nazýváme variace k-tého stupně s opakováním, jejich počet budeme značit V(n,k). Volný výběr v tomto případě znamená, že předpokládáme, že stále máme pro výběr stejně možností, např. díky tomu, že vybrané prvky před dalším výběrem vracíme nebo třeba házíme pořád stejnou kostkou. Zřejmě platí
j Variace s opakováním j^.———~—
V(n,k) = n\
Pokud nás výběr zajímá bez zohlednění pořadí, hovoříme o kombinacích s opakováním a pro jejich počet píšeme C(n, k). Zde se na první pohled nezdá tak jednoduché, jak výsledný počet zjistit. Důkaz následující věty je pro matematiku typický - podaří se nám nový problém převést na problém jiný, který jsme už dříve zvládli. V našem případě je to převedení na problém standardních kombinací bez opakování.
J Kombinace s opakováním ——
Věta. Počet kombinací s opakováním k-té třídy z n prvků je pro všechna k > 0 a n > 1
C(n, k)
- k ■ k
Důkaz. Důkaz je opřen o trik (jednoduchý, jakmile ho pochopíme). Uvedeme dva různé postupy.
Představme si nejprve, že taháme postupně karty z balíku n různých karet. Abychom mohli případně některou z nich vytáhnout vícekrát, přidáme si k balíku ještě k — 1 různých žolíků (alespoň jednou určitě chceme jednu z původních karet). Řekněme, že postupně vytáhneme r původních karet a s žolíků, tj. r + s — k. Zdá se, že bychom měli vymyslet postup, jak z těch s žolíků poznat, které karty nám zastupují. Ve skutečnosti nám ale stačí diskuse počtů možností takových voleb.
K tomu můžeme použít matematickou indukci a předpokládat, že dokazovaná věta platí pro menší argumenty než jsou n a k. Skutečně potřebujeme obsáhnout kombinace s-té třídy s opakováním z pouze r původních karet, což dává (r+k~r~1) — f^1)' coz
Řešení. Dvě různé cifry použité na zápis můžeme vybrat (j0) způsoby, ze dvou vybraných cifer můžeme sestavit 24 — 2 různých čtyřciferných čísel (dvojku odečítáme za dvě čísla složená pouze z jedné cifry). Celkem máme (2°)(24 - 2) = 630 čísel. Nyní jsme ale započítali i čísla začínající nulou, těch je (j)(23 — 1) = 63. Celkově dostáváme 630 - 63 = 567 čísel. □
1.22. Určete počet sudých čtyřciferných čísel sestavených z právě dvou různých cifer.
Řešení. Obdobně jako v předchozím příkladu se nejprve nebudeme ohlížet na cifru nula. Dostaneme tak (j)(24 — 2) + 5 • 5(23 — 1) čísel (nejprve počítáme čísla pouze ze sudých cifer, druhý sčítanec udává počet sudých čtyřciferných čísel složených ze sudé a liché cifry). Opět musíme odečíst čísla začínající nulou, těch je (23 — 1)4 + (22 — 1)5. Hledaný počet cifer tak je
(24 - 2) + 5 • 5(2J - 1) - (2J - 1)4 - (2Z - 1)5 = 272.
□
1.23. Na koncertě je 730 lidí. Mají někteří z nich stejné iniciály? (Neuvažujeme háčky ani čárky)
1.24. Jak se může rozesadit pět osob v pětimístném autě, když jen dva z nich mají řidičský průkaz? Jak se může rozesadit 20 cestujících a dva řidiči v 25-místném minibuse?
Řešení. Na místě řidiče máme dvě možnosti a na zbylých místech už je pořadí libovolné, tzn. pro spolujezdce 4 možnosti, pro další místo 3, pak 2 a 1. Celkově 2-4! =48 možností. Podobně v minibuse máme dvě možnosti na místě řidiče a druhý řidič plus cestující mohou na zbylých 24 místech sedět libovolně. Nejprve vybereme místa, která budou obsazená, tj. (24) a na těchto místech může být 21! různých pořadí. Dohromady máme 2 • (^)21! = ^ možností. □
1.25. Kolika způsoby lze do tří různých obálek rozmístit pět shodných stokorun a pět shodných tisícikorun tak, aby žádná nezůstala prázdná?
Řešení. Nejdříve zjistíme všechna rozmístění bez podmínky neprázd-nosti. Těch je podle pravidla součinu (rozmísťujeme nezávisle stokoruny a tisícikoruny) C(3, 5)2 = Q . Odečteme postupně rozmístění, kdy je právě jedna obálka prázdná, a poté kdy jsou dvě obálky prázdné. Celkem C(3, 5)2-3(C(2, 5)2 - 2) -3 = Q2-3(62 - 2) -3 = 336.
□
12
KAPITOLA 1. ROZCVIČKA
je právě počet kombinací s-tého stupně (bez opakování) ze všech žolíků. Tím je věta dokázána.
Druhý přístup (bez matematické indukce): Na množině
S — {ai, a„],
ze které vybíráme kombinace, si zafixujeme uvedené pořadí prvků a pro naše volby prvků z S si připravíme n přihrádek, do kterých si již předem dáme v námi zvoleném pořadí po právě jednom prvku z S.
Jednotlivé volby x; e S přidáváme do přihrádky, která již tento prvek obsahuje. Nyní si uvědomme, že pro rozpoznání původní kombinace nám stačí vědět, kolik je prvků v jednotlivých přihrádkách. Například
a | bbb | cc \ d ~ * | * * * | ** | *,
vypovídá o volbě b,b,c z množiny S — {a, b, c, d}.
V obecném případě výběru k prvků z n možných tedy máme řetězec n + k znaků a počet C(n, k) je roven počtu možných umístění přihrádek | mezi jednotlivé znaky. To odpovídá výběru n — 1 pozic z n + k — 1 možných. Protože je
ín + k-\\ í n+k-1 \ ín+k-\\
V k )~ \n+k-l-k)~ V n-1 )'
je věta dokázána i podruhé. □
3. Diferenční rovnice
V předchozích odstavcích jsme viděli vzorce, které zadávaly hodnotu skalární funkce definované na přirozených číslech (fak-toriál) nebo dvojicích čísel (binomická čísla) pomocí předcházejících hodnot. Zatímco v odstavci 1.5 jsou kombinační čísla definována přímo spočítatelným výrazem, lze rozumět vztahům v 1.8 také tak, že místo hodnoty naší funkce zadáváme její změnu při odpovídající změně nezávislé proměnné.
Takto se skutečně velice často postupuje při matematické for-»_^lľ§' íSj^ rnulaci modelů, které popisují reálné systémy v eko-^í^^^-f/ nomice, biologii apod. My si tu povšimneme jen 1^^Íäŕ»~ několika jednoduchých případů a budeme se k této tématice postupně vracet.
1.9. Lineární diferenční rovnice prvního řádu. Obecnou diferenční rovnicí prvního řádu rozumíme výraz
f(n + 1) = F(n, /(«)),
kde F je známá skalární funkce závislá na dvojici přirozených čísel. Známe-li „počáteční" hodnotu /(O), můžeme spočítat /(l) — F(0, /(O)), poté f (2) — F(l, /(l)) atd. Tímto postupným způsobem můžeme tedy nakonec spočítat hodnotu f(n) pro libo volné n e N. Všimněme si, že tato úvaha je podobná konstrukci přirozených čísel z prázdné množiny nebo principu matematické indukce. Jako příklad může sloužit definiční formule pro faktoriál, tj.
(n + 1)! = (n + 1) •«!
Vidíme, že skutečně vztah pro f(n + 1) závisí na n i na hodnotě
Dalším obzvlášť jednoduchým příkladem je f(n) — C pro nějaký pevný skalár C a všechna n a tzv. lineární diferenční rovnice
(1.6) f(n + l) = a ■/(«)+ b,
kde a ^ 0, a b jsou známé skaláry.
1.26. Určete počet různých vět, které vzniknou přesmyčkami v jednotlivých slovech věty SKOKAN NA KOKS (vzniklé věty ani slova nemusejí dávat smysl).
Řešení. Určíme nejprve počty přesmyček jednotlivých slov. Ze slova SKOKAN dostaneme 6!/2 různých přesmyček (permutace s opakováním 1, 1, 1,2)), obdobně ze slova NA dvě a ze slova KOKS 4!/2. Celkem podle pravidla součinu (6!/2) • 2 • (4!/2) = 8640. □
1.27. Kolik existuj e různých přesmyček slova KRAKATIT takových, že mezi písmeny K je právě jedno jiné písmeno.
Řešení. V uvažovaných přesmyčkách je šest možností, jak umístit skupinu dvou K. Fixujeme-li pevně místa pro dvě písmena K, pak ostatní písmena můžeme rozmístit na zbylých šest míst libovolně, tedy P (1, 1,2,2) způsoby. Celkem podle pravidla součinu je hledaný počet
6 • 6!
6 • 1,2,2) =-= 1080.
2-2
□
1.28. Kolika způsoby můžeme do pěti různých důlků vybrat po j edné kouli, vybíráme-li ze čtyř bílých, čtyř modrých a tří červených koulí? Řešení. Nejprve řešme úlohu v případě, že bychom měli k dispozici alespoň pět koulí od každé barvy. V tomto případě se jedná o volný výběr pěti prvků ze tří možností, tedy o variace s opakováním (viz ). Máme
V(3, 5) = 35.
Nyní odečteme ty výběry, ve kterých se vyskytují buď pouze koule stejné barvy (takové výběry jsou tři), nebo právě čtyři koule červené (takových výběrů je 2 • 5 = 10; nejprve vybereme barvu koule, která nebude červená - dvě možnosti - a poté důlek, ve kterém bude - pět možností). Celkem tedy máme
35 - 3 - 10 = 230
možných výběrů. □
1.29. Kolika způsoby mohla skončit tabulka první fotbalové ligy, víme-li o ní, že žádné dva z trojice týmů Zbrojovka Brno, Baník Ostrava a Sigma Olomouc spolu v tabulce „nesousedí"?(Ligu hraje 16 mužstev.)
Řešení. První způsob. Hledaný počet spočítáme podle principu in-kluze a exkluze tak, že od počtu všech možných tabulek odečteme počet tabulek, ve kterých sousedí některá dvojice z uvedených tří týmů a přičteme počet těch tabulek, ve kterých sousedí všechny tři týmy. Hledaný počet tedy je
16! - (3 ) • 2! • 15! + 3! • 14! = 13599813427200.
13
KAPITOLA 1. ROZCVIČKA
Takovou diferenční rovnici umíme snadno řešit, je-li b — 0. Pak se totiž jedná o dobře známou rekurentní definici geometrické posloupnosti a platí
/(l) = a/(0), /(2) = fl/(l) = a2/(0) atd.
Máme tedy pro všechna n
f (n)
a" f (Q).
To je např. vztah pro tzv. Malťhusiánský model populačního růstu, který vychází z představy, že za zvolený časový interval vzroste populace s konstantní úměrou a vůči předchozímu stavu.
Dokážeme si obecný výsledek pro rovnice prvního řádu, které se podobají lineárním, ale připouští proměnné koeficienty a a b,
(1.7)
f(n + 1)
f(n) + bn.
Nejdříve se ale zamysleme, co mohou takové rovnice popisovat.
Lineární diferenční rovnici (1.6) můžeme pěkně interpretovat jako matematický model pro spoření nebo splácení úvěru s pevnou úrokovou mírou a a pevnou splátkou b (tyto dva případy se liší pouze znaménkem u parametru b).
S proměnnými parametry dostáváme obdobný model, ovšem „ s prorněnlivými jak úroky, tak splátkami. Můžeme si představit třeba n jako počet měsíců, a„ bude vy-
'r^,Y-r jadřovat úrokovou míru v měsíci n, b„ příslušnou y/^i=> splátku v měsíci n. Neděste se zdánlivě složitého sčítání a násobení v následujícím výsledku. Jde o typický příklad technického matematického tvrzení, kdy těžké je „uhodnout", jak zní. Naopak důkaz je už pak jen docela snadné cvičení na základní vlastnosti skalárů a matematickou indukci. Skutečně zajímavé jsou teprve důsledky, viz 1.11 níže.
Ve formulaci používáme vedle obvyklých znaků pro součet J2 také obdobné znaky pro součin Y\. V dalším budeme vždy používat také konvenci, že pokud u součtu je množina uvedených indexů prázdná, pak je součet nula, zatímco u součinu je ve stejném případě výsledek jedna.
1.10. Tvrzení. Obecné řešení diferenční rovnice (1.7) prvního řádu s počáteční podmínkou / (O) = y q je dáno vztahem
In-\
n—2 i n—\
(1.8) f(n) = f] ai) yo + X! ľ! ai hi + bn-1-
\Z=0 / 7=0 \i=j+l /
Důkaz. Tvrzení dokážeme matematickou indukcí. Zjevně tvrzení platí pro n — 1, kdy se jedná právě o definiční vztah /(l) — aoyo + &o-
Předpokládáme-li, že tvrzení platí pro nějaké pevně zvolené n, můžeme snadno spočíst
(/n-l \ n-2 / n-1 \
(na') y°+2Z na' i hí+b"-\Z=0 / 7=0 V = /+l /
+ b„
(n \ n — l í n \
Y\a>)y° + T, \ n ai\bJ + bn, í=0 / 7=0 \i=j+l
Jiné řešení. Zmíněné tři týmy budeme považovat za „oddělovače". Zbylých třináct týmů musíme rozdělit tak, aby mezi libovolnými dvěma oddělovači byl alespoň jeden tým. Navíc zbylé týmy můžeme mezi sebou nezávisle permutovat a rovněž tak oddělovače. Celkem tedy dostáváme
'14^
• 13! • 3! = 13599813427200
možností.
□
1.30. Pro libovolné pevné n e N určete počet všech řešení rovnice
xi +x2-\-----h xk = n
v množině nezáporných, kladných celých čísel.
Řešení. Každé řešení (r1; ..., rk), XÍ=i ri = n můžeme jednoznačně zašifrovat jako posloupnost jedniček a nul, ve které napíšeme nejprve r\ jedniček, pak nulu, pak r2 jedniček, nulu a tak dále. Posloupnost bude celkem obsahovat n jedniček a k — 1 nul. Každá taková posloupnost navíc zřejmě určuje nějaké řešení dané rovnice. Je tedy řešení tolik, kolik je posloupností, tedy
C. Diferenční rovnice
□
jak se přímo vidí roznásobením výrazů.
□
Diferenční rovnice (jinak řečeno též rekurentní vztahy) jsou vztahy mezi členy nějaké posloupnosti, přičemž následující člen je dán pomocí členů předchozích. Vyřešit diferenční rovnici pak znamená najít explicitní vzorec pro n-tý (libovolný) člen dané posloupnosti. Rekurentní vztah nám totiž po zadání několika prvních členů posloupnosti zadává n-tý člen přímo pouze pomocí postupného vyčíslení všech předchozích členů.
Pokud je následující člen posloupnosti určen pouze předchozím členem, hovoříme o diferenčních rovnicích prvního řádu. S nimi se můžeme v životě opravdu setkat, například, pokud si chceme zjistit dobu splácení nějaké půjčky při pevné měsíční splátce, nebo naopak chceme zjistit výši měsíční splátky, zadáme-li si dobu, za kterou chceme půjčku splatit.
1.31. Mirek si chce koupit nové auto, které stojí 300 000 Kč. Mirek by chtěl auto koupit na měsíční splátky. Prodávající společnost mu nabízí půjčku na koupi auta s ročním úrokem 6%. Mirek by chtěl auto splatit za tři roky. Jak vysoká bude měsíční splátka?
14
KAPITOLA 1. ROZCVIČKA
Opět si všimněme, že jsme pro důkaz nepotřebovali o použitých skalárech nic víc než vlastnosti komutativního okruhu.
1.11. Důsledek. Obecné řešení lineární diferenční rovnice (1.6) sa / la počáteční podmínkou /(O) = yo je
l-a"
(1.9)
f (ji) = a"y0 +
1 — a
Důkaz. Dosazením konstantních hodnot za a; a bt do obecného vzorce (1.8) dostáváme
f(n) = anyQ + b(\ + Ydan-^\
Pro vyčíslení součtu součinů v druhém sčítanci šije třeba všimnout,
že se jedná o výrazy (1+aH-----\-an~l)b. Součet této geometrické
řady spočteme ze vztahu 1 — a" — (1 — a)(l + a H-----h a"-1) a
dostaneme právě požadovaný výsledek. □
Všimněme si, že pro výpočet součtu geometrické řady jsme potřebovali existenci inverze pro nenulové skaláry. To bychom nad celými čísly neuměli. Poslední výsledek tedy platí pro pole skalárů a můžeme jej bez problému použít pro lineární diferenční rovnice, kde koeficienty a, b a počáteční podmínka / (O) — y o jsou racionální, reálné nebo komplexní, ale také nad okruhem zbytkových tříd Z* s prvočíselným k (zbytkové třídy budeme definovat v odstavci 1.41).
Pozoruhodné je, že ve skutečnosti vzorec (1.9) platí i s celočíselnými koeficienty a počáteční podmínkou. Pak totiž předem víme, že všechny f(n) budou také celočíselné, a celá čísla jsou podmnožinou v číslech racionálních. Musí proto nutně náš vzorec dávat ta správná celočíselná řešení, tady to asi není šikovné pjj pozornějším pohledu na důkaz je zřejmé, že l—a" je vždy
— příklady na zbytkové f v ✓ , , , v * .
třídy snad budou v dělitelné l — a, takže nás poslední pozorování nemělo překvapit.
druhém sloupci už XT. ✓ v . -jv. v .v i jii' m . ^ i o v
dříve,nejiépebybyioi Nicméně je vidět, ze treba nad skaláry ze La, a treba a — 3 uz z tohoto udéiat příklad neuspějeme, protože pak 1 - a = 2 je dělitelem nuly.
a odtud to přesunout r J r r J J
(nebo úplně vypustit)
1.12. Nelineární příklad. Vraťme se na chvíli k rovnici prvního řádu (1.6), kterou jsme použili na velice primitivní model populačního růstu závisející přímo úměrně na okamžité velikosti populace p. Na první pohled je zřejmé, že takový model vede při úměře a > 1 k příliš rychlému a hlavně neomezenému růstu.
Realističtější model bude mít takto úměrnou změnu populace Ap(n) — p(n + 1) — p(n) jen při malých hodnotách p, tj. Ap/p ~ r > 0. Pokud tedy budeme chtít nechat růst populaci o 5% za období při malém p, budeme r volit 0, 05. Při určité hmitní hodnotě p — K > 0 ale naopak už populace neroste a při ještě větších už klesá (třeba protože zdroje pro její obživu jsou omezené, jedinci ve veliké populaci si navzájem překáží apod.).
Předpokládejme, že právě hodnoty y„ — Ap(n)/p(n) se v závislosti na p(n) mění lineárně. Graficky si tedy tuto závislost můžeme představit jako přímku v rovině proměnných p a y, která prochází body [0, r] (tj. při p — 0 máme y — r) a [K, 0] (což dává druhou podmínku, že při p — K se populace nemění). Položíme proto
r
y = ~Yp + r-
Dosazením y„ za y a p(n) za p dostáváme
p(n + 1) - p(n)
Řešení. Označme S Mirkovu měsíční splátku. Předpokládejme, že při „koupi" auta Mirek zaplatí jednu měsíční splátku a pak po měsíci vždy další. Částku, kterou bude Mirek dlužit po uplynutí k měsíců, označme dk. Cenu auta označme C a měsíční úrok m (je tedy u = ^ř). Po prvním měsíci bude Mirek dlužit
di = C — S + u(C — S)
(na počátku Mirek splatí jednu splátku, zbytek dluhu se pak úročí). Obecně po uplynutí &-tého měsíce dluží Mirek
(1.2)
d\ — dfc—i — S -\- ud)
k-l-
Podle vztahu (1.9) je dk dáno následovně
1, yi = 1.
O
Lineární rekurentní vtahy se mohou vyskytnout například v geometrických problémech:
15
KAPITOLA 1. ROZCVIČKA
tj. roznásobením dostáváme diferenční rovnici prvního řádu (kde hodnota p (n) vystupuje v první i v druhé mocnině)
(1.10) p(n + l) = p(n)(l-^p(n) + r).
Zkuste si promyslet nebo vyzkoušet chování tohoto modelu W pro různé hodnoty r a A". Na obrázku je průběh hod--^g|f|v not pro parametry r — 0. 05 (tj. pětiprocentní nárůst Cmjyá^u v ideálním stavu), K — 100 (tj. zdroje hmitují hodnotu na 100 jedinců) a p(0) jsou dva jedinci.
i /
ío
HElINEAmt M/isloí r
(Mji^ jviU. foť
So
156
Zoo
Všimněme si, že počáteční přibližně exponenciální růst se skutečně později zlomí a hodnota se postupně blíží kýženému limitu 100 jedinců. Pro p blízké jedné a K daleko větší než r bude pravá strana rovnice (1.10) přibližně p(n)(l+r), tzn. chování je obdobné Malthusiánskému modelu. Naopak při p přibližně K bude pravá strana přibližně p (ji). Pro větší počáteční hodnoty p než K budou hodnoty klesat, pro menší než K růst, takže systém bude zpravidla postupně oscilovat kolem hodnoty K.
4. Pravděpodobnost
Teď se podíváme na jiný obvyklý případ skalárních hodnot tr> _ funkcí - sledované hodnoty často nej sou známy ani explicitně vzorcem, ani implicitně nějakým popisem. Jsou výsledkem nějaké nahodilosti a ■iffl'f' my se snažíme popsat s jakou pravděpodobností nastane ta či ona možnost.
1.13. Co je pravděpodobnost? Jako jednoduchý příklad může sloužit obvyklé házení kostkou se šesti stěnami s označeními
1, 2, 3, 4, 5, 6.
1.34. Na kolik nejvýše oblastí může dělit rovinu n přímek?
Řešení. Označme hledaný počet oblastí p„. Pokud v rovině nemáme dánu žádnou přímku, je celá rovina jedinou oblastí, je tedy po = 1. Pokud je v rovině dáno n přímek, tak přidáním n + 1 přibude nejvýše (n + 1) oblastí: oblastí přibude právě tolik, kolika (původními) oblastmi bude přímka procházet (každou takovou oblast rozdělí na dvě části, jedna oblast tedy přibude). Přidaná přímka může mít nejvýše n různých průsečíků s n přímkami, které už v rovnině byly. Část přímky mezi libovolnými dvěma sousedními průsečíky prochází právě jednou oblastí, celkem může přidaná přímka procházet nejvýše n+\ oblastmi, tedy může přibýt maximálně n + 1 oblastí, navíc v rovině bylo před přidáním (n + l)-ní přímky nejvýše p„ oblastí (tak jsme číslo p„ totiž definovali).
Celkem dostáváme rekurentní vztah
pn+1 = pn+(n + 1),
ze kterého získáme explicitní formuli pro p„ buď pomocí vzorce 1.10 nebo přímo:
Pokud popisujeme matematický model takového házení „poctivou" kostkou, budeme očekávat a tudíž i předepisovat, že každá ze stran padá stejně často. Slovy to vyjadřujeme „každá předem vybraná stěna padne s pravděpodobností g ".
Pokud si ale třeba sami nožíkem vyrobíme takovou kostku z kusu dřeva, je jisté, že skutečné relativní četnosti výsledků nebudou stejné. Pak můžeme z velikého počtu pokusů usoudit na relativní četnosti jednotlivých výsledků hodů a tyto ustanovit jako pravděpodobnosti v našem matematickém popisu. Nicméně při sebevětším počtu pokusů nemůžeme vyloučit možnost, že se náhodou povedla velice nepravděpodobná kombinace výsledků a že jsme proto náš matematický model skutečnosti pro naši kostku nevybrali dobře.
po + 1
i = \
pn = pn-i +n = pn_2 + (n-l)+n = pn-3 + (n - 2) + (n - 1) + n = ^ n(n + 1) n2 + n + 2
□
Rekurentní vztahy mohou mít i složitější podobu než je rekurze prvního řádu. Uvedme si příklady kombinatorických úloh, při jejichž řešení můžeme rekurze s výhodou využít.
16
KAPITOLA 1. ROZCVIČKA
V dalším budeme pracovat s abstraktním matematickým popisem pravděpodobnosti v nejjednoduším přiblížení. To, do jaké míry je takový popis adekvátní pro konkrétní pokusy či jiný problém, je záležitostí mimo samotnou matematiku. To ale neznamená, že by se tako-vým přemýšlením neměli zabývat matematikové (nejspíše ve spolupráci s jinými experty). Později se vrátíme k pravděpodobnosti coby teorii popisující chování nahodilých procesů nebo i plně determinovaných dějů, kde ovšem neznáme přesně všechny určující parametry.
Matematická statistika pak umožňuje posuzovat, do jaké míry lze očekávat, že vybraný model je ve shodě s realitou, resp. umožňuje určit parametry modelu tak, aby docházelo k co nejlepší shodě s pozorováním a zároveň umí odhadnout míru spolehlivosti zvoleného modelu.
K matematické pravděpodobnosti i statistice ovšem budeme potřebovat dosti rozsáhlý matematický aparát, který budeme mezitím několik semestrů budovat.
Na příkladu naší neumělé kostky si to můžeme představit tak, že v teorii pravděpodobnosti budeme pracovat s parametry pí pro pravděpodobnost jednotlivých hodnot stran a budeme požadovat pouze aby všechny tyto pravděpodobnosti byly nezáporné a jejich součet byl
1.35. Kolik existuje slov délky 12 složených pouze z písmen A a B, které neobsahují skupinu BBB1
Řešení. Nechť a„ značí počet slov délky n složených pouze z písmen A a B neobsahujících skupinu BBB. Pak pro a„ (n > 3) platí rekurentní vztah
neboť slova délky n splňující danou podmínku musí končit buď na A, nebo na AB, nebo na ABB. Slov končících na A je právě a„_i (před posledním A může být libovolné slovo délky n — 1 splňující danou podmínku). Obdobně pro zbylé dvě skupiny. Dále snadno vyčíslíme a\ = 2, a2 = 4, a3 = 1. Postupným dopočítáním
a12 = 1705.
Též bychom dle uvedené teorie mohli odvodit explicitní vzorec pro n-tý člen takto zadané posloupnosti. Charakteristický polynom dané rekurentní rovnice je x3 —x2 — x — 1 s jedním reálným a dalšími dvěma komplexními kořeny, které můžeme vyjádřit pomocí vztahů (|| 1.11|).
□
P1+ P2 + P3 + P4 + P5 + P6 — 1-
Při volbě konkrétních hodnot pi pro konkrétní kostku pak v matematické statistice budeme schopni odhadnout s jakou spolehlivostí tento model naší kostce odpovídá.
Naším skromným cílem je teď pouze naznačit, jak abstraktně zachytit pravděpodobnostní úvahy ve formalizova-ných matematických objektech. Následující odstavce tak budou ve své podstatě pouhými cvičeními v jednoduchých operacích nad množinami a jednoduché kombinatorice (tj. výpočtech počtu možností, jak mohou být splněny dané podmínky kladené na konečné množiny prvků).
1.14. Náhodné jevy. Budeme pracovat s neprázdnou pevně zvolenou množinou £2 všech možných výsledků, kterou nazýváme základní prostor. Pro jednoduchost bude pro nás £2 konečná množina s prvky &>i, ...,&>« představujícími jednotlivé možné výsledky. Každá podmnožina A c Q představuje možný jev. Systém podmnožin A základního prostoru se nazývá jevové pole, jestliže
• Q e A (tj. základní prostor je jevem),
• jsou-li A, B e A, pak A \ B e A (tj. pro každé dva jevy je jevem i jejich množinový rozdíl),
• jsou-li A, B e A, pak A U B e A (tj. pro každé dva jevy je jevem i jejich sjednocení).
1.36. Skóre basketbalového utkání mezi týmy Česka a Ruska vyznělo po první čtvtině 12 : 9 pro ruský tým. Kolika způsoby se mohlo vyvíjet skóre?
ŘešéraT
Označíme-li P^,i) počet způsobů, kterými se mohlo vyvíjet skóre basketbalového utkání, které skončilo k : l, tak pro k,l > 3 platí rekurentní vztah:
P(k,l) = P(k-i,l) + P(k-2,l) + P(k-\,l) + P(k,l-\) + P(j^2ji + f\(k,l-$)-
(Způsoby, kterými se mohlo vyvíjet utkání s výsledným skóre k : l, rozdělíme na šest po dvou disjunktních podmnožin podle toho, které družstvo vstřelilo koš a za kolik bodů (1, 2, či 3).) Ze symetrie úlohy zřejmě platí P^,i) = P(i,k) - Dále pro k > 3 platí:
P(k,2) = P(k-3,2) + P(k-2,2) + P(k-l,2) + P(k,l) + P(k,0), P(k,l) = P(k-3,l) + P(k-2,l) + P(k-1,1) + P(k,0), P(k,0) = P(k-3,0) + P(k-2,0) + ^(i-1,0).
což spolu s počátečními podmínkami P(o,o) = 1, ^(i,o) = 1, P(2,o) = 2,
P(3,0) = 4, P(U) = 2, P(2,i) = P(i,i) + P(0,1) + P(2,0) = 5, P(2,2) =
^(0,2) + ^(1,2) + P(2,i) + P(2,o) = 14 dává
p(12i9) = 497178513.
□
17
KAPITOLA 1. ROZCVIČKA
Zjevně je i komplement Ac — £2 \ A jevu A jevem, který nazýváme opačný jev k jevu A. Průnik dvou jevů je opět jevem, protože pro každé dvě podmnožiny A, P c <3 platí
A \ (£2 \ P) = A n B.
Slovy se tak dá jevové pole charakterizovat jako systém podmnožin (konečného) základního prostoru uzavřený na průniky, sjednocení a rozdíly. Jednotlivé množiny A e A nazýváme náhodné jevy (vzhledem k A).
Pro naše házení kostkou je £2 — {1, 2, 3,4, 5, 6} a jevové pole je tvořeno všemi podmnožinami množiny £2. Např. náhodný jev {1,3,5} pak interpretujeme jako „padne Uché číslo".
Něco málo terminologie, která by měla dále připomínat souvislosti s popisem skutečných modelů:
• celý základní prostor £2 se nazývá jistý jev, prázdná podmnožina 0 e A se nazývá nemožný jev,
• jednoprvkové podmnožiny {&>} c £2 se nazývají elementární jevy,
• společné nastoupení jevů Ai, i e /, odpovídá jevu n;e/A;, nastoupení alespoň jednoho zjevů Ai, i e /, odpovídá jevu
• A, B e A jsou neslučitelné jevy, je-li A n B = 0,
• jev A má za důsledek jev P, když A c B,
Přestavte si příklady všech uvedených pojmů pro jevový prostor popisující házení kostkou nebo obdobně pro házení mincí!
1.15. Definice. Pravděpodobnostní prostor je trojice (£2, A, P), kde A je jevové pole podmnožin (konečného) základního prostoru £2, na kterém je definována skalární funkce P : A -> R s následujícími vlastnostmi:
• P je nezáporná, tj. P(A) > 0 pro všechny jevy A,
• P je aditivní, tj. P (A U B) = P (A) + P (P), kdykoliv je A, P e AaA n P = 0,
Poznámka. Vidíme, že rekurentní vztah v tomto příkladu má složitější formu, než kterou jsme se zabývali v teorii a tudíž neumíme vyčíslit libovolné číslo P^,i) explicitně, nýbrž pouze postupným výpočtem od počátečních členů. Takové rovnice nazýváme parciální diferenční rovnice, protože členy posloupnosti jsou značeny dvěma nezávislými proměnnými (k,l).
O lineárních rekurentních formulích (diferenčních rovnicích) vyšších řádů s konstantími koeficienty si povíme více v kapitole 3.
D. Pravděpodobnost
Uvedme si několik jednoduchých příkladů na klasickou pravděpodobnost, kdy zkoumáme nějaký pokus, který má konečně mnoho možných výsledků („všechny případy") a nás zajímá, kdy výsledek pokusu bude náležet nějaké podmnožině možných výsledků („příznivé případy"). Hledaná pravděpodobnost je pak rovna poměru počtu příznivých případů ku počtu všech případů. Klasickou pravděpodobnost můžeme použít tam, kde předpokládáme (víme), že každý z možných výsledků má stejnou pravděpodobnost toho, že nastane (například při hodech kostkou).
1.37. Jaká je pravděpodobnost, že při hodu šestibokou kostkou padne číslo větší než 4?
Řešení. Všech možných výsledků je šest (tvoří množinu {1,2,3,4,5,6}), příznivé možnosti jsou dvě ({5,6}). Hledaná pravděpodobnost je tedy 2/6 = 1/3. □
1.38. Ze skupiny osmi mužů a čtyř žen náhodně vybereme skupinu pěti Udí. Jaká je pravděpodobnost, že v ní budou alespoň tři ženy?
Řešení. Pravděpodobnost spočítáme jako podíl počtu příznivých případů ku počtu všech případů. Příznivé případy rozdělíme podle toho, kolik je v náhodně vybrané skupině mužů: mohou v ní být buď dva, nebo jeden muž. Skupinek o pěti Údech s jedním mužem je osm (záleží pouze na výběru muže, ženy v ní musí být všechny), skupinek se dvěma muži je potom c(8, 2) • c(4, 3) = (!|) • (3) (vybereme dva muže z osmi a nezávisle na tom tři ženy ze čtyř, tyto dva výběry můžeme nezávisle kombinovat a podle pravidla součinu dostáváme uvedený počet skupin). Všech možných skupin o pěti lidech pak můžeme sestavit c (12, 5) = (j2). Hledaná pravděpodobnost je tedy
(?) '
□
Uvedme si příklad, při jehož řešení není vhodné používat klasické pravděpodobnosti:
18
KAPITOLA 1. ROZCVIČKA
• pravděpodobnost jistého jevu je l,tj. P(£Z) — 1. Funkci P nazýváme pravděpodobností na jevovém poli A.
Zjevně je okamžitým důsledkem našich definic řada prostých, ale užitečných tvrzení. Např. pro všechny jevy platí
P(AC) = 1 - P (A).
Dále můžeme matematickou indukcí snadno rozšířit aditivitu na jakýkoliv konečný počet vzájemně neslučitelných jevů A;- c Q, i e /, tj.
PQJi&IAi) = YjnAi),
i El
kdykoliv At n Aj — 0, pro všechna / / j, i, j e I.
1.16. Definice. Nechť ň je konečný základní prostor a nechť jevové pole A je právě systém všech podmnožin v £2. Klasická pravděpodobnost je pravděpodobnostní prostor (£2, A, P) s pravděpodobnostní funkcí
P : A
P(A) =
Q\
kde | A | značí počet prvků množiny A e A.
Zjevně takto zadaná funkce skutečně definuje pravděpodobnost, ověřte si samostatně všechny požadované axiomy.
1.17. Sčítání pravděpodobností. U neslučitelných jevů j e sčítání
§pravděpodobností pro výskyt alespoň jednoho z nich přímo požadováno v základní definici pravděpodobnosti. Obecně je sčítání pravděpodobností pro výskyty jevů složité. Problém totiž je, že pokud jsou jevy slučitelné, částečně máme v součtu pravděpodobností započteny příznivé výskyty vícekrát.
Nejjednodušší je si nejprve představit situci se dvěma slučitelnými jevy A, B. Uvažme nejprve klasickou pravděpodobnost, kde jde vlastně o počítání prvků v podmnožinách. Pravděpodobnost výskytu alespoň jednoho z nich, tj. pravděpodobnost jejich sjednocení, je dána vztahem
(1.11)
P (A U B) = P (A) + P (B) - P (A n B),
protože ty prvky, které patří do množiny A i B, jsme nejprve započetli dvakrát, a tak je musíme jednou odečíst.
Tentýž výsledek dostaneme i pro obecnou pravděpodobnost P na nějakém jevovém poli. Protože A n B a A \ B jsou nezávislé jevy, pak
P (A) = P(A \B) + P (A n B),
Podobně pro B máme
P(A U B) = P(A \B) + P (B \ A) + P(A n B).
Dosazením za pravděpodobnosti množinových rozdílů dostáváme opět vztah (1.11).
Následující věta je přímým promítnutím tzv. kombinatoric-kého principu inkluze a exkluze do naší konečné % pravděpodobnosti a říká, jakým způsobem vícenásobné započítávání výsledků kompenzovat v obecném případě.
Jde patrně o dobrý příklad matematického tvrzení, kde nejtěžší je najít dobrou formulaci a pak se dá říci, že (intuitivně) je tvrzení zřejmé.
1.39. Jaká je pravděpodobnost toho, že čtenář této úlohy vyhraje příští týden alespoň milión dolarů v loterii?
Řešení. Takováto formulace úlohy je neúplná, neposkytuje dostatek údajů. Předvedeme chybné řešení. Základní prostor všech možný jevů je dvouprvkový: buď vyhraje nebo nevyhraje. Příznivý jev je jeden (vyhraje), hledaná pravděpodobnost je tedy 1/2 (a to je zjevně špatná od-pověd). □
Poznámka. V předchozím příkladě je porušena základní podmínka použití klasické pravděpodobnosti, totiž to, že každý z elementárních jevů má stejnou pravděpodobnost toho, že nastane.
1.40. Do řady v kině o 2n místech je náhodně rozmístěno n mužů a n žen. Jaká je pravděpodobnost, že žádné dvě osoby stejného pohlaví nebudou sedět vedle sebe?
Řešení. Všech možných rozmístění lidí v řadě je (2n)\, rozmístění splňujících podmínky je 2(n\)2: máme dvě možnosti výběru pozice mužů, tedy i žen - buď všichni muži budou sedět na lichých místech (a tedy ženy na sudých), nebo všchni muži na sudých (a tedy ženy na lichých místech); na nich jsou pak muži i ženy rozmístěny libovolně. Výsledná pravděpodobnost je tedy
2(n\)2
p(n) = ——, p(2) = 0, 33, p(5) = 0, 0079, p(8) = 0, 00016. (2n)\
□
1.41. Do výtahu osmipatrové budovy nastoupilo 5 osob. Každá z nich vystoupí se stejnou pravděpodobností v libovolném poschodí. Jaká je pravděpodobnost, že vystoupí
i) všichni v šestém poschodí,
ii) všichni ve stejném poschodí,
iii) každý v jiném poschodí?
Řešení. Základní prostor všech možných jevů je prostor všech možných způsobů vystoupení 5 osob z výtahu. Těch je 85.
V prvním případě je jediná příznivá možnost vystoupení, hledaná pravděpodobnost je tedy ^, ve druhém případě máme osm možností, hledaná pravděpodobnost je tedy ^ a konečně ve třetím je počet příznivých případů dán pětiprvkovou variací z osmi prvků (z osmi pater vybíráme pět, ve kterých se vystoupí a dále kteří lidé vystoupí ve vybraných poschodích), celkem je hledaná pravděpodobnost ve třetím případě rovna (viz 1.6 a 1.8)
u(5,8) 8-7--4
V(5,8)
85
0,2050781250.
□
19
KAPITOLA 1. ROZCVIČKA
Na obrázku je situace znázorněna pro tři množiny A, B, C a pro klasickou pravděpodobnost. Jednoduše šrafované oblasti v prostém součtu máme dvakrát, dvojitě šrafované třikrát. Pak ty jednoduše šrafované jednou odečteme, přitom ty dvojitě šrafované opět třikrát odečteme, proto je tam nakonec ještě jednou započteme.
Obecně si díky aditivní vlastnosti pravděpodobnosti můžeme představit, že každý jev rozložíme na elementární (tj. jednobodové) jevy, jakkoliv ve skutečnosti nemusí jednoprvkové podmnožiny do uvažovaného jevového pole patřit. Pak je pravděpodobnost každého jevu dána součtem pravděpodobností jednotlivých elementárních jevů do něj patřících a můžeme při vyjádření pravděpodobnosti nastoupení alespoň jednoho z jevů postupovat takto: sečteme všechny pravděpodobnosti výsledků pro všechna A i zvlášť, pak ovšem musíme odečíst ty, které tam jsou započteny dvakrát (tj. prvky v průnicích dvou). Teď si ovšem dovolujeme odečíst příliš mnoho tam, kde ve skutečnosti byly prvky třikrát, tj. korigujeme přičtením pravděpodobností ze třetího členu, atd.
Věta. Buďte A\,..., Ak e A libovolné jevy na základním prostoru Q s jevovým polem A. Pak platí
k k-l k
P(uř=1Ai) = £>(Ai) - £ P(AinAj1
i — l i — l j—i-\-l
k-2 k-l k
+ E E E PÍAnAjnA,)-...
+ (-i)t-1P(A1nA2n...nAt).
Důkaz. Aby se výše naznačený postup stal důkazem, je zapotřebí si ujasnit, že skutečně všechny korekce, tak jak jsou popsány, jsou skutečně s koeficienty jedna. Místo toho můžeme snáze dát dohromady formálnější důkaz matematickou indukcí přes počet k jevů, jejichž pravděpodobnosti sčítáme. Zkuste si průběžně porovnávat oba postupy, mělo by to vést k vyjasnění, co to znamená „dokázat" a co „porozumět".
Pro k — 1 tvrzení zjevně platí, vztah pro k — 2 je totožný s rovností (1.11) a tu jsme pro obecné pravděpodobnostní funkce již dokázali také.
Předpokládejme tedy, že věta platí pro všechny počty množin až do pevně zvoleného k > 1. Nyní můžeme pracovat v indukčním kroku se vztahem pro k + 1 jevů, když sjednocení prvních k jevů bereme jako A ve vzorci (1.11) výše, zatímco zbývající jev hraje
1.42. Náhodně vybereme celé kladné číslo menší než 105. Jaká je pravděpodobnost, že bude složeno pouze z cifer 0, 1,5a zároveň bude dělitelné číslem 5?
Řešení. Čísel spňujích danou podmínku je 2 • 34 — 1 (kromě poslední cifry máme na každý řád na výběr ze tří cifer, případné číslice 0 na začátku slova nepíšeme. Všech celých kladných čísel menších než 105 je 105 — 1, podle klasické pravděpodobnosti dostáváme, že hledaná
pravděpodobnost je
2-34-l 10s —1 "
□
1.43. Ze sáčku s pěti bílými a pěti červenými koulemi náhodně vytáhneme tři (koule do sáčku nevracíme). Jaká je pravděpodobnost, že dvě budou bílé a jedna červená?
Řešení. Rozdělme uvažovaný jev na sjednocení tří disjunktních jevů: podle toho, kolikátou vytáhneme červenou kouli. Pravděpodobnosti, že vytáhneme koule přesně ve zvoleném pořadí jsou: 145 151
2 9 8' 2 9 2'
\ ■ | • \. Celkem
Jiné řešení. Uvažme počet všech možných trojic vytažených koulí (koule jsou mezi sebou rozlišitelné), tedy (3°). Trojic, které obsahují právě dvě bílé koule je potom (^) • (j) (dvě bílé koule můžeme vytáhnout (2) způsoby, k nim pak červenou pěti způsoby). □
1.44. Z klobouku, ve kterém je pět bílých, pět červených a šest černých koulí, náhodně vytahujeme koule (bez vracení). Jaká je pravděpodobnost, že pátá vytažená koule bude černá?
Řešení. Spočítáme dokonce obecnější úlohu. Totiž pravděpodobnost toho, že /-tá vytažená koule bude černá, je stejná pro všechna i, 1 < i < 16. Můžeme si totiž představit, že vytáhneme postupně všechny koule. Každá taková posloupnost vytažených koulí (od první vytažené koule po poslední), složená z pěti bílých, pěti červených a šesti černých koulí, má stejnou pravděpodobnost vytažení a pro výpočet hledané pravděpodobnosti můžeme opět použít model klasické pravděpodobnosti. Zmíněných posloupností je P(5, 5, 6) = 5]^l6] ■ Počet posloupností, kde na /-tém místě je černá koule, zbytek libovolný, je tolik, kolik je libovolých posloupností pěti bílých, pěti červených a pěti černých koulí, tedy f (5, 5, 5) = Celkem je tedy hledaná pravděpodobnost
P(5,5,5) P(5,5, 6)
15! 5!5!5!
16! 6!5!5!
□
Vraťme se k házení kostkou a zkusme popsat jevy ze základního prostoru £2 vznikající při házení tak dlouho, dokud nepadne šestka, ne však více než stokrát.
Pro jeden hod samostatně je základním prostorem šest čísel od jedné do šesti a jde o klasickou pravděpodobnost. Pro celé série našich
20
KAPITOLA 1. ROZCVIČKA
roli B:
P(U*+Í A,-) = P((uf=1Ai) U Ajt+i) k .
= E( E ŕ^i.n-.-nAi.)
7=1 1<í'i < — 0, potom
P(Ai n A2) = P{A2)P{Al\A2) = P(Ai)P(A2|Ai).
Všechna tato čísla vyjadřují pravděpodobnost toho, že nastanou oba jevy A\ i A2, jenom jinými způsoby. Například v posledním případě nejprve sledujeme, zda nastane první jev. Potom za předpokladu, že ten první nastal, sledujeme zda nastane i ten druhý. Podobně pro tři jevy A\, A2, a3 splňující P(A\ n A2 n a3) > 0 dostaneme
P(Ai n A2 n A3) = P(Ai)P(A2|Ai)P(A3|Ai n A2).
Slovy to lze opět popsat tak, že pravděpodobnost výskytu všech tří jevů zároveň můžeme spočítat tak, že se nejprve zabýváme výskytem pouze prvního z nich, potom druhého za předpokladu, že první už nastal, a naposledy třetího za předpokladu, že oba předešlé jevy již nastaly.
Máme-li obecný počet k jevů A1,..., A* splňujících P (A 1 n • • • n A*) > 0, pak věta říká následující:
P(Ai n ■ ■ ■ n A*) = P(Ai)P(A2|Ai)- • -P(Ak\Ai n • • • n Ak-X).
Skutečně, dle předpokladu jsou i pravděpodobnosti všech průniků, které jsou brány ve výrazu za hypotézy, nenulové. Pokrácením čitatelů a jmenovatelů získáme i napravo právě pravděpodobnost jevu odpovídajícího průniku všech uvažovaných jevů.
1.21. Geometrická pravděpodobnost. V praktických problémech se často setkáváme s daleko složitějšími modely, kde základní prostor není konečnou množinou. Nemáme momentálně k dispozici ani základní nástroje pro dostatečné zobecnění pojmu pravděpodobnosti, nicméně můžeme uvést alespoň jednoduchou ilustraci.
Uvažme rovinu R2 dvojic reálných čísel a v ní podmnožinu Q se známým obsahem vol Q (symbol „vol" je od anglického „volume", tj. obsah/objem). Příkladem může sloužit třeba jednotkový čtverec. Náhodné jevy budou reprezentovány podmnožinami A c Q a za jevové pole A bereme nějaký vhodný systém podmnožin, u kterých umíme určit jejich obsah. Nastoupení nebo nenastoupení jevu je dáno výběrem bodu v £2, kterým se trefíme nebo netrefíme do množiny reprezentující jev A.
Uvažme jako příklad problém, kdy náhodně vybereme dvě hodnoty a < bv intervalu [0, 1] c R. Všechny hodnoty a i b jsou stejně pravděpodobné a otázka zní , jaká je pravděpodobnost, že interval (a, b) bude mít velikost alespoň jedna polovina?". Volba čísel a, b je volbou libovolného bodu [a, b] ve vnitřku trojúhelníku ň s hraničními vrcholy [0, 0], [0, 1], [1, 1] (viz obrázek).
Pravděpodobnost toho, že žádný člověk neobdrží „svůj" dopis je tedy
(-1)*
*=0
k\
a hledaná pravděpodobnost pak
■-E
k=0
(-1)* _ 53 k\ ~ 144'
□
Poznámka. Všimněme si, že odpověď na stejnou otázku se s rostoucím počtem dopisů příliš nemění. Pro n dopisuje pravděpodobnost, že sekretářka nedá žádný do správné obálky, rovna
^ k\ e
Jak totiž uvidíme později, uvedená suma konverguje (blíží se) k hodnotě í/e.
Podobně lze řešit příklad || 1.1551|.
Následující příklad je jednoduchým modelem, který odhaduje pravděpodobnost úmrtí osoby při dopravní nehodě.
1.46. Ročně zahyne na silnicích v ČR přibližně 1200 českých občanů. Určete pravděpodobnost, že někdo z vybrané skupiny pěti set Čechů zemře v následujících deseti letech při dopravní nehodě. Předpokládejte pro zjednodušení, že každý občan má v jednom roce stejnou „šanci" zemřít při dopravní nehodě a to 1200/107. Řešení. Spočítejme nejprve pravděpodobnost, že jeden vybraný člověk v následujících deseti letech nezahyne při dopravní nehodě. Pravděpodobnost, že nezahyne v jednom roce, je (1 — j^). Pravděpodobnost, že nezahyne v následujících deseti letech, je pak (1 — j^)10-Pravděpodobnost, že v následujících deseti letech nezahyne nikdo z daných pěti set lidí, je opět podle pravidla součinu (jedná se o nezávislé jevy) (1 — yj^)5000. Pravděpodobnost jevu opačného, tedy toho, že někdo z vybraných pěti set lidí zahyne, je
5000
= 0,4512.
□
Poznámka. Model, který jsme použili v předchozím příkladu k popisu zadané situace, je pouze přibližný. Problém spočívá v podmínce, že každý občan z vyšetřovaného vzorku má stejnou pravděpodobnost toho, že v průběhu roku zahyne, kterou jsme odhadli z počtu usmrcených osob za rok. Počet tragických nehod se totiž rok od roku mění a i kdyby se neměnil, tak se mění populace. Ukažme si jednu s nepřesností příkladu na jiném způsobu řešení: zahyne-li 1200 osob za rok, tak za deset let zahyne 12000. Pravděpodobnost toho, že konkrétní
23
KAPITOLA 1. ROZCVIČKA
Úlohu si můžeme představit jako popis problému, kdy se hodně unavený účastník večírku nad ránem pokouší dvěma řezy rozdělit párek na tři díly pro sebe a své dva kamarády. Jaká je pravděpodobnost, že se na někoho dostane aspoň půlka?
Odpověď je docela jednoduchá: Podobně jako u klasické pravděpodobnosti definujeme pravděpodobnostní funkci P : A -> M vztahem
vol A
P(A) =-,
vol Q
kde A jsou podmnožiny v rovině, které odpovídají námi vybraným jevům.
Potřebujeme tedy znát plochu podmnožiny, která odpovídá bodům s b > a + ^, tj. vnitřku trojúhelníku A ohraničeného vrcholy [0, i], [0, 1], [i, 1]. Evidentně dostáváme P (A) = \.
Zkuste si samostatně odpovědět na otázku „pro jakou požadovanou minimální délku intervalu (a, b) dostaneme pravděpodobnost jedna polovina?".
1.22. Metody Monte Carlo. Jednou z účinných výpočetních měří' tod přibližných hodnot je naopak simulace známé takovéto pravděpodobnosti pomocí relativní četnosti nastoupení vhodně zvoleného jevu. Např. známá formule pro ob-sah kruhu o daném poloměru říká, že obsah jednotkového kruhu je roven právě konstantě
ti = 3, 1415...,
která vyjadřuje poměr obsahu kruhu a druhé mocniny jeho poloměru. (Tady si také povšimněme východiska, které jsme nedokázali - proč by měl být obsah kruhu roven konstantnímu násobku druhé mocniny poloměru? Matematicky to budeme umět ukázat, až zvládneme tzv. integrování. Experimentálně si to ale můžeme ověřit níže uvedeným postupem s různými velikostmi strany čtverce.)
Pokud zvolíme za Q jednotkový čtverec a za A průnik Q a jednotkového kruhu se středem v počátku, pak vol A — \it. Máme-li tedy spolehlivý generátor náhodných čísel mezi nulou a jedničkou a počítáme relativní četnosti, jak často bude vzdálenost bodu [a, b] (určeného vygenerovanou dvojicí a, b) od počátku menší nezjedná, tj. a2 + b2 < 1, pak výsledek bude při velkém počtu pokusů s velikou jistotou dobře aproximovat číslo \n.
Numerickým postupům založeným na tomto principu se říká metody Monte Carlo.
člověk zahyne v průběhu deseti let tedy můžeme odhadnout i zlomkem 12000/107. Pravděpodobnost, že konkrétní osoba nezahyne v průběhu
10 let je tedy (1 — j^) (to jsou první dva členy binomického rozvoje (1 — j^)10)- Celkem dostáváme anolagicky jako v předchozím řešení odhad pravděpodobnosti
500
10*)
Vidíme, že oba odhady jsou velmi blízké.
0,4514.
Snaha použít matematických znalostí k výhře v nejrůznějších hazardních hrách je velmi stará. Podívejme se na jednoduchý příklad.
1.47. Alešovi zbylo 2500 Kč z pořádání tábora. Aleš není žádný ňou-ma: 50 Kč přidal z kasičky a rozhodl se jít hrát ruletu na automaty. Aleš sází pouze na barvu. Pravděpodobnost výhry při sázce na barvu je 18/37. Začíná sázet na 10 Kč a pokud prohraje, v další sázce vsadí dvojnásobek toho, co v předchozí (pokud na to ještě má, pokud ne, tak končí s hrou - byť by měl ještě peníze na nějakou menší sázku). Pokud nějakou sázku vyhraje, v následující sázce hraje opět o 10 Kč. Jaká je pravděpodobnost, že při tomto postupu vyhraje dalších 2550 Kč? (jakmile bude 2550 Kč v plusu, tak končí)
Řešení. Nejprve spočítejme, kolikrát po sobě může Aleš prohrát. Za-číná-li s 10 Kč, tak na n vsazení potřebuje
ln-\
10+20+- • -+10-2
n-l
10- E2'
10-
2" - 1 2 - 1
10-(2"-l).
Jak snadno nahlédneme, číslo 2550 je tvaru 10(2" — 1) a to pro n = 8. Aleš tedy může sázet osmkrát po sobě bez ohledu na výsledek sázky, na devět sázek by potřeboval již 10(29 — 1) = 5110 Kč a to v průběhu hry nikdy mít nebude (jakmile bude mít 5100 Kč, tak končí). Aby tedy jeho hra skončila neúspěchem, musel by prohrát osmkrát v řadě. Pravděpodobnost prohry při jedné sázce je 19/37, pravděpodobnost prohry v osmi po sobě následujících (nezávislých) sázkách je tedy (19/37)8. Pravděpodobnost, že v těchto osmi hrách vyhraje 10 Kč (při daném postupu) je tedy 1 — (19/37)8. Na to, aby vyhrál 2500 Kč, potřebuje 255 krát vyhrát po desetikoruně. Tedy opět podle pravidla součinu je pravděpodobnost výhry
0, 29.
Tedy pravděpodobnost výhry je nižší, než kdyby vsadil rovnou vše na jednu barvu. □
24
KAPITOLA 1. ROZCVIČKA
5. Geometrie v rovině
V posledních odstavcích jsme intuitivně používali elementární pojmy z geometrie reálné roviny. Teď budeme po-drobněji zkoumat, jak se vypořádávat s potřebou po-<5T^|gg!ř^ pisovat „polohu v rovině", resp. dávat do souvislostí polohy různých bodů roviny.
Nástrojem k tomu budou opět zobrazení, tentokrát to ale budou velice speciální pravidla přiřazující dvojicím hodnot (x, y) dvojice (w, z) — F(x, ý). Zároveň půjde o předzvěst úvah z oblasti matematiky, které se říká lineární algebra a kterou se budeme podrobně zabývat v dalších třech kapitolách.
1.23. Vektorový prostor R2. Podívejme se na „rovinu" jakožto na množinu dvojic reálných čísel (x, y) e R2. Budeme jim říkat vektory v R2. Pro takové vektory umíme definovat sčítání „po složkách", tj. pro vektory u = (x, y) av = (x1, ý) klademe
u + v — (x + x', y + y).
Protože pro jednotlivé složky platí všechny vlastnosti komutativní grupy, evidentně budou tyto vlastnosti platit i pro naše nové sčítání vektorů. Zejména tedy máme tzv. nulový vektor 0 — (0, 0), jehož přičtením k jakémukoliv vektoru v dostaneme opět vektor v. Záměrně teď používáme tentýž symbol 0 pro vektor i jeho skalární složky — z kontextu je vždy jasné, jakou „nulu" máme kdy na mysli.
Dále definujeme násobení vektorů a skalárů tak, že pro a € M a v — (x, ý) e R2 klademe
a ■ v — (ax, ay).
Zpravidla budeme znak • vynechávat a pouhé zřetězení znaků a v bude označovat skalární násobek vektoru. Přímo se ověří další vlastnosti pro násobení skaláry a, b a sčítání vektorů u,v, např.
a (u + v) — a u + a v, (a + b)u — a u + b u, a(bu) — (ab)u,
kde opět používáme stejný znak plus pro sčítání vektorů i skalárů. Tyto operace si můžeme dobře představit, jestliže uvažujeme vektory v jako šipky začínající v počátku 0 — [0, 0] a končící v bodě [x, y] v rovině.
Takové šipky pak můžeme přikládat jednu za druhou a to přesně odpovídá sčítání vektorů. Násobení skalárem a pak odpovídá natažení dané šipky na a-násobek. V
■2w +nr +
Nyní můžeme udělat podstatný krok: jestliže si zapamatujeme ^jfi „ dva významné vektory e\ — (1, 0) a e2 — (0, 1), pak ka-~~ ždý jiný vektor dostaneme jako
1.48. Samostatně si můžete vyzkoušet spočítat předchozí příklad za předpokladu, že Aleš sází stejnou metodou jako v předchozím příkladě, končí však až v okamžiku, kdy nemá žádné peníze (pokud nemá na vsazení dvojnásobku částky prohrané v předchozí sázce, ale má ještě nějaké peníze, začíná sázet znovu od 10 Kč).
Nyní si procvičme tzv. „podmíněnou" pravděpodobnost (viz (1.20)).
1.49. Jaká je pravděpodobnost toho, že při hodu dvěma kostkami padne součet 7, víme-li, že ani na jedné z kostek nepadlo číslo 2?
Řešení. Označme jako b jev, že ani na jedné kostce nepadne dvojka, jev „padne součet 7" označme jako A. Množinu všech možných výsledků budeme značit opět jako £2. Pak
p(A\b)
p(A n b) p (b)
\AC\B\
\B\
iní
\a n b\
\b\
Číslo 7 může padnout čtyřmi různými způsoby, pokud nepadne dvojka, tedy \A n b\ = 4, \b\ = 5 ■ 5 = 25, tedy
p(A\b) = —. V 1 ' 25
Všimněme si, že p (a)
i, tedy jevy A a S jsou závislé.
□
1.50. Michal má dvě poštovní schránky, jednu na gmail.com a jednu na seznam.cz. Uživatelské jméno má stejné na obou serverech, hesla různá (ale nepamatuje si, které heslo má na kterém serveru). Při zadávání hesla při přístupu do schránky se splete s pravděpodobností 5% (tj. jestliže chce zadat jemu známé slovo jako heslo, tak jej s pravděpodobností 95% skutečně správně na klávesnici zadá). Michal zadal na serveru seznam.cz jméno a heslo a server mu oznámil, že něco není v pořádku. Jaká je pravděpodobnost, že chtěl zadat správné heslo, ale pouze se „překlepnul" při zadávání? (Předpokládáme, že uživatelské jméno zadá vždy bez chyby.)
Řešení. Označme A jev, že Michal fyzicky zadal na serveru seznam.cz špatné heslo. Tento jev je sjednocením dvou disjunktních jevů:
A i : chtěl zadat správné heslo a přepsal se, A 2 : chtěl zadat špatné heslo (to z gmail.com) a buď se přepsal nebo ne.
Hledáme tedy podmíněnou pravděpodobnost p(Ai\A), ta je podle vztahu pro podmíněnou pravděpodobnost rovna
P(AiHA) P(Ai) P(Ai)
P(Ai|A) = ——-- =-—— =-—-.
p (A) p(AlUA2) p(Al) + p(A2)
Potřebujeme tedy určit pravděpodobnosti p(Ai) a p(A2). Jev Ai
je konjunkcí (průnikem) dvou nezávislých jevů: Michal chtěl zadat
KAPITOLA 1. ROZCVIČKA
u — (x, y) — x e\ + y ej.
Výrazu napravo říkáme lineární kombinace vektoru e\ a ej. Dvojici vektorů e — (e\, ej) říkáme báze vektorového prostom M2.
Jestliže si ale vybereme jiné dva vektory u, v, které nejsou jeden násobek druhého, tj. jinou bázi v M2, budeme moci udělat totéž. Lineární kombinace w —xu + yv nám pro všechny různé dvojice (x, y) dá právě všechny vektory w v rovině.
Nakonec můžeme nahlížet vektory jako naše šipky v abstraktní poloze, tj. zapomeneme na ztotožnění bodů v rovině s dvojicemi čísel. Jenom budou naše šipky všechny „upoutány" v bodě 0, který je zároveň nu-"^^^LX^ lovým vektorem. Zůstanou nám operace sčítání a násobení skaláry a teprve volbou báze e\,ej ztotožníme naši rovinu šipek s M2.
1.24. Afinní rovina. Když si pevně vyvolíme nějaký vektor u e R2, můžeme jej přičítat (tj. coby šipku přikládat) k libovolnému bodu P — [x, y]. Máme tak tedy s pevným vektorem definované posunutí, které každý bod roviny P zobrazí na P + u.
.P-
Zkusme teď úplně zapomenout na souřadnice a vnímat celou rovinu jako množinu, na které fungují naše posunutí. Takovou množinu A — R2 si můžeme představit z pohledu pozorovatele, který sedí v některém pevně zvoleném místě (můžeme mu říkat třeba bod xo, yo] e K2). Předpokládejme, že ji vnímá jako nekonečnou desku bez jakýchkoliv zvolených měřítek a popisů a jenom ví, co to znamená posunout se o libovolný násobek nějakého vektoru u e R2. Takové rovině budeme říkat „afinní rovina".
Aby mohl vidět kolem sebe „dvojice reálných čísel", musí si vybrat nějaký bod E\, kterému řekne „bod [1, 0]" a jiný bod Ej, kterému začne říkat „bod [0, 1]". Jinými slovy, zvolí si bázi e\ — (1, 0), ej — (0, 1) mezi vektory posunutí. Do všech ostatních se pak dostane tak, že poskočí „a-krát ve směru e\" a pak „fr-krát ve směru ej " a takovému bodu bude říkat „bod [a, b]". Pokud to bude dělat obvyklým způsobem, nebude výsledek záviset na pořadí, tzn. může také napřed jít fr-krát ve směru ej a pak teprve ve směru e\.
To, co jsme popsali, se nazývá volba (afinního) souřadného systému v rovině, bod O je jeho počátkem, a obecně každý bod P roviny je ztotožněn s dvojicí čísel [a,b], kterou také budeme psát jako posunutí P — O.
Budeme dále pracovat v pevně zvolených souřadnicích, tj. s dvojicemi reálných čísel, ale pro lepší orientaci budeme vektory
správné heslo a Michal se při zadávání přepsal. Dle zadání je pravděpodobnost prvního z nich 1/2, druhého 1/20, celkem P(Ai) = \ ■ ^ = (pravděpodobnosti násobíme, protože se jedná o nezávislé jevy). Dále je ze zadání P(A2) = \. Celkem P (A) = P(Ai) + P(A2) = Jo + \ = !o"' a můžeme vyčíslit:
P{AllA) = Ľ^}± = ^
1
21
□
Metodu geometrické pravděpodobnosti můžeme použít v případě, že daný základní prostor sestává z nekonečně mnoha elementárních jevů, které dohromady vyplňují nějakou oblast na přímce, rovině, prostoru (u které umíme určit její délku, obsah, objem, ...). Předpokládáme, že pravděpodobnost toho, že nastane elementární jev z určité podoblasti je rovna poměru její velikosti (délce, obsahu, ...) k velikosti celého základního prostoru.
1.51. Z Těšína vyjíždí vlaky co půl hodinu (směrem na Bohumín) a z tohoto směru přijíždějí také každé půl hodiny. Předpokládejme, že vlaky se mezi těmito dvěma stanicemi pohybují rovnoměrnou rychostí 72 km/h a jsou dlouhé 100 metrů, cesta trvá 30 minut, vlaky se míjejí někde na trase. Nevyspalý hazardér Jarek si vybere jeden z těchto vlaků a během cesty z Těšína do Bohumína náhodně vystrčí hlavu z okna na pět vteřin nad kolejiště pro protější směr. Jaká je pravděpodobnost, že mu bude uražena? (Předpokládáme, že jiné než zmíněné vlaky na trati nejezdí.)
Řešení. Vzájemná rychlost protijedoucích vlaků je 40 m/s, protijedoucí vlak mine Jardovo okno za dvě a půl sekundy. Prostor všech možností je tedy interval (0, 1800 s), prostor „příznivých" možností je potom interval délky 1,5 s ležící někde uvnitř předchozí úsečky. Pravděpodobnost uražení hlavy je tedy 7,5/1800 = 0, 004. □
1.52. Jednou denně někdy mezi osmou hodinou ranní a osmou ho-dinnou večerní vyjíždí náhodně autobus z Koločavy do Užhorodu. Jednou denně ve stejném časovém rozmezí jezdí jiný autobus náhodně opačným směrem. Cesta tam trvá pět hodin, zpět též pět hodin. Jaká je pravděpodobnost, že se autobusy potkají, jezdí-li po stejné trase?
Řešení. Prostor všech možných jevů je čtverec 12 x 12, Označíme -li doby odjezdu obou autobusů x, resp. y, pak se tyto na trase potkají právě když \x — y\ < 5. Tato nerovnost vymezuje v daném čtverci oblast „příznivých jevů". Obsah zbylé části spočítáme přímo jednodušeji, neboť je sjednocením dvou pravoúhlých rovnoramenných trojúhelníků o odvěsnách délky 7, tedy je roven 49, obsah části odpovídající „příznivým jevům" je tedy
26
KAPITOLA 1. ROZCVIČKA
zapisovat s kulatými závorkami místo hranatých u souřadnic bodů v afinní rovině.
1.25. Přímky v rovině. Když se náš pozorovatel umí posouvat o ■i; libovolný násobek pevného vektoru, pak také ví, co je to přímka.
Je to podmnožina p c A v rovině taková, že existují \Ů bod O a nenulový vektor v takové, že
p = {P e A; P — O — t ■ v, t € R}.
Popišme si P — P (t) e p ve zvolených souřadnicích s volbou
v = (a,P):
x(t) — x0 + a - t, y(t) — y0 + fj ■ t.
Protože vektor v — (a, fl) je nenulový, musí být aspoň jedno z čísel a, fJ různé od nuly. Když pro určitost předpokládáme, že třeba a / 0, pak vyloučíme t z parametrického vyjádření pro iaja jednoduchým výpočtem dostaneme
—fix + ay — —fJxo + ayo-
To je obecná rovnice přímky
(1.13) ax + by — c
se známým vztahem dvojice čísel (a,b) — (—fJ, a) a směrového vektoru přímky v — (a, fl)
(1.14)
aa + bß — 0.
144 — 49 = 95, celkem je hledaná pravděpodobnost p
KOLOCAVA - tAzttOWT>
95
144
0, 66.
•2° t/ÝJEzp zK- ^
1.53. Dvoumetrová tyč je náhodně rozdělena na tři díly. Určete pravděpodobnost, že alespoň jeden díl bude nejvýše 20 cm dlouhý. Řešení. Náhodné rozdělení tyče na tři díly je dáno dvěma body řezu, čísly x ay (nejprve tyč rozřízneme ve vzdálenosti x od počátku, nehýbeme s ní a dále ji rozřízneme ve vzdálenosti y od počátku). Pravděpodobnostní prostor je tedy čtverec C o straně 2 m. Umístíme-li čtverec C tak, aby dvě jeho strany ležely na kartézských osách v rovině, tak podmínka, že alespoň jeden díl má být nejvýše 20 cm dlouhý, nám vymezuje ve čtverci následující oblast O:
O = {(x, y) ěC I (x < 20) v (x > 180) v (y < 20) v (y > 180) V (\x - y\) < 20}. Jak snadno nahlédneme, zaujímá takto vymezená oblast ^ obsahu
čtverce.
□
E. Geometrie v rovině
Vraťme se na chvíli ke komplexním číslům. Komplexní rovina je totiž „normální" rovina, kde ovšem máme dáno něco navíc:
1.54. Interpretujte násobení imaginární jednotkou a vzetí komplexně sdruženého čísla jako geometrickou transformaci v rovině. Řešení. Imaginární jednotka i odpovídá bodu (0, 1) a všimněme si, že vynásobení jakéhokoliv čísla z = a + i b imaginární jednotkou dává výsledek
i ■ (a + i b) = —b + i a
27
KAPITOLA 1. ROZCVIČKA
Výraz nalevo v rovnici přímky (1.13) můžeme vidět jako skalární funkci F závislou na bodech v rovině a s hodnotami v R, samu rovnici pak jako požadavek na její hodnotu. Časem uvidíme, že vektor (a, b) je v tomto ^— případě právě směrem, ve kterém F nejrychleji roste. Proto bude směr kolmý na (a, b) právě tím směrem, ve kterém zůstává naše funkce F konstantní. Konstanta c pak určuje, kterou ze všech rovnoběžných přímek rovnice určuje.
Mějme nyní dvě přímky p a q a ptejme se po jejich průniku p n q. Ten bude popsán jako bod, splňující obě rovnice přímek současně. Pišme je takto
ax + by — r,
(1.15) , ,
cx + ay — s.
Opět můžeme levou stranu vnímat jako přiřazení, které každé dvojici souřadnic [x, y] bodů P v rovině přiřadí vektor hodnot dvou skalárních funkcí F i a f2 daných levými stranami jednotlivých rovnic (1.15). Můžeme tedy naše rovnice napsat jako jediný vztah F (v) — w, kde F je přiřazení, které vektor v popisující polohu obecného bodu v rovině (v našich souřadnicích) zobrazí na vektor zadaný levou stranou rovnic, a požadujeme, aby se toto zobrazení strefilo do předem zadané hodnoty w — (r, s).
1.26. Lineární zobrazení a matice. Přiřazení F, se kterými j sme ííÄí4J^' pracovali při popisu průniku přímek, mají jednu ve-lice podstatnou společnou vlastnost: respektují operace sčítání a násobení s vektory a skaláry, tj. respektují lineární kombinace:
F {a ■ v + b ■ w) — a ■ F{v) l, v, w €
■b- F(w)
pro všechna a, b e R, v, w e R2. Říkáme, že F je lineárni zob-
p2 j_ Ttj2 „ „íx»™» z? . mi2 v to2
razeni z itc do R , a píšeme F : Rz -> Rz. Slovy lze podmínku také vyjádřit tak, že lineární kombinace vektorů se zobrazuje na tutéž lineární kombinaci jejich obrazů, tj. lineární zobrazení jsou ta zobrazení, která zachovávají lineární kombinace.
Se stejným chováním jsme se setkali i v rovnici (1.13) pro přímku, kde šlo o lineární zobrazení F : R2 -> R a jeho předepsanou hodnotu c. To je také důvodem, proč jsou hodnoty zobrazení z — F(x, y) na obrázku vyobrazeny jako rovina v R3.
Stručně budeme zapisovat taková zobrazení pomocí tzv. matic a jejich násobení. Maticí rozumíme obdélníkové schéma skalárů, např.
a ^. ) nebo v — (
c dj \yy
hovoříme o (čtvercové) matici A a (sloupcovém) vektoru v. Jejich násobení definujeme takto:
A - v —
ax cx -
- by ■ dy
Podobně, můžeme místo vektoru v zprava násobit jinou maticí B stejného rozměru jako je A. Prostě aplikujeme předchozí formule po jednotlivých sloupcích matice B a obrdržíme jako výsledek opět čtvercovou matici.
Neumíme násobit vektor v zprava maticí A protože nám nevychází počty skalárů na řádcích v s počty skalárů ve sloupcích A. Umíme však napsat vektor w do řádku ?"i skalárů (tzv. transponovaný vektor) wT — (a, Z?) a ten zprava našimi maticemi A nebo vektory v již násobit
umíme.
což je v interpertaci v rovině znamená otočení bodu z o pravý úhel v kladném smyslu, tj. proti směru hodinových ručiček.
Přiřazení komplexně sdruženého čísla je symetrie podle osy reálných čísel:
z = (a + i b) h-> (a — i b) = z.
□
Nyní jeden známý, ale velmi pěkný příklad.
1.55. Určete součet úhlů, které v rovině M2 svírají s osou x postupně vektory (1, 1), (2, 1) a (3, 1)
Řešení. Uvážíme-li rovinu M2 jakožto Gaussovu rovinu komplexních čísel, tak uvedené vektory odpovídají komplexním číslům 1 + i, 2 + i a 3 + i a máme najít součet jejich argumentů, tedy podle Moivrovy věty argument jejich součinu. Jejich součin je (1 + i)(2 + i)(3 + i) = (1 + 3/)(3 + 0 = 10i, tedy ryze imaginární číslo s argumentem tt/2 a tedy hledaný součet je roven právě tt/2. □
1.56. Napište obecnou rovnici přímky p : x = 2 — t, y = í +3t, t e R.
Řešení. Vektor (—1, 3) je směrovým vektorem přímky p. Proto vektor (3, 1) je jejím normálovým vektorem a obecná rovnice přímky p má tvar
3x + y + c = 0
pro jisté c e M. Tuto konstantu c určíme dosazením x = 2, y = 1 (přímka p prochází bodem [2, 1] daným volbou t = 0). Získáváme tak c = — 1 a následně výsledek 3x + y — 1 = 0. □
1.57. Je dána přímka
p : [2,0] + f (3, 2), t € R. Určete její obecnou rovnici a nalezněte průnik s přímkou
q : [-l,2]+i(l,3), s e R.
Řešení. Souřadnice bodů na přímce jsou dány dle daného parametrického zadání jako x = 2 + 3t a y = 0 + 2t. Vyloučením parametru t ze soustavy těchto dvou rovnic dostáváme obecnou rovnici přímky p:
2x - 3y - 4 = 0.
Průnik s přímkou q získáme dosazením parametrického vyjádření bodů přímky q, tedy x = — 1 + s & y = 2 + 3s, do obecné rovnice přímky p:
2(-l+5)-3(2 + 3í)-4 = 0,
28
KAPITOLA 1. ROZCVIČKA
Snadno ověříme tzv. asociativitu násobení (propočítejte pro obecné matice A, B a vektor v detailně):
(A ■ B) ■ v = A ■ (B ■ v).
Místo vektoru v můžeme samozřejmě psát i libovolnou matici C správného rozměru. Stejně snadno je vidět i distributivita
A-(B + Q = A- B + A-C.
Neplatí však komutativita a existují „dělitelé nuly". Např.
0 1 0 0
0 0 0 1
0 1\ /O 0 0 0/' VO 1
0 1 0 0
0 o o o
Zejména vidíme, že násobení vektorů pevnou maticí zadává linerání zobrazení, a naopak, pomocí hodnot lineárního zobrazení F na dvou pevných vektorech báze už dostaneme celé příslušné zobrazení. Body v rovině jsou tedy obecně vzory hodnot lineárních zobrazení F roviny do roviny, přímky jsou obecně vzory hodnot lineárních zobrazení z roviny do reálné přímky R. S maticemi a vektory umíme rovnice pro přímky a body psát
(a b)
Ve zvláštních situacích tomu tak být nemusí. Tak třeba průnikem dvou stejných přímek je opět sama přímka (a vzorem vhodné hodnoty pro takové lineární zobrazení bude celá přímka), nulové zobrazení má za vzor nuly celou rovinu. V prvém případě to poznáme tak, že jsou nalevo v rovnicích (1.15) stejné výrazy až na skalární násobek (nebo jinak řečeno, řádky matice A jsou stejné až na skalární násobek). V takovém případě buď nebude v průniku příslušných přímek žádný bod (rovnoběžné různé přímky) nebo tam budou všechny body přímky (stejné přímky). Tuto podmínku může vyjádřit tak, že poměry a/c ab/d musí být stejné, neboli
(1.16)
ad — bc — 0.
Všimněme si, že toto vyjádření už zahrnuje i případy, kdy c nebo ŕ/ je nulové.
1.27. Determinant matice. Výrazu nalevo v (1.16) říkáme determinant matice A a píšeme pro něj
det A
ad — bc.
Naši diskusi teď můžeme vyjádřit takto:
Tvrzení. Determinant je skalární funkce det A definovaná na všech maticích A a rovnice A ■ v — u je jednoznačně řešitelná, právě když je det A ^ 0.
Zkuste promyslet, že pro tuto úvahu bylo podstatné, že pracujeme s polem skalárů. Například nad celými čísly obecně neplatí. Když prostě spočteme řešení rovnic s celočíselnými koeficienty (tj. matice A má pouze celočíselné vstupy), tak toto řešení celočíselné být nemusí.
odkud s = —12/7 a dosazením do parametrického vyjádření přímky q dostáváme souřadnice průsečíku P:
19 22"
"T' ~y
□
1.58. Stanovte průsečík přímek
p : x + y — 4 = 0, q : x -
-1 + 2t, y = 2 + t, ŕ e
Řešení. Nejdříve poznamenejme, že směrovým vektorem přímky p je up = (1,-1) (libovolný nenulový vektor kolmý k vektoru (1,1) z obecné rovnice přímky) a směrovým vektorem přímky q je uq = (2, 1). To, že vektor up není násobkem vektoru uq, pak zaručuje, že se přímky protínají (přímky nejsou rovnoběžné). Bod [x, y] je hledaným průsečíkem, právě když jeho souřadnice vyhovují rovnici přímky p a současně existuje reálné číslo t, pro které
x = -1 + 2t, y = 2 + t.
Dosadíme-li odsud do obecné rovnice p, obdržíme
(-l+2ř)+ (2 + ř)-4 = 0.
Této rovnici vyhovuje právě t = 1, což dává průsečík se souřadnicemi
x = \,y = 3. □
1.59. Najděte obecnou rovnici přímky p, jež prochází bodem [2,3] a je rovnoběžná s přímkou x — 3 y + 2 = 0, a parametrickou rovnici přímky q procházející body [1, 3] a [—2, 1].
Řešení. Každá přímka rovnoběžná s přímkou x— 3 y +2 = Oje zadána rovnicí
x - 3y + c = 0
pro nějaké cel Přímka p prochází bodem [2, 3]. Musí tedy platit
2-3-3 + c = 0, tj. c = l. Pro přímku q lze ihned uvést její parametrické vyjádření
q : [1, 3] + t (1 - (-2), 3 - 1) = [1, 3] + t (3, 2), t e R.
□
1.60. Zjistěte, zda některé z přímek
pi : 2x + 3y — 4 = 0, p2 '■ x — y + 3 = 0, pi, : — 2x + 2y = —6,
P4
y + 2 = 0, p5 : x = 2 + t, y
t, t e
(ne)jsou totožné. Řešení. Je vidět, že
-2 •
y + 2 = 2x + 3y - 4.
29
KAPITOLA 1. ROZCVIČKA
1.28. Afinní zobrazení. Podíváme se, jak maticová symbolika t7 umožňuje pracovat s jednoduchými zobrazeními v ■ť^SPflw annní rovině. Viděli jsme, že násobením maticí je LM,^*^~_ dáno linerání zobrazení. Posunutí v afinní rovině M2 o pevný vektor t — (r, s) e R2 umíme v maticové formě také snadno zapsat:
x + r y + s
Jestliže k výsledku lineárního zobrazení ještě dovolíme přičíst pevný vektor t — (r, s), pak naše zobrazení bude mít tvar
t =
ax + by cx + dy
Takto jsou popsána právě všechna tzv. afinní zobrazení roviny do sebe.
Taková zobrazení nám umožní přepočítávání souřadnic vznik-\. lých různými volbami počátků a bází směrů pro posunutí. Co se stane, když náš pozorovatel z odstavce 1.23 bude tutéž rovinu shlížet z jiného bodu nebo si aspoň vybere jiné body E\,EtP. Zkuste si promyslet, že na úrovni souřadnic to skutečně bude právě změna realizovaná pomocí afinního zobrazení. Časem budeme vidět obecné důvody, proč tomu tak je ve všech dimenzích.
1.29. Euklidovská rovina. Přidejme nyní schopnost našeho pozorovatele vidět vzdálenosti. Např. může věřit obvyklému vzorci pro velikost vektoru v — (a,b)
= 4ä2-
b2
v jím zvolených afinních souřadnicích. Okamžitě pak můžeme definovat pojmy jako jsou úhel a otočení v rovině.
Jednoduše si to můžeme představit takto: náš člověk se rozhodne o nějakých bodech E\ a E2, že jsou od něj ve !>JlL' vzdálenosti jedna, a zároveň si řekne, že jsou na sebe ■žfrSfe- kolmé. Vzdálenosti ve směrech souřadných os pak jsou dány příslušným poměrem, obecně používá Euklidovu (nebo Pythagorovu) větu. Odtud vyjde právě výše uvedený vzorec.
tlAKLIDOI/SK//
Obecné rovnice pi&p4 tudíž zadávají stejnou přímku. Normálový vektor přímky p\ je (2, 3), pro přímku P2 je (1, —1), pro pj, je (—2, 2) apro/?5Je(l, 1) (kolmý vektor k vektoru (1, — 1)). Přímky P2 a pj, jsou rovnoběžné (normálový vektor jedné je násobkem normálového vektoru druhé). Další dvojice rovnoběžných přímek neexistují. Neboť soustava
x - y + 3 = 0, -2x + 2y + 6 = 0
zjevně nemá řešení, přímky p\ a P4 tvoří jedinou dvojici totožných přímek. □
1.61. Určete přímku p,která je kolmá k přímce q : 6x—7y+\3 = 0 a prochází bodem [—6, 7].
Řešení. Protože normálový vektor přímky q je směrový vektor přímky p, můžeme bezprostředně napsat výsledek
p : x
+ 6ř, y =1 -It, t €
□
1.62. Udejte příklad čísel a, b e M, pro něž je vektor u normálovým vektorem přímky AB, je-li A = [1, 2], B = [2b, b], u = (a — b, 3).
Řešení. Směrovým vektorem přímky AS je (2b — \,b — 2) (tento vektor je vždy nenulový), a proto jejím normálovým vektorem je (2 — b, 2b — 1). Položíme-li
2-b
2b - 1
dostáváme a = b = 2.
□
1.63. Určete vzájemnou polohu přímek p a q y rovině, jestliže je p :2x — y — 5 = 0aq : x+2y — 5 = 0. Pokud se jedná o různoběžky, nalezněte souřadnice jejich průsečíku.
Řešení. Z obecných rovnic přímek p, q známe jejich normálové vektory (2, —1), (1, 2). Přímky j sou rovnoběžné právě tehdy, je-li normálový vektor jedné násobkem normálového vektoru druhé, což zřejmě pro přímky p, q splněno není. Jde tedy o různoběžky. Průsečík nalezneme vyřešením soustavy
2x - y - 5 = 0, x + 2y - 5 = 0.
Když z první rovnice vyjádříme y = 2x — 5 a dosadíme za y do druhé, získáme
x + 2(2x - 5) - 5 = 0, tj. x = 3.
Poté snadno určíme y dě [3, 1].
2-3 — 5 = 1. Přímky se tak protínají v bo-
□
30
KAPITOLA 1. ROZCVIČKA
Náš pozorovatel roviny může samozřejmě postupovat i jinak. Může použít nějaký standard pro skutečné měření vzdálenosti bodů P a Q v rovině a říci, že to je právě velikost vektoru Q — P, který potřebujeme na posunutí z P do Q. Pak si vybere nějaký z vektorů, které skutečně mají velikost 1 a třeba pomocí trojúhelníku o stranách s velikostmi 3,4 a 5 zkonstruuje kolmý vektor o velikosti jedna a dále pokračuje jako výše.
Euklidovská rovina je afinní rovina s výše zavedeným pojmem vzdálenosti.
1.30. Úhel vektorů. Jak jsme již používali při diskusi komplexních čísel coby bodů v rovině, tzv. goniometrická ^____funkce cos M2 lze vcelku snadno uhádnout: Je-li totiž výsledkem matice se sloupci (a, c) a (b, d), pak první sloupec dostaneme násobením této matice s prvním vektorem báze (1,0) a druhý je vyčíslením na druhém vektoru báze (0, 1).
1.64. Uvažujme rovinu M2 se standardní soustavou souřadnic. Z počátku [0, 0] je vyslán laserový paprsek ve směru (3, 1). Dopadne na zrcadlovou přímku p danou parametricky jako
p : [4,3] + ř(-2, 1)
a poté se odrazí (úhel dopadu je shodný s úhlem odrazu). V jakém bodě dopadne odražený paprsek na přímku q, danou parametricky jako
q : [7,-10] +f (-1,6)?
Řešení. Směr paprsku svírá s přímkou p úhel 45°, odražený paprsek tedy bude kolmý na dopadající, jeho směrový vektor bude (1,-3) (Pozor na orientaci! Daný směrový vektor můžeme též získat například zrcadlením (osovou symetrií) podle kolmého vektoru k přímce p.) Paprsek dopadne v bodě [6,2], odražený paprsek tedy bude mít rovnici
[6, 2] +ř(l, -3), t > 0.
Průnik přímky dané odraženým paprskem s přímkou q je bod [4, 8], což je mimo polopřímku,kteráje daná odraženým paprskem (ř = —2). Odražený paprsek tedy přímku q neprotne. □
Poznámka. Odraz paprsku v třírozměrném prostoru je studován v příkladu ||3.55||.
1.65. Z bodu [—2, 0] vyrazila v pravé poledne konstantní rychlostí 1 ms-1 ve směru (3, 2) úsečka délky 1. Rovněž v poledne vyrazila z bodu [5, —2] druhá úsečka délky 1 ve směru (—1, 1), ovšem dvojnásobnou rychlostí. Srazí se?
Řešení. Přímky, po kterých se pohybují dané úsečky, můžeme popsat parametrickým vyjádřením:
P
Obecná rovnice přímky p je
[-2, 0] + r(3,2), [5,-2] + í(-1,1).
2x - 3y + 4 = 0.
Dosazením parametrického vyjádření přímky q získáme průsečík p = [1,2].
Nyní se snažme zvolit jediný parametr t pro obě úsečky tak, aby nám odpovídající bod na přímkách p, resp. q, popisoval polohu počátku první, resp. druhé, úsečky v čase t. V čase 0 je první úsečka v bodě [—2, 0], druhá v bodě [5, —2]. Za čas t sekund urazí první úsečka t jednotek délky ve směru (3, 2) druhá pak 2t jednotek délky
31
KAPITOLA 1. ROZCVIČKA
ve směru (—1, 1). Odpovídající parametrizace jsou tedy
P
[-2,0] +
(3,2),
[5, -2] + řV2(-l, 1).
Počátek první úsečky dorazí do bodu [1, 2] v čase t\ = v 13 s, počátek druhé úsečky v čase ř = 2V2 s, tedy více než o půl vteřiny dříve. Tedy v době, kdy dorazí do průsečíku P počátek první úsečky, bude již konec druhé úsečky pryč a úsečky se tak nesrazí. □
Z obrázku je proto vidět, že pro rotaci o úhel \j/ proti směru hodinových ruček jsou v matici sloupce
cos ý sin \jf
- sin ý
cos \jf
Směr proti směru hodinových ruček označujeme jako kladný směr rotace, opačný je pak záporný. Proto dostáváme tvrzení:
-j Matice rotace
Rotace o předem daný úhel ý v kladném směru kolem počátku I souřadnic je dána maticí R f:
R,i
cos ý sin \jf
— sin ý cos \jf
Nyní, když už víme, jak vypadá matice otočení v rovině, můžeme ověřit, že otočení zachovává vzdálenosti a úhly (definované předešlým vzorcem). Označíme-li obraz vektoru v jako
R
vx cos ý — vy sin ý vx sin \jf + vy cos \jf
a podobně w' platí
Rý ■ w, pak lze snadno přepočítat, že opravdu
v'w' + v'w'
y y
VXWX + VyWy.
Předchozí výraz lze pomocí vektorů a matic napsat následovně
(Rý ■ w)T(Rý ■ v) — wTv.
Transponovaný vektor (Rý ■ w)T je roven wT ■ R^, kde R^ je tzv. transponovaná matice k matici Rý. To je matice, jejíž řádky tvoří sloupce původní matice a sloupce naopak tvoří řádky původní matice. Vidíme tedy, že matice otočení splňují vztah R^- Rý — I, matice / (někdy píšeme prostě 1 a máme tím na mysli jednotku v okruhu matic), je tzv. jednotková matice
<-(J T.
- [1, 0] ve směru [23, 36] a B =
1.66. Rovinný fotbalista vystřelí míč z bodu F (3, 4) na bránu (úsečku) ohraničenou body A = [26, 30]. Směřuje míč do brány?
Řešení. Vzhledem k tomu, že se situace odehrává v prvním kvadrantu, stačí uvažovat směrnice vektorů FA, (3,4), FB. Tvoří-li (v tomto pořadí) buď rostoucí nebo klesající posloupnost, míč směřuje na bránu. Tato posloupnost je 36/22, 4/3, 30/25, což je klesající posloupnost, míč tedy směřuje do brány. □
1.67. Upravte (A — B)T ■ 2C ■ u, přičemž
Upravte (A 0 5
-2 2
B
2 0 -1 1
C
A-B
(A-B)1
Řešení. Dosazením
■2 5^ ■1 1,
a násobením matic dostáváme
-2 5
(A - B)T ■ 2C ■ u
1 10
2C
3
-4 10
-52 64
□
1.68. Uvedte příklad matic A a B, pro něž
(a) (A + B) ■ (A - B) £ A ■ A - B ■ B;
(b) (A + B) ■ (A + B) ^ A • A + 2A • B + B ■ B.
Řešení. Připomeňme, že uvažujeme dvojrozměrné (čtvercové) matice A a S. Pro libovolné matice A a S ovšem platí
(A + B) ■ (A - B) = A ■ A - A ■ B + B ■ A - B ■ B. Identitu
(A + B) ■ (A - B) = A ■ A - B ■ B tak dostaneme, právě když je — A • B + B ■ A nulovou maticí, tj. právě když matice A a B komutují. Příkladem hledaných matíc jsou tedy právě ty dvojice matic, které nekomutují (matice součinu se při záměně pořadí násobených matic změní). Můžeme např. zvolit
4 3 2 1
32
KAPITOLA 1. ROZCVIČKA
Tím jsme odvodili pozoruhodné tvrzení — matice F s vlastností, že F ■ Rý — I (budeme takové říkat inverzní matice k matici rotace Rý) je maticí transponovanou k původní. To je logické, neboť inverzní zobrazení k rotaci o úhel i/r je opět rotace, ale o úhel —ý, tj. inverzní matice R^ je rovna matici
cos(-ý) — sin (—ý) sm(-ip-) cos (—i/f)
cos ý sin ý - sin ý cos ý
Pokud bychom chtěli zapsat rotaci kolem jiného bodu P — O + w, P — [wx, wy] opět pomocí matice, snadno napíšeme potřebný vzorec pomocí posunutí:
Stačí si k tomu uvědomit, že můžeme místo rotace kolem daného bodu P napřed posunout P do našeho počátku, pak provést rotaci a pak udělat opačné posunutí, kterým celou rovinu vrátíme tam, kde měla celou dobu být, viz obrázek. Počítejme tedy
v — w i—> Rf ■ (v — w)
Rf ■ (v — w) + w cos ý(x — wx)
sin ijr(x
sin ijr(y wx) + cos ý(y -
- Wy) + WX Wy)) + W,
1.32. Zrcadlení. Dalším dobře známým příkladem zobrazení, která zachovávají velikosti, je tzv. zrcadlení vzhledem k přímce. Opět nám bude stačit popsat zrcadlení vzhledem k přímkám procházejícím počátkem O a ostatní se z nich odvodí pomocí posunutí, resp. rotací.
Hledejme tedy matici zrcadlení vzhledem k přímce s jednotkovým směrovým vektorem v svírajícím úhel ý s vektorem (1,0). Nejprve si uvědomme, že
Z0 =
1 0
neboť při této volbě je
A-B = {20 13> BA = {5 í Analogicky pro každou dvojici matic A, B platí
(A + B)-(A + B) = A-A + A-B + B- A + B-B.
To znamená, že
(A + B)-(A + B) = A-A + A-B + A-B + B-B
je splněno tehdy a jenom tehdy, když A-B = B A.Ne, druhém případě jsou tak hledané dvojice matic A, B zcela totožné s případem prvním.
□
1.69. Rozhodněte, zda jsou zobrazení F, G : M2 -> M? přiřazeními
lineární.
Řešení. Pro libovolný vektor (x, y)T eť můžeme vyjádřit
zadaná
y i \ 3
G
x\\ (1 -3S
yjj v-2 5
'2 2\ ix-A -9)
Odtud vyplývá, že obě zobrazení jsou afinní. Připomeňme, že afinní zobrazení je lineární, právě když se nulový vektor zobrazí sám na sebe. Neboť
zobrazení F je lineární, zobrazení G nikoli.
□
1.70. Buď dán pravidelný šestiúhelník ABCDEF (vrcholy jsou označeny poradě v kladném smyslu) se středem v bodě S = [1,0] a vrcholem A = [0, 2]. Určete souřadnice vrcholu C.
Řešení. Souřadnice vrcholu C získáme otočením bodu A okolo středu S šestiúhelníka o 120° v kladném smyslu:
'cos^O") - sin(120°)N sin(120°) cos(120°)
C
(A - S) + S
+ [1,0] = [--73,-1
□
1.71. Určete úhel, který svírají vektory
(a) u = (-3, -2), v = (-2,3);
(b) u = (2, 6), v = (-3, -9).
33
KAPITOLA 1. ROZCVIČKA
T-Í.O)
Obecně můžeme každou přímku otočit do směru vektoru (1,0) a tedy zapsat obecnou matici zrcadlení jako
Zf — Rf ■ Zq ■ R-ý,
kdy nejprve otočíme maticí R-ý přímku do „nulové" polohy, od-zrcadlíme maticí Zq a vrátíme zpět otočením Rý.
Můžeme proto (díky asociativitě násobení matic) spočíst:
Z'ý —
cos ý sin \jf
cos l/r sin \jf
— sin ý cos l/r
sin \jf
— cos l/r
cos2 ý — sin2 ý
1 0 \ / cos ý sin ^ 0 —1J \— sin ý cos ý
cos \jf sin i/f - sin \jf cos i/f
2 sin \jf cos i/f 2 sin ý cos i/f —(cos2 ý — sin2 i/r)
^cos2i/f sin2i/f ^sin2i/f — cos2i/fy
PoužiU jsme přitom obvyklé součtové vzorce pro goniometrické funkce. Povšimněme si také, že • Zq je dáno:
^cos2i/f sin2i/f \ /l 0 \ _ /cos2i//" — sin2i//"^ vsin2i/f — cos2\j/J \0 —1J \vsin2i/f cos2i//"
Toto pozorování lze zakreslit a zformulovat následovně
Řešení. Hledaný úhel
det A
splňuje všechny tři naše požadavky. Kolik takových zobrazení ale může být? Každý vektor umíme vyjádřit pomocí dvou bázových vektorů e\ — (1, 0) a e2 — (0, 1) a díky linearitě je tedy každá možnost pro vol A jednoznačně určena už vyčíslením na těchto vektorech. Protože ale pro obsah, stejně jako pro determinant, je zjevně vol A(e\,e\) — vol A(e2, e2) — 0 (kvůli požadované an-tisymetrii), je nutně každá taková skalární funkce jednoznačně zadána hodnotou na jediné dvojici argumentů (e\, e2). Jsou si tedy všechny možnosti rovny až na skalární násobek. Ten umíme určit požadavkem
1
vol A(ei, e2) - -,
tj. volíme orientaci a měřítko pomocí volby bázových vektorů, a chceme, aby jednotkový čtverec měl plochu jedna.
Vidíme tedy, že determinant zadává plochu rovnoběžníku určeného sloupci matice A a plocha trojúhelníku je tedy poloviční.
1.35. Viditelnost v rovině. Předchozí popis hodnot pro orientovaný obsah nám dává do rukou elegantní nástroj pro určování pozice bodu vůči orientovaným úsečkám. Orientovanou úsečkou rozumíme dva body v rovině R2 s určeným pořadím. Můžeme šiji představit jako šipku od prvého k druhému bodu. Taková orientovaná úsečka nám rozděluje rovinu na dvě poloroviny, říkejme jim „levou" a „pravou". Pro daný bod chceme poznat, jestli je v té levé nebo pravé.
Takové úlohy často potkáváme v počítačové grafice při řešení viditelnosti objektů. Pro zjednodušení si zde jen představme, že úsečku , je vidět" z bodů napravo a není vidět z těch nalevo (což odpovídá představě, že objekt ohraničený orientovanými hranami proti směru hodinových ručiček má nalevo od nich svůj vnitřek, přes který tedy není hranu vidět).
-1. dg -°. u :
Inverzní matici je v tomto případě jednoduché najít, protože vektory ve sloupcích jsou kolmé, tj. matice je (skoro) ortogonální. Máme
1 M =2 1 ° -1 1/ lo 1
1 1 -1 1
ii 1 1
2 l -1 1
'0 1
Vynásobením příslušných matic dostaneme výsledek ( ^ q |. Tento
výsledek se dá uhádnout i přímo z obrázku.
□
1.79. Zjistěte, jaká lineární zobrazení M2 do M2 jsou zadána maticemi (tj. popište jejich geometrický význam)
1 0 0 0
-1 0 0 1
Řešení. Nechť (x, y)T je nadále libovolný reálný vektor. Pro matici A\ dostáváme
což znamená, že lineární zobrazení, které tato matice zadává, je (kolmá) projekce na osu x. Podobně vidíme, že matice A2 určuje zrcadlení vzhledem k ose y, protože
y
Matici A3 lze vyjádřit ve tvaru
cos cp — sin cp sin cp cos cp
pro
S — (X — S), neboli X \-> 25 — X. (Obraz bodu X ve středové symetrii podle středu S dostaneme tak, že k souřadnicím bodu S přičteme souřadnice vektoru opačného k vektoru X — S.) Postupnou aplikací tří středových souměrností se středy S,TaU tak dostáváme X 25 - X 2T - (25 - X) ^ 2U - (2T - (25 - X)) = 2(U - T + 5) - X, celkem X h+ 2(U - T + 5) - X, což je středová souměrnost se středem S—T+U. Složení libovolného lichého počtu středových souměrností tak postupně redukujeme až na složení tří středových souměrností, jde tedy o středovou symetrii (v principu se jedná o důkaz matematickou indukcí, zkuste si jej sami zformulovat).
□
1.82. Sestrojte (2n + 1)-úhelník, jsou-li dány všechny středy jeho stran.
Řešení. K řešení využijeme toho, že složením lichého počtu středových souměrností je opět středová souměrnost (viz předchozí příklad). Označme vrcholy hledaného (2n + 1)-úhelníka po řadě A\, A2, ..., A2n+i a středy stran (počínaje středem strany AiA2) postupně 5i, 52,... S2n+i. Provedeme-li středové souměrnosti po řadě podle těchto středů, tak bod A! je zjevně pevným bodem výsledné středové souměrnost, tedy jejím středem. K jeho nalezení tedy stačí provést uvedenou středovou souměrnost s libovolným bodem X roviny. Bod A\ leží pak ve středu úsečky XX', kde X' je obrazem bodu X ve zmíněné středové symetrii. Další vrcholy A2,..., A2n+i získáme zobrazováním bodu A i ve středových souměrnostech podle 5i, ..., S2„+\. □
1.83. Určete obsah trojúhelníku ABC, je-li A [-2,0], C = [5,9].
[-8,1], B
37
KAPITOLA 1. ROZCVIČKA
pro vyjádření skutečnosti, že (a, b) patří do relace, a říkáme, že b je hodnotou zobrazení / v bodě a. Dále říkáme, že / je
• zobrazení množiny A do množiny B, jestliže je D — A,
• zobrazení množiny A na množinu B, jestliže je D — A a I — B, často také surjektivní zobrazení,
• prosté (často také injektivní zobrazení), jestliže je D — Aapro každé bel existuje právě jeden vzor a e A tak, že f (a) — b.
Vyjádření zobrazení / : A -> B jakožto relace / c A x B, f = {(a, f (a)); a e A} známe také pod názvem graf zobrazení f.
0: hmj$^ ,,-n
**** fa&&fll)jL
1.37. Skládání relací a funkcí. U zobrazení je jasná koncepce, jak se skládají. Máme-li dvě zobrazení / : A -> B a g : B -> C, pak jejich složení g o f : A -> C je definováno
(g o /)(«)= *(/(fl)).
Ve značení používaném pro relace totéž můžeme zapsat jako
/CA x 5, / = {(a, f (a)); a e A} g^BxC, g = {(b,g(b));beB} gofCAxC, gof = {(a,g(f(a)));aeA}.
Zcela obdobně definujeme skládání relací, v předchozích vztazích jen doplníme existenční kvantifikátory, tj. musíme uvažovat všechny „vzory" a všechny „obrazy". ľAi.\| Uvažme relace R {0, 1}, které "říkají", zda určitý prvek je či není v dané podmnožině). Na množině 2A máme relaci c danou vlastností „být podmnožinou". Je tedy X c. Z právě, když je X podmnožinou v Z. Evidentně jsou přitom splněny všechny tři vlastnosti pro uspořádání: skutečně, je-li X c. Y a zároveň Y c. X, musí být nutně množiny X a Y stejné. Je-li X c Y c Z, je také X c. Z. Reflexivita je také zřejmá.
Říkáme, že uspořádání < na množině A je úplné, když pro každé dva prvky a, b e A platí, že jsou srovnatelné, tj. buď a < b nebo b < a. Všimněme si, že ne všechny dvojice (X, Y) podmnožin v A jsou srovnatelné v tomto smyslu. Přesněji, pokud je v A více než jeden prvek, existují podmnožiny X aY, kdy není ani X c ľ ani ľ c X.
Připomeňme rekurentní definici přirozených čísel N = {0, 1,2, 3, ...},kde
0 = 0,
1 = {0, 1,2,...,«}.
Na této množině N definujeme relaci < následovně: m < n, právě když m e n nebo m — n. Evidentně jde o úplné uspořádání. Např. 2 < 4, protože
2 = {0, {0}} € {0, {0}, {0, {0}}, {0, {0}, {0, {0}}}} = 4.
Jinak řečeno, samotná rekurentní definice zadává vztah n < n + 1 a tranzitivně pak n < k pro všechna k, která jsou tímto postupem definována později.
1.39. Rozklad podle ekvivalence. Každá ekvivalence R na množině A zadává zároveň rozklad množiny A na
% podmnožiny vzájemně ekvivalentních prvků, tzv. třídy ekvivalence. Pro libovolné a e A uvažujeme třídu (množinu) prvků, které jsou ekvivalentní s prvkem a, tj.
Ra = {b e A; (a,b) e R}.
Často budeme psát pro Ra prostě [a], je-li z kontextu zřejmé, o kterou ekvivalenci jde.
Zjevně Ra — Rb, právě když (a,b) e R a každá taková třída ekvivalence je tedy reprezentována kterýmkoliv svým prvkem, tzv. reprezentantem. Zároveň Ra n Rb / 0, právě když Ra — Rb, tj. třídy ekvivalence jsou po dvou disjunktní. Konečně, A — UaeARa, tj. celá množina A se skutečně rozloží na jednotlivé třídy.
Můžeme také třídám rozkladu rozumět tak, že třídu [a] vnímáme jako prvek a „až na ekvivalenci".
1.40. Konstrukce celých a racionálních čísel. Na přirozených J „ číslech umíme sice sčítat a víme, že přičtením nuly se
číslo nezmění. Umíme i definovat odečítání, při něm ale jen někdy existuje výsledek v množině N. 5 ' Základní ideou konstrukce celých čísel z přirozených je tedy přidat k nim chybějící rozdíly. To můžeme udělat tak, že místo výsledku odečítání budeme pracovat s uspořádanými dvojicemi čísel, které nám samozřejmě vždy výsledek dobře reprezentují. Zbývá jen dobře definovat, kdy jsou (z hlediska výsledku odečítání) takové dvojice ekvivalentní. Potřebný vztah tedy je:
(a, b) ~ (a, b') ^==>- a — b — a — b' ^=>- a + b' — a + b.
Všimněme si, že zatímco výrazy v prostřední rovnosti v přirozených číslech neumíme, výrazy vpravo už ano. Snadno ověříme, že skutečně jde o ekvivalenci a její třídy označíme jako celá čísla Z.
3-3 1-3 3 - (tt - 2) 4 - (tt - 2)
0 -2 5 — Tt 6 — Tt
0 - (-2) • (5 - Tt) > 0,
1-3 4 - (Tt - 2)
-2-3 -2 - (Tt - 2)
-2 6 — Tt
-2 ■ (-Tt) - (-5) • (6 - Tt) >0.
Z bodu X jsou tedy vidět právě strany určené dvojicemi vrcholů [-2,-2], [2, 1] a [2, 1], [3, 3]. □
1.88. Uvedte strany pětiúhelníku s vrcholy v bodech [—2,-2], [—2,2], [1,4], [3,1] a [2,-11/6], které je možné vidět z bodu [300, 1].
Řešení. Pro zjednodušení zápisů „tradičně" položme
A = [—2, —2], B = [2,-11/6], C = [3, 1], D = [1,4], £" = [-2,2].
Strany BC a CD jsou zjevně z pozice bodu [300, 1] viditelné; naopak strany DE a EA být vidět nemohou. Pro stranu AB raději určeme
-2 - 300 2 - 300
1
-302 -(-y)- (-298) -(-3) <0.
Odsud plyne, že tato strana je z bodu [300, 1] vidět.
□
B - P 1 7
C - P 5 7
A - P 5 5
B - P 7 7
C - P 5 7
A - P — 5 5 <
1.89. Viditelnost stran trojúhelníka. Je dán trojúhelník s vrcholy A = [5, 6], B = [7, 8], C = [5, 8]. Určete, které jeho strany je vidět z bodu P = [0, 1].
Řešení. Uspořádáme vrcholy v kladném smyslu, tedy proti směru hodinových ručiček: [5, 6], [7, 8], [5, 8]. Pomocí příslušných determinantů určíme, je-li bod [0, 1] „nalevo" či „napravo" od jednotlivých stran trojúhelníka uvažovaných jako orientované úsečky,
> 0,
0.
Z nulovosti posledního determinantu vidíme, že body [0, 1], [5, 6] a [7, 8] leží na přímce, stranu A B tedy nevidíme. Stranu BC rovněž tak nevidíme, na rozdíl od strany AC, pro kterou je příslušný determinant záporný. □
1.90. Určete, které strany čtyřúhelníka s vrcholy A = [95, 99], B = [130, 106], C = [40, 60], D = [130, 120]. jsou viditelné z bodu [2, 0].
Řešení. Nejprve je třeba určit strany čtyřúhelníka („správné" pořadí vrcholů): ACBD. Po spočítání příslušných determinantů jako v předchozích příkladech zjistíme, že je vidět pouze strana CB. □
40
KAPITOLA 1. ROZCVIČKA
Na nich definujeme operaci sčítaní (a s ní i odečítání) pomocí reprezentantů, např.
[(a, b)] + [(c, d)] = [(a+c,b + d)],
což zjevně nezávisí na výběru reprezentantů.
Lze si přitom vždy volit reprezentanty (a, 0) pro kladná čísla a reprezentanty (0, a) pro čísla záporná, se kterými se nám bude patrně počítat nejlépe.
Tento jednoduchý příklad ukazuje, jak důležité je umět nahlížet na třídy ekvivalence jako na celistvý objekt a soustředit se na vlastnosti těchto objektů, nikoliv formální popisy jejich konstrukcí. Ty jsou však důležité k ověření, že takové objekty vůbec existují.
U celých čísel nám už platí všechny vlastnosti skalárů (KG1)-(KG4) a (01)-(04), viz odstavec 1.1. Pro násobení je neutrálním prvkem jednička, ale pro žádné číslo a různé od nuly a jedničky neumíme najít číslo a-1 s vlastností a ■ a~l — 1, tzn. chybí nám inverzní prvky pro násobení.
Zároveň si povšimněme, že platí vlastnost oboru integrity (Ol), viz 1.1, tzn. je-li součin dvou čísel nulový, musí být alespoň jedno z nich nula.
Díky poslední jmenované vlastnosti můžeme zkonstruovat racionální čísla Q přidáním všech chybějících inverzí zcela obdobným způsobem, jak jsme konstruovali Z z množiny N. Na množině uspořádaných dvojic (p,q),q ^0, celých čísel definujeme relaci ~ tak, jak očekáváme, že se mají chovat podíly p/q:
(p, q) ~ (p', q1) p/q = p' 14 p-q' = p' -q.
Opět neumíme očekávané chování v prostřední rovnosti v množině Z formulovat, nicméně rovnost na pravé straně ano. Zjevně jde o dobře definovanou relaci ekvivalence (ověřte podrobnosti!) a racionální čísla jsou pak její třídy ekvivalence. Když budeme formálně psát p/q místo dvojic (p,q), budeme definovat operace násobení a sčítání právě pomocí formulí, které nám jsou jistě dobře známy.
1.41. Zbytkové třídy. Jiným dobrým a jednoduchým příkladem Jsou tzv- zbytkové třídy celých čísel. Pro pevně zvolené přirozené číslo k definujeme ekvivalenci ~£ tak, že dvě čísla a, b e Z jsou ekvivalentní, jestliže jejich zbytek po dělení číslem k je stejný. Výslednou množinu tříd ekvivalence označujeme Z*. Nejjednodušší je tato procedura pro k — 2. To dostáváme Z2 — {0, 1}, kde nula reprezentuje sudá čísla, zatímco jednička čísla lichá. Opět lze snadno zjistit, že pomocí reprezentantů můžeme korektně definovat násobení a sčítání na každém Z*.
Věta. Zbytkové třídy Z* jsou komutativním tělesem skalárů (tj. splňují i vlastnost (P) z odstavce 1.1), právě když je k prvočíslo.
Pokud k prvočíslem není, obsahuje Z vždy dělitele nuly. Není proto ani oborem integrity.
Důkaz. Okamžitě je vidět druhé tvrzení. Jestliže x • y — k pro přirozená čísla x, y, pak samozřejmě je výsledek násobení příslušných tříd [x] • [y] nulový.
Naopak, j sou-li xak nesoudělná, existují podle tzv. Bezoutovy rovnosti, kterou dovodíme později (viz ??), přirozená čísla a a b splňující
a x + b k — 1, což pro odpovídající třídy ekvivalence dává
[a] ■ [x] + [0] = [a] ■ [x] = [1], a proto je [a] inverzním prvkem k [x]. □
F. Zobrazení a relace
1.91. Rozhodněte, zda následující relace na množině M jsou relace ekvivalence:
i) M = {f : R -> R}, kde (/ ~ g), pokud /(0) = g(0).
ii) M = {f : R -> R}, kde (/ ~ g), pokud /(0) = g(\).
iii) M je množina přímek v rovině, přičemž dvě přímky jsou v relaci, jestliže se neprotínají.
iv) M je množina přímek v rovině, přičemž dvě přímky jsou v relaci, jestliže jsou rovnoběžné.
v) M = N, kde (m ~ n), pokud S(m) + S(n) = 20, přičemž S(n) značí ciferný součet čísla n.
vi) M = N, kde (m ~ n), pokud C(m) = C(n), kde C(n) = S(n), pokud je ciferný součet S(n) menší než 10, jinak definujeme C(n) = C(S(n)) (je tedy vždy C(n) < 10).
Řešení.
i) Ano. Ověříme tři vlastnosti ekvivalence:
i) Reflexivita: pro libovolnou reálnou funkci / je /(0) = /(0).
ii) Symetrie: jestliže platí /(0) = g(0), pak i g(0) = /(0).
iii) Tranzitivita: jestliže platí /(0) = g(0) a g(0) = h(0), pak platí i /(0) = h(0).
ii) Ne. Definovaná relace není reflexivní, např pro funkci sin máme sin 0 7^ sin 1 a není ani tranzitivní.
iii) Ne. Relace opět není reflexivní (každá přímka protíná sama sebe) ani tranzitivní.
iv) Ano. Třídy ekvivalence pak tvoří množinu neorientovaných směrů v rovině.
v) Ne. Relace není reflexivní. 5(1) + 5(1) = 2.
vi) Ano.
□
1.92. Máme množinu {3, 4, 5, 6, 7}. Napište explicitně relaci
i) a dělí b
ii) a dělí b nebo b dělí a
iii) a a b jsou soudělná
O
1.93. Nechť je na R2 definována relace R tak, že ((a, b), (c, d)) e R pro libovolná a,b,c,d e R, právě když b = d. Zjistěte, zda se jedná
41
KAPITOLA 1. ROZCVIČKA
o relaci ekvivalence. Pokud jde o relaci ekvivalence, popište geometricky rozklad, který určuje.
Řešení. Z ((a, b), (a, b)) e R pro všechna a, b e M plyne, že relace je reflexivní. Stejně snadno vidíme, že relace je symetrická, neboť v rovnosti (druhých složek) můžeme zaměnit levou a pravou stranu. Je-li ((a, b), (c, d)) € R a ((c, d), (e, /)) e R, tj. platí-li b = dad = f, lehce dostáváme splnění tranzitivní podmínky ((a, b), (e, /)) e R, tj.b = f. Relace i? je relací ekvivalence, kdy body roviny jsou spolu v relaci, právě když mají stejnou druhou souřadnici (přímka jimi zadaná je kolmá na osu y). Příslušný rozklad proto rozdělí rovinu na přímky rovnoběžné s osou x. □
1.94. Určete, kolik různých binárních relací lze zavést mezi množinou X a množinou všech jejích podmnožin, má-li množina X právě 3 prvky.
Řešení. Nejprve si uvědomme, že množina všech podmnožin X má
23 = 8 prvků, a tudíž její kartézský součin s množinou X má 8 • 3 =
24 prvků. Uvažovanými binárními relacemi jsou právě podmnožiny tohoto kartézského součinu, kterých je celkem 224. □
1.95. Uvedte definiční obor D a obor hodnot / relace
R = {(a, v), (b, x), (c, x), (c, u), (d, v), (/, y)}
mezi množinami A = {a, b, c, d, e, /} a B = {x, y, u, v, w}. Je relace R zobrazení?
Řešení. Přímo z definice definičního oboru a oboru hodnot relace dostáváme
D = {a, b, c, d, f} C A, I = {x, y, u, v} C B.
Nejedná se o zobrazení, protože (c, x), (c, u) e S,tj.c e D má dva obrazy. □
1.96. O každé z následujících relací na množině {a, b, c, d} rozhodněte, zda se jedná o relaci uspořádání (příp. zda se jedná o úplné uspořádání):
Ra = {(a, a), (b, b), (c, c), (d, ď), (b, a), (b, c), (b, ď)}, Rh = {(a, a), (b, b), (c, c), (d, d), (d, a), (a, d)}, Rc = {(a, a), (b, b), (c, c), (d, ď), (a, b), (b, c), (b, ď)}, Rd = {(a, a), (b, b), (c, c), (a, b), (a, c), (a, d), (b, c), (b, d), (c, d)}, Re = {(a, a), (b, b), (c, c), (d, d), (a, b), (a, c), (a, d), (b, c), (b, d), (c,d)}.
42
KAPITOLA 1. ROZCVIČKA
Řešení. Ra je uspořádání, které není úplné (např. (a, c) £ Ra ani (c, a) g Ra). Relace R], není antisymetrická (je totiž (a, d) e R], i (d, a) s R],), a tudíž se nejedná o uspořádání (jde o ekvivalenci). Relace Rc a Rd rovněž nejsou uspořádáními, protože Rc není tranzitivní ((a, b), (b, c) € Rc, (a, c) g Rc) a Rd není reflexivní ((d, d) g Rd). Relace Re je úplné uspořádání (pokud budeme (a,b) e R interpretovat jako a < b, pak a < b < c < d). □
1.97. Rozhodněte, zda je zobrazení / injektivní, resp. surjektivní, jestliže
(a) / : z x z -» z, f((x, y)) = x + y - 10x2;
(b) / : N -» N x N, f (x) = (2x, x2 + 10).
Řešení. Ve variantě (a) je uvedeno surjektivní zobrazení (postačuje položit x = 0), které není injektivní (stačí zvolit (x, y) = (0, —9) a (x, y) = (1, 0)). Ve variantě (b) se naopak jedná o injektivní zobrazení (obě jeho složky, tj. funkce y = 2x a y = x2 + 10, jsou evidentně rostoucí na N), které není surjektivní (např. dvojice (1, 1) nemá vzor).
□
1.98. Stanovte počet zobrazení množiny {1, 2} do množiny {a, b, c}. Kolik z nich je surjektivních a kolik injektivních?
Řešení. Prvku 1 můžeme v rámci zobrazení přiřadit libovolně jeden ze tří prvků a, b, c. Podobně také pro prvek 2 máme tři možnosti. Podle (kombinatorického) pravidla součinu tak existuje celkem 32 zobrazení množiny {1, 2} do množiny {a, b, c}. Surjektivní žádné z nich být nemůže, neboť konečná množina {a, b, c} má více prvků než množina {1, 2}. Při libovolném zobrazení prvku 1 (tři možnosti) obdržíme injektivní zobrazení, právě když prvek 2 zobrazíme na jiný prvek (dvě možnosti). Vidíme tedy, že injektivních zobrazení množiny {1,2} do množiny {a, b, c} je 6. □
1.99. Určete počet injektivních zobrazení množiny {1,2,3} do množiny {1, 2, 3, 4}.
Řešení. Libovolné injektivní zobrazení mezi uvažovanými množinami je dáno výběrem (uspořádané) trojice z množiny {1, 2, 3, 4} (prvky ve vybrané trojici budou po řadě obrazy čísel 1,2,3) a obráceně každé injektivní zobrazení nám zadává takovou trojici. Je tedy hledaných injektivních zobrazení stejně jako možností výběru uspořádaných trojic ze čtyř prvků, tedy v (3, 4) = 4 • 3 • 2 = 24. □
1.100. Určete počet surjektivních zobrazení množiny {1, 2, 3, 4} na množinu {1, 2, 3}.
Řešení. Hledaný počet určíme tak, že od počtu všech zobrazení odečteme ta, která nejsou surjektivní, to jest ta, jejichž obor hodnot je
43
KAPITOLA 1. ROZCVIČKA
buď jednoprvkovou nebo dvouprvkovou množinou. Všech zobrazení je y (3, 4) = 34, zobrazení, jejichž oborem hodnot je jednoprvková množina, jsou tři. Počet zobrazení, jejichž oborem hodnot je dvouprvková množina, je (^) (24 — 2) ((^) způsoby můžeme vybrat obor hodnot a máme-li již dva prvky fixovány, máme 24 — 2 možností, jak na ně zobrazit čtyři prvky). Celkem je tedy počet hledaných surjektivních zobrazení
(1.4) 34-Q(24 - 2)- 3 = 36.
□
1.101. Hasseův diagram uspořádám. Hasseův diagram daného uspořádání -< na n -prvkové množině M je diagram s n vrcholy (každý vrchol odpovídá právě jednomu prvku množiny), přičemž dva vrcholy (prvky) a, b jsou spojeny (víceméně svislou) čarou (tak, že a je „dole" a b „nahoře"), právě když b pokrývá a, tj. a < b a neexistuje c € M tak, že a < c a c < b.
1.102. Určete počet relací uspořádání na čtyřprvkové množině. Řešení. Postupně projdeme všechny možné Hasseovy diagramy uspořádání na nějaké čtyřprvkové množině M a spočítáme, kolik různých uspořádání (tj. podmnožin množiny M x M) má daný Hasseův diagram, viz obr.:
• • • » i # n •A • V * í N ¥
6 b Y K <> i Hl
Celkem tedy je 219 uspořádání na čtyřprvkové množině. □
1.103. Určete počet relací uspořádání množiny {1, 2, 3, 4, 5} takových, že právě dvě dvojice prvků jsou nesrovnatelné. O
1.104. Vypište všechny relace na dvouprvkové množině {1,2}, jež současně nejsou reflexivní, jsou symetrické a nejsou tranzitivní. Řešení. Reflexní relace jsou právě ty, které obsahují obě dvojice (1, 1), (2, 2). Tím jsme vyloučili relace
{(1,1), (2, 2)}, {(1,1), (2, 2), (1,2)}, {(1,1), (2, 2), (2,1)}, {(1,1), (2, 2), (1,2), (2, 1)}.
Zbývající relace, které jsou symetrické a nejsou tranzitivní, musejí obsahovat (1,2), (2, 1). Pokud taková relace obsahuje jednu z těchto dvou uspořádaných dvojic, musí obsahovat rovněž druhou (podmínka symetrie). Kdyby neobsahovala ani jednu z těchto dvou uspořádaných dvojic, pak by očividně byla tranzitivní. Z celkového počtu 16 relací na dvouprvkové množině jsme tak vybrali
44
KAPITOLA 1. ROZCVIČKA
{(1,2), (2,1)}, {(1,2), (2,1), (1,1)}, {(1,2), (2,1), (2, 2)}.
Je vidět, že každá z těchto 3 relací není reflexivní, je symetrická a není tranzitivní. □
1.105. Určete počet relací ekvivalence na množině {1, 2, 3, 4}.
Řešení. Ekvivalence můžeme počítat podle toho, kolik prvků mají jejich třídy rozkladu. Pro počty prvků tříd rozkladu ekvivalencí na čtyřprvkové množině jsou tyto možnosti:
Počty prvků ve třídách rozkladu počet ekvivalencí daného typu
1,1,1,1 1
2,1,1 0
2,2
3,1 (í)
4 1
Celkem tedy máme 15 různých ekvivalencí. □
Poznámka. Obecně počet tříd rozkladu n -prvkové množiny udává Bellovo číslo Bn+k, pro které lze odvodit rekurentní formuli
n
Bn + 1 = (k)Sk-
1.106. Kolik existuje relací na rc-prvkové množině?
Řešení. Relace je libovolná podmnožina kartézského součinu množiny se sebou samou. Tento kartézský součin má n2 prvků, a je
2
tedy počet všech relací na n -prvkové množině 2" . □
1.107. Kolik existuje reflexivních relací na rc-prvkové množině?
Řešení. Relace na množině M je reflexivní, právě když je diagonální relace AM = {(a, a), kde a e M} její podmnožinou. U zbylých n2—n uspořádaných dvojic v kartézském součinu M x M máme nezávislou volbu, jestli daná dvojice v dané relaci bude či ne. Celkem tedy máme
2
2" ~" různých reflexivních relací na n -prvkové množině. □
1.108. Kolik existuje symetrických relací na rc-prvkové množině?
Řešení. Relace na množině M je symetrická, právě když je její průnik s každou množinou {(a,b),(b,a), kde a ^ b, a, b e M} buď celá daná dvouprvková množina, nebo je tento průnik prázdný. Dvouprvkových podmnožin množiny M je a pokud kromě průniků s těmito množinami ještě určíme průnik dané relace s diagonální relací AM = {(a, a), kde a e M}, je tímto daná relace jednoznačně určena. Celkem můžeme provést + n nezávislých voleb mezi dvěma alternativami: každá množina typu {(a, b), (b, á)\kde a, b e M, a ^ b} je buď podmnožinou dané relace, nebo ani jeden z jejich prvků v dané relaci neleží a každá dvojice {a, a), a e M, potom také buď v relaci leží
45
KAPITOLA 1. ROZCVIČKA
nebo ne. Celkem tedy máme 2©+" symetrických relací na n -prvkové množině. □
1.109. Kolik existuje antisymetrických relací na rc-prvkové množině?
Řešení. Relace na množině M je antisymetrická, právě když její průnik s každou množinou {(a, b), (b, a)} a ^ b,a,b e M není dvoj-prvkový (jsou tedy tři možnosti jak průnik vypadá, buď j e to množina {(a, b)}, nebo {(b, a)}, nebo je průnik prázdný). Průnik s diagonální relací pak může být libovolný. Určením těchto všech průniků je relace jednoznačně určena. Celkem máme 3©2" antisymetrických relací na n -prvkové množině. □ V [?] jsme si zavedU zbytkové třídy a ukázali, že Zp je těleso pro libovolné prvočíslo p. Přesto se v tomto tělese vyskytují jevy, na které nejsme u reálných či komplexních čísel zvyklí:
1.110. Nenulový mnohočlen s nulovými hodnotami. Najděte nenulový mnohočlen jedné neznámé s koeficienty v z7, tj. výraz typu anxn + • • • + a\x + a0, cit e z7, an ^ 0, takový, že na množině z7 nabývá pouze nulových hodnot (tj. dosadíme-li za x libovolný z prvků z7 a výraz v z7 vyčíslíme, dostaneme vždy nulu).
Řešení. Při konstrukci tohoto mnohočlenu se opřeme o Malou Fer-matovu větu, která říká, že pro livovolné prvočíslo p a číslo a s ním nesoudělné platí:
a"'1 = l(modp). Hledaný polynom je tedy například polynom x1 — x (polynom x6 — 1 by neměl nulovou hodnotu v čísle 0). □
46
KAPITOLA 1. ROZCVIČKA
G. Doplňující příklady k celé kapitole
1.111. Nechť t a m jsou kladná celá čísla. Ukažte, že číslo %/i je buď přirozené, nebo není racionální.
Řešení. Ukažte, že pokud uvažovaná odmocnina není přirozená, pak není ani racionální. Pokud %/i není přirozená, tak existuje prvočíslo r a přirozené s taková, že ŕ dělí t, r+l nedělí t a m nedělí s (zápis ordr t = s) Předpokládejte, že %/i = -, p, q e z, neboli t ■ pm = q™. Uvažte ordr L a ordr R a jejich dělitelnost číslem m. (L značí levou stranu rovnice,...) □
1.112. Stanovte
(2+3Z)(l+/\/3)
Řešení. Neboť absolutní hodnota součinu (podílu) dvou libovolných komplexních čísel je součin (podíl) jejich absolutních hodnot a každé komplexní číslo má stejnou absolutní hodnotu jako číslo s ním komplexně sdružené, platí
= |2 + 3i| • = 12 + 3i| = V22 + 32 = VTŠ.
(2+3Q(l+iV3) 1-/V3
□
12
1.113. Číslo + 5i) ' zapište v co nejjednodušším tvaru.
Řešení. Úpravy jako postupné umocňování nebo rozvoj podle binomické věty jsou v tomto případě časově náročné. Při vyjádření
573 + 5i = 10 + = 10 (cos f + i sin f)
užitím Moivreovy věty však snadno obdržíme
(573 + 5i) 12 = 1012 (cos ^ + i sin = 1012.
7.774. Vyjádřete zi + z2, zi ■ z2, zu \z2\, zf2, pro
a) zi = 1 - 2/, Z2 = 4i -3
b) zi = 2, z2 = i
1.115. Uvedte vzdálenost d čísel z, z v komplexní rovině, je-li
/3 73 _ • 3 2 2-
□
O
Řešení. Není obtížné si uvědomit, že komplexně sdružená čísla jsou v komplexní rovině souměrně sdružená podle osy x a že vzdálenost komplexního čísla od osy x je rovna absolutní hodnotě jeho imaginární části. To již dává d = 3. □
47
KAPITOLA 1. ROZCVIČKA
1.116. Setkání se zúčastnilo šest mužů. Pokud si všichni navzájem potřásli rukama, vyčíslete počet potřesení.
Řešení. Počet potřesení rukou zřejmě odpovídá počtu způsobů, jak lze vybrat neuspořádanou dvojici ze 6 prvků, tj. výsledek je c (6, 2) = (^) = 15. □
1.117. Určete, kolika způsoby lze z 15 poslanců vybrat čtyřčlennou komisi, není-li možné, aby jistí 2 poslanci pracovali spolu.
Řešení. Výsledek je
O-Q = 1287.
Obdržíme ho tak, že nejprve určíme počet všech možných výběrů čtyřčlenné komise, potom od něj odečteme počet těch výběrů, kdy oba zmínění poslanci budou vybráni (v takovém případě vybíráme pouze 2 další členy komise ze 13 poslanců). □
1.118. Kolika způsoby můžeme rozdělit 8 žen a 4 muže do 2 šestičlenných skupin (v nichž nerozlišujeme pořadí - jsou neuspořádané) tak, aby v obou skupinách byl alespoň 1 muž?
Řešení. Rozdělení 12 osob do 2 šestičlenných skupin bez jakýchkoli podmínek je dáno libovolným výběrem 6 z nich do první ze skupin, což lze provést (12) způsoby. Skupiny ale nejsou rozlišitelné (nevíme, která z nich je první), a proto je počet všech možných rozdělení \ ■ (12). V © případech pak budou všichni muži v jedné skupině (volíme 2 ženy z 8, které skupinu doplní). Správná odpověď je tudíž
\ ■ O - © = 434-
□
1.119. Jaký je počet čtyřciferných čísel složených z číslic 1, 3, 5, 6, 7 a 9, ve kterých se žádná z cifer neopakuje?
Řešení. K dispozici máme šest různých číslic. Ptáme se: Kolik různých uspořádaných čtveřic z nich můžeme vybrat? Výsledek je proto i; (6, 4) = 6 • 5 • 4 • 3 = 360. □
1.120. Řecká abeceda se skládá z 24 písmen. Kolik různých slov majících právě pět písmen z ní lze utvořit? (Bez ohledu na to, zda tato slova mají nějaký jazykový význam.)
Řešení. Pro každou z pěti pozic ve slově máme 24 možností, neboť písmena se mohou opakovat. Výsledek je tedy V (24, 5) = 245. □
1.121. Noví hráči se sejdou v jednom volejbalovém týmu (6 lidí). Kolikrát si při seznamování (každý s každým) podají ruce? Kolikrát si hráči podají ruce se soupeřem po odehrání zápasu?
Řešení. Seznamuje se každá dvojice z šesti hráčů. Počet podání rukou je teda roven kombinaci C(2, 6) = (j) = 15. Po zápase si každý z šesti hráčů podá ruku šestkrát (s každým z šesti soupeřů). Počet je tedy dohromady 62 = 36. □
48
KAPITOLA 1. ROZCVIČKA
1.122. K vytrvalostnímu závodu, v němž běžci vybíhají jeden po druhém s danými časovými odstupy, se přihlásilo k závodníků, mezi nimi také tři kamarádi. Stanovte počet startovních listin, v rámci kterých žádní dva z trojice kamarádů nestartují těsně po sobě. Pro jednoduchost uvažujte k > 5.
Řešení. Ostatních k — 3 závodníků můžeme seřadit (k — 3)! způsoby. Pro uvažované tři kamarády pak máme k — 2 míst (začátek, konec a k — 4 mezer), na které je můžeme rozmístit v (k — 2,3) způsoby. Podle (kombinatorického) pravidla součinu je tak výsledek
(k - 3)! • (k - 2) ■ (k - 3) • (k - 4) = (k - 2)! • (k - 3) • (k - 4).
□
1.123. Turnaje se zúčastní 32 lidí. Podle požadavků organizátorů se musí libovolným způsobem rozdělit do čtyř skupin tak, aby první skupina měla 10 účastníků, druhá 8, třetí také 8 a poslední čtvrtá potom 6. Kolika způsoby se mohou takto rozdělit?
Řešení. Můžeme si představit, že z 32 účastníků vytvoříme řadu, kdy prvních 10 utvoří první skupinu, dalších 8 druhou atd. Celkem můžeme účastníky seřadit 32! způsoby. Uvědomme si ovšem, že na rozdělení do skupin nemá vliv, když zaměníme pořadí osob, které patří do stejné skupiny. Proto je počet navzájem různých rozdělení roven
P(10,8,8,6) = Mf^.
□
1.124. Je potřeba ubytovat 9 osob v jednom čtyřlůžkovém, jednom třílůžkovém a jednom dvoulůžkovém pokoji. Zjistěte, kolika způsoby to lze provést.
Řešení. Jestliže např. hostům ve čtyřlůžkovém pokoji, přiřadíme číslici 1, v třílůžkovém pokoji číslici 2 a v dvoulůžkovém číslici 3, pak vytváříme permutace s opakováním ze tří prvků 1, 2, 3, v nichž jednička se vyskytuje čtyřikrát, dvojka třikrát a trojka dvakrát. Příslušný počet permutací je
p (4, 3, 2) = 41^21 = 1260.
□
1.125. Kolika způsoby můžeme do řady posadit 50 lidí tak, aby Pavel s Petrem ob jedno místo a Martin sousedil alespoň s jedním z nich? (Ve skupině je právě jeden Pavel, Petr i Martin) O
1.126. Určete počet způsobů, jak lze rozdělit mezi tři osoby A, S a C 33 různých mincí tak, aby osoby A a S měly dohromady právě dvakrát více mincí, než má osoba C.
Řešení. Ze zadání vyplývá, že osoba C má obdržet 11 mincí. To lze provést (^j způsoby. Každou ze zbývajících 22 mincí může získat osoba A nebo B, což dává 222 možností. Z (kombinatorického) pravidla součinu plyne výsledek (^) • 222. □
1.127. Kolika způsoby můžete mezi 4 chlapce rozdělit 40 stejných kuliček?
Řešení. Přidejme ke 40 kuličkám troje zápalky. Poskládáme-li kuličky a zápalky do řady, rozdělí zápalky kuličky na 4 úseky. Náhodně seřadme chlapce. Dáme-li prvnímu chlapci všechny kuličky z prvního úseku, druhému chlapci všechny kuličky z druhého úseku atd., je již vidět, že všech rozdělení je právě (f) = 12 341. □
49
KAPITOLA 1. ROZCVIČKA
1.128. Podle kvality dělíme výrobky do skupin I, 77, 7/7, IV. Zjistěte počet všech možných rozdělení 9 výrobků do těchto skupin, která se Uší počtem výrobků v jednotlivých skupinách.
Řešení. Zapisujeme-li přímo uvažované devítičlenné skupiny z prvků I, II, III, IV, vytváříme kombinace s opakováním deváté třídy ze čtyř prvků. Počet takových kombinací je (12) = 220. □
1.129. Kolika způsoby mohla skončit tabulka první fotbalové ligy, víme-li o ní pouze, že alespoň jeden z týmů z dvojice Ostrava, Olomouc je v tabulce za týmem Brna (ligu hraje 16 mužstev). Řešení. Nejprve určíme tři místa, na kterých se umístily celky Brna, Olomouce a Ostravy. Ty lze vybrat c(3, 16) = (g6) způsoby. Z šesti možných pořadí zmíněných tří týmů na vybraných třech místech vyhovují podmínce ze zadání čtyři. Pro libovolné pořadí těchto týmů na libovolně vybraných třech místech pak můžeme nezávisle volit pořadí zbylých 13 týmů na ostatních místech tabulky. Podle pravidla součinu je tedy hledaný počet tabulek roven
(^^j . 4 • 13! = 13948526592000.
□
1.130. Kolik je možných uspořádání (v řadě) na fotce volejbalového týmu (6 hráčů), když
i) Gouald a Bamba chtějí stát vedle sebe
ii) Gouald a Bamba chtějí stát vedle sebe a uprostřed
iii) Gouald a Kamil nechtějí stát vedle sebe
Řešení.
i) Goualda a Bambu můžeme v tomto případě počítat za jednoho, rozlišíme jen jak stojí vzájemně. Máme 2.5! = 240 pořadí.
ii) Tady je to podobnéjen pozice Goualda a Bamby je pevně daná. Dostáváme 2.4! = 48 možností.
iii) Nejjednodušší je asi odečíst případy, kdy stojí vedle sebe (viz (i)) od všech pořadí. Dostaneme 6! - 2.5! = 720 - 240 = 480.
1.131. Házení mincí. Šestkrát hodíme mincí.
i) Kolik je všech různých posloupností panna, orel
ii) Kolik je takových, že padnou právě čtyři panny.
iii) Kolik je takových, že padnou aspoň dvě panny.
O
1.132. Kolik existuje přesmyček slova BAZILIKA takových, že se v nich střídají souhlásky a samohlásky?
Řešení. Protože souhlásky i samohlásky jsou v daném slově čtyři, tak se v každé takové přesmyčce střídají pravidelně souhlásky a samohlásky. Slovo tedy může být typu BABABABA nebo ABABABAB. Na daných čtyřech místech můžeme pak samohlásky permutovat mezi sebou (P0(2,2) = 272-y způsoby) a nezávisle na tom i souhlásky (4! způsoby). Hledaný počet je pak dle pravidla součinu 2 • 4! • ^ = 288. □
50
KAPITOLA 1. ROZCVIČKA
1.133. Kolika způsoby lze rozdělit 9 děvčat a 6 chlapců do dvou skupin tak, aby každá skupina obsahovala alespoň dva chlapce?
Řešení. Rozdělíme zvlášť děvčata a chlapce: 29(25 — 7) = 12800. □
1.134. Materiál je tvořen pěti vrstvami, každá z nich má vlákna v jednom z daných šesti směrů. Kolik takových materiálů existuje? Kolik je jich takových, že dvě sousední vrstvy nemají vlákna ve stejném směru?
Řešení. 65a6-55. □
1.135. Pro libovolné pevné n e N určete počet všech řešení rovnice
xi + x2 H-----h xk = n
v množině nezáporných, kladných celých čísel.
Řešení. Hledáme-li řešení v oboru kladných celých čísel, tak si všimněme, že přirozená čísla x i,... xk jsou řešením dané rovnice, právě když jsou celá nezáporná čísla y,■ = x,■ — 1, i = 1,..., k, řešením rovnice
yi + yi H-----\-yk=n - k.
Těchje podle || 1.30|| □
1.136. Na kružnici stojí n pevností (n > 3), očíslovaných po řadě čísly 1,..., n. V jeden okamžik \, každá vystřelí na jednu ze dvou sousedních (pevnost 1 sousedí s pevností n). Označme P(n)
počet možných výsledků střelby (za výsledek střelby považujeme množinu čísel právě těch pevností, které byly při střelbě zasaženy, nerozlišujeme přitom mezi jedním a dvěma zásahy). Dokažte, že P(n) a P(n + 1) jsou nesoudělná.
Řešení. Označíme-li zasažené pevnosti černým kolečkem a nezasažené bílým, úloha je ekvivalentní úloze určit počet všech možných obarvení n koleček, umístěných na kružnici, černou a bílou barvou tak, aby nebyla žádná dvě bílá kolečka „objedno". Pro lichá n je tento počet roven počtu K(n) obarvení černou a bílou barvou tak, aby žádná dvě bílá kolečka nestála vedle sebe (přečíslujeme pevnosti tak, že začneme u kolečka 1 a číslujeme popořadě vzestupně po lichých číslech a poté vzestupně po sudých). V případě sudého n je tento počet roven K(n/2)2, kvadrátu počtu obarvení n/2 koleček na obvodu kruhu tak, aby žádná dvě bílá nestála vedle sebe (barvíme nezávisle kolečka na lichých a na sudých pozicích).
51
KAPITOLA 1. ROZCVIČKA
Pro K(ri) snadno odvodíme rekurentní formuli K(n) = K(n — 1) + K(n — 2). Navíc snadno spočteme, že K(2) = 3, K(3) = 4, K(4) = 7, tedy K(2) = F(4) - F(0), K(3) = F(5) - F(l), K(4) = F(6) — F(2) a indukcí snadno dokážeme K(n) = F(n + 2) — F(n — 2), kde F(n) značí n-tý člen Fibonacciho posloupnosti (F(0) = 0, F(l) = F(2) = 1). Navíc protože (K(2), K(3)) = 1, máme pro n > 3 obdobně jako u Fibonacciho posloupnosti
(K(n), K(n - 1)) = (K(n) - K(n - 1), K(n - 1)) =
Ukážeme nyní, že pro každé sudé n = 2a je P(n) = K(a)2 nesoudělné jak s ř(« I 1) = K(2a + 1), tak s P(n — 1) = K(2a — 1). K tomu stačí následující: pro a > 2 je totiž
(K(a), K(2a + 1)) = (K(a), F(2)K(2a) + F(l)K(2a - 1)) =
= (K(a), F(3)K(2a - 1) + F(2)K(2a -2) = ...
= (K(a), F(a + l)K(a + 1) + F(a)K(a)) =
= (K(a), F(a + 1)) = (F(a + 2) - F(a - 2), F(a + 1)) =
= (F(a +2) - F(a + 1) - F(a - 2), F(a + 1)) =
= (F(a) - F(a - 2), F(a + 1)) =
= (F(a - 1), F(a + 1)) = (F(a - 1), F (a)) = 1 (£(a), ^(2^ - 1)) = (K(a), F(2)K(2a - 2) + F(l)K(2a - 3)) =
= (K(a), F(3)K(2a - 3) + F(2)K(2a - 4)) =
= • • • = (K(a), F(a)K(a) + F(a - l)K(a - 1)) =
= (K(a), F(a - 1)) = (F(a + 2) - F(a - 2), F(a - 1)) =
= (F(a + 2) - F(íi), F(a - 1)) =
= (F(a + 2) - F(a + 1), F (a - 1)) = (F(a), F(a - 1)) = 1. Tím je tvrzení dokázáno. □
1.137. Kolik peněz naspořím na stavebním spoření za pět let, vkládám-li 3000 Kč měsíčně (vždy k 1. v měsíci), vklad je úročen roční úrokovou mírou 3% (úročení probíhá jednou za rok) a od státu obdržím ročně příspěvek 1500 Kč (státní příspěvek se připisuje vždy až 1. května následujícího roku)?
Řešení. Označme množství naspořených peněz po n-tém roce jako xn. Potom dostáváme (pro n > 2) následující rekurentní formuli (navíc předpokládáme, že každý měsíc je přesně dvanáctina roku)
xn+1 = 1, 03(x„) + 36000 + 1500+
(K(n - 2), K(n-l)) = --- = 1.
úroky z vkladů za aktuální rok
+
0,03• - •1500
3
úrok ze státního příspěvku připsaného v aktuálním roce l,03(x„) + 38115.
52
KAPITOLA 1. ROZCVIČKA
Tedy
n-2
xn = 38115 J](l, 03)'' + (1, 03)"-1jci + 1500, *=o
přičemž xx = 36000 + 0, 03 • 3000 (l + n + • • • + n) = 36585, celkem
/(1,03)4-1\ , x5 = 38115 í Q3-j + (1,03)4-36585 + 1500 = 202136.
□
1.138. Poznámka. Ve skutečnosti úročení probíhá podle počtu dní, které jsou peníze na účtu. Obstarejte si skutečný výpis ze stavebního spoření, zjistěte si jeho úročení a zkuste si spočítat připsané úroky za rok. Porovnejte je se skutečně připsanou sumou. Počítejte tak dlouho, dokud sumy nebudou souhlasit...
1.139. Na kolik maximálně částí dělí rovinu n kružnic?
Řešení. Pro maximální počet p„ oblastí, na které dělí rovinu kružnice odvodíme rekurentní vzorec
Pn+i = p„+2n.
Všimněme si totiž, že (n + l)-ní kružnice protíná n předchozích maximálně v 2n průsečících (a tato situace skutečně může nastat).
n-l
= pi + li = n2 — n + 2.
i=\
□
1.140. Na kolik nejvýše částí dělí třírozměrný prostor n rovin?
Řešení. Označme hledaný počet r„. Vidíme, že r0 = 1. Podobně jako příkladu (|| 1.34||) uvažujme, že máme v prostoru n rovin, přidejme jednu další a ptejme se, kolik nejvýše částí prostoru přibude. Opět to bude přesně tolik, kolika původními částmi prostoru přidaná rovina prochází. Kolik to může být? Počet částí prostoru, kterými (n + l)-ní rovina prochází je roven počtu částí, na které je přidaná (n + l)-ní rovina rozdělena průsečnicemi s n rovinami, které v prostoru již byly rozmístěny. Těchto
53
KAPITOLA 1. ROZCVIČKA
částí však může být podle předchozího příkladu nejvýše 1/2 • (n2 + n + 2), dostáváme tak rekurentní formuli
n2 + n + 2
rn + l = rn H--^-"
Danou rovnici opět můžeme vyřešit přímo:
(n - l)2 + (n - 1) + 2 n2-n+2 rn = r„_i H---- = r«-i ^--^- =
(n - l)2 - (n - 1) +2 ř22-«+2 = r„_2 +---+ ^^ =
n2 (n — l)2 n (n — 1)
= r„_2 + — +---------- + 1 + 1 =
2 2 2 2
, ^2 . (n-l)2 (n-3)2 n (n - 1) (n - 2) "r"-3 +2+2 + 2 2 2 2 +
+1 + 1 + 1 =
j h Y n n
/—1 i—l i—l
n(n + l)(2n + 1) n(n + 1)
= 1 H-----h n =
12 4
«3 + 6n + 5
kde jsme použili známého vztahu
n(n + l)(2n + 1)
který lze snadno dokázat matematickou indukcí.
□
1.141. Na kolik maximálně částí dělí trojrozměrný prostor n koulí? O
1.142. Na kolik částí dělí prostor n navzájem různých rovin, které všechny prochází jedním daným bodem?
Řešení. Pro hledaný počet x„ odvodíme rekurentní formuli
x„ = x„_! + 2(n - 1),
dále x\ = 2, tedy
x„ = n(n — 1) + 2.
□
1.143. Z balíčku 52 karet náhodně vybereme 16 karet. Vyjádřete pravděpodobnost, že vybereme právě 10 červených a 6 černých karet.
Řešení. Nejdříve si uvědomme, že nemusíme zohledňovat pořadí výběru karet. (Ve výsledném zlomku bychom uspořádané výběry získali tak, že bychom číslem 16! vynásobili čitatele i jmenovatele.) Počet všech možných (neuspořádaných) výběrů 16 karet z 52 je (j2). Podobně je počet všech
10) a 6 karet z 26 pak (6). Neboť vybíráme nezávisle na sobě 10 karet z 26 červených a 6 karet z 26 černých, užití (kombinatorického) pravidla součinu dává výsledek
54
KAPITOLA 1. ROZCVIČKA
/26\ /26-
Q
^- -0, 118.
□
1.144. V urně je 7 bílých, 6 žlutých a 5 modrých koulí. Vylosujeme (bez vracení) 3 koule. Určete pravděpodobnost, že právě 2 jsou bílé.
Řešení. Celkem máme (7+3+5) způsobů, jak lze vybrat 3 koule. Vylosovat právě 2 bílé umožňuje (2) výběrů bílých a současně výběrů zbylé (třetí) koule. Podle pravidla součinu je tak počet způsobů, jak lze vylosovat právě 2 bílé, roven q • Odsud již plyne výsledek
^ = 0, 283.
□
1.145. Z karetní hry o 108 kartách (2 x 52+4 žolíci) bez vracení vybereme 4 karty. Jaká je pravděpodobnost, že aspoň jedna z nich je eso nebo žolík?
Řešení. Lehce můžeme určit pravděpodobnost opačného (komplementárního) jevu znamenajícího, že ve vybrané čtveřici není žádná z 12 uvažovaných karet (8 es a 4 žolíků). Tato pravděpodobnost je dána poměrem počtu výběrů 4 karet z 96 a počtu výběrů 4 karet ze 108, tj. je rovna Opačný jev má tudíž pravděpodobnost
1-^= 0, 380.
□
1.146. Při házení kostkou padla jedenáctkrát po sobě čtyřka. Uvedte pravděpodobnost, že padne podvanácté.
Řešení. Předchozí výsledky (podle našich předpokladů) nijak neovlivňují, co padne na kostce při dalších hodech. Proto je hledaná pravděpodobnost 1/6. □
1.147. Z balíčku 32 karet náhodně vypadne 6 karet. Jaká je pravděpodobnost, že jsou všechny téže barvy?
Řešení. K tomu, abychom získali výsledek
^ = 1,234- 10
-4
(?)
stačí nejprve zvolit jednu ze 4 barev a uvědomit si, že existuje (g) způsobů, jak vybrat 6 karet z 8 této barvy. □
1.148. Tri hráči dostanou po 10 kartách a 2 zbudou (z balíčku připraveného na mariáš nebo prší -32 karet, z toho 4 esa). Je pravděpodobnější, že někdo dostane listovou sedmu, osmu a devítku, nebo to, že zbyla dvě esa?
Řešení. Protože pravděpodobnost, že nějaký z hráčů dostane uvedené tři karty, je rovna hodnotě
©'
zatímco pravděpodobnost, že zbudou dvě esa, je rovna číslu
ÉL
je pravděpodobnější, že nějaký z hráčů dostal zmíněné tři karty. Poznamenejme, že dokázat nerovnost
55
KAPITOLA 1. ROZCVIČKA
(10) (?)
lze úpravou obou jejích stran, kdy opakovaným krácením (po vyjádření kombinačních čísel dle definice) lehce dostaneme 6 > 1. □
1.149. Hodíme n kostkami. Jaká je pravděpodobnost, že mezi čísly, která padnou, nebudou hodnoty 1,3 a 6?
Řešení. Úlohu můžeme přeformulovat tak, že rc-krát po sobě hodíme 1 kostkou. Pravděpodobnost, že při prvním hodu nepadne 1, 3 nebo 6, je 1/2. Pravděpodobnost, že při prvním a druhém hodu nepadne 1, 3 ani 6, je zjevně 1/4 (výsledek prvního hodu neovlivňuje výsledek druhého). Vzhledem k tomu, že jev určený výsledkem jistého hodu a jakýkoli jev určený výsledkem jiného hodu jsou vždy (stochasticky) nezávislé, hledaná pravděpodobnost jel /2". □
1.150. Dva přátelé střílejí nezávisle na sobě do jednoho terče, každý po jednom výstřelu. Pravděpodobnost zásahu terče pro prvního je 0, 4, pro druhého je 0, 3. Nalezněte pravděpodobnost P jevu, že po střelbě bude v terči právě jeden zásah.
Řešení. Výsledek stanovíme tak, že sečteme pravděpodobnosti těchto dvou neslučitelných jevů: trefil se první střelec a druhý nikoli; první střelec minul, zatímco druhý terč zasáhl. Při nezávislosti jevů (která se zachovává také tehdy, když uvažujeme komplementy některých z jevů) je pravděpodobnost společného nastoupení dána součinem pravděpodobností jednotlivých jevů. Užitím toho dostáváme
p = 0, 4 • (1 - 0, 3) + (1 - 0, 4) • 0, 3 = 0, 46.
□
1.151. Dvanáctkrát po sobě házíme třemi mincemi. Jaká je pravděpodobnost, že alespoň v jednom hodu padnou tři líce?
Řešení. Uvážíme-li, že při opakovaní téhož pokusu jsou jednotlivé výsledky nezávislé, a označíme-li pro i € {1, ..., 12} jako A; jev „při /-tém hodu padly tři líce", určujeme
P (.U Ať) = 1 - (1 - PiAO) ■ (1 - P(A2)) ••• (1 - P(Ai2».
Pro každé i e {1, ..., 12} je však P{Ai) = 1/8, neboť na každé ze tří mincí padne líc s pravděpodobností 1/2 nezávisle na tom, zda na ostatním mincích padl líc, příp. rub. Nyní již můžeme napsat výsledek
□
1.152. V jisté zemi mají parlament, ve kterém zasedá 200 poslanců. Dvě hlavní politické strany, které v zemi existují, si při „volbách" házejí o každý poslanecký mandát zvlášť mincí. Každá z těchto stran má přidělenu jednu stranu mince. Té straně, jejíž strana mince padne, náleží mandát, o který se právě losovalo. Jaká je pravděpodobnost, že každá ze stran získá 100 mandátů? (mince je „poctivá")
Řešení. Všech možných výsledků losování (uvažovaných jako dvousetčlenné posloupnosti rubů a líců) je 2200. Pokud každá strana získá právě sto mandátů, je ve vylosované posloupnosti právě sto
56
KAPITOLA 1. ROZCVIČKA
líců a sto rubů. Takových posloupností je (100) (taková posloupnost je jednoznačně určená výběrem sto členů z dvou set možných, na kterých budou např. líce). Celkem je hledaná pravděpodobnost
(200\ 200!
v 100/ íooi-ioo! • n n^A = ^205- = °' °56-
□
1.153. Sedm Čechů a pět Angličanů náhodně rozdělíme na dvě (neprázdné) skupiny. Jaká je pravděpodobnost, že v jedna ze skupin bude tvořena pouze Čechy?
Řešení. Všech možností je 212 — 1. Jestliže jsou v jedné skupině pouze Češi, znamená to, že všichni Angličané jsou v jedné skupině (buď v první nebo druhé). Zbývá rozdělit Čechy na dvě neprázdné skupiny, to můžeme 27 — 1 způsoby. Na závěr ještě přičíst rozdělení, kdy jsou skupiny podle národností.
2 • (27 - 1) + 1
212- 1
□
1.154. Z deseti karet, z nichž právě jedna je eso, namátkou vybereme kartu a vrátíme ji zpět. Kolikrát takový výběr musíme provést, aby pravděpodobnost, že aspoň jednou vybereme eso, byla větší než 0, 9?
Řešení. Označme A;- jev „při /-tém výběru bylo vytaženo eso". Neboť jednotlivé jevy A;- jsou (stochasticky) nezávislé, víme, že
P (Ů Ať) = 1 - (1 - P(A0) • (1 - P(A2)) ••• (1 - P(An))
pro každé n e N. Připomeňme, že hledáme n e N takové, aby platilo
P (Ů Ať) = 1 - (1 - P(A0) • (1 - P(A2)) ••• (1 - P(An)) > 0, 9.
Zřejmě je P (A;) = 1/10 pro libovolné / e N. Proto stačí vyřešit nerovnici
1-(&)"> 0,9,
ze které lze vyjádřit
n > !og" I!'', kde a > 1.
loga 0,9
Vyčíslením potom zjistíme, že daný pokus musíme provést alespoň dvaadvacetkrát. □
1.155. Texas holďem. Nyní spočítejme několik jednoduchých úloh týkajících se populární karetní hry Texas holďem, jejíž pravidla zde nebudeme uvádět (pokud je čtenář nezná, snadno je dohledá na internetu). Jaká je pravděpodobnost, že
i) jako startovní kominaci dostanu dvojici stejných symbolů?
ii) ve své startovní dvojici karet budu mít eso?
iii) na konci budu mít jednu z šesti nejlepších kombinací karet?
iv) vyhraji, pokud držím v ruce eso a trojku (libovolné barvy), na flopu je eso a dve dvojky a na turnu je třetí trojka a všechny tyto čtyři karty mají různou barvu? (poslední karta river ještě není otočena)
Řešení.
57
KAPITOLA 1. ROZCVIČKA
i) Počet různých symbolů je 13 a jsou vždy čtyři (pro každou barvu jeden). Proto je počet dvojic se stejnými symboly 13(2) = 78. Počet všech možných dvojic je (13'4) = 1326. Pravděpodobnost stejných symbolů je tedy 77 = 0, 06.
ii) Jedna karta je eso, to jsou čtyři možnosti a druhá je libovolná, to je 51 možností. Dvojice s oběma esama, kterých je (2) = 6 jsme ale takto započítali dvakrát. Dostáváme tedy 4.51 — 6 = 198 dvojic a pravděpodobnost je y^g = 0, 15.
iii) Spočítame pravděpodobnosti jednotlivých nejlepších kombinací:
ROYAL FLUSH: Takové kobinace jsou zřejmě jen čtyři - pro každou barvu jedna. Všech kombinací pěti karet je (552) = 2598960. Pravděpodobnost je tak rovna asi 1, 5.10-6. Hodně malá:)
STRAIGHT FLUSH: Postupka, která končí nej vyšší kartou v rozmezí 6 až K, tj. 8 možností pro každou barvu. Dostáváme 259382960 = 1, 2.10-5.
POKER: Čtyři stejné symboly -13 možností (pro každý symbol jedna). Pátá karta může být libovolná, to znamená 48 možností. Odtud: ^fj^ = 2, 4.10"4.
FULL HOUSE: Tři stejné symboly 13 (3) = 52 možností a k tomu dva stejné symboly je 12(2) = 72 možností. Pravděpodobnost je 2598960 ^ 1' 4-10-3.
FLUSH: Všech pět karet stejné barvy znamená 4(153) = 5148 možností a pravděpodobnost
JePak 2598960 = 2-l°~3-
STRAIGHT: Nejvyšší katrta postupky je v rozmezí 6 až A, tj. 9 možností. Barva každé karty je pak libovolná, tj. dohromady 9.45 = 9216 možností. Zde jsme ale započítali jak straight flush, tak i royal flush. Ty je potřeba odečíst.
Pro zjištění pravděpodobnosti nějaké z šesti nejlepších kombinací to ale ani nemusíme dělat, jen první dvě kombinace nezapočteme. Celkově tedy dostáváme pravděpodobnost zhruba 3, 5.10"3 + 2.10"3 + 1, 4.10"3 + 2, 4.10"4 = 7, 14.10"3.
iv) Evidentně je situace hodně dobrá a proto bude lepší spočítat nepříznivé situace, tj. kdy bude mít soupeř lepší kombinaci. Já mám v tuto chvíli full house ze dvou es a tří dvojek. Jediná kombinace, která by mmě mohla porazit v tuto chvíli je buď full house ze tří es a dvou dvojek nebo dvojkový poker. To znamená, že soupeř by určitě musel držet eso nebo poslední dvojku. Pokud drží dvojku a libovolnou jinou kartu, pak určitě vyhraje bez ohledu na kartu na riveru. Kolik je možností pro tuto kartu ke dvojce? 3 + 4+-+4 + 2 = 45 (jednu trojku a dvě esa už mít v ruce nemůže). Včech zbylých kombinací je (426) = 1035 a pravděpodobnost takové prohry je tak 0,043. Pokud drží v ruce eso, pak se může stát následující. Pokud drží (zbylá) dvě esa, tak opět vyhraje, pokud na riveru nepřijde dvojka - pak by byl split poker. Pravděpodobnost (podmíněná) mé prohry je tedy .|| = 10~3. pokud drží soupeř v ruce eso a nějakou jinou kartu, než 2 a A, tak následuje remíza bez ohledu na river. Celková pravděpodobnost výhry je tak skoro 96 %.
□
1.156. Osm karet, čtyři esa a čtyři krále rozdělíme po dvou mezi čtyři hráče. Jaká je pravděpodobnost, že někdo dostane alespoň dvě esa? Výsledek vyjádřete ve tvaru podílu dvou dvojciferných čísel. O
1.157. 5.(5b.) Aleš má dvě speciální hrací kostky, na jedné padá vždy šestka, na druhé padá pouze čtyřka, pětka, či šestka, každé číslo se třetinovou pravděpodobností. Jaká je pravděpodobnost, že mu
58
KAPITOLA 1. ROZCVIČKA
při hodu těmito dvěma kostkami padne vyšší součet než Martinovi, který háže se dvěma poctivými kostkami. Výsledek vyjádřete ve tvaru podílu dvou dvouciferných čísel. O
1.158. Volejbalový tým (s liberem, tj. celkem sedm osob) sedí po zápase v hospodě a popíjí zasloužené pivo. Hospodský má k dispozici pouze sedm kríglů. Jaká je pravděpodobnost, že příště i) právě jeden volejbalista nebude pít ze stejného kríglů,
ii) nikdo nebude pít ze stejného kríglu,
iii) právě tři budou pít ze stejného kríglu.
Řešení.
i) Pokud šest Udí dostne ten svůj, tak zákonitě i ten šestý, pravděpodobnost je tedy nulová.
ii) Nechť M je množina všech uspořádání a jev A, je uspořádání, kdy i-tý hráč dostane svůj krígl. Chceme spočítat \M — U;A;|. Dostáváme 7! JľI=o ^rŕ~ = 1854. A pravděpodobnost
= 1854 _ M ^ Q 37 Jc 5040 280 ' '
Ui) Vybereme, kteří tři dostanou ten svůj - q = 35 možností. Zbylí čtyři musí dostat jiné než svoje. To je opět vzorec z minulého bodu, konkrétně jde o 4! Ylt=o = 9 možností. Máme tedy dohromady 9 • 35 = 315 možností a pravděpodobnost je = ^.
□
1.159. KoUka způsoby lze rozestavit n shodných věží na šachovnici n x n tak, aby bylo každé neobsazené pole ohrožováno některou z věží?
Řešení. Daná rozestavení jsou sjednocením dvou množin: množiny rozestavení, kdy je alespoň v jednom řádku jedna věž (tedy v každém řádku právě jedna; tato množina má n" prvků - v každém řádku vybereme nezávisle jedno pole pro věž) a množiny rozestavení, kdy je v každém sloupci alespoň (tedy právě) jedna věž (stejnou úvahou jako u první množiny má tato množina rovněž n" prvků). Průnik těchto množin pak má n! prvků (místa pro věže vybíráme postupně od prvního řádku - tam máme n možností, ve druhém pak již pouze n — 1 možností-jeden sloupec je již obsazen,...). Podle principu inkluze a exkluze je počet hledaných rozestavení:
2n" - n\.
□
1.160. Zjistěte pravděpodobnost, že při hodu dvěma kostkami padla alespoň na jedné kostce čtyřka, jestUže padl součet 7.
Řešení. Příklad řešíme pomocí klasické pravděpodobnosti, kdy podmínku interpretujeme jako zúžení pravděpodobnostního prostoru. Ten má vzhledem k podmínce tedy 6 prvků, z čehož právě 2 jsou příznivé vyšetřovanému jevu. Správná odpověď je 2/6 = 1/3. □
59
KAPITOLA 1. ROZCVIČKA
1.161. Hodíme dvěma kostkami. Určete podmíněnou pravděpodobnost, že na první kostce padla pětka za podmínky, že padl součet 9. Na základě tohoto výsledku rozhodněte o nezávislosti jevů „na první kostce padla pětka" a „padl součet 9".
Řešení. Označíme-li jev „na první kostce padla pětka" jako A a jev „padl součet 9" jako H, pak platí
P(A\H) = ^ = f = I.
36
Uvědomme si, že součet 9 můžeme získat tak, že na první kostce padne 3 a na druhé 6, na první 4 a na druhé 5, na první 5 a na druhé 4 nebo na první 6 a na druhé 3. Z těchto čtyř (stejně pravděpodobných) výsledků jevu A vyhovuje právě jeden. Protože pravděpodobnost jevu A je očividně 1/6 ^ 1/4, nejsou uvedené jevy nezávislé. □
1.162. Mějme balíček 32 karet. Vytáhneme-li dvakrát po jedné kartě, nalezněte pravděpodobnost, že druhá tažená karta bude eso, když první kartu vrátíme, a také tehdy, když ji do balíčku nevrátíme (druhou kartu potom vybíráme z balíčku 31 karet).
Řešení. Pokud kartu do balíčku vrátíme, zjevně opakujeme pokus, který má 32 možných (stejně pravděpodobných) výsledků, přičemž právě 4 z nich vyhovují námi uvažovanému jevu. Vidíme, že tomto případě je hledaná pravděpodobnost 1/8. Ve druhém případě, kdy první kartu do balíčku nevrátíme, je ovšem hledaná pravděpodobnost stejná. Postačuje např. uvážit, že při vytažení postupně všech karet je pravděpodobnost vytažení esa jako první karty totožná s pravděpodobností, že druhá vytažená karta bude eso. Pochopitelně bylo možné využít toho, že máme zavedenu podmíněnou pravděpodobnost. Tak bychom mohli obdržet
_± .1. _1_ 28 _4_ _ 1 32 ' 31 32 ' 31 ~~ 8-
□
1.163. Uvažujme rodiny se dvěma dětmi a pro jednoduchost předpokládejme, že všechny možnosti v množině £2 = {kk, kh, hk, hh}, kde k značí „kluk" a h znamená „holka" při zohlednění stáří dětí, jsou stejně pravděpodobné. Zavedme náhodné jevy
Hi - rodina má kluka, Ai - rodina má 2 kluky.
Vypočtěte P (Ai|íŕi).
Podobně uvažujme rodiny se třemi dětmi, kdy je
£2 = {klek, kkh, khk, hkk, khh, hkh, hhk, hhh}.
Jestliže
H2 - rodina má kluka i holku, A2 - rodina má nejvýše jednu holku, rozhodněte o nezávislosti náhodných jevů A2 a H2.
Řešení. Uvážením, které ze čtyř prvků množiny £2 (ne)vyhovují jevu A\, resp. H\, lehce získáváme
Pia i h \ — p(MnHi) _ p(Ai) _ i _ i r — P(Hl) — P(Hl) — 3 — 3-
Dále máme zjistit, zda platí
P (A2 f)H2) = P (A2) • P (H2).
Opět si stačí pouze uvědomit, že jevu A2 vyhovují právě prvky kkk, kkh, khk, hkk množiny £2, jevu H2 prvky kkh, khk, hkk, khh, hkh, hhk a jevu A2 n H2 prvky kkh, khk, hkk. Odtud plyne
P (A2 n H2) = f = I ■ I = P (A2) • P (H2),
60
KAPITOLA 1. ROZCVIČKA
což znamená, že jevy A2 a H2 jsou nezávislé. □
1.164. Pětkrát jsme hodili mincí. Pokud padl líc, dali jsme do klobouku bílou kuličku. Když padl rub, dali jsme do téhož klobouku kuličku černou. Vyjádřete pravděpodobnost, že v klobouku je více černých kuliček než bílých, je-li v klobouku alespoň jedna černá kulička.
Řešení. Zavedhiejevy
A - v klobouku je víc černých kuliček než bílých, H - v klobouku je aspoň jedna černá kulička.
Chceme stanovit P (A \ H). Uvědomme si, že pravděpodobnost P (Hc) opačného jevu k jevu H je 2~5 a že pravděpodobnost jevu A je stejná jako pravděpodobnost P (Ac) jevu opačného (v klobouku je víc bílých kuliček). Nutně tedy P(H) = 1 - 2"5, P(A) = 1/2. Dále je P(A n H) = P(A), neboť jev H obsahuje jev A (jev A má za důsledek jev H). Celkem jsme obdrželi
P(A\ff\ - P(AnH) _ \ _ 16
r\ft\ri) - p(H) _ 5_31.
□
1.165. V osudí je 9 červených a 7 bílých koulí. Postupně vytáhneme 3 koule (bez vracení). Určete pravděpodobnost, že první dvě budou červené a třetí bílá.
Řešení. Příklad budeme řešit pomocí věty o násobení pravděpodobností. Nejprve požadujeme vytažení červené koule, což se podaří s pravděpodobností 9/16. Pokud byla poprvé vytažena červená koule, při druhém tahu vytáhneme znovu červenou kouli s pravděpodobností 8/15 (v osudí je 15 koulí, z toho 8 červených). Konečně, pokud byla dvakrát vytažena červená koule, pravděpodobnost, že potom bude vytažena bílá, je 7/14 (v osudí je 7 bílých koulí a 7 červených koulí). Celkem dostáváme
JL . JL . -7_ = o 15
16 15 14 u' J-
□
1.166. V osudí je 10 koulí, a to 5 černých a 5 bílých. Postupně budeme losovat po jedné kouli, přičemž vytaženou kouli nevrátíme zpět. Stanovte pravděpodobnost, že nejprve vytáhneme bílou, poté černou, pak bílou a v posledním čtvrtém tahu opět bílou kouli.
Řešení. Použijeme větu o násobení pravděpodobností. V prvním tahu vytáhneme bílou kouli s pravděpodobností 5/10, poté černou s pravděpodobností 5/9, následně bílou s pravděpodobností 4/8 a na závěr bílou s pravděpodobností 3/7. Dohromady to dává
_5_ 5 4 3 _ _5_ 10 ' 9 ' 8 ' 7 ~~ 84-
□
1.167. Z balíčku 32 karet náhodně vybereme šestkrát po sobě po jedné kartě, a to bez vracení. Spočtěte pravděpodobnost, že první král bude vybrán až při šestém výběru.
Řešení. Podle věty o násobení pravděpodobností je výsledek
2827262524J_^ r> 0790 32 ' 31 ' 30 ' 29 ' 28 ' 27 — U'
61
KAPITOLA 1. ROZCVIČKA
□
1.168. Jaká je pravděpodobnost, že součet dvou náhodně zvolených kladných čísel menších než 1 bude menší než 3/7?
Řešení. Je vidět, že jde o jednoduchý příklad na geometrickou pravděpodobnost, kdy jako základní prostor £2 se nabízí čtverec s vrcholy [0, 0], [1, 0], [1, 1], [0, 1] (volíme dvě čísla mezi 0 a 1). Zajímá nás pravděpodobnost jevu udávajícího, že pro náhodně zvolený bod [x, y] v tomto čtverci bude platit x + y < 3/7; tj. pravděpodobnost toho, že zvolený bod se bude nacházet uvnitř trojúhelníku A s vrcholy [0, 0], [3/7, 0], [0, 3/7]. Nyní již snadno vyčíslíme
P(A\ — Mil — (?) 12 — 2.
^ ' vol Q 1 98 •
□
1.169. Nechť je náhodně rozlomena tyč na tři části. Stanovte pravděpodobnost, že délka druhé (prostřední) části bude větší než dvě třetiny délky tyče před jejím rozlomením.
Řešení. Nejprve si označme délku uvažované tyče jako d. Rozlomení tyče ve dvou místech je dáno volbou bodů, kde ji zlomíme. Označme jako x bod, ve kterém je první (např. blíže nějakému předmětu) zlom, a jako x + y bod, ve kterém je druhý zlom. To nám říká, že za základní prostor lze považovat množinu {[x, y]; x e (0, d), y e (0, d — x)}, tj. trojúhelník s vrcholy v bodech [0, 0], [d, 0], [0, d]. Délka prostřední části je dána hodnotou y. Požadavek ze zadaní lze nyní zapsat v jednoduchém tvaru .y > 2d/3, což odpovídá trojúhelníku s vrcholy [0, 2d/3], [d/3, 2d/3], [0, d]. Obsahy uvažovaných pravoúhlých rovnoramenných trojúhelníků jsou d2 /2 a (d/3)2/2, a proto je hledaná pravděpodobnost
3^-2 _ 1
ffl ~ 9'
2
□
1.170. Tyč o délce 2 m je náhodně rozřezána na tři části. Nalezněte pravděpodobnost jevu, že třetí část měří méně než 1, 5 m.
Řešení. Tento příklad je na užití geometrické pravděpodobnosti, kdy hledáme pravděpodobnost toho, že součet délek prvních dvou částí je větší než čtvrtina délky tyče. Určeme pravděpodobnost opačného jevu, tj. pravděpodobnost, když budou náhodně (a nezávisle na sobě) zvolena dvě místa, ve kterých bude tyč rozřezána, že budou obě v první čtvrtině tyče. Pravděpodobnost tohoto jevu je 1/42, neboť pravděpodobnost výběru místa v první čtvrtině tyče je zřejmě 1 /4 a tento výběr se (nezávisle) jednou opakuje. Pravděpodobnost hledaného (opačného) jevu je tak 15/16. □
1.171. Mirek a Marek chodí na obědy do univerzitní menzy. Menza má otevřeno od 1 lh do 14h. Každý z nich stráví na obědě půl hodiny a dobu příchodu (mezi 1 lh a 14h) si vybírá náhodně. Jaká je pravděpodobnost, že se na obědě v daný den potkají, sedávají-li oba u stejného stolu?
Řešení. Prostor všech možných jevů je čtverec 3x3. Označíme-li x dobu příchodu Mirka a y dobu příchodu Marka, tak tito se potkají, právě když \x — y\ < 1/2. Tato nerovnost vymezuje ve čtverci možných událostí oblast, jejíž obsah je roven 11/36 obsahu čtverce. Tomuto zlomku je tedy rovna i hledaná pravděpodobnost. □
62
KAPITOLA 1. ROZCVIČKA
1.172. Z Brna vyrazí náhodně někdy mezi polednem a čtvrtou hodinou odpolední Honza autem do Prahy a opačným směrem někdy ve stejném intervalu autem Martin. Oba si dávají půl hodiny pauzu v motorestu v polovině cesty (přístupném pro oba směry). Jaká je pravděpodobnost, že se tam potkají, jezdí-li Honza rychlostí 150 km/h a Martin 100 km/h? (Vzdálenost Brno-Praha je 200 km)
Řešení. Označíme-li dobu odjezdu Martina x a dobu odjezdu Honzy y a pro menší výskyt zlomků v následujících výpočtech zvolíme za jednotku deset minut, tak stavovým prostorem bude čtverec 24 x 24. Doba příjezdu Martina do motorestu je x + 6, do příjezdu Honzy x +4. Stejně jako v předchozím příkladu to, že se v motorestu potkají, je ekvivalentní tomu, že doby jejich příjezdu se neliší o více než o půl hodiny, tedy | (x + 6) — (y + 4) | < 3. Tato podmínka nám pak ve stavovém čtverci vymezuje oblast o obsahu 242 — ^(232 + 192) (viz obr.) a hledaná pravděpodobnost je
1.173. Mirek vyjede náhodně mezi desátou hodinou dopolední a osmou hodinou večerní z Brna do Prahy. Marek vyjede náhodně ve stejném intervalu z Prahy do Brna. Oběma trvá cesta 2 hodiny. Jaká je pravděpodobnost, že se po cestě potkají (jezdí po stejné trase)?
Řešení. Řešíme naprosto analogicky jako v předchozím příkladě. Prostor všech možných jevů je čtverec 10xl0,Mirek, vyjíždějící v čase x, potká Marka, vyjíždějícího v čase j právě když \x—y\ < 2. Hledaná pravděpodobnost je p = = ^ = 0,36.
□
1.174. Dvoumetrová tyč je náhodně rozdělena na tři díly. Určete pravděpodobnost, že ze vzniklých dílů půjde sestavit trojúhelník.
63
KAPITOLA 1. ROZCVIČKA
Řešení. Rozdělení tyče je dáno stejně jako v předchozím příkladě body řezu x a v a jevovým prostorem je opět čtverec 2x2. Aby z částí bylo možno sestavit trojúhelník, musejí jejich délky splňovat tzv. trojúhelníkové nerovnosti, tedy součet délek libovolných dvou částí musí být větší než délka třetí části. Vzhledem k tomu, že součet délek je roven 2 m, je tato podmínka ekvivalentní podmínce, že každá s částí musí být menší než 1 m. To pomocí řezů x a y vyjádříme tak, že nesmí platit současně x < \ay < 1 nebo současně x > la v > 1 (odpovídá podmínkám, že krajní díly tyče j sou menší než 1), navíc |x — y\ < 1 (prostřední díl musí být menší než jedna). Tyto podmínky splňuje vyšrafovaná oblast na obrázku a jak snadno nahlédneme, její obsah je 1/4.
□
4X! - V3x2 = 3,
X! - - 2y/lx2 = -2
4X! - V3x2 = 16,
Xi - - 2VVx2 = -7
4X! + 2x2 = 7,
1.175. Je rovnice
(a)
(b)
^ ^ —2xi — x2 = —3 jednoznačně řešitelná (má právě 1 řešení)?
Řešení. Soustava hneárních rovnic je jednoznačně řešitelná právě tehdy, když je nenulový determinant matice určené koeficienty na levé straně soustavy. Zejména tedy absolutní členy rovnic (čísla na pravé straně) neovlivňují jednoznačnost řešení soustavy. Musíme tedy ve variantách (a) a (b) dostat stejnou odpověď. Protože
-73
-2V7
4- (-2V7) - (-V3- l) ^0, = 4.(-l)-(2.(-2)) = 0,
-2 -1
mají soustavy ve variantách (a) a (b) právě 1 řešení a poslední soustava nikoliv. Vynásobíme-li druhou rovnici v (c) číslem —2, vidíme, že tato soustava nemá řešení. □
1.176. V R2 určete vrcholy nějakého rovnostranného trojúhelníka ABC o straně délky 1, s bodem C = [1, 1] a základnou A B rovnoběžnou s přímkou 3x + 4 v = 105. O
64
KAPITOLA 1. ROZCVIČKA
1.177. Vypočítejte obsah 5 čtyřúhelníku zadaného vrcholy
[0,-2], [-1,1], [1,5], [1,-1]. Řešení. Při obvyklém označení vrcholů
A = [0,-2], S = [1,-1], C = [1,5], D = [-1,1] a neméně obvyklém rozdělení čtyřúhelníku na trojúhelníky ABC a ACD s obsahy S\ a 52, dostáváme
5 = 5j + 52
1-0 1-0 -1+2 5 + 2
+
1-0 5 + 2
-1-0 1+2
(7-1) +i (3+ 7)
1 1 5 + 1 1 5
2 10 13 2 -3 -5
□
1.178. Určete obsah čtyřúhelníka ABCD s vrcholy A = [1, 0], B = [11, 13], C = [2, 5] a D = [-2,-5].
Řešení. Čtyřúhelník rozdělíme na dva trojúhelníky ABC a ACD. Jejich obsahy pak spočítáme pomocí patřičných determinantů, viz 1.34,
47
T"
□
1.179. Spočítejte obsah rovnoběžníku s vrcholy v bodech [5, 5], [6, 8] a [6, 9].
Řešení. Přestože takový rovnoběžník není zadán jednoznačně (není uveden čtvrtý vrchol), trojúhelník s vrcholy [5,5], [6, 8] a [6, 9] musí být nutně polovinou každého rovnoběžníku s těmito třemi vrcholy (jedna ze stran trojúhelníku se stane úhlopříčkou rovnoběžníku). Proto je hledaný obsah vždy roven determinantu
ň _ s ň _ s 1 1
1.4-1-3 = 1.
6-5 6-5 1 1
8-5 9-5 3 4
□
65
KAPITOLA 1. ROZCVIČKA
1.180. Určete počet relací na množině {1,2,3,4}, které jsou současně symetrické i tranzitivní.
Řešení. Relace uvedených vlastností je relací ekvivalence na nějaké podmnožině množiny {1, 2, 3, 4}. Celkem 1 + 4 • 1 + Q ■ 2 + @) • 5 + 15 = 52. □
1.181. Určete počet relací uspořádání na tříprvkové množině. O
1.182. Určete počet relací uspořádání na množině {1,2,3,4} takových, že prvky 1 a 2 j sou nesrovnatelné (tedy neplatí 1 -< 2 ani 2 -< 1, kde -< je označení uvažované relace uspořádání). O
1.183. Určete počet surjektivních zobrazení / množiny {1,2, 3, 4, 5} na množinu {1,2,3} takových, že/(l) = /(2).
Řešení. Každé takové zobrazení je jednoznačně dáno obrazem prvků {1, 3, 4, 5}, těchto zobrazení je tedy přesně tolik, kolik j e zobrazení surj ektivních zobrazení množiny {1, 3, 4, 5} na množinu {1,2,3}, tedy 36, jak víme z předchozího příkladu. □
1.184. Výčtem prvků zadejte S o R, je-li
R = {(2, 4), (4, 4), (4, 5)} C N x N, S = {(3, 1), (3, 2), (3, 5), (4, 1), (4, 4)} c N x N.
Řešení. Uvážením všech výběrů dvou uspořádaných dvojic
(2, 4), (4,1); (2, 4), (4, 4); (4, 4), (4,1); (4, 4), (4, 4)
splňujících, že druhá složka první uspořádané dvojice, která je prvkem i?, je rovna první složce druhé uspořádané dvojice, která je prvkem 5, dostáváme
SoR = {(2, 1), (2,4), (4, 1), (4,4)}.
□
1.185. Nechť je dána binární relace
i? = {(0,4), (-3,0), (5, tt), (5, 2), (0,2)} mezi množinami A = Z a B = R. Vyjádřete R~l a R o R~l. Řešení. Ihned vidíme, že
R-1 = {(4, 0), (0, -3), (tt, 5), (2, 5), (2, 0)}.
Odtud pak dále
RoR-1 = {(4, 4), (0, 0), (tt, tt), (2, 2), (4, 2), (tt, 2), (2, tt), (2, 4)}.
□
1.186. Rozhodněte, zdaje relace R určená podmínkou
(a) (a,b) e R \a\ < \b\;
(b) (a,b) e R \a\ = \2b\
na množině celých čísel Z tranzitivní.
Řešení. V prvním případě relace R tranzitivní je, protože platí
\a\< \b\, \b\< \c\ => \a\ < Ve druhém případě relace R tranzitivní není. Stačí např. uvážit, že
66
KAPITOLA 1. ROZCVIČKA
(4, 2), (2, 1) e i?, (4, 1) g R.
□
1.187. Najděte všechny relace na M = {1,2}, které nejsou antisymetrické. Které z nich jsou tranzitivní?
Řešení. Hledané relace, jež nejsou antisymetrické, jsou čtyři. Jsou to právě ty podmnožiny {1,2} x {1,2}, které obsahují prvky (1, 2), (2, 1) (jinak nemůže být podmínka antisymetrie porušena). Z těchto čtyř je tranzitivní pouze jediná relace
{(1, 1), (1, 2), (2, 1), (2, 2)} = M x M,
protože nezahrnutí dvojic (1, 1) a (2, 2) do tranzitivní relace by znamenalo, že nemůže obsahovat zároveň (1, 2) a (2, 1). □
1.188. Existuje relace ekvivalence, která je současně relací uspořádání, na množině všech přímek v rovině?
Řešení. Relace ekvivalence (příp. relace uspořádání) musí být reflexivní, a proto každá přímka musí být v relaci sama se sebou. Dále požadujeme, aby hledaná relace byla symetrická (ekvivalence) a zároveň antisymetrická (uspořádání). To dává, že přímka může být v relaci pouze sama se sebou. Zavedeme-li ovšem relaci tak, že dvě přímky jsou v relaci právě tehdy, když jsou totožné, dostaneme „velmi přirozenou" relaci ekvivalence i relaci uspořádání. Stačí si uvědomit, že je triviálně tranzitivní. Hledanou relací je právě identické zobrazení množiny všech přímek v rovině. □
1.189. Určete, zdaje relace
R = {(k,l) e Z x Z; \ k\ > \ l\] na množině Z ekvivalence, uspořádání.
Řešení. Relace R není ekvivalencí: není symetrická (kupř. (6, 2) e R, (2, 6) ^ i?); není uspořádáním: není antisymetrická (mj. (2, —2) e R, (—2, 2) e R). □
1.190. Ukažte, že průnik libovolných relací ekvivalence na libovolně dané množině X je rovněž relace ekvivalence a že sjednocení dvou relací uspořádání na X nemusí být relace uspořádání.
Řešení. Postupně uvidíme, že průnik relací ekvivalence je reflexivní, symetrický a tranzitivní. Všechny relace ekvivalence na X musí obsahovat dvojici (x, x) pro každé x e X, a proto ji musí obsahovat také daný průnik. Pokud v průniku ekvivalencí je prvek (x,y), musí v něm být rovněž prvek (y, x) (stačí využít toho, že každá ekvivalence je symetrická). To, že do průniku ekvivalencí náleží prvky (x, y) a (y, z), znamená, že se jedná o prvky každé z ekvivalencí. Z tranzitivnosti všech jednotlivých ekvivalencí již vyplývá, že do průniku náleží také prvek (x, z). Zvolíme-li X = {1, 2} a relace uspořádání
Rt = {(1, 1), (2, 2), (1, 2)}, R2 = {(1, 1), (2, 2), (2, 1)}
na X, dostáváme relaci
/ř1U/ř2 = {(l,l),(2,2),(l,2),(2, 1)}, která zřejmě není antisymetrická, a tedy ani uspořádáním. □
67
KAPITOLA 1. ROZCVIČKA
1.191. Na množině M = {1, 2,..., 19, 20} je zavedena relace ekvivalence ~ tak, že a ~ b pro libovolná a, b e M právě tehdy, když první cifry čísel a, b jsou stejné. Sestrojte rozklad daný touto ekvivalencí.
Řešení. Dvě čísla z množiny M jsou ve stejné třídě ekvivalence, právě když jsou spolu v relaci (první cifra je stejná). Rozklad jí určený se tedy skládá z množin
{1, 10, 11, ..., 18, 19}, {2, 20}, {3}, {4}, {5}, {6}, {7}, {8}, {9}.
□
1.192. Je dán rozklad se dvěma třídami {b, c}, {a, d, e} množiny X = {a, b, c, d, e}. Napište relaci ekvivalence R na množině X příslušnou tomuto rozkladu.
Řešení. Ekvivalence R je určena tím, že v relaci jsou spolu ty prvky, které jsou ve stejné třídě rozkladu, a to v obou pořadích (R musí být symetrická) a každý sám se sebou (R musí být reflexivní). Proto R obsahuje právě
(a, a), (b, b), (c, c), (d, d), (e, e), (b, c), (c, b), (a, d), (a, e), (d, a), (d, e), (e, a), (e, d).
□
1.193. Na následujících třech obrázkách jsou ikony spojeny čarami tak, jak by je možná přiřadili lidé v různých částech světa. Určete, zda jde o zobrazení, zdaje injektivní, surjektivní nebo bijektivní.
Řešení. V prvním případě jde o zobrazení, které je surjektivní, ale není injektivní, protože had i pavouk jsou označeni jako jedovatí. Druhý případ není zobrazení ale jen relace, protože pes je určen jako domácí zvíře i na jídlo. V třetím případě máme opět zobrazení. Tentokrát není ani injektivní, ani surjektivní. □
68
KAPITOLA 1. ROZCVIČKA
1.194. Mějme množinu {a, b, c, d] a na ní relaci
{(a, a), (b, b), (a, b), (b, c), (c, b)}.
Jaké členy je potřeba minimálně doplnit do této relace, aby to byla ekvivalence? Řešení. Postupně projdeme všechny tři vlastnosti, které definují ekvivalenci. Za prvé je to reflexivita. Musíme tedy doplnit dvojice {(c, c), (d, d)}. Za druhé symetrie -musíme doplnit (b, a) a za třetí musíme udělat tzv. tranzitivní obal. Protože je a v relaci s b a b v relaci s c, musí být i a v relaci s c. Nakonec tedy potřebujeme přidat (a, c) a (c, a). □
1.195. Uvažme množinu čísel, které mají pět cifer ve dvojkovém zápisu a relaci takovou, že dvě čísla jsou v relaci, právě když jejich ciferný součet má stejnou paritu. Napište příslušné třídy ekvivalence.
Řešení. Dostáváme dvě třídy ekvivalence (o osmi členech):
[10000] = {10000, 10011, 10101, 10110, 11001, 11010, 11100, 11111}
odpovídá množině {16, 19, 21, 22, 25, 26, 28, 31} a
[10001] = {10001, 10010, 10100, 11000, 10111, 11011, 11101, 11110}
odpovídá množině {17, 18, 20, 24, 23, 27, 29, 30}. □
1.196. Uvažme množinu čísel, které mají tři cifry ve trojkové soustavě a relaci takovou, že dvě čísla jsou v relaci, právě když v této soustavě
i) začínají stejným dvojčíslím.
ii) končí stejným dvojčíslím.
Napište příslušné třídy ekvivalence. Řešení.
i) Dostáváme šest tříprvkových tříd
[100] = {100, 101, 102} odpovídá {9, 10, 11} [110] = {110, 111, 112} odpovídá {12, 13, 14} [120] = {120, 121, 122} odpovídá {15, 16, 17} [200] = {200, 201, 202} odpovídá {18, 19, 20} [210] = {210, 211, 212} odpovídá {21, 22, 23} [220] = {220, 221, 222} odpovídá {24, 25, 26}
ii) V tomto případě máme devět dvouprvkových tříd
[100] = {100, 200} odpovídá {9, 18} [101] = {101, 201} odpovídá {10, 19} [102] = {102, 202} odpovídá {11, 20} [110] = {110, 210} odpovídá {12, 21} [111] = {111, 211} odpovídá {13, 22} [112] = {112, 212} odpovídá {14, 23} [120] = {120, 220} odpovídá {15, 24} [121] = {121, 221} odpovídá {16, 25}
69
KAPITOLA 1. ROZCVIČKA
[122] = {122, 222} odpovídá {17, 26}
□
1.197. Pro jaký maximální definiční obor D a obor hodnot H je zobrazení bijektivní a jaká je v tom prípade inverzní funkce?
i) i ^ i4
ii) x h» x3
iii) x h» -^-r
Řešení.
i) D = [0, oo) a H = [0, oo) nebo také D = (—oo, 0] a H = [0, oo). Inverzní funkce je
ii) D = // = Ka inverze je x i-» f/x.
iii) D = M \ {-1} a Íř = R \ {0}. Inverzní funkce je x h» i - 1.
□
1.198. Uvažme relaci na M x M. Bod je v relaci, pokud pro něj platí
(x - l)2 + (y + l)2 = 1
Můžeme body popsat pomocí funkce y = f(x)l Nakreslete obrázek bodů v relaci.
Řešení. Nemůžeme, protože např. y = — 1 má dva vzory: x = 0 a x = 2. Body leží na kružnici se
středem v bodě (1, — 1) s poloměrem 1. □
1.199. Nechť pro libovolná celá čísla k, l platí (k,l) e R právě tehdy, když je číslo 4k — 41 celočíselným násobkem 7. Je takto zavedená relace R ekvivalence, uspořádání?
Řešení. Uvědomme si, že dvě celá čísla jsou spolu v relaci R, právě když dávají stejný zbytek po dělení 7. Jde tedy o příklad tzv. zbytkové třídy celých čísel. Proto víme, že relace R je relací ekvivalence. Její symetrie (např. (3, 10), (10, 3) e S, 3 ^ 10) pak implikuje, že se nejedná o uspořádání.
□
1.200. Nechť je na množině N = {3,4,5,... ,n,n + \, ...} definována relace R tak, že dvě čísla jsou v relaci, právě když jsou nesoudělná (tedy neobsahuje-li prvočíselný rozklad uvažovaných dvou čísel ani jedno stejné prvočíslo). Zjistěte, zda je tato relace reflexivní, symetrická, antisymetrická, tranzitivní.
Řešení. Pro dvojici stejných čísel platí, že (n, n) g R. Nejedná se tedy o reflexivní relaci. Být „soudělný" nebo „nesoudělný" pro dvojici čísel z N je zřejmě vlastnost neuspořádané dvojice - nezávisí na uvedeném pořadí uvažovaných čísel, a proto je relace R symetrická. Ze symetrie relace R plyne, že není antisymetrická (např. (3, 5) e Ä, 3 ^ 5). Neboť je R symetrická a (n, n) g R pro libovolné číslo n s N, volba dvou různých čísel, která jsou spolu v této relaci, dává, že R není tranzitivní.
□
70
KAPITOLA 1. ROZCVIČKA
Řešení cvičení
1.23. Písmen v abecedě (včetně CH) je 27. Počet všech možných iniciálu je tedy 272 — 729. Proto aspoň 2 lidé budou mít stejné iniciály. 1.33. y„ = 2(§)" - 2. 1.92.
i) (3, 3), (4,4), (5, 5), (6, 6), (7, 7), (3, 6) ověřte, že jde o relaci uspořádání
ii) opět (/, /) pro i — 1,..., 7 a k tomu (3, 6), (6, 3) ověřte, že jde o relaci ekvivalence
iii) (/, /) pro i — 1,..., 7 a k tomu (3, 6), (6, 3), (4, 6), (6,4) ověřte, že nejde o relaci ekvivalence, protože není splněna tranzitivita.
1.103. Tři různé Hasseovy diagramy vyhovujících uspořádání. Celkem 5! + 5! + 5!/4 — 270. 1.114.
a) 1 - 3 - 2/ + Ai = -2 + 2i, 1 • (-3) - 8/2 + 6/ + Ai = 5 + 10«, 1 + 2i, JA2 + (-3)2 = 5, žl = fi% = 1 . (-3) + 8/2 + 6/ - 4/25 = -ii + á/-
Z2 \Z2\ 25 25
b) 2 +i, 2/2, 1, \ = -2/. 7.725. (3-46 + 2-2)-2-47!
i) 26 = 64
ii) (4) = 15
iii) Žádná panna je jedna možnost (q) — 1, jedna panna (f) — 6 možností. Posloupností s nejvýše jednou pannou je teda jen 7 a proto posloupností, kde jsou aspoň dvě panny je 64 — 7 — 57.
1.141. Maximální počet y„ částí, na které rozdělí n kružnic rovinu, je y„ = yn-\ + 2(n — 1), yi = 2, tedy
y„ — n2 - n + 2.
Pro maximální počet p„ částí, na které potom rozdělí n koulí prostor, pak dostáváme rekurentní vztah
Pn+i — Pn + yn, Pi = 2, tedy celkem p„ — |(n2 - 3n + 8).
4! • 4! 27
1
*± 35
24
7.757. f.
1.176. Směry stran jsou (3V3/2 — 2, 3/2 + 2\/3) a (3V3/2 + 2, 2\/3 — |). Jedna ze dvou možných dvojic
notom ie A - + 1 2vl , J_n » _ + 2 13 , 2^3-, potom je a - l 10 + 5, 5 + 10j. a - l 10 + 5, 10 + 5 j,
7.7S7. 19. 7.7S2. 87.
71
KAPITOLA 2
Elementární lineární algebra
neumíte ještě počítat se skaláry? - zkusme to rovnou s maticemi...
V minulé kapitole jsme se snad rozehřáli s relativně jednoduchými úlohami, k jejichž řešení nebylo potřeba složitých nástrojů. Vystačili jsme si přitom se sčítáním a násobením skalárů. V této a dalších kapitolách se postupně budeme věnovat jednotlivým tématům souvisleji.
Hned tři kapitoly budou věnovány nástrojům pro práci s daty, kdy operace spočívají v obzvlášť jednoduchých úkonech se skaláry, jen je těch skalárů povíce naráz. Hovoříme o „lineárních objektech" a „lineární algebře". Jakkoliv to teď může vypadat jako hodně speciální nástroj, uvidíme později, že složitější objekty a závislosti stejně studujeme hlavně pomocí jejich „lineárních přiblížení".
V této kapitole budeme pracovat přímo s konečnými posloup-jfJy^ nostmi skalárů. Takové se objevují v praktických úlohách všude, kde máme objekty popisovány pomocí několika parametrů. Nedělejme si přitom problémy s představou, jak vypadá prostor s více než třemi
„souřadnicemi". Smiřme se se skutečností, že malovat si budeme umět jednu, dvě nebo tři dimenze, ale představovat ty obrázky mohou jakýkoliv jiný počet. A když budeme sledovat jakýkoliv parametr u třeba 500 studentů (např. jejich studijní výsledky), budou naše data mít hned zrovna několikrát 500 položek a budeme s nimi chtít pracovat. Naším cílem bude vytvořit nástroje, které budou dobře fungovat nezávisle na skutečném počtu těchto položek. Také se neděsme slovních spojení jako pole či okruh skalárů K. Prostě si můžeme představit jakýkoliv konkrétní číselný obor. Okruhy skalárů pak zahrnují i celá čísla Z a všechny zbytkové třídy, zatímco mezi poli jsou pouze R, Q, C a zbytkové třídy Z* s prvočíselným k. Zvláštní je mezi nimi Z2, kde ze vztahu x — — x nemůžeme usoudit, že x — 0, zatímco u všech ostatních číselných oborů tomu tak je.
1. Vektory a matice
Většinou se o vektorech hovoří pouze ve spojení s poli skalárů, protože obecná teorie je při existenci neivertibilních nenulových skalárů nesrovnatelně složitější. Jen v prvních dvou částech této kapitoly budeme pracovat s vektory a maticemi v kontextu konečných posloupností skalárů a tam bude zajímavé si i třeba případu celých čísel povšimnout. Bude přitom snad pěkně vidět, jak silné výsledky lze důsledným formálním uvažováním odvodit.
2.1. Vektory nad skaláry. Prozatím budeme vektorem rozumět uspořádanou n-tici skalárů z K, kde pevně zvolené n e N budeme nazývat dimenzí.
38]). < {
10 "
"3 ^ 7rP
A. Soustavy lineárních rovnic
Na vektorové prostory půjdeme od lesa. Začneme s něčím známým, totiž soustavami lineárních rovnic. I za nimi jsou totiž skryty vektorové prostory.
2.1. A teď vám to pěkně natřeme. Firma zabývající se velkoplošnými nátěry si objednala 810 litrů barvy, která má obsahovat stejné množství červené, zelené a modré barvy (tj. 810 litrů černé barvy). Obchod může splnit tuto zakázku smícháním běžně prodávaných barev (má skladem jejich dostatečné zásoby), a to
KAPITOLA 2. ELEMENTÁRNI LINEÁRNÍ ALGEBRA
Skaláry umíme sčítat a násobit. Vektory budeme také sčítat, násobit však vektor budeme umět jen skalárem. To odpovídá představě, kterou jsme již viděli v rovině R2, kde sčítání odpovídalo skládání vektorů coby šipek vycházejících z počátku a násobení skalárem pak jejich patřičnému natahování.
Násobení vektoru u — (a\,... ,a„) skalárem c tedy definujeme tak, že každý prvek n-tice u vynásobíme stejným skalárem c a také sčítání vektorů definujeme po složkách. To znamená
I základní operace s vektory
u + v — (ai, ..., a„) + (bi, ..., b„) — (fli + b\, ..., an + b„) c ■ u — c ■ (fli, ..., a„) — (c ■ a\, ... ,c ■ a„).
Pro sčítání vektorů a násobení vektorů skaláry budeme používat stále stejné symboly jako u skalárů samotných, tj. symboly plus a buď tečku nebo prosté zřetězení znaků.
Konvence zápisu vektorů. Nebudeme, na rozdíl od mnoha jiných učebnic, v textu používat pro vektory žádné speciální značení a ponecháváme na čtenáři, aby udržoval svoji pozornost přemýšlením o kontextu. Pro skaláry ale spíše budeme používat písmena ze začátku abecedy a pro vektory od konce (prostředek nám zůstane na indexy proměných či komponent a také pro sčítací indexy v součtech).
Často budeme požadovat, aby skaláry byly z nějakého pole, viz 1.1, ale v této kapitole budeme vesměs pracovat s operacemi, které tento přepoklad nepotřebují. V literatuře se pak většinou místo o vektorových prostorech hovoří o modulech nad okruhy. U obecné teorie se ale v příští kapitole již zcela omezíme na pole skalárů.
Pro sčítání vektorů v K" zjevně platí (KG1)-(KG4) s nulovým prvkem
0 = (0, ...,0) eK".
Schválně zde používáme i pro nulový prvek stejný symbol jako pro nulový prvek skalárů.
..^^Vlastnosti vektorů
Pro všechny vektory v, w e K" a skaláry a, b e K platí
(VI) (V2) (V3) (V4)
a ■ (v + w) — a ■ v + a ■ w (a + b) ■ v — a ■ v + b ■ v a ■ (b ■ v) — (a ■ b) ■ v 1 • v — v
Vlastnosti (V1)-(V4) našich vektorů, coby n-tic skalárů v K", se snadno ověří pro kterýkoliv okruh skalárů K, protože při ověřování vždy používáme pro jednotlivé souřadnice vektorů pouze vlastnosti skalárů uvedené v 1.1 a 1.3.
Budeme takto pracovat např. sM",Q",C", ale také Z", (Z*)", n = 1,2, 3, ....
2.2. Matice nad skaláry. O něco složitějším objektem, který budeme při práci s vektory používat, jsou matice.
• načervenalé barvy - obsahuje 50 % červené, 25 % zelené a 25 % modré barvy;
• nazelenalé barvy - obsahuje 12,5 % červené, 75 % zelené a 12,5 % modré barvy;
• namodralé barvy - obsahuje 20 % červené, 20 % zelené a 60 % modré barvy.
Kolik litrů od každé z uskladněných barev se musí smíchat, aby byly splněny požadavky zákazníka?
Řešení. Označme jako
• x - množství (v litrech) načervenalé barvy, které se použije;
• y - množství (v litrech) nazelenalé barvy, které se použije;
• z- množství (v litrech) namodralé barvy, které se použije.
Smícháním barev chceme získat barvu, která bude obsahovat 270 litrů červené barvy. Uvědomme si, že načervenalá barva obsahuje 50 % červené, nazelenalá obsahuje 12,5 % červené a namodralá 20 % červené barvy. Musí tudíž platit
0,5x + 0, 125.V + 0,2z
270.
Analogicky požadujeme (pro zelenou a modrou barvu)
0,25x + 0,15y + 0,2Z = 270, 0,25x + 0, 125.V + 0,6z = 270.
Nyní můžeme postupovat dvěma způsoby. Buď budeme postupně vyjadřovat proměnné pomocí ostatních (z první rovnice je x = 540 — 0, 25 y — 0, 4z, dosadíme za x do druhé a třetí rovnice a dostaneme dvě lineární rovnice o dvou neznámých 2, 75y + 0, 4z, = 540 a 0, 25y + 2z, = 540. Ze druhé rovnice vyjádříme z = 270 — 0, 125y a dosazením do první dostáváme 2, Ty = 432, neboli y = 160, odkud z = 270-0, 125-160 = 250 a x = 540-0, 25-160+0, 4-250 = 400.
Druhým způsobem je zapsat si soustavu do matice, jejíž první řádek bude tvořen koeficienty u neznámých v první rovnici, druhý koeficienty ve druhé rovnici a třetí ve třetí. Je tedy matice soustavy
0,5 0,125 0,2 0, 25 0, 75 0, 2 0,25 0,125 0,6
rozšířenou matici soustavy potom získáme z matice soustavy připsáním sloupce pravých stran jednotlivých rovnic v systému:
0, 5 0, 125 0, 2 0, 25 0, 75 0, 2 0, 25 0, 125 0, 6
Jejím postupným upravováním pomocí tzv. elementárních řádkových úprav (odpovídají ekvivalentním úpravám rovnic, více viz 2.7)
73
KAPITOLA 2. ELEMENTÁRNI LINEÁRNI ALGEBRA
J Matice typu m j n ^,
Maticí typu m/n nad skaláry schéma Asm řádky a n sloupci
rozumíme obdélníkové
A =
/ an fli2
A21 A22 \flml flm2
fll«\
A2«
flffíř7 /
pak dostáváme:
0, 5 0, 125 0, 2 0,25 0,75 0,2 0, 25 0, 125 0, 6
1 0,25 0,4 540
kde aij €
pro všechny 1 < / < m, 1 < j < n. Pro matici A s prvky používáme také zápis A — (aij).
Vektory (au, ai2, ■ ■ ■, ai„) e K" nazýváme (í—té) řádky matice A, i — 1,..., m, vektory (aij, aj_j,■ ■ ■, amj) e Km nazýváme (j—té) sloupce matice A, j —
i
Matici můžeme také chápat jako zobrazení
A : {1, ...,m] x {1, ...,«} -* K,
kde A(i, j) — atj. Matice typu 1/n nebo n/1 jsou vlastně právě vektory v K".
I obecné matice lze chápat jako vektory v Km'n, prostě zapomeneme na řádkování. Zejména tedy je definováno sčítání matic a násobení matic skaláry:
A + b — (aij + b^), a ■ A — (a ■ aij)
kde A — (aij), b — (bij), a e K.
Matice —A — (—aij) se nazývá matice opačná k matici A a matice
/0 ... 0\
0 =
\0 ... 0/
se nazývá nulová matice. Zapomenutím řádkování tak získáme následující tvrzení, že matice jsou jen specificky zapsané vektory:
Tvrzení. Předpisy pro A + b, a-A, —A, 0 zadávají na množině všech matic typu m/n operace sčítání a násobení skaláry splňující axiomy (V1)-(V4).
2.3. Matice a rovnice. Velmi častý nástroj pro popis nějakých matematických modelů jsou systémy lineárních rovnic. Právě matice lze vhodně využít pro jejich zápis. Zavedeme si k tomu účelu pojem skalární součin dvou vektorů, který vektorům (a\, . . . , an) a (xi,... ,xn) přiřadí jejich součin
(fli
, fl«) • (xi,
, x„) — a\x\
tj. postupně násobíme po dvou souřadnice vektorů a výsledky sčítáme.
Každý systém m lineárních rovnic v n proměnných
a\\x\ + a\2X2 + ■
021*1 + A22*2 + '
■ fll«*« = bl
■ fl2«*« = b2
flml*l ~t~ flm2*2 ~t~ ' ' ' ~t~ amnXn — bm
lze tedy vidět jako požadavek na hodnoty m skalárních součinů neznámého vektoru (x\,..., xn) s vektory souřadnic (au,..., ai„).
0 2,75 0,4 0 0,25 2
0,25 0,4
I 8
II 1,6 zpětně vypočítáme
-21 600
1 0,25 0,4 1 3 0,8 1 0,5 2,4
540
1080
1080
1 0,25 0,4 540
0 11 1,
2160 2160
0,4
540 2160 -21600
250,
y
-86,4
2 160 - 8 • 250
160,
x = 540 - 0, 4 • 250 - 0, 25 • 160 = 400. Je tedy potřeba smísit po řadě 4001, 1601, 2501 uvedených barev. □ 2.2. Vypočtěte
Xi
2x\ -3x\
+ +
2x2 3x2
*2
+
+
3x3 x3
2X3
2, -3, -3.
Řešení. Zadanou soustavu lineárních rovnic zapíšeme ve tvaru rozšířené matice
12 3 2 2 -3 -1 -3 -3 1 2-3
kterou pomocí elementárních řádkových transformací postupně převedeme na schodovitý tvar
1
2
1
-7
3
-7 11
-7
1 2 3 2 \ /1 2 3 2
0 1 1 1 ~ ~ 0 1 1 1
0 0 4 -w w 0 1 -1
Nejdříve jsme přitom dvojnásobek prvního řádku odečetli od druhého a jeho trojnásobek přičetli ke třetímu. Poté jsme sečetli druhý a třetí řádek (součet napsali do třetího řádku) a druhý řádek vynásobili číslem 1/7. Přejdeme nyní zpět k soustavě rovnic
x\ + 2x2 + 3x3 = 2, x2 + x3 = 1, X3 = — 1.
Ihned vidíme, že x3 = — 1. Dosadíme-li x3 = — 1 do rovnice x2 +x3 = 1, dostaneme x2 = 2. Podobně dosazení získaných hodnot x3 = — 1, x2 = 2 do první rovnice dává x\ = \. □ Systémy lineárních rovnic tedy lze zapisovat v maticovém tvaru. Ale je to nějaká výhoda, když je stejně umíme řešit, aniž bychom
74
KAPITOLA 2. ELEMENTÁRNI LINEÁRNI ALGEBRA
Vektor proměnných můžeme také vidět jako sloupec v matici typu n/l, a podobně hodnoty b\,...,b„ můžeme 1 \ vnímat jako vektor u a to opět jako jediný sloupec v "> matici typu n /1. Náš systém rovnic lze pak formálně
psát ve tvaru A - x — u takto:
/au ... a\n \
(bl\
\am\ ... amn J \xn) \bm/ kde levou stranu interpretujeme jako m skalárních součinů jednotlivých řádků matice vytvářejících sloupcový vektor, jehož hodnotu rovnice určují. To znamená, že skutečně rovnost ř-tých souřadnic zadává podmínku původní rovnice
anxi H-----Yainxn = bt
a zápis A ■ x — u tak dává skutečně původní systém lineárních rovnic.
2.4. Součin matic. V rovině, tj. pro vektory dimenze 2, jsme už zavedli počet s maticemi a viděli jsme, že s ním lze pracovat velice efektivně (viz 1.26). Nyní budeme postupovat obecněji a zavedeme všechny nástroje již známé z roviny pro všechny dimenze n.
Násobení matic je možné definovat pouze, když to rozměry sloupců a řádků v maticích dovolí, tj. když je pro ně definován skalární součin jako výše:
««_„.^„^^„^«1^™_j Součin matic ^____^_va>
I Pro libovolnou matici A — (a^) typu m/na libovolnou matici B — (bjk) typu n/q nad okruhem skalárů K definujeme jejich součin C — A ■ B — (en) jako matici typu m/q s prvky
n
— ^ aijbjk, pro libovolné l 1 proto netvoří obor integrity, zejména tedy nejsou ani (nekomutativním) tělesem.
Důkaz. Asociativita násobení - (Ol): Protože skaláry jsou asociativní, distributivní i komutativní, můžeme pro tři matice A — (atj) typu m/n, B — (bjk) typu n/p a C — (cm) typu p/q spočíst
A-B = (j2aU-bJk), BC= fcbjk.ckl\ (A ■ B) ■ C = í (Yl aiJ -bJk)-Ckl ) = (12 aiJ-bJk -Ckl )'
k j J Kj,k J
A-(B ■C)=y£jaij.bjk .ckt) J = i aU-bjk -cki )•
V j k J Kj,k J
Všimněme si, že jsme při výpočtu vycházeli z toho, že je jedno v jakém pořadí uvedené součty a součiny provádíme, tj. využívali jsme podstatně našich vlastností skalárů.
Velmi snadno vidíme, že násobení jednotkovou maticí má skutečně vlastnost jednotkového prvku:
/l 0 ••• 0\
□
A ■ E
( an
0 1
\o o
o
1/
a stejně pro násobení E zleva.
Zbývá ukázat distributivitu násobení a sčítání. Opět díky distributivně skalárů snadno spočteme pro matice A — (a^) typu m/n, B = (bjk) typu n/p, C = (cjk) typu n/p, D = (du) typu
p/q
A-(B + Q= (j2aij(bjk + cjk)j
= ((Eflý^) + (Eflýc^)) = A ■ B + A ■ C
(B + C)D = (j2(bjk + cjk)dkA ^ k '
= {(ž2bJkdki) + (ž2cJkdki)) = BD + CD. ^ k k '
Jak jsme již viděli v 1.26, dvě matice dimenze 2 nemusí komutovat:
'\ o\ /o i\ _ /o r Ko orlo oj_lo o.
o i o o
i o o o
o o o o
Tím jsme získali zároveň protipříklad na platnost (02) i (Ol). Pro matice typu 1/1 ovšem oba axiomy samozřejmě platí, protože je mají samy skaláry. Pro větší matice získáme protipříklady snadno tak, že právě uvedené matice umístíme do levého horního rohu příslušných čtvercových schémat a doplníme nulami. (Ověřte si sami!) □
V důkazu jsme vlastně pracovali s maticemi obecnějšího typu, dokázali jsme tedy příslušné vlastnosti obecněji:
2.4. Nalezněte všechna řešení soustavy lineárních rovnic
3x\ -\- 3x3 — 5x4 = —8,
X\ — X2 ~\~ Xj — X4 = —2,
—2xi — X2 + 4x3 — 2x4 = 0, 2xi -\- X2 — X3 — X4 = —3.
Řešení. Soustavě rovnic odpovídá rozšířená matice
/ 3 0 3 -5 -8 \
1 -1 1 -1 -2
-2 -1 4 -2 0
v 2 1 -1 -1 -3 /
Záměnou pořadí řádků (rovnic) potom obdržíme matici
/ 1
2
1 1
1
1
1
4 3
V 3 0 kterou převedeme na schodovitý tvar:
-2 \
-3
0
/ 1 -1 1 -1 -2 ^ / 1 -1 1 -1 -2 \
2 1 -1 -1 -3 0 3 -3 1 1
-2 -1 4 -2 0 0 -3 6 -4 -4
v 3 0 3 -5 -8 ) \o 3 0 -2 "2 /
/ 1 -1 1 -1 -2 \ (1 -1 1 -1 -2 \
0 3 -3 1 1 0 3 -3 1 1
0 0 3 -3 -3 0 0 3 -3 -3
0 3 -3 "3 y/ 0 0 0 0 /
Soustava bude mít nekonečně mnoho řešení, neboť dostáváme tři rovnice pro čtyři neznámé, které mají právě jedno řešení pro každou volbu proměnné X4 e R. Neznámou X4 proto nahradíme parametrem t e R a od maticového zápisu přejdeme zpět k rovnicím
X\ — X2 + X3 — t = —2, 3X2 — 3X3 + t = 1,
3x3 - 3t = -3.
Z poslední rovnice máme x3 = t — 1. Dosazení za x3 do druhé rovnice potom dává
3x2 - 3t + 3 + t = 1, tj. x2
Konečně podle první rovnice je 1
Xi
(2t - 2) + t - 1 - t
-2,
I (2t - 2)
1
tj. X! = - (2t - 5).
Množinu řešení můžeme tudíž zapsat (pro t
(X\, Xi, *3, X4) = I 2s
5 2
, 2s — -, 3s
3s) ve tvaru
- 1, 3s
s e
3 3
Nyní se vraťme k rozšířené matici naší soustavy a upravujme ji dále užitím řádkových transformací tak, aby (při schodovitém tvaru)
76
KAPITOLA 2. ELEMENTÁRNI LINEÁRNÍ ALGEBRA
_ [ Asociativita a distributivita násobení matíc
Důsledek. Násobení matic je asociativní a distributivní, tj.
A-(B • Q = (A • B) C
A-(B + Q = A- B + A-C,
kdykoliv jsou všechny uvedené operace definovány. Jednotková matice je neutrálním prvkem pro násobení zleva i zprava.
2.6. Inverzní matice. Se skaláry umíme počítat tak, že z rovnosti a ■ x — b umíme vyjádřit x — a~l ■ b, kdykoliv inverze k a existuje. Podobně bychom to chtěli umět i s maticemi, máme ale problém, jak poznat, zda taková existuje, a jak ji spočítat. Říkáme, že B je matice inverzní k matici A, když
A ■ B — B ■ A — E.
Píšeme pak B — A~l a z definice je samozřejmé, že obě matice musí mít být čtvercové se stejnou dimenzi n. Matici, k níž existuje matice inverzní, říkáme invertibilní matice nebo také regulární čtvercová matice.
V následujících odstavcích mimo jiné odvodíme, že B je inverzní k A, jakmile platí jedna z požadovaných identit (tj. druhá je pak důsledkem).
Pokud A~l a B~l existují, pak existuje i inverze k součinu A ■ B
(2.1) (A • B)'1 = B~l - A-1.
Je totiž, díky právě dokázané asociativitě násobení,
(B~l ■ A-1) ■ (A - B) — B~l ■ (A-1 ■ A) ■ B — E (A-B)- (B
A-l) = A-(B-B-l)-A~l = E.
Protože s maticemi umíme počítat podobně jako se skaláry, ^ jen mají složitější chování, může nám existence inverzní matice skutečně hodně pomoci s řešením sys-
témů lineárních rovnic: Jestliže vyjádříme soustavu n
rovnic pro n neznámých součinem matic
(au ■■■ a\m\ (x\\ (b\\
A - x —
\flral
\bm)
a jestliže existuje matice inverzní k matici A, pak lze násobit zleva A-1 a dostaneme
A-1 • u — A-1
A ■ x — E ■ x — x,
tj. A-1 • u je hledané řešení.
Naopak rozepsáním podmínky A • A ~1 — E pro neznámé skaláry v hledané matici A-1 dostaneme n systémů lineárních rovnic se stejnou maticí na levé straně a různými vektory napravo.
2.7. Ekvivalentní úpravy matic. Zkusme se praktičtěji zorientovat v předchozí úvaze o systémech rovnic a jejich maticích. Samozřejmě nás nalezení inverzní matice stojí jisté úsilí - větší než přímé vyřešení rovnice. Podstatné však je, že pokud máme mnohokrát za sebou řešit systémy se stejnou maticí A ale různými pravými stranami u, pak se nám nalezení A-1 opravdu hodně vyplatí.
první nenulové číslo každého řádku (tzv. pivot) bylo právě číslo 1 a aby všechna ostatní čísla v jeho sloupci byla 0. Platí
/1 -1 1 -1 -2 \ ( 1 -1 1 -1 -2 \
0 3 -3 1 1 0 1 -1 1/3 1/3
0 0 3 -3 -3 0 0 1 -1 -1
\o 0 0 0 o ) V 0 0 0 0 o )
/1 -1 0 0 -1 /1 0 0 -2/3 -5/3 \
0 1 0 -2/3 -2/3 0 1 0 -2/3 -2/3
0 0 1 -1 -1 0 0 1 -1 -1
0 0 0 0 ) 0 0 0 0
přičemž nejdříve jsme vynásobili druhý a třetí řádek číslem 1/3, pak přičetli třetí řádek ke druhému a jeho (—l)násobek k prvnímu a na závěr přičetli druhý řádek k prvnímu. Z poslední matice snadno dostáváme výsledek
/2/3\
+ t
X3 W
/-5/3\ 2/3 -1 0
V o /
2/3 1
V 1 /
t e
Volné proměnné jsou totiž ty, jejichž sloupce neobsahují žádného pi-vota (v našem případě neobsahuje pivota čtvrtý sloupec, je tedy volná čtvrtá proměnná, tj. používáme ji jako parametr). □
2.5. Určete řešení systému rovnic
3xi + 3x3
X\ - X2 + X3
—2x\ — x2 + 4x3 2xi -\- x2 — X3
5X4
X4 2x4 X4
-2, 0, -3.
Řešení. Uvědomme si, že soustava rovnic v tomto příkladu se od soustavy z předešlého příkladu liší pouze v hodnotě 8 (místo —8) na pravé straně první rovnice. Provedeme-li totožné řádkové úpravy jako v minulém příkladu, obdržíme
/ 3 0 3 -5 8 \ / 1 -1 1 -1 -2 \
1 -1 1 -1 -2 2 1 -1 -1 -3
— 2 -1 4 -2 0 -2 -1 4 -2 0
v 2 1 -1 -1 "3 ) V 3 0 3 -5 § /
( 1 -1 1 1 "2 \ / 1 -1 1 -1 -2 \
0 3 -3 1 1 0 3 -3 1 1
0 0 3 — 3 -3 0 0 3 -3 -3
^ 0 0 3 - 3 13 / 0 0 0 16;
kde poslední úpravou bylo odečtení třetího řádku od čtvrtého. Ze čtvrté rovnice 0=16 vyplývá, že soustava nemá řešení. Vyzdvihněme, že při úpravě na schodovitý tvar obdržíme rovnici 0 = a pro nějaké a ^ 0 (tj. nulový řádek na levé straně a nenulové číslo za svislou čarou) právě tehdy, když soustava nemá řešení. □ Další příklady na systémy lineárních rovnic naleznete na straně
123
77
KAPITOLA 2. ELEMENTÁRNI LINEÁRNI ALGEBRA
Z hlediska řešení systémů rovnic A ■ x — u je jistě přirozené považovat za ekvivalentní matice A a vektory u, které zadávají systémy rovnic se stejným řešením. Zkusme se teď zamyslet nad možnostmi, jak zjednodušovat matici A tak, abychom se k řešení blížili. Začneme jednoduchými manipulacemi s řádky rovnic, které řešení ovlivňovat nebudou, a stejným způsobem pak můžeme upravovat i vektor napravo. Když se nám u čtvercové matice podaří vlevo dostat systém s jednotkovou maticí, bude napravo řešení původního systému. Pokud při našem postupu nějaké řádky úplně vypadnou (při úpravách se vynulují), bude to také dávat další přímé informace o řešení. Naše jednoduché úpravy jsou:
-| Elementární řádkové transformace |_
• záměna dvou řádků,
• vynásobení vybraného řádku nenulovým skalárem,
• přičtení řádku k jinému řádku.
Těmto operacím říkáme elementární řádkové transformace. Je zjevné, že odpovídající operace na úrovni rovnic v systému skutečně nemohou změnit množinu všech jeho řešení, pokud je náš okruh oborem integrity. ^^
Analogicky, elementární sloupcové transformace matic jsou
• záměna dvou sloupců,
• vynásobení vybraného sloupce nenulovým skalárem,
• přičtení sloupce k jinému sloupci,
ty však nezachovávají řešení příslušných rovnic, protože mezi sebou míchají samotné proměnné.
Systematicky můžeme použít elementární řádkové úpravy k postupné eliminaci proměnných. Postup je algoritmický a většinou se mu říká Gaussova eliminace proměnných.
.J Gaussova eliminace proměnných J__^——i
Tvrzení. Nenulovou matici nad libovolným okruhem skalárů K lze konečně mnoha elementárními řádkovými transformacemi převést na tzv. (řádkově) schodovitý tvar:
1,..
• Je-li au — 0 pro všechna k všechna k > i,
• je-li a(j-i)j první nenulový prvek na (i
j, potom ay — 0 pro l)-ním řádku, pak
au — 0.
Důkaz. Matice v řádkově schodovitém tvaru vypadá takto
/O 0
aij 0
a2k
aip
aim\
a2,
)
a matice může, ale nemusí, končit několika nulovými řádky. K převodu libovolné matice můžeme použít jednoduchý algoritmus, kterým se postupně, řádek za řádkem, blížíme k výslednému schodovitému tvaru:
B. Manipulace s maticemi
V této podkapitole budeme pracovat pouze s maticemi, abychom si osvojili jejich vlastnosti.
2.6. Násobení matic. Provedte násobení matic a zkontrolujte si výsledek. Všimněte si, že proto, abychom mohli dvě íatice násobit je nutná a postačující podmínka, aby měla první matice stejně sloupců, jako druhá řádků. Počet řádků výsledné matice je pak dán počtem řádků první matice, počet sloupců je roven počtu sloupců druhé matice.
12 7 1 3 0 5
(7 7 18),
Poznámka.Body i) a ii) v předchozím příkladu ukazují, že násobení čtvercových matic není komutativní, v bodě iii) vidíme, dané obdélníkové matice můžeme mezi sebou násobit pouze v jednom ze dvou možných pořadí. V bodech iv) a v) si pak všimněme, že (A ■ B)T = BT -AT.
2.7. Vypočítejte A5 a A-3, je-li
2 -1 1
A = "I 2 -1
o 0 1
O
2.8. Nechťje
ŕ 0 -5\ /
2 7 15 , B=\
7 13/ \
Lze matici A převést na matici B pomocí elementárních řádkových transformací (pak říkáme, že jsou řádkově ekvivalentní)?
Řešení. Obě matice jsou zřejmě řádkově ekvivalentní s trojrozměrnou jednotkovou maticí. Snadno se vidí, že řádková ekvivalence na množině všech matic daných rozměrů je relací ekvivalence. Matice A a B jsou tudíž řádkově ekvivalentní. □
78
KAPITOLA 2. ELEMENTÁRNI LINEÁRNÍ ALGEBRA
Algoritmus Gaussovy eliminace
(1) Případnou záměnou řádků docílíme, že v prvním řádku bude v prvním nenulovém sloupci nenulový prvek, nechť je to j-tý sloupec.
(2) Pro i — 2,..., vynásobením prvního řádku prvkem aij, /-tého řádku prvkem a\j a odečtením vynulujeme prvek na /-tém řádku.
(3) Opakovanou aplikací bodů (1) a (2), vždy pro dosud neupravený zbytek řádků a sloupců v získané matici dospějeme po konečném počtu kroků k požadovanému tvaru.
Tím je tvrzení dokázáno
□
Uvedený postup je skutečně právě obvyklá eliminace proměnných v systémech lineárních rovnic.
Zcela analogickým postupem definujeme sloupcově schodovitý tvar matic a záměnou řádkových na sloupcové transformace obdržíme algoritmus převádějící matici na takový tvar.
Poznámka. Gaussovu eliminaci jsme zformulovali pro obecné 1 „ skaláry z nějakého okruhu. Zdá se být přirozené, že ve schodovitém tvaru ještě vynásobením vhodnými skaláry dosáhneme jednotkových koeficientů na výsledné nenu-S ' lové „diagonále" nad nulami v matici a dopočítáme řešení. To ale pro obecné skaláry nepůjde, představte si třeba celá čísla Z.
Pro řešení systémů rovnic nemá ale vůbec uvedený postup rozumný smysl, když jsou mezi skaláry dělitelé nuly. Promyslete si pečlivě rozdíl mezi K — Z, K — R a případně Z2 nebo z4.
2.8. Matice elementárních transformací. V dalším budeme už pracovat jen s polem skalárů K, každý nenulový skalár tedy má inverzní prvek.
Všimněme si, že elementární řádkové (resp. sloupcové) transformace odpovídají vynásobením zleva (resp. zprava) následujícími maticemi:
(1) Přehození /-tého a j-tého řádku (resp. sloupce)
/l 0
o '••
1 ... o
1/
(2) Vynásobení /-tého řádku (resp. sloupce) skalárem a: /l \
1
V
2.9. Nalezněte nějakou matici B, pro kterou je matice C = B ■ Ave schodovitém tvaru, kde
/3 5 1
V7
3 2\
2 3
-5 0
1 4/
Řešení. Budeme-li matici A postupně násobit zleva elementárními maticemi (uvažte, jakým řádkovým úpravám toto násobení matic odpovídá)
£7
obdržíme
/O 0 1 o\
0 1 0 0
1 0 0 0
V> 0 0 v
/ 1 0 0 0\
0 1 0 0
-3 0 1 0
0 0 V
(l 0 0 0\
0 1/3 0 0
0 0 1 0
V> 0 0 V
(1 0 0 0\
0 1 0 0
0 0 1 0
-4 0 V
B = EsE1E6E5E4Et,E2Ei
/o
0
1
/1 0 0 0\
-5 1 0 0
0 0 1 0
\o 0 0 1)
/1 0 0 0^
0 1 0 0
0 0 1 0
V-7 0 0 1)
(l 0 0 0^
0 1 0 0
0 -2 1 0
v> 0 0 1,
(l 0 0 0^
0 1/4 0 0
0 0 1 0
V> 0 0 1,
0 1 0\
1/12 5/12 0
-2/3 1/3 0
-4/3 -1/3 V
c
/l -3-5 0 \
0 1 9/4 1/4
0 0 0 0
\0 0 o o /
□
2.10. Komplexní čísla jako matice. Uvažme množinu matic
b a
, a, ŕ e lj. Všimněte si, že c je uzavřená na a násobení matic a dále ukažte, že přiřazení / : c -> c, \_t a) ^a + bi splňuje f(M + N) = f(M) + f(N) i f(M-N) = f(M) ■ f(N) (na levých stranác rovností se jedná o sčítání a násobení matic, na pravých o sčítání a násobení komplexních čísel). Na množinu c spolu s násobením a sčítáním matic lze tedy nahlížet jako na těleso c komplexních čísel. Zobrazení / se pak
79
KAPITOLA 2. ELEMENTÁRNI LINEÁRNÍ ALGEBRA
(3) Sečtení ř-tého řádku (resp. sloupce) s j-tým:
/l 0 \
o '••
V
Toto prostinké pozorování je ve skutečnosti velice podstatné, protože součin invertibilních matic je invertibilní (viz rovnost (2.1)) a všechny elementární transformace jsou nad polem skalárů invertibilní (sama definice elementárních transformací zajišťuje, že inverzní transformace je stejného typu a je také snadné určit její matici).
Pro libovolnou matici A tedy dostaneme násobením vhodnou invertibilní maticí P — Pk- ■ P\ zleva (postupné násobení k maticemi zleva) její ekvivalentní řádkový schodovitý tvar A' — P ■ A.
Jestliže obecně aplikujeme tentýž eliminační postup na sloupce, dostaneme z každé matice B její sloucový schodovitý tvar B' vynásobením zprava vhodnou invertibilní maticí Q — Ô i • • • Qí - Pokud ale začneme s maticí B — A' v řádkově schodovitém tvaru, ehminuje takový postup pouze všechny dosud nenulové prvky mimo diagonálu matice a závěrem lze ještě i tyto elementárními operacemi změnit na jedničky. Celkem jsme tedy ověřili důležitý výsledek, ke kterému se budeme mnohokrát vracet:
2.9. Věta. Pro každou matici A typu m /n nad polem skalárů K existují čtvercové invertibilní matice P dimenze m a Q dimenze n takové, že matice P ■ A jev řádkově schodovitém tvaru a
P A-Q
2.10. Algoritmus pro výpočet inverzní matice. V předchozích úvahách jsme se dostali prakticky k úplnému algoritmu pro výpočet inverzní matice. Během jednoduchého níže uvedeného postupu buď zjistíme, že inverze neexistuje, nebo bude inverze spočtena. I nadále pracujeme nad polem skalárů.
Ekvivalentní řádkové transformace se čtvercovou maticí A dimenze n vedou k matici P' takové, že matice P' ■ A bude v řádkově schodovitém tvaru. Přitom může (ale nemusí) být jeden nebo více posledních řádků nulových. Jestliže má existovat inverzní matice k A, pak existuje i inverzní matice k P' ■ A. Jestliže však je poslední řádekv P'Anulový, bude nulový i poslední řádekv P'ABpro jakoukoliv matici B dimenze n. Existence takového nulového řádku ve výsledku (řádkové) Gaussovy eliminace tedy vylučuje existenci A"1.
. 0 ... 0\
0 . . 1 0 ... ... 0
0 . . 0 1 0 ... 0
0 . . 0 0 0 ... 0
V /
nazývá izomorfismem (těles). Je tedy například
3 5\ /8 -9\ _ / 69 IV -5 3) ' \9 8 ) ~ \-13 69;
což odpovídá tomu, že (3 + 5/) • (8 — 9i) = 69 — 13/.
2.11. Vyřešte maticové rovnice
.3 l)-Xl = \3 4,
X
2 •
Řešení. Zjevně neznámé X\ a X2 musejí být matice 2x2 (aby uvažované součiny matic existovaly a výsledkem byla matice 2x2). Položme
' ai b\ \ v (a2 b2
X,
X,
,c\ dij ' \c2 d2/
a roznásobme matice v první zadané rovnici. Má platit
a\ + 3c\ b\ + 3d\ \ (\ 2^ ^«1+8^1 3bl+%dl
3 4
tj. má být
3ci\
+ 3ci + 8ci
+ 3^
1,
2,
3,
4,
X,
3b x + Mi
Sečtením (—3)násobku první rovnice se třetí dostáváme c\ = 0 a následně «1 = 1. Podobně sečtením (—3)násobku druhé rovnice se čtvrtou dostáváme d\ = 2 a poté b\ = —4. Je tedy
'\
v0 2
Hodnoty a2,b2,c2, d2 najdeme odlišným způsobem. Využijeme vztah
'a b\~X 1 (d -b
. c d) ~ ad - bc \~c a který platí pro libovolná čísla a, b, c, d e R (lze snadno odvodit; plyne také přímo z 2.2), spočtěme
1 3Y = (-
3 SJ \ 3 -1, Vynásobení zadané rovnice touto maticí zprava dává
X2
1 2 3 4
■1
a tudíž
X2
2.12. Řešte maticovou rovnici
'2 5 1 3
X
-2 1 ■12 5
□
O
80
KAPITOLA 2. ELEMENTÁRNI LINEÁRNÍ ALGEBRA
Předpokládejme nyní, že A-1 existuje. Podle předchozího, nalezneme řádkově schodovitý tvar bez nulového řádku, tzn. že všechny diagonální prvky v P' ■ A jsou nenulové. Pak ovšem pokračováním eliminace pomocí řádkových elementárních transformací od pravého dolního rohu zpět a vynormováním diagonálních prvků na jedničky získáme jednotkovou matici E. Jinými slovy, najdeme další invertibilní matici P" takovou, že pro P — P" P' platí P ■ A — E. Výměnou řádkových a sloupcových transformací lze za předpokladu existence A~l stejným postupem najít Q takovou, že A ■ Q = E. Odtud
P — P ■ E — P ■ (A ■ Q) — (P ■ Á) ■ Q — Q.
To ale znamená, že jsme nalezli hledanou inverzní matici
A~l — P — Q
k matici A. Zejména se tedy v okamžiku nalezení matice P s vlastností P-A — E už nemusíme s žádnými dalšími výpočty namáhat, protože víme, že již jistě jde o inverzní matici. Prakticky tedy můžeme postupovat takto:
' výpočet inverzní matice
Vedle sebe napíšeme původní matici A a jednotkovou matici E, matici A upravujeme řádkovými elementárními úpravami nejprve na schodovitý tvar, potom tzv. zpětnou eliminací na diagonální matici a v té násobíme řádky inverzními prvky z K. Tytéž úpravy postupně prováděné s E vedou právě k hledané matici A~l. Pokud tento algoritmus narazí na vynulování celého řádku v původní matici, znamená to, že matice inverzní neexistuje.
2.11. Lineární závislost a hodnost. V předchozích úvahách a počtech s maticemi jsme stále pracovali se sčítáním řádků nebo sloupců coby vektorů, spolu s jejich '••;'•'""** .•" násobením skaláry. Takové operaci říkáme lineární kombinace. V abstraktním pojetí se k operacím s vektory vrátíme za chvíli v 2.24, bude ale užitečné pochopit podstatu už nyní. Lineární kombinací řádků (nebo sloupců) matice A — (a^) typu m/n rozumíme výraz
C\Ui
CkUik,
j„) jsou řádky (nebo uj —
, a
kde ci jsou skaláry, u j — (a.j\, (aij, ..., amj) jsou sloupce) matice A.
Jestliže existuje lineární kombinace daných řádků s alespoň jedním nenulovým skalárním koeficientem, jejímž výsledkem je nulový řádek, říkáme, že jsou tyto řádky lineárně závislé. V opačném případě, tj. když jedinou možností jak získat nulový řádek je vynásobení výhradně nulovými skaláry, jsou tyto řádky lineárně nezávislé.
Obdobně definujeme lineárně závislé a nezávislé sloupce matice.
Předchozí výsledky o Gausově eliminaci můžeme teď inte-J.1« pretovat tak, že počet výsledných nenulových „schodů" v řádkově nebo sloupcově schodovitém tvaru je vždy roven počtu lineárně nezávislých řádků matice, resp. počtu linete árně nezávislých sloupců matice. Označme E h matici z věty 2.9 s h jedničkami na diagonále a předpokládejme, že dvěma různými postupy dostaneme různá h' < h. Pak ovšem podle našeho postupu budou existovat také invertibilní matice P a Q takové, že
2.13. Výpočet inverzní matice. Spočtěte inverzní matice k maticím
3
B
Poté určete matici (AT ■ B) 1.
Řešení. Inverzní matici nalezneme tak, že vedle sebe napíšeme matici A a matici jednotkovou. Pomocí řádkových transformací pak převedeme matici A na jednotkovou. Tímto matice jednotková přejde na matici A~l. Postupnými úpravami dostáváme
5 11
0 -1' ( 1 0
1 1 ~ o 0
-2 2 / [o 1
1 0 0 3 -4 3
0 1 0 1 -2 2
0 0 1 -7 11 -9
0
1
2
0
1 0
-1
0
1
0
1 o
1
4
-4 11
-2
přičemž v prvním kroku jsme odečetli od prvního řádku třetí, ve druhém jsme (—5)násobek prvního přičetli ke druhému a současně jeho (—3)násobek ke třetímu, ve třetím kroku jsme odečetli od druhého řádku třetí, ve čtvrtém jsme (—2)násobek druhého přičetli ke třetímu, v pátém kroku jsme (—5)násobek třetího řádku přičetli ke druhému a jeho 2násobek k prvnímu, v posledním kroku jsme pak zaměnili druhý a třetí řádek. Zdůrazněme výsledek
/ 3 -4 3 A~l = í 1 -2 2
\-7 11 -9y
Upozorněme, že při určování matice A~l jsme díky vhodným řádkovým úpravám nemuseli počítat se zlomky. Přestože bychom si mohli obdobně počínat při určování matice B~l, budeme raději provádět více názorné (nabízející se) řádkové úpravy. Platí
0
0
1
0
j_
3 _2
3
0
0
1
1 0 0 1 2 -3 \ /1 0 0 1 2 -3
0 1 0 -1 1 -1 l " 0 1 0 -1 1 -1
0 0 1 3 o -i i / 0 1 0 -2 3
81
KAPITOLA 2. ELEMENTÁRNI LINEÁRNÍ ALGEBRA
tj-
P-Eh,-Q = Eh.
V součinu Eh' ■ Q bude více nulových řádků ve spodní části matice, než kolik má být jedniček v Eh a přitom se k nim máme dostat už jen řádkovými transformacemi. Zvýšit počet lineárně nezávislých řádků ale pomocí elementárních řdákových transformací nelze. Proto je počet jedniček v matici P ■ A ■ Q ve větě 2.9 nezávislý na volbě našeho postupu eliminace a je roven jak počtu lineárně nezávislých řádků v A, tak počtu lineárně nezávislých sloupců v A. Tomuto číslu říkáme hodnost matice a značíme je h (A). Zapamatujme si výsledné tvrzení:
Věta. Nechť A je matice typu m /n nad polem skalárů K. Matice A má stejný počet h(A) Unárně nezávislých řádků a lineárně nezávislých sloupců. Zejména je hodnost vždy nejvýše rovna menšímu z rozměrů matice A.
Algoristmus pro výpočet inverzních matic také říká, že čtvercová matice A dimenze m má inverzi, právě když je její hodnost rovna počtu řádků m.
2.12. Matice jako zobrazení. Zcela stejně, jak jsme s maticemi pracovali v geometrii roviny, viz 1.29, můžeme každou čtvercovou matici A interpretovat jako zobrazení
Díky distributivitě násobení matic je zřejmé, jak jsou zobrazovány lineární kombinace vektorů takovými zobrazeními:
A ■ (a x + b y) — a (A ■ x) + b (A ■ y).
Přímo z definice je také vidět (díky asociativitě násobení matic), že skládání zobrazení odpovídá násobení matic v daném pořadí. Invertibilní matice tedy odpovídají bijektivním zobrazením.
Z tohoto pohledu je velice zajímavá věta 2.9. Můžeme ji číst tak, že hodnost matice určuje, jak velký je obraz celého K" v tomto zobrazení. Skutečně, je-li A — P ■ E k ■ Q s maticí E k s k jedničkami jako v 2.9, pak invertibilní Q napřed jen bijektivně „zamíchá" n-rozměrné vektory v K", matice E k pak „zkopíruje" prvních k souřadnic a vynuluje n—k zbývajících. Tento „^-rozměrný" obraz už pak následně násobení invertibilní P nemůže zvětšit.
2.13. Řešení systémů lineárních rovnic. K pojmům dimenze, lineární nezávislost apod. se vrátíme ve třetí části této kapitoly. Již teď si ale můžeme povšimnout, co právě dovozené výsledky říkají o řešení systému lineárních rovnic. Jestliže budeme uvažovat matici systému rovnic a přidáme k ní ještě sloupec požadovaných hodnot, hovoříme o rozšířené matici systému. Postup, který jsme předvedli odpovídá postupné eliminaci proměnných v rovnicích a vyškrtání lineárně závislých rovnic (ty jsou prostě důsledkem ostatních).
Dovodili jsme tedy kompletní informaci o velikosti množiny řešení systému lineárních rovnic v závislosti na hodnosti matice systému. Pokud nám při přechodu na řádkově schodovitý tvar zůstane v rozšířené matici více nenulových řádků než v matici systému, pak žádné řešení nemůže existovat (prostě se daným lineárním zobrazením do požadované hodnoty vůbec netrefíme). Pokud je hodnost obou matic stejná, pak nám při zpětném dopočtu řešení zůstane právě tolik volných parametrů, kolik je rozdíl mezi počtem proměnných n a hodností h (A).
B~
Využitím identity
(A?.B)-
B-1 ■ (AT)~
BT
(A"T
a znalosti výše vypočítaných inverzních matic lze obdržet
(A-.BY
1
-7" -9j
□
2.14. Vypočítejte inverzní matici k matici
O
2.15. Nalezněte inverzní matici k matici
/8 3 0 0 0\
5 2 0 0 0
0 0 -1 0 0
0 0 0 1 2
0 0 3 V
O
2.16. Zjistěte, zda existuje inverzní matice k matici
C
/l 1 1
V1
1
1 \
1
-1 1
Pokud ano, určete tuto matici C
O
2.17. Stanovte A 1, j e-li
(a) A = / 1
u 3>
-5
(b) A = -1 5
V-1 6
tady byla ještě ukázka
matic rotací - patrně
budou v příkladech, tak
jsou tady
vyprocentované
přičemž i je imaginární jednotka;
O
82
KAPITOLA 2. ELEMENTÁRNI LINEÁRNI ALGEBRA
2. Determinanty
2.18. Napište inverzní matici k n x n matici (n > 1)
V páté části první kapitoly jsme viděli (viz 1.27), že pro čtvercové matice dimenze 2 nad reálnými čísly exis-
íijy tuje skalární funkce det, která matici přiřadí nenu-<5T^|jgg!ř^ iov£ číslo, právě když existuje její inverze. Neříkali jsme to sice stejnými slovy, ale snadno si to ověříte (viz odstavce počínaje 1.26 a vzorec (1.16)). Determinant byl užitečný i jinak, viz odstavce 1.33 a 1.34, kde jsme si volnou úvahou odvodili, že obsah rovnoběžníka by měl být lineárně závislý na každém ze dvou vektorů definujících rovnoběžník a že je užitečné zároveň požadovat změnu znaménka při změně pořadí těchto vektorů. Protože tyto vlastnosti měl, až na pevný skalární násobek, jedině determinant, odvodili jsme, že je obsah dán právě takto. Nyní uvidíme, že podobně lze postupovat v každé konečné dimenzi.
V této části budeme pracovat s libovolnými skaláry K a maticemi nad těmito skaláry. Naše výsledky o determinantech tedy budou vesměs platit pro všechny komutativní okruhy, zejména tedy třeba pro celočíslené matice.
2.14. Definice determinantu. Připomeňme, že bijektivní zobrazení množiny X na sebe se nazývá permutace množiny X, viz 1.7. Je-li X — {1, 2,..., n], lze permutace zapsat pomocí výsledného pořadí ve formě tabulky:
1
<7(1)
2
g (2)
n
a {n)
Prvek x € Z se nazývá samodružným bodem permutace a, je-li a (x) — x. Permutace a taková, že existují právě dva různé prvky x, y e X s g (x) — y, zatímco všechna ostatní z e X jsou samod-ružná, se nazývá transpozice, značíme ji (x, y). Samozřejmě pro takovou transpozici platí také g (y) — x, odtud název.
V dimenzi 2 byl vzorec pro determinant jednoduchý -vezmeme všechny možné součiny dvou prvků, po
^____jednom z každého sloupce a řádku matice, opatříme
je znaménkem tak, aby při přehození dvou sloupců došlo ke změně celkového znaménka, a výrazy všechny (tj. oba) sečteme:
A — , det A — ad — bc.
Obecně, uvažujme čtvercové matice A — (a^-) dimenze n nad K. Vzorec pro determinant matice A bude také poskládaný ze všech možných součinů prvků z jednotlivých řádků a sloupců:
_mmmmm^Definice determinantu ^■__mai
Determinant matice A je skalár det A = \A \ definovaný vzta-
hem
\A\ — ^2 sgn(CT)flio.(i) -020-1
(2) • • • anCr(n)
kde £„ je množina všech možných permutací na {1,..., n} a znaménko sgn pro každou permutaci g ještě musíme popsat. Každý z výrazů
sgn(er)a\a(i) ■ fl2o-(2) • • • a„a(„) nazýváme člen determinantu \A\.
V dimenzích 2 a 3 snadno uhádneme i správná znaménka. Součin prvků z diagonály má být s kladným znaménkem a chceme antisymetrii při přehození dvou sloupců nebo řádků.
(2-n 1 1 2-n
\ 1 1
1 1 \
1
2-n 1 1 2-n)
O
C. Permutace
Abychom mohli definovat stěžejní pojem kalkulu matic, totiž determinant, je nutné se věnovat permutacím (bijekcím na konečné množině), zejména pak jejich paritě.
Pro zápis permutací (tj. bijektivních zobrazení na dané konečné množině) budeme používat tzv. dvouřádkový zápis, (viz 2.14) V prvním řádku uvedeme všechny prvky uvažované množiny, libovolný sloupeček je pak tvořen dvojicí vzor, obraz (v dané permutaci). Protože permutace je bijekce, je druhý řádek vskutku permutací (pořadím) řádku prvního, v souladu s názvoslovím používaným v kombinatorice.
2.19. Rozložte permutaci
er
123456789 316789542
Na součin transpozic.
Řešení. Nejprve rozložíme permutaci na součin nezávislých cyklů: začneme s prvním prvkem (jedničkou) a ve druhém řádku odečteme, na jaký prvek se v dané permutaci zobrazuje. Je to trojka. Nyní se podíváme na sloupeček začínající trojkou a odečteme z něj, že se zobrazuje na šestku, atd. Pokračujeme tak dlouho, dokud se nám nějaký prvek nezobrazí na počáteční prvek (v tomto případě jedničku). Dostáváme následující posloupnost prvků, které se na sebe v dané permutaci zobrazují:
1 i—> 3 i—> 6 i—> 9 i—> 2 i—> 1.
Zobrazení, které zobrazuje prvky výše uvedeným způsobem je tzv. cyklus (viz 2.16), který zapisujeme (1, 3, 6, 9, 2).
Nyní vezmeme prvek, který není obsažený v získaném cyklu a opakujeme s ním postup jako z jedničkou. Dostáváme cyklus (4,7,5,8). Z postupu vyplývá, že musí být nezávislý na prvním. Každý prvek z dané množiny ({1, 2, ..., 9}) se již vyskytuje v některém z cyklů, můžeme tedy psát:
a = (l,3,6,9,2)o(4,7,5,8).
83
KAPITOLA 2. ELEMENTÁRNI LINEÁRNI ALGEBRA
„j Determinanty v dimenzi 2 a 3 ^.
Pro n — 2 je, jak jsme čekali
Podobně pro n
an a n ai3
Ö21 a22 a23 Ö31 Ö32 Ö33
an an
«21 «22 3
— <311 «22 — Al2fl21-
flllfl22fl33 — fll3fl22fl31 + 013021032 —flllfl23fl32 + fll2fl23fl31 ~ fll2fl21fl33-
Tomuto vzorci se říká Saarusovo pravidlo.
1
2.15. Parita permutace. Jak tedy najít správná znaménka permutací? Říkáme, že dvojice prvků a, b e X — [ 1, ..., n} tvoří inverzi v permutaci a, je-li a < b a a (a) > cr(b). Permutace er se nazývá sudá (resp. ^)%j^Li_ lichá), obsahuje-li sudý (resp. lichý) počet inverzí.
Parita permutace er je (_i)P°cet inverzi a značíme ji sgn(er). Tolik tedy definice znamének našich členů determintu. Chceme ale vědět, jak s paritou počítat. Z následujícího tvrzení o permutacích už je jasně vidět, že Saarusovo pravidlo skutečně počítá determinant v dimenzi 3.
Věta. Na množině X — {1,2, ...,n\ je právě n \ různých permutací. Tyto lze seřadit do posloupnosti tak, že každé dvě po sobě jdoucí se liší právě jednou transpozicí. Lze při tom začít libovolnou permutací. Každá transpozice mění paritu.
Důkaz. Pro jednoprvkové a dvouprvkové X tvrzení samozřejmě platí. Budeme postupovat indukcí přes dimenzi.
Předpokládejme, že tvrzení platí pro všechny množiny s n — 1 prvky a uvažme permutaci a{\) — a\, ... ,a{n) — a„. Podle indukčního předpokladu všechny permutace, které mají na posledním místě a„, dostaneme z tohoto pořadí postupným prováděním transpozic. Přitom jich bude (n — 1)!. V posledním z nich prohodíme a(n) — an za některý z prvků, který dosud nebyl na posledním místě, a znovu uspořádáme všechny permutace s tímto vybraným prvkem na posledním místě do posloupnosti s požadovanými vlastnostmi. Po n-násobné aplikaci tohoto postupu získáme n {n — 1) = n \ zaručeně různých permutací, tzn. všechny, právě předepsaným způsobem.
Všimněme si, že poslední věta dokazovaného tvrzení se nezdá příliš důležitá pro jeho využití. Je však velice důležitou částí postupu v našem důkazu indukcí přes počet prvků v X.
Zbývá tvrzení věty o paritách. Uvažme pořadí
(fli
. Cli, +
, a„),
ve kterém je r inverzí. Pak zjevně je v pořadí
(a\, ..., fli+i, ai, ..., a„)
budV — 1 nebo r+1 inverzí. Každou transpozici (a, , a j) lze přitom získat postupným provedením (j — i) + (j — i — 1) — 2(j — i) — 1 transpozic sousedních prvků. Proto se provedením libovolné transpozice parita permutace změní. Navíc již víme, že všechny permutace lze získat prováděním transpozic. □
Zjistili jsme, že provedení libovolné transpozice změní paritu permutace a že každé pořadí čísel {1,2,... ,n] lze získat postupnými transpozicemi sousedních prvků. Dokázali jsme proto:
Pro cykly je rozklad na permutace jednoduchý. Je totiž
(1, 3, 6, 9, 2) = (1, 3)o(3, 6)o(6, 9)o(9, 2) = (1, 3)(3, 6)(6, 9)(9, 2). Celkem dostáváme:
a = (1, 3)(3, 6)(6, 9)(9, 2)(4, 7)(7, 5)(5, 8).
□
Poznámka. Upozorněme, že operace o je skládání zobrazení, je nutné tedy zobrazení ve složení provádět „odzadu" tak, jak jsme u skládání zobrazení zvyklí. Aplikaci daného složení transpozic kupříkladu na prvek 2 můžeme postupně zapsat:
[(1, 3)(3, 6)(6, 9)(9, 2)](2) = [(1, 3)(3, 6)(6, 9)]((9, 2)(2)) =
[(1,3)(3,6)(6, 9)](9) = [(1,3)(3,6)](6) = (1,3)(3) = 1,
tedy vskutku zobrazuje dané zobrazení prvek 2 na prvek 1 (je to totiž
pouze jinak zapsaný cyklus (1, 3, 6, 9, 2). V zápisu skládání permutací
však znak „o" často vypouštíme a hovoříme o součinu permutací.
Při zápisu cyklu zapisujeme pouze prvky, na kterých cyklus (tj.
zobrazení) netriviálně působí (tj. zobrazuje je jinam, než na sebe
sama). Pevné body cyklu naopak v jeho notaci neuvádíme. Je tudíž
nutné vědět, na které množině daný cyklus uvažujeme (většinou
zřejmé z kontextu). Cyklus (4,7,5,8) z předchozího příkladu,
označme tento cyklus jako c, je tedy zobrazení (permutace), které by
ve dvojřádkovém zápisu mělo tvar
'l 2345678 9N 1 2378654 9y
Pokud tedy má již původní permutace nějaké pevné body, tak se v rozkladu na cykly neobjevují.
Dále si všimněme, že zápis (1, 2, 3) zadává stejný cyklus jako (2, 3, 1) či (3, 1, 2). Cyklus (1, 3, 2) je však již jiné zobrazení.
2.20. Určete paritu následujících permutací:
1 2345678 9\ _/l 23456 .3 1678954 2/ X ~ \2 4 6 1 5 3
er
Řešení. Z předchozího příkladu víme, že a = (1, 3) (3, 6) (6, 9) (9, 2) (4, 7) (7, 5) (5, 8).
Její parita je dána paritou počtu transpozic v jejím rozkladu (ta je
narozdíl od počtu transpozic v libovolném rozkladu dané permutace
stejná). Transpozic je v rozkladu sedm, permutace je tudíž lichá. Bez
znalosti rozkladu a na traspozice, bychom mohli spočítat počet dvojic
(a,b) c {1, 2, ..., 9} x {1, 2, ..., 9}, které jsou v inverzi vůči a
(viz 2.15: procházíme postupně druhý řádek zápisu permutace a pro
každé číslo přičteme počet čísel, která jsou menší než ono číslo a
84
KAPITOLA 2. ELEMENTÁRNI LINEÁRNI ALGEBRA
Důsledek. Na každé konečné množině X \n\ sudých a j
n > 1, je právě \n! sudých a hni lichých permutací.
[I, ... ,n] s n prvky,
Jestliže složíme dvě permutace za sebou, znamená to provést napřed všechny transpozice tvořící první a pak druhou. Proto pro libovolné permutace er, rj : X -> X platí
a proto také
sgn((T o rf) = sgn(cr) • sgn(^)
sgn((T ) = sgn(cr).
2.16. Rozklad permutace na cykly. Dobrým nástrojem pro praktickou práci s permutacemi je jejich rozklad na tzv. cykly.
^mtm—__| Cykly ^K>i_Ma^_BI|
I Permutace er na množině X — {1,..., n] se nazývá cyklus délky k, jestliže je možné najít prvky a\,..., a* e X, 2 < k < n, takové, že er(a;) — ai+\, i — 1, ..., k — 1, zatímco er(a,t) — «1 a ostatní prvky v X jsou pro er samodružné. Cykly délky dva jsou právě transpozice.
Každá permutace je složením cyklů. Cykly sudé délky mají
^^aritu^^^cyUyliché^élky mají paritu 1.
Poslední tvrzení musíme ještě dokázat. Jestliže definujeme pro danou permutaci er relaci R tak, že dva prvky x, % y e X jsou v relaci právě když ar (x) — y pro nějakou iteraci permutace er, pak zjevně jde o relaci ekvivalence (ověřte si podrobně!). Protože je X konečná množina, musí pro nějaké £ být a1 (x) — x. Jestliže zvolíme jednu třídu ekvivalence {x, er (x),..., al~x (x)} c Z a ostatní prvky definujeme jako samodružné, dostáváme cyklus. Evidentně je pak celá původní permutace X složením všech těchto cyklů pro jednotlivé třídy naší ekvivalence a je jedno v jakém pořadí cykly skládáme.
Pro určení parity si nyní stačí povšimnout, že cykly sudé délky lze napsat jako lichý počet transpozic, proto mají paritu —1. Obdobně cyklus Uché délky dostaneme ze sudého počtu transpozic a proto mají paritu 1.
2.17. Jednoduché vlastností determinantu. Poznání vlastností permutací a jejich parit z předchozích odstavců nám teď umožní rychle odvodit základní vlastnosti deter-
'(^N*-"- minantů.
vl'-i=r Pro každou matici A — (a^) typu m/n nad ska-
láry z K definujeme matici transponovanou k A. Jde o matici AT — (a-j) s prvky a -■ — a ji, která je typu n/m.
Čtvercová matice A s vlastností A — AT se nazývá symetrická. Jestliže platí A — —AT, pak se A nazývá antisymetrická.
Jednoduché vlastnosti determinantů
T5f h>
Věta. Pro každou čtvercovou matici A — (flij) platí následujícíc tvrzení:
(1) \AT\ = \A\
(2) Je-li jeden řádek v A tvořen nulovými prvky z K, pak \A\ =0.
(3) Jestliže matice B vznikla z A výměnou dvou řádků, pak | A | — -\B\.
(4) Jestliže matice B vznikla z A vynásobením řádku skalárem a € K, pak \ B\ — a \ A\.
která stojí v řádku za ním. Není těžké si rozmyslet, že počet inverzí v dané permutaci je právě počet dvojic čísel „větší před menším" v druhém řádku. Pro a počítáme (procházíme druhý řádek): za trojkou je jednička i dvojka, tedy přičítáme 2, za jedničkou není pochopitelně žádné menší číslo, přičítáme 0, za šestkou je pětka, čtyřka a dvojka, tedy přičítáme 3, stejně tak za sedmičku, osmičku i devítku, za pětku přičítáme 2, za čtyřku 1 a dvojku nic. Celkem máme 17 inverzí, permutace je tedy vskutku Uchá.
Obdobně můžeme rozložit r buď na součin transpozic (pomocí rozkladu na nezávislé cykly):
r = (1, 2, 4)(3, 6) = (1, 2)(2, 4)(3, 6),
nebo zjistíme počet inverzí ví: 1+2 + 3 + 0+1 = 7. Tak jako tak zjišťujeme, že r je rovněž lichá permutace.
□
D. Determinanty
Ověřte si nejprve na následujícím příkladu, že umíte počítat determinanty matic 2 x 2 a 3 x 3 (pomocí Saarusova pravidla):
2.21. Určete determinanty matic:
1 2
2 1
-1
3N 2>
2.22. Spočítejte determinant matice
/l 3 5 6\ 12 2 2 1112 \0 1 2 1/
Řešení. Začneme rozvíjet podle prvního sloupce, kde máme nejvíce (jednu) nul. Postupně dostáváme
13 5 6 12 2 2 1112 0 12 1
Podle Saarusova pravidla
2 2 2 3 5 6 3 5 6
1 • 1 1 2 - 1 • 1 1 2 + 1 • 2 2 2
1 2 1 1 2 1 1 2 1
2 + 6
2.23. Nalezněte všechny hodnoty argumentu a takové, že
a 1 1 1
0 a 1 1
Ola 1
0 0 0 -a
□
1.
85
KAPITOLA 2. ELEMENTÁRNI LINEÁRNÍ ALGEBRA
(5) Jsou-li prvky k-tého řádku v A tvaru — +bkj a všechny ostatní řádky v maticích A, B — (bij), C — (q,) jsou stejné, pak\A\ = \B\ + \C\.
(6) Determinant | A \ se nezmění, přičteme-li k libovolnému řádku A lineární kombinaci ostatních řádků.
důkaz. (1)
Členy determinantů \A\ a \A1 | jsou v bijektivní korespondenci. Členu sgn((T)alfr(1) • a2a(2) ■ ■ ■ ana(n) přitom v AT odpovídá člen (na pořadí skalárů v součinu
totiž nezáleží)
sgn(er)flo-(i)i • flo-(2)2 • • • aa(„)„ —
= sgn((T)fllfr-i (1)
a2a-1 (2) '
' ana-1 («)'
přičemž musíme ověřit, že je tento člen opatřen správným znaménkem. Parita er a er-1 je ale stejná, jde tedy opravdu o člen v determinantu | AT | a první tvrzení je dokázáno.
(2) Plyne přímo z definice determinantu, protože všechny jeho členy obsahují z každého řádku právě jeden člen. Je-li jeden z řádků nulový, budou tedy všechny členy determinantu nulové.
(3) Ve všech členech | B\ dojde ve srovnání s determinantem
| A | u permutací k přidání jedné transpozice, znaménko všech členů determinantu tedy bude opačné.
(4) Vyplývá přímo z definice, protože členy determinantu | B\ jsou členy \A\ vynásobené skalárem a.
(5) V každém členu \A\ je právě jeden součinitel z &-tého řádku matice A. Protože platí distributivní zákon pro násobení a sčítání v K, vyplývá tvrzení přímo z definičního vztahu pro determinanty.
(6) Jsou-li v A dva stejné řádky, jsou mezi členy determinantu vždy dva sčítance stejné až na znaménko. Proto je v takovém případě \A\ — 0. Je tedy podle tvrzení (5) možné přičíst k vybranému řádku libovolný jiný řádek, aniž by se změnila hodnota determinantu. Vzhledem k tvrzení (4) lze ale přičíst i skalární násobek libovolného jiného řádku. □
2.18. Výpočetní důsledky. Podle předchozí věty umíme převést elementárními řádkovými transformacemi každou čtvercovou matici A na řádkově schodovitý tvar, aniž bychom změnili hodnotu jejího determinantu. Jen musíme dávat pozor, abychom vždy k upravovanému řádku pouze přičítali lineární kombinace řádků ostatních.
-| VÝPOČET DETERMINANTŮ ELIMINACÍ |_
Je-li matice A v řádkovém schodovitém tvaru, pak v každém členu | A | je alespoň jeden součinitel prvkem pod diagonálou s výjimkou případu, kdy jsou všechny jen na diagonále. Pak je ale jediným nenulovým členem determinantu ten, který odpovídá identické permutaci. Vidíme tedy, že determinant takové matice ve schodovitém tvaru je
\A\ — au ■ ail----
Předchozí věta tedy poskytuje velice efektivní metodu výpočtu determinantů pomocí Gaussovy ehminační "^^y^^^^^^J
Pro komplexní a uvedte buďjeho algebraický nebo goniometrický tvar. Řešení. Spočítáme determinant rozvinutím podle prvního sloupce ma-
tice:
D
a 1 1 1
0 a 1 1
Ola 1
0 0 0 -a
a 1 1
a ■ 1 a 1
0 0 —a
dále rozvíjíme podle posledního řádku:
r> i \ a 1 D = a ■ (—a) , =
la
Celkem dostáváme následující podmínku pro a: a4 — a2 + 1 = 0.
-a2(a2 - 1).
Substitucí t = a2, pak máme t2 — t + 1 s kořeny h
cos(7t/3) + i sin(7r/3), h
l-iV3
cos(7t/3) — i sin(7r/3)
cos(—jt/3) + i sin(—7T/3), odkud snadno určíme čtyři možné hodnoty parametru a: a\ = cos(it/6) + i sin(7r/6) = V3/2 + i/2, a2 = cos(77r/6) + i sin(77r/6) = — V3/2 — i/2, a3 = cos(—jt/6) + i sin(—it/6) = v3/2 — i/2, a^ = cos(57r/6) + i sin(57r/6) = -V3/2 + //2. □
2.24. Vandermondův determinant. Dokažte vzorec pro tzv. Vander-mondův determinant, tj. determinant Vandermondovy matice:
V„
1 1 .. 1
CL\ a2 ..
2 2
af a2 .. ü
-n-\
a2
-,n-l
Y[ (aj -at),
l i.
Řešení. Odečtením prvního řádku od všech ostatních řádků a následným rozvojem podle prvního sloupce obdržíme
V„(xi, x2,
1 X\ x\ 0 x2 — x\ x\
..n-l
2 2
.,«-1
0 xn X\ Xn x^
2 2
X2 - X\ Xj^ - X-y
2 2 X\ Xn — Xj
x„
n-l
„«-1
„n-l vn-l
Vytkneme-Li z /-tého řádku xi+\ — x\ pro i e {1, 2, — 1}, dostaneme
V„(xi,x2, ...,xn) = (x2 — Xi) ■ ■ ■ (x„ — Xi)
1 X2 + X\ 1 X„ + X\
En—2 n—j—2 j j=0 X2 Xl
n-2 n-j-2 j
En—A n j=0 X"
86
KAPITOLA 2. ELEMENTÁRNI LINEÁRNÍ ALGEBRA
Všimněme si také hezkého důsledku prvního tvrzení před-«s>. chozí věty o rovnosti determinantů matice a matice
transponované. Zaručuje totiž, že kdykoliv se nám podaří dokázat nějaké tvrzení o determinantech formulované s využitím řádků příslušné matice, pak analogické tvrzení platí i pro sloupce. Např. tedy můžeme okamžitě všechna tvrzení (2)-(6) této věty přeformulovat i pro přičítání lineárních kombinací ostatních sloupců k vybranému. To můžeme hned použít pro odvození následujícího vzorce pro přímý výpočet řešení systémů lineárních rovnic:
^mm^^mCrAMMEROVO PRAVIDLO J^m—om^
Uvažme systém n linárních rovnic pro n proměnných s maticí sytému A — (a^) a sloupcem hodnot b — (b\,..., b„), tj. v maticovém zápisu řešíme rovnici A ■ x — b. Jestliže existuje inverze A~l, pak jsou jednotlivé komponenty jediného řešení x — (x\,..., x„) dány vztahem
xí = \At\\A\-\
kde matice A i vznikne z matice systému A výměnou ř-tého sloupce za sloupec hodnot b.
Skutečně, jak jsme viděli, inverze k matici systému existuje právě tehdy, když má systém jediné řešení. Jestliže tedy takové řešení x máme, můžeme za sloupec b dosadit do matice A/ příslušnou kombinaci sloupců matice A, tj. hodnoty b i — anx\ 4-
----Yai„x„. Pak ale odečtením x^-násobků všech ostatních sloupců
zůstane v ř-tém sloupci pouze x;-násobek původního sloupce z A. Číslo xí tedy můžeme vytknout před determinant a získáme rovnost | Ai 11A | ~1 — xí | A11A | ~1 — xí, což je požadované tvrzení.
Dále si všimněme, že vlastnosti (3)-(5) z předchozí věty říkají, že determinant jakožto zobrazení, které n vektorům dimenze n (řádkům nebo sloupcům matice) přiřadí skalár, je antisymetrické zobrazení lineární v každém svém argumentu, přesně jako jsme podle analogie z dimenze 2 požadovali.
2.19. Další vlastnosti determinantu. Časem uvidíme, že skutečně stejně jako v dimenzi dva je determinant matice roven orientovanému objemu rovnoběžnostěnu určeného jejími sloupci. Uvidíme také, že když uvážíme zobrazení x i-> A ■ x zadané čtvercovou maticí A na K°, pak můžeme determinant této matice vidět jako vyjádření poměru mezi objemem rovnoběžnostěnů daných vektory x\,...xn a jejich obrazy A ■ x\,..., A ■ x„. Protože skládání zobrazení x \-> A ■ x \-> B ■ (A ■ x) odpovídá násobení matic, je snad docela pochopitelná tzv. Cauchyova věta:
m^m^__Cauchyova věta ^__^__ma(
Věta. Nechť A — (flý), B — (bij) jsou čtvercové matice dimenze n nad okruhem skalárů K. Pak \ A ■ B\ — \ A\ ■ \B\.
Všimněme si, že z Cauchyovy věty a z reprezentace elementárních rakových transformací pomocí násobení vhodnými maticemi (viz 2.8), okamžitě vyplývají tvrzení (2), (3) a (6) z Věty 2.17.
Odečtením od každého sloupce (počínaje posledním a konče druhým) x\-násobku předcházejícího lze docílit úpravy
^«—2 n—j—2 j
1 X2 + X\
En—z. n
En—2 n—j—2 j j-Q xn X\
1 X2
1 xn
..n-2
jn-2
1 X„ + X\
Proto
V„(xi, x2, ..., x„) = (x2 — x\) ■ ■ ■ (x„ — x\) V„-i(x2, ..., x„). Neboť je zřejmě
V2(xn — l,Xn) = Xn Xn — \,
platí (uvažme matematickou indukci)
V„(Xi,X2, . . . ,X„) = Y[ (Xj-Xi).
l
xi + (1 — a)x2 = b — 3,
xi + (1 — a)x2 + axj, = 2b — 1
(a) právě 1 řešení;
(b) zadne resem;
(c) alespoň 2 řešení?
Řešení. Soustavu „tradičně" přepíšeme do rozšířené matice a upravíme
a a
0
a
2b - 1
1
1 —a —2 b 0 12-3 0 0 a b+2
Dodejme, že v prvním kroku jsme první řádek odečetli od druhého a od třetího a ve druhém kroku pak druhý od třetího. Vidíme, že soustava bude mít právě jedno řešení (které lze určit zpětnou eliminací) tehdy a jenom tehdy, když a ^ 0. Pro a = 0 totiž ve třetím sloupci není první nenulové číslo nějakého řádku. Je-li a = 0 a b = —2, dostáváme nulový řádek, kdy volba 13 ei jako parametru dává nekonečně mnoho různých řešení. Pro a = Oab ^ —2 poslední rovnice a = b+2 nemůže být splněna - soustava nemá řešení.
89
KAPITOLA 2. ELEMENTÁRNI LINEÁRNI ALGEBRA
s nulami v pravém dolním rohu. Dostaneme
(au ■■■ a\n c\\ ... c\„\
K
■
-1
o o
o
o /
V o -10
Prvky submatice nahoře vpravo přitom musí splňovat
čij = anbij + ai2b2j H-----h ainbnj
neboh jde právě o prvky součinu A ■ B a\K\ — \H\. Přitom rozvojem podle posledních n sloupců dostáváme
\K\ = (-1)"+1+-+2"|A • B\ = (-l)2"-("+D -\A-B\ = \A- B\.
Tím je Cauchyova věta bezezbytku dokázána.
2.23. Determinant a inverzní matice. Předpokládejme nejprve, že existuje matice inverzní k matici A, tj. A • A-1 — E. Protože pro jednotkovou matici platí vždy | E\ — 1, je pro každou invertibilní matici vždy |A| inver-tibilní skalár a díky Cauchyově větě platí \A~1\ —
\A[ '
My však nyní kombinací Laplaceovy věty a Cauchyho věty umíme říci víc.
| Vzorec pro inverzní matici
Pro libovolnou čtvercovou matici A — (a^) dimenze n definujeme matici A* — (a*.,), kde a*. — A p jsou algebraické doplňky k prvkům a ji v A. Matici A* nazýváme algebraicky adjungovaná matice k matici A.
Věta. Pro každou čtvercovou matici A nad okruhem skalárů K platí
(2.2) AA* = A*A = |A| • E.
Zejména tedy
(1) A ~1 existuje jako matice nad okruhem skalárů K, právě když | A |_1 existuje v K.
(2) Pokud existuje A ~1, /»z& A ~1
Poznamenejme, že pro a = 0, & = — 2 jsou řešeními
(jci, x2, x3) = (-2 + 2t, —3 — 2ř, i) , íel
a pro a ^ 0 je jediným řešením trojice
-3a2 - ab - 4a + 2b + 4 2b + 3a+4 b + 2
□
2.29. Zjistěte počet řešení soustav (a)
12xi + V5x2 + 11x3
(b)
(c)
Xi - 5x3 = -9,
xx + 2X3 = -7;
4xi + 2x2 _ 12X3 = 0,
5xi + 2x2 - x3 = 0,
—2xi — x2 + 6x3 = 4;
4X! + 2x2 _ 12X3 = 0,
5xi + 2x2 - x3 = 1,
—2xi — x2 + 6x3 = 0.
|A|
A*.
1
Důkaz. Jak jsme již zmínili, Cauchyova věta ukazuje, že z existence A-1 vyplýváinvertibilita |A| e K.
Pro libovolnou čtvercovou matici A spočteme přímým výpočtem A • A* — (c^), kde
'ij = ^2aikakj = ^2aikA
k=\
k=\
Pokud i — j je to právě Laplaceův rozvoj | A| podle ř-tého řádku. Pokud i / j jde o rozvoj determinantu matice v níž je i-tý a j-tý řádek stejný a proto je c;; — 0. Odtud plyne A • A* — \ A| • E a dokázah jsme rovnost (2.2).
Předpokládejme navíc, že | A | je invertibilní skalár. Jestliže zopakujeme předešlý výpočet pro A* A, obdržíme | A | ~1 A* • A — E. Proto náš výpočet skutečně dává inverzní matici A, jak je tvrzeno ve větě. □
Řešení. Vektory (1, 0, —5), (1, 0, 2) jsou očividně lineárně nezávislé (jeden není násobkem druhého) a vektor (12, VŠ, 11) nemůže být jejich lineární kombinací (jeho druhá složka je nenulová), a proto matice, jejímiž řádky jsou tyto tři lineárně nezávislé vektory, je invertibilní. Soustava ve variantě (a) má tedy právě jedno řešení.
U soustav ve variantách (b), (c) si stačí povšimnout, že je
(4,2, -12) = -2(-2, -1,6).
V případě (b) tak sečtení první rovnice s dvojnásobkem třetí dává 0 = 8 - soustava nemá řešení; v případě (c) je třetí rovnice násobkem první - soustava má zřejmě nekonečně mnoho řešení. □
2.30. Najděte (libovolný) lineární systém, jehož množina řešení je právě
{(ŕ + 1, 2t, 3t, 40; t e R}. Řešení. Takovým systémem je např.
2xi — x2 = 2, 2x2 — X4 = 0, 4x3 — 3x4 = 0.
Těmto rovnicím totiž uvedené řešení vyhovuje pro každé t e R a vektory
(2,-1,0,0), (0,2,0,-1), (0,0,4,-3)
zadávající levé strany rovnic jsou zřejmě lineárně nezávislé (množina řešení obsahuj e j eden parametr). □
90
KAPITOLA 2. ELEMENTÁRNI LINEÁRNÍ ALGEBRA
Jako přímý důsledek této věty můžeme znovu ověřit Cram-merovo pravidlo pro řešení systémů lineárních rovnic, viz 2.18. Skutečně, pro řešení systému A ■ x — b stačí důsledně přečíst v rovnosti
x — A~l ■ b — \A\~lA* -b
poslední výraz jako Laplaceův rozvoj determinantu matice A, vzniklé výměnou ř-tého sloupce v A za sloupec hodnot b.
3. Vektorové prostory a lineární zobrazení
2.24. Abstraktní vektorové prostory. Vraťme se teďna chvilku k systémům m lineárních rovnic pro n proměnných z 2.3 a předpokládejme navíc, že jde o homogenní systém rovnic A ■ x — 0, tj.
\ami ... amn) \x„) \0/ Díky vlastnosti distributivity pro násobení matic je zřejmé, že součet dvou řešení x — (x\,..., x„) a y — (yi, ■ ■ ■, yn) splňuje
A-(x + y) = A- x + A- y = 0
a je tedy také řešením. Stejně tak zůstává řešením i skalární násobek a ■ x. Množina všech řešení pevně zvoleného systému rovnic je proto uzavřená na sčítání vektorů a násobení vektorů skaláry. To byly základní vlastnosti vektorů dimenze n v K", viz 2.1. Teď ale máme vektory v prostoru řešení s n souřadnicemi a „rozměr" tohoto prostoru je dán rozdílem počtu proměnných a hodností matice A. Můžeme tedy snadno mít při řešení 1000 souřadnic a jen jeden nebo dva volné parametry. Celý prostor řešení se pak bude chovat jako rovina nebo přímka, jak jsme je poznali již v 1.25 na straně 27.
Už v odstavci 1.9 jsme ale potkali ještě zajímavější příklad prostoru všech řešení homogenní lineární diferenční rovnice (prvního řádu). Všechna řešení jsme dostali z jednoho pomocí násobení skaláry a jsou tedy také uzavřená na součty a skalární násobky. Tyto „vektory" řešení ovšem jsou nekonečné posloupnosti čísel, přestože intuitivně očekáváme, že , jozměr" celého prostoru řešení by měl být jedna. Potřebujeme proto obecnější definici vektorového prostoru a jeho dimenze:
mm^^mwmrnmrn^ DEFINICE VEKTOROVÉHO PROSTORU
Vektorovým prostorem V nad polem skalárů K rozumíme množinu, na které jsou definovány
• operace sčítání splňující axiomy (KG1)-(KG4) z odstavce 1.1 na straně 5,
• násobení skaláry, pro které platí axiomy (V1)-(V4) z odstavce 2.1 na straně 72.
Připomeňme také naši jednoduchou konvenci ohledně značení: skaláry budou zpravidla označovány znaky z počátku abecedy, tj. a, b, c,..., zatímco pro vektory budeme užívat znaky z konce, u, v, w, x, y, z. Přitom ještě navíc většinou x, y, z budou opravdu n-tice skalárů. Pro úplnost výčtu, písmena z prostředka, např. i, j, k, £ budou nejčastěji označovat indexy výrazů.
Abychom se trochu pocvičili ve formálním postupu, ověříme ' jednoduché vlastnosti vektorů, které pro n-tice skalárů byly samozřejmé, nicméně teď je musíme odvodit z axiomů.
2.31. Stanovte hodnost matice
/ 1 -3 0 1 \
1 -2 2-4
1-10 1
\-2 -1 1 -2/
Poté stanovte počet řešení systému lineárních rovnic
Xi
-3xi
+ +
+ x3
- X3
*2
2x2 2x2
4x2 + x3
+
a také všechna řešení systému +
-3*1
Xi
+ x3
- *3
+
*2
2x2 2x2
4x2 + x3
+
2X4 X4 X4
2x4 2x4
X4 X4
2x4
4,
5, 1, 3
0, 0,
o, o
a systému
Xi Xi Xi
-2xi
3x2
2X2 + 2x3
x2
X2 + X3
1,
-4, 1, -2.
Řešení. Protože je det A = —10, tedy nenulový, jsou sloupce matice A lineárně nezávislé, a tudíž se její hodnost rovná jejímu rozměru. První z uvedených třech systémů je zadán rozšířenou maticí
/ 1 1 1 -2 4 \
-3 -2 -1 -1 5
0 2 0 1 1
v 1 -4 1 -2 3 )
Ovšem levá strana je právě AT s determinantem \AJ
\A\ £ 0.
Existuje tedy matice (AT) a soustava má právě 1 řešení
(xi, x2, x3, x4)T = (AT)~l ■ (4, 5, 1, 3)T .
Druhý ze systémů má totožnou levou stranu (určenou maticí AT) s prvním. Protože absolutní členy na pravé straně hneárních systémů neovlivňují počet řešení a protože každý homogenní systém má nulové řešení, dostáváme jako jediné řešení druhého systému uspořádanou čtveřici
(xi, x2, x3, x4) = (0,0, 0,0).
Třetí systém má rozšířenou matici
/ 1 1 1
V -2
což je matice A (pouze poslední sloupec je uveden za svislou čarou). Pokud budeme tuto matici upravovat na schodovitý tvar, musíme obdržet řádek
( 0 0 0 I a ) , kde a £ 0.
3 0 1 \
2 2 -4
1 0 1
1 1 ~2)
91
KAPITOLA 2. ELEMENTÁRNI LINEÁRNI ALGEBRA
2.25. Tvrzení. Nechť V je vektorový prostor nad polem skalám K, dále uvažme a, b, a; e K, vektory u, v, u j e V. Potom
(1) a ■ u — 0, právě když a — 0 nebo u — 0,
(2) (— 1) • u — —u,
(3) a ■ (u — v) — a ■ u — a ■ v,
(4) (a — b) ■ u — a ■ u — b ■ u,
(5) (Eľ=i ai) ■ (££=i "/) = Eľ=i Iľjli ai ■ UJ-
Důkaz. Můžeme rozepsat
(fl+U)-íí = fl-íí + U- íí = fl-íí což podle axiomu (KG4) zaručuje 0 • u — 0. Nyní
u + (-1) • w (=2) (1 + (-1)) • u = 0 • M = 0 a odtud —w — (—1) • m. Dále
(V2, V3)
a • (m + (—1) - v) = a • u + (—a) • ľ — a ■ u — a ■ v, což dokazuje (3). Platí
(V2, V 3)
(a — b) ■ u — a ■ u + (—b) ■ u — a ■ u — b ■ u
a tím je ověřeno (4). Vztah (5) plyne indukcí z (V2) a (VI).
Zbývá (1): a ■ Q — a ■ (u — u) — a ■ u — a ■ u = 0, což spolu s prvním tvrzením tohoto důkazu ukazuje jednu implikaci. K opačné implikaci poprvé potřebujeme axiom pole pro skaláry a axiom (V4) pro vektorové prostory: je-li p-u—Oap^O, pak u = 1 • u = (p~l -p) ■ u = p~l -0 = 0. □
2.26. Lineární (ne)závislost. V odstavci 2.11 jsme pracovali s tzv. lineárními kombinacemi řádků matice. S obecnými vektory budeme zacházet zcela analogicky:
-| Lineární kombinace a nezávislost |_
Výrazy tvaru a\-v\-\- ■ -+ak-vk nazýváme lineárníkombinace vektorů v\,... ,vk e V.
Konečnou posloupnost vektorů vi,..., vk nazveme lineárně nezávislou, jestliže jediná jejich nulová lineární kombinace je ta s nulovými koeficienty, tj. jestliže pro skaláry a\,..., ak e K platí
a\ ■ v\ + • • • + ak ■ vk — 0 ==>■ a\ — aj_ — ■ ■ ■ — ak — 0.
Je zjevné, že v nezávislé posloupnosti vektorů jsou všechny po dvou různé a nenulové.
Množina vektorů M c V ve vektorovém prostoru V nad K se nazývá lineárně nezávislá, jestliže každá konečná &-tice vektorů v\,..., vk e M je lineárně nezávislá.
Množina M vektorů je lineárně závislá, jestliže není lineárně nezávislá.
Přímo z definice vyplývá, že neprázdná podmnožina M vektorů ve vektorovém prostoru nad polem skalárů K je závislá právě, když je jeden z jejích vektorů vy-It^jV jádřitelný jako konečná lineární kombinace pomocí i— ostatních vektorů v M. Skutečně, alespoň jeden koeficient v příslušné nulové lineární kombinaci musí být nenulový a protože jsme nad polem skalárů, můžeme jím podělit a vyjádřit tak u něj stojící vektor pomocí ostatních.
Každá podmnožina lineárně nezávislé množiny M je samozřejmě také lineárně nezávislá (požadujeme stejné podmínky na méně vektorů). Stejně snadno vidíme, že M c V je lineárně nezávislá právě tehdy, když každá konečná podmnožina v M je lineárně nezávislá.
Víme totiž, že sloupec na pravé straně není lineární kombinací sloupců na levé straně (hodnost matice je 4). Tento systém nemá řešení. □
2.32. Nechť je dáno
ľ 5 '\
A = 3 4 0 , x =
V 1 v
Najděte taková reálná čísla bi,b2,b3, aby systém lineárních rovnic A ■ x = b měl:
(a) nekonečně mnoho řešení;
(b) právě jedno řešení;
(c) žádné řešení;
(d) právě 4 řešení.
Řešení.
Pro čtenáře jistě nebude problém najít odpovídající hodnoty v případech a) a c) (stačí volit b\ = b2 + bj, v případě a) a naopak b\ b2 + b3 v případě c)). Povšimneme si dále, že \A\ = 0, soustava tak má buď nekonečně mnoho, nebo žádné řešení. Obecně tvoří množina řešení homogenní soustavy lineárních rovnic vektorový prostor, varianta d) je proto apriori vyloučena. Varianta b) je možná pouze pro regulární matici soustavy (jediným řešením je pak nulový vektor).
□
2.33. Vyřešte systém homogenních lineárních rovnic zadaný maticí
/o 72 73 76 0 \
2 2 V3 -2 -75
0 2 V5 2V3 -V3
\3 3 73 -3 0 /
o
2.34. Určete všechna řešení systému
3x
2.35. Vyřešte
x2 + X4 = 1,
1 — 2x2 - 3x3 + 4x4 = - 2,
1 + x2 - x3 + X4 = 2,
1 x3 1.
3x — 5y + 2u + 4z = 2,
5x + ly — Au - 6z = 3,
Ix - 4y + + 3z =
O
o
2.36. Rozhodněte o řešitelnosti soustavy lineárních rovnic
3xi + 3x2 + x3 = 1,
2xi + 3x2 — x3 = 8,
2xi — 3x2 + x3 = 4,
3xi — 2x2 + x3 = 6
92
KAPITOLA 2. ELEMENTÁRNI LINEÁRNI ALGEBRA
2.27. Generátory a podprostory. Podmnožina M c V se nazývá vektorovým podprostorem jestliže spolu se zúženými operacemi sčítání a násobení skaláry je sama -^rľ- ' vektorovým prostorem. Tzn. požadujeme
Vo, b e K, Vv,w e M, a ■ v + b ■ w e M.
Rozeberme si hned několik příkladů: Prostor m-tic skalárů Rm se sčítáním a násobením po složkách je vektorový prostor nad R, ale také vektorový prostor nad Q. Např. pro m — 2, jsou vektory (1, 0), (0, 1) e M2 lineárně nezávislé, protože z
a ■ (1,0) +b- (0, 1) = (0, 0)
plyne a = b = 0. Dále, vektory (1,0), (Vl, 0) e M2 jsou lineárně závislé nad R, protože \pl ■ (1,0) — Í-J2, 0), ovšem nad Q jsou lineárně nezávislé! Nad R tedy tyto dva vektory „generují" jednorozměrný podprostor, zatímco nad Q je „větší".
Polynomy stupně nejvýše m tvoří vektorový prostor Rm[x]. Polynomy můžeme chápat jako zobrazení / : R -> R a sčítání a násobení skaláry definujeme takto: (/ + g)(x) — f(x) + g(x), (a ■ f)(x) — a ■ fix). Polynomy všech stupňů také tvoří vektorový prostor Mqo [x] a Rm [x] c R„ [x] je vektorový podprostor pro všechna m < n < oo. Podprostory jsou také např. všechny sudé polynomy nebo Uché polynomy, tj. polynomy splňující fi—x) — ±/(x).
Úplně analogicky jako u polynomů můžeme definovat strukturu vektorového prostoru na množině všech zobrazení R -> R nebo všech zobrazení M -> V Ubovolné pevně zvolené množiny M do vektorového prostoru V.
Protože podmínka v definici podprostoru obsahuje pouze univerzální kvantifikátory, je jistě průnik podprostoru opět podprostor. Snadno to ověříme i přímo: Nechť W/, e I /, jsou vektorové podprostory ve V, a, b e K, u, v e ' ri/e/Wí. Pak pro všechny / e I, a ■ u + b ■ v e Wí, to ale znamená, že a ■ u + b ■ v e ri/e/Wi.
Zejména je tedy podprostorem průnik (M) všech podprostoru W C V, které obsahují předem danou množinu vektorů M c V.
Říkáme, že množina M generuje podprostor (M), nebo že prvky M jsou generátory podprostoru (M).
Zformulujme opět někoUk jednoduchých tvrzení o generování podprostoru:
Tvrzení. Pro každou neprázdnou podmnožinu M C V platí
(1) (M) — {a\ ■ u\ H-----h a* • «*; k e N, at e K, u j e M, j —
1, ...,&};
(2) M = (M), právě když M je vektorový podprostor;
(3) jestliže N C M, pak (N) C (M) je vektorový podprostor.
Podprostor (0) generovaný prázdnou podmnožinou je triviálni podprostor {0} C V.
Důkaz. (1) Množina všech lineárních kombinací
a\u\
akut
na pravé straně (1) je jistě vektorový podprostor a samozřejmě obsahuje M. Naopak, každá z jednotUvých lineárních kombinací nutně musí být v (M) a první tvrzení je dokázáno.
Tvrzení (2) vyplývá okamžitě z (1) a z definice vektorového podprostoru a obdobně je z prvního tvrzení zřejmé i tvrzení třetí.
třech proměnných x\, x2, x3.
2.37. Stanovte počet řešení 2 soustav 5 Uneárních rovnic
O
kde
x = (1,2, 3,4, 5)3
X — (Xi, X2, X3)
AT - x
(1, 1, 1, 1, 1)
'3 1 7 5 0^ 0 0 0 0 1 ,2 1 4 3 0;
O
2.38. Určete řešení soustavy Uneárních rovnic
ax\ + 4x2 +2 X3 2xi -\- 3x2 — X3
0, 0,
v závislosti na parametru a e
O
2.39. V závislosti na hodnotě parametru a e R rozhodněte o počtu řešení soustavy
/4 1 4 a \ AA / 2 \
2 3 6 8
3 2 5 4 \6 -1 2 -8/
*2
X3
W
5
3
v-v
o
2.40. Rozhodněte, zda existuje homogenní soustava lineárních rovnic tří proměnných, jejíž množinou řešení je
(a) {(0, 0, 0)};
(b) {(0,1,0), (0,0,0), (1,1,0)};
(c) {(x, 1,0); x e R};
(d) {(x,y,2y); x, y € R}.
O
2.41. Řešte soustavu lineárních rovnic v závislosti na reálných parametrech a,b.
x +2y +bz x - y + 2z 3x — y
a 1 1.
O
2.42. Nalezněte matici algebraicky adjungovanou a matici inverzní k matici
(\ 0 2 0\ 0 3 0 4 5 0 6 0 \0 7 0 8/
93
KAPITOLA 2. ELEMENTÁRNI LINEÁRNI ALGEBRA
Konečně, nejmenší vektorový podprostor je {0}, protože prázdnou množinu obsahují všechny podprostory a každý z nich obsahuje vektor 0. □
2.28. Součty podprostorů. Když už máme představu o generátorech a jimi vytvářených podprostorech, měli bychom rozumět i možnostem, jak několik podprostorů může sfcľ^ vytvářet celý vektorový prostor V.
j Součty podprostorů |____————
Nechť Vi, i e I, jsou podprostory ve V. Pak podprostor generovaný jejich sjednocením, tj. (U/ e/ Ví), nazýváme součtem podprostorů Ví. Značíme 2~2ieI Ví. Zejména pro konečný počet podprostorů V\,..., Vk C V píšeme
Vl+--- + Vrjt = (ViUV2U---UVJt).
Řešení. Adjungovaná matice je
Mu
A2i A3i
Vidíme, že každý prvek v uvažovaném součtu podprostorů můžeme vyjádřit jako lineární kombinaci vektorů z podprostorů Ví . Protože však je sčítání vektorů komutativní, lze k sobě poskládat členy patřící do stejného podprostorů a pro konečný součet k podprostorů tak dostáváme
Vi + V2
vk
{"i
+ vk; ví e Ví, i — 1,..., k}.
Součet W — V\ + ■ ■ ■ + Vk C V se nazývá přímý součet podprostorů, jsou-li průniky všech dvojic triviální, tj. Ví n V) — {0} pro všechny i ^ j. Ukážeme, že v takovém případě lze každý vektor w e W napsat právě jedním způsobem jako součet
ví
Vk,
kde v i e Ví . Skutečně, pokud by tento vektor šlo zároveň vyjádřit, jako w
0:
v'k, potom
(vi — v[) H-----h (vk - v'k).
Pokud bude ví — v. první nenulový člen na pravé straně, pak tento vektor z Ví umíme vyjádřit pomocí vektorů z ostatních podprostorů. To je ale ve sporu s předpokladem, že Ví má se všemi ostatními nulový průnik. Jedinou možností tedy je, že všechny vektory na pravé straně jsou nulové a tedy je rozklad w jednoznačný. Pro přímé součty podprostorů píšeme
W=Vi
vk =
=iVi-
2.29. Báze. Nyní máme vše připravené pro pochopení minimálních množin generátorů tak, jak jsme se s nimi vypořádali v rovině
TO 2
báze vektorových prostorů
Podmnožina M c V se nazývá báze vektorového prostoru V, jestliže (M) = V a M je lineárně nezávislá.
Vektorový prostor, který má konečnou bázi nazýváme konečněrozměrný, počet prvků báze nazýváme dimenzí V. Nemali V konečnou bázi, říkáme, že V je nekonečněrozměrný. Píšeme dim V — k,k eN, případně k — oo. ^^^^^J
Abychom s takovou definicí dimenze mohli být spokojeni, potřebujeme vědět, že různé báze téhož prostoru budou mít vždy stejný počet prvků. To skutečně brzy dokážeme. Všimněme si hned, že triviální podprostor je generován prázdnou množinou, která je „prázdnou" bazí. Má tedy triviální podprostor dimenzi nulovou.
Al2 A22
A32
A42
Al3
A23
A33 A43
A24 A34 A44
kde Aíj je algebraický doplněk prvku matice A, tedy součin čísla (—a determinantu trojrozměrné matice vzniklé z A vynecháním /-tého řádku a 7-tého sloupce. Platí
3 0 4 0 0 4
Au = 0 6 0 = -24, A12 = - 5 6 0 = 0, ..
7 0 8 0 0 8
1 0 0 1 0 2
A43 = 0 3 4 = 0, A44 = 0 3 0 = -12
5 0 0 5 0 6
Dosazením získáme
/-24 0
0 -32 0 16
V 0
Inverzní matici A"
20 0 -4 0
0 \
28 0
-12/
/-24 0
20
V o
určíme ze vztahu A"
0
-32 0 28
: |A|-
8 0 \
0 16 -4 0
0 -12/
1 • A*. Determi-
nant matice A je (rozvojem podle prvního řádku) roven
1 0 2 0
0 3 0 4
5 0 6 0
0 7 0 8
3 0 4 0 3 4
0 6 0 + 2 5 0 0
7 0 8 0 7 8
16.
Dostáváme tedy
/ -3/2 0 1/2 0 \
0 -2 0 1
5/4 0 -1/4 0
v 0 7/4 0 -3/4/
□
2.43. Najděte algebraicky adjungovanou matici F*, je-li
a, fi,y,8 e R.
O
2.44. Vypočítejte algebraicky adjungované matice k maticím
/3 -2 0 -l\
0 2 2 1
1 -2 -3 -2 \0 1 2 1 /
přičemž i označuje imaginární jednotku.
(a)
(b)
1 + i 2i 3-2/ 6
O
94
KAPITOLA 2. ELEMENTÁRNI LINEÁRNÍ ALGEBRA
Bázi &-rozměrného prostom budeme obvykle zapisovat jako &-tici v — (vi...,vk) bázových vektorů. Jde tu především o zavedení konvence: U konečněrozměrných podprostorů budeme totiž vždy uvažovat bázi včetně zadaného pořadí prvků i když jsme to takto, striktně vzato, nedefinovali.
Zjevně, je-li (vi,..., v„) bazí V, je celý prostor V přímým součtem jednorozměrných podprostorů
V
(ví)
Okamžitým důsledkem výše odvozené jednoznačnosti rozkladu jakéhokoliv vektoru ve V do komponent v přímém součtu dává jednoznačné vyjádření
W — X\V\ + • • • + x„ v„
a dovoluje nám tedy po volbě báze opět vidět vektory jako n-tice skalárů. K tomuto pohledu se vrátíme v zápětí v odstavci 2.33, jak jen dokončíme diskusi existence bazí a součtů podprostorů v obecné poloze.
2.30. Věta. Z libovolné konečné množiny generátorů vektorového prostoru V lze vybrat bázi. Každá báze koenčněrozměrného prostoru V má přitom stejný počet prvků.
Důkaz. První tvrzení ukážeme snadno indukcí přes počet ge-,, nerátorů k.
Jedině nulový podprostor nepotřebuje žádný generátor | a tedy umíme vybrat prázdnou bázi. Naopak, nulový vektor vybrat nesmíme (generátory by byly lineárně závislé) a nic jiného už v podprostorů není.
Abychom měli indukční krok přirozenější, probereme ještě přímo případ k — 1. Máme V — ({v}) a v / 0, protože {v} je lineárně nezávislá množina vektorů. Pak je ovšem {v} zároveň báze vektorového prostoru V.
Předpokládejme, že tvrzení platí pro k — n, a uvažme V — (vi,..., vn+\). Jsou-li v\,..., vn+i lineárně nezávislé, pak tvoří bázi. V opačném případě existuje index / takový, že
■ ai-iVi-i + ai+ivi+i
í-----h an+ivn+i.
-1) a již umíme vybrat
ví — aivi + ■
Pak ovšem V — (vi,..., u;-i, ví+i, bázi (podle indukčního předpokladu).
Zbývá ověřit, že báze mají vždy stejný počet prvků. Uvažujme bázi (vi,..., v„) prostoru V a libovolný nenulový vektor
u — a\v\ + ■ ■ ■ + anvn e V
s gí / O pro jisté i. Pak
1 ( — Im
Cli
(a\vi H-----h üi-iVi-i + ai+ivi+i H-----h a„v„j)
aprototaké {u, v\,..., vi-\, vi+\,... ,vn) — V.
Ověříme, že je to opět báze: Kdyby přidáním u k lineárně nezávislým vektorům vi,..., ví-i, ví+i, ..., vn vznikly lineárně závislé vektory, pak by u bylo jejich lineární kombinací. To by znamenalo
V — ..., ví-i, vi+i, vn),
což není možné.
Takže jsme dokázali, že pro libovolný nenulový vektor u e V existuje i, 1 < i < n, takové, že (w, ui, ..., vi-\, vi+\, ..., v„) je opět báze V.
Dále budeme místo jednoho vektoru u uvažovat lineárně nezávislou množinu u\,...,uk a budeme postupně přidávat
F. Vektorové prostory
Vlastnosti vektorového prostoru, kterých jsme si všimli u roviny či třírozměrného prostoru, ve kterém žijeme, má celá řada jiných množin. Ukažme si to na příkladech.
2.45. Vektorový prostor ano či ne? Rozhodněte o následujících množinách, jestli jsou vektorovými prostory nad tělesem reálných čísel:
i) Množina řešení soustavy
x\ + x2 H-----h x98 + x99 + xioo =100xi,
xi + x2 H-----h x98 + x99 =99xi,
x\ + x2-\-----h x98 =98*1,
Xi -\- x2 =2xi.
ii) Množina řešení rovnice
X\ + X2 + ■ ■ ■ + X\oo = 0
iii) Množina řešení rovnice
x\ + 2x2 + 3x3 + • • • + lOOxioo = 1.
iv) Množina všech reálných, resp. komplexních, posloupností. (Reálnou, resp. komplexní posloupností rozumíme zobrazení / : N -> R, resp. / : N C. O obrazu čísla n pak hovoříme jako o n-tém členu posloupnosti, většinou jej označujeme dolním indexem, např. a„.)
v) Množina řešení homogenní diferenční rovnice.
vi) Množina řešení nehomogenní diferenční rovnice.
vii) {/ : R -+ R\f(\) = f (2) = c, c e R}
Řešení.
i) Ano. Jsou to všechny reálné násobky vektoru (1,1,1...,1),
1-,-'
100 jedniček
tedy vektorový prostor dimenze 1 (viz dále (2.29)).
ii) Ano. Jedná se o prostor dimenze 99 (odpovídá počtu volných parametrů řešení). Obecně je tvoří množina řešení libovolné homogenní soustavy lineárních rovnic vektorový prostor.
iii) Ne. Např. dvojnásobek řešení x\ = 1, x; = 0, i = 2, ... 100 není řešením dané rovnice. Množina řešení však tvoří tzv. afinní prostor (viz (|| ?? ||)).
iv) Ano. Množina všech reálných, resp. komplexních, posloupností tvoří zřejmě reálný, resp. komplexní, vektorový prostor.
95
KAPITOLA 2. ELEMENTÁRNI LINEÁRNÍ ALGEBRA
u\, u2, • • •, vždy výměnou za vhodné v i podle předchozího postupu. Musíme přitom ověřit, že takové ví vždy bude existovat (tj. že se nebudou vektory u vyměňovat vzájemně). Předpokládejme tedy, že již máme umístěné u\,... ,u£. Pak se ui+\ jistě vyjádří jako lineární kombinace těchto vektorů a zbylých vj. Pokud by pouze koeficienty u u\,...,m byly nenulové, znamenalo by to, že již samy vektory u\,..., ui+\ byly lineárně závislé, což je ve sporu s našimi předpoklady.
Pro každé k < n tak po k krocích získáme bázi ve které z původní báze došlo k výměně k vektorů za nové. Pokud by k > n, pak již v n-tém kroku obdržíme bázi vybranou z nových vektorů uí , což znamená, že tyto nemohou být lineárně nezávislé. Zejména tedy není možné, aby dvě báze měly různý počet prvků. □
Ve skutečnosti jsme dokázali silnější tvrzení, tzv. Steinitzovu větu o výměně, která říká, že pro každou konečnou bázi v a každý systém lineárně nezávislých vektorů ve V umíme najít podmnožinu bázových vektorů ví, po jejichž záměně za zadané nové vektory opět dostaneme bázi.
2.31. Důsledky Steinitzovy věty o výměně. Díky možnosti volně volit a vyměňovat bázové vektory můžeme ^_ okamžitě dovodit pěkné (a intuitivně snad také očekávané) vlastnosti bazí vektorových prostorů:
Tvrzení. (1) Každé dvě báze konečněrozměrného vektorového prostoru mají stejný počet vektorů, tzn. že naše definice dimenze nezávisí na volbě báze.
(2) Má-li V konečnou bázi, lze každou lineárně nezávislou množinu doplnit do báze.
(3) Báze konečněrozměrných vektorových prostorů jsou právě maximální lineárně nezávislé množiny.
(4) Báze prostoru s konečnou dimenzí jsou právě minimální množiny generátorů.
Malinko složitější, ale nyní snadno zvládnutelná, je situace kolem dimenzí podprostorů a jejich součtů:
Důsledek. Nechť W, W\, W2 C V jsou podprostory v prostoru V konečné dimenze. Pak platí
(1) dimW < dim V,
(2) V — W, právě když dim V — dim W,
(3) dim Wi + dim W2 = dim(Wi + W2) + dim(Wi n W2).
Důkaz. Zbývá dokázat pouze poslední tvrzení. To je zřejmé, pokud je dimenze jednoho z prostorů nulová. Předpokládejme tedy dimWi — r > 1, dimW2 — s > 1 a nechť (w\..., wt) je báze W\ n W2 (nebo prázdná množina, pokud je průnik triviální). Podle Steinitzovy věty o výměně lze tuto bázi průniku doplnit na bázi (wi,..., wt, ut+\ ... ,ur) pro W\ a na bázi (»!•••, wt, vt+i,..., vs) pro W2. Vektory
Wl,...,Wt, ut+i.
.,ur, vt+i . . .
jistě generují W\ + W2. Ukážeme, že jsou přitom lineárně nezávislé. Nechť tedy
Sčítání posloupností a násobení posloupnosti skalárem je totiž definováno člen po členu, kde se jedná o vektorový prostor reálných, resp. komplexních, čísel.
v) Ano. Abychom ukázali, že množina posloupností vyhovujících dané diferenční homogenní rovnici tvoří vektorový prostor, stačí ukázat, že je uzavřená vzhledem ke sčítání i násobení reálným číslem (neboť se jedná o podmnožinu vektorového prostoru) mějme posloupnosti (xj)^0 a Cy/)^o vyhovující stejné homogenní diferenční rovnici, tedy
anxn+k + an-\xn+k-\ + ' ' ' + a0xk = 0 anyn+k + ttn-iyn+k-l + ■ ■ ■ + ttoyk = 0.
Sečtením těchto rovnic dostaneme
an(xn+k + yn+k) + an-l(xn+k-l + yn+k-l) + • • • + a<)(xk + ä) = 0,
tedy i posloupnost (xj + yj)^* vyhovuje stejné diferenční rovnici. Rovněž tak pokud posloupnost (xj)^0 vyhovuje dané rovnici, tak i posloupnost (uxj)^0, kde ueK.
vi) Ne. Součet dvou řešení nehomogenní rovnice
anxn+k + an-\xn+k-\ + ' ' ' + a0xk — c
anyn+k + an-\yn+k-\ H-----\-a0yk = c, c e
{0}
a\w\ H-----h atwt + bt+\ut+\ + ...
----Ybrur +ct+ivt+i
■csvs = 0.
vyhovuje rovnici
Gn(Xn+k + yn+k) + ^n-l(xn+k-l + yn+k-\) + • • • + a<)(xk + ä) = 2c,
zejména pak nevyhovuje původní nehomogenní rovnici. Množina řešení však tvoří afinní prostor, viz 4.1. vii) Je to vektorový prostor právě, když c = 0. Vezme-li dvě funkce / a g z dané množiny, pak (f+g)(l) = (f+g)(2) = f(l) + g(\) = 2c. Má-li funkce f + g být prvkem dané množiny, musí být (/ + g)(l) = c, tedy 2c = c, tedy c = 0.
□
2.46. Zjistěte, zda je množina
í/i ={(Xl,x2,x3) ĚK3; |jci| = \x2\ = \x3\] podprostorem vektorového prostoru R3 a množina
U2 = {ax2 + c; a,c eR] podprostorem prostoru polynomů stupně nejvýše 2.
96
KAPITOLA 2. ELEMENTÁRNI LINEÁRNÍ ALGEBRA
Pak nutně
- (q+i • vt+i H-----h cs ■ vs) —
— a\ ■ w\ + ■ ■ ■ + at ■ wt + bt+\ ■ ut+\ H----+ br ■ ur
musí patřit do W2 n W\. To ale má za následek, že
bt+i — ■■■ — br —0,
protože tak jsem doplňovali naše báze. Pak ovšem i
a\ ■ w\ H-----h at ■ wt + ct+\ ■ vt+\ H-----h cs ■ vs — 0
a, protože příslušné vektory tvoří bázi W2, jsou všechny koeficienty nulové.
Tvrzení (3) nyní vyplývá z přímého přepočítání generátorů.
□
2.32. Příklady. (1) K" má (jako vektorový prostor nad I n. Bazí je např. n-tice vektorů
I dimenzi
((1,0,
0), (0, 1,
,0).
(0,...,0,1)).
Tuto bázi nazýváme standardní báze v Kn. Všimněme si, že případě konečného pole skalárů, např. Z*, má celý vektorový prostor K" jen konečný počet k" prvků.
(2) C jako vektorový prostor nad R má dimenzi 2, bázi tvoří např. čísla 1 a /.
(3) Km [x], tj. prostor polynomů stupně nejvýše m, má dimenzi m + 1, bazí je např. posloupnost 1, x, x2,..., x™.
Vektorový prostor všech polynomů K[x] má dimenzi 00, umíme však ještě stále najít bázi (i když s nekonečně mnoha prvky): 1, x, x2, ....
(4) Vektorový prostor R nad Q má dimenzi 00 a nemá spočetnou bázi.
(5) Vektorový prostor všech zobrazení / : R -> R má také dimenzi 00 a nemá spočetnou bázi.
2.33. Souřadnice vektorů. Jestliže pevně zvolíme bázi "4&®K (V1, • • •' konečněrozměrného prostoru V, pak fu^p můžeme každý vektor w e V vyjádřit jako lineární
, V, (1, y) © (1, z) = (1, z + y) pravšechna O : R x V -> V, z O (1, y) = (1, y ■ z) pro všechna
vektorovým prostorem?
O
G. Lineární závislost a nezávislost, báze
2.48. Výpočtem determinantu vhodné matice rozhodněte o lineárni nezávislosti vektorů (1, 2, 3, 1), (1, 0, —1, 1), (2, 1, —1, 3) a (0, 0, 3, 2).
Řešení. Protože
12 3 1 10-11 2 1-13
0 0 3 2
uvedené vektory jsou lineárně nezávislé.
10 ^0,
□
w — a\v\
■anvn = bivi
b„v„.
Potom ale
0 = (fli - bi) ■ vi H-----h (an - bn) ■ vn
a proto a; — bi pro všechna / — 1,... ,n. Dospěli jsme proto k závěru:
V konečněrozměrném vektorovém prostoru lze každý vektor zadat právě jediným způsobem jako lineární kombinaci bázových vektorů. Koeficienty této jediné lineární kombinace vyjadřující daný vektor w e V ve zvolené bázi v — (vi,..., vn) se nazývají souřadnice vektoru w v této bázi.
Kdykoliv budeme mluvit o souřadnicích (ai,..., a„) vektoru w, které vyjadřujeme jako posloupnost, musíme mít pevně zvolenu i posloupnost bázových vektorů v — (y\,v„). Jakkoliv jsme tedy báze zavedli jako minimální množiny generátorů, ve skutečnosti s nimi budeme pracovat jako s posloupnostmi (tedy s uspořádanými množinami, kde je pevně zadáno pořadí bázových prvků).
2.49. Nechťjsou dány libovolné Lineárně nezávislé vektory u, v, w, z ve vektorovém prostoru V. Rozhodněte, zda jsou ve V lineárně závislé, či nezávislé, vektory
u — 2v, 3u + w — z, u — 4v + w + 2z, 4v + 8u> + 4Z.
Řešení. Uvažované vektory jsou lineárně nezávislé právě tehdy, když jsou lineárně nezávislé vektory (1,-2,0,0), (3,0,1,-1), (1, -4, 1, 2), (0, 4, 8, 4) v R4. Je však
1-200
3 0 1-1 1-412
0 4 8 4
-36 jL 0,
tudíž jsou uvažované vektory lineárně nezávislé.
□
97
KAPITOLA 2. ELEMENTÁRNI LINEÁRNÍ ALGEBRA
přiřazení souřadnic vektorům
Přiřazení, které vektoru u — a\v\ + ■ ■ ■ + anvn přiřadí jeho souřadnice v bázi v, budeme značit stejným symbolem v : V -> K". Má tyto vlastnosti:
(1) v(u + w) — v(u) + v(w); Vw, w e V,
(2) v(a ■ u) — a ■ v(u); Va eK,V«6 V.
i
Všimněme si, že operace na levých a pravých stranách těchto rovnic nejsou totožné, naopak, jde o operace na různých vektorových prostorech! Při této příležitosti se také můžeme zamyslet nad obecným případem báze M (možná nekonečněrozměrného) prostoru V. Báze pak nemusí být spočetná, pořád ale ještě můžeme definovat zobrazení M : V -> KM (tj. souřadnice vektoru jsou zobrazení z M do K).
Uvedené vlastnosti přiřazení souřadnic jsme viděli už dříve u zobrazení, kterým jsme v geometrii roviny říkali lineární (zachovávaly naši lineární strukturu v rovině). Než se budeme věnovat podrobněji závislosti souřadnic na volbě báze, podíváme se obecněji na pojem linearity zobrazení.
2.34. Lineární zobrazení. Pro jakékoliv vektorové prostory (konečné i nekonečné dimenze), definujeme „linearitu" zobrazení mezi prostory obdobně, jako fet::^ jsme to viděli již v rovině R2:
j[ Definice lineárních zobrazení ———
Nechť V a W jsou vektorové prostory nad týmž polem skalárů K. Zobrazení / : V -> W se nazývá lineární zobrazení (homo-morfismus) jestliže platí:
(1) f(u + v) = f(u) + f(v), Vu,veV
(2) f(a-u) = a- f(u), Va e K, Vm e V.
i
Samozřejmě, že jsme taková zobrazení již viděli ve formě násobení matic:
/ : K" ->• Km ,ih>A-i
s maticí typu m/n nad K.
Obrazím f :— f (V) c W je vždy vektorový podprostor, protože lineární kombinace obrazů /(«/) je obrazem lineární kombinace vektorů «/ se stejnými koeficienty.
Stejně tak je vektorovým podprostorem množina všech vektorů Ker/ :— /_1({0}) C V, protože lineární kombinace nulových obrazů bude vždy zase nulovým vektorem. Podprostor Ker / se nazývá jádro lineárního zobrazení f.
Lineární zobrazení, které je bijekcí nazýváme izomorfismus.
Podobně jako u abstraktní definice vektorových prostorů, opět je třeba ověřit zdánlivě samozřejmá tvrzení vyplývající z axiomů:
Tvrzení. Nechť f : V -> W je lineární zobrazení mezi libovolnými vektorovými prostory nad týmž polem skalárů K. Pro všechny vektory u, u\,..., uk € V, a skaláry a\,..., ak € K platí:
(1) /(O) = 0,
(2) f(-u) = -f(u),
(3) f(ai ■ u\ H-----h ak ■ uk) — a\ ■ f (u\) -\-----V ak ■ f(uk),
(4) pro každý vektorový podprostor V\ C V je jeho obraz /(Vi) vektorový podprostor ve W,
(5) pro každý podprostor W\ C W je množina f~1(Wi) — {v e V; f (v) e Wi} vektorový podprostor ve V.
2.50. Určete všechny konstanty a e M takové, aby polynomy ax2 + x +2, —2x2 + ax + 3 a x2 + 2x + a byly lineárně závislé (ve vektorovém prostoru Pj,[x\, polynomů jedné proměnné stupně nejvýše 3 nad reálnými čísly).
Řešení. V bázi 1, x, x2 jsou souřadnice zadaných vektorů (polynomů) následující: (a, 1, 2), (—2, a, 3), (1, 2, a). Polynomy budou lineárně závislé, právě když bude mít matice, jejíž řádky jsou tvořeny souřadnicemi zadaných vektorů menší hodnost, než je počet vektorů, v tomto případě tedy hodnost dvě a menší. V případě čtvercové matice nižší hodnost než je počet řádkuje ekvivalentní nulovosti determinantu dané matice. Podmíka na a tedy zní
a
1
-2 a 1 2
0,
tj. a bude kořenem polynomu a3 — 6a — 5 = (a + l)(a2 — a — 5), tj.
úloha má tři řešení a\
1, ^2,3
l±V2l
□
2.51. Vektory (1, 2, 1), (—1, 1, 0), (0, 1, 1) jsou lineárně nezávislé, a proto společně tvoří bázi R3. (v bázi je nutné zadat i jejich pořadí). Každý trojrozměrný vektor je tak nějakou jejich lineární kombinací. Jakou jejich lineární kombinací je vektor (1,1, 1), nebo-li jaké jsou souřadnice vektoru (1, 1, 1) v bázi dané zmíněnými vektory?
Řešení. Hledáme a, b, c e R taková, aby a{\, 2, 1) + b(—\, 1, 0) + c(0, 1,1) = (1,1,1). Rovnost musí platit v každé souřadnici, dostáváme tak soustavu tří lineárních rovnic o třech neznámých:
a — b =1 2a + b+c = 1 a + c = 1,
jejíž vyřešením získáme a = \, b = — \, c = \, je tedy
(1, 1, 1) = \ ■ (1, 2, 1) - \ ■ (-1, 1, 0) + l- ■ (0, 1, 1),
neboli souřadnice vektoru (1, 1, 1) vbázi ((1, 2, 1), (—1, 1,0), (0, 1, 1))
□
jsou (i, -i, i).
2.52. Vyjádřete vektor (5, 1, 11) jako lineární kombinaci vektorů (3, 2, 2), (2, 3, 1), (1,1, 3), tj. nalezněte čísla p,q,r e R, pro která je
(5, 1, 11) = p (3, 2, 2) + q (2, 3, 1) + r (1, 1, 3).
O
98
KAPITOLA 2. ELEMENTÁRNI LINEÁRNI ALGEBRA
Důkaz. Počítáme s využitím axiomů a definic a již dokázaných výsledků (dohledejte si případně samostatně!):
/(O) = f (u -u) = f ((l - 1) • u) = 0 • f (u) = 0, f(-u) = /((-l) • u) = (-1) • f (u) = -f (u).
Vlastnost (3) se ověří snadno z definičního vztahu pro dva sčítance indukcí přes počet sčítanců. Z platnosti (3) nyní plyne, že (f(Vi)) — f(V\), je to tedy vektorový podprostor.
Je-li naopak f(u) e W\af(v) e W\, pak pro libovolné skaláry bude i f (a ■ u + b ■ v) — a ■ f(u) + b ■ f (v) e W\. □
2.35. Jednoduché důsledky.
(1) Složení go/ : V -> Z dvou lineárních zobrazení / : V -> W a g : W -> Z je opět lineární zobrazení.
(2) Lineární zobrazení / : V -> W je izomorfismus, právě když Im / — W a Ker / = {0} c V. Inverzní zobrazení k izomor-fismu je opět izomorfismus.
(3) Pro libovolné podprostory Vi, V2 C V a lineární zobrazení / : V -* W platí
f(Vi + V2) = f(Vi) + f(V2),
f(Vi n v2) c /(vo n f(v2).
(4) Zobrazení „přiřazení souřadnic" u : V -> K" dané libovolně zvolenou bází w = («!,...,«„) vektorového prostoru V je izomorfismus.
(5) Dva konečněrozměrné vektorové prostory jsou izomorfní právě když mají stejnou dimenzi.
(6) Složení dvou izomorfismů je izomorfismus.
Důkaz. Ověření prvního tvrzení je velmi snadné cvičení.
Pro důkaz druhého si uvědomme, že je-li / lineární bijekce, pak je vektor w vzorem linerání kombinace au + bv, tj. w — f~1(au + bv), právě když
f(w) = au + bv = f (a -f-\u) + b- f~\v)).
Je tedy také w — af~l (u) + bf~l(v) a tedy je inverze k lineární bijekci opět lineární zobrazení.
Dále, / je surjektivní, právě když Im / — W a pokud Ker / — {0}, pak f(u) — f (v) zaručuje f(u — v) — 0, tj. u — v. Je tedy v tom případě / injektivní.
Další tvrzení se dokáže snadno přímo z definic. Najděte si protipříklad, že v dokazované inkluzi opravdu nemusí nastat rovnost! Zbývající body jsou již zřejmé. □
2.36. Opět souřadnice. Uvažujme libovolné vektorové prostory J„ V a W nad K s dim V — n, dim W — m a mějme lineární zobrazení / : V —>• W. Pro každou volbu bází u —
É («i,..., u„) na V, v — (v\,..., vn)naW, mámekdispo-V-1 zici příslušná přiřazení souřadnic a celou situaci několika právě zmíněných zobrazení zachycuje následující diagram:
2.53. Uvažme komplexní čísla C jako reálný vektorový prostor. Určete souřadnice čísla 2 + i v bázi dané kořeny polynomu x2 + x + 1.
Řešení. Protože kořeny daného polynomu jsou — ^ + / ^ a — \ — máme určit souřadnice (a, b) vektoru 2 + i v bázi (—\ + i^j-, — \ — í^y). Tato reálná čísla a, b jsou jednoznačně určena požadavkem
1 73 1 73
a ■ (---h i—) +b ■ (---i—) =2 +i.
2 2 2 2
Rozepsáním rovnosti zvlášť pro reálnou a imaginární složku dostáváme soustavu dvou lineárních rovnic o dvou neznámých:
1 1
--a--b = 2
2 2
V3 73,
-a--b = 1.
2 2
Jejím vyřešením získáme a = —2+*j-,b = —2—^, hledané souřadnice tedy jsou (—2 + —2--^). □
V3^
Spodní šipka je definována zbylými třemi, tj. jako zobrazení jde o složení
fu,v — V o f ou~l.
2.54. Poznámka. Jak pozorný čtenář jistě postřehl, úloha není zadána jednoznačně, nemáme totiž zadáno pořadí kořenů polynomu, tudíž ani pořadí bázových vektorů. Výsledek je tedy dán až na záměnu souřadnic.
Dále se na tomto místě vyjádřeme k tzv. „usměrňování" zlomků, tedy odstraňování odmocnin z jejich jmenovatele. Autoři nemají vyhraněný názor, zda by se usměrňovat mělo, či ne (Je hezčí ^ nebo ^5?)- V některých případech však je usměrňování nežádoucí: ze zlomku -7= okamžitě odečteme, že jeho hodnota je o něco málo větší než 1 (neboť V35 je jen o málo menší než 6), kdežto z usměrněného zlomku nevidíme na první pohled nic.
2.55. Uvažme komplexní čísla C jako reálný vektorový prostor. Určete souřadnice čísla 2 + i v bázi dané kořeny polynomu x2 — x + 1.
2.56'. Pro jaké hodnoty parametrů a, b, c e M jsou vektory (1, \ ,a, 1), (l,b, 1, 1), (c, 1,1,1) lineárně závislé?
2.57. Nechť je dán vektorový prostor V a nějaká jeho báze složená z vektorů u, v, w, z. Zjistěte, zda jsou vektory
u — 3v + z, v — 5w — z, 3w — lz, u — w + z lineárně (ne)závislé.
2.58. Doplňte vektory 1 — x2 + ŕ, 1 + x2 + ŕ, 1 — x — x3 na bázi prostom polynomů stupně nejvýše 3.
99
KAPITOLA 2. ELEMENTÁRNI LINEÁRNI ALGEBRA
Matice lineárního zobrazení
2.59.
Každé lineárni zobrazení je jednoznačně určeno svými hodnotami na libovolné množině generátorů, zejména tedy na vektorech báze u. Označme
/(«l) = «11 ' v\ + «21 • v2 H-----\-amivm
f(u2) — an ■ vi + a22 ■ v2 H-----h am2vm
/(«„) — a\„ ■ vi + a2n ■ v2 H-----h amnvm
tj. skaláry tvoří matici A, kde sloupce jsou souřadnice hodnot f(uj) zobrazení / na bázových vektorech vyjádření v bázi v na cílovém prostoru W.
Matici A — (flij) nazýváme maticí zobmzení^^^b^íci^^^^^
Pro obecný vektor u — x\u\ + ■ ■ ■ + xnun e V spočteme (vzpomeňme, že sčítání vektorů je komutativní a distributivní vůči násobení skaláry)
f(u) — x\f(ui) H-----Yxnf(un)
= xi(anvi-\-----Yam\vm) -\-----Y xn(ainv\-\-----Yamnvm)
= (xiflnH-----Yxna\n)vi H-----h (xiami~\-----Yxnamn)vm.
Pomocí násobení matic lze nyní velice snadno a přehledně zapsat hodnoty zobrazení fu,v(w) definovaného jednoznačně předchozím diagramem. Připomeňme si, že vektory v W chápeme jako sloupce, tj. matice typu r/1
fu,v(u(w)) - v(f(w)) - A ■ u{w).
Naopak, máme-li pevně zvoleny báze na V i W, pak každá volba matice A typu m /n zadává jednoznačně lineární zobrazení K" -> Km a tedy i zobrazení / : V -> W. Máme-li tedy zvoleny báze prostorů V aW, odpovídá každé volbě matice typu m/n právě jedno lineární zobrazení V —>• Waukázalijsmebijekcimezi maticemi příslušného rozměru a lineárními zobrazeními V —>• W.
2.37. Matice přechodu mezi souřadnicemi. Jestliže zaViW zvolíme tentýž prostor, ale s různými bázemi, a za / identické zobrazení, vyjadřuje postup z předchozího odstavce vektory báze u v souřadnicích vzhledem k v. Označme výslednou matici T. Když pak zadáme vektor u
u — x\u 1 + • • • + x„ u„
v souřadnicích vzhledem k u a dosadíme za m; jejich vyjádření pomocí vektorů z v, obdržíme souřadné vyjádření x — (x\,..., x„) téhož vektoru v bázi v. Stačí k tomu přeskládat pořadí sčítanců a vyjádřit skaláry u jednotlivých vektorů báze.
Ve skutečnosti teď děláme totéž, co v předchozím odstavci pro speciální případ identického zobrazení idy na vektorovém prostoru V. Matice tohoto identického zobrazení je T a tedy nutně musí naznačený přímý výpočet dát x — T ■ x. Situace se zobrazena na diagramu:
Tvoří matice
'\ 0 1 -1,
1 4 \ (-5 0\ (1 -2N
o V3 oj' [o 3
bázi vektorového prostoru čtvercových dvourozměrných matic?
Řešení. Uvedené čtyři matice j sou j ako vektory v prostoru 2x2 matic lineárně nezávislé. Vyplývá to z toho, že matice
/ 1 1 —5 1 \
0 4 0 -2
10 3 0
\-2 -10 3 /
je tzv. regulární, což je mimochodem ekvivalentní livovolnému z ná-sledujích tvrzení: její hodnost je rovna rozměru; ze z ní pomocí řádkových elementárních transformací obdržet jednotkovou matici; existuje k ní matice inverzní; má nenulový determinant, roven 116; jí zadaná homogenní soustava lineárních rovnic má pouze nulové řešení; každý nehomogenní lineární systém s levou stranou určenou touto maticí má právě jedno řešení; obor hodnot lineárního zobrazení, jež zadává, je vektorový prostor dimenze 4; toto zobrazení je injektivní). □
2.60. V R3 jsou dány podprostory U a V generované po řadě vektory
(1,1,-3), (1, 2, 2) a (1, 1, -1), (1, 2, 1), (1, 3, 3). Nalezněte průnik těchto podprostorů.
Řešení. Podprostor V má dimenzi pouze 2 (nejedná se tedy o celý prostor R3), neboť
0
a neboť libovolná dvojice z uvažovaných třech vektorů je očividně lineárně nezávislá. Stejně snadno vidíme, že také podprostor U má dimenzi 2. Současně je
1 1 -1 1 1 1
1 2 1 = 1 2 3
1 3 3 -1 1 3
1 1
1 2
-3 2
2^0,
a proto vektor (1, 1, — 1) nemůže náležet do podprostorů U. Průnikem rovin procházejících počátkem (dvojrozměrných podprostorů) v trojrozměrném prostoru musí být alespoň přímka. V našem případu je jím právě přímka (podprostory nejsou totožné). Určili jsme dimenzi průniku - je jednodimenzionální. Všimneme-li si, že
1 -(1, 1, -3)+ 2- (1,2,2) = (3,5, 1) = 1 • (1, 1, -1) +2 • (1, 2, 1),
dostáváme vyjádření hledaného průniku ve tvaru množiny všech skalárních násobků vektoru (3, 5, 1) (jedná se o přímku procházející počátkem s tímto směrovým vektorem). □
100
KAPITOLA 2. ELEMENTÁRNI LINEÁRNÍ ALGEBRA
Výslednou matici T nazýváme matice prechodu od báze u vektorového prostoru V k bázi v téhož prostom. Přímo z definice vyplývá:
* VÝPOČET MATICE PRECHODU
Tvrzení. Matici T přechodu od báze u_ k bázi v získáme tak, že souřadnice vektoru báze u v bázi v napíšeme do sloupců matice T.
Funkce matice přechodu je taková, že známe-li souřadnice x vektoru v bázi u, pak jeho souřadnice v bázi v se obdrží vynásobením sloupce x maticí přechodu (zleva). Protože inverzní zobrazení k identickému je opět totéž identické zobrazení, je matice přechodu vždy invertibilní a její inverze je právě matice přechodu opačným směrem, tj. od báze j; k bázi u.
2.38. Více souřadnic. Nyní si ukážeme, jak se skládají souřadná vyjádření lineárních zobrazení. Uvažme ještě další vektorový prostor Z nad K dimenze k s bází w, li-v^čv" , jjeáj-jjj zobrazení g:ff^Za označme příslušnou matici gv,w-
V ■
f
w-
ft±,v_
gv,i
Složení g o f na horním řádku odpovídá matici zobrazení K" -> Kk dole a přímo spočteme (píšeme A pro matici f a B pro matici g ve zvolených bazích):
gv,w ° fu,v(x) = wo g o v'1 o vo f o iT1
— B ■ (A ■ x) — (B ■ A) ■ x — (g o f)u,w(x)
pro všechny x e K". Skládání obražení tedy odpovídá násobení příslušných matic. Všimněte si také, že isomorfismy odpovídají právě invertibilním maticím.
Stejný postup nám dává odpovědna otázku, jak se změní matice zobrazení, změníme-li báze na definičním oboru i oboru hodnot:
idy / „. id«
V
v ■
w ■
w
fu,v
kde T je matice přechodu od u' k u a S je matice přechodu od v' k v. Je-U tedy A původní matice zobrazení, bude nová dána jako
A' = S~l AT.
Ve speciálním případě lineárního zobrazení / : V -> V, tj. zobrazení má stejný prostor V jako definiční obor i obor hodnot, vyjadřujeme zpravidla / pomocí jediné báze u prostoru V. Pak tedy přechod k nové bázi w' s maticí předchodu T od w' k u bude znamenat změnu matice zobrazení na A' — T~1AT.
2.39. Lineární formy. Obzvlášť jednoduchým a zároveň důležitým případem lineárních zobrazení jsou tzv. lineární formy. Jde o lineární zobrazení z vektorového prostoru V nad polem skalárů K do skalárů K. Jsou-li dány souřadnice na V, je přiřazení jednotlivé /-té souřadnice vektorům právě takovou lineární formou. Přesněji řečeno, pro každou volbu báze v — (vi,...,vn) máme k dispozici
2.61. Stanovte vektorový podprostor (prostoru R4) generovaný vektory mi = (-1, 3, -2, 1), u2 = (2, -1,-1, 2), u3 = (-4, 7, -3, 0), «4 = (1, 5, —5, 4). vybráním nějaké maximální množiny lineárně nezávislých vektorů u i (tj. vybráním báze).
Řešení. Sepíšeme vektory u i do sloupců matice a obdrženou matici upravíme pomocí řádkových elementárních transformací. Takto získáme
H
3
-2 ■
V i
(l 2
0 1
0 1
\o o
o
-1 5/4 -1 1 0 o /
M í1
5 -1 -5 ~ 3 4/ V-2
2
2 2
-1 -1
0
4\ ix
"5/
2 0 4 -4 -7 7
0 1 -1 0 0 0
\o o o
5/4 -1/4 o /
\ /l o
3 2
0 1
0 0 0 \Q 0 0 0/
4\
5
-7 3 /
1 0
Odtud vyplývá, že lineárně nezávislejšou právě vektory u i, ř/2, W4, tj. právě ty vektory odpovídající sloupcům, které obsahují první nenulové číslo nějakého řádku. Navíc odsud plyne (viz třetí sloupec)
2 • (-1, 3, -2, 1) - (2, -1,-1,2) = (-4, 7, -3, 0).
□
2.62. Ve vektorovém prostoru M4 jsou dány trojrozměrné podpro-story
U = («i, u2, u3), V = (vi, v2, v3),
přičemž
(\\ (\\ /1\ (1 ^ (1 \
1 1 0 1 -1
1 0 1 -1 , v2 = 1
w v) v)
t>3 = (1, —1, —1, l)T. Určete dimenzi a libovolnou bázi podprostoru
u n v.
Řešení. Do podprostoru U n V náleží právě ty vektory, které je možné obdržet jako lineární kombinaci vektorů u i a také jako lineární kombinaci vektorů vim Hledáme tedy čísla x\, x2, x3, yi, y2, y3 e R taková, aby platilo
Xi
/1\ 1 1
\0J
+ x2
(1\ (i\ ( 1 ^ ( 1 ^ ( 1 ^
1 +X3 0 1 + y2 -1 + y3 -1
0 1 = yi -1 1 -1
v) v) \-y K1)
tj. hledáme řešení soustavy
Xi + x2 + x3 Xl + x2
X\ + X3
X2 + X3
yi + y2 + y3,
yi - y2 - V3,
-yi + y2 - y3,
-yi - y2 + y3-
101
KAPITOLA 2. ELEMENTÁRNI LINEÁRNÍ ALGEBRA
lineárni formy v* : V -> K takové, že v*(vj) — 8{j, tj. nula pro různé indexy / a j a jednička pro stejné.
Vektorový prostor všech lineárních forem na V značíme V* a říkáme mu duální prostor vektorovému prostoru V. Předpokládejme nyní, že prostor V má konečnou dimenzi n. Bázi V* sestavenou z přiřazování jednotlivých souřadnic jako výše nazýváme duální báze. Skutečně se jedná o bázi prostoru V*, protože jsou tyto formy zjevně lineárně nezávislé (prověřte si!) a je-li a libovolná forma, pak platí pro každý vektor u — x\ v\ +----V xnvn
a(u) — jcia(ui) + • • • + xna(vn)
= a(vi)v*(u) H-----h a(vn)v*(u)
a je tedy a lineární kombinací forem v*.
Při pevně zvolené bázi {1} na jednorozměrném prostoru skalárů K jsou s každou volbou báze v na V lineární formy a ztotožněny s maticemi typu l/n, tj. s řádky y. Právě komponenty těchto řádků jsou souřadnicemi obecných lineárních forem v duální bázi v*. Vyčíslení takové formy na vektoru je pak dáno vynásobením příslušného řádkového vektoru y se sloupcem souřadnic x vektoru u e V v bázi v:
a(u) — y ■ x — yixi H-----h ynxn.
Zejména tedy vidíme, že pro každý konečněrozměrný prostor V je V* izomorfní prostoru V. Realizace takového izomorfismu je dána např. naší volbou duální báze ke zvolené bázi na prostoru V.
V tomto kontextu tedy znovu potkáváme skalární součin řádku n skalárů se sloupcem n skalárů, jak jsme s ním pracovali již v odstavci 2.3 na straně 74.
U nekonečně rozměrného prostoru se věci mají jinak. Např. už nejjednodušší příklad prostoru všech polynomů K[x] v jedné proměnné je vektorovým prostorem se spočetnou bazí s prvky ví — x1 a stejně jako výše můžeme definovat lineárně nezávislé formy v*. Jakýkoliv formální nekonečný součet Yľ^Ĺo aí vľ Je nYn^ dobře definovanou lineární formou na K[x], protože bude vyčíslován vždy pouze na konečné lineární kombinaci bázových polynomů x1', i — 0, 1,2,....
Spočetná množina všech v* tedy není bazí. Ve skutečnosti lze ukázat, že tento duální prostor ani spočetnou bázi mít nemůže.
2.40. Velikost vektorů a skalární součin. V úvahách o geometrii roviny R2 jsme již v první kapitole v odstavci 1.29 pracovali nejen s bázemi a lineárními zobrazeními, ale také s velikostí vektorů a jejich úhly. Pro zavedení těchto pojmů jsme také použili skalárního součinu dvou vektorů v — (x, y) a v' — (x', ý) ve tvaru u ■ v — xx1 + yý. Skutečně, souřadné vyjádření pro velikost v — (x, y) je dáno
yjx2 + y2
\/v ■ v,
zatímco (orientovaný) úhel R, které je symetrické ve svých argumentech, lineární v každém z nich a takové, že (v, v) > 0 a ||j;||2 — (v, v) — 0 pouze při v — 0.
Číslu || j; || — *J(v, v) říkáme velikost vektoru v.
Vektory v a w e V se nazývají ortogonální nebo kolmé, jestliže (v, w) — 0. Píšeme také v _L w. Vektor v se nazývá normovaný, jestliže || d || — 1.
Báze prostoru V složená z ortogonálních vektorů se nazývá ortogonální báze. Jsou-li bázové vektory navíc i normované, je to ortonormální báze.
Skalární součin se také často zapisuje pomocí obvyklé tečky, tj. (u, v) — u ■ v. Z kontextu je pak třeba poznat, zda jde o součin dvou vektorů (tedy výsledkem je skalár) nebo něco jiného (stejně jsme značili součin matic a také někdy součin skalárů).
Protože je skalární součin lineární v každém ze svých argumentů, bude jistě úplně určen již svými hodnotami na dvojicích bázových vektorů. Skutečně, zvolme si bázi u — (u\,...,u„) prostoru V a označme
Si j = (Ui, Uj).
Pak ze symetričnosti skalárního součinu plyne síj — s jí a z linearity součinu v každém z argumentů dostáváme:
i j >J >J
yxiyj.
Pokud je báze ortonormální, je matice S jednotkovou maticí. Tím jsme dokázali následující užitečné tvrzení:
skalární součin a ortonormální báze
Tvrzení. Skalární součin je v každé ortonormální bázi dán v souřadnicích výrazem
(x, y) - xT ■ y.
Pro každou obecnou bázi prostoru V existuje symetrická matice S taková, že souřadné vyjádření skalárního součinu je
(x, y) — xT ■ S ■ y.
2.41. Ortogonální doplňky a projekce. Pro každý pevně zvolený podprostor W C V v prostoru se skalárním součinem definujeme jeho ortogonální doplněk ^IJ takto
matic 3x2, musíme najít další čtyři matice (dimenze celého prostoru je zjevně 6) takové, aby výsledná šestice byla lineárně nezávislá. Můžeme využít toho, že známe např. standardní bázi
prostoru reálných matic 3x2, který lze přímo ztotožnit s R6. Sepíšeme-li dva vektory báze U a vektory standardní báze celého prostoru v tomto pořadí, výběrem prvních 6 lineárně nezávislých vektorů dostaneme hledanou bázi. Pokud však uvážíme, že kupř.
1 0 0 0 0 0
2 1 0 0 0 0
3 2 1 0 0 0
4 3 0 1 0 0
5 4 0 0 1 0
6 5 0 0 0 1
můžeme ihned bázového vektory
podprostoru U doplnit maticemi (vektory prostoru matic)
W1
[u e V; u _L v pro všechny v e W}.
na bázi. Upozorněme, že výše uvedený determinant lze vyčíslit velmi snadno - je roven součinu prvků na diagonále, neboť matice je v dolním trojúhelníkovém tvaru (nad diagonálou jsou všechny prvky nulové). □
H. Lineární zobrazení
Jak popsat analyticky shodná zobrazení v rovině či prostoru jako je rotace, osová symetrie či zrcadlení, nebo projekci třírozměrného prostoru na dvojrozměrné plátno? Jak popsat zvětšení obrázku? Co mají společného? Jsou to všechno lineární zobrazení. Znamená to, že zachovávají jistou strukturu roviny či prostoru. Jakou strukturu? Strukturu vektorového prostoru. Každý bod v rovině je popsán dvěma v prostoru pak třema souřadnicemi. Pokud zvolíme počátek souřadnic, tak má smysl mluvit o tom, že nějaký bod je dvakrát dál od počátku stejným směrem než jiný bod. Také víme, kam se dostaneme, posuneme-li se o nějaký úsek v jistém směru a pak o jiný úsek v jiném směru. Tyto vlastnosti můžeme zformalizovat, hovoříme-li o vektorech v rovině, či prostoru a o jejich násobcích, či součtech. Lineární zobrazení má pak tu vlastnost, že obraz součtu vektorů je součet obrazů sčítaných
103
KAPITOLA 2. ELEMENTÁRNI LINEÁRNI ALGEBRA
Přímo z definice je zjevné, že W je vektorový podprostor. Jestliže W G V má bázi (u\,..., m), je podmínka pro W1- dánajako & homogenních rovnic pro n proměnných. Bude tedy mít W1- dimenzi alespoň n — k. Zároveň ale u e W n W1- znamená (u, u) — 0 a tedy i u — 0 podle definice skalárního součinu. Zřejmě je tedy vždy celý prostor V přímým součtem
V = ffSff1.
Lineární zobrazení / : V -> V na libovolném vektorovém prostoru se nazývá projekce, jestliže platí
/ o / = /■
V takovém případě je pro každý vektor v e V
v = f (v) + (v- f (v)) € Im(/) + Ker(/) = V
a je-li v e Im(/) a f (v) — 0, pak je i v — 0. Je tedy přechozí součet podprostorů přímý. Říkáme, že / je projekce na podprostor W — Im(/) podél podprostorů U — Ker(/). Slovy se dá projekce popsat přirozeně takto: rozložíme daný vektor na komponentu ve W a v U a tu druhou zapomeneme.
Je-li na V navíc skalární součin, říkáme že jde o kolmou projekci, když je jádro kolmé na obraz. Každý podprostor W / V tedy definuje kolmou projekci na W. Je to projekce na W podél W-1, která je dána pomocí jednoznačného rozkladu každého vektoru u na komponenty uw e W a uw± e W-1, tj. lineární zobrazení, které uw + uw± zobrazí na uw-
2.42. Existence ortonormální báze. Povšimněme si, že na každém konečněrozměrném reálném vektorovém prostoru jistě existují skalární součiny. Prostě si stačí vybrat libovolnou bázi, prohlásit ji za ortonormální a hned jeden dobře definovaný skalární součin máme.
V této bázi pak skalární součiny počítáme podle vzorce v Tvrzení 2.40.
Umíme to ale i naopak. Máme-li zadán skalární součin na vektorovém prostoru V, můžeme vcelku jednoduše početně využít vhodných kolmých projekcí a jakoukoliv zvolenou bázi upravit na ortonormální. Jde o tzv. Grammův-Schmidtův ortogonalizační proces. Cílem této procedury bude z dané posloupnosti nenulových generátorů v\,..., vk konečněrozměrného prostoru V vytvořit ortogonální množinu nenulových generátorů pro V.
Grammova-Schmidtova ortogonalizace |_
Tvrzení. Nechť (u\,..., w*) je lineárně nezávislá k-tice vektorů prostoru V se skalárním součinem. Pak existuje ortogonální systém vektorů (v\,..., u*) takový, že vi e ...,«/), / — 1,..., k. Získáme je následující procedurou:
• Nezávislost vektorů ui zaručuje, že u\ ^ 0; zvolíme v\ —u\.
• Máme-li již vektory v\, ... ,V£ potřebných vlastností, zvolíme
vektorů a obraz násobku vektoru je ten stejný násobek obrazu násobeného vektoru. Tyto vlastnosti právě mají zobrazení zmíněná v úvodu tohoto odstavce. Takové zobrazení je pak jednoznačně určeno tím, jak se chová na vektrorech nějaké báze (to je v rovině obrazem dvou vektorů neležících na přímce, v prostoru obrazem tří vektorů neležích v rovině).
A jak tedy zapsat nějaké lineární zobrazení / na vektorovém prostoru V? Začněme pro jednoduchost s rovinou M2: předpokládejme, že obraz bodu (vektoru) (1, 0) je (a, b) a obraz bodu (0, 1) je (c, d). Tím už je jednoznačně určený obraz libovolného bodu o souřadnicích
(u, v): f((u, v)) = f(u(l, 0) + i,(0, 1)) = uf(l, 0) + vf(l, 0) = (ua, ub) + (vc, vd) = (au + cv, bu + dv), což můžeme výhodně zapsat následujícím způsobem:
vi+\ — ui+\ + a\V\ + ■ ■ ■ + aivi, kde a;-
\M\'
Důkaz. Začneme prvním (nenulovým) vektorem v\ a spočteme kolmou projekci v2 do
(ui)1" C {{vuvi}).
Výsledek bude nenulový právě, když je v2 nezávislé na v\. Ve všech dalších krocích budeme postupovat obdobně.
au + cv bu + dv
Lineární je tedy zobrazení jednoznačně dané maticí. Navíc pokud
(e f\
máme další lineární zobrazení g, dané maticí I ^ j, tak snadno
spočítáme (čtenář si jistě ze zájmu sám ověří), že jejich složení g o f
,/ae + fc be + d f
je dáno maticí , ,,,,,, y ag + ch bg + dh
To nás vede k tomu, abychom násobení matic definovali tímto způsobem, tedy aby aby aplikace zobrazení na vektor byla dána maticovým násobením matice zobrazení se zobrazovaným vektorem a aby složení zobrazení bylo dáno součinem matic jednotlivých zobrazení. Obdobně to funguje v prostorech vyšší dimenze. Zároveň tato úvaha znovu ukazuje to, co již bylo dokázáno v (2.5), totiž že násobení matic je asociativní, ale není komutativní, neboť tomu tak je u skládání zobrazení. To je tedy další z motivací, proč se zabývat vektorovými prostory a proč je s pojmem vektorového
Připomeňme si nyní, že v první kapitole jsme již pracovali s maticemi některých lineárních zobrazení v rovině M2, zejména rotace kolem bodu a osové symetrie (viz 1.31 a 1.32),
Nyní zkusme zapsat matice lineárních zobrazení z M3 do M3. Jak vypadá matice rotace ve třech rozměrech? Začněme speciálními (pro popis jednoduššími) rotacemi kolem souřadnicových os:
i
2.64. Matice rotací kolem os v B.3. Napište matice zobrazení rotací o úhel
sin (p cos (p 0 0 0 1,
rotace kolem osy y.
cos (p 0 sin (p
0 1 0 — sin cp 0 cos cp)
rotace kolem osy x:
U matice rotace kolem osy y máme jinak znaménko u cp. Chceme totiž, stejně jako u ostatních os rotaci kolem osy y v kladném smyslu, tedy takovou, že pokud se díváme proti směru osy y, tak se svět točí proti směru hodinových ručiček. Znaménka v maticích jsou závislá na orientaci naší souřadné soustavy. Obvykle se v třírozměrném prostoru volí tzv. „pravotočivá soustava souřadnic": položíme-li ruku na osu x tak, aby prsty byly po směru osy a abychom mohli osu x otočit v rovině x y do osy y tak, aby souhlasily jejich směry, pak palec by měl ukazovat ve směru osy z. V takové soustavě jde o rotaci v záporném smyslu v rovině xz, (tedy osa z, se otáčí směrem k x). Rozmyslete si kladný a záporný smysl rotace podél všech tří os. □ Znalost matic rotací kolem souřadnicových os nám již umožňuje napsat matici rotace kolem libovolné (orientované) osy. Začněme s konkrétním příkladem:
2.65. Nalezněte matici rotace v kladném smyslu o úhel jt/3 kolem přímky procházející počátkem s orientovaným směrovým vektorem (1, 1, 0) ve standardní bázi M3.
Řešení. Uvedené otočení lze získat složením po řadě těchto tří zobrazení:
• rotace o tt/4 v záporném smyslu podle osy z (osa rotace přejde na osu x);
• rotace o tt/3 v kladném smyslu podle osy x;
• rotace o tt/4 v kladném smyslu podle osy z (osa x přejde na osu rotace).
105
KAPITOLA 2. ELEMENTÁRNI LINEÁRNÍ ALGEBRA
Úhel dvou vektorů
Úhel
K, kde pro jakékoliv vektory u, v, w, z a skaláry a,b,c ad platí, stejně jako u skalárního součinu
a (au + bv, cw + dz) — aca(u, w) + ada(u, z)
+ bca(v, w) + bda(v, z).
Pokud navíc platí
a(u, w) — a(w, u),
hovoříme o symetrické bilineární formě. Jestliže záměna argumentů vede k obrácení znaménka výsledku, hovoříme o antisyme-trické bilineární formě.
Již v rovinné geometrii jsme zavedli determinant jako bilineární antisymetrickou formu a, tj. a(u, w) — —a(w, u). Obecně víme z věty 2.17, že je determinant v dimenzi n možno nahlížet jako n-lineární antisymetrickou formu.
Jako u lineárních zobrazení je zřejmé, že každá ^-lineární forma je úplně určena svými hodnotami na všech ^-ticích bázových prvků v pevné bázi. V analogii k lineárním zobrazením tyto hodnoty můžeme vnímat jako ^-rozměrné analogie matic. Ukážeme si to v případě k — 2, kde půjde doopravdy o matice, jak jsme je zavedli.
| Matice bilineární formy jsaM_____-_
Jestliže zvolíme bázi u na V a definujeme pro danou bilineární formu a skaláry aij — a(ui, uj), pak zjevně dostaneme pro vektory v, w se souřadnicemi x a y (jakožto sloupce souřadnic)
n
a (v, w) — ^2 (///A'/v; — yT ■ A ■ x,
ij=l
kde A je matice A — (flý).
Přímo z definice matice bilinerání formy je vidět, že forma je symetrická nebo antisymetrická, právě když má tutéž vlastnost její matice.
Každá bilineární forma a na vektorovém prostoru V definuje zobrazení V —>• V*, v \-> a(, v), tj. dosazením pevného vektoru v za druhý argument dostáváme lineární formu, která je obrazem
/ V2
2
V2 2
V 0
f o
0 1,
Uvědomme si, že výslednou rotaci bylo možné získat např. také složením následujících tří zobrazení:
• rotace o tt/4 v kladném smyslu podle osy z (osa rotace přejde na osu y);
• rotace o tt/3 v kladném smyslu podle osy y;
• rotace o tt/4 v záporném smyslu podle osy z (osa y přejde na osu rotace).
Analogicky tak dostáváme
2
2
V2 2
0
_V2 2
VI
2
0
o' o
□
2.66. Matice obecné rotace v M3. Odvodte matici obecné rotace vť.
Řešení. Úvahu z předchozího příkladu můžeme provést i s obecnými hodnotami. Uvažme libovolný jednotkový vektor (x, y, z). Rotace v kladném smyslu o úhel
y • a ■ x).
4. Vlastností lineárních zobrazení
Podrobnějším rozborem vlastností různých typů lineárních zobrazení se nyní dostaneme k lepšímu pochopení nástrojů, které nám vektorové prostory pro lineární modelování procesů a systémů nabízejí.
2.45. Začneme čtyřmi příklady v nejnižší zajímavé dimenzi. Ve ~€y _ standardní bázi roviny R2 se standardním skalárním součinem uvažujme následující matice zobrazení / : R2 -* R2:
1 0 0 0
, b
0 1
o o
, c
a 0 0 b
, D
0 -1
1 0
Matice a zadává kolmou projekci podél podprostoru
na podprostor
W C {(0, a); a e IR} C
V C {(a, 0); a e IR} C
tj. projekce na osu x podél osy y. Evidentně pro toto zobrazení / : R2 -> R2 platí / o / — f a tedy zúžení /1 y daného zobrazení na obor hodnot je identické zobrazení. Jádrem / je právě podprostor W.
Matice b má vlastnost b2 — 0, platí tedy totéž o příslušném zobrazení /. Můžeme si jej představit jako matici derivování polynomů Mi [x] stupně nejvýše jedna v bázi (1, x) (derivacemi se budeme podrobně zabývat v kapitole páté, viz ??).
Matice C zadává zobrazení /, které první vektor báze zvětší a-krát, druhý fr-krát. Tady se nám tedy celá rovina rozpadá na dva podprostory, které jsou zobrazením / zachovány a ve kterých jde o pouhou homotetii, tj. roztažení skalárním násobkem (první příklad byl speciální případem s a — 1, b — 0). Např. volba a — 1, b — — 1 odpovídá osové symetrii (zrcadlení) podle osy x, což je totéž jako komplexní konjugace x + iy i-> x — iy na dvourozměrném reálném prostoru R2_Cv bázi (1,0- Toto je lineární zobrazení dvourozměrného reálného vektorového prostoru C, nikoliv však jednorozměrného komplexního prostoru C.
Matice D je maticí rotace o pravý úhel ve standardní bázi a na první pohled je vidět, že žádný jednorozměrný podprostor není zobrazením zachováván.
Taková rotace je bijekcí roviny na sebe, proto jistě umíme najít (různé) báze na definičním oboru a oboru hodnot, ve kterých bude jeho maticí jednotková matice E (prostě vezmeme jakoukoliv bázi na definičním oboru a její obraz na oboru hodnot). Neumíme ale v tomto případě totéž s jednou bází na definičním oboru i oboru hodnot.
Zkusme však uvažovat matici D jako matici zobrazení g : C2 -> C2 ve standardní bázi komplexního vektorového prostoru C2. Pak umíme najít vektory u — (i, 1), v — (—i, 1), pro které bude platit
(1, 0, 0). Matice této rotace je
z 0
VT^T2
iii) rotace TZj, v kladném smyslu kolem osy x o úhel
R ve standardní bázi následující maticí:
'1 -1 0 1 v2 0
Napište matici tohoto zobrazení v bázi
fi, h) = ((1,1,0), (-1,1,1), (2,0, 1)).
Řešení. Matice přechodu T od báze / = (f\, f2, f3) k standardní bázi, tj. bázi danou vektory (1,0, 0), (0, 1, 0), (0, 0, 1), získáme podle Tvrzení 2.25 zapsáním souřadnic vektorů f\, f2, f3 ve standardní bázi do sloupců matice přechodu T. Máme tedy
/l -1 2^ T =11 1 0 \0 1 1,
Matice přechodu od standardní báze k bázi / je potom
Matice zobrazení v bázi / je potom
T~lAT
2 0
□
107
KAPITOLA 2. ELEMENTÁRNI LINEÁRNI ALGEBRA
(") = g(v) =
0 -1\ í i
i o y \i o -i\ íl
1 0 / \ij \-i To ale znamená, že v bázi (m, u) na C2 má zobrazení g matici
K =
; 0 0 -i
a povšimněme si, že tato komplexní analogie k případu matice C má na diagonále prvky a — cos^jr) + / sin(^jr) a kmoplexně sdružené ä. Jinými slovy, argument v goniometrickém tvaru tohoto komplexního čísla udává úhel otočení.
Tomu lze snadno porozumět, když si označíme reálnou a imaginární část vektoru u takto
u — xu + iyu — Re u + i Im u —
+ i
Vektor v je komplexně sdružený k u. Zajímá nás zúžení zobrazení g na reálný vektorový podprostor V — R2 n (u, v) c C2. Evidentně je
V — (u + u, i(u - u)) — {xu, —yu)
celá reálná rovina R2. Zúžení zobrazení g na tuto rovinu je právě původní zobrazení dané maticí A a z definice násobení komplexní jednotkou jde o otočení o úhel \n v kladném smyslu ve vztahu ke zvolené bázi xu, —yu (ověřte si přímým výpočtem a uvědomte si také, proč případné prohození pořadí vektorů uav povede k témuž výsledku, byť v jiné reálné bázi!).
2.46. Vlastní čísla a vlastní vektory zobrazení. Klíčem k popisu zobrazení v předchozích příkladech byly odpovědi na otázku , jaké jsou vektory splňující rovnici f(u) — ~~^a ■ u pro nějaké vhodné skaláry a?". Zvolme tedy pevně lineární zobrazní / : V -> V na vektorovém prostoru dimenze n nad skaláry K. Jestliže si představíme takovou rovnost zapsanou v souřadnicích, tj. s využitím matice zobrazení A v nějakých bázích, jde o výraz
A ■ x — a ■ x — (A — a ■ E) ■ x — 0.
Z předchozího víme, že taková soustava rovnic má jediné řešení x — 0, pokud je matice A—a E invertibilní. My tedy chceme najít takové hodnoty a e K, pro které naopak A — a E invertibilní není, a nutnou a dostatečnou podmínkou je (viz Věta 2.23)
(2.4)
det(A -a-E)=0.
Jestliže považujeme X — a za proměnnou v předchozí skalární rovnici, hledáme ve skutečnosti kořeny polynomu stupně n. Jak jsme viděli v případě matice D výše, kořeny mohou, ale nemusí existovat podle volby pole skalárů K.
-j Vlastní čísla a vlastní vektory J__——■
Skaláry A. vyhovující rovnici f(u) — X-u pro nenulový vektor u e V nazýváme vlastní čísla zobrazení f, příslušné nenulové vektory u pak vlastní vektory zobrazení f.
2.68. Uvažme vektorový prostor mnohočlenů jedné neznámé stupně nejvýše 2 s reálnými koeficienty. V tomto prostoru uvažme bázi 1, x, x2. Napište matici zobrazení derivace v této bázi a také v bázi 1 + x2,
/O 1 o Řešení. 0 0 2
0 0 o
□
2.69. Ve standardní bázi v R3 určete matici rotace o 90° v kladném smyslu kolem přímky (ř, t, t), t e R, orientované ve směru vektoru (1, 1, 1). Dále určete matici této rotace v bázi £=((1,1,0), (1,0,-1), (0,1,1)).
Řešení. Snadno určíme matici uvažované rotace a to ve vhodné bázi, totiž v bázi dané směrovým vektorem přímky a dále dvěma navzájem kolmými vektory v rovině x + y + z = 0, tedy v rovině vektorů kolmých k vektoru (1, 1, 1). Uvědomme si, že matice rotace v kladném
P2- /0 "I"
smyslu o 90° v nějaké ortonormální bázi vl je ^ 0 y' V ortoS°"
nální s velikostmi vekorů k, l potom 0^)" ^vo^me"u v ro"
viněx + y+z = 0 kolmé vektory (1, —l,0)a(l, 1, —2) o velikostech 72 a 76, tak v bázi / = ((1, 1, 1), (1, -1,0), (1, 1, -2)) máuvažo-
/l 0 0 \ vaná rotace matici 10 0 — V3 I. Abychom získali matici uva-
\0 1/V3 0 / žované rotace ve standardní bázi, stačí nám transformovat matici již
známým způsobem. Matici přechodu T od báze / ke standardní dostaneme zapsáním souřadnic (ve standardní bázi) vektorů báze / do
/i i i\
sloupců matice T:T=\\ —1 II. Celkem tedy pro hledanou
v 0 -v
matici R máme
R
1/3 1/3 + V3/3
1/3-V3/3 l/3 + V3/3\ 1/3 1/3 - V3/3
J/3-V3/3 1/3 + V3/3 1/3 /
Tento výsledek můžeme ověřit dosazením do matice obecné rotace (||2.66||), normováním vektoru (1, 1, 1) dostáváme vektor (x, y, z) = (1/V3, 1/V3, 1/V3), cos(
V v jisté bázi, pak | A — XE\ nazýváme také charakteristický polynom zobrazení f.
Protože je charakteristický polynom lineárního zobrazení / : V -> V nezávislý na volbě báze V, jsou i jeho koeficienty u jednotlivých mocnin proměnné X skaláry vyjadřující vlastnosti zobrazení /, tj. nemohou záviset na naší volbě báze. Zejména jako jednoduché cvičení na počítání determinantů vyjádříme koeficienty u nejvyšších a nejnižších mocnin (předpokládáme dim V — n a matici zobrazení A — (atj) v nějaké bázi):
X ■ E\ — (-\)nXn + (-+ •••+ \A\ -X°
-íy-Vi
H-----h ann) ■ X'
n-l
2.71. Matice obecné rotace podruhé. Zkusme odvodit matici (obecné) rotace z (||2.66||) o úhel
+ (!— cos (f)z1 )
Při násobení a následném zjednodušování je nutno opakovaně použít předpokladu x2 + y2 + z2 = 1.
Podrobnějším rozborem vlastností různých typů lineárních zobrazení se nyní dostaneme k pořádnějšímu pochopení nástrojů, které nám vektorové prostory pro lineární modelování procesů a systémů nabízejí.
2.72. Uvažme komplexní čísla jako reálný vektorový prostor a za jeho bázi zvolme 1 a i. V této bázi určete matici následujících lineárních zobrazení:
Koeficient u nejvyšší mocniny říká jen, zda je dimenze prostoru V sudá nebo Uchá. O determinantu matice zobrazení jsme už zmiňovali, že vyjadřuje, kolikrát dané lineární zobrazení zvětšuje objemy.
Zajímavé je, že i součet diagonálních členů matice zobrazení nezávisí na volbě báze. Nazýváme jej stopa matice a značíme TrA. Stopa zobrazení je definována jako stopa jeho matice v libovolné bázi. Ve skutečnosti to natolik překvapivé není, protože v kapitole osmé si jako příklad na metody diferenciálního počtu ukážeme, že stopa je ve skutečnosti lineárním přiblížením determinantu v okolí jednotkové matice, viz ??.
V dalším si uvedeme několik podstatných vlastností vlastních podprostorů.
2.47. Věta. Vlastní vektory lineárního zobrazení f : V —> příslušné různým vlastním hodnotám jsou lineárně nezávislé.
V
a) konjugace,
b) násobení číslem (2 + /).
Určete matici těchto zobrazení v bázi / = ((1 — /), (1 + /))■
Řešení. Abychom určili matici lineárního zobrazení v nějaké bázi, stačí určit obrazy bázových vektorů.
a) Pro konjugaci je 1 h-> 1, i h-> —i, zapsáno v souřadnicích (1,0) \-> (1, 0) a (0, 1) \-> (0,-1). Zapsáním obrazů do sloupců dostáváme matici ^ , V bázi / pak konjugace prohazuje bázové vektory, čili (1, 0) h-> (0, 1) a (0, 1) \-+ (1, 0) a matice konjugace v této bázi je K ^
109
KAPITOLA 2. ELEMENTÁRNI LINEÁRNI ALGEBRA
Důkaz. Nechť a\,... ,ak jsou různé vlastní hodnoty zobrazení / a vlastní vektory s těmito vlastními hodnotami. Důkaz provedeme indukcí přes počet lineárně 5 nezávislých vektorů mezi zvolenými. Předpokládejme, že «i,..., ui jsou lineárně nezávislé a ui+\ = E; c/mí Je jejich lineární kombinací. Alespoň £ = 1 lze zvolit, protože vlastní vektory jsou nenulové. Pak ovšem /(w^+i) = a;+i • =
z z i
ui = EQ ' -^"^ = EQ ' a' '
Odečtením druhého a čtvrtého výrazu v rovnostech dostáváme 0 = Yl\=i(ai+i ~ aí) ' cí ' ui- Všechny rozdíly vlastních hodnot jsou však nenulové a alespoň jeden koeficient q je nenulový. To je spor s předpokládanou nezávislostí u i,..., ui, takže i vektor ui+i musí být lineárně nezávislý na předchozích. □
Na právě dokázané tvrzení se můžeme podívat jako na rozklad lineárního zobrazení / na součet jednoduchých zobrazení. Pro vesměs různé vlastní hodnoty A; charakteristického polynomu budeme dostávat jednorozměrné vlastní podpostory . Každý z nich pak zadává projekci na tento invariantní jednorozměrný pod-prostor, na němž je zobrazení dáno jako násobení vlastním číslem Xi. Celý prostor V je tak rozložen na přímý součet jednotlivých vlastních podprostorů. Navíc lze tento rozklad na vlastní podpro-story snadno spočíst:
J báze z vlastních vektorů j——
Důsledek. Jestliže existuje n navzájem různých kořenů ki charakteristického polynomu zobrazení f : V -> V, na n-rozměrném prostoru V, pak existuje rozklad V na přímý součet vlastních podprostorů dimenze 1. To znamená, že existuje báze V složená výhradně z vlastních vektorů a v této bázi má f diagonální matici. Tato báze je určená jednoznačně až na pořadí prvků.
Příslušnou bázi (vyjádřenou v souřadnicích vzhledem k libovolně zvolené bázi V) obdržíme řešením n systémů homogenních lineárních rovnic o n neznámých s maticemi (A — A; • E), kde A je matice f ve zvolené bázi.
2.48. Invariantní podprostory. Viděli jsme, že každý vlastní vektor v zobrazení / : V -> V generuje podprostor (v) c V, který je zobrazením / zachováván.
Obecněji říkáme, že vektorový podprostor W C V je invariantní podprostor pro lineární zobrazení /, jestliže platí f(W) c W.
Jestliže je V konečněrozměrný vektorový prostor a vybereme nějakou bázi (u\,..., w*) podprostorů W, můžeme ji vždy doplnit na bázi (u\,uk, u^+\,..., u„) celého V a v každé takové bázi má naše zobrazení matici A tvaru
(2.5)
B C 0 D
kde B je čtvercová matice dimenze k, D je čtvercová matice dimenze n — k a C je matice typu n/(n — k). Naopak, jestliže je v nějaké bázi (u\, ...,«„) matice zobrazení / tvaru (2.5), je W = ..., m*) invariantní podprostor zobrazení /.
b) Pro bázi (1, i) dostáváme 1 \-+ 2+i, i \-> 2i — 1, tedy (1,0) \-+
(2, 1), (0, 1) \-> (2, —1). Celkem je matice násobení číslem 2 + i v
(2 -\\ bázi (1, i) tato: I ^ )■
Nyní určeme matici v bázi /. Násobením číslem (2+/) dostáváme: (1 - i) i—> (1 — 0(2 + 0 = 3- i, (1 + 0 + 30- Souřadnice
(a,b)f vektoru 3 — i v bázi / jsou dány, jak již dobře víme, rovnicí a ■ (1 - 0 + b ■ (1 + 0 = 3 + i, tedy (3 + 0/ = (2, 1). Obdobně
(2 -Ý
(1 + 30/ = (—1,2). Dohromady jsme získali matici K ^
Zamyslete se, proč nám matice násobení číslem 2 + i vyšla stejná v obou bázích. Byla by stejná matice násobení libovolným jiným komplexním číslem v těchto bazích? □
2.73. Určete matici A, která ve standardní bázi prostoru M3 zadává kolmou projekci do vektorového podprostorů generovaného vektory ui = (-1, 1,0) a M2 = (-1,0, 1).
Řešení. Nejprve poznamenejme, že uvedený podprostor je rovinou procházející počátkem s normálovým vektorem u3 = (1,1,1). Uspořádaná trojice (1, 1, 1) je totiž očividným řešením soustavy
—x\ + x2 =0, —x\ + x3 = 0,
tj. vektor u3 je kolmý na vektory u\, u2.
Při dané projekci se vektory ui a u2 musejí zobrazit na sebe a vektor u3 potom na nulový vektor. V bázi složené po řadě z vektorů u\, ii2, «3 je proto matice této projekce
0 0
0 1 0
0 0 0
Pomocí matic přechodu
3 3 _ 1 _ J_
7 i5 !
3 3 3
od báze {u\, u2, u3) ke standardní bázi a od standardní báze k bázi («i, «2, u3) získáme
3 3 3
_I _I 2
3 3 3
1 1 1
□
2.74. Ve vektorovém prostoru R3 určete matici kolmé projekce na ro-
vinu x + y — 2z, = 0.
O
110
KAPITOLA 2. ELEMENTÁRNI LINEÁRNÍ ALGEBRA
Pochopitelně bude v naší matici zobrazení (2.5) submatice C nulová právě tehdy, když bude i podprostor (wí+i, ...,u„) generovaný doplněnými vektory báze invariantní.
Z tohoto pohledu jsou vlastní podprostory lineárního zobrazení extrémní případy invariantních podprostorů a zejména v případě existence n — dim V různých vlastních čísel zobrazení / dostáváme rozklad V na přímý součet n vlastních podprostorů. V příslušné bázi z vlastních vektorů má pak naše zobrazení diagonální tvar s vlastními čísly na diagonále.
2.49. Ortogonální zobrazení. Podívejme se teď na speciální případ zobrazení / : V -> W mezi prostory se skalárními součiny, která zachovávají velikosti pro -r^ všechny vektory u e V.
mm^__| Definice ortogonálních zobrazení
Lineární zobrazení / : V -> W mezi prostory se skalárním součinem se nazývá ortogonální zobrazení, jesltiže pro všechny
u e V
2.75. Ve vektorovém prostoru R3 určete matici kolmé projekce na ro-
vinu 2x — y + 2z = 0.
O
Z linearity f a ze symetrie skalárního součinu vyplývá pro všechny dvojice vektorů rovnost
(f(u + v), f(u + v)) = (f(u), f(u)) + (f(v), f (v)) + 2(f(u),f(v)).
Proto všechny ortogonální zobrazení splňují i zdánlivě silnější požadavek, aby platilo pro všechny vektory u, v e V
(f(u),f(v)) = (u,v).
V úvodní diskusi o geometrii v rovině jsme ve Větě 1.33 dokázali, že lineární zobrazení R2 -> R2 zachovává velikosti vektorů, právě když jeho matice ve standardní bázi (a ta je ortonormální vzhledem ke standardnímu skalárnímu součinu) splňuje AT ■ A — E,tj. A~l = AT.
Obecně, ortogonální zobrazení / : V -> W musí být vždy in-jektivní, protože podmínka (/(«), /(«)) — 0 znamená i (u, u) — 0 a tedy u — 0. Je tedy vždy v takovém případě dimenze oboru hodnot alespoň taková, jako je dimenze definičního oboru /. Pak ovšem je dimenze obrazu rovna dimenzi oboru hodnot a víme, že / : V -> Im / je bijekce. Pokud Im / / W, doplníme ortonormální bázi na obrazu / na ortonormální bázi cílového prostoru a matice zobrazení bude obsahovat čtvercovou regulární matici A doplněnou nulovými řádky na potřebnou velikost. Bez újmy na obecnosti tedy předpokládejme W — V.
Naše podmínka pro matici ortogonálního zobrazení v ortonormální bázi pak říká pro všechny vektory x a y v prostoru K" toto:
(A • x)T ■ (A ■ y) = xT ■ (AT • A) • y = xT ■ y.
Speciálními volbami vektorů standardní báze za x a y dostaneme přímo, že AT ■ A — E, tedy tentýž výsledek jako v dimenzi dvě. Dokázali jsme tak následující tvrzení:
* Matice ortogonálních zobrazení
Věta. Nechť V je reálný vektorový prostor se skalárním součinem a f : V —>• V je lineární zobrazení. Pak f je ortogonální, právě když v některé ortonormální bázi (a pak už ve všech) má matici A splňující AT — A~l.
I. Báze a skalární součiny
Pomocí skalárního součinu umíme řešit jiným způsobem (lépe?) problémy, které jsme již dříve zvládli pomocí transformace souřadnic.
2.76. Napište matici zobrazení kolmé projekce do roviny procházející počátkem a kolmé na vektor (1, 1, 1).
Řešení. Obraz libovolného bodu (vektoru) x = (x!,x2,x3) e R3 v uvažovaném zobrazení získáme tak, že od daného bodu odečteme jeho kolmou projekci do normálového směru dané roviny, tedy do směru (1, 1, 1). Tato projekce p je dána (viz 2.3) jako
(x, (1, 1, 1))
' ■ (1, 1, 1) =
l(l,l,l)l2
Xi + X2 + X3 Xi + X2 + X3 Xi + x2 + x3
3 ' 3 ' 3
Výsledné zobrazení je tedy
/2xi x2 + x3 2x2 x\ + x3 2x3 x\ + x2 x-P= --
3 3 3
Vyšla nám tedy (správně) stejná matice jako v příkladu || 2.731|. □
2.77. Určete matici zrcadlení podle roviny procházející počátkem a s normálovým vektorem (1, 1, 1).
Řešení. Obdobně jako v předchozím příkladu (|| 2.761|) získáme obraz libovolného bodu (vektoru) x = {x\, x2, x3) e R3 pomocí jeho kolmé projekce p do normálového směru (1, 1, 1). Narozdíl od předchozího příkladu je však tuto projekci třeba odečíst dvakrát (viz obrázek). Je tedy
Xi 2(X2+X3) X2 2(X!+X3) X3 2(X!+X2)
x — 2p = (---,---,---) =
ť 3 3 3 3 3 3
3 3 3
2 I _ 2
"3 3 3
2 2 1
3 3 3
Uvedená matice je tedy hledadanou maticí uvažovaného zrcadlení. □
2.78. V R3 je dána standardní souřadnicová soustava. V rovině z = 0 je umístěno zrcadlo a v bodě [4, 3, 5] svíčka. Pozorovatel v bodě [1, 2, 3] o zrcadle neví, ale pozoruje odrazem v něm svíčku. V jakém bodě se mu jeví, že je svíčka umístěna?
111
KAPITOLA 2. ELEMENTÁRNI LINEÁRNI ALGEBRA
Důkaz. Skutečně, jestliže zachovává / velikosti, musí mít uvedenou vlastnost v každé ortonormální bázi. Naopak, předchozí výpočet ukazuje, že vlastnost matice v jedné bázi už zaručuje zachovávání velikostí. □
Čtvercovým maticím, které splňují rovnost AT — A~l říkáme ortogonální matice.
Důsledkem předchozí věty je také popis všech matic přechodu S mezi ortonormálními bázemi. Každá totiž musí zadávat zobrazení K" -> K" zachovávající velikosti a splňují tady také právě podmínku S~l — ST. Při přechodu od jedné ortonormální báze ke druhé se tedy matice (libovolných) lineárních zobrazení mění podle vztahu
A' = STAS.
Rozklad ortogonálního zobrazení. Podívejme se nyní podrobněji na vlastní vektory a vlastní čísla ortogonálních zobrazení na reálném vektorovém prostoru V se skalárním součinem.
Uvažujme pevně zvolené ortogonální zobrazení / : V s maticí A v nějaké ortonormální bázi a zkusme postupovat obdobně jako s maticí rotace D v příkladu 2.45.
Nejprve se ale podívejme obecně na invariantní podprostory ortogonálních zobrazení a jejich ortogonální doplňky. Jestliže pro libovolný podprostor W C V a ortogonální zobrazení / : V -> V platí f(W) c W, pak také platí pro všechny v e W-1, w e W
(f(v), w) = (f(v), f o f-\w)) = (v, f~\w)) = 0
protože i f~1(w) e W. To ale znamená, že také /(W-1) c W-1. Dokázali jsme tedy jednoduché, ale velice důležité tvrzení:
Tvrzení. Ortogonální doplněk k invariantnímu podprostoru je také invariantní.
Kdyby byla vlastní čísla ortogonálního zobrazení reálná, zaručovalo by už toto tvrzení, že bude vždy existovat báze V z vlastních vektorů. Skutečně, zúžení / na ortogonální doplněk invariantního podprostoru je opět ortogonální zobrazení, takže můžeme do báze přibírat jeden vlastní vektor za druhým, až dostaneme celý rozklad V. Nicméně většinou nejsou vlastní čísla ortogonálních zobrazení reálná. Musíme si proto pomoci opět výletem do komplexních vektorových prostorů. Zformulujeme rovnou výsledek:
Rozklad ortogonálních zobrazení ^.mb—.
Věta. Nechť f : V -> V je ortogonální zobrazení na prostoru se skalárním součinem. Pak všechny kořeny charakteristického polynomu f mají velikost jedna a existuje rozklad V na jednorozměrné vlastní podprostory odpovídající vlastním číslům X — ±1 a dvourozměrné podprostory Px ~x, na kterých působí f rotací o úhel rovný argumentu komplexního čísla k v kladném směru. Všechny tyto různé podprostory jsou po dvou ortogonální.
Důkaz. Bez újmy na obecnosti můžeme pracovat s prostorem V — Rm se standardním skalárním součinem. Zobrazení tedy bude dáno ortogonální matici A, kterou můžeme stejně považovat za matici lineárního zobrazení na komplexním prostoru Cm (která je jen shodou okolností reálná). Zaručeně bude existovat právě m (komplexních)
Řešení. V zrcadle vidíme vždy (nezávisle na naší poloze) zrcadlový obraz pozorovaných objektů. Svíčka se tedy jeví v bodě, který je zrcadlovým obrazem skutečné polohy podle roviny zrcadla, tedy podle roviny z = 0. Zrcadlení podle této roviny má jednoduchý předpis, stačí změnit znaménko u souřadnice z zobrazovaného bodu (rozmysli). Svíčku tudíž vidí pozorovatel v bodě [4,3,-5]. □
2.79. Najděte matici zrcadlení vzhledem k rovině x + y + z = 0. Řešení. Z tvaru rovnice roviny zjistíme její jednotkový normálový vektor. V našem případě to je « = ^(1, 1, !)■ Zrcadlení Z na vektoru i; lze pak vyjádřit Zv = v — 2(v.n)n = (1 — 2nnT)v (pro standardní skalami součin je v.n = vnT). Matice zrcadlení je tedy
1
1 — 2nnJ
1
-2>
□
Pomocí skalárního součinu můžeme určovat odchylky vektorů:
2.80. Určete odchylku kořenů polynomu x2 — i uvažovaných jako vektory v komplexní rovině.
Řešení. Kořeny daného polynomu jsou druhé odmocniny z i. Argumenty druhých odmocnin z libovolného nenulového komplexního čísla se podle Moivrovy věty liší o n. Jejich odchylka tedy bude vždy
n. □
2.81. Určete cosinus odchylky přímek p,qv] nicemi jako
p : -2x + y + z = x +3y -4z = q : x — y = —2
daných obecnými rov-
2.82. Je dána přímka
p : [1, 1] + (4, l)ř, ř e R
Určete parametrické vyjádření všech přímek q, které procházejí počátkem souřadnic a s přímkou p mají odchylku 60°. O
2.83. Pomocí Gramova-Schmidtova ortogonalizačního procesu získejte ortogonální bázi podprostoru
U = {(xi, X2, xs, x^)1 € R4; x\ + x2 + xj, + X4 = 0}
prostoru R4.
112
KAPITOLA 2. ELEMENTÁRNI LINEÁRNI ALGEBRA
kořenů charakteristického polynomu, včetně jejich algebraické násobnosti (viz tzv. základní věta algebry, ??). Navíc, protože charakteristický polynom zobrazení bude mít výhradně reálné koeficienty, budou tyto kořeny buď reálné, nebo půjde o dvojice komplexně sdružených kořenů X a X. Příslušné vlastní vektory v Cm k takové dvojici komplexně sdružených vlastních čísel budou řešením dvou komplexně sdružených systémů homogenních lineárních rovnic, neboť příslušné matice systémů rovnic jsou celé reálné, až na samotná dosazená vlastní čísla. Evidentně proto budou také řešení těchto systémů komplexně sdružené vektory.
Nyní využijeme skutečnost, že ke každému invariantnímu pod-prostoru je i jeho ortogonální doplněk invariantní. Nejprve si najdeme všechny vlastní podprostory V±i příslušné k reálným vlastním hodnotám a zúžíme naše zobrazení na ortogonální doplněk k jejich součtu. Bez újmy na obecnosti tedy můžeme předpokládat, že naše ortogonální zobrazení nemá žádná reálná vlastní čísla a že je dim V — 2n > 0.
Zvolme nyní nějaké vlastní číslo X a označme ux vlastní vektor příslušný k vlastnímu číslu X — a + ifí, p / 0. Zcela stejně jako v případě rotace v rovině zadané v odstavci 2.45 maticí D nás zajímá reálná část součtu dvou jednorozměrných podprostorů (ux) ®(ux), kde u\ je vlastní vektor příslušný k vlastnímu číslu X.
Jde o průnik uvedeného součtu komplexních podprostorů s M2", který je generovaný vektory ux + ux a i(ux — ux), tj. reálný vektorový podprostor Px C M2" generovaný bazí danou reálnou a imaginární částí ux
XX — reux,
-yx — -imux.
Protože A - (ux + ux) — Xux + Xäx a podobně s druhým bázovým vektorem, jde zjevně o invariantní podprostor vůči násobení maticí A a dostáváme
A-xx — axx + fiyx, A ■ yx — -ayx + fax-
Protože naše zobrazení zachovává velikosti, musí být navíc velikost vlastní hodnoty X rovna jedné. To ale neznamená nic jiného, než že zúžení našeho zobrazení na P x je rotací o argument vlastní hodnoty X. Všimněme si, že volba vlastního čísla X místo X vede na stejný podprostor se stejnou rotací, pouze ji dostaneme vyjádřenou v bázi xx, yx, tj. musíme v souřadnicích rotovat o úhel s opačným znaménkem.
Důkaz celé věty tím dokončen, protože zúžením našeho zobrazení na ortogonální doplněk a opakováním předchozí úvahy dostaneme celý rozklad po n krocích. □
K myšlenkám tohoto důkazu se ještě vrátíme v kapitole třetí, když budeme studovat komplexní rozšíření euklidovských vektorových prostorů, viz 3.26.
Poznámka. Specielně v dimenzi tři musí být alespoň jedno í vlastní číslo ±1, protože je trojka liché číslo. Pak ovšem příslušný vlastní podprostor je osou rotace trojrozměrného prostoru o úhel daný argumentem dalších vlastních čísel. Zkuste si rozmyslet, jak poznat, kterým směrem jde rotace a také, že vlastní číslo —1 znamená ještě dodatečné zrcadlení podle roviny kolmé na osu rotace.
Řešení. Množina řešení uvedené homogenní lineární rovnice je zřejmě vektorovým prostorem s bází
1 0
u2
0
1
«3
0
o
V 1 /
Vektory ortogonální báze získané užitím Gramova-Schmidtova orto-gonaUzačního procesu budeme značit t>i, v2, v3. Nejprve položme v\ = u\. Dále
T
1
u\ ■ V\
v2 = u2- Vi = u2 - - Vi
\\vi\\2 2
1 1
—, —, 1,0
2 2
resp. zvolme násobek v2 = (— 1, — 1, 2, 0) . Následně je
1 1
ul ■ V\ V3 = U3- ——^ Ví
INU2 1 1 1
ul ■ v2
—— v2 = U3 - -Ví - -v2 INU2 2 6
3 3 3 Máme tedy celkem
/-1\ í-l\ /-1\
1 -1 -1
0 , v2 = 2 -1
\°) w
Dodejme, že pro jednoduchost příkladu lze bezprostředně uvést ortogonální bázi z vektorů
(1,-1,0, 0)T , (0, 0, l,-l)r, (1, 1,-1,-l)r
nebo
(-1, 1, 1,-l)T , (1,-1, 1,-l)r
(-1,-1,1,1)'
□
2.84. Napište něj akou bázi reálného vektorového prostoru matic 3x3 nad R s nulovou stopou (součet prvků na diagonále) a napište souřadnice matice
'12 0 0 2 0
.1 -2 -3,
v této bázi.
2.85. Zavedte nějaký skalární součin na vektorovém prostoru matic z předchozího příkladu. Spočítejte normu matice z předchozího příkladu, která je indukovaná Vámi zavedeným součinem. O
113
KAPITOLA 2. ELEMENTÁRNI LINEÁRNÍ ALGEBRA
K diskusi vlastností matic a lineárních zobrazení se budeme vracet. Před pokračováním obecné teorie si napřed ukážeme v následující kapitole několik aplikací, ještě ale uzavřeme naši diskusi obecnou definicí:
-j Spektrum lineárního zobrazení j.
2.51. Definice. Spektrum lineárního zobrazení f : V -> V (resp. matice) je posloupnost kořenů charakteristického polynomu zobrazení /, včetně násobností. Algebraickou násobností vlastní hodnoty rozumíme její násobnost jakožto kořenu charakteristického polynomu, geometrická násobnost vlastní hodnoty je dimenze příslušného podprostoru vlastních vektorů.
Spektrálním poloměrem lineárního zobrazení (matice) je největší z absolutní hodnot vlastních čísel.
i
V této terminologii můžeme naše výsledky o ortogonálních zobrazeních zformulovat tak, že jejich spektra jsou vždy celá podmnožinou jednotkové kružnice v komplexní rovině. To znamená, že v reálné části spektra mohou být pouze hodnoty ±1, jejichž algebraické a geometrické násobnosti jsou stejné. Komplexní hodnoty spektra pak odpovídají rotacím ve vhodných dvourozměrných pod-prostorech, které jsou na sebe po dvou kolmé.
2.86. Určete nějakou bázi vektorového prostoru antisymetrických reálných čtvercových matic typu 4x4. Uvažte standardní skalární součin v této bázi a pomocí tohoto součinu vyjádřete velikost matice
/ 0 3 1 0\ -3012 -1-1 0 2 \0 -2-2 0/
2.87. Najděte ortogonální doplněk U1- podprostoru
U = {(xi, xi, X3, X4); x\ = X3, X2 = X3 + 6x4} C R4.
Řešení. Ortogonální doplněk U1- tvoří právě ty vektory, které jsou kolmé na každé řešení soustavy
x\ — X3 = 0,
X2 — X3 — 6X4 = 0.
Vektor je ovšem řešením této soustavy tehdy a jenom tehdy, když je kolmý na oba vektory (1,0, —1,0), (0, 1, —1, —6). Je tedy
{a ■ (1, 0, -1, 0) + b ■ (0, 1, -1, -6); a,be
□
2.88. Určete, zda jsou podprostory U = ((2, 1, 2, 2))
a V = ((-1, 0, -1, 2), (-1, 0, 1, 0), (0, 0, 1, -1)) prostoru R4 na sebe kolmé. Pokud ano, je R4 = U © V, tj. je U1- = VI
2.89. V závislosti na parametru t e R stanovte dimenzi podprostoru U vektorového prostoru R3, je-li U generován vektory
(a) ui = (1, 1, 1), u2 = (í,t,í), «3 = (2, 2, ř);
(b) u 1 = (t,t,t), u2 = (-4ř,-4ř, 4ř), «3 = (-2, -2, -2).
2.90. Sestrojte ortogonální bázi podprostoru
((1,1,1,1), (1,1,1,-1), (-1,1,1,1))
prostoru R4.
2.91. V prostoru R4 nalezněte nějakou ortogonální bázi podprostoru všech lineárních kombinací vektorů (1,0, 1, 0), (0, 1, 0, —7),
(4, —2, 4, 14) a podprostoru generovaného vektory (1, 2, 2, —1), (1, 1, -5, 3), (3,2, 8, -7).
2.92. Pro jaké hodnoty parametrů a, b e M jsou vektory
(1,1,2,0,0), (1,-1,0,1, a), (1,0,2,3,-2) v prostoru M5 po dvou ortogonální?
2.93. V prostoru M5 uvažujte podprostor generovaný vektory (1,1,-1,-1,0), (1,-1,-1,0,-1), (1,1,0,1,1), (—1, 0, —1, 1, 1). Najděte nějakou bázi jeho ortogonálního doplňku.
114
KAPITOLA 2. ELEMENTÁRNI LINEÁRNÍ ALGEBRA
2.94. Popište ortogonální doplněk podprostoru V prostoru R4, jeli V generován vektory (-1,2, 0, 1), (3, 1, -2, 4), (-4, 1, 2, -4), (2,3, -2,5).
2.95. V prostoru M5 určete ortogonální doplněk W1- podprostoru W, jestliže
(a) W = {(r + s + t, -r + t, r + s, -t, s + t); r, s, t e R};
(b) W je množina řešení soustavy rovnic x\ — x3 = 0, x\ — x2 + x3 — x4 -\- X5 = 0.
2.96. Nechť jsou v prostom R4 dány vektory
(1,-2,2,1), (1,3,2,1).
Doplňte tyto dva vektory libovolným způsobem na ortogonální bázi celého R4. (Můžete k tomu využít Gramův-Schmidtův ortogonalizační proces.)
2.97. Nalezněte nějakou ortonormální bází podprostoru y c M,
kde V = {(xi, x2, x3, x4) e R4 \ x\ + 2x2 + x3 = 0}.
Řešení. Vidíme, že čtvrtá souřadnice se v omezení na podprostor nevyskytuje, bude tedy vhodné volit jeden z vektorů hledané ortonormální báze vektor (0, 0, 0, 1) a redukovat problém do prostom R3. I dále se zkusíme vyhnout počítání: vidíme, že položíme-li druhou souřadnici rovnu nule, tak ve vyšetřovaném prostoru leží vektory s opačnou první a třetí souřadnicí, zejména jednotkový vektor (^j, 0, — , 0). Na tento vektor je kolmý libovolný vektor, který má stejnou první a třetí souřadnici. Abychom se dostali do uvažovaného podprostoru, volíme druhou souřadnici rovnu záporné hodnotě součtu první a třetí souřadnice a normujeme, tedy volíme vektor (-^, — 7^, 0) a jsme hotovi. □
2.98. Vlastní čísla a vlastní vektory mohou sloužit k názornému popisu lineárních zobrazení, zejména vE2al3.
(1) Uvažme zobrazení s maticí ve standardní bázi
J. Vlastní čísla a vlastní vektory
/0 0 1
/ : R3 -+ R3, A = 0 1 0 \1 0 0
Pak dostáváme
\A-kE\
—k
0
1
0
1 — X
o
1 o
—X
X3 + X2 + X - 1,
115
KAPITOLA 2. ELEMENTÁRNI LINEÁRNI ALGEBRA
s kořeny ki_2 = 1, A3 = —1. Vlastní vektory s vlastní hodnotou k = 1 se spočtou:
s bází prostom řešení, tj. všech vlastních vektorů s touto vlastní hodnotou
m! = (0,1,0), lť2 = (1,0,1).
Podobně pro k = — 1 dostáváme třetí nezávislý vlastní vektor
(-1,0, 1).
V bázi ii\, u2, ut, (všimněte si, že m 3 musí být lineárně nezávislý na zbylých dvou díky větě 2.47 a u\, u2 vyšly jako dvě nezávislá řešení) má / diagonální matici
Celý prostor M3 je přímým součtem vlastních podprostorů, M3 = V\ © V2, dim V\ = 2, dim V2 = \. Tento rozklad je dán jednoznačně a vypovídá mnoho o geometrických vlastnostech zobrazení /. Vlastní podprostor V\ je navíc přímým součtem jednorozměrných vlastních podprostorů, které lze však zvolit mnoha různými způsoby (takový další rozklad nemá tedy již žádný geometrický význam).
(2) Uvažme lineární zobrazení / : M2M definované derivováním polynomů, tj. /(I) = 0, f(x) = l, f(x2)=2x. Zobrazení / má tedy v obvyklé bázi (1, x, x2) matici
Charakteristický polynom je \ A — k ■ E\ = —k3, existuje tedy pouze jediná vlastní hodnota, k = 0. Spočtěme vlastní vektory:
Prostor vlastních vektorů je tedy jednorozměrný, generovaný konstantním polynomem 1.
2.99. Přiklad i se změnou báze. Určete vlastní čísla a vlastní vektory matice
/1 1 o^
A = 1 2 1 U 2 1,
116
KAPITOLA 2. ELEMENTÁRNI LINEÁRNÍ ALGEBRA
Popište geometrickou interpretaci tohoto zobrazení a napište jeho matici v bázi:
ei = [1,-1,1] e2 = [1,2,0] e3 = [0, 1, 1]
Řešení. Charakteristický polynom dané matice je
= -k3 + 4k2 -2k = -k(k2 -4k + 2).
1 - k 1 0 1 2 — k 1 1 2 1 - k
Kořeny tohoto polynomu, vlastní čísla, udávají, kdy nebude mít matice
'l-k 1 0 1 2 — k 1 1 2 l-k,
plnou hodnost, tedy soustava rovnic
bude mít i jiné řešení než řešení x = (0, 0, 0). Vlastní čísla tedy jsou 0, 2 + 72, 2 — 72. Spočítejme vlastní vektory příslušné jednotlivým vlastním hodnotám:
• 0: Řešíme tedy soustavu
0
Jejím řešením je jednodimenzionální vektorový prostor vlastních vektorů ((1, —1, 1)).
• 2 + 72: Řešíme soustavu -(1 + 72) 1 0 \ /jcA
1 -y/2 1 X2 = 0.
1 2 -(1 + 72)/ \X3/
Řešením je jednodimenzionální prostor ((1,1 + 72, 1 + 72)).
• 2 — 72: Řešíme soustavu
'(72- 1) 1 0 \ /jcA
1 V2 1 x2 = 0.
1 2 (72 - 1)/ \x3/
Řešením je prostor vlastních vektorů ((1, 1 — 72, 1 — 72)).
Daná matice má vlastní čísla 0,2+72 a 2—72, kterým přísluší po řadě jednorozměrné prostory vlastních vektorů ((1, —1, 1)), ((1, 1 + 72, 1 + 72)) a ((1, 1 - 72, 1 - 72)).
Zobrazení tedy můžeme interpretovat jako projekci podél vektoru (1, -1, 1) do roviny dané vektory (1, 1 + 72, 1 + 72) a (1, 1 -
117
KAPITOLA 2. ELEMENTÁRNI LINEÁRNI ALGEBRA
\/2, 1 — VŤ.) složenou s lineárním zobrazením daným „natažením" daným vlastními čísly ve směru uvedených vlastních vektorů.
Nyní jej vyjádřeme v uvedené bázi. K tomu budeme potřebovat matici přechodu T od standardní báze k dané nové bázi. Tu získáme tak, že souřadnice vektorů staré báze v bázi nové napíšeme do sloupců matice T. My však snadněji zapíšeme matici přechodu od dané báze k bázi standardní, tedy matici T~l. Souřadnice vektorů nové báze pouze zapíšeme do sloupců:
,-..(-;,
Potom
T = r-1"1 =
a pro matici B zobrazení v nové bázi pak máme (viz 2.38)
B = TAT'1 =
□
Procvičme si počítání s vlastními čísly a vlastními vektory na následujících příkladech.
2.100. Naleznete vlastní čísla a jim příslušné vektorové prostory vlastních vektorů matice: A=
Řešení. Nejprve sestavíme charakteristický polynom dané matice:
■1-k 1 0 -1 3-k 0 2 —2 2 — X
X3 - 4k3 + 2X + 4.
Tento polynom má kořeny 2,1 + V3,1 — V3, což jsou tak vlastní čísla zadané matice. Jejich algebraická násobnost je jedna (jsou to jednoduché kořeny charakteristického polynomu), každému tedy bude odpovídat právě jeden (až na nenulový násobek) vlastní vektor (tj. jejich tzv. geometrická násobnost bude také jedna, viz 3.32).
Určeme vlastní vektor příslušný vlastnímu číslu 2 (je řešením homogenní lineární soustavy s maticí A — 2E):
-3xi + x2 = 0 — lxi + x2 = 0 2xi — 2x2 = 0.
118
KAPITOLA 2. ELEMENTÁRNI LINEÁRNÍ ALGEBRA
Soustava má řešení x\ = x2 = 0, x3 e M libovolné, vlastním vektorem příslušným vlastní hodnotě 2 je tedy například vektor (0, 0, 1) (a libovolný jeho nenulový násobek).
Analogickým způsobem určíme i zbývající dva vlastí vektory, jakožto řešení soustavy [A — (1 + V3)£]x = 0, respektíve [A — (1 + V3)£]x = 0. Řešením soustavy
(-2 - VŠ)jci + x2 = 0 -Ijci + (2 - VŠ)x2 = 0 2xi - 2x2 + (1 - VŠ)x3 = 0
je prostor {((^ — l)ŕ, — 5, ^ , í e M}. To je tedy prostor vlastních vektorů příslušných vlastní hodnotě 1 + V3 (mimo nulového vektoru, který sice je řešením dané soustavy, ale za vlastní vektor jej nepovažujeme; tuto záležitost již nebudeme více zmiňovat a nebudeme nulový vektor explicitně vylučovat z množiny řešení).
Obdobně pak dostaneme, že prostor vlastních vektorů příslušných vlastní hodnotě 1 - VŠ je ((-1 - ^,-\, 1)). □
2.101. Nalezněte vlastní čísla a jim příslušné vektorové prostory vlastních vektorů matice:
II 1 0\ A = I —1 3 0 . \2 -2 2/
Řešení. Charakteristický polynom matice je X3 —6A2 +12A—8, což je (A — 2)2 s trojnásobným kořenem 2. Číslo 2 je tedy vlastní hodnotou s algebraickou násobností tři. Její geometrická násobnost tedy bude jedna, dvě, nebo tři. Určeme tedy vlastní vektory příslušné této vlastní hodnotě jako řešení soustavy
—x\ +x2 = 0, (A - 2E)x = -xi +x2 = 0, 2xi —2x2 = 0.
Jejím řešením je dvojrozměrný prostor ((1, —1, 0), (0, 0, 1)). Vlastní hodnota 2 má tedy algebraickou násobnost tři, ale geometrickou pouze dva.
□
Další základní příklady na vlastní čísla vektory matic naleznete na straně 126
2.102. Pro libovolnou n x n matici A je její charakteristický polynom I A — k E I stupně n, je tedy tvaru
I A - X E I = cn X" + c„_i X"-1 + • • • + ci X + c0, c„ ^ 0,
přičem platí
119
KAPITOLA 2. ELEMENTÁRNI LINEÁRNÍ ALGEBRA
cn = (-l)\ c„_! = (-l)"-1trA, c0 = |A|. Jestliže je matice A trojrozměrná, obdržíme
| A - k E | = -k3 + (tr A) k2 + ci k + \A\. Volbou k = 1 dostáváme
|A-£| = -l+trA + ci + |A|. Odsud získáváme vyjádření
\A-kE\ = -A.3 + (tr A) A2 + (| A - £" | + 1 - tr A - | A |) A + | A |.
Využijte toto vyjádření k určení charakteristického polynomu a vlastních hodnot matice
A =
O
2.103. Bez počítání napište spektrum lineárního zobrazení / : R3 -» R3 zadaného přiřazením {x\, x2, x3) i-» {x\ + x3, x2, x\ + x3). Q
2.104. Uvedie dimenze vlastních podprostorů jednotlivých vlastních hodnot ki matice
/4 0 0 0\ 14 0 0 5 2 3 0 \0 4 0 3/
O
2.105. Pauliho matice Ve fyzice se stav částice se spinem \ popisuje Pauliho maticemi. Jsou to následující matice 2x2 nad komplexními čísly
'0 1\ /O -i\ (\ 0
ai = \i o)>a2={i o)>°3- \0 -1
Pro čtvercové matice definujeme jejich komutátor (značený hranatými závorkami) jako \o\, a2] := a\a2 — a2a\
Ukažte, že platí [cti, W ^ug-l-ýí- na vektorových prostorech. Jak si jistě umíme před-' slav'l> vektor v e V může představovat stav nějakého
3 éi-^ - námi sledovaného systému, zatímco cp(v) pak dá výsledek po uskutečněném procesu.
Pokud chceme dosáhnout předem daného výsledku b e W takového jednorázového procesu, řešíme problém
x2 + 90
xx < 110
Účelová funkce (funkce udávající zisk při daném počtu vyrobených šroubků a matic) je 40x! + 60x2. Předchozí soustava nerovnic zadává v M2 určitou oblast a optimalizace zisku znamená najít v této oblasti bod (případně body), ve kterém bude mít účelová funkce nejvyšší hodnotu, tj. najít nej větší k takové, že přímka 40x! + 60x2 = k bude mít s danou oblastí neprázdný průnik. Graficky můžeme najít řešení například tak, že umístíme přímku p do roviny tak, aby splňovala rovnici 40x! + 60x2 = 0 a začneme ji rovnoběžně posunovat „nahoru" tak dlouho, dokud bude mít nějaký společný průnik s danou oblastí. Je zřejmé, že tímto posledním průnikem může být buďbod, nebo hraniční přímka dané oblasti (pokud by byla rovnoběžná s p). Dostaneme tak (viz. obrázek), bod x\ = 110 a x2 = 5. Maximální možný zisk tedy činí 40 • 110 + 60 • 5 = 4700 Kč. □
3.2. Minimalizace nákladů na krmení. Hříbárna v Nišovicích u Volyně nakupuje na zimu krmivo: seno a oves. Výživné hodnoty krmiv a požadované denní dávky pro jedno hříbě jsou v tabulce
g/kg Seno Oves POŽADAVKY
Sušina 841 860 Alespoň 6300 g
SNL 53 123 Nejvýše 1150 g
Škrob 0,348 0,868 Nejvýše 5,35 g
Vápník 6 1,6 Alespoň 30 g
Fosfor 2,8 3,5 Nejvýše 44 g
Sodík 0,2 1,4 Přibližně 7 g
CENA 1,80 1,60
Každé hříbě musí v krmné dávce denně dostat alespoň 2 kg ovsa Průměrná cena včetně dopravy činí 1, 80 Kč za 1 kg sena a 1, 60 Kč za 1 kg ovsa Sestavte denní dávku krmení pro jedno hříbě tak, aby náklady byly minimální.
Předchozí dva příklady šlo řešit pouze graficky, vyznačením oblasti v rovině R2, která je určena danými omezeními, a potom snadno
133
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
3.4. Optimalizační lineárni modely. Ve vedlejším sloupci jsme tuto kapitolu začali problémy natěračů. Budeme v ^ / tom pokračovat. Představme si, že náš velice speciali-zovaný natěrač v černobílém světě je ochoten natírat fasády buď malých rodinných domků nebo naopak velikých veřejných budov a že pochopitelně používá jen černou a bílou barvu. Může si zcela volně vybírat, v jakém rozsahu bude dělat x jednotek plochy prvého typu nebo y jednotek druhého. Předpokládejme však, že jeho maximální pracovní zátěž je ve sledovaném období L jednotek plochy, jeho čistý výnos (tj. po odečtení nákladů) je na jednotku plochy c\ u malých domků a c2 u veřejných staveb. Zároveň má k dispozici maximálně W kg bílé a B kg černé barvy. Konečně na jednotku plochy rodinného domu potřebuje w i kg bílé barvy a b\ kg černé, zatímco u veřejných staveb jsou to hodnoty w2 ab2.
Když si to celé shrneme do (ne)rovnic, dostáváme omezení
(3.1)
(3.2)
(3.3)
x\ + X2 < L w\x\ + w2x2 < W b\x\ + ž>2X2 < B.
Celkový čistý výnos natěrače
h(x\,x2) — c\x\ + c2x2
bychom přitom rádi měli co největší.
Každá z uvedených nerovnic samozřejmě zadává v rovině proměnných (xi,x2) polorovinu, ohraničenou přímkou zadanou příslušnou rovnicí, a jistě musíme také předpokládat, že jak x\ tak X2 jsou nezáporná reálná čísla, protože záporné velikosti ploch natěrač neumí. Ve skutečnosti máme tedy omezení na hodnoty (xi, x2), které může být buď nesplnitelné neboje dáno jako vnitřek mnohoúhleníku s maximálně pěti vrcholy, viz obrázek.
Obecně hovoříme o problému lineárního programování, jestliže hledáme buďmaximum nebo minimum lineární formy h na Rn na množině ohraničené pomocí systému lineárních nerovnic, kterým říkáme lineární omezení. Vektoru na pravé straně pak říkáme vektor omezení, lineární formě h také účelová funkce.
Formulace s nerovnostmi < u omezujících podmínek, nezápornými proměnnými a maximalizaci účelové funkce říkáme standardní maximalizační problém. Naopak, standardní minimalizační problém je hledání minima účelové funkce při omezujících podmínkách s nerovnostmi >, přičemž opět uvažujeme nezáporné proměnné.
Je snadné nahlédnout, že každý obecný problém lineárního programování lze převést na kterýkoliv ze standardních. Kromě změn znamének můžeme ještě pracovat s rozdělením případných proměnných bez omezení znaménka na rozdíl dvou kladných. Bez újmy na obecnosti se tedy budeme dále věnovat jen standardnímu maximalizačnímu problému.
Jak takový problém řešit? Hledáme maximum lineární formy h na podmnožinách M vektorového prostoru, které jsou zadány lineárními nerovnostmi, tj. v rovině pomocí průniku polorovin, obecně budeme v další kapitole hovořit o poloprostorech. Všimněme si, že každá lineární forma na reálném vektorovém prostoru h : V -> R (tj. libovolná lineární skalární funkce) v každém vybraném směru buď stále roste nebo stále klesá. Přesněji řečeno, jestliže vybereme pevný počáteční vektor u e V a „směrový" vektor v e V, pak složením naší formy h s parametrizací
nalezneme na její hranici bod, ve kterém nabývá zadaná funkce maxima (je to „nejvzdálenější" bod dané oblasti ve směru největšflio růstu dané funkce, tedy normály k nadrovině zadané koeficienty optimalizované funkce).
Jde vlastně o obecnější pozorování. Pokud máme zadánu nějakou lineární funkci W -» W, f(x\, ..., x„) = c0 + cixi + • • • x„ (říkejme ji dále účelová funkce) tak se její hodnota v bodech A = [«!,..., a„] a B = A + u = [«!+«!,...,«„+«„] liší díky linearitě o hodnotu f (A — B) = f (u) = f(u\, ..., un) = c\U\ + • • • cnun, což je skalární součin vektorů (ci,c„) a (u\, u„). Ze vztahu skalárního součinu a kosinu odchylky dvou vektorů vidíme, že zadaná lineární funkce definuje ve vektorovém prostoru M." nadrovinu (s normálou (ci, ..., ci) rozdělující prostor M." na dva poloprostory takové, že zkoumaná funkce ve směru libovolného vektoru z jednoho poloprostoru roste, ve směru libovolného vektoru z druhého poloprostoru klesá. Jde vlastně o stejný princip, se kterým jsme se setkali u rozhodování o viditelnosti dané úsečky v rovině (určili jsme, jestli pozorovací bod leží na pravo, či na levo od ní, viz 1.35).
Toto pozorování pak vede k algoritmickému postupu hledání extrému účelové funkce na množině omezené lineárními nerovnostmi.
Algoritmus pracuje pro úlohu v tzv. standardním tvaru maximalizovat funkci c\X\-\-----\-c„ na množině Ax = b. Do tohoto tvaru lze libovolnou úlohu o hledání extrému účelové funkce na množině Ax < b snadno převést (násobením nerovnosti číslem (-1) můžeme měnit znaménko nerovnosti, pronásobením číslem (-1) účelové funkce rovněž můžeme změnit minimalizační problém na maximalizační, přidáním nové nezáporné proměnné k jedné nerovnici pak můžeme změnit nerovnici na rovnici).
Zápis algoritmu pomocí tabulky: mějme úlohu maximalizovat cixi + • • • cnxn na množině v M." dané rovnicemi Ax = b, a nerovnicemi x j > 0, kde A = (a^), 1 < j < n, 1 < i < m, b = (b\, ..., bm). Zadání přepíšeme do tabulky takto:
-Cl ■ 0
an a\n bi
a„i b„
Pokud se nám podaří v matici A nalézt m sloupců takových, že eliminací odpovídající podmatice mxm vůči vhodně vybraným prvkům, dosáhneme toho, že vybrané sloupce budou tvořit (ve vhodném pořadí) jednotkovou matici, můžeme zahájit výpočet (uvidíme, že při zadání úlohy ve tvaru Ax < b, kde b je nezáporné toho lze snadno docílit).
Dále postupujeme v následujících krocích: Vybereme první sloupec zleva, který má na prvním řádku nekladný prvek. V tomto sloupci
134
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
dostaneme
t h-> h(u + t v) = h(u) + t h(v).
Tento výraz je skutečně s rostoucím parametrem t vždy buď rostoucí nebo klesající, případně konstantní (podle toho, zdaje h (v) kladné nebo záporné, případně nulové).
Jistě tedy musíme očekávat, že problémy podobné tomu s natěračem budou buď nesplnitelné (když je množina zadaná omezením prázdná) nebo bude výnos neohraničený (když omezení zadají neomezenou část celého prostoru a forma h v některém z neomezených směrů bude nenulová) nebo budou mít maximální řešení v alespoň jednom z „vrcholů" množiny M (přičemž zpra-
Tady vsunout rámeček vidla půjde o jediný vrchol, může ale jít o konstatní maximální
aigoritmSh'odkaz honotu na části horanice oblasti M).
apod.
3.5. Formulace pomocí lineárních rovnic. Ne vždy je nalezení optima tak snadné jako v předchozím případě. Problém může zahrnovat velmi mnoho proměnných a velmi mnoho omezení a jen rozhodnout, zda je množina M splnitelných bodů neprázdná je problematické.
Nemáme tu prostor na úplnou teorii, zmíníme ale alespoň dva směry úvah, které ukazují, že ve skutečnosti bude řešení naleznu-telné vždy podobně, jako tomu bylo v dvojrozměrném problému v předchozím odstavci.
Začneme srovnáním se systémy lineárních rovnic - těm už totiž rozumíme dobře. Zapišme si rovnice (3.1)—(3.3) vektorově v obecném tvaru:
A ■ x < b,
kde x je nyní n-rozměrný vektor, b je m-rozměrný vektor a A odpovídající matice a nerovností myslíme jednotlivé nerovnosti po řádcích. Maximalizovat chceme součin c ■ x pro daný řádkový vektor koeficientů lineární formy h. Jestliže si pro každou z rovnic přidáme jednu pomocnou proměnnou a ještě si primyslíme proměnnou z jako hodnotu Unární formy h, můžeme celý problém přepsat jako systém lineárních rovnic
kde matice je složena z bloků o\ + n + m sloupcích a 1 + m řádcích a tomu odpovídají jednotUvé komponenty vektorů. Dodatečně přitom požadujeme pro všechny souřadnice X i xs nezápornost.
Pokud tedy má daný systém rovnic řešení, hledáme v této množině řešení takové hodnoty proměnných z, x a xs, aby všechna x byla nezáporná a z maximální možné. K diskusi, jak to obecně může dopadat se vrátíme z pohledu afinní geometrie v odstavci 4.11 na straně 207.
Konkrétně v našem problému černobílého natěrače bude systém Unárních rovnic vypadat takto:
(z\
/l -ci -c2 0 0 o\ Xl
0 1 1 1 0 0 x2 L
0 w\ w2 0 1 0 x3 W
\o bi b2 0 0 v X4 w w
vybereme z kladných čísel to číslo x, pro které je poměr čísla ve stejném řádku a nejpravějším sloupci ku x minimální. Eliminujeme celý sloupec této tabulku podle čísla x, říkejme mu pivot (tzn. elementárními řádkovými transformacemi dané tabulky dosáhneme toho, že ve vybraném sloupci bude číslo 1 na místě x, jinak samé nuly). Ukažme si postup na konkrétním příkladu:
■y — 2z, za podmínek x, y, z > 0 a
3.3. Minimalizujte funkci — 3x
x - y + z, > 4 2x + z < 3
x + y + 3z < 8
Řešení. Vynásobením účelové funkce a první nerovnice číslem —1 dostáváme ekvivalentní úlohu maximalizovat funkci 3x + y + 2z za podmínek
+ y
—X
2x x
+ +
z z
3z
<
<
<
4 3
+ y
Zavedením nezáporných proměnných u, v, w dostáváme již tabulku (účelová funkce je3x + y+2z + 0- w + 0- i; + 0- w):
-3 -1 -2 0 0 0 0
- 1 1 -1 1 0 0 4
2 0 1 0 1 0 3
1 1 3 0 0 1 8
Nyní vybereme první sloupec tabulky, ve kterém je v prvním řádku záporné číslo (tedy celkově první sloupec tabulky) a v něm vybereme řádek s dvojkou (u řádků s kladnou hodnotou porovnáváme velikosti čísel | a f, vybereme řádek odpovídající menší hodnotě). V dalším eUminujeme první sloupec podle prvku 2 (vynásobíme třetí řádek číslem \, a odečteme jeho vhodné násobky od ostatních tak, aby v nich zůstaly v prvním sloupci samé nuly; nezapomínáme na první řádek tabulky):
0 -1 1 2 0 3 2 0 9 2
0 1 1 2 1 1 2 0 11 2
1 0 1 2 0 1 2 0 3 2
0 1 5 2 0 1 2 1 13 2
Nyní vybíráme z druhého sloupce a podle již aplikovaného pravidla vybereme první řádek (— < y), pivotem tedy bude jednička ve druhém řádku i sloupci tabulky. Eliminujeme podle ní:
135
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
3.6. Dualita v lineárním programování. Uvažujme reálnou matici Asm řádky a n sloupci, vektor omezení b a řádkový vektor c zadávající účelovou funkci. Z těchto dat můžeme |x sestavit dva problémy lineárního programování pro x e R"
a y e Rm.
Maximalizační problém: Maximalizuj cx za podmínky A x < b a zároveň x > 0.
Minňnalizační problém: Minimalizuj yT -b za podmínky yT ■ A > cT a zároveň y > 0.
Říkáme, že tyto problémy jsou vzájemně duální. K odvození dalších vlastností problémů lineárního programování zavedeme trochu terminologie.
Řekneme, že jde o idxřešitelný problém, jestliže existuje nějaký přípustný vektor x, který vyhoví všem omezujícícm podmínkám. Řešitelný maximalizační, resp. minimalizační problém je ohraničený, jestliže je účelová funkce na množině vyhovující omezením ohraničená shora, resp. zdola.
Lemma. Je-li x e R" přípustný vektor pro standarní maximalizační problém a y e Rm je přípustný vektor pro duální minimalizační problém, pak pro účelové fuknce platí
c ■ x < yT ■ b
Důkaz. Jde vlastně jen o snadné pozorování: x > 0 a cT < yT ■ A, ale také y >Q a A ■ x ci-
Důkaz. Předpokládejme, že platí oba vztahy z předpokladu implikace ve větě. Pak tedy můžeme v následujím výpočtu počítat s rovnostmi, protože sčítance s ostrou nerovností mají stejně u sebe nulové koeficienty:
0 0 -1 1 2 0 10
0 1 1 2 1 1 2 0 11 2
1 0 1 2 0 1 2 0 3 2
0 0 3 -1 -1 1 1
Pivotem bude nyní číslo 3 ve třetím sloupci a čtvrtém řádku:
0 0 0 2 3 5 3 1 3 31 3
0 1 0 5 6 1 3 1 6 17 3
1 0 0 1 6 2 3 1 6 4 3
0 0 1 1 3 1 3 1 3 1 3
Z výsledné tabulky odečteme řešení (hodnoty v pravém sloupci udávají hodnoty neznámých, zastoupených v Jednotkové podmatici", pokud se proměnná v podmatici nevyskytuje, je její hodnota nulová
to ovšem není tento případ): x\
4 Y
17 r
31
r. Maximální
hodnota účelové funkce na zadané množině je pak — (můžeme ji vyčíst v pravém horním rohu tabulky).
Z tabulky lze vyčíst i řešení duální úlohy, totiž minimalizovat Au+ 3 v + Sw za podmínek
u + 2v + w < 3
—u + w > 1 Hodnota tohoto minima je totiž
u + v + 3w > 2 dle věty o dualitě (3.7) také —, odpovídající hodnoty proměnných odečteme v horním řádku tabulky ve sloupcích odpovídajích neznámým u, v, w, tedy ve sloupcích 4, 5 a 6: u = |, v = |, w = |. Není těžké si rozmyslet, že pro tři čísla aí4, aí5, ai6 v prvním řádku tabulky a zmíněných sloupcích a hodnotu h v pravém horním rohu tabulky platí v průběhu výpočtu neustále 4úti4 + 3oi5 + 8ai6 = h. (čísla v prvním řádku zmíněných sloupců totiž udávají, kolikrát byl řádek odpovídající doplňkové proměnné přičten k prvnímu, tedy nejpravější hodnota v prvním řádku bude odpovídající lineární kombinací nejpravějších hodnot ostatních řádků). □
3.4. Špetka teorie her. Uvažme hru, kterou mezi sebou hrají dva hráči, burzián a osud. Burzián chce investovat do zlata, stříbra, diamantů či do akcií významné softwarové firmy. Jsou známy zisky či ztráty těchto investic v posledních čtyř letech (pro jednoduchost výpočtu uvažujeme pouze poslední čtyři roky a zapišme je do matice A = (oy)):
zlato stříbro diamanty Ovoce
200A 2% 1% 4% 3%
200B 3% -1% -2% 6%
200C 1% 2% 3% -4%
200D -2% 1% 2% 3%
136
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
m n
i — l i — l j—l i — l j—l
a z stejného důvodu také
m n n
v/"//v; = X/>v/-
í = l 7=1 7=1
Tím máme dokázánu jednu implikaci z tvrzení díky větě o dualitě.
Předpokládejme nyní, že x a y jsou skutečně optimální vektory. Víme tedy, že platí
X v//'< - EE^'^'1/ - X/vv>
Z = l i = l 7=1 7=1
ale zároveň jsou si levé a pravé strany rovny. Nastává tedy všude rovnost. Přepíšeme-li prvou rovnost jako
m y n \
Xv'(/'/ X"';V;) =°
Z = l V 7=1 7
vidíme, že může být naplněna jen za podmínek ve větě, protože jde o nulový součet samých nezáporných čísel. Z druhé rovnosti stejně plyne i druhé zbylé tvrzení a důkaz je ukončen. □
Věty o dualitě a ekvilibriu jsou užitečné při řešení problémů lineárního programování, protože nám ukazují souvislosti mezi nulovostí jednotlivých dodatečných proměnných a naplňování omezujících podmínek.
3.8. Poznámky o lineárních modelech v ekonomii. Náš velice schematický problém černobílého natěrače z odstavce 3.4 můžeme použít jako ilustraci jednoho z typických ekonomických modelů, tzv. model plánování výroby. Jde přitom o zachycení problému jako celku, tj. se zahrnutím vnitřních i vnějších vztahů. Levé strany rovnic (3.1), (3.2), (3.3) i účelové funkce h(x\,x2) jsou vyjádřením různých výrobních vztahů. Podle povahy problému pak jsou požadovány na pravé straně buď přesné hodnoty (pak řešíme systém rovnic) nebo požadujeme kapacitní omezení a optimalizaci účelu (a pak dostáváme právě problémy lineárního programování).
Můžeme tak tedy obecně řešit problém alokace zdrojů při dodavatelských omezeních a přitom buď minimalizovat náklady nebo maximalizovat zisk. Z tohoto pohledu lze také nahlížet dualizaci problémů. Jestliže by náš natěrač chtěl hypoteticky nastavit svoje náklady spojené se svojí prací y^, bílou barvou yw a černou barvou ys, pak bude chtít minimalizovat účelovou funkci
L -yL + Wyw + ByB
při omezujících podmínkách
yl + w\yw +b\yB > ci
yl + w2yw + b2yB > c2.
To je právě duální problém k původnímu a hlavní věta 3.7 říká, že optimální stav je takový, kdy účelové funkce mají stejnou hodnotu.
V ekonomických modelech najdeme mnoho modifikací. Jednou z nich jsou úlohy finančního plánování, související s optimalizací portfolia. Určujeme přitom objemy investic do jednotlivých investičních variant s cílem držet se daných omezení na rizika a
Burzián chce investovat na jeden rok. Jak má rozložit svůj vklad, aby si zaručil maximální možný zisk bez ohledu na to, jak se situace na burze vyvine? (Předpokládáme, že následující rok bude nějakým pravděpodobnostním mixem čtyř předchozích let. Ve hře tedy osud zahraje nějaký pravděpodobnostní vektor (xi, x2, x3, x4), burzián zvolí pravděpodobnostní vektor (y\, y2,y3, y^) odpovídající rozdělení jeho vkladu. Výhra burziána je pak Z~ľ! j=i xiyjaij-)
Řešení. Problém úlohy je najít pravděpodobnostní vektor iy\,y2,y^,yA), který maximalizuje minimum ze všech hodnot E?,7=i xiyjau Pro (Ji> y2, yi, yri pevné a (xi, x2, x3, x4) libovolný pravděpodobnostní vektor.
Velmi bystrý čtenář si rozmyslí, že tento problém je ekvivalentní problému maximaUzovat zi + z,2 + z,3 + za za podmínky ATz < (\,... ,\)T, z > 0, (hledaný pravděpodobnostní vektor y pak dostaneme pravděpodobnostním normováním vektoru z). 1
Řešme tedy tuto úlohu Lineárního programování. Zavedme pomocné proměnné w\, w2, w3, W4 a úlohu převedeme do standardního tvarumax{zi+z2+Z3+Z4l(Ar|£'4)(z, w) = (1, 1, 1, l)r} azapíšeme do tabulky:
-1 -1 -1 -1 0 0 0 0 0
2 3 1 -2 1 0 0 0 1
1 -1 2 1 0 1 0 0 1
4 -2 3 2 0 0 1 0 1
3 6 -4 3 0 0 0 1 1
0 3 2 1 4 1 2 0 0 1 4 0
0 4 1 2 -3 1 0 1 2 0 1 2
0 1 2 5 4 1 2 0 1 1 4 0 3 4
1 1 2 3 4 1 2 0 0 1 4 0 1 4
0 15 2 25 4 3 2 0 0 3 4 1 1 4
0 0 3 2 1 5 0 0 1 10 1 5
0 0 17 6 19 5 1 0 1 10 15 11 30
0 0 5 6 3 5 0 1 3 10 1 15 23 30
1 0 1 3 3 5 0 0 1 5 1 15 4 15
0 1 5 6 1 5 0 0 1 10 2 15 1 30
^oto je klíčová úvaha v proslulé von Neumannově větě, která říká, že pravděpodobnostní rozšíření libovolné maticové hry má rovnovážnou situaci.
137
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
optimalizovat přitom zisk, resp. při očekávaném objemu minimalizovat rizika.
Dalším obvyklým modelem jsou marketingové aplikace, např. alokace nákladů na reklamy v různých médiích nebo umísťování reklam do časových termínů. Omezujícími podmínkami bude disponibilní rozpočet, rozložení cílových skupin apod.
Velmi obvyklé jsou modely výživových problémů, tj. návrh ná-vek různých komponent výživy s daným složením a omezujícími požadavky na celkové objemy výživových látek.
Problémy lineárního programování se objevují při personálních úlohách, kdy jsou pracovníci s různými kvalifikacemi a dalšími předpoklady rozdělováni do směn. Obvyklé jsou také problémy směšování, problémy dělení a problémy distribuce zboží.
2. Diferenční rovnice
Diferenčními rovnicemi jsme se stručně zabývali již v první kapitole, byť pouze těmi prvního řádu .Nyní si ukážeme obecnou teorii pro lineární rovnice s lŕ konstantními koeficienty, která poskytuje nejen ■tu, velmi praktické nástroje, ale je také pěknou ilustrací pro koncepty vektorových podprostorů a lineárních zobrazení.
| Homogenní lineární diferenční rovnice řádu k
3.9. Definice. Homogenní lineární diferenční rovnice řádu k je dána výrazem
a0x„ + a\xn-\ H-----h akx„-k = 0, a0 / 0 ak / 0,
kde koeficienty a; jsou skaláry, které mohou případně i záviset na n.
Říkáme také, že taková rovnost zadává homogenní lineární rekurenci řádu k a často zapisujeme hledanou posloupnost jako funkci
= /(«) =
fli ak -f(n-D-------/(«■
k).
«0 «0
Řešením této rovnice nazýváme posloupnost skalárů x,, pro všechna; e N, případně; e Z, které vyhovují rovnici s libovolným pevným n.
Libovolným zadáním k po sobě jdoucích hodnot x; jsou určeny i všechny ostatní hodnoty jednoznačně. Skutečně, pracujeme nad polem skalárů, takže hod-noty flo i ak jsou invertibilní a proto z definičního vztahu lze vždy spočíst hodnotu x„ ze známých ostatních hodnot a stejně tak pro xn-k. Indukcí tedy okamžitě dokážeme, že lze jednoznačně dopočíst všechny hodnoty jak pro kladná tak pro záporná celá n.
Prostor všech nekonečných posloupností x; je vektorový prostor, kde sčítání i násobení skaláry je dáno po složkách. Přímo z definice je zjevné, že součet dvou řešení homogenní lineární rovnice nebo skalární násobek řešení je opět řešení. Stejně jako u homogenních systémů lineárních tedy vidíme, že množina všech řešení je vektorový podprostor.
Počáteční podmínka na hodnoty řešení je dána jako k-rozměrný vektor v K*. Součtu počátečních podmínek odpovídá součet příslušných řešení a obdobně se skalárními násobky. Dále si všimněme, že dosazením nul a jedniček do zadávaných
0 0 0 - 188 85 9 17 0 4 85 7 85
0 0 1 - 114 85 6 17 0 3 85 16 85 11 85
0 0 0 146 85 5 17 1 23 85 19 85 56 85
1 0 0 89 85 2 17 0 18 85 11 85 19 85
0 1 0 78 85 5 17 0 11 85 2 85 12 85
188 89 0 0 0 25 89 0 44 89 17 89
114 89 0 1 0 18 89 0 21 89 2 89 37 89
- 146 89 0 0 0 9 89 1 55 89 1 89 26 89
85 89 0 0 1 10 89 0 18 89 11 89 19 89
78 89 1 0 0 17 89 0 5 89 8 89 30 89
Závěrečná tabulka již je optimální, neboť v prvním řádku se vyskytují jenom nezáporné hodnoty. Z tabulky odečteme optimální řešení úlohy: x2 = ||, x3 = ||, x4 = ^,xi =0. Optimální hodnota je pak
X\ -\- X2 ~\~ X3 -\- X4
II. Po přeškálování na pravděpodobnostní vektor (vynásobením hodnotou || dostáváme řešení původní úlohy: y\ = 0, y 2 = §, y i = f|, y 4 = f s optimální hodnotou §f.
□
B. Rekurentní rovnice
Různé Lineární závislosti mohou být dobrým nástrojem pro popsání rozličných modelů růstu. Začněme s velmi populárním populačním modelem, který využívá Lineární diferenční rovnici druhého řádu:
3.5. Fibonacciho posloupnost. Na začátku jara přinesl čáp na Louku dva čerstvě narozené zajíčky, samečka a samičku. Samička je schopná od dvou měsíců stáří povít každý měsíc dva «21 malé zajíčky (samečka a samičku). Nově narození zajíci plodí potomky po jednom měsíci a pak každý další měsíc. Každá samička je březí jeden měsíc a pak opět porodí samečka a samičku. Kolik párů zajíců bude na louce po devíti měsících (pokud žádný neuhyne a žádný se tam „nepřistěhuje")?
Řešení. Po uplynutí prvního měsíce je na louce pořád jeden pár, nicméně samička zabřezne. Po dvou měších se narodí první potomci, takže na louce budou dva páry. Po uplynutí každého dalšího měsíce se narodí (tedy přibude) tolik zajíců, kolik zabřezlo zaječic před měsícem, což je přesně tolik, kolik bylo před měsícem párů schopných mít potomka, což je přesně tolik, kolik bylo párů před dvěma měsíci. Celkový počet p„ zajíců po uplynutí n-tého měsíce tak je tak součtem počtů
138
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
počástečních k hodnot snadno získame k lineárně nezávislých řešení naší rovnice. Jakkoliv jsou tedy zkoumané vektory nekonečné posloupnosti skalárů, samotný prostor všech řešení je konečněrozměrný, předem víme, že jeho dimenze bude rovna řádu rovnice k, a umíme snadno určit bázi všech těchto řešení. Opět hovoříme o fundamentálním systému řešení a všechna ostatní řešení jsou právě jejich lineární kombinace.
Jak jsme si již ověřili, vybereme-li k po sobě jdoucích indexů i, i + 1,..., i + k — 1, zadává homogenní lineární diferenční rovnice lineární zobrazení Kk -> K°° ^-rozměrných vektorů počástečních hodnot do nekonečně rozměrných poslouností týchž skalárů. Nezávislost různých takových řešení je ekvivalentní nezávislosti počátečních hodnot, ale tu umíme snadno rozpoznat pomocí determinantu. Máme-li &-tici řešení (x^1],..., x[f]), pak jde o nezávislá řešení právě, když následující determinant, tzv. Ca-soratián je nenulový pro jedno (a pak už všechna) n
c(41],...,4i])
ju
*"« + !
ln+k-l
r[k]
ln + l
Jk]
ln+k-l
/o
3.10. Řešení homogenních rekurencí s konstantními koeficienty. Těžko bychom hledali univerzální postup, jak hledat řešení obecných homogenních lineárních diferenčních rovnic, tj. přímo spočítatelný výraz pro obecné řešení x„.
V praktických modelech ale velice často vystupují rovnice, kde jsou koeficienty konstantní. V tomto přípdě se daří uhodnout vhodnou formu řešení a skutečně se nám podaří najít k lineárně nezávislých možností, ■feť^-i- Tím budeme mít problém vyřešený, protože všechny ostatní budou jejich lineární kombinací.
Pro jednoduchost začneme rovnicemi druhého řádu. Takové potkáváme obzvlášť často v praktických problémech, kde se vyskytují vztahy závisející na dvou předchozích hodnotách. Lineární diferenční rovnicí druhého řádu s konstantními koeficienty (resp. lineární rekurencí druhého řádu s konstantními koeficienty) tedy rozumíme předpis
(3.4)
f(n + 2) = a-f(n + l) + b-f(n) + c,
kde a,b,c jsou známé skalární koeficienty.
Např. v populačních modelech můžeme zohlednit, že jedinci v populaci dospívají a pořádně se rozmnožují až o dvě období později (tj. přispívají k hodnotě f(n + 2) násobkem b ■ f (n) s kladným b > 1), zatímco nedospělí jedinci vysílí a zničí část dospělé populace (tj. koeficient a pak bude záporný). Navíc si je třeba někdo pěstuje a průběžně si ujídá konstantní počet c < 0 v každém jednotlivém období.
Speciálním takovým příkladem s c — Oje např. Fibonacciho posloupnost čísel y0, yi, . . ., kde yn+2 — y„+i + y„.
Jestliže při řešení matematického problému nemáme žádný nový nápad, vždy můžeme zkusit, do jaké míry funguje známé řešení podobných úloh. Zkusme proto dosadit do rovnice (3.4) s koeficientem c — 0 podobné řešení jako u rovnic lineárních, tj. f(n) — X" pro nějaké skalární X. Dosazením dostáváme
X
n+2
párů v předchozích dvou měsících. Pro počet párů zajíců na louce tedy dostáváme homogenní lineární rekuretni formuli
(3.1)
Pn+2 — Pn + l + Pn,
1,
která spolu s počátečními podmínkami p\ = 1 a p2 = 1 jednoznačně určuje počty párů zajíců na louce v jednotlivých měsících. Linearita formule znamená, že všechny členy posloupnosti (pn) jsou ve vztahu v první mocnině, rekurence je snad jasná a homogenita značí, že v předpisu chybí absolutní člen (viz dále pro nehomogenní formule). Pro hodnotu rc-tého členu můžeme odvodit explicitní formuli. V hledaní formule nám pomůže pozorování, že pro jistá r je funkce r" řešením diferenční rovnice bez počátečních podmínek. Tato r získáme tak, že dosadíme do rekurentního vztahu:
yn+2
r2
r"+1 +r" a po vydělení f dostaneme r + 1,
což je tzv. charakteristická rovnice daného rekurentního vztahu. Naše
rovnice má kořeny
i-Vš „ i+Vš
a tedy posloupnosti a„
(±^)"a
t>n = 0^2^-)", n > 1, vyhovují danému vztahu. Vztah také splňuje jejich libovolná tzv. lineární kombinace, tedy posloupnost c„ = san + tb„, s,t € R. Čísla s a t můžeme zvolit tak, aby výsledná kombinace splňovala dané počáteční podmínky, v našem případě c\ = 1, c2 = 1. Pro jednoduchost je vhodné navíc ještě dodefinovat nultý člen posloupnosti jako cq = 0 a spočítat saíz rovnic pro cq a c\. Zjistíme,
ze s
(3.2)
i
Vš
Pn
a tedy
(1 + 75)" - (1 - V5)"
2"(V5)
Takto zadaná posloupnost splňuje danou rekurentní formuli a navíc počáteční podmínky c0 = 0, c\ = 1, jedná se tedy o tu jedinou posloupnost, která je těmito požadavky zadána. Všimněte si, že hodnota vzorce (|| 3.21|) je celočíselná pro libolné přirozené n (zadává totiž celočíselnou Fibonacciho posloupnost), i když to tak na první pohled nevypadá. □
3.6. Zjednodušený model chovám hrubého národního produktu.
Uvažujme diferenční rovnici
(3.3)
yk+2 - a(l + b)yk+i + abyk = 1,
■ aX
n + l
■ bXn = Xn(X2 -aX-b) =0.
kde yk je národní produkt v roce k. Konstanta a je takzvaný mezní sklon ke spotřebě, což je makroekonomický ukázali, který udává jaký zlomek peněz, které mají obyvatelé k dispozici, utratí, a konstanta b popisuje, jak závisí míra investic soukromého sektoru na mezním sklonu ke spotřebě.
139
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
Tento vztah bude platit buď pro X — 0 nebo při volbě hodnot
A, =
— (a + V«2 +
4b),
1
A 9 = — (fl
2
Va2 + 4ž>).
Zjistili jsme tedy, že skutečně opět taková řešení fungují, jen musíme vhodně zvolit skalár X. To nám ale nestačí, protože my chceme najít řešení pro jakékoliv počáteční hodnoty /(O) a /(l), a zatím jsme našli jen dvě konkrétní posloupnosti splňující danou rovnici (a nebo dokonce jen jednu, pokud je X2 — X1).
Jak jsem již dovodili i u zcela obecných lineárních rekurencí, součet dvou řešení f\(n) a f2(11) naší rovnice f(n+2)—a-f(n + 1) — b ■ f (n) — 0 je zjevně opět řešením téže rovnice a totéž platí pro konstatní násobky řešení. Naše dvě konkrétní řešení proto poskytují daleko obecnější řešení
f(n) = CXX\ + C2X"2
pro libovolné skaláry C\ a C2 a pro jednoznačné vyřešení konkrétní úlohy se zadanými počátečními hodnotami / (0) a / (1) nám zbývá jen najít příslušné konstanty C\ a C2. (A také si musíme ujasnit, zda to pro všechny počáteční hodnoty půjde).
3.11. Volba skalárů. Ukažme si, jak to může fungovat alespoň na jednom příkladě. Soustředíme se přitom na problém, že kořeny charakteristického polynomu nevychází obecně ve stejném oboru skalárů, jako jsou koeficienty v rovnici. Řešme tedy problém:
1
(3.5)
yn+2 — yn+i
yo -2,yi- 0.
V našem případě je tedy X i_2 — 5(1 ± \/Š) a zjevně
yo
Ci+C2 = 2
yi
Íc1(l + V3) + Íc2(l-v/3)
je splněno pro právě jednu volbu těchto konstant. Přímým výpočtem C\ — l — ^\/3, C2 — 1 + \\ľ$ a naše úloha má jediné řešení
f(n) = (1 - ^/3)^(1 + VŠ)" + d + ^/3)^(1 - V3)".
Všimněme si, že i když nalezená řešení pro rovnice s celočíselnými koeficienty vypadají složitě a jsou vyjádřena pomocí iracionálních (případně komplexních) čísel, o samotném řešení dopředu víme, že je celočíselné též. Bez tohoto „úkroku" do většího oboru skalárů bychom ovšem obecné řešení napsat neuměli.
S podobnými jevy se budeme potkávat velice často. Obecné řešení nám také umožňuje bez přímého vyčíslování konstant diskutovat kvalitativní chování posloupnosti čísel / (n), tj. zda se budou s rostoucím n blížit k nějaké pevné hodnotě nebo budou oscilovat v nějakém rozsahu nebo utečou do neomezených kladných nebo záporných hodnot.
3.12. Obecný případ homogenních rekurencí. Zkusme nyní stejně jako v případě druhého řádu dosadit volbu x„ — X" pro nějaký (zatím neznámý) skalár X do obecné homogenní rovnice z definice 3.9. Dostáváme pro každé n podmínku
X"-k(a0Xk
■ fli X'
k-l
+ ak) = 0
Předpokládáme dále, že velikost národního produktu je normována tak, aby na pravé straně rovnice vyšlo číslo 1.
Spočítejte konkrétní hodnoty pro a = |, b = |, y0 = 1, yi = 1.
Řešení. Nejprve budeme hledat řešení homogenní rovnice (pravá strana nulová) ve tvaru . Číslo r musí být řešením charakteristické rovnice
1
x2 — a(l + b)x + ab = 0, tj. x2 — x +
0,
která má dvojnásobný kořen \. Všechna řešení homogenní rovnice jsou potom tvaru a{^)n + bn(^)n.
Dále si všimněme, že najdeme-li nějaké řešení nehomogenní rovnice (tzv. partikulární řešení), tak pokud k němu přičteme libovolné řešení homogenní rovnice, obdržíme jiné řešení nehomogenní rovnice. Lze ukázat, že takto získáme všechna řešení nehomogenní rovnice.
V našem případě (tj. pokud jsou všechny koeficienty i nehomogenní člen konstantami) je partikulárním řešením konstanta y„ = c. Dosazením do rovnice máme c — c + \c = 1, tedy c = 4. Všechna řešení diferenční rovnice
1
yk+2 - yk+i + - ■ yk
1
jsou tedy tvaru 4 + au)" + bn(^)n. Požadujeme yo
yi
1 a tyto
dvě rovnice dávají a = b je
y n =Ĺ
- 3, tedy řešení naší nehomogenní rovnice
3n
,2/ \2y
Opět, protože víme, že posloupnost zadaná touto formulí splňuje danou diferenční rovnici a zároveň dané počáteční podmínky, jedná se vskutku o tu jedinou posloupnost, která je těmito vlastnostmi charakterizována. □ V předchozím příkladu jsme použili tzv. metodu neurčitých koeficientů. Ta spočívá v tom, že na základě nehomogenního členu dané diferenční rovnice „uhodneme" tvar partikulárního řešení. Tvary partikulárních řešení jsou známy pro celou řadu nehomogenních členů. Např. rovnice
(3.4)
yn+k + aiyn+k_i -\-----h akyn = Pm(n),
kde P (m) je polynom stupně n a příslušná charakteristická rovnice má reálné kořeny má (skoro vždy) partikulární řešení tvaru Qm (n), Qm (n) je polynom stupně m.
Další možnou způsobem řešení je tzv. medota variace konstant, kdy nejprve najdeme řešení
k
y(n) = ^Cifiin)
i=\
140
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
což znamená, že buď X — 0 neboje X kořenem tzv. charakteristického polynomu v závorce. Charakteristický polynom ale už není závislý na n.
Předpokládejme, že má charakteristický polynom k různých kořenů X\,..., Xk. Můžeme za tímto účelem i rozšířit uvažované pole skalárů, např. Q na M nebo R na C, protože výsledkem výpočtu pak stejně budou řešení, která opět zůstanou v původním poli díky samotné rovnici. Každý z kořenů nám dává jedno možné řešení
xn — (Xi)" ■
Abychom byli uspokojeni, potřebujeme k lineárně nezávislých řešení.
K tomu nám postačí ověřit nezávislost dosazením k hodnot pro n — 0,..., k — 1 pro k možností Xi do Casoratiánu viz 3.9. Dostaneme tak tzv. Vandermondovu matici a je pěkným (ale ne úplně snadným) cvičením spočíst, že pro všechna k a jakékoliv &-tice různých Xi je determinant takovéto matice nenulový, viz příklad ||2.24|| na straně 86. To ale znamená, že zvolená řešení jsou lineárně nezávislá.
Nalezli jsme tedy fundamentální systém řešení homogenní diferenční rovnice v případě, že všechny kořeny jejího charakteristického polynomu jsou po dvou různé.
Uvažme nyní násobný kořen X a dosaďme do definiční rovnice předpokládané řešení xn — nXn. Dostáváme podmínku
aonX" + • • • + ak(n — k)Xn
0.
Tuto podmínku je možné přepsat pomocí tzv. derivace polynomu (viz ?? na straně ??), kterou značíme apostrofem:
X(a0Xn + ■
■ akX )
0
a hned na začátku kapitoly páté uvidíme, že kořen polynomu / je vícenásobný právě, když je kořenem i jeho derivace /'. Naše podmínka je tedy splněna.
Při vyšší násobnosti £ kořenu charakteristického polynomu můžeme postupovat obdobně a využijeme skutečnosti, že £-násobný kořen je kořenem všech derivací polynomu až do £ — 1 včetně. Derivace přitom postupně vypadají takto:
+ akX
n—k
f(X) = a0X"
f'(X) = a0nX"~l H-----h ak(n - k)X
f"CX)
n—k — l
zhomogenizované rovnice a poté uvažujeme konstanty q jako funkce Ci (n) proměnné n a hledáme partikulární řešení dané rovnice ve tvaru
y(n) = ^Ci(n)fi(n).
Ukažme si na obrázku hodnoty /) pro i < 35 a rovnicí f(n) = 9-f(n - 1) - 3-f(n - 2) + 1 /(O) = /(l) = 1.
0,9-
0,85;
0,8; 0,75:
0,7-
» • '„„„•"""•o*'
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I
5 10 15 20 25 30 35
a0n(n-l)X"-2+- ■ ■ +ak(n-k)(n-k-l)X"-k-2
Dále si procvičme, jak řešit lineární diferenční rovnice druhého řádu s konstantními koeficienty. Posloupnost vyhovující dané rekurentní rovnici druhého řádu je dána jednoznačně, pokud zadáme navíc nějaké dva její sousední členy. Znovu si povšimněme dalšího využití komplexních čísel: pro určení expUcitního vzorce pro n-tý člen posloupnosti reálných čísel můžeme potřebovat výpočty s čísly komplexními (to nastává tehdy, pokud má charakteristický polynom dané diferenční rovnice komplexní kořeny).
3.7. Nalezněte explicitní vzorec pro posloupnost vyhovující následující lineární diferenční rovnici s počátečními podmínkami:
Xnjr2 = 2.Xn -\- řZ, X\ = 2, X2 = 2.
.(n-l)Xn-1-1 + ak(n — k) ...
(n-k- £)Xn
-k-l-l
Podívejme se na případ trojnásobného kořenu X a hledejme řešení ve tvaru n2Xn. Dosazením do definiční podmínky dostaneme rovnost
a0n2X" + ---+ak(n- k)2X"~k = 0.
Zjevně je levá strana rovna výrazu X2f"(X) + Xf'(X) a protože je X kořenem obou derivací, je podmínka splněna.
Indukcí snadno dokážeme, že i obecnou podmínku pro hledané řešení ve tvaru x„ —nlXn,
a0nlXn + ...ak(n- k)lXn~k = 0,
Řešení. Zhomogenizovaná rovnice je
Xn _|_2 = 2xn.
Její charakteristický polynom je x2 — 2, jeho kořeny jsou ±V2. Řešení zhomogenizované rovnice je tedy tvaru
a(V2)n + b(-V2)n, pro libovolné a,b eR.
Partikulární řešení budeme hledat metodou neurčitých koeficientů. Nehomogenní část dané rovnice je lineární polynom n, partikulární řešení proto budeme nejprve hledat ve tvaru lineárního polynomu
141
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
dostaneme jako vhodnou lineární kombinaci derivací charakteristického polynomu začínající výrazem
a dostali jsme se tedy blízko k úplnému důkazu následující:
Věta. Každá homogenní lineární diferenční rovnice řádu k nad libovolným číselným oborem K obsaženým v komplexních číslech K má za množinu všech řešení k-rozměrný vektorový prostor generovaný posloupnostmi xn — nlXn, kde X jsou (komplexní) kořeny charakteristického polynomu a mocniny l probíhají všechna přirozená čísla od nuly až do násobnosti příslušného kořenu X.
Důkaz. Výše použité vztahy násobnosti kořenů a derivací uvidíme později, a nebudeme tu dokazovat tvrzení, že každý komplexní polynom má právě tolik kořenů, včetně násobnosti, jaký má stupeň. Zbývá tedy ještě dokázat, že nalezená &-tice řešení je lineárně nezávislá. I v tomto případě lze induktivně dokázat nenulovost příslušného Casoratiánu, jako jsme odkazovali u případu Vander-mondova determinantu výše.
Pro ilustraci postupu ukážeme, jak výpočet vypadá pro případ jednonásobného kořenu X\ a dvojnásobného kořenu X2 charakteristického polynomu:
C(X"X"nX") =
x-
X\+l
x"+2
k2
n + l
4+2
X
(n (n
nX\
f l)Xn+l f 2)Xn+2
_ ^n^2n
— k\k2
1 n -i 2n k\k2
_ } n -i 2n
- ~k\k2
1
Xx k\
1
x2 x\
1
n
(n (n
1) X2
2) X2
X\ — X2
Al(Aj -X2)
X\ — X2
Al(Aj -X2)
n
X2
X2 X2
= xn1xln+1(xl
V obecném případě vedeme příslušného Casoratiánu indukcí.
podobně důkaz
X2)z ŕ 0.
nenulovosti
□
3.13. Reálné báze řešení. Pro rovnice s reálnými koeficienty povedou reálné počáteční podmínky vždy na reálná řešení. Přesto ale budou příslušná fundamentální řešení z právě odvozené věty často existovat pouze v oboru komplexním.
Zkusme proto najít jiné generátory, se kterými se nám bude pracovat lépe. Potože jsou koeficienty charakteristického polynomu reálné, každý jeho kořen bude buď také reálný nebo musí kořeny vystupovat po dvou komplexně združených.
Jestliže si řešení popíšeme v goniometrickém tvaru jako
X" = \X\" (cos ncp + i sinncp)
X" = \X\" (cos ncp — i sinncp),
okamžitě je vidět, že jejich součtem a rozdílem dostáváme jiná dvě lineárně nezávislá řešení
x„ = \X\" cosncp, yn — \X\n sinncp.
Difereční rovnice se velmi často vyskytují jako model dynamiky nějakého systému. Pěkným tématem na přemýšlení je proto souvislost absolutních hodnot jednotlivých kořenů a stabilizace řešení, buď všech nebo v závislosti na počátečních podmínkách.
v proměnné n, tedy kn + l, kde k, l e R. Dosazením do původní rovnice dostáváme
k(n + 2) + l = 2(kn +l)+n.
Porovnáním koeficientů u proměnné n na obou stranách rovnice dostáváme vztah k = 2k + 1, tedy k = — 1, porovnáním absolutních členů pak vztah 2k + l = 21, tedy l = —2. Celkem je tedy partikulárním řešením je posloupnost —n — 2.
Řešení dané nehomogenní diferenční rovnice druhého řádu bez počátečních podmínek jsou tedy tvaru a(V2)n + b(—\pľ)n — n — 2, a, b e R.
Nyní dosazením do počátečních podmínek určíme neznámé a, b e R. Pro početní jednoduchost použijeme malého triku: z počátečních podmínek a daného rekurentního vztahu vypočteme člen xq : xq = \ (x2 — 0) = 1. Daný rekurentní vztah spolu s podmínkami x0 = 1 a x\ = 1 pak zřejmě splňuje tatáž posloupnost, která splňuje původní počáteční podmínky. Máme tedy následující vztahy pro a, b:
x0: a(V2)° + b(-V2)° - 2 = 1, tedya + 6 = 3, x\ : V2a — V2b = 5,
jejichž řešením dostáváme a = 6+5/2, b = 6 54^2. Řešením je po-
sloupnost
,„ = ^l(^r + ^!(-^)»-„-2.
□
3.8. Určete reálnou bázi prostoru řešení homogenní diferenční rovnice
-"-«+4 = -"-«+3 -"-«+1 -*•«>
Řešení. Charakteristický polynom dané rovnice je x4 — x3 — x + 1. Hledáme-li jeho kořeny, řešíme reciprokou rovnici
x4 - x3 - x + 1 = 0
Standardním postupem nejprve vydělíme rovnici výrazem x2 a poté zavedeme substituci t = x + tedy t2 = x2 + + 2. Obdržíme rovnici
i1 - t-2 = 0,
s kořeny t\ = — 1, t2 = 2. Pro obě tyto hodnoty neznámé t pak řešíme zvlášť rovnici danou substitučním vztahem:
1
x + - = -1.
x
142
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
Nepůjdeme zde do podrobností, protože teprve v páté kapitole budeme probírat pojem konvergence hodnot k nějaké hodnotě hmitní apod., jistě je tu ale prostor pro zajímavé numerické experimenty např. s oscilacemi vhodných populačních nebo ekonomických modelů.
3.14. Nehomogenní lineární diferenční rovnice. Stejně jako u systémů lineárních rovnic můžeme dostat všechna řešení nehomogenních lineárních diferenčních rovnic
■ a* («)*„-* = b(n),
+ i& = cos(2tt/3) +
a0(n)xn +ai(n)xn.
kde koeficienty a; a b jsou skaláry, které mohou záviset na n, a flo(n) ak(n) / 0.
Postupujeme tak, že najdeme jedno řešení a přičteme celý vektorový prostor dimenze k řešení odpovídajících systémů homogenních. Skutečně takto dostáváme řešení a protože je rozdíl dvou řešení nehomogenní rovnice zjevně řešením homogenní, dostáváme takto řešení všechna.
U systému lineárních rovnic se mohlo stát, že nemusel vůbec mít řešení. To u našich diferenčních rovnic možné není. Zato ale bývá nesnadné nalézt to jedno potřebné partikulární řešení nehomogenního systému, pokud je chování skalárních koeficientů v rovnici složité. U lineárních rekurencí je to podobné.
Omezíme se tu na jediný případ, kdy příslušný homogenní systém má koeficienty konstantní a b(n) je polynom stupně s. Řešení pak lze hledat ve tvaru polynomu
x„ — ao + a\n + • • • + asns
s neznámými koeficienty ai, i — 1,..., s. Dosazením do diferenční rovnice a porovnáním koeficientů u jednotlivých mocnin n dostaneme systém s + 1 rovnic pro s + 1 proměnných a;. Pokud má tento systém řešení, našli jsme řešení našeho původního problému. Pokud řešení nemá, může stačit zvětšit stupeň s hledaného polynomu.
Např. rovnice x„ —x„ _2 — 2 nemůže mít konstantní řešení, ale dosazením x„ — ao + a\n dostáváme řešení a\ — 1 (a koeficient ao může být libovolný) a proto je obecné řešení naší rovnice
x„ = Ci + C2(-1)" +«■
dopMt odkaz na Všimněme si, že skutečně matice příslušného systému rovnic pro příklady ve vedlejším polynom nižšího stupně nula je nulová a rovnice 0 • an — 2 nemá
sloupci, snad tam je i t v ✓ diskuse řešitelnosti řešení, pomocí variace konstant...
3.15. Lineární filtry. Uvažujme nyní nekonečné posloupnosti
x = (.
i X-n + \,
, X-l, XQ, X\,
.)
a budeme, podobně jako u systémů lineárních rovnic, pracovat s operací T, která zobrazí celou posloupnost x na posloupnost z — Tx se členy
z„ — aoxn + a\xn-\ + • • • + flj;X„_j-.
S posloupnostmi x můžeme opět pracovat jako s vektory vzhle-f „ dem ke sčítání i násobení skaláry po složkách. Pouze bude tento velký vektorový prostor nekonečněrozměrný. Naše zobrazení T je zjevně lineárním zobrazením na takovém ^ ' vektorovém prostoru.
Ta má dva komplexní kořeny x\ = —\ , * 2 i sin(27r/3) a x2 = — \ — i^- = cos(27r/3) — i sin(27r/3). Pro druhou hodnotu neznámé t dostáváme rovnici
1
x + - = 2
x
s dvojnásobným kořenem 1. Celkem je tedy bazí hledaného vektorového prostoru posloupností, které jsou řešením dané diferenční rovnice, následující čtveřice posloupností: {—5 +' ^} £L i, {—\— i^}^L\, {IJ^Lí (konstantní posloupnost) a {n}™=l. Hledáme-li však reálnou bázi, musíme nahradit dva generátory (posloupnosti) z této báze s komplexními hodnotami generátory reálnými. Protože tyto generátory jsou geometrické řady, jejichž libovolné členy jsou komplexně sdružená čísla, můžeme vzít jako vhodné generátory posloupnosti dané polovinou součtu, resp. polovinou /-násobku rozdílu, daných komplexních generátorů. Takto dostaneme následující reálnou bázi řešení: {1}^ (konstantníposloupnost), {n}^=l, {cos(n-2Tc/3)}^=l, {únin-lTc/^)}^^.
□
3.9. Najděte posloupnost, která vyhovuje nehomogenní diferenční rovnici s počátečními podmínkami:
xn+2
-\- 2xn -\- 1, X\ — 2, x2
Řešení. Obecné řešení zhomogenizované rovnice je tvaru a(—l)n + b2". Partikulárním řešením je konstanta —1/2. Obecné řešení dané nehomogenní rovnice bez počátečních podmínek je tedy
1
fl(-l)" +b2
Dosazením do počátečních podmínek zjistíme konstanty a = —5/6, b = 5/6. Dané rovnici s počátečními podmínkami tedy vyhovuje posloupnost
■-(-1)" + -2""1 - -. 6 3 2
□
3.10. Určete posloupnost reálných čísel, která vyhovuje následující nehomogenní diferenční rovnici s počátečními podmínkami:
2x„+2 — ~xn + \ + xn + 2,
Xi
2, x2 = 3.
Řešení. Obecné řešení zhomogenizované rovnice je tvaru a(—l)n + b(l/2)n. Partikulárním řešením je konstanta 1. Obecné řešení dané nehomogenní rovnice bez počátečních podmínek je tedy
a(-l)n+b(^\ +1.
143
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
Posloupnosti si představme jako diskrétní hodnoty nějakého signálu, odečítané zpravidla ve velmi krátkých časových jednotkách, operace T pak může být filtrem, který signál zpracovává. Bude nás zajímat, jak odhadnout vlastnosti, které takový „filtr" bude mít.
Signály jsou velice často ze své podstaty dány součtem několika částí, které jsou samy o sobě víceméně periodické. Z naší definice je ale zřejmé, že periodické posloupnosti x„, tj. posloupnosti splňující pro nějaké pevné přirozené číslo p
Dosazením do počátečních podmínek zjistíme konstanty a = í,b = 4. Dané rovnici s počátečními podmínkami tedy vyhovuje posloupnost
(-l)"+4(i
+ 1.
□
3.11. Řešte následující diferenční rovnici:
Xn+p — Xn
Xn+4 — xn+3 ~ xn+2 + xn
+ 1
budou mít i periodické obrazy z — T x
Zn+p — ClOxn+p + d\Xn-\+p + ' ' ' + dkXn-k+p
= aox„ + a\xn-\ H-----h akXn-k = z„
se stejnou periodou p.
Pro pevně zvolenou operaci T nás bude zajímat, které vstupní periodické posloupnosti zůstanou přibližně stejné (případně až na násobek) a které budou utlumeny na nulové hodnoty.
Ve druhém případě tedy hledáme jádro našeho lineárního zobrazení T. To je ale dáno právě homogenní diferenční rovnicí
a0x„ + a\xn-\ -\-----h akx„-k = 0, a0 / 0 ak / 0,
kterou jsme se už naučili řešit.
3.16. Špatný equalizer. Jako příklad uvažujme velmi jednoduchý lineární filtr zadaný rovnicí
Řešení. Z teorie víme, že prostor řešení této diferenční rovnice bude čtyřdimenzionální vektorový prostor, jehož generátory zjistíme z kořenů charakteristického polynomu dané rovnice. Charakteristická rovnice je
-4 -J ' -L x + 1 = 0.
■ x3 + x2
Jedná se o reciprokou rovnici (to znamená, že koeficienty u (n—k)-té a k-té mocniny x,k = 1, ..., n, jsou shodné). Zavedeme tedy substituci u = x + i. Po vydělení rovnice x2 (nula nemůže být kořenem) a substituci (všimněte si, že x2 + j% = u2 — 2) dostáváme
2 1 1 2 x — x + 1---1—- = u — u — 1=0.
x x2
Dostáváme tedy neznámé u i _2 1=0 určíme čtyři kořeny
i±yš
Odtud pak z rovnice x2 — ux +
X\, 2,3,4
1 ± y/5± V-10±2V5
Zn — (TX)n — X^-j-2 ~t~ Xn.
Výsledky takového zpracování signálu jsou naznačeny na ¥£r~:^f>~' se zvyšující frekvenci periodického signálu
' ^Í^f^-<' v" = cos ( Xn-k+l)
všech hodnot od aktuální až po poslední, kterou ještě v našem lineárních filtru zpracováváme. V jednom časovém intervalu (ve vzorkovací frekveci audio signálu mimořádně krátkém) pak přejdeme ke stavovému vektoru
Yn+\ — (xn
-k+l),
kde první hodnota xn+\ — a\xn-\-----h a^Xn-k+i je spočtena jako
u homogenních diferenčních rovnic, ostatní si jen posunujeme o jednu pozici a poslední zapomeneme. Příslušná čtvercová matice řádu k, splňující Yn+\ — A ■ Y„, bude vypadat takto:
(a\ a2 • Clk\
1 0 . 0 0
A = 0 1 0 0
U 0 . 1 o-/
Pro takovou jednoduchou matici jsme si odvodili explicitní postup pro úplné řešení otázky, jak vypadá formule pro řešení. Obecně to tak snadno nepůjde ani pro velice podobné systémy. Jedním z typických případů je studium dynamiky populací v různých biologických systémech.
3.12. Určete explicitní vyjádření posloupnosti vyhovující diferenční rovnici xn+2 = 2xn+\ — 2xn se členy x\ = 2, x2 = 2.
Řešení. Kořeny charakteristického polynomu x2 — 2x + 2 jsou 1 + i a 1 — i. Báze (komplexního) vektorového prostoru řešení je tedy tvořena posloupnostmi y„ = (1 + /)" a z„ = (1 — /)"■ Hledanou posloupnost můžeme vyjádřit jako lineární kombinaci těchto poslopností (s komplexními koeficienty). Je tedy x„ = a ■ yn + b ■ z,„, kde a = a\ + ia2, b = b\ +ib2. Z rekurentního vztahu dopočteme xq = \(2x\ —x2) = 0 a dosazením « = 0a« = ldo uvažovaného vyjádření x„ dostáváme
1 = xq = ci\ + ia2 + b\ + ib2
2 = xi = (ai + ia2)(\ + i) + (bi + ib2){\ - i),
a porovnáním reálné a komplexní složky obou rovnic dostáváme lineární soustavu čtyř rovnic o čtyřech neznámých
CL\ + b\ = 1
a2+b2 = 0
ai — a2 + b\ + b2 = 2
ai + a2 — b\ + b2 = 0
s resenim a\ = b\ = b2 = j a a2 posloupnost vyjádřit jako 1 1
1/2. Celkem můžeme hledanou
(-- -i)(l + i)" + (i + ii)(l-0".
Posloupnost můžeme však vyjádřit i pomocí reálné báze (komplexního) vektorového prostoru řešení, totiž posloupností u„ = \{yn + zn) = (V2> cos(-) a vn = \i(z„ - y„) = (72)" sin(-). Matice
přechodu od komplexní báze k reálné je
i _ I r
inverzní matice je T 1 = y. ^.j, pro vyjádření posloupnosti xn pomocí reálné báze, tj. souřadnice (c, d) posloupnosti xn v bázi {un, vn j pak máme
= T~
máme tedy alternativní vyjádření posloupnosti x„, ve kterém se nevyskytují komplexní čísla (ale zase jsou v něm odmocniny):
x„ = (V2rcos(^) + (V2rsin(^),
které jsme samozřejmě mohli získat též řešením dvou lineárních rovnic o dvou neznámých c, d, totiž 1 =x0 = c ■ w0 + d ■ v0 = c a
2 = x\ = c • u\ + d • v\ = c + d. □
145
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
Všimněme si také, že vcelku pochopitelně má matice A za charakteristický polynom právě
p(X) = Xk -aiXk~l
jak snadno dovodíme pomocí rozvoje podle posledního sloupce a rekurencí. To je vysvětlitelné i přímo, protože řešení x„ — X", X / 0, vlastně znamená, že matice A vynásobením převede vlastní vektor (Xk,..., X)T na jeho A-násobek. Musí být tedy takové X vlastním číslem matice A.
3.18. Leslieho model růstu populací. Představme si, že zkoumáme nějaký systém jednotlivců (pěstovaná zvířata, hmyz, buněčné kultury apod.) rozdělený do m skupin, třeba podle stáří, fází vývoje hmyzu apod. Stav X„ je tedy dán vektorem
Xn — (u\,..., um)T
závisejícím na okamžiku t„, ve kterém systém pozorujeme. Lineární model vývoje takového systému je dán maticí A dimenze n, která zadává změnu vektoru X„ na
Xn+\ — A ■ X„
při přírůstku času z t„ na f„+i.
Uvažujme jako příklad tzv. Leslieho model růstu, ve kterém vystupuje matice
A =
jejíž parametry jsou svázány s vývojem populace rozdělené do m věkových skupin tak, že f i označuje relativní plodnost příslušné věkové skupiny (ve sledovaném časovém skoku vznikne z N jedinců v i—té skupině fiN jedinců nových, tj. ve skupině první), zatímco ti je relativní úmrtnost i-té skupiny během jednoho období. Pochopitelně lze použít takový model s libovolným počtem věkových skupin.
Všechny koeficienty jsou tedy nezáporná reálná čísla a čísla t; jsou mezi nulou a jedničkou. Všimněme si, že pokud jsou všechna t rovna jedné, jde vlastně o lineární rekurenci s konstantními koeficienty a tedy buď exponenciálním růstem/poklesem (pro reálné kořeny X charakteristického polynomu) nebo oscilováním spojeným s případným růstem či poklesem (pro komplexní kořeny).
Než se pustíme do obecnější teorie, trochu si pohrajeme s tímto konkrétním modelem.
Přímým výpočtem pomocí Laplaceova rozvoje podle posledního sloupce spočteme charakteristický polynom pm (X) matice A pro model s m skupinami:
pm(X) = \A- XE\ = -Xpm-iiX) + (-l)m-lfmxi ... xm—\.
Vcelku snadno dovodíme indukcí, že tento charakteristický polynom má tvar
(fl h h ■ fm — 1 f m ^
0 0 . 0 0
0 0 . 0 0
0 0 0 0
0 0 .
3.13. Dokažte, že každý člen posloupnosti zadané rekurentním vztahem
x„ = 2x„_i + 8x„_2 — 9, n > 2 se členy x\ = 1, x2 = 25, je druhou mocninou přirozeného čísla. O
3.14. Určete explicitní vyjádření posloupnosti vyhovující diferenční rovnici xn+2 = 3xn+i + 3xn se členy x\ = 1 a x2 = 3. O
3.15. Určete explicitní vzorec pro n-tý člen jediné posloupnosti {xn}%Li vyhovující následujícím podmínkám:
X„_|_2 — xn + \ — xn i i x\ — 1; x2 — 5.
O
3.16. Určete explicitní vzorec pro n-tý člen jediné posloupnosti {xn}%Li vyhovující následujícím podmínkám:
xn+3 — 2x„_|_2 + 2x„_|_i +X„, X\ — 1, X2 — 1, X3 — 1.
O
3.17. Určete explicitní vzorec pro n-tý člen jediné posloupnosti ixn}^Li vyhovující následujícím podmínkám:
xn+3 — 3x„+2 + 3xn + \ + X„, X\ — 1, X2 — 1, X3 — 1.
C. Populační modely
O
Pm(X) = (-l)m(X"
■ fli X
m — l
Populační modely, kterými se budeme zabývat, budou rekurentní vztahy ve vektorových prostorech. Neznámou veličinou tedy nebude posloupnost čísel nýbrž posloupnost vektorů. Roli koeficientů pak budou hrát matice. Začneme s jednoduchým (dvourozměrným) příkladem.
3.18. Spoření. S kamarádem spoříme na společnou dovolenou následujícím způsobem. Na začátku dám 10 EUR a on 20 EUR. Každý další měsíc pak dá každý z nás tolik, co minulý měsíc plus polovinu toho, co dal ten druhý z nás předchozí měsíc. Kolik budeme mít za rok dohromady naspořeno? Kolik peněz budu platit dvanáctý měsíc?
Řešení. Obnos peněz, který budu platit n-tý měsíc já označím x„ a to, co bude platit kamarád označím y„. První měsíc tedy dáme x\ = 10, y\ = 20. Pro další platby můžeme psát rekurentní rovnice:
xn + l = xn ~\~
yn + l = y n + 2X"
Pokud označíme společný vklad z,„ = xn+yn, pak sečtením uvedených rovnic dostaneme vztah zn+\ = z„ + \zn = \zn- To je geometrická
146
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
s vesměs nezápornými koeficienty a\,..., am, pokud j sou všechny prametry t; a f i kladné. Např. je vždy
— f m Ti . . . Xm — i.
Zkusme kvalitativně odhadnout rozložení kořenů polynomu pm. Bohužel, detaily budeme umět přesně vysvětlit a ověřit až po absolvování příslušných partií tzv. matematické analýzy v kapitole páté a později, přesto by ale postup měl být intuitivně jasný. Vyjádříme si charakteristický polynom ve
pm(X) = ±Xm(l-q(X))
kde q(X) — a\X~l + • • • + amX~m je ostře klesající a nezáporná funkce pro X > 0. Evidentně bude proto existovat právě jedno kladné X, pro které bude q(X) — la tedy také pm (X) — 0. Jinými slovy, pro každou Leslieho matici existuje právě jedno kladné reálné vlastní číslo.
Pro skutečné Leslieho modely populací bývají všechny koeficienty ti i f j mezi nulou a jedničkou a typicky nastává situace, kdy jediné reálné vlastní číslo Xi je větší nebo rovno jedné, zatímco absolutní hodnoty ostatních vlastních čísel jsou ostře menší než jedna.
Jestliže začneme s libovolnýmn stavovým vektorem X, který bude dán jako součet vlastních vektorů
X — X\ H----+ Xm
s vlastními hodnotami Xt, pak při iteracích dostáváme
Ak ■ X
x\X\ + ... XkmXn
takže za předpokladu, že \Xi\ < 1 pro všechna ;' > 2, budou všechny komponenty ve vlastních podprostorech velmi rychle mizet, kromě kompomenty X\X\.
Rozložení populace do věkových skupin se tak budou rychle blížit poměrům komponent vlastního vektoru k dominantnímu vlastnímu číslu X\.
Například pro matici (uvědomme si význam jednotlivých koeficientů, jsou převzaty z modelu pro chov ovcí, tj. hodnoty r zahrnují jak přirozený úhyn tak případné aktivity chovatelů na jatkách)
( ° 0.2 0.8 0.6 o\
0.95 0 0 0 0
A = 0 0.8 0 0 0
0 0 0.7 0 0
l o 0 0 0.6 0/
vyjdou vlastní hodnoty přibližně
1.03, 0, -0.5, -0,27 + 0.74;, -0.27-0.74;
s velikostmi 1.03, 0, 0.5, 0.78, 0.78 a vlastní vektor příslušný dominantnímu vlastnímu číslu je přibližně
XT = (30 27 21 14 8).
Zvolili jsme rovnou jediný vlastní vektor se součtem souřadnic rovným stu, zadává nám proto přímo výsledné procentní rozložení populace.
Pokud bychom chtěli místo tříprocentního celkového růstu populace setrvalý stav a předsevzali si ujídat více ovce třeba z druhé věkové skupiny, řešili bychom úlohu, o kolik máme zmenšit t2, aby bylo dominantní vlastní číslo rovno jedné.
řada a dostáváme tedy z„ = 3.(|)" .Za rok budeme mít celkem naspořeno z\ +Z2+- • • +Zi2- Tento částečný součet umíme lehce spočítat
3 3 (-V2 - 1
Zi(l + ^ + --- + y11) = 30-4-r
7725.
Za rok tedy dohromady naspoříme více než 7724 euro.
Rekurentní soustavu rovnic popisující systém spoření můžeme napsat pomocí matice následovně
1 f \ / x,
xn + l
Kyn+\) ~ \\ i) \yn/
Jde tedy opět o geometrickou řadu. Jejími prvky jsou teď ovšem vektory a kvocient není skalár, ale matice. Řešení lze nicméně najít obdobně
JCfj \ ( J_ ~ \ í \
Mocninu matice působící na vektor (xi,yi) můžeme nalézt, když vyjádříme tento vektor v bázi vlastních vektorů. Charakteristický polynom matice je (1 — A)2 - j - 0a vlastní čísla jsou tedy ki _2 = \,\-Příslušné vlastní vektory jsou po řadě (1, 1) a (1, —1). Pro počáteční vektor (x\,y\) = (10, 20) spočítáme
15
a proto
To znamená, že já zaplatím 12. měsíc
3V"1 (1
IV"1 / i
x\2
1297
2) \2,
eur a můj kamarád v podstatě stejně. □
Poznámka. Předchozí příklad lze řešit i bez matice následujícím přepsáním rekuretní rovnice: x„+1 = x„ + \yn = \xn + \^z,„.
Předcházející příklad byl vlastně modelem růstu (v daném případě růstu množství naspořených peněz). Nyní přejděme k modelům růstu popisujícím primárně růst nějaké populace. Leslieho model růstu, který jsme detailně rozebrali v teorii, velmi dobře popisuje nejen populace ovcí (podle kterých byl sestaven), ale uplatňuje se například i při modelování následujích populací:
3.19. Zajíci podruhé. Ukažme si, jak můžeme Leslieho modelem popsat populaci zajíců na louce, kterou jsme se zaobírali v příkladu (|| 3.51|). Uvažujme, že zajíci umírají po dovršení devátého měsíce věku (v původním modelu byl věk zajíců neomezen). Označme počty zajíců (resp. zaječic) podle stáří v měsících v čase t (měsíců) jako x\(t), x2(t),..., x9(t), tak počty zajíců v jednotlivých věkových skupinách
147
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
tady by se hodilo trochu historie, vlastně jen naznačíme část výsledku Perrona, k Frobeniově obecnější situaci se vůbec nedopracujeme.
3.19. Matice s nezápornými prvky. Reálné matice, které nemají žádné záporné prvky mají velmi speciální vlastnosti. Zároveň jsou skutečně časté v praktických modelech. Naznačíme proto teď proto tzv. Perronovu-Frobeniovu teorii, která se právě takovým maticím věnuje.
Začneme definicí několika pojmů, abychom mohli naše úvahy vůbec formulovat.
Kladné a primitivní matice
budou po jednom měsíci x\(t + 1) = x2(t) + x3(t) + ■ ■ ■ + x9(t), Xi(t + 1) = Xi-i(t), pro i = 2,3,..., 10, neboli
Definice. Za kladnou matici budeme považovat takovou čtvercovou matici A, jejíž všechny prvky jsou reálné a ostře kladné. Primitivní matice je pak taková čtvercová matice A, jejíž nějaká mocnina Ak je kladná.
Ai(ř + 1)\ ŕ 1 1 1 1 1 1 1 Al(ř)\
x2(ř + l) 1 0 0 0 0 0 0 0 0 x2(ř)
x3(ř + l) 0 1 0 0 0 0 0 0 0 x3(ř)
x4(ř + 1) 0 0 1 0 0 0 0 0 0 x4(ř)
x5(ř + l) = 0 0 0 1 0 0 0 0 0 x5(ř)
x6(ř + l) 0 0 0 0 1 0 0 0 0
x7(ř + l) 0 0 0 0 0 1 0 0 0 x7(ř)
x8(r + l) 0 0 0 0 0 0 1 0 0 HO)
\x9(ř + l)/ Vo 0 0 0 0 0 0 1 0/ \x9(ř)/
Připomeňme, že spektrálním poloměrem matice A nazýváme maximum absolutních hodnot všech jejích (komplexních) vlastních čísel. Spektrálním poloměrem lineárního zobrazení na (konečněrozměrném) vektorovém prostoru rozumíme spektrální
2
poloměr jeho matice v některé bázi. Normou matice A e Rn nebo vektoru x e Rn rozumíme součet absolutních hodnot všech jejich prvků. U vektorů x píšeme pro jejich normu \x\.
Následující výsledek je mimořádně užitečný a snad i dobře srozumitelný. Jeho důkaz se svou náročností dosti vymyká této učebnici, uvádíme ale alespoň jeho stručný nástin. Pokud by čtenář měl problém s plynulým čtení nástinu důkazu, doporučujeme jej přeskočit.
Věta (Perronova). Jestliže je A primitivní matice se spektrálním poloměrem k e R, pak je k jednoduchým kořenem charakteristického polynomu matice A, který je ostře větší než absolutní hodnota kteréhokoliv jiného vlastního čísla matice A. K vlastnímu číslu k navíc existuje vlastní vektor x s výhradně kladnými prvky x;.
Náznak důkazu. V důkazu se budeme opírat o intuici ele-^\ mentární geometrie. Částečně budeme použité koncepty upřesňovat už v analytické geometrii ve čtvrté kapitole, některé analytické aspekty budeme studovat podrobněji v kapitolách páté a později, přesné důkazy některých analytických kroků v této učebnici nepodáme vůbec. Snad budou následující úvahy nejen osvětlovat dokazovaný teorém, ale budou také samy o sobě motivací pro naše další studium geometrie i matematické analýzy. Začneme docela srozumitelně znějícím pomocným lemmatem:
Lemma. Uvažme libovolný mnohostěn P obsahující počátek 0 e R". Jestliže nějaká iterace lineárního zobrazení \j/ '■ R" —>• R" zobrazuje P do jeho vnitřku, pak je spektrální poloměr zobrazení iff ostře menší než jedna.
Uvažme matici A zobrazení ý ve standardní bázi. Protože vlastní čísla Ak jsou k-té mocniny vlastních čísel matice A, můžeme rovnou bez újmy na obecnosti předpokládat, že samotné zobrazení ý již zobrazuje P do vnitřku P. Zjevně tedy nemůže mít ý žádnout vlastní hodnotu s absolutní hodnotou větší než jedna.
Důkaz dále povedeme sporem. Předpokládejme, že existuje vlastní hodnota k s \k\ — 1. Máme tedy dvě možnosti. Buď je Xk — 1 pro vhodné k nebo takové k neexistuje.
Obrazem P je uzavřená množina (to znamená, že pokud se body v obrazu budou hromadit k nějakému bodu y vRn, bude y
Charakteristický polynom uvedené matice je k9 — k1 — k6 — k5 — k4 — t k3 —k2 — k—1. Kořeny této rovnice nejsme schopni explicitně vyjádřit, X jeden z nich však velmi dobře odhadnout, ki = 1, 608 (proč musí být menší než (VŠ + l)/2)?). Populace bude tedy podle tohoto modelu růst přibližně s geometrickou řadou 1, 608ř.
3.20. Jezírko. Mějme jednoduchý model jezírka, ve kterém žije populace bílé ryby (plotice, ouklej, podoustev, ostroretka atd.). Předpokládáme, že druhého roku se dožije 20 % rybího plůdku a od tohoto stáří už jsou ryby schopny se reprodukovat. Z mladých ryb přežije z druhého do třetího roku přibližně 60 % a v dalších letech je už úmrtnost zanedbatelná. Dále předpokládáme, že roční přírůstek nových plůdků je třikrát větší než počet ryb (schopných reprodukce).
Tato populace by evidentně jezírko brzy přeplnila. Rovnováhu chceme dosáhnout nasazením dravé ryby, např. štiky. Předpokládejme, že jedna štika sní ročně asi 500 dospělých bílých ryb. Kolik štik pak
inspirováno materiálem
^irasíme do jezírka nasadit, aby populace stagnovala?
users .m^th.umd .edu/
mmb/Řeserf. Pokud označíme p počet plůdku, m počet mladých ryb a r počet dospělých ryb, pak je stav populace v dalším roce popsán následovně:
'p\ í 3m + 3r m I I 0, 2p r l \0, 6m + rr/
kde 1 — r je relativní úmrtnost dospělé ryby způsobená štikou.
Příslušná matice popisující tento model je tedy
0 3 3N 0,2 0 0 0 0, 6 r,
Pokud má populace stagnovat, pak musí mít tato matice vlastní hodnotu 1. Jinými slovy, jednička musí být kořenem charakteristického polynomu této matice. Ten je tvaru k2(r —k)+0, 36—0, 6.(r— k) = 0. To znamená, že r musí splňovat
r - 1 + 0,36-0, 6(r - 1) = 0 0, 4r - 0, 04 = 0
Do dalšího roku tedy může přežít jen 10 % z dospělých ryb a zbytek by měla sníst štika. Označíme-li hledaný počet štik x, pak dohromady
148
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
opět v obrazu) a hranici P tento obraz vůbec neprotíná. Nemůže tedy mít i/r pevný bod na hranici P ani nemůže existovat žádný bod na hranici, ke kterému by se mohly libovolně blížit body v obrazu. První argument vylučuje, že by nějaká mocnina X byla jedničkou, protože to by takový pevný bod na hranici P jistě existoval. Ve zbývajícím případě jistě existuje dvourozměrný podprostor W C M", na nějž se i/r zužuje coby rotace o iracionální argument a jistě existuje bod y v průniku W s hranicí P. Pak by ale byl bod y libo volně přesně přiblížen body z množiny \jr (y) při průchodu přes všechny iterace a tedy by musel sám být také v obrazu. Došli jsme tedy ke sporu a lemma je ověřeno.
Nyní se dáme do důkazu Perronovy věty. Naším prvním krokem bude ověření existence vlastního vektoru, který má všechny prvky kladné. Uvažme za tím účelem tzv. standardní simplex
S — {x — (jci, ..., xn)J', \x\ — 1, Xi > 0, i — 1, ..., n}.
Protože všechny prvky v matici A jsou nezáporné, obraz A-x bude mít samé nezáporné souřadnice stejně jako x a alespoň jedna z nich bude vždy nenulová. Zobrazení x i-> | A ■ x\~l (A ■ x) proto zobrazuje S do sebe, Toto zobrazení S -> S splňuje všechny předpo-uríitě budeme chtít mít jjja(jy tzv Browerovy věty o pevném bodě a proto existuje vektor
později v analýze neco J J J ľ ľ J
víc o větách o pevném y e S takový, že je tímto zobrazením zobrazen sám na sebe. To
bodě. Tady dplníme ✓ v
odkazu ale znamená, ze
A ■ y — X y, X — \ A ■ y\
a našli jsme vlastní vektor, který leží v S. Protože ale má nějaká mocnina Ak podle našeho předpokladu samé kladné prvky a samozřejmě je také Ak ■ y — Xky, všechny souřadnice vektoru y jsou ostře kladné (tj. leží ve vnitřku S) a X > 0.
Abychom dokázali zbytek věty, budeme uvažovat zobrazení zadané maticí A ve výhodnější bázi a navíc ho vynásobíme konstantou A-1:
B = X~l(Y~l ■ A-Y),
kde ľ je diagonální matice se souřadnicemi y i právě nalezeného vlastního vektoru y na diagonále. Evidentně je B také primitivní matice a navíc je vektor z — (l, ■ ■ ■ ,l)T jejím vlastním vektorem, protože zjevně Y ■ z — y.
Jestliže nyní dokážeme, že [i — 1 je jednoduchým kořenem charakteristického polynomu matice B a všechny ostatní kořeny mají absolutní hodnotu ostře menší nezjedná, bude Perronova věta dokázána.
K tomu se nám teď bude hodit dříve dokázané pomocné lemma. Uvažujme matici B jako matici lineárního zobrazení, které zobrazuje řádkové vektory
(«1, ...,u„)
u ■ B
v,
tj. pomocí násobení zprava. Díky tomu, že je z — (1,..., 1)T vlastním vektorem matice B, je součet souřadnic řádkového vektoru v
íj=i
i=\
kdykoliv je u e S. Proto toto zobrazení zobrazuje simplex S na sebe a má také jistě v S vlastní (řádkový) vektor w s vlastní hodnotou jedna (pevný bod, opět dle Browerovy věty). Protože nějaká mocnina Bk obsahuje samé ostře pozitivní prvky, je nutně obraz simplexu S v k-té iteraci zobrazení daného B uvnitř S. To už jsme blízko použití našeho lematu, které jsme si pro důkaz připravili.
sní 500x ryb, což by mělo odpovídat podle předchozího výpočtu 0, 9r. Poměr počtu bílé ryby ku počtu štik by tedy měl být r- = To je přibližně jedna štika na 556 kusů bílé ryby. □ Obecněji můžeme zpracovat předcházející model takto:
3.21. Nechť je v populačním modelu dravec-kořist určen vztah mezi počtem dravců Dk a kořisti Kk v daném a následujícím měsíci (k e N U {0}) lineárním systémem
(a)
Djt+i = 0,6Djt + 0,5*:*,
Kk+l = -0,16Djt + 1,2**;
(b)
Djt+i = 0,6Dk + 0,5Kk,
Kk+l = -0, 175 + 1,2**;
(c)
Dk+l = 0,6Dk + 0,5 Kk,
Kk+l = -0, 135 D* + 1,2*:*.
Analyzujte chování tohoto modelu po velmi dlouhé době.
Řešení. Všimněme si, že jednotlivé varianty se od sebe navzájem liší pouze v hodnotě koeficientu u Dk ve druhé rovnici. Můžeme proto všechny tři případy vyjádřit jako
Dk Kk
0,6 0,5\ /£>*_! a l,2/'U*-i
k e N,
kde budeme postupně klást a = 0, 16, a = 0, 175, a = 0, 135. Hodnota koeficientu a zde reprezentuje průměrný počet kusů kořisti zahubených jedním (očividně „nenáročným") dravcem za měsíc. Při označení
0,6 0,5 -a 1,2
bezprostředně dostáváme
Pomocí mocnin matice T tak můžeme určit vývoj populací dravce a kořisti po velmi dlouhé době. Snadno stanovíme vlastní čísla
(a) A1 = l, A2 = 0,8;
(b) Ai = 0, 95, X2 = 0, 85;
(c) ki = 1,05, k2 = 0, 75
matice T a jim (při zachování pořadí) příslušné vlastní vektory
(a) (5,4)r, (5,2)r;
(b) (10,7)r, (2,l)r;
(c) (10,9)r , (10, 3)T. Pro k e N tudíž platí
149
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
Budeme i nadále pracovat s řádkovými vektory a označme si P posunutí simplexu S do počátku pomocí vlastního vektoru w, který jsme právě našli, tj. P = —w+ S. Evidentně je P mnohostěn obsahující počátek a vektorový podprostor ľcl" generovaný P je invariantní vůči působení matice B pomocí násobení řádkových vektorů zprava. Zúžení našeho zobrazení na P tedy splňuje předpoklady pomocného lemmatu a proto nutně musí být všechny jeho vlastní hodnoty v absolutní hodnotě menší než jedna.
Ještě se musíme vypořádat se skutečností, že právě uvažované zobrazení je dáno násobením řádkových vektorů zprava maticí B (zatímco nás původně zajímalo chování zobrazení, zadaného maticí B pomocí násobení sloupcových vektorů zleva). To je ale ekvivalentní násobení transponovaných sloupcových vektorů transponovanou maticí B obvyklým způsobem zleva. Dokázali jsem tedy vlastně potřebné tvrzení o vlastních číslech pro matici transponovanou k naší matici B. Transponování ale vlastní čísla nemění.
Dimenze prostoru V je přitom n — 1, takže důkaz věty je ukončen. □
3.20. Jednoduché důsledky. Následující velice užitečné tvrzení má při znalosti Perronovy věty až překvapivě jednoduchý důkaz a ukazuje, jak silná je vlastnost primi-tivnosti matice zobrazení.
Důsledek. Jestliže A = (flij) je primitivní matice a x e M" její vlastní vektor se všemi souřadnicemi nezápornými a vlastní hodnotou X, pak X > Oje spektrální poloměr A. Navíc platí
n n
min/e{i,...,«}
i=\ i=\
Důkaz. Uvažme vlastní vektor x z dokazovaného tvrzení. Protože je A primitivní, můžeme zvolitpevně k tak, aby Ak už měla
samé pozitivní prvky, a pak je samozřejmě i Ak
Xkx vektor
se samými ostře kladnými souřadnicemi. Nutně proto je X > 0.
Z Perronovy věty víme, že spektrální poloměr [i je vlastním číslem a zvolme takový vlastní vektor y k fi, že rozdíl x — y má samé kladné souřadnice. Potom nutně pro všechny mocniny n
0 < A" ■ (x — y) = X"x
I1 y,
ale zároveň platí X < \i. Odtud již vyplývá X = \i.
Zbývá odhad spektrálního poloměru pomocí minima a maxima součtů jednotUvých sloupců matice. Označme je bmin a bmax, zvolme za x vektor se součtem souřadnic jedna a počítejme:
n n i,j=l i = l
7=1
-'min-^j
□
Všimněme si, že např. všechny Leslieho matice z 3.18, kde jsou všechny uvažované koeficienty f i a r j ostře kladné, jsou primitivní a tedy na ně můžeme plně použít právě odvozené výsledky.
nk _ (5 5\ (1 0 \k (5 5^ -1
4 2
4 21 10 0,
„t / 10 2\ (0,95 0 \ HO 2
(a)
(b)
(c)
9 3 J \ 0 0,15) \9 3 Odtud dále pro velká & e N plyne (a)
5 5\ (\ 0\ (5 5
1 1/ \ 0 0,85 7 V 7 1
10 10\ /1,05 0 \* /10 10^ 1
(b)
4 2) \0 0/ \4 2
j_ /-10 25 10 V -8 20
10 2\ /0 0\ /10 2
(c)
7 1/ \0 0/ V 7 1
o 0\ 0 0/'
,* . i'10 10\ /l, 05* 0\ /10 10
9 3 7 V 0 07 V 9 3 1,05* /-30 100N
60 V"27 90 neboť právě pro velká & e N můžeme položit
(a)
(b)
i o y /i o> o o, 87 ~ lo 07'
0,95 o y _ /O 0N 0 0,85/ \0 07 '
(c)
'1,05 0 V A, 05* 0^ 0 0,75J ~ \ 0 Oj
Podotkněme, že ve variantě (b), tj. pro a = 0, 175, nebylo nutné vlastní
vektory počítat.
Obdrželi jsme tak
(a)
Kk) ~ 10 V-8 20)'{K0/
= J_(5 (-2A, + 5^o)N 10 U(-2D0 + 5í:o),
150
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
Perronova-Frobeniova věta je zobecněním Perronovy věty na obecnější matice, které tu nebudeme uvádět. Další informace lze najít např. v ??.
3.21. Markovovy řetězce. Velice častý a zajímavý případ lineárních procesů se samými nezápornými prvky v matici je matematický model systému, který se může nacházet v m různých stavech s různou pravděpodobností. V jistém okamžiku je systém ve stavu / s pravděpodobností xt a k přechodu z možného stavu / do stavu j dojde s pravděpodobností fý.
Můžeme tedy proces zapsat takto: V čase n je systém popsán pravděpodobnostním vektorem
x„ = («i(n), ..., um{n))T.
To znamená, že všechny komponenty vektoru x jsou reálná nezáporná čísla a jejich součet je roven jedné. Komponenty udávají rozdělení pravděpodobnosti jednotlivých možností stavů systému. Rozdělení pravděpodobností pro čas n+1 bude dáno vynásobením pravděpodobnostní maticí přechodu T — (t i j), tj.
(b)
odkaz do literatury a n dalsi využiti...
0 0 0 o
Xn + 1
Protože předpokládáme, že vektor x zachycuje všechny možné stavy a proto s celkovou pravděpodobností jedna přejde opět do některého z nich, budou všechny sloupce matice T tvořeny také pravděpodobnostními vektory. Takovému procesu říkáme (diskrétní) Markovův proces a výsledné posloupnosti vektorů xq,x\, ... říkáme Markovův řetězec xn.
Všimněme si, že každý pravděpodobnostní vektor x je skutečně Markovovým procesem zobrazen na vektor se součtem souřadnic jedna:
E E
E^
i.
Nyní můžeme v plné síle použít Perronovu-Frobeniovu teorii. Protože je součet řádků matice T vždy roven vektoru (1,..., 1), je zcela elementárně vidět, že matice T — E je singulární a jednička proto bude zaručeně vlastním číslem matice T.
Pokud je navíc T primitivní matice (tj. např. když jsou všechny prvky nenulové), z Důsledku 3.20 víme, že je jednička jednoduchým kořenem charakteristického polynomu a všechny ostatní mají absolutní hodnotu ostře menší než jedna.
Věta. Markovovy procesy s maticí, která nemá žádné nulové prvky nebo jejíž některá mocnina má tuto vlastnost, splňují:
• existuje jediný vlastní vektor Xqo pro vlastní číslo 1, který je pravděpodobnostní,
• iterace Tkxo se blíží k vektoru x^ pro jakýkoliv počáteční pravděpodobnostní vektor xq.
Důkaz. První tvrzení vyplývá přímo z kladnosti souřadnic vlastního vektoru dovozené v Perronově větě.
Předpokládejme nejprve, že jsou algebraické a geometrické násobnosti vlastních čísel matice T stejné. Pak každý pravděpodobnostní vektor xo můžeme (v komplexním ■") napsat jako lineární kombinaci
X0 — ClXoo + C2«2 H-----1- c„u„,
rzsireni
(c)
1,05*
60 1,05*
60
D0
K0
-30 100 -27 90
D0
K0
10(-3A, + 10Z0) 9 (-3 A> + lOKo)
Tyto výsledky lze interpretovat následovně:
(a) Pokud 2 D0 < 5K0, velikosti obou populací se ustálí na nenu-
lových hodnotách (říkáme, že jsou stabilní); jestliže 2D0
>
5K0, obě populace vymřou.
(b) Obě populace vymřou.
(c) Pro3Do < IOKq nastává populační exploze obou druhů; pro 3D0 > 10 K o obě populace vymřou.
To, že extrémně malá změna velikosti a může vést ke zcela odlišnému výsledku, je zapříčiněno neměnností hodnoty a v závislosti na velikosti obou populací. Poznamenejme, že toto omezení, kdy a v našich modelech považujeme za konstantní, nemá oporu ve skutečnosti. Přesto získáváme odhad velikosti a pro stabilní populace.
□
3.22. Poznámka. Jiný model soužití populací dravce a kořisti poskytuje model pánů Lotky a Volterra, který popisuje vztah mezi populacemi soustavou dvou obyčejných diferenciálních rovnic. Podle tohoto modelu obě populace oscilují, což je i v souladu s pozorováními.
V lineárních modelech hrají významnou roli tzv. primitivní matice (3.19).
3.23. Které z matic
0 1/7
1 6/7
B
1/2 0 1/3N 0 1 1/2 1/2 0 1/6,
D
/1/3 1/2 1/2 1/3 0
Vl/6
0 0 \
0 o
1/6 1/6 1/3
0 5/6 2/3/
/ 0 1
C = 1/4 0
\3/4 0
(0 1 0 0\
0 0 0 1
1 0 0 0
0 1 0/
jsou primitivní? Řešení. Neboť
A2=/l/7 6/49 \ 3 l6/7 43/49) '
'3/8 1/4 l/4> 1/4 3/8 1/4 ,3/8 3/8 1/2,
151
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
kde u2 - ■ ■ ,un doplňují x^ na bázi z vlastních vektorů. Pak ovšem ^-násobná iterace dává opět pravděpodobnostní vektor
Xk
■ x0 = ciXoo + A2c2W2 H-----1- Xncnun.
Protože jsou všechna vlastní čísla X2, ■ ■ ■ Xn v absolutní hodnotě ostře menší než jedna, všechny komponenty vektoru x*, kromě té první, se velmi rychle blíží v normě k nule. Přitom ale je stále x* pravděpodobnostní, takže musí být c\ — 1 a druhé tvrzení máme ověřeno.
Ve skutečnosti ale i při různé algebraické a geometrické násobnosti vlastních čísel dojdeme ke stejnému závěru pomocí podrobnějšího studia tzv. kořenových podprostorů pro matici T, ke kterým se dostaneme v souvislosti s tzv. Jordánovým rozkladem matic ještě v této kapitole, viz poznámka 3.33.
I v obecném případě totiž dostaneme k vlastnímu podprostorů (*oo) jednoznačně určený invariantní (n — l)-rozměrný komple-ment, na kterém už všechna vlastní čísla jsou v absolutní hodnotě menší než jedna a proto se příslušná komponenta v x* také bude neomezeně blížit k nule jako výše. □
3.22. Iterace stochastických matic. Matice Markovových procesů, tj. matice jejichž všechny sloupce mají součet svých komponent roven jedné se nazývají stochastické matice. Standardní úlohy spojené s Markovo-vými procesy zahrnují odpovědi na otázky po očekávané střední době přechodu mezi předem určenými stavy systému apod. Momentálně nejsme na řešení těchto úloh připraveni, vrá tíme se ale k této tématice později.
Přeformulujeme předchozí větu do jednoduchého, ale asi docela překvapivého důsledku. Konvergencí k hmitní matici v násle-dujcím tvrzení myslíme skutečnost, že když si předem určíme možnou chybu e > 0, tak najdeme hranici na počet iterací k po níž už všechny komponenty uvedené matice se od té limitní budou lišit o méně než e.
Důsledek. Nechť T je primitivní stochastická matice z Markovova procesu a Xqo je stochastický vlastní vektor k dominantnímu číslu 1 jako ve větě výše. Pak iterace Tk konvergují k limitní matici T^, jejíž všechny sloupce jsou rovny iw.
Důkaz. Sloupce v matici Tk jsou obrazy vektorů standardní báze v příslušném iterovaném lineárním zobrazení. To ale jsou obrazy pravděpodobnostních vektorů a proto všechny konvergují k
Xoo. n
Nyní se ještě na rozlučku s Markovovými procesy zamyslíme nad problémem, zda existují pro daný systém stavy, do kterých se má systém tendenci dostat a setrvat v nich.
O stavu systému řekneme, že je přechodový, jestliže v něm systém setrvává s pravděpodobností ostře menší než jedna. Za absorbční označíme stav, ve kterém systém setrvává s pravděpodobností 1, a do kterého se lze dostat s nenulovou pravděpodobností z kteréhokoliv z přechodových stavů. Konečně, Markovův řetězec x„ je absorpční, jestliže jsou jeho všechny jeho stavy buď absorpční nebo přechodové.
Je-li v absorpčním Markovově řetězci prvních r stavů systému absorpčních, pro stochastickou matici T systému to znamené, že se rozpadá na „blokově" horní trojúhelníkový tvar
matice A a C jsou primitivní; a neboť
'1/2 0 l/3\ /0> 0 11/2-1 ,1/2 0 1/6/ \0,
bude prostřední sloupec matice B" vždy (pro n e N) vektorem (0, 1, 0)T, tj. matice B nemůže být primitivní. Součin
/ 0 \ n
a, b € R
(\/3 1/2 0 0 \
1/2 1/3 0 0
0 1/6 1/6 1/3
\l/6 0 5/6 2/3/
M 0
a
w
o o
a/6 + b/3 \5a/6 + 2b 13 j
implikuje, že matice D2 bude mít v pravém horním rohu nulovou dvourozměrnou (čtvercovou) submatici. Opakováním této implikace dostáváme, že stejnou vlastnost mají matice D3 = D ■ D2, D4 = D ■ D3, ..., D" = D ■ Dn~l, ..., tudíž matice D není primitivní. Matice E je permutační (v každém řádku a sloupci má právě jeden nenulový prvek, a to 1). Není obtížné si uvědomit, že mocniny permutační matice jsou opět permutační matice. Matice E proto také není primitivní. To lze rovněž ověřit výpočtem mocnin E2, E3, E4. Matice E4 je totiž iednptkpyá. □
aBaTpnslirj, pokud
uvedme poněkud obsáhlejší model.
vymakat pnsJiD, po] to nenastane, ^nahradit odkazem do
3.24. Model šíření jednoletých bylin. Budeme uvažovat rostliny, které na začátku léta vykvetou, na jeho vrcholu vyprodukují semena a samy uhynou. Některá ze semen vyklíčí ještě na konci podzimu (ozimé rostliny), jiná přečkají zimu v zemi a vyklíčí na začátku jara (jarní rostliny). Ozimé rostlinky (sazenice), které přes zimu nezmrznou, jsou na j aře větší než j arní a většinou z nich vyrostou větší rostliny než z jarních sazenic. Větší rostlina vyprodukuje více semen. Pak se celý vegetační cyklus opakuje.
Rok je tedy rozdělen na čtyři vegetační období a v každém z těchto
období můžeme rozlišit několik „forem" rostliny: Období stadia rostliny
začátek jara začátek léta vrcholné léto podzim
malé a velké sazenice
malé, střední a velké kvetoucí rostliny
semena
sazenice a přezimující semena
T
I R
0 Q
Označme xi(t), resp. x2(ř), počet malých, resp. velkých, sazenic na začátku jara roku t a y\(t), resp. y2(t), resp. yj,(t), počet malých, resp. středních, resp. velkých rostlin v létě téhož roku. Z malých sazenic mohou vyrůst malé nebo střední rostliny, z velkých sazenic mohou vyrůst střední nebo velké rostliny. Kterákoliv ze sazenic samozřejmě může uhynout (uschnout, být spasena krávou a podobně) a nevyroste z ní nic. Označme bij pravděpodobnost, že ze sazenice j-té velikosti, j = 1,2,
152
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
kde E je jednotková matice, jejíž rozměr je dán počtem absorpčních stavů, zatímco R je kladná matice a Q nezáporná. V každém případě iteracemi této matice budeme pořád dostávat stejný blok nulových hodnot v levém dolním bloku a tedy zcela jistě nebude primitivní, např.
R + R-Q
Q2
I o takových maticích lze získat hodně informací pomocí plné Perronovy-Frobeniovy teorie a se znalostí pravděpodobnosti a statistiky také odhadovat střední doby, po kterých se systém dostane do jednodo z abosrpčních stavů apod.
4. Více maticového počtu
Na vcelku praktických příkladech jsme viděli, že porozumění vnitřní struktuře matic a jejim vlastnostem je silným nástrojem pro konkrétní výpočty nebo analýzy. Ještě více to platí pro efektivitu numerického počítání s maticemi. Proto se budeme zase chvíli věnovat abstraktní teorii.
Budeme přitom zkoumat další speciální typy lineárních zobrazení na vektorových prostorech ale také obecný případ, kdy je struktura zobrazení popsána tzv. Jordánovou větou.
3.23. Unitární prostory a zobrazení. Už jsme si zvykli, že je užitečné pracovat rovnou v číselném oboru komplexních čísel a to i v případě, kdy nás zajímají jen reálné objekty. Navíc v mnohých oblastech jsou komplexní vektorové prostory nutnou součástí úvah. Jasným příkladem je například tzv. kvantové počítání, které se stalo velmi akční oblastí teoretické informatiky, přestože kvantové počítače zatím zkonstruovány ve funkční podobě nebyly.
Proto navážeme na ortogonální zobrazení a matice z konce druhé kapitoly následující definicí:
mm^mmm_\ Unitární prostory
Definice. Unitární prostor je komplexní vektorový prostor V spolu se zobrazením V x V -> C, (u, v) i-> u ■ v, které splňuje pro všechny vektory u, v, w e V a skaláry a e C
(1) u ■ v = Fu (zde pruh značí komplexní konjugaci),
(2) (au) ■ v = a(u ■ v),
(3) (u + v) ■ w = u ■ w + v ■ w,
(4) je-li u ^ 0, pak u ■ u > 0 (zejména je výraz reálný).
Toto zobrazení nazýváme skalární součin na V.
Reálné číslo *Jv ■ v nazýváme velikostí vektoru v a vektor je normovaný, jestliže má velikost jedna. Vektory u a v nazýváme ortogonální, jestliže je jejich skalární součin nulový, bázi sestavenou z po dvou ortogonálních a normovaných vektorů nazýváme ortonormální báze V.
Na první pohled jde o rozšíření definice euklidovských vektorových prostorů do komplexního oboru. Nadále budeme také používat alternativní značení (u,v) pro sklární součin vektorů u a v. Zcela stejně jako v reálném oboru také okamžitě z definice vyplývají následující jednoduché vlastnosti skalárního součinu pro
vyroste rostlina /-té velikosti, i = 1, 2, 3. Pak je
0i(ŕ) a w2(t) počet semen, které vyklíčí ještě na podzim a počet semen, která přezimují, v tomto pořadí, adn, resp. d2i pravděpodobnost, že semeno vyklíčí na podzim, resp. nevyklíči (prezimuje), a f n, resp. f22 pravděpodobnost, že ozimá sazenice, resp. že přezimující semeno během zimy nezmrzne. Pravděpodobnosti vyklíčení í/11, í/21 zřejmě musí splňovat nerovnosti
0 < í/11, 0 < í/21, d\\ + í/21 = 1,
153
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
všechny vektory ve V a skaláry v C:
u ■ u e M
u ■ u = 0 právě tehdy, když u = 0 m • (au) = ä (m • d)
íí-(l) + W)) = íí-D+íí-W)
w-0 = 0-w = 0 (^a/Ki) • (^ Vi) = X)fli*V(Ki ■ UA
kde poslední rovnost platí pro všechny konečné lineární kombinace. Podrobné ověření je skutečně jednoduchým cvičením, např. první vztah plyne okamžitě z definiční vlastnosti (1).
Standardním příkladem skalárního součinu na komplexním vektorovém prostoru C" je
(xi
,x„) -(yi,
,xn) =xiyi
H-----hx„y„.
3.24. Vlastnosti prostorů se skalárním součinem. Ve stručné diskusi euklidovských prostorů v předchozí kapitole jsme už některé jednoduché vlastnosti prostorů se skalárním součinem odvodili, důkazy v komplexním oboru jsou velmi podobné.
V dalším budeme pracovat s reálnými i komplexními prostory zároveň a budeme psát K pro R nebo C, v reálném případě je konjugace prostě identické zobrazení (tak jak skutečně zúžení konjugace na reálnou přímku v komplexní rovině je). Stejně jako u reálných prostorů definujeme obecně pro libovolný vektorový podpro-stor U C V v prostoru se skalárním součinem jeho ortogonální doplněk
U1' = {v € V; u ■ v = 0 pro všechny u e U],
což je zjevně také vektorový podprostor ve V.
Budeme v dalších odstavcích pracovat výhradně s konečněrozměrnými unitárními nebo euklidovskými prostory. Řada našich výsledků ale má přirozené rozšíření pro tzv. Hilbertovy prostory, což jsou jisté nekonečněrozměrné prostory se skalárním součinem, ke kterým se aspoň stručně vrátíme později.
Tvrzení. Pro každý konečněrozměrný prostor V dimenze n se skalárním součinem platí:
(1) Ve V existuje ortonormální báze.
(2) Každý systém nenulových ortogonálních vektorů ve V je lineárně nezávislý a lze jej doplnit do ortogonální báze.
a poněvadž rostlinka snáze zmrzat, než semeno ukryté v zemi, budeme o pravděpodobnostech f\ \, f22 přežití zimy předpokládat
Při označení
D
0 < /ll < fll < I-
/n o
w(t)
«>i (0
Díky konjugování souřadnic druhého argumentu toto zobrazení splňuje všechny požadované vlastnosti. Prostor C" s tímto skalárním součinem budeme nazývat standardní unitární prostor v dimenzi n. Maticově můžeme tento skalární součin psát jako x • y =
-t
y ■ x.
Zcela obdobně jako u euklidovských prostorů a ortogonálních zobrazení budou důležitá lineární zobrazení, která respektují skalární součiny.
J Unitární zobrazení |._____^_f
Lineární zobrazení cp : V —>• W mezi unitárními prostory se I nazývá unitární zobrazení, jestliže pro všechny vektory u, v e V platí
u ■ v = (p(u) ■ (p(v). Unitární isomorfismus je bijektivní unitární zobrazení. I
. \u ■ e\ |2 + • • • + \u ■ ek\2
(Besselova nerovnost).
(4) Pro ortonormální systém vektorů (e\, ..., ek) patří vektor u do podprostoru e (e\, ..., ek) právě když
||u||2 — \u ■ e\\2 + ■ ■ ■ + \u ■ ek\2■
(Parsevalova rovnost)
(5) Pro ortonormální systém vektorů (e\,..., ek) a vektor u e V je vektor
w — (w • ei)ei H-----h (u ■ ek)ek
jediným vektorem, který minimalizuje velikost \\u všechny ve (e\,..., ek).
v || pro
Důkaz. Všechny důkazy spočívají v přímých výpočtech: (2): Definujme vektor w :— u — ^v, tzn. w _L v a počítejme
0 < |M|2 = ||«||2
0 < ||ui2|M|2 =
(li-V) / \ U-V / \
II u II ||«||z
(u-v)(u-v) m ||2
NI
li ii2|i ii2
2(u ■ v)(u ■ v) + (u ■ v)(u ■ v)
|2 > \u ■ v\2 a rovnost nastane
Odtud již přímo plyne, že ||u|| právě tehdy, když w — 0, tj. když jsou u av lineárně závislé. (1): Opět stačí počítat
< \\u
d || + U ■ V + V ■ U
2
\v
2Re(« • v)
\v\\2 + 2\u ■ v\ < \\u\\2
2\\u\\ \\v\
\v\\r
Protože se přitom jedná o kladná reálná čísla, je opravdu ||w + v\\ < IIm II + II u II. Navíc, při rovnosti musí nastat rovnost ve všech předchozích nerovnostech, to však je ekvivalentní podmínce, že u a v jsou lineárně závislé (podle předchozí části důkazu). (3), (4): Nechť (ei,..., ek) je ortonormální systém vektorů. Doplníme jej do ortonormální báze (e\,...,en) (to vždy jde podle předchozí věty). Pak, opět podle předchozí věty, je pro každý vektor u e V
n n k
\\u\\2 — ^(w • e t) (u ■ e t) — ^ \u ' ei\2 - E ' e'!2
pružnost je tedy podíl těchto relativních změn, tj.
Ak(s)/k(s) s k(s + As) - k(s)
e(k, s)
As/s k(s) As
Konkrétně, meziroční relativní přírůstek populace závislý na přežití semen přes zimuje podle (||3.5||)
M/22) = d2i(b22Ci2 + fa2cn) fn + dn{bucufu +621^12/11)
a pro konkrétní zvolené hodnoty ostatních parametrů
M/22) = 13/22 + 0,0325.
Poněvadž f22 = 0,1, můžeme počítat
A(0,1) = 1,3325, A(0,l+As) = l,3325+13As, AA(0,1) = 13A*, takže
0,1 13As
e(A,0,l) = —:--=0,976.
1,3325 As
Analogicky můžeme spočítat pružnost reakce relativního přírůstku k populace na ostatních „demografických parametrech". Výsledky jsou shrnuty v tabulce
parametr pružnost reakce parametr pružnost reakce
bn 0,006 Cil 0,006
b2i 0,019 C\2 0,244
b22 0,225 0,751
b23 0,750 f U 0,024
dn 0,024 Í22 0,976
d2\ 0,976
Z ní můžeme vidět, že přírůstek A je nejvíce ovlivňován množstvím přezimujících semen (parametr d2{) a jejich přežíváním (parametr f22). Toto zjištění není nijak překvapivé, zemědělcům je tento fakt dobře známý již od neolitu. Výsledek však ukazuje, že matematický model skutečně nějak adekvátně realitu popisuje.
Další zajímavé a detailně popsané modely růstu nalezne čtenář v souboru příkladů za touto kapitolou.
3.25. Uvažujte následující Leslieho model: farmář chová ovce. Porodnost ovcí je dána pouze věkem a je průměrně 2 ovce na jednu ovci mezi jedním a dvěma lety věku, pět ovcí na ovci mezi dvěma a třemi lety věku a dvě ovce na ovci mezi třemi a čtyřmi roky věku. Ovce do jednoho roku nerodí. Z roku na rok umře vždy polovina ovcí a to rovnoměrně ve všech věkových skupinách. Po čtyřech letech posílá farmář ovce na jatka. Farmář by rád ještě prodával (živá) jehňátka do jednoho roku na kožešinu. Jakou část jehňátek může každý rok prodat, aby mu velikost stáda zůstávala z roku na rok stejná? V jakém poměru budou potom rozděleny počty ovcí v jednotlivých věkových skupinách?
156
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
To je ale právě dokazovaná Besselova nerovnost. Přitom rovnost může nastat právě tehdy, když u ■ e i = 0 pro všechny / > k, a to dokazuje Parsevalovu rovnost.
(5): Zvolme libovolný v e (e\,..., ek) a doplňme daný ortonormální systém na ortonormální bázi (e\,...,en). Nechť (ui,..., un) a (xi,..., xk, 0,..., 0) jsou souřadnice u a v v této bázi. Pak
\u — v\\2 = \u\ — xi |2 H-----h \uk -xk\2 + \uk+i\2 ■
a tento výraz je zjevně minimalizován při volbě jednotlivých vek-torů x\ = u\, ..., xk = uk. □
3.26. Vlastnosti unitárních zobrazení. Vlastnosti ortogonálních zobrazení mají přímočarou obdobu v komplexním oboru. Můžeme je snadno zformulovat .' a dokázat společně:
Tvrzení. Uvažme lineární zobrazení (endomorfismus) cp : V -> V na prostoru se skalárním součinem. Pak jsou následující podmínky ekvivalentní:
(1) cp je unitární nebo ortogonální transformace
(2) (p je lineární isomorfismus a pro každé u, v e V platí ■ (2): Zobrazení cp je prosté, proto musí být i na. Platí přitom cp(u) ■ v = (p(u) ■ (p((p~l (v)) = u ■ (p~l (v).
(2) =>■ (3): Standardní skalární součin je v K" vždy dán pro sloupce x, y skalárů výrazem x ■ y = xT Eý, kde E je jednotková matice. Vlastnost (2) tedy znamená, že matice A zobrazení
(4): Je-li AT = A-1 v některé ortonormální bázi, pak to zaručuje platnost podmínky (2) ((p(u) ■ v = (Ax)TEý = xT EA~1y = u ■ cp~l (v)) atedy i (3).
(4) =>■ (5) Dokazované tvrzení je vyjádřeno prostřednictvím matice A zobrazení
■ (6): Protože pro determinant platí \ATA\ = |£| =
= \A\\A\ = 1, existuje inverzní matice A-1. Přitom je AÄT A = A, proto i ÄT A = E což vyjadřuje právě (6).
(6) =>■ (1): Ve vybrané ortonormální bázi je
V jsou vždy také invariatní. Skutečně, je-li (p(U) V je unitární zobrazení komplexních vektorových prostorů. Pak je V ortogonálním součtem jednorozměrných vlastních podprostorů.
Důkaz. Jistě existuje alespoň jeden vlastní vektor v e V. Pak je zúženi cp na invariantní podprostor (v)1- opět unitární a jistě má opět nějaký vlastní vektor. Po n takovýchto krocích obdržíme hledanou ortogonální bázi z vlastních vektorů. Po vynormování vektorů získáme ortonormální bázi. □
Nyní už je možné snadno pochopit detaily důkazu spektrálního rozkladu ortogonálního zobrazení z 2.50 na konci druhé kapitoly — reálnou matici ortogonálního zobrazení interpretujeme jako matici unitárního zobrazení na komplexním rozšíření euklidovského prostoru a pečlivě sledujeme důsledky struktury kořenů reálného charakteristického polynomu nad komplexním oborem. Automaticky přitom dostáváme invariantní dvourozměrné podpro-story zadané dvojicemi komplexně sdružených vlastních čísel a tedy příslušné rotace pro zúžené původní reálné zobrazení.
Duální a adjungovaná zobrazení. Při diskusi vektorových prostorů a lineárních zobrazení jsme již ve druhé kapitole letmo zmínili duální vektorový prostor V* všech lineárních forem na vektorovém prosotru V, viz 2.39. o každé lineární zobrazení mezi vektorovými prostory i/r : W můžeme přirozeně definovat jeho duální zobrazení \jr : V* vztahem
(v, Ý* (a)) — (Ý(v), a),
(i — 1) kremrolí a s poloviční pravděpodobností (/ + 1) kremrolí. Pokud dosáhne pěti kremrolí nebo všechny prohraje už se počet kremrolí nemění. Vektor Xj+i tak získáme podle podmínek v přiklání z Xj vynásobením maticí
(1 0,5 0 0 0 0\
0 0 0,5 0 0 0
0 0,5 0 0,5 0 0
0 0 0,5 0 0,5 0
0 0 0 0,5 0 0
0 0 0 0,5 v
X,
A4X,
(3.6)
Na začátku máme
M o
x - 0
X] - 1
o
w
po čtyřech sázkách bude situaci popisovat náhodný vektor
3_
16
0
_5_
16
0
\V
tedy pravděpodobnost, že hra skončí do čtvté sázky (včetně) je polovina.
Všimněme si ještě, že matice A popisující vývoj pravděpodobnostního vektoru X je pravděpodobnostní, tedy má součet prvků v každém sloupci 1. Nemá ale vlastnost vyžadovanou v Perronově-Frobeniově větě a snadným výpočtem zjistíte (nebo přímo uvidíte bez počítání), že existují dva lineárně nezávislé vlastní vektory příslušné k vlastnímu číslu 1 - případ, kdy hráči nezůstane žádná krémrole, tj. x = (1, 0, 0, 0, 0, 0)T, nebo případ kdy získá 5 kremrolí a hra tím pádem končí a všechny mu už zůstávají, tj. x = (0, 0, 0, 0, 0, l)T. Všechna ostatní vlastní čísla (přibližně 0, 8, 0, 3, —0, 8, —0, 3) jsou v absolutní hodnotě ostře menší než jedna. Proto komponenty v příslušných vlastních podprostorech při iteraci procesu s libovolnou počáteční hodnotou vymizí a proces se blíží k limitní hodnotě pravděpodobnostího vektoru tvaru (a, 0, 0, 0, 0, 1 —a), kde hodnota a závisí na počtu kremrolí, se kterými hráč začíná. V našem případě je to a = 0, 4, kdyby začal se 4 krémrolemi, bylo by to a = 0, 2 atd. □
3.28. Na základě teploty ve 14.00 se rozdělují dny na teplé, průměrné a chladné. Dle celoročních statistik následuje po teplém dni teplý v polovině případů a průměrný ve 30 % případů, po průměrném dnu
158
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
kde ( , ) značí vyčíslení formy (druhý argument) na vektoru (první argument), v e V aa e W* jsou libovolné.
Zvolme si báze v na V, w na W a pišme A pro matici zobrazení ý v těchto bazích. Pak snadno spočteme v duálních bazích matici zobrazení ý* v příslušných duálních bazí na duálních prostorech. Skutečně, definiční vztah říká, že pokud bychom reprezentovali vektory z W* v souřadnicích jako řádky skalárů, pak je zobrazení Je dáno toutéž maticí jako i/r, pokud jí násobíme řádkové vektory zprava:
(ý(v), a) — (ai, ..., a„) ■ A
\Vn/
{v, Ý* (<*))•
To znamená, že maticí duálního zobrazení je transponovaná matice AT, protože a ■ A — (AT ■ aT)T.
Předpokládejme nadále, že se pohybujeme ve vektorovém prostoru se skalárním součinem. Jestliže tedy zvolíme pevně jeden vektor v e V, dosazování vektorů za druhý argument ve skalárním součinu nám dává zobrazení V -> V* — Hom( V, K)
V
(W !—>• (v, Vú) €
Podmínka nedegenerovanosti skalárního součinu nám zaručuje, že toto zobrazení je bijekcí. Zároveň víme, že jde skutečně o lineární zobrazení nad komplexními nebo reálnými skaláry, protože jsme pevně zvolili druhý argument. Na první pohled je vidět, že vektory ortonormální báze jsou takto zobrazeny na formy tvořící bázi duální, a každý vektor můžeme prostřednictvím skalárního součinu chápat také jako lineární formu.
V případě vektorových prostorů se skalárním součinem proto převádí naše ztotožnění vektorového prostoru se svým duálem také duální zobrazení ý* na zobrazení ý* : W -> V zadané formulí
(3.7)
(^(m), v) — (u, ý*(v)),
kde stejným značením závorek jako v definičním vztahu (3.6) nyní myslíme skalární součin. Tomuto zobrazení se říká adjungované zobrazení k iff.
Ekvivalentně lze brát vztah (3.27) za definici adjungovaného zobrazení ý*, např. dosazením všech dvojic vektorů ortonormální báze za vektory u a v dostáváme přímo všechny hodnoty matice zobrazení ý*.
Předchozí výpočet pro duální zobrazení v souřadnicích nyní můžeme zopakovat, pouze musíme mít na paměti, že v ortonormálních bazích na unitárních prostorech vystupují souřadnice druhého argumentu konjugované:
(i[r(v), w) — (wi, ..., w„) ■ A ■
= A
( wi\
\w„)
\VnJ \Vn)
— (v, Ý* (w))
Vidíme proto, že je-li A matice zobrazení ý v ortonormální bázi, pak matice adjungovaného zobrazení ý* je matice transponovaná a konjugovaná, kterou značíme A* — ÄT.
průměrný ve 40 % případů a chladný ve 30 % případů, po chladném dnu chladný v polovině případů a ve 30 % případů průměrný. Bez dalších informací zjistěte, kolik lze během roku očekávat teplých, průměrných a chladných dnů.
Řešení. Pro každý den musí nastav právě jeden ze stavů „teplý den", „průměrný den", „chladný den". Pokud vektor x„ má za složky pravděpodobnosti toho, že jistý (označený jako n-tý) den bude teplý, průměrný, chladný (při zachování pořadí), potom složky vektoru
/0,5 0,3 0,2\ xn+l = 0, 3 0, 4 0, 3 • xn \0,2 0,3 0,5/
udávají postupně pravděpodobnosti, že následující den bude teplý, průměrný, chladný. Pro ověření stačí dosadit
přičemž např. pro třetí volbu musíme dostat pravděpodobnosti, že po chladném dnu bude následovat teplý, průměrný, chladný (v tomto pořadí). Vidíme tak, že úloha je Markovovým řetězcem s pravděpodobnostní maticí přechodu
^0,5 0,3 0^ 0,3 0,4 0,3 v0,2 0,3 0,5,
Neboť jsou všechny prvky této matice kladné, existuje pravděpodobnostní vektor
k němuž se blíží vektor x„ pro zvětšující se n nezávisle na tom, jaký byl vektor x„ pro mnohem menší n. Navíc podle důsledku Perronovy-Frobeniovy věty je x^ vlastním vektorem matice T pro vlastní číslo 1. Má tedy platit
0,5x^ 0,3x^ 0,2x1
+ 0,34, + 0,44 + 0,34
+ 0,2x3^ + 0,3x3^ + 0,5x3^
1 = xoo + xoo + X0O'
kde poslední podmínka znamená, že vektor x^ je pravděpodobnostní. Snadno se vypočítá, že tato soustava má jediné řešení
1 _ 2 _ 3 _ 1
Lze tedy očekávat přibližně stejný počet teplých, průměrných a chladných dnů.
Zdůrazněme, že součet všech čísel z libovolného sloupce matice T musel být roven 1 (jinak by se nejednalo o Markovův proces). Protože TT = T (matice je symetrická), je součet všech čísel z libovolného
159
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
Matici A* se říká adjungovaná matice k matici A. Všimněme si, že adjungované matice jsou dobře definované pro jakékoliv obdélníkové matice a nepleťme si je s maticemi algebraicky adjungo-vanými, které jsme u čtvercových matic používali při úvahách o determinantech.
Můžeme si tedy shrnout, že má-li jakékoliv lineární zobrazení Ý : V -> W mezi unitárními prostory v ortonormálních bazích matici A, bude mít jeho duální zobrazení v bazích duálních matici AT. Pokud přitom zotožníme pomocí skalárního součinu vektorové prostory s jejich duálními prostory, pak nám duální zobrazení představuje adjungované zobrazení ý* : W -> V (které je zvykem značit stejně jako to zobrazení duální), které ale má matici A*. Rozdíl mezi maticemi duálního a adjungovaného zobrazení je tedy v dodatečné konjugaci, ta ale samozřejmě je důsledkem toho, že zotožnění unitárního prostoru s jeho duálním prostorem není komplexně lineární zobrazení (neboť z druhé pozice ve skalárním součinu se skaláry vytýkají konjugované).
3.28. Samoadjungovaná zobrazení. Zvláštním případem lineárních zobrazení jsou tedy ta, která splývají rt í se svým adjungovaným zobrazením: ý* = i/r. Takovým zobrazením říkáme samoadjungovaná. Ekvivalentně můžeme říci, že jsou to ta zobrazení, jejichž matice A v jedné a tedy ve všech ortonormálních bazích splňují A = A*.
V případě euklidovských prostorů jsou samoadjungovaná zobrazení tedy ta, která mají v některé ortonormální bázi (a pak už všech) symetrickou matici. Často se jim proto říká symetrické matice a symetrická zobrazení.
V komplexním oboru se maticím splňujícím A = A* říká hermiteovské matice. Občas se také hermiteovským maticím říká samoadjungované matice. Všimněme si, že hermiteovské matice tvoří reálný vektorový podprostor v prostoru všech komplexních matic, není však podprostorem v komplexním oboru.
Poznámka. Obzvlášť zajímavý je v této souvislosti následující postřeh. Jestliže hermiteovskou matici A vynásobíme imaginární jednotkou, dostáváme matici B = i A, která má vlastnost B* = i AJ = —B. Takovým maticím říkáme anti-hermiteovské. Tak jako je tedy každá reálná matice součtem své symetrické a anti-symetrické části
1
1
A=-(A+A') + -(A-AÍ), je v komplexním oboru obdobně
A = l-(A + A*) + i^(A- A*) 2 2i
a můžeme proto vyjádřit každou komplexní matici právě jedním způsobem jako součet
A = B + i C
s hermiteovskými maticemi B a C. Jde o obdobu rozkladu komplexního čísla na reálnou a ryze imaginární komponentu a skutečně se často v literatuře setkáme i se značením
1 * 1
B = reA = -(A + A*), C = imA= — (A
2 2i
A*).
V řeči lineárních zobrazení to tedy znamená, že každý komplexní lineární automorfismus můžeme takto jednoznačně vyjádřit pomocí dvou samoadjungovaných zobrazení.
řádku matice také roven 1. O matici s nezápornými prvky a s vlastností, že součet čísel v každém řádku a rovněž součet čísel v každém sloupci je 1, mluvíme jako o dvojnásobně (dvojitě, dvojně) stochastické. Důležitou vlastností každé dvojnásobně stochastické primitivní matice (pro jakýkoli rozměr - počet stavů) je, že jí příslušný vektor x^ má všechny složky stejné, tj. po dostatečně dlouhé době vyhodnocování se všechny stavy v odpovídajícím Markovově procesu jeví jako stejně časté. □
3.29. Půjčovna aut. Firma půjčující každý týden auta má dvě pobočky - jednu v Brně a jednu v Praze. Auto zapůjčené v Brně lze vrátit i v Praze a naopak. Po čase se zjistilo, že na konci týdne je vždy v Praze vráceno zhruba 80 % z aut vypůjčených v Praze a 90 % z aut vypůjčených v Brně.
Jak je potřeba rozdělit auta mezi pobočky, aby na obou byl na začátku týdne vždy stejný počet aut jako předchozí týden? Jak bude vypadat situace po jisté dlouhé době, pokud jsou auta mezi pobočky na začátečátku náhodně rozdělena?
Řešení. Hledaný začáteční počet aut v Brně označme xB a v Praze xP. Stav rozmístění aut mezi pobočkami je tedy popsán vektorem
x = ( Xb ). Uvážíme-li takový násobek vektoru x, že součet jeho \xpj
složek je 1, pak dávají jeho složky procentuální rozmístění aut.
Na konci týdne bude podle zadání stav popsán vektorem 0, 1 0,2\ íxB\ .. . /O, 1 0,2
Matice A
tedy popisuje
0,9 0,8/ \xpj- ---- ^0,9 0,8
náš (lineární) systém půjčování aut. Pokud má být na konci týdne
v pobočkách stejně aut jako na začátku, pak hledáme takový vektor x,
pro který platí Ax = x. To znamená, že hledáme vlastní vektor matice
A příslušný vlastnímu číslu 1.
Charakteristický polynom matice A je (0, 1—A)(0, 8—A)—0, 9.0, 2 =
(A—1)(a+0, 1) a 1 je tedy opravdu vlastní hodnota matice A. Příslušný
xB\ ... . . /-0,9 0,2 \ (xB xpj splňujerovmci^09 _Q2)[Xp
Je to tedy násobek vektoru ^. Pro zjištění procentuálního rozložení hledáme takový násobek, aby xB + xP = 1. To splňuje 0 82^' Správlrá rozložení aut mezi Brnem a
Prahou je takové, že 18% aut bude v Brně a 82% aut v Praze.
xB
vlastní vektor x
0.
vektor ± rQ 2g
Pokud zvolíme libovolný počáteční stav x = ), pak bude stav
\xpj
za n týdnů popsán vektorem x„ = A"x. Nyní je výhodné vyjádřit počáteční vektor x v bázi vlastních vektorů matice A. Vlastní vektor k vlastnímu číslu 1 už jsme našli a podobně se nalezne vlastní vektor
k vlastnímu číslu —0, 1. Tím je například vektor
160
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
3.29. Spektrálni rozklad. Uvažujme samoadjungované zobrazení ý : v -> v s maticí A v nějaké ortonormální bázi a zkusme postupovat obdobně jako v 2.50. Opět se nejprve
I obecně podíváme na invariantní podprostory samoadjun-\Ů ' govaných zobrazení a jejich ortogonální doplňky. Jestliže pro libovolný podprostor w c v a samoadjungované zobrazení tz> : v -> Vplatíi//-(W) c W, pak také platí pro všechny v e w-1, w € w
{ijf(v), w) — (v, ý(w)) — 0.
To ale znamená, že také ^(w-1) c w-1.
Uvažme nyní matici A samoadjungovaného zobrazení v nějaké ortonormální bázi a A ■ x — Xx pro nějaký vlastní vektor x e C". Dostáváme
X (x, x) = {Ax, x) — (x, Ax) — (x, Xx) — X (x, x).
Kladným reálným číslem (x, x) můžeme krátit a proto musí být X — X, tj. vlastní čísla jsou vždy reálná.
Komplexních kořenů má charakteristický polynom det(A — X E) tolik, kolik je dimenze čtvercové matice A, a všechny jsou ve skutečnosti reálné. Dokázali jsme tak důležitý obecný výsledek:
Tvrzení. Ortogonální doplněk k invariantnímu podprostoru pro samoadjungované zobrazení je také invariantní. Navíc jsou všechna vlastní čísla hermiteovské matice A vždy reálná.
Ze samotné definice je zřejmé, že zúžení samoadjungovaného zobrazení na invariantní podprostor je opět samoadjungované. Předchozí tvrzení nám tedy zaručuje, že bude vždy existovat báze v z vlastních vektorů. Skutečně, zúžení i/r na ortogonální doplněk invariantního podprostoru je opět samoadjungované zobrazení, takže můžeme do báze přibírat jeden vlastní vektor za druhým, až dostaneme celý rozklad v. Vlastní vektory příslušející různým vlastním číslům jsou navíc kolmé, protože z rovností if{u) — Xu, \j/(v) — fiv vyplývá
X{u, v) — (^f(w), v) — (u, ý(v)) — jl{u, v) — ji{u, v).
Obvykle bývá náš výsledek formulován pomocí projekcí na vlastní podprostory. O projektoru P : v -> v říkáme, že je kolmý, je-li ImP 1 Ker P. Dva kolmé projektory P, Q jsou vzájemně kolmé, je-li Im P _L Im Q.
Věta (O spektrálním rozkladu). Pro každé samoadjungované zobrazení iff : v -> v na vektorovém prostoru se skalárním součinem existuje ortonormální báze z vlastních vektorů. Jsou-li X\,..., Xk všechna různá vlastní čísla ý a P\,..., Pk příslušné kolmé a navzájem kolmé projektory na vlastní podprostory k odpovídajícím vlastním číslům, pak
f = XiPi + ---+XkPk.
Dimenze obrazů těchto projektorů je přitom vždy rovna algebraické násobnosti vlastních čísel Xi.
3.30. Ortogonální diagonalizace. Zobrazení, pro která lze najít ^N ortonormální bázi jako v předchozí větě o spektrál-
% ním rozkladu se nazývají ortogonálně diagonalizo-vatelná. Jsou to samozřejmě právě ta zobrazení, pro která umíme najít ortonormální bázi tak, aby v ní jejich matice zobrazení byla diagonální. Zamysleme se, jak mohou vypadat.
Počáteční vektor tedy můžeme vyjádřit jako Lineární kombinaci
'0,2\ , /-1\ „ , .
j I. Stav po n týdnech je pak
fl,0,9,+
x„ = A" (a ( o' 82 ' +
■1
a I?' ll\+b(-0, 1)"
■1
1 )' " \0, 82/ ' "y ^ ^ 1 oo blíží nuLe a proto se stav ustálí na
Druhý sčítanec se pro n
0 82^' teC^ sl°zce počátečního vektoru ve směru prvního vlastního vektoru. Koeficient a lze jednoduše vyjádřit pomocí počátečních počtů aut: a = ^f^. □
3.30. Sledovanost televizí. V jisté zemi vysílají jisté dvě televizní stanice. Z veřejného výzkumu vyplynulo, že po jednom roce přejde 1/6 diváků první stanice ke druhé stanici, 1/5 diváků druhé stanice přejde k první stanici. Popište časový vývoj počtu diváků sledujících dané stanice jako Markovův proces, napište jeho matici, nalezněte její vlastní čísla a vlastní vektory. O
3.31. Studenti na přednášce. Studenty můžeme rozdělit řekněme do tří skupin - na ty, co jsou přítomni na přednášce a vnímají, na ty, co jsou rovněž přítomni, ale nevnímají a na ty, co sedí místo přednášky v hospodě. Nyní budeme hodinu po hodině sledovat, jak se mění počty studentů v těchto skupinách. Základem je vypozorovat, jaké jsou jednotlivé pravděpodobnosti změn stavu studenta. Dejme tomu, že by to mohlo být následovně:
Student, který vnímá: s pravděpodobností 50% zůstane vnímat, 40% přestane vnímat a 10% odejde do hospody. Student, který je na přednášce a nevnímá: začne vnímat s pravděpodobností 10%, zůstane ve stejném stavu 50%, odejde do hospody 40%. Student, který sedí v hospodě má nulovou pravděpodobnost, že se vrátí na přednášku.
Jak se bude tento model vyvíjet v čase? Jak se situace změní, pokud budeme předpokládat aspoň desetiprocentní pravděpodobnost toho, že se student vrátí z hospody na přednášku (tu ovšem samozřejmě nevnímá)?
Řešení. Ze zadání se jedná o Markovovův proces s ma-/0,5 0,1 0\
ticí I 0,4 0,5 0 I. Její charakteristický polynom je \0, 1 0,4 1/
(0, 5 - X)2(l - X) - 0,4(1 — X) = 0. Evidentně je tedy 1 vlastní číslo této matice (další kořeny jsou pak 0,3 a 0,7). Postupem času se tedy studenti rozdělí do skupin tak, že stav bude
popsán příslušným vlastním vektorem. Ten je řešením rovnice -0,5 0, 1 0\ /x\
0,4 —0,5 0||j|=0, což jsou právě násobky vektoru 0, 1 0,4 0/ \zj (0.0.1). Jinými slovy, všichni studenti po čase skončí v hospodě.
161
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
Pro euklidovský případ je to snadné: diagonální matice jsou zejména symetrické, jedná se tedy právě o samoadjungovaná zobrazení. Jako důsledek získáváme tvrzení, že ortogonální zobrazení euklidovského prostoru do sebe je ortogonálně diagonalizovatelné, právě když je zároveň samoadjungované (jsou to právě ta samoadjungovaná zobrazení s vlastními hodnotami ±1).
U komplexních unitárních prostorů je situace složitější. Uvažme libovolné lineární zobrazení V unitárního prostoru a nechť
o q>* =
V s poslední uvedenou vlastností se nazývají normální.
Vzájemné souvislosti ukazuje následující věta (pokračujeme ve značení tohoto odstavce):
Tvrzení. Následující podmínky jsou ekvivalentní:
(1) cp je ortogonálně diagonalizovatelné,
(2)
(2) jsme již diskutovali. (2) (3): Stačí provést přímý výpočet
qxp* — (ý + ít])(ý — i?]) — ý2 + ^2 + i Ol ý — ýr))
cp*cp — (ý ~ í'ř?)(Vf + — Ý2 + I2 + i(Ýrl ~ VÝ)
Odečtením dostaneme 2i(tiý — ýv)-
(2) =>■ (1): Nechť u e V je vlastní vektor normálního zobrazení
(4): Výraz ^ j \aij \2 je právě stopa matice AA*, to je matice zobrazení • V, kterou dokážeme později v 3.37. Podle ní totiž existuje pro každé lineární zobrazení
• V ortonormální báze, ve které má
3:
A"
(1 a + ab + ab2 a + ab a 0\
0 0 0 0 0
0 0 0 0 0
0 0 0 0 0
b3 b2 b V
162
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
všechny vlastní hodnoty
0
pro všechny vektory x. Navíc zjevně
B* = (A* -A)* = A*-A = B.
Hermiteovských maticím B s takovou vlastností říkáme pozitivně semidefinitní a pokud nastane nulová hodnota pouze pro x — 0, pak jim říkáme pozitivně definitní. Obdobně hovoříme o pozitive definitních a a positivně semidefinitních zobrazeních i/r : V —»• V.
Pro každé pozitivně semidefinitní zobrazení i/r : V -> V umíme najít jeho odmocninu, tj. zobrazení tj takové, že rj o tj — i/r. Nejjednodušeji to uvidíme v ortonormální bázi, ve které bude mít Ý diagonální matici. Taková podle našich předchozích úvah vždy existuje a matice A zobrazení ývní bude mít na diagonále nezáporná reálná vlastní čísla zobrazení i/r. Kdyby totiž bylo některé z nich záporné, nebyla by splněna podmínka nezápornosti již pro některý z bázových vektorů. Pak ovšem stačí definovat zobrazení tj pomocí matice B s odmocninami příslušných vlastních čísel na diagonále.
3.32.
Spektra a nilpotentní zobrazení. Na závěr této části se vrátíme k otázce, jak se mohou chovat lineární zobrazení / v úplné obecnosti. Budeme i nadále pracovat s reál-nými nebo komplexními vektorovými prostory.
a snadno zjistíme, že hra skončí s pravděpodobností a + ab + ab2 = 0, 885 prohrou a s pravděpodobností cca 0, 115 výhrou 800 Kč. (Maticí A00 vynásobíme počáteční vektor (0, 1, 0, 0, 0) a dostáváme vektor (a + ab + ab2, 0, 0, 0, b3).) □
3.33. Uvažujme situaci z předchozího případu a předpokládejme, že pravděpodobnost výhry i prohry je 1/2. Označme matici procesu A. Bez použití výpočetního software určete A100. O
3.34. Roztržitý profesor. Uvažujme následující situaci: Roztržitý profesor s sebou nosí deštník, ale s pravděpodobností 1/2 jej zapomene tam, odkud odchází. Ráno odchází do práce. V práci chodí na oběd do restaurace a zpět. Po skončení práce odchází domů. Uvažujme pro jednoduchost, že nikam jinam po dostatečně dlouhou dobu profesor nechodí a že v restauraci zůstává deštník na profesorově oblíbeném místě, odkud si ho může následující den vzít (pokud nezapomene). Uvažte tuto situaci jako Markovův proces a napište jeho matici. Jaká je pravděpodobnost, že se po mnoha dnech po ránu deštník bude nalézat v restauraci? (Je vhodné za časovou jednotku vzít jeden den - od rána do rána.)
Řešení.
/U/16 3/8 l/4> A = 3/16 3/8 1/4 V 1/8 1/4 1/2, Spočítejme třeba prvek a\, tedy pravděpodobnost, že deštník začne den doma a skončí doma (bude tam i druhý den ráno): deštník může putovat třemi disjunktními cestami:
D Profesor ho hned ráno zapomene doma: p\ = \. DPD Profesor si ho vezme do práce, pak ho zapomene vzít na oběd a poté ho večer odnese domů: Pi = \-\-\ = \-DPRPD Profesor bere deštník všude a nikde ho nezapomene: pj, =
lili
2 ' 2 ' 2 ' 2
16-
Celkem a\ = p\ + p2 + pj, =
Vlastní vektor této matice příslušný dominantní vlastní hodnotě 1 je (2, 1, 1), je tedy hledaná pravděpodobnost 1/(2 + 1 + 1) = 1/4. □
3.35. Algoritmus na určování důležitosti stránek. Internetové vyhledávače umí na internetu vyhledat (skoro) všechny stránky obsahující dané slovo či frázi. Jak ale setřídit vyhledané stránky tak, aby uživatel dostal pokud možno seznam seřazený podle relevance daných stránek? Jednou z možností je následující algortitmus: soubor všech nalezených stránek považujme za systém a každou z nalezených stránek za jeden z jeho možných stavů. Popíšeme náhodné procházení těchto stránek jako Markovův proces. Pravděpodobnosti přechodu mezi jednotlivými stránkami jsou dány odkazy: každý odkaz, řekněme ze stránky
163
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
Připomeňme, že spektrum lineárního zobrazení f : V -> V je posloupnost kořenů charakteristického polynomu zobrazení /, včetně násobností. Algebraickou násobností vlastní hodnoty rozumíme její násobnost jako kořenu charakteristického polynomu, geometrická násobnost vlastní hodnoty je dimenze příslušného pod-prostoru vlastních vektorů.
Lineární zobrazení / : V -> V se nazývá nilpotentní, jestliže existuje celé číslo k > 1 takové, že iterované zobrazení /* je identicky nulové. Nejmenší číslo k s touto vlastností se nazývá stupněm nilpotentnosti zobrazení /. Zobrazení / : V -> V se nazývá cyklické, jestliže existuje báze (u\, ...,«„) prostoru V taková, že f(u\) — 0 a /(«/) = m;-i pro všechna / — 2,..., n. Jinými slovy, matice / v této bázi je tvaru
/O 1 0 ...\
A =
0 0 1
7
Je-li f (v) — a ■ v, pak pro každé přirozené k je f (v) — ak ■ v. Zejména tedy může spektrum nilpotentního zobrazení obsahovat pouze nulový skalár (a ten tam vždy je).
Přímo z definice plyne, že každé cyklické zobrazení je nilpotentní, navíc je jeho stupeň nilpotentnosti roven dimenzi prostoru V. Operátor derivování na polynomech, D(xk) — kx1-1, je příkladem cyklického zobrazení na prostorech K„ [x] všech polynomů stupně nejvýše n nad skaláry K.
Kupodivu to platí i naopak a každé nilpotentní zobrazení je přímým součtem cyklických. Důkaz tohoto tvrzení nám dá hodně práce, proto napřed zformulujeme výsledky, ke kterým směrujeme, a pak se teprve dáme do technické práce. Ve výsledné větě o Jordánově rozkladu vvystupují vektorové (pod)prostory a lineární zobrazení na nich s jediným vlastním číslem X a maticí
(X 1 0 ... 0\
0 X 1 ... o
J =
\o 0 0 ... XJ
Takovýmto maticím (a odpovídajícím invariantním podprostorům) se říká Jordánův blok.
Věta (Jordánova věta o kanonickém tvaru). Nechť V je vektorový prostor dimenze n a f : V -> V je lineární zobrazení s n vlastními čísly včetně algebraických násobností. Pak existuje jednoznačný rozklad prostoru V na přímý součet podprostorů
V = Vi ® ■■■ ® vk
takových, že f (Ví) C Ví, zúžení f na každé Ví má jediné vlastní číslo Xi a zúžení f — Xi ■ id na Ví je buď cyklické nebo nulové zobrazení.
Věta tedy říká, že ve vhodné bázi má každé lineární zobrazení blokově diagonální tvar s Jordánovými bloky podél diagonály. Celkový počet jedniček nad diagonálou v takovém tvaru je roven rozdílu mezi celkovou algebraickou a geometrickou násobností vlastních čísel.
3.33. Poznámky. Všimněme si, že jsme Jordánovu větu již dříve plně dokázali v případech, kdy jsou všechna vlastní čísla různá nebo když jsou geometrické a algebraické násobnosti vlastních čísel stejné. Zejména jsme ji plně dokázali pro unitární, normální a samoadjungovaná zobrazení.
A na stránku B určuje pravděpodobnost (l/(celkový počet odkazů ze stránky A)), se kterou se dostaneme ze stránky A na stránku B. Pokud z některé stránky nevedou žádné odkazy, tak ji uvažujeme jako stránku, ze které vedou odkazy na všechny ostatní. Tímto dostaneme pravděpodobnostní matici M (prvek m;i odpovídá pravděpodobnosti, se kterou se dostaneme z i-té stránky na j-tou). Bude-li tedy člověk náhodně klikat na odkazy v nalezených stránkách (pokud se dostane na stránku, ze které nevede odkaz, vybere si náhodně další), tak pravděpodobnost toho, že se v daný okamžik (dostatečně vzdálený od počátku klikání) bude nalézat na i-té stránce odpovídá i-té složce jednotkového vlastního vektoru matice M, odpovídajícího vlastnímu číslu 1. Podle velikosti těchto pravděpodobností pak určíme důležitost jednotlivých stránek.
Tento algoritmus lze modifikovat tím, že budeme předpokládat, že uživatel po nějaké době přestane klikat z odkazu na odkaz a opět začne náhodně na nějaké nové stránce. Řekněme, že s pravděpodobností d vybere náhodně novou stránku a s pravděpodobností (1-d). V takovéto situaci je nyní pravděpodobnost přechodu mezi hbovolnými dvěma stránkami 5; a Sj nenulová, je to totiž d/n+(l-d)/(celkový počet odkazů ze stránky Si), pokud ze stránky 5; vede odkaz na Sj, pokud ne, tak je tato pravděpodobnost d/n (1/n, pokud z Si nevedou žádné odkazy), podle Frobeniovy-Perronovy věty je vlastní hodnota 1 jednonásobná a dominantní, takže jí odpovídající vlastní vektor je jediný (pokud bychom volili pravděpodobnosti přechodu pouze způsobem z předchozího odstavce, tak by tomu tak nemuselo být).
Pro názornost uvažme stránky A, B, C a D. Odkazy vedou z A na B a na C, z B na C a z C na A, z D pak nikam. Uvažujme, že pravděpo-dobnst toho, že uživatel náhodně zvolí novou stránkuje 1/5. Potom by matice M vypadala následovně:
/1/20 1/20 17/20 l/4\
9/20 1/20 1/20 1/4
9/20 17/20 1/20 1/4
\l/20 1/20 1/20 1/4/
Vlastní vektor příslušný vlastní hodnotě 1 je (305/53, 175/53, 315/53, 1), důležitost stránek tedy bude stanovena v pořadí podle velikosti jeho odpovídajících složek, tedy C > A > B > D.
3.36. Jirka má ve zvyku si každý večer zaběhat. Má tři trasy - krátkou, střední a dlouhou. Pokud si někdy zvolí krátkou trasu, následující den si to vyčítá a rozhodne se libovolně (tj. se stejnou pravděpodobností) pro dlouhou, nebo střední. Jestliže si v některý den zvolí dlouhou trasu, v následujícím dnu volí zcela libovolně jednu z tras. Pokud běžel středně dlouhou trasu, cítí se dobře a druhý den si se stejnou pravděpodobností vybere buď střední, nebo dlouhou. Předpokládejte,
M
164
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
Další užitečné pozorovaní je, že pro každé linerání zobrazení přísluší ke každému vlastnímu čislu jednoznačně určený invariantní podprostor, který odpovídá Jordánovým blokům s příslušnou vlastní hodnotou.
Také si všimněme jednoho velice užitečného důsledku Jorda-
tnovy věty (který jsme už použili u diskuse chování Marko-vových řetězců). Předpokládejme, že jsou vlastní hodnoty našeho zobrazení / všechny v absolutní hodnotě menší než jedna. Potom opakované působení lineárního zobrazení na jakémkoliv vektoru v e V vede k rychlému zmenšování všech souřadnic fk(v) nad všechny meze. Skutečně, předpokládejme pro jednoduchost, že na celém V má zobrazení / jediné vlastní číslo X af—X idy je cyklické (tj. omezujeme se na jediný Jordánův blok), a nechť vi,..., vi je příslušná báze. Pak podmínka z věty říká, že f(v2) — Xv2 + v\, f2(v2) — X2v2 + Xv\ + Xv\, a podobně pro ostatní ví a vyšší mocniny. V každém případě při iterování dostáváme stále vyšší a vyšší mocniny X u všech nenulových komponent, přičemž nejnižší z nich může být nejvýše o stupeň nilpotentnosti nižžší než násobnost iterace.
Tím je tvrzení dokázáno (a stejný argumet s aboslutní hodnotou vlastních čísel ostře větší nezjedná vede k neomezenému růstu všech souřadnic iterací fk(v)).
Zbytek této části třetí kapitoly je věnován důkazu Jordánovy \. věty a několika k tomu potřebným pojmům. Je vý-l, razně obtížnější než dosavadní text a čtenář jej může případně přeskočit až do začátku 5. části této kapitoly.
3.34. Kořenové prostory. Na příkladech jsme viděli, že vlastní podprostory popisují dostatečně geometrické vlastnosti jen některých lineárních zobrazení. Zavedeme nyní jemnější nástroj, tzv. kořenové podprostory.
Definice. Nenulový vektor u e V se nazývá kořenovým vektorem lineárního zobrazení V, jestliže existuje a € K a celé číslo k > 0 takové, že((p — a- idy)* («) — 0, tj. k-tá iterace uvedeného zobrazení zobrazuje u na nulu. Množinu všech kořenových vektorů příslušných k pevnému skaláru X doplněnou o nulový vektor nazýváme kořenovým prostorem příslušným ke skaláru X e K, značíme 1Zx-
Je-li u kořenový vektor a k z definice je vybráno nejmenší možné, pak (cp — a- idy)*-1 (u) je vlastní vektor s vlastní hodnotou a. Je tedy 1Zx — {0} pro všechny skaláry X, které neleží ve spektru zobrazení
V platí
(1) Pro každé X e K je TZi C V vektorový podprostor.
(2) Pro každé X, fi e K je 1Z\ invariantní vzhledem k lineárnímu zobrazení ( 0,25 = 0, 1 0,6 0,25 0 0,5/ \0, 1 0,2 0,5/ \1, a pro další výrobek v pořadí potom vektor
'0,375\ /0,8 0,2 0,25\ /0,25N 0, 3 I = I 0, 1 0, 6 0, 25 0, 25 v0,325/ \0, 1 0,2 0,5/ \ 0,5
jehož první složka je hledanou pravděpodobností.
Doplňme, že první metoda řešení (bez zavedení Markovova procesu) vedla k výsledku zřejmě rychleji. Uvědomme si, jak výrazně by se však první metoda znepřehlednila, kdybychom např. místo 18. výrobku uvažovali 20., 22. nebo až 30. výrobek v pořadí. Ve
166
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
3.36. Indukovaná zobrazení na faktorových prostorech.
Předpokládejme, že U C V je invariantní podpro-stor vzhledem k lineárnímu zobrazení
V ■m, a zvolme takovou bázi u\,... ,u„ prostoru V, že prvních k vektorů této báze je bazí U. V této bázi
ma
V/U, (v + u) e (p(v) + U (protože U je invariantní), ((p(v) + U) + ((p(w) + U) — (p(v+w) + U aa-((p(v) + U) — a- V je lineární zobrazení, jehož spektrum obsahuje n prvků (tj. všechny kořeny charakteristického polynomu leží v K a počítáme je včetně násobnosti). Pak existuje posloupnost invariantních podprostorů {0} = Vo c V\ c • • • C V„ — V s dimenzemi dim Vj- = i. V bázi u\,... ,un prostom V takové, že Vi — (u\,..., uí), má (p horní trojúhelníkovou matici:
Ai ... *\
\0 ... k„J
kde X\,..., Xn je posloupnost prvků spektra.
Důkaz. Konstrukci podprostorů Ví provedeme induktivně. Nechť Xi,... ,X„ jsou prvky ve spektru zobrazení
(u + Vk) e V/V*. To znamená, že v každé třídě rozkladu V/V* existuje právě jeden vektor z . Skutečně, tuto vlastnost má faktorový prostor podle libovolného podprostorů v unitárním prostoru - pokud u, v e jsou v jedné třídě, pak jejich rozdíl patří do Vk n Vj^-, tedy jsou stejné. Můžeme tedy jako reprezentanta u^+i nalezené třídy, tedy vlastního vektoru V je libovolné lineární zobrazení (reálného nebo komplexního) unitárního prostoru s m — dim V vlastními hodnotami (včetně násobonosti). Pak existuje ortonormální báze prostoru V taková, že V je lineární zobrazení. Součet kořenových prostorů
nkx,...,nkk
příslušných různým vlastním hodnotám k\..., kk je přímý. Navíc je pro každou vlastní hodnotu k dimenze podprostorů 1Z\ rovna její algebraické násobnosti.
Důkaz. Důkaz provedeme indukcí přes počet k kořeno-\ vých prostorů. Předpokládejme, že tvrzení vždy platí pro méně než k prostorů a že pro vektory
u\ e 1Zxx,..., M* e lZik platí u\ H-----l-w* — 0.Pro
vhodné j pak (
V/lZi nechť je zobrazení indukované cp na faktorovém prostoru. Předpokládejme, že dimenze IZx je menší než násobnost kořenu X charakteristického polynomu. Podle lemma 3.36 to znamená, že a je i vlastní hodnotou zobrazení i/r. Nechť (v +lZi) e V/lZi je příslušný vlastní vektor, tj. ý(v + IZi) = X ■ (v + IZi) což podle definice značí v £ IZ*. a
V, jehož celé spektrum je v K, je V = 1Z\X © • • • © 1Z\n přímým součtem kořenových podprostorů. Zvolíme-li vhodně báze těchto podprostorů, pak cp má v této bázi blokově diagonální tvar s horními trojúhelníkovými maticemi v blocích a vlastními hodnotami a; na diagonále.
3.39. Nilpotentní a cyklická zobrazení. Nyní již máme skoro vše připraveno pro diskusi kanonických tvarů matic. Zbývá jen vyjasnit vztah mezi cyklickými a nilpotent-ními zobrazeními a poskládat dohromady již připravené výsledky.
Věta. Nechť cp V -> V je nilpotentní lineární zobrazení. Pak existuje rozklad V na přímý součet podprostorů V = V\ © • • • © Vk takových, že zúžení cp na kterýkoliv z nich je cyklické.
Důkaz. Ověření je docela přímočaré a spočívá v konstrukci takové báze prostoru V, že akce zobrazení cp na bázových vektorech přímo ukazuje rozklad na cyklická zobrazení. Postup bude ale poněkud zdlouhavý. Něphť k je stupeň nilpotentnosti zobrazení cp a označme P; = imicfř), i = 0, ..., k, tzn.
{0} = Pk C Pk-i C
C Pi C P0
V.
ek„, \ prostoru
Vyberme libo volnou bázi e\ ,. i Pt-1, kde pk-1 > 0 je dimenze Pk-1. Z definice plyne, že Pk-1 c Kenp, tj. vždy
1/2 1/2 1/2 vl/8 1/4 3/8y
splňuje podmínku Perronovy-Frobeniovy věty (všechny její prvky j sou kladné). Hledaný pravděpodobnostní vektor je
1 1 lxr i' 2' 4,
což již dává pravděpodobnosti 1/4, 1/2, 1/4 výskytu po řadě kombinací aa, aA, AA po velmi dlouhé (teoreticky nekonečné) době.
Případ (b). Pro pořadí dvojic alel AA, aA, aa nyní dostáváme pravděpodobnostní matici přechodu
'\ 1/2 (í> 0 1/2 1 v0 0 0y
Ihned vidíme všechna vlastní čísla 1, 1/2 a 0 (odečteme-li je od diagonály, hodnost obdržené matice nebude 3, tj. touto maticí zadaná homogenní soustava bude mít netriviální řešení). Těmto vlastním číslům přísluší po řadě vlastní vektory
1
Proto je
1 0 0\ /l -1 1
0 1/20-0 1 -2
0 0 0/ \0 0 1
1 0 0\ /l 1 1N 0 1/2 0 I - I 0 1 2
0 0 0/ \0 0 1,
Odsud pro libovolné n e N plyne
íl -1 1 \ íl 0 0\" íl 1 r T" = 0 1 -2 0 1/2 0 0 1 2 \0 0 1 / \0 0 0/ \0 0 1,
1 -1 1
0 1 -2 k0 0 1
'1 0 0) 0 2"" 0 k0 0 0;
-1 M /l 0 0
0 1 -2 0 0 0
0 o 1 / Vo 0 0
Zřejmě pro velká neN můžeme nahradit 2 " za 0, což implikuje
Pokud tedy plodí potomky jedinci původní populace výhradně s členy populace, ve které se vyskytuje pouze dvojice alel AA, nutně po dostatečně velkém počtu křížení dojde k tomu, že dvojice a A a aa zcela vymizí (bez ohledu na jejich původní četnost).
169
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
Předpokládejme dále, že již máme sestrojenu bázi podpro-storu Pk-i takovou, že ji můžeme poskládat do schématu
-i '
'1 ' jfc-3
k-l
ek~l '' Pk-i
k-l k-l
■ ' Pk-V Pk-\ + V '
ek~3 ek~3
■ ' Pk-V Pk-\ + V '
k-í k-i
Pk-V cpk-\+V
ek~2
■ ' Pk-2
ek~3 ek~3
■ ' Pk-2' Cpk-2 + V
„k-l k-l 'Pk-2' C»-2 + l'
., e
k-3
Pk-3
ak-l 'Pk-3'
ak-l
'Pk-l
kde hodnota zobrazení cp na libovolném bázovém vektoru se nachází nad ním, nebo je nulová, pokud nad zvoleným vektorem báze již nic není. Pokud je Pk-i / V, opět musí existovat vektory ek~l~l, ..., ek^~l, které se zobrazují na e\~l, můžeme je doplnit do báze Pk-i-i, řekněme vektory
ek ^ a
Pk-i a
k-l-l „k-l-l epk-í + ľ • • • ' ÉPk-l-\-
Přitom postupným odečítáním hodnot iterací zobrazení cp na těchto vektorech dosáhneme opět toho, že doplněné vektory do báze Pk-i-i budou ležet v jádru cp a analogicky jako výše ověříme, že skutečně dostaneme bázi Pk-i-\.
Po k krocích získáme bázi celého V, která má vlastnosti uvedené pro bázi prostoru Pk-i- Jednotlivé sloupce výsledného schématu pak generují hledané podprostory Vi a navíc jsme přímo našli báze těchto podprostorů ukazující, že příslušná zúžení cp jsou cyklická zobrazení. □
3.40. Důkaz Jordánovy věty. Nechť X\,...,Xk jsou všechny různé vlastní hodnoty zobrazení cp. Z předpokladů Jordánovy věty plyne, že V — 1Zxx © • • • © TZ^. Zobrazení cpi — ((p\jzk. —Xi id^) jsou nilpotentní a proto je každý ^ z kořenových prostorů přímým součtem
nXl = Pi,it ®---®Pjt,it
prostorů na nichž je zúžení zobrazení (p — Xf idy cyklické. Matice těchto zúžených zobrazení na Prs jsou Jordánovy bloky příslušné k nulové vlastní hodnotě, zúžené zobrazení cp\ pr s má proto za matici Jordánův blok s vlastní hodnotou Xi.
Pro důkaz Jordánovy věty zbývá dokázat tvrzení o jednoznačnosti. Protože diagonální hodnoty Xi jsou dány jako kořeny charakteristického polynomu, je jejich jednoznačnost zřejmá. Vyjádříme rozměry jednotlivých Jordánových bloků prostřednictvím hodností rk(Xi) zobrazení ((p — Xi ■ idy)*. Tím bude jasné, že až na pořadí jsou bloky jednoznačně určeny. Naopak, přehození bloků odpovídá přečíslování vektorů báze, lze je tedy získat v libo volném pořadí.
Je-li ý cyklický operátor na n-rozměrném prostoru, pak defekt iterovaného zobrazení t/** je k pro 0 < k < n a je n pro všechna k > n. Odtud plyne, že pokud matice J zobrazení cp obsahuje dk (X) Jordánových bloků řádu k s vlastní hodnotou X, pak defekt matice (J — X ■ E)1 je
dx{X) + 2d2{X) + ... ldt{k) + ldl+l{X) + ...
Odtud spočítáme
n - n{X) = dt(X) + 2d2{X) + ■ ■ ■ + ldt{k) + ldl+l{X) + ... dk(X) = rk-i(X) - 2rk(X) + rk+i(X)
Případ (c). Tentokráte budeme mít 6 možných stavů (v tomto pořadí)
AA,AA; aA,AA; aa,AA;
aA,aA; aa,aA; aa,aa,
přičemž tyto stavy jsou dány různými případy genotypů rodičů. Matice odpovídajícího Markovova řetězce je
(1 1/4 0 1/16 0 0\
0 1/2 0 1/4 0 0
0 0 0 1/8 0 0
0 1/4 1 1/4 1/4 0
0 0 0 1/4 1/2 0
0 0 1/16 1/4 v
Pokud budeme např. uvažovat situaci (druhý sloupce), kdy jeden z rodičů má dvojici alel A A a druhý a A, pak zjevně může nastat každý ze čtyř případů (jde-li o dvojice alel jejich dvou náhodně zvolených potomků)
AA,AA; AA,aA; aA,AA; aA,aA
se stejnou pravděpodobností. Pravděpodobnost setrvání ve druhém stavu je proto 1/2 a pravděpodobnost přechodu ze druhého stavu do prvního je 1/4 a do čtvrtého také 1/4.
Nyní bychom měli opět určit mocniny T" pro velká n e N. Uvážením podoby prvního a posledního sloupce ihned zjistíme, že 1 je vlastním číslem matice T. Velmi lehce lze najít vlastní vektory
(l,0,0,0,0,0)r, (0,0,0,0,0, l)T
příslušné vlastnímu číslu 1. Přechodem ke čtyřrozměrné podmatici matice T (vynecháním právě prvního a šestého řádku a sloupce) nalezneme poté zbylá vlastní čísla
1 1 1-y/Š l + y/5
2' 4' 4 ' 4 ' Vzpomeneme-li si na řešení příkladu nazvaného Mlsný hazardér, nemusíme T" počítat. V tomto příkladu jsme dostali stejné vlastní vektory příslušné číslu 1 a ostatní vlastní čísla měla rovněž absolutní hodnotu ostře menší 1 (jejich přesné hodnoty jsme nevyužívali). Dostáváme tak totožný závěr, že proces se blíží k pravděpodobnostnímu vektoru
(a,0, 0, 0,0, 1 -af ,
kde a e [0, 1] je dáno výchozím stavem. Protože pouze na první a šesté pozici výsledného vektoru mohou být nenulová čísla, stavy
útA,AA; aa,AA; aA,aA; aa,aA
po mnohonásobném křížení vymizí. Uvědomme si dále (plyne z předešlého a z příkladu Mlsný hazardér), že pravděpodobnost toho,
170
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
(kde poslední řádek vznikne kombinací předchozího pro hodnoty
l = k- \,k,k+ 1).
3.41. Poznámka. Důkaz věty o existenci Jordánova kanonického . tvaru byl sice konstruktivní, nedává nám ale doko-^^-C^M / naje efektivní algoritmický postup pro jejich hledání. Nyní shrneme již odvozený postup explicitního výpočtu báze, v níž má dané zobrazení cp : V -> V matici v kanonickém Jordánově tvaru.
(1) Najdeme kořeny charakteristického polynomu.
(2) Jestliže jich je méně než n — dim V, včetně násobností, kanonický tvar neexistuje.
(3) Je-li n lineárně nezávislých vlastních vektorů, získáme bázi V z vlastních vektorů a v ní má cp diagonální matici.
(4) Nechť X je vlastní hodnota s geometrickou násobností menší než algebraickou avi,... ,vk nechť jsou příslušné vlastní vektory. To by měly být vektory na horním okraji schématu z důkazu věty 3.39, je ovšem nutné najít vhodnou bázi aplikacemi iterací
W zadáno maticí v blokově diagonálním
tvaru s jednotkovou maticí, s rozměrem daným dimenzí obrazu /, a s nulovými bloky všude kolem. To lze přeformulovat takto: Každou matici A typu m/n nad polem skalárů K lze rozložit na součin
Ô,
'E 0^
kde P a Q jsou vhodné invertibilní matice.
Pro čtvercové matice jsme v 3.32 ukázali při diskusi vlastností lineárních zobrazení / : V -> V na komplexních vektorových prostorech, že každou čtvercovou matici A dimenze m umíme rozložit na součin
A — P ■ B ■ P~\
kde B je blokově diagonální s Jordánovými bloky příslušnými k vlastním číslům na diagonále. Skutečně jde o pouhé přepsání Jordánovy věty, protože násobení maticí P a její inverzí z opačných stran odpovídá v tomto přípaě právě změně báze na vektorovém prostoru V a citovaná věta říká, že ve vhodné bázi má každé zobrazení Jordánův kanonický tvar.
Obdobně jsme také při diskusi samoadjungovaných zobrazení dokázali, že pro reálné symetrické nebo komplexní Hermiteovské matice existuje vždy rozklad na součin
A — P ■ B ■ P*,
kde B je diagonální matice se všemi (vždy reálnými) vlastními čísly na diagonále, včetně násobností. Skutečně, jde opět o součin s maticemi vystihující změnu báze, nicméně připouštíme nyní
a^ + ab + —j + yiA + ab + — j ^ab + bc + 2ac + —
1/ b2
+ — I ab + bc + 2ac -\--
4 V 2
a + ab H--) I ab + bc + 2ac -\--I +
+ ( ab + bc + 2ac +
2
cz + bc + ^-] +
+ 2 [a2 + ab +
c +bc H--+ - ab + bc + 2ac -\--
4 7 2 V 2
, , , b2\2 ( b2\ ( 7 b2
ť7 = ( cl + bc + — j + \ab +bc + 2ac + — j I cl + bc + —
1 / b2
+ — I ab + bc + 2ac -\--
4 V 2
Lze ukázat (využitím a + b + c = 1), že
b2 b2 b2
t\=a2+ab-\--, ň = ab + bc + 2ac-\--, ň=c2 + bc-\--,
z 4 2 4
tj-
/ a2 + ab + b2/4 \ í a2+ab+b2/4
T : \ab+bc + 2ac+ b2/2 j \ab + bc + 2ac + b2/2
\ c2 + bc + b2/4 ) \ c2 + bc + b2/4
Získali jsme tak překvapivý výsledek, že dalším aplikováním transformace T se vektor obdržený v prvním kroku nezmění. To znamená, že výskyt uvažovaných dvojic alel je po libovolně dlouhé době totožný jako v první generaci potomstva. Pro velkou populaci jsme tak dokázali, že evoluční vývoj by se realizoval během jediné generace, kdyby nedocházelo k mutacím nebo k selekci. □
3.40. Nechť jsou dány dvě urny, které obsahují dohromady n bílých a n černých koulí. V pravidelných časových intervalech je z obou uren vylosována jedna koule a přemístěna do druhé urny, přičemž počet koulí v obou urnách je na začátku (a tedy po celou dobu) právě n. Zadejte tento Markovův proces pravděpodobnostní maticí přechodu T.
Řešení. Tento příklad se používá ve fyzice jako model prolínání dvou nestlačitelných kapalin (již v roce 1769 ho zavedl D. Bernoulli) nebo analogicky jako model difúze plynů. Stavy 0,1,... ,n budou odpovídat kupř. počtu bílých koulí v jedné pevně zvolené urně. Tento údaj totiž současně zadává, kolik černých koulí je ve zvolené urně (všechny ostatní koule jsou pak ve druhé z uren). Pokud v jistém kroku dojde ke změně stavu j e {1,...,«} na j — 1, znamená to, že ze zvolené urny
172
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
pouze změny mezi mezi ortonormálními bázemi a proto i matice přechodu P musí být ortogonální. Odtud P~l = P*.
Pro reálná ortogonální zobrazení jsme odvodili obdobné vyjádření jako u symetrických, pouze naše B bude blokově diagonální s bloky rozměru dva nebo jedna vyjadřujícími buď rotaci nebo zrcadlení nebo identitu vzhledem k příslušným podpro-storům.
3.44. Věta o singulárním rozkladu. Nyní se vrátíme k obecným lineárním zobrazením mezi (obecně různými) vektorovými prostory. Jestliže na nich je definován skalární součin a omezíme se přitom na ortonormální báze, musíme postupovat o hodně rafinovaněji, než v případě bazí libo volných:
Věta. Nechť A je libovolná matice typu m/n nad reálnými nebo komplexními skaláry. Pak existují čtvercové unitární matice U a V dimenzím an, a reálná diagonální matice s nezápornými prvky D dimenze r, r < minfm, n\, takové, že
'D 0\ 0 0)
A = USV*, S
a r je hodnost matice A A*. Přitom je S určena jednoznačně až na pořadí prvků a prvky diagonální matice D jsou druhé odmocniny vlastních čísel di matice A A*. Pokud je A reálná matice, pak i matice U a V jsou ortogonální.
Důkaz. Předpokládejme nejprve m < n a označme
Km zobrazení mezi reálnými nebo komplexními prostory se standardními skalárními součiny, zadané maticí A ve standardních bazích.
Tvrzení věty můžeme přeformulovat tak, že existují ortonormální báze na K" a Km ve kterých bude mít
diagonální matici s vlastními čísly na diagonále. Jinými slovy, existuje unitární matice V taková, že A* A = VBV* pro reálnou diagonální matici s nezápornými vlastními čísly (d\, d2,..., dr, 0,..., 0) na diagonále, di / 0 pro všechny / = 1,..., r. Odtud
B = V*A*AV = (AV)*(AV).
To je ale je ekvivalentní tvrzení, že prvních r sloupců matice A V je ortogonálních a zbývající jsou nulové, protože mají nulovou velikost.
Označme nyní prvních r sloupců v\,... ,vr e Rm. Platí tedy (vi, ví) = di,i = l,..., r, a normované vektory u i = -^vi tvoří ortonormální systém nenulových vektorů. Doplňme je na ortonormální bázi u = u i, ... ,u„ celého Km. Vyjádříme-li naše původní zobrazení cp v bazích uinaK" a u na Km, dostáváme matici \f~B. Přechody od standardních bází k nově vybraným odpovídají násobení zleva ortogonálními maticemi U a zprava V~l = V*.
Pokud je m > n, můžeme aplikovat předchozí část důkazu na matici A*. Odtud pak přímo plyne požadované tvrzení.
Pokud pracujeme nad reálnými skaláry, jsou všechny naše kroky v důkazu výše také realizovány v reálném oboru. □
Tento důkaz věty o singulárním rozkladu je konstruktivní a můžeme jej opravdu použít pro výpočet unitárních, resp. ortogonálních, matic U, V a diagonálních nenulových prvků matice S.
byla vytažena bílá koule a z druhé černá. To se stane s pravděpodobností
]_ ]_
n n
ľ
Přechodu ze stavu j e {0,..., n—1} do j +1 odpovídá vytažení černé koule ze zvolené urny a bílé z té druhé s pravděpodobností
n ~ j n - j (n - j)2
n n
Soustava zůstane ve stavu j e {1, ..., n — 1}, jestliže z obou uren byly vytaženy koule stejné barvy, což má pravděpodobnost
l _ n- j n- j j 2 j (n - j) n
Dodejme, že ze stavu 0 se nutně (s pravděpodobností 1) přechází do stavu 1 a že ze stavu n se s jistotou přechází do stavu n — í. Uvážením výše uvedeného dostáváme hledanou matici
í°
2- l(n - 1)
0 (n - l)2
0
0 V0
0
o
o
22
2 • 2(n - 2)
0 0 0
2 • (n - 2)2
22 0
0 0
0
(n - l)2
2- (n - 1)1
1
pro pořadí stavů 0,1,... ,n.
Při užití tohoto modelu ve fyzice nás samozřejmě zajímá složení uren po uplynutí určité doby (po daném počtu výměn v závislosti na předešlém složení uren). Bude-li počáteční stav např. 0, můžeme pomocí mocnin matice T sledovat, s jakou pravděpodobností přibývají ve zvolené urně bílé koule. Také lze potvrdit očekávaný výsledek, že počáteční rozdělení koulí bude ovlivňovat jejich rozdělení po delší době zanedbatelným způsobem.
Kdybychom jednotlivé koule očíslovali, místo výběru po jedné kouli z uren vylosovali nějaké z čísel 1, 2,..., 2n a kouli, jejíž číslo bylo vytaženo, přemístili do druhé urny, obdrželi bychom Markovův proces se stavy 0, 1,..., 2n (počet koulí ve zvolené urně), kdy se tak už nerozlišuje barva koulí. Tento Markovův řetězec je rovněž ve fyzice důležitý. (P. a T. Ehrenfestovi jej zavedli v roce 1907.) Používá se jako model výměny tepla mezi dvěma izolovanými tělesy (teplota je reprezentována počtem koulí, tělesa urnami). □
3.41. Dva hráči A, B hrají o peníze opakovaně jistou hru, která může skončit pouze vítězstvím jednoho z hráčů. Pravděpodobnost výhry hráče A je v každé jednotlivé hře p e [0, 1/2) a oba sází vždy (v libovolné hře) jen 1 Kč, tj. po každé hře s pravděpodobností p dá 1 Kč
173
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
3.45. Geometrická interpretace. Diagonálním hodnotám matice D z předchozí věty se říká singulární hodnoty matice A. Přeformulujme si tuto větu v reálném případě geometričtěji.
Pro příslušné lineární zobrazení
mají singulární hodnoty skutečně jednoduchý geometrický význam: Nechť K c M" je jednotková sféra pro standardní skalární součin. Obrazem (p(K) pak vždy bude (případně degenerovaný) m-rozměrný elipsoid. Singulární čísla matice A jsou přitom velikosti hlavních poloos a věta navíc říká, že původní sféra vždy připouští ortogonální sdružené průměry, jejichž obrazem budou právě všechny poloosy tohoto elipsoidu.
Pro čtvercové matice je vidět, že A je invertibilní právě, když všechna singulární čísla jsou nenulová. Poměr největšflio a nejmenšího singulárního čísla je důležitým parametrem pro robustnost řady numerických výpočtů s maticemi, např. pro výpočet inverzní matice. Poznamejme také, že existují rychlé metody výpočtů, resp. odhadů, vlastních čísel, proto lze se singulárním rozkladem velmi efektivně pracovat.
3.46. Věta o polárním rozkladu. Věta o singulárním rozkladu je východiskem pro mnoho mimořádně užitečných nástrojů. Uvažujme nyní nad několika přímými
-/—, důsledky (které samy o sobě jsou dosti netriviální). Tvrzení věty říká pro libovolnou matici A, ať už reálnou nebo komplexní, A = U SW* s diagonální S s nezápornými reálnými čísly na diagonále a unitárními U,W. Pak ovšem také A = USU*UW* a pojmenujme si matice P = USU*, V = UW*. První z nich, P je hermiteovská (v reálném případě symetrická) a pozitivně semi-defmitní, protože jde jen o zápis zobrazení s reálnou diagonální maticí S v jiné ortonormální bázi, zatímco V je coby součin dvou unitárních opět unitární (v reálném případě ortogonální). Navíc A* = WSU* a tedy AA* = USSU* = P2 a naše matice P je vlastně odmocninou ze snadno spočítatelné hermiteovské matice AA*.
Předpokládejme, že A = P V = Q U j sou dva takové rozklady matice A na součin positivně semidefinitní hermiteovské a unitární matice a předpokládejme, že A je invertibilní. Pak ovšem je
AA* = PVV*P
QUU*Q = Q2
pozitivně definitní a proto jsou matice Q = P = VÄÄ* jednoznačně určené a invertibilní. Pak ovšem také U = V = P~l A.
Beze zbytku jsme tedy odvodili velice užitečnou analogii rozkladu reálného čísla na znaménko (ortogonální matice v případě dimenze jedna jsou právě ±1) a absolutní hodnotu (matice P, ke které umíme odmocninu).
Věta (Věta o polárním rozkladu). Každou čtvercovou komplexní matici A dimenze n lze vždy vyjádřit ve tvaru A = P ■ V, kde P je hermiteovská a positivně definitní čtvercová matice téže dimenze a V je unitární. Přitom P = V AA*. Je-li A invertibilní, je rozklad jednoznačný a V = (VAA*)~lA.
Pokud pracujeme nad reálnými skaláry, je P symetrická a V ortogonální.
Když budeme tutéž větu aplikovat na A* místo A, dostaneme tentýž výsledek, ovšem s obráceným pořadím hermiteovských a unitárních matic. Matice v příslušných pravých a levých rozkladech budou samozřejmě obecně různé.
hráč B hráči A a s pravděpodobností 1 — p naopak 1 Kč dá hráč A hráči B. Hrají ovšem tak dlouho, dokud jeden z nich nepřijde o všechny peníze. Jestliže má hráč A na začátku x Kč a hráč B má y Kč, určete pravděpodobnost, že hráč A vše prohraje.
Řešení. Tato úloha se nazývá Rumování hráče. Jedná se o speciální Markovův řetězec (viz také příklad Mlsný hazardér) s mnoha důležitými aplikacemi. Hledaná pravděpodobnost činí
(3.6)
x+y'
Povšimněme si, jaká je tato hodnota pro konkrétní volby p,x,y. Kdyby hráč B chtěl mít téměř jistotu a požadoval, aby pravděpodobnost, že hráč A s ním prohraje 1000 000 Kč, byla alespoň 0,999, potom stačí, aby měl 346 Kč, je-li p = 0, 495 (či 1727 Kč, je-li p = 0, 499). Proto je ve velkých kasinech možné, aby „vášniví" hráči mohli hrát téměř spravedlivé hry. □
3.42. V rámci jisté společnosti fungují dvě navzájem si konkurující oddělení. Vedení společnosti se rozhodlo, že každý týden bude poměřovat relativní (vzhledem k počtu zaměstnanců) zisky dosažené těmito dvěma odděleními. Do oddělení, které bude úspěšnější, pak budou přeřazeni dva pracovníci z druhého oddělení. Tento proces má probíhat tak dlouho, až jedno z oddělení zanikne. Získali jste zaměstnání v této společnosti a můžete si vybrat jedno z těchto dvou oddělení, kde budete pracovat. Chcete si zvolit to, které nebude v důsledku vnitropodnikové konkurence zrušeno. Jaká bude Vaše volba, když jedno oddělení má nyní 40 zaměstnanců, druhé 10 a když odhadujete, že to v současnosti menší z nich bude mít větší relativní zisky v 54 % případů? O
Další využití Markovových řetězců viz příloha za kapitolou.
E. Unitární prostory
Již v minulé kapitole jsme definovali skalární součin v reálných vektorových prostorech (2.40), v této kapitole rozšiřujeme jeho definici i na komplexní vektorové prostory (3.23).
3.43. Grupy O(n) a U(n). Uvážíme-li všechna lineární zobrazení z R3 do R3, která zachovávají daný skalární součin, tedy vzhledem k definicím délky vektorů a odchylky dvou vektorů lineární zobrazení zachovávající délky a úhly, tak tato tvoří zřejmě vzhledem ke skládání zobrazení grupu (viz 1.1; složení dvou takových zobrazení je z definice zobrazení zachovávající délky a úhly, jednotkovým prvkem je identické zobrazení, inverzním prvkem k danému zobrazení je zobrazení k němu inverzní - díky podmínce na zachvávání velikostí existuje).
174
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
V komplexním případě je analogie s rozkladem čísel ještě zábavnější — pozitivně semidefinitní P hraje opět roli absolutní hodnoty komplexního čísla, unitární matice V pak má jednoznačné vyjádření jako součet - V — re V + i im V s hermiteovkými reálnými a imaginárními částmi a s vlastností (re V)2 + (im V)2 — E, tj. dostáváme plnou analogii goniometrického tvaru komplexních čísel (viz závěrečná poznámka v 3.30). Všimněme si ale, že ve vícerozměrném případě je podstané, v jakém pořadí tento „goniometrický tvar" matice píšeme. Jde to oběma způsoby, výsledky jsou ale obecně různé.
Pro řadu praktických aplikací bývá rychlejší použití tzv. QR rozkladu matic, který je obdobou Schurovy věty o ortogonální triangulaci:
3.47. Věta. Pro každou komplexní matici A typu m/n existuje unitární matice Q a horní trojúhelníková matice R takové, že A = QTR.
Pokud pracujeme nad reálnými skaláry, jsou Q i R reálné.
Důkaz. V geometrické formulaci potřebujeme dokázat, že pro každé zobrazení
Km s maticí A ve standardních bazích můžeme zvolit novou ortonormální bázi na Km tak, aby potom
(e;) v bázi u vystupují pouze vektory u\,...,ui. Zobrazení
s=(o 0
je její singulární rozklad (zejména D je invertibilní). Matici
0
A*:=VŠU*, =
nazýváme pseudoinverzní matice k matici A.
Jak ukazuje následující věta, je pseudoinverze důležité zobecnění pojmu inverzní matice, včetně přímočarých aplikací.
3.49. Věta. Nechť A je reálná nebo komplexní matice typu m/n. Pak pro její pseudoinverzní matici platí:
Matice těchto zobrazení tedy tvoří vzhledem k násobení matic grupu (viz), říkáme jí ortogonální grupa, značíme 0(n). Je to podgrupa všech invertibilních zobrazení z W do M.".
Požadujeme-li navíc po maticích zobrazení, aby měly determinant roven jedné, hovoříme o speciální ortogonální grupě SO(n) (obecně může být determinantem matice z 0(n) číslo 1 či — 1).
Obdobně definujeme unitární grupu U(n) jakožto grupu všech (komplexních) matic, které odpovídají komplexně lineárním zobrazením z C" do C", která zachovávají daný skalární součin v unitárním prostoru. Stejně pak SU(n) značí podgrupu matic v U(n) s jednotkovým determinantem (obecně může být determinantem libovolná komplexní jednodnotka).
3.44. Uvažujme vektorový prostor V funkcí R -» C. Určete, zda je zobrazení
1.
175
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
(1) Je-li A invertibilní (zejména tedy čtvercová), pak
(2) Pro pseudoinverzi A^ platí, že A^A i AA^ jsou hermiteovské (v reálném případě symetrické) a
AA^A — A, A*AA* = A*.
(3) Pseudoinverzní matice A^ je čtyřmi vlastnosti z předchozího bodu určena jednoznačně. Pokud tedy nějaká matice B typu n x m splňuje, že BA i A B jsou hermiteovské, ABA — A a BAB = B,pakB = A1".
(4) Je-li A matice systému lineárních rovnic Ax — b, s pravou stranou b e W", pak vektor y — A^b e K" minimalizuje velikost \\Ax — b\\ pro všechny vektory x e K".
(5) Systém lineárních rovnic Ax — b s b e Km je řešitelný, právě když platí AA^b — b. V tomto případě jsou všechna řešení dána výrazem
x = Atb+(E - A*A)u, kde u € K" je libovolné.
Důkaz. (1): Je-li A invertibilní, pak je matice S — U*AV Jj« také invertibilní a přímo z definice je S' — S~ľ. Odtud vyplývá A(_1) A = AA(_1) = E.
(2): Přímým výpočtem dostáváme SS'S — Sa
f í? 1 S'SS = S, proto
AA(_1)A = USV*VSU*USV* = USSSV* = U SV* = A a analogicky pro druhou rovnost. Dále
(AA(_1))* = (USSU*)* = U (S1)* S* U*
= U(SS)*U* = USSU* = AA(_1)
a podobně se ukáže (A(-l)A)* = A(_1)A.
(3) Tvrzení dokážeme přímým výpočtem. Uvažme na chvíli zobrazení
Km, x i-> Ax, a přímé součty K" = (Kerip)1- © Ker
Im
a doplníme je na ortonormální báze na celých prostorech, bude mít q> matici S a
minimalizující vzdálenost \\b — z\\ (tj. reahzující vzdálenost od afinního podprostoru p(b, lmcp), viz další kapitola) právě komponenta z — b\ rozkladu b — b\ + b2, b\ e \m(p,bi e (Im(p)-1. Přitom ale ve zvolené bázi je zobrazení qf~^, původně zadané ve standardních bazích pseudoinverzí A(_1), dáno maticí S' z věty o singulárním rozkladu, zejména je (p(-1} (Im(p) = (Ker cp)1- a D'1 matici zúžení cp^^ a je nulové. Je tedy skutečně
n. Např. máme experimentem dáno mnoho naměřených reálných hodnot b j a chceme najít lineární kombinaci několika funkcí f i, která bude co nejlépe aproximovat hodnoty b j. Skutečné hodnoty zvolených funkcí v bodech y j e R zadají matici — f j (y i),
Řešení. Pro libovolný vektor i; platí
„ „ „ „ „ „ dv d(xv)
[x, p]v = xpv — pxv = x(—i—) + i-
dx dx
a odtud už přímo vyplývá naše tvrzení. 3.49. Ukažte
[x — p, x + p] = 2i
IV
□
Řešení. Evidentně platí [x,x] — 0 a [p, p] z linearity komutátoru a z minulého příkladu.
0 a zbytek vyplývá
□
3.50. Jordánův tvar. Najděte Jordánův tvar matice A a napište příslušný rozklad. Jaká je geometrická interpretace rozkladu této matice?
-i ŕ
-6 Aj
-i ŕ
-4 3,
i) A
ii) A
Řešení. i)Nejprve spočítáme charakteristický polynom matice A
|A - XE\
■1
X 1
4 - X
X-3X + 2
Vlastní čísla matice A jsou kořeny tohoto polynomu, to znamená
X 1,2 = 1,2. Prtotože matice je řádu dva a máme dvě různé vlastní
'1 0^
hodnoty, je Jordánův tvar diagonální matice J
0 2
. Vlastní
(A - E)x
vektor (x, y) příslušný vlastní hodnotě 1 splňuje 0
6 3) (y)' ^' _2x ^ = ®' ^° Jsou právě násobky vektoru (1,2). Podobně zjistíme, že vlastním vektorem k vlastní hodnotě 2 je (1,3).
Matici P pak dostaneme napsáním těchto vlastních vektorů do sloupců,
1 ť
2 3,
' 3 -ť -2 1
tj. P = [ ^ ^ ). Pro matici A pak máme A = P ■ J ■ P l. Inverzní matice k f má tvar P~l = | / I a dohromady pak dostáváme
-6 4J \2 3J\0 2J\-2 1 Tento rozklad nám říká, že matice A určuje takové lineární zobrazení, které má v bázi vlastních vektorů (1,2), (1,3) výše uvedený diagonální tvar. To znamená, že ve směru (1,2) se nic neděje a ve směru (1, 3) se každý vektor protáhne na svůj dvojnásobek.
ii) Charakteristický polynom matice A je v tomto případě
1 — A 1
-4 3 — X
\A-XE\
Dostáváme tedy dvojnásobný kořen X (x, y) splňuje
0 = (A — E)x =
--1-21 + 1= 0 1 a příslušný vlastní vektor
-2 1 -4 2
177
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
jejíž sloupce jsou dány hodnotami jednotlivých funkcí f j v uvažovaných bodech, a naším úkolem je tedy určit koeficienty x j e R tak, aby součet kvadrátů odchylek od skutečných hodnot
m n m n
- <£v///(vŕ))r = - (Eatjxj))2
i = l j=l i = l 7=1
byl minimální. Jinými slovy, hledáme lineární kombinaci funkcí f i takovou, abychom „dobře" proložili zadané hodnoty bi. Díky předchozí větě jsou hledané optimální koeficienty A^^b.
Abychom měli konkrétnější představu, uvažujme pouze dvě funkce fi(x) — x, f2(x) — x2 a předpokládejme, že „naměřené hodnoty" jejich neznámé kombinace g(x) — y\x + y2x2 v celočíselných hodnotách pro x mezi 1 a 10 jsou bT — (1.44 10.64 4.48 14.56 31.12 39.20 54.88 71.28 85.92 104.16). Tento vektor vzniknul výpočtem hodnot x + x2 v daných bodech posunutých o náhodné hodnoty v rozmezí ±8. Matice A — (bij) je tedy v našem případě rovna
'1 234 5 6 7 8 9 10 ~ 1 4 9 16 25 36 49 64 81 100y
AT =
a hledané koeficienty v kombinaci jsou
ic-i>.*=r0-61'
\0.99
y = A{
Výsledné proložení je možné dobře vidět na obrázku, kde zeleně jsou proloženy zadané hodnoty b lomenou čarou, zatímco červený je graf příslušné kombinace g. Výpočty byly provedeny v systému Maple pomocí příkazu leastsqrs(B,b). Pokud jste s Maplem (nebo jiným podobným softwarem) spřáteleni, zkuste si zaexperimento-vat s podobnými úlohami.
100-
To jsou, opět jako v minulém příkladu, násobky vektoru (1, 2). To, že řešením této rovnice nejsou dva lineárně nezávislé vektory, říká, že Jordánův tvar v tomto případě nebude diagonální, ale bude to matice
1 1 0 1
. Bázi, ve které má matice A tento tvar, tvoří vlastní vektor
(1, 2) a vektor, který se na tento vektor zobrazí zobrazením A — E. Je tedy řešením soustavy rovnic
-2 1 -4 2
-2 1 0 0
To jsou násobky vektoru (1,3). Dostáváme tedy stejnou bázi jako v minulém příkladu a můžeme psát
-4 3/ \2 3J\0 \J\-2 1 Zobrazení teď působí na vektor tak, že složka ve směru (1,3) zůstává stejná a ke složka ve směru (1, 2) se bude násobit součtem koeficientů, které určují složky ve směrech (1, 3) a (1, 2). □
3.51. Najděte Jordánův tvar matice A a napište příslušný rozklad. Jaká je geometrická interpretace rozkladu této matice?
A\ = i ^ ^2 4^ a A2 = | ^ a nakreslete (narýsujte), jak
se vektory i; = (3, 0), A\ v a A2v rozkládají vzhledem k bázi vlastních vektorů matice Ai 2.
Řešení. Matice mají stejné Jordánovy tvary jako matice v minulém příkladu a obě je mají v bázi tvořenou vektory (1, 2) a (1, — 1), tj.
■1
a
■2 4 1
1 0
0 2
~ 5 _1 ) = ( 1 1
3 V4 1 / V2 -1
Pro vektor i; = (3, 0) dostáváme i;
1
1 11 0 l)\2 -1, (1, 2) + 2(1, -1) a pro jeho
obrazy A\v = (5, —2) (2 + 1) • (1,2) + 2 • (1,
: (1,2) + 2 • 2 • (1, -1) a A2v ■1).
(5,4)
□
F. Rozklady matic
3.52. Vyvraťte nebo dokažte:
• Nechť A je čtvercová matice n x n. Pak je matice AT A je symetrická.
• Nechť čtvercová matice A má pouze kladné reálné vlastní hodnoty. Pak je A symetrická.
3.53. Nalezněte LU-rozklad následující matice:
-2 1 0 -4 4 2 -6 1 -1,
178
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
Řešení.
'l 0 0\ (-2 1 0^ 2 1 0 0 2 2
v3 "I 1/VO 0 Nejprve vynásobíme matice odpovídající Gaussově eliminaci, dostáváme tak pro původní matici A, XA = U, kde X je dolní trojúhelníková daná zmíněným součinem, U horní trojúhelníková. Z této rovnosti máme A = X~l U, což je hledaný rozklad (musíme tedy spočítat inverzi k X). □
/l 1 0\
3.54. Nalezněte L [/-rozklad matice 1 -12. O
v- 1 -v
3.55. Ray-tracing. V počítačové 3D-grafice se obraz zobrazuje pomocí algoritmu Ray-tracing. Základem tohoto algoritmu je aproximace světelných vln paprskem (přímka) a aproximace zobrazovaných objektů mnohostěny. Ty jsou tedy ohraničeny rovinami a je potřeba spočítat, kam se na těchto rovinách odráží světelné paprsky. Z fyziky přitom víme, jak se paprsky odráží - úhel odrazu je roven úhlu dopadu. Z touto problematikou v rovině jsme se již potkali v příkladu || 1.64||.
Paprsek světla ve směru i; = (1, 2, 3) dopadá na rovinu určenou rovnicí x + y + z = 1. V jakém směru se paprsek odrazí? Řešení. Jednotkový normálový vektor k rovině je « = -^(1,1,1). Vektor určující směr odraženého paprsku v r bude ležet v rovině určené vektory v,n. Můžeme jej tedy vyjádřit jako lineární kombinaci těchto vektorů. Zároveň nám pravidlo úhel odrazu je roven úhlu dopadu jinými slovy říká, že (v,n) = —{vR,n). Odtud dostaneme kvadratickou rovnici pro koeficienty lineární kombinace.
Příklad můžeme vyřešit i jednoduším, geometrickým způsobem. Z obrázku můžeme přímo odvodit,že
vR = v — 2{v, n)n
a v našem případě dostáváme vR = (—3, —2, —1). □
3.56. Singulární rozklad,polární rozklad, pseudoinverze.
/O 0 -A
Spočítejte singulární rozklad matice A = 1—1 0 Ol. Ná-
\ 0 0 0 /
sledně spočítejte její polární rozklad a najděte její pseudoinverzi.
Řešení. Nejprve spočítáme AT A:
/ 0 -1 0\ / 0 0 -A /l 0 0^ ATA =0 0 0-1 0 0=00 0
W 0 °/ V 0 0 0 / \o o i
a dostáváme diagonální matici. Potřebujeme ale najít takovou ortonormální bázi, ve které je matice diagonální a nulový řádek je až poslední. Toho zjevně docílíme otočením o pravý úhel kolem osy x (souřadnice y přejde na z a z přejde na -y). Toto otočení je ortogonální transformace
179
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
daná matici V = I 0 0 II. Tím jsme bez počítání našli rozklad Vo -1 o)
AT A = VBVT, kde B je diagonální s vlastními čísly (1, |, 0) na diagonále. Protože teď máme B = (AV)T(A V), tvoří sloupce matice 0 0 -A íl 0 0\ / 0 i 0^
0 0 0 / \0 -1 0/ \ 0 0 0y ortogonální systém vektorů, který znormalizujeme a doplníme do báze.
Ta má pak tvar (0, -1, 0),(1, 0, 0), (0, 0, 1). Matice přechodu od této
/0 1 0\
báze ke standardní je pak U =1—1 0 0 I. Dohromady tak dostá-
\0 0 l)
váme rozklad A = U\ÍBVT
0 0 -1 0 0 0 0
Geometricky lze rozklad zobrazení interpretovat tak, že nejprve se vše otočí o pravý úhel kolem osy x, pak následuje projekce do roviny xy taková, že jednotková koule se zobrazí do elipsy s hlavními poloosami 1 a \ a výsledek se otočí o pravý úhel kolem osy z.
Polárni rozklad A = P ■ W dostaneme ze singulárního jednoduše: P := U\f~BUJ a W := UVT,
Pseudoinverzní matice je dána výrazem A( l) := V S U1, kde S '\ 0 0\
0 2 0. Máme tedy ,0 0 0/
A(-D
□
3.57. QR rozklad. QR rozklad matice A se dobře hodí v případě, když je dán systém lineárních rovnic Ax = b, který sice nemá řešení, ale my potřebujeme najít jeho co nejlepší přiblížení. Chceme tedy minimalizovat IIAx — b\\. Podle Pythagorovy věty máme ||Ax — b\\2 =
180
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
II Ax — b\\ II2 + H&jJI2, kde b jsme rozložili na b\\, které patří do obrazu matice A a na bj_, které je k tomuto obrazu kolmé. Projekci na obraz matice A můžeme psát ve tvaru QQT pro vhodnou ortogonální matici Q. Konkrétně tuto matici získame Gram-Schmidtovou or-tonormalizací sloupců matice A. Potom máme b\\ = QQTb a proto Ax — b y = Q(QT Ax — QTb). Soustava v závorce už má řešení, pro které potom dostáváme \\Ax — b \\ = \\bj_\\, což je minimálni hodnota. Navíc matice R := QT A je horní trojúhelníková a proto požadované přibližné řešení najdeme velmi lehce.
Najděte přibližné řešení soustavy rovnic
x + 2y = 1 2x + 4y = 4
feienf.Mämetedysousfcvu^sA^ J) a » = (\
(která evidentně nemá řešení). Uděláme tedy ortonormalizaci sloupců matice A. Vezmeme první z nich a vydělíme ho jeho velikostí. Tím
dostaneme první vektor ortonormální báze . Druhý dostaneme
tak, že od druhého sloupce odečteme jeho komponentu ve směru už nalezeného prvního vektoru ortonormální báze. Druhý vektor je ovšem dvojnásobek prvního a proto v ortonormalizaci nulový. Máme proto
Q = -jj ■ Projektor na obraz matice A je pak QQT = \(\^ 4^> dále spočítáme
Qlb-7l(l 2)(')^
a
R-T,{x 2)0 4) = 7|<' »>
Přibližné řešení pak splňuje Rx = QTb a to v našem případě znamená 5x + 9y = 9 (přibližné řešení tedy není jednoznačné). QR rozklad matice A je
'\ 2\ 1 /1\ 1
□
2 9)
2 -1 -1\
3.58. MinimaUzujte \\Ax - b\\ pro A = | — 1 2 — 1 I a ŕ =
s 1 -1 2) ')
0 I a napište QR rozklad matice A.
Řešení. Normalizovaný první sloupec matice A je 000 e\ = I — 1 I. Z druhého sloupce odečteme jeho složku ve
181
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
směru e\. Máme
a proto dostaneme
-1\ /-l 2
-1
Tím jsme vyrobili ortogonální vektor, který normujeme a dosta-
neme e2 = I 1 I. Tretí sloupec matice A je už lineárně 1-1/
závislý (můžeme ověřit spočítáním determinantu). Hledaná sloup-cově-ortogonální matice je tedy
1 í2 °
Dále spočítáme
Vě U 3V3 -3>/3/
Řešením rovnice Rx = QTb je x = y = z. Násobky vektoru (1,1,1) tedy minimalizují \\Ax — b\\.
Zobrazení určené matici A je projekce na rovinu s normálovým vektorem (1,1, 1).
□
3.59. Lineární regrese. Znalosti, které j sme se v této kapitole naučili lze s výhodou použít v praxi při řešení problémů pomocí lineární regrese. Jde o to nalézt nejlepší přiblížení nějaké funkční závislosti pomocí lineární funkce.
Máme tedy zadánu funkční závislost v několika bodech (například zkoumáme hodnotu majetku lidí v závislosti na jejich inteligenci, na majetku rodičů, počtu společných známých s panem Kalouskem,...), t}. f(a\, ...,aln) = yu...,f(a\,a\, ...,akn) = yk,k > n (máme tedy více rovnic než neznámých) a chceme tuto závislost „co nejlépe" odhadnout pomocí lineární funkce, tj. vyjádřit hodnotu majetku jakožto lineární funkci f{x\, ...,x„) = b\X\ + b2x2 H-----h b„x„ + c. Pokud
182
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
navíc definujeme „co nejlépe" tím, že chceme minimalizovat
k I n
i = l \ 7=1
v závislosti na reálnych konstantách b\, ..., b„, c. Našim cílem je najít takovou lineární kombinanci sloupců matice A = (a1.) (s koeficienty b\, ..., b„), která bude mít co nejmenší vzdálenost od vektoru (ji,..., yk) v Rk, tedy vlastně najít kolmou projekci vektoru (ji,..., y^ na podprostor generovaný sloupci matice A. Podle věty 3.49 je touto projekcí vektor {b\,..., bn)T = A(_1)(j!,..., b„).
3.60. Metodou nejmenších čverců řešte soustavu
2x + y + 2z = 1 x + y + 3z = 2 2x + y + z = 0 x + z, = -1
Řešení. Naše soustava nemá řešení, neboť její matice má hodnost 3, rozšířená matice soustavy pak hodnost 4. Nejlepším přiblížením vektoru b = (1,2, 0,-1) tvořeném pravými stranami rovnic soustavy můžeme tedy dle věty 3.49 dosáhnout pomocí vektoru A(~l)b. (AA(~l)b je pak ono nejlepší přiblížení, neboli kolmá projekce vektoru b na prostor generovaný sloupci matice A.)
Protože sloupce matice A jsou lineárně nezávislé, je její pseudo-inverzní matice určena vztahem (AT A)-1 AT. Je tedy
(-6/5,7/3, l/3y
Projekce (nejlepší přiblížení k sloupci pravých stran) je pak vektor
(3/5,32/15,4/15,-13/15). □
183
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
G. Doplňující příklady k celé kapitole
3.61. Určete jedinou posloupnost vyhovující rekurentnímu vztahu
x„ = lx„-\ — 10x„_2 + Sn — 22, s počátečními členy x\ = 6, x2 = 8. O
3.62. Model vývoje populace velryb. Pro vývoj populace jsou podstatné samice a u nich není důležitý věk, ale plodnost. Z tohoto hlediska můžeme samice rozdělit na novorozené neboli juve-nilní, tj. dosud neplodné samice, mladé plodné samice, dospělé samice s nej větší plodností a samice postmenopauzní, které již plodné nej sou, ale mají velký význam při ochraně mláďat nebo vyhledávání zdrojů potravy.
Budeme modelovat vývoj takové populace v čase. Za časovou jednotku zvolíme dobu dosažení dospělosti. Novorozená samice, která tuto dobu přežije, dospěje k plodnosti. Vývoj mladé samice do plné plodnosti a vývoj dospělé samice k menopauze závisí na podmínkách prostředí. Přechod do další plodnostní kategorie je tedy náhodný jev. Stejně je náhodným jevem i úmrtí samice. Mladá plodná samice má za jednotku času průměrně méně mláďat, než samice plodná. Tyto poznatky vyjádříme formalizovane.
Označme x\{ť), resp. x2(t), resp. x3(t), resp. x$(t), množství juvenilních, resp. mladých, resp. plně plodných, resp. postmenopauzních, samic v čase t. Množství může vyjadřovat počet jedinců, ale také počet jedinců vztažených na jednotkový areál (tzv. populační hustotu), případně také celkovou biomasu a podobně. Dále označme p\ pravděpodobnost, že juvenilní samice přežije jednotkový časový interval a tedy během něho dospěje, a p2, resp. p3, pravděpodobnost, že během jednotkové doby mladá, resp. plně plodná, samice, která neuhyne, dospěje do následující kategorie, tj. mladá do plné plodnosti a plně plodná k menopauze. Dalším náhodným jevem je umírání (pozitivně řečeno: přežívání) samic, které nedospějí do další kategorie; označme pravděpodobnosti přežití po řadě q2, qj, a q4 pro mladé, plně plodné a postmenopauzní samice. Každé z čísel p\, p2, p3, q2, q3, q^ jakožto pravděpodobnost je z intervalu [0, 1]. Mladá samice může přežít, dospět do plné plodnosti nebo uhynout; tyto jevy jsou neslučitelné, společně tvoří jev jistý a možnost úmrtí nelze vyloučit. Platí tedy P2 + qi < 1. Z podobných důvodů platí p3+q3 < 1. Nakonec ještě označíme f2, resp. f3 průměrný počet dcer mladé, resp. plně plodné, samice. Tyto parametry splňují nerovnost 0 < f2 < f3.
Očekávaný počet novorozených samic v následujícím časovém období je součtem dcer mladých a plně plodných samic, tj.
xx(t + 1) = f2x2(t) + f3X3O).
Označme na okamžik x2^(t + 1) množství mladých samic v čase t + 1, které byly v předchozím období, tj. v čase t juvenilními, a. x22(t + 1) množství mladých samic, které již v čase t byly plodné, jednotkový časový interval přežily, ale nedosáhly plné plodnosti. Pravděpodobnost p\, že juvenilní samice přežije jednotkový časový interval, můžeme vyjádřit jako klasickou, tj. jako poměr x2,i(ř + l)/xi(t), a podobně můžeme vyjádřit pravděpodobnost q2 jako poměr x2:2(t + l)/x2(t). Poněvadž mladé samice v čase t + 1 jsou právě ty, které dospěly z juvenilního stádia, a ty, které již plodné byly, přežily a nedospěly k plné plodnosti, platí
x2(t + 1) = x2,i(ř + 1) +xX2(t + 1) = pxxx(t) +q2x2(t).
184
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
Analogicky odvodíme očekávaný počet plně plodných samic jako
X3(í + 1) = p2X2(t) + 3-*3(0
a očekávaný počet postmenopauzních samic
x4(t + 1) = p3x3(ť) + q4x4(t). Nyní můžeme označit
/O f2
A n1
Pi 0
92 />2
0
h
o
/>3
o\ o o 4/
x(ř)
Ai(0\
x2(t) x3(t) \x4(t) J
a předchozí rekurentní formule přepsat v maticovém tvaru
x(t + 1) = Ax(t).
Pomocí této maticové diferenční rovnice snadno spočítáme očekávané množství velrybích samic v jednotlivých plodnostních kategoriích, pokud známe složení populace v nějakém počátečním čase.
Konkrétně, pro populaci kosatek dravých byly odpozorovány populační parametry
pi= 0,9775, ^2 = 0,9111, f2 = 0,0043, p2 = 0,0736, ^3 = 0,9534. /3 = 0,1132, p3 = 0,0452, q4 = 0,9804; časovou jednotkou je v tomto případě jeden rok.
Začneme-li v čase t = 0 s jednotkovým množstvím mladých samic v nějakém neobsazeném
areálu, tj. s vektorem x(0) = (0, 1, 0, 0)T, můžeme spočítat
x(l)
/ 0 0,0043 0,1132 0 > /0\ f0,0043\
0,9775 0,9111 0 0 1 0,9111
0 0,0736 0,9534 0 0 0,0736
V 0 0 0,0452 0,9804y w k 0 i
/ 0 0,0043 0,1132 0 \ ^0,0043^ /0,01224925\
0,9775 0,9111 0 0 0,9111 0,83430646
0 0,0736 0,9534 0 0,0736 0,13722720
V 0 0 0,0452 0,9804/ 0 ) v0,00332672y
x(2)
a tak můžeme pokračovat dále. Výsledky výpočtu můžeme také znázornit graficky; to je provedeno na obrázku || 11|. Vyzkoušejte si výpočet a grafické znázornění jeho výsledků i pro jiné počáteční složení populace. Výsledkem by mělo být pozorování, že celková velikost populace roste jako exponenciální funkce, poměry velikostí jednotlivých plodnostních tříd se postupně ustálí na konstantních hodnotách. Matice A má vlastní hodnoty
ki = 1,025441326, k2 = 0,980400000, k3 = 0,834222976, k4 = 0,004835698,
vlastní vektor příslušný k nej větší vlastní hodnotě Ai je
w = (0,03697187, 0,31607121, 0,32290968, 0,32404724);
tento vektor je normován tak, aby součet jednotlivých složek byl roven 1.
Porovnejte vývoj velikosti populace s exponenciální funkcí F(t) = k[x0, kde x0 je celková velikost počáteční populace. Vypočítejte také relativní zastoupení jednotlivých plodnostních kategorií v populaci pojistě době vývoje a porovnejte ho se složkami vlastního vektoru w. Shoda je způsobena pouze tím, že matice A má jednu vlastní hodnotu, která má absolutní hodnotu největší z absolutních
185
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
10
20
30
40
50
Obrázek i. Vývoj populace kosatky dravé. Na vodorovné ose je čas v letech, na svislé velikost populace. Jednotlivé plochy zobrazují množství juvenil-ních, mladých, plné plodných a postmenopauzních samic v tomto pořadí zdola.
hodnot všech vlastních hodnot matice A, a tím, že vektorový podprostor generovaný vlastními vektory příslušnými k vlastním hodnotám A.2, A.3, A4 má s nezáporným orthantem jednoprvkový průnik (pouze nulový vektor). Struktura matice A však sama nezaručuje takto jednoduše předvídatelný vývoj, je totiž tzv. reducibilní (viz ??).
3.63. Model růstu populace bodláků Dipsacus sylvestris. Tuto rostlinu můžeme vidět ve čtyřech podobách. Buď jako kvetoucí rostlinu nebo jako růžici listů, přičemž u růžic můžeme rozlišit trojí velikost - malé, střední a velké. Životní cyklus této jednodomé víceleté byliny můžeme popsat následovně.
Kvetoucí rostlina vyprodukuje v pozdním létě větší množství semen a uhyne. Ze semen některá vyklíčí ještě v temže roce a vyroste z nich růžice listů, nejčastěji střední velikosti. Jiná semena zůstanou v zemi a přezimují. Některá z přezimujících semen na jaře vyklíčí a vyroste z nich růžice listů; poněvadž jsou ale prezimovaním oslabena, bude tato růžice s nejvyšší pravděpodobností malá. Většina z přezimujících semen zůstane v zemi, a ta z nich, která přežijí, na jaře vyklíčí a vyrostou z nich malé růžice. Po třech nebo více zimách „spící" (odborně řečeno dormantní) semena hynou, ztrácí schopnost vyklíčit. Podle podmínek prostředí, kde rostlina roste, může malá nebo střední růžice listů do dalšího roku vyrůst, kterákoliv z růžic může zůstat ve své velikostní kategorii nebo uhynout - uschnout, být sežrána nějakým hmyzem a podobně. Střední nebo velká růžice může v následujícím roce vykvést. Kvetoucí rostlina produkuje semena a celý cyklus se opakuje.
Abychom mohli předpovídat, jak rychle se bude populace uvažovaných bodláků v krajině šířit, potřebujeme popsané procesy nějak kvantifikovat. Botanici zjistili, že kvetoucí rostlina vyprodukuje průměrně 431 semen. Pravděpodobnosti klíčení různých semen, růstu růžic listů a vykvetení jsou shrnuty v tabulce:
186
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
jev
pravděpodobnost
semeno vyprodukované rostlinou uhyne
ze semene vyroste malá růžice v temže roce
ze semene vyroste střední růžice v temže roce
ze semene vyroste velká růžice v temže roce
ze semene přezimujícího rok vyroste malá růžice
ze semene přezimujícího rok vyroste střední růžice
ze semene přezimujícího rok vyroste velká růžice
ze semene přezimujícího dva roky vyroste malá růžice
semeno po prvním prezimovaní uhyne
malá růžice přežije a nevyroste
střední růžice přežije a nevyroste
velká růžice přežije a nevyroste
z malé růžice vyroste střední
z malé růžice vyroste velká
ze střední růžice vyroste velká
střední růžice vykvete
velká růžice vykvete
0,172 0,008 0,070 0,002 0,013 0,007 0,001 0,001 0,013 0,125 0,238 0,167 0,125 0,036 0,245 0,023 0,750
Povšimněme si, že všechny relevantní jevy v životním cyklu rostliny mají pravděpodobnost přiřazenu a že se jedná o jevy neslučitelné.
Budeme si představovat, že populaci pozorujeme vždycky na začátku vegetačního roku, řekněme v březnu, a že ke všem uvažovaným jevům dochází ve zbytku času, dejme tomu od dubna do února. V populaci se vyskytují kvetoucí rostliny, růžice tří velikostí, vyprodukovaná semena a semena dor-mantní jeden nebo dva roky. Toto pozorování by mohlo svádět k tomu, že populaci rozdělíme do sedmi tříd - semena čerstvá, dormantní první rok a dormantní druhý rok, růžice malé střední a velké, kvetoucí rostliny. Avšak z vyprodukovaných semen se v temže roce vyvinou buď růžice nebo semena přezimují. Čerstvá semena tedy netvoří samostatnou třídu, jejíž velikost bychom na začátku roku
mohli určit. Označme tedy:
xi(t) — počet semen dormantních první rok na jaře roku t
x2Í.t) — počet semen dormantních druhý rok na jaře roku t
x?,{t) — počet malých růžic na jaře roku t
x4(ř) — počet středních růžic na jaře roku t
x5(t) — počet velkých růžic na jaře roku t
xe(t) — počet kvetoucích rostlin na jaře roku t Počet vyprodukovaných semen v roce t je 431x6(ř). Pravděpodobnost, že semeno zůstane jako dormantní první rok, je rovna pravděpodobnosti, že ze semena nevyroste žádná růžice a že neuhyne, tedy 1 - (0,008 + 0,070 + 0,002 + 0,172) = 0,748. Očekávaný počet semen dormantních jednu zimu v následujícím roce tedy je
Pravděpodobnost, že semeno, které již jeden rok bylo dormantní, zůstane dormantním i druhý rok je rovna pravděpodobnosti, že ze semena dormantního jeden rok nevyroste žádná růžice a že neuhyne, tedy 1 — 0,013 — 0,007 — 0,001 — 0,013 = 0,966. Očekávaný počet semen dormantních dvě zimy v následujícím roce tedy bude
Malá růžice může vyrůst ze semena bezprostředně, ze semena dormantního jeden rok nebo dormantního dva roky. Očekávaný počet malých růžic vyrostlých bezprostředně v roce t je roven
xi(t + 1) = 0,748 • 431x6(ř) = 322,388x6(ř).
x2(t + 1) = 0,966x!(ř).
187
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
0,008 • 431x6(ŕ) = 3,448x6(ŕ). Očekávaný počet malých růžic vyrostlých ze semen dormantních jeden a dva roky je 0,013x! (ř) a 0,010x2(ŕ)- S těmito nově vyrostlými malými růžicemi jsou v populaci rostlin také malé růžice starší, které nevyrostly; těch je 0,125x3(r). Celkový očekávaný počet malých růžic tedy je
x3(t + 1) = 0,013x!(ř) + 0,010x2(r) + 0,125x3(r) + 3,448x6(r)-Analogicky určíme očekávaný počet středních a velkých růžic x4(t + 1) =0,007x!(ř) + 0,125x3(ř) + 0,238x4(ř) + 0,070 • 431x6(ř) = =0,007x!(ř) + 0,125x3 (ř) +0,238x4(ř) + 30,170x6,
x5(t + 1) =0,245x4(ř) +0,167x5(ř) +0,002 • 431x6(ř) =
=0,245x4 (ř) +0,167x5 (ř) +0,862x6 (ř).
Kvetoucí rostlina může vyrůst ze střední nebo velké růžice. Očekávaný počet kvetoucích rostlin tedy bude
x6(t + 1) = 0,023x4(ř) + 0,750x5 (ř). Dospěli jsme tedy k šesti rekurentním formulím pro jednotlivé složky populace studované rostliny. Označíme nyní
/ 0 0 0 0 0 322,388\ (xi(t)\
0,966 0 0 0 0 0 x2(t)
0,013 0,010 0,125 0 0 3,448 , x(ř) = x3(ř)
0,007 0 0,125 0,238 0 30,170 x4(ř)
0,008 0 0,038 0,245 0,167 0,862 x5(t)
V 0 0 0 0,023 0,750 o ) \X6Ít) /
a předchozí rovnosti zapíšeme v maticovém tvaru vhodném pro výpočet
x(t + 1) = Ax(t).
Pokud známe počty jednotlivých složek populace v nějakém počátečním roce t = 0, můžeme vypočítat očekávané počty rostlin a semen v letech následujících. Můžeme také počítat celkový
6
počet jedinců n(t) v čase t, n(t) = x;(ř), relativní zastoupení jednotlivých složek Xi(t)/n(t),
i = l
i = 1, 2, 3, 4, 5, 6 a meziroční relativní změnu populace n(t + l)/n(t). Výsledky takového výpočtu pro patnáct let a případ, že na nějakou lokalitu jsme přesadili jednu kvetoucí rostlinu, jsou uvedeny v tabulce || 11|. Na rozdíl od populace velryb by nyní obrázek nebyl příliš přehledný, počty rostlin jsou oproti počtům semen zanedbatelné, v obrázku by splynuly.
Matice A má vlastní hodnoty
a! = 2,3339 a4 = 0,1187 + 0,1953i
X2 = -0,9569 + 1,4942i X5 = 0,1187 - 0,1953i
a3 = -0,9569 - 1,4942i a6 = -0,1214 Vlastní vektor příslušný k vlastní hodnotě ki je
w = (0,6377, 0,2640, 0,0122, 0,0693, 0,0122, 0,0046);
tento vektor je normován tak, aby součet jeho složek byl roven jedné. Vidíme, že s rostoucím časem t se relativní změna velikosti populace přibližuje vlastní hodnotě X\, relativní zastoupení jednotlivých složek populace se přibližují složkám normovaného vlastního vektoru příslušného k vlastní hodnotě X\. Každá nezáporná matice, která má nenulové prvky na stejných pozicích jako matice A je primitivní. Vývoj populace tedy zákonitě spěje ke stabilizované struktuře.
188
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
t XI x2 x3 X4 x5 Xg n (ŕ)
0 0,00 0,00 0,00 0,00 0,00 1,00 1,00
1 322,39 0,00 3,45 30,17 0,86 0,00 356,87
2 0,00 311,43 4,62 9,87 10,25 1,34 337,50
3 432,13 0,00 8,31 43,37 5,46 7,91 497,18
4 2550,50 417,44 33,93 253,07 22,13 5,09 3 282,16
5 1641,69 2 463,78 59,13 235,96 91,78 22,42 4514,76
6 7 227,10 1585,88 130,67 751,37 107,84 74,26 9 877,12
7 23 941,29 6981,37 382,20 2486,25 328,89 98,16 34218,17
8 31 646,56 23 127,29 767,29 3768,67 954,73 303,85 60568,39
9 97 958,56 30570,58 1786,27 10381,63 1 627,01 802,72 143 126,78
10 258788,42 94 627,97 4570,24 27 597,99 4 358,70 1459,04 391402,36
11 470376,19 249 989,61 9 912,57 52970,28 10 991,08 3 903,78 798 143,52
12 1258 532,41 454383,40 23 314,10 134915,73 22 317,98 9461,62 1902925,24
13 3 050314,29 1215742,31 56442,70 329 291,15 55 891,57 19 841,54 4727 523,56
14 6 396 675,73 2946603,60 127 280,49 705398,22 133 660,97 49492,37 10 359111,38
15 15955747,76 6179188,75 299182,59 1721756,52 293 816,44 116469,89 24 566161,94
X! (ŕ) *2(0 x3(ŕ) x4(ŕ) *s(0 x6(t) n(t + 1)
L n(t) n(t) n(t) n(t) n(t) n(t) n(t)
0 0,000 0,000 0,000 0,000 0,000 1,000 356,868
1 0,903 0,000 0,010 0,085 0,002 0,000 0,946
2 0,000 0,923 0,014 0,029 0,030 0,004 1,473
3 0,869 0,000 0,017 0,087 0,011 0,016 6,602
4 0,777 0,127 0,010 0,077 0,007 0,002 1,376
5 0,364 0,546 0,013 0,052 0,020 0,005 2,188
6 0,732 0,161 0,013 0,076 0,011 0,008 3,464
7 0,700 0,204 0,011 0,073 0,010 0,003 1,770
8 0,522 0,382 0,013 0,062 0,016 0,005 2,363
9 0,684 0,214 0,012 0,073 0,011 0,006 2,735
10 0,661 0,242 0,012 0,071 0,011 0,004 2,039
11 0,589 0,313 0,012 0,066 0,014 0,005 2,384
12 0,661 0,239 0,012 0,071 0,012 0,005 2,484
13 0,645 0,257 0,012 0,070 0,012 0,004 2,191
14 0,617 0,284 0,012 0,068 0,013 0,005 2,371
15 0,650 0,252 0,012 0,070 0,012 0,005
Tabulka 1. Modelovaný vývoj populace bodláku Dipsacus sylvestris. Velikosti jednotlivých složek populace, celková velikost populace, relativní zastoupení jednotlivých složek a relativní přírůstky velikosti.
3.64. Nelineární model populace. Prozkoumejte podrobně vývoj populace pro nelineární model z učebnice (1.12) a hodnoty K = 1 a
i) míru růstu r = 1 a počáteční stav p(l) = 0,2
ii) míru růstu r = 1 a počáteční stav p(l) = 2
iii) míru růstu r = 1 a počáteční stav p(l) = 3
iv) míru růstu r = 2, 2 a počáteční stav p(l) = 0,2
v) míru růstu r = 3 a počáteční stav p(l) = 0,2
Spočítejte několik prvních členů a odhadněte, jak bude populace dále růst. Řešení.
i) Prvních deset členů posloupnosti p(n) je v následující tabulce. Odtud je vidět, že velikost populace konverguje k hodnotě 1.
189
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
n P(n)
1 0,2
2 0,36
3 0,5904
4 0,83222784
5 0,971852502
6 0,999207718
7 0,999999372
Graf vývoje populace pro r = 1 a p(l) = 0, 2:
ii) Pro počáteční hodnotu p(l) =2 dostaneme p(2) = 0 a dál už se populace měnit nebude.
iii) Pro p(l) = 3 dostáváme
n P(n)
1 3
2 -15
3 -255
4 -65535
a odtud je vidět, že populace bude klesat pode všechny meze. iv) Pro míru růstu r = 2, 2 a počáteční stav p(l) = 0, 2 dostáváme
n P(n)
1 0,2
2 0,552
3 1,0960512
4 0,864441727
5 1,122242628
6 0,820433675
7 1,144542647
8 0,780585155
9 1,157383491
10 0,756646772
11 1,161738128
12 0,748363958
!3 1,162657716
14 0,74660417
Vidíme, že místo konvergence dostáváme v tomto případě oscilaci-po nějaké době bude populace přeskakovat mezi hodnotami 1,16 a 0,74. Graf vývoje populace pro r = 2, 2 a p(l) = 0, 2 pak vypadá následovně: v) Pro míru růstu r = 3 a počáteční stav p(l) = 0, 2 dostáváme
190
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
n P(n)
1 0,2
2 0,68
3 1,3328
4 0,00213248
5 0,008516278
6 0,033847529
7 0,131953152
8 0,475577705
9 1,223788359
10 0,402179593
11 1,123473097
12 0,707316989
13 1,328375987
14 0,019755658
15 0,077851775
16 0,293224403
17 0,91495596
18 1,148390614
19 0,63715945
20 1,330721306
21 0,010427642
22 0,041384361
23 0,160399447
V tomto prípade je už situace složitější-populace začne oscilovat mezi více hodnotami. Abychom lépe viděli mezi kterými, bylo by potřeba spočítat ještě víc členů. Pro členy z tabulky máme následující graf
□
3.65. Jistá populace malých hlodavců se množí následujícím způsobem: hlodavci stáří do jednoho měsíce splodí v průměru jednoho hlodavce, na jednoho hlodavce stáří mezi jedním a dvěma měsíci připadá v průměru 12 nově narozených hlodavců. Starší hlodavci neplodí. Umírá polovina hlodavců stáří do jednoho jednoho měsíce i polovina hlodavců stáří mezi měsícem a dvěma měsíci. Více než tří měsíců se nedožije žádný. Na jakém poměru se ustálí počet hlodavců stáří do jednoho měsíce ku počtu hlodavců stáří mezi jedním a dvěma měsíci ku počtu hlodavců stáří mezi dvěma a třemi měsíci.
O
3.66. V laboratoři je prováděn pokus se stejnou pravděpodobností úspěchu i neúspěchu. Pokud se pokus podaří, bude pravděpodobnost úspěchu druhého pokusu 0, 7. Jestliže skončí první pokus neúspěchem, bude pravděpodobnost úspěchu druhého pokusu pouze 0, 6. Dále se bude pokračovat v provádění pokusů, kdy úspěšnost předešlého znamená, že pravděpodobnost úspěchu následujícího bude 0, 7, a jeho neúspěšnost způsobí, že pravděpodobnost úspěchu následujícího bude 0, 6. Pro libovolné neN stanovte pravděpodobnost, že n-tý pokus se podaří.
Řešení. Zavedme pravděpodobnostní vektor
191
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
kde x\ je pravděpodobnost úspěchu rc-tého pokusu a x\ = 1 — x\ je pravděpodobnost jeho neúspěchu. Podle zadání je
a zřejmě také
Xl
Při označení
1/2 1/2
0, 7 0, 6\ /l/2\ _ /13/20 0,3 0,4,1 ' l 1/2/ ~ I 7/20
/7/10 3/5 13/10 2/5
platí
(3.7) xn+í = T ■ x„, n e N,
neboť pravděpodobnostní vektor xn+\ závisí pouze na x„ a tato závislost je totožná jako pro x2 a x\. Ze vztahu (||3.7||) bezprostředně plyne
(3.8) xn+l = T ■ T -jc„_i = ••• = T" -xu n > 2, n e N.
Proto vyjádříme T", n e N. Jedná se o Markovův proces, a tudíž je 1 vlastní číslo matice T. Druhé vlastní číslo 0, 1 vyplývá kupř. z toho, že stopa (součet prvků na diagonále) je rovna součtu všech vlastních čísel (každé vlastní číslo bereme tolikrát, jaká je jeho algebraická násobnost). Těmto vlastním číslům pak přísluší vlastní vektory
Dostáváme tak
T =
tj. pro n € N je Dosazení
2 1 \ (1 0 \ (2 1
1 -i/V0 i/io/ v -i
2 1 Wl 0 V (2 1
1 -i)' [o i/ioy ' \i -i
2 1 \ /l" 0 \ (2 1
i —17' v o ío-"/'u -i
2 1 \ _ 1 /l 1 1 -ij "3 U "2
a roznásobení dává
1/2+10-" 2-2-10-"N, 3 VI — ÍO-" 1+2-10""/'
Odtud, z (113.711) a (113.811) plyne
'2111
^ + t—7T , n e N.
,3 6 • 10" 3 6-10", Zvláště vidíme, že pro velká n je pravděpodobnost úspěchu «-tého pokusu blízká 2/3. □
3.67. Student na koleji je značně společensky unaven (v důsledku toho není schopen plně vnímat smyslové podněty a koordinovat své pohyby). V tomto stavu se přesto rozhodne, že na právě probíhající večírek pozve známou, která má pokoj na jednom konci chodby. Na opačném konci chodby však bydlí někdo, koho pozvat rozhodně nehodlá. Je ovšem natolik „unaven", že rozhodnutí udělat krok zvoleným směrem se mu podaří realizovat pouze v 53 ze 100 pokusů (ve zbylých 47 jde přesně
192
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
na opačnou stranu). Za předpokladů, že vyjde v polovině chodby a že vzdálenost k oběma dveřím na koncích chodby odpovídá jeho 20 krokům, stanovte pravděpodobnost, že nejdříve dorazí ke správnym dveřím. O
3.68. Nechť n e N osob hraje tzv. tichou poštu. Pro jednoduchost předpokládejte, že první osoba zašeptá druhé právě jedno (libovolně zvolené) ze slov „ano", „ne". Druhá osoba pak potichu řekne třetí osobě to ze slov „ano", „ne", o kterém si myslí, že ho řekla první osoba. Takto to pokračuje až k n-té osobě. Jestliže pravděpodobnost toho, že při libovolném předání se zamění (nechtě, úmyslně) šířené slovo na to druhé, je p e (0, 1), stanovte pro velká n e N pravděpodobnost, že n-tá osoba určí správně slovo zvolené první osobou.
Řešení. Na tuto úlohu lze nahlížet jako na Markovův řetězec se dvěma stavy nazvanými Ano a Ne, kdy řekneme, že proces je ve stavu Ano v čase m e N, pokud si m-tá osoba bude myslet, že předávané slovo je „ano". Pro pořadí stavů Ano, Ne je pravděpodobnostní matice přechodu
Součin matice Tm~l a pravděpodobnostního vektoru počáteční volby první osoby potom udává pravděpodobnosti toho, co si bude myslet m-tá osoba. Mocniny této matice ovšem počítat nemusíme, neboť všechny prvky matice T jsou kladná čísla. Navíc tato matice je dvojnásobně stochastická. Víme tudíž, že pro velká n e N bude pravděpodobnostní vektor blízký vektoru (1/2, l/2)T. Pravděpodobnost, že n-tá osoba řekne „ano", je proto přibližně stejná jako pravděpodobnost, že řekne „ne", a to nezávisle na tom, pro které slovo se rozhodla první osoba. Pro velký počet zúčastněných tak platí, že zhruba polovina z nich uslyší „ano" (zopakujme, že nezávisle na tom, které slovo bylo na začátku vybráno).
Pro úplnost zjistěme, jak by úloha dopadla, kdybychom předpokládali, že pravděpodobnost záměny „ano" na „ne" je u libovolné osoby p e (0, 1) a pravděpodobnost záměny „ne" na „ano" je obecně odlišné q e (0, 1). V tomto případě pro stejné pořadí stavů dostáváme pravděpodobnostní matici přechodu
r = (>-" « Y
V p l-q;
která vede (pro velká n e N) k pravděpodobnostnímu vektoru blízkému vektoru
\P + q' p+q což kupř. plyne z vyjádření matice
t ;)♦<'-'-*■(-', 7)]-
Rovněž tentokrát při dostatečném počtu Lidí nezáleželo na volbě slova, kterou učinila první osoba. Stručně řečeno, v tomto modelu platí, že nezáleží na původním rozhodnutí, protože o tom, jakou informaci si Lidé předávají, rozhodují oni sami; přesněji řečeno, Lidé sami rozhodují o četnosti výskytu „ano" a „ne", pokud je jich dostatečný počet (a chybí-ii jakékoli ověřování).
Doplňme ještě, že výše uvedený závěr byl experimentálně ověřen. V psychologických pokusech byl mj. jedinec opakovaně vystaven vjemu, který šlo vnímat dvěma různými způsoby, a to v časových intervalech zaručujících, aby si subjekt pamatoval předešlý vjem. Viz např. „T. Havránek a kol.: Matematika pro biologické a lékařské védy, Praha, Academia 1981", kde je uveden experiment, v němž
1
p+q
193
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
je zábleskem osvětlován v pevných časových odstupech nejednoznačný obraz (třeba náčrt krychle vnímatelný jako nadhled i podhled). Takový proces je totiž Markovovým řetězcem s maticí přechodu
'1 - P q p l-q,
kde p, q € (0, 1). □
3.69. V jisté hře si můžete vybrat jednoho ze dvou soupeřů. Pravděpodobnost, že porazíte lepšího, je 1/4, zatímco horšího ze soupeřů porazíte s pravděpodobností 1/2. Soupeři ale nejsou rozlišeni, a tak nevíte, který z nich je ten lepší. Čeká Vás velké množství her (pro každou můžete zvolit jiného soupeře) a samozřejmě chcete dosáhnout celkově co největšflio podílu vítězných her. Uvažte tyto dvě strategie:
1. Pro první hru si vyberete soupeře náhodně. Pokud nějakou hru vyhrajete, pokračujete se stejným soupeřem; jestliže ji prohrajete, změníte pro další hru soupeře.
2. Pro první dvě hry si vyberete (jednoho) soupeře náhodně. Dále se řídíte výsledkem předchozích dvou her, kdy na další dvě hry změníte soupeře, právě když obě předchozí prohrajete.
Kterou ze strategií (moudře) zvolíte?
Řešení. Obě strategie jsou vlastně Markovovým řetězcem. Pro jednoduchost horšího ze soupeřů označujme jako osobu A a lepšího ze soupeřů jako osobu b. V prvním případě pro stavy „hra s osobou A", „hra s osobou 5" (a toto jejich pořadí) dostáváme pravděpodobnostní matici přechodu
'1/2 3/4^ ,1/2 1/4,
Tato matice má všechny prvky kladné, a proto stačí najít pravděpodobnostní vektor x^, který přísluší vlastnímu číslu 1. Platí
3 2X T
.5 5,
Jeho složky odpovídají pravděpodobnostem, že po dlouhé řadě her bude soupeřem osoba A, resp. b. Lze tedy očekávat, že 60 % her bude hráno proti horšímu ze soupeřů. Neboť
2 _ 3 1 2 1
5 = 5 ' 2 + 5 ' 4' vítězných her bude kolem 40 %.
Pro druhou strategii zavedme stavy „dvě hry po sobě s osobou A" a „dvě hry po sobě s osobou 5", které vedou na pravděpodobnostní matici přechodu
'3/4 9/16\ 1/4 7/16,1 ■
Snadno určíme, že nyní je
_/9_ 4_^T X°° ~ V13' 13
Proti horšímu ze soupeřů by se tak hrálo (9/4)krát častěji než proti lepšímu z nich. Připomeňme, že pro první strategii to bylo (3/2)krát častěji. Druhá strategie je proto výhodnější. Ještě poznamenejme, že při druhé strategii bude přibližně 42,3 % her vítězných. Stačí totiž vyčíslit
. ... 11 9 1 4 1
0, 423 = — =---+---.
26 13 2 13 4
□
194
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
3.70. Petr se pravidelně setkává se svým kamarádem. Je ovšem „proslulý" svou nedochvilností. Snaží se ale změnit, a proto platí, že v polovině případů přijde včas a v jedné desetině případů dokonce ještě dříve, pokud na minulé setkání přišel pozdě. Jestliže minule přišel včas nebo dříve, než měl přijít, vrátí se ke své „bezstarostnosti" a s pravděpodobností 0,8 dorazí pozdě a pouze s pravděpodobností 0,2 včas. Jaké je pravděpodobnost, že na dvacáté setkání přijde pozdě, když na jedenácté přišel včas?
Řešení. Zřejmě se jedná o Markovův proces se stavy „Petr přijde pozdě", „Petr přijde včas", „Petr přijde dříve" a s pravděpodobnostní maticí přechodu (pro uvedené pořadí stavů)
/0,4 0,8 0, 8\ T = 0,5 0, 2 0, 2 . \0, 1 0 0/
Jedenácté setkání je určeno pravděpodobnostním vektorem (0, 1, 0)T (s jistotou víme, že Petr přišel
včas). Dvacátému setkání pak odpovídá pravděpodobnostní vektor
/0\ /0,571578 368\ T9 1 = 0,371316224 . \0/ \0, 057 105 408/
Hledaná pravděpodobnost je tudíž 0, 571578 368 (přesně). Dodejme, že je
/0, 571 316224 0,571578 368 0,571 578 368\ T9 = 0,371512832 0,371316224 0, 371 316 224 I . \0,057 170944 0,057105 408 0,057 105 408/
Odtud vidíme, jak málo záleží na tom, zda přišel na jedenácté setkáni pozdě (první sloupec), včas
nebo dříve (druhý a současně třetí sloupec). □
3.71. Dva studenti A a B tráví každé pondělní odpoledne hraním jisté počítačové hry o to, kdo z nich večer zaplatí společnou útratu v restauraci. Hra může rovněž skončit remízou, kdy večer oba platí právě polovinu útraty. Výsledek předešlé hry částečně ovlivňuje hru následující. Pokud tedy před týdnem vyhrál student A, potom s pravděpodobností 3/4 vyhraje opět a s pravděpodobností 1/4 skončí hra remízou. Remíza se opakuje s pravděpodobností 2/3 a s pravděpodobností 1/3 vyhraje ve hře následující po remíze student B. Pokud před týdnem vyhrál student B, pak s pravděpodobností 1 /2 své vítězství zopakuje a s pravděpodobností 1/4 vyhraje student A. Nalezněte pravděpodobnost, že dnes bude každý platit polovinu útraty, jestliže první hru před velmi dlouhou dobou vyhrál student A. Řešení. Vlastně je zadán Markovův proces se stavy „vyhraje student A", „hra skončí remízou", „vyhraje student 5" (v tomto pořadí) pravděpodobnostní maticí přechodu
/3/4 0 l/4\ T = 1/4 2/3 1/4 . V 0 1/3 1/2/
Chceme najít pravděpodobnost přechodu z prvního stavu do druhého po velkém počtu neN kroků
(týdnů). Matice T je primitivní, protože
/ 9/16 1/12 5/16 \ T2 = 17/48 19/36 17/48 . \ 1/12 7/18 1/3 /
Stačí tak najít vlastní pravděpodobnostní vektor Xoo matice T příslušný vlastnímu číslu 1. Snadno lze
spočítat, že
_ /2 3 2 X°° ~ {V 7' 7
195
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
Vime, že vektor se jen velmi málo liší od pravděpodobnostního vektoru pro velká n a téměř
nezávisí na počátečním stavu, tj. pro velká n e N můžeme klást
(2/1 2/1 2/l\ T" « 3/7 3/7 3/7 . \2/7 2/7 2/7/
Hledaná pravděpodobnost je prvkem této matice na druhé pozici v prvním sloupci (je druhou složkou vektoru x^). Poměrně rychle jsme nalezli výsledek 3/7. □
3.72. Adam, Bedřich a Čeněk si házejí balónem. Adam jej s pravděpodobností \ hodí Čeňkovi, s pravděpodobností \ Bedřichovi. Bedřich jej s pravděpodobností \ hodí Adamovi a s pravděpodobností | Čeňkovi. Konečně Čeněk jej hodí s pravděpodobností | Adamovi a s pravděpodobností \ Bedřichovi. Sestavte matici tohoto Markovova procesu a určete, s jakou pravděpodobností se míč bude nacházet po velkém počtu hodů u Bedřicha (každý potřebuje stejný čas na odhození balónu).
O
3.73. Sheldon a Leonard si hážou balónem přes síť. Pravděpodobnost, že Sheldon dokáže přehodit síť jsou 3/5 (s pravděpodobností 2/5 zůstane míč na jeho straně). Pravděpodobnost, že Leonard přehodí síť jsou 4/5 (s pravděpodobností 1/5 zůstane míč na jeho straně). Jaká je pravděpodobnost, že po velkém počtu pokusů obou pánů bude míč na Sheldonově straně? Formulujte úlohu jako Markovův proces a u vedle jeho matici. O
196
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
Řešení cvičení
3.2. Denní dávka by měla sestávat z 3, 9 kg sena a 4, 3 kg ovsa. Náklady na dávku potom budou 13, 82 Kč.
3.13. x„
3.14.
i .-x n i
'21
4" + 2 • (-2)" + 1 = (2" + (-1)")2.
1 /3 + V2T\" 1 Í3
3.15. xn = 2\/3sin(n • (tt/6)) — 4cos(n • (jr/6)).
3.16. xn = -3(-l)" - 2cos(« • (2tt/3)) - 2^3 sin(« • ((2tt/3)).
3.17. xn = (-l)"(-2«2 + 8n - 7).
3.26. Leslieho matice daného modelu je (úmrtnost v první skupině označíme a)
Podmínka stagnace populace odpovídá tomu, že matice má vlastní hodnotu 1, neboli polynom X3 — 2aX — 2a
má mít kořen 1, t.j a = 1/4.
3.30.
5 1
f I
6 5
Matice má dominantní vlastní hodnotu 1, příslušný vlastní vektor je (|, 1). Protože je vlastní hodnota dominantní, tak se poměr diváků se ustálí na poměru 6:5.
3.33. Stejně jako v (||3.32||) skončí hra po třech sázkách. Jsou tedy opět všechny mocniny A, počínaje A3 shodné.
/I 7/8 3/4 1/2 0\ 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 \0 1/8 1/4 1/2 1/
3.42. Můžeme využít výsledku úlohy označované jako Ruinování hráče. Pravděpodobnost, že zanikne to oddělení, které má nyní 40 zaměstnanců, je podle tohoto příkladu rovna
A100 = A3 =
i _ / Q.46 y
1 \ 1-0,46 J
( 0,46 \2 \ 1-0,46 )
0, 56.
1
Stačilo dosadit p = 1 — 0, 54, y = 10/2 a x = 40/2 do (||3.6||). Prozíravější je tedy zvolit v tuto chvíli menší
oddělení. 3.52.
• Tvrzení je pravdivé. (B := AT A, bij = (i-tý řádek AT) ■ (j-tý sloupec A)= b ji = (j-tý řádek AT) ■ (i-tý sloupec A)=(j-tý sloupec A) ■ (i-tý řádek AT)
• Tvrzení zřejmě neplatí. Uvažte např. A ^ ^
0 1
3.54.
-2 0
3.61. x„ = 2"+1 - 5""1 + 2n + 1. 3.65. 36 : 6 : 1.
197
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
3.67. Znovu se jedná o speciální prípad Ruinovaní hráče. Stačí zadání vhodně přeformulovat. Pro p = 0, 47, y = 20 a x = 20 z (||3.6||) plyne výsledek
1 _ f _o^Z_f °
1 \ 1-0,47,/
0,917 =
1 \ 1-0,47^
3.72. Matice procesu je I j 0 ^ I, vlastní vektor příslušný vlastní hodnotě 1 je (y, 1, y|), hledaná
U 1 o/ pravděpodobnost pak 13^g+11+25^18 = ^. j.
23
/I IX /2 4\
J.7J. I | ^ )' resP- (5 í )' vlastní vektor příslušný vlastní hodnotě 1 je (1, 4/3), resp. (4/3, 1), hledaná
pst 4/7.5 5 5 5
198
KAPITOLA 4
Analytická geometrie
Vrátíme se teď k našemu pohledu na geometrii, když jsme zkoumali polohy bodů v rovině v 5. části první kapitoly, viz 1.23. Budeme se nejprve zajímat o vlastnosti prostorových objektů vymezených pomocí bodů, přímek, rovin apod. Podstatné přitom bude vyjasnění, jak jejich vlastnosti souvisí s pojmem vektorů a zda závisí na pojmu velikosti vektorů.
V další části pak použijeme lineární algebru pro studium objektů, které už lineárně definované nejsou. Opět přitom budeme potřebovat trochu více maticového počtu. Výsledky budou důležité později při diskusi technik pro optimalizace, tj. hledání extrémů funčkních hodnot.
Projektivní rozšíření afinních prostorů nám v závěru kapitoly ukáže, jak lze překvapivě snadno dosáhnout zjednodušení i stability algoritmických postupů typických pro práci s počítačovou grafikou.
1. Afinní a euklideovská geometrie
Když jsme si ujasňovali strukturu řešení systémů lineárních t7 rovnic v první části předchozí kapitoly, zjistili jsme ■ť^SPflw v ostavci 3.1, že všechna řešení nehomogenních sys-LM,^*^~_ témů rovnic sice netvoří vektorové podprostory, vždy ale vznikají tak, že k jednomu jedinému řešení přičteme celý vektorový prostor řešení příslušné homogenní soustavy. Naopak, rozdíl dvou řešení nehomogenní soustavy je vždy řešením soustavy homogenní. Obdobně se chovají lineární diferenční rovnice, jak jsme již viděli v odstavci 3.14.
4.1. Afinní prostory. Návod na teoretické uchopení takové situace dává již diskuse geometrie roviny, viz odstavec 1.25 a dále. Tam jsme totiž popisovali přímky a body jako množiny řešení systémů lineárních rovnic. Přímka pro nás pak byla jednorozměrným" prostorem, přestože její body byly popisovány dvěmi souřadnicemi. Parametricky jsme ji zadávali tak, že k jednomu bodu (tj. dvojici souřadnic) jsme přičítali násobky pevně zvoleného směrového vektoru. Stejně budeme postupovat i teď v libovolné dimenzi.
mmm^_ _\ Standardní afinní prostor
Standarní afinní prostor A„ je množina všech bodů v R" = A„ spolu s operací, kterou k bodu A = (a\,..., a„) e A„ a vektoru v = (vi,..., v„) e R" = V přiřadíme bod
A + v = (fli + vi,..., an + v„) e R" = A„.
Tyto operace splňují následující tři vlastnosti:
(1) A + 0 = A pro všechny body A e A„ a nulový vektor 0 e V,
(2) A + (v + w) = (A + v) + w pro všechny vektory v, w e V a body A € An,
poloha, incidence, projekce ? - a zase skončíme u matic...
Řešení. Zřejmě postačuje vyřešit uvedenou soustavu rovnic. Jde o dvě lineární rovnice o třech neznámých. Jejím řešením je jedno-parametrický systém (x, y, z) = (t, 3t — 7, 5t — 14), což je již hledané parametrické vyjádření. Můžeme ale postupovat také odlišně. Potřebujeme totiž najít nenulový (směrový) vektor, který bude kolmý na (normálové) vektory (1, —2, 1), (2, 1,-1). Ten můžeme najít jednak vyřešením soustavy rovnic
x\ — 2x2 + x3 = 0 2x\ + x2 — x3 =0,
vystihující, že skalární součin hledaného vektoru (xi,x2,x3) s vektory (1,—2,1) i (2,1,-1) bude nulový (jde o zhomogenizovaný původní systém). Řešením je jednoparametrický systém kolmých vektorů (ř, 3ř, 5ř). Vektor (xi,x2, x3) můžeme také určit přímo, pomocí
199
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
(3) pro každé dva body A, B e A„ existuje právě jeden vektor v e V takový, že A + v — B. Značíme jej v — B — A, někdy také AB.
Vektorový prostor R" nazýváme zaměření standardního afinního prostoru A„. ^mmm^^^^m—__J[
Všimněme si několika formálních nebezpečí. Používáme vfK stejný symbol „+" pro dvě různé operace: přičtení vektoru ze zaměření k bodu v afinním prostoru, ale ŕľ* také sčítání vektorů v zaměření V — Rn. Také nezavádíme zvláštní písmena pro samotnou množinu bodů afinního prostoru, tj. A„ pro nás představuje jak samotnou množinu bodů, tak i celou strukturu definující afinní prostor.
Proč vlastně chceme rozlišovat množinu bodů prostoru A„ od jeho zaměření V, když se jedná jakoby o stejné M"? Jde o velice podstatný formální krok k pochopení geometrie v Rn: Geometrické objekty jako přímky, body, roviny apod. nejsou totiž přímo závislé na vektorové struktuře na množině R" a už vůbec ne na tom, že pracujeme s n-ticemi skalárů. Potřebujeme jen umět říci, co to znamená pohybovat se „rovně v daném směru". K tomu právě potřebujeme na jedné straně vnímat třeba rovinu jako neohraničenou desku bez zvolených souřadnic, ale s možností posunout se o zadaný vektor. Když přejdeme navíc k takovému abstraktnímu pohledu, budeme umět diskutovat „rovinnou geometrii" pro dvourozměrné podprostory, tj. roviny ve vícerozměrných prostorech, „prostorovou" pro třírozměrné atd., aniž bychom museli přímo manipulovat &-ticemi souřadnic.
Tento pohled je zachycen v následující definici:
4.2. Definice. Afinním prostorem A se zaměřením V rozumíme množinu bodů V, spolu se zobrazením
V
(A, v)
kde V je vektorový prostor a naše zobrazení splňuje vlastnosti (l)-(3) z definice standardního afinního prostoru.
Pro libovolný pevně zvolený vektor v e V je tak definováno posunutí xv : A -> A jako zúžené zobrazení
tv : V ~ V x {v} -* V, Ah-A + u.
tzv. vektorového součinu (viz 4.24):
(1, -2, 1) x (2, 1, -1) = (1,3,5). Všimneme-li si navíc, že např. uspořádaná trojice
(x, y, z) = (2,-1,-2) vyhovuje dané soustavě, dostaneme výsledek
[2,-1,-2]+ t (1,3, 5), íel.
Čtenář jistě postřehnul, že alternativní postup pouze geometricky interpretoval řešení nehomogenní lineární soustavy rovnic. □
4.2. V M4 je parametricky dána rovina
q : [0, 3, 2, 5] + t (1, 0, 1, 0) + s (2, -1, -2, 2), í,sel Vyjádřete tuto rovinu implicitně.
Řešení. Úkolem je najít soustavu lineárních rovnic čtyř proměnných x, y, z, u (čtyři proměnné jsou dány dimenzí prostoru), jíž budou vyhovovat právě souřadnice bodů uvedené roviny. Poznamenejme, že hledaná soustava bude obsahovat 2 = 4 — 2 lineárně nezávislé rovnice. Příklad vyřešíme tzv. eliminací parametrů. Body [x, y, z,u] e q splňují
x
y
z u
+ t
+
+
2s, s, 2s, 2s,
Dimenzí afinního prostoru A rozumíme dimenzi jeho zaměření. přičemž t,seR. Odtud můžeme ihned přejít k maticovému zápisu
Nadále nebudeme rozlišovat ve značení důsledně množinu bodů A a množinu vektorů V, budeme místo toho hovořit o bodech a vektorech affiního prostoru A.
Z axiomů okamžitě plyne pro libovolné body A, B, C v afinním prostoru A
j 1 2 -1 0 0 0 0 \
0 -1 0 -1 0 0 3
1 -2 0 0 -1 0 2
2 0 0 0 -1 5/
(4.1)
(4.2)
(4.3)
A-Ä=0eV B - A = —(A - B) (C - B) + (B - A) = C - A.
Skutečně, (4.1) vyplývá z toho, že A + 0 — 0 a takový vektor musí být jednoznačný (první a třetí definiční vlastnost). Postupným přičtením B — AaA — BkA(v uvedeném pořadí), zjevně dostaneme podle druhé definiční vlastnosti opět A, tedy jsme přičeťli nulový vektor a to dokazuje (4.2). Obdobně z definiční vlastnosti 4.1 (2) a jednoznačnosti vyplývá (4.3).
kde první dva sloupce jsou směrové vektory roviny, za svislou čarou následuje záporně vzatá jednotková matice a za druhou svislou čarou jsou souřadnice bodu [0, 3, 2, 5]. Tento přepis vzniká tak, že na výše uvedenou soustavu rovnic nahlížíme jako na soustavu rovnic pro neznámé t, s, x, y, z, u a všechny členy přitom převádíme na jednu stranu rovnic. Získanou matici převedeme pomocí elementárních řádkových transformací do tvaru, kdy před první svislou čarou bude maximální možný počet nulových řádků. Přičtením (— l)násobku prvního
200
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
Všimněme si, že volba jednoho pevného bodu Aq e A nám určuje bijekci mezi V a A. Při volbě pevné báze uveV tak dostáváme pro každý bod A e A jednoznačné vyjádření
A — Aq + x\u\ + • • • + x„u„.
Hovoříme o afinní soustavě souřadnic (Aq; u\, ..., un) zadané počátkem afinní souřadné soustavy Aq a bazí zaměření u nebo také o afinním repéru (Aq, u).
Slovy můžeme shrnout situaci takto: Afinní souřadnice bodu A v soustavě (Aq, u) jsou souřadnicemi vektoru A — Aq v bázi u zaměření V.
Volba afinního souřadného systému ztotožňuje jakýkoliv n-rozměrný afinní prostor A se standardním afinním prostorem
An •
4.3. Afinní podprostory. Jestliže si vybereme v A jen body, které budou mít některé předem vybrané souřadnice nulové (třeba poslední jednu). Dostaneme opět množinu, která se bude chovat jako afinní prostor. Takto budeme skutečně parametricky popisovat tzv. afinní podprostory ve smyslu následující definice.
Podprostory afinního prostoru
Definice. Neprázdná podmnožina Q c A afinního prostoru A se zaměřením V se nazývá afinní podprostor v A, je-li podmnožina W — {B — A; A, B e Q} c V vektorovým podprostorem a pro libovolné A e Q, v e W je A + v e Q.
Je podstatné mít obě podmínky zahrnuty v definici, protože je snadné najít příklady podmnožin, které budou splňovat první, ale nikoliv druhou podmínku. Přemýšlejte např. o přímce v rovině s vyjmutým jedním bodem.
Pro libovolnou množinu bodů M c A v afinním prostoru se zaměřením V definujeme vektorový podprostor
Z(M) = ({B — A; B, A e M}) C V
všech vektorů generovaných rozdíly bodů z M.
Zejména je V — Z (A) a každý afinní podprostor Q c A splňuje sám axiomy afinního prostoru se zaměřením Z(Q).
Přímo z definic je také zřejmé, že průnik libovolné množiny afinních podprostorů je buď opět afinní podprostor nebo prázdná množina.
Afinní podprostor (M) v A generovaný neprázdnou podmnožinou M c A je průnikem všech afinních podprostorů, které obsahují všechny body podmnožiny M.
Afinní obal a parametrický popis podprostorů \rmm^
Afinní podprostory si můžeme pěkně popsat pomocí jejich zaměření, jakmile si zvolíme jeden jejich bod Aq e M v generující množině bodů M. Skutečně, dostáváme (M) — {Aq + v; v e Z (M) c Z (A)}, tj. pro generování afinního podprostorů vezmeme vektorový podprostor Z(M) v zaměření generovaný všemi rozdíly bodů z M a ten pak přičteme k libovolnému z nich. Hovoříme také o afinním obalu množiny bodů M v A.
Naopak, kdykoliv zvolíme podprostor U v zaměření Z (A) a jeden pevný bod A e A, pak podmnožina A + U vzniklá všemi možnými součty jediného bodu A se všemi vektory v U je afinní podprostor. Takový postup vede k pojmu parametrizace podprostorů:
a současně (—4)násobku druhého řádku ke třetímu řádku a dvojnásobku druhého ke čtvrtému řádku dostáváme
/1 2 -1 0 0 0 0 \
0 -1 0 -1 0 0 3
1 -2 0 0 -1 0 2
\Q 2 0 0 0 -1 5 /
(1 2 -1 0 0 0 0
0 -1 0 -1 0 0 3
0 0 1 4 -1 0 -10
0 0 -2 0 -1 11
Odkud plyne výsledek
x +
4y 2y
+
10
11
0, 0.
Koeficienty za první svislou čarou v řádcích, které jsou před touto svislou čarou nulové, určují totiž koeficienty obecných rovnic roviny.
Upozorněme, že kdybychom např. přepsali soustavu rovnic do matice
/1 0 0 0 1 2 0 \
0 1 0 0 0 -1 3
0 0 1 0 1 -2 2
0 0 1 0 2 5/
která odpovídá situaci, kdy proměnné x,y,z,u zůstávají na levé straně rovnic, totožná úprava
/ 1 0 0
0 1 0
0 0 1
V 0 0 0
0 \ / 1 0 0 0 1 2 0
3 0 1 0 0 0 -1 3
2 -1 -4 1 0 0 0 -10
5/ V 0 2 0 1 0 0 11
dává výsledek ve tvaru
4y 2y
+
+
■10, 11.
Při přepisování soustavy do matice je tudíž nutné zohledňovat, zda svislá čára odděluje levou stranu rovnic od pravé (či nikoliv). Jak jsme částečně viděli v tomto příkladu, metoda eliminace parametrů může být zdlouhavá a při jejím použití se lze snadno dopustit chyb. Jiné řešení. Řešení můžeme do značné míry urychlit naší „šikovností". Pokud si všimneme, že dva lineárně nezávislé normálové vektory, tj. vektory kolmé na vektory (1, 0, 1, 0), (2, —1, —2, 2). jsou např. (0, 2, 0, 1), (—1,0, 1, 2), dosazením x = 0, y = 3, z = 2, u = 5 do rovnic
2 v + u = a,
—x + z + 2u = b
11, b = 12, následně hledané implicitní vy-
bychom obdrželi a jádření
2y
+ z
+ +
u 2u
11,
12.
□
201
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
Nechť Q = A + Z(Q) je afinní podprostor v .4« a (u\,..., uk) je báze Z(Q) c K". Pak vyjádření podprostoru
Q = [A + řií 0 dostáváme polopřímku začínající v bodě A a procházející bodem C. Libovolně pevně zvolené t e R a měnné s > 0 pak zadávají polopřímku s počátkem na hraniční přímce a s body v polorovině, ve které se nachází bod C. To znamená, že hledanou otevřenou polorovinu můžeme vyjádřit parametricky takto
[2, 1, 1] + t (1, 3, 4) + s (2, -3, 2), t e R, s > 0.
□
4.4. Určete vzájemnou polohu přímek
p : [1,0, 3] + t (2,-1,-3), t s R, q : [1,1, 3] +s (1,-1,-2), s e R.
Řešení. Hledejme společné body zadaných přímek (průnik podprostoru). Dostáváme soustavu
1 + 2t = 1 + s, 0 - t = 1 - s, 3 - 3t = 3 - 2s.
Z prvních dvou rovnic vyplývá, že t = 1, s = 2. To ovšem nevyhovuje třetí rovnici. Soustava tak nemá řešení. Neboť směrový vektor (2,-1,-3) přímky p není násobkem směrového vektoru (1,-1,-2) přímky q, přímky nejsou rovnoběžné. Jedná se proto o mimoběžky. □
4.5. Pro jaká čísla a e M jsou přímky
p : [4, -4, 8] + t (2, 1, -4), t e R, q : [o,6,-5] + 5 (1,-3,3), s e R
různoběžné?
202
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
4.5. Transformace souřadnic. Dvě libovolně zvolené afinní soustavy souřadnic (Ao, u), (Bo,v) se obecně liší posunutím počátku o vektor (Bq — Ao) a jinou bazí zaměření. Transformační rovnice mezi příslušnými souřadnicemi tedy vyčteme ze vztahu pro obecný bod X e A
X — B0+x\vi H-----\-x'nvn
— B0 + (Ao - Bo) +x\u\ H-----\-x„u„.
Označme y — (yi,..., yn)T sloupec souřadnic vektoru (Ao — Bq) v bázi vaM — (a;j) buď matice vyjadřující bázi u prostřednictvím báze v. Potom
x'i — yi + «11*1 H-----1- a\nxn
xn — yn + cin\x\ + ■ ■ ■ + annxn
tj. maticově
x' — y + M ■ x. Jako příklad si můžeme vujádřit dopad takové změny báze na souřadné vyjádření podmnožin pomocí systémů lineárních rovnic. Nechť má v souřadnicích (Ao; w) náš systém rovnic tvar
S ■ x — b
s maticí systému S. Potom
S-x = S- M"1 • (y + M ■ x) - S ■ M"1 ■ y = b.
Proto v nových výše uvažovaných souřadnicích (Bo; v) bude mít náš systém rovnic tvar
(S ■ M~l) ■ x' — b' — b + (S ■ M~l) ■ y.
Pokud tedy máme nějakou podmnožinu popsánu systémem lineárních rovnic v jednom afinním repéru, pak tomu tak bude i ve všech ostatních afinních souřadných systémech. To plně dokončuje důkaz předchozí věty.
4.6. Příklady afinních podprostorů. (1) Jednorozměrný (standardní) afinní prostor je množina všech bodů reálné přímky A\. Její zaměření je jednorozměrný vektorový prostor R (a nosná množina také R). Afinní souřadnice dostaneme volbou počátku a měřítka (tj. báze ve vektorovém prostoru R). Všechny vlastní afinní podpro-story jsou 0-rozměrné, jsou to právě všechny body reálné přímky R.
(2) Dvourozměrný (standardní) afinní prostor je množina všech bodů prostoru Ai se zaměřením R2. (Nosnou množinou je R2.) Afinní souřadnice dostaneme volbou počátku a dvou nezávislých vektorů (směrů a měřítek). Vlastní afinní podprostory jsou pak všechny body a přímky v rovině (0-rozměrné a 1-rozměrné). Přímky přitom jednoznačně zadáme jejich jedním bodem a jedním generátorem zaměření (tzv. parametrický popis přímky).
(3) Trojrozměrný (standardní) afinní prostor je množina všech bodů prostoru a3 se zaměřením R3. Afinní souřadnice dostaneme volbou počátku a tří nezávislých vektorů (směrů a měřítek). Vlastní afinní podprostory jsou pak všechny body, přímky a roviny (0-rozměrné, 1-rozměrné a 2-rozměrné).
(4) Podprostor všech řešení jedné lineární rovnice a ■ x — b pro
Řešení. Přímky jsou různoběžné tehdy a jenom tehdy, když má soustava
4 + 2t = a + s, -4 + t = 6 - 3s,
8 - At = -5 + 3s právě 1 řešení. V maticovém zápisu řešíme (první sloupec odpovídá proměnné ř, druhý pak s)
i 2 -1 fl-4 \ ( 1 3 10
1 3 10 2 -1 a-A
V "4 -3 -13 ) ^ -4 -3 -13
-7 1
10
a - 24 3
Vidíme, že soustava má právě 1 řešení tehdy a jenom tehdy, když je druhý řádek násobkem třetího. To je splněno pouze pro a = 3. Dodejme, že průsečíkem je v tomto případě bod [6, —3,4]. □
4.6. V M3 stanovte vzájemnou polohu přímky p zadané implicitně rovnicemi
x + y - z = 4, x - 2y + z = -3 a roviny q : y = 2x — 1.
Řešení. Normálový vektor q je (2, — 1, 0) (uvažte zápis q : 2x — y + 0z = 1). Lze postřehnout, že platí
(1,1,-1)+ (1,-2, 1) = (2,-1,0),
tj. že normálový vektor roviny q je lineární kombinací normálových vektorů p. Zaměření přímky (zadané nenulovým směrovým vektorem kolmým na uvedené dva normálové vektory) je proto podprostorem zaměření roviny q (směrový vektor přímky je nutně kolmý na vektor (2, — 1, 0)). Lehce jsme zjistili, že přímka p je rovnoběžná s rovinou q. Zajímá nás, zda se protínají (zda p leží v q). Soustava rovnic x + y - z = 4,
x 2x
2y
y
+
-3,
1
má nekonečně mnoho řešení, neboť sečtením prvních dvou rovnic dostaneme právě třetí z rovnic. Přímka p tak musí ležet v rovině q. □ Následuje standardní příklad na průnik vektorových prostorů.
Čtenář by měl být schopen následující příklad vyřešit. Doporučujeme nepokračovat ve čtení této učebnice, 11 dokud tomu tak nebude.
4.7. Nalezněte průnik podprostorů Q\ a Q2, je-li
Qi : [4, -5, 1, -2] + h (3, 5, 4, 2) + t2 (2, 4, 5, 1) + ř3 (0, 3, 1, 2), Q2 : [4, 4, 4, 4] + Sl (0, -6, -2, -4) + s2 (-1, -5, -3, -3), kde t\, t2, ř3, s\,s2 e R.
203
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
neznámy bod [x\,..., x„] e A„, známý nenulový vektor koeficientů (fli,..., a„) a skalár b e M je afinní podprostor dimenze n—1 (říkáme také, že je jeho kodimenze 1), tj. tzv. nadrovina v A„.
Afinní kombinace bodů. Zavedeme nyní obdobu lineárních kombinací vektorů. Nechť Ao, ..., Ak jsou body v afinním prostoru A. Jejich afinní obal ({Ao ..., Ak}) můžeme zapsat jako
{Ao + hiAt - A0) + ■■■ + tk(Ak - A0); h,
, t k e
0},
(4) obecněji k- rozměrné poloprostory
a — {P + t\ ■ v\ H-----h tk ■ vk; t\,
, e R, > 0},
(5) úhly v dvojrozměrných podprostorech
fJ = {P + ři • vi + t2 ■ v2; h >0,t2> 0}.
Přímo z definice také plyne, že průnik libovolného systému konvexních množin je opět konvexní. Průnik všech konvexních množin obsahujících danou množinu M nazýváme konvexní obal JC(M) množiny M.
Věta. Konvexní obal libovolné podmnožiny M C A je
s
K{M) = {tlAl +■■■ + tsAs; J^ti = L fi ^ 0, A,- e M]
i=\
Důkaz. Označme S množinu všech afinních kombinací na pravé straně dokazované rovnosti. Nejprve ověříme, že je S konvexní. Zvolme tedy dvě sady parametrů ti, i — 1,.., s\, ťj, j — 1,..., s2 s požadovanými vlastnosti.
Bez újmy na obecnosti můžeme předpokládat, že s\ — s2 a že v obou kombinacích vystupují stejné body z M (jinak prostě přidáme sčítance s nulovými koeficienty). Uvažme libovolný bod úsečky zadané takto získanými body:
e(řiAi + • • • + tsAs) + (1 - e)(ť;Ai + • • • + ťsAs), 0 < e < 1.
Zřejmě jsou opět všechny v S.
Zbývá ukázat, že konvexní obal bodů A\,..., As nemůže být menší než S. Samotné body A; odpovídají volbě parametrů tj — 0 pro všechny j ^ i a ř; — 1. Předpokládejme, že tvrzení platí pro všechny množiny s nejvýše s — 1 body. To znamená, že konvexní obal bodů A\,..., As_i je (podle předpokladu) tvořen právě těmi kombinacemi z pravé strany dokazované rovnosti, kde ts — 0. Uvažme nyní libovolný bod A — t\A\-\-----\-tsAs e S,ts < 1, a afinní
kombinace
e(řiAi
+ řs_iAs_i) + (1 - e(l - ts))As, 0 < € < yij-.
Jde o úsečku s krajními body určenými parametry e — 0 (bod As) a e — 1/(1 — řs) (bod v konvexním obalu bodů A\,..., As_i). Bod A je vnitřním bodem této úsečky s parametrem e — 1. □
Konvexní obaly konečných množin bodů se nazývají konvexní mnohostěny. Jsou-li definující body Aq, ..., A* konvexního mnohostěnu v obecné poloze, dostáváme právě ^-rozměrný simplex. V případě simplexu je vyjádření jeho bodů ve tvaru afinní kombinace definujících vrcholů jednoznačné.
Zvláštním příkladem jsou konvexní mnohostěny generované jedním bodem a konečně mnoha vektory: Nechť u\, jsou
4.8. Zjistěte, zda leží body [0, 2, 1], [-1,2, 0], [-2, 5, 2] a [0, 5, 4] z M3 v jedné rovině.
Řešení. Libovolná dvojice zadaných bodů z afinního prostoru R3 určuje vektor (viz definice afinního prostoru; jeho souřadnice jsou dány po složkách rozdíly souřadnic daných dvou bodů). To, že dané čtyři body leží v rovině je ekvivalentní tomu, že jsou tři vektory dané jedním vybraným bodem a vždy jedním ze tří zbylých lineárně závislé. Vybereme např. bod [0, 2, 1] (na výběru nezáleží), pak uvažujeme vektory [0, 2, 1]-[-1,2,0] = (1,0, 1), [0,2, l]-[-2, 5,2] = (2, -3, -1) a [0, 2, 1] - [0, 5, 4] = (0, -3, -3). Vidíme, že součet dvojnásobku prvního vektoru a třetího vektoru je roven druhému vektoru, vektory jsou tedy lineárně závislé (jinak má taky matice, jejíž řádky jsou tvořeny souřadnicemi daných vektorů, hodnost nižší než tři; v tomto případě se tedy jedná o matici
která má hodnost dva). Dané body tedy leží v rovině.
□
4.9. Na kolik částí mohou dělit prostor (R3) tři roviny? Pro každou možnost popište odpovídající případ.
4.10. Rozhodněte, zda leží bod [2, 1,0] uvnitř konvexního obalu bodů [0, 2, 1], [1, 0, 1], [3, -2, -1], [-1,0, 1].
Řešení. Sestavíme nehomogenní lineární soustavu, pro koeficienty t\, t2, t3, t a,, afinní kombinace daných bodů, která dává první bod (jsou určeny jednozačně, pokud dané body neleží v rovině).
/Ol 3 -1\ /řA Í2\ 2 0 -2 0 t2 _ 1 11-11 ti ~ 0 \1 1 1 l) W W Poslední rovnice udává, že jde o afinní kombinaci. Jejím řešením dostáváme (ři, t2, ř3, ř4) = (1,0, 1/2, —1/2), nejedná se tedy o konvexní kombinaci, (nelze odvodit pomocí projekcí na jednotlivé osy). □
4.11. V R3 je dán čtyřstěn ABCD, kde A = [4, 0, 2], B = [-2, -3, 1], C = [1, -1, -3], D = [2, 4, -2]. Rozhodněte, zda leží bod X = [0, — 3, 0] uvnitř tohoto čtyřstěnu.
Řešení. Daný bod uvnitř daného čtyřstěnu neleží. Vyjádříme-Li X jakožto afinní kombinaci jeho vrcholů (řešením soustavy čtyř lineárních rovnic o čtyřech neznámých a, b, c a d dané rovností X = aA + bB + cC + dD), obdžíme X = \A + \B + \C - \D. To znamená, že X neleží v daném čtyřstěnu, tj. v konvexním obalu bodů A, B, C a D {a, b, c i d by musela být v intervalu (0,) 1). □
205
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
libovolné vektory v zaměření R", A e A„ je libovolný bod. Rovnoběžnostěn Vk(A; u\,..., uk) c An je množina
Vk(A; u\, ..., Uk) — {A + c\u\ H-----h ckuk; 0 < q < 1}.
Jsou-li vektory u\,...,uk nezávislé, hovoříme o ^-rozměrném rovnoběžnostěnu Vk(A;u\,... ,uk) C A„. Z definice je zřejmé, že rovnoběžnostěny jsou konvexní. Ve skutečnosti jde o konvexní obaly jejich vrcholů.
4.10. Příklady standardních afinních úloh. (1) K podprostoru ř^i\.. zadanému implicitně nalézt parametrický popis a naopak:
i, 'J5ř
Nalezením partikulárního řešení nehomogenního systému a fundamentálního řešení zhomoge-nizovaného systému rovnic získáme (v souřadnicích, ve kterých byly rovnice zadány) právě hledaný parametrický popis. Naopak, zapíšeme-li parametrický popis v souřadnicích, můžeme volné parametry t\,... ,tk vyeliminovat a získáme právě rovnice zadávající daný podprostor implicitně.
(2) Nalézt podprostor generovaný několika podprostory Qi, ■ ■ ■, Qs (obecně různých dimenzí, např. v Rj, nalézt rovinu danou bodem a přímkou, třemi body apod.) a zadat jej implicitně či parametricky:
Výsledný podprostor Q je vždy určen jedním pevně zvoleným bodem A i v každém z nich a součtem všech zaměření. Např.
Q = Al + (Z({Al,...,Ak}) + Z(Ql)
Z(QS)).
Pokud jsou podprostory zadány implicitně, je možné je nejdříve převést na parametrický tvar. V konkrétních situacích bývají funkční i jiné postupy. Všimněme si, že obecně je skutečně nutné využít jednoho bodu z každého podprostoru. Např. dvě paralelní přímky v rovině vygenerují celou rovinu, ale sdílí totéž jednorozměrné zaměření.
(3) Nalézt průnik podprostoru Q\, ..., Qs:
Pokud jsou zadány v imphcitním tvaru, stačí sjednotit všechny rovnice do jednoho systému (a případně vynechat lineárně závislé). Pokud je vzniklý systém neřešitelný, je průnik prázdný. V opačném případě získáme implicitní popis afinního podprostoru, který je hledaným průnikem.
Pokud máme dány parametrické tvary, můžeme také hledat přímo společné body jako řešení vhodných rovnic, podobně jako při hledání průniků vektorových podprostoru. Získáme tak přímo opět parametrický popis. Pokud je podprostoru více než dva, musíme průnik hledat postupně.
Máme-li jeden prostor zadaný parametricky a ostatní implicitně, stačí dosadit parametrizované souřadnice a řešit výsledný systém rovnic.
(4) Nalezení příčky mimoběžek p, q v Aj, procházející daným ■J.< i. bodem nebo mající předem daný směr (tj. zaměření):
Příčkou rozumíme přímku, která má neprázdný průnik s oběma mimoběžkami. Výsledná příčka r tedy bude jednorozměrným afinním podprostorem. Pokud máme zadán jeho bod Aer, pak afinní podprostor generovaný p a A je buď přímka (A e p) nebo rovina (A p). V prvém případě máme nekonečně mnoho řešení, jedno pro každý bod z q, v druhém stačí najít průnik B roviny (p U A) s q a r — ({A, B}). Pokud je průnik prázdný, úloha nemá řešení, v případě že q C (p U A), máme opět nekonečně mnoho řešení, a pokud je průnik jednoprvkový, dostáváme právě jedno řešení.
4.12. Afinní transformace souřadnic bodů
V afinní bázi {[1, 2, 3], (1, 1, 1), (1,-1, 2), (2, 1, 1)} v R3 jsou vyjádřeny souřadnice bodu X jako [2,2,3]. Určete jeho souřadnice ve standardní bázi, tj. v bázi {[0, 0, 0], (1,0, 0), (0, 1,0), (0, 0, 1)}.
Řešení. Souřadnice [2, 2, 3] vbázi {[1, 2, 3], (1, 1, 1), (1, -1,2), (2, 1, 1)} určujípředpisem[l,2, 3]+2-(l, 1, l)+2-(l, -l,2) + 3-(2, 1, 1) = [11,5, 12] souřadnice bodu X ve standardní bázi. □
4.13. Afinní transformace předpisu zobrazení. Nalezněte předpis afinního zobrazení / v souřadné soustavě dané bází u = {(1,1), (—1, 1)} a počátkem [2, 0], které je ve standardní bázi v R2 dáno jako
f(xi,x2)
2 1 0 1
Řešení. Matice přechodu od dané báze u ke standardní bázi k je
'l -Ý 1 1
Matici zobrazení v bázi ([2, 0], u) získáme tak, že nejprve transformujeme souřadnice v bázi ([2, 0], u) na souřadnice ve standardní bázi, tedy v bázi ([0, 0], (1, 0), (0, 1)), poté aplikujeme matici zobrazení / ve standardní bázi a na závěr výsledek transformujeme zpět do souřadnic v bázi ([2, 0], u). Transformační rovnice přechodu od suouřadnic yi, y 2 v bázi ([2, 0], u) k souřadnicím x\, x2 v standardní bázi jsou
+
Odtud máme, že
1
yi _
y2J \ 1 1 Pro předpis zobrazení pak dostáváme
+
/(ji, y i)
+
+
+
□
4.14. Mějme dánu standardní souřadnou soustavu v prostoru R3. Agent K sídlí v bodě S o souřadnicích [0,1,2] a ústředí mu přidělilo pro používání souřadnou soustavu s počátkem S a bází {(1, 1,0), (-1,0, 1), (0, 1,2)}. Agent Sokol bydlí domě D na kótě [1, 1, 1] a používá souřadnou soustavu s bází {(0,0, 1), (-1, 1,2), (1,0, 1)}. Agent K žádá Sokola o schůzku v cihelně, která leží podle jeho souřadné soustavy v bodě [1, 1,0]. Kam má přijít Sokol (podle jeho souřadnic)?
206
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
Máme-li místo bodu dán směr u e R", tj. zaměření r, pak uvažujeme opět podprostor Q generovaný p a zaměřením Z(p) + (u) c R". Opět, pokud q G Q, máme nekonečně mnoho řešení, jinak uvážíme průnik Q s q a úlohu dokončíme stejně jako v předchozím případě.
Řešení mnoha dalších praktických geometrických úloh vesměs spočívá v systematickém používání výše uvedených kroků.
4.11. Poznámky k lineárnímu programování. Na začátku třetí kapitoly jsme se zastavili v odstavcích 3.4-3.8 u praktických problémů, které jsou zadány pomocí systémů lineár-| nich nerovnic. Snadno ověříme, že každá taková jednotlivá nerovnice
a\x\
■ anx„ < b
zadává v standardním afinním prostoru Rn poloprostor ohraničený nadrovinou, kterou zadává příslušná rovnice (srovnej s definicí v odstavci 4.9(4)). Skutečně, jestliže zvolíme parametrický popis příslušné nadroviny
{P + tw + ••• + ?„-! vn-i]
s vektory zaměření u i,..., u„ _ i, pak doplněním těchto vektorů do báze celého Rn vektorem v, nutně musí být hodota
a\x\ + • • • + a„x„ — b
na lineární kombinaci t\ v \ H-----h t„ _ i vn _ i +1„ v vždy kladná pro
všechny vektory buď s kladným nebo záporným tn.
Zároveň tedy vidíme, že množina všech přípustných vektorů pro problém lineárního programování je vždy průnikem konečně mnoha konvexních množin a tedy je sama buď konvexní nebo prázdná.
Pokud je zároveň průnik neprázdný a omezený, pak jde zřejmě o konvexní mnohostěn. Jak jsme zdůvodnili již v 3.4, každá lineární forma je podél každé (parametrizované) přímky v afinním prostoru buď stále rostoucí nebo stále klesající nebo konstantní. Pokud je tedy daný problém lineárního programování řešitelný a omezený, pak musí mít optimální řešení v jednom z vrcholů příslušného konvexního mnohostěnu. Čtenář by si měl umět toto tvrzení bez problémů představit v případě dvourozměrného nebo třírozměrného problému. Přímočaré zdůvodnění z těchto malých dimenzí však platí pro věechny konečněrozměrné případy.
Tím jsme podali „geometrický důkaz" existenční části základní věty 3.7. Takéjsme tak původní problém převedli k diskrétní (tj. konečné) úvaze o hodnotách dané cenové funkce v konečně mnoha bodech prostoru. K příkladu praktického algoritmu, jak příslušné vrcholy konvexního mnohostěnu co nejsnáze najít a vyhodnotit, se vrátíme ještě v kapitole o diskrétní matematice.
4.12. Afinní zobrazení. Zobrazení / : A -> B mezi afinními prostory nazýváme afinní zobrazení, jestliže mezi jejich zaměřeními existuje lineám zobrazení Z(B) takové, že pro všechny A e A, v € Z (A) platí
f (A + v) = f (A) +
B. Přímo z definice je zřejmé, že stačí vyjádřit obraz /(Aq) počátku souřadnic v A v souřadnicích na B, tj. vyjádřit vektor /(Ao) — Po v bázi v jako sloupec souřadnic yo a vše ostatní je pak určeno násobením maticí zobrazení
• yo + Y ■ x,
kde yo je jako výše a Y je matice zobrazení
!) = t-1. ~2- ~3]-
Souřadnice hledaného obrazu X" jsou X" = X' + (0, 0, 1) = [—1, —2, —2]. Při zrcadlení bodu [3, 2, 1] jsme samozřejmě mohli použít přímo matice získané v příkladu || 2.791|. □
B. Eukleidovská geometrie
4.19. Určete vzdálenost přímek v R3. p : [1,-1,0] +f (-1,2, 3), a : [2, 5, -1] + ř(-l, -2, 1).
Řešení. Vzdálenost je dána jako velikost kolmého průmětu libovolné příčky (spojnice) daných přímek do ortogonálního doplňku vektorového podprostoru generovaného jejich zaměřeními. Tento ortogonální doplněk zjistíme například pomocí vektorového součinu:
((-1, 2, 3), (-1, -2, l))x = ((-1, 2, 3) x (-1, -2, 1)) = ((8,-2, 4)) = ((4,-1,2)).
Spojnicí daných přímek je například úsečka [1, —1, 0][2, 5, —1], promítneme tedy vektor [1, —1, 0] — [2, 5, —1] = (—1, —6, 1). Pro vzdálenost přímek pak dostáváme:
|(-1,-6,1). (4,-1,2)| 4
PÍP, )
I(4,-1,2)|
□
4.20. Nalezněte bod A přímky
p : x + 2y + z - 1 = 0, 3x - y + 4z - 29
0,
[3, 11,4],
který má stejnou vzdálenost od bodů B = C = [-5, -13, -2].
Řešení. Nejprve vyjádříme přímku p parametricky tak, že vyřešíme soustavu rovnic
x + 2y + z = 1, 3x - y + 4z, = 29.
Soustavu zapíšeme rozšířenou maticí a upravíme
1 2 1 3-14
1
29
1 0 9/7 0 1 -1/7
1 2 1 0 -7 1
59/7 -26/7
1
26
Tím dostáváme vyjádření "59 26
7
7
,0
+ t
9 1 7' 7
, 1
t e
Odkud substitucí t = Is + 26 plyne
p : [-25, 0,26] + s (-9, 1,7), se
209
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
(1) p(A, B) = p(B, A)
(2) p(A, B) = 0 právě, když A — B
(3) p(A,B) + p(B,C)> p(A,C)
(4) V každé kartézké souřadné soustavě (Aq; e) mají body A — Ao+aiei +• ■ ■ +anen, B — A^+biei +• ■ ■ +bnen vzdálenost
(5) Je-li dán bod A a podprostor Q v £„, pak existuje bod P e Q minimalizující vzdálenosti bodů Q od A. Vzdálenost bodů A a P je rovna velikosti kolmého průmětu vektoru A — B do Z(Q)1- pro libovolný B e Q.
(6) Obecněji, pro podprostory Q alZv £n existují body P e Q a Q e 1Z minimalizující vzdálenosti bodů B e Q a A e 1Z. Vzdálenost bodů Q a P je rovna velikosti kolmého průmětu vektoru A — B do Z(Q)1- pro libovolné body B e Qa A e7Z.
Důkaz. První tři vlastnosti vyplývají přímo z vlastností velikosti vektorů v prostorech se skalárním součinem, čtvrtá plyne přímo z vyjádření skalárního součinu v libovolné ortonormální bázi.
Podívejme se na vztah pro minimalizaci vzdle-ností p(A, B) pro B e Q. Vektor A — B se jednoznačně rozkládá na A — B — u\ + u2, u\ e Z(Q), u2 e Z(Q)-1. Přitom u2 nezávisí na volbě B e Q, protože případná změna bodu B se projeví přičtením vektoru ze Z(Q).
Nyní zvolme P — A + (—uj) — B + u\ e Q. Dostáváme
5H2 =
Im1 I
\\u2W2 > \\u2W2 — \\A ■
Odtud již vyplývá, že nejmenší možné vzdálenosti je skutečně dosaženo, a to právě pro náš bod P. Vypočtená vzdálenost je skutečně
II"2||.
Obdobně ukážeme obecný výsledek. Pro volbu libovolných bodů A e IZaB e Q je jejich rozdíl dán jako součet vektorů u\ e Z(1Z) + Z(Q) au2 e (Z(1Z) + Z(Q))-1, přičemž komponenta «2 nezávisí na volbě bodů. Přičtením vhodných vektorů ze zaměření IZaQ zjevně obdržíme body A' a B', jejichž vzdálenost je právě
II «2II- □
Rozšíříme nyní náš stručný přehled elementárních úloh v analytické geometrii.
4.17. Příklady standardních úloh. (1) Najděte vzdálenost bodu A € £n odpodprostoru Q C £„:
Postup při řešení je dán ve větě 4.16. (2) V £2 veďte bodem A přímku q svírající s danou přímkou p daný úhel: Připomeňme, že na úrovni rovinné geometrie jsme s odchylkami vektorů již pracovali (viz např. 2.43). Najdeme vektor u e R2 ležící v zaměření přímky q a zvolíme vektor v mající od u zadanou odchylku. Hledaná přímka je dána bodem A a zaměřením (v). Úloha má dvě nebo jedno řešení.
(3) Spočtěte patu kolmice vedené bodem na danou přímku:
Postup je uveden v důkazu předposledního bodu věty 4.16.
(4) V £3 určete vzdálenost dvou přímek p, q:
Zvolíme libovolně jeden bod z každé přímky, A e p, B e q. Komponenta vektoru A — B v ortogonálním doplňku (Z (p) + Z (q))1- má velikost rovnu vzdálenosti p a q.
(5) V £3 najděte osu dvou mimoběžek p a q:
Bod A obdržíme volbou jistého sel. Přitom vektory
A — B = (-28 - 9s, -11 +s,22 + 7s) , A-C = (-20 - 9s, 13 + s, 28 + 7*)
mají mít stejnou délku, tj. má platit
V(-28 - 9s)2 + (-11 + s)2 + (22 + ls)2
= V(-20 - 9s)2 + (13 + s)2 + (28 + ls)2
resp.
(-28 - 9s)2 + (-11 + s)2 + (22 + ls)2
= (-20 - 9s)2 + (13 + s)2 + (28 + ls)2.
Úpravou poslední rovnice získáme s = —3. Je tak
A = [-25, 0, 26] - 3 (-9, 1,7) = [2, -3, 5].
□
4.21. Jarda stojí v bodě [2, 1, 2] a má tyč délky 4. Může se touto tyčí současně dotknout přímek p a q, kde
p : [-1,4,1] +f (-1,2,0), q : [4,4,-1]+5(1, 2,-4)?
(Tyč musí procházet bodem [2, 1,2].)
Řešení. Již známým způsobem spočítáme příčku daných přímek procházející bodem [2, 1, 2]. Je jí úsečka [1, 0, 1][3, 2, 3], její délka je potom °JV2, což je méně než 4. Jarda se tedy danou tyčí dotknout přímek současně nemůže. □
4.22. V euklidovském prostoru M4 stanovte vzdálenost bodu A = [2, —5, 1, 4] od podprostoru daného rovnicemi
U : 4x\ — 2x2 — 3x3 — 2x4 + 12 = 0, 2xi — X2 — 2x3 — 2x4 + 9 = 0.
Řešení. Nejdříve nalezneme parametrické vyjádření podprostoru U. Např. je
B = [0, 3, 0, 3] e U.
Víme, že vzdálenost A od U se rovná velikosti kolmého průmětu vektoru A — B do ortogonálního doplňku zaměření podprostoru U. Ortogonální doplněk zaměření U ovšem známe (zadává tento podprostor) -jako množinu (lineárních kombinací normálových vektorů)
V := {t (4, -2, -3, -2) + s (2, -1, -2, -2); t, s e R}.
Potřebujeme najít kolmý průmět Pa-b vektoru A — B do V, který náleží do y, a proto je
PA-b = a (4, -2, -3, -2) + b (2,-1, -2, -2)
210
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
Osou zde rozumíme příčku, která realizuje nejmenší možnou vzdálenost daných mimoběžek pomocí bodů průniku. Opět lze postup dovodit z důkazu věty 4.16 (poslední bod). Nechť rj je podpro-stor generovaný jedním bodem A e p a součtem Z(p) + (Z(p) + Z(q))-1. Pokud nejsou přímky p a q rovnoběžné, půjde o rovinu. Pak průnik tj n q spolu se zaměřením (Z(p) + Z(q))1- dávají parametrický popis hledané osy. Pokud jsou přímky rovnoběžné, bude mít úloha nekonečně mnoho řešení.
pro jisté hodnoty a,b sR. Zjevně musí platit (A — B — Pa-b) -L V, tedy
((A - B) - PA-B) J_ (4, -2, -3, -2), ((A — B) — Pa-b) ±(2,-1,-2, -2). Dosazením za A — B a Pa-b odsud vyplývá
4.18. Odchylky. Stejně jako vzdálenost, i řada dalších geometrických pojmů jako odchylky, orientace, objem apod. je v bodových prostorech £„ zaváděna prostřednictvím vhodných pojmů ve vektorových euklidovských pro-%ítr?*&>^-~ storech. Připomeňme, že odchylku dvou vektorů jsme definovali na konci třetí části druhé kapitoly, viz 2.43.
Skutečně, z Cauchyovy nerovnosti plyne 0 <
NI NI
< 1, má
tedy smysl definice odchylky ||2 — 2(u ■ v)
— \\u\\2 + \\v\\2 — 2\\u\\\\v\\ coscp(u, v).
To je patrně dobře známá kosinová věta z rovinné geometrie.
Dále platí pro každou ortonormální bázi e zaměření V a nenulový vektor u e V vztah
\u\\2 — ^\u ■ ej\
Podělením této rovnice číslem II u Ir dostáváme vztah
1 = ^ (cos <£>(«, et))2
který je větou o směrových kosinech
2. Pak pro odchylku
l)) —
\vi\
Důkaz. Pro všechny vektory u e U platí díky Cauchyově nerovnosti
\u ■ v\ \u ■ (v\ + V2)\ \u ■ v\\
l"l I1'
||íí II II Dl II l"l |f'|
\vi I
\vi I
II ľ II II ľl I
l"l • v\
\\v\\ II Dl II
Odtud plyne
cos(p((v), («)) < cos(p((v), (Dl))
\vi I
a námi nalezený vektor di tedy představuje nej větší možnou hodnotu pro kosinus úhlu mezi všemi volbami vektorů z U. Protože je funkce cos na intervalu [0, j] klesající, dostáváme tak nejmenší možný úhel a tvrzení je dokázané. □
12
3 3 6 6\ / 1 1 2 2
0 3 -3 0 ~ " ° 1 -1 0
0 -3 3 O/ 0 0 0
-1 o
můžeme ihned napsat řešení
x = (2 - 3t, t, i) T
■1
t e
Dodejme, že existence nekonečně mnoha řešení je zapříčiněna nadbytečností třetího ze zadávajících vektorů podprostorů U, neboť je
3 (1, 0, 1, 1) - (2, 1, 1, 0) = (1, -1, 2, 3).
Libovolná (ř e R) lineární kombinace
(2 - 3ř) (1, 0, 1, 1) + t (2, 1, 1, 0) + t (1, -1, 2, 3) = (2, 0, 2, 2)
však odpovídá bodu [2, 0, 2, 2] podprostorů U, který je nejblíže bodu [0, 0, 6, 0]. Pro hledanou vzdálenost proto platí
v = || [2, 0, 2, 2] - [0, 0, 6, 0] || = V22 + 0 + (-4)2 + 22 = 2^6.
□
4.24. V euklidovském prostoru M5 stanovte vzdálenost rovin
Q! : [7, 2, 7, -1,1] + h (1, 0, -1, 0, 0) + sx (0, 1, 0, 0, -1), q2 : [2, 4, 7, -4, 2] + ř2 (1, 1, 1, 0, 1) + s2 (0, -2, 0, 0, 3), kde t\, s\, t2, S2 € R, a poté vzdálenost rovin
cti : [0, 1, 2, 0, 0] + px (2, 1, 0, 0, 1) + qx (-2, 0, 1, 1, 0), ct2 : [3, -1, 7, 7, 3] + p2 (2, 2, 4, 0, 3) + q2 (2, 0, 0, -2, -1),
212
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
4.21. Výpočet odchylek. Postupu v předchozím lemmatu můžeme rozumět tak, že jednorozměrný podprostor generovaný vektorem v kolmo promítneme do podprostoru U I a podíváme se, jak moc se obrazy zmenšují. Podle toho V~l ' pak poznáme odchylku. Podobný postup použijeme ve vyšších dimenzích také. Potíž je přitom ale s rozpoznáním, které směry nám svými průměty odchylku skutečně prozradí. V našem předchozím případě to můžeme dobře vidět, pokud nešikovně budeme promítat větší prostor U do jednorozměrného (v) a pak kolmo zpět do U. Zjistíme, že odchylku poznáme podle směru vlastního vektoru takového zobrazení, jeho vlastní číslo bude kvadrátem příslušného kosinu úhlu.
Uvažujme tedy dva obecné podprostory U\, U2 v euklidovském vektorovém prostoru V, předpokládejme U\ n U2 — {0}, a zvolme pevně ortonormální báze e, a e' celého prostoru V tak, aby Ui = (eu...,ek), U2 = <<,..., e[).
Uvažujme kolmý průmět
V2- Zobrazení i/r : U2 —>• U\ nechť vznikne podobně z kolmého průmětu na U\. Tato zobrazení mají v bazích (e\, ..., e*) a (e\, ..., e'}) matice
ek-e\\
, B
e'i ■ ek)
Protože jde o skalární součiny na reálném vektorovém prostoru, platí e; • e'- — e'- ■ e; pro všechny indexy /, j a proto zejména platí B = at.
Složené zobrazení ý o
U\ má tedy symetrickou pozitivně semidefinitní matici at a a ý je zobrazení adjungované k (p. Viděli jsme, že každé takové zobrazení má pouze nezáporná reálná vlastní čísla a že má ve vhodné ortonormální bázi diagonální matici s těmito vlastními čísly na diagonále, viz 3.29 a 3.31.
Nyní můžeme odvodit obecný postup pro výpočet odchylky a — cp(U\, U2).
Věta. V předchozím označení nechť je k největší vlastní hodnota
matice A1 A. Pak (cos a)1
Důkaz. Nechť u e U\ je vlastní vektor zobrazení ý o (s příslušný největší vlastní hodnotě X. Uvažme ■m, všechna vlastní čísla X\,..., Xk (včetně násobnosti) a nechť u — (u\, ...,«„) je příslušná ortonormální báze U\ z vlastních vektorů. Můžeme přímo předpokládat, že X — X\, u — u\.
Potřebujeme ukázat, že odchylka libovolného v e U\ od U2 je nejméně tak velká jako odchylka u od U2. Tzn. že kosinus příslušného úhlu nesmí být větší. Podle předchozího lemmatu stačí diskutovat odchylku u a q>(u) e U2 a přitom víme, že \\u\\ — 1.
Zvolme tedy v e U\, v Pak
a\U\-
\\
"1)
- P2 {vu «i) - q2 (v2, ux) = 0,
(-3, 2, -5, -7, -3), u2 ) + pi (uu u2 ) + qi (u2, u2 )
- p2 { vi, u2 ) - q2 { v2, u2 ) = 0,
; (-3, 2, -5, -7, -3), ví ) + pi vi) +qi (u2, vi )
- p2 (vi, vi) - q2 { v2, ví ) = 0,
213
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
Protože jsme zvolili za X\ největší z vlastních hodnot a součet kvadrátů souřadnic af je jedna, dostáváme
(cos a) = ||<í>( i>) ii
\Ý °
«a«)2
i=\
Aí) <
i = \
AílMI
X a
Při v = u dostáváme ovšem přesně || (2, 0, 0, -
Snadno získáme
/ 2 1 0 0 1 \ / 1 0 0 0 3/2 \
-2 0 1 1 0 0 1 0 0 -2
2 2 4 0 3 0 0 1 0 1
v 2 0 0 -2 -1 ) ^ 0 0 0 i 2 ;
-1)
odkud dostáváme ortogonální doplněk ((—3/2, 2, —1, —2, 1)), příp. jej raději zapišme jako ((3, —4, 2, 4, —2)). Připomeňme, e vzdálenost cti vůči ct2 se rovná velikosti kolmého průmětu vektoru (rozdílu libovolného bodu ct i a libovolného bodu ct2)
u = (3, -2, 5, 7, 3) = [3, -1, 7, 7, 3] - [0, 1, 2, 0, 0]
do tohoto ortogonálního doplňku. Označme zmíněný kolmý průmět u symbolem pu a polo meu = (3, —4, 2, 4, —2). Zřejmě je pu = a ■ v pro nějaké a e M a má platit
(u — pu, v ) = 0, tj. (u, v) — a (v, v) = 0.
Vyčíslení dává 49 — a ■ 49 = 0. Je tudí pu = \ ■ v = v a vzdálenost rovin ct i, ct2 je rovna
\\Pu\\ = V32 + (-4)2 + 22 +42 + (-2)2 = 7.
214
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
Jinak uvažujeme jako při Grammově-Schmidtově ortogonalizaci
(«1, . . . , Wjfc) = (uu Uk-l)@(lll, ut-i^n (uu ...,uk).
V tomto rozkladu se uk jednoznačně vyjádří jako
uk = u'k + ek
kde ej; _L (u\, ..., uk-\).
Absolutní hodnotu objemu rovnoběžnostěnu definujeme induktivně tak, abychom naplnili představu, že jde o součin objemu „základny" a „výšky":
I VolľPi(A; mi) = IIííiII I Vol\Vk(A; mi, ..., uk) = Het III Vol\Vk-i(A; uu ..., Mjt_i).
Je-U «!,...,«„ báze souhlasná s orientací V, definujeme (orientovaný) objem rovnoběžnostěnu
Vol P* (A; uu ..., u„) = I Vol |pjt(A; uu ..., it„),
v případě neosuhlasné báze klademe
VolVk(A; uu ..., u„) = - I Vol |7>t(A; mi, ..., it„).
Následující tvrzení objasňuje naše dřívější poznámky, že determinant je v jistém smyslu nástroj vyjadřující objem. První tvrzení totiž říká právě, že na ^-rozměrném prostoru dostaneme objem rovnoběžnostěnu nataženého na k vektorů tak, že jejich souřadnice (v ortonormální bázi) napíšeme do sloupců matice a spočteme determinant.
Výrazu ve druhém tvrzení se říká Grammův determinant. Jeho výhoda je, že je zcela nezávislý na volbě báze a zejména se s ním proto lépe pracuje v případě k menšího než je dimenze celého prostoru.
Věta. Nechť Q C £„ je euklidovský podprostor a nechť (ei,...,ek) je jeho ortonormální báze. Pak pro libovolné vektory u\, ..., uk e Z(Q) a A e Q platí
(1) VolVk(A;Ul
(2) (Voirk(A;uu...,uk))2
u\ ■ e\ u\-ek ..
U\ ■ U\
U\ ■ uk
uk ■ e\
Uk ■ ek uk ■ U\
uk • uk
Důkaz. Matice
(u\ ■ e\
\u\ ■ ek
uk ■ e\\
uk ■ ekJ
má ve sloupcích souřadnice vektorů u\,... ,uk ve zvolené ortonormální bázi. Platí
A||A| = u\ ■ u\
U\ ■ uk
\AT\\A\
\ATA\
Uk ■ U\
uk ■ uk
Vidíme tedy, že pokud platí (1), platí i (2).
Přímo z definice je neorientovaný objem roven součinu
Ukázalo se, že výpočet vzdálenosti pomocí ortogonálního doplňku součtu zaměření byl v předešlém příkladu „rychlejší cestou k výsledku". Pro roviny q\ a q2 tomu bude nepochybně stejně. Druhá metoda ovšem dává body, ve kterých se vzdálenost realizuje (body, kde si jsou roviny nejblíže). Nalezněme proto s její pomocí takové body v případě rovin Qi,Q2- Označme
m = (1, 0, -1, 0, 0), u2 = (0, 1, 0, 0, -1), ui = (1, 1, 1,0, 1), v2 = (0, -2, 0, 0, 3).
Body Xi s Qi, X2 s Q2, ve kterých se vzdálenost rovin realizuje, můžeme vyjádřit jako
Xi = [7, 2, 7, -1,1] + ri«i + siu2, X2 = [2, 4, 7, -4, 2] + t2vi + s2v2,
a tedy
Xi-X2= [7, 2,7,-1, 1] - [2,4, 7, -4, 2]
+ri«i + siu2 - t2vi - s2v2 = (5, —2, 0, 3, —1) + t\Ui + siu2 — t2vi — S2V2-
Skalární součiny
(Xl-X2,ul) =0, (X1-X2,v1)=0,
xl
X2,u2) =0, X2,v2) =0
pak vedou na soustavu lineárních rovnic
2ři = -5,
2si + 5^2 = 1,
-4f2 - s2 = -2, -5si - h - 13^2 = -1 s jediným řešením t\ = —5/2, s\ = 41/2, t2 = 5/2, s2 = —8. Získali jsem tak
"9 45 19 39 2' ~2" ~2" ~ ' ~~2
5 41
Xx = [7,2,7,-1, !]--«! + — U2
X2 = [2,4,1, -4,2] + -Vl
8f2
9 45 19 39 2' 2~' 2~' ~ ' ~~2
\Vol\rk(A;Ul,...,uk)
\\vi\W\v2\
\Vk\
Nyní ji snadno ověříme, že vzdálenost bodů X\, X2 (a současně \zdá-lenostrovinei,e2)je||Xi -X2\\ = || (0, 0, 0, 3, 0) || =3. □
4.25. Najděte průnik kolmé roviny spuštěné z bodu A = [1,2,3,4] eť na rovinu
q : [1, 0, 1, 0] + (1, 2, -1, -2)s + (1, 0, 0, l)ř, s,íei
Řešení. Nalezněme nejprve kolmou rovinu k q. Její zaměření bude kolmé na zaměření q, pro vektory (a,b,c,d) patřící do jejího
215
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
kde vi
)\ — u\, v2 — u2+a\vi, ...,vk — uk+ď[v\^-----ha^Vk-i
je výsledek Grammova-Schmidtova ortogonalizačního procesu. Je tedy
-akv\-
(VolTk(A;Ul,...,uk))2
vi ■ vi
vi ■ vk
Dl • Dl 0
0 0
. . Djfc • Dl
Vk ■ vk
0
Vk ■ vk
Označme B matici jejíž sloupce jsou souřadnice vektorů Di,..., D* v ortonormální bázi e. Protože vi,...,vk vznikly z u\,... ,uk jako obrazy v lineární transformaci | s horní trojúhelníkovou maticí C s jedničkami na dia-1 gonále, je B — CA a \B\ — \C\\A\ = \A\. Pak ovšem \A\2 = \B\2 = \A\\A\, proto VolVk(A; uu..., uk) = ±\A\. Přitom pokud jsou vektory u\,...,uk závislé vyjde objem nulový, pokud jsou nezávislé, pak znaménko determinantu je kladné, právě když je báze u\,..., uk zadává stejnou orientací jako báze e. □
V geometrické formulaci dostáváme jako velice důžitý důsledek následující tvrzení:
4.23. Důsledek. Pro každé lineární zobrazení V
euklidovského vektorového prostoru V je det
[«!,...,«„] je antisymetrické n-lineární zobrazení. Tzn., že je lineární ve všech argumentech a výměna dvou argumentů se vždy projeví změnou znaménka výsledku.
(2) Vnější součin je nulový, právě když jsou vektory u\, ...,«„ lineárně závislé.
(3) Vektory u\,...,u„ tvoří kladnou bázi, právě když je jejich vnější součin kladný.
V technických aplikacích v prostoru R3 se často používá velmi úzce související operace, tzv. vektorový součin, který dvojici vektorů přiřazuje vektor třetí.
Uvažme obecný euklidovský vektorový prostor V dimenze n > 2 a vektory u\,..., u„-\ e V. Dosadíme-li těchto n — 1
zaměření dostáváme tedy soustavu rovnic
(a,b,c,d) ■ (1,2,-1, -2) = 0 = a+2b-c-2d = 0 (a,b,c,d) ■ (1,0, 0, 1) = 0 = a+d = 0.
Jejím řešením je dvojdimenzionální vektorový prostor ((0, 1, 2, 0), (—1, 0, —3, 1)). Rovina r kolmá k rovině q procházející bodem A má tedy parametrické vyjádření
r : [1, 2, 3, 4] + (0, 1, 2, 0)« + (-1, 0, -3, l)v, u, v e R.
Průnik rovin potom můžeme získat pomocí obou parametrických vyjádření. Pro parametry popisující průnik tedy dostáváme soustavu rov-
nic:
1 + s +t 2s 1 -s -2s +1
1 - v
2 + u
3 + 2u — 3v
4 + v,
která má jediné řešení (musí tomu tak být, protože sloupce matice soustavy jsou dány lineárně nezávislými vektory zaměření obou rovin) s = -8/19, t = 34/19, u = -54/19, v = -26/19. Dosazením hodnot parametrů s a t do parametrického vyjádření roviny q pak dostaneme souřadnice průniku [45/19, —16/19, 11/19, 18/19] (stejný výsledek pochopitelně obdržíme, dosadíme-li hodnoty parametrů u a v do parametrického vyjádření roviny r). □
4.26. Nechť j e dána krychle A BCD EFGH (při obvyklém významu zápisu, tedy vektory E —A, F—B, G—C, H—D jsou kolmé na rovinu určenou vrcholy A, B, C, D) v euklidovském prostom R3. Vypočtěte odchylku
R. Stejně dobře můžeme přemýšlet o obecné symetrické bilineární formě na libovolném vektorovém prostoru.
Pro libovolnou bázi na tomto vektorovém prostoru bude hodnota f(x) na vektoru x = xiei H----+ xnen dána vztahem
f(x) = F (x, x) = ^XiXjFiei, ej) =
kde A = (aij) je symetrická matice s prvky aij = F(e/, ej). Takovýmto zobrazením / říkáme kvadratické formy a výše uvedený vzorec pro hodnotu formy s použitím zvolených souřadnic se nazývá analytický tvar formy.
Obecně rozumíme kvadratickou formou zúžení f(x) jakékoliv symetrické bilineární formy F (x, y) na argumenty tvaru (x, x). Evidentně umíme z hodnot f(x) zrekonstruovat celou bilineární formu F, protože
f(x + y) = F(x + y,x + y) = f(x) + f(y) + 2F(x, y).
Jestliže změníme bázi e; na jinou bázi e[,... ,e'n, dostaneme pro stejný vektor jiné souřadnice x = S ■ x' (zde S je příslušná matice přechodu) a tedy
f(x) = (S ■ x')T ■ A ■ (S ■ x') = (x')T ■ (ST ■ A ■ S) ■ x'.
Předpokládejme opět, že je na našem vektorovém prostoru zadán skalární součin. Předchozí výpočet pak můžeme shrnout slovy, že matice bilineární formy F a tedy i kvadratické formy / se transformuje při změně souřadnic způsobem, který pro ortogonální změny souřadnic splývá s transformací matic zobrazení (skutečně, pak je S~ľ = ST). Tento výsledek můžeme intepretovat také jako následující pozorování:
Tvrzení. Nechť V je reálný vektorový prostor se skalárním součinem. Pak vztah
F, F (u, u) = (
' ^ 4 ' 2 ' 4 > l(Í,-#,-Í)IIIKÍ,#,-Í)l
Je tedy a = 132°.
□
4.35. V euklidovském prostoru M5 vypočtěte odchylku
i, v2, v3, v4). Určíme-li pu, ze vzorce
" Pu I I
(4.1)
cos
M kvadratická forma. Pak na V existuje polární báze pro f.
Důkaz. (1) Nechť A je matice / v bázi u — (u\,u„) na V a předpokládejme au / O. Pak můžeme psát
f(x\, ..., x„) = a\\x\ + 2a\2X\X2 H-----h 022*2 + • • •
— a^(a\\x\ + a\2X2 H-----h a\nxn)2
+ členy neobsahující x\.
Provedeme tedy transformaci souřadnic (tj. změnu báze) tak, aby v nových souřadnicích bylo
x\ = a\\x\ + a\2X2 H-----h a\nxn, x2 — X2, ..., x'n —x„.
To odpovídá nové bázi (spočtěte si jako cvičení příslušnou matici přechodu!)
Dl — a^u\, V2 — U2 — a^a\2U\,
-1
vn — un — an a\nu\
a tak, jak lze očekávat, v nové bázi bude příslušná symetrická bilinerání forma splňovat g(v\,v{) — 0 pro všechny / > 0 (přepočtěte!). Má tedy / v nových souřadnicích analytický tvar a\l^\ + h, kde h je kvadratická forma nezávislá na proměnné
XI.
Z technických důvodů bývá lepší zvolit v nové bázi vi — u\, opět dostaneme výraz / — f\ + h, kde f\ závisí pouze na x/1, zatímco v h se x'x nevyskytuje. Přitom pak g'v\,v\) — a\\.
(2) Předpokládejme, že po provedení kroku (1) dostaneme pro h matici (řádu o jedničku menšího) s koeficientem u Xj2 různým od nuly. Pak můžeme zopakovat přesně stejný postup a získáme vyjádření / — f\ + fa + h, kde v h vystupují pouze proměnné s indexem větším než dvě. Tak můžeme postupovat tak dlouho, až buď provedeme n — 1 kroků a získáme diagonální tvar, nebo v řekněme ř-tém kroku bude prvek au právě získané matice nulový.
(3) Nastane-li poslední možnost, ale přitom existuje jiný prvek ajj / 0 s j > i, pak stačí přehodit i-tý prvek báze s j-tým a pokračovat podle předešlého postupu.
(4) Předpokládejme, že jsme narazili na situaci ajj — 0 pro všechny j > /. Pokud přitom neexistuje ani žádný jiný prvek ajk ^ 0 s j > i, k > i, pak jsme již úplně hotovi, neboť jsme již dosáhli diagonální matici. Předpokládejme, že / 0. Použijeme pak transformaci v j — u j + uk, ostatní vektory báze ponecháme (tj. x'k — xjc — xj, ostatní zůstávají). Pak h(vj, vj) — h(uj, Uj) + h(uk, m*) + 2h(uk, Uj) — 2ajk / Oa můžeme pokračovat podle postupu v (1). □
4.31. Afinní klasifikace kvadratických forem. Po výpočtu polární báze Lagrangeovým algoritmem můžeme ještě vylepšit bázové vektory pomocí násobení skalárem tak, aby v příslušném analytickém vyjádření naší formy vystupovaly v roli koeficientů u kvadrátů jednotlivých souřadnic pouze skaláry 1, —1 a 0. Následující věta o setrvačnosti říká navíc, že počet jedniček a mínus jedniček nezávisí na našich volbách v průběhu algoritmu. Tyto počty nyzýváme signaturou kvadratické formy. Opět tedy dostáváme úplný popis
Varianta (f). Opět nalezněme průnik zaměření U a V. Analogicky jako v předešlé variantě hledejme čísla t,s, p,q,r el, pro která je
f (1,0, 1,1, 1)+5 (1,0,0,1,1) =
p(l, 1, 1, 1, 1) + q(l, 1,0, 1, 1) +r (1, 1,0, 1,0).
Řešením této soustavy je (ř, s, p, q, r) = (—a, a, —a, a, 0), a e R. Do průniku Z(ř/)nZ(V) zaměření U a V tak náleží právě vektory
(0, 0, -a, 0, 0) = -a (1, 0, 1, 1, 1) + a (1, 0, 0, 1, 1)
= -o(l, 1, 1, 1, 1) + a(l, 1,0, 1, 1) + 0(1, 1,0, 1,0)
kde a ě1, tj. Z(č/)nZ(V)je podprostorem generovaným vektorem (0, 0, 1,0, 0) a jeho ortogonální doplněk (Z(U) n ZiV))1- je zjevně generován vektory
(1,0,0,0,0), (0,1,0,0,0), (0,0,0,1,0), (0,0,0,0,1).
Zvlá tě dostáváme
z(í/)nz(V)^{0}, z(U) nz(V) ^ z(U), z(U) n z(V) ^ z(V).
Odchylka
J—Xp+ixp+i, ..., yr — *y~Xrxr, yr+\ — xr+\, ..., y„ — x„ již vede na požadovaný tvar. Formy „) = v? +••• + y2, - y2q+1-----y\
a označme podprostor generovaný prvními p vektory prvé báze P — ..., up), aobdobně Q — (vq+i,..., v„). Pak pro každý « e P je f (u) > 0 zatímco pro ve Q je f (v) < 0. Nutně tedy platí P n Q — {0}, a proto dim P + dim Q < n. Odtud plyne p + (n — q) < n, tj. p < q. Opačnou volbou podprostorů však získáme i q < p.
Je tedy p nezávislé na volbě polární báze. Pak ovšem pro dvě matice se stejnou hodností a stejným počtem kladných koeficientů v diagonálním tvaru příslušné kvadratické formy získáme stejný analytický tvar. □
Při diskusi symetrických zobrazení jsme hovořili o definit-ních a semidefitních zobrazeních. Tatáž diskuse má jasný smysl i pro symetrické bilineární formy a kvadratické formy. Kvadratickou formu / forma na reálném vektorovém prostoru V nazýváme
(1) positivně definitní, je-li f(u) > 0 pro všechny vektory u ^ 0,
(2) positivně semidefinitní, je-li f(u) > 0 pro všechny vektory u € V,
(3) negativně definitní, je-li / (u) < 0 pro všechny vektory u ^ 0,
(4) negativně semidefinitní, je-li f(u) < 0 pro všechny vektory
u € V,
(5) indefinitní, je-li f(u) > 0af(v) < 0 pro vhodné vektory u, v € V.
Stejné názvy používáme i pro symetrické reálné matice, jsou-li maticemi patřičných kvadratických forem. Signaturou symetrické matice pak rozumíme signaturu příslušné kvadratické formy.
□
4.36. Nyní ukážeme jednoduché využití Cauchyovy nerovnosti. Dokažte, že pro každé řieRa pro Libovolná kladná čísla x\, x2,..., xn e R platí
n2<
1
1
+ — +
X\ X2
+
1
(xi +x2-\-----h x„)
Poté uvedte, kdy nastává rovnost.
Řešení. Postačuje uvážit Cauchyovu nerovnost
\u-v\< \\u\\\\v\\
v eukLidovském prostoru R" pro vektory 1 1
(—l—, —l—,..., —!=), v = (yir, jxi,...,
IX\ tJX2
Takto dostaneme
(4.2)
Dokazovanou nerovnost potom obdržíme umocněním (||4.2||). Dále víme, že Cauchyova nerovnost přejde v rovnost, právě když bude vektor u násobkem vektoru v, což již implikuje x\ = x2 = ■ ■ ■ = x„.
□
4.37. Spočtěte objem rovnoběžnostěnu v R3 s podstavou v rovině z = 0 a s hranami zadanými dvojicemi vrcholů [0, 0, 0], [—2, 3, 0]; [0, 0, 0], [4, 1,0] a [0, 0, 0], [5,7,3].
Řešení. Rovnoběžnostěn je zadán vektory (4,1,0), (—2,3,0), (5, 7, 3). Víme, že jeho objem je roven determinantu
-2 5 3 7 0 3
3 • 14 = 42.
Doplňme, že při změnách pořadí vektorů bychom obdrželi výsledek ±42, neboť determinant udává orientovaný objem rovnoběžnostěnu. Ještě poznamenejme, že objem rovnoběžnostěnu by se dle výpočtu determinantu nezměnil, pokud by třetí vektor byl [a, b, 3] pro libovolná čísla a, b e R. Jeho objem pochopitelně závisí pouze na kolmé vzdálenosti rovin dolní a horní podstavy a jejich obsahu
14.
□
223
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
4.32. Věta (Sylvestrovo kritérium). Symetrická reálná matice A je positivně definitní, právě když jsou všechny její hlavní minory kladné.
Symetrická reálná matice A je negativně definitní právě, když (—1)' \ Ai | > 0pro všechny hlavnísubmatice A;.
Důkaz. Budeme si muset podrobněji rozebrat, jak vypadají transformace použité v Lagrangeově algoritmu pro ■m, konsturkci polární báze. Transformace použité v prvním kroku tohoto algoritmu mají vždy horní trojúhelníkovou matici T a navíc, při použití technické modifikace zmíněné v důkazu věty 4.30, má tato matice jedničky na diagonále:
T
i
0
v
.212 au
1
_£ü2\ an \
0
Taková matice přechodu od báze u k bázi v má několik pěkných vlastností. Zejména její hlavní submatice 7\ tvořené prvními k řádky a sloupci jsou matice přechodu podprostorů Pk — ■ ■ ■, uk) od báze (u\,..., uk) k bázi ..., vk). Hlavní submatice A* matice A formy / jsou maticemi zúžení formy f na Pk. Při přechodu od u k j; daném maticí přechodu T jsou tedy matice Ak a A'k zúžení na podprostory Pk ve vztahu Ak — TkT A'k(Tk)~l. Inverzní matice k horní trojúhelníkové matici s jedničkami na diagonále je přitom opět horní trojúhelníková matice s jedničkami na diagonále, můžeme tedy podobně vyjádřit i A' pomocí A. Podle Cauchyovy věty jsou tedy determinanty matic Ak a A'k stejné. Celkem jsme tak dokázali velice užitečné pomocné tvrzení:
Nechť je f kvadratická forma na V, dim V — n, a nechť je u báze V taková, že při hledání polární báze Lagrangeovým algoritmem není nikdy potřebné použít body (3) a (4). Pak je výsledkem analytické vyjádření
f(x\, ..., x„) — \\x\ + X2x\ + • • • + )\rx2
kde r je hodnost formy f, "k\, ..., kr / 0a pro hlavní submatice (původní) matice A kvadratické formy f platí \A%\ = ^1^2 • • • ^k> k 0. Nechť u je zvolená báze, ve které má forma
4.38. V M3 je dán čtyřstěn ABCD, kde A = [4, 0, 2], B = [-2, -3, 1], C = [1, -1, -3], D = [2, 4, -2]. Rozhodněte, zda leží bod X = [0, — 3, 0] uvnitř tohoto čtyřstěnu.
Řešení. Objem čtyřstěnu je šestina objemu rovnoběžnostěnu, jehož tři hrany z bodu A jsou B — A = (-6, -3, —1), C — A = (-3, -1,-5) a D — A = (—2, 4, —4) a ten je dán absolutní hodnotou determinantu
-3 -2
-124.
Celkem je tedy objem čtyřstěnu ^
□
4.39. Je dán rovnoběžník [0, 0, 1], [2, 1, 1], [3, 3, 1], [1, 2, 1]. Určete bod X na přímce p : [0,0,l] + (l,l,l)ř tak, aby rovnoběžnostěn určený daným rovnoběžníkem a bodem X měl objem 1.
Řešení. Sestavíme determinant, jehož absolutní hodnota udává objem rovnoběžnostěnu při pohyblivém bodu X:
t t
1 0
2 0
3ř.
Požadujeme, aby byl roven 1, či —1, tedy t = 1/3 nebo t = —1/3. □
4.40. Jsou dány vektory u = (ui,u2,u3)av = (vi, v2, v3). Doplňte je třetím jednotkovým vektorem tak, aby rovnoběžnostěn daný těmito třemi vektory měl co největší objem.
Řešení. Označme hledaný jednotkový vektor jako ř = (ti,t2, t3). Podle Tvrzení ||??|| je objem rovnoběžnostěnu 7^3(0; u, v, t_) dán jako abolutní hodnota determinantu
ř • (u x v) < ||řII \\u x v\\ = \\u x v\\.
Použité znaménko nerovnosti vyplývá z Cauchyovy nerovnosti, přičemž víme, že rovnost nastává právě pro ř = c(u x v), c ě! Velikost objemu hledaného rovnoběžnostěnu tedy může být maximálně rovna velikosti obsahu rovnoběžníka daného vektory u, v_ (tj. velikosti vektoru (u x v)). Rovnost nastane právě když
(u x v)
V\ h h h h
u2 v2 h = U\ u2 u3
u3 v3 h V\ v2 v3
\(u xv)\
C. Geometrie kvadratických forem
□
4.41. Určete polární bázi formy /
2x\x2 + x\ + 4x2X3 + 6x2.
i, f(xu x2,x3) = 3x] +
224
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
/ matici A. Zúžení / napodprostory Vk = («i, ...,uk) je opět positivně definitní forma//t, jejíž maticí v bázi «i,..., uk je hlavní submatice Ak. Proto je podle předchozí části důkazu také\Ak\ > 0.
Tvrzení o negativně definitních vyplývá z předchozího a skutečnosti, že A je positivně definitní právě, když —A je negativně definitní. □
3. Projektivní geometrie
V mnoha elementárních textech o analytické geometrii autoři končí afinními a euklidovskými objekty popsanými výše. Na spoustu praktických úloh euklidovská nebo afinní geometrie stačí, na jiné bohužel ale nikoliv, ■feť^-i- Tak třeba při zpracovávání obrazu z kamery nejsou zachovávány úhly a rovnoběžné přímky se mohou (ale nemusí) protínat. Dalším dobrým důvodem pro hledání širšího rámce geometrických úloh a úvah je požadovaná robustnost a jednoduchost numerických operací. Daleko jednodušší jsou totiž operace prováděné prostým násobením matic a velice těžko se totiž od sebe odlišují malinké úhly od nulových, proto je lepší mít nástroje, které takové odlišení nevyžadují.
Základní ideou projektivní geometrie je rozšíření afinních prostorů o body v nekonečnu způsobem, který bude dobře umožňovat manipulace s hneárními objekty typu bodů, přímek, rovin, projekcí, apod.
4.33. Projektivní rozšíření afinní roviny. Začneme tím nejjed-nodušším zajímavým případem, geometrií v rovině. Jestliže si body roviny A2 představíme jako rovinu z = 1 v TZ3, pak každý bod P naší afinní roviny představuje vektor u = (x, y, 1) e R3 a tím i jednorozměrný podprostor (u) c R3. Naopak, skoro každý jednorozměrný podprostor v R3 protíná naši rovinu v právě jednom bodě P a jednotlivé vektory takového podprostoru jsou dány souřadnicemi (x, y, z) jednoznačně, až na společný skalární násobek. Žádný průnik s naší rovinou nebudou mít pouze podprostory s body o souřadnicích (x, y, 0).
__Projektivní rovina
Řešení. Její matice je
Definice. Projektivní rovina V2 je množina všech jednorozměrných podprostorů v R3. Homogenní souřadnice bodu P — (x : y : z) v projektivní rovině jsou trojice reálných čísel určené až na společný skalární násobek, přičemž alespoň jedno z nich musí být nenulové. Přímka v projektivní rovině je definována jako množina jednorozměrných podprostorů (tj. bodů v V2), které vyplní dvourozměrný podprostor (tj. rovinu) v R3.
Abychom měli před očima konkrétní příklad, podívejme se v afinní rovině R2 na dvě rovnoběžné přímky
Li : y
1 = 0,
y
i = o.
Jestliže budeme body přímek L \ a L2 chápat jako konečné body v projektivním prostoru V2, budou zjevně jejich homogenní souřadnice (x : y : z) splňovat rovnice
■ y-
z = 0,
y
■z = 0.
Je vidět, že průnikem L i n L2 bude v tomto kontextu bod (—1:1: 0) eV2, tj. nevlastní bod odpovídající společnému zaměření obou přímek.
Podle bodu (1) Lagrangeova algoritmu (viz věta 4.30) provedeme úpravy
f(x\, x2, x3) = -(3*1 + x2)2 H—x\ + 4x2x3 + 6x2
1
-i 3
1 , 3 2 , = 3)^ + 2(3^2 + 2y3)
a vidíme, že forma má hodnost 2 a matice přechodu do příslušné polární báze w_ se získá posbíráním provedených transformací:
2 2
Z3 = = x3, z2 = -y2 + 2y3 = -x2 + 2x3, Zl = yi = 3xx + x2,
tedy matice přechodu od standardní báze k polární bázi je
1 0^
2' 2
Matici jsme získali tak, že jsme odvozené vyjádření souřadnic v polární bázi pomocí souřadnic ve standardní bázi napsali do řádků uvažované matice (čtenář si rozmyslí, že sloupce této matice jsou souřadnice vektorů standardní báze v polární bázi). Souřadnice vektorů polární báze pak snadno odečteme z matice T~l (jsou to její sloupce).
j 1
0 § -3
v0 0 1
hledaná polární báze tedy je ((|, 0, 0), (-
4.42. Určete polární bázi formy / : I
2x i x3 -\- *2.
Řešení. Matice dané formy je
^0 0 0 1
v1 0 °j
Hned v prvním kroku můžeme přehodit proměnné: y\ = x2, y2 = x\, y3 = x3. Aplikace bodu (1) Lagrangeova algoritmu je pak triviální (nejsou tu žádné společné členy), pro další krok ale nastane situace z bodu (4). Zavedeme tedy transformaci z i = y\,z2 = y2,z3 = y3 — y2. Pak
0), (1,-3, 1)). □
3. f(X\, x2, x3)
f(X\, x2, x3)
z\ + 2z2{z3 + zi)
9 1 9 1
z2 + -(2z2 + z3)2- -
4-
225
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
4.34. Afinní souřadnice v projektivní rovině. Pokud začneme naopak projektivní rovinou V2 a budeme v ní chtít uvidět afinní rovinu jako její „konečnou" část, pak můžeme místo roviny z = 1 vzít v R3 jakoukoliv jinou rovinu er neprochá-\$ zející počátkem 0 e R3. Konečné body pak budou ty jednorozměrné podprostory, které mají neprázdný průnik s rovinou a.
Pokračujme v našem příkladu rovnoběžných přímek z předchozího odstavce a podívejme se, jak budou jejich rovnice vypadat v souřadnicích v afinní rovině, která bude dána jako y = 1. Za tím účelem stačí dosadit y = 1 do předchozích rovnic:
L[:l
0, Ľ, : 1
0
Nyní jsou „nekonečné" body naší původní afinní roviny dány vztahem z = 0 a vidíme, že naše přímky L\ a L'2 se protínají v bodě (1, 1, 0). To odpovídá geometrické představě, že rovnoběžné přímky Lx,L2v afinní rovině se protínají v nekonečnu a to v bodě (1:1: 0).
4.35. Projektivní prostory a transformace. Náš postup v afinní rovině se přirozeným způsobem zobecňuje na každou konečnou dimenzi.
Volbou libovolné afinní nadroviny A„ ve vektorovém prostoru Rn+1, která neprochází počátkem, můžeme ztotožnit body P e A„ s jednorozměrnými podprostory, které tyto body generují. Zbylé jednorozměrné podprostory vyplní nadrovinu rovnoběžnou s A„ a říkáme jim nekonečné body nebo také nevlastní body v projektivním rozšíření V„ afinní roviny A„.
Zjevně je vždy množina nevlastních bodů v V„ projektivním prostorem dimenze o jedničku nižším. Afinní přímka má ve svém projektivním rozšíření pouze jediný nevlastní bod (oba konce přímky se „potkají" v nekonečnu a projektivní přímka proto vypadá jako kružnice), projektivní rovina má projektivní přímku nevlastních bodů, trojrozměrný projektivní prostor má projektivní rovinu nevlastních bodů atd.
Ještě obecněji zavádíme projektivizaci vektorového prostoru: pro libovolný vektorový prostor V dimenze n + 1 definujeme
P(V) = (fcV; P G V, dimV=l}.
Volbou libovolné báze u ve V dostáváme tzv. homogenní souřadnice na V(V) tak, že pro P e V(V) použijeme jeho libovolný nenulový vektor u e V a souřadnice tohoto vektoru v bázi u. Bodům projektivního prostoru V( V) říkáme geometrické body, zatímco jejich nenulové generátory ve V nazýváme říkáme aritmetické reprezentanty.
Při zvolených homogenních souřadnicích je možné jednu z jejich hodnot zafixovat na jedničku (tj. vyloučíme všechny body projektivního prostoru s touto souřadnicí nulovou) a získáme tak vložení n -rozměrného afinního prostoru A„ C V(V). To je přesně konstrukce, kterou jsme použili v našem příkladu projektivní roviny.
4.36. Perspektivní projekce. Velmi dobře jsou výhody projektivní geometrie vidět na perspektivní projekci R3 -> R2. Přestavme si, že pozorovatel sedící v počátku pozoruje „polovinu světa", tj. body (X, Y, Z) e R3 se Z > 0 a obraz vidí „promítnutý" na plátně daném
rovinou Z = / > 0.
■ '"'"ti'
Celkem dostáváme zi = yx = x2, z2 = y2 = xx, z3 = y3 - y2 x3 — xx. Matice přechodu T do příslušné polární báze je tedy
polární báze je tedy ((0, 1, 0), (1, 0, 1) (0, 1, 1)).
4.43. Nalezněte polární bázi kvadratické formy / : je ve standardní bázi dána předpisem
□
která
f(xX, X2, X3) — X\X2 + XXX3.
Řešení. Aplikací uvedeného Lagrangeova algoritmu dostáváme:
f(xx, x2, x3) = 2xxx2 + x2x3
provedeme substituci podle bodu (4) algoritmu y2 = x2 — x\, yi = x\, y3 = x3
= 2xx{xx + y2) + (xi + y2)x3 = 2x\ + 2xxy2 + xxx3 + y2x3 =
1
1
-(2*i + y2 + -x3)
1
1
Ý2 - öX3 + ?2*3
substituce yi =2x\
■ yi ■
\x3
1
y\
i
y\
i
substituce y3 = 2y2
-x3 + y2x3 \x3
-A
2(\y2
i
-x3y + -xí
i
y\
2y\ +
v3.
V souřadnicích yx,y3, x3 má tedy daná kvadratická forma diagonální tvar, to znamená že báze příslušná těmto souřadnicím je polární bází dané kvadratické formy. Pokud ji máme vyjádřit musíme získat matici přechodu od této polární báze ke standardní bázi. Z definice matice přechodu jsou pak její sloupce bázovými vektory polární bázi. Matici přechodu získáme tak, že buď vyjádříme staré proměnné (xx, x2, x3) pomocí nových proměnných (yi, y3, x3), nebo ekvivalentně vyjádříme nové proměnné pomocí starých (což jde jednodušeji), pak ale musíme spočítat inverzní matici.
Máme yx = 2xx + y2 + \x3 = 2xx + (x2 - xx) + \x3 a y3
\x3
\x\ + \x3
i 2x3. Matice přechodu od zvolené polární
baáze ke standardní bázi je
Pro inverzní matici pak máme
_2 3
4
3
0
226
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
Bod (X, Y, Z) „reálného světa" se mu tedy promítá na bod (x, y) na průmětně takto:
X
y
Y
To je nejen nelineární formule, ale navíc při Z malém bude velice problematická přesnost výpočtů.
Při rozšíření této transformace na zobrazení V3 -> V2 dostá-
váme zobrazení (X : Y : Z : W) i-> (x : y : Z), tj. popsané prostým lineárním vztahem
z) = (-fX : -fY
Y Z
W
Tento jednoduchý výraz zadává perspektivní projekci pro konečné body v t3 c ?3, které dosazujeme jako výrazy s W — 1. Přitom jsem elgantně odstranili problémy s body, jejichž obraz utíká do nekonečna. Skutečně, je-li Z-ová souřadnice skutečného bodu scény blízká nule, bude hodnota třetí homogenní souřadnice obrazu mít souřadnici blízkou nule, tj. bude představovat bod blízký nekonečnu.
4.37. Afinní a projektivní transformace. Každé prosté lineární zobrazení V2 mezi vektorovými prostory samozřejmě zobrazuje jednorozměrné podprostory na jednorozměrné podprostory. Tím vzniká zobrazení na projektivi-\^ žacích T : V(V\) -> VCV2). Takovým zobrazením říkáme projektivní zobrazení, v literatuře je používán také pojem koline-ace. Pokud je toto zobrazení invertibilní.
Jinak řečeno, projektivní zobrazení je takové zobrazení mezi projektivními prostory, že v každé soustavě homogenních souřadnic na definičním oboru i obrazu je toto zobrazení zadáno násobením vhodnou maticí. Obecněji, pokud naše pomocné lineární zobrazení není prosté, definuje projektivní zobrazení pouze mimo svoje jádro, tj. na bodech, jejichž homogenní souřadnice se nezobrazují na nulu.
Prostá zobrazení V -> V vektorového prostoru na sebe jsou invertibilní, všechna projektivní zobrazení projektivního prostoru Vn na sebe jsou tedy invertibilní též. Říká se jim také regulární ko-lineace nebo projektivní transformace. Odpovídají v homogenních souřadnicích invertibilním maticím dimenze n +1. Dvě takové matice zadávají stejnou projektivní transformaci, právě když se liší o konstantní násobek.
Jestliže si zvolíme první souřadnici jako tu, jejíž nulovost určuje nevlastní body, budou transformace, které zachovávají nevlastní body, dány maticemi, jejichž první řádek musí být až na první člen nulový. Jestliže budeme chtít přejít do afinních souřadnic konečných bodů, tj. zafixujeme si hodnotu první souřadnice na jedničku, musí být první prvek na prvním řádku být také rovný jedné. Matice kolineací zachovávajících konečné body našeho afinního prostoru tedy mají tvar:
/l 0 ••• 0\
b\ au
fli«
\^ř7 flftl ' ' ' Clnn J
kde b — (b\,..., bn)T e R" a A — (flý) je invertibilní matice dimenze n. Působení takové matice na vektoru (1, x\,..., x„) je
Jedna z polárních bazí dané kvadratické formy je tedy například báze (je dána sloupci poslední matice)
((1/3, 1/3, 0), (-2/3, 4/3, 0), (-1/2, 1/2, 1)). □
4.44. Určete typ kuželosečky dané rovnicí:
3xí
3xix2 + x2 - 1 = 0.
Řešení. Pomocí algoritmu úpravy na čtverec postupně dostáváme:
3xí
3x\X2 ~\~ X2 — 1
1
-(3*1 - -x2)
- —x\ + x2 — 1 4
^2 1
1 - 4 3 _ , _ -y] - -(-x2 - -Y + - - 1 V1 3 4 T 3
1 2 4 j 2
2^ - F2 - ä"
□
Podle seznamu kuželoseček 4.29 se tedy jedná o hyperbolu. 4.45. Pomocí doplnění na čtverce vyjádřete kvadriku
-x2 + 3/ + z2 + 6xy - 4z = 0 ve tvaru, ze kterého lze vyčíst její typ.
Řešení. Všechny členy obsahující x připojíme k —x2 a provedeme doplnění na čtverec. Tím získáme
-(x - 3y)2 + 9/ + 3/ + z2 - 4z = 0.
Žádné „nežádoucí" členy obsahující y nemáme, a proto postup opakujeme pro proměnnou z, což dává
-(x - 3y)2 + 12y2 + (z - 2)2
0.
Odtud plyne, že existuje transformace proměnných, při které obdržíme (rovnici můžeme nejdříve vydělit 4) rovnici
z2 , r2 , -2
-x- + f + lL - 1 = 0.
□
O typu kuželosečky můžeme rozhodnout i bez úpravy na některý z tvarů uvedený v seznamu 4.29. Jak již víme, každou kuželosečku můžeme napsat ve tvaru
útnx2 + 2úii2xy + ci^iy2 + 2úti3X + la-ay + «33 = 0.
Determinanty A = det A
an ayi
^12 a22
a\\ al2 al3
«12 <222 a23 a 8
al3 a32 a33
jsou tzv. invarianty kuželosečky, což znamená, že se nemění při euklidovské transformaci souřadnic (rotace a posunutí) navíc různé typy kuželoseček mají různá znaménka těchto determinantů. • A / 0 vlastní (regulární) kuželosečky: elipsa pro 8 > 0, hyperbola pro 8 < 0 a parabola pro 8 = 0 Aby šlo o reálnou elipsu, nikoliv imaginární, musí být navíc (au + «22)A < 0.
227
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
právě obecná afinní transformace, kde b zadává posunutí a A její lineární část. Jsou tedy afinní zobrazení právě ty kolineace, které zachovávají nadrovinu nevlastních bodů.
4.38. Určení kolineací. K zadání afinního zobrazení je nutné a vN stačí libovolně zadat obraz afinního repéru. V právě
% uvedeném popisu afinních transformací jako speciálního případu projektivních zobrazení to odpovídá vhodné volbě obrazu vhodné aritmetické báze vektorového prostoru V.
Obecně ale neplatí, že obraz aritmetické báze V jednoznačně určí kolineaci. Ukažme si podstatu problému na jednoduchém příkladu afinní roviny. Jestliže si zvolíme v rovině čtyři body A, B, C, D tak, aby každá z nich utvořená trojice byla v obecné poloze (tj. žádné tři z nich neleží na jedné přímce), můžeme si libovolně zvolit jejich obraz v kolineaci následujícím způsobem:
Zvolme jakkoliv jejich čtyři obrazy A', B', C, D' se stejnou vlastností a zvolme si jejich homogenní souřadnice u, v, w, z, u', v', w', z' v R3. Vektory z a z' pak můžeme jistě zapsat pomocí lineárních kombinací
z — c\u + c2v + c3 w, z' — c[u' + c'2v' + c3w)',
přičemž všech šest koeficientů musí být nenulových, neboť jinak by některá trojice z našich bodů nebyla v obecné poloze.
Nyní si zvolíme nové aritmetické reprezentanty bodů A, B a C po řadě jako ú — c\u, v — c2v a w — cj,w a stejně u' — c\u', v' — c2v' a w' — c3u)' pro body A', B' a C. Tato volba zadává jediné lineární zobrazení
- a ■ A,
tj. matice duálních zobrazení je AT. Duální zobrazení ovšem zobrazuje formy opačným směrem z „cílového prostoru" ne „počáteční", proto potřebujeme pro současné studium vlivu regulární kolineace na body a jejich duální nadroviny zobrazení inverzní ke kolineaci /. To je dáno maticí A ~1. Matice příslušného působení kolineace na formách je proto (A T) ~1. Protože je přitom inverzní matice rovna algebraicky adjungované matici A*lg, až na
Řešení. Determinant A
23
7^ 0 jde tedy
o regulární kuželosečku. Navíc je 8 = 5 > 0 tedy jde o elipsu. Dále (an + a22) A = (2 + 3) • (—^) < 0, jde tedy o reálnou elipsu. □
4.47. Určete typ kuželosečky x2
t 1
Řešení. Determinant A
' 1
4xy - 5y2 + 2x + 4y + 3 -2 1
-5 2 = -34 ^ 0, 2 3
0.
dále je 8
1
-9 < 0, jde tedy o hyperbolu.
□
4.48. Určete rovnici kuželosečky (a poté její typ), která prochází body
[-2,-4], [8,-4], [0,-2], [0,-6], [6,-2].
Řešení. Do obecné rovnice kuželosečky
aiix2 + a22y2 + 2a\2xy + a\x + a2y + a = 0
postupně dosadíme souřadnice zadaných bodů. Takto obdržíme soustavu
4fln + 16^22 + 16fll2
64fln + 16^22 — 64^12 4a22 36a22
36fln + 4úi22 — 24^12
+
+
2a\ 8fli
4a2 + a = o,
4a2 + a = o,
2a2 + a = o,
6a2 + a = o,
2a2 + a = 0.
V maticovém zápisu provedeme úpravy
(4 16 16 -2 -4
64 16 -64 8 -4 0 4 0 0 -2 0 36 0 0 -6
\36 4 -24 6 -2
(4 16 16 -2
0 4 0 0
0 0 64 -8
0 0 0 24
\0 0 0 0
/48 0 0 0 12 0
1\ 1 1 1
1 \ 1
-9 ■36 27 3 -2)
-4 -2 12
0 0
0
o o
o o
o o
64 0 0
0 24 0
0 0 3
Hodnotu a můžeme zvolit. Zvolíme-li a
a\\ = 1, a22 = 4, = 0, a\ = —6, Kuželosečka má tudíž rovnici
x2 + 4y2 -6x + 32y + 48 = 0
-1\ -1 0
3
-v
48, dostaneme
a2 = 32.
229
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
násobek inverzí determinantu, viz vztah (2.2) na str. 90, můžeme rovnou pracovat s projektivní transformací prostoru ^(V*) zadanou maticí (A*lg)r (nebo bez transoponování, pokud násobíme řádkové vektory zprava).
Okamžitě z definic je vidět, že projektivní bod X patří nadro-vině a, když pro jejich aritmetické souřadnice platí a ■ x — 0. To samozřejmě zůstává v platnosti i po působení libovolnou kolineací, protože opět
(a ■ A~l) ■ (A -x) = a -x = 0.
4.41. Samodružné body, středy a osy. Uvažujme regulární koli-neaci / zadanou v nějaké aritmetické bázi projektivního prostoru V(V) pomocí matice A.
Samodružným bodem kolineace / rozumíme bod A, který je zobrazen na sebe, tj. f (A) — A, samodružnou nadrovinou kolineace f rozumíme nadrovinu a, která je zobrazována na sebe, tj. f (a) c a.
Přímo z definice tedy vidíme, že samozdružné body mají za aritmetické reprezentanty právě vlastní vektory matice A.
V geometrii roviny jsme se s mnoha typy kolineací již jistě setkali: symetrie podle středu, zrcadlení podle přímky, posunutí, stejnolehlost atd. Možná vzpomeneme i na různé typy promítání, např. promítání jedné roviny v R3 na druhou z nějakého středu S e R3.
Všimněme si, že kromě samodružných bodů se u všech takových afinních zobrazení objevovaly také samodružné přímky. Např. u symetrie podle středu se zachovávají také všechny přímky tímto středem procházející, u posunutí se (obdobně) zachovávají nevlastní body roviny.
Zastavíme se u tohoto jevu v obecné dimenzi. Nejprve zavedeme potřebné velmi klasických pojem související s incidencí bodů a nadrovin.
Trs nadrovin procházejí bodem A e V(V) je množina všech nadrovin, které obsahují bod A. Z definice je zřejmé, že pro každý bod A je příslušný trs nadrovin sám nadrovinou v duálním prostoru V(V*) (je zadán jednou homogenní lineární rovnicí v aritmetických souřadnicích).
Pro kolineací / : V(V) -* V(V) řekneme, že bod S e V(V) je středem kolineace f jestliže všechny ňadro viny v trsu nadrovin určeném bodem S jsou samodružné. Řekneme, že nadrovina a je osou kolineace f, jestliže jsou všechny její body samodružné.
Přímo z definice je zřejmé, že osa kolineace je středem kolineace duální, zatímco trs nadrovin zadávajících střed kolineace je sám osou kolineace duální.
Protože matice kolineace na původním a duálním prostoru se liší pouze transpozicí, jejich vlastní čísla splývají (vlastní vektory jsou sloupcové, resp. řádkové, k týmž vlastním číslům). Např. v projektivní rovině (a ze stejného důvodu v každém reálném projektivním prostoru sudé dimenze) má každá kolineace alespoň jeden samodružný bod, protože charakteristické polynomy příslušných lineárních zobrazení jsou lichého stupně a tedy mají alespoň jeden reálný kořen.
Nebudeme se již zde dále věnovat obecné teorii, ale budeme aspoň krátce ilustrovat její užitečnost na několika výsledcích pro projektivní roviny.
Tvrzení. Projektivní transformace roviny různá od identity má buď právě jeden střed a právě jednu osu, nebo nemá ani střed ani osu.
V této rovnici doplníme výrazy x2 — 6x, 4y2 + 32y na druhé mocniny dvoj členů, což dává
0,
(x - 3)2 + 4(y + 4)2 - 25
resp.
(x
52
3_Ý + (y+4)2
(I)2
1 =0.
Vidíme, že se jedná o elipsu se středem v bodě [3, —4].
□
4.49. Další charakteristiky kuželoseček. Zabývejme se ještě podrobněji některými dalšími pojmy, které se pojí s kuželosečkami. Osa kuželosečky je přímka, podle které je kuželosečka osově souměrná. Z kanonického vyjádření kuželosečky v polární bázi (4.29) plyne, že elipsa má dvě osy (x = 0 a y = 0), parabola má jenu osu (x = 0) a hyperbola má dvě osy (x = 0 a y = 0). Průniky os se samotnou kuželosečkou se nazývají vrcholy kuželosečky. Čísla a, b z kanonického vyjádření kuželosečky (které udávají vzdálenost vrcholů od počátku) se nazývají délky poloos. V případě elipsy a hyperboly se osy navzájem protínají v počátku. Podle tohoto boduje pak kuželosečka zřejmě středově souměrná. Takový bod se nazývá středem kuželosečky. Kromě vrcholů a středů existují ještě další význačné body ležící na ose kuželosečky. Pro elipsu jsou to ohniska elipsy E, F charakterizované vlastností \EX\ + \FX\ = 2a pro Libovolný bod X ležící na elipse. Následující příklad ukazuje, že takové body E a F skutečně existují.
4.50. Existence ohnisek. Pro elipsu o velikostech poloos a > b jsou
body E = [—e, 0] a F = [e, 0], kde e = -Ja2 — b2 jejími ohnisky (v polárních souřadnicích).
Řešení. Uvažujme body X = [x, y], které splňují podmínku \EX\ + \FX\ = 2a a ukážeme, že to jsou právě body elipsy. V souřadnicích má tato rovnice tvar
V(jc + e)2 + f + j (x - e)2 + f = 2a Umocněním rovnice a její úpravou dostaneme ekvivalentní rovnici
(a2 - e2)x2 + a2/ = a2(a2 - e2).
Dosazením e2 = a2 — b2 a vydělením a2b2 dostaneme kanonickou rovnici elipsy
x2 y2 aL bL
□
Poznámka. Číslo e z předchozího příkladu se nazývá excentricita (výstřednost) elipsy. Podobně definujeme ohniska hyperboly jako body E, F, které splňují \ \EX\ — \FX\\ = 2a pro libovolný bod X ležící na hyperbole. Můžete si ověřit, že tuto vlastnost splňují v polární bázi body [—e, 0] a [e, 0], kde e = ~Ja2 + b2. Ohnisko paraboly je bod F,
230
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
Důkaz. Uvažme kolřneaci / na VR3 a uvažme, že by měla dva různé středy A a B. Označme £ přímku zadanou těmito středy a zvolme bod X v projektivní rovině mimo í. Jsou-li p a q po řadě přímky procházející dvojicemi bodů (A, X) a (B, X), pak také f(p) = paf(q) = q atedy zejménajeibodZ samodružný. To ale znamená, že všechny body roviny mimo L jsou samodružné. Každá přímka různá od £ má tedy všechny body mimo £ samodružné a proto je i její průnik s £ samodružný. Je tedy / identické zobrazení a dokázali jsme, že neidentická projektivní transformace může mít nejvýše jeden střed. Tatáž úvaha pro duální projektivní rovinu nám dává výsledek o nejvýše jediné ose.
Jestliže má / střed A, pak všechny přímky procházející A jsou samodružné a odpovídají proto dvourozměrnému podprostoru vlastních řádkových vektorů příslušné matice pro transformaci /. Proto bude existovat dvourozměrný prostor sloupcových vlastních vektorů ke stejnému vlastnímu číslu a ten bude reprezentovat právě přímku samodružných bodů, tedy osu. Tatéž úvaha v obráceném pořadí dokazuje i opačné tvrzení — jestliže má projektivní transformace roviny osu, má i střed. □
Pro praktické problémy je užitečné i pro reálnou rovinu pracovat v jejích komplexním projektivním rozšíření a geometrické chování transformací je pak velmi dobře čitelné z případné existence reálných či imaginárních středů a os.
4.42. Projektivní klasifikace kvadrik. Závěrem se ještě vrátíme f7 ke kuželosečkám a kvadrikám. V n-rozměrném 4^ťJ^r/ afinním prostoru R" zadáváme kvadriku Q v úmíj?**^ afinních souřadnicích pomocí obecné kvadratické rovnice (4.4), viz str. 219. Pohlížíme-li na afinní prostor Rn jako na afinní souřadnice v projektivním prostoru VRn+1, můžeme chtít tutéž množinu Q popsat pomocí homogenních souřadnic v projektivním prostoru. V nich by mělo jít o výraz, jehož všechny členy jsou druhého řádu, protože pouze vynulování takového homogenního výrazu bude mít pro homogenní souřadnice bodu smysl nezávisle na zvoleném konstantním násobku souřadnic (xo, xi,..., x„). Hledáme tedy takový výraz, jehož zúžením na afinní souřadnice, tj. dosazením xo = 1, získáme původní výraz z (4.4).
To je ale mimořádně jednoduché, prostě dopíšeme dostatek xq ke všem výrazům - žádný ke kvadratickým členům, jedno k lineárním a x^ ke konstantnímu členu v původní afinní rovnici pro Q.
Získáme tak dobře definovanou kvadratickou formu / na vektorovém prostoru Rn+1, jejíž nulové body korektně definují tzv. projektivní kvadriku Q.
Průnik „kužele" Q c Rn+1 nulových bodů této formy s afinní rovinouxo = 1 je původní kvadrika Q, jejíž body označujeme jako vlastní body kvadriky, zatímco další body Q \ Q v projektivním rozšíření jsou body nevlastní.
Klasifikace reálných či komplexních projektivních kvadrik, až na projektivní transformace, je úlohou, kterou jsme již zvládli — jde prostě o nalezení kanonické polární báze, viz odstavec 4.29. Z této klasifikace dané v reálném případě signaturou formy, v komplexním pouze hodností, vcelku snadno můžeme dovodit i klasifikace kvadrik afinních. Stačí si všímat množiny nekonečných bodů v projektivním rozšíření naší afinní kvadriky. Ukážeme si podstatu postupu na případu kuželoseček v afinní a projektivní rovině.
který má v polární bázi souřanice F = [0, §] a je charakterizován tím, že jeho vzdálenost od libovolného bodu X paraboly je stejná jako jako vzdálenost X od přímky y = — |.
4.51. Určete ohniska elipsy x2 + 2y2 = 2.
Řešení. Z rovnice přímo odečteme, že velikosti poloos jsou a = \/2 a b = 1. Poté již snadno dopočítáme z předchozího příkladu (||4.50||): e = V<22 — b2 = 1, souřadnice ohnisek jsou tedy [—1, 0] a [1, 0]. □
4.52. Dokažte, že součin vzdáleností ohnisek elipsy od její libovolné tečny je konstantní a zjistěte velikost této konstanty.
Řešení. Uvažme polární bázi. V ní má matice elipsy diagonální tvar diag(^2, ^2,-1) a rovnice poláry (tečny) v bodě X=[x0, yol rná tvar %x + $y = 1- Vzdálenost ohnisek E,F= [=p?, 0] od této přímky je rovna
Já + za
a jejich součin je tedy
l-e2Í
i i xl 4_ É. a4 b4
2 2
Dosadíme-li e2 = a2—b2a^ = 1—^ (bod X leží na elipse), zjistíme, že předchozí výraz je roven b2. □
231
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
Projektivní klasifikace dává následující možnosti, popsané v homogenních souřadnicích (x : y : z) v projektivní rovině VR3: • imaginární regulární kuželosečka zadaná x2 + y2 + z2 — 0
reálná regulární kuželosečka s rovnicí x2 + y2
0
• dvojice imaginárních přímek s rovnicí x2 + y2 = 0
• dvojice reálných přímek s rovnicí x2 — y2 = 0
• dvojnásobná přímka x2 = 0.
Klasifikaci uvažujeme jako reálnou, tj. klasfikace kvadratických forem je dána nejen hodností, ale i signaturou, nicméně body kvadrik pak uvažujeme i v komplexním rozšíření. Tak je třeba chápat uvedené názvy, např. imaginární kuželosečka nemá žádné reálné body.
4.43. Afinní klasifikace kvadrik. Pro afinní klasifikaci musíme omezit projektivní transformace na ty, které zachovávají přímku nevlastních bodů. To ale můžeme také realizovat opačným postupem — pro zvolený projektivní typ kuželosečky Q, tj. její kužel Q c R3 budeme postupně různě volit afinní rovinu a c R3 ne-procháející počátkem a sledovat, jak se mění množina bodů Q n a, které jsou v afinních souřadnicích realizovaných pomocí roviny a vlastními body Q.
V případě reálné regulární kuželosečky tedy máme k dispozici skutečný kužel Q zadaný rovnicí z2 — x2 + y2 a za rovinu a berme třebas tečné roviny jednotkové sféry. Začneme-li s rovinou z — 1, dostaneme jako průnik samé konečné body v ní ležící jednotkové kružnice Q. Postupnýnm nakláněním a budeme dostávat protaženější a protaženější elipsy, až dosáhneme náklonu a rovnoběžného s jednou z přímek kužele. V tom okamžiku se již objeví jeden (dvojnásobný) nekonečný bod naší kuželosečky, jejíž konečné body ale stále tvoří jednu souvislou komponentu, a dostáváme parabolu parabola. Pokračováním naklánění vzniknou nekonečné body dva a množina konečných bodů přestane být souvislá a tak dostáváme poslední regulární kvadriku v afinní klasifikaci, hyperbolu.
Z uvedeného postupu si můžeme vzít poučení, které nám snadno umožní pokračovat do vyšších dimenzí. Předně, si všimněme, že průnikem naší kuželosečky s projektivní přímkou nevlastních boduje vždy opět kvadrika v dimenzi o jedničku nižší, tj. v našem případě šlo o prázdnou množinu nebo dvojnásobný bod nebo dva body jakožto typy kvadrik na projektivní přímce. Dále jsme zjistili, že afinní transformaci převádějící jednu z možných realizací zvoleného projektivního typu na druhou jsme našli jen tehdy, když příslušné kvadriky v nevlastní přímce byly projektivně ekvivalentní. Takovýmto způsobem lze pokračovat v klasifikaci kvadrik v dimenzi tři a dále.
4.53. Jakou velikost mají poloosy elipsy, když je součet jejich velikostí roven vzdálenosti mezi ohnisky a ta je rovna 1.
Řešení. Řešíme soustavu
a + b
2e
a najdeme řešení a = |, b
iVä2
3 8-
b2
□
4.54. Pro jaké směrnice k jsou přímky vedené z bodu [—4, 2] sečnami a kdy tečnami elipsy dané rovnicí
x2 y2 — + — = 1 9 4
Řešení. Směrový vektor přímky je (l,k) a proto je parametrické vyjádření přímky x = —4 + t,y = 2 + kt. Průsečík s elipsou pak splňuje
(-4 +Q2 (2 + kt)2 _ 9 4 Tato kvadratická rovnice má diskriminant roven
D = -^(7*+ 16)
To znamená, že v intervalu k e (—y, 0) má dvě řešení, tj. přímka je sečna, a pro směrnici k = — y aJ = 0 jediné řešení, tj. přímka je tečna. □
4.55. Najděte rovnici tečny k elipse 3x2 + 7y2 =30, jejíž vzdálenost od středu elipsy je rovna 3.
Řešení. Střed elipsy je v počátku souřadnic a pro vzdálenost d přímky
ax + by + c = 0 od počátku se odvodí d
Ja2+b2
. Tečna ze zadání
tedy splňuje a2 + b2 = Rovnice tečny v bodě [xT, yr] je 3xxr + 7yyT — 30 = 0. Pro souřadnice bodu dotyku tak dostáváme soustavu
(3xr)2 +(lyT)2 3xy + ly\
100 30
Jejím řešením je xT = ±y^, yj = Vzhledem k symetrii
elipsy dostáváme čtyři řešení ±3J^-x ± IJj^y — 30 = 0.
□
4.56. Je dána hyberbola x2 — y2 =2. Určete rovnici hyperboly, která má stejná ohniska a prochází bodem [—2, 3].
Řešení. Výstřednost zadané hyperboly je e = V2 + 2 = 2. Rovnice
2 2
hledané hyperboly bude ^ - = la její výstřednost bude splňovat e2 = a2 + b2 = 4. Podmínka, že bod [—2, 3] leží na hyperbole dává 4r — jjj = 1. Řešením této soustavy je a2 = 1, b2 = 3. Hledaná
2
hyperbola je tedy x2 — — = 1. □
232
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
4.57. Určete rovnice tečen hyperboly 4x2 — 9y2 = 1, kolmých na přímku x — 2y + 1 = 0.
Řešení. Všechny přímky kolmé na zadanou přímku mají tvar 2x + y + c = 0 pro nějaké c. Hledaná přímka má mít právě jeden průnik se zadanou hyperbolou, tj. rovnice 4x2 — 9(—2x — c)2 = 1 má mít jedno řešení. To nestane tehdy, když D = (36c)2 — 4.32.(9c2 + 1) = 0. Odtudc = ±2^. □
4.58. Projektivní pohled na kuželosečky. Pojem projektivního prostoru nám také umožňuje se novým pohledem podívat na již známé kuželosečky (srovnej s 4.42). Kuželosečku v £2 zadanou kvadratickou formou
f(x, y) = anx2 + 2anxy + a22y2 + 2a\3x + 2a23y + a33
můžeme chápat jako množinu bodů v projektivní rovině V2 s homogenními souřadnicemi (x : y : z), které jsou nulové body homogenní kvadratické formy
f(x, y, z) = a\\x2 + 2anxy + any2 + 2a\3xz + 2a23yz + a33z2.
Tu můžeme jednoduše psát jako f (v) = vT Av, kde i; je sloupcový vektor o souřadnicích (x, y, z) a matice A je symetrická matice (%). Podle věty 4.31 existuj e báze, ve které má tato kvadratická forma j eden z následujících tvarů
f(x, y, z) = x2 + y2 + z2, f(x, y, z) = x2 + y2 - z2.
V prvním případě je řešením f(x, y,z) =0 jediný (nevlastní) bod a proto původní forma nezadávala reálnou kuželosečku. Druhá kvadratická forma zadává kužel v R3. Příslušnou kuželosečku dostaneme přechodem zpět k nehomogenním souřadnicím. To znamená řezem tohoto kužele rovinou, která měla v původní bázi rovnici z = 1. Odtud dostaneme ihned klasifikaci kuželoseček z 4.29., která odpovídá řezům kužele v R3 různými rovinami. Řezy, které dávají vlastní kuželosečky jsou znázorněny na obrázku. Nevlastní kuželosečky odpovídají řezům rovinami, které prochází vrcholem kužele.
233
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
Pro kuželosečku v projektivní rovině definujeme následující užitečné pojmy:
Body P, Qe V2 príslušné jenorozměrným poprostorům (p), (q) (generovanými vektory p, q e R3) se nazývají polárně sdružené vzhledem ke kuželosečce /, pokud platí F(p,q) = 0, tj. pT Aq =0.
Bod P= (p) se nazývá singulárním bodem kuželosečky /, jestliže je polárně sdružený vzhledem k / se všemi body roviny, tj. F(p,x) = 0 Vx e V2. To jinými slovy znamená Ap = 0. Tím pádem matice A kuželosečky se singulárním bodem nemá maximální hodnost a tak zadává nevlastní kuželosečku. Vlastní kuželosečky tedy neobsahují singulární body.
Množinu všech bodů X= (x) polárně sdružených s podem P = (p) nazývámepolárou bodu P vzhledem ke kuželosečce /. Je to tedy množina bodů, pro které platí F(p,x) = pT Ax = 0. Protože je po-lára zadaná lineární kombinací souřadnic, je to vždy (v nesingulárním případě) přímka. Geometrický význam poláry vysvětluje následující věta.
4.59. Charakterizace polár. Uvažme vlastní kuželosečku /. Polárou bodu P € f vzhledem k projektivní kuželosečce / je tečna k / s bodem dotyku P. Polárou bodu P £ f je přímka daná body dotyku tečen sestrojených z bodu P ke kuželosečce /.
Řešení. Nejprve uvažujme Pe / a ukážeme sporem, že polára má s kuželosečkou právě jeden společný bod (bod dotyku). Předpokládejme tedy, že polára bodu P, určená rovnicí F(p,x) = 0, protne vlastní kuželosečku / v bodě Q= (q) ^P. Pak zřejmě platí F(p,q) = 0 a f iq) = F(q, q) = 0. Pro libovolný bod X = (x) ležící na přímce určené body P a Q pak máme x = a p + fiq pro nějaké a, fi e R. Díky bilinearitě a symettrii F pak dosáváme
f(x) = F(x, x) = a2F(p, p) + 2a.pF(p, q) + p2F(q, q) = 0
a to znamená, že každý bod X přímky leží na kuželosečce /. Když ale kuželosečka obsahuje přímku, pak musí být nevlastní, což je spor s předpokladem. Zároveň vidíme, že v případě nevlastní kuželosečky je polárou samotná (tzv. tvořící) přímka kuželosečky.
Tvrzení pro případ P £ f vyplývá z následujícího důsledku symetrie bilineární formy F. Pokud bod Q leží na poláře bodu P, pak bod P leží na poláře bodu Q.
□
Pomocí polárně sdružených bodů můžeme také nalézt bez použití Lagrangeova algoritmu rovnice os kuželoseček i střed kuželosečky.
234
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
Napišme matici kuželosečky jako blokovou matici
T
a a
kde Ä = (ciij) pro /, j = 1, 2, a je vektor o souřadnicích («13, a2j.) a a = út33. To znamená, že kuželosečka je zadaná rovnici
u1 Au + 2a1u + a = 0
pro vektor u = (x, y). Nyní ukážeme
4.60. Osy kuželosečky jsou poláry nevlastních bodů určených vlastními vektory matice Ä.
Řešení. Protože je matice Ä symetrická, má v bázi svých vlastních vektorů diagonální tvar D = ^ , kde X, /jl e Ma tato báze je ortogonální. Označíme-li matici přechodu k této bázi U (sloupce jsou jednotkové vlastní vektory), pak má matice kuželosečky bázi vlastních vektorů tvar
'UT 0\(Ä a\(U 0\ _ / D ř/V 0 l)[aT a)\0 l)-[aTU
V této bázi má tedy kanonické vyjádření až na posunutí dané vektorem UTa. Konkrétně, označíme-li jednotkové vlastní vektory v^,v^, máme
aTvi t aTva t (aTvi)2 (aTvu)2
X(x + —±)2 + ix(y +-^)2 = K—^- + K--^- - a.
X fl A fl
To znamená, že vlastní vektory jsou směrové vektory os kuže-
T
losečky (tzv. hlavní směry) a rovnice os v této bázi jsou x = —^-^
T
a v
a y = —j^-. Souřadnice os uk a u/x ve standardní bázi proto splňují
T T
vlux = -^aujií,! = neboli v{(Xuk+a) =0a^(/í^ +
a) = 0. Tyto rovnice jsou ekvivalentní rovnicím vl(Äux + a) = 0 a v^iÄu^ + a) = 0 a to jsou rovnice polár nevlastních bodů určených vektory v^av^. □
4.61. Poznámka. Důsledkem tvrzení z předchozího příkladu je fakt, že střed kuželosečky je polárně sdružený se všemi nevlastními body. Souřadnice s středu pak splňují rovnici Äs + a = 0.
Pokud det(A) 7^ 0, pak má rovnice Äs + a =0 pro souřadnice středu kuželosečky pro 8 = det(Ä) ^ 0 právě jedno řešení, a pro 8 = 0 žádné řešení. To znamená, že z vlastních kuželoseček má elipsa
235
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
a hyperbola jeden vlastní střed a parabola žádný (střed paraboly je v nevlastním bodě).
4.62. Dokažte, že tečna paraboly v libovolném bode svírá stejný úhel s osou paraboly, jako se spojnicí ohniska a bodu dotyku. Řešení. Polárou (tj. tečnou) bodu X=[x0, y o] k parabole zadané kanonickou rovnicí v polární bázi je přímka splňující
/i o o\/*\
(x0, y0, 1) 0 0 -p y = x0x - py - py0 = 0 Vo -p 0 J \\)
Kosinus úhlu, který tečna svírá s osou paraboly (x = 0) je daný skalárním součinem příslušných jednotkových směrových vektorů. Jednotkový směrový vektor tečny je , 1 (p, x0) a proto pro kosinus platí
1 Xn
= (p,x0).(0,l) =
Nyní ukážeme, že kosinus úhlu, který tečna svírá se spojnicí ohniska
2-
niceje
F=[0, I] a bodem dotyku X je stejný. Jednotkový směrový vektor spoj-
1 p (x0, yo - tt)-
x2o + (y0-f)2 2
Pro kosinus úhlu pak máme
1 1 , PXQ
=(-^oyo + -r-)
P2 + ^^ + (^,-f)2 2
Dosazením yo = ^ a úpravou výrazu dostaneme
Tento příklad ukazuje, že paprsky světla dopadající rovnoběžně s osou na parabolické zrcadlo, se odrážejí do ohniska a naopak, paprsky světla vyzařovaného z ohniska se odráží stejným sněrem (rovnoběžně s osou). To je principem mnoha zařízení, např. parabolický reflektor, parabolická anténa. □
4.63. Najděte rovnici tečny v bodě P=[l, 1] ke kuželosečce
4x2 + 5y2 - Sxy + 2y - 3 = 0
Řešení. Projektivizací dostaneme kuželosečku zadanou kvadratickou formou (x, y, z)A(x, y, z)T s maticí
/ 4 -4 0
A = -4 5 1 V 0 1-3
Podle předchozí věty je tečna polárou bodu P, který má homogenní souřadnice (1:1: 1). Taje dána rovnicí (1, 1, l)A(x, y, z)T = 0, což v našem případě dává rovnici
2y - 2z = 0
236
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
Přechodem zpět k nehomogenním souřadnicím dostaneme rovnici tečny y = 1.
□
4.64. Určete souřadnice bodu dotyku osy y s kuželosečkou zadanou rovnici
5x2 + 2xy + y2 - 8x = 0
Řešení. Osa y, tj. přímka x = 0, je polárou hledaného bodu P s homogenními souřadnicemi (p) = (p\ : p2 ■ p?,). To znamená, že rovnice x = 0 je ekvivalentní rovnici poláry F (p, v) = pT Av = 0, kde v = (x, y, z)T.To je splněno právě v případě, když Ap = (a, 0, 0)T pro nějaké a e M. Tato podmínka dává pro matici naší kuželosečky
soustavu rovnic
5pi + P2 - 4p3 = aj Pi + P2 = 0 -4Pl = 0
Buď můžeme najít souřadnice bodu P pomocí inverzní matice, p = A~l(a, 0, 0)T, nebo vyřešit tuto soustavu rovnic přímo, zpětným dosazováním. V tomto případě takto dostaneme lehce řešení p = (0, 0, — \a). Osa y se tedy dotýká kuželosečky v počátku. □
4.65. Určete bod dotyku přímky x = 2 s kuželosečkou z předchozího příkladu.
Řešení. Přímka má v projektivním rozšíření rovnici x — 2z = 0, a proto v tomto případě dostaneme pro bod dotyku P podmínku Ap = (a, 0, —2a), což dává soustavu
5pi + P2 ~ 4p3 = a Pi + P2 = 0 —4pi = —2a
Jejím řešením je p = (\a, — \a, \a). Tyto homogenní souřadnice jsou ekvivalentní souřadnicím (2, —2, 1) a proto proto má bod dotyku souřadnice [2, —2]. □
4.66. Najděte rovnice tečen sestrojených z bodu P= [3, 4] ke kuželosečce zadané rovnicí
2x2 - 4xy + y2 - 2x + 6y - 3 = 0
237
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
Řešení. Předpokládejme, že bod dotyku T hledané tečny má homogenní souřadnice dané násobky vektoru t = (ři, ř2, ^3). Podmínka, že T leží na kuželosečce je tT At = 0, což dává
2t2 - At\h + tj - 2t\h + 6ŕ2ŕ3 -3^=0
Podmínka, že bod P leží na poláre bodu T je p1 At = 0, kde p = (3, 4, 1) jsou homogenní souřadnice bodu P. Tato rovnice v našem případě dává
í 2 -2 -1\ M (3, 4, 1) 1-2 1 3 U = -3ŕi + h + 6í3 = 0 V-l 3 -3) \t3)
Nyní můžeme dosadit například t2 = 3ři — 6t3 do předchozí (kvadratické) rovnice. Potom dostaneme
-t\ + Atxh -3^=0
Protože pro t3 = 0 rovnice není splněna, můžeme přejít k nehomogenním souřadnicím 1), pro které dostáváme
"(|)2 + 4(|)-3 = 0 a g = 3(£)-6,
tj. i = 1 a ^ = -3, nebo f = 3 a f = 3. Body dotyku tedy mají homogenní souřadnice (1 : —3 : l)a(3 : 3 : 1). Rovnice tečen dostaneme jako poláry těchto bodů. Výsledné rovnice tečen jsou Ix —
2y - 13 = Oax = -3. □
4.67. Napište rovnici tečny vedené počátkem ke kružnici zadané rovnicí
x2 + y2 - lOx - Ay + 25 = 0
Řešení. Bo dotyku {t\ : t2 : h) splňuje
/l 0 -5\/řl\ (0, 0, 1) 0 1 -2 ř2 = —5ři - 2t2 + 25 = 0 \-5 -2 25/ VV
Odtud vyjádříme např. ř2 a dosadíme do rovnice kuželosečky (kružnice), kterou musí bod (h '■ h : t3) také splňovat. Dostaneme kvadratickou rovnici 29ť\ — 250ři + 525 = 0, která má řešení t\ = 5 a řl = Wm Souřadnici t2 dopočítáme a získáme body dotyku [5, 0] a [^, ^]. Hledané tečny jsou pak poláry těchto bodů. Ty mají rovnice y = 0a20x - 21j = 0. □
4.68. Najděte rovnice tečen ke kružnici x2 + y2 =5 rovnoběžných s přímkou 2x + y + 2 = 0.
Řešení. V projektivním rozšíření se tyto tečny protínají v nevlastním bodě splňujícím 2x+y+z = 0 tj. v bodě s homogenními souřadnicemi (1 : —2 : 0). Jsou to tedy tečny spuštěné z tohoto bodu ke kružnici a postupovat můžeme stejně jako v předchozím příkladě. Matice kuželosečky (kružnice) je diagonální s diagonálou (1, 1, —5) a proto bod
238
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
dotyku (ři : t2 : h) hledaných tečen splňuje t\ — 2t2 = 0. Dosazením o rovnice kružnice dostaneme 5^ =5. Odtud máme t2 = ±1 a body dotyku proto jsou [2, 1] a [—2, —1]. □ Tečna v nevlastním bodě kuželosečky se nazývá asymptota kuželosečky. Počet asymptot kuželosečky se tedy rovná počtu průsečíků kuželosečky s přímkou nevlastních bodů, tj. elipsa nemá žádnou reálnou asymptotu, parabola má jednu (která je ovšem nevlastní přímkou) a hyperbola dvě.
4.69. Určete nevlastní body a asymptoty kuželosečky zadané rovnicí
4x2 - Sxy + 3y2 - 2y - 5 = 0
Řešení. Nejprve napíšeme rovnici kuželosečky v homogenních souřadnicích.
4x2 - Sxy + 3y2 - 2yz - 5z2 = 0
Nevlastní body kuželosečky jsou pak body určené homogenními souřadnicemi (x : y : 0) splňující tuto rovnici, to znamená
4x2 - Sxy + 3y2 = 0.
Pro podíl - dostaneme dvě řešení: - = — \ & - = —|. Zadaná ku-
ť y y 2 y 2
želosečka je tedy hyperbola s nevlastními body P= (—1 : 2 : 0) a Q= (—3:2:0). Asymptoty jsou potom poláry bodů P a Q, tj.
(-1,2,0) -4 3 -1 y =-12x + 10y-2 = 0
(-3,2,0) -4 3 -1 y =-20x + 18y - 2 = 0
Další příklady na kuželosečky naleznete na straně 243.
□
4.70. Harmonický dvojpoměr. Je-li dvojpoměr čtyř bodů ležících na přímce roven —1, hovoříme o tzv. harmonické čtveřici. Harmonickou čtveřici lze snadno zkonstruovat: mějme čtyřuhelník ABCD. Označme K průsečík přímek AS a CD, M průsečík přímek AD a BC. Dále nechť L, resp. N, je průsečík přímky KM s přímkou AC, resp. BD. Potom body K, L, M, N tvoří harmonickou čtveřici.
239
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
240
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
241
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
242
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
D. Doplňující příklady k celé kapitole
4.71. Parametricky vyjádřete průnik následujících rovin v R3:
er: 2x + 3y — z + l= 0 a p : x — 2y + 5 = 0.
O
4.72. Nalezněte osu mimoběžek
p : [1, 1, 1] + ř(2, 1, 0), q : [2, 2, 0] + ř(l, 1, 1).
O
4.73. l.(8b.) Určete příčku mimoběžek p : [0, 1, 1] + ř(l, 2, 3), q : [0, 5, 5] + s(2, 1, 0), tj. body P a 2, kde P € p a Q € q, takové, že přímka P Q prochází bodem [—7, 7,12]. O
4.74. Jarda stojí v bodě [— 1, 1, 0] a má tyč délky 4. Může se touto tyčí současně dotknout přímek p a q, kde
p : [0,-1,0] +f (1,2, 1), q : [3,4, 8]+5(2, 1,3)?
O (Tyč musí procházet bodem [ — 1, 1,0].)
4.75. Rozhodněte, za existuje úsečka P Q, kde P € p, Q € q, přičemž přímky p a q jsou dány vztahy
p : [1, -1, 2]+ř(l, 0, 1), t e R, q: [2, -3, 1]+í(-1, -1, l)sel
a navíc bod [0, 1, 3] leží na úsečce P Q. O
4.76. V prostom R3 je dána zrcadlová rovina y = 0. Určete délku dráhy, kterou urazí světelný paprsek při cestě z bodu [1, 2, 3] odrazem o zrcadlovou rovinu do bodu [2, 1, 2]. O
4.77. JedánakrychleASCD^FGÍř.NechťbodriežínahraněSF,\BT\ = \ \ BF \. Určete kosinus odchylky rovin ATCaBDE. O
4.78. Je dána krychle ABCDEFGH. Nechť bod T leží na hraně AE,\AT\ = \\AE\ a S je střed strany AD. Určete kosinus odchylky rovin BDT a SCH. Q
4.79. JedánakrychleASCD^FGÍř.NechťbodriežínahraněSF,\BT\ = ±1 BF \. Určete kosinus odchylky rovin ATCaBDE. O
2 2
4.80. Určete tečnu k elipse jě + \ = 1 rovnoběžnou s přímkou x + y — 1 = 0.
Řešení. Rovnoběžky s danou přímkou se s ní protínají v nevklastním bodě (1 : —1 : 0). Z tohoto bodu spustíme tečny k dané elipse. Bod dotyku T= (ři : t2 : t3) leží na jeho poláře a proto splňuje {j — I = 0, tj. h = j^ti. Dosazením do rovnice elipsy pak dostáváme t\ = ±y. Body dotyku hledaných tečen tak jou [y, |] a [—y, — |]. Tečny jsou pak poláry těchto bodů. Ty mají rovnice x + y = 5 a x + y = — 5. □
4.81. Určete nevlastní body a asymptoty kuželosečky zadané rovnicí
2x2 + 4xy + 2y2 - y + 1 = 0
Řešení. Rovnice nevlastních bodů 2x2 + 4xy + 2y2 = 0, tj. 2(x + y)2 = 0 má řešení ^ — y. Jediným nevlastním bodem je tedy (1 : — 1 : 0) (daná kuželosečka je parabola). Asymptota je polára tohoto bodu a tou je nevlastní přímka z = 0 (jedná se tedy o parabolu). □
243
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
4.82. Dokažte, že součin vzdáleností bodu libovolného bodu hyperboly od jejích asymptot je konstantní a určete velikost této konsatnty.
Řešení. Označme bod na hyperbole P. Rovnice asymptot hyperboly v kanonickém tvaru je b x ± ay = 0. Jejich normály jsou tedy (b, ±a) a odtud určíme průměty P\, P2 bodu P na asymptoty. Pro vzdálenost bodu P od asymptot pak dostáváme \PP\2\ = -7=4- Hledaný součin je tedy roven
\f a 2+b2
°2qía2%p2 = 4i%' Protože bod P leží na hyperbole. □
4.83. Určete úhel asymptot hyperboly 3x2 — y2 = 3.
Řešení. Pro kosinus úhlu, který svírají asymptoty hyperboly v kanonickém tvaru lze odvodir cos a = f2^2 ■ V našem případě tak dostáváme úhel 60°. □
4.84. Určete středy kuželoseček:
(a) 9x2 + 6xy - 2y - 2 = 0
(b) x2 + 2xy + y2 + 2x + y + 2 = 0
(c) x2 - 4xy + 4y2 + 2x - 4y - 3 = 0
(d) ^ + ^# = 1
Řešení, (a) Soustava Äs + a = 0 pro výpočet vlastních středů má tvar
9si +3s2 = 0 3*1-2 = 0
a jejím vyřešením dostaneme střed [|, —2].
(b) V tomto případě máme
si+s2 + l = 0 si+s2 + j = 0
a proto žádný vlastní střed neexistuje (kuželosečka je parabola). Pokud přejdeme do homogenních souřadnic, dostaneme nevlastní střed (1 : —1 : 0).
(c) Souřadnice středu v tomto případě splňují
51-2*2 + 1 = 0 -2si +4s2-2 = 0
a řešením je tedy celá přímka středů. Je to proto, že kuželosečka je degenerovaná do dvojice rovnoběžných přímek.
(d) Z rovnic pro výpočet středu okamžitě plyne, že středem je (a, ji). Souřadnice středu tedy udávají posunutí počátku souřadnic k repéru, ve kterém má elipsa základní tvar.
□
4.85. Určete rovnice os kuželosečky dané rovnicí 6xy + Sy2 + 4y + 2x — 13 = 0.
Řešení. Hlavní směry kuželosečky (směrové vektory os) j sou vlastní vektory matice ^ . Charakteristická rovnice má tvar A2—8A—9 = 0 a vlastní čísla jsou proto X1 = — \,k2 = 9. Příslušné vlastní vektory jsou pak (3, —1) a (1, —3). Osy jsou polárami nevlastních bodů určených těmito směry. Pro (3, —1) tak dostáváme rovnici osy — 3x + y + 1 = 0 a pro (1, —3) osu — 9x — 2\y — 5 = 0. □
244
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
4.86. Určete rovnice os kuželosečky dané rovnici 4x2 + 4xy + y2 + 2x + 6y + 5 = 0.
(4 2\
Řešení. Vlastní čísla matice I ^ ^ I jsou ~k\ = 0, A2 = 5 a príslušné vlastní vektory (—1, 2) a (2, 1).
Pro osy pak dostávame rovnice 5 = 0a2x + y + l =0. První z nich očividně není splněna pro žádný bod. Existuje tedy jen jedna osa (zadaná kuželosečka je parabola). □
4.87. Rovnicí
x2 + 3xy - y2 + x + y + 1 = 0. je dána kuželosečka. Určete její střed, osy, asymptoty a ohniska.
245
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
Řešení cvičení
4.9. 2, 3,4, 6, 7, 8. Polohy rovin, které realizují dané počty si rozmyslete samostatně. 4.31. Pro normálový vektor (a, b, c) hledaných rovin máme rovnice a + b — 0 (kolmost na p) a volbou a — — b — 1 (vektor (0, 0, 1) nevyhovuje podmínkám, takže vhodným pronásobením můžeme dosáhnout
— A, celkem pak hledané
podmínky a — —b — ľ) pak dostáváme z podmínky pro odchylku
rovnice přímek jsou x — y ± Vó —1=0. 4.7/. Přímka (2ř, ř, 7ŕ) + [-5, 0, -9].
4.72. [3,2, l][8/3, 8/3,2/3].
4.73. P = [-1, -1, -2], g = [-4, 3, 5].
4.74. Příčka [1, 1, l][-3, 1, -1], délky ^20, tyč stačit nebude.
4.75. Neexistuje. Přímka procházející daným bodem a protínající jak p tak q je daná body P (e p)ag = [2, —3, 1] (e q). Daný bod však na úsečce P Q neleží.
4.76. VTL
4.77.
[1,-1,2]
2V6
4.78. ^r-
4.79.
246
KAPITOLA 5
Zřízení ZOO
jaké funkce potrebujeme pro naše modely?
- pořádný zvěřinec...
V této kapitole začneme budovat nástroje umožňujících modelování závislostí, které nejsou ani lineární ani diskrétní. S tako-vou potřebou se často setkáme, když popisujeme systém vyvíjející se v čase a to ne jen v několika vybraných okamžicích, ale „souvisle", tj. pro všechny možné okamžiky. Někdy je to přímo záměr či potřeba (třeba ve fyzikálních modelech klasické mechaniky), jindy je to vhodné přiblížení diskrétního modelu (třeba u ekonomických, chemických nebo biologických modelů).
Klíčovým pojmem budou stále funkce. Čím větší třídu funkcí připustíme, tím obtížnější bude vybudovat nástroje pro naši práci. Když ale bude různých typů funkcí málo, nebudeme patrně umět budovat dobré modely pro reálné situace vůbec. Cílem následujících dvou kapitol bude proto explicitně zavést několik typů elementárních funkcí, implicitně popsat daleko více funkcí a vybudovat standardní nástroje pro práci s nimi. Souhrnně se tomu říká diferenciální a integrální počet jedné proměnné. Zatímco dosud jsme se spíše pohybovali v oblasti matematiky nazývané algebra, nyní se budeme postupně blížit k tzv. matematické analýze.
1. Interpolace polynomy
V předchozích kapitolách jsme pracovali často s posloupnostmi hodnot reálných nebo komplexních čísel, tj. se skalárními funkcemi N -> K nebo Z -> K, kde K byl zvolený číselný obor. Případně jsme pracovali s posloupnostmi vektorů nad reálnými nebo komplexními čísly.
Připomeňme si diskusi z odstavce 1.4, kde jsme přemýšleli nad způsoby, jak pracovat se skalárními funkcemi. Na této diskusi není třeba nic doplňovat a rádi bychom (pro začátek) uměli pracovat s funkcemi M -> W. (reálné funkce reálné proměnně) nebo M -> C (komplexní funkce reálné proměnné), případně funkcemi Q -> Q (funkce jedné racionální proměnné s racionálními hodnotami) apod. Většinou půjdou naše závěry snadno rozšířit na případy s vektorovými hodnotami nad stejnými skaláry, ve výkladu se ale zpravidla omezíme jen na případ reálných a komplexních čísel.
Začneme od nejednodušších funkcí, které umíme zadat explicitně pomocí konečně mnoha algebraických operací se skaláry.
Polynomy. Skaláry umíme sčítat a násobit a tyto operace ájg£> splňují řadu vlastností, které jsme vyjmenovali už
v odstavcích 1.1 a 1.3. Když připustíme konečný ír- počet těchto operací, přičemž jednu proměnnou ponecháme jako neznámou a další vstupující skaláry budou pevně zvolené, dostáváme tzv. polynomy:
A. Interpolace polynomy
Na úvod této kapitoly se budeme snažit odhadnout funkce pomocí polynomů. Předpokládejme, že o neznámé funkci máme pouze kusé informace, totiž její hodnoty v několika bodech, popřípadě i hodnoty její první či druhé derivace v těchto bodech. Budeme se snažit najít polynom (co nejmenšího stupně) splňující tyto závislosti.
5.1. Nalezněte polynom P splňující následující podmínky:
)^ p(2) = 1, P(3) = 0, P(4) = -1, P(5) = 6.
ReseitfHŘešme příklad nejprve sestavením soustavy čtyř Uneárních rovnic o čtyřech neznámých. Předpokládáme polynom ve tvaru a3x3 + a2x2 +aixi +a0. Víme, že polynom stupně nejvýše tři splňující podmínky v zadání je dán jednoznačně.
«o + 2«i + 4a2 + 8^3 ao + 3ai + 9a2 + 21 a3 «o + 4a i + 16^2 + 64út3 «o + 5«i + 25a2 + 125^3
1
0
247
KAPITOLA 5. ZŘÍZENÍ ZOO
Polynomy
Polynomem nad okruhem skalárů K rozumíme zobrazení / ■> K dané výrazem
fix) — a„x" + fl„_ix"_1 + • • • + a\x + gq,
Každá rovnice vznikla z jedné z podmínek v zadání.
Druhou možností řešení je vytvořit hledaný polynom pomocí fundamentálních Lagrangeových polynomů (viz 5.4):
kde en, i — 0,..., n, jsou pevně zadané skaláry, násobení je znázorněno prostým zřetězením symbolů a „+" označuje sčítání. Pokud je a„ ^ 0, říkáme, že polynom / je stupně n. Stupeň nulového polynomu není definován. Skaláry a; označujeme jako koeficienty polynomu f. ^ml^ml
Polynomy stupně nula jsou právě konstantní nenulová zobrazení x i-> ao.V algebře jsou častěji polynomy definovány jako formální výrazy uvedeného tvaru fix), tj. jako posloupnosti koeficientů ao, a\,... s konečně mnoha nenulovými prvky. V zápětí si ale ukážeme, že v analýze budou oba přístupy ekvivalentní.
Je snadné ověřit, že polynomy nad okruhem skalárů tvoří opět okruh, kde násobení a sčítání je dáno operacemi v původním okruhu K pomocí hodnot polynomů, tzn.
(/ ' *)to = /to ' Sto, (/ + S)to = /to + Sto, kde nalevo a napravo musíme správně interpretovat příslušné operace v okruhu polynomů a v samotném okruhu skalárů.
5.2. Dělení polynomů se zbytkem. Jak jsme již zmínili, budeme v dalším pracovat výhradně s poli skalárů Q, R nebo C. Pro všechna pole skalárů však platí
Tvrzení (O dělení polynomů se zbytkem). Pro libovolné polynomy f stupně n a g stupně m, existují jednoznačně určené polynomy q a r takové, že f = q ■ g + r a přitom je stupeň r menší než m nebo je r = 0.
Pix)
ix - 3)(x - 4)(x - 5) 1 . i-!±-!±-L + o .(...) +
(2 - 3) (2 - 4) (2 - 5)
(x - 2)(x - 3)(x - 5) (x-2)(x-3)(x-4)
(-1) • —-77";-777";-T" + O •
3Z
(4-2)(4-3)(4-5)
, 101
12z2 + —z, - 29.
(5-2)(5-3)(5-4)
Koeficienty tohoto polynomu jsou samozřejmě jediným řešením výše sestavené soustavy lineárních rovnic. □
5.2. Nalezněte polynom P splňující následující podmínky:
Pil + i) = i, P(2) = 1, Pi3) = -i.
5.3. Pro navzájem různé body x0,... ,xn e R uvažme elementární Lagrangeovy polynomy (5.4)
Z,.(jc) := ^-^■■V^-.)H+1H^-^) x eR, i = 0,...,n.
Dokažte, že platí
£ li ix) = 1 pro všechna x e
Důkaz. Začněme jednoznačností. Předpokládejme, že máme Řešení. Zřejmě je
dvě požadovaná vyjádření polynomu / s polynomy g, g', r a r1, tj. platí
fí' f = q.g + r = 4 ■g + r'.
Pak také odečtením dostaneme 0 = iq — q') ■ g + ir — r1).
Jestliže q — 4> pak také r — r1. Je-li q / q', pak člen s nej vyšším stupněm v iq — 4) ■ 8 nemůže být vykompenzován r — r1, což vede na spor. Dokázali jsme tedy jednoznačnost výsledku dělení, pokud existuje.
Zbývá dokázat, že umíme polynom / vždy napsat požadovaným způsobem. Pokud by stupeň g byl větší než stupeň /, pak můžeme rovnou psát / — 0 • g + f. Předpokládejme proto n > m a dokažme tvrzení indukcí přes stupeň /.
Pokud je / polynom stupně nula, je tvrzení zřejmé. Přepokládejme tedy, že tvrzení platí pro stupně menší než n > 0 a uvažme výraz h(x) = fix) — y-x"~m gix). Buď je h(x) přímo nulový polynom a pak máme, co jsme hledali, nebo jde o polynom nižšího stupně a tedy jej již umíme napsat potřebným způsobem h(x) — q ■ g + r a tedy také
fix) = hix) +
lgix) = iq +
')gix)
a tvrzení je dokázáno.
□
Je-li pro nějaký prvek b e K hodnota f (b) — 0, pak to znamená, že v podílu / (x) = qix) ix —b)+r musí být r — 0. Jinak by totiž nebylo možné dosáhnout f (b) = qib) -0 + r, kde stupeň r je
£Z;(x0) = l+ 0 + ---+0 = l,
£/,■ (Jti) = 0 + 1+ •••+() = 1,
iZhiXn) =0 + 0 + --- + l = 1.
To znamená, že polynom £"=0^(x) stupně nejvýše n nabývá v n + 1 bodech x0,..., x„ stejné hodnoty 1. Takový polynom (stupně nejvýše n) však existuje právě jeden, a to konstantní polynom y = 1.
□
5.4. Nalezněte polynom P splňující následující podmínky:
P(l) = 0, P'il) = 1, Pil) = 3, P'i2) = 3.
Řešení. Opět ukážeme dvě možnosti řešení.
Dané podmínky určují čtyři lineární rovnice pro koeficienty hledaného polynomu. Budeme-li hledat polynom třetího stupně, dostáváme
248
KAPITOLA 5. ZŘÍZENÍ ZOO
nulový. Říkáme, že b je kořen polynomu f. Stupeň q je pak právě n — X. Pokud má q opět kořen, můžeme pokračovat a po nejvýše n krocích dojdeme ke konstatnímu polynomu. Dokázali jsme tedy, že každý nenulový polynom nad polem K má nejvýše tolik kořenů, kolik je jeho stupeň. Odtud již snadno dovodíme i následující pozorování:
Důsledek. Je-li K pole s nekonečně mnoha prvky, pak dva polynomy f a g jsou si rovny jako zobrazení, právě když mají shodné koeficienty.
Důkaz. Předpokládejme / — g,tj. /—g — 0, jako zobrazení. Polynom (/ — g)(x) tedy má nekonečně mnoho kořenů, což je možné pouze tehdy, je-li nulovým polynomem. □
Uvědomme si, že u konečných polí samozřejmě takové tvrzení neplatí. Jednoduchým příkladem je např. polynom x2 + x nad Z2, který představuje nulové zobrazení.
5.3. Interpolační polynom. Často je užitečné zadat snadno počítatelný vztah pro funkci, pro kterou máme zadány hodnoty v předem daných bodech xq, ... ,x„.
■^.Y"' Pokud by šlo o nulové hodnoty, umíme přímo zadat M i^-* polynom stupně n + 1
f (x) — (x - x0)(x - xi) ... (x - x„),
který bude mít nulové hodnoty právě v těchto bodech a nikde jinde. To ale není jediná polynomiální odpověď, protože požadovanou vlastnost má i nulový polynom. Ten je přitom jediný s touto vlastností ve vektorovém prostoru polynomů stupně nejvýše n. Obdobně to dopadne i v obecném případě:
' Interpolační polynomy
Nechť K je nekonečné pole skalárů. Interpolační polynom f pro množinu po dvou různých bodů xq, ... ,x„ e K a předepsaných hodnot yo,..., yn e K je polynom stupně nejvýše n nebo nulový polynom, který splňuje /(*/) — y i pro všechna i = 0, l,...,n.
Věta. Pro každou množinu n + 1 po dvou různých bodů xq, ..., x„ € K a předepsaných hodnot yo, ..., yn e K existuje právě jeden interpolační polynom f.
Důkaz. Začněme jednodušší částí, tj. jednoznačností. Jsou-li / a g dva interpolační polynomy se stejnými definičními hodnotami, pak je jejich rozdíl polynomem stupně n, který má n + 1 kořenů, a proto je f-g = 0.
Zbývá existence. Označme si prozatím neznámé koeficienty polynomu / stupně n
f — anx" + • • • + a\x + aq-
Dosazením požadovaných hodnot dostaneme systém n + 1 rovnic pro stejný počet neznámých koeficientů a;
fl0 +x0fli H-----h (x0)"a„ — yo
fl0 + x„ai H-----h (x„)"a„ = y„.
tedy přesně tolik rovnic, kolik je neznámých koeficientů polynomu (nechť např. P(x) = a3x3 + a2x2 + a\x + a0):
P(l) = (a3+a2 + ai+a0 =0,
P'(\) = 3a3 +2a2+ai = 1,
P (2) = 8^3 + 4a2 + 2a 1 + ci$ = 3,
P'(2) = I2a3 + 4a2 + ax = 3.
Vyřešením tohoto systému obdžíme polynom P(x) = — 2x3 + 10x2 — 13x +5.
Jiné řešení. Použijeme fundamentální Hermiteovy polynomy:
2
h\(x) = i1
h\(x) = (5
h\(x) = (x
h\{x) = (x
Celkem
0 + (-l)
2x)(x - l)2,
(x - 1) (2 - x)z = (2x - l)(x - 2)1
P(x) = 0-/í}(x)+3-/í2(x)+1-/í2(x)+3-^(x) = -2x3 + 10x2-13x+5.
□
5.5. Pomocí Lagrangovy interpolace spočítejte přibližnou hodnotu cos2 1. Použijte k tomu hodnoty funkce v bodech j, j a |.
Řešení. Nejprve určíme funkční hodnoty v zadaných bodech: cos2(f) = 1/2, cos2(f) = 1/4, cos2(f) = 0. Dále určíme elementární Larangeovy polynomy, přitom můžeme spočítat hodnoty přímo v zadaném bodě:
ío(l)
hW =
Celkem tedy
(1 "f)(l - -)
i71 71 \ f 71 3 A4 n) l>
(1- "f)(l- - -)
,71 y3 71 \ f 71 4 A 3 2'
(1 "f)(l - -) 3>
f 71 71 \ f 71 71 \
^2 ~ 1^2 ~
8(7r" - 3)(7T - -2)
O 7T2
9(7r -4)(7T -2)
y 7T2
2(7r" -4)(7T- -3)
Z. 7T2
•9(7r -4)(7T -2)
* y 7T2
+ 0
0.288913.
_ (5tt - 12) (tt - 2) ~ i^2
Vidíme, že při výpočtu třetí elementrání polynom nebyl potřeba. Skutečná hodnota je cos2 1 = 0.291927. □
249
KAPITOLA 5. ZŘÍZENÍ ZOO
Existenci řešení tohoto systému rovnic můžeme snadno ukázat přímou konstrukcí patřičného polynomu pomocí tzv. Lagran-geových polynomů pro dané body x$,... ,x„, viz. další odstavec textu níže.
Nyní ale důkaz dokončíme pomocí jednoduchých znalostí z lineární algebry. Tento systém lineárních rovnic má totiž právě jedno řešení pokud je determinant jeho matice invertibilní skalár, tj. pokud je nenulový (viz 3.1 a 2.23). Jde o tzv. Vandermondův determinant, který jsme již diskutovali v příkladu ||2.24|| na straně 86.
Protože jsme ale už ověřili, že pro nulové pravé strany existuje řešení právě jedno, víme, že tento determinant nenulový být musí.
Protože polynomy jsou jako zobrazení stejné, právě když mají stejné koeficienty, věta je dokázána. □
x mmvitiNi rov/Hony
5.6. Franta potřebuje počítat hodnoty funkce sin, ale má k dispozici jen mobilní telefon s jednoduchou kalkulačkou, která umí základní operace. Protože si pamatuje hodnoty funkce sin v bodech 0, |, || a f a ví, že přibližné hodnoty n, V2 a VŠ jsou 3.1416,1.4142 a 1.7321, rozhodl se, že použije k přibližnému výpočtu interpolaci. Pomozte mu sestrojit přibližný vztah s využitím všech hodnot.
Řešení. Sestrojíme elementární Larangeovy polynomy:
Z0(x)
h(x)
h(x)
Z4(x)
(x - f )(x - f )(x - f )(x - f) (0-f)(0-f)(0-f)(0-f)
1.4783x4 - 5.8052x3 + 8.1057x2 - 4.7746x + 1,
(x-0)(x-f)(x-f)(x-f)
(f -0)(|-f)(f - f)(f -f)
-13.3046x4 + 45.2808x3 - 49.2419x2 + 17.1887*, (x-0)(x-f)(x-f)(x-f)
(f - 0)(f - f )(f - f )(f - f)
23.6526x4 - 74.3070x3 + 71.3298x2 - 20.3718x, (x-0)(x-f)(x-f)(x-f)
(f - 0)(f - f )(f - f )(f - f)
-13.3046x4 + 38.3146x3 - 32.8279x2 + 8.5943x, (x-0)(x-f)(x-f)(x-f)
(f-0)(f
— \( il
— \( il
f)
1.4783x4 - 3.4831x3 + 2.6343x2 - 0.6366x.
5.4. Užití interpolací. Na první pohled se může zdát, že reálné nebo případně racionální polynomy, tj. polynomiálně zadané funkce R -> R nebo Q -> Q, tvoří hezkou ve-% ^ likou třídu funkcí jedné proměnné. Můžeme jimi pro-ložit jakékohv sady předem zadaných hodnot. Navíc se zdají být snadno vyjádřitelné, takže by s jejich pomocí mělo být dobře možné počítat i hodnoty těchto funkcí pro jakoukoliv hodnotu proměnné. Při pokusu o praktické využití v tomto směru ovšem narazíme hned na několik problémů.
Prvním z nich je potřeba rychle vyjádřit polynom, kterým zadaná data proložíme. Pro řešení výše diskutovaného systému rovnic totiž budeme obecně potřebovat čas úměrný třetí mocnině počtu bodů, což při objemnějších datech je jistě těžko přijatelné. Podobným problémem je pomalé vyčíslení hodnoty polynomu vysokého stupně v zadaném bodě. Obojí lze částečně obejít tak, že zvolíme vhodné vyjádření intepolačnflio polynomu (tj. vybereme lepší bázi příslušného vektorového prostoru všech polynomů stupně nejvýše k, než je ta nejobvyklejší 1, x, x2,... ,x"). Ukážeme si pouze jediný příklad takového postupu:
-j Lagrangeovy interpolační polynomy |_
Lagrangeův interpolační polynom snadno zapíšeme pomocí tzv. elemntárních Lagrangeových polynomů li stupně n s vlastnostmi
1 i
J
Hodnota interpolačního polynomou je pak
1 V2 73
P(x) = 0 • o(x) + -h(x) + — h(x) + — h(x) + U(x)
= 0.0288x4 - 0.2043x3 + 0.0214x2 + 0.9956x.
□
|0 i*j
Doplňující otázky: Může Franta tento přibližný výsledek použít i pro výpočet funkce sin na intervalu [|, 7r]? A pokud ne, jak by měl postupovat?
Jak by vypadaly přibližné vztahy, pokud by Franta ne použil všechny uzly, ale pro každý bod jen tři uzly nejbližší?
5.7. Další den potřeboval Franta spočítat dvojkový logaritmus 25. x\\bv (Ve skutečnosti potřeboval přirozený logaritmus, ale protože /S ví, že ln 2 je zhruba 0.6931, vystačí si i s dvojkovým.) Nejprve tedy vzal uzly 16 a 32 s funkčními hodnotami 4 a 5 a sestrojil interpolační polynom (přímku) P(x) = j^x + 3, takže f (25) = y| = 4.5625. Kvůli zpřesnění výsledku přidal další uzel 8 s funkční hodnotou 3. V tomto případě vyšel interpolační polynom roven P(x) = — ^x2 + f^x + |, což dává P(25) = 4.7266. Franta chtěl výsledek ještě zpřesnit, přidal tedy rovnou dva uzly, a to 2 a 4 s funkčními hodnotami 1 a 2. Jaké však bylo jeho překvapení, když
250
KAPITOLA 5. ZŘÍZENÍ ZOO
Zřejmě musí být tyto polynomy až na konstantu rovny výrazům
(x - x0)... (x - x/_i)(x - xi+\)... (x - x„) a proto
ll/./'V' X/)'
Hledaný Lagrangeův interpolační polynom je pak dán vztahem
f(x) — y{)U)(x) + y\l\(x) H-----h y„l„(x).
Použití Lagrangeových polynomů je obzvlášť efektivní, když opakovaně prokládáme zadané hodnoty závislé proměnné y/ pro stále stejné hodnoty nezávislé proměnné x;. Pak totiž máme elementární polynomy U předem připraveny.
Toto vyjádření má nevýhodu ve velké citlivosti na nepřesnosti výpočtu při malých rozdílech zadaných hodnot x;, protože se v něm těmito rozdíly dělí.
Další nepříjemností je velice špatná stabilita hodnot reálných nebo racionálních polynomů při zvětšující se hodnotě proměnné. Brzy budeme mít nástroje na přesný popis kvalitativního chování funkcí, nicméně i bez nich je zřejmé, že podle znaménka koeficientu u nejvyšší mocniny polynomu se hodnoty velice rychle při rostoucím x vydají buď do plus nebo mínus nekonečna. Ani toto znaménko koeficientu u nej vyššího stupně se ale u interpolačnflio polynomu při malých změnách prokládaných hodnot nechová stabilně. Názorně to vidíme na dvou obrázcích, kde je proloženo jedenáct hodnot funkce sin(x) s různými malými náhodnými změnami hodnot. Je na nich vynesena aproximovaná funkce, kolečka jsou malinko posunuté hodnoty a jimi proložený jednoznačně zadaný interpolační polynom. Zatímco uvnitř intervalu je aproximace vcelku dobrá, stabilita na okrajích je otřesná.
Kolem interpolačních polynomů existuje bohatá teorie, zájemce odkazujeme na speciální literaturu.
5.5. Poznámka. Numerická nestabilita způsobená případnou blízkostí (některých) z bodů x; je dobře viditelná i na systému rovnic z důkazu Věty 5.3. Při řešení systémů lineárních rovnic totiž nestabilita do značné míry souvisí s velikostí determinantu matice systému, tj. v našem případě Vandermondova determinantu. Ten umíme vcelku snadno přímo spočíst:
Lemma. Pro posloupnost po dvou různých skalárů xq, ..., xn e K platí
V(x0, ...,x„) = Y[ (xi - xk)-
mu vyšla hodnota P (25) = 5.892, která je určitě nesprávná vzhledem k tomu, že logaritmus je rostoucí funkce. Dokážete vysvětlit, kde se vzala taková chyba?
Řešení. Franta trochu pátral na internetu a zjistil, že chyba při interpolaci se dá vyjádřit ve tvaru
f(x) - Pn(x)
(x — x0)(x — X\) ... (x — xn)
(n + 1)!
kde bod § není znám, ale leží v intervalu daném nejmenším a největším uzlem. Člen v čitateli zlomku způsobuje, že přidávání dalších vzdálených uzlů přesnost spiše zhoršuje. □
5.8. O týden později potřeboval Franta určit VŤ". Napdlo ho problém otočit a použít tzv. inverzní interpolaci, tedy zaměnit roli uzlů a funkčních hodnot a určit přibližnou hodnotu vhodné funkce v nule. Jak postupoval?
Řešení. *Jl je nulový bod funkce x2 — 7. Franta vzal uzly x0 = 2, x\ = 2.5, X2 = 3, příslušné funkční hodnoty jsou -3, -0.75 a 2. Pak prohodil úlohu uzlů a funkčních hodnot a získal elementární Lagran-geovy polynomy
Z0(x)
(x + 0.75)(x -2) 4 (-3 + 0.75X-3-2) ~ 45'
16 2 16 32
--x--x H--,
99 99 33
6,3 9
—x1 H--x H--.
55 11 55
1
—x 9
2
15'
Pro V7 tak dostal přibližnou hodnotu 2 • Z0(0) + 2.5 • h (0) + 3 • Z2(0)
437 165
2.6485.
Doplňující otázky: Frantovi se do výpočtu jednoho elementráního polynomu vloudila chyba, pokuste se ji vypátrat. Má tato chyba vliv na výslednou hodnotou?
Jak bychom mohli využít také hodnotu derivace v bodě 2.5? □ 5.9. Nalezněte přirozený splajn 5, který splňuje podmínky
5(-l) = 0, 5(0) = 1, 5(1) = 0.
>k=0
Řešení. Hledaný přirozený splajn bude složen ze dvou kubických polynomů, jednoho, řekněme 5i, pro interval [—1,0], druhého, řekněme 52 pro interval [0, 1]. Slůvko „přirozený" navíc určuje, že hodnoty druhých derivací polynomů 5i, resp. 52, budou nulové v bodě — 1, resp. 1. Díky předepsané společné hodnotě v bodě 0 víme že absolutní člen obou polynomů je 1, ze symetrie úlohy plyne, že společná hodnota první derivace v bodě Oje nulová. Můžeme tedy psát 5i (x) = ax3 + bx2 + 1 a 52(x) = cx3 + dx2 + 1, pro neznámé reálné parametry a, b, c a d. Dosazením těchto tvarů do čtyř podmínek 5i (—1) =0,
251
KAPITOLA 5. ZŘÍZENÍ ZOO
Důkaz. Vztah dokážeme indukcí přes počet bodů x;. Evidentně je správný pro n = 1 (a pro n = 0 je úloha nezajímavá). Předpokládejme, že výsledek je správný pro n — 1, tj.
n-l
V(x0,...,X„-i)= Y[ (xi - xk)-
i>k=0
Nyní považujme hodnoty xq, ..., x„_i za pevné a hodnotu x„ po-nechme jako volnou proměnnou. Rozvojem determinantu podle posledního řádku (viz ??) obdržíme hledaný determinant jako polynom
(5.1) V(x0, ...,x„) = (xn)"V(x0, x„-i) - (x,,)"-1
Toto je polynom stupně n, protože víme, že jeho koeficient u (x„)" je nenulový dle indukčního předpokladu. Přitom bude zjevně nulový při dosazení kterékoliv hodnoty x„ = x; pro i < n, protože bude v takovém případě obsahovat původní determinant dva stejné řádky. Náš polynom tedy bude dělitelný výrazem
i%n xo)(xn Xl) • • • {xn Xft — l),
který má sám již stupeň n. Odtud vyplývá, že celý Vandermondův determinant coby polynom v proměnné x„ musí být tomuto výrazu roven až na konstantní násobek, tj.
V(x0, ..., xn) = c ■ (xn ~ x0)(xn - Xl) • • • (x„ - x„_i).
Porovnáním koeficientů u nej vyšší mocniny v (5.1) a tomto výrazu dostáváme
c = V(x0, x„_i) a tím je důkaz lemmatu ukončen. □
Opět tedy vidíme, že determinant bude velmi malý, pokud jsou malé vzdálenosti bodů x;.
5.6. Derivace polynomů. Zjistili jsme, že hodnoty polynomů s rostoucí proměnnou rychle míří k nekonečným hodnotám (viz také obrázky). Proto je zřejmé, že polynomy nemohou nikdy vhodně popisovat jakékoliv periodicky se opakující děje (jako jsou např. hodnoty goniometrických funkcí). Mohlo by se ale zdát, že podstatně lepší výsledky budeme alespoň mezi body x; dosahovat, když si budeme kromě hodnot funkce hlídat, jak rychle naše funkce v daných bodech rostou.
Za tímto účelem zavedeme (prozatím spíše intuitivně) pojem derivace pro polynomy. Můžeme přitom pracovat opět s reálnými, komplexními nebo racionálními polynomy. Rychlost růstu v bodě x € M pro reálný polynom fix) dobře vyjadřují podíly
fix + Ax) - fix)
(5.2)
Ax
a protože umíme spočíst (nad libovolným okruhem)
x1 +kxk 1 Ax-
(x + Ax)
dostaneme pro polynom fix) ve tvaru
/(i+Ai)-/(i) nx"_1Ax
(Ax)*,
■■ + (k_)xíiAx)k-l + -anx" H-----hflo výše vedený podíl
■ +(Axf
Ax
Ax +a\ — Ax
= na„xn 1 + (n
Ax
ix""2 H-----hfli + Ax(...)
kde výraz v závorce je polynomiálně závislý na Ax. Evidentně pro hodnoty Ax velice blízké nule dostaneme hodnotu libovolně blízkou následujícícmu výrazu:
5i"(—1) = 0, 52(1) = 0a52"(l) = 0 dostáváme čtyři lineární rovnice pro tyto parametry:
-a+b + \ = 0, -6a +2b = 0, c + d + \ = 0, 6c + 2d = 0.
Jejich vyřešením pak 5i(x) = —\x3 — |x2 + 1, S2(x) = \x3 — |x2 + 1. Celkem tedy
5(x)
_Ir3 _ 1^2
ix3-fx2 + l proxe[0, 1].
xl + 1 pro* € [-1,0],
□
5.10. Nalezněte splajn 5, který splňuje podmínky
5(-l) = 0, 5(0) = 1, 5(1) = 0, 5'(-l) = 1, 5'(1) = 1.
Řešení. Hledaný splajn se od splajnu z předchozí úlohy liší pouze hodnotami derivací v bodech — 1 a 1. Obdobně jako v předchozí úloze tak dostáváme části 5i a 52 splajnu ve tvaru 5i (x) = aŕ + bx2 + 1 a S2(x) = c ŕ + dx2 + 1, pro neznámé reálné parametry a, b, c ad. Dosazením do podmínek 5i(—1) = 0, 5j(—1) = 1, 52(1) = 0 a 5'2(1) = 1 dostáváme nyní soustavu
s resenim a funkce
-a+b + 1 =
3a — 2b =
c+d+1 =
3c + 2d =
-2, c = 3 a d
0,
1, 0, 1
-4, tedy hledaný splajn je
5(x)
3xJ
-x3 - 2x2 + 1 prox e [-1, 0],
4xz + 1 prox e [0,1].
□
5.11. Nalezněte polynom nejvýše druhého stupně, který v bodech
xq = —1, Xi = 1, X2 = 2 nabývá po řadě hodnot
yo = l, yi = -3, y2 = 4.
O
5.12. Sestrojte Lagrangeův interpolační polynom pro
Xi -2 -1 1 2
yi 1 -1 -1 1
252
KAPITOLA 5. ZŘÍZENÍ ZOO
Derivace polynomů
Derivací polynomu f(x) — anx" x rozumíme polynom
oo podle proměnné
f'(x) — na„x" 1 + (n — l)a„-ix" 2 + ■ ■ ■ + a\.
Z definice je jasné, že právě hodnota /'(xo) derivace polynomu nám dává dobré přiblížení jeho chování v okolí bodu xo. Přesněji řečeno, přímky
/(xo + Ax) - /(x0)
y —-r-(x - xo) + /(x0),
Ax
tj. sečny grafu polynomu procházející body [xq, /(xo)] a [xq + Ax, /(xo + Ax)] se, se zmenšujícím se Ax, přibližují přímce
y - f'(x0)(x - x0) + /(x0),
což tedy musí být tečna grafu polynomu /. Hovoříme o lineárním přiblížení polynomu / jeho tečnou.
Derivace polynomů je lineární zobrazení, které přiřazuje polynomům stupně nejvýše n polynomy stupně nejvýše n — 1.
Iterací této operace dostáváme druhé derivace /", třetí derivace /(3) a obecně po ^-násobném opakování polynom stupně n — k. Po n + 1 derivacích je výsledkem nulový polynom. Toto lineárním zobrazení je příkladem tzv. cyklického nilpotent-nflio zobrazení, která jsou podrobněji rozebírána v odstavci 3.32 o nilpotentních zobrazeních.
5.7. Hermiteův interpolační problém. Uvažme opět m + 1 po dvou různých reálných hodnot xo,..., xm,tj.x; / x j pro všechna i ^ j. Budeme chtít zase prokládat pomocí polynomů předem dané hodnoty, tentokrát ale ífe^^-i— budeme vedle hodnot předepisovat i první derivace. Tj. predpíšeme y/ a y'i pro všechna i. Hledáme polynom /, který bude nabývat těchto předepsaných hodnot a derivací.
Zcela analogicky jako u interpolace pouhých hodnot obdržíme
pro neznámé koeficienty polynomu f(x) — a„x" H-----hflo systém
2(m + 1) rovnic
fl0
+ x0fli H-----h (x0)"fl„ — yo
a0 +xmai H-----h (xm)"an
a\ + 2xofl2 + • • • + n(xo)"_1fln
ym
y0
Pak uveďte libovolný polynom vyššího než třetího stupně, jenž vyhovuje podmínkám uvedeným v tabulce. O
5.13. Nalezněte polynom p(x) = ax3 + bx2 +cx +d, pro který platí p(0) = l, />(!) = 0, p(2) = l, p(3) = \0.
O
5.14. Určete polynom p nejvýše třetího stupně splňující
p(0) = 2, p{\) = 3, p(2) = 12, p(5) = 147.
O
5.15. Nechť jsou libovolně zvoleny hodnoty yo, ■ ■ ■, y„ e M v navzájem různých bodech x0,..., x„ é1. Kolik existuje polynomů stupně právě n + í, které nabývají v uvedených bodech zadaných hodnot? O
5.16. Stanovte Hermiteovy interpolační polynomy P, Q, jestliže má být
P(-l) = -ll, P(l) = l, P'(-l) = 12, P'(l)=4; <2(-l) = -9, G(l) = -1, <2'(-l) = 10, G'(l)=2.
O
5.17. Nahradte funkci / Hermiteovým polynomem, víte-li
Xi -1 1 2
f(Xi) f'(x0 4 8 -4 -8 -8 11
O
5.18. Bez počítání uvedte Hermiteův interpolační polynom, je-li požadováno, aby
x0 = o, X\ = 2, X2 = i,
yo = 0, y\ = 4, yi = i,
y'o = 0, y\ = 4, Á = 2.
2xma2 H-----h n(xm)n lan = /m
Opět bychom mohli ověřit, že při volbě n — 2m + 1 bude determinant tohoto systému rovnic nenulový a tudíž bude existovat právě jedno řešení. Nicméně, obdobně ke konstrukci Lagrangeova polynomu lze zkonstruovat takový polynom / přímo. Prostě si vytvoříme jednu sadu polynomů s hodnotami nula nebo jedna jak u derivací tak u hodnot, abychom jejich jednoduchou lineární kombinací uměli dosáhnout potřebné hodnoty. Ověření následující definice a tvrzení necháme na čtenáři:
O
5.19. Nalezněte polynom nejvýše třetího stupně, který v bodě x = 1 nabývá hodnoty y = 4, v bodě x = 2 hodnoty y = 9 a který má v bodě x = 0 derivaci rovnu —2, zatímco v bodě x = 1 je jeho derivace rovna 1. Poté určete polynom nejvýše třetího stupně, jenž v bodech x = lax = —1 nabývá hodnoty y = 6 a jenž má v bodě x = 1 a zároveň v bodě x = — 1 derivaci rovnu 2. O
253
KAPITOLA 5. ZŘÍZENÍ ZOO
Hermjteův interpolační polynom
Hermiteův interpolační polynom definujeme pomocí fundamentálních Hermiteových polynomů:
t"(Xi)
h\(x) =
1
(x - Xi)
(ii(x)Y
hj(x) = (x - Xi) (£i(x)Y
kde£(x) = nLi(
Xi). Tyto polynomy splňují:
1 pro i = j 0 pro i ŕ j
h] (Xj) = «/ =
(«•)'(*;) = 0
h2(Xj) = 0
(hf)'(xj) = H
a proto je Hermiteův interpolační polynom dán výrazem
f(x) = J2(yihUxi) + y,tf(xi'))
5.8. Příklady Hermiteových polynomů. Úplně nejjednodušší případ je zadání hodnoty a derivace v jediném bodě. Tím určíme beze zbytku polynom stupně jedna
/(*) = f(xo) + f'(x0)(x - x0)
tj. právě rovnici přímky zadané hodnotou a směrnicí v bodě xq. Když zadáme hodnotu a derivaci ve dvou bodech, tj. yo = f(xo), /o = f(xo), yi = f(xi), y\ = f'(xi) pro dva různé body xt, dostaneme ještě pořád snadno počítatelný problém.
Ukažme si jej ve zjednodušeném provedení, kdy xo = 0, x\ = 1. Pak matice systému a její inverze budou
/O 0 0 l\
1 0 \3
1 0
0/
(2 -2 1 1 \
-3 3 -2 -1
0 0 1 0
\1
o o
o/
Přímým vynásobením A ■ (yo, yi, yo, y)r pak vyjde vektor koeficientů («3, «2, «1, «o)r polynomu /, tj.
/(*) = (2y0-2yi + y0 + y1)x3
+ (-3yo + 3yi - 2y0 - y)x2 + y0x + y0.
5.9. Interpolace splajny. Obdobně můžeme předepisovat libo-volný konečný počet derivací v jednotlivých bodech X, a vhodnou volbou stupně polynomu obdržíme vždy jednoznačné interpolace. Nebudeme zde uvádět podrobnosti. Bohužel, u všech těchto interpolací pořád zůstávají problémy zmíněné už v případě jednoduchých interpolací hodnot - složitost výpočtů a nestabilita. Použití derivací však podbízí jednoduché vylepšení metodiky:
Jak jsme viděli na obrázcích demonstrujících nestabilitu interpolace jedním polynomem dostatečně vysokého stupně, malé lokální změny hodnot zapříčiňovaly dramatické celkové změny chování výsledného polynomu. Nabízí se tedy využití malých polynomiálních kousků nízkých stupňů, které ale musíme umět rozumně navazovat.
Nejjednodušší je propojení vždy dvou sousedních bodů polynomem stupně nejvýše jedna. Tak se nejčastěji zobrazují data. Z
5.20. Kolik existuje navzájem různých polynomů stupně nejvýše 4, které v bodech x0 = 5, x\ = 55 nabývají po řadě hodnot yo = 55, yi = 5 a jejichž první a druhá derivace v bodě x0 je nulová? O
5.21. Napište libovolný polynom P vyhovující těmto podmínkám:
P(0) = 6, P(l) = 4, P(2)=4, P'(2) = l.
O
5.22. Sestrojte přirozený kubický interpolační splajn pro body xo = — 1, x\ = 0, x2 = 1 a hodnoty yo = 1, yi = 0, y2 = 1 v těchto bodech.
O
5.23. Zkonstruujte přirozený kubický interpolační splajn pro funkci
/(x) = |x|, jce[-l,l], pokud jsou zvoleny body x0 = — 1, x\ = 0, x2 = 1. O
5.24. Napište přirozený kubický interpolační splajn pro body
xo = —3, x\ = 0, x2 = 3 a hodnoty y0 = -3, yx = 0, y2 = 3. O
5.25. Bez počítání uvedte přirozený kubický interpolační splajn pro body x0 = — 1, X! = 0 a x2 = 2 a hodnotu yo = yi = y2 = 1 v těchto bodech. O
5.26. Určete úplný kubický interpolační splajn pro body
Xo — —3, X\ = —2, X2 = —1
a pro hodnoty
j0 = 0, y\ = \, y2 = 2, /0 = 1, i2 = 1.
O
5.27. Sestrojte přirozený kubický interpolační splajn pro funkci
při volbě bodů
Xo = 0, X\ = 1, X2 = 3.
O
Více příkladů k interpolačním polynomům najdete na straně 308.
B. Topologie komplexních čísel a jejich podmnožin
5.28. Nalezněte hromadné, izolované, hraniční a vnitřní body množin N, , X = {x e R; 0 < x < 1} v R.
KAPITOLA 5. ZŘÍZENÍ ZOO
pohledu derivací to znamená, že budou na jednotlivých úsecích konstantní a pak se skokem změní.
O něco sofistikovanější možností je předepsat v každém bodě hodnotu a derivaci, tj. pro dva body budeme mít 4 hodnoty a jednoznačně tím určíme Hermiteův polynom 3. stupně, viz výše. Tento polynom pak můžeme použít pro všechny hodnoty nezávislé proměnné mezi krajními hodnotami xo < x\. Hovoříme o intervalu [xo, x i ]. Takové polynomiální přiblížení po kouskách už bude mít tu vlastnost, že první derivace na sebe budou navazovat.
V praxi ale není pouhé navazování první derivace dostatečné a navíc při naměřených datech nemíváme hodnoty derivací k dispozici. Přímo se proto vnucuje pokus využívat pouze zadané hodnoty ve dvou sousedních bodech, ale požadovat zároveň rovnost prvních i druhých derivací u sousedních kousků polynomů třetího stupně. To totiž bude znamenat stejné množství rovnic a neznámých a pravděpodobně tedy i obdobnou praktickou řešitelnost problému:
1_——_mmm^_J Kubické splajny ^____^) Nechť xo < xi < • • • < x„ jsou reálné hodnoty, ve kterých jsou zadány požadované hodnoty yo, ... ,y„. Kubickým inter-polačním splajnem pro toto zadání je funkce S : R -> R, která splňuje následující podmínky:
• zúžení S na interval [x;_i, x;] je polynom Si nejvýše třetího stupně, i = 1,..., n
• Si (xi-i) = yi-i a St (xí) = yt pro všechny i = l,...n,
• Si (xí) = Si+1 (xí) pro všechny / = 1,..., n — 1,
• S- (xí) = S'l+1 (xí) pro všechny / = 1, ..., n — 1.
J_
Kubický splajn1 pro n + 1 bodů sestává z n kubických polynomů, tj. máme k dispozici 4n volných parametrů (první definiční podmínka) .Další podmínky přitom zadávají 2n+(n — 1)+(n — 1) rovností, tj. dva parametry zůstávají volné. Při praktickém použití se dodávají předpisy pro derivace v krajních bodech, tzv. úplný splajn, nebo jsou tyto zadány jako nula, tzv. přirozený splajn.
Výpočet celého splajnu už není bohužel tak jednoduchý jako u nezávislých výpočtů Hermiteových polynomů třetího stupně, protože data se prolínají vždy mezi sousedními intervaly. Při vhodném uspořádání se však dosáhne matice systému, která má nenulové prvky prakticky jen ve třech diagonálách, a pro takové existují vhodné numerické postupy, které umožní splajn počítat také v čase úměrném počtu bodů. Pro srovnání se podívejme na interpolaci stejných dat jako v případě Lagrangeova polynomu, nyní pomocí splajnů:
Ošklivé české slovo „splajn" vzniklo fonetickým přepisem anglického ekvivalentu „spline", který znamenal tvárné pravítko užívané inženýry pro kreslení křivek.
Řešení. Množina N. Pro libovolné n e N očividně platí
Oi (n) n N = (n - 1, n + 1) n N = {n}.
Existuje tedy okolí bodu n e N v M, které obsahuje pouze jeden prvek množiny N (pochopitelně právě uvažované n), tj. každý bod n e N je izolovaný. Množina vnitřních bodů je proto prázdná (je-li bod izolovaný, nemůže být vnitřní). Bod a e M je pak hromadným bodem A právě tehdy, když každé jeho okolí obsahuje nekonečně mnoho bodů A. Ovšem množina
Oi (a) n N = (a - 1, a + 1) n N, přičemž a e R,
je konečná, z čehož plyne, že N hromadné body nemá. To, že tato množina je konečná, dále implikuje
8b := inf \b-n\ = inf \b-n\>0 pro b e R \ N.
neN neOi(b)nN
Odsud máme 0&b (b) n N = 0, tj. žádné b e R \ N není hraničním bodem N. Současně víme, že každý bod dané množiny, který není vnitřním bodem, je nutně jejím hraničním bodem. Množina hraničních bodů tak obsahuje N. Shrneme-li to, množina hraničních bodů N je N.
Množina Q. Racionální čísla tvoří tzv. hustou podmnožinu množiny všech reálných čísel. To znamená, že ke každému reálnému číslu konverguje posloupnost racionálních čísel (představme si např. nekonečný desetinný rozvoj reálného čísla a jemu odpovídající posloupnost, kdy v následujícím členu přidáváme další cifru rozvoje). O této posloupnosti lze navíc předpokládat, že všechny její členy jsou navzájem různé (na poslední pozici konečného desetinného rozvoje se můžeme záměrně dopouštět chyby nebo kupř. číslu 1 přiřadíme desetinný rozvoj 0, 999... apod.). Množina hromadných bodů Q v M je proto celé R a každý bod x e R \ Q je hraniční. Zvláště dostáváme, že libovolné á-okolí
kde p, q e Z, q ^0,
racionálního čísla p Iq musí obsahovat nekonečně mnoho racionálních čísel, což dává neexistenci izolovaných bodů. Číslo 72/10" není racionální pro žádné n e N. Předpokladem opaku (opět p, q sZ,q ^ 0)
ň\ = L. (j. V2 = 15>,
10" q J q
totiž okamžitě obdržíme spor - o číslu ~Jl víme, že není racionální. Libovolné okolí racionálního čísla p/q tak zároveň obsahuje nekonečně mnoho reálných čísel p/q + V2/10" (n e N), která nejsou racionální (množina Q jako těleso je uzavřená vzhledem k odečítání). Všechny body p/q e Q jsou tudíž rovněž hraniční a vnitřní body množina Q nemá.
255
KAPITOLA 5. ZŘÍZENÍ ZOO
0,5--4 \ -2 < / \ ' 2 14
\
\ ľ \
\ /: \ Z
V,:
2. Reálná čísla a limitní procesy
Je důležité mít dostatečně velkou zásobu funkcí, se kterými bude možné možné vyjadřovat všechny běžné závislosti, zároveň ale musí být výběr šikovně omezen, abychom uměli vybudovat nějaké univerzální a hlavně účinné nástroje pro práci s nimi.
Ve skutečnosti se budeme muset hned z kraje soustředit na to, jak vůbec hodnoty funkcí definovat, když pomocí konečně mnoha násobení a sčítání dostáváme jen polynomy a navíc skutečně počítat umíme jen s čísly racionálními. S těmi ale nevystačíme ani při počítání odmocnin, protože už \fl racionální číslo není.
Prvním naším krokem tedy musí být pořádné zavedení tzv. limitních procesů, tj. dáme přesný obsah tvrzením, že se nějaké hodnoty blíží jejich hodnotě hmitní.
Všimněme si také, že výraznou vlastností polynomů je jejich „spojitá" závislost hodnot na nezávislé proměnné. Intuitivně řečeno, když dostatečně málo změníme x, určitě se nám moc nezmění ani hodnota f(x). Takové chování naopak nemáme u po částech konstantních funkcí / : f-> Iv okolí „skoků". Např. u tzv. Heavisideovy funkce2
/(*) =
0 pro všechny x < 0, 1/2 pro x — 0,
1 pro všechny x > 0
taková „nespojitost" nastane pro x — 0.
Začneme formalizací takovýchto intuitivních výroků.
5.10. Reálná čísla. Prozatím jsme docela dobře vystačili s alge-;í',, braickými vlastnostmi reálných čísel, které říkaly, že R je pole. Už jsme ale používali i relaci uspořádání reálných |x čísel, kterou značíme „<" (viz odstavec 1.38). Vlastnosti (axiomy) reálných čísel, včetně souvislostí uspořádání a ostatních relací, jsou srhnuty v následující tabulce. Dělící čáry naznačují, jak axiomy postupně zaručují, že jsou reálná čísla komutativní grupou vůči sčítání, že R \ {0} je komutativní grupa vůči násobení, R je pole, množina R spolu s operacemi +, • a s relací uspořádání je tzv. uspořádané pole a konečně poslednímu axiomu můžeme rozumět tak, že M je „dostatečně husté", tj. nechybí nám tam body, jako např. chybí V2 v číslech racionálních.
Množina X = [0, 1). Nechť a e [0, 1) je zvoleno libovolně. Posloupnosti {a + {1 — \}^Li zjevně konvergují po řadě k hodnotám a, 1. Snadno jsme tak ukázali, že množina hromadných bodů obsahuje interval [0, 1]. Jiné hromadné body neexistují: pro jakékoli b <£ [0, 1] existuje 8 > 0 takové, že Os (b) n [0, 1] = 0 (pro b < 0 postačuje položit á = —baprob > 1 potom <5 = b—Y). Protože každý bod intervalu [0, 1) je hromadným bodem, množina izolovaných bodů je prázdná. Pro a e (0, 1) označme menší z kladných čísel a, 1 — a jako 8a. Uvážíme-li
0Sa (a) = (a-8a,a+8a)£ (0, 1), a € (0, 1),
vidíme, že libovolný bod intervalu (0, 1) je vnitřním bodem intervalu [0, 1). Pro každé S e (0, 1) je
os (0) n [0, i) = (-s, s) n [0, i) = [0, s),
o& (i) n [0, i) = (i - s, i + s) n [0, i) = (i - s, i),
tj. každé á-okolí bodu 0 obsahuje jisté body intervalu [0, 1) a hodnoty z intervalu (—8, 0) a každé á-okolí bodu 1 má neprázdný průnik s intervaly [0,1), [1,1+ <5). Body 0 a 1 jsou tedy hraničními body. Celkem jsme zjistili, že množina všech vnitřních bodů odpovídá intervalu (0, 1) a množina hraničních boduje {0, 1}. Stačí si uvědomit, že bod nemůže být současně vnitřní a hraniční a že hraniční bod musí být izolovaný, nebo hromadný. □
5.29. Určete suprema a infima množin v R:
A = (-3, 0]U(1,tt)U{6}; B
(-1)"
n e N ; C = (-9,
O
5.30. Nalezněte sup A a inf A pro
; n e N c
O
5.31. Jsou dány následující množiny:
N = {1,2, ...,n, ...}, M t7 = (0,2]U[3,5]\{4}. Určete inf N, sup M, inf J a sup J v R.
1
-; n e N
O
? Heaviside byl byl anglický inženýr, v matematice samouk, který ale .
5.32. Napište příklad množiny M c R, která nemá v R infimum, ale má zde supremum; a udejte příklad množiny N cR, která nemá v R supremum, ale má zde infimum. O
5.33. Uvedte podmnožinu X množiny R, pro kterou je sup X < inf X.
O
256
KAPITOLA 5. ZŘÍZENÍ ZOO
Axiomy reálných čísel
5.34. Udejte příklad množin A, B, C c R takových, aby platilo
(Rl
(R2; (R3
(R4;
(R5 (R6; (R7
(R8
(R9
(rio;
(Rll (R12
(a + b) + c — a + (b + c), pro všechny a, b, c e R a + b = b + a, pro všechny a, b e R existuje prvek 0 e M takový, že pro všechny a € M platí a + 0 — a
pro všechny a € M existuje opačný prvek (—a) e R takový, že platí a + (—a) — 0
a ■ b) ■ c — a ■ (b ■ c), pro všechny a, b, c e R a ■ b — b ■ a pro všechny a, b e R existuje prvek 1 € M takový, že pro všechny a e 1 • a — a
pro každý a e R, a / 0 existuje inverzní prvek a-1 e takový, že platí a ■ a~l — 1
(b + c)
■ b + a ■ c, pro všechny a,b,c e
relace < je úplné uspořádání, tj. reflexivní, antisymet-
rická, tranzitivní a úplná relace na R
pro všechny a,b,c e R platí, že z a < b vyplývá také
a + c < b + c
pro všechny a, b e R, a > 0, b > 0, platí také a ■ b > 0
(R13) každá neprázdná shora ohraničená množina A c supremum.
ma
Pojem supremum musíme ale také zavést pořádně. Má smysl pro každou uspořádanou množinu, tj. množinu s pevně zadanou relací uspořádání, a budeme se s ním takto i později setkávat ve více algebraických souvislostech. Připomeňme, že v obecné úrovni je uspořádáním jakákoliv binární relace na množině, která má vlastnosti reflexivity, antisymetrie a tranzitivity, viz odstavec 1.38.
_^Supremum a infimum
Definice. Uvažme podmnožinu A c B v uspořádané množině B. Horní závorou množiny A je každý prvek b e B, pro který platí, že b > a pro všechny a e A. Obdobně definujeme dolní závory množiny A jako prvky b e A takové, že b < a pro všechny a e A.
Nejmenší horní závora podmnožiny A, pokud existuje, se nazývá supremum této podmnožiny a značíme ji sup A. Obdobně, největší dolní závora, pokud existuje, se nazývá infimum, píšeme inf A.
Posledním axiomem v naší tabulce vlastností reálných čísel tedy předpokládáme, že pro každou množinu reálných čísel A platí, že pokud existuje nějaké číslo a větší nebo rovno než všechna x e A, pak existuje také nejmenší takové číslo a. Např. volbou A — {x € Q, x2 < 2} dostaneme jako její supremum sup A právě V2.
Okamžitým důsledkem je také existence infim pro každou zdola ohraničenou množinu reálných čísel (stačí si všimnout, že obrácením znaménka všech čísel zaměníme suprema a infima).
Pro formální výstavbu další teorie ale potřebujeme vědět, zda námi požadované vlastnosti reálných čísel lze realizovat, tj. zda existuje taková množina R s operacemi a relací uspořádání, které všech třináct axiomů skutečně splňují. Zatím jsem zkonstruovali korektně j en čísla racionální, která tvoří uspořádané pole, tj. splňují axiomy (Rl) - (R12), což si čtenář jistě snadno ověří.
Ve skutečnosti lze reálná čísla nejen zkonstruovat, ale také lze ukázat, že až na izomorfismus to jde jediným způsobem. Pro naši potřebu vystačíme s intuitivní představou reálné přímky. Jednoznačnosti i existenci se ještě budeme věnovat později.
ADB = 0, ARC = 0, SRC = 0, sup A = inf B = inf C = sup C.
O
'. platí 5.35. Vyznačte v komplexní rovině následující množiny:
i) {zeC||z-l| = |z + l|}
ii) {z e C| 1 < \z - i\ < 2},
iii) {z € C| Re(z2) = 1},
iv) {z e q Re(i) < ±}.
Řešení.
• imaginární osa,
• mezikruží okolo i,
• hyperbola a2 — b2 = 1,
• vnějšek jednotkového kruhu se středem v 1.
□
C. Limity
V následujících příkladech se budeme zabývat výpočtem limit posloupností, tedy tím, jak posloupnosti „vypadají v nekonečnu". Tj. pokud bychom chtěli předepsat n-tý člen posloupnosti pro hodně velké n, tak nám jej limita posloupnosti (pokud existuje) velmi dobře přiblíží. Limitám posloupností a posléze funkcí věnujeme v příkladovém sloupci hodně prostoru, proto s nimi začínáme dříve (a končíme později), než ve sloupci teorie.
Začněme s limitami posloupností. Potřebné definice nalezne čtenář na straně 258.
257
KAPITOLA 5. ZŘÍZENÍ ZOO
5.11. Komplexní rovina. Připomeňme, že komplexní čísla jsou dána jako dvojice reálnych čísel, které jsme zvyklí zapisovat jako z = rez + i im z. Dobrou představou o komplexních číslech je proto rovina C = M2. Se sčítáním a násobením splňuje pole komplexních čísel axiomy (R1)-(R9), není na nich ale žádným rozumným způsobem definováno uspořádání, které by naplnilo axiomy (R10)-R(13). Nicméně s nimi budeme také pracovat a již dříve jsme viděli, že rozšíření skalárů na komplexní čísla je často pro výpočty mimořádně užitečné nebo dokonce nutné.
Důležitou operací na komplexních čísel je tzv. konjugace. Je to zrcadlení podle přímky reálných čísel, tj. obrácení znaménka u imaginární složky. Značíme ji pruhem nad daným číslem z e C,
Protože je pro z
z -iy
rez — i ímz.
z • z
(x + iy)(x — iy) = x2 + yŕ
zadává nám tento výraz právě kvadrát vzdálenosti komplexního čísla od nuly. Odmocnině z tohoto reálného nezáporného čísla říkáme absolutní hodnota komplexního čísla z, píšeme
(5.3) |z|2 = z-ž.
Absolutní hodnotu máme definovánu také na každém uspořádaném poli skalárů K, prostě definujeme absolutní hodnotu \a \ takto
Ía je-li a > 0 —a je-li a < 0. Samozřejmě platí pro každá dvě čísla a, b e K
(5.4) |a + ŕ|<|fl| + |ŕ|.
Této vlastnosti říkáme trojúhelníková nerovnost a splňuje ji také absolutní hodnota komplexních čísel definovaná výše.
Zejména pro pole racionálních a reálných čísel, která jsou podmnožinami v komplexní rovině, zjevně obě definice absolutní hodnoty splývají.
5.12. Konvergence posloupností. V dalších odstavcích bu-v, deme pracovat s některým z číslených oborů K racionálních, reálných nebo komplexních čísel. V tomto kontextu je tedy třeba chápat absolutní hodnotu a skutečnost, že ve všech případech platí trojúhelníková nerovnost.
Budeme chtít formalizovat představu, že se hodnota nějakých čísel blíží dané limitě. Základním objektem pro nás proto budou posloupnosti čísel a;, kde index / bude zpravidla probíhat všechna přirozená čísla. Posloupnosti budeme zapisovat buď volně jako ao, a\,..., nebo jako nekonečné vektory (ao, a\,...), případně v obdobě k zápisu matic jako (a; )fl1.
_ -J Cauchyovské posloupnosti ^___»»_
Uvažme libovolnou posloupnost čísel (ao, a\,...) v K takovou, že pro libolné pevně zvolené kladné číslo e > 0 platí pro všechny dvojice prvků a;, a j posloupnosti, až na konečně mnoho výjimek (které závisí na volbě e),
Jinak řečeno, pro každé pevné e > 0 existuje index N takový, že předcházející nerovnost platí pro všechna i, j > N. Takové posloupnosti prvků se říká Cauchyovská posloupnost.
5.36. Spočítejte následující limity posloupností:
i) lim 2"2+3"+1,
iii) lim
n + l
n^oo 2«2+3« + l ' 2"-2-
V4^
-oo 2" +2-" '
24
iv) lim„
v) lim
vi) lim V4«2 + n — 2n.
Řešení.
i) iim 2»!±2»±i :
iii) lim ,
' n^oo 2«z+3« + l
iv)
lim
2«+3+J
lim ,
lim —-
n + „2
n „2
1 + i
oo.
lim „ o ,
„^oo 2«+3+-
2" - 2""
2" + 2_"
+ =0.
lim
2-n
2L. . i
2-n i 1
v) Podle věty o třech limitách (5.21): Vn e N : ^ < <
/4n2+n + ±
. Dále pak lim J*sL = lim ^ = 2, lim
/4«2+«+i!5
lim 22±i = 2. Tedy i lim = 2.
TI * TJ
vi)
lim V4n2 + n — 2n
lim
(V4«2 + n - 2«)(V4ř22 +n + 2n)
V4«2 + n + 2n
n
lim —-_
V4«2 + n + 2n
1
lim - _
1
+ 2
□
5.37. Buď c e R+ (kladné reálné číslo). Ukážeme, že lim tfč = 1.
Řešení. Uvažme nejprve c > 1. Funkce ^/č je vzhledem k n klesající a její hodnoty jsou stále větší než 1 a proto musí mít posloupnost limitu a tou je infimum jejich členů. Předpokládejme, že by tato Umita byla větší než 1, řekněme 1 + e, kde s > 0. Pak by podle definice limity byly všechny hodnoty dané posloupnosti od jistého m menší
2 2
než 1 + s + tj. zejména ^/c < 1 + s + Potom by však
což je spor s tím, že 1 + s je infimem dané posloupnosti.
< i/l+£ + —
1 + 2<1+£'
258
KAPITOLA 5. ZŘÍZENÍ ZOO
Intuitívne jistě cítíme, že buď jsou v takové posloupnosti všechny prvky stejné až na konečně mnoho z nich (pak bude od určitého indexu N počínaje vždy |a; — o/| — 0) nebo se taková posloupnost „hromadí" k nějaké hodnotě. Dobře je to představitelné v komplexní rovině: ať vybereme jakkoliv malý kruh (o poloměru e), tak se nám jej u Cauchyovské posloupnosti vždy musí podařit položit do komplexní roviny tak, že zakryje všechny body nekonečné posloupností a;, až na konečně mnoho z nich. Můžeme si pak představit, že postupným zmenšováním se kruh smrští až do jediné hodnoty a, viz obrázek.
n>os>LOurNo&r
Pokud by taková hodnota a e K pro Cauchyovskou posloupnost skutečně existovala, očekávali bychom od ní patrně následující vlastnost konvergence:
mmm^^__Konvergující posloupnost [..^^
Jestliže pro posloupnost čísel (ao,a\,...) v K, pevně zvolené číslo aela pro libovolné kladné reálné číslo e platí pro všechny i, až na konečně mnoho výjimek (závisejících na volbě e),
a\ < e,
říkáme, že posloupnost (a;)°^0 konverguje k hodnotě a. Číslu a říkáme limita posloupnosti (a;)°^0.
Jestliže nějaká posloupnost čísel a;■ e K, i — 0, 1,..., konverguje k číslu a e K, pak pro každé pevně zvolené kladné e víme, že \at■ — a\ < e pro všechna / větší než vhodné N e N. Pak ovšem, díky trojúhelníkové nerovností, pro každou dvojici indexů i, j > N dostáváme
\ai — aj \ — \at — apj + apj — aj \ < — | + |fl/v ~ aj \ < 2e. Dokázali jsme tedy:
Lemma. Každá konvergující posloupnost čísel je Cauchyovská.
V poli racionálních čísel se ovšem může snadno stát, že pro Cauchyovské posloupností příslušná hodnota a neexistuje. Např. číslo \/2 můžeme libovolně přesně přiblížit racionálními čísly a;, dostaneme tedy konvergentní posloupnost s limitou V2, ale samotná limita již není racionální.
Uspořádaná pole skalárů, ve kterém všechny Caychyovské posloupností konvergují, se nazývají úplná. Následující tvrzení říká, že axiom (R13) takové chování reálných čísel zaručuje:
Věta. Každá Cauchyovská posloupnost reálných čísel ai konverguje k reálné hodnotě a e M.
Důkaz. Každá Cauchyovská posloupnost je zjevně ohraničená množina, protože pro libovolnou volbu e ohraničíme všechny členy posloupností až ^s&štĚSPS na konečně mnoho z nich. Definujme si množinu B všech reálných čísel x, pro které platí x < aj pro všechny prvky a j posloupnosti, až na konečně mnoho z nich.
Zřejmě má B horní závoru, tudíž podle axiomu (R13) má i supremum. Definujme a — sup B. Nyní pro nějaké pevně zvolené
Pro c = 1 je tvrzení triviální a pro číslo c e (0, 1) plyne z předchozího, uvážíme-li tvrzení pro číslo l/c.
□
5.38. Stanovte
lim Vň.
Řešení. Zřejmě je tfň > l,n e N. Můžeme tedy položit
Vň = 1 + a„ pro jistá čísla a„ > 0, n e N. Užitím binomické věty získáváme
n = (1 + anf = 1 + Qo„ + Qfl2 + ••• + <, n > 2 (n e N).
Odsud plyne odhad (všechna čísla a„ jsou nezáporná)
t n (n — 1) t - ——z—-a2, n>2(/ieN),
n > 2 (n € N).
n > | 2 \a tj. po úpravě máme
000 ŕ7=>00 ŕ7=>00 y fl — 1
Obdrželi jsme tak výsledek
lim Vh~ = lim (1 + a„) = 1 + 0 = 1. Poznamenejme, že další užití Věty o třech limitách mj. dává
1 = lim 1 < lim V~c < lim Vň = 1 pro libovolné reálné číslo c > 1. 5.39. Určete limitu
lim (V2.y2.V2--- 2V2).
Řešení. Ke stanovení Umity postačuje její členy vyjádřit ve tvaru
□
22 • 2? • 2s ■■ -2^ = 22+?+s"
"2"
1.1.1 »2+4 + 8"
_ j_
"2"
Dostáváme tak
lim (V2 -Ví-Vi-.. 2V2) = lim 2
n—>oo \ / n—>oo
Pomocí známého vzorce pro součet geometrické řady je
E -L
E
IV
1-é
259
KAPITOLA 5. ZŘÍZENÍ ZOO
e > 0 zvolme N takové, aby |a; — aj\ < e pro všechny i, j > N. odkud plyne Zejména tedy aj > — e a a j < + e pro všechny indexy j > N, takže — e patří do B, zatímco + e už nikoliv. Souhrnně z toho dostávame, že \a — aN | < e, a proto také
lim
(fl-Tl-^íl--- 72)=21=2.
\a — aj I < \a — aN I + |fljv — aj I < 2e
pro všechny j > N. To ale značí právě, že a je limitou uvažované posloupnosti. □
Důsledek. Každá Cauchyovská posloupnost komplexních čísel zi konverguje k nějakému komplexnímu číslu z.
Důkaz. Pišme zi — at+i bi. Protože je |a;- — aj\2 < \zi —Zj\2 a podobně i pro hodnoty bi, jsou obě posloupnosti reálnych čísel a; a bi Cauchyovské. Existují tedy jejich limity a resp. b a snadno ověříme, že z — a + i b je limitou pro posloupnost z;. □
5.13. Poznámka. Předchozí diskuse nám dává návod na jeden
z možných postupů, jak korektně vybudovat reálná čísla. Postupujeme podobně jako při zúplňování přirozených čísel na celá (abychom přidali opačné hodnoty) a celých na racionální (abychom přidali podíly nenulových čísel). Tentokrát k racionálním číslům „přidáme" limity všech Cauchyovských posloupností.
Skutečně se podbízí zavést vhodně relaci ekvivalence na množině všech Cauchyovských posloupností racionálních čísel tak, že dvě Cauchyovské posloupnosti (a;)°^0 a (bi)f^0 jsou ekvivalentní, když vzdálenosti |a; — b i \ konvergují k nule (to je totéž jako požadavek, že jejich sloučením do jediné posloupnosti tak, že první posloupnost bude představovat Uché, zatímco druhá sudé členy výsledné posloupnosti) obdržíme opět posloupnost Cauchyovskou).
Nebudeme zde teď podrobně ověřovat, že jde o ekvivalenci, ani zavádět operace násobení a sčítání, ani dokazovat, že všechny požadované axiomy skutečně dojdou naplnění. Mohou se o to ale pokusit čtenáři samostatně, protože to není složité počínání. Všechny uvedené definice lze opřít o již existující sčítání a násobení jednotlivých členů posloupností, stejně jako definici vzdálenosti čísel. Jediný náročnější bod je v důkazu, že takto definovaných „nových" reálných čísel již bude dost, tj. že již bude platit axiom (R13) o existenci suprema. Tady je asi nejjednodušší ukázat, že každé úplné pole splňuje tento axiom, tj. že stačí ověřit, že Cauchyovské posloupnosti vždy konvergují (a to v našem případě již není složité). Stejně tak je docela snadné dokázat, že axiomy (R1)-(R13) definují reálné čísla jednoznačně až na izomorfismus, tj. až na bi-jektivní zobrazení, která zachovávají jak algebraické operace, tak uspořádání.
Ještě se k těmto poznámkám později vrátíme v souvislosti se zúplněním metrických prostorů, která budeme diskutovat ve druhé části 7. kapitoly na straně 429.
5.14. Uzavřené množiny. Pro další práci s reálnými nebo komplexními čísly budeme potřebovat podrobnější pochopení pojmů jako blízkost, omezenost, konvergence apod. Pro jakoukoliv podmnožinu
A bodů v K nás budou zajímat nejen její body a e A ale také body, ke kterým se umíme dostat limitně, tj. pomocí limit posloupností.
□
5.40. Stanovte
1 2
n — 2 n — 1
lim — + — + ••• + —— +
O
5.41. Vypočítejte
V«3 — \ \n2 + 2 + Ž/n1 — 2n5 — n3 — n + sin2 n
lim -^ -.
»^°° 2 - V5«4 + 2n3 + 5
O
5.42. Určete limitu
lim
n\ + (n -2)\- (n -4)! n50 +n\- (n - 1)!
O
5.43. Udejte příklad posloupností majících nevlastní limity se členy xn,yn,n eN, pro které je
lim (xn + yn) = 1, lim (xn y2\ = +oo.
5.44. Napište všechny hromadné body posloupnosti dané členy
(-l)"2n
O
V4«2 + 5n + 3
neN.
O
5.45. Spočtěte
je-li
lim sup an a lim inf an,
n2 + An — 5 9 nit
--- sin —, n e N.
n2+ 9 4
O
5.46. Určete
1 \" nit lim inf ( (-1)" ( 1 + - j + sin —
O
260
KAPITOLA 5. ZŘÍZENÍ ZOO
Hromadné body množiny
Uvažme jakoukoliv množinu A bodů v K. Bod x € K nazývame hromadný bod množiny A, jestliže existuje posloupnost a$,a\,... vybraná z prvků A, jejíž všechny členy jsou různé od x a která konverguje k hodnotě x.
Hromadné body podmnožiny A racionálních, reálnych nebo komplexních čísel jsou tedy ta čísla x, která jsou limitami takových posloupností čísel z A, které samotný bod x neobsahují. Všimněme si, že hromadný bod množiny do ní může, ale nemusí, patřit.
Pro každou neprázdnou množinu A c K a pevný bod x € K je množina všech vzdáleností |x — a\, a e A, zdola ohraničená množina reálnych čísel, má tedy infimum d(x, A), kterému říkáme vzdálenost bodu x od množiny A. Všimněme si, že d(x, A) = 0, právě když buď x e A nebo je x aspoň hromadným bodem A (dokažte si podrobně z definic).
_^mmm^_Uzavřené množiny
Uzáver Ä množiny A c K je množina všech bodů, které mají od A vzdálenost nulovou (všimněme si, že pro prázdnou množinu není vzdálenost bodů od ní definována, je tedy automaticky 0 = 0).
Uzavřená podmnožina v K je taková, která splývá se svým uzávěrem. Jsou to tedy právě množiny, které obsahují i všechny své hromadné body. Typickou uzavřenou množinou je tzv. uzavřený interval
[a, b] = {x e R, a < x < b} reálných čísel, kde a a b jsou daná reálná číslo.
Pokud některá z hraničních hodnot intervalu chybí, píšeme a = —oo (mínus nekonečno) nebo podobně b = +oo, a takové uzavřené intervaly značíme (—oo, b], [a, oo) a (—oo, oo).
Uzavřené množiny jsou tedy ty, které v sobě mají i vše, k čemu umí „dokonvergovat". Uzavřenou množinu bude tvořit např. posloupnost reálných čísel bez hromadného bodu nebo posloupnost s konečným počtem hromadných bodů spolu s těmito body. Uzavřený je také např. jednotkový kruh v rovině komplexních čísel včetně hraniční kružnice.
Snadno ověříme, že libovolný průnik a libo volné konečné sjednocení uzavřených množin opět uzavřená množina. Skutečně, pokud všechny body nějaké posloupnosti patří do průniku našeho systému množin, pak jistě patří do každé z nich a proto do každé z nich patří i všechny hromadné body. Pokud bychom ale chtěli totéž říci o obecném sjednocení systému množin A i, pak bychom neuspěli, protože např. jednobodové množiny jsou zjevně uzavřené, ale z nich utvořená posloupnost bodů už uzavřená nebývá. Pokud ale jde o konečné sjednocení množin a hromadný bod nějaké posloupnosti ležící v tomto sjednocení, pak takový hromadný bod musí být hromadným bodem i vybrané podposloupnosti, která ale už bude celá v jedné z našich množin. Každá je ale uzavřená, takže i hromadný bod do ní a tedy i celého sjednocení patří.
5.15. Otevřené množiny. Dalším užitečným příkladem podmnožin jsou otevřené intervaly reálných čísel
(a, b) = {x € R; a < x < b],
kde opět a i b jsou pevná reálná čísla nebo nekonečné hodnoty ±oo. Jde o typickou otevřenou množinu v následujícím smyslu:
5.47. Nyní přejděme k určování limit funkcí. Definice viz strana 264. Určete
(a)
(b)
(c)
(d)
lim sin x;
x^-jt/3
lim
X + X
2 x2 - 3x + 2'
lim arccos-
x^+qo V, X + 1
lim arctg —, lim arctg x , lim arctg (sin x) .
x^>— oo x x^—oo x^ — oo
Řešení. Případ (a). Připomeňme, že funkce je spojitá v jistém bodě, když je v tomto bodě její limita rovna funkční hodnotě. O funkci y = sinx však víme, že je spojitá na R. Dostáváme tak
,. . . TV V3
lim sin i = sin - = —.
x^n/3 3 2
Případ (b). Přímé dosazení x = 2 dává nulový čitatel i jmenovatel. Přesto je příklad velmi snadno řešitelný. Jednoduché krácení
lim
x + x
(x-2)(x + 3) x + 3 2 + 3 c lim-= lim-=-= 5
►2 x2 - 3x + 2 x^2 (x - 2) (x - 1) x'^2 X - 1 2-1 totiž vedlo ke správnému výsledku (díky spojitosti obdržené funkce v bodě x0 = 2). Uvědomme si zde, že limitu můžeme počítat pouze z funkčních hodnot v libovolně malém okolí daného bodu x0 a že přitom limita nezávisí na hodnotě přímo v tomto bodě. Při počítání limit tedy můžeme využívat krácení a rozšiřování výrazů, které nemění hodnoty uvažované funkce v libovolně zvoleném ryzím okolí bodu x0.
Případ (c). Dvojnásobná záměna pořadí limity a vnější funkce převádí původní limitu na
3
(arccos ( lim -
^ \*->-|-oo X + 1
Lehce určíme, že
lim
1
0.
>+oo X + 1
Neboť je funkce y = arccos x spojitá v bodě 0, ve kterém nabývá hodnoty 7t/2, a funkce y = x3 je spojitá v bodě 7t/2, platí
3 / / i \ \ 3
lim (arccos-| = (arccos ( lim - | | = (
:^+cx) \ X + 1/ V \x^+ck x + 1 // V
Případ (d). Funkce y = arctg x má vlastnosti „užitečné při počítání limit" - je spojitá a prostá (rostoucí) na celé reálné ose. Tyto vlastnosti
261
KAPITOLA 5. ZŘÍZENÍ ZOO
„J Otevřené množiny a okolí bodů ^.
Otevřená množina v K je taková množina, jejíž doplněk je uzavřenou množinou.
Okolím bodu a e K nazývame libovolnou otevřenou množinu O, která a obsahuje. Je-li okolí definované jako
Os(a) = {x e K, |x - a\ < 8}
pro kladné číslo S, hovoříme o S-okolí bodu a.
Všimněme si, že pro libovolnou množinu A je a e K hromadným bodem A, právě když v libovolném okolí a leží také alespoň jeden bod b e A, b / a.
Lemma. Množina čísel A C K je otevřená, právě když každý její bod a e A do ní patří i s nějakým svým okolím.
Důkaz. Nechť je A otevřená a a e A. Kdyby neexistovalo žádné okolí bodu a uvnitř A, musela by existovat posloupnost an A, \a — a„ \ o sin2(x2) 2
Předchozí výpočet je nutné chápat „odzadu". Protože existují limity na pravé straně (ať už vlastní či nevlastní) a výraz \ ■ oo má smysl (viz Poznámka za větou 5.22), existuje i původní Umita. Kdybychom původní limitu rozdělili na součin Umit
1
lim(l - cosx) • lim ,
x^o x^o xz sm(xz)
jednalo by se o součin typu 0 • oo, tedy nedefinovaný výraz, ale tento fakt nevypovídá nic o exitenci původní Umity. □
5.49. Určete následující limity:
1
i) lim. iii) lim
x^2
x-2 Jx2-4
, ii) lim
x^O '
sin(sin x)
x^O
iv) lim^o'?*
Řešení.
i) lim
2 VÄ
lim
>2 V(x -2)(x +2)
... ,. x-2 (5.27),. sin y ii) lim —== = lim-
x^2 ^Jx2 _ 4 y^O y
~Jx - 2
lim
x^2 Vx + 2
1,
kde jsme využili toho, že lim sinx = 0.
x^O
sin2 x sin x iii) lim-= lim sinx • lim-=0-1=0,
x^0 X x^0 x^0 X
opět původní limita existuje, protože existují obě Umity na pravé straně rovnosti a jejich součin je definován.
262
KAPITOLA 5. ZŘÍZENÍ ZOO
5.17. Věta. Pro podmnožiny A reálnych čísel platí:
(1) neprázdná množina A je otevřená, právě když je sjednocením nejvýše spočetného systému otevřených intervalů,
(2) každý bod a e A je buď vnitřní nebo hraniční,
(3) každý hraniční bod množiny A je buď izolovaným nebo hromadným bodem A,
(4) A je kompaktní, právě když každá v ní obsažená nekonečná posloupnost má podposloupnost konvergující k bodu v A,
(5) A je kompaktní, právě když každé její otevřené pokrytí obsahuje konečné podpokrytí.
Důkaz. (1) Zjevně je každá otevřená množina sjednocením nějakých okolí svých bodů, tj. otevřených intervalů. Jde tedy pouze o to, jestli nám jich vždy stačí spočetně » mnoho. Zkusme tedy najít „co největší" intervaly. Řekneme, že body a, b e A jsou v relaci, jestliže celý otevřený interval (minfa, b], maxfa, b}) je podmnožinou v A. To je zjevně relace ekvivalence (otevřený interval (a, a) je prázdná množina a ta je podmnožinou, symetrie relace i tranzitivita jsou zřejmé). Třídy této ekvivalence budou zjevně intervaly, které budou navíc po dvou disjunktní. Každý z těchto intervalů jistě musí obsahovat nějaké racionální číslo a tyto musí být různé. Všech racionálních čísel je ale spočetně mnoho, proto máme tvrzení dokázané.
(2) Přímo z definic vyplývá, že bod nemůže být vnitřní a hraniční zároveň. Nechť tedy a e A není vnitřní. Pak ovšem existuje posloupnost bodů a; ^ As hromadným bodem a. Zároveň a patří do každého svého okolí. Proto je a hraniční.
(3) Předpokládejme, že a e A je hraniční a není izolovaný. Pak stejně jako v argumentaci předchozího odstavce existují body a;, tentokrát uvnitř A, jejichž hromadným bodem je a.
(4) Předpokládejme, že je A kompaktní, tj. uzavřená a ohraničená, a uvažme nějakou nekonečnou posloupnost bodů a/ e A. Tato podmnožina má jistě supremum b i infimum a (nebo můžeme zvolit libovolnou horní a dolní závoru množiny A). Rozdělme nyní interval [a, b] přesně na dvě poloviny [a, j (b — a)] a [ j (b — a), b]. V alespoň jedné z nich musí být nekonečně mnoho prvků a,. Vyberme takovou polovinu, jeden z prvků v ní obsažených a následně tento vybraný interval opět rozdělme na poloviny. Pak znovu vybereme tu polovinu, kde je nekonečně mnoho prvků posloupnosti a vybereme si jeden z nich. Tímto způsobem dostaneme posloupnost, která bude Cauchyovská (dokažte si detailně - vyžaduje to jen pozorné hraní si s odhady, podobně jako výše). O Cauchyovských posloupnostech ovšem už víme, že mají
i v) Při výpočtu této limity musíme být obezřetní, protože obě jednostranné limity v bodě nula existují, jejich hodnoty se však liší, zkoumaná limita tedy neexistuje:
lim e
x^0+
lim e
oo,
□
5.50.
Určete
(a) lim*
(c) lim*
x+2 >2 (x-2f '
(b) iiiii*^z (x_2)S, >+0o(2 + i);, (d) lim*^+0ox-*. Řešení.
V tomto příkladu se budeme věnovat tzv. neurčitým výrazům.
Přesněji řečeno, budeme se zabývat situacemi, kdy se o ně nejedná. Čtenáři doporučujeme, aby neurčité výrazy vnímal jako pojem pomocný, který mu má pouze usnadnit orientování se při prvním počítání limit, neboť obdržený neurčitý výraz pouze znamená, že jsme „nic nezjistili". Víme, že limita součtu je součet limit, limita součinu je součin limit a že limita podílu je podíl limit, pokud jednotlivé limity existují a nezískáme-li některý z výrazů oo—oo, 0-oo, 0/0, oo/oo, o kterých právě hovoříme jako o neurčitých. Pro úplnost dodejme, že tato pravidla můžeme kombinovat (pro limity všech složek určené současně) a že za neurčitý výraz pak považujeme také ten, jenž obsahuje alespoň jeden neurčitý výraz. Např. tedy výrazy
-00 + 00 = 00 - 00, ŤŤ22- = - —,
' 3+00 00'
O-(oo-oo)"1
lim* lim*
x+2
(—oo)3+oo
označujeme jako neurčité a o výrazech
0
0
-00 — 00,
3 + 00 (—oo)3
00
můžeme říci, že jsou „určité" (pro ně jsme schopni ihned příslušnou limitu stanovit - výrazy odpovídají po řadě hodnotám —00, 0, 0).
V případě (a) podíl limit čitatele a jmenovatele dává výraz 4/0. Zápis, ve kterém dělíme nulou, je sám o sobě přinejmenším nežádoucí (později bychom se mu měli být schopni vyvarovat). Přesto nám umožní stanovit výsledek: nejedná se o neurčitý výraz. Všimněme si, že jmenovatel se blíží k nule zprava (pro x ^ 2 je (x — 2)6 > 0). To zapisujeme jako 4/ + 0. Čitatel a jmenovatel tak mají stejné znaménko v jistém ryzím okolí bodu xq = 2 a lze říci, že jmenovatel je v limitě „nekonečněkrát menší" než čitatel, tj.
x + 2
lim
►2 (x - 2)6
+00,
263
KAPITOLA 5. ZŘÍZENÍ ZOO
vždy hromadné body nebo jsou konstantní až na konečně mnoho výjimek. Existuje tedy podposloupnost s námi hledanou limitou. Z uzavřenosti A zase vyplývá, že námi nalezený bod musí opět ležet v A.
Opačně, jestliže každá v A obsažená nekonečná podmnožina má hromadný bod v A, znamená to, že všechny hromadné body jsou v A a tedy je A uzavřená. Pokud by nebyla množina A zároveň ohraničená, uměli bychom najít posloupnost stále rostoucí nebo klesající s rozdíly dvou po sobě jdoucích čísel třeba alespoň 1. Taková posloupnost bodů z A ale nemůže mít hromadný bod vůbec.
(5) Nejprve se věnujme snadnější implikaci, tj. předpokládejme, že z každého otevřeného pokrytí lze vybrat konečné a dokazujme, že pak A je uzavřená i ohraničená. Jistě lze A pokrýt spočetným systémem intervalů /„ = (n — 2, n + 2), n e Z, a jakýkoliv výběr konečného podpokrytí z nich říká, že je množina A ohraničená.
Předpokládejme nyní, že a e R \ A je hromadným bodem posloupnosti cit e A a předpokládejme rovnou, že \a — ci„ \ < -\ (jinak bychom mohli vybrat takovou podposloupnost). Množiny
1 1
J„ —R\[a--, a + -]
n n
pro všechny n e N, n > 0, jsou sjednocení dvou otevřených intervalů a jistě také pokrývají naši množinu A. Protože je možné vybrat konečné pokrytí A, bod a je uvnitř doplňku R \ A včetně nějakého svého okolí a není tedy hromadným bodem. Proto musí být všechny hromadné body A opět v A a tato množina je i uzavřená.
Opačný směr důkazu je založený na existenci a vlastnostech suprema. Předpokládejme, že je A kompaktní a že je dáno nějaké její otevřené pokrytí C. Z předchozího je zjevné, že v A existují nej větší a nejmenší prvek, které jsou zároveň rovny b — sup A a a — inf A. Označme si teď „nejzašší mez", pro kterou ještě půjde konečné pokrytí z C vybrat, tj. definujeme množinu
B — {x e [a, b], existuje konečné podpokrytí [a, x] n A}.
Evidentně a e B, jde tedy o neprázdnou shora ohraničenou množinu a existuje proto c — sup B. Jde nám o to dokázat, že ve skutečnosti musí být c — b.
Argumentace je trochu nepřehledná, dokud si ji nenačrtneme na obrázku, podstata je ale snadná: Víme, že a < c < b, předpokládejme tedy chvíli, že c < bac ^ A. Protože je R \ A otevřená, pro c <£ A existuje okolí bodu c obsažené v[ci,b]a zároveň disjunktní s A. To by ale vylučovalo možnost c — sup B.
Zbývá tedy v takovém případě c < b a c e A a tedy je i nějaké okolí O bodu c v otevřeném pokrytí C. Zvolme si body p < c < q v O. Opět nyní bude existovat konečné pokrytí pro [a, q] n A. To ale značí, že q > c leží v B, což není možné. Původní volba c < b tedy vedla ke sporu, což dokazuje požadovanou rovnost b — c. Nyní ale s pomocí okolí b, které patří do C umíme najít konečné pokrytí v C pro celé A. □
5.18. Limity funkcí a posloupností. Pro diskusi limit je vhodné rozšířit množinu reálných čísel R o dvě nekonečné hodnoty ±oo, tak jak jsme to už dělali při označování intervalů.
což odpovídá položení 4/ + 0 = +oo (podobně se klade 4/ — 0 = — oo).
Při určování druhé limity lze postupovat analogicky. Protože čísla a s r a a5 mají stejná znaménka, dostáváme
x + 2 x + 2
lim
+oo 7^ —oo
lim
- >T+ (x - 2)5 ~" ' "~ ^ xTi- (x - 2)5'
tj. oboustranná limita neexistuje. Tomu odpovídá zápis 4/ ± 0 (nebo obecnější a/ ± 0, a ^ 0, a e r*), který je „určitým výrazem". Při důsledném oddělování symbolů +0 a —0 od ±0 vždy a/±0 pro a ^ 0 znamená, že limita neexistuje.
Případy (c), (d). Je-li f(x) > 0 pro všechna uvažovaná x e r, platí
f(x)g{x) = eHf(x)S(x^ = e*w'ln f(x).
Využijeme-li toho, že exponenciální funkce je spojitá a prostá na reálné přímce, můžeme nahradit limitu
za
lim f{x)
X—>XQ
lim (g(x)-lnf(x))
Připomeňme, že jedna z těchto limit existuje právě tehdy, když existuje druhá; a doplňme
X^-XQ
= a € r = lim fix)g(x) X^-Xq = efl,
) = +oo = lim fix)g{x) X—>X{) = +oo
) = —oo = lim fix)g{x) X—>X{) = 0.
Můžeme tudíž psát
lim fix)g(x)
X^-Xq
lim g(x)- lim ln f(x)
X—^a'Q X—^a'Q
jestliže obě limity vpravo existují a neobdržíme-Li neurčitý výraz 0 • oo. Není obtížné si uvědomit, že tento neurčitý výraz lze získat pouze ve třech případech odpovídajících zbylým neurčitým výrazům 0°, oo°, 1°°, kdy postupně je
lim fix) =0 a
X^XQ
lim fix) = +oo a lim fix) = 1 a
X^XQ
lim gix) = 0,
X^XQ
lim gix) = 0,
X^XQ
lim gix) = ±oo.
X^-XQ
V ostatních případech nám tedy znalost (a pochopitelně existence) limit
lim fix), lim g{x)
X^XQ X^XQ
umožňuje uvést výsledek (při dodefinování některých zápisů)
lim fix)
X—>XQ
lim fix)
X—>XQ
lim g(x)
264
KAPITOLA 5. ZŘÍZENÍ ZOO
Okolím nekonečna rozumíme interval (a, oo), resp. (—00, a) je okolí —00. Pojem hromadného bodu množin rozšiřujeme tak, že 00 je hromadným bodem množiny A c M jestliže každé okolí 00 s ní má neprázdný průnik, tj. jestliže je A shora neohraničená. Obdobně pro —00. Hovoříme o nevlastních hromadných bodech množiny A.
_—^m^m^mm j „počítání se nekonečny" ^_iBHa,
Protože
Zavádíme i pravidla pro počítání s formálně přidanými hodnotami ±00 a pro libovolná „konečná" čísla a e R:
a + 00 = 00 a — 00 — —00 a ■ 00 — 00, je-li a > 0 a ■ 00 — —00, je-li a < 0 a ■ (—00) — —00, je-li a > 0 a ■ (—00) — 00, je-li a < 0
n
— 0, pro všechna a / 0.
±00
Následující definice pokrývá mnoho případů limitních procesů a bude třeba ji zvládnout dokonale. Jednotlivými případy se budeme podrobně zabývat v zápětí.
mmm^m,___( Reálné a komplexní limity
Definice. Uvažme libovolnou podmnožinu A c M a reálnou funkci / : A -> R, případně komplexní funkci / : A -> C, definovanou na A. Uvažme dále hromadný bod xo množiny A (tj. buď reálné číslo nebo případně ±00).
Říkáme, že / má v xq limitu a e R, případně komplexní limitu a e C, a píšeme
lim f(x) — a,
jestliže pro každé okolí O (a) bodu a lze najít okolí O(xq) bodu xo takové, že pro všechny x e A n (O(xq) \ {xo}) je f(x) e O (a).
V případě reálné funkce může také být limitní hodnotou a — ±00 a v takovém případě se limita a reálné funkce nazývá nevlastní. V případě a € M je o limitu vlastní.
Je důležité si všimnout, že hodnota / v bodě xo v definici nevystupuje a / v tomto hromadném bodě vůbec nemusí být definována (a v případě nevlastního hromadného bodu ani nemůže)! Často také hovoříme o ryzím okolí O(x) \ {x}, ve kterém nás funkční hodnoty zajímají.
Nevlastní limity komplexních funkcí zatím definovat nebudeme.
5.19. Nejčastější varianty definičních oborů. Naše definice limity pokrývá zdánlivě velice rozdílné koncepty:
(1) Limity posloupností. Jestliže je A — N, tj. funkce / je definována pouze pro přirozená čísla, hovoříme o limitách posloupností reálných nebo komplexních čísel. Jediným hromadným bodem definičního oboru A je pak 00 a zpravidla píšeme hodnoty poslounosti f{n) — a„& limitu ve tvaru
lim a„ — a.
je
1\ 1 lim I 2 H— 1=2, lim — = 0, lim x = +00,
x^+00 \ x J x^+00 x x^+00
lim (2 + - ) =2° = 1,
x^+00 \ x
lim x
x^>+oc
lim
X^+QO \ X
nebo
lim x x = lim (xř) =0.
Poslední výsledek pak bychom mohli vyjádřit zápisem O00 = 0 či 0000 = 00, oo-1 = 0 (zdůrazněme, že se nejedná o neurčité výrazy).
Přestože jsme kladli důraz na to, aby čtenář raději upřednostňoval úvahy o limitním chování funkcí před škatulkováním výrazů na určité a neurčité (a tyto pojmy vnímal jen jako pomocné), je snad dobře patrný důvod, proč se budeme nadále zabývat především neurčitými výrazy. □
5.51. Vypočítejte
smx + 77" x lim --;
x^+00 2 cosx — 1 — x2
lim
3*+i + xs _ 4X
lim
lim
x^>+oc
+00 3X + 2X + x2 ' 4X - 8x6 - 2X - 167 _ 3X - 45x - Vňjtx+n' ~Jx — sin3 x + x arctg x
Vl + 2x + x2
Řešení. Vydělíme-li v případě první z limit čitatele i jmenovatele polynomem x2, obdržíme
lim
Sinx + 7tx
lim
r2
+ 7z
x^+oo 2 COSX — 1 — X2 X^+QO
Ohraničenost výrazů
2 COS X — 1 r2
1
I sin x I < 1, 12 cos x — 11 < 3 pro x e a x2 -» +00 pro x -» +00 pak dávají výsledek
lim
x^>+oc
Slil i _ .
—T +X 0 + JT
2 cos x — 1 r2
1 0-1
-7t.
V předešlé úvaze jsme vlastně použili Větu o třech limitách a zápis c/00 = 0 platný pro c e M (nebo přímo ohr./oo = 0, kde „ohr." značí ohraničenou funkci).
265
KAPITOLA 5. ZŘÍZENÍ ZOO
Podle definice to pak znamená, že pro každé okolí O (a) limitní hodnoty a existuje index N e N takový, že a„ e O (a) pro všechny n > N. Ve skutečnosti jsme tedy v tomto speciálním případě přeformulovali definici konvergence posloupnosti (viz 5.12). Přidali jsme pouze možnost nevlastních limit. Říkáme také, že posloupnost an konverguje k a.
Přímo z naší definice pro komplexní hodnoty je opět vidět, že komplexní posloupnost má limitu a, právě když reálné části a; konvergují k re a a zároveň imaginární části konvergují k im a.
(2) Limita funkce ve vnitřním bodě intervalu. Jestliže je / definována na intervalu A — (a, b) a xo je vnitřním bodem tohoto intervalu, hovoříme o limitě funkce ve vnitřním bodě jejího definičního oboru. Většinou v tomto případě píšeme
lim fix) — a.
Podívejme se, proč je důležité v definici požadovat fix) e O (a) pouze pro body x / xo i v tomto případě. Vezměme jako příklad funkci / : M -* M
/(*) =
10 je-li x / 0 1 je-li x = 0.
Pak zjevně limita v nule je dobře definována a v souladu s naším očekáváním bude lim^o fix) — 0, přestože hodnota /(O) — 1 do malých okolí hmitní hodnoty 0 nepatří.
(3) Limity funkce zprava a zleva. Je-li A — [a,b] ohraničený interval a xo — a nebo xo — b, hovoříme o limitě zprava, resp. zleva, funkce / v bodě xq.
Jestliže je bod xo vnitřním bodem definičního oboru funkce /, můžeme pro účely výpočtu limity definiční obor zúžit na [xo, b] nebo [a, xo]. Výsledným limitám pak také říkáme limita zprava, resp. limita zleva pro funkci / v bodě xo. Označujeme je výrazy \m\x^x+ fix), resp. lim^^- fix). Jako příklad nám může sloužit limita zprava a zleva v xo — 0 pro Heavisideovu funkci h z úvodu této části. Evidentně je
lim h(x)
1,
lim h(x)
0.
Limita líního fix) přitom neexistuje.
Přímo z našich definic je zjevné, že limita ve vnitřním bodu definičního oboru libovolné reálné funkce / existuje, právě když existují limity zprava i zleva a jsou si rovny.
Tento postup lze zobecnit. Pro limitu tvaru
Mx) + f2(x) + ••• + /„ (x)
lim
pncemz
x0 glix) + g2(x) H----+ gn(x)
fi(x)
lim
x^x0 f\ (x)
,. gi(x) lim
0, 0,
i e {2, i e {2,
m
platí
lim
*^*o gi (x)
/!(x) + /2(x) + ... + /m(x)
lim
x^x0 gl(x)
>*o giix) + g2(x) H----+ g„ix)
pokud limita na pravé straně existuje. Je přitom výhodné si uvědomit (třetí z limit lze určit např. pomocí 1'Hospitalova pravidla, se kterým se seznámíme později), že
a f> x
C
lim —
X^+QO X™
0, lim —
X^+QO x"
0, lim —
x^+oo ax
0, lim
X—>-\-OQ
0
pro
c e
0 < a < j6, 1 < a <
Odtud ihned plyne
lim
4x
+oc y + 2X + x2 4X - 8x6 - 2X
= lim
x^>+oc
167
3-3*
lim
x^+0o y _ 45x _ Jii^x+n Uvědorníme-U si, že je
lim
x^>+oc
Ujt
12
-oo.
lim arctgx = — > 1,
X^+QO 2
stejně snadno dostaneme
lim
x^>+oc
x — sin x + x arctg x Vl +2x +x2
lim
x^>+oc
x arctg x
lim arctg x
x^+oo
□
5.20. Další příklady limit. (1) Limita komplexní funkce / : A —>• C existuje tehdy a jen tehdy, jestliže existují limity její reálné a imaginární části. V takovém případě je pak
lim fix)
x—>xq
lim (re/(x))
x^xq
i lim (im fix)).
x^xq
Důkaz je přímočarý a vychází přímo z definice vzdáleností a okolí bodů v komplexní rovině. Skutečně, příslušnost do á-okolí komplexní hodnoty z je zajištěna pomocí reálných (l/\/2)Xq
/(xo).
5.52. Určete limity lim
1 1 1
lim
1-2 2-3 3-4
1 1
+
1
+ ••• +
(n — l) ■ n 1
.Vra2 + 1 Vra2 +2 Vra2 + n,
Řešení. Neboť pro každé přirozené číslo k > 2 je (provádíme tzv. rozklad na parciální zlomky - budeme jej probírat u integrování racionálních lomených funkcí)
1 _ 1 1
ik-l)k ~ k - 1 ~ ť
266
KAPITOLA 5. ZŘÍZENÍ ZOO
flo, pak roznásobením platí
Skutečně, je-li f (x) — anx" + ■■ (xQ+S)k — x^+£ q). Za &k si zvolíme minimum ze vzdáleností bodu x od hranic těchto intervalů pro uvažovaná m menší než k. Samozřejmě vždy platí St < j-
Uvažme nyní nějaké e > 0 a k taková, že £ < e. Pak pro všechna y v ryzím á-okolí bodu x je buď f(y) — 0, jde-li o iracionální hodnotu, nebo f(y) < j pro r > k, jde-li o hodnotu racionální. V každém případě je tedy \f(y)\ < e.
Tato funkce má proto limitu ve všech reálných bodech x nulovou. Jen v iracionálních bodech je ale tato limita rovna funkční hodnotě.
5.21. Věta (O třech hmitách). Buďte f, g, h reálné funkce se shodným definičním oborem A a takové, že existuje ryzí okolí hromadného bodu io e I definičního oboru, kde platí
/lil 1
lim--1---1---1-----1--
».-►oo V1-2 2-3 3-4 (n-l)-n
/1 1 1 1 1 1 1 1
lim----1-----1-----1-----1----
n^ooVl 22334 n-l n
lim ( 1 - - ) = 1.
Poznamenejme, že stanovení této limity je důležité: určuje součet jedné z tzv. teleskopických řad (se kterou pracoval již Johann I. Bernoulli).
Ke stanovení druhé limity využijeme Větu o třech limitách. Odhady
1 11 In
+•••+-== > +••• +
i
:+••• + ■
\Jn2 + n V«2 + n 1 1
V«2 + 1 V«2 +n V«2 + 1
pro n s N dávají
+ ••• +
V«2 + n V«2 + n 1 n
V«2 +1 V«2 + i
lim
< lim
< lim
V«2 + n n^°° \V«2 + 1 n
1
+ ••• +
V«2 +
Protože
n
lim —-==
V«2 + n
je rovněž
lim
n n 1, lim —-== = lim —-=
V«2 + 1 V«2
1,
lim
1 1
+
V«2 + 1 V«2 + 2
+ ••• +
1
V«2 + n
□
f (x) < g (x) < h(x). Potom, pokud existují limity
lim f (x) — fo, lim h (x) = h0
X^XQ X^XQ
a navíc fo — ho, pak také existuje limita
lim g (x) = go
X^XQ
a platí go — fo — h0.
Této funkci se říkává Thomaeova funkce podle německého matematika J. Thomae z drahé poloviny 19. století.
5.53. Spočtěte
(a)
(b)
(c)
-v/1 + x — \J\ — X
lim-:
x^O X
lim
cosx — smx
yjr/4 COS (2x)
lim tfŕ (J/x2 + 2x + 3 - ^x2 + 2x + 2) .
Řešení. Všechny uvedené hmity vypočítáme pomocí vhodného rozšíření zadaného výrazu. V případě první limity vynásobíme čitatele i jmenovatele výrazem
Vl +x + Vl - x
267
KAPITOLA 5. ZŘÍZENÍ ZOO
Důkaz. Za předpokladů věty existuje pro libovolné e > 0 okolí O(xq) bodu xo e A c R, ve kterém jsou pro všechna x / xo hodnoty f (x) i /z(x) obsaženy v intervalu (fo — s, fo + s). Z podmínky f(x) < g(x) < h(x) vyplývá, žeig(x) e (f0-s, f0 + s), tedy lim^^ g(x) = f0.
Drobnou modifikací předchozího postupu si čtenář doplní i argumentaci pro nevlastní hodnoty limit nebo limity v nevlastním bodu xo. Určitě bude dobré si tyto případy podrobně promyslet!
□
Všimněme si, že věta dává možnost výpočtu limit pro všechny typy diskutované výše, tj. limity posloupností, limity funkcí ve vnitřních bodech, jednostranné limity atd.
5.22. Věta. Nechť A C R je definiční obor reálných nebo komplexních funkcí f a g, xo nechť je hromadný bod A a existují limity
b e K.
lim f (x)
a e
lim g (x)
X^XQ
lim
Potom:
(1) limita a je určena jednoznačne,
(2) limita součtu f + g existuje a platí
lim (f(x)+g(x)) = a + b,
X^XQ
(3) limita součinu f ■ g existuje a platí
lim (f(x) -g(x)) = a-b,
X^XQ
(4) pokud navíc b ^ 0, pak limita podílu f/g existuje a platí
f (x) _ a >*o g(x) b'
Důkaz. (1) Předpokládejme, že a a a' jsou dvě hodnoty limity limx^Xo f (x). Pokud je a / a', pak existují disjunktní okolí O (a) a O (a'). Pro dostatečně malá okolí xo ale mají hodnoty / ležet v obou naráz, což je spor. Proto je a = a'.
(2) Zvolme si nějaké okolí a + b, třeba 02€(a + b). Pro dostatečně malé okolí xo a x / xo bude jak f (x), tak g (x) v e-okolích bodů a a b. Proto jejich součet bude v 2e-okolí kýžené hodnoty a + b. Tím je důkaz ukončen.
(3) Podobně postupujeme u součinu s 0€i (ab). Pro malá okolí xq se nám hodnoty / i g trefí do e-okolí hodnot a a b. Proto jejich součin bude v požadovaném e2-okolí.
(4) Podobný postup ponechán jako cvičení. □
a využijeme známého vztahu (a — b) (a + b) = a2 — b2. Takto obdržíme
-v/l + X — -v/l — X
lim
x^O
Podobné vypočítame
cos x — sin x
(l+x)-(l-x) *->o x (Vi +x + Vl - x)
2 2
lim
lim
yyr/4 cos (2x)
lim
o vi+x+vi - x vr+yi
(cos x + sin x) (cos x — sin x)
1.
►jt/4 (cosx + sinx) cos (2x)
lim
cos2 x — sin2 x
►jt/4 (cosx + sinx) cos (2x) 1 1
= hm - . —
x^ji/4 cosx + smx V2 i V2
2 T 2
U provedeného krácení připomeňme identitu
cos (2x) = cos2 x — sin2 x, x e M. Abychom mohli při určování poslední limity použít (a - b) (a2 +ab + b2) = a3 - b3, k rozšíření potřebujeme výraz
V2 2 '
(x2 + 2x + 3)2+V*2 + 2x + 3-V-k2 + 2x + 2+J (x2 +2x + 2), který odpovídá a2 + ab + b2, resp. volíme
a = v'x2 + 2x + 3, b = \J x2 + 2x + 2.
Tímto rozšířením převedeme Umitu ze zadání na
V? ((x2 + 2x + 3) - (x2 + 2x + 2))
lim —=
(x2 +2x + 3)2 + jx2 +2x + 3 ■ ^x2 +2x + 2 + j (x2 +2x + 2)2 tj-
V?
lim —=====-^—^-====.
x^+0° j(x2 +2x + 3)2 + jx2 +2x + 3 ■ jx2+2x+2 + j(x2 +2x+ 2)2
Poslední limitu umíme snadno vyčíslit. Víme totiž, že je určena pouze jedním členem v čitateli a jedním ve jmenovateli, a to axp pro nej větší p (v tomto případě je uvažovaný člen ve jmenovateli rozdělen na několik sčítanců). Platí tudíž
lim
(x2 +2x + 3) + +oc
(^x2 + 2x + 3 - V*2 + 2x + 2)) = -.
□
268
KAPITOLA 5. ZŘÍZENÍ ZOO
Poznámka. Podrobnějším sledováním důkazů jednotlivých bodů věty můžeme její tvrzení rozšířit i na některé nekonečné hodnoty limit reálných funkcí: V prvém případě je zapotřebí, aby buď alespoň jedna z limit byla konečná nebo aby obě měly stejné znaménko. Pak opět platí, že limita součtuje součet limit s konvencemi z 5.18. Případ „oo — oo" ale není zahrnut.
V druhém případě může být jedna z limit nekonečná a druhá nenulová. Pak opět platí, že limita součinu je součin limit. Případ „0 • (±oo)" není ale zahrnut.
V případě podílu může být a e R a b = ±oo, kdy výsledek limity bude nula, nebo a = ±oo a b e R, kde výsledek bude ±oo podle znamének čitatele a jmenovatele. Případ " není zahrnut.
Zdůrazněme, že naše věta jako speciální případ pokrývá také odpovídající tvrzení o konvergenci posloupností i o limitách zprava a zleva funkcí definovaných na intervalu.
Pro úvahy o limitách bývá technicky užitečný i následující jednoduchý důsledek definic, který uvádí do souvislosti limity posloupností a funkcí obecně.
5.23. Důsledek. Uvažme reálnou nebo komplexní funkci f definovanou na množině A cRa hromadný bod xq množiny A. Funkce f má v bodě xq limitu y právě, když pro každou posloupnost bodů xn € A konvergující k xq a různých od xq má i posloupnost hodnot f(xn) limitu y.
T£5r WNVEX&čNCE-
■4-1—1,t""" <
Důkaz. Předpokládejme nejprve, že limita / v bodě xo je skutečně y. Pak pro libovolné okolí V bodu y musí existovat okolí V bodu xq takové, že pro všechny x e V C\A, x / xq, je f(x) e U. Pro každou posloupnost x„ -> xo bodů různých od xo ale budou pro všechna n větší než vhodné N i všechny body x„ e V. Budou tedy posloupnosti hodnot f(xn) konvergovat k hodnotě y.
Předpokládejme naopak, že funkce / nekonverguje k y při x -> xq. Pak pro nějaké okolí U hodnoty y existuje posloupnost bodů xm / xo v A, které jsou bližší k xo než l/m a přitom hodnota / (xm) nepatří do U. Tím j sme zkonstruovali posloupnost bodů z A různých od xo, pro které hodnoty f(xn) nekonvergují k y a důkaz je ukončen. □
Nyní máme nachystány nástroje na korektní formulaci vlastnosti spojitosti, se kterou jsme dříve intuitivně nakládali u polynomů.
m^m^mm_—__^_| Spojitost funkcí ^Maa^MM,,
Definice. Nechť / je reálná nebo komplexní funkce definovaná na intervalu A c R. Říkáme, že / je spojitá v bodě xo e A, jestliže je
5.54. Pro libovolné neN určete limitu
(1 +2nx)n - (l+nx)2n lim---.
x^O Xz
Řešení. Podle binomické věty je
(1 +2nx)n = 1 +
i)2nx + (2)
(2nx)2 + P (x) x3,
(1 + nx)
2«
1 + ( ln\nx + r" ) (nx)2 + Q (x) x3
x e
x e
pro jisté polynomy P, Q. Raději vyzdvihněme, že předchozí vyjádření skutečně platí pro všechna n e N. Pro n = 1 si stačí uvědomit, že klademe (*) = 0 a že polynomy P, Q mohou být identicky rovny nule. Dostáváme tedy
(1 + 2nx)n = 1 + 2n2x + 2n3 (n - 1)x2 + P (x) x3, x e R, (1 + nx)2n = 1 + 2n2x + n3 (2n - 1) x2 + Q (x) x3, x e R.
Pouhé dosazení a jednoduché úpravy již dávají
(1 +2nx)n - (l+nx)2n
lim
x^O
(2n3 (n - 1) - n3 (2n - 1)) x2 + (P(x) - Q(x)) x3 lim---
jt^o x1
lim {-n3 + (P(x) - Q(x)) x) = -n3 + 0 = -n3.
□
5.55. Spočítejte
lim (tgx)tg(2x)
Řešení. Limity typu 1 (jako je v zadání) lze počítat podle vzorce
lim f(x)
x—>xq
g(x)
lim ((f(x)-l)g(x))
jestliže limita na pravé straně existuje af(x) ^ 1 pro x z jistého ryzího okolí bodu x0 € R. Určeme proto
lim (tgx — 1) tg (2x) = lim
x^7l/4
smx
1
sin (2x)
x^jt/4 ycosx / cos (2x)
sin x—cos x 2 sin x cos x lim -
x^n/4 COSX
—2 sinx
lim
cos2 x — sin2 x
9 V2 ^ 2
x^jt/4 cosx + smx
V2 , V2
2 2
Odtud máme
lim (tgx)
x^7l/4
tg (2x)
Doplňme, že použitý vzorec platí obecněji pro „typ icokoll"? tj. bez kladení jakýchkoli podmínek týkajících se limity lim^^ g(x), která tak ani nemusí existovat. □
269
KAPITOLA 5. ZŘÍZENÍ ZOO
lim f(x) = /(x0).
Funkce / je spojitá na množině A, jestliže je spojitá ve ve všech bodech xq e A.
Všiměme si, že pro hraniční body intervalu A říká naše definice, že f v nich má hodnotu rovnou limitě zleva, resp. zprava. Říkáme, že je v takovém bodě spojitá zprava, resp. zleva. Již jsme také viděli, že každý polynom je spojitou funkcí na celém M, viz 5.20(2). Potkali jsme také funkci, která je spojitá jen v iracionálních reálných číslech, přestože má limity i ve všech číslech racionálních, viz 5.20(4).
Z předchozí Věty 5.22 o vlastnostech limit okamžitě vyplývá většina následujících tvrzení
5.24. Věta. Nechť f a g jsou (reálné nebo komplexní) funkce definované na intervalu A a spojité v bodě xo e A. Pak
(1) součet f + g je funkce spojitá v xq
(2) součin f ■ g je funkce spojitá v xq
(3) pokud navíc g(xo) ^ 0, pak podíl f/g je dobře definován v nějakém okolí xq a je spojitý v xq.
(4) pokud je spojitá funkce h je definována na okolí hodnoty /(xo) reálné funkce f, pak složená funkce h o f je definována na okolí bodu xo a je v bodě xo spojitá.
Důkaz. Tvrzení (1) a (2) jsou zřejmá, doplnit důkaz potřebujeme u tvrzení (3). Jestliže je g(xo) / 0, pak také celé e-okolí čísla g(xo) neobsahuje nulu pro dostatečně malé e > 0. Ze spojitosti g pak vyplývá, že na dostatečně malém <5-okolí bodu xo bude g nenulové a podíl f/g tam bude tedy dobře definován. Pak bude ovšem i spojitý v xo podle předchozí věty.
(4) Zvolme nějaké okolí O hodnoty h(f(xo)). Ze spojitosti h k němu existuje okolí O' bodu /(xo), které je celé zobrazeno funkcí h do O. Do tohoto okolí O' spojité zobrazení / zobrazí dostatečně malé okolí bodu xo. To je ale právě definiční vlastnost spojitosti a důkaz je ukončen. □
Nyní si vcelku snadno můžeme odvodit zásadní souvislosti spojitých zobrazení a topologie reálných čísel:
5.25. Věta. Nechť f : M. -> M je spojitá funkce. Pak
(1) vzor f~l (U) každé otevřené množiny U je otevřená množina,
(2) vzor f~l(W) každé uzavřené množiny W je uzavřená množina,
5.56. Ukažte, že je
smx
lim
x^0 X
1.
Řešení. Uvažujme jednotkovou čtvrtkružnici v prvním kvadrantu ajejíbod [cosx, sinx], x e (0, n/2). Délka kruhového oblouku mezi body [cos x, sin x] a [1, 0] je rovna x. Zřejmě tedy je
smx < x, x e
Hodnotu tgx potom vyjadřuje délka úsečky s krajními body [1, sinx/cosx] a [1,0]. Vidíme, že je (příp. si nakreslete obrázek)
x < tgx, x e
Tato nerovnost rovněž vyplývá z toho, že trojúhelník s vrcholy [0, 0], [1, 0], [1, tgx] má očividně větší obsah než uvažovaná kruhová výseč. Dohromady jsme získali
smx
smx < x <
cosx
1 <
<
x e
x e
sin x cos x
smx
1 > - > cosx, x e
Z Věty o třech limitách nyní plynou nerovnosti 1
Dokázali jsme tak, že
smx
lim 1 > lim - > lim cos x = cos 0=1.
x^0+ x^0+ X x^0+
lim
smx
1.
x^0+ X
Funkce y = (sin x)/x definovaná pro x ^ 0 je ovšem sudá, a tudíž je
smx lim -
x^0- X
smx lim -= 1.
x^0+ X
Protože obě jednostranné limity existují a jsou si rovny, existuje oboustranná limita a platí pro ni
smx
lim
x^0 X
smx lim -= 1.
x^0± X
Poznamenejme ještě, že uvedenou limitu by sice šlo velmi snadno vyčíslit za pomoci 1'Hospitalova pravidla, nicméně k odvození 1'Hospi-talova pravidla je používána právě tato limita, tudíž se při jejím výpočtu na zmíněné pravidlo odvolávat nemůžeme. □
270
KAPITOLA 5. ZŘÍZENÍ ZOO
(3) obraz f (K) každé kompaktní množiny K je kompaktní množina,
(4) na libovolné kompaktní množině K dosahuje spojitá funkce svého maxima a minima.
Důkaz. (1) Uvažme nějaký bod xo e f~l (U). Nějaké okolí O hodnoty /(xo) je celé v U, protože je U otevřená. Pak ovšem existuje okolí O' bodu xo, které se celé zobrazí do I O, patří tedy do vzoru. Každý bod vzoruje tedy vnitřní a ' tím je důkaz ukončený.
(2) Uvažme nějaký hromadný bod xo vzoru f~l(W) a nějakou posloupnost xt, f(xi) e W, která k němu konverguje. Ze spojitosti / nyní zjevně vyplývá, že /(x;) konverguje k /(xo), a protože je W uzavřená, musí i /(xo) e W. Zřejmě jsou tedy všechny hromadné body vzoru množiny W veW také obsaženy.
(3) Zvolme libovolné otevřené pokrytí f(K). Vzory jednotlivých intervalů budou sjednoceními otevřených intervalů a tedy také vytvoří pokrytí množiny K. Z něho lze vybrat konečné pokrytí a proto nám stačí konečně mnoho odpovídajících obrazů k pokrytí původní množiny f(K).
(4) Protože je obrazem kompaktní množiny opět kompaktní množina, musí být obraz ohraničený a zároveň musí obsahovat svoje supremum i infimum. Odtud ale vyplývá, že tyto musí být zároveň maximem a minimem hodnot. □
5.26. Důsledek. Nechť f:R^Rje spojitá. Potom
(1) obraz každého intervalu je opět interval,
(2) f na uzavřeném intervalu [a, b] nabývá všech hodnot mezi svou maximální a minimální hodnotou.4
Důkaz. (1) Uvažme nejprve nějaký otevřený interval A a předpokládejme, že existuje bod y e R takový, že f (A) obsahuje body menší i větší než y, ale y <£ f (A). Znamená to tedy, že pro otevřené množiny B\ — (—oo, y) a B2 — (y, oo) jejich vzory Ai — f~l (Bi) n A a A2 — f~1(B2) n A pokrývají A. Tyto množiny jsou přitom opět otevřené, jsou disjunktní a obě mají neprázdný průnik s A. Stejnou úvahou jako v důkazu prního bodu v 5.17 dospějeme k závěru, že musí existovat bod x e A, který neleží v A\, je ale jejím hromadným bodem. Musí pak tedy ležet v A2 a to u disjunktních otevřených množin není možné.
Dokázali jsme tedy, že pokud nějaký bod y nepatří do obrazu intervalu, musí být všechny hodnoty buď zároveň větší nebo zároveň menší. Odtud vyplývá, že obrazem bude opět interval. Všimněme si, že jeho krajní body tohoto intervalu mohou a nemusí do obrazu patřit.
Pokud obsahuje definiční interval A i některý ze svých hraničních bodů, musí jej spojitá junkce zobrazit opět buď na hraniční nebo vnitřní bod obrazu vnitřku A. Tím je tvrzení ověřeno.
(2) Toto tvrzení je přímým důsledkem předchozího, protože obrazem ohraničeného uzavřeného intervalu (tj. kompaktní množiny) musí být opět uzavřený interval. □
Na závěr naší úvodní diskuse spojitosti funkcí uvedeme ještě tvrzení, která jsou užitečným nástrojem při počítání limit.
5.27. Věta (O limitě složené funkce). Nechť f, g funkce, líníma /(x) = b.
L jsou
Tomuto tvrzení se (zejména v české literatuře) říká Bolzanova věta. Bernard Bolzano pracoval na začátku 19. století v Praze.
5.57. Stanovte limity
lim
n + 1 / n^oo V n
iy / iy*
lim 1 + — , lim 1 -
sin x x arcsmx lim-, lim —-—, lim-;
x^o x x^o sin x x
3tg2x sin(3x) tg (3x)
lim-—, lim-, lim
>o 5x-
2 '
>o sin (5x)
>o sin (5x)
lim
lim
x->o x x^o sin (2x)
Řešení. Při určování těchto limit využijeme znalosti limit (a e R)
/ a\n sinx ď — 1 lim 1 + - =ď; lim-= 1; lim- = 1.
n^oo \ n' x^O X x^O X
Víme tedy, že je
, ix" ín-l\n e = lim 1--I = lim
n^oo Y ľl J n^oo \ fi
Substituce m = n — 1 dává
(n — 1\ (m -J = lim - n I rn^oo \m + 1
m + l
m \ m lim - ) • lim -.
m^oo \ m + 1 / m^oo m + l
Celkem máme
_i I m \ m e = lim -) • lim -.
m^oo ym + 1/ m^oo m + l
Druhá z limit je zjevně rovna 1. Když změníme označení (nahradíme n za m), můžeme napsat výsledek
n
e = lim
n + 1
Dále platí
lim ( 1 + X) = lim (l + 4
lim 1 + —
i y
eu = 1
lim (1 - -\ =]im((l--\\= 0.
n^oo Y ti) n^oo Y\ n)
Upozorněme, že první z předešlých vyčíslení vyplývá z limit
/ iy2 / iy i
lim 1 + — = lim 1 + — = e, lim - = 0
n^>co Y TI I m^*oo Y ífl / n^>co fi
a druhé potom z
/ i v
lim (1--) = e 1, lim n = +oo,
271
KAPITOLA 5. ZŘÍZENÍ ZOO
(1) Pokud je funkce g spojitá v bodě b, potom
limg(f(x))=g(limf(x)) =g(b).
x^a \x^a /
(2) Jestliže existuje limita lim-y^j, g (y) a zároveň pro všechna x z nějakého ryzího okolí bodu a platí f (x) ^ b, potom
lim g (f (x)) = lim g (y).
x^a y^*b
Důkaz. První tvrzení se dokazuje podobně jako tvrzení 5.24(4). Ze spojitosti g v bodě b vyplývá, že pro jakékoliv okolí V hodnoty g (b) umíme najít dostatečně malé okolí U bodu b, na kterém jsou už všechny hodnoty g ve V. Pokud ale / má bod b jako limitu v bodě a, pak se do U trefíme všemi hodnotami / pro dostatečně malé ryzí okolí bodu a, což již ověřuje první tvrzení.
Pokud nemáme k dispozici spojitost funkce g v bodě b, bude předchozí argumentace obecně platit také, když zajistíme, aby dostatečně malá ryzí okolí bodu a byla funkcí / zobrazena do ryzího okolí bodu b. □
5.28. Kdo už je v ZOO. Začali jsme budovat náš zvířetník funkcí s polynomy a s funkcemi, které se z nich dají vyrobit „po částech". Zároveň jsme dovodili spoustu vlastností pro patrně obrovskou třídu spojitých funkcí, nemáme ale zatím moc prakticky zvladatelných příkladů, kromě polynomů. Jako další příklad si prohlédneme podíly polynomů.
Nechť / a g jsou dva polynomy, které mohou mít i komplexní hodnoty (tj. připouštíme výrazy anxn + ■ ■ ■ + ao s komplexními a;- e C, ale dosazujeme jen reálné hodnoty za proměnnoux). Funkce g(x) = 0} -* C,
h(x)
g (x)
je dobře definována ve všech reálných bodech x kromě kořenů polynomu g. Takové funkce nazýváme racionální funkce. Z Věty 5.24 vyplývá, že racionální funkce jsou spojité ve všech bodech svého definičního oboru. V bodech, kde definovány nejsou, mohou mít
• konečnou limitu, když jde o společný kořen obou polynomů f ag, přičemž jeho násobnost je v / alespoň taková jako v g (v tomto případě rozšírením jejich definice o limitní hodnotu v tomto bodě dostaneme funkci i v tomto bodě spojitou),
• nevlastní limitu, když nevlastní limity zprava a zleva v tomto bodě jsou stejné,
• různé nevlastní limity zprava a zleva.
Názorně je možné tuto situaci vidět na obrázku, který ukazuje hodnoty funkce
h(x)
(x - 0.05a) (x - 2 - 0.2a) (x - 5) x(x - 2)(x - 4)
pro hodnoty a — 0 (obrázek vlevo tedy vlastně zobrazuje racionální funkci (x — 5)/(x — 4)) apro a — 5/3.
přičemž klademe e~°° se o určitý výraz). Snadno lze získat
0 (zápis označuje limx
0 - jedná
Zřejmě je
a Umita
sin x smx lim-= lim sin x • lim-
x^O X x^O x^O X
lim
0-1=0.
x^o smx
lim
1
x^o smx
neexistuje (zapisujeme 1/ ± 0). Kdybychom tedy k výpočtu limity
x
lim —t—
sin x
užili pravidla o limitě součinu, obdrželi bychom ll/±0=l/±0. To znamená, že tato limita neexistuje (opět jde o určitý výraz). Ke stanovení
arcsin x lim-
x^0 X
použijeme identitu x = sin (arcsin x) platnou pro x e (—1, 1), tj. v jistém okolí bodu 0. Pomocí substituce y = arcsin x dostáváme
lim
x^0
arcsm x
lim
arcsm x
lim
y
i.
x o sin (arcsin x) y^osiny
Poznamenejme, že y -» 0 plyne z dosazení x = 0 do y = arcsin x a ze spojitosti této funkce v počátku (to také zaručuje, že jsme tuto substituci mohli „bez obav" zavést). Ihned vidíme, že je
3 tg2 x .. / 3 sin x sin x 1
_ (3 sinx sinx lim-— = lim - •-•-•
o 5x2 x^o \5 x x
3 sinx sinx = - • lim-• lim-• lim
1
5 x^o x 3
•lil
x^0 X
3
5 5" Vhodné rozšíření a substituce dávají
sin (3x) / sin (3x) 5x 3 lim-= lim -•-- -
x^o sin (5x) x^o \ 3x sin (5x) 5
sin (3x) 5x = lim-• lim
x^o cos2 X
>o 3x
>o sin (5x) 5
srny z lim-• lim
3 3 3
- - = 1 - 1 - - = -.
z^osinz 5 5 5
y^0 y
Pomocí předešlého výsledku pak lehce spočítáme
,. tg (3x) /sin (3*) 1
lim-= lim
>o sin (5x)
o \ sin (5x) cos (3x)
sin(3x) 1 lim-• lim
>o sin (5x) ^^o cos (3x)
272
KAPITOLA 5. ZŘÍZENÍ ZOO
5.29. Funkce mocninné a exponenciální. Polynomy jsou po-ág^ mocí sčítání a násobení skaláry seskládány z jednoduchých mocninných funkcí x i-> x" s přirozeným
exponentem n = 0,1,2,____Samozřejmý smysl má
také funkce x x-1 pro všechna x / 0. Tuto definici teď rozšíříme na obecnou mocninnou funkci x° s libovolným a e R.
Budeme vycházet z vlastností mocnin a odmocnin, které patrně považujeme za samozřejmé. Pro záporné celé číslo —a proto definujeme
x~a = (xf1)'1 = (x~l)a.
Dále jistě chceme, aby ze vztahu b" = x pro n e N vyplývalo, že b
i
je n-tou odmocninou z x, tj. & = x«. Je třeba ale ověřit, že taková b pro kladná reálná x skutečně existují.
Z bionomického rozkladu mocniny dvojčlenu je vidět, že funkce y i-> y" je pro y > 0 stále rostoucí. Předpokládejme x > 0 a uvažujme množinu B = {y € M, y > 0, y" < x}. To je zřejmě shora ohraničená množina a zvolíme b = sup B. O mocninné funkci s přirozeným n již víme, že je to funkce spojitá, snadno tedy ověříme, že skutečně platí b" = x. Skutečně, určitě je b" < x a kdyby platila ostrá nerovnost, našli bychom jistě i y s hodnotou b" < y" < x, což nutně znamená i b < y a tedy jde o spor s definicí suprema.
Máme tedy již korektně definovánu mocninnou funkci pro
všechna racionální a = ^ x° = (xp) = (x?)p.
Konečně, pro hodnoty a e R a x > lsi povšimněme, že jde pro racionální a o striktně rostoucí výraz (pro větší a je vždy větší výsledek). Proto klademe
ŕ = supíx^, y e Q, y < a}.
Pro 0 < x < 1 buď definujeme analogicky (je třeba si jen pohrát s nerovnítky) nebo klademe přímo x° = (\)~a. Pro x = 1 je pak l" — 1 pro libovolné a.
Obecnou mocninnou funkci x i-> x" máme tedy dobře definovanou pro všechny x e [0, oo) a a e R. Naši konstrukci ale můžeme také číst následujícím způsobem: Pro každé pevné reálné c > 0 existuje dobře definovaná funkce na celém R, y i-> cy. Této funkci říkáme exponenciální funkce o základu c.
Vlastnosti, které jsme použili při definici mocninné a exponenciální funkce f(y) = c^, tj. c = /(l), lze shrnout do jediné rovnosti pro libovolné reálné kladné x a y:
/(v + y) = /(v) • /(v)
společně s požadavkem spojitosti.
Podobně můžeme stanovit
lim
x^O
_
»(5-2)jc
lim | e2*-
\ (5 - 2)x
1
3x
lim e2* • lim
x^O
>o 3x
(5-2)
•3
e^ - 1
a rovnez
lim
e5x — e
>o sin (2x) 'e
lim
e° • lim
y^O y
i5x - 1 e
•3 = 1 • 1 -3
1
,5x 2
lim
x^o \ 5x sin (2x) 2
>o ysin (2x) sin (2x) 2x 5 e~x — 1 2x
^5x
lim
1
>o 5x
• lim
2x
y o sin (2x) 2 lim —
— • lim —— ■--lim-
u^o u z^osinz 2 v^o v
5 1 „ 2 + 2=3-
-x sin (2x)
1 2x — • lim
lim
>o sin (2x) - • lim Z
z^o sin z
5.58. Vypočtěte limity
lim
x^0
1 — cos (2x)
x smx
Řešení. Využijeme faktu, že
lim
x^0
1 — cos X
smx
lim
x^0 X
Snadno získáváme
1 — cos (2x)
lim
x^0
x smx
lim
x^0
lim
x^0
1 — (cos2 x — sin2 x)
(1
x smx cos2 x) + sin2 x
resp.
lim
x^0
1 — cos X
lim
x^0
1 — cos x 1 + cos X x2 1 + cos X
lim
□
x smx
2 sin2 x sin x lim-:- = lim 2-
x^o x sinx x^o x
2;
1 — cos X
>0 X2 (1 + cosx)
lim
sin2x
>0 X2 (1 + cosx)
smx
lim
x^0 X
lim
1
>o 1 + cosx
1
2"
Dodejme, že jsme také mohli hned použít vyjádření
1 — cos (2x) = 2 sin2 x, x e M.
□
273
KAPITOLA 5. ZŘÍZENÍ ZOO
Skutečně, pro y — 0 dostáváme z této rovnosti /(O) — 1, odtud pak 1 — f(0) — fix — x) — fix) ■ ifix))~l a konečně pro přirozené n je zjevně /(ni) = (/(x))". Takto jsme již jednoznačně určili hodnoty x° pro všechny x > Oaa e Q a požadavkem spojitosti byla již funkce určena všude.
Zejména tedy pro exponenciální funkci platí známé vztahy
(5.5)
iax)
ix-y
5.30. Logaritmické funkce. Viděli j sme právě, že exponenciální funkce fix) — ax je pro a > 1 stále rostoucí a pro 0 < a < 1 je stále klesající. V obou případech tedy existuje k fix) funkce inverzní f~l (x) kterou nazýváme logaritmickou funkcí se základem a. Píšeme lnfl (x) a definiční vztah tedy je lnfl (ax) — x. Rovnosti (5.5) jsou proto ekvivalentní vztahům
lnfl (x-y) — lna (x) + lna iy), lnfl (xy) — y ■ lna (x).
Logaritmické funkce jsou definovány jen pro kladné hodnoty argumentu a jsou pro základ a > 1 rostoucí, pro základ 0 < a < 1 klesající na celém definičním oboru. Pro každé a je lnfl (1) =0.
Brzy uvidíme, že obzvlášť důležitou hodnotou pro a je tzv. Eu-lerovo číslo e, viz odstavec 5.42. Funkci lne(x) nazýváme přirozeným logaritmem a základ e v označení vynecháváme, tj. píšeme prostě ln(x).
3. Derivace
U polynomů jsme již v odstavci 5.6 diskutovali, jak popisovat jednoduše velikost růstu hodnot polynomu kolem daného bodu jeho definičního oboru. Tehdy jsme pozorovali podíl (5.2), který vyjadřoval směrnici sečny mezi body [x, fix)] e M2 a [x+Ax, /(i+Äi)] e M2 pro (malý) přírůstek Ax nezávisle proměnné. Tehdejší úvaha funguje zrovna stejně pro libovolnou reálnou nebo komplexní funkci /, jen musíme místo intuitivního „zmenšování" přírůstku Ax pracovat s pojmem limity.
Uvádíme definici pro vlastní i nevlastní derivace, tj. připouštíme i nekonečné hodnoty. Všimněte si, že na rozdíl od limity funkce, u derivace v daném bodě xq je nutné, aby byla sama funkce v tomto bodě definovaná.
Derivace funkce jedné reálné proměnné |^
5.31. Definice. Nechť / je reálná nebo komplexní funkce definovaná na intervalu A c M a xq e A. Jestliže existuje limita
fix) - fix0)
lim
x0
pak řídáme, že / má v bodě xo derivaci a. Hodnotu derivace zapisujeme jako f'ix0) nebo %(x0), případně a — £f(x0).
D. Spojitost funkcí
5.59. Zkoumejte existenci limit a spojitost funkce (x — 1) ~sgn x v bodech 0 a 1.
Řešení. Spočítejme nejprve jednostranné limity v bodě nula:
linwo-(* - l)"sgn" = HnWo-(* " 1) = "I,
lim
(x - l)-ssnj
lim
x-l
■1,
odtud lim (x — 1) sgn x = — 1, nicméně funkční hodnota této funkce je
x^O
v bodě 0 rovna 1, tudíž zkoumaná funkce není v bodě 0 spojitá. Dále je
lim^i-(jc - l)-ssn* lim^1+(x- 1)"^
lim
i
x-l
linu 1
-oo, oo.
x-l
V bodě 1 tedy existuje levostranná i pravostranná limita dané funkce, jejich hodnoty se ovšem liší, funkce tudíž nemá v bodě 1 limitu (a tak není v tomto bodě ani spojitá). □
5.60. Bez použití Věty o třech limitách dokažte, že funkce
Rix)
\x, x € {i; n € N} ; 0, x e M\ {i; n e N}
je spojitá v bodě 0.
Řešení. Funkce R je spojitá v bodě 0, právě když je lim i?(x) = RiO) = 0.
x^0
Z definice limity ukážeme, že tato limita se skutečně rovná 0. Při „obvyklém" značení je a = 0, x0 = 0. Nechť 8 > 0 je nadále libovolné. Pro jakékoli x e i—8, 8) je Rix) = 0, nebo i? (x) = x, a tudíž (v obou případech) dostáváme i?(x) e i—8,8). Jinými slovy, vezmeme-li libovolné á-okolí i—8, 8) hodnoty a a přiřadíme-li mu i—8, 8) (jako okolí bodu x0), pak pro každé x e i—8, 8) (z uvažovaného okolí x0) platí, že Rix) s i—8, 8) (zde na interval i—8, 8) nahlížíme jako na okolí a). To odpovídá znění definice limity (nemuseli jsme ani požadovat, aby bylo x xo).
Uvažovaná funkce R se nazývá Riemannova funkce (proto označení R). V literatuře se ovšem uvádí v různých modifikacích. Např. o funkci
/(*)
1, x e Z
L, x = p-
q q
0, X £ Q
e Q pro nesoudělná p, q € Z a q > \;
se „často" hovorí jako o Riemannově.
□
274
KAPITOLA 5. ZŘÍZENÍ ZOO
Derivace reálné funkce je vlastní, resp. nevlastní, když je takovou příslušná limita.
Jednostranné derivace (tj. derivaci zprava a zleva) definujeme zcela stejně pomocí limity zprava a zleva.
O funkci mající v bodě xq derivaci říkáme, že je v tomto bodě diferencovatelná. O funkci diferencovatelné v každém bodě intervalu říkáme, že je diferencovatelná na tomto intervalu.
S derivacemi se vcelku snadno počítá, dá nám ale dost práce korektně odvodit derivace i některých z funkcí, které už v našem zvěřinci máme. Proto s předstihem vsunujeme do textu souhrnnou tabulku, jak derivace pro několik z nich vychází. V posledním sloupci je odkaz na odstavec, kde se dá údaj skutečně i s úplným výkladem najít. Všimněme si také, že inverzní funkce k řadě z našich funkcí sice neumíme přímo vyjádřit elementárním způsobem, přesto ale budeme umět počítat jejich derivace, viz. 5.35
m^mm^mi>——některé derivace funkcí ^■__ba|
funkce definiční obor derivace
polynomy fix) celé M fix) je opět polynom 5.6
kubické splajny hix) celé M h'ix) má spojitou pouze první derivaci 5.9
racionální funkce m/g(x) celé R kromě kořenů g racionální funkce: f'(x)g(x)-f(x)g'(x) >tU)2 5.34
mocninné funkce fix) = X* interval (0, oo) fix) = ať'1 5.36, 5.44
exponenciála fix) = ax, a > 0, a ^ 1 celé R fix) = ln(fl) -ax 5.36, 5.44
logaritmus fix) = lnfl(x), a > 0, a ^ 1 interval (0, oo) fix) = (inwr1 • \ 5.36, 5.44
Z formulace definice lze očekávat, že fixo) bude umožňovat dobře aproximovat danou funkci pomocí přímky
y = fixo) + /'(xo)(x - x0).
Takto lze rozumět následujícímu lemmatu, které říká, že nahrazením konstantního koeficientu fixo) ve vyjádření přímky spojitou funkcí dostaneme přímo hodnoty /. Odchylka hodnot t/c(x) na okolí bodu xq od hodnoty Ý(xo) Pak přímo říká, jak se liší směrnice sečen a tečny v bodě xq.
5.61. Dodefinujte funkci
fix) = (x2 - 1)
2x - 1
sin ■
1
x # ±1 (x e R)
v bodech —1,1 tak, aby byla spojitá na R.
Řešení. Daná funkce je spojitá ve všech bodech svého definičního oboru. V bodech —1,1 bude spojitá, právě když položíme
2x - ť
/(-l) /(l)
tmi (x2 - 1)
sin
lim í (x2 - l) si
x 2x
2 - 1 1
sin ■
x^l vx ' xA — 1
Pokud by jedna z těchto limit neexistovala (příp. byla nevlastní), funkci by nešlo spojitě dodefinovat. Očividně je
2x - 1
sin
1
< 1, í/í1(íěK),
odkud plyne
U2 - 1 I < fix) < I x2
1 I , x ^ ±1 (x e R).
Protože
lim I x2 - 1 I = 0,
Jt->±1 1 1
z Věty o třech limitách již dostáváme výsledek /(±1) := 0. □
5.62. Zjistěte, jestli má rovnice e2* — x4 + 3x3 — 6x2 = 5 alespoň jedno kladné řešení.
Řešení. Uvažujme funkci
/(*) ==
Jlx
x4 + 3x3 - 6x2 - 5, x > 0,
pro niž je
/(0) = -4, lim fix) = lim e2* = +oo.
Ze spojitosti funkce / na celém jejím definičním oboru tudíž vyplývá, že nabývá všech hodnot y e [—4, +oo). Zvláště její graf nutně protíná kladnou poloosu x, tj. rovnice fix) = 0 má řešení. □
5.63. V jakých bodech x e M je funkce
y = cos I arctg
12x21 + 11
acos(x+2) — x
-11 -x
s maximálním definičním oborem spojitá? 5.64. Rozhodněte, zda je funkce
/(*)
x < 0;
0 < x < 1; x = 1;
1 < x < 2;
2 < x < 3; x > 3
spojitá; spojitá zleva; spojitá zprava v bodech — jt, 0, 1, 2, 3, jt. O
x, 0, x, 0, x,
i
x-J,'
275
KAPITOLA 5. ZŘÍZENÍ ZOO
5.65. Dodefinujte funkci
Lemma. Reálná nebo komplexní funkce f {x) má v bodě xo vlastní derivaci, právě když existuje na nějakém okolí O'(xo) funkce \j/ spojitá v xq a taková, že pro všechny x e O(xq) platí
f (x) - /(xo) + f{x){x - x0).
Navíc pak vždy if{xo) — /'(xo) a sama funkce f je v bodě xo spojitá.
Důkaz. Nejprve předpokládejme, že /'(xo) je vlastní derivace. Pokud má i/r existovat, má jistě pro všechny x e O \ {xo} tvar
f (x) — (f (x) - f(x0))/(x - x0). V bodě xo naopak definujme hodnotu derivací /'(xo). Pak jistě lim f (x) = /'(x0) = f(xo)
jak je požadováno.
Naopak, jestliže taková funkce i/r existuje, tentýž postup vypočte její limitu v xo. Proto existuje i /'(xo) a je tK*o) rovna.
Z vyjádření / pomocí spojitých funkcí je zřejmé, že je sama spojitá v bodě xo. □
5.32. Geometrický význam derivace. Předchozí lemma lze ná-zorně vysvětlit geometricky a tím popsat smysl derivace. Říká totiž, že na grafu funkce y — f (x), tj. na příslušné křivce v rovině se souřadnicemi x a y, poznáme, zda existuje derivace podle toho, jestli se spojitě mění hodnota směrnice sečny procházející body [xo, /(xo)] a [x, fix)]. Pokud ano, pak hmitní hodnota této směrnice je hodnotou derivace.
j Rostoucí a klesající funkce v bodě |^_——
Důsledek. Má-li reálná funkce f v bodě xo € R derivaci /'(xo) > 0, pak pro nějaké okolí O(xq) platí fix) > /(xo) pro všechny body x € O(xq), x > xq a f(x) < /(xo) pro všechny body x e O(xq), x < xo.
Je-li derivace f (xq) < 0, pak naopak pro nějaké okolí O (xq) platí fix) < /(xo) pro všechny body x e O(xq), x > xq, a fix) > /(xo) pro všechny body x e O(xq), x < xq.
Důkaz. Uvažme prvý případ. Pak podle předchozího lematu platí fix) — /(xo) + is(x)(x — xo) a Ý(xo) > 0. Protože je ale ý v xo spojitá, musí existovat okolí O(xo), na kterém bude t/c(x) > 0. Pak ale s rostoucím x > xq nutně poroste i hodnota fix) > /(xq) a naopak pro x < xo.
Stejná argumentace ověří i tvrzení se zápornou derivací. □
fix) = arctg 1 +
• 2 5
sin x ,
x e R \ {0}
pro x = 0 tak, aby byla v tomto bodě spojitá.
5.66. Uvedie p sR, pro které je funkce
sin (6x)
/(x) = ^-A X6EM\{0}; 3x
spojitá v počátku.
5.67. Zvolte reálnou hodnotu a tak, aby funkce
x4
O
/(O)
O
h (x) byla spojitá v R. 5.68. Vypočtěte
.4 j
1
x>l; h (x) = a, x 0 splněna pro všechna reálná x.
Řešení. Všimněme si, že pro a = 2 je nerovnost triválně splněna (levá strana je konstanta 1). Pro a ^ 2 je levá strana kvadratickou funkcí fix) proměnné x, přičemž je /(O) = 1. Vzhledem ke spojitosti funkce fix) tak bude nerovnost fix) > 0 platit pro všechna reálná x, právě když rovnice fix) = 0 nebude mít řešení v R (graf funkce / pak bude celý „nad" osou x) a to nastane, právě když diskriminant kvadratické rovnice ia — 2)x2 — ia — 2)x + 1=0 bude záporný. Dostáváme tak nutnou a postačující podmínku
D = ia - 2)2 - 4(a - 2) = ia - 2)(a - 6) < 0.
Taje splněna pro a e (2,6). Celkem je nerovnice splněna pro všechna reálná x pro a € [2,6). □
5.70. V R řešte rovnici
2X + 3X + 4X + 5X + 6X = 5.
O
Řešení. Funkce na levé straně rovnice je součtem tří rostoucích funkcí na R, je tedy sama rostoucí funkcí na celém R. Hodnota levé strany je pro x = 0 rovna 5, což je tedy jediným řešením dané rovnice. □
5.71. V M řešte rovnici
2X + 3X +
276
KAPITOLA 5. ZŘÍZENÍ ZOO
Funkce, které mají na nějakém okolí bodu xo vlastnost / (x) > /(xo), kdykoliv x > xo, a f(x) < /(xo), když x < xo, se nazývají rostoucí v bode xq. Funkce rostoucí ve všech bodech nějakého intervalu se nazývá rostoucí na intervalu. Samozřejmě pro funkce rostoucí na intervalu platí f(b) > f (a) pro všehcny a < b z tohoto intervalu.
Podobně je funkce klesající v bodu xo, jestliže má na nějakém okolí bodu xo vlastnost f(x) < /(xo), kdykoliv x > xo, a/(x) > /(xo), když x < xo. Funkce je klesající na intervalu, jestliže je klesající ve všech bodech tohoto intervalu.
Náš důsledek tedy říká, že funkce, která má v bodě nenulovou konečnou derivaci, je v tomto bodě buď rostoucí nebo klesající podle znaménka této derivace.
Pokud má funkce / v okolí bodu xo spojitou derivaci f'(xo) / 0, pak je tato funkce na nějakém okolí bodu xq rostoucí nebo klesající, podle znaménka derivace. Skutečně, jako spojitá nenulová funkce má /'(xo) v nějakém okolí xo stále stejné znaménko.
Jako ilustraci jednoduchého použití vztahu derivace k růstu hodnot funkce se podívejme na existenci inverzí polynomů. Protože polynomy jen zřídka jsou výhradně rostoucí nebo klesající funkce, nemůžeme očekávat, že by k nim existovaly globálně definované inverzní funkce. Naopak ovšem inverzní funkce k polynomu / existují na každém intervalu mezi kořeny derivace /', tj. tam kde derivace polynomu je nenulová a nemění znaménko. Tyto inverzní funkce nebudou nikdy polynomy, až na případ polynomů stupně jedna, kdy z rovnice
O
5.72. Rozhodněte, zda polynom
v-37
+ 5x21 - 4x9 + 5x4 - 2x - 3
má v intervalu (—1, 1) alespoň jeden reálný kořen.
O
E. Derivace
Ukažme si nejprve, že derivace funkcí uvedené v tabulce v odstavci 5.31 jsou skutečně správně. Určíme je přímo z definice derivace.
5.73. Z definice (viz 5.31) určete hodnoty derivací funkcí x" (x je proměnná, n kladná celá konstanta), yfx, sinx.
Řešení. Nejprve podotkněme, že označíme-li v definici derivace výraz x — x0 jako h, pak dostáváme
ľ /(x)-/(x0) /(x0 + h) - /(x0) lim -= lim-.
x-*x0 X — Xq h^O h
V následujících výpočtech budeme pracovat s druhým vyjádřením téže limity.
spočteme přímo
y — ax
1
-(y-b). a
U polynomu druhého stupně obdobně
y — ax2 + bx + c
vede ke vztahu
—b ± y7/?2 - 4a (c - y)
x — -,
2a
a inverze tedy existuje (a je dána touto formulí) jen pro x na intervalech (-00, -£), (-£, 00).
Pro práci s inverzními funkcemi k polynomům nevystačíme s dosavadními funkcemi a dostáváme v našem zvířetníku nové přírůstky.
5.33. Pravidla pro počítání derivací. Uvedme si nyní několik základních tvrzení o výpočtech derivací. Říkají nám, jak dobře se snáší operace derivování s algebraickými operacemi sčítání a násobení na reálných nebo komplexních funkcích. Poslední z pravidel pak umožňuje efektivní výpočet derivace složených funkcí a říkává se mu „řetězové pravidlo".
Intuitivně jim můžeme všem velice snadno rozumět, když si derivaci funkce y — f (x) představíme jako podíl přírůstků závislé proměnné y a nezávislé proměnné x:
Ay_ Ax'
t n. ,. (x + hr-x" {ny-'h + (^xn-2h2 + ... + hn
(x y = lim-= lim —-
h^O h h^O
h
nx"-1 + lim ( ('" )x"~2h + (|x"~3/i2 + • • • + hn~l
h
h^O \ \2
nx
, ,_. y/x + h - ~Jx {yjx +h — Vx)(V-x + h + y/x)
(V*) = bm-= lim--=-
h^o h h^o /i(Vx + h + y/x)
lim
h
lim
1
h^O h{y/x + k + y/x) h^O y/x + h + y/x 1
2yfx
(sinx)' = lim
sin(x + h) — sinx h
sin x cos h + cos x sin h — sin x lim-
h^O h
cosx sin/i sinx(cos/i — 1) lim--h lim-
h^O h h^O h
cosx • lim
sin/i 2(sin^)2 lim
h^O h h^O h
siní
cos x • 1 + lim sin t -
t^o t
cosx.
□
277
KAPITOLA 5. ZŘÍZENÍ ZOO
Samozřejmě pak při y — h (x) — f(x) + g (x) je přírůstek y dán součtem přírůstků / a g a přírůstek závislé proměnné zůstává stejný. Je tedy derivace součtu součtem derivací.
U součinu musíme být malinko pozornější. Pro y — f (x) g (x) je přírůstek
Ay = f (x + Ax)g(x + Ax) - f (x) g (x) = f(x+Ax)(g(x+Ax)-g(x)) + (f(x+Ax)- f(x))g(x)
Nyní ale když budeme zmenšovat přírůstek Ax, jde vlastně o výpočet limity součtu součinů a o tom už víme, že jej lze počítat jako součet součinů limit. Proto z naší formulky lze očkávat pro derivaci součinu f g výraz f g' + f g, kterému se říká Leibnizovo pravidlo.
Ještě zajímavěji se chová derivace složené funkce
g = h o f,
kde definiční obor funkce z — h(y) obsahuje obor hodnot funkce y — f (x). Opět vypsáním přírůstků dostáváme
Az _ Az Ay Ax Ay Ax' Můžeme tedy očekávat, že pravidlo pro výpočet bude
(h o f)'(x) = h'(f(x))f'(x).
Podáme nyní korektní formulace a důkaz:
j Pravidla pro derivování j^.—^—-—
5.74. Zderivujte a výsledek upravte:
i) x sin x,
ii) 䣣,
iii) ln(x + Vx2 — a2), a 7^ 0, |x| > \a\,
iv) arctan ^-^===^, |x| < 1,
v) xx.
Řešení, (i) Podle pravidla o derivování součinu funkcí, tedy Leibni-zova pravidla, viz 5.33 dostáváme
(x sinx)' = x' ■ sinx + x • (sin x)' = sin x + x cos x.
(ii) Podle pravidla o derivování podílu funkcí (5.34) je
sinx (sinx)'• x — sinx • x' x cosx —sinx
X X2 X2
(iii) Použijeme pravidla pro derivování složené funkce (5.33).
Označíme-li h(x) = ln(x), f(x) = x + Vx2 — a2, máme
ln(x + Vx2 - a2)' = h(f(x)Y = h(f(x)) ■ f'(x)
(x + V-*
2V
a2)
+ Vx2
1 +
+ Vx2"
Věta. Nechť f a g jsou reálné nebo komplexní funkce definované na okolí bodu xo € R a mající v tomto bodě vlastní derivaci. Potom
(1) pro každé reálné nebo komplexní číslo c má funkce x c ■ f (x) derivaci v xq a platí
(c/)'(x0) = c(/'(x0)),
(2) funkce f + g má v xq derivaci a platí
(/ + s)'(*o) = /'(*o) + s'(*o),
(3) funkce f ■ g má v xq derivaci a platí
(f ■ g)'(xo) = /'(xo)s(xo) + /(xo)s'(xo).
(4) Je-li dále h funkce definovaná na okolí obrazu yo = f(xo), která má derivaci v bodě yo, má také složená funkce h o f derivaci v bodě xq a platí
(h o /)'(x0) = h'(f(x0)) ■ f'(xo).
kde jsme pro derivování výrazu Vx2 — a2 použili opět pravidlo o derivování složené funkce, (iv) Opět derivujeme složenou funkci:
arctan
i
i +
l-x2
VT^x2 +
1 +
l-xz
Vl - X2 +
1
VT^x2 VT^x2
(v) Funkci je nejprve převedeme na funkci o konstatním základu (nejlépe o základu e), kterou už umíme derivovat.
(xx)' = ((elnx)x)' = (
„x ln x \ f
(x ln jc) • e
/ „i lni
)'
(1 + lnx) • ŕ
Důkaz. (1) a (2) Přímé použití věty o součtech a součinech limit funkcí dává výsledek.
(3) Přepíšeme vztah pro podíl přírůstků, který jsme zmínili před formulací věty, takto
(fg)(x) - (fg)(xo) s/ ,g(x)-g(x0) | f(x)-f(x0) - = f(x)--1--g(xo)-
x — xq x — xq x — xq
Limita tohoto výrazu pro x —>• xo dá právě požadovaný výsledek, protože je funkce / spojitá v xq.
(4) Podle lematu 5.31 existují funkce ty a 0.
Řešení. Platí
(xsin*)' = (esinx lnx)' = ďinx lnx (cosx lnx + ^) xúnx (cosx lnx + .
h(y) - h(y0) +
lim
lim
x — x — Ax
AjČ^ío Ax Ajc^o Ax(x2 + xAx)
-1
Ajc^o x2 + xAx a z pravidel pro počítání limit okamžitě plyne
h' (xo) — —x-2.
Nyní pravidlo pro derivaci složené funkce říká, že
-g~2-g\
a konečně pravidlo pro derivaci součinu nám dává právě
a/*)' = (/ • g~ly = fg~l - fg~2g' = f'8~ď.
□
5.35. Derivace inverzních funkcí. V odstavci 1.36 jsme při obecné diskusi relací a zobrazení formulovali pojem inverzní funkce. Pokud k dané funkci / : R —>• R inverzní funkce f~l existuje (nezaměňujme značení i- s funkcí x (/(x))-1), pak je dána jednoznačně kterýmkoliv ze vztahů
/ o / = idM, f o f
idú
a druhý již pak platí také. Pokud je / definováno na podmnožině A c Rdi f (A) — B,je existence f~l podmíněna stejnými vztahy s identickými zobrazeními id^ resp. idB na pravých stranách. Jak je vidět z obrázku, graf inverzní funkce prostě dostaneme záměnnou os závislé a nezávislé proměnné.
O
Doporučujeme čtenáři si vymyslet funkce, které potom sám zde-rivuje. Výsledek si může ověřit v celé řadě matematických výpočetních programů. V následujícím příkladu si uvědomíme geometrický význam derivace bodě, totiž, že určuje směrnici tečny ke grafu v daném bodě (viz 5.32)
5.78. Za pomoci diferenciálu přibližně určete arccotg 1, 02.
Řešení. Diferenciál funkce / se spojitou první derivací v bodě x0 je roven
/' (x0) dx = f (xo) (x - xo). Rovnice tečny ke grafu funkce / v bodě [x0, f(xo)] je pak
y - f (*o) = /' (*o) (x - xo) ■ Odtud je vidět, že diferenciál funkce je přírůstek funkce na tečně. Hodnoty na tečně ovšem aproximují hodnoty f(x), je-li rozdíl x — xo „malý". Získáváme tak vzorec pro přibližné určení funkční hodnoty pomocí diferenciálu ve tvaru
/(*) ~ / (*o) + /' (*o) (x - Xo) . Položíme-li tedy
f(x) := arccotgx, xo := 1,
obdržíme
arccotg 1, 02 « arccotg 1 + ^ (1, 02 - 1) = f - 0, 01
Ještě podotkněme, že bod x0 sice volíme tak, aby výraz x — x0 byl blízký nule, ale současně musíme být schopni v tomto bodě vyčíslit funkce / a /'. □
5.79. Za pomoci diferenciálu přibližně určete arcsin 0, 497.
5.80. Za pomoci diferenciálu vyčíslete
a :=arctgl,02; b := ^70.
5.81. Pomocí diferenciálu přibližně vyjádřete
O
o
(a) sřn(H);
279
KAPITOLA 5. ZŘÍZENÍ ZOO
Pokud bychom věděli, že pro diferencovatelnou funkci x = /()>) je i y = /_1(x) diferencovatelná, pravidlo pro derivaci složené funkce nám okamžitě říká
1 = (id)'(x) = (/ o f-l)'(x) = f(y) ■ (f-l)'(x)
a tedy pak přímo dostáváme vzorec (zjevně f'(y) v takovém případě nemůže být nulové)
| Derivace inverzní funkce |^__————«
(5.6)
i
f'(y)
Ay Ax
^j. Takto skutečně můžeme derivace inverzních
To dobře odpovídá intuitivní představě, že pro y = f (x) je přibližně /' = -57 zatímco pro x = f~1(y) je to přibližně
(f-'Yiy) =
funkcí počítat:
Věta. Je-li f reálná funkce diferencovatelná v bodě xq av tomto bodě platí /'(xo) ^ 0, pak existuje na nějakém okolí bodu yo : • funkci f~l inverzní k f a platívztah (5.6).
Důkaz. Nejprve si povšimněme, že nenulovost derivace v xo znamená, že na nějakém okolí bodu xo je naše funkce / buďrostoucí nebo klesající, viz důsledek 5.32. Proto na nějakém okolí nutně existuje inverzní funkce. Protože je obrazem ohraničeného uzavřeného intervalu ve spojité funkci opět uzavřený interval, nutně je také pro každou otevřenou množinu U v definičním oboru / i obraz f(U) otevřený. Potom ale přímo z definice spojitosti pomocí okolí je tato inverzní funkce také spojitá.
Pro odvození našeho tvrzení nyní postačí pozorně znovu pročíst důkaz čtvrtého tvrzení věty 5.33. Jen volíme / místo funkce /za/-1 místo / a místo předpokladu existence derivací pro obě funkce víme, že funkce složená je diferencovatelná (a víme, že je to identická funkce): Skutečně, podle lematu 5.31 existuje funkce i/r spojitá v bodě yo taková, že
f(y) - f(yo) = (p(y)(y - yo),
na nějakém okolí yo. Navíc pro ni platí
R je spojitá na konečném uzavřeném intervalu [a, b]a diferencovatelná uvnitř tohoto intervalu. Jestliže platí f (a) = f(b), pak existuje c e (a, b) takové, že f'(c) = 0.
l+x
< ln (1 + x) < x pro všechna x > 0.
F. Extremální úlohy
O
Jednoduché pozorování 5.32 o geometrickém významu derivace nám také říká, že extrémy diferencovatelné reálné funkce jedné reálné proměnné mohou nastat pouze v bodech, kde je derivace dané funkce nulová. Tohoto prostého faktu lze využít při řešení množství zajímavých praktických úloh.
5.93. Určete x-ovou souřadnici xA bodu paraboly y = x2, který je nejblíže bodu A = [1,2].
Řešení. Není obtížné uvědomit si, že příklad má právě jedno řešení a že úkolem je vlastně najít absolutní minimum funkce
f(x) = V(x - l)2 + (x2 - 2)2, x e R. Funkce / má zjevně nejmenší hodnotu ve stejném bodě jako funkce
g(x) = (x - l)2 + (x2 - 2)2, x e R.
Neboť
g'(x) = 4x3 - 6x - 2, x e R, řešením rovnice 0 = 2x3 — 3x — 1 dostáváme nejprve stacionární bod x = — 1 a po vydělení polynomu 2x3 — 3x — 1 polynomem x + 1 také zbývající dva stacionární body
1-V3 „ 1+73
~1~ a ~1~ ■
Protože funkce g je polynomem (má derivaci na celé reálné ose), z geometrického významu úlohy již získáváme
Y _ 1+73 XA - —j—.
□
5.94. Do rovnoramenného trojúhelníku o základně z a výšce i; (nad základnou) vepište obdélník (jedna jeho strana bude částí základny trojúhelníku) s nej větším obsahem. Stanovte obsah S tohoto obdélníku.
Řešení. Pro vyřešení příkladu postačuje uvažovat úlohu, kdy se snažíme vepsat do pravoúhlého trojúhelníku s odvěsnami délek z/2 a i; obdélník s maximálním možným obsahem, přičemž dvě jeho strany musí být částmi odvěsen tohoto trojúhelníku. Úlohu takto převedeme na otázku maximalizace funkce
f{x)=x(v-2-f) na intervalu / = [0, z/2]. Neboť je
fix) = v
pro všechna x s I
281
KAPITOLA 5. ZŘÍZENÍ ZOO
a dále
Důkaz. Protože je funkce / spojitá na uzavřeném intervalu (tj. kompaktní množině), má na něm maximum a minimum. Pokud by maximum i minimum mělo stejnou hodnotu f (a) — f(b), pak by funkce / byla konstantní a tedy i její derivace by byla nulová ve všech bodech intervalu (a,b). Předpokládejme tedy, že buď maximum nebo mimimum je jiné. Pak ovšem nastává jedno z nich ve vnitřním bodě c. Kdyby v platilo f'(c) / 0, pak by v tomto bodě byla byla funkce / buď rostoucí nebo klesající (viz 5.32) a jistě by tedy v okolí bodu c nabývala větších i menších hodnot, než je f(c). Je tedy nutně f'(c) = 0. □
Právě dokázanému tvrzení se říká Rolleova věta.5 Z ní snadno vyplývá následující důsledek, známý jako Lagrangeova věta o střední hodnotě.6
5.38. Věta. Nechť funkce f : M. -> M je spojitá na intervalu [a, b] a diferencovatelná uvnitř tohoto intervalu. Pak existuje c e (a, b) takové, že
f(b) - f (a)
f'(c) =
Důkaz. Důkaz je prostým zápisem geometrického významu .J&fy tvrzení: k sečně mezi body [a, f (a)] a [b, f(b)] existuje tečna, která je s ní rovnoběžná (podívejte se na obrázek). Rovnice naší sečny je
y — g (x) — f (a) + -^-^-(x - a).
/(O) = /(§)= 0, f (x) > 0, xel,
v jediném svém stacionárním bodě xq = z/4 nutně nabývá funkce / maxima na /. Proto jsou strany hledaného obdélníku dlouhé z/2 (dvojnásobek x0: uvažujeme původní úlohu) a v/2 (to lze získat dosazením z/4 za x do výrazu i; — 2vx/z). Odsud dostáváme, že S = vz/4. □
5.95. Mezi obdélníky, jejichž dva vrcholy leží na ose x a další dva s kladnými druhými souřadnicemi na parabole y = 8 — 2x2, najděte obdélník s maximálním obsahem.
Řešení. Základna obdélníku s maximálním obsahem měří 4/ V3, jeho výška pak 16/3. Tento výsledek lze obdržet nalezením absolutního maxima funkce
S(x) = 2x(S-2x2)
na intervalu / = [0, 2]. Neboť tato funkce je na / nezáporná, v krajních bodech / nulová a má derivaci na celém /, přičemž její derivace je nulová pouze v jednom bodě intervalu /, a to v bodě x = 2/-J3, nabývá zde maximální hodnoty. □
5.96. Je dána elipsa 3x2 + y2 = 2. Napište rovnici tečny, která vytína v prvním kvadrantu trojúhelník o nejmenším obsahu a určete jeho velikost.
Řešení. Přímka zadaná rovnicí ax + by + c = 0 má s osami průsečíky [—|, 0], [0, — |] a obsah trojúhelníka s vrcholy v těchto
2
bodech a v počátku je 5 = Rovnice tečny v bodě [xT, yT] je 3xxT + yyT —2 = 0. Obsah trojúhelníka určený touto tečnou je tedy S = 3x2yT. V prvním kvadrantu přitom máme xT,yT > 0. Minimalizovat tento obsah znamená maximalizovat součin xTyr =
JRolle byl ^Lagrange byl.
xj^j2 — 3xT, což je v prvním kvadrantu to samé, jako maximalizovat (xTyT)2 = x\(2 — 3x2T) = —3(x2j — |)2 + |. Hledané minimum obsahu je tedy v xT = Tečná má rovnici V3x + y = 2 a velikost tohoto obsahuje Smin = 2-^. □
5.97. Ve čase t = 0 se začaly pohybovat tři body P, Q, R v rovině a to bod P z bodu [—2, 1] směrem (3, 1) rovnoměrnou rychlostí \/TÔ m/s, bod Q z bodu [0, 0] směrem (—1, 1) rovnoměrně zrychleným pohybem se zrychlením 2^2 m/s2 a bod R z bodu [0, 1 ] směrem (1,0) rovnoměrnou rychlostí 2 m/s. V jakém čase bude obsah trojúhelníku P Q R minimální?
282
KAPITOLA 5. ZŘÍZENÍ ZOO
Rozdíl h(x) = f(x) — g(x) udává vzdálenost grafu od sečny (v hodnotách y). Jistě platí h(a) = h(b) a
/(*>) " /(«)
Řešení. Rovnice bodů P,Q,Rv čase jsou
h'(x) = f'{x)
□
Podle předchozí věty existuje bod c, ve kterém je h'{c) = 0.
Větu o střední hodnotě můžeme také přepsat ve tvaru:
(5.9) f(b) = f(a) + f(c)(b-a).
V případě parametricky zadané křivky v rovině, tj. dvojice funkcí y = f (t), x = g (f), je stejný výsledek o existenci rovnoběžné tečny k sečně krajními body popsán ve tvaru tzv. Cauchy-ovy věty o střední hodnotě:
Důsledek. Nechť funkce y = f {t) a x = g (t) jsou spojité na intervalu [a, b] a diferencovatelné uvnitř tohoto intervalu a g'(t) ^ 0 pro všechny t e (a, b). Pak existuje bod c e (a, b) takový, že platí
f (b) - f (a) _ f'(c) g(b)-g(a) g'(c) Důkaz. Opět spoléháme na použití Rolleovy věty. Položíme proto
h(t) = (f (b) - f(a))g(t) - (g(b) - g(a))f(t).
Nyní h(a) = f(b)g(a)-f(a)g(b),h(b) = f(b)g(a)-f(a)g(b), takže existuje c e (a, b) takový, že h'(c) = O.Protožejeg'(c) ^ 0, dostáváme právě požadovaný vztah. □
Podobná úvaha jako v posledním tvrzení vede k mimořádně užitečnému nástroji pro počítání limit podílu funkcí. Tvrzení je znám jako ĽHospitalovo pravidlo?
5.39. Věta. Předpokládejme, že f a g jsou funkce diferencovatelné v okolí bodu xq e M, ne však nutně v bodě xq samotném, a nechť existují limity
lim f(x) = 0,
X^XQ
lim g(x) = 0.
X^*XQ
Jestliže existuje limita
pak existuje i limita
a jsou si rovny.
lim
x^x0 g'(x)
lim -
*->*0 g(x)
ĽHO&ITAL0VO TKAVIDLO
p
Q R
[-2, 1] + (3, l)ř, [0, 0] + (-l,l)ŕ2, [0, 1] + (2, 0)ŕ.
Obsah trojúhelníka P Q R je určený např. polovinou absolutní hodnoty determinantu, jehož řádky jsou souřadnice vektorů P Q a Q R (viz 1.34). Minimalizujeme tedy determinant:
-2 + t
t
-1 +ŕ2
2ť - t + 2.
ĽHospital byl.
-t1 - 2t
Derivace je 6t2 — 1, extrémy tedy nastávají pro t = ±--jg- Vzhledem k tomu, že uvažujeme pouze nezáporný čas, vyšetřujeme pouze t = . Druhá derivace uvažované funkce je v tomto bodě kladná, funkce obsahu zde tedy nabývá svého lokální minima. Navíc je její hodnota v tomto bodě kladná a menší, než hodnota v bodě 0 (krajní bod intervalu, na kterém hledáme extrém), jedná se tudíž o globální minimum obsahu v čase. □
5.98. V devět hodin ráno vylezl starý vlk z nory V a v rámci ranní rozcvičky začal běhat proti směru hodinových ručiček po kružnici o poloměru lkm, kolem svého oblíbeného pařezu f a to rovnoměrnou rychlostí 4 km/h. Ve stejnou dobu vyrazila Karkulka z domu D k babičce sídlící v chaloupce C rychlostí 4 km/h (po přímce). Kdy si budou nejblíž a jaká tato vzdálenost bude? Souřadnice (v kilometrech): N = [2, 3], P = [2, 2], D = [0, 0], C = [5, 5].
Řešení. Vlk se pohybuje po jednotkové kružnici, jeho úhlová rychlost je tedy stejná jako jeho absolutní rychlost a jeho dráhu můžeme v závislosti na čase popsat následujícími parametrickými rovnicemi:
x(ř) = 2 - cos(4ř), y(t) = 2- sin(4ř),
Karkulka se pak pohybuje po dráze
x(ř) = 2V2ř, y(t) = 2J2t.
Nalezněme extrémy (čtverce) vzdálenosti p jejich drah v čase:
p(t) = [2 - cos(4ř) - 2V2ř]2 + [2 - sin(4ř) - 2V2ř]2, p'it) =16(cos(4ř) - sin(4ř))(V2ř - 1) + 32ř+ + 4V2(cos(4ř) + sin(4ř)) - 16^2.
Řešit algebraicky rovnici p' (ř) = 0 se nám nepodaří (ani to nelze), zbývá pouze najít řešení numericky (pomocí výpočetního softwaru). Je jasné, že extrémů bude nekonečně mnoho: při každém kolečkuje směr pohybu vlka v jistý časový okamžik rovnoběžný se směrem Karkulky,
283
KAPITOLA 5. ZŘÍZENÍ ZOO
Důkaz. Bez újmy na obecnosti můžeme předpokládat, že v xo mají funkce / ag nulovou hodnotu. ^ / Výsledek je opět jednoduše představitelný pomocí obrázku. Uvažujme body [g(x), f(x)] e R2 parametrizované proměnnou x. Podíl hodnot pak odpovídá směrnici sečny mezi body [0, 0] a [f(x), g(x)]. Zároveň víme, že podíl derivací odpovídá směrnici tečny v příslušném bodě. Z existence limity směrnic tečen tedy chceme dovodit existenci limity směrnic sečen.
Technicky lze využít věty o střední hodnotě v parametrickém tvaru. Předně si uvědomme, že v tvrzení věty implicitně předpokládáme existenci výrazu f(x)/g' (x) na nějakém okolí xo (kromě bodu xo samotného), zejména tedy pro dostatečně blízké body c k xo bude g'(c) / O.8 Díky větě o střední hodnotě nyní
f(x) lim -= lim
/(*) - /(x0)
= lim
f'(Cx)
>x0 g(x) x^x0 g(x) - g(x0) x^x0 g'(cx) kde cx je číslo mezi xo a x, závislé na x. Z existence limity
,. fix) lim -
*->*0 g'(x)
vyplývá, že stejnou hodnotu bude mít i limita libovolné posloupnosti vzniklé dosazením hodnot x — xn jdoucích k xo do f(x)/g'(x). Zejména tedy můžeme dosadit jakoukoliv posloupnost cXn pro x„ -> xq a proto bude existovat i limita
,. f(cx) lim -
x^x0 g'(cx)
a poslední dvě limity zjevně budou mít stejnou hodnotu. Dokázali jsme tedy, že naše hledaná limita existuje a má také stejnou hodnotu. □
Z důkazu věty je samozřejmé, že její tvrzení platí i pro jednostranné limity.
5.40. Důsledky. ĽHospitalovo pravidlo můžeme jednoduše rozšířit i pro limity v nevlastních bodech ±oo a pro případ nevlastních hodnot limit. Je-li, např.
lim f(x) = 0, lim g(x) = 0,
x^oo x^oo
potom je limx^0+ /(1/x) — 0 a limx^0+ g(l/x) — 0.
Zároveň z existence limity podílu derivací v nekonečnu dostaneme
(/(!/*))' ,. fd/xK-l/x2)
lim
*^o+ (g(l/x))' x-
lim
lim
Ď+ s'(l/x)(-l/x2)
/'(1/x) f'(x)
lim
>0+ g'(l/x) X^QO g'(X)
Použitím předchozí věty tedy dostáváme, že v tomto případě bude existovat i limita podílu
lim
/(*)
lim
fd/x)
lim
g(x) X^0+ g(l/x) X^QO g'(X)
Ještě jednodušší je postup při výpočtu limity v případě, kdy
±oo, lim g(x) — ±oo.
X^XQ
lim f(x)
X^XQ
Pro samu existenci limity v obecném smyslu to vždy nutné není, nicméně pro tvrzení UHospitalovy věty je to potřebné. Podrobnou diskusi je možné najít (vygooglovat) v populárním článku 'R. P. Boas, Counterexamples to ĽHôpital's Rule, The American Mathematical Monthly, October 1986, Volume 93, Number 8, pp. 644-645.'
jejich vzdálenost se tedy po jistou dobu snižuje; Karkulka se však neustále vzdaluje konstantní rychlostí od středu kruhu, kolem kterého obíhá vlk. Zjistíme, že první lokální minimum nastává pro t = 0, 31 a poté pro t = 0, 97, kdy bude vzdálenost vlka a Karkulky asi 5 metrů. Je zřejmé, že půjde i o globální minimum.
Situace, kdy neumíme explicitně vyřešit daný problém, je v praxi velmi častá a použití numerických metod výpočtu má velký význam. □
5.99. Halleyova úloha, 1686. Hráč stojí před basketbalovým košem r/^> ve vzdálenosti l od obroučky, která je ve výšce h nad bo-
W^WÍ dem odhodu. Určete minimální počáteční rychlost v0, kterou Tijt- musí udělit míči, aby skóroval, a příslušný elevační úhel cp
pro toto v0. Viz obrázek.
Řešení. Opět vynecháváme fyzikální jednotky: můžeme předpokládat, že údaje o vzdálenostech jsou uváděny v metrech a časové údaje v sekundách (rychlosti pak v metrech za sekundu). Nechť hráč hodí míč v čase t = 0 a nechť míč projde obroučkou v čase t0 > 0. Pozici míče (během jeho letu) vyjádříme body [x(ř), y(t)] pro t e [0, t0], přičemž požadujeme, aby x(0) = 0, y(0) = 0, x(ř0) = l, y(to) = h. Zřejmě je
x1 (ř) = vq cos cp, y (ř) = vq sin cp — gt
pro t € (0, to), kde g je normální tíhové zrychlení (konstanta gravitačního zrychlení). Hodnoty x' (ř) a / (ř) totiž po řadě udávají horizontální a vertikální rychlost míče. Integrováním těchto rovnic získáme
x(t) = vot cos cp + c\, y(t) = vot sincp 2 pro t € (0, řo) a c\, c2 etZ počátečních podmínek
x(0) = 0, lim y(t) = y(0) = 0 plyne, že ci = c2 = 0. Dosazení zbývajících podmínek
* gt2 + c2
lim x(ř)
t^0+
lim x(ř)
lim y(t) t->t0-
x(t0) = l,
o-
tak již dává
l = VqÍq cos cp, Podle první rovnice je
(5.1) ř0 =-,
Vq COS (p
a tudíž dostáváme jedinou rovnici
y(to) = h
h = vqíq sin
xo g (x) x^x0 l/f(x)
což je již případ pro použití ĽHospitalova pravidla z předchozí věty. Lze ale i dokázat, že ĽHospitalovo pravidlo platí ve stejné formě pro nevlastní limity:
Věta. Nechť f a g jsou funkce diferencovatelné v okolí bodu xq e M, ne však nutně v bodě xq samotném, a nechť existují limity
lim
■x->xo .
f (x) — ±00 a limx^X(j g(x) — ±00. Jestliže existuje
limita
pak existuje i limita
a jsou si rovny.
lim
*->*o g'(x)
,. f(x) hm -
*^*o g (x)
Důkaz. Opět lze vyjít z věty o střední hodnotě. Základem je vyjádření podílu tak, abychom dostali do hry derivaci:
/(*) = /(*) f(x)-f(y) g(x)-g(y) g(x) f(x) - f(y) g(x) - g(y) g(x)
kde za y volíme nějaký pevný bod ze zvoleného okolí xo a x necháme blížit k xo. Protože jsou hmity / i g v xo nekonečné, můžeme jistě předpokládat, že rozdíly hodnot v x a y jsou u obou funkcí při pevném y nenulové.
Pomocí věty o střední hodnotě můžeme nyní nahradit prostřední zlomek podílem derivací ve vhodném bodě c mezi x a y a výraz ve zkoumané limitě dostává tvar
f(x) g(x)
1
1
Mži w, . g(x) J (c)
f (x) 6
příklady budou jistě hodjně v druhé části textu, včetně takových jako je zaprocentován
kde c závisí na x i y. Při pevném y a x jdoucím k xo jde první zlomek zjevně k jedničce. Když zároveň budeme y přibližovat k xo, bude se nám druhý zlomek libo volně přesně blížit k hmitní hodnotě podílu derivací. □
5.41. Příklad použití. Vhodnými úpravami sledovaných výrazů lze využít Ľ Hospitalova pravidla také na výrazy typu 00 — 00,100, 0 • 00 apod. Zpravidla jde o prosté přepsání výrazů nebo o využití nějaké hladké funkce, např. exponenciální.
Ukážeme si pro ilustraci takového postupu souvislost aritmetického a geometrického průměru z n nezáporných hodnot x;. Aritmetický průměr
M (xi,
> Xn) —
XI
n
je speciálním případem tzv. mocninného průměru stupně r.
1
Af(xi,...,x„)
n
Speciální hodnota M~l se nazývá harmonický průměr. Spočtěme si nyní hmitní hodnotu Af pro r jdoucí k nule. Za tímto účelem spočteme limitu pomocí ĽHospitalova pravidla (jde o výraz 0/0 a derivujeme podle r, zatímco x; jsou při výpočtu konstantní parametry).
Následující výpočet, ve kterém užíváme pravidla pro derivování složených funkcí a znalosti hodnot derivace mocninné funkce,
minimální hodnotu v0, pro kterou bude existovat
- 7frtg
0.
Také nyní nám substituce (tentokráte q = vfy umožní přejít ke kvadratickému výrazu (na levé straně nerovnice) a následně získat
(yl -g[h + Vh^TpJj (v2 -g[h- VJčTpJ) > 0. Protože h < \Jh2 + 12, musí být
v20>
h + jh2 + P Nejmenší přípustné hodnotě
(5.4) v0 ~-
potom odpovídá (viz (||5.3||))
tj. v0
h + V/12 + P
h + \//i2 + P
(5.5) tgcp = -2-
h + V/12 + P
tj. cp = arctg
h + V/12 + P
gl l 0 l
Předchozí výpočet byl ovšem založen na podmínkách x(ř0) = l, y(fo) = h, které pouze udávají požadovanou polohu v čase to. Míč však mohl projít obroučkou zespodu. Doplňme proto podmínku ý (t0) < 0, která říká, že míč v čase t0 už klesal, a dokažme, že je pro v0 z (||5.4||) a
0 r^O X\ \nx\-\-----\-xrn lnxn
— lim
lnxi + • • • + lnx„
— In yxi.....x„.
Odtud tedy je přímo vidět, že lim Af (xi, ...
což je hodnota známá pod názvem geometrický průměr.
lim Af (xi, ..., x„) = y/x\... xn,
r-*0
4. Mocninné řady
5.42. Jak se počítá e*. Kromě sčítání a násobení už umíme také počítat s hmitami posloupností. Podbízí se proto přibližovat nepolynomiální funkce pomocí posloupností spočítatelných hodnot.
Když se takto podíváme na funkci e*, hledáme vlastně funkci, jejíž okamžitý přírůstek je v každém bodě roven hodnotě této funkce. To si můžeme dobře představit jako úžasné úročení vkladu se sazbou rovnou okamžité hodnotě. Když budeme roční sazbu úroku realizovat jednou za měsíc, za den, za hodinu atd., budeme pro výnos vkladu x po jednom roce dostávat výsledné hodnoty
—V
365/
x \
8760
8760/
Dalo by se tedy tušit, že bude platit:
lim
i X \" +
Zároveň tušíme, že čím jemněji budeme postupovat při úročení, tím vyšší bude výnos, takže by posloupnost čísel na pravé straně měla být rostoucí.
Podívejme se tedy podrobně na číselnou posloupnost
an — 1
jejíž hmita má být Eulerovo číslo e.
Bude se nám přitom hodit velice užitečná Bernoulliova nerovnost:
Lemma. Pro každé reálné číslo b > —1, b ^ 0, a přirozené n > 2 platí (1 + b)n > 1 + nb.
Důkaz. Pro n — 2 dostáváme
(1 + b)2 = 1 + 2b + b2 > 1 + 2b.
Dále postupujeme indukcí za předpokladu b > — 1. Předpokládejme, že tvrzení platí pro nějaké k > 2 a počítejme
(1 + b)k+l = (1 + b)k(l + b) > (1 + kb)(\ + b)
= l + (k+l)b + kbz > l + (k + l)b Tvrzení zřejmě platí také pro b — — 1.
I sin
|1-^ "
n )n — 1
1.
Je tedy naše posloupnost skutečně rostoucí.
Následující obdobný výpočet (opět s využitím Bernoulliovy nerovnosti) ověřuje, že posloupnost čísel
b„
1
1 + -
n
n + l
je klesající a jistě je bn > an.
b„
' n + l
1 \ S±2
\ n + l ,
n
n+l
1
1
1 + -
n
n
n ■+ 1
n+l
1
1 + -
n
■2n + l
2n
n+l
n + 1 n
n(n + 2) n+ 2
= 1.
n + 1 \ n (n + 2) /
Posloupnost an je tedy shora ohraničená a rostoucí a proto je její limita dána jejím supremem. Zároveň vidíme, že je tato limita rovna také limitě klesající posloupnosti bn, protože
1
lim b„ — lim (1 H—)a„ — lim a„.
n^oo n^oo n n^oo
Tato limita proto zadává jedno z nej důležitějších čísel v matematice (vedle nuly, jedničky a Ludolfova čísla it), Eulerovo číslo e. Je tedy
e = lim ( 1 + 1
n^oo y n /
5.43. Mocninná řada pro e*. Exponenciální funkci jsme defi-1 „ novali jako jedinou spojitou funkci splňující /(l) — e a f(x + y) — fix) ■ fiy). Základ e máme vyjádřen jako limitu posloupnosti čísel a„, nutně tedy je, pro každé pevné 5 ' reálné číslo x,
ex — lim ian)x.
n^oo
Počítejme nyní pro jednoduchost s pevně zvoleným kladným x. Jestliže v hodnotách a„ z minulého odstavce zaměníme n za n /x, opět dostatneme stejnou limitu (rozmyslete si podrobně) a proto také
e = lim (l + - V , ex = lim (l + -)" .
Označme n-tý člen této posloupnosti u„(x) — (1 4- x/n)n a vyjádřeme jej pomocí bionomické věty:
x nin — 1)jt nlx" n /Anz nin"
x2 + V. x3 /. ľ 3! \ n/ \ n x" /. 1\ /. 2\ /. n - 1
«„(x) = 1 = 1 + j
(5.10)
2!«2 1
minimální množství prachu jako pro zasažení horizontálního cíle ve vzdálenosti h + ^/h2 + Z2 (při úhlu
o dána a měnné je R v závislosti na
R'(cp) [i>o sin2 N. Pro takto velká y je ovšem c,-+i < \cj < 2-0-w+i) Cn _ j0 aje znamená, že částečné součty prvních n členů v našem formálním součtu jsou shora ohraničeny součty
N-l 1 1 n-N *
y 1xj + ±yv y 1
^ i\ NI ^ V
Protože pro každé g platí (1 — q)(l + q můžeme hodnoty v„ také odhadnout
qk) = 1 -q<
k+1
N-l
y Lxj + Ayv(1_2-„
+N-1
Limita výrazů na pravé straně pro n jdoucí do nekonečna proto jistě existuje a tedy existuje i limita rostoucí posloupnosti v„.
Nyní si prohlédněme pozorněji posloupnost čísel u„, jejíž limitou je ex. Budeme chtít uvažovat n > N pro nějaké pevné N (hodně velké) a k < N pevné (docela malé) a /§ označíme si prvních k členů ve výrazu (5.10) pro u„. 'i Pro dané x a e > 0, umíme zvolit k tak, aby u„^ + e > un, pro všechna n > k (skutečně, zbylé členy jsou všechny kladné a j eště menší, než ty ve v„, které j sme odhadli výše). Přitom zároveň pro naše pevné k můžeme volbou dostatečně velikého N zařídit, aby pro všechna n > N bylo také un^ < vk < (protože pro pevné k máme ve výrazech pro u„^ jen konečně mnoho závorek a volbou velikého n budou všechny libovolně blízko k jedničce).
Stačí ověřit, že Uq sin 2
q sin 2
0 můžeme najít N tak, aby lim„^oo Ylk=N h^~l < € Pro všechna — 1 < x < 1. Pak jistě pro dostatečně malá x můžeme zmenšit i součet prvních N — 2 sčítanců na nejvýše e. Půjdeme-li přitom s číslem e k nule, zjistíme, že limita limitního výrazu napravo je nulová a proto zkoumaná limita skutečně existuje a je rovna jedné. □
Čtenáři, kteří předchozí řádky přeskočili (ať už schválně nebo v nouzi) mohou v klidu počkat, až odvodíme předchozí výsledek z obecných teoretických úvah jednodušeji (časem totiž ukážeme, že jsou funkce zadané jako nekonečné polynomy vždy diferencovatelné a že je lze derivovat člen po členu, ještě později ukážeme, že je podmínky fix) — fix) a /(O) — 1 určují funkci / jednoznačně).
5.45. Číselné řady. Při odvození předchozí důležité věty o funkci ex jsme mimoděk pracovali s několika mimořádně užitečnými pojmy a nástroji. Zformulujeme si je nyní obecněji:
číselné nekonečné řady
Definice. Nekonečná řada čísel je výraz
oo
a„ — flo + «1 + «2 +----
ak
«=0
kde an jsou reálná nebo komplexní čísla. Posloupnost částečných součtů je dána svými členy Sk — J2n=o a» a říkáme, že řada konverguje a je rovna s, jestliže existuje konečná limita částečných součtů
s = lim s„.
Jestliže posloupnost reálných částečných součtů řady má nevlastní limitu, říkáme že řada diverguje k oo nebo —oo, pokud limita částečných součtů neexistuje, říkáme, že je řada osciluje.
K tomu, aby posloupnost částečných součtů s„ konvergovala, je nutné a stačí, aby byla Cauchyovská. Tzn. že
km — Sn I — + l + ' ' ' + «m I
musí být libovolně malé pro dostatečně velká m > n. Protože je
\am\ >
vyplývá z konvergence řady Z~2kĹo\a"\ i konvergence řady
k=0 a" ■
sin 2cp0 = y/l — cos2 2cp0 = J\ je funkční hodnota
H+sh)
VQ+gh
R (cpo) = h tg 2(p0 = h
7"0+2^"0 r---
gh VQ+gh
vl + 2gh.
Nechťnapř. oštepárka Barbora Špotáková udělí oštěpu ve výši h = 1, 8 m rychlost v0 = 27, 778 m/s = 100 km/h (při g = 9, 806 65 m • s~2). Potom oštěp může doletět do vzdálenosti
R( 0, a proto j sme si mohli pomoci příslušnou jednostrannou limitou. □ Další rozličné úlohy na hledání extrémů funkcí jedné proměnné viz 312
289
KAPITOLA 5. ZŘÍZENÍ ZOO
„J Absolutně konvergentní řady ^.
Říkáme, že řada YlkLo fl« konverguje absolutně, jestliže konverguje řada YlT=o
Absolutní konvergenci jsme zavedli, protože se často daleko snadněji ověřuje, zároveň ale následující věta uka-I IíiZ-S zuje, že se v případě aboslutně konvergentních řad i | jednoduché algebraické operace chovají všechny velice dobře:
5.46. Věta. Nechť s = Y^Ĺo an a t = 2^,T=o bn jsou dvě absolutně konvergentní řady. Pak
(1) jejich součet absolutně konverguje k součtu
oo oo oo
S+r = ^a„ + ^ž>„ = ^(a„ +bn),
n—0 n—0 n—0
(2) jejich rozdíl absolutně konverguje k rozdílu
oo oo oo
s - t = ^fl„ -^2bn — ~ b„),
n—0 n—0 n—0
(3) jejich součin absolutně konverguje k součinu
/oo \ / oo \ oo / « \
st = (J2a») ■ (HbA = J2[J2an-kbk\.
\n=0
\n=0
n=0 \k=0
Důkaz. První i druhé tvrzení jsou bezprostředním důsledkem obdobných vlastností limit. Třetí tvrzení vyžaduje větší pozornost. Označme si
k=0
Z předpokladů a podle pravidel pro hmitu součinu posloupností dostáváme
Máme tedy dokázat, že
\n=0
\n=0
\\«=0 / \«=0 / n=0 I
Porovnejme si nyní výrazy
J2a") '(Hbn) = H aibJ
V«=0 / \«=0 / 0 žľc"= a'bj-
i+j—n n—0 i+jk i+i>k
+P 0i- \ 2 Poté ji spočtěte užitím 1'Hospitalova pravidla.
Řešení. Bezprostředně můžeme potvrdit, že je
(a)
lim (sin (2x) — 2 sinx) = 0 — 0 = 0,
x^O
^x JI
(b)
(c)
(d)
(e)
(f)
(g)
lim (2e* -x2-2x-2) = 2- 0- 0- 2 = 0;
x^0 V '
lim lnx = —oo, lim cotgx = +oo;
x^0+ x^0+
X 1
lim - = +oo, lim -= +oo;
x^i+ x — 1 *->■!+ lnx
lim lnx = 0, lim ln(x — 1) = —oo;
x^l+ x^l +
lim cotgx = +oo, lim -= 0;
x^o+ x^o+lnx
sinx 1 lim-= 1, lim — = +oo;
x^0 X
x^0 XL
7tX
lim cos — = 0, lim lnx =0.
x^l— 2 x^l —
290
KAPITOLA 5. ZŘÍZENÍ ZOO
více členů, tj. vezmeme všechny jako v součinu a odebereme pouze ty, u kterých jsou oba nejvýše k/2.
i+j>k 0 1. Při \q\ = 1 může řada konvergovat ale nemusí. (3) Jestliže existuje limita
lim
pak při q < 1 řada konverguje absolutně, zatímco při q > 1 nekonverguje. Je-li q = 1, může konvergovat i divergovat.
Důkaz. (1) Víme, že existence a případná hodnota limity posloupnosti komplexních čísel je dána pomocí limit posloupností reálných a imaginárních složek. První |£3ár tvrzení tedy stačí dokázat pro posloupnosti reálných čísel. Jestliže lim„^oo a„ neexistuje neboje nenulová, existuje pro dostatečně malé číslo e > 0 nekonečně mnoho členů ak s \ak I > e. Zároveň tedy musí mezi nimi existovat nekončené mnoho kladných nebo nekonečně mnoho záporných. Pak ovšem při přidání kteréhokoliv z nich do částečného součtu dostáváme rozdíl dvou po sobě jdoucích s„ a s„+i o velikosti alespoň e. Posloupnost částečných součtů proto nemůže být Cauchyovská a tedy ani konvergentní.
(2) Protože chceme dokazovat absolutní konvergenci, můžeme rovnou předpokládat, že členy řady j sou reálná čísla a; > 0. Důkaz jsme pro speciální hodnotu q = 1/2 provedli při odvození hodnoty ex pomocí řady. Uvažme nyní q < r < 1 pro nějaké reálné r. Z existence limity podílů dovodíme pro všechna j větší než dostatečně veliké N
To ale znamená, že částečné součty s„ jsou pro velká n > N shora ohraničeny součty
n-N N
sn
n-N+l
1 -r
j=0 j=0 j=0
Protože 0 < r < 1, je množina všech částečných součtů shora ohraničená rostoucí posloupnost a proto je její limitou její supre-mum.
Při hodnotě q > r > 1 použijeme obdobný postup, ale z existence limity podílu q hned na začátku odvodíme
aj+\ > r ■ aj > r
U-N+l)
ajv > 0.
Případ (a). Aplikování 1'Hospitalova pravidla převádí limitu
sin (2x) — 2 sin x
lim
na limitu
o 2e* - x2 -2x -2
2 cos(2x) — 2 cos x
lim
>o 2e* -2x -2 která je ovšem typu 0/0. Dalšími dvěma aplikacemi 1'Hospitalova pravidla dostáváme
—4 sin (2x) + 2 sinx lim-
x^o 2ex - 2
a (výše uvedená limita je opět typu 0/0)
— 8 cos (2x) + 2 cos x —8 + 2 lim-=-= —3.
x^o 2ex 2
Celkem tak máme (vrátíme se k původní limitě)
sin (2x) — 2 sin x lim---= —3.
x^o 2ex — x1 — 2x — 2
Dodejme, že opakované užití 1'Hospitalova pravidla v jednom příkladu je běžné.
Nadále budeme klást, že se limity podílů derivací získané 1'Hospi-talovým pravidlem přímo rovnají původním limitám podílů. Takto si můžeme počínat, pokud obdržené limity na pravých stranách budou existovat, tj. o platnosti zápisů se vlastně budeme přesvědčovat dodatečně.
Případ (b). Tentokráte derivování čitatele a jmenovatele dává lnx
lim
lim
sin2 x
>0+ COtgX x^0+ —j— sin x
lim
x^0+ X
Poslední limitu umíme snadno určit (dokonce ji známe). Z
sinx
lim — sinx = 0, lim -= 1
jc=>0+ jc=>0+ X
plyne výsledek 0 = 0-1. Také jsme mohli znovu použít 1'Hospitalovo
pravidlo (nyní pro výraz 0/0) s výsledkem
— sin2x —2-sinx-cosx —2-0-1 lim -= lim -=-= 0.
x^0+ X x^0+ 1 1
Případ (c). Pouze převodem na společného jmenovatele
lim
1
>i+ \x — 1 lnx jsme obdrželi typ 0/0. Je
lim
x lnx — (x — 1)
>i+ (x — 1) lnx
lim
x lnx — (x — 1)
lim
lnx + - - 1
lim
lnx
T+ (x - 1) lnx x'^\+ i-i + lnx 1 - - + lnx '
■ ' X X
Máme podíl 0/0, pro který (opět dle 1'Hospitalova pravidla) platí lnx z 1 1
lim
lim
i+1-i+lnx jc-n+ i+I 1 + 1 2
Návratem k původní Umitě zapíšeme výsledek
x 1 \ 1 " 2"
lim
1+ V x — 1 lnx
291
KAPITOLA 5. ZŘÍZENÍ ZOO
To ale znamená, že absolutní hodnoty velikostí jednotlivých členů řady nejdou k nule a proto tato řada nemůže konvergovat podle již dokázané části věty.
(3) Důkaz je zde velmi podobný předchozímu případu. Z existence limity q < 1 vyplývá, že pro každé q < r < 1 existuje N takové, že pro všechny n > N platí y/\a„ \ < r. Umocněním pak dostáváme \a„\ < rn, takže jsme opět v situaci, kdy srovnáváme s geometrickou řadou. Důkaz se proto dokončí stejně jako v případě podílového testu. □
V důkazu druhého i třetího tvrzení jsme využívali slabšího tvrzení, než je existence hmity. Potřebovali jsme pro studované posloupnosti nezáporných výrazů pouze tvrzení, že od určitého indexu už budou větší nebo menší než dané číslo.
K takovému odhadu nám ale postačí pro danou posloupnost b„ uvažovat s každým indexem n supremum hodnot členů s indexy vyššími. Tato suprema vždy existují a budou tvořit nerostoucí posloupnost. Její infimum pak označujeme jako limes superior dané posloupnosti a značíme
lim sup bn.
Výhodou je, že limes superior vždy existuje, můžeme proto předchozí výsledek (aniž bychom měnili důkaz) přeformulovat v silnější podobě:
Důsledek. Nechť S = Y]T=o a" Je nekonečná řada reálných nebo komplexních čísel.
(1) Je-li
an + l
q = lim sup
pak řada S konverguje absolutně při q < 1 a nekonverguje při q > 1. Při q = 1 může řada konvergovat ale nemusí. (2) Je-li
q = lim sup ý\an\,
pak při q < 1 řada konverguje absolutně, zatímco při q > 1 diverguje. Je-li q = 1, může konvergovat i divergovat.
5.48. Mocninné řady. Jestliže máme místo posloupnosti čísel an zp _ k dispozici posloupnost funkcí f„(x) se stejným definičním oborem A, můžeme bod po bodu použít definici součtu číselné řady a dostáváme pojem součtu řady funkcí
S(x) = ^/„(x).
4
n=0
Konvergence mocninné řady
Mocninná řada je dána výrazem
oo
S(x) = anx" .
n=0
Řekneme, že S(x) má poloměr konvergence p > 0, jestliže S(x) konverguje pro každé x splňující |x| < p a nekonverguje při |x| > p.
Případ (d). Uvedený výraz převedeme na typ oo/oo (přesněji řečeno, na typ —oo/oo) vytvořením zlomku
lim ln (x — 1) • lnx = lim
ln (x - 1)
x^l +
x^l +
Podle 1'Hospitalova pravidla je
ln (x - 1) lim -;-= lim
i
x-l
x^l +
ln x
x^l +
1 _ J_
ln2 x x
ln x
lim
-x ln2 x
•i+ x-l
Pro tento neurčitý výraz (typu 0/0) lze pokračovat 1'Hospitalovým pravidlem a stanovit
—x ln x —ln x — 2x lnx • -lim -= lim --
x^l+ X — 1 x^l+ 1
Případy (e), (f), (g). Protože
0 + 0
lim
lim (cotg x) i" * = e*^0+
x^0+
lnťcotg x) ln x
lim
x^0 \ X
siní
lim
lim
x^l-
/ 7CX \
(cosTj
JtX\lnx lim (ln;c-ln(cos EL))
postačuje vypočítat limity uvedené v argumentu exponenciální funkce. Pomocí 1'Hospitalova pravidla a jednoduchých úprav získáváme
lim
ln (cotg x)
>o+ lnx —x
typ
+oo
-oo
1 lim ^\ sin^
lim -
^^o+ cosx • sinx
typ
lim
>o+ cos2 x — sin x 1—0
-1;
lim —-
x^0 X1
0
typ5 o
typ ä
lim
x^0
x x cosx—sin x sin x
r2
lim
x cosx — siní
lim
2x x^o 2x2 sinx
cosx — x sinx — cosx
o 4x sin x + 2x2 cos x
lim
siní
lim
>o 4sinx + 2x cosx — cosx
0
ty? q
-i
a tudíž
>o 4 cos x + 2 cos x — 2x sin x 4 + 2 — 0
lim (cotg x) i" * = e
lim
x^0 \ X
sin x \ x
,.2
e s
292
KAPITOLA 5. ZŘÍZENÍ ZOO
5.49. Vlastnosti mocninných řad. Ačkoliv na podstatnou část důkazu následující věty si budeme muset počkat až na konec příští kapitoly, zformulujeme si základní vlastnosti mocninných řad hned:
Absolutní konvergence a diferencování
Věta. Nechť S(x) — Z~2^Lo anx" Je mocninná řada a existuje limita
r = lim ý\a~~~\.
Pak je poloměr konvergece řady S roven p — r~1.
Mocninná řada S(x) konverguje na na celém svém intervalu konvergence absolutně a je na něm spojitá (včetně krajních bodů, pokud v nich konverguje také) a na tomto intervalu existuje její derivace
S! (x) — 'y^nanxn
«=1
Důkaz. Pro ověření absolutní konvergence řady můžeme pro každou pevnou hodnotu x použít odmocninový test z věty 5.47(3). Počítáme přitom
lim d\anxn | = rx
a řada konverguje absolutně, resp. nekonverguje, jestliže je tato limita různá od 1. Odtud plyne, že skutečně konverguje pro |x| < p a diverguje pro |x| > p.
Tvrzení o spojitosti a derivaci dokážeme později v obecnějším kontextu, viz 6.43-6.45. □
Všimněme si také, že můžeme při důkazu konvergence použít silnější variantu odmocninového testu a tedy lze poloměr konvergence r pro každou mocninnou řadu přímo zadat vztahem
f~1 = lim sup $\an\.
Obdobně lze postupovat při určování poslední limity. Platí
lim ) (ln x) • ln
/ 7tX\
(cos-j
lim
lim
ln (cos f-)
i
ln x
typ
-oo
-oo
oo oo
(-sinf)f __i_ _ j_
ln2 x x
jt x sin z*- ■ ln x — lim -^—-.
2^i- cosíf
Neboť je tento výraz typu 0/0, mohli bychom pokračovat 1'Hospitalo-vým pravidlem; místo toho ale přejdeme od
x sin ^ • ln2 x
lim
k součinu limit
lim (x sin —^ •
cos f-
ln2x
lim
COS ;
1 • lim
ln2x
COS :
2 2
Teprve nyní aplikujeme 1'Hospitalovo pravidlo pro
ln2x
lim
COS :
typ
0
21nx • i lim--r-—
(-|)sinf
0
Celkem máme
lim (lnx • ln (cos = ^.1-0 = 0,
/ jrx\l (cosTj
lim
7tx\ ln*
~2
□
5.50. Poznámky. Pokud koeficienty řady velmi rychle rostou, např. a„ — nn, pak je r — oo, tj. poloměr konvergence je nula. Skutečně taková řada pak konverguje pouze v jediném bodě x — 0. Podíváme se na příklady konvergence mocninných řad
S(*) = Xy, r(x) = £-x"
«=0
«=1
včetně krajních bodů příslušného intervalu.
První příklad je geometrická řada, kterou jsme se zabývali již dříve, a její součet je pro všechna x, |x| < 1,
s(x) = —!—,
1 — x
zatímco |x| > 1 zaručuje divergenci. Pro x — 1 dostáváme také zjevně divergentní řadu 1 + 1 + 1 + ... s nekonečným součtem, při x — — 1 jde o řadu 1 — 1 +1 —..., jejíž částečné součty nemají limitu vůbec, tj. řada osciluje.
Věta 5.47(2) ukazuje, že poloměr konvergence druhého příkladu je také jedna, protože existuje
lim 1 ^ + 1 n + lA — x lim n
±x" n n + 1
ř7^*OQ ř7^*OQ
5.102. Jak j sme již impicitně zmínili, použití ľ Hospitalova pravidla může vést k limitě, která neexistuje, ačkoliv původní limita existuje: určete limitu
x + sinx lim -
X^QO X
Řešení. Limita je typu ^, použitím ľ Hospitalova pravidla dostáváme
x + sinx 1 + cosx lim -= lim -,
x^-oc x x^-oc 1
a protože neexistuje limita lim^oocosx, neexistuje ani limita lim^oo 1 + cos x. Původní limita ovšem existuje, je totiž
x — 1 x + sinx x + 1
a podle věty o třech limitách je
x + sin x x + sin x x + 1 1 = lim - < lim - < lim -= 1.
x^oo x x^oo x x^oo x
□
293
KAPITOLA 5. ZŘÍZENÍ ZOO
Pro x — 1 tu dostaneme divergentní řadu 1 + \ + ^ + ..., protože umíme odhadnout částečné součty tak, že vždy postupně pro k — 1,2,3,..., sečteme 2k~l po sobě jdoucích členů l/2k~1,..., 1/(2* — 1) a nahradíme všechny 2~k. Do spodního odhadu tedy každá taková část přispěje 1/2 a odhad tedy roste nad všechny meze.
Naopak, řada T(—í) — — 1 + 3 — ^ + ■■■ konverguje i když samozřejmě nemůže konvergovat absolutně. Vyplývá to z obecnějšího platného tvrzení, které ukážeme až v příští kapitole.
5.51. Goniometrické funkce. S mocninnými řadami nám J.1« do našeho společenství funkcí přibyla spousta nových příkladů hladkých funkcí, tj. funkcí libovolněkrát diferencovatelných na celém svém definičním oboru. Podobně \^ jako polynomy mají všechny tyto přírůstky do zvěřince navíc vlastnost, že jsou ve skutečnosti zadány vztahem, který definuje funkci C -> C.
Skutečně, naše úvahy o absolutní konvergenci jsou bezezbytku platné i pro komplexní číselné řady. Proto mocninné řady budou, po dosazeni komplexních čísel za x, na celém kruhu v komplexní rovině se středem v počátku a poloměrem r představovat konvergentní číselné řady komplexních čísel.
Pohřejme si chvíli s nejvýznamnějším příkladem, exponenci-
álou
5.103. Určete
Ix2 2
Ix"
Tato mocninnná řada má poloměr konvergence nekonečný a dobře proto definuje hladkou funkci pro všechna komplexní čísla x. Její hodnoty jsou limitami hodnot (komplexních) polynomů s reálnými koeficienty a každý polynom je zcela určený konečně mnoha svými hodnotami. Zejména tedy jsou hodnoty mocninných řad i v komplexním oboru zcela určeny jejich hodnotami na reálných argumentech x. Proto i pro komplexní exponenciálu musí platit i obvyklé vztahy, které jsme pro reálné hodnoty proměnné x již odvodili. Zejména tedy platí
ex+y = &x
viz vztah (5.5) a věta 5.46(3). Dosadme si hodnoty x — i ■ t, kde i e C je imaginární jednotka, t e R libovolné.
éf — 1 + it - -t2 - i—ř + —ŕ + i—ŕ
2 3! 4! 5!
a zjevně tedy je komplexně konjugované číslo kz = e" číslo z e~". Proto
|z|2=z-ž = e"-e-" =e°= 1
lnx lim -,
X^+QO X
lim x e
x^O-
lim x ln —,
x^o+ x
lim
x^O X
lim x e*
x^0+
100
lim (ln x — x) ;
lim -.
x^+oo x + lnx • cosx
lim
7x~TT
+°° f/x +3'
lim
Vx2 + 1
Řešení. Snadno lze zjistit (např. n -násobným užitím 1'Hospitalova pravidla), že pro libovolné n e N je
x" ex lim — =0, tj. lim — = +00.
jc^+oo Qx jc^+oo XH
Z Věty o třech limitách potom pro reálná čísla a > 0 ihned plyne zobecnění
x° ex lim — =0, tj. lim — = +00.
jc^+oo Qx jc^+oo Xf1
Uvážíme-li, že grafy funkcí y = ex a y = ln x (inverzní funkce k y =
ex) jsou symetrické vzhledem k přímce y = x, víme dále
lnx x lim -= 0, tj. lim - = +00.
x^+oo x x^+oo lnx
Získali jsme tak první výsledek. Ten přitom dává rovněž 1'Hospi-talovo pravidlo, podle kterého je
lnx 7 1
lim -= lim — = lim — = 0.
X^+QO X X^+QO 1 X^+QO X
Upozorněme, že 1'Hospitalovo pravidlo lze použít k vyčíslení každé z dalších pěti uvedených limit. Je ovšem možné určit tyto limity jednoduššími způsoby. Např. substituce y = 1/x vede na
1 lny lim x ln — = lim -= 0;
x^0+ X y^+oo y
lim x e1
jc^0+
lim — = +00.
y
Samozřejmě x -> 0+ dává y = l/x -> +00 (píšeme 1/ + 0 = +00). Pomocí substitucí u = —l/x, v = l/x2 po řadě dostáváme
lim x e
jc^O-
_ j_
e *2
lim
x^0 X
100
= lim--=
V50
lim — = 0,
-oo:
přičemž x -> 0— odpovídá u = —l/x -> +00 (píšeme — 1/ — 0 = +00) a x -> 0 potom 1; = l/x2 -> +00 (znovu 1/ + 0 = +00). Již dříve jsme také objasnili, že platí
a všechny hodnoty z — leží na jednotkové kružnici v komplexní rovině.
Reálné a imaginární složky bodů na jednotkové kružnici jsme popisovali pomocí goniometrických funkcí cos 6 a sin 6, kde 6 je patřičný úhel.
lim (ln x — x)
lim —x
x^>+oc
-oo.
Případné pochyby snad rozptýlí limita
lnx — x lim -
x^+oo lnx
lim (l - —)
x^+oo \ lnx/
-00,
294
KAPITOLA 5. ZŘÍZENÍ ZOO
Derivací parametrického popisu bodů kružnice, í i-> e" dostáváme vektory „rychlostí", které budou dány výrazem (pokud zatím nevěříme derivování mocninných řad člen po členu, lze také zderivovat zvlášť reálnou a imaginární složku) 11-> (elt)' = i' ■ e" a jejich velikost proto také bude pořád jednotková. Odtud lze tušit, že celou kružnici oběhneme po dosažení hodnoty parametru rovného délce oblouku, tj. 2it (k pořádné definici délky křivky budeme potřebovat integrální počet, pak toto tvrzení ověříme). Tímto postupem můžeme definovat tzv. Ludolfovo číslo9 Jt —je to délka poloviny jednotkové kružnice v euklidovském R2.
Můžeme se ale nyní aspoň částečně ujistit pohledem na nejmenší kladné kořeny reálné části částečných součtů naší řady, tj. příslušných polynomů. Již při řádu deset nám vyjde číslo it přesně na 5 desetinných míst.
Dostáváme tedy přímou definici goniometrických funkcí pomocí mocninných řad:
1
1
cos f = ree" = 1 - -t2 H--ť
2 4!
1
— i
6!
■ + (-1)*
(2k)\
siní = ime" = t - —f3 + —t5 3! 5!
7!
■ + (-1)*
1
(2*+ 1)!
A
S.
Ilustraci konvergence řady pro funkci cos je vidět na dalším obrázku. Jde o graf příslušného polynomu stupně 68. Při postupném vykreslení částečných součtů je vidět, že aproximace v okolí nuly je velice dobrá a prakticky beze změn. S rostoucím řádem se pak zlepšuje i dále od počátku.
^Číslo udávající poměr mezi průměrem a obvodem používaly už Babyloňané a Řekové ve starověku. Označení Ludolfovo číslo je odvozeno od jména německého matematika Ludolfa van Ceulena, který Archimedovým postupem aproximace pomocí pravidelných mnohoúhelníků spočetl tz na 35 platných desetinných míst již v 16. století.
která dokazuje, že při zmenšení absolutní hodnoty uvažovaného výrazu (aniž by došlo ke změně znaménka) stále výraz v absolutní hodnotě roste nade všechny meze. Stejně snadno umíme určit
lim
+°° x 4- ln x ■ cos x
x
lim —
1;
lim _
■■^+°° Vx + 3 x
lim
lim ^
X^+QO ^
= lim
IX X
4-00;
1.
-v/l2 4" 1 x^-t^j
Viděli jsme, že 1'Hospitalovo pravidlo nemusí být nejlepší metodou výpočtu limity jednoho z typů 0/0,00/00. Na předchozích třech příkladech lze ilustrovat, že jej ani nelze vždy (pro neurčité výrazy) aplikovat. Kdybychom jej použili k řešení prvního z nich, obdrželi bychom pro x > 0 podíl
1 x
1 4-
ln x ■ sin x x + cos x — x ln x ■ sin x
který je složitější než původní. Dokonce pro x -> 4-00 limitu nemá. Není tedy splněn jeden z předpokladů 1'Hospitalova pravidla. Ve druhém případě pak (libovolný počet opakovaných) použití 1'Hospitalova pravidla vede na neurčité výrazy. Pro poslední Umitu nás 1'Hospitalovo pravidlo vrátí do zadání: dává nejdříve zlomek
1
2x
a následně
2v/x2+l
2x 2^x2 + l
I
Odsud můžeme odvodit, že Umita je rovna 1 (hledáme nezápornou hodnotu a e B takovou, aby platilo a = a~l), pouze když dříve dokážeme, že vůbec existuje. □ Další příklady na výpočet limit užitím L'Hospitalova pravidla na-lezneet na straně 323.
H. Nekonečné řady
Nekonečné řady se přirozeně vyskytují v celé řadě (problémů).
5.104. Sierpiňského koberec. Jednotkový čtverec se rozdělí na devět shodných čtverců a odstraní se prostřední čtverec. Caždý ze zbývajících čtverců se znovu rozdělí na devět shodných čtverců a v každém z nich se odstraní prostřední čtverec. Určete obsah zbylého obrazce po prodloužení tohoto postupu do nekonečna.
295
KAPITOLA 5. ZŘÍZENÍ ZOO
1 y 0 5-1 j.
30 20 10 5-1 ■ 10 l~ I 2 30
-1,5J
Přímo z definice vyplývá známý vztah
&it e-it _ sjfl2 f _|_ CQS2 f _ j
a také z derivace (elt)' — ie" vidíme, že
(sin i)' — cos t, (cos t)' — — sin f.
Tento výsledek lze samozřejmě ověřit přímo derivací našich řad člen po členu.
Označme ?o nejmenší kladné číslo, pro které je — tj. první kladný nulový bod funkce cos t. Podle naší definice Ludolfova čísla je to — jjt.
Pak kvadrát této hodnoty je el2t° — e~l2t° — (e_íí°)2ajdetedy o nulový bod funkce sin t. Samozřejmě přitom platí pro libovolné t
eí'(4iřo+ř) _ ^eitQÝk . qu — 1 . qu
Jsou tedy obě goniometrické funkce sin a cos periodické s periodou 2it. Z našich definic je přitom vidět, že je to nejmenší jejich perioda.
Nyní můžeme snadno odvodit všechny obvyklé vztahy mezi goniometrickými funkcemi. Uvedeme na ukázku několik z nich. Nejprve si všimněme, že definice vlastně říká
(5.12) cosf = i(eíř+e-íř)
(5.13) siní = — (eíř -e_íř).
2i
Součin těchto funkcí jde tedy vyjádřit jako
siní cosf — — (elt - e~lt)(elt + e~lt) 4i
= — (é2t -e~i2t) = isin2f. 4i 2
Dále můžeme využít naši znalost derivací:
cos2t — (- sin2f)' — (siní cos t)' — cos2 t — sin2 t.
Vlastnosti dalších goniometrických funkcí
siní _,
tgf =--, cotgf = (tgf)
cos t
se snadno odvodí z jejich definice a pravidel pro derivování. Grafy funkcí sinus, cosinus, tangens a cotangens jsou na obrázcích (postupně červený a zelený vlevo, červený a zelený vpravo):
Řešení. V prvním kroku se odstraní 1 čtverec o obsahu 1/9. Ve druhém kroku se odstraní 8 čtverců o obsahu 9~2, tj. o celkovém obsahu 8 • 9~2. V každé další iteraci se odstraní osminásobek počtu čtverců z předešlého kroku, přičemž obsah každého z nich je devítinou obsahu jednoho čtverce z předchozího kroku. Součet obsahů všech odstraněných čtvercuje
I_l_i__l_<_._l_ 8" 9 t g2 t g3 t - - - — 2—, 9«+l • n=0
Obsah zbylého obrazce (tzv. Sierpinského koberce) tak činí
i-E^ = i-^E(ir = i-|-T1T=o.
n=0 n=0 9
□
5.105. Kochova vločka, 1904. Vytvořte „sněhovou vločku" následujícím postupem. Na začátku uvažujte rovnostranný trojúhelník s jednotkovou délkou strany. Každou z jeho stran rozdělte na třetiny a nad prostředními třetinami sestrojte rovnostranné trojúhelníky, kdy základny (prostřední třetiny stran původního trojúhelníku) odstraníte. Takto z původního trojúhelníku dostanete šesticípou hvězdu. Celý postup opakujte tak, že každou úsečku obdrženou v předchozím kroku rozdělíte na třetiny a prostřední třetinu nahradíte za rovnostranný trojúhelník bez základny. Sněhovou vločku pak získáte nekonečným opakováním tohoto postupu. Dokažte, že vzniklý útvar (vločka) má nekonečný obvod. Poté určete jeho obsah.
Řešení. Obvod původního trojúhelníku je roven 3. V každém kroku konstrukce se prodlouží obvod útvaru o třetinu, neboť ze tří částí každé úsečky vzniknou čtyři stejné délky. Odsud vyplývá, že obvod vločky lze vyjádřit jako hmitu
d„ = 3 (\Y a lim d„ = +00.
Útvar se zřejmě během konstrukce zvětšuje. Ke stanovení jeho obsahu nám tudíž stačí zachytit, o kolik se jeho obsah zvětší v jednotlivých krocích. Počet jeho stran se v libovolném kroku stává čtyřnásobným (úsečky se rozdělí na třetiny, kdy místo prostřední třetiny máme dvě úsečky), přičemž délka nových stran je třetinová. V následujícím kroku se obsah útvaru zvětší právě o obsahy stejných rovnostranných trojúhelníků, jejichž počet je stejný jako počet úseček v předchozím kroku a jejichž strany mají délku třetin těchto úseček. Když takto přecházíme od rovnostranného trojúhelníku k šesticípé hvězdě při první realizaci uvedeného postupu, obsah se zvětší o 3 rovnostranné trojúhelníky (jejich počet odpovídá počtu stran původního útvaru) s délkou stran 1/3 (taje třetinová). Označme obsah původního
296
KAPITOLA 5. ZŘÍZENÍ ZOO
1 s 3
Cyklometrické funkce jsou inverzní ke goniometrickým. Protože jsou goniometrické funkce všechny periodické s periodou 2it, jsou jejich inverze definované vždy jen v rámci jedné periody a to ještě jen na části, kdy je daná funkce buď rostoucí nebo klesající. Jsou to funkce
arcsin = sin-1
s definičním oborem [—1, 1] a oborem hodnot [—it/2, it/2]. Dále arccos = cos-1
s definičním oborem [—1, 1] a oborem hodnot [0, it], viz obrázek vlevo.
Zbývají ještě funkce (zobrazené na obrázku vpravo) arctg = tg"1
s definičním oborem R a oborem hodnot (—it/2, it/2) a konečně
arccotg = cotg-1
s definičním oborem R a oborem hodnot (0, it).
Velice často se také využívají tzv. hyperbolické funkce
sinhx = -(e* —e-*), coshx = -(ex + e~x). 2 2
Název naznačuje, že by funkce mohly mít něco společného s hyperbolou. Přímý výpočet dává (druhé mocniny se v roznásobených dvojčlenech všechny odečtou a zůstanou smíšené členy)
(coshx)2 - (sinhx)2 = 2^(e* e~x) = 1.
Body [cosh t, sinh t] e R2 tedy skutečně parametricky popisují hyperbolu v rovině. Pro hyperbolické funkce lze snadno odvodit podobné identity jako pro funkce goniometrické. Mimo jiné je přímo z definice snadno vidět (dosazením do vztahů (5.12) a (5.13))
coshx = cos(íx), i sinhx = sin(í'x).
trojúhelníku jako So. Pokud si uvědomíme, že zmenšením strany rovnostranného trojúhelníku na třetinu se jeho obsah zmenší devětkrát, dostaneme obsah šesticípé hvězdy ve tvaru
So + 3-f.
Podobně v dalším kroku obdržíme obsah útvaru jako
S0 + 3 • & + 4 • 3
So
Počet přidávaných trojúhelníků je čtyřnásobný a délky jejich stran třetinové.
Nyní již není obtížné odvodit, že obsah vločky je roven limitě lim (So + 3 • f +4 • 3 • | + • • • +4" • 3 • ^) =
5oi^(1 + ^ + H + --- + Hir)
So
1 + i lim 1 + I + ■ ■ ■ +
k=0
So
1 + I lim E (I)*
' k=0
1 +
J_ 1
5'H
S0.
Obsah vločky je tedy 8/5 obsahu původního trojúhelníka, tj.
So
8 V3 _ 2 V3 5 ' 4 ~~ 5 •
Zopakujme, že tato vločka je příkladem toho, jak nekonečně dlouhá křivka může ohraničovat konečnou plochu. □
5.106. Sečtěte řadu
OO / n.
«=i
OO
(b) E |r;
oo
(c) E (42/1-1 + 4>r) '1
n = l
00
(d) E £;
n = l
(e) £ (3Í
1
«=0
+ l)(3«+4)-
Řešení. Případ (a). Podle definice je součet řady
OO , n.
«=1
^((7Ť-7!) + (7!-7f) + --- + fe-Ä)) =
n^(1 + (-7! + 7!) + --- + (-7i + *)-vtŤ) = L Případ (b). Zjevně se jedná o pětinásobek konvergentní geometrické řady s kvocientem q = 1/3, a tudíž je
00 00
E^=5E(ir=5-^T=f.
«=0 «=0 3
Případ (c). Platí (při substituci m = n — 1)
297
KAPITOLA 5. ZŘÍZENÍ ZOO
5.52. Poznámky. (1) Jestliže mocninnou řadu S(x) vyjádříme s posunutou hodnotou proměnné x o konstanta! posuv xo, dostaneme funkci T(x) = S(x — xo). Jestliže je p •H. poloměr konveregence S, bude T dobře definovaná na intervalu (xq — p, xq 4- p). Říkáme, že T je mocninná řada se středem v xo.
Mocninné řady proto můžeme přímo definovat takto:
oo
S(x) = ^a„(x - x0)",
«=0
kde xq je libovolné pevně zvolené reálné číslo. Všechny naše předchozí úvahy jsou pořád platné, jen je třeba mít na paměti, že se vztahují k bodu xo. Zejména tedy taková řada konverguje na intervalu (xo — p, xo + p), kde p je její poloměr konvergence.
Dále platí, že má-li mocninná řada y = T (x) hodnoty v intervalu, kde je dobře definována řada S(y), potom i hodnoty funkce Soľ jsou vyjádřeny mocninnou řadou, kterou dostaneme formálním dosazením y = T (x) za y do S(y).
(2) Jakmile máme k dispozici mocninné řady s obecným středem, lze docela přímočaře počítat koeficienty mocninných řad zadávajících inverzní funkce. Nebudeme zde uvádět seznam formulí, snadno se k nim dostaneme například v Maplu procedurou „series". Pro ilustraci se podívejme alespoň na dva příklady:
Viděli jsme, že
1
-x2 ■ ^ , 1
2 6 24
Protože je e° = 1, budeme hledat pro inverzní funkci ln x mocninnou řadu se středem v x = 1, tj.
lnx = a$+a\(x — \)+a2(x — +aj,(x — \Ý +a4(x -
■l)4
Využijeme tedy rovnosti x = e1
ln x
ln(ex) a přeskupením koefi-
cientů podle mocnin x po dosazení příslušných řad dostaneme:
x = flQ + a\ I x
1
1
1
—j 24
E (42/1-1 +42«) 4 E (42/1-2) "T" 16 E (42/1-2)
n = \
(I + Š)E
1
167 ^ 42m m— 0
4 L^i \4ir1 « = 1
00
14
16 V167 m—0
16 ^ \42n « = 1
14
16 1-á
11 15 •
Řadu lineárních kombinací jsme zde vyjádřili jako lineární kombinaci řad (přesněji řečeno, jako součet řad s vytknutím konstant), což je platná úprava, pokud obdržené řady jsou absolutně konvergentní. Případ (d). Z částečného součtu
I 1 2. 1 1. 1
3 1 32 1 33 1
bezprostředně získáváme
1 , 2
ÍS. — _L _1_ _|_____LÍZÍ4. _ÍL_ n cH
3 - 32 T 3J T T 3,! T 3„+i , « t 1X1.
Je tedy
$n 3
i 4- -1 4- -1 + 3-1-32-1-33-r-
+ —
3«
šíři, neN.
Protože lim = 0, dostáváme
E f = Hm f (í„ - f) = f lim E 3T
«=1
'i=l
Případ (e). Stačí použít vyjádření (jde o tzv. rozklad na parciální zlomky)
1
11 11
(3« + l)(3«+4) 3 3« + l 3 3«+4
které dává
00
E (3„-|
1
s n + l)(3n+4)
«=0
1 1 1 1 1 1 1 1
lim I h _ I + I _ I + I
3 l1 4 + 4 7 + 7
= lim i (l —
3 V 3«+4
10 T T 3« + l 3«+47
7 3-
+ a2 \ x
= flO + ^ 1* 1
l-x>
■ «3 I x
-x2
24
fli
a\ + «2
x2
1
rfll +02 + 03 IX
«2
-fl3 + fl4 (x
Porovnáním koeficientů u stejných mocnin nalevo a napravo
«0 = 0, a\ = 1, «2 =
1 1 1
- —, fl3 = —, fl4 =--, . . .
2 3 4 což skutečně odpovídá platnému výrazu (ověříme později):
lnx
00 { 1 \ř7 — 1
1)".
«=1
Podobně si můžeme pohrát s řadou
5!
sin t = t
1
—1 3!
7!
a zatím neznámou řadou pro její inverzi (všimněme si, že počítáme opět se středem v nule, protože je sin 0 = 0)
arcsinf = a$ + a\t + ajt1 4- aj,ŕ + a^ŕ + ....
5.107. Ověřte, že platí
E „2 < E 2" ■
n — l n—0
□
Řešení. Ihned je vidět, že
1<1 ± + ±<2-±-1- -1- 4- -1- 4- -1 4- -1 < 4-- i
1 - 1' 22 + 32 < Z 22 — 2 ' 42 + 52 + 62 + 72 < ^ 42 — 4'
resp. obecný odhad
(2«)2 + ' ' ' + (2»+l-l)2 ^ ^ ' (2")2 2
< 2'
« 1
h, neN.
Odsud (porovnáním členů obou řad) dostáváme zadanou nerovnost, z níž mj. plyne absolutní konvergence řady E^Li ^í- Ještě upřesněme, že je
oo 2 OO
«—1 «—0
□
298
KAPITOLA 5. ZŘÍZENÍ ZOO
Opět dosazením dostáváme t — clo + a\ ( t
3! 5!
fl2 t
1
ř + -ř
3! 5!
— flQ + + a2^ +
-—fll + «3 Jf3 +
6
a proto
- —fl2 + «4 )ř
6
aresin f
120
-f3 6
-fl3 + a5 )r
Ir
40
(3) Všimněme si také, že kdybychom hned zpočátku uvěřili, že funkci eř můžeme napsat jako mocninnou řadu se středem v nule a že se mocninné řady derivují člen po členu, pak bychom snadno obrdrželi diferenční rovnici pro koeficienty a„. Víme totiž (x"+iY — (n+l)x", a proto z našeho požadavku, že exponenciála má mít v každém bodě derivaci rovnou své hodnotě, vyplývá
a odtud už je jasné, že a„ — jj.
fl0 = 1
«=i
5.108. Vyšetřete konvergenci řady
oo
Vln*±i.
t—i n
« = 1
Řešení. Pokusme se uvedenou řadu sečíst. Platí
oo
Eln^= Um(lnf+ln§+lnl + ...+ln=±i)
lim ln (n + 1) = +oo.
Řada tudíž diverguje k +oo.
5.109. Prokažte, že řady
oo , ^_ oo
2-, drLl5 ,, + i - 2^ „3+„2_„
»7=0 n = l
nekonvergují. Řešení. Protože
Um ln2-34;f+1)
r7=>0O ř7=>00
lim aretg
n2+2)1+3^+4 « + 1
lim aretg — = f
lim
3" + l
i • 3"
lim % = +oo,
□
není splněna nutná podmínka konvergence lim an = Ořady YlT=tm an-
□
5.110. Jaký je součet řady
n =2
Řešení. Z nerovností (uvažte graf přirozeného logaritmu)
1 < lnn < «, n > 3, « e N
plyne
3, n e N. Podle Věty o třech limitách je
lim -Z/lnn = 1, tj. lim -=== = 1.
r7=>oo «=>oo Vln n
Řada tedy není konvergentní. Neboť má nezáporné členy, musí divergovat k +oo. □
5.111. Zjistěte, zda řada
(a) E
i
(H+n-3"
n=0 oo ,
(b) E ^
n = l oo
(c) E—í—
« = 1
konverguje.
Řešení. Všechny tři uvedené řady mají nezáporné členy, a tak mohou v jednotlivých variantách nastat jen dvě možnosti - součet je konečný, součet je roven +oo. Platí
(a) E
(« + l)-3" n=0 n=0
E (I)" = TTT < +°°'
299
kapitola 5. zřízení zoo
(b) E ^ > E = E \ = +00;
n — l n — l n — l
00 00
(c) E —í— > E 1 = +°°-
v 7 ^-^ n—mn — t—1 n n — l n — l
Odtud plyne, že řada (a) konverguje; (b) diverguje k +00; (c) diverguje k +00. □ Další zajímavé příklady k číselným řadám naleznete na straně 324.
I. Mocninné řady
V předchozí podkapitole jsme zkoumali, jestli lze přiřadit smysl součtu nekonečně mnoha čísel. Nyní se budeme zajímat o to, jaký může mít význam součet nekonečně mnoha funkcí.
5.112. Určete poloměr konvergence následujících mocninných řad:
00
i) E
n = l
íí) E
1
«=1
(1+0"
Řešení.
i) Podle je
1
lim sup
Daná mocnina řada tedy konverguje pro reálná x e (-
'2' 2
),
případně pro komplexní \x\ < j. Všimněme si, že řada je divergentní pro x = \ (jde o harmonickou řadu) a naopak konverguje pro x = — \ (alternující harmonická řada). Rozhodnout o konvergenci pro libovoné x ležící v komplexní rovině na kružnici o poloměru \ je těžší otázka a přesahuje rámec našeho kurzu.
ii)
lim sup
1
(l + 0"
lim sup
1 + i
V2 2 '
□
5.113. Určete poloměr konvergence r mocninné řady
(a) E^«;
«=1 00
(b) E(-4«)"x";
n = l
00 2
(c) E(i + í)"
«=1
(d) E
«=1
Řešení. Platí
(2+(-l)")"
300
KAPITOLA 5. ZŘÍZENÍ ZOO
(a) lim y\a„ | = lim = ±;
«^►00 n^oo v"'° 0
(b) lim VI an I = lim 4« = +00;
(c) lim VRTl = lim (1 + i)" = e;
n—>oo n—>oo
(d) lim sup y\a„ \ = lim sup 2_^fir = Um sup 2f^]l)n = 1-
n^-oc n^-oc n^-oc
Proto je poloměr konvergence (a) r = 8, (b) r = 0, (c) r = 1/e, (d) r = 1. □
5.114. Stanovte poloměr konvergence r mocninné řady
Řešení. Poloměr konvergence libovolné mocninné řady se nezmění, pokud posuneme její střed nebo nahradíme koeficienty členů tak, že se nezmění jejich absolutní hodnota. Určeme tedy poloměr konvergence řady
4^ \?«4+2«3 + 1-jt"
Protože
lim = í lim ýn) =1 pro a > 0, můžeme dále přejít k řadě
00
« = 1
se stejným poloměrem konvergence r = 7r/3. □
5.115. Napište mocninnou řadu se středem v počátku, jejíž součet je na intervalu (—3, 3) funkce
1
x2-x-W
Řešení. Neboť
1 1 1 1 \
____ i c___
x2-x-\2 (*-4)(jt+3) 1 Vjc-4 x+3
1
jt-4
"TT| = _4^1 + 4 + 42""1 l"^""1 J '
jc+3 l-(-f) 3
dostáváme
1
OO OO OO / x
J_ V íH- - i- V (-x)" -VI __ä_\ v«
28 ^ 4" 21 ^ 3" ^ \ 21-3" 28-4" / -
x2-x-12
«—0 n—0 «—0
□
5.116. Nalezněte přibližnou hodnotu čísla sin 1° s chybou ostře menší než 10~10.
Řešení. Víme, že je
sin X — X g, X +j|X 71 X +••• — E (2« + l)! "*~ ' x £
«=0
301
KAPITOLA 5. ZŘÍZENÍ ZOO
Dosadíme-li x = tt/180, pak částečné součty řady vpravo budou aproximacemi sin 1°. Zbývá určit počet členů, které je třeba sečíst, aby chyba byla prokazatelně menší než 10~10. Číselná řada
_k___1_ (JL.Ý _i_ _L (JI_)5__L (JL.\7 _i_ = V (-1)" ( ji Ýn+1
180 3! V180/ 5! V180/ 7! V 180/ — 2^ (2n + l)\ V180/
«=0
je alternující s vlastností, že posloupnost absolutních hodnot jejích členů je klesající. Pokud libovolnou takovou konvergentní řadu nahradíme jejím částečným součtem, chyba, jíž se tím dopustíme, bude menší než absolutní hodnota prvního členu uvažované řady nezahrnutého do částečného součtu. (Důkaz tohoto tvrzení uvádět nebudeme.) Chyba aproximace
sinF^f^ "3
180 1803-3!
je tak menší než
1805-5!
< 10
-10
□
5.117. Určete poloměr konvergence r mocninné řady
i)!
V 2ln-n\ n 2—i (2«)' X
«=0
O
5.118. Stanovte poloměr konvergence pro YľŽĹi x" ■ O
5.119. Bez počítání uvedte poloměr konvergence mocninné řady
oo
_ 5 n-
« = 1
V —_X"
O
5.120. Nalezněte obor konvergence mocninné řady
y«+i
3V"
£—t 'XJn
n = l
O
5.121. Určete, pro jaká x e M řada
E (-3); {x _ 2)»
^ v/«4+2«3 + lll
konverguje. O
5.122. Je pro Ubovolnou posloupnost reálných čísel {a«}^L0 poloměr konvergence mocninných řad
Ea„x", £^x"
stejný? O
5.123. Rozhodněte o platnosti implikací:
(a) Pokud existuje vlastní Umita lim y^of, pak mocninná řada
302
KAPITOLA 5. ZŘÍZENI ZOO
5ľ an (x — xo)"
n = \
konverguje absolutně alespoň ve dvou různých bodech x.
(b) Z neabsolutní konvergence řad YlT=i an, 2~1™=\ b» plyne> ze rovněž řada ~ 5bn) konverguje.
(c) Jestliže pro číselnou řadu YlT^o a" Je
lim a\ = 0,
pak tato řada konverguje.
(d) Pokud řada YlT=i a\ konverguje, potom řada
Eqn n
« = 1
konverguje absolutně.
O
5.124. Určete cos s chybou menší než 10~5. O
5.125. Pro konvergentní řadu
(-D"
V7Í+100
odhadněte chybu aproximace jejího součtu částečným součtem sg 999.
O
5.126. Funkci y = ex definovanou na celé reálné přímce vyjádřete jako nekonečný polynom se členy tvaru an(x — 1)" a funkci y = 2X definovanou na R vyjádřete jako nekonečný polynom se členy anx".
O
5.127. Nalezněte funkci /, k níž pro x e R konverguje posloupnost funkcí
/„(jc) = -^L, neN. Je tato konvergence stejnoměrná na M? O
5.128. Konverguje řada
00
T -£4, kde x eR,
n = \
stejnoměrně na celé reálné ose? O
5.129. Odhadněte
(a) kosinus deseti stupňů s přesností alespoň 10~5;
(b) určitý integrál JQ1/2 s přesností alespoň 10~3.
O
5.130. Určete mocninný rozvoj se středem v bodě xG = 0 funkce
X
f{x) = fefi dt, x € R. o
303
KAPITOLA 5. ZŘÍZENÍ ZOO
o
5.131. Užitím integrálního kritéria nalezněte hodnoty a > 0, pro které řada
oo
y -
« = 1
konverguje. o
5.132. Určete, pro která iéM konverguje řada
y_i_x3„
j^2n - n- \a(n)
o
5.133. Určete všechna x e R, pro která konverguje mocninná řada
oo
e£. o
5.134. Pro jaká x e Mřada
oo
Eln(ř?!) nx
« = 1
konverguje? o
5.135. Rozhodněte, zda řada
oo
konverguje absolutně, příp. relativně, nebo zda diverguje k +oo, resp. k — oo, či nic z toho (říkáme, že osciluje). o
5.136. Stanovte součet číselné řady
oo
y J-
« = 1
pomocí součtu vhodné mocninné řady. o
5.137. Pro x e (-1, 1) sečtěte
x - 4x2 + 9x3 - 16x4 H----
o
5.138. Je-li | x | < 1, určete součet řady
oo
(a) E 2ih x2n~l; «=i
(b) J2n2X
n = \
5.139. Spočtěte
o
V1 2n-l « = 1
pomocí součtu mocninné řady
304
KAPITOLA 5. ZŘÍZENÍ ZOO
Jln
£(-!)" (2« + l)x2
«=o
pro jisté x e (—1, 1). Q
5.140. Pro x e M sečtěte řadu
1 ^.3« + l
2~2 2"-n\ X «=0
O
J. Přírůstky do ZOO
5.141. Stanovte maximální podmnožinu R, kde může být funkce
y = arctg (x21 + sin x) • 2--—
definována. O
5.142. Napište maximální definiční obor funkce
arccos (ln x)
y
XL-\
O
5.143. Uvedie definiční obor, obor hodnot a inverzní funkci funkce
x-l
y
2-3x ■
O
5.144. Je funkce
cos x . r3 >
(a) y =
(b) y = ^ + l;
(c) y =
(d) y = ^ + 1;
(e) y = sinx +tg|;
(f) ),=ln±±f;
(g) y = sinhx
2
ex+e~x
(h) j = cosh x — 2 s maximálním definičním oborem Uchá? O
5.145. Je funkce
cos x . r3 ,
cos x .
x* ' cos x
(b) y = £«£ + 1; (C) J
(d) y = ^ + i;
(e) j = sinx +tg
(g) j = sinhx = (-
(h) j = cosh x
2 '
e-*+e
305
KAPITOLA 5. ZŘÍZENÍ ZOO
s maximálním definičním oborem sudá? O
5.146. Rozhodněte, zda je funkce
(a) y = sin x ■ ln | x |;
(b) y = arccotgx;
(c) y = x8 - f/3x6 + 3x2 - 6;
(d) y = cos (jz — x);
(e) y - tgx+x
3+7 cos x
s maximálním definičním oborem lichá, sudá. O
5.147. Je funkce
(a) y = ln (cos x) ;
(b) y = tg (3x) + 2 sin (6x)
s maximálním definičním oborem periodická? O
5.148. Nakreslete grafy funkcí
/(x)=e|x|, iěM; g(x) = ln|x|, ieK\{0).
O
5.149. Načrtněte graf funkce
y = 2~'* ', x e
O
5.750. Hyperbolickými funkcemi rozumíme
sinhx = e~e *, x e M; coshx = ^ *, x e M; tghx = x e M; cotghx = x e M \ {0}.
° cosh x' ' ° sinh x ' 1 J
Stanovte derivace těchto funkcí na jejich definičních oborech. O
5.151. V libovolném bodě x e M vypočítejte derivaci argumentu hyperbolického sinu, tj. derivaci inverzní funkce (značené jako argsinh) k funkci y = sinhmal. O
Poznámka.Inverzní funkce k hyperbolickým funkcím y = coshx, x e [0, +oo), y = tghx, x e R a y = cotghx, x e (—00, 0) U (0, +00) se nazývají hyperbolometrické (řadíme k nim rovněž y = argsinh x). Označují se po řadě argcosh, argtgh, argcotgh (čteme argument hyperbolického kosinu, argument hyperbolického tangens, argument hyperbolického kotangens) a jsou definovány pro x e [1, +00), x e (—1,1), resp. x e (—00, —1) U (1, +00). Dodejme, že platí
(argcosh x)' = -7==, x > 1,
yx2-l
(argtgh x)' = jK, |x| 1.
306
KAPITOLA 5. ZŘÍZENÍ ZOO
5.152. Sečtěte:
2 12 12
2 + 1 H---1---1---1---1---h
2! 3! 4! 5! 6!
Řešení. Porovnáme-li tvar součtu s rozvojem funkcí sinh a cosh do mocninných řad, dostáváme výsledek
sinh(l) +2cosh(l).
□
307
KAPITOLA 5. ZŘÍZENÍ ZOO
K. Doplňující příklady k celé kapitole
5.153. Určete polynom P(x) co nejmenšflio stupně splňující podmínky P(l) = 1, P(2) = 28, P(0) = 2, P'(0) = 1, P'(l) = 9. O
5.154. Určete polynom P(x) co nejmenšflio stupně splňující podmínky P(0) = 0, P(\) = 4, P(-1) = -2,P'(0) = 1,P'(1)=7. O
5.155. Určete polynom P(x) co nejmenšflio stupně splňující podmínky P(0) = —1, P(\) = —1, P'(-1) = 10,P'(0) = -1,P'(1) = 6. O
5.756'. Z definice limity dokažte, že je
lim (x3 -2) = -2.
x^O V '
5.157. Z definice limity určete
,. (l+x)2-3 lim
r 3 (* ~2)4 ^ lim -= +oo.
X^—QO 2
5.759. Určete obě jednostranné limity
1 1 lim arctg -, lim arctg -.
x^0+ X x^O- X
Na základě výsledku rozhodněte o existenci limity
1
lim arctg —.
x^O X
5.160. Existuje některá z limit
sinx 5x4 + 1
lim——, lim-?
*-»0 X x^O X
5.161. Vypočtěte limitu
tgx — sinx
lim
sin x
5.762. Určete
lim
2 sin3 x + 7 sin2 x + 2 sin x — 3 t/6 2 sin3 x + 3 sin2 x — 8 sin x + 3
5.163. Pro libovolné m, n e N určete
x™ - 1 lim -.
x^l X" - 1
O
2
tj. napište <5(e)-předpis jako v minulém příkladu. O 5.758. Ukažte z definice limity, že
O
o
o
o
o
308
KAPITOLA 5. ZŘÍZENÍ ZOO
5.164. Určete
lim (\/x2 + x — x) .
5.765. Stanovte
lim (x V1 + x2 - x2 )
5.766'. Vypočítejte
,. V2-VI + cos a: lim---.
*->o sin x
5.167. Určete
sin (4x)
lim
'0 Ví + 1 - 1 5.768. Spočtěte
VT+lgx - VI - tg* lim -■-.
x^o- siní
5.769. Stanovte
2T + Vl +x2 -x9 - 7x5 + 44x2
lim - =-.
3* + V6x6 + x2 - 18x5 - 592X4
5.770. Nechť lmi^.co /(.*) = 0. Je pravda, že \im.x^.-00(f(x) ■ g(x)) funkci g : R -> M?
5.7 77. Určete limitu
5.772. Spočítejte
sin x — x lim---.
x^O- X3
5.173. Pro x > e určete znaménko derivace funkce
ln x
f(x) = arctg
-l+ln.T
5.174. Stanovte všechna lokální maxima a minima funkce
v = x ln2 x
O
o o
o o
o
o
0 pro každou rostoucí
O
o o
o
309
KAPITOLA 5. ZŘÍZENÍ ZOO
definované na intervalu (0, +00). o
5.175. Existuje a e M, pro které má funkce y = ax + sinx v bodě x0 = 5tt/4 absolutní minimum na intervalu [0, 2jr]? o
5.176. Nalezněte absolutní minimální hodnotu, jež v nějakém bodě svého definičního oboru nabývá funkce
y = ex — lnx, x>0.
o
5.177. Určete maximální hodnotu funkce
y = V3x e x, X €
o
5.178. Stanovte absolutní extrémy polynomu p(x) = x3 — 3x + 2 na intervalu [—3, 2]. o
5.179. Nechť je uražená vzdálenost (v metrech) hmotného tělesa popsána funkcí
s(t) = -(t - 3)2 + 16, f e [0,7], kde t je čas v sekundách. Stanovte
(a) počáteční (tj. v čase t = 0 s) rychlost tělesa;
(b) čas a polohu, ve kterých má těleso nulovou rychlost;
(c) rychlost a zrychlení tělesa v čase t = 4 s.
Doplňme, že rychlost je derivace dráhy a zrychlení je derivace rychlosti. o
5.180. Z definice derivace /' funkce / v bodě x0 spočtěte /' pro f(x) = yfx v libovolném bodě
x0 > 0. o
5.181. Rozhodněte o existenci derivace funkce
f(x) = x arctg i, x e R \ {0}, /(0) = 0 v bodě x0 = 0. o
5.182. Má funkce
y = sin (arctg 12x21 + 11 | • ^^12 + sin(sin(sin(sinx))), x e M derivaci v bodě x0 = n3 + 371 ? o
5.183. Zjistěte, jestli má funkce
f(x) = (x2 - ljsinjlj-, /(-1)=0 derivaci v bodě x0 = — 1. o
5.184. Udejte příklad funkce / : R -> M, která je spojitá na celé reálné ose, ale v bodech x\ = 5, x2 = 9 nemá derivaci. o
5.185. Uvedte funkce / a g, které nemají derivaci v žádném reálném bodě, ale jejich kompozice / og má derivaci na celé reálné přímce. o
5.186. Pomocí základních vzorců spočtěte derivaci funkce
(a) y = (2 — x2) cosx + 2x sinx, x e R;
310
KAPITOLA 5. ZŘÍZENÍ ZOO
(b) y = sin (sinx) , x e M;
(c) y = sin (ln (x3 + 2x)) , x e (0, +00);
O
O
5.187. Libovolným způsobem určete derivaci funkce
(a) y = sjx y/x y/Í, x e (0, +00);
(b) y = ln |tg § j , x e r \ {nn; n e Z}.
5.188. Napište derivaci funkce
v = sin (sin (sin x)), x e
5.189. Pro funkci
f(x) = arccos ^ + \7x3
s největším možným definičním oborem vypočítejte /' na maximální podmnožině reálných čísel, kde tato derivace existuje. O
5.190. V libovolném bodě x ^ {nit; n e Z} určete první derivaci funkce y = f/ sin x. O
5.191. Pro x e M derivujte výraz
xVl +x2 + ex (x2 - 2x + 2) .
O
O
5.192. Vyčíslete /'(l), je-li
f(x) = (x - l)(x - 2)2(x - 3)3, x e
5.193. Stanovte derivaci funkce
O
±±f3, |x|^l(xeM).
O
5.194. Derivujte (v reálné proměnné x)
x ln2 (x + s/l +x2) - 2Vl +x2 ln (x + y/l + x2^j + 2x všude, kde derivace existuje. Obdržený výraz zjednodušte. O
5.195. Určete /' na maximální množině, jestliže f(x) = logx e. O
5.196. Vyjádřete derivaci součinu čtyř funkcí
[f(x)g(x)h(x)k(x)\ '
311
KAPITOLA 5. ZŘÍZENÍ ZOO
ve tvaru součtu součinů daných funkcí či jejich derivací za předpokladu, že všechny tyto funkce mají derivaci. O
5.197. U vedle derivaci funkce
x1 (x+iy^x+2 (x+3)2
pro x > 0. O
5.198. Vrtulník dálniční hlídky letí 3 km nad rovnou silnicí rychlostí 120 km/h. Pilot zaměří radarem auto jedoucí proti směru letu vrtulníku a naměří, že auto se při vzdušné vzdálenosti 5 km od vrtulníku k němu přibližuje rychlostí 160 km/h. Spočítejte rychlost auta (vůči předmětu pohozenému na vozovce).
Řešení. Pro jednoduchost budeme v celém příkladu vynechávat fyzikální jednotky, a to kilometry pro dráhu a hodiny pro čas (rychlost tedy bude v km/h). Pozici vrtulníku v čase t vyjádřeme bodem [y(ř), 3] a auta potom bodem [x(t), 0]; tj. 1 jednotka na osách odpovídá 1 km a současně osy volíme tak, aby „auto jelo po ose x". Jako s(t) označme vzdušnou vzdálenost vrtulníku od auta a jako t0 ten časový okamžik, ze kterého jsou údaje v zadání. Spočtěme rychlost auta vzhledem k předmětu umístěnému do počátku soustavy souřadnic. Můžeme předpokládat, že x(t) > y(t) > 0. Za tohoto předpokladu je x1 (t) < 0, y1 (t) > 0 pro uvažovaná t. Auto se totiž blíží k bodu [0, 0] zprava - hodnota x(t) se zmenšuje pro zvětšující se ř, a tudíž x1 (t) < 0. Podobně dostáváme ý (t) > 0 a také s1 (t) < 0. Ještě dodejme, že např. ý (t) udává, jak rychle se mění funkce y v čase ř, tedy rychlost vrtulníku. Víme, že je
s (t0) = 5, s* (to) = -160, y' (t0) = 120 a že platí (s(t) je přepona pravoúhlého trojúhelníku)
(5.9) (x(t)-y(t))2 + 32 = r(t).
Odtud plyne (x(t) > y(t) > 0)
(x (t0) - y (t0))2 + 32 = 52, tj. x (t0) - y (t0) = 4. Derivováním identity (||5.9||) získáváme
2 (x(t) - y(t)) (xf (t) - y (t)) = 2s(t)s> (t)
a následně pro t = t0
2-4(jť(f0)- 120)= 2-5-(-160), tj. x' (t0) = -80.
Vypočítali jsme, že auto se blíží k předmětu na vozovce rychlostí 80 km/h. Stačí si uvědomit, s jakými jednotkami jsme pracovali. To, že jsme jako výsledek obdrželi zápornou hodnotu, je pak zapříčiněno naší volbou souřadnicového umístění. □
5.199. Pro jaká a e M je kubický polynom P vyhovující vztahům P(0) = 1, P'(0) = 1, P(l) = 2a + 2, P'(l) = 5fl + l, monotónní funkcí na celém M?
Řešení. Z podmínek P(0) = 1 a ř'(0) = 1 plyne, že P (x) = b x3 + c x2 + x + 1, kde b, c e R, zbylé dvě podmínky určují dvě rovnice pro neznámé bac: b+c+2 = 2a+2,3b+2c+1 = 5a+1 s jediným řešením/? = c = a, polynomy vyhovující zadaným vztahům jsou tedy tvaru P (x) = aŕ +ax2 +x+\, a s R. Podmínka na to, aby byl monotónní funkcí na celém R, je ekvivalentní tomu, že polynom nemá lokální extrém. Extrémy mohou nastat v kritických bodech, tedy v bodech, kde jeho derivace
312
KAPITOLA 5. ZŘÍZENÍ ZOO
mění znaménko. Pokud tedy derivace nebude na celém M měnit znaménko, funkce bude monotónní. Derivace je
P'(x) = 3ax2 +2ax + 1 a nebude měnit znaménko, bude-li její diskriminant nekladný. Dostáváme tedy podmínku
4a2 -12a < 0 4a(a - 3) < 0,
což odpovídá a e [0, 3]. Pro a = 0 však P sice je monotónní funkcí, nikoliv však kubickým polynomem. Dané podmínky splňují právě a e (0, 3]. □
5.200. Regiomontanův problém, 1471. V muzeu na stěně visí obraz. Jeho dolní okraj je a metrů x^-f nad zemí a horní okraj pak b metrů nad zemí (tj. výška obrazu je b — a). Na obraz se / dívá turista, jehož oči jsou ve výšce h < a metrů nad zemí. (Důvodem nerovnosti h < a ~jG^ může např. být, že se tak dá umožnit výhled stejně vysokým návštěvníkům muzea stojícím v několika řadách.) Jak daleko od stěny má turista stát, aby maximalizoval velikost svého úhlu pohledu na obraz?
Řešení. Jako x označme vzdálenost (v metrech) turisty od stěny a jako b lze postupovat analogicky a že pro h € [a, b] se zřejmě úhel
0 pro x e (o, j(b - h)(a - A)) , /'(x) < 0 pro x e (V(& - h)(a - h), +ooj
Funkce / má proto globální maximum v bodě xo = y/(b — h)(a — h) (připomeňme nerovnosti h < a < b).
Určit bod x0 lze samozřejmě i jinými způsoby. Můžeme např. místo hledání maxima kladné funkce / na intervalu (0, +oo) pomocí diferenciálního počtu hledat globální minimum funkce
g(x) = -f- = *2+(b-h)(a-h) = x (b-h)(a-h) (Q }
°v ' f(x) x(b—a) b—a x(b—a) ' v ' '
využitím tzv. A-G nerovnosti (mezi aritmetickým a geometrickým průměrem)
ve které rovnost nastává právě pro y\ = y2. Volba
x
b—a' -ízw x(b—a)
totiž dává
g(x) = yi(x) + y2(x) > 2 y/y\{x) y2(x) = J(b-h) (a-h).
b—a
Pokud tak existuje x > 0, pro které je y\(x) = y2W, má funkce g v bodě x globální minimum. Rovnice
= tj. ^ = ^ri,
má jediné kladné řešení x0 = y/(b — h)(a — h).
Dvěma odlišnými způsoby jsme stanovili ideální vzdálenost turisty od stěny. Hodnotě xo odpovídá
(Po = arctg , xo(b~a)— = arctg--
x2+(b-h)(a-h) & 2 J(b-h)(a-h)'
Při pohledu z úrovně podlahy (kdyby se díval brouk) je h = 0, a tudíž je
x0 = vflo, i a bodem B v homogenním prostředí s rychlostí šíření světla v2. Viz obrázek.
Řešení. V celém příkladu nebudeme uvádět fyzikální jednotky: můžeme kupř. předpokládat, že údaje o vzdálenostech budou v metrech a rychlosti t>i, v2 jsou v metrech za sekundu (čas bude vyjádřen v sekundách). Paprsek je určen principem rm^imálního času, kdy k přenosu energie elektromagnetickým vlněním mezi body A a B dochází takovým způsobem, aby se odehrál v co nejkratším čase. V homogenních prostředích bude paprsek úsečkou. Stačí tedy stanovit bod R (určený hodnotou x),
kde dojde k lomu. Vzdálenost mezi body A a R činí y h \ + x2 a mezi body R a B pak y h\ + (d — x)2, Celková doba přenosu energie mezi body A a S je tak dána funkcí
T(x) = ---h--
v proměnné x e [0, d\. Zdůrazněme, že chceme nalézt bod x e [0, d], ve kterém je hodnota T(x) minimální. Derivace
V(x)
d—x
V{ yrcy-t-x- v2 ^jh^+id—x)2
je spojitou funkcí na intervalu [0, d], a proto o znaménku derivace můžeme snadno rozhodnout pomocí jejích nulových bodů. Z rovnice
T'(x) = 0, tj.
d—x
vi Jh2+x2 v2 Jhi + (d-x)2
jednoduchou úpravou dostáváme
h2
Tento tvar je pro nás užitečný, neboť (viz obrázek)
1 1 " _ £i_
«2 '
d—x
sm(p\ = , sm 0, existuje právě jeden stacionární bod x0. Z nerovností T'(x) < 0 pro x e [0, x0) a T'(x) > 0 pro x e (x0, d] již plyne, že ve stacionárním bodě x0 je globální minimum.
Shrňme předchozí. Paprsek je zadán bodem lomu R (hodnotou xq) a bod R je potom určen identitou (||5.10||), která se ve fyzice označuje jako Snellův zákon.
Podíl rychlostí t>i a v2 je pro uvedená homogenní prostředí konstantní a vyjadřuje důležitou veličinu, jež popisuje rozhraní optických prostředí. Nazývá se index lomu a značí se n. Obvykle se požaduje, aby první z prostředí bylo vakuum, tj. klade se v\ = c a v2 = v, se ziskem (absolutního) indexu lomu n = c/v. Pro vakuum je n = 1. Také pro vzduch se používá n = 1, neboť při standardních podmínkách (tj. při tlaku 101 325 Pa, teplotě 293 K a absolutní vlhkosti 0, 9 gm~3) je pro vzduch n = 1, 000272. U ostatních prostředí se uvádí n > 1 (např. se klade n = 1,31 pro led, n = 1,33 pro vodu, n = 1,5 pro běžné sklo).
315
KAPITOLA 5. ZŘÍZENÍ ZOO
Index lomu ovšem rovněž závisí na vlnové délce uvažovaného elektromagnetického vlnění (kupř. pro vodu a světlo se jedná o rozsah od n = 1,331 až po n = 1,344), kdy index lomu zpravidla klesá s rostoucí vlnovou délkou. Rychlost světla v optickém prostředí s indexem lomu n > 1 totiž závisí na frekvenci světla. Hovoří se o tzv. disperzi světla. Právě disperze světla způsobuje, že se paprsky světla různých barev lámou pod různými úhly. (Nejvíce se láme paprsek fialového světla a nejméně paprsek světla červeného.) To je mj. příčina vzniku duhy. Můžeme dále vzpomenout slavný Newtonův pokus se skleněným jehlanem (optickým hranolem) z roku 1666.
Na závěr ještě doplňme, že naše úloha měla vždy řešení, protože jsme mohli volit bod R libovolně. Pokud by byl s rychlostmi t>i a v2 zadán také úhel 0. Má tak smysl analyzovat funkci (viz (||5.11||)a(||5.12||))
a(y) = 4arcsin ^ — 2arcsin j, y e [0, R].
Volbou vhodné jednotky délky (pro kterou je R = 1) přejdeme k funkci
a{x) = 4 arcsin^ — 2arcsinx, x e [0, 1].
Po výpočtu derivace
x e (0, 1)
snadno určíme, že rovnice a'(x) = 0 má jediné řešení
Jo = y^6(0,l), pokud «2e(l,4). Položme n = 4/3 (což je přibližně index lomu pro vodu). Dále je
a'(x) > 0, x e (0, x0), a'(x) < 0, x e (x0, 1). Zjistili jsme, že v bodě
= 0, 86
má funkce a globální maximum
o-(xo) = 4 arcsin - 2 arcsin = 0, 734 rad « 42 °.
Přestože je zajímavé, že vrchol duhy nemůže být nad úrovní přibližně 42 ° vůči tomu, kdo ji pozoruje, ještě zajímavější jsou vyčíslení
a(0, 74) = 39, 4°, a(0, 94) = 39, 2 °, a(0, 8) = 41, 2°, a(0, 9) = 41, 5°.
Ta totiž implikují (funkce a roste na intervalu [0, x0] a klesá na intervalu [x0, 1]), že více než 20 % hodnot a leží v úzkém pásu zhruba od 39 ° do 42 ° a 10 % v pásu o šířce menší než 1 °. Pokud navíc uvážíme např.
a(0, 84) =41,9°, a(0, 88) = 41, 9°,
vidíme, že paprsky, pro které je a blízké hodnotě 42 °, mají největší intenzitu. Vyzdvihněme, že se jedná o případ tzv. principu minimální odchylky, kdy platí, že k největší koncentraci rozptýleného světla dochází právě u paprsků s minimální odchylkou. Celková úhlová odchylka paprsku se totiž rovná úhlu 8 = n — a.
Kapky, ze kterých směřují paprsky k pozorovateli vidícímu duhu, tak leží na povrchu kuželu s centrálním úhlem 2a (x0). Nadzemní část tohoto kuželu se pak jeví pozorovateli právě jako kruhový oblouk duhy (viz obrázek). Při západu Slunce by tedy měla duha tvar půlkružnice. Uvažte také, že duha se realizuje vzhledem k pozorovateli - není nikde v prostoru. Na závěr poznamenejme, že onen kruhový tvar duhy podrobně zdokumentoval již René Descartes, který duhu vědecky zkoumal v letech 1635-1637. □
317
KAPITOLA 5. ZŘÍZENÍ ZOO
5.203. ĽHospitalova kladka.
Ke stropu je v bobě A uvázáno lano délky r. Na jeho druhém konci je připevněna kladka. Ve
f,, vzdálenosti d (v bodě B) od bodu A je ke stropu přivázáno druhé lano délky l > v'd2 + r2, které prochází kladkou. Na tomto druhém laně je zavěšeno závaží. V jaké pozici se závaží x ustáli (systém přejde do stacionární polohy)? Při řešení úlohy zanedbejte hmotnost i velikost lan a kladky.
Řešení. Systém bude ve stacionární poloze, pokud bude minimalizována jeho potenciální energie, tj. vzdálenost závaží od stropu fix) bude maximální. To však znamená, že pro r > d se kladka pouze přesune pod bod B. Nadále proto budeme předpokládat, že r < d. Podle Pythagorovy věty je vzdálenost kladky od stropu \Jr2 — x2 a vzdálenost kladky a závaží je l-y/(d- x)2 + r2 - x2 , coz dává
f{x) = Vr2 - x2 + l - y/(d - x)2 +r2 -x2 .
Poloha systému je zcela popsána hodnotou x e [0, r] (viz obrázek), a tudíž stačí najít globální maximum funkce / na intervalu [0, r]. Nejprve spočítáme derivaci
f'W = ~ j(d-x)*+fi-x* = + Ad-xÝ+fi-x*' x e (0' r)-
Umocnění rovnice fix) = 0 pro x e (0, r) vede na
X2 = d2
r2 —x2 {d—x)2+r2 —x2
Vynásobením obou stran výrazem (r2 — x2) (id — x)2 + r2 — x2) pak (po úpravě) dostaneme
2dx3 - (Id2 +r2)x2 +d2r2 = 0, x e (0, r).
Všimneme-li si, že jedním z kořenů polynomu na levé straně je zřejmě x = d, snadno převedeme poslední rovnici do tvaru
ix-d) (2dx2 - r2x - dr2) =0, x e (0, r), resp. (pro kvadratickou rovnici máme vzorec)
318
KAPITOLA 5. ZŘÍZENÍ ZOO
2d(x-d)(x- ^W4-2+8ť) (* - ?-^^S) =0, x e (0, r). Odsud vidíme, že rovnice f'(x) = 0 má v intervalu (0, r) nejvýše jedno řešení. (Neboť je r < d a Vr2 + 8úP > r, dva kořeny uvažovaného polynomu v proměnné x určitě v intervalu (0, r) neleží.) Zbývá rozhodnout, zda
^+rVV2+8íŕ _ 1 ,„ r_ j_ /ŕ^2 j_ 8 e (0, r).
X0 - -4ď- - 4 r
Když však uvážime, že r, 0 a r < d, snadno získame
r.
0 < x0 < ^ r
l+VT^T
Vzhledem ke spojistosti funkce /' na intervalu (0, r) může dojít ke změně jejího znaménka pouze v bodě x0. Z limit
lim f'(x) = -já—, lim f'(x) = -oo
jc^0+ V^+í-2 x^r-
tak již vyplývá, že
f'(x) > 0, x e (0, x0), f'(x) < 0, x e (x0, r). Funkce / má proto globální maximum na intervalu [0, r] v bodě xq. □
5.204. Nejmenovaná poštovní společnost má ve svých podmínkách uvedeno, že délka jí přepravo-,\\)iv váného balíku nesmí být větší než 108 palců a že součet jeho délky a maximálního obvodu nesmí přesáhnout hodnotu 165 palců. Nalezněte balík největšího objemu, který podle svých podmínek společnost může doručit.
Řešení. Nechť M označuje hodnotu 165 in (tj. palců) a x délku balíku (v palcích). Hledaný balík bude mít zřejmě takový tvar, že jeho průřez pro libovolné t e (0, x) bude mít stejný (ten maximální) obvod, který (rovněž vyjádřen v palcích) budeme značit jako o. Chceme, aby balík měl maximální objem, a tudíž aby průřez daného obvodu měl maximální obsah. Není obtížné si uvědomit, že rovinný útvar, který má při daném obvodu maximální obsah, je kruh. Tím jsme dospěli k závěru, že hledaný balík největšího objemu má tvar válce o výšce x a poloměru podstavy r = o/2tt. Jeho objem je
V =Txr2x = 4^,
přičemž musí být o + x < M a také x < 108 in. Uvažujme proto balík, pro který je právě o + x = M. Ten má objem
V(x) = = *3-™£+m2* , kde x e (0,108]
Spočítáme-li derivaci
yl(x) = 3,2-4M,+M2 = 3(*-*)(*-f)^ x £ 10g)
snadno zjistíme, že funkce V roste na intervalu (0, 55] = (0, M/3] a klesá na intervalu [55, 108] = [M/3, min {108, M}]. Největší objem tak dostáváme pro x = M/3, přičemž
v (f) = m =0,011789 M3 « 0, 867 8 m3. Pokud by společnost v přepravních podmínkách požadovala, aby měl balík tvar kvádru, příp. jistého hranolu, můžeme předchozí úvahy zopakovat pro daný průřez o obsahu 5, aniž bychom specifikovali, jak tento průřez vypadá. Stačí si uvědomit, že nutně S = ko2 pro jisté k > 0, které je právě určeno tvarem průřezu. (Když se pouze změní velikost mnohoúhelníku, jenž je průřezem, tak se změní ve stejném poměru také jeho obvod. Obsah se však např. zdevítinásobí při trojnásobné velikosti - trojnásobném obvodu.) Objem balíku je tedy funkcí
319
KAPITOLA 5. ZŘÍZENÍ ZOO
V (x) = Sx = ko2x = k (M — x)2 x, x € (0, 108].
Konstanta k neovlivňuje bod, kde je globálni maximum funkce V, a proto toto maximum nastává opět pro x = M/3. Např. pro nejobjemnější kvádr s podstavou čtverce je o = M — x = 2M/3, tj. délka strany jeho podstavy je a = M/6 a objem potom
V = a2x = = 0, 009259 M3 « 0, 681 6 m3.
Pro balík ve tvaru koule, kdy je x průměrem, podmínku o + x < M můžeme ihned přepsat do tvaru Ttx + x < M, tj. x < M/{jt + 1) < 108 in. Pro x = M/{jt + 1) tak získáváme maximální objem
V = \n (f)3 =--^--3 = 0,007 370M3 « 0,5426 m3.
3 V2/ 6(jt+1)3 ' '
Podobně pro balík ve tvaru krychle, kdy x udává délku hrany, podmínka o + x < M znamená, že x < M/5 < 108 in. Takže pro x = M/5 dostáváme maximální objem
V = x3 = (f )3 = 0, 008 M3 « 0, 588 9 m3. Ještě doplňme, že krychle, která má stejný objem jako nalezený válec, má délku hrany a = ^= =0,227 595M^ 0, 953 849 m.
Uvědomme si, že pro ni je součet její délky a obvodu roven 5a = 1, 138 M, tj. o bezmála 14 % překračuje hodnotu stanovenou společností. □
5.205. Rozlehlý vojenský prostor (nadále zkráceno na VP) s půdorysem čtverce o rozloze 100 km2 je kolem dokola ohraničený úzkou cestou. Z výchozího místa v jednom rohu VP se lze dostat do cílového místa uvnitř VP tak, že se jde 5 km po cestě a poté 2 km kolmo k ní. Ovšem můžete jít libovolnou dobu po cestě rychlostí 5 km za hodinu a potom šikmo přes VP rychlostí 3 km za hodinu. Kolik (kilo)metrů musíte jít po cestě, abyste došli na místo určení co nejdříve?
Řešení. K tomu, abychom po cestě ušli x km, přičemž x e [0, 5], potřebujeme x/5 hodin. Naše cesta přes VP pak bude měřit
V22 + (5 - x)2 = Vx2 - lOx + 29 kilometrů a ujdeme ji za Vx2 — lOx + 29/3 hodin. Celkem bude naše cesta trvat
f(x) = ±x + \s/x2 - lOx + 29 hodin (připomeňme, že x e [0, 5]). Jediný nulový bod funkce
/ W - 5 "I" 3 Jx2_10x+29
je x = 7/2. Protože derivace /' existuje v každém bodě intervalu [0, 5] a protože
/(!) = i(5) = ! (0) = ^,
funkce / má v bodě x = 7/2 absolutní minimum. Po cestě bychom tudíž měli jít 3, 5 km. □
5.206. Jste ve člunu na jezeře ve vzdálenosti d km od pobřeží. Chcete se dostat co nejrychleji do určeného místa na pobřeží ve vzdušné vzdálenosti -Jd2 + Z2 km od Vás (viz obrázek). Jak si budete počínat, pokud dokážete veslovat rychlostí v\ kxn/h a po břehu běžet rychlostí v2 km/h? Jak dlouho Vám bude cesta trvat?
Řešení. Optimální strategie je zřejmě dána tím, že dorazíte ke břehuvjistém bodě[0, x]prox e [0,/] a poté budete běžet podél břehu do cílového místa [0, l] (viz obrázek), kdy je tedy trajektorie složena ze dvou úseček (přip. z jedné pro x = Z). Doplout ke břehu v bodě [0, x] Vám bude trvat
hodin
320
KAPITOLA 5. ZŘÍZENÍ ZOO
a běh po pobřeží pak
— hodin.
Jde o to, aby celkový čas byl minimální, tj. je potřeba minimaUzovat funkci
t(x)
jd2 +x2 . l-x_
na intervalu [0, /]. Navíc lze předpokládat, že v\ < v2. (Pro v\ > v2 je nepochybně nejrychlejší veslovat přímo k cílovému místu, čemuž odpovídá x = l.) Nejprve vypočítáme první derivaci
ť(x)
a poté druhou
Dále vyřešíme rovnici Jejím umocněním obdržíme Jednoduchá úprava tak již dává
ť(x)
v^(s+x2Y
ť(x)=0, tj.
x e (0, l) x e (0,1).
j£+x2 v2 '
fé)2
tj-
Uvědomme si, že uvažujeme pouze x e (0,1). Zajímá nás proto, zdaje
< i,
po úpravě — < , ' „
ť ť v2 Jl2+£
Pokud je tato nerovnost splněna, je rovněž v\ < v2 a funkce ř' mění znaménko pouze v bodě
X0
-ti)
a to ze záporného na kladné (uvažte lim^o-n ť (x) < 0 a ť (x) > 0, x e (0, /)). To znamená, že v tomto případě je v bodě x0 globálni minimum funkce t na intervalu [0, /]. Jestliže nerovnost (II 5.206 II) splněna není, pak je ť (x) < 0 pro všechna x e (0, 0, odkud plyne, že globální minimum funkce t na [0, l] je v pravém krajním bodě (funkce t je na svém definičním oboru klesající). Nejrychlejší cesta tedy bude trvat (v hodinách)
n
t(x0) = --+- = — d2 +
Vl
v2
teľ
1
+ —
v2
v-±d
V2
l I\ — (El]2 _ El d V \V2 J V2>
fe))
321
KAPITOLA 5. ZŘÍZENI ZOO
+^^-{vif-id (i - fe)2)W1 - feľ
+
ľlľ2 ľlľ2 l"2
platí-li (115.20611), a
ř (Z) = hodin,
když (115.20611) neplatí. □
5.207. Firma hledá obdélníkovou parcelu o rozměrech 5a x ŕ se záměrem ji po obvodu celou oplotit a pak ještě ploty kolmými na první stranu rozdělit na 5 stejně veľkých parcel o rozměrech a x b. Pro jaké hodnoty a, b bude rozloha parcely S = 5ab maximální, má-li být celková délka plotů 2 400 m?
Řešení. Přeformulujme zadání: Chceme maximalizovat součin 5ab při splnění podmínky (5.13) 66 + 10a = 2400, a,b>0.
Lehce lze ukázat, že funkce
a h-» 5a
2 400-10a
6
definovaná pro a e [0, 240] nabývá maximální hodnoty v bodě a = 120. Proto je výsledek
a = 120 m, b = 200 m. Doplňme, že uvedená hodnota b bezprostředně plyne z (||5.13||). □
5.208. Do rovnostranného trojúhelníka o straně a je vepsán pravoúhelník (jedna jeho strana leží na straně trojúhelníka, zbylé dva vrcholy leží na zbylých stranách trojúhelníka). Jaký může mít maximálně obsah?
5.209. Zvolte rozměry otevřeného bazénu se čtvercovým dnem o objemu 32 m3 tak, aby na natření jeho stěn a dna bylo potřeba nejmenší množství barvy. O
5.210. Číslo 28 rozložte na 2 nezáporné sčítance tak, aby součet druhé mocniny prvního sčítance a třetí mocniny druhého sčítance byl minimální. O
5.211. Pomocí první derivace nalezněte reálné číslo a > 0, pro které je součet a + l/a minimální. Poté tuto úlohu řešte bez použití diferenciálního počtu. O
5.212. Vepište do půlkruhu o poloměru r obdélník s největším možným obvodem. Uvedte jeho obvod.
O
5.213. Existuje-li mezi obdélníky o obvodu 4c obdélník s maximálním obsahem, stanovte délky jeho stran. O
5.214. Zjistěte výšku i; a poloměr podstavy r nej objemnějšího kužele, který se vejde do koule o poloměru R. O
5.215. Ze všech trojúhelníků s konstantním obvodem o > 0 vyberte ten, jenž má největší obsah. O
5.216. Na parabole 2x2 —2y = 9 najděte body s minimální vzdáleností od počátku soustavy souřadnic.
O
322
KAPITOLA 5. ZŘÍZENÍ ZOO
5.217. Vaším úkolem je vyrobit jednolitrovou plechovou konzervu „obvyklého" tvaru rotačního válce tak, aby na její výrobu bylo potřeba co nejméně plechu. Určete správný poměr mezi její výškou i; a poloměrem podstavy r. O
5.218. Určete vzdálenost bodu [3, —1] eť od paraboly y = x2 — x + 1. O
5.219. Určete vzdálenost bodu [—4, —2] e R2 od paraboly y = x2 + x + 1. O
5.220. V čase t = 0 vyjelo auto z bodu A = [5, 0] rychlostí 4 jednotky za sekundu směrem (—1,0). Ve stejném čase vyjelo druhé auto z bodu B = [—2, —1] rychlostí 2 jednotky za sekundu směrem (0, 1). Kdy si budou auta nejblíže a jaká bude tato vzdálenost? O
5.221. V čase t = 0 vyjelo auto z bodu A = [0, 0] rychlostí 2 jednotky za sekundu směrem (1, 0). Ve stejném čase vyjelo druhé auto z bodu B = [1,-1] rychlostí 3 jednotky za sekundu směrem (0, 1). Kdy si budou auta nejblíže a jaká bude tato vzdálenost? O
5.222. Určete maximální možný objem kužele o povrchu 3tt cm2 (do povrchu kužele počítáme i obsah podstavy). Povrch kužele spočítáme jako P = nr(r + v), objem jako V = \Ttr2v, kde r je poloměr podstavy a i; výška kužele. O
5.223. O dům je opřený žebřík dlouhý 13 stop. Náhle základna žebříku podklouzne a žebřík začne sjíždět k zemi (stále zůstává opřený o dům). Když je základna žebříku 12 stop od domu, klouže od něj rychlostí 5 stop/s. Jak rychle v tomto okamžiku
(a) klesá vršek žebříku po zdi;
(b) se mění obsah trojúhelníku vymezeného žebříkem, domem a zemí;
(c) se mění úhel, který svírá žebřík se zemí?
O
5.224. Předpokládejte, že vlastníte dostatek finančních prostředků bez možnosti investovat mimo svou továrnu s působností na cenově regulovaném trhu s takřka neomezenou poptávkou a omezeným přístupem k některým klíčovým surovinám, což Vám umožňuje produkovat nejvýše 10 000 výrobků denně. Víte, že pro hrubé výnosy i; a náklady n jako funkce proměnné x, udávající v tisících průměrný počet výrobků vyrobených za den, platí
v(x) = 9x, n(x) = x3 - 6x2 + 15x, x e [0, 10].
Při jakém objemu výroby budete mít z Vaší továrny největší zisky? O
5.225. Určete
/ 1 lim cotgx--
x^0 \ X
Řešení. Uvědomíme-U si, že je
1
lim cotgx = +oo, lim — = +oo,
x^0+ x^0+ X
1
lim cotgx = — oo, lim — = — oo,
x^0- x^0- X
vidíme, že v případě obou jednostranných limit dostáváme typ oo — oo. Můžeme tedy uvažovat najednou oboustrannou limitu. Funkci kotangens zapíšeme jako podíl kosinu a sinu a zlomky převedeme
323
KAPITOLA 5. ZŘÍZENÍ ZOO
na společného jmenovatele, tj.
/ 1 \ x cosx — sinx lim cotg x--) = lim-.
x^o \ x) x^o x sinx
Obdrželi jsme výraz 0/0, pro který platí (podle 1'Hospitalova pravidla)
x cosx —sinx cosx — x sinx — cosx —xsinx
lim-= lim-= lim
x^o xsinx x^o sinx+x cosx x^o sinx + x cosx
Druhým použitím 1'Hospitalova pravidla pro typ 0/0 pak již dostaneme
—xsinx — sinx —x cosx 0 — 0
lim-= lim-=-= 0.
x^o sinx + x cosx x^o cosx + cosx — x sinx 1 + 1 — 0
5.22c). Určete limitu
5.227. Stanovte
JtX
lim (1 -x)tg—.
jt-» 1 — z
Hm g-xtgx).
5.228. Pomocí 1'Hospitalova pravidla určete
Ä, ((^ "
5.229. Vypočtěte
1 1
lim
i \ 2 ln x x2 — 1
5.230. Užitím 1'Hospitalova pravidla spočtěte limitu
lim cos —
X^+QO \ X
5.231. Vypočtěte
lim(l -cosx)sin*
x^0
5.232. Určete následující dvě limity
□
O
o
o
o
o
o
lim x i" *■, lim x i" *■, přičemž a e Ije libovolné. O
5.233. Libovolným způsobem ověřte, že je
ex - 1 lim- = 1.
x^0 X
O
324
KAPITOLA 5. ZŘÍZENÍ ZOO
5.234. Aplikací podílového (tzv. ďAlembertova) kritéria (viz 5.47) určete, jestli nekonečná řada
(a) E
n = \ oo
(b) E
«=i
(C) „".„!
«=i
konverguje.
Řešení. Protože (a„ > 0 pro všechna ri)
(a) Um 2^1 = um |7^fgf = lim f^+f = lim f, = f < 1;
«^oo fl" «^oo 3"+1-2"-(« + l)j „^oo 3(« + l)j „^oo 3«j 3
(b) lim 2*±i = lim (/^-j •£)= Um 4r = 0 < 1;
(C) Um 2^ = lim f, i^r'n, • = i™ t^tt • lim ^±Ľ1 = lim *2
V ' n^oo an n^oo \(" + 1)2-(" + 1)! " / n^oo (" + D2 n^oo " n^oo
lim (1 + i)" = 1 e > 1, řada (a) konverguje; (b) konverguje; (c) nekonverguje (diverguje k +00). □
5.235. Aplikací odmocninového (tzv. Cauchyova) kritéria určete, jestli nekonečná řada
00
1
(a) E in"(„
n = \
(n + 1)'
OO (n±±Y
(b) E^
n = \ 00
(c) E arcsin" §f konverguje.
Řešení. Opět máme řady s nezápornými členy, přičemž je
(a) lim zfa~n = lim j—±— = O < 1;
(n±l)n lim (l + l)"
(b) lim zfa = lim VfT = 7°° (3 = f < 1;
(c) lim zja~^ = lim arcsin = arcsin O = O < 1.
To znamená, že všechny zadané řady konvergují. □
5.236. Rozhodněte, zda řada
00
(a) E(-l)" ln(l + £);
n = l
00 2
(b) E ^ ■
.1!
«=1 00
z- (6+(-i)")" «=1
konverguje.
Řešení. Případ (a). Podle 1'Hospitalova pravidla je
lim 7 = lim 2 ,-= lim —
a proto platí
0 že je konvergentní. Musí tak být
325
KAPITOLA 5. ZŘÍZENÍ ZOO
E In (1 + 2^) < +00,
n = \
tj. řada v zadání konverguje (absolutně). Případ (b). Podílové kritérium dává
lim
r7=>00
,. 2("+1) -«l i- 22"+1 i- 2-4'
lim---r = lim -—r = lim
«->oo (« + l)!-2«2 «->oo " + 1
n + l
+ OO.
Řada tedy nekonverguje.
Případ (c). Nyní použijeme obecnou verzi odmocninového kritéria
lim sup ý\an I = lim sup 3 — 3
6+C-l)" 5
< 1,
z níž plyne (absolutní) konvergence řady.
□
5.237. Libovolným způsobem dojděte k rozhodnutí o konvergenci alternující řady
(a) E(-D"^
n = \
n n2+3n-l . -2)2 '
(b) E(-D
n = \
n-l 3«4-3«3+9«-l (5«3-2)-4« 1
Řešení. Případ (a). Z toho, že je ihned vyplývá neexistence Umity
lim "+3""1 = lim " - 1
r7=>00 ^n Z' r7=>00
9«2 9
ŕ o,
lim (-1)"
« «2+3«-l (3«-2)2 '
Řada tudíž nekonverguje (není splněna nutná podmínka konvergence).
Případ (b). Viděli jsme, že při použití podílového (nebo odmocninového) kritéria polynomy v čitateli ani jmenovateli členů řady neovUvňují hodnotu počítané limity. Uvažujme tedy řadu
EC-D"-1^
n = \
pro kterou je
lim
r7=>00
"n+\
To ovšem znamená, že rovněž původní řada je (absolutně) konvergentní.
□
5.238. Konverguje řada
E(-D"+1arctg;^:
«=1
Řešení. Posloupnost 12/V5« | je zřejmě klesající a funkce y = arctg x rostoucí (na celé reálné
ose), a tudíž posloupnost arctg [2/y/3ň) \ je klesající. Je tedy zadána alternující řada splňující, že posloupnost absolutních hodnot jejích členů je klesající. Taková alternující řada konverguje, právě když posloupnost jejích členů konverguje k 0 (tzv. Leibnizovo kritérium), což je ovšem splněno:
lim arctg -7= = arctg 0 = 0, tj. lim f(-l)"+1arctg = 0.
□
326
KAPITOLA 5. ZŘÍZENÍ ZOO
5.239. Zjistěte, jestli řada
oo
(a) E ^r;
n = l
(b) E
COS (7777 )
-=1 ^
konverguje absolutně, příp. neabsolutně (relativně), nebo nekonverguje.
Řešení. Případ (a). Ukázat, že tato řada konverguje absolutně, je snadné. Např. je
E I ~ň2~ I — E ^ < E 2« = ^
n — 1 n — 1 n—0
přičemž druhou nerovnost jsme dokázali dříve.
Případ (b). Je vidět, že cos (jzri) = (—l)n,n e N. Máme tedy alternující řadu, jejíž posloupnost členů v absolutní hodnotě je klesající. Proto z limity
lim 4= = 0
již plyne, že řada konverguje. Zároveň však je
^ ^ „ti ^ " „ti"
«=1
Řada tak konverguje neabsolutně. □
5.240. Sečtěte řadu
«=1 00
(b) E Jr;
n=0
00
(c) E (42/1-1 + 4>r) !
n = l 00
(d) E f;
n = l 00
(Ě) 5ľ (3« + l)(3«+4)-
«=0
Řešení. Případ (a). Podle definice je součet řady
y(-l--l-) = i™ ((tt " A) + (75 - A) + • • • + O ~ vfe)) =
lim fl + (-4. + + + f_ 1 + 1 ) _ 1 ) = 1.
Případ (b). Zjevně se jedná o pětinásobek konvergentní geometrické řady s kvocientem q = 1/3, a tudíž je
oo OO ^
E pr = 5 E (3) = 5 • 771 = y-
«=0 «=0 Případ (c). Platí (při substituci m = n — 1)
0o3 ^ ^ oo ^ 2°°1
E (42/1-1 + 427j) = 4 E (42/1-2) + Tg E (42^ n — 1 « —1 « —1
(4 16/ ^ 42m 16 ^ v 16/ — 16 ' 1__1 ~~ 15-
m=0 m=0 16
Řadu Uneárních kombinací jsme zde vyjádřili jako lineární kombinaci řad (přesněji řečeno, jako součet řad s vytknutím konstant), což je platná úprava, pokud obdržené řady jsou absolutně konvergentní.
327
KAPITOLA 5. ZŘÍZENÍ ZOO
Případ (d). Z částečného součtu
3"r"32"r"33"r"'''"r"3;
sn = k + ě + é + --- + £> «eN
bezprostředně získáváme
3 — 32 l 3:
£2. — -L 4- -1 4- ... 4- !Ľ± 4- -2- « (= M
3 — i2 T i3 T T o„ T , « c «■
Je tedy
o — I4.Í4.ÍJ....J.J___«_ „ c M
3 - 3 T 32 T 33 T ■ ' ■ T 3« 3«+1
Protože lim = 0, dostáváme
3«
i£(ir=i(^T-i)=i-
Případ (e). Stačí použít vyjádření (jde o tzv. rozklad na parciální zlomky)
1 1111
;, í1ěNU{0),
(3« + l)(3«+4) 3 3« + l 3 3«+4'
které dává
i
1 _ i;m 1 /1 1,1 1,1 1 , , 1 1
(3» + l)(3»+4)
n—u
lim I (1 - Ti3) - 1
£-> (3« + l)(3«+4) 3 v 4 T 4 7 T 7 10 T T 3« + l 3«+4/
5.241. Ověřte, že platí
Řešení. Ihned je vidět, že
1 <
resp. obecný odhad
oo oo
~^2 < jň-
n—1 n—0
1<1 J- + J-<2-^--i ± + -i- + -i- + -i- < 4 • ± - i
1 - -1' 22 ^ 32 < Z 22 — 2' 42 ^ 52 ^ 62 ^ 72 < ^ 42 — 4'
□
(2«)2 ^ ~ (2"+1-l)2 (2«)2 ~~ 2"
Odsud (porovnáním členů obou řad) dostáváme zadanou nerovnost, z níž mj. plyne absolutní konvergence řady YlT=i ^- Ještě upřesněme, že je
5Z^ = T<2=^2"-
n — 1 «—0
□
5.242. Vyšetřete konvergenci řady
oo
£ln*±i.
« = 1
Řešení. Pokusme se uvedenou řadu sečíst. Platí
oo
£ln^=lm(lnf + lnf+lnf + ...+ln2±i) =
n_j " «^oo 1 A J "
lim ln 2W"+1> = lim ln (n + 1) = +00.
«^►00 l-Z-J---« «^0o
Řada tudíž diverguje k+00. □
328
KAPITOLA 5. ZŘÍZENÍ ZOO
5.243. Prokažte, že řady
Earctg"2+2"t3,^+4; E -TTT—
o n + 1 ' ni+n1—n
n—O n—l
nekonvergují. Řešení. Protože
lim arctg "2+2"+3f+4 = iim arctg n-
ŕ7 _ 7ľ_
2
a
hm o, ^ = lim = +oo,
není splněna nutná podmínka konvergence lim a„ = 0 řady Z~YYnn an ■ □ 5.244. Jaký je součet řady
oo
E
«=2
Řešení. Z nerovností (uvažte graf přirozeného logaritmu)
1 < Inn 3, n e N
plyne
VT < v^ňn < 3, n e N. Podle Věty o třech limitách (5.21) je
lim tylnn = 1, tj. lim -J= = 1. Řada tedy není konvergentní. Neboť má nezáporné členy, musí divergovat k +00. □
5.245. Zjistěte, zda řada
00 Eôŕ
(n + l)-3" '
«=0
(b) E
«=1 00
(c) E—r-
« = 1
konverguje.
Řešení. Všechny tři uvedené řady mají nezáporné členy, a tak mohou v jednotlivých variantách nastat jen dvě možnosti - součet je konečný, součet je roven +00. Platí
(a) E T^W < E (I)" = A < +00;
«=0 «=0 3
(b) E2r>E=r = EH+~;
77 — 1 77 — 1 77 — 1
OO OO
(c) E —r- > E 1 = +°°-
v 7 ^—' 77—ln 77 — ^—' 77
77 — 1 77 — 1
Odtud plyne, že řada (a) konverguje; (b) diverguje k +00; (c) diverguje k +00. □ 5.246. Ukažte, že tzv. harmonická řada
^ n
«=1
diverguje.
329
KAPITOLA 5. ZŘÍZENÍ ZOO
Řešení. Pro libovolné přirozené k je součet prvních 2 členů řady větší než k/2 1111111 1 + 2+3 + 4+5 + 6 + 7+8+---'
í.i_i
"4+4-2
' 8 + 8 + 8 + 8 — 2
součet členů od 2l +1 do 2l+1 je totiž vždy větší než 2'-krát (jejich počet) číslo 1/2' (nejmenší z nich), což je dohromady 1/2. □
5.247. Rozhodněte o následujících řadách, jestli konvergují či divergují:
oo
i) £ -
« = 1 oo
n = l
ííí) £ -
1
n = l
2100000
£ (í+o"
n = l
Řešení.
i) Budeme zkoumat konvergenci podílovým kritériem:
2(n + 1) lim -= 2 > 1,
2n+l
lim an + \ = lim n + 1 In
Z
řada tedy diverguje.
ii) Odhadneme řadu ze spodu: víme, že pro libovolné přirozené n platí \ < -j^. Pro posloupnost částečných součtů s„ zkoumané řady a posloupnost částečných součtů harmonické řady s'n tedy platí:
n ^ H \
A protože harmonická řada diverguje (viz předchozí příklad), diverguje i její posloupnost částečných součtů {s'n}^=l, tedy diverguje i posloupnost částečných součtů {sn}^, tedy diverguje i zadaná posloupnost.
iii) Diverguje, jedná se o násobek harmonické řady.
iv) Jedná se o geometrickou řadu s koeficientem j^j, ta bude konvergovat, bude-li absolutní hodnota koeficientu menší než 1. Víme, že
1
1
1 1
1 1 72 - + - = — < 1, 4 4 2
1 + i1 1 2 1 12 2 1 řada tedy konverguje a umíme ji dokonce sečíst:
1 1 1 + i
n = l d + 0" 1 " lil
1
□
5.248. Do čtverce o délce strany a > 0 je vepsán čtverec, jehož strany jsou spojnicemi středů stran zadaného čtverce. Do vepsaného čtverce je stejným způsobem vepsán další čtverec atd. Stanovte součet obsahů a součet obvodů všech těchto (nekonečně mnoha) čtverců. O
330
KAPITOLA 5. ZŘÍZENÍ ZOO
5.249. Nechť je dána posloupnost řádků půlkruhů, přičemž v n-tém řádkuje 2" půlkruhů o poloměru 2~" pro každé n e N. Jaký bude obsah libovolného obrazce složeného ze všech těchto půlkruhů, když nebudou umístěny přes sebe? O
5.250. Vyřešte rovnici
1 - tg x + tg2x - tg3 x + tg4x - tg5x + • •
tg2x + l
5.251. Určete
oo
,2"
« = 1
5.252. Sečtěte
E W + 2n + T.
5.253. Dokažte konvergenci a nalezněte součet řady
oo
„ 3n+2n
«=1
5.254. Stanovte součet řady
oo
(a) E
(b) E ^
5.255. Sečtěte
1-3 ^ 3-5 ^ 5-7 ^ (2«-l)(2« + l) •
« = 1
5.256. Pomocí rozkladu na parciální zlomky vyčíslete
i .
«2-l ■
(a) E ^
«=2
(b) E
*?3+3ŕ72+2ŕ7 '
«=1
5.257. Sečtěte konvergentní řadu
E
4«2-l ' «=0
O
o
o
o
o
o
o
331
KAPITOLA 5. ZŘÍZENÍ ZOO
O
5.258. Určete součet řady
V 1
t—1 n2+3n '
oo
1
« = 1
O
5.259. V závislosti na
s ■= y t-u" =i_i + i_i + i_i + i_ii...
a • 2— « 1 2^3 4^5 6^7 8 ^
« = 1
vyjádřete součty řad
+ + G + +
které z výše uvedené řady vznikly přerovnáním (tj. změnou pořadí členů). O 5.260. Zjistěte, zda řada
oo
E
5" «=0
konverguje. O
5.261. Dokažte následující tvrzení: Jestliže řada E^o a" konverguje, pak je lim sin (3a„ + jt) = 0.
«=>00
O
oo _ oo oo
5.262. Pro jaké a e R; p e Z; y e M\{0} konvergují řady E ^p: E ^r1; E ^r?
« = 120 " «=240 " «=360 ^
O
5.263. Rozhodněte, zda řada
E(_1)„ÍL^5ÍL+2«
2 «=21
konverguje absolutně, konverguje neabsolutně (relativně), nebo nekonverguje. O 5.264. Zjistěte, jestli je limita
lim (\ + \ + • • • + S1)
„=.00 V«2 «2 «2 I
vlastní. Upozorněme, že k tomu nelze využít součtů
Í? = T- E — = +oo.
« —1 «—2
O
5.265. Najděte všechna reálná čísla A > 0, pro která řada
oo
E(-l)"ln(l + A2")
«=i
konverguje. O 5.266". Zopakujme, že harmonická řada diverguje; tj. platí
oo
E 1 = +oo.
« = 1
Rozhodněte, zda také řada
i+... + _ + J_ + ...4-_L_l__L_|_..._|__L_|_...
x T 9 11 T 19 T 21 T T 29 T
332
KAPITOLA 5. ZŘÍZENÍ ZOO
--1—1_..._|--1—I--1--u...-I—1—i—1—u...
91 T 99 T 111 T T 119 T 121 T
diverguje. O
5.267. Udejte příklad divergentních číselných řad 2~2T=i a"> 2~2T=i ^« s kladnými členy, pro které řada 2~2T=i Oan — 2bn) absolutně konverguje. O
5.268. Zjistěte, zda jednotlivé řady
OO - OO 7 4
Ei_i\« («!) . v-1 /_i \n n —n+n \ (2«)!' 1) „8+2„6_|_„
n — 1 « —1
konvergují absolutně, konvergují neabsolutně, či nekonvergují. O
5.269. Konverguje řada
«=1
O
5.270. Nalezněte hodnoty parametru pel, pro které řada
OO
£ (-1)" sin" f
«=i "
konverguje. O
333
KAPITOLA 5. ZŘÍZENÍ ZOO
Řešení cvičení
5.2. P(x) = (-| - |«V + (2 + 3;> - f -5.77. 3x2 -2x -4.
5.72. (2X2 - 5) /3; např. (§x2 - f)3.
5.73. a = 1, b = -2, c = 0, = — 1;
sup C = 9, inf C = -9.
5.30. Lehce lze ukázat, že
3
sup A = -, inf A = 0.
5.37. Zřejmě je
inf N = 1, sup M = 0, inf J" = 0, sup J" = 5.
5.32. Lze položit kupř.
M := Z \ N; TV := N.
5.33. Uvažte jakoukoli jednoprvkovou množinu IcR.
5.34. Množina C musí být jednoprvková. Nechť je tedy např. C = {0}. Nyní můžeme zvolit A = (—1,0),
£ = (0, 1). 5.40. Platí
(X 2 n-2 n-l\ /1+n-l n-l\ 1 lim — + — + ... + —— + —— = lim----— = -.
n^oo \vnz nz nz nz / «=>oo y «z 2/2
5.47. Snadno lze ukázat, že
Vn3 — lln2 + 2 + ŽJn1 — 2n5 — n3 — n + sin2 n
lim - - = — oo.
2 - V5n4 + 2n3 + 5
334
KAPITOLA 5. ZŘÍZENÍ ZOO
5.42. Limita je rovna 1.
5.43. Kupř. lze položit
xn := n, yn := —n + 1, n e N.
5.44. Správná odpověď je ±1.
5.45. Výsledek je
lim sup a„ — 1,
5.46. Platí
/ „/ 1\" nit\ V2
liminf (-1)" 1 + - +sin— = -e--.
n^oo \ \ n J AJ 2
5.63. Uvedená funkce je spojitá na celém R.
5.64. V bodech — ji, 0, n je spojitá; v bodě 2 je spojitá pouze zprava a v bodě 3 pouze zleva; v bodě 1 není spojitá ani z jedné strany.
5.65. Je nutné položit /(O) := 0.
5.66. Funkce je spojitá právě pro p = 2.
5.67. Správná odpověď je a — A.
5.68. Je
sin8 x sin8 x
lim —-— = lim —-— = 0.
Jt-»0+ XJ x^-oo x5
5.71. Jediné řešení x — — 1.
5.72. Ano.
5.76. f'(x) = 2xlnx~1 lnx.
5.77. (sin x)1 +cos x (cotg2 x - ln (sin x)).
5.79. f - -^0, 003.
5.80. a « | +0,01; ŕ «4, 125.
5.8/.(a)i-#;(b)f + #. 5.Si. Ano, má.
5.84. y=f x-|.
5.85. y = 2x.
5.86. y = v^íx + 1); y = (x + 1).
í »7 v ln5 _ /13 ln5\, n. ,, ln5 _ 20 / n
5.87. V - — - - — J (X - i), \ - - 5in5_26(x - l>-
5.88. [i2i].
5.89. f:y=| + f;n:y = -6x + 15;
5.90. ni A.
5.91. y — 2 — x; y = x.
5.92. Nerovnosti plynou např. z Věty o střední hodnotě (tzv. Lagrangeovy věty) aplikované na funkci y — ln(l + ŕ),ŕ e [0, x].
5.117. r — +00. 5.7/8. 1. 5.7/9.3.
Um inf an — 0.
335
KAPITOLA 5. ZŘÍZENÍ ZOO
5.120. [-1, 1].
5.121. x e [2- \, 2-
5.122. Ano. 5.723.
(a) Platí.
(b) Neplatí.
(c) Neplatí.
(d) Platí.
5.124. 1
102-2 ^ 1044! "
5.725. Chyba náleží do intervalu (0, 1 /200).
5.127. fix) — x, x e R; ano.
5.128. Nikoli.
5.729. (a) 1 - ^ + ^; (b) \ - ^.
5 no v°° 1 ^«+1
J.iJÍA Z^«=0 (2« + l)«! ^
5.131. a > 1.
5.732. 1-^/2, V2).
5.733. Prox e [-1, 1].
5.734. x > 2.
5.135. Konverguje absolutně. 5.73(5. In (3/2).
J-ř-J/- (1+jc)3-
5.738.(a)±lnj±f;(b)
"3-
2 111 w (1-jc)3-
5.739. 2/9.
5.740. xe~. 5.747. R.
5.742. (l,e].
5.743. (-00, §) U (§, +00); (-00, -i) U (-i, +00); y = x /
5.144. (a) ano; (b) ne; (c) ne; (d) ne; (e) ano; (f) ano; (g) ano; (h) ne.
5.145. (a) ne; (b) ne; (c) ano; (d) ano; (e) ne; (f) ne; (g) ne; (h) ano.
5.146. Lichá funkce je uvedena ve variantách (a), (e); sudá v (c), (d).
5.147. Je periodická s primitivní periodou (a) 2it; (b) it/3.
5.148. Funkce / a g jsou sudé - k vykreslení jejich grafů tak postačují grafy funkcí y — ex, x e [0, +00) a y — lnx, x € (0, +00).
5.149. Zadaná funkce je sudá, a proto k načrtnutí jejího grafu stačí znát graf funkce y — 2X, x e (—00, 0].
5.150. (sinhx)' — coshx; (coshx)' — sinhx; (tghx)' — —(cotghx)' —
1
coshzx' v °" ' sinh2*
5.757.
yi+í2'
5.753. x4 + 2X3 - x2 + x - 2.
5.754. x4 + 2X3 - 2X2 + x + 2.
5.755. x4 + 3X3 - 3X2 - x - 1.
5.156. Pro každé e > 0 stačí e-okolí bodu —2 přiřadit á-okolí bodu 0 předpisem
SH-Í, 8 — s,
přičemž bez újmy na obecnosti lze požadovat, aby e < 1. Pokud by totiž bylo e > 1, lze položit 8 = 1.
336
KAPITOLA 5. ZŘÍZENÍ ZOO
5.157. Existence limity a rovnost
,. (l+x)2-3 3 lim - = —
*->-i 2 2
např. opět plyne z volby S :— s pro s e (0, 1).
5.158. Neboť — (x — 2)4 < x pro x < 0, dostáváme 3 (x — 2)4/2 > —x pro x < 0.
5.159. Neboť
1 71 1 71
lim arctg— = —, lim arctg — — — — ,
x^0+ X 2 jt-»0- X 2
uvažovaná oboustranná limita neexistuje.
5.160. První z limit je rovna +oo, druhá neexistuje.
5.161. Limitu lze spočítat více způsoby. Nabízí se např.
tg x — sin x / tg x — sin x cotg x
lim---= lim 1
x^O sin3 x x^o\ sin3 x cotgx
1 — cos x 1 — cos X
= lim--— = lim
x^O cos x • sin2 x x^o cos x (l — cos2 x) 1 1
= lim
>0 cosx (1 + cosx) 2
5.162. Platí
2 sin3 x + 7 sin2 x + 2 sin x — 3 sin x + 1
lim -^-r-= lim -= —3.
x^ji/6 2 sin3 x + 3 sin2 x - 8 sin x + 3 *->jt/6 sin x - 1
5.163. Je
xm — 1 m lim - = —.
*-»l x" — 1 n
5.164. Po rozšíření výrazem
Vx2 + x + .
lze lehce dostat
5.165. Platí
5./<5<í. Je
Vx2 + X + X
■)4
lim ( Vx2 + x — x
x^+oo
lim
x^+oo
(x\/l+x2 -x2^ — i. \Í2 — Vl + cosx \Í2
lim
sin x
5.167. Rozšířením zlomku ze zadání je možné obdržet
sin (4x) lim , = 8.
*->0 Vx + 1 - 1
5.168. Platí
VI +tgx -VI -tgx lim -= 1.
x^o- sinx
5.169. Zřejmě je
2X + Vl +x2 - x9 - Ix5 + 44X2 7 lim - —-= —.
x^-oo y + Vóx6 + x2 - 18x5 - 592X4 18
337
KAPITOLA 5. ZŘÍZENÍ ZOO
5.170. Výrok není pravdivý. Uvažte kupř.
f (x) :— -, x e (—00. 0);
g (x) :— x, x e M.
x
5.171.
)
2n-l
5.172.
sin x — x
lim
—OO.
5.173. f'(x) < 0,x > e.
5.174. V bodě xi — e-2 nabývá zadaná funkce lokálního maxima a v bodě x2 — \ potom lokálního minima.
5.175. Neexistuje: pro a — \Í2/2 nastává v daném bodě pouze lokální extrém.
5.176. 2 = e± -ln I.
5.177. 4=.
Ve
J./7S. 4 = p (-1) = p (2), -16 = p (-3).
5.179. (a) u(0) = 6m/s; (b) t = 3 s, 5(3) = 16m; (c) u(4) = -2m/s, a(4) = -2m/s2.
5.180. f (xo) =5^.
5.181. Derivace neexistuje: jednostranné derivace, a to it/2 (jednostranná derivace zprava) a — tt/2 (jednostranná derivace zleva), se nerovnají.
5.182. Ano.
5.183. Nikoli.
5.184. f(x) := |x - 5| + |x - 9 |.
5.185. Např. f — g pro funkci / definovanou tak, že v racionálních bodech nabývá hodnoty 1, zatímco v iracionálních hodnoty — 1.
5.186. (a) x2 sinx; (b) cos (sinx) ■ cosx; (c) 3J^g cos (ln (x3 + 2x)); (d) ttz^ttt •
5.187. (a) l x"5 ; (b) cosecx =
5.188. cosx • cos (sinx) • cos (sin (sinx)).
5-189./'(x) ^-^2+l,x e (l-V2,l + V2).
5.194. ln2 (x + Vl + x2j, ieK.
5.795. /'(x) = -i (log, e)2, x > 0, x / 1.
5.196. [f(x)g(x)h(x)k(x)] ' = f'(x)g(x)h(x)k(x) + f(x)g'(x)h(x)k(x) + f(x)g(x)h'(x)k(x) + f(x)g(x)h(x)k'(x).
5.208. Vepsaný pravoúhelník má strany x, *j3/2(a — x), tedy obsah */3/2(a — x)x. Maximum pro x — a/2, tedy maximální obsah je (V3/8)a2. 5.209.4m x 4m x 2m.
338
KAPITOLA 5. ZŘÍZENÍ ZOO
5.210. 28 = 24 + 4. 5.2//. a = 1.
5.212. 241 r.
5.213. Jedná se o čtverec (s délkou strany c).
5.214. v = f Ä, r = ^fl.
5.215. Nej větší obsah VŠ o2/36 má rovnostranný trojúhelník. 5.2/(5. [2, -1/2], [-2, -1/2].
5.2/7. i; = 2r.
5.2/8. Nejbližšíbod [1, 1], vzdálenost 2^2.
5.219. Nejbližšíbod [-1, 1], vzdálenost3^2.
5.220. t — 1, 5s, vzdálenost VŠ jednotek.
5.221. V čase t — s si budou auta nejblíže a to -^p jednotky.
5.222. P — jrn; + jrr2 ==>■ j; = P~^f' ==^ ^ = 5K/* — tt?"2). Extrém r = dosazením do objemu V = ?f cm3.
5.22i. (a) 12ft/s; (b) -59, 5ft2/s; (c) -1 rad/s.
5.224. Při produkci zhruba 3 414 výrobků denně.
5.225. Trojnásobné použití l'Hospitalova pravidla dává
sin x — x 1
5.226. 2In.
5.227.
;^?_(|"X)tgX = L
5.228.
lim (Y3* —2x\x) =ln-.
5.229. 1/2.
5.230. Platí
lim l cos —
X^+QO \ x
5.231. Dvojnásobnou aplikací l'Hospitalova pravidla lze obdržet
lim (1 -cosx)sin* =e° = 1.
x^O
5.232. V obou případech je výsledek e".
5.233. Limitu lze snadno určit např. pomocí 1'Hospitalova pravidla.
5.248. 2a2; 4a (2 + Ji).
5.249. tt/2.
5.250. x = l+k7T,x = ^+k7T,keZ.
5.251.5.
5.252. +00.
5.253. 3/2.
5.254. (a) 3; (b) 9/4.
5.255. 1/2.
339
KAPITOLA 5. ZŘÍZENÍ ZOO
5.256. (a) 3/4; (b) 1/4.
5.257. -1/2.
5.258. 11/18.
5.259. s/2; 3s/2 (s = ln 2).
5.260. Konverguje.
5.261. Postačuje uvážit nutnou podmínku konvergence lim,,-^ a„ — 0.
5.262. a > 0; 8 e {-2, -1, 0, 1, 2}; y e (-oo, -1) U (1, +oo).
5.263. Konverguje absolutně.
5.264. Limita je rovna 1/2.
5.265. A e [0, 1).
5.266. Součet uvedené řady je konečný - řada konverguje.
5.267. Např. a„ = n/3, bn = n/2, n e N.
5.268. První řada konverguje absolutně; druhá neabsolutně.
5.269. Ano.
5.270. p e R.
340
KAPITOLA 6
Diferenciální a integrálni počet
V minulé kapitole jsme si postupně hráli buď s mimořádně velikými třídami funkcí — všechny spojité, všechny diferencovatelné apod. — nebo jen s konkrétními funkcemi — např. exponenciální, goniometrické, polynomy atd. Měli jsme ale přitom minimum nástrojů a vše jsme počítali tak říkajíc na koleně. Z kvalitativního pohledu jsme jen naznačili, jak využívat znalost lineárního přiblížení funkce její derivací k diskusi lokálního chování takové funkce kolem daného bodu. Teď dáme dohromady několik výsledků, které umožní snáze pracovat s funkcemi při modelování reálných problémů.
Pomocí derivování jsme se naučili zaznamenávat velkosti okamžitých změn. V této kapitole se vyrovnáme i s úlohou, jak sčítat nekonečně mnoho takových „nekonečně malých" změn, tj. jak „integrovat". Nejdříve si ale uděláme více jasno o derivacích.
V poslední části kapitoly se vrátíme k řadám funkcí a doplníme přitom i několik chybějících krůčků v naší dosavadní argumentaci.
1. Derivování
6.1. Derivace vyšších řádů. Jestliže má první derivace f'(x) re-
álné nebo komplexní funkce / v bodě xo derivaci (/')'(xo)> říkáme že existuje druhá derivace funkce /, resp. derivace druhého řádu.
Píšeme pak f"(x0) = (/')'(*()) nebo také /(2)(x0).
Funkce / je dvakrát diferencovatelná na nějakém intervalu, jestliže má druhou derivaci v každém jeho bodě. Derivace vyšších řádů definujeme induktivně:
_| &-krát diferencovatelné funkce |__^
Reálná nebo komplexní funkce / je v bodě xq (k + \)-krát diferencovatelná pro nějaké přirozené číslo k, jestliže je &-krát diferencovatelná na nějakém okolí bodu xo a její k-tá derivace má v bodě xo derivaci. Pro &-tou derivaci funkce f(x) píšeme f^k\x). Pro k = 0 rozumíme 0-krát diferencovatelnými funkcemi funkce spojité.
Jestliže existují derivace všech řádů na intervalu, říkáme, že je tam funkce / hladká.
Pro funkce se spojitou &-tou derivací používáme označení třída funkcí Ck (A) na intervalu A, kde k může nabývat hodnot 0, 1,..., oo. Často píšeme pouze Ck, je-li definiční obor znám z
Pojem derivace vyššího řádu mažeme rychle ilustrovat na polynomech. Protože výsledkem derivování polynomu je opět polynom, ale derivací se vždy o jedničku snižuje jeho stupeň, dostaneme po konečném počtu derivací nulový polynom. Přesněji
zvěřinec teď máme, ale co s ním? - naučíme se s ním zacházet...
A. Derivace vyšších řádů
Nejprve zavedme konvenci, jak značit derivace vyšších řádů: druhou derivaci funkce / jedné proměnné budeme značit /" nebo f(2), derivace od třetího řádu výše pak pouze f(3\ f(4\...f(n). Na připomenutí ale zahájíme trochu rafinovaným příkladem „pouze" na první derivace.
6.1. Určete následující derivace:
i) (x2 • sinx)",
ii) (**)",
iv) (x")(n),
v) (sinx)(n).
Řešení, (a) (x2 -sin x)" = (2x sinx +x2 cosx)' = 2 sinx +4x cos x — x2 sin x.
(b) {xx)" = [(1 +lnx)xx]' = xx~1 +xx(l +lnx)2.
(c\ C^V3) =_i___s_
w Vln*/ x2(lnx)2 x2(lnx)4'
(d) (x")(n) = [(x")']("_1) = (nxn-1)(n-1) = ••• = «!.
341
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
řečeno, právě po k + 1 derivacích, kde k je stupeň polynomu, dostaneme nulu. Samozřejmě pak existují derivace všech řádů, tj.
/ e C°°(R).
Při konstrukci splajnů, viz 5.9, jsme pohlídali, aby výsledné funkce byly třídy C2(R). Jejich třetí derivace budou po částech konstantní funkce. Proto nebudou splajny patřit do C3 (M), přestože jejich všechny derivace vyšších řádů budou nulové ve všech vnitřních bodech jednotlivých intervalů v interpolaci. Promyslete si podrobně tento příklad!
Následující tvrzení je jednoduchým kombinatorickým důsledkem Leibnizova pravidla pro derivaci součinu funkcí:
Lemma. Jsou-li f a g dvě funkce mající derivaci řádu k v bodě xq, pak má derivaci řádu k i jejich součin a platí:
k
(f-g)(k)(xo)
E
rHxo)g(k-iHx0).
Důkaz. Pro k = 0 je tvrzení triviální, pro k = 1 je to Leib-nizovo pravidlo pro derivaci součinu. Jestliže pravidlo platí pro nějaké k, derivací pravé strany a použitím Leibnizova pravidla dostaneme obdobný výraz
/(,'+1)(W*-ť)(*o) + /(i)(W*-i+1)(*o)
V této nové sumě je součet řádů derivací u součinů v jednotlivých sčítancích k + 1 a koeficienty u f^ (xo)g(-k+1~J*> (xo) jsou součty binomických koeficientů (.^J + (*) = fj"1). □
6.2. Násobné kořeny a inverze polynomů. Derivace polynomů jsme spočítali již v odstavci 5.6 a je vidět, že jde o hladké funkce. Derivace je v tomto případě vlastně prosté algebraické zobrazení a podívejme se, jak se nám derivace bude hodit pro diskusi násobných kořenů polynomů.
Nejprve zformulujme základní větu algebry, jejíž důkaz odložíme do ??.
Věta. Každý nenulový komplexní polynom f alespoň jedna má kořen.
stupne
Nutně tedy polynom stupně k > 0 má právě k komplexních kořenů včetně násobností a můžeme jej vždy psát jednoznačně ve tvaru
f(x) = (x - ai)Cl -{x-aq)ci,
kde a\,... ,aq jsou všechny kořeny polynomu / a
í 1.
Řešení. Úlohu vyřešíme pomocí tzv. logaritmické derivace. Nechť je / libovolná kladná funkce. Víme, že je
[In/(*)]'
fix)
tj- f'(x) = f(x).[lnf(x)]'.
pokud derivace f'(x) existuje. Užitečnost tohoto vzorce je dána tím, že pro jisté funkce je jednodušší derivovat jejich logaritmus než je samé. Takový je právě výraz v zadání. Dostáváme totiž
yx^T ■ (x + 2)' ex(x + 132)2
V\7-~I • (x + 2)3 ex(x + 132)2 '
v\7-~T • (x + 2)3 r ex(x + 132)2
yx^T ■ (x + 2ý eř(x + U2)2
ln
yx^i ■ (x + 2ý
e,x(x + U2)2
3 ln (x + 2) + i ln (x - 1) - x lne - 21n (x + 132)
x + 2 40-1)
x + 132
□
6.3. Nechť n e N je libovolné. Najděte «-tou derivaci funkce
y = lnj±f, jce(-l.l).
Řešení. Vzhledem k vyjádření
lni±£ =ln(l +x) -ln(l - x) , x e (-1, 1) zavedeme pomocnou funkci
f(x):=\n(ax + l), x e (-1, 1), a = ±1. Pro x e (—1, 1) lze snadno (postupně) vypočíst
f(i)(x)
(ax+l)2 '
. 2a3 (ax + l)3 '
J W — (ax + lf
Na základě těchto výsledků můžeme usoudit, že
(6.1) fin\x)
(-\)"-l(n - l)\an
, x e (-1, 1), n e N.
(ax + 1)"
Správnost tohoto vzorce ověříme matematickou indukcí. Protože pro n = 1, 2, 3, 4 platí, zbývá ukázat, že z jeho platnosti pro k e N plyne jeho platnost pro k + 1. Neboť přímý výpočet dává
f(k+l)(x\ — ( (-!)*-'(*-!)! a* V _ (-!)*-'(*-!)! a* (-k) a _ (-l)kk\ak+l J y ' \ (ax+l)k ) (ax + l)k+x (ax + l)k+x '
vzorec (||6.11|) platí pro všechna n € N. Podle něj je
342
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
6.3. Význam druhé derivace. Již jsme viděli, že první derivace funkce je jejím lineárním přiblížením v okolí daného bodu a že ze znaménka nenulové derivace vyplývá, že funkce je v bodě xq rostoucí nebo klesající. Body, ve kterých je první derivace nulová se nazývají kritické body nebo také stacionární body dané funkce.
A
Je-li xq stacionární bod funkce /, může být chování funkce / v okolí bodu xo jakékoliv. Vidíme to již z chování funkce fix) = x" v okolí nuly pro libovolné n. Pro lichá n > 0 bude f(x) rostoucí, pro sudá n naopak bude nalevo klesající a napravo rostoucí, dosáhne tedy v bodě xo své minimální hodnoty mezi body z (dostatečně malého) okolí bodu xq = 0.
Tentýž pohled můžeme aplikovat na funkci /'. Jestliže totiž je druhá derivace nenulová, určuje její znaménko chování derivace první. Proto v kritickém bodě xo bude derivace fix) rostoucí při kladné druhé derivaci a klesající při záporné. Jestliže je ale rostoucí, znamenená to, že nutně bude záporná nalevo od kritického bodu a kladná napravo od něj. Funkce / v takovém případě je klesající nalevo od kritického bodu a rostoucí napravo od něj. To znamená, že má funkce / v bodě xo minimum ze všech hodnot z nějakého malého okolí bodu xo.
Naopak, je-li druhá derivace záporná v xo, je první derivace klesající, tedy záporná vlevo od xq a kladná vpravo. Funkce / bude tedy mít v bodě xo maximální hodnotu ze všech hodnot na nějakém okolí.
Funkce diferencovatelná na (a,b) a spojitá na [a, b] má jistě na tomto intervalu absolutní maximum a minimum. Může ho dosáhnout pouze buď na hranici nebo v bodě s nulovou derivací, tj. v kritickém bodě. Pro diskusi extrémů nám tedy mohou stačit kritické body a druhé derivace pomůžou určit typy extrémů, pokud jsou nenulové. Pro přesnější diskusi ale potřebujeme lepší než lineární aproximace zkoumaných funkcí. Proto se nejprve budeme věnovat úvahám v tomto směru a teprve poté se vrátíme k diskusi průběhu funkcí.
6.4. Taylorův rozvoj. Jako překvapivě jednoduché využití Rolleovy věty teď odvodíme mimořádně důležitý výsledek. Říkává se mu Taylorův rozvoj se zbytkem. Intuitivně se k I němu můžeme dostat obrácením našich úvah kolem moc-ninných řad. Máme-li totiž mocninnou řadu se středem v bodě a,
S(x) = ^^fl„(x — a)",
n=0
a derivujeme-li ji opakovaně, dostáváme mocninné řady (víme, že je možné takový výraz derivovat člen po členu, i když jsme to ještě
ln^d+x) = lnW(l-x) = -^, ,€(-1,1).
Odtud již dostáváme výsledek
(ln^)(n) = («-l)!(ä^-(^) pro x € (-1, 1) a n € N.
□
6.4. Určete druhou derivaci funkce y = tg x na celém jejím definičním oboru, tj. pro cosx ^ 0. O
6.5. Stanovte pátou a šestou derivaci polynomu
p (x) = (3x2 + 2x + l) • (2x - 6) • (2x2 - 5x + 9) , x € R.
O
6.6. Bez počítání uvedte 12. derivaci funkce
y = e2x + cosx + x10 — 5x7 + 6x3 — llx + 3, x €
O
6.7. Napište 26. derivaci funkce
fix) = sinx + x23 - x18 + 15xn - 13x8 - 5x4 - llx3 + 16 + e2* pro x € R. O Ukažme si ještě některé zajímavé příklady na užití diferenciálního počtu. Nejpve však zmiňme Jensenovu nerovnost, která hovoří o konvexních, resp. konkávních funkcích a kterou dále využijeme.
6.8. Jensenova nerovnost. Pro ostře konvexní funkci / na intervalu / a pro libovolné body x\,... ,xn € la reálná čísla c\,... ,cn > 0 taková, že c\ + ■ ■ ■ + cn = 1, platí
□
\i = l / i = \
přičemž rovnost nastane, právě když je x\ = ■ ■ ■ = x„. Řešení. Důkaz lze nalézt např. v ||??|| Poznámka.
Jensenovu nerovnost lze z formulovat i více intuitivně: těžiště hmotných bodů umístěných na grafu ostře konvexní funkce leží nad tímto grafem.
6.9. Dokažte, že mezi všemi (konvexními) n -úhelníky vepsanými do kružnice má největší obsah právě pravidelný rc-úhemík (pro libovolné n > 3).
Řešení. Očividně stačí uvažovat n -úhelníky, uvnitř kterých leží střed kružnice. Každý takový rc-úhemík vepsaný do dané kružnice o poloměru r rozdělíme podle obrázku na n trojúhelníků s obsahy Si, i € {1, ... ,n}. Vzhledem k tomu, že
sin
cos ■
i € {1, ..., n},
343
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
nedokázali)
oo
S(k) (x) = n(n - 1) ... (n - k + l)an(x - a)"~
platí
Si = X{ h{ = r2 sin ^ cos ^ = j r2 sin cpi, i e {1
n—k
V bodě x = a je tedy (a) = Můžeme tedy naopak číst poslední tvrzení jako rovnici pro ak a původní řadu přepsat jako
Odsud plyne, že obsah celého n -úhelníku je
S=J2Si = \r2 E sin
S(x) = V — S™ (a)(x-a)n. t—1 k\
n=0
Jestliže místo mocninné řady máme nějakou dostatečně hladkou funkci f(x), je tedy na místě se ptát, zda ji můžeme vyjádřit jako mocninnou řadu a jak rychle budou konvergovat částečné součty (tj. přiblížení funkce / polynomy). Naše úvaha právě naznačila, že můžeme očekávat v okolí bodu a dobrou aproximaxi polynomy.
| Taylorovy polynomy funkce / Jm_——
Pro /c-krát diferencovatelnou funkci / definujeme její Tay-lorův polynom k-tého stupně vztahem
Tk,af(x) = f (a) + f'(a)(x - a) + ^f"(a)(x - a)2+
\f0)(a)(x -a)3 + --- + j-f(k)(a)(x - a)k. 6 k\
Chceme tedy maximalizovat součet 2~2"=i sm í°i> přičemž pro hodnoty tj. sin [J2 \ i = l / i = l \i = l /
n
E \ sm(Pi-
i = l
Navíc víme, že rovnost nastává právě pro
k-l
(x-^)k-l(f{k)^)-r),
kde S udává obsah uvažovaného obrazce a o jeho obvod (tj. délku křivky). Izoperimetrický podíl tedy udává podíl obsahu obrazce a obsahu kruhu, který má stejný obvod jako daný obrazec. Označení IQ je tak nejen anglickou zkratkou izoperimetrického podílu, ale lze jej označit i za „inteligenci útvaru" s jakou využívá svůj obvod pro vytvoření co největší plochy. Izoperimetrická věta pak říká, že pro každou uzavřenou křivku je její IQ < 1, přičemž rovnost nastává jedině pro kružnici, neboli že („kružnice je nej chytřejší").
Určete IQ pro pravidelný mnohoúhelník a kružnici a najděte kruhovou výseč, pro niž je IQ její hranice největší.
Řešení. Nejdříve si uvědomme, že hodnota IQ se nemění při změně měřítka na osách (na obou shodné). Když se totiž rozměry obrazce a-krát zvětší (pro libovolné a > 0), obvod se také zvětší a-krát a obsah a2-krát (jde o plošnou míru). Takže IQ nezávisí na velikosti obrazce,
344
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
protože výrazy v sumě se postupně vzájemně ruší. Nyní si stačí všimnout, že F (a) — Fix) — f(x) (připomeňme, že x je libovolně zvolená ale pevná hodnota v intervalu (a, b)). Proto podle Rolleovy věty existuje číslo c, a < c < x, takové, že F'(c) — 0. To ale je právě požadovaný vztah. □
6.5. Odhady pro rozvoje se zbytkem. Obzvlášť jednoduchý je Taylorův rozvoj libovolného polynomu
f(x) — a„x" + fl„_ix"_1 + • • • + a\x + a®, a„ ^ 0.
Protože je (n + l)-ní derivace / identicky nulová, má Taylorův polynom stupně n nulový zbytek a tedy je pro každé mel
/(*) = f(x0) + f'(x0)(x -x0) + ...+ -f^ixoXx - x0)"
n\
a všechny derivace snadno vyčíslíme (např. poslední výraz je vždy tvaru an (x — xo)").
Tento výsledek je velmi speciálním odhadem chyby v Taylo-rově rozvoji se zbytkem. Víme totiž předem, že zbytek je odhadnutelný pomocí velikosti derivace a ta je u polynomu od určitého řádu identicky nulová.
I obecněji vede odhad velikost k-té derivace na nějakém intervalu k odhadu chyby na temže intervalu. Speciálním případem je také věta o střední hodnotě coby aproximace Taylorovým rozvojem řádu nula, viz (5.9).
Dobrým příkladem pro rozvoj libovolného stupně jsou goniometrické funkce sin a cos. Iterováním derivace funkce sin x dostaneme vždy buď sinus nebo cosinus s nějakým znaménkem, ale v absolutní hodnotě budou hodnoty vždy nejvýše jedna. Dostáváme tedy přímý odhad rychlosti konvergence mocninné řady
\x\k+1
I sinx — (7* n sin)(x)| < -.
Ukazuje, že pro x výrazně menší než k bude chyba malá, pro x srovnatelné s k nebo větší ale bude obrovská. Srovnej s obrázkem aproximace funkce cos x Taylorovým polynomem stupně 68 v odstavci 5.51.
Jak jsme zmínili v úvodu diskuse Taylorova rozvoj e funkcí, pokud začneme s mocninnou řadou fix) se středem v bodě a, pak její částečné součty splývají s Taylorovými polynomy Tk,af(x). Následující tvrzení je jednou z jednoduchých formulací opačné implikace, tj. kdy je daná funkce fix) ve skutečnosti mocninnou řadou.
Důsledek (Taylorova věta). Předpokládejme, že funkce fix) je na intervalu (a — b, a + b) hladká a že všechny její derivace jsou zde omezeny stejnoměrně konstantou M > 0, tj.
\f(k\x)\ 0, ) <0,
0+, tj. konečný součet limit výrazů x~-> e~l/x — x~-> / e1^ . To jsou samé výrazy typu oo/oo, na které můžeme opakovaně použít ĽHospitalovo pravidlo. Zjevně po několika derivacích čitatele i jmenovatele (a obdobné úpravě jako v případu výše) bude ve jmenovateli stále stejný výraz, zatímco v čitateli již bude mocnina nezáporná. Celý výraz tedy nutně má v nule limitu nulovou, stejně jako jsme spočítali v případě první derivace výše. Totéž tedy bude platit pro konečný součet takových výrazů a zjistili jsme, že bude v nule existovat i každá derivace f^ (x) a její hodnota bude nula.
Ukázali jsme, že naše funkce f(x) je hladká na celém M, je samozřejmě nenulovou funkci všude mimo x — 0, všechny její derivace v tomto bodě jsou ale nulové. Samozřejmě to tedy není analytická funkce v bodě xq — 0.
6.11. Je dán provázek délky l. Máte jej rozstříhat na n částí tak, aby o-'&IŠf^ ze vzniklých n menších provázků bylo možné vytvořit hranice předem daných geometrických obrazců (kupř. čtverce, trojúhelníku, kruhu, půlkruhu) s nejmenším součtem ploch.
Řešení. K vyřešení příkladu použijeme izoperimetrický podíl křivek a Jensenovu nerovnost (uvedené v předchozích příkladech). Pro předem určené geometrické obrazce označujme hodnoty jejich izoperimetrických podílů jako
17-=-^-. I €{l,...,n],
přičemž 5; je obsah a o; obvod /-tého obrazce. Ještě budeme používat označení
n
A := EV
i=l
Připomeňme, že izoperimetrický podíl je dán pouze tvarem obrazce a nezávisí na jeho velikosti. Zvláště hodnota A je konstantní (je určena tvarem zadaných obrazců).
Naším úkolem je minimalizovat součet ELi & při dodržení podmínky $ľ"=i °i = I- Protože je však
Si = ié-, ie{l,...,n}, jde nám o minimalizaci výrazu
" 2
S — ± T
ů — An L kr
i=l
Použijeme-li Jensenovu nerovnost pro ostře konvexní funkci y = x2 (na celé reálné ose), obdržíme
n \ 2 n
E ci xi) < E ci A
í=l / i = \
pro xi s R a c i > 0 s vlastností c\ + ■ ■ ■ + cn = 1. Dále víme, že v této nerovnosti nastane rovnost právě tehdy, když je x\ = ■ ■ ■ = x„. Volbou
ci = x> xi = fr i e {l,...,n]
pak dostaneme
(TI \ ^ TI "
6.7. Příklady neanalytických hladkých funkcí. Snadno Jednoduchými úpravami přejdeme k nerovnici
^, „ můžeme naši funkci f(x) z předchozího odstavce modifikovat takto:
\Z = 1 / !=1
-l/x2
je-U x < 0 je-li x > 0
a poté (uvažte, že Eľ=i °í = 0
Opět jde o hladkou funkci na celém M. Další úpravou můžeme získat funkci nenulovou ve všech vnitřních bodech intervalu [—a, a],
i "2
t < y í
A — t— Xi '
i = l
Jde o speciální případ tzv. Whitneyho věty, viz. doplnit citaci a info.
přičemž opět rovnost nastává právě pro (6.3) X! = • •
Ol o„ x„, tj. — = • • • = —.
kl kn
346
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
a > 0 a nulovou jinde:
h (x) =
je-li |x| > a je-li |x| < a.
Tato funkce je opět hladká na celém R. Poslední dvě funkce jsou na obrázcích, vpravo je použit parametr a — X.
Nakonec ještě ukážeme, jak lze dostat hladké analogie Heavi-sideových funkcí. Pro dvě pevně zvolená reálná čísla a < b definujeme funkci f(x) s použitím výše definované funkce g takto:
/(*) =
g(x - a)
g(x - a)+g(b-x)
Zjevně je pro každé x e M jmenovatel zlomku kladný (pro každý z intervalů určených čísly a a b je totiž alespoň jeden ze sčítanců jmenovatele nenulový a tedy je celý jmenovatel kladný). Dostáváme z našeho definičního vztahu proto hladkou funkci f(x) na celém R. Při x < a je přitom jmenovatel zlomku přímo dle definice funkce g nulový, při x > b je čitatel i jmenovatel stejný. Na dalších dvou obrázcích jsou právě funkce f(x) a to s parametry a — 1 — a, b — 1 + a, kde nalevo je a — 0.8 a napravo a — 0.4.
Snadno nyní také vytvoříme hladkou obdobu charakteristické funkce intervalu [c, d\.
Označme si jako f€ (x) výše uvedenou funkci f(x) s parametry a — —e, b — +€. Nyní pro interval (c, ď), s délkou d — c>2e definujeme funkci h€(x) — f€(x — c) ■ f€(d — x). Tato funkce je identicky nulová na intervalech (—oo,c — e) a ( 0, tím rychleji naše funkce přeskočí z nuly na jedničku kolem začátku intervalu nebo zpět na konci intervalu.
Vidíme tedy, že hladké funkce jsou velice „plastické" — z lokálního chování kolem jednoho bodu nemůžeme říci vůbec nic o globálním chování takové funkce. Naopak, analytické funkce jsou zcela určené dokonce jen derivacemi v jediném bodě. Zejména
Odsud vyplývá, že S je nejmenší, právě když platí (||6.3||). Tato nejmenší hodnota S je P /(4itA). Zbývá stanovit délky nastříhaných částí Oi. Pokud j e (||6.3||) splněno, musí zjevně být o; = kk{ pro každé i €{!,...,«} a jistou konstantu k > 0. Z
E Oi■ = l a současně °i = ^ E ^ ihned plyne, že k = l/A, tj.
kA
l,
i € {1, ... ,n]
Podívejme se na konkrétní situaci, kdy máme provázek o délce 1 m rozříznout na dva menší a z nich potom vytvořit čtverec a kruh tak, aby součet jejich obsahů byl co nejmenší. Pro čtverec a kruh je po řadě (viz příklad nazvaný Izoperimetrický podíl)
A,
1,
tj-
A = ki + k2
4+ji
Délky příslušných částí tak jsou (v metrech)
-J— . 1 — -JL- — O 44
á±ZL 1 - 4+jt - u' ™-
Ol = 4tf • 1 = 44^ = u, 30, 02
Obsah čtverce o obvodu 0, 56 m (s délkou strany a = 0, 14 m) je 0, 019 6 m2 a obsah kruhu s obvodem 0, 44 m (a poloměrem r = 0, 07 m) pak činí přibližně 0, 015 4 m2. Můžeme ověřit, že (v m2
i
4jtA
4(4+jt)
0, 035 = 0,019 6 + 0,015 4.
□
Taylorovy rozvoje. Derivace vyšších řádů nutně potřebujeme k tomu, abychom určili Taylorův rozvoj dané funkce.
6.12. Určete Taylorovy rozvoje Tk (k-tého řádu v bodě x) z následujících funkcí:
i) T03 z funkce sin x,
ii) T? z funkce —.
Řešení, (i) Spočítáme hodnoty první až třetí derivace funkce / = sin v bodě 0: /'(0) = cos(0) = 1, /(2)(0) = - sin(0) = 0, /(3)(0) = — cos(0) = — 1, dále /(0) = 0 Taylorův rozvoj 3-tího řádu funkce sin(x) v bodě 0 je tedy
1 ,
7/n (sin(x))
X--X
(ii) Opět /(l) = e, /'(l) :
/(2)(D =
/(3)(D =
e x
ex x ex x
x = l
ex2 2ex 2- + —
x xJ
x = l
nX2
+
6ex 6ex
-2e
x = l
347
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
jsou tedy bezezbytku určené svým chováním na libovolně malém okolí jediného bodu ze svého definičního oboru. Jsou tedy v tomto smyslu velice „rigidní".
6.8. Lokální chování funkcí. Viděli j sme, že znaménko první derivace určuje u každé diferencovatelné funkce, zda roste nebo klesá na nějakém okolí daného bodu. Pokud je ale derivace nulová, sama o '■"'<" sobě mnoho o chování funcke neříká. Už jsme se ale setkali s významem druhé derivace při popisu kritických bodů. Teď zobecníme diskusi kritických bodů pro všechny řády. Začneme diskusí lokálních extrémů funkcí, tj. hodnot, které jsou ostře větší nebo ostře menší než všechny ostatní hodnoty z nějakého okolí daného bodu.
Budeme v dalším uvažovat funkce s dostatečným počtem spojitých derivací, aniž bychom tento předpoklad přímo uváděli.
Řekneme, že bod a v definičním oboru funkce / je kritický bod řádu k, jestliže platí
/'(a) = ■■■ = /<*> (a) = 0.
f(k+1)(a)r0.
Předpokládejme, že f^k+l\a) > 0. Pak je tato spojitá derivace kladná i na jistém okolí O (a) bodu a. Taylorův rozvoj se zbytkem nám v takovém případě dává pro všechna x z O (a)
1
f(x) = fia) +
f(k+1)(c)(x-ay
k+l
(k + \)V
Je proto změna hodnot fix) v okolí bodu a dána chováním funkce (x — a)k+l. Je-li přitom k + l sudé číslo, jsou nutně hodnoty fix) v takovém okolí větší než hodnota f (a) a zjevně je proto bod a bodem lokálního minima. Pokud je ale k sudé číslo, pak jsou hodnoty vlevo menší a vpravo větší než než f (a), extrém tedy ani lokálně nenastává. Zato si můžeme všimnout, že graf funkce fix) protíná svoji tečnu y — fia) bodem [a, fia)].
Naopak, je-li f(-k+1\a) < 0, pak ze stejného důvodu jde o lokální maximum při lichém k a extrém opět nenastává pro k sudé.
6.9. Konvexní a konkávni funkce. Říkáme, že diferencovatelná funkce / jev bodě a konkávni, jestliže se její graf nachází v jistém okolí celý pod tečnou v bodě [a, fia)], tj. požadujeme
/(*)(«) +/'(«)(*-a)-Říkáme, že funkce / je konvexní v bodě a, jeťliže naopak je její graf nad tečnou v bodě a, tj.
f(x)>f(a) + f'(a)(x-a).
Funkce je konvexní nebo konkávni na intervalu, jestliže má tuto vlastnost v každém jeho bodě.
Předpokládejme navíc, že má funkce / spojité druhé derivace v okolí bodu a. Z Taylorova rozvoje druhého řádu se zbytkem dostáváme
fix) = fia) + f'ia)ix -a) + ^/"(c)(x - a)2.
Proto je zjevně funkce konvexní, kdykoliv je f"ia) > 0, a je konkávni, kdykoliv f"ia) < 0.
Pokud je druhá derivace nulová, můžeme použít derivace vyšších řádů. Stejný závěr ovšem umíme učinit pouze, pokud první další nenulová derivace po první derivaci bude sudého řádu. Pokud bude naopak první nenulová řádu lichého, bude zjevně body grafu
Dostáváme tedy Taylorův rozvoj třetího řádu funkce y v bodě 1:
-3 3x2 . 5
TM-) = e +-ix - lY
;(x - iy
x
e(--+
V 3 2
2x + -). o
□
6.13. Určete Taylorův polynom T06 funkce sin a pomocí věty (6.4) odhadněte chybu polynomu v bodě it/4.
Řešení. Podobně jako v předchozím příkladu určíme
ro6(sin(x)) = x
1
x3 +
1
12Ô"
Dle věty 6.4 pak odhadneme velikost zbytku (chyby) R. Podle věty existuje c € (0, j) takové, že
Riit/4)
COS(c)7T7
7!47
< — = 0, 0002. 7!
□
6.14. Najděte Taylorův polynom 3. stupně funkce
y = arctg x, x e M v bodě x0 = 1. O
6.15. Určete Taylorův rozvoj 3. řádu v bodě xo = 0 funkce
(a) y =
v 7 J cos x^'
(b) y = e-i2";
(c) y = sin (sin x) ;
(d) y =tgx;
(e) y = ex sin x
definované v jistém okolí bodu x0. O
6.16. Stanovte Taylorův rozvoj 4. řádu funkce y = lnx2, x e (0, 2) v bodě x0 = 1. O
6.17. Nalezněte odhad chyby přibližného vyjádření
ln(l +x)
pro x e (—1,0).
O
6.18. Napište Taylorův polynom 4. stupně funkce y = sinx, x e R se středem v počátku. Pomocí tohoto polynomu přibližně vyčíslete sin 1° a stanovte limitu
lim x smx4~x
x^0+ x
O
6.19. Uvedte Taylorův polynom se středem v počátku stupně alespoň 8 funkce y = e2x, x e R. Q
6.20. Polynom x3 — 2x + 5 vyjádřete jako polynom v proměnné u = x - 1. O
348
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
funkce na různých stranách nějakého malého okolí zkoumaného bodu na opačných stranách tečny v tomto bodě.
6.10. Inflexní body. Bod a nazýváme inflexní bod diferencovatelné funkce /, jestliže graf funkce / přechází z jedné strany tečny na druhou.
Předpokládejme, že / má spojité třetí derivace a napišme si Taylorův rozvoj třetího řádu se zbytkem:
1
1
/ (x) = f(a)+f'(a) (x -a)+ ^f" (a) (x -a)2 + - f" (c) (x-af.
2 6
Je-li a nulový bod druhé derivace takový, že f "(a) ^ 0, pak je třetí derivace nenulová i na nějakém okolí a jde proto zjevně o inflexní bod. Znaménko třetí derivace nám v takovém případě určuje, zda graf funkce přechází tečnu zdola nahoru nebo naopak.
Pokud je bod a navíc izolovaným nulovým bodem druhé derivace a zároveň inflexním bodem, pak zjevně je na nějakém malém okolí bodu a funkce na jedné straně konkávni a na druhé konvexní. Inflexní body tedy můžeme také vnímat jako body přechodu mezi konkávním a konvexním chováním grafu funkce.
6.11. Asymptoty grafu funkce. Uvedeme ještě jednu dobrou š.. pomůckou pro náčrtek grafu funkce. Zkusíme zjistit '■^Ty^' " tzv. asymptoty, tj. přímky, ke kterým se blíží hodnoty w: funkce /. Asymptotou v nevlastním bodě oo je ta-^ .— • ková přímka y = ax + b, pro kterou je
lim (/(*)
■b) = 0.
Říkáme jí také asymptota se směrnicí. Pokud taková asymptota existuje, platí
lim (f(x) — ax) = b
a tedy existuje i limita
lim
f(x)
Pokud ovšem existují poslední dvě limity, existuje i limita z definice asymptoty, jde proto i o podmínky dostatečné. Obdobně se definuje a počítá asymptota i v nevlastním bodě — oo.
Tímto způsobem dohledáme všechny potenciální přímky splňující vlastnosti asymptot se směrnicí. Zbývají nám případné přímky kolmé na osu x: Asymptoty v bodech a € M jsou přímky x = a takové, že funkce / má v bodě a alespoň jednu jednostrannou limitu nekonečnou. Hovoříme tako o asymptotách bez směrnice.
Např. racionální funkce lomené mají v nulových bodech jmenovatele, které nejsou nulovými body čitatele, asymptotu.
Spočtěme aspoň jeden jednoduchý příklad: Funkce fix) = x + j má za asymptoty přímky y = x a x = 0. Skutečně, jednostranné limity zprava a zleva v nule jsou zjevně ±oo, zatímco limita f(x)/x = 1 + 1/x2 je samozřejmě v nevlastních bodech právě ±1, zatímco limita fix) — x = l/x je v nevlastních bodech nulová.
Derivací obdržíme
2x
/'(x) = l-x-2, fix)
Funkce /' (x) má dva nulové body ± 1. V bodě x = 1 má funkce lokální minimum, v bodě x = — 1 lokální maximum. Druhá derivace nemá nulové body v celém definičním oboru (—oo, 0) U (0, oo), proto nemá naše funkce žádný inflexní bod.
6.21. Rozviňte funkci ln(l + x) do mocninné řady v bodech 0 a 1 a určete všechna x e R, pro která tyto řady konvergují.
Řešení. Nejprve určeme rozvoj v bodě 0. Rozvinout funkci do mocninné řady v daném bodě je to stejné, jako určit její Taylorův rovoj v daném bodě. Snadno nahlédneme, že
,„+i (n-D!
[ln(x + l)](n) = (-l)
ix + 1)"'
takže vyčíslením derivací v nule máme ln(x + 1) = ln 1 + anx",
n = l
kde
(_l)»+i(n_ j)! (_i)
n + l
Můžeme tedy psát
ln(x + 1)
nl
1 2 1 3 1 4
X--X + -x--X +
2 3 4
l—l n
« = 1
Pro poloměr konvergence potom použijeme limitu podílu následujících koeficientů členů mocninné řady
1
1
lim„_
an+l
lim *+1 LÍLLLn -+ oo i
1.
Řada tedy konverguje pro libovolné x e (—1, 1). Pro x = — 1 dostáváme harmonickou řadu (se znaménkem minus), pro x = 1 dostáváme aternující harmonickou řadu, která podle Leibnizova kriteria konverguje. Daná řada proto konverguje právě pro x e (— 1, 1].
Pro rozvoj v bodě 1 dostáváme podobně vyčíslením výše uvedených derivací z ||6.211|
1
1
1
ln(x + 1) = ln(2) + -ix - 1) - -(x - l)2 + 3 _ ^
00 (-])n+1 = ]n(2) + Yt _ (x - 1)",
(x - iy
n = \
n ■ 2"
pro poloměr konvergence této řady pak dostáváme 1 1
lim„_
"n+\
1.
lim„_
2"+'(n+l)
2" n
První řada konverguje pro — 1 < x < 1, druhá pro — 1 < x < 3.
□
6.22. Rozviňte funkci
(a)j=ln|±f, í e (-1,1);
(b) y = ď + x2 e
2 a-2x
x e
349
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
n—i—i—i—i—i—i—i—i—i—i—rô-
-i—i—i—i—i—i—i—i—i—i—i—n
2 4
6.12. Diferenciál funkce. Při praktickém používaní diferenciálního počtu často pracujeme se závislostmi mezi l\ různými veličinami, řekněme y a x, a není dána pevně volba závislé a nezávislé proměnné. Explicitní vztah y = / (x) s nějakou funkcí / je tedy jen jednou z možností. Derivování pak vyjadřuje, že okamžitá změna y = f (x) je úměrná okamžité změně x a to s úměrou f(x) = ^-(x). Tento vztah se často píše jako
df
df(x) = —(x)dx, dx
kde d fix) interpretujeme jako lineární zobrazení přírůstků dané df(x)(Ax) = fix) ■ Ax, zatímco dx(x)(Ax) = Ax.
Hovoříme o diferenciálu funkce f pokud platí aproximační vlastnost
f(x + Ax)-f(x)-df(x)(Ax)
lim
Ax
0
Z Taylorovy věty tedy vyplývá, že funkce s ohraničenou derivací /' má diferenciál df. To zejména v bodě x nastane, když je v něm první derivace fix) existuje a je spojitá.
Pokud je veličina x vyjádřena pomocí další veličiny t, tj. x = g(J), a to opět funkcí se spojitou první derivací, pak pravidlo o derivaci složené funkce říká, že i složená funkce f o g má opět diferenciál
d f dx df(t) = -jr(x) — (t)dt. dx dt
Můžeme proto vnímat d f jako lineární přiblížení dané veličiny v závislosti na přírůstcích závislé proměnné, ať už je tato závislost dána jakkoliv.
6.13. Křivost grafu funkce. Abychom se pocvičili v základních \\ pravidlech pro derivování složených funkcí apod., budeme graf hladké funkce fix) teď chvíli diskutovat jako zvláštní případ parametrizované křivky v rovině. Můžeme si ji představit jako pohyb v rovině parametrizovaný pomocí nezávislé proměnné x. Pro libovolný bod x z definičního oboru naší funkce můžeme okamžitě výpočtem první derivace vidět vektor (1, fix)) e R2, který představuje okamžitou rychlost takového pohybu. Tečna bodem [x, fix)] parametrizovaná pomocí tohoto směrového vektoru pak představuje lineární přiblížení křivky.
do Taylorovy řady se středem v počátku.
Řešení. Pokud lze funkci vyjádřit jako součet mocninné řady (s kladným poloměrem konvergence) na jejím oboru konvergence, pak je tato řada nutně Taylorovou řadou uvažované funkce (svého součtu). To nám umožní snadno najít příslušné Taylorovy řady. Případ (a). Víme, že je
OO j
ln(l+x) = £ (-^r-x", jte(-l,l),
«=i
tj-
ln(l-x)= £t^(-x)" = -£±x",
n—1 n—1
Celkem máme
OO
ln j±f = ln (1 + x) - ln (1 - x) = J2
n = l
pro x € (—1,1).
Případ (b). Podobně ze známé identity
OO
&x = —.x", x e
t—i n\ '
plyne
e*2 = EM*2)" = E>-, *e
a
2 v2n-\
« = 1
«=0
«=0
«=0
x e
Platí tudíž
2 _-2* _ v2 1 c_Ov\« _ V" (~2)" v«+2
*2 E^(-2x)" = E^
x e
«=o
ex + x e
«=o
E
«=0
x e
□ R
6.23. Určete Taylorovu řadu se středem v počátku funkce
(a) y
r, x e (-1,1);
(l+x)2 '
(b) y = arctgx, x e (—1, 1). Řešení. Případ (a). Využijeme vzorec
1« E (-*)" = E (-1)"*". x e (-1,1) o součtu geometrické řady. Jeho derivováním dostáváme
(OO \ ' OO
E(-l)"*" ) =£(-!)"«í e (-1,1), «=0 / n=l
přičemž (x0)' = 0, a tak je dolní index n = 1. Vidíme, že
OO
^ = £(_iy.+i „^-i, x e (-1,1).
«=i
Případ (b). Derivaci funkce y = arctgŕ umíme vyjádřit jako
OO OO
(arctgŕ)'= ^7f = EHT = E(-l)"ŕ2", í e (-1,1).
«=0 «=0
Protože pro x e (—1, 1) je
350
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
Viděli jsme už také, že v případě, že f"(x) — 0 a zároveň f"'(x) / 0, přechází graf naší funkce přes svoji tečnu, tzn. že tečna je i nejlepším přibhžením křivky v bodě x i do druhého řádu. To zpravidla popisujeme tvrzením, že má graf funkce / v bodě x nulovou křivost. Tak jak u první derivace nenulové hodnoty vyjadřovaly rychlost růstu (ať už s jakýmkoliv znaménkem), stejně asi intuitivně očekáváme, že druhá derivace bude popisovat míru zakřivení grafu. Zatím jsme jen viděli, že je graf funkce nad svojí tečnou pro kladnou hodnotu a pod tečnou v případě opačném.
Tečnu grafu v pevném bodě P — [x, f (x)] jsme dostali pomocí limity sečen, tj. přímek procházejícími body P a Q — [x + Ax, f (x + Ax)]. Chceme-li přiblížit druhou derivaci, budeme body P a Q / P prokládat kružnicí Cq, jejíž střed je na průsečíku kolmic na tečny, vztyčených v bodech P a Q. Z obrázku je patrné, že jestliže tečna v pevném bodě P svírá s osou x úhel a a tečna v Q úhel a + Aa, pak i úhel zmíněných kolmic v jejich průsečíku bude A a. Označíme-li poloměr naší kružnice p, pak délka oblouku kružnice mezi body P a Q bude pAa. Jestliže budeme limitně přibližovat bod Q k pevnému bodu P, bude se zároveň délka oblouku kružnice blížit délce s studované křivky, tj. grafu funkce fix), a kružnice limitně přejde do kružnice Cp. Dostáváme tedy pro limitní poloměr p kružnice C p základní vztah
As ds
P
lim
Aa^O Aa
da
Křivost grafu funkce / v bodě P definujeme jako číslo 1/p. Nulová křivost tedy odpovídá nekonečnému poloměru p.
Pro výpočet poloměru p potřebujeme umět vyjádřit délku oblouku s pomocí změny úhlu a a derivaci této funkce pak vyjádřit pomocí derivací funkce /.
Všimněme si již teď, že při rostoucím úhlu 6 může délka oblouku buď také růst nebo klesat, podle toho, jestli má kružnice C q střed nad nebo pod grafem funkce /. Znaménko p nám tedy odráží, zda je funkce konkávni nebo konvexní. Je třeba také pomyslet na zvláštní případ, kdy střed limitně „uteče" do nekonečna, tj. místo kružnice limitně dostaneme přímku a to opět tečnu.
Evidentně nemáme přímý nástroj na vyčíslení derivace Víme však, že tg a — df/dx a derivováním této rovnosti podle x dostaneme (s využitím pravidla pro derivaci složených funkcí)
1 da
--= f ■
(cos a)2 dx
Na levé straně můžeme dosadit
_j = l + (tgoOz= l + if)
(cos a)2 ° J
a proto platí také (viz pravidlo pro derivování inverzní funkce)
i\2
dx da
l + (tga)z l +
i\2
f" f"
To už jsme ale skoro hotoví, protože přírůstek délky oblouku s v závislosti na proměnné x je dán vztahem
ds dx
a tedy můžeme již snadno spočíst podle pravidla pro derivování složené funkce
= d + (f)2)1'2
p
ds da
ds dx dx da
f"
Nyní již můžeme vyčíst vztah křivosti a druhé derivace: čitatel našeho zlomku je, nezávisle na hodnotě první derivace, vždy
J (arctgt)' dt = arctgx — arctg 0 = arctgx
X / oo
«=0
/ [Y.(-Vnt2n )dt = E[ (-D" / t2n ^) = E feg *2n+1
n=0
máme již výsledek
arctg x = £ 2^Tx2n+1 - *e(-l,l).
«=o
□
6.24. Najděte Taylorovu řadu se středem x0 = 0 funkce
fix) = f ucosu2du, x e o
Řešení. Z vyjádření
cosi = £ t2n, t e
«=0
plyne
«=o
u cos u2 = u ^ LJ1. („2
«=0
a následně (pro x e M)
x / oo
fix) = f ucosu2du = f í i~2 ^2n)T u4"+1 ) du o 0 V«=o
«=0 \ o
(-1)" x4«+2
«=0
1+2)
□
6.25. Na intervalu konvergence (—1, 1) stanovte součet řady
oo
J2 n in + 1) x" .
n = l
Řešení. Platí
OO OO
X>(n + l)x" = £" (x"+1)' = [J2 n x"+1
«=i
oo
£ n x"-1 x2
n = \
oo
x- | -1+ £x"
n=0
pravšechna x e (—1, 1).
«=i
«=i
x2 £(*")'
X2 ( £ X"
(-1+1^)'
"2 1
L d-*)2 J
2x
(\-xÝ
□
6.26. Rozviňte do mocninné řady funkci cos2(x) (tj. určete Taylorův rozvoj funkce) v bodě 0 a určete pro která reálná čísla tato řada konverguje.
351
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
kladný. Je roven třetí mocnině velikosti tečného vektoru ke studované křivce. Znaménko křivosti tedy je dáno jen znaménkem druhé derivace, což jen znovu potvrzuje naši úvahu o konkávních a konvexních bodech funkcí. V případě, že je druhá derivace nulová, dostaneme i křivost nulovou.
Kružnici, pomocí které jsme křivost definovali nazýváme oskulační kružnicí.
Zkuste si spočíst křivost jednoduchých funkcí sami a využijte oskulační kružnice při náčrtech jejich grafů. Nejjednodušší je výpočet v kritických bodech funkce /, protože v těch dostáváme poloměr oskulační kružnice jako reciprokou hodnotu druhé derivace opatřenou znaménkem.
6.14. Vektorový diferenciální počet. Jak jsme zmínili hned v úvodu k páté kapitole, pro naše úvahy o derivování bylo vesměs podstatné, že jsme zkoumali funkce definované na reálných číslech a že jejich hodnoty lze mezi sebou sčítat a lze je násobit reálnými čísly. Potřebujeme proto, aby naše funkce / : R -> V měly hodnoty ve vektorovém prostoru V. Budeme jim pro odlišení říkat vektorové funkce jedné reálné proměnné nebo stručněji vektorové funkce.
Nyní se budeme podrobněji věnovat reálným funkcím s hodnotami v rovině nebo prostoru, tj. / : R -> M2 a / : R -> R3. Hovoříme o (parametrizovaných) křivkách v rovině a v prostoru. Obdobně bychom mohli pracovat s hodnotami v Rn pro jakoukoliv konečnou dimenzi n.
Pro zjednodušení budeme pracovat v pevných standardních bazích e; vK2 a R3, takže naše křivky budou dány dvojicemi, resp. trojicemi obyčejných reálných funkcí jedné reálné proměnné. Vektorová funkce r v rovině, resp. v prostoru, je tedy dána
rif) = x(ť)ei + y(t)e2, r(t) = x(f)ei + y(t)e2 + z(t)e3.
Derivace takové vektorové funkce je opět vektor, který přibližuje zobrazení r pomocí lineárního zobrazení přímky do roviny či prostoru. V rovině je to tedy
dr(ť) dt
(t) = /(ř) =x'(0ei +y!(f)e2
a podobně v prostoru. V tomto kontextu je také třeba vnímat diferenciál vektorové funkce:
/ dx dy dz \
dr — I —e\ H--e2 H--ej, )dt
\ dt dt dt J
kde výraz na pravé straně chápeme tak, že se přírůstek skalární nezávisle proměnné t lineárně zobrazí pomocí vynásobení vektoru derivace a tím dostaneme příslušný přírůstek vektorové veličiny r.
Jestliže vektor r(t) představuje parametrizaci křivky, pak jeho derivace je vektorem rychlosti takto zadané dráhy. Speciální případ vektoru r(t) — tei+f(t)e2 zadávajícího graf funkce / jsme zkoumali v minulém odstavci. Druhá derivace pak představuje zrychlení takto zadaného pohybu. Všimněme si, že samozřejmě zrychlení nemusí být kolineární s rychlostí. V případě grafu funkce je dokonce zrychlení kolineární s rychlostí pouze v bodech, kde je /" nulová, což odpovídá představě, že kolineární může zrychlení být pouze, když je křivost grafu nulová.
6.27. Rozviňte do mocninné řady funkci sin (x) v bodě 0 a určete pro která reálná čísla tato řada konverguje.
6.28. Rozviňte do mocninné řady funkci ln(x3 + 3x2 + 3x +1) v bodě 0 a určete, pro která x e M konverguje. O
6.29. Rozviňte do mocninné řady funkci ln yfx v bodě 1 a určete, pro která x e M konverguje. O Další příklady na Taylorovy polynomy a řady naleznete na straně 404.
Nyní uvedeme několik „klasických" příkladů, ve kterých budeme vyšetřovat průběh různých funkcí.
6.30. Stanovte obor hodnot funkce /(*)
ex-l
x e
Řešení. Přímka y = 1 je zjevně asymptotou funkce /v+ooa přímka y = — 1 asymptotou v — oo, neboť
x^-oc
Z nerovnosti
lim 44
lim
f'(x)
1,
(e*+l)
lim ^
> 0, x e
0-1 0+1
■ 1.
dále plyne, že / je spojitá a rostoucí na R. Oborem hodnot je tedy interval (-1, 1). □
6.31. Uvedte všechny intervaly, kde je funkce y konkávni.
, x e
O
6.32. Uvažujte funkci
y = arctg^-, x^O(xeM).
Určete intervaly, kde je tato funkce konvexní a kde konkávni; a také všechny její asymptoty. O
6.33. Najděte všechny asymptoty funkce
(a) y = x ex;
(b) y
(x-2Ý
s maximálním definičním oborem.
6.34. Stanovte asymptoty funkce y = 2 arctg ^
O
x £ ±1 (x e R).
O
6.35. Uvažujte funkci
y
ln
e* + l
definovanou pro všechna reálná x. Nalezněte její asymptoty.
O
352
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
6.15. Derivování složených zobrazení. V lineární algebře a geometrii jsou velice užitečná zobrazení, kterým říkáme formy. Jako argumenty mají jeden nebo více vektorů a v kazil dém ze svých argumentů jsou lineární. Zadáváme tak ve-\Ů ' likost vektorů (skalární součin je symetrická bilineární forma) nebo objem rovnoběžnostěnů (to je n-lineární antisymet-rická forma, kde n je dimenze prostoru), viz např. odstavce 2.44 a 4.22.
Do těchto operací samozřejmě můžeme dosazovat vektory r(ť) závisející na parametru. Přímočarou aplikací Leibnizova pravidla pro derivaci součinu funkcí ověříme následující
Věta. (1) Je-li rit) : R -> R" diferencovatelný vektor a * : R" -> Rm lineární zobrazení, pak pro derivaci zobrazení * o r platí
6.36. Vyšetřete průběh funkce
R" a k-linerání formu : R" x ... x R" na prostoru R". Pak pro derivaci složeného zobrazení
(Pit) = <ř(n(0,...,rJt(0)
platí (zobecněné Leibnizovo) pravidlo
dr\
, r k
) _|-----|_ cř(n,
n-i,
drk
dt
dq>
dt v dt
(3) Předchozí tvrzení zůstává bezezbytku v platnosti i pokud má také hodnoty ve vktorovém prostoru (a je lineární ve všech k argumentech).
Důkaz. (1) V lineární algebře se ukazuje, že lineární zobrazení jsou dána konstantní maticí skalárů A = (a^) tak, že
y n n \
* o rit) = ( Y^aím it),...,J2 amin (t) J.
\-=i z=i '
Derivaci nyní provádíme po jednotlivých souřadnicích výsledku. Víme ale, že derivace se chová lineárně vůči skalárním hneárním kombinacím, viz Věta 5.33. Proto skutečně dostaneme derivaci * o rit) prostým vyčíslením původního lineárního zobrazení * na derivaci r' (t).
(2) Zcela obdobně dostatneme i druhé tvrzení. V souřadnicích rozepíšeme vyčíslení ^-lineární formy na vektorech r\,...,rk takto
n
(n(t),...,rk(t)) = Y2 Bh...ik-(rl)hit)...in)ikit), í'i,...,í;t=l
kde skaláry P>ix...ik jsou pro každou volbu indexů dány jako hodnota dané formy <ř(e;i,..., eik) na zvolené &-tici bázových vektorů. Pravidlo pro derivaci součinu skalárních funkcí nám dá právě dokazované tvrzení.
(3) Pokud má <$> vektorové hodnoty, je zadáno konečně mnoha komponentami a můžeme použít předchozí úvahu na každou z nich.
□
Na euklidovském prostoru R3 máme kromě skalárního součinu, který dvěma vektorům přiřadí skalár, také vektorový součin, který dvěma vektorům u a v přiřadí vektor u x v e R3, viz 4.24. Tento vektor h x wje kolmý na oba vektory u a v, má velikost rovnou obsahu rovnoběžníka určeného vektory u a v (v tomto pořadí) a orientaci takovou, aby trojice u, v, u x v byla kladně orientovanou bází.
Z předchozí věty okamžitě vyplývají užitečná tvrzení:
f(x) = 7|x|3 + l.
Řešení. Definičním oborem i oborem spojitosti je celá reálná osa (/ tedy nemá body nespojitosti). Postačuje např. uvážit, že funkce y = ^fx je spojitá v každém bodě x e M (na rozdíl od odmocnin o sudém základě definovaných pouze na nezáporné poloose). Ihned je také vidět, že / (x) > laf(-x) = f(x) pro všechna x e R, tj. funkce / je kladná a sudá. Bod [0, 1] jako jediný průsečík grafu / s osami proto dostaneme dosazením x = 0. Limitní chování funkce má smysl uvažovat pouze v ±oo (neexistují body nespojitosti), kde lehce určíme
(6.4) lim v^x P + 1 = lim = lim | x | = +oo.
Nyní přistoupíme ke zkoumání průběhu funkce pomocí jejích derivací. Pro x > 0 je
f(X) =7x3+1 = (x3 +1)!
a tedy
(6.5) f'(x) = i (x3 + lp 3x2
(x3 + 1)'
> 0, x > 0.
Odtud vyplývá, že funkce / je rostoucí na intervalu (0, +oo). Vzhledem ke své spojitosti v počátku je však nutně / rostoucí na [0, +oo). Neboť se jedná o sudou funkci, víme dále, že na intervalu (—oo, 0] klesá. Má tak jediné lokální minimum v bodě xo = 0, které j e současně (ostrým) minimem globálním. Protože nekonstantní spojitá funkce zobrazuje interval na interval, je oborem hodnot / právě [1, +oo) (uvažte f(x0) = 1 a (||6.4||)). Všimněme si, že díky sudosti funkce jsme nemuseli počítat derivaci /' na záporné poloose, kterou lze však snadno určit náhradou \x \3 = (—x)3 = —x3 se ziskem
/'(*) = i (-x3 + lp (-3x2)
< 0, x < 0.
Při výpočtu f'(0) můžeme vyjít přímo z definice nebo pomocí Umit
v2 „ v2
lim
*^0+ j(x3+lf
0 = lim
^0- ^(-*3 + l)2
stanovit jednostranné derivace a následně f'(0) = 0. Ve skutečnosti jsme nemuseli počítat první derivaci ani na kladné poloose. K tomu, abychom obdrželi, že / roste na (0, +oo), si stačilo uvědomit, že funkce y = ^fx a y = x3 + 1 jsou rostoucí na M a že kompozice rostoucích funkcí je funkce rostoucí.
Snadno pro x > 0 však z (||6.5||) vypočítáme druhou derivaci
fix)
353
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
Důsledek. V prostoru R3 uvažme vektory u(t)av (ř). Pro derivace jejich skalárního součinu (u(t), v (i)) a vektorového součinu u(t)x v (i) platí
(6.1)
dt
(u(t), v(t)) = (u'(t), v(t)) + (u(t), v'(t))
(6.2) —(u(t) x vit)) — u'(t) x vit) + u(ť) x v'(ť)
dt
6.16. Křivost křivek. Nyní máme daleko mocnější nástroje pro studium křivek systematičtějším způsobem, než když jsme diskutovali křivost grafů funkcí.
Podívejme se obecně na křivky r(f) v prostoru a předpokládejme, že jsou parametrizovány tak, aby jejich tečný vektor měl stále velikost jedna, tj. {r1 (ŕ), ť (f)) — 1 pro všechna t. Říkáme, že je křivka r(t) parametrizována délkou. Další derivací tohoto jednotkového vektoru r1 (ŕ) dostaneme vektor r" (ŕ), pro který spočteme (využíváme symetrie skalárního součinu)
0= -(/(0,r'(0) =2(/(ř),/(/)) dt
a je tedy vektor zrychlení r" (t) vždy kolmý na vektor rychlosti. To odpovídá představě, že při volbě parametrizace s konstantní velikostí rychlosti nemůže být zrychlení ve směru pohybu znatelné, musí tedy celé zrychlení být v rovině kolmé k vektoru rychlosti.
Pokud je druhá derivace nenulová, nazýváme normovaný vektor
1
nit) = -r"(t)
\\r"(t)\\
hlavní normálou křivky rit). Skalární funkce ic(t) splňující (v bodech, kde je r" (ŕ) ŕ 0)
r"it) = K(t)n(ť)
se nazývá křivost křivky rit). V nulových bodech druhé derivace definujeme ic(t) také nulovou hodnotou.
V nenulových bodech křivosti je dobře definován jednotkový vektor b(f) — r1 (ŕ) x nit), který nazýváme binormála křivky rit). Přímým výpočtem dostáváme
0 = ^-(biť), r1 (r)) = (b'it), r1 (r)) + (bit), r" (f)) dt
= (b'it), r'it)) + K(t)(b(t), n(t)) = (ť(t), r'(t)),
což ukazuje, že je tečný vektor k binormále kolmý jak na b (f), tak na r' (t). Musí tedy být násobkem vektoru hlavní normály. Píšeme
b'(t) = -x(ť)n(ť)
a skalární funkci x (t) nazýváme torze křivky r(t).
Ještě jsme nespočetli rychlost změny hlavní normály, kterou můžeme také psát jako n(t) — b (f) x r' (t).
n'(t) = b'(t) x r'(ť) + K(ť)b(ť) x n(ť) = -x(t)n(t) x r'(t) + K(t)(-r'(t)) = x(ť)b(ť) -K(ť)r'(ť).
Postupně jsme pro všechny body s nenulovou druhou derivací křivky r(ť) parametrizované délkou oblouku odvodili význačnou bázi (r1 (t), n(t), b(t)), které se v klasické literatuře říká Frenetův
tj. po úpravě máme (6.6) fix) =
Podobně můžeme spočítat
2x
(x3 + 1)-
> 0,
x > 0.
f„(x) = 2x/(-x3 + l)2 - §*^(-*3 + i)"1 (_3*2)
^H3 +1)4
2x
> 0,
^H3 +1)5
pro x > 0 a poté /"(0) = 0. Dále pak limitním přechodem:
lim
2x
„, ,--0 = lim j-
Podle nerovnosti (||6.6||) je / ryze konvexní na intervalu (0, +oo). Také dostáváme ryzí konvexnost funkce / na (—oo, 0). K tomuto závěru ovšem opět nebylo potřeba druhou derivaci pro x < 0 počítat: stačilo využít sudosti zadané funkce. Celkem jsme pak obdrželi, že / je konvexní na celém svém definičním oboru (nemá inflexní body).
K vykreslení grafu funkce ještě potřebujeme nalézt asymptoty (vyčíslení funkce v jistých bodech přenecháváme čtenáři). Neboť je funkce / spojitá na R, asymptoty bez směrnice mít nemůže. Přímka y = ax +bje pak asymptotou se směrnicí pro x -> oo tehdy a jenom tehdy, když existují (jako vlastní) obě limity
2x
lim
x^-oc
/(*)
Analogické tvrzení platí pro x
lim i fix) — ax) = b.
x^-oc
- —oo. Z limit
fix) =
X
lim ifix)-\-x)
lim
x^-oc
lim
x^-oc
•Jx3 + l
lim
x^-oc
1,
lim
X3 + 1
lim
x^-oc
J(x3 + lf+xjx3 + l+x2 j(xl + l)2+xjx^+l+x2
lim
x^ + l-x^
lim h
o
J(x3 + lf+xjx3 + l+x2 x^oo
tak již plyne, že přímka y = x je asymptotou v +oo. Když znovu uvážíme, že funkce / je sudá, bezprostředně obdržíme přímku y = —x j ako asymptotu v — oo. □
6.37. Vyšetřete průběh funkce
fix) = ^_L.
J • ' cos 2x
Řešení. Do definičního oboru náleží všechna x e R, pro která je cos 2x 0. Rovnice cos 2x = 0 je splněna právě pro
2x = \ + kit, k e
tj. i = f + ^,i€
Jako definiční obor tak obdržíme množinu
M\ {f + \; k e Z}.
354
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
reper a zároveň jsme v této bázi vyjádřili derivace jejích komponent formou tzv. Frenetových-Serretových formulí
0 pro nějakou konstantu h. Taylorův rozvoj pro funkci / v bodě x; pišme ve tvaru
f(Xi ±h) = fi± hf\Xi) + y± f)/(3)te) + ■ ■ ■
Víme, že když v rozvoji skončíme členem řádu k v h, tj. výrazem obsahujím hk, pak se dopustíme chyby, která je omezená odhadem výrazu
hk+l
—-f(k+1)(x)
(k+\)V
na intervalu [x; —h,xi+ h]. Pokud je (k + l)-vní derivace / spojitá, můžeme ji odhadnout konstantou. Vidíme pak, že se pro malá h chová chyba aproximace pomocí Taylorova polynomu stupně k stejně jako hk+1, až na konstantní násobek. Takovému odhadu se říká asymptotický odhad.
fi~x)
cos(—x) cos(—2x)
COS X
cos 2x
fix)
pro všechna x z definičního oboru, a tudíž je / s definičním oborem symetrickým kolem počátku sudou funkcí, což vyplynulo ze sudosti funkce y = cos x. Když dále uvážíme, že kosinus je periodický s periodou 2ti (tj. y = cos2x má periodu jt), dostaneme, že postačuje uvažovat funkci / pro
x e V := [0, Jt] \ {f + kf; k e Z} = [0, f) U (f, 3f) U (f, n],
neboť průběh zadané funkce na celém jejím definičním oboru lze odvodit s použitím toho, že je sudá a periodická s periodou 2n.
Zabývejme se proto pouze body nespojitosti x\ = rt/4 a x2 = 37T/4 a stanovme pro ně příslušné jednostranné Umity
lim
cos 2x
lim
3jr cos 2x
+ 00,
+oo,
lim
cos 2x
lim
o_ cos 2x
-OO,
-oo.
Přihlédneme-li ke spojitosti / na intervalu (tt/4, 3tt/4), vidíme, že / na tomto intervalu nabývá všech reálných hodnot. Oborem hodnot / je tedy celé R. Rovněž jsme zjistili, že body nespojitosti j sou tzv. druhého druhu, kdy aspoň jedna jednostranná limita je nevlastní (příp. neexistuje). Tím jsme současně dokázali, že přímky x = rt/4 a x = 37T/4 jsou asymptotami bez směrnice. Kdybychom předchozí výsledky formulovali bez omezení se na interval [0, tt], tak můžeme např. říci, že ve všech bodech
Xk
7 + T' ke
má / nespojitost druhého druhu a že každá přímka
* = ! + keZ
je asymptotou bez směrnice. Současně z periodičnosti funkce / vyplývá, že jiné asymptoty neexistují. Zvláště nemůže mít žádné asymptoty se směrnicí, ani nemohou existovat (jako nevlastní) limity lim
x^+oo
f{x), lim*
, fix). Ještě určíme průsečíky s osami.
Průsečík [0, 1] s osou y nalezneme vyčíslením /(O) = 1. Při hledání průsečíků s osou x uvažujeme rovnici cos x = 0, x € V s jediným řešením x = jx/2. Snadno dále získáme intervaly [0, rt/4), Ítx/2, 3ti/4), kde je funkce / kladná, a intervaly in/4, ti/2), (37T/4, Tt], kde je záporná.
Nyní přistoupíme k výpočtu derivace - sin x cos 2x — 2 cos x (— sin 2x)
fix)
cos2 2x
sin x (cos2 x — sin2 x) + 2 cos x (2 sin x cos x)
cos2 2x
sin
1 x + 3 cos2 x sin x (sin2 x + cos2 x + 2 cos2 x) sin x
cos
22x
cos
22x
355
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
Dennice. Řekneme, že výraz G (h) je pro h -> 0 asymptoticky stejný s výrazem F (h) apíšeme G(h) — 0(F (h)), jestliže existuje konečná limita
G (h)
lim
a e
h^o F (h)
Označme si hledané odhady hodnot derivací f (x) v bodech xí jako f-^ a pišme Taylorův rozvoj stručně takto:
fi±l = f ± f'h + ^h2 ± ^h3 + ...
Pro odhady první derivace můžeme okamžitě použít tři různé diference spočtené z Taylorova rozvoje:
h2
M) _ fi+l - fi-1 Ji ~ 2h
fi + l ~ f i
f!1] =
fl
(d
h
fi - fi-1
3! h
2! h
h
kde jsme prostě jen odečetli příslušné polynomy. Získáváme tak numerická vyjádření pro první derivaci. První z nich má asymptotický odhad chyby
fi + l - fi-1
f
(1)
2h
0(h2),
další dvě mají chybu 0(/z). Říkáme jim středová diference, dopředná diference a zpětná diference. Kupodivu je středová diference o řád lepší než zbylé dvě.
Stejně můžeme postupovat při odhadu druhé derivace. Abychom uměli spočíst /"(x;) z vhodné kombinace Tayulorových polynomů, potřebujeme vyrušit první derivace i hodnotu v x;. Nejjednodušší kombinace vyruší i všechny liché derivace:
//2) = ^^±^ + ^/(4)(x;.) + ....
Hovoříme o diferenci druhého řádu a stejně jako u středové první diference je asymptotický odhad chyby o jeden řád lepší, než bychom na první pohled čekali:
1 h2
2. Integrování
6.18. Newtonův integrál. Nyní se budeme zajímat o opačný postup než tomu bylo u derivování. Budeme chtít ze znalosti okamžitých změn nějaké funkce rekonstru-|£3ár ovat její skutečné hodnoty. Jestliže danou funkci / (x) považuj eme za derivaci neznámé funkce F (x), pak na úrovni diferenciálů můžeme psát
d F — f (x)dx.
Funkci F nazýváme primitivní funkce nebo neurčitý integrál funkce / a tradičně píšeme
F(x) — J f(x)dx.
Lemma. Primitivní funkce F(x) k funkci f(x) je na každém intervalu [a, b] určena jednoznačně až na aditivní konstantu.
(2cos2x + l) sinx
, x e V.
cos2 2x
Body, ve kterých je f'(x) = 0, jsou očividně řešením rovnice sinx = 0, x e V, tj. derivace je nulová v bodech x3 = 0, x4 = jt. Z nerovností
2cos2x + 1 > cos2 2x > 0, sinx > 0, x e V n (0, it)
plyne, že v každém vnitřním bodě množiny V funkce / roste, a tudíž / roste na každém podintervalu V. Sudost / potom implikuje, že klesá v každém bodě x e (—it, 0), x ^ —3it/4, x ^ —it/4. Funkce má proto ostré lokální extrémy právě v bodech
xk = kjt, k e Z.
Vzhledem k periodičnosti / tyto extrémy jednoznačně popíšeme pozorováním, že pro x3 = x0 = 0 dostáváme lokální minimum (zopakujme funkční hodnotu / (0) = 1) a pro x4 = x\ = ix lokální maximum s funkční hodnotou / (it) = —1. Spočítejme druhou derivaci
/"(*) =
[4 cos x(— sin x) sin x-\-{2 cos2 x-\-í) cos cos2 2x— 4 cos 2x(— sin 2x)(2 cos2 x-\-í) sin x
cos4 2x
[—4 cos x sin2 x-\-2 cos3 x+cos x](cos2 x— sin2 x)— 4(—2 sin x cos x){2 cos2 x+l) sin x
cos3 2x
cos3 2x
[10 sin2 x cos2 x-\-2 cos4 x+cos2 x-\-4 sin4 x-\-l sin2 x\ cos x cos3 2x '
x e v.
Poznamenejme, že jednoduchými úpravami lze také vyjádřit
nebo
Protože
(3+4 cos x sin x-\-% sin xj cos x cos3 2x
(l 1 —4 cos4 x —4 cos2 cos x cos3 2x
x eV
x eV.
10 sin2 x cos2 x + 2 cos4 x + cos2 x + 4 sin4 x + 7 sin2 x > 0, x e M, resp.
3 + 4 cos2 x sin2 x + 8 sin2 x = 11 — 4 cos4 x — 4 cos2 x > 3, x e M,
je f" (x) = 0 pro jisté x sV tehdy a jen tehdy, když cos x = 0. Tomu ale vyhovuje pouze x5 = it/2 e V. Je vidět, že v tomto bodě mění /" znaménko, tj. jedná se o inflexní bod. Jiný inflexní bod neexistuje (druhá derivace /" je spojitá na V). K dalším změnám znaménka /" dochází v nulových bodech jmenovatele, které jsme již dříve určili jako body nespojitosti x\ = it/4 a x2 = 3it/4. Znaménko se tedy mění právě v bodech x\, x2, x5, a tak z nerovnosti
f"(x) > 0 pro x -+ 0+
vyplývá, že / je konvexní na intervalu [0, it/4), konkávni na (it/4,7t/2], konvexní na [it/2, 3tt/4) a konkávni na (3^/4, it].
356
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
Důkaz. Tvrzení je okamžitým důsledkem Lagrangeovy věty o střední hodnotě, viz 5.38. Skutečně, pokud je F'(x) — G'(x) — f(x) na celém intervalu [a,b], funkce (F — G)(x) má ve všech bodech c intervalu [a, b] nulovou derivaci. Pak ale podle věty o střední hodnotě pro všechny body x v tomto intervalu
F (x) - G(x) = F (a) - G(a) + 0 • (x - a).
Musí tedy být rozdíl hodnot funkcí f a G stejný na celém intervalu
[a,b]. □
Předchozí lemma nás vede k tomu, že neurčitý integrál obvykle zapisujeme ve tvaru
F (x) = J f(x)dx + C
s neznámou konstantou C.
Hodnotu reálné funkce f (x) můžeme také považovat za okamžitý přírůstek plochy vymezené grafem funkce / a osou x a snažit se najít velikost této plochy mezi krajními hodnotami a a b nějakého intervalu. Zkusme tuto představu dát do souvislosti s neurčitým integrálem. Předpokládejme tedy, že na intervalu [a, b] známe reálnou funkci a její neurčitý integrál F (x), tj. F'(x) —
Jestliže rozdělíme interval [a, b] na n částí volbou bodů a — xo < xi < • • • < x„ — b a přiblížíme hodnoty derivací v bodech x; výrazy
, F(xi+i) — F(xi) f(xt) = F'(xí) ~ -—,
X/ + 1 — Xi
dostáváme součtem přes všechny intervaly našeho dělení odhad hledané velikosti plochy:
n-l
n-1
F(xi+i)- F(xj)
X/ + 1 — Xi
(Xi + l-Xi)
i=0
F(b) - F(a).
Dá se tedy očekávat, že pro „dostatečně pěkné" funkce f(x) velikost plochy vymezené grafem funkce a osou x skutečně spočteme jako rozdíl hodnot primitivní funkce v krajních bodech intervalu. Tomuto postupu se říká Newtonův integrál. Píšeme
J a
f(x)dx = [F(x)fa = F(b) - F(a)
a hovoříme také o (Newtonově) určitém integrálu v mezích a, b.
V případě komplexní funkce / je reálná a imaginární část jejího neurčitého integrálu jednoznačně dána reálnou a imaginární částí /, budeme proto dále bez dalších komentářů pracovat s reálnými funkcemi a ke komplexním se vrátíme v aplikacích, jak je to bude třeba.
6.19. Integrace „po paměti". Ještě než si uděláme jasno, jak Newtonův integrál skutečně souvisí s velikostí plochy a jak jej případně lze používat pro modelování praktických problémů, ukážeme několik postupů, jak Newtonův integrál spočítat. Budeme přitom využívat jen naše znalosti o derivacích.
Nej snadnější je případ, kdy v integrované funkci umíme derivaci přímo uvidět. K tomu v jednoduchých případech stačí číst
Konvexnost a konkávnost funkce / na jiných podintervalech je dána její periodičností a následujícím jednoduchým pozorováním. Je-li funkce sudá a konvexní na intervalu (a, b), kde 0 < a < b, potom je konvexní rovněž na (—b, —a).
Zbývá jen vyčíslit derivaci (k odhadu rychlosti růstu funkce) v in-flexním bodě se ziskem /' (tt/2) = 1. S pomocí všech předchozích výsledků lze již lehce sestrojit graf funkce /. □
6.38. Vyšetřete průběh funkce
ln(x)
a načrtněte její graf. Řešení.
i) Nejprve určíme definiční obor funkce: R+ \ {1}.
ii) Nalezneme intervaly monotónnosti funkce: nejprve nalezneme nulové body derivace:
ln(x) - 1
ln2(x)
0
Tato rovnice má kořen e. Dále vidíme, že f'(x) je na intervalu (0, 1) i (1, é) záporná, tedy je f(x) na intervalu (0, 1) i na (1, é) klesající, dále je f'(x) na intervalu (e, oo) kladná a tedy f(x) rostoucí. Má tedy funkce / jediný extrém v bodě e a to minimum, (také bychom o tom mohli rozhodnout pomocí znaménka druhé derivace funkce / v bodě e, je totiž f(2\e) > 0)
iii) Určíme inflexní body:
m ln(x) — 2
f2\x) = -=0
x ln (x)
Tato rovnice má kořen e2, který musí být inflexním bodem (extrém to již být nemůže vzhledem k předchozímu bodu).
iv) Asymptoty. Funkce má asymptotu přímku x = 1. Dále hledejme asymptoty s konečnou směrnicí k:
1
k = lim y
ln(jtľ)
lim
x^oo ln(x)
0.
Pokud asymptota existuje, má tedy směrnici 0. Pokračujme tedy ve výpočtu
x
lim
x^°o ln(x)
0 • x = lim ln(x) = oo,
a protože Umita není konečná, asymptota s konečnou směrnicí neexistuje. Průběh funkce:
357
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
tabulky pro derivace funkcí v našem zvěřinci naopak. Dostáváme tak např. následující tvrzení pro všechna aelaneZ, — 1:
/ / / / / / / / / / / /
C
a dx = ax + C
n + 1
e" dx = i e" +C
— cos"4"1 (bx) + C
a tg(bx) dx =--ln(cos(£>x)) + C
b
— dx = arctg (f) + C
\l a2 — x2
dx = arccos (^) + C
•Ja2 — x2
dx = arcsin (f — ) + C.
Ve všech případech je zapotřebí dobře promyslet definiční obor, na kterém je neurčitý integrál dobře definován.
K takovýmto tabulkovým pravidlům pro integraci lze relativně snadno dodávat další pravidla jednoduchými pozorováními vhodné struktury integrovaných funkcí. Např.
/
dx = ln|/(x)| + C
pro všechny spojitě diferencovatelné funkce / na intervalech, kde jsou nenulové. Samozřejmé také z pravidel pro derivaci součtu diferencovatelných funkcí a konstantních násobků diferencovatelných funkcí je zřejmé že obdobná pravidla platí neurčitý integrál také.
6.20. Integrace per partes. Výpočet integrálu pomocí primitivní funkce (neurčitého integrálu), spolu s pravidlem
(F ■ G)'(t) = F'(t) ■ G(t) + F(t) ■ G'(t)
pro derivaci součinu funkcí, dává následující formuli pro neurčitý integrál
fW.CW + C = /f'WGW& + /fWG'U„,
Tato formule se většinou používá tak, že jeden z integrálů napravo je ten, který máme spočíst, zatímco druhý umíme spočítat snáze. Nejlépe je princip vidět na příkladu. Spočteme
-/
x sin x dx.
□
Nyní přejděme od vyšetřování funkcí k dalším tématům spojených s derivacemi funkcí. Nejprve demonstrujme pojem křivosti a oskulační kružnice na elipse.
6.39. Určete křivost elipsy x2 + 2y2 = 2 v jejích vrcholech (|| 4.491|). Udejte též rovnice oskulačních kružnic v těchto vrcholech.
Řešení. Protože elipsa je v daných souřadnicích již v základním tvaru (nejsou přítomny ani smíšené ani lineární členy), je zadaná báze již bází polární. Jejími osami jsou souřadnicové osy x a y, vrcholy pak body [V2, 0], [-V2, 0], [0, 1] a [0, -1]. Spočítejme nejprve křivost ve vrcholu [0, 1]. Uvážíme-li souřadnici y jakožto funkci souřadnice x (v okolí bodu [0, 1] je jednoznačně určena), pak derivací rovnice elipsy podle proměnné x dostáváme 2x + 4y/ = 0, tedy / = — ^ (/ značí derivaci funkce y(x) podle proměnné x; nejedná se vlastně
0 nic jiného, než o vyjádření derivace funkce dané implicitně, viz ??). Derivací této rovnice podle x pak obdržíme y" = — 5 (j — p-) ■ V bodě [1,0] pak dostáváme / = 0 a y" = — \ (ke stejným výsledkům bychom došli, kdybychom explicitně vyjádřili z rovnice elipsy y =
1 V2 — x2 a derivovali; výpočet by byl jen o něco složitější, jak si jistě čtenář sám ověří). Poloměr oskulační kružnice bude tedy dle vzahu v6.13
(i + (y)2)5
(y)
n2
358
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
V tomto případě pomůže volba F (x) — x, G'(x) — sin x. Odtud G (x) — — cos x a proto také
/ = -xcosx-/-cosx.x = -xcosx + sinx + C. Obvyklým trikem je také použít tento postup s f (x) — 1:
jlnx dx — j 1 • ln x dx — x ln x — f —x dx — xlnx — x + C.
-í h
6.21. Integrace pomocí substituce. Další užitečný postup je odvozen z derivování složených funkcí. Jestliže
F'(y) = f(y), y = y(x), pro diferencovatelnou funkci 2jt JO
2n (2n-l)(2n-3)...3-l
cos x dx =-2it,
2«(2«-2)...2
zatímco u lichých m je to vždy nula (jak bylo možné přímo uhádnout z grafu funkce cos x).
Křivost elipsy v jakémkoli jejím bodě se tedy nalézá mezi křivostmi v jejích vrcholech, tj. mezi \ a V2.
B. Integrování
Nejprve několik jednoduchých příkladů, které by měl zvládnout každý.
6.41. Integrováním „po paměti" vyjádřete
(a) / e~x dx, x e M;
(b) / -jJ= dx, x e (-2, 2);
A-*2
(c) f-^dx,xeR;
3x2 + l
xó+x+2
dx, i / -I.
Řešení. Snadno získáváme
(a) / e~x dx = — f —e~x dx
(b) f -ř= dx = f , 2 „ úřx = arcsin f + C;
^ 74-jc2 ^
-e~x + C;
2
(c) f^dx
x2+3
j=3 arctg f3+C;
v2
f — dx = -L f
73
V3<
i+
■ dx
(d) / dx = ln | x3 + 3x + 2 | + C,
kde jsme využili vzorec / 0; Řešení.
/
lnx dx
u = lnx u' = -1/ = 1 i; = x
xlnx — / ldx=xlnx — x + C.
/
360
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
6.23. Integrace racionálních funkcí lomených. U racionálních funkcí lomených si můžeme při integraci pomoci několika zjednodušeními. Zejména v případě, že je stupeň polynomu / v čitateli větší nebo roven stupni polynomu g ve jmenovateli, je rozumné hned z kraje dělením se zbytkem, viz odstavec 5.2, převést integraci na součet dvou integrálů. První pak bude integrací polynomu a druhý integrací výrazu f/g se stupněm g ostře větším, než je stupeň / (takovým funkcím říkáme ryze racionální lomené).
Toho skutečně dosáhneme prostým vydělením polynomu:
f h
■h, — = q H--.
g g
Můžeme tedy zrovna předpokládat, že stupeň g je ostře větší než stupeň /. Další postup si ukažme na jednoduchém příkladě. Zkusme si rozebrat, jak se dostaneme k výsledku
f (x) _ 4x + 2 -2 6
g (x) x2 + 3x + 2 x + 1 x + 2 který již umíme integrovat přímo:
4x + 2
/
■ dx = -2 ln |x + 11 + 6 ln |x + 21 + C.
x*- + 3x + 2
Především převedením součtu zlomků na společného jmenovatele tuto rovnost snadno ověříme. Pokud naopak víme, že lze náš výraz rozepsat ve tvaru
4x + 2 A B
■3x-
1
jde nám pouze o výpočet koeficientů AaB. Můžeme pro ně získat rovnice pomocí roznásobení obou stran polynomem x2 + 3x + 2 ze jmenovatele a porovnáním koeficientů u jednotlivých mocnin x ve výsledných polynomech napravo i nalevo:
4x + 2 = A(x + 2) + B(x + 1)
2A + B = 2, A + B = 4.
Odtud již přímo vychází náš rozklad. Říká se mu rozklad na parciální zlomky.
Tento elementární postup lze snadno zobecnit. Jde o čistě algebraickou úvahu opírající se o vlastnosti polynomů, ke kterým se budeme vracet v kapitole ??.
Předpokládejme, že jmenovatel g(x) a čitatel fix) nesdílí žádné reálné ani komplexní kořeny a že g(x) má právě n různých reálných kořenů a\,... ,a„. Pak jsou body a\,... an právě všechny body nespojitosti funkce f(x)/g(x).
Pro zjednodušení úvahy nejprve pišme g(x) jako součin
gix) = pix)qix)
dvou nesoudělných polynomů. Díky Bezoutově identitě (viz ??), která je důsledkem obyčejného dělení polynomů se zbytkem, existují polynomy a (x) a b(x) se stupni ostře menšími než je stupeň g takové, že
a(x)p(x) +bix)qix) = 1.
Vynásobením této rovnosti podílem fix)/gix) dostáváme
fix) _ ajx) bjx) gix) qix) pix) '
Předpokládejme nyní, že náš polynom gix) nemá jiné než reálné kořeny, má tedy jednoznačný rozklad na faktory (x — a{)ni, kde nt jsou násobnosti kořenů ai,i = Postupným použitím
/
x cos x dx
u
u
1
v = cosx v = smx x sinx + cosx + C.
x smx
/
sin x dx
□
6.44. Metodou per partes vypočítejte
(a) / (x2 + l) e~x dx, x e R,
(b) / (2x — 1) lnx dx, x > 0,
(c) / arctgx dx, x e R,
(d) / ď sinx dx, x e R,
Řešení. Nejdříve vyzdvihněme, že metodou per partes lze vypočítat každý integrál ve tvaru
/ P(x) abx dx, f P(x)sin(bx) dx, f P(x)cos(bx) dx,
f P(x)\ognax dx, f xh logna (kx) dx,
f /J(x)arccos (bx) dx, f P (x) arccotg (bx) dx, f ahx cos (cx) dx,
f /J(x)arcsin (bx) dx, f P(x)arctg (bx) dx, f ahx sin (cx) dx, kde f je libovolný polynom a
a e (0, 1) U (1, +oo), i,cel \ {0}, neN, k > 0. Proto víme, že (a)
' F'(x) = 2x
f (x2 + l) e~x dx
F(x) = x2 + 1 G'(x) = e~x
G(x)
- (x2 + 1) e~x + f 2x e~x dx F(x) = 2x F'(x) = 2 G'(x) = e~x G(x) = -e~x (x2 + l) e~x - 2x e~x + f 2e~x dx = - (x2 + l) e" 2x e~x - 2e~x + C = -e~x (x2 + 2x + 3) + C;
(b)
/(2x — 1) lnx dx
F(x) = lnx G'(x) = 2x - 1
F'(x) = 1/x G(x) =x2 -
(x2 — x) ln x — j x—^- dx = (x2 — x) ln x + j 1 — x dx
{x2 - x) lnx +x - y + C;
(c)
f arctg x dx
F (x) = arctgx G'(x) = 1
F'M = t+x1
G(x) = x
x arctgx - / dx =x arctgx -\$ dx
l+x1
x arctgx - \ ln (l + x2) + C;
(d)
361
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
předchozího postupu s nesoudělnými polynomy p (x) a q(x) dostaneme vyjádření f (x)/g (x) pomocí součtu zlomků ve tvaru
n(x)
r k (x)
(x -
(x - ak)mj
kde stupně polynomů r,(x) jsou ostře menší než stupně v jmenovatelích. Každý z nich ale jde velmi snadno rozepsat jako součet
r(x)
(x - a)"
(x — a)2
(x - a)"
když začneme od nejvyšších mocnin v polynomu r(x) a postupně počítáme A\, A2,... vhodným doplňováním a odebíráním sčítanců v čitateli. Např.
5x - 16 (x - 2)2
= 5-
1
(x - 2)2
(x - 2)2
(x - 2)2
Zbývá ošetřit ještě případ, kdy reálných kořenů není dostatek. Vždycky ale existuje rozklad g(x) na lineární faktory s případně komplexními kořeny. Opakování předchozí úvahy pro komplexní polynomy nám dá tentýž výsledek. Pokud ale předem víme, že koeficienty polynomů jsou reálné, budou komplexní kořeny v našich výrazech vystupovat vždy po dvojicích komplexně sdružených kořenů. Můžeme proto rovnou pracovat s kvadratickými faktory ve tvaru součtu čtverců (x — a)2 + b2 a jejich mocnin. Naše předchozí úvaha opět dobře funguje a zaručuje, že bude možné hledat příslušné sčítance ve tvaru
Bx + C
((x - a)2 + b2)n '
Obdobně jako v případě reálných kořenů se tedy i v případě mocniny ((x — a)2 + b2)n takového kvadratického (nerozložitelného) faktoru vždy podaří najít odpovídající rozklad na parciální zlomky tvaru
A\x + B\ Anx + Bn
(x - a)2 + b2 + " ' + ((x - a)2 + b2)" '
Konkrétní výsledky lze také snadno ozkoušet v Maplu pomocí volání procedury „convert(h, parfrac, x)", které rozloží výraz h racionálně závislý na proměnné x na parciální zlomky.
Všechny výše uvedené parciální zlomky už umíme integrovat. Připomeňme, že ty poslední zmíněné vedou mimo jiné na integrály diskutované v Příkladě 6.22.
Celkově můžeme shrnout, že racionální funkce f(x)/g (x) lze poměrně snadno integrovat, pokud se podaří najít příslušný rozklad polynomu ve jmenovateli g(x). Při výpočtu Newtonových integrálů jsou ale problematické body nespojitosti racionálních funkcí lomených, v jejichž okolí jsou tyto funkce neohraničené. Tomuto problému se budeme obecně ještě věnovat později (viz odstavec 6.30 níže).
6.24. Riemannův integrál. Myšlenku počítat integrál jako vyjádření plochy vymezené grafem funkce a osou x je třeba zpřesnit. To nyní učiníme a v zápětí do-kážeme, že pro všechny spojité funkce tato definice dává stejné výsledky jako Newtonův integrál.
Uvažme reálnou funkci / definovanou na intervalu [a, b] a zvolme dělení tohoto intervalu spolu s výběrem reprezentantů §; jednotlivých částí, tj. a = xo < x\ < ■ ■■ < xn = b a zároveň t-i e [xi-i, xí], i = 1,... ,n. Normou dělení nazýváme číslo S
/ ex sin x dx
F(x) = ex G'(x) = sinx
F'(x) G(x) -.
cosx
-eř cos x + f ď cos x dx = F'(x) = ď G (x) = sinx
F (x) = ex G'(x) = cosx
—ex cosx + ex sinx — / ex sinx dx, odkud plyne
/ ex sinx dx = ^ex (sinx — cosx) + C.
□
Pro vyjádření následujících integrálů je výhodné použít substituční metodu (viz 6.21).
6.45. Vhodnou substitucí stanovte
>
5 .
(a) f -J2x — 5 dx, x
(b) / ÍZ±J££)I ^ x > 0;
(^Uäé^dx,x^^,ke (d)/
dx, x e
+sin x
Řešení. Platí (a)
j -J2x — 5 dx
t = 2x — 5 dt = 2 dx I
/ ^/tdt
±t2 +C
(b)
■ dx
y(2x - 5)3 + C;
t = 1 + lnx ' dt = - dx
X
(7+ln xf
fť1dt = 'j+C
+ Q
(c)
(l+sin x)2
dx
t = 1 + sin x dt = cos x dx
ľ-
+ C
i
1 +sin x
+ Q
(d)
VT
■■ dx
+sin x
í = siní
dt = cos x dx
'i+t2
■■ dt
t + Vi + t2 > o
u
du = (1 + 7&)
^ - 1 dt
dt
t+Vi+t2
n+t2
ľ - du = ln u + C
J u
ln
(t + y/l + ŕ2) + C = ln (sinx + y/l + sin2x) + C.
□
6.46. Určete integrály
a) / áx
sin2(x)—cos2(x) 1
b) / x2 y/2x + 1 dx.
362
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
min, [xi —xí _ i}. Riemannův součet odpovídající zvolenému dělení s reprezentanty
S = (x0, ... ,x„
definujeme jako
i=\
Řekneme, že Riemannův integrál funkce / na intervalu [a, b] existuje, jestliže pro každou posloupnost dělení s reprezentanty (St)^0 s normami dělení &k jdoucími k nule existuje limita
lim SSk = S,
k^-oo
jejíž hodnota navíc nezávisí na volbě posloupnosti dělení a jejich reprezentantů. Píšeme v takovém případě
J a
f (x)dx.
Tato definice nevypadá příliš prakticky, nicméně nám dovolí snadno zformulovat a dokázat řadu jednoduchých vlastností Rie-mannova integrálu:
Věta. (1) Je-li f omezená reálná funkce definovaná na intervalu [a, b] a c € [a, b] je nějaký vnitřní bod tohoto intervalu, potom integrál f% f(x)dx existuje tehdy a jen tehdy, když existují oba integrály fa f(x)dx a /? f(x)dx. Vtokovém případě pak také platí
p b p c nb
J f(x)dx = / f(x)dx + /
Ja Ja J c
f (x)dx.
(2) Jsou-li f a g dvě reálné funkce definované na intervalu [a, b] a jestliže existují integrály f% f(x)dx a f% g (x)dx, pak existuje také integrál jejich součtu a platí
ľ
Ja
(f(x)+g(x))dx
pb rb / f(x)dx + / Ja Ja
g(x)dx.
(3) Je-li f reálná funkce definovaná na intervalu [a, b], C e
rb
M je konstanta a jestliže existuje integrál Ja f(x)dx, pak existuje
rb
také integrál Ja C ■ f (x)dx a platí
f
Ja
C ■ f (x)dx = C
Ja
f (x)dx.
Důkaz. (1) Předpokládejme nejprve, že existuje integrál přes celý interval. Jistě se lze při jeho výpočtu omezit na limity Rie-mannových součtů, jejichž dělení mají bod c mezi svými dělícími body. Každý takový součet dostaneme jako součet dvou dílčích Rie-mannových součtů. Pokud by tyto dílčí součty v limitě závisely na zvolených rozděleních a reprezentantech, pak by celkové součty nemohly být v limitě na volbách nezávislé (stačí ponechat jednu posloupnost dělení podintervalu stejnou a druhou měnit tak, aby se limita změnila).
Naopak, jestliže existují Riemannovy integrály na obou podin-tervalech, jsou libovolně přesně aproximovatelné Riemannovými součty a to navíc nezávisle na jejich volbě. Pokud do libovolné posloupnosti Riemannových součtů přes celý interval [a, b] přidáme v jejich děleních jeden dělící bod c navíc, změníme hodnotu celého součtu i částečných součtů přes intervaly patřící do [a, c] a [c, b] nejvýše o násobek normy dělení a možných rozdílů omezené funkce / na celém [a, b]. To je číslo jdoucí libovolně blízko k nule při zmenšující se normě dělení. Proto nutně i částečné Riemannovy
Řešení. Pro výpočet prvního z integrálů zvolíme substituci t = tg x, kterou lze často s výhodou uplatnit.
dx
/
sin (x) — cos2(x) substituce t = tg x
dt = —^t- dx = (1 + tg2(x)) dx = (1 + ŕ2) dx
COS^ X
sin2(x) - JIÍÍ£) - ?
cos (x)
l+tg2(x) l+fl 1 _ 1
l+tg2(x) 1+t2
J f -1 2] t-\ 2 J ŕ + 1
1 /tg(x) - 1 , = - ln BV 1 + C
2 V tg+1
Nyní určeme druhý integrál:
/
x2 V2x + 1 dx =
2 u =2x
u = x
v' = V2x + 1 v = U2x + l)
1 9
-x2 (2x + 1)
2
x + ldx - -(2x + 1)2 + C,
což můžeme chápat jako rovnici, kde neznámou je hledaný integrál. Převedením na jednu stranu pak
/
x2 V2x + 1 dx
x2(2x + 1)5
x + 1
v' = V2x + 1 v = \*J2x + 1
1 9 3 2 / 1 ,- 1 f 3 \
-x2(2x + 1)2 - - I-xV2x + 1 - - / (2x + 1)2 dx)
-x2(2x + 1)2--xV2x + 1 -|--(2x + 1)2 =
V 21 105
-x2(2x + 1)2 - — x(2x + 1)2 + — (2x + 1)2 + C 1 ' 35 105
□
6.47. Užitím základních vzorců vypočtěte
(a) / j= dx, x ^ 0;
(b) / tg2 x dx, x ^ I + kn, k e Z;
(c) f^dx,xŕ-z+2kn,ke:
(d) / 6 sin 5x + cos | + 2 e 3 dx, x e
Řešení. Případ (a). Ihned určíme
i
f^dx= f x-1'3 dx = xl+C
x2 +C,
363
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
součty naší funkce nutně konvergují k limitám, jejichž součtem je Riemannův integrál přes [a, b].
(2) V každém Riemannově součtu se součet funkcí projeví jako součet hodnot ve vybraných reprezentantech. Protože je násobení reálných čísel distributivní, vyplývá odtud právě dokazované tvrzení.
(3) Stejná úvaha jako v předchozím případě. □
Následující výsledek je zcela zásadní pro pochopení vztahu mezi integrálem a derivací:
6.25. Věta (Základní věta integrálního počtu). Pro každou spoji-
tou funkci f na konečném intervalu [a, b] existuje její Riemannův integrál Ja f (x)dx. Navíc je funkce F (ť) zadaná na intervalu [a, b] pomocíRiemannova integrálu
F(x) = í f(t)dt
Ja
primitivní funkcí k f na tomto intervalu.
Celý důkaz tohoto významného tvrzení bude poněkud delší. V prvním kroku pro důkaz existence integrálu použijeme alternativní definici, ve které nahrazujeme výběr reprezentatů a příslušné hodnoty /(&) pomocí suprem M; hodnot fix) v příslušném po-dintervalu [x;_i, x;], resp. pomocí infim m; funkce fix) tamtéž. Hovoříme o horních Riemannových součtech, resp. dolních Rie-mannových součtech (někdy je v literatuře tento postup označován jako Darbouxův integrál).
6.26. Horní a dolní Riemannův integrál. Protože je naše funkce J.1« spojitá, je jistě i omezená na uzavřeném intervalu a proto
jsou všechna výše uvažovaná suprema i infima konečná. Je tedy horní Riemannův součet příslušný dělení S = W (xq, ..., x„) zadán výrazem
zatímco dolní Riemannův součet je
n n
Se,m — vy inf /(£)) • (xí - Xi-i) — y^rriiixi - x;_i).
Protože pro každé dělení S — (xq, ..., x„; §i ,...,§„) s reprezentanty platí odhady
(6.3)
Se,m — Se, % — Ss
sup
a infima i suprema lze libovolně přesně aproximovat skutečnými hodnotami, lze tušit, že bude Riemannův integrál existovat právě, když bude existovat pro libovolné posloupnosti dělení s normou jdoucí k nule limita horních i dolních součtů a tyto si budou rovny. Dokážeme, že tomu tak skutečně musí být pro všechny omezené funkce:
Věta. Nechť je funkce f omezená na uzavřeném intervalu [a, b]. Pak
Ssup = inf SsSUp, S;nf — SUp Ssinf
jsou limity všech posloupností horních, resp. dolních, součtů s normou jdoucí k nule.
přičemž zápisu, ve kterém přičítáme C e M, je třeba rozumět tak, že všechny primitivní funkce získáme právě pomocí konstantního posunutí libovolné primitivní funkce. To ovšem platí pouze na intervalu. Jinak řečeno, hodnota C je obecně různá pro x < 0 a pro x > 0. Měli bychom tedy uvažovat hodnoty C\ a C2. Pro jednoduchost budeme ale používat zápis bez indexů a uvádění příslušných intervalů. Navíc si budeme pomáhat položeními aC = C pro asR\{0}aC + b = C pro feel, která jsou založena na skutečnosti, že
{C; CeR) = {aC; C e R] = {C + b; C e R] = R.
Zcela korektní vyjádření bychom pak obdrželi např. substitucemi C = aC,C = C+b. Tato zjednodušení prokáží svou užitečnost při počítání náročnějších příkladů. Činí totiž postupy a úpravy přehlednějšími. Případ (b). Postupné úpravy integrované funkce vedou na
ftg2xdx=f^dx=f dx =
•J <-> J COS X J COS X
f —k— dx — f ldx =tex — x + C,
J cosz x •> °
kde jsme si pomohli znalostí derivace
(tgx)' = ^, x ^ f+for, k e Z. Případ (c). Stačí si uvědomit, že se jedná o speciální případ vzorce
jfMdx=in\ f(x) | + c,
jenž můžeme přímo ověřit derivováním
(ln| f(x) \ + C)' = (ln[±/(x)])'+(C)' = = ±£M = fg.
Platí tudíž
1 +sin x
dx = ln (1 + sinx) + C.
Případ (d). Protože integrál součtu je součtem integrálů (pokud mají jednotlivé integrály smysl) a nenulovou konstantu lze z integrálu vytknout kdykoli, je
/ 6 sin 5x + cos | + 2 e^" 0 najdeme vždy k takové, Ssk,mp, k > N bude k Ssup blíže než o e. Pro ale umíme podle předchozí úvahy najít <5 tak, že pro všechna dělení s normou menší než <5 budememe se součtem blíže než o 2e. Právě jsme proto ukázali, že pro libovolné číslo e > 0 umíme najít takové 8 > 0, že pro všechna dělení s normou nejvýše 8 bude l^s.sup — Se\ < e. To je přesné tvrzení, že číslo Smp je limitou všech posloupností horních součtů s normami dělení jdoucími k nule. Úplně stejně se dokáže i tvrzení pro součty dolní.
Pokud Riemannův integrál neexistuje, existují posloupnosti dělení a reprezentantů s různými limitami Riemannových součtů. Pak ovšem z již dokázaného tvrzení plyne, že budou různé i limity horních součtů a dolních součtů. Naopak, předpokládejme, že Ssup — Si„f, pak ovšem i všechny Riemannovy součty posloupností dělení musí mít tutéž limitu díky nerovnostem (6.3). □
6.27. Stejnoměrná spojitost. Prozatím jsme ze spojitosti naší funkce / využili pouze to, že každá taková funkce je na konečném uzavřeném intervalu omezená. Zbývá .' nám ale ukázat, že pro spojité funkce je Ssup — Sm. Z definice spojitosti víme, že pro každý pevně zvolený bod x e [a, b] a každé okolí 0€(f(x)) existuje okolí (D$(x) takové, že f(Og(x)) c Oe(f(x)). Toto tvrzení lze přepsat takto: jsou-li y, z e O s (x), tzn. mimo jiné platí
\y-z\< 28,
je také f(y), f (z) e 0€(f(x)), tzn. mimo jiné platí
\f(y)-f(z)\<2e.
Budeme potřebovat globální variantu takové vlastnosti, říkáme jí stejnoměrná spojitost funkce /:
Věta. Necht je f spojitá funkce na uzavřeném konečném intervalu [a, b]. Pak pro každé číslo e > 0 existuje takové číslo 8 > 0, že pro všechny z, y € [a, b] splňující \y — z\ < 8 platí \ f (y) — f (z)\ < e.
obě (derivovat umíme všechny elementární funkce). Musíme se proto rozhodnout, kterou ze dvou variant metody použijeme (zda budeme integrovat funkci y = x2, nebo y = e~3*). Uvědomme si, že per partes můžeme použít opakovaně a že n-tá derivace polynomu stupně n e N je konstantní polynom. To nám dává způsob, jak lze spočítat
x e
-3x
dx
a dále
x e
-3x
dx
\ x e~3x + 3
F(x) = x2 G'(x) = e -\x2 e~3x + f
F(x) = x G'(x) = e~3x 1 / e"3* dx =
-3x
x e
F'(x) = G(x) =
3xdx
2x
"3 e
F'(x) G(x) :
■ I x e 3x
10-3* '3 e
i p.-3x 9 C
+ C.
Dohromady tak máme
/ x2 e~3x dx -
i x2 e~3x
le-3*
2 —3r
I x e ix
^t~3x + C
3. (x2 + \x + |) + C.
Poznamenejme, že opakované použití per partes v rámci výpočtu jednoho integrálu je běžné (podobně jako při počítání limit 1'Hospitalo-vým pravidlem).
Případ (c). Opět aplikujeme metodu per partes při vyjádření
/ cos2 x dx = f cos x ■ cos x dx
F(x)
cosx
G'(x)
cosx
cos x • sin x + f sin2 x dx
F'(x) = — sinx G(x) = sinx cos x • sin x + / 1 — cos2 x dx = cos x • sin x + f 1 dx — f cos2 x dx = cos x • sin x + x — f cos2 x dx.
Přestože návrat k zadanému integrálu může vyvolat u čtenáře pochyby, ze vztahu
f cos2 x dx = cos x • sin x + x — j cos2 x dx je možné vyvodit
2 j cos2 x dx = cos x • sin x + x + C,
tj-
(6.7)
/
2 1 cos x dx = - (x + sinx • cosx) + C.
Stačí si vzpomenout, že klademe C/2 = C a že neurčitý integrál (jako nekonečnou množinou) lze reprezentovat jednou konkrétní funkcí a jejími posunutími.
Vyzdvihněme, že většinou vhodné úpravy či substituce vedou k výsledku rychleji než metoda per partes. Např. pomocí identity
cos2x = i (1 + cos2x) , x e M
jednodušeji dostaneme
/ cos2 x dx = f \dx + j \ cos 2x dx = | + + C =
x_ _i_ 2 sin x cos x 2 4
+ C = \ (x + sinx • cosx) + C.
365
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
Důkaz. Protože je každý konečný uzavřený interval kompaktní, umíme jej celý pokrýt konečně mnoha okolími 0&(X)(x) zmiňovanými v souvislosti se spojitostí výše, přičemž jejich poloměr 8(x) závisí na středu x, zatímco čísla e budeme uvažovat pořád stejná. Zvolíme konečně za 8 minimum ze všech (konečně mnoha) 8(x). Naše spojitá funkce / tedy má požadovanou vlastnost (pouze zaměňujeme čísla e a á za jejich dvojnásobky). □
6.28. Dokončení důkazu Věty 6.25. Nyní již snadno dokončíme celý důkaz existence Riemannova integrálu. Zvolme si e a á jako v předchozí větě o stejnoměrné spojitosti a uvažujme jakékoliv dělení S s n intervaly a normou nejvýš 8. Pak
V sup /(§) • (x;-x;_i)-V inf /(§) • (xi-Xi-i)
i = \
0 číslo 8 > 0 tak, aby
\f(x + Ax)-f(x)\ <€
pro všechna 0 < Ax < á na celém intervalu [a, b]. Rozdíl derivace naší funkce F (x) a integrované funkce fix) je vyjádřen pomocí limity výrazů
f(t)dt - I f(t)dt 1 - f(x)
1 / rx+^x r* \
- IJ f(t)dt - J f(t)dt)
A
pro Ax jdoucí k nule. Pokud však volíme 0 < Ax < 8, pak v absolutní hodnotě je tento výraz odhadnut
f(t)dt) - f(x) <€,
Ax (/
protože ve výrazu nalevo můžeme libovolně přesně nahradit integrál jeho Riemannovým součtem a ve sčítancích /(§/)(** — x;_i) s i-i e [x, x + Ax] v jakémkoliv Riemannově součtu jsou /(§) vzdáleny od fix) nejvýše o velikost e. Proto nahrazením fix) za všechny /(§/) dostáváme nalevo nulový výraz a dopouštíme se chyby nejvýše e.
To ovšem znamená, že existuje v bodě x derivace funkce F (x) zprava a je rovna fix). Stejně dokážeme výsledek pro derivaci zleva a celá věta 6.25 je dokázaná.
6.29. Důležité poznámky. (1) Věty 6.25 a 6.24 nám říkají, že integrál je lineární zobrazení
/
: C[a,b]
vektorového prostoru spojitých funkcí na intervalu [a, b] do reálných čísel. Je to tedy lineární forma na prostoru C[a, b].
□
6.49. Integrujte
(a) / cos5 x • sin x dx, x e M;
(b) / cos5 x • sin2 x dx, x e M;
«0/ä^ 0.
VJt5+Jt
Řešení. Případ (a). Jde o jednoduchý příklad na tzv. první substituční metodu, jejíž podstatou je zapsat integrál ve tvaru
(6.8)
j f((p(x))(ff(x)dx
pro jisté funkce / a cp. Takový integrál lze totiž pomocí substituce y = (pix) (nahrazujeme rovněž dy = (p1 (x) dx, což dostáváme diferencováním y = (pix)) převést na integrál / fiy)dy. Substitucí y = cos x, kdy je dy = — sin x dx, tak obdržíme
/ cos5 x • sinx dx = — f cos5 x (— sinx) dx = — f y5 dy = -^ + C = -^- + C. Případ (b). Při vyjádření
/ cos5 x • sin2 x dx = f (cos2 x)2 sin2 x • cos x dx =
srn'
x) sin2 x • cos x dx
sin x, která dává
t = sinx | dt = cos x dx |
2{ + ř- + C =
f(\-f)t2dt
1 n • 5
n x 2 sin x
+
+ c.
se nabízí substituce t
f cos5 x • sin2 x dx
fř-2r+rdt = <1 -s . 3 ■--T 5 '3
Případ (c). Neboť je sinus i kosinus v sudé mocnině, nelze postupovat jako v předchozím případě. Zkusme proto použít tzv. druhou substituční metodu znamenající přechod od j f (y) dy ke tvaru (||6.8||) pro y = (pix). Situace, kdy nahrazujeme jednodušší výraz za komplikovanější, může působit překvapivě. Nesmíme však zapomínat, že onen komplikovanější integrál může mít takovou podobu, že jej budeme schopni spočítat. Chceme určit primitivní funkce funkce fix) = tg4 x. Má tedy smysl uvažovat substituci u = tg x. Získáváme
x = arctg u I r ,/ , r 7 , j du = T,—2 du = / u — 1 + t— du =
iia I
tgx + arctg (tgx) + C =
■ dx
l+u1
3 3
\ - u + arctg u + C = %±
^ -tgx+x + C.
Případ (d). Platí
dx
+x
dz
l+z UC
6 .
6z5 dz = f z2
z = x 5 A" — dx
^e^dz
+ 2z - ln I z + 11 + C
2Vx - 6^/x + 12^x - 6 ln (ýx + l) + C,
366
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
(2) Dokázali jsme, že každá spojitá funkce je derivací nějaké funkce. Newtonův a Riemannův integrál tedy jako koncepty pro spojité funkce splývají. Riemannův integrál spojitých funkcí lze proto spočíst pomocí rozdílu hodnot F(b) — F (a) primitivní funkce F.
(3) V prvním kroku důkazu věty 6.25 jsme dokázali důležité tvrzení, že pro omezenou funkci / na intervalu [a, b] vždy existují limity horních součtů i dolních součtů. Říká se jim také horní Riemannův integrál a dolní Riemannův integrál a používá se pro ně
často značení faf(x) dx a fh fix) dx.
Takto lze pro omezené funkce ekvivalentně definovat i Riemannův integrál (jak jsme konečně v důkazu i činili).
(4) V dalším kroku v důkazu jsme odvodili důležitou vlastnost spojitých funkcí, které se říká stejnoměrná spojitost na uzavřeném intervalu [a, b]. Zjevně je každá stejnoměrně spojitá funkce také spojitá, naopak to ale na otevřených intervalech platit nemusí. Příkladem může sloužit třeba funkce fix) = sin(l/x) na intervalu (0, 1).
(5) Uvažme funkci / na intervalu [a,b], která je pouze po částech spojitá. To znamená, že je spojitá ve všech bodech c e [a, b] kroměkonečně mnoha bodů nespojitostici, a < ct < Z?, ve kterých ovšem má konečné jednostranné limity. Vzhledem k aditivnosti integrálu vůči intervalu přes který se integruje, viz 6.24(1), existuje podle poslední věty v takovém případě integrál
Fix)
ľ
Ja
fit)dt
pro všechna x e [a, b] a derivace funkce F (x) existuje ve všech bodech x, ve kterých je / spojitá. Navíc se snadno ověří, že ve zbývajících bodech je funkce F (x) spojitá, je to tedy spojitá funkce na celém intervalu [a,b]. Při výpočtu integrálu pomocí primitivních funkcí je zapotřebí volit její jednotlivé části tak, aby na sebe navazovaly. Pak bude i celý integrál vyčíslen jako rozdíl funkce F (x) v krajních hodnotách.
(6) Lagrangeova věta o střední hodnotě diferencovatelné funkce má analogii, které se říká integrální věta o střední hodnotě. Uvažme funkci fix) spojitou na intervalu [a, b] a její primitivní funkci F (x). Věta o střední hodnotě říká, že existuje vnitřní bod a < c < b takový, že
fix) dx = F(b) - F (a) = F\c)(b - a) = f(c)(b - a).
Toto tvrzení lze vcelku snadno odvodit přímo z definice Rieman-nova integrálu a pak jej je možné přímočaře využít v závěrečném kroku důkazu základní věty integrálního počtu.
6.30. Nevlastní integrály. Při diskusi integrace racionálních lomených funkcí jsme viděli, že bychom rádi pracovali také s určitými integrály přes intervaly, v nichž jsou i body, kde integrovaná funkce fix) má nevlastní (jednostranné) limity. V takovém případě není integrovaná funkce ani spojitá ani omezená a proto pro ni nemusí platit námi odvozené výsledky. Hovoříme o „nevlastním integrálu".
Jednoduchým východiskem je diskutovat v takovém případě určité integrály na menších intervalech s hranicí blížící se problematickému bodu a zkoumat, zda existuje limitní hodnota takovýchto určitých integrálů. Pokud existuje, řekneme, že příslušný nevlastní integrál existuje a je roven této limitě. Uvedeme postup
kde jsme opět substitucí lehce určili (pro z ^ -1)
v = z + l\_ r dv dv = dz
I
dz z+1
Jv=ln|i;| + C = lnU + l|+C.
□
6.50. Kombinací metody per partes a substituční metody určete
(a) / x3 e~*2 dx, x e R;
(b) /xarcsinx2 dx, x e (—1, 1).
Řešení. Případ (a). Substituční metoda vede na integrál
jí I
3
x e
dx
f t é dt,
t = —x dt = —2x dx
který lze snadno vypočítat metodou per partes se ziskem
/ té dt
Fit) = t F'it) = 1
G'it) = é Git) = é
\té-^fé dt
\té
I é + C = -\&~xí (x2 + 1) + C.
Případ (b). Podobně obdržíme
f x arcsin x2 dx = F'it)
t = xL
dt = 2x dx
i
\ f arcsin t dt
n-t2
t arcsin t
f-ř=dt
Fit) = arcsin í G'it) = 1 u = 1 - t2 | _ du = —2t dt |
\t arcsin t + ±Vl - t2 + C = \x2 arcsinx2 + ±Vl - x4 + C.
Git) = t
■t arcsin t + \ f ^ = \t arcsin t + \~Ju + C
□
6.51. Dvěma různými způsoby vypočítejte integrál
/ Vl -x2 dx, x e (-1, 1). Řešení. Metoda per partes dává
/ V1 — x2 dx
x Vl — x2 — f Vl — x2 dx + f J-— dx =
J J Vl-jc2
x Vl — x2 — f Vl — x2 dx + arcsinx,
odkud plyne
tj-
2 f V1 — x2 dx = x Vl — x2 + arcsinx + C,
f V1 — x2 dx = \{x Vl — x2 + arcsinx^ + C.
Substituční metodou pak s pomocí (||6.7||) dostáváme
x = sin y ' dx = cos y dy
f V1 — x2 dx
f y/l — sin2 y ■ cos y dy
f cos2 y dy = ^ (y + sin y ■ cos y) + C = (siny ■ y/l — sin2 y + yj + C = \ (x Vl — x2 + arcsinx^ + C,
367
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
na jednoduchém příkladě:
-f
Jo
dx
#2-
je nevlastní integrál, protože uvedená integrovaná funkce f (x) — (2 — x)-1/4 má v bodě b — 2 limitu zleva rovnou oo. V ostatních bodech je integrovaná funkce spojitá. Zajímáme se proto o integrály
h
Jo -s/2 — x Js
y
-1/4
dy
V/4
"l2
J<5
:23/4 - -á3/4.
Všimněme si, že jsme ve výpočtu substitucí dostali integrál s přepočtenou horní mezí <5 a dolní mezí 2. Otočením mezí do obvyklé polohy jsme do výrazu přidali jedno znaménko minus navíc.
Limita pro <5 -> 0 zprava zjevně existuje a spočítali jsme tedy nevlastní určitý integrál
Jo
dx
V2-
= -23/4. 3
Stejně budeme postupovat, pokud je zadáno integrování přes neohraničený interval. Často v tomto případě hovoříme o nevlastních integrálech 1. druhu, zatímco integrály z neohraničených funkcí na konečných intervalech jsou nevlastní integrály 2. druhu.
Obecně tedy např. pro a € M
-ľ
Ja
rb
f (x) dx — lim / f(x)dx,
pokud limita vpravo existuje. Obdobně můžeme mít horní mez integrování konečnou a druhou nekonečnou. Pokud jsou nekonečné obě, počítáme integrál jako součet dvou integrálů s libovolně pevně zvolenou pevnou mezí uprostřed, tj.
/oo />a />c
f(x) dx — I f(x) dx + I -oo J— co Ja
f(x) dx.
Existence ani hodnota nezávisí na volbě takové meze, protože její změnou pouze o stejnou konečnou hodnotu měníme oba sčítance, ovšem s opačným znaménkem. Naopak limita při které by stejně rychle šla horní i dolní mez do ±oo může vést k odlišným výsledkům! Např.
f
J —í
x dx —
x2
= 0,
přestože hodnoty integrálů x dx s jednou pevnou mezí utečou rychle k nekončených hodnotám.
Při výpočtu určitého integrálu z racionální funkce lomené musíme pečlivě rozdělit zadaný interval podle bodů nespojitosti integrované funkce a spočítat jednotlivé nevlastní integrály každý zvlášť. Navíc je nutné rozdělit celý interval tak, abychom vždy integrovali funkci neohraničenou pouze v okolí jednoho z krajních bodů.
6.31. Přírůstky do ZOO. Z počítaných příkladů se může zdát, jJ* n že je obvyklé najít neurčitý integrál pomocí výrazů složených ze známých elementárních funkcí. To je úplně mylný dojem.
kde y e (—it/2, it/2) pro x e (—1, 1), a mj. tak je
0 < cos y
cos y
cos2 y
sin2 y.
□
6.52. Stanovte
/ dx, x > 0.
Řešení. Touto úlohou lze ilustrovat možnosti kombinování substituční metody a metody per partes (v rámci jednoho příkladu). Nejprve použijeme substituci y = yfx, abychom odstranili odmocninu z argumentu exponenciální funkce. Tím přejdeme k integrálu
/dx
2y dy = dx | ^ / ^ e Nyní pomocí per partes určíme
fyďdy
F(y)--G'(y)
y
F'(y) G(y)~-
1
y ď - fďdy
y ď - ď + C.
Celkem tedy je
/e^dx = 2yey — 2ey + C = 2e^ (Vx" - l) + C.
□
6.53. Dokažte, že
1
2
sin4 x
1 1 3
-- cos(2x) H--cos(4x) H--.
4 16 16
Řešení. Snadnější, než porovnávat dané výrazy přímo, je ukázat, že funkce na pravé a levé straně rovnosti mají shodné derivace. Je totiž
Ľ = 2 cos x sin3 x = sin(2x) sin2 x, P' = isin(2x) + jsin(4x) =
sin2x(i + icos(2x))
sin(2x) sin2 x. Levá a pravá strana se tedy liší o konstantu. Tuto konstantu určíme porovnáním funkčních hodnot v jednom bodě, například bodě 0. Hodnota obou funkcí je v nule nulová, jsou si tedy rovny. □
C. Integrace racionálních lomených funkcí
6.54. Integrujte
(a) j ^.dx, x ^2;
(b) / ^ dx, x ŕ -4;
(c) / ^t7-< dx, x e
(d) f
x2-4x + l5 30x-77
dx, x e
(x2-6x + l3)
Řešení. Případy (a), (b). Platí
f-^dx =
J X—L
a podobně
y = x — 2 dy = dx
fŘydy
61n|y |+C = 61n|x-2|+C
368
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
Naopak, drtivá většina spojitých funkcí vede na integrály, které tak vyjádřit neumíme. A to i když integrujeme funkce docela jednoduché. Protože se integrací získané funkce velice často v praxi vyskytují, mnohé mají jména a před nástupem počítačů byly pro potřeby inženýrů vydávány obsáhlé tabulky hodnot takových funkcí. V dalším textu se ještě budeme vracet k metodám, jak numerické aproximace takových funkcí získávat.
Uvedeme si nyní aspoň nějaké příklady. V metodách pro zpracování signálu je velice důležitá funkce
sin(x) sinc(x) —-.
x
Docela přímočaře, byť pracně, lze ověřit, že jde o hladkou funkci s limitními hodnotami
2
"3"
Je tedy okamžitě vidět, že tato sudá funkce bude mít v bodě x — 0 absolutní maximum a s narůstající absolutní hodnotou x se bude vlnit se stále se zmenšující amplitudou. Funkce Sinusintegrál je definovaná vztahem
ľ
Si (x) — I sinc(f) dt. Jo
Důležité jsou také Fresnelovy sinové a kosinové integrály
FresnelS(x) — I sin(Ajrf2) 2, n e N.
Případ (c). Nyní máme integrovat parciální zlomek odpovídající dvojici komplexně sdružených kořenů. Ve jmenovateli je tedy polynom stupně 2 a v čitateli stupně nejvýše 1. Pokud j e stupně 1, zapíšeme parciální zlomek tak, abychom v čitateli měli násobek derivace jmenovatele a k tomu přičítali zlomek, v jehož čitateli je již pouze konstanta. Takto dostaneme
^í±^ dx = U ^At, dx + 13f- ^
-2_
4jc+15
ln(.
x- - 4x + 15) + 13 /
x-l
2-4jc + 15 dx
(x-2)2 + ll
x2-4x + \5 v-2
ln (x2 - 4x + 15) +
n j
dx
+ 1
y --
dy ln(x2
dx
/ll
ln(x2-4x + 15) + :)fT/^T
4x + 15) + -^arctgj + C
13
yx-
| ln (x2 - 4x + 15) + -j= arctg
x-2
+ c.
Opět můžeme obecně vyjádřit
Ax+B (x-x0)2+a2
dx = ±f
2(x-xp) (x-x0)2+a2
dx + {B + Ax0) /
(x-x0)2+a2
dx
a spočítat
f , 2(x~x20) 2 dx
J (x-x0)2+a2
y =
dy
(x — xo)2 + a2 = 2 (x — xq) dx
dy
y
i
ln | y | + C = ln[(x - x0)2 + a2] + C,
x —xq I
(x-x0)2+a2
dx
aL >> I x-x
dx
+i
1 arctg z + C = 1 arctg
Z -
dz
x^m + c
a I - i r
ěl \ a j
dz z2+l
Ax+B (x-x0)2+a2
dx
ln ((x - x0)2 + a2) + Zfz- arctg x-^ + C,
kde hodnoty A, B, x0 e M, a > 0 jsou libovolné.
Případ (d). Zbývají parciální zlomky pro vícenásobné komplexní kořeny ve tvaru
[(x-x0)2+a2] , , u , ,
které analogicky upravíme na
2(*-*o)
2 [(x_xo)2+a2]
+ (B + Ax0)
[(x-x0)2+a2]
Poté určíme
369
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
a pomocí indukce snadno dovodíme, že pro všechna kladná celá čísla n dává tato funkce hodnotu faktoriálu:
r(n) = (n - 1)!
Následující obrázek ukazuje v logaritmickém měřítku závislé proměnné průběh funkce f(x) = ln(T(x)). Vidíme z něj tedy, jak rychle skutečně roste faktoriál.
Než se pustíme do dalších témat matematické analýzy, uvedeme ještě několik přímých použití pro Riemannův integrál.
6.32. Riemannovsky měřitelné množiny. Sama definice Riema-nova integrálu byla odvozena od představy velikosti plochy v rovině se souřadnicemi x a y ohraničené osou x, hodnotami funkce y = f (x) a hraničními přímkami x = a, x = b. Přitom je plocha nad osou x dána s kladným znaménkem zatímco hodnoty pod osou vedou ke znaménku zápornému. Ve skutečnosti víme zatím pouze, co je to plocha rovnoběžnostěnu určeného dvěma vektory, obecněji ve vektorovém prostoru Rn víme, co je to objem rovnoběžnostěnu. Plochy jiných podmnožin je teprve třeba definovat. Pro některé jednoduché objekty jako třeba mnohoúhelníky je definice dána přirozeně předpokládanými vlastnostmi.
Námi vybudovaný koncept Riemannova integrálu můžeme teď přímo použít k měření „objemu" jednorozměrných podmnožin.
O podmnožině A c M řekneme, že je (riemannovsky) měřitelná, jestliže je funkce x : R -> R
Xa(x)
I 1 jestliže je x € A I 0 jestliže je x ^ A.
riemannovsky integrovatelná, tj. existuje integrál (ať už s konečnou nebo nekonečnou hodnotou)
m(A)
J —c
XA(x)dx.
Funkci xa říkáme charakteristická funkce množiny A, hodnotě m(A) říkáme Riemanovská míra množiny A. Všimněme si, že pro interval A = [a, b] jde vlastně o hodnotu
I Xa(x) dx = / dx = b — a,
J co J a
přesně jak jsme očekávali.
Zároveň má takováto definice „velikosti" očekávanou vlastnost, že míra sjednocení konečně mnoha riemannovsky měřitelných a po dvou disjunktních množin vyjde jako součet. Zejména každá konečná množina A má Riemannovskou míru nulovou.
2(x-x0) [(x-x0)2+a2]
■ dx
y = (x - x0) + a2 I _ * dy
dy = 2 (x — xq) dx I J y"
i
(l-n)y
— + c
(l-n)[(x-x0)2+a2
Kn (x0, a) := /
■ dx
F(x) = t-^-r-r
V ' [(x-x0)2+a2]
G'(x) = 1
[(x-xo)2+a2]
p'(x) — -2n(x~xo)
[(x-X0)2+a2f+l
G (x) = x — xq
-xg
[(x-x0)2+a2
y + 2n f
(x-xpY+a
[(x-xo)2+a
2^21"+!
[(x-xo)2+a
2-w,21"+1
dx
X—XQ
[(x-x0)2+a2
odkud plyne
pr + 2n (Kn (x0, a) - a2 Kn+Í (x0, a)) ,
Kn+l (x0, a) = ± i2^- K„ (x0, a) +
X—XQ
2n [{x-X0ý+a2]' ) >
což zřejmě platí také pro n = 1. Poslední rekurentní formuli ještě doplňme o v případě (c) odvozený integrál
Kx (x0,fl) = iarctg^a + C.
V zadaném příkladu je
30x-n
(x2-6x + l3):
■ dx = 15 f
2x-6
a dále
2x-6
(x2-6x+l3)
■ dx
(jc2_6jc + 13)
x2 - 6x + 13
dx + l3f
(x2-6x + l3)
■ dx
y — -1 ~~ t ij i _ /•
dy = (2x — 6) dx I ^
dy
„2
+ c
1
x2-6x + l3
■ dx = f
+ C,
dx
(x2-6x+13y "" J [(X-3Ý+22}
^(^^1(3,2) + ^ (x_x~2+22) Celkem tak máme
2 (x-3)2+22y
x—3 i 1 x—3
arctg ^ +
8 x2-6x + l3
+ c.
30x-n
(x2-6x+l3):
■ dx
- — 15 _l 11 arrtCT x-~l- 4_ 11 x~3 ~ x2-6x + l3 ^ 16 dIt'L& 2 ^ 8 x2-6x+l3
11 arrtCT i—1 4- 13x-159 , f
16 arctg 2 + %{x2_6x+u) +c.
+ C
□
6.55. Integrujte racionální lomené funkce
(a)/ (c) f (e) f
x5 + \ x(x-\Ý x-4 5x2+6x+3
dx, x 7^ 0, x 7^ 1;
úřx, x e
(x-4)(x-2)(x2+2x+2)
í/x, x 7^ 2, x 7^ 4;
X4 — X3— x + l
2jc+1
(jc2+4jc + 13)2 ^2
úřx, x 7^ 1; ■ dx, iéI;
5jcz-12
dx, x e
jc4-12jc3+62jc2_156jc + 169
Řešení. Všechny zadané integrály budeme počítat takovým způsobem, jakým lze postupovat při integrování racionálních lomených funkcí vždy. Nepoužijeme tedy žádnou specifickou úpravu či substituci. Dokonce rekurentní vzorec pro Kn+\(x0, a), který jsme odvodili v obecné
370
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
Pokud ale vezmeme spočetné sjednocení, taková vlastnost již neplatí. Např. stačí vzít množinu Q všech racionálních čísel jakožto sjednocení jednoprvkových podmnožin. Zatímco každá množina o konečně mnoha bodech má podle naší definice míru nulovou, charakteristická funkce x q není riemannovsky integrovatelná.
Povšimněme si, že horní Riemannův integrál z charakteristické množiny xa odpovídá infimu součtů délek konečně mnoha disjunktních intervalu, kterými umíme pokrýt danou množinu a, zatímco dolní integrál je supremem součtu délek konečně mnoha disjunktních intervalů, které umíme vložit do množiny a. Takto lze postupovat i ve vyšších dimenzích při definici tzv. Jordánovy míry. Pro definici plochy (objemu) ve vícerozměrných prostorech budeme umět použít i přímo koncept Riemannova integrálu, až jej zobecníme do vícerozměrného případu. Nicméně je dobré si už teď povšimnout, že skutečně původní představa o ploše rovinného útvaru uzavřeného výše uvedeným způsobem grafem funkce bude bezezbytku naplněna.
6.33. Střední hodnota funkce. U konečné množiny hodnot j sme zvyklí uvažovat o jejich střední hodnotě a definujeme ji zpravidla jako aritmetický průměr.
Pro riemannovsky integrovatelnou funkci fix) na intervalu (konečném nebo nekonečném) [a, b] je definována její středníhod-nota výrazem
m(f)
= — f
b-a Ja
fix) dx.
Z definice je m(f) výška obdélníka (s orientací podle znaménka) nad intervalem [a, b], který má stejnou plochu jako je plocha mezi osou x a grafem funkce / (x). Platí tedy obecně integrální věta o střední hodnotě
Tvrzení. Je-li fix) riemannovsky integrovatelná reálná funkce na intervalu [a, b], pak existuje číslo m(f), pro které platí
i-b
fix) dx = mif){b — a).
6.34.
/
J a
Délka prostorové křivky. Námi vybudovaný integrál jde také dobře použít pro výpočet délky křivky ve vícerozměrném vektorovém prostoru rn. Pro jednoduchost si to předvedeme na případu křivky v rovině r2 se souřadnicemi x, y. Mějme tedy parametrický popis křivky F : r -* r2,
Fit) = [git), fit)] a představme si ji jako dráhu pohybu. Pro jednoduchost předpokládejme, že funkce fit) a git) mají po částech spojitou derivaci.
Derivací zobrazení Fit) dostaneme hodnoty, které budou odpovídat rychlosti pohybu po takovéto dráze. Proto celková délka křivky (tj. dráha uražená za dobu mezi hodnotami t = a, t = b) bude dána integrálem přes interval [a, b], kde integrovanou funkcí hit) budou právě velikosti vektorů F'(ť). Chceme tedy spočíst délku s rovnou
\(t)dt= [h Jifiť))2 + ig'it))2 dt.
= / h(ť)dt = /
Ja Ja
Ve speciálním případě, kdy křivka je grafem funkce y = fix) mezi body a < b obdžíme pro její délku
= ľ yjl + if'ix))2dx Ja
podobě, použijeme pouze pro x0 = 0, a = 1 (a to také tehdy, když bude n = 0). Dříve uvedenými postupy tak získáváme
(a)
f dx = 2 f -Ar + f +2 f
J x(x-l)1 J x-l J (x-l)2 J (x-l)1
dx
21n|x - 1
x-l (x-l)2
ln I x I + C;
(b)
x-4
dx
i
lQjt+6
dx
5x2+6x+3 10 J 5x2+6x+3
i>(5x2+6x+3)-§/
23 f dx 5 J 5x2+6x+3 dx
10
ln (5x2 + 6x + 3) - f /
dx
5x+3
dt = -j^dx
-Lln(5^+6x+3)-^/^1 ^ln(5x2 + 6x + 3) - ^arctgř + C ± ln (5x2 + 6x + 3) - ^ arctg ^ + C:
(c)
dx_
(x-4)(x-2)(x2+2x+2)
52 J x-4 20 J x-2 ^ 130 J x2+2x+2 UX ~ 52 111 1 X ^ 1
1ln|*-2| + T^2/-^í/x+7/: * ^"
20 2oôln
(x-4Ý
(*-2)13 t = X + 1
dt = dx
130
+ _|_m(x2+2x+2) + _7_y
xl+2x+2,
dx
(x-4)5{x2+2x+2) (1-2)13
130 J (jt + l)2+l
i__7_ r dt
130 J t2 + l ~
1
260
ln
(x-4ý{x2+2x+2) (x-2) 13
(x-4)s(x2+2x+2ý (1-2)13
+ ^arctgř + C
+ 14 arctg (x + 1) + C;
(d)
d t 11 dx ■
x* — xď— x + l
1 1 y dx
i r dx
3 J (x-l)2
1
1 r dx
3 J x2+x + l
3(x-l)
dt
H)
2x+l I V3 I
-T? dx
J3 |
3(x-l)
4 f dx
9 j /„...,n2
+1
1
3(x-ľ) 3V3
-4= arctg t + C
2 r dt J t2+\
^ arctg + C;
3(*-l) 3^3^ t2+l
-__I___?_ Qr„t„ 2x±l
- 3(x-l)
(e)
2x + l
dx = f ■
2x+4
■ dx — 3 f
dx
(jc2+4jc+13)2 dx _
(jc2+4jc + 13)2 J (jc2+4jc + 13)2
ř=x2+4x + 13|_ r á_ f dt = (2x + 4) dx | ~~ ■' t2 J [(x+2)2+9]
— x+2 I
dx _ u — 3 | _
- í
21 J
[m
+i
u du
■ dx
x2+4x + 13
' f (u
du
1
(u2 + l)2
x2+4x + 13
i(iwctgu + \^)+C
i
x2+4x + 13
1 arctg ^f-^—^2— + C
18
18
18 3 6 x2+4x+13 + C'
(f)
371
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
Tentýž výsledek lze intuitivně vidět jako důsledek Pythagorovy věty: pro lineární přírůstek délky křivky As odpovídající přírůstku Ax proměnné x spočteme totiž právě
As = y(Ax)2 + (Ay)2 a to při pohledu přímo na naši definici integrálu znamená
-fj
1 + ( + I dx.
\dx
Naopak základní věta diferenciálního počtu (viz 6.25) ukazuje, že na úrovni diferenciálů takto definovaná veličina délky grafu funkce y — y(x) splňuje
ds — ^l + (y(x))2dx,
přesně dle očekávání.
Jako snadný příklad spočteme délku jednotkové kružnice jako dvojnásobek integrálu funkce y — Vl — x2 v mezích [—1, 1]. Víme již, že musí vyjít číslo 2it, protože jsme takto číslo it definovali.
-Ĺ. i
!/-i7r^
'1 + (i)2dx
-. dx — 2[arcsinx]_
-i VT— jC
Jesthže v předchozím výpočtu budeme počítat s
ryji - (x/r)2
2tt.
■ dx
y
Vr
a meze budou [—r, r], dostaneme substitucí x — rt deku kružnice o poloměru r.
= 2 f .1+ (x/r)2 , dx = 2 í J-ry l-(x/r)2 J_-
: dt
2r[arcsinx]
2tir:
Výsledek samozřejmě známe z elementární geometrie. Nicméně teď se nám z východisek integrálního počtu podařilo dovodit zásadní skutečnost, že je délka kružnice lineárně závislá na jejím průměru 2r. Číslo it je právě poměr, ve kterém se tato závislost realizuje.
6.35. Plochy a objemy. Riemannův integrál můžeme přímo použít na výpočet ploch či objemů útvarů definovaných pomocí grafu funkce.
Jako příklad spočtěme plochu kružnice s poloměrem r. Půlkruh vymezený funkcí ~Jr2 — x2 má plochu, jejíž dvojnásobek a (r) spočteme substitucí x — r sin t, dx — r cos t dt (s využitím výsledku pro h v odstavci 6.22)
r.jt/2
a(r) —2 \ \/r2 - x2 dx = 2r2 / cos2 t dt
/r - rn/A V r2 — x2 dx — 2Ý2 I < -r J-jt/2
2^ jt/2 2
— [cos t sin t + t]_K/2 — 711 ■
Opět stojí za pozornost, že tento dobře známý vzoreček je odvozen z principů integrálního počtu a že kupodivu je plocha kruhu nejen úměrná kvadrátu poloměru, ale zároveň je tento poměr daný opět konstantou it.
5xz-l2
■ dx = f
5x2-12
5/
4 -12x3 +62x2 -156x +169
5 ľ_dx__, r_
J x2-6x + l3 ^ J (x2-6x + l3)2
* +I5f-^^dx + l3f
(x2-6x + l3)2
3Ck"77 dx =
dx
dx
(x-3)2+A dx
(x2-6x + \3)2
- £__
. 2
(x2-6x+\3)2
x2 - 6x + 13
[ix-3)2+4]
dt = \dx\ du = (2x — 6) dx
7 £1+15/$ +
dx
+1
arctg t
15
\t2 + l\
x-3
2 —
f arctg ^
15
-6x + \3
+ f (iarctgř + i^)
15
-6x + l3
+ i|arctg^ + i|
x-3 2
§ arctg ^ + ji arctg x 3
+ c = - + c
+1
15
f arctg
2
x-3
+
x-3
+
x2-6x + l3 13jc —159 8(jc2-6x+13)
13 _
8 (x-3)2+4
+ c.
+ c
□
6.56. Spočítejte
(x-í)2(x2+2x+2)
dx.
x ^ 1.
Řešení. Protože je stupeň polynomu v čitateli nižší než ve jmenovateli, tyto polynomy nemají společný kořen a je zadáno vyjádření jmenovatele ve tvaru součinu kořenových činitelů, známe tvar rozkladu integrované funkce na parciální zlomky
Cx+D
_ _A__|_ B _
(x-l)2(x2+2x+2) ~ x-l (x-1)2 "t" x2+2x+2
pro A, B,C, D s R. Pokud tuto rovnici vynásobíme jmenovatelem levé strany, dostaneme identitu
x =
A (x - 1) (x2 + 2x + 2) + S (x2 + 2x + 2) + (Cx + D) (x - l)2 ,
která má platit pro všechna x el\{l}.Na obou jejích stranách jsou ale polynomy, a tak rovnost musí nastat rovněž pro x = 1. Dosazením této hodnoty ihned obdržíme, že 1 = 5(1 + 2 + 2), tj. B = 1/5.
Mohli bychom volit další reálná (příp. komplexní) čísla a dosazovat je do uvedené rovnice. Nelze však již očekávat, že bychom tím přímo určili další z neznámých (pokud nedosadíme kořen jmenovatele). Raději proto budeme porovnávat koeficienty u stejných mocnin polynomů
+
x - \ (x2 + 2x + 2)
- j x2 + 3 x
2 5'
A (x - 1) (x2 + 2x + 2) + (Cx + D) (x - l)2 = (A + C) x3 + (A - 2C + D) x2 + (C - 2D) x — 2A + D,
372
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
Všimněme si ještě poměru obsahu a obvodu kruhu, tj.
Ttr2 r 2nr 2
Čtverec o stejném obsahu má stranu o velikosti *Jnr a tedy obvod 4v/ŤřV. Obvod čtverce o obsahu jednotkového kruhu je tedy 4V/ŤF, což je o přibližně 0.8 více, než je obvod jednotkového kruhu. Lze dovodit, že ve skutečnosti je kružnice útvarem s nejmenším obvodem mezi všemi se stejným obsahem. K odvozování takových výsledků se dostaneme v našich poznámkách o tzv. variačním počtu v pozdějších kapitolách.
Další obdobou téhož principu je výpočet povrchu nebo objemu rotačního tělesa. Pokud vznikne těleso rotací grafu funkce / kolem osy x v intervalu [a, b], vzniká při přírůstku Ax nárůst plochy o násobek A s délky křivky zadané grafem funkce y — fix) & velikosti kružnice o poloměru fix). Plocha se proto spočte formulí
Mf)
rb pb
= 2x1 fix) ds — 2jt I
Ja Ja
f(x)Jí + (f'(x))2dx,
kde ds je dán přírůstkem délky křivky y — fix), viz výše. Pod-kud bychom rotační těleso zadali jeho hranicí prametrizovanou dvojicí funkcí [x(f), yit)], bude příslušný diferencál tvaru ds — y/ix' (f))2 + (/ (O)2 dt a pro povrch dostaneme
A = 2tt f K0v/(/(0)2 + (x'(0)2 dt.
J a
Objem stejného tělesa naroste při změně Ax o násobek tohoto přírůstku a plochy kružnice o poloměru fix). Proto je dán formulí
Vif)
J a
(f(x))2dx.
Jako příklad užití vzorců pro obsah a objem odvodíme známé formule pro plochu sféry a objem koule o poloměru r.
1 - (x/V)2
\r — 2ti J i
— 2nr j ĺ
Vr — tí j (r2 — x2 ) dx
1
Vi - (x/r)2 = Atc?
: dt
r2,
—x 3
4 ,3
3
Stejně jako u kružnice i koule je objektem, který má mezi všemi s daným objemem ten nejmenší povrch. To je důvod, proč jsou mýdlové bubliny vždy prakticky tohoto tvaru.
6.36. Integrální kriterium konvergence řad. Pomocí nevlastního integrálu také umíme rozhodnout o konvegenci širší třídy nekonečných řad než doposud:
Věta. BuďY2^=i f in) řada taková, že funkce f : M. -> M je kladná a nerostoucí na intervalu (1, oo). Pak tato řada konverguje právě tehdy, když konverguje integrál
f;
f(x)dx.
Důkaz. Pokud interpretujeme integrál, jako plochu pod křiv-^ kou, je kriterium zřejmé.
čímž získáme systém rovnic
0 =
-1/5 =
3/5 =
-2/5 = -
A + C,
A — 2C + D,
C - 2D,
-2A + D.
Podotkněme, že tato soustava musí mít právě jedno řešení (které je jednoznačně určeno libovolnými třemi z uvedených rovnic). Hledané řešení potom je
25 '
C
' 25 '
D
_8_ "25 •
Platí tak
_x_ j _ r dx . r dx
(x-l)2(x2+2x+2) "A J 25(x-l) J 5(x-l)2 J 25{x2+2x+2)
f:
x+8
dx
■ln I x - 1
25 ' 1 5(jc-1) 50
kde jsme využili
ln (x2 + 2x + 2) - ^ arctg (x + 1) + C,
/ x2+2x+2 dx - f x2+2x+\ + x2+2x+2 dx-2.f x^2x+2 dX +
7 / (j+i1)2+i dx = \ ln (x2 + 2x + 2) + 7 arctg (x + 1) + C.
□
6.57. Určete
-3+2x2 x2-x+l
(b) fx^dx,x^±l
(a) / x3t&T' dx> x ^R;
Řešení. Případ (a). Nejdříve musíme provést dělení polynomů
(x3 + 2x2 + x - l) : (x2 - x + l) = x + 3 + 3x~4
x2-x + l '
abychom uvažovali ryze lomenou racionální funkci (stupeň čitatele byl nižší než jmenovatele). Nyní už spočítáme
ľ x3+2x2+x-l J x2-x + l
dx = f x + 3dx + f
3x-4
dx
+ ^x + U^+idx-U
2-x + \ dx_
2 . ~ . 2 , x2_x + l ~ 2 , ,)2 + (#)
— + 3x + | ln (x2 - x + l) - arctg 2^-
+ C.
Případ (b). Platí
f^dx = fldx + ífŽ-1-UŽi-kf& +
1 r V2x-2 7 _ 1 r sI2x+l 7
8 J x2-V2x+l aX 8 J x2+V2x + l aX
x + iln|x-l|-iln|x + l|-i arctg x + f
1 r V2.x+2
x + l
1 „ 1 V2 ľ 2x-s/2
l f _dx
8 J
X
V2
16 J x2-V2x + l V_2 f 2x+j2 7 _ 1 f dx
16 J r2j-./9r-l-1 8 J
dx
V2\2 16 J x2+s/2x + \
x + iln|x-l|-|ln|x + l|-i arctg x +
16
16
ln
ti (x2 - V2x + l) - x arctg (^2x - lj -(x2 + V2x + l) - x arctg (^2x + 1J+C.
□ 373
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
Pokud daná řada diverguje, pak diverguje i řada Y1T=2 /(")• Pro libovolné k e N máme pro k-tý částečný součet ^ (řady bez prvního členu) nerov-
nost
k pk
4 = £/(«)< J
f(x)dx,
neboť s'k je dolním součtem Riemannova integrálu fix) dx. Pak ale je
/>oo f>k
I /(x)dx = lim / /(x)dx > lim s'k = oo
Jl k^ooJi k^oo
a uvažovaný integrál diverguje.
Předpokládeme nyní, že daný integrál konverguje a označme k-tý částečný součet dané řady jako sk. Potom máme nerovnosti
k^oo
fix)áx = lim / /(x)dx < lim sk < 00,
k^oo
neboť Sk je horním součtem Riemannova integrálu f fix) dx a předpokádáme, že daná řada konverguje. □
3. Nekonečné řady
Již jsme se při budování našeho zvířetníku funkcí setkali s mocninnými řadami, které přirozeným způsobem rozšiřují skupinu všech polynomů, viz 5.45. Zároveň jsme si říkali, že takto získáme třídu analytických funkcí, ale nedokazovali jsme tehdy ani to, že jsou mocninné řady spojitými funkcemi. Snadno nyní ukážeme, že tomu tak je a že skutečně umíme mocninné řady i derivovat a integrovat po jednotlivých sčítancích. Právě proto ale také uvidíme, že není možné pomocí mocninných řad získat dostatečně širokou třídu funkcí. Např. nikdy tak nedostaneme jen po částech spojisté periodické funkce, které jsou tak důležité pro modelování a zpracování audio a video signálů.
6.37. Jak ochočené máme řady funkcí? Vraťme se nyní k diskusi limit posloupností funkcí a součtu řad funkcí z pohledu uplatnění postupů diferenciálního a integrálního počtu. Uvažujme tedy konvergentní řadu funkcí
S(x) = £/„(*)
n = \
na intervalu [a, b]. Přirozené dotazy jsou:
• Jsou-li všechny funkce fn(x) spojité v nějakém bodě xo e [a, b], je spojitá i funkce S(x) v bodě xq?
• Jsou-li všechny funkce f„ix) diferencovatelné v nějakém bodě a e [a, b], je v něm diferencovatelná i funkce S(x) a platí vztah y (x) = 2ZZ1 f n W?
• Jsou-li všechny funkce /„ (x) riemannovsky integrovatelné na intervalu [a, b], je integrovatelná i funkce S(x) a platí vztah f* Six)dx = fha f„ix)dxl
Ukážeme si nejprve na příkladech, že odpovědi na všechny tři takto kladené otázky jsou „NE!". Poté ale najdeme jednoduché dodatečné podmínky na konvergenci řady, které naopak platnosti všech tří tvrzení zajistí. Řady funkcí tedy obecně moc zvladatelné nejsou, nicméně si umíme vybrat velikou třídu takových, se kterými se už pracuje velmi dobře. Mezi ně naštěstí budou patřit mocninné řady.
6.58. Vypočtěte
2jt4+2jt2-5jt + l x(x2 —x+l)2
dx,
x ŕ 0.
Řešení. Platí
2jt4+2jt2-5jt + l
x— 6
r 2x*+2xí-5x+l , _ r dx , r x+3 , 1 r
J x{x2-x + lf dX-J x + J x2-x + l ÚX + J
+ 2-f 2X~l
x2-x + l —■ • J (x2_x + i)
In I x I + 2 / x2X_x+l dx + ^f x2_x+l -r 2 j (x2_x+l)2
2 dx dx -
dx
(x2-X + l)2
ln(x2 -x + l) + lf
t = xz - X + 1 dt = (2x — 1) dx
dx j_ L ľ Ě. — 11 ľ
2 J t2 2 J
ln I x I +
dx
H)
[H)2
ln
u du
x -Jx2 — x + 1
dx
2t
88 f 9 J
dx
2x-\
ŕ
■4= dx
du
44 73 ľ _
9 J r..■y , ,n2
[u2+l 44 VŠ /1
= ln ln
x -Jx2 — x + 1
1 Isfi f du "t 3 J u2+l
+ 1
x \Jx2 — X + 1
+ ^ arctg u
2(x2-x + l)
2(x2-x + l)
(iarctgM + i-^T)+C = ln
2x-l 1
x v x2 — x + 1
^ arctg ^ -22f arctg
x2 -22 VI
+
2x-\
2(x2-x + l)
m'
+ c
+1
ln
x -Jx2 — x + 1
f arctg 2^1
l llx-4 3 x2-x + l
+ c.
□
6.59. Integrujte
(a) f jfpc dx, x eR;
(b) f , 3 5 lnA , dx, x > 0, x ^ e.
v ' J x\ď x+x ln2 x—2x '
Řešení. Případ (a). Výhodou výše popsané metody integrování racionálních lomených funkcí je její univerzálnost (umíme díky ní najít primitivní funkce každé racionální lomené funkce). Někdy je však výhodnější použití substituční metody nebo per partes. Např. je
JT^dx
y =xf I dy = 2x dx | \ arctg y + C
ľ dy _ i_ ľ dy
J 2(l+y2) ~ 2 J l+y2
i arctg x2 + C.
Případ (b). Pomocí substituce získáváme integrál racionální lomené funkce
y = ln x I
5 ln x
5 ln x
5y
!■
■dy=f.
dx =
-y+2
y3+y2-2 — ■! y-1 + y2+2y+2
I^ldy
dy = x
dy = 1 dy
dx
(j+i)2+i2
ln I y - 1 I - \ ln (y2 + 2y + 2) + 3 arctg (y + 1) + C = ln I lnx - 1 I - 2-ln(ln2x +21nx + 2) +3arctg(lnx + 1) + C.
□
374
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
Poté se také zamyslíme nad alternativními koncepcemi integrování, které fungují více uspokojivě i pro větší třídy funkcí.
6.38. Příklady ošklivých posloupností. (1) Uvažme nejprve funkce
fn(x) = (sinx)"
na intervalu [0, it]. Hodnoty těchto funkcí budou ve všech bodech 0 < x < it nezáporné a menší než jedna, kromě x — j, kde je hodnota 1. Proto na celém intervalu [0, it] budou bod po bodu tyto funkce konvergovat k funkci
/(*)= lim/n(x)=f? P--echnax/f n^°° II pro x — j.
Zjevně tedy je limita posloupnosti funkcí /„ nespojitou funkcí, ačkoliv jsou všechny funkce f„(x) spojité. Problematický je přitom dokonce vnitřní bod intervalu.
Tentýž jev umíme najít i pro řady funkcí, protože součet je limitou částečných součtů. Stačí tedy v předchozím příkladě vyjádřit /„ jako n-tý částečný součet. Např. fi(x) — sinx, f2(x) — (sinx)2 — sinx, atd. Levý obrázek vykresluje funkce fm(x) pro m — n3, n — 1, ..., 10.
(2) Podívejme se nyní na druhou otázku, tj. na špatně se chovající derivace. Celkem přirozená je idea na podobném principu jako výše sestavit posloupnost funkcí, které budou mít v jednom bodě stále stejnou nenlovou derivaci, ale budou čím dál tím menší, takže bodově dokonvergují k funkci identicky nulové.
Předchozí obrázek napravo vykresluje funkce
/„(x)=x(l-x2)"
na intervalu [—1, 1] pro hodnoty n — m2, m — 1,..., 10. Na první pohled je zjevné, že
lim /„ (x) = 0
a všechny funkce /„ (x) jsou hladké. V bodě x — 0 je jejich derivace
/«(0) — ((1 — x2)" — 2nx2 (1 — x2)"~l)\x=o — 1
nezávisle na n. Limitní funkce pro posloupnost /„ přitom má samozřejmě všude derivaci nulovou!
(3) Protipříklad k třetímu tvrzení jsme už viděli v 6.32. Charakteristickou funkci xq racionálních čísel můžeme vyjádřit jako součet spočetně mnoha funkcí, které budou očíslovány právě racionálními čísly a budou vždy všude nulové, kromě jediného bodu, podle které jsou pojmenovány, kde jsou rovny 1. Riemannovy integrály všech takových funkcí budou nulové, jejich součet ale není riemannovsky inegrovatelnou funkcí.
Pro libovolnou funkci / spojitou a ohraničenou na ohraničeném intervalu (a, b) platí tzv. Newtonův-Leibnizův vzorec
(6.9)
f
f(x)dx = [F(x)Ýa
lim F(x)
x^-b—
lim F(x),
x^a +
kde F'(x) = f(x),x e (a, b). Zdůrazněme, že za uvedených podmínek vždy existuje primitivní funkce F a jako vlastní obě limity v (||6.91|). K výpočtu určitého integrálu nám tedy stačí najít antide-rivaci a určit příslušné jednostranné limity (příp. jen funkční hodnoty, je-li primitivní funkce spojitá v krajních bodech uvažovaného intervalu).
6.60. Určete
(a)/ 1
Jx^+Jx7
dx, x > 0;
x+l
i
(x+4)Yx2+3x-4
dx ^ x ^ 2
dx, x e M\ [-1, 1];
dx, x e (—oo, —4) U (1, +oo);
dx, x e (—1,2); dx, x ^ 1.
(x-l)Yx2+x + l
Řešení. V tomto příkladu budeme ilustrovat použití substituční metody při integrování výrazů s odmocninami. Případ (a). Má-li počítaný integrál tvar
f f(p(Vx~, p(Vx~,..., p(Í/x~) dx
pro jistá čísla p{\), p{2), ..., p{j) e Na racionální lomenou funkci / (více proměnných), doporučuje se substituce t" = x, kde n je (nejmenší) společný násobek čísel pil), ..., pij). Touto substitucí lze totiž převést integrand (integrovanou funkci) na racionální lomenou funkci, kterou umíme integrovat vždy. Dostáváme
dx
v j. ^ x{^J
in f -Ě— -10 [ln f +
dx
'-T-^X^j
10/(}
10ř9 dt = dx
I ř10
dt
2t2 ^ 3f>
,3 1
4r
) dt
ln(l + 0] + C =
± + -L
i
ř+l
ln
10
x i J0___5_ ,__
(1+ \?í)10 + tyl Jí + 3
2jx^
+ c.
Případ (b). Pro integrály
p(Vax +b, p(2Vax+b,
f f (x, p(Vax+b, p<2Vax+b, p{jl/ax + b) dx,
kde opět pil), ..., pij) € N, / je racionální lomený výraz a a, b e R, volíme substituci t" = ax + b při zachování významu n. Takto obdržíme
x+l J3x~+1
dx
ř3 = 3x + 1 dx = t2 dt
—+ 1 ,2
t2 dt = f
f3-1+3
tdt
\jŕ +2tdt = i + t2) + C = —oo). Přitom
/ /„ (x) dx = — Jo n
1/0.
6.39. Stejnoměrná konvergence. Zjevným důvodem neúspěchu ve všech třech předchozích příkladech je skutečnost, že rychlost bodové konvergence hodnot f„(x) -> / (x) se bod od bodu velice liší. Přirozenou myšlenkou tedy je omezit se na takové případy, kdy bude naopak konvergence probíhat přibližně stejně rychle po celém intervalu.
J Stejnoměrná konvergence —
Definice. Říkáme, že posloupnost funkcí /„ (x) konverguje stejnoměrně naintervalu [a, b] khmitě /(x), jestliže pro každé kladné číslo e existuje přirozené číslo N e N takové, že pro všechna n > N a všechna x e [a, b] platí
|/„(x)-/(x)| <€.
O řadě funkcí řekneme, že konverguje stejnoměrně na intervalu, jestliže stejnoměrně konverguje posloupnost jejích částečných součtů.
1
Tedy volba čísla N sice závisí na zvoleném e, je ale nezávislá na bodu x e [a, b]. To je rozdíl od bodové konvergence, kde N závisí na e i x. Graficky si definici můžeme představit tak, že do pásu vzniklého posunutím limitní funkce /(x) na /(x) ± e pro libovolně malé, ale pevně zvolené kladné e, vždy padnou všechny funkce /„ (x), až na konečně mnoho z nich. Tuto vlastnost zjevně neměl první a poslední z předchozích příkladů, u druhého ji postrádala posloupnost derivací /„'.
Následující tři věty lze stručně shrnout tvrzením, že všechna tři obecně neplatná tvrzení v 6.37 platí pro stejnoměrnou konvergenci (pozor ale na jemnosti u derivování).
6.40. Věta. Nechť f„(x) je posloupnost funkcí spojitých na intervalu [a, b], která na tomto intervalu stejnoměrně konverguje k funkci /(x). Pak je také f(x) spojitá funkce na intervalu [a, b].
Důkaz. Chceme ukázat, že pro libovolný pevně zvolený bod xq e [a, b] a jakékoliv pevně zvolené malé e > 0 bude
|/(x)-/(x0)| <€
pro všechna x dostatečně blízká k xq. Z definice stejnoměrné konvergence je pro nějaké e > 0
|/„(x)-/(x)| <€
pro všechna x e [a, b] a všechna dostatečně velká n. Zvolme si tedy nějaké takové n a uvažme S > 0 tak, aby také
\fn(x) ~ fn(xo)\ < e
Případ (c). Dalším zobecněním jsou integrály typu
f ax-\-b p(2)í ax-\-b cx-\-d ' V cx-\-d '
cx+d 1 '
přičemž se navíc požaduje pouze to, aby hodnoty a,b,c,d e R splňovaly nabízející se podmínku ad — bc ^ 0. Při zachování významu uvedených symbolů nyní klademe t" = ffipf. Konkrétně je
1 x + l
dx
t2
-4í2
(ř2+l)(ř2-l)
ln 11 + 1 |
dx = dt
x + l " x-l
P-+1 fi-l
4t
(tl-iy
dt
ž2-! -4i2 '2 + l (ř2-l)2
dt
2 arctg t + C =
ln 11 - 1
ln
lx+x + x
X—l
ln
I x + l _ 1 x-l 1
2arctgJf±} + C.
Úpravy
ln
X—l
ln
ln
I x + l _ 1 x-l 1
ln
/x+l 1 x-l 1
ln
VI x + l |+V| x-l VI x + l |—VI x — l
ln
x+l
x-l
21n (VI* + l| + VI*-l|)-ln2 pro xe(—oo,— 1) U (1, oo) dále umožňují zapsat /\^kdx =21n(VU + l| + VU- 1|) -2arctgyf±f + C. Případy (d), (e), (f). Nyní se zaměříme na integrály
/ / (x, Vax2 + bx + c^j dx,
kde očekáváme a ^ 0 a b2 — 4ac ^ 0 pro jinak libovolná čísla a, b, c s R. Připomeňme, že / je racionální lomený výraz. Rozlišíme dva případy, kdy kvadratický polynom ax2 +bx +c má reálné kořeny a kdy reálné kořeny nemá.
Pokud je a > 0 a polynom ax2 + bx + c má reálné kořeny x\, x2, vyjádříme
V ax2 + bx + c = yíä (x — x\)2 x=p°- = J~a~ \ x
y X X\
a položíme t2
Xl
x-x2
X—X\
\r^- Pokud je a < 0 a polynom ax2 + bx + c má reálné kořeny x\ < x2, vyjádříme
V ax2 + bx + c a zavedeme t2 =
a (x — xi)
2 x2~x
-a (x — xi)
X2-X X—X\
. Pokud polynom ax2 + bx + c nemá reálné
kořeny (nutně musí být a > 0), volíme substituci
V ax2 +bx + c = +~Ja ■ x ± ř
při jakékoli volbě znamének. Poznamenejme, že znaménka samozřejmě volíme tak, abychom dostali co nejjednodušší výraz pro následné integrování. Ve všech uvedených případech potom tyto substituce vedou opět na racionální lomené funkce. Platí tedy
(d)
376
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
pro všechna x z á-okolí xo (to je možné, protože všechny f„(x) jsou spojité). Pak
|/W - /(x0)| < |/(x) - /„ (x)| + |/„(x) - /„(x0)|
+ l/«(xo) - /(*o)| < 3e
pro všechna x z námi zvoleného á-okolí bodu xo. □
6.41. Věta. Nechť fn (x) je posloupnost riemannovsky integrova-telných funkcí na konečném intervalu [a, b], které na tomto intervalu stejnoměrně konvergují k funkci /(x). Pak také /(x) je riemannovsky integrovatelná
a platí
lim / f„(x) dx — I ( lim f„(x))dx— I f(x)dx.
n^°°Ja Ja \n^oo ) Ja
Důkaz této věty se opírá o zobecnění vlastností Cauchyov-ských posloupností čísel na stejnoměrnou konvergenci funkcí. Tímto způsobem umíme pracovat s existencí limity posloupnosti integrálů, aniž bychom ji potřebovali znát.
Stejnoměrně Cauchyovské posloupnosti
Definice. Řekneme, že posloupnost funkcí f„(x) na intervalu [a, b] je stejnoměrně Cauchyovská, jestliže pro každé (malé) kladné číslo e existuje (velké) přirozené číslo N takové, že pro všechna x e [a, b] a všechna n >N platí
l/«(x) - fm(x)\ < e.
Zřejmě je každá stejnoměrně konvergentní posloupnost funkcí na intervalu [a, b] také stejnoměrně Cauchyovská na temže intervalu, stačí si povšimnout obvyklého odhadu
l/„(x) - fm(x)\ < |/„(x) - /(x)| + |/(x) - /m(x)|
založeného na trojúhelníkové nerovnosti.
Toto pozorování nám už stačí k důkazu naší věty, zastavíme se ale napřed u užitečného obráceného tvrzení:
Tvrzení. Každá stejnoměrně Cauchyovská posloupnost funkcí fn(x) na intervalu [a, b] stejnoměrně konverguje k nějaké funkci f na tomto intervalu.
Důkaz. Z podmínky Cauchyovskosti posloupnosti funkcí vyplývá, že také pro každý bod x e [a, b] je posloupnost hodnot f„(x) Cauchyovskou posloupností reálných (případně komplexních) čísel. Bodově tedy nutně konverguje posloupnost funkcí f„ (x) k nějaké funkci / (x).
Ukážeme, že ve skutečnosti konverguje posloupnost /„ (x) ke své limitě stejnoměrně. Zvolme N tak velké, aby
l/«(x) - fm(x)\ < e
pro nějaké předem zvolené malé kladné e a všechna n > N, x e [a, b]. Nyní zvolíme pevně jedno takové n a odhadneme
l/«(x) - /(x)| = lim |/„(x) - /m(x)| < e
pro všechna x e [a, b]. □
Důkaz Věty. Připomeňme, že každá stejnoměrně konvergentní posloupnost funkcí je také stejnoměrně Cauchyovská a že
dx
f-
dx
(e)
(f)
(x+4)7*2+3*-4 J (*+4)V(*-l)(*+4) ,2 _ x-1
f
dx
X
dx
x+4
-J__4
d-t2)2 dt
f
■dt = f
5 l-t2 ' dt
sgn(l-ř2)/lí/ř = fsgn(^)ř + C fsgn(x)7|l + C;
dx
l+^-x2+x+2 J2 _ 2-x
f
dx
l+V-(*-2)(*+l)
dx
1 + +
x+1
X
dx
t2+i
-6t (í2+l):
1
dt
-6t ?+l
(í2+1)2 t2+3t+l
dt
-6t
■ dt
(t2+l)(t2+3t+l) 4 VŠ 2 4 VŠ
5 2í+3+VŠ t2 + l 5_2í-3+V5,
dt
2VŠ
5
2VŠ
ln
ln
2t + 3 + VŠ
-2t - 3 + VŠ
-Min
2 arctg t +
+ C =
2 arctg 7^ +
-2ViŤT-3 + Vš
+ c
2V5 ln2VfeT+3-^
5 ~ /2—x
+3+V5
2 arctg J + C;
dx
(x-l)^x2+x + l
Vx2 + X + 1 = X + t x2 + x + 1 = x2 + 2xŕ + t2
dx
-2p2-t+l)
2t-1 -2(ŕ2-f+l) (2t-1)2
dt
f_Qľľí_dt - f_?-_
J t2+2í-2 ,2_,+i ai — J t2+2t-2 2í-1 2í-1
f (VI 1 _ VI 1 \
J V 3 í+1-73 3 Í+1+V3/
dt
dt --
V3
ln
t + 1- V3
V3
ln
t + 1 + V3
+ C
f ln
ž+l-VŠ ŕ+l+VŠ
V3 1
v/*2+jc + l-jc + l-V3
+ C = ^ ln ■ _j-
J V*2+jc + l-jc + l+V3
+ C.
□
6.61. Pomoci vhodné substituce spočítejte
dx
dx, x e (-00, ^f^) U +00) .
r+V^+x —1
Řešení. Přestože kvadratický polynom pod odmocninou má reálné kořeny x\, x2, nebudeme příklad řešit pomocí substituce ŕ2 = ^5^-Sice bychom tak postupovat mohli, ale raději použijeme metodu, kterou jsme zavedU pro případ komplexních kořenů. Tato metoda totiž dává velmi jednoduchý integrál racionální lomené funkce, jak vidíme z výpočtu
377
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
Riemannovy součty pro jednotlivé členy naší posloupnosti konvergují k fa f n (x) dx nezávisle na výběru dělení a reprezentantů. Proto, jestliže platí
\fn(x) ~ fm(x)\ < e
pro všechna x e [a, b], pak také
pb ŕb / /„ (x) dx -
Ja Ja
f m ix) dx
< e\b-
Je tedy posloupnost čísel f„ (x) dx Cauchyovská a proto konvergentní. Současně ale také díky stejnoměrné konvergenci posloupnosti /„ (x) platí pro limitní funkci fix) ze stejného důvodu, že její Riemannovy součty jsou libovolně blízké Riemannovým součtům pro funkce /„ s dostatečně velkým n a limitní funkce fix) bude tedy opět integrovatelná. Zároveň
fb cb
/ f n (x) dx -Ja Ja
fix) dx
< e\b-
a musí proto jít o správnou Umitní hodnotu.
□
Pro příslušný výsledek o derivacích je třeba zvýšené pozornosti ohledně předpokladů:
6.42. Věta. Nechť fn (x) je posloupnost funkcí diferencovatelných na intervalu [a, b], a předpokládejme fnixo) —>• f(xo) v nějakém bodě xq e [a, b]. Dále nechť jsou všechny derivace g„ix) — f'nix) spojité a nechť konvergují na temže intervalu stejnoměrně k funkci g(x). Pak je také funkce fix) — f git) dt diferencovatelná na intervalu [a, b], funkce fn(x) konvergují k fix) a platí fix) — g(x).
Důkaz. Jesthže budeme místo fnix) uvažovat funkce f„(x) — fnix) — fnixo), budou předpoklady i závěry ve větě platné nebo neplatné pro obě posloupnosti zároveň. Bez újmy na obecnosti můžeme proto předpokládat, že všechny naše funkce splňují fnixo) — 0. Pak ovšem můžeme psát pro všechny x € [a, b]
fnix)
í 8n
Jx0
(ř) dt.
Protože ale funkce g„ stejnoměrně konvergují k funkci g na celém [a, b], konvergují funkce /„ (x) k funkci
f(x)
f git)dt.
Jx0
Protože je funkce g coby stejnoměrná limita spojitých funkcí opět spojitou funkcí, dokázali jsme vše potřebné, viz Věta 6.24 o Rie-mannově integrálu a primitivní funkci. □
Pro nekonečné řady můžeme předchozí výsledky shrnout takto:
6.43. Důsledek. Uvažme funkce f„ (x) na intervalu [a, b]. (1) Jsou-li všechny funkce f„ (x) spojité na [a, b] a řada
«=i
konverguje stejnoměrně k funkci S(x), je i funkce S(x) spojitá na [a, b].
dx
:+jx2+x-l
\/x2 + X — 1 = X + t
x2 + x - 1 = x2 + 2xř + t2
dx
l-2ř -2t2 +2t+2 (\-2t)2
-2Í2 +2t+2 (ř+2)(l-2ř)
dt
dt
l(l-lk-\l-T)dt=t-2^\t+2\-Mt-\\ +
(V*2 + x - 1 - X + 2) -
C
21n
ln
1
+ C.
\/x2 + x
Dodejme, že každou doporučenou substituci (viz dříve uvedené příklady) lze ve většině konkrétních úloh nahradit jinou substitucí, která umožní dospět k výsledku výrazně snazším způsobem. Nespornou výhodou doporučených substitucí však je univerzálnost: jejich zavedením lze vypočítat všechny integrály příslušných typů. □ Další metody integrování naleznete na straně 396
D. Určité integrály
6.62. Vyčíslete určité integrály
ZL ZL 3 4
ľ tg2 x dx, ľ -^r- dx.
J <-> J COSz X
Řešení. Pro x 7^ | + kjt, kde k e Z, je
/ tg2 x dx = tg x — x + C, jak jsme vypočítali dříve. Odsud vyplývá, že
'jtfxdx = [tgx-xYj; = 73 - I - (-L _ f) = 2. _ f.
ji/6
Určité integrály lze pochopitelně počítat také přímo. Substituce y = tg x kupř. dává
jt/3
jt/3
f tg2xdx = f
■ dx
jt/6
V3
jt/6 V3
y = tg x; dy
■2 t"2 x
sin x
í+tg2*
dx ;os2 x - J_
~ l+y2
I \r^dy= I l-T+^dy = [y-^ctsy]fJv3 = f3
6 •
1/V3 í/Vš Pouze je třeba nezapomenout změnit při substituci meze integrálu na hodnoty získané dosazením V3 = tg (tt/3), l/VŠ = tg (tt/6).
Druhý integrál vyčíslíme metodou per partes pro určitý integrál. (Poznamenejme, že primitivní funkce funkce y = x cos-2 x jsme také stanovili již dříve.) Platí
71 / A
í
J COS2 j
dx
F(x) = x G'ix) =
F'(x) = 1 G(x) =tgx
/4 71/4 /4 71/4
[xtgxjp - / tgxúřx = [xtgxjp + / =^dx
[xtgx] nJA + [ln(cosx)]p
jt/4
0
zl _|_ in v_ 4 -r m 2
COS X
ji—2 ln 2
□
378
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
(2) Jsou-li všechny funkce fn (x) spojitě diferencovatelné na intervalu [a, b], řada S(x) — 2~2n=i fn(x) konverguje pro nějaké xq € [a,b] a řada T(x) — 2~2n=i ZiíW konverguje stejnoměrně na [a, b], pak také řada S(x) konverguje a je spojitě diferencovatelná na [a, b] a platí & (x) = T(x), tj.
■n = \ ' n = \
(3) Jsou-li všechny funkce fn(x) riemannovsky integrovatelné na [a, b] a řada
S(x) = £/„(*)
n = \
konverguje stejnoměrně k funkci S(x) na [a, b], je tamtéž in-tegrovatelná i funkce S(x) a platí vztah
/ (^2 fn(x)j dx — I fn (x) dx.
6.44. Test stejnoměrné konvergence. Nejjednodušším způsobem pro zjištění stejnoměrné konvergence posloupnosti funkcí je porovnání s absolutní konvergencí vhodné posloupnosti čísel. Říkává "''^ se tomu často Weierstrassův test. Předpokládejme tedy, že máme řadu funkcí /„ (x) na intervalu / — [a, b] a že navíc známe odhad
\fn(x)\ m dostáváme
\Sk(x) - Sm{x)\ — ^2 fn(x) < £ l/«(X)l - £ ak' n=m + l n=m+l n=m + l
Pokud je řada (nezáporných) konstant YlnĹi a« konvergentní, pak bude samozřejmě posloupnost jejích částečných součtů Caychyov-ská. Právě jsme ale spočetli, že v takovém případě bude posloupnost částečných součtů s„ (x) stejnoměrně Caychyovská.
Díky tvrzení dokázanému před chvílí v 6.41 jsme tedy právě dokázali následující
Věta (Weierstrassův test). Nechť fn (x) je posloupnost funkcí definovaných na intervalu [a, b] a platí | /„ (x) | < an e M.
Je-li řada čísel YlnĹi fl« konvergentní, pak řada S(x) — YľŽĹi fn(x) konverguje stejnoměrně.
6.45. Důsledky pro mocninné řady. Weistrassův test je velice užitečný pro diskusi mocninných řad
S(x) = ^2an(x - x0)"
«=0
se středem v bodě xq.
6.63. Vyčíslete určité integrály
(a) fo
n-x2
2 1
1 ,/Í2
dx; dx:
w n (
Řešení. Platí (a)
x2-l
ex i 1 e2x _)_3 cos2 x
^ dx;
x2-l
z = x + Vx2 - 1
'^j^dx
dz
[ln z]
2+V3
ln
(2 + V3);
(c)
1 / 1 \ 1 1 1
/ ( + ^7 )dx = f dx + f dx
o
p = ex dp = ex dx
tgl
V3
f-^dp + ltgx]1^ \j
ds
p2+3 P
1 dp
V3
3 1 (*) + 1
dp +
e/V3
/
1/V3
3 [arctgí]^ + tg 1 = f (arctg ^ - f) + tg 1;
□
6.64. Dokažte, že platí
V2
vi < r
20 - J vT+I
úřx < ^j.
Řešení. Neboť
/l+jc
< Xy
x e [0, 1],
z geometrického významu určitého integrálu plyne
20
/ 4s dx < j -7= dx < f x9 dx
o o
10 ■
□
6.65. Bez symbolů derivace a integrace vyjádřete
/ ř5 ln (ř + 1) dt
x e (-1, 1),
je-li derivováno podle x.
Řešení. O integrování se často hovoří jako o inverzní operaci k derivování. V tomto příkladu této „inverznosti" využijeme. Funkce
379
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
Při našem prvním setkání s mocninnými řadami jsme ukázali eSx,. v 5.48, že každá taková řada konverguje na (xo — 8, xo + <5), kde tzv. poloměr konvergence 8 > 0 může být také nula nebo oo. (viz také 5.52). Zejménajsme v důkazu věty 5.48 pro ověření konvergence řady S(x) používali srovnání s vhodnou geometrickou posloupností. Podle Weistrassova testuje proto řada S(x) stejnoměrně konvergentní na každém kompaktním (tj. konečném) intervalu [a,b] uvnitř intervalu (xo — 8, xo + 8). Dokázali jsme tedy
Věta. Každá mocninná řada S(x) je ve všech bodech uvnitř svého intervalu konvergence spojitá a spojitě diferencovatelná. Funkce S(x) je také integrovatelná a derivování i integrování lze provádět člen po členu.
Ve skutečnosti platí také tzv. Ábelova věta, která říká, že mocninné řady jsou spojité i v hraničních bodech svého definičního oboru (včetně případných nekonečných limit). Tu zde nedokazujeme.
Právě dokázané příjemné vlastnosti mocninných řad zároveň poukazují na hranice jejich použitelnosti při modelování závislostí nějakých praktických jevů nebo procesů. Zejména není možné pomocí mocninných řad dobře modelovat po částech spojité funkce. Jak uvidíme v zápětí, je možné pro konkrétněji vymezené potřeby nacházet lepší sady funkcí /„ (x) než jsou hodnoty /„ (x) = x". Nejznámějšími příklady jsou Fourierovy řady a tzv. wawelety, které přibolížíme v další kapitole.
6.46. Laurentovy řady. V kontextu Taylorových rozvojů se ještě podívejme na hladkou funkci f(x) = e~l/x z odstavce 6.6. Viděli jsme, že není analytická v nule, protože tam má všechny derivace nulové. Takže zatímco ve všech ostatních bodech xo je tato funkce dána konvergentní Taylorovou řadou s poloměrem konvergence r = \x$\, v počátku řada konverguje jen v jediném bodě.
Pokud ale do mocninné řady pro ex dosadíme za x výraz — 1/x2, dostaneme řadu funkcí
oo 1
S(x) = Yi-(-l)nx-2»
= E
(_1)M
x2".
«=o
která bude konvergovat ve všech bodech x / 0 a dává nám dobrý popis pro chování kolem výjimečného bodu x = 0. Podbízí se proto uvažovat následující obecnější řady docela podobné mocninným:
j Laurantovy řady l^....———_
F(x) := ft5 ln(ř + 1) dt, x e (-1, 1)
o
je očividně antiderivací funkce f(x) := x5 ln(x + 1) na intervalu (—1, 1), tj. jejím derivováním dostaneme právě /. Platí tedy
Řadu funkcí tvaru
/ ŕ ln (ř + 1) dt
j ŕ ln (ř + 1) dt
-x5 ln (x + 1)
□
E. Nevlastní integrály
6.66. Rozhodněte, zda
+0o
í s*ä£ dx e R.
J xjx
1
Řešení. Nevlastní integrál udává obsah obrazce mezi grafem kladné funkce
y = SEfc x > 1
a osou x (zlévaje obrazec ohraničen přímkou x = 1). Integrál je proto kladným reálným číslem, neboje roven +oo. Víme, že
f < arctgx < f, x e [1, +oo).
Odsud ovšem dostáváme
+00 +00 +00
I = I / x-2 dx < f SJfc dx < § / X-2 dx = TI,
1 1 1
tj. zvláště
S(x) = E an(x - x0)"
+oo
f dx e
□
Vzorec (||6.9||) lze použít také tehdy, když je funkce / neohraničená nebo interval (a, b) je neohraničený. Mluvíme o tzv. nevlastních integrálech. Pro nevlastní integrály však limity na pravé straně mohou být nevlastní, příp. nemusejí vůbec existovat. Pokud jedna z limit neexistuje nebo obdržíme výraz oo — oo, znamená to, že integrál neexistuje (oo — oo tedy v tomto případě nemá charakter neurčitého výrazu). Říkáme, že integrál osciluje. V každém jiném případě máme výsledek (připomeňme, že oo + oo = +oo, —oo — oo = —oo, ±oo + a = ±oo pro a e R).
nazýváme Laurentova řada se středem v xo. Řadu nazveme konvergentní, jestliže konvergují samostatně její části s kladnými a zápornými exponenty.
I
Smysl Laurentových řad je dobře viditelný u racionálních funkcí lomených. Uvažme takovou funkci S(x) = f(x)/g(x) s nesoudělnými polynomy f aga uvažme kořen xo polynomu g (x). Jeli násobnost tohoto kořenu s, pak vynásobením dostaneme funkci
6.67. Určete
oo
(a) / sin x dx;
(b) /
dx x4+x2
380
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
S (x) — S(x)(x — xqY, která už bude na nějakém okolí bodu xo analytická a proto můžeme psát
Cl—S Cl—l
S(x) =
(x - x0)s
oo
£^ a„(x
x0
+ cio + cii(x — xo) +
xo)".
Uvažujme nyní odděleně části
S(x) — S- + S+ — an (x — xq)" + an (x — xo)".
«=0
Pro řadu víme z Věty 5.48, že její poloměr konvergence R je dán rovností
R-
limsup \7\an\.
Když však aplikujeme tutéž úvahu na řadu S- s dosazenými hodnotami 1/x za x, zjistíme, že řada S- (x) konverguje pro |x — xo | > r, kde
r~l — lim sup {Í\ci-n\.
Tyto úvahy platí bezezbytku i pro komplexní hodnoty x dosazované do našich výrazů.
Věta. Laurentova řada S(x) se středem xq konverguje pro všechna x € C splňující r < |x — xq| < R a diverguje pro všechna x splňující |x — xol < r nebo \x — xq\ > R.
Vidíme tedy, že Laurentova řada nemusí konvergovat ve vůbec žádném bodě, protože klidně můžeme dospět k hodnotám R < r. Podíváme-li se ale např. na výše uvedený případ racionálních funkcí lomenných rozvíjených do Laurentovy řady v některém z kořenů jmenovatele, pak zjevně je r — 0 a tedy, dle očekávání, bude konvergovat skutečně na prestencovém okolí tohoto bodu xo, zatímco R bude v tomto případě dáno právě vzdáleností k dalšímu nejbližšímu kořenu jmenovatele. V případě našeho prvního příkladu, funkce &~l^x je r — 0 a R — oo.
6.47. Numerická přiblížení integrace. Podobně jako na konci přechozí části textu (viz odstavec 6.17), nyní využi-jeme Taylorova rozvoje k návrhu co nejlepších a zároveň jednoduchých aproximací integrace. Budeme pracovat s integrálem / — f% f(x)dx analytické funkce fix) a rovnoměrným dělením intervalu [a, b] pomocí bodů a — xq, x\, ..., xn — b se vzdálenostmi x; — x;_i — h > 0. Body uprostřed intervalů v děleních si označíme x;+i/2, hodnoty naší funkce v bodech dělení budeme psát jako /(x;) — f.
Příspěvek jednoho dílku dělení k integrálu spočteme pomocí Taylorova rozvoje a předchozí věty. Záměrně přitom integrujeme symetricky kolem středových hodnot, aby se nám při procesu integrace vzájemně vyrušily derivace lichých stupňů:
fh/2
/ fiXi + l/2 ■ J-i
t)dt
-A/2
00 / /-A/2 1 \
k=0\J-h/2k\ J
00 h2k+l
= zZ WmTrv_f(2k)(Xi+1/2)-
k=0
(d) / %
Řešení. Případ (a). Ihned stanovíme
f sinxúřx =[—cosx]^°= lim (—cosx) + cos 1.
Protože limita na pravé straně neexistuje, uvažovaný integrál osciluje. Případy (b), (c). Stejně lehce vypočítáme
dx x4+x2
dx
2(x2 + l)
f T?- Thdx = [-Lx-wc^x\\
Um (-i - arctgx) + \ + arctg l=0-| + l + f = l- f a ještě snazší pak je
/* = [2^]0 = 4-0 = 4,
o
kde je primitivní funkce v počátku spojitá zprava (uvažovaná limita je tak rovna funkční hodnotě).
Případ (d). Kdybychom bezmyšlenkovitě vypočítali
/£ = [4]-i = -l-l = -2.
-i
obdrželi bychom zjevně chybný výsledek (zápornou hodnotu při integrování kladné funkce). Důvodem, proč Newtonův-Leibnizův vzorec nejde takto aplikovat, je nespojitost uvažované funkce v počátku. Využijeme-li však tzv. pravidla návaznosti
b c b
f fix)dx = f fix)dx + f fix)dx,
a a c
které platí vždy, když mají integrály na pravé straně smysl, nalezneme správný výsledek
lim - 1 - 1 - lim = oo - 2 + oo = +oo.
x^O- V x/ x^0+ V x/
Podotkněme, že ze sudosti funkce y = x~2 také plyne
/•^=2/^=2.oo = +oo.
-i o
6.68. Vyčíslete určité integrály
□
00/c
oo i
0 (x+2ý
dx;
(b) f_2 ln | x | dx;
(d) f_x ^ dx;
(e) ŕ —p— dx.
K ' JI xmx
Řešení. Platí (a)
381
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
Velmi jednoduchým numerickým přiblížením integrace na jednom dílku dělení je tzv. lichoběžníkové pravidlo, které pro aproximaci využívá plochu lichoběžníka určeného body [xí, 0], [xí, f i], [0, xi+i\, [xi+í, fi+i\. Tato plocha je
Pi = \(fi+fi+i)h a celkem tedy integrál I odhadujeme hodnotou
n~ ^ h
/uch = Pi = 2(/o+2/1 + ■ ■ ■+2/n-1 + fn)-
i=0
Srovnáme nyní 7i;ch s přesnou hodnotou I spočtenou pomocí příspěvků po jednotlivých dílcích dělení. Hodnoty f i můžeme vyjádřit pomocí prostředních hodnot a derivací //+i/2 takt°:
h , h2 „
/Í + l/2±l/2 = fi + l/2 ± 2^ + 1/2 + 2~Ť22^ ^ + l/T>
h3
±3!23/(3)(ř' + 1/2) + ---' takže pro příspěvek P; do odhadu dostáváme
Pi = \(fi + fi+Úh = h(fi+l/2 + ^/"(« + 1/2)) + 0(h5). Odtud dostáváme odhad chyby I — 7iicn na jednom dílku dělení
h^ ... . h2
24-
At = h(fi+l/2 + -f!'+l/2 - fi+l/2 - Tff'+1/2 + 0(h4))
h3 12'
Celková chyba tedy je odhadnuta jako
/ " /lieh = ^"h3f" + n O^5) = ^2(-b- a)h2f" + °(/í4)
kde /" vyjadřuje odhad pro druhou derivaci /.
Pokud nám lineární aproximace funkce po jednotlivých dílcích nestačí, dalším pokusem může být aproximace kvadratickým polynomem. K tomu ale budeme potřebovat vždy tři body, takže budeme pracovat s dílky dělení po dvou. Předpokládejme tedy že « = 2ma uvažujme x; s lichými indexy. Budeme požadovat
fi+1 = f(Xi +h) = fi+ah+ fJh2
fi-l = f(xi-h) = fi-ah+fJh2
což dává (viz podobnost s diferencí pro aproximaci druhé derivace)
č = ^"2 (/* + ! +/*-!-2/})-
Plocha přibližného vyjádření integrálu na dvou dílcích dělení mezi Xi-i a Xi+i je nyní odhadnuta výrazem
P = í fi + at + pt2 dt = 2hfi + l/3h3
J-h i
= 2hfi + ^-(fi+1 + fi-1-2fi) 6
= j(4fi+i + fi-i-2fi).
Tomuto postupu se říká Simpsonovo pravidlo. Celý integrál je nyní přiblížen výrazem
/simp = ^A(/0 + /2n+4 fk + 2 E /*)■
liché k sudé k
(b)
/(iw = -H(- + 2)-x =
o
+2)"4"2"4) = -Ho - b) = h
2 0 2 2
/ ln | x | dx = f ln | x \ dx + f ln | x \ dx = 2 f ln x dx
-2-2 0 0
F(x) = lnx F'(x) = \
G'(x) = 1 G(x) = x
2 í [x lnx]2, — / 1 dx
v-/ - - v, \ 0 /
2 ([x lnx]2 - [x]2) = 2 ^21n2 - lim (x lnx) -2 + 0^ = 41n2 - 4;
(c)
J s/X
2Jx | 1
-2 (lim e"ř - e"1) = 2-\
(d)
fl£dx = -1 du
-1
f uď du =
—oo
-i
[«e"]lL- / —oo
u = 1/x I
= — f uď du
F(u) = u F'(u) = 1
G'(u) = ď G(u) = ď
-1
-OO
[e"]!1
-oo
--— lim we"-- + lim e" = --;
e u^>— oo e u^>— oo e
(e)
J x ln x
^* — lil I C dr n i ln
* = =jf- = Dnr]° =
i jc I 0
ln (ln2) — lim lnr = ln (ln2) + oo = +oo.
ln2
iln2
□
6.69. Vypočítejte nevlastní integrály
oo oo
/ x2 e~x dx; f
0 -oo
dx
Řešení. Protože je nevlastní integrál speciálním případem určitého integrálu, máme k dispozici základní metody, jak jej můžeme počítat. Metodou per partes získáváme
f x2 e x dx o
[-x2 e~x]Q +2 f xe~x dx
F(x) = x2 G'(x) = ďx
F(x) = x
G'(x)
F'(x) = 2x G(x) = -e"
' F'(x) = 1 G(x) = -e"
- lim 4 + 2 \-x e"*lľ° + 2 f e~x dx =
x^oo e L o
0 - 2 lim 4+2 \-ďx]™ = 0 + 2 ( lim -e~x + l) = 2.
Substituční metoda potom dává
382
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
Obdobným postupem jako výše odvodíme, že celková chyba je odhadnuta výrazem
imp
-^(b-a)h4f(4) +0(h5),
kde /(4) představuje odhad pro čtvrtou derivaci funkce /.
Závěrem této kapitoly se zastavíme u dalších konceptů integrace. Jako první uvedeme modifikaci Riemannova integrálu, která bude později užitečná v úvahách o pravděpodobnosti a statistice. Ve výkladu vesměs už ale zůstaneme spíše v rovině poznámek a postřehů, zájemce o podrobný výklad bude muset vyhledat jiné zdroje.
6.48. Riemann-Stieltjesův integrál. Při naší představě o integraci jakožto sčítání nekonečně mnoha linearizovaných (nekonečně) malých přírůstků do plochy zadané funkcí f(x) jsme pominuli možnost, že bychom pro různé hodnoty x brali přírůstky různě vážně. To by jistě mohlo být na infinitesimální úrovni zajištěno záměnou diferenciálu dx za q>(x)dx pro nějakou vhodnou funkci 0 existuje norma dělení S > 0 taková, že pro všechna dělení S s normou menší než <5 platí
\S3-I\<€.
Např., jestliže zvolíme na intervalu [0, 1] za g(x) po částech konstantní funkci s konečně mnoha body nespojitosti c\,..., ck a „skoky"
cti — lim g(x) - lim g(x)
x—y c i _|_ x—y —
pak Riemann-Stieltjesův integrál existuje pro každou spojitou f(x) a je roven
ľ\ k l= \ f(x)dg(x) = Y2aif(ck). Jo r—!
I
dx
ex+e
y
—ca
[arctgy]^ = lim arctgy = §
I = f dy dy = ex dx I J y2+1
kde nové meze integrálu plynou z limit
lim ex = 0, lim ex = +oo.
□
6.70. Spočtěte
2n+l
dx,
n e N.
Řešení. Příklad řešme nejprve substituční metodou a následně opakovaně aplikujme per partes se ziskem
f*
o
2n + l
dx
dy = 2x dx I 2 f ^ 6 ^
F(y) = f G'(y) = e-
F'(y) = nf~ G(y) = -e"
[-/ e~y]^ +nf f-1 e-ydy\ = \ f f-1 e~y dy
F(y) = f~ G'(y) = e"
F'(y) = (n- l)ý G(y) = -e">
ft-2
I [_y.-i e-y]~ + („-!)/ f~2 e"> dy
e-ydy = ... = "C-D-2 jTye-y dy
F(y) = y G'(y) = e"
F'(y) = 1 G (y) = -i
ni[[-y--y]7 + h-ydy
6.71. V závislosti na a e R+ určete integrál f0 dx.
F. Délky, obsahy, povrchy, objemy
6.72. Určete délku křivky dané parametricky
x = sin2 ř, y = cos2 ř,
pro t s [0, f]. Řešení. Podle ||??|| je délka křivky daná integrálem
f 2 V(x'(ř))2 + (/(O)2 dř = / 2 V(sin2ř)2 + (-sin2ř)2 dř Jo Jo
□
o
í
V2sin2řdř = V2.
Pokud si uvědomíme, že daná křivka je částí přímky y=l-x (neboť sin21 +cos21 = 1) a sice úsečka s koncovými body [0, 1] (pro hodnotu
383
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
Stejnou technikou, jako jsme používali u Riemannova integrálu, lze i nyní zavést horní a dolní součty a horní a dolní Riemann-Stieltjesův integrál, které mají tu výhodu, že pro omezné funkce vždy existují a jejich hodnoty splývají, právě když existuje Riemann-Stieltjesův integrál ve výše uvedeném smyslu.
Již u Riemannova integrálu jsme měli problém s integrovatel-ností funkcí, které byly „příliš rozskákané". Technicky pro funkci g(x) na konečném intervalu [a, b] zavádíme její variaci vztahem
var^g
SUP^Igte) - g(Xi-l)\, S i = l
kde supremum bereme přes všechna dělení S intervalu [a,b]. Pokud je supremum nekonečné, říkáme, že g (x) má neomezenou variaci na [a, b], v opačném případě říkáme, že je g funkce s omezenou variací na intervalu [a,b].
Podobně, jak jsme postupovali u Riemannova integrálu, můžeme docela snadno odvodit následující:
Věta. Nechť f(x) a g (x) jsou reálné funkce na konečném intervalu [a, b].
(1) Pokud je g (x) neklesající a spojitě diferencovatelná, pak Ri-emannům integrál nalevo a Riemann-Stieltjesův integrál napravo existují současně a jejich hodnoty jsou si rovny
pb pb / f(x)g'(x)dx — i J a J a
f(x)dg(x)
(2) Pokud je f(x) spojitá a g(x) je neklesající funkce s konečnou
rb
variací, pak integrál Ja f (x) dg (x) existuje.
6.49. Kurzweilův integrál. Posledním zastavením bude modifikace Riemannova integrálu, která napravuje nešťastné chování ve třetím bodu v odstavci 6.37, tj. limity neklesajících posloupností integrovatelných funkcí budou opět integrovatelné. Pak budeme moci i v těchto případech měnit pořadí hmitního procesu a integrace, jak tomu bylo u stejnoměrné konvergence.
Všimněme si napřed v čem je jádro problému. Intuitivně bychom měli předpokládat, že hodně malé množiny musí mít velikost nulovou, a tudíž by změny hodnot funkcí na takovýchto množinách neměly ovlivnit integraci. Navíc, spočetné sjednocení takových „pro integraci zanedbatelných" množin by mělo mít opět velikost nulovou. Jistě bychom tedy čekali, že např. množina racionálních čísel uvnitř konečného intervalu bude mít takovouto vlastnost a tedy její charakteristická funkce by měla být integrovatelná a hodnota takového integrálu má být nulová.
Řekneme, že množina A c M má nulovou míru, když pro každé e > 0 můžeme najít pokrytí množiny A spočetným systémem otevřených intervalů //, / — 1,2,..., takových, že
V dalším budeme vždy výrokem „funkce / má na množině B danou vlastnost skoro všude" myslet skutečnost, že má / tuto vlastnost ve všech bodech, až na podmnožinu A G B míry nula. Např. tedy charakteristická funkce racionálních čísel je skoro všude nulová, po částech spojitá funkce je skoro všude spojitá atd.
Chtěli bychom nyní modifikovat definici Riemannova integrálu tak, abychom uměli při volbě dělení a příslušných Rieman-nových součtů ehminovat neblahý vliv hodnot integrované funkce
t = 0) a [1, 0] (pro hodnotu t = j) tak okamžitě můžeme psát její délku, tedy 72. □
6.73. Určete délku křivky dané parametricky
x = t2, y = t3
pro t e [0, y/5]. Řešení. Délku l určíme opět využitím vztahu ||??||:
l = f y/4t2 + 9ŕ dt = í ty/9t2 + 4 dř Jo Jo
1 2 = -J y/9u + 4dt = —[(9u + 4)kl
335 ~2J
□
6.74. Určete plochu ležící napravo od přímky x = 3 a dále ohraničenou grafem funkce y = zj—^ a osou x. Řešení. Plocha je dána nevlastním integrálem /3°° ^-j- dx. Vypočteme jej metodou rozkladu na parciální zlomky:
1
x3 - 1 1
x = 1
x° : 1 = C - B
x2 : 0 = A + C a můžeme psát
Ax + B C +
X2 + X + 1 x — 1 (Ax + B)(x - 1) + C(x2 + x + 1), 1
C = -,
B
A
J3 x3-l 3J3 \x-l x2+x + \J
x1+x+~
Nyní určíme zvlášť neurčitý integrál / xi+x\x dx:
x + 2
dx.
/ /
■ dx
X2 + X + 1 (* + 2-)2 + f
dx +
2 / (x + i)2 + |
dx
substituce u prvního integrálu t = x2 + X + 1 dř = 2(x + i) dx
L)2 , 3
1> ^ 4
2 J I 2 J (x + \:
I_!_
substituce u prvního integrálu
S=X + \
ds = dx
ln(x2 + x + 1) +
3 4
- ln((x2 + x + 1) H---
2 VV ' 2 3
ds
384
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
na předem známé množině míry nula. Nabízí se zkusit zajistit, aby dílky v uvažovaných děleních s reprezentanty měly tu vlastnost, že kolem bodů takovéto množiny budou kontrolovatelně malé.
Kladnou reálnou funkci <5 na konečném intervalu [a, b] nazýváme kalibr. Dělení S intervalu [a, b] s reprezentanty §; nazýváme á-kalibrované, jestliže pro všechna / platí
%i - Kki) < < %i < Xi < %i + 8&).
Pro další postup je podstatné ověřit, že ke každému kalibru <5 lze najít nějaké <5-kalibrované dělení s reprezentanty. Tomuto tvrzení se říká Cousinovo lemma a lze jej dokázat např. obvyklým postupem opřeným o vlastnosti suprem. Pro daný kalibr S na [a, b] si označíme M množinu všech bodů x e [a, b] takových, že na [a, x] lze á-kalibrované dělení s reprezentanty najít. Jistě je M neprázdná a ohraničená a má tedy supremum s. Kdyby s / b, pak bychom uměli najít kalibrované dělení s reprezentantem v s a to vede na spor.
Nyní již můžeme zavést zobecnění Riemannova integrálu takto:
Definice. Funkce / definovaná na konečném intervalu [a, b] má Kurzweilův integrál
J a
fix) dx,
jestliže pro každé e > 0 existuje kalibr 8 takový, že pro každé á-kalibrované dělení s reprezentanty S platí pro příslušný Rie-mannův součet Se odhad | Se — 11 < e.
6.50. Vlastnosti Kurzweilova integrálu. Předně si povšimněme, ^\ že j sme při definici Kurzweilova integrálu jen omezili množinu všech dělení, pro které Riemannovy součty bereme v úvahu. Pokud tedy bude naše funkce ri-emannovsky integrovatelná, musí mít nutně i Kurzweilův integrál a tyto dva integrály jsou si rovny.
Ze stejného důvodu můžeme zopakovat argumentaci ve Větě 6.24 o jednoduchých vlastnostech Riemannova integrálu a opět ověřit, že se stejně chová i integrál Kurzweilův. Zejména je lineární kombinace integrovatelných funkcí c fix) + dgix) opět integrovatelná a její integrál je c fix)dx+d gix)dx atd. Při důkazu je potřeba jen promyslet drobné modifikace při diskusi zjemněných dělení, která navíc mají být <5-kalibrovaná.
Podobně lze rozšířit pro případ monotóních posloupností bodově konvergentních funkcí argumentaci ověřující, že limity stejnoměrně konvergující posloupnosti integrovatelných funkcí /„ jsou opět integrovatelné a integrálem limity je limita hodnot integrálů /„.
Konečně, Kurweilův integrál se chová tak, jak bychom si přáli, i vůči množinám s nulovou mírou:
Věta. Uvažme funkci f na intervalu [a, b], která je skoro všude nulová. Pak Kurzweilův integrál f% /(x)oo
1
V*2 + x + 1
1 1 7
- ln 13 H--— arctan —= -
6 73 73
1 r (28 + 1
--lim v 3 arctan --=—
3í->°° V 73
1 . V3
- m2--7t.
3 6
□
6.75. Určete povrch a objem rotačního paraboloidu, který vznikne rotací části paraboly y = 2x2 pro x e [0, 1] kolem osy y.
Řešení. Vzorce uvedené v textech platí pro rotaci křivek kolem osy x\ Je tedy nutno buď integrovat podle danou křivku neznámé y, nebo transformovat.
'2 „
V
■ dx = 7t
S = 2jz f .[^-Jí + — dx =2tx í J- + — dx Jo V 2 V 8x Jo V 2 16
7t-
177T7 - 1 "24 '
□
6.76. Vypočtěte obsah S obrazce složeného ze dvou částí roviny vymezených přímkami x =0, x = l,x=4, osou x a grafem funkce
Řešení. Nejprve si uvědomme, že
-J= < 0, x e [0, 1),
>0, jce(l,4]
385
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
Definujme si nyní kalibr <5(x) pro x e Jkj tak, aby celé intervaly (x — 1+ VAÍ-1
První část obrazce (ležící pod osou x) je proto ohraničena křivkami
y = 0,
o,
1,
y
fx-l
s obsahem daným nevlastním integrálem
I o
úřx;
zatímco druhá část (nad osou x) vymezená křivkami
0, x = 1, x=4, 1
y
y
má obsah
Neboť
fx-l
dx.
dx
Jx-l 2
jako součet Si + S2 získáváme
S =
V (x - l)2 + C,
lim
(1^
d2-!
)+,1Í?+(^-i^31^)
§(i + ^).
Ukázali jsme mj. to, že uvedený obrazec má konečný obsah, přestože není (shora ani zdola) ohraničený. (Blížíme-li se k x = 1 zprava, příp. zleva, jeho výška roste nade všechny meze.) Připomeňme zde neurčitý výraz typu 0 • oo. Obrazec je totiž ohraničený, když se omezíme na x € [0, 1 - 8] U [1 + 8, 4] při libovolně malém 8 > 0. □
6.77. Určete průměrnou rychlost vp tělesa v časovém intervalu [1,2], pokud je jeho rychlost
u(0 = -7=, f e [1,2].
Jednotky neuvažujte.
Řešení. K vyřešení příkladu si stačí uvědomit, že hledaná průměrná rychlost je střední hodnota funkce i; na intervalu [1, 2]. Platí tak
1 f ^L= dt = f ^ dx = VŠ - V2,
2-1 J Jl+fi
přičemž 1 + t2 = x, t dt = dx/2.
□
6.78. Vypočítejte délku s části křivky označované jako traktrix dané parametrickým popisem
f(t) = r cosi + r ln (tg 0 , g(ŕ) = rsinŕ, t e [tt/2, a], kde r > 0, a e (tt/2, ti). Řešení. Protože
f'{t)
-r smí +
2tg j-cos2 j
-r sin ř +
g'(t) = r cos ř na intervalu [tt/2, a], pro délku s dostáváme
386
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
: f Jr2 cos2 t dt= f /ii^fil dt =
J V sin21 J V sirr t
n/2 n/2
-r j ^ dt = -r[\n(sint)]°/2 = -rln(sina)
n/2
□
6.79. Spočtěte objem tělesa vzniklého otáčením omezené plochy, jejíž hranicí je křivka x4 — 9x2 + y4 =0, kolem osy x.
Řešení. Pokud je [x, y] bodem křivky x4 — 9x2 + y4 =0, zřejmě tato křivka prochází rovněž body [—x, y], [x, —y], [—x, —y]. Je tedy souměrná vzhledem k oběma osám x, y. Pro y = 0 dostáváme x2 (x — 3) (x + 3) = 0, tj. osu x protíná hraniční křivka v bodech [—3, 0], [0, 0], [3, 0]. V prvním kvadrantu ji pak můžeme vyjádřit jako graf funkce
f(x) = Z/9x2 - x4, x € [0, 3].
Hledaný objem je proto dvojnásobkem (zde uvažujeme x > 0) integrálu
/ Jtf2(x) dx = it f V9x2 — x4 dx.
o o
Pomocí substituce t = V9 — x2 (xdx = —tdf) pak snadno spočítáme
3 _ 3 _ 0
/ V9x2 - x4 dx = fx ■ V9 - x2 dx = -ft2dt = 9,
0 0 3
a tak obdržíme výsledek 18tt. □
6.80. Torricelliho trychtýř, 1641. Nechť část větve hyperboly x y = 1 pro x > a, kde a > 0, rotuje kolem osy x. Ukažte, že obdržené rotační těleso má konečný objem V a současně nekonečný povrch S.
Řešení. Víme, že platí
V = Jt f (i) dx = jt f \dx=7t\ lim -i - (-i) = i
J \x i J x1 \x^^_QO x \ a) j a
a
+oo i-— +00 - +oo
S = 2tv f 7-V1+ dx=2jt f ^^-dx>2jt f \dx
2ti I lim lnx — lna ) = +oo.
Skutečnost, že uvažované těleso (tzv. Torricelliho trychtýř) nelze natřít za pomoci konečného množství barvy, ale lze jej naplnit konečným množstvím kapaliny, se nazývá Torricelliho paradox. Uvědomme si však, že reálný nátěr barvou má nenulovou tloušťku, což jsme při výpočtu nijak nezohlednili. Kdybychom jej kupř. natírali zevnitř, jediná kapka barvy by nepochybně trychtýř nekonečné délky „ucpala". □
Další příklady na výpočet délek křivek, obsahů rovinných útvarů a objemů částí prostoru naleznete na straně 405.
387
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
6.81. Aplikace integrálního kriteria konvergence. Nyní se opět vraťme k (číselným) řadám. Díky intergrálnímu kriteriu konvergence (viz 6.33) umíme rozhodnout o konvergenci širší třídy řad: Rozhodněte, zda následující sumy konvergují či divergují:
oo
a) E^-
n = \
1
b) Eá-
«=i
Řešení. Všimněme si nejprve, že ani u jedné z uvažovaných řad neumíme o její konvergenci rozhodnout na základě podílového či odmoc-ninového kriteria (všechny limity lim |22±í-|i lim Ma^ jsou rovny 1). Pomocí integrálního kriteria pro konvergenci řad pak dostáváme:
a)
/ -dx = -dt = lim [ln(ř)]n = °°,
Ji xln(x) Jo t WJ°
daná řada tedy diverguje.
b)
f°° 1
/ — dx = lim
J1 X1 &^oo
a daná řada tedy konverguje.
6.82. Pomocí integrálního kritéria rozhodněte o konvergenci řady
00
E
Řešení. Funkce
□
, (« + l)ln2(« + l)'
f(x) = -7ttt7-77, X € [1, +oo)
J ■ ' (x + l) ln2(jc + l) '
je zjevně na svém definičním oboru kladná a nerostoucí, a proto řada v zadání konverguje, právě když konverguje integrál f^°° f(x)dx. Užitím substituce y = ln (x + 1) (kdy je dy = dx/(x + 1)) můžeme vyčíslit
+00 +00
f (x+l)\n2(x + l) dX = -f 7 dy = ta2" 1 ln 2
Řada tedy konverguje. □
G. Stejnoměrná konvergence
6.83. Konverguje posloupnost funkcí
yn = e4«2, iéM, neN
stejnoměrně na M?
Řešení. Posloupnost {y„}neN bodově konverguje ke konstantní funkci y = 1 na R, neboť
lim e^2 = eu = 1, iéM.
388
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
Z vyčíslení
yn (^/2n^ = e > 2 pro každé n e N však vyplývá, že se nejedná o stejnoměrnou konvergenci. (V definici
stejnoměrné konvergence postačuje uvážit e e (0, 1).) 6.84. Určete, zda řada
J^x-n
□
E nL
« = 1
-\-x
stejnoměrně konverguje na intervalu (0, +oo). Řešení. Při označení
fn(x)
je
^Jx-n ~ir+x2
n(n4-3x2)
x > 0, n e N,
x > 0, n e N.
2jx~(n*+x2)
Nechť n e N je nadále libovolné. Nerovnosti f'n(x) > 0 pro x e (O, «2/V3) a /„'(x) < 0 pro x e (rc2/V3, +oc^ implikují, že maximum funkce /„ nastává právě v bodě x = n2/*j3. Protože
Jn l 73/ ~~ 4«2 3 2^ 4„2 - 4 Z. „2 < -l-OO,
«=1 "—1
«=1
podle Weierstrassova kritéria řada 2~1™=\ fnix) konverguje stejnoměrně na intervalu (0, +oo). □
6.85. Pro x e [-1, 1] sečtěte
(-!)"+' x« + l
« = 1
(n + d
Řešení. Nejprve upozorněme, že symbolem pro neurčitý integrál budeme označovat jednu konkrétní primitivní funkci (při zachování proměnné), kterou je vhodné chápat jako tzv. funkci horní meze, přičemž dolní mez je nula. Užitím věty o integraci mocninné řady pro x e (—1,1) obdržíme
y^OO (-1)" ž—m = \ n(n
v« + l
(n + d
= /EB°°=i ((-ir+1fx-1dx)dx =
f (/E^iC-*)""1 dx)dx = f (f 1 - x +x2 - x3 + ••• dx)dx f (f TTx dx)dx
í
ln(l +x) + C\dx
Jelikož
J £ (f~~^— x") dx = f ln (! + x) + ci
«=i
ze spojitosti uvažovaných funkcí víme, že
E
«=i
(-d"
ln(l +x) +Ci
x e (-1, 1).
Volba x = 0 potom dává 0 = ln 1 + C\, tj. C\ =0. Dále je
389
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
/ln(l + x) dx = | per partes
u = ln (1 + x) u' — 1
l+x
1 V = X
1
xln(l +x) - J dx
x ln (1 + x) - f 1 - dx = x ln (1 + x) - x + ln (1 + x) + C2 = (x + 1) ln (x + 1) - x + C2.
Protože zadaná řada konverguje v bodě x = 0 se součtem 0, analogicky jako pro C\ z
0 = 1 • ln 1 - 0 + C2 vyplývá, že C2 = 0. Celkem tedy získáváme
E^Tirx"+1 =(* + l)ln(x + l)-x, í e (-1,1).
«=i
Navíc podle Ábelovy věty (viz 6.45)je součet uvažované řady roven (případné nevlastní) limitě funkce (x + 1) ln (x + 1) — x v bodech — 1 a 1. V našem případě jsou obě limity vlastní (v bodě 1 je dokonce funkce spojitá a hodnota limity v bodě 1 je pak rovna funkční hodnotě 2 ln 2 — 1. Pro výpočet hodnoty limity v bodě — 1 použijeme L'Hospi-talova pravidla:
lim (x + 1) ln (x + 1) - x = lim t ln t + 1
jt->-l + t^0+
lni 7 = lim -r- + 1 = lim -V + 1 = lim -t + 1 = 1.
t t2
Konvergenci řady v bodech ±1 lze samozřejmě ověřit přímo. Do-
oo
konce lze přímo i odvodit £ n(«+i) = 1 (rozepsáním n(n1+1) = \ — ^.
«=i
□
6.86. Součet řady. Pomocí věty 6.41 „o záměně limity a integrálu posloupnosti stejnoměrně konvergentních funkcí" nyní sečteme číselnou řadu
T— ■
«=i
Využijeme toho, že / ^ =
2
1
Řešení. Na intervalu (2, oo) konverguje řada funkcí £n=i ^rr stejnoměrně. To plyne například z Weierstrasova kriteria: každá z funkcí Pi+t Je klesající na intervalu (2, oo), její hodnota tedy nepřevyšuje 2^r; řada E^Li ^^rr Je ovšem konvergentní (jedná se o geometrickou řadu s kvocientem \. Podle Weierstrasova kriteria tedy řada funkcí E^Li tedy konverguje stejnoměrně. Dokonce umíme výslednou funkci explicitně vyjádřit. Její hodnota v libovolném x e (2, oo) je hodnotou geometrické řady s kvocientem \, označíme-li tedy limitu jako f(x),je
11 1
xn + l x2 1 - i X(X - 1)
« = 1 x
390
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
Použitím (6.43) (3) dostávame
~ 1 _ ~ r di ^ ni" ~ ^ J2 x"+1
dx
dx
n = \
C°° 1 J2 x(x - 1)
lim
lim [(ln(<5 - 1) - ln(<5) - ln(l) + ln2]
r i i
J 2 x - i
dx
lim ln2
ln
8 - 1
+ ln(2) = ln I lim--- ) + ln2
□
6.87. Uvažme funkci f(x) = Yl™=\ ne nx. Určete
-In 3
/»in _ Jln2
/(x)dx.
Řešení. Obdobně jako v předchozím případě z Weierstrasova kriteria pro stejnoměrnou konvergenci vypývá, že řada funkcí 2~1V=\ ne~nx konverguje stejnoměrně na intervalu (ln 2, ln 3), neboť každá z funkcí ne~nx je menší než ^ na (ln2, ln3) a řada Yl™=\ ^ konverguje, což plyne třeba z podílového kriteria pro konvergenci řad:
(n + 1)2"("+1
lim
an + l
lim
n2n
,. ln + 1 1 lim--= -.
n^oo 2 ti 2
Celkem podle (6.43) (3) platí
ln3 00
/•ln3
/ /Wdx
/•lni ^
00
ne~nx dx
ř7X-iln 3 Jln2
( 9«
«=1
«=1
1
3"
1 1
□
6.88. Určete následující limitu (postup výpočtu zdůvodněte):
ľ00 cos lim / -—
"^°°Jo (1 -+
(1 + f)"
dx.
391
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
cos(^)
Posloupnost těchto funkcí limi-
1
(ll??ll)
1
Řešení. Určeme nejprve lim tuje bodově a máme
cos(^)
lim -líii_ = _
»^°° (1 + X-Y lim (1 + x-f e*
Lze ukázat, že daná posloupnost konverguje stejnoměrně. Potom podle (6.41)
cos (Xň)
r00 cos(^)
lim /--^Trdx
"^°°Jo +
o
lim
™ (1 + l)
dx
1
Jo ex
Ověření stejnoměrné konvergence dané posloupnosti necháváme na čtenáři (podotýkáme jenom, že diskuze je složitější než v předchozích příkladech).
□
392
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
H. Doplňující příklady k celé kapitole
6.89. Nechť je dána funkce / a bod z, přičemž platí
f(z) = 0, f'(z) = 0, f"(z)=0, f(3\z) = l. Která z následujících tvrzení:
(a) tečnou ke grafu funkce / v bodě [z, f (z)] je osa x;
(b) funkce / není polynomem druhého stupně;
(c) funkce / v bodě z roste;
(d) funkce / nemá v bodě z ostré lokálni minimum;
(e) bod z je inflexním bodem funkce /
j sou zcela jistě pravdivá? O
6.90. Vyšetřete celkový průběh funkce
Tedy určete (má-li smysl):
(a) definiční obor (ten je zadán) a obor hodnot;
(b) případnou sudost, lichost, periodicitu;
(c) body nespojitosti a jejich druh (včetně příslušných jednostranných limit);
(d) průsečíky s osami x, y;
(e) intervaly, kde je funkce kladná a kde záporná;
(f) limity lim^.oo f (x), limx^+0o f (x);
(g) první a druhou derivaci;
(h) kritické a tzv. stacionární body, ve kterých je první derivace nulová (příp. body, ve kterých neexistuje první nebo druhá derivace);
(i) intervaly monotonie;
(j) ostré i neostré lokální a absolutní extrémy;
(k) intervaly, kde je funkce konvexní a kde konkávni;
(1) infiexní body;
(m) asymptoty bez směrnice a se směrnicí;
(n) hodnoty funkce / a její derivace /' ve „významných" bodech;
(o) graf.
O
6.91. Vyšetřete průběh funkce
f (x) =
Vyšetřením průběhu funkce / se (nejen v tomto příkladu) rozumí „udat definiční obor, obor hodnot a případnou lichost, sudost, periodicitu; spočítat limity
lim f(x) a lim f(x),
jestliže existují; určit body nespojitosti a jejich druh včetně příslušných jednostranných limit (pokud existují), nulové body (pokud existují) a intervaly, kde je funkce kladná a kde záporná; stanovit první (a druhou, je-li potřeba) derivaci a intervaly, na kterých funkce roste, klesá, čije konstantní; nalézt stacionární (kritické) body a všechny lokální extrémy (pokud existují); určit inflexní body a intervaly,
393
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
kde je funkce konvexní a kde konkávni; vypočítat hodnoty ve význačných bodech (tj. vyčíslit funkci ve stacionárních a v inflexních bodech, pomůže-li to při kreslení grafu, a uvést průsečíky s osami, existují-li); načrtnout její graf s asymptotami11. O
6.92. Vyšetřete průběh funkce
fix) ^
x-l
6.93. Vyšetřete průběh funkce
6.94. Vyšetřete průběh funkce
O
f(x) = yže-*.
o
f(x) = arctg
O
6.95. Vyšetřete průběh funkce ^, mimo jiné nalezněte extrémy, inflexní body, asymptoty a načrtněte její graf. O
6.96. Vyšetřete průběh funkce, mimo jiné nalezněte extrémy, inflexní body, asymptoty.
ln(x2 - 3x + 2) + x.
O
6.97. Vyšetřete průběh funkce, mimo jiné nalezněte extrémy, inflexní body a asymptoty.
(x2 -2)ex2~l.
6.98. Vyšetřete průběh funkce, mimo jiné nalezněte extrémy, inflexní body a asymptoty.
ln(2x2 - x- l).
6.99. Vyšetřete průběh funkce (mimo jiné nalezněte extrémy, inflexní body a asymptoty):
x2 -2
O
o
x - 1
o
6.100. Použitím základních vzorců určete libovolnou primitivní funkci k funkci
(a) y = x Jx v^, x e (0, +oo);
(b) y = (2X + 3X)Z , iéM; (Ov = -^, *e(-l,l);
^y = ^ *e(-f,^)
394
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
6.101. Využijte derivací funkcí y = tg x a y = cotg x k nalezení neurčitých integrálů funkcí
(a) y = cotg2x, x € (0, n);
(b) y = . 2 1 2 , x e (0, f) .
sin x cosz x \ z /
6.102. U vedle primitivní funkci k funkci
6.103. Určete
f-^dx, x e
6.104. Stanovte
/ JIZ^ dx, X 6E
6.105. Prox e (0, 1) vypočtěte
ľ 1 f~>+1i\ + /3 - + 4sinx — 5cosx) 0
pomoci integrační metody per partes. O
6.707. Opakovaným užitím pravidla per partes pro všechna x e M vypočtěte
(a) j x2 sin x dx;
(b) / x2 ex dx.
O
6.108. Například integrací per partes určete
f x ln2 x dx
pro x > 0. O
6.109. Pomocí metody per partes spočtěte
/ (2 -x2)exdx
395
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
na celé reálné ose. o
6.110. Integrujte
(a) f(2x + 5)10 0;
v ' J x hr x
(c) J e~x x2 dx, x e M;
(d) f 15 ssSäLí ífr, x e (-1, 1);
(e) fljfdx, x > 0;
(Ě)f^dx, x e R; (h) / sin y/x dx, x > 0
aplikací substituční metody. o
6.111. Pro x e (0, 1) pomocí vhodných substitucí prevedie integrály
fxt.f^dx; f ^
l~x ' J (x-í)^x2+x + l
na integrály racionálních lomených funkcí. o 6.112. Prox e {—jt/2, tz/2) vypočtěte
/■_<&
^ 1 +shr x
pomocí substituce t = tg x. o
6.77.3. Libovolným způsobem určete
r -f^-t ííx , x > o.
o
6.774. Spočtěte
(a) f x" Inx dx, x > 0, n ^ —1;
(b) fjf^dx, x sR.
o
6.115. Pro x > 0 stanovte
2+5x):
(a) / dx; Mf^dx;
(c) f --i= dx.
Řešení. Všechny tři zadané integrály jsou tzv. binomické, tj. lze je zapsat jako
f x"1 (a + bxn)p dx pro jistá čísla a, b e R, m, n, p e Q.
Binomické integrály se tradičně řeší aplikací substituční metody. Pokud p e z (nikoli nutně p < 0), volí se substituce x = ť, kde s je společný jmenovatel čísel man; pokud ^eZa^Z, klade se a + bx" = ť, kde s je jmenovatel čísla p; a pokud + p e z (p ^ z, 2í±I ^ z), zavádí se a + &x" = řs x", kde s je jmenovatel p. V těchto třech případech je potom zaručen přechod k integrování racionální lomené funkce. Snadno tak vypočítáme
396
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
(a)
f?
dx = J x 4 (2 + 5x)3 dx
p e Z x = ŕ dx = 4í3 dt
4/(2 +5í4)3 í/ŕ
4/ (8 + 60í4 + 150í8 + 125í12) dt = 4 (8í + 12í5 + f t9 + ±§ P) + C 4^8^/1 + 127^ +
Yx»+m ^)+C;
(b)
Í^Tdx = fx *
í/x
(c)
p i Z, 22±i e Z 1 +x? = í3 x = (Z3 - l)4 dx = 12í2 (í3 - l)3 dt
12 / ŕ - t3 dt = 12 (L - J) + C = 12^(1 + ^I)4 - I) + C;
12 Jt3 (ŕ - l) í/í
)
f -r=£ÍC = f (1 +x4) ? ŕ/x
l"+ x4 = ŕ4x4
x = (ŕ - i)-* í/x = -í3 (í4 - 1)"
dt
f
dt
f
t2
dt
f (ŕ-i í+i + fl+i)
(í-lKí+Dŕ+l)
-i (ln I í - 1 I - ln 11 + 1 I + 2arctg0 + C
+ C.
□
6.116. Pro x e (-§, f) integrujte
(a) /
(b) /
(c) /
dx:
1
1 +sin jt
1
2—cos x
dx; dx.
Řešení. Integrály ve tvaru j f (sin x, cos x) dx pro jistou racionální lomenou funkci / se obvykle řeší substituční metodou. Je-li /(sin*, — cosx) = —/(sinx, cosx), volí se t = sinx; je-li /(— sinx, cosx) = —/(sinx, cosx), volí set = cosx; a je-li /(— sinx, — cosx) = /(sinx, cosx), pak t = tgx. Jestliže neplatí žádný z uvedených vztahů, používá se substituce t = tg |. Ukážeme si to na zadaných integrálech.
Případ (a). Ve jmenovateli je
1+4 cos2 x + 3 sin2 x = 4 + cos2 x
a v čitateli pouze funkce sinus v liché mocnině, tj. substituce t = cosx, kdy je dt = — sinx dx, umožňuje nahradit všechny siny a kosiny, a tak obdržet
dx = f sinx(1-Q°s2x) - ľ ~(1~'2) M - Cí-i 5 Wí _ , 5
1+4 cos2 x-\-3 sinz x
4+cos2 x
dx = f
4+ir-dt=f{l-4F)dt
2 arctg f + C
cosx
§ arctg -§- + C.
Případ (b). Neboť je sinus (i kosinus) v sudé mocnině, v rámci substituce ř = tgx provedeme nahrazení
sin2 x
t2
1+t2
cos2 x
1
1+t2
dx
j^dt,
čímž získáme
397
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
dx
f _A_ dt = j-LFdt = £- arctg (jli) + C = ^ arctg (s/2 tgx) + C.
"2,
í+í2
Prípad (c). Nyní použijeme univerzální substituci t = tg |, kdy je
sin x = -73, cos x = f-y, dx = -f-f /3r) + C = ^ arctg (73 tg f) + c.
1+f2
6". 117. Provedte naznačené dělení polynomů
(a)
fu.\ 2xi+5xi-x1+2x-l
v6_l-9r4_l-r2
x3+3x2-4x-12'
s+5x3-x2-\ x6+2x4+x2
6.122. Vyjádřete racionální lomenou funkci
_ _5j+2
y ~ x*-x3+2x2
y- 1
x^x + í) '
6.125. Upravte funkci
x*+6x2+x-2 x4-2x3
□
2x5-x4+3x2-x + l x2-2x+4
pro x e R. O
6.118. Vyjádřete funkci
_ 3x4+2x3-x2 + l y ~ 3x+2
jako součet polynomu a ryze lomené racionální funkce. O
6.119. Rozložte racionální lomený výraz
4a-2 + 13a-2 .
na součet parciálních zlomků. O
6.120. Vyjádřete funkci
_ 2jt3+6;t2+3;t-6 " ~~ x*-2x3
ve tvaru parciálních zlomků. O
6.121. Rozložte výraz
Ix2-I0x+31
jc3—3jc2+9x + 13
na parciální zlomky. O
ve tvaru součtu parciálních zlomků. O 6.123. Rozložte na parciální zlomky funkci
O
6.124. Uvedte tvar rozkladu na parciální zlomky racionální lomené funkce
_ 2x2-\U y ~ (x-2)x2 (3x2+x+4)2'
Neurčité koeficienty nepočítejte! O
398
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
na součet polynomu a ryze lomené racionální funkce Q. Získanou funkci Q poté vyjádřete ve tvaru součtu parciálních zlomků. O
6.126. Napište primitivní funkci racionální lomené funkce
(a) y = tt~2> *r 2;
(b) 3> = -(^ -^2.
O
6.127. Vyjádřete
^ jc2+4jc+8
/ x2+4x+& dj- X Ě
O
6.128. Vypočtěte neurčitý integrál funkce
o
6.129. Určete
O
6.730. Integrujte
f -J— dx. x ^ 1.
O
6.737. Spočtěte integrál
dx, iel\jl,2}.
O
6.132. Pro .v e (0, §) vypočítejte
(a) / sin3 x cos4 x 0; sgnx = —1, je-li x < 0; a sgnO = 0. O
6.140. Vyčíslete určitý integrál
1 3
fj^dx.
o
O
6.141. Např. opakovaným užitím pravidla per partes spočítejte
jt/2
f e2x cosx dx. o
400
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
6.142. Stanovte
i
J x2 e~T dx.
-i
6.143. Vyčíslete integrál
-i
dx
^ iVl+ln x ln 2
(b) Z' £ dx.
0
6.145. Které z kladných čísel
-2 0 0
O
o
za pomoci substituční metody. O 6.144. Vypočtěte
O
jr/2 rt
p := f cos1 x dx, q := j cos2x dx o b
je větší? O 6.146. Určete znaménka těchto tří čísel (hodnot integrálů)
2 ti 1tí
a := f x3 2X dx; b := /cosx dx; c := f dx.
O
6.147. Seřadte čísla
jt/2 ti/2 1
A := f cosx sin2x dx, B := / shr x dx, C := f —x5 5X dx,
0 0-1 10 , 2jt ti ,
2ä tt 10
podle velikosti. O
6.148. Uvážením geometrického významu určitého integrálu stanovte
2
(a) / | x — 1 | dx;
-2 0,10
(b) / tgx dx;
-0,10 2jt
(c) / sin a' dx.
o
o
6.149. Vypočtěte f^\x\dx. O
401
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
6.750. Určete
i
v-5 clr,2
f x5 sin x dx.
-i
6.757. S chybou menší než 1/10 približne vyčíslete
2
f (x - £2i7J^)lnx dx.
f x4 + 3x; + 5.
x2 +4x + 2
dx.
6.154. Vypočtěte integrál
"2 sin í
1 — cos21
4
6.755. Vypočtěte integrál
"ln2 dx
dt.
o e2x — 3ex
6.156. Vypočtěte:
ZL
(i) f02 sin x sin 2x dx,
(ii) / sin2 x sin 2x dx.
6.157. Vyčíslete nevlastní integrál
(a) + 0O f —oo + 0O dx
(b) f 0 dx . x '
(c) / dx;
o
i
(d) / ln | x | dx.
-i
O
o
6.752. Vyjádřete bez symbolu derivace a integrace výraz
| / 3ř2 cos t d^j
s proměnnou x e M a reálnou konstantou a, je-li derivováno podle x. O 6.75i. Spočtěte neurčitý integrál
O
o
o
o
402
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
6.158. Určete
3jr/2
J 1+SÍllAľ
0
6.759. Spočítejte nevlastní integrál
+ 0o
ľ -5—í—- dx .
J x2+x + l
6.160. Vyčíslete
+00
f 7l- e\- , dx .
6.161. Užitím substituční metody vypočtěte
o
f x e~x dx; f 2«-l
y (_i)»+i f—x2».
(2«)!
«=i
konverguje pro libovolné reálné x. (5.28.
/w = L—-—^
«=1
konverguje pro x € (—1, 1].
6.29. Je dobré si uvědomit, že rozvíjíme ^ ln(x).
CX) j
2;
Konverguje na intervalu (0, 2]. (5.3/. (-#,#).
(5.32. Konvexní je na intervalech (—oo, 0) a (0, 1/2); konkávni na intervalu (1/2, +oo). Má pouze jednu asymptotu, a to přímku y = jr/4(v±oo).
6.33. (a) y — 0 v —oo; (b) x = 2 - bez směrnice, y — 1 v ±oo.
6.34. y = 0 pro x -> ±oo.
6.35. y = ln 10, y = x + ln3. 6.71. jz^ pro a e (0, 1), oo jinak.
6.89. Všechna.
6.90. Oborem hodnot je (—oo, 0] U [4, +oo). Funkce / není lichá, sudá ani periodická. Má jediný bod nespo-jitosti, a to xq — —1, přičemž
lim f(x) — —oo, lim f(x) — +oo.
x^> — 1 + x^> — 1 —
Funkce protíná osu x pouze v počátku. Je kladná pro x < — 1 a nekladná pro x > — 1. Lehce lze ukázat, že
lim f(x) — +oo, lim f(x) — —oo;
X—* —CX) x^+oo
406
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
Odtud plyne, že / roste na intervalech [—2, —1), (—1, 0] a klesá na intervalech (—oo, —2], [0, +00). Ve stacionárním bodě xi = 0 nabývá ostrého lokálního maxima a ve stacionárním bodě x2 = —2 má ostré lokální minimum y2 = 4. Je konvexní na intervalu (—00, —1), konkávni na intervalu (—1, +00). Nemá inflexní bod. Přímka x = — 1 je asymptotou bez směrnice. Asymptotou se směrnicí v ±00 je přímka y = — x + 1. Dodejme např. /(-3) = 9/2, f (-3) = -3/4, /(l) = -1/2, /'(l) = -3/4.
o~.9i. Funkce je definována i spojitá na R \ {0}. Není Uchá, sudá ani periodická. Je záporná právě na intervalu (1, +00). Jediným průsečíkem grafu s osami je bod [1,0]. V počátku má / tzv. nespojitost druhého druhu a jejím oborem hodnot je R, neboť
lim f(x) = +00, lim f(x) = —00, lim f(x) = +00.
Platí
f'(x) = -££, x€M\{0}, /"(x) = x € M \ {0}. Jediným stacionárním bodem je xi = —\fl. Funkce /roste na intervalu [x\, 0), klesá na intervalech (—00, x\], (0, +00). V bodě xi má tudíž lokální minimum yi = 3/^/4. Inflexní body daná funkce nemá. Je konvexní na celém svém definičním oboru. Asymptotou bez směrnice je přímka x = 0, přímka y = — x je pak asymptotou se směrnicí v ±00.
6.92. Funkce je definována i spojitá na R \ {1}. Není lichá, sudá ani periodická. Průsečíky grafu / s osami j sou body [l-^2,0] a [0, —1]. V bodě xo = 1 má funkce / nespojitost druhého druhu a jejím oborem hodnot je R, což bezprostředně plyne z limit
lim f(x) = —00, lim f(x) = +00, lim f(x) = +00.
JC—>■ 1— Jt-»1 + X^±QO
Po úpravě
/(x) = (x-l)2 + IlT, x€M\{l},
není obtížné spočítat
/'(*) = 2 X€M\{1},
/"(*) = 2 x€M\{l}. Jediným stacionárním bodem je x\ = 2. Funkce / roste na intervalu [2, +00), klesá na intervalech (—00, 1), (1, 2]. V bodě x 1 tudíž nabývá hodnoty lokálního minima y\ = 3. Je konvexní na intervalech
(1, +00) a konkávni na intervalu
(l-^2, l) . Bod x2 = 1 - ifl je tak inflexním bodem. Přímka x = 1 je asymptotou bez směrnice. Asymptoty se směrnicí daná funkce nemá.
6.93. Funkce je definována i spojitá na celém R. Není lichá, sudá ani periodická. Nabývá kladných hodnot na kladné poloose, záporných na záporné. Průsečíkem grafu / s osami je pouze bod [0, 0]. Snadno se určí derivace
/'(x) = ^=-#Fe-*, x€M\{0}, /'(0) = +00, f"(x) = ^e"* - l^-i^l x€M \ {0}.
Jediným nulovým bodem první derivace je bod xo = 1/3. Funkce / roste na intervalu (—00, 1 /3] a klesá na intervalu [1/3, +00). V bodě xo má proto absolutní maximum yo = l/\/3e. Neboť lim^-oo f(x) = —00, jejím oborem hodnot je (—00, yo]- Inflexní body jsou
X! = ±-3^, x2 = 0, x3 = ±±3^,
přičemž funkce / je konvexní na intervalech (x\, x2), (X3, +00), konkávni na intervalech (—00, xi), (x2, X3). Jedinou asymptotou je přímka y = 0 v +00, tj. limx^+00 f(x) = 0.
6.94. Funkce je definována i spojitá na R \ {2}. Není lichá, sudá ani periodická. Je kladná právě na intervalu (0, 2). Jediným průsečíkem grafu funkce / s osami je bod [0, 0]. V bodě xo = 2 nastává tzv. skok o velikosti it, jak vyplývá z limit
lim /(*) = f, lim /(*) = -f.
Platí
407
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
/"<*> = č^fefe*' x € M \ {2}. První derivace nemá nulový bod. Funkce / proto roste v každém bodě svého definičního oboru. Neboť
lim /(x) = -f, lim /(x) = -f,
x=> — co x^+co
oborem hodnot je množina (—it/2, tt/2) \ {—tt/4}. Funkce / je konvexní na intervalu (—00, 1), konkávni na intervalech (1, 2), (2, +00). Bod x\ — 1 je tedy inflexním bodem, přičemž /(l) — tt/4. Jedinou asymptotou je přímka y — —it/4 v ±00.
6.95. Def. obor R+, globální maximum x — e, inŕl. bod x — Ve3, rostoucí na int (0, e), klesající na (e, 00), konkávni (0, Vě3", konvexní (Vě3", 00), asymptoty x = 0 a y = 0, lim^o f(x) — —00, lim^oo f(x) — 0.
6.96. Def. obor R \ [1,2]. Lokální maximum x — 1~2V^, na celém definičním oboru konkávni, asymptoty x — l, x — 2.
6.97. Def. obor M. Lokální minima v — 1, 1, maximum v 0. Funkce sudá. Infiexní body ±-^|> t>ez asymptot.
6.98. Def. obor R \ [—\, 1]. Glob. extrémy nemá. Bez infiexních bodů, asymptoty x — — j, x — í.
6.99. Def. obor R \ {1}. Bez extrémů. Bez infl. bodů, na int. (—00, 1) konvexní, (1, 00) konkávni, Asymptota bez směrnice x — 1. Asymptota se směrnicí y — x + 1.
6.100. (a) £ x7x^; (b) £ + 2^ + ^; (c) ™L; (d) ln (1 + sinx).
6.101. (a) -cotgx - x + C; (b) tgx - cotgx + C.
6.102. ex + 3arcsin f.
6.103. ±ln(l +x4) + C. 6.704. 2V2 arctg ^ + C.
6.105. In j í-^i j + j arcsin x — 4 cos x — 5 sin x + C. 6.706. (a) x arctgx - ln(1+*2) + C; (b) ^ + C.
6.107. (a) —x2 cos x + 2x sin x + 2 cos x + C; (b) ex (x2 — 2x + 2) + C.
6.108. ^ (21n2x - 21nx + 1) + C.
6.109. (2x -x2)ď + C.
6.110. (a) (2*+5)" + C; (b) + C; (c) -± e"*3 + C; (d) 5 arcsin3 x + C; (e) ^ + C; (f) arctg2 Vx + C; (g) ^ arctg e*) + C; (h) 2 sin Vx - 2^/x cos Vx + C.
6.111. Např. 1 — x = f2x dává f , ~2. dt; a Vx2 + x + 1 — x + y vede na f 72f3' „.
6.772. ^ arctg (\/2 tg x) + C. 6.113. x - 2Vx + 21n (l + Vx) + C. 6.774.(a)^lnx-^ + C;(b)^ + C. 6.777. 2X3 + 3x2 - 2x - 13 + ~219^+53.
6//Ä r3 — ir + 2 -I__-_
V.110. x 3-* "ŕ- g "I" 9(3^+2) •
5Ji9.(a)^ + _l___i_;(b)2_4r
6.727. 3 1 4*"2
x + l ^ x2-4x + l3'
1 2 , 2jc-3
6.122. — — — -1—j
408
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
5.725. ±-4, +4,-^.
ŕ, 17A A i JL _|_ C. j_ Dx+E , Fx+G °-ÍZ^- x-2 ^ x2 ^ x ^ (3x2+x+4)2 + 3x2+x+4-
5.225. 1 + ^ - | +
6.726. (a)31n|x-2|;(b) 1
(x-2)2 ■
6.127. I ln (x2 + 4x + 8) - \ arctg -J2- + C. 6.728.^arctg^ + 3l^±L_ + C.
<5.i29.Iln^lÍ + f arctg ^ +C.
6.750. iln|x - 1| - gin (x2 +x + l) - ^arctg ^ + C.
6.757. ln (| x - 1 | (x - 2)4) - ^ + x + C.
6.752. (a) £2^i _ £°^£ + C; (b) + § + C; (c) x - sinx + C; (d) | + äs2* + C; (e) § sini x - | siní x + £ sin t x + C; (f) ^ + 2 tg x - ^ + C; (g) \ ln |tg §1 - + C; (h) ln |tg f | + C.
6.133. SEn, sup = 2±1, SS(1, m = 2=i; ano, je.
6.754. jl^fx~dx = | (2^2 - l).
6.135. Nekonečně mnoho.
6.136. Např. funkce / může nabývat hodnoty 1 v racionálních bodech intervalu 7 a být nulová v iracionálních bodech.
6.757. (a) 2; (b) f - x% (c) 2 In (l + V2); (d) 2-\.
6.138. VŠ-V2.
6.139. \b\ - \a\.
6.140. \ ln 2.
6.747. i (e* - 2).
6.742. e-5c"1. 6.745. I.
6.744. (a) 4; (b)
6.745. p < q.
6.146. a > 0;b = 0;c> 0.
6.747. C<7) = 0 arctan ((2*+1)v/3) + C.
6.754. iln(|±|^).
6.755. -i - |ln2.
6.756.
(i) f,
/••\ 1 • 4
(n) 5 sin x-
6.757. (a) tt; (b) +00; (c) 20; (d) -2.
6.758. -00.
409
KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
6.159. ^tt.
6.160. ^tt.
6.161. -\; 1. 6.162.2-1;
e' e ez ez
6.163. (a) a > 1; (b) a < 1; (c) a = 0.
6.164. Právě pro p > 1, # e R a pro /? = 1, q > 1.
6.165. (a) platí; (b) neplatí; (c) platí.
2 4
d/55. 1 - 7752- + yfe
6.167. Chyba náleží do intervalu (0, 1/200).
6.168. 1 — 3a- + 2^x4; nad tečnou.
oo (-1)" _2n
o.yoy. 2^„=o a„y. -x
6.170. y — arctgx.
6.171. Právě pro x € (—|, |^ je
6.172. ^ J2T=o i«x" •
6.173.
oo
1 _ 1
5+2x ~ 5
n=0
E (-1)"
x".
(_1y + l22i JTX2/ + 1
"-"- \x--)
(2/ + D V 4/
. . (2/ + 1)! Řada konverguje pro všechna x e R.
(í.i75. /(x) = x, x e M; ano. 6.176. Nikoli.
6.77«. (a) 1-^ + ^; (b) 4-^.
O.l/V. 2^n=0 (2« + l)«! X
6.180. y — arctgx.
6.181. Právě pro x € (-§, |^ je
oo
1
5+2.T ~~ 5
n=0
6.182. (a) u(0) = 6m/s; (b) f = 3 s, s(3) = 16m; (c) u(4) = -2m/s, a(4) = -2m/s-
410
KAPITOLA 7
Spojité modely
Jak zvládame nelineárni objekty? - zase hlavně lineárními nástroji...
V této kapitole ukážeme využití nástrojů diferenciálního a integrálního počtu ve vybraných problémech, ve kterých si vystačíme s funkcemi jedné reálné nezávislé proměnné.
Půjde o postupy a nástroje docela podobné těm z kapitoly třetí, tj. manipulace s hneárními kombinacemi vybraných generátorů a lineárními transformacemi (např. hledání jejich jader nebo vzorů předepsaných obrazů). Jen místo konečně rozměrných vektorů budeme pracovat s prostory funkcí, tzn. uvažované vektorové prostory často nebudou mít konečnou dimenzi. K těmto i dalším praktickým oblastem se vrátíme v příští kapitole v kontextu funkcí více proměnných, diferenciálních rovnic i variačního počtu.
Nejprve budeme aproximovat funkce pomocí lineárních kombinací z předem pevně zvolených sad generátorů. Po cestě si ale budeme muset ujasnit, jak vlastně lze pracovat s pojmy jako je vzdálenost. Půjde o náznaky teorie tzv. metrických prostorů a tato část je zároveň přípravou na analýzu v euklidovských prostorech Rn. V zásadě přitom budeme pokračovat v postupech, které již z euklidovských vektorových prostorů dobře známe. Zjistíme, že naše intuice z euklidovských prostorů nízké dimenze se docela dobře hodí i obecně.
Pak se budeme stručně zabývat integrálními operátory, tj. lineárními zobrazeními na funkcích, které jsou definovány pomocí integrování. Půjde zejména o tzv. Fourierovu analýzu. Při našich úvahách se přitom budeme jako obvykle zamýšlet i nad diskrétními variantami dříve diskutovaných spojitých operací.
V celé kapitole budeme pracovat s funkcemi jedné reálné proměnné, které ale budou mít buď reálné nebo (velmi často) komplexní hodnoty.
1. Fourierovy řady
7.1. Prostory funkcí. Jako obvykle začneme výběrem vhodných množin funkcí, se kterými chceme pracovat. Přitom chceme mít dost funkcí na praktickou použitelnost našich modelů, ale také musí být dostatečně „pěkné", abychom je uměli integrovat a derivovat tak, jak bude třeba.
Budeme vesměs pracovat s funkcemi definovanými na nějakém intervalu I — [a,b] cR, případně nekonečném intervalu (tj. krajní hodnoty a i b mohou také nabývat hodnot ±oo, stále však půjde o uzavřené množiny).
Prostory po částech hladkých funkcí
Množina funkcí 5° — 5° [a, b] obsahuje právě všechny po částech spojité funkce na / — [a, b] s reálnými nebo komplexními hodnotami, tj. předpokládáme, že v každém bodě intervalu má funkce / e 5° příslušné konečné jednostranné limity zprava i zleva, přičemž bodů nespojitosti je nejvýše konečně mnoho na
A. Ortogonální systémy funkcí
Chceme-li zobrazit nějaký trojrozměrný objekt v rovině, uvážíme jeho (například kolmou) projekci do této roviny. Obdobně, chceme-li „vyjádřit" nějakou složitější funkci pomocí jednodušších, můžeme uvážit její projekci do (reálného) vektorového prostoru generovaného těmito jednoduššími funkcemi. Potom budeme schopni například integrovat složitější funkce stejně, jako jsme integrovali (či derivovali) funkce vyjádřené pomocí mocninných řad (pokud bude prostor jednodušších funkcí „dostatečně" velký, tak s libovolnou přesností).
411
KAPITOLA 7. SPOJITÉ MODELY
každém konečném intervalu. Zejména jsou tedy všechny takové funkce na omezených intervalech omezené.
Pro každé přirozené číslo k > 1 budeme také uvažovat množinu všech po částech spojitých funkcí / jejichž všechny derivace až do řádu k včetně patří do 5° (tj. nemusí existovat ve všech bodech, ale existují jejich jednostranné limity ve všech bodech). Budeme pro ni používat značení 5*.
V případě neomezeného intervalu I budeme také pracovat často s podmnožinou 6^ c 5* všech funkcí s kompaktním nosičem (tzn. že funkce jsou identicky nulové vně nějakého konečného uzavřeného intervalu). ^mmm^^^^m—__J[
Na ohraničených intervalech samozřejmě mají všechny funkce kompaktní nosič v tomto smyslu. Když nás nebude zajímat, na jakém intervalu pracujeme, budeme proto psát jen 6^ ve všech případech. V případě konečného intervalu [a, b] nebo za předpokladu kompaktního nosiče jsou naše funkce z 5° vždy riemannovsky in-tegrovatelné na zvoleném intervalu I jak v absolutní hodnotě tak v kvadrátu, tzn.
J a
\f(x)\dx < oo,
ľ
Ja
(f(x))dx < oo.
Naše úvahy lze rozšiřovat na podstatně větší definiční obory funkcí, často ale za cenu značné technické námahy. Budeme občas zmiňovat prostory kurweilovsky (nebo lebesgueovsky) integro-vatelných funkcí, pro které jsou výsledky daleko ucelenější a pěknější. Zájemce odkazujeme na rozsáhlou specializovanou literaturu. Ve skutečnosti se budeme držet stejné strategie jako u racionálních a reálných čísel - počítáme jen s pěknými funkcemi a máme „nějak zvládnuto", jak vypadají limity cauchyovských posloupností ve zvolených metrikách (které většinou potřebujeme jen formálně).
Vzdálenost funkcí. Z námi již dokázaných vlastností limit a derivování je okamžitě vidět, že 5*, resp. 6^, jsou vektorové prostory. Na konečnědimenzionálních prostorech jsme uvažovali vzdálenost vekotorů pomocí rozdílů hodnot jednotlivých jejich souřadnic. Na prostorech funkcí můžeme postupovat podobě a využít absolutní hodnoty reálných nebo komplexních čísel (resp. euklidovské vzdálenosti) následujícím způsobem:
-J Vzdálenost funkcí |_———————
Na vhodném (nekonečném) vektorovém prostoru funkcí na daném intervalu, můžeme zavést i skalární součin. Skalární součin tedy nezavedeme na prostoru všech funkcí na daném intervalu, ale na jistém jeho podprostoru, který však bude dostačně veliký pro naše výpočty (mimo jiné bude obsahovat všechny spojité funkce na daném intervalu). Skalární součin nám umožní počítat projekce tak, jak jsme byli zvyklí u vektorových prostorů. Pokud máme dán konečně rozměrný vektorový (pod)prostor funkcí a chceme určit projekci nějaké fukce na něj, tak Grarimiovým-Schmidtovým ortogonalizačním procesem (viz 2.42) nejprve spočítáme ortogonální (či ortonormální) bázi tohoto podprostoru a pak známým způsobem (2.3) dopočítáme kolmou projekci.
7.1. V prostoru reálných funkcí na intervalu [1, 2], je dán vektorový podprostor (x2, 1/x). Doplňte funkci 1/x na jeho ortogonální bázi a určete kolmou projekci funkce x na tento podprostor.
Řešení. Nejprve doplníme funkci 1/x na ortogonální bázi. Jedním z vektorů báze tedy bude funkce 1/x. Uvažovaný vektorový prostor je generován dvěma lineárně nezávislými funkcemi, bude tedy mít dimenzi 2 (a všechny vektory v něm jsou tvaru a- \ +b-x2, kde a, b e R). Zbývá nám tedy najít pouze ještě jeden vektor báze, který bude kolmý na funkci f\ = 1/x. Podle Grammova-Schidtova ortogonalizačního procesu ho hledáme ve tvaru f2 = x2 + k ■ \, k e R. Reálnou konstantu k určíme z podmínky kolmosti:
1
Definice. Pro funkce / a g z 6^ je jejich Li-vzdálenost definována vztahem
J a
l/W - g(x)\dx
Obdobně je Z.2-vzdálenost funkcí / a g definována vztahem
I/-SII2
oř
\f(x)-g(x)\2dx
1/2
Velikostí funkce H/Hj nebo ||/||2 rozumíme její vzdálenost od funkce nulové.
tedy
1 9 1
X X
(L,x2) ' 1 1.
1 1
x,xz) +k{-, -),
f21
■Jl X
x2 dx
{-, L)
2 1 1
dx
Hledaná ortogonální báze tedy j e (-, x2 — -). Nyní spočítáme pro-jekci px funkce x na tento podprostor (viz (2.3)):
(x, t) 1
+
(X, X
1 x ' x '
2 15 - 3
x 34 x
1,x2
-> • (x2
□
7.2. Uvažujme reálný vektorový prostor funkcí na intervalu [1,2] generovaný funkcemi -, \, \. Doplňte funkci - na ortogonální bázi
tohoto prostoru.
Řešení. Analogicky jako v předcházejícím příkladu, použijeme Grammova-Schmidtova ortogonalizačního procesu (s daným skalár-
ním součinem). Dostáváme tak postupně /2W = — 57 >
h(x) = — - + 247-
□
412
KAPITOLA 7. SPOJITÉ MODELY
V prvním případě L i -vzdálenost funkcí / a g s pouze reálnymi hodnotami vyjadřuje plochu uzavřenou mezi grafy těchto funkcí, nezávisle na tom, která funkce má větší či menší hodnoty. Protože uvažujeme po částech spojité funkce / a g, může být jejich vzdálenost rovna nule pouze když se od sebe liší nanejvýš svými hodnotami v bodech nespojitosti, tj. v nejvýše konečně mnoha bodech na ohraničených intervalech. Skutečně, jestliže se dvě naše funkce liší v jednom bodě xq, ve kterém jsou spojité, liší se i na nějakém dostatečně malém okolí tohoto bodu a toto okolí přispěje do vzdálenosti nenulovou hodnotou integrálu.
Máme-li tři funkce /, g a h, pak samozřejmě
ľ\h(x) - f(x)\dx = ľ \h(x) - g(x) + g(x) - f(x)\dx
J a J a
'-ľ
Ja
\h(x) — g(x)\dx
f
Ja
\g(x) ~ f(x)\dx,
a platí tedy obvyklá trojúhelníková nerovnost. Všimněme si, že odvození této nerovnosti využívá pouze trouhelníkovou nerovnost platnou pro velikost skalárů, platí proto i pro funkce /, g e 5^ s komplexními hodnotami.
Podobné je to pro druhou definici. Kvadrát velikosti \\f\\2 funkce / je
\f\\22
J a
\f(x)\Zdx
a je odvozen z dobře definovaného symetrického bilineárního zobrazení reálných funkcí do skalárů
(f,8)
-f
J a
f(x)g(x)dx
dosazením / za obě funkce. U komplexních hodnot ale obdržíme podobně tuto velikost ze skalárního součinu s použitím komplexní konjugace,
(f,8)
J a
f(x)g(x) dx,
jak jsme viděli u unitárních prostorů v třetí kapitole:
Určitě tedy bude platit i trojúhelníková nerovnost, protože celou diskusi můžeme odehrát v maximálně třírozměrném prostoru se skalárním součinem generovaném danými funkcemi f,gah.
7.3.
(Ne)konečnost dimenze a ortogonalita. Zůstaňme na chvíli u u naší definice /^-velikosti || ||2 na vektorovém prostoru 0, b € R určené polohou a rychlostí bodu v počátečním čase. Funkci y = f(t) lze získat např. vyřešením homogenní lineární diferenciální rovnice
(7.2)
/ + cůzy = 0
vyplývající z aplikace Newtonova zákonu síly pro daný pohyb. Doplňme, že funkce / má zřejmě periodu T = lit/co (v mechanice se však častěji mluví o kmitočtu neboli frekvenci 1/7) a že kladná hodnota a (vyjadřující maximální výchylku kmitajícího bodu od počátku) se nazývá amplituda, hodnota b (vyjadřující polohu bodu v počátečním čase) počáteční fáze a hodnota a> pak úhlová frekvence kmitavého pohybu.
Podobně se můžeme zabývat funkcí z = g{f), která udává napětí v závislosti na čase t v elektrickém obvodu s indukčností L a kapacitou C a která je řešením diferenciální rovnice
(7.3)
z" + co2z
0.
Rozdíl mezi rovnicemi (||7.2||) a (||7.3||) (kromě odlišné fyzikální interpretace) je pouze v konstantě co. Pro rovnici (||7.2||) je co2 = k/m,
413
KAPITOLA 7. SPOJITÉ MODELY
V konečněrozměrném případě reálnych nebo komplexních vektorových prostorů jsme uvažovali skalární součiny a velikost vektorů již ve druhé a třetí kapitole. Všimněme si teď, že při dovozování vlastností jsme vždy pracovali s dvojicemi nebo konečnými množinami vektorů.
Nyní to ale můžeme dělat s funkcemi naprosto stejně a pokud zúžíme naši definici skalárního součinu na vektorový podprostor generovaný (podle potřeby nad reálnými nebo komplexními čísly) jen konečně mnoha funkcemi f\,..., fk. Dostaneme opět dobře definovaný skalární součin na tomto konečněrozměrném vektorovém podprostoru.
Jako příklad uvažme funkce f i = x*, i = 0,... ,k. Jimi je v generován (£+1)-rozměrný vektorový podprostor Rkíx] všech polynomů stupně nejvýše k. Skalární součin dvou takových polynomů je dán integrálem. Každý polynom stupně nejvýše k je vyjádřen jednoznačným způsobem jako lineární kombinace generátorů fo, ..., fk- Pokud by navíc naše generátory měly tu vlastnost, že
(7.1)
(fi,fj)
|0 proř/j, 11 pro i = j,
jde o tzv. ortonormální bázi. Připomeňme si v této souvislosti proceduru Gramovy-Schmidtovy ortogonalizace, viz 2.42, která z libovolného systému lineárně nezávislých generátorů f i vytvoří nové (opět lineárně nezávislé) ortogonální generátory gt téhož prostoru, tj. (gi,gj) = 0 pro všechny / / j. Spočteme je přitom postupně jako g i = f\ a vzorci
, . (fl + Ugi)
gl+l — fl+l + aigl H-----1- aigl, a-i —---—t—
WgiV
pro£ > 1.
Aplikujme tuto proceduru pro ilustraci na tři polynomy 1, x, x2 na intervalu [—1, 1]. Dostaneme gi = 1,
g2 = X -g3=X2 = x2
— ľ
Slil2/-:
x ■ 1 dx ■ 1 = x — 0 = x
x2 • 1 dx ■ 1
— ľ
Příslušná ortogonální báze prostoru R2[x] všech polynomů stupně nejvýše tři na intervalu [—1, 1] je tedy 1, x, x2 — 1/3. Normalizací, tj. vhodným násobením skalárem tak, aby prvky v bázi měly velikost jedna, dostaneme ortonormální bázi
h2
3 1 P ,
-x, h3 = -y-(3X2 - 1/3).
Takovým ortonormálním generátorům Rk [x] se říká Legendreovy polynomy.
7.4. Ortogonální systémy funkcí. Právě jsme si připomněli výhody, které ortonormální báze podprostoru mají pro konečněrozměrné vektorové prostory. V předchozím příkladu Legendreových polynomů generujících
R2[x\ C V = Rk[x\,k > 2, bude pro libovolný polynom h e Vfunkce
H = {h, h\)h\ + {h, h2)h2 + {h, h3)h3
kde k je konstanta úměrnosti a m je hmotnost hmotného bodu; a pro rovnici (117.311) je co2 = (LC)"1.
Ve skutečnosti každý periodický děj, který lze zadat funkcí ve tvaru (|| 7.11|), se označuje jako harmonické kmitání a pro konstanty a,a>,b se používá takřka výhradně výše zmíněné označení převzaté z jednoduchého harmonického kmitání hmotného bodu v mechanice.
Když využijeme jednoho ze součtových vzorců
sin (a + P) = cos a sin f3 + siná cos f3, a, f3 e M, můžeme funkci / (viz (||7.1||)) zapsat jako (7.4) f(t) = c cos (cot) + d sin (cot) ,
přičemž c = a sin b, d = a cos b. Rovněž tedy funkce / z (||7.4||) vystihuje harmonické kmitání s amplitudou a = -Jc2 + d2 a s počáteční fází b € [0, 2tt) splňující sin b = c/a, cos b = d/a.
Důležitou úlohou v aplikačních problémech je skládání (tzv. superpozice) různých harmonických kmitání. Klíčovou pozici potom zaujímá superpozice konečného počtu harmonických kmitání vyjádřených funkcemi ve tvaru
f„(x) = an cos (ncox) + bn sin (ncox) pro n € {l,...,m}. Tyto jednotlivé funkce mají základní periodu 27t/(na>). Jejich součet
(7.5)
[an cos (ncox) + bn sin (ncox) ]
n = \
je proto periodickou funkcí s periodou 2jz/qí. Obecně platí, že superpozicí libovolných konečně mnoha jednoduchých harmonických kmitání majících souměřitelné periody je periodický proces, jehož periodou je nejmenší společný násobek primitivních period jednotlivých kmitání. Součet (|| 7.51|) doplněný o vhodné posunutí
(7.6) --h ían cos (ncox) + bn sin (ncox) ]
n = l
je právě m-tým částečným součtem funkcionální řady
00
(7.7) --h lan cos (ncox) + bn sin (ncox) ].
n = \
Z fyzikálního hlediska jde o složený periodický proces, jenž může sloužit jako přirozená aproximace superpozice nekonečného počtu jednoduchých harmonických kmitání (tzv. harmonických složek) funkcionální řady (|| 7.71|).
Nabízí se zde otázka, zda je možné naopak každý periodický proces „rozumně" vyjádřit superpozicí konečného a případně nekonečného počtu jednoduchých harmonických kmitání - zda každý periodický proces je výsledkem takové superpozice. Formulováno přesněji z pohledu matematiky, zda lze každou periodickou funkci
414
KAPITOLA 7. SPOJITÉ MODELY
jednoznačně určenou funkcí, která minimalizuje naši L2-vzdálenost \\h — H\\ mezi všemi funkcemi v R*[x], viz. 3.25.
Koeficienty pro nej lepší aproximaci zadané funkce pomocí funkce z vybraného podprostoru je možné tedy získat prostě integrací v definici skalárního součinu.
Uvedený přiklad podbízí následující zobecnění: Když provedeme proceduru Gramovy-Schmidtovy ortogonalizace pro všechny monomy 1, x, x2,..., tj. pro spočetný systém generátorů, co z toho vznikne?
Ortogonální systémy funkcí
Libovolný konečný nebo spočetný systém lineárně nezávislých funkcí v 6^ [a, b] takový, že každé dvě různé z nich mají nulový skalární součin, se nazývá ortogonální systém funkcí. Jestliže jsou všechny funkce /„ v posloupnosti po dvou ortogonální a zároveň je pro všechna n velikost \\f„ ||2 — 1, hovoříme o ortonormálním systému funkcí.
Uvažme tedy jakýkoliv ortogonální systém funkcí /„ e co
vyjádřit jako konečný součet (||7.6||), příp. alespoň jako součet řady (||7.71|). Kladnou odpověď pro významnou a širokou třídu periodických funkcí samozřejmě dostáváme pouze pro součet nekonečný (viz teoretická část).
Již jsme řekli, že periodické procesy hrají důležitou roh ve většině fyzikálních i technických oborů. Tradičně vyzdvihněme alespoň akustiku, mechaniku, elektrotechniku, kde se nepopiratelně ukazuje nutnost zodpovězení uvedené otázky. Kromě toho však hledání odpovědi vedlo ke vzniku svébytné matematické partie - teorie Fourierových řad. Ta se poté začala využívat při řešení dalších tříd problémů (mj. k řešení většiny důležitých typů obyčejných a parciálních diferenciálních rovnic) a přispěla k rozvoji samotných teoretických základů matematiky (např. k přesnému vymezení tak fundamentálních pojmů, jakými jsou funkce a integrál).
Název Fourierovy řady je pak na počest francouzského matematika a fyzika Jeana B. J. Fouriera, který jako první prakticky využil trigonometrické výrazy (|| 7.61|) ve své práci z roku 1822 věnované problematice vedení tepla (problematikou se začal zabývat v roce 1804 a práci sepsal již v roce 1811). Význam tohoto Fourierova počinu pro teoretickou fyziku, přestože se fyzice věnoval spíše okrajově, byl nesmírný: zavedl tím do oboru matematické metody, které dodnes patří ke klasickým nástrojům teoretické fyziky. Fourierova matematická teorie tepla se také stala základem pro George S. Ohma při odvození jeho slavného zákonu vedení elektrického proudu. Upozorněme ještě, že jiní matematikové studovali vlastnosti součtů (||7.6||) o mnoho let dříve než Fourier (kupř. L. Euler). Nedosáhli však zásadního výsledku směrem k možnému praktickému využití jako on.
7.6. Určete Fourierovy koeficienty funkce
(a) g(x) = sin (2x) cos (3x) , x e [—jt, Jt];
(b) g(x) = cos4x, x e [—jt, Jt].
Řešení. Případ (a). Neboť pro x e M je
sin (2x) cos (3x) = sin (2x) [cos (2x) cos x — sin (2x) sin x] = i sin (4x) cos x — sin2 (2x) sin x = ^ cos x sin (4x) — 1~c°s(4;t) sin x = — i sin x + i cos x sin (4x) + ^ sin x cos (4x) = — ^ sin x + ^ sin (5x) ,
vidíme, že Fourierovy koeficienty jsou nulové s výjimkou b\ = —1/2, b5 = 1/2.
Případ (b). Podobně z
cos4x
l+cos(2x) 2
= [cos2x] [l + 2 cos (2x) + cos2 (2x) ]
_ i
~ 4
| + \ cos (2x) + i cos (4x) , x e
1+2 cos (2x) +
1+cos(4jc)
415
KAPITOLA 7. SPOJITÉ MODELY
tehdy a jen tehdy, když
oo
11*1
«=1
Ještě než se pustíme do důkazu, zkusme lépe porozumět významu jednotlivých tvrzení této věty. Protože pracujeme s úplně libovolně zvoleným ortogonálním systémem funkcí, nemůžeme očekávat, že lze dobře aproximovat jakoukoliv funkci pomocí lineárních kombinací funkcí f i.
Např. když se omezíme u Legendreových ortogonálních polynomů na intervalu [—1, 1] pouze na sudé stupně, určitě budeme dobře aproximovat pouze nanejvýš sudé funkce. Nicméně hned první tvrzení věty nám říká, že vždycky budeme dosahovat nejlepší možné aproximace částečnými součty (v Í2-vdálenosti).
Druhé a třetí tvrzení pak můžeme vnímat jako analogii ke kolmým průmětům do podprostorů vyjádřeným pomocí kartézských souřadnic. Skutečně, pokud pro danou funkci g bodově konverguje řada F (x) = YlnĹi cnfn, pak je funkce F (x) v jistém smyslu kolmým průmětem g do vektorového podprostorů všech takovýchto řad.
Druhému tvrzení se říká Besselova nerovnost a je obdobou konečněrozměrného tvrzení, že kolmý průmět vektoru nemůže být větší než původní vektor. Rovnost ze třetího tvrzení se nazývá Par-sevalova rovnost a říká, že jestliže se vektor kolmým průmětem do podprostorů ostře nezmenší, pak do tohoto podprostorů jistě sám patří.
Na druhé straně ale naše věta neříká, že by částečné součty uvažované řady musely bodově konvergovat k nějaké funkci. To je jev, který v konečněrozměrném světě nemá obdobu. Řada F (x) obecně nemusí být konvergentní (tj. pokud bychom uvažovali obecnější funkce než je náš prostor 5° [a, b]) ani v případě, kdy nastane rovnost v (3). Pokud ale např. existuje konečná hodnota YlnLi lc« I a všechny funkce /„ jsou stejnoměrně omezené na /, pak zřejmě řada F (x) = Z~2T=i c"f" konverguje v každém x. Nemusí ale přitom konvergovat všude k funkci g. K těmto úvahám se brzy vrátíme.
Důkaz všech třech tvrzení věty je velmi podobný jako u konečněrozměrných euklidovských prostorů. Není divu, protože odhady vzdálenosti g od částečného součtu / se vlastně dělají jen v konečněrozměrném lineárním obalu dotčených funkcí:
Důkaz Věty 7.5. Zvolme libovolnou lineární kombinaci / — J2n=i an f n a spočtěme její vzdálenost od g. Dostáváme
k (,b k 2
US ~ ^2anfn\\2 — / g(x) ~ ^anfn(x) n = l Ja n = l
p b p b k _
— / \g(x)\2dx- / ^g(x)anfn(x) dx-
J a Ja,
n = l
p b k _ ľ b k
- / ^2a„f„(x)g(x) dx + / y^an/«(x)
Ja n=\ Ja n=\
k
dx
= llgll2 - Efl"C""^""2 ~ ^2ancn\\fn\\2 + ^a2\\ fn\\2 n — l n — l n — l
k
= llgll2 + E ll/«ll2((c« ~ an)(cn - a„) - \cn\2).
plyne, že a0 = 3/4, a2 = 1/2, a4 = 1/8 a že ostatní koeficienty jsou nulové.
V této úloze jsme si ukázali, že výpočet Fourierovy řady nemusí nutně vést na počítání integrálů (obvykle metodou per partes). Zvláště v situacích, kdy funkce g má tvar součinu (mocniny) funkcí y = sin (mx), y = cos (nx) pro m,n € N, stačí aplikovat středoškolské učivo (známé goniometrické vzorce). □
7.7. Najděte Fourierovu řadu pro periodické prodloužení funkce
(a) g(x) = 0, x e [—7t, 0), g {x) = sinx, x e [0, jt);
(b) g (x) = |*|, x e [-77-, 77-);
(c) g (x) = 0, x e [-1, 0), g (x) = x + 1, x e [0, 1). Řešení. Případ (a). Přímými výpočty získáváme
xq+2jt 0 n
2- / g (x) dx = 2. J 0 dx + 2- f sin x dx
x(j -jt 0
2- [-cosx]^ = 1,
jt j u jt
xq+2jt
~ f g(x) cos (nx) dx
X0
0 jt
j- f 0 dx + 2- f sin x cos (nx) dx
-71 0
a0
2tz
J_
2jt
J_
2n
f sin ([1 + n]x) + sin ([1 — n]x) dx
cos([l+n]x) cos([l— n]x) 1+n l—n
_ cos([l+«]7r) _ cos([l— n]jr) . 1 _|__1
1+n 1-n 1+n 1-
0- -
e N,
xq+2jT 0 jt
2; f g (x) sinx dx = 2- f Oúřx + 2-J sin2 x dx
-jt 0
xq
2^- / 1 — cos (2x) dx =
sin(2x) 2
0
2jt J ^ ' 2jt
0
xq+2jt 0 jt
2; f g (x) sin (nx) dx = 2- J 0 dx + 2- f sin x sin (nx) dx
x0 -jt 0
jt
2^- f cos ([1 — n]x) — cos ([1 + n]x) dx
2jt
sin([l— n]x) sm([l+n]x) l—n 1+n
0, pro n € N\ {1}
Dostáváme tak Fourierovu řadu
00 r /
1 i sin x i__1_
jt 2 ~1~2jt
n = l
cos([l+«]7r) _ cos([l— n]jr) , 1 .__1
1+n 1-n 1+n 1-
-) cos(nx)
Upravme ještě získaný výsledek. Pro sudá n totiž platí
cos([l+«]7r) _ cos([l—n]jr) , 1 , 1
1+n 1-n
n = l
1+n 1-n
a pro Uchá n pak
cos([l+«]jr) cos([l—n~\jr)
1+n 1-n
Celkem tedy
cos([l+«]jr) cos([l— n~\jr)
J_ + J_ + J_ + J_ =__4_
1+n 1 1-n 1 1+n 1 1-n n1-!
T 1+n T 1-n
■ -í___i— 4- —i— 4- —i—
1+n 1-n 1 1+n 1 1-n
1+n
1-n
T 1+n T 1-n
(-1)"
«2-l
n e N,
416
KAPITOLA 7. SPOJITÉ MODELY
Evidentně lze poslední výraz minimalizovat právě volbou an — cn, čími je první tvrzení dokázáno.
Dosazením této volby dostáváme tzv. Besselovu identitu
k k
lisH2 = llsll2-2_>»l2ll-f»ll2'
n—l n—1
ze které okamžitě díky nezápornosti levé strany vyplývá dokazovaná Besselova nerovnost
a tudíž můžeme výslednou řadu zapsat ve tvaru
2 0, jestliže pro každé x € M platí f (x + T) — f (x).
Je zjevné, že součty a skalární násobky periodických funkcí se stejnými periodami jsou opět periodické funkce s touž periodou.
b„ = pro n liché, bn = — pro n sudé.
□
Integrál fx0+T f(x)dx periodické funkce / přes interval
jxq
délky periody T nezávisí na volbě xq e
i
Poslední tvrzení se dokáže snadno:
Zvolme si dva takové levé hraniční body integrace xq a yo- Pomocí substituce t — x + kT s vhodným k převedeme fy0°+T fix) dx na případ, kdy y o e [xq, xq + T]. Nyní rozdělením intervalu integrace na tři části dokončíme důkaz.
Ortogonalitu Fourierova systému funkcí si můžeme spočíst docela snadno pomocí výletu do komplexních čísel, který se nám bude velice hodit později:
Připomeňme, že etx — cos(x) + / sin(x). Přímým derivováním součinu reálných funkcí ověříme, že pro funkce z(x) a q>(x) s reálnou proměnnou x a s reálnými hodnotami platí
(z(x) e^w)' = z'(x) e^w +i z(x) cp' (x) e^w .
Primitivní funkce ke komplexní funkci fix) s reálnou proměnnou x samozřejmě dostaneme pomocí primitivních funkcí k reálné a imaginární komponentě funkce /.
Můžeme si tedy velmi snadno spočíst integrál (předpokládáme m / n)
ľ" eimx e-inx dx = ľ" ei(m-n)x
J—jt J— jt
dx
1
i(m—n) 1
i(m—n)x-i7T
což je vždy nula, protože je jedno jestli o násobky ir obíháme po jednotkové kružnici v jednom nebo druhém směru.
Právě spočtený integrál vyjadřuje skalární součin (etmx, énx). Vidíme tedy, že skutečně všechny dvojice našich funkcí énx (s komplexními hodnotami) jsou na sebe kolmé.
Můžeme ale tento skalární součin rozepsat:
{eimx, énx) — (cos(mx) + / sin(mx), cos(nx) + / sin(nx))
= ((cos(mx), cos(nx)) + (sin(mx), sin(nx)))
+ ř'((sin(mx), cos(nx)) — (cos(nx), sin(mx))).
Všimněme si, že v imaginární části tohoto výrazu budeme integrovat Uché funkce přes interval [—Jt, it] a tedy dostaneme zaručeně nulu.
Funkce sin(x) a cos(x) se liší jen o fázový posun, tj. cos(mx — it/2) — sin(mx). Proto jsou oba sčítance v reálné části našeho výrazu stejné. Musí tedy dát nulu oba. Tím jsme ověřili ortogonalitu našeho systému funkcí.
Zároveň vidíme, že pro m — n je výsledkem reálné číslo f*^ dx = 2it a přitom zjevně musí opět být velikosti jak sin(nx) tak cos(nx) stejné. Nutně proto pro kladná n dostáváme velikosti
|| cos(nx)||2 = 7t, II sin(nx)||2 = tt.
Jen pro n = 0 dostáváme || 11|2 = 2it.
7.8. Nechť je dána Fourierova řada funkce / na intervalu [—Jt,7t] s koeficienty am,bn,m sNU {0}, n e N. Dokažte následující tvrzení:
(a) Jestliže f(x) = f(x + n), x e [—tv, 0], potom a2k-i = b2k-i = 0 pro každé k sN.
(b) Jestliže f(x) = —f(x + n), x e [—jt, 0], potom ciq = o-2k = b2k = 0 pro každé k sN.
Řešení. Případ (a). Tvrzení lze pro libovolné k e N dokázat přímo výpočty
jt
út2£-i = x f f(x)cos([2k — l]x) dx
—jt
0 jt
= £ / fix) cos i\2k - l]x) dx + £ / fix) cos ([2k - l]x) dx
-jt 0
— jt
= \x=y + jt\ = -l f fiy + Jt) cos i[2k-\][y + it]) dy
-2jt
jt
+± f fix) cos i[2k - l]x) dx
o
= 1-) fiy) cos i[2k - l][y + jt]) dy + 1 / fix) cos i[2k - l]x) dx
o o
= £ / fiy)[ cos i[2k - l]y) cos i[2k - l]jt)
o
jt
- sin i[2k - \]y) sin ([2k - \]jt) ] dy + ± f fix) cos ([2k - l]x) dx
o
= -±f fiy) cos i[2k - l]y) dy + ±f fix) cos ([2* - l]x) dx = 0,
o o
jt
b2k-i = i f f(x)sin([2k - l]x) dx
—jt
0 jt
= ± f fix) sin i[2k - l]x) dx + ^f fix) sin i[2k - l]x) dx
-jt 0
— jt
= | x = y + jt | = £ / fiy + Jt) sin ([2* - l][y + Jt]) dy
-2jt
jt
+± f /(x)sin([2/t - l]x) dx
o
= ±f fiy) sin i[2k -i][y + „]) + ±f fix) sin i[2k - l]x) dx
o o
jt
= jT-Í f(y) [sin ([2* - l]y) cos ([2k - l]n) + sin i[2k - l]jt) cos i[2k - \]y)] dy
o
jt
+± f /(jc)sin([2ik - l]x) dx
o
= ~Ú f(y) sin i[2k - l]y) dy + ^f fix) sin i[2k - l]x) dx = 0.
Případ (b). Okamžitě máme
ao = j; f f(x)dx = }7 I fix)dx + ±f fix)dx=0
— 71 —71 0
418
KAPITOLA 7. SPOJITÉ MODELY
fourierovy řady
Řadu funkcí
f (x) = — + J^(«n cos(nx) + bn sin(nx))
«=1
z Věty 7.5, s koeficienty
-I í
* Jx{
b„ = - f
* J x,
<0+2jt
g (x) cos(nx) dx,
g (x) s in (n x) dx,
nazýváme Fourierova řada funkce g na intervalu [xq, xq + 2jt]. Koeficienty an a bn se nazývají Fourierovy koeficienty funkce
g-
V praktickém použití chceme pracovat s Fourierovými řadami ;ijf' „ s libovolnou délkou periody funkcí T místo hodnoty 2it. Stačí k tomu jen přejít k funkcím cos(y-ni), sin(^nx). Jednoduchou substitucí proměnných t = a>x, kde w = iltí ověříme ortogonalitu našeho nového systému funkcí a přepočítáme koeficienty ve Fourierově řadě F (x) funkce g na intervalu [xq, xq + T]:
F(x) = — + y^(an cos(n&>x) + b„ sin(n&>x)),
«=l
které mají hodnoty
2 po+r
2 r
a„ = — / g (x) cos (na)x) dx, T Jx0
2 fx°+T bn = — / g(x) sin(n&>x) dx.
T Jxn
7.7. Vyjádření s exponenciálou. Před chvílí jsme při ověřování ortogonality funkcí cos(nx), sin(nx) vyšli ze základního vztahu pro parametrizaci jednotkové kružnice v komplexní rovině pomocí goniometrických funkcí. Uvažujmeme-li a> = 2it/T jako rychlost obíhání kružnice, kde T je čas jednoho oběhu, dostáváme tutéž parametrizaci ve tvaru:
&imt _ CQS Mt _|_ ;- sjn M^
Pro (reálnou nebo komplexní) funkci fit) a všechna celá čísla n si v tomto kontextu definujeme její komplexní Fourierovy koeficienty jako komplexní čísla
1 ľT'2
1 ľ1
Cn = ~ fii)Z-lmt dt.
1 J-T/2
Přímo z definice jsou přitom jasné vztahy mezi koeficienty a„ a bn Fourierových řad (po přepočtu formulí pro tyto koeficienty pro funkce s obecnou periodou délky T) a těmito komplexními koeficienty c„. Pro přirozená n dostáváme
c„ = \ian- ib„), c-n = \ian+ ib„)
a při výhradně reálných hodnotách funkce / jsou samozřejmě c„ a c-n komplexně konjugované hodnoty.
a poté analogicky jako v důkazu prvního tvrzení pro libovolné JeN dostáváme
jt
ú2k = x f /(-"O cos ([2&]x) dx
— jt
0 jt
= -\ f fix) cos i[2k]x) dx + f fix) cos i[2k]x) dx = \x = y + tc
-jt o
— jt jt
= j I f& + Jt) cos (i2k][y +rc]) dy + ± f fix) cos i[2k]x) dx
-2jt 0
= -±f fiy) cos i[2k][y + „]) dy + ± f fix) cos i[2k]x) dx
o o
jt
= —tf fiy) [cosi[2k]y) cos([2ik]7r) - sía([2k]y) sin ([2A:]jr)] dy
o
jt
+ - f fix) cos i[2k]x) dx o
= -i / fiy) cos i[2k]y) dy + ^f fix) cos i[2k]x) dx = 0,
o o
jt
b2k = ^ f f ix) sin i[2k]x) dx
— jt
0 jt
= ^ f fix) sin i[2k]x) dx + ^ f fix) sin (J2k]x) dx = \x=y + rc\
-jt o
= £ J fiy + TV) sin i[2k][y + jt]) dy + i / fix) sin i[2k]x) dx
-2jt 0
= -±f f(y) sin i[2k][y + jr])dy + ±f fix) sin i[2k]x) dx
o o
jt
= fiy) [sin ([2k]y) cos i[2k]n) + sin i[2k]n) cos ([2k]y)] dy
o
jt
+± f /(x)sin([2£]x) dx
o
= -jf f(y) sin (I2k]y) dy + ±f fix) sin i[2k]x) dx = 0. o o
□
7.9. Rozhodněte o konvergenci a stejnoměrné konvergenci Fourie-rovy řady funkce g{x) = e~x pro x e [— 1, 1).
Řešení. K rozhodnutí o konvergenci není třeba příslušnou Fourierovu řadu počítat. Zavedrne funkci s definovanou nals periodou T = 2 předpisem
g(-l)+ lim g(x)
s(x) := gix) = e~x, x e (-1, 1), .(1) :=--=
O této funkci totiž víme, že je součtem uvažované Fourierovy řady. Jinými slovy, Fourierova řada konverguje k periodické funkci s. Navíc tato konvergence je stejnoměrná na každém uzavřeném intervalu, který neobsahuje žádný z bodů 2k + í,k e Z. To vyplývá ze spojitosti funkcí g a g' na (—1, 1). Konvergence pak nemůže být stejnoměrná na žádném intervalu {c, d) s vlastností [c,d]n {2k + 1; k e Z} ^ 0, protože stejnoměrnou limitou spojitých funkcí je vždy funkce spojitá.
419
KAPITOLA 7. SPOJITÉ MODELY
Vyjádřili jsme tedy Fourierovu řadu F(t) pro funkci f(t) ve
tvaru
Takto lze psát Fourierovy řady pro funkce s reálnými i komplexními hodnotami, v obou případech ale budou obecně její koeficienty komplexní.
K tomuto vyjádření se ještě několikrát vrátíme, např. až budeme diskutovat prakticky mimořádně užitečnou Fourierovu transformaci.
Všimněme si ještě, že při pevně zvoleném T vyjadřuje výraz a — 2it/T právě změnu ve frekvenci způsobenou nárůstem n o jedničku. Je to tedy právě diskrétní krok, se kterým při výpočtu koeficientů Fourierovy řady měníme frekvence.
V pozdější části této kapitoly ukážeme, že Fourierovy řady pracují s úplným ortogonálním systémem na 5°. Budeme se na to ale muset napřed důkladně připravit. Proto zde teď zformulujeme užitečné výsledky předem a hned uvedeme několik praktičtěji orientovaných poznámek. K důkazům se vrátíme později.
7.8. Věta. Uvažujme konečný interval [a, b] s délkou T — b — a. Dále nechť f je funkce s reálnými nebo komplexními hodnotami v S1 [a, b] (tj. po částech spojitá funkce s po částech spojitou první derivací), periodicky rozšířená na celé R. Potom platí:
(1) Částečné součty s n její Fourierovy řady konvergují bodově k funkci
g(x) = Uum f(y)+ lim f(y)).
(2) Je-li navíc f spojitá periodická funkce s po částech spojitou derivací, pak je bodová konvergence její Fourierovy řady stejnoměrná.
(3) L^-vzdálenost ||íjv — /II2 částečných součtů sn Fourierovy řady od funkce f na S1 [a, b] vždy konverguje k nule při N -> 00.
7.9. Rozvoj periodických funkcí. Konvergentní Fourierova řada bude samozřejmě konvergovat i mimo původní interval [—T/2, T/2]a bude periodickou funkcí na celém
Jako příklad uveďme Fourierovu řadu pro periodickou funkci vzniklou z Heavisideovy funkce g(x) zúžením na jednu periodu. Tj. naše funkce g bude na intervalu [—it, 0] rovna —1 a na intervalu (0, it) bude rovna 1. Hodnotami v nule a v krajních bodech intervalu se nemusíme zabývat, protože stejně na koeficienty Fourierovy řady nebudou mít žádný vliv. Jejímu periodickému rozšíření na celé R se říkává „hranatá vlnová funkce".
Protože jde o funkci lichou, jistě budou všechny koeficienty u funkcí cos(nx) nulové. Pro koeficienty u funkcí sin(nx) spočteme
1 f71 b„ = -
* J-7T
g(x) sin(nx) dx
_ 2 ľ * Jo
sin(nx) dx
-d-(-D")-
Výsledná Fourierova řada je tedy tvaru
4 / 1 1
g(x) — — I sin(x) H— sin(3x) H— sin(5x) + . ir \ 3 5
a součet jejích prvních pěti a prvních padesáti členů je na následujících dvou obrázcích.
Zvláště tak řada konverguje k funkci g na (—1, 1), ale tato konvergence je stejnoměrná pouze na podintervalech [c, d] splňujících omezení — \ = it/4. Tentokráte jsou však nulové koeficienty an,n e N U {0}. K nalezení zbývajících koeficientů užitím metody per partes a (||7.8||) (součinem 2 lichých funkcí je funkce sudá) získáme
420
KAPITOLA 7. SPOJITÉ MODELY
x0 + T
Pokud za základní periodu pro takovou hranatou vlnovou funkci zvolíme interval [— T/2, T/2], tj. chceme pracovat s periodickým rozšířením Heavisideovy funkce s periodou T, jednoduše přepočítáme, že výsledná Fourierova řada je tvaru
1 1 - sin(3 0 dvojnásobným využitím metody per partes dostáváme:
a„ — - í x2 cos(2^yi)íix — 2 í x2 cos(jrnx) —3— cos(jrnx).
/ f(x) sin (ncox) dx
x0
f(x - 1) sin Sf-dx- f(x - 3) sin Sf- dx
[-(x - 1)^ cos '-f-]] + sin *f.]20 - [-(x - 3) £ cos ^]
4 = J_
2 njr
[(-!)"-!] +
-TT-sin^,
«ZJTZ 2
n € N.
Ihned odsud vidíme, že pro sudá n je b„ = 0. Si-
novu Fourierovou řadu díky tomu upravíme do tvaru
00
E[(^[(-l)"-l] + ^sinf)sin^]
V ( ~4 I (-l)""'^^ t2"-!]^ 2- l [2«-l]jr [2«-1]2jt2 / 5,111 4 « = 1
□
« = 1
7.11. Funkci §(x) = cosx, x e (0,7r) zapište jako součet kosinové a sinové Fourierovy řady.
Řešení. Samozřejmě platí
cosx = cosx, x e (—tt, tt),
přičemž na kosinus na levé straně nahlížíme jako na sudé rozšíření funkce g a na pravé straně jako na kosinovou Fourierovu řadu, která je dána jednoznačně.
Pro sinovou řadu pak musí být a„ = 0, n e N U {0} a snadno také spočítáme
jt 71
b\= ^ / cosx sinx dx = -}- f sin (2x) dx = 0, o o
bn = ^ f cos x sin (nx) dx
-}- f sin ([n + l]x) + sin ([n — l]x) dx
o
COs([ř? + l]x) i COs([ř7 — l]x)
n+1 ' n-1
2»[(-l)" + l]
(«2-l)jT
n e N\ {!}.
Jestliže uvážíme, že
b„ = 0 pro lichá n e N a ŕ„ = (n2l"1)ff Pro su(iá n, získáme
oo
cosx = £
« = 1
8«
(4«2-1)jt
sin (2«x)
x e (0, 7t).
□
7.12. Napište Fourierovu řadu n -periodické funkce, která se rovná kosinu na intervalu {—jt/2, ti/2), a kosinovou Fourierovu řadu 2tt-periodické funkce y = \ cosx |.
Řešení. Není obtížné si uvědomit, že hledáme pouze jednu Fourierovu řadu (druhá část zadání je reformulací té první). Sestrojme tedy Fourierovu řadu pro funkci g(x) = cosx,
421
KAPITOLA 7. SPOJITÉ MODELY
Z Weierstrassova kritéria je přímo zřejmé, že tato řada konverguje stejnoměrně a tedy bude / (x) spojitá. Z Věty 7.8 ale už víme, že ve skutečnosti je f (x) — x2 na celém intervalu [—1, 1], protože aproximujeme spojitou funkci na celém R a konvergence musí být stejnoměrná. Aproximuje tedy naše řada funkci x2 na intervalu [0, 1] výrazně lépe, než bychom to uměli s periodickým rošffením dané funkce jen z tohoto intervalu.
Pojdme ale v našich ilustracích dále. Díky stejnoměrné konvergenci můžeme využít věty o derivování a integrování řad člen po členu a spočítat Fourierovy řady pro funkce x a x3. Jednodušší bude derivování:
2 ~ (-1)"+! .
— > -sin(jrnx).
n = \
Tato řada už evidentně nemůže konvergovat stejnoměrně, protože periodické rozšíření funkce x není spojitou funkcí. Docela snadno lze ale přímo odvodit, že bodově konvergovat bude (viz. naše úvahy o alternujících řadách v ??), proto jsme skutečně dostali rovnost (viz. Věta ??).
Obdobně můžeme člen po členu integrovat a dostaneme
1 3
-x 3
2
—x
3
4 ^ (-1)" . . . —t > —~— sin(jrnx) n3 ^ n3
«=1
a výslednou Fourierovu řadu dostaneme dosazením za x z předchozí rovnosti.
7.11. Obecné Fourierovy řady a wavelety. V případě obecného ortogonálního systému funkcí /„ a z něj vytvářených řad se často hovoří o obecných Fou-*t~y rierových řadách vzhledem k ortogonálnímu T/<ř/■' ^ systému funkcí /„. Fourierovy řady a další z nich vycházející nástroje jsou využívány ke zpracování různých signálů, obrázků apod. Povaha použitých periodických goniometrických funkcí v klasických Fourie-rových řadách a jejich prosté škálování pomocí zvětšující se frekvence zároveň omezují jejich použitelnost. V mnoha oblastech aplikací proto vyvstala přirozená potřeba nalézt šikovnější úplné ortogonální systémy funkcí, které budou vycházet z předpokládané povahy dat a které bude možné efektivněji zpracovávat.
Obvyklým požadavkem pro rychlá numerická zpracování bývá rychlá škálovatelnost měřítek a možnost snadného posuvu o konstantní hodnoty. V takový systém lze například doufat, jestliže zvolíme vhodnou spojitou funkci i/r s kompaktním nosičem, ze které sestrojíme spočetně mnoho funkcí ijrjk, j, k e Z, pomocí translací a dilatací:
fjk(x) = 2J'2f(2Jx-k).
Pokud zároveň vyhovíme dvěma podmínkám:
• tvar mateřské funkce ý dobře vystihuje možné chování dat,
• její potomci Ýjk tvoří úplný ortogonální systém,
pak nejspíš bude dobře stačit k aproximaci konkrétního zpracovávaného signálu jen několika málo funkcí. Hovoříme o tzv. wavele-tech.
Nemáme zde prostor pro podrobnosti, jde o mimořádně živý směr výzkumu i základ komerčních aplikací. Zájemce snadno najde spoustu literatury.
Poznamenejme však, že ve skutečnosti se velmi často používají pouze diskrétní verze našich objektů, tzn. hodnoty
x e [—it/2, Tt/2]. Ze sudosti g plyne b„ = 0, n e N. Současně máme
ji/2
úq = ^ f cos x dx = ^,
-jt/2 jt/2
an = 2. j cos x cos (2nx) dx
-tt/2 jt/2
-tt/2
sin([2ř? + l]x) ■ sin([2ř? — l]x) 2n + l 2«-l
4 (-!)"+' 71 4«2-l
-| jt/2 ti/2
2« + l 2«-l
pro každé n e N. Všimněme si, že výpočet a0 bylo možné zahrnout do výpočtu obecného a„. Hledanou Fourierovou řadou je
1 + ±j:
«=i
(-D"
4«2-l
cos(2nx)
□
7.13. Funkci g(x) = ex rozviňte do
(a) Fourierovy řady na intervalu [0, 1);
(b) kosinové Fourierovy řady na intervalu [0, 1];
(c) sinové Fourierovy řady na intervalu (0, 1].
Řešení. V celé úloze budeme využívat vztahů (7.9)
/
ď [a sin (ax) + cos (ax) ]
e cos (ax) dx =----h C, a e
1 + a2
(7.10)
/
x ■ ,fl w e*[sin(/k) -lcos(fr)] e sin (fix) dx =----\-C, P e
1+02
které lze obdržet dvojí aplikací metody per partes. S jejich pomocí postupně vypočítáme
(a)
a0
2fexdx =2(e- 1),
2 f ex cos (2njtx) dx =2 n e N,
0
2(e-l) l+4«2jr2
1
ex[2nji sm(2njix) +cos(2njix) ] 1+4«2jt2
-ll
0
2 f ex sin (2njtx) dx =2 íiéN;
(b)
o
4«jr(l-e) 1+4«2jt2 '
eA [sm(2njix) —2nji cos(2njix) ] l+4«2jr2
nl
0
a0
2fexdx =2(e- 1),
0
1
2 f ex cos (njtx) dx =2
qx[hji sin(njix) +cos(njix)]
1+«23t2
2[(-l)"e-l]
(C)
l+«2Jr
2^2
n e N;
422
KAPITOLA 7. SPOJITÉ MODELY
všech funkcí ýjk jsou pouze tabelovány v diskrétní (hodně velké) množině bodů a jsou v tomto smyslu i ortogonální. Dobrým příkladem jsou standardy JPEG2000, které tuto techniku používají a jsou nástrojem pro profesionální komprimaci obrazových dat ve filmovém průmyslu, nebo formát DjVu komprimace publikací.
Jedny z prvních waveletů sestrojila Ingrid Daubechies. Na obrázku niže je tzv. Daubechies mateřská wavelet D4(x) a její dcera
D4(2~
1).
3 4
Průběh funkce D4 není popsán analytickým způsobem. Funkce je zadána pouze tabelovanými hodnotami pro konečnou (byť velmi velkou) množinu argumentů. Je zvolena tak, aby měla ve svých různých částech všechny vlastnosti, které jsou třeba pro grafická data potřebné — pomalý i rychlý růst, ostrý zlom v obou extrémech apod. Složitost konstrukce spočívá samozřejmě v tom, abychom skutečně dostali pomocí výše uvedené konstrukce ortogonální systém!
2. Metrické prostory
V této části kapitoly se trochu abstraktněji zamyslíme nad pojmy vzdálenost a konvergence. Bude se nám to hodit v zápětí při důkazech již formulovaných výsledků o Fourierových řadách a v nejrůznějších kontextech se k těmto pojmům budeme vracet. Berme proto další stránky jako velmi užitečný (a snad ještě stále stravitelný) výlet do matematiky pro zdatné či odvážné.
7.12. Metriky a normy. Při odvozování techniky Fourierových řad jsme volně hovořili o vzdálenosti na prostoru funkcí. Nyní se u tohoto pojmu zastavíme pořádněji. I| Euklidovská vzdálenost ve vektorových prostorech M" splňuje, stejně jako tomu bylo u naší L i-vzdálenosti d(f, g) — ||/ — g|| j na prostoru spojitých absolutně integrova-telných funkcích, následující tři abstraktní požadavky. Mějme v dalších odstavcích pořád na paměti tyto dva příklady.
' Axiomy metriky a normy
Množina X spolu se zobrazením d : X pro všechny prvky x, y, z e X podmínky
X
splňující
(7.2) d(x, y) > 0 a d(x, y) = 0, právě když x — y
(7.3) d(x,y) = d(y,x),
(7.4) d(x, z) < d(x, y) + d(y, z),
bn = 2 f ď sin (njtx) dx =2 o
2«7iTl+(-l)"+1e~
ex[s'm(njľx) —niľ cos(njľx)]
1+«27T2
1+«27T2
a následně pouhým dosazením získáme příslušné Fourierovy řady
(a)
(b)
(c)
e-l + 2(e-l)£fg^+47r(l-e)£
1+4«2JT2 ' "" V" ~' 1+4«27T2 '
n — 1 n — 1
i i o V"1 [(~l)"e~l] cosQjjn:)
e ~ 1 + z 2- iTňhfl ;
n = l
2tx E
n = l
«[l + (-l)"+1e] sin(«jrjc)
1+«2JT2
□
7.14. Funkci g(x) = n2 — x2 na intervalu [—jt, n] vyjádřete jako součet Fourierovy řady. Pomocí tohoto vyjádření sečtěte číselné řady
t—1 n1 t—1 n1
n—l n—l
Řešení. Také nyní bychom mohli využít sudosti zadané funkce g a metodou per partes spočítat nenulové koeficienty an. V teoretické části je však odvozena Fourierova řada pro funkci f(x) = x2 na intervalu [ — 1, 1]. Tím je vlastně dokázána identita
oo
/(-*) = | + ^ E xe(-l,l).
n = l
Odtud pak (s přihlédnutím k rovnosti g(—n) = g(jr)) plyne
n „_„ mix
g(x) =7t2- 3+^rE -~
\ « = 1
oo
7t
Stačilo
x e [—jt, Jt].
«=i
přičíst Jt2 a původní řadu vynásobit —1. Dále je třeba si uvědomit, že v argumentu kosinů bude pouze nx místo njtx. Perioda je tak jt -násobná (mění se 2/T a meze integrálu ve vzorci pro an) a při integrování kosinů nyní nedostáváme Jt ve jmenovatelích (při výpočtu «0 se proj eví změna horní meze). Proto j sme museli původní řadu j eště vynásobit Jt2. Jestliže čtenář není schopen projít si příslušné výpočty v hlavě a hned si uvědomit, kde vzniknou odlišnosti, doporučujeme mu, aby Fourierovu řadu funkce g raději vypočítal přímo. Když dosadíme x = 0 a x = jt, obdržíme již
-2 = i-2 + 4E^p, tj.
n—l n—l
a
00
0=|7r2 + 4E-
n = l
1 7TZ
"' tj" E „2 — 6
«=1
Jinak řečeno, nalezli jsme další způsob, jak lze vyjádřit
___ _ 1,1,1
32 42
Jt2 = 12(1 - i + £ - £ + ...) =6(1 + ^ + ^ + + •••)•
se nazývá metrický prostor. Zobrazení d je metrika na X.
□
423
KAPITOLA 7. SPOJITÉ MODELY
Je-li X vektorový prostor nad R a splňující
X
: je funkce 7.15. Pomocí Fourierovy řady funkce g (x) = ex,x e [0, 2it), vyčís-
(7.5) ||x|| > 0, přičemž ||x|| — 0, právě když x — 0,
(7.6) \\Xx\\ — \X\ ||x||, pro všechny skaláry X ,
(7.7) \\x + y\\ < \\x\\ + \\y\\,
pak funkci || || nazýváme norma na Z a prostor X je normovaný vektorový prostor.
Norma vždy zadává metriku d(x, y) =J^^^|^^^^^^^^J
Na začátku předchozí části této kapitoly jsme tedy ve skutečnosti definovali vzdálenost funkcí pomocí tzv. L i -normy. V euklidovských vektorových prostorech pak šlo také o normu ||x||, která je indukována z bilineárního skalárního součinu vztahem ||x||2 — (x, x), a obdobně jsme pracovali s normou na prostorech unitárních. Úplně stejně jsme pak obdrželi na spojitých funkcích Í2-normu.
Samozřejmě metriky zadané normou mají velmi specifické vlastnosti, protože jejich chování lze na celém prostoru X odvodit z vlastností v libovolně malém okolí nulového prvku x —0 e X.
7.13. Konvergence. Na zcela abstraktních metrických prostorech lze zavést pojem (blízkých) okolí jednotlivých prvků, konvergence posloupností prvků a související „topologické" pojmy prakticky úplně stejně, jako jsme to udělali pro reálná a komplexní čísla a jejich posloupnosti na začátku páté kapitoly, viz. 5.12-5.17.
Můžme tyto odstavce skoro zkopírovat, jen u Věty 5.17 narazíme na výrazně složitější důkazy. Začneme konceptem konvergentních posloupností v metrickém prostoru X s metrikou d:
J Cauchyovské posloupnosti j^.———
Uvažme libovolnou posloupnost prvků x$,x\,... v X takovou, že pro libolné pevně zvolené kladné reálné číslo e platí pro všechny dvojice prvků x;, x j posloupnosti, až na konečně mnoho výjimek (které závisí na volbě e),
d(Xi, Xj) < e.
Jinak řečeno, pro každé pevné e > 0 existuje index N takový, že předcházející nerovnost platí pro všechna i, j > N. Takové posloupnosti prvků se říká cauchyovská ^os^°^^^^^^^^^^^^J^
Stejně jako u reálných či komplexních čísel bychom rádi, aby každá cauchyovská posloupnost prvků x; e X konvergovala k nějaké hodnotě x v následujícím smyslu:
J Konvergentní posloupnosti ——
= 1 l+«2"
Řešení. Platí (viz také (||7.9||), (||7.10||))
2ji
a0 =I/e^x = l(e2--l),
o
2ji
- f ď cos (nx) dx = -o
eA [cos(nx)+n sin(nx)] l+n2
-i2jr
(l+«2)jr
, n en,
2jz
b„ = - f ex sin (nx) dx
o
eA [sin(nx)—n cos(nx)] 1+n2
-i2jr
«(e2lr-l) " (1+«2)jt
, n en.
Proto je
*x _ eZ7I-l / 1
+ E
n = \
zvs{nx)—n smjnx) 1+n2
, x e (0, 2tt).
Žádnou volbou x e (0, 2jt) ale nelze na pravé straně získat řadu E^Li ■ Tu bychom obdrželi pro x = 0. V tomto bodě zjevně není periodické prodloužení g na R spojité, a tak dostáváme
„ , J?(0)+ lim g(x) - / oo
e°+e271 _ x^2n- s _ e2lI-l / 1 _|_ cos 0-« sin 0
odkud plyne
jt \ 2 1 ^ l+n2 n = \
e27T + l n _ I i 1 2 ' e2ľr-l 2 2^ l+n2
a po uprave
«=i
v-^ 1 _ (jr-l)e2;r+jr+l 2- \+n2
n = l
l+n2 2(e2lr-l)
□
7.16. Určete součet řady
T —
t— (2n-
n = l
Řešení. Ke stanovení součtu této řady lze s úspěchem využít známých Fourierových řad mnoha různých funkcí. Připomeňme např. Fourie-rovu řadu
jt _ 4_ y cos([2n —1]*) 2 ji 2^ (2n-l)2 ' n = l
Jestliže pro posloupnost prvků x$,x\,... e X, pevně zvolený prvek x € Z a pro libovolné kladné reálné číslo e platí pro všechna i, až na konečně mnoho výjimek (závisejících na volbě e),
d(xi, x) < e,
říkáme, že posloupnost x;, / — 0, 1,..., konverguje k prvku x, kterému říkáme limita posloupnosti xí, i — 0, 1,... v metrickém prostoru X. ^^^^^^^^j
kterou jsme vypočítali pro funkci g(x) = \x\,x e [—n,n). Protože je tato funkce spojitá na [—jt, tt) a | — n \ = \ jt \, víme, že dokonce platí
jt _ 4- yj cos([2n —1]*)
n = l
Dosazení x = 0 nám dává
oo
ji 4 1
i ji1
n-i_í v_i_ ti V__ —
U 2 ji (2«-l)2' lJ- £- (2«-l)2 8 •
ř7 —1 ř7 —1
□
424
KAPITOLA 7. SPOJITÉ MODELY
Díky trojúhelníkové nerovnosti dostáváme pro každou dvojici prvků xí, x j z konvergentní posloupnosti, s dostatečně velikými indexy (značení jako v definici výše),
d(xi, x j) < d(xi, x) + d(x, x j) < 2e,
a proto je každá konvergentní posloupnost také cauchyovská. Metrické prostory, kde platí i obrácené tvrzení, tj. že každá cauchyovská posloupnost je konvergentní nazýváme úplné metrické prostory.
7.14. Topologie, konvergence a spojitost. Stejně jako v případě reálných čísel můžeme zformulovat konvergenci pomocí „otevřených okolí".
Otevřené a uzavřené množiny
Otevřené e-okolí prvku x v metrickém prostoru X (stručně e-okolí) je množina
0€(x) = {y e X; d(x, y) < e}.
Podmnožina U C Z je otevřená, jestliže obsahuje s každým svým bodem i nějaké jeho e-okolí. Pomnožina W C X je uzavřená, jestliže je její doplněk X\W otevřenou množinou.
Namísto e-okolí hovoříme také o (otevřené) e-kouli se středem v x. V případě normovaného prostoru si vystačíme s e-koulemi se středem v nule, jejichž přičtením k danému prvku x dostaneme právě jeho e-okolí.
Hromadné body podmnožiny A C X opět definujeme jako takové prvky x € Z, ke kterým konverguje nějaká posloupnost bodů z A neobsahující samotný bod x. Snadno uvidíme, že množina je uzavřená, právě když obsahuje všechny své hromadné body:
Skutečně, přímo z definice plyne, že množina A je uzavřená, právě když pro každý bod x ^ A existuje nějaké e > 0 takové, že celé e-okolí 0€ (x) má s A prázdný průnik. Pokud by tedy A byla uzavřená a x byl hromadný bod množiny A, který do A nepatří, pak jistě v libovolném takovém e-okolí takového x leží nekonečně mnoho bodů množiny A, což je spor.
Naopak předpokládejme, že A obsahuje všechny své hromadné body a uvažme x e X \ A. Pokud by v každém e-okolí bodu x existoval bod x€ e A, pak postupně volbami e — 1/n dostaneme posloupnost bodů x„ e A konvergující k x. Pak by ovšem x musel být hromadným bodem, a tedy v A, takže opět máme spor.
Pro každou podmnožinu A v metrickém prostoru X definujeme její vnitřek jako množinu těch bodů v A, které do A patří i s celým svým nějakým okolím. Dále definujeme uzávěr Ä množiny A jako sjednocení původní množiny A s množinou všech jejích hromadných bodů.
Snadno jako u reálných čísel ověříme, že libovolný průnik a libovolné konečné sjednocení uzavřených množin v metrickém prostoru je opět uzavřená množina.
U otevřených množin je to opět naopak: libovolné sjednocení oteřených množin je opět otevřená množina, ale jen konečný průnik otevřených množin je obecně opět otevřená množina. Dokažte si obě tvrzení podrobně sami!
Sami si také podrobně ověřte, že vnitřek množiny A je právě sjednocením všech otevřených množin v A obsažených, zatímco uzávěr A je průnikem všech uzavřených množin obsahujících A.
Uzavřené a otevřené množiny představují základní pojmy tzv. topologie. Aniž bychom zacházeli do hlubších podrobností a souvislostí, seznámili jsme se právě s topologií metrických prostorů.
7.17. Sečtěte řady
Z— «4' ^ «4
n—1 n—1
Řešení. Nejdříve připomeňme, že součty řad
_L = el
__, „2 g i __, n2
n — l n — l
EÍ
12
jsme určili už dříve. V této úloze naznačíme, jakým způsobem lze postupovat při počítaní součtů řad
——] n2k > __]
n — l n — l
pro obecné & e N. Využijeme identit
(7.11) ;
(7.12)
Esm (nx) -—-, x e (0, lit), TI
n = l
^+4E
cos(nx)
4-E
sin (nx)
X € (0, 27T),
«=1
«=1
které vyplývají z konstrukcí Fourierových řad postupně pro funkce g(x) = x a g(x) = x2 na intervalu [0, 27r). Podle (|| 7.111|) je
oo
£^i = -=i xe(0,27r).
n = l "
Dosazením do (||7.12||) získáme
OO 9 9
Ecos(m) _ 3jt — 6jtx+2jtz n2 ~ 12
« = 1
X € (0, 27T).
Pouhé dosazení pak dokáže platnost tohoto vztahu také v krajních bodech x = 0, x = 27T. Řada na levé straně má zjevně majo-rantu YlT^i ^>a proto konverguje absolutně a stejnoměrně na [0, 27r]. Můžeme ji tak integrovat člen po členu:
oo
Esinjnx) «3
« = 1
E
n = l
sin(ny) „3
3y2-6jry+2jr2
0 n = l
dy
-, x e [0, 27T].
J 12 J 12
0
Upozorněme, že ve skutečnosti lze člen po členu integrovat každou Fourierovu řadu. Analogicky dalším integrováním obdržíme
E
n = l
1— cos(nx)
E
n = l
cosiny)
0
IlZ^dy
o «=i
= / y3-*"f+^y dy = *4-4**W*2, xe[0,2jt].
o
Dosazení x = n vede na
oo . ^
l+(-l)"+1
E
n = l
E
n = l
1—cos(«7r)
48 1
425
KAPITOLA 7. SPOJITÉ MODELY
Pojem konvergence můžeme nyní zformulovat tak, že posloupnost prvků xt v metrickém prostoru X, i = 0,1,..., konverguje k x e X, právě když pro každou otevřenou množinu U obsahující x jsou všechny body naší posloupnosti, až na konečně mnoho výjimek, obsaženy v U.
Stejně jako u reálných čísel můžeme také definovat spojitá zobrazení mezi metrickými prostory:
Zobrazení / : W -> Z je spojité jestliže vzor /_1(V) každé otevřené množiny V c Z je otevřená množina ve W. Samořejmě to neznamená nic jiného než tvrzení, že pro každý prvek z = /(i)eZa kladné číslo e existuje kladné číslo <5 tak, že pro všechny prvky y e W se vzdáleností dw (x, y) < S je také dz(z, f(y)) < e.
Zcela stejně jako u reálných funkcí je zobrazení / mezi metrickými prostory spojité právě tehdy, když respektuje konvergence posloupností.
7.15. Z. p-normy. Nyní máme k dispozici obecné nástroje, se kterými se můžeme podívat na příklady metrických prostorů tvořených konečněrozměrnými vektory nebo funk-i cemi. Omezíme se na obzvlášť užitečnou třídu norem, ičneme na reálných nebo komplexních konečněrozměrných vektorových prostorech 1" a C" a definujeme pro pevné reálné číslo p > 1 a libovolný vektor z= (zi, ■ ■ ■, z«)
Dokážeme, že takto je definována norma. První dvě vlastnosti z definice jsou zřejmé. Zbývá dokázat trojúhelníkovou nerovnost. Vyjdeme přitom z tzv. Hôlderovy nerovnosti:
Lemma. Pro pevné reálné číslo p > 1 a každé dvě n-tice nezáporných reálných čísel x; a y i platí
J2xiyi
i=l
kde l/q = 1 — l/p.
(x>r) (x>0 ■
Důkaz. Označme si Z a ľ výrazy v součinu na pravé straně dokazované nerovnosti. Pokud jsou všechna čísla x; ■m, nebo všechna y i nulová, pak tvrzení platí. Předpokládejme tedy X ŕ 0 a Y ^ 0. erova nerovnost je užitečným přímým důsledkem kon-vexity exponenciální funkce. Definujme čísla vk a wk tak, aby platilo
xk = Xďk/P, yk = YeWk/4.
Protože 1/p+l/q = 1, můžeme uvažovat afinní kombinaci hodnot + a díky konvexitě exponenciály dostáváme
avk/p+wk/q
Odtud již přímo dopočítáme
1 1 Y í KyK ~ p
a sečtením přes k = 1,.
1 "
< -e - p
1 M ,\ wk
pXP
1 " — Yyq
qYP ^ 1
S přihlédnutím k tomu, že čitatel na levé straně je nulový pro sudá n a je roven 2 pro lichá n, lze obdrženou řadu zapsat jako
(7.13)
E
«=i
7t
(2n - l)4 48
Z vyjádření
oo oo oo
ri = r _J__i_ y_-_
«4 (2«)4 ^ (2«-l)4
pak plyne
n = \
n = \
16
«4 ^ (2«-
2-, „4 i5
«=i
15 ^ (2«-l)4 n = \
n = \
16 1 / 15 ' 2 ' 48
n = \
EL
90 '
(-d"
oo
čímž jsme sečetli první řadu. Součet druhé je
oo
E
n = l
E (2«-l)4 E (2„)4 E (2„
n = \
1 EL
2 ' 48
-d4
n = \
J_ TLL — 1JLL 16 ' 90 720-
n = \
16 ^ «4
«=1
Jak jsme řekli, obdobně lze postupovat při sčítání řad
oo oo
y- J_ y- (-!)"+'
n — 1 n — 1
pro další k e N. Je proto přirozené ptát se např. na součet řady E^Li ^3- O nalezení jejího součtu se však matematikové marně pokoušejí (bez přehánění) už celá staletí. To může čtenáře oprávněně překvapit, neboť naznačený postup bychom měli být schopni provést i pro všechny liché mocniny.
Můžeme třeba vyjít z identity
oo
cos(nx)
E
n = l
-ln (2 sin |), x e (0, lit),
kterou lze mimochodem opět dokázat tím, že funkci na pravé straně rozvineme do Fourierovy řady. Kdybychom stejně jako výše dvakrát integrovali člen po členu řadu na levé straně a v limitě dosadili x -» 0+, získali bychom právě řadu E^Li Mělo by tedy stačit dvojí integrování funkce na pravé straně a výpočet jedné limity. Integrování pravé strany ovšem vede na tzv. vyšší funkci, kterou není možné běžným způsobem vyjádřit pomocí funkcí elementárních, s nimiž pra-
cujeme.
□
7.18. Pomocí Parsevalovy rovnosti pro Fourierův ortogonální systém ověřte, že
oo
E
«=1
(2«-l)4 96'
Řešení. Součet uvedené řady jsme již stanovili (viz (||7.13||)). Nyní odhalíme, že číselné řady lze pomocí Fourierových řad sčítat ještě
funkce f(p) = YľnLi se nazývá Riemannova zeta funkce.
426
KAPITOLA 7. SPOJITÉ MODELY
Na pravé straně ovšem jednotlivé sumy dávají právě Xp a Yq a celý výraz je tedy roven l/p + l/q — 1. Vynásobením této nerovnosti číslem X Y dostáváme právě dokazovanou nerovnost. □
Teď už budeme umět dokázat, že || || je skutečně norma:
_^..^j MlNKOWSKÉHO NEROVNOST
snadněji. Tato cesta však podmiňuje znalost nemalého počtu Fourie-rových řad a může být pro čtenáře o něco náročnější. (Doporučujeme tak každému, aby porovnal řešení tohoto a předchozího příkladu.) Základem je volba vhodné Fourierovy řady. Vezměme kupř. Fou-
rierovu řadu
Pro každé p > 1 a všechny n-tice nezáporných reálných čísel (xu ... ,x„) a (yi, ..., y„) platí
jt _ 4_ y- cos([2n —1]*)
2 n Z-^ (2«-l)2 ' n = l
1
(E^ + ^) ^(E*f) +(E^f) •
kterou jsme obdrželi pro funkci g(x) = \x\, x e [—n, n) a kterou jsme k určení součtu číselné řady již jednou použili. Parsevalova rovnost
K ověření této praktické nerovnosti vede následující trik využívající Hôlderovu nerovnost. Jistě platí (všimněme si, že p > 1)
2 oo oo xq+T
pro ni říká
5>(*+w)'-1 <íE-f) • (E^+y^p~l)q) i + £t^ = if\x\2dX = ffx2dx = 24,
2 = 1 2 = 1 2 = 1 „ = 1 -jt 0
2 = 1
a stejně tak
E^+^-^ÍE^) •(E^ + ^)(p"1)9) •
2 = 1 \' = 1 7 \' = 1 7
Nyní sečtením posledních dvou nerovností, s využitím skutečnosti, že p + q — pq a tedy (p — l)q — pq — q — p, dostaneme
V 1 _ /2jP_ _ rP_\ jt
^ (2«-l)4 ~ \ 3 2/1« n = l
2 v* _ _ jt
16 ~~ 96-
£"=l(*i + V/)
(2x1
l/q
E*f
;=i
i/?
;=i
□
Nyní budeme ilustrovat, jak lze použít Fourierovy řady v teorii diferenciálních rovnic. Pro jednoduchost uvažujme pouze nehomogenní (srovnej s (||7.2||)) diferenciální rovnici
ale 1 — 1/g = takže jde právě o dokazovanou Minkowského nerovnost.
Ověřili jsme si tedy, že na každém konečněrozměrném reálném nebo komplexním vektorovém prostoru máme třídu norem || ||p pro všechna p > 1. Kromě toho ještě klademe
llzlloo =max{|z/|, i = l,...,n},
což je zjevně také norma.
Všimněme si, že Hôlderovu nerovnost můžeme v kontextu těchto norem zapsat pro všechna x — (xi,...,x„), y = (yi,..., y„) jako
(7.14)
y" + a2y = f (x)
s neznámou y v proměnné x e M, s periodickou spojitě diferencovatelnou funkcí / : R -» R na pravé straně a konstantou a > 0. Nechť je T > 0 primitivní perioda funkce / a nechť je na [— 772, T/2] známa její Fourierova řada, tj. identita
(7.15) f (x)
a OQ
«=i
2jxnx 2jxnx An cos--h Bn sin-
x e
Eix'i-i^i<
pro všechna p > 1 a q splňující 1/p+l/q — 1, přičemž pro p — 1 klademe q — oo.
7.16. L p-normy pro posloupností a funkce. Nyní docela snadno zavedeme normy i na vhodných nekonečněrozměrných vektorových prostorech. Začněme posloupnostmi. Vektorový prostor £p, p > 1, je množina všech posloupností reálných nebo komplexních posloupností x$,x\,... takových, že
7.19. Dokažte, že má-li rovnice (|| 7.141|) periodické řešení na R, pak perioda tohoto řešení musí být rovněž periodou funkce /. Dále dokažte, že rovnice (||7.14||) má právě jedno periodické řešení s periodou T právě tehdy, když je
(7.16)
2jxn
a - pro každé n e N.
AP
Řešení. Nechť je funkce y = g {x), x e M řešením rovnice (||7.14||) a má periodu p > 0. Aby bylo vůbec možné dosadit funkci g do diferenciální rovnice druhého řádu, musí existovat její druhá derivace g". Protože funkce g, g', g", ... mají stejnou periodu, také funkce
g"(x)+a2g(x) = f(x)
427
KAPITOLA 7. SPOJITÉ MODELY
Všechny posloupnosti s omezenými absolutními hodnotami členů tvoří prostor t^. Limitním přechodem pro n -> oo okamžitě z Minkowského nerovnosti vidíme, že výraz
je norma na lp. Obdobně klademe
Hxlloo = sup{|x;|, i — 0, 1,...}
a opět dostáváme normu.
Konečně, vraťme se k prostorům funkcí 5° [a, b] na konečném intervalu [a, b] nebo 6^ [a, b] na neohraničeném intervalu. S normou II ||i jsme se již setkali. Zjevně ale pro každé p > 1 a pro všechny funkce v takovém prostoru funkcí existují Riemannovy integrály
ľ
Ja
\f(x)\Pdx
a můžeme tedy definovat
ll/l
/ rb \ 1/P
= IJ \f(x)\pdx\
Riemannův integrál jsme definovali pomocí limitního přechodu vycházejícího z tzv. Riemannových součtů, které odpovídají dělením S s reprezentanty §;. V našem případě tedy jde o konečné součty
SS,? =El/&•)lP(*^•-*^•-l)■
^•=l
Hôlderova nerovnost použitá na Riemannovy součty součinu dvou funkcí fix) a g(x) dá
n
El/&0lls(£«0l(*«-*«-i) =
i=\
n
= El/(É«)I(*« -Xi-i)1/p\8&)\(xi -Xi-xÝli
i=\
< (zZ\f(^P(xi ■(^2\8^i)\q(xi-xi-1)\ ,
přičemž napravo máme zjevně právě součin Riemannových součtů pro integrály ||/||p a \\g\\q.
Limitním přechodem tak ověřujeme tzv. Hôlderovu nerovnost pro integrály:
J f(x)g(x) dx < IJ fixY dx\ IJ gixf dx\
plamou pro všechny nezáporné reálné funkce f a g v našem prostoru po částech spojitých funkcí s kompaktním nosičem
Přesně stejným postupem jako v předchozím odstavci odvodíme z Hôlderovy nerovnosti nerovnost Minkowského v její integrální formě:
\\f + g\\p < ll/llp + llsllp. Je tedy || || p je skutečně norma na vektorovém prostoru všech spojitých funkcí s kompaktními nosiči pro všechna p > 1 (a pro p — 1 jsme tuto skutečnost ověřili už dávno). Pro celý prostor 5° [a, b] po částech spojitých funkcí budeme sice také slovo norma v tomto kontextu používat, měli bychom ale přitom vědět, že musíme ztotožňovat funkce, které se od sebe liší jen hodnotami v bodech ne-spojitosti.
je periodická s periodou p. Jinak řečeno, funkce / je periodická jako lineární kombinace funkcí s periodou p. Tím jsme dokázali první tvrzení říkající, že p = IT pro jisté l e N.
Nyní předpokládejme, že funkce y = g (x), x e R je periodickým řešením rovnice (||7.14||) s periodou Tas vyjádřením Fourierovou řadou
Clo v—*
(7.17) g (x) = — + lan cos icůnx) + bn sin iconx)], x
n = \
kde co = 2ji/T. Vyhovuje-li g rovnici (||7.14||), musí mít tato funkce
spojitou druhou derivaci na R. Platí tedy
00
g'(x) = [conb„ cos iconx) — conan sin iconx)], x e M,
n = l
(7.18)
00
g"{x) = [—(i)2n2an cos iconx) — co2n2bn sin ( X2 mezi metrickými prostory s metrikami d\ a di řekneme, že je izometrie, jestliže pro všechny prvky x,y e X platí d2( 0, x,ys X, d(x, y) = d(y, x), x, y e X.
Položíme-li však x = z v (||7.23||), z (||7.22||) dostaneme (||7.24||). Podobně z volby y = z v (||7.23||) spoužitím (||7.22||) plyne X\ a í2 : X -> X 2 do dvou zúplnění prostoru Z a pišme X2, které je bijektivní izometrií. Jsou tedy v tomto smyslu skutečně Xi aX2 stejné.
7.18. Věta. Nechť X je metrický prostor s metrikou d, která není úplná. Pak existuje jeho zúplnění X s metrikou d a to jednoznačně až na bijektivní izometrie.
Důkaz. Myšlenka konstrukce je zcela identická jako u kon-^\ strukce reálných čísel. Dvě cauchyovské posloupnosti xí a y i bodů v X považujeme za ekvivalentní, jestliže d(xi, y i) konverguje k nule pro / jdoucí do nekonečna. Tady jde o konvergenci reálných čísel, tedy korektní definici.
Je vcelku zřejmé z vlastností konvergence na reálných číslech, že jde skutečně o relaci ekvivalence (ověřte si podrobně - např. tranzivita plyne z toho, že součet dvou posloupností konvergujících k nule také konverguje k nule).
Definujeme nyní X jako množinu tříd ekvivalence cauchyov-ských posloupností. Původní body x e X můžeme ztotožnit s třídou posloupností ekvivalentních s konstantní posloupností x; — x, i — 0, 1,....
Nyní je nasnadě, jak zadefinovat metriku d. Nabízí se uvažovat pro posloupnosti x — {xq, x\,...} a y — {yo, yi, ■ ■ ■}
ď(x, ý) — lim d(xi, yt).
Předně je třeba ověřit, že tato limita skutečně existuje a je konečná. Přímo z trojúhelníkové nerovnosti pro absolutní hodnotu na reálných číslech a skutečnosti, že obě posloupnosti x a y jsou cauchyovské, plyne, že jde o cauchyovskou posloupnost reálných čísel d(xi, y i■) a tedy její limita skutečně existuje.
Pokud vybereme jiné reprezentanty x — {x'0, x/1,...} a y — {yo, y'1,...}, pak z trojúhelníkové nerovnosti pro vzdálenost reálných čísel (je třeba uvážit důsledky pro rozdíly vzdáleností) vidíme, že
!(*;., 3/0 - d(Xi, yi)\ < wiy, 3/.) - dtf, yi)\+
| 0 najdeme v původním prostoru nějaké y takové, že vzdálenost konstatní posloupnosti prvků y od zvolené posloupnosti xí nebude větší než e. Protože je však posloupnost xt cauchyovská, budou všechny dvojice x„, xm jejích členů sobě blíže než o e pro dostatečně veliké indexy man. Pak ale nutně také výběrem y — xn projeden takový index budou již sobě prvky y axm blíže než o e a tedy i v limitě bude platit, žed(ý,x) < e.
Závěrem je tedy ještě třeba ukázat, že cauchyovské posloupnosti bodů rozšířeného prostoru Z vzhledem k metrice d jsou už nutně konvergentní. Jinak řečeno, chceme ukázat, že opakováním předchozí konstrukce již nedostaneme nové body. To uděláme tak, že budeme umět postupně body cauchyovské posloupnosti ík přiblížit body yk z původního prostoru X tak, aby výsledná posloupnost ý — {yi} byla hmitou původní posloupnosti vzhledem k metrice d.
Protože již víme, že je Z v Ž hustou podmnožinou, můžeme pro každý prvek ík z naší dané posloupnosti vybrat prvek Zk e Z tak, aby pro konstantní posloupnost Zk platilo d(xk, Zk) < i/k. Uvažme nyní posloupnost z — {zo, zi,...}. Původní posloupnost x je cauchyovská, tj. pro pevně zvolené číslo e > 0 najdeme index n(e) takový, že d(x„, xm) < e/2, kdykoliv budou min větší než n(e). Bez obav můžeme přitom předpokládat, že námi zvolený index n(e) je větší nebo roven číslu 4/e. Nyní dostáváme pro min větší než n (e):
d(Zmi Zn) — d(Zmi Zn)
— d(Zm, xm) + d{xm, xn) + d{xn, Zn) < l/m + e/2 + l/n < 2^ + | = e.
Jde tedy o cauchyovskou posloupnost z; prvků v Z a tedy ž e X. Zkoumejme, zda vzdálenost d(xn, z) skutečně jde k nule, jak jsme se snažili konstrukcí zajistit. Z trojúhelníkové nerovnosti
ď(~Z, Xn) < ď(~Z, Zn) + ď(~Z„, x„).
Podle našich předchozích odhadů ale jdou oba sčítanci napravo k nule a tím je důkaz ukončen. □
V dalších třech odstavcích si uvedeme tři docela jednoduché věty o úplných metrických prostorech, které mají spoustu důležitých aplikací jak v samotné matematické analýze, tak v ověřování konvergence numerických metod.
(xuz)x(xnz) xuz
< [(iuz)\(inz)]u[ľ\(iuz)]
— XUZU[ľ\(XUZ)]
XUZ ^0.
Ta je založena pouze na počítání s nezápornými čísly, neboť obecně platí
0,z>0,x€[0,z].
Ze zřejmého vztahu
XUZU[ľ\(XUZ)]=XUľUZ tak již dostáváme
d2(X, Z)
xuz
[(xuy)x.(xny)]u[(yuz)x.(ynz)]
(iuz)\(inz) i < [(iuz)\(inz)]u[ľ\(iuz)] <
XUZU[ľ\(IUZ)]
xuyuz (xuy)x(xny)
+
(yuz)x,(ynz)
xuyuz d2(X, Y) + d2(Y, Z),
xuy| 1 | yuz pokud XUZ^0aľ^0.ProX = Z = 0 nebo Y = 0 je však očividně trojúhelníková nerovnost splněna také.
V obou případech se tudíž jedná o metriky. Metrika d\ má spíše pomocný charakter a nelze říci, že by měla tak široké uplatnění jako ďi, kterou lze dohledat v literatuře pod názvem Jaccardova metrika. Pojmenována byla podle biologa Paula Jaccarda, který v roce 1908 pomocí funkce 1 — d2 účinně vystihl míru podobnosti mezi hmyzími populacemi. □
7.23. Nechťje
d(x, y) : =
x, y e
1 + 1 x-y | '
Dokažte, že d je metrika na R.
Řešení. Opět dokážeme jenom trojúhelníkovou nerovnost (ostatní je
zřejmé). Zavedme pomocnou rostoucí funkci
t
(7.27)
f (t)
1 + ť
t > 0.
Skutečnost, že / je rostoucí, ani není třeba ověřovat výpočtem první derivace. Stačí úvaha nebo jednoduchá úprava
fis) - f(r) = ^ - ^ = > 0, s > r > 0.
Platí proto
d(x, z) =
x-y
1+1 x-z
+
x-y+y-z 1 + | x-y+y-z
Ll^iJ-<
1 + | x-y | + | y-z | 1 + | x-y | + | y-z, | — 1 + | x-y
d(x, y) + d(y, z), x, y, z e I
x-y l+l y-z
1 + | x-y l + l y-z
x-y _|_ y-z
l+l y-z
□
7.24. Určete vzdálenost funkcí
f(x) = x, g(x) =
•Jl+xl
x e [1,2]
jako prvků normovaného vektorového prostoru Z na metrickém prostoru X s metrikou d se nazývá kon-trahujícízobrazení, jestliže pro nějakou reálnou konstantu 0 < C < 1 a všechny prvky x, y v X platí
rf(F(x), F (y)) < Cd(x, y).
Věta. Je-li F kontrahující zobrazení na úplném metrickém prostom X, pak existuje jeho pevný bod z € X, tj. F (z) — z.
Důkaz. Důkaz docela přímočaře sleduje intuitivní představy, že když je zobrazení kontrahující, mělo by se jeho iterované působení na nějaké počáteční hodnotě zo e X „hromadit" k nějakému bodu. K tomu pochopitelně potřebujeme úplnost, jinak by hmitní bod už nemusel v X existovat.
Zvolme tedy libovolné zo e X a uvažme posloupnost z;-, / — 0, 1,...
zi — F(zo), Z2 — F(zi),Zi+i — F(zi),... Podle předpokladů platí
d(zi+uzi) =d(F(zi),F(zi-i))
< Cd(zi,zi-i) <■■■< Cd(zuzo).
Z trojúhelníkové nerovnosti pak pro všechna přirozená čísla j dostáváme
d(zi+j,Zi) < ydjzj+k, Zj+k-i)
k=l
j
< £ Ci+k~l d(zi, zo) = Čd(zi, zo) E c'
C
k=l
k=l
k-l
k=\
1 - C
d(zi, zo)-
Nyní pro každé kladné sebemenší e jistě bude výraz na pravé straně menší než e pro dostatečně velké indexy /, tj.
d(zi,Zi+j) <
1 - C
d(zi, zo) < e.
To ale přesně říká, že je naše posloupnost zi cauchyovská. Díky úplnosti prostoru X bude tedy existovat její limita z a k dokončení důkazu je již jen třeba ověřit, že F (z) — z.
Každé kontrahující zobrazení je ale zcela evidentně spojité. Je
tedy
F(z) — F( lim z„) = lim F(z„) — z.
Tím je tvrzení dokázáno.
□
7.20. Cantorova věta o průniku. Pro libovolnou množinu A v metrickém prostoru X s metrikou d nazýváme reálné číslo
diam A — sup d(x, y)
x,yeA
průměrem množiny A. O množině A říkáme, že je omezená, jestliže diam A < oo.
Věta. Je-li Ai D Aj_ D ■ ■ ■ D Ai D ... neklesající řetězec neprázdných uzavřených podmnožin v úplném metrickém prostoru X a diam Ai —>• 0, pak existuje právě jeden bod x € X patřící do průniku všech Ai.
Řešení. Případ (a). Stačí vypočítat
2 2
f\f(x)-g(x) \ dx=fx +
■■ dx
+ VTT?
| + Vš - V2.
Případ (b). Nyní chceme určit
max | f(x) - g(x) | = max Ix +
jce[l,2] *e[l,2] V -Jl+x1,
Při hledání extrémů funkcí je velmi silným a účinným nástrojem jejich derivování. Ihned z nerovnosti
i +
>0, xe[l,2]
vidíme, že
max (x + -7= )
jce[l,2] V
2 +
2 -2 + ^-
VT+22 ~ + VŠ"
Rostoucí funkce na uzavřeném intervalu totiž nabývá své maximální hodnoty v jeho pravém krajním bodě. □
7.25. Zjistěte, jestli je posloupnost {x„ }n£N, kde
X! = 1, x„ = 1 + \ + • • • + l, n € N \ {!},
cauchyovská v R. Uvažujte nejprve běžnou metriku danou rozdílem v absolutní hodnotě (tj. indukovanou normou, kterou je absolutní hodnota) a poté metriku
d(x, y) '.-Řešení. Připomeňme, že
x-y
1 + | x-y | '
(7.28)
Platí tak
Er = °°< tj- Er
oo, m e N.
k=\
k—m
lim |x„
k—m + 1
Odsud je vidět, že posloupnost {x„} nemůže být cauchyovská. Nalezli jsme odpověď pro běžnou metriku. Mohli jsme však hned využít toho, že posloupnost {x„} není podle (||7.28||) konvergentní, a vzpomenout si, že se nacházíme v úplném metrickém prostoru, kde cauchyovské a konvergentní posloupnosti splývají.
Pro metriku d si stačí uvědomit, že zobrazení / zavedené v (|| 7.271|) je spojitou bijekcí mezi množinami [0, oo) a [0, 1) s vlastností, že /(0) = 0. Libovolná posloupnost je tak konvergentní „v původním významu", právě když konverguje v metrickém prostoru R s metrikou d. Stejně tak platí, že posloupnost je cauchyovská v R vzhledem k běžné metrice právě tehdy, když je cauchyovská vzhledem k d. □
432
KAPITOLA 7. SPOJITÉ MODELY
Důkaz. Vyberme z každé množiny A;- jeden bod zi. Protože diam Ai -> 0, můžeme pro sebemenší kladné e najít index n (e) tak, aby všechny Ai s indexy / > n (e) už měly průměr menší než e. Pak ale nutně pro takto veliké indexy /, j bude také d(zi ,Zj) < e a tedy je naše posloupnost cauchyovská. Bude proto mít limitní bod z e X, který pochopitelně musí být hromadným bodem všech Ai a proto patří do všech A i (když jsou všechny uzavřené) a tedy patří do jejich průniku.
Dokázali jsme tedy existenci z, zbývá odůvodnit jednoznačnost. Předpokládejme tedy, že máme body z a y, oba v průniku všech A/. Jejich vzdálenost pak ale musí být menší než průměr všech A;, ten ale konverguje k nule. Tím je důkaz ukončen. □
7.21. Věta (Bairova věta). Je-li X úplný metrický prostor, pak průnik libovolného spočetného systému otevřených hustých množin Ai je množina hustá v metrickém prostoru X.
Důkaz. Máme dán systém hustých a otevřených množin A; v X, i — 1, 2..., a chceme ukázat, že množina A — n^A, má s libovolnou otevřenou množinou U c X neprázdný průnik. Budeme postupovat induktivně s pomocí předchozí věty.
Jistě existuje zi e A i ní/, protože je ale množina A i otevřená, patří bod z\ do tohoto průniku i s uzávěrem svého €\ okolí U\ pro dostatečně malé €\. Označme si uzávěr této ei-koule U\ jako B\. Předpokládejme dále, že již jsou vybrány body zi a jejich otevřená e;-okolí U i pro / — 1,... ,n. Protože je množina A„+i otevřená a hustá v X, jistě existuje bod zn+i e A„+i n Ú„, protože je ale An+\C\Un otevřená, patří do ní bod zn+i i s dostatečně malým e„+i okolím Un+\. Pak jistě také pro uzávěry platí Bn+\ — Ún+\ C U„ a tedy uzavřená množina Bn+\ je obsažena v A„+i n Ú„. Jistě přitom můžeme předpokládat i e„ < 1/n.
Jestliže takto induktivně postupujeme od původního bodu zi a množiny B\, dostáváme neklesající posloupnost neprázdných uzavřených množin Bn, jejichž průměr jde k nule. Existuje tedy společný bod z všech těchto množin, tj.
což jsme chtěli dokázat.
n°
iBicn^ABní/,
□
7.22. Ohraničené a kompaktní množiny. Pro reálná čísla se nám osvědčily následující pojmy, které nám ulehčovaly vyjadřování. Pro metrické prostory je můžeme převzít skoro beze změn: 'MP^m^'— Vnitřním bodem podmnožiny A v metrickém prostoru je takový prvek, který do A patří i s nějakým svým e-okolím.
Hraniční bod množiny A je takový prvek x e X, jehož každé okolí má neprázdný průnik jak s A tak s doplňkem X\A. Hraniční bod tedy může, ale nemusí patřit do samotné množiny A.
Otevřené pokrytí množiny A je takový systém otevřených množin í/; cl.ie /, že jejich sjednocení obsahuje celé A.
Izolovaným bodem množiny A rozumíme prvek a e A, který má v metrickém prostoru X e-okolí, jehož průnik s A je právě jednobodová množina {a}.
Množina A prvků metrického prostoru se nazývá ohraničená nebo omezená, jestliže je její průměr konečný, tj. existuje kladné reálné číslo r takové, že d(x, y) < r pro všechny prvky x,y e A. V opačném případě je neohraničená nebo neomezená.
7.26. Je metrický prostor 1; max{|/(jc)|; x e [-1, 1]}
(a) ||/||p
(b) 11/11«, úplný?
Řešení. Případ (a). Pro každé n e N definujme funkci
fn(x) = 0, x e [-1, 0), fn(x) = 1, x e [±, l],
fn(x) = nx, x e [0, ±) .
Takto získaná funkční posloupnost {/„}„£n C n, m, n e N.
Zabývejme se případnou limitou posloupnosti {/„} v n(s). Spojitá funkce / proto musí splňovat
f(x) =0, x e [-1, 0], f (x) = 1, x e [e, 1] pro libovolně malé s > 0. Tedy nutně
f (x) = 0, x e [-1, 0], f (x) = 1, x e (0, 1].
Tato funkce však není spojitá na [—1, 1] - nepatří do uvažovaného metrického prostom. Posloupnost {/„} tak nemá limitu v 0 (chcete-li, ke každému e/2) existuje n(s) e N, pro které platí
s
(7.29) max | fm(x) - /„(x) | < -, m,n> n (s).
jce[-l,l] Z
Zvláště tak pro každé x e [—1,1] dostáváme cauchyovskou číselnou posloupnost {fn(x)}„eN C M. Neboť metrický prostor R s běžnou metrikou je úplný, každá (pro x e [—1,1]) posloupnost {/„(x)} je konvergentní. Označme
f (x) := lim /„(x), x e [-1, 1].
Limitním přechodem pro m -> oo v (||7.29||) obdržíme
max | f (x) - /„(x) | < f < s, n> n (e).
jce[-l,l] 2
To ovšem znamená, že posloupnost {/„}„£n stejnoměrně konverguje kfunkci / na [—1, 1]. Jinak řečeno, {/„}„£n konvergujek / vzhledem
433
KAPITOLA 7. SPOJITÉ MODELY
Metrický prostor X se nazývá kompaktní, jestliže v něm má každá posloupnost xt e X podposloupnost konvergující k nějakému bodu x e X.
U reálných čísel jsme si uváděli několik charakterizací kom-jŕ^, paktnosti. U metrických prostorů to je o něco složitější Jjjjžjí s pojmem ohraničenosti. Pro libovolné podmnožiny A, ., j^^V" B c X v metrickém prostom X s metrikou d definu-^ssšäiii' jeme vzdálenost
dist(A, B) — sup {d(x, y)}.
xeA,yeB
Je-li A — {x} jednobodová množina, hovoříme o vzdálenosti dist(x, B) bodu od množiny. Řekneme, že je metrický prostor X totálně omezený, jestliže ke každému kladnému číslu e > 0 existuje konečná množina A taková, že
dist(x, A) < e
pro všechny body x e X. Připomeňme, že metrický prostor je omezený, jestliže má celé X konečný průměr.
Je okamžitě vidět, že totálně omezený prostor je také omezený. Skutečně, průměr konečné množiny je vždy konečný a jeli A množina z definice totální omezenosti příslušná k e, pak vzdálenost dvou bodů d(x, ý) můžeme vždy shora odhadnout součtem dist(x, A), dist(y, A) a diam A, což je konečné číslo. V případě metriky na podmožině konečněrozměrného euklidovského prostoru tyto pojmy splývají, neboť omezenost množiny zaručuje omezenost všech jednotlivých souřadnic v pevně vybrané ortonormální bázi a odtud již plyne i totální omezenost (ověřte si podrobně samostatně).
Věta. Následující podmínky na metrický prostor X jsou ekvivalentní
(1) X je kompaktní,
(2) každé otevřené pokrytí X obsahuje konečné pokrytí,
(3) X úplný a totálně omezený.
Náznak důkazu. Jestliže je splněna druhá podmínka věty, pak je vcelku snadno vidět, že musí být prostor X totálně omezený. Skutečně, stačí si vybrat pokrytí X pomocí všech e-koulí se středy v bodech x e X. Z něho musí jít vybrat konečné pokrytí a množina středů x; koulí, které se v tomto konečném pokrytí vyskytují, již naplňuje podmínku z definice totální omezenosti. K důkazu implikace (2) ==>■ (3) tedy chybí ještě důkaz úplnosti. Uvažme cauchyovskou posloupnost x; ..
dokončit aspoň na vod na důkaz, nejlépe implikacemi (3) => (1)a(1) => (2)
□
7.23. Kompaktnost na spojitých funkcích. Jako příklad odlišného chování pojmu kompaktnosti v euklidovských prostorech a v prostorech funkcích si uvedem velice užitečné tvrzení známé pod jménam Arzelaova-Askoliho věta.
Věta. Množina M C C[a, b] je kompaktní, právě když je omezená uzavřená a stejnoměrně spojitá.
k zadané normě. Již dříve jsme navíc zjistili, že stejnoměrnou limitou spojitých funkcí je funkce spojitá. Díky tomu nemusíme dokazovat, že / € S[— 1, 1]. Metrický prostor je tudíž úplný.
Doplňme, že ke stejným závěrům (pomocí stejných úvah v obou variantách) bychom pochopitelně dospěli také pro obecnější metrický prostor S[a, b] spojitých funkcí na [a, b]. □
7.27. Jednu z nejdůležitějších charakteristik úplných metrických prostorů poskytuje tzv. princip vložených koulí. Ten říká, že metrický prostor (X, d) je úplný právě tehdy, když pro každou posloupnost {A„ }„£n do sebe vnořených (tj. An+\ c An, n e N) neprázdných uzavřených množin A„ platí
(7.30) Q An ŕ 0-
nm
Součástí tohoto tvrzení však je ještě jedna podmínka na uvažované posloupnosti {A„}. Požaduje se, aby
(7.31) lim sup {d(x, y); x, y € An} = 0.
n^oo
Zjistěte, zda lze tuto podmínku vynechat.
Řešení. Pravděpodobně v rozporu s očekáváním většiny čtenářů nelze podmínku (||7.311|) vynechat: při jejím vynechání se tvrzení stane neplatným. Potřebujeme uvést jediný protipříklad dokládající, že bez této podmínky tvrzení neplatí.
Uvažujme proto množinu X = N s metrikou
d(m, n) = H--\—, m ^ n, d(m, n) = 0, m = n.
v ' ' m+n ' ' ' \ > / '
První dvě vlastnosti metriky jsou očividně splněny. K dokázaní trojúhelníkové nerovnosti si stačí všimnout, že d(m, n) e (1, 4/3], je-li m n. Stejně lehce lze najít všechny cauchyovské posloupnosti. Těmi jsou tzv. skorostacionární posloupnosti - od jistého indexu konstantní (konstantní až na konečně mnoho výjimek). Každá cauchyovská posloupnost je tedy konvergentní a uvažovaný prostor úplný. Zavedme množiny
A„ := {m e N; d(m, n) < 1 + ^} , n e N.
Neostrá nerovnost v jejich definici zaručuje, že se jedná o uzavřené množiny. Neboť A„ = {n,n + 1, ...}, (||7.30||) neplatí. Při vynechaní podmínky (||7.311|) by to znamenalo, že metrický prostor není úplný, což není pravda. Pro jistotu dodejme, že
lim sup {d(x, y); x,y € An} = lim (l + ^-r) = 1^0.
434
KAPITOLA 7. SPOJITÉ MODELY
7.24. Důkaz věty 7.8 o Fourierových řadách. Obecný kontext metrik a konvergencí nám nyní umožní vrátit se k důkazu věty, ve které jsme dali částečný obrázek o bodové i jiné I konvergenci Fourierových řad. Nejde nám přitom o nutné f ^ ' podmínky konvergencí a v literatuře lze najít mnoho jiných formulací. Naše Věta 7.8 ale byla docela jednoduchá a postihla velké množství užitečných případů.
Pro začátek si bude dobré uvědomit, jak se mohou lišit konvergence vůči různým Lp normám. Pro zjednodušení budeme vždy pracovat v zúplnění prostoru nebo S], vzhledem k příslušné normě, aniž bychom dumali nad tím, o jaké přesně prostory jde (i když bychom je mohli popisovat docela snadno pomocí Kurzwei-lova integrálu).
Hôlderova nerovnost (použitá na funkce / a konstantu 1) dává na 5° [a, b] první z následujících odhadů
j\f(x)\dx <\a-b\l"i^j\f{x)fdx
< |fl-r|l/9Cl/9 (jľVtol
1/P
dx
l/P
kde p > 1 a 1/p + l/q = 1, C > \f(x)\ na celém intervalu [a, b] (takové stejnoměrné omezení konstantou vždy existuje, když je / e 5° [a, b]). Druhý odhad okamžitě plyne z odhadu \f(x)\P < Cp~l \f(x)\a vztahu 1 - l/p = l/q.
Je tedy z prvního odhadu zjevné, že L p -konvergence /„ -> / bude pro jakékoliv p > 1 vždy silnější než Li-konvergence (a drobně upraveným odhadem ukážeme i obdobné silnější tvrzení, že
7.28. Dokažte, že metrický prostor l-i je úplný.
Řešení. Uvažujme libovolnou cauchyovskou posloupnost {x„}„eN v prostoru h. Každým členem této posloupnosti je ovšem zase posloupnost, tj. x„ = {j4}«-eN, neN. Poznamenejme, že samozřejmě nezáleží na rozsahu indexování - zda n,k e N, resp. n, k e N U {0}. Zavedrne pomocné posloupnosti pro JeN tak, že
Je-li {xn} cauchyovská v h, pak tím spíše musí být cauchyovská každá z posloupností y k v R (posloupnosti y k jsou posloupnostmi reálných čísel). Z úplnosti R (vzhledem k běžné metrice) plyne, že všechny posloupnosti yk jsou konvergentní. Jejich limity označme jako Zk, k e N.
Stačí nám dokázat, že z = {zk)ken e h a že posloupnost {xn} konverguje pro n -» oo v l2 právě k posloupnosti z. Posloupnost {x„}neN C h je cauchyovská, a tak ke každému s > 0 existuje n (e) e N s vlastností, že
]T} (x?L\ — x*)2 < s, m, n > n(e), m, n e N.
Zvláště je
(ŕm — ŕn)2 < s, m, n > n(e), m,n,l e N,
Lq konvergence je silnější než Lp konvergence, kdykoliv je q > p, odkud limitním precnodem pro m -> oo lze obdržet
zkuste si sami). Pro použití druhého odhadu ale musíme požadovat stejnoměrnou omezenost posloupnosti funkcí /„, tj. omezení funkcí /„ konstantou C musí být nezávislé na n. Pak totiž můžeme odhadnout | /„ (x) — f(x) \ < 2C a dostáváme z našeho odhadu, že Li-konvergence je silnější než L p -konvergence.
Jsou tedy všechny Lp-normy na našem prostoru 5° [a, b] rovnocenné z hlediska konvergence stejnoměrně omezených posloupností funkcí.
Nejtěžší (a také nej zajímavější) bude dokázat první tvrzení Věty 7.8, které bývá v literatuře označováno jako Dirichletova podmínka (a byla údajně odvozena již v roce 1824). Dokážeme proto nejprve, jak z této vlastnosti bodové konvergence vyplývají tvrzení (2) a (3) dokazované věty. Bez újmy na obecnosti můžeme předpokládat, že pracujeme na intervalu [—it, it], tj. s periodou T = 2it.
Jako první krok si připravíme jednoduché odhady pro koeficienty Fourierovy řady. Samořejmý je odhad
Y^izk-x*) n(s), n,l e N,
k=l
tj. (tentokráte l -> oo)
oo
(7.32) (zk - 4)2 < n > "(e), n eN.
k=l
Speciálně máme
Y(z,k-xkn) < oo, n > n (e), neN
a současné
]T (x*)2 < oo, neN,
k=l
1 fn \a„\ < - \
což plyne přímo z {x„}„£n C h- Protože
\.f(x)\ dx
a totéž pro všechna bn, neboť jak cos(x), tak sin(x) jsou v absolutní hodnotě ohraničené jedničkou. Pokud je ale / spojitá funkce v S1 [a, b], můžeme integrovat per partes a dostaneme
k=\
k=\
k=\
a„{f)
i r
* J-71
fix) cos(nx)iix
E(^-4) =E z2k - izkxi + (rny
k=l k=l L
n e N,
-[fix)sminx)Y_n
1 ľ71 ,
— / f
nit J-jt
musí být
(x) sin(nx) dx
E A
< oo.
-bnif).
k=\
Píšeme zde an (/) pro příslušný koeficient funkce / atd.
Tím jsme dokázali, že z e li. Skutečnost, že {x„} konverguje pro n -> ookz v Z2, vyplývá z (H7.32II). □
435
KAPITOLA 7. SPOJITÉ MODELY
Vidíme tedy, že čím „hladší" funkce, tím rychleji se blíží Fou-rierovy koeficienty k nule. Iterací této procedury skutečně dostaneme odhad pro funkce / v [—it, it] se spojitými derivacemi až do řádu k včetně
\a„(f)\
\f(k+1)(x)\dx
a totéž pro bn (f). Jinak řečeno, pro dostatečně hladké funkce / jsou n^-násobky jejich Fourierových koeficentů a„ abn ohraničeny L i -normou jejich k-té derivace / ®.
Předpokládejme tedy, že máme spojitou funkci / v prostoru S1 [a, b], jejíž částečné součty Fourierovy řady bodově konvergují k /. Můžeme pak odhadnout
\sn(x) - f(x)\ -
(a* cos(kx) + bi sin(/tx))
k=N+l
< E (ifl*i + i**i)-
k=N+l
Pravou stranu můžeme dále odhadnout pomocí koeficientů a'n a b'n derivace /' (s použitím Hôlderovy nerovnosti pro Lp aLq normy pro nekonečné řady s p — q — 2, viz 7.15, a Besselovy nerovnosti pro obecné Fourierovy řady. viz 7.5.(2))
\sn(x) ~ f(x)\
k=N+l
E
k=N+l
iY/2 k2)
E i'
E
\=N+1
r^ll/,|l:
\K\2)
1/2
= 1
ll/'ll
Dostali jsme takto nejen důkaz stejnoměrné konvergence naší řady k předjímané hodnotě, ale také odhad rychlosti konvergence:
SUp|5jvW-/WI < (^=\\f'h
N
Tím je dokázáno tvrzení 7.8.(2) za předpokladu platnosti Dirichle-tovy podmínky 7.8.(1).
7.25. /^-konvergence. V dalším kroku našeho důkazu odvo-\^ díme /^-konvergenci Fourierových řad za předpo-'% kladu stejnoměrné konvergence. Důkaz se opírá o obvyklou techniku aproximace nespojitých objektů spojitými, kterou popíšeme jen bez podrobností. V případě zájmu či potřeby by mělo být vcelku snadné detaily doplnit. Sformulujeme si napřed potřebné tvrzení obecně:
Lemma. Podmožina spojitých funkcí f v 5° [a, b] na konečném intervalu [a, b] je v tomto prostoru hustá podmnožina vzhledem k L^-normě.
Myšlenka důkazu je dobře vidět na příkladu aproximace Hea-visidovy funkce h na [—it, it]. Pro každé it > S > 0 definujeme funkci f s jako x/S pro \x\ < S a f s (x) — h (x) jinak. Zjevně jsou všechny funkce f s spojité, protože jsme bod nespojitosti překlenuli pomocí vhodné lineární funkce na intervalu, jehož velikost je kontrolována pomocí S. Velmi jednoduše se spočte, že \\h — f s ||2 —>• 0,
7.29. V metrickém prostoru *=0)
-1
Jsou tyto množiny otevřené, uzavřené?
Řešení. Vnitřkem množiny M rozumíme množinu všech vnitřních bodů a značíme jej M°. Libovolná množina M je pak otevřená, právě když M = M°. Podobně zavádíme uzávěr množiny M jako množinu všech bodů majících nulovou vzdálenost od množiny M a značíme ho M. Stejně snadno vidíme, že libovolná množina M je uzavřená právě tehdy, když M = M. Protože platí
A° = A, A = {/ e 1]; /(O) e [0, 2]}, E° = 0, B = B,
je množina A otevřená a není uzavřená a množina S je naopak uzavřená a není otevřená. □
7.30. Nechť je dána libovolná množina 1/0. Zobrazení d : X x X -> R definované předpisem
d(x, y) := 1, x ^ y, d(x, y) := 0, x = y
je zjevně metrikou na X. Hovoří se o tzv. triviálním nebo častěji o diskrétním metrickém prostom (X, d).
(a) Popište všechny cauchyovské a konvergentní posloupnosti
v (X, d).
(b) Popište všechny otevřené, uzavřené a ohraničené množiny v (X,d).
(c) Popište vnitřní, hraniční, hromadné a izolované body libovolné množiny v (X, d).
(d) Popište všechny kompaktní množiny v (X, d).
Řešení. Za (a). K tomu, aby mohla být jakákoli posloupnost {x„}„eN cauchyovská, je v tomto prostoru nutné, aby existoval index n e N takový, že x„ = xn+m pro všechna m e N. Posloupnost s touto vlastností pak nutně konverguje ke společné hodnotě x„ = x„+1 = (mluvíme o skorostacionárních posloupnostech). Mimo jiné jsme tak dokázali, že metrický prostor (X, d) je úplný.
Za (b). Otevřené 1-okolí libovolného prvku obsahuje pouze tento prvek. Každá jednoprvková množina je tedy otevřená. Neboť sjednocení libovolného počtu otevřených množin je otevřená množina, je každá množina v (X, d) otevřená. To ale rovněž znamená, že každá množina je současně uzavřená. Skutečnost, že 2-okolí libovolného
436
KAPITOLA 7. SPOJITÉ MODELY
neboť funkce / je omezená v absolutní hodnotě a tedy příspěvek integrace přes stále se zmenšující interval musí jít k nule.
Zcela stejným způsobem můžeme ošetřit všechny body nespo-jitosti obecné funkce /, kterých je maximálně konečně mnoho a tedy jsou skutečně všechny uvažované funkce hromadnými body posloupností spojitých funkcí.
Nyní je již náš důkaz jednoduchý, protože pro zadanou funkci / můžeme odhadnout vzdálenost od částečných součtů její Fourie-rovy řady pomocí spojitého přiblížení f€ takto (všechny normy v tomto odstavci jsou L2 normy):
Wf-SN (f) II < II / " U II + II U ~ SN II + \\SN " SN (f) II
a jednotlivé sčítance napravo umíme kontrolovat.
První z nich je nejvýše e, podle předpokladu o stejnoměrné konvergenci pro spojité funkce můžeme dosáhnout stejně malého ohraničení i druhého sčítance. U třetího je dobré si všimnout, že jde vlastně o velikost částečného součtu Fourierovy řady pro f — f€. Je tedy jistě
\\f-fe-sN(f-fe)\\ < Wf-M
a proto také (díky trojúhelníkové nerovnosti)
lkv(/-/e)ll <2||/-/e|| <2e.
Celkem jsme tedy odhadli celou vzdálenost pro dostatečně bllízké spojité funkce a dostačně velká N číslem 4e. Tím je dokazovaná L 2 konvergence potvrzena.
7.26. Dirichletovo jádro. A konečně se dáme do důkazu prvního \\ tvrzení věty 7.8. Přímo z definice Fourierovy řady F (ŕ) funkce fit) a s využitím jejího vyjádření s komplexní exponenciálou v 7.7 dostáváme pro částečné součty s n (0 výraz
fix)e-imkx émkt dx,
1 A CT'2
T k=-NJ-T'2
kde T je základní perioda, se kterou pracujeme a w — 2it/T. Tento výraz můžeme přepsat jako
rT/2
íjv(ř) — I Kpjit — x)fix) dx
J-T/2
a funkci
nazýváme Dirichletovo jádro. Všimněme si, že součet je kouskem geometrické řady s poměrem členů émy. Můžeme ji tedy přímo vyjádřit pro všechna y / 0 následujícím způsobem (po cestě násobíme čitatel i jmenovatel výrazem —Q~ia}y/2^ abychom uměli přepsat následně pomocí reálné funkce sin):
l Q-iNmy _QÍ(N+l)a>y
KNiy) = --
1
1 - eiú>y
-i(N+\/2)a>y
J(N+l/2)coy
J QÍmy/2 _ &-imy/2
1 sin((Ař+ l/2)oy)
T sin(&ry/2)
V bodě y — 0 samořejmě přímo vidíme KNiO) — j(2N +1).
Z posledního výrazu je také vidět, že Kf/(y) je sudá funkce a pomocí ĽHospitalova pravidla přímo rychle spočteme, že je to
prvku splývá s celým prostorem, pak znamená, že každá množina v (X, d) je ohraničená.
Za (c). Znovu využijeme toho, že otevřené 1-okolí každého prvku obsahuje pouze tento prvek. Odsud vyplývá, že každý bod libovolné množiny je jejím vnitřním a současně izolovaným bodem a že žádná množina nemá ani jeden hraniční nebo hromadný bod.
Za (d). Každá konečná množina v libovolném metrickém prostoru je zřejmě kompaktní (zadává kompaktní metrický prostor zúžením definičního oboru d). Z popisu konvergentních posloupností (viz (a)) plyne, že žádná nekonečná množina nemůže být kompaktní v (X, d). □
7.31. Rozhodněte, zda je množina (nazývaná Hilbertova krychle)
A = {{x„}„m el2; \x„ I < i, n e N} kompaktní v h- Poté rozhodněte o kompaktnosti množiny
B = {{Xn}neN e Zoo! | | < £, « € N}
v prostoru Zqo.
Řešení. Víme, že prostor Z2 je úplný. Každá uzavřená podmnožina úplného metrického prostoru sama zadává úplný metrický prostor. Množina A je očividně uzavřená v h, a tak k její kompaktnosti stačí ukázat, že je totálně omezená.
Vyjděme z nám dobře známého součtu
Pro každé s > 0 tak existuje n(s) e N splňující
E k\
2'
U k=n(e) + l
Z každého z intervalů [—l/n, \/n] pro n e {1, ..., n (e)} můžeme vybrat konečně mnoho bodů x", ..., x^(n) tak, aby pro libovolné x e [-l/n, 1/n] bylo
mm
j'e{l,...,m(«))
<
Uvažujme takové posloupnosti {y„ }„£n z h, jejichž členy s indexy n > n(s) jsou nulové a současně platí
yi e [x\,..., x1m(1)},..., yn(B) e |x"(e),..., xn^fn(B)) J.
Všech takových posloupností je konečně mnoho a tvoří e-síť pro A, neboť
y + fiH r- ^ + § < £ • tJtzt ~ 1 + f = e. Libovolnost s > 0 potom implikuje, že množina A je totálně omezená, což již dává její kompaktnost.
Rozhodnout o kompaktnosti množiny B je velmi snadné. Každá kompaktní množina totiž musí být uzavřená, a to množina B není. Jejím uzávěrem je
437
KAPITOLA 7. SPOJITÉ MODELY
funkce všude spojitá. Protože všechny částečné součty řady pro konstantní funkci fix) — 1 jsou také 1, dostáváme přímo z definice Dirichletova jádra
• r/2
Kpj(x)dx — 1.
-t/2
U periodických funkcí jsou jejich integrály přes intervaly délky periody nezávislé na volbě krajních bodů intervalu integrace. Proto můžeme pomocí změny souřadnic použít pro částečné součty též výraz
sN(x)
r t/2
J-t/2
KN(y)f(x + y)dy.
Teď konečně máme vše připraveno. Nejprve se budeme věnovat případu, kdy je funkce / v bodě x spojitá a diferencovatelná. Chceme pro tento případ dokázat, že Fourierova řada F (x) v bodě x konverguje k hodnotě f(x). Dostáváme
sn(x) ~ f(x)
-L
t/2
t/2
(f(x + y)- f(x))KN(y)dy.
Integrovaný výraz můžeme přepsat do tvaru, který bude připomínat opět Fourierovy koeficienty pro vhodné funkce:
f(x + y) - f (x)
J . ; sin((JV + \/2)y/2)
— y) 4 kde jsme si označili funkci
f(x + y)
y/2) cos(Afft>y)),
sin(&>y/2)
pro y / 0, zatímco y/2).
To ale znamená že s rostoucím N nutně tento výraz bNiÝ\) + aNÍÝ2) konverguje k nule (viz 7.5.(2)).
Závěrem se podíváme na konvergenci v případě, že v bodě x — 0 má funkce / nebo její derivace bod nespojitosti. Protože jde o funkci v S1, je v okolních bodech mimo x — 0 již spojitá a diferencovatelná. Rozložme si funkci / na její sudou část f\ a lichou část f2, tj.
/W = i(/W + /(-x)) + i(/W-/(-x)).
V bodě x — 0 přitom definujeme hodnotu f\(0) jako
1
-( lim
2 y^0+
fiy)
lim
fiy))-
Pak se snadno přesvědčíme, že sudá část f\ (x) je spojitá a diferencovatelná v bodě x — 0 (díky tomu, že jednostranné limity existují) a tedy i na celém okolí tohoto bodu. Zároveň nás nepřekvapí, že lichá část splňuje f2 (0) — 0 a stejně tak je v nule nulová i Fourierova řada, ve které jsou pouze členy s sin(n&>x).
Můžeme proto využít předchozího spojitého případu a spočíst pro Fourierovu řadu F (x) naší funkce /
F(0) = Fi(0) + F2(0) což jsme chtěli dokázat.
1 ,
-( lim
2V>o+
fiy)
lim fiy))
y^O-
■o,
B = {{x„}„eN e Zoo; | x„ | < -\, n e N}.
Množina B pak je kompaktní. Důkaz je výrazně jednodušší než pro množinu A, a proto jej přenecháváme čtenáři jako cvičení. □
D. Integrální operátory
Konvoluce je jedním z nástrojů k vyhlazování funkcí:
7.32. Určete konvoluci f * f2, kde
1
fiix)
Í2ÍX)
pro
x pro x e [0, 1] 0 jinak
Řešení. Hodnota konvoluce v bodě ř je dána integrálem fľ'oo fiix)f2Í.t — x) dx. Integrovaná funkce je nenulová pokud je druhý z činitelů nenulový, tedy pokud (ř — x) e [—1, 1], tj. x e [ř — 1, t + 1]. Hodnotu konvoluce v bodě t tak můžeme interpretovat jako integrální průměr funkce f přes interval (ř — 1, t + 1). Při integrování přes tento interval musíme rozlišit, náleží-li číslo 0 tomuto intervalu, či nikoliv. V případě, že interval nulu obsahuje, tak musíme integrál rozdělit na dva nevlastní integrály. Hodnotu menšího z nich však můžeme odečíst díky lichosti funkce \, a zbude nám integrál -\ dx (rozmyslete si, že předpis funguje i pro záporné ť). Dostáváme tak:
fl * Í2Ít)
f;\l idx = ln
\t+i
pro t e (—oo, -1] U [1, oo], pro t e [-1, 1].
□
Nyní zkusme spočítat konvoluci dvou funkcí, které mají obě konečný nosič.
7.33. Určete konvoluci f * f2, kde
1 - x2 pro x
fiix)
Í2ÍX)
0 jinak,
x pro x e [0, 1], 0 jinak.
Řešení. Hodnota konvoluce f * f2 v bodě t je dána integrálem přes všechna reálná čísla ze součinu funkce f (x) a funkce f2(t — x) podle proměnné x (viz 7.13). Je tedy tato hodnota nulová, jestliže je alespoň jedna z hodnot fix) a fit — x) nulová pro libovolné reálné x. Obráceně hodnota konvoluce může být v bodě t nenulová, pouze pokud
438
KAPITOLA 7. SPOJITÉ MODELY
V případě nespojitosti v obecném bodě můžeme postupovat obdobně a celý důkaz je ukončen (a tím i důkaz tvrzení (2) a (3) věty 7.8, v jejichž důkazech jsme přepokládali správnost Dirichle-tovy podmínky).
3. Integrální operátory
7.27. Integrální operátory. V případě konečněrozměrných vek-torových prostorů jsme mohli vnímat vektory jako ~ zobrazení z konečné množiny pevně zvolených gene-^'■^ - rátorů do prostoru souřadnic. Sčítání vektorů a náso-x> i^*- bení vektorů skaláry pak bylo dáno odpovídajícími operacemi s takovými funkcemi. Stejným způsobem jsme pak pracovali i s vektorovými prostory funkcí jedné reálné proměnné, když jejich hodnotami byly skaláry (nebo případně i vektory).
Nejjednodušší lineární zobrazení a mezi vektorovými prostory zobrazovala vektory do skalárů (tzv. lineární formy). Byla definována jako součet součinů souřadnic x; vektorů s pevně zvolenými hodnotami a; — a(e/) na generátorech e;, tj. pomocí jednořádkových matic:
(xi,..., x„)
(ai, ... ,a„) • (xi, ...,x„)
Složitější zobrazení s hodnotami opět v tom samém prostoru pak byla obdobně zadána čtvercovými maticemi. Velice podobně umíme přistoupit k lineárním operacím na prostorech funkcí.
Budeme chvíli pro jednoduchost pracovat s reálným vektorovým prostorem S všech po částech spojitých reálných funkcí s kompaktním nosičem definovaných na celém R nebo na intervalu / = [a, b]. Lineárním zobrazením S -> R budeme říkat (reálné) lineárnífunkcionály. Příklady takových funkcionálů můžeme velmi snadno zadat dvěma způsoby — pomocí vyčíslení funkce (případně jejích derivací) v jednotlivých pevně zvolených bodech nebo pomocí integrování. Příkladem funkcionálů L tedy může být vyčíslení v jediném pevném bodě xo e /
L(.n = f(x0)
a příklad s integrováním může být zadán pomocí pevně zvolené funkce g (x)
L(.n
-r
Ja
f(x)g(x)dx.
Funkce g (x) zde hraje roli váhy, se kterou při definici Riemannova integrálu bereme jednotlivé hodnoty reprezentující funkci f(x). Nejjednodušším příkladem takového funkcionálů je samozřejmě Riemannův integrál samotný, tj. případ s g (x) — 1 pro všechny body x.
Dobrou představu dává volba funkce
g(x)
| 0 je-li |x| > e je-li |x| < e.
2a
pro jakákoliv e > 0. Integrál funkce g přes R je jednotkový a náš lineární funkcionál můžeme vnímat jako (rovnoměrné) zprůměro-vání hodnot funkce / přes e-okolí počátku. Obdobně můžeme pracovat s funkcí
g(x) =
0
je-li |x| > e je-li |x| < e
se kterou jsme pracovali v odstavci 6.6. To je funkce hladká na celém R s kompaktním nosičem v intervalu (—e, e). Náš funkcionál
existují taková x, pro která f\ (i) ^ 0 ^ f2(t — x). Podle definice daných funkcí je to tehdy, pokud existují taková x e [—1, 1] (f\(x) ^ 0), že (ř - x) e [0, 1] (f2(t - x) £ 0). Neboli f\ * f2(t) může být nenulové pokud [f - 1, f + 1] n [0, 1] # 0. To nastává pro t e [-1, 2]. Integrujeme pak přes x náležící průniku intervalů [ř — 1, t +1 ] a [0, 1 ]. Tento průnik se dále Liší v závislosti na t e [—1,2]:
a) proř e [-1,0] je [ř - l,ř + 1] n [0, 1] = [0, t + 1],
b) pro t e [0, 1] je [ř - 1, t + 1] n [0, 1] = [0, 1],
c) pro t e [1, 2] je [ř - 1, t + 1] n [0, 1] = [ř - 1, 1].
V závislosti od průniku těchto intervalů je potom: a)
/OO ŕ fÁx)f2(t-x) dx = / -oo JO -í+1
ř+1
fi(x)f2(t - x) dx
Jo
(1
x2)(ř
x) dx
b)
ľ
fi(x)f2(t-x)
Í
Jo
1 4 a 2 --ŕ + t + -t
4 3
fi(x)f2(t -x)
1
4'
Jo
(1
x2)(ř
2 1
x) dx = -t--,
' 3 4
c)
Mx)f2(t-x)
f
Jt-1
(1
x2)(ř
x) dx
fi(x)f2(t -x)
1 4 3. 4
—ŕ - ŕ + -t. 12 3
Celkem tak dostáváme:
h * f2«)
4'
■ f2
-t- i 3' 4
±ŕ - f2 + h
12'
0
pro f e [-2, -1], pro f e [-1, 1], pro f e [1,2] jinak.
7.34. Určete konvoluci f\ * f2 funkcí
fi = f2 =
1 — x pro x e [—2, 1], 0 jinak,
1 pro x e [0, 1], 0 jinak.
□
O
7.35. Nalezněte Fourierovu transformaci F(f) = f funkce
/(ř) = sgnř, ře(-l,l); f(t) = 0, řel\(-l,l), tj. /(0) = 0, f(t) = 1 pro t e (0, 1) a f(t) = -1 pro t e (-1, 0). Řešení. Fourierova transformace uvedené funkce je
439
KAPITOLA 7. SPOJITÉ MODELY
má tentokrát význam vážené kombinace hodnot, tentokrát však bereme rychle se zmenšující váhy jednotlivých argumentů se vzrůstající vzdáleností od počátku. Jistě má g konečný integrál přes celé R, nebude to ale jednička. Vydělením g tímto integrálem bychom opět obdrželi funkcionál, který bude mít význam nerovnoměrného průměrování dané funkce /.
Jiný velice obvyklý příklad je tzv. Gaussián
g(x) = - e it
což je funkce opět s jedničkovým integrálem přes celé R (což časem také ukážeme), tentokrát mají všechny argumenty x v příslušném „průměru" nenulovou váhu, byť s rostoucí vzdáleností od počátku velmi rychle zanedbatelně malou.
Další takový příklad s jedničkovým integrálem přes celé R jsme viděli před chvílí při diskusi Dirichletových jader g(x) — KN(x)u Fourierových řad.
7.28.
Konvoluce funkcí. Integrální funkcionály z předchozího odstavce můžeme lehce modifikovat, abychom obdrželi „rozmlžené zprůměrování" hodnot funkce / kolem daného bodu y e R:
Ly(f)
J —c
f (x) g (y - x) ->•/:
f(y) = Ly(f)
-ľ
J —c
f (x)g (y - x) sc
na dvojicích funkcí s kompaktními nosiči komutativní. Stejně tak můžeme konvoluce uvažovat s pomocí integrace přes konečný interval, musíme se jen postarat o to, aby byly dobře definovány funkce, které v nich vystupují. Zejména je to tedy dobře možné u peridodických funkcí a integrování přes interval délky periody.
Konvoluce je mimořádně užitečný nástroj pro modelování způsobu, jak pozorujeme data měřená v experimentu nebo jak se projevuje prostředí při přenosu informací (např. analogový audio nebo video signál ovlivňovaný šumy apod.). Argument / je přenášenou informací, funkce g je volena tak, aby co nejlépe vystihovala vlivy prostředí či zvoleného technického postupu při zpracovávání signálu, resp. jakýchkoliv dat.
Odhadnout "lokálnost"konvoluce - pomocí rozložení vah kolem nuly a ohranicenosti funkce /.
Této operaci se říká konvoluce funkcí f ag, značíme ji f * g.
Většinou se konvoluce definuje pro reálné nebo komplexní funkce na R s kompaktním nosičem. ^mmm^^^^m—_HJ[
Pomocí transformace t — z — x se snadno spočte
/oo f(x)g(z-x)dx -oo f— oo
f(z-i)g(i)dt = (g* f)(z).
J sgn t [cos (cůt) — i sin (a>t) ] dt.
-i
Protože součin dvou lichých funkcí je sudá funkce, součin sudé a liché je Uchá funkce a protože integrál Uché funkce přes interval [—1, 1] je 0 (pokud tento integrál existuje) a integrál sudé funkce přes interval [—1, 1] je roven dvojnásobku integrálu přes [0, 1], dostáváme dále
T(f)((o) = 2 ř-isin(íu0 dt = ^L [s^V • /Tcos^
yJ /K ' V2jt j V2jt L m Jo V 71 m
Kdybychom přímo využiU známé vyjádření Fourierovy transformace liché funkce /, snadněji bychom obdrželi
oo 1
F(f)(cú) = -== f f (t) sintoř) dt = ■== f sintoř) dt = ■ ■ ■ =
/ 2 cos co — 1
□
7.36. Popište Fourierovu transformaci F{f) funkce kde a > 0.
Řešení. Naším úkolem je vypočítat
oo
F{f)(cú) = -7= ./" e~at2 e~imtdt.
Derivování (podle a>) a poté užití metody per partes (pro F'
-ite~atl,G =z-imt)ááv&
oo
(F(f) (új))' = 77= / -it e~at2 e-iúJt dt =
-4= lim ^ e
/ a.—aP' —iíút
lim 4- e
i at1 —imt ľ i
f
i(-icú) ^-aP-
la
-4= f lim Q~at - f lim e"^ - f f Q~at e~imt dt
s/2t7 \ 2a ř 2a t^_0o j 2a
\ —oo
~ Ta ij^^ d) =-£W)(*0-
Hledejme proto funkce y(a>) = !F{f){(ů), které vyhovují diferenciální rovnici
(7.33)
Při zápisu y = dy/dců je
y 03
2a
není-U funkce y rovna nule (zjevně y = 0 je řešením (||7.33||)). Integrováním dostáváme
lni y I
4a
In I C I, tj. y = ±U~
440
KAPITOLA 7. SPOJITÉ MODELY
7.29. Gibbsův efekt. Jeden velmi užitečný případ konvoluce jsme vlastně již viděli dříve. V odstavci 7.26 jsme interpretovali částečný součet Fourierovy řady pro funkci / jako konvoluci s Dirichletových jádrem
- - KN(y) = z~_-T/2-i'oky-
Tato interpretace nám umožní vysvětlit tzv. Gibbsův jev zmíněný v odstavci 7.9.
Pomocí předchozího odhadu lokálnosti konvoluce dovodit, ŽE SE KONVOLUCE S DlRCHLETOVYMI JÁDRY BUDOU KOLEM SKOKU CHOVAT OBDOBNĚ JAKO JE TOMU U HEAVISIDEOVY FUNKCE A PRO NI TO UDĚLAT EXPLICITNĚ.
7.30. Fourierova transformace. Konvoluce jsou jedním z mnoha případů obecných integrálních operátorů na
i l-Z-S prostorech funkcí
L(f)(y)
-f
J a
f(x)k(y, x) dx.
Funkce k(y, x) závislá na dvou proměnných,
se nazývá jádro integrálního operátoru L. Definiční obor takových funkcionářů je nutné volit s ohledem na vlastnosti jádra tak, aby vždy existoval použitý integrál.
Teorie integrálních operátorů s jádry a rovnic, které je obsahují, je velice užitečná a zajímavá zároveň, bohužel pro ni zde teď ale nemáme dost prostoru. Zaměříme se alespoň na jeden mimořádně důležitý případ, tzv. Fourierovu transformaci T, která úzce souvisí s Fourierovými řadami.
Připomeňme, že funkce fit), která je dána svojí konvergující Fourierovou řadou, je rovna
/«>= E
kde c„ jsou komplexní Fourierovy koeficienty, con — nln/T se základní periodou T, viz odstavec 7.7.
Při pevně zvoleném T vyjadřuje výraz Aco — 2it/T právě změnu ve frekvenci způsobenou nárůstem n o jedničku. Je to tedy právě diskrétní krok, se kterým při výpočtu koeficientů Fourierovy řady měníme frekvence. Koeficient 1/T ve vztahu
1 fT/2 cn = = f(t)e~10Jnt dt
1 J-T/2
je pak roven Aco/2it, takže můžeme řadu pro f(t) přepsat jako
°° i / rT/2
f(t)= Y. 2^\Aa) f(x)e-'°JnX dxe10^
n = -oo ^ J-T/2
nahlavu Představme si nyní hodnoty con pro všechna n e Z jako vybrané reprezentanty pro malé intervaly [con, con+i] o délce Aco. Pak náš výraz ve vnitřní velké závorce v posledním vztahu pro f(t) ve skutečnosti vyjadřuje sčítance Riemannových součtů pro nevlastní integrál
2it J_c
g(co)éat dco
kde g (co) je funkce nabývající v bodech con hodnoty
fT/2
g(cůn) — I f(x)e
J-T/2
přičemž C e M\ {0}. Zahrnutím nulového řešení tak můžeme vyjádřit všechna řešení diferenciální rovnice (||7.331|) jako funkce
y(tú) = Ke--£, řel.
Doplňme určení konstanty K, pro niž získáváme právě T(f)(co). Později (v souvislosti s tzv. normálním rozdělením ve statistických metodách) se dozvíme, že
z čehož plyne
J e %1 dx = y/Ťt,
f e-1"2 dt = j- f e"*2 dx
j~a
Ja '
Platí proto
= zk = 7Ťa asoucasně T(f)(0) = Kt° = K. Celkem máme
Tif)ico) = ^e~Í.
□
7.37. Stanovte funkci /, jejíž Fourierovou transformací je funkce
f (co) = i sas, co ^ 0.
J ■ ' J2tc oj ' '
Řešení. Inverzní Fourierova transformace dává
oo
71 \-oo °J 0 °J )
Jestliže použijeme substituci, kdy nahradíme — a> za a> v integrálu přes interval (—oo, 0], získáme
/ oo
f(.t) = £(fúŽfL e~iúJt dco + fs^f émt dco
oo
1 ľ sin oj
2tz
dx.
f [cos ia>t) — i sin ia>t) + cos (a>t) + i sin (a>t) ] dco =
oo
I r sin» CQS ( ř) dM
71 J oj v '
0
Poznamenejme, že předchozí vyjádření lze obdržet už z toho, že funkce y = §SLS1 s maximálním definičním oborem je sudá.
j oj J
Pomocí identity
sinx • cos ixy) = ť) (sin [x(l + y)\ + sin [x(l — y)]) , x, y e M, která mj. vyplývá ze součtových vzorců (pro sinus), dostáváme
(oo oo f sin[^1+ž)] dco + f Sin[^-Ž)] dco o m o m
Substituce u = co i\ + t), v = co i\ — t) potom dávají
/ oo oo \
441
KAPITOLA 7. SPOJITÉ MODELY
Pracujeme s po částech spojitými funkcemi s kompaktním nosičem, proto je naše funkce / integrovatelná v absolutní hodnotě přes celé R. Limitním přechodem T -> oo dojde ke zjemňování normy Aoj našich dělících intervalů v Riemannově součtu. Zároveň se dostaneme v posledním výrazu k integrálu
f
j—í
f (x) e"
dx.
Předchozí úvahy ukazují, že pro docela velkou množinu Rie-mannovsky integrovatelných funkcí / na R umíme i \ zadefinovat dvojici vzájmně inverzních integrálních operátorů:
_j FOURIEROVA TRANSFORMACE -
Pro každou po částech spojitou reálnou nebo kompaktní funkci / nals kompaktním nosičem definujeme
Hf)(oj) = f (oj)
i r
ÍTjŽ J-c
/(Oe-
dt.
Této funkci / říkáme Fourierova transformace funkce /. Přechozí úvahy ukazují, že bude také platit
f(t) = ^ (f)(t)
1 ľ
JTjŽ J-c
f (oj) éat d(ů.
Tím říkáme, že k právě definované Fourierově transformaci T existuje inverzní operace T~x, které říkáme inverzní Fourierova trans-
!ormac'- _l
Všimněme si, že Fourierova transformace a její inverze jsou integrální operátory se skoro shodným jádrem
k (oj, t)
Samozřejmě tyto transformace mají smysl pro mnohem větší definiční obory, zájemce odkazujeme na speciální literaturu.
7.31. Jednoduché vlastnosti. Fourierova transformace zajímavým způsobem převrací lokální a globální chování funkcí. Začněme jednoduchým příkladem, ve kterém najdeme funkci f(t), která se ztransformuje na charateristickou funkci intervalu Q], tj. f (oj) = 0 pro M > £2 a / = 1 pro M < Q. Inverzní transformace T~l nám dává
f(t)
i ra ■
— / e"
s/2jt J-q
doj
1
it
1
:(e'
■e-ií2ř)
V2Ťrf 2i 2Q sin(ňř)
~~ -Jiň ttt
Až na konstantní násobek a škálování proměnné, jde tedy o velice důležitou funci sinc(x) —
Přímým výpočtem limity v nule (ĽHospitalovo pravidlo) spočteme, že f(0) — 2Q(2it)~1^2, nejbližší nulové body jsou v t — ±7ľ/ Q a funkce poměrně rychle klesá k nule mimo počátek x — 0. Na obrázku je tato funkce znázorněná rozvlněnou křivkou pro Q — 20. Zároveň je vynesena křivkou oblast, ve které se s rostoucím Q naše funkce f(t) stále rychleji vlní.
m = ^(!^du + S^dv\ = l-J^du, f e (-1,1);
\0 0/0
(oo oo \
-f^du + f^dv) =0, t<-l. o o /
Dokázali jsme tak, že funkce / je nulová pro 11 \ > la konstantní (nutně nenulová) pro 11 | < 1. (Po celou dobu předpokládáme, že inverzní Fourierova transformace existuje.) Určeme funkční hodnotu /(O). Pro funkci
í(0 = i, |ř|i
platí
i i FigXv) = -7= f e~im' dt = ^f cos dt
2_sin oj
2ŤŽ a>
-1 '0
Odtud plyne, že f(0) = g(0)/2 = 1/2. Ještě vyzdvihněme vyčíslení integrálu
fS2ULdu = $,
j u 2 '
které jsme rovněž obdrželi.
7.38. Vyřešte integrální rovnici
□
/ f(x) sin(xř) dt = e x, x > 0
o
pro neznámou funkci /.
Řešení. Pokud obě strany rovnice vynásobíme číslem -J2/tŤ, obdržíme na levé straně právě sinovou Fourierovu transformaci. Stačí tedy aplikovat na rovnici inverzní transformaci. Takto dostaneme
oo
f(t) = I / e~x sin(xř) dx, t > 0.
o
Dvojnásobným použitím metody per partes pak lze spočítat
/ e~x sin (xt) dx = [— sin (xt) — t cos (xt) ] + C, a tudíž je
oo
/ e~x sin (xt) dx = o
i™ (l& [" sin W ~ ř cos W ]) " i+V ("O = 1+7 • Řešením rovnice je proto funkce
/(0 = frřjr. t>o.
□
7.39. Fourierova transformace a difrakce. Intenzita světla je fyzikální veličina kvantitativně vyjadřující přenos energie vlněním. Intenzita obecné světelné vlny je definována jako časová střední hodnota velikosti Poyntingova vektoru, který je vektorovým součinem navzájem
442
KAPITOLA 7. SPOJITÉ MODELY
Vidíme, že charakteristická funkce intervalu [—£2, £2] přechází Fourierovou transformací na funkci /, která má velmi výraznou kladnou hodnotu v malém okolí nuly, přičemž hodnota v nule je pevným násobkem ň. Čím je tedy ň větší, tím více se soustředí / do okolí počátku.
Dále si spočteme Fourierovu transformaci derivace fit) pro nějakou funkci /. Stále předpokládáme, že / má kompaktní nosič, tj, zejména F(f) i Fif) skutečně existují. Počítejme metodou per partes:
1
\/2it - icoľifico)
1 f00
— / fit)c~lmt dt [e-icotfit)]^.
2it
ľ
J —c
/(Oe-
dt
Vidíme tedy, že Fourierova transformace převádí (limitní) operaci derivování na (algebraickou) operaci prostého násobení proměnnou. Samozřejmě můžeme tento vzorec iterovat a dostáváme
Hf")(a>)
-co2Hf), ■ ■ ■, Hfn))
inconFif).
7.32. Vztah ke konvolucím. Další mimořádně důležitou vlastností je vztah mezi konvolucemi a Fourierovou transformací. Spočtěme, jak dopadne transformace konvoluce h — f * g, kde opět pro jednoduchost předpokládáme, že funkce mají kompaktní nosiče. Při výpočtu prohodíme pořadí integrování, což je krok, který ověříme teprve v diferenciálním a integrálním počtu později, viz ??. V dalším krůčku pak zavedeme substituci t — x — u.
Fih)ia>)
7= í ( í f(x)git -x) dx) e~ia)t dt
\/2tZ J-oo\J-oo )
= -^= f°° fix)( í°° git - x) e~imt dt) dx
1 ŕ oq / /*OQ \
= -f= / /(*)( / giu)e-ia)(u+x) du)dx V2jr J-oo V J-oo /
= -j=( H fix)e~imx dx") ■ ( í°° giu)e-iúJU du V2jr \J-oo / \J-oo
kolmých vektorů elektrického a magnetického pole. Pro monochromatickou rovinnou vlnu šířící se ve směru osy y platí
i r
cs0- / 7 Jo
E2ydt,
kde c je rychlost světla a eo je permitivita vakua. Monochromatická vlna je posána harmonickou funkcí Ey = if/(x, t) = A cos( je úhlová frekvence a pro libovolné pevné t je nejmenší periodou tzv. vlnová délka X. Přitom k
představuje rychlost šíření vlny k = 2jL. Platí
1
cs0-
E2dt
1
cs0-
1 f i
7 Jo
r jo + cos(2((Wř
A2 cos2 (cůt
kx) dt
2
sin(2((Wř
c Sq A
1 ,1 r -cs0A2-[t +
2 x
1 ,1 , -csoAz-(r +
2 x
1 t - sin(2((wr -ceoA2(\ + -
kx))
dt
kx))
2ců
sin(2((wr
kx)) — sin(2(—kx))
2(ů
kx)) — sin(2(—kx))
)
1
2cůx
) = -csoA7
než ^-
Druhý člen v závorce můžeme zanedbat, protože je vždy menší < 10~6 pro reálné detektory světla, je tedy nepatrný oproti 1. Intenzita světlaje přímo úměrná druhé mocnině amplitudy.
Difrakcí rozumíme takovou odchylku od přímočarého šíření světla, která nemůže být vysvětlena jako důsledek odrazu či lomu (či změnou směru paprsku v prostředí se spojitě se měnícím indexem lomu). S difrakcí se setkáváme při šíření prostorově ohraničeného svazku světla. Difrakční jevy jsou nejvýrazněji a snadno pozorovatelné tehdy, když světlo prochází otvory či překážkami, jejichž velikost je řádově srovnatelná s vlnovou délkou světla. Při Fraunhoferově difrakcí v následujícím příkladu prochází rovinná monochromatická vlna velmi úzkou obdélníkovou štěrbinou a promítá se na vzdálenou plochu, například posvítíme-li laserovým ukazovátkem drobnou štěrbinou na stěnu. Obraz, který dostaneme je Fourierovou transformací funkce propustnosti stínítka - štěrbiny.
Zvolme rovinu difrakčního stínítka za souřadnicovou rovinu z = 0. Nechť kolmo na tuto rovinu dopadá rovinná vlna A exp(ikz) (nezávisí na místě dopadu (x, y) na stínítku). Označme s(x, y) funkci propustnosti stínítka, pak lze výsledné vlnění dopadající na projekční plochu v místě (§, rj) popsat jako integrální součet všech vln (Huygensův-Fresnelův princip), které prošly stínítkem a šíří se dále prostředím ze všech bodů (x, y, 0) (jako kulová vlna) do bodu (§, t),z):
= J2izFif) ■ Fig)
A f f s(x, y)e-ik(^y) dx dy J Jm2
443
KAPITOLA 7. SPOJITÉ MODELY
Podobný výpočet ukazuje i obrácené tvrzení, že Fourierova transformace součinu je, až na konstantu, konvoluce transformací.
T(f ■g) = ^=Hf)*Hg).
'2tc
Jak jsme si uváděli výše, konvoluce f * g velice často modeluje proces našeho pozorování nějaké sledované veličiny /. Pomocí Fourierovy transformace a její inverze nyní můžeme snadno rozpoznat původní hodnoty této veličiny, pokud známe konvoluční jádro g. Prostě spočteme T(f * g) a podělíme obrazem T(g). Tak získáme Fourierovu transformaci původní funkce /, kterou obdržíme explicitně pomocí inverzní Fourierovy transformace. Hovoříme o dekonvoluci.
7.33. Diracova delta-funkce. Vraťme se nyní ještě k prvnímu příkladu s inverzní transformací k charakteristické funkci f q intervalu [—£2, £2]. Zkusme provést limitní přechod pro £2 jdoucí k nekonečnu a označme \/2ŤtS(t) kýženou limitní „funkci" pro F~l (/n)(0- Inverzní obraz součinu s libovolným obrazem T(g) umíme vyjádřit pomocí konvoluce:
J^1 (fa ■ F(g))(z)
i r
g(i)^l(fn)(z-t)dt.
Při limitním přechodu Q -> oo přejde výraz nalevo k T~l (T(g))(z) — g(z), zatímco napravo dostáváme
g (z)
-ľ
g(t)S(z - t)dt.
Naše hledaná S(t) tedy vypadá na „funkci", která je všude nulová, kromě jediného bodu t — 0, kde je tak „nekonečná", že integrováním jejího součinu s libovolnou integrovatelnou funkcí g dostaneme právě hodnotu g v bodě t — 0. Není to samozřejmě funkce v našem smyslu, nicméně jde o objekt často používaný. Říká se jí Diracova funkce S a korektně ji lze popsat jako tzv. distribuci. Z nedostatku času nebudeme distribuce podrobněji rozebírat a omezíme se na konstatování, že si lze dobře Diracovo <5 představit jako jednotkový impulz v jediném bodě. Fourierova transformace jej pak pretransformuje na konstantní funkci T(S) (&>) — -4=.
Naopak mnohé funkce, které nejsou integrovatelné v absolutní hodnotě na R transformuje Fourierova transformace na výrazy s Diracovým S. Např.
J7(cos(nť))((tí) — J — (&(n — co) + &(n + co)),
což můžeme docela snadno vidět výpočtem Fourierovy transformace funkce f q cos(nx) a následným limitním přechodem £2 -> oo. Dodělat výpočet nebo odkázat do příkladů ... (je to
snadné rozepsáním cos((« — U))x) + cos((« + Ců)x) pomocí
součtových vzorců a zapomenutím sudé části výrazu pro Fourierovu transformaci).
Obdobně dostaneme Fourierovyu transformaci pro funkci sinus, můžeme pro to využít také skutečnost, že transformace derivace této funkce se bude lišit jen o násobek imaginární jednotkou a proměnnou.
Tyto transformace jsou základem Fourierovy analýzy signálů. Jestliže totiž signál je čistou sinusoidou na dané frekvenci, pak to pomocí Fourierovy transformace identifikujeme jako dva bodové impulzy právě v kladné a záporné hodnotě frekvence. Pokud je signál lineární kombinací několika takových čistých signálů, dostaneme stejnou lineární kombinaci bodových impulzů. Protože ale
p/2 ľq/2
T])
-p/2 J-
-ik(%x+t]y)
dy dx
P/2 J-q/2
/p/2 p q/2
e-^x dx -p/2 J-q/2
-ikrjy
dy
~ g—ik^x ~ P/2 e
-P/2
-ikrjy
-ikr]
2 ún(k^p/2) 2 ún(krjq/2)
kl-
kr)
Apq
ún(k^p/2) sin(kr]q/2) kíjp/2 kt]q/2
Graf funkce f (x) = vypadá následovně:
Graf funkce ý(Š> f])
sin £ sin rj
1 ň~
pak takto:
Popisovaná difrakce pak takto:
KAPITOLA 7. SPOJITÉ MODELY
vždycky zpracováváme signál jen v nějakém konečném časovém intervalu, dostáváme ve skutečnosti místo bodových impulzů rozvlněnou křivku podobnou funkci sine s výrazným maximem právě v hodnotě příslušné frekvence. Z velikosti tohoto maxima přitom umíme také přímo vyčíst původní amplitudu signálu.
7.34. Fourierova sinová a cosinová transformace. Pokud použijeme Fourierovu transformaci na lichou funkci fit), tj. /(—i) — —fit), příspěvek integrace součinu / (ř) a funkce cos (±)
ľ* í
V Tt Jo
í2 í
V TT Jo
fit) sin(tt)f) dt,
fs(t) sin(tt)f) dt.
Obdobně se definuje Fourierova cosinusová transformace pro sudé funkce:
fÁ 0:
/>oo
£(f'(t))is) = / /'(ř)e-Jo
dt
= [/(O e
= -/(O)
-íř-ioo
Jo
ľ
Jo
sC(fXs).
fit)e~st dt
Vlastnosti Laplaceovy transformace a řadu dalších zejména v technické praxi používaných transformací je možné snadno dohledat v literatuře.
i- 1-10 'rud
- Orad
L-1-10 rad
Protože lim^o ^f1 = 1, je intenzita ve středu obrazu přímo úměrná Iq = A2p2q2. Fourierovu transformaci si můžete prohlédnout jednoduše, když posvítíte laserovým ukazovátkem skrz drobnou škvírku mezi palcem a ukazováčkem, bude to obraz funkce její propustnosti. Obraz na posledním obrázku je dobře vidět, pokud si vytvoříte kvalitní obdélníkovou štěrbinu např. slepením dobře ohraněných samolepek.
7.40. Nalezněte řešení tzv. rovnice vedení tepla (rovnice difúze)
ut{x, t) = a2 uxxix, t), x e M, t > 0 splňující počáteční podmínku lim u{x,f) = fix).
Poznámky: Symbolem ut = ^ zde rozumíme parciální derivaci funkce u podle t (tj. derivujeme podle t, přičemž x považujeme za konstantní) a podobně uxx = ^f- označuje druhou parciální derivaci podle x (kdy dvakrát derivujeme podle x a na t nahlížíme při derivování jako na konstantu). Fyzikální interpretací úlohy je, že se snažíme určit teplotu u{x,f) v tepelně izolované a homogenní tyči nekonečné délky (rozsah proměnné x), je-li dána počáteční teplota tyče funkcí /. Tyč má konstantní průřez a teplo se v ní může šířit pouze vedením. Koeficient a2 je pak roven podílu —, kde a je koeficient tepelné vodi-
CQ
vosti, c je specifické teplo a q je hustota. Zvláště se tedy předpokládá, že a2 > 0.
Řešení. Na rovnici vedení tepla aplikujeme Fourierovu transformaci vzhledem k proměnné x. Platí ovšem
oo
T (ut) ícú, ť) = -j= j utix, t) e~ioJX dx =
—oo
s oo
--J== / uix, t)e~imxdx
—oo
kde je derivováno podle t, tj. je
445
KAPITOLA 7. SPOJITÉ MODELY
4. Diskrétní transformace
Fourierova analýza signálů naznačená v předchozím odstavci byla dříve např. v radiotechnice realizována pomocí speciálních analogových obvodů. Dnes při zpracování signálů pomocí počítačových obvodů pracujeme pouze s diskrétními daty. Předpokládáme, že v (diskrétní) časové proměnné je dán nějaký pevný (malinký) vzorkovací interval t a že se náš signál opakuje s periodou N x (pro hodně veliké přirozené N), což je maximální perioda zachytitelná v našem diskrétním modelu).
Naše
T(ut) (a>, t) = (T(u) (a>, t))' = (T(u))t (a>, t). Současně víme, že
T (a2 uxx) (co, i) = a2 T (uxx) (a>, i) = —a2o)2 T (u) (co, t). Při označení y(a>, t) = T (u) (a>, t) tak přecházíme k rovnici
yt = -a2cú2 y.
Podobnou diferenciální rovnici jsme již při počítání Fourierových transformací řešili, a tudíž pro nás není obtížné stanovit všechna její řešení
y{(ů, t) = K((ú) e-fl2íU\ K((ú) e R. Zbývá určit K(a>). Transformace počáteční podmínky dává T(f) (tu) = lim F(u) (tu, ř) = lim y(cú, t) = K(cú)e° = K(ců), a proto je
y{(ů, i) = T (/) (tu) e-a2°j2t, K((ú) e R.
Nyní se pomocí inverzní Fourierovy transformace vraťme k původní diferenciální rovnici s řešením
oo
u(x, t) = -j= f y(cú, t) é0JX dcú =
—oo
oo
f T (/) (tu) e-a2°j2t émx dco =
—oo
oo / oo \
-L= f l-J= f f(s)e-ioJSds) e-a2°j2t émx dco =
—oo V —oo /
oo / oo \
-J= f f(s)(-^ f e~a2m2t e-im(s-x) dco 1 ds.
—oo V —oo /
Vypočítáním Fourierovy transformace F(f) funkce f(t) = t~a<1 pro a > 0 jsme při přeznačení proměnných obdrželi
OO 2
■4= f e~cp2 e~irp dp = -}=e-^, o 0.
—oo
Dle tohoto vztahu (uvažte c = a2t > 0, p = a>, r = s — x) platí
OO (s-x)2
i r -a2o?t -íoj(s-x) dcú = _1 e-^ir
\/2Jr J -Jlah —oo
a tedy
oo fr-,)2
u(x, t) = —-= / f(s)e 4*2> ds.
— oo
□
7.41. Stanovte Laplaceovu transformaci C(f)(s) funkce
(a) fit) = ď';
(b) fit) = ci ď1' + c2 e'
(c) fit) = cos ibt);
id) fit) = sin ibt);
(e) fit) = cosh ibt);
(f) fit) = sinh ibt),
446
KAPITOLA 7. SPOJITÉ MODELY
přičemž hodnoty b e Ra ci,c2 e C jsou libovolné a kladné s e R je větší než reálné části čísel a,ai,a2 e Ca rovněž je větší než b ve variantách (e) a (f).
Řešení. Případ (a). Bezprostředně z definice Laplaceovy transformace plyne
oo oo
£ (/) (5) = / eflř e"sř í/ř = / e-(s-a)t dt =
Um
0
J>
-(s—a) s—a '
Případ (b). Pomocí výsledku varianty (a) a linearity nevlastního integrálu dostáváme
oo oo
£ (/) (s) = Clf e^ e"sř dt + c2f ď2t e"sř dt = ^ + ^
o o Případ (c). Protože
cos (iř) = i (eífoř + e_,'to),
volba ci = 1/2 = C2, fli = íTj, «2 = —ibv předchozí variantě již dává
oo
£ (/) (,) = / (1^ + le-*) e- A = ^ + ^ =
o
Případy (d), (e), (f). Analogicky volby
(d) c\ = —i/2, c2 = i/2, ai = ib, a2 = —ib;
(e) ci = 1/2 = c2, ai = b,a2 = -b;
(f) ci = 1/2, c2 = -1/2, a\ =b,a2 = -b
vedou na
(d) £ (f) (S) - * •
(e) £ (/) (s)
(f) £ (/) (í)
s2-b2' b
s2-b2'
□
7.42. Pomocí vztahu
(7.34) £ (/') (S) = S £ (/) (S) - lim f(t)
odvodte Laplaceovy transformace funkcí y = cos t a y = sin ř. Řešení. Nejprve si uvědomme, že z (||7.34||) plyne
£(f")(s) = s£(f')(s)- lim /'(*) =
í s£ (f) (s) - lim f{ť) - lim /'(ŕ) = s2£(f)(S)-S lim /(O - lim /'(ř).
Platí tedy
-£ (siní) (s) =£(- siní) (5) = £ ((siní)") (s) = s2 £ (sin ř) (5) — s lim sin ř — lim cos t = s2£ (sin ř) (s) — 1,
odkud dostáváme
-£ (sin ř) (5) = i2 £ (sin ř) (í) — 1, tj. £ (sin ř) (5) = .
447
KAPITOLA 7. SPOJITÉ MODELY
Nyní užitím vzorce (||7.34||) snadno určíme
Ĺ (cosí) (s) = C ((siní)') (s) = s
:2 + l
lim siní = -r—.
í^0+ s +1
□
7.43. Pro s > — 1 spočtěte Laplaceovu transformaci C(g) (s) funkce
g(t) = te-'
a pro s > 1 Laplaceovu transformaci C (h) (s) funkce
h(t) = t sinhř.
Řešení. Užitím metody per partes získáváme
OO OO / _f 11 \
C (g) (s) = ft e"ř e~st dt = ft e~(s+1)t dt = lim ('-^j^) - 0 -o o ^ * '
j _(S + 1) at ~ ^™ (S + 1)2 (s + 1)2 j
(s+1)2
Derivování Laplaceovy transformace obecné funkce — / (tj. nevlastního integrálu) podle parametru s dává
OO \ ' OO OO
/ -f(t) e"sř dt) =f -f(t) (e-sř)' dt = ftf(t) e"sř rff.
0/0 o
To znamená, že derivace Laplaceovy transformace £(—f)(s) je La-placeova transformace funkce tf(t). Laplaceovu transformaci funkce y = sinh t jsme ale dříve určili jako funkci y = ^rf. Proto platí
Ĺ
(ÄM*)=(-^y
2s
(s2-l)2-
Povšimněme si, že tímto způsobem jsme rovněž mohli určit L (g) (s).
□
Základní Laplaceovy transformace uvádíme v následující tabulce:
y(t)
C(y)(s)
té11
feat
sincot cos cot eat sin cot eat (cos cůt + - sin cot) t sin cůt sin-s)t dt
1
(i(tí-s)t
s — ico
1 ém
--(lim —
s — íců t^oo est
s co + i-
1)
1
s + iců
s — íců (s — ícú)(s + íců)
s2 + co2 s2 + co2
□
7.45. Označme C(y)(s) Laplaceovu transformaci funkce y(t). Metodou per partes dokažte, že platí
Řešení.
(7.35)
a indukcí:
C(y')(s) = sC(y)(s) - y(0)
C(y")(S) = s2C(y)-Sy(0)-y'(0)
C(y(n))(s) = s"C(y)(s) - ^^"''/""(O)-
7.46. Najděte funkci y(t) vyhovující diferenciální rovnici
y" (t) +4y(t) = sin2ř
a počátečním podmínkám y(0) = 0 a ý (0) = 0. Řešení. Z předchozího příkladu ||7.45||:
s2C(y)(s) + 4£(y)(s) = C(sm2t)(s)
Přitom
□
£(sin2ř)(í)
£(y)(s)
s2 + 4' 2
(s2 + 4)2
Zpětnou transformací dostáváme
y(t) = i sin2ř — jt cos2ř.
□
449
KAPITOLA 7. SPOJITÉ MODELY
7.47. Najděte funkci y(ť) vyhovující diferenciální rovnici
/ (ř) + 6/ (ř) + 9 y(t) = 50 sin t
a počátečním podmínkám y(0) = 1 a ý (0) = 4. Řešení. Laplaceovou transformací dostáváme
s2C(y)(s) -s-4 + 6(sC(y)(s) - 1) + 9£(y)(s) = 50£(siní)00, tj-
(í2 + 6s + 9)£(y)(í) = -r^- +s +10, sz + 1
50 s +10
£{y){S) ~ (S2 +1)(S + 3)2 + (7W
Rozkladem na parciální zlomky prvního členu dostaneme
50 As + B C D +-t +
(s2 + l)(s + 3)2 s2 + l ' s+3 ' (s + 3)2 tedy
50 = (As + + 3)2 + C(s2 + + 3) + Z)(s2 + 1). Dosazením s = —3 dostáváme
50 = 10D tedy D = 5 a porovnáním koeficientů u s3
0 = A + C, tedy A = -C. Porovnáním koeficientů u s pak
4
0 = 9A + 6B + C = SA + 6B, tedy B = -C. Porovnáním absolutních členů dostaneme
50 = 9B+3C+D = 12C+3C+5 tedy C = 3, B = 4, A = —3. Protože
s + 10 s +3 + 7 1 7
+
(s+3)2 (s + 3)2 s+3 (s + 3)2 platí
C(y)(s) =^ + 7^ + 777^ + 7^ +
„2+1 t J+3 -r (j+3)2 t J+3 -r (j+3)2
_ -3s ,__4__, _4_ , 12
s2+l s2+l s+3 ~r (s+3)2-
Odtud inverzní Laplaceovou transformací dostáváme řešení ve tvaru
y(t) = -3 cosi + 4 siní + 4e~3t + \2te~3t.
□ 450
KAPITOLA 7. SPOJITÉ MODELY
7.48. Nalezněte Laplaceovu transformaci Heavisideovy funkce H (t) a posunuté Heavisideovy funkce Ha(t) = H (t — a):
0 pro t < 0, Hit) = \ \ pro t = 0,
1 pro t > 0.
Řešení.
C(H(t))(s)
/ H(t)e-Stát = Jo Jo
e~st át
C(Ha(t))(s) = C(H(t-a))(s)
f
Jo
;(0- 1)
/ H
Jo
(t - a)e st át
f
Ja
-s(t+a)
át = e-asC(H(t))(s)
e~st át
□
7.49. Ukažte, že platí
(7.36) C(f(t) ■ Ha(t))(s) = e-asC(f(t + a))(s)
Řešení.
C(f(t).Ha(t))(s) = / f(t)H(t-a)e-stát= / f(t)e~stát
JO Ja
= / f(t+ a)e-s(t+a) át = e~as / f(t + a)e~st Jo Jo
e-asC(f(t+a))(s).
□
7.50. Řešení. Nalezněte funkci y(t) vyhovující diferenciální rovnici a počátečním podmínkám:
fit) + 4y(t) = f(t), y(0) = 0, ý(0) = -1,
kde funkce f(t) je po částech spojitá:
| cos(2ř) pro 0 < t < jt, 10 pro t > jt.
f(t)
Úloha je modelem netlumeného kmitání pružiny (bez zahrnutí tření a jiných vlivů, například nelinearit v tuhosti pružiny apod.), které je buzené vnější silou jen během počáteční doby a poté ustane.
Funkci f(t) lze zapsat jako lineární kombinaci Heavisideovy funkce u(t) a jejího posunutí, tj.
fit) =cos(2ŕ)(w(ŕ)-M0)
Protože
Ciy")(s) = s2C(y) - sy(0) - ý(0) = s2C(y) + 1,
451
KAPITOLA 7. SPOJITÉ MODELY
dostáváme s využitím předchozích příkladů 7. a 8. k výpočtu Lapla-ceovy transformace pravé strany
s2 C(y) + 1 + 4C(y) = £(cos(2í)(w(í) - MO))
= £(cos(2í) • u(i)) - £(cos(2ř) • un(t)) = £(cos(2ř)) - e~ns£(cos(2(ř + tc))
(l-e-™)- S
Odtud
' s2 + 4'
1
C(y) = -^— + (l-e-JIS)
s2 + 4 (s2 + 4)2'
Inverzní transformací dostávávme řešení ve tvaru
y(t) = -I sin(2ř) + \t sin(2ř) + C~l ( e
2 V > 4 ■ - {$2 +4)2
Podle vztahu (||7.36||), ale
^(^T^Tj) = sin(2í)))
= (ř - 7r) sin(2(ř - 77-)) • íř^(ř)-
Protože je Heavisideova funkce pro t < 7r nulová a pro ř > tc rovna 1, dostáváme řešení ve tvaru
y(t)
— \ sin(2ř) + \t sin(2ř) pro 0 < ř < tc ^ sin(2ř) pro t > tc
□
7.51. Najděte funkci y(t) vyhovující diferenciální rovnici
f(t) = cos (77-í) - y(t), t e (0, +00)
a počátečním podmínkám y(0) = c\, / (0) = c2.
Řešení. Nejdříve podotkněme, že z teorie obyčejných diferenciálních rovnic vyplývá, že úloha má právě jedno řešení. Dále připomeňme
C (/") (s) =s2C (/) (s) - s lim f(t) - lim /'(ř)
a
£(cos(iř))(í) = ^i, ^K-Aplikování Laplaceovy transformace na zadanou diferenciální rovnici proto dává
s2C (y) (s) - sci -c2 = - C (y) (s),
r2 tj-
(7.37) Ľ (y) (s) = + + -y^--.
(S2 + 1) (i2 + tc2) S1 + 1 S2 + 1
Stačí tudíž najít funkci y splňující (||7.37||). Rozkladem na parciální zlomky získáváme
(s2 + l)(s2+Jr2) = k^Ä (s^+ľ ~ ?+^2") •
Z výše uvedeného vyjádření L (cos (&ŕ)) (5) a dříve dokázaného
1
s2+l
£ (sin 0 (*)- 1
452
KAPITOLA 7. SPOJITÉ MODELY
tak již dostáváme hledané řešení
i
77:2-1
y(t) = -y— (cos t — cos (itt)) + ci cos t + c2 sin t.
□
7.52. Vyřešte soustavu diferenciálních rovnic
x" (f)+jť (ř) = y(t)-f (t)W, x1 (i)+2x(t) = -y(ř)+y (0+e "ř
při počátečních podmínkách x(0) = 0, y(0) = 0, x'(0) = 1, y'(0) = 0.
Řešení. Opět aplikujeme Laplaceovu transformaci. Tím s využitím
£ (e±0 <*) = ér
převedeme první rovnici na
s2 C (x) (s) — s lim x(t) — lim x' (t) + sC (x) (s) — lim x(t) =
C (y) (s) - (s2 Ľ (y) (s) - s lim y(t) - lim y (t)) +
a druhou potom na
sC (x) (s) - lim x(t) + 2C (x) (s) = -C (y) (s) + sC (y) (s) - lim y(t) + ^.
Vyčíslíme-li limity (dle počátečních podmínek), obdržíme lineární rovnice
s2 Ĺ (x) (s) - 1 + sC (x) (s) = C (y) (s) - s2 Ľ (y) (s) + ^
a
sC (x) (s) + 2C (x) (s) = -C (y) (s) + sC (y) (s) + ^ s právě jedním řešením
2s —1 r í /■ r,\ 3s
2(S2-lf
Opět si pomůžeme rozkladem na parciální zlomky se ziskem
Ľ (X) (S) ~ i -±- + ^ _J__IJ_ - 2 1 , 1 _J_
>~ W W — 8 s_i -r 4 (j+1)2 g J+1 — 4 (j+1)2 T 4 s2_! ■ Neboť již dříve jsme vypočítali
£ (ř e"0 (*) = - C (sinh ř) (*) = zh -
£ (ř sinh ř) (i)
2s
(*2-l)2'
dostáváme
x(t) = | ř e"ř + \ sinh ř, y(ř) = § ř sinh ř.
Čtenář může sám ověřit, že tyto funkce x a y jsou skutečně hledaným řešením. Ověření však důrazně doporučujeme provést (např. z toho důvodu, že Laplaceovy transformace funkcí y = é, y = sinhř a y = t sinh t jsme získali pouze pro s > 1). □
453
KAPITOLA 7. SPOJITÉ MODELY
7.53. Najděte řešení soustavy diferenciálních rovnic:
x'(ŕ) /(O Řešení.
-2x(t) + 3y(t) + 3t2, -4x(t) + 5y(t) + é, jc(0) = 1, y(0)
C(x')(s) = C(-2x +3y + 3t2)(s),
£(/)(*) = £(-4x+5y + e')(s).
Přitom levé strany lze zapsat pomocí (||7.35||) a pravé lze rozepsat vzhledem k linearitě operátoru C. Protože C(3t2)(s) C(et)(s) = --ži dostáváme systém lineárních rovnic
sC(x)(s)-l = -2C(x)(s) + 3C(y)(s) + -%, sC(y)(s) + l = -4C(x)(s) + 5C(y)(s) + --z-l.
4 a
Po úpravě dostaneme maticově A(s)x(s) = b(s), kde jsme označili Cramerovo pravidlo říká, že
„ ÍC(x)(s) . 5ľx(s) = {c(y)(s) ' ah(s)
1 +
C(x)(s)
|Ai| |A|
|A| =
|Ai| =
|A2| = Odtud
C(x)(s) C(y)(s)
s+ 2 -3 4 s-5 1 +
5 + 2 4
C(y)(s) s2 - 3s + 2,
(s-5)(l + ^) + 3(-l + ^T)
1 4- ±
"I +
s-1
(. + 2)(-l + ^T)
24 «3 •
1
(s - - 2)
1
(5 -5)(s3 +6)
(s+2)(2-s) s - 1
i - 1 4s3 + 24
15
«3
87 4s '
Rozkladem na parciální zlomky vyjádříme Laplaceovy obrazy řešení £(x)(s) - —^__3— + __?J-
-í-WW — 2j2 (s-1)2 ^ «-1 4r»-' £(*)(«) = - ^jyj i s_! s_2
a zpětnou transformací dostáváme řešení Cauchyovy úlohy:
39, 1(,í , on ř 21 „2ř 15.2 87
i _27___7__12 _ 21
x(ř) =
y(t)
-18ř - 3řeř + 27eř - leM - 6ť - 21
-f ř - 3teř + 28eř - ^2ř - f ŕ - f,
2ř
□
7.54. Diskrétní kosinová transformace. Základem JPEG komprese dat je tzv. diskrétní kosinová transformace. Taje dána ortogonální maticí C = (cu)nk [=i definovanou následovně
(2k - 1)(Z - 1)tt'
cu = akl cos
2n
kde akX
V"
- pro l > 1. Vektor reprezentující data pak
ortogonálně rozložíme a některé bázové vektory (sloupce matice C
454
KAPITOLA 7. SPOJITÉ MODELY
) vypustíme. Tím je provedena redukce dat s rozumnou aproximací původních dat. Zpětná transformace je jednoduchá. Protože je C ortogonální, je dána násobením transponovanou maticí.
Ukažte, že pro n = 2 je matice C rovna ^ j ^ a že je
ortogonální. Spočítejte ortogonální rozklad vektoru (3, 4) vzhledem k bázi tvořené sloupci matice a určete vlastní čísla a vlastní vektory.
Řešení. Počítejme
-MG -O-G -'H(o°)-
Matice C je tedy ortogonální a její sloupce tvoří ortonormální bázi e\ = (=jj, -^),^2 = (^j, —7f)- Koeficienty ortogonálního rozkladu vektoru u = (3, 4) dostaneme jednoduše použitím transponované matice
Ortogonální rozklad má tedy následující tvar
CTu
) V2-(|) 72(4
V2y 1
Charakteristický polynom matice C je — 5 = Oa
vlastní čísla jsou tedy Alj2 = ±1 (jiná ani ortogonální matice nemůže mít). Příslušné vlastní vektory jsou určeny po řadě rovnicemi
0
a jsou to tedy například vektory (-^, 1 — -^), (-^, —1 — (které jsou automaticky ortogonální). □
Poznámka. Zkuste si nakreslit obrázek působení zobrazení určeného maticí A na nějaký vektor v rovině.
7.55. Diskrétní kosinová transformace 2. Ukažte, že symetrická matice
/O 1 1 0
o o\ o o
o o ... 0 1 \o o ... 10/ má vlastní hodnoty kt = cos R jedné proměnné, ^t:^ Přinejmenším bývají potřebné funkce závislé na parametrech a často právě změna výsledků v závislosti na parametrech bývá důležitější než výsledek samotný. Budeme proto uvažovat funkce
f(xi,x2,...,x„) :Rn ^R
a budeme se snažit co nejlépe rozšířit naše metody pro sledování hodnot a jejich změn do této situace. Říkáme jim funkce více proměnných.
Pro snazší pochopení pojmů budeme často pracovat s případy n — 2 nebo n — 3 a přitom budeme místo číslovaných proměnných používat písmena x,y, z. To znamená, že funkce / definované v „rovině" R2 budou značeny
f :R2 3 (x, y) i-> f(x, y) e R
a podobně v „prostoru" R3
f : R3 3 (x, y, z) k> f (x, y, z) e R.
Podobně jako u funkcí jedné proměnné hovoříme o definičním oboru AcK",na kterém je ta která funkce definována. Při zkoumání funkce zadané konkrétním výrazem bývá prvním úkolem zjistit co největší definiční obor, na kterém má tento výraz smysl.
S každou takovou funkcí více proměnných bývá užitečné uvažovat její graf, tj. podmnožinu G f c K" xK = definovanou vztahem
G f = {(xi, ...,x„, f(xi, ...,x„)); (xi, ...,x„) e A},
A. Topologie En
8.1. Známým faktem o prostom En je, že nejkratší možná spojnice dvou boduje přímka. Na prostom R" (či jeho podmnožinách) můžeme však definovat různé metriky, které tuto vlastnost nemají. Uvážíme-li mapu nějakého státu jako podmnožinu R2, lze definovat vzdálenost dvou bodů, jako dobu, za kterou se lze nejrychleji dostat z jednoho do druhého pomocí použití veřejné dopravy či pěšky. Například ve Francii má takto definovaná metrika hodně daleko k tomu, aby nejkratší spojnicí dvou bodů byla přímka.
8.2. Ukažte že každá vlastní podmnožina E„ má něj aký hraniční bod.
Řešení. Nechť U c En nemá hraniční bod. Uvažme bod X € U a Y s U a úsečku XY e En. Populárně řečeno, tato úsečka musí někdy „přejít" z U do U a tento přechod je možný jen na hranici (jak čtenář jistě zjistil při návštěvě cizích zemí). Formálně zvolme na úsečce XY bod A tak, aby \XA\ = sup{|XZ|, XZ e U} (takový bod A je na úsečce XY právě jeden). Tento bod je zjevně hraničním bodem množiny U: z definice A leží libovolná úsečka XB, kde B e X A celá v U, zejména tedy bod B. Pokud by ovšem existovalo okolí A ležící celé v U, tak by existovala úsečka delší než úsečka XA, ležící celá v U, což by byl také spor s definicí bodu A. Libovolné okolí bodu X tak obsahuje jak bod z U tak z U. □
460
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
kde A je definiční obor /. Např. grafem funkce definované v rovině vztahem
x + y
f(x, y)
+ V2
je docela pěkná plocha na obrázku a jejím maximálním definičním oborem jsou všechny body roviny kromě počátku (0, 0).
Při definici a zejména při kreslení obrázku grafu jsme použili pevně zvolené souřadnice v rovině. Pokud pro některou z nich zvolíme pevnou hodnotu, zbude nám jen jedna proměnná. Pro pevně zvolenou hodnotu x tak např. dostáváme zobrazení
R -> R3, y i-> (x, y, f (x, y)),
tj. křivku v prostoru M3. Křivky jsou vektorové funkce jediné proměnné, se kterými jsme již pracovali v šesté kapitole (viz 6.14). Na obrázku jsou čarami vyneseny obrazy takovýchto křivek pro některé pevně zvolené hodnoty souřadnic x a y.
Křivky c : R -> Rn jsou vedle funkcí více proměmných nej-jednoduššími příklady zobrazení F : Rm -> Rn, ke kterým se dostaneme brzy také.
U funkcí jedné proměnné jsme celý diferenciální a integrální počet vybudovali na základě pojmů konvergence, otevřených okolí, spojitosti atd. Tyto pojmy jsme poté v druhé části sedmé kapitoly zobecnili nejen pro euklidovské prostory R", ale i obecněji pro tzv. metrické prostory. Před čtením následujících odstavců bude vhodné si tyto pasáže pečlivě připomenout, případně dohledávat si tam potřebné pojmy a výsledky průběžně. Pro jistotu tady jen velice rychle shrneme aspoň něco málo.
8.2. Euklidovské prostory. Euklidovský prostor E„ vnímáme 'IQLď' Jak° mnozmu hodů v Rn bez volby souřadnic a na ^yTTfc jeho zaměření R" pohlížíme jako na vektorový pro-yS^^^^T^ stor možných přírůstků, které umíme k bodům prostoru E„ přičítat.
Navíc je na Rn zvolen standardní skalární součin
xiyi
8.3. Dokažte, že jedinou podmnožinou E„, která uzavřená i otevřená je E„ samotné.
Řešení. Kdyby byla taková vlastní podmnožina, tak by podle předchozího příkladu ||8.2|| měla hraniční bod, což by byl spor s její otevřeností. □
8.4. Ukažte, že prostor E„ nelze zapsat jako sjednocení (alespoň dvou) disjunktních neprázdných otevřených množin.
Řešení. Předpokládejme, že E„ takovým sjednocením vyjádřit lze, tedy E„ = U Ui, kde I je nějaká indexová množina. Vyberme pevně
Ze/
nějakou množinu U z tohoto sjednocení. Pak můžeme psát En = U U U, kde jak U, tak U (jakožto sjednocení otevřených) jsou obě otevřené. Tedy jsou obě, protože jsou doplňky otevřených, i uzavřené a dostáváme spor s tvrzením předchozího příkladu ||8.4||. □
8.5. Dokažte nebo vyvraťte: sjednocení (případně i nekonečně mnoha) uzavřených podmnožin v R" je uzavřená podmnožina v R".
Řešení. Tvrzení neplatí. Protipříkladem je sjednocení
yZ=3
1 1
-, 1 - -
i i
uzavřených podmnožin R, které je rovno oteřené množině (0, 1). □
8.6. Dokažte nebo vyvraťte: průnik (případně i nekonečně mnoha) otevřených podmnožin v R" je otevřená podmnožina v R". Řešení. Tvrzení neplatí. Protipříkladem je průnik
"Z =2
1 1
-, 1 - -
i i
kde u — (x\,..., xn) a v — (yi,..., yn) jsou libovolné vektory. Tím je na E„ dána metrika, tj. funkce vzdálenosti || P — Q\\ dvojic
otevřených podmnožin R, které je rovno uzavřené množině {1}. □
B. Tečny, tečné roviny, grafy funkcí více proměnných
8.7. Určete definiční obor funkcí R2 -> R, které jsou zadány následujícími předpisy:
' y(jc3+jc2+jc + l)'
b) ln(x2 - y2),
c) arcsin(2sgn(xQ(x)), kde xq značí charakteristickou funkci racionálních čísel.
Řešení, a) Jedinou podmínkou proto, aby byl předpis korektně zadával nejakou hodnotu je, aby jmenovatel uvedeného zlomku byl nenulový. Předpis tak definuje funkci na množině M\{(y, 0), (y, —1), x, y e R}.
b) Předpis je korektní, pokud je argument logaritmu kladný, tj. \x\ > |y|. Definiční obor takto zadané funkce j e tedy {(x, y) e R, \x\ > \y\}.
c) Aby předpis zadával nějakou hodnotu, musí být argument funkce ar-csin v intervalu [—1; 1], což je porušeno právě pro ty dvojice (x, y) e
461
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
bodů P, Q předpisem
Q\\
E*
kde u je vektor, jehož přičtením k bodu Q obdržíme bod P. Např. v rovině E2 je tedy vzdálenost bodů P\ = (x\, yi) a P2 = (x2, y2) dána
(x! - x2)2 + (yi - y2)2.
Takto definovaná metrika splňuje trojúhelníkovou nerovnost pro každé tři body P, Q, R
R\\ = \\(P - Q) + (Q - R)\\ < \\(P-Q)\
\(Q-R)\
viz 3.25(1) v geometrii, resp. axiomy metriky v 7.12 nebo stejnou nerovnost (5.4) pro skaláry. Můžeme proto bez problému přenést (rozšířit) pro body P; libovolného Euklidovského prostoru pojmy zavedené dosud pro reálné a komplexní skaláry a pdrobně diskutované pro metrické prostory:
j Topologie euklidovského prostoru |_
Cauchyovská posloupnost: posloupnost bodů P; taková, že pro každé pevně zvolené e > 0 je || Pí■ — P j \\ < e pro všechny indexy, až na konečně mnoho výjimečných hodnot i, j, konvergentní posloupnost: posloupnost bodů P; konverguje k bodu P, jestliže pro každé pevně zvolené e > 0 je || P; —P || < e, až na konečně mnoho výjimečných hodnot i, j; bod P pak nazýváme limitou posloupnosti P;,
hromadný bod P množiny A C En: existuje posloupnost bodů
v A konvergující k P a vesměs různých od P,
uzavřená množina: obsahuje všechny své hromadné body,
otevřená množina: její doplněk je uzavřený,
otevřenéS-okolíbodu P: množina Og(P) = {Q e En; \\P —
gII < <$}, S e R, S > 0,
hraniční bod P množiny A: každé á-okolí bodu P má neprázdný průnik s A i s komplementem E„\A, vnitřní bod P množiny A: existuje á-okolí bodu P, které celé leží uvnitř A,
ohraničená množina: leží celá v nějakém <5-okolí některého
svého bodu (pro dostatečně velké S),
kompaktní množina: uzavřená a ohraničená množina.
R2, které mají první složku racionální. Předpis tedy korektně definuje funkci na množině {{x,y),x el\Q).
□
8.8. Určete parametrické i implicitní rovnice tečny ke křivce c :
R -» R3, c(t) = (ci(ř), c2(t), c3(ř)) = (ř, t2,t3) v bodě odpovídajícím hodnotě parametru t = 1.
Řešení. Parametru t = 1 odpovídá bod c(l) = [1,1,1]. Derivace jednotlivých složek jsou c[(t) = 1, c'2(t) = 2t, c3(t) = 3ř2. Hodnoty derivací v bodě t = 1 jsou 1,2, 3. Parametrické rovnice tečny tak jsou:
y
z
+Cl(l) C2(l)í +c2(l) +c3(l)
t + l,
2t + 1, 3ř + 1.
Vyloučením parametru t dostáváme implicitní rovnice tečny (nejsou dány kanonicky):
2x ■ 3x
y
■ z
1,
2.
□
8.9. Určete, zda tečná rovina ke grafu funkce / : R x R+ -> R f(x, y) = x ■ ln(y) v bodě [1, ^] prochází bodem [1, 2, 3] e R3.
Řešení. Určíme nejdříve parciální derivace: fx(x,y) = ln(y),
fy(x, y)
-, jejich hodnoty v bodě (1, -) jsou —1, e, dále
f(l, i) = —1. Rovnice tečné roviny je tedy
= — 1 — x + ey.
y - -
e
■^TéttíTéwňci daný bod nevyhovuje, v tečné rovnině tedy neleží.
ilustraci pojmu, napr. j j j j
□
Čtenář by měl investovat přiměřené úsilí do pročtení odstavců 3.25, 5.14-5.17 a 7.14-7.16 a 7.22 a zkusit si promyslet/připomenout definice a souvislosti všech těchto pojmů. Zejména by mělo být z definic přímo zřejmé, že posloupnosti bodů Pí mají vlastnosti zmiňované v prvních dvou bodech předchozího výčtu tehdy a jen tehdy, když stejně nazvané vlastnosti mají reálné posloupnosti vzniklé z jednotlivých souřadnic bodů P; ve kterékoliv kartézské souřadné soustavě. Proto také z Lemma 5.12 vyplývá, že každá Caychovská posloupnost bodů v E„ je konvergentní. Zejména je tedy E„ vždy úplným metrickým prostorem.
8.3. Kompaktní množiny. Naše hrátky s otevřenými, uzavřenými nebo kompaktními množinami mohly v případě reálné přímky E\ vypadat jako zbytečné, protože nakonec jsme stejně skoro vždy mluvili jen o intervalech.
8.10. Určete parametrické vyjádření tečny k průsečnici grafů funkcí
/ : R2 -> R, f(x, y) = x2 + xy - 6, g : R x R+ -> R, g(x, y) = x ■ ln(y) v bodě [2, 1].
Řešení. Tečna k průsečnici je průsečnici tečných rovin v daném bodě. Tečná rovina ke grafu funkce / procházející bodem [2, 1] je
z = /(2,1) + A(2, l)(x-x0) + /,(2,l)(y-y0) = 5x + 2y - 12.
Tečná rovina k grafu g je pak
z = f(2,l)+gx(x,y)(2,l)(x-xo) + 8(x,y)y(2,l)(y-y0) = 2y - 2.
462
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
(4)
(5)
U metrických prostorů ve ve druhé části kapitoly sedmé to možná bylo až moc složité. Stejný přístup je ale v případě euklidovských prostorů R" docela jednoduchý a zároveň velmi užitečný a podstatný (a je to samozřejmě speciální případ obecných metrických prostorů).
Stejně jako v případě E\ definujeme otevřené pokrytí množiny (tj. systém otevřených množin, v jejichž sjednocení je daná množina obsažena) a platí s drobnými formulačními úpravami i Věta 5.17:
Věta. Pro podmnožiny A C En v euklidovských prostorech platí:
(1) A je otevřená, právě když je sjednocením nejvýše spočetného systému S-okolí,
(2) každý bod a e A je buď vnitřní nebo hraniční,
(3) každý hraniční bod je buď izolovaným nebo hromadným bodem A,
A je kompaktní, právě když každá v ní obsažená nekonečná posloupnost má podposloupnost konvergující k bodu v A, A je kompaktní, právě když každé její otevřené pokrytí obsahuje konečné pokrytí.
Důkaz. Důkaz z 5.17 lze bez úprav použít v případě tvrzení (l)-(3), byť s novým chápání pojmů a nahrazením „otevřených intervalů" jejich vícerozměrnými á-okolími vhodných bodů.
Důkaz pro zbylá dvě tvrzení je však třeba dosti zásadně upravit. Bude proto dobré si projít důkaz příslušných obecných tvrzení pro metrické prostory v 7.22 a přitom přemýšlet, co je v případě euklidovských prostorů možné zjednodušit. □
8.4. Křivky v E„. Skoro celá naše diskuse kolem limit, derivací - 'fitr'-7^' a mtegrálů funkcí v 5. a 6. kapitole se týkala funkcí s jednou reálnou proměnnou a reálnými nebo kom-~ plexními hodnotami s odůvodněním, že používáme
pouze trojúhelníkovou nerovnost platnou pro velikosti reálných i komplexních čísel. Již tehdy jsme si povšimli, že se tento argument do značné míry přenáší na jakékoliv funkce jedné reálné proměnné s hodnotami v euklidovském prostoru R" a uvedli jsme několik nástrojů pro práci s křivkami v odstavcích 6.14-6.17.
Připomeňme proto, že pro každou (parametrizovanou) křivku1, tj. zobrazení c : R -> R" v n-rozměrném prostoru, můžeme pracovat s pojmy, které jednoduše rozšiřují naše úvahy z funkcí jedné proměnné:
• limita: limř^ř0 c (ŕ) e R"
• derivace: c'(t0) — limř_>ř0 • (c(ŕ) - c(ŕ0)) e R"
• integrál: fa c(t)dt e R".
Všimněme si také, že jak limita tak derivace křivek mají smysl v afinním prostoru, aniž bychom volili souřadnice (přičemž limitou posloupnosti je opět bod v původním prostoru, zatímco derivace je vektor v zaměření!). V případě integrálu ale musíme uvažovat křivky ve vektorovém prostoru Rn. Důvod je vidět už v jednorozměrném případě, kde potřebujeme znát počátek, abychom mohli vidět „plochu pod grafem funkce".
Opět je přímo z definice zjevné, že limity, derivace i integrály lze spočíst po jednotlivých n souřadných složkách vR"a stejně se rozpozná i jejich existence.
geometrii se většinou rozlišuje mezi křivkou jakožto podmnožinou v En a její parametrizací E ->• E". My zde pod pojmem „křivka" rozumíme výhradně parametrizované křivky. Těm se v české geometrické literatuře často říká „dráha"
Průsečnicí těchto dvou rovin je přímka daná parametricky jako
[2, t, 2t - 2], t e R.
Jiné řešení. Normála k ploše určené rovnicí f(x, y, z) = 0 v bodě b = [2, 1, 0] je (fx(b), fy(b), fz(b)) = (5, 2, —1), normála k ploše určené jakog(x, y, z) = 0 v tomtéž bodě je (0, 2, —1). Tečna je kolmá na obě normály, její směrový vektor získáme tedy např. vektorovým součinem normál, což je (0, 5, 10). Protože tečna prochází bodem [2, 1, 0],je její parametrické vyjádření [2, 1 + t, 2t], t e R. □
8.11. Napište Taylorův rozvoj druhého řádu funkce / : R2 -» R,
f(x, y) = ln(x2 + y2 + 1) v bodě [1, 1].
Řešení. Nejprve spočítáme první parciální derivace:
2x . 2y
fx
x2 + y2 + 1
fy
poté Hessián:
Hf(x, y)
2y2-2;t2+2 (x2+y2+l)2 4xy
X2 + y2 + 1
4xy
(x2+y2+l)2
_ 2;t2-2y2+2
(x2+y2 + l)2 (x2+y2 + l)2 I
Hodnota Hessiánu v bodě [1, 1] je
4 2 "9 9
celkem tedy již můžeme napsat Taylorův rozvoj druhého řádu v bodě [1, 1]:
T2(x,y) = f(l,l) + Ml,l)(x-l) + fy(l,l)(y-l) +
= ln(3) + ^(x-l) + ^(3;-l) + Í(x-l)2-
-A-(x- l)(y- \)+l-(y- l)2 = ^(x2 +ý +8x + 8.y-4x.y-14)+ln(3).
□
Poznámka. Zejména je tedy Taylorův rozvoj (polynom) druhého stupně z libovolné diferencovatelné funkce v daném bodě mnohočlenem druhého stupně.
8.12. Určete Taylorův polynom druhého stupně funkce
/ : R2 -> R2, f(x,y) = xycosy v bodě [jr,jr]. Rozhodněte (tím se myslí i zdůvodněte), zda tečná rovina ke grafu této funkce v bodě [ir, 7t, f(ir, ir)] prochází bodem [0, tt/2, 0].
Řešení. Jako v předchozích příkladech zjistíme, že
T(x,y) = l-n2ý - xy - jt3y + l-pA.
463
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
U integrálu můžeme také přímo formulovat pro křivky analogii souvislosti Riemannova integrálu a primitivní funkce (viz 6.25):
Tvrzení. Nechť c je křivka v R", spojitá na intervalu [a, b]. Pak
cb
existuje její Riemannův integrál Ja c(ť)dt. Navíc je křivka
C(t)
Ja
c(s)ds e
dobře definovaná, diferencovatelná a platí C (t) — c(t) pro všechny hodnoty t e [a, b].
Horší je to s větou o střední hodnotě a obecněji s Tayloro-vou větou, viz 5.38 a 6.4. Ve zvolených souřadnicích je můžeme aplikovat na jednotlivé souřadné funkce diferencovatelné křivky c(t) — (ci(ř), • • •, c„(f)) na konečném intervalu [a, b]. Dostaneme např. u věty o střední hodnotě existenci čísel f; takových, že
ct(b) - c i (a) — (b -a)- c-(ři).
Tato čísla f; ale budou obecně různá, nemůžeme proto vyjádřit rozdílový vektor koncových bodů c(b) — c (a) jako násobek derivace křivky v jediném bodě. Např. v rovině E2 pro diferencovatelnou křivku c{t) — (x(f), y(f)) takto dostáváme
db) - cia) = (x'(^)(b ~ a), ý(ji)(b - a))
= (&-«)■ (V (£),/(»?))
pro dvě (obecně různé) hodnoty ^,rj e [a, b]. Pořád nám ale tato úvaha stačí na následující odhad
Lemma. Je-li c křivka v En se spojitou derivací na kompaktním intervalu [a, b], pak pro všechny a < s < t < b platí
\\c(f) - c(s)\\ < */ň(maxre[aM \\c'(r)\\) ■ \t - s\.
Důkaz. Přímým použitím věty o střední hodnotě dostáváme pro vhodné body r i uvnitř intervalu [s,f\:
n n
\\c(t) - c(s)\\2 = £(cí(0 - Ciis))2 < J2(c'i(ri)it - s)Ý
<(t- s)2 Emaxre[s,ř] c'Ar)2
i=\
< n(maxre[s,t\, /=!,...,« |c-(r)|)2(f - s)2
< íimaxrE|jií] ||c'(r)||2(f
Rovnice tečné roviny ke grafu dané funkce v bodě (it, it) je dána Taylo-rovým polynomem prvního stupně v bodě {jt, Tt), její obecná rovnice je tedy
z = —Tty — JtX + tt2, které zadaný bod [0, it, 0] vyhovuje. □
8.13. Určete Taylorův polynom druhého stupně funkce / : R2 -> R2, fix,y) = x2 siny + y2 cos x v bodě [0, 0]. Rozhodněte, zda tečná rovina ke grafu této funkce v bodě [0, 0, 0] prochází bodem [n, Tt, it].
O
8.14. Určete Taylorův polynom druhého řádu funkce ln(x2 y) v bodě
[i,i]. O
8.15. Určete Taylorův rozvoj druhého řádu funkce / : R2 -> R,
f(x,y) = tanixy + y) v bodě (0,0). O
8.16. Buď dáno zobrazení F : R2 R, Fix, y) = xy sin (f xy2). Ukažte, že rovnost Fix, y) = 1 zadává v nějakém okolí U bodu [1,1] implicitně funkci / : U -> R tak, že platí Fix, fix)) = 1 pro x e U. Určtete /'(l).
Řešení. Fy{x,y) = xsmí^xy2) + Ttx2y2 cosí^xy2), tedy Fy{\,\) = 1 0, tudíž předpis Fix, y) = 1 zadává implicitně na okolí bodu (1, 1) funkci / : R -> R. Pro její derivaci potom platí
C. Extrémy funkcí více proměnných
□
8.17. Určete stacionární body funkce / :
Jix,y) =x2y +
Důležitým pojmem je tečný vektor ke křivce c :
y2x — xy, a rozhodněte, které z těchto bodů jsou lokální extrémy a
J7 y Pokud si představíme c " JakodtoJj^jj^druflU
boděc(fo) e En, který definujeme jako vektor v prostoru zaměření předmitu v prostom,
R" daný derivací c'(f0) e R". Přímka T zadaná parametricky Sé^SrfiřPrvní derivace jsou fx = 2xy + y2 - y, fy=x2+ 2xy - x.
/ chápat jako okamžitou ^
T \ C (to) + t ■ C (to) rychlo]
se nazývá tečna ke křivce c v bodě to. Na rozdíl od tečného vektoru, tečna T coby neparametrizovaná přímka zjevně nezávisí na parametrizaci křivky c, protože při změně parametrizace dostaneme díky větě o derivování složených funkcí znovu stejný tečný vektor, až na násobek.
1
8.5. Parciální derivace. Pro každou funkci / : R" —>• R a libovolnou křivku c : R —>• R" máme k dispozici jejich kompozici (/oc)(ř):K-^K. Tato složená funkce F o c vypovídá o chování funkce / podél křivky c. Nejjednodušší bude použít přímky.
-li obě parciální derivace současně nule, má soustava následující řešení: {x = y = 0}, {x = 0, y = 1}, {x = í, y = 0}, {x = 1/3, y = 1/3}, což jsou čtyři stacionární body dané funkce.
Hessiánfunkce///je (2x+2^_1 2x+^
Jeho hodnoty ve stacionárních bodech jsou postupně 0 -1\ íl 1\ /0 ŕ -1 0)'[l 0)'[l 1, tedy první tři Hessiány jsou indefinitní, poslední pak pozitivně de-
finitní, bod [1/3, 1/3] je tedy lokálním minimem. □
464
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
smerové a parciálni derivace
8.18. Určete bod v rovině x + y + 3 z = 5 ležící v R3, který má nejmenší vzdálenost od počátku souřadnic. A to jak metodami lineární algebry, tak metodami diferenciálního počtu.
Řešení. Jde o patu kobnice spuštěné z bodu [0, 0, 0] na rovinu. Normála k rovině je (ŕ, t, 3t), t e R. Dosazením do rovnice roviny dosta-
Hodnotě dv f také říkáme směrová derivace. jmýJ\ŘmkMu kolmice [5/11,5/11,15/11].
Speciální volbou přímek ve směru souřadných os dostáváme ^S^ttsniativně minimalizujeme vzdálenost (resp. její kvadrát) bodů
Definice. Řekneme, že / : R" -> R má derivaci ve směruvektoru v e Rn v boděx e £„, jestliže existuje derivace dvf(x) složeného zobrazení t i-> f(x + tv) v bodě t — 0, tj.
1
dvf(x) = lim -(/(x + tv) - f(x)). t^o t
tzv. parciální derivace funkce /, které značíme Jf-,' — 1, nebo bez odkazu na samotnou fukci jako operace
Pro funkce v rovině tak dostáváme
d 1
— /(x, y) = lim - (/(x + t,y)- f (x, y)) ôx t^O t
— f (x, y) = lim - (/(x, y + t) - f (x, y)), ôy t^o t
funkce / ve směru v.
■' ' v rovině od počátku, tj. funkci dvou proměnných,
(5-y- 3z)2 + y2 + z2. Položením parciálních derivací rovných nule dostaneme soustavu
3y + 10z - 15 = 0
2y + 3z
Tady je to hodně zevrubné, je potřeba hodně času a počítání bokem, aby si to člověk ověřil a tím pádem uvěřil.
Zejména je vidět, že parciálně podle vybrané proměnné derivujeme tak, že prostě všechny ostatní proměnné považujeme za konstanty a postupujeme jako u funkcí jedné proměnné.
8.6. Diferenciál funkce / : Rn -> R. Se samotnými parciálními nebo směrovými derivacemi nevystačíme pro dobrou aproximaci chování funkce lineárními výrazy. Asi bychom přirozeně očekávali, že „diferencovatelná" funkce více proměnných bude složením s jakoukoliv diferencovatelnou křivkou dávat diferencovatelné funkce jedné proměnné, které už dobře známe.
Podívejme se ale např. na funkce v rovině zadané výrazy
1 když yx — 0
0 jinak
1 když y — x2 / 0 0 jinak
Evidentně žádná z nich neprodlužuje všechny hladké křivky procházející bodem (0, 0) na hladké funkce. Přitom ale pro g existují obě parciální derivace v (0, 0) a jiné směrové derivace neexistují, zatímco pro h existují všechny směrové derivace v bodě (0, 0) a je dokonce dvh(0) — 0 pro všechny směry v, takže jde o lineární závislost na v e R2.
Snadno si také představíme funkci /, která bude mít podél přímek (r cos 6, r sin 6) s pevným úhlem 6 hodnoty k(6)r, přičemž k(6) je periodická lichá funkce v úhlu 6, s periodou 2tc. Její směrové derivace dvf v (0, 0) všechny existují, ale pro obecné funkce k(6) zcela jistě nepůjde o lineární výrazy v závislosti na směrech v.
Budeme proto napodobovat případ funkcí jedné proměnné co nejdůsledněji a podobné patologické chování funkcí vyloučíme přímo definicí:
_aB^MWaMBMM__J Diferenciál [ah__^4
Definice. Funkce / : Rn -> R je diferencovatelná v bodě x, jestliže zároveň platí tři vlastnosti:
(1) v bodě x existují směrové derivace dvf(x) pro všechny vektory v eR",
(2) dvf(x) je lineární v závislosti na přírůstku v,
= 0,
která má řešení jako výše. Protože víme, že minimum existuje a jedná se o jediný stacionární bod, nemusíme už ani počítat Hessián. □
8.19. Určete všechny lokální extrémy funkce
f(x, y) = x2 + arctg2 x + | y3 + y | , x,ys\
Řešení. Funkci / si vyjádříme jako součet fi + fi, kde
h (x) = x2 + arctg2x, x e R, f2(y) = I y3 + y
y e
Máli-li mít funkce / v nějakém bodě lokální extrém, pak jej musí mít také vzhledem k libovolné podmnožině svého definičního oboru. Jinak řečeno, pokud má např. v bodě [a,b] maximum a my položíme y = b, potom funkce f(x, b) jedné proměnné x musí mít maximum v bodě x = a. Zvolme libovolně jel. Pro toto pevné y dostáváme funkci jedné proměnné, která je posunutím funkce f\, což znamená, že má maxima a minima ve stejných bodech. Nalézt extrémy f\ je ovšem snadné. Stačí si uvědomit, že tato funkce je sudá (je součtem dvou sudých funkcí, přičemž funkce y = arctg2 x je součinem dvou lichých funkcí) a rostoucí pro x > 0 (kompozice i součet rostoucích funkcí je rostoucí funkce). Má proto jediný extrém, a to minimum v bodě x = 0. Podobně platí, že pro pevně zvolené x je / posunutím f2 a že také funkce f2 má minimum v bodě y = 0 jako svůj jediný extrém. Dokázali jsme tak, že / může mít lokální extrém pouze v počátku. Protože zjevně
/(0,0)=0, f(x,y)>0, [ij]eR2\([0,0]),
funkce / má v bodě [0, 0] ostré lokální (dokonce globální) minimum.
□
8.20. Vyšetřete lokální extrémy funkce
f(x, y) = (x + y2) ei, jjéI.
465
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
(3) linwo m(/(* + v)~ /(x) " dvf{x)) = °-Lineárni výraz dv f (ve vektorové proměnné v) nazýváme diferenciál funkce f vyčíslený na přírůstku v.
I
Řečeno slovy, požadujeme, aby v bodě x existovalo dobré přiblížení přírůstků funkce / pomocí lineární funkce přírůstků proměnných veličin.
Přímo z definice směrových derivací vyplývá, že můžeme také diferenciál definovat pouze pomocí vlastnosti (3). Skutečně, pokud existuje nějaká lineární forma d fix) taková, že pro přírůstky v v bodě x platí vlastnost (3) s dvf(x) — df(x)(v), pak je zjevně df(x)(v) právě směrovou derivací funkce / v bodě x a vlastnosti (1) a (2) jsou tedy splněny automaticky.
Podívejme se, co umíme říci o diferenciálu funkce fix, y) v . rovině za přepokladu, že obě parciální derivace |£, ^-^pi. |£ exjstujj a jsou Sp0jité v okolí bodu (xo, yo).
Uvažme za tím účelem jakoukoliv hladkou M li=ľ* křivku t i-> (x(f), y(ť)) s x0 — x(0), y0 = y(0). S použitím věty o střední hodnotě na funkce jedné proměnné v obou sčítancích zvlášť dovodíme, že
±(fixit),yiť))- fix0,y0)) =
i(/(x(0, y(0)-/(*o, y(0)) + 7(/(x0, y(0)-/(*o, yo))
= \ixit) -x0) • jpMÉ), yiť)) + \iyit) - y0) ■ ^-(*o, yW) óx óy
pro vhodná čísla ^ ar] mezi 0 a t.
Zejména tedy pro každou posloupnost čísel t„ jdoucí k nule získáme příslušné posloupnosti čísel Š„ar]n, které také budou konvergovat k nule, a pro všechny bude platit vyjádření výše.
Limitním přechodem t -> 0 proto díky spojitosti parciálních derivací dostáváme (viz test konvergence funkce pomocí vybraných posloupností hodnot argumentů, 5.23, a Věta 5.22 o limitách součtů a součinů funkcí)
^-fixit), y(f))|ř=0 = x'(0)^(x0, y0) + /(0)^(x0, y0), dt óx óy
což je příjemné rozšíření platnosti věty o derivování složených funkcí jedné proměnné pro vektorově hodnotové funkce.
Samozřejmě, speciální volbou parametrizovaných přímek
(x(r), y(0) = (*o + yo + ty) přechází náš výpočet při v — (§, rj) na rovnost
dvfixo, yo) — —ixo, yo)Š + ^—(x0, yo)n óx óy
a tento vztah můžeme pěkně vyjádřit způsobem, kterým jsme v lineární algebře zapisovali souřadná vyjádření lineárních funkcí na vektorových prostorech:
3/
df — —dx ■
dx
Bf
dy
dy.
Jinými slovy, směrová derivace dv f je skutečně lineární funkce M" —>• Mna přírůstcích, se souřadnicemi danými právě parciálními derivacemi.
Podobným postupem nyní budeme umět dokázat, že předpoklad spojitých parciálních derivací v daném bodě zajišťuje i aproximační vlastnosti diferenciálu.
Řešení. Daná funkce má parciální derivace všech řádů na celém svém definičním oboru. Lokální extrém může proto nastat pouze ve stacionárních bodech, ve kterých jsou obě parciální derivace fx, fy nulové. O tom, zda v těchto bodech extrém skutečně je, lze pak rozhodnout pomocí druhých derivací. Snadno určíme
fx(x, y) =ei + I (x+ y2)e2, fy(x, y) = 2y é-, ijei Stacionární bod [x, y] musí splňovat
fy(x,y)=0, tj. y=0,
a dále
fx(x,y) = /,(x,0)=ef (1 + ijc) = 0, tj. x =-2.
Vidíme, že existuje jediný stacionární bod [—2, 0].
Nyní spočítáme Hessián H f v tomto bodě. Bude-li tato matice (příslušná kvadratická forma) pozitivně definitní, jedná se o ostré lokální minimum; a při negativní definitnosti jde o ostré lokální maximum. Pokud bude indefinitní, nepůjde o extrém. Platí
fxx(x, y) = \ é (2 + \ (x + y2)) , fyy(x, y)=2é, fxy(x, y) = fyx(x, y) = yei, x, y e R,
a tedy
h f (-7 m = (f**("2'0) f*y("2' °A = (1/2e 0
J{ ' ^ \fyx (-2,0) fyy(-2,0)J { 0 2/ey Připomeňme, že vlastními čísly diagonální matice jsou právě hodnoty na diagonále a že pozitivní definitnost matice znamená, že všechna její vlastní čísla jsou kladná. Odtud již plyne, že v bodě [—2, 0] je ostré lokální minimum. □
8.21. Nalezněte lokální extrémy funkce
fix, y, z) = x3 + y2 + ^ - 3xz - 2y + 2z, x, y, z e R.
Řešení. Funkce / je polynomem (mnohočlenem), a tudíž o ní víme, že má parciální derivace všech řádů. Hledejme proto stacionární body (jinde extrém být nemůže) tak, že zderivujeme / postupně podle x, y, z a tyto derivace položíme rovny nule. Takto dostaneme 3x2-3z = 0, tj. z=x2, 2y-2 = 0, tj. y = 1, a (s využitím první rovnice)
z-3x + 2 = 0, tj. iě(1,2). Existují tedy dva stacionární body [1, 1, 1], [2, 1,4]. Vypočtěme nyní všechny parciální derivace druhého řádu
fXX - 6X, fXy - fyX - 0, fXZ - fZX - 3,
fyy = 2, fyz = fzy = 0, fzz = 1.
S jejich pomocí ve stacionárních bodech snadno určíme Hessián ;
466
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
Budeme už rovnou uvažovat obecné funkce více proměnných:
8.7. Věta. Nechť f : En -> R je funkce n proměnných, která má v okolí bodu x € En spojité parciální derivace. Pak existuje její diferenciál d f v bodě x a jeho souřadné vyjádření je dáno výrazem.
df df df d f — -—dx\ + -—dx2 H-----h -—dx„.
áx\ 0X2 oxn
Důkaz. Odvození věty je naprosto analogické výše uvede-nému postupu v případě n — 2. Musíme být jen Ši, být opatrní v detailech a dokončit úvahu o aproximačních vlastnostech. Úplně stejně jako výše uvažujeme křivku
c(t) = (Cl(t),...,cn(t)),
c(0) — (0,0), a bod x e R" a vyjádříme pro složenou funkci f (cit)) rozdíl fix + cit)) - fix) takto
f(xt + ct(t),...,
(0) - f(xi, X2 + c2(t), ...) + f(x\, x2 + c2(t), ...))- f(x\,X2, ...,xn +cn(t))
+ f(x\, x2,...,x„+ cn(t)) - f(x\,X2, xn).
Na všech n sčítanců teď můžeme uplatnit větu o střední hodnotě a, stejně jako v případě dvou proměnných, dostáváme
df
(ci(ř) -ci(0))-Mxi +c1(61),X2 + c2(t), ...,xn +cn(t)) ax\
(c2(t) - c2(0))^-(xu X2 + c2(62),
0X2
c„(t))
df
+ (c„(t) -c„(0))-—(xi,x2, oxn
■ ,x„ +ci(6„)),
pro vhodné hodnoty 0 < 0/ < t. Jde o konečný součet, proto stejnou argumentací jako v případě dvou proměnných ověříme
^-f(x + c(O)m) = c[(0)^(x) + ■■■ + c'n(Q)^L(x). dt ox\ oxn
Speciální volbou křivek c(ť) — x + tv pro směrový vektor v máme ověřeno tvrzení o existenci a linearitě směrových derivací v bodě
x.
Zároveň ale můžeme úplně stejně aplikovat větu o střední hodnotě na rozdíl
f(x + v)-f(x) = dvf(x+Gv)
df
ví-—(x +6v) ■
OX\
df
vn-—(x + 6 v)
oxn
s vhodným 0 < 9 < 1, kde druhá rovnost platí, podle výše odvozeného výrazu pro směrové derivace, pro dostatečně malá v díky spojitosti parciálních derivací na okolí bodu x.
Protože jsou všechny parciální derivace spojité v bodě x, víme, že pro libovolně malé e > 0 můžeme najít okolí U počátku v Rn takové, že se pro w e U budou všechny parciální derivace ^-(x +
w) lišit od J£- (x) o méně než e. Dostaneme pak odhad
-^—(f(x + w)-f(x)-dwf(x+6w)) < TT-TlNHe II10II II10II
a tedy i aproximační vlastnost diferenciálu je splněna.
i 0 -3\ /12 0 -3
ff/(l,l,l) = | 0 2 0 , Hf(2, 1,4)= 0 2 0 -3 0 1 / \-3 0 1
Potřebujeme zjistit, zda jsou tyto matice pozitivně definitní, negativně definitní, příp. indefinitní, abychom mohli rozhodnout, jestli a jaké jsou v nich extrémy. V případě první z matic (pro bod [1, 1, 1]) ihned vidíme vlastní číslo X = 2. Neboť je její determinant roven —6 a jedná se o symetrickou matici (všechna vlastní čísla jsou reálná), matice musí mít také záporné vlastní číslo (determinant je součinem vlastních čísel). Matice H f (1, 1, 1) je tedy indefinitní - v bodě [1, 1, 1] extrém není.
Pro matici H f (2,1, A) použijeme tzv. Sylvestrovo kritérium. Podle tohoto kritéria je reálná symetrická matice
út 12 «22 a23 13 Ü23 Ö33
a\n\
^2« ^3«
\Clln @2n ^3n ' ' ' &nnJ
pozitivně definitní, právě když všechny vedoucí hlavní minory A, tj. determinanty
an a i2
^12 a22
all al2 al3
3= an a22 a23 , ..., d„ = \ A |,
al3 a23 a33
jsou kladné, a je negativně definitní tehdy a jenom tehdy, když je
d\ < 0, d2 > 0, d3 < 0, Z nerovností
12
12 > 0,
12 0 0 2
6 > 0,
12 0 24 > 0, 0 2 0 -3 0 1
vyplývá, že matice H f (2, 1, 4) je pozitivně definitní - v bodě [2, 1, 4] je ostré lokální minimum. □
(-\fdn >0. -3
8.22. Stanovte lokální extrémy funkce
z = (x2-l)(l
y2)
x, y e
Řešení. Opět spočítáme parciální derivace zx a zy a položíme je rovny nule. Takto obdržíme rovnice
-6x5 + 4x3 + 2x - 2xy2 = 0, (x2 - l) (-2y) = 0
s řešeními [x, y] = [0, 0], [x, y] = [1, 0], [x, y] = [—1, 0]. Doplňme, že k nalezení řešení stačilo určit reálné kořeny 1,-1 polynomu — 6x4 + 4x2 + 2 pomocí substituce u = x2. Nyní vypočítáme druhé parciální derivace
-30x4 + 12x2 + 2-2/, z.
xy
»yx
-4xy, Zyy = -2 (x2 - l)
□ a ve stacionárních bodech vyčíslíme Hessián:
467
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
8.8. Tečná rovina ke grafu funkce. Lineární přiblížení chování funkce diferenciálem můžeme také obdobně k funkcím jedné proměnné vyjádřit ve vztahu k jejímu ^Ľps grafu. Jen místo tečen musíme pracovat s nadrovi-nami.
Pro případ funkce na E2 a pevně zvoleného bodu (xo, yo) e E2 uvažme rovinu v £3 zadanou rovnicí
z — /(xo, yo) + df(x0, yo)(x -x0,y- yo)
df df — f(xo, yo) + -z-(x0, yo)(x - x0) + — (x0, yo)(y - yo)-dx áy
Již jsme viděli, že přírůstek funkčních hodnot diferencovatelné funkce / : E„ -> R v bodech x + tv a x je vždy vyjádřen pomocí směrové derivace dv f ve vhodném bodě na jejich spojnici. Tato rovina má tedy jako jediná ze všech rovin procházejících bodem (xo, yo) vlastnost, že v ní leží derivace a tedy i tečny všech křivek
c(t) = (x(t), y(t), f(x(t), y(t)))-
Říkáme jí tečná rovina ke grafu funkce /.
Na obrázku jsou zobrazeny dvě tečné roviny ke grafu funkce
f(x, y) — sin(x) cos(y).
Diagonálně vedená čáraje obrazem křivky c(t) — (t, t, f(t, t)).
Hz(0, 0)
Pro funkce n proměnných definujeme tečnou rovinu jako analogii k tečné rovině k ploše v trojrozměrném prostoru. Místo zaplétání se do spousty indexů bude snad užitečná vzpomínka na afinní geometrii, kde jsme s tzv. nadrovinami již pracovali, viz odstavec 4.3.
Tečná (nad)rovina grafu funkce v bodě |_
Definice. Tečná nadrovina ke grafu funkce / : R" -> R v bodě x e Rn je nadrovina procházející bodem (x, fix)) se zaměřením, které je grafem lineárního zobrazení d fix) : Rn -> R, tj. diferenciálu v bodě x e E„.
Definice vychází ze skutečnosti, že směrová derivace dv f je dána přírůstkem na tečné (nad)rovině odpovídajícím přírůstku argumentu v. ^^^^^^^J
Z těchto úvah vyplývá řada analogií s funkcemi jedné proměnné. Zejména má diferencovatelná funkce / na E„ v bodě x e E„ nulový diferenciál tehdy a jen tehdy, když její složení s libovolnou křivkou procházející tímto bodem zde má stacionární bod, tj. ani neroste ani neklesá v hneárním přiblížení.
Jinak řečeno, tečná rovina je v takovém bodě rovnoběžná s nadrovinou proměnných (tj. její zaměření je E„ c £«+1 s přidanou nulovou poslední souřadnicí). To samozřejmě neznamená, že v takovém bodě musí mít / aspoň lokálně buď maximum nebo minimum. Stejně jako u funkcí jedné proměnné můžeme rozhodovat teprve podle derivací vyšších.
V0 2)' »«(!•«» = »«(-!•«» "("J6 J)-Vidíme, že první z matic je pozitivně definitivní, a tudíž je v počátku ostré lokální minimum.
Zbývající dvě matice jsou ale negativně semidefinitní. Nelze tedy na základě druhých parciálních derivací s určitostí říci, zdaje v bodech [1, 0], [—1, 0] extrém. Zkoumejme proto funkční hodnoty v okolích těchto bodů. Platí
Z(l,0) =z(-l,0) =0, z(x,0)<0 pro jc e (-1,1). Uvažujme dále y v závislosti na x e (—1,1) dané předpisem y =
2(l — x4) splňujícím, že y -» 0 pro x —> ±1. Pro tuto volbu je však
z (x, ^2(1 -x4)) = (x2 - 1) (x4 - 1) > 0, x e (-1, 1).
Ukázali jsme, že v libovolně malých okolích bodů [1,0], [—1,0] nabývá z hodnot větších i menších, než je funkční hodnota v těchto bodech. Nejedná se tak o extrémy. □
8.23. Rozhodněte, zda má polynom
p(x, y) = x6 + y* + y4x4 - x6/ ve stacionárním bodě [0, 0] lokální extrém.
Řešení. Snadno lze ověřit, že parciální derivace px a py jsou v počátku skutečně nulové. Také všechny parciální derivace pxx, pxy, pyy jsou ale v bodě [0, 0] rovny nule. Hessián H p (0, 0) je tudíž současně pozitivně i negativně semidefinitní. Jednoduchá úvaha však ihned dává výsledek. Všimněme si např., že je p(0, 0) = 0 a současně
p(x, y) = x6 (l - y5) + y8 + y4x4 > 0
pro [x,y] s R x (—1, 1) \ {[0, 0]}. Zadaný polynom má proto v počátku lokální minimum. □
8.24. Určete lokální extrémy funkce / : R3 -> R, f(x, y, z) = x2y + y2z + x - znal3 O
8.25. Určete lokální extrémy funkce / : R3 -> R, f(x, y, z) = x2y — y2z + 4x + znaR3. O
3 -+ R,f(x, y, z) =xz2 +
O
8.26. Určete lokální extrémy funkce /
y2z — x + y na R3.
8.27. Určete lokální extrémy funkce / : R3 -xz2 + x + 4y svého minima na R3.
8.28. Určete lokální extrémy funkce / : R2
x2 + 2y2 + y na R2
8.29. Určete lokální extrémy funkce / : R2
2y2 + 2y na R2.
,f(x, y, z) = y2z-O
l, f(x,y) =x2y +
O
l, f(x,y) =x2y +
O
468
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
8.9. Derivace vyšších řádů. Stejně jako v přídpadě jedné proměnné, operaci derivování je možné iterovat. Tentokrát si můžeme pro každou iteraci vybrat jiný směr.
Jestliže vybereme pevný přírůstek v e Rn, zadává vyčíslení diferenciálů na tomto přírůstku (diferenciální) operaci na diferencovatelných funkcích / : E„ -> R
8.30. Určete lokální extrémy funkce / : I
xy + ly2 + y na M2.
Řešení, (globální) maximum v bodě (1/7,
8.31. Určete lokální extrémy funkce / : I
xy — ly2 + y na M2.
-2/7).
/(*, y)
/(*, y)
1 +
0
□
1 + O
f\-+dvf = df(v)
a výsledkem je opět funkce df(v) : En -> R. Jestliže je tato funkce opět diferencovatelná, může opakovat totéž s jiným přírůstkem atd. Zejména tedy můžeme pracovat s iteracemi parciálních derivací. Pro parciální derivace druhého řádu píšeme
-°-)f
dx i dxi
d2f
dxi dxj dxi dxj
-f
V případě opakované volby / — j píšeme také
dxi ° oxí )■ dx2* dx2'
Úplně stejně postupujeme při dalších iteracích a hovoříme o parciálních derivacích k-tého řádu
Sx/j ... dxik
Obecněji můžeme iterovat (u dostatečně diferencovatelných funkcí) také libovolné směrové derivace, např. dv o dw f pro dva pevné přírůstky v,w eRn.
mm^^l_-Maj &-krát diferencovatelné funkce
Řekneme, že je funkce / : E„ -> R k-krát (spojitě) diferencovatelná v bodě x, jestliže všechny parciální derivace až do řádu k včetně existují na nějakém okolí bodu x a jsou v tomto bodě spojité. _
Řekneme, že funkce / je ^-diferencovatelná, jestliže je k-krát (spojitě) diferencovatelná ve všech bodech svého definičního oboru.
V dalším budeme vždy pracovat se spojitě diferencovatelnými funkcemi, pokud explicitně neuvedem jinak.
Abychom si vše ukázali v co nejjednodušší formě, budeme opět pracovat chvíli v rovině E2 za přepokladu spojitosti parciálních derivací druhého řádu. V rovině a prostoru se často stručně značí iterované derivace pouhými odkazy jmen proměnných v pozici indexů u funkce, např.
df
f — — f —
j X ň ' j XX
dx
9V dx2
fxy —
d2 f 3x3 y
fyx —
d2 f dydx
Ukážeme, že ve skutečnosti spolu za rozumných podmínek parciální derivace komutují, tzn. není potřeba dbát na pořadí, ve kterém je provádíme.
Dle předpokladu existence a spojitosti parciálních derivací existují limity
D. Vázané extrémy
Začněme s tak trochu netypickým optimalizačním problémem
8.32. Sázková kancelář vypisuje kurzy na výhru jednoho, či druhého hráče v tenisovém zápase. Hráč A má kurz a : 1, hráč B má kurz b : 1, tj. v případě sázky x Kč na hráče A obdrží v případě jeho výhry sázející ax Kč, obdobně pro hráče B (poplatky zanedbáváme). Jaká je nutná podmínka pro (kladná reálná) čísla a ab, aby si sázející vhodným rozdělením vsazených peněz mezi sázky na výhru A a na výhru B nemohl zaručit zisk, ať vyhraje kdokoliv (např. při kurzu 1, 4 : 1 na výhru hráče A a 5 : 1 na výhru B by si sázející při sázce 3 Kč na výhru B a 7 Kč na výhru A zajistil vždy zisk).
Řešení. Nechť má sázející k dispozici P Kč. Svoji sázku může rozdělit na kP a (\ — k)Pl korun, kde k e (0, 1). Jeho výhra pak bude buď akP korun v případě výhry hráče A, nebo b(l — k)P korun v případě výhry hráče B. Při daném rozdělení si sázející vždy zaručí výhru odpovídající menší z těchto částek, celkový zisk (ztráta) pak bude dána ještě odečtením částky P. Protože a, b i P jsou kladná reálná čísla, je funkce akP rostoucí a funkce b(l —k)P klesající vzhledem ke k. Pro k = Oje větší b(l — k)P, pro k = 1 je pak větší (l—k)P. Maximum z minim z čísel akP a b(l—k) P tedy nastane pro k e (0, 1) atoproto&o, pro které ako P = b(í—ko)P, odkud &o = Sázková kancelář, aby nezkrachovala, pak musí volit a, b tak, aby ak0P = b(l — k0)P < P, neboli ak0 < 1, čili ab < a + b. □
8.33. Najděte extrémní hodnoty funkce
h(x, y, z) =x3 +y} + z3, jednak na jednotkové sféře Svl3 dané rovnicí
F(x, y,z) =x2 +f +z2 - 1, . a také na kružnici dané průnikem této sféry s rovinou
G(x, y, z) = x + y + z.
Řešení. Začněme hledáním stacionárních bodů pro funkci h na sféře S. Výpočtem příslušných gradientů (např. grad/i(x, y, z) =
469
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
(3x2, 3y2, 3z2)) dostaneme systém rovnic
fxy (x, y) = Hm - (fx (x, y + t) - fx (x, y)) 1 / 1 /
= lim - lim - (f (x + s, y + t) - f (x, y + t)
t=>0 t \s^0 S
/(.v • v. v) • /(.v. v))
Protože ale limity můžeme vyjádřit pomocí libolného výběru hodnot t„ -> 0 a s„ -> 0 a limit příslušných posloupností, bude jistě také platit
/*y (x, y) = lim 1 (^(f(x + t, y + t) - f (x, y + t)) - (f(x + t,y)-f(x,yj)
a tato limitní hodnota je spojitá v (x, y).
Označme si výraz, ze kterého bereme poslední limitu, jako funkci (p(x, y, t) a zkusme jej vyjádřit pomocí parciálních derivací. Pro dočasně pevné t si označme g(x, y) — f(x + t, y) — f(x, y). Pak výraz v poslední velké závorce je díky větě o střední hodnotě roven
g(x, y + t) - g(x, y) - t ■ gy (x, y + ř0).
pro nějaké vhodné řo, které je mezi nulou a t (a hodnota to závisí na t).
Nyní gy (x, y) — fy(x +1, y) — fy (x, y) a proto můžeme psát • 0 zaručit požadovanou rovnost
fxy(x, y) = fyx(x, y)
ve všech bodech (x, y).
Stejný postup pro funkce n proměnných dokazuje následující základní výsledek:
| ZÁMĚNNOST PARCIÁLNÍCH DERIVACÍ |^_-_——
8.10. Věta. Nechť f : En —>• M je k-krát diferencovatelná funkce se spojitými parciálními derivacemi až do řádu k včetně v okolí bodu x € W. Pak jsou všechny parciální derivace funkce f v bodu x a do řádu k včetně nezávislé na pořadí derivování.
0 = 3x - 2Xx, 0 = 3y2 - 2ky,
0 = 3z 0 =
2Xz„
2,2,2
x +y +z
1,
což je systém čtyř rovnic o čtyřech proměnných. Před řešením tohoto systému si zkusme odhadnout, kolik lokálních vázaných extrémů bychom měli čekat. Určitě bude h(P) v absolutní hodnotě rovno na jednotkové sféře nejvýše jedné a to nastane ve všech průnicích souřadných os s S. Máme tedy pravděpodobně 6 lokálních extrémů. Dále uvnitř každé osminy sféry vytčené souřadnými rovinami může, ale nemusí, být další extrém. Jednotlivé kvadranty lze snadno oparametrizo-vat a průběh funkce h coby funkce dvou parametrů ověřit standardním způsobem (nebo si nechat vykreslit třeba programu Maple).
Řešením systému (ať už algebraicky nebo opět v programu Maple) obdržíme ve skutečnosti spoustu stacionárních bodů. Kromě šesti, o kterých už víme (dvě souřadnice nulové a jedna ±1) a u kterých je X = ±|, jsou to např. ještě body
P±=Jň.ň.±í\.
\ 3 3 3 J
ve kterých skutečně nastává lokální extrém.
Jestliže omezíme náš zájem na body kružnice K, musíme přidat další funkci G jeden další volný parametr r\ coby koeficient u jejího gradientu. Dostaneme tak větší systém rovnic
0 = 3x2 — 2kx — t), 0 = 3y2 -2\y-r), 0 = 3z2 -2-kz-n, 0 = x2 +y2 +z2- 1, 0 = x + y + z.
Protože je i kružnice kompaktní množinou, nutně na ní musí mít h globální maximum a globální minimum. Další rozbor ponecháme na čtenáři. □
8.34. Rozhodněte, zda funkce / :
f(x, y, z) = x2y na-
bývá extrémů na ploše 2x2 +2y2 +z2 = 1. Pokud ano, tak tyto extrémy nalezněte a určete o jaké extrémy se jedná.
Řešení. Protože vyšetřujeme extrémy spojité funkce na kompaktní množině (elipsoidu) - je to uzavřená a omezená množina v M3 - musí na něm daná funkce nabývat jak minima, tak
470
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
Důkaz. Důkaz pro druhý řád byl proveden výše ve speciálním případě n = 2 a postup v obecném případě se ; / nijak neliší.
r_ Formálně můžeme celý důkaz vést tak, že pro každou pevnou volbu dvou souřadnic x; a x j se vždy celá diskuse jejich záměnnosti odehraje ve dvourozměrném afinním pod-prostoru, tj. všechny ostatní proměnné považujeme za konstantní a v argumentaci nijak aktivně nevystoupí.
U derivací vyššího řádu důkaz dokončíme indukcí podle řádu. Skutečně, každé pořadí indexů i\,..., i k lze vytvořit z pevně zvoleného záměnami sousedících dvojic. □
8.11. Hessián. Tak jako jsme u derivací prvního řádu zavedli diferenciál coby lineární formu d fix) přibližující nejlépe v daném bodu x funkci /, budeme nyní chtít porozumět kvadratickému přiblížení funkcí /:£„—>• R.
■^^^J Hessián ^.a....,.
Definice. Je-li / : W -> R libovolná dvakrát diferencovatelná funkce, nazýváme symetrickou matici funkcí
H fix) =
82f
(14-ix)
ix) =
v dxi dxj Hessián funkce / v bodě x.
dx\ dx,
iA^íx) i
Z předchozích úvah jsme již viděli, že vynulování diferenciálu v bodě (x, y) e Ei zaručuje stacionární chování podél všech křivek v tomto bodu. Hessián
H fix, y)
fxx ix, y) fxy ix, y)
.A y (v. v) /vy (v. v)
hraje roh druhé derivace. Pro každou parametrizovanou přímku
cit) = ixit), yit)) = (x0 + £í, y0 + t)t) budou totiž mít funkce jedné proměnné
ait) = f ixit), yit))
3/ 3/ jS(0 = /(x0, yo) + -7-C*0, yo)Š + ^—(x0, yo)rj dx dy
1 ( 2 2
+ 2 I fxxixo, yo)Š + 2/ry(x0, yo)$r] + fyyixo, yo)rj
stejné derivace do druhého řádu včetně v bodě t = 0 (přepočtěte si!). Funkci p přitom můžeme zapsat vektorově jako
jS(0 = /(x0, yo) + df(x0, yo) ■
l-iH v)-Hf(x0,y0)-(Í
nebo /3(r) = /(x0, y0) + df(x0, yo)(v) + jHf ixo, yo)iv, v), kde v = i^,rj) je přírůstek zadaný derivací křivky cit) a Hessián je použit jako symetrická 2-forma.
To je vyjádření, které již určitě připomíná Taylorovu větu funkcí jedné proměnné, přesněji řečeno kvadratické přiblížení funkce Taylorovým polynomem druhého řádu. Na následujícím obrázku je vynesena jak tečná rovina tak toto kvadratické přiblížení pro funkci fix, y) = sin(x) cos(y).
maxima. Navíc, protože vazební podmínka je dána spojitě diferencovatelnou funkcí a zkoumaná funce je diferencovatelná, extrémy musí nastat ve stacionárních bodech vyšetřované funkce na dané množině. Pro stacionární body sestavíme soustavu:
2xy
2
4kx 4ky 0 = 2kz
Jejím řešením jsou body (±7^, 7^, 0) a (±7^, — ľjô'^- Fun^ce nabývá pouze dvou funkčních hodnot v těchto čtyřech stacionárních bodech. Z výše uvedeného vyplývá, že první dva uvedené stacionární body jsou maxima dané funkce na uvedeném elipsoidu a druhé dva potom minima. □
8.35. Určete, zda existují maxima a minima funkce / : R3 -> R,
fix, y, z) = z — xy2 na sféře
x2+y2+. Pokud extrémy existují, určete je. Řešení. Řešíme soustavu
1.
y
z
-ky2 -2kxy
Z druhé rovnice dostáváme, že buď y = 0, nebo x = — . První možnost vede k bodům (0, 0, 1), (0, 0, —1). Druhá pak nemůže být splněna (dosazením do rovnice koule dostaneme rovnici
1 1 2 4k2 + 2k2+k
1,
která nemá řešení. Ve dvou vypočtených bodech na dané sféře má funkce maximum, resp. minimum. □
8.36. Rozhodněte, zda existují extrémy funkce / : R3 -> R, fix, y, z) = xyz, na elipsoidu určeném rovnicí
gix, y,z) =kx2 +1/ +z2 = 1, k,leR+
Pokud extrémy existují, určete je.
Řešení. Nejprve sestavíme rovnice, které musí splňovat stacionární body dané funkce na elipsoidu:
3/
— = X-
dx dx
dy dy dz dz
yz
xz.
xy
2Xkx, 2Uy,
2XZ.
471
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
8.12. Taylorova věta. Vícerozměrná verze Taylorovy věty je také |gu příkladem matematického tvrzení, kde složitou částí >JSíT^>'"' je nalezení správné formulace. Důkaz je už pak do-cela snadný.
ľ^lk—?— Budeme postupovat ve výše naznačeném směru a zavedeme si značení pro jednotlivé části Dk f aproximací vyšších řádů pro funkce /:£„—>• R". Budou to vždy ^-lineární výrazy v přírůstcích a nás bude zajímat jen jejich vyčíslení na k stejných hodnotách.
Již jsme diskutovali diferenciál D1 f — d f v prvním řádu a hessián D2 f — H f v řádu druhém. Obecně pro funkce / : E„ -> M, body x — (xi,...,x2) e E„ a přírůstky v — (§i,...,§„) klademe
Dkf(x)(v)
E
9*/
i
M /e k-krát diferencovatelná funkce v okolí Os(x) bodu x e En. Pro každý přírůstek v e R" s velikostí || d || < á /»z& existuje číslo 0 < 0 < l takové, že
f(x + v) = f(x) + Dlf(x)(v) + ±-D2f(x)(v)+
■■■+ n 1 Dk-Xf(x)(v) + ^Dkf(x + 6 ■ v)(v). (k — 1)! k\
Snadno nahlédneme, že řešením dané rovnice musí být trojice nenulových čísel. Po vydělení dvojic rovnic a dosazení do rovnice elipsy dostaneme osm řešení. Dostaneme osm stacionárních bodů x = ±-k=, y = ±-^j, z = ±-^,v nichž ovšem funkce / nabývá pouze dvou různých hodnot. Protože / je spojitá a daný elipsoid je kompaktní, tak na něm / nabývá jak svého minima, tak maxima. Neboť navíc jak / tak g jsou spojitě diferencovatelné, tak tyto extrémy musí nastat v stacionárních bodech. Není tedy jiné možnosti, než že čtyři z daných stacionárních bodů jsou lokálními maximy dané funkce s maximem 1 zbývající čtyři pak minima s hodnotou — t-^ťť . □
3V3H '
3V3H
i
Důkaz. Pro přírůstek v e Rn uvažujme parametrizovanou i' u přímku c(t) — x+tv v E„ a zkoumejme funkci • R definovanou složením q>(t) — f o c(t). Taylorova věta pro funkce jedné proměnné říká (viz Věta 6.4)
8.37. Stanovte globální extrémy funkce
f(x, y) = x2 - 2y2 + 4xy - 6x - 1 na množině bodů [x, y] vyhovujících nerovnostem
(8.1) x>0, y>0, y<-x + 3.
Řešení. Máme zadán polynom se spojitými parciálními derivacemi na kompaktní (tj. uzavřené a ohraničené) množině. Taková funkce nutně nabývá své nejmenší a největší hodnoty na této množině, a to ve stacionárních bodech nebo na hranici. Stačí tedy najít stacionární body uvnitř množiny a stacionární body na konečném počtu otevřených (příp. jednobodových) částí hranice, vyčíslit v těchto bodech / a vybrat největší a nejmenší hodnotu. Dodejme, že množina bodů určená nerovnostmi (118.111) je zřejmě trojúhelníkem s vrcholy [0, 0], [3, 0], [0, 3].
Určeme stacionární body uvnitř tohoto trojúhelníku jako řešení rovnic fx =0, fy = 0. Neboť
fx(x, y) =2x +4y -6, fy(x, y) = 4x - 4y,
těmto rovnicím vyhovuje pouze bod [1, 1]. Hranici můžeme (nabízejícím se způsobem) vyjádřit jako sjednocení tří úseček výběrem dvojic vrcholů. Nejprve uvažujme x = 0, y e [0, 3], kdy je f (x, y) = —2y2 —1. Graf této funkce (jedné proměnné) na intervalu [0, 3] ovšem známe. Není tudíž obtížné stanovit body, ve kterých nastávají globální extrémy. Jde o krajní body [0, 0], [0, 3]. Podobně můžeme uvažovat y = 0, x e [0, 3], přičemž také obdržíme jenom krajní body [0, 0], [3,0]. Zbývá úsečka y = — x + 3, x e [0, 3], pro niž po úpravě dostáváme
f(x, y) = f(x, -x + 3) = -5x2 + 18x - 19, x e [0, 3].
Potřebuje tedy najít stacionární body polynomu p (x) = — 5x2+18x — 19 z intervalu [0, 3]. Rovnici p'(x) = 0, tj. -lOx + 18 = 0, pak vyhovuje x = 9/5. To znamená, že v posledním případě jsme (kromě již zahrnutých krajních bodů) získali ještě jeden bod [9/5, 6/5], ve kterém může být globální extrém. Celkem máme tyto „podezřelé" body
472
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
/(xq). Pokud nastává v předchozích nerovnostech ostrá nerovnost pro všechny x / xo, hovoříme o ostrém extrému.
14 5 •
[1,1], [0,0], [0,3], [3,0], [f,f] po řadě s furikčními hodnotami
-4, -1, -19, -10,
Vidíme, že nej větší hodnoty — 1 nabývá funkce / v bodě [0, 0] a nejmenší hodnoty —19 pak v bodě [0, 3]. □
8.38. Rozhodněte, zda funkce / : R3 R, f(x, y, z) = fz nabývá extrémů na úsečce dané rovnicemi 2x+y+z = l, x — y + 2z = 0a omezením x e (—1,2). Pokud ano, tak tyto extrémy nalezněte a určete o jaké extrémy se jedná. Všechna svoje rozhodnutí zdůvodněte.
Řešení. Hledáme extrémy spojité funkce na kompaktní množině, funkce tedy bude nabývat na dané množině jak svého minima tak maxima a to buď v bodech, kde je gradient zkoumané funkce lineární kombinací gradientů funkcí zadávající vazební podmínky, nebo v krajních bodech úsečky. Najděme body splňující podmínku s gradienty:
0
2yz
y2
2x + y + z x - y + 2z
2k + l k-l k+ 21 1
0,
která má řešení (x, y, z) = (|, 0, -0 a (x, y, z) = (f, |, -£) (proměnné k a l můžeme samozřejmě dopočítat také, ale nezajímají nás). Krajní body dané úsečky jsou (—1, |, |) a (2, —|, — |). Ztěchto čtyř bodů nabývá funkce největší hodnoty v prvním z krajních bodů (f(x, y, z) = jpf), tam tedy nabývá maxima na dané úsečce a
|),tam
□
nejmenší hodnoty v druhém z krajních bodů (f(x, y, z) tedy nabývá svého minima na dané úsečce.
8.39. Najděte maximální a minimální hodnotu polynomu
p(x, y) = 4x3 - 3x - 4y3 + 9y
na množině
M = {[x, y] e R2; x2 + y2 < 1} .
Řešení. Také v tomto příkladu máme zadán polynom na kompaktní množině, a proto se omezíme na hledání stacionárních bodů uvnitř či na hranici M a „krajních" bodů na hranici M. Jako řešení rovnic
px{x, y) = \2x2 -3 = 0, py(x, y) = -\2y2 +9 = 0
však dostáváme pouze body
i V5 1 V3 i V5 i V5
2' 2 2' 2 2' 2 2' 2
473
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
Pro jednoduchost budeme nadále předpokládat, že naše funkce / má spojité parciální derivace prvního i druhého řádu na svém definičním oboru. Nutnou podmínkou pro existenci maxima nebo minima v bodě xq je vymizení diferenciálu v tomto bodě, tj. df(xo) — 0. Skutečně, pokud je df(x$) ^ 0, pak existuje směr v, ve kterém jedvf(xo) / O. Pak ovšem nutně podél přímky xo + tv na jednu stranu od bodu xo hodnota funkce roste a na druhou klesá, viz (5.32).
Vnitřní bod x e En definičního oboru funkce /, ve kterém je diferenciál df (x) nulový nazýváme stacionární bod funkce f.
Budeme opět chvíli pracovat s jednoduchou funkcí v E2 abychom závěry přímo mohli ilustrovat. Uvažme funkci / (x, y) — sin(x) cos(y), která už byla předmětem diskuse a obrázků v odstavcích 8.9 a 8.8. Svým tvarem tato funkce připomíná známá kartónová plata na vajíčka, je tedy předem zřejmé, že najdeme řadu extrémů, ale ještě více stacionárních bodů, které ve skutečnosti extrémy nebudou (ta „sedýlka" viditelná na obrázku).
Spočtěme si tedy první a poté potřebné druhé derivace:
fx(x, y) — cos(x) cos(y), fy(x, y) — - sin(x) sin(y) a obě derivace budou nulové pro dvě sady bodů
0, to je (x, y) — (^p-Jt, in), pro
21 + 1 „„„
—5-71), pro
H fix, y) =
(x, y)
(1) cos(x) — 0, sin(y) libovolné k, i e Z
(2) cos(y) — 0, sin(x) — 0, to je (x, y) — (kn libovolné k,i e Z.
Druhé parciální derivace jsou
f xx fxy Kfxy fyy/
- sin(x) cos(y) — cos(x) sin(y)
- cos(x) sin(y) — sin(x) cos(y)
V našich dvou sadách stacionárních bodů tedy dostáváme následující hessiány:
(1) ff/(tor + f,fcr) = ±(j f když parity k a i jsou stejné a naopak pro +;
(2) H f (kn, in + j) — ± ^ ^j, přičemž znaménko — nastává,
když parity k a i jsou stejné a naopak pro +. Když se nyní podíváme na tvrzení Taylorovy věty pro řád k — 2, dostáváme v okolí jednoho ze stacionárních bodů (xo, yo)
, přičemž znaménko — nastává,
/(*, y) 1
+ 2
/(■xo, yo)+
Hf(x0 + 9(x - x0), yo + 9(y - yo))(x - x0, y - yo),
které se nacházejí na hranici M. To znamená, že p nemá uvnitř M žádný extrém. Stačí tak najít maximum a minimum p na jednotkové kružnici k : x2 + y2 = 1. Kružnici k umíme vyjádřit parametricky jako
x = cosi, y = siní, t e [—tc, ji].
Od hledání extrémů p na M tak přecházíme k hledání extrémů funkce
f(t) := p(cos t, sin t) = 4 cos3 t — 3 cos t — 4 sin3 t + 9 sin t
na intervalu [—re, re]. Pro t e [—re, re] platí
f'(t) = —12cos21 siní + 3 sin t — 12 sin2 t cos t + 9 cos t,
Abychom mohli určit stacionární body, musíme funkci /' vyjádřit ve tvaru, ze kterého bude možné vypočítat, kde její graf protíná osu x. Použijeme k tomu identitu
-\- = 1 + tg21,
cos21 1 & '
která platí všude, kde mají obě strany smysl. S její pomocí dostáváme
f'(t) = cos3 t [- 12tg t + 3 (tg t + tg3 ř) - 12tg2 t + 9 (1 + tg2ř) ]
/ Q tc) = 372 > / (i tc) = -1 + 373 > 0.
Globální minimum má funkce / tedy v bodě t = — tc/3 a maximum v bodě t = 2tc/3.
Nyní se vraťme k původní funkci p. Ze znalosti hodnot cos (—i tt) = \, sin(— \tc) = — cos(|7r) = —\, sin (| tc) = nabývá polynom p minimální hodnoty —1 — 373 (pochopitelně stejné jako /) v bodě [1/2, —73/2] a maximální hodnoty 1 + 373 v bodě [-1/2, 73/2]. □
474
KAPITOLA 8.
SPOJITÉ MODELY S VICE PROMĚNNÝMI
Tadyjototozoo
pochopitelné. Možná podrobněji
kde H f nyní vnímáme jako kvadratickou formu vyčíslenou na «/(*&40.") =V jakých bodech nabývá funkce přírůstku (x-x0,y-yo). Protože naše funkce má spojitý hessián ^iém omT (tj. spojité parciální derivace do druhého řádu včetně), a matice t>oduo0,}>0)je
znaménko H f stejné
hessianu jsou nedegenerovane, nastane lokální maximum tehdy a jakozg|^álnfch extrémů na množině M jen tehdy, když náš bod (xq, yo) patří do první skupiny se stejnými "f^o-yo^v^-
fix, y)
paritami kal. Když budou parity opačné, pak bod z první skupiny bude naopak bodem lokálního minima.
Naopak, hessián u druhé skupiny bodů se vždy vyčíslí kladně na některých přírůstcích a záporně na jiných. Proto se tak bude chovat i celá funkce / v malém okolí daného bodu.
Abychom mohli zformulovat obecné tvrzení o hessiánu a lokálních extrémech ve stacionárních bodech, musíme připomenout diskusi o kvadratických formách v odstavcích 4.31^1.32 v kapitole o afinní geometrii. Zavedli jsme tam pro kvadratickou formu h : En -> R následující přívlastky
• positivnědefinitní, je-li h(u) > 0 pro všechny u ^ 0
• positivněsemidefinitní, je-li h(u) > 0 pro všechny u e V
• negativně definitní, je-li h(u) < 0 pro všechny u ^ 0
• negativně semidefinitní, je-li h(u) < 0 pro všechny u e V
• indefinitní, je-li h(u) > 0 a f (v) < 0 pro vhodné u, v e V.
Zavedli jsme také nějaké metody, které umožňují přímo zjistit, zda daná forma má některý z těchto přívlastků.
Taylorův rozvoj se zbytkem okamžitě dává platnost následující věty:
Věta. Nechť f : En -> R je dvakrát spojitě diferencovatelná funkce a x e En nechť je stacionární bod funkce f. Potom
(1) f má v x ostré lokální minimum, je-li Hf(x) positivně definitní,
(2) f má v x ostré lokální maximum, je-li Hf(x) negativně definitní,
(3) f nemá v bodě x lokální extrém je-li Hf(x) indefinitní.
Důkaz. Taylorův rozvoj druhého řádu se zbytkem aplikovaný na naši funkci f(x\,..., x„), libovolný bod x — (xi,... ,x„) a libovolný přírůstek v — (vi,..., vn), takové že jak x tak x + v jsou v definičním oboru funkce /, říká
f(x + v) = f(x) + df(x)(v) + l-Hf(x + 6 ■ v)(v),
pro vhodné reálné 0 < 6 < 1. Dle předpokladu o nulové hodnotě diferenciálu je tedy
fix + v)
f(x) + l-Hf(x
9 ■ v)(v).
Podle našeho předpokladu je kvadratická forma Hf(x) spojitě závislá na bodu x a definitnost, resp. indefinitnost, kvadratických forem je rozhodnutelná podle znaménka hlavních subdeterminantů matice Hf, viz Sylvestrovo kritérium v odstavci 4.32. Samotný determinant je ale coby polynomiální výraz v koeficientech matice spojitou funkcí, proto nenulovost a znaménka zkoumaných determinantů v dostatečně malém okolí bodu x budou stejná jako v bodě x samotném.
Zejména tedy pro pozitivně definitní Hf(x) máme ve stacionárním bodu x zajištěno, že f(x + v) > f(x) pro dostatečně malá
4x + y2 x\ + \y\ 0 totiž nemění body, kde nastávají extrémy (pouze změní hodnotu extrémů). O funkci g však víme, že udává vzdálenost bodu [x, y] od bodu [2,0]. Neboť množina M je zřejmě čtvercem s vrcholy [1, 0], [0, 1], [—1, 0], [0, —1], nejblíže z bodů M k bodu [2, 0] je vrchol [1,0] a nej vzdálenější je vrchol [—1,0]. Máme výsledek - minimální hodnotu má / v bodě [1, 0] a maximální v bodě [—1,0]. □
8.41. Spočítejte lokální extrémy funkce y = f(x) určené implicitně rovnicí
3x2 +2xy + x = y2 +3j + f, [x, y] € M2\{[x,x - |] ; x e R} .
Řešení. V souladu s teoretickou částí označme
F(x, y) = 3x2 + 2xy + x — y2 — 3y
R2 \ {[x, x - §] ; x e R}
a vypočtěme derivaci
y = f(x)
Vidíme, že tato derivace existuje spojitě na celé zadané množině. Zvláště je na této množině implicitně určena funkce / (jmenovatel je nenulový).
Lokální extrém může nastat pouze pro x, y, pro která je / = 0, tj. 6x +2y+1 = 0. Dosadíme-li y = — 3x —1/2 do rovnice F(x, y) = 0, obdržíme po úpravě — 12x2 + 6x = 0 a následně
[x,y] = [0,-í], = [±,-2].
Snadno také spočítáme
5
4'
[x, y] e
Fx(x,y) Fy(x,y)
(>x+2y + \ 2x—2y—3 '
r
Dosazením x dostaneme
0, y
(2x-2y-?,ý
-1/2, y = 0 ax
1/2, y = —2, y
a
y
6(-2)-0
>0 pro [x, y] = [0, -\]
6(+2)-°<0 pro [x, y] = [l
-2]-
4 ^ v, L„v, j i —
Dokázali jsme tak, že implicitně zadaná funkce má v bodě x = lokálni minimum a v bodě x = 1/2 ostré lokálni maximum.
0 ostré
□
475
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
v, jde tedy o ostré minimum funkce / v bodě x. Analogicky pro negativní definitnost. V případě indefinitní formy H f (x) budou existovat směry v, w ve kterých f (x + v) > f (x) a f (x + w) < f (x) a tedy v diskutovaném stacionárním bodu extrém žádný nenastává. □
Všimněme si, že věta nedává žádný výsledek, pokud je hes-sián funkce ve zkoumaném bodě degenerovaný a přitom není indefinitní. Důvod je opět stejný jako u funkcí jedné proměnné. V takových případech totiž existují směry, ve kterých první i druhá derivace zmizí a my proto v tomto řádu přiblížení neumíme poznat, zda se funkce bude chovat jako f3 nebo jako ±f4, dokud nespočteme alespoň v potřebných směrech derivace vyšší.
Zároveň si povšimněme, že i v bodech, kde je diferenciál nenulový, má definitnost hessiánu H fix) podobné důsledky jako ne-nulovost druhé derivace u funkce jedné proměnné. Skutečně, pro funkci / : R" -* R výraz
z(x + v) = f(x) + df(x)(v)
jn + l
zadává tečnou nadrovinu ke grafu funkce / v prostoru K" '± a proto Taylorova věta druhého řádu se zbytkem, tak jak byla využita v důkazu, ukazuje, že při pozitivní definitnosti hessiánu jsou všechny hodnoty funkce / v dostatečně malém okolí bodu x nad hodnotami na tečné nadrovině, tj. celý graf je v dostatečně malém okolí nad tečnou nadrovinou. V případě negativní definitnosti je tomu naopak. U indefinitních hodnot hesiánu opět graf funkce přechází z jedné strany tečné nadroviny na druhou, to se ale obecně děje podél objektů nižší dimenze v tečné nadrovině, nemáme tedy k dispozici přímočaré zobecnění infiexních bodů.
8.14. Diferenciál zobrazení. Koncept derivace a diferenciálu lze snadno rozšířit na zobrazení F : En -> Em. Při zvolených kartézských souřadnicích na obou stranách je ľÝ^i-M takové zobrazení obyčejná m-tice
F(xi, ...,xn) = (fi(xi, ... ,x„), fm(x\, ..., x„))
funkcí f i : E„ -> R. Řekneme, že F je diferencovatelné nebo k-krát diferencovatelné zobrazení, jestliže tuto vlastnost mají všechny funkce /i,..., fm.
-| Diferenciál a Jacobiho matice ■
Diferenciály d f (x) jednotlivých funkcí f zobrazení
F(xi, ...,x„) = (f\(x\, ... ,x„), fm(xi, x„))
poskytují lineární přiblížení přírůstků jejich hodnot. Lze proto očekávat, že budou společně dávat také souřadné vyjádření lineárního zobrazení DlF(x) : Rn -> Rm mezi zaměřeními, které bude lineárně aproximovat přírůstky našeho zobrazení. Výsledná matice
D Fix)
(dfi(x)\
df2(x) —
\dfm (x) /
OJ2
dx\
Ml
a? 3/2
dx2
MUL
dX2
&
dxn
Mul i
dxn /
(X)
8.42. Najděte lokální extrémy funkce z = fix, y) zadané na maximální množině implicitně rovnicí
(8.2)
+ y2 + z2 - xz - yz + 2x + 2y + 2z - 2 = 0.
Řešení. Derivování (||8.2||) podle x a y dává
2x + 2zzx - z - xzx - yzx + 2 + 2z,x
2y + 2zzy - xzy - z - yzy + 2 + 2zy
Odtud vyplývá (8.3)
z — 2x — 2
Zx = fx(x, y) =--—, zy = fyix, y) --
0, 0.
2y
2z
y+ 2
2z — x — y + 2
Všimněme si, že parciální derivace jsou spojité všude, kde je definována funkce /. To implikuje, že lokální extrémy mohou být pouze ve stacionárních bodech. Ve těchto bodech pak platí
Zx = 0, tj. z - 2x - 2 = 0,
zy = 0, tj. z-2y -2 = 0.
Máme dvě rovnice, které umožňují vyjádřit x a y v závislosti na z. Dosazením do (||8.2||) potom již získáme body
[x, y, z] = [-3 + 76, -3 + 76, -4 + 2V0I,
[x, y, z] = [-3 - V6, -3 - 76, -4 - 2^6 .
Nyní potřebujeme druhé derivace k tomu, abychom mohli říci, zda jde v příslušných bodech o lokální extrémy. Derivováním zx v (||8.3||) dostáváme
z,xx = fxx(x, y) derivuj eme-li podle x, a
Zxy
(Zx -2) (2z-x-y+2) - (z-2x -2) (2Zx -1) (2z-x-y+2)2
r , s _ Zy(2z—x—y+2) — (z—2x—2){2zy — í)
fxy{X, y) - (2z_x_y+2)2 >
se nazývá Jacobiho matice zobrazení F v bodě x.
když derivujeme podle y. Důvodem, proč jsme neurčili také zyy, je záměnné postavení xayv(||8.2||) (pokud zaměníme x za y, rovnice se nezmění). Navíc také x-ové a y-ové souřadnice uvažovaných bodů jsou stejné, a proto je v těchto bodech z,xx = zyy. Snadno již ve stacionárních bodech vyčíslíme
fxx (-3 + 76, -3 + 76) = fyy (-3 + 76, -3 + 76) - 1
fxy (-3 + 76, -3 + 76") = fyx (-3 + 76, -3 + 76) = 0,
fxx (-3 - 76, -3 - 76") = (-3 - 76, -3 - 76) = j=,
fxy (-3 - 76, -3 - 76") = fyx (-3 - 76, -3 - 76) = 0. Při zápisu do Hessiánu je
H f (-3 + 76, -3 + Tě) = ~~ °
476
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
Lineární zobrazení D1 F (x) definované na přírůstcích v — (vi,..., vn) pomocí stejně značené Jacobiho matice nazýváme diferenciál zobrazení F v bodě x z definičního oboru, jestliže platí
lim — (F(x + v) - F(x) - DlF(x)(v)) = 0.
Již jsme několikrát použili skutečnost, že definice euklidovské vzdálenosti má za důsledek, že limity hodnot v E„ existují tehdy a jen tehdy, když existují limity jednotlivých souřadných komponent. Přímé použití Věty 8.5 o existenci diferenciálu pro funkce n proměnných na jednotlivé souřadné funkce zobrazení F proto vede k následujícímu tvrzení (dokažte si případně podrobněji samostatně!):
Důsledek. Nechť F : En -> Em je zobrazení, jehož všechny souřadné funkce mají spojité parciální derivace v okolí bodu x e E„. Pak existuje diferenciál D1 F(x) a je zadaný Jacobiho maticí DlF(x).
8.15. Transformace souřadnic. Zobrazení F : En -> E„, která mají inverzní zobrazení G : E„ -> E„ definované na celém svém obrazu, se nazývají transformace. Ka-tt:^, ždé takové zobrazení je možné vnímat jako změnu souřadnic. Zpravidla požadujeme, aby f i G bylo (spojitě) diferencovatelné zobrazení.
Stejně jako u vektorových prostorů, volba našeho „pohledu na věc", tj. volba souřadnic, může zdánlivě zjednodušit nebo zhoršit naše porozumění studovanému objektu. Změnu souřadnic nyní diskutujeme v daleko obecnější formě než jen u afinních zobrazení v kapitole čtvrté. Někdy se v tomto obecném smyslu užívá označení ,Jrfivočaré souřadnice". Velice názorný příklad je změna nejob-vyklejších souřadnic v rovině na tzv. polární, tj. polohu bodu P zadáváme pomocí jeho vzdálenosti od počátku souřadnic r — sjx2 + y2 a úhlu cp — arctan(y/x) mezi spojnicí s počátkem a osou x (pokud je x / 0).
1/2*Pi
3/2* Pi
Přechod z polárních souřadnic do standardních je Ppolární = (r> Em a G : Em —> Er jsou dvě diferencovatelná zobrazení, přičemž definiční obor G obsahuje celý obor hodnot F. Pak také složené zobrazení G o F je diferencovatelné a jeho diferenciál je v každém bodě z definičního obodu F kompozicí diferenciálů
Dl(G o F)(x) = DlG(F(x)) o DlF(x).
Příslušná Jacobiho matice je dána součinem příslušných Jacobiho matic.
Důkaz. V odstavci 8.5 a při důkazu Taylorovy věty jsme íf' „ odvodili, jak se chová diferencování složených zobrazení vzniklých z funkcí a křivek. Tím jsme dokázali speciální případy této věty s n — r — 1. Obecný případ se odvodí \^ prakticky stejným postupem, jen budeme pracovat více s vektory.
Zvolme libovolný pevný přírůstek v a počítejme směrovou derivaci pro kompozici G o F v bodě x e En. Ve skutečnosti to znamená spočíst postupně diferenciály pro jednotlivé souřadné funkce zobrazení G složené s F. Pišme tedy rovnou jednodušeji g o F pro kteroukoliv z nich.
1 ,
dv(g o F)(x) = Irm -{g(F(x t^o t
tv))-g(F(x))).
Výraz v závorce můžeme ovšem z definice diferenciálu g vyjádřit jako
g(F(x + tv)) - g(F(x)
dg(F(x))(F(x + tv)-F(x))
+ a(F(x + tv) - F(x)),
kde a je funkce definovaná na okolí bodu F (x), která je spojitá a
splňuje lim„_
•o
N
■a (v) — 0. Dosazením do rovnosti pro směro-
vou derivaci dostáváme
dv(g o F)(x)
lim -ídg(F(x))(F(x t^o t
= dg(f(x))(lim-(f(
\r->0 t \
+ tv) - F(x)) a(F(x + tv) - F(x))) tv) - F(x)
1
lim -
t^o t
a(F(x + tv) - F(x)) 0,
= dg(F(x)) o D1 F(x)(v)
kde jsme využili skutečnosti, že lineární zobrazení mezi konečněrozměrnými prostory jsou vždy spojitá a vlastnosti funkce
Nyní si ukážeme rychlejší způsob, jak jsme mohli dospět k výsledku. Známe (příp. snadno určíme) druhé parciální derivace funkce L,tj. její Hessián
H L (x, y)
0
x3 x*
o 4-
Vyčíslením
HL
'y/2 V2^
-2V2 o o -2V2
HL
_/2 _V2\ _ (2V2 0 2 ' 2 I ~ I 0 2V2
pak zjistíme, že tato kvadratická forma je pro první stacionární bod negativně definitní (jedná se o ostré lokálni maximum) a pozitivně de-finitní pro druhý stacionárni bod (ostré lokálni minimum).
Upozorněme na nebezpečí tohoto „rychlejšího" prístupu, kdybychom obdrželi indefinitní formu (matici). V takovém případě bychom nemohli tvrdit, že v daném bodě extrém nenastává. Při nezačlenění vazebné podmínky (což jsme během výpočtu d2L provedli) totiž uvažujeme obecnější situaci. Grafem funkce / na zadané množině je křivka, kterou lze zadat jako funkci jedné proměnné. Tomu právě musí odpovídat jednodimenzionální kvadratická forma. □
8.44. Nalezněte globální extrémy funkce
fix, y)
1 1 1
+ i x ^0, y ^0
1 1 1
a.
na množině bodů, které vyhovují rovnici +
Řešení. Na tomto příkladu si ukážeme, že hledání globálních extrémů může být výrazně snazší než hledání extrémů lokálních (viz předešlý přiklad) také tehdy, když jsou uvažovány hodnoty funkce na neohraničené množině. Stejným způsobem jako v minulém přikladu bychom ovšem nejprve stanovili stacionární body (||8.4||) a hodnoty (||8.5||). Raději zdůrazněme, že v tomto přikladu hledáme extrémy funkce na nekompaktní množině, a tak se nemůžeme spokojit s pouhým vyčíslením funkčních hodnot ve stacionárních bodech. Důvodem je, že funkce / na uvažované množině vůbec nemusí maximální ani minimální hodnoty nabývat - její obor hodnot zde může být otevřeným intervalem. Ukažme si, že tomu tak ale není.
Uvažujme proto | x | > 10 a uvědomme si, že rovnici \ + \ = 4
x y
mohou splňovat pouze hodnoty y, pro které je | y \ > 1/2. Máme tak odhady
-2V2 < - 2 < fix, y) < ± + 2 < 2V2, je-li | x | > 10. Současně je (záměnou x za y dostaneme stejnou úlohu)
478
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
Dokázali jsme tedy tvrzení pro jednotlivé funkce gi,..., gr zobrazení G. Celá věta nyní vyplývá z toho, jak se násobí matice.
□
Ilustrujme teď využití konceptu transformace a věty o deri-vání složených zobrazení na jednoduchém příkladě. Viděli jsme, že polární souřadnice vzniknou z kartézských transformací F : R2 -> M2, kterou v souřadnicích (x, y) a (r,
10.
Odtud vidíme, že globálních extrémů na uvedené množině musí funkce / nabývat, a to uvnitř čtverce ABC D s vrcholy v bodech A = [-10, —10], B = [10, —10], C = [10, 10], D = [-10, 10]. Jako průnik „stokrát zmenšeného" čtverce s vrcholy A = [—1/10, —1/10], B = [1/10, -1/10], Č = [1/10, 1/10], Ď = [-1/10, 1/10] azadané množiny potom očividně dostaneme prázdnou množinu. Globální extrémy jsou tedy v bodech ve vnitřku kompaktní množiny ohraničené těmito dvěma čtverci. Neboť je na této množině / spojitě diferencovatelná, globální extrémy mohou být jedině ve stacionárních bodech. Nutně je
/max = /(f,f)=2V2, /mln = /(-f ,-f) = -2V2.
□
8.45. Určete maximální a minimální hodnotu, kterých nabývá funkce f(x, y, z) = xyz na množině M vymezené podmínkami
x2 +y2 +z2 =1, x+y+z = 0.
Řešení. Není obtížné si uvědomit, že M je kružnice. V rámci řešení úlohy však postačuje vědět, že je M kompaktní, tj. ohraničená (první podmínka je rovnice jednotkové sféry - kulové plochy) a uzavřená (množina, která j e řešením uvedených rovnic, j e uzavřená, neboť z platnosti těchto rovnic pro všechny členy jisté konvergentní posloupnosti vyplývá jejich platnost pro Umitu této posloupnosti). Funkce / i vazebné funkce F(x, y, z) = x2 + y2 + z2 — 1, G(x, y,z) = x + y + z mají spojité parciální derivace všech řádů (jsou to polynomy). Jaco-biho matice vazeb pak je
'Fx{x, y, z) Fy(x, y, z) Fz(x, y,z)\ = Í2x 2y 2z" KGx{x,y,z) Gy(x,y,z) Gz(x, y, z)) ~ \ 1 1 1 Její hodnost je snížena (menší než 2), právě když je vektor (2x, 2y, 2z) násobkem vektoru (1, 1, 1), což dává x = y = z a podle druhé ze zadaných podmínek dále x = y = z = 0. Ovšem množina M počátek neobsahuje. Nic nám tedy nebrání hledat stacionární body použitím metody Lagrangeových multiplikátorů. Pro L(x, y, z, k2) = xyz - ki (x2 + y2 + z2 - l) - A2 (x + y + z) rovnice Lx = 0, Ly = 0, Lz = 0 po řadě dávají yz, — 2k\x — k2 = 0, xz, — 2k\y — k2 = 0, xy — 2k\z, — k2 = 0. Odečtením první rovnice od druhé a od třetí dostaneme xz — yz — 2k\y + 2Aix = 0, xy — yz — 2k\z, + 2Aix = 0,
479
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
Když tuto situaci interpretujeme z pohledu zobrazení E\ -> E\ a lineárních zobrazení M -> R coby jejich diferenciálů, je nenu-lovost nutnou a dostatečnou podmínkou k invertibilitě příslušného diferenciálu. Takto obdržíme tvrzení platné pro konečněrozměrné prostory obecně:
I věta o inverzním zobrazení >—■
Věta. Nechť F : En -> En je diferencovatelné zobrazení na nějakém okolí bodu xo e En a nechť je Jacobiho matice D1 f(xo) in-vertibilní. Pak na nějakém okolí bodu xq existuje inverzní zobrazení F~x a jeho diferenciál v bodě F(xq) je inverzním zobrazením k diferenciálu D1 f (xo), tzn. je zadán inverzní maticí k Jacobiho matici zobrazení F v bodě xq.
1
Důkaz. Nejdříve si zkusme ověřit, že tvrzení je rozumné a očekávatelné. Pokud bychom předpokládali, že inverzní zobrazení existuje a je diferencovatelné v bodě f (xo), věta o derivování složených funkcí si vynucuje vztah
idm
'')ofl'f(4
D (F~ o F)(x0) = DL(F~
což ověřuje vztah v závěru věty. Víme proto od začátku, jaký diferenciál pro F~l hledat.
V dalším kroku předpokládejme, že inverzní zobrazení F~l na okolí bodu f (xo) existuje a je spojité. Budeme v této situaci ověřovat existenci diferenciálu. Z diferen-covatelnosti F na okolí xo vyplývá, že
F (x) - F(x0) - D1F(xq)(x - x0) — a(x - x0) s funkcí a : R" -> 0 splňující lim^o a(v) — 0. Pro ověření
aproximační vlastnosti lineárního zobrazení (D1 f (xo))-1 je třeba pouze spočíst následuje! hmitu pro y — F (x) jdoucí k yo — F(xq) 1
lim
-(F-\y) - F-\y0) - (D1 F (xo))-1 (y - yo)).
y^yo \\y - yo\ Dosazením z předchozí rovnosti dostáváme 1
lim
x0-
y^yo \\y - y0
(D1F(xo)r1(D1F(xo)(x -x0) + a(x- x0))
= lim
y^yo
-1
\y - yo\\
■(DlF(xo))-l(a(x-x0))
(DlF(x0)y
_1 lim ■
y^yo
-1
-(a(x - x0)),
\\y - yo\
kde poslední rovnost vyplývá ze skutečnosti, že lineární zobrazení mezi konečněrozměrnými prostory jsou vždy spojitá a díky invertibilitě diferenciálu jeho předřazení hmimímu procesu neovlivní ani existenci hmity.
Všimněme si, že jsme zdánlivě s důkazem skoro hotoví. Limita na konci našeho výrazu je v důsledku vlastností funkce a nulová, pokud jsou velikosti \\F(x)—F(xo)|| větší než C\\x — xo|| pro nějakou konstantu C. To je o trochu silnější vlastnost, než že je F ~1 spojité, v literatuře se této vlastnosti říká, že je funkce Lipschitzov-sky spojitá. Zbývá nám tedy už , jenom" dokázat existenci Lipschi-tzovsky spojitého inverzního zobrazení k zobrazení F.
tj. po úpravě
(x -y)(z + 2ki) = 0, (x-z) (y+2X0 = 0. Poslední rovnice jsou splněny v těchto čtyřech případech
x = y, x = z', x = y, y = —2X\; z = —2A.i, x = z; z = —2A.i, y = —2X\, tedy (zahrnutím podmínky G = 0)
x = y = z = 0; x = y = —2X\, z = 4X\;
x = z = —2X\, y = 4X\; x = 4X\, y = z = —2X\.
S výjimkou prvního případu (který zřejmě nemůže být splněn) začleněním podmínky F = 0 obdržíme
(4A1)2 + (-2A1)2 + (-2A1)2 = 1,
tj. X!
Celkem tak získáváme body
i
1 2
1 2
1
2
1
1
1 1
2
1
2 1
2 1 1 \/6 ' V6 ' V6
Nebudeme ověřovat, zda se jedná o stacionární body. Důležité je, že v této šestici jsou zahrnuty všechny stacionární body.
Hledáme globální maximum a minimum spojité funkce / na kompaktní množině M. Globální extrémy (o kterých víme, že existují) však mohou být pouze v bodech lokálních extrémů vzhledem k M. Tyto lokální extrémy pak musí být v některém z uvedených bodů. Proto pouze vyčíslíme funkci / v těchto bodech. Tím zjistíme, že hledané maximum je
Vo" -v/6 -v/6
a minimum potom
f(±,±.-±
f(-- - --
1
2 1
3V6
1
2 1
Vě' V6
2 1 1
-v/6 -v/6 -v/6
376'
□
8.46. Nerovnost mezi aritmetickým a geometrickým průměrem.
Dokážte nerovnost
1
-(xi H-----hx„) > f/xi ■ ■ ■ x„
n
pro jakýchkoliv n kladných reálných čísel x\, ..., x„, přičemž rovnost nastane, právě když jsou si všechna x; rovna.
480
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
Pro další úvahy si zjednodušíme práci převedením obecného případu na o něco jednodušší tvrzení. Zejména bez íl, újmy na obecnosti lze vhodnou volbou kartézských souřadnic dosáhnout xq — 0 e Rn, yo — F(xq) — 0 e R".
Složením zobrazení F s jakýmkoliv lineárním zobrazením G dostateme opět diferencovatelné zobrazení a víme také, jak se změní diferenciál. Volbou G(x) — (D1F(0))_1(x) dostáváme D1(G o F)(0) — idu". Můžeme tedy zrovna předpokládat
Z)1F(0) = idM«.
Uvažme za těchto předpokladů zobrazení K(x) — F(x) — x. Toto zobrazení je opět diferencovatelné a jeho diferenciál v bodě 0 je zjevně nulový.
Pro libovolné spojitě diferencovatelné zobrazení K v okolí počátku Rn platí díky Taylorovu rozvoji prvního řádu se zbytkem jednotlivých souřadných funkcí K i a díky definici euklidovské vzdálenosti odhad
\K(x) - K(y)\\ < C-Jn\
y\\,
kde C je ohraničeno maximem všech absolutních hodnot parciálních derivací v Jacobiho matici zobrazení K na sledovaném okolí.2 Protože v našem případě je diferenciál zobrazení K v bodě xo — 0 nulový, můžeme volbou dostatečně malého okolí U počátku dosáhnout platnosti ohraničení
\K(x)-K(y)\\
1
< -llx - 2
yl
Dále dosazením za definici K(x) — F(x) — x a použitím trojúhelníkové nerovnosti ||(w — v) + v\\ < \\u — v\\ + \\v\\, tj. také llMll — II ľ II < IIM — ľ II, dostáváme
\y ■
Odtud konečně
\F(x)-F(y)\
|F(x) - F(y) + y - x\\
1
< ~\\y
1
— llx
2
■y\\ < l|F(x)-F(y)||
Tímto odhadem jsme dosáhli opravdu pěkného pokroku: jsou-li na našem malém okolí U počátku x ^ y, pak nutně musí být také F(x) / F(y). Je tedy naše zobrazení vzájemně jednoznačné. Pišme F-1 pro jeho inverzi definovanou na obrazu U. Pro ni náš odhad říká
\\F-l(x)-F-l(y)\\<2\\x-y\\,
je tedy toto zobrazení určitě nejen spojité ale dokonce Lipschitzov-sky spojité, tak jak jsme v předchozí části důkazu potřebovali. Zdánlivě jsme tedy již úplně hotoví (s důkazem), to ale není pravda. Abychom skutečně dokončili důkaz, musíme ukázat, že je zobrazení F zúžené na dostatečně malé okolí nejen vzájemně jednoznačné, ale že také zobrazuje otevřené okolí nuly na otevřené okolí nuly.3 Zvolme si <5 tak malé, aby okolí V — Og (0) leželo v U včetně své hranice a zároveň aby Jacobiho matice zobrazení F byla na celém V invertibilní. To je jistě možné, protože determinant je spojité
Z této úvahy okamžitě plyne, že funkce, která má spojité parciální derivace na kompaktní množině, je na ní i Lipschitzovsky spojitá.
V literatuře lze snadno dohledat příklady zobrazení, která třeba spojitě a bijektivně zobrazí úsečku na čtverec apod.
Řešení. Uvažme součet x\ + ■ ■ ■ + xn = c jako vazební podmínku pro nějakou blíže neurčenou nezápornou konstantu c. Budeme hledat maxima a minima funkce
f (X\, . . . , Xfi) — \JX\ • • • xn
za naší vazební podmínky a přepdokladu x\ > 0,..., x„ > 0.
Normálový vektor k nadrovině definované podmínkou je (1,..., 1). Extrém funkce / tedy může nastat pouze v bodech, kdy je její gradient násobkem tohoto normálového vektoru. Pro hledané body tedy dostáváme soustavu rovnic
1 1
n Xi
pro i = 1a k e M.
Tato soustava má zjevně na zkoumané množině jediné řešení x\ = ■ ■ ■ = x„. Pokud bychom uvažovali i nulové hodnoty x;, byla by naše množina M zadaná omezením kompaktní a proto by na ní musela mít funkce / jak maximum, tak minimum. Minimum však zjevně dosahuje, právě když je některá zhodnot x; nulová, v našem bodě s x; = ^, i = 1, ..., n, nabývá tedy nutně ostrého maxima.
Ve všech ostatních bodech s daným součtem souřadnic c je pak hodnotota jejich geometrického průměru menší a nerovnost je dokázána. □
8.47. Určete, ve kterých bodech nastávají extrémy funkce / : R3 ->
R, f(x, y, z) = x2 + y2 + z2, na rovině x + y — z = la určete, o jaké extrémy se jedná.
Řešení. Snadno sestavíme rovnice rovnice popisující lineární závislost normály k vazební ploše a gradientu zkoumané funkce:
x = k, y = k z = —k, tel,
jejichž jediným řešením je bod [5,5,-5]. Navíc si všimneme, že funkce roste ve směru (1,-1,0) a tento směr náleží do vazební roviny. V získaném bodě tedy musí nastávat minimum zkoumané funkce. Jiné řešení. Úlohu převedeme na vyšetření extrému funkce dvou reálných proměnných na R2. Vazební podmínka je totiž lineární a snadno z ní vyjádříme z = x + y — 1. Dosazením do zadané funkce pak získáme reálnou funkci dvou proměnných: f(x,y) = x2 + y2 + (x + y — l)2 = 2x2 + 2xy + y2 — 2x — 2y + 1. Položením obou parciálních derivací rovno nule, dostáváme lineární soustavu
4x + 2y - 2 = 0, 4y + 2x - 2 = 0,
jejímž jediným řešením je bod [5, 5]. Protože se jedná o kvadratickou funkci s kladnými koeficienty u neznámých, je tato na R2 neomezená
481
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
zobrazení. Označme B hranici množiny V (tj. příslušnou sféru). Protože je B kompaktní a F spojité, má funkce
p(x) = || f (x) ||
na B maximum i minimum. Označme a — j minxeB p(x) a uvažujme libovolné y e Oa(0). Samozřejmě je a > 0. Chceme ukázat, že existuje alespoň jedno x e V takové, že y — F (x), čímž bude celá věta o inverzní funkci dokázána.
Za tímto účelem uvažme funkci (y je náš pevně zvolený bod)
h(x)= \\F(x)-y\\2.
Opět obraz h (V) U h (B) musí mít minimum. Ukážeme nejprve, že toto minimum nemůže nastat pro x e B. Platí totiž F(0) — 0 a proto h(0) — \\y\\ < a. Zároveň podle naší definice a je pro y e Ofl(0) vzdálenost y od F (x) pro x e B alespoň a (protože a jsme volili jako polovinu minima z velikosti F (x) na hranici). Minimum tedy nastává uvnitř V a musí být ve stacionárním bodě z funkce h. To ale znamená že pro všechna j — 1,... ,n platí
dh -v 3 f i
^(z) = EWz)-^(z) = 0.
dxj
=1 3
Na tento systém rovnic se můžeme dívat jako na systém lineárních rovnic s proměnnými — f i (z) — yi a koeficienty zadanými dvojnásobkem Jacobiho matice DlF(z). Pro každé z e V má takový systém ovšem pouze jedno řešení a to je nulové, protože Jacobiho matice je podle našeho předpokladu invertibilní.
Tím jsme našli hledaný bod x — z e V splňující pro všechna i — 1,..., n rovnost (z) — yi, tj. F (z) — y. □
8.18. Věta o implicitní funkci. Naším dalším cílem je využít větu o inverzním zobrazení pro práci s implicitně defino-ťfcX vánými funkcemi. Pro začátek uvažujme diferenco-„ „' vatelnou funkci F (x, y) definovanou v rovině E2 a hledejme body (x, y), ve kterých platí F (x, y) — 0.
Příkladem může být třeba obvyklá (implicitní) definice přímek a kružnic:
F (x, y) — ax + by + c — 0
F(x, y) = (x - s)2 + (y - t)2 - r2 = 0, r > 0.
Zatímco v prvém případě je (při b / 0) předpisem zadaná funkce
a c
-—x--
b b
pro všechna x, ve druhém případě můžeme pro libovolný bod (xo, y o) splňující rovnici kružnice a takový, že y o ^ t (to j sou totiž krajní body kružnice ve směru souřadnice x), najít okolí bodu xo, na kterém bude buď
y = /(*) =
y = f(x) = t + y/(x-s)2
nebo
y — f (x) — t - y7(x - s)2 - r, podle toho na kterou polokružnici patří bod (xq, yo). Při načrtnutí obrázku je důvod zřejmý - nemůžeme chtít pomocí funkce y — f (x) postihnout horní i dolní půlkružnici zároveň. Zajímavější jsou krajní body intervalu [s — r, s + r]. Ty také vyhovují rovnici kružnice, platí v nich ale Fy (s ± r,t) — 0, což vystihuje polohu tečny ke kružnici v těchto bodech rovnoběžnou s osou y. V těchto bodech skutečně neumíme najít okolí, na němž by kružnice byla popsána jako funkce y — f (x).
a tudíž v získaném bodě nastává (globální) minimum. Z úvodního line-árníno vyjádření proměnné z pak získáme odpovídající bod ve vazební rovině: [± ± -\]. □
8.48. Určete body, ve kterých nastávají extrémy funkce x+y : M3 -> R na kružnici dané rovnicemi x+y+z = lax2+y2+z2 = 4.
Řešení. „Podezřelé" body jsou body, pro které platí
(1, 1, 0) = k ■ (1, 1, 1) + l ■ (x, y, z), k, l e R.
Zřejmě x = y(= l/Z). Dosazením do rovnic kružnice pak získame řešení
1 V22 1 722 i V22 1 V22 1 V22 1 722 [3 + ~6~' 3 + ~6~' 3 ~ ~T] a [3 ~ ~6~' 3 ~ ~6~' 3 + ~T] , vzhledem ke kompaktnosti kružnice stačí prověřit funkční hodnoty v těchto dvou bodech. Zjišťujeme, že v prvním bodě nastává maximum a v druhém minimum dané funkce na kružnici. □
8.49. Určete, ve kterých bodech nastávají extrémy funkce / : R3 -> R, f(x, y, z) = x2 + y2 + z2, na rovině 2x + y — z = la určete, o jaké extrémy se jedná. O
8.50. Určete maximum funkce / : R2 -> R, f(x, y) = xy na kružnici o poloměru 1 se středem v bodě [x0, yo] = [0, 1]. O
8.51. Určete, ve kterých bodech nastává minimum funkce / : R2 -> R, f = xy na kružnici o poloměru 1 se středem v bodě [x0, yo] = [2,0]. O
8.52. Určete, ve kterých bodech nastává minimum funkce / : R2 -> R, f = xy na kružnici o poloměru 1 se středem v bodě [xo, yo] = [2,0]. O
8.53. Určete, ve kterých bodech nastává minimum funkce / : R2 -> R, f = xy na elipse x2 + 3y2 = 1. O
8.54. Určete, ve kterých bodech nastává minimum funkce / : R2 -> R, f = x2 y na kružnici o poloměru j edna se středem v bodě [x0, yo ] =
[0,0]. o
8.55. Určete maximum funkce / : R2 -> R, f(x, y) = x3y na kružnici x2 + y2 = 1. O
8.56. Určete maximum funkce / : R2 -> R, f(x, y) = xy na elipse 2x2 + 3y2 = 1. O
8.57. Určete maximum funkce / : R2
x2 +2/ = 1.
i, f(x, y) = xy na elipse
O
482
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
Navíc umíme i derivace naší funkce y
/(*)
V(x — s)2 — r2 , tam kde je definována, vyjádřit pomocí parciálních derivací funkce F:
1
2(x — s)
2^(7^)2
y
Když prohodíme roli proměnných x a y a budeme chtít najít závislost x — f(y) takovou, aby F(f(y), y) — 0, pak v okolí bodů (s ± r, i) bez problémů uspějeme. Všimněme si, že v těchto bodech je parciální derivace Fx nenulová.
Naše pozorování tedy (pro pouhé dva příklady) říká: pro funkci F (x, y) a bod (a, b) e E2 takový, že F(a,b) — 0, umíme jednoznačně najít funkci y — f (x) splňující F (x, f (x)) — 0, pokud je Fy(a, b) ^ 0. V takovém případě umíme i vypočíst f (a) — —Fx(a, b)/Fy(a, b). Dokážeme, že ve skutečnosti toto tvrzení platí vždy. Poslední tvrzení o derivaci přitom je dobře za-pamatovalné (a při pečlivém vnímání věcí i pochopitelné) z výrazu pro diferenciál funkce g (x) — F (x, y(x)) a diferenciál dy — f (x)dx
0 — dg — Fxdx + Fydy — (Fx + Fyf'(x))dx.
Obdobně bychom mohli pracovat s implicitními výrazy F (x, y, z) — 0, přičemž můžeme hledat funkci g (x, y) takovou, že F (x, y, g (x, y)) — 0. Jako příklad uvažme třeba funkci f (x, y) — x2 + y2, jejímž grafem je rotační paraboloid s počátkem v bodě (0, 0). Ten můžeme implicitně zadat také rovnicí
0 — F(x, y, z) — z
y2.
Než sformulujeme výsledek rovnou pro obecnou situaci, všimněme si ještě, jaké dimenze se mohou/mají v problému vyskytovat. Pokud bychom pro tuto funkci F chtěli najít křivku
c(x) — (ci (x), c2(x)) v rovině takovou, že
F (x, c(x)) — F (x, ci (x), c2(x)) — 0,
pak to jistě budeme umět (dokonce pro všechny počáteční podmínky x — d) také, ale výsledek nebude jednoznačný pro danou počáteční podmínku. Stačí totiž uvážit libovolnou křivku na rotačním paraboloidu, jejíž průmět do první souřadnice má nenulovou derivaci. Pak považujeme x za parametr křivky a za c(x) zvolíme její průmět do roviny yz.
Očekáváme tedy, že jedna funkce m + 1 proměnných zadává implicitně nadplochu v Rm+1, kterou chceme vyjádřit alespoň lokálně jako graf jedné funkce v m proměnných. Lze očekávat, že n funkcí v m + n proměnných bude zadávat průnik n nadploch v Rm+n, což je ve „většině" případů m-rozměrný objekt. Uvažujme proto diferencovatelné zobrazení
F = (fi
fn):
Jacobiho matice tohoto zobrazení bude mít n řádků am+n sloupců a můžeme šiji symbolicky zapsat jako
D1F = (DlxF, D\F)
/Ml
dxi
. Ml
\dxi
Ml
SXm
Ml
dxm
.Ml
dxm
dx:
3/i \
dxm
Bfn .
SXm+n /
E. Objemy, povrchy, těžiště těles
8.58. Určte objem tělesa ležícího v polorovině z > 0, ve válci x2 + y2 < 1 a v polorovině
a) z < x,
b) x + y + z < 0.
Řešení, a) Objem spočítáme pohodlně s využitím válcových souřadnic. V nich je válec určen nerovnicí r < 1, polorovinu z < x pak zapíšeme jako z < r cos
z2,x > 0.
Řešení.
483
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
kde (jci, ..., xm+n) e Rm+n zapisujeme jako (x, y) e Rm x R", D\ F je matice s n řádky a prvními m sloupci v Jacobiho matici, zatímco Dy F je čtvercová matice řádu n se zbylými sloupci. Vícerozměrnou analogií k předchozí úvaze s nenulovou parciální derivací podle y je požadavek, aby matice Dy F byla invertibilní.
věta o implicitním zobrazení
Věta. Nechť F : Rm+" -> R" je diferencovatelné zobrazení na otevřeném okolí bodu (a,b) e Rm x Rn — Rm+n, ve kterém je F(a,b) — 0 a detDyF ^ 0. Potom existuje diferencovatelné zobrazení G : Rm -> R" definované na nějakém okolí U bodu a € Rm s obrazem G(U), který obsahuje bod b, a takové, že F(x, G(x)) — 0 pro všechny x e U.
Navíc je Jacobiho matice D1G zobrazení G na okolí bodu a zadána součinem matic
DlG{x)
-(DyF)
-\x, G(x)) ■ DlxF(x, G(x)).
i
D F{x, y)
Důkaz. Pro zvýšení srozumitelnosti uvedeme napřed kompletní důkaz pro nejjednodušší případ rovnice F(x,y) — Os funkcí F dvou proměnných. Bude zdánlivě složitý, protože jej schválně vedeme tak, jak jej bude možné použít i pro obecné dimenze z věty. Rozšíříme funkci F na
F : R2 -* R2, (x, y) i-> (x, f (x, y)). Jacobiho matice zobrazení F je
1 0
KFx(x,y) Fy(x,y)
Z předpokladu Fy(a,b) / 0 vyplývá, že totéž platí i na nějakém okolí bodu (a, b) a tedy je na tomto okolí funkce F invertibilní podle věty o inverzním zobrazení. Vezměme tedy jednoznačně definované a diferencovatelné inverzní zobrazení F~ľ na nějakém okolí bodu (a, 0).
Nyní označme it : R2 -> R projekci na druhou souřadnici a uvažujme funkci f(x) — it o F~1(x, 0). To je dobře definovaná a diferencovatelná funkce. Máme ověřit, že následující výraz
F(x,f(x)) = F(x, ttCF-^O)))
bude na okolí bodu x — a nulový. Přitom z definice F(x, y) — (x, F(x, y)) vyplývá, že i její inverze musí mít tvar F~ľ (x, y) — (x, itF~1(x, y)). Můžeme proto pokračovat v předchozím výpočtu:
F (x, f (x)) = jt(F(x, jz(F-1(x, 0)))) =
= tt{F{F-\x, 0))) = tt(x, 0) = 0.
Tím máme dokázánu první část věty a zbývá spočíst derivaci funkce f(x). Tuto derivaci můžeme odečíst opět z věty o inverzním zobrazení pomocí matice (D1 F) ~1.
Následující výsledek je snadné ověřit roznásobením matic. (Spočíst lze také přímo explicitní formulí pro inverzní matici s pomocí determinantu a algebraicky adjungované matice, viz odstavec 2.23)
1
0
,Fx{x,y) Fy{x,y)
= (Fy(x,y)y
Fy(x,y) 0 -Fx(x,y) 1
Nejprve si uvědomme, o jaké těleso se jedná. Jde o část zadané koule, která leží vně daného kužele (viz obr.).
Objem spočítáme asi nejlépe jako rozdíl objemu poloviny koule a poloviny kulové výseče dané zadaným kuželem (všimněme si, že objem tělesa se nezmění, nahradíme-li podmínku x > 0 podmínkou z > 0 - výseč řežeme buď „vodorovně" nebo „svisle", ale vždy napůl) Budeme počítat ve sférických souřadnicích.
x = r cos( R3 má Jakobián r2 sin(V^).
Určeme nejprve objem koule. Integrační meze: je vhodné si vyjádřit podmínky, kterými je těleso omezeno v souřadnicích, ve kterých budeme počítat. Ve sférických souřadnicích je koule dána nerovnicí
r2 < 1.
Hledejme integrační meze nejprve například pro proměnnou cp. Označíme-li projekci na souřadnici cp ve sférických souřadnicích (ji
i,..., vn) e
a velikost
\dvF\
df
3xi
-vi
OL
3x„
DlF II
kde
z2. Opět vyjádřeme podmínky ve sférických souřadnicích:?2 < l,3sin2(i/V) > cos2(i/V),nebolitan(i/V) > -^.Opět jako v případě koule vidíme, že v podmínkách se vyskytují proměnné nezávisle, intergrační meze jednotlivých proměnných tedy budou na sobě nezávislé. Z podmínky r2 < 1 máme r e (0, 1], z podmínky tan(V0 > vyplývá \jr e [0, |]. Na proměnnou
Jo Jo Jo
V
ix
r dz dr dep = —=. 10 Jo Jo V3
Všimněme si, že ve válcových souřadnicích nemůžeme spočítat objem tělesa přímo, musíme ho rozdělit na dvě tělesa daná navíc omezením
485
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
Zde by se hodil obrázek, napr. obr. 2
Odtud ovšem vyplývá, že nulové jsou právě ty směrové derivace, které jsou kolmé na gradient, zatímco směr zadaný gradientem je právě ten směr, ve kterém funkce / nejrychleji roste.
Je tedy zřejmé, že tečná rovina k neprázdné úrovňové množině Mfr v okolí jejího bodu s nenulovým gradientem D1 f je určena ortogonálním doplňkem ke gradientu a samotný gradient je tzv. normálovým vektorem nadplochy Mj,.
Např. pro sféru vťo poloměru r > 0 a středu (a,b,c) zadanou rovnicí
F (x, y, z) = (x - a)2 + (y - b)2 + (z - c)2 = r2
dostáváme normálové vektory v bodě P — (xo, yo, zo) jako nenulový násobek gradientu, tj. násobek prú vodiče
DlF — (2(x0 - a), 2(y0 - b), 2(z0 - c)),
a tečné vektory budou právě všechny vektory kolmé na gradient. Implicitně proto jde vždy tečnou rovinu ke sféře v bodě P popsat s pomocí gradientu rovnicí
0 = (x0 - a)(x - x0) + (yo - b)(y - yo) + (zo - c)(z - zo).
To je speciální případ obecné formule: | Tečná nadrovina implicitně zadané nadplochy
Věta. Pro funkci F (x\,..., x„) v n proměnných a bod P — (fli, ..., an) v úrovňové množině M\, funkce F, v jehož okolí je Mj, grafem funkce (n — 1) proměnných, je implicitní rovnice pro tečnou nadrovinu k Mj,
r <\, resp. r > \.
0:
df OXl
(xi — fll) +----h
3/
-—(P) • (x„ - a„).
óxn
Důkaz. Tvrzení je zřejmé z předchozího výkladu. Tečná nadrovina totiž musí být (n — l)-rozměrná, její zaměření je proto zadané jako jádro lineární formy dané gradientem (nulové hodnoty příslušného lineárního zobrazení Rn -> R zadaného násobení sloupce souřadnic řádkovým vektorem grad F). Zvolený bod P přitom naší rovnici zjevně vyhovuje. □
8.20. Model osvětlení 3D objektů. Uvažujme osvětlení 3D objektu, kde známe směr v dopadu světla na 2D povrch tohoto objektu, tj. množinu M zadanou implicitně nějakou rovnicí F (x, y, z) — 0. Intenzitu osvětlení bodu P e M definujme jako / cos
IR", se souřad-15 nými funkcemi f, můžeme opět uvažovat n rovnic pro n +m proměnných
fi(x\,...,xm+n) = bi, i — \,...,n, vyjadřujících rovnost F (x) — b pro vektor b e R".
Pak, za podmínek věty o implicitní funkci, je množina všech řešení (xi,..., xm+n) e Rm+n alespoň lokálně grafem zobrazení
G : Rm -* R".
Pro pevnou volbu b — (b\,. ..,b„) je samozřejmě množinou všech řešení průnik nadploch M (fy, f) příslušejících jednotlivým funkcím f. Totéž musí platit pro tečné směry, zatímco normálové směry jsou generovány jednotlivými gradienty. Proto je-li DlF Ja-cobiho matice zobrazení implicitně zadávajícího množinu M s bodem P — (a\,am+n) e M, v jehož okolí je M grafem zobrazení,
/Ml JLď_\
D F
. Mn.
dxm
dfn
dxm
7
potom bude afinní podprostor v Rm+n obsahující právě všechny tečny procházející bodem P dán implicitně rovnicemi:
9/i
ÓX\
dfn
0=-^(P)-(X!
ÓX\
■ fll) H-----h
9x„
(P) ■ (x„
dfn
■ fll) H-----1"--(P) ■ (Xm+n
ÓXn
Tento podprostor se nazývá tečný prostor k (implicitně zadané) m-rozměrné ploše M v bodě P.
Normálový prostor v bodě P je afinní podprostor generovaný bodem P a gradienty všech funkcí f\ ,...,/„ v bodě P, tj. řádky Jacobiho matice D1 F.
Jako jednoduchý příklad si spočtěme tečnu a normálový prostor ke kuželosečce v R3. Uvažujme rovnici kuželu s vrcholem v počátku
0 = f(x, y, z) = a rovinu zadanou
0 — g (x, y, z) — z — 2x + y + 1.
Bod P — (1,0, 1) patří jak kuželu tak rovině a průnik M těchto dvou ploch je křivka (namalujte si obrázek). Její tečnou v bodě P bude přímka zadaná rovnicemi
yjx2 +y2
0 =
1
_z2x
2yx2 + y2
1
-.2y
x=l,y=0
(X- 1)
y + 1 • (z - 1)
0 =
V*2 + r x=hy=0
-x + z
-2(x - 1) + y + (z - 1) = -2x + y + z + 1,
zatímco rovina kolmá k naší křivce bodem P bude parametricky dána výrazem
(1,0, 1) + t(-1,0, l) + er(-2, 1, 1)
Musíme ještě odečíst objem kužele. Ten je roven \it R2 V (kde R je poloměr podstavy kužele a V jeho výška, v našem případě jsou obě hodnoty rovny jedné) tedy celkový objem je
4 r 1 1 r
^výseč - ^kužel = - 1) - -n = -7t(W2 - 5).
Stejným způsobem bychom mohli obecně spočítat objem kulové úseče o výšce i; v kouli o poloměru R:
V
^výseč " " ykužel Jo Jo Jo
1
r2 sin(0) dr á9 dep
-7t(2Rv - vz)(R - v)
-jtvz(3R - v) 3
□
8.61. Určete objem části válce x2 + z2 = 16, který leží uvnitř válce
+ ý = 16.
Řešení. Integrál vypočteme v kartézských souřadnicích. Vzhledem k symetrii tělesa stačí integrovat přes první oktant (záměníme-li x za —x, či y za — y, či z za —z tak se rovnice tělesa nezmění). Část tělesa ležící v prvním kvadrantu je dána částí prostoru ležícího pod grafem funkce z(x, y) = Vl6 — x2 a nad čtvrtkruhem x2 + y2 < 16, x > 0, y > 0. Její objem je tak roven
4 ľjl6-x2
V = 8
//
Jo Jo
VT6
dydx = 128.
□
487
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
s parametry x aa.
8.22. Vázané extrémy. Nyní se dostávame k první opravdu vážné aplikaci diferenciálního počtu více proměnných. Typickou úlohou optimalizace nebo řízení je najít extrémy hodnot závisejících na několika (ale konečně mnoha) parametrech, ovšem za nějakých dalších podmínek na vzájemné vztahy parametrů.
Velice často má řešená úloha m + n parametrů, které jsou vázány n podmínkami. V našem jazyce diferenciálního počtu tedy hledáme extrémy diferencovatelné funkce h na množině bodů M zadaných implicitně rovnicí F(x\,...,xm+n) = 0. K tomu již máme připraveny účinné postupy.
Pro každou křivku c (t) c M procházející přes P = c(0) musí být h(c(t)) extrémem pro tuto funkci jedné proměnné. Proto také musí být derivace
—A(c(0)|M> dt
■■dc,(Q)h(P) = dh(P)(c'(0)) = 0.
To ale znamená, že diferenciál funkce h se v bodě P nuluje na všech tečných přírůstcích k M v bodě P. Tato vlastnost je ekvivalentní tvrzení, že gradient h leží v normálovém podprostoru (přesněji v jeho zaměření). Takové body P e M budeme nazývat stacionární body funkce H vzhledem k vazbám F.
Jak jsme viděli v minulém odstavci, normálový prostor k naší množině M je generován řádky Jacobiho matice zobrazení F a stacionární body jsou proto ekvivalentně určeny následujícím tvrzením:
Metoda Lagrangeových multiplikátorů
Věta. NechťF = (/i, ...,/„) : Rm+n -* W je diferencovatelná v okolí bodu P, F(P) = 0. Dále nechť M je zadána implicitně rovnicí F(x, y) = 0 a hodnost matice D1 F v bodě P jen. Pak P je stacionárním bodem spojitě diferencovatelné funkce h : M.m+n -> W. vzhledem k podmínkám F, právě když existují reálné parametry k\,... ,kn takové, že
grad/z = ki grad/i
+ kn grad/„.
Všimněme si, že metoda Langrangeových multiplikátorů je algoritmická. Podívejme se nejprve na počty nezná-^ / mých a rovnic: gradienty j sou vektory o m + n souřad-ničích, tedy požadavek z věty dává m + n rovnic. Jako proměnné máme jednak souřadnice x\,..., xm+n hledaných stacionárních bodů P vzhledem k vazbám, ale navíc také n parametrů kt v hledané lineární kombinaci. Zbývá však požadavek, že hledaný bod P patří implicitně zadané množině M, což představuje dalších n rovnic. Celkem tedy máme 2n + m rovnic pro 2n + m proměnných a proto lze očekávat, že řešením bude diskrétní množina bodů P (tj. každý z nich bude izolovaným bodem).
2. Integrování podruhé
Nyní se vrátíme k procesu integrování, který j sme částečně popsali v druhé části šesté kapitoly. Nepůjdeme do detailů a budeme se soutředit na rozšíření tohoto procesu pro veličiny závislé na více proměnných, případně závislé na parametrech.
Poznámka. Všimněme si, že průmět daného tělesa je jak do roviny y = 0, tak do roviny z = 0 kružnice o poloměru 4, a přesto se nejedná o kouli.
8.62. Určete objem části prostoru ležící uvnitř válce x2 + y2 ohraničené rovinami z = 0az = x+ y + 2.
4a
Řešení. V příkladu budeme používat válcových souřadnic daných rovnicemi x = r cos(
Xn) —
|1 pro ixi,... ,x„) e S
I 0 pro všechny ostatní body v 1
V
n 2tt n\ n\ JO JO Jr2
r dz dr dep
4J2.tc Itc
□
8.65. Určete objem tělesa v
cem 4x2 + y2 = 1 z = 0.
3, které je ohraničeno eliptickým vál-rovinami z = 2y a z = 0, ležící nad rovinou
TZOVINA
Řešení. Vzhledem k symetrii úlohy bude výhodné zavést souřadnice x = \r cos(
\/2 t-2 y
V = 4 / / —rdzdrdep
Jo Jo Jr2 V 2
/*tt/2 /»\/2
= 2^2 / / 2r - r3 dr dep = 2 V2 / dep Jo Jo Jo
= V277-.
□
490
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
Riemannovsky integrovatelná na R".
Pro jakoukoliv Riemannovsky měřitelnou množinu M a funkci / definovanou ve všech bodech M můžeme uvažovat funkci / = xm ■ f jako funkci definovanou na celém R" a tato funkce / zjevně má kompaktní nosič. Riemannův integrál funkce / na množině M definujeme jako
/ / dx\ ... dxn = / f dx\ ... dxn,
J m JRn
pokud integrál napravo existuje.
Tato definice Riemannova integrálu nedává přímo rozumný návod, jak hodnoty integrálů skutečně vypočíst. Sama ale okamžitě vede k základním vlastnostem Riemannova integrálu (srovnejte s Větou 6.24):
8.25. Věta. Množina Riemannovsky integrovatelných reálných funkcí na intervalu / Cl" je vektorovým prostorem nad reálnými skaláry a Riemannův integrál je na něm lineární formou.
Pokud je obor integrace S zadán jako disjunktní sjednocení konečně mnoha Riemannovsky měřitelných oborů Si, je integrál funkce f přes S dán součtem integrálů přes obory Si.
Důkaz. Všechny vlastnosti plynou přímo z definice Riemannova integrálu a vlastností konvergentních posloupností reálných čísel, zcela stejně jako v případě jedné proměnné. Doporučujeme promyslet samostatně podrobnosti. □
Přepišme si větu do obvyklých rovností: ^^^mhb.,^ Konečná aditivita a linearita
První část říká, že lineární kombinace (nad skaláry v R) Riemannovsky integrovatelných funkcí f■ : I -> R, i = 1,..., k, je vždy opět Riemannovsky integrovatelná a spočte se takto:
ai/i(xi
fl(xi
ak
l
,x„)-\-----h akfk(xi, ..., x„) I dx\ ... dxn
fk(xi, ..., x„)dx\ . ..dx„.
Druhá část pak říká že pro disjukntní Riemannovsky měřitelné množiny M\ a M2 a pro funkci / : Rn -> R Riemannovsky inte-grovatelnou na obou těchto množinách platí
/
f (x\, ..., x„) dx\ ... dx„
mlum2
= /
J h
í
J m
f(xu ...,xn)dxi ...dxn +
f (x\, ..., x„) dx\ ... dx„.
8.26. Násobné integrály. V zápětí uvidíme, že Riemannovsky '/fs integrovatelné množiny zejména zahrnují případy, kdy lze obor integrace M definovat pomocí spojité - :' funkční závislosti souřadnic hraničních bodů tak, že pro danou první souřadnici x umíme zadat dvěmi funkcemi rozsah další souřadnice y e [(p(x), i/>(x)], poté rozsah další souřadnice z e [r](x, y), £(x, y)] apod. pro všechny další souřadnice.
V případě naší koule z úvodního příkladu to skutečně umíme: pro x e [—1,1] definujeme pro y rozsah
8.67. Vypočtěte objem elipsoidu x2 + 2y2 + 3z2 = 1. Řešení. Uvážíme souřadnice
r cos( 2 a paraboloidem 2x2 + y2 = 8 — z.
Řešení. Zjistíme nejprve průnik zadaných ploch:
(z - 2)2 = -z + 8, z > 2,
tedy z = 4 a dostáváme rovnici průniku daných ploch 2x2 + y = 4. Substitucí x = -^r cos(
2ar2=8 — z, tedy z = r + 2 pro první
491
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
y e [—V 1 — x2, Vl — x2]. Objem koule pak můžeme buď spočítat integrovaním výše uvedené funkce / nebo můžeme integrovat charakteristickou funkci koule, tj. funkci identicky rovnou jedné na oblasti Scť, která je definována ještě dalším určením z e [—\J\ — x2 — y2, \Jl — x2 — y2].
Podstatná je přitom následující věta, která převádí výpočet Riemannova integrálu na postupný výpočet několika integrálů v jedné proměnné (a ostatní proměnné jsou přitom považovány za parametry, které se mohou proto objevovat i v mezích pro integraci)
NÁSOBNÉ INTEGRÁLY |___———
plochu a z = 8 — r2 pro druhou plochu. Celkem je průmět daného tělesa do souřadnice
Ýn(xi,...,Xn-i)
Důkaz. Důkaz si nejprveme provedeme pro dvě proměnné a pak uvidíme, že pro obecný případ vlastně už nic nového vymýšlet nebudeme.
Uvažme interval / — [a, b] x [c, d] obsahující naši množinu M — {(x, y); x e [a, b], y e lir(x), r](y)]} a dělení S intervalu / s reprezentanty i-ij. Příslušná integrální šumaje
E(E/^'))a^)Ax-
kde píšeme Ax;; pro součin velikostí Ax; a Axj intervalů, které odpovídají výběru reprezentanta i-^.
Předpokládejme nyní chvíli, že pracujeme pouze s výběry reprezentantů takovými, že všechny i-^ mají stejnou první souřadnici xí. Jesthže pak ponecháme dělení intervalu [a, b] a budeme zjemňovat dále pouze dělení [c, d], budou se hodnoty vnitřní sumy v našem výrazu blížit k hodnotě integrálu
ri(xi) Jy(xi)
f(xi, y)dy,
který jistě existuje, protože je funkce /(x;, y) spojitá. Navíc ale tímto způsobem získáme spojitou funkci ve volném paramtru x;, viz 8.23. Proto další zjemňování dělení intervalu [a, b] povede limitně právě na požadovanou formuli
Erb / i>n(y) \ SíAxí^-S— / ( / f(x,y)dy)dx.
i J a \Jý(x) /
Zbývá nám ještě se vypořádat s obecnými výběry reprezentantů obecných dělení S. Protože ale pracujeme se spojitou funkcí / na kompaktní množině, je tam ve skutečnosti stejnoměrně souvislá. Jestliže tedy vybereme předem malé e > 0, můžeme vždy
dep
16V2
-7t.
□
8.72. Určete objem tělesa ležícího uvnitř válce y2 + z2 = 4, dále v polorovině x > 0 a konečně ohraničeného plochou y2 +z2 + 2x = 16.
Řešení. Ve válcových souřadnicích
I
/» 2jt /»2 /»£
Jo Jo Jo
r dx dr dep = 2&ir.
□
8.73. Těžiště tělesa. Souřadnice (xt,yt,zt) těžiště (homogenního) tělesa T o objemu V v M3 je dáno po souřadnicích následujícími integrály:
K'= J J^Jxdxdydz, yt = j j^jxdxdydz, zt j J^Jzdxdydz. Analogicky spočteme těžiště tělesa v M.2 či v jiných dimenzích.
8.74. Určete těžiště části elipsy 3x2 + 2y2 = 1 ležící v prvním kvadrantu roviny R2.
Řešení. Spočítejme nejprve obsah dané elipsy. Transformací souřadnic x = -j^x', y = -jj/ s Jakobiánem -jg dostaneme
11-3*2
\ \ dydx = — dy'dx'
Jo Jo v 6 Jo Jo
7T
476'
Další potřebné integrály můžeme spočítat přímo v kartézkých souřadnicích x a y:
1 /1-3*2
73 f\ t~
0 JO
,73 / 1 - 3x2
x dy dx = / xJ-dx
o V 2
l-ľJ^dt = ^. 2 Jo V 2 18
492
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
najít pro normu dělení ohraničení S > 0 tak, že odchylka hodnot funkce / pro obecné volby x;; od výše použitých voleb nebude převyšovat e. Proto dopadnou hmitní procesy i pro obecné Rie-mannovy sumy Ss^ stejně jako jsme viděli výše.
Obecný případ nyní můžeme dokázat snadno indukcí. V
§případě n — 1 je výsledek triviální a výše uvedená argumentace mužem být snadno převedena v obecný indukční krok, jestliže místo y píšeme (x2,..., x„), místo x máme x\ a jednotlivé krychličky v dělení vnímáme jako (n — 1)-rozměrné krychličky kartézský vynásobené posledním intervalem. V předposledním kroku argumentace pak místo prosté jednorozměrné integrace použjeme indukční předpoklad. Závěrečný argument o stejnoměrné spojitosti zůstává stejný. Doporučujeme projít podrobně jako cvičení. □
fubiniho věta
8.27.
Důsledek. Pro vícerozměrný interval M — [a\,b{\ x [íi2, bi\ x ... x [an,bn] a spojitou funkci f(x\,...,x„) na M je násobný Riemannův integrál
J m
f(xi
J a\ Jan J an
f (XI
nezávislý na pořadí ve kterém postupně integraci provádíme.
Důkaz. V předchozí větě je v případě vícerozměrného intervalu M kterékoliv pořadí integrace vyjádřením oblasti M v požadovaném tvaru. Na výsledku integrálu tak pořadí integrace nemůže mít vliv. □
Možnost zaměňovat pořadí integrace v násobných intgrálech je nesmírně užitečná. I my jsme tento výsledek už dříve využili při studiu vztahu Fourierových transformací a konvolucí, viz odstavec 7.9.
Naše jednoduché odvození Fubiniho věty je opřené o jednoduché vlastnosti Riemannovy integrace a spojitost integrované funkce. Ve skutečnosti ale Fubini svůj výsledek odvodil v daleko obecnějším kontextu integrace, zatímco námi uvedenou větu běžně používali matematici jako Cauchy nejméně 100 let před Fubinim.
Všimněme si také, že u Riemannova integrálu pro funkce více proměnných jsme nezavedli žádný pojem nevlastního integrálu pro neomezené funkce. Ověřte si, že to ani nemůže moc rozumně jít na následujícím příkladu dvou násobných integrálů:
fo (fo fo (fo
x — y \ 1 -tt dy \dx — —
(x + yý y) 2
y
(x + y)
3 dx \ dy —
Zdůvodnění lze vytušit už z vlastností neabsolutně konvergentních řad, kdy přerovnáním pořadí sčítanců lze dosáhnout jakéhokoliv výsledku.
O něco lepší je situace, když počítáme Riemannův integrál omezené riemannovsky integrovatelné funkce f(x), která nemá
ŕ ľ
Jo Jo
f
Jo
y dy dx
1 ľTš 1 - 3x2
10 jo 1 TTš
, (l-3xz)dx 4./o 1
2 jo 73
dx
Souřadnice těžiště jsou potom [7^, ^].
□
8.75. Určete objem a souřadnice těžiště homogenního rotačního kužele o kruhové podstavě s poloměrem r a výšce h.
Řešení. Otočíme-li kužel vrcholem dolů a ten umístíme do počátku souřadnic, pak ve válcových souřadnicích:
V =4/ / / pdzdpd(p = -jthr2. Jo Jo j^p 3
" jt/2 pr ph
Těžiště zjevně leží na ose z. Pro z-tovou souřadnici pak máme
z = ^ í zdV v Jkuže
1 ľ71/2 V Jo
r ľ
o Jhp
zpdzdpdcp = -h.
V Jkužel 'jo jo j-rp
Těžiště tedy leží ve výšce \h nad středem podstavy kužele.
□
8.76. Určete těžiště tělesa ohraničeného paraboloidem 2x2 + ly2 = z, válcem (x + l)2 + y2 = 0 a rovinou z = 0.
Řešení. Nejprve určeme objem daného tělesa. Zkusme použít válcových souřadnic (x = r -cos
0.
o
8.83. Určete těžiště kruhové výseče z kruhu o poloměru 1 příslušné úhlu 120°. o
8.84. Určete objem tělesa v M3 daného nerovnostmi z>0, z — x <0 a(x-l)2 + /0, z — y <0 Q
8.86. Určete objem tělesa ohraničeného plochou
3x2 + 2y2 + 3z2 + 2xy - 2yz - 4xz = 1.
o
8.87. Určete objem části prostoru M3 uvnitř elipsoidu 2x2+y2+z2 = 6 a v poloprostoru x > 1. o
8.88. Povrch grafu reálné funkce f(x, y) dvou proměnných x a y.
Povrch grafu funkce dvou proměnných nad plochou S v rovině x y je dán integrálem
l + /2 + /2dxdj.
Určete obsah části pláště kužele x2 + y2 = z2, která leží nad rov-ninou z = 0 a uvnitř válce x2 + y2 = y.
Řešení. Hledaný povrch vypočítáme jako povrch grafu funkce z = a/x2 + y2 nad kruhem K: x2 — (y — ^)2. Snadno nahlédneme, že
x y
x2 + y2
r spojitá funkce. Potom platí
J M
f (XI,
-f
Jn
i ^) dx^ ... djCfj —
f(G(h
,f„)) \áet(DlG(tu
tn)) \ dt\ ... dtn.
Důkaz. Protože pracujeme se spojitou funkcí /, a diferencovatelnou změnou souřadnic, zjevně existují integrály na obou stranách dokazované rovnosti. Potřebujeme tedy pouze dokázat, že se jejich hodnoty budou skutečně rovnat. Označme si naši složenou funkci
g(h,...,t„) = f(G(h,...,t„)),
zvolme si dostatečně velký n-rozměrný interval / obsahující N a jeho dělení S. Celý důkaz je jen přesnějším zápisem výše uvedené úvahy.
a povrch můžeme vyjádřit integrálem
/ / ^ + fx2 + f2dxdy = j j V2dxdy
K
K
r r ľsmK sqrti r 7
v 2 / / r ár dcp =- / sin cp
Jo Jo 2 J0
Vlit
□
8.89. Určete povrch plochy paraboloidu z = x2 + y2 nad kruhem
X2 + y2 < 4. Q
8.90. Určete povrch části roviny x +2y + z = 10 nad útvarem daným nerovnostmi (x — l)2 + y2 < 1 a y > x. O
F. Aplikace Stokesovy věty - Greenova a Gaussova-Ostrogradského věta
8.91. Vypočtěte
/
(x — y)dx + x dy,
kde c je kladně orientovaná křivka, kterou představuje obvod čtverce ABCD určeného vrcholy A = [2,2]; B = [-2, 2];C = [-2, -2]; D = [2, -2].
Řešení. Pomocí Greenovy věty (viz 8.43) převedeme daný křivkový integrál na integrál plošný. Integrál je tvaru f{ imitscf(x, y) dx + g (x, y) dy, kde f (x, y) = x—y a g (x, y) = x. Potřebné parciální derivace funkcí / (x, y) a g (x, y) tedy jsou fy (x, y) = — 1 a gx (x, y) = 1. Funkce f (x, y) a g(x, y) i fy(x, y) a gx(x, y) jsou spojité na R2, a můžeme tak Greenovy věty použít:
/
(x — y) dx + x dy
D
(1 + 1) dx dy == 2 I I dxdy
D
2 2
2 / dxdy = 2[x ] -[y ] = 32.
J J -2-2 -2 -2
□
8.92. Vypočtěte
/
x dx + xy dy,
kde c je kladně orientovaná křivka procházející vrcholy,
A = [0, 0]; B = [1,0]; C = [0, 1]
496
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
Nejprve si všimněme dvou věcí: Jednak jsou obrazem hranic našeho intervalu hx...in diferencovatelné objekty (stěny, hrany apod.) a zejména tedy půjde opět o Riemannovsky měřitelnou množinu. Pro každý jednotlivý dílek hx...in našeho dělení S jistě existuje integrál / přes Jh...in = G(Ih...in).
Dále, j estliže si zvolíme pevně střed til...in intervalu hx...in, pak dostaneme lineární obraz tohoto intervalu (všimněme si, že lineárním zobrazením daným Jacobiho maticí zobrazujeme interval posunutý do počátku a výsledek potom přičítáme k obrazu středu)
G(th..,J + DíG(th...iJ(Ih...in-th...iJ
je n-rozměrný rovnoběžnostěn. Jetliže bude naše dělení hodně jemné, bude se tento rovnoběžnostěn hodně málo lišit od obrazu Jiu...in. Přesněji řečeno, díky stejnoměrné spojitosti zobrazení G, můžeme pro každé malé e > 0 najít normu dělení takovou, že pro všechna jemnější dělení již bude platit
G(ř/,.../„)+ (l+e)D1G(ři,...ř„)(//l.../„) D Jh...ik.
Pak ovšem jistě bude také pro n-rozměrné objemy platit
voU//,.../„) < (l+e)"vol„(/?;i..,J
= (l+e)"|detG(ř/l.../i)|vol„(/il...i„).
Nyní již umíme celý integrál odhadnout shora
/ f(x\, ..., x„) dxi ... dxn =
j m
v / /(„.....
h...inJj'l-'n
< SUP g)vol„(//!.../„)
(l+e)"^( sup g)|detG(ř/1.../i)|vol„(//l.../(1).
(ři ,...,ř„)e/i. ...in
i\...in
Při limitním procesu pro zmenšující se normy dělení zůstává hodnota nalevo stále stejná, zatímco napravo jistě dostaneme Ri-emannův integrál. Místo dokazované rovnosti ve větě dostáváme nerovnost:
J m
f (xi
/
Jn
< I /(G(ři,...,ř„))\det(DíG(tu...,tn))\dtx...dtn.
in
Nyní však můžeme zopakovat stejnou argumentaci tak, že zaměníme GsG"1, obory integrace M aN a funkce f ag. Okamžitě tak dostaneme nerovnost opačnou:
/
Jn
g(h
ř„)\det(DlG(ti,
, t„)) \ dt\ ... dt„
/
J m
< I f(xu...,xn)\det(DíG(G-í(x1,...,xn)))\
m
|det(Z) G (x\, ..., x„))| dx\ ... dxn • ^ Xfj^^ dxy • • • djCfj
a tím je důkaz ukončen.
= í f(xu
J m
□
Řešení. Křivka c je hranicí trojúhelníka ABC. Integrované funkce jsou spojitě diferencovatelné dokonce na celém M2 a můžeme použít Greenovu větu:
1 -x+l
J x4 dx + xy dy = JJ y dx dy = J J y dx dy
D 0 0
1 _ 1 -x+l
2 J° J L 2
o o
]dx = —\-2 3
□
8.93. Vyčíslete
J (xy + x + y) dx + (xy + x - y) dy,
c
kde c je kružnice o poloměru 1 se středem v počátku.
Řešení. Opět jsou splněny předpoklady pro užití Greenovy věty a postupně dostáváme
J (xy + x + y) dx + (xy + x - y) dy
y + l—x — Idxdy
D
1 2ti
SÍ,Hú
0 0 1 2ti
0 0
sin R" a v euklidovském vektorovém prostoru Rn jsme vyjádřili velikost || c' (t)\\ tečného vektoru. Tento postup přitom byl dán univerzálním vztahem pro libovolný tečný vektor, tj. našli jsme ve skutečnosti zobrazení p : Rn -> R, které vyčíslením na c'(t) dalo skutečnou velikost. Toto zobrazení splňovalo p(a v) — \a\p(v), protože jsme ignorovali orientaci křivky danou naší parametrizací. Pokud bychom chtěli délku se znaménkem respektujícím orientaci, pak by naše zobrazení p bylo lineární na každém jednorozměrném podprostoru L c R".
Budeme teď postupovat velice podobně. Uvažme nějakou diferencovatelnou křivku c(t) v R", t e [a, b] a předpokládejme, že je na nějakém okolí jejích hodnot definovaná diferencovatelná funkce /. Diferenciál této funkce nám pro každý tečný vektor dává přírůstek této funkce v daném směru. Děje se tak pomocí diferenciálu složeného zobrazení f o c vztahem
d(f o c)(t) = ^(C(t))c[(t) + ■■■ + ^L(c(t))c'n(t). dxi óxn
Můžeme tedy zkusit zadefinovat hodnotu integrálu takto (píšeme zatím symbolicky d f pro zviditelnění, jaký objekt integrujeme, podobně jako jsme u integrálů v jedné proměnné psali dx)
2 2
8.99. Vypočtěte obsah plochy dané elipsou ^ + yi = 1 ■
Řešení. Použitím vztahu ||8.95|| a pomocí transformace souřadnic x = a cos t,y = b sin t, pro t e [0, 2it] dostáváme
/ f dvolM — / (
J M Ja \
Bf_
3xi
(c(t))c\ (i)
Bf_
9x„
(c(ť))c'n(t))dt
a okamžitě ověříme, že změna parametrizace křivky nemá žádný vliv na hodnotu. Skutečně, pokud napíšeme c(t) — c(\l/(s)), a — ir(ä), b — if(b), dostaneme naším postupem
J h \ ox\
(cW(s)))c[(if(s))
d f , \df
+ -L(c(f(s)))c'n(f(s)))^-ds
OJCfi / as
a věta o transformaci souřadnic pro integrál jedné proměnné dává právě stejnou hodnotu, pokud je ^- > 0, tj. pokud zachováváme orientaci přivky, a totéž až na znaménko, pokud je derivace transformace záporná.
Přesněji řešeno, naučili jsme se integrovat diferenciál funkce d f přes křivky. Není teď ovšem asi přímo vidět souvislost s integrací funkcí. Evidentně nedostaneme délku křivky, když za / zvolíme konstatní funkci s hodnotou jedna. Ke zdůvodnění potřebujeme geometrický pohled na věc. Velikost vektoru je totiž dána pomocí kvadratické formy, nikoliv lineární. Jestliže ale vezmeme odmocninu z hodnot (pozitivně definitní) kvadratické formy, dostaneme formu lineární, až na znaménka, viz výše. Ještě se k těmto souvislostem vrátíme.
8.33. Vektorová pole a lineární formy. Parametrizaci křivky jsme využili v předchozím odstavci k tomu, že jsme ke každému bodu v obrazu M křivky dostali tečný vektor c' (t) e Rn. Máme tak dáno zobrazení X : M MxRn,c(t) h->- (c(t), c'(ť)). Hovoříme o vektorovém poli X podél křivky M.
Obecně definujeme vektorové pole X na otevřené množině U C Rn jako přiřazení vektoru X(x) e R" v zaměření euklidovského prostoru Rn ke každému jeho bodu x v uvažovaném definičním oboru.
1 ľ
m(D) = — J —y dx + x dy
2tc
2tc
1 ľ 1 ľ
- J a cos t ■ b cos tát — - / b sin ř • {—a sin f)dt
o o
2jt 2jt
1 ľ 2 1 ľ
-ab I cos tát H—ab \ si
2 J 2 J
o
27!
1 ľ
-ab I
2 J
cos21 + sin2 tdt = -ab2it = Ital
sin tdt
1
což je vskutku známý vzorec pro výpočet elipsy s poloosami a ab.
□
8.100. Vypočtěte obsah plochy ohraničené cykloidou danou parametricky VKO = la(t — siní); a(l — cosi)], pro a > 0, t e (0, 2it) a osou x.
Řešení. Plocha je dána křivkami ci a c2. Takže pro obsah dostáváme
m
(D) = j fc —y dx + x dy + j fc —y dx + x dy.
Spočítáme samostatné integrály, křivka c\ je dána
ci : Ý(t) e (ř; 0); t e< 0; 2ajt >
Takže příslušný integrál je roven
5 / —y dx + x dy = 0
Ci
Pro křivku c2 platí
c2 : VK0 £ (a(t — siní); a(l — cosi)); t e< 2ir; 0 >
Vzorec pro obsah předpokládá kladně orientovanou křivku, což pro uvažované parametrické vyjádření cykloidy znamená, že se pohybujeme proti směru parametrizace, tedy od větší meze k menší.
499
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
Jestliže máme dáno vektorové pole X na otevřené množině U C M", pak můžeme pro každou diferencovatelnou funkci / na U definovat její derivaci ve směru vektorového pole X pomocí směrové derivace předpisem
Pro obsah cykloidy tak dostáváme
X(f): U
X(f)(x) = dXMf.
Je-li tedy v souřadnicích X(x) — (X\(x), ...Xn (x)), pak
X(f)(x) = X!(x)-^-(x) + ■■■ + Z„(x)^(x).
óx\ óxn
Nejjednodušší vektorová pole budou mít v souřadnicích všechny souřadné funkce rovny nule, kromě jedné funkce Z;, která bude konstantně jednička. Takové pole pak odpovídá příslušné parciální derivaci podle proměnné x;. Tomu odpovídá také obvyklý zápis
X(x) = Xi(x)-^- + • • • + Xn(x)^-.
óx\ óxn
Množina všech možných tečných vektorů v bodech otevřené podmnožiny U € M" se nazývá tečný prostor TU. Vektorový prostor všech vektorů v bodě x zapisujeme jako TXU. Pro množinu všech hladkých vektorových polí na U používáme značení X(U). Vektorová pole gj- můžeme chápat jako generátory X(U), jako koeficienty v lineárních kombinacích ovšem připouštíme hladké funkce.
Při studiu vektorových prostorů jsme již ve druhé kapitole narazili na potřebnost tzv. lineárních forem. Definovali jsme je v odstavci 2.39 na straně 101. Stejná idea je nasnadě nyní. Lineární forma na zaměření Rn našeho euklidovského prostoru Rn přiřazená k bodu x e R" je lineárním zobrazením definovaným na tečném prostoru TXU. Jestliže máme dáno zobrazení rj : U c R" -> Rn* na otevřené podmnožině U, hovoříme o lineární formě rj na U.
Každá diferencovatelná funkce / na otevřené podmnožině U C Rn definuje lineární formu d f na U. Pro množinu všech hladkých lineárních forem na U používáme značení ň1 (U).
Je zřejmé, že v souřadnicích (xi,... ,x„) můžeme využít diferenciálů jednotlivých souřadných funkcí a každou lineární formu rj vyjádřit
rj (x) — rji (x)dx\
?1n ix)dxn,
kde rn (x) jsou jednoznačně určené funkce. Taková forma rj se vyčíslí na vektorovém poli X(x) — X\ (x) + ■ ■ ■ + X„ (x) jako
v(X(x)) = m (x)Xi (x) + --- + rj„ (x)Xn (x).
V případě, že je forma rj diferenciálem funkce /, dostáváme právě výše použité vyjádření X(f)(x) — df(X(x)).
Všimněme si, že jsme v předchozím odstavci vlastně zavedli integrál libovolné lineární formy přes (neparametrizované) křivky M pomocí jakékoliv parametrizace c (ŕ)
J m Ja
T,(c(t))(c'(t))dt,
protože jsme tehdy sice pracovali s diferenciálem funkce, ale ve skutečnosti jsme ověřili nezávislost hodnoty integrálu na volbě par-materizace pro jakoukoliv lineární formu.
Všimněme si také, že není třba psát nějaký symbol označující vzhledem k jakému konceptu objemu integrujeme, je to dáno definicí lineární formy.
-y dx + x dy
C2
^ . a(t — siní) • a(smt)dt — — / a(\ — cosi) • a(\ — cost)dt
w
2ti
2n
1 2 ľ
-a I
2 J
o
o
1 2 f ■
-a I t si
2 ;
u
2n
t sin t — sin21 — 1 + 2 cos t — cos2 t dt
sin t + 2 cos t — 2 dt
2n
1
ja [—t cos t — sin t + 2 cos t — 2yln = 3jva .
□
Poznámka. Tento obsah bychom neuměli (narozdíl od obsahu elipsy) spočítat doposud známými metodami.
8.101. Vypočítejte souřadnice těžiště rovinného útvaru pro oblast D ohraničenou křivkou c\ a osou x, kde c\ : x = ř cos t, t e< 0, ti >. Předpokládejme, že hmota je rozložena stejnoměrně a hustota je konstatní (tedy r(x, y) = 1).
f f xr(x, y) dx dy, Mx
f f yr(x, y) dx dy a
Řešení. Pro souřadnice těžiště T platí: xT = — a yT = —,
f 1 m J 1 m 5
kde Mz
D D
m = ff r(x, y) dx dy (m značí hmotnost a Mx a My statické
D
momenty).
Užijeme Greenovu větu pro funkce f(x, y) = (xy, y2), g(x,y) = (x2, xy), h(x, y) = (—y, x) dané oblasti D ohraničenou křivkou c\ a osou x, kde
c\ : x = ř cos ř; ř e< 0, tc >
Výraz na pravé straně Greeonovy věty pro / dává:
P(x, y) = xy Py(x, y) = x Q(x,y) = y2 Qx(x,y)=Q
Hranici d D oblasti D sestává ze dvou částí, a to z křivky c\ a části osy x. Můžeme psát dD = c\ + c2, kde c2 je dáno:
c2 : x = —ti + t; t e< 0, n >
500
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
8.34. ^-rozměrné plochy a &-formy. Místo parametrizovaných křivek teď budeme pracovat s diferencovatelnými zobrazeními
M c M", že ji lze rozšířit na zobrazení
Rn, které je difeomofismem a (jrl (M) — V x {0}. Tato jen zdánlivě složitá definice je ilustrována na obrázku. Typicky můžeme zadat variety pomocí implicitních zobrazení, viz odstavec 8.18 a diskuse v 8.19.
Zobrazení
M variety M, nějaké rj ((p(u)) e Ak(Típ(u)Rn) a zvolme libovolně k vektorů Xi (w),..., Xk (u) v tečném prostoru Tu V. Podobně jako u lineárních forem nyní můžeme vyčíslit formu rj na obrazech vektorů Xi pomocí parametrizace
- Qx(x, y) = y
A příslušný integrál je
f g (x, y) dx dy = ffy—0dxdy = f g dt + f g dt.
c D ci C2
Opět spočítáme samotné integrály pro křivky c\ a c2
f (x2, xy) dt = f (t2 cos2 t, t2 cos t sin t) ■ (cos t — t sin t, sin t +
c\ 0
jľ jľ
t cos t) dt = f t2 cos t dt = [t2 sin ŕ] q — 2 f t sin t dt =
o
o
-2([-ŕcosŕ]o + / cos t dt) = -2txI
o
qř(r](cp(u))) (XAu),...,Xk(u))
= v(*(Xi(w))).
501
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
Přímo z definice např. spočteme
cp*(dxi)(-) = dxAipA-)) = ——
duk' duk" duk
a tedy (8.1)
cp (dxi) = -—du\ H-----h -—
OU\ oun
du„.
Stejně tak je okamžitým důsledkem definice vztah pro stažení libovolné &-formy pomocí složení dvou difeomorfismů. Ověřte si samostatně následující rovnost!
(8.2) (cpof)*a = f*(cp*a).
Hladká &-forma rj na ^-rozměrné podvarietě je takové zobrazení M -> Ak(TxM)*, že stažením této formy jakoukoliv parametrizací dostaneme hladkou vnější &-formu na V. Pro množinu všech hladkých vnějších &-forem na M budeme používat značení
Qk(M).
8.35. Vnější součin vnějších forem. Máme-li dány &-formu a e
: a £ -formu i
e A*M"* můžeme pomocí
všech možných permutací a argumentů snadno vytvořit (k + £)-formu a A j3. Musíme prostě prostřídat argumenty ve všech pořadích a opatřit vždy správným znaménkem:
(a Ap)(Xu...,Xk+l) = 1 x
— 2^ sign((r)Q!(Zfr(1), Xa{k) )P(Xa(k+1), Xa(k+l)).
Z definice je zřejmé, že a A p je skutečně (k + £)-forma. V nej-jednodušším případě 1-forem definice říká
(a A fS)(X, Y) = (a(X)p-(Y) - a(Y)p(X))
a v případě 1-formy a a &-formy p dostáváme
(aAp)(X0,X1,...,Xk) =
k
^2(-iya(Xj)p(xQ, ...,xj,..., xk),
j=o
kde stříška značí vynechání příslušného argumentu. Zcela obdobně definujeme vnější součin konečně mnoha forem (buďpřímo podobnou formulí nebo si všimneme, že je vnější součin dvou forem asociativní operací - promyslete si samostatně!).
Stejné značení budeme používat pro formy v Qk (M). Tak jako jsme měli generátory všech vektorových polí v X(W), stejně jsou všechny lineární formy v ^(R") generovány formami dxi. Jejich vnější součiny
€il,„ik = dxh A • • • A dxik
s &-ticemi indexů i\ < Í2 < ■■ ■ < i\ generují celý prostor £2*(R"). Skutečně, prohozením dvou sousedních forem v součinu jen měníme znaménko a zejména tedy je celý výraz identicky nulový, jestliže se dva indexy opakují. Každá &-forma a je proto dána jednoznačně pomocí funkcí aix...ik(x)
a(x)
E
,c(x)dxil A ■ ■ ■ A dxit
Všimněme si ještě, že 0-formy ÍT20(R") jsou podle definice funkce na R". Vnější součin 0-formy / s ^-formou a je prostě násobek formy a funkcí /.
f(x2,xy)dt = f((t - 7t)2,0) ■ (1,0)dt = f(t - re)2dt =
c2 0 0
V\(t-^)M = \^
A tedy: f g(x, y) dx dy = ffy dx dy = ^jt3 — 2jt. c D
A pro h dostáváme:
P(x,y) = -y => Py(x,y) = -1 Q(x,y) =x=> Qx(x,y) = 1
/ h(x, y)dx dy = ff 1 + 1 dx dy = f hdt + f hdt.
c D c\ ci
jt
f(—y,x)dt = f(—t siní, t cos t) ■ (cosi — t siní, siní +
ei 0
jt
t cos ť)dt = f t2 dt = [\tt3]1 = \it3. o
jt
/(-y, x)dt = f (0,7t - t) ■ (1, 0) dt = 0.
c2 0
Dohromady je integrál pro h roven
/ h(x, y)dx dy = ff2dxdy = ^n3 + 0 = ^n3.
c D
Nyní máme potřebné integrály, takže můžeme vyjádřit souřadnice těžiště:
m = f f \dxdy = 2-ff 2(x, y) dx dy = \jt3
Mx = ffxdxdy = —ff —x dx dy = 4 — nz
D D
My = ffydxdy = ^n3 — 2tt
a dostáváme
xT
jí m
Ijt3
My
jjr -2jt _ 2jt2-12
□
G. Diferenciální rovnice l.řádu
8.102. Určete všechna řešení diferenciální rovnice
y
(l + cos2 x)
Řešení. Máme zadánu obyčejnou diferenciální rovnici prvního řádu ve tvaru / = f(x, y), čemuž říkáme, že je rozřešená vzhledem k derivaci. Navíc ji můžeme uvést do tvaru i = f\ (x) ■ f2(y) pro spojité funkce f\ a f2 jedné proměnné (na jistých otevřených intervalech), tj. jedná se o diferenciální rovnici se separovanými proměnnými.
502
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
Ověřte si samostatně, že pro stažení vnějšího součinu pomocí difeomorfismu
U platí
r« zadávající standardní n-rozměrný objem rovnoběžníků, tj. ve standardních souřadnicích bude
(ú^n — dx\ A • • • A dx„.
Chceme-li „po stáru" integrovat funkci fix), uvážíme místo ní formu co — fco^n, tj. ve standardních souřadnicích bude mít co tvar (8.3). Definujeme
/ f(x)dxi A Ju
A dx„
I fix) dx\ ... dxn Ju
kde na pravé straně stojí Riemannův integrál funkce. Všimněme si, že nalevo stojí n-forma zcela nezávisle na volbě souřadnic.
Jestliže budeme chtít formu co vyjádřit v jiných souřadnicích prostřednictvím difeomorphismu
U, znamená to, že budeme vy číslo vat co v bodě cpiu) — x na hodnotách vektorů
(«))(-—dui H-----h -—du„) A ..
'du
A i-^-du\
du\
dun dcpn , x
-—du„)
óun
ficpiu)) det(Z)
)
I fiu) det(Z)lcpiu))du\ Jv
' dun
což je podle věty o transformaci proměnných z odstavce 8.30 tatáž hodnota, pokud je determinant Jacobiho matice stále kladný, a stejná hodnota až na znaménko, pokud je záporný.
Naše nová interpetace tedy dává geometrický smysl pro integrál n-formy na M", pokud příslušný Riemannův integrál v nějakých (a pak už jakýchkoliv) souřadnicích existuje. Tato integrace přitom bere v úvahu orientaci oblasti, přes kterou integrujeme.
8.37. Integrace vnějších forem na varietách. Teď už máme skoro všechno připravené pro definici integrálu k-formy na ^-rozměrné orientované varietě. Budeme Iľii.H' se Pro jednoduchost zabývat hladkými formami co s i— kompaktním nosičem.
Při výpočtu nejprve nahradíme / = dy/dx a upravíme diferenciální rovnici do tvaru
Neboť
1 +cos2 X
dy
l+cos X
dx.
dx = ľ —\--h 1 dx,
U c M c M". Volbou parametrizace —
V cRk, snadno můžeme počítat podle stejné definice. Označme si přitom
R a g : (c, d) -> R spojité a je-li g (y) / Oje (c, d), má počáteční úloha
Z = f (x) g (y), y(x0) = y0
právě jedno řešení pro libovolné x0 e (a, b), y0 e (c, d). Toto řešení
je implicitně určeno jako
y (x) x f ^=ff(t)dt.
yo *o
V konkrétních příkladech si počínáme tak, že najdeme všechna řešení a pak vybereme to, které vyhovuje počáteční podmínce.
504
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
mozna obr. charite
nezáporné fce?
8.38. Rozklad jednotky. Uvažme nějakou varietu M c M" a její pokrytí otevřenými obrazy U t parametrizací r + e,aO< fa,r (ŕ) < 1 všude. Přitom zároveň platilo fit) / 0, právě když \ t\ < r + e.
Jestliže nyní definujeme
Xr,€,x0(x) - fe,r(\x -X0|)
dostáváme hladkou funkci identicky jedničkovou uvnitř koule Br-€ (xo), s nosičem právě Br+€ (xo) a s hodnotami mezi nulou a jedničkou všude.
Lemma (Whitneyho věta). Každá uzavřená množina K C R" je množinou všech nulových bodů nějaké hladké funkce.
Důkaz. Idea důkazu je prostá. Je-li K — Rn, vyhovuje identicky nulová funkce, předpokládejme K ^ Rn.
Otevřenou množinu U — R" \ K vyjádříme jako sjednocení nejvýše spočetně mnoha otevřenými koulemi BYi (x;) a pro každou z nich zvolíme hladkou nezápornou funkci f na Rn, jejíž nosič je právě BYi (xí), viz funkce Xr,e,x0 výše. Nyní sečteme všechny tyto funkce do nekonečné řady
Počítejme
f(x) - ^2akfkix),
přičemž koeficienty ak zvolíme tak malé, aby tato řada konvergovala k hladké funkci / (x).
K tomu stačí např. zvolit ak tak aby všechny parciální derivace všech funkcí akfk (x) až do řádu k včetně byly shora odhadnuly číslem 2~k. Pak totiž nejen samotná řada akfa}Q shora odhadnuta součtem řady yj* 2~k a tedy podle Weistrassova kriteria konverguje stejnoměrně na celém Rn, ale totéž dostaneme pro všechny řady parciálních derivací, protože je můžeme vždy napsat jako
r-l „. . oo
Eo fa , \ -
k=0 11 h k=r
ar fa
dxi,
■ dxir
přičemž první část je hladká funkce, protože jde o konečný součet hladkých funkcí, a druhou část máme opět odhadnutou shora absolutně konvergující řadou čísel a bude tedy opět tento výraz stejnoměrně konvergovat k dx. ^./^ ■
Z definice je zřejmé, že funkce fix) splňuje požadavky v le-matu. □
Rozklad jednotky na varietě
Věta. Uvažme varietu M C M" a její lokálně konečné pokrytí otevřenými obrazy U i parametrizací cpi. Pak na množinách U i existuje soustava hladkých funkcí f takových, že pro každý bod x e M platí VJ; f i (x) — 1 a zároveň f (x) ^ 0, právě když x € U i.
(l + ex) y dy/dx = eř
ydy
1 +ex
■ dx,
y2
y =ln(l +ex) +ln|C|, C^O,
v2
y— = ln(C[l+e*]), C>0.
Dosazení y = 1, x = 0 poté dává
1 _
2 ~
Nalezli jsme tak řešení tj-
i=ln(C-2), tj. C = f.
y = ^21n(f [1+ť]) v okolí bodu [0, 1], kde je y > 0.
8.105. Určete řešení diferenciální rovnice pro které je y(0) = 1.
Řešení. Podobně jako v předchozím příkladu dostáváme
dy
f + 1 ln | x + 1 | + C,
dx x + 1' C e M
arctgy
Počáteční podmínka (tedy dosazení x=0ay = l) dává
arctgl =ln|l| + C, tj. C = f. Proto řešením zadaného počátečního problému je funkce yix) =tg (ln|x + l| + f)
v okolí bodu [0, 1].
8.106. Vyřešte (8.8)
y
x + y + l
□
□
2x + 2y - 1
Řešení. Nechť má funkce / : ia, b) x (c, d) -> R spojité parciální derivace druhého řádu a fix, y) ^ 0, x e {a, b), y e {c, d). Pak lze diferenciální rovnici y' = fix, y) převést na rovnici se separovanými proměnnými právě tehdy, když
fix, y) fix. v) f'xix,y) f';yix,y)
0, x e (a, b), y e (c, d).
S trochou námahy tak lze dokázat, že diferenciální rovnici ve tvaru y = fiax + by + c) můžeme převést na rovnici se separovanými proměnnými, a to pomocí substituce z = ax + by + c. Podotkněme, že proměnná z zde nahrazuje y.
505
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
nezáporné fce?
Soustavě funkcí fi z věty říkáme rozklad jednotky podřízený lokálně konečnému pokrytí variety parametrizacemi.
Položíme tedy z = x + y, což dává z' = 1 + /. Dosazením do ||8.81|) získáváme
z + 1
1
Důkaz. Nejprve si rozšiřme množiny Ui na otevřené množiny U t pomocí rozšířených parematrizací varietách. Uvažme tedy nějakou takovou vari-? etu M c M" a nějakou formu co e Qk(M) s kompatkním nosičem.
Zvolme si nějaké lokálně konečné pokrytí variety M parametrizacemi cpi : Ví -> Ui takovými, že uzávěry všech obrazů cpt (Ví) jsou kompaktní a k tomuto pokrytí podřízený rozklad jednotky f i. Integrál definujeme vztahem
2z z + 1
1
dz,
dx 2z dz
dx 2z 2 1 .
dz
- ľ + 1,
3z
2 1
3Z"3lnU
3 3Z/ = x + c, c e
- 1 1 dx,
tady nl^Slínl^btreba nezápornost fce
f z - 3 ln | Cz
J m J m . . J u i
f i Oi,
kde integrály v sumě napravo jsme již definovali, protože formy f i co mají nosič uvnitř obrazu v parametrizaci cpt. Ve skutečnosti můžeme přepodkládat, že bude naše suma konečná, protože nám stačí uvažovat parametrizace pokrývající kompaktní nosič formy co. Jde tedy o dobře definované číslo, nicméně je třeba ověřit, že výsledná hodnota skutečně nezávisí na našich volbách.
Zvolme si tedy nějakou novou parametrizaci cp : V —>• U kousku variety U c M a podívejme se, čím integrál přes U přispěje k naší integraci. Dostáváme
(fi °
Qk+lM, pro všechny variety M C M" a k — 0, ..., k, takové že
• d je lineární vzhledem k násobení reálnymi čísly
• pro k — 0 jde o diferenciál funkcí
• d(a A P) = (deľ) A [3 + (-l)ka A (dP), kde a eQk(M)
• pro každou funkci f na M platí d(df) — 0.
Zobrazení d říkáme vnější diferenciál.
Důkaz. Pišme lokálně &-formu ve tvaru
a — ^2 aíx...íkdxíx A • • • A dxh
i\<-Cx+1, C e R.
y = xe
□
8.108. Vypočtěte
y
4;t+3y + l
Řešení. Obecně platí, že jsme schopni vyřešit každou rovnici typu
ax + by + c
(8.9)
y = /
^Ax +By + C Pokud má soustava lineárních rovnic
(8.10) ax + by + c = 0, Ax + By + C = 0
právě jedno řešení x0, y0, pak pomocí substitucí u = x —x0, v = y — y0 převedeme rovnici (||8.9||) na homogenní rovnici
dv _ r í au+bv \
du ~ J \Au+Bv ) '
Pokud soustava (|| 8.101|) nemá řešení, příp. jich má nekonečně mnoho, lze rovnici (||8.9||) převést substitucí z = ax + by na rovnici se separovanými proměnnými (často se v těchto případech již jedná o rovnici se separovanými proměnnými).
V tomto príkladu má příslušná soustava rovnic
Ax + 3y + 1 = 0, 3x + 2y + 1 = 0
507
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
9M — {(xi, xi,..., x„) e R"; x\ — 0}. Orientací na tomto poloprostoru zděnenou ze standardní orientace rozumíme tu určenou formou dx2 A • • • A dx„.
-| Orientovaná hranice variety
právě jedno řešení x0 = —1, jo obdržíme homogenní rovnici
1. Substitucí u = x + í,v = y — 1
Uvažme uzavřenou podmnožinu M c Rn takovou, že její vnitřek M c M je orientovanou ^-rozměrnou varietou s pokrytím kompatibilními parmaterizacemi cpi. Dále předpokládejme, že pro každý hraniční bod x e 3M — M\M má okolí v M s parametrizací^ : V C M-xM*-1 -> M takovou, že body x e dMr\cp(V) jsou právě obrazem hranice poloprostoru M_ xRt_1. Podmnožinu M s těmito vlastnostmi nazýváme orientovaná varieta s hranicí.
Zúžení parametrizací zahrnujících hranici na tuto hranici 3 M zadává na 3M sturkturu k — 1-rozměrné orientované variety.
dv du
kterou řešíme další substitucí z =
z u + z
4u+3v 3u+2v '
v/u. Získáváme
_ 4 + 3z 3 + 2z'
dz, du
2z2 + 6z + 4 3 + 2z, '
1
2z + 3 du
TT^-7-ľ =--
2z2 + 6z + 4 m
za předpokladu, že z + 3 z + 2 ^ 0. Integrováním přecházíme ke
vhodný príklad s obr.,
napr obr. 5
1
8.42. Stokesova věta. Nyní se dostáváme k velice důležitému a užitečnému výsledku. Hlavní větu o vícerozměrné analogii křivkových a plošných integrálů formulujeme pro hladké formy a hladké variety. Zběžná analýza důkazu ale ukazuje, že ve skutečnosti potřebujeme je jednou spojitě diferencovatelnou integrovanou vnější formu a dvakrát spojitě integrovatelné paramterizace variety. V praxi navíc často máme hranici oblasti podobnou jako třeba u jednotkové krychle v R3. Tj. máme v hranici nespojitosti derivací na Rieman-novsky měřitelné množině míry nula. V takovém případě si integraci rozdělíme na hladké části a výsledky sečteme. Všimněme si, že přitom sice vzniknou nové kusy hranic, ty však sousedí a jsou v sousedících oblastech s opačnými orientacemi, takže se jejich přínos integraci vzájemně vyruší (podobně jako tomu výše bylo u hraničních bodů po částech diferencovatelné křivky).
-j Stokesova věta ^v_>«»>a
■ ln | z2 + 3z + 2 1
■ln|i<|+ln|C|, C^O,
- In | (z2 + 3z + 2)u2\ = ln | C |, ln | (z2 + 3z + 2) u2\ = lnC2, (z2 + 3z + 2) u2 = ±C2, Při přeznačení tak máme
(z2 + 3z, + 2) u2 = D, D jt 0 a přechodem k původním proměnným dále
C ^ 0, c ^ 0,
c ŕ o.
v v — +3- + 2
uL u
D,
v2 + 3vu + 2m2
D ŕ 0, D £ 0,
Věta. Uvažme hladkou vnější {k — \)-formu co s kompaktním nosičem na orientované varietě M s hranicí 3M se zděděnou orientací. Pak platí
I dcó — J
J M JdM
1
Důkaz. S využitím vhodného lokálně konečného pokrytí variety M a jemu podřízeného rozkladu jednotky vy-h jádříme integrály na obou stranách jako součet (dokonce konečný, protože je nosič uvažované formy co kompaktní) integrálů forem na Rk nebo poloprostoru
= D,
(y - l)2 + 3(y - l)(x + 1) + 2(x + l)2 = D, 0.
Jednoduchými úpravami vyjádříme obecné řešení jako (x + y) (2x + y + 1) = D, D jL 0.
Vraťme se k podmínce z2 + 3z + 2 ^ 0. Z z2 + 3z + 2 = 0 plyne z = — 1 nebo z = —2, tj. v = —u nebo i; = —2u. Pro i; = — u je x = u — \ ay = v + \ = — u + \, což znamená, že y = —x. Podobně pro i; = —2u je y = —2u + 1, a tedy y = —2x — 1. Obě funkce y = —x, y = —2x — 1 však vyhovují původní diferenciální rovnici a lze je navíc zahrnout do obecného řešení volbou D = 0. Všechna řešení proto známe z implicitního tvaru
Můžeme tedy bez újmy na obecnosti rovnou předpokládat, že ^v^2^mk
(x + y) (2x + y + 1) = D, De
je M poloprostor
M
□
a forma co je forma s kompaktním nosičem na M. Pak bude co jistě součtem forem tvaru
tuje matou!
CO — COj(x)dx\ A
A dXj A
A dxk
kde stříška značí vynechání příslušné lineární formy a co j (x) je hladká funkce s kompaniím nosičem. Její vnější diferenciál je
Stanovte obecné řešení diferenciální rovnice
(x2 + y2) dx — 2xy dy = 0.
Řešení. Pro y ^ 0 jednoduchými úpravami dostáváme
dco — (-
dco j
-iy^-dxi A • 8xj
A dxk.
y --
a tak použitím substituce u
i+(ř)2
2xy 21 '
y/x přejdeme k rovnici
508
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
Pokud je j > 1, je vyčíslení formy a> na hranici 3M identicky nulové. Zároveň s využitím základní věty o primitivní funkci pro funkce jedné proměnné dostáváme
argument: podel hranice xi const.
/ dcú = (-1) J M
= ("D
if (f00 dctíj \
1 I [I -dx i \dx\ ■ ■ ■ dx i ■ ■ ■ dxk
JRt-i \J-oo dxj V
' / [^i]^ dx\ ■ ■ ■ dxj ■ ■ ■ dxk = 0,
protože má funkce co j kompaktní nosič. Věta tedy v tomto případě platí. Pokud je ale j = 1, pak dostáváme
f f (ŕ dm \
j dcú = / I / -dx\ \dx2......dxk
J M Jm*-1 \J-qo dx\ )
= / có\ (0, xi, ..., Xk)dx2 ■ ■ ■ dxk = / (tí
Jm*-1 JdM
Tím je důkaz Stokesovy věty ukončen.
□
j f (x, y)dx
■g (x, y) d y
= /("
J M \
dx A dy,
8.43. Poznámky o využití Stokesovy věty. Dokázali jsme mimořádně důležitý výsledek, který pokrývá několik klasických integrálních vztahů z klasické vektorové analýzy. Např. si všimněme, že podle Stokesovy věty je integrace vnějšího diferenciálu da> jakékoliv (k — 1)-formy přes kompaktní varietu bez hranice vždy nulová (např. když integrujeme 2-formu da> přes sféru S2 c M3).
Podívejme se postupně na případy Stokesovy věty v nízkých dimenzích.
Případ n = 2, k = 1. Zkoumáme tedy plochu M v rovině ohraničenou křivkou C = 3M. Je-li forma a>(x, y) = f(x, y)dx+ g(x, y)dy,jeda> = (—1£ + '^)dx A dy. Stokesova věta tedy dává vztah
dy dx
což je jeden z klasických tvarů tzv. Greenovy věty.
Jestliže využijeme standardní skalární součin na M2, můžeme vektorové pole X ztotožnit s lineární formou cd x takovou, že ůl>x(Y) = (Y, X). Ve standardních souřadnicích (x, y) to prostě znamená, že pole X = / (x, y) + g (x, y) ^ zadá právě formu &> zadanou výše. Integrál z a>x podél křivky C má ve fyzice význam práce vykonané pohybem po této křivce v silovém poli X. Gree-nova věta pak mimo jiné říká, že pokud je cd x = dF pro nějakou funkci F, pak je vykonaná práce po uzavřené křivce vždy nulová. Takovým polím se říká potenciálové a funkce F je potenciál pole X.
Také jsme Greenovou větou znovu ověřili že integrace diferenciálu funkce po křivce závisí jen na počátečním a koncovém bodu křivky.
Případ n = 3, k = 2. Zkoumáme oblast v M3 ohraničenou plochou S. Je-li co = f(x, y, z)dy Adz+g(x, y, z)dz/\dx+h(x, y, z)dx A dy, dostaneme dm = (|£ věta říká
|^ + fr)x (x, y, z) — f(x, y, z)dy Adz + g (x, y, z)dz A dx + h(x, y, z)dx A dy. Integrál této formy přes plochu můžeme vnímat tak, že integrovaná 2-forma v každém bodě infinitesimálně přidá k integrálu přírůstek rovný objemu rovnoběžnostěnu zadaného polem Z a malým kouskem plochy. Vnímáme-li vektorové pole jako rychlost pohybu jednotlivých bodů prostoru, půjde o „průtok" danou plochou. Na pravé straně integrálu pak je výraz, který můžeme definovat jako d(a>x) — (divZ)dx A dy A dz. Gaussova-Ostrogradského věta říká, že když je div X identicky nulové, pak celkový průtok hraniční plochou oblasti je nulový. Proto se polím s div X — 0 říká bezzřídlová pole.
Případ n — 3, k — 1. V tomto případě máme v R3 plochu M ohraničenou křivkou C. V případě, že lineární forma a> je diferenciálem nějaké funkce, zjišťujeme, že integrál po ploše závisí jen na hraniční křivce. Jde o klasickou Stokesovu větu. Pokud stejně jako v rovině použijeme standardní skalární součin k identifikaci vektorového pole Z — f ^ + 8j^+h^- s formou &> — fdx + gdx + hdz, dostaneme
/ fdx + gdx + hdz — I dcó, Jc J M
\AzdcD = (*-&)dyAdz^%-g)dzAdx+(&-&)dxAdy. Tuto 2-formu můžeme opět identifikovat s jediným vektorovým polem rot Z, které dá da> dosazením do standardní formy objemu. Tomu poli se říká rotace vektorového pole X. Vidíme, že v třírozměrném prostoru jsou vektorová pole Z s vlastností a>x — dF pro nějakou funkci F zadána podmínkou rot Z — 0. Opět jim říkáme potenciálová pole.
3. Diferenciální rovnice
V této části se vrátíme k (vektorovým) funkcím jedné proměnné, které ale budeme zadávat a zkoumat pomocí jejich okamžitých změn. V závěru se pak také zastavíme u případu rovnic obsahujících parciální derivace.
8.44. Lineární a nelineární diferenční modely. Pojem derivace jsme zavedh, abychom mohli pracovat s okamžitými změnami studovaných veličin. Ze stejných důvodů jsme kdysi v úvodní kapitole zaváděli diference a právě vztahy mezi hodnotami veličin a změnami těch samých nebo jiných veličin vedly k tzv. diferenčním rovnicím. Jako motivační úvod k rovnicím obsahujícím derivace neznámých funkcí se k diferenčním rovnicím na chvilku vraťme.
Nejjednodušším modelem bylo úročení vkladů nebo půjček (a totéž pro tzv. Malthusiánský model populace). Přírůstek byl úměrný hodnotě, viz 1.10. V rámci spojitého modelování stejný požadavek povede na rovnici vztahující derivaci funkce i (i) s její hodnotou
(8.4)
y'(i) = r-y(i)
s konstantou úměrnosti r.
Je snadné uhodnout řešení této rovnosti, tj. funkci y(t) po jejímž dosazení bude rovnost identicky splněna,
y(t) = Cď'
s libovolnou konstantou C. Tuto konstantu určíme jednoznačně volbou tzv. počáteční hodnoty yo — y(ío) v nějakém bodě íq. Pokud
Podstatou metody integračního faktoru je, že na levé straně je derivace výrazu y . Integrováním snadno obdržíme
,x-l
f
x{x — 1)
dx
2x + 2 ln I x + 1 I + C, C e
y~x+i j x+i
Řešeními jsou tak funkce
y = Si (t -lx +21n ix +11 + c) >
C e
Při metodě variace konstant nejprve vyřešíme přidruženou homogenní rovnici
y
2y
x2-l ■
což je rovnice se separovanými proměnnými. Platí
dy dx
dy
y
1 | + ln | x + 1 | + ln | C | x + 1
2y
x^ 2
1
■ dx,
lni y I
mix
ln\y
ln
C
y = C
x - 1
X + 1
-1
x - 1
kde jsme museli vyloučit případ y = 0. Funkce y = 0 je však řešením homogenní lineární diferenciální rovnici vždy a můžeme ji zahrnout do obecného řešení. Obecným řešením přidružené homogenní rovnice tudíž je
CeR.
y
C(x+l) x-1 '
Na konstantu C nahlížejme dále jako na funkci C(x). Derivujme
y
C (x) (jt + l)(jt-l)+C(jt) (jc-I)-C(jc) + (x-1)2
a následně dosadme do původní rovnice
C'(x) (jc + 1)(jc-1)+C(jc) (jt-l)-C(jt) (x-1)2
Po úpravě dostáváme
2C(x) (x + 1) (x-l)(x2-l)-
C(x)
x(x — \) x + \ '
C(x)
ľ x(x - 1) I x + 1
dx,
C(x) = — - 2x + 21n|x + 1 | + C, Cei
Nyní již stačí dosadit j = C(x)f±} = f±i(^-2x+21n|x + l| + c) , CeR. Vidíme, že jsme obdrželi výsledek ve stejném tvaru jako v prvním případě. To by nemělo být překvapivé už z toho důvodu, že rozdíly mezi těmito metodami jsou nevýznamné a že se při nich počítají totožné integrály.
Na závěr si všimněme, že řešení y rovnice / = a(x)y lze stejným způsobem určit pro libovolnou spojitou funkci a. Vždy tedy je
510
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
by část růstu v našem modelu byla dána konstatním působením nezávislém na hodnotě y nebo t (jako jsou např. paušální poplatky za vedení účtu nebo přirozený úbytek populace třeba v důsledku porážek na jatkách), mohli bychom použít rovnici s konstantou s na pravé straně
(8.5)
y/(t) = r-y(t)+:
Zjevně bude řešením této rovnice funkce
y(t) = Ce"
K tomuto závěru je velice lehké dojít, pokud si uvědomíme, že množinou všech řešení rovnice (8.4) je jednorozměrný vektorový prostor, zatímco řešení rovnice (8.5) se obdrží přičtením kteréhokoliv jednoho jejího řešení ke všem řešením předchozí rovnice. Lze pak snadno najít konstantní řešení y(t) — k pro k — — j.
Podobně se nám v odstavci 1.13 podařilo vytvořit tzv. logistický model populačního růstu založený na předpokladu, že poměr změny velikosti populace p(n + \) — p(n) a její velikosti p (ji) je v afinní závislosti na samotné velikosti populace. Přitom jsme chtěli, aby se model choval podobně jako Mathusiánský při malých hodnotách populace a vůbec nerostl při dosažení hmitní hodnoty K. Nyní můžeme tentýž vztah pro spojitý model formulovat pro populaci p(ť) závislou na čase t pomocí rovnosti
(8.6)
P'(t) = p(t)(~jp(t) + r)
tj. při hodnotě p(t) — K pro velkou konstantu K je skutečně okamžitý přírůstek funkce p nulový, zatímco pro p(ť) blízké nule je poměr rychlosti růstu populace k její velikosti blízký r, což bývá malé číslo v řádu setin vyjadřující rychlost růstu populace za dobrých podmínek.
Není jistě snadné vyřešit bez znalostí teorie takovou rovnici (i když právě tento typ rovnic zanedlouho zvládneme), nicméně jako cvičení na derivování lze snadno ověřit, že následující funkce je řešením pro každou konstantu C:
P(t) =
K
1 + CKe-
Srovnáním červeného grafu (levý obrázek) této funkce s volbou K — 100, r — 0, 05 a C — 1 (první dvě jsme takto použili v 1.13, poslední odpovídá přibližně počáteční hodnotě p(0) — 1) s pravým obrázkem (řešení diferenční rovnice z 1.13 s týmiž hodnotami paramterů) vidíme, že skutečně oba přístupy k modelování populací dávají docela podobné výsledky. Pro srovnání výstupu je také do levého obrázku zeleně vkreslen graf řešení rovnice (8.4) s touž konstantou r a počáteční podmínkou.
y = Cef a{x) , CeR. Podobně řešení rovnice / = a (x)y+b(x) doplněné počáteční podmínkou y(x0) = y0 lze při spojitosti koeficientů (funkcí a, b) explicitně určit jako
f* a(t) dt ( px , — [' a(s) ds r\
y = eJ*o [yo +Jxob(t)e Jx° dtj . Ještě dodejme, že lineární rovnice nemá žádná singulární řešení a v obecném řešení vystupuje Cel □
8.111. Vypočtěte lineární rovnici
(y + 2xy) e*2 = cosx.
Řešení. Kdybychom postupovali podle metody integračního faktoru, pouze bychom triviálně přepisovali zadání. Uvedený tvar diferenciální rovnice má totiž požadovanou vlastnost - na levé straně je derivace
2
výrazu y ex . Můžeme proto ihned spočítat
e*2^ = cosx,
j cos x dx,
y e
yer
sinx + C, C e
y = q~x (sinx + C) , CeR. 8.112. Stanovte všechna nenulová řešení Bernoulliho rovnice
y-y- = 3xý.
Řešení. Bernoulliho rovnice
y = a(x)y + b(x)f , r/0,r/l,rel
□
se řeší po vydělení členem / substitucí u = y ární diferenciální rovnici
u' = (1 — r) [a(x)u + b(x)]
V tomto konkrétním příkladu substituce u
u' + í = -3x.
x
Stejně jako v minulém příkladu počítáme
y
1-2
která vede na line-
1/y dává
■ ln I x \
[f -3x eln 1 x 1 dx]
kde ln | x | jsme obdrželi jako (libovolně zvolenou) primitivní funkci k 1/x. Dále je
/
-3x én]x]dx
1
-3x I x I dx
Absolutní hodnotu lze nahradit za znaménko, které lze vytknout a pokrátit, tj. stačí uvažovat
u = \[f -3x2 dx] = \ [-x3 + Č] , CeR.
511
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
8.45. Diferenciální rovnice prvního řádu. Obecně rozumíme (obyčejnou) diferenciální rovnicí prvního řádu vztah mezi derivací funkce / (ř) v proměnné t, její hodnotou y(t) a samotnou proměnnou, který lze zapsat s pomocí nějaké reálné funkce F : R3 -> R jako rovnost
Návratem k původní proměnné dostaneme
y
C-x3
C e
Úpravami vyloučený případ y = 0 je singulárním řešením (což samozřejmě platí pro každou Bernoulliho rovnici s kladným r). □
F(y'(t),y(t),t)=0.
Zápis připomíná implicitně zadané funkce y(t), nicméně navíc je tu závislost na derivaci hledané funkce y(t).
Pokud je rovnice alespoň explicitně vyřešena vzhledem k derivaci, tj.
y(0 = /(r, y(t))
pro nějakou funkci / : R2 -> R, můžeme si dobře graficky představit, co taková rovnice zadává. Pro každou hodnotu (ŕ, y) v rovině si totiž můžeme představit šipku udávající vektor (1, fit, y)), tj. rychlost se kterou se nám bod grafu řešení bude pohybovat rovinou v závislosti na volném parametru t.
Např. pro rovnici (8.6) dostaneme takovýto obrázek (i s vyneseným řešením pro počáteční hodnotu jako výše).
100'
y(x)
80'
60-
40'
20i
7
V///
////
íííí
11/1
m
//// //// %////
//// //// ////
ífff
1111
m
//// ////
//// / /// v/ //////
V, ľ,
1111
w,w,
////// //////
//////
11
///// ///// /////
Wľľ,
ííííf
11111
/ / / / / /////
I" I ' I ■ I ■ I " I T T T T T 1 T r ľ I" I* I* I" I ' I
50
100
150
x
200
Intuitivně lze na základě takových obrázků očekávat, že pro každou počáteční podmínku bude existovat právě jedno řešení naší rovnice. Jak ale uvidíme, takové tvrzení platí jen pro dostatečně hladké funkce /.
8.46. Integrace diferenciálních rovnic. Ještě než se pustíme do zkoumání existence řešení diferenciálních rovnic, ukážeme si aspoň jednu úplně elementární metodu řešení. Převádí řešení na obyčejné integrování a zpravidla pak pro řešení obdržíme implicitní popis.
dvnice se separovanými proměnnými |_
Uvažujme diferenciální rovnici ve tvaru
(8.7)
y(0 = /(0-*(y(0)
8.113. Záměnou proměnných řešte rovnici
y dx — (x + y2 sin y) dy = 0.
Řešení. Je-li proměnná x ve vyjádření diferenciální rovnice prvního řádu pouze v první mocnině a y se vyskytuje v argumentu elementárních funkcí, je možné aplikovat tzv. metodu záměny proměnných, kdy hledáme řešení jako funkci x nezávislé proměnné y.
Nejprve rozřešíme diferenciální rovnici vzhledem k derivaci, tj. vyjádříme
y = —ř— •
y x+yA sin y
Tato rovnice není žádného z předchozích typů, a proto využijeme úpravy
dy_ _ y
dx x + y2 sin y '
dx
y
dy \x + y2 siny
+ y sin y,
1
x = — x + y sin y.
y
Tím jsme přešli k lineární diferenciální rovnici. Snadno pak dopočítáme její obecné řešení
x = — y cos y + Cy, CeR.
□
Další příklady na diferenciálních rovnic 1. řádu:
8.114. Vyřešte diferenciální rovnici pro funkci y = y(x):
1 +y2
y
l+x2
O
8.115. Určete všechna řešení rovnice se separovanými proměnnými
y - y2 +xy* =0.
O
8.116. Vyřešte rovnici
pro dvě spojité funkce jedné reálné proměnné f ag.
1 +
dx
512
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
Řešení této rovnice lze získat integrací, tj. nalezením primitivních funkcí
G(y)
I
dy
~g(y)
/
F (x) — j f(x)dx.
Postup spolehlivě najde řešení splňující g (y(t)) ^ 0.
Pak totiž spočtením funkce y(x) z implicitně zadaného vztahu F (x) + C — G (y) s libovolnou konstantou C vede k řešení, protože derivovaním této rovnosti s použitím pravidla pro derivovaní složené funkce G(y(x)) dostaneme skutečně ■ y1 (x) — f (x).
Jako příklad najděme řešení rovnice
3/ (x) = x • y(x).
Přímým výpočtem dostaneme ln \y(x)\ — ^x2 padá (alespoň pro kladná y) na
C. Odtud to vy-
y(x)
e2
x2+C
1 r2
D ■ ež ,
kde D je nyní libovolná kladná konstanta. Zastavme se ale pozorněji u výsledné formule a znamének. Konstantní řešení y(x) — 0 vyhovuje naší rovnici také a pro záporná y můžeme použít stejné řešení s zápornými konstantami D. Ve skutečnosti může být konstanta D jakákoliv a našli jsme řešení vyhovující jakékoliv počáteční hodnotě.
IIIIIP
illlm
•"'s///11 !
-^ssss / / /
1
li
W\N^—
-NVWW\
•^\\w\ w \
-N\W\\ \ \ \
illllll
III
—s///r
1!
I
///
AWWW \ \ \ \ \ \ \ -N\\\ \ \\\\
mww
Na obrázku jsou vynesena dvě řešení, která ukazují na nestabilitu rovnice vůči počátečním podmínkám: Jestliže pro libovolné xq změníme malinké yo z negativní na pozitivní hodnotu, pak se nám dramaticky mění chování výsledného řešení. Navíc si povšimněme konstatního řešení y(x) — 0, které odpovídá počáteční podmínce y(x0) = 0.
Pomocí separací proměnných umíme snadno vyřešit nelineární rovnici z předchozího odstavce, která popisovala logistický model populace. Zkuste si jako cvičení.
V první kapitole jsme se obzvlášť pečlivě věnovali tzv. line-1 „ árním diferenčním rovnicím a jejich docela ošklivě vypadající obecné řešení jsme spočtli v odstavci 1.10 na straně 14. Přestože tedy bylo předem jasné, že půjde o jed-fft ' norozměrný afinní prostor vyhovujících posloupností, šlo zdánlivě velmi nepřehlednou sumu, protože bylo třeba zohlednit všechny měnící se koeficienty.
Lze snad tedy odtud čerpat inspiraci k následující konstrukci řešení obecné lineární rovnice prvního řádu
(8.8)
y (r) = a(t)y(t) + b(t)
8.117. Vypočtěte rovnici 2y = x3 /.
8.118. Stanovte všechna řešení rovnice
y/4 - y2 dx +ydy = 0.
O O
O
8.119. Řešte
y tgx = y2 + 1 - 2y.
O
8.120. Stanovte obecné řešení diferenciální rovnice
x2+l _ y y
l-y2
O
8.121. Napište obecné řešení diferenciální rovnice
(x + 1) dy + xy dx = 0.
O
8.122. Najděte řešení diferenciální rovnice
sin y cos x dy = cos y sin x dx splňující 4 y(0) = 7t.
8.123. Vyřešte počáteční úlohu
(x2 + 1) (y2 - 1) + xyi = 0, yil) = J2.
8.124. Určete partikulární řešení rovnice
y sin x = y ln y procházející bodem [tv/2, e].
8.125. Nalezněte všechna řešení diferenciální rovnice
2(1 +ex) yi = ex, která splňují podmínku y(0) = 0.
8.126. Vyřešte homogenní rovnici
O
o
o
o
se spojitými koeficienty a(t) a b (i).
(xy - y) cos y-=x.
513
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
Nejprve najděme řešení homogennizované rovnice y1 (t) = a(t)y(t). To snadno spočteme pomocí separace proměnných a dostáváme
y(t) = y0F(t,t0), F(t,S) = ^a{x)• R spojité parciální derivace na nějaké otevřené množině U. Pak pro každý bod (to, yo) e U D R2 existuje maximální interval I = [?o — a, ?o + b], s kladnými a, b e R, a právě jedna funkce y (t) : I -> R, která je řešením rovnice
y(0 = /(r, M)
na intervalu I.
Důkaz. Všimněme si, že jestliže je funkce y(t) řešením naší rovnice splňující počáteční podmínku y(to) = řo, pak také splňuje rovnost
y(t) = yo + f y'(t)dt = yo+ f f (t, y(t)) dt. Jt0 J to
všude se vyskytuje l jak t-. . i . , . v v , . . /, ,
v mezi, tak v integrálu Pravá strana tohoto výrazu je ovsem, az na konstantu, integrální operátor
L(y)(t) = y0+ í f(t,y(t))dt.
Při řešení naší diferenciální rovnice prvního řádu tedy vlastně hledáme pevný bod pro tento operátor L, tj. chceme najít funkci
y = y(t) s L(y) = y.
8.138. Metodou variace konstant vypočtěte / +2y = x.
8.139. Určete obecné řešení rovnice / = 6x + 2y + 3.
8.140. Vyřešte lineární rovnici
y =4xy + (2x + \)q2x\
8.141. Řešte rovnici i x + y = x In x.
8.142. Vypočtěte lineární diferenciální rovnici
ýx = y + x2 \nx.
O
o o
o o
o
8.143. Stanovte všechna řešení rovnice
y' cos x = (y +2 cos x) sin x.
O
8.144. Najděte řešení rovnice / = 6x — 2y, které vyhovuje počáteční podmínce y(0) = 0. O
8.145. Vypočtěte počáteční problém
y + y sin x = sin x, y (^) = 2.
O
8.146. Uvedte řešení rovnice y1 = 4y + cosx, které prochází bodem
[0, i]. O
8.147. Pro libovolné a, b e R řešte
x y + y = ex, y (a) = b.
O
8.148. Stanovte obecné řešení rovnice
3x2y + xy =
8.149. Řešte Bernoulliho rovnici
O
Např. Kamke.
y = xy — y3 e
515
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
Naopak, jestliže je Riemannovsky integrovatelná funkce y(t) pevným bodem operátoru L (ý), pak z věty o primitvní funkci okamžitě vidíme, že skutečně y(ť) vyhovuje zadané diferenciální rovnici, včetně počátečních podmínek.
Pro operátor L můžeme docela lehce odhadnout, jak se liší
§jeho hodnoty L(y) a L (z) pro různé argumenty y(ť) a z (ŕ). Skutečně, díky spojitosti parciálních derivací funkce / víme, že je / lokálně Lipschitzovská. To znamená, že máme k dispozici odhad
\f(t,y)-f(t, z)\ < C\y-z\, s konstantou C, jestliže omezíme hodnoty (t, y) na okolí bodu (řo, yo) s kompaktním uzávěrem. Zvolíme e > 0 a omezíme se na f v nějakém intervalu J — [to — ao, to + Mj] tak, aby J x [yo — Ě, yo + el C U, a omezíme se na funkce y(t) a z (ŕ), které budou pro t e J splňovat
O
8.150. Vypočtěte Bernoulliho rovnici
y — - = y2 sin x.
8.151. Najděte všechna řešení rovnice
y = ?+v7-
o
O
max |y(ř)
re/
■ yol < e.
max |z(ř)
re/
yol < e-
Nyní dostáváme odhad
\(L(y) - L(z))(t)\
ľ f
Jtn
f (t, y(t))-f(t,z(t))dt
8.152. Řešte rovnici
Na posledním radku chybi max..., taky bych trochu popsal jednotlivé nerovnosti a volbu S
x}/ + 2y + x y f
\f(t, y(ť))-f(t,z(ť))\dt
\y(ť)-z(ť)\dt
Jt0
< D\t-t0\
pro vhodné konstanty C a D. Pro S > 0 dostatečně malé proto bude platit
max \L(y)(t)
\t—íq\ <8
L (z) (ř)| < max c\y(t)
\t—tf)\<8
z(t)\
s nějakou konstantou 0 < c < 1. Takovýmto operátorům jsme v odstavci 7.19 říkali na str. 432 kontrakce. V předpokladech Bana-chovy věty o kontrakci zajišťující jednoznačně určený pevný bod ale potřebujeme ještě úplnost prostoru X funkcí, na nichž operátor L operuje.
V našem případě si můžeme povšimnout, že již ze spojitosti zobrazení f(t,y) vyplývá stejnoměrný odhad pro všechny výše uvažované funkce y(t) a hodnoty t > s v jejich definičním oboru:
\L(y)(t) - L(y)(s)\ < í \f(t, y(t)\dt < d \t — s\
Js
s univerzální konstantou d > 0. Můžeme se tedy kromě výše uvedených podmínek ještě omezit na podmnožinu všech stejnoměrně spojitých funkcí. Ta je ale již kompaktní a tedy úplnou množinou spojitých funkcí na našem intervalu, viz Arzelaova-Ascoliho věta 7.23 a proto existuje jednoznačně daný pevný bod y(t) této kontrakce L, který je řešením naší rovnice.
Zbývá ukázat existenci maximálního intervalu I — (to — a,to + b). Předpokládejme, že máme nalezeno řešení y(ť) na intervalu (řo, ři) a zároveň existuje konečná limita
yi
lim y(t). ř-^ři
Pak ale podle výše dokázaného musí existovat řešení s počáteční podmínkou (?i, yi), na nějakém okolí bodu t\ a přitom nalevo od
O
8.153. Pro a, b > 0 stanovte obecné řešení
ydy
dx.
O
8.154. Záměnou proměnných řešte
2y + (y2 - 6x) /
8.155. Vyřešte rovnici
y
O
2y ln y-\-y—x '
O
8.156. Spočítejte obecné řešení následující rovnice
x dx = — y3^ dy.
8.157. Záměnou proměnných vypočtěte
(x + y) dy = y dx + y ln y dy.
O
o
8.158. Řešte
y (e
t) = l.
516
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
něj musí splývat s řešením y(t). Jistě tedy jde řešení y(t) prodloužit napravo od t\. Existují tedy pouze dvě možnosti, kdy řešení napravo od f i neexistuje: buď neexistuje konečná limita y(t) v bodě t\ zleva nebo sice limita y\ existuje, ale bod (ři, y\) je na hranici definičního oboru U funkce /. V obou případech jde skutečně o maximální prodloužení řešení napravo od řo.
Obdobně argumentujeme pro maximální řešení nalevo od řo.
□
8.49. Iterativní aproximace řešení. Postup v důkazu předchozí věty lze přeformulovat do iterativní procedury, která poskytuje přibližná řešení pomocí postupné integrace. Pomocí konkrétního odhadu pro konstantu c z důkazu můžeme dostat i přímé odhady chyb. Zkuste si sami promyslet jako cvičení (viz postup v důkazu Banachovy věty o pevném bodu v odstavci 7.19). Lze pak i vcelku snadno přimo ukázat, že jde o stejnoměrně konvergentní posloupnost spojitých funkcí a tedy bude i hnutou spojitá funkce (aniž bychom se dovolávali na složité věty ze sedmé kapitoly).
m^t^^—PlCARDOVY APROXIMACE
Jednoznačné řešení rovnice
/(ř) = /(ř,y(ř)),
jejíž pravá strana / má spojité parciální derivace, můžeme na dostatečně malém intervalu vyjádřit jako limitu postupných iterací začínajících konstantní funkcí (tzv. Picardova aproximace):
yo(t) = yo, yn+i(t) = L(yn), n = 1, ....
Jde o stejnoměrně konvergující posloupnost spojitých funkcí se spojitou limitou y(t).
Všimněme si, že jsme ve skutečnosti postřehovali jen Lipschi-tzovskost parciálních derivací funkce /, věta tedy platí i s tímto slabším předpokladem. Ukážeme v dalším odstavci, že pouhá spojitost funkce / již zajišťuje existenci řešení také, na jednoznačnost však nestačí.
8.50. Nejednoznačnost řešení.
příkladem. Uvažme rovnici
Začněme úplně jednoduchým
ý(t) = y/]yW-Snadno lze najít řešení pomocí separace proměnných
y(t) = \(t
C)
pro kladná y, s libovolnou konstantou C a t +C > 0. Pro počáteční hodnoty (řo, yo) syo 0 jde přitom o zadání vyhovující předchozí větě a proto bude lokálně existovat řešení právě jedno. Zjevně musí být řešení stále neklesající, proto pro záporné hodnoty yo dostaneme stejné řešení, jen s opačným znaménkem a t + C < 0.
Pro počáteční podmínku (řo, yo) — (fo, 0) ovšem máme kromě na sebe navazující řešení nalevo a napravo od řo, které jsme už našli, ještě identicky nulové řešení y(t) = 0. Můžeme tedy tyto dvě větve nalevo a napravo navazovat libolně, viz. obrázek. Nicméně existenci nějakého řešení garantuje následující věta, které se říkává Peanova věta o existenci řešení:
Věta. Uvažme funkci f(t, y)
spojitou na nějaké
O
8.159. Spočítejte
y
7.x —y1 '
O
8.160. Vyřešte rovnici
2y dx + x dy = 2y3 dy.
O
H. Slovní úlohy vedoucí na diferenciální rovnice
8.161. Čistička vody o objemu 2000 m3 byla znečištěna olovem, které se nachází ve vodě v ní v množství 10g/m3. Do čističky přitéká čistá voda rychlostí 2 m3/s a stejnou rychlostí i vytéká. Za jak dlouho poklesne obsah olova ve vodě v čističce pod 10 iíglm3 (což je hygienická norma pro obsah olova v pitné vodě podle směrnice Evropského společenství), předpokládáme-li, že voda je neustále rovnoměrně promíchávána?
Řešení. Označme objem vody v nádrži jako V (m3), rychlost vytékání vody jako i; (m3/s), konečně nechť m je hmotnost vody v nádrži v gramech. Za infinitezimální (nekonečně malou) časovou jednotku dř vyteče z nádrže y ■ vát gramů olova, pro změnu hmotnosti množství olova v čističce tedy můžeme sestavit diferenciální rovnici
m
dm =---vát.
V
otevřené množině U. Pak pro každý bod (to, y o) D R2 existuje
Separací proměnných dostáváme rovnici
dm v
— =--dř,
m V
integrací obou stran rovnice a odlogaritmováním dostaneme řešení ve tvaru m(t) = moe~^\ kde m0 je množství olova v nádrži v čase ř = 0. Po dosazení číselných hodnot zjistíme, že ř = 6 h 35 min. □
8.162. Rychlost šíření zprávy v populaci o P lidech je přímo úměrná počtu lidí, kteří zprávu ještě neslyšeli. Určete funkci / popisující počet lidí v čase, kteří již zprávu slyšeli. Je vhodné tento model šíření zprávy používat pro malá nebo velká Pl
Řešení. Sestavíme diferenciální rovnici pro /. Rychlost šíření zprávy = f'(t) má být přímo úměrná počtu lidí, kteří o ní ještě neslyšeli, tedy hodnotě P — f (t). Celkem
df_ dt
k(P - f(t)).
517
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
spojité reseni rovnice
y'(t) = f(t, y(t)) lokálně na nějakém okolí íq.
Důkaz. Důkaz uvedeme jen stručně a nechávame na čtenáři doplnění řady detailu. Místo Picardových aproximací budeme postupovat zdánlivě zcela naivně.
Budeme konstruovat řešení napravo od počátečního bodu íq. Zvolíme si za tím účelem malý krok h > 0 a označíme si body
tk — íq + kh, k =1,2,....
V počátečním bodě (to, y o) máme definovánu hodnotu derivace f (to, yo) příslušné křivky řešení (t, y(ť)), můžeme tedy přibližně nahradit parametrizovanou přímkou s touže derivací:
y(°) (f) = y0 + /(f0,y0)(f-f0)
a označíme si y\ — y(0) (t\). Induktivně takto sestrojíme funkce a body
yik) (t) = yk + f(xk, yú(t - h), yk+i = y(k) (tk+l).
Nyní si definujeme y h (t) pomocí slepení jednotlivých lineárních částí, tj.
yh(t) = y(k) (t) pro všechna t e [kh, (k + l)h].
To je evidentně spojitá funkce, které říkáme Eulerova aproximace řešení.
Nyní zbývá již ,jen" dokázat, že existuje limita funkcí y h pro
■Š'.jHeI- ^ J^0UC1 k nu'c a že je řešením. ^ " "' K tomu je třeba si povšimnout (jak jsme již učinili v důkazu věty o jednoznačnosti a existenci řešení), že díky stejnoměrné spojitosti f(t, y) na okolí u, na kterém hledáme řešení, máme k dispozici pro každé předem zvolené e > 0 takové 8, že
\f(t,y)-f(s,z)\<€,
kdykoliv bude || (t — s, y — z)\\ < 8.
Zejména tedy budou všechny naše funkce y^ v množině stejnoměrně spojitých funkcí na našem dotčeném intervalu. Proto podle Arzelaovy-Ascoliho věty (viz odstavec 7.23 na straně 434) bude existovat posloupnost hodnot hn -> 0 taková,že příslušná poslounost funkcí ynn bude stejnoměrně konvergovat ke spojité funkci y(n). Pišme dále jednodušeji y„(i) — yun -> y(t).
Pro každou ze spojitých funkcí y^ ovšem máme jen konečně mnoho bodů v intervalu [to, t], kde není diferencovatelná a můžeme tedy psát
Separací proměnných a zavedením konstanty K (počet lidí, kteří znají zprávu v čase t = 0 musí být P — K) dostáváme řešení
f(t)
Ke
-kt
kde k je kladná reálná konstanta.
Tento model má zřejmě smysl jen pro velká P.
□
8.163. Rychlost, kterou se šíří epidemie v dané uzavřené populaci o P lidech, je přímo úměrná součinu počtu lidí, kteří jsou nakaženi, a počtu lidí, kteří jsou ještě nenakaženi. Určete funkci f(t) popisující počet nakažených v čase.
Řešení. Jako v přechozím příkladě sestavíme diferenciální rovnici df
dt
Separací proměnných dostáváme
K
k ■ f (t) (P - f (t)) .
f (t)
-Kkt
l + Le
velmi yhodno ohrazek,T . . ^ , .
naprcJžIe K & L jsou integrační konstanty.
□
8.164. Rychlost, kterou se rozpadá daný izotop daného prvku, je přímo úměrná množství daného izotopu. Poločas rozpadu izotopu Plutonia, 239Pu, je 24100 let. Za jak dlouho ubude setina z nukleární pumy, jejíž aktivní složkou je zmiňovaný izotop?
Řešení. Označíme-li množství Plutonia jako m, tak pro rychlost rozkladu můžeme napsat diferenciální rovnici
dm dt
kde k je nějaká neznámá konstanta. Řešením je tedy funkce m(t) = m0e~kt. Dosazením do rovnice pro poločas rozpadu (e~kt = ^) zís-
k ■ m,
káme konstantu k
□
2, 88 • 105. Hledaný čas je přibližně 349 let.
y« (0 = yo +
Jtn
(s) ds.
Ale derivace na jednotlivých intervalech jsou konstantní takže můžeme psát (zde k je největší splňující ?o + khn < t, zatímco y j a t j jsou body z definice funkce y^„)
y n (t) = yo +
E/ m
yj)ds
8.165. Změna rychlosti předmětu padajícího v konstantním gravitačním poli v prostředí s jistým odporem je dána vztahem:
dv
kde k je konstanta udávající odpor prostředí. Byl vypuštěn předmět pohybující se počáteční rychlostí 5ms_1 v gravitačním poli g = lOms-2, konstanta odporu prostředí je k = 0.5 s_1. Jaká bude rychlost předmětu za 3 vteřiny?
Řešení.
+ f f(tk,yk). Jtk
g (S \
v=k-Kk-vV'
-kt
po dosazení v (3) = 20 — 15e 2 ms
□
518
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
Rádi bychom místo toho viděli
y n (0 = yo
/ f(s,y„(s))ds,
ale rozdíl tohoto integrálu a posledních dvou členů v předchozím výrazu je odhadnut možnými rozdíly hodnot funkce fit, y) a délkami intervalů. Díky našemu univerzálnímu odhadu pro fit, y) výše můžeme tedy v Umitním procesu lim„^oo y„(t) místo skutečných hodnot použít právě poslední integrál a dostáváme
yit) = lim(y0+ í f(s,y„(s))ds) / (lim/(s,y„ ($)))<&
J to
= yo
yo
ľ fis,yis))ds, J t0
kde jsme pro limitní přechod u integrace využili stejnoměrné konvergence y„(t) -> yit).
Tím je věta dokázána. □
8.51. Systémy rovnic prvního řádu. Na řešení rovnice i (x) — fix, y) lze také pohlížet jako na hledání (parame-/ trizované) křivky (x(f), yit)) v rovině, kde jsme *sít:^ již předem pevně zvolili parametrizaci proměnné x(f) — t. Pokud ale akceptujeme tento pohled, pak můžeme jednak zapomenout na tuto pevnou volbu pro jednu proměnnou a hlavně přibrat libovolný počet proměnných.
Například v rovině můžeme psát takový systém ve tvaru
x' (f) = fit, xit), yit)), 3/ (f) = git, xit), yit))
se dvěmi funkcemi f, g : R3 -> R. Obdobně pro více proměnných.
Jednoduchým příkladem v rovině může sloužit systém rovnic
x'(o = -yo, y(0 = x(o.
Snadno lze uhádnout (nebo aspoň ověřit), že řešením takového systému je např.
xit) — R cos t, yit) — Rúnt
s libovolnou nezápornou konstantou R a křivky řešení budou právě parametrizované kružnice o poloměru R.
V obecném případě budeme pracovat s vektorovým zápisem systému ve tvaru
x'(0 = /(f, xit)) pro vektorovou funkci x : R -> R" a zobrazení / : Rn+1 -> Rn. Na takové systémy umíme přímo rozšířit platnost věty o jednoznačnosti a řešení:
Existence a jednoznačnost pro systémy ODE
Věta. Uvažme funkce fit, x\,..., x„) : Rn+1 -> R, i — 1,..., n, se spojitými parciálními derivacemi. Pak pro každý bod (řo, xi, ..., x„) e Rn+1 existuje maximální interval [to—a, to+b], s a, b € R kladnými, a právě jedna funkce xit) : R -> R", která je řešením systému rovnic
x\ (x) = fi (t, xi (ř), - - -, x„ (x))
x'„ (x) = /„ (ŕ, x\(ť),...,x„ (x))
8.166. Rychost nárůstu populace odmocninového brouka je nepřímo úměrná její velikosti. V čase t = 0 čítala populace 100 brouků. Za měsíc se populace zdvojnásobila. Jak bude populace velká za dva měsíce?
Řešení. Uvažujme spojitou aproximaci počtu brouků a označme jejich počet P. Pak můžeme sestavit následující rovnici:
dP _ k
dt ~ P'
P = y/Kt + c. Dopočtením ze zadaných hodnot f (2) = ~Jl ■ 100, což je odhad skutečného množství brouků. □ Další slovní úlohy vedoucí na diferenciální rovnice:
8.167. Najděte rovnici křivky ležící v 1. kvadrantu a procházející bodem [l, 3/4], jejíž tečna v libovolném bodě vytíná na kladné poloose y úsek velikostí odpovídající průvodiči bodu dotyku (tj. vzdálenosti bodu dotyku od počátku). O
8.168. Zkoumejte množství chemické sloučeniny S (izolované od okolí) v kontejneru, která je nestálá a postupem času se rozpadá, přičemž střední doba života jedné její molekuly je q (jednotek času). Pokud bylo na počátku (tj. v čase t = 0) v kontejneru M molů sloučeniny 5, kolik molů této sloučeniny by mělo být v kontejneru v čase t > 0?
O
8.169. Těleso o hmotnosti 100 g při zavěšení protáhne pružinu o 5 cm. Má-li toto těleso při průchodu rovnovážným bodem rychlost 10 cm/s, vyjádřete jeho polohu v závislosti na čase t. Q
8.170. Nádrž na 300 hl obsahuje 100 hl slané vody, v níž je rozpuštěno 50 kg soli. Do nádrže začne vtékat stálou rychlostí 6 hl/min slaná voda obsahující 2 kg soli najeden hl. Směs, která je promícháváním neustále udržována homogenní, vytéká z nádrže neměnnou rychlostí 4 hl/min. Vyjádřete množství (v kg) soli v nádrži po uplynutí t minut jako funkci proměnné t e [0, 100]. O
8.171. V rámci řízeného experimentu došlo k vyhasnutí malé experimentální tavící pece při konstantní okolní teplotě 300 K. Experiment začal ve 12.00. Ve 13.00 byla měřením odhadnuta teplota v peci na 1300 K a v 15.00 na 550 K. Za předpokladu, že tyto odhady teplot jsou přesné, vypočtěte teplotu v peci ve 14.00. O
8.172. Poločas rozpadu radioaktivního izotopu síry35 S je 87,5 dní. Po nějaké době zbylo z 1 kg tohoto izotopu pouze 90 dkg. Po jaké? (ve výsledku můžete používat funkce ln) O
8.173. Poločas rozpadu radioaktivního prvku A je pět let, prvku B jeden rok. Máme-li 5 kg prvku S a 1 kg prvku A, za jak dlouho budeme
519
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
s počáteční podmínkou
xi (ŕ0) — xi,
Xn (to) — Xn .
Důkaz. Důkaz je skoro identický s důkazem existence a jednoznačnosti pro jednu rovnici s jednou neznámou funkcí, jak jsme ukázali ve Věta 8.48. Neznámá funkce x(t) — (xi (t),..., x„(t)) je křivkou v R" vyhovující zadané rov-\^ nici a proto jsou její komponenty x; (t) opět vyjádřitelné pomocí integrálů
xi (t) — xí (t0)
I xi (t) dt — X{ + I J to J to
fi(t, x(t))dt.
Opět tedy pracujeme s integrálním operátorem y i-> L(y), tentokrát zobrazujícím křivky v Rn na křivky R" a hledáme jeho pevný bod. Protože je euklidovská vzdálenost dvou bodů v Rn vždy shora odhadnuta součtem velikostí rozdílů jednotlivých komponent, důkaz se postupuje zcela stejně jako v případě 8.48. Je pouze zapotřebí si povšimnout, že velikost vektoru
\\f(t,zi,...,zn)- f(t,yi, je odhadnuta shora součtem
yn) II
\\f(t,zi,...,z„)-f(t,yi,Z2---,z„)\\+...
+ II/O, yi,..., y„-i, z„) - f(t, yi,..., y„)\\.
Doporučujeme podrobně projít a promyslet důkaz Věty 8.48 z tohoto pohledu samostatně. □
Při zavádění a studiu modelů nějakého reálného systému je podstatné tzv. kvalitativní chování řešení v závislosti na počátečních podmínkách a na volných parametrech systému (tj. ať už konstant nebo funkcí).
Jako takový docela jednoduchý příklad systému rovnic prvního řádu zmiňme klasický populační model „dravec - kořist", který zavedli ve dvacátých létech minulého století Lotka a Volterra.
Označme x(t) vývoj počtu jedinců v populaci kořisti a y(t) totéž pro dravce. Přepokládáme, že přírůstek kořisti by se řídil Malthusiánským modelem (tj. exponenciální růst s koeficientem a), kdyby nebyli loveni. U dravce naopak očekáváme, že by bez kořisti pouze přirozeně vymíral (tj. exponenciální pokles stavů s koeficientem y). Přitom dále uvažujeme interakci dravce s kořistí, kterou očekáváme přímo úměrnou počtu obou s jistým koeficientem p, u dravce navíc ještě opatřený multiphkativním koeficientem vyjdřujícícm jeho efektivitu při lovu kořisti. Dostáváme systém dvou rovnic:
Model Lotky a Volterry j.^—
x' (t) — ax(t) - fíy(t)x(t) y(t) =-yy(t) + 8!3x(t)y(t).
mít stejné množství obou? (ve výsledku můžete používat funkce ln)
O
8.174. Poločas rozpadu radioaktivního prvku A je osm let, prvku B dva roky. Máme-li 3 kg prvku S a 1 kg prvku A, za jak dlouho budeme mít stejné množství obou? (ve výsledku můžete používat funkce ln)
O
8.175. Poločas rozpadu radioaktivního izotopu kobaltu 60Co je 5,27 let. Za jak dlouho ubyde kilogram ze čtyř kilogramů tohoto izotopu kobaltu? (ve výsledku můžete používat funkce ln) O
I. Diferenciální rovnice vyšších řádů
8.176. Tlumený oscilátor. Zkusme si popsat jednoduchý model pro pohyb nějakého tělesa upnutého k jednomu bodu silnou pružinou. Je-li y(t) výchylka našeho tělesa od bodu yo = y(0) = 0, pak lze uvažovat, že zrychlení y" (t) v čase t bude úměrné velikosti výchylky, avšak s opačným znaménkem. Konstanta úměrnosti k je nazývána pružinou-vou konstantou. Uvažujeme-li k = 1, dostáváme tedy tzv. rovnici oscilátoru
f(t) = -y(t). Tato rovnice odpovídá systému rovnic
x'(ř) = -y(0, y'(t)=x(t) z 8.7. Řešením takového systému je
x(t) = R cos(ř - r), y(t) = R sin(ř - r)
s libovolnou nezápornou konstantou R, která určuje maximální amplitudu, a konstantou r, která určuje fázový posun.
Pro určení jednoznačného řešení potřebujeme proto znát nejen počáteční polohu yo, nýbrž také rychlost pohybu v tomto okamžiku. Těmito dvěma údaji bude určena jak amplituda tak fázový posun jednoznačně.
Představme si navíc, že vlivem vlastností materiálu pružiny bude ještě dodatečně působit síla, která bude úměrná okamžité rychlosti pohybu našeho objektu, opět se znaménkem opačným než je amplituda. To vyjádříme dodatečným členem s první derivací a naše rovnice je
y"(t) = -y(t)-ay'(t),
kde a je konstanta, která vyjadřuje velikost tlumení. Na následujícím obrázku jsou vyneseny tzv. fázové diagramy pro řešení s dvěmi různými počátečními podmínkami a to nalevo při nulovém tlumení, zatímco napravo je použit koeficient a = 0.3
520
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
Zajímavé je, že stejný model docela dobře vystihuje i vývoj nezaměstnanosti v systému omezeném na zaměstnavatele a jejich zaměstnance a to tak, že zaměstnanci hrají roh dravců, zatímco zaměstnavatelé jsou lovenou kořistí.
Vložit cca čtyři obrázky znázorňující dynamiku pro různé hodnoty koeficientů a opatřit komentářem!!!!!
O tomto a podobných modelech lze nalézt nepřeberné množství literatury.
8.52. Stabilita systémů rovnic. My se nyní omezíme jen na jednu základní větu o stabilitě systémů. Všimněme si, že nám za předpokladu spojitosti parciálních deri-y$ vací funkcí zadávajících systémy (ve skutečnosti jejich
ríz Lipschitzovskosti) zajišťuje spojitost chování řešení a to jak v závislosti na počátečních podmínkách tak na samotných rovnicích.
S rostoucí vzdáleností t od počáteční hodnoty to ovšem odhady rostou exponenciálně! Tento výsledek tedy má pouze lokální charakter a není v rozporu s příkladem nestabilně se chovající rovnice ý (ř) = t y(t) ilustrované v odstavci 8.46.5
Uvažujme dva systémy rovnic zapsané ve vektorovém tvaru
x'(t) = f(t,x(t)), y'(t) = g(t,y(t)),
a předpokládejme, že zobrazení f, g : U c M"+1 -> Rn mají spojité parciální derivace na otevřené množině U s kompaktním uzávěrem. Takové funkce budou jistě stejnoměrné spojité a stejnoměrně Lipschitzovské na U, můžeme si tedy označit konečné hodnoty
\f(t,x)-f(t,y)\
Tlumené oscilace
Tlumené oscilace
C = sup
x^y; (t,x), (t,y)eU \x
5 = sup \f(t,x)-g(t,x)\
(t,x)eU
y\
S tímto značením nyní můžeme zformulovat naši základní větu:
Věta. Nechť x(t) a y(t) jsou dvě pevně zvolená řešení
x'(t) = f(t,x(t)), y (t) = g(t, y(t))
výše uvažovaných systémů, zadaná počátečními podmínkami x(to) = xo a y{to) = yo- Potom
|x(0 - y(t)\ < 1*0 - yo\eCMo1 +£(ec|Mo1 -1).
Důkaz. Bez újmy na obecnosti můžeme předpokládat to = \^ 0. Z vyjádření řešení x(t) a y(t) jako pevných bodů ÍV, příslušných integrálních operátorů okamžitě vyplývá odhad
|x(f) - y(t)\ < |x0 -y0\+ / x(s)) - g(s, y(s))\ds.
Jo
Ingrand přitom můžeme dále odhadnout
\f(s,x(s))-g(s, y(s))\
< |/(5, x(s)) - f(s, y(s))\ + \f(s, y(s)) - g(s, y(s))
< C \x(s) - y(s)\ + B
Jestliže si označíme F (t) = \x(t) — y(t)\, a = \xo — yo\, přepíšeme náš odhad jako
L
Fit) 0. Potom také
F (i) dr -1) a druhé tvrzení lematu je dokázáno také. □
A teď už můžeme důkaz věty o spojité závislosti na parametrech rychle dokončit. Již jsme získali odhad Fit) < a + f0' (C F(s)+B) ds a použitím trochu modifikované funkce F(t) — F (f) + ^ z něj dostaneme
Fit)<%+a + j^ CFis)ds.
To už je předpoklad Gronwallovy nerovnosti s dokonce konstantními parametry, dostáváme tedy podle druhého tvrzení lemmatu
F(f) + f < (a+§)eio'Cífc, neboli právě námi dokazované tvrzení
Fit) < aeCř+f (eCř -1).
8.178. Vypočtěte
i" + f + 9/ + 9y = ex + lOcos(3x) .
Řešení. Nejprve vyřešíme přidruženou homogenní rovnici. Příslušný charakteristický polynom je v tomto případě
A3 + k2 + 9k + 9
a má kořeny ki = — 1, k2 = 3i, A3 = — 3i. Obecné řešení přidružené homogenní rovnice je tedy
y = Cie-* + C2 cos (3x) + C3 sin (3x) , Ci, C2, C3 e R.
Řešení nehomogenní rovnice uvedeme ve tvaru
y = Cie~x + C2 cos (3x) + C3 sin (3x) + yp, Ci, C2, C3el
pro jisté partikulární řešení yp nehomogenní rovnice.
Pravá strana zadané rovnice je ve speciálním tvaru. Obecně platí, že pokud je nehomogenní část dána funkcí
Pn(x)ďX,
přičemž P„ je polynom «-tého řádu, existuje partikulární řešení
yp = ŕ R„(x)ďx,
kde k je násobnost čísla a jako kořene charakteristického polynomu a R„ je polynom stupně nejvýše n. Ještě obecněji, pro nehomogenní část
ďx [Pm(x) cos (fix) + Sn(x) sin (fix) ] ,
přičemž Pm je polynom stupně m a S„ polynom stupně n, existuje partikulární řešení ve tvaru
yp = xk ďx [Rt(x) cos (fix) + Tt(x) sin (fix) ] ,
kde k je násobnost čísla a + ifi jako kořene charakteristického polynomu a Ri, Ti jsou polynomy stupně nejvýše l = max {m, n}.
V tomto příkladu je nehomogenní část součtem dvou funkcí ve speciálním tvaru (viz výše). Najdeme proto příslušná dvě partikulární řešení pomocí metody neurčitých koeficientů a ta pak sečteme. Tím získáme partikulární řešení a posléze i obecné řešení zadané diferenciální rovnice. Začněme s funkcí y = ex, které odpovídá partikulární řešení yPl (x) = Aex pro jisté AeK. Protože
yPl (x) = ypi (x) = fpi (x) = fv\ (x) = Aď,
dosazením do původní rovnice s pravou stranou, kde je pouze funkce y = ex, získáváme
20Ae*=e*, tj. A = ^.
Pro pravou stranu tvořenou funkcí y = 10 cos (3x) hledáme partikulární řešení ve tvaru
yP2(x) = x [B cos (3x) + C sin (3x)].
522
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
□
Z tvrzení věty okamžitě vyplývá spojitá závislost jak na počátečních podmínkách, tak na případných dalších parametrech, v nichž by funkce / byla lokálně Lipschitzovsky spojitá. Úplně jednoduchá rovnice v jedné proměnné x* (t) = x(t) s exponenciálním řešením ukazuje, že nelze doufat v obecné lepší výsledky.
8.53. Diferencovatelnost řešení. V praktických problémech nás zajímá diferencovatelnost získaných řešení a to také ve vztahu k počátečním podmínkám, resp. dalším parametrům systému.
Všimněme si, že v obecném vektorovém popisu systému obyčených rovnic
x'(t) = f(t, x(ť))
můžeme vždy předpokládat, že vektorová funkce nezávisí implicitně na t. Skutečně, pokud totiž na t explicitně závisí, můžeme přidat jednu proměnnou xo a zapsat stejný systém rovnic pro křivkux7(ř) = (xo(f),x\(t),... ,x„(ŕ)) jako
x'0(0 = 1
x\(t) = fi(x0(t),Xl(t),...,xn(t))
x'n(t) = /„(x0(f), x\(t), ..., x„(f)) s počátečními podmínkami
*oOo) — to, x(f0) = x\,..., xn(to) = x„.
Takovýmto systémům nezávislým explicitně na čase říkáme autonomní systémy obyčejných diferenciálních rovnic.
Pro zjednodušení postupu se tedy budeme zabývat autonomními systémy závsislými na parametrech X a s počátečními podmínkami
(8.9) ý(f) = f(y(i),k),y(to)=x.
Bez újmy na obecnosti budeme u autonomních systémů vždy uvažovat počáteční hodnotu to = 0 a v případě potřeby budeme řešení s y(0) = x psát ve formě y(t, x, X), abychom zdůraznili závislost na parametrech.
Pro pevné hodnoty počátečních podmínek (a případných parametrů) bude samotné řešení vždy o jeden řád vícekrát diferencovatelné než je řád diferencovatelnosti funkce /. Snadno to odvodíme induktivně pomocí pravidla o derivování složených zobrazení. Jeli / spojitě diferencovatelná,
y"(ť) = Dlf(y(t)) ■ y (r) = Dlf(y(t)) ■ f(y(t))
existuje a je spojitá. Máme-li spojité všechny derivace druhého řádu, dostaneme výraz pro třetí derivaci:
y(3)(0 = D2f(y(ť))(f(y(ť)), f(y(ť)))
+ {Dlf(y(t)))2-f(y(t))-
Promyslete si podrobně argumentaci pro vyšší řády.
Předpokládejme na chvíli, že řešení y(t, x) našeho systému (8.9) je spojitě diferencovatelné i v parametrech x e Rn. Pak můžeme derivaci
(t,x) = Dx(y(t,x)),
Připomeňme, že číslo X = 3i jsme obdrželi jako kořen charakteristického polynomu. Snadno spočítáme derivace
yp2(x) = [5 cos (3x) + C sin (3x) ]
+x [-35 sin (3x) + 3C cos (3x) ], i = 2 [-35 sin (3x) + 3C cos (3x) ] +x [-95 cos (3x) - 9C sin (3x) ],
y^(x) = 3 [-95 cos (3x) - 9C sin (3x) ] +x [275 sin (3x) - 27 C cos (3x) ],
jejichž dosazením do rovnice s pravou stranou tvořenou funkcí y = 10 cos (3x) po úpravě dostaneme
-185 cos (3x) - 18C sin (3x) - 65 sin (3x) + 6C cos (3x) =
10 cos (3x) .
Porovnání koeficientů vede na systém lineárních rovnic -185+6C = 10, -18C-65 = 0
s jediným řešením 5 = —1/2 a C = 1/6, tj.
yP2(x) = x [—i cos (3x) + i sin (3x)]. Celkem je tudíž obecným řešením
y = Cit~x + C2 cos (3x) + C3 sin (3x) +
1 1
—x cos (3x) + -x sin (3x) , C\, C2, C3 e M.
2 6
□
8.179. Určete obecné řešení rovnice
y" +3y' +2y = e~2x.
Řešení. Daná rovnice je lineární (všechny derivace se v rovnici vyskytují v první mocnině) diferenciální rovnice s kostantními koeficienty druhého řádu (nej vyšší derivace hledané funkce, která se v rovnici vyskytuje je druhá). Nejprve vyřešíme zhomogenizovanou rovnici
y" + 3y' + 2y = 0.
Její charakteristický polynom je
x2 + 3x + 2 = (x + l)(x + 2),
s kořeny x\ = — 1 a x2 = —2. Obecné řešení zhomogenizované rovnice je tedy
cxe~x + c2e~2x,
kde c\,c2 jsou libovolné reálné konstanty.
Nyní metodou neurčitých koeficientů nalezneme (nějaké) partikulární řešení původní nehomogenní rovnice. Podle tvaru nehomogenity
523
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
tj. Jacobiho matici všech parciálních derivací podle souřadnic x;, závisející jednak na čase t, ale také na počáteční podmínce x, určit pomocí pravidla pro derivování kompozice zobrazení:
Dl(At,x)) =±(Dly(t,x))
= Dlf(y(t,X))-Dxy(t,x).
Derivace podle počátečních podmínek podél řešení y(t, x) systému (8.53) jsou tedy dány jako řešení systému n2 rovnic prvního řádu s počáteční podmínkou
(8.10) (r, x), <í>(0, x) = E,
kde F(t,x) — D1 f(y(t, x)) a počáteční podmínka vychází z identity y(0, x) — x. Jednoznačnou existenci řešení tohoto (maticového) systému a jeho spojitou závislost na parametrech jsme již dokázali.
Následující věta říká, že ve skutečnosti pro systémy se spojitě diferencovatelnými pravými stranami / skutečně takto derivace podle parametrů vždy dostaneme.
DlFERENCOVATELNOST ŘEŠENÍ |^——
Věta. Uvažme otevřenou podmnožinu U C W+k a zobrazení f : U -> M" se spojitými prvními derivacemi. Pak systém diferenciálních rovnic závislý na pametru X e Rk s počáteční podmínkou v bodě x e U
y(t) = f(y(t),k), y(0)=x
má jednoznačně určené řešení y(ř, x, X), které je zobrazením se spojitými prvními derivacemi ve všech proměnných.
1
Důkaz. Nejprve si všimněme, že můžeme uvažovat systém závisející na parametrech jako obyčejný autonmní systém bez parametrů, když i parametry považujeme za prosto-j ,m rové proměnné a dodáme (vektorové) podmínky X'(t) — 'i 0 a X(0) — X. Bez újmy na obecnosti proto stačí dokazovat větu pro autonomní systémy bez dodatečných parametrů a soustředit se na závislost na počátečních podmínkách.
Stejně jako v základní větě o existenci vyjdeme z Picardových aproximací řešení pomocí integrálního operátoru
yo(t,x) —x, yk+i(t,x)
= x + í Jo
f(yk(s,x))ds.
Drobným upřesněním důkazu této věty 8.48 ověříme stejnoměrnou konvergenci aproximací yk (t, x) k řešení y(ř, x) a to včetně proměnné x.
Zvolme si nyní pro počáteční podmínku pevně bod xq, zvolme jeho malé okolí V, které budeme případně zmenšovat během následujících odahdů, a pišme C pro konstantu, která díky Lipschitzov-skosti funkce / dává na tomto okolí odhad
\f(y)-f(z)\ (t,x) = Dxy(t,x)
řešení y(ř, x) existovat, bude dána rovnicí (8.10) s počáteční podmínkou. Definujme tedy <$> (t, x) touto rovnicí a zkoumejme výraz
Git, h) = \y(t, xo + h)- yit, x0) - A<í>(r, x0)|
a protože —2 je kořenem charakteristického polynomu dané rovnice hledáme řešení ve tvaru yo = axe~2x, kde ael. Dosazením do původní rovnice obdržíme
a[-4e~2x + 4xe~2x + 3ie~2x - 2xe~2x) + 2xe~2x] = e~2x,
odkud a = — 1. Partikulárním řešením dané rovnice je tedy funkce —xe~2x, obecným řešením potom prostor funkcí c\e~x + c2e~2x —
□
xe 2x, c\,ci e R.
8.180. Určete obecné řešení rovnice
/+/ = !.
Řešení. Charakteristický polynom dané rovnice je x2 + x s kořeny 0 a —1, obecné řešení zhomogenizované rovnice je tedy c\ + c2e~x, kde c\,c2 e R.
Partikulární řešení hledáme ve tvaru ax, a e R (nula je kořenem charakteristického polynomu). Po dosazení do původní rovnice dostáváme a = 1. Obecné řešení dané nehomogenní rovnice je c\ +c2e~x + x, ci, c2 e R. □
8.181. Určete obecné řešení rovnice
y" +5y' +6y = e~2x.
Řešení. Charakteristický polynom rovnice je x2 + 5x + 6 = (x + 2)(x + 3), jeho kořeny jsou —2 a —3, obecné řešení zhomogenizované rovnice je tedy c\e~2x + c2e~3x, c\,c2 e R. Partikulární řešení hledáme metodou neurčitých koeficientů ve tvaru axe~2x, a sR (—2 je kořenem charakteristického polynomu). Dosazením do původní rovnice získáme a = 1. Obecné řešení dané rovnice je tedy
cxe~2x +c2e~3x +xe~2x.
□
8.182. Určete obecné řešení rovnice
/ - y = 5.
Řešení. Charakteristický polynom je x2 — x s kořeny 1, 0, obecné řešení zhomogenizované rovnice je tedy c\ + c2ex, kde c\, c2 e R. Partikulární řešení hledáme metodou neurčitých koeficientů ve tvaru ax, a € R, dostáváme a = —5. Obecné řešení dané rovnice je tvaru
c\ + c2ex — 5x.
□
524
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
s malými přírůstky h e R". Abychom dokázali, že spojitá derivace existuje, musíme prostě dokázat, že
1
lim - G (t, h) = 0.
h^O h
Budeme k tomu potřebovat několik odhadů. Předně z poslední věty o spojité závislosti na počátečních podmínkách přímo vidíme odhad:
\y(t,x0 + h) -y(f,x0)| < \h\ ec|ř| .
V dalším kroku použijeme Taylorův rozvoj se zbytkem pro zobrazení /
f(y) - f (z) = D\f(z) • (y - z) + R(y, z),
kde R(y,z) splňuje \R(y,z)\/\y - z\ -> 0 při \y — z\ -> 0. Dostáváme první odhad, při kterém využíváme definice zobra-zde bych * rozepsal, zení ®(t,xo)) pomocí jeho derivace a píšeme opět F(t,x) =
nebo popsal, co se kde f (^(f, ^)))
8.183. Vyřešte rovnici
Jo
G(t,h)< I \f(y(s,x0 + h))- f(y(s,x0)) - h F (s, xo)<&(s, xq) \ ds
\F(s, xq)|| \y(s, xq+h) — y(s, xq) — h <&(s, xq)| ds
Jo
+ \R(y(s,x0 + h),y(s,x0))\ds, Jo
kde pracujeme s normou na maticicích danou jako maximum absolutních hodnot jejich komponent.
Podle předpokladu je F(t, x) spojité, proto na našem okolí V a pro \ t\ < T s dostatečně malým T, abychom zůstávali v okolí V, můžeme ohraničit normu
\\F(t,x0)\\ < B
a zároveň pro libovolně zvolenou konstantu e > 0 umíme najít ohračení \h\ < á, při kterém bude zbytek R splňovat
\R(y(t,x0 + h),y(t,x0))\ < e|y(t, x0 + h) - y(t, x0)| < \h\eeCT .
Můžeme proto náš odhad dále vylepšit takto
G(t,h)C\(x)ex + Cz(x)xex = 0,
C\(x)ex + C'2(x) [ŕ+K1]
x2 + ľ
Neznámé C\ (x) a C'2(x) vypočítame pomoci Cramerova pravidla.
e x e
ex ex + x ex
x e
ex + x ex
ex ex
= e
J2x
2x
xl+l
X2 + 1
e2x
~~ X2 + 1
plyne
Ci(x)
í —
J x2 + \
dx
--ln(x2+l) + d, de
C2(x)
/dx x2 + 1
arctgx + C2, d e
Obecné řešení proto je
y = Cie* + dx ex - \ ex ln (x2 + l) + x e'arctgx, Cu C2 e
□
525
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
8.54. Toky vektorových polí. Ještě než se přesuneme k rovnicím vyšších řádů, podíváme se chvíli na systémy rovnic prvního řádu geometrickým pohledem. Nyní můžeme geometricky formalizovat pravou stranu autonomního systému jako přiřazení vektoru f(x) e ln v zaměření euklidovského prostoru Rn ke každému jeho bodu x v uvažovaném definičním oboru. Hovoříme o vektorovém poli X(x) = /(*).
Jestliže máme dáno vektorové pole X na otevřené množině Í/Cl", pak můžeme pro každou diferencovatelnou funkci / na U definovat její derivaci ve směru vektorového pole X předpisem
X(f):U^R, X(f)(x) = dx(x)f. Je-li tedy v souřadnicích X(x) — (Xi (x),... X„ (x), pak
X(f)(x)
df
Zi(x)-^(x)
ÓX\
df
+ Z„(x)-^(x).
ox„
Nejjednodušší vektorová pole budou mít v souřadnicích všechny souřadné funkce rovny nule, kromě jedné funkce Z;, která bude konstantně jednička. Takové pole pak odpovídá příslušné parciální derivaci podle proměnné x;. Tomu odpovídá také obvyklý zápis
X(x) = Xi(x)-^-+ ■ ■ ■ + X„(x)-
d
3xi 3x„
Nyní můžeme řešení našeho systému rovnic ekvivalentně popsat jako hledání křivky x(f), která pro každé t ze svého definičního oboru splňuje
x'(f) = Z(x(0),
tečný vektor hledané křivky je v každém jejím bodě zadán vektorovým polem X. Každou takovou křivku nazýváme integrální křivkou vektorového pole X a zobrazení
Flf : Rn -* Rn,
definované v bodě xo jako hodnota integrální křivky x(f), splňující x(0) — xo nazýváme tokem vektorového pole X. Věta o jednoznačnosti a existenci řešení systémů rovnic říká, že pro každé spojitě diferencovatelné vektorové pole X existuje jeho tok v každém bodě xo definičního oboru pro dostatečně malá t. Jednoznačnost řešení navíc přímo zajišťuje, že
Flf+s(x)=Flf oFlf(x),
kdykoliv obě strany existují. Navíc je zobrazení Fl^ (x) s pevným parametrem t diferencovalné ve všech bodech x, kde je definované.
Pokud je vektorové pole X definované na celém Rn a má kompaktní nosič, pak zejvně existuje jeho tok ve všech bodech a pro všechna t. Takovým vektorovým polím říkáme úplná. Tok úplného vektorového pole je tedy složen z difeomorfismů Flf Rn -> R" s inverzními difeomorfismy V\x_t.
Jednoduchým příkladem úplného vektorového pole je pole X(x) — Jeho tok je dán
Flf(x!,
,x„) — (xi +t,x2, ...,x„).
Naopak, vektorové pole X(t) — t2 na jednorozměrném prostoru R není úplné, protože jeho řešení jsou tvaru
1
t i->
C - t
pro počáteční podmínky s to ^ 0 a „utečou" tedy do nekonečných hodnot v konečném čase.
8.184. Určete jedinou funkci y vyhovující lineární diferenciální rovnici
y(3) -3y' -2y=2e\ s počátečními podmínkami y(0) = 0, ý (0) = 0, y" (0) = 0. Řešení. Charakteristický polynom je x3 — 3x — 2 s kořeny 2 a dvojnásobným kořenem — 1, partikulární řešení hledáme ve tvaru aex, a el, snadno zjistíme že je jím funkce — \ex, obecné řešení dané rovnice je tedy
9 1
cxe +c2e x + c3xe x - -ex
Dosazením do počátečních podmínek získáme jedninou funkci vyhovující zadání
-e2x H--e x + -xe~
9 18 3
1
2
□
y/3
2 ■
Další příklady diferenciálních rovnic vyššího řádu:
8.185. Nalezněte řešení diferenciálnírovnice
yW = -2y" - 2y' - y + sin(x), splňující y(0) = -\, i (0) = & a f (0) = -1
8.186. Vypočtěte rovnici /" - 2y" - i + 2y = 0.
8.187. Uvedte obecné řešení pro rovnici
y(4) + 2f + y = 0.
8.188. Vyřešte
y(6) + 2y(5) + 4ym + 4y// + 5y/ + 2y + 2y = 0.
8.189. Najděte obecné řešení lineární rovnice
y(5) _ 3y(4) + 2y»> = 8X - 12.
8.190. Nalezněte obecné řešení rovnice
/ =2ý +y + l,
splňující y(0) = 0 a / (0) = 1.
8.191.3. Nalezněte obecné řešení rovnice
/ =4y- 3y' + 1,
splňující y(0) = 0 a ý (0) = 2.
8.192. Spočtěte
O
o
o
o
o
o
o
526
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
vlevo skalař, vpravo vektor
tady bych to určite rozepsal
Popis vektorového pole jakožto přiřazení tečného vektoru v zaměření ke každému bodu euklidovského prostoru je nezávislé na souřadnicích. Následující věta nám tedy dává geometrický lokální kvalitativní popis všech řešení systémů obyčejných diferenciálních rovnic v okolí každého bodu x ve kterém je dané vektorové pole X nenulové.
Věta. Je-li X vektorové pole definované na okolí bodu xq e M" a platí X(xq) ^ 0, pak existuje transformace souřadnic F taková, že v nových souřadnicích y — f (x) je vektorové pole X dáno jako
pole
dyi ■
Důkaz. Budeme konstruovat diffeomorfismus F — (fi,..., /„) postupně. Geometricky lze podstatu důkazu i'NiL snrnout tak' ze si vybereme nadplochu komplementární k směrům X(x), procházející bodem xo, na ní zvolíme souřadnice a ty pak rozneseme na nějaké okolí bodu xo pomocí toku pole X.
Nejdříve použijeme posunutí xo do počátku souřadnic a lineární transformaci na W tak, abychom dosáhli X(0) — äfj-(O). Nyní si zapišme v těchto souřadnicích (x\,..., x„) tok pole X procházející v čase t — 0 bodem (x\, ...,x„) jako x;(f) — • R, která je řešením rovnice k-tého řádu
y(k) (ř) = f(t,y(t),y'(t),...,y{k-l) (t))
s počáteční podmínkou
y(to) = zo, y (ř0) = zi, ■ ■ ■, y(k~1} (to) = zt-i-
Toto řešení navíc závisí diferencovatelně na počáteční podmínce a případných dalších parametrech vstupujících diferencovatelně do funkce f.
Vidíme tedy, že pro jednoznačné zadání řešení obyčejné diferenciální rovnice &-tého řádu musíme zadat v jednom bodě hodnotu a prvních k — 1 derivací výsledné funkce.
Pokud bychom pracovali se systémem í rovnic řádu k, pak stejný postup převede tento systém také na systém kí rovnic prvního řádu. Opět tedy bude plati obdobná věta o existenci jednoznačnosti, spojitosti a diferencovatelnosti.
Na všechny takové systémy se samozřejmě také přenáší silnější vlastnosti v případech, kdy je pravá strana rovnice / diferencovatelná do řádu k včetně nebo analytická, včetně parmaterů, kteréžto vlastnosti se přenáší i na řešení.
8.56. Lineární diferenciální rovnice. Již jsme přemýšleli o operaci derivování jako o hneárním zobrazení z (dostatečně) hladkých funkcí do funkcí. Pokud derivace (-^V jednotlivých řádů j vynásobíme pevnými funkcemi a j (t) a výrazy sečteme, dostaneme tzv. lineární diferenciální operátor.
y(t) D(y)(t) = ak(t)y(k) (t) + ■ ■ ■ + ax (t)yf (t) + a0y(t).
Řešit příslušnou homogenní lineární diferenciální rovnici pak znamená najít funkci y splňující D(ý) — 0, tj. obrazem je identicky nulová funkce.
Ze samotné definice j e zřejmé, že součet dvou řešení bude opět řešením, protože pro libovolné funkce yi a y2 platí
D(yi + yi)(t) = D(yi)(t) + D(y2)(t).
Obdobně je také konstantní násobek řešení opět řešením. Celá mm-nožina všech řešení lineární diferenciální rovnice &-tého řádu je tedy vektorovým prostorem. Přímou aplikací předchozí věty o jednoznačnosti a existenci řešení rovnic dostáváme:
528
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
^^m^mmmmm^ Prostor řešení lineárních rovnic |h—
Věta. Množina všech řešení homogenní lineární diferenciální rovnice k-tého řádu je vždy vektorový prostor dimenze k. Proto můžeme vždy řešení zadat jako lineární kombinaci libovolné množiny k lineárně nezávislých řešení. Taková řešení jsou zadána jednoznačně lineárně nezávislými počátečními podmínkami na hodnotu funkce y(t) a jejích prvních (k — 1) derivací v jednom pevném bodě f o-
Důkaz. Jesliže zvolíme k lineárně nezávislých počátečních podmínek v jednom pevném bodě, pak dostaneme pro každou z nich jednoznačně určené řešení naší rovnice. Lineární kombinace těchto počátečních podmínek přitom vede na tutéž lineární kombinaci příslušných řešení. Všechny možné počáteční podmínky tak vyčerpáme, proto takto dostateme i celý prostor řešení naší rovnice. □
8.57. Lineární diferenciální rovnice s konstantními koeficienty. Předchozí diskuse nám jistě připoměla situaci s homogenními lineárními diferenčními rovnicemi, se kterými jsme se potýkali v odstavci 3.9 třetí kapitoly. Analogie jde i dále v okamžiku, kdy jsou všechny koeficienty a j diferenciálního operátoru D konstantní. Už jsme viděli u takové rovnice prvního řádu (8.8), že řešením je exponenciála s vhodnou konstantou u argumentu. Stejně jako u diferenčních rovnic se podbízí vyzkoušet, zda takový tvar řešení y(t) — e>a s neznámým parametrem X může splnit rovnici &-tého řádu. Dosazením dostaneme
D(ekt) = (akXk + ak-ikk~l H-----h aiX + a0(x)) elt.
Parametr X tedy vede na řešení lineární diferenciální rovnice s konstantními koeficienty tehdy a jen tehdy, když je X kořenem tzv. charakteristického polynomu akXk + ■ ■ ■ + a\X + ao.
Pokud má tento polynom k různých kořenů, dostáváme bázi celého vektorového prostoru řešení. Pokud je X násobný kořen, přímým výpočtem s využitím toho, že je pak také kořenem derivace charakteristického polynomu, dostaneme, že je řešením i funkce y(t) — te>a. Podobně pak pro vyšší násobnost £ dostáváme £ různých řešení ekt, t elt,..., ŕ ekt.
U obecné lineární diferenciální rovnice předepisujeme nenulovou hodnotu diferenciálního operátoru D. Opět úplně analogicky k úvahám o systémech lineárních rovnic nebo u lineárních diferenčních rovnic přímo vidíme, že obecné řešení takovéto (nehomogenní) rovnice
D(y)(ť) = b(t)
pro nějakou pevně zadanou funkci b(t) je součtem jednoho jakéhokoliv řešení této rovnice a množiny všech možných řešení příslušné homogenní rovnice D(y)(t) — 0. Celý prostor řešení je tedy opět pěkný konečněrozměrný afinní prostor, byť ukrytý v obrovském prostoru funkcí.
Metody pro nalezení jednoho partikulárního řešení jsou předvedeny v konkrétních příkladech ve vedlejším sloupci. V principu jasou založeny na hledání řešení v podobném tvaru v jakém je pravá strana.
8.58. Maticové systémy s konstantními koeficienty. Ještě se podívejme na velmi speciální případ systému prvního řádu, jehož pravá strana je zadána násobením matice a n2-rozměrné neznámé vektorové funkce Y(t).
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
(8.11) Y'(ť) = A-Y(ť)
s konstantní maticí A e Mat„ (R). Kombinací našich znalostí z lineárni algebry a z analýzy funkcí jedné proměnné můžeme přímo uhádnout řešení, jestliže definujeme tzv. exponentu matice předpisem
B(t) = eřA = Y —Ak.
Na výraz napravo přitom můžeme formálně nahlížet jako na matici, jejímiž komponentami bij jsou nekonečné řady vzniklé z uvedených součinů. Jestliže odhadneme všechny komponenty v A maximem jejich absolutních hodnot || A|| = C, pak pro k-tý sčítanec v bij (t) dostaneme v absolutní hodnotě odhad ^nkCk. Nutně tedy je každá řada bij (t) absolutně a stejnoměrně konvergentní a je zhora ohraničena hodnotou em c. Když zkusíme derivovat členy naší řady člen po členu, dostaneme stejnoměrně konvergentní řadu s limitou A etA. Bude proto, podle obecných vlastností stejnoměrně konvergentních řad, tomuto výrazu rovna i derivace
cit y '
Tím jsme získali obecné řešení našeho systému (8.11) ve tvaru
Y(ť) = éA Z,
kde Z € Mat„ (R) je libovolná konstantní matice. Skutečně, exponenta éA je invertibilní maticí pro všechna t a proto jsme tak dostali vektorový prostor správné dimenze a tudíž všechna obecná řešení.
Pozoruhodné je, že pokud řešíme jen vektorovou rovnici s konstantní maticí A € Mat„(M), y (ř) = A -y(t), pro neznámou funkci y : R -> Rn, pak eponenta etA zadá n lineárně nezávislých řešení pomocí svých n sloupců. Obecné řešení pak opět obdržíme jako jejich libovolnou lineární kombinaci.
Závěrem si připomeňme, že jsme maticový systém prvního ,, řádu potkali v odstavci 8.53, když jsme přemýšleli o derivací řešení vektorové rovnice podle počátečních podmínek. "Š Uvažme nyní diferencovatelné vektorové pole X(x) defino-V-> ' vané na okolí bodu xq e R" takové, že X(xq) = 0. Potom je bod xo pevným bodem jeho toku Flf (x).
Pro diferenciál <ř(r) = DxFlx(x0) platí (viz (e8.42b) na straně 524)
<ř'(0 = zyx(x0) • <í>(0, <í>(0) = E.
Známe tedy explitně evoluci diferenciálu toku vektorového pole v jeho singulárním bodě xo, která je dána exponentou
0>(0 = eřA, A = Z)1Z(x0).
To je užitečný krok k úvahám o kvahtativním chování v okolí sta-cionánflio bodu xo.
8.59. Poznámka o Markovových řetězcích. Ve třetí kapitole jsme se zabývali iterativními procesy a významnou roli tam hrály tzv. stochastické matice a jimi zadané Markovovy procesy. Připomeňme, že matice A je stochastická, jestliže součet každého jejího sloupce dá jedničku. Jinými slovy, platí
(1 ... 1) • A = (1 ... 1).
530
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
Jestliže vezmeme exponentu e , dostaneme
(1 ... 1) • éA = V —(1 ...l)-Ak—é(l ... 1). '-^ k\
Je tedy pro každé t invertibilní matice B (t) — e~' etA stochastická. Dostaneme tak spojitou verzi Markovova procesu (infinitesimálně ) generovaného stochastickou maticí A. Skutečně, derivací podle t dostaneme
— Bit) = -e_řeřA +e"fAe'A = (-E + A)B(ť), dt
je tedy matice B(f) řešením maticového systému rovnic s konstantními koeficienty
Y'it) — (A — E) ■ Yit)
se stochastickou matici A. To má vcelku zřejmé intuitivní vysvětlení. Když je A stochastická, pak okamžitý přírůstek vektoru yit) ve vektorovém systému s maticí A, ý (t) = A ■ yit), je opět stochastický vektor. My ale pro Markovův proces chceme, aby vektor yit) zůstával stochastický pro všechna t. Součet přírůstků jednotlivých komponent vektoru yit) tedy musí být nulový a to zajišťuje odečtení jednotkové matice.
Jak jsme již viděli výše, maticové řešení Y'it) má ve svých sloupcích bázi všech řešení i (ŕ) vektorového sytému.
Předpokládejme nyní navíc, že je matice A primitivní, tj. nějaká její mocnina má samé positivní komponenty, viz ?? na straně ??. Pak víme, že její mocniny konvergují k matici Aoo, která má ve všech svých sloupcích vlastní vektor k vlastnímu číslu 1. Jistě proto existuje univerzální konstanta! odhad pro všechny mocniny \\Ak — Aoo II < C a pro každé malé kladné e existuje N e N tak, že pro všechna k > N máme již || Ak — Am || < e. Můžeme nyní odhadnou rozdíl mezi řešením Y'it) pro velká t a konstantní maticí Aqo
00 A 00 Je
^ k\ ^ k\
k=0 k=0
jk
< e"ř E jfjCHAooH +e-te||A00||.
k T již menší než e. Celý výraz jsme tedy odhladli (pro n>Nat>T>0) číslem e(C+ 1)|| Aoo ||.
Dokázali jsem tak velmi zajímavé tvrzení, které hodně připomíná diskrétní variantu Markovových procesů:
Spojité procesy se stochastickou maticí
Věta. Každá primitivní stochastická matice A zadává vektorový systém rovnic
y (t) = (A - E) ■ y(t)
s následujícími vlastnostmi
• báze vektorového prostoru všech řešení je dána sloupci ve stochastické matici
Yit) = e_ř etA,
531
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
• je-li počáteční podmínka yo — y(to) stochastický vektor, pak i řešení y(t) je stochastický vektor pro všechna t,
• každé stochastické řešení konverguje pro t -> oo k vlastnímu vektoru 3>oo matice A příslušnému vlastnímu číslu 1 matice A.
8.60. Diferenciální rovnice. Poznámky o elementárních metodách řešení
8.61. Geometrické distribuce.
8.62. Frobeniova věta o distribucích.
8.63. Parciální rovnice prvního řádu. a něco málo info o rovnicích druhého řádu - vedení tepla, torze tyče apod.
4. Poznámky o numerických metodách
Kromě tak jednoduchých rovnic, jako jsou ty lineární s konstantními koeficienty se v praxi málo setkáváme s analyticky řešitelnými rovnicemi. Většinou proto potřebujeme postupy, jak přibližně spočíst řešení těch rovnic, se kterými pracujeme.
Už jsme podobné úvahy dělali všude tam, kde jsme se zabývali aproximacemi (tj. zejména lze doporučit porovnání s dřívějšími odstavci o splajnech, Taylorových polynomech a Fourierových řadách). S trochou odvahy můžeme také považovat diferenční a diferenciální rovnice za vzájemné aproximace. V jednom směru nahrazujeme diference diferenciály (např. u ekonomických nebo populačních modelů), ve druhém pak naopak.
Zastavíme se na chvilku u nahrazování derivací diferencemi. Nejdříve si však zavedeme obvyklé značení pro zápis odhadů chyb.
Připomeňme, že pro funkci f(x) v proměnné x říkáme, že je v okolí hromadného bodu xo svého definičního oboru řádu velikosti 0((p(x)) pro nějakou funkci D = ln(2) + ^x2 + y2 + xy - x - y - 1). 1.15. y+xy.
124. Stacionární body (±^, =pl, ±^). Hessiány jsou v obou indefinitní, extrém nenastává.
1.25. Stac. body [=p2, ±1, ±2], Hessián je v obou indefinitní, extrémy v těchto bodech nejsou.
1.26. Stac. body [±g, ±1, Tjl, Hessiány jsou v těchto bodech indefinitní, extrémy nenastávají.
1.27. Stac. body [±2, =p2, ±1], extrémy v nich nenastávají.
128. Stacionární body: (0, -1/4), (±73, -1), minimum v bodě (0, -1/4). 1.29. Stacionární body: (0, — 1 /2), Hessián v tomto bodě indefinitní, nemá extrém. 1.31. Stacionární bod (—1/9,2/9), Hessián v něm indefinitní, extrém nenastává. 149. V bodě [i, ^, -i], minimum.
1.50. V bodě [-^, §].
ř.5/. +
ř.53. V bodech [±-^,t^]•
ř.54. V bodech [±^, -^]. ř.55. 373/16. 1.56. 1/(276).
ř.57. (l/s?rí2, 1/2), (-l/sqrt2, -1/2). ř.80. [0, |].
ř.82. [0, A].
ř.S4. v = n.
ř.85. 8tt. ř.86.
ř.57. 4V37T - f 7T.
ř.89. |(17VT7- 1).
1.90. 76(71-/4- 1/2). ř.96.47r. ř.97. 36tt. 198. ff.
y = fzf^-- (použijte součtového vzorce pro tangens).
ř.775. y = 0, y = (1 - Cx) ~l, Cel. U16.y = -ln(l - Ce*), Cel.
1.117. y = Ce~l/x2, Cel.
ř.775. y 5E 2, y = -2, (x - Q2 + y2 = 22, C e R.
U19.y = l,y=l-ln]sm\]+c,CeR.
1.120. x2 + 2 ln | x | + ln I y2 - 1 I = C, C e M.
544
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
8.121. y = C (x + 1) e~x, C e R.
8.122. V2 cos y — cos x.
8.123. y = +
8.124. y = e^(x/2).
8.125. y = ±Vln (eA + 1) - ln 2.
8.126. x = Cesin*, C e M. &/27. y2 = x2 + Cŕy2, C e M.
&Í2S. y = x, y = -x, y = x sin (ln | Cx |), C e R \ {0}. &/29. cotg (i ln ^ = ln | Cx \, C e R \ {0}.
8.130. arctg £ = ln (x2 + y2) + C, C e R.
8.131. y = tg (x + Q - x, C e R.
8.132. C = (x - l)2 - 2(y - 4)(x - 1) - (y - 4)2, C e R \ {0}. &/55. (x - y)2 + 2x + C = 0, C e M.
&/54. y = x, C = 5x - 2y + ln | y - x |, C e R.
8.135. (x + l)2 - 2(x + l)(y + 2) - (y + 2)2 = C, C e R \ {0}.
&/56. 3(y + l)2 - 2(y + l)(x - 2) + 2(x - 2)2 = C, C e R \ {0}.
8.137. y = 5 - x + C(x - 3)2, C e M.
&/5S. y = Ce"3l + |i-^,C eK.
8.139. y = Ce2* - 3(x + 1), C e R.
8.140. y = (x2 + x + C) e2*2, C € R. y = 7 + =Mp - f, C e M.
&Í42. y = Cx +X2 lnx - x2, C e M. 8.745. y = ži!iii±c c € K
J COS .T '
8.144. y = 3x + \ e~2x - §, C e M. &/45.y = ecos* + l.
8.146. y — j=j sin x — ^ cos x + ^ e4*.
8.147. y = e*+af-efl.
y3 = ln|^l+c, C e M.
S./49. y s 0, r = ťt^č, C e M.
Ä/50. v = 0,^f + cos x - C e M.
&i5i. y s 0, y = x4 [\ ln | x | + Cj 2, C e R.
8.152. y s 0, y"2 = x4 (2e* + Q, C e R.
8.153. y2 + £ = Ce-ar, C e M.
&/54.X = 4 + Cy3,C eM. &/55.X = y lny + y, C e R. &/5<5. x2 + y2 (y2 — C) = 0, C e R.
&/57.X = ylny - + Cy, C e M.
&Í5S.X = (C + y) e->\ C e M.
545
KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
8.159. x = £ + l + \ + Ce2y, C e R.
8.160. x = f y3 +-j=,C e R.
8.167. y = l-^,ie(0, 2).
8.168. Me-'li.
8.169. ^sin(2f).
8.770.2(100 + 20
2
15-105
(100+2ř)2 '
& i 71. 800 K.
&Í72. -87,5í^i = 13,3 dne. 8.173. 51n(5)
&774.
4 ln(2) •
8 ln(3) 3 ln(2) •
# 775 5 27ln<^} o.í/j. j, z,/ ln(2).
&i&5. y(x) = — e~x + e-^ sin(-^x) + e~t-x cos(-^x) — 5 sin(x) — \ cos(x).
8.186. y = Cie* + C2e"* + C3e2x, Cu C2, C3 e R.
8.187. y — Ci cosx + C2 sinx + C3x cosx + C4X sinx, přičemž konstanty C\, C2, C3, C4 e M.
y = (Ci + C3x + C5e-*) cosx + (C2 + C4x + C6e_*) sinx, Ci, C2, C3, C4, C5, C6 e R.
&7<59. y = Ci + C2x + C3X2 + C4e2* + C5e* + ^, přičemž konstanty Ci, C2, C3, C4, C5 e R.
8.190.
= I (1+V2)x , X_ (\-sflx)x _ l
y 2 2
8.191. y = \ex - ^e"4* - \.
8.192. y = Cle"2* + C2c~x + (x + l)e3*, Ci, C2 e R.
8.193. Např. y = 8 sin (2x) - 6 cos (2x).
8.194. y = e"* (Ci cosx + C2 sinx) + \ e~x sinx, Ci, C2 e M.
8.195. y = Cie* cos (2x) + C2e* sin (2x) + e2x (sinx - \ cosx), přičemž Ci, C2 e M. &Í96. y = Ci + C2c~x + 3-x3-fx2+3x + e2*, Ci, C2 e R.
8.197. y = (Ci + C2x) e* + (C3 + C4x) e_* + x2 (e* + e-*) + cosx + sinx, Ci, C2, C3, C4 e M
8.198. y = Cie* + C2x ex + x ex (ln | x | - 1), Ci, C2 e M.
8.199. y = Cie"2* + C2x e"2* + ^ e"2* lnx - ^ e"2*, Ci, C2 e R.
8.200. Pro Ci, C2 e M je y — - § cos (2x) + \ sin (2x) ln | sin (2x) | + Ci cos (2x) + C2 sin (2x).
8.201. y = Ci cosx + C2sinx - 2+ 5 sinx ln I I, Ci, C2 e M.
546
KAPITOLA 9
Statistické a pravděpodobnostní metody
Je statistika částí matematiky? - když ano, pak matematiky potřebuje moc...!
Statistika je, v širším slova smyslu, jakékoliv zpracování číselných nebo jiných dat o nějakém souboru objektů a jejich více či méně přehledná prezentace. V tomto smyslu hovoříme o popisné statistice. Jejím předmětem je tedy zpracování a zpřehledňování dat o objektech daného souboru, např. roční příjmy všech občanů zpracovávané z kompletních dat finančních úřadů.
Matematická statistika spočívá ve využití matematických metod při zkoumání dat pouze menšího počtu objektů. Např. zjišťujeme zatížení populace chorobami pomocí dat získaných u několika nahodile vybraných osob, chceme ale interpretovat výsledky ve vztahu k celé populaci.
Podstatou popisné statistiky je odvození jednoduchých (zpravidla) číselných charakteristik o velkých souborech dat, resp. jejich vhodná vizualice. Podstatou matematické statistiky je pro prezentovaná data zjišťovat, jaké vlastnosti skutečně mají objekty, které jou daty popisovány, a zároveň, jak věrohodné jsou odvozené výsledky. Zpravidla přitom jde o sběr a zpracování dat o nějakém souboru objektů, jejich následnou analýzu a, konečně, o vyslovení důsledků pozorování pro rozsáhlejší soubor objektů než jsou ty, jejichž data jsme zpracovávali. Ještě jinak řečeno, výsledkem použití matematické statistiky je sdělení o velkém souboru objektů na základě studia malé (zpravidla náhodně vybrané) části z nich, společně s kvalitativním odhadem věrohodnosti výsledného sdělení.
Matematická statistika je opřena hlavně o nástroje teorie pravděpodobnosti, které jsou velice užitečné (a zajímavé) i samy o sobě. Nejvíce úsilí budeme v dalším textu věnovat právě jim.
Celá tato kapitola poskytuje elementární úvod do matematické statistiky, který by měl být dostatečný pro správné chápání běžných statistických informací všude kolem nás. Pro seriozní práci matematického statistika bude třeba sáhnout po dalších zdrojích.
1. Popisná statistika
Popisná statistika není sama o sobě matematická disciplína, byť používá četné manipulace s čísly a občas i velmi sofistikované metody. Je přitom ale dobrou příležitostí k ilustraci matematického přístupu k budování obecně užitečných nástrojů.
Zároveň by nám měla posloužit jako motivace pro řadu úvah v pravděpodobnosti, protože už budeme tušit, k čemu je v matematické statice budeme potřebovat.
9.1. Pravděpodobnost nebo statistika? Ne náhodou se vracíme k části našich motivačních náznaků z první kapitoly, jak jen máme shromážděno dostatek matematických nástrojů. Statistikami je totiž dnes zaplaveno kdejaké sdělení, ať už v médiích, politické nebo odborné. Nicméně porozumět obsahu takového sdělení
9.1. Máme čtyři sáčky a v nich následující počty koulí: v prvním čtyři bílé, ve druhém tři bílé a jednu černou, ve třetím dvě bílé a dvě černé a ve čtvrtém čtyři černé. Náhodně vybereme sáček a z něj začneme bez vracení vytahovat koule. Určete pravděpodobnost, že
a) první dvě vytažené koule budou různých barev
b) a že druhá vytažená koule bude bílá, jestliže první vytažená koule byla bílá.
Řešení. Protože ve všech sáčcích je stejný počet koulí, je pravděpodobnost vytažení libovolné z koulí, potažmo libovolné dvojice koulí, stejná. Budeme tedy příklad řešit pomocí klasické pravděpodobnosti
a) Celkem můžeme vytáhnout 24 různých dvojic koulí, z toho je sedm dvojic složených z různobarevných koulí, hledaná pravděpodobnost je tedy 7/24.
b) Označme A jev, že první vytažená koule byla bílá, B jev, že druhá vytažená koule bude bílá. Potom P (BD A) je pravděpodobnost, že první dvě vytažené koule budou bílé a ta je podobně jako v předchozím případě 10/24 = 5/12. A opět klasickou pravděpodobností můžememe spočítat i P(A), všech koulí je 16, z toho 9 bílých. Celkem
P(B\A)
P(Bf)A) ± P (A)
il = 20 -i- 27'
16
Jiné řešení. Jev A můžeme uvážit jako sjednocení tří disjunktních jevů A\, A2, resp. A3 a to, že jsme zvolili první sáček a z něj vytáhli bílou kouli, že jsme zvolili druhý sáček a z něj vytáhli bílou kouli a konečně že jsme zvolili třetí sáček a z něj vytáhli bílou kouli. Protože v každém sáčku je stejný počet koulí, je pravděpodobnost vytažení libovolné (bílé) koule shodná a tudíž P (A)
±&P(A1\A) = f
547
KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY
a pochopit možnosti či oprávněnost využití jednotlivých statistických metod a pojmů si vyžaduje mnoho znalostí z různých oblastí matematiky, kterými jsme dosud procházeli.
Vezměme si jako příklad souboru objektů všechny studenty konkrétního základního kurzu. Jako číselné údaje pak můžeme např. zkoumat
• „průměrný počet bodů" dosažený při hodnocení tohoto předmětu v minulém semestru a „rozptyl" dosažených hodnot,
• „průměrné známky" dosažené u zkoušky z tohoto a z jiných pevně vybraných předmětů a „korelace" mezi výsledky,
• „korelace" dat vypovídajících o historii dřívějšího studia u konkrétních studentů,
• „korelace" neúspěchů ve studiu a počtu pracovních hodin týdně odpracovaných studentem či studentkou mimo fakultu,
• ...
Zastavme se u prvního údaje. Samotný aritmetický průměr bodů nám mnoho neřekne ani o kvalitě přednášky ani o kvalitě přednášejícího ani o samotném hodnocení konkrétních studetnů. Možná nás bude více zajímat hodnota, která bude „uprostřed souboru", tj. počet bodů, pro které je stejně studentů pod ní a nad ní (nebo obdobně první a poslední čtvrtina, desetina apod.). Všem takovým údajům říkáme statistiky posuzované veličiny. Takové statistiky budou jistě zajímavé pro samotné studenty a je docela jednoduché je zavést, spočíst i sdělit.
Z obecné zkušenosti nebo jako výsledek teoretických úvah mimo samotnou matematiku víme, že rozumné hodnocení by na mělo mít tzv. „normální" rozdělení. Tento pojem patří do teorie pravděpodobnosti a k jeho zavedení potřebujeme poměrně dost matematiky. Porovnáním výsledku třeba i docela malého náhodného výběru studentů s teoretickým předpokladem můžeme zjistit odhad parametrů takového rozdělení a činit závěry, zdaje celé hodnocení postaveno rozumně. Zároveň lze z číselných hodnot našich statistik pro konkrétní výběr kvalitativně popsat věrohodnost našich závěrů. Stejně tak budeme umět spočíst statistiky, které nebudou měřit polohy uvnitř daného statistického souboru ale variabilitu sledovaných hodnot. Tak například když výsledky hodnocení nebudou vykazovat dostatečnou variabilitu, přičemž studenti jistě různé výkony prokazují, jde opět o náznak, že je s předmětem něco v nepořádku. Když má variabilita charakter chaosu, pak jistě také.
V předchozím odstavci jsme mlčky předpokládali, že považujeme zpracovávaná data za věrohodná. To však v praktickém využití tak nebývá. Naopak samotná data jsou zatížena chybami, zpravidla vznikajícími v důsledku konstrukce experimentu a samotného sběru dat. V mnoha případech také není známo mnoho o charakteru rozdělení dat. V takových případech je obvyklé používat metody neprarametrické statistiky (ketrých se jen letmo dotkneme na konci kapitoly).
Daleko zajímavější vývody ovšem můžeme činit, když porovnáním statistik pro různé veličiny uvedené výše budeme moci dovozovat informace o souvislostech. Pokud např. neexistuje žádná doložitelná souvislost mezi historií předchozího studia a výsledky v dané přednášce, je jedním z možných vysvětlení závěr, že je přednáška prostě špatná.
Shrňme si tedy tyto úvahy takto:
• V popisné statistice máme k dispozici nástroje, které umožňují dobře porozumět struktuře a povaze i velmi rozsáhlých dat;
P(A2\A)
vame
P(B\A)
, P(A3\A)
|. Použitím vztahu (5) pak dostá-
PWAÓPiAdA) + P(B\A2)P(A2\A) + P(B\A3)P(A3\A)
P(Ai) P(A2) P(A3)
P(B\Al)--^- + P(B\A2)--^f + P(B\A3)
P (A)
4 2 3 12 20
1 • - +---+ — = —.
9 3 9 3 9 27
P (A)
P(P(A)
□
9.2. Mirek má čtyři sáčky, v každém jsou bílé a černé kuličky a to v těchto počtech: čtyři bílé; tři bílé a jedna černá; dvě bílé a dvě černé; jedna bílá a tři černé. Mirek náhodně jeden sáček vybral a náhodně z něj vytáhl jednu kouli. Byla černá. Mirek tento sáček zahodil a náhodně vybral jeden ze zbylých tří sáčků a z něj náhodně jednu kouli. Jaká je pravděpodobnost, že bude bílá?
Řešení. Podobně jako v předchozím příkladě, označíme jako A jev, že Mirek náhodně vybral sáček a z něj náhodně černou kouli. Tento jev disjuktním sjednocením jevů A;, i = 2, 3, 4, kde A; je jev, že Mirek vybral i-tý sáček a z něj potom černou kouli. Opět je pravděpodobnost vytažení libovolné (černé) koule stejná a tedy P(A2\A) = ^,
12
P(A3\A) = l = \ a P(A4\A) = | = 5- Nechť B je jev, že Mirek po zahození jednoho ze sáčků vybral ze zbylých bílou kouli. Pokud vyhodil druhý sáček, tak ve zbylých sáčcích je dohromady 7 bílých koulí a pravděpodobnost, že vytáhne jednu z nich je P(B\Ai) (opět můžeme použít klasickou pravděpodobnost, protože v každém sáčkuje stejný počet koulí a tedy má každá stejnou pravděpodobnost, že bude vytažena). Obdobně P(B\A2) = £ a P(B\A3) = ^. Pak podle (5) je hledaná pravděpodobnost
P(B\A) = P(B\A2)P(A2\A) + P(B\A3)P(A3\A) + P(B\A4)P(A4\A)
1 12
1 8 6 + 12
1 9 3 + 12
25 36'
□
9.3. Mirek má čtyři sáčky, v každém jsou bílé a černé kuličky a to v těchto počtech: jedna bílá a jedna černá; tři bílé a jedna černá; jedna bílá a dvě černé; jedna bílá a tři černé. Mirek náhodně jeden sáček vybral a náhodně z něj vytáhl jednu kouli. Byla bílá. Mirek tento sáček zahodil a náhodně vybral jeden ze zbylých tří sáčků a z něj náhodně jednu kouli. Jaká je pravděpodobnost, že bude bílá?
Řešení. Podobně jako v předchozím příkladě uvážíme jev A, totiž že Mirek vybral náhodně sáček a z něj náhodně bílou kouli jako sjednocení čtyř disjunktních jevů A\, A2, A3 a A4: Mirek vytáhl bílou kouli
548
KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY
• v matematice pracujeme s abstraktním matematickým popisem pravděpodobnosti, který je použitelný pro analýzu daných dat, jen pokud zvolenému modelu odpovídají;
• závěry statických šetření na vzorcích konktrétních souborů dat může dát matematická statistika;
• i to, zdaje takový popis adekvátní pro konkrétní výběr dat, je možné podpořit nebo zavrhnout pomocí metod matematické statistiky.
Než se do takového složitého programu pustíme, zastavme se u prvního bodu.
9.2. Terminologie. Statistikové zavedli veliké množtví názvů a budeme si je muset osvojit. Základním východiskem je statistický soubor, což je přesně definovaná množina základních statistických jednotek. Ty mohou být dány buď výčtem nebo nějakými pravidly v rámci většího souboru. Na každé statistické jednotce měříme jeden nebo více statistických znaků, přitom ovšem chápeme „měření" velice široce.
Např. souborem mohou být všichni studenti dané univerzity, každý zvlášť je pak statistickou jednotkou. O těchto jednotkách pak můžeme schraňovat mnoho znaků - např. všechny číselné hodnoty zjistitelné z informačního systému, jakou mají jednotliví studenti nejraději barvu, co snědli večer před poslední písemkou, atd.
Základním objektem pro zkoumání jednoťlivých znaků je pak soubor hodnot. Zpravidla jej máme ve formě uspořádaných hodnot. Uspořádání je buď dáno přirozeně (když jsou hodnotami např. reálná čísla) nebo je můžeme zavést pro určitost (třeba když budeme sledovat barvy, tak je můžeme vyjdřovat v RGB standardu a řadit podle tohoto příznaku). Můžeme pracovat i s hodnotami neuspořádanými.
Protože smyslem statistického popisu je srozumitelně a přehledně sdělit něco o celém souboru, budeme jistě chtít umět jednotlivé hodnoty nějak porovnovávat a poměřovat. Je tedy podstatné mít k tomu dispozici nějaké měřítko.
^^mm^^_——MĚŘÍTKA ZNAKŮ ^mm^m.,.
Podle toho jakého charakteru jsou hodnoty, hovoříme o měřítku:
• nominálním, kdy mezi hodnotami není žádný vztah, jde pouze o četnosti možných hodnot (např. politické strany v ČR nebo přednášející na univerzitě při zkoumání jejich obliby);
• ordinálním, kdy platí totéž jako předchozí, ale s přidaným uspořádáním (např. počet hvězdiček u hotelů v turistických průvodcích);
• intervalovém, kdy jde o číselné hodnoty, ale jde o porovnání velikostí, nikoliv absolutní hodnotu (např. u měření teplot je poloha nuly zpravidla dohodnuta, ale není podstatná);
• poměrovém, kdy máme pevně stanovené měřítko a nulu (např. většina fyzikálních nebo ekonomických veličin).
9.3. Třídění hodnot. V dalším budeme pracovat se souborem hodnot x\,X2,... ,xn, které lze uspořádat a které vznikly měřením na n statistických jednotkách, a uspořádáme je do uspořádaného souboru hodnot
(9.1) X(i),X(2),...,X(„). Číslo n nazýváme rozsah souboru.
a před tím zahodil druhý, resp. třetí, resp. čtvrtý sáček. Pravděpodobnost vytažení bílé koule z prvního sáčkuje P{A\) = -\ ■ \ (jev A2 je dán tím, že současně nastaly dva nezávislé jevy a to, že vytáhl první sáček a že z prvního sáčku vytáhl bílou kouli), podobně P (A2) = \ ■ f, P(A3) = \-\, P(A4) = i • I. P (A) = P(AO + P(A2) + P(A3) + P(A4) = ^. Všimněme si, že pravděpodobnost P (A) nemůžeme počítat klasickou pravděpodobností, tedy prostým podělením počtu bílých koulí ku počtu všech koulí, protože například pravděpodobnost vytažení dané koule v prvním sáčku je dvojnásobná oproti vytažení dané koule ze čtvrtého sáčku. Pro podmíněné pravděpodobnosti pak platí P(Al\A) = P(Al)/P(A) = ±, P(A2\A) = ±, P(A3\A) = ±, P(A4\A) = ^.Označíme ještě písmenem B jev, že Mirek po zahození jednoho ze sáčků vytáhne bílou 3kouli a znovu budeme chtít použít vztah (5). Zbývá ještě dopočítat P(B\At), i = 1,... 4. Jev P{B\AX) rozdělíme na tři disjunktní jevy B2, B3, B4, totiž že druhá vytažená koule byla z druhého, resp. třetího, resp. čtvrtého sáčku. Celkem
P(B\A{) = />(£2|A1)+JP(£3|A1)+JP(£4|A1) = ^+^+^ = \
Obdobně
P(B\A2) P(B\A3) P(B\A4)
II _i_ II _i_ II
32i~33i~34
II _1_ 11 _1_ II 32i~34i~34
II _1_ 11 _1_ II 32~l~34~l~33
13
36' 1
2' 19
36'
Celkem pak
P(B\A) = P(B\Ai)P(Ai\A) + P(B\A2)P(A2\A)
+ P(B\A3)P(A3\A) + P(B\A4)P(A4\A) _ 4 3 13 9 1 2 19 3 _ 19 ~ 9 TT + 36 22 + 2 TT + 36 22 ~ 44
□
9.4. Určete konstantu a tak aby funkce /(*) =
0 pro x < 1
a ln(x) pro 1 < x < 2 0 pro 2 < x
zadávala hustotu pravděpodobnosti nějaké náhodné veličiny.
Řešení. Podmínka na to, aby zadaná funkce zadávala hustotu pravděpodobnosti je
f(x) = 1
Í
J —c
549
KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY
Pokud pracujeme s rozsáhlými soubory znaků, které ale připouští jen málo hodnot, je nejjednodušší uvádět pouze četnosti výskytu. Např. při průzkumu preferencí politických stran nebo u prezentace kvality hotelové sítě uvádíme u každé možné hodnoty počet jejích výskytů.
Pokud je možných hodnot mnoho (nebo dokonce připouštíme spojitě rozprostřené reálné hodnoty), dělíme často možný rozsah hodnot na vhodný počet intervalů a o statistickém znaku uvádíme četnost hodnot v daných intervalech. Intervalům se často říká třídy a počtu znaků ve třídě pak třídní četnosti. Používáme také kumulativní četnosti a kumulativní třídní četnosti, které pro danou třídu vznikají prostým součtem třídních četností s hodnotami nejvýše jako má ta daná.
Nejčastěji pak uvažujeme střed a; dané třídy za hodnotu, která ji reprezentuje a hodnota a;n;, kde n; je četnost výskytu této třídy představuje celkový příspěvek této třídy. Velmi často také místo četností zobrazujeme relativní četnosti a;/«, resp. relativní kumulativní četnosti.
Graf, který na jedné ose vynáší intervaly jednotlivých tříd a nad nimi obdélníky s výškou rovnou četnosti se nazývá histogram. Obdobně se znázorňuje kumulativní četnost.
Na obrázku jsou histogramy souborů o rozsahu n — 500, které vznikly náhodným generováním dat s různými standardními rozděleními (časem jim budeme říkat normální, x 2 a studentovo)
Bude potřeba spočítat / ln(x) dx:
J ln(x) dx = x ln(x) — J 1 dx = x ln(x) — x = x(ln(x) — 1). Celkem
f{x) = / aln(x) = a[x(ln(x) - l)}\ = a(21n(2) - 1),
-oo Jl
tedya = itaľkr- D
9.5. V lese, jehož hranice tvoří na mapě pravidelný šestiúhelník se ztratilo dítě. Předpokládejme, že pravděpodobnost toho, že dítě je v určité části lesa, je úměrná pouze velikosti této části, nikoliv jejímu umístění.
• Jaké je rozdělení pravděpodobnosti vzdálenosti dítěte od zvolené strany (přímky) lesa
• Jaké je rozdělení pravděpodobnosti vzdálenosti dítěte od nej-bližší strany lesa.
vytvořŘegení.
histogramy a říci —Mdněji, co ukazují
• Necht a je strana šestiúhelníka. Pak rozdělení pravděpodob-
nosti je
0
4
9a2
pro x < 0 x + pro 0 < x < j\/3a
éix + ^r pro\V3(
9a
a < x <
0
VTa Pr°2
pro x > \Í3a
9.4. Míry polohy statistických znaků. Chceme-li vyjádřit veli-kost hodnot, kolem kterých se jednotlivá pozorování ^f^^^^ znaků shromaždújí používáme většinou pojmy z ná-^^Ä^^fe- sledující definice. Budeme teď pracovat se znaky v poměrových (nebo případně intervalových) měřítcích.
Uvažme (netříděný) soubor (x\,..., x„) hodnot měřeného znaku pro všechny zpracovávané statistické jednotky.
j Průměry ^.m—>»~—
pro část a.
• Spočtěme nejprve distribuční funkci F hledaného rozložení náhodné veličiny X udávající vzdálenost dítěte od nejbližší strany lesa. Vzdálenost se může pohybovat v intervalu I =
(0, ^-a). Pro y e I potom máme
Definice. Průměr (nebo také výběrový průměr) je dán
j n j m
I
i=\
7=1
Geometrický průměr je dán
Fiy) = P[X lirr3
Derivováním pak obdržíme hustotu pravděpodobnosti: 0 pro x < 0
■ x "3 pro 0 < x < ^itr3 pro x > l^r3
f (x)
0
□
9.7.
Stanovte hodnotu parametru a e (' 0
f (x)
ax 0
pro pro pro
R tak, aby funkce
x < 0 0 < x < 3 x > 3
zadávala hustotu pravděpodobnosti náhodné veličiny X. Určete distribuční funkci, hustotu pravděpodobnosti a střední hodnotu rozdělení objemu krychle, jejíž délka hrany je náhodná veličina s hustotou pravděpodobnosti danou funkcí /.
Řešení. Jednoduše a = |. Distribuční funkce náhodné veličiny X je tedy Fx(t) = jjt3 pro t e (0, 3), pro menší t je tato funkce nulová, pro větší rovna 1. Označme Z = X3 náhodnou veličinu označující objem krychle. Ten je v intervalu (0, 27), pro t e (0, 27) a distribuční funkci F z náhodné veličiny Z tedy můžeme psát Fz (t) = P [Z < t] = P [X3 < t] = P[X < yYt] = Fx(yYt) = jjU hustota pravděpodobnosti je pak f z (t) = 27 na intervalu (0, 27), jinak nula, jedná se tedy o rovnoměrné rozdělení pravděpodobnosti na daném intervalu, střední hodnota j e tudíž 13, 5. □
9.8. Stanovte hodnotu parametru a e M tak, aby funkce
0 pro x
f (x) ~-
0 pro x < 0 ax pro 0 < x < 3 0 pro x > 3
zadávala hustotu pravděpodobnosti náhodné veličiny X. Určete distribuční funkci, hustotu pravděpodobnosti a střední hodnotu rozdělení obsahu čtverce, jehož délka hrany je náhodná veličina s hustotou pravděpodobnosti danou funkcí /.
551
KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY
Protože jak standardní velikost v W tak výběrový průměr jsou invariantní vůči posunutím o konstantní hodnotu, bude se tak jistě chovat i směrodatné odchylka, tj. pro neuspořádaný soubor znaků
y — (xi + c, X2 + c, ..., xn + c)
bude vždy platit také Sy — Sx.
Někdy se ve jmenovateli zlomku používá (n — 1), důvod uvidíme později. V případě třídních četností n j hodnot a j pro m tříd dává stejný výraz hodnotu rozptylu
Řešení. Budeme postupovat jako v předchozím příkladě. Opět snadno
j m
ale v praxi se doporučuje používat tzv. Shepardovu korekci, která S2 zmenší o h2/12, kde h je šířka stejných intervalů definujících třídy hodnot.
Dále se ještě můžeme potkat s tzv. rozpětím výběru R — x(n) — X(i) akvartilovým rozpětím Q — Qj, — Q\.
Používá se také tzv. průměrná odchylka, která je dána průměrnou vzdáleností hodnot od mediánu
1 "
i = \
Následující věta podává zdůvodnění, proč tyto míry variability volíme:
Věta. Funkce S(t) — (1/n) 2~21=i(xi ~ r)2 nabývá svého minima pro t — x, tj. pro výběrový průměr.
Funkce D(t) — (1/n) YH=i \xi ~ rl nabývá svého minima pro t — x, tj. pro medián.
Důkaz. Protože je součet vzdáleností všech hodnot od výběrového průměru nulový, dostáváme přímým výpočtem
Y^(xí -t)2 = J2((xí -x)2 + (x-t)2 - 2(xt - x)(x-t))
i=\ i=\
n
— n(x - i)2 + ^(x;- - x)2, i = \
což ověřuje první tvrzení.
U druhého si musíme dát pozor na definici mediánu. Součet si za tím účelem přeskládáme tak, abychom vždy postupně sčítali první s posledním sčítancem, pak druhý s předposledním atd. V prvním případě tedy jde o výraz |x(i) — t\ + |x(„) — t\, a ten bude roven vzdálenosti |x(„) — x(i), pokud bude t uvnitř rozsahu hodnost, a bude ještě vetší jinak. Další dvojice v součtu nám stejně dá |x(„_i) — X(2), pokud bude xq.) < t < X(„_i) a bude větší jinak. Postupně tedy požadavek na minimahzaci součtu povede právě na t — x. □
V praxi potřebujeme poměřovat variabilitu různých souborů hodnot znaků různých statistickcých jednotek. Pro tento účel je vhodné relativizovat měřítko a používáme proto tzv. variační koeficient daného souboru x
Vx =
x
Tuto relativní míru vairability můžeme chápat v procentech směrodatné odchylky ve vztahu k aritmetickému průměru x.
zjistíme a
\. Distribuční funkce náhodné veličiny X je tedy
Fx(i) = \t2 pro ř e (0, 3), pro menší ř je tato funkce nulová, pro větší rovna 1. Označme Z = X2 náhodnou veličinu označující obsah čtverce. Ten je v intervalu (0, 9), pro t e (0, 9) a distribuční funkci Fz náhodné veličiny Z tedy můžeme psát Fz (t) = P [Z < ř] = P [X2 < ř] = P[X < Vř] = Fx{\/t) = \t, hustota pravděpodobnosti je pak fz(t) = \ na intervalu (0, 9), jinak nula, jedná se tedy o rovnoměrné rozdělení pravděpodobnosti na daném intervalu, střední hodnota je tudíž 4,5. □
9.9. Náhodně rozřízneme úsečku délky l na dvě části. Určete distribuční funkci a hustotu pravděpodobnosti rozdělení obsahu obdélníka, jehož délky stran jsou rovny délkám takto vzniklých úseček.
Řešení. Spočítejme hledanou distr. funkci. Označme ještě X náhodnou veličinu s rovnoměrným rozložením na intervalu (0, l) udávající délku jedné ze stran (délka druhé je pak l — X). Obsah obdélníka 5, tedy součin x(l — x) pro x e (0, l) může zřejmě nabývat hodnot (0, Z2/4). Volíme-li d e (0, Z2/4), můžeme psát
F(d) = P[S 4
Hustotu pravděpodobnosti pak dostaneme derivací:
0 pro x < 0
*<*) = ■ íyfe pro
0 pro
0<*<í x>-
□
9.10. 4. Nezávislé náhodné veličiny X a Y mají následující hustoty pravděpodobnosti:
fx(t)
0 pro t < 0
1 pro 0 < t < 1 0 pro 1 < t
fy (t)
0 pro x < 0 2t pro 0 < t < 1 0 pro 1 < t
552
KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY
9.7. Šikmost rozložení hodnot znaků. Pokud jsou rozloženy znaky našeho souboru naprosto symetricky kolem výběrového průměru, bude zejména platit
Často ale potkáváme rozložení hodnot splňujících
x > x > x,
např. to je běžné u rozložení mezd v populaci. Docela užitečnou charakteristikou v tomto směru je tzv. Pearsonův koeficient, který je dán vztahem
x — x
" = 3—
a můžeme z něho usoudit relativní míře i charakteru zešikmení. Zejména si všimněme, že směrodatná odchylka je vždy kladná, takže již znaméko nám ukazuje, kterým směrem k zešikmení dochází.
„^^^■■■•■■J kvantilové koeficienty šikmosti |__«
Podrobnější informaci v tomto směru dávají tzv. kvantilové koeficienty šikmosti
„ X\ — p + Xp
X\—P xp
pro každé 0 < p < 1. Jejich význam je zřejmý, když čitatel zlomku vyjádříme jako (x\-p — x) — (x — xp).
Specielně dostáváme tzv. kvartilový koeficient šikmosti při volbě p — 0, 25.
9.8. Diagramy. Pro rychlé vstřebávání složitěji strukturovaných i~$> _ informací je člověk skvěle vybaven zrakově.
Proto se pro zobrazení statistiky jednotlivých znaků nebo jejich korelací používá mnoho stan-t//// dardizovaných nástrojů. Jedním z nich jsou tzv. krabicové diagramy.
„_4 Krabicový diagram
Na obrázku je zobrazen histogram a krabicový box stejného souboru hodnot.
Střední linka je medián, kraje boxu jsou kvartily, „packy" ukazují 1,5 kvartilového rozsahu, ne však víc než kraje rozsahu výběru, případné hodnoty mimo jsou přímo naznačeny body.
Běžné zobrazovací nástroje nám umožnějí dobře vidět případné závislosti dvou výběrů zjištěných znaků. Např. na dvou obrázcích níže jsou za souřadnice voleny hodnoty ze dvou chybí obrizky, nejspíš nezávislých, resp. závislých výběrů z tzv. normálních rozdělení se
budeme chht nejakou J i ľ J J
malou matici obrázku, střední hodnotou 1 a rozptylem 1.
jak u Zváry, Štěpána na str. 149
Určete distribuční funkci náhodné veličiny udávající obsah obdélníka o stranách X a Y. O
Řešení.
0 pro t < 0
FY (ŕ) = • 2t - t2 pro 0 < t < 1
1 pro 1 < t
□
9.11. Nechť X, Y jsou nezávislé náhodné veličiny, přičemž X má rovnoměrné rozdělení pravděpodobnosti na intervalu (0, 2), F je pak dána následující hustotou pravděpodobnosti:
f (x)
0 pro x < 0 2x pro 0 < x < 1 0 pro x > 1.
Určete pravděpodobnost, že Y je menší než X2.
Řešení. Protože X a Y jsou nezávislé náhodné veličiny, je sdružená hustota pravděpodobnosti fx,Y) : M2 ^ M2 veličiny (X, Y) dána součinem hustot pravděpodobnosti fx veličiny X a fY veličiny Y, tedy
f(X,Y)(u, V)
Mu) ■ Mv) = \ ■ 2v = v pro(M, v) e (0, 2) x (0, 1),
0 jinak. Hledaná pravděpodobnost P je pak dána integrálem hustoty
pravděpodobnosti f(xj) přes tu část roviny O, kde je Y < X
2.
//
l2\0
f(xj) dxdy = \- f(x,Y) dx dy = 1
i f
JO Jx2
y dy dx = -.
2 5
□
9.12. Nechť X, Y jsou nezávislé náhodné veličiny, přičemž X je dána následující hustotou pravděpodobnosti:
fix)
0 pro x < 0 2x pro 0 < x < 1 0 pro x > 1,
veličina Y pak touto hustotou pravděpodobnosti:
/(*) =
0 pro x < 0 | pro 0 < x < 2 0 pro x > 2.
Určete pravděpodobnost, že Y je větší než X2.
Řešení. f(x,Y)(u, v) = mi;, pro (u, v) e (0, 1) x (0, 2), f(x,Y)(u, v) 0 jinak. Pro hledanou pravděpodobnost P pak máme
fl r2 n
f / xydydx = —. o Jx2 12
O
□
553
KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY
9.9. Entropie. Variabilitu potřebujeme vyjadřovat i u znaků s no-jjí' i, minálním měřítkem, např. ve statistické fyzice nebo teorii "tívjfe informace. K dispozici máme jen třídní četnosti a můžeme r\Kw tedy použít princip klasické pravděpodobnosti (viz čtvrtá W'1 část první kapitoly), kdy relativní četnost ř-té třídy, pí — vnímáme jako pravděpodobnost, že náhodně vybraný prvek bude v této třídě.
Zamysleme se, jak definovat charakteristiku Hx výběru X o rozsahu n ve tvaru
Hx = J2píF(Pí),
kde F je zatím neznámá funkce. Chtěli bychom přitom, aby se tato charakteristika chovala tak, že když zkombinujeme X s dalším výběrem Y o rozsahu m tak, že budeme v novém výběru Z uvažovat dvojice prvků (x, y) z původních výběrů, tak dostaneme Hz — H x + Hy.
Máme tedy Y11 Pí — Yľj — 1> relativní třídní četnosti pro Z
jsou
rij = - = ptqj
nm
a požadujeme tedy rovnost (rozsahy součtů jsou zřejmé z kontextu) J2pi)(E/>^)) + (l>)(E^/^)
a dostáváme vztah
J^PiqjFipiqj) = J2piqj(F(pi) + F(qj)).
ij ij
Je zřejmé, že tomuto požadavku vyhovuje jakýkoliv konstantní násobek logaritmu při kterémkoliv základu (a lze ukázat, že jiná spojitá řešení F neexistují).
j Entropie
9.13. Nechť X, Y jsou nezávislé náhodné veličiny, přičemž X je dána následující hustotou pravděpodobnosti:
0 pro x < 0
Míru variability znaků v nominálním měřítku vyjadřujeme pomocí entropie. Je dána vztahem
I
E
-ln(-),
n n
kde k je počet tříd ve výběru. Kromě přirozeného logaritmu se často také setkáváme (např. v informatice) se stejným vztahem ale s logaritmem při základu 2. ^^^^^^^^j
fix)
Y pro 0 < x < 3
0 pro x > 1, veličina Y pak touto hustotou pravděpodobnosti:
/(*)
0 pro x < 0 | pro 0 < x < 2 0 pro x > 2.
Určete pravděpodobnost, že F je větší než X3.
O
Řešení.
JO Jx2
^4
xy dy dx = -.
y 12
□
9.14. Hodíme třemi mincemi. Určete korelační koeficient veličiny X udávající počet padlých líců dohromady na první a druhé minci a veličiny Y udávající počet padlých líců dohromady na druhé a třetí minci.
Řešení. Nejprve sestavíme pravdivostní tabulku vektorové diskrétní náhodné veličiny (X, Y), ze které snadno určíme pravděpodobnostní rozdělení veličin, které budeme potřebovat (samozřejmě to můžeme udělat i bez tabulky):
Y X 0 1 2
0 i 8 1 8 0
1 1 8 1 4 i 8
2 0 1 8 1 8
Diskrétní veličiny X a Y mají stejné rozdělení pravděpodobnosti a to hodnotu 0 nabývají s pravděpodobností 1/4, hodnotu 1 s pravděpodobností 1/2 a hodnotu 2 s pravděpodobností 1/4. Veličina XY pak může nabývat hodnot 0, 1, 2, 4 a to postupně s pravděpodobnostmi 3/8, 1/4, 1/4, 1/8 Nyní spočítáme střední hodnoty veličin X, X2, Y, Y2,XY:
1
E(X)
E(X2)
E(XY)
-E(Y) E(Y2)
1 1 - + l-- + 2-- = l 4 2 4
1 1 13 _ + 1 . _ + 4 . _ = _
2 4 2
1 1
- + 2 •- + 4 • 4 4
0
4
0-1 + 1
5 4
554
KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY
vložit obrázek, jak se entropie mění u souboru 100 znaků se dvěma tndními četnostmi v závislosti na velikosti jedné z nich
Všimněme si, že nezávisle na zvoleném základu logaritmu má Hx nulovou hodnotu, pokud mají všechny znaky ve výběru stejnou hodnotu. Koeficient — 1 se volí proto, aby entropie vycházela kladná. Často se také místo Hx pracuje s veličinou
V tomto tvaru se pěkně spočítá, že pro výběr X sk stejně velkými tndními četnostmi je eHx — (í^)-*)* = k, nezávisle na velikosti výběru.
2. Pravděpodobnost
Před dalším čtením lze čtenářům vřele doporučit zopakování obsahu čtvrté části první kapitoly (tj. odstavce začínající na straně 16). Tehdy jsme pracovali převážně s tzv. klasickou konečnou pravděpodobností a zavedli jsme základy formalismu, který nyní rozšíříme. Hlavní změnou bude, že náš základní prostor ň už nebude obecně obsahovat jen konečně mnoho prvků (ve skutečnosti nemusí být ani spočetný). Připomeňme, že v našich úvahách o tzv. geometrické pravděpodobnosti na konci čtvrté části první kapitoly jsme potřebovali jako základní prostor pro popis jevu vhodnou část euklidovského prostoru a jevy pak byly vhodně vybrané podmnožiny. Tedy samozřejmě samé nespočetné množiny.
Začneme jednoduchým, stále ještě diskrétním, ale nekonečným příkladem, ke kterému se ve výkladu budeme občas vracet.
9.10. Proč nekonečné množiny jevů? Představme si experiment, ve kterém opakovaně házíme mincí dokud nepadne líc. Ráme se, jaká je pravděpodobnost, že budeme házet alespoň 3-krát nebo právě 35-krát nebo nejvýš 10-krát apod.
Elementární jevy bychom tedy mohli uvažovat ve tvaru wK e N>i U{oo}, které slovně vyjadřujeme „líc padne poprvé právě v k-témhodu". Všimněme si, že j sme přidali & — oo, protože formálně nemůžeme vyloučit, že budou vždycky padat pouze ruby mince.
Zjevně můžeme takový problém dobře zvládat, když vyjdeme z klasické pravděpodobnosti 0,5 pro obě možné strany mince při jednom hodu, nemůžeme ale v abstraktním modelu omezit celkový počet hodů nějakým pevným přirozeným číslem N. Na druhé straně, očekávaná pravděpodobnost, že padne ve všech prvních (k — 1) pokusech vždy rub v n > k pokusech celkem, je dána zlomkem
in—k
— = 2~k, 2"
kde v čitateli je počet možností příznivých z n nezávislých hodů (tj. možností jak rozestavit libovolně dvě hodnoty do n — k zbývajících pozic) a ve jmenovateli je počet všech možností výsledků. Podle očekávání tato pravděpodobnost nezávisí na zvoleném n a platí Y1T=\ -~k = 1- Musí být proto pravděpodobnost neustálého opakování rubu nulová.
Můžeme tedy nyní zavést skutečně pravděpodobnost na základní prostoru Q s elementárními jevy wK, kterým přiřazujeme pravděpodobnost 2~k. Dostaneme tak pravděpodobnostní prostor ve smyslu následujících definic.
K tomuto jednoduchému ilustračnímu přikladu se ještě budeme vracet.
Máme tedy
a2(X) =g2(Y) = E(X2) - [E(X)Y
cov(X, Y)
Celkem
PX,Y
E(XY) - E(X)E(Y)
cov(X, Y) 1
(x(X)-a(Y) 2
□
9.15. Dvakrát hodíme šestibokou kostkou. Určete korelační koeficient veličiny X udávající počet padlých sudých čísel a veličiny Y udávající počet padlých lichých čísel. O
9.16. Pomocí distribuční funkce standardního normálního rozdělení určete pravděpodobnost, že při 1600 hodech mincí bude rozdíl mezi počtem padlých hlav a orlů alespoň 82.
Řešení. Označíme-li jako X náhodnou veličinu udávající počet padlých hlav, tak X má binomické rozložení pravděpodobnosti 5/(1600, 1/2) (se střední hodnotou 800 a směrodatnou odchylkou
20) a tudíž lze distribuční funkci veličiny
X-800 20
lze pro dané velké
n = 1600 podle Moivreovy-Laplaceovy věty velmi dobře odhadnout jako distribuční funkci <ř standardního normálního rozdělení. Hledaná pravděpodobnost je tedy
P[159 3100] = P[
X
50 1 - d>(2)
3000 3100 - 3000 > -
50
P[-
X-3000
50
0, 0228.
>2]
□
9.12. Pravděpodobnostní prostor. Teď popíšeme, co bude v našem matematickém modelu pravděpodobnost. Nejdříve ale ještě připomeneme názvosloví užívané už v první kapitole.
J Terminologie
Používáme následující názvy týkající se jevů:
• celý základní prostor £2 se nazývá jistý jev, prázdná podmnožina 0 e A se nazývá nemožný jev,
• jednoprvkové podmnožiny {co} e Q se nazývají elementární jevy,
556
KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY
• společné nastoupení jevů Ai, i e I, odpovídá jevu ri/e/A/, nastoupení alespoň jednoho zjevů Ai, i e I, odpovídá jevu
• A, B e A jsou neslučitelné jevy, je-li A n B = 0,
• jev A má za důsledek jev B, když A C B,
• je-li A € .4, pak se jev B = Í2 \ A nazývá opačný jev k jevu A, píšeme B = Ae.
Hned v prvním odstavci této části jsme viděli příklad pravděpodobnosti definované na nekonečné množině elementárních jevů. Obecně budeme pravděpodobnost chápat takto:
—Pravděpodobnost |,._^
Definice. Pravděpodobnostní prostor je jevové pole A podmnožin základního prostoru £2, na kterém je definována skalární funkce Pi^l^Rs následujícími vlastnosti:
• P je nezáporná, tj. P(A) > 0 pro všechny jevy A,
• P je spočetně aditivní, tj. P(U;e/A;) = 2~2iei P(Ai), pro každý nejvýše spočetný systém po dvou neslučitelných jevů,
• pravděpodobnost jistého jevu je 1.
Funkci P říkáme pravděpodobnost na jevovém poli (£2, A).
Z definice okamžitě vidíme, že pro opačné jevy platí
P(AC) = 1 - P (A).
Podobně zůstávají v platnosti důkazy, které jsme o sčítání pravděpodobností odvodili pro konečné systémy (protože vztahy stejně vždy obsahovaly pouze konečně mnoho množin - promyslete si podrobněji!) Zejména tedy platí pro libovolnou množinu k jevů A i vztah
k k-l k
P(uf=1 At) = P(Ai) - E E P(Ai n Ai>
i — l i — l j—i-\-l
k-2 k-l k
Z = l + l t=j+\
+ (-i)k-1P(AlnA2n---nAk).
Stejně zůstává beze změny definice stochasticky nezávislých jevů, která vystihuje představu, že u nezávisle probíhajících jevů se jejich pravděpodobnosti mají násobit.
_m^mmStochastická nezávislost ^m^b^b^,.
Jevy A a B jsou stochasticky nezávislé, jsetliže platí
P(A n B) = P(A)P(B).
Je samozřejmé, že jev jistý a jev nemožný jsou stochasticky nezávislé na jakémkoliv jiném jevu.
Připomeňme, že výměnou jednoho z jevů A; v systému po dvou stochasticky nezávislých jevů A\, A2, dostaneme opět systém stochasticky nezávislých jevů, a platí vztah (1.12) ze strany 22
P(Ai U ■ ■ ■ U At) = 1 - P(A\ n • • • n Ack) =
= l-(l-P(Ai))...(l-P(Ajt)).
557
KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY
Základním příkladem pro nás i nadále zůstává tzv. klasická konečná pravděpodobnost, kterou jsme se při tvorbě matematického modelu inspirovali. Připomeňme, že v tomto případě je £2 konečná množina, jevovým polem A je systém všech podmnožin v ň a klasická pravděpodobnost je pravděpodobnostní prostor (£2, A, P) s pravděpodobnostní funkcí P : A -> M,
P(A) = —.
mi
To odpovídá představě o relativní četnosti p a jevu A při náhodném výběru prvků z množinu £2.
Naše definice pravděpodobnosti zajišťuje rozumné chování na rostoucích či klesajících spočetných řetězcích jevů:
9.13. Věta. Uvažme pravděpodobnostní prostor (Q, A, P) a neklesající řetězec jevů A\ C A2 C .... Pak platí
lim P(Ai).
Pokud je naopak A\ D A2 D A3 D potom platí
KnA0=£s>p(Ai)-
Důkaz. Přepíšeme uvažované sjednocení jevů A — pomocí neslučitelných jevů
Ai = Ai \ Ai-
definovaných pro všechna / = 2, 3,..., a klademe A\ — A\. Potom
, oo \ oo k
P(A) = p(\jÄi \ = £p(Ä/) = tHm £ P(Äi).
\' = 1 7 i = l !=1
Přitom ale pro konečné součty máme
oo k
Y_ P(Äi) = P(Ai) + £(P(Ať) - P(Ať_i)) = P(A„)
i = l i =2
díky předpokládaným vztahům A;_i c A;. Tím jsme dokázali první tvrzení věty.
Ve druhém tvrzení můžeme přejít od jevů A; k jejich kom-plementům B i — Act. Ty pak splňují předpoklady první části věty. Komplement k uvažovanému průniku je
/ OO \ c 00
=1
Druhé tvrzení nyní plyne ze vztahu
P (A) = 1 - P(B) = lim (1 - P(5;)) = 1 - lim P(5;)
í-»0o í-»0o
a důkaz j e ukončen. □
9.14. Podmíněná pravděpodobnost. Popřemýšlejme nad následujícím úkolem. V předmětu X obvykle uspěje u zkoušky 40% studentů, v předmětu Y obvykle uspěje 80% studentů. Zaslechneme-li na chodbě jednoho ze studentů obou předmětů říkat, že u zkoušky uspěl, s jakou pravděpodobností šlo o předmět XI
Jak jsme stručně zmínili už v odstavci ?? na straně ??, umíme takové úlohy formalizovat následovně.
558
KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY
Definice. Nechť H je jev s nenulovou pravděpodobností v jevovém poli a v pravděpodobnostním prostoru (£2, a, P). Podmíněná pravděpodobnost P(A\H) jevu A e A vzhledem k hypotéze H je definována vztahem
p (A n H)
P(A\H) = —---.
P (H)
Definice odpovídá představě z klasické pravděpodobnosti, že jevy A a H nastanou zároveň, za předpokladu, že jev// nastal, s pravděpodobností P (A n H)/P(H).
Je také vidět přímo z definice, hypotéza H a jev A jsou nezávislé tehdy a jen tehdy, je-li P (A) — P(A\H).
Na první pohled se může zdát, že zavedením podmíněné pravděpodobnosti jsme nic nového nepřinesli. Ve skutečnosti jde o velice důležitý přístup, ke kterému se budeme vracet i ve statistice. Hypotéza totiž může mít charakter tzv. apriorní (tj. předem předpokládané) pravděpodobnosti a výsledné pravděpodobnosti pak říkáme aposteriorní (tj. bereme ji jako důsledek našeho předpokladu).
Přímo z definice vyplývá následující výsledek.
Lemma. Nechť jev B je disjunktním sjednocením jevů B\, Bi,...,Bn. Potom
n
(9.2) P(A\B) =^P(A\Bí)P(Bí\B)
i=\
Důkaz. Všimněme si nejprve, že jevy AC\B\, AC\B2,... ,An Bn jsou rovněž disjunktní. Můžeme tedy psát
P (A n (Bi U • • • U b„))
P(A\Bi U • • • U B„) — —-—--—
P(SlU---US„)
_ P ((A n Bi) u (A n b2) u • • • u (A n b„))
= P(B)
_ ELiPJAnBi) PjBj) P(Bi) ' P(B)
n
= ^P(A\Bí)P(Bí\B).
i=\
□
9.15. Bayesovy věty. Přepsáním formule pro podmíněnou pravděpodobnost dostáváme
P(A DB) — P(B n A) = P(A)P(B\A) = P(B)P(A\B).
Odtud okamžitě plyne velice důležitý důsledek: mm^^mmm>——a_^.( Bayesovy věty ^^■_h.^_mba>
Věta. Pro pravděpodobnost jevů A a B platí P(A)P(B\A)
(9.3) P(A\B) =
(9.4) P(A\B)
P(B)
P(A)P(B\A)
P(A)P(B\A) + P(AC)P(B\AC)
559
KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY
Důkaz. První tvrzení je jen přepsáním výpočtu před větou. Abychom dostali druhé tvrzení všimněme si, že
P(B) = P(B n A) + P(B n Ac),
proto můžeme dle definice podmíněné pravděpodobnosti dosadit P(B) = P(A)P(B\A) + P(AC)P(B\AC) do první Bayesovy věty a dostáváme právě druhou Bayesovu větu. □
Dodejme ještě, že vztahům z předchozí věty se také říkává Bayesovy vzorce a že druhý z nich bývá často formulován v lehce obenějším tvaru, který se dokáže stejným způsobem jako (9.4):
Nechť je základní prostor Q sjednocením disjunktních jevů A\,...A„. Pak pro libovolné i e {1,... ,n] platí
P(B\At)P(At)
(9.5) P(Ai\B)
Eľ=i PiB^PiAi)
9.16. Poznámky. Nyní se můžeme snadno vypořádat s úvodní otázkou z minulého odstavce. Dotaz si nejprve malinko upřesníme. Uvažujeme jev A představující „student u zkoušky uspěl" a jev B, který říká „student byl zkoušen z předmětu X". Předpokládáme přitom, že pravděpobnosti zkoušení z obou předmětů jsou stejné, tj. P(B) = PiPr) = 0.5. Zatímco hledaná pravděpodobnost P(B\A) je zatím spíše nejasná, pravděpodobnost P(A\B) = 0.4 je dána přímo v zadání.
To je typický případ použití Bayesových vzorců. Když přitom použijeme druhý z nich, vůbec nemusíme počítat P (A):
P(B)P(A\B) P(B\A) =-y_j_j_j__>-
P(B)P(A\B) + P(BC)P(A\BC) 0.5 • 0.4 1
0.5-0.4+ 0.5-0.8 3
Abychom si přiblížili roh aposteriorní pravděpodobnosti hypotézy, podívejme se ještě najeden příklad.
Řekněme, že testy připravenosti a znalostí, na základě kterých jsou studenti přijímáni na univerzitu, mají následující spolehlivost v testování inteligence osob: 99% inteligentních osob má pozitivní výsledek testu, zatímco u neinteligentních uchazečů más stále 0.5% z nich pozitivní výsledek testu. Chceme zjistit, s jakou pravděpodobností je náhodně vybraný student na univerzitě inteligentní.
Máme tedy jev A „náhodně zvolená osoba je inteligentní" a jev B „osoba prošla testem s pozitivním výsledkem". Dle druhé Bayesovy věty můžeme opět rovnou spočíst pravděpodobnost, že nastal jev A za předpokladu, že nastal jev B. Musíme jen dodat všeobecnou pravděpodobnost p = p (A), že náhodně zvolený uchazeč o studium je inteligentní.
p ■ 0.99
P (A B) =-í--.
p- 0.99 + (1 - p) ■ 0.005
V následující tabulce je spočten pro různé hodnoty p vyjádřené v jednotkách promile. V prvním sloupci tedy je výsledek za předpokladu, že je mezi uchazeči o studium každý druhý inteligentní atd.
p | 500 100 50 10 1 0.1 P(A\B) f 0.99 0.96 0.91 0.67 0.17 0.02 Pokud tedy je každý druhý uchazeč inteligentní, máme na univerzitě používající náš test 99% intelignentních studentů. Pokud ale naší představě o inteligenci odpovídá jen 10% populace a uchazeči jsou dobrým náhodným vzorkem, pak už máme na univerzitě jen zhruba dvě třetiny inteligentních studentů ...
560
KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY
Představme si ale, že obdobné testování provedeme při plošném testování výskytu nějaké nemoci, třeba HIV. Dejme tomu, že máme stejně citlivý test jako výše a prověříme jím o přestávce mezi přednáškami všechny přítomné studenty. V tomto případě bychom měli předpokládat, že paramatr p bude obdobný jako u celé populace, tj. řekněme jeden nakažený z 10000 obyvatel, což odpovídá poslednímu sloupci v tabulce. Pak ovšem je výsledek testu katastroficky nespolehlivý. Jen asi u 2 procent pozitivně otestovaných se jedná o skutečně nemocné studenty!
Všimněme si, že problém je zapříčiněn jakýmkoliv malým výskytem pozitivních výsledků u zdravých osob. I kdybychom zlepšili test tak, že bude na 100% účinný při testu pozitvní osoby, neovlivníme skoro vůbec výsledné pravděpodobnosti v tabulce.
V obou případech tedy musíme při přípravě testu dbát na to, abychom si zajistili přiměřeně vysoké p. U procesu přijímání studentů na univerzitu to asi bude dobrý marketing univerzity, který zajistí, aby se neinteligentní osoby hlásily v daleko menší míře, než je jejich výskyt v populaci. U testování chorob nejspíš půjde o souběh dalších skutečností a činností.
9.17. Borelovské množiny. Vraťme se k jednoduchému a názornému příkladu statistik kolem výsledků studentů v daném předmětu. Ten je a není podobný klasické pravděpodobnosti a s ní související statistice při házení kostkou.
Na jedné straně máme pouze konečný počet studentů a připustili jsme pouze konečný počet možných bodových hodnocení práce studenta za semestr (např. celá čísla od 0 do 20). Zároveň ale není patrně vhodné představovat si výsledky jednotlivých studentů jako analogii nezávislého házení pravidelnou kostkou. Jednak neexistuje pravidelný 21-stěn, ale hlavně by to byla skutečně divně vedená přednáška.
Na základním (konečném) prostoru £2 všech studentů máme prostě definovánu funkci bodového ohodnocení X : Q -> R, která má tu vlastnost, že můžeme modelovat pravděpodobnosti, že její hodnota při náhodném výběru studenta padne do předem zvoleného intervalu. Např. můžeme chtít modelovat pravděpodobnost, že student uspěl s hodnocením A nebo B. Pokud známe výsledky všech studentů, snadno dostaneme statistiky celého souboru, např. výběrový průměr X a směrodatnou odchylku Sx.
Patrně bychom od rozumně vedené přednášky a dobrých studentů očekávali, že nejvyšší pravděpodobnost výsledku bude ležet někde uprostřed škály v „úspěšném intervalu", zatímco ideální výsledek plného bodového zisku příliš pravděpodobný nebude. Stejně tak bude příliš mnoho hodnot X v intervalu neúspěšných hodnot na většině univerzit bráno jako výrazný neúspěch přednášejícího.
Často ale v podobných situacích máme k dispozici jen náhodně vybraných několik studentů a známe příslušné statistiky jen pro tento vybraný vzorek. Pak se můžeme dívat na příslušné hodnoty jako na vektor (Xi,..., X*) a bude nás opět zajímat jakákoliv funkce na tomto vektoru (např. některá z výše zmíněných statistik).
Je to typický příklad tzv. náhodných veličin a náhodných vektorů, jak je budeme definovat v dalším odstavci. Budeme chtít umět diskutovat pravděpodobnost, že hodnota X padne do kteréhokoliv intervalu (a,b) c R s reálnými čísly a, b a uzavřenými nebo otevřenými konci intervalu. Případně budeme potřebovat totéž pro vícerozměrné intervaly vra vektory (Xi,..., X„).
561
KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY
Zkusme tedy uvažovat číselné veličiny X na nějakém základním prostoru, tj. obyčejné funkce X : £2 -> R. Chceme pracovat s pravděpodobnostmi příslušnosti hodnoty X do předem zadaného intervalu. Musíme ^— proto uvést do souladu požadavky na pravděpodobnostní prostor všech jevových polí s vlastnostmi takových funkcí:
„ ■] borelovské množiny v Rk j—"———■—
Na prostoru Rk uvažujme nejmenší jevové pole B obsahující všechny ^-rozměrné intervaly. Množinám v B říkáme Borelovské množiny na Rk. Specielně pro k — 1 půjde o všechny množiny, které ze všech intervalů obdržíme konečnými průniky a nejvýše spočetnými sjednoceními.1
1
9.18. Náhodné veličiny. Nyní už máme všechno připraveno pro definic náhodných veličin a náhodných vektorů. Poznamenejme již předem, že pro klasickou konečnou pravděpodobnost je náhodnou veličinou každá reálná funkce X : Q -> R. Skutečně, na konečné množině £2 nabývá X jen konečně mnoho hodnot a každá podmnožina v £2 je jevem.
| náhodné veličiny a vektory ^m>—i
Definice. Náhodná veličina X na pravděpodobnostním prostoru (Q, A, P) je taková funkce X : Q -* R, že vzor Z"1 (B) patří do A pro každou Borelovskou množinu B e B na R. Reálná funkce P x (B) — P(X~1(B)) definovaná na všech Borelovských množinách B C M se nazývá rozdělení (pravděpodobnosti) náhodné veličiny X.
Náhodný vektor X — (X\,..., Xk) na (£2, A, P) je &-tice náhodných veličin Xt■■ : Q -> R definovaných na stejném základním pravděpodobnostním prostoru (£2, A, P).
Jestliže vybereme intervaly I\,..., 4 v R a definujeme množinu B — h x • • • x 4, pak jistě existuje pravděpodobnost současného výskytu všech k jevů Z; e li. Díky aditivitě funkce P tedy bude, obdobně jako ve skalárním případě, existovat reálná funkce Px(B) — P(X~1(B)) definovaná na všech Borelovských množinách B C Rk. Nazýváme ji rozdělení (pravděpodobnosti) náhodného vektoru X.
9.19. Distribuční funkce. Rozdělení náhodných veličin zadáváme nejčastěji pomocí pravidla, jak roste pravděpodobnost s přírůstkem intervalu B.
Definice náhodné veličiny zajišťuje, že pro všechny intervaly / s krajními body a, b, —oo < a < b < oo, existuje pravděpodobnost jevu P(I). Budeme ji zapisovat stručně P (a < X < b), resp. P(X < b) pokud je a — — oo, pro otevřený interval / a obdobně pro intervaly uzavřené nebo z jedné strany uzavřené. Ve speciálním případě jediné hodnoty píšeme P(X — a).
Podobně u náhodného vektoru X — (X\,... ,Xk) píšeme stručně P(a\ < X\ < b\,...,ak < Xk < bk), pro současné nastoupení jevů, kdy hodnoty Z; padnou do uvedených intervalů (které mohou být také uzavřené neohraničené apod.).
této souvislosti se často také hovoří o tzv. a-algebře Borelovsky měřitelných množin ml* a následující definici lze formulovat tak, že náhodné veličiny jsou Borelovsky měřitelné funkce.
562
KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY
Distribuční funkce
Definice. Distribuční funkcí náhodné veličiny X je funkce Fx '■ R -> [0, 1] definovaná pro všechny x € M vztahem2
Fx(x) = P(X M definovaná pro všechny x = (xi,..., xk) e Rk vztahem
Fx(x) = P(Xi < xu...,Xk [0, 1] následující vlastnosti
(1) F je neklesající funkce;
(2) F má v každém bodě x € M limitu zleva i limitu zprava;
(3) F je zleva spojitá;
(4) v nevlastních bodech má F limity
(9.6) lim F (x) = 1, lim = 0;
x=>co x^—co
(5) pravděpodobnost, že X nabývá právě hodnotu x je dána
(9.7) P(X = x) = lim F(y) - F(x).
y^x+
(6) Distribuční funkce náhodné veličiny má vždy nejvýše spočetně mnoho bodů nespojitosti.
Důkaz. Důkaz spočívá ve vcelku jednoduchým přímých výpočtech. Zejména si uvědomme, že jevy a < X < b aX < a jsou disjunktní a proto platí
P(a 0 konvergující k 0 a uvažujme jevy A„ zadané požadavkem X < x — r„. Sjednocení všech těchto jevů je právě jev A zadaný nerovností X < x. Jev A přitom pochopitelně nezávisí na volbě posloupnosti r„. Podle prvního tvrzení věty 9.13 tedy bude
P (A) = lim P(An).
n=>oo
To však podle testu konvergence funkcí pomocí posloupností (viz str. 269) znamená, že limita zleva funkce Fx v bode x existuje a je rovna P (A). To dokazuje polovinu tvrzení (2) a zároveň tvrzení (3).
Zcela obdobně můžeme pomocí zvolené posloupnosti čísel r„ definovat jevy A„ odpovídající hodnotám X„ < x + r„. tentokrát máme nerostoucí řetězec A\ D A2 D ... a jejich průnikem bude
V literatuře se stejně často potkáváme také s definicí s neostrou nerovností, tj. pravděpodobnost P(X = x) je ještě započtena také. V takovém případě platí obdobné vlastnosti jako ve větě 9.34, jen je distribuční funkce zprava spojitá apod.
563
KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY
jev X < x. Pro pravděpodobnost jevu A platí, podle druhé vlastnosti z věty 9.13,
P (A) = lim P(An) = P(X < x),
což ověřuje že limita zprava funkce F v bodě x existuje. Zároveň jsme přitom ověřili i vlastnost (5).
Limitní hodnoty z vlastnosti (4) věty se odvodí zcela obdobně s použitím věty 9.13, jak jsme výše spočetli limity zleva a zprava výše. V prvém případě půjde o jevy A„ zadané pomocí X < r„, pro jakoukoliv rostoucí posloupnost r„ -> oo. Jejich sjednocením bude jev jistý £2. Ve druhém případě půjde o jevy A„ zadané pomocí Z < r„ pro jakoukoliv klesající posloupnost r„ -> — oo a jejich průnikem bude jev nemožný.
Zbývá dokázat poslední tvrzení. Podle již dokázaných vlastností jsou body nespojitosti distribuční funkce právě ty hodnoty
x, ve kterých má náhodná veličina tuto hodnotu s nenulovou pravděpodobností, tj. P(X — x) ^ 0. Označme nyní M„ množinu těch bodů x, pro které je P(X — x) > ^. Evidentně je množina M všech bodů nespojitosti dána jako sjednocení M — Uj^2. Protože je ale součet pravděpodobností disjunktních jevů vždy nejvýše jedna, nemůže obsahovat M„ více než n — 1 prvků. Je tedy M spočetným sjednocením konečných množin a je tedy sama spočetná. □
Nyní je zřejmé, že můžeme z distribuční funkce snadno spočíst pravděpodobnost, že hodnota náhodné veličiny padne do jakéhokoliv daného intervalu. Zadává tedy skutečně distribuční funkce F x celé rozložení pravděpodobnostní náhodné vličiny X.
9.21. Diskrétní a spojité náhodné veličiny. Náhodné veličiny se -^&%Ězr&fy cnovaJí zásadně odlišně podle toho, jestli je veškerá ^r^^^í/ nenulová pravděpodobnost „soustředěna do něko--d^4|gj^, Yíka konečných hodnot" nebo je naopak „spojitě rozprostřena" po (části) reálné osy.
| Diskrétní náhodné veličiny j——
Jestliže náhodná veličina X na pravděpodobnostním prostoru (£2, A, P) nabývá jen konečně mnoha různých hodnot
xi, X2, ■ ■ ■ ,x„ e R nebo případně spočetně mnoha reálných hodnot x\, X2,..., říkáme, že jde o diskrétní náhodnou veličinu.
Definujeme pak pravděpodobnostní funkci f (x) vztahem
Protože je pravděpodobnost spočetně aditivní a jednotlivé jevy X — xí jsou disjunktní, je součet všech hodnot /(*/) dán buď konečnou nebo absolutně konvergentní řadou
I
Pro rozdělení pravděpodobnosti veličiny X platí
a tedy zejména je distribuční funkce tvaru
564
KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY
Všimněme si, že distribuční funkce F (x) diskrétní náhodné veličiny je po částech konstantní a F (x) — 1 pro x větší než všechna x;.
Každá náhodná veličina definovaná pro klasickou konečnou pravděpodobnost je diskrétní.
I když hodnoty náhodné veličiny X nejsou diskrétní, můžeme postupovat podobně. Intuitivně lze při infinitesimální změně hodnoty x o přírůstek dx uvažovat takto: hustotu fix) pravděpodobnosti pro náhodnou veličinu X si představíme jako
P(x < X < x + dx) — f(x)dx.
To znamená, že chceme pro — oo < a < b < oo
Pia < X < b) = / f(x)dx.
-ľ-
Ja
Spojité náhodné veličiny
Náhodná veličina X, pro kterou existuje její hustota pravděpodobnosti f splňující
Fx(b)= ľ fix)dx,
j — oo
se nazývá spojitá náhodná veličina.
Všimněme si, že distribuční funkce F (x) spojité náhodné veličiny X je vždy diferencovatelná a její derivace se rovná hustotě pravděpodobnosti X, tj. platí F'(x) — fix).
Samozřejmě se také můžeme setkat se smíšeným chováním u veličin, které mají část pravděpodobnosti rozprostřenu spojitě, některých hodnot ale nabývají s nenulovou pravděpo-i dobností. Představme si třeba chaotického přednášejícího, f 5 ' který s pravděpodobností p zůstává stát na místě za řečnickým pultíkem, jakmile se však odtud pohne je jeho pozice v kterémkoliv jiném místě na stupínku stejně pravděpodobná.
Bude tedy příslušná náhodná veličina udávající jeho polohu mít distribuční funkci (zavádíme si souřadice tak, že pultík je v pozici 0 a posluchárna je ohraničena hodnotami ±1)
Fit)
0 je-li f < — 1
2
1_p(f + l) je-li f e (-1,0)
p + K^it+l) je-li t >0.
Distribuční funkce takovýchto veličin můžeme často přímo vyjadřovat pomocí Riemannova-Stieltjesová integrálu F(ť) — f-oo fix)dig (x)), který jsme zavedli v odstavci 6.48 na straně 383. V předchozím příkladu bychom zvolili třeba fix) — la
gix)
-1 prox < — 1
-i
2
—- v pro — 1 < x < 0
-j^x + p pro 0 < x < 1 -4^ prox > 1.
Připomeňme, že distribuční funkce nemůže mít více než spočetně mnoho bodů nespojitosti.
9.22. Několik diskrétních rozdělení. Požadavky na vlastnosti rozdělení náhodných veličin zpravidla vychází z modelovaných situací a ve skutečnosti pak ani nemáme moc možností, jak rozdělení pravděpodobnosti může vypadat.
Uvedeme přehled nejjednodušších diskrétních rozdělení.
565
KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY
Degenerované rozdělení
Rozdělení odpovídající konstantní náhodné veličině Z = fi se nazývá degenerované rozdělení Dg(fi).
Jeho distribuční funkce Fx a pravděpodobnostní funkce f x jsou dány
Fx(t) = \A fx(t)
Nyní popišme pokus s pouze dvěma možnými výsledky, kterým budeme říkat zdar a nezdar. Pokud má zdar pravděpodobnost p, pak nezdar musí mít pravděpodobnost 1 — p.
j Alternativní rozdělení j______-í_|
Rozdělení náhodné veličiny X s dvěmi hodnotami 0 pro ne- I zdar a 1 pro zdar, přičemž zdar nastává s pravděpodobností p říkáme alternativní rozdělení A(p). Jeho distribuční a pravděpodobnostní funkce jsou tvaru:
Fx(t)
0 t < 0
1-p 0 1
p t = 1 1-p t=0 0 jinak.
i
Uvažme dále rozdělení veličiny X odpovídající n-krát nezávisle opakovanému pokusu popsanému alternativním rozdělením, přičemž naše náhodná veličina měří počet zdarů. Je tedy zjevné, že pravděpodobnostní funkce bude mít nenulové hodnoty právě v celých číslech 0,..., n odpovídajícím celkovému počtu úspěchů v pokusech (a nezáleží nám na pořadí).
J Binomické rozdělení |______
Binomické rozdělení Bi(n, p) má pravděpodobnostní funkci
fx(í) =
p)"-' t e {0, 1, jinak
i
Na obrázku jsou pravděpodobnostní funkce pro Bi(50, 0.2), Bi(50, 0.5) a Bi(50, 0.9). Rozdělení pravděpodobnosti odpovídá intuici, že nejvíce výsledků bude blízko u hodnoty np:
9.23. Poissonovo rozdělení. V praktických úlohách často úvaha o binomickém rozdělení vede k dalším modelovým případům.
Uvažme situaci, kdy do n přihrádek rozdělujeme — r vzájemně nerozlišitelných předmětů. Umístění kteréhokoliv předmětu do pevně zvolené přihrádky má pravděpodobnost 1 /n (každá z nich je stejně pravděpodobná).
KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY
Náhodnou veličinu, která popisuje počet X předmětů v jedné pevně zvolené přihrádce můžeme popsat následovně. Máme možnosti hodnot X — k, kde k — 0,..., r a pravděpodobnost jednotlivých hodnot je
k) \n) \ n) \kj nr
Jde proto o rozložení X typu Bi(r, 1/n).
S takovouto veličinou se můžeme potkat např. u popisu fyzikální soustavy s velikým počtem molekul plynu. Přihrádky představují malé objemy prostoru a sledujeme rozložení molekul. Zajímá nás pak, co se bude dít s veličinami X„, když bude vzrůstat počet přihrádek n společně s počtem předmětů r„ tak, že v průměru nám na každou přihrádku bude připadat (přibližně) stejný počet prvků X.
Zajímá nás tedy chování našeho rozdělení veličin X„ při limitním přechodu n -> oo. Standardní úpravy (můžeme je brát i jako výzvu k opakování postupů z analýzy funkcí jedné proměnné!) vedou při lim„^oo r„/n — X k výsledku:
frn\ (n - l)r*-k lim P(X„ =k) = lim ' '
k) nr
r„(r„-l)...(r„-*+l) 1 / 1 lim -:--| 1--
n^oo (n — l)k k\
__rn
= — lim I 1
= — e \ k\
protože obecně funkce (1+x/n)" konvergují stejnoměrně k funkci na každém omezeném intervalu v R.
POISSONOVO ROZDĚLENÍ [___^___
4
Poissonovo rozdělení Po (X) popisuje náhodné veličiny s pravděpodobnostní funkcí
fxV) =
t e N jinak.
Samozřejmě platí
00 \k \k
k=0 k k
Jak jsme odvodili výše, toto diskrétní rozdělení Po (X) s libovolným X > 0 (rozložené do nekonečně mnoha bodů) dobře aproximuje binomická rozložení Bi(n, p„), kde np„ — X, pro veliká n.
9.24. Dva příklady Poissonova rozdělení. Kromě výše £^ zmíněného fyzikálního modelu lze takové chování při sledování výskytu jevů v prostoru s konstatní očekávanou hustotou na jednotku objemu (např. při sledování výskytu bakterií na sklíčku pod mikroskopem, které se stejně pravděpodobně vyskytují v kterékoliv jeho části). Je-li „průměrná hustota výskytu" v jednotkové ploše X, pak při rozdělení celé oblasti na n stejných částí bude výskyt k jevů v jedné vybrané části modelován náhodnou veličinou X s Poissonovým rozdělením. Takovéto pozorování při praktické diagnostice v biochemické laboratoři umožní výpočet docela
567
KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY
přesného celkového počtu bakterií ve vzorku ze skutečného počtu odečteného jen v několika náhodně vybraných malých částech vzorku.
Zkusme nyní popsat události, které se vyskytují náhodně v čase t > 0 a přitom pravděpodobnost výskytu v % následujícím malinkém časovém intervalu o délce h nezávisí na předchozí historii a je rovna stále stejné hodnotě hX pro pevné X > 0. Přitom pravděpodobnost, že nastane jev v daném malinkém intervalu více než jedenkrát bude velmi malá.
Označme si náhodnou veličinu Xt vyčíslující počet výskytu sledovaného jevu v intervalu [0, ř) a zkusme vyjádřit naše požadavky infinitesimálně. Chceme, aby
• pravděpodobnost jedné události v každém časovém úseku o délce h byla rovna hX + a (h), kde funkce a (h) splňuje
lim^0+ ^=0;
• pravděpodobnost fí(h), že nastane více než jedna událost v časovém úseku délky h splňuje limň^o+ — 0;
• jevy Xt — j a Xt+h — Xt — k jsou nezávislé pro všechny
j, k e N a t, h > 0.
Označíme si funkce pk(t) — P(Xt — k), k e N, a položíme samozřejmé okrajové podmínky po(0) — 1 a pk(0) — 0pro& > 0. Nyní přímo spočteme
po(t + h) — po(t)P(Xt+h - Xt = 0)
= p0{i)(\ - hX - a(ť) - p-(i))
a podobně
pk(t + h) — pk(t)P(Xt = k, Xt+h — Xt — 0)+
pk-i(t)P(X, =k-l, Xt+h -X, = 1)+ P(Xt• 0+ nulovou)
p0(t + h) - p0(t) 1
---= -Xp0(t) + - o(h)
h h
pk(t + h) - pk(t) 1
-■- = -Xpk(t) + Xpk-i(t) + - o(h)
h h
a Umitním přechodem pro h —>• 0+ tak dostáváme (nekonečný!) systém obyčejných diferenciálních rovnic:
p'0(t) = -Xp0(t), po(0) = 1
p[(t) = -XPk(t) + kpk-i(t), pk(0) = 0
pro všechny t >0aieN,s počáteční podmínkou.
Nemusíme se ale děsit, protože první z nich má jediné řešení
Po(t) = e""ř,
které okamžitě můžeme dosadit a vyřešit druhou rovnici. Obdržíme
pi(t) = Xte~lt.
Matematickou indukcí teď už snadno dovodíme, že ve skutečnosti má celý systém jediné řešení a to
Pk(t) = (-^re-lt, t > 0, k e N. k\
568
KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY
Ověřili jsme tedy, že pro každý proces splňující tři výše uvedené vlastnosti má náhodná veličina Xt udávají počet výskytů v časovém intervalu [0, t) rozdělení Po (Ar).
V praxi jsou takové procesy spojeny např. s poruchovostí strojů a zařízení.
9.25. Spojitá rozdělení. Nejjednoduším příkladem spojitého rozdělení je rovnoměrné rozprostření veškeré pravděpodobnosti na nějakém intervalu. Na něm lze
dobře ilustrovat, že při jednoduše formulovaném požadavku na chování rozdělení nám nezbude moc prostoru pro jeho definici. Nyní chceme, aby pravděpodobnost hodnoty veličiny X v každém intervalu stejné délky obsaženém v daném intervalu (a,b) c M byla stejná, tj. hustota f x našeho rozdělení náhodné veličiny X má být konstantní.
_m^—___| Rovnoměrné rozdělení ^..v,,
Pro libovolná reálná čísla — oo < a < b < oo definujeme hustotu a distribuční funkci takto:
0 t < a
-±ra te(a,b) Fx(t) = 0 t > b,
fx(t) =
Říkáme, že veličina X má rovnoměrné rozdělení.
0 t < a
B; te(a,b)
b
1 t > b
Další rozdělení budeme podobné diskrétnímu Poissonovu. Předpokládejme, že sledujeme výskyt náhodného jevu takového, že jeho výskyty v nepřekrývajících se intervalech jsou nezávislé. Je-li tedy pit) pravděpodobnost, že jev nenastane během intervalu délky t, pak nutně p(t + s) — p(ť)p(s) pro všechna t,s > 0. Předpokládejme navíc diferencovatelnost funkce p a piO) — 1.
Pak jistě ln p(t+s) — ln pit)+ln p(s), takže limitním přechodem
r ^pit + s)-\npjt) , p'iO)
lim -= (ln(p)) (0) = —— = p (0).
s^0+ s piO)
Označme si spočtenou derivaci (ln(/?))'(0) — — k e M. Pak tedy pro pit) platí ln pit) — —Xt + C a počáteční podmínka dává jediné řešení
P(t) = e~kt.
Všimněme si, že z definice našich objektů vyplývá, že X > 0.
Nyní uvažme náhodnou veličinu X udávající (náhodný) okamžik, kdy náš jev poprvé nastane. Zřejmě tedy je distribuční funkce rozdělení pro X dána
— ~kt
Fx(t) = í-p(t)
t < 0.
Je vidět, že skutečně jde o rostoucí funkci s hodnotami mezi nulou a jedničkou a správnými limitami v ±oo. Hustotu tohoto rozdělení dostaneme derivováním distribuční funkce.
* Exponenciální rozdělení
Spojité rozdělení náhodné veličiny X s hustotou
fx(t) = \o t<0.
se nazývá exponenciální rozdělení ex(A)
569
KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY
9.26. Normální rozdělení. Jestliže v binomiálním rozdělení zachováme konstatní úspěšnost p, ale budeme přidávat počet pokusů n, bude pravděpodobnostní funkce kupodivu pořád mít podobný tvar (i když jiné rozměry). Na obrázku při rostoucím n se budou vynesené bodové hodnoty slívat do křivky, která by nám měla dát hustotu spojitého rozdělení aproximujícího dobře Bi(n, p) pro veliká n.
Naznačíme dopředu, kde hledat. Vzpomeňme na hladkou funkci y — f (x) — e~x l\ kterou jsme v odstavci 6.6 na straně 345 zmiňovali jako vhodný nástroj pro konstrukce funkcí hladkých, ale nikoliv analytických. Na obrázku je srovnání této křivky (vpravo) s vynesenými hodnotami Bi(5000, 0.5).
I
II
Podbízí se proto hledat vhodné spojité rozdělení, které by mělo hustotu danou pomocí vhodně upravené takové funkce.
Funkce e~x ^ je vždy kladná funkce, stačí nám spočíst e~x I1 dx a pokud to bude konečné číslo, prostě tuto funkci vynásobího jeho převrácenou hodnotou. Spočítat tento integrál sice není možné pomocí elementárních funkcí, můžeme si ale pomoci vícerozměrnou integrací a Fubiniho větou. Snadno totiž pomocí transformace do polárních souřadnic spočteme, že
27r = y e~(x2+y2V2 dxdy
c-y2'2dy
(srovnejte s poznámkami na konci odstavce 8.27, ověřte, že integrovaná funkce skutečně vyhovuje tam uvedeným podmínkám a spočtěte si podrobně!). Odtud ale již vidíme, že hledaný integrál
má hodnotu v2jr a bude proto funkce f(x) — definovanou hustotou náhodné veličiny.
j Normální rozdělení j_
e x I1 dobře
Spojité rozdělení náhodné veličiny Z s hustotou
0 takto:
^.ff(x) = e-^W). Nyní snadno spočteme pomocí jednoduché substice proměnné
-(,-m)W)í/x = V2^(t.
r
Joo
Dostáváme tedy celou douparametrickou třídu hustot
náhodných veličin. Příslušná rozdělení budeme značit N(/z, ct).
K asymptotické blízkosti normánflio a binomického rozdělení pro n -> oo se ještě vrátíme, jenom co si k tomu vytvoříme patřičné nástroje.
9.27. Rozdělení náhodných vektorů. Obdobně jako u skalárních veličin definujeme distribuční funkce a hustotu nebo rt. > pravděpodobnostní funkci pro spojité a diskrétní ná-±Lm hodné vektory. Hovoříme také o simultánních (sdružených) pravděpodobnostních funkcích a hustotách.
Pro dvě diskrétní náhodné veličiny, tj. diskrétní vektor (X, Y) náhodných veličin, definujeme (sdruženou) pravděpodobnostní funkci
t! ^ I P(X — Xi A Y — y j) x=Xi,y = yj /,V-V,-|(» jinak.
u diskrétních veličin. Pro spojité veličiny pak definujeme pro všechny a, b e R
F {a, b) = P(-oo -
*; y j
Derivací sdružené distribuční funkce spojitých proměnných dostáváme vztah mezi jejich hustotami:
32
fx,ľ(x, y) = ——Fx,y(x, y) 3x3 y
3
|2
Fx(x)FY(y)
3x3 y = fx(x)fr(y).
Jde tedy o prostý součin hustot jednotlivých veličin.
Sdružené pravdpodobnostní funkce a hustoty náhodných vektorů vyšších dimezí se definují zcela obdobně pomocí vícenásobných součtů či integrací. Pro ně také definujeme jejich závislost požadavkem, aby jejich sdružené distribuční funkce byly součinem jednotlivých distribučních funkcí, tj.
Fxx,...,xn(x\, ...,x„) = FXx(x\) ■ ■ ■ FXn(x„)
a jejich sdružené pravděpodobnostní funkce a srdužené hustoty opět dostaneme pomocí součinů.
9.28. Funkce náhodných veličin. Náhodné vektory potkáváme v praktických modelech ve dvou velmi odlišných rolích. Můžeme sledovat skutečně několik různých ná-HjjV hodných veličin popisujících více či méně souvise--Är*%sJ- jící jevy. Jako příklad nám mohou sloužit různorodé číselné parametry svázané s jednotlivými studenty (prospěch v různých předmětech, váha, výška, stáří, roční příjem, atd.). V tomto případě budeme potřebovat nástroje, které nám umožní sledovat rozdíly či závislosti mezi takovými veličinami.
Můžeme ale také sledovat jen jeden parametr na velkém souboru objektů a vybíráme přitom jen menší počet n z nich. Takový postup popisujeme pomocí n-rozměrného vektoru (Xi,..., X„), kde všechny náhodné veličiny Xk mají stejné rozdělení pravděpodobnosti. Tady nás budou velice zajímat veličiny, které budou odpovídat statistickým číselným charakteristikám, které jsme již potkali v předchozí části této kapitoly.
Máme k dispozici velice jednoduchý koncept. Místo jedné náhodné veličiny nebo náhodného vektoru uvažujeme funkci z těchto veličin.
I u jediné veličiny jde o užitečný nástroj. Místo náhodné veličiny X, např. „roční plat zaměstnance", budeme vyčíslovat jinou závislou hodnotu ijr(X), např.„roční čistý příjem zaměstnance po zdanění a včetně sociálních dávek". V systému se značnou sociální solidaritou je první veličina hodně variabilní, zatímco druhá může být skoro konstantní. Statisticky se proto budou značně odlišovat.
j Funkce náhodných veličin a vektorů j^——
Uvažme spojitou funkci i/r :l^-la náhodnou veličinu X. Náhodnou veličinu Y — ý(X) nazýváme funkcí náhodné veličiny X.
572
KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY
V případě náhodného vektoru (X\, ...,X„) a funkce ý '■ Rn -> R hovoříme o funkci Y = if(X\, ■ ■ ■, Xn) náhodného vektoru.
Všimněme si, že požadavek spojitosti \j/ zaručuje, že je Y opět náhodnou veličinou podle naší definice, protože vzor bore-lovské množiny ve spojitém zobrazení je opět borelovská množina. Obecněji můžeme právě tento požadavek na \j/ vztáhnout pro každý speciální případ veličiny či vektoru a definovat tak pojem funkce z náhodné veličiny či vektoru obecněji.
Nejjednodušší funkcí po konstantách je afinní závislost
f{X) = a+bX
s konstantami a, b e R, b / 0. Je-li f x (x) pravděpodobnostní funkce náhodné veličiny s diskrétním rozdělením, snadno se vypočte
fw)(y) = pww = y)= E /(*«■)■
V případě afinní závislosti Y = a+bX je proto pravděpodobnostní funkce nenulová právě v bodech y i = ax; + b.
Jako přiklad na funkci náhodného vektoru si rozmyslete součet n nezávislých náhodných veličin s alternativním rozdělením A(p). Samozřejmě dostáváme právě binomiální rozdělení Bi(n, p).
Podobně můžeme přepočíst distribuční funkci rozdělení funkce ze spojité náhodné veličiny, či vektoru. Ukážeme na příkladu.
V předposledním odstavci jsme zavedli veličinu Z s normálním rozdělením N(0, 1). Snadno spočteme, že veličiny Y = ji + a Z budou mít normální rozdělení N (/z, er) diskutované tamtéž. Skutečně,
FY{y) = P(Y oo
Eý(X)= / f(x)fx(x)dx,
pokud tento integrál absolutně konverguje.
Střední hodnotu náhodné veličiny můžeme nahlížet jako „očekávanou hodnotu". Ve statistice zanedlouho uvidíme, že má skutečně přímý vztah k aritmetickému průměru vektoru hodnot.
9.30. Petrohradský paradox. Vraťme se k příkladu, kterým j sme motivovali potřebu diskrétních náhodních veličin v '■^ť'^" odstavci 9.10. Přeformulujeme tentýž model jako po-"f^,^-: tenciální pravidla herny a dostaneme pěkný příklad \> Sir- situace, ve které střední hodnota zkoumané veličiny nebude podle naší definice vůbec existovat.
Návštěvník zaplatí vklad C a poté hází mincí. Je-li T počet hodů potřebných k první hlavě, pak obdrží výhru 2T. Ptáme se, jaká je „fér hodnota" pro vklad C? Je-li X náhodná veličina popisující výhru, jistě se nám zdá, že správnou odpovědí je „cokoliv menší než střední hodnota E X".
Jak jsme odvodili v 9.10, je (za předpokladu férové mince) P(T — k) — 2~k. Sečteme-li všechny pravděpodobnosti výsledků vynásobené výhrami 2k, dostaneme 2^i° 1 — oo. Střední hodnota tedy neexistuje. Zdá se proto, že se hráči vyplatí vložit i velký vklad...
574
KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY
Ve skutečnosti simulací hry zjistíme, že nezávisle na počtu pokusů se prakticky všechny výhry budou pohybovat v rozmezí cca do 24. Důvodem je, že nikdo nemůže hrát neomezeně dlouho a vysoké výhry jsou proto velice nepravděpodobné a proto je při reálných úvahách nelze brát vážně. V teorii rozhodování se takovým případům, kdy očekávaná hodnota nemá přímý vztah ke skutečnému užitku říká Petrohradský paradox a k této tématice lze najít rozsáhlou literaturu.3
9.31. Vlastni střední hodnoty. U jednoduchých rozdělení můžeme snadno spočíst jejich střední hodnotu přímo z definice. Např. pro náhodnou veličinu s alternativním rozdělením A(p) zřejmě
EX = (1 - p)-0 + p ■ 1 = p. Stejně tak bychom mohli spočíst střední hodnotu np binomického rozdělení Bi(n, p), to už ale dá trochu přemýšlení. Nicméně výsledek je okamžitým důsledkem následující obecné věty, protože Bi(n, p) je součtem n náhodných veličin s alternativním rozděleními A(p).
Uvažme nějaké náhodné veličiny X, Y, reálné konstanty a, b a podívejme se na střední hodnoty funkcí veličin X + Y aa + bX, za předpokladu, že střední hodnoty E Z a E ľ existují.
Přímo z definice je samozřejmé, že konstantní náhodná veličina a má za střední hodnotu opět a. Dále,
E(bX) = bEX,
protože konstanta b se vytkne jak ze sum, tak z integrálů. Zkusme spočíst E(X + Y). Pro diskrétní rozdělení X a Y dostaneme
E(X + Y) = ^2 + yj)P(x = *«> Y = y j)
i j
= ^2^2xtP(X = xt,Y = yj)+
i j
52'£,yjP(X = xi,Y = yj)
i j
= T,(x'T,p(x = x''Y = yj))+
i j
T,(yjT,p(x = x''Y = yj))
J 1
i j
přičemž absolutní konvergence sumy nalevo vyplývá z trojúhelníkové nerovnosti a absolutní konvergence sum pro střední hodnotu jednotlivých proměnných, při výpočtu jsme pak absolutní konvergence sum využili k záměně pořadí sčítání.
Zcela obdobně ověříme existenci a spočteme střední hodnotu součtu pro spojité náhodné veličiny se střední hodnotou. Celkem tedy dostáváme očekávaný vztah:
E(X + Y) = EX + Eľ,
kdykoliv střední hodnoty E X a E Y existují.
Nyní již aplikací na konstantní veličinu a a veličinu bX dostáváme také
E(a + bX) = a + bEX.
Bernoulli, 1738, viz Wlki - hodnota není dána cenou ale užitkem
575
KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY
Následující věta rošiřuje toto chování vůči afinním transformacím na náhodné vektory (a ukazuje, že je střední hodnota invariantní vůči afinním transformacím, stejně jako aritmetický průměr):
Věta. Nechť X — (X i, ..., Xn) je náhodný vektor se střední hodnotou E X, a € M", B € Matm„ (M) matice. Pak platí
E(a + BX) = a + B-EX.
Důkaz. Ve skutečnosti už skoro nemáme co dokazovat. Protože je střední hodnota vektoru definována jako vektor středních hodnot, stačí se nám omezit na jedinou položku v E(a + B). Můžeme proto rovnou předpokládat, že a je skalár a B matice s jediným řádkem. Pak jde ovšem o střední hodnotu konečného součtu náhodných veličin a ta je podle předchozí úvahy jednak existuje a zároveň je dána jako součet středních hodnot. □
9.32. Kvantity a kritické hodnoty. Pokračujeme v našem programu zavádění číselných chrakterstik v obdobě k těm z popisné statistiky. Dalšími užitečnými charak-Y teristikami tam byly tzv. kvantily. ^^^hLj— Uvažme nejprve náhodnou veličinu s ryze mono-tóní distribuční funkci Fx. Podmínce vyhovuje každá spojitá náhodná veličina X se všude nenulovou hustotou, jako je tomu např. u normálního rozdělení. V tomto případě definujeme tzv. kvantilo-vou funkci F^1 prostě jako inverzní funkci (fx)-1 : (0, 1) —>• r. To znamená, že hodnota y — f-1 (a) je právě takové y, že P(X < ý) — a. To přesně odpovídá kvantilům z popisné statistiky, když budeme za pravděpodobnosti brát relativní četnosti výkytu hodnot.
J kvantilová funkce |a^____»__
Obecně, pro libovolnou náhodnou veličinu X s distribuční funkcí Fx(x) definujeme její kvantilovou funkci
(a) = inf{x e M; f (x) >a], a e (0, 1).
J
Zřejmě jde o zobecnění předchozí definice v případě ryze monotónní distribuční funkce.
Jak jsme viděli v popisné statistice, nejčastěji jsou používané kvantily s a — 0.5, tzv. medián, s a — 0.25, tzv. první kvartil, a — 0.75, tzv. třetí kvartil, a podobně pro decily a percentily (kdy je a rovno násobkům desetin a setin).
Jak vyplývá přímo z definice, kvantilová funkce nám pro danou náhodnou veličinu X umožňuje přímo určovat intervaly, do kterých nám padnou hodnoty X s předem zadanou pravděpodobností. Velice často se jistě budeme potkávat např., s hodnotou 3>_1(0, 975), která je přibližně rovna 1,96 a zadává percentil 97, 5 pro normální rozdělení N(0, 1). Tato hodnota říká, že s 2, 5-procentní pravděpodobností bude hodnota takové náhodné veličiny Z nejvýše 1, 96. Protože je přitom hustota pravděbonosti veličiny Z symetrická kolem počátku, můžeme toto pozorování interpretovat tak, že pouze s 5-procentní pravděpodobností bude hodnota |Z| větší než 1, 96.
Podobné intervaly a hodnoty budeme hledat při diskusi spolehlivosti odhadů hodnot charakteristik náhodných veličin.
J Kritické hodnoty •——
Pro náhodnou veličinu X a reálné číslo 0 < a < 1 definujeme její kritickou hodnotu x(a) na úrovni a předpisem
P(X > x(o0) = a.
576
KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY
To znamená, že x(a) = Fx 1 (1 — a), kde fx 1 je kvantilová funkce veličiny Z.
9.33. Rozptyl a směrodatná odchylka. Nejjednodušší číselné charakteristiky udávající variabilitu hodnot vzorku v popisné statistice byly rozptyl a směrodatná od-_5 chylka. Pro náhodné veličiny si budeme počínat obdobně.
,..... I Rozptyl náhodné veličiny L__-____
Pro náhodnou veličinu X s konečnou střední hodnotou definujeme její rozptyl vztahem
var Z = e((X -ex)2y
pokud i střední hodnota na pravé straně výrazu existuje. V opačném případě říkáme, že veličina Z nemá rozptyl.
Odmocnina Vvar Z z rozptylu se nazývá směrodatná odchylka náhodné veličiny Z.
S využitím vlastností střední hodnoty snadno spočteme jednodušší vztah pro rozptyl náhodné veličiny Z se střední hodnotou:
var Z = E(X-EX)2
= E(Z2 - 2Z(EZ) + (EX)2)
= EZ2-2(EZ)2 + (EZ)2
= E Z2 - (El)2.
Podívejme se také, jak se chová rozptyl náhodné veličiny při afinních transformacích. Pro náhodnou veličinu Z se střední hodnotou a rozptylem a pro reálná čísla a, b uvažujme náhodnou veličinu Y = a + bX. Spočteme
var Y = E((a + bX) - E(a + bX))2
= E(b(X -EX)f
= £2varZ.
Odvodili jsem tedy následující užitečné vztahy: _mmm^^^^^mm^^ Vlastnosti rozptylu
var Z = E(X2) - (EX)2 var(a + bX) = b2 var Z Vvar(a + bX) = ž>2VvarZ
Ke každé náhodné veličině Z se střední hodnotou a rozptylem můžeme zadat tzv. normovanou veličinu (často také říkáme standardizovanou) jako funkci
Z -EZ
Z =
VvarZ
Je to tedy taková afinní transformace původní veličiny, která má střední hodnotu nulovou a rozptyl jednotkový.
9.34. Momenty a momentová funkce rozdělení.
9.35. Definice. Charakteristiku E(Xk) nazýváme k-tým momentem, charakteristiku (n = E ((Z — EX)k) pak k-tým centrálním
577
KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY
momentem náhodné veličiny Z. Funkci M x (ŕ) : R -> R definovanou předpisem
Mx(0 = £eÄ pak momentovou vytvořující funkcí náhodné veličiny X.
9.36. Věta. f doplnit předpoklady!) Koeficienty Taylorova rozvoje funkce Mx (t) jsou právě centrální momenty náhodné veličiny X.
Momentová funkce poskytuje za jistých podmínek úplnou charakterizaci náhodné veličiny, obdobně jako její distribuční funkce.
Spočítejme momentovou funkci náhodné veličiny X s normálním rozložením. Použijeme pro to větu ??.
f00 1 X2
Mx(i) = / etx —^=e~~ áx
J—oo
f
J —c
'2tc
1 :í-l(l2_2a+ŕ-ŕ)(lx
/2tt
t ľ°° 1 fe-»2 e2 _e 2 dx —
J-OO V27T
t
e 2 .
9.37. Kovaríance. Pro náhodné veličiny X, Y s existujícími rozptyly definujeme jejich kovarianci C(X, Y) (též cov(Z, Y)) jako
C(X, Y) — E ((X - EX) (Y - EX))
9.38. Poznámka.
Pro kovarianci náhodných veličin X, Y, Z platí
cov(Z, Y) = E(XY) - (EX)(EY) cov(Z + Y, Z) = cov(Z, Z) + cov(T, Z) cov(a +bX,c + dY) — bd cov(Z, Y), a, b, c, d e R
Důkaz. Vyplývá z vlastností střední hodnoty náhodné veličiny. Provedrne např. důkaz třetího vztahu:
cov(a + bX, c + dY) = E ((a + bX - E(a + bX))(c + dY - E(c + dY))) = E ((bX - bE(X))(dY - dE(Y))) = = E (bd(X - E(X))(Y - E (Y)) = = M£ ((Z - EX)(Y - EY)) = = bd cov(X, Y).
□
Vidíme, že podle definice je var(Z, Z) — cov(Z, 7). Pokud uvážíme náhodné veličiny s definovaným rozptylem jako vektorový prostor nad R, tak kovariance je symetrická bilineární forma a rozptyl jí odpovídající kvadratická forma. Odtud
1
(9.8) cov(Z, Y) = - (var(Z + Y) - var(Z) - var(7)).
Korelace dvou náhodných veličin vypovídá o míře jejich závislosti.
9.39. Věta. Pokud jsou XaY nezávislé, pak C(X, Y) = 0.
Důkaz. Jsou-li XaY nezávislé, jsou nezávislé též veličiny (Z - EX) a (Y - EY) a tudíž
C(X, Y) = E ((X - EX)(Y - EY)) = E(X - EX)E(Y - EY) = = (EX - EX)(EY - EY) = 0.
□
578
KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY
Bezprostředním důsledkem předchozí věty a vztahu (9.8) je potom
9.40. Důsledek. Pro nezávislé náhodné veličiny XaY platí
cov(Z + Y) = cov(X) + cov(7).
Ještě lépe než kovariance (i když opět ne úplně) vystihuje míru (ne)závislosti dvou náhodných veličin korelační koeficient, náhodných veličin XaY rozumíme hodnotu
cov(Z, Y)
PX,Y — , r
V var X V var Y
Schwarzova nerovnost pro positivně semi-definitní formu cov nám pak říká, že
\Px,y \ < 1 Dále snadno dostáváme
Pa+bx,c+dY - sign(bd)px,Y
a pro nezávislé veličiny X, Y pak px,Y — 0.
9.41. Přehled rozdělení odvozených od normálního.
9.42. Limitní vlastnosti.
9.43. Věta (Centrální hmitní věta).
9.44. Soubor hodnot a jeho popis.
9.45. Číselné charakteristiky polohové.
9.46. Míry variability souboru.
9.47. Další výběrové koeficienty.
9.48. Diagramy.
3. Matematická statistika
9.49. Výběry z populace. V praxi často potkáváme veliký základní statistický soubor s N jednotkami, který budeme stručně nazývat populace. Na každé z N jednotek přitom můžeme měřit hodnotu nějakého pevně zvoleného číselného znaku X, čímž bychom celkem získali N hodnot xi,x2,...,xn. Průměr x všech hodnot xí označíme [i a populační rozptyl cr2, tj.
1 N 1 N
M = -J>' *2 = ^ I>i -/*)2-
i = 1 i = 1
Je-li naše populace skutečně veliká, nemůžeme (nebo alespoň z různých důvodů nechceme) získávat skutečně všechny hodnoty x;. Místo toho provedeme výběr (tj. zvolíme tzv. výběrový soubor) o rozsahu n < N jednotek, který bude „dobře" reprezentovat celou populaci. Pro naše potřeby budeme nyní za dobrý považovat takový výběr, kdy všechny n-tice jednotek mají stejnou šanci na vybrání.
Uvažme neprve případ, kdy použijeme náhodný výběr bez vracení, tzn. že postupně vybíráme jednotky jednu za druhou, aniž bychom dosud zpracované do základní populace vraceli. Pro celý výběrový soubor máme zjevně (^) možností a každou pevně zvolenou n-tici indexů co můžeme zvolit (jV^")! způsoby.
Pracujeme tedy s konečným jevovým polem s elementárními jevy co a přiřazování číslené charakteristiky x; má charakter náhodného vektoru
(Xl(co),X2(co),...,Xn(co)),
579
KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY
který vzniká z n-násobného výběru elemntárního jevu &> a přiřazení příslušné číselné honoty znaku. Při výpočtech průměrů a rozptylů pracujeme se symetrickými funkcemi, budou nás proto nyní skutečně zajímat pouze neuspořádané n-tice. Každý z takových výběrů je sjednocením n! jevů a má tedy pravděpodobnost
éř
Chceme nyní ověřit, do jaké míry vede použití standardních formulí pro výběrové průměry a rozptyly k dobrým odhadům skutečných hodnot pro celou populaci. Uvažujme proto náhodné veličiny
y n \ n
x = x(s) = - Ví;, s2 = - yVxť - x)2.
n L—' n L—'
i=\ i=\
Věta. Za výše uvedených podmínek a označení platí
N t - N-na
EX — jjl, ES2 =-a2, varŽ =
2
N - 1 N -1 n
Tvrzení řeší, zda průměr číselného znaku X populace a příslušný rozptyl tohoto znaku jsou ve střední hodnotě (tj. „v průměru") stejné jako odpovídající hodnoty spočtené na náhodném výběru. Pokud ano, říkáme, že jde o nestranné odhady. Výběrový průměr tedy je nestranným odhadem, zatímco výběrový rozptyl se jím stane teprve po korekci koeficientem ^r-. K nestranným odhadům se ještě vrátíme obecněji.
Důkaz. Za tím účelem si technicky popišme naše náhodné výběry pomocí N náhodných veličin Wi, které jsou definovány tak, aby pro výběr n-tice s bylo Wi (s) — 1 pokud i e s a nula jinak (tzv. indikátory zahrnutí). Snadno se pak ukáže ...
□
9.50. Poznámky o statistické indukci.
9.51. Poznámky o testování hypotéz.
9.52. Poznámky o lineárních modelech.
9.53. Závěrem.
4. Bayesovská a neparametrická statistika
580
KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY
581
KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY
582
KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY
583
KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY
584
KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY
585
KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY
586
KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY
587
KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY
588
KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY
589
KAPITOLA 10
Algebraické struktury
čím větší abstrakce, tím větší zmatek? - ne, často to bývá naopak...
V této kapitole se budeme věnovat zdánlivě velice formálnímu studiu pojmů, které ale ve skutečnosti odráží spoustu skutečných vlastností věcí kolem nás.
Abstrahujeme z nich přitom jen ty nejjednodušší operace a „algebru" tak lze vnímat jako algoritmické manipulace s písmeny, které zpravidla mají nějaké souvislosti s výpočty nebo popisem procesů. Zároveň si budeme trochu všímat, kde všude jsme takové objekty potkávali v předchozích kapitolách (aniž by ale bylo nutné mít tyto kapitoly předem pročtené). Přímo navážeme víceméně jen na první a šestou část první kapitoly, kde jsme podobně abstraktně pohlíželi na čísla, se kterými počítáme, a obecněji na vztahy mezi objekty, když jsme je abstrahovali do tzv. relací.
V první části této kapitoly se zastavíme u té nejjednodušší situace - budeme se zamýšlet nad případem, kdy máme jen jednu jedinou operaci, která se chová podobně jako násobení čísel. Pak si přidáme druhou operaci, podobně jako jsou u čísel k dispozici společně sčítání a násobení. To nám umožní vysvětlit elementární základy tzv. počítačové algebry, tj. algoritmických postupů, díky kterým počítače umí manipulovat s formálními výrazy a počítat s nimi, včetně řešení systémů polynomiálních rovnic.
V další části se vrátíme k jiné abstrakci situací s jedinou operací a budeme přitom vycházet z uspořádní čísel podle velikosti nebo množinové inkluze. V poslední části kapitoly se pak zastavíme u několika poznámek ohledně využití algebraických nástrojů pro návrhy (samoopravných) kódů využívahých hojně při přenosech dat.
1. Grupy
Naše první úvahy se budou týkat objektů a situací, ve kterých je možné rovnice tvaru a ■ x — b vždy jednoznačně řešit (tak jako u lineárních rovnic jsou objekty a a b dány, zatímco x hledáme). Půjde o tzv. teorii grup. Všimněme si, že zatím nic nevíme o povaze objektů, ani co znamená ta tečka. Jen předpokládáme, že dvěma objektům a a x umíme přiřadit objekt a ■ x.
Nejprve si oprášíme a rozšíříme náš slovník pojmů ohledně operací, jak jsme jej zavedli již v kapitole první a projdeme přitom příklady čísel a transformací roviny a prostoru, ve kterých se s takovými „grupovými" objekty potkáváme. Teprve pak se budeme chvíli věnovat základům obecné teorie.
10.1. Příklady a pojmy. Pro libovolnou množinu A jsme již dříve definovali binární operace na A jako libovolné zobrazení AxA ^ A. Výsledek takové operace budeme často značit
(a,b)
■b.
10.1. Rozhodněte o následujících množinách a operacích, jaké tvoří (grupoid, pologrupa, zda existují levé (pravé) neutrální prvky, grupa):
i) podmnožiny množiny přirozených čísel spolu s operací sjednocení
ii) přirozená čísla spolu s binární operací největší společný dělitel
iii) přirozená čísla spolu s binární operací nejmenší společný násobek
iv) množina všech invertibilních matic 2x2 nad R spolu se sčítáním
v) množina všech matic 2x2 nad R spolu s násobením matic
vi) množina všech matic 2x2 spolu s odčítáním matic
590
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
Množina s binární operací se nazývá grupoid.
Abychom mohli něco podstatného říci, potřebujeme nějaké další vlastnosti operací. Binární operace je asociativní, jestliže pro všechny prvky v A platí
a ■ (b ■ c) — (a ■ b) ■ c.
^| Binární operace a pologrupy
Grupoid s asociativní binární operací, se nazývá pologrupa. Binární operace je komutativní, jestliže pro všechny prvky v A platí
Přirozená čísla N={0, 1,2,...}, spolu s kteroukoliv z operací sčítání a násobení jsou asociativní a komutativní pologrupa. Celá čísla Z — {..., —2, —1,0, 1, 2,...} jsou grupoid vůči kterékoliv z operací sčítání, odčítání, násobení. Operace odčítání ale není asociativní. Např.
(5 - 3) - 2 = 0 / 5 - (3 - 2) = 4,
ani komutativní, protože a — b — —(b — a).
1_Jednotky, inverze a grupy Levá jednotka v grupoidu (A, •) je takový prvek e e A, že pro všechny prvky v A platí e ■ a — a; obdobně pro pravou jednotku musí platit pro všechny prvky a ■ e — a. Jednotka binární operace je prvek e, který je pravou i levou jednotkou zároveň.
Prvek a~l je levou inverzí k prvku a v pologrupě (A, •) s jednotkou e, jestliže platí a~1 - a — e; obdobně je pravou inverzí a~1 takový prvek, pro který je a ■ a~l — e.
Prvek a~l je inverzní k a v pologrupě s jednotkou, jestliže je levou i pravou inverzí zároveň.
Monoid (M, •) je pologrupa s jednotkou. Grupa (G, •) je pologrupa s jednotkou, ve které má každý prvek inverzi.
Komutativní grupa, resp. komutativní pologrupa, je taková, ^líd^e^operac^komutativní.
Komutativní grupy se také často nazývají abelovské.1 Podívejme se na přímé jednoduché důsledky definic. V mo-
noidu nemohou být pravé a levé inverze různé. Je-li totiž a ■ x —
x ■ b — e, pak také
a — a ■ (x ■ b) — (a ■ x) ■ b — b.
Podstatná je zde pouze asociativita operace. Všimněme si, že pro odečítání na celých číslech (tady operace není asociativní) je nula pravou jednotkou, tj. a — 0 — a pro všechna celá čísla a, není však levou jednotkou. Dokonce v tomto případě levý neutrální prvek neexistuje.
Celá čísla jsou zjevně pologrupou vůči sčítání i násobní. Grupou jsou přitom jen vůči sčítání, protože pro násobení neexistují inverzní prvky, kromě čísel ± 1.
Je-li (A, •) grupa, pak její podmnožinu B G A, která je uzavřená vůči zúžení operace • a zároveň je spolu s touto operací grupou, nazýváme podgrupa.
Je to na počest mladého matematika Ábela ... V angličtině se používá přídavné jméno „abelian" a bývá to uváděno jako příklad absolutní pocty, protože se píše s malým písmenem, tzn. je to tak obecně používáno, že se již zapomnělo, že jde o jméno člověka.
vii) množina všech invertibilních matic 2x2 nad Z2 s násobením matic
viii) množina Z6 spolu s násobením (modulo 6) ix) množina Z7 spolu s násobením (modulo 7)
Svá tvrzení zdůvodněte (proč je něco např. pouze grupoid a není pologrupa ... U třetího příkladu od konce sestavte tabulku dané operace.
i) monoid
ii) pologrupa (bez neutrálního prvku)
iii) monoid (číslo 1 je neutrálním prvkem)
iv) není ani grupoid (uvážíme A+(—A) pro nějakou invertibilní matici A)
v) monoid
vi) grupoid (není asociativní)
vii) grupa
viii) pologrupa ix) pologrupa
V příkladě 7 má grupa následující prvky: A = , B = ^ ,
Mi 0-D = G i>M" í>' = G
tabulka operace násobení matic vypadá následovně:
A B C D E F
A A B C D E F
B B A E F C D
C C D A B F E
D D C F E A B
E E F B A D C
F F E D C B A
Všimněme si, že v tabulce se v každém řádku i sloupci (bez prvního řádku a sloupce) vyskytuje každý prvek právě jednou (proč tomu tak je?). Nemusíme tedy všechny součiny počítat a můžeme si v jisté fázi doplňování tabulky zahrát „Sudoku". □
10.2. Rozhodněte o následujících množinách a operacích, jaké tvoří struktury (grupoid, pologrupa, grupa). Určete zda existují levé (pravé) neutrální prvky a zda ja daná operace komutativní.
i) Podmnožiny množiny přirozených čísel spolu s operací průnik,
ii) přirozená čísla spolu s binární operací největší společný dělitel,
iii) množina všech invertibilních matic 3x3 nad R spolu se sčítáním,
iv) množina všech matic 3x3 nad R spolu s násobením matic,
Řešení.
591
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
Racionální čísla Q jsou komutativní grupou vzhledem ke sčítání a nenulová racionální čísla jsou také komutativní grupou vůči násobení. Celá čísla spolu se sčítáme ním jsou jejich podgrupou. Pro každé kladné přirozené číslo k je množina všech &-tých odmocnin z jedničky, tj. množina {z e C; zk — 1} konečnou grupou vůči násobení komplexních čísel. Např. pro k — 2 dostaneme grupu {—1, 1} se dvěma prvky, které jsou oba samy sobě inverzí, zatímco pro k — 4 dostáváme grupu G — {1, i, —1, —i}.
Množina Mat„, n > 1, všech čtvercových matic je (nekomutativní) pologrupa vzhledem k násobení matic a komutativní grupa vzhledem ke sčítání matic (viz odstavce 2.2-2.5).
Množina všech lineárních zobrazení Hom(V, V) na vektorovém prostoru je pologrupa vzhledem ke skládání zobrazení a komutativní grupa vzhledem ke sčítání zobrazení (viz odstavec 2.34).
V obou předchozích příkladech, podmnožina invertibilních objektů uvažované pologrupy tvoří grupu. V prvním případě jde o tzv. grupu invertibilních matic, ve druhém o grupu lineárních transformací vektorového prostoru.
V dřívějších kapitolách jsme již potkali mnoho (polo)gru-pových struktur, občas asi i docela nečekaně. Vzpomeňme např. různé podgrupy grupy matic nebo grupovou strukturu na eliptických křivkách.
10.2. Grupy permutací. Velmi často grupy a pologrupy potkáváme jako množiny zobrazení na pevně dané množině M, které jsou uzavřeny vůči skládání Nfe, zobrazení. Ne vždy si ale tuto skutečnost přímo ^řrflĚpB-J-- uvědomujeme, protože vidíme jen některá zobrazení a na všechna ostatní vznikající složeními nemyslíme.
Nejsnáze je tato souvislost vidět na konečných množinách M, kde nám každá podmnožina invertibilních zobrazení vygeneruje pomocí skládání jistou grupu.
Na každé takové množině o m — \M\ e N prvcích (prázdná množina má 0 prvků) totiž máme k dispozici mm možných definic zobrazení (každý z m prvků můžeme zobrazit na kterýkoliv v M) a všechna taková zobrazení umíme skládat. Protože skládání zobrazení je samozřejmě asociativní operace, dostáváme grupoid.
Pokud chceme, aby existovala k zobrazení a : M -> M jeho inverze a-1, musí být a bijekcí. Složením dvou bijekcí vznikne opět bijekce a proto podmnožina Em všech bijekcí na množině M o m prvcích je grupa. Říkáme jí grupa permutací (na m prvcích). Je příkladem konečné grupy.2
Sám název grupy Em přitom uvádí jinou souvislost, kdy místo bijekcí na konečné množině vnímáme permutace jako přerovnání rozlišitelných prvků. Potká vah jsme se s permutacemi v tomto smyslu např. při studiu determinantů, viz odstavec 2.14 na straně 83.
Promysleme si podrobněji, jak vlastně násobení v takové grupě vypadá. U (malé) konečné grupy si můžeme snadno sestavit úplnou tabulku všech operací. Jestliže v grupě permutací £3 na číslech {1, 2, 3} označíme jednotlivá pořadí
a = (1, 2, 3), b = (2, 3, 1), c = (3, 1, 2), d = (1, 3, 2), e = (3, 2, 1), / = (2, 1, 3),
A lze dokázat, že každá konečná grapa je podgrupou ve vhodné konečné grupě permutací. To si můžeme interpretovat tak, že grapy Sm jsou tak nekomutativní a složité, jak to jen jde.
v) množina všech matíc 3x3 spolu se sčítáním matíc,
vi) množina všech invertibilních matic 3x3 nad Z2 s násobením matíc,
vii) množina (Z9, +),
viii) množina (Z9, •),
O
10.3. Určete grupu symetrií krychle (popište všechny symetrie). Je tato grupa komutativní? Pokuste se sestavit alespoň část tabulky operace skládání symetrií.
Řešení. Grupa má 48 prvků, z nichž 24 jsou generovány pouze rotacemi. Grupa není komutativní (uvažte například v různém pořadí složení zrcadlení podle roviny dané středy čtyř rovnoběžných hran a rotace o 90° kolem osy ležící v uvedené rovině a procházející středy nějakých dvou protějších stěn. □
10.4. V grupě symetrií krychle určete podgrupu (popište symetrie v podgrupě a uvedte tabulku operace skládání na této podgrupě) generovanou zrcadlením podle roviny procházející středy čtyř rovnoběžných hran a rotací o 180° kolem osy ležící ve zmíněné rovině procházející středy dvou protějších stěn. Je tato podgrupa normální?
10.5. Rozhodněte, zda jsou podgrupy generované
• cyklem (1,2, 3) v 53,
• cyklem (1,2, 3,4) v S4
• cyklem (1, 2, 3) v A4
normální. V posledním případě určete pravé třídy rozkladu A4 podle uvažované podgrupy. Určete, kdy je podmnožina všech cyklů délky n podgrupou grupy S„. Ukažte, že se pak jedná o normální podgrupu.
Řešení.
• Jde o normální podgrupu A3.
• Není to normální podgrupa ( (1, 2)(1, 3) (2, 4)(1, 2) = (4, 1)(2, 3) ).
• Podgrupa není normální. Pravé třídy rozkladu jsou
pak {(124), (243), (13)(24)}, {(142), (143), (14)(23)}, {(234), (12)(34), (134)}, {Id, (123), (132)}.
Podmnožina je podgrupou pouze pro n = 3. Potom jde o podgrupu A3 sudých permutací v 53, jedná se tedy o normální podgrupu. (pro jiná n snadno najdeme dva cykly délky n jejichž složením není cyklus délky n). □
592
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
pak skládání našich permutací je zadáno tabulkou
a b c d e f
a a b c d e f
b b c a f d e
c c a b e f d
d d e f a b c
e e f d c a b
f f d e b c a
Všimněme si podstatného rozdílu mezi permutacemi a, b a c a dalšími třemi. Ty první tři tvoří tzv. cyklus generovaný prvkem b nebo prvkem c:
2 3 2 3
b — c, b — a, c — b, c —a.
Samy o sobě jsou tyto tři prvky komutativní podgrupou. V této podgrupě je a jednotka a prvky b s c jsou vzájemně inverzní. Je tedy tato podgrupa stejná jako je grupa Z3 zbytkových tříd celých čísel modulo 3, resp. jako grupa třetích odmocnin z jedničky.
Další tři prvky jsou samy sobě inverzí a každý z nich je tedy společně s jednotkou a podgrupou stejnou jako je Z2. Říkáme, že bac jsou prvky řádu 3, zatímco prvky d, e a / jsou řádu 2.
Tabulka ale není symetrická podle diagonály, naše operace • tedy není komutativní.
Obdobně se chovají všechny grupy permutací Em konečných množin o m prvcích. Každá permutace er rozkládá množinu M na disjunktní sjednocení maximálních invariantních podmnožin, které dostaneme tak, že postupně vybíráme dosud nezpracované prvky x e M a do třídy rozkladu Mx přidáváme všechny akce iterací ak(x),k — 1,2,..., dokud není ak(x) — x. Každou permutaci tak dostáváme jako složení jednodušších permutací, tzv. cyklů, které se chovají jako identická permutace vně Mx a tak jako g na Mx. Pokud přitom očíslujeme prvky v Mx jako pořadí (1,2,..., \MX |) tak aby / odpovídalo er' (x), pak je naše permutace prostým posunutím o jednu pozici v cyklu (tj. poslední prvek je zobrazen zpátky na první). Odtud název cyklus. Zjevně přitom tyto cykly komutují, takže je jedno, v jakém pořadí z nich permutaci g složíme.
Nejjednodušší cykly jsou jednoprvkové pevné body permutace g a dvouprvkové (x, er(x)), kde g(g(x)) — x. Těm se říká transpozice. Protože každý cyklus zjevně můžeme poskládat z permutací sousedních prvků (necháme „probublat" první prvek nakonec), lze každou permutaci napsat jako složení transpozic sousedních prvků.
Vraťme se k případu £3. Tam máme jednak možnost cyklu, který zahrne všechny tři prvky a v něm dostaneme permutace a, b, c. Kromě toho ještě můžeme mít jeden cyklus o délce 2 a zbývající prvek bude pevným bodem - tak dostaneme zbývající 3 permutace. Více možností není. Z postupu je zřejmé, že u větších počtů prvků bude možností velmi mnoho.
Jednotlivé permutce můžeme obecně vyjádřit pomocí transpozic mnoha způsoby. Přitom ale skutečnost, jestli potřebujeme sudý nebo lichý počet transpozic, je na volbách nezávislá (můžeme tuto skutečnost vyjádřit pomocí počtu tzv. inverzí a poslední tvrzení pak plyne z toho, že každá transpozice mění počet inverzí o lichý počet, viz úvahy v odstavci 2.15 na straně 84).
Máme tedy definováno dobře zobrazení
sgn : Em -> Z2 — {±1},
10.6. Určete podgrupu v S$ generovanou permutacemi (12) (34) (56), (1234) a (56). Je tato podgrupa normální? Pokud ano, popište třídy rozkladu S^/H.
Řešení. Nejprve si všimněme, že všechny zadané permutace leží v podgrupě 54 x 52 C S§. Proto i jimi generovaná podgrupa bude ležet v této podgrupě. Dále zřejmě (protože mezi generátory je transposice (56)) je hledaná podgrupa tvaru H x 52, kde H c 54. Stačí tedy popsat H, tato grupa je generována prvky (12)(34) a (1234) (projekce generátorů na 54). Máme
(1234)2 = (13)(24)
(1234)3 = (4321)
(1234)4 = id
[(12)(34)]2 = id
(12)(34) 0 (1234) = (24)
(1234) 0 (12)(34) = (13)
(12)(34) 0 (4321) = (13)
(4321) 0 (12)(34) = (24)
(12)(34) 0 (13)(24) = (14)(23)
(13) (24) 0 (12) (34) = (14)(23)
(12)(34) 0 (42) = (1234)
(13) 0 (42) = (13)(24)
Stačí si rozmyslet, že dalším skládáním již nedostaneme nic nového (např (13) o (1234) = (12)(34) o (4321) o (1234) = (12)(34) o id = (12)(34)). Podgrupa H c 54 má tedy osm prvků (osm je dělitel čísla 24, tedy podle Lagrangeovy věty je to skutečně možný počet prvků podgrupy).
H = {id, (1234), (13)(24), (4321), (12)(34), (13), (24), (14)(23)}.
Všech prvků hledané podgrupy v je tedy 16 (pro každý prvek h s H jsou v ní prvky h x id a h x (56)).
□
10.7. Určete podgrupu v 54 generovanou permutacemi (12) (34), (123).
593
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
tzv. paritu. Dokázali jsme si znovu tvrzení, která jsme již využívali při studiu determinantů (viz 2.14 a dále):
Věta. Každá permutace konečné množiny je složením cyklů. Cyklus délky l lze vyjádřit jako složení l — 1 transpozic. Parita cyklu délky í je (-l)1'1.
Parita složení permutací a o x je součinem parit a ax.
Poslední tvrzení věty říká, že zobrazení sgn převádí složení permutací a o x na součin sgn er • sgn x v komutativní grupě Z2.
_ | HOMOMORFISMY (POLO)GRUP ^^.m—^—a—.
Obecně říkáme, že zobrazení / : G\ -> G2 je homomorfis-mus (polo)grup, jestliže respektuje grupové operace, tzn.
f (a ■ b) = f (a) ■ f(b).
1
Zejména tedy vidíme, že je naše právě zavedená signatura permutací homomorfismem sgn : Em -> Z2.
10.3. Symetrie rovinných útvarů. V páté části první kapitoly jsme podrobně a elementárně rozebrali souvislosti invertibilních matic se dvěma řádky a dvěma sloupci a lineárními transformacemi v rovině.
Viděli jsme přitom, že matice v Mat2 (M) zadávají lineární zobrazení R2 -> R2, které zachovávají standardní vzdálenosti právě, když jsou jejich sloupce ortonormální bazí R2 (což je jednoduchá podmínka na souřadnice matice, viz odsta-\$ vec 1.29 na straně 30). Ve skutečnosti je snadné dokázat, že každé zobrazení roviny do sebe, které zachovává velikosti, je afinní euklidovské, tj. je složením lineárního a vhodné translace.3
Jak jsme již připomněli, lineární část takového zobrazení přitom musí navíc být ortogonální. Všechna taková zobrazení tedy tvoři grupu všech ortogonálních transformací (nebo také euklidovských transformací) v rovině. Navíc jsme ukazovali, že kromě translací Ta o vektor a jde pouze o rotace Rv o jakýkoliv úhel • E2 zachovávat velikosti, totéž musí být pravda pro přenášené vektory rychlostí, tj. Jacobiho matice DF(x,y) musí být v každém bodě ortogonální. Rozepsání této podmínky pro dané zobrazení F = (/(x, y), g(x, y)) : Ŕ1 ->• E2 vede na systém diferenciálních rovnic, který má pouze afinní řešení, protože snadno uvidíme, že všechny druhé derivace F musí být nulové (a pak už je naše tvrzení okamžitým důsledkem Taylorovy věty se zbytkem). Zkuste si promyslet detaily! Ve skutečnosti vede stejný postup k výsledku pro euklidovské prostory libovolné dimenze. Všimněte si přitom, že dokazovaná podmínka je nazávislá na volbě afinních souřadnic, proto složením F s lineárním zobrazením výsledek nemění. Můžeme proto pro pevný bod (x,y) složit (DF)-1 o F a bez újmy na obecnosti rovnou předpokládat, že DF(x, y) je matice identického zobrazení. Derivováním rovnic pak dostáváme důsledky, které přímo říkají požadované tvrzení.
Řešení. Oba zadané generátory jsou sudé permutace, jejich libovolným složením tedy vznikne opět pouze sudá permutace. Hledaná pod-grupa tedy bude i podgrupou grupy A4 všech sudých permutací. Máme
[(12)(34)]2 = id
(123)2 = (321)
(12)(34) o (123) = (243)
(123) o (12)(34) = (134)
(12)(34) o (321) = (314)
(321) o (12)(34) = (234)
a v tomto okamžiku máme již sedm prvků hledané podgrupy A4, protože A4 má dvanáct prvků a počet prvků podgrupy musí být dělitem čísla dvanáct, musí být hledanou podgrupou celá grupa A4. □
10.8. Najděte všechny podgrupy grupy invertibilních čtvercových matic 2x2 nad Z2 (operací je násobení matic). Je některá z nich normální?
Řešení. V příkladě ||10.1|| jsme sestavili tabulku operace ve zkoumané grupě. Dle Lagrangeovy věty (10.10) je možný počet prvků v podgrupě dělitelem čísla šest. Kromě triviálních podgrup (podgrupa složená pouze z jednokového prvku a celá grupa) přicházejí tedy do úvahy podgrupy o dvou či třech prvcích. Dvouprvkové grupy musejí mít tu vlastnost, že prvek, který není jednotka musí být inverzní sám sobě. Tato vlastnost je i postačující. Dostáváme tak podgrupy {A, B}, {A, C], {A, F} (jednotkovým prvkem je matice A). Dále díky jejich samoinverznosti, je součinem libovolné z matic B, C, F s nějakou další (nejednotkovou) maticí nejednotková matice třetí. Tedy žádná z těcho matic nemůže být prvkem trojprvkové podgrupy. Zbývá možnost P = {A, D, E} což vskutku podgrupa je. Navíc výpočtem konjugací BDB = E, CDC = E, FDF = E (z čehož vyplývá BEB = D, CEC = D, FEF = D) zjišťujeme, že daná podgrupa je normální. □
10.9. Eisensteinovo kriterium ireducibility. Udává, kdy je polynom nad okruhem Z nerozložitelný nad Q (což je stejné, jako neroz-ložitelnost nad Z):
Buď
f(x) = anxn + an-ix"~l + • • • + a\x + úq
polynom nad Z a dále nechť existuje prvočíslo p tak, že
• p dělí a j■■, j = 0... n — 1,
• p nedělí an,
• p2 nedělí a0,
594
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
Pro začátek uvažme třeba úsečku a rovnostranný trojúhelník. Ráme se, jak moc jsou symetrické, tzn. vůči kterým trasformacím (zachovávajícím velikost) jsou invariantní. Jinak řečeno, chceme aby obraz našeho obrazce byl od původního k nerozeznání, dokud si nepopíšeme nějaké význačné body, třeba vrcholy trojúhelníka A, B aC a konce úseček. Zároveň je předem jasné, že všechny symetrie pevně zvoleného útvaru budou vždy tvořit grupu (většinou pouze s jediným prvkem, identickým zobrazením).
1
P
U úsečky je situace obzvlášť jednoduchá - na první pohled je zřejmé, že jedinými jejími netriviálními symetriemi jsou rotace o it kolem středu úsečky, zrcadlení vůči ose této úsečky a zrcadlení vůči úsečce samotné. Všechny tyto symetrie jsou samy sobě inverzí. Celá grupa symetrií úsečky má tedy čtyři prvky. Její tabulka násobení vypadá takto:
^0 Rjt Ztf Zy
Ro
ZH Zv
Ro
Rn
ZH Zv
Rrc
Ro
Zv ZH
Zh Zv Ro
Rn
Zv ZH
Rn
Ro
a je tedy celá tato grupa komutativní.
Pro rovnostranný trojúhelník už symetrií nacházíme víc: můžeme rotovat o it/3 nebo můžeme zrcadlit vůči osám stran. Abychom dostali grupu celou, musíme přidat všechna složení takovýchto transformací. Už v 1.29 jsme viděli, že složení dvou zrcadlení je vždy otočením. Zároveň je zřejmé, že složení takových zrcadlení v opačném pořadí dá otočení o stejný úhel, ale s opačnou orientací. V našem případě tedy zrcadlení kolem dvou různých os vygenerují postupnou opakovanou aplikací všechny symetrie, který bude dohromady šest. Jestliže si umístíme trojúhelník v souřadnicích jako na obrázku, bude našich šest transformací zadáno maticemi
d =
1 0 0 1
-1 0 0 1
Sestavením tabulky pro násobení, tak jak jsme ji udělali pro grupu permutací £3 obdržíme právě stejný výsledek. Pro větší názornost jsou vrcholy označeny čísly, takže jsou příslušné permutace přímo čitelné.
Obdobně umíme nacházet grupy symetrií s k různými rotacemi a k zrcadleními. Stačí si k tomu vzít pravidelný ^-úhelník. Takové grupy symetrií se často označují jako grupy Dk a říká se jim dihedrální grupy řádu k. Tyto grupy jsou nekomutativní pro všechna k > 3, zatímco D2 je komutativní. Název patrně je odvozen od skutečnosti, že D2 je grupa symetrií molekuly vodíku H2, ve které jsou dva atomy vodíku a geometricky si ji lze představit jako úsečku.
pak je f(x) nerozložitelný nad Z (Q). Dokažte toto kriterium.
10.10. Kolika způsoby můžeme vytvořit náhrdelník z 3 černých a 6 bílých korálků stejného tvaru? Kusy stejné barvy nerozlišujeme a za stejné náhrdelníky považujeme všechny, které lze na sebe převést symetrií v rovině. O
Řešení. Pro řešení úlohy si náhrdelník představíme jako obarvení pevně označených vrcholů pravidelného devítiúhelníka. Za množinu S volíme všechna možná taková obarvení. Každé takové obarvení je jednoznačně určeno pozicí tří černých korálků. Velikost množiny S je tedy Q = 84.
Víme, že grupou všech symetrií je grupa D9 složená z 9 rotací (včetně identity) a stejného počtu reflexí. Stejné náhrdelníky jsou ty, které leží ve stejné orbitě akce grupy D9 na množině všech konfigurací 5, zajímá nás tedy počet orbit N. Pro výpočet N stačí probrat prvky grupy D9 a všímat si velikostí Sg:
Identita je jediný prvek řádu 1, |5id| = 84. Příspěvek do sumy je
84.
Zrcadlení g jsou všechna řádu 2 a je jich 9. Přitom je zjevně \Sg\ = 4, celkový příspěvek je proto 4 • 9 = 36.
Dvě rotace g o úhel 27r/3 nebo 47r/3 mají řád 3 a \ Sg | =3. Jejich příspěvek je tedy 6.
Konečně, zbývajících rotací (řádu 9 v D9) je 6 a nenechávají na místě žádný prvek, do celkové sumy tedy ničím nepřispívají.
Celkem dostáváme podle formule z Burnsidovy věty:
N
1 ^ 126
y |5 1 = — = 7.
t—1 18
geD9
Najděte si příslušných sedm různých náhrdelníků!
□
10.11. Určete počet obarvení políček tabulky 3x3 třemi barvami, považujeme-li za stejná obarvení, která na sebe přejdou při nějaké symetrii tabulky (tedy rotací nebo zrcadlením). O
Řešení. Grupa symetrií tabulky je grupou symetrií čtverce, tedy dihedrální grupa D4. Všech obarvení tabulky, pokud považujeme každé políčko za jedinečné, je 39. Na těchto obarveních nám tedy působí grupa G = D4. Postupně projdeme všechny symetrie g z G a určíme, kolik takových obarvení zachovávají:
. g =Id. \Sg\ =39.
• g je rotace o 90° či o 270° (= -90°). Při takové rotaci přejde libovolné rohové pole na sousední rohové pole, aby
595
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
Stejně tak lze snadno najít obrazce, které mají pouze rotační symetrie a jde tedy o komutativní grupy, které se v chemii značí jako C*. Říkáme jim cyklické grupy řádu k. K tomu postačí např. uvažovat pravidelný mnohoúhelník, u kterého nesymetricky, ale pořád stejně, pozměníme chování hran, viz. čerchované rozšíření trojúhelníku na obrázku. Všimněme si, že grupu C2 lze realizovat dvěma způsoby - buď jedinou netriviální rotací o tc nebo jediným zrcadlením.
Jako první ukázku síly našich abstraktních úvah dokážeme následující větu. Řekneme, že obrazec má diskrétní grupu symetrií, jestliže množina obrazů libovolného bodu při působení všemi prvky grupy je diskrétní podmnožinou v rovině (tj. všechny její body mají okolí, ve kterém už žádný další bod množiny není).
Všimněme si, že každá diskrétní grupa symetrií ohraničeného obrazce je nutně konečná.
Věta. Nechť je M ohraničená množina v rovině R2 s diskrétní grupou grupou symetrií G. Pak je grupa G buď triviální nebo jedna z grup Ck, Dk, sk > 1.
Důkaz. Kdyby nějaká množina M připouštěla jako svoji sy-y~""'"v metrii translaci, nemůže být ohraničená. Pokud by Sjf jě&, M připouštěla rotaci o úhel, jehož žádný celočíselný r%/T<(' násobek není 2tc (tj. rotaci o iracionální násobek ^JszL— 2tc), pak bychom iteracemi této rotace obdželi hustou podmnožinu obrazů na příslušné kružnici. Grupa symetrií by tedy nemohla být diskrétní.
Pokud by M připouštěla netriviální rotace s různými středy, opět nemůže být ohraničená. Napíšeme-li totiž příslušné rotace v komplexní rovině jako
R : z <-+ (z - a)í; + a, Q : r\z
pro komplexní jednotky £ = Q2mlk , n = e2711/1 a libovolné a /
0 e C, pak okamžitě vidíme
QoRoQ-1 : z i-> z + ari(l - f),
což je translace o netriviální vektor, pokud není úhel rotace Q nulový. Množina M by tedy nemohla být ohraničená.
Totéž platí pro případ, že by existovala rotační symetrie a zrcadlení podél přímky, která neprochází středem rotace.
Máme tedy k dispozici pouze rotace se společným středem a zrcadlení podél přímek tímto středem procházejících.
Zbývá tedy dokázat, že je celá grupa složena vždy buďpouze z rotací nebo vždy ze stejného počtu rotací a zrcadlení. Připomeňme, že vždy složením dvou různých zrcadlení dostáváme rotaci o úhel rovný polovině úhlu svíraného osami zrcadlení (viz 1.29). Proto je
1 naopak složením zrcadlení podle přímky p s rotací o úhel
H mezi dvěmi grupami G a H se , nazývá homomorfismus grup, jestliže respektuje *: „*' násobení, tj. pro všechny prvky a, b e G platí
f (a ■ b) = f (a) ■ f (b).
Povšimněme si, že násobení vlevo je uvnitř grupy G předtím, než zobrazujeme, zatímco vpravo jde o násobení v H poté, co zobrazujeme.
Přímo z definice se snadno ověří následující vlastnosti homo-morfismů:
Tvrzení. Pro každý homomorfismus f : G -> H grup platí
(1) obraz jednotky e e G je jednotka v H
(2) obraz inverze k prvku je inverzí obrazu, tj.
/(fl-1) = /(fl)-1.
(3) obraz podgrupy K C G je podgrupa f (K) C H.
(4) vzorem f-1 (K) C G podgrupy K G H je podgrupa.
(5) je-li f zároveň bijekcí, pak i inverzní zobrazení f~l je homomorfismus.
(6) f je injektivní zobrazení právě, když f-1 (e) — {e}.
Důkaz. Je-li K c G podgrupa, pak pro každé dva prvky y — f (a), z — f (b) v H nutně také y ■ z — f (a ■ b) patří do obrazu.
Potom g zachovává 34 různých obarvení. Takových rotací je celkem 3 + 6 = 9. - g je rotace o ±120°. Potom g zachovává opět 34 různých obarvení. Takových rotací je osm. Celkem je hledaný počet obarvení roven
^(38 + 6-32 + 17-34)
333.
□
10.13. Kolik různých náramků lze sestavit právě z devíti bílých, šesti červených a tří černých korálků? (dva náramky považujeme za stejné, pokud se liší pouze nějakou rotací v prostoru)
Řešení. Grupa symetrií náramku je dihedrální grupa Z)18 o 36 prvcích. Ta operuje na množině náramků, kde máme pevně očíslovaná místa na náramku (od jedné do osmnácti), těch je 18!/(9!6!3!) = 4084080. Symetrie, které zachovávají nenulový počet takovýchto náramků jsou zjevně pouze rotace o 120° a 240° a zrcadlení podle osy procházející protějšími vrcholy (takových je devět) a samozřejmě identita. Podle Burnsidova lematu je hledaný počet náramků roven
-í-(4084080+ 2 36 \ 3
+ 9
) = 113590.
□
10.14. Určete kolik existuje náramků sestavených z právě šesti stejných bílých, šesti stejných červených a šesti stejných černých korálků, přičemž dva náramky považujeme za stejné, pokud se Uší nějakou rotací (v prostoru). O
10.15. Určete kolik existuje náramků sestavených z právě osmi stejných bílých, osmi stejných červených a osmi stejných černých korálků, přičemž dva náramky považujeme za stejné, pokud se Uší nějakou rotací (v prostoru). O
10.16. Kolik existuje náramků složených ze tří stejných bílých a šesti stejných černých korálků, považujeme-li dva náramky za stejné, lze-U jeden na druhý převést rotací (v prostoru)? O
10.17. Rozložte nad C a nad R mnohočlen
x4 +2x3 +3x2 +2x + 1.
Řešení. Přiklad lze řešit jak hledáním největšího společného dělitele s derivací, tak jako reciprokou rovnici:
• Spočítejme Eukleidovým algoritmem největšího společného dělitele daného polynomu a jeho derivace 4x3 +6x2 +6x +2. Největší společný dělitel je dán v Ubovolném okruhu až
597
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
Je proto vždy obrazem podgrupy opět podpologrupa (tj. bude to podgrupa, pokud obraz nutně obsahuje i inverze a jednotku).
Specielně, triviální podgrupa {e} má za obraz opět podpolo-grupu. Protože z rovnosti z ■ z — zv grupě H vynásobením prvkem z-1 dostáváme z — e, ověřili jsme, že jedinou jednoprvkovou podpologrupou v grupě je triviálni podgrupa {e}. Zejména tedy f (e) = e.
Přímo z definice homomorphismu nyní vidíme, že
f (a-1) ■ f (a) = f (e) = e,
tj. f(a)~l — f(a~l). Dokázali jsme tedy první tři tvrzení.
Stejně postupujeme u vzorů: jestliže a, b e G splňují f (a), f (b) e K c H, potom také f (a ■ b) e K.
Předpokládejme, že existuje inverzní zobrazení g — f~l a zvolme libovolné y — f (a), z — f (b) e H. Pak f (a -b) — y-z — f (a)-f (b), cožje ekvivalentní výrazu g (;y)g (z) — a-b — g(y-z). Je tedy inverze skutečně homomorfismem.
Pokud platí f (a) = f (b), pak f (a ■ b~l) = e e H. Pokud je tedy jediným vzorem jednotky v H jednotka v G, pak a- b-1 — e, tj. a — b. Opačná implikace je zřejmá. □
Podgrupa f~1(e) jednotkového prvku e e H se nazývá jádro homomorfismu / a značíme ji ker /. Bijektivní homomorfismus grup nazýváme izomorfismus.
Z předchozích tvrzení okamžitě vyplývá, že homomorfismus / : G -> H s triviálním jádrem je izomorfismem na obraz f(G).
10.6. Příklady. Grupy zbytkových tříd j sou izomorfní grupám komplexních &-tých odmocnin z jedničky, což jsou zároveň izomorfní obrazy konečných grup otočení v -r^ rovině o celé násobky úhlu 2it/k. Nakreslete si obrázek, počítání s tzv. komplexními jednotkami e2m/k je velmi efektivní.
Zobrazení exp : R -> R+ je izomorfismus aditivní grupy reálných čísel na multiplikativní grupu kladných reálných čísel.
Tento izomorfismus se přirozeně rozšiřuje na morfismus exp : C -> C \ 0 aditivní grupy komplexních čísel na multiplikativní grupu všech nenulových komplexních čísel. Pro komplexní čísla přitom ale dostáváme netriviální jádro. Viděli jsme totiž, že zúžení exp na ryze imaginární čísla (což je podgrupa izomorfní R) je homomorfismem
it h-> e" — cos t + i sin t,
tzn. že čísla 2kiti, k e Z, jsou v jádru. Snadno se dopočítá, že je to celé jádro. Je-li totiž es+lt — e" ■ elt — 1 pro reálná jař, musí být e" — 1, tj. s — 0, a pak zbývá pouze t — 2kit pro libovolné celé k.
Determinant matice je zobrazením, které každé matici skalárů z K přiřazuje nějaký skalár v K (pracovali jsme s K — Z, Q, R, C). Cauchyova věta o determinantu součinu čtvercových matic
det(A • B) = (det A) ■ (det B)
je tedy tvrzením, že pro grupu G — GL(n,l je det: G —>• K \ 0 homomorfismem grup.
i invertibilních matic
na násobek jednotky a i v průběhu Eukleidova algoritmu můžeme mezivýsledky násobit jednotkami daného okruhu. V případě okruhu polynomů nad okruhem skalárů jsou jednotky právě všechny skaláry. Násobíme tak, abychom se v co nej větší míře vyhnuli počítání se zlomky.
2x4 + 4x3 + 6x2 + 4x + 2 : 2x3 + 3x2 + 3x + 1 = x + 2x4 + 3x3 + 3x2 + x
1
x3 +3x2 +3x +2
3 3 2 3 1 x5 + -xl + -x + -2 2 2
-xŕ + -x + -2 2 2
10.7. Součin grup. Jestliže máme k dispozici dvě grupy, můžeme snadno vytvořit složitější grupu následující konstrukcí:
Dále dělíme polynom 2x3 + 3x2 + 3x + 1 zbytkem \x2 + |x + | (pronásobeným jednotkou |)
2x3 + 3x2 + 3x + 1 : x2 + x + 1 = 2x + 1 2x3 + 2x2 + 2x x2 + x + 1
Násobné kořeny původního polynomu jsou právě kořeny největšflio společného dělitele tohoto polynomu se svojí derivací, tedy kořeny polynomu x2+x+\. Tento má právě kořeny — \ ± i\/3/2, které jsou dvojnásobnými kořeny původního polynomu. Rozklad polynomu nad C je tedy rozkladem na součin kořenových činitelů (tak je tomu podle základní věty algebry vždy):
x4 + 2x3 + 3x2 + 2x + 1 = (x + l - i^Ýix + i + i^-)2.
2 2 2 2
Rozklad nad R pak dostaneme vynásobením kořenových závorek odpovídajících komplexně sdruženým kořenům polynomu (tento součin musí být polynom s reálnými koeficienty, ověřte!):
x4 + 2x3 + 3x2 + 2x + 1 = (x2 + x + l)2. • Řešme rovnici
x4 + 2x3 + 3x2 + 2x + 1 = 0. Vydělením x2 a substitucí t = x + \- dostáváme rovnici
ř2 + 2t + 1 = 0,
s dvojnásobným kořenem — 1. Dosazením do substituce dostáváme již známou rovnici x2 +x +1 = 0 s výše uvedenými řešeními.
598
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
Součin grup
Pro každé dvě grupy G, H definujeme součin grup G x H takto: Jako množina je G x H skutečně součin a násobení definujeme po složkách, tj.
(a, x) ■ (b, y) — (a ■ b,x ■ y)
kde nalevo vystupuje součin, který definujeme, zatímco napravo používáme tečku k naznačení součinů v jednotlivých grupách G a H.
Projekce na jednotlivé komponenty G a H v součinu,
PG
H 3 (a, b) i-> a e G, pu '■ G x H b (a, b) i-> b
jsou surjektivní homomorfismy grup s jádry
ker pá = {(eG,b); b e H} ~ H kerpH — {(a, eH); a e G} — G.
Grupa je izomorfní součinu Z2 x Z3. Docela snadno můžeme toto tvrzení vidět při multiplikativní realizaci grup zbytkových tříd Z* jakožto komplexních &-tých odmocnin z jedničky. Skutečně tak vidíme, že Zg je tvořeno body na jednotkové kružnici v komplexní rovině ve vrcholech pravidleného šestiúhelníku, Z2 pak odpovídá ±1, Z3 pravidelnému trojúhelníku s jedním vrcholem v jedničce. Jestliže budeme ztotožňovat příslušné body s otočeními v rovině, které jedničku převede právě do nich, pak skládání dvou takových otočení bude vždy komutativní a kombinacemi jednoho otočení ze Z2 a jednoho ze Z3 dostaneme právě všechna otočení ze Nakreslete si obrázek! Takto tedy dostaneme (při obvyklejší aditivní notaci pro zbytkové třídy) izomorfismus:
[0]6 [1]6 [2]6 [3]6 [4]6 [5]6
([0]2, [0]3) ([lh, [2]3) ([0]2, [1]3) ([1]2, [0]3) ([0]2, [2]3) ([1]2, [1]3)
V zápětí uvidíme, že jsou podobné konstrukce k dispozici pro konečné komutativní grupy úplně obecně.
10.8. Komutativní grupy. Libovolný prvek a v grupě G je obsažen v minimální podgrupě {a, a2, a3,...}, která jej obsahuje. Je zjevné, že je tato podgrupa komutativní, a pokud je celá grupa G konečná, nutně musí jednou nastat případ ak — e. Nejmenší k s touto vlastností nazýváme řád prvku a v G. Grupa G je cyklická grupa je-li celé G generované nějakým svým prvkem a výše uvedeným způsobem. Pokud je řád k generátoru grupy konečný, jde právě o grupy C\ z naší diskuse symetrií obrazců v rovině.
Z definice přímo vyplývá, že každá cyklická grupa je izomorfní buď grupě celých čísel Z (pokud je nekonečná) nebo některé grupě zbytkových tříd Z* (když je konečná). Ve skutečnosti z takových jednoduchých stavebních kamenů můžeme poskládat všechny konečné komutativní grupy.
Věta. Každá konečná komutativní grupa G je izomorfní součinu cyklických grup C\.
□
10.18. Poznámka. Připomeňme na tomto místě známé tvrzení, že jedinými ireducibilnímy polynomy nad R jsou lineární polynomy a kvadratické polynomy se záporným diskriminantem. Toto tvrzení vyplývá i z úvah v předchozím příkladě.
10.19. Rozložte polynom
x5 + 3x3 + 3
na ireducibilní složky nad
i) Q
ii) Z7 Řešení.
i) Podle Eisensteinova kriteria je daný polynom ireducibilní nad Z i Q (použijeme prvočíslo 3)
ii) (x — l)2(x3 +2x2 —x+3). Např. pomocí Homérova schématu zjistíme dvojnásobný kořen 1. Po vydělení polynomem (x — l)2 dostáváme polynom (x3 + 2x2 — x + 3), který již nemá nad Z7 kořeny. Proto je ireducibilní (kdyby byl rozložitelný, musel by mít jeden faktor stupeň jedna, tedy (x3 +2x2 —x+3) by musel mít kořen).
□
10.20. Rozložte polynom x4 + 1 nad
Řešení.
(x
• (x2 + x + 2)(x2 + 2x + 2)
• Kořeny jsou všechy čtvrté odmocniny z —1, ty leží v komplexní rovině na jednotkové kružnici a mají argumenty postupně 7T/4, 7t/4 + 7T/2, 7t/4 + 7T a 7T/4 + 37T/2, jsou to tedy čísla ±V2/2 ± /V2/2. Rozklad tedy je
72 .75 V2 ,y/2 V2 .V2~ 72 .75
— -i—)(x- — + l—)(x + — -l—)(x- — + l—).
• Vynásobením kořenových činitelů komplexně sdružených kořenů v rozkladu nad C dostáváme rozklad nad R:
(x2 - V2x + l)(x2 + V2x + 1).
□
599
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
Je-lin — ■ ■ ■ p/ rozklad přirozeného čísla n na prvočísla, pak je grupa Cn izomorfní součinu
Cti — C k\ X • • • X C kr .
Důkaz. Obecné první tvrzení věty zde vůbec nebudeme dokazovat. Kompletní důkaz lze najít např. v [?]. Několika poznámkami se ještě k problematice vrátíme v odstavci 10.12.
Důkaz druhého tvrzení začneme jednodušším speciálním případem, kdy n — pq s nesoudělnými p a q. Zvolme generátory a grupy C„, b grupy Cp a c grupy Cq. Nabízí se definovat zobrazení / : C„ -> Cp x Cq vztahem
f(ak) = (bk, ck).
Protože platí ak ■ a1 — ak+l a podobně pro bac, dostáváme
f(ak ■ a") = (bk+l, ck+l) = (bk, ck) ■ (bl, cl)
a jde tedy o homomorfismus. Jestliže je obrazem jednotka, pak k musí být zíroveň násobkem p iq. Protože jsou p a q nesoudělné, znamená to, že je k i násobkem n a je proto / injektivní. Přitom zřejmě mají grupy C„ i Cp x Cq stejně prvků, takže jde o izomor-fismus. Odtud již vyplývá tvrzení věty o rozkladu cyklických grup řádu k na součiny menších cyklických grup. □
Všimněme si, že naopak Cpi nikdy není izomorfní součinu CpxCp. Zatímco Cpi je totiž generované prvkem řádu p2, největší dostupný řád prvku v Cp x Cp je jenom p.
Vzhledem k tomu, že všechny konečné komutativní grupy jsou izomorfní součinu cyklických grup, můžeme pro malé počty prvků najít všechny takové grupy až na izomorfismus. Např. máme jen dvě grupy s 12 prvky
Cl2 = C4 X C3, C2XC2XC3 = C2X C6.
Podobně si můžeme povšimnout, že mají-li všechny prvky v grupě G kromě jednotky řád 2, pak jde o grupu (Ci)n pro nějaké n, zejména tedy má 2" prvků. Skutečně, kdybychom totiž v rozkladu G na součin cyklických grup povolili Cp s p > 2, pak by tam nutně musely vzniknout prvky vyššího řádu.
10.9. Rozklady podle podgrup. Volbou libovolné podgrupy H v grupě G dostáváme další informace o struktuře celé grupy. Na množině prvků grupy G nyní definujeme relaci a ~# b jestliže b~1 -a e H. Snadno ověříme, že je takto definována relace ekvivalence: Platia-1 -a — e e H, je tedy relace reflexivní. Je-li b~l -a — h € H, potom a~l ■ b — (b~l ■ a)~l — h~l e H, je proto relace symetrická. Konečně, je-li c~l ■ b e H a zároveň je b~l ■ a e H, potom c~1 - a — c~1 -b-b~l - a e H, ověřili jsme tedy i tranzivitu.
Celá grupa G se proto jako množina rozpadá na tzv. levé třídy rozkladu podle podgrupy H vzájemně ekvivalentních prvků. Třídu příslušející prvku a značíme a ■ H a skutečně platí, že
a ■ H — {a ■ h; h e H},
neboť prvek b je ve stejné třídě s a, právě když jde takovýmto způsobem vyjádřit.
Množinu všech levých tříd rozkladu podle podgrupy H označujeme G/H.
Obdobně definujeme pravé třídy rozkladu Ha. Příslušná ekvivalence je: a ~ Z?, jestliže a ■ b~l e H. Proto
H\G = {H a; a eG).
10.21. Nalezněte polynom s racionálními koeficienty a s co nejmenším stupněm, jehož kořenem je číslo 20V2.
Řešení. P(x) = x2001 — 2. Ukažme, že neexistuje polynom menšího stupně s kořenem 2m^/2. Buď totiž Q(x) nenulový polynom nejmenšflio stupně s kořenem 2m^/2. Pak st Q(x) < 2007. Vydělme P(x) polynomem Q(x) se zbytkem: P(x) = Q(x) ■ D(x) + R(x), kde D(x) je neúplný podíl po dělení a R(x) zbytek po dělení, sti?(x) < st Q(x), nebo R(x) = 0. Dosazením čísla 201\/2 do poslední rovnice vidíme, že 201\/2 je kořenem i polynomu R(x), z definice polynomu Q(x) musí být tedy R(x) nulový polynom, tedy Q(x) dělí P(x). Polynom P(x) je však ireducibilní (podle Eisensteinova kriteria), jeho jediným netriviálním dělitelem je on sám (až na násobení jednotkou okruhu polynomů nad Q, tedy racionální konstantou), je tedy Q(x) = P(x) (opět až na pronásobení jednotkou). Například polynom |x2007 — | také splňuje podmínky zadání. Normovaný polynom splňující tyto podmínky je však již jediný a je to polynom P (x). □
10.22. Najděte všechny irreducibilní polynomy stupně nejvýše 2 nad Z3.
Řešení. Nerozložitelné jsou z definice všechny lineární mnohočleny. Nerozložitelné polynomy stupně dva dostame tak, že z množiny všech polynomů stupně 2 nad Z3 „vyškrtáme" rozložitelné polynomy, tedy násobky dvojic lineáních polynomů. Reducibilní polynomy stupně dva jsou tedy: (x + l)2 = x2 + 2x + 1, (x + 2)2 = x2 + x + 1, (2x + l)2 = (2 • (x + 2))2 = x2 + x + 1, (2x + 2) = x2 + 2x + 1, x2, x(x + 1) = x2 + x, x(x +2) = x2 + 2x. Stačí uvažovat pouze normované polynomy, ostatní z nich dostaneme násobením dvojkou (rozmysli). Celkem normované ireducibilní polynomy stupně 2 nad Z3 jsou x2 + 2x + 2, x2 + x + 2, x2 + 1. □
10.23. Rozhodněte, zda je následující polynom nad Z3 ireducibilní, případně nalezněte jeho rozklad:
x4 + x3 + x + 2
Řešení. Dosazením čísel 0, 1, 2 zjistíme, že daný polynom nemá v Z3 kořen. Je tedy buď ireducibilní nebo je součinem dvou polynomů stupně 2. Vzhledem k tomu, že daný polynom je normovaný, tak je-li součinem nějakých dvou polynomů stupně dva, je součinem i normovaných polynomů stupně dva (po případném pronásobení obou polynomů dvojkou). Hledejme tedy konstanty a, b,c,d e Z3 tak, aby
x4+x3+x+2 = (x2 +ax+b) (x2 +cx+d) = x4 +(a+c)x3 +(ac+b+d)x2 +(ad+bc)x+i
600
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
Tvrzení. Pro třídy rozkladu grupy G podle podgrupy H platí:
(1) Levé a pravé třídy rozkladu podle podgrupy H C G splývají právě, když pro každé a e G, h e H platí
a ■ h ■ a-1 € H.
(2) Všechny třídy (levé i pravé) mají shodnou mohutnost s pod-grupou H.
Důkaz. Obě vlastnosti vyplývají bezprostředně z definičních vlastností. V prvém případě chceme, aby pro jakékoliv a e G, h e H platilo h ■ a — a ■ h' pro vhodné h' e H. To ale nastane právě tehdy, když a~l ■ h ■ a — h' e H.
Ve druhém případě si stačí uvědomit, že pokud a - h — a - h', pak také vynásobením a~l zleva obdržíme h — h'. □
Jako okamžitý důsledek předchozího jednoduchého tvrzení dostáváme
10.10. Věta. Nechť G je konečná grupa s n prvky, H její podgrupa. Potom
(1) Mohutnost n — \G\ je součinem mohutnosti H a mohutnosti G/H, tj.
\G\ = \G/H\-\H\
(2) Přirozené číslo \H\je dělitelem čísla n.
(3) Je-li a € G prvek řádu k, pak k dělí n.
(4) Pro každé a e G je a" — e.
(5) Je-li mohutnost grupy G prvočíslo, pak je G izomorfní cyklické grupě 7Ln.
Druhému tvrzení se říkává Lagrangeova věta, předposlednímu malá Fermatova věta.
Důkaz. Viděli j sme, že každá třída levého rozkladu má právě | H | prvků. Přitom dvě různé třídy rozkladu musí mít nutně prázdný průnik. Odtud vyplývá první tvrzení.
Druhé tvrzení je okamžitým důsledkem prvního.
Každý prvek a e G generuje cyklickou podgrupu {a, a2, ..., ak — e] a právě počet prvků této podgrupy je řádem prvku a. Proto musí řád dělit počet prvků v G.
Jelikož je řád k prvku a dělitelem čísla n a ak — e, je také a" — (ak)s — e pro nějaké s.
Jestliže je n > 1, pak existuje prvek a e G různý od jednotky e. Jeho řád je přirozené číslo k různé od jedničky a nutně dělí n. Proto musí být k rovno n. Pak ovšem jsou všechny prvky G tvaru ak pro k — 1,..., n. □
Tady určitě přijdou nějaké reminiscence z elementární teorie čísel!
10.11. Normální podgrupy a faktorgrupy. Podgrupy H, pro které platí, že a ■ h - a'1 e H pro všechny a e G,
KU h € H, se nazývají normální podgrupy.
Pro normální podgrupy je dobře definováno násobení na G/H vztahem
(a ■ H) ■ (b ■ H) = (a ■ b) ■ H. Skutečně, volbou jiných reprezentantů a ■ h,b ■ h' dostaneme opět stejný výsledek
(a-h-b-tí)- H = ((a-b) - (b~l ■ h ■ b) ■ h') ■ H — (a ■ b) ■ H.
Totéž si můžeme odůvodnit tak, že nezáleží na tom jestli pracujeme s pravými nebo levými třídami. Můžeme proto rovnou naše třídy
Porovnáním koeficientů u jednotlivých mocnin x dostáváme soustavu čtyř rovnic o čtyřech neznámých:
1 = a + c
0 = ac + b + d
1 = ad + bc
2 = bd
Z poslední rovnice je jedno z čísel b, d rovno jedné, druhé pak dvěma, vzhledem k symetrii soustavy vůči dvojicím (a,b) a (c,d) můžeme zvolit například b = 1, d = 2. Z druhé rovnice potom a c = 0, tedy jedno z čísel a, b je nula, z první rovnice je pak druhé z nich jednička. Ze třetí rovnice 2a + c = 1, je tedy a = 0, c = 1. Celkem
x4 + x3 + x + 2 = (x2 + l)(x2 + x + 2).
□
10.24. Pro libovolné Uché prvočíslo p určete všechny kořeny polynomu
P(x) = xp~2 + xp~3 + ■ ■ ■ + x + 2
v tělese Zp.
Řešení. Vzhledem k rovnosti
x"'1 - 1 = (x - l)(P(x) - 1)
jsou všechna čísla ze Zp kromě jedničky kořeny P(x) — 1, nemohou tedy být kořeny P(x) + 1. Jednička je kořenem triviálně vždy, je to tedy jediný kořen. □
10.25. Rozložte na ireducibilní faktory R[x] a poté v C[x] polynom
4x5 - 8x4 + 9x3 - lx2 + 3x - 1.
O
10.26. Rozložte na ireducibilní faktory vl[i]a poté v C[x] polynom
x5 + 3x4 + lx3 + 9x2 + 8x + 4.
O
10.27. Rozložte polynom x4 - 4x3 + \0x2 -\2x+9 nad R a nad C.
O
10.28. Rozhodněte, zda je následující polynom nad Z3 ireducibilní, případně nalezněte jeho rozklad na ireducibilní faktory:
x5 + x2 + 2x + 1
O
601
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
psát jako H a - H & potom snadno definujeme (H - a) ■ (b ■ H) — H ■ (a ■ b) ■ H.
Zřejmě jsou splněny pro nové násobení naG/H všechny vlastnosti grupy: jednotkou je sama grupa H jakožto třída e ■ H jednotky, inverzí k a ■ H je zřejmě a~l Ha asociativita násobení je zřejmá z definice. Hovoříme o faktorové grupě G/H grupy G podle normální podgrupy H.
V komutativních grupách jsou samozřejmě všechny podgrupy normální. Podmnožina
10.29. Rozhodněte, zda je následující polynom nad Z3 ireducibilní, případně nalezněte jeho rozklad:
n£, — \na: a e
C
zadává v celých číslech podgrupu a její faktorgrupou je právě (aditivní) grupa zbytkových tříd Z„.
Z definice je zřejmé, že všechna jádra homomorfismů jsou normální podgrupy. Naopak, jestliže je podgrupa H G G normální, pak zobrazení
p:G^ G/H, a i-> a- H
je surjektivní homomorfismus grup s jádrem H. Skutečně, p je dobře definované, přímo z definice násobení na G/H je vidět, že p je homomorfismus, a p je zjevně surjektivní. Je tedy vidět, že normální podgrupy jsou právě všechna jádra homomorfismů.
Dále, pro libovolný homomorfismus grup / : G -> K s jádrem H — ker / je dobře definován také homomorfismus
/:G/ker/-»tf, f(a-H) = f(a),
který je injektivní.
Zdánlivě paradoxní je příklad homomorfismů grup C* -> C*, který je definovaný na nenulových komplexních číslech vztahem z i-> zk s přirozeným k. Zjevně jde o surjektivní homomorfismus a jeho jádro je množina &-tých odmocnin z jedničky, tj. cyklická podgrupa Z*. Předchozí úvaha tedy dává pro všechna přirozená k izomorfismus
/ : CVZjfc -* C*. Tento příklad ukazuje, že u nekonečných grup nejsou počty s mohutnostmi tak přehledné jako tomu bylo u konečných grup ve Větě 10.10.
10.12. Exaktní posloupnosti. Kdykoliv zvolíme normální podgrupu H v grupě G, dostáváme tzv. krátkou exaktní posloupnost grup
e -* H -* G -* G/H -* e,
kde šipky postupně znázorňují jediný homomorfismus triviální grupy {e} do grupy H, vložení t podgrupy H c G, projekci v na faktorgrupu G/H a, konečně, jediný morfismus grupy G/H na triviální grupu {e}. Ve všech případech je vidět, že obraz předcházející šipky je přesně jádrem následující. To je definice exaktnosti posloupnosti homomorfismů.
Jesliže existuje homomorfismus er : G/H -> G, takový že v o g — id<3/H, říkáme, že se naše exaktní posloupnost štěpí.
Lemma. Každá rozštěpená krátká exatkníposloupnost komutativních grup zadává izomorfismus G — H x G/H.
Důkaz. Definujeme zobrazeni / : H x G/H -> G vztahem
/ (a, b) — a ■ a (b).
Protože pracujeme s komutativními grupami, jde zjevně o homomorfismus:
f(aa', bb') = aa'a(b)a(b') = (aa(b))(a'a(b')).
x4 + 2x5 + 2
O
10.30. Určete všechny normované ireducibilní polynomy stupně 2 nad Z5.
Řešení. Polynomy určíme vylučovací metodou. Ze všech polynomů stupně dva nad Z5 vyloučíme všechny, které nejsou ireducibilní, tedy mají kořen.
x2 ± 2, x±x + 2, x2 ± 2x — 2, x2 — x ± 1, x2 ± 2x — 1. □
10.31. Uvažujme (7, 3) lineární kód generovaný polynomem x4 +x2 + x + 1. Napište jeho generující a kontrolní matice, metodou vedoucích representantů dekódujte přijatou zprávu 1010001 za předpokladu, že při přenosu došlo k minimálnímu možnému počtu chyb. O
A. Špetka Booleových algeber a svazů
10.32. Volební skříňka pro tři voliče je skříňka, která zpracuje hlasy tří voličů a jejím výstupem je výsledek „ano", pokud byla pro většina z voličů. Navrhnete takovou skříňku složenou z přepínačových obvodů.
O
10.33. Naleznete (úplnou) disjunktivní normální formu výrazu
(B' A [(A v C) A B]'
O
Řešení. Obsahuj e-li formule relativně málo proměnných (v našem případě tři), je nejvýhodnější sestavit pravděpodobnostní tabulku daného výrazu a z ní úplnou disjunktivní normální formu odečíst. Tabulka bude obsahovat 23 = 8 řádků:
A B c B' C ((A v C) A B)' (B' C) A ((A
0 0 0 0 1 0
0 0 1 1 1 1
0 1 0 1 1 1
0 1 1 1 0 0
1 0 0 0 1 0
1 0 1 1 1 1
1 1 0 1 0 0
1 1 1 1 0 0
Výsledná úplná disjunktivní normální forma je dána disjunkcí formulí odpovídajícím řádkům, které mají v posledním sloupečku jedničku (daná formule je pro danou volbu základních proměnných pravdivá). Řádku pak odpovídá konjunkce daných proměnných (jeli hodnota proměnné 1), případně jejich negací (je-li hodnota 0). V
602
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
Jestliže f (a, b) — e, pak a (b)
e H, tj. b = v(o(b))
je tedy jednotkový prvek w G/H. Pak ovšem jeho obraz musí být a(b) — eajeprotoia — e. Protože j sou levé a pravé třídy rozkladu u komutativních grup totožné, je zobrazení / zjevně surjektivní. Dokázali jsme tedy, že je / izomorfismus. □
Můžeme nyní naznačit hlavní ideu důkazu Věty 10.8. Kdy-^\ bychom totiž věděli, že se všechny krátké exaktní posloupnosti vzniklé volbou cyklických podgrup H v konečných komutativních grupách G štěpí, pak bychom snadno důkaz vedli indukcí. V grupě G o mohutnosti n, která není cycklická, bychom totiž zvolili prvek s řádem p < n a našli jím generovanou cyklickou podgrupu H a štěpení příslušné krátké exaktní posloupnosti. Tím bychom dostali grupu G vyjádřenou jako součin zvolené cyklické podgrupy H a grupy G/H s mohutností n/p.
Hlavním technickým bodem důkazu tedy je ověření, že v každé konečné komutativní grupě najdeme prvky řádu pr s patřičnými mocninami prvočíselných p a že se skutečně výše uvedené krátké exaktní posloupnosti pro tyto grupy štěpí.
10.13. Akce grupy. Již jsme viděli, že často potkáváme grupy jako množiny transformací nějaké pevné množiny. Musí přitom být všechny invertibilní a zároveň musí být naše množina transformací uzavřená na skládání. Často ale také chceme pracovat s pevně zvolenou grupou, jejíž prvky reprezentujeme jako zobrazení na nějaké množině, přitom ale ne nutně jsou zobrazení příslušná různým prvkům grupy různá. Např. všechna otočení roviny kolem počátku o všechny možné úhly odpovídají grupě reálných čísel. Otočení o 2it je ale identické zobrazení.
Formálně si můžeme takovou situaci popsat následovně.
mt^m^^m____^_| Akce grupy |__^
I Levá akce grupy G na množině S je homomorfismus grupy G do podgrupy invertibilních prvků v pologrupě Ss všech zobrazení S -> S. Takový homomorfismus si také můžeme představit jako zobrazení
S, které splňuje
(p(a ■ b, x) — (p(a, (p(b, x)),
odtud název „levá akce". Často budeme k vyjádření akce prvku grupy na prvku S používat pouze zápis a ■ x (byť jde o jinou tečku než u násobení uvnitř grup). Definiční vlastnost pak vypadá takto:
(a ■ b) ■ x — a ■ (b ■ x).
Obraz prvku x e S v akci celé grupy G nazýváme orbita Sx prvku x, tj.
$x = [y = V(a, x); a € G}.
Pro každý bod x e S definujeme izotropní podgrupu Gx c G akce
pomocí spojek a a v, de Morganových pravidel a distributivních zákonů:
(£' a [(A v C) a B]'
(B v O a [(A v Q' v B']
(B v O a [(A'a C) v B']
[(B vC) a (A'a C')] v[(B vC) a 5']
[(B a A' a C) v (C a A' a C')] v [(B a B') v (C a B')] <
(B a A' a C) v (Ca B'),
což již je (neúplná) disjunktivní normální forma dané formule. Tato formule je zjevně ekvivalentní úplné disjunktivní normální formě dané formule, kterou jsme odvodili z tabulky (slovo „úplná" znamená, že se ve formuli objevují pouze konjunkce všech tří proměnných či jejich negací). □
10.34. Nalezněte disjuktivní normální formu výrazu
((A a B) v O ' a (A' v (B a C a D))
O
V logice známe několik logických spojek: a, v, =>, =. A také operátor '. Libovolnou výrokovou formuli užívajících těchto spojek lze pravdivostně ekvivalentně zapsat použitím pouze některých z nich, například spojkou v a operátorem '. Existují i spojky NAND a NOR (A NAND B = (A a B)', A NOR B = (Av B)'). Tyto spojky mají tu vlastnost, že pomocí pouze jedné znich lze pravdivostně ekvivalentně zapsat libovolnou výrokovou formuli (čtenář si rozmyslí, že uvedené základní spojky i operátor ' lze pomocí jak spojky NAND, tak pouze pomocí spojky NOR ekvivalentně vyjádřit. Tyto spojky lze implementovat v elektrických obvodech pomocí tzv. „brán".
10.35. Vyjádřete výrokovou formuli (A =^ B) pomocí obvodu obsahujícího pouze hradlo NAND. O
10.36. Nalezněte konečnou podmnožinu množiny kladných celých čísel takovou, že pokud ji uvážíme jako uspořádanou množinu, kde relace uspořádání je dána relací dělitelnosti, tak se nebude jednat o svaz. O
603
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
Jestliže zvolíme dva body x, y e S a prvek g e G zobrazující x an y = g ■ x, pak je zjevně množina {ghg~l; h e Gx] izotropní podgrupou Gy. Zobrazení h \-> ghg~l je přitom homomorfismem grup Gx -* Gy.
Snadno se vidí, že u tranzitivních akcí je celý prostor jedinou orbitou a všechny izotropní podgrupy mají stejnou mohutnost.
Jako příklad tranzitivní akce konečné grupy můžeme uvést např. zjevnou akci grupy permutací pevně zvolené množiny X na samotné množině X. Přirozená akce všech invertibilních lineárních transformací na nenulových prvcích vektorového prostoru V je také tranzitivní. Pokud vezmeme ale prostor V celý, je nulový vektor zvláštní orbitou.
Výše uváděný příklad akce aditivní grupy reálných čísel prostřednictvím rotací kolem pevného středu O v rovině není tranzitivní. Orbity jednotlivých bodů jsou právě kružnice se středem O procházející těmito body.
Typický příklad tranzitivní akce grupy G je přirozená akce na množině levých tříd G/H pro jakoukoliv podgrupu H. Definujeme ji vztahem
g ■ (aH) = (ga)H.
Snadno ukážeme, že takto v podstatě vypadají všechny tranzitivní akce grup. Pro libolnou tranzitivní akci G x 5 ^ 5 a pevně zvolený bod x e G můžeme totiž ztotožnit 5 s množinou levých tříd G/Gx pomocí vztahu gGx i-> g ■ x. Toto zobrazení je zjevně surjektivní a obrazy g ■ x = h ■ x splývají právě když h~lg e Gx a to je ekvivalentní s gGx = hGx. Konečně si všimněme, že toto ztotožnění převádí původní akci G na 5 právě na výše uvedenou akci G na G/Gx.
10.14. Věta. Pro každou akci konečné grupy G na konečné množině S platí:
(1) Pro každý prvek x e S je
\G\ = \GX\-\SX\.
(2) (Burnsidovo lemma) Je-li N počet orbit akce G na S pak
geG
kde Sg = {x € 5; g ■ x = x} označuje množinu pevných bodů akce prvku g.
Důkaz. Uvažme libovolný bod x e S a izotropní podgrupu Gx c G tohoto bodu. Stejný argument j ako na konci minulého odstavce u tranzitivních grup můžeme uplatnit na každou akci grupy G. Dostáváme zobrazení G/Gx -> Sx, g ■ Gx i-> g ■ x. Pokud (g-Sx)-x = (h ■ Sx)-x, pak zjevně g~lh e Sx, je tedy našezobra-zaní injektvní. Zároveň je zjevně surjektivní, proto pro mohutnosti našich konečných množin platí \G/GX\ = 15*1. Odtud již vyplývá první vlastnost z věty, protože \ G\ = \G/GX \ ■ \GX\.
Druhé tvrzení dokážeme tak, že dvěma způsoby spočteme mohutnost množiny pevných bodů akce:
F = {(x, g) e S x G; g (x) = x} c 5 x G.
Protože jde o konečné množiny, můžeme si představit prvky součinu S x G jako prvky v matici (sloupce označujeme prvky v 5, řádky pak podle prvků v G). Sčítáním po řádcích i sloupcích obdržíme
geG xeS
B. Kódy
10.37. Uvažujme (7, 3) lineární kód generovaný polynomem x4 +x3 + x + 1. Napište jeho generující a kontrolní matice, metodou vedoucích reprezentantů dekódujte přij atou zprávu 1110010. O
10.38. Určete inverze prvků 17, 18 a 19 v (Z*31, •), tedy v grupě invertibilních prvků ze Z131 s operací násobení.
Řešení. Nalezneme pomocí Eukleidova algoritmu: 131 =7-17 + 12, 17 = 12 + 5, 12 = 2-5 + 2, 5 = 2-2 + 1,
je tedy 1 = 5- 2- 2 = 5- 2(12 - 2-5) = 5- 5- 2-12 = 5 • (17 - 12) - 2 • 12 = 5 • 17 - 7 • 12 = = 5 • 17 - 7 • (131 - 7 • 17) = 54 • 17 - 7 • 131,
inverze k 17 je 54.
Obdobně [18]"1 = 51 a [19]"1 = 69.
□
10.39. Nalezněte inverzi prvku [49]z253 v Z253 O
10.40. Nalezněte inverzi prvku [37]Z208 v Z2os- O
10.41. Nalezněte inverzi prvku [57]Z359 v Z359. O
10.42. Nalezněte inverzi prvku [17]Z40 v Z40. O
10.43. Eulerova funkce. Eulerova funkce
N udává počet čísel nepřevyšujících n s číslem n nesoudělných. Je-li n = ]~[/=i pT rozklad přirozeného čísla n na prvočísla, pak
s
Zm x Z„ vztahem
f([x\mn) = ([-*-]m> [-*-]«)•
To je zjevně homomorfismem aditivních grup a zároveň přímý výpočet ukazuje, že jde i o homomorfismus multiplikativních grup, který jedničku zobrazuje na jedničku. □
605
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
(1) 0 • c — c ■ 0 = 0 pro všechny c e K,
(2) — c — (— 1) • c — c ■ (— 1) pro všechny c e K,
(3) —(c ■ d) — (—c) ■ d — c ■ (—d) pro všechny c, d e K,
(4) a ■ (b — c) — a ■ b — a ■ c,
(5) celý okruh K je triviálni množinou {0} = {1} právě, když 0
Důkaz. Všechna tvrzení vyplývají z jednoduché úvahy a definičních axiomů. V prvém případě počítáme pro jakákoliv c, a:
c ■ a — c ■ (a +0) — c ■ a + c ■ 0
a protože jediným neutrálním prvkem vůči sčítání je nula, dostáváme a ■ 0 = 0. Stejně se dokáže i 0 • a = 0. Ve druhém případě teď stačí spočíst
0 = c ■ 0 = c ■ (1 + (-1)) = c + c ■ (-1),
proto je c ■ (—1) opačný prvek k prvku c, což jsme chtěli dokázat.
Další dvě tvrzení jsou už přímým důsledkem druhého vztahu a základních axiomů. Jestliže je celý okruh tvořen jediným prvkem, je pochopitelně 0=1. Naopak, jestliže platí 1=0, pak pro jakékoliv ceKjec—l-c — 0- c —0. □
10.16. Polynomy nad okruhy. Definice komutativního okruhu s jedničkou abstrahuje právě vlastnosti potřebné k násobení a sčítání. Můžeme je hned využít pro práci s tzv. polynomy. Rozumíme jimi jakýkoliv konečný výraz, který lze poskládat ze známých konstantních prvků K a jedné neznámé proměnné pomocí operací sčítání a násobení. Formálně můžeme definovat polynomy takto:4 -j Polynomy
q9
10.46. Najděte poslední dvě cifry čísla r .
Řešení. Poslední dvě cifry daného čísla je jeho zbytek po dělení číslem 100. Stačí tedy určit zbytek čísla 1 po dělení číslem 100. K tomu si všimněme, že 74 = 1 (mod 100) (z Eulerovy věty víme pouze, že 7^(100) = 740 = 1 (mod 100) a nejmenší číslo t splňující 7ř = 1 (mod 100) musí být dělitelem ^(100) = 40.). Dále víme, že 9 = 1 (mod 4), proto i 99 = 1 (mod 4). Celkem
Definice. Nechť K je jakýkoliv komutativní okruh skalárů s jedničkou. Polynomem nad K rozumíme konečný výraz
1
f(x) = ^flí-y
*=0
kde a,■ e K, i = 0, 1,..., k, jsou tzv. koeficienty polynomu. Je-li a* / 0, říkáme, že fix) má stupeň k, píšeme deg f — k. Nulový polynom nemá stupeň, polynomy stupně nula jsou právě nenulové prvky v K, kterým říkáme konstantní polynomy.
Polynomy fix) a g(x) jsou stejné, jestliže mají stejné nenulové koeficienty. Množinu všech polynomů nad okruhem K budeme značit K[x].
Každý polynom zadává zobrazení / : K —>• K, jehož hodnota vznikne dosazením hodnoty c za nezávislou proměnnou x, tj.
f(c) = flo + a\c + ■ ■ ■ + atck.
Všimněme si, že konstantní polynomy odpovídají právě konstantním zobrazením.
Kořen polynomu f(x) je takový prvek c e K, pro který je
f(c) = 0 € K.
Obecně mohou různé polynomy definovat různá zobrazení. Např. polynom x2 + x e Z2[x] zadává identicky nulové zobrazení. Obecněji, pro každý konečný okruh K = {ao, a\,..., a^} zadává polynom fix) — (x — ao)ix — a\)... (x — en) identicky nulové zobrazení.
Ne náhodou je pro okruh použit symbol K - nadále si pod ním představujte třeba kterýkohv okruh naších číselných oborů.
T
1
(t)4 -1
1 (mod 100).
=i
Poslední dvě cifry čísla 79 jsou tedy 07.
□
10.47. Určete poslední tři cifry čísla 1310".
Řešení. Tri poslední cifry jsou zbytkem po dělení daného čísla čísla číslem 1000. Ten jednoznačně určíme podle Čínské zbytkové věty pokud určíme zbytky po dělení nesoudělnými čísly 125 a 8. Protože
(13, 125) = 1
í jsou stupně polynomů / a g a uvažujeme nulové koeficienty všude tam, kde v původním výrazu pro polynomy nenulové koeficienty nejsou.5.
Tato definice vskutku odpovídá příslušným operacím sčítání a násobení hodnot zobrazení /, g : K -> K, díky vlastnostem „skalárů" v původním okruhu K.
Přímo z definice vyplývá, že množina polynomů K[x] nad komutativním okruhem s jedničkou je opět komutativním okruhem s jedničkou, přičemž jedničkou v K[x] je opět jednička 1 v okruhu K vnímaná jako polynom stupně nula, nulou pro sčítání je nulový polynom.
Lemma. Okruh polynomů nad oborem integrity je opět obor integrity.
Důkaz. Máme ukázat, že v K[x] mohou být netriviální dělitelé nuly pouze, jetliže jsou už v K. To je ale zřejmé z výrazu pro násobení polynomů. Jsou-li fix) a g(x) polynomy stupně kal jako výše, pak koeficient u x*+t v součinu fix) ■ g(x) je součin a^-b^a ten musí být nenulový, pokud nejsou dělitelé nuly v K. □
10.17. Polynomy více proměnných. Často se setkáváme s r/£j objekty popsanými pomocí polynomiálních výrazů ''Jííj/L ale s více proměnnými. Např. kružnici v rovině ^s^^^SL+ř se středem S — (xq, y o) a poloměrem r zapíšeme pomocí rovnice
(x - xo)2 + iy- yo)2 -1=0. Okruhy polynomů v proměnných x\,..., xr můžeme zavést úplně podobně jako jsme postupovali s K[x]. Místo mocnin jediné proměnné xk budeme uvažovat tzv. monomy
Ji
a jejich formální lineární kombinace s koeficienty akx ...kr e K.
Formálně i technicky je ale jednodušší je definovat induktivně vztahem
K[xi, ...,xr] := (K[xi, ..., xr-i])[xr].
Např. K[x, y] — K[x][y], tzn. že uvažujeme polynomy v proměnné y nad okruhem K[x]. Snadno si každý ověří (promyslete si to!), že polynomy v proměnných x\,..., xr lze i při této definici chápat jako výrazy vzniklé z písmen x\,..., x„ a prvků okruhu K konečným počtem (formálního) sčítání a násobení v komutativním okruhu. Například prvky v K[x, y] jsou tvaru
f = a„(x)f +a„_i(x)/_1 H-----hflo(x)
= H-----h a0n)f H-----h ibp0xp H-----h %))
= coo + ciox + c0iy + C2QX2 + cnxy + c02/ + - - -
Pro zjednodušení zápisu si zavedeme tzv. multiidexovou symboliku (kterou jsme používali při diskusi parciálních diferenciálních rovnic vyšších řádů).
10.49. Dokažte, že pro libovolné prvočíslo p e N platí: p\ip
\y2-1 -1.
Řešení.
(P-iy-1-i = {(p-iý"-1))
■ 1 = l(p+1) — 1=0 (mod p)
□
10.50. Martin a Honza chtějí komunikovat šifrou ElGamal navrženou podle protokolu pánu Diffieho a Helhnana. Domluvili se na cyklické grupě Z^j a Martin si náhodně zvolil generátor grupy 11a číslo 10 a zveřejnil trojici (Z41,11, A), kde A = 1110 (mod 41). Honza mu pošle veřejně dvojici (22, 6). Jakou zprávu Honza poslal?
Řešení. A = 9 (k dekódování není třeba). Zprávu Z dostaneme jako Z = (6/2210) (mod 41). Spočtěme nejprve 2210 = 222 • (222)2 • ((222)2) = (-8) • (-8)2 • (-8)2 = (-8) • 23 • 23 = -9 (mod 41), (-9)"1 = 9, Z = 9 • 6 = 13 (mod 41). □
10.51. Martin a Honza chtějí komunikovat šifrou ElGamal navrženou podle protokolu pánu Diffieho a Helhnana. Domluvili se na cyklické grupě Z^"7 a Martin si náhodně zvolil generátor grupy 5 a číslo 10 a zveřejnil trojici (Z37, 5, A), kde A = 510 (mod 37). Honza mu pošle veřejně dvojici (17,21). Jakou zprávu Honza poslal?
Řešení. Zprávu spočteme jako Z = 21/1710 (mod 37). Spočtěme nejprve 17^ = 172 • (172)2 • (172)2 = (-7) • (-7)2 • (-7)2 = (-7) • 12 • 12 = 28 (mod 37), 28"1 = 4 (mod 37), tedy Z = 4 • 21 = 10 (mod 37). □
Formálně bychom mohli naopak za polynom považovat nekonečný výraz pro : 0, ..., oo s podmínkou, že jen konečně mnoho koeficientů je nenulových.
607
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
MULTIINDEXY
Multiindex a délky r je r-tice nezáporných celých čísel I (ai,..., ar). Celé číslo \a\ — a\ + ■ ■ ■ + ar nazýváme velikost multiřndexu a.
Stručně zapisujeme monomy x" místo x"1 x"2 ... xa/ . Pro polynomy v r proměnných pak máme symbolické vyjádření velice podobné obvyklému značení pro polynomy v jedné proměnné:
/ — E aa^ ' S — E a^ 6 KtXl' • • •' Xr^
\a\ ...,xr-i)Y)
Y
— ^2(aj,y + bj,y)(xi, ... ,xr-i)Y4 ■ (r,f)
Podobně lze vést důkaz pro součin (udělejte samostatně!). □
Jako důsledek naší definice a předchozích výsledků pro polynomy nad obecnými komutativními okruhy dostaneme:
Důsledek. Jestliže v okruhu K nejsou dělitelé nuly, pak také v okruhu polynomů K[xi, ..., xr] nejsou dělitelé nuly.
608
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
Důkaz. Budeme postupovat indukcí přes počet proměnných
r.6 Polynomy v jediné proměnné mají tvar / = anx\ H-----\-a\xi +
ao a g = fcmf" + ■■■ + bo, přičeml' bm ^ 0 a a„ / O. Vedoucí člen součinu f g je anbmx"+m, protože anbm / 0, zejména tedy je součin nenulových polynomů opět nenulový.
Pokud tvrzení platí pro r — 1 proměnných, pak použijeme předchozí úvahu pro okruh polynomů v jedné proměnné xr s koeficienty v K[xi,..., xr-\ ]. □
10.18. Dělitelnost a nerozložitelnost. Naším dalším cílem bude pochopit, jak je to v obecném případě polynomů nad oborem integrity s jejich rozkladem na součin polynomů jednodušších, tj. ve speciálním případě polynomů s jedinou proměnnou budeme diskutovat kořeny polynomů. U polynomů s více proměnnými půjde o rozklad na jednodušší faktory nižších stupňů. Protože již víme, že polynomy ve více proměnných můžeme definovat induktivně, stačí nám nyní uvažovat jen polynomy v jedné proměnné, ovšem nad obecným oborem integrity, a směřujeme ke zobecnění úvah o dělitelnosti, které byly základem našeho počínání v elemntární teorii čísel.
Uvažujme nějaký pevně zvolený obor integrity K. Příkladem nám stále mohou sloužit celá čísla Z nebo okruh 7LV s prvočíselným p.
dělitelnost v okruzích
J
Obecně říkáme, že a e K dělí c e K, jestliže existuje b tak, že a ■ b = c. Skutečnost že c e K je dělitelné a e K zapisujeme
a\c.
Dělitelé jedničky, tj. invertibilní prvky v K, se nazývají jednotky. Jednotky v komutativním okruhu vždy tvoří komutativní grupu.
V oboru integrity jsou dělitelé určeny jednoznačně. Skutečně je-li b = a- cab^0, pak c je jednoznačně dáno volbou a, b, protože při b = ac = ac' totiž platí 0 = a ■ (c — c') a a ^ 0. Z neexistence dělitelů nuly proto vyplývá c = c'.
Přímo z definic vyplývají následující tvrzení:
Lemma. Nechť a, b, c e K. Potom
(1) je-li a\b a zároveň b\cpak také a\c;
(2) je-li a\b a zároveň a\c pak také a\(ab+Pc) pro všechny a, p €
K;
(3) a\0pro všechny a € K (je totiž a ■ 0 = OJ;
(4) každý prvek a € K je dělitelný všemi jednotkami e € K a jejich násobky a ■ e (jak přímo plyne z existence e~l).
Jednoznačný roklad v oboru integrity
Řekneme, že prvek a € K je nerozložitelný, jestliže je dělitelný pouze jednotkami e e K a jejich násobky a ■ e.
Řekneme, že okruh K je obor integrity s jednoznačným rozkladem, jestliže platí:
• pro každý nenulový prvek a e K existují nerozložitelné
a\, ... ,ar € K takové, že a = a\ ■ a2 ■.. ar
• jsou-li prvky a\,...,ar a b\,..., bs nerozložitelné, nejsou mezi nimi žádné jednotky a a = aia2 ...ar = b\b2 ...bs,
^Důkaz lze vést také přímo s použitím multiindexových formulí pro součin, když si zavedeme vhodné uspořádání monomů tak, jak to budeme za chvíli stejně dělat.
609
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
pak je r — s a ve vhodném přeuspořádání platí aj — ejbj pro vhodné jednotky ej.
Již jsme viděli, že Z je obor integrity s jednoznačným rozkladem a každé pole (komutativní těleso) je obor integrity s jednoznačným rozkladem (protože každý nenulový prvek v poli je jednotka).
Pro ilustraci si uveďme příklad oboru integrity, který jednoznačný rozklad nemá. Konstrukce je podobná polynomům, jen místo mocnin uvážíme vhodně se skládající odmocniny: Naše K bude mít prvky tvaru
k i = l
kde ao, ... ,ak e Z, mi, n e Z>o. Pak jednotky jsou v K pouze prvky ±1, všechny prvky s ao — 0 jsou rozložitelné, ale např. výraz x nelze vyjádřit jako součin nerozložitelných. Nerozložitelných prvků je v K prostě příliš málo.
10.19. Dělení se zbytkem a kořeny polynomu. Základním nástrojem pro diskusi dělitelnosti, společných dělitelů apod. v okruhu celých čísel Z byla procedura dělení se zbytkem a Euklidův algoritmus pro hledání největších společných dělitelů. Tyto postupy nyní zobecníme.
Lemma (Algoritmus pro dělení se zbytkem). Nechť K je komutativní okruh bez dělitelů nuly a f, g e K [x] polynomy, g ^ 0. Pak existuje a e K, a ^ 0, a polynomy q a r splňující a f — qg + r, kde r — 0 nebo deg r < deg g. Je-li navíc K pole, nebo je aspoň vedoucí koeficient polynomu g roven jedné, potom lze volit a — 1 a polynomy q ar jsou v tomto případě určeny jednoznačně.
Důkaz. Tvrzení dokážeme indukcí vzhledem ke stupni /. Jeli deg / < deg g nebo / — 0, pak volíme a — 1, q — 0,r — f , což vyhovuje všem našim podmínkám. Pro konstantní polynom g klademe a — g, q — f,r — 0.
Předpokládejme tedy, že deg / > deg g > 0 a pišme
/ — a0 H-----h anŕ , g — bo H-----h ^i™ .
Buď platí Z?m/ — anx"~m g — 0 anebo je deg(Z?m/— a„x"~m g) < deg/. V prvém případě jsme hotovi, ve druhém pak, podle indukčního předpokladu, existují a', q1, / splňující
a'(bmf-a„Xn-mg) = q/g + /
a budV — 0 nebo deg r' < deg g. Tzn.
li r i ! , / n—m \ , /
a bmf = (g +aanx )g+r .
Přitom je-li bm — 1 nebo K je pole, pak podle indukčního předpokladu lze volit a' — 1 a q*, r' jsou tak určeny jednoznačně. V takovém případě ovšem získáme
bmf = (g' + anxn-m)g + r'
a je-li K pole, můžeme rovnost vynásobit b~l.
Předpokládejme, že f — qig + r\ je jiné řešení. Pak 0 — f - f — (<7-<7i)g + (r-n)abuďjer = n, nebo deg (r-n) < deg g. V prvém případě odtud ovšem plyne \q — q\, protože K[x] neobsahuje dělitele nuly. Nechť ax* je člen nejvyššího stupně v q — qi ^ 0 (určitě existuje). Potom jeho součin se členem nejvyššího stupňe v g musí být nulový (protože nejvyšší stupeň dostaneme tak, že vynásobíme nejvyšší stupně). To ovšem znamená, že a —
610
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
0. Protože ax1 byl největší nenulový stupeň, nutně dostáváme, že q — qi žádné nenulové monomy neobsahuje, je tedy určitě nulové. Pak ovšem i r — r\. □
Proceduru dělení se zbytkem můžeme okamžitě využít k diskusi kořenů polynomů. Uvažme tedy polynom / e K[x], deg / > 0, a zkusme jej vydělit polynomem x—b,b e K. Protože je vedoucí koeficient jednička, algoritmus pro dělení dává jednoznačný výsledek. Dostáváme tedy jednoznačně zadané polynomy q a r splňující / = q(x — b) + r, kde r — 0 nebo deg r — 0, tj. r e K. Tzn., že hodnota polynomu / v b e K je rovna právě f(b) — r. Z toho plyne, že prvek b e K je kořen polynomu / právě, když (x — b)\ f. Protože po vydělení polynomem stupně jedna vždy klesne stupeň výsledku alespoň o jedničku, dokázali jsme následující tvrzení:
Důsledek. Každý polynom f e K[x] má nejvýše deg / kořenů. Zejména tedy zadávají polynomy nad nekonečným oborem integrity stejná zobrazení K -> K, právě když jde o stejné polynomy.
Skutečně, dva polynomy nad nekonečným komutativním okruhem, které zadávají stejné zobrazení K -> K, mají rozdíl, jehož kořenem je každý prvek v K. To však znamená, že pokud by jejich rozdíl nebyl nulový polynom, pak K má nejvýše tolik prvků, kolik je maximum ze stupňů uvažovaných polynomů.
Zatímco reálné polynomy mohou být i úplně bez kořenů, každý komplexní polynom naopak takovýto rozklad připouští. To je obsahem tzv. základní věty algebry, kterou pro úplnost uvádíme s (v podstatě) kompletním důkazem. Díky tomuto výsledku víme, že každý polynom v C[x] má tolik kořenů, včetně násobnosti, jako je jeho stupeň deg f — k. Proto připouští vždy rozklad tvaru
f(x) — (x - fli) • (x - a2) ... (x - ak)
s vhodnými komplexními kořeny a;.
10.20. Věta (Základní věta algebry). Pole C je algebraicky uzavřené, tj. každý polynom stupně alespoň 1 má kořen.
Důkaz. Předpokládejme, že f e C [z] je nenulový polynom, \. který nemá kořen, tj. f (z) /0 pro všechny z e C. Definujme zobrazení
f(z)
q> : C —>• C, zh>
l/(z)l
tj. 0
fr:R^Kr, řh> f{t) = re1'.
Pro každé r e (0, oo) máme definováno spojité zobrazení kt — (joý, : R —>• K\.Zt spojité závislosti k na parametru r navíc vyplývá existence zobrazení ar : R —>• R jednoznačně zadaných podmínkami 0 < ar (0) < 2it a kt (t) — eiar{t). Získané zobrazení ar opět spojitě závisí na r. Celkem tedy máme spojité zobrazení
«:Rx(0,oo)->R, (t, r) ^ ar(t)
a z jeho konstrukce plyne že pro všechna r je j-(ar(2jt) — ar (0)) — nr e Z. Protože je a spojité, znamená to, že nr je celočíselná konstanta nezávislá na r. Podívejte se na obrázek, odkud kam jdou jednotlivá zobrazení v naší konstrukci!
611
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
Pro dokončení důkazu si stačí uvědomit, že pokud / — ao + ■ ■ ■ + adZd a ad ^0, pak pro malá r se bude ar chovat podobně jako konstantní zobrazení, zatímco pro velká r to vyjde stejně, jako kdyby / — zd. Nejprve si spočtěme, jak tedy nr dopadne při / — zd, pak toto tvrzení upřesníme a důkaz tím bude ukončen.
Funkce C -> C, z i-> zd, z i-> -hn se snadno vyjádří pomocí
goniometrického tvaru komplexních čísel z — r(cos a zd = / (cos da + i sin do) = / eida
■ i siná).
—— — 1 (cos úfa + i sin da) — é
jda
zobrazení
0. Již víme, že / je nerozložitelný také v L[x], kde L je podílové těleso okruhu K. Předpokládejme tedy nejdříve, že K je pole (a je tedy rovno svému podílovému tělesu). Předpokládejme dále, že f\gh a zároveň / nedělí g. Ukážeme, že pak jistě f\h. Nej větší společný dělitel polynomů g a / musí být konstantní polynom v L, proto existují A, B e L [x]
615
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
takové, že 1 — A f + Bg. Odtud h — Afh + Bgh a protože f\gh musí platit i f\h.
Vraťme se nyní k obecnému případu. Podle předchozího vyplývá z našich předpokladů, že f\g nebo f\hw okruhu polynomů L[x] nad podílovým tělesem L okruhu K. Nechť např. h — k f v L [x] a zvolme a e K tak, aby ak e K[x]. Pak ah — ak f a pro každý nerozložitelný faktor e e a musí platit e\ak, protože / je nerozložitelný a nekonstantní. Můžeme proto e krátit. Po konečném počtu takových krácení je z a jednotka, tzn. h — k'f pro vhodné k' e K[x]. □
Důkaz tohoto lemmatu ukončil celý důkaz věty 10.23.
3. Systémy polynomiálních rovnic
V praktických úlohách se často setkáváme s objekty nebo ději popsanými polynomy, resp. systémy polynomiálních rovnic.
p^V-'- Může jít o hledání príslušnosti bodu k nějakému
vl j^=r - tělesu, hledání extrémů na algebraicky popsaných podmnožinách mnohorozměných prostorů, analýzu pohybů součástí nějakého stroje atd.
10.27. Afinní variety. Pro jednoduchost (existence kořenů polynomů) budeme pracovat zejména nad polem komplexních čísel, nicméně některé úvahy rozvineme pro obecné pole K.
Afinním n -rozměrným prostorem nad polem K rozumíme K" — K x • • • x K se standardní afinní strukturou, viz začátek
^ v J
n
čtvrté kapitoly.
Jak jsme jiz viděli, polynom f — aaXa € K[xi..., xn] lze přirozeným způsobem chápat jako zobrazení /: K" —>• K" definované
/(«!,...,«„):= ^^aaua kde ua — u"1 ■ ■ ■ u\
a
V dimenzi n — 1 popisuje rovnost fix) — 0 jen nejvýše konečně mnoho bodů v K. Ve vyšší dimenzi bude rovnost fix\,..., x„) popisovat podmnožiny podobné, jako jsou křivky v rovině nebo plochy v trojrozměrném prostoru, mohou ale mít docela složité a samoprotínající se tvary.
Např. množina zadaná rovnicí (x2 + y2 )3 — Ax2 y2 — 0 vypadá jako čtyřlístek. Pěkný obrázek dvourozměrné plochy dává tzv. Whitneyho deštník x2 — y2 z — 0, který kromě znázorněné části na obrázku obsahuje také celou přímku {x — 0, y — 0}.
616
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
Obrázek byl vykreslen s pomocí parametrického popisu x — u v, y — v, z — u2, ze kterého nejspíš snadno uhádneme i implicitní popis x2 — y2 z — 0.
Další obrázek ukazuje tzv. Enneperovu plochu s parametrizací
x — 3u + 3uv — u , y — 3v + 3u v — v , z — 3u — 3v .
Těžko si představit, jak z této parametrizace dopočítat ručně implicitní popis, přesto to budeme umět algoritmicky zvládnout eliminací proměnných u a v z 3 těchto tří rovnic. Budeme k tomu ale muset vybudovat docela složitou teorii. Začneme jako obvykle formalizací objektů.
_^mm^^_Afinní variety ^_____maa
Nechť f\, ..., fs e K[xi, ..., x„]. Afinní varietou v K" určenou polynomy f\,..., f„ nazveme množinu
aj(/i,...,/s) = {(ai,...,fl„)eK",
617
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
fi(a\
, ..., an) = 0; i — 1, ... ,s]
I
Afinní variety jsou například všechny kuželosečky, kvadriky a nadkvadriky singulární i regulární. Mnoho pěkných křivek či ploch můžeme snadno popsat jako afinní variety.
Varieta určená více polynomy je pak průnik variet zadaných jednotlivými polynomy. Tedy například 93 (x2 + y2 — 1, z) je kružnice se středem (0, 0, 0) a poloměrem jedna, ležící v rovině xy.
Podobně 93(xz, yz) je sjednocení přímky x — 0, y — 0 a roviny z — 0, protože pro právě pro body těchto dvou útvarů jsou oba polynomy xz, y z nulové.
Vidíme na těchto příkladech, že není lehké s vypořádat s pojmem dimenze. Stačí zmíněná přímka navíc k rovině, aby naše varieta byla třírozměrná, nebo ji ještě budeme považovat za dvojrozměrnou s jistou anomálií?
Následující přímočaré tvrzení si ověřte samostatně:
Věta. Nechť V = 93(/i, ...,fs),W = 93(gi, ...,j()cK" jsou afinní variety. Potom iVUWaVnW jsou afinní variety a platí
vn w = W(fu...,fs,gu...,gt),
VUW = W(figj) prol ) je minimální afinní varieta obsahující takto dané body (x\, ... , x„).
Všimněme si, že při parametrizaci nepožadujeme popis všech bodů variety. To je podstatné, jak je vidět i na jednoduchém příkladu parametrizace kružnice v rovině,
2t + f
y
■ ■ i +12
kterou obdržíme tzv. stereografickou projekcí. (Ověřte si detailně!) Všimněme si, že skutečně dostaneme parametrizací všechny body, kromě bodu (0, 1), ze kterého promítáme. Ten totiž není dosažitelný pro žádnou hodnotu parametru t. To není způsobeno naší nešikovností, z rozdílných topologických vlastností přímky a kružnice totiž vyplývá, že globální bijektivní racionální parametrizace existovat nemůže.
V této souvislosti se nabízí další otázky.
D. Existuje parametrizace dané variety, resp. lze ji nalézt?
E. Naopak, umíme k parametricky zadané varietě najít její implicitní popis?
Obecná odpovědna otázku D je záporná. V podstatě lze tvrdit, že většinu afinních variet parametrizovat nelze, respektive neexistuje algoritmus parametrizace implicitního popisu. Ty, u kterých se to podaří, se v angličtině nazývají unirational, česky tedy patrně neiracionální.
Na první pohled je zřejmé, že pro jednu a tutéž varietu existuje více implicitních, případně i parametrických popisů. Opomeneme-li parametrický popis, nejednoznačnosti implicitního jsou způsobeny reprezentací pomocí několika „generujících" polynomů a zjevně máme velikou volnost v jejich volbě.
10.29. Ideály. Abychom se vyhnuli závislosti na jednotlivých zvolených rovnicích zadávajících varietu, budeme chtít uvažovat i všechny důsledky zadaných rovnic. To vede na následující algebraický pojem:
«Ideály ^«__a^_mbit
Definice. Množinu I c K, kde K je komutativní okruh, nazveme ideálem, platí-li 0 e I a zároveň
f,gel ==> f + gel
f e I, h eK =>• f-hel
Ideály můžeme generovat podmnožinami, budeme používat značení I — {a\,... ,a„). Tím máme na mysli
Množina generátorů může být také nekonečná, je-li generátorů jen konečný počet, říkáme, že ideál je konečně generovaný.
^_—^4 Ideál variety ^......a^
Pro varietu V — 23(/i,..., fs) klademe
J(V) := {/ e K[xi, xn], f(au ..., an) = 0,
V(fli,...,fl„) e V}
619
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
Lemma. Nechť f\, ■ ■ ■, fs, g\, ■ ■ ■, gt - k[x\,..., x„~\ jsou polynomy. Pak platí
(1) Jestliže (fi,...,fs) = (gi,..., gt), pak 2J(/i, ..., /s) =
m8i,...,gt).
(2) 3(V) je ideál a platí (fi,...,fs) c 3(V), kde V = 2J(/i, ...,/s).
Důkaz. Jestliže nějaký bod (a\,... ,a„) patří varietě ,...,/s),sv tomto bodě jistě nuluje i jakýkoliv polynom
/-/':/:
tj. libovolný prvek ideálu / —)f\,fs(. Proto se v něm dle předpokladu nulují i všechny polynomy g i. Ověřili jsme tedy
9J(/i,...,/s)c2J(si,...,s().
Opačná inkluze se dokáže stejně.
Abychom ověřili druhé tvrzení, zvolme g, g' e J(V), h e K[x\,... ,xn]. Pak pro každý bod a e V platí
(gh)(a) = 0^^€ 3(V)
(g + g')(a) = 0 g + g' e 3(V)
Je tedy J(V) ideál v K[xi,... ,x„].
Pro Ubovolný f — h\f\ -\-----h hsfs e)fi,..., fs( a bod
a e V je samozřejmě také f (a) — 0, což ověřuje i dokazovanou inkluzi. □
Nejjednodušší příklady jsou triviální variety - jeden bod a celý afinní prostor:
3({(0, 0,...,0)}) = (xu...,xn)
J(K") — { 0} pro Ubovolné nekonečné pole K
Inkluze opačná k druhé části věty obecně neplatí. Například varieta 93(x2, y2) má jediný bod - (0, 0). J(V) je potom (x, y) D
(x2,/).
Jsou-li V, W c K" variety, pak platí
v c w =^ a(v) 2 ^(w)
Neboli polynomy, které se nulovaly na nějaké varietě se nutně musí nulovat i na její podmnožině.
Můžeme hned formulovat další přirozené problémy
F. Je každý ideál / e K[x\,... ,xn] konečně generovaný?
G. Lze algoritmicky zjistit, zda / e (/i,..., /s)?
H. Jaký je přesný vztah mezi (fi,..., fs) a ..., /s))?
10.30. Dimenze 1. Podívejme se na polynomy v jedné proměnné
x
f = «0x" + a\x"~l + ■ ■ ■ + a„ kde ao / 0. Vedoucí člen polynomu definujeme jako LT(f) :— aox" (označení pochází z anglického „leading term"). Zřejmě platí
deg/ LT(f)\LT(g)
Nechť K je pole a g nenulový polynomu. Víme, že každý polynom / e K [x] lze jednoznačně psát jako
/ — q ■ g + r kde r — 0 nebo deg r < deg g.
Jde ve skutečnosti o algoritmický postup, podíl q a zbytek r počítá následující algoritmus.
(1) q := 0, r := /
(2) while r / 0 A LT(g)\LT(r)
(a) 9 :=q+LT(r)/LT(g)
620
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
(b) r :=r-LT(r)/ĽT(g)-g Pro průchod cyklem platí invariant / — q ■ g + r, algoritmus tedy dává správny výsledek, pokud se zastaví. Stupeň r se každým průchodem zmenšuje, proto k zastavení nutně dojde.
Důsledek. Nechť K je pole. Pak každý ideál v orkuhu polynomů ~K[x]je tvaru (/).
Důkaz. Uvažme jakýkoliv ideál / c K[x]. Je-li/ — {0},pak je generován nulovým polynomem. Jestliže / obsahuje nenulový polynom /, pak jistě obsahuje i polynom / minimálního stupně. Jistě je pak )/(C /.
Pro jakýkoliv jiný polynom gel spočteme výsledek dělení se zbytkem, tj. g — q f + r. Zjevně je tedy q f e I a proto i r e I. Stupeň / byl ale minimálni, takže nutně r — 0. Je tedy i g e I a /=)/(• □
Ideály generované jediným prvkem se nazývají hlavní ideály. Okruhům, které mají vlastnost z posledního lematu říkáme okruh hlavních ideálů.
Největší společný dělitel h — GCD(f, g) polynomů / a g lze opět spočítat algoritmicky:
(1) h:=f,s:=g
(2) while s / 0
(a) r :— zbytek po dělení h /s
(b) h := s
(c) s :— r
Nechť f — q ■ g + r ah — GCD(f, g). Potom h\r, g a zároveň
V/j e K[x]: p\r, g tedy p\f a p\h
Odtud h je GCD(r, g). Triviálně GCDQi, 0) = h, proto algoritmus počítá správně GCD(f, g). Protože stupně r postupně klesají, algoritmus zastaví.
Největší společný dělitel dvou polynomů tedy existuje. Je určen jednoznačně až na násobek skalárem. Dva různé GCD se totiž musí dělit navzájem a to je u polynomů možné právě v tomto případě.
Největšflio společného dělitele více než dvou polynomů definujeme takto: Je-li s > 2, potom
GCD(fi, ...,fs):= GCD(fi, GCD(f2, ..., /s))
Lemma. Pro polynomy f\, ..., fs platí (GCD(f\,..., fs)) — (fi, ■■■,/*)•
Důkaz. GCD(fi,..., fs) dělí všechny polynomy f. Je tedy hlavní ideál) GCD(fi,..., fs) (obsažen v ideálu )fi,...,fs(. Naopak z Bezoutovy rovnosti okamžitě plyne inkluze opačná. □
Položili jsme několik otázek. Tady jsou odpovědi pro dimenzi
1:
• Protože 2J(/i,..., /s) = 2J(GCD(/i,..., /s)), problém prázdnosti variety se redukuje na problém existence kořene polynomu.
• Ze stejného důvodu je varieta vždy konečnou množinou izolovaných bodů - kořenů GCD(fi,..., fs) s jedinou výjimkou, kdy GCD(fi,..., fs) — 0; to nastane pouze v případě, že fi — f2 — ■ ■ ■ — f s — 0. Pak je varietou celá množina K.
• Pojem dimenze v tomto případě postrádá smysl, všechny variety mají coby diskrétní množiny bodů dimenzi nulovou.
• Každý ideál je generovatelný jediným polynomem.
621
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
• / e (/i,...,/s) <=> GCIHJ....../;»/.
• Označíme-li (/) := 3(2J(/i,..., fs)), pak / a GCD(fi,..., fs) se mohou lišit pouze násobností kořenů.
10.31. Monomiální uspořádání. Abychom mohli zobecnit dělení polynomů se zbytkem pro polynomy více proměnných, najdeme nejprve dobrý ekvivalent pojmů stupeň polynomu a vedoucí člen polynomu. Dělením se zbytkem polynomu / e K[x\,..., x„] polynomy gi,..., g s chceme rozumět vyjádření
/ = aigi H-----\-asgs +r,
kde vžádný člen zbytku r nebude dělitelný některým z vedoucích členů LT gt.
Zkusme to s / — x2y+xy2 + y2 ,gi — xy — lag2 — y2 — 1. Prvním dělením získáme
/ = (x + y) ■ gi + (x + y2 + y)
LT (y2 — 1) nedělí x (vedoucí člen zbytku), a tak bychom teoreticky nemohli pokračovat dál.
Přesuneme-li však toto x do zbytku, dostáváme teprve výsledek
/ = (x + y) ■ gi + g2 + (x + y + 1)
Zde již žádný člen zbytku není dělitelný žádným z LT(gi), LT(g2).
Jak jsme ale vlastně určovali vedoucí členy?
J Uspořádání monomů |____————.
Úplné (lineární) dobré (tj. každá neprázdná podmnožina má nejmenší prvek) uspořádání < na N" splňující
Va, B, y e Z": a < P ==> a + y < fi + y
nazveme monomiálním uspořádáním na K[xi, ..., x„]. Uspořádání na N" indukuje uspořádání na monomech.
Každý polynom lze však přeskládat jako klesající posloupnost monomů (na koeficienty teď nehledíme). Uspořádání se na polynomy rozšíříme „lexikograficky", tedy větší je ten polynom, který má větší první monom, pokud tak nelze rozhodnou, bere se v potaz druhý monom atd.
Následující tři definice zavádějí nejběžněji užívaná monomiální uspořádání. Všechna se opírají o předem dané uspořádání jednotlivých proměnných, standardně x\ > x2 > ■ ■ ■ > x„.
Definice. Lexikografické uspořádání je takové iex p <^=^ Nejlevější nenulový člen v a — p je kladný
Gradované lexikografické uspořádání je takové že pro každé a, p e N" platí:
« >griex P <^ l«| > \B\ nebo
\a\ — \B\ a zároveň a >iex p
Gradované opačné lexikografické uspořádání je takové ze pro každé a, p e N" platí:
« >greviex P l«l > \P\ nebo \a\ = \B\
a zároveň nejpravější nenulový člen (a — P) < 0
622
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
Tedy XI >grevlex *2 >grevlex ••• >grevlex X„, ale pokud X >
y > z, pak x2 yz2 >e\eK xy3 z, ale x2 yz2 iex, >griex, >greviex jsou skutečně mo-nomiální uspořádání.
10.32. Dělení se zbytkem. Nechť/= 2~ZaeN" a^x" je nenulový polynom v K[xi,... ,x„]a< monomiální uspořádání. Pak definujeme:
• Stupeň multideg / := max{a e N", aa ^ 0}
• Vedoucí koeficient LC f := flmultideg /
• Vedoucí monom LM f := xmultláĚs f
• Vedoucí člen LT f : = LC f ■ LM f
Tyto pojmy jsou tedy pro polynomy více proměnných vesměs silně závislé na volbě konkrétního uspořádání.
Lemma. Nechť f, g e K[xi,...,x„] a uvažme monomiální uspořádání <. Pak
(1) multideg (/• g) = multideg / + multideg g
(2) f + g ŕ 0 => multideg(/ + g) < maxfmultideg / multideg g]
Důkaz. Plyne okamžitě přímo z definic. □
Věta. Nechť < je monomiální a F = (/,..., /) s-tice polynomů x„]. Pak každý f € K[xi,..., x„] lze vyjádřit jako
f = fli/i H-----h flj/j + r
kde ai,r e K[xi,..., x„] pro všechna i = 1,2, ... ,s. Navíc r = 0 nebo r je lineární kombinací monomů, z nichž žádný není dělitelný kterýmkoli z LT /,..., LT / a pokud ai / ^ 0 pak multideg / > multideg a;- /• pro každé i.
Polynom r nazýváme zbytkem po dělení // F.
Důkaz. Věta neříká nic o jednoznačnosti výsledku. Následující algoritmus dává jedno možné řešení a je tedy důkazem platnosti věty.
Nadále budeme výsledkem dělení se zbytkem chápat právě tento výstup pevně zvoleného algoritmu.
(1) fli := 0, ..., as := 0, r := 0, p := /
(2) while p / 0
(a) i := 1
(b) d := falše
(c) while i < s A not d
(i) ±f LT f \LT p
ai := ai + LT p/LT /•
p := p - (LTp/LT fi) ■ ft
d := true
(ii) else i :— i + 1
(d) i f not d
(i) r :=r +ĽT p
(ii) p := p — LT p
Při každém průchodu vnějším cyklem se právě jednou provede právě jeden z příkazů 2(c)i, 2(d)ii, a tedy stupeň p klesne. Proto algoritmus skončí.
Platí invariant f = aifi + ■ ■ ■ + p + r a přitom každý člen každého a; je podílem LT p/LT /• z nějakého okamžiku. Proto stupeň těchto členů je menší než stupeň p v daném okamžiku a ten je nejvýše roven stupni /. Dohromady stupeň každého a;/ je menší nebo roven stupni /. □
623
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
V okruhu K[xi,..., x„] platí pouze implikace
/-«:/: • 0 > f e{fu...,fs)
Obrácení obecně pro naše dělení se zbytkem neplatí. Uvažujme / — xy2 —x,fi — xy + 1, f2 — y2 — 1. Potom algoritmus dělení dá
/ = y(xy + 1) + 0(/ - 1) + (-x - y) ale přitom evidentně / — xiy2 — 1), a tedy f e (fi, /2) •
10.33. Monomiální ideály. Ideál 7 c K[xi,..., x„] nazýváme monomiální, jesthže existuje množina multiindexů a c N" taková, že 7 je generován právě všemi monomy x" s a e A.
To znamená, že všechny polynomy v 7 jsou tvaru
JlaeA haX* ,ká&ha € k\x\, . . . , x„].
Zřejmě pro monomiální ideál 7 platí, že x^ e I, právě když existuje a e A takové, že x" dělí x^.
Lemma. Nechť I c K[xi,x„] je monomiální ideál, f e K[xi,..., x„] polynom. Pak následující tvrzení jsou ekvivalentní
(1) fel
(2) Každý člen polynomu f je prvkem I.
(3) Polynom f je lineární kombinací monomů z I s koeficienty zk.
Důkaz. Implikace (3) ==>■ (2) ==>■ (1) jsou zřejmé. Zbývá ukázat (1) ==>■ (3).
Zapišme si polynom / — ^a aaX01, kde aa e K. Z předpokladu fel vyplývá, že lze také vyjádřit / — 2~2peA hpx^ > kde x^ e I ahp e K[xi,..., x„].
Každý člen flai" se musí rovnat některému členu z druhé rovnosti. Jistě tedy každý člen aa/ polynomu / můžeme vyjádřit jako součet výrazů d x@+s ,kde 1 a předpokládejme, že pro menší počty proměnných tvrzení platí. Pro přehlednost si označíme proměnné jako xi,..., x„_i, y a monomy budeme psát ve tvaru x" y™, kde a e N"-1, m e N. Množinu monomů x^ s p e A budeme značit Ia - Předpokládejme, že I c K[xi,..., x„_i, y] je monomiální a definujme J c K[xi,..., x„_i] následovně
J := (x", 3m € N, x"y™ e IA).
Zřejmě je J monomiální ideál v n — 1 proměnných a tedy podle indukčního předpokladu lze psát J — (x"1,..., x"s). Dále z definice 7 vyplývá, že existují taková minimální m; € N, že x"' y™' e /a. Označme tedy m :— max{m;} a definujme analogicky systém ideálů Jk - K[xi, ..., x„_i] pro 0 < k < m — 1
4 := (V, x V e 7a)
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
Opět všechny Jk splňují indukční předpoklad a tedy je lze vyjádřit
Jk = (x0*-1, ...,x°*-*)-
Zbývá ukázat, že / je generovaný právě zkonstruovanou konečnou množinou monomů
x"1 f , ..., x** f
Xa°-ly°, ■■■ ,Xa°-soy°
x«m-l,l yn-1 x«m-l,sm_1 yn-1
Uvažujme tedy libovolný monom x" yp e Ia- Nastane jeden ze dvou případů
• p > m. Potom jistě x" € J, a tedy některý
z x"1 y™ , ..., x"* y™ dělí x" y^ .
• p < m. Potom analogicky x" € Jk a některý
z x0*-1 x"*-* / dělí x" yP .
Podle předchozího lemmatu lze každé f e I vyjádřit jako lineární kombinaci monomů z Ia, ty jsou již dělitelné některým z našich generátorů, proto / patří do ideálu jimi generovaného. Proto / je jeho podmnožinou. Opačná inkluze je zcela triviální a důkaz Dic-sonova lematu je hotov. □
10.35. HUbertova věta. Nyní již máme nachystáno vše potřebné pro diskusi pěkných bazí ideálů v okruzích poly-k\"/. nomů. Hlavní myšlenkou je maximální využití infor-? mací o vedoucích členech prvků v bázi a v celém ideálu.
Je-li / c K[xi,... ,x„] nenulový, označíme
LTI := {aŕ , 3 f e I: LT f — axa}
Zřejmě (LT I) je monomiální ideál, proto podle Dicksonova lemmatu lze psát (LTI) — (LTgi,... ,LTgs) pro nějaká vhodná gu-..,gs e I.
Věta. Každý ideál I e ~K[x\, ..., xn]je konečně generovaný.
Důkaz. Pokud je / — {0}, je tvrzení triviální. Uvažujme tedy / / {0}. Podle Dicksonova lematu a předchozí poznámky existují takovági,..., gs e I,že (LTI) = (LTgi,... ,LTgs).
Zřejmě (gi,...,gs) c /. Vezměme libovolné f e I a provedrne dělení se zbytkem s-ticí gi,..., gs. Dostáváme
/ = H-----\-asgs +r,
kde žádný člen r není dělitelný LT g\,... ,LT gs.
Protože r — f — a\g\ — ■ ■ ■ — asgs, platí r e I, a tedy také LT r e LT I. Zřejmě tedy LT r e (LT I). Připusťme, že r / 0. Protože (LT I) je monomiální, musí být LT r dělitelný některým z jeho generátorů, tj. LT g\,..., LT gs. To je ovšem spor s výsledkem algoritmu dělení. Proto r — 0 a / je generovaný
Gróbnerovy báze ideálů
10.36. Definice. Konečná báze g\,...,gs ideálu I _! k[x\,...,x„] se nazývá Gróbnerova, jestliže platí (LTI) = (LTgl,...,LTgs).
625
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
Báze použitá v důkazu Hilbertovy věty byla Grôbnerova.
Důsledek. Každý ideál I c K[xi,...,x„] má Grôbnewvu bázi. Přitom každá množina polynomů gi, ■■■, gs e I splňující {ĽTI) — (LT g i, ĽT gs) je Grôbnerovou bází ideálu I.
Ukažme smysl předchozích obecných výsledků na nejjed-£^ nodušším případě polynomů stupně j edna s lexikografickým uspořádáním:
Označme generátory /• — ■ atjxj + a;o-Uvažujme matici A — (a;-j), kde / — 1,..., s a j — 0,..., n a aplikujme na ni Gausovu eliminaci. Získláme B — (bij) ve schodovitém tvaru, z ní navíc vypustíme nulové řádky. Máme novou bázi gi,..., gt, kde t < s.
Vzhledem k provedeným úpravám je každé /• vyjádřitelné jako lineární kombinace g\,..., gt, a tedy
(fi, • ••,/*) = (g\,---,gt)
Ověříme si, že takto získané polynomy gi,... ,gt jsou Grôbnerovou bází:
Bez újmy na obecnosti předpokládejme, že proměnné jsou značeny tak, že LM gi — x; pro / — 1,..., t. Libovolný f e I lze psát
/ = hifi + ■ ■ ■ + hsfs = h\gi +■■■ + h'tgt Chceme, aby LT f e (LTgi,..., LTgt), tj. LT f má být dělitelný některým z x\,..., xt. Předpokládejme, že / je pouze v proměnných xt+i,..., xn. Pak ale h\ — 0, protože x\ je vzhedem ke schodovitosti B pouze v g\. Analogickým postupem získáme h'2 — ■ ■ ■ — h't — 0, a tedy / — 0.
Dokázali jsme sice existenci nadějných zvláštních bází, zatím je ale neumíme algoritmicky konstruovat. K tomu se dostaneme v následujících odstavcích.
10.37. Věta. Necht G — {g\, ■ ■ ■, gt] je Grôbnerova báze ideálu I c K[xi, ..., xn] a f je polynom v K[xi, ..., x„]. Pak existuje právě jedno r — Y2a flax" e ~K[x\,..., xn] s těmito
vlastnostmi
(1) Žádný člen r není dělitelný žádným z LT g\,..., LT gt, tj. VaVi: LTgiXaaX*.
(2) 3gel: f = g + r
Důkaz. Algoritmus pro dělení se zbytkem dá
/ — aigi H-----Yatgt + r,
kder splňuje podmínku (1). Za g sizvolmeaigi H-----Vatgt, které
samozřejmě patří do /.
Zbývá dokázat jednoznačnost. Předpokládejme
f = g + r=g' + r',
kde r / r1. Zřejmě platí r — r1 — g' — g e I. Protože G je Grôeb-nerova báze, je ĽT(r — r1) dělitelný některým z ĽT g\,... ,LT gt. Máme přitom jen dvě možnosti
• LMr / LM r1. Pak ten s vyšším stupněm musí být dělitelný některým z vedoucích členů LTg\,... ,LTgt, což je spor s podmínkou (1).
• LM r — LM r' a zároveň LCr / LCr'. Potom ale oba mnomy LM r a LM r1 musí být dělitelné některým z LT g\,... ,LT gt, což je opět spor.
Proto tedy ĽT r — LTV a induktivní úvahou odtud plyne r —
r1. U
626
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
Předchozí věta zobecňuje dělení se zbytkem, kde na místě dělitele vystupuje ideál. V případě jedné proměnné nebylo co zobecňovat, protože každý ideál byl generovaný jedním polynomem. Zajímá-li nás pouze zbytek, věta navíc říká, že nezáleží na pořadí
_q
polynomů v Grobnerově bázi. Proto má smysl zavést značení / pro zbytek po dělení f/G, pokud G — (gi,..., gs) je Gröbnerova báze.
Důsledek. Nechť G — {g\, . . . , gt] je Gröbnerova báze ideálu I c K[xi,..., x„] a f je polynom v K[xi, ..., x„]. Pak je libovolný polynom f prvkem ideálu I, právě když je zbytek po dělení f/G nulový.
10.38. Syzygy. Dalším krokem bude nalezení dostatečné „testovací množiny" polynomů z daného ideálu, které je třeba prověřit dělením se zbytkem, abychom mohli usoudit, že je uvažovaný systém generátorů již Gröbnerovou bazí. ŕo a — multideg faß — multideg g uvažme
y :—(yi,...,yn) kdeyi— max{a;-, ßt}
Monom xY nazýváme nejmenším společným násobkem (least common multiple) monomů LM f a LM g a zavádíme označení LCM(LM f, LMg):=xy . Výraz
LT f LT g
nazýváme S-polynomem (nebo také syzygy, neboli spřežení) polynomů /, g.
Jedná se o nástroj k ehminaci vedoucích členů, Gaussova eliminace je speciálním případem tohoto postupu pro polynomy stupně jedna. Narozdíl od ní ale může dojít ke zvýšení stupně, i když původní vedoucí členy odstraní.
Vezměme například / — x3 y2 —x2 y* +x, g — 3x4 y+y2, tedy polynomy stupně 5 v y] a uspořádání kde c\, ... ,ct e k a olí + multideg gi — S pro nějaké pevné S kdykoli ci ^ 0. Pokud multideg f < 8, pak existují taková Cjk e K, že
Y^^'sí = e cjkxs-y* s(gj,gk),
i = \ j,k=l
kde xyik = LCM(LM g j, LM gk) a každý monom x^-^ S(gj, gk) má stupeň menší než 8.
Důkaz. Označme di :— LC gi a p i — x"' gi/di. Určitě platí Cidi — LCÍcíx01' gi) aLC p i — 1. Protože multideg (qx"' gi) — 8
627
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
a zároveň multideg f < s, musí nutně platit také Y.'í=i cí^í — 0-Pokusme se teď / vyjádřit jako kombinaci S-polynomů.
t
f - ^__CidiPi — cidiipi - p2) + (cidi + c2d2)(p2 ~ Pt.) i=\
H-----h (cií/i H-----h cř_! dt-i ){pt-\ - pt)
+ (c\di H-----h ctdt)pt.
o
Každý rozdíl p j — pk lze vyjádřit v S-polynomech
ŕ x8 _ s-y-t í xV,k xV,k
d~7^8i~ďk~7z^8k = x ' \Wg~8i ~ lTg~k8k
= XS~Y* S(gj,gk)
Z obou rovností se už snadno odvodí jednotlivé koeficienty cJK.
□
Nyní můžeme přikročit k důkazu věty. Implikace „==>■" plyne bezprostředně z důsledku v odstavci 10.37. Musíme dokázat implikaci opačnou.
Uvažme nenulový polynom f e I. Potřebujeme ukázat, že za předpokladu dokazované implikace vždy bude platit LT f e (LT gi,.. .LT gt). Podaří-li se zaručit, že lze náš polynom vyjádřit jako / — Z~2'i=i hi8i s vlastností
multideg / — max {multideg (h igi)}
bude LT f nutně dělitelný některým LT gt, a tedy G bude skutečně Grôbnerova báze.
Označme m; := multideg (h igi), S :— maxfmi,..., mt}. Zřejmě multideg f < 8. Nechť jsou polynomy h\, ...,ht zvoleny tak, že <5 je minimální. Protože pracujeme s monomiálním uspořádáním, které je dobré, takové <5 existuje.
Dokažme tedy, že multideg f — S. Můžeme psát
/ = hi8i + 5ľ hi8i
m i—8 m[<8
= Y_ (LThi)gi + Y_ (hi-LThi)gi + Y_ higi-
mi—S mi—S mi<8
Všechny sčítance druhé a třetí sumy mají jistě stupeň menší než S. Připustíme-li, že multideg / < S, potom nutně
multideg ^ (LT h^gi J < S.
\mi—S J
Označme nyní qx"' := LT hi a aplikujme naše technické lemma.
£ (LThi)gi = £ Si = J2cJkxS~ľjk S(gj,gk).
mi—S mi—S j,k
Z předpokladu věty a algoritmu o dělení se zbytkem získáváme
t
S(gj, gk) = ^aijkgi
i = \
a navíc multideg (a^g;) < multideg S(gj, gk). Označíme-li
bijk ;= x&~Y'~k ciijk, dostáváme
x
t
S(gj, gk) = ^2 bijk g i
628
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
Podle druhé části lemmatu platí
multideg (fc^gi) < multideg (x^* S(gj,gk)) < S a dosazením dastáváme
E (LT hi)gi = cJk í E bW Si J
m;=<5 j,k \i = l /
t
E 12CJkbUk Si-
í' = l \j,k
Přitom platí
multideg |^ cjk bijk Si j < 8 pro ŕ = 1,..., ŕ.
Dosazením do naší původní rovnosti získáváme vyjádření / jako kombinace gi,... ,gt, kde všechny sčítance jsou stupně menšího než S. To je spor s minimální volbou S, a tedy multideg / — 8, odkud LT f e (LT gi,... ,LT gt) a báze G je Grôbnerova. □
10.39. Naivní algoritmus pro Grôbnerovy báze. Právě dokázaná věta nám již poskytuje účinný prostředek pro zjištění, zda nějaká báze je Grôbnerova. Uvažujme například / — (x + y, y — z). Jediný S-polynom, který připadá v úvahu je
xy xy 2
S(x + y, y — z) — — (x + y)--(y — z) — xz + y
x y
Dělením získáme xz + y2 — z(x + y) + y(y — z), a tedy daná báze je Grôbnerova.
Následující algoritmus využívá přesně tento postup pro nalezení nějaké Grôbnerovy báze ideálu generovaného s-ůcí polynomů F = (/i,..., fs).
(1) G := F, G' := 0
(2) while G ŕ G'
(a) G' := G
(b) V/j, q e G': p / q do
(i) s :=~ŠTp7q)G'
(ii) if s ŕ 0
G := G u {í}
Když se algoritmus zastaví, jistě to bude v G Gôbnerova báze. Musíme tedy už jen ověřit, že se skutečně zastaví. V jeho průběhu ovšem při každém běhu vnitřním cyklem (2), tj. když se přidává nějaký netriviální zbytek po dělení, buďmonomiální ideál generovaný LT G vzroste nebo zůstane stejný. Dostáváme tedy neklesající řetězec (monomiálních) ideálů I\ — LT(F) c I2 c ••• c h !~ ■■ ■ ■ Označíme-li nyní / — lJk%1 h, pak jde jistě o ideál a podle Hilbertovy věty musí být konečně generovaný. To ale znamená, že všechny generátory / jsou již v některém z 4 a proto od tohoto k počínaje bude platit 4 — 4+1 —____7
Stabilizace tohoto řetězce monomiálních ideálů hlavních členů je ale ekvivalentní zastavení algoritmu.
V angličtině se podmínce stabilizace každého neklesajícího řetězce ideálu říká ACC, „ascending chain condition". Okruhy, které splňují ACC se nazývají Noetherovské (na počest Emy Noether). Hilbertovu větu lze tedy ekvivalentně formulovat jako „Okruh polynomů nad noetherovským okruhem je opět noetherov-ský".
629
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
Tento algoritmus ovšem není zdaleka ideální. Lze vymyslet velmi jednoduše vypadající vstupy, pro něž vrací divoké výsledky. Dále výstupní báze se přímo odvíjí od vstupní, a tedy pro tentýž ideál zadaný různými bázemi dá také různé výsledky.
10.40. Redukce bazí. Viděli jsme, že k rozpoznání, které generátory jsou potřebné pro Grôbnerovu bázi, stačí sledovat jejich vedoucí členy. Prvním krokem je prosté vyházení f všech prvků, které v tomto smyslu nejsou třeba.
Lemma. Nechť G je Grôbnerova báze ideálu I a p e G takový, že ĽT p e (LT(G — {p})). Pak G — {p} je také Grbbnerova báze I.
Důkaz. Z definice Grôbnerovy báze platí (LTI) — {ĽT G). Protože ĽT p e (LT(G - {p})), platí (ĽT(G - {p})) = (ĽT G). Odsud již plyne tvrzení. □
Definice. Minimální Grôbnerovou bází ideálu / je taková Grôb-nerova báze G, že pro všechna p e G platí LC p — 1 a zároveň LTpi {LT(G -{p}))
Například mějme K[x, y] a := (G _ {g]) y {g>}
Tento nový systém generátorů G' je opět minimální Grôbnerovou bází ideálu /, protože {LT G') = {LT G), tjtaké platí {LT G') = {LT I). Polynom g' je zřejmě redukovaný pro G' díky vlastnostem algoritmu pro dělení. Byl-li nějaký h ^ g redukovaný pro G, zůstává podle předchozího tvrzení z předchozho odstavce redukovaný i pro G'.
Při každé provedené redukci některého z prvků dojde ke zmenšení celkového počtu členů polynomů v G. Proto se algoritmus zastaví v okamžiku, kdy už jsou všechny prvky redukované a máme tedy algoritmus konstrukci redukované Grôbnerovy báze.
Zbývá dokázat její jednoznačnost. Předpokládejme dvě redukované Grôbnerovy báze G, G nenulového ideálu I. Platí tedy {LT G) = {LT I) = {LT G). Protože tento ideál je monomiální, lze pro něj aplikovat Dicksonovo lemma. S odvoláním na konstrukci báze v jeho důkazu lze tvrdit, že existuje právě jedna monomiální báze monomiálního ideálu tak, že koeficienty jejích členů jsou rovny jedné a žádný z členů této báze nedělí jiný.
Podle definice minimality musí být LT G iLT G právě takovou bází. Tedy LT G = LT G. Ke každému g e G tedy exisuje právě jedno g e G takové, zeĽT g = LT g.
_q
Platí g — g e I. Protože G je Grôbnerova, platí g — g =0. Členy LT g,LT g se odečtou už v g — g. Protože obě báze jsou redukované, nemůže být žádný ze zbývajících členů g —g dělitelný kterýmkoli zLT G = LT G. Musí se tedy dostat do zbytku. Platí tedy
_q
g-g=g-g =0
Tím je jednoznačnost dokázána. □
10.42. Poznámky. Máme již k dispozici několik odpovědí na dříve položené otázky. Umíme totiž účinně rozhodnout o příslušnosti polynomu do daného ideálu pomocí dělení se zbytkem prostřednictvím Grôbnerovy báze. A umíme také pomocí
redukovaných Grôbnerových bází rozhodnout, zda jsou dva ideály stejné.
Pro náš problém řešení systémů polynomiálních rovnic to znamená, že pro daný systém polynomiálních rovnic umíme rozhodnout, zda nějaká jiná polynomiální rovnice je jejich důsledkem. Umíme také o dvou různých systémech algoritmicky rozhodnout, zda generují stejný ideál svých důsledků.
631
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
Při těchto algoritmických konstrukcích bude záležet na zvoleném uspořádání monomů, samotné odpovědi na výše uvedené otázky ale na uspořádání nezávisí.
Jak jsme zmiňovali v úvodu kapitoly, technika Grôbnerových bazí je jedním ze základů počítačové algebry. Samozřejmě jsou při implementacích v programových systémech využita různá zlepšení výše uvedeného algoritmu. Např. je možné využít techniky redukcí již během vytváření Grôbnerovy báze v základním algoritmu z odstavce 10.39 apod.
V literatuře lze dohledat také různé varianty pro nekomu-jjí; tativní algebraické objekty (např. při formálních manipulacích s diferenciálními operátory). Algoritmus pro nalezení Grôbnerovy báze lze také interperetovat jako speciální \Ů případ Knuth-Bendixova algoritmu pro přepisovací pravidla řešící problém ekvivalentnosti slov v monoidech zadaných generátory a sadou rovností.
Konečně, v samotné komutativní algebře je technika Grôbnerových bazí použitelná daleko sofistikovaněji. Při průchodu naším algoritmem totiž dostáváme syzygy všech dvojic generátorů konečné báze. Tyto syzygy jsou vlastně bazí tzv. podmodulu všech relací mezi k prvky g\, ... ,gk báze, tj. podmnožiny S v prostoru (K[xi,..., xn])k. Na takové podmnožiny opět můžeme rozšířit samotný algoritmus a najít význačné generátory všech relací mezi mezi generátory. Takto můžeme pokračovat, dokud existují nějaké netriviální relace. Lze dokázat, že nejpozději po n takových krocích už žádné netriviální relace nebudou existovat a počty generátorů relací v jednotlivých krocích nám dávají velmi podrobnou informaci o topologických vlastnostech příslušné afinní variety 23 (gi,..., gk)-
10.43. Eliminace proměnných. Na závěr této části si uvedeme J> .. alespoň jednu aplikaci předchozích algoritmů.
" Budeme považovat okruh K[xp+i,..., xn] r^>V- za podokruh K[xi,... ,x„]. Jedná se o polynomy, M v nichž se nevyskytují proměnné x\,..., xp. Je to
skutečně podokruh, ale už ne ideál.
-J Eliminační ideály __
Nechť I — (/i, ..., fs) c k[x\, ..., x„]. Pro p — 1,..., n definujeme
Ip := /nK[ip+i, ...,x„]
Tuto množinu nazveme p-tým eliminačním ideálem. Všimněme si, že Ip je ideálem pouze v k[xp+\,..., x„].
Na úrovni polynomiálních rovnic Ip obsahuje všechny rovnice, které jsou důsledky systému f\ — 0,..., fs — 0 a ve kterých vystupují pouze proměnné xp+i,..., x„.
Věta (Eliminační věta). Nechť I c K[xi,..., x„] je ideál, G — {gi,..., gm\ jeho Grbbnerova báze vzhledem k iex x2 >iex ■ ■ ■. Potom pro každé p = 0,..., n je G p :— G n K[xp+i,..., x„] Grôbnerovou bází ideálu
h-
Jestliže je G minimálni, resp. redukovaná, Grbbnerova báze, pak G p je opět báze minimálni resp. redukovaná.
Důkaz. Bez újmy na obecnosti můžeme uvažovat Gp — {gi,..., gr}. Protože G c I, je i Gp c Ip. Inkluze (Gp) c Ip platí triviálně. Dokážeme tedy ikluzi opačnou.
632
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
Pro libovolný polynom / e Ip bychom rádi ověřili, že
/ = hlgl H-----hhrgr-
Provedeme za tím účelem dělení se zbytkem původní Grôbnerovou
_q
hází G. Protože je také f e I, platí / — 0, a tedy
/ — h\gi H-----h hrgr + hr+igr+i----h hmgm
Každý z polynomů gr+i,..., gm musí obsahovat nějakou z proměnných x\,..., xp, jinak by byl prvkem Gp. Vzhledem k vlastnostem lexikografického uspořádání takovou proměnnou obsahují i LT gr+i,... ,LT gm. Uvědomíme-li si postup algoritmu pro dělení se zbytkem a skutečnost, že v f není žádný monom obsahující některou zxi,... ,xp, musí být hr+\ — ■ ■ ■ — hm — 0. Ověřili jsem proto / e (Gp).
Dokázali jsme nejen požadovanou inkluzi, ale i fakt, že dělení f/G dopadne na Ip stejně jako f/Gp. Pro 1 < i < j < r uvažujme s-polynomy S(gi, gj). Platí
S(gi,gj)Gp = S(gi,gj)G =0
a tedy Gp je Grôbnerova báze ideálu Ip.
Tvrzení o minimalitě nebo redukovanosti báze je zřejmé z definic těchto pojmů. □
Jediná vlastnost lexikografického uspořádání, kterou jsme použili v důkazu, je tvrzení, že pokud se některé proměnné objevují v polynomu /, pak se objevují v jeho vedoucím členu. To je ovšem podstatně slabší požadavek, než definice lexikografického uspořádání. Proto lze při skutečných implementacích používat jakékoliv uspořádání, které bude zajišťovat tuto vlastnost. Dosáhne se tak většinou efektivnějších výpočtů, protože čisté lexikografické uspořádání zpravidla vede k nepříjemnému nárůstu stupňů polynomů.
10.44. Implicitní popis parametrizovaných variet. Z předchozí věty lze docela snadno odvodit algoritmus pro nalezení implicitního popisu variet zadaných pomocí polynomiální parametrizace. Nebudeme se věnovat detailní diskusi, protože nemáme k dispozici všechny nástroje pro práci s nejménšími varietami obsahujícími body zadané parametrizací. Zůstaneme proto na úrovni poznámek.
Jestliže je naše parametrizace variety dána polynomiálními vztahy
xi — /l(«l, ■ ■ ■, uk), xn =/„(«!,... , uk),
spočteme redukovanou Grôbnerovu bázi ideálu
(xi - fi, ...,x„ - /„)
v lexikografickom uspořádání, kde m; > xj pro všechna Z této báze dostaneme redukovanou Grôbnerovu bázi eliminačního ideálu 4 a to je přesně hledaný ideál a jeho implicitní popis.
Ve skutečnosti nám pro výpočet stačí takové uspořádání, které zaručí převahu všech m; nad xj, aby se algoritmem pro výpočet Grôbnerovy báze eliminovala «/, jinak může být uspořádání libovolné. Máme tak naději dosáhnout efektivnějšího výpočtu, než s čistým lexikografickým uspořádáním.
Jako příklad si uveďme už dříve zobrazenou varietu v R3 nazývnou Enneperova plocha. Její parametrický popis byl x — 3u + 3uv2 — u3, y — 3v + 3u2v — v3, z — 3u2 — 3v2. Aplikace ehminační procedury (např. v systému MAPLE za použití gbasis s uspořádáním plex) dá odpovídající implicitní popis, tj. rovnici s jediným polynomem devátého stupně:
633
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
-59049z - 104976z2 - 6561y2 - 72900z3 - 18954y2 z -23328z4 + 32805z2x2 + 14580zV + 3645zV - 1296y4 z -16767y2z2 - 6156y2 z3 - 783y2z4 + 3936ÓZX2 + 19683X2 -1296y4 - 2430z5 + 432z6 + 108z7 + 486zV - 432y4 z2 + 54y2z5 + 27z6x2 - 48y4z3 + 15y2z6 - 64y6 - z9. Když je naše parametrizace racionální, tj.
fi(h, ■ ■ ■ , tm)
X i — -,
gi(t\, ...,tm)
asi nás hned napadne dosadit do předchozí věty ideál {x\g\ — fi,..., xngn — f„). To ale většinou nefunguje dobře. Například uvažujme
2 2
x — — y — — z — u.
v u
Dostali bychom / — (vx — u2, uy — v2, z — u) a po eliminaci I2 — (z(x2y — z3)). Správny výsledek je ale jenom 93(x2y — z3), tedy náš postup přidal navíc celou rovinu.
Problém je v tom, že zahrnujeme i celou varietu nulových bodů jmenovatelů v parametrizacích jednotlivých proměnných, W — 2J(gi,..., g„). Raději tedy parametrizaci F chápejme jako zobrazení F : (Kk — W) —>• K". Pro implicitizaci pak použijeme ideál
I = ig\x\ - fj, ...,gnx„ - f„, 1 - gi ■■■g„y) C K[y, ři,..., tm, xi,..., xn],
kde si navíc pomáháme dodatečnou proměnnou y. Potom lze ukázat, že V (4-1- O je minimální afinní varieta obsahující F(Km — W).
4. Uspořádané množiny a Booleovská algebra
Tak jako jsme z vlastností čísel nebo symetrií objektů abstrahovali podstatné axiomy a dostali jsme daleko siřeji použitelné nástroje pro úvahy v linerární algebře, při diskusi grup symetrií a jejich akcí, studium okruhů polynomů atd.
Nyní budeme postupovat obdobně a okamžitě uvidíme, že jen docela drobnou změnou základních vlastností dostaneme na první pohled úplně jiné objekty. To co zůstane podobné je algebraická práce se symboly zastupujícími velice rozmanité objekty a tím pádem i docela univerzální použitelnost výsledků.
Za východisko si vezmeme základní operace s množinami, tj. jejich sjednocení, průnik a vztahy inkluze a naším prvním cílem bude uvést tyto operace do souvislosti s výrokovou logikou (tj. for-malizovanými postupy pro vyjadřování výroků a vyhodnocování jejich pravdivosti).
10.45. Množinová algebra. S každou množinou M máme k dispozici také množinu K — 2M všech jejích podmnožin a na ní operace v : K x K —>• K sjednocení množin a A : K x K —>• K průniku množin. To jsou dvě binární operace, které jsme dosud značili U a n.
Dále máme ke každé množině A e K také její množinu doplňkovou A' — K \ A, což je další unární operace.
Konečně máme „největší objekt", tj. celou množinu M, který je neutrální vůči operaci A a který proto budeme v této souvislosti označovat jako 1, a obdobně se chová prázdná množina & e K vůči operaci v. Tu budeme v této souvislosti značit jako 0.
Na množině K všech podmnožin v M můžeme velmi snadno ověřit pro všechny prvky A, B, C následující vlastnosti (již jsme
634
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
definovali význačné prvky O = 0al = Ma unární operaci vzetí doplňku A' k podmnožině A):
(1) A A (B a O = (A A B) a C,
(2) A v (5 v Q = (A v 5) v C,
(3) A A B = B A A, A V B = B V A,
(4) A a (B v Q = (A A B) v (A a C),
(5) A v (B A C) = (A v 5) a (A v C),
(6) existuje 0 e K tak, že A v 0 — A,
(7) existuje 1 e /f tak, že A A 1 = A,
(8) AaA'=0, AvA' = 1.
Porovnejme si tyto vlastnosti s vlastnostmi okruhů:
První dvě z nich, tj. (1) a (2) říkají, že obě operace A a v jsou asociativní. Vlastnost (3) konstatuje komutativitu obou operací.
Až potud je tedy vše jako u číslených oborů a operací sčítání a násobení. Zásadní změnou jsou ale další dvě vlastnosti (4) a (5), protože ty vyžadují jak distributivitu operace v vůči průniku A, tak naopak. To pochopitelně u sčítání a násobení čísel nejde — máme tam pouze distributivitu sčítání vůči násobení, ale ne naopak.
Poslední tři vlastnosti (6) - (8) konstatují existenci neutrálních prvků vůči oběma operacím, ale také existenci obdoby k inverzím" ke všem prvkům (ale všimněme si, že průnikem s kom-plementem chceme dostat neutrální prvek ke sjednocení a naopak, tedy odlišně od vzetí inverzí v okruzích). Jistě nás nepřekvapí, když zachvíli uvidíme, že takto silně provázané vlastnosti dvou různých operací nemůže mít příliš mnoho objektů.
m^^^m_Booleovské algebry
Definice. Množině K spolu s dvěmi binárními operacemi A a v a jednou unární operací' splňující vlastnosti (l)-(8) říkáme Booleovská algebra. Operaci A budeme říkat infimum (případně sjednocení, anglicky často také meet), operaci v budeme říkat supremum (případně průnik, anglicky také joiri). Prvku A' se říká doplněk k prvku A.
Všimněme si, že axiomy Booleovské algebry jsou zcela symetrické vůči záměně operací A a v, společně se záměnou prvků 0 a 1. Důsledkem tohoto faktu je, že jakékoliv tvrzení, které odvodíme z axiomů, má také platné duální tvrzení, které vznikne z prvého právě záměnou všech výskytů A za v a naopak a stejně tak všech výskytů 0 a 1. Hovoříme o principu duality.
10.46. Vlastnosti Booleovských algeber. Jako obvykle si hned odvodíme několik elementárních důsledků axiomů. Zejména si povšimněme, že tak dokážeme u speciálního případu Booleovské algebry všech podmnožin v dané množině M elementární vlastnosti známé z množinové algebry. Např. je doplněk k A e K určen svými vlastnostmi jednoznačně. V obecném pohledy však toto pozorování říká, že máme-li dáno (K, A, v), může existovat nejvýše jedna unární operace', se kterou dostaneme Booleovskou algebru (K, A, v, '))•
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
Skutečně, pokud B a C e K splňují vlastnosti A' (tj. poslední axiom (8) v definici výše), platí
B = BvO=Bv(AaQ
= (5vA)a(5vQ = 1a(5vQ = 5vC
a stejně také spočteme
C = C v B.
Je tedy nutně B — C. Všimněme si, že použitím tohoto výsledku na prvky 1 a 0, společně s jejich definicí, okamžitě dostáváme jednoznačnost pro tyto výjimečné prvky v libovolné Booleovské algebře (promyslete si podrobně!).
Vlastnosti v následujícím tvrzení mají svá zavedená jména v množinové algebře: vlatnosti (2) se říká absorpční zákony, vlastnosti (3) popisují idempotentnost operací a ]í a v a rovnosti (4) jsou známy jako De Morganova pra-vidla.
Tvrzení. V každé Booleovské algebře (K, a, v,') platí pro všechny prvky v K
(1) Aa0 = 0, A vl = 1
(2) A a (A v B) = A, A v (A a B) = A
(3) A a A — A, A v A = A
(4) (A a B)' = A' v B', (A v B)' = A' a B'
(5) (A')' = A.
Důkaz. Podle principu duality potřebujeme z každého z duálních tvrzení na jednotlivých řádcích dokázat pouze jedno. Počítejme s využitím axiomů:
Začneme s vlastností (3)
A = A a 1 = A a (A v A') = (A a A) v 0 = A a A.
Nyní už umíme snadno (1)
A a0 — A a (A a A') — (A a A) a A' — A a A' — 0
a pak je snadné i (2)
A a (A v B) = (A v 0) a (A v 5)
= Av(0a5) = Av0 = A
K důkazu De Morganových pravidel stačí ověřit, že A' v B' má vlastnosti doplňku k A a B, pak to totiž bude doplněk dle úvahy výše. S využitím (1) spočteme
(A a B) a (A' v tí) — ((A a B) a A') v ((A a B) a B')
= (0 a B) v (A a 0) = 0.
Obdobně, s použitím (2) dostáváme
(A a B) v (A' a = (A v (A' v&)) v(8v (A' v&))
= (1 V tí) a (1 v A') = 1.
Konečně, přímo z definice je A'AA = 0aA'vA = 1, má proto A požadované vlastnosti doplňku k A' a je tedy A — (A')'. □
10.47. Příklady Booleovských algeber. Nejmenší zajímavá al-^ í gebra je množina všech podmnožin jednoprvkové v:^TŤ^množiny M. Ta má právě dva prvky 0 — 0 a 1 = M. ^/ C . Operace a a v v tomto případě splývají s násobením a K>':—- sčítáním v okruhu abytkových tříd z2, proto budeme nadále hovořit o Booleovské algebře z2.
Podobně jako u vektorových prostorů a okruhů můžeme algebraickou strukturu Booleovské algebry přenášet na prostory
636
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
funkcí, jejichž obor hodnot Booleovskou algebrou je. Skutečně, pro množinu všech funkcí S = {/ : M -> K] zmnožiny M do Booleovské algebry (K, A, v,') definujeme potřebné operace a vybrané prvky 0 a 1 na S jako funkce v argumentu x e M takto:
(/l A/2)W = (/ito) A (/2 (/lV/2)(l) = (/ito) V (/2
(l)(x) = leK, (0)(x) =0eř
(/)'(*) = (/(*))' e
Ověření, že tyto nové operace skutečně zadávají Booleovskou algebru je zcela přímočaré a jednoduché.
Připomeňme, že všechny podmnožiny dané množiny M lze interpretovat jako zobrazení M -> Z2, když na jedničku zobrazíme právě body vybrané podmnožiny. Pak skutečně můžeme sjednocení a průnik definovat výše uvedeným způsobem — např. o každém bodu x e M rozhodujeme u (A A B)(x) zda patří do A a zda patří do B a vezmeme sjednocení výsledků v Z2, tj. výsledek bude 1, právě když x padne do sjednocení.
10.48. Výroková logika. V předchozích odstavcích jsme použili symboliku, kterou je často rozumné interpretovat tak, že z prvků A, B,... e K tvoříme „slova" pomocí operací v, a,' a závorek vyjasňujících v jakém pořadí a na jaké argumenty jsou operace aplikovány. Samotné axiomy Booleovských algeber a jejich důsledky pak říkají, že velice často různá slova dávají stejnou hodnotu výsledku v K.
V případě množiny všech podmnožin K = 2M je to zřejmé -prostě jde o rovnost podmnožin. Nyní uvedeme stručně jinou podobnou souvislost.
Budeme pracovat opět se slovy jako výše, interpretujeme je ale jako tvrzení složené z elementárních výroků A, B,... a logických operací AND (binární operace a), OR (binární operace v) a negace NOT (unární operace ')• Taková slova nazýváme výroky a přiřazujeme jim pravdivostní hodnotu v závislosti na pravdivostní hodnotě jednotlivých elementárních argumentů. Pravdivostní hodnotu přitom bereme jako prvek z triviální Booleovy algebry Z2, tedy buď 0 nebo 1. Pravdivostní hodnota výroku je plně určena přiřazením hodnot pro nejjednoduší výroky A A B, A v B a A', tj. A A B je pravdivé pouze, když jsou oba výroky A a B pravdivé, A v B je nepravdivé pouze, když jsou oba výroky nepravdivé a A' má opačnou hodnotu než A.
Výrok obsahující n elementárních výroků tedy představuje funkci (Z2)" -> Z2 a dva výroky nazýváme logicky ekvivalentní, jestliže zadávají stejnou funkci. V předchozím příkladu jsme již ověřili, že na množině tříd logicky ekvivalentních výroků je dána struktura Booleovy algebry. Nutně tedy pro výrokovou logiku bude v tomto smyslu platné vše, co dokážeme pro obecné Booleovy algebry.
Stručně si proberme, jak vypadají obvyklé další jednoduché výroky ve výrokové logice jakožto prvky Booleovy algebry (tj. reprezentujeme vždy naším výrazem třídu výroků ekvivalentních):
Implikaci A =>■ B dostaneme jako A' v B, ekvivalenci A <^ B odpovídá (A A B) v (A' A B'). Dále vylučovací OR, neboli XOR, je dáno jako (A A B') v (A' A B), negace NOR operace OR je vyjádřena jako A' A B' a negace NAND operace AND je dána jako A' v B'. Konečně tautologie je dána pomocí libovolného elementárního výroku jako A v A'.
637
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
Všimneme si také, že X OR odpovídá v množinové algebře symetrickému rozdílu množin.
10.49. Přepínače jako Booleova algebra. Přepínač je pro nás černá skříňka, která má jen dva stavy, buď j e zapnut (a signál prochází) nebo naopak vypnut (a signál neprochází).
r-—-A-
o-'A-'B-o o-
1—v
Jeden nebo více přepínačů zapojujeme do sítě sériově nebo paralelně. Sériové zapojení je popsáno pomocí binární operace A, paralelní je naopak v. Unární operace A' zadává přepínač, který je vždy v opačné poloze než A. Každé konečné slovo vytvořené pomocí přepínačů A, B,... a operací A, v a' umíme převést na obrázek, který bude představovat systém přepínačů propojených dráty a zcela obdobně jako v minulém odstavci nám každá volba poloh jednotlivých přepínačů zadá hodnotu „zapnuto/vypnuto" pro celý systém.
Opět se snadno krok po kroku ověří platnost základních axiomů Booleových algeber pro náš systém. Na následujícím obrázku je ilustrován jeden z axiomů distributivity.
B"
c-
-O = O—
A-'b-
VK-'c-1
Propojení bez přepínače odpovídá prvku 1, koncové body bez propojení (nebo sériové zapojení A a A') dává prvek 0. Nakreslete si obrázky pro všechny axiomy Booleovské algebry a ověřte šije!
10.50. Dělitelé. Dalším přirozeným příkladem Booleovské alge-ť% bry může být systém dělitelů přirozeného čísla nebo polynomu.
'sS^SěĚ^ Začněme trochu obecněji a zvolme pevně takové přirozené číslo p e N nebo polynom p e K[x\,..., xs] nad oborem integrity K s jednoznačným rozkladem. Za nosnou množinu Dp bereme množinu všech dělitelů q našeho p. Pro dva takové dělitele definujeme q A r jako největší společný dělitel prvků q a r, q v r je nejmenší společný násobek. Dále definujeme význačný prvek 1 e Dp jako naše číslo nebo polynom p a neutrálním prvkem 0 vůči supremu na Dp je jednička v N, resp. 1 € K c K[xi,..., xs]. Unární operaci ' definujeme pomocí dělení: q' — p/q.
Lemma. Množina Dp spolu s výše uvedenými operacemi A, V a ' je Booleovská algebra, právě když rozklad p na nerozložitelné faktory neobsahuje žádné kvadráty (tj. v jednoznačném rozkladu p — q\ .. .qn na nerozložitelné faktory jsou všechna qi po dvou různá).
Důkaz. Ověření axiomů je vcelku snadné, projdeme jeden po druhém a budeme zkoumat, kdy je zapotřebí nešeho požadavku na nepřítomnost kvadrátů v rozkladu.
Největší společný dělitel konečného počtu čísel nebo polynomů nezávisí na pořadí, ve kterém jej počítáme. Stejně tak pro nejmenší společný násobek. To odpovídá axiomům (1) a (2) v 10.45. Komutativita, tj. axiom (3) je zcela zřejmá.
Pro tři libovolné prvky a,b,ac můžeme bez újmy na obecnosti psát jejich rozklad ve tvaru a — qPl ... qpss, b — q™x ... q™s a c —
q\l ... qkss, kde připouštíme i mocniny 0 a všechny prvky q j jsou po dvou nesoudělné. Prvek a A b e Dp je tedy prvek s rozkladem,
638
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
ve kterém se objeví všechna společná q i v mocnině, která bude minimem z mocnin v a a b. Naopak a v b bude mít rozklad, ve kterém se objeví všechny členy z rozkladů a a b a to s mocninou, která bude tou větší z mocnin příslušného faktoru v a a b. Z této úvahy nyní snadno plynou distributivní zákony (4) a (5) z 10.45.
Problém nemáme ani s existencí prvků 0 a 1, které jsme přímo definovali a zjevně splňují axiomy (6) a (7). Případná exis-tecne kvadrátů v rozkladech ale znemožní určení doplňku. Např. v D n — {1, 2, 3, 4, 6, 12} nelze 6 a 6' — 1 dosáhnout, protože má 6 netriviálního společného dělitele se všemi ostatními prvky v Z) 12 mimo jedničku, ta ovšem nesplňuje 6 v 1 — 12.
Pokud ovšem nejsou v rozkladu čísla nebo polynomu p kvadráty, definujeme doplněk pomocí dělení jako q* — p/q a snadno ověříme potřebné vlastnosti z axiomů (6)-(8). □
10.51. Částečná uspořádání. K Booleovským algebrám teď půjdeme z jiné strany. Základní strukturou pro nás bude pojem uspořádání. Vzpomeňme na definici uspořádání jakožto reflexivní, antisymetrické a tranzitivní relace < na množině K. Taková relace obecně neříká o každé dvojici a, b e K jestli je a < b nebo b < a (takové uspořádání se nazývá úplné uspořádání nebo dobré uspořádání). Často v našem případě obecného uspořádání proto hovoříme také o částečném uspořádání a množina (K, <) vybavená částečným uspořádáním se nazývá poset (z anglického „partially ordered set").
Takové uspořádání je zejména vždy na množině K — 2M všech podmnožin množiny M prostřednictvím inkluze podmnožin. Pomocí naší relace infima na K je můžeme definovat jako A G B právě, když A a B — A. Ekvivalentně, A G B právě, když AvB — B.
Lemma. Je-li (K, a, V,') Booleova algebra, pak relace < definovaná výtahem A < B právě, když A a B — A, je částečné uspořádání. Navíc platí pro všechny prvky A, B, C e K
(1) A a B < A
(2) A v posledním odstavci.
Konečné posety se přehledně zobrazují pomocí orientovaných grafů. Prvky K jsou představovány uzly a hranou jsou spojeny právě prvky v relaci s orientací od většího k menšímu. Hasseho diagram posetu je zakreslení takového grafu v rovině tak, že větší prvky jsou zobrazeny vždy výš než menší (a orientace hran je tedy dána takto implicitně). Zvláště u malého počtu prvků množiny K je to velmi přehledný způsob, jak diskutovat různé příklady, viz obrázek níže.
__\ Svazy f
Definice. Svaz je poset (K, <), ve kterém každá dvouprvková množina {A, B} má supremum A v B a infimum AaB. Hovoříme přitom o úplném svazu, jestliže existuje supremum a infimum každé podmnožiny v K.
1
1
Na svazu (K, <) tedy máme definovány binární operace A a v a přímo z definice je zjevná asociativita a komutativita těchto operací (dokažte si podrobně!).
Všimněme si také že jakýkoliv prvek v A" je horní závorou pro prázdnou množinu, proto supremum prázdné množiny musí být menší než všechny prvky v K. Obdobně infimum prázdné množiny musí být větší než jakýkoliv prvek v K. Zejména tedy úplný svaz má vždy největší a nejmenší prvek.
Protože jsou binární operace A a v asociativní a komutativní, jistě existují v každém svazu suprema a infima všech konečných neprázdných množin. V případě konečných posetu (K, <) jde proto o úplný svaz tehdy a jen tehdy, když v něm existuje jediný největší prvek 1 e K a jediný nejmenší prvek 0 e K.
O svazu říkáme, že je distributivní, jestliže operace A a v splňují axiomy distributivity (4) a (5) z odstavce 10.46 na straně
640
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
635. Snadno lze ale nakreslit Hasseho diagram svazu, který není distributivní, viz obrázek níže.
Nyní už můžeme snadno definovat Booleovskou algebru v jazyce svazů: Booleovská algebra je distributivní svaz s největším prvkem 1 a nejmenším prvkem 0 takový, že v něm existují ke všem prvkům komplementy (tj. prvky splňující vlastnost 10.45(8).
Ověřili jsme již, že v takovém případě jsou komplementy definovány jednoznačně (viz úvahy na začátku odstavce 10.46), takže je naše alternativní definice Booleovské algebry korektní.
Všimněme si také, při diskusi dělitelů daného čísla nebo polynomu p jsme narazili na distributivní svazy Dp, které jsou Booleovskou algebrou právě tehdy, když rozklad p neobsahuje kvadráty, viz Lemma 10.50.
10.53. Homomorfismy. Jak jsme již viděli u mnoha matematických struktur, o objektech se dozvídáme informace pomocí tzv. homomorfismů, tj. zobrazení, které zachovávají příslušné operace. Obzvlášť
jednoduché je to u posetu:
_| isotonní zobrazení ^_»>_a«
Homomorfismem posetu (K, L, ze z A (L, A, v,') se nazývá homo-morfismus Booleovských algeber, jestliže pro všechny A, B e K platí
(1) f (A a B) — f (A) a f (B)
(2) f (A v B) — f (A) V f (B)
(3) f (A') = f (A)'.
Homomorfismus / je izomorfismus Booleovských algeber, jestliže je / bijektivní.
Podobně definujeme homomorfismy svazů jako zobrazení, ^^terá^sphiují^astao^t^(l) a (2).
Snadno se ověří, že bijektivnost / již zaručí, že f~l je opět homomorfismem.
Z definice uspořádání na Booleových algebrách nebo svazech je zřejmé, že každý homomorfismus / : K -> L bude také splňovat f (A) < f (B) pro všechny prvky A < B v K, půjde tedy vždy o izotonní zobrazení.
Jakkoliv umíme rekonstruovat operace suprema a infima z uspořádání, pokud toto vzniklo z Booleovy algebry, není pravda, že by každý homomorfismus posetu byl automaticky homomorfismem příslušných algeber nebo svazů, viz obrázek níže.
10.54. Věty o pevném bodě. Mnoho praktických úloh spočívá v diskusi pevných bodů zobrazení / : K -> K na
i, nějaké množině K, tj. prvků x e K s vlastností f (x) — x. Naše úvahy o infimech a supremech umožňují překvapivě snadno odvodit velice silná tvrzení tohoto typu. Dokážeme si jednu takovou klasickou větu, kterou odvodili Knaster a Tarski (ve speciálním případě Booleovské algebry podmnožin dané množiny již koncem dvacátých let 20. století, obecné tvrzení pak publikoval Tarski v r. 1955):
641
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
Věta (Tarského věta). Uvažujme libovolný úplný svaz (K, A, v) a libovolné isotonní zobrazení f : K -> K. Pak f má pevný bod a množina všech pevných bodů f je (s uspořádáním zdedeným z K) opět úplný svaz.
Důkaz. Označme M — {x e K; x < f (x)}. Protože v K existuje minimální prvek, je jistě M neprázdná a protože / zachovává uspořádání, je f (M) C M. Označme dále zi — sup M. Pak jistě pro x e M platí x < z\, tedy také f (x) < f(z\). Přitom zároveň vime x < f (x), takže f(zi) je horní závorou pro M. Pak ovšem nutně zi < f(zi), takže i zi e Ma proto f(zi) < z\. Dokázali jsme tedy f(zi) — zi a pevný bod je nalezen.
Trochu složitější je dokázat dovětek, že množina Z c A" všech pevných bodů zobrazení / je úplný svaz. Zřejmě jsme již našli její nej větší prvek zi — max Z a úplně stejným postupem s použitím infima a vlastnosti f(x) < x, místo definice M a jejího suprema, bychom našli také nejmenší bod zo — min Z.
Uvažme nyní libovolnou neprázdnou množinu Q c Z a označme y — sup Q. Toto supremum sice nemusí ležet v Q, ukážeme ale, že bude přesto v Z existovat supremum i ve zděděném uspořádání • R. Podle výše dokázaného tedy bude mít f\R nejmenší pevný bod ý. Samozřejmě je ý e Z a snadno nahlédneme, že ve skutečnosti je ý supremem námi zvolené množiny Q vůči zděděnému uspořádání na Z. Přitom je možné, že ý > y. Obdobným postupem se zaměněnými relacemi a volbou infima najdeme i infimum libovolné neprázdné podmnožiny v Z. Nej větší a nejmenší prvek jsme již našli dříve a důkaz je ukončen. □
Poznámka. V literatuře lze najít mnoho variant vět o pevných bodech v různých souvislostech. Jednou z velmi užitečných je tzv. Kleeneho věta, jejíž tvrzení můžeme vyčíst z právě dokázané věty následujícím způsobem.
Jestliže (ve značení Tarského věty) uvážíme spočetnou podmnožinu v K tvořenou tzv. Kleeneho řetězcem
0(0)(/(0))<...,
pak supremum z této podmnožiny zjevně nemůže být větší, než kterýkoliv pevný bod zobrazení /. Skutečně, pokud je y pevný bod zobrazení / pak ze vztahu 0 < y dostaneme / (O) < f(y) — y atd. Pokud má / navíc vlastnost, že „dostatečně" zachovává suprema, můžeme dovodit že f (z) bude opět supremem téhož řetězce a tedy pevný bod. Musí to proto být nejmenší pevný bod. Toto tvrzení se nazývá Kleeneho věta o pevném bodě a má četná použití v teorii rekurzí, při diskusi zastavení algoritmů atd.
Nebudeme zde zacházet do podrobností kolem tzv. spojitosti zobrazení mezi posely. Přesné formulace Kleeneho věty a dalších souvislostí lze nalézt např. v ??.
10.55. Normální tvary výrazů. Vrátíme se závěrem zpět k dis-kusi Booleovských algeber s konečným počtem prvků , IÍM a ukážeme si jejich úplnou klasifikaci.
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
Při diskusi výrokové logiky jsme se potýkali s problémem, co vlastně jsou prvky příslušné Booleovy algebry. Formálně vzato jsme je definovali jako třídy ekvivalentních výroků. Jinak řečeno, pracovali jsme s hodnotovými funkcemi pro výroky s daným počtem argumentů. Vůbec jsme přitom neřešili obtížný problém, jak rozpoznat stejné výroky v tomto smyslu. Také jsme neřešili, jestli všechny formálně možné hodnotové funkce (Z2)" -> Z2 lze zadat pomocí základních logických operací.
Zcela obdobně se můžeme tázat, jak poznat, zda dva systémy přepínačů mají stejnou funkci. Obdobně jako u výroků zde pro systém s n přepínači pracujeme s funkcemi (Z2)" -> Z2 a zjevně existuje právě 22 různých takových přepínacích funkcí. Na těchto funkcích umíme přirozeným způsobem zadat strukturu Booleovy algebry (využíváme, že hodnoty, tj. Z2 jsou Booleovou algebrou).
Odpovíme nyní na výše uvedené otázky tak, že pro libovolný prvek obecné Booleovy algebry sestrojíme jeho tzv. normální tvar, tj. napíšeme jej pomocí dobře vybrané skupiny nejjednodušších prvků a operace v. Porovnáním normálních tvarů dvou prvků pak už snadno poznáme, zda jsou stejné či nikoliv. Nejprve si tedy vybereme obzvlášť jednoduché prvky Booleovských algeber:
_i Atomy v Booleovské algebře ^■__na,
Prvek A e K nazveme atom v Booleově algebře K, jestliže pro všechny B e K platí A A B = A nebo A A B = 0.
Jinak řečeno, A je atom, když pro všechny ostatní prvky B < j A implikuje B = 0 nebo B = A.
Velmi jednoduché je to v Booleovské algebře všech podmnožin dané konečné množiny M. Zjevně budou atomy právě všechny jednoprvkové podmnožiny A = {x} v množině M. Skutečně, pro každou podmnožinu B budeme mít buď A A B = A, pokud x e B, nebo A A B = 0, pokud x ^ B.
Podívejme se ještě, jak vypadají atomy v Booleově algebře funkcí přepínačového systému s n přepínači A1,..., A„. Snadno ověříme, že zde je 2" atomů, které jsou tvaru A^ A • • • A A%", kde buď A*' = Ai nebo Af1 = A'
l 1 II
Skutečně, pro dvě funkce 2M vztahem
/(X) = /(Ai)U---U/(Ajt),
tj. jako sjednocení jednoprvkových podmnožin A; c M obsažených ve výrazu.
Z jednoznačnosti normální formy vyplývá, že / je nutně bi-jekcí. Zbývá dokázat, že jde o morfismus Booleovských algeber.
Jsou-li X a Y dva prvky v K, pak v normální formě jejich sjednocení jsou právě atomy, které vystupují v X nebo v Y, zatímco u průniku jsou to atomy vystupující v obou výrazech současně. To ale právě ověřuje, že / zachovává operace A a v. Pro doplňky si všimněme, že atom A vystupuje v normální formě X', právě když Z A A — 0. Odtud již vidíme, že i komplementy / zachovává a důkaz je ukončen. □
Pro nekonečné Booleovské algebry obecně neplatí, že by byly izomorfní Booleovské algebře všech podmnožin nějké vhodné množiny M. Platí však, že je izomorfní Booleově podalgebře vhodné podmnožiny všech množin nějaké množiny M. Tomuto výsledku se říká Stoneova věta o reprezentaci, důkaz lze najít např. v ??.
5. Kódování
Často potřebujeme přenášet informace a přitom zajišťovat jejich správnost. Někdy stačí zajistit, abychom poznali, zda je informace nezměněná, a při chybě si vyžádáme informaci znovu, jindy potřebujeme zajistit, aby chyby byly i opraveny bez nového
645
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
přenášení správy. To vše je úkol kódování a v dalších odstavcích se tomuto úkolu budeme věnovat.
Pokud navíc chceme, aby zprávu mohl číst pouze adresát, potřebujeme i tzv. šifrování. Tomu jsme se krátce věnovali na konci minulé kapitoly.
10.59. Kódy. Při přenosu informace zpravidla dochází k její de-formaci. Budeme pro jednoduchost pracovat s modelem, kdy jednotlivé částečky informace jsou buď nuly
C!'.' nebo jedničky (tj. prvky v Z2), říkáme jim bity, a v přenášíme konečná slova o k bitech, pro nějaké pevně
zvolené k e N. Obdobné postupy jsou možné nad libovolnými konečnými poli, my ale zůstaneme u nejjednoduššflio případu TL2.
Přenosové chyby chceme rozpoznávat, případně i opravovat, a za tím účelem přidáváme ke ^-bitovému slovu dodatečných n — k bitů informace pro pevně zvolené n > k. Hovoříme o (n,k)-kódech.
Všech slov o k bitech je 2k a každé z nich má jednoznačně určovat jedno kódové slovo z 2" možných. Máme tedy u (n, &)-kódů ještě
2" -2k = 2k(2n~k - 1)
slov, které jsou chybové. Lze tedy tušit, že pro veliké k nám i malý počet přidaných bitů dává hodně redundantní informace.
Úplně jednoduchým příkladem je kód kontrolující paritu. Kódové slovo o & + 1 bitech je určené tak, aby přidáním prvního bitu ke ^-bitovému slovu byl zaručen sudý počet jedniček ve slově. Jde tedyo(A: + l,Á:)-kód.
Pokud při přenosu dojde k Uchému počtu chyb, s použitím tohoto jednoduchého kódu na to přijdeme. Dvě různá kódová slova se při tomto kódu vždy liší alespoň ve dvou pozicích, chybové slovo se ale od alespoň dvou různých kódových slov liší pouze v pozici jedné. Nemůžeme proto umět chyby opravovat, ani kdybychom věděli, že při přenosu došlo k právě jedné chybě.
Přehledně jsou všechna možná slova o dvou bitech s jedním přidaným paritním bitem vidět na obrázku níže. Kódová slova jsou zvýrazněna tučným puntíkem.
000
Navíc kódem kontrolujícím pouze paritu neumíme detekovat tak obvyklé chyby, jako je záměna dvou sousedních hodnot ve slově.
10.60. Vzdálenost slov. Na obrázku ilustrujícím (3, 2)-kód kon-
trolující paritu je vidět, že ve skutečnosti každé chybné slovo je „stejně" daleko od tří kódových slov m—jsou to ta, která se Uší v právě jednom bitu. Ostatní
jsou dál. Abstraktně můžeme takové pozorování zachytit definicí vzdálenosti:
646
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
„„J Vzdálenost slov
Hammingova vzdálenost dvou slov je rovna počtu bitů, ve kterých se liší.
Pokud uvažujeme slova x, y, z a první dvě se Uší v r bitech, zatímco y a z se Uší v s bitech, pak se nutně x a z Uší v nejvýše r +s bitech, je tedy splněna trojúhelníková nerovnost pro vzdálenosti.
Aby kód mohl odhalovat chyby v r bitech, musí být minimální vzdálenost mezi kódovými slovy alespoň r+1. Pokud budeme chtít i opravit nepřesně přenesené slovo s r chybami, pak nutně musí existovat jen jediné kódové slovo, které má od přijatého chybného slova vzdálenost nejvýše r. OvěřiU jsme tedy jednoduchá tvrzení:
Věta. (1) Kód spolehlivě odhaluje nejvýše r chyb ve slově, právě když je minimální Hammingova vzdálenost kódových slov r + 1.
(2) Kód spolehlivě odhaluje i opravuje nejvýše r chyb, právě když je minimální Hammingova vzdálenost kódových slov 2r + 1.
10.61. Konstrukce polynomiálních kódů. K praktickému použití potřebujeme efektivně konstruovat kódová slova tak, abychom je mezi všemi slovy sladno rozpoznaU. Kontrolu parity jsme už viděli, další triviální možnost je prosté opakování bitů. Např. (3, l)-kód bere jednotlivé bity a posílaje třikrát po sobě.
Docela systematickou cestou ke konstrukci kódů je využití dělitelnosti polynomů. Zpráva bobi... bk-i je reprezentována jako polynom nad polem Z2
m(x) — bo + b\x + • • • + Zjj.-ix*-1 .
Í__„„Polynomiální kód ^MM—BBMaaaa, Nechť p(x) — ao + ■ ■ ■ + a„-kx"~k e Z2M je polynom s koeficienty ao — 1, an -k — 1. Polynomiální kód generovaný polynomem p(x) je (n, k)-kód jehož slova jsou polynomy stupně menšího než n dělitelné p(x).
Zpráva m(x) je zakódována jako v(x) — r(x) + x"~k m(x), kde r(x) je zbytek po dělení polynomu x"~km(x) polynomem j P(x).
Z definice kódového slova v(x) pro přenášené slovo m(x) čteme:
v(x) = r(x) + x"~km(x)
— r(r) + q(x)p(x) + r(x) — q(x)p(x),
protože nad Z2 je součet dvou stejných polynomů vždy nulový. Budou tedy skutečně všechna kódová slova dělitelná p(x).
Naopak, je-U v(x) dělitelné p(x), můžeme číst poslední výpočet z opačné strany a vidíme, že jde skutečně o kódové slovo vzniklé uvedeným postupem.
Z definice je také vidět, že kódové slovo vznikne přidáním n — k bitů na začátek slova. Původní zpráva je tedy obsažena přímo v polynomu v(x), takže dekódování správného slova je velmi snadné.
Uvedhie si dva jednoduché příklady, které už známe. Všimněme si nejprve, že 1 + x děU polynom v(x) tehdy a jen tehdy, když v(l) — 0. To nastane právě tehdy, když je ve v(x) sudý počet nenulových koeficientů. Polynom p(x) — 1 + x proto generuje (n,n — l)-kód kontroly parity pro všechna n > 3.
647
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
Obdobně se snadno ověří, že polynom p(x) — 1 + x H----+
x"-1 generuje (n, 1)-kód n-násobného opakování bitů. Skutečně, dělením polynomu box" ~1 polynomem /? dostaneme zbytek (1 + • • • + x" ~2) a tedy příslušné kódové slovo je bop (x).
10.62. Detekce chyb. Označme si e(x) vektor chyb, které vzniknou při přenosu. Místo posílaného slova v e (JL-if tedy dopadne přenos příjmem polynomu
u(x) — v(x) + e(x).
Chyba je rozpoznatelná pouze, když generátor kódu p(x) nedělí e(x). Máme proto zájem o polynomy p(x) v TL^YA, které nevystupují jako dělitelé zbytečně často.
Definice. Ireducibilní polynom p(x) e 7Lt\x\ stupněm se nazývá primitivní, jestliže p(x) dělí polynom (1 +xk) pro/c — 2m — 1, ale nedělí jej pro žádná menší k.
Věta. Je-li p(x) primitivní polynom stupně m, pak pro všechna n < 2m — 1 odhaluje příslušný (n, n—m)-kód všechny jednoduché a dvojité chyby.
Důkaz. Jestliže nastane právě jedna chyba, pak e(x) — xl pro vhodné 0 < i < n. Protože je p(x) ireducibilní polynom, nemůže mít kořen v 1*2. Zejména tedy nemůže dělit beze zbytku x*, protože rozklad x* je jednoznačný. Tedy je každá jednotlivá chyba rozpoznatelná.
Jestliže nastanou chyby právě dvě, pak
e(x) = x1 + xj — x1 (1 + xj~l )
pro jistá 0 < i < j < n. Již víme, že p(x) nedělí beze zbytku žádné x* a protože je primitivní, nedělí beze zbytku ani 1 4- x'~l , pokud je j—i < 2m —1. Zároveň je p (x) ireducibilní, nedělí proto ani součin e(x) — x1' (1 + xJ_í) a důkaz je ukončen. □
10.63. Důsledek. Je-li q(x) primitivní polynom stupně m, pak pro všechna n < 2m — 1 rozpoznává (n,n — m — \)-kód generovaný polynomem p (x) = q(x) (1 + x) všechny dvojité chyby a všechna slova s lichým počtem chyb.
Důkaz. Kódová slova generovaná zvoleným polynomem p(x) jsou dělitelná jak x + 1, tak primitivním polynomem pi(x). Jak jsme již ověřili, faktor x + 1 má za důsledek kontrolu parity, tj. všechna kódová mají sudý počet nenulových komponent. Tím umíme odhalit výskyt lichého počtu chyb. Jak jsem již také viděli v předchozí větě, druhý faktor umí odhalit dvojnásobné chyby. □
Následující tabulka ilustruje sílu výsledků předchozích dvou tvrzení pro několik primitivních polynomů v nízkých stupních. Např. poslední řádek nám říká, že přidáním pouhých 11 kontrolních bitů ke slovu o délce 1012 bitů budeme umět pomocí polynomu (x + l)p(x) odhalit jednotlivé, dvojité, trojité a všechny liché počty výskytů chyb v přenosu. Jde přitom o přenášení dosti velkých čísel, v desítkové soustavě by měly přes třista cifer.
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
primitivní polynom p (x) kontrolní bity délka slova
1 + X 1 1
1 + x - h x2 2 3
1 + x - h x3 3 7
1 + x - h x4 4 15
1 H h x2 - h x5 5 31
1 + X - h x6 6 63
1 H h x3 - h x7 7 127
1 +X2 +X3 H h x4 - h x8 8 255
1 H hx4- h x9 9 511
1 + x3 + x10 10 1023
Nástroje pro konstrukci primitivních polynomů dává teorie konečných polí. Souvisí s tzv. primitivními prvky v Galoisových polích G(2m). Ze stejné teorie lze také dovodit příjemnou realizaci dělení se zbytkem, tj. ověřování, zdaje přijaté slovo kódové, pomocí zpožďovacích registrů. Jde o jednoduchý obvod s tolika prvky, kolik je stupeň polynomu.8
10.64. Lineární kódy. Polynomiální kódy lze efektivně popisovat také pomocí elementárního maticového počtu. Budeme přitom pracovat s vektorovými prostory nad Z2, takže musíme být opatrní při využívání výsledků ■¥ůvé*^>^— elementární lineární algebry, protože jsme v ní často využívali vlastnost že v — — v zaručuje v — 0. To nyní samozřejmě neplatí.
Základní definice vektorových prostorů, existence bazí a popis lineárních zobrazení pomocí matic ale zůstávají v platnosti. Bude užitečné připomenout si při čtení následujících odstavců obecnou teorii a ujistit se o její použitelnosti.
Vyjdeme z obecnější definice kódů, která požaduje lineární závislost kódového slova na původní informaci:
mtm^^^„_—j Lineární kódy
Injektivní lineární zobrazení g : (Z2)* -> (Z2)" je lineární kód. Matice G typu k/n reprezentující toto zobrazení ve standardních bazích se nazývá generující matice kódu.
Pro každé slovo v je příslušným kódovým slovem delší vektor u — G ■ v.
Věta. Každý polynomiální (n, k)-kód je lineární kód.
Důkaz. Použijeme elementární vlastnosti dělení polynomů se zbytkem. Použijme naše přiřazení polynomu v(x) — r(x) + x"~km(x) původní polynomiální zprávě m(x) na součet dvou různých zpráv m(x) — m\(x) + m2(x). Zbytek po dělení x"~k (m\(x) + m2(x)) je díky jednoznačnosti dělení dán jako součet zbytků r\ (x) + r2(x) pro jednotlivé zprávy. Dostaneme tedy
v(x) — r\(x) + r2(jc) +x"~k (m\(x) + m2(jc)),
což je požadovaná aditivita. Protože jediným nenulovým skalárem je v Z2 jednička, dokázali jsme požadovanou lineritu zobrazení slova m(x) na delší slovo v(x). Toto zobrazení je navíc injektivní, protože původní slovo m(x) je prostě zkopírováno za přidané bity.
□
Více o této krásné teorii a jejích souvislostech s kódy se lze dočíst např. knize Gilbert, W., Nicholson, K., Modern Algebra and its applications, John Wiley & Sons, 2nd edition, 2003, 330+xvii pp., ISBN 0-471-41451-4.
649
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
Např. uvažujme polynomiální (6, 3)-kód využívající polynomu p (x) — 1 + x + x3 pro kódování slov se třemi bity. Vyčíslením na jednotlivých bázových prvcích m i (x) — x*-1, / — 1,2,3 dostáváme
^0 — (1 +x) +x3
/ 2 \ 4
Dl — (X + X ) + X
V2 — (1 +X +X2) +X5
a tedy matice odpovídající tomuto (6, 3)-kódu je
G =
(1 0 1\
1 1 1
0 1 1
1 0 0
0 1 0
V> 0 v
Protože je u polynomiálních kódů vždy původní slovo zkopírováno za přidané kontrolní bity, musí mít každý lineárni kód vzniklý z polynomiálního matici s jednotkovým blokem I* řádu k zabírajícím posledních k řádků matice, doplněným maticí P s n—k řádky a k sloupci.
10.65. Věta. Je-li g : (Z2)* —>• (Z2)" lineární kód s (blokově zapsanou) maticí
potom zobrazení h : (Z2)" —>• (Z2)" * s maticí H = (I„_jt P)
má následující vlastnosti
(1) Ker /i = Img
(2) Přijaté slovo u je kódové slovo právě, když je H ■ u — 0.
Důkaz. Složení h o f : (Z2)* —>• (Z2)"-* je dáno součinem matic (počítáme nad Z2)
H ■ G — (l„-k
— P + P — 0.
DokázaU jsme tedy Img c Ker h. Protože je prvních n—k sloupců v H tvořeno bázovými vektory v (Z2)"-*, má obraz Im/z maximální dimenzi n — k a tedy má tento obraz 2n~k různých vektorů. Vektorové prostory nad Z2 jsou konečné komutativní grupy, proto můžeme použít vztah mezi mohutnostmi pogrup a faktorgrup z odstavce 10.10 a dostáváme
|Ker/i| • \ lmh\ = |(Z2)"| = 2".
Proto je počet vektorů v Ker h roven 2" • 2k~n — 2k. K dokončení důkazu prvního tvrzení si nyní stačí povšimnout, že obraz Im / má také 2k prvků.
Druhé tvrzení je samozřejmým důsledkem prvního tvrzení.
□
Matici H z věty se říká matice kontroly parity přílušného (n, &)-kódu.
Např. matice H — (1 1 1) je zjevně takovou maticí pro (3, 2) kód přidávající jeden paritní bit k slovu o dvou bitech. Skutečně ji
650
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
snadno dostaneme z matice
zadávající tento kód.
Pro výše uvedený (6, 3)-kód to bude matice
/l 0 0 1 0 1\ // = 0 1 0 1 1 1 J . \0 0 1 0 1 1/
10.66. Samoopravné kódy. Jak jsme viděli, přenos zprávy u dává výsledek
v — u + e.
To je ale nad TL2 ekvivalentní e — u + v.
Pokud tedy známe vektorový podprostor V c (Z2)" správ-
fných kódových slov, víme u každého výsledku, že správné slovo (s opravenými případnými chybami) je ve třídě rozkladu v + V ve faktorovém vektorovém prostoru (Z2)"/V. Zobrazení h : (Z2)" -> (Z2)"-* zadané maticí kontroly parity má V za jádro, proto indukuje injektivní lineární zobrazení/z : (Z2)"/V -> (Z2)"-*. Jeho hodnoty jsou jednoznačně určeny hodnotami H ■ u.
—,^^mmm^l^_Syndromy slov
Hodnota H ■ u, kde //je matice kntroly parity pro lineární kód, se nazývá syndrom slova u v tomto kódu.
Samozřejmým důsledkem konstrukce je následující:
Věta. Dvě slova jsou ve stejné třídě rozkladu u + V právě, když sdílí syndrom.
Samoopravné kódy nyní můžeme konstruovat tak, že pro každý syndrom určíme prvek v příslušné třídě, který je nej-vhodnějším slovem. Budeme patrně vybírat tak, abychom s co největší pravděpodobností opravili jednu, případně více chyb.
Zkusme si to na příkladu (6, 3), pro který už máme spočteny matice G a H. Sestavíme tabulku všech syndromů a jim odpovídajících kódových slov.
Syndrom 000 mají právě všechna kódová slova. Všechna možná slova s daným syndromem pak dostaneme přičtením syndromu (doplněného nulami na délku kódového slova) ke všem kódovým slovům.
V následujících dvou tabulkách jsou v prvním řádku příslušné syndromy, na dalším řádku pak uvádíme ten z vektorů v příslušné třídě, který má nejméně jedniček. Skoro ve všech případech jde o jedinou jedničku, jen v posledním řádku máme jedničky dvě a zvolili jsme si jako význačný prvek ten, který má jedničky vedle sebe (třeba protože věříme, že násobné chyby s větší pravděpodobností nastávají těsně po sobě)
000 100 010 001
000000 100000 010000 001000
110100 010100 100100 111100
011010 111010 001010 010010
111001 011001 101001 110001
101110 001110 111110 100110
001101 101101 011101 000101
100011 000011 110011 101011
010111 110111 000111 011111
651
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
110 011 111 101
000100 000010 000001 000110
110000 110110 110101 110010
011110 011000 011011 011100
111101 111011 111000 111111
101010 101100 101111 101000
001001 001111 001100 001011
100111 100001 100010 100101
010011 010101 010110 010001
Počínaje druhým sloupcem první tabulky, je každý řádek tabulky afinním prostorem, jehož zaměřením je vektorový prostor daný prvním řádkem první tabulky. Je tomu tak, protože daný kód je lineární, všechna kódová slova tedy tvoří vektorový prostor a jednotlivé třídy ve faktorovém prostoru jsou afinní podprostory.
Zejména je tedy rozdíl každých dvou slov ve stejném řádku nějakým kódovým slovem. Tučně vyznačená slova představují tzv. vedoucí representanty třídy (afinního prostoru) odpovídajícího danému syndromu. Jsou to slova s nejmenším počtem jedniček v řádku. Udávají tak nejmenší počet bitových změn, které musíme v libovolném slovu na řádku provést, abychom dostali kódové slovo.
Např., pokud dostaneme kódové slovo 111101, má syndrom 110. Vedoucím representantem ve třídě tohoto syndromu je slovo 000100 a jeho odečtením od obdrženého kódového slova dostaneme platné kódové slovo 111001. Je to platné kódové slovo s nejmenší Hammingovou vzdáleností od obdrženého slova. Odeslaná zpráva tedy patrně byla 001.
652
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
653
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
654
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
655
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
656
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
657
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
658
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
659
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
660
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
661
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
662
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
Řešení cvičení
9.15.
PX,Y — -1-
10.2. 1) Pologrupa s neutrálním prvkem (monoid). 2) Pologrupa. 3) Není ani grupoid (operace není na dané množině uzavřená). 4) Monoid. 5) Grupa. 6) Grupa. 7) Grupa. 8) Pologrupa. (1 není neutrální prvek kvůli prvku 0)
10.4. Čtyřprvková podgrupa, přibude pouze zrcadlení podle roviny kolmé k uvažované rovině obsahující osu rotace o (je izomorfní Kleinově grupě). Není normální.
10.9. Předpokládejte opak, totiž že polynom součinem dvou polynomů s celočíselnými koeficienty. Indukcí dokažte, že jeden z těchto mnohočlenů má všechny koeficienty dělitelné prvočílem p (začněte u absolutního člene). Pak by však byl i vedoucí koeficient f(x) dělitelný p.
10.16. 7.
10.25. Nad M: (x -l)(2x2 - x + l)2, nad C: (x - l)(x - ^f^)2.
10.26. Nad M: (x + l)(x2 + x + 2)2, nad C: (x + l)(x + ^^)2.
10.27. Nad M: (x2 - 3x + 2)2, nad C: (x - 1 + V2i)2(x - 1 - V2i)2.
10.28. x5+x2+2x + l = (x2 + lXx3 + 2x + 1).
10.29. x4 + 2X3 + 2 je ireducibilní. Nemá kořeny a není součinem dvou polynomů stupně 2 (nutno početně ověřit!).
10.31. 011.
10.34. A'aC.
10.35. (A NAND(B NAND B)).
10.36. Např. {1,2, 3, 12, 18}.
10.37. 110.
10.39. 31.
10.40. 45.
10.41. 63.
10.42. 33.
10.15. & (
24!
+ (4!)3+Z23+^ J- + Z^(4!)3//
= 197216213.
663
KAPITOLA 10. ALGEBRAICKÉ STRUKTURY
10.52. Poznámky o šifrách. Šifrování slouží k tomu, abychom přenesli mezi danými (dvěma) uživateli tajnou informaci, který by měl zůstat ostatním lidem nepřístupný. Historie šifrování sahá až do starověku, kde je známým příkladem Spartská skytala. Šifry nacházely využití zejména pro vojenské účely a například prolomení německé šifry Enigma za druhé světové války poskytlo spojencům možná rozhodující převahu. V současné době se šifrují například i televizní kanály, i když názvosloví je zde odlišné od matematema-tického, protože se spíše hovoří o kódovaných kanálech, nikoliv o šifrovaných.
10.53. RSA Algoritmus. Jde o algoritmus, který byl publikován v sedmdesátých letech dvacátého století pány Ronem Rivestem, Adi Shamirem a Leonardem Aldlemanem v roce 1978. Tento algoritmus umožňuje výměnu soukromých informací aniž by si odesílatel a příjemce museli vyměnit nějaký tajný klíč, na jehož utajení by závislá bezpečnost algoritmus.
Vlastní algoritmus probíhá v těchto fázích:
i) Příjemce zvolí dvě velká prvočísla p a q a dále zvolí přirozené e nesoudělné s 5 budou jistě buď aspoň tři plné nebo aspoň tři čárkované. Situace je znázorněná na pravém obrázku. Ve zobrazeném kousku celé situace se sledovaný host se třemi jinými zná, zbylé puntíky jsou spojeny čárkovaně - to by znamenalo, že máme trojúhelník hostů, kteří se neznají. Pokud by se ale jedna dvojice z nich znala, vznikl by naopak trojúhelník hostů, kteří se znají.
Nyní předpokládejme, že máme krabičku, která požírá jeden bit za druhým (třeba podle toho, jestli dveřmi zrovna prošel muž nebo žena - jednička nechť označuje třeba ženu), a má svítit buď modře nebo červeně podle toho, zda byl poslední bit nula nebo jednička (a bodle barvy světla tedy můžeme tedy poznat, zdaje za dveřmi muž nebo žena). Opět si schéma můžeme pěkně znázornit:
A. Základní pojmy
11.1.
11.2. Určete, kolik existuje homomorfismů grafů
a) z P-i do K5,
b) z K3 do K5
Řešení.
a) 5 • 4 • 4 = 80.
b) 5 • 4 • 3 = 60.
Jediné omezení je, že se uzly mezi kterými vede hrana nesmí zobrazit na tentýž uzel. □
11.3. Dokažte, že vrcholový graf musí být vrcholově 2-souvislý. Udejte příklad grafu, který je vrcholově 2-souvislý a přesto v něm neexistuje hamiltonovská kružnice.
Řešení. V hamiltonovském grafu vedou mezi Ubovolnými dvěma uzly dvě neprotínající se cesty („oblouky" hamiltonovské kružnice). Odstraněním jednoho bodu, se tedy zjevně neporuší souvislost grafu (odstraněný bod může ležet pouze na jedné ze dvou cest). □
B. Kombinatorické úlohy o grafech
11.4. Kolik existuje různých koster grafu K5? Kolik různých jich existuje až na izomorfismus?M
Řešení. M Existují tři navzájem neizomorfní kostry (se skóre (1, 2, 2, 2, 1), (1, 2, 3, 1, 1), (4, 1, 1, 1, 1)).M Příslušné třídy isomorfních grafů mají postupně 5 • (*) • 2, 5 • 4 • 3 aM 5 prvků, celkem 125 různých koster, což souhlasí s obecným vzorcem pro počet koster úplného grafu.M DM
667
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
co
Třetí uzel, ze kterého pouze vychází dvě šipky naznačuje start před prvním zaslaným bitem.
11.2. Základní pojmy grafů. V obou příkladech máme společné schéma. Máme nějakou konečnou množinu objektů, kterou si znázorňujeme jako uzly a jejich vlastností, které znázorňujeme spojnicemi mezi nimi. Už dávno víme, že takové situace umíme popisovat pomocí tzv. relací, viz. text začínající odstavcem 1.36 v šesté části první kapitoly. Třeba čtenáře neodstraší ukázka, jak se jednoduchým věcem dá složitě říkat: V našem prvním příkladu pracujeme na stejné množině hostů se dvěmi komplementárními symetrickými a antireflexními relacemi, ve druhém pak jde o příklad dvou antisymetrických relací na třech prvcích.
My teď ale můžeme na relace pozapomnět a budeme pracovat s terminologií odpovídající našim obrázkům. Nenechte se zmást novým významem slova graf, pro který jsme již měli význam u funkcí. Ve skutečnosti není věcná podobnost až tak vzdálená.
Definice. Grafem G — (V, E) rozumíme množinu V jeho vrcholů spolu s podmnožinou E množiny (j) všech dvouprvkových podmnožin ve V. Prvkům E říkáme hrany grafu. Vrcholům ve hraně e — {v, w], v ^ w, říkáme hraniční vrcholy hrany e. O hranách, které mají daný vrchol v za hraniční říkáme, že z vrcholu v vycházejí.
Orientovaným grafem G — (V, E) rozumíme množinu V jeho vrcholů spolu s podmnožinou E c V x V. Prvnímu z vrcholů definujících hranu e — (v, w) říkáme počáteční vrchol hrany, druhému pak koncový vrchol. Hrana e vychází ze svého počátečního vrcholu a vchází do koncového. U orientovaných hran mohou být koncový a počáteční vrchol totožný, hovoříme pak o smyčce.
Sousední hrany grafu jsou ty, které sdílí hraniční vrchol, u sousedních hran orientovaného grafu musí být vrchol pro jednu koncový a pro druhou počáteční. Naopak, sousední vrcholy jsou ty, které jsou hraničními pro tutéž hranu.
Grafy jsou mimořádně dobrým jazykem pro přemýšlení o postupech a odvozování vztahů týkajících konečných množin objektů. Jsou totiž pěkným příkladem kompromisu mezi přirozeným sklonem k „přemýšlením v obrázcích" a přesným matematickým vyjadřováním. Obecný jazyk teorie grafů nám v konkrétních úlohách také umožňuje přidávat informace o vrcholech nebo hranách. Můžeme tak např. „obarvit" vrcholy podle příslušnosti objektů k několika disjunktním skupinám nebo můžeme označit hrany několika různými hodnotami apod. Existence hrany mezi vrcholy různých barev může naznačit „konflikt". Např. když modré a červené uzly představují pánskou a dámskou část večírku, pak
11.5. Označme vrcholy v grafu K6 postupně čísly 1, 2,... 6 a každou hranu {/, j} ohodnoťme číslem [(/ + j) mod 3] + 1. Kolik existuje různých minimálních koster v tomto grafu?
Řešení. Hrany s ohodnocením jedna tvoří kružnici 12451 délky čtyři a hranu 36. Jde tedy o nesouvislý podgraf daného grafu. Není tedy možné vybrat kostru daného grafu pouze z hran s ohodnocením jedna. Minimální kostra bude mít tedy součet ohodnocení hran v ní minimálně 4-1+2 = 6. Kostru s touto hodnotou skutečně můžeme vybrat. Z hran s ohodnocením 1 můžeme vypustit libovolnou hranu ze zmiňované kružnice a nezávisle přidáme nějakou hranu s ohodnocením dvě, která spojuje v podgrafu hran s ohodnocením jedna komponentu 1245 s komponentou 36. Takové hrany jsou celkem čtyři. Celkem má daný graf 4 • 4 = 16 různých minimálních koster. □
11.6. Označme vrcholy v grafu K§ postupně čísly 1, 2,... 6 a každou hranu {/, j} ohodnoťme číslem [(/ + j) mod 3] + 1. Kolik existuje různých maximálních koster v tomto grafu?
Řešení. Hrany s ohodnocením tři tvoří kružnici 23562 délky čtyři a hranu 14. Jde tedy o nesouvislý podgraf daného grafu. Není tedy možné vybrat kostru daného grafu pouze z hran s ohodnocením tři. Maximální kostra bude mít tedy součet ohodnocení hran v ní nejvýše 4-3+2 = 14. Kostru s touto hodnotou skutečně můžeme vybrat. Zhraň s ohodnocením 3 můžeme vypustit libovolnou hranu ze zmiňované kružnice a nezávisle přidáme nějakou hranu s ohodnocením dvě, která spojuje v podgrafu hran s ohodnocením tři komponentu 2356 s komponentou 14. Takové hrany jsou celkem čtyři. Celkem má daný graf 4-4 = 16 různých maximálních koster. □
11.7. Označme vrcholy v grafu K7 postupně čísly 1, 2,... 7 a každou hranu {/, j} ohodnoťme číslem [(/ + j) mod 3] + 1. Kolik existuje různých minimálních koster v tomto grafu?
Řešení. Nej levnější hrany s ohodnocením jedna tvoří podgraf obsha-hující všechny vrcholy a mající dvě komponenty, které mohou být propojeny nějakou hranou s druhým nejmenším ohodnocením. Minimální kostra má tedy součet ohodnocení jejch hran minimálně 6x1+2 = 8. Kostry s touto hodnotou skutečně existují, je totiž šest hran hodnoty 2, které propojují zmiňované dvě komponenty. Konkrétně jde o komponentu {1, 2, 4, 5, 7} a {3, 6}. V první komponentě existují právě tři kružnice a to délky 4, přičemž každá ze šesti hran této komponenty leží právě ve dvou kružnicích. Abychom z dané komponenty získali strom, musíme dvě hrany vypustit, to můžeme udělat 6 • 4/2 způsoby. Celkem dostáváme 12 • 6 = 72 různých minimálních koster. □
668
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
hrana mezi vrcholy různých barev může znamenat potenciální nevhodnost sdílení pokoje pro přenocování. Náš první příklad v předchozím odstavci můžeme tedy chápat jako graf s obarvenými hranami. Dokázané tvrzení v této řeči zní: V grafu Kn — (V, (j)) s n vrcholy a se všemi možnými hranami obarvenými na dvě barvy je vždy alespoň jeden trojúhelník z hran o stejné barvě, pokud je počet vrcholů alespoň šest.
Výše znázorněný orientovaný graf s označenými hranami (hodnotami nula nebo jedna) představuje jednoduchý konečný automat. Tento název odráží představu, že graf popisuje proces, který se vždy nachází ve stavu popsaným některým z uzlů a další stav nastane procesem, odpovídajícím jedn z hran, které z vrcholu vychází. Teorií konečných automatů se zde nebudeme podrobněji zabývat.
11.3. Příklady užitečných jednoduchých grafů. Nejjed-nodušším grafem je graf bez hran, pro ten si ale ani nebudeme zavádět zvláštní označení.
Opačný extrém je naopak užitečný a grafu se všemi možnými hranami říkáme úplný graf. Značíme symbolem Kn, kde n je počet vrcholů grafu. Graf K4 a K5 jsme již viděli, K3 je trojúhelník, K2 je úsečka.
Dalším důležitým grafem je cesta, tj. graf, kde existuje uspořádání vrcholů (vq, ... ,v„) takové, že E — {e\,..., e„], kde e i — {vi-i, v i], pro všechny i — 1, ... ,n. Hovoříme o cestě délky n a značíme ji Pn. Pokud cestu upravíme tak, že poslední a první vrchol splývají, dostaneme kružnici délky n a značíme Cn- Na dalším obrázku vidíme K3 — C3, C5 a P5
nJ
Dalším příkladem je tzv. úplný bipartitní graf který vznikne tak, že vrcholy si obarvíme dvěmi barvami a pak přidáme všechny hrany, které spojí vrcholy různých barev. Značíme jej A"m,«, kde m a n jsou počty vrcholů s jednotlivými barvami. Na obrázku je vidět
K\,3, K2,3 a £"3,3-
V
Dobrým příkladem grafu je také tzv. hyperkostka Hn v dimenzi n, která vznikne tak, že vrcholy jsou všechna čísla 0,..., 2" — 1. Hrany spojí právě ta čísla, která se v zápisu v dvojkové soustavě liší v právě jednom bitu. Na obrázku níže je h4 a popis vrcholů je naznačen.
Všimněme si, že přímo z definice vyplývá, že hyperkostku v dané dimenzi vždy cky dostaneme tak, že vhodně spojíme hranami dvě hyperkostky o jednu dimenzi menší. Na obrázku je to
11.8. Označme vrcholy v grafu K5 postupně čísly 1, 2,... 5 a každou hranu i, j,i = 1, ..., 5 ohodnoťme číslem 1, pokud je (/ + j) liché, číslem 2, pokud je (/ + j) sudé. Kolik existuje různých maximálních koster v tomto grafu? O
11.9. Označme vrcholy v grafu K5 postupně čísly 1, 2,... 5 a každou hranu {/, j},i = 1,... ,5 ohodnoťme číslem 1, pokud je (/ + j) liché, číslem 2, pokud je (/ + j) sudé. Kolik existuje různých minimálních koster v tomto grafu? O
11.10. Označme vrcholy v grafu K6 postupně čísly 1, 2,... 6 a každou hranu i, j, i = 1, ..., 6 ohodnoťme číslem 1, pokud je (/ + j) dává zbytek 1 po dělení třemi, číslem 2, pokud je (/ + j) dává zbytek 2 po dělení třemi a konečně číslem 3, pokud je (/ + j) dělitelné třemi. Kolik existuje různých minimálních koster v tomto grafu? O
11.11. Označme vrcholy v grafu K6 postupně čísly 1, 2,... 6 a každou hranu i, j, i = 1, ..., 6 ohodnoťme číslem 1, pokud je (/ + j) dává zbytek 1 po dělení třemi, číslem 2, pokud je (/ + j) dává zbytek 2 po dělení třemi a konečně číslem 3, pokud je (/ + j) dělitelné třemi. Kolik existuje různých maximálních koster v tomto grafu? O
11.12. Určete, kolik existuje v grafu K5 různých kružnic.
Řešení. Spočítáme postupně délky kružnic délek tři, čtyři a pět. Kružnice délky tři je jednoznoznačně dána třemi body na ní. Tři body můžeme vybrat (3) způsoby. Kružnice délky 4 je dána svými vrcholy (ty můžeme vybrat q) způsoby a dvojicí sousedů jednoho pevně zvoleného vrcholu na kružici (tu je možné vybrat (^) způsoby ze zbývajících tří bodů). Konečně kružnice délky pět je dána opět dvojicí sousedů jednoho pevně zvoleného vrcholu a navíc ještě dalším vrcholem (ze dvou zbylých), sousedícím s jedním vybraným vrcholem ze dvou sousedů. Celkem tak máme
:k:
možností. □
37
11.13. Určete počet podgrafů grafu K5. Q
Řešení. Počet podgrafů spočítáme postupně podle počtu 1; jejich vrcholů:
• 1; = 0. Jde o prázdný graf. Ten je pouze jediný.
• 1; = 1. Jeden vrchol můžeme vybrat pěti způsoby, celkem 5 grafů.
m v = 2. Dva vrcholy můžeme vybrat způsoby, mezi vybranými vrcholy pak buď vede nebo nevede hrana. Celkem (2)2 grafů.
669
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
naznačeno tak, že příslušné hrany mezi dvěmi disjunktními kopiemi H3 jsou čárkované. Samozřejmě ale můžeme tímto způsobem rozložit Ha, mnoha různými způsoby.
1110 mi
0100
1011
0000 0001
Poslední dva príklady jsou tzv. cyklický žebřík CLn s 2n vrcholy, který je složen propojením dvou kopií kružnice C„ tak, že hrany spojí odpovídající vrcholy dle pořadí a tzv. Petersenův graf, který je sice docela podobný CL5, ale ve skutečnosti je to nejjed-noduší „vyvraceč nesprávných úvah" - graf, na němž se vyplatí testovat tvrzení, než je začneme dokazovat.
11.4. Morfismy grafů a podgrafy. Jako u všech matematických pojmů, klíčovou roh hrají zobrazení mezi objekty, která zachovávají uvažovanou strukturu.
Definice. Pro grafy grafy G = (V, E) a G' = (V, É) budeme za morfismus / : G -> G' považovat zobrazení fy : V -> V mezi množinami vrcholů takové, že je-li e — {v, w] hrana v E, pak e' — {f(v), f (w)} musí být hranou v E'. V dalším textu nebudeme ve značení odlišovat morfismus / a zobrazení fy. Zároveň pak takové zobrazení fy určuje i zobrazení f e ■ E -> E', f (e) — e', kde e a e' jsou jako výše.
Pro orientované grafy je definice shodná, jen pracujeme s uspořádanými dvojicemi e — (v, w) v roh hran.
Všimněme si, že u grafů tato definice znamená, že pokud f (v) — f(w) pro dva různé vrcholy ve V, pak mezi nimi nesměla být hrana. U orientovaných grafů, taková hrana je přípustná, pokud je na společném obrazu smyčka.
Speciálním případem je morfismus libovolného grafu G do úplného grafu Km. Takový morfismus je ekvivalentní vybranému obarvení vrcholů grafu V pomocí m různých jmen uzlů Km tak, že stejně obarvené uzly nejsou spojeny hranou. Hovoříme v tomto případě o barvení grafu pomocí m barev.
• 1; = 3. Tři vrcholy můžeme vybrat (3) způsoby, mezi každými dvěma vybranými vrcholy buď vede, nebo nevede hrana, celkem (3) • 2® grafů.
• v = 4. Q ■ 20 grafů.
• v = 5.(55)- 2© grafů.
Celkem 1550 podgrafů grafu K5.
□
11.14. Určete, kolik existuje v grafu K7 různých cest mezi zadanými dvěma různými vrcholy. O
11.15. Určete počet cest mezi dvěma různými pevně vybranými vrcholy v grafu K7. Q
Řešení. Spočítáme cesty postupně podle jejich délky. Cesta délky jedna je jedna (hrana spojující dva vybrané vrcholy). Cest délek dva je pět (vybíráme jeden z pěti zbylých vrcholů, přes který cesta půjde). Cest délek tři je 5 • 4 (vybíráme v daném pořadí dva vrcholy, přes které cesta půjde), obdobně cest délky čtyři je 5 • 4 • 3, cest délky pět je 5 • 4 • 3 • 2 a konečně cest délky šest je taktéž 5!. Delší cesty v K7 nejsou. Celkem máme l + 5 + 5- 4 + 5- 4- 3 + 5! + 5! = 326 cest. □
11.16. Kolik minimálně hran může mít šestistěn?
Řešení. V libovolném mnohostěnu je každá stěna ohraničena minimálně třemi hranami. Kaž ve dvou stěnách. Označíme-li s počet stěn a h počet hran mnohostěnu dostáváme tak odhad 3s <2h. Pro šestistěn dává tento odhad 18 < 2h, neboli h > 9. Šestistěn s devíti hranami skutečně existuje, dostaneme jej například „slepením" dvou stejně velikých pravidelných čtyřstěnů stěnou k sobě. Minimální možný počet hran šestistěnu je tedy devět. □
C. Základní algoritmy
11.17. Označme vrcholy v grafu K6 postupně čísly 1, 2,... 6. Kterou hranu grafu K6 objeví algoritmus „prohledávání do šířky", bude-li počátečním vrcholem vrchol 5 a hrany ze zpracovávaného vrcholu budeme procházet postupně podle velikosti druhého koncového vrcholu hrany (od nejmenšího). O
11.18. Označme vrcholy v grafu K6 postupně čísly 1, 2,... 6. Napište posloupnost hran grafu K6 tak, jak je bude procházet algoritmus „prohledávání do hloubky", bude-li počátečním vrcholem vrchol 5 a hrany ze zpracovávaného vrcholu budeme procházet postupně podle velikosti druhého koncového vrcholu hrany (od nejmenšího). O
11.19. Označme vrcholy v grafu K6 postupně čísly 1, 2,... 6. Napište posloupnost hran grafu K6 tak, jak je bude procházet algoritmus
670
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
V případě, že je morfismus / : G -> G' bijekcí na vrcholech takovou, že i f~l je morfismem, hovoříme o izomorfismu grafů. Izomorfní grafy se liší pouze různým pojmenováním vrcholů.
Snadno si budeme umět načrtnout až na izomorfismus všechny grafy na málo vrcholech (třeba třech nebo čtyřech). Obecně jde ale o nesmírně složitý kombinatorický problém a i rozhodnutí o konkrétních dvou daných grafech, zda jsou izomorfní je obecně mimořádně obtížné.
Jednoduchými a mimořádně užitečnými příklady morfismů grafů jsou pojmy cesta, sled a kružnice v grafu:
Cestou délky n v grafu G rozumíme morfismus p : P„ -> G takový, že p je injektivní zobrazení (tj. všechny obrazy vrcholů vq, ■■■ ,vn z Pn jsou různé). Sled délky n v grafu G je jakýkoliv morfismus s : P„ -> G (tj. v obrazu se mohou opakovat vrcholy).
Sled si můžeme představit jako dráhu „přičinlivého ale tápajícího" poutníka z uzlu f(vo) do uzlu fVn. Poutník se totiž v žádném uzlu nezastaví, ale klidně se po cestě grafem vrací do uzlů nebo i dokonce po hranách, kterými dříve šel. Cesta je naopak průchod grafem z počátečního uzlu f(vo) do koncového f(vn) bez takových zbytečných oklik.
Obrazy cest i sledů jsou příkladem tzv. podgrafů, ne však stejným způsobem. Definujme nejprve obecně, co je to podgraf.
Uvažujme graf G = (V, E) a nějakou podmnožiny V G V. Indukovaný podgraf je graf G' = (V, E'), kde e e E patří i do E' právě, když oba krajní vrcholy hrany e patří do V'. Podgraf G' = (V, E') je takový graf, který má stejnou množinu vrcholů jako G, ale jeho množina hran E je libovolnou podmnožinou. Obecně můžeme pro konstrukci podgrafů použít oba procesy - napřed zvolíme V c V a pak v indukovaném podgrafů vybereme cílovou množinu hran E'. Úplně formálně tedy dostáváme:
Definice. Graf G' = (V, E') je podgrafem v grafu G jestliže V C V, E' c E.
(V, E),
Snadno je vidět, že každý obraz homomorfismu (tj. obraz jak vrcholů tak hran) tvoří podgraf. Podgraf, který je homomorfním obrazem cesty nazýváme také cestou. Je zřejmé, každá taková cesta o n > 2 vrcholech v grafu vzniká právě dvěma způsoby jako ho-momorfní obraz Pn, které se liší v počátečním a koncovém uzlu. Naopak, jestliže obraz sledu obsahuje k uzlů, můžeme obecně pro n > k najít nepřeberně způsobů, jak takový obraz obdržet.
Kružnice v grafu G je injektivním homomorfním obrazem grafu C„ v G. Všimněte si, že sama kružnice C„ je také homomorfním obrazem cesty Pn, kdy první a poslední bod cesty zobrazíme do téhož vrcholu a zvolíme orientaci cesty.
Najděte si v předchozích obrázcích cesty nebo kružnice obsažené ve větších grafech.
„prohledávání do hloubky", bude-li počátečním vrcholem vrchol 3 a hrany ze zpracovávaného vrcholu budeme procházet postupně podle velikosti druhého koncového vrcholu hrany (od nejmenšího). O
11.20. Označme vrcholy v grafu K§ postupně čísly 1, 2,... 6. Napište posloupnost hran grafu K6 tak, jak je bude procházet algoritmus „prohledávání do šířky", bude-li počátečním vrcholem vrchol 3 a hrany ze zpracovávaného vrcholu budeme procházet postupně podle velikosti druhého koncového vrcholu hrany (od nejmenšího). O
11.21. Uvažme následující postup pro určování minimální cesty mezi dvěma vrcholy v ohodnoceném neorientovaném grafu: nejprve nalezneme minimální kostru grafu, za minimální cestu pak prohlásíme jedinou cestu spojující dva dané vrcholy v minimální kostře. Dokažte, že je tento postup správný, nebo u vedle protipříklad.
Řešení. Postup není správný. Stačí uvážit například kružnici s hranami ohodnocenými až na jednu jedničkami, zbývající hrana ohodnocená dvojkou. □
11.22. Máme dánu následující tabulku vzdáleností světových metropolí: Londýna, Mexico City, New Yorku, Paříže, Pekingu a Tokia:
/ L MC NY P Pe T \
L 5558 3469 214 5074 5959
MC 2090 5725 7753 7035
NY 3636 6844 6757
P 5120 6053
1307y
Jaká je nejmenší délka kabelu, kterým je možné propojit tato města? (předpokládáme, že délka kabelu potřebného k propojení daných dvou měst je právě vzdálenost v tabulce).
Řešení. Aplikací libovolného algoritmu na hledání minimální kostry zjistíme, že hledaná délka je 12154. (v kostře jsou hrany LPe, LP, LNY, PeT, MCNY). □
11.5. Kolik je vlastně neizomorfnich grafů? Odpovědět přesně je děsně těžké. Odhadnout, že je neizomorfních grafů moc, je poměrně snadné:
Všech možných grafů na n vrcholech je tolik, kolik je všech podmnožin v množině všech hran. Všech podmnožin o mohutnosti N je 2N. Isomorfních grafů nemůže být víc, než kolik je bijekcí na n vrcholech. Těch je n!. Neizomorfních grafů tedy nemůže být méně než
k(n) =
2© ~n\~
D. Toky v sítích
11.23. Řezem v síti (V, E, z, s, w) můžeme také rozumět množinu hranC c S takovou, že v síti (V, E\C, z, s, w) neexistuje žádná cesta ze zdroje z do stoku (cíle, spotřebiče) s, ale pokud z C odebereme libovolnou hranu e, tak už nová množina tuto vlastnost mít nebude, tedy v (V, E \ C U e, z, s, w) existuje cesta ze z do s. Určete všechny tyto řezy (a jejich hodnoty) v následující síti:
671
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
Jestliže si tuto funkci zlogaritmujeme při základu 2, dostaneme (s využitím zjevného vztahu n! < n")
log2£(n)
n1 ( 1
log2«! > — I 1 - -2 V n
2 log2 n
Pro n -> oo tedy zjevně dostáváme
1 ,
log2£(n) = -n
0(n log2 n)
viz terminologii pro odhady z 8.27. To znamená, že počet neizo-morfních grafů na n uzlech roste asymptoticky stejně rychle jako množství všech možných grafů, tj. číslo 2^). Můžeme to nepřesně formulovat tak, že velká většina všech možných grafů bude po dvou neizomorfní.
11.6. Příklad.
11.6.1. Určete, kolik existuje homomorfismů grafu
a) z Pi do Ks,
b) z K3 do K5
Řešení.
a)
b)
4 = 80. 3 =60.
Jediné omezení je, že se uzly mezi kterými vede hrana nesmí zobrazit na tentýž uzel. □
11.7. Stupně uzlů a skóre grafu. Izomorfní grafy se od sebe liší pouze přejmenováním vrcholů. Proto musí mít stejné všechny číselné charakteristiky, které se přešíslováním vrcholů nemění. Jednoduché údaje tohoto typu můžeme dostat sledováním počtů hran vycházejících z jednotlivých vrcholů.
Pro vrchol v e V v grafu G — (V, E) říkáme, že jeho stupeň je k, jestliže v E existuje k hran, jejichž hraničním vrcholem v je. Píšeme v takovém případě
deg v = k.
Skóre grafu G s vrcholy V — (vi, ..., v„) je posloupnost
(degui, degj;2, . ..,degi;„)
Je zřejmé, že pro izomorfní grafy se jejich skóre může lišit pouze permutací hodnot. Pokud tedy porovnáme skóre grafů setříděné podle velikosti hodnot, pak různá skóre zaručují neizomorfnost grafu. Naopak ale snadno najdeme příklad grafů se stejným skóre, které izomorfní být nemohou, např. G — C3 U C3 má skóre (2, 2, 2, 2, 2, 2), stejně jako C$. Zjevně ale izomorfní nejsou, protože v C(, existuje cesta délky 5, která v druhém grafu být nemůže.
Zajímají nás samozřejmě také kritéria, jaká skóre mohou vůbec grafy mít. Protože každá hrana vychází ze dvou vrcholů, musí být v celkovém součtu skóre započtena každá hrana dvakrát. Proto platí
(11.1)
£degi; = 2|E|.
Zejména tedy musí být součet všech hodnot skóre sudý.
Následující věta je naší první úvahou o operacích nad grafy. Protože je důlaz konstruktivní, jde vlastně o návod, jak pro dané skóre buď zjistit
Řešení. Označíme-li hrany dle obrázku
pak jsou řezy následující: {f,i},{f,h,j,a},{f,j,c,a,d,e},{f,j,c,a,d,f}, {b,j,c},{b,j,h},{b,i}, jejich hodnoty jsou pak 12, 9, 20, 18, 15, 10, 15.
□
11.24. Najděte maximální tok v síti z předchozího příkladu. O
Řešení. Z teorie a předchozího příkladu víme, že hodnota maximálního řezu je 9. Tento tok / není zadán jednoznačně. Můžeme volit například f (a) = 2, f(b) = 4,f(c) = l,f(h) = l,f(j) = 4, /(/) = 2, /(/) = 7, f (v) = 0 pro všechny ostatní hrany i; daného grafu. □
11.25. Metodou hledání maximálního toku v síti (kterou získáte z daného bipartitního grafu přidáním jistých dvou vrcholů a orientací hran, jak jistě víte) nalezněte maximální párování následujícího bipartitního grafu:
Pro maximální tok určující Vámi nalezené maximální párování dále určete jemu odpovídající minimální řez v síti.
Řešení. Z daného bipartitního grafu vyrobíme síť přidáním zdroje Z d a stoku St, orientovaných hran (Zd, A),..., (Zd, G),
672
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
Věta (Algoritmus na sestrojení grafu s daným skóre). Pro libovolná přirozená čísla 0 < d\ < • • • < dn existuje graf G na n vrcholech s těmito hodnotami skóre tehdy a jen tehdy, když existuje graf se skóre
(di, d*2, ..., dn-dn — 1, dn-dn+\ na n — 1 vrcholech.
1,
, dn.
Důkaz. Na jednu stranu je implikace jednoduchá: Pokud existuje graf G' o n — 1 vrcholech se zadaným skóre, pak můžeme přidat ke grafu G' nový vrchol v„ a spojit jej hranou s posledními d„ uzly grafu G'. Tím dostaneme požadovaný graf G s předepsaným skóre.
Naopak je to o něco těžší. Postup nám zároveň ukáže, jak málo skóre určuje graf, z něhož vzniklo. Ukážeme, že při pevně zadaném skóre (d\,..., d„) s 0 < d\ < ■■ ■ < dn vždy existuje graf, jehož uzel v„ je spojen hranou právě s posledními d„ uzly v„-dn,...,
Vn-l-
Idea je jednoduchá — pokud některý z posledních d„ uzlů vk není hranou spojen s v„, musí být v„ spojen s některým z vrcholů dřívějších. Pak bychom měli umět prohodit koncové vrcholy dvou hran tak, aby v„ a v j spojeny byly a skóre se nezměnilo. Technicky to lze provést takto: Uvažme všechny grafy G s daným skóre a označme si pro každý takový graf číslo v(G), které je nej větší index vrcholu, který není spojen hranou s v„. Nechť G je nyní pevně zvolený graf s v(G) nejmenším možným. Pak buďje v(G) — n—dn — \ a tedy jsme získali požadovaný graf neboje v(G) >n — d„.
V posledním případě ale musí být v„ spojen hranou s některým ví, i < v(G). Protože je deg vv(g) > deg vt, nutně existuje také hrana spojující vv(Q) s v i pro £ < i. Nyní záměnou hran \vi, vv(G)} s {v£, v i) a {vt, v„} s {vv(G), v„} dostáváme graf G' s týmž skóre, ale menším v(G'), což je spor s naší volbou. (Namalujte si obrázek!)
Nutně tedy platí první z možností a důkaz je hotov. □
Všimněme si, že skutečně věta dává přesný postup, jak zkonstruovat graf se zadaným skóre. Pokud by takový graf neexistoval, algoritmus to po cestě pozná. Postup je takový, že od zadaného vzestupně uspořádaného skóre postupně odprava od hodnot odečítáme tolikrát jedničku, kolik je největší hodnota d„. Uspořádáme znovu výsledné skóre postupujeme stejně, dokud buď neumíme přímo graf se zadaným skóre napsat nebo naopak nevidíme, že takový neexistuje. Jestliže graf v některém z kroků sestrojíme, zpětným postupem přidáváme vždy jeden nový uzel a hrany podle toho, jak jsme odečítali jedničky. Zkuste si několik jednoduchých příkladů sami. Důležité upozornění — lgoritmus sestrojuje pouze jeden z mnoha grafů, které mohou k danému skóre existovat!
U orientovaných grafů rozlišujeme vstupní stupeň deg+ v vrcholu v a výstupní stupeň deg_ v. Říkáme, že orientovaný graf je vyvážený, když pro všechny uzly platí deg_ v — deg+ v.
11.8. Algoritmy a reprezentace grafů. Jak j sme již naznačovali, grafy jsou jazykem, ve kterém často formulujeme algoritmy.
Samotný pojem (grafového) algoritmu můžeme (pro naše potřeby) formalizovat jako postup, kdy v nějakém orientovaném grafu přecházíme z uzlu do uzlu podél orientovaných hran a přitom zpracováváme informace, které jsou určeny a ovlivněny výsledkem předchozích operací, uzlem, ve kterém se zrovna nacházíme, a hranou, kterou jsme do uzlu vstoupili. Při zpracování informace
(T, St), ..., (Z, St), stávající hrany orientujeme „abecedně" od nižšího písmena k vyššímu, všem hranám pak přiřadíme kapacitu 1. Ford-Fulkersonovým algoritmem pak snadno nalezneme některý maximální tok a jemu odpovídající max. párování. Jeden z možných maximálních toků je vyznačen na následujícím obrázku (červené hrany znázorňují tok o velikosti 1 danou hranou zleva do pravá):
□
11.26. Určete maximální tok a jemu odpovídající minimální řez v následujícím ohodnoceném orientovaném grafu:
a 7 b
O
673
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
se zároveň rozhodujeme, kterými výstupními hranami budeme pokračovat a v jakém pořadí. Pokud je graf neorientovaný, můžeme všechny hrany považovat za dvojice hran orientované opačnými směry.
Abychom mohli dobře takové algoritmy realizovat (většinou s pomocí počítače), je třeba umět uvažovaný graf efektivně zadat. Jednou z možností je tzv. hranový seznam (Edge List). Graf G — (V, E) si v něm reprezentujeme jako dva seznamy V a E propojené ukazately tak, že každý vrchol ukazuje na všechny z něj vycházející hrany a každá hrana ukazuje na svůj počáteční a koncový vrchol. Je vidět, že pamět potřebná na uchování grafu je v tomto případě 0(\V\ + \E\), protože na každou hranu ukazujeme právě dvakrát a na každý vrchol ukazujeme tolikrát, kolik je jeho stupeň a součet stupňuje také roven dvojnásobku počtu hran. Až na konstantní násobek jde tedy stále o optimální způsob uchovávání grafu v paměti.
Zcela jiný způsob je zadání tzv. matice sousednosti grafu. Uvažme (neorientovaný) graf G — (V, E), zvolme uspořádání jeho vrcholů V — (vi,..., vn) a definujme matici A q — (a^) nad Z2 (tj. zaplněnou jen nulami a jedničkami) takto:
11 jestliže je hrana eý — {vt, Vj] v E 0 jestliže není hrana etj — {ví,vj} v E
Popřemýšlejte samostatně, jak vypadají matice grafů z příkladů na začátku této kapitoly.
Při nejjednodušším způsobu uchovávání matic v poli je zadání grafu pomocí matice sousednosti velice neefektivní metoda. Potřebuje totiž vždy 0(n2) místa v paměti. Pokud je ale v grafu málo hran, dostáváme tzv. řídkou matici se skoro všemi prvky nulovými. Existují ovšem postupy, jak tyto řídké matice uchovávat v paměti efektivněji.
Promyslete si podrobně, jak se v obou způsobech zadání grafu zpracují základní operace nad grafem, kterými rozumíme:
• odebrání hrany
• přidání hrany
• přidání vrcholu
• odebrání vrcholu
• dělení hrany nově přidaným vrcholem
Jako jednoduchou aplikaci maticového počtu si uvedeme následující tvrzení:
11.9. Věta. Nechť G — (V, E) je graf s uspořádanými vrcholy V — (v\,..., v„) a maticí sousednosti Aq. Označme AkG — (af^)
prvky k-té mocniny matice Aq délky k mezi vrcholy v i a Vj.
(aij). Pak a^ je počet sledů
Důkaz. Tvrzení je pouze jiným vyjádřením definice matice sousednosti pro případ k — 1 a celý důkaz povedeme indukcí přes délku k. Předpokládejme tedy, že věta platí pro nějaké k a zkoumejme, kolik je sledů délky k+1 mezi vrcholy ví a v j pro nějaké pevné indexy i a j. Jistě každý takový sled obdržíme pomocí jedné hrany z v, do nějakého uzlu vi a nějakého sledu délky k mezi vi a vj. Různé volby přitom dávají vždy různé výsledky. Proto, označíme-li a^) počet různých sledů délky kzv^do Vj, pak námi hledaný počet sledů délky k+1 bude
u ■ a
Sk) li ■
11.27. Určete maximální tok a jemu odpovídající minimální řez v následujícím ohodnoceném orientovaném grafu:
O
11.28.3. Určete maximální tok a jemu odpovídající minimální řez v následujícím ohodnoceném orientovaném grafu:
A 23 b
O
11.29. Určete maximální tok a jemu odpovídající minimální řez v následujícím ohodnoceném orientovaném grafu:
O
674
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
To je ale právě formulka pro násobení matice Aq s mocninou AkG. Dokázali jsme, že naše čísla a^+V) jsou prvky matice Ag+1. □
Důsledek. Jsou-li G — (V, E) a Aq jako v předchozívětě, pak lze všechny vrcholy G spojit cestou právě, kdyžmámatice (A+I„)"_1 samé nenulové členy (zde I„ označuje jednotkovou matici s n řádky a sloupci).
Důkaz. Díky distributivitě násobení matic a skutečnosti, že jednotková matice /„ komutuje s každou jinou maticí stejného rozměru, dostaneme roznásobením
(A + I,)""1 = A""1 + (" " A""2 + ... + ^ " ^ A + /„. Výsledná matice má za členy čísla (ve značení jako v minulé větě) aij +y í )aij +■■■+{ £ )aij +---+(n-l)aij+SiJ,
kde Si i — 1 pro všechny / a <5ý — 0 pro i ^ j.
Toto číslo evidentně zadává součet počtů sledů délek 0,..., n — 1 mezi vrcholy vt a v j vynásobených kladnými konstantami. Bude proto nenulové právě tehdy, jestliže mezi těmito vrcholy existuje nějaká cesta. □
11.10. Poznámka. Ještě si všimněme vlivu permutace našeho uspořádání uzlů V na matici sousednosti grafu. Není obtížné si uvědomit, že permutace uzlů grafu G má za následek jednu a tutéž permutaci řádků a i sloupců matice Aq. Každou takovou permutaci můžeme zadat právě jednou tzv. permutační maticí, tj. maticí z nul a jedniček, která má v každém řádku a každém sloupci právě jednu jedničku a jinak nuly. Je-li P taková parmutační matice, pak nová matice sousednosti izomorfního grafu G' bude
AG, = PAGPT,
kde PT značí transponovanou matici a tečkou označujeme násobení matic. Každou permutaci umíme napsat jako složení transpo-zic a proto příslušnou permutační matici dostaneme jako součin příslušných matic pro transpozice.
V případě permutačních matic je matice transponovaná zároveň maticí inverzní. Tyto úvahy lze dále rozvíjet a přemýšlet o souvislostech matic sousednosti a matic lineárních zobrazení mezi vektorovými prostory. Nebudeme zde zacházet do podrobností.
11.11. Prohledávám v grafu. Mnoho užitečných algoritmů j e založeno na postupném prohledávání všech všech vrcholů v grafu. Zpravidla máme zadaný počáteční vrchol nebo si jej na začátku procesu zvolíme. V průběhu procesu vyhledávání pak v každém okamžiku máme vrcholy
• již zpracované, tj. ty, které jsme již při běhu algoritmu procházeli a definitivně zpracovali;
• aktivní, tj. ty vrcholy, které jsou detekovány a připraveny pro zpracovávání;
• spící, tj. ty vrcholy, na které teprve dojde.
Zároveň si udržujeme přehled o již zpracovaných hranách. V každém okamžiku musí být množiny vrcholů a/nebo hran v těchto skupinách disjunktním rozdělením množin V a E vrcholů a hran grafu G a některý z aktivních vrcholů je aktuálně zpracováván. Sledujme nejprve princip obecně na příkladě prohledávání vrcholů. V dalších odstavcích pak budeme postup používat pro algoritmy řešící konkrétní úlohy.
675
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
Na počátku průběhu tedy máme jeden aktivní vrchol a všechny ostání vrcholy jsou spící. V prvním kroku projdeme všechny hrany vycházející z aktivního vrcholu a jejich příslušným koncovým vrcholům, které jsou spící, změníme statut na aktivní. V dalších krocích vždy u zpracovávaného vrcholu probíráme ty z něho vycházející hrany, které dosud nebyly probrány a jejich koncové vrcholy přidáváme mezi aktivní. Tento postup aplikujeme stejně u orientovaných i neorientovaných grafů, jen se drobně mění význam adjektiv koncový a počáteční u vrcholů.
V konkrétních úlohách se také můžeme omezovat na některé z hran, které vychází z aktuálního vrcholu. Na principu to ale nic podstatného nemění.
Pro realizaci algortimů je nutné se rozhodnout, v jakém pořadí zpracováváme aktivní vrcholy a v jakém pořadí zpracováváme hrany z nich vycházející. V zásadě přichází v úvahu dvě možnosti zpracovávání vrcholů:
(1) vrcholy vybíráme pro další zpracování ve stejném pořadí, jak se stávaly aktivními (fronta)
(2) dalším vrcholem vybraným pro zpracování je poslední zak-tivněný vrchol (zásobník).
V prvním případě hovoříme o prohledávání do šířky, ve druhém o prohledávání do hloubky.
Na první pohled je zřejmá role volby vhodných datových struktur pro uchovávání údajů o grafu. Hranový seznam umožňuje projít všechny hrany vycházející z právě zpracovávaného vrcholu v čase lineárně úměrném jejich počtu. Každou hranu přitom diskutujeme nejvýše dvakrát, protože má právě dva konce. Zjevně tedy platí:
Věta. Celkový čas realizace vyhledávání do šířky i do hloubky v čase 0((n + m) * K), kde n je počet vrcholů v grafu, m je počet hran v grafu a K je čas potřebný na zpracování jedné hrany, resp. jednoho vrcholu.
Následující obrázky slouží pro ilustraci prohledávání do šířky a do hloubky:
Je na nich zachyceno prvních osm kroků prohledávání do šířky Petersenova grafu na 10 vrcholech.
Zakroužkovaný vrchol je ten právě zpracovávaný, modré velké puntíky jsou již zpracované uzly, čárkované červené hrany jsou již zpracované a červené drobné uzly jsou ty aktivní (poznají se také podle toho, že do nich již vede některá zpracovaná hrana). Hrany zpracováváme v pořadí orientace proti hodinovým ručkám, přičemž za „první" bereme směr „kolmo dolů".
676
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
Totéž je dalších obrázcích postupem „do hloubky". Všimněte si, že první krok je stejný jako v předchozím případě.
11.12. Souvislé komponenty grafu. Každý graf G — (V, E) se přirozeně rozpadá na disjunktní podgrafy G; takové, že vrcholy v e Gi aw e G j jsou spojeny nějakou cestou právě, když i — j.
Tento postup si můžeme formalizovat takto: Nechť je G — (V, E) neorientovaný graf. Na množině vrcholů grafu G zavedeme relaci ~ tak, že v ~ w právě když existuje cesta z » do w. Promyslete si, že tato relace je dobře definovaná a že se jedná o ekvivalenci. Každá třída [v] této ekvivalence definuje indukovaný podgraf G [V] C G a disjunktní sjednocení těchto podgrafů je ve skutečnosti původní graf G. Skutečně, podle definice naší ekvivalence, žádná hrana původního grafu nemůže propojovat uzly z různých komponent. Podgrafům G[v] říkáme souvislé komponenty grafu G.
Je-li graf G orientovaný, pak postupujeme úplně stejně, pouze u definice relace výslovně požadujeme aby cesta existovala z uzlu v do uzlu w nebo naopak z uzlu w do uzlu v.
Jako skutečně jednoduchý příklad prohledávání v grafu si můžeme uvést algoritmus na vyhledání všech souvislých komponent v grafu. Jedinou informací, kterou musíme zpracovávat je, kterou komponentu aktuálně procházíme. Samotné prohledávání, tak jak jsme jej prezentovali, projde právě všechny vrcholy jedné komponenty. Kdykoliv při běhu algoritmu skončíme s prázdnou množinou aktivních vrcholů ke zpracování, máme nachystánu jednu celou komponentu na výstup. Stačí pak vzít jakýkoliv další dosud spící vrchol a pokračovat dále. Teprve až nebudou ani žádné spící vrcholy, ukončíme algoritmus. í
Definice. Řekneme, že graf G — (V, E) je
• souvislý, jestliže má právě jednu souvislou komponentu;
• vrcholově k-souvislý, jestliže má alespoň k + 1 vrcholů a bude souvislý po odebrání libovolné podmnožiny k — 1 vrcholů;
• hranově k-souvislý, jestliže bude souvislý po odebrání libovolné podmnožiny k—l hran.
Případ k — 1 v definici jen opakuje souvislost grafu G. Silnější souvislost grafu je žádoucí např. u síťových aplikací, kdy klient požaduje značnou redundanci poskytovaných služeb v případě výpadku některých linek (tj. hran) nebo uzlů (tj. vrcholů).
Obecně lze dokázat tvrzení tzv. Mengerovy věty, kterou teď nebudeme dokazovat:
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
Tvrzení. Pro každé dva vrcholy v awv grafu G — (V', E) je počet hranově různých cest z vdovu roven minimálnímu počtu hran, které je třeba odstranit, aby se v a w ocitly v různých komponentách vzniklého grafu.
Speciálním případem je 2-souvislý graf. To je takový souvislý graf o alespoň třech vrcholech, kdy vynecháním libovolného vrcholu nenarušíme jeho souvislost. Na tomto příkladu si odvodíme několik pěkných charakterizací:
Věta. Pro graf G — (V, E) s alespoň třemi vrcholy jsou následující podmínky ekvivalentní:
• G je 2-souvislý;
• každé dva vrcholy v awv grafu G leží na společné kružnici;
• graf G je možné vytvořit z trojúhelníku Kj, pomocí postupných dělení hran.
Důkaz. Na jednu stranu je implikace zřejmá: Jestliže každé dva vrcholy sdílejí kružnici, pak jsou mezi nimi vždy alespoň dvě různé cesty a tedy odebrání vrcholu nemůžeme pokazit souvislost.
Opačná implikace není o mnoho složitější. Budeme postupovat indukcí podle minimální délky cesty spojující vrcholy v a w. Pokud vrcholy sdílí hranu e, pak díky 2-souvislosti je i graf bez této hrany souvislý a je v něm proto cesta mezi v a w. Spolu s hranou e tato cesta vytváří kružnici. Předpokládejme, že umíme takovou sdílenou kružnici sestrojit pro všechny vrcholy spojitelné cestou délky nejvýše k a uvažujme vrcholy uawaje spojující nejkratší cestu (v — v$,e\,... ,vK — w) délky k + 1. Pak v\ a w umíme spojit cestou o délce nejvýše k a proto leží na společné kružnici. Označme si P\ a P2 příslušné dvě různé cesty mezi vi a w. Graf G \ {v\} je ale také souvislý, existuje tedy cesta Pz«do w, která neprochází vrcholem v\ a tato nutně musí někdy poprvé narazit na jednu z cest P\ a Pí. Předpokládejme, že se tak stane ve vrcholu z na cestě P\. Pak je cesta, která vznikne složení části cesty P z v do z, části cesty P\ ze z do w a opačnou cestou k P2 z w do v hledanou kružnicí (nakreslete si obrázek!). □
11.13. Metrika na grafech. V posledním důkazu jsme používali délku cest pro měření „vzdálenosti" vrcholů. Ukážeme, že takto skutečně lze matematicky vybudovat pojem vzdálenosti na grafu: Na každém (neorientovaném) grafu definujeme vzdálenost uzlů uaiuj ako číslo do (v, w), které j e rovno počtu hran v nejkratší možné cestě zv dow. Pokud cesta neexistuje, píšeme dc(v,w) — 00.
Budeme v dalším uvažovat pouze souvislé graf G. Pak pro takto zadanou funkci d& : V x V ^ N platí obvyklé tři vlastnosti vzdálenosti:
• do (v, w) > 0 a přitom do (v, w) — 0 právě, když v — w;
• vzdálenost je symetrická, tj dc(v, w) — dQ(w, v);
• platí trojúhelníková nerovnost, tj. pro každou trojici vrcholů v, w, z platí
dc(v, z) < dc(v, w) + dc(vj, z).
Říkáme, že d q je metrika na grafu G.
Kromě těchto standardních tří vlastností splňuje metrika na grafu evidentně ještě
• dá (v, w) má vždy nezáporné celočíslené hodnoty;
• je-li dc(v,w) > 1, pak existuje nějaký vrchol z různý odua w atakový, že dc(v, w) — dc(v, z) + dc(z, w).
678
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
Lze dokázat, že pro každou funkci úq s výše uvedenými pěti vlastnostmi na V x V pro konečnou množinu V lze nadefinovat hrany E tak, aby G — (V, E) byl graf s metrikou úq. Zkuste si ukázat jako cvičení!
11.14. Dijkstrův algoritmus pro hledání nejkratších cest. Dá
se tušit, že nejkratší cestu v grafu, která vychází z daného uzlu v a končí v jiném uzlu w budeme umět hledat pomocí prohledávání grafu do šířky. Při tomto typu prohledávání totiž postupně diskutujeme vrcholy, do kterých se umíme dostat z výchozího vrcholu po jediné hraně, poté projdeme všechny, které mají vzdálenost nejvýše 2 atd. Na této jednoduché úvaze je založen jeden z nejpoužívanějších grafových algoritmů - tzv. Dijkstrův algoritmus.
Tento algoritmus hledá nejkratší cesty v realističtější podobě, kdy jednotlivé hrany e jsou ohodnoceny „vzdálenostmi", tj. kladnými reálnými čísly w(e). Kromě aplikace na hledání vzdáleností v silničních nebo jiných sítích to mohou být také výnosy, toky v sítích atd. Vstupem algoritmu je graf G — (V, E) s ohodnocením hran a počáteční vrchol vq. Výstupem je ohodnocení vrcholů čísly dw (v), která udávají nejmenší možný součet ohodnocení hran podél cest z vrcholu vq do vrcholu v. Postup dobře funguje v orientovaných i neorientovaných grafech.
Pro konečný chod algoritmu a jeho výsledek je skutečně podstatné, že všechna naše ohodnocení jsou kladná. Zkuste si rozmyslet třeba cestu P3 se záporně ohodnocenou prostřední hranou. Při procházení sledu mezi krajními vrcholy bychom „vzdálenost" zmenšovali každým prodloužením sledu o průchod prostřední hranou tam a zpět.
Dijkstrův algoritmus vyžaduje jen drobnou modifikaci obecného prohledávání do šířky:
• U každého vrcholu v budeme po celý chod algoritmu udržovat číselnou hodnotu d(v), která bude horním odhadem skutečné vzdálenosti vrcholu v od vrcholu vq.
• Množina již zpracovaných vrcholů bude v každém okamžiku obsahovat ty vrcholy, u kterých již nejkratší cestu známe, tj. d(v) — dw(v).
• Do množiny aktivních (právě zpracovávaných) vrcholů W zařadíme vždy právě ty vrcholy y z množiny spících vrcholů Z, pro které je d(y) — min{dw(v)
pro všechny vrcholy grafu. Předpokládejme tedy, že tato nerovnost platí při vstupu do hlavního cyklu algoritmu a ověříme, že platí i po výstupu z cyklu. Skutečně, pokud v kroku 4 měníme d(ý), pak je to proto, že jsme našli vrchol v s vlastností
dw(y) < dw(v) + w({v, y}) < d(v) + w({v, y}) = d(y),
kde napravo již máme nově změněnou hodnotu.
Rovnost (11.2) bude proto jistě platit i v okamžiku ukončení algoritmu a zbývá nám ověřit, že na konci algoritmu bude platit i nerovnost opačná. Za tímto účelem si promysleme, co se vlastně děje v krocích 3 a 4 v algoritmu. Označme si 0 — do < ■■ ■ < dk všechny existující různé konečné vzdálenosti dv(v) vrcholů grafu G od počátečního vrcholu vq. Tím máme zároveň rozdělenu množinu vrcholů grafu G na disjunktní podmnožiny Ví vrcholů se vzdáleností právě di. Při prvním průchodu hlavním cyklem máme N — Vó — {vq}, číslo <5 bude právě d\ a množinu spících vrcholů změníme na V \ Vq. Předpokládejme, že by tomu takto bylo až do j-tého průchodu včetně, tj. při vstupu do cyklu by platilo N — V j,
S — d j a u/=0Vi — V \ N. Uvažme nějaký vrchol y e Vj+i, tj. dwy — dj+i < oo a existuje cesta (uo, e\,v\,... ,vi, ei+\, y) celkové délky dj+\. Pak ovšem jistě
(11.3) dw(vi) < dj+i - w({vi, y}) < dí+\
Podle našeho předpokladu tedy již dříve (v některém z předchozích průchodů hlavním cyklem) byl vrchol v a aktivní a tedy již v tom průchodu bylo jeho ohodnocení rovno dw (vi) — d(yt) — di pro některé / < j. Proto při stávajícím průchodem hlavním cyklem bude výsledkem nastavení
d(y) — dwvi + w({v£, y}) — dj+i
680
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
a toto v dalších průchodech již nikdy nebude měněno. V nerovnosti (11.2) tedy ve skutečnosti nastává po ukončení chodu algoritmu rovnost.
Naše analýza průchodu hlavním cyklem nám zároveň umožňuje odhadnout čas potřebný na chod algoritmu (tj. počet elementárních operací s grafem a dalšími objekty s ním spojenými). Je totiž vidět, že hlavním cyklem projdeme tolikrát, kolik v grafu existuje různých vzdáleností d[. Každý vrchol při jeho zpracování v kroku 3 budeme uvažovat právě jednou a budeme muset přitom umět setřídit dosud spící vrcholy. To dává odhad 0(n log n) na tuto část algoritmu, pokud budeme používat pro uchovávání grafu seznam hran a vrcholů obohacený o ohodnocení hran a spící vrcholy budeme uchovávat ve vhodné datové struktruře umožňující vyhledání množiny N aktivních vrcholů v čase <9(logn + |iV|). To lze dosáhnout datovou strukturou, které se říká halda. Každá hrana bude právě jednou zpracovávána v kroku 4 protože vrcholy jsou aktivní pouze při jednom průchodu cyklem. □
Všimněme si, že pro nerovnost (11.3), která byla podstatná pro analýzu algoritmu, je nutný předpoklad o nezáporných vahách všech hran.
V praktickém použití bývají přidávána různá heuristická vylepšení. Např. není nutné dopočítávat celý algoritmus, pokud nás zajímá pouze nejkratší cesta mezi dvěma vrcholy. V okamžiku, kdy totiž je vrchol vyřazován z aktivních víme, že jeho vzdálenost je již spočtena správně.
Také není nutné na začátku algoritmus iniciovat s nekonečnou hodnotou. Samozřejmě by to při programování ani nešlo, můžeme však postupovat ještě daleko lépe než jen přiřadit dostatečně velikou konstantu. Například při počítání nejkratší cesty po silniční síti můžeme jako iniciaci volit předem známe vzdušné vzdálenosti bodů. Pak totiž známe předem odhady vzdáleností á®, (v) vrcholů v avo takové, že pro všechny hrany e — {v, y] platí
\dl(v) - \cPw(y)\ M2 spojujícím vrcholy c(0) — v a c(l) = w.
Pokud navíc platí, že se jednotlivé dvojice hran protínají nejvýše v koncových vrcholech, pak hovoříme o rovinném grafu G.
Otázka, jestli daný graf připouští realizaci jako rovinný graf, vyvstává velice často v aplikacích. Jednoduchý příklad je následující:
Tři dodavatelé vody, elektřiny a plynu mají každý své jedno přípojné místo v blízkosti tří rodinných domků. Chtějí je všichni napojit tak, aby se jejich sítě nekřížily (třeba se jim nechce kopat příliš hluboko...). Je to možné zvládnout? Odpověď zní „není".
V tomto případě se to zdá být jasné. Jde o bipartitní úplný graf A"33, kde tři vrcholy představují přípojná místa, další tři pak domky. Hrany jsou linie sítí. Všechny hrany umíme zvládnout, jedna poslední ale už nejde, viz obrázek na kterém neumíme čárkovanou hranu nakreslit bez křížení:
Pro skutečný důkaz ovšem potřebujeme skutečné matematické nástroje. V tomto případě alespoň naznačíme:
Můžeme se opřít o docela pracně dokazatelný topologický výsledek, že každá spojitá uzavřená křivka v rovině, která sama sebe neprotíná (tj. „pokřivená kružnice"), rozděluje rovinu na dvě části. Jinými slovy, každá jiná spojitá křivka spojující jeden bod uvnitř takové křivky a jeden vně musí nutně naši křivku protínat. Protože
684
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
jsou v grafu ^33 jednotlivé vrcholy v každé z trojic vrcholů nespojených hranami stejné, až na volbu pořadí, můžeme naši modrou silnou kružnici považovat za obecný případ kružnice čtyřmi body a diskutovat umístění zbylých dvou vrcholů. Aby byl graf rovinný, musely by být oba buď uvnitř naší kružnice nebo vně. Obě možnosti jsou opět rovnocenné, nechť jsou tedy uvnitř. Nyní diskutujme jejich polohu vůči vhodné kružnici se dvěma modrými silnými a dvěma černými hranami (tj. přes tři modré a jeden černý vrchol) a vůči ní diskutujme pozici zbývajícího černého vrcholu. Dojdeme k nemožnosti umístit poslední hranu bez křížení.
Zcela obdobně lze ukázat, že úplný graf K5 také není rovinný. Obecně se dá dokázat tzv. Kuratowského věta:
Věta. Graf G je rovinný právě tehdy když žádný jeho podgrafnení izomorfní dělení grafu ^33 nebo grafu K5.
Jedna implikace této věty je zřejmá - dělením rovinného grafu vzniká vžy opět rovinný graf a jestliže podgraf nelze v rovině nakreslit bez křížení, totéž musí platit i pro celý graf G. Opačný směr důkazu je naopak velice složitý a nebudeme se jím zde zabývat.
Problematice rovinných grafů je věnováno ve výzkumu a aplikacích hodně pozornosti, my se zde omezíme pouze na vybrané ilustrace.
Zmiňme alespoň naokraj, že existují algoritmy, které testují ro-vinatost grafu na n vrcholech v čase O(n), což určitě nejde přímou aplikací Kuratowského věty.
11.20. Stěny v rovinných grafech. Uvažme (konečný) rovinný graf G, včetně jeho realizace v M2 a nechť S je množina všech bodů x e IR2, které nepatří žádné hraně, ani nejsou vrcholem. Množina M2 \ G se rozpadne na disjunktní souvislé podmnožiny Si, kterým říkáme stěny rovinného grafu G. Jedna stěna je výjimečná - ta jejíž doplněk obsahuje všechny vrcholy grafu. Budeme jí říkat neohraničená stěna So- Množinu všech stěn budeme označovat S — {So, Si, ■ ■ ■, Sk] a rovinný graf G — (V, E, S).
Jako příklad si můžme rozebrat stromy. Každý strom je zjevně rovinný graf, jak je vidět například z možnosti realizovat jej postupným přidáváním listů k jedinému vrcholu. Samozřejmě také můžeme použít Kuratowského větu - když není v G žádná kružnice, nemůže obsahovat jakékoliv dělení grafů ^33 nebo ^5. Protože strom G neobsahuje žádnou kružnici, dostáváme pouze jedinou stěnu So a to tu neohraničenou. Protože víme, jaký je poměr mezi počty vrcholů a hran pro všechny stromy, dostáváme vztah
|V|-|E| + |S|=2.
Vztah mezi počty hran, stěn a vrcholů lze odvodit pro všechny rovinné grafy. Jde o tzv Eulerův vztah. Všimněme si, že z něho zejména vyplývá, že počet stěn v rovinném grafu nezávisí na způsobu, jak jeho rovinnou realizaci vybereme:
Věta. Nechť G — (V, E, S) je souvislý rovinný graf Pak platí
\V\-\E\ + \S\=2.
Důkaz. Pokud G neobsahuje kružnici, tj. jde o strom, tvrzení jsme již dokázali v 11.18(5), protože každý strom má zjevně pouze jedinou stěnu So.
Předpokládejme dále, že hrana e v grafu G je obsažena v kružnici. Pak je i graf G'\e souvislý. Můžeme tedy postupovat indukcí přes počet hran. Graf s jedinou hranou vztah splňuje a jestliže jej splňuje i G', pak to znamená
|V|-|£| +1 + |5|-1 =2
685
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
protože s odebráním jedné hrany dojde nutně i k propojení právě dvou stěn grafu G do jedné v G'. □
11.21. Konvexní mnohostěny v prostoru. Rovinné grafy si můžeme dobře představit jako namalované na povrchu koule místo v rovině. Sféra vznikne z roviny tak, že přidáme jeden bod „v nekonečnu". Opět můžeme stejným způsobem hvořit o stěnách a pro takovýto graf pak jsou všechny jeho stěny rovnocenné (i stěna Sq je ohraničená).
Naopak, každý konvexní mnohostěn P c R3 si můžeme představit jako graf nakreslený na povrchu koule (můžeme si představit, že hrany a vrcholy daného mnohostěnu promítneme na dostatečně velkou sféru z libovolného bodu uvnitř P). Vypuštěním jednoho bodu uvnitř jedné ze stěn (ta stane neohraničenou stěnou So) pak obdržíme rovinný graf jako výše tak, že „proděravěnou sféru natáhneme do roviny".
Rovinné grafy, které vzniknou z konvesních mnohočlenů zjevně 2-souvislé, protože každé dva vrcholy v konvexním mnohoúhelníku leží na společné kružnici. Navíc v nich platí, že každá stěna kromě So je vnitřkem nějaké kružnice a So je vnějškem nějaké kružnice (při kreslení na sféře jsou všechny stěny vnitřek nějaké kružnice). Názorné se zdá i to, že ve skutečnosti budou grafy vznikající z konvexních mnohoúhelníků 3-souvislé.
Ve skutečnosti platí dosti náročná Steinitzova věta:
Věta. Libovolný vrcholově 3-souvislý rovinný graf G vzniká z konvexního mnohostěnu v R3.
11.22. Platónská tělesa. Jako ilustraci kombinatorické práce s grafy odvodíme klasifikaci tzv. pravidelných mnohostěnů, tj. mnohostěnů poskládaných ze stejných pravidelných mnohoúhelníků tak, že se jich v každém vrcholu dotýká stejný počet. Již v dobách antického myslitele Platóna se vědělo, že jich je pouze pět:
Přeložíme si požadavek pravidelnosti do vlastností příslušného grafu: chceme aby každý vrchol měl stejný stupeň d > 3 a zároveň aby na hranici každá stěny byl stejný počet k > 3 vrcholů. Označme n počet vrcholů, e počet hran a s počet stěn.
Máme k dispozici jednak vztah provazující stupně vrcholů s počtem hran:
dn — 2e
a podobně počítáme počet hran, které ohraničují jednotlivé stěny, a bereme v úvahu, že každé je hranicí dvou stěn, tj.
2e — ks.
Eulerův vztah pak říká
2e 2e 2 — n — e + s — —— e + —.
d k
686
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
Úpravou odtud dostáváme pro naše známé d a k vztah
1 1 _ 1 1 d k 2 e
Protože nejen d a k, ale také e a n musí být přirozená čísla (tj. zejména je ^ > 0), dostáváme z této rovnosti velice silné omezení možností. Dosadíme-li minimální možnou hodnotu d = 3, obdržíme drobnou úpravou nerovnost
Odtud vyplývá k,d e {3,4, 5} a dopočítáním ostatních hodnot pro jednotlivé možnosti těcho hodnot dostáváme následující výčet všech možností řešení:
d k n e s
3 3 4 6 4
3 4 8 12 6
4 3 6 12 8
3 5 20 30 12
5 3 12 30 20
Ve skutečnosti ale také všechny odpovídající pravidelné mnohostěny existují - již jsme je viděli na obrázcích výše. U prvních třech jistě nejsou pochybnosti, naznačíme pro ilustraci konstrukci dvanáctistěnu (malujte si přitom obrázek). Začneme s krychlí a na všech jejích stěnách budeme zaráz a stejným způsobem stavět „stany áčka". Horní vodorovné tyčky přitom nachystáme na úrovni ploch stěn krychle tak, aby byly pro sousední stěny vždy na sebe kolmé a jejich délku zvolíme tak, aby lichoběžníky bočních stěn stanu měly tři stejně dlouhé strany. Nyní budeme zdvihat zaráz stejně všechny stany při zachovávání poměrů tří stran lichoběžníku. Jistě nastane právě jednou okamžik, ve kerém budou sousední lichoběžníkové a trojúhelníkové stěny koplanární (tj. v jedné rovině). Tak vznikne pravidelný dvanáctistěn.
Zkuste si sestrojit dvacetistěn jako cvičení.
2. Aplikace kombinatorických postupů
I v této části budeme nejprve pokračovat v úvahách založených na grafových postupech.
11.23. Kořenové stromy, binární stromy a haldy. Stromy využíváme pro organizaci dat tak, abychom v datech uměli buď rychle vyhledávat nebo v nich udržovat pořádek, nejčastěji obojí.
Protože ve stromu není žádná kružnice, volba jednoho vrcholu vr zadává orientaci všech hran. Skutečně, do každého vrcholu vede z vr právě jedna cesta a orientaci hran bereme podél ní. Přitom není možné, že by pro různé cílové vrcholy probíhaly příslušné cesty jednu hranu v různých směrech - to by opět vedlo na kružnici.
Situace se tedy po výběru jednoho vrcholu začíná více podobat skutečnému stromu v přírodě - jeden jeho vrchol je výjimečný tím, že roste ze země. Stromy s jedním vybraným „počátečním" vrcholem nazýváme kořenové stromy, význačný vrchol vr je kořen stromu.
V kořenovém stromu je dobře definován pojem následník a předchůdce vrcholu takto: vrchol w je následník v a naopak v je předchůdce w právě tehdy, když existuje cesta z kořene stromu do w která prochází v a v ^ w. Přímý následník a přímý předchůdce vrcholu jsou pak následníci a předchůdci přímo spojení hranou. Často o nich mluvíme také jako o synech a otcích (patrně v narážce na genealogické stromy).
687
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
K vyhledávání se nejčastěji používají tzv. binární stromy, které jsou speciálním případem kořenového stromu, kdy každý otec má nejvýše dva následníky (někdy se ale pod stejným označením binární strom předpokládá, že všechny vrcholy kromě listů mají právě dva následníky). Pokud máme s vrcholy spojeny klíče v nějaké úplně uspořádané množině (např. reálná čísla), hledání vrcholu s daným klíčem je realizováno jako hledání cesty od kořene stromu a v každém vrcholu se podle velikosti rozhodujeme, do kterého ze synů budeme pokračovat (resp. zastavíme hledání, pokud jsme již ve hledaném vrcholu). Abychom mohli tuto cestu jednoznačně krok po kroku určovat, požadujeme aby jeden syn společně se všemi jeho následníky měli menší klíče než druhý syn a všichni jeho následníci.
Pro efektivní vyhledávání se snažíme o tzv. vyvážené binární stromy, ve kterých se délky cest z kořene do listů liší maximálně o jedničku. Nejdále od vyváženého stromu na n vrcholech je tedy cesta P„ (která formálně může být považována za binární strom), zatímco dokonale vyvážený strom, kde kromě listů má každý otec právě dva syny je možné sestrojit pouze pro hodnoty n — 2k — 1,
k — 1,2,____Ve vyvážených stromech dohledání vrcholu podle
klíče bude vždy vyžadovat pouze 0(log2 «) kroků. Hovoříme v této souvislosti také často o binárních vyhledávacích stromech. Jako cvičení si rozvažte, jak lze účinně vykonávat základní operace s grafy (přidávání a odebírání vrcholů se zadanými klíči, včetně vyvážení) nad binárními vyhledávacími stromy.
Mimořádně užitečným příkladem využití struktury binárních stromů je datová struktura halda. Jde opět o vyvážené binární stromy s vrcholy opatřenými klíči a požadujeme aby podél všech cest od kořene k listům ve stromu klíče klesaly (tzv. maximální halda) nebo naopak stoupaly (tzv. minimální halda). Díky tomuto uspořádání umíme v konstatním čase odebírat z haldy podmnožiny buď maximálních nebo minimálních prvků a skutečné náklady na takovou operaci spočívají v obnovení struktury haldy po odebrání kořene. Jako cvičení si ukažte, že je to možné zvládnout v logaritmickém čase.
Na obrázku nalevo je binární vyhledávací strom (který ale není vyvážený), napravo je příklad maximální haldy.
11.24. Izomorfismy stromů. Stromům, jejich různým variantám a použití je věnována obsáhlá literatura. My se zde už pouze na chvíli zamyshrne nad obecným problémem hledání izomorfismu grafů pro speciální třídu stromů. Budeme postupovat tak, že napřed zesílíme strukturu, kterou mají naše izomorfismy zachovávat a nakonec ukážeme, že postup je použitelný i pro úplně obecné stromy.
Pro přehled nad strukturou kořenových stromů je kromě vztahů otec-syn ještě užitečné mít syny uspořádány v pořadí (třeba v představě odleva doprava nebo podle postupného růstu atd.). Hovoříme o pěstěných stromech T — (V, E, vr, v), kde v je částečné uspořádání na hranách takové, že srovnatelné jsou vždy právě hrany směřující od jednoho otce k synům.
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
Morfismem kořenových stromů T = (V, E, vr) a T = (V, E, v'r) rozumíme takový morfismus grafů T', který převádí vr na ^. Obdobně pro izomorfismy. Pro pěstěné stromy navíc požadujeme aby zobrazení hran zachovávalo částečná uspořádání v a \J.
Pro pěstěné stromy T = (V, E, vr, v) zavedeme jejich (jak uvidíme) jednoznačný popis pomocí slov z nul a jedniček. Obrazně si můžeme představit, že strom kreslíme a každý přírůstek naznačíme dvěma tahy, které si označíme 0 (dolů) a 1 (nahoru). Začneme od listů, kterým takto všem přiřadíme slovo 01. Celý strom pak budeme popisovat zřetězováním částí slov tak, že máli otec v syny uspořádány jako posloupnost v\,. ..,vi, a jsou-li již jednotliví synové označeni slovy W\,.. .Wi, pak pro otce použijeme slovo
OW1...W1I.
Strom na levém obrázku výše tedy zapíšeme postupně takto (přidáváme postupně vrcholy podle vzdálenosti od kořene, syny máme uspořádány zleva doprava)
01, 01, 01 k> 01, 001011, 0011 0010010111, 000111 k> 000100101110001111.
Hovoříme o kódu pěstěného stromu. Ověřte si, že skutečně kreslením cest dolů a nahoru (třeba si můžeme představit že dolů malujeme levý obrubník cesty a nahoru pravý) získáme skutečně původní strom s jednou hranou směřující shora do kořene navíc.
Věta. Dva pěstěné stromy jsou izomorfní právě, když mají stejný kód
Důkaz. Z konstrukce je zřejmé, že izomorfní stromy budou mít stejný kód, zbývá tedy pouze dokázat, že různé kódy vedou na neizomorfní stromy.
Dokážeme to indukcí podle délky kódu (tj. počtu nul a jedniček). Ten je roven dvojnásobku počtu hran zvýšenému o jedničku, tj. dvojnásobku počtu vrcholů, jde tedy vlastně o indukci vzhledem k počtu vrcholů stromu T. Nejkratší možný kód odpovídá nejmenšímu stromu s jedním vrcholem. Předpokládejme, že věta platí pro stromy o nejvýše n vrcholech, tj. pro kódy o délce nejvýše k = 2n, a uvažme kód tvaru 0W1, kde W je slovo o délce 2n. Jistě je ve W jednoznačně určena nejmenší levá část W\, která obsahuje stejně nul a jedniček (při kreslení stromu to znamená první okamžik, kdy se vrátíme do kořenového vrcholu stromu odpovídajícího 0W1). Stejně najdeme W2 jako další úsek obsahující stejně nul a jedniček atd., až celé slovo W vyjádříme jako W = Wi W2 ■ ■ ■ Wi. Podle indukčního předpokladu odpovídají všem kódům W/ jednoznačně pěstěné stromy, až na izomorfismy, a pořadí jejich kořenů jakožto synů kořenu našeho stromu T je dáno jednoznačně pořadím v kódu. Nutně proto je i pěstěný strom T jednoznačně určený kódem 0 W1, až na izomorfismus. □
Nyní můžeme docela snadno využít klasifikaci pěstěných stromů pomocí kódů k popisu všech stromů. U kořenových stromů potřebujeme určit pořadí jejich synů jednoznačně až na izomorfismus. Na pořadí synů ovšem nezáleží právě tehdy, když jsou podgrafy určené jejich následníky izomorfní. Můžeme proto využít obdobu (v jistém smyslu rekurzivní) konstrukce kódu pro pěstěné stromy a postupovat obdobně s využitím lexikografického uspořádní synů podle jejich kódů. Tzn. že kód W\ > W2 jestliže buď ve Wi narazíme při čtení z leva dříve na jedničku než ve W2 neboje W2 počátečním úsekem slova W\. Kořenový strom budeme
689
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
tedy popisovat zřetězováním částí slov tak, že má-li otec v syny již označeny kódy W\,... Wi, pak pro otce použijeme slovo
OW1...W1I
kde pořadí W\,..., Wi je zvoleno tak aby W\ < W2 < ■ ■ ■ < Wi.
Pokud není určen kořen ve stromě, můžeme se jej pokusit určit tak, aby byl „přibližně uprostřed stromu". To lze realizovat tak, že všechny jednotlivé vrcholy stromu označíme hodnotou tzv. výstřednosti. Definujeme výstřednost exx(v) vrcholu v v grafu T jako největší možnou vzdálenost zwdo nějakého vrcholu w v T, kterou lze dosáhnout. Tento pojem má smysl pro všechny grafy, u stromu ale díky nepřítomnosti kružnic platí, že maximální hodnoty excentricity vždy dosahuje buď právě jeden vrchol nebo právě dva vrcholy. Skutečně, nejdelší možná cesta z kteréhokoliv vrcholu stromu nutně končí v některém z jeho listů. Pro strom na dvou vrcholech tvrzení platí a u stromu na n > 3 vrcholech odebráním listů dostaneme strom menší, u nějž se excentrity všech vrcholů, které zůstaly, zmenší právě o jedničku. Tvrzení tedy plyne indukcí podle počtu vrcholů stromu. Navíc je zřejmé, že dva vrcholy s maximální excentricitou musí být spojeny hranou.
Nyní tedy můžeme přiřadit jednoznačný kód, až na izomorfis-mus i každému stromu. Pokud existuje jediný vrchol s maximální excentricitou, použijeme jej jako kořene, v opačném případě postupujeme stejně pro dva stromy vzniklé z T odebráním hrany spojující vrcholy s maximální excentricitou a kód vznikne zřetězením kódů obou stromů v pořadí podle lexikografického uspořádání.
Důsledek. Dva stromy T a T' jsou izomorfní právě, když mají společný kód.
11.25. Kostra grafu. V praktických aplikacích často zadává graf všechny možnosti propojení mezi objekty, příkladem může být třeba silniční nebo vodovodní nebo elektrická síť. Pokud nám stačí zajistit propojitelnost každých dvou vrcholů při minimálním počtu hran, hledáme vlastně v grafu G podgraf T na všech vrcholech grafu G, který je stromem.
Definice. Libovolný strom T — (V, E') v grafu G — (V, E), E' c E se nazývá kostra grafu G.
Evidentně může kostra v grafu existovat pouze, pokud je graf G souvislý. Místo formálního důkazu, že platí i opak uvedeme přímo algoritmus, jak kostru grafu sestrojit.
Algoritmus 1. Postupovat můžeme například takto: Seřadíme zcela libovolně všechny hrany e\,..., em v E do pořadí a postupně budujeme množiny hran E\ tak, že v (/ + l)-vém kroku přidáme hranu e; k E\ jestliže tím nevznikne v grafu G; = (V, £; U {e;}) kružnice, a ponecháme £; beze změny v případě opačném. Algoritmus skončí pokud buď má již graf G i pro nějaké / právě n — 1 hran nebo je již i — m. Pokud zastavujeme z druhého důvodu, byl původní graf nesouvislý a kostra neexistuje.
Lemma. Výsledkem předchozího algoritmu je vždy les T. Jestliže algoritmus skončí s k < n — 1 hranami, má původní graf n — k komponent. Zejména je tedy T kostrou právě, když algoritmus skončí pro dosažení n — 1 hran.
Důkaz. Podle pravidla v algoritmu, výsledný podgraf T v G nikdy neobsahuje kružnice. Je tedy lesem. Jestliže je výsledný počet hran n — 1, jde o strom, viz Věta 11.18.
690
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
Zbývá pouze ukázat, že souvislé komponenty grafu T mají stejné množiny vrcholů jako souvislé komponenty původního grafu G. Každá cesta v ľ je i cestou v G, musí tedy všechny vrcholy ze jednoho stromu v T ležet všechny v jedné komponentě G. Pokud by ale existovala v G cesta z v do w takové, že její koncové vrcholy leží v různých stromech v T, pak na ní existuje poslední vrchol ví v komponentě určené » a v ní neleží. Příslušná hrana {ví, musela někdy při chodu algoritmu ale vytvářet kružnici, protože jinak by se bývala ocitla mezi hranami v T. Protože se během algoritmu hrany neodebírají, musí tedy zůstávat cesta mezi ví a vi+\ v T. To je ovšem spor s našimi předpoklady a proto v a w nemohou ležet v různých stromech v T. Počet komponent v T je dán pevným vztahem mezi počtem vrcholů a hran ve stromech. □
Poznámka. Jako vždy bychom se měli zabývat otázkou, jak složitý je uvedený algoritmus. Kružnice přidáním nové hrany vznikne tehdy a jen tehdy, jestli její koncové vrcholy leží ve stejné souvislé komponentě budovaného lesu T. Stačí nám proto průběžně udržovat znalost souvislých komponent.
K realizaci algoritmu proto potřebujeme (v abstraktní podobě) umět pro již zadané třídy ekvivalence na dané množině (v našem případě jsou to vrcholy) slučovat dvě tříd ekvivalence do jedné a nalézat pro daný prvek, do které třídy patří. Pro sjednocení jistě potřebujeme O(k) času, kde k je počet prvků slučovaných tříd a jistě můžeme použít ohraničení počtu k celkovým počtem vrcholů n. Můžeme si ale pamatovat spolu se třídami i počty jejich prvků a průběžně pro každý vrchol uchovávat informaci do které třídy patří. Sjednocení dvou tříd tedy představuje přeznačení jména u všech prvků jedné z nich. Jestliže při přeznačování příslušnosti vrcholů k třídám budeme vždy přeznačovat tu menší z nich, pak celkový počet operací potřebných v našem algoritmu bude 0(n log n+m). Dokažte si jako cvičení!
Algoritmus 2. Kostru můžeme ale hledat také jinak a rychleji: Budeme v grafu G — (V, E) s n vrcholy a m hranami postupně budovat strom T. Začneme v libovolně zvoleném vrcholu v a prázdnou množinou hran, tj. To — ({v}, 0). V ř-tém kroku hedáme mezi hranami, které dosud nejsou v 7/_i, mají v 7/_i jeden koncový vrchol, ale druhý koncový vrchol fo 7/_i nepatří. První takovou hranu přidáme i s druhým koncovým vrcholem a získáme tak ľ;. Algoritmus skončí, až taková hrana neexistuje.
Evidentně je výsledný graf T souvislý a podle počtu vrcholů a hran je to strom. Ukážeme, že vrcholy T splývají s vrcholy souvislé komponenty G. Předpokládejme proto, že do nějakého vrcholu w vede z v cesta. Pokud by w nebyl vrchol v T, pak zcela stejně jako v důkazu předchozího lematu na ní najdeme poslední vrchol ví, který ještě do T patří. Další hrana cesty by ale v okamžiku ukončení algoritimu připadal v úvahu pro přidání do T, což je spor.
Tento algoritmus tedy v čase 0(n +m) nalezne kostru souvislé komponenty zvoleného počátečního vrcholu v.
11.26. Počet koster úplného grafu. K určení počtu koster úplného grafu o n uzlech může sloužit pojem Prúferovy posloupnosti kostry grafu. Prúferovu posloupnost můžeme přiřadit kostře grafu Kn a to následujícím způsobem: označme vrcholy v grafu Kn postupně od 1 do n a odstraňujme postupně listy dané kostry (od nejmenšího) a s každým odstraněným Uštem zapišme do posloupnosti souseda právě odstraněného listu. Opakujeme tak dlouho, dokud v kostře nezbubou pouze dva vrcholy.
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
Získaná posloupnost má evidentně n — 2 členů, které mohou nabývat hodnot od 1 do n. Obráceně není těžké dokázat, že pro každou takovou posloupnost existuje právě jedna kostra grafu Kn, která se do této posloupnosti výše popsaným postupem zakóduje.
Celkem dostáváme, že existuje právě nn~2 různých koster grafu K„.
11.27. Minimální kostra. Protože je to obecnou vlastností stromů, každá kostra grafu G má stejný počet hran. Tak, jak jsme ale již dříve hledali nejkratší cesty v grafech s ohodnocenými hranami, budeme v případě koster jistě chtít umět najít kostry s minimálním součtem ohodnocení použitých hran.
Definice. Nechť G — (V, E, w) je souvislý graf s ohodnocenými hranami s nezápornými vahami w(e) pro všechny hrany. Jeho minimální kostra T je taková kostra grafu G, která má mezi všemi jeho kostrami minimální součet ohodnocení všech hran.
O praktičnosti takové úlohy můžete přemýšlet třeba v souvislosti s rozvodnými sítěmi elektřiny, plynu, vody apod.
Kupodivu je docela jednoduché minimální kostru najít za předpokladu, že jsou všechna ohodnocení w (e) hran v grafu G nezáporná. Následujícímu postupu se říká Kruskalův algoritmus:
• Setřídíme všech m hran v E tak, aby w(e\) < w(ei) < ■■■ < w(em).
• v tomto pořadí aplikujeme na hrany postup z Algoritmu 1 pro kostru v předchozím odstavci.
Jde o typický příklad takzvaného „hladoveckého přístupu", kdy se k maximalizaci zisku (nebo minimahzaci nákladů) snažíme dostat výběrem momentálně (snad) nejvýhodnějšflio kroku. Často tento přístup zklame, protože nizké náklady na začátku procesu mohou zavinit vysoké na jeho konci. V našem případě ale skutečně dostaneme vždy minimální kostru:
Věta. Kruskalův algoritmus správně řeší problém minimální kostry pro každý souvislý graf G s nezáporným ohodnocením hran. Algoritmus pracuje v čase 0(m log m), kde m je počet hran vG.
Důkaz. POZDĚJI ??? □
11.28. Další algoritmy pro minimální kostru. I druhý z našich algoritmů pro kostru grafu v předchozím odstavci vede na minimální kostru, když v každém okamžiku volíme ze všech možných hran e;- — {ví, vu+], vt e Ví, ví+i e V \ ví tu, která má minimální ohodnocení. Výsledný postup se zpravidla nazývá Primův algoritmus podle jeho práce z r. 1957, ve skutečnosti byl ale popsán českým matematikem Jarníkem již v roce 1930. Raději mu proto říkejme Jarníkův algoritmus. Jarník přitom reagoval na ještě dřívější algoritmus brněnského matematika O. Borůvky z r. 1928.
Věta. Jarníkův algoritmus najde minimální kostru pro každý souvislý graf s libovolným ohodnocením hran.
Důkaz. POZDĚJI ??? □
Poznámka. Borůvkův algoritmus je docela podobný, konstruuje ale postupně stále co nejvíce souvislých komponent zaráz. Začneme tedy s jednoprvkovými komponentami v grafu To — (V, 0) a pak postupně vždy každou komponentu propojíme nejkratší možnou hranou s komponentou jinou. Opět lze dokázat, že takto obdržíme minimální kostru. V pseudokódu by šel tento algoritmus zapsat následovně:
692
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
(1) Inicializace. Udělej graf S složený z vrcholů grafu G;
(2) Hlavní cyklus. Dokud má S více než jednu komponenta opakuj:
pro každý strom T v S najdi nejmenší hranu spojující T sG\T, tuto hranu přidej do E;
všechny hrany z E přidej do S;
11.29. Problém obchodního cestujícícho. Z naší krátké exkurze do grafových problémů a algoritmů by mohl vzniknout dojem, že jev zásadě možné nalézat hezké a jednoduché algoritmy řešící uvažované problémy. To bylo ale způsobeno tím, že jsme si dosud vybírali pouze problémy jednoduché. V drtivé většině případů je tomu naopak, teoretické výsledky pouze ukazují, že algoritmus fungující alespoň v polynomiálním čase neexistuje a používají se takové, které dávají výsledky rozumně dobré, nikoliv však optimální.
Jedním z nejsledovanějších takových kombinatorických problémů je úloha, kdy máme najít v grafu s ohodnocenými hranami minimální hamiltonovskou kružnici, tzn. kružnici s minimálním součtem vah použitých hran mezi všemi možnými hamiltonov-skými kružnicemi.
Praktické vyjádření ne vždy na první pohled prozradí, že jde právě o tento problém. Setkáváme se s ním např. při
• plánování dodávek zboží nebo služeb
• organizaci poštovní služby (rozvoz pošty, výběr pošty ze schránek)
• plánování údržby sítí (např. bankomatů)
• obsluha požadavků z fronty (např. při paralelních požadavcích na čtení z hard disku)
• plánování postupného měření jednotlivých částí celku (např. při studiu struktury krystalu proteinu pomocí rentgenu, kdy náklady jsou soustředěny zejména na posuvy a zaostření pro jednotlivá měření)
• plánování dělení materiálů (např. při kladení tapet jejich dělení na použité pásy tak, aby navazoval vzorek a došlo k co nejmenším ztrátám)
I v případě hledání minimální hamiltonovské kružnice můžeme uplatnit hladovecký (anglicky „greedy") přístup. Algoritmus začne v libovolném vrcholu vi, který se stane aktivním a všechny ostatní si označí za spící. Postupuje pak postupně v krocích tak, že vždy najde ten dosud neumístěný vrchol z spících, do kterého vede z aktivního vrcholu nejméně ohodnocená hrana, aktivní vrchol označí jako zpracovaný, tento nový vrchol se stane aktivním. Algoritmus skončí buď neúspěchem, když nenajde žádnou hranu z aktivního uzlu do spícího uzlu, ale hamiltonovská kružnice ještě nebyla nalezena, nebo využitím všech vrcholů. Pokud ve druhém přípědě existuje hrana z posledního přidaného uzlu v„ do vi, získáme hamiltonovskou kružnici.
Je zjevné, že tento algoritmus jen velice zřídka vyprodukuje skutečně minimální hamiltonovskou kružnici. Na úplném grafu zato vždy alespoň nějakou najde. Je dokázáno, že se dokonce polynomiálně rychlými algoritmy nelze libovolně přibližovat k optimálnímu řešení.
11.30. Toky v sítích. Další skupina aplikací jazyka teorie grafů se týká přesunu nějakého měřitelného materiálu v pevně zadané síti. Vrcholy v orientovaném grafu představují body, mezi kterými lze podél hran přenášet předem známá množství, která jsou zadána formou ohodnocení hran. Některé vybrané vrcholy představují zdroj sítě), jiné výstup ze sítě. Podle analogie potrubní sítě pro přenos
693
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
kapaliny říkáme výstupním vrcholům stok sítě). Síť je tedy pro nás orientovaný graf s ohodnocenými hranami a vybranými vrcholy, kterým říkáme zdroje a stoky.
Je zřejmé, že se můžeme bez újmy na obecnosti omezit na orientované grafy s jedním zdrojem a jedním stokem. V obecném případě totiž vždy můžeme přidat jeden stok a jeden zdroj navíc a spojit je vhodně orientovanými hranami s všemi zadanými zdroji a stoky tak, že ohodnocení přidaných hran bude zároveň zadávat maximální kapacity jednotlivých zdrojů a stoků. Situace je naznačena na obrázku, kde černými vrcholy nalevo jsou zobrazeny všechny zadané zdroje, zatímco černé vrcholy napravo jsou všechny zadané stoky. Nalevo je jeden přidaný (virtuální) zdroj jako bílý vrchol a napravo jeden stok. Označení hran není v obrázku uvedeno.
Definice. Síť je orientovaný graf G — (V, E) s vybraným jedním vrcholem z nazvaným zdroj a jiným vybraným vrcholem s nazvaným stok, spolu s nezáporným ohodnocením hran w : E -> R. Tokem v síti S — (V, E, z, s, w) rozumíme ohodnocení hran / : E -> R takové, že součet hodnot u vstupních hran u každého vrcholu v, kromě zdroje a stoku, je stejný jako součet u výstupních hran z téhož vrcholu, tj.
E f^ = E f^-
eeIN(v) eeOUT(v)
Velikost toku f je dána celkovou balancí hodnot u zdroje
Z definice je zřejmé, že velikost toku můžeme stejně dobře vypočíst jako hodnotu
1/1= E f^- E f^-
eeIN(s) eeOUT(v)
Na obrázku máme nakreslenu jednoduchou síť se zvýrazněným bílým zdrojem a černým stokem. Součtem maximálních kapacit hran vstupujících do stoku vidíme, že maximální možný tok v této síti je 5.
3
11.31. Problém maximálního toku v síti. Naší úlohou bude pro zadanou síť na grafu G určit maximální možný tok. Na konci minulého odstavce jsme pohledem na obrázek zjistili, že maximální tok v této síti nemůže přesáhnout číslo 5. Podstatné na naší úvaze bylo, že jsme sečetli hodnoty maximálních kapacit u množiny hran, pres které musí jít každá cesta ze z do s. Zároveň umíme snadno najít tok, který toto maximum skutečné realizuje (protože je naše sít tak jednoduchá). Tuto rozvahu můžeme zformalizovat takto:
694
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
Definice. Řezem v síti S — (V, E, z, s, w) rozumíme takovou množinu hran C c E, že po jejím odebrání nebude v grafu G — (V, E \ C) žádná cesta z z do s. Číslo
|C| =
nazýváme velikost řezu C.
Evidentně platí, že nikdy nemůžeme najít větší tok, než je hodnota kteréhokoliv z řezů. N a dalším obrázku máme zobrazen tok sítí s hodnotou 5 a čárkovanými lomenými čarami jsou naznačeny řezy o hodnotách 12, 8 a 5.
2/3
Sestavíme funkční algoritmus, který pomocí postupných konstrukcí vhodných cest najde řez s minimální možnou hodnotou a zároveň najde tok, který tuto hodnotu realizuje. Tím dokážeme následující větu:
Věta. Maximální velikost toku v dané síti S — (V, E, z, s, w) je rovna minimální velikosti řezu v této síti.
Myšlenka algoritmu je vcelku prostá - prohledáváme cesty mezi uzly grafu a snažíme se je „nasytit" co největším tokem. Zavedeme si za tito účelem terminologii. O neorientované cestě v síti S — (V, E, z, s, w) z vrcholu v do vrcholu w řekneme, že je nenasycená, jestliže pro všechny hrany této cesty orientované ve směru zudoií platí f(e) < w(e) a f(e) > 0 pro hrany orientované opačně. Za rezervu kapacity hrany e pak označujeme číslo w(e) — f (e) pro případ hrany orientované ve směru zwdoiua číslo f(e) při orientaci opačné. Pro zvolenou cestu bereme za rezervu kapacity minimální rezervu kapacity z jejích hran.
Fordův-Fullkersonův algoritmus. Vstupem je síť S — (V, E, z, s, w) a výstupem maximální možný tok /:£—>• R.
• Iniciace: zadáme f(e) — 0 pro všechny hrany e e E a prohledáváním do šířky z vrcholu z najdeme množinu vrcholů U C V, do kterých existuje nenasycená cesta;.
• Hlavní cyklus: Dokud s e U opakujeme
- zvolíme nenasycenou cestu P ze zdroje z do s a zvětšíme tok / u všech hran této cesty o její minimální rezervu
- obnovíme U.
• na výstup dáme maximální tok / a minimální řez C tvořený všemi hranami vycházejícími z U a končícími v doplňku V \ U.
Důkaz správnosti algoritmu. Jak jsme viděli, velikost každého toku je nejvýše rovna hodnotě kteréhokoliv řezu. Stačí nám tedy ukázat, že v okamžiku zastavení algoritmu jsme vygenerovali řez i tok se stejnou hodnotou.
Algoritmus se zastaví při prvním případu, kdy neexistuje nenasycená cesta ze zdroje z do stoku s. To znamená, že U neobsahuje s a pro všechny hrany e z U do zbytku je f(e) — w (e), jinak bychom museli koncový vrchol e přidat k U.
Zároveň ze stejného důvodu všechny hrany e, které začínají v komplementu V \ U a končí v U musí mít tok f(e) — 0.
695
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
Pro velikost toku celé sítě jistě platí
1/1= E E
hrany z U do V \ U hrany z V \ U do U
Tento výraz je ovšem v okamžiku zastavení roven
E /w= E = ici,
hrany zU doV \ U hrany z í/ do V \ U
což jsme chtěli dokázat.
Zbývá ovšem ukázat, že algoritmus skutečně zastaví.
Všimněme si, že pro celočíslené hodnoty ohodnocení hran získáme také celočíselný tok.
2/3 2/3
Chod algoritmu je ilustrován na obrázku. Vlevo jsou vybaveny dvě nejkratší nenasycené cesty ze zdroje do stoku (horní má dvě hrany, spodní tři). Jsou vyznačeny červeně. Napravo je pak nasycena další cesta v pořadí a je vyznačena modře. Je nyní zjevné, že nemůže existovat další nenasycená cesta ze zdroje do stoku. Proto algoritmus v tomto okamžiku skončí.
11.32. Dodatečné podmínky na tok. Naše úloha připouští i další podmínky. Můžeme např. požadovat dodržení maximální kapacity průtoku přes jednotlivé vrcholy. Nebo můžeme chtít dodržet nejen maximální ale také minimální toky přes jednotlivé hrany či vrcholy.
Přidání kapacit vrcholů je jednoduché - prostě vrcholy zdvojíme a dvojčata oznčující vstup do vrcholu a výstup z vrcholu spojíme právě jednou hranou s příslušnou kapacitou.
Omezení minimálními průtoky lze zahrnout do iniciace našeho algoritmu. Je ovšem zapotřebí otestovat, jestli takový tok vůbec existuje.
V literatuře lze najít řadu dalších nuancí, nebudeme se jim zde věnovat.
11.33. Další aplikace. Hezkým využitím toků v sítí je řešení úlohy bipartitního párování. Úlohou je v bipartitním grafu najít maximální párování, tedy maximální podmnožinu hran takovou, aby žádné dvě hrany nesdílely vrchol.
Jde o abstraktní variantu docela obvyklé úlohy - třeba spárování kluků a holek k tanci v tanečních, kdybychom měli předem známé možnosti, ze kterých vybíráme.
Tento problém docela snadno převedeme na hledání maximálního toku. Přidáme si uměle navíc ke grafu zdroj, který propojíme hranami jdoucími do všech vrcholů v jedné skupině v bipartitním grafu, zatímco ze všech vrcholů ve druhé skupině vedeme hranu do přidanéhoho stoku. Všechny hrany opatříme maximální kapacitou 1 a hledáme maximální tok. Za páry pak bereme hrany s nenulovým tokem.
696
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
Jiným využitím toků je důkaz tzv. Mengerovy věty (uvedli jsmejijakotvzernív 11.12). Můžeme se na ně dívat takto: V orientovaném grafu ohodnotíme všechny hrany e maximální kapacitou 1 a totéž pro všechny vrcholy. Dále si zvolíme libovolnou dvojici vrcholů uati), které považujeme za zdroj a stok. Jestliže nás pak zajímá tok tímto grafem, dostaneme právě počet zcela různých cest z v do w (hrany i vrcholy jsou různé kromě začátku a konce). Každý řez přitom odděluje uamdo různých souvislých komponent zbylého grafu. Ze skutečnosti, že hodnota minimálního řezu je rovna hodnotě toku v síti nyní vyplývá požadované tvrzení.
11.34. Stromy her. Obrátíme teď naši pozornost k velice rozšířeným užitím stromových struktur při analýzách možných strategií nebo postupů. Zcela jistě se s nimi setkáme v teorii umělé inteligence a v části teorie her. Své místo ale mají také v ekonomii a mnoha dalších oblastech lidských činností.
Budeme v této souvislosti hovořit o hrách. V matematickém smyslu se teorie her zabývá modely, ve kterých jeden nebo více partnerů činí kroky podle předem známých pravidel a většinou také ve předem známém pořadí. Většinou se možné kroky nebo úkony ohodnocují nějakými výnosy nebo ztrátami pro daného partnera. Smyslem je pak nalezení strategie hráče, tj. algoritmického postupu, podle kterého může hráč maximalizovat výnos, případně minimalizovat ztrátu.
Budeme se zabývat tzv. extenzivním popisem her. To je takový popis, kdy máme k dispozici úplnou a konečnou analýzu všech možných stavů hry a výsledná analýza zadává skutečně přesnou rozvahu o výnosech či ztrátách za předpokladu nejlepšflio možného chování zúčastněných partnerů. Strom hry je kořenový strom, který má za uzly všechny možné stavy hry, a tyto uzly budou označeny podle toho, který z hráčů je zrovna na tahu. Hrany budou všechny možné tahy daného hráče v daném stavu. Takový úplný popis pomocí stromu můžeme konstruovat pro běžné hry jako jsou piškvorky, šachy, apod.
Jako jednoduchý příklad uvedhie jednoduchou variantu hry Nim. (Názem zavedl patrně Charles Bouton ve své analýze těchto her z roku 1901 - prý pochází z německého „Nimm!", což česky znamená „Ber!".)
Na stole leží na jedné hromádce k sirek, kde k > 1 je přirozené číslo, a hráči postupně odebírají každý jednu nebo dvě sirky. V normální variantě hry vyhraje ten, kdo jako poslední má co vzít. Ve variantě hry „na žebráka" naopak prohrává ten, kdo vzal všechny zbývající sirky. Strom takové hry, včetně všech potřebných informací můžeme setrojit následovně:
• Stavu s £ sirkami na stole a s prvním hráčem na tahu odpovídá podstrom s kořenem označeným Fi, stavu s týmž počtem sirek a druhým hráčem na tahu odpovídá podstrom s kořenem Si.
• Uzel F a má levého syna a pravého syn S 1-2, u uzlu Si jsou to obdobně synové F^_i a F^_2.
• Listy jsou vždy buď Fq nebo So (při normálním režimu hry, při hře na žebráka by to byly stavy Fi a Si, ve kterých příslušný hráč prohrál).
Každý průběh hrou začínající v kořenu Ft odpovídá právě jednomu listu výsledného stromu. Je tedy vidět, že celkový počet pik) možných her pro Ft je roven
pik) = pik-l) + pik-2)
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
pro k > 3 a snadno vidíme, že p(l) — 1 a p(2) — 2. Takovou diferenční rovnici jsme už řešili. Jejím řešením jsou tzv. Fibonacciova čísla a umíme pro ně explicitní formuli, viz. část o diferenčních rovnicích v první kapitole. Známe proto i formuli pro počet možných průběhů her. Počet možných stavů hry je přitom roven počtu všech uzlů ve stromu. Hra přitom vždy skončí výhrou buď prvního nebo druhého hráče. U podobných her může kromě toho hra končit také remízou.
11.35. Analýza hry. Připravená stromová struktura nám teď snadno umožní analyzovat hru tak, abchom mohli sestavit skutečně algoritmickou strategii pro každého hráče. Je k tomu jednoduchý rekurzivní postup pro ohodnocení kořene podstromu. Budeme označovat jako W uzly ve kterých (při optimální strategii obou) vítězí první hráč a Z, v případě opačném, případně ještě můžeme značit jako T (z anglického „win" a „loose" z pohledu prvého hráče, znak T odpovídá anglickému „tie" ro remízu). Postup je tento:
(1) Listy označíme buď W nebo L, případně T, podle pravidel hry (u normálního průběhu naší varianty Nim to tedy bude W pro So & L pro F0)
(2) Uzel F i označíme W, jestliže existuje syn, který je W. Pokud takový syn neexistuje, ale mezi syny existuje uzel s označením T, bude i označovaný uzel T. Ve zbývajícím případě, kdy jsou všichni synové L bude i označovaný uzel L.
(3) Uzel Si označíme L, jestliže existuje syn označený L. Pokud takový syn neexistuje, ale mezi syny existuje uzel s označením T, bude i označovaný uzel T. Ve zbývajícím případě, kdy jsou všichni synové W bude i označovaný uzel W.
Voláním této procedury na kořen stromu obdžíme ohodnocení všech uzlů a tím také i strategii pro každého z hráčů:
• První hráč se snaží v každém svém kroku přesunout do uzlu označeném W, pokud to ale nejde, hledá alespoň T
• Druhý hráč je se snaží v každém svém kroku dostat hru do uzlu označeného L, pokud to nejde, hledá alespoň T.
Hloubka rekurze je dána hloubkou stromu. Např. u našeho Nim s k sirkami je to právě k.
Získaná analýza ještě není příliš užitečná. Pro její užití v uvedené formě totiž potřebujeme mít k dispozici celý strom hry a to je obecně skutečně velice mnoho dat (u minipiškvorek na hřišti 3x3 má příslušný strom jednotlivé desítky tisíc uzlů). Zpravidla se v takovéto podobě používá analýza pomocí stromové struktury tehdy, když zkoumáme pouze malý úsek celého stromu pomocí vhodných heuristických metod a tento kousek si naopak dynamicky utváříme během hry. To je fascinující oblast moderní teorie umělé inteligence, my se jí zde ale nebudeme věnovat.
Pro naše potřeby úplné formální analýzy ale umíme najít kompaktnější vyjádření stromové struktury grafu. Pokud si nakreslíme náš strom pro hru Nim, okamžitě vidíme, že se nám mnohokráte opakují pořád ty stejné situace hry v různých Uštech, a to podle toho, jaká byla historie hry. Ve skutečnosti, jsou ale strategie určeny pouze počtem zbývajících sirek a tím, kdo je na tahu. Můžeme proto stejnou hru popsat pomocí grafu, který bude mít za uzly počty zývajících sirek a celá strategie bude zadána určením, jestli v dané situaci vyhrává ten, kdo je na tahu nebo naopak ten, kdo táhl předtím. K popisu možných tahů budeme používat orientované hrany.
698
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
Příklad pro naši hru Nim je na obrázku. Nalevo je úplný strom pro hru se třemi sirkami, napravo je orientovaný graf zobrazující hru se sedmi sirkami. Úplný strom pro hru se sedmi sirkami by měl již 21 listů a počet listů roste exponenciálně s počtem sirek!
Orientovaný acyklický graf má pro každý počet sirek právě jeden vrchol a ten zároveň nese označení, zda při jeho průchodu celkově vyhrá ten, kdo je zrovna na řadě (písmeno N od „next"), nebo ten druhý (písmeno P od slova „previous"). Celkově je v něm vždy jen k + 1 vrcholů pro hru s k sirkami. Zároveň v sobě graf uschovává kompletní strategii: pokud z uzlu, ve kterém se hráč nachází, vychází hrana končící v uzlu s označením P, hráč použije tento tah.
Naopak, každý acyklický orientovaný graf můžeme považovat za popis hry. Výchozími situacemi jsou v ní ty uzly, do kterých nevedou žádné hrany (jeden nebo více), hra končí v listech (opět jeden nebo více). Strategii hry obdržíme opět jednoduchou rekurzivně volanou procedurou:
• Listy označíme písmenem P (skutečně prohrává ten, kdo je na tahu a nachází se v listu).
• Uzel grafu označíme jako N, pokud z něj vede hrana do uzlu označeného jako P. V opačném případě označíme uzel jako P.
(Pro zjednodušení nyní uvádíme pouze případy her bez remíz.)
V našem speciálním případě hry Nim je tedy situace obzvláště jednoduchá. Z uvedené strategie vyplývá, že hráč, který je na tahu prohrává, pokud je počet sirek dělitelný třemi, a vyhrává ve zbylých dvou případech zbytků 1 a 2 po dělení třemi.
Hry, které umíme reprezentovat výše uvedeným způsobem pomocí acyklického orientovaného grafu nazýváme nestranné. Jde právě o takévé hry, ve kterých
• V každé herní situaci mají oba hráči stejné možnosti tahů.
• Hra má konečný celkový počet herních situací.
• Hra má tzv. nulový součet, tj. lze její výsledek formulovat pomocí výhry jednoho (a tím prohry druhého) hráče, resp. remízy.
Příkladem nestranné hry jsou např. piškvorky na předem známém rozměru použité čtverečkové sítě. Zde sice hráči používají různé symboly, podstatné aleje, že je mohou umístit do kteréhokoliv dosud neobsazeného pole. Naopak šachy nestrannou hrou v tomto smyslu nejsou, protože možné tahy jednotlivých hráčů jsou v každé situaci silně závislé od množství figurek, které zrovna mají k dispozici.
11.36. Součet her. Klasická hra Nim se hrává poněkud složitěji. Hráči mají před sebou tři hromádky sirek (nebo jiných objektů),
699
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
každou o daném počtu k. Ten kdo je na řadě může brát libovolný počet sirek, ale pouze z jedné hromádky. Vyhrává, při normální hře, ten, kdo bere naposled. (Při hře na žebráka takový hráč naopak prohrává.) Pokud bychom takto hráli s jednou hromádkou, je to jednoduché. První hráč shrábne vše a druhý prohrál. Se třemi to ovšem tak snadno nepůjde. Zároveň se nám patrně nechce věřit, že znalost analýzy možností pro jednu hromádku nebude pro takovouto kombinovanou hru užitečná.
Zavedeme si tzv. součet nestranných her. Věcně to bude tak, že situace ve hře kombinované ze dvou současných her budou uspořádané dvojice jednotlivých možných situací. Tahem pak rozumíme využití možného tahu v jedné z her (a druhá zůstane nezměněna). Jsou-li G\ — (Vi, E\) a G2 — (V2, E2) dva acyklické orientované grafy, pak jejich součtem rozumíme graf G — (V, E), kde
V = Vi x V2
E — {(i>iť2, wiv2); (i>i, wi) € £1} U {(v\v2, v\w2); (v2, w2) e E2).
V případě jedné hry jsme si vystačili s postupným označováním uzlů grafu od listů písmeny N a P podle toho, jestli je nebo není (pomocí orientovaných hran) „vidět" nějaké P. V součtu her se ovšem pohybujeme po jednotlivých hranách složitěji, budeme proto potřebovat jemnější nástroj, jak si vyjadřovat dosažitelnost uzlů značených jako P z dalších uzlů. Dobře k tomu poslouží tzv. Spragueova-Grundyova funkce g : V -> N, kterou definujeme na acyklickém orientovaném grafu G — (v, E) rekurzivně takto:
(1) Všechny listy v označíme g (v) — 0.
(2) Pro vrchol v e V definujeme
g (v) — minffl e N; neexistuje hrana (v, w) s g(w) — a}.
Při definici jsme použili funkci, které se říkává minimální vyloučená hodnota. Definujeme ji pro podmnožiny S přirozených čísel N — {0, 1,...} vztahem
mex S — min N \ S.
Naše funkce g (v) je právě mex S pro množinu S všech hodnot g(w), které podél hran vidím z vrcholu v.
11.37. Poznámka. Definice je korektní, neboť výše definovaný předpis zřejmě definuje jednoznačně funkci z pozic kombinatorické hry do přirozených čísel.
Na přirozených číslech definujeme ještě jednu operaci. Je to binární operace (a,b) i-> a@b, kterou dostaneme tak, že vyjádříme čísla a a b ve dvojkové soustavě a vzniklé vektory a a b ve vek-trovém prostoru (I*2)k nad Z2 sečteme (k je dostatečně velké). Výsledkem je opět vyjádření pro a © b ve dvojkové soustavě. Sčítání vektorů ve (I*2)k je známá operace X OR na jednotlivých bitech.
Věta. (1) Vrchol v e V v orientovaném acyklickém grafu
G — (V', E) je P pozice právě, když je hodnota Spragueovy-
Grundyho funkce g (v) = 0. (2) Pro orientované acyklické grafy G\ — {V\,E\), G2 —
(V2, E2) a G — (V, E) — G\ + G2 a jejich Spragueovy-
Grundyovy funkce g\, g2a g platí:
g{v\v2) — g\(y\) © g2{v2) Důkaz. První tvrzení věty je zřejmé.
Důkaz druhé části povedeme následovně: nechť (v\v2) je pozice hry Gi + G2anechťa e No, a < g\(y\) © g2(v2) je jinak
700
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
libovolné. Ukážeme, že existuje stav (xix2) hry G\ + G 2 tak, že (viV2, x\%2) e E a zároveň pro žádnou hranu (v\V2, y\yi) e E neplatí g 1 (y 1) © giiyi) = gi(vi) @ g2(v2).
i) Nechť tedy a < gi(vi) © 52(^2)- Uvažme číslo b := a © gi(vi) © g2(v2)- Nechť binární zápis tohoto čísla má k cifer. Potom na &-tém místě (od konce) v binárním rozvoji čísla gi(vi) © #2(^2) musí být cifra 1 (pokud mají a a gi(vi) © g2Ív2) různý počet ciferje tvrzení zřejmé; pokud majígi (v\) a a stejný počet cifer, tak právě jedno z čísel a agi(vi)®g2(v2) musí mít na &-tém místě od konce cifru 1 a nemůže to být číslo a, protože ve vyšších řádech si obě čísla musejí být rovna a číslo a je menší). Tedy právě jedno z čísel gi(vi) a #2(^2) má na k-tém místě cifru 1. Bez ujmy na obecnosti předpokládejme, že to je gi (v\), a uvažme číslo c := g\(v\) © b. Toto číslo je v binárním zápise nejvýše k — 1 ciferné (obě sčítaná čísla mají v k-tém řádu cifru 1), je tedy menší než gi (vi). Potom dle definice funkce vi existuje stav w\ hry G\ takový, že (i>i, w\) € Ei a gi(un) = c. Nyní však {v\V2, W1V2) e H a gi (wi) © g2(v2) = c © g2(v2) = gi (ui) © b © #2(^2) =
gl (l>l) © A © gl (l>l) © g2(í^2) © g2(í^2) = A-
ii) Nechť (viV2, yiy2), kde (ui, yi) e £1), je hrana v G anechť gi(yi) © g2(y2) = gi(^i) © gi(v2). Pak ovšem gi(yi) © g2(^2) = gi(vi) © g2(^2) a tedy gi(yi) = gi(ui), ale to je ve sporu s vlastnostmi Spragueovy-Grundyovy funkce gi hry Gi.
Ukázali jsme tedy, že funkce gi © g2) splňuje rekurzivní předpis pro Spragueovu-Grundyho funkci hry G1 ©G2, vzhledem k jednoznačnosti předpisu se tedy jedná o Spragueovu-Grundyho funkci této hry. □
Z věty okamžitě dostáváme srozumitelný a prakticky užitečný výsledek:
Důsledek. Vrchol V1V2 v součtu grafů je P-pozice právě, když gl(vi) = gl(V2).
Poznámka. V tomto textu nemůžeme jít do podrobností, obecně lze ale dokázat, že každý konečný acyklický orientovaný graf je izomorfní s konečným součtem vhodně zobecněných her Nim. Naší analýzou jednoduché hry a konstrukcí funkce g jsme tedy v podstatě (alespoň implicitně) zvládli analýzu všech nestranných her.
11.38. Vytvořující funkce. Docela často jsou v kombinatorických úvahách užitečné výsledky dosahované ve „spojitých metodách", tj. zejména klasické matematické analýze. Tomu můžeme rozumět i naopak - v podstatě byly všechny výsledky v analýze dosaženy vhodným přeložením problému na kombinatorickou úlohu (za příklad může sloužit třeba převedení problému integrace racionálních funkcí lomených na rozklad těchto funkcí na tzv. parciální zlomky). Není proto divu, že tyto již zvládnuté postupy můžeme dobře využívat přímo.
V závěru naší procházky po aplikacích kombinatorických postupů se proto podíváme alespoň na jednu oblast, kde se nám shodí znalosti ze spojitých metod. Začněme jednoduchým příkladem: Máme v peněžence 4 korunové mince, 5 dvoukorunových a 3 pětikorunové. Z automatu, který nevrací, chceme Colu za 22 Kč. Kolika způsoby to umíme, aniž bychom ztratili přeplatek? Hledáme zjevně čísla i, j ak taková, že / + j + k = 22 a zároveň
i e {0, 1, 2, 3, 4}, j e {0, 2, 4, 6, 8, 10}, k e {0, 5, 10, 15}.
701
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
Uvažme součin polynomů (třeba nad reálnými čísly)
(1 +X2 +x3 + x4)(x2 + x4 +x6 +x8 +x10)(x5 +x10 +x15).
Mělo by být zřejmé, že hledaný počet řešení je právě koeficient u x22 ve výsledném polynomu. Skutečně tak dostáváme 4 možnosti 3*5 + 3*2 + 1 * 1, 3*5 + 2*2 + 3* 1,2*5 + 5*2 + 2* 1 a 2*5+4*2 + 4* 1.
Tento prostinký příklad zasluhuje větší pozornost, než by se mohlo na první pohled zdát. Jednotlivé polynomy svými koeficienty vyjadřovaly posloupnost hodnot, kterých jsem uměli dosahovat: Jestliže budeme (pro jistotu, abychom nemuseli předem dělat odhady velikostí) pracovat s nekonečnými posloupnostmi, pak pomocí jednotlivých korun umíme dosáhnout hodnot 0,1,2,... s četnostmi
(pokračují samé nuly), u dvoukorun a pětikorun to budou poslou-nosti četností
(1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 0,...), (1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0,...).
Ke každé takové posloupnosti s konečně mnoha nulovými členy můžeme přiřadit polynom a hodou okolností řešení naší úlohy bylo možné odečíst ze součinu těchto polynomů. Takový postup můžeme používat obecně pro práci s posloupnostmi.
Definice. Vytvořující funkce pro nekonečnou posloupnost a — (ao, a\, a2, ■ ■ ■) je (formální) mocninná řada
Některým jednoduchým operacím s posloupnostmi odpovídají jednoduché operace nad mocninnými řadami:
• Sčítání {ai + b{) posloupností člen po členu odpovídá součet a(x) + b(x) příslušných vytvořujících funkcí.
• Vynásobení (a ■ a{) všech členů posloupnosti stejným skalárem a odpovídá vynásobení a ■ a(x) příslušné vytvořující funkce.
• Vynásobení vytvořující funkce a (x) monomem x1 odpovídá posunutí posloupnosti doprava o k míst a její doplnění nulami zleva.
• Pro posunutí posloupnosti doleva o k míst (tj. vynechání prvních k míst posloupnosti) nejprve od a (x) odečteme polynom bk(x) odpovídají posloupnosti (ao, ..., ak-\, 0, ...) a poté podělíme vytvořující funkci x1.
• Dosazením monomu f(x) za x vytvoříme specifické kombinace členů původní posloupnosti. Jednoduše je vyjádříme pro f(x) — ax, což odpovídá vynásobení &-tého členu posloupnosti skalárem ak. Dosazení f(x) — x" nám do posloupnosti mezi každé dva členy vloží n — 1 nul.
První dvě pravidla říkají, že přiřazení vytvořující funkce posloupnosti je homomorfismus vektorových prostorů nad zvoleným prostorem skalárů.
11.39. Příklady vytvořujících funkcí. Uvedeme několik jednoduchých příkladů vytvořujících funkcí. Řadu z nich jsme viděli při práci s mocninnými řadami ve třetí části šesté kapitoly. Snad si všichni vzpomenou na vytvořující funkci zadanou geometrickou řadou:
(1, 1, 1, 1, 1,0, 0,...)
oo
i=0
1
— 1 +x +X2 + . . .
a(x) =
1 -x
702
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
která tedy odpovídá konstantní posloupnosti (1, 1, 1,...). Obecně, pro každou posloupnost a; s členy velikosti \a„\ — 0(nk) s konstantním exponentem k, konverguje její vytvořující funkce na nějakém okolí nuly (viz 5.50 a 6.45). Můžeme s nnimi pak opravdu na konvergenčním intervalu zacházet jako s funkcemi, zejména je umíme sčítat, násobit, skládat, derivovat a integrovat. Několik jednoduchých příkladů - DODĚLAT ????
11.40. Diferenční rovnice s konstantními koeficienty. Hezkým a poučným příkladem na užití vytvořujících funkcí je úplná diskuse řešení lineárních diferenčních rovnic s konstantními koeficienty. Zabývali jsme se jimi již v třetí části první kapitoly, viz např. 1.12. Tam j sme ale přímo odvodili vzorec pro rovnice prvního řádu, odůvodnili jednoznačnost a existenci řešení, ale řešení samo jsme pak v podstatě „uhádli". Nyní můžeme řešení skutečně odvodit.
Zkusme nejprve dobře známý příklad Fibonaciovy posloupnosti zadané rekurencí
F„+2 — Fn + F„+i, Fo — 0, Fi — 1
a pišme F (x) pro vytvořující funkci této posloupnosti. Definiční rovnost můžeme vyjádřit pomocí F (x), když použijeme naše operace pro posuv členů poslounosti. Víme totiž, že xF(x) odpovídá posloupnosti (0, Fq, F\, F2,...) a x2 F (x) posloupnosti (0, 0, Fq, Fi, ...). Proto vytvořující funkce xF(x) + x2 F (x) — F (x) odpovídá posloupnosti
(-Fo,F0-FU0, 0, ...,0,...).
Obdrželi jsme tedy rovnici pro vytvořující funkci F (x):
(1 - x-x2)F(x) =x.
Abychom lépe viděli odpovídající posloupnost, můžeme ještě výsledný výraz upravit na součet jednodušších. Víme totiž, že lineární kombinace vytvořujících funkcí odpovídá stejným kombinacím posloupností. Racionální funkce lomené jsme se naučili rozkládat na tzv. parciální zlomky, viz 6.23. Tímto postupem vyjádříme
1 A B F (x) =--r =-+-
1 — X — XL X — X\ X — X2
a b 1 — X\x 1 — X2x kde A, B jsou vhodné (obecně) komplexní konstanty a x\, x2 jsou kořeny polynomu ve jmenovateli. Konstanty a,b,X\ aX2 získáme jednoduchou úpravou jednotlivých zlomků. Výsledkem je obecné řešení pro naši vytvořující funkci
oo
F (x) = J2(aXl + bX"2)x" «=0
a tím i obecně řešení naší rekurence. Srovnejte tento postup s výsledkem vil.
Pro obecné lineární diferenční rovnice řádu k je účinný stejný postup. Je-li
Fn+k — aoFn +----h ajfc-lF„+jfc_i,
pak vytvořující funkce pro výslednou posloupnost je
F(x) =--j^zi--
1 — aoxr 1 — • • • — a\-\x
Rozkladem na parciální zlomky dostaneme obecný výsledek, který jsme zmiňovali již v odstavci 11.
703
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
11.41. Pěstované binární stromy. Jako další příklad uvedeme výpočet počtu p„ neizomorfních pěstovaných binárních stromů na n vrcholech.
Každý takový pěstovaný strom je vyjádřen jako kořen, podstrom jeho levého syna a podstrom jeho pravého syna (které mohou být i prázdné). Výjimkou je pouze strom na prázdné množině uzlů, který nemá ani kořen. Pro nízké hodnoty n můžeme určit přímo (jediný prázdný strom, na jednom uzlu pouze kořen, na dvou uzlech je buď pravý nebo levý syn atd.):
PO = 1, Pi — 1, P2 — 2, P3 — 5,----
Označme si P(x) — po + p\x + pix1 + ... vytvořující funkci pro naši posloupnost pt. Protože pro každé rozdělení n — 1 uzlů mezi dva syny můžeme použít kterékoliv ze synů nezávisle na sobě, platí pro počet všech různých možností vztah
Pn= Pt ' P i
i+j—n — l
kde i, j > 0. To je ovšem koeficient u x"-1 ve funkci P(x)P(x). Odvodili jsme tedy vztah (konstatní jednička napravuje první člen po posuvu o jednu pozici doprava)
P(x) = 1 +x(P(x))2.
Odtud spočteme P(x) jako řešení kvadratické rovnice (x považujeme za parametr, zatímco P(x) hledanou neznámou), tj.
1 ± VI -4x
P(x) =----
2x
Protože naše hodnota P (x) se pro x —>• 0+ blíží k hodnotě po — 1, nemůže vyhovovat řešení se znaménkem +. Zkusíme tedy znaménko mínus. Abychom dostali řešení, potřebujeme vyjádřit jako mocnicnou řadu výraz VI — 4x. Dosazením této řady a dalšími úpravami dostáváme
■(^«(
2 \n + 1J n + l\ n
Jsou to tzv. Catalánova čísla, která se v kombinatorice často objevují.
704
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
705
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
706
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
707
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
708
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
709
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
710
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
711
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
712
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
713
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
714
KAPITOLA 11. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY
Řešení cvičení
11.8. 18.
11.9. 12.
11.10. 16.
11.11. 16.
11.14. Sečteme počty cest délky l,2,...,6:l+5 + 5- 4 + 5- 4- 3 + 5!+5! = 326.
11.17. (5, 1), (5, 2), (5, 3), (5,4), (5, 6), (1, 2), (1, 3),..., (4, 6).
11.18. (5, 1), (5, 2), (5, 3), (5,4), (5, 6), (6, 1),. ..(1,2)
11.19. (3, 1), (3, 2), (3,4), (3, 5), (3, 6), (6, 1), (6, 2), (6, 4), (6, 5), (5, 1), (5, 2), (5, 4), (4, 1), (4, 2), (2, 1).
11.20. (3, 1), (3, 2), (3,4), (3, 5), (3, 6), (1, 2), (1, 4), (1, 5), (1, 6), (2, 4), (2, 5),... (5, 6).
11.26. Min. řez je dán množinou {Z, A, E}. Hodnota je 32.
11.27. Min. řez odpovídá množině (B, D, S). Hodnota je 40.
11.28. Řez je dán množinou {F, S, D], hodnota je 29.
11.29. Min. řez. dán množinou {F, S], jeho hodnota je 39.
715