Matematika drsné a svižné Martin Panák, Jan Slovák a „autorský kolektív" Projekt netradiční základní učebnice matematiky pro studenty přírodních věd, informatiky, ekonomie apod., přibližující podstatnou část matematiky v rozsahu čtyř semestrálních přednášek. Text by měl být dokončen a vydán v roce 2013. Práce na učebnici jsou podpořeny projektem Univerzitní výuka matematiky v měnícím se světě (CZ. 1.07/2.2.00/15.0203) sociální fond V ČR EVROPSKÁ UNIE MINISTERSTVO ŠKOLSTVÍ, mládeže a tělovýchovy OP Vzdělávání pro konkurenceschopnost INVESTICE DO ROZVOJE VZDELÁVANÍ i ii Obsah Obsah Kapitola 1. Rozcvička 1. Čísla a funkce 2. Kombinatorické veličiny 3. Diferenční rovnice 4. Pravděpodobnost 5. Geometrie v rovině 6. Relace a zobrazení Kapitola 2. Elementární lineárni algebra 1. Vektory a matice 2. Determinanty 3. Vektorové prostory a lineárni zobrazení 4. Vlastnosti lineárních zobrazení Kapitola 3. Linární modely a maticový počet 1. Lineárni procesy 2. Diferenční rovnice 3. Iterované lineárni procesy 4. Více maticového počtu 5. Rozklady matic a pseudoinverze Kapitola 4. Analytická geometrie 1. Afmní a euklideovská geometrie 2. Geometrie kvadratických forem 3. Projektivní geometrie Kapitola 5. Zřízení ZOO 1. Interpolace polynomy 2. Reálná čísla a limitní procesy 3. Derivace 4. Mocninné řady Kapitola 6. Diferenciální a integrální počet 1. Derivování 2. Integrování 3. Nekonečné řady Kapitola 7. Spojité modely 1. Fourierovy řady 2. Metrické prostory 3. Integrální operátory 4. Diskrétní transformace 5 Kapitola 1. 5 5 A. Čísla a funkce 5 10 B. Kombinatorika 11 15 C. Diferenční rovnice 16 18 D. Pravděpodobnost 20 27 E. Geometrie v rovině 30 41 F. Zobrazení a relace 42 G. Doplňující příklady k celé kapitole 49 71 Kapitola 2. Elementární lineární algebra 71 83 A. Soustavy lineárních rovnic 71 93 B. Manipulace s maticemi 77 111 C. Determinanty 82 D. Soustavy lineárních rovnic podruhé 86 E. Vektorové prostory 92 F. Lineární závislost a nezávislost, báze 94 138 G. Lineární zobrazení 97 H. Vlastní čísla a vlastní vektory 105 I. Báze a skalární součiny 110 176 J. Doplňující příklady k celé kapitole 122 199 Kapitola 3. 131 A. Rekurentní rovnice 131 221 ^ B. Populační modely 139 C. Markovovy procesy 149 243 D. Unitární prostory 166 243 E. Rozklady matic 169 253 F. Doplňující příklady k celé kapitole 185 274 Kapitola 4. Analytická geometrie 199 A. Afmní geometrie 199 325 B. Eukleidovská geometrie 207 325 C. Geometrie kvadratických forem 223 343 D. Doplňující příklady k celé kapitole 240 362 Kapitola 5. Zřízení ZOO 243 387 A. Interpolace polynomy 243 387 B. Topologie komplexních čísel a jejich podmnožin 249 401 C. Limity 251 419 D. Derivace 267 427 E. LHospitalovo pravidlo 269 F. Extremální úlohy 276 G. Řady 290 H. Mocninné řady 304 I. Doplňující příklady k celé kapitole 307 Kapitola 6. 325 iii A. Derivace vyšších řádů 325 B. Integrování 344 C. Integrace racionálních lomených funkcí 353 D. Určité integrály 364 E. Nevlastní integrály 366 F. Délky, obsahy, povrchy, objemy 369 G. Stejnoměrná konvergence 373 H. Doplňující příklady k celé kapitole 377 Kapitola 7. Spojité modely 387 A. Ortogonální systémy funkcí 387 B. Fourierovy řady 388 C. Metrické prostory 405 D. Integrální operátory 413 iv Předmluva Příprava této učebnice byla motivována přednáškami pro informatické obory na Masarykově univerzitě, kde je celý program založen na precizním matematickém přístupu. Chtěli jsme proto rychle, ale zároveň pořádně, pokrýt zhruba tolik matematických metod, jako je obvyklé u větších kurzů v klasických technických oborech opřených o matematické metody. Zároveň jsme ale nechtěli rezignovat na úplný a matematicky korektní výklad. Chtěli jsme vedle sebe vyložit i obtížnější partie matematiky a spoustu elementárních i obtížnějších konkrétních příkladů, jak s uvedenými postupy ve skutečnosti pracovat. Nechtěli jsme přitom za čtenáře řešit, v jakém pořadí a kolik „teorie" či „praxe" pročítat. Z těchto podnětů vznikl dvousloupcový formát s oddělenými teoretickými úvahami a praktickými postupy, který kopíruje i skutečné rozdělení výkladu na přednáškách na „teoretické přednášky" a „demonstrovaná cvičení". Snažíme se tím vyjít vstříc jak čtenářům, kteří si napřed chtějí procvičit postupy při řešení úloh a teprve pak přemýšlet, proč a jak algoritmy fungují, tak těm druhým, kteří si napřed chtějí dělat jasno o tom proč a jak věci fungují a pak případně zkouší počítat příklady. Zároveň tím snad zbavujeme čtenáře stresu, že by měl přečíst úplně vše. Naopak, měl by mít radost z brouzdání textem a prožitku objevování vlastní cestičky. Text se přitom v obou svých částech snaží prezentovat standardní výklad matematiky s akcentem na smysl a obsah představovaných matematických metod. Řešené úlohy procvičují základní pojmy, ale zároveň se snažíme dávat co nej lepší příklady užití matematických modelů. Teoretický text je prezentován dosti kompaktním způsobem, mnoho prostoru je ponecháno pro dořešení podrobností čtenáři. Uváděné příklady se snaží pokrýt celou škálu složitosti, od banálních až po perličky ke skutečnému přemýšlení. Studenti navíc řešili a odevzdávali každý týden zadávané příklady. Čtenářům bychom rádi pomohli: • přesně formulovat definice základních pojmů a dokazovat jednoduchá matematická tvrzení, • vnímat obsah i přibližně formulovaných závislostí, vlastností a výhledů použití matematických nástrojů, • vstřebat návody na užívání matematických modelů a osvojit si jejich využití. K těmto ambiciózním cílům nelze dojít lehce a pro většinu lidí to znamená hledat si vlastní cestu s tápáním různými směry (s potřebným překonáváním odporu či nechutě). I proto je celý výklad strukturován tak, aby se pojmy a postupy vždy několikrát vracely s postupně rostoucí složitostí a šíří diskuse. Jsme si vědomi, že se tento postup může jevit jako chaotický. Domníváme se ale, že dává mnohem lepší šanci na pochopení u těch, kteří vytrvají. Vstup do matematiky je skoro pro každého obtížný — pokud už „víme", nechce se nám přemýšlet, pokud „nevíme", je to ještě horší. Jediný spolehlivý postup pro orientaci v matematice je hledat porozumnění v mnoha pokusech a to, pokud možno, při četbě v různých zdrojích. Určitě nepovažujeme tento text za dostatečný jediný zdroj pro každého. Doufáme, že může být dobrým začátkem a případně i dlouhodobým pomocníkem, zvláště pro ty, kdo se k jednotlivým částem budou znovu a znovu vracet. Pro ulehčení vícekolového přístupu ke čtení je text doprovázen emotivně laděnými ikonkami, které snad nejen oživí obvyklou strohou strukturu matematického textu, ale naznačí čtenáři, kde by složitější text měl být čten pozorněji, ale určitě ne přeskakován, případně kde by bylo možná lépe náročné pasáže přinejmenším napoprvé vůbec nečíst. 1 Volba jednotlivých ikonek samozřejmě odráží hlavně pocity autorů. Přesto by postupně mohly být dobrým vodítkem pro čtenáře. Sloupec zaměřený na výklad teorie (užší sloupec) a sloupec zaměřující se na příkadovou část jsou přitom značeny odlišnými sadami ikonek. Co se týče sloupce teorie používáme ikonky varující před pracností/složitostí/náročností, např. Další označují ne úplně pohodovou zdlouhavost práce a potřebu trpělivosti či nadhledu, jako jsou tyto A konečně máme také ikonky vyjadřující pohodu nebo radost ze hry, třeba následující Co se týče příkladového sloupce, tak používáme ikonky pro základní příklady, které by čtenář rozhodně měl být schopen zvládnout a pokračovat ve čtení až po jejich vyřešení, ikonky pro obtížnější příklady se zajímavým obratem, či praktickou aplikací, ikonka značí velmi obtížný příklad a konečně ikonka indikuje, že při řešení příkladu je vhodné použít výpočetní software. Snažili jsme se sloupce s příklady sepsat tak, aby byly čitelné prakticky víceméně samostatně. Bez ambicí pohrát si s hlubšími důvody, proč uváděné postupy fungují (nebo s prostým cílem „projít s písemkou"), by mělo skoro stačit probírat se jen příklady. Definice pojmů či popisy jejich vlastností používaných při řešení příkladů jsou v teoretickém sloupci zpravidla vyznačeny, aby o ně bylo možno snadno pohledem zavadit. Souvislost řešených příkladů s paralelně studovanou teorií je přitom spíše volná, snažili jsme ale ulehčit přeskakování „z teorie do praxe a zpět" co nejvíce. Obsahově je celá učebnice ovlivněna představou, že pro praktické využití jsou velmi podstatné metody tzv. diskrétní matematiky, zatímco tzv. spojité modely jsou matematicky dobře uchopitelná přiblížení veskrze diskrétního světa kolem nás. Počítat koneckonců stejně umíme vždy jen s konečně 2 mnoha racionálními čísly naráz. Bez spojité matematiky si lze ale těžko dobře představit koncepty jako konvergence procesu k limitnímu stavu nebo robustnost výpočtu. Bylo by bez ní také obtížné pracovat s odhady chyb při numerických procesech. Všechna témata a velmi podstatnou část textu jsme v létech 2005 - 2012 ověřovali při výuce studentů informatiky a později i matematiky na Masarykově univerzitě. Paralelně jsme přitom vytvořili také podklady pro praktické semináře matematického modelování a numerických metod. V nich se studenti věnují skutečnému využití výpočtových nástrojů a modelů. Závěrem stručně shrneme obsah celé učebnice. Samozřejmě předpokládáme, že si každý čtenář, případně přednášející, vybere témata a jejich pořadí. Pokusíme se proto zároveň vymezit bloky, se kterými lze takto nezávisle zacházet. Úvodní motivační kapitola se snaží ilustrovat několik přístupů k matematickému popisu problémů. Začínáme nejjednoduššími funkcemi (základní kombinatorické vzorce). Pak naznačujeme, jak pracovat se závislostmi zadanými pomocí okamžitých změn (jednoduché diferenční rovnice), užití kombinatoriky a množinové algebry diskutujeme prostřednictvím konečné klasické pravděpodobnosti. Předvádíme maticový počet pro jednoduché úlohy rovinné geometrie (práce s pojmem pozice a transformace) a závěrem vše trochu zformalizujeme {relace, uspořádní, ekvivalence). Nenechte se zde uvrhnout do chaotického zmatku rychlým střídáním témat — cílem je nashromáždit něco málo netriviálních námětů k přemýšlení a hledání jejich souvislostí i použití, ještě než zabředneme do úrovně problémů a teorií složitějších. Ke všem tématům této úvodní kapitoly se časem vrátíme. Další dvě kapitoly jsou věnovány základům počtu, který umožňuje práci s vícerozměrnými daty i grafikou. Jde o postupy tzv. lineární algebry, které jsou základem a konečným výpočetním nástrojem pro většinu matematických modelů. Nejprve probíráme jednoduché postupy pro práci s vektory a maticemi, třetí kapitola je pak věnována aplikacím maticového počtu v různých lineárních modelech (systémy lineárních rovnic, lineární procesy, lineární diferenční rovnice, Markovovy procesy, lineární regrese). Čtvrtá kapitola pak ilustruje použití maticového počtu v geometrických úlohách. Dozvíme se něco málo o afinní, euklidovské a projektivní geometrii. V tomto okamžiku přerušíme diskusi diskrétních modelů a přejdeme ke spojitým. Chceme co nejnázorněji ukázat, že základní ideje, jak s funkcemi pracovat, bývají jednoduché. Stručně řečeno, velmi jednoduché úvahy spojené s popisem okamžitých změn sledovaných veličin umožňují dělat závěry pro jejich celkové chování. Složitosti se pojí skoro výhradně se zvládnutím rozumně velké třídy funkcí, pro které mají naše postupy být použitelné. Začínáme proto kapitolou, kde diskutujeme jaké funkce potřebujeme pro nelineární modely. Po polynomech a splajnech postupně diskutujeme pojmy spojitosti, limity posloupností a funkcí a derivace funkcí, připomeneme všechny základní elementární funkce a závěrem se seznámíme s mocninnými řadami. Tím je připravena půda pro klasický diferenciální a integrální počet. Ten prezentujeme v kapitole šesté s důrazem na co nejpřímočařejší pochopení souvislostí limitních procesů, integračních procesů a aproximací. Sedmá kapitola se věnuje náznakům aplikací a snaží se co nejvíce připomínat analogie k postupům jednoduché lineární algebry. Místo lineárních zobrazení mezi konečně rozměrnými vektorovými prostory tak pracujeme s lineárními operacemi mezi vektorovými prostory funkcí, definovanými buď integrálními nebo diferenciálními operátory. Zatímco diskusi diferenciální rovnic necháváme na později, zde studujeme nejprve aproximace funkcí s pomocí vzdálenosti definované integrálem (tzv. Fourierovy řady). Pak se věnujeme souvislostem s některými integrálními operátory (např. konvoluce) a integrálními transformacemi (zejména Fourirerova transformace). Po cestě si neodpustíme ilustraci obecného principu, že spojité modely jsou zpravidla ideovým podkladem a zároveň dobrou aproximací pro modely diskrétní. Poslouží nám k tomu stručné nahlédnutí na problematiky tzv. waveletů a diskrétní Fourierovy transformace. [odtud dál ještě texty ani nejsou pořádně rozpracované] V osmé kapitole pokračujeme v našem stručném nastínění analytických spojitých metod, tentokrát pro modely s mnoha proměnnými. Nejprve rozšime základní postupy a výsledky týkající se derivací nafunkce více proměnných, včetně funkcí zadaných implicitně a tzv. vázaných extrémů. Hned poté rozšíříme teorii integrování o tzv. násobné integrály. Poté se věnujeme stručně modelům opřeným o 3 známou změnu našich objektů, tj. diferenciálním rovnicím a malinko naznačíme obdobné problémy variační. Závěrem této kapitoly se pak stručně věnujeme numerickým přiblížením a odhadům. Devátá kapitola je věnována popisné statistice, matematické pravděpododobnosti a matematické statistice. Seznámíme se s pojmy pravděpodobnostní prostor, hustota pravděpodobnosti, normální rozdělení, střední hodnota, medián, kvantil, rozptyl, příklady diskrétních a spojitých rozdělení a budeme se náznakem věnovat statistickému zpracování dat, tj. výběrovým statistikým a jejich spolehlivosti. V další kapitole zamíříme zpět do světa diskrétních metod. Zabýváme se v ní základními pojmy a poznatky teorie grafů a jejich využitím v praktických problémech (např. prohledávání do šířky a hloubky, minimální pokrývající kostry, toky v sítích, hry popisované stromy). Závěrem se budeme zajímat o vytvořující funkce. Poslední kapitola se zabývá nejprve obecnými algebraickými strukturami s důrazem na elementární poznatky z teorie grup, okruhů polynomů. Zmíníme i něco málo aplikací v kódování. Dále se věnujeme úvodu do teorie čísel a vybrané aplikace, včetně šifrování informace. Pořádné poděkování všem zúčastněným, kteří nebudou přímo v autorském kolektivu, studentům apod. ??. ??. 2013, kolektiv autorů 4 KAPITOLA 1 Rozcvička „ hodnota, změna, poloha " — co to je a jak to uchopit? Cílem první kapitoly je uvést čtenáře do fascinujícího světa matematického myšlení. Vybíráme si k tomu co nej-konkrétnější příklady modelování reálných situací pomocí abstraktních objektů a souvislostí. Zároveň projdeme několik témat a postupů, ke kterým se postupně budeme vracet a v závěru kapitoly se budeme chvíli věnovat samotnému jazyku matematiky (se kterým budeme jinak zacházet spíše intuitivně). O co jednodušší jsou východiska a objekty, se kterými zde budeme pracovat, o to složitější je pochopit do důsledku jemnosti použitých nástrojů a postupů. Většinou je možné proniknout k podstatě věcí teprve v jejich souvislostech. Proto je také představujeme hned z několika pohledů zároveň. Přecházení od tématu k tématu se možná bude zdát jako zmatečné, ale to se jistě postupně spraví při našich návratech k jednotlivým úvahám a pojmům v pozdějších kapitolách. Název kapitoly lze chápat i jako nabádání k trpělivosti. I nejjednodušší úlohy a úvahy budou snadné jen pro ty, kteří už podobné řešili. K postupnému poznání a ovládnutí matematického myšlení vede jen pozvolná a spletitá cesta. Začneme s tím nejjednodušším: obyčejnými čísly. A. Čísla a funkce S přirozenými, celými, racionálními a reálnými čísly již počítat umíme. Zamyslíme se, proč racionální čísla nestačí (byť v počítači s jinými doopravdy počítat neumíme) a připomeneme si tzv. čísla komplexní (protože ani s reálnými čísly si při výpočtech nevystačíme). 1. Čísla a funkce Lidé odjakživa chtějí mít jasno „kolik" něčeho je, případně „za kolik" to je, „jak dlouho" něco trvá apod. Výsledkem takových úvah je většinou nějaké „číslo". Za číslo přitom W/f1'^ považujeme něco, co umíme sčítat a násobit a splňuje to obvyklé zákonitosti, ať už všechny nebo jen některé. Například výsledek sčítání nezávisí na pořadí, v jakém čísla sčítáme, máme k dispozici číslo nula, které přičtením výsledek nezmění, číslo jedna, kterým můžeme násobit, aniž bychom změnili výsledek, apod. Nejjednodušším příkladem jsou tzv. čísla přirozená, budeme je značit N = {0, 1, 2, 3, ...}. Všimněme si, že jsme mezi přirozená čísla vzali i nulu, jak je obvyklé zvláště v informatice. Počítat „jedna, dvě, tři, ..." se učí děti už ve školce. O něco později se setkáváme s čísly cítýmč Z = {.. 1.1. Najděte nějaké reálné číslo, které není racionální. Řešení. Jedna z mnoha možných odpovědí je \[2. Již staří Řekové věděli, že předepíšeme-li plochu čtverce a2 = 2, pak nelze najít racionální a, které by předpisu vyhovovalo. Proč? Víme, že každé přirozené číslo n lze jednoznačným způsobem vyjádřit jako součin n = p[l ■ pr^ ... prkk, až na pořadí v součinu, kde pi, ..., Pk jsou po dvou různá prvočísla. Pokud by tedy platilo (p/q)2 = 2 pro přirozená čísla p a q, pak tedy p2 = 2q2. Na levé straně máme v rozkladu na prvočísla 2r se sudým r (případně r = 0), na pravé straně ale bude vždy mocnina dvojky lichá. To je spor s naším tvrzením a tedy předpoklad nemůže platit a žádné racionální číslo nemůže mít za svoji druhou mocninu dvojku. □ 2, — 1, 0, 1, 2, ...} a nakonec si zvykneme na 1.2. Najděte řešení rovnice x = b pro libovolné reálné číslo b. 5 A. ČÍSLA A FUNKCE 1. ČÍSLA A FUNKCE pl. 3 Řešení. Víme, že tato rovnice má vždy řešení x v oboru reálných čísel, pokud je b nezáporné. Jestliže je b = —1, pak ale zjevně takové reálné x existovat nemůže. Musíme proto najít větší obor čísel, ve kteréip-uě- řešení existovat bude. K reálným číslům nejprve přidáme nové číslo i, tzv. imaginární jednotku a zkusíme dodefinovat sčítání a násobení tak, abychom i nadále zajistili obvyklé chování čísel, jak je shrnuto v odstavci 1.1. Jistě musíme umět nové číslo i násobit reálnými čísly a výsledky sčítat s jakýmikoliv reálnými čísly. Nutně proto musíme v novém číselném oboru komplexních čísel C pracovat s formálními výrazy z = a + i b. Aby byly splněny vlatnosti asociativity a distributivity, zavedeme sčítání tak, že se nezávisle sčítají reálné složky a imaginární složky. Stejně tak chceme násobení tak, jak by se násobily dvojčleny reálných čísel s jediným dodatečným pravidlem i2 = — 1, tj. (a + i b) + (c + i d) = {a + c) + i (b + d), (a + i b) ■ (c + i d) = (ac — bd) + i (bc + ad). □ Reálnému číslu a říkáme reálná složka komplexního čila z, reálnému číslu b pak imaginární složka komplexního čísla z, píšeme re(z) = a, im(z) = b. 1.3. Ověřte, že skutečně platí všechny vlastnosti (KG1-4), (01-4) a (P) skalárů z 1.1. Řešení. Nulou je číslo O + z O, jedničkou číslo 1 + i O, obě tato čísla pro jednoduchost opět píšeme jako O a 1. Všechny vlastnosti se ověří přímočarým výpočtem. □ Komplexní číslo je dáno dvojicí reálných čísel, jde tedy o bod v reálné rovině M2. 1.4. Ukažte, že vzdálenost komplexního čísla z = a+iboá počátku (značíme ji \z\) je dána výrazem zž, kde ž komplexně sdružené číslo a — i b. Řešení. Součin zz (a2 + b2) + i {-ab + ba) = a2 + , je vždy reálné číslo a dává nám skutečně kvadrát vzdálenosti čísla z od počátku 0. Platí tedy \z\2 = zz ■ □ desetinná čísla a víme, co znamená 1.19-násobek ceny díky 19% dani z přidané hodnoty. 1.1. Vlastnosti čísel. Abychom mohli s čísly pracovat opravdu, musíme se jejich definici a vlastnostem věnovat pořádněji. V matematice se těm základním tvrzením o vlastnostech objektů, jejichž platnost předpokládáme, aniž bychom se zabývali jejich dokazovaním, říká axiomy. Vhodná volba axiomů předurčuje jak dosah z nich vycházející teorie, tak její použitelnost v matematických modelech skutečnosti. Uveďme si teď základní vlastnosti operací sčítání a násobení pro naše počty s čísly, která píšeme jako písmena a, b, c, .... Obě tyto operace fungují tak, že vezmeme dvě čísla a, b a. aplikací sčítání nebo násobení dostaneme výsledné hodnoty a + b a a ■ b. \ Vlastnosti skalárů |_ Vlastnosti sčítání: 1.5. Poznámka. Vzdálenost \z\ nazýváme též absolutní hodnotou komplexního čísla z. (KG1) (a + b) + c = a + (b + c), pro všechna a, b, c (KG2) a + b = b + a, pro všechna a, b (KG3) existuje 0 taková, že pro všechna a platí a + 0 = a (KG4) pro všechna a existuje b takové, že a + b = 0 Vlastnostem (KG1) - (KG4) říkáme vlastnosti komutativní grupy. Jsou to po řadě asociativita, komutativita, existence neutrálního prvku (říkáme u sčítání také nulového prvku), existence inverzního prvku (říkáme u sčítání také opačného prvku k a a značíme ho —a). Vlastnosti násobení: (01) (a ■ b) ■ c = a ■ (b ■ c), pro všechny a, b, c (02) a ■ b = b ■ a, pro všechny a, b (03) existuje prvek 1 takový, že pro všechny a platí 1 • a = a (04) a ■ (b + c) = a ■ b + a ■ c, pro všechny a, b, c. Vlastnosti (01)-(04) se postupně nazývají asociativita, komutativita, existence jednotkového prvku a distributivita sčítání vůči násobení. Množiny s operacemi +, • a vlastnostmi (KG1)-(KG4), (01)-(04) se nazývají komutativní okruhy. Další vlastnosti násobení: (P) pro každé a ^ O existuje b takové, že a ■ b = 1. (01) je-li a ■ b = O, potom buď a = O nebo b = 0. Vlastnost (P) se nazývá existence inverzního prvku vzhledem k násobení (tento prvek se pak značí a-1) a vlastnost (01) říká, že neexistují „dělitelé nuly". m^mmmmmmmmmmm 6 KAPITOLA 1. ROZCVIČKA Vlastnosti těchto operací sčítání a násobení budeme soustavně využívat, aniž bychom museli přesně vědět, s jakými objekty skutečně pracujeme. Tak se dostaneme k obecným matematickým ná-strojům, je však vždy dobré mít představu o typických příkladech. Celá čísla Z jsou dobrým příkladem komutativní grupy, přirozená čísla nikoliv, protože nesplňují (KG4) (a případně neobsahují neutrální prvek, pokud někdo nulu do N nezahrnuje). Když komutativní okruh navíc splňuje i vlastnost (P), hovoříme o poli (často také o komutativním tělese). Poslední uvedená vlastnost (Ol) je automaticky splněna, pokud platí (P). Opačně to ovšem neplatí a tak říkáme, že vlastnost (Ol) je slabší než (P). Např. okruh celých čísel Z nesplňuje (P), ale splňuje (Ol). Hovoříme v takovém případě o oboru integrity. Všimněme si, že množina všech nenulových prvků v poli společně s operací násobení splňuje (Ol), (02), (03), (P), a je proto také komutativní grupa. Jen se místo sčítání mluví o násobení. Jako příklad můžeme vzít všechna nenulová reálná čísla. Prvky nějaké množiny s operacemi + a • splňujícími (ne nutně všechny) výše uvedené vlastnosti (tj. komutativní okruh, obor integrity, pole) budeme nazývat skaláry. Budeme pro ně vesměs užívat malá latinská písmena ze začátku nebo konce abecedy. Všechny vlastnosti (KG1)-(KG4), (01)-(04), (P), (01) z našich úvah je třeba brát jako axiomatickou definici příslušných matematických pojmů. Pro naše potřeby bude stačit si průběžně uvědomovat, že při dalších diskusích budeme důsledně používat pouze tyto vlastnosti skalárů a že i naše výsledky proto budou platné pro všechny objekty s těmito vlastnostmi. V tomto je pravá síla matematických teorií - nejsou platné jen pro konkrétní řešený příklad. Naopak, při rozumné výstavbě mají vždy univerzální použití. Budeme se snažit tento aspekt zdůrazňovat, přestože naše ambice mohou být v rámci daného rozsahu učebnice jen velice skromné. 1.2. Existence skalárů. K tomu, aby ale skutečně bylo možné budovat matematickou teorii, je třeba ověřit, že takové objekty mohou existovat. Pro pořádek si proto budeme postupně ukazovat, jak je možné zkon-struovat základní číselné obory. Pro konstrulĽá£pÍ3ffiÍĽ zených čísel začneme s předpokladem, že víme, co jsou to množiny. Prázdnou množinu si označíme 0 a definujeme (1.1) neboli O:=0, 1 O := 0, n + í:=nU{n} \, 2 := {O, 1}, ...,n + 1 := {O, 1, ...,n] 1.6. Interpretujte násobení imaginární jednotkou a vzetí komplexně sdruženého čísla jako geometrickou transformaci v rovině. Řešení. Imaginární jednotka i odpovídá bodu (O, 1) a všimněme si, že vynásobení jakéhokoliv čísla z = a + i b imaginární jednotkou dává výsledek i ■ (a + i b) = —b + i a což je v interpertaci v rovině otočení bodu z o pravý úhel v kladném smyslu, tj. proti směru hodinových ručiček. Přiřazení komplexně sdruženého čísla je symetrie podle osy reálných čísel: z = (a + i b) h-> (a — i b) =z- □ Obrázek! 1.7. Goniometrický tvar komplexního čísla. Nejprve uvažme komplexní čísla tvaru z = cos
/l3.
(2+3Q(l+iV/3) 1-/V3
|2 + 3i\
|1-Z\/3|
|2 + 3i\
□
1.14. Uvedte vzdálenost d čísel z, z v komplexní rovině, je-li
- _ TWl ; 3
Řešení. Není obtížné si uvědomit, že komplexně sdružená čísla jsou v komplexní rovině souměrně sdružená podle osy x a že vzdálenost komplexního čísla od osy x je rovna absolutní hodnotě jeho imaginární části. To již dává d = 3. □
1.15. Vyjádřete z\ + Z2, z\ ■ Z2,l\, \Z2\, fr> Pro
i) zi
ii) Zl
1 - 2i, Z,2 2, Z,2 = i
4i
1.16. Komplexní čísla nejsou pouze nástrojem, abychom získali „divná" řešení kvadratických rovnic, ale jsou potřeba i k tomu, abychom určili reálná řešení kubických rovnic. Jak vyjádřit řešení kubické rovnice
x3 + ax2 + bx + c = 0
pomocí reálných koeficientů a, b, cl Ukažme si metodu, na kterou přišli v šestnáctém století pánové Ferro, Cardano, Tartaglia a možná další. Zaveďme substituci x := t — a/3 (abychom odstranili kvadratický člen v rovnici), dostaneme rovnici:
t3 + pt + q = 0,
9
A. ČÍSLA A FUNKCE
2. KOMBINATORICKÉ VELIČINY
kde p = b — a2/3 a q = c + (2a3 — 9ab)/27. Nyní zaveďme neznámé u, v splňující podmínky u + v = t & 3uv + p = Q. Dosazením první podmínky do původní rovnice dostáváme
u3 + v3 + (3uv + p)(u + v) + q = 0,
dosazením druhé pak
u6 + qu3 - — = 0, H 27
což je kvadratická rovnice v neznámé s = u3. Máme tedy
u=Í-q-±Jq- + P-V 2 V 4 27
Celkem pak zpětným dosazením
x = —p/3u + u — a/3. Cardan
Ve výrazu pro m je se vyskytuje třetí odmocnina a abychom dostali všechna tři řešení, je nutno pracovat i s komplexními odmocninami. Rovnice x3 = a, a ^ 0, s neznámou x má totiž právě tři řešení v oboru komplexních čísel (Základní věta algebry, viz (??)). Všechna tato řešení nazýváme třetí odmocninou z čísla a. Je tedy výraz ^fa v komplexním oboru trojznačný. Pokud se chce přisoudit výrazu ^fä jednoznačný význam, tak se za třetí odmocninu uvažuje řešení s nejme-nším argumentem.
Navíc ještě dodejme, že při popsaném postupu se mohlo vyskytnout dělení nulou. V tom případě je nutno použít jiného (většinou snadnějšího) postupu.
1.17. Řešte rovnici
x3 +x2
2x - 1 = 0.
Řešení. Jak snadno zjistíme, tak rovnice nemá racionální kořeny (metody na určování racionálních kořenů si objasníme v části (??)). Do-
sazením do získaných vztahů získáme p = q = —7/27, pro u pak dostáváme
^28 ± 12^147
b - a113
TA.
1 . 4
kde můžeme teoreticky volit až šest možností pro u (dvě volby znaménka plus či mínus a k tomu tři nezávislé volby třetí odmocniny). Jak však snadno nahlédneme, dostáváme pro x pouze tři různé hodnoty. Dosazením do (1.16) pak jeden z kořenů má tvar
14
'3(28 - 84/V3)
^28 - 84/73 1
+------= 1,247,
6 3
Naše definice funkce faktoriál říká, jak se změní hodnota /(«), když změníme hodnotu n o jedničku. Vzorec pro n\ již explicitně říká, kolik to je doopravdy. V tomto případě to není příliš efektivní vzorec, protože se jeho složitost zvětšuje s rostoucím n, lepší ale těžko hledat.
Podívejme se ještě na obyčejné sčítání přirozených čísel jako na operačně definovanou skalární funkci. Definičním oborem je množina všech dvojic (a, b) přirozených čísel. Definujeme a + b jako výsledek procedury, ve které k a několikrát po sobě přičítáme 1. Tak jsme vlastně obecně a + 1 definovali v rovnicích (1.1). Při každém přičtení odebereme z b největší prvek a postupujeme tak, dokud není b prázdná (tj. b se postupně zmenšuje o jedničku a v každém kroku nám říká, kolik ještě zbývá přičíst).
Je evidentní, že takto definované sčítání sice je dáno (iterativním) vzorcem, postup ale není vhodný pro praktické počítání. Tak tomu bude v našem výkladu často - teoreticky korektní definice pojmu či operace neznamená, že úkony s nimi spojené jsou efektivně vykonavatelné. Právě k tomu budeme postupně rozvíjet celé teorie, abychom praktické nástroje získávali. Co se týče přirozených čísel, od školky je umíme sčítat zpaměti a rychle (pokud jsou malá), pro větší známe ze základní školy algoritmus písemného sčítání a s velkými si poradí počítače (pokud nejsou příliš velká).
2. Kombinatorické veličiny
Typickým „kombinatorickým" problémem je napočítat, kolika různými způsoby se může něco stát. Např. kolika způsoby lze vybrat v samoobsluze dva různé sendviče z dané nabídky? Myslíme si přitom, že jsou všechny sendviče v regálu po dvou různé nebo rozlišujeme jen různé typy sendvičů? Připouštíme pak, že si také můžeme vzít dva stejné? Nepřeberně takových otázek máme u karetních a jiných her.
Při řešení konrétních problémů většinou používáme buď tzv. „pravidlo součinu", když v navzájem nezávislých úkonech kombinujeme každý výsledek s každým, nebo „pravido součtu", když sčítáme počty pro různé neslučitelné možnosti. Prakticky to uvidíme v mnoha příkladech.
1.5. Permutace. Jestliže z množiny n předmětů vytváříme nějaké pořadí jejich prvků, máme pro volbu prvního prvku n možností, další je volen z n — 1 možností atd., až nám nakonec zbude jediný poslední prvek. Zjevně tedy je na dané konečné množině S s n prvky právě n! různých pořadí. Procesu uspořádávání prvků množiny S říkáme permutace prvků množiny S. Výsledkem permutace je pak vždy nějaké pořadí prvků. Jestliže si předem prvky v S očíslujeme, tj. ztotožníme si 5 s množinou S = {\, ... ,n)n přirozených čísel, pak permutace odpovídají možným pořadím čísel od jedné do n. Máme tedy příklad jednoduché matematické věty a naši předchozí diskusi je možné považovat za její důkaz:
10
KAPITOLA 1. ROZCVIČKA
Počet permutací
Tvrzení. Počet p(n) různých pořadí na konečné množině s n prvky je dán známou funkcí faktor iál:
el. la
1.4a
(1.2)
p (n)
nl
1.6. Kombinace a variace. Dalším jednoduchým příkladem hodnoty určené vzorcem jsou tzv. kombinační čísla, která vyjadřují, kolika způsoby lze vybrat k různých rozlišitelných předmětů z množiny n předmětů. Zjevně máme
n(n - 1) • • • (n - k + 1)
možných výsledků postupného výběru našich k prvků, přitom ale stejnou výslednou &-tici dostaneme v k\ různých pořadích. Pokud nám záleží i na pořadí vybrané &-tice prvků, hovoříme o variaci k—tého stupně.
Jak jsme si právě ověřili, počet kombinací a variací udávají následující vzorce, které také nejsou pro výpočet moc efektivní při velikých kun, protože obsahují výrazy pro fak-toriály.
' Kombinace a variace
el. 2
Tvrzení. Pro počet c(n,k) kombinací k-tého stupně z n
prvků, kde 0 < k < n, platí
(1.3)
'n\ n(n - 1)... (n - k + 1) n\ ,k) ~ *(*-!)...! ~ (n-k)\k\'
c(n, k)
el. 2a
k(k-\)...\ Pro počet v(n,k) variací platí (1.4) v{n, k) = n(n - 1) • • • (n -
pro všechny 0 < k < n (a nula jinak).
k + 1)
el. 3
Kombinační číslo čteme „n nad k" a nazýváme ho také někdy binomickým číslem. Tento název čísla dostala od tzv. binomického rozvoje, tj. roznásobení n-té mocniny dvo-jčlenu. Počítáme-li totiž ia + b)n, bude koeficient u mocniny akbn~k pro každé 0 < k < n roven právě počtu možností, jak vybrat &-tici z n závorek v součinu (ty, kde bereme do výsledku a). Platí proto
(1.5)
ia+bf = \Mb
k=0
1.5
a všimněme si, že pro odvození jsme potřebovali pouze distri-butivitu, komutativitu a asociativitu násobení a sčítání. Formule (1.5) proto platí v každém komutativním okruhu.
Jako další jednoduchou ukázku, jak vypadá matematický důkaz si odvoďme několik jednoduchých tvrzení o kombinačních číslech. Pro zjednodušení formulací definujme = 0, kdykoliv je buď k < 0 nebo k > n.
1.7. Tvrzení. Pro všechna přirozená čísla k a n platí
obdobně pro ostatní dva kořeny (přibližně —0, 445 a —1, 802). Jak jsme předeslali, vidíme, že i když se ve vzorcích pro kořeny vyskytují komplexní čísla, tak výsledek je reálný. □ Závěrem uveďme ještě jeden příklad ukazující, že „divné" skaláry se chovají divně:
1.18. Nenulový mnohočlen s nulovými hodnotami. Najděte nenulový mnohočlen jedné neznámé s koeficienty v Z7, tj. výraz typu a„xn + • • • + ci\x + ao, at e Z7, a„ 7^ 0, takový, že na množině Z7 nabývá pouze nulových hodnot (tj. dosadíme-li za x libovolný z prvků Z7 a výraz v Z7 vyčíslíme, dostaneme vždy nulu).
Řešení. Při konstrukci tohoto mnohočlenu se opřeme o Malou Fer-matovu větu, která říká, že pro livovolné prvočíslo p a číslo a s ním nesoudělné platí:
a"'1 = l(modp).
Hledaný polynom je tedy například polynom x1 — x (polynom x6 — 1 by neměl nulovou hodnotu v čísle 0). □
6. Kombinatorika
V této kapitole si budeme hrát s přirozenými čísly, která budou popisovat různé nedělitelné předměty nacházející se v našem životním prostoru a budeme se zabývat tím, jak spočítat počet jejich uspořádání, přeuspořádání, výběrů a tak podobně. Ve velké většině takovýchto problémů lze vystačit se „selským rozumem". Stačí vhodně používat pravidel součtu a součinu, která si ukážeme na následujících příkladech:
1.19. Maminka chce Jeníkovi a Mařence rozdělit pět hrušek a šest jablek. Kolika způsoby to může udělat? (Hrušky mezi sebou považujeme za nerozlišitelné, stejně tak jablka. Připouštíme, že některé z dětí nic nedostane.)
Řešení. Pět hrušek samostatně může maminka rozdělit šesti způsoby. (Rozdělení je určeno tím, kolik hrušek dá Jeníkovi, zbytek připadne Mařence.) Šest jablek pak nezávisle sedmi způsoby. Podle pravidla součinu pak obě ovoce současně může rozdělit 6 • 7 = 42 způsoby. □
1.20. Určete počet čtyřciferných čísel, která začínají cifrou 1 a nekončí cifrou 2, nebo končí cifrou 2 a nezačínají cifrou 1.
Řešení. Množina uvažovaných čísel je složená ze dvou disjunktních množin, totiž čísel, která začínají cifrou 1 a nekončí cifrou 2 (první množina) a čísel, která nezačínají cifrou 1 a končí cifrou 2. Celkový počet popsaných čísel dostaneme podle pravidla součtu tak, že sečteme počty čísel v těchto dvou množinách. V první z těchto množin máme čísla tvaru „1XXY", kde X je libovolná cifra a F je libovolná číslice mimo dvojky. Můžeme tedy provést deset voleb druhé cifry, nezávisle
11
B. KOMBINATORIKA
2. KOMBINATORICKÉ VELIČINY
na tom můžeme provést deset voleb třetí cifry a opět nezávisle devět voleb poslední cifry Tyto tři nezávislé volby jednoznačně určují dané číslo a podle pravidla součinu máme tedy 10 • 10-9 = 900 takových čísel. Obdobně ve druhé skupině máme 8 • 10 • 10 = 800 čísel (na první cifru máme pouze osm možností, neboť číslo nemůže začínat nulou a jedničku máme zakázánu). Celkem podle pravidla součtu je 900 + 800 = 1700 uvažovaných čísel. □
1.21. Určete počet způsobů, jak lze na šachovnici (8x8 polí) postavit bílou a černou věž tak, aby se neohrožovaly (nebyly ve stejném řádku ani sloupci).
Řešení. Nejprve umístíme např. bílou věž. Pro ni máme na výběr z 82 polí. Ve druhém kroku umístíme věž černou. Nyní máme „k dispozici" 7 2 polí. Podle pravidla součinu je výsledek 82 • 72 = 3 136.
□
V následujících příkladech už budeme při řešení používat pojmů kombinace, permutace, variace (případně s opakováním), které jsme definovali.
1.22. Během schůze má vystoupit 8 řečníků. Stanovte počet všech pořadí, v nichž dva předem určení řečníci nevystupují ihned po sobě.
Řešení. Označme si zmíněné dva řečníky jako osoby A a B. Pokud hned po vystoupení osoby A následuje vystoupení osoby B, můžeme na to nahlížet jako na projev jediného řečníka. Počet všech pořadí, v nichž vystupuje B ihned po A, je tedy roven počtu všech permutací ze sedmi prvků. Stejný je pochopitelně také počet všech pořadí, v nichž vystupuje A ihned po B. Neboť počet všech možných pořadí 8 řečníků je 8!, číslo 81 — 2-7! udává hledaný počet pořadí. □
1.23. Kolik existuje přesmyček slova PROBLÉM takových, že v nich
a) písmena B a R stojí vedle sebe,
b) písmena B a R nestojí vedle sebe.
Řešení, a) Dvojici písmen B a R můžeme považovat za jedno nedělitelné dvojpísmeno. Celkem tedy máme k dispozici šest různých písmen a šestipísmených slov složených z různých písmen je 6!. V našem případě však tento počet musíme ještě vynásobit dvěma, neboť naše dvojpísmeno může bít jak BR tak RB. Celkem dostáváme 2-6! různých přesmyček.
b) 7! — 2 • 6! (doplněk části a) do počtu všech sedmipísmenných slov složených z různých písmen. □
1.24. Kolika způsoby může sportovec umístit 10 různých pohárů do 5 polic, jestliže se na každou polici vejde všech 10 pohárů?
<*) g) = c"j
(2) g:í) = ©+Gy
(3) ELo g) =2"
Důkaz. První tvrzení je zjevné přímo z formule (1.3). Jestliže vyčíslíme pravou stranu z tvrzení (2), dostáváme
/n\ í n \ n\ n\
\ k j
+
n
k + 1
+
k\(n - k)\ ' (k + l)!(n (k + l)n\ + (n- k)n\
1)!
(k + l)!(n - k)\ _ (n + 1)! ~ (* + l)!(n -k)\
což je ale levá strana tohoto tvrzení.
Tvrzení (3) dokážeme tzv. matematickou indukcí. Tento 0 typ důkazu je vhodný právě pro tvrzení, která
říkají, že něco má platit pro všechna přiro-7OM zená čísla n. Matematická indukce se skládá ze dvou kroků. V prvním se tvrzení dokáže pro n = 0 (popřípadě n = 1 nebo další hodnoty ň). V druhém, tzv. indukčním, kroku předpokládáme, že tvrzení platí pro nějaké n (a všechny předešlé hodnoty), a za pomoci tohoto předpokladu dokážeme, že tvrzení platí i pro n + 1. Dohromady z toho pak vyvodíme, že tvrzení platí pro všechna přirozená n.
Tvrzení (3) zjevně platí pro n = 0, protože Q = 1 = 2°. (Stejně tak je přímo vidět i pro n = 1.) Předpokládejme, že platí pro nějaké n a spočtěme příslušnou sumu pro n + 1 s využitím tvrzení (2) i (3). Dostaneme
n + 1
E
*=0
n + 1 k
n + 1
E
jt=0 n
E
k=-\
n
k - 1
+
n + 1
+ E
k=0
2" +2" = 2'
n + 1
Všimněme si, že vzorec (3) udává počet všech podmnožin rc-prvkové množiny, neboť je počet všech jejích ^-prvkových podmnožin. Všimněme si také, že tvrzení (3) plyne přímo z (1.5) volbou a = b = 1.
Tvrzení (4) dokážeme opět matematickou indukcí, podobně jako (3). Zjevně platí pro n = 0, čímž je hotov první krok. Indukční předoklad říká, že (4) platí pro něj aké n. Spočtěme nyní příslušnou sumu pro n + 1 s využitím tvrzení (2) a indukčního předpokladu. Dostaneme
n + 1
E*
*=0
n + 1
n + 1
n \ In k-l) + \k
E*
n , x n+l , x
Ě(;hĚ<:)+í>(;;
12
KAPITOLA 1. ROZCVIČKA
2n i „„ o n — 1 .
•\n—i
(« + 1)2".
Tím je proveden indukční krok, a tvrzení je dokázáno pro všechna přirozená n. □
Druhá vlastnost z našeho tvrzení umožňuje sestavit všechna kombinační čísla do tzv. Pascalova trojúhelníku, kde každé číslo obdržíme jako součet dvou bezprostředně nad ním ležících sousedů:
n = 0 n = 1 n = 2 n = 3 n = 4 n = 5
1
4
1
1
3
10
1
2
1
3
10
1
4
1
Všimněme si, že v jednotlivých řádcích máme právě koeficienty u jednotlivých mocnin z výrazu (1.5), např. poslední uvedený řádek říká
(a + b)5 = a5 + 5a4b + \0a3b2 + \0a2b3 + 5ab4 + b5.
1.8. Výběr s opakováním. Pořadí n prvků, z nichž mezi některými nerozlišujeme, nazýváme permutace s opakovaním.
Nechť je mezi n danými prvky p\ prvků prvního druhu, p2 prvků druhého druhu, ..., Pk prvků &-tého druhu, p\ + p2 + ■ ■ ■ + Pk = n, potom počet pořadí těchto prvků s opakováním budeme značit P(pi,...,pk).
Podobně jako u permutací a kombinací bez opakování, pro výběr prvního z nich máme n možností, pro další n — 1 a tak dále, až po poslední, který zbude. Přitom ale za stejná považujeme pořadí nerozlišitelných objektů. Těch je pro každou skupinku o p{ objektech právě p{!, takže zřejmě platí
' Permutace s opakováním
P(pi
Pk)
P\\--- Pk]-
Volný výběr k prvků z n možností, včetně pořadí, nazýváme variace k-tého stupně s opakováním, jejich počet budeme značit V(n,k). Volný výběr v tomto případě znamená, že předpokládáme, že stále máme pro výběr stejně možností, např. díky tomu, že vybrané prvky před dalším výběrem vracíme nebo třeba házíme pořád stejnou kostkou. Zřejmě platí
| Variace s opakováním [
V(n,k) =nk
Pokud nás výběr zajímá bez zohlednění pořadí, hovoříme o kombinacích s opakováním a pro jejich počet píšeme C(n, k). Zde se na první pohled nezdá tak jednoduché, jak výsledný počet zjistit. Důkaz následující věty je pro matematiku typický - podaří se nám nový problém převést na problém jiný, který jsme už dříve zvládli. V našem
Řešení. K pohárům přidáme 4 navzájem nerozlišitelné předměty, kupř. tužky. Počet všech různých pořadí pohárů a tužek je zřejmě 14 !/4! (tužky jsou nerozlišitelné). Každé umístění pohárů do polic ovšem odpovídá právě jednomu seřazení pohárů a tužek. Stačí třeba říci, že poháry před první tužkou v pořadí dáme do první police (při zachování pořadí), poháry před druhou tužkou do druhé police atd. To znamená, že číslo 14!/4! je výsledkem. □
1.25. Určete počet čtyřciferných čísel sestavených z právě dvou různých cifer.
Řešení. Dvě různé cifry použité na zápis můžeme vybrat (j0) způsoby, ze dvou vybraných cifer můžeme sestavit 24 — 2 různých čtyřciferných čísel (dvojku odečítáme za dvě čísla složená pouze z jedné cifry). Celkem máme (2°)(24-2) = 630 čísel. Nyní j sme ale započítali
1) = 63. Celkově dostáváme
□
i čísla začínající nulou. Těch je (j)(2 630 - 63 = 567 čísel.
1.26. Určete počet sudých čtyřciferných čísel sestavených z právě dvou různých cifer.
Řešení. Obdobně jako v předchozím příkladu se nejprve nebudeme ohlížet na cifru nula. Dostaneme tak (j)(24 — 2) + 5 • 5(23 — 1) čísel (nejprve počítáme čísla pouze ze sudých cifer, druhý sčítanec udává počet sudých čtyřciferných čísel složených ze sudé a liché cifry). Opět musíme odečíst čísla začínající nulou, těch je (23 — 1)4 + (22 — 1)5. Hledaný počet cifer tak je
'5^
(24 - 2) + 5 • 5(2J - 1) - (2J - 1)4 - (2Z - 1)5 = 272.
□
1.27. Na koncertě je 730 lidí. Mají někteří z nich stejné iniciály? (Neuvažujeme háčky ani čárky)
Řešení. Písmen v abecedě (včetně CH) je 27. Počet všech možných iniciálu je tedy 272 = 729. Proto aspoň 2 lidé budou mít stejné iniciály.
□
1.28. Noví hráči se sejdou v jednom volejbalovém týmu (6 lidí). Kolikrát si při seznamování (každý s každým) podají ruce? Kolikrát si hráči podají ruce se soupeřem po odehrání zápasu?
Řešení. Seznamuje se každá dvojice z šesti hráčů. Počet podání rukou je teda roven kombinaci C(2, 6) = Q = 15. Po zápase si každý z šesti hráčů podá ruku šestkrát (s každým z šesti soupeřů). Počet je teda dohromady 62 = 36. □
13
B. KOMBINATORIKA
2. KOMBINATORICKÉ VELIČINY
1.29. Jak se může rozesadit pět osob v pětimístném autě, když jen dva z nich mají řidičský průkaz? Jak se může rozesadit 20 cestujících a dva řidiči v 25-místném minibuse?
Řešení. Na místě řidiče máme dvě možnosti a na zbylých místech už je pořadí libovolné, tzn. pro spolujezdce 4 možnosti, pro další místo 3, pak 2 a 1. Celkově 2.4! = 48 možností. Podobně v minibuse máme dvě možnosti na místě řidiče a druhý řidič plus cestující mohou na zbylých 24 místech sedět libovolně. Nejprve vybereme místa, která budou obsazená, tj. (^J) a na těchto místech může být 21! různých pořadí. Dohromady máme 2.(^)21! = ^ možností. □
1.30. Kolika způsoby lze do tří různých obálek rozmístit pět shodných stokorun a pět shodných tisícikorun tak, aby žádná nezůstala prázdná?
Řešení. Nejdříve zjistíme všechna rozmístění bez podmínky neprázd-nosti. Těch je podle pravidla součinu (rozmísťujeme nezávisle stokoruny a tisícikoruny) C(3, 5)2 = Q2. Odečteme postupně rozmístění, kdy je právě jedna obálka prázdná, a poté kdy jsou dvě obálky prázdné. Celkem C(3, 5)2 - 3(C(2, 5)2 - 2) -3 = Qf -3(62 - 2) -3 = 336.
□
1.31. Určete počet různých vět, které vzniknou přesmyčkami v jednotlivých slovech věty „Skokan na koks" (vzniklé věty ani slova nemusejí dávat smysl).
Řešení. Určíme nejprve počty přesmyček jednotlivých slov. Ze slova „skokan" dostaneme 6!/2 různých přesmyček (permutace s opakováním P(l, 1, 1, 1, 2)), obdobně ze slova „na" dvě a ze slova „koks" 4! 12. Celkem podle pravidla součinu 6 !4 !/4 = 4320. □
1.32. Kolik existuje různých přesmyček slova „krakatit" takových, že mezi písmeny „k" je právě jedno jiné písmeno.
Řešení. V uvažovaných přesmyčkách je šest možností, jak umístit skupinu dvou „k". Fixujeme-li pevně místa pro dvě písmena „k", pak ostatní písmena můžeme rozmístit na zbylých šest míst libovolně, tedy P(l, 1, 2, 2) způsoby. Celkem podle pravidla součinu je hledaný počet
fi • fi!
6- P(l, 1,2,2)
2-2
1080.
□
1.33. Kolika způsoby můžeme do pěti různých důlků vybrat po jedné kouli, vybíráme-li ze čtyř bílých, čtyř modrých a tří červených koulí?
Řešení. Nejprve řešme úlohu v případě, že bychom měli k dispozici alespoň pět koulí od každé barvy. V tomto případě se jedná o volný
případě je to převedení na problém standardních kombinací bez opakování:
| Kombinace s opakováním |
Věta. Počet kombinací s opakováním k-té třídy z n prvků je pro všechny k > 0 a n > 1
C(n,k)
n+k-1
1
Důkaz. Důkaz je opřen o trik (jednoduchý, jakmile ho pochopíme). Uvedeme dva různé postupy.
Představme si nejprve, že taháme postupně karty z balíku n různých karet a abychom mohli případně některou z nich vytáhnout vícekrát, přidáme si k balíku ještě k — 1 různých žolíků (alespoň jednou určitě chceme jednu z původních karet). Řekněme, že postupně vytáhneme r původních karet a s žolíků, tj. r + s = k. Zdá se, že bychom měli vymyslet postup, jak z těch s žolíků poznat, které karty nám zastupují. Ve skutečnosti nám ale stačí diskuse počtů možností takových voleb.
K tomu můžeme použít matematickou indukci a předpokládat, že dokazovaná věta platí pro menší argumenty než jsou nuk. Skutečně, potřebujeme obsáhnout kombinace s-té třídy s opakováním z pouze r původních karet, což dává (r+k~r~1) = C71)' c°ž Je právě počet kombinací 5-tého stupně (bez opakování) ze všech žolíků. Tím je věta dokázána.
Druhý přístup (bez matematické indukce): Na množině
S = {ai, an},
ze které vybíráme kombinace, si zafixujeme uvedené pořadí prvků a pro naše volby prvků z 5 si připravíme n přihrádek, do kterých si již předem dáme v námi zvoleném pořadí po právě jednom prvku z S.
Jednotlivé volby xt e S přidáváme do přihrádky, která již tento prvek obsahuje. Nyní si uvědomme, že pro rozpoznání původní kombinace nám stačí vědět, kolik je prvků v jednotlivých přihrádkách. Například,
a I bbb I cc \ d ~ * | * * * | ** | *,
vypovídá o volbě b, b, c z množiny S = {a, b, c, d}.
V obecném případě výběru k prvků z n možných tedy máme řetězec n + k znaků a počet C(n, k) je roven počtu možných umístění přihrádek | mezi jednotlivé znaky. To odpovídá výběru n — 1 pozic z n + k — 1 možných. Protože je
n + k k
1
n+k-1 n + k — 1 — k
n+k-1 n - 1
je věta dokázána i podruhé.
□
14
KAPITOLA 1. ROZCVIČKA
3. Diferenční rovnice
2.4.
1. 7
el. 4
V předchozích odstavcích jsme viděli vzorce, které zadávaly hodnotu skalární funkce definované na přirozených číslech (faktoriál) nebo dvojicích čísel (binomická čísla) pomocí předcházejících hodnot. Zatímco v odstavci 1.5 jsou kombinační čísla definována přímo spočítatelným výrazem, lze rozumět vztahům v 1.8 také tak, že místo hodnoty naší funkce zadáváme její změnu při odpovídající změně nezávislé proměnné.
Takto se skutečně velice často postupuje při matematické formulaci modelů, které popisují reálné sys-l-^y//, témy v ekonomice, biologii apod. My si tu povšimneme jen několika jednoduchých případů a budeme se k této tématice postupně vracet.
1.9. Lineární diferenční rovnice prvního řádu. Obecnou diferenční rovnicí prvního řádu rozumíme výraz
f(n + 1) = F(n, /(«)),
kde F je známá skalární funkce závislá na dvojicích přirozených čísel. Známe-li „počáteční" hodnotu /(O), můžeme spočítat /(l) = F(0, /(O)), poté f (2) = F(l, /(l)) atd. Tímto postupným způsobem můžeme tedy nakonec spočítat hodnotu f (jí) pro libovolné n e N. Všimněme si, že tato úvaha je podobná konstrukci přirozených čísel z prázdné množiny nebo principu matematické indukce.
Jako příklad může sloužit definiční formule pro faktoriál,
tj-
(n + 1)! = (n + 1) -n\
Vidíme, že skutečně vztah pro f(n + \) závisí na n i na hodnotě f(n).
Dalším obzvlášť jednoduchým příkladem je f(n) = C pro nějaký pevný skalár C a všechna n a tzv. lineární diferenční rovnice
(1.6)
f(n + í) = a ■ f(n) + b,
kde a ^ 0, a b jsou známé skaláry.
Takovou diferenční rovnici umíme snadno řešit, je-li b = 0. Pak se totiž jedná o dobře známou rekurentní definici geometrické posloupnosti a platí
/(l) = a/(0), f (2) = af(l) = a2f(0) atd.
Máme tedy pro všechna n
f (n) = ď f (Q).
To je např. vztah pro tzv. Malthusiánský model populačního růstu, který vychází z představy, že za zvolený časový interval vzroste populace s konstantní úměrou a vůči předchozímu stavu.
Dokážeme si obecný výsledek pro rovnice prvního řádu, které se podobají lineárním, ale připouští proměnné koeficienty a a b,
výběr pěti prvků ze tří možností, tedy o variace s opakováním (viz ). Máme
V(3, 5) = 35.
Nyní odečteme ty výběry, ve kterých se vyskytují buď pouze koule stejné barvy (takové výběry jsou tři), nebo právě čtyři koule červené (takových výběrů je 2 • 5 = 10; nejprve vybereme barvu koule, která nebude červená - dvě možnosti - a poté důlek, ve kterém bude - pět možností). Celkem tedy máme
3 - 10 = 230
možných výběrů.
□
1.34. Kolika způsoby lze rozestavit n shodných věží na šachovnici n x n tak, aby bylo každé neobsazené pole ohrožováno některou z věží?
Řešení. Daná rozestavení jsou sjednocením dvou množin: množiny rozestavení, kdy je alespoň v jednom řádku jedna věž (tedy v každém řádku právě jedna; tato množina má n" prvků - v každém řádku vybereme nezávisle jedno pole pro věž) a množiny rozestavení, kdy je v každém sloupci alespoň (tedy právě) jedna věž (stejnou úvahou jako u první množiny má tato množina rovněž n" prvků). Průnik těchto množin pak má n! prvků (místa pro věže vybíráme postupně od prvního řádku - tam máme n možností, ve druhém pak již pouze n — 1 možností - jeden sloupec je již obsazen, ...). Podle principu inkluze a exkluze je počet hledaných rozestavení:
2nn - n\.
□
1.35. Kolika způsoby mohla skončit tabulka první fotbalové ligy, víme-li o ní, že žádné dva z trojice týmů Zbrojovka Brno, Baník Ostrava a Sigma Olomouc spolu v tabulce „nesousedí"?(Ligu hraje 16 mužstev.)
Řešení. První způsob. Hledaný počet spočítáme podle principu inkluze a exkluze tak, že od počtu všech možných tabulek odečteme počet tabulek, ve kterých sousedí některá dvojice z uvedených tří týmů a přičteme počet těch tabulek, ve kterých sousedí všechny tři týmy. Hledaný počet tedy je '3N
16!
2! • 15! + 3! • 14! = 13599813427200.
el. 5
(1.7)
f(n + !)=«„• f(n) + bn.
Jiné řešení. Zmíněné tři týmy budeme považovat za „oddělovače". Zbylých třináct týmů musíme rozdělit tak, aby mezi libovolnými dvěma oddělovači byl alespoň jeden tým. Navíc zbylé týmy můžeme
15
C. DIFERENČNÍ ROVNICE
3. DIFERENČNÍ ROVNICE
mezi sebou nezávisle permutovat a rovněžtak oddělovače. Celkem tedy dostáváme
'14^
• 13! • 3! = 13599813427200
možností.
□
1.36. Pro libovolné pevné n e N určete počet všech řešení rovnice xi +x2-\-----h xk = n
v množině
a) nezáporných
b) kladných
celých čísel.
Řešení, a) Každé řešení (ri, ..., r*), $ľ/=i r' = n můžeme jednoznačně zašifrovat jako posloupnost jedniček a nul, ve které napíšeme nejprve r\ jedniček, pak nulu, pak r2 jedniček, nulu a tak dále. Posloupnost bude celkem obsahovat n jedniček a k — 1 nul. Každjá-ta^-ková posloupnost navíc zřejmě určuje nějaké řešení dané rovnice. Je tedy řešení tolik, kolik je posloupností, tedy
b) Hledáme-li řešení v oboru kladných celých čísel, tak si všim-
něme, že přirozená čísla x\, .. .xk jsou řešením dané rovnice, IpfávS5 když jsou celá nezáporná čísla yt = xt — 1, i = 1, ..., k, řešením rovnice
vi + v2 H-----\-yk=n-k.
Těch je podle první části řešení (nkZ\) ■ ^
C. Diferenční rovnice
Diferenční rovnice (jinak řečeno též rekurentní vztahy) jsou vztahy mezi členy nějaké posloupnosti, přičemž následující člen je dán pomocí členů předchozích. Vyřešit diferenční rovnici pak znamená najít explicitní vzorec pro n-tý (libovolný) člen dané posloupnosti. Rekurentní vztah nám totiž po zadání několika prvních členů posloupnosti zadává n-tý člen přímo pouze pomocí postupného vyčíslení všech předchozích členů.
Pokud je následující člen posloupnosti určen pouze předchozím členem, hovoříme o diferenčních rovnicích prvního řádu. S nimi se můžeme v životě opravdu setkat, například, pokud si chceme ,zjis-tit dobu splácení nějaké půjčky při pevné měsíční splátce, nebo naopak chceme zjistit výši měsíční splátky, zadáme-li si dobu, za kterou chceme půjčku splatit.
Nejdříve se ale zamysleme, co mohou takové rovnice popisovat.
Lineární diferenční rovnici (1.6) můžeme pěkně interpretovat jako matematický model pro spoření nebo splácení úvěru s pevnou úrokovou mírou a a pevnou splátkou b (tyto dva případy se liší pouze znaménkem u parametru b).
S proměnnými parametry dostáváme obdobný model, ovšem s proměnlivými jak úroky, tak splátkami. M, Můžeme si představit třeba n jako počet měsíců, an bude vyjadřovat úrokovou míru v měsíci n, bn příslušnou splátku v měsíci n. Neděste se zdánlivě složitého sčítání a násobení v následujícím výsledku. Jde o typický příklad technického matematického tvrzení, kdy těžké je „uhodnout", jak zní. Naopak důkaz je už pak jen docela snadné cvičení na základní vlastnosti skalárů a matematickou indukci. Skutečně zajímavé jsou teprve důsledky, viz 1.11 níže.
Ve formulaci používáme vedle obvyklých znaků pro součet také obdobné znaky pro součin ]~[. V dalším budeme vždy používat také konvenci, že pokud u součtu je množina uvedených indexů prázdná, pak je součet nula, zatímco u součinu je ve stejném případě výsledek jedna.
1.10. Tvrzení. Obecné řešení diferenční rovnice (1.7) prvního řádu s počáteční podmínkou f(0) = y q je dáno vztahem
/n-l
n-2
n-l
(1.8) f(n) =[Y\ -y**.
„ (x\ Í2x+2y-A\
\yj \4x-9y + 3J' ,y
lineární.
Řešení. Pro libovolný vektor (x, y)T el2 můžeme vyjádřit
zadaná přiřa-
G
7 -3\ lx -2 5 J \j, '2 2\ (xs A -9)
Odtud vyplývá, že obě zobrazení jsou afmní. Připomeňme, že afinní zobrazení je lineární, právě když se nulový vektor zobrazí sám na sebe. Neboť
y \ 3
G
zobrazení F je lineární, zobrazení G nikoli
□
1.78. Buď dán pravidelný šestiúhelník ABCDEF (vrcholy jsou označeny poradě v kladném smyslu) se středem v bodě S = [1,0] a vrcholem A = [0, 2]. Určete souřadnice vrcholu C.
Řešení. Souřadnice vrcholu C získáme otočením bodu A okolo středu S šestiúhelníka o 120° v kladném smyslu:
'cos(120o) - sin(120°)N sin(120°) cos(120°)
C
(A — S) + S
+ [1,0] = [--VŠ,-1
2
□
1.79. Buďdán rovnostranný trojúhelník s vrcholy [1, 0] a [0, 1] ležící celý v prvním kvadrantu. Určete souřadnice jeho třetího vrcholu.
m Řešení. Třetí souřadnice je [\ + ^,\ + ^] (otáčíme bod [1, 0] o 60°
kolem bodu [0, 1] v kladném smyslu).
□
1.80. Určete souřadnice vrcholů trojúhelníka, který vznikne otočením rovnostranného trojúhelníka, jehož dva vrcholy jsou A = [1,1] a S = [2, 3] (třetí pak v polorovině dané přímkou AS a bodem S = [0, 0]) o 60° v kladném smyslu kolem bodu S.
Řešení. Třetí vrchol trojúhelníka dostaneme např. otočením o 60° jednoho z vrcholů kolem druhého (ve správném smyslu). Hledané
35
E. GEOMETRIE V ROVINE
5. GEOMETRIE V ROVINE
L], [I _ IV3, ±V3 + ±], □
body mají pak souřadnice [— §V3, V3 [1 - |V3, V3 + |],
1.81. Určete úhel, který svírají vektory
(a) u = (-3, -2), v = (-2, 3);
(b) u = (2,6), v = (-3, -9).
Řešení. Hledaný úhel 2
Matice rotace
u\ + U2, U = (U\, U2) €
Rotace o předem daný úhel ý v kladném směru kolem počátku souřadnic je dána maticí R^,:
cos ý — sin ý sin ý cos ý
1
Nyní, když už víme, jak vypadá matice otočení v rovině, můžeme ověřit, že otočení zachovává vzdálenosti a úhly (definované předešlým vzorcem). Označíme-li obraz vektoru v jako
vx cos ý — vy sin ý vx sin ý + vy c°s ý
a podobně w' opravdu platí
R f ■ w, pak lze snadno přepočítat, že
llw'11
v' w' + v' w'
x x 1 y ^y
-- NI
VXWX + VyWy.
Předchozí výraz lze pomocí vektorů a matic napsat následovně
(RÝ ■ w)T(RÝ ■ v)
T
W V.
w)T je roven wT
obdržíme výsledky
Transponovaný vektor (R^
je tzv. transponovaná matice k matici R^. To je matice, jejíž řádky tvoří sloupce původní matice a sloupce naopak tvoří řádky původní matice. Vidíme tedy, že matice otočení splňují vztah ■ Rý = I, matice / (někdy píšeme prostě 1 a máme tím na mysli jednotku v okruhu matic), je tzv. jednotková matice
1 0 0 1
Tím jsme odvodili pozoruhodné tvrzení — matice F s vlastností, že F ■ Rý = I (budeme takové říkat inverzní matice k matici rotace Rf) je maticí transponovanou k původní. To je logické, neboť inverzní zobrazení k rotaci o úhel ý je opět rotace, ale o úhel — ý, tj. inverzní matice je rovna matici
\AB\ = -B\
\BC\ = \\B -C|
\AC\ = \\A -C|
R.
cos(-ý) — sin(-ý) sin(-ý) cos(-ý)
cos ý sin ý - sin ý cos ý
Pokud bychom chtěli zapsat rotaci kolem jiného bodu P = O + w, P = [wx, wy], opět pomocí matice, snadno □ napíšeme potřebný vzorec pomocí posunutí:
36
KAPITOLA 1. ROZCVIČKA
1.26c
TOTACE S TOSUNUTI^
Stačí si k tomu uvědomit, že můžeme místo rotace kolem daného bodu P napřed posunout P do našeho počátku, pak provést rotaci a pak udělat opačné posunutí, kterým celou rovinu vrátíme tam, kde měla celou dobu být, viz obrázek. Počítejme tedy
h-» v — W H» ■ (v — w) i-» Rf ■ (v — w) + w
cos ý(x — wx) — sin \js(y sin ý(x — wx) + cos \js(y -
- Wy) + WX Wy)) + Wy
1.32. Zrcadlení. Dalším dobře známým příkladem zobra-zení, která zachovávají velikosti, je tzv. zrcadlení vzhledem k přímce. Opět nám bude stačit popsat zrcadlení vzhledem k přímkám prochá-
zejícím počátkem O a ostatní se z nich odvodí
pomocí posunutí, resp. rotací.
Hledejme tedy matici zrcadlení vzhledem k přímce s jednotkovým směrovým vektorem v svírajícím úhel ý s vektorem (1,0). Nejprve si uvědomme, že
Z0
1 0 0 -1
ťa,
3| . M o
0 -4
Obecně můžeme každou přímku otočit do směru vektoru (1,0) a tedy zapsat obecnou matici zrcadlení jako
Zý = Rý ■ Zq • R-ý,
1.84. Najděte matice A takové, že
Nápověda: jaké geometrické zobrazení v rovině zadává matice A2? Řešení. A2 je matice rotace o 60° v kladném smyslu, takže hledané matice jsou
A^(í ?)'
tj. jsou to matice rotace o 30°, resp. o 210°. □
1.85. Stanovte A • A pro
^cos cp — sin cp
vsin det A
splňuje všechny tři naše požadavky. Kolik takových zobrazení ale může být? Každý vektor umíme vyjádřit pomocí dvou bázových vektorů e\ = (1,0) a e2 = (0,1) a díky linearitě je tedy každá možnost pro vol A jednoznačně určena už vyčíslením na těchto vektorech. Protože ale pro obsah, stejně jako pro determinant, je zjevně vol A(ei, ei) = vol A(e2, e2) = 0 (kvůli požadované antisymetrii), je nutně každá taková skalární funkce jednoznačně zadána hodnotou na jediné dvojici argumentů (e\,e2). Jsou si tedy všechny možnosti rovny až na skalární násobek. Ten umíme určit požadavkem
vol A(!, e2) = ^,
tj. volíme orientaci a měřítko pomocí volby bázových vektorů a chceme aby jednotkový čvtverec měl plochu jedna.
Vidíme tedy, že determinant zadává plochu rovnoběžníku určeného sloupci matice A a plocha trojúhelníku je tedy poloviční.
1.35. Viditelnost v rovině. Předchozí popis hodnot pro orientovaný obsah nám dává do rukou elegantní nástroj pro určování pozice bodu vůči orientovaným úsečkám. Orientovanou úsečkou rozumíme dva body v rovině M2 s určeným pořadím. Můžeme si ji představit jako šipku od prvého k druhému bodu. Taková orientovaná úsečka nám rozděluje rovinu na dvě poloroviny, říkejme jim „levou" a „pravou". Pro daný bod chceme poznat, jestli je v té levé nebo pravé.
Takové úlohy často potkáváme v počítačové grafice při řešení viditelnosti objektů. Pro zjednodušení si zde jen představme, že úsečku „je vidět" z bodů napravo a není vidět z
40
KAPITOLA 1. ROZCVIČKA
těch nalevo (což odpovídá představě, že objekt ohraničený orientovanými hranami proti směru hodinových ručiček má nalevo od nich svůj vnitřek, přes který tedy není hranu vidět).
Máme-li dán nějaký bod C, spočtěme orientovanou plochu příslušného trojúhelníku zadaného vektory A — C a B — C. Pokud jsme s bodem C nalevo od úsečky, pak při obvyklé kladné orientaci proti směru hodinových ruček bude vektor A — C dříve než ten druhý a proto výsledná plocha (tj. hodnota determinantu matice jejímiž sloupci jsou tyto dva vektory) bude kladná. Naopak, při opačné poloze bude výsledkem záporná hodnota determinantu a podle záporné hodnoty determinantu zjistíme, že je náš bod od úsečky napravo.
Uvedený jednoduchý postup je skutečně často využíván pro testování polohy při standardních úlohách v 2D grafice.
6. Relace a zobrazení
V této závěrečné části úvodní motivační kapitoly se vrátíme k formálnímu popisu matematických struktur, budeme se je ale průběžně snažit ilustrovat na již známých příkladech. Zároveň můžeme tuto část brát jako cvičení ve formálním přístupu k objektům a konceptům matematiky.
1.36. Relace mezi množinami. Nejprve potřebujeme definovat kartézský součin A x B dvou množin A a B. Je to množina všech uspořádaných dvojic (a, b) takových, že a e A a b e B. Binární relací mezi množinami A a. B pak rozumíme libovolnou podmnožinu R kartézského součinu AxB.
Často píšeme a ~R b pro vyjádření skutečnosti, že (a, b) e R, tj. že body a e A a b e B jsou v relaci R. Definičním oborem relace je podmnožina
Z) c A, D = {a e A; 3b e B, (a, b) e R}.
Slovy vyjádřené, je to množina prvků a z množiny A takových, že existuje prvek b z množiny B tak, že (a, b) patří do relace R. Stručněji, jsou to takové prvky z A, které mají obraz v B. Podobně oborem hodnot relace je podmnožina
/ c 5, / = {b e B; 3a e A, (a, b) e R],
to znamená takové prvky v B, které mají vzor v A.
1.95. Které strany čtyřúhelníku zadaného vrcholy [—2, —2], [1, 4], [3, 3] a [2, 1] jsou viditelné z pozice bodu [3, Tt — 2]?
obraázekje naopak!
Řešení. Jedná se o modelovou úlohu na viditelnost stran konvexního mnohoúhelníku v rovině. V prvním kroku uspořádáme vrcholy tak, aby jejich pořadí odpovídalo směru proti pohybu hodinových ručiček. Když jako první vrchol zvolíme např. A = [—2, —2], je další pořadí B = [2, 1], C = [3, 3], D = [1, 4]. Uvažujme nejprve stranu AB. Ta společně s bodem X = [3, Tt — 2] zadává matici
-2-3 2-3 -2 - (tt - 2) 1 - (tt - 2), tak, že její první sloupec je rozdílem A — X a druhý sloupec je B — X. To, zdaje vidět z bodu [3, Tt — 2], pak určuje znaménko determinantu
-2-3 -2 - (tt - 2)
1
2-3 -(iz-2)
-5
-Tt
■1
Tt
—5 • (3 — tc) — (-1X-77-) < 0. Záporná hodnota znamená, že strana je vidět. Doplňme, že nezáleží na tom, zda uvažujeme rozdíly A — X a B — X, nebo X — A a X — B. Kdybychom však zaměnili pořadí sloupců, příslušná strana by byla vidět právě tehdy, když by byl determinant kladný. Pro stranu BC analogicky obdržíme
1
2-3 - (Tt - 2)
3-3 3 - (Tt - 2) -1 • (5 -Tt)
-1
3-Tt
0 < 0.
0
5 — Tt
Tato strana je tudíž vidět. Zbývají strany CD a D A. Pro ně dostáváme po řadě
3-3 1-3 _0 -2
3 -(tt-2) 4 - (Tt -2) ~~ 5 - Tt 6-Tt 0 - (-2) • (5 - Tt) > 0, 1-3 -2-3 -2 -5
— (Tt —2) — 2 — (Tt — 2) ~ 6 — Tt —Tt -2 ■ (-Tt) - (-5) • (6 - Tt) >0.
Z bodu X jsou tedy vidět právě strany určené dvojicemi vrcholů [-2,-2], [2, 1] a [2, 1], [3, 3]. □
1.96. Uvedte strany pětiúhelníku s vrcholy v bodech [—2, —2], [-2,2], [1,4], [3,1] a [2,-11/6], které je možné vidět z bodu [300, 1].
Řešení. Pro zjednodušení zápisů „tradičně" položme
A = [-2,-2], B = [2, —11/6], C = [3,1], D = [1,4], £" = [-2,2]. Strany BC a CD jsou zjevně z pozice bodu [300, 1] viditelné; naopak strany DE a E A být vidět nemohou. Pro stranu AB raději určeme -2 - 300 2 - 300
1
-302 -(-y)- (-298) -(-3) <0.
Odsud plyne, že tato strana je z bodu [300, 1] vidět.
□
41
F. ZOBRAZENÍ A RELACE
6. RELACE A ZOBRAZENÍ
1.97. Viditelnost stran trojúhelníka. Je dán trojúhelník s vrcholy A = [5, 6], B = [7, 8], C = [5, 8]. Určete, které jeho strany je vidět z bodu P = [0, 1].
Řešení. Uspořádáme vrcholy v kladném smyslu, tedy proti směru hodinových ručiček: [5, 6], [7, 8], [5, 8]. Pomocí příslušných determinantů určíme, je-li bod [0, 1] „nalevo" či „napravo" od jednotlivých stran trojúhelníka uvažovaných jako orientované úsečky,
B - P 1 7
C - P 5 7
A - P 5 5
B - P 7 7
> o,
0.
c
A
P P
< o,
Z nulovosti posledního determinantu vidíme, že body [0, 1], [5, 6] a [7, 8] leží na přímce, stranu A B tedy nevidíme. Stranu BC rovněž tak nevidíme, na rozdíl od strany A C, pro kterou je příslušný determinant záporný. □
1.98. Určete, které strany čtyřúhelníka s vrcholy A = [95, 99], B = [130, 106], C = [40, 60], D = [130, 120]. jsou viditelné z bodu [2, 0].
Řešení. Nejprve je třeba určit strany čtyřúhelníka („správné" pořadí vrcholů): ACBD. Po spočítání příslušných determinantů jako v předchozích příkladech zjistíme, že je vidět pouze strana CB. □
F. Zobrazení a relace
1.99. Rozhodněte, zda následující relace na množině M jsou relace ekvivalence:
i) M = {f : R -> R}, kde (/ ~ g), pokud /(0) = g(0).
ii) M = {f : R -> R}, kde (/ ~ g), pokud /(0) = g(l).
iii) M je množina přímek v rovině, přičemž dvě přímky jsou v relaci, jestliže se neprotínají.
iv) M je množina přímek v rovině, přičemž dvě přímky jsou v relaci, jestliže jsou rovnoběžné.
v) M = N, kde (m ~ n), pokud S(m) + S(n) = 20, přičemž S(n) značí ciferný součet čísla n. 11. 31
vi) M = N, kde (m ~ n), pokud C(m) = C(n), kde C(n) = S(n), pokud je ciferný součet S(n) menší než 10, jinak definujeme C(n) = C(S(n)) (je tedy vždy C(n) < 10).
Řešení.
i) Ano. Ověříme tři vlastnosti ekvivalence:
i) Reflexivita: pro libovolnou reálnou funkci / je /(0) = /(0).
ii) Symetrie: jestliže platí /(0) = g(0), pak i g(0) = f(0).
Speciálním případem relace mezi množinami je zobrazení z množiny A do množiny B. Je to případ, kdy pro každý prvek definičního oboru re-/ lace existuje právě jeden prvek z oboru hodnot, který je s ním v relaci. Nám známým případem zobrazení jsou všechny skalární funkce, kde oborem hodnot zobrazení je množina skalárů, třeba celých nebo reálných čísel. Pro zobrazení zpravidla používáme značení, které jsme také u skalárních funcí zavedli. Píšeme
/:DCA^/CS, f (a) = b
pro vyjádření skutečnosti, že (a, b) patří do relace, a říkáme, že b je hodnotou zobrazení / v bodě a. Dále říkáme, že / je
• zobrazení množiny A do množiny B, jestliže je D = A,
• zobrazení množiny A na množinu B, jestliže je D = A a I = B, často také surjektivní zobrazení
• prosté (často také injektivní zobrazení), jestliže je D = A a pro každé bel existuje právě jeden vzor a e A, f (a) = b.
Vyjádření zobrazení / : A -> B jakožto relace /cAxS, f = {(a, f (a)); a e A} známe také pod názvem graf zobrazení f.
9
1.37. Skládání relací a funkcí. U zobrazení je jasná koncepce, jak se skládají. Máme-li dvě zobrazení f : A ^ B a g : B -> C, pak jejich složení g o f : A -> C je definováno
(g o f)(a) = g(f(a)).
Ve značení používaném pro relace totéž můžeme zapsat jako
/cAxS, / = {{a, f(a))\ a e A} g^BxC, g = {(b, g(b)); b e B} gof^AxC, gof = {(a,g(f(a)));aeA}.
42
KAPITOLA 1. ROZCVIČKA
Zcela obdobně definujeme skládání relací, v předcho-
zích vztazích jen doplníme existenční kvantifikátory, tj. musíme uvažovat všechny „vzory" a všechny „obrazy". Uvažme relace R c A x B, 5 c B x C. Potom S o R c A x C,
5 o i? = {(o, c); 3i e B, (a, b) e i?, (b, c) e 5}.
Zvláštním případem relace je identické zobrazení
iáA = {(a, a) e A x A; a e A]
na množině A. Je neutrální vzhledem ke skládání s každou relací s definičním oborem nebo oborem hodnot A.
iii) Tranzitivita: jestliže platí /(O) = g(0) a §(0) = Ä(0), pak platí i /(O) = A(0).
ii) Ne. Definovaná relace není reflexivní, např pro funkci sin máme sin 0 ^ sin 1 a není ani tranzitivní.
iii) Ne. Relace opět není reflexivní (každá přímka protíná sama sebe) ani tranzitivní.
iv) Ano. Třídy ekvivalence pak tvoří množinu neorientovaných směrů v rovině.
v) Ne. Relace není reflexivní. 5(1) + 5(1) = 2.
vi) Ano.
Pro každou relaci i? c A x S definujeme inverzní relaci R-1 = {(b, a); (a, b) e R] c B x A.
Pozor, u zobrazení, je stejný pojem užíván ve specifičtější situaci. Samozřejmě, že existuje pro každé zobrazení jeho in-vezní relace, ta však nemusí být zobrazením. Zcela logicky proto hovoříme o existenci inverzního zobrazení, pokud každý prvek b e B je obrazem pro právě jeden vzor v A. V takovém případě je samozřejmě inverzní zobrazení právě inverzní relací.
Všimněme si, že složením zobrazení a jeho inverzního zobrazení (pokud obě existují) vždy vznikne identické obražení, u obecných relací tomu tak být nemusí.
1.32 |
1.38. Relace na množině. V případě A = B hovoříme o relaci na množině A. Říkáme, že relace R je:
• reflexivní, pokud iáA c R, t), (a, a) e R pro všechny a e A,
• symetrická, pokud R~l = R, tj. pokud (a,b) e R, pak i (b, a) e R,
□
1.100. Máme množinu {3, 4, 5, 6, 7}. Napište explicitně relaci
i) a dělí b
ii) a dělí b nebo b dělí a
iii) a a b jsou soudělná
1.101. Nechť je na M2 definována relace R tak, že ((a, b), (c, d)) e R pro libovolná a, b, c, d e M, právě když b = d. Zjistěte, zda se jedná o relaci ekvivalence. Pokud jde o relaci ekvivalence, popište geometricky rozklad, který určuje.
Řešení. Z ((a, b), (a, b)) e R pro všechna a, b e M plyne, že relace je reflexivní. Stejně snadno vidíme, že relace je symetrická, neboť v rovnosti (druhých složek) můžeme zaměnit levou a pravou stranu. Je-li ((a, b), (c, d)) e R a ((c, d), (e, /)) e R, tj. platí-li b = d ad = f, lehce dostáváme splnění tranzitivní podmínky ((a, b), (e, /)) e R, tj. b = f. Relace i? je relací ekvivalence, kdy body roviny jsou spolu v relaci, právě když mají stejnou druhou souřadnici (přímka jimi zadaná je kolmá na osu v). Příslušný rozklad proto rozdělí rovinu na přímky rovnoběžné s osou x. □
1.102. Určete, kolik různých binárních relací lze zavést mezi množinou X a množinou všech jejích podmnožin, má-li množina X právě 3 prvky.
Řešení. Nejprve si uvědomme, že množina všech podmnožin X má
23 = 8 prvků, a tudíž její kartézský součin s množinou X má 8 • 3 =
24 prvků. Uvažovanými binárními relacemi jsou právě podmnožiny tohoto kartézského součinu, kterých je celkem 224. □
1.103. Uvedlte definiční obor D a obor hodnot / relace
R = {(a, v), (b, x), (c, x), (c, u), (d, v), (/, y)}
mezi množinami A = {a, b, c, d, e, f) a B = {x, y, u, v, w}. Je relace R zobrazení?
43
F. ZOBRAZENÍ A RELACE
6. RELACE A ZOBRAZENÍ
Řešení. Přímo z definice definičního oboru a oboru hodnot relace dostávame
D = {a,b,c,d, f} C A, I = {x, y,u, v} C B.
Nejedná se o zobrazení, protože (c, x), (c, u) e R, tj. c e D má dva obrazy. □
1.104. O každé z následujících relací na množině {a, b, c, d} rozhodněte, zda se jedná o relaci uspořádání (příp. zda se jedná o úplné uspořádání):
Ra Rh
Rc Rd Re
(a, a), (b, b), (c, c), (d, d), (b, a), (b, c), (b, d)}, (a, a), (b, b), (c, c), (d, d), (d, a), (a, d)}, (a, a), (b, b), (c, c), (d, d), (a, b), (b, c), (b, d)}, (a, a), (b, b), (c, c), (a, b), (a, c), (a, d), (b, c), (b, d), (c, d)}, (a, a), (b, b), (c, c), (d, d), (a, b), (a,c), (a,d), (b, c), (b, d),
(c,d)}.
Řešení. Ra je uspořádání, které není úplné (např. (a, c) £ Ra ani (c, a) £ Ra). Relace Rh není antisymetrická (je totiž (a, d) e Rh i (d, a) e Rh), a tudíž se nejedná o uspořádání (jde o ekvivalenci). Relace Rc a Rd rovněž nejsou uspořádáními, protože nejsou tranzitivní (např. (a,b),(b,c) e Rc, Rd, (a, c) £ Rc, Rd) a dokonce ani reflexivní ({d, d) <£ Rc, (d, d) £ Rd). Relace Re je úplné uspořádání (pokud budeme (a, b) e R interpretovat jako a < b, pak a < b < c < d).
□
1.105. Rozhodněte, zda je zobrazení / injektivní, resp. surjektivní, jestliže
(a) / : Z x Z Z, f((x, y)) = x + y - 10x2;
(b) / : N N x N, f (x) = (2x, x2 + 10) .
Řešení. Ve variantě (a) je uvedeno surjektivní zobrazení (postačuje položit x = 0), které není injektivní (stačí zvolit (x, y) = (0, —9) a (x, y) = (1, 0)). Ve variantě (b) se naopak jedná o injektivní zobrazení (obě jeho složky, tj. funkce y = 2x a y = x2 + 10, jsou evidentně rostoucí na N), které není surjektivní (např. dvojice (1, 1) nemá Wzcíčý.
□
1.106. Stanovte počet zobrazení množiny {1, 2} do množiny {a, b, c}. Kolik z nich je surjektivních a kolik injektivních?
Řešení. Prvku 1 můžeme v rámci zobrazení přiřadit libovolně jeden ze tří prvků a, b, c. Podobně také pro prvek 2 máme tři možnosti. Podle (kombinatorického) pravidla součinu tak existuje celkem 32 zobrazení množiny {1,2} do množiny {a, b, c}. Surjektivní žádné z nich
• antisymetrická, pokud R~l ľ\R c idA, tj. pokud (a,b) e R a zároveň (b, a) e R, pak a = b,
• tranzitivní, pokud R o R c i?, tj. pokud z (a, b) e R a. (b, c) e R vyplývá i (a, c) e R.
Relace se nazývá ekvivalence, pokud je současně reflexivní, symetrická i tranzitivní.
Relace se nazývá uspořádání jestliže je reflexivní, tranzitivní a antisymetrická. Relaci uspořádání obvykle značíme symbolem <, tj. skutečnost, že prvek a je v relaci s prvkem b, značíme a < b.
Zde je dobré si uvědomit, že relace <, tj. „býti ostře menší než", mezi reálnými (racionálními, celými, přirozenými) čísly není relace uspořádání, protože není reflexivní.
Dobrým příkladem uspořádání je inkluze. Uvažme množinu 2A všech podmnožin konečné množiny A (značení je speciálním případem obvyklé notace BA pro množinu všech zobrazení z A do B; prvky množiny 2A jsou tedy zobrazení A -> {0, 1}, které "říkají", zda určitý prvek je či není v dané podmnožině). Na množině 2A máme relaci c danou vlastností „být podmnožinou". Je tedy X c Z právě, když je X podmnožinou v Z. Evidentně jsou přitom splněny všechny tři vlastnosti pro uspořádání: skutečně, je-li X c Y a zároveň Y c X musí být nutně množiny X a Y stejné. Je-li X c Y c Z je také X c Z a také reflexivita je zřejmá.
Říkáme, že uspořádání < na množině A je úplné, když pro každé dva prvky a, b e A platí, že jsou srovnatelné, tj. bud'út < b nebo b < a. Všimněme si, že ne všechny dvojice (X, Y) podmnožin v A jsou srovnatelné v tomto smyslu. Přesněji, pokud je v A více než jeden prvek, existují podmnožiny X a Y, kdy není ani X c Y ani ľcl
Připomeňme rekurentní definici přirozených čísel N = {0, 1,2,3, ...}, kde
0 = 0, n + 1 = {0, 1,2, ...,n}.
Na této množině N definujeme relaci < následovně: m < n, právě když m e n nebo m = n. Evidentně jde o úplné uspořádání. Např. 2 < 4, protože
2 = {0, {0}} s {0, {0}, {0, {0}}, {0, {0}, {0, {0}}}} = 4.
Jinak řečeno, samotná rekurentní definice zadává vztah n < n + 1 a tranzitivně pak n < k pro všechna k, která jsou tímto postupem definována později.
1.39. Rozklad podle ekvivalence. Každá ekvivalence R na množině A zadává zároveň rozklad množiny \>, A na podmnožiny vzájemně ekvivalentních prvků, tzv. třídy ekvivalence. Pro libovolné a e A uvažujeme třídu (množinu) prvků, které jsou ekvivalentní s prvkem a, tj.
Ra = {b e A; (a,b) e R}.
Často budeme psát pro Ra prostě [a], je-li z kontextu zřejmé, o kterou ekvivalenci jde.
44
KAPITOLA 1. ROZCVIČKA
Zjevně Ra = Rh, právě když (a, b) e R a každá taková třída ekvivalence je tedy reprezentována kterýmkoliv svým prvkem, tzv. reprezentantem. Zároveň Ra n Rh ^ 0, právě když Ra = Rh, tj. třídy ekvivalence jsou po dvou disjunktní. Konečně, A = UaeARa, tj. celá množina A se skutečně rozloží na jednotlivé třídy.
Můžeme také třídám rozkladu rozumět tak, že třídu [a] vnímáme jako prvek a „až na ekvivalenci".
1. 34
1.40. Konstrukce celých a racionálních čísel. Na přiroze-jf< ,. ných číslech umíme sice sčítat a víme, že přičtením "u!% nuly se číslo nezmění. Umíme i definovat odečítání, <\Zífe- při něm ale jen někdy existuje výsledek v množině
' P 1 N.
Základní ideou konstrukce celých čísel z přirozených je tedy přidat k nim chybějící rozdíly. To můžeme udělat tak, že místo výsledku odečítání budeme pracovat s uspořádanými dvojicemi čísel, které nám samozřejmě vždy výsledek dobře reprezentují. Zbývá jen dobře definovat, kdy jsou (z hlediska výsledku odečítání) takové dvojice ekvivalentní. Potřebný vztah tedy je:
(a,b) ~ (a',b') <í=^ a-b=a'-ť <í=^ a+ť = a'+b.
Všimněme si, že zatímco výrazy v prostřední rovnosti v přirozených číslech neumíme, výrazy vpravo už ano. Snadno ověříme, že skutečně jde o ekvivalenci a její třídy označíme jako celá čísla Z. Na nich definujeme operaci sčítání (a s ní i odečítání) pomocí reprezentantů. Např.
[(a,b)] + [(c,d)] = [(a + c,b + d)],
což zjevně nezávisí na výběru reprezentantů.
Lze si přitom vždy volit reprezentanty (a, 0) pro kladná čísla a reprezentanty (0,a) pro čísla záporná, se kterými se nám bude patrně počítat nejlépe.
Tento jednoduchý příklad ukazuje, jak důležité je umět nahlížet na třídy ekvivalence jako na celistvý objekt a soustředit se na vlastnosti těchto objektů, nikoliv formální popisy jejich konstrukcí. Ty jsou však důležité k ověření, že takové objekty vůbec existují.
U celých čísel nám už platí všechny vlastnosti skalárů (KG1)-(KG4) a (01)-(04), viz odstavce 1.1 a 1.3. Pro násobení je neutrálním prvkem jednička, ale pro všechna čísla a různá od nuly a jedničky neumíme najít číslo a~l s vlastností a ■ a~l = 1, tzn. chybí nám inverzní prvky pro násobení.
Zároveň si povšimněme, že platí vlastnost oboru integrity (Ol), viz 1.3, tzn. je-li součin dvou čísel nulový, musí být alespoň jedno z nich nula.
Díky poslední jmenované vlastnosti můžeme zkonstruovat racionální čísla Q přidáním všech chybějících inverzí zcela obdobným způsobem, jak jsme konstruovali Z z množiny N. Na množině uspořádaných dvojic (p, ä), q ^ 0, celých čísel definujeme relaci ~ tak, jak očekáváme, že se
být nemůže, neboť konečná množina {a, b, c} má více prvků než množina {1, 2}. Při libovolném zobrazení prvku 1 (tři možnosti) obdržíme injektivní zobrazení, právě když prvek 2 zobrazíme na jiný prvek (dvě možnosti). Vidíme tedy, že injektivních zobrazení množiny {1,2} do množiny {a, b, c} je 6. □
1.107. Určete počet injektivních zobrazení množiny {1,2,3} do množiny {1, 2, 3, 4}.
Řešení. Libovolné injektivní zobrazení mezi uvažovanými množinami je dáno výběrem (uspořádané) trojice z množiny {1,2,3,4} (prvky ve vybrané trojici budou po řadě obrazy čísel 1, 2, 3) a obráceně každé injektivní zobrazení nám zadává takovou trojici. Je tedy hledaných injektivních zobrazení stejně jako možností výběru uspořádaných trojic ze čtyř prvků, tedy v(3, 4) = 4 • 3 • 2 = 24. □
1.108. Určete počet surjektivních zobrazení množiny {1, 2, 3, 4} na množinu {1, 2, 3}.
Řešení. Hledaný počet určíme tak, že od počtu všech zobrazení odečteme ta, která nejsou surjektivní, to jest ta, jejichž obor hodnot je buď jednoprvkovou nebo dvouprvkovou množinou. Všech zobrazení je V(3, 4) = 34, zobrazení, jejichž oborem hodnot je jednoprvková množina, jsou tři. Počet zobrazení, jejichž oborem hodnot je dvouprvková množina, je (^) (24 — 2) ((^) způsoby můžeme vybrat obor hodnot a máme-li již dva prvky fixovány, máme 24 — 2 možností, jak na ně zobrazit čtyři prvky). Celkem je tedy počet hledaných surjektivních zobrazení
(1.3) 34- Q(24 - 2)- 3 = 36.
□
1.109. Určete počet surjektivních zobrazení / množiny {1,2,3,4,5} na množinu {1,2,3} takových, že /(l) = f (2).
Řešení. Každé takové zobrazení je jednoznačně dáno obrazem prvků {1, 3, 4, 5}, těchto zobrazení je tedy přesně tolik, kolik je zobrazení surjektivních zobrazení množiny {1, 3, 4, 5} na množinu {1, 2, 3}, tedy 36, jak víme z předchozího příkladu. □
1.110. Hasseův diagram uspořádání. Hasseův diagram daného uspořádání < na n -prvkové množině M je diagram s n vrcholy (každý vrchol odpovídá právě jednomu prvku množiny), přičemž dva vrcholy (prvky) a, b jsou spojeny (víceméně svislou) čarou (tak, že a je „dole" a b „nahoře"), právě když b pokrývá a,t\. a < ba. neexistuje c e M tak, že a < c & c < b.
45
F. ZOBRAZENÍ A RELACE
6. RELACE A ZOBRAZENÍ
1.111. Určete počet relací uspořádání na čtyřprvkové množině.
Řešení. Postupně projdeme všechny možné Hasseovy diagramy uspořádání na nějaké čtyřprvkové množině M a spočítáme, kolik různých uspořádání (tj. podmnožin množiny M x M) má daný Hasseův diagram, viz obr.:
A
1 - v 1 f\ f
.i \ k 1
\ / } A i 0
i T
1. 35
'V 1 i
Celkem tedy je 219 uspořádání na čtyřprvkové množině. □
1.112. Určete počet relací uspořádání množiny {1, 2, 3, 4, 5} takových, že právě dvě dvojice prvků jsou nesrovnatelné.
1.113. Vypište všechny relace na dvouprvkové množině {1,2}, jež současně nejsou reflexivní, jsou symetrické a nejsou tranzitivní.
Řešení. Reflexní relace jsou právě ty, které obsahují obě dvojice (1, 1), (2, 2). Tím jsme vyloučili relace
{(1,1), (2, 2)}, {(1,1), (2, 2), (1,2)}, {(1,1), (2, 2), (2,1)},
{(1,1), (2, 2), (1,2), (2, 1)}.
Zbývající relace, které jsou symetrické a nejsou tranzitivní, musejí obsahovat (1, 2), (2, 1). Pokud taková relace obsahuje jednu z těchto dvou uspořádaných dvojic, musí obsahovat rovněž druhou (podmínka symetrie). Kdyby neobsahovala ani jednu z těchto dvou uspořádaných dvojic, pak by očividně byla tranzitivní. Z celkového počtu 16 relací na dvouprvkové množině jsme tak vybrali
{(1,2), (2,1)}, {(1,2), (2,1), (1,1)}, {(1,2), (2,1), (2, 2)}.
Je vidět, že každá z těchto 3 relací není reflexivní, je symetrická a není tranzitivní. □
1.114. Určete počet relací ekvivalence na množině {1, 2, 3, 4}.
Řešení. Ekvivalence můžeme počítat podle toho, kolik prvků mají jejich třídy rozkladu. Pro počty prvků tříd rozkladu ekvivalencí na čtyřprvkové množině jsou tyto možnosti:
Počty prvků ve třídách rozkladu počet ekvivalencí daného typu
1,1,1,1 1
2,1,1 (t)
2,2
3,1 (í)
4 1
mají chovat podíly p/q:
(p, q) ~ (//, q') p/q = p'/q' p ■ q' = p' ■ q.
Opět neumíme očekávané chování v prostřední rovnosti v množině Z formulovat, nicméně rovnost na pravé straně ano. Zjevně jde o dobře definovanou relaci ekvivalence (ověřte podrobnosti!) a racionální čísla jsou pak její třídy ekvivalence. Když budeme formálně psát p/q místo dvojic (p, q), budeme definovat operace násobení a sčítání právě pomocí formulí, které nám jsou jistě dobře známy.
1.41. Zbytkové třídy. Jiným dobrým a jednoduchým pří-fáftj^ kladem jsou tzv. zbytkové třídy celých čísel. ^ Pro pevně zvolené přirozené číslo k definujeme ekvivalenci ~k tak, že dvě čísla a, b e Z jsou ekvivalentní, jestliže jejich zbytek po dělení číslem k je stejný. Výslednou množinu tříd ekvivalence označujeme Zjfc. Nejjednodušší je tato procedura pro k = 2. To dostáváme Z2 = {0, 1}, kde nula reprezentuje sudá čísla, zatímco jednička čísla lichá. Opět lze snadno zjistit, že pomocí reprezentantů můžeme koerektně definovat násobení a sčítání na každém Z^.
Věta. Zbytkové třídy Zj- jsou komutativním tělesem skalárů (tj. splňují i vlastnost (P) z odstavce 1.3), právě když je k prvočíslo.
Pokud k prvočíslem není, obsahuje Z vždy dělitele nuly, není proto ani obor integrity.
Důkaz. Okamžitě je vidět druhé tvrzení — jestliže x ■ y = k pro přirozená čísla x, y, pak samozřejmě je výsledek násobení příslušných tříd [x] ■ [y] nulový.
Naopak, jsou-li x a k nesoudělná, existují podle tzv. Bez-outovy rovnosti, kterou dovodíme později (viz ??) přirozená čísla a a b splňující
a x + b k = 1, což pro odpovídající třídy ekvivalence dává
[a] ■ [x] + [0] = [a] ■ [x] = [1] a proto je [a] inverzním prvkem k [jc]. □
46
KAPITOLA 1. ROZCVIČKA
Celkem tedy máme 15 různých ekvivalencí. □
Poznámka. Obecně počet tříd rozkladu n -prvkové množiny udává Bellovo číslo Bn+k, pro které lze odvodit rekurentní formuli
n
Bn + \ = J2 (k)Bk-
1.115. Kolik existuje relací na rc-prvkové množině?
Řešení. Relace je libovolná podmnožina kartézského součinu množiny se sebou samou. Tento kartézský součin má n2 prvků, a je
2
tedy počet všech relací na n -prvkové množině 2" . □
1.116. Kolik existuje reflexivních relací na rc-prvkové množině?
Řešení. Relace na množině M je reflexivní, právě když je diagonální relace AM = {(a, a), kde a e M} její podmnožinou. U zbylých n2—n uspořádaných dvojic v kartézském součinu M x M máme nezávislou volbu, jestli daná dvojice v dané relaci bude či ne. Celkem tedy máme
2
2" ~" různých reflexivních relací na n -prvkové množině. □
1.117. Kolik existuje symetrických relací na rc-prvkové množině?
Řešení. Relace na množině M je symetrická, právě když je její průnik s každou množinou {(a, b), (b, a), kde a ^ b, a, b e M} buď celá daná dvouprvková množina, nebo je tento průnik prázdný. Dvouprvkových podmnožin množiny M je (^) a pokud kromě průniků s těmito množinami ještě určíme průnik dané relace s diagonální relací AM = {(a, a), kde a e M}, je tímto daná relace jednoznačně určena. Celkem můžeme provést ("2) + n nezávislých voleb mezi dvěma alternativami: každá množina typu {(a, b), (b, a)\kde a, b e M, a ^ b} je buď podmnožinou dané relace, nebo ani jeden z jejich prvků v dané relaci neleží a každá dvojice (a, a), a e M, potom také buď v relaci leží nebo ne. Celkem tedy máme 2^)+n symetrických relací na n -prvkové množině. □
1.118. Kolik existuje antisymetrických relací na rc-prvkové množině?
Řešení. Relace na množině M je antisymetrická, právě když její průnik s každou množinou {(a, b), (b, a)} a ^ b, a, b e M není dvoj-prvkový (jsou tedy tři možnosti jak průnik vypadá, buďje to množina {(a,b)}, nebo {(b,a)}, nebo je průnik prázdný). Průnik s diagonální relací pak může být libovolný. Určením těchto všech průniků je relace jednoznačně určena. Celkem máme 3^2" antisymetrických relací na n -prvkové množině. □
1.119. Určete počet relací na množině {1,2,3,4}, které jsou současně symetrické i tranzitivní.
1.120. Určete počet relací uspořádání na tříprvkové množině.
47
F. ZOBRAZENÍ A RELACE
6. RELACE A ZOBRAZENÍ
1.121. Určete počet relací uspořádání na množině {1, 2, 3, 4} takových, že prvky 1 a 2 jsou nesrovnatelné (tedy neplatí 1 < 2 ani 2 < 1, kde < je označení uvažované relace uspořádání).
1.122. Nechť pro libovolná celá čísla k, l platí (k,l) e R právě tehdy, když je číslo 4k — 41 celočíselným násobkem 7. Je takto zavedená relace R ekvivalence, uspořádání?
Řešení. Uvědomme si, že dvě celá čísla jsou spolu v relaci R, právě když dávají stejný zbytek po dělení 7. Jde tedy o příklad tzv. zbytkové třídy celých čísel. Proto víme, že relace R je relací ekvivalence. Její symetrie (např. (3, 10), (10, 3) e Ä, 3 / 10) pak implikuje, že se nejedná o uspořádání. □
1.123. Nechť je na množině N = {3, 4, 5, ... ,n,n + 1, ...} definována relace R tak, že dvě čísla jsou v relaci, právě když jsou nesoudělná (tedy neobsahuje-li prvočíselný rozklad uvažovaných dvou čísel ani jedno stejné prvočíslo). Zjistěte, zdaje tato relace reflexivní, symetrická, antisymetrická, tranzitivní.
Řešení. Pro dvojici stejných čísel platí, že (n,n) <£ R. Nejedná se tedy o reflexivní relaci. Být „soudělný" nebo „nesoudělný" pro dvojici čísel z je zřejmě vlastnost neuspořádané dvojice - nezávisí na uvedeném pořadí uvažovaných čísel, a proto je relace R symetrická. Ze symetrie relace R plyne, že není antisymetrická (např. (3,5) e R, 3 ^ 5). Neboť je i? symetrická a (n, n) £ R pro libovolné číslo n e N, volba dvou různých čísel, která jsou spolu v této relaci, dává, že R není tranzitivní.
□
48
KAPITOLA 1. ROZCVIČKA
G. Doplňující příklady k celé kapitole
Vidíme tedy, že již hledání odmocnin nás nutí k rozšíření racionálních čísel na reálná. Jako cvičení si dokažte
1.124. Nechť t a m jsou kladná celá čísla. Ukažte, že číslo ^ft je buďpřirozené, nebo není racionální.
1.125. Setkání se zúčastnilo šest mužů. Pokud si všichni navzájem potřásli rukama, vyčíslete počet potřesení.
Řešení. Počet potřesení rukou zřejmě odpovídá počtu způsobů, jak lze vybrat neuspořádanou dvojici ze 6 prvků, tj. výsledek je c (6, 2) = (^) = 15. □
1.126. Určete, kolika způsoby lze z 15 poslanců vybrat čtyřčlennou komisi, není-li možné, aby jistí 2 poslanci pracovali spolu.
Řešení. Výsledek je
= 1287.
Obdržíme ho tak, že nejprve určíme počet všech možných výběrů čtyřčlenné komise, potom od něj odečteme počet těch výběrů, kdy oba zmínění poslanci budou vybráni (v takovém případě vybíráme pouze 2 další členy komise ze 13 poslanců). □
1.127. Kolika způsoby můžeme rozdělit 8 žen a 4 muže do 2 šestičlenných skupin (v nichž nerozlišujeme pořadí - jsou neuspořádané) tak, aby v obou skupinách byl alespoň 1 muž?
Řešení. Rozdělení 12 osob do 2 šestičlenných skupin bez jakýchkoli podmínek je dáno libovolným
6 j způsoby. Skupiny ale nejsou rozlišitelné (nevíme, která z nich je první), a proto je počet všech možných rozdělení ^ • (12). V (^j případech pak budou všichni muži v jedné skupině (volíme 2 ženy z 8, které skupinu doplní). Správná odpověď j e tudíž
\ ■ O - 0 = 434-
□
1.128. Jaký je počet čtyřciferných čísel složených z číslic 1, 3, 5, 6, 7 a 9, ve kterých se žádná z cifer neopakuje?
Řešení. K dispozici máme šest různých číslic. Ptáme se: Kolik různých uspořádaných čtveřic z nich můžeme vybrat? Výsledek je proto v (6, 4) = 6 • 5 • 4 • 3 = 360. □
1.129. Řecká abeceda se skládá z 24 písmen. Kolik různých slov majících právě pět písmen z ní lze utvořit? (Bez ohledu na to, zda tato slova mají nějaký jazykový význam.)
Řešení. Pro každou z pěti pozic ve slově máme 24 možností, neboť písmena se mohou opakovat. Výsledek je tedy V (24, 5) = 245. □
49
G. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE
6. RELACE A ZOBRAZENÍ
1.130. K vytrvalostnímu závodu, v němž běžci vybíhají jeden po druhém s danými časovými odstupy, se přihlásilo k závodníků, mezi nimi také tři kamarádi. Stanovte počet startovních listin, v rámci kterých žádní dva z trojice kamarádů nestartují těsně po sobě. Pro jednoduchost uvažujte k > 5.
Řešení. Ostatních k — 3 závodníků můžeme seřadit (k — 3)! způsoby. Pro uvažované tři kamarády pak máme k — 2 míst (začátek, konec a k — 4 mezer), na které je můžeme rozmístit v (k — 2, 3) způsoby. Podle (kombinatorického) pravidla součinu je tak výsledek
(k - 3)! • (k - 2) ■ (k - 3) • (k - 4) = (k - 2)! ■ (k - 3) ■ (k - 4).
□
1.131. Turnaje se zúčastní 32 lidí. Podle požadavků organizátorů se musí libovolným způsobem rozdělit do čtyř skupin tak, aby první skupina měla 10 účastníků, druhá 8, třetí také 8 a poslední čtvrtá potom 6. Kolika způsoby se mohou takto rozdělit?
Řešení. Můžeme si představit, že z 32 účastníků vytvoříme řadu, kdy prvních 10 utvoří první skupinu, dalších 8 druhou atd. Celkem můžeme účastníky seřadit 32! způsoby. Uvědomme si ovšem, že na rozdělení do skupin nemá vliv, když zaměníme pořadí osob, které patří do stejné skupiny. Proto je počet navzájem různých rozdělení roven
P(10,8,8,6) = Mf^.
□
1.132. Je potřeba ubytovat 9 osob v jednom čtyřlůžkovém, jednom třílůžkovém a jednom dvoulůžkovém pokoji. Zjistěte, kolika způsoby to lze provést.
Řešení. Jestliže např. hostům ve čtyřlůžkovém pokoji, přiřadíme číslici 1, v třílůžkovém pokoji číslici 2 a v dvoulůžkovém číslici 3, pak vytváříme permutace s opakováním ze tří prvků 1, 2, 3, v nichž jednička se vyskytuje čtyřikrát, dvojka třikrát a trojka dvakrát. Příslušný počet permutací je
/> (4, 3, 2) = db = 1260.
□
1.133. Určete počet způsobů, jak lze rozdělit mezi tři osoby A, S a C 33 různých mincí tak, aby osoby A a S měly dohromady právě dvakrát více mincí, než má osoba C.
Řešení. Ze zadání vyplývá, že osoba C má obdržet 11 mincí. To lze provést ^) způsoby. Každou ze zbývajících 22 mincí může získat osoba A nebo B, což dává 222 možností. Z (kombinatorického) pravidla součinu plyne výsledek (") • 222. □
1.134. Kolika způsoby můžete mezi 4 chlapce rozdělit 40 stejných kuliček?
Řešení. Přidejme ke 40 kuličkám troje zápalky. Poskládáme-li kuličky a zápalky do řady, rozdělí zápalky kuličky na 4 úseky. Náhodně seřaďme chlapce. Dáme-li prvnímu chlapci všechny kuličky z prvního úseku, druhému chlapci všechny kuličky z druhého úseku atd., je již vidět, že všech rozdělení je právě (433) = 12 341. □
50
KAPITOLA 1. ROZCVIČKA
1.135. Podle kvality dělíme výrobky do skupin I, 77, 7/7, IV. Zjistěte počet všech možných rozdělení 9 výrobku do těchto skupin, která se liší počtem výrobků v jednotlivých skupinách.
Řešení. Zapisujeme-li přímo uvažované devítičlenné skupiny z prvků I, II, III, IV, vytváříme kombinace s opakováním deváté třídy ze čtyř prvků. Počet takových kombinací je (12) = 220. □
1.136. Kolika způsoby mohla skončit tabulka první fotbalové ligy, víme-li o ní pouze, že alespoň jeden z týmů z dvojice Ostrava, Olomouc je v tabulce za týmem Brna (ligu hraje 16 mužstev).
Řešení. Nejprve určíme tři místa, na kterých se umístily celky Brna, Olomouce a Ostravy. Ty lze vybrat c(3, 16) = (g6) způsoby. Z šesti možných pořadí zmíněných tří týmů na vybraných třech místech vyhovují podmínce ze zadání čtyři. Pro libovolné pořadí těchto týmů na libovolně vybraných třech místech pak můžeme nezávisle volit pořadí zbylých 13 týmů na ostatních místech tabulky. Podle pravidla součinu je tedy hledaný počet tabulek roven
,\
1 - 4- 13! = 13948526592000.
□
1.137. Kolik je možných uspořádání (v řadě) na fotce volejbalového týmu (6 hráčů), když
i) Gouald a Bamba chtějí stát vedle sebe
ii) Gouald a Bamba chtějí stát vedle sebe a uprostřed
iii) Gouald a Kamil nechtějí stát vedle sebe
Řešení.
i) Goualda a Bambu můžeme v tomto případě počítat za jednoho, rozlišíme jen jak stojí vzájemně. Máme 2.5! = 240 pořadí.
ii) Tady je to podobnéjen pozice Goualda a Bamby je pevně daná. Dostáváme 2.4! = 48 možností.
iii) Nejjednodušší je asi odečíst případy, kdy stojí vedle sebe (viz (i)) od všech pořadí. Dostaneme 6! - 2.5! = 720 - 240 = 480.
□
1.138. Házení mincí. Šestkrát hodíme mincí.
i) Kolik je všech různých posloupností panna, orel
ii) Kolik je takových, že padnou právě čtyři panny.
iii) Kolik je takových, že padnou aspoň dvě panny.
1.139. Kolik existuje přesmyček slova BAZILIKA takových, že se v nich střídají souhlásky a samohlásky?
Řešení. Protože souhlásky i samohlásky jsou v daném slově čtyři, tak se v každé takové pře-smyčce střídají pravidelně souhlásky a samohlásky. Slovo tedy může být typu BABABABA nebo ABABABAB. Na daných čtyřech místech můžeme pak samohlásky permutovat mezi sebou (P0(2, 2) = způsoby) a nezávisle na tom i souhlásky (4! způsoby). Hledaný počet je pak dle pravidla součinu 2 • 4! • ^rr = 288. □
51
G. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE
6. RELACE A ZOBRAZENÍ
1.140. Kolika způsoby lze rozdělit 9 děvčat a 6 chlapců do dvou skupin tak, aby každá skupina obsahovala alespoň dva chlapce?
Řešení. Rozdělíme zvlášť děvčata a chlapce: 29(25 — 7) = 12800. □
1.141. Materiál je tvořen pěti vrstvami, každá z nich má vlákna v jednom z daných šesti směrů. Kolik takových materiálů existuje? Kolik je jich takových, že dvě sousední vrstvy nemají vlákna ve stejném směru?
Řešení. 65 a 6 -55. □
1.142. Na kružnici stojí n pevností (n > 3), očíslovaných po řadě čísly 1,..., n. V jeden okamžik
f., každá vystřelí na jednu ze dvou sousedních (pevnost 1 sousedí s pevností n). Označme P(n) počet možných výsledků střelby (za výsledek střelby považujeme množinu čísel právě těch x pevností, které byly při střelbě zasaženy, nerozlišujeme přitom mezi jedním a dvěma zásahy). Dokažte, že P(n) & P(n + 1) jsou nesoudělná.
Řešení. Označíme-li zasažené pevnosti černým kolečkem a nezasažené bílým, úloha je ekvivalentní úloze určit počet všech možných obarvení n koleček, umístěných na kružnici, černou a bílou barvou tak, aby nebyla žádná dvě bílá kolečka „objedno". Pro lichá n je tento počet roven počtu K(n) obarvení černou a bílou barvou tak, aby žádná dvě bílá kolečka nestála vedle sebe (přečíslujeme pevnosti tak, že začneme u kolečka 1 a číslujeme popořadě vzestupně po lichých číslech a poté vzestupně po sudých). V případě sudého n je tento počet roven K(n/2)2, kvadrátu počtu obarvení n/2 koleček na obvodu kruhu tak, aby žádná dvě bílá nestála vedle sebe (barvíme nezávisle kolečka na lichých a na sudých pozicích).
Pro K(n) snadno odvodíme rekurentní formuli K(n) = K(n — 1) + K(n — 2). Navíc snadno spočteme, že K(2) = 3, K(3) = 4, K(4) = 7, tedy K(2) = F(4) - F(0), K(3) = F(5) -K(4) = F(6) — F(2) a indukcí snadno dokážeme K(n) = F(n +2) — F(n — 2), kde F(n) značí n-tý člen Fibonacciho posloupnosti (F(0) = 0, F(l) = F(2) = 1). Navíc protože (K(2), K(3)) = 1, máme pro n > 3 obdobně jako u Fibonacciho posloupnosti
(K(n), K(n - 1)) = (K(n) - K(n - 1), K(n - 1)) = = (K(n-2), K(n-!)) = ■■■ = 1.
Ukážeme nyní, že pro každé sudé n = 2a je P(n) = K(a)2 nesoudělné jak s + 1) = K(2a + 1), tak s P(n — 1) = K(2a — 1). K tomu stačí následující: pro a > 2 je totiž
(K(a), K(2a + 1)) = (K(a), F(2)K(2a) + F(l)K(2a - 1)) =
= (K(a), F(3)K(2a - 1) + F(2)K(2a -2) = ...
= (K(a), F(a + l)K(a + 1) + F(a)K(a)) =
= (K(a), F(a + 1)) = (F(a + 2) - F(a - 2), F(a + 1)) =
= (F(a +2) - F(a + 1) - F(a - 2), F(a + 1)) =
= (F(a) - F(a -2), F(a + 1)) =
= (F(a - 1), F(a + 1)) = (F(a - 1), F (a)) = 1 (K(a), K(2a - 1)) = (K(a), F(2)K(2a - 2) + F(l)K(2a - 3)) =
= (K(a), F(3)K(2a - 3) + F(2)K(2a - 4)) =
52
KAPITOLA 1. ROZCVIČKA
= • • • = (K(a), F(a)K(a) + F (a - l)K(a - 1)) =
= (K(a), F (a - 1)) = (F(a + 2) - F (a - 2), F (a - 1)) =
= (F (a + 2) - F (a), F (a - 1)) =
= (F (a + 2) - F (a + 1), F (a - 1)) = (F (a), F (a - 1)) = 1. Tím je tvrzení dokázáno. □
1.143. Kolik peněz naspořím na stavebním spoření za pět let, vkládám-li 3000 Kč měsíčně (vždy k 1. v měsíci), vklad je úročen roční úrokovou mírou 3% (úročení probíhá jednou za rok) a od státu obdržím ročně příspěvek 1500 Kč (státní příspěvek se připisuje vždy až 1. května následujícího roku)?
Řešení. Označme množství naspořených peněz po n-tém roce jako xn. Potom dostáváme (pro n > 2) následující rekurentní formuli (navíc předpokládáme, že každý měsíc je přesně dvanáctina roku)
xn+i = 1, 03(x„) + 36000 + 1500+
0, 03 • 3000 (\ + li + ... + Jľj + V 12 12/
•-v-'
úroky z vkladů za aktuální rok
+ 0,03• 1 •1500
úrok ze státního příspěvku připsaného v aktuálním roce = 1, 03(jc„) + 38115.
Tedy
n-2
x„ = 38115 J](l, 03)'' + (1, 03)"-1jci + 1500,
i=0
přičemž xx = 36000 + 0, 03 • 3000 (l + n + • • • + n) = 36585, celkem
/(1,03)4-1\ , x5 = 38115 í Q3-j +(1,03)4-36585 + 1500 = 202136.
□
1.144. Poznámka. Ve skutečnosti úročení probíhá podle počtu dní, které jsou peníze na účtu. Obstarejte si skutečný výpis ze stavebního spoření, zjistěte si jeho úročení a zkuste si spočítat připsané úroky za rok. Porovnejte je se skutečně připsanou sumou. Počítejte tak dlouho, dokud sumy nebudou souhlasit...
1.145. Na kolik maximálně částí dělí rovinu n kružnic?
Řešení. Pro maximální počet pn oblastí, na které dělí rovinu kružnice odvodíme rekurentní vzorec
pn+1 = pn + 2n.
Všimněme si totiž, že (n + l)-ní kružnice protíná n předchozích maximálně v 2n průsečících (a tato situace skutečně může nastat).
53
G. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE
6. RELACE A ZOBRAZENÍ
Navíc zřejmě pi = 2. Pro počet pn tedy dostáváme
p„ = pn-i + 2(n - 1) = p„-2 + 2(n - 2) + 2(n - 1) = ...
n-l
= pi + 2i = n2 — n + 2.
□
1.146. Na kolik nejvýše částí dělí třírozměrný prostor n rovin?
Řešení. Označme hledaný počet r„. Vidíme, že r0 = 1. Podobně jako příkladu (1.40) uvažujme, že máme v prostoru n rovin, přidejme jednu další a ptejme se, kolik nejvýše částí prostoru přibude. Opět to bude přesně tolik, kolika původními částmi prostoru přidaná rovina prochází. Kolik to může být? Počet částí prostoru, kterými (n + l)-ní rovina prochází je roven počtu částí, na které je přidaná (n + l)-ní rovina rozdělena průsečnicemi s n rovinami, které v prostoru již byly rozmístěny. Těchto částí však může být podle předchozího příkladu nejvýše 1/2 • (n2 + n + 2), dostáváme tak rekurentní formuli
n2 +n +2
fn + l = f n H--^-'
Danou rovnici opět můžeme vyřešit přímo:
(n - l)2 + (n - 1) + 2 n2 - n + 2 rn = r„_i H---- = r„_i H---- =
(n - l)2 - (n - 1) + 2 n2 -n+2 = r„_2 +---+ ^- =
n2 (n — l)2 n (n — 1)
= r„_2 + — +---------- + 1 + 1 =
2 2 2 2
, n2 (n - l)2 (n - 3)2 n (n-l) (n - 2) " r""3 + 2+2 + 2 2 2 2 +
+ 1 + 1 + 1 =
j h Y n n
/ — 1 i — l i — l
n (n + l)(2n + 1) n (n + 1)
= 1 H-----h n =
12 4
54
KAPITOLA 1. ROZCVIČKA
n3 + 6n + 5 6 '
kde jsme použili známého vztahu
n (n + í)(2n + 1)
,-2
i = l
který lze snadno dokázat matematickou indukcí.
□
1.147. Na kolik maximálně částí dělí trojrozměrný prostor n koulí?
1.148. Na kolik částí dělí prostor n navzájem různých rovin, které všechny prochází jedním daným bodem?
Řešení. Pro hledaný počet xn odvodíme rekurentní formuli
x„ = x„_! + 2(n - 1),
dále %\ = 2, tedy
x„ = n(n — 1) + 2.
□
1.149. Z balíčku 52 karet náhodně vybereme 16 karet. Vyjádřete pravděpodobnost, že vybereme právě 10 červených a 6 černých karet.
Řešení. Nejdříve si uvědomme, že nemusíme zohledňovat pořadí výběru karet. (Ve výsledném zlomku bychom uspořádané výběry získali tak, že bychom číslem 16! vynásobili čitatele i jméno-
16j. Podobně je počet všech
možných výběrů 10 karet z 26 roven (2^) a 6 karet z 26 pak (26). Neboť vybíráme nezávisle na sobě 10 karet z 26 červených a 6 karet z 26 černých, užití (kombinatorického) pravidla součinu dává výsledek
=o, 118.
□
1.150. V urně je 7 bílých, 6 žlutých a 5 modrých koulí. Vylosujeme (bez vracení) 3 koule. Určete pravděpodobnost, že právě 2 jsou bílé.
Řešení. Celkem máme (7+3+5) způsobů, jak lze vybrat 3 koule. Vylosovat právě 2 bílé umožňuje Q výběrů bílých a současně výběrů zbylé (třetí) koule. Podle pravidla součinu je tak počet způsobů, jak lze vylosovat právě 2 bílé, roven Q • Odsud již plyne výsledek
^ = 0, 283.
□
55
G. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE
6. RELACE A ZOBRAZENÍ
1.151. Z karetní hry o 108 kartách (2 x 52 + 4 žolíci) bez vracení vybereme 4 karty. Jaká je pravděpodobnost, že aspoň jedna z nich je eso nebo žolík?
Řešení. Lehce můžeme určit pravděpodobnost opačného (komplementárního) jevu znamenajícího, že ve vybrané čtveřici není žádná z 12 uvažovaných karet (8 es a 4 žolíků). Tato pravděpodobnost je dána poměrem počtu výběrů 4 karet z 96 a počtu výběrů 4 karet ze 108, tj. je rovna (^f)/^8)- Opačný jev má tudíž pravděpodobnost
(96)
1-^= 0, 380.
□
1.152. Při házení kostkou padla jedenáctkrát po sobě čtyřka. Uvedie pravděpodobnost, že padne podvanácté.
Řešení. Předchozí výsledky (podle našich předpokladů) nijak neovlivňují, co padne na kostce při dalších hodech. Proto je hledaná pravděpodobnost 1 /6. □
1.153. Z balíčku 32 karet náhodně vypadne 6 karet. Jaká je pravděpodobnost, že jsou všechny téže barvy?
Řešení. K tomu, abychom získali výsledek
= 1,234- 10"4,
stačí nejprve zvolit jednu ze 4 barev a uvědomit si, že existuje (j!) způsobů, jak vybrat 6 karet z 8 této barvy. □
1.154. Tři hráči dostanou po 10 kartách a 2 zbudou (z balíčku připraveného na mariáš nebo prší -32 karet, z toho 4 esa). Je pravděpodobnější, že někdo dostane listovou sedmu, osmu a devítku, nebo to, že zbyla dvě esa?
Řešení. Protože pravděpodobnost, že nějaký z hráčů dostane uvedené tři karty, je rovna hodnotě
zatímco pravděpodobnost, že zbudou dvě esa, je rovna číslu
(?)'
je pravděpodobnější, že nějaký z hráčů dostal zmíněné tři karty. Poznamenejme, že dokázat nerovnost
Q (?)
lze úpravou obou jejích stran, kdy opakovaným krácením (po vyjádření kombinačních čísel dle definice) lehce dostaneme 6 > 1. □
1.155. Hodíme n kostkami. Jaká je pravděpodobnost, že mezi čísly, která padnou, nebudou hodnoty 1, 3 a 6?
Řešení. Úlohu můžeme přeformulovat tak, že n-krát po sobě hodíme 1 kostkou. Pravděpodobnost, že při prvním hodu nepadne 1, 3 nebo 6, je 1/2. Pravděpodobnost, že při prvním a druhém hodu nepadne 1, 3 ani 6, je zjevně 1 /4 (výsledek prvního hodu neovlivňuje výsledek druhého). Vzhledem k tomu, že jev určený výsledkem jistého hodu a jakýkoli jev určený výsledkem jiného hodu jsou vždy (stochasticky) nezávislé, hledaná pravděpodobnost je 1 /2". □
56
KAPITOLA 1. ROZCVIČKA
1.156. Dva přátelé střílejí nezávisle na sobě do jednoho terče, každý po jednom výstřelu. Pravděpodobnost zásahu terče pro prvního je 0, 4, pro druhého je 0, 3. Nalezněte pravděpodobnost P jevu, že po střelbě bude v terči právě jeden zásah.
Řešení. Výsledek stanovíme tak, že sečteme pravděpodobnosti těchto dvou neslučitelných jevů: trefil se první střelec a druhý nikoli; první střelec minul, zatímco druhý terč zasáhl. Při nezávislosti jevů (která se zachovává také tehdy, když uvažujeme komplementy některých zjevů) je pravděpodobnost společného nastoupení dána součinem pravděpodobností jednotlivých jevů. Užitím toho dostáváme
p = 0, 4 • (1 - 0, 3) + (1 - 0, 4) • 0, 3 = 0, 46.
□
1.157. Dvanáctkrát po sobě házíme třemi mincemi. Jaká je pravděpodobnost, že alespoň v jednom hodu padnou tři líce?
Řešení. Uvážíme-li, že při opakovaní téhož pokusu jsou jednotlivé výsledky nezávislé, a označíme-li pro i e {1, ..., 12} jako A;- jev „při /-tém hodu padly tři líce", určujeme
P (Ů Ať) = 1 - (1 - P(A0) • (1 - P(A2)) ••• (1 - P(An)).
Pro každé / e {1, ..., 12} je však P(Ai) = 1/8, neboť na každé ze tří mincí padne líc s pravděpodobností 1/2 nezávisle na tom, zda na ostatním mincích padl líc, příp. rub. Nyní již můžeme napsat výsledek
□
1.158. Z deseti karet, z nichž právě jedna je eso, namátkou vybereme kartu a vrátíme ji zpět. Kolikrát takový výběr musíme provést, aby pravděpodobnost, že aspoň jednou vybereme eso, byla větší než 0, 9?
Řešení. Označme A;- jev „při /-tém výběru bylo vytaženo eso". Neboť jednotlivé jevy A;- jsou (stochasticky) nezávislé, víme, že
P yU Aij = 1 - (1 - PiAO) ■ (1 - P(A2))... (1 - P(An)) pro každé n e N. Připomeňme, že hledáme n e N takové, aby platilo
P (Ů Ať) = 1 - (1 - P(A0) • (1 - P(A2)) ••• (1 - P(An)) > 0, 9. Zřejmě je /J(A;) = 1/10 pro libovolné / e N. Proto stačí vyřešit nerovnici
!-(&)"> 0,9,
ze které lze vyjádřit
n > !oga n „, kde a > 1.
loga 0,9
Vyčíslením potom zjistíme, že daný pokus musíme provést alespoň dvaadvacetkrát. □
57
G. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE
6. RELACE A ZOBRAZENÍ
1.159. Texas holďem. Nyní spočítejme několik jednoduchých úloh týkajících se populární karetní hry Texas hold' em, jejíž pravidla zde nebudeme uvádět (pokud je čtenář nezná, snadno je dohledá na internetu). Jaká je pravděpodobnost, že
i) jako startovní kominaci dostanu dvojici stejných symbolů?
ii) ve své startovní dvojici karet budu mít eso?
iii) na konci budu mít jednu z šesti nejlepších kombinací karet?
iv) vyhraji, pokud držím v ruce eso a trojku (libovolné barvy), na flopu je eso a dve dvojky a na turnu je třetí trojka a všechny tyto čtyři karty mají různou barvu? (poslední karta river ještě není otočena)
Řešení.
i) Počet různých symbolů je 13 a jsou vždy čtyři (pro každou barvu jeden). Proto je počet dvojic se stejnými symboly 13(2) = 78. Počet všech možných dvojic je (1324) = 1326. Pravděpodobnost stejných symbolů je tedy jj = 0, 06.
ii) Jedna karta je eso, to jsou čtyři možnosti a druhá je libovolná, to je 51 možností. Dvojice s oběma esama, kterých je (2) = 6 jsme ale takto započítali dvakrát. Dostáváme tedy 4.51 — 6 = 198 dvojic a pravděpodobnost je = 0, 15.
iii) Spočítáme pravděpodobnosti jednotlivých nejlepších kombinací:
ROYAL FLUSH: Takové kobinace jsou zřejmě jen čtyři - pro každou barvu jedna. Všech kombinací pěti karet je (552) = 2598960. Pravděpodobnost je tak rovna asi 1, 5.10-6. Hodně malá :)
STRAIGHT FLUSH: Postupka, která končí nej vyšší kartou v rozmezí 6 až K, tj. 8 možností pro každou barvu. Dostáváme 259382960 = 1, 2.10-5.
POKER: Čtyři stejné symboly -13 možností (pro každý symbol jedna). Pátá karta může být libovolná, to znamená 48 možností. Odtud: = 2, 4.10-4.
FULL HOUSE: Tři stejné symboly 13(4) = 52 možností a k tomu dva stejné symboly je 12(4) = 72 možností. Pravděpodobnost je 2598960 ^ ^' 4-10-3.
FLUSH: Všech pět karet stejné barvy znamená 4(1J3) = 5148 možností a pravděpodobnost
STRAIGHT: Nejvyšší katrta postupky je v rozmezí 6 až A, tj. 9 možností. Barva každé karty je pak libovolná, tj. dohromady 9.45 = 9216 možností. Zde jsme ale započítali jak straight flush, tak i royal flush. Ty je potřeba odečíst.
Pro zjištění pravděpodobnosti nějaké z šesti nejlepších kombinací to ale ani nemusíme dělat, jen první dvě kombinace nezapočteme. Celkově tedy dostáváme pravděpodobnost zhruba 3, 5.10-3 + 2.10-3 + 1, 4.10-3 + 2, 4.10-4 = 7, 14.10"3.
iv) Evidentně je situace hodně dobrá a proto bude lepší spočítat nepříznivé situace, tj. kdy bude mít soupeř lepší kombinaci. Já mám v tuto chvíli full house ze dvou es a tří dvojek. Jediná kombinace, která by mmě mohla porazit v tuto chvíli je buď full house ze tří es a dvou dvojek nebo dvojkový poker. To znamená, že soupeř by určitě musel držet eso nebo poslední dvojku. Pokud drží dvojku a libovolnou jinou kartu, pak určitě vyhraje bez ohledu na kartu na riveru. Kolik je možností pro tuto kartu ke dvojce? 3 + 4 + -- -+ 4 + 2 = 45 (jednu trojku a dvě esa už mít v ruce nemůže). Včech zbylých kombinací je (426) = 1035 a pravděpodobnost takové prohry je tak 0,043. Pokud drží v ruce eso, pak se může stát následující. Pokud drží
58
KAPITOLA 1. ROZCVIČKA
(zbylá) dvě esa, tak opět vyhraje, pokud na riveru nepřijde dvojka - pak by byl split poker. Pravděpodobnost (podmíněná) mé prohry je tedy -|f = 10~3. pokud drží soupeř v ruce eso a nějakou jinou kartu, než 2 a A, tak následuje remíza bez ohledu na river. Celková pravděpodobnost výhry je tak skoro 96 %.
□
1.160. Zjistěte pravděpodobnost, že při hodu dvěma kostkami padla alespoň na jedné kostce čtyřka, jestliže padl součet 7.
Řešení. Příklad řešíme pomocí klasické pravděpodobnosti, kdy podmínku interpretujeme jako zúžení pravděpodobnostního prostoru. Ten má vzhledem k podmínce tedy 6 prvků, z čehož právě 2 jsou příznivé vyšetřovanému jevu. Správná odpověďje 2/6 = 1/3. □
1.161. Hodíme dvěma kostkami. Určete podmíněnou pravděpodobnost, že na první kostce padla pětka za podmínky, že padl součet 9. Na základě tohoto výsledku rozhodněte o nezávislosti jevů „na první kostce padla pětka" a „padl součet 9".
Řešení. Označíme-li jev „na první kostce padla pětka" jako A a jev „padl součet 9" jako H, pak platí
P(A\H) = ^ = f = I.
Uvědomme si, že součet 9 můžeme získat tak, že na první kostce padne 3 a na druhé 6, na první 4 a na druhé 5, na první 5 a na druhé 4 nebo na první 6 a na druhé 3. Z těchto čtyř (stejně pravděpodobných) výsledků jevu A vyhovuje právě jeden. Protože pravděpodobnost jevu A je očividně 1/6 / 1/4, nejsou uvedené jevy nezávislé. □
1.162. Mějme balíček 32 karet. Vytáhneme-li dvakrát po jedné kartě, nalezněte pravděpodobnost, že druhá tažená karta bude eso, když první kartu vrátíme, a také tehdy, když ji do balíčku nevrátíme (druhou kartu potom vybíráme z balíčku 31 karet).
Řešení. Pokud kartu do balíčku vrátíme, zjevně opakujeme pokus, který má 32 možných (stejně pravděpodobných) výsledků, přičemž právě 4 z nich vyhovují námi uvažovanému jevu. Vidíme, že tomto případě je hledaná pravděpodobnost 1/8. Ve druhém případě, kdy první kartu do balíčku nevrátíme, je ovšem hledaná pravděpodobnost stejná. Postačuje např. uvážit, že při vytažení postupně všech karet je pravděpodobnost vytažení esa jako první karty totožná s pravděpodobností, že druhá vytažená karta bude eso. Pochopitelně bylo možné využít toho, že máme zavedenu podmíněnou pravděpodobnost. Tak bychom mohli obdržet
_± Ä. _1_ 28 _4_ _ 1 32 ' 31 32 ' 31 ~~ 8-
□
1.163. Uvažujme rodiny se dvěma dětmi a pro jednoduchost předpokládejme, že všechny možnosti v množině Q = {kk, kh, hk, hh}, kde k značí „kluk" a h znamená „holka" při zohlednění stáří dětí, jsou stejně pravděpodobné. Zaveďme náhodné jevy
H\ - rodina má kluka, A\ - rodina má 2 kluky.
Vypočtěte P {Ai\Hx).
Podobně uvažujme rodiny se třemi dětmi, kdy je
59
G. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE
6. RELACE A ZOBRAZENÍ
£2 = {kkk, kkh, khk, hkk, khh, hkh, hhk, hhh}.
Jestliže
H2 - rodina má kluka i holku, A2 - rodina má nejvýše jednu holku, rozhodněte o nezávislosti náhodných jevů A2 a H2.
Řešení. Uvážením, které ze čtyř prvků množiny Q (ne)vyhovují jevu A\, resp. H\, lehce získáváme
p (a \h \ — p(MnHi) _ p(M) _ i _ i r yAi\ni) — p(Hi) — p(Hi) — j — 3.
Dále máme zjistit, zda platí
P (A2 n H2) = P (A2) ■ P (H2).
Opět si stačí pouze uvědomit, že jevu A2 vyhovují právě prvky kkk, kkh, khk, hkk množiny Q, jevu H2 prvky kkh, khk, hkk, khh, hkh, hhk a jevu A2 n H2 prvky kkh, khk, hkk. Odtud plyne
P (A2 n H2) = f = I ■ I = P (A2) ■ P (H2),
což znamená, že jevy A2 a H2 jsou nezávislé. □
1.164. Pětkrát jsme hodili mincí. Pokud padl líc, dali jsme do klobouku bílou kuličku. Když padl rub, dali jsme do téhož klobouku kuličku černou. Vyjádřete pravděpodobnost, že v klobouku je více černých kuliček než bílých, je-li v klobouku alespoň jedna černá kulička.
Řešení. Zaveďme jevy
A - v klobouku je víc černých kuliček než bílých, H - v klobouku je aspoň jedna černá kulička.
Chceme stanovit P(A\H). Uvědomme si, že pravděpodobnost P (ířc) opačného jevu k jevu H je 2~5
a že pravděpodobnost jevu A je stejná jako pravděpodobnost P (Ac) jevu opačného (v klobouku je
víc bílých kuliček). Nutně tedy P(H) = 1 - 2"5, P (A) = 1/2. Dále je P(A D H) = P(A), neboť
jev H obsahuje jev A (jev A má za důsledek jev H). Celkem jsme obdrželi
P(A\ff\ - p(Anm _ \ _ 16 r\ft\ri) - p(H) _ 5_31.
□
1.165. V osudí je 9 červených a 7 bílých koulí. Postupně vytáhneme 3 koule (bez vracení). Určete pravděpodobnost, že první dvě budou červené a třetí bílá.
Řešení. Příklad budeme řešit pomocí věty o násobení pravděpodobností. Nejprve požadujeme vytažení červené koule, což se podaří s pravděpodobností 9/16. Pokud byla poprvé vytažena červená koule, při druhém tahu vytáhneme znovu červenou kouli s pravděpodobností 8/15 (v osudí je 15 koulí, z toho 8 červených). Konečně, pokud byla dvakrát vytažena červená koule, pravděpodobnost, že potom bude vytažena bílá, je 7/14 (v osudí je 7 bílých koulí a 7 červených koulí). Celkem dostáváme
16 15 14 u' J-
□
60
KAPITOLA 1. ROZCVIČKA
1.166. V osudí je 10 koulí, a to 5 černých a 5 bílých. Postupně budeme losovat po jedné kouli, přičemž vytaženou kouli nevrátíme zpět. Stanovte pravděpodobnost, že nejprve vytáhneme bílou, poté černou, pak bílou a v posledním čtvrtém tahu opět bílou kouli.
Řešení. Použijeme větu o násobení pravděpodobností. V prvním tahu vytáhneme bílou kouli s pravděpodobností 5/10, poté černou s pravděpodobností 5/9, následně bílou s pravděpodobností 4/8 a na závěr bílou s pravděpodobností 3/7. Dohromady to dává
_5_ 5 4 3 _ _5_ 10 ' 9 ' 8 ' 7 ~~ 84-
□
1.167. Z balíčku 32 karet náhodně vybereme šestkrát po sobě po jedné kartě, a to bez vracení. Spočtěte pravděpodobnost, že první král bude vybrán až při šestém výběru.
Řešení. Podle věty o násobení pravděpodobností je výsledek
28 27 26 25 24 J_ ^_ r> 0790 32 ' 31 ' 30 ' 29 ' 28 ' 27 ~~ U' u/z->-
□
1.168. Jaká je pravděpodobnost, že součet dvou náhodně zvolených kladných čísel menších než 1 bude menší než 3/7?
Řešení. Je vidět, že jde o jednoduchý příklad na geometrickou pravděpodobnost, kdy jako základní prostor Q se nabízí čtverec s vrcholy [0, 0], [1, 0], [1, 1], [0, 1] (volíme dvě čísla mezi 0 a 1). Zajímá nás pravděpodobnost jevu udávajícího, že pro náhodně zvolený bod [x, y] v tomto čtverci bude platit x + y < 3/7; tj. pravděpodobnost toho, že zvolený bod se bude nacházet uvnitř trojúhelníku A s vrcholy [0, 0], [3/7, 0], [0, 3/7]. Nyní již snadno vyčíslíme
PíA\ — ^2lá — /2 — JL
^ ' vol Q 1 98 •
□
1.169. Nechť je náhodně rozlomena tyč na tři části. Stanovte pravděpodobnost, že délka druhé (prostřední) části bude větší než dvě třetiny délky tyče před jejím rozlomením.
Řešení. Nejprve si označme délku uvažované tyče jako d. Rozlomení tyče ve dvou místech je dáno volbou bodů, kde ji zlomíme. Označme jako x bod, ve kterém je první (např. blíže nějakému předmětu) zlom, a jako x + y bod, ve kterém je druhý zlom. To nám říká, že za základní prostor lze považovat množinu {[jc, y]; x e (0, d), y e (0, d — x)}, tj. trojúhelník s vrcholy v bodech [0, 0], [d, 0], [0, d]. Délka prostřední části je dána hodnotou y. Požadavek ze zadaní lze nyní zapsat v jednoduchém tvaru y > 2d/3, což odpovídá trojúhelníku s vrcholy [0, 2d/3], [d/3, 2d/3], [0, d]. Obsahy uvažovaných pravoúhlých rovnoramenných trojúhelníků jsou d2/2 a (d/3)2/2, a proto je hledaná pravděpodobnost
3^-2 _ 1
ffl ~ 9'
2
□
61
G. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE
6. RELACE A ZOBRAZENÍ
1.170. Tyč o délce 2 m je náhodně rozřezána na tři části. Nalezněte pravděpodobnost jevu, že třetí část měří méně než 1, 5 m.
Řešení. Tento příklad je na užití geometrické pravděpodobnosti, kdy hledáme pravděpodobnost toho, že součet délek prvních dvou částí je větší než čtvrtina délky tyče. Určeme pravděpodobnost opačného jevu, tj. pravděpodobnost, když budou náhodně (a nezávisle na sobě) zvolena dvě místa, ve kterých bude tyč rozřezána, že budou obě v první čtvrtině tyče. Pravděpodobnost tohoto jevu je 1/42, neboť pravděpodobnost výběru místa v první čtvrtině tyče je zřejmě 1/4 a tento výběr se (nezávisle) jednou opakuje. Pravděpodobnost hledaného (opačného) jevu je tak 15/16. □
1.171. Mirek a Marek chodí na obědy do univerzitní menzy. Menza má otevřeno od llh do 14h. Každý z nich stráví na obědě půl hodiny a dobu příchodu (mezi llh a 14h) si vybírá náhodně. Jaká je pravděpodobnost, že se na obědě v daný den potkají, sedávají-li oba u stejného stolu?
Řešení. Prostor všech možných jevů je čtverec 3x3. Označíme-li x dobu příchodu Mirka a y dobu příchodu Marka, tak tito se potkají, právě když \x — y\ < 1/2. Tato nerovnost vymezuje ve čtverci možných událostí oblast, jejíž obsah je roven 11 /36 obsahu čtverce. Tomuto zlomku je tedy rovna i hledaná pravděpodobnost. □
1.172. Z Brna vyrazí náhodně někdy mezi polednem a čtvrtou hodinou odpolední Honza autem do Prahy a opačným směrem někdy ve stejném intervalu autem Martin. Oba si dávají půl hodiny pauzu v motorestu v polovině cesty (přístupném pro oba směry). Jaká je pravděpodobnost, že se tam potkají, jezdí-li Honza rychlostí 150 km/h a Martin 100 km/h? (Vzdálenost Brno-Praha je 200 km)
Řešení. Označíme-li dobu odjezdu Martina x a dobu odjezdu Honzy y a pro menší výskyt zlomků v následujících výpočtech zvolíme za jednotku deset minut, tak stavovým prostorem bude čtverec 24 x 24. Doba příjezdu Martina do motorestu je x + 6, do příjezdu Honzy x +4. Stejně jako v předchozím příkladu to, že se v motorestu potkají, je ekvivalentní tomu, že doby jejich příjezdu se neliší o více než o půl hodiny, tedy | (x + 6) — (y + 4) | < 3. Tato podmínka nám pak ve stavovém čtverci vymezuje oblast o obsahu 242 — |(232 + 192) (viz obr.) a hledaná pravděpodobnost je
i
fy
242 - i 232 + 192) 131
-^-- =-= 0,227.
242 576
□
1.173. Mirek vyjede náhodně mezi desátou hodinou dopolední a osmou hodinou večerní z Brna do Prahy. Marek vyjede náhodně ve stejném intervalu z Prahy do Brna. Oběma trvá cesta 2 hodiny. Jaká je pravděpodobnost, že se po cestě potkají (jezdí po stejné trase)?
62
KAPITOLA 1. ROZCVIČKA
Řešení. Řešíme naprosto analogicky jako v předchozím příkladě. Prostor všech možných jevů je čtverec lOx 10, Mirek, vyjíždějící v čase x, potká Marka, vyjíždějícího v čase y právě když \x—y\ < 2. Hledaná pravděpodobnost je p = = ^ = 0,36.
1.174. Dvoumetrová tyč je náhodně rozdělena na tři díly. Určete pravděpodobnost, že ze vzniklých dílů půjde sestavit trojúhelník.
Řešení. Rozdělení tyče je dáno stejně jako v předchozím příkladě body řezu x a y a jevovým prostorem je opět čtverec 2x2. Aby z částí bylo možno sestavit trojúhelník, musejí jejich délky splňovat tzv. trojúhelníkové nerovnosti, tedy součet délek libovolných dvou částí musí být větší než délka třetí části. Vzhledem k tomu, že součet délek je roven 2 m, je tato podmínka ekvivalentní podmínce, že každá s částí musí být menší než 1 m. To pomocí řezů x a y vyjádříme tak, že nesmí platit současně x < lay < 1 nebo současně x > lay > 1 (odpovídá podmínkám, že krajní díly tyče jsou menší než 1), navíc |x — y| < 1 (prostřední díl musí být menší nezjedná). Tyto podmínky splňuje vyšrafovaná oblast na obrázku a jak snadno nahlédneme, její obsah je 1 /4.
□
□
1.175. Je rovnice
(b)
3,
-2;
16, -7;
(c)
Ax\ + 2x2 =
—2.X i — X2 =
7, -3
63
G. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE
6. RELACE A ZOBRAZENÍ
jednoznačně řešitelná (má právě 1 řešení)?
Řešení. Soustava lineárních rovnic je jednoznačně řešitelná právě tehdy, když je nenulový determinant matice určené koeficienty na levé straně soustavy Zvláště řečeno, absolutní členy (čísla na pravé straně) neovlivňují jednoznačnost řešení soustavy. Musíme tedy ve variantách (a) a (b) dostat stejnou odpověď. Protože
4 -73
1
-277
4- (-2V7) - (-73-l) ^0, = 4-(-l)-(2-(-2))=0,
-2 -1
mají soustavy ve variantách (a) a (b) právě 1 řešení a poslední soustava nikoliv. Vynásobíme-li druhou rovnici v (c) číslem —2, vidíme, že tato soustava nemá řešení. □
1.176. Vypočítejte obsah S čtyřúhelníku zadaného vrcholy
[0,-2], [-1,1], [1,5], [1,-1]. Řešení. Při obvyklém označení vrcholů
A = [0,-2], S = [1,-1], C = [1,5], D = [-1,1] a neméně obvyklém rozdělení čtyřúhelníku na trojúhelníky ABC nACD s obsahy S\ a S2, dostáváme
S = St + S2
1-0 1-0 -1+2 5 + 2
+
1-0 5 + 2
-1-0 1+2
(7 - 1) + i (3 + 7)
1 1 5 1 1 5
2 10 13 + 2 -3 -5
□
1.177. Určete obsah čtyřúhelníka ABCD s vrcholy A = [1, 0], B = [11, 13], C = [2, 5] a D = [-2, -5].
Řešení. Čtyřúhelník rozdělíme na dva trojúhelníky ABC a ACD. Jejich obsahy pak spočítáme pomocí patřičných determinantů, viz 1.34,
47
T"
□
1.178. Spočítejte obsah rovnoběžníku s vrcholy v bodech [5, 5], [6, 8] a [6, 9].
Řešení. Přestože takový rovnoběžník není zadán jednoznačně (není uveden čtvrtý vrchol), trojúhelník s vrcholy [5, 5], [6, 8] a [6, 9] musí být nutně polovinou každého rovnoběžníku s těmito třemi vrcholy (jedna ze stran trojúhelníku se stane úhlopříčkou rovnoběžníku). Proto je hledaný obsah vždy roven determinantu
ň _ _ 1 1
1.4-1-3 = 1.
6-5 6-5 1 1
8-5 9-5 3 4
□
64
KAPITOLA 1. ROZCVIČKA
1.179. Výčtem prvků zadejte S o i?, je-li
R = {(2, 4), (4, 4), (4, 5)} C N x N, S = {(3, 1), (3, 2), (3, 5), (4, 1), (4, 4)} c N x N.
Řešení. Uvážením všech výběrů dvou uspořádaných dvojic
(2, 4), (4,1); (2, 4), (4, 4); (4, 4), (4,1); (4, 4), (4, 4)
splňujících, že druhá složka první uspořádané dvojice, která je prvkem i?, je rovna první složce druhé uspořádané dvojice, která je prvkem 5, dostáváme
SoR = {(2, 1), (2,4), (4, 1), (4,4)}.
□
1.180. Nechť je dána binární relace
R = {(0,4), (-3,0), (5,tt), (5, 2), (0,2)} mezi množinami A = Z a B = M.. Vyjádřete i?-1 a R o R~x. Řešení. Ihned vidíme, že
R-1 = {(4, 0), (0, -3), (tt, 5), (2, 5), (2, 0)}.
Odtud pak dále
RoR-1 = {(4, 4), (0, 0), (tt, 7T), (2, 2), (4, 2), (tt, 2), (2, tt), (2, 4)}.
□
1.181. Rozhodněte, zdaje relace R určená podmínkou
(a) (a,b) e i? \a\ < |i|;
(b) (a,i) e i? M = |2i|
na množině celých čísel Z tranzitivní.
Řešení. V prvním případě relace R tranzitivní je, protože platí
\a\< \b\, \b\< \c\ => \a\ < Ve druhém případě relace R tranzitivní není. Stačí např. uvážit, že
(4,2), (2, 1) e/?, (4, 1) g/?.
□
1.182. Najděte všechny relace na M = {1, 2}, které nejsou antisymetrické. Které z nich jsou tranzitivní?
Řešení. Hledané relace, jež nejsou antisymetrické, jsou čtyři. Jsou to právě ty podmnožiny {1,2} x {1, 2}, které obsahují prvky (1, 2), (2, 1) (jinak nemůže být podmínka antisymetrie porušena). Z těchto čtyř je tranzitivní pouze jediná relace
{(1, 1), (1, 2), (2, 1), (2, 2)} = M x M,
protože nezahrnutí dvojic (1, 1) a (2, 2) do tranzitivní relace by znamenalo, že nemůže obsahovat zároveň (1, 2) a (2, 1). □
65
G. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE
6. RELACE A ZOBRAZENÍ
1.183. Existuje relace ekvivalence, která je současně relací uspořádání, na množině všech přímek v rovině?
Řešení. Relace ekvivalence (příp. relace uspořádání) musí být reflexivní, a proto každá přímka musí být v relaci sama se sebou. Dále požadujeme, aby hledaná relace byla symetrická (ekvivalence) a zároveň antisymetrická (uspořádání). To dává, že přímka může být v relaci pouze sama se sebou. Zavedeme-li ovšem relaci tak, že dvě přímky jsou v relaci právě tehdy, když jsou totožné, dostaneme „velmi přirozenou" relaci ekvivalence i relaci uspořádání. Stačí si uvědomit, že je triviálně tranzitivní. Hledanou relací je právě identické zobrazení množiny všech přímek v rovině. □
1.184. Určete, zda je relace
R = {(k,l) e Z x Z; \ k\>\l\] na množině Z ekvivalence, uspořádání.
Řešení. Relace R není ekvivalencí: není symetrická (kupř. (6, 2) e R, (2, 6) <£ i?); není uspořádáním: není antisymetrická (mj. (2, —2) e R, (—2, 2) e R). □
1.185. Ukažte, že průnik libovolných relací ekvivalence na libovolně dané množině X je rovněž relace ekvivalence a že sjednocení dvou relací uspořádání na X nemusí být relace uspořádání.
Řešení. Postupně uvidíme, že průnik relací ekvivalence je reflexivní, symetrický a tranzitivní. Všechny relace ekvivalence na X musí obsahovat dvojici (x, x) pro každé x e X, a proto ji musí obsahovat také daný průnik. Pokud v průniku ekvivalencí je prvek (x, y), musí v něm být rovněž prvek (v, x) (stačí využít toho, že každá ekvivalence je symetrická). To, že do průniku ekvivalencí náleží prvky (x, y) a (y, z), znamená, že se jedná o prvky každé z ekvivalencí. Z tranzitivnosti všech jednotlivých ekvivalencí již vyplývá, že do průniku náleží také prvek (x, z)-Zvolíme-li X = {1, 2} a relace uspořádání
/?i = {(1, 1), (2, 2), (1, 2)}, R2 = {(1, 1), (2, 2), (2, 1)}
na X, dostáváme relaci
/ř1U/ř2 = {(l,l),(2,2),(l,2),(2, 1)}, která zřejmě není antisymetrická, a tedy ani uspořádáním. □
1.186. Na množině M = {1, 2, ..., 19, 20} je zavedena relace ekvivalence ~ tak, že a ~ b pro libovolná a, b e M právě tehdy, když první cifry čísel a, b jsou stejné. Sestrojte rozklad daný touto ekvivalencí.
Řešení. Dvě čísla z množiny M jsou ve stejné třídě ekvivalence, právě když jsou spolu v relaci (první cifra je stejná). Rozklad jí určený se tedy skládá z množin
{1, 10, 11,..., 18, 19}, {2, 20}, {3}, {4}, {5}, {6}, {7}, {8}, {9}.
□
1.187. Je dán rozklad se dvěma třídami {b, c}, {a, d, e} množiny X = {a, b, c, d, e}. Napište relaci ekvivalence R na množině X příslušnou tomuto rozkladu.
Řešení. Ekvivalence R je určena tím, že v relaci jsou spolu ty prvky, které jsou ve stejné třídě rozkladu, a to v obou pořadích (R musí být symetrická) a každý sám se sebou (R musí být reflexivní). Proto R obsahuje právě
66
KAPITOLA 1. ROZCVIČKA
(a, a), (b, b), (c, c), (d, d), (e, e), (b, c), (c, b), (a, d), (a, e), (d, a), (d, e), (e, a), (e, d).
□
1.188. Na následujících třech obrázkách jsou ikony spojeny čarami tak, jak by je možná přiřadili lidé v různých částech světa. Určete, zda jde o zobrazení, zdaje injektivní, surjektivní nebo bijektivní.
Řešení. V prvním případě jde o zobrazení, které je surjektivní, ale není injektivní, protože had i pavouk jsou označeni jako jedovatí. Druhý případ není zobrazení ale jen relace, protože pes je určen jako domácí zvíře i na jídlo. V třetím případě máme opět zobrazení. Tentokrát není ani injektivní, ani surjektivní. □
1.189. Mějme množinu {a, b, c, d} a na ní relaci
{(a, a), (b,b), (a,b), (b,c), (c,b)}.
Jaké členy je potřeba minimálně doplnit do této relace, aby to byla ekvivalence?
Řešení. Postupně projdeme všechny tři vlastnosti, které definují ekvivalenci. Za prvé je to reflexivita. Musíme tedy doplnit dvojice {(c, c), (d,d)}. Za druhé symetrie -musíme doplnit (b, a) a za třetí musíme udělat tzv. tranzitivní obal. Protože je a v relaci s b a b v relaci s c, musí být i a v relaci s c. Nakonec tedy potřebujeme přidat (a, c) a (c, a). □
1.190. Uvažme množinu čísel, které mají pět cifer ve dvojkovém zápisu a relaci takovou, že dvě čísla jsou v relaci, právě když jejich ciferný součet má stejnou paritu. Napište příslušné třídy ekvivalence.
Řešení. Dostáváme dvě třídy ekvivalence (o osmi členech):
[10000] = {10000, 10011, 10101, 10110, 11001, 11010, 11100, 11111}
67
G. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE
6. RELACE A ZOBRAZENÍ
odpovídá množině {16, 19, 21, 22, 25, 26, 28, 31} a
[10001] = {10001, 10010, 10100, 11000, 10111, 11011, 11101, 11110}
odpovídá množině {17, 18, 20, 24, 23, 27, 29, 30}. □
1.191. Uvažme množinu čísel, které mají tři cifry ve trojkové soustavě a relaci takovou, že dvě čísla jsou v relaci, právě když v této soustavě
i) začínají stejným dvojčíslím.
ii) končí stejným dvojčíslím.
Napište příslušné třídy ekvivalence. Řešení.
i) Dostáváme šest ťříprvkových tříd
[100] = {100, 101, 102} odpovídá {9, 10, 11}
[110] = {110, 111, 112} odpovídá {12, 13, 14} [120] = {120, 121, 122} odpovídá {15, 16, 17} [200] = {200, 201, 202} odpovídá {18, 19, 20} [210] = {210, 211, 212} odpovídá {21, 22, 23}
[220] = {220, 221, 222} odpovídá {24, 25, 26}
ii) V tomto případě máme devět dvouprvkových tříd
[100] = {100, 200} odpovídá {9, 18}
[101] = {101, 201} odpovídá {10, 19} [102] = {102, 202} odpovídá {11, 20} [110] = {110, 210} odpovídá {12, 21} [111] = {111, 211} odpovídá {13, 22} [112] = {112, 212} odpovídá {14, 23} [120] = {120, 220} odpovídá {15, 24}
[121] = {121, 221} odpovídá {16, 25}
68
KAPITOLA 1. ROZCVIČKA
[122] = {122, 222} odpovídá {17, 26}
□
1.192. Pro jaký maximální definiční obor D a obor hodnot H je zobrazení bijektivní a jaká je v tom případě inverzní funkce?
i) i ^ i4
ii) X h» x3
iii) x h» —r-r
Řešení.
i) D = [0, oo) a H = [0, oo) nebo také D = (—oo, 0] a íŕ = [0, oo). Inverzní funkce je
ii) D = í/ = la inverze je x ^/x.
iii) D = M \ {-1} a Íř = M \ {0}. Inverzní funkce je
□
1.193. Uvažme relaci na M x M. Bod je v relaci, pokud pro něj platí
(x - l)2 + (y + l)2 = 1 Můžeme body popsat pomocí funkce y = f (x)? Nakreslete obrázek bodů v relaci. Řešení. Nemůžeme, protože např. y = — 1 má dva vzory: x = 0 a x = 2. Body leží na kružnici se středem v bodě (1, —1) s poloměrem 1. □
69
G. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE
6. RELACE A ZOBRAZENÍ
Řešení cvičení
7.75.
i) 1 - 3 - 2i + Ai = -2 + 2i, 1 • (-3) - 8;2 + 6i + Ai = 5 + 10«, 1 + 2i, JA2 + (-3)2 = 5,
= fi% = 1 . (-3) + 8;2 + 6i - 4/25 = -ii + Ä/.
z2 z2i 25 25
ii) 2 + i, 2i 2, 1, ? = -2/. 7.39. y„ = 2(|)" - 2.
7.50. Jedná se o známý problém permutací s pevnými body.
i) Pokud šest lidí dostne ten svůj, tak zákonitě i ten šestý, pravděpodobnost je tedy nulová.
ii) Nechť M je množina všech uspořádání a jev A/ je uspořádání, kdy i-tý hráč dostane svůj krígl. Chceme spočítat \M — U/A/|. Dostáváme 7! J2k=o TT = 1854. A pravděpodobnost je — 103 = Q 37
280
iii) Vybereme, kteří tři dostanou ten svůj - Q) — 35 možností. Zbylí čtyři musí dostat jiné než svoje. To je
opět vzorec z minulého bodu, konkrétně jde o 4! z_,k=o k\ ~ ^ možností. Máme tedy dohromady 9 • 35 — 315 možností a pravděpodobnost je —
1.100.
i) (3, 3), (4, 4), (5, 5), (6, 6), (7, 7), (3, 6) ověřte, že jde o relaci uspořádání
ii) opět (i, i) pro i — 1, ..., 7 a k tomu (3, 6), (6, 3) ověřte, že jde o relaci ekvivalence
iii) (i, i) pro i — 1, ..., 7 a k tomu (3, 6), (6, 3), (4, 6), (6, 4) ověřte, že nejde o relaci ekvivalence, protože není splněna tranzitivita.
1.112. Tři různé Hasseovy diagramy vyhovujících uspořádání. Celkem 5! + 5! + 5!/4 — 270.
1.119. Relace uvedených vlastností je relací ekvivalence na nějaké podmnožině množiny {1, 2, 3, 4}. Celkem
l+4-l + (4)-2+(4)-5 + 15 = 52.
7.720. 19. 7.727. 87.
1.124. Ukažte, že pokud uvažovaná odmocnina není přirozená, pak není ani racionální. Pokud ^fi není přirozená, tak existuje prvočíslo r a přirozené s taková, že ŕ dělí t, r+1 nedělí tam nedělí s (zápis ordr t — s) Předpokládejte, že ^/F — p, q e Z, neboli t ■ pm — qm. Uvažte ordr L a ordr R a jejich dělitelnost číslem m. (L značí levou stranu rovnice, ...) 1.138.
i) 26 = 64
ii) (j) = 15
iii) Žádná panna je jedna možnost (q) — 1, jedna panna (j) — 6 možností. Posloupností s nejvýše jednou pannou je teda jen 7 a proto posloupností, kdejsou aspoň dvě panny je 64 — 7 — 57.
1.147. Maximální počet yn částí, na které rozdělí n kružnic rovinu, je yn — y„-\ + 2(n — 1), yi = 2, tedy yn — n2 - n + 2.
Pro maximální počet pn částí, na které potom rozdělí n koulí prostor, pak dostáváme rekurentní vztah pn+i — pn + yn, pi = 2, tedy celkem pn = |(n2 - 3n + 8).
70
KAPITOLA 2
Elementární lineární algebra
neumíte ještě počítat se skaláry? — zkusme to rovnou s maticemi...
Ha
V minulé kapitole jsme se snad rozehřáli s relativně jednoduchými úlohami, k jejichž řešení nebylo potřeba složitých nástrojů. Vystačili jsme si přitom se sčítáním a násobením skalárů. V této a dalších kapitolách se postupně budeme věnovat jednotlivým tématům souvisleji.
Hned tři kapitoly budou věnovány nástrojům pro práci s daty, kdy operace spočívají v obzvlášť jednoduchých úkonech se skaláry, jen je těch skalárů povíce naráz. Hovoříme o „lineárních objektech" a „lineární algebře". Jakkoliv to teď může vypadat jako hodně speciální nástroj, uvidíme později, že složitější objekty a závislosti stejně studujeme hlavně pomocí jejich „lineárních přiblížení".
V této kapitole budeme pracovat přímo s konečnými po-j?^ sloupnostmi skalárů. Takové se objevují v praktických úlohách všude, kde máme objekty popisovány pomocí několika parametrů. Nedělejme si přitom problémy s představou, jak vypadá
prostor s více než třemi „souřadnicemi". Smiřme se se skutečností, že malovat si budeme umět jednu, dvě nebo tři dimenze, ale představovat ty obrázky mohou jakýkoliv jiný počet. A když budeme sledovat jakýkoliv parametr u třeba 500 studentů (např. jejich studijní výsledky), budou naše data mít hned zrovna několikrát 500 položek a budeme s nimi chtít pracovat. Naším cílem bude vytvořit nástroje, které budou dobře fungovat nezávisle na skutečném počtu těchto položek. Také se neděsme slovních spojení jako pole či okruh skalárů K. Prostě si můžeme představit jakýkoliv konkrétní číselný obor. Okruhy skalárů pak za-hrnují i celá čísla z a všechny zbytkové třídy, zatímco mezi poli jsou pouze i, q, c a zbytkové třídy 1,k s prvočíselným k. Zvláštní je mezi nimi z2, kde ze vztahu x = —x nemůžeme usoudit, že x = 0, zatímco u všech ostatních číselných oborů tomu tak je.
1. Vektory a matice
Většinou se o vektorech hovoří pouze ve spojení s poli skalárů, protože obecná teorie je při existenci neivertibilních nenulových skalárů nesrovnatelně složitější. Jen v prvních dvou částech této kapitoly budeme pracovat s vektory a maticemi v kontextu konečných posloupností skalárů a tam bude
A. Soustavy lineárních rovnic
Na vektorové prostory půjdeme od lesa. Začneme s něčím známým, totiž soustavami lineárních rovnic. I za nimi jsou totiž skryty vektorové prostory.
2.1. A teď vám to pěkně natřeme. Firma zabývající se velkoplošnými nátěry si objednala 810 litrů barvy, která má obsahovat stejné množství červené, zelené a modré barvy (tj. 810 litrů černé barvy). Obchod může splnit tuto zakázku smícháním běžně prodávaných barev (má skladem jejich dostatečné zásoby), a to
• načervenalé barvy - obsahuje 50 % červené, 25 % zelené a 25 % modré barvy;
• nazelenalé barvy - obsahuje 12,5 % červené, 75 % zelené a 12,5 % modré barvy;
• namodralé barvy - obsahuje 20 % červené, 20 % zelené a 60 % modré barvy.
Kolik litrů od každé z uskladněných barev se musí smíchat, aby byly splněny požadavky zákazníka?
Řešení. Označme jako
• x - množství (v litrech) načervenalé barvy, které se použije;
• y - množství (v litrech) nazelenalé barvy, které se použije;
• z, - množství (v litrech) namodralé barvy, které se použije.
71
A. SOUSTAVY LINEÁRNÍCH ROVNIC
1. VEKTORY A MATICE
Smícháním barev chceme získat barvu, která bude obsahovat 270 litrů červené barvy. Uvědomme si, že načervenalá barva obsahuje 50 % červené, nazelenalá obsahuje 12,5 % červené a namodralá 20 % červené barvy. Musí tudíž platit ,——
0,5x + 0, \25y + 0,2z = 270.
Analogicky požadujeme (pro zelenou a modrou barvu)
0, 25x + 0,15y + 0,2z = 270, 0,25x + 0, I25y + 0,6z = 270.
Nyní můžeme postupovat dvěma způsoby. Buď budeme postupně vyjadřovat proměnné pomocí ostatních (z první rovnice je x = 540 — 0, 25y — 0, 4z, dosadíme za x do druhé a třetí rovnice a dostaneme dvě lineární rovnice o dvou neznámých 2, 75y + 0, 4z, = 540 a 0, 25y + 2z, = 540. Ze druhé rovnice vyjádříme z = 270 — 0, 125.y a dosazením do první dostáváme 2, Ty = 432, neboli y = 160, odkud z = 270-0, 125-160 = 250 a x = 540-0, 25-160+0, 4-250 = 400.
Druhým způsobem je zapsat si soustavu do matice, jejíž první řádek bude tvořen koeficienty u neznámých v první rovnici, druhý koeficienty ve druhé rovnici a třetí ve třetí. Je tedy matice soustavy
0,5 0,125 0,2 0, 25 0, 75 0, 2 0,25 0,125 0,6
rozšířenou matici soustavy potom získáme z matice soustavy připsá
ním sloupce pravých stran jednotlivých rovnic v systému:
0, 5 0, 125 0, 2 0, 25 0, 75 0, 2 0,25 0, 125 0, 6
Jejím postupným upravováním pomocí tzv. elementárních řádkových úprav (odpovídají ekvivalentním úpravám rovnic, více viz 2.7) pak dostáváme:
0,5 0,125 0,2 0,25 0,75 0,2 0, 25 0, 125 0, 6
1 0,25 0,4 0 2,75 0,4 0 0,25 2
1 0,25 0,4 0 1 8 0 11 1,6 A opět zpětně vypočítáme -21600
y = 2 160 — 8 • 250 = 160, x = 540 - 0, 4 • 250 - 0, 25 • 160 = 400. Je tedy potřeba smísit po řadě 400 1, 160 1, 250 1 uvedených barev. □
zajímavé si i třeba případu celých čísel povšimnout. Bude přitom snad pěkně vidět, jak silné výsledky lze důsledným formálním uvažováním odvodit.
2.1. Vektory nad skaláry. Prozatím budeme vektorem rozumět uspořádanou n-tici skalárů z K, kde pevně zvolené n e N budeme nazývat dimenzí.
Skaláry umíme sčítat a násobit. Vektory budeme také sčítat, násobit však vektor budeme umět jen skalárem. To odpovídá představě, kterou jsme již viděli v rovině M2, kde sčítání odpovídalo skládání vektorů coby šipek vycházejících z počátku a násobení skalárem pak jejich patřičnému natahování.
Násobení vektoru u = («!,...,«„) skalárem c tedy definujeme tak, že každý prvek rc-tice u vynásobíme stejným skalárem c a také sčítání vektorů definujeme po složkách. To znamená
| základní operace s vektory |_
u + v = (ai, ..., a„) + (bi, ..., b„) = (ai + bu ..., a„ + b„) c ■ u = c • (a\, ..., a„) = (c ■ d\, ... ,c ■ a„).
Pro sčítání vektorů a násobení vektorů skaláry budeme používat stále stejné symboly jako u skalárů samotných, tj. symboly plus a buď tečku nebo prosté zřetězení znaků.
Konvence zápisu vektorů. Nebudeme, na rozdíl od mnoha jiných učebnic, v textu používat pro vektory žádné speciální značení a ponecháváme na čtenáři, aby udržoval svoji pozornost přemýšlením o kontextu. Pro skaláry ale spíše budeme používat písmena ze začátku abecedy a pro vektory od konce (prostředek nám zůstane na indexy proměných či komponent a také pro sčítací indexy v součtech).
Často budeme požadovat, aby skaláry byly z nějakého pole, viz 1.1, ale v této kapitole budeme vesměs pracovat s operacemi, které tento přepoklad nepotřebují. V literatuře se pak většinou místo o vektorových prostorech hovoří o modulech nad okruhy. U obecné teorie se ale v příští kapitole již zcela omezíme na pole skalárů.
Pro sčítání vektorů v W zjevně platí (KG1)-(KG4) s nulovým prvkem
0=(0.....0)eK".
Schválně zde používáme i pro nulový prvek stejný symbol jako pro nulový prvek skalárů.
72
KAPITOLA 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
Vlastnosti vektorů
Pro všechny vektory v, w e K" a skaláry a, b e K platí
(VI) (V2) (V3) (V4)
a ■ (v + w) = a ■ v + a ■ w (a + b) ■ v = a ■ v + b ■ v a ■ (b ■ v) = (a ■ b) ■ v 1 • v = v
Vlastnosti (V1)-(V4) našich vektorů, coby n-tic skalárů v K", se snadno ověří pro kterýkoliv okruh skalárů K, protože při ověřování vždy používáme pro jednotlivé souřadnice vektorů pouze vlastnosti skalárů uvedené v 1.1 a 1.3.
Budeme takto pracovat např. sl",Q",C", ale také Z", (Zk)",n = 1,2,3, ....
2.2. Matice nad skaláry. O něco složitějším objektem, který budeme při práci s vektory používat, jsou matice.
_—^_Matice typu m/ti [
Maticí typu m /n nad skaláry schéma Asm řádky a n sloupci
/ all a12
&2\ ^22
rozumíme obdélníkové
^2«
\Clm\ am2
nn J
kde cii
pro všechny 1 < i < m, 1 < j < n. Pro matici
A s prvky útý používáme také zápis A = (flý).
Vektory (au, au, ..., ain) e W nazýváme (/-té) řádky matice A, i = 1, ..., m, vektory (a\j, a-ij, ■ ■ ■, amj) e W" nazýváme (7—té) sloupce matice A, j =
Matici můžeme také chápat jako zobrazení
A : {1, ...,m] x {1, ...,n] K,
kde A(i, j) = aij. Matice typu 1/n nebo n/1 jsou vlastně právě vektory v K".
I obecné matice lze chápat jako vektory v Km'n, prostě zapomeneme na řádkování. Zejména tedy je definováno sčítání matic a násobení matic skaláry:
A + B = (a i j + bij), a ■ A = (a ■ a^)
kde A = (q.ij), B = (bij), aéI.
Matice — A = (—^7) se nazývá matice opačná k matici A a matice
/O ... 0^
0 = :
v0 ... Oj
se nazývá nulová matice. Zapomenutím řádkování tak získáme následující tvrzení, že matice jsou jen specificky zapsané vektory:
Poznámka. Druhý způsob je vhodný pro teoretické úvahy (například o počtu řešení daného systému) a také je vhodnější pro počítačové zpracování problému. V následujícím dvou kapitolách se naučíme „přemýšlet v maticích" a uvidíme, že nám to pomůže při řešení celé řady úloh.
2.2. Vypočtěte
Xi
1x\ -3*1
+ 2*2 + 3*3 = 2, — 3*2 — *3 = —3, + x2 + 2x3 = —3.
Řešení. Zadanou soustavu lineárních rovnic zapíšeme ve tvaru rozšířené matice
1
2
■1
-3 1 2
kterou pomocí elementárních řádkových transformací postupně převedeme na schodovitý tvar
1
2
■1
1
-7
7
3
-7 11
-7
2 \ / 1 2 3 2 1 -011 1 -4 / \ 0 0 1 -1
Nejdříve jsme přitom dvojnásobek prvního řádku odečetli od druhého a jeho trojnásobek přičetli ke třetímu. Poté jsme sečetli druhý a třetí řádek (součet napsali do třetího řádku) a druhý řádek vynásobili číslem —1/7. Přejdeme nyní zpět k soustavě rovnic
x\ + 2x2 + 3x3 = 2, X2 + x3 = 1, x3 = — 1.
Ihned vidíme, že x3 = — 1. Dosadíme-li x3 = — 1 do rovnice x2 +x3 = 1, dostaneme x2 = 2. Podobně dosazení získaných hodnot x3 = — 1, x2 = 2 do první rovnice dává x\ = 1. □
Systémy lineárních rovnic tedy lze zapisovat v maticovém tvaru. Ale je to nějaká výhoda, když je stejně umíme řešit, aniž bychom hovořili o maticích? Ano je, o řešení můžeme hovořit koncepčněji a jazyk matic pak daleko lépe navádí k počítačovému zpracování problému. Zkusme si tedy osvojit lépe různé operace, které můžeme s maticemi provádět. Jak jsme viděli v předchozích příkladech, tak ekvivalentní úpravy lineárních rovnic odpovídají v řeči matic elementárním řádkovým (sloupcovým) úpravám. Dále jsme viděli, že převedeme-li těmito úpravami matici soustavy do schodovitého tvaru (tomuto procesu říkáme Gaussova eliminace, viz 2.7), tak je již vyřešení soustavy velmi jednoduché. Ukažme si to ještě na dalších příkladech, na kterých
73
A. SOUSTAVY LINEÁRNÍCH ROVNIC
1. VEKTORY A MATICE
uvidíme, že soustava lineárních rovnic může mít nekonečně mnoho řešení.
2.3. Vyřešte soustavu lineárních rovnic
2 . 3
2x\ 3*1 3xi -7xi
+
+
*2
16x2 5x2 7x2
+ 3x3
+ 7x3
+ 4x3
+ -10X3
o,
0, 0, 0.
Řešení. Vzhledem k nulovosti pravých stran všech rovnic (jedná se tedy o homogenní systém) budeme upravovat pouze matici systému. Řešení nalezneme převodem na schodovitý tvar pomocí elementárních řádkových transformací, které odpovídají záměně pořadí rovnic, vynásobení rovnice nenulovým číslem a přičítání násobků rovnic. Navíc můžeme kdykoli od maticového zápisu přejít zpět k zápisu rovnic s neznámými x;. Nejprve docílíme toho, aby se proměnná x\ vyskytovala pouze v první rovnici. Zřejmě postačuje (—3/2)násobek prvního řádku přičíst ke druhému a ke třetímu řádku a jeho (7/2)násobek k poslednímu řádku, což v maticovém zápisu dává
/ 2 -1 3 \ / 2 -1
0 35/2
V
-7
16
-5 7
7 4
-10/
0
-7/2 7/2
3 5/2 -1/2 1/2 )
Odtud je vidět, že druhá, třetí a čtvrtá rovnice jsou násobky rovnice 7x2 + x3 = 0. Při maticovém zápisu můžeme např. (l/5)násobek druhého řádku přičíst ke třetímu a jeho (—1 /5)násobek k poslednímu řádku, čímž obdržíme schodovitý tvar
/ 2 -1 3 \ / 2 -1 3\
0 35/2 0 -7/2 V 0 7/2
5/2 -1/2 1/2 /
/ 2 0 0
V 0
■ 1
7 0
o
3 \ 1 0
o/
0 35/2 5/2 0 0 0
V o o o /
který jsme v posledním kroku zjednodušili tak, že jsme druhý řádek (druhou rovnici) vynásobili číslem 2/5. Přestože byly zadány čtyři rovnice pro tři neznámé, má celá soustava nekonečně mnoho řešení, neboť pro libovolné x3 e M mají zbylé rovnice
2xi
*2
7x2
+ +
3x3 x3
0, 0
řešení. Nahradíme tak proměnnou X3 parametrem ř e 1
2 . 4
*2
-- x3
7
1
-- ř 7
a x\
1
_ (x2
2 V
3x3)
a vyjádříme
11
--1.
1
Pokud ještě nahradíme t tvaru
-Is, obdržíme výsledek v jednoduchém
(xi, x2, x3) = (lis, s, —ls) , s e
Tvrzení. Předpisy pro A + B, a ■ A, —A, 0 zadávají na množině všech matic typu m/n operace sčítání a násobení skaláry splňující axiomy (VI )—(V4).
2.3. Matice a rovnice. Velmi častý nástroj pro popis nějakých matematických modelů jsou systémy lineárních rovnic. Právě matice lze vhodně využít pro jejich zápis. Zavedeme si k tomu účelu pojem skalární součin dvou vektorů, který vektorům (a\, ..., an) a (xi, ..., x„) přiřadí jejich součin
(ai
a„) ■ (xi,
Xn) — a\X\ -(-••• -\- anxn
tj. postupně násobíme po dvou souřadnice vektorů a výsledky sčítáme.
Každý systém m lineárních rovnic v n proměnných
Cl\\X\ + a\2X2 + «21*1 + <222x2 +
-|- a\nxn ~\~ ci2nxn
^m\X\ ~\~ Cím2X2 -\- ' ' ' -\- amnXn — bm
lze tedy vidět jako požadavek na hodnoty m skalárních součinů neznámého vektoru (xi, ..., x„) s vektory souřadnic (an, ..., ain).
Vektor proměnných můžeme také vidět jako sloupec v matici typu n /1, a podobně hodnoty b\, ... ,bn můžeme vnímat jako vektor m a to opět jako jediný sloupec v matici typu n/1. Náš systém rovnic lze pak formálně psát ve tvaru A ■ x = u takto:
din
( *\
□
kde levou stranu interpretujeme jako m skalárních součinů jednotlivých řádků matice vytvářejících sloupcový vektor, jehož hodnotu rovnice určují. To znamená, že skutečně rovnost /-tých souřadnic zadává podmínku původní rovnice
anxi + • • • + o.i„x„ = bi
a zápis A-x = u tak dává skutečně původní systém lineárních rovnic.
2.4. Součin matic. V rovině, tj. pro vektory dimenze 2, _^7*j jsme už zavedli počet s maticemi a viděli jsme, %'---'■} že s ním lze pracovat velice efektivně (viz 1.26). /Kh^fy' Nyní budeme postupovat obecněji a zavedeme í^jr^ť^-J— všechny nástroje již známé z roviny pro všechny dimenze n.
Násobení matic je možné definovat pouze, když to rozměry sloupců a řádků v maticích dovolí, tj. když je pro ně definován skalární součin jako výše:
74
KAPITOLA 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
Součin matic
Pro libovolnou matici A = (a^) typu m/n a libovolnou matici B = (bjk) typu n/q nad okruhem skalárů K definujeme jejich součin C = A ■ B = (cik) jako matici typu m/q s prvky
2.4. Nalezněte všechna řešení soustavy lineárních rovnic
3xi xx —2x\ 2x\
+ 3x3
— X2 + X3
— X2 + 4X3 + X2 — X3
5x4
X4
2x4
X4
-2, 0, -3.
y flý^yj-, pro libovolné l < i < m,l < k < q Řešení. Soustavě rovnic odpovídá rozšířená matice
7=1
Je tedy prvek C[ik] součinu právě skalárním součinem z-tého řádku matice nalevo a /c-tého sloupce matice napravo. Například máme
2 1 1 -1 0 1
3 2 3 3 1 0
2.5. Čtvercové matice. Je-li v matici stejný počet řádků a sloupců, hovoříme o čtvercové matici. Počet řádků a sloupců pak nazýváme také dimenzí matice. Matici
(\ ...
E = (Su) =
1,
se vkk jednotková matice. Takto definovaným číslům <5;J se říkává Kroneckerovo delta. Na množině čtvercových matic nad K dimenze n je součin matic definován pro každé dvě matice, je tam tedy definována operace násobení, jejíž vlastnosti jsou velice podobné jako u skalárů:
Tvrzení. Na množině všech čtvercových matic dimenze n nad libovolným okruhem skalárů K je definována operace násobení s následujícími vlast-feéi^ nosti okruhů (viz 1-3):
(1) Platí asociativita násobení (Ol).
(2) Jednotková matice E = (Si j) je jednotkovým prvkem pro násobení dle (03).
(3) Platí distributivita sčítání a násobení (04).
Obecně však neplatí axiomy (02) ani (Ol). Čtvercové matice pro n > 1 proto netvoří obor integrity, zejména tedy nejsou ani (nekomutativním) tělesem.
Důkaz. Asociativita násobení - (Ol): Protože skaláry jsou asociativní, distributivní i komutativní, můžeme pro tři matice A = (aij) typu m/n, B = (bjk) typu n/p a C = (cu) typu p Iq spočíst
A ■ B = (X>/./>Ä). B ■ C = (j^bjk.ck)j, (A ■ B) ■ C = ( J2( aij-bjk)-cti ) = í 5ľ aiihik -Ckl )' A ■ (B ■ C) = í aii ■ (J2 bJk -cki) j = ( aij -bjk -Ckl j ■
j k S ^j,k S
V
1
3 1
4
-1
"3 /
Záměnou pořadí řádků (rovnic) potom obdržíme matici
/
1 1
V
-2 \
-3
0
1
2 1 -1 -2 -1 4
3 0 3
kterou převedeme na schodovitý tvar. Nejprve přičteme (—2)násobek, 2násobek a (—3)násobek prvního řádku po řadě ke druhému, třetímu a čtvrtému řádku, čímž získáme 0 pod prvním nenulovým číslem v prvním řádku. Analogicky poté získáme 0 pod prvním nenulovým číslem ve druhém řádku tak, že tento řádek a jeho (—l)násobek přičteme po řadě ke třetímu a čtvrtému řádku. Takto dostaneme
/ 1 -1 1 -1 -2 ^ / 1 -1 1 -1 -2 \
2 1 -1 -1 -3 0 3 -3 1 1
-2 -1 4 -2 0 0 -3 6 -4 -4
v 3 0 3 -5 -8 ) \o 3 0 -2 "2 /
/ 1 -1 1 -1 -2 \ (1 -1 1 -1 -2 \
0 3 -3 1 1 0 3 -3 1 1
0 0 3 -3 -3 0 0 3 -3 -3
\0 0 3 -3 "3 y/ \° 0 0 0 0 /
Odtud vyplývá (čtvrtý řádek je pouhou kopií třetího - lze jej tedy „vynulovat"), že soustava bude mít nekonečně mnoho řešení, neboť dostáváme tři rovnice pro čtyři neznámé, které očividně budou mít právě jedno řešení pro každou volbu proměnné x4 e M. Neznámou x4 proto nahradíme parametrem t e M a od maticového zápisu přejdeme zpět k rovnicím
X\ — X2 ~\~ X3 — t = —2, 3x2 — 3x3 + t = 1, 3x3 - 3ř = -3.
Z poslední rovnice máme X3 = t — 1. Dosazení za X3 do druhé rovnice potom dává
1
3x2 - 3ř + 3 + t = 1, tj. x2
(2t - 2)
Konečně podle první rovnice je 1
(2t - 2) + t - 1 - t = -2, tj.
1
(2t - 5).
75
A. SOUSTAVY LINEÁRNÍCH ROVNIC
1. VEKTORY A MATICE
(xi, x2, x3, x4)
Množinu řešení můžeme tudíž zapsat (pro t = 3s) ve tvaru
5 2 \
2s--, 2s--, 3s — 1, 3s , se.
3 3 )
Nyní se vraťme k rozšířené matici naší soustavy a upravujme ji
dále užitím řádkových transformací tak, aby (při schodovitém tvaru)
první nenulové číslo každého řádku (tzv. pivot) bylo právě číslo 1 a aby
všechna ostatní čísla v jeho sloupci byla 0. Platí
/1 -1 1 -1 -2 \ ( 1 -1 1 -1 -2 \
0 3 -3 1 1 0 1 -1 1/3 1/3
0 0 3 -3 -3 0 0 1 -1 -1
\o 0 0 0 o ) V 0 0 0 0 o )
/1 -1 0 0 -1 /1 0 0 -2/3 -5/3 \
0 1 0 - -2/3 -2/3 0 1 0 -2/3 -2/3
0 0 1 -1 -1 0 0 1 -1 -1
\0 0 0 0 0 ) \0 0 0 0 0
přičemž nejdříve jsme vynásobili druhý a třetí řádek číslem 1/3, pak přičetli třetí řádek ke druhému a jeho (—1)násobek k prvnímu a na závěr přičetli druhý řádek k prvnímu. Z poslední matice snadno dostáváme výsledek
/2/3\
+ t
x3 \X4J
/-5/3\ 2/3 -1 0
V o /
2/3 1
V 1 /
t e
Volné proměnné jsou totiž ty, jejichž sloupce neobsahují žádného pi-vota (v našem případě neobsahuje pivota čtvrtý sloupec, je tedy volná čtvrtá proměnná, tj. používáme ji jako parametr). □
2.5. Určete řešení systému rovnic
3x\ + 3x3
X\ — x2 -\- x 3
—2x\ — x2 + 4x3
2x\ -\- x2 — X3
Řešení. Uvědomme si, že soustava rovnic v tomto příkladu se od soustavy z předešlého příkladu liší pouze v hodnotě 8 (místo — 8) na pravé straně první rovnice. Provedeme-li totožné řádkové úpravy jako v minulém příkladu, obdržíme
5^4 = 8,
X4 = -2,
2^4 = 0,
X4 = -3.
/ 3 0 3 -5 8 \ / 1 -1 1 -1 -2 \
1 -1 1 -1 -2 2 1 -1 -1 -3
— 2 -1 4 -2 0 -2 -1 4 -2 0
V 2 1 -1 -1 "3 ) V 3 0 3 -5 8 /
( 1 _1 1 1 "2 \ / 1 -1 1 -1 -2 \
0 3 -3 1 1 0 3 -3 1 1
0 0 3 3 -3 0 0 3 -3 -3
^ 0 0 3 3 13 / \0 0 0 0 16;
kde poslední úpravou bylo odečtení třetího řádku od čtvrtého. Ze čtvrté rovnice 0=16 vyplývá, že soustava nemá řešení. Vyzdvihněme, že
Všimněme si, že jsme při výpočtu vycházeli z toho, že je jedno v jakém pořadí uvedené součty a součiny provádíme, tj. využívali jsme podstatně našich vlastností skalárů.
Velmi snadno vidíme, že násobení jednotkovou maticí má skutečně vlastnost jednotkového prvku:
/l 0 ••• 0\ 0 1 ••• 0
(c
A ■ E
\o o
V
a stejně pro násobení E zleva.
Zbývá ukázat distributivitu násobení a sčítání. Opět díky distributivitě skalárů snadno spočteme pro matice A = (a^-) typu m/n, B = (bjk) typu n/p, C = (cjk) typu n/p, D = (du) typu p/q
A-(B + C)
+ cjk)
[J2aij(bj
(Y,a>ib*) + (E W) I = A ■ B + A ■ C
v j j
(B + C)D = \ Y^(bjk +cjk)dk ^ k
(J^bjkdu) + (J2cJkdu) I = B ■ D + C ■ D.
Jak jsme již viděli v 1.26, dvě matice dimenze 2 nemusí komutovat:
1 0
0 0
0 1
0 0
0 1
0 0
1 0 0 0
0 1
0 0
0 0
0 0
Tím jsme získali zároveň protipříklad na platnost (02) i (Ol). Pro matice typu 1/1 ovšem oba axiomy samozřejmě platí, protože je mají samy skaláry. Pro větší matice získáme protipříklady snadno tak, že právě uvedené matice umístíme do levého horního rohu příslušných čtvercových schémat a doplníme nulami. (Ověřte si sami!) □
V důkazu jsme vlastně pracovali s maticemi obecnějšího typu, dokázali jsme tedy příslušné vlastnosti obecněji:
^ Asociativita a distributivita násobení matic
Důsledek. Násobení matic je asociativní a distributivní, tj.
A ■ (B ■ C) = (A ■ B) ■ C A ■ (B + C) = A ■ B + A ■ C,
kdykoliv jsou všechny uvedené operace definovány. Jednotková matice je neutrálním prvkem pro násobení zleva i zprava.
76
KAPITOLA 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
2.6
e2 . 0
2.7
2.6. Inverzní matice. Se skaláry umíme počítat tak, že z rovnosti a-x = b umíme vyjádřit x = a~l - b, kdykoliv inverze k a existuje. Podobně bychom to chtěli umět i s maticemi, máme ale problém, jak poznat, zda taková existuje, a jak ji spočítat. Říkáme, že B je matice inverzní k matici A, když
A ■ B = B ■ A = E.
Píšeme pak B = A~l a z definice je samozřejmé, že obě matice musí mít být čtvercové se stejnou dimenzi n. Matici, k níž existuje matice inverzní, říkáme invertibilní matice nebo také regulární čtvercová matice.
V následujících odstavcích mimo jiné odvodíme, že B je inverzní k A, jakmile platí jedna z požadovaných identit (tj. druhá je pak důsledkem).
Pokud A-1 aB"1 existují, pak existuje i inverze k součinu A • B
(2.1)
(A • B)-
B~
Je totiž, díky právě dokázané asociativitě násobení,
(B~l ■ A"1) • (A • B) = B~l ■ (A-1 ■ A) ■ B = E (A • B) ■ (B~l ■ A"1) = A ■ (B ■ B~l) ■ A"1 = E.
Protože s maticemi umíme počítat podobně jako se ska-láry, jen mají složitější chování, může nám existence inverzní matice skutečně hodně pomoci s řešením systémů lineárních rovnic: Jestliže vyjádříme soustavu n rovnic pro n neznámých součinem matic
A • x
an
\Clfn\
íb,
\bn
a jestliže existuje matice inverzní k matici A, pak lze násobit zleva A-1 a dostaneme
A-1 • u = A-1 ■ A ■ x = E ■ x = x,
tj. A-1 • u je hledané řešení.
Naopak rozepsáním podmínky A • A ~1 = E pro neznámé skaláry v hledané matici A-1 dostaneme n systémů lineárních rovnic se stejnou maticí na levé straně a různými vektory napravo.
2.7. Ekvivalentní úpravy matic. Zkusme se praktičtěji zorientovat v předchozí úvaze o systémech rovnic a jejich maticích. Samozřejmě nás nalezení inverzní matice stojí jisté úsilí - větší než přímé vyřešení rovnice. Podstatné však je, že pokud máme mnohokrát za sebou řešit systémy se stejnou maticí A ale různými pravými stranami u, pak se nám nalezení A-1 opravdu hodně vyplatí.
při úpravě na schodovitý tvar obdržíme rovnici 0 = a pro nějaké a ^ 0 (tj. nulový řádek na levé straně a nenulové číslo za svislou čarou) právě tehdy, když soustava nemá řešení. □
B. Manipulace s maticemi
V této podkapitole budeme pracovat pouze s maticemi, abychom si osvojili jejich vlastnosti.
2.6. Násobení matic. Provedlte násobení matic a zkontrolujte si výsledek. Všimněte si, že proto, abychom mohli dvě matice násobit je nutná a postačující podmínka, aby měla první matice stejně sloupců, jako druhá řádků. Počet řádků výsledné matice je pak dán počtem řádků první matice, počet sloupců je roven počtu sloupců druhé matice.
12 7
12),
Poznámka.Body i) a ii) v předchozím příkladu ukazují, že násobení čtvercových matic není komutativní, v bodě iii) vidíme, že pokud můžeme násobit obdélníkové matice, tak pouze v jednom ze dvou možných pořadí. V bodech iv) a v) si pak všimněme, že (A-B)T = AT BT.
2.7. Nechť j e
ľ 0 -5\ /
2 7 15 , B=\
U 7 13/ \
Lze matici A převést na matici B pomocí elementárních řádkových transformací (pak říkáme, že jsou řádkově ekvivalentní)?
Řešení. Obě matice jsou zřejmě řádkově ekvivalentní s trojrozměrnou jednotkovou maticí. Snadno se vidí, že řádková ekvivalence na množině všech matic daných rozměrů je relací ekvivalence. Matice A a B jsou tudíž řádkově ekvivalentní. □
77
B. MANIPULACE S MATICEMI
1. VEKTORY A MATICE
2.8. Řešte maticovou rovnici
ŕ2 5 1 3
X ■
1
2.9. Nalezněte libovolnou matici B, pro kterou je matice C = B ■ A ve schodovitém tvaru, jestliže
-1
-3 -3 -5
/3 5 1
V7
2\
3 0
1
Řešení. Budeme-li matici A postupně násobit zleva elementárními maticemi (uvažte, jakým řádkovým úpravám toto násobení matic odpovídá)
/O 0 1 0\ / ' 1 0 0 0\
Ei = 0 1 1 0 0 0 0 0 , E2 = -5 0 1 0 0 1 0 0
V> 0 0 v \ v 0 0 0 v
(i 0 0 /1 0 0 0\
E3 = 0 -3 1 0 0 1 0 0 , E4 = 0 0 1 0 0 1 0 0
0 0 !/ V-7 0 0 v
<\ 0 0 0N (l 0 0 0\
E5 = 0 0 1/3 0 0 1 0 0 , E6 = 0 0 1 -2 0 1 0 0
vo 0 0 \ 0 0 v
<\ 0 0 0\ /l 0 0 0\
E1 = 0 0 1 0 0 1 0 0 , E, = 0 0 1/4 0 0 1 0 0
vo -4 0 v 0 0 v
obdržíme
S = E%E-iE(>EsE4Ej,E2E\
/O 0 0 1/12
1
0\
1
-2/3 -4/3
-5/12 0 1/3 0 -1/3
V
c
/i o o
1 o o
-5 0 \
9/4 1/4 0 0 0 0 /
□
Z hlediska řešení systémů rovnic A ■ x = m je jistě přirozené považovat za ekvivalentní matice A a vektory u, které zadávají systémy rovnic se stejným řešením. Zkusme se teď zamyslet nad možnostmi, jak zjednodušovat matici A tak, abychom se k řešení blížili.
Začneme jednoduchými manipulacemi s řádky rovnic, které řešení ovlivňovat nebudou, a stejným způsobem pak můžeme upravovat i vektor napravo. Když se nám u čtvercové matice podaří vlevo dostat systém s jednotkovou maticí, bude napravo řešení původního systému. Pokud při našem postupu nějaké řádky úplně vypadnou (při úpravách se vynulují), bude to také dávat další přímé informace o řešení. Naše jednoduché úpravy jsou:
-[ Elementární řádkové transformace j,
• záměna dvou řádků,
• vynásobení vybraného řádku nenulovým skalárem,
• přičtení řádku k jinému řádku.
Těmto operacím říkáme elementární řádkové transformace. Je zjevné, že odpovídající operace na úrovni rovnic v systému skutečně nemohou změnit množinu všech jeho řešení, pokud je náš okruh oborem integrity.
Analogicky, elementární sloupcové transformace matic
jsou
• záměna dvou sloupců,
• vynásobení vybraného sloupce nenulovým skalárem,
• přičtení sloupce k jinému sloupci,
ty však nezachovávají řešení příslušných rovnic, protože mezi sebou míchají samotné proměnné.
Systematicky můžeme použít elementární řádkové úpravy k postupné eliminaci proměnných. Postup je algoritmický a většinou se mu říká Gaussova eliminace proměnných.
Gaussova eliminace proměnných |m
Tvrzení. Nenulovou matici nad libovolným okruhem skalárů K lze konečně mnoha elementárními řádkovými transformacemi převést na tzv. (řádkově) schodovitý tvar:
• Je-li dik = 0 pro všechna k = 1, ..., j, potom a^ = 0 pro všechna k > /,
• je-li ci(i-\)j první nenulový prvek na (i — \)-ním řádku, pak cii j = 0.
důkaz.
takto
ŕ
0 0
o o
aXj 0
&2k
a\m\
^2m
0 aip
1
Matice v řádkově schodovitém tvaru vypadá
78
KAPITOLA 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
a matice může, ale nemusí, končit několika nulovými řádky. K převodu libovolné matice můžeme použít jednoduchý algoritmus, kterým se postupně, řádek za řádkem, blížíme k výslednému schodovitému tvaru:
Algoritmus Gaussovy eliminace
(1) Případnou záměnou řádků docílíme, že v prvním řádku bude v prvním nenulovém sloupci nenulový prvek, nechť je to 7-tý sloupec.
(2) Pro / = 2, ..., vynásobením prvního řádku prvkem atj, /-tého řádku prvkem a\} a odečtením vynulujeme prvek ciij na /-tém řádku.
(3) Opakovanou aplikací bodů (1) a (2), vždy pro dosud neupravený zbytek řádků a sloupců v získané matici dospějeme po konečném počtu kroků k požadovanému tvaru.
Tím je tvrzení dokázáno
Uvedený postup je skutečně právě obvyklá eliminace proměnných v systémech lineárních rovnic.
Zcela analogickým postupem definujeme sloupcově schodovitý tvar matic a záměnou řádkových na sloupcové transformace obdržíme algoritmus převádějící matici na takový tvar.
Poznámka. Gaussovu eliminaci jsme zformulovali pro J' ,. obecné skaláry z nějakého okruhu. Zdá se být přirozené, že ve schodovitém tvaru ještě vynáso
- 1 bením vhodnými skaláry dosáhneme jednotkových 5 koeficientů na výsledné nenulové „diagonále" nad nulami v matici a dopočítáme řešení. To ale pro obecné skaláry nepůjde, představte si třeba celá čísla Z.
Pro řešení systémů rovnic nemá ale vůbec uvedený postup rozumný smysl, když jsou mezi skaláry dělitelé nuly. Promyslete si pečlivě rozdíl mezi K = Z, K = M a případně Z2 nebo Z4.
2.8. Matice elementárních transformací. V dalším budeme už pracovat jen s polem skalárů K, každý nenulový skalár tedy má inverzní prvek.
Všimněme si, že elementární řádkové (resp. sloupcové) transformace odpovídají vynásobením zleva (resp. zprava) následujícími maticemi:
(1) Přehození /-tého a 7-tého řádku (resp. sloupce)
/l 0
o '•.
\
1/
2.10. Komplexní čísla jako matice. Uvažme množinu matic a, b e M}. Všimněte si, že C je uzavřená na
C
h^a + bi splňuje f (M + N)
f(M) + f(N) i
iM™ a násobení matic a dále ukažte, že přiřazení / \-b aý
f(M ■ N) = f(M) ■ f(N) (na levých stranác rovností se jedná o sčítání a násobení matic, na pravých o sčítání a násobení komplexních čísel). Na množinu C spolu s násobením a sčítáním matic lze tedy nahlížet jako na těleso C komplexních čísel. Zobrazení / se pak nazývá izomorfismem (těles). Je tedy například
3 5\ /8 -9\ _ / 69 13' -5 3J ' \9 8 ) ~ V-13 69y
což odpovídá tomu, že (3 + 5/) • (8 — 9i) = 69 — 13/.
□ 2.11. Vyřešte maticové rovnice
1 3
3 8
■X,
1 2 3 4
X
2 •
1 3
3 8
Řešení. Zjevně neznámé Xi a X2 musejí být matice 2x2 (aby uvažované součiny matic existovaly a výsledkem byla matice 2x2). Položme
X,
X,
,c\ dij ' \c2 d2/
a roznásobme matice v první zadané rovnici. Má platit
ci\ + 3c 1 3ai + 8ci
bi + 3di 3bi + Mi
1 2 3 4
tj. má být
Cli
3ai
+ +
3ci
ici
3b i
+ 3di
+ Sdi
1,
2,
3,
4,
Xi
Sečtením (—3)násobku první rovnice se třetí dostáváme ci = 0 a následně ai = l. Podobně sečtením (—3)násobku druhé rovnice se čtvrtou dostáváme d\ = 2 a poté b\ = —4. Je tedy
'\
v0 2
Hodnoty a2,b2, c2, d2 najdeme odlišným způsobem. Např. použitím vzorce
'a b\~ľ 1 (d -b
vc d J ad - bc \-c a který platí pro libovolná čísla a, b, c, d e M (přičemž inverzní matice existuje právě tehdy, když ad — bc 7^ 0), spočtěme
3 s) y 3 -1.
Vynásobení zadané rovnice touto maticí zprava dává
'\ 2\ {-% 3
X2
3 4
■1
79
B. MANIPULACE S MATICEMI
1. VEKTORY A MATICE
a tudíž
-2 1 ■12 5
□
2.12. Které z matic
1/2 0 1/3N 0 1 1/2 1/2 0 1/6>
/1/3 1/2 0 0 \
1/2 1/3 0 0
0 1/6 1/6 1/3
\l/6 0 5/6 2/3/
jsou regulární?
/ 0 1 0
C = 1/4 0 1/2
\3/4 0 1/2
/o 1 0 0\
0 0 0 1
1 0 0 0
0 1 v
Řešení. Neboť
1/7 6/49 \ 6/7 43/49/
'3/8
C"
1/4 3/8 ,3/8 3/8
1/4 l/4> 1/4
1/2,
matice A a C jsou regulární; a neboť
'1/2 0 1/3 0 1 1/2 vl/2 0 1/6
bude prostřední sloupec matice B" vždy (pro n e rem (0, 1, 0)T, tj. matice B nemůže být regulární. Součin
N) vekto-
/1/3 1/2 0 0 \
1/2 1/3 0 0
0 1/6 1/6 1/3
\l/6 0 5/6 2/3/
0 0
a/6 + b/3 \5a/6 + 2b/3/
a, b e
M o
a \bj
implikuje, že matice D2 bude mít v pravém horním rohu nulovou dvourozměrnou (čtvercovou) submatici. Opakováním této implikace dostáváme, že stejnou vlastnost mají matice D3 = D ■ D2, D4 = D ■ D3, D" = D ■ Dn~\ tudíž matice D není regulární. Matice E je permutační (v každém řádku a sloupci má právě jeden nenulový prvek, a to 1). Není obtížné si uvědomit, že mocniny permutační matice jsou opět permutační matice. Matice E proto Itakeg
není regulární. To lze rovněž ověřit výpočtem mocnin E2, É3, E4. Matice E4 je totiž jednotková. □
2.13. Výpočet inverzní matice. Spočtěte inverzní matice k maticím
B
Poté určete matici (Ar • B)
(2) Vynásobení z-tého řádku (resp. sloupce) skalárem a: /l \
1
1
V i/
(3) Sečtení /-tého řádku (resp. sloupce) s 7-tým /l 0 \
o '•.
1/
Toto prostinké pozorování je ve skutečnosti velice pod-\^ statné, protože součin invertibilních matic je in-vertibilní (viz rovnost (2.1)) a všechny elementární transformace jsou nad polem skalárů in-vertibilní (sama definice elementárních transformací zajišťuje, že inverzní transformace je stejného typu a je také snadné určit její matici).
Pro libovolnou matici A tedy dostaneme násobením vhodnou invertibilní maticí P = Pk ■ ■ ■ P\ zleva (postupné násobení k maticemi zleva) její ekvivalentní řádkový schodovitý tvar A' = P ■ A.
Jestliže obecně aplikujeme tentýž eliminační postup na sloupce, dostaneme z každé matice B její sloucový schodovitý tvar B! vynásobením zprava vhodnou invertibilní maticí Q = ô 1 • • • Qi- Pokud ale začneme s maticí B = A' v řádkově schodovitém tvaru, eliminuje takový postup pouze všechny dosud nenulové prvky mimo diagonálu matice a závěrem lze ještě i tyto elementárními operacemi změnit na jedničky. Celkem jsme tedy ověřili důležitý výsledek, ke kterému se budeme mnohokrát vracet:
2.9. Věta. Pro každou matici A typu m/n nad polem skalárů K existují čtvercové invertibilní matice P dimenze m a Q dimenze n takové, že matice P -Ajev řádkově schodovitém tvaru a
PA-Q
r ■ . 0 .. 0\
0. . 1 0 ... . .. 0
0. . 0 1 0 . .. 0
0. . 0 0 0 . .. 0
v /
80
KAPITOLA 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
2.10
2 .10a
2.10. Algoritmus pro výpočet inverzní matice. V předchozích úvahách jsme se dostali prakticky k úplnému algoritmu pro výpočet inverzní matice. Během jednoduchého níže uvedeného postupu buďzjistíme, že inverze neexistuje, nebo bude inverze spočtena. I nadále pracujeme nad polem skalárů.
Ekvivalentní řádkové transformace se čtvercovou maticí A dimenze n vedou k matici P' takové, že matice P'-A bude v řádkově schodovitém tvaru. Přitom může (ale nemusí) být jeden nebo více posledních řádků nulových. Jestliže má existovat inverzní matice k A, pak existuje i inverzní matice k P'-A. Jestliže však je poslední řádek v P' ■ A nulový, bude nulový i poslední řádek v P' ■ A ■ B pro jakoukoliv matici B dimenze n. Existence takového nulového řádku ve výsledku (řádkové) Gaussovy eliminace tedy vylučuje existenci A-1.
Předpokládejme nyní, že A-1 existuje. Podle předchozího, nalezneme řádkově schodovitý tvar bez nulového řádku, tzn. že všechny diagonální prvky v P' ■ A jsou nenulové. Pak ovšem pokračováním eliminace pomocí řádkových elementárních transformací od pravého dolního rohu zpět a vynor-mováním diagonálních prvků na jedničky získáme jednotkovou matici E. Jinými slovy, najdeme další invertibilní matici P" takovou, že pro P = P" ■ P' platí P • A = E. Výměnou řádkových a sloupcových transformací lze za předpokladu existence A-1 stejným postupem najít Q takovou, že A ■ Q = E. Odtud
P = p . E = P ■ (A • Q) = (P ■ A) • Q = Q.
To ale znamená, že jsme nalezli hledanou inverzní matici
A~l = P = Q
k matici A. Zejména se tedy v okamžiku nalezení matice P s vlastností P ■ A = E už nemusíme s žádnými dalšími výpočty namáhat, protože víme, že již jistě jde o inverzní matici.
Prakticky tedy můžeme postupovat takto:
' výpočet inverzní matice
Vedle sebe napíšeme původní matici A a jednotkovou matici E, matici A upravujeme řádkovými elementárními úpravami nejprve na schodovitý tvar, potom tzv. zpětnou eliminací na diagonální matici a v té násobíme řádky inverzními prvky z K. Tytéž úpravy postupně prováděné s E vedou právě k hledané matici A-1. Pokud tento algoritmus narazí na vynulování celého řádku v původní matici, znamená to, že matice inverzní neexistuje.
2.11.
Lineární závislost a hodnost. V předchozích úvahách a počtech s maticemi jsme stále pracovali / se sčítáním řádků nebo sloupců coby vektorů, spolu s jejich násobením skaláry. Takové operaci říkáme lineární kombinace. V abstraktním pojetí se k
Řešení. Inverzní matici nalezneme tak, že vedle sebe napíšeme matici A a matici jednotkovou. Pomocí řádkových transformací pak převedeme matici A na jednotkovou. Tímto matice jednotková přejde na matici A-1. Postupnými úpravami dostáváme
-1
0
1
0 -1
1 1 0 4
-4 11 --2
přičemž v prvním kroku jsme odečetli od prvního řádku třetí, ve druhém jsme (—5)násobek prvního přičetli ke druhému a současně jeho (—3)násobek ke třetímu, ve třetím kroku jsme odečetli od druhého řádku třetí, ve čtvrtém jsme (—2)násobek druhého přičetli ke třetímu, v pátém kroku jsme (—5)násobek třetího řádku přičetli ke druhému a jeho 2násobek k prvnímu, v posledním kroku jsme pak zaměnili druhý a třetí řádek. Zdůrazněme výsledek
/ 3 -4 3 A"1 = 1 -2 2
\-7 11 -9y
Upozorněme, že při určování matice A-1 jsme díky vhodným řádkovým úpravám nemuseli počítat se zlomky. Přestože bychom si mohli obdobně počínat při určování matice B~l, budeme raději provádět více názorné (nabízející se) řádkové úpravy. Platí
0
0
1
0
1
\
3
0
0
1
1 0 0 1 2 -3 \ /1 0 0 1 2 -3
0 1 0 -1 1 -1 l A o 1 0 -1 1 -1
0 0 1 3 o -f i; 0 1 0 -2 3
tj-
B~
Využitím identity (ť.B)-
B-1 ■ (AT)~l = B-1 ■ (A"1)2
81
C. DETERMINANTY
1. VEKTORY A MATICE
a znalosti výše vypočítaných inverzních matic lze obdržet
1 2 -1 1
-14 -9 42 -10 -5 27 17 10 -491
1
2.14. Vypočítejte inverzní matici k matici
2.15. Nalezněte inverzní matici k matici
/8 3
5 2
0 0
0 o
\o o
o o 0\
0 0 0
-10 0
0 1 2
0 3 5/
2.16. Zjistěte, zda existuje inverzní matice k matici
/ll 1 1 \
1 1 -1 1 1-1 1 -1
v -1 -1 lJ
Pokud ano, určete tuto matici C-1.
, přičemž i je imaginární jednotka;
2.Í& Napište inverzní matici k n x n matici (n > 1)
/2-n 1 ••• 1 1 \ 1 2-n
1
V 1
1
2-n 1 1 2-n)
□
2 .10b
C. Determinanty
Ověřte si nejprve na následujícím příkladu, že umíte počítat determinanty matic 2 x 2 a 3 x 3 (pomoci Saarusova pravidla):
operacím s vektory vrátime za chvíli v 2.24, bude ale užitečné pochopit podstatu už nyní. Lineární kombinací řádků (nebo sloupců) matice A = (a^-) typu m/n rozumíme výraz
c\uh H-----h ckui
kde c i jsou skaláry, u j = (a
n-
a m) jsou řádky (nebo
(a
amj) jsou sloupce) matice A.
Jestliže existuje lineární kombinace daných řádků s alespoň jedním nenulovým skalárním koeficientem, jejímž výsledkem je nulový řádek, říkáme, že jsou tyto řádky lineárně závislé. V opačném případě, tj. když jedinou možností jak získat nulový řádek je vynásobení výhradně nulovými skaláry, jsou tyto řádky lineárně nezávislé.
Obdobně definujeme lineárně závislé a nezávislé sloupce matice.
Předchozí výsledky o Gausově eliminaci můžeme teď J' „ intepretovat tak, že počet výsledných nenulových „schodů" v řádkově nebo sloupcově schodovitém tvaru je vždy roven počtu lineárně nezávislých řádků matice, resp. počtu lineárně nezávislých sloupců matice. Označme Eh matici z věty 2.9 s h jedničkami na diagonále a předpokládejme, že dvěma různými postupy dostaneme různá h' < h. Pak ovšem podle našeho postupu budou existovat také invertibilní matice P a. Q takové, že
P-Eh,-Q = Eh.
V součinu Ehi ■ Q bude více nulových řádků ve spodní části matice, než kolik má být jedniček v Eh a přitom se k nim máme dostat už jen řádkovými transformacemi. Zvýšit počet lineárně nezávislých řádků ale pomocí elementárních řdáko-vých transformací nelze. Proto je počet jedniček v matici P ■ A ■ Q ve větě 2.9 nezávislý na volbě našeho postupu eliminace a je roven jak počtu lineárně nezávislých řádků v A, tak počtu lineárně nezávislých sloupců v A. Tomuto číslu říkáme hodnost matice a značíme je h (A). Zapamatujme si výsledné tvrzení:
Věta. Nechť A je matice typum/n nadpolem skalárů K. Matice A má stejný počet h( A) Unárně nezávislých řádků a lineárně nezávislých sloupců. Zejména je hodnost vždy nejvýše rovna menšímu z rozměrů matice A.
Algoristmus pro výpočet inverzních matic také říká, že čtvercová matice A dimenze m má inverzi, právě když je její hodnost rovna počtu řádků m.
2.12. Matice jako zobrazení. Zcela stejně, jak jsme s maticemi pracovali v geometrii roviny, viz 1.29, můžeme každou čtvercovou matici A interpretovat jako zobrazení
A :
x A ■ x.
Díky distributivitě násobení matic je zřejmé, jak jsou zobrazovány lineární kombinace vektorů takovými zobrazeními:
A • (a x + b y) = a (A • x) + b (A • y).
82
KAPITOLA 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
2 .10c
tady byla ještě ukázka matic rotací - patrně budou v příkladech, tak jsou tady
vyprocentované
Přímo z definice je také vidět (díky asociativitě násobení matic), že skládání zobrazení odpovídá násobení matic v daném pořadí. Invertibilní matice tedy odpovídají bijektivním zobrazením.
Z tohoto pohledu je velice zajímavá věta 2.9. Můžeme ji číst tak, že hodnost matice určuje, jak velký je obraz celého W v tomto zobrazení. Skutečně, je-li A = P ■ Ek ■ Q s maticí Ek s k jedničkami jako v 2.9, pak invertibilní Q napřed jen bijektivně „zamíchá" n-rozměrné vektory v W, matice Ek pak „zkopíruje" prvních k souřadnic a vynuluje n — k zbývajících. Tento „^-rozměrný" obraz už pak následně násobení invertibilní P nemůže zvětšit.
2.13. Řešení systémů lineárních rovnic. K pojmům dimenze, lineární nezávislost apod. se vrátíme ve třetí části této kapitoly. Již teď si ale můžeme povšimnout, co právě dovozené výsledky říkají o řešení systému lineárních rovnic. Jestliže budeme uvažovat matici systému rovnic a přidáme k ní ještě sloupec požadovaných hodnot, hovoříme o rozšířené matici systému. Postup, který jsme předvedli odpovídá postupné eliminaci proměnných v rovnicích a vyškrtání lineárně závislých rovnic (ty jsou prostě důsledkem ostatních).
Dovodili jsme tedy kompletní informaci o velikosti množiny řešení systému lineárních rovnic v závislosti na hodnosti matice systému. Pokud nám při přechodu na řádkově schodovitý tvar zůstane v rozšířené matici více nenulových řádků než v matici systému, pak žádné řešení nemůže existovat (prostě se daným lineárním zobrazením do požadované hodnoty vůbec netrefíme). Pokud je hodnost obou matic stejná, pak nám při zpětném dopočtu řešení zůstane právě tolik volných parametrů, kolik je rozdíl mezi počtem proměnných n a hodností h (A).
2. Determinanty
V páté části první kapitoly jsme viděli (viz 1.27), že pro čtvercové matice dimenze 2 nad reálnými čísly existuje skalární funkce det, která matici přiřadí nenulové číslo, právě když existuje její
inverze. Neříkali jsme to sice stejnými slovy, ale snadno si to ověříte (viz odstavce počínaje 1.26 a vzorec (1.16)). Determinant byl užitečný i jinak, viz odstavce 1.33 a 1.34, kde jsme si volnou úvahou odvodili, že obsah rovnoběžníka by měl být lineárně závislý na každém ze dvou vektorů definujících rovnoběžník a že je užitečné zároveň požadovat změnu znaménka při změně pořadí těchto vektorů. Protože tyto vlastnosti měl, až na pevný skalární násobek, jedině determinant, odvodili jsme, že je obsah dán právě takto. Nyní uvidíme, že podobně lze postupovat v každé konečné dimenzi.
V této části budeme pracovat s libovolnými skaláry K a maticemi nad těmito skaláry. Naše výsledky o determinantech tedy budou vesměs platit pro všechny komutativní okruhy, zejména tedy třeba pro celočíslené matice.
2.19. Určete determinanty matic:
1 2
2 1
2.20. Spočítejte determinant matice
(\ 3 5 6\ 12 2 2 1112 \0 1 2 1/
Řešení. Začneme rozvíjet podle prvního sloupce, kde máme nejvíce (jednu) nul. Postupně dostáváme
13 5 6 12 2 2 1112 0 12 1
Podle Saarusova pravidla
□
2.21. Nalezněte všechny hodnoty argumentu a takové, že
2 2 2 3 5 6 3 5 6
1 • 1 1 2 - 1 • 1 1 2 + 1 • 2 2 2
1 2 1 1 2 1 1 2 1
-2 _ 2 + 6 = 2.
a 1
0 a
0 1
0 0
1 1
a 0
1.
Pro komplexní a uvedte buď jeho algebraický nebo goniometrický tvar. Řešení. Spočítáme determinant rozvinutím podle prvního sloupce ma-
tice:
D
a 1
0 a
0 1
0 0
1 1
a 0
a 1 1
a ■ 1 a 1
0 0 —a
dále rozvíjíme podle posledního řádku: D = a ■ (—a)
a 1 1 a
2/ 2
-a (a
1)-
a- + 1 = 0.
2
Celkem dostáváme následující podmínku pro a: a4 — ~2 Substitucí t = a2, pak máme t2 — t + 1 s kořeny t\ cos(7r/3) + i sin(7r/3), t\ = l~2^ = cos(jt/3) — i sin(7r/3) = cos(—jt/3) + i sin(—7T/3), odkud snadno určíme čtyři možné hodnoty parametru a: a\ = cos(7r/6) + / sin(7r/6) = V3/2 + i/2, a2 = cos(77r/6) + i sin(77r/6) = — V3/2 — i/2, aj, = cos(—it/6) + i sin(—jt/6) = V3/2 — i/2, a4 = cos(57r/6) + i sin(57r/6) = -V3/2 + //2. □
83
C. DETERMINANTY
2. DETERMINANTY
/andermond
2 .10c
2.22. Vandermondův determinant. Dokažte vzorec pro tzv. Vander-mondův determinant, tj. determinant Vandermondovy matice:
1 1 . 1
«1 «2 .
V n = a\ a2 . a2 "n = n (aJ ~ l i.
Řešení.
Ukážeme opravdu nádherný důkaz indukcí, nad nímž srdce mate-
§., matika zaplesá. Pro n = 2 vztah triviálně platí. Nechť tedy platí pro determinant matice určené čísly «i, ..., ak a dokážeme, v že platí i pro výpočet determinantu Vandermondovy matice určenou čísly «i, ..., ak+i. Uvažme determinant Vk+i jako polynom P v proměnné ak+i. Z definice determinantu vyplývá, že tento polynom bude stupně k v této proměnné a navíc čísla a\,...,ak budou jeho kořeny: nahradíme-li totiž ve Vandermondově matici Vk+i poslední sloupec tvořený mocninami čísla ak+i libovolným z předchozích sloupců tvořeným mocninami čísla «;-, tak hodnota tohoto pozměněného determinantu je vlastně hodnotou Vandermondova determinantu (jakožto polynomu v proměnné ak+\) v bodě «,. Tato je ovšem nulová, neboť determinant z matice se dvěma shodnými, tedy lineárně závislými, sloupci je nulový. To znamená, že «;- je kořenem P. Nalezli jsme tedy k kořenů polynomu stupně k, tudíž všechny jeho kořeny a P musí být tvaru P = C(ak+\ — a\)(ak+\ — a2) ■ ■ ■ (ak+\ — ak), kde C je nějaká konstanta, resp. vedoucí koeficient polynomu P. Uvážíme-li však výpočet determinantu Vk+\ pomocí rozvoje podle posledního sloupce, tak vidíme, že C = Vk, což už dokazuje vzorec pro Vk+\. □ Jiné řešení, (viz Návody a řešení cvičení)
2.23. Nenulovost determinantu čtvercové matice charakterizuje všechny invertibilní čtvercové matice: zjistěte, zdaje matice
/ 3 2-1
4 1 2
-2 2 4
V 2 3-4
2 \ -4 1
8/
2.14. Definice determinantu. Připomeňme, že bijektivní zobrazení množiny X na sebe se nazývá permutace množiny X, viz 1.7. Je-li X = {1, 2, ...,«}, lze permutace zapsat pomocí výsledného pořadí ve formě tabulky:
1 2 ... n
vct(1) o (2) ... a (ji),
Prvek x e X se nazývá samodružným bodem permutace a, je-li a(x) = x. Permutace a taková, že existují právě dva různé prvky x,y e X s a(x) = y, zatímco všechna ostatní z e X jsou samodružná, se nazývá transpozice, značíme ji (x, y). Samozřejmě pro takovou transpozici platí také a (y) = x, odtud název.
V dimenzi 2 byl vzorec pro determinant jednoduchý -vezmeme všechny možné součiny dvou prvků, po jednom z každého sloupce a řádku matice, opatříme je znaménkem tak, aby při přehození dvou sloupců došlo ke změně celkového znaménka, a výrazy všechny (tj. oba) sečteme:
det A = ad — bc
'a
\c d j
Obecně, uvažujme čtvercové matice A = (a^) dimenze n nad K. Vzorec pro determinant matice A bude také poskládaný ze všech možných součinů prvků z jednotlivých řádků a sloupců:
_ j Definice determinantu |_
Determinant matice A je skalár det A vztahem
\A\ definovaný
sgn(er)útiCT(i) • a2a(2) ■ ■ ■ ana(n)
tre£„
kde £„ je množina všech možných permutací na {1, ...,«} a znaménko sgn pro každou permutaci a ještě musíme popsat. Každý z výrazů
sgn(°r)fll 0 1 1 v2 0 0>
Napište matici tohoto zobrazení v bázi
(/i,/2,/3) = ((1,1,0), (-1,1,1), (2,0, 1)).
Řešení. Matice přechodu T od báze / = (/i, f2, f3) k standardní bázi, tj. bázi danou vektory (1, 0, 0), (0, 1, 0), (0, 0, 1), získáme podle Tvrzení 2.25 zapsáním souřadnic vektorů f\, f2, f3 ve standardní bázi do sloupců matice přechodu T. Máme tedy
Matice přechodu od standardní báze k bázi / je potom
Matice zobrazení v bázi / je potom
T~lAT
2 0
□
101
G. LINEÁRNÍ ZOBRAZENÍ
3. VEKTOROVÉ PROSTORY A LINEÁRNÍ ZOBRAZENÍ
2.63. Uvažme vektorový prostor mnohočlenů jedné neznámé stupně nejvýše 2 s reálnými koeficienty. V tomto prostoru uvažme bázi 1, x, x2. Napište matici zobrazení derivace v této bázi a také v bázi 1 + x2,
x, x + x2.
/O 1 0\ /O 1 1 \ Řešení. 002,21 3. □ \0 0 0/ \0 -1 -1/
2.64. Ve standardní bázi v M3 určete matici rotace o 90° v kladném smyslu kolem přímky (ŕ, t,ť), t e M, orientované ve směru vektoru (1, 1, 1). Dále určete matici této rotace v bázi
£=((1,1,0), (1,0,-1), (0,1,1)).
Řešení. Snadno určíme matici uvažované rotace a to ve vhodné bázi, totiž v bázi dané směrovým vektorem přímky a dále dvěma navzájem kolmými vektory v rovině x + y + z = 0, tedy v rovině vektorů kolmých k vektoru (1, 1, 1). Uvědomme si, že matice rotace v kladném
smyslu o 90° v nějaké ortonormální bázi v
0
je
0 -1
1 0
, v ortogo-
nální s velikostmi vekorů k, l potom
,2.24 Zvolíme-li v ro-
-k/l yl/k 0
vině x + y + z = 0 kolmé vektory (1, —1,0) a (1, 1,-2) o velikostech V2 a y/6, tak v bázi / = ((1, 1, 1), (1, -1,0), (1, 1, -2)) má uvažo-
/l 0 0 \ vaná rotace matici I 0 0 — V3 I. Abychom získali matici uva-
\0 1/V3 0 / žované rotace ve standardní bázi, stačí nám transformovat matici již
známým způsobem. Matici přechodu T od báze / ke standardní dostaneme zapsáním souřadnic (ve standardní bázi) vektorů báze / do
/i i i
sloupců matice T: T = I 1 —1 1
V 0 "2.
matici R máme
. Celkem tedy pro hledanou
/l 0 0
(2.3) R = T ■ 0 0 -y/3 I • T~l
\o í/Vš o
/ 1/3 1/3-V3/3 l/3 + V3/3\
(2.4) = 1/3 + V3/3 1/3 1/3 - V3/3
\l/3-V3/3 1/3 + V3/3 1/3 /
Tento výsledek můžeme ověřit dosazením do matice obecné rotace (2.1), normováním vektoru (1, 1, 1) dostáváme vektor (x, y, z) = (l/VŠ, 1/V3, 1/V3), cos( Z dvou lineárních zobrazení / : V^Wa.g:W^Z)e opět lineární zobrazení.
(2) Lineární zobrazení / : V -> W je izomorfismus, právě když Im / = W a Ker / = {0} C V. Inverzní zobrazení k izomorfismu je opět izomorfismus.
(3) Pro libovolné podprostory V\, V2 C V a lineární zobrazení / : V -> W platí
/(Vi + V2) = /(V0 + f(V2),
/(Vi n v2) c f (vo n f(v2).
(4) Zobrazení „přiřazení souřadnic" u : V -> K" dané libovolně zvolenou bází u = (u\, ..., un) vektorového prostom V je izomorfismus.
(5) Dva konečněrozměrné vektorové prostory jsou izomorfní právě když mají stejnou dimenzi.
(6) Složení dvou izomorfismu je izomorfismus.
Důkaz. Ověření prvního tvrzení je velmi snadné cvičení.
Pro důkaz druhého si uvědomme, že je-li / Y^- lineární bijekce, pak je vektor w vzorem line-rání kombinace au +bv, tj. w = f~1(au+bv),
právě když
f(w) =au+bv = f (a ■ f-\u) + b ■ f~\v)).
Je tedy také w = af~l(u) + bf~l(v) a tedy je inverze k lineární bijekci opět lineární zobrazení.
Dále, / je surjektivní, právě když Im / = W a pokud Ker / = {0}, pak f(u) = f (v) zaručuje f(u — v) = 0, tj. u = v. Je tedy v tom případě / injektivní.
102
KAPITOLA 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
Další tvrzení se dokáže snadno přímo z definic. Najděte si protipříklad, že v dokazované inkluzi opravdu nemusí nastat rovnost! Zbý vaj ící body j sou j iž zřej mé. □
2.36. Opět souřadnice. Uvažujme libovolné vektorové prostory V a W nad K s dim V = n, dim W = m a mějme lineární zobrazení / : V -» W. Pro každou
u„) na V, v = (vi,
v„)
volbu bází u = (u\ V1 na W, máme k dispozici příslušná přiřazení souřad nic a celou situaci několika právě zmíněných zobrazení za chycuje následující diagram:
Spodní šipka /„je definována zbylými třemi, tj. jako zobrazení jde o složení
fu,v =vo f o u~l.
Matice lineárního zobrazení
Každé lineární zobrazení je jednoznačně určeno svými hodnotami na libovolné množině generátorů, zejména tedy na vektorech báze u. Označme
f(ux) = an ■ vi + a2\ ■ v2 -\-----h amivm
f(u2) =a12-v1+a22-v2-\-----h am2vm
f(un) — ai„ ■ vi + a2n ■ v2 + ■ ■ ■ + amnvm
tj. skaláry tvoří matici A, kde sloupce jsou souřadnice hodnot f(uj) zobrazení / na bázových vektorech vyjádření v bázi v na cílovém prostoru W.
Matici A = (ciij) nazýváme maticí zobrazení f v bázích u, v.
Pro obecný vektor u = x\u\ + • • • + xnun e V spočteme (vzpomeňme, že sčítání vektorů je komutativní a distributivní vůči násobení skaláry)
f(u) = xxfiux) H-----\-xnf(un)
= x\{a\\V\-\- • ■+amivm) + ■ ■ ■ + x„(ai„vi+- ■ ■+amnvm) = (xiútn+- • ■+x„ai„)vi + ■ ■ ■ + (x\ami+- ■ ■+xnamn)vm.
Pomocí násobení matic lze nyní velice snadno a přehledně zapsat hodnoty zobrazení fu,v(w) definovaného jednoznačně předchozím diagramem. Připomeňme si, že vektory v W chápeme jako sloupce, tj. matice typu r/1
fu,v(u(w)) = v(f(w)) = A ■ u(w).
Naopak, máme-li pevně zvoleny báze na V i W, pak každá volba matice A typu m/n zadává jednoznačně lineární zobrazení K" -> Km a tedy i zobrazení / : V -> W. Máme-li tedy zvoleny báze prostorů V a.W, odpovídá každé volbě matice typu m/n právě jedno lineární zobrazení V -> W a
jednotkového vektoru (x, y, z) jiným způsobem než, jsme učinili v [], analogicky jako v předchozím příkladě. V bázi / = ((x, y, z), (-y, x, 0), (zx, zy, z2 - 1)), tedy v ortogonální bázi tvořené směrovým vektorem osy rotace a dvěma navzájem kolmými vektory o shodných velikostech Vl — z2
ležícími v rovině kolmé na osu, má uvažovaná rotace matici
/ 1 0 0 \
A = I 0 cos(
-2 1 -2
'10 0 1 - 2nnT = I 0 1 0
1
2 - 1 1 1 001/ 3 V1 1 1 / J\-2-2 1
□
Nyní jeden známý, ale velmi pěkný příklad.
2.68. Určete součet úhlů, které v rovině M2 svírají s osou x postupně vektory (1, 1), (2, 1) a (3, 1) (obrázek).
Řešení. Uvážíme-li rovinu M2 jakožto Gaussovu rovinu komplexních čísel, tak uvedené vektory odpovídají komplexním číslům 1 + i, 2 + i a 3 + i a máme najít součet jejich argumentů, tedy podle Moivrovy věty argument jejich součinu. Jejich součin je (1 + i) (2 + i) (3 + i) = (1 + 3/)(3 + 0 = 10i, tedy ryze imaginární číslo s argumentem jt/2 a tedy hledaný součet je roven právě jt/2. □
103
G. LINEÁRNÍ ZOBRAZENÍ
3. VEKTOROVÉ PROSTORY A LINEÁRNÍ ZOBRAZENÍ
2.69. Uvažme komplexní čísla jako reálny vektorový prostor a za jj^p ' jeho bázi zvolme 1 a i. V této bázi určete matici náiilgdují^ cích lineárních zobrazení:
a) konjugace,
b) násobení číslem (2 + i).
Určete matici těchto zobrazení v bázi (1 — z), (1 + z). Řešení.
■> G -O-
'2 -V
b) V obou bazích je matice stejná a to Zamyslete se, proč tomu tak je.
1
□
2.70. Uvažme komplexní čísla C j ako reálný vektorový prostor. Určete souřadnice čísla 2 + z v bázi dané kořeny polynomu x2 — x + 1.
Řešení.
□
2.71. Určete matici A, která ve standardní bázi prostoru M3 zadává kolmou projekci do vektorového podprostoru generovaného vektory ux = (-1, 1,0) aw2 = (-1,0, 1).
Řešení. Nejprve poznamenejme, že uvedený podprostor je rovinou procházející počátkem s normálovým vektorem w3 = (1,1,1). Uspořádaná trojice (1, 1, 1) je totiž očividným řešením soustavy
-Xi -Xi
+ x2
+ *3
0,
o,
tj. vektor w3 je kolmý na vektory u\, u2. Podotkněme rovněž, že jsme tento příklad již vyřešili (matici A známe z dřívějšího příkladu).
Při dané projekci se vektory ui a. u2 musejí zobrazit na sebe a vektor w3 potom na nulový vektor. V bázi složené po řadě z vektorů
2 2 6
u i, U2, w3 je proto matice této projekce I—'--
0 0
0 1 0
0 0 0
Pomocí matic přechodu
1 -1
0
1
ukázali jsme bijekci mezi maticemi příslušného rozměru a lineárními zobrazeními V -» W.
2.37. Matice přechodu mezi souřadnicemi. Jestliže za V i W zvolíme tentýž prostor, ale s různými bázemi, a za / identické zobrazení, vyjadřuje postup z předchozího odstavce vektory báze u v souřadnicích vzhledem k v. Označme výslednou matici T. Když pak zadáme vektor u
U = X\U\ -\-' ' ' -\- Xnlln
v souřadnicích vzhledem ku a dosadíme za u{ jejich vyjádření pomocí vektorů z y_, obdržíme souřadné vyjádření x = (iči, ..., xn) téhož vektoru v bázi v. Stačí k tomu přesklá-dat pořadí sčítanců a vyjádřit skaláry u jednotlivých vektorů báze.
Ve skutečnosti teď děláme totéž, co v předchozím odstavci pro speciální případ identického zobrazení idy na vektorovém prostoru V. Matice tohoto identického zobrazení je T a tedy nutně musí naznačený přímý výpočet dát x = T ■ x. Situace se zobrazena na diagramu:
Výslednou matici T nazýváme matice přechodu od báze u vektorového prostoru V k bázi v téhož prostoru. Přímo z definice vyplývá:
| výpočet matice přechodu |_
Tvrzení. Matici T přechodu od báze u k bázi v získáme tak, ze souřadnice vektorů báze u v bázi v napíšeme do sloupců matice T.
1
Funkce matice přechodu je taková, že známe-li souřadnice x vektoru v bázi u, pak jeho souřadnice v bázi v se obdrží vynásobením sloupce x maticí přechodu (zleva). Protože inverzní zobrazení k identickému je opět totéž identické zobrazení, je matice přechodu vždy invertibilní a její inverze je právě matice přechodu opačným směrem, tj. od báze v k bázi u.
2.38. Více souřadnic. Nyní si ukážeme, jak se skládají souřadná vyjádření lineárních zobrazení. Uvažme ještě další vektorový prostor Z nad K dimenze k s bází w, lineární zobrazení g : W -> Z a označme příslušnou matici g^^.
V
W
fu,v
8v_,w
104
KAPITOLA 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
Složení go f na horním řádku odpovídá matici zobrazení W -» Kk dole a přímo spočteme (píšeme A pro matici / a B pro matici g ve zvolených bazích):
8v,w o fu,Áx) = w o g o v'1 o v o f o u~l
= B ■ (A ■ x) = (B ■ A) ■ x = (g o /)„,„,(*)
pro všechny x e W. Skládání obražení tedy odpovídá násobení příslušných matic. Všimněte si také, že isomorfismy odpovídají právě invertibilním maticím.
Stejný postup nám dává odpověďna otázku, jak se změní matice zobrazení, změníme-li báze na definičním oboru i oboru hodnot:
V
V
f
W
fu,v
W
kde T je matice přechodu od w' k u a S je matice přechodu od 1/ k v. Je-li tedy A původní matice zobrazení, bude nová dána jako A' = S^AT.
Ve speciálním případě lineárního zobrazení / : V -» V, tj. zobrazení má stejný prostor V jako definiční obor i obor hodnot, vyjadřujeme zpravidla / pomocí jediné báze u prostoru V. Pak tedy přechod k nové bázi w' s maticí před-chodu T od u/ k u bude znamenat změnu matice zobrazení na A' = T~1AT.
2.39. Lineární formy. Obzvlášť jednoduchým a zároveň důležitým případem lineárních zobrazení jsou tzv. lineární formy. Jde o lineární zobrazení z vektorového prostoru V nad polem skalárů K 'jLj^=— do skalárů K. Jsou-li dány souřadnice na V, je přiřazení jednotlivé /-té souřadnice vektorům právě takovou lineární formou. Přesněji řečeno, pro každou volbu báze v = (i>i, ..., vn) máme k dispozici lineární formy v* : V -» K takové, že v*(vj) = tj. nula pro různé indexy i a. j a. jednička pro stejné.
Vektorový prostor všech lineárních forem na V značíme V* a říkáme mu duální prostor vektorovému prostoru V. Předpokládejme nyní, že prostor V má konečnou dimenzi n. Bázi V* sestavenou z přiřazování jednotlivých souřadnic
jako výše nazýváme duální báze. Skutečně se jedná ož>á3ÍL prostoru V*, protože jsou tyto formy zjevně lineárně nezávislé (prověřte si!) a je-li a libovolná forma, pak platí pro každý vektor u = x\V\ + ■ ■ ■ + x„v„
a(u) = x\a(v\) + • • • + x„a(v„)
= íx(i;i)i;*(h) H-----h a(vn)v*(u)
a je tedy a lineární kombinací forem v*.
Při pevně zvolené bázi {1} na jednorozměrném prostoru skalárů K jsou s každou volbou báze v na V lineární formy a ztotožněny s maticemi typu l/n, tj. s řádky y. Právě komponenty těchto řádků jsou souřadnicemi obecných lineárních forem v duální bázi v*. Vyčíslení takové formy na vektoru je
od báze (u\, u2, u3) ke standardní bázi a od standardní báze k bázi («i, «2, «3) získáme
1
□
2.72. Napište matici zobrazení kolmé projekce do roviny procházející počátkem a kolmé na vektor (1, 1, 1).
Řešení. Obraz libovolného bodu (vektoru) x = (xi,x2,x3) e M3 v uvažovaném zobrazení získáme tak, že od daného bodu odečteme jeho kolmou projekci do normálového směru dané roviny, tedy do směru (1, 1, 1). Tato projekce p je dána (viz 2.3) jako
(x, (1, 1, 1)) _ X\ +X2 + X3 Xi+X2+X3 Xi+X2+X3
1(1, 1, 1)|2 ~ 3 ' 3 ' 3
Výsledné zobrazení je tedy
2xi
(-
X2 ~h X3 2.X2 xl "I- x3 2x3 X\ -\- X2
)
□
2.73. Ve vektorovém prostoru M3 určete matici kolmé projekce na rovinu x + y — 2z = 0.
2.74. Ve vektorovém prostoru M3 určete matici kolmé projekce na rovinu 2x — y + 2z, = 0.
H. Vlastní čísla a vlastní vektory
2.75. Vlastní čísla a vlastní vektory mohou sloužit k názornému popisu lineárních zobrazení, zejména vK2a M3. (1) Uvažme zobrazení s maticí ve standardní bázi
R3 - -> R3, A
Pak dostáváme
—k 0 1
\A-XE\ = 0 1 — X 0
1 0 -X
-X + X + X — 1,
105
H. VLASTNI CISLA A VLASTNI VEKTORY
3. VEKTOROVÉ PROSTORY A LINEÁRNI ZOBRAZENI
1, k3
1. Vlastní vektory s vlastní hodnotou k = 1
s kořeny k\t2 se spočtou:
s bází prostoru řešení, tj. všech vlastních vektorů s touto vlastní hodnotou
«i = (0,1,0), u2 = (1,0,1). Podobně pro k = — 1 dostáváme třetí nezávislý vlastní vektor
(-1,0, 1).
V bázi «i, u2, «3 (všimněte si, že w3 musí být lineárně nezávislý na zbylých dvou díky předchozí větě a u i, u2 vyšly jako dvě nezávislá řešení) má / diagonální matici
Celý prostor R3 je přímým součtem vlastních podprostorů, ffi|-
2~8
Vi © V2, dim Vi = 2, dim V2 = 1. Tento rozklad je dán jednoznačně a vypovídá mnoho o geometrických vlastnostech zobrazení /. Vlastní podprostor V\ je navíc přímým součtem jednorozměrných vlastních podprostorů, které lze však zvolit mnoha různými způsoby (takový další rozklad nemá tedy již žádný geometrický význam).
(2) Uvažme lineární zobrazení / : R2\x\ -» R2[x] definované derivováním polynomů, tj. /(I) = 0, f(x) = 1, f(x2) = 2x. Zobrazení / má tedy v obvyklé bázi (1, x, x2) matici
Charakteristický polynom je \A — k ■ E\ = —k3, existuje tedy pouze jediná vlastní hodnota, k = 0. Spočtěme vlastní vektory:
Prostor vlastních vektorů je tedy jednorozměrný, generovaný konstantním polynomem 1.
2.76. Příklad i se změnou báze. Určete vlastní čísla a vlastní vektory matice
/i i o^
A = 1 2 1 U 2 1,
pak dáno vynásobením příslušného řádkového vektoru y se sloupcem souřadnic x vektoru w e V v bázi u:
ot(u) = y - x = yixi H-----h ynxn.
Zejména tedy vidíme, že pro každý konečněrozměrný prostor V je V* izomorfní prostoru V. Realizace takového izo-morfismu je dána např. naší volbou duální báze ke zvolené bázi na prostoru V.
V tomto kontextu tedy znovu potkáváme skalární součin řádku n skalárů se sloupcem n skalárů, j ak j sme s ním pracovali již v odstavci 2.3 na straně 74.
U nekonečně rozměrného prostoru se věci mají jinak. A Např. už nejjednodušší příklad prostoru všech polynomů K[x] v jedné proměnné je vektorovým prostorem se spočetnou bazí s prvky vt = x1 a stejně jako výše můžeme definovat lineárně nezávislé formy v*. Jakýkoliv formální nekonečný součet YlľĹo ai vľ Je nyní dobře definovanou lineární formou na K[x], protože bude vyčíslován vždy pouze na konečné lineární kombinaci bázových polynomů x1, i = 0, 1, 2, ....
Spočetná množina všech v* tedy není bazí. Ve skutečnosti lze ukázat, že tento duální prostor ani spočetnou bázi mít nemůže.
2.40. Velikost vektorů a skalární součin. V úvahách o geometrii roviny M2 jsme již v první kapitole v od-rf stavci 1.29 pracovali nejen s bázemi a lineár-sz. nimi zobrazeními, ale také s velikostí vektorů a jejich úhly. Pro zavedení těchto pojmů jsme také použili skalárního součinu dvou vektorů v = (x, y) a v' = (x', ý) ve tvaru u ■ v = xx' + yyf. Skutečně, souřadné vyjádření pro velikost v = (x, y) je dáno
IMI = \/x2 + y2 = y/v ■ v,
zatímco (orientovaný) úhel 0 a ||u||2 = (v, v) = 0 pouze při v = 0.
Číslu ||u|| = s/(v, v) říkáme velikost vektoru v.
Vektory v a w e V se nazývají ortogonální nebo kolmé, jestliže (v, w) = 0. Píšeme také v _L w. Vektor v se nazývá normovaný, jestliže ||t>|| = 1.
Báze prostoru V složená z ortogonálních vektorů se nazývá ortogonální báze. Jsou-li bázové vektory navíc i normované, je to ortonormální báze.
Skalární součin se také často zapisuje pomocí obvyklé tečky, tj. (u, v) = u ■ v. Z kontextu je pak třeba poznat, zda jde o součin dvou vektorů (tedy výsledkem je skalár) nebo něco jiného (stejně jsme značili součin matic a také někdy součin skalárů).
Protože je skalární součin lineární v každém ze svých argumentů, bude jistě úplně určen již svými hodnotami na dvojicích bázových vektorů. Skutečně, zvolme si bázi u = (ui, ..., un) prostoru V a označme
(Ui,Uj).
s jí a
Pak ze symetričnosti skalárního součinu plyne Síj z linearity součinu v každém z argumentů dostáváme:
(J2xiUi,J2yjuj) = J2x'>'i{"'- ui) = J2suxiyj-
i j i,j i,j
Pokud je báze ortonormální, je matice S jednotkovou maticí Tím jsme dokázali následující užitečné tvrzení:
skalární součin a ortonormální báze
Tvrzení. Skalární součin je v každé ortonormální bázi dán v souřadnicích výrazem
(x, y) =xT ■ y.
Pro každou obecnou bázi prostoru V existuje symetrická matice S taková, že souřadné vyjádření skalárního součinu je
<*, y)
S-y.
2 . 33b
2.41. Ortogonální doplňky a projekce. Pro každý pevně zvolený podprostor W C V v prostoru se skalárním součinem definujeme jeho ortogonální doplněk takto
W1- = {u s V; u A. v pro všechny v e W}.
Přímo z definice je zjevné, že W1- je vektorový podprostor. Jestliže W C V má bázi («!,..., uk), je podmínka pro W1-dána jako k homogenních rovnic pro n proměnných. Bude tedy mít W1- dimenzi alespoň n—k. Zároveň ale u e IVniy1
Popište toto zobrazení a napište jeho matici v bázi:
ei = [1,-1,1] e2 = [1,2,0] es = [0, 1, 1]
Řešení. Charakteristický polynom dané matice je 1 — A 1 0
2 — X 2
1
1 - X
-A3 + 4A2
2X
-k(k2 - 4k + 2).
Kořeny tohoto polynomu, vlastní čísla, udávají, kdy nebude mít matice
'\-k 1 0 1 2 — X 1 1 2 1-k,
plnou hodnost, tedy soustava rovnic
1 0 1 2-k 1 1 2 1-k,
bude mít i jiné řešení než řešení x = (0, 0, 0). Vlastní čísla tedy jsou
0, 2 + \[2, 2 — \fi. Spočítejme vlastní vektory příslušné jednotlivým
vlastním hodnotám:
• 0: Řešíme tedy soustavu
'1 1 0 1 2 1 .1 2 1
0
Jejím řešením je jednodimenzionální vektorový prostor vlastních vektorů ((1, —1, 1)).
• 2 + a/2: Řešíme soustavu -(1 + V2) 1 0 \ jxA
1 -y/2 1 \\x2 = 0.
1 2 -(1 + V2)/ W
Řešením je jednodimenzionální prostor ((1,1 + \fl, 1 + V2)>.
• 2 — a/2: Řešíme soustavu
'(V2- 1) 1 0 \ (xA
1 V2 1 \\x2 = 0. 1 2 (72 - i)) \x3J
Řešením je prostor vlastních vektorů ((1, 1 — a/2, 1 — \/2)).
Daná matice má vlastní čísla 0,2+a/2 a 2—a/2, kterým přísluší po řadě jednorozměrné prostory vlastních vektorů ((1, —1, 1)), ((1, 1 + a/2, 1 + a/2)) a ((1, 1 - a/2, 1 - a/2)).
Zobrazení tedy můžeme interpretovat jako projekci podél vektoru (1, -1, 1) do roviny dané vektory (1, 1 + a/2, 1 + a/2) a (1, 1 -a/2, 1 — a/2) složenou s lineárním zobrazením daným „natažením" daným vlastními čísly ve směru uvedených vlastních vektorů.
107
H. VLASTNI CISLA A VLASTNI VEKTORY
3. VEKTOROVÉ PROSTORY A LINEÁRNI ZOBRAZENI
Nyní jej vyjádřeme v uvedené bázi. K tomu budeme potřebovat matici přechodu T od standardní báze k dané nové bázi. Tu získáme tak, že souřadnice vektoru staré báze v bázi nové napíšeme do sloupců matice T. My však snadněji zapíšeme matici přechodu od dané báze k bázi standardní, tedy matici T~l. Souřadnice vektorů nové báze pouze zapíšeme do sloupců:
1 1 0>
-1 2 1
, 1 0 L
Potom
/ 0 0 1
t = r-1"1 = (i o -i I,
\-2 1 3
a pro matici B zobrazení v nové bázi pak máme (viz 2.38)
/O 5 2 B = T AT'1 = 10 -2 -1 \0 14 6 f
□
2.77. Naleznete vlastní čísla a jim příslušné vektorové prostory vlastních vektorů matice:
-1 -| 0 -f o \
2 . 33a
2.78. Určete charakteristický polynom \A—kE\, vlastní čísla a vlastní vektory matice
'4 -1 2 1 v2 -1
2.79. Stanovte vlastní hodnoty matice
/-13 5 4 2\ 0 -10 0
V
-30 -12
12
9 4
V
2.80. Udejte příklad čtyřrozměrné matice s vlastními čísly k\ = 6 a k2 = 1 takové, aby násobnost k2 jako kořene charakteristického polynomu byla 3 a aby
(a) dimenze podprostoru vlastních vektorů k2 byla 3;
(b) dimenze podprostoru vlastních vektorů k2 byla 2;
(c) dimenze podprostoru vlastních vektorů k2 byla 1.
2.81. Víte-li, že čísla 1,-1 jsou vlastní hodnoty matice
/-ll 5 4 1\ -3010
V
-21 -9
11 5
8 2 3 1/
znamená (u,u) = 0 a tedy i u = 0 podle definice skalárního součinu. Zřejmě je tedy vždy celý prostor V přímým součtem
v = wew±.
Lineární zobrazení / : V -» V na libovolném vektorovém prostoru se nazývá projekce, jestliže platí
/ o f = f.
V takovém případě je pro každý vektor v e V
v = f (v) + (v- f (v)) e Im(/) + Ker(/) = V
a je-li v e Im(/) a f (v) = 0, pak je i v = 0. Je tedy předloží součet podprostoru přímý. Říkáme, že / je projekce na podprostor W = Im(/) podél podprostoru U = Ker(f). Slovy se dá projekce popsat přirozeně takto: rozložíme daný vektor na komponentu ve W a v U a tu druhou zapomeneme.
Je-li na V navíc skalární součin, říkáme že jde o kolmou projekci, když je jádro kolmé na obraz. Každý podprostor W V tedy definuje kolmou projekci na W. Je to projekce na W podél W^, která je dána pomocí jednoznačného rozkladu každého vektoru u na komponenty uw e W a U e W-1, tj. lineární zobrazení, které uw +uw± zobrazí na uw-
2.42. Existence ortonormální báze. Povšimněme si, že na každém konečněrozměrném reálném vektorovém prostoru jistě existují skalární součiny. Prostě si stačí vybrat libovolnou bázi, prohlásit ji za ortonormální a hned jeden dobře definovaný skalární součin máme. V této bázi pak skalární součiny počítáme podle vzorce v Tvrzení 2.40.
Umíme to ale i naopak. Máme-li zadán skalární součin na vektorovém prostoru V, můžeme vcelku jednoduše početně využít vhodných kolmých projekcí a jakoukoliv zvolenou bázi upravit na ortonormální. Jde o tzv. Grammův-Schmidtův ortogonalizační proces. Cílem této procedury bude z dané posloupnosti nenulových generátorů v\, ..., vk konečněrozměrného prostoru V vytvořit ortogonální množinu nenulových generátorů pro V.
| Grammova-Schmidtova ortogonalizace
Tvrzení. Nechť (u\, ..., uk) je lineárně nezávislá k-tice vektorů prostoru V se skalárním součinem. Pak existuje ortogonální systém vektorů (vi, ..., vk) takový, že Vi e (u\, ..., Ui), i = 1, ..., k. Získáme je následující procedurou:
• Nezávislost vektorů Ui zaručuje, že u\ ^ 0; zvolíme v\ =
U\.
• Máme-li již vektory v\, ..., vi potřebných vlastností, zvolíme vi+\ = ui+i -\-a\V\ +• • • -\-aiVi, kde at = — ^j^r~.
108
KAPITOLA 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
Důkaz. Začneme prvním (nenulovým) vektorem vi a spočteme kolmou projekci v2 do
{viŕ C {{vuv2}).
Výsledek bude nenulový právě, když je v2 nezávislé na v\. Ve všech dalších krocích budeme postupovat obdobně.
V £-tém kroku tedy chceme, aby pro ví+i = uí+i + a\V\ + ■ ■ ■ + aivi platilo (vi+i, v i) = 0, pro všechny i =
Odtud plyne
0 = (Ui+i + atvi H-----h aivi, vt) = {uí+]_, vt) + a^Vi, vt)
a je vidět, že vektory s požadovanými vlastnostmi jsou určeny jednoznačně až na násobek. □
Kdykoliv máme ortogonální bázi vektorového prostoru V, stačí vektory vynormovat a získáme bázi ortonormální. Dokázali jsme proto:
Důsledek. Na každém konečněrozměrném reálném vektorovém prostoru se skalárním součinem existuje ortonormální báze.
V ortonormální bázi se obzvlášť snadno spočtou souřadnice a kolmé projekce. Skutečně, mějme ortonormální bázi (fix, ..., en) prostoru V. Pak každý vektor v = x\e\ + • • • + xnen splňuje
(,, v) = {ei,X]_ei H-----h x„e„) = xt
a platí tedy vždy (2.3) v =
{ex, v)ex H-----h („, v)en.
Pokud máme zadán podprostor W C V a jeho ortonormální bázi (ex, ..., ek), jde ji jistě doplnit na ortonormální bázi (ex, ..., en) celého V. Kolmá projekce obecného vektoru v e V do W pak bude dána vztahem
v h> ( M3 zadaného přiřazením (jci, x2, x3) \-> (x\ + x3, x2, x\ + x3).
2.85. Pauliho matice. Ve fyzice se stav částice se spinem ^ popisuje Pauliho maticemi. Jsou to následující matice 2x2 nad komplexními čísly
'\ 0 ,0 -1.
cti
0 1\ /0 -i
. CT2 = - n I - CT3
1 OJ ' 2 ~ \i o Ukažte, že pro komutátor matic (značený hranatými závorkami) platí [cti, a2] := o\o2— K, kde pro jakékoliv vektory u, v, w, z a skaláry a,b, c ad platí, stejně jako u skalárního součinu
a(au + bv, cw + dz) = aca(u, w) + ada(u, z)
+ bc a(v, w) + bd a(v, z).
Pokud navíc platí
a(u, w) = a(w, u),
hovoříme o symetrické bilineární formě. Jestliže záměna argumentů vede k obrácení znaménka výsledku, hovoříme o antisymetrické bilineární formě.
Již v rovinné geometrii jsme zavedli determinant jako bilineární antisymetrickou formu a, tj. a(u, w) = —a(w, u). Obecně víme z věty 2.17, že je determinant v dimenzi n možno nahlížet jako «-lineární antisymetrickou formu.
Jako u lineárních zobrazení je zřejmé, že každá k-lineární forma je úplně určena svými hodnotami na všech /c-ticích bázových prvků v pevné bázi. V analogii k lineárním zobrazením tyto hodnoty můžeme vnímat jako /c-rozměrné analogie matic. Ukážeme si to v případě k = 2, kde půjde doopravdy o matice, jak jsme je zavedli.
110
KAPITOLA 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
Matice bilineární formy
v\ = u\. Dále
Jestliže zvolíme bázi u na ľ a definujeme pro danou bilineární formu a skaláry atj = a(ui, Uj), pak zjevně dostaneme pro vektory v, w se souřadnicemi x a v (jakožto sloupce souřadnic)
n
a (v, w) = ^2 atjXtyj = yT ■ A ■ x, íj=i
kde A je matice A = («ý).
2.29
Přímo z definice matice bilinerání formy je vidět, že forma je symetrická nebo antisymetrická, právě když má tutéž vlastnost její matice.
Každá bilineární forma a na vektorovém prostoru V definuje zobrazení V -» V*, v h-» a( , u), tj. dosazením pevného vektoru v za druhý argument dostáváme lineární formu, která je obrazem tohoto vektoru. Zvolíme-li pevně bázi na ko-nečněrozměrném prostoru V a duální bázi na V7*, pak jde o zobrazení
y h-» (x h-» yT ■ A ■ x).
4. Vlastnosti lineárních zobrazení
Podrobnějším rozborem vlastností různých typů lineárních zobrazení se nyní dostaneme k lepšímu pochopení nástrojů, které nám vektorové prostory pro lineární modelování procesů a systémů nabízejí.
2.45.
Začneme čtyřmi příklady v nejnižší zajímavé di-ins> _ menzi. Ve standardní bázi roviny R2 se standardním skalárním součinem uvažujme následující matice zobrazení
•W///"'1 f : R2 ^ R2:
1 0 0 0
B
0 1
o o
c
a 0 0 b
D
0 -1
1 0
Matice A zadává kolmou projekci podél podprostoru W C {(0,a); a e R} c R2
na podprostor
V C {(a, 0); a e R} C R2,
tj. projekce na osu x podél osy y. Evidentně pro toto zobrazení / : R2 -» R2 platí / o / = / a tedy zúžení /1 v daného zobrazení na obor hodnot je identické zobrazení. Jádrem / je právě podprostor W.
Matice B má vlastnost B2 = 0, platí tedy totéž o příslušném zobrazení /. Můžeme si jej představit jako matici derivování polynomů Ri[x] stupně nejvýše jedna v bázi (1, x) (derivacemi se budeme podrobně zabývat v kapitole páté, viz ??).
Matice C zadává zobrazení /, které první vektor báze zvětší út-krát, druhý b-kiát. Tady se nám tedy celá rovina
1
v2 = u2- -—— Vi = u2 - - Vi
2
1 1
i>i||^ z \ 2 2
t
1,0
resp. zvolme násobek ii2 = (-1, -1,2,0) . Následně je
uX • V\ u\ • v2
V3 = U3 ---— Ví ---— V2 = U3
1
1
IlUll
1 1 1
3' ~3' ~3' Máme tedy celkem
vi
\V2\
Vl
v2
í-l\ í-l\ /-1\
1 -1 -1
0 , v2 = 2 , V3 = -1
w \3J
Dodejme, že pro jednoduchost příkladu lze bezprostředně uvést ortogonální bázi z vektorů
(1,-1,0, 0)T, (0, 0, l,-l)r, (1, 1,-1,-l)r
nebo
(-1, 1, 1,-I)1 , (1,-1,1,-iy, (-1,-1,1,1)'.
□
2.90. Ve vektorovém prostoru R4 jsou dány trojrozměrné podpro-story
U = u2, u3), V = (vi,v2,v3),
přičemž
(\\ (\\ (\\ ( 1 ^ ( 1 \
1 1 0 1 -1
1 , u2 = 0 , Uj, = 1 -1 1
w v) v) v-V
v3 = (1, —1, —1, 1)T. Určete dimenzi a libovolnou bázi podprostoru
u n v.
Řešení. Do podprostoru U n V náleží právě ty vektory, které je možné obdržet jako lineární kombinaci vektorů u{ a také jako lineární kombinaci vektorů t>;. Hledáme tedy čísla x\, x2, x3, yi, y2, y3 e R taková, aby platilo
/1\
Xi
+ x2
(1\ (1\ ( 1 ^ (1 ^ ( 1 ^
1 + x3 0 i -1 -1
0 1 = yi -i 1 -1
v) v) v-V
1 1
w
tj. hledáme řešení soustavy
Xl + x2 + x3 Xl + x2
Xl + x3
X2 + x3
Vi + V2 + V3,
y\ - yi - b,
"Vl + V2 - V3,
"Vl - V2 + V3.
111
I. BÁZE A SKALÁRNÍ SOUČINY
4. VLASTNOSTI LINEÁRNÍCH ZOBRAZENÍ
Při maticovém zápisu této homogenní soustavy (a při zachování pořadí proměnných) je
/l i i -1 -1 -1\ /l 1 1 -1 -1 - -1\
1 1 0 -1 1 1 0 0 -1 0 2 2
1 0 1 1 -1 1 0 -1 0 2 0 2
v> 1 1 1 1 -v 1 1 1 1 - -v
/l 1 1 -1 -1 -is /l 1 1 -1 -1 - -1\
0 1 1 1 1 -1 0 1 1 1 1 - -1
0 0 - -1 0 2 2 0 0 1 0 -2 - -2
0 1 3 1 !y ^0 0 0 1 1 1 /
/l 1 1 0 0 0 \ /l 0 0 0 0 2 \
0 1 1 0 0 - 2 0 1 0 0 2 0
0 0 1 0 - -2 - 2 0 0 1 0 -2 -2
[o 0 0 1 1 1/ [o 0 0 1 1 l)
Dostáváme tak řešení
x\ = —2t, X2 = —2s, xj, = 2s + 2t, yi = — s — t, y2 = s, y?, t, s e M. Odtud dosazením získáváme obecný vektor průniku
* ~í\ + x2 + x3 Xi + x2 X\ + x3 \ x2+x3
Vidíme, že
/ 0 \
-2t - 2s
2s
v 2t J
dim U n V
unv
(0\ /0\
-1 -1
1 ' 0
W w
□
2.91. Uvedte nějakou bázi podprostoru
U
vektorového prostoru reálných matic 3x2. Tuto bázi doplňte na bázi celého prostoru.
Řešení. Připomeňme, že bázi podprostoru tvoří množina lineárně nezávislých vektorů, které generují uvažovaný podprostor. Protože
celý podprostor U je generován pouze prvními dvěma maticemi. Ty jsou potom lineárně nezávislé (jedna není násobkem druhé), a tak zadávají bázi. Chceme-li ji doplnit na bázi celého prostoru reálných
rozpadá na dva podprostory, které jsou zobrazením / zachovány a ve kterých jde o pouhou homotetii, tj. roztažení skalárním násobkem (první příklad byl speciální případem s a = 1, b = 0). Např. volba a = 1, b = — 1 odpovídá osové symetrii (zrcadlení) podle osy x, což je totéž jako komplexní konjugace x + iy x — iy na dvourozměrném reálném prostoru E2~Cv bázi (1,0- Toto je lineární zobrazení dvourozměrného reálného vektorového prostoru C, nikoliv však jednorozměrného komplexního prostoru C.
Matice D je maticí rotace o pravý úhel ve standardní bázi a na první pohled je vidět, že žádný jednorozměrný podprostor není zobrazením zachováván.
Taková rotace je bijekcí roviny na sebe, proto jistě umíme najít (různé) báze na definičním oboru a oboru hodnot, ve kterých bude jeho maticí jednotková matice E (prostě vezmeme jakoukoliv bázi na definičním oboru a její obraz na oboru hodnot). Neumíme ale v tomto případě totéž s jednou bází na definičním oboru i oboru hodnot.
Zkusme však uvažovat matici D jako matici zobrazení g : C2 -> C2 ve standardní bázi komplexního vektorového prostoru C2. Pak umíme najít vektory u = (i, 1), v = (—i, 1), pro které bude platit
g(v)
0 -1
1 0
0 -1
1 o
■1
1 ■ u,
-1 ■ v.
To ale znamená, že v bázi (u, v) na C2 má zobrazení g matici K
i 0 0 -i
a povšimněme si, že tato komplexní analogie k případu matice C má na diagonále prvky a = cos(^jt) + i sin(jjr) a kmoplexně sdružené ä. Jinými slovy, argument v goniometrickém tvaru tohoto komplexního čísla udává úhel otočení.
Tomu lze snadno porozumět, když si označíme reálnou a imaginární část vektoru u takto
xu + iyu = Re u -\- i Im u
+ i
Vektor v je komplexně sdružený k u. Zajímá nás zúžení zobrazení g na reálný vektorový podprostor V = M2 n (u, v) c C2. Evidentně je
V = {u + ú, i(u - ú)) = {xu, -yu)
celá reálná rovina M2. Zúžení zobrazení g na tuto rovinu je právě původní zobrazení dané maticí A a z definice násobení komplexní jednotkou jde o otočení o úhel ^jt v kladném smyslu ve vztahu ke zvolené bázi xu, —yu (ověřte si přímým výpočtem a uvědomte si také, proč případné prohození pořadí vektorů u a. v povede k témuž výsledku, byť v jiné reálné bázi!).
112
KAPITOLA 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
2.30
2.46. Vlastní čísla a vlastní vektory zobrazení. Klíčem k popisu zobrazení v předchozích příkladech byly odpovědi na otázku „jaké jsou vektory "^tzz^ splňující rovnici f(u) = a-m pro nějaké vhodné skaláry a?".
Zvolme tedy pevně lineární zobrazní / : V -» V na vektorovém prostoru dimenze n nad skaláry K. Jestliže si představíme takovou rovnost zapsanou v souřadnicích, tj. s využitím matice zobrazení A v nějakých bázích, jde o výraz
A ■ x — a ■ x = (A — a ■ E) ■ x = 0.
Z předchozího víme, že taková soustava rovnic má jediné řešení x = 0, pokud je matice A — a E invertibilní. My tedy chceme najít takové hodnoty aéI, pro které naopak A—a E invertibilní není, a nutnou a dostatečnou podmínkou je (viz Věta 2.23)
e2.1 (2.4)
det(A - a ■ E) = 0.
Jestliže považujeme k = a za proměnnou v předchozí skalární rovnici, hledáme ve skutečnosti kořeny polynomu stupně n. Jak jsme viděli v případě matice D výše, kořeny mohou, ale nemusí existovat podle volby pole skalárů '.
Vlastní čísla a vlastní vektory Skaláry k vyhovující rovnici f(u) = k ■ u pro nenulový vektor u e V nazýváme vlastní čísla zobrazení f, příslušné nenulové vektory u pak vlastní vektory zobrazení f.
Jsou-li u, v vlastní vektory příslušné k témuž vlastnímu číslu k, pak i pro jejich jakoukoliv lineární kombinaci platí
f (au + bv) = af(u) + bf(v) = k(au + bv).
Proto tvoří vlastní vektory příslušné k vlastnímu číslu k, společně s nulovým vektorem, netriviální vektorový podprostor Vx, tzv. vlastní podprostor příslušný k. Např., je-li k = 0 vlastním číslem, je jádro Ker / vlastním podprostorem V0-
Z definice vlastních čísel je zřejmé, že jejich výpočet nemůže záviset na volbě báze a tedy matice zobrazení /. Skutečně, jako přímý důsledek trasformačních vlastností z odstavce 2.38 a Cauchyovy věty 2.19 pro výpočet determinantu součinu dostáváme jinou volbou souřadnic matici A' = P~lAP s invertibilní maticí P a
\P~lAP - kE\ = \P~lAP - P~lkEP\
= \P~HA - kE)P\ = \p-l\\(A-kE\\P\ = \A- kE\,
protože násobení skalárů je komutativní a = li5!-1.
Z těchto důvodů používáme pro matice a zobrazení společnou terminologii:
ir-j Charakteristický polynom matice a obražení _^ Pro matici A dimenze n nad K nazýváme polynom \A — kE\ e K„[A] charakteristický polynom matice A.
matic 3x2, musíme najít další čtyři matice (dimenze celého prostoru je zjevně 6) takové, aby výsledná šestice byla lineárně nezávislá. Můžeme využít toho, že známe např. standardní bázi
'\ 0\ /O 1\ /O 0\ /O 0\ /O 0\ /O 0 0 I , 0 0 I , 1 0 I , 0 1 I, o o I, o o v0 0/ \0 0/ \0 0/ \0 0/ \1 0/ \0 1,
prostoru reálných matic 3x2, který lze přímo ztotožnit s M6. Sepíšeme-li dva vektory báze U a vektory standardní báze celého prostoru v tomto pořadí, výběrem prvních 6 lineárně nezávislých vektorů dostaneme hledanou bázi. Pokud však uvážíme, že kupř.
1 0 0 0 0 0
2 1 0 0 0 0
3 2 1 0 0 0
4 3 0 1 0 0
5 4 0 0 1 0
6 5 0 0 0 1
můžeme ihned bázového vektory
'\ 2^ 3 4
podprostoru U doplnit maticemi (vektory prostoru matic)
^0 0\ /0 0\ /0 0\ /0 0^ 10, 0 1, 0 0, 0 0 v0 0/ \0 0/ \1 0/ \0 1,
na bázi. Upozorněme, že výše uvedený determinant lze vyčíslit velmi snadno - je roven součinu prvků na diagonále, neboť matice je v dolním trojúhelníkovém tvaru (nad diagonálou jsou všechny prvky nulové). □
2.92. Napište něj akou bázi reálného vektorového prostoru matic 3x3 nad M s nulovou stopou (součet prvků na diagonále) a napište souřadnice matice
v této bázi.
2.93. Zavedlte nějaký skalární součin na vektorovém prostoru matic z předchozího příkladu. Spočítejte normu matice z předchozího příkladu, která je indukovaná Vámi zavedeným součinem.
2.94. Určete nějakou bázi vektorového prostoru antisymetrických reálných čtvercových matic typu 4x4. Uvažte standardní skalární součin v této bázi a pomocí tohoto součinu vyjádřete velikost matice
/0 3 1 0\ -3012 -1-1 0 2 \0 -2-2 0/
113
I. BÁZE A SKALÁRNÍ SOUČINY
4. VLASTNOSTI LINEÁRNÍCH ZOBRAZENÍ
2.95. Najděte ortogonální doplněk U1- podprostoru
U = {(xi, X2, X3, X4); x\ = X3, X2 = X3 + 6x4} c M4.
Řešení. Ortogonální doplněk U1- tvoří právě ty vektory, které jsou kolmé na každé řešení soustavy
x\ — x3 = 0,
X2 — X3 — 6x4 = 0.
Vektor je ovšem řešením této soustavy tehdy a jenom tehdy, když je kolmý na oba vektory (1,0, —1,0), (0, 1, — 1, —6). Je tedy
U1- = {a ■ (1, 0, -1, 0) + b ■ (0, 1, -1, -6); a, b e
□
na
2.96. Určete, zda jsou podprostory U = ((2, 1, 2, 2)) a V = ((-1, 0, -1, 2), (-1, 0, 1, 0), (0, 0, 1, -1)) prostoru sebe kolmé. Pokud ano, je M4 = U © V, tj. je U1- = VI
Řešení. Vektor, který zadává podprostor U, je kolmý na každý ze tří vektorů, které generují V. Podprostory jsou tak na sebe kolmé. Avšak není pravda, že M4 = U © V. Podprostor V je totiž pouze dvojdimenzionální, protože
(-1, 0, -1,2) = (-1, 0, 1, 0) - 2 (0, 0, 1, -1).
□
2 . 30a 'ostoru
2.97. V závislosti na parametru t e M stanovte dimenzi podp U vektorového prostoru M3, je-li U generován vektory
(a) ui = (1, 1, 1), u2 = (ÍJ, 1), u3 = (2, 2, ř);
(b) ui = (t,t,t), u2 = (-4ř,-4ř, 4ř), «3 = (-2, -2, -2).
Řešení. V prvním případu je dim U = 2 pro t e {1,2}, jinak je dim U = 3. Ve druhém případu je dim U = 2 pro t 7^ 0 a dim U = 1 pro t = 0. □
2.98. Sestrojte ortogonální bázi podprostoru
((1,1,1,1), (1,1,1,-1), (-1,1,1,1))
prostoru M4.
Řešení. Gramovým-Schmidtovým ortogonalizačním procesem lze obdržet výsledek
((1, 1, 1, 1), (1, 1, 1, -3), (-2, 1, 1,0)).
□
Kořeny tohoto polynomu jsou vlastní čísla matice A. Jeli A matice zobrazení / : V -> V v jisté bázi, pak \A — XE\ nazýváme také charakteristický polynoni^obraz^ní^^^^^^^
Protože je charakteristický polynom lineárního zobrazení / : V -> V nezávislý na volbě báze V, jsou i jeho koeficienty u jednotlivých mocnin proměnné k skaláry vyjadřující vlastnosti zobrazení /, tj. nemohou záviset na naší volbě báze. Zejména jako jednoduché cvičení na počítání determinantů vyjádříme koeficienty u nejvyšších a nejnižších mocnin (předpokládáme dim V = n a matici zobrazení A = (a^-) v nějaké bázi):
\A — X ■ E\ = (-1)"A" + (-I)"" Vl + • • • + Onn) ■ i"''
+ --- + \A\-k°.
Koeficient u nejvyšší mocniny říká jen, zda je dimenze prostoru V sudá nebo lichá. O determinantu matice zobrazení jsme už zmiňovali, že vyjadřuje, kolikrát dané lineární zobrazení zvětšuje objemy.
Zajímavé je, že i součet diagonálních členů matice zobrazení nezávisí na volbě báze. Nazýváme jej stopa matice a značíme TrA. Stopa zobrazení je definována jako stopa jeho matice v libovolné bázi. Ve skutečnosti to natolik překvapivé není, protože v kapitole osmé si jako příklad na metody diferenciálního počtu ukážeme, že stopa je ve skutečnosti lineárním přiblížením determinantu v okolí jednotkové matice, viz ??.
V dalším si uvedeme několik podstatných vlastností vlastních podprostoru.
2.47. Věta. Vlastní vektory lineárního zobrazení f : V —> V příslušné různým vlastním hodnotám jsou lineárně nezávislé.
Důkaz. Nechť a\, ... ,ak jsou různé vlastní hodnoty j.1 „ zobrazení / a u\, ..., uk vlastní vektory s těmito vlastními hodnotami. Důkaz provedeme indukcí přes počet lineárně nezávislých vektorů mezi zvolenými, f5 Předpokládejme, že u\, ..., ui jsou lineárně nezávislé a ul+i = CíUí je jejich lineární kombinací. Alespoň i = 1 lze zvolit, protože vlastní vektory jsou nenulové. Pak ovšem f(ul+1) = al+1 ■ ul+1 = al+1 ■ q • ut, tj.
f(ul+1) = ^al+1 ■ Ct ■ ut = • /("/) = XIQ ' ai ' Ui'
Odečtením druhého a čtvrtého výrazu v rovnostech dostáváme 0 = $ľí=i(ai+i ~ ai)' ci' ■ uiVšechny rozdíly vlastních hodnot jsou však nenulové a alespoň jeden koeficient q je nenulový. To je spor s předpokládanou nezávislostí U\, . . . , Ui, takže i vektor ul+i musí být lineárně nezávislý na předchozích. □
114
KAPITOLA 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
Na právě dokázané tvrzení se můžeme podívat jako na rozklad lineárního zobrazení / na součet jednoduchých zobrazení. Pro vesměs různé vlastní hodnoty kt charakteristického polynomu budeme dostávat jednorozměrné vlastní pod-postory Vii. Každý z nich pak zadává projekci na tento invariantní jednorozměrný podprostor, na němž je zobrazení dáno jako násobení vlastním číslem A;. Celý prostor V je tak rozložen na přímý součet jednotlivých vlastních podpro-storů. Navíc lze tento rozklad na vlastní podprostory snadno spočíst:
' báze z vlastních vektorů
Důsledek. Jestliže existuje n navzájem různých kořenů charakteristického polynomu zobrazení f : V -» V, na n— rozměrném prostoru V, pak existuje rozklad V na přímý součet vlastních podprostorů dimenze 1. To znamená, že existuje báze V složená výhradně z vlastních vektorů a v této bázi má f diagonální matici. Tato báze je určená jednoznačně až na pořadí prvků.
Příslušnou bázi (vyjádřenou v souřadnicích vzhledem k libovolně zvolené bázi V) obdržíme řešením n systémů homogenních lineárních rovnic o n neznámých s maticemi (A — Xi ■ E), kde A je matice f ve zvolené bázi.
2 . 44
2.48. Invariantní podprostory. Viděli jsme, že každý vlastní vektor v zobrazení / : V -» V generuje podprostor (v) C V, který je zobrazením / zachováván.
Obecněji říkáme, že vektorový podprostor W C V je invariantní podprostor pro lineární zobrazení /, jestliže platí f(W) C W.
Jestliže je V konečněrozměrný vektorový prostor a vybereme nějakou bázi (u\, ..., uk) podprostorů W, můžeme ji vždy doplnit na bázi (u\, ..., uk, uk+\, ■ ■ ■, un) celého V a v každé takové bázi má naše zobrazení matici A tvaru
3a
(2.5)
C D
kde S je čtvercová matice dimenze k, D je čtvercová matice dimenze n — k a C je matice typu n/(n — k). Naopak, jestliže je v nějaké bázi (u\, ..., un) matice zobrazení / tvaru (2.5), je W = (ui, ..., uk) invariantní podprostor zobrazení /.
Pochopitelně bude v naší matici zobrazení (2.5) sub-matice C nulová právě tehdy, když bude i podprostor (uk+i, ..., un) generovaný doplněnými vektory báze invariantní.
Z tohoto pohledu jsou vlastní podprostory lineárního zobrazení extrémní případy invariantních podprostorů a zejména v případě existence n = dim V různých vlastních čísel zobrazení / dostáváme rozklad V na přímý součet n vlastních podprostorů. V příslušné bázi z vlastních vektorů má pak naše zobrazení diagonální tvar s vlastními čísly na diagonále.
2.99. V prostoru M4 nalezněte nějakou ortogonální bázi podprostorů všech lineárních kombinací vektorů (1,0, 1,0), (0, 1,0, —7), (4, —2, 4, 14) a podprostorů generovaného vektory (1, 2, 2, —1), (1, 1, -5, 3), (3,2, 8, -7).
Řešení. Při zachování pořadí podprostorů ze zadání jsou ortogonálními bázemi např.
((1,0, 1,0), (0, 1,0, -7))
((1, 2, 2, -1), (2, 3, -3, 2), (2, -1, -1, -2)).
2.100. Pro jaké hodnoty parametrů a, b e M jsou vektory (1,1,2,0,0), (1,-1,0,1, a), (1,0,2,3,-2) v prostoru M5 po dvou ortogonální?
Řešení. Výsledek je a = 9/2, b = —5, neboť musí mj. platit 1+6 + 4 + 0 + 0 = 0, 1-6 + 0 + 3-2a =0.
□
□
2.101. V prostoru M5 uvažujte podprostor generovaný vektory (1,1,-1,-1,0), (1,-1,-1,0,-1), (1,1,0,1,1), (—1, 0, —1, 1, 1). Najděte nějakou bázi jeho ortogonálního doplňku.
Řešení. Hledaná báze obsahuje jediný vektor. Jejím nějaký nenulový skalární násobek vektoru
(3, -7, 1, -5,9).
□
2.102. Popište ortogonální doplněk podprostorů V prostoru M4, jeli V generován vektory (-1,2, 0, 1), (3, 1, -2, 4), (-4, 1, 2, -4), (2,3, -2,5).
Řešení. Ortogonální doplněk (komplement) V1- je množina všech skalárních násobků vektoru (4, 2, 7, 0). □
2.103. V prostoru M5 určete ortogonální doplněk W1- podprostorů W, jestliže
(a) W = {(r + s + t, -r + t, r + s, -t, s + t); r,s,te R};
(b) W je množina řešení soustavy rovnic x\ — x3 = 0, x\ — x2 + x3 — X4 + x$ = 0.
Řešení.
(a) W1- = {(1, 0, -1, 1, 0), (1, 3, 2, 1, -3));
(b) W1- = {(1, 0, -1, 0, 0), (1, -1, 1, -1, 1)).
115
I. BÁZE A SKALÁRNÍ SOUČINY
4. VLASTNOSTI LINEÁRNÍCH ZOBRAZENÍ
2 .36
□
2.104. Nechť jsou v prostoru M4 dány vektory
(1,-2,2,1), (1,3,2,1).
Doplňte tyto dva vektory libovolným způsobem na ortogonální bázi celého M4. (Můžete k tomu využít Gramův-Schmidtův ortogonalizační proces.)
Řešení. Hledaných doplnění je pochopitelně nekonečně mnoho. Jedním (skutečně jednoduchým) je např.
(1,-2,2,1), (1,3,2,1), (1,0,0,-1), (1,0,-1,1).
□
2.105. Nalezněte nějakou ortonormální bází podprostoru V C M,
kde V = {(jci, x2, x3, x4) e M4 | %\ + 2x2 + x3 = 0}.
Řešení. Vidíme, že čtvrtá souřadnice se v omezení na podprostor nevyskytuje, bude tedy vhodné volit jeden z vektorů hledané ortonormální báze vektor (0, 0, 0, 1) a redukovat problém do prostoru M3. I dále se zkusíme vyhnout počítání: vidíme, že položíme-li druhou souřadnici rovnu nule, tak ve vyšetřovaném prostoru leží vektory s opačnou první a třetí souřadnicí, zejména jednotkový vektor (-^, 0, — , 0). Na tento vektor je kolmý libovolný vektor, který má stejnou první a třetí souřadnici. Abychom se dostali do uvažovaného podprostoru, volíme druhou souřadnici rovnu záporné hodnotě součtu první a třetí souřadnice a normujeme, tedy volíme vektor (-^, — 0) a jsme
hotovi. □
2.106. Věta (2.50) nám dává do ruky nástroje, jak poznat matici rotace v M3: má tři různá vlastní čísla s absolutní hodnotou 1, jedno z nich je přímo číslo 1 (jemu příslušný vlastní vektor je osa rotace). Argument zbylých dvou, tedy nutně komplexně sdružených, vlastních čísel potom udává úhel rotace v kladném smyslu v rovině určené bazí ux +ul, i[ux -
2.107. Určete, jaké lineární zobrazení zadává matice
zl 1 zls
5 5 5 =Ä 2 1 5 5 5 1 zá 1 5 5 5
Řešení. Již známým postupem zjistíme, že matice má následující vlastní čísla a jim příslušné vlastní vektory: 1, (1,2,0); | + fz, 1, (1, 1 + z, -1 - z); | - fi, (1, 1 - i, -1 + 0- Jde tedy o matici rotace (všechna vlastní čísla mají absolutní hodnotu 1 a jedna z vlastních hodnot je přímo 1), navíc víme, že se jedná o rotaci o arccos^) = 0, 2957T, což je argument vlastního čísla | + |z.
2.49. Ortogonální zobrazení. Podívejme se teď na speciální případ zobrazení / : V -» W mezi prostory se skalárními součiny, která zachovávají velikosti pro všechny vektory u e V.
Definice ortogonálních zobrazení j,. Lineární zobrazení / : V -» W mezi prostory se skalárním součinem se nazývá ortogonální zobrazení, jesltiže pro všechny u e V
(f (u), f (u)) = (u, u).
Z linearity / a ze symetrie skalárního součinu vyplývá pro všechny dvojice vektorů rovnost
{f(u + v),f(u + v))
■ {f(u),f(u)) + {f(v),f(v}) + 2(f(u),f(v)).
Proto všechny ortogonální zobrazení splňují i zdánlivě silnější požadavek, aby platilo pro všechny vektory u, v e V
(f(u),f(v)) = (u, v).
V úvodní diskusi o geometrii v rovině jsme ve Větě 1.33 dokázali, že lineární zobrazení M2 -> M2 zachovává velikosti vektorů, právě když jeho matice ve standardní bázi (a taje ortonormální vzhledem ke standardnímu skalárnímu součinu) splňuje AT ■ A = E, tj. A-1 = AT.
Obecně, ortogonální zobrazení / : V -> W musí být vždy injektivní, protože podmínka (/(«), /(«)) = 0 znamená i (u, u) = 0 a tedy u = 0. Je tedy vždy v takovém případě dimenze oboru hodnot alespoň taková, jako je dimenze definičního oboru /. Pak ovšem je dimenze obrazu rovna dimenzi oboru hodnot a víme, že / : V -> Im / je bijekce. Pokud Im/ 7^ W, doplníme ortonormální bázi na obrazu / na ortonormální bázi cílového prostoru a matice zobrazení bude obsahovat čtvercovou regulární matici A doplněnou nulovými řádky na potřebnou velikost. Bez újmy na obecnosti tedy předpokládejme W = V.
Naše podmínka pro matici ortogonálního zobrazení v ortonormální bázi pak říká pro všechny vektory x a y v prostoru K" toto:
(A • xf ■ (A • y) = xT ■ (AT ■ A) • y = xT ■ y.
Speciálními volbami vektorů standardní báze za x a y dostaneme přímo, že AT ■ A = E, tedy tentýž výsledek jako v dimenzi dvě. Dokázali jsme tak následující tvrzení:
-| Matice ortogonálních zobrazení j.
Věta. Nechť V je reálný vektorový prostor se skalárním součinem a f : V —> V je lineární zobrazení. Pak f je ortogonální, právě když v některé ortonormální bázi (a pak už ve všech) má matici A splňující AT = A-1.
116
KAPITOLA 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
2 . 45
Důkaz. Skutečně, jestliže zachovává / velikosti, musí mít uvedenou vlastnost v každé ortonormální bázi. Naopak, předchozí výpočet ukazuje, že vlastnost matice v jedné bázi už zaručuje zachovávání velikostí. □
Čtvercovým maticím, které splňují rovnost AT = A~l říkáme ortogonální matice.
Důsledkem předchozí věty je také popis všech matic přechodu S mezi ortonormálními bázemi. Každá totiž musí zadávat zobrazení W -» W zachovávající velikosti a splňují tady také právě podmínku 5_1 = ST. Při přechodu od jedné ortonormální báze ke druhé se tedy matice (libovolných) lineárních zobrazení mění podle vztahu
A' = STAS.
2.50. Rozklad ortogonálního zobrazení. Podívejme se nyní podrobněji na vlastní vektory a vlastní čísla ortogonálních zobrazení na reálném vektorovém prostoru V se skalárním součinem.
Uvažujme pevně zvolené ortogonální zobrazení V s maticí A v nějaké ortonormální bázi a zkusme postupovat obdobně jako s maticí rotace D v příkladu 2.59.
Nejprve se ale podívejme obecně na invariantní podpro-story ortogonálních zobrazení a jejich ortogonální doplňky. Jestliže pro libovolný podprostor W C V a ortogonální zobrazení / : V -» V platí f(W) C W, pak také platí pro všechny v e W^, w e W
(f(v), w) = (f(v), f o f~\w)) = (v, f~\w)) = 0
protože i f~l(w) e W. To ale znamená, že také f (W^) C W-1. Dokázali jsme tedy jednoduché, ale velice důležité tvrzení:
Tvrzení. Ortogonální doplněk k invariantnímu podprostoru je také invariantní.
Kdyby byla vlastní čísla ortogonálního zobrazení reálná, zaručovalo by už toto tvrzení, že bude vždy existovat báze V z vlastních vektorů. Skutečně, zúžení f na ortogonální doplněk invariantního podprostoru je opět ortogonální zobrazení, takže můžeme do báze přibírat jeden vlastní vektor za druhým, až dostaneme celý rozklad V. Nicméně většinou nejsou vlastní čísla ortogonálních zobrazení reálná. Musíme si proto pomoci opět výletem do komplexních vektorových prostorů. Zformulujeme rovnou výsledek:
' Rozklad ortogonálních zobrazení
Věta. Nechť f : V -» V je ortogonální zobrazení na prostoru se skalárním součinem. Pak všechny kořeny charakteristického polynomu f mají velikost jedna a existuje rozklad V na jednorozměrné vlastní podprostory odpovídající vlastním číslům X = ± 1 a dvourozměrné podprostory P^l, na kterých působí f rotací o úhel rovný argumentu komplexního čísla X v kladném směru. Všechny tyto různé podprostory jsou po dvou ortogonální.
Zbývá určit smysl otáčení. Nejprve je dobré si připomenout, že smysl otáčení se mění s orientací osy (nemá tedy smyslu hovořit o smyslu otáčení, pokud nemáme orientovánu jeho osu. Dle úvah v důkazu věty 2.50, působí daná matice otáčením o arccos(|)) v kladném smyslu v rovině dané bazí ((0, 1, —1), (1, 1, —1)). První vektor báze je imaginární částí vlastního vektoru příslušného vlastní hodnotě | + |z, druhý pak je (společnou) reálnou částí vlastních vektorů příslušných komlexním vlastním hodnotám. Tady je důležité pořadí vektorů v bázi (prohozením vektorů se změní smysl otáčení). Osa otáčení je kolmá na uvažovanou rovinu. Pokud ji orientujeme podle pravidla pravé ruky (daný kolmý směr také dostaneme vektorovým součinem vektorů v bázi) tak bude smysl otáčení v prostoru souhlasit se smyslem otáčení v rovině s uvedenou bazí. V našem případě dostaneme vektorovým součinem (0, 1, —1) x (1, 1, —1) = (0, —1, —1). Jedná se tedy o rotaci o arccos(|) v kladném smyslu kolem vektoru (0, —1, —1), neboli o rotaci o arccos(|) v záporném smyslu kolem vektoru (0, 1, 1).
a to v kladném smyslu. □
117
I. BÁZE A SKALÁRNÍ SOUČINY
4. VLASTNOSTI LINEÁRNÍCH ZOBRAZENÍ
Důkaz. Bez újmy na obecnosti můžeme pracovat s pro-c\Lg^, storem V = W" se standardním skalárním sou--*ár " činem. Zobrazení tedy bude dáno ortogonální ^g^jPs matici A, kterou můžeme stejně považovat za matici lineárního zobrazení na komplexním prostoru Cm (která je jen shodou okolností reálná). Zaručeně bude existovat právě m (komplexních) kořenů charakteristického polynomu, včetně jejich algebraické násobnosti (viz tzv. základní věta algebry, ??). Navíc, protože charakteristický polynom zobrazení bude mít výhradně reálné koeficienty, budou tyto kořeny buď reálné, nebo půjde o dvojice komplexně sdružených kořenů k a k. Příslušné vlastní vektory v Cm k takové dvojici komplexně sdružených vlastních čísel budou řešením dvou komplexně sdružených systémů homogenních lineárních rovnic, neboť příslušné matice systémů rovnic jsou celé reálné, až na samotná dosazená vlastní čísla. Evidentně proto budou také řešení těchto systémů komplexně sdružené vektory.
Nyní využijeme skutečnost, že ke každému invariantnímu podprostoru je i jeho ortogonální doplněk invariantní. Nejprve si najdeme všechny vlastní podprostory V±1 příslušné k reálným vlastním hodnotám a zúžíme naše zobrazení na ortogonální doplněk k jejich součtu. Bez újmy na obecnosti tedy můžeme předpokládat, že naše ortogonální zobrazení nemá žádná reálná vlastní čísla a že je dim V = 2n > 0.
Zvolme nyní nějaké vlastní číslo k a označme ux vlastní vektor příslušný k vlastnímu číslu k = a + i/3, /3 7^ 0. Zcela stejně jako v případě rotace v rovině zadané v odstavci 2.59 maticí D nás zajímá reálná část součtu dvou jednorozměrných podprostoru (ux) ®{úx), kde úx je vlastní vektor příslušný k vlastnímu číslu k.
Jde o průnik uvedeného součtu komplexních podprostoru s M2", který je generovaný vektory ux + úx a i(ux — úx), tj. reálný vektorový podprostor Px c M2" generovaný bazí danou reálnou a imaginární částí ux
xx=ľeux, -yx = -imux.
Protože A ■ (ux + úx) = kux +kúx a. podobně s druhým bázovým vektorem, jde zjevně o invariantní podprostor vůči násobení maticí A a dostáváme
A ■ xx = otxx + fiyk, A-yx = -ayx + fixk.
Protože naše zobrazení zachovává velikosti, musí být navíc velikost vlastní hodnoty k rovna jedné. To ale neznamená nic jiného, než že zúžení našeho zobrazení na Px je rotací o argument vlastní hodnoty k. Všimněme si, že volba vlastního čísla k místo k vede na stejný podprostor se stejnou rotací, pouze ji dostaneme vyjádřenou v bázi xx, yx, tj. musíme v souřadnicích rotovat o úhel s opačným znaménkem.
Důkaz celé věty tím dokončen, protože zúžením našeho zobrazení na ortogonální doplněk a opakováním předchozí úvahy dostaneme celý rozklad po n krocích. □
118
KAPITOLA 2. ELEMENTÁRNI LINEÁRNI ALGEBRA
K myšlenkám tohoto důkazu se ještě vrátíme v kapitole třetí, když budeme studovat komplexní rozšíření euklidovských vektorových prostorů, viz 3.26.
Poznámka. Specielně v dimenzi tři musí být alespoň jedno vlastní číslo ±1, protože je trojka liché číslo. '"^"T^"'*1 ovšem příslušný vlastní podprostor je osou Ctr rotace trojrozměrného prostoru o úhel daný ar-v'/lr-r- gumentem dalších vlastních čísel. Zkuste si rozmyslet, jak poznat, kterým směrem jde rotace a také, že vlastní číslo — 1 znamená ještě dodatečné zrcadlení podle roviny kolmé na osu rotace.
K diskusi vlastností matic a lineárních zobrazení se budeme vracet. Před pokračováním obecné teorie si napřed ukážeme v následující kapitole několik aplikací, ještě ale uzavřeme naši diskusi obecnou definicí:
* Spektrum lineárního zobrazení _
32 2.51. Definice. Spektrum lineárního zobrazení f : V -» V (resp. matice) je posloupnost kořenů charakteristického polynomu zobrazení /, včetně násobností. Algebraickou násobností vlastní hodnoty rozumíme její násobnost jakožto kořenu charakteristického polynomu, geometrická násobnost vlastní hodnoty je dimenze příslušného podprostoru vlastních vektorů.
Spektrálním poloměrem lineárního zobrazení (matice) je , největší z absolutní hodnot vlastních čísel.
V této terminologii můžeme naše výsledky o ortogonálních zobrazeních zformulovat tak, že jejich spektra jsou vždy celá podmnožinou jednotkové kružnice v komplexní rovině. To znamená, že v reálné části spektra mohou být pouze hodnoty ±1, jejichž algebraické a geometrické násobnosti jsou stejné. Komplexní hodnoty spektra pak odpovídají rotacím ve vhodných dvourozměrných podprostorech, které jsou na sebe po dvou kolmé.
I. BAZE A SKALÁRNÍ SOUČINY 4. VLASTNOSTI LINEÁRNÍCH ZOBRAZENI
120
KAPITOLA 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
121
j. doplňující príklady k cele kapitole
4. vlastnosti lineárních zobrazeni
ves0016
J. Doplňující příklady k celé kapitole
2.108. Řešte soustavu
X\ -\- X2 ~\~ X3 -\- X4 — 2X5
2X2 + 2x3 + 2x4 — 4X5
— X\ — X2 — X3 -\- X4 -\- 2x5
—2xi + 3x2 + 3x3 — 6x5 Řešení. Rozšířená matice soustavy je
3, 5, 0, 2.
/ 1 1 1 1 -2 3 \
0 2 2 2 -4 5
-1 -1 -1 1 2 0
V "2 3 3 0 -6 2/
Přičtením prvního řádku ke třetímu a jeho dvojnásobku ke čtvrtému a poté přičtením (—5/2)násobku druhého řádku ke čtvrtému obdržíme
/1 1 1 1 -2 3 \ / 1 1 1 1 -2 3 \
0 2 2 2 -4 5 0 2 2 2 -4 5
0 0 0 2 0 3 0 0 0 2 0 3
5 5 2 -10 8 / 0 0 -3 0 -9/2 /
Poslední řádek je zřejmě násobkem předposledního, a tak jej můžeme vynechat. Pivoti se nacházejí v 1., 2. a 4. sloupci, proto jsou volné proměnné X3 a X5, které nahradíme reálnými parametry ř, 5. Uvažujeme tak soustavu
Xi +
x2 2x2
+ +
ř 2t
+ +
X4
2s 4s
3, 5, 3.
Víme tedy, že x4 = 3/2. Druhá rovnice dává
2x2 + 2t + 3 - 4s = 5, tj. x2 = 1 - t + 2s. z první potom plyne
xi + 1 - t + 2s + t + 3/2 - 2s = 3, tj. Xi = 1/2.
Celkem máme (2.5)
(Xi, X2, X3, X4, X5)
(1/2, \ -t+2s, t, 3/2, s), t,s €
Také v tomto příkladu znovu uvažujme rozšířenou matici a převeďme ji pomocí řádkových úprav do schodovitého tvaru, kde první nenulové číslo v každém řádku je 1 a kde ve sloupci, ve kterém tato 1 je, jsou ostatní čísla 0. Ještě připomeňme, že čtvrtou rovnici, jež je kombinací prvních třech rovnic, budeme vynechávat. Po řadě vynásobením druhého a třetího řádku číslem 1 /2, odečtením třetího řádku od druhého a od prvního a odečtením druhého řádku od prvního získáme
0
1 1 1 1 -2 3^
0 2 2 2 -4 5
0 0 0 2 0 3/1
1 1 1 0 -2 3/2
0 1 1 0 -2 1
0 0 0 1 0 3/2
1 0 0 0 0 0 110-2 0 0 0 1 0
122
KAPITOLA 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
Pokud opět zvolíme s (t, s € M), dostaneme odsud obecné řešení (2.5) ve stejném tvaru,
a to bezprostředně. Uvažte příslušné rovnice
Xi
x2 +
2s
1/2, 1, 3/2.
□
2.109. Najděte řešení soustavy lineárních rovnic zadané rozšířenou maticí
/ 3 3 2 1 3 \
2 1 1 0 4
0 5 -4 3 1
\5 3 3 -3 5/
Řešení. Uvedenou rozšířenou matici upravíme na schodovitý tvar. Nejprve první a třetí řádek opíšeme a do druhého řádku napíšeme součet (—2)násobku prvního a 3násobku druhého řádku a do čtvrtého řádku součet 5násobku prvního a (—3)násobku posledního řádku. Takto získáme
/ 3 3 2 1 3 \ / 3 3 2 1 3 \
2 1 1 0 4 0 -3 -1 -2 6
0 5 -4 3 1 0 5 -4 3 1
\5 3 3 -3 5 ) ^ 0 6 1 14 0/
Opsání prvních dvou řádků a přičtení 5násobku druhého řádku k 3násobku třetího a jeho 2násobku ke čtvrtému řádku dává
2
-1 -17 -1
/ 3 0 0
-1
-4
1
1
-2 3
14
3 \
1
0/
/ 3 0 0
V 0
o o
1
-2 -1 10
3 \
33
12/
Pokud první, druhý a čtvrtý řádek opíšeme a ke třetímu přičteme čtvrtý, dostaneme
/ 3 3 2 1 3 ( 3 3 2 1 3 \
0 -3 -1 -2 6 0 -3 -1 -2 6
0 0 -17 -1 33 0 0 -18 9 45
0 -1 10 12 ) \0 0 -1 10 12 /
Dále je (řádkové úpravy jsou již „obvyklé")
/ 3 3 2 1 3 \ ( 3 3 2 1 3 \
0 -3 -1 -2 6 0 -3 -1 -2 6
0 0 -18 9 45 0 0 2 -1 -5
\o 0 -1 10 12 J V 0 0 1 -10 -12 )
/ 3 3 2 1 3 / 3 3 2 1 3 \
0 -3 -1 -2 6 0 -3 -1 -2 6
0 0 1 -10 -12 0 0 1 -10 -12
0 2 -1 -5 J \0 0 0 19 19 /
Vidíme, že soustava má právě 1 řešení. Určeme ho zpětnou eliminací
/ 3 0 0
o o
1 o
1
-2 -10
3 \
-12
/ 3 0 0
0
o
1 o
o o
0
1
2 \ 8
-2 1 /
123
J. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE
4. VLASTNOSTI LINEÁRNÍCH ZOBRAZENÍ
/ 3 3 0 0 6 \ /1 1 0 0 2 \
0 -3 0 0 6 0 1 0 0 -2
0 0 1 0 -2 0 0 1 0 -2
0 0 1 1 ) v 0 0 0 1 1 /
/1 0 0 0 4 \
0 1 0 0 -2
0 0 1 0 -2
v 0 0 0 1 1 )
Výsledek je tak
X\ = 4, x2 = —2, x3 = —2, x4 = 1.
2.110. Uvedte všechna řešení homogenního systému
x + y = 2z + v, z + 4w + v = 0, — 3« =0, z = —v 4 lineárních rovnic 5 proměnných x, y, z, u, v.
Řešení. Systém přepíšeme do matice tak, že v prvním sloupci budou koeficienty u x, ve druhém sloupci koeficienty u y, až v pátém sloupci koeficienty u v, přičemž všechny členy v každé rovnici převedeme na levou stranu. Tímto způsobem přísluší systému matice
/l 1 -2 0 -l\
0 0 14 1
0 0 0-30
\0 0 1 0 1 /
Přičteme-li (4/3)násobek třetího řádku ke druhému a odečteme-li poté druhý řádek od čtvrtého, obdržíme
/l 1 -2 0 -l\ /l 1 -2 0 -l\ 0 0 1 4 1 0 0 1 0 1
000 -3 0 ~000 -3 0 \0 0 1 0 1/ \0 00 0 OJ
Dále vynásobíme třetí řádek číslem —1/3 a přičteme 2násobek druhého řádku k prvnímu, což dává
/l 1 -2 0 -l\ /l 1 0 0 l\
0 0 1 0 1 0 0 1 0 1
00 0 -3 0 ~00010
\0 0 0 0 OJ \0 0 0 0 0/
Z poslední matice můžeme přímo vypsat všechna řešení
ř, s e
neboť máme matici ve schodovitém tvaru, přičemž první nenulové číslo v každém řádku je 1 a ve sloupci, kde se taková 1 nachází, jsou na ostatních pozicích 0. Výše uvedené řešení ve tvaru lineární kombinace dvou vektorů je určeno právě sloupci bez prvního nenulového čísla nějakého řádku, tj. druhým a pátým sloupcem, kdy volíme 1 jako druhou složku pro druhý sloupec a jako pátou složku pro pátý sloupec a kdy čísla v příslušném sloupci bereme s opačným znaménkem a umisťujeme je na
/x\ /-1\ /-1\
y 1 0
z = t 0 + s -1
u 0 0
\v) \°)
124
KAPITOLA 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
pozici danou sloupcem, ve kterém je první 1 v jejich řádku. Dodejme, že výsledek je ihned možné přepsat do tvaru
(x, y, z, u, v) = (—t — s, t, —s, 0, s) , t,s € M.
□
125
J. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE
4. VLASTNOSTI LINEÁRNÍCH ZOBRAZENI
Řešení cvičení
2.8. Taková matice X existuje právě jedna, a to
18 -32^ 5 -
l 10 -4\
2.14. A-1 = 1 12 -5
V> 5 -v
(2 -3 0 0 o\
-5 8 0 0 0
2.15. 0 0 -1 0 0
0 0 0 -5 2
0 0 3 -v
(0 1 1 o\
2.16. C"1 = 1 2 0 1 1 -1 0 0 -i 0
V -1 -1 1
2.77. V prvním případě dostáváme
ve druhém potom
1
2 \i 1
'14 8 5> 2 1 1 1 1 0)
2.18. Platí
A~ =
/o i 1 ... 1\
1 0 1 ... 1
1 1 0
'•• 1
V 1 1 0/
n - 1
2.79. -3,17,-1
2.22. Odečtením prvního řádku od všech ostatních řádků a následným rozvojem podle prvního sloupce obdržíme
V„(xi,x2, ...,*„) —
xi
0 x2 — XI XJ — Xj
0 Xn X\ X2. 4 X^ X j^ •
Xn X\ x^
Xj — Xj
xľ
-1 „«-1 xl
„n-1 _ „"-I -*2 Al
vji —1 _ vn-l
A.
-"íl ~~
Vytkneme-li z ř-tého řádku x;+i — x\ pro / € {1, 2, ..., n — 1}, dostaneme
V„(xi,x2, x„)
i x2 + xi ... Y!}Zo*2~j~24
(x2 - Xl) ■ ■ ■ (x„ - Xl)
, . sr^n-2 n
■«-2 Ji-j-2 J
Xy
126
KAPITOLA 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
Odečtením od každého sloupce (počínaje posledním a konče druhým) x\-násobku předcházejícího lze docílit úpravy
->n-2 n—j—2
i x2 + XI ... j2"=oA 3 A
1 x2
x2
1 X„ + XI ... YľjJ) X„ ] 2 A 1 X" • • • 2
Proto
V„(xi,x2, ..., x„) = (x2 -xi) • • • (x„ -xi) V„-i(x2, ... ,x„). Neboťje zřejmě
^(Xft — 1, Xyí) = Xn Xn — \,
platí (uvažme matematickou indukci)
V„(X!, x2, ..., x„) = Y\ (xj - x')-
l 0 0 V (6 0 0 V> o\ 0 0
(c) 0 7 1 0
0 0 0 7 0 1 V
2.87. Kořen —1 polynomu | A — X E | je trojnásobný. 2.82. ie \ A — X E \ = —X3 + 12X2 - AIX + 60, tj. Xi = 3, A2 = 4, A3 2.&3.
/ 122 A5 = -121
V o
2.84. Výsledkem je posloupnost 0, 1,2. 2.86. Dimenze je 1 pro X\ — 4 a 2 pro X2 — 3.
2.S7. Matice B má dvě různá vlastní čísla, a proto takové vyjádření existuje. Např. platí
'5 6\ _ ! (V2
Existují právě dvě diagonální matice D, a to
'11 0 0 -1
0
-1
-1
V2 V2 -•v/2 V2
0
ovšem sloupce matice P 1 můžeme nahradit za jejich libovolné nenulové skalární násobky, tedy uvažovaných dvojic Z), P je nekonečně mnoho.
129
KAPITOLA 3
Linární modely a maticový počet
kde jsou matice užitečné? — nakonec skoro všude...
Máme už vybudován docela slušný balíček nástrojů a tak je na čase, abychom si maticový počet zkusili použít. Na docela jednoduchých úlohách uvidíme, že teorie nám umožňuje kvalitativní i kvantitativní analýzy a někdy i překvapivě snadno vede k nečekaným výsledkům.
Jakkoliv se může zdát, že předpoklad linearity vztahů mezi veličinami je příliš omezující, v reálných úlohách naopak často právě lineární závislosti buď vystupují přímo nebo je skutečný proces výsledkem iterace mnoha lineárních kroků. I když tomu tak není, můžeme tímto způsobem skutečné procesy alespoň aproximovat.
V této kapitole proto neprve zrekapitulujeme nejjednodu-šší případ, kdy celý proces je popsán jediným ^_ lineárním zobrazením. O co méně tady bude nové teorie, tím více snad bude zajímavé, jak takové modely vznikají v různých oblastech využití matematických nástrojů. Poté se vrátíme k tzv. lineárním diferenčním rovnicím, které lze chápat buď jako rekurentně definované funkce nebo také jako specifický pffpžčPIiňfár^ I nrho interovaného procesu. Právě takovým pocesům bude věnována část třetí, kde si ukážeme, k jakým kouzlům vede pochopení vlastností vlastních hodnot matic.
Na matice (resp. lineární zobrazení) se také někdy rádi ji ,. díváme jako na objekty, se kterými bychom rádi pracovali tak, jak to umíme se skaláry. K tomu ale bude třeba docela usilovná práce ve čtvrté části kapitoly. ifí1 ' Rychlé a užitečné použití pak ukážeme na tzv. rozkladech matic, které jsou potřebné pro numerické zvládnutí matičkového počtu co nejrobustnějším způsobem.
1. Lineární procesy
3.1. Řešení systému lineárních rovnic. Jednoduché line-ární procesy jsou dány lineárními zobrazeními ■ 1, vyhovují danému vztahu. Vztah také splňuje jejich libovolná tzv. lineární kombinace, tedy posloupnost cn = san + tbn, s, t e M. Čísla s a t můžeme zvolit tak, aby výsledná kombinace splňovala dané počáteční podmínky, v našem případě c\ = 1, c2 = 1. Pro jednoduchost je vhodné navíc ještě dodefinovat nultý člen posloupnosti jako c0 = 0 a spočítat s a t z rovnic pro c0 a c\. Zjistíme,
žei = -7!'ř = 7!atedy
r--1 „k (i + Vš)" - (i - Vš)"
Binet (3.2) p„ = -—-.
- 2»(V5)
Takto zadaná posloupnost splňuje danou rekurentní formuli a navíc počáteční podmínky co = 0, c\ = 1, jedná se tedy o tu jedinou posloupnost, která je těmito požadavky zadána. Všimněte si, že hodnota vzorce (3.2) je celočíselná pro libolné přirozené n (zadává totiž celočíselnou Fibonacciho posloupnost), i když to tak na první pohled nevypadá. □
IniProdukt
3.2. Zjednodušený model chování hrubého národního produktu.
Uvažujme diferenční rovnici
(3.3) yk+2 - a(l + b)yk+1 + abyk = 1,
kde yk je národní produkt v roce k. Konstanta a je takzvaný mezní sklon ke spotřebě, což je makroekonomický ukazatel, který udává jaký zlomek peněz, které mají obyvatelé k dispozici, utratí, a konstanta b popisuje, jak závisí míra investic soukromého sektoru na mezním sklonu ke spotřebě.
Předpokládáme dále, že velikost národního produktu je normována tak, aby na pravé straně rovnice vyšlo číslo 1.
Spočítejte konkrétní hodnoty pro a = |,& = i,y0 = l,y1 = l.
pro neznámý vektor x a známý vektor b.
V pevně zvolených souřadnicích pak máme matici A zobrazení , přičemž opět uvažujeme nezáporné proměnné.
Je snadné nahlédnout, že každý obecný problém lineárního programování lze převést na kterýkoliv ze standardních. Kromě změn znamének můžeme ještě pracovat s rozdělením případných proměnných bez omezení znaménka na rozdíl dvou kladných. Bez újmy na obecnosti se tedy budeme dále věnovat jen standardnímu maximalizačnímu problému.
Jak takový problém řešit? Hledáme maximum lineární formy h na podmnožinách M vektorového prostoru, které jsou zadány lineárními nerovnostmi, tj. v rovině pomocí průniku polorovin, obecně budeme v další kapitole hovořit o poloprostorech. Všimněme si, že každá lineární forma na reálném vektorovém prostoru h : V -» R (tj. libovolná lineární skalární funkce) v každém vybraném směru buď stále roste nebo stále klesá. Přesněji řečeno, jestliže vybereme pevný počáteční vektor m e V a „směrový" vektor v € V, pak složením naší formy h s parametrizací dostaneme
t h-» h(u + t v) = h(u) + t h(v).
Tento výraz je skutečně s rostoucím parametrem t vždy buď rostoucí nebo klesající, případně konstantní (podle toho, zda je h (v) kladné nebo záporné, případně nulové).
Jistě tedy musíme očekávat, že problémy podobné tomu s natěračem budou buď nesplnitelné (když je množina zadaná omezením prázdná) nebo bude výnos neohraničený (když omezení zadají neomezenou část celého prostoru a forma h v některém z neomezených směrů bude nenulová) nebo budou mít maximální řešení v alespoň jednom z „vrcholů" množiny M (přičemž zpravidla půjde o jediný vrchol, může ale jít o ^ecdľo™' konstatní maximální honotu na části horanice oblasti M).
Dantzigovi, algoritmech, odkaz apod.
3.5. Formulace pomocí lineárních rovnic. Ne vždy je nalezení optima tak snadné jako v předchozím případě. Problém může zahrnovat velmi mnoho proměnných a velmi mnoho omezení a jen rozhodnout, zda je množina M splnitelných bodů neprázdná je problematické.
Nemáme tu prostor na úplnou teorii, zmíníme ale alespoň dva směry úvah, které ukazují, že ve skutečnosti bude řešení naleznutelné vždy podobně, jako tomu bylo v dvojrozměrném problému v předchozím odstavci.
Začneme srovnáním se systémy lineárních rovnic - těm už totiž rozumíme dobře. Zapišme si rovnice (3.1)—(3.3) vektorově v obecném tvaru:
A - x < b,
kde x je nyní «-rozměrný vektor, b je m-rozměrný vektor a A odpovídající matice a nerovností myslíme jednotlivé nerovnosti po řádcích. Maximalizovat chceme součin c ■ x pro daný řádkový vektor koeficientů lineární formy h. Jestliže si pro každou z rovnic přidáme jednu pomocnou proměnnou a ještě si primyslíme proměnnou z jako hodnotu Unární formy
134
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
h, můžeme celý problém přepsat jako systém lineárních rovnic
x
-c
0
E
kde matice je složena z bloků o 1 + n + m sloupcích a 1 + m řádcích a tomu odpovídají jednotlivé komponenty vektorů. Dodatečně přitom požadujeme pro všechny souřadnice X i xs nezápornost.
Pokud tedy má daný systém rovnic řešení, hledáme v této množině řešení takové hodnoty proměnných z, x ai„ aby všechna x byla nezáporná a z maximální možné. K diskusi, jak to obecně může dopadat se vrátíme z pohledu afinní geometrie v odstavci 4.11 na straně 208.
Konkrétně v našem problému černobílého natěrače bude systém linárních rovnic vypadat takto:
/l 0
0 wi \0 bx
■ci -c2 0 0 0\
1 110 0
0 1 0
0 0 1/
w2 b2
(z\
xx /0\
x2 L
x3 W
w
dostáváme
k(n + 2) + l = 2(kn +l)+n.
Porovnáním koeficientů u proměnné n na obou stranách rovnice dostáváme vztah k = 2k + 1, tedy k = — 1, porovnáním absolutních členů pak vztah 2k + l = 21, tedy l = —2. Celkem je tedy partikulárním řešením je posloupnost —n — 2.
Řešení dané nehomogenní diferenční rovnice druhého řádu bez počátečních podmínek jsou tedy tvaru a{~j2)n + b{—~j2)n — n — 2, a, b e M.
Nyní dosazením do počátečních podmínek určíme neznámé a, b e M.. Pro početní jednoduchost použijeme malého triku: z počátečních podmínek a daného rekurentního vztahu vypočteme člen x0 : x0 = \ (x2 — 0) = 1. Daný rekurentní vztah spolu s podmínkami x0 = 1 a x\ = 1 pak zřejmě splňuje tatáž posloupnost, která splňuje původní počáteční podmínky. Máme tedy následující vztahy pro a, b:
x0: fl(v/2)° + Ŕ(-v/2)°-2= 1, tedy a+ b = 3, V2a - V2b = 5,
li .
3.6. Dualita v lineárním programování. Uvažujme reál-J.i „ nou matici Asm řádky a n sloupci, vektor omezení b a řádkový vektor c zadávající účelovou funkci. Z těchto dat můžeme sestavit dva problémy lineárního programování pro x e M" a y e W".
Maximalizační problém: Maximalizuj c ■ x za podmínky A ■ x < b a zároveň x > 0.
Minimalizační problém: Minimalizuj yT ■ b za podmínky yT ■ A > cT a zároveň y > 0.
Říkáme, že tyto problémy jsou vzájemně duální. K odvození dalších vlastností problémů lineárního programování zavedeme trochu terminologie.
Řekneme, že jde o idxřešitelný problém, jestliže existuje nějaký přípustný vektor x, který vyhoví všem omezujícícm podmínkám. Řešitelný maximalizační, resp. minimalizační problém je ohraničený, jestliže je účelová funkce na množině vyhovující omezením ohraničená shora, resp. zdola.
Lemma. Je-li x e W přípustný vektor pro standarní maximalizační problém a y e W" je přípustný vektor pro duální minimalizační problém, pak pro účelové fuknce platí
c ■ x < yT ■ b
Důkaz. Jde vlastně jen o snadné pozorování: x > 0 a cT < yT ■ A, ale také y >Q & A ■ x < b, proto musí platit i
c ■ x < yT ■ A ■ x < yT
jejichž řešením dostáváme a = 6+54^, b = ^—|^. Řešením je posloupnost
6 + 575 /- 6-5V5 /-xn =-4-(V2) +-4-(-V2)" - n - 2.
□
3.4. Určete reálnou bázi prostoru řešení homogenní diferenční rovnice
-"-«+4 = -"-«+3 + -"-«+1 -*•«>
Řešení. Charakteristický polynom dané rovnice je x4 — x3 — x + 1. Hledáme-li jeho kořeny, řešíme reciprokou rovnici
x4 - x3 - x + 1 = 0
Standardním postupem nejprve vydělíme rovnici výrazem x2 a poté zavedeme substituci t = x + tedy t2 = x2 + + 2. Obdržíme rovnici
t2 - t - 2 = 0,
s kořeny t\ = — 1, t2 = 2. Pro obě tyto hodnoty neznámé t pak řešíme
zvlášť rovnici danou substitučním vztahem:
1
x + - = -1.
X
což jsme měli dokázat.
Ta má dva komplexní kořeny x\ = —2+ í^y = cos(27r/3) + - \ — í^y = cos(2tc/3) — i sin(27r/3).
□ i sin(27r/3) a x2
135
A. REKURENTNÍ ROVNICE
1. LINEÁRNÍ PROCESY
Pro druhou hodnotu neznámé t dostáváme rovnici
1
x + - = 2
x
s dvojnásobným kořenem 1. Celkem je tedy bazí hledaného vektorového prostoru posloupností, které jsou řešením dané diferenční
rovnice, následující čtveřice posloupností: {—^ + iV3}^=l, {—\ — ř'V3}^i>{l}^i (konstantníposloupnost) a {ri\°£=x. Hledáme-li všiakrc^ álnou bázi, musíme nahradit dva generátory (posloupnosti) z této báze s komplexními hodnotami generátory reálnými. Protože tyto generátory jsou geometrické řady, jejichž libovolné členy jsou komplexně sdružená čísla, můžeme vzít jako vhodné generátory posloupnosti dané polovinou součtu, resp. polovinou /-násobku rozdílu, daných komplexních generátorů. Takto dostaneme následující reálnou bázi řešení: {1}^ (konstantní posloupnost), {n}^=l, {cos(« • 27r/3)}^1, {&m(n-27c/3)}?=1. □
3.5. Najděte posloupnost, která vyhovuje nehomogenní diferenční rovnici s počátečními podmínkami:
xn+2
-\- 2xn -\- 1, X\ — 2, x2
Řešení. Obecné řešení zhomogenizované rovnice je tvaru a(— 1)" + b2". Partikulárním řešením je konstanta —1/2. Obecné řešení dané nehomogenní rovnice bez počátečních podmínek je tedy
1
fl(-l)" +b2
Dosazením do počátečních podmínek zjistíme konstanty a = —5/6, b = 5/6. Dané rovnici s počátečními podmínkami tedy vyhovuje posloupnost
--(-!)" + -2""1 - -. 6 3 2
□
3.6. Určete posloupnost reálných čísel, která vyhovuje následující nehomogenní diferenční rovnici s počátečními podmínkami:
2x
n+2
*-« + !
-\- xn -\- 2, X\ — 2, X2 — 3.
Řešení. Obecné řešení zhomogenizované rovnice je tvaru a(— 1)" + b(1/2)". Partikulárním řešením je konstanta 1. Obecné řešení dané nehomogenní rovnice bez počátečních podmínek je tedy
a(-ir+b(^\ +1.
Odtud okamžitě vidíme, že jestliže jsou oba duální problémy řešitelné, pak musí být i ohraničené. Ještě zajímavější je následující postřeh přímo vycházející z nerovnosti v předchozí větě.
Důsledek. Jestliže existují přípustné vektory x a y duálních lineárních problémů takové, že pro účelové funkce platí c ■ x = yT ■ b, pak jde o optimální řešení obou problémů.
3.7. Věta (O dualitě). Je-li standardní problém lineárního programování řešitelný a ohraničený, pak je takový i jeho duální problém, optimální hodnoty jejich účelových funkcí splývají a optimální řešení vždy existuje.
Důkaz. Jeden směr tvrzení jsme již dokázali v předchozím důsledku. Zbývá důkaz existence optimálního řešení. Ten se nejsnadněji dokáže konstrukcí funkčního algoritmu, tomu se však teď nebudeme v podrobnostech věnovat. K chybějící části důkazu se vrátíme na straně 208 v afinní geometrii. □
Povšimněme si ještě pěkného přímého důsledku právě zformulované věty o dualitě:
Důsledek (Věta o ekvilibriu). Uvažme příspustné vektory x a y pro standarní maximalizační problém a jeho duální problém z definice 3.6. Pak jsou oba tyto vektory optimální, právě tehdy když yt = 0 pro všechny souřadnice s indexem i, pro které 2~2"j=i aUxJ < h a zároveň x j = 0 pro všechny souřadnice s indexem j, pro které YlT=i yiaij > ci-
Důkaz. Předpokládejme, že platí oba vztahy z předpko-ladu impliace ve větě. Pak tedy můžeme v ná-sledujím výpočtu počítat s rovnosti, protože sčítance s ostrou nerovností mají stejně u sebe nu-lové koeficienty:
m m n m n
i — l i — l j—l i — l j—l
a z stejného důvodu také
m n n
Y, Y, ^''"'/V/ = Y2cJxj-
Tím máme dokázánu jednu implikaci z tvrzení díky větě o dualitě.
Předpokládejme nyní, že x a y jsou skutečně optimální vektory. Víme tedy, že platí
m m n n
Y>'ihi ~ Vŕí/ŕ/.V; > ^<;.V;.
i = \ i = \ j=l j=l
ale zároveň jsou si levé a pravé strany rovny. Nastává tedy všude rovnost. Přepíšeme-li prvou rovnost jako
m / n \
YÁhi ~ J2avxj) =0
136
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
vidíme, že může být naplněna jen za podmínek ve větě, protože jde o nulový součet samých nezáporných čísel. Z druhé rovnosti stejně plyne i druhé zbylé tvrzení a důkaz je ukončen.
□
Věty o dualitě a ekvilibriu jsou užitečné při řešení problémů lineárního programování, protože nám ukazují souvislosti mezi nulovostí jednotlivých dodatečných proměnných a naplňování omezujících podmínek.
Poznámky o lineárních modelech v ekonomii. Náš
velice schematický problém černobílého natěrače z odstavce 3.4 můžeme použít jako ilustraci jednoho z typických ekonomických
__ modelů, tzv. model plánování výroby. Jde
přitom o zachycení problému jako celku, tj. se zahrnutím vnitřních i vnějších vztahů. Levé strany rovnic (3.1), (3.2), (3.3) i účelové funkce h(x\,x2) jsou vyjádřením různých výrobních vztahů. Podle povahy problému pak jsou požadovány na pravé straně buď přesné hodnoty (pak řešíme systém rovnic) nebo požadujeme kapacitní omezení a optimalizaci účelu (a pak dostáváme právě problémy lineárního programování).
Můžeme tak tedy obecně řešit problém alokace zdrojů při dodavatelských omezeních a přitom buď minimalizovat náklady nebo maximalizovat zisk. Z tohoto pohledu lze také nahlížet dualizaci problémů. Jestliže by náš natěrač chtěl hypoteticky nastavit svoje náklady spojené se svojí prací yL, bílou barvou yw a černou barvou yB, pak bude chtít minimalizovat účelovou funkci
L ■ y l + Wyw + By b
při omezujících podmínkách
Vl + wiyw + bxyB > cx yL + w2yw + b2yB > c2.
To je právě duální problém k původnímu a hlavní věta 3.7 říká, že optimální stav je takový, kdy účelové funkce mají stejnou hodnotu.
V ekonomických modelech najdeme mnoho modifikací. Jednou z nich jsou úlohy finančního plánování, související s optimalizací portfolia. Určujeme přitom objemy investic do jednotlivých investičních variant s cílem držet se daných omezení na rizika a optimalizovat přitom zisk, resp. při očekávaném objemu minimalizovat rizika.
Dalším obvyklým modelem jsou marketingové aplikace, např. alokace nákladů na reklamy v různých médiích nebo umísťování reklam do časových termínů. Omezujícími podmínkami bude disponibilní rozpočet, rozložení cílových skupin apod.
Velmi obvyklé jsou modely výživových problémů, tj. návrh návek různých komponent výživy s daným složením a omezujícími požadavky na celkové objemy výživových látek.
Dosazením do počátečních podmínek zjistíme konstanty a = l,b = 4. Dané rovnici s počátečními podmínkami tedy vyhovuje posloupnost
1
□
(-i)"+4(-| +1
3.7. Řešte následující diferenční rovnici:
-"-«+4 = -"-«+3 -"-«+2 ~\~ -"-« + 1 -*-«•
Řešení. Z teorie víme, že prostor řešení této diferenční rovnice bude čtyřdimenzionální vektorový prostor, jehož generátory zjistíme z kořenů charakteristického polynomu dané rovnice. Charakteristická rovnice je
x4 - x3 + x2 - x + 1 = 0.
Jedná se o reciprokou rovnici (to znamená, že koeficienty u (n—k)-té a k-té mocniny x, k = 1, ..., n, jsou shodné). Zavedeme tedy substituci u = x + i. Po vydělení rovnice x2 (nula nemůže být kořenem) a substituci (všimněte si, že x2 + = u2 — 2) dostáváme
2 1 1 2 x — x + 1---1—- = u — u — 1=0.
x x1
Dostáváme tedy neznámé m i 2 = 1±2V^- Odtud pak z rovnice x2 —ux + 1=0 určíme čtyři kořeny
2,3,4
1 ± y/5± V-10±2V5
Nyní si všimněme, že kořeny charakteristické rovnice jsme mohli „uhodnout" rovnou. Je totiž
x5 + 1 = (x + l)(x4
x3 + x2 - X + 1),
a tedy jsou kořeny polynomu x4 — x3 + x2 — x + 1 i kořeny polynomu x5 + 1, což jsou páté odmocniny z —1. Takto dostáváme, že řešením charakteristikého polynomu jsou čísla xi 2 = cos^isin^) ax34 = cos^) ± sin^). Tedy reálnou bází prostoru řešení dané diferenční rovnice je například báze posloupností cos^), sin^), cos(-|-) a siní^j1), což jsou siny a kosiny argumentů příslušných mocnin kořenů charakteristického polynomu.
Všimněme si, že jsme mimochodem odvodili algebraické výrazy pro cos(|-)
í+Vš
4 ,sin(i)
710-2^
4 , cos(^) = a sin(3f)
710+2^5
(vzhledem k tomu, že všechny kořeny rovnice mají abso-
lutní hodnotu 1, tak jsou to reálné, resp. imaginární, části příslušných kořenů). □
137
A. REKURENTNÍ ROVNICE
2. DIFERENČNÍ ROVNICE
3.8. Určete explicitní vyjádření posloupnosti vyhovující diferenční rovnici xn+2 = 2xn+\ — 2x„ se členy x\ = 2, x2 = 2.
Řešení. Kořeny charakteristického polynomu x2 — 2x + 2 jsou 1 + i a 1 — i. Báze (komplexního) vektorového prostoru řešení je tedy tvořena posloupnostmi y„ = (1 + i)" a z„ = (1 — /)"■ Hledanou posloupnost můžeme vyjádřit jako lineární kombinaci těchto poslopností (s komplexními koeficienty). Je tedy xn = a ■ yn + b ■ z„, kde a = a\ + ia2, b = b\ + ib2. Z rekurentního vztahu dopočteme xq = ^ (2x\ — x2) = 0 a dosazením «=0a« = ldo uvažovaného vyjádření xn dostáváme
1 = xq = ci\ + ia2 + b\ + ib2
2 = xi = (fli + ia2){\ + i) + (bi + ib2){\ - i),
a porovnáním reálné a komplexní složky obou rovnic dostáváme ^itre-ární soustavu čtyř rovnic o čtyřech neznámých
ai + b\ = 1
a2 + b2 = 0
ai — a2 + b\ + b2 = 2
ai + a2 — b\ + b2 = 0
s resenim a\ = b\ = b2 = ^ a a2 posloupnost vyjádřit jako 1
-112. Celkem můžeme hledanou
(--l-í)(l + if + + h)(l-if.
Posloupnost můžeme však vyjádřit i pomocí reálné báze (komplexního) vektorového prostoru řešení, totiž posloupností un = \(y„ + zn) = (V2)"cos(f) a vn = \i(Zn - Jn) = (>/2> sin(f). Matice přechodu od komplexní báze k reálné je
1 _ \ i
2 2
inverzní matice je T~l = Q ^,pro vyjádření posloupnosti xn pomocí reálné báze, tj. souřadnice (c, d) posloupnosti xn v bázi {un, vn}, pak máme
máme tedy alternativní vyjádření posloupnosti x„, ve kterém se nevyskytují komplexní čísla (ale zase jsou v něm odmocniny):
JtB = (V2)-cos(^) + (V2)-sin(^),
které jsme samozřejmě mohli získat též řešením dvou lineárních rovnic o dvou neznámých c, d, totiž 1 = x0 = c ■ u0 + d ■ v0 = c a. 2 = x\ = c ■ u\ + d ■ v\ = c + d. □
Problémy lineárního programování se objevují při personálních úlohách, kdy jsou pracovníci s různými kvalifikacemi a dalšími předpoklady rozdělováni do směn. Obvyklé jsou také problémy směšování, problémy dělení a problémy distribuce zboží-
2. Diferenční rovnice
Diferenčními rovnicemi jsme se stručně zabývali již v první kapitole, byť pouze těmi prvního řádu.Nyní si ukážeme obecnou teorii pro lineární rovnice s konstantními koeficien-■íijwf ty, která poskytuje nejen velmi praktické nástroje, ale je také pěknou ilustrací pro koncepty vektorových podprostorů a lineárních zobrazení.
^ Homogenní lineární diferenční rovnice řádu k \—
3.9. Definice. Homogenní lineární diferenční rovnice řádu k je dána výrazem
aoxn + a\xn-\ + • • • + a^Xn-i =0, a$ ^ 0 ak ^ 0,
kde koeficienty a{ jsou skaláry, které mohou případně i záviset na n.
Říkáme také, že taková rovnost zadává homogenní lineární rekurenci řádu k a často zapisujeme hledanou posloupnost jako funkci
f(n) = --f(n-l) a0
ak
-f(n-k).
a0
Řešením této rovnice nazýváme posloupnost skalárů , pro všechna i e N, případně i e Z, které vyhovují rovnici s libovolným pevným n.
1
Libovolným zadáním k po sobě jdoucích hodnot x; jsou určeny i všechny ostatní hodnoty jednoznačně. Skutečně, pracujeme nad polem skalárů, takže í?Z3 hodnoty ao i ak jsou invertibilní a proto z definičního vztahu lze vždy spočíst hodnotu xn ze známých ostatních hodnot a stejně tak pro xn-k. Indukcí tedy okamžitě dokážeme, že lze jednoznačně dopočíst všechny hodnoty jak pro kladná tak pro záporná celá n.
Prostor všech nekonečných posloupností x; je vektorový prostor, kde sčítání i násobení skaláry je dáno po složkách. Přímo z definice je zjevné, že součet dvou řešení homogenní lineární rovnice nebo skalární násobek řešení je opět řešení. Stejně jako u homogenních systémů lineárních tedy vidíme, že množina všech řešení je vektorový podprostor.
Počáteční podmínka na hodnoty řešení je dána jako k-rozměrný vektor v Kk. Součtu počátečních podmínek odpovídá součet příslušných řešení a obdobně se skalárními násobky. Dále si všimněme, že dosazením nul a jedniček do zadávaných počástečních k hodnot snadno získáme k lineárně nezávislých řešení naší rovnice. Jakkoliv jsou tedy zkoumané vektory nekonečné posloupnosti skalárů, samotný prostor všech řešení je konečněrozměrný, předem víme, že jeho
138
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
dimenze bude rovna řádu rovnice k, a umíme snadno určit bázi všech těchto řešení. Opět hovoříme o fundamentálním systému řešení a všechna ostatní řešení jsou právě jejich lineární kombinace.
Jak jsme si již ověřili, vybereme-li k po sobě jdoucích indexů i, i + 1, ..., i + k — 1, zadává homogenní lineární diferenční rovnice lineární zobrazení Kk -» K°° k-rozměrných vektorů počástečních hodnot do nekonečně rozměrných poslouností týchž skalárů. Nezávislost různých takových řešení je ekvivalentní nezávislosti počátečních hodnot, ale tu umíme snadno rozpoznat pomocí determinantu. Máme-li /c-tici řešení (x^1], ..., x^), pak jde o nezávislá řešení právě, když následující determinant, tzv. Casoratián je nenulový pro jedno (a pak už všechna) n
[i]
r[i]
xn
xíl]
\+k-\
xn
[k] Xn + l
[k] Xn+k-l
3.10. Řešení homogenních rekurencí s konstantními koeficienty. Těžko bychom hledali univerzální postup, jak hledat řešení obecných homogenních lineárních diferenčních rovnic, tj. přímo spočítatelný výraz pro obecné řešení xn. V praktických modelech ale velice často vystupují rovnice, kde jsou koeficienty konstantní. V tomto přípdě se daří uhodnout vhodnou formu řešení a skutečně se nám podaří najít k lineárně nezá-'^jf^i^y~ vislých možností. Tím budeme mít problém vyřešený, protože všechny ostatní budou jejich lineární kombinací.
Pro jednoduchost začneme rovnicemi druhého řádu. Takové potkáváme obzvlášť často v praktických problémech, kde se vyskytují vztahy závisející na dvou předchozích hodnotách. Lineární diferenční rovnicí druhého řádu s konstantními koeficienty (resp. lineární rekurencí druhého řádu s konstantními koeficienty) tedy rozumíme předpis
(3.4)
f(n+2) = a- f(n + l)+b-f(n)+c,
kde a,b, c jsou známé skalární koeficienty.
Např. v populačních modelech můžeme zohlednit, že jedinci v populaci dospívají a pořádně se rozmnožují až o dvě období později (tj. přispívají k hodnotě f(n + 2) násobkem b ■ f (n) s kladným b > 1), zatímco nedospělí jedinci vysílí a zničí část dospělé populace (tj. koeficient a pak bude záporný). Navíc si je třeba někdo pěstuje a průběžně si ujídá konstantní počet c < 0 v každém jednotlivém období.
Speciálním takovým příkladem s c = 0 je např. Fibo-nacciho posloupnost čísel y0, yi, ..., kde yn+2 = y„+i + y„.
Jestliže při řešení matematického problému nemáme žádný nový nápad, vždy můžeme zkusit, do jaké míry funguje známé řešení podobných úloh. Zkusme proto dosadit do rovnice (3.4) s koeficientem c = 0 podobné řešení jako u
3.9. Určete explicitní vyjádření posloupnosti vyhovující diferenční rovnici xn+2 = 3xn+\ + 3x„ se členy x\ = 1 a x2 = 3.
3.10. Určete explicitní vzorec pro n-tý člen jediné posloupnosti {xn}^=l vyhovující následujícím podmínkám:
xn+2 — xn + l
,Xi
1, x2 = 5.
3.11. Určete explicitní vzorec pro n-tý člen jediné posloupnosti ix«}^Li vyhovující následujícím podmínkám:
~xn+3 = 2xn+2 + 2xn + \ +x„, X\ = 1, X2 = 1, x3 = 1.
3.12. Určete explicitní vzorec pro n-tý člen jediné posloupnosti {xn}^=l vyhovující následujícím podmínkám:
— xn+3 = 3x„+2 + 3x„ + i + X„, X\ = 1, X2 = 1, x3 = 1.
B. Populační modely
Populační modely, kterými se budeme zabývat, budou rekurentní vztahy ve vektorových prostorech. Neznámou veličinou tedy nebude posloupnost čísel nýbrž posloupnost vektorů. Roli koeficientů pak budou hrát matice. Začneme s jednoduchým (dvourozměrným) příkladem.
3.13. Spoření. S kamarádem spoříme na společnou dovolenou následujícím způsobem. Na začátku dám 10 EUR a on 20 EUR. Každý další měsíc pak dá každý z nás tolik, co minulý měsíc plus polovinu toho, co dal ten druhý z nás předchozí měsíc. Kolik budeme mít za rok dohromady naspořeno? Kolik peněz budu platit dvanáctý měsíc?
Řešení. Obnos peněz, který budu platit n-tý měsíc já označím xn a to, co bude platit kamarád označím y„. První měsíc tedy dáme x\ = 10, yi = 20. Pro další platby můžeme psát rekurentní rovnice:
i
-*-« 2yn
yn ~\~ yxn
xn + l
yn + l — jn i 2J
Pokud označíme společný vklad zn = xn+yn, pak sečtením uvedených rovnic dostaneme vztah zn+\ = zn + \zn = \zn- T° je geometrická řada a dostáváme tedy z„ = 3.(|)"_1. Za rok budeme mít celkem naspořeno z,i +z2+- ■ -+Z\2- Tento částečný součet umíme lehce spočítat
3(l + - + --- + (-)n)
.(I)12
1
1
772, 5.
Za rok tedy dohromady naspoříme přes 772 euro.
139
B. POPULAČNÍ MODELY
2. DIFERENČNÍ ROVNICE
Rekurentní soustavu rovnic popisující systém spoření můžeme napsat pomocí matice následovně
xn + l
yn+i
Jde tedy opět o geometrickou řadu. Jejími prvky jsou teď ovšem vektory a kvocient není skalár, ale matice. Řešení lze nicméně najít obdobně
1 \ \ 1
n-l
Mocninu matice působící na vektor (xi, vi) můžeme nalézt, když vyjádříme tento vektor v bázi vlastních vektorů. Charakteristický polynom matice je (1 — X)2 - | - Oa vlastní čísla jsou tedy Ai 2 = \,\- Příslušné vlastní vektory jsou po řadě (1, 1) a (1, —1). Pro počáteční vektor (x\, yi) = (1,2) spočítáme
a proto
3 /3 2 V2
3/1 2 1
1
n-l
To znamená, že já zaplatím 12. měsíc
Xl2
12
-(-
2\2
12
n-l
130
eur a můj kamarád v podstatě stejně.
Poznámka. Předchozí příklad lze řešit i bez matice následujícím přepsáním rekuretní rovnice: x„ = xn + \yn
jXn ~\~ 2Zn-
Předcházející příklad byl vlastně modelem růstu (v daném případě růstu množství naspořených peněz). Nyní přejděme k modelům růstu popisujícím primárně růst nějaké populace. Leslieho model růstu, který jsme detailně rozebrali v teorii, velmi dobře popisuje nejen populace ovcí (podle kterých byl sestaven), ale uplatňuje se například i při modelování následujích populací:
3.14. Zajíci podruhé. Ukažme si, jak můžeme Leslieho modelem popsat populaci zajíců na louce, kterou jsme se zaobírali v příkladu (3.1). Uvažujme, že zajíci umírají po dovršení devátého měsíce věku (v původním modelu byl věk zajíců neomezen). Označme počty zajíců (resp. zaječic) podle stáří v měsících v čase t (měsíců) jako x\(i), x2(t),..., x9(t), tak počty zajíců v jednotlivých věkových skupinách budou po jednom měsíci x\(t + 1) = x2(t) + x3(ř) + • • • + x9(t),
rovnic lineárních, tj. f(n) = X" pro nějaké skalární X. Dosazením dostáváme
n+2
aX
n + l
bX" = Xn(X2 -aX-b) = 0.
Tento vztah bude platit buď pro X = 0 nebo při volbě hodnot
Xt = ^(a + yV + 4b), X2 = ^(a - y'a2 + 4b).
Zjistili jsme tedy, že skutečně opět taková řešení fungují, jen musíme vhodně zvolit skalár X. To nám ale nestačí, protože my chceme naj ít řešení pro j akékoliv počáteční hodnoty / (0) a f(l), a zatím jsme našli jen dvě konkrétní posloupnosti splňující danou rovnici (a nebo dokonce jen jednu, pokud je
^2 = ^l)-
Jak jsem již dovodili i u zcela obecných lineárních reku-rencí, součet dvou řešení f\(n) a f2(n) naší rovnice f(n + 2) — a ■ f (n + 1) — b ■ f (n) = 0 je zjevně opět řešením téže rovnice a totéž platí pro konstatní násobky řešení. Naše dvě konkrétní řešení proto poskytují daleko obecnější řešení
f(n) = ClX"l+ C2X\
pro libovolné skaláry C\ a C2 a pro jednoznačné vyřešení konkrétní úlohy se zadanými počátečními hodnotami /(O) a f(\) nám zbývá jen najít příslušné konstanty C\ a C2. (A také si musíme ujasnit, zda to pro všechny počáteční hodnoty půjde).
3.11. Volba skalárů. Ukažme si, jak to může fungovat alespoň na jednom příkladě. Soustředíme se přitom na problém, že kořeny charakteristického polynomu nevychází obecně ve stejném oboru skalárů, jako jsou koeficienty v rovnici. Řešme tedy problém:
elQ (3.5)
1
yn+2 = yn+\ +
y0 = 2, yi = 0. V našem případě je tedy Ai_2 = ^(1 ± V3) a zjevně y0 = Ci + C2 = 2
yi
ici(l + V3) + ic2(l- VŠ)
je splněno pro právě jednu volbu těchto konstant. Přímým výpočtem C\ = 1 — \ V3, C2 = 1 + | V3 a naše úloha má jediné řešení
f in) = (1 - i V3)^(l + 73)" + (1 + ^/3)^(1 - 73)".
Všimněme si, že i když nalezená řešení pro rovnice s celočíselnými koeficienty vypadají složitě a jsou vyjádřena pomocí iracionálních (případně komplexních) čísel, o samotném řešení dopředu víme, že je celočíselné též. Bez tohoto „úkroku" do většího oboru skalárů bychom ovšem obecné řešení napsat neuměli.
S podobnými jevy se budeme potkávat velice často. Obecné řešení nám také umožňuje bez přímého vyčíslování konstant diskutovat kvalitativní chování posloupnosti čísel
140
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
3.11a
f (n), tj. zda se budou s rostoucím n blížit k nějaké pevné hodnotě nebo budou oscilovat v nějakém rozsahu nebo utečou do neomezených kladných nebo záporných hodnot.
3.12. Obecný případ homogenních rekurencí. Zkusme nyní stejně jako v případě druhého řádu dosadit volbu xn = k" pro nějaký ( zatím neznámý) skalár k do obecné homogenní rovnice z definice 3.9. Dostáváme pro každé n podmínku
Xi(t + 1)
kn~k(aokk + a\kk~
+ ak)=0
což znamená, že buď k = 0 nebo je A kořenem tzv. charakteristického polynomu v závorce. Charakteristický polynom ale už není závislý na n.
Předpokládejme, že má charakteristický polynom k různých kořenů k\, ..., kk. Můžeme za tímto účelem i rozšířit uvažované pole skalárů, např. Q na M nebo M na C, protože výsledkem výpočtu pak stejně budou řešení, která opět zůstanou v původním poli díky samotné rovnici. Každý z kořenů nám dává jedno možné řešení
xn = C^ž)"-
Abychom byli uspokojeni, potřebujeme k lineárně nezávislých řešení.
K tomu nám postačí ověřit nezávislost dosazením k hodnot pro n = 0, ..., k— 1 pro k možností k{ do Casoratiánu viz 3.9. Dostaneme tak tzv. Vandermondovu matici a je pěkným (ale ne úplně snadným) cvičením spočíst, že pro všechna k a jakékoliv /c-tice různých k{ je determinant takovéto matice nenulový, viz příklad 2.22 na straně 84. To ale znamená, že zvolená řešení jsou lineárně nezávislá.
Nalezli jsme tedy fundamentální systém řešení homogenní diferenční rovnice v případě, že všechny kořeny jejího charakteristického polynomu jsou po dvou různé.
Uvažme nyní násobný kořen k a dosaďme do definiční rovnice předpokládané řešení xn = nk". Dostáváme podmínku
a0nkn H----+ak(n- k)kn~k = 0.
Tuto podmínku je možné přepsat pomocí tzv. derivace polynomu (viz ?? na straně ??), kterou značíme apostrofem:
k(a0kn +■■■ + akk"-ky = 0
a hned na začátku kapitoly páté uvidíme, že kořen polynomu / je vícenásobný právě, když je kořenem i jeho derivace /'. Naše podmínka je tedy splněna.
Při vyšší násobnosti i kořenu charakteristického polynomu můžeme postupovat obdobně a využijeme skutečnosti, že £-násobný kořen je kořenem všech derivací polynomu až do i — 1 včetně. Derivace přitom postupně vypadají takto:
1) = x;_i(ř),pro i = 2,3, 10, neboli
/*i (í + i)\ ŕ 1 i 1 1 i 1 1
x2(ř + l) i 0 0 0 0 0 0 0 0 x2(ř)
x3(ř + l) 0 1 0 0 0 0 0 0 0 x3(ř)
x4(ř + 1) 0 0 1 0 0 0 0 0 0 x4(ř)
x5(ř + l) = 0 0 0 1 0 0 0 0 0 x5(ř)
x6(ř + l) 0 0 0 0 1 0 0 0 0
x7(ř + l) 0 0 0 0 0 1 0 0 0 x7(ř)
x8(r + l) 0 0 0 0 0 0 1 0 0 n(t)
\x9(ř + l)/ Vo 0 0 0 0 0 0 1 0/ \x9(ř)/
Charakteristický polynom uvedené matice je k9 — k1 — k6 — k5 — k4 — k3 —k2 —k—l. Kořeny této rovnice nej sme schopni explicitně vyj ádřit, jeden z nich však velmi dobře odhadnout, k\ = 1, 608 (proč musí být menší než (VŠ + l)/2)?). Populace bude tedy podle tohoto modelu růst přibližně s geometrickou řadou 1, 608ř.
3.15. Jezírko. Mějme jednoduchý model jezírka, ve kterém žije populace bílé ryby (plotice, ouklej, podoustev, ostroretka atd.). Předpokládáme, že druhého roku se dožije 20 % rybího plůdku a od tohoto stáří už jsou ryby schopny se reprodukovat. Z mladých ryb přežije z druhého do třetího roku přibližně 60 % a v dalších letech je už úmrtnost zanedbatelná. Dále předpokládáme, že roční přírůstek nových plůdků je třikrát větší než počet ryb (schopných reprodukce).
Tato populace by evidentně jezírko brzy přeplnila. Rovnováhu chceme dosáhnout nasazením dravé ryby, např. štiky. Předpokládejme, že jedna štika sní ročně asi 500 dospělých bílých ryb. Kolik štik pak musíme do jezírka nasadit, aby populace stagnovala?
Řešení. Pokud označíme p počet plůdku, m počet mladých ryb a r počet dospělých ryb, pak je stav populace v dalším roce popsán následovně:
p\ í 3m + 3r 0,2p i0, 6m + xr
kde 1 — r je relativní úmrtnost dospělé ryby způsobená štikou. Příslušná matice popisující tento model je tedy
Pokud má populace stagnovat, pak musí mít tato matice vlastní hodnotu 1. Jinými slovy, jednička musí být kořenem charakteristického polynomu této matice. Ten je tvaru k2(x — k)+0, 36—0, 6.(r —k) = 0. To znamená, že r musí splňovat
r - 1 + 0,36-0, 6(r - 1) = 0 0, 4r - 0, 04 = 0
Do dalšího roku tedy může přežít jen 10 % z dospělých ryb a zbytek by měla sníst štika. Označíme-li hledaný počet štik x, pak dohromady sní 500x ryb, což by mělo odpovídat podle předchozího výpočtu 0, 9r.
141
B. POPULAČNÍ MODELY
2. DIFERENČNÍ ROVNICE
Poměr počtu bílé ryby ku počtu štik by tedy měl být - = To je
přibližně jedna štika na 556 kusů bílé ryby.
Obecněji můžeme zpracovat předcházející model takto:
□
3.16. Nechť je v populačním modelu dravec-kořist určen vztah mezi počtem dravců Dk a kořisti Kk v daném a následujícím měsíci (k e N U {0}) lineárním systémem
(a)
0,6Dk + 0,5 Kk, -0,l6Dk + l,2Kk,
Dk+1 Kk+i
(b)
(c)
Dk+i Kk+i
0,6Dk -0,175 Dk
+ 0,5Kk, + 1,2 Kk;
Dk+i Kk+i
+ 0,5Kk, + l,2Kk.
0,6Dk -0, 135 Dk
Analyzujte chování tohoto modelu po velmi dlouhé době.
Řešení. Všimněme si, že jednotlivé varianty se od sebe navzájem liší pouze v hodnotě koeficientu u Dk ve druhé rovnici. Můžeme proto všechny tři případy vyjádřit jako
Dk Kk
0,6 0,5 a 1,2
Dk-i Kk-i
k e N,
kde budeme postupně klást a = 0, 16, a = 0, 175, a = 0, 135. Hodnota koeficientu a zde reprezentuje průměrný počet kusů kořisti zahubených jedním (očividně „nenáročným") dravcem za měsíc. Při označení
0,6 0,5 a 1,2
bezprostředně dostáváme
Dk Kk
Tk l Do * Ko
keN.
Pomocí mocnin matice T tak můžeme určit vývoj populací dravce a kořisti po velmi dlouhé době. Snadno stanovíme vlastní čísla
(a) ki = 1, k2 = 0, 8;
(b) kí = 0, 95, k2 = 0, 85;
(c) ki = 1,05, k2 = 0,75
matice T a jim (při zachování pořadí) příslušné vlastní vektory
(a) (5,4)r, (5,2)r;
(b) (10,7)r, (2, lf;
(c) (10,9)r , (10, 3)T. Pro k e N tudíž platí
/(*) /'(*) /"(*)
a0k" +
i n—k
+ akk"
■ ■ ■ + ak(n - k)kn-k~l a0n(n-l)kn-2+- ■ -+ak(n-k)(n-k-l)kn-k-2
a0nk" 1 +
a0n...(n- í)kn~1-1 + ...
+ ak(n — k)... (n — k — i)k
n-k-l-l
Podívejme se na případ trojnásobného kořenu k a hledejme řešení ve tvaru n2k". Dosazením do definiční podmínky dostaneme rovnost
a0n2k" +
+ ak(n — k) k
21 n—k
Zjevně je levá strana rovna výrazu k2 f"(k) + kf'(k) a protože je k kořenem obou derivací, je podmínka splněna.
Indukcí snadno dokážeme, že i obecnou podmínku pro hledané řešení ve tvaru xn
nlkn,
aonlkn + .. .ak(n
k)lk
£ -\ n—k
o,
dostaneme jako vhodnou lineární kombinaci derivací charakteristického polynomu začínající výrazem
1
kl+lf(l+l> + -kl£(£ + l)fw + ...
a dostali jsme se tedy blízko k úplnému důkazu následující:
Věta. Každá homogenní lineární diferenční rovnice řádu k nad libovolným číselným oborem K obsaženým v komplexních číslech K má za množinu všech řešení k—rozměrný vektorový prostor generovaný posloupnostmi x„ = nlkn, kde k jsou (komplexní) kořeny charakteristického polynomu a mocniny l probíhají všechna přirozená čísla od nuly až do násobnosti příslušného kořenu k.
Důkaz. Výše použité vztahy násobnosti kořenů a derivací uvidíme později, a nebudeme tu dokazovat tvrzení, že každý komplexní polynom má právě tolik kořenů, včetně násobnosti, jaký má stupeň. Zbývá tedy ještě dokázat, že nalezená &-tice řešení je lineárně nezávislá. I v tomto případě lze induktivně dokázat nenulovost příslušného Casora-tiánu, jako jsme odkazovali u případu Vandermondova determinantu výše.
Pro ilustraci postupu ukážeme, jak výpočet vypadá pro případ jednonásobného kořenu k\ a dvojnásobného kořenu
142
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
X2 charakteristického polynomu:
C(X", X", nXn2)
i n+2
2
l n+2
nX"2 (n + l)Xn2+1 (n + 2)Xn2+1
-1n-12n K\K2
^n -í2n K\K2
1
xx
1
~X2
x\ 1
1 n -\ 2n -AlA2
XX -
Xi(X\ -
xx
(n + 1)X2 (n + 2)X\
1 n
0 X2
0 x\
x2
~X2
-A2)
-x2
X\(X\ — X2) Xi
X"X2n+1(Xi — X2)z 0.
V obecném případě vedeme podobně důkaz nenulovosti příslušného Casoratiánu indukcí. □
3.13. Reálné báze řešení. Pro rovnice s reálnými koeficienty povedou reálné počáteční podmínky vždy na reálná řešení. Přesto ale budou příslušná fundamentální řešení z právě odvozené věty často existovat pouze v oboru komplexním.
Zkusme proto najít jiné generátory, se kterými se nám bude pracovat lépe. Potože jsou koeficienty charakteristického polynomu reálné, každý jeho kořen bude buď také reálný nebo musí kořeny vystupovat po dvou komplexně združených.
Jestliže si řešení popíšeme v goniometrickém tvaru jako
X" = \X|" (cos n 5K0, obě populace vymřou.
(b) Obě populace vymřou.
(c) Pro3D0 < 10Ko nastává populační exploze obou druhů; pro 3 A) ř_ 10Kq obě populace vymřou.
To, že extrémně malá změna velikosti a může vést ke zcela odlišnému výsledku, je zapříčiněno neměnností hodnoty a v závislosti na velikosti obou populací. Poznamenejme, že toto omezení, kdy a v našich modelech považujeme za konstantní, nemá oporu ve skutečnosti. Přesto získáváme odhad velikosti a pro stabilní populace. □
3.17. Poznámka. Jiný model soužití populací dravce a kořisti poskytuje model pánů Lotky a Volterra, který popisuje vztah mezi populacemi soustavou dvou obyčejných diferenciálních rovnic. Podle tohoto modelu obě populace oscilují, což je i v souladu s pozorováním.
3 . 14
Nyní uveďme poněkud obsáhlejší model.
3.18. Model šíření jednoletých bylin. Budeme uvažovat rostliny, které na začátku léta vykvetou, na jeho vrcholu vyprodukují semena a samy uhynou. Některá ze semen vyklíčí ještě na konci podzimu (ozimé rostliny), jiná přečkají zimu v zemi a vyklíčí na začátku jara (jarní rostliny). Ozimé rostlinky (sazenice), které přes zimu nezmrznou, jsou na jaře větší než jarní a většinou z nich vyrostou větší rostliny než z jarních sazenic. Větší rostlina vyprodukuje více semen. Pak se celý vegetační cyklus opakuje.
Rok je tedy rozdělen na čtyři vegetační období a v každém z těchto
období můžeme rozlišit několik „forem" rostliny: Období stadia rostliny
začátek jara malé a velké sazenice
začátek léta malé, střední a velké kvetoucí rostliny
vrcholné léto semena
podzim sazenice a přezimující semena
Označme xi(t), resp. x2(t), počet malých, resp. velkých, sazenic na začátku jara roku t a y\{t), resp. y2(t), resp. yj,(t), počet malých, resp.
Postupujeme tak, že najdeme jedno řešení a přičteme celý vektorový prostor dimenze k řešení odpovídajících systémů homogenních. Skutečně takto dostáváme řešení a protože je rozdíl dvou řešení nehomogenní rovnice zjevně řešením homogenní, dostáváme takto řešení všechna.
U systému lineárních rovnic se mohlo stát, že nemusel vůbec mít řešení. To u našich diferenčních rovnic možné není. Zato ale bývá nesnadné nalézt to jedno potřebné partikulární řešení nehomogenního systému, pokud je chování skalárních koeficientů v rovnici složité. U lineárních rekurencí je to podobné.
Omezíme se tu na jediný případ, kdy příslušný homogenní systém má koeficienty konstantní a b(n) je polynom stupně s. Řešení pak lze hledat ve tvaru polynomu
x„ = ao + a\n + • • • + asns
s neznámými koeficienty a,■, i = 1, ..., s. Dosazením do diferenční rovnice a porovnáním koeficientů u jednotlivých mocnin n dostaneme systém s + 1 rovnic pro s + 1 proměnných a i. Pokud má tento systém řešení, našli jsme řešení našeho původního problému. Pokud řešení nemá, může stačit zvětšit stupeň s hledaného polynomu.
Např. rovnice xn — x„_2 = 2 nemůže mít konstantní řešení, ale dosazením xn = a0+Q!i« dostáváme řešení a i = 1 (a koeficient a0 může být libovolný) a proto je obecné řešení naší rovnice
x„ = Ci +C2(-1)" +n.
Všimněme si, že skutečně matice příslušného systému rovnic d°Plnit odkaz na pro polynom nižšího stupně nula je nulová a rovnice 0-a0 = 2 vedlejším sloupci,
snad tam je i diskuse řešitelnosti pomocí variace
nema resem.
3.15. Lineární filtry. Uvažujme nyní nekonečné posloupnosti
konstant.
(. . . , X—n, X—n
+ 1.
X — i, Xq, X\,
a budeme, podobně jako u systémů lineárních rovnic, pracovat s operací T, která zobrazí celou posloupnost x na posloupnost z = Tx se členy
Zn
aoxn + a\xn-\ + ■ ■ ■ + akxn-
S posloupnostmi x můžeme opět pracovat jako s vektory J' „ vzhledem ke sčítání i násobení skaláry po složkách. Pouze bude tento velký vektorový prostor nekoneč-něrozměrný. Naše zobrazení T je zjevně lineárním ffi 1 zobrazením na takovém vektorovém prostoru. Posloupnosti si představme jako diskrétní hodnoty nějakého signálu, odečítané zpravidla ve velmi krátkých časových jednotkách, operace T pak může být filtrem, který signál zpracovává. Bude nás zajímat, jak odhadnout vlastnosti, které takový „filtr" bude mít.
Signály jsou velice často ze své podstaty dány součtem několika částí, které jsou samy o sobě víceméně periodické. Z naší definice je ale zřejmé, že periodické posloupnosti xn,
144
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
3.15
raději spravit obrázky - černobílé sinusovkami a pondne :-)
tj. posloupnosti splňující pro nějaké pevné přirozené číslo p
xn+p — xn
budou mít i periodické obrazy z = T x
Zn+p = aOxn+p + a\xn-\+p + ' ' ' + akxn-k+p = ClQXn + a\X„-i + • • • + a^Xn-k = Zn
se stejnou periodou p.
Pro pevně zvolenou operaci T nás bude zajímat, které vstupní periodické posloupnosti zůstanou přibližně stejné (případně až na násobek) a které budou utlumeny na nulové hodnoty.
Ve druhém případě tedy hledáme jádro našeho lineárního zobrazení T. To je ale dáno právě homogenní diferenční rovnicí
at)Xn + a\xn-\ + ■ ■ ■ + a^Xn-i =0, «o ^ 0 ak ^ 0, kterou jsme se už naučili řešit.
3.16. Spatný equalizer. Jako příklad uvažujme velmi jednoduchý lineární filtr zadaný rovnicí
Zn — (TX)n = Xn-^-2 ~\~ Xn.
Výsledky takového zpracování signálu jsou naznačeny ifgfc. na následujících čtyřech obrázcích pro po-'^3^\/f^"'' stupně se zvyšující frekvenci periodického ''Wjh^-'' signálu x„ = cos(cpn). Červený je původní jNiás^-- signál, zelený je výsledek po zpracování filtrem. Nerovnoměrnosti křivek jsou důsledkem nepřesného kreslení, oba signály jsou samozřejmě rovnoměrnými
středních, resp. velkých rostlin v létě téhož roku. Z malých sazenic mohou vyrůst malé nebo střední rostliny, z velkých sazenic mohou vyrůst střední nebo velké rostliny. Kterákoliv ze sazenic samozřejmě může uhynout (uschnout, být spasena krávou a podobně) a nevyroste z ní nic. Označme pravděpodobnost, že ze sazenice j-té velikosti, j = 1,2, vyroste rostlina i-té velikosti, / = 1, 2, 3. Pak je
0 W mezi unitárními prostory se nazývá unitární zobrazení, jestliže pro všechny vektory u, v e V platí
u ■ v = cp(u) ■ (p(v). Unitární isomorfismus je bijektivní unitární zobrazení.
3.24. Vlastnosti prostorů se skalárním součinem. Ve
stručné diskusi euklidovských prostorů v předchozí kapitole jsme už některé jednoduché vlastnosti prostorů se skalárním součinem odvodili, důkazy v komplexním oboru jsou velmi podobné.
V dalším budeme pracovat s reálnými i komplexními prostory zároveň a budeme psát K pro M nebo C, v reálném případě je konjugace prostě identické zobrazení (tak jak skutečně zúžení konjugace na reálnou přímku v komplexní rovině je). Stejně jako u reálných prostorů definujeme obecně pro libovolný vektorový podprostor U C V v prostoru se skalárním součinem jeho ortogonální doplněk
U~L = {v € V; u ■ v = 0 pro všechny u e U},
což je zjevně také vektorový podprostor ve V.
Budeme v dalších odstavcích pracovat výhradně s ko-nečněrozměrnými unitárními nebo euklidovskými prostory. Řada našich výsledků ale má přirozené rozšíření pro tzv. Hil-bertovy prostory, což jsou jisté nekonečněrozměrné prostory
156
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
se skalárním součinem, ke kterým se aspoň stručně vrátíme později.
Tvrzení. Pro každý konečněrozměrný prostor V dimenze n se skalárním součinem platí:
(1) Ve V existuje ortonormální báze.
(2) Každý systém nenulových ortogonálních vektorů ve V je lineárně nezávislý a lze jej doplnit do ortogonální báze.
(3) Pro každý systém lineárně nezávislých vektorů (iii, ..., iik) existuje ortonormální báze (vi,...,v„) taková, že její vektory postupně generují stejné podpro-story jako vektory uj, tzn. {v\, ..., v i) = (u\ ..., Ui), 1 < i < k.
(4) Je-li (u\, ..., u„) ortonormální báze V, pak souřadnice každého vektoru u e V jsou vyjádřeny vztahem
u = (u ■ Ml)«l +••• + («• un)u„.
(5) V libovolné ortonormální bázi má skalární součin souřadný tvar
u ■ v = x ■ y = xxýx H-----h xnýn
kde x a y jsou sloupce souřadnic vektorů u a v ve zvolené bázi. Zejména je tedy každý n—rozměrný prostor se skalárním součinem izomorfní standardnímu euklidovskému W1 nebo unitárnímu C".
(6) Ortogonální součet unitárních podprostorů V\ +■ ■ ■ +Vk ve V je vždy přímý součet.
(7) Je-li A C V libovolná podmnožina, pak A1- c V je vektorový (tedy i unitární) podprostor a (A-1)1- c V je právě podprostor generovaný A. Navíc platí V = (a) © A\
(8) V je ortogonálním součtem n jednorozměrných unitárních podprostorů.
Důkaz. (1), (2), (3): Daný systém vektorů nejprve doplníme do libovolné báze (u\, ..., un) prostoru V a spustíme na ni Grammovu-Schmidtovu ortogo->í nalizaci z 2.42. Tak získáme ortogonální bázi s vlastnostmi požadovanými v (3). Přitom ale z algoritmu Grammovy-Schmidtovy ortogonalizace vyplývá, že pokud již původních k vektorů tvořilo ortogonální systém vektorů, pak v průběhu ortogonalizace zůstanou nezměněny. Dokázali jsme tedy zároveň i (2) a (1). (4): Je-li u = cl\U\ + • • • + a„u„, pak
|2
U ■ Ui
a, ui
ax(ui ■ Uj) -\-----\-an(un ■ Uj)
(5): Podobně spočteme pro libovolné vektory u
----h x„u„, v = yiwi H-----h y„un
(*iHi H-----h xnun) ■ (yi«i H-----h y„un)
xiýi H-----Yxnýn.
X\U\ +
u ■ v
(6): Potřebujeme ukázat, že pro libovolnou dvojici Vj, V) ze zadaných podprostorů je jejich průnik triviální. Je-li však u e Ví a zároveň u e V), pak je m _L u, tj. u ■ u =0. To je ale možné pouze pro nulový vektor u e V.
že takto běhá každý večer už velmi dlouhou dobu. Jak často volí krátkou a jak často dlouhou trasu? Jaká je pravděpodobnost, že si zvolí dlouhou trasu, když si ji zvolil přesně před týdnem?
Řešení. Zřejmě se jedná o Markovův proces se třemi možnými stavy, a to volbami krátké, střední a dlouhé trasy. Toto pořadí stavů dává pravděpodobnostní matici přechodu
0 0 1/3N 1/2 1/2 1/3 ,1/2 1/2 1/3,
Stačí si uvědomit, že např. druhý sloupec odpovídá volbě střední trasy v minulém dnu, která znamená, že s pravděpodobností 1 /2 bude opět zvolena střední trasa (druhý řádek) a s pravděpodobností 1 /2 bude zvolena dlouhá trasa (třetí řádek). Neboť je
1/6 1/6 l/9\ 5/12 5/12 4/9 , v5/12 5/12 4/9/
můžeme využít důsledků Perronovy-Frobeniovy věty pro Markovovy procesy. Není obtížné vypočítat, že vlastním vektorem, který přísluší vlastnímu číslu 1 a který je pravděpodobnostní, je právě
13 3" 7' 7' 7
Hodnoty 1/7,3/7,3/7 pak udávají po řadě pravděpodobnosti, že v náhodně určeném dnu volí trasu krátkou, střední, dlouhou.
Nechť si Jirka v jistý den (v čase n e N) vybere dlouhou trasu. Tomuto rozhodnutí odpovídá pravděpodobnostní vektor
(o, o, iy
Pro následující den tedy platí
0 0 l/3\ /0\ /1/3N xn+l = | 1/2 1/2 1/3-0 = 1/3 1/2 1/2 1/3/ \ll ll/3,
/1/3
0 = T6 ■ 1/3
1/ Vl/3
až po sedmi dnech je
xn+7
Vyčíslením dostáváme jako složky xn+1 hodnoty
0,142 861225...; 0,428 569 387...; 0,428 569 387...
Tedy pravděpodobnost, že zvolí dlouhou trasu za podmínky, že si ji zvolil před sedmi dny, činí přibližně 0, 428 569 ~ 3/7 = 0, 428 571.
□
157
C. MARKOVOVY PROCESY
4. VÍCE MATICOVÉHO POČTU
3.31. Výrobní linka nefunguje spolehlivě: jednotlivé výrobky se od sebe co do kvality nezanedbatelně liší. Navíc jistý pracovník ve snaze zvýšit kvalitu neustále zasahuje do výrobního procesu. Při rozdělení výrobků do tříd I, II, III podle kvality se zjistilo, že po výrobku třídy I následuje výrobek stejné kvality v 80 % případů a třídy II v 10 % případů, po výrobku třídy II se nezmění kvalita v 60 % případů a změní se na třídu I ve 20 % případů a že po výrobku třídy III následuje výrobek stejné kvality v polovině případů a se stejnou četností pak výrobky tříd I, II. Spočtěte pravděpodobnost, že 18. výrobek je třídy I, pokud 16. výrobek v pořadí náležel do třídy III.
Řešení. Nejprve úlohu vyřešme bez uvážení Markovova řetězce. Sledovanému jevu vyhovují případy (16. výrobek je třídy III)
• 17. výrobek byl zařazen do třídy I a 18. do třídy I; I 3 • 32
• 17. výrobek byl zařazen do třídy II a 18. do třídy I;
• 17. výrobek byl zařazen do třídy III a 18. do třídy I
po řadě s pravděpodobnostmi
• 0, 25 • 0, 8 = 0, 2;
• 0, 25 • 0, 2 = 0, 05;
• 0, 5 • 0, 25 = 0, 125.
Lehce tak získáváme výsledek
0, 375 = 0, 2 + 0, 05 + 0, 125.
Nyní na úlohu nahlížejme jako na Markovův proces. Ze zadání plyne, že pořadí možných stavů „výrobek je třídy I", „výrobek je třídy II", „výrobek je třídy III" odpovídá pravděpodobnostní matice přechodu
'0,8 0,2 0,25^ 0, 1 0, 6 0, 25 v0, 1 0, 2 0, 5
Situaci, kdy výrobek patří do třídy III, zadává pravděpodobnostní vektor (0, 0, 1)T. Pro následující výrobek dostáváme pravděpodobnostní vektor
'0,25\ /0,8 0,2 0,25\ /0> 0,25 = 0, 1 0,6 0,25 0 0,5/ \0, 1 0,2 0,5/ \1,
i pro další výrobek v pořadí potom vektor
0,2 0,25 0,6 0,25 0,2 0,5
jehož první složka je hledanou pravděpodobností.
Doplňme, že první metoda řešení (bez zavedení Markovova procesu) vedla k výsledku zřejmě rychleji. Uvědomme si, jak výrazně by
(7) : Nechť u,v e A^. Pak (au + bv) ■ w = 0 pro všechny w e A, a, b e K (z distributivity skalárního součinu). Tím jsme ověřili, že A1- je unitární podprostor ve V. Nechť (vi, ..., vk) je nějaká báze (A), vybraná z prvků A, («!,..., uk) ortonormální báze vzniklá z Grammovy-Schmidtovy ortogonalizace vektorů (v\, ..., vk). Doplňme ji na ortonormální bázi celého V (obojí existuje podle již dokázaných částí věty). Protože se jedná o ortogonální bázi, je nutně (uk+i, ..., un) = (u\, ..., w^)1" = a A c (uk+i, ..., u,,)1- (jak plyne z vyjádření souřadnic v ortonormální bázi). Je-li m _L (uk+i, u„), pak u je nutně lineární kombinací vektorů u\, ... ,uk, to je ale právě tehdy, když je lineární kombinací vektorů v\, ..., vk, což je ekvivalentní příslušnosti u do (A).
(8) : Je pouze ekvivalentní formulaci existence ortonormální báze. □
3.25. Důležité vlastnosti velikosti. Nyní máme vše připraveno pro základní vlastnosti spojené s naší definicí velikostí vektorů. Hovoříme také o normě definované skalárním součinem. Všimněme si také, že všechna tvrzení se týkají vždy konečných množin vektorů a jejich platnost proto nezávisí na dimenzi prostoru V, ve kterém se vše odehrává.
Věta. Pro libovolné vektory u, v v prostoru V se skalárním součinem platí
(1) ||w + v\\ < ||u|| + ||v||, přitom rovnost nastane, právě když jsou u a v lineárně závislé.
(trojúhelníková nerovnost)
(2) \u ■ v\ < ||m|| ||f ||, přitom rovnost nastane, právě když jsou u a v lineárně závislé.
(Cauchyova nerovnost)
(3) Pro každý ortonormální systém vektorů (e\, ..., ek) platí
\\u\\2> \u-ei\2 + ■■■+ \u-ek\2
(Besselova nerovnost).
(4) Pro ortonormální systém vektorů (e\, ..., ek) patří vektor u do podprostoru e (e\, ..., ek) právě když
||w||2 = \u - ei|2 + --- + \u -ek\2.
(Parsevalova rovnost)
(5) Pro ortonormální systém vektorů (e\, ..., ek) a vektor u e V je vektor
w = (u ■ !)! H-----h (u ■ ek)ek
jediným vektorem, který minimalizuje velikost \\u — v\\ pro všechny v e (e\, ..., ek).
Důkaz. Všechny důkazy spočívají v přímých výpočtech:
(2): Definujme vektor w := u — ^v, tzn. w _L v a počítejme
0< IM|2= NI2 0< IM|2|M|2 =
(u-v
M
II2 IIIl2
yu-v) / \ u-v / , , \ .
v\\ — 2(u ■ v)(u ■ v) + (u ■ v)(u ■ v)
158
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
Odtud již přímo plyne, že ||w||2||t>||2 > \u ■ v\2 a rovnost nastane právě tehdy, když w = 0, tj. když jsou u a v lineárně závislé.
(1): Opět stačí počítat ||w + i;||2 = \\u\\2 + \\v\\2 + u ■ v + v ■ u = IN|2 + IM|2 + 2Re(M-i;)
< ||M||2 + ||i,||2+2|M.i;| < ||M||2 + ||u||2 + 2||M||||i;| = (II"II + NI)2
Protože se přitom jedná o kladná reálná čísla, je opravdu || u + v || < || m || + || ľ ||. Navíc, při rovnosti musí nastat rovnost ve všech předchozích nerovnostech, to však je ekvivalentní podmínce, že u a v jsou lineárně závislé (podle předchozí části důkazu).
(3), (4): Nechť (e\, ..., ek) je ortonormální systém vektorů. Doplníme jej do ortonormální báze (e\, ..., e„) (to vždy jde podle předchozí věty). Pak, opět podle předchozí věty, je pro každý vektor u e V
n n k
II"II2 = J^(u ■ ediU—ě-) = J^\u -ei\2 > ^\u-ei\2
i — l i — l i — l
To je ale právě dokazovaná Besselova nerovnost. Přitom rovnost může nastat právě tehdy, když u ■ et =0 pro všechny i > k, a to dokazuje Parsevalovu rovnost. (5): Zvolme libovolný v e (e\, ..., ek) a doplňme daný ortonormální systém na ortonormální bázi (e\, ..., en). Nechť («i, ..., u„) a (xi, ..., xk, 0, ..., 0) jsou souřadnice u av v této bázi. Pak
||M-i;||2 = \Ul-Xl\2-\-----\-\uk-Xk\2 + \uk+l\2-\-----hKI2
a tento výraz je zjevně minimalizován při volbě jednotlivých vektorů x\ = u\, ..., xk = uk. □
3.26. Vlastnosti unitárních zobrazení. Vlastnosti ortogonálních zobrazení mají přímočarou obdobu v komplexním oboru. Můžeme je snadno zformulovat a dokázat společně:
Tvrzení. Uvažme lineární zobrazení (endomorfismus) cp : V —> V na prostoru se skalárním součinem. Pak jsou následující podmínky ekvivalentní:
(1) cp je unitární nebo ortogonální transformace
(2) cp je lineární isomorfismus a pro každé u, v e V platí cp(u) ■ v = u ■ (p~l(v)
(3) matice A zobrazení cp v libovolné ortonormální bázi splňuje A~l = AT (pro euklidovské prostory to znamená A~l = AT)
(4) matice A zobrazení cp v některé ortonormální bázi splňuje A~l = AT
(5) řádky matice A zobrazení cp v ortonormální bázi tvoří ortonormální bázi prostoru W se standardním skalárním součinem
0\ 0
o o o
se však první metoda znepřehlednila, kdybychom např. místo 18. výrobku uvažovali 20., 22. nebo až 30. výrobek v pořadí. Ve druhé metodě se lze omezit na do jisté míry „bezmyšlenkovité" násobení (umocňování) matic. Při zavedení Markovova procesu jsme také současně vyšetřovali situace, kdy 18. výrobek náleží do tříd II a III. □
3.32. Opakovaně házíme hrací kostkou. Napište pravděpodobnostní matici přechodu T pro Markovův řetězec „maximální počet ok dosažených do «-tého hodu včetně" pro pořadí stavů 1, ..., 6. Poté určete T" pro každé n e N.
Řešení. Ihned můžeme uvést
/l/6 0 0 0 0
1/6 2/6 0 0 0
1/6 1/6 3/6 0 0
1/6 1/6 1/6 4/6 0
1/6 1/6 1/6 1/6 5/6
\l/6 1/6 1/6 1/6 1/6
kde první sloupec je určen stavem 1 a pravděpodobností 1/6 pro jeho zachování (v dalším hodu padne 1) a pravděpodobností 1/6 jeho přechodu do libovolného ze stavů 2, ..., 6 (po řadě padne 2, ..., 6), druhý sloupec je zadán stavem 2 a pravděpodobností 2/6 pro jeho zachování (v dalším hodu padne 1 nebo 2) a pravděpodobností 1 /6 pro přechod do jakéhokoli ze stavů 3, ..., 6 (padne 3, ..., 6), až poslední sloupce získáme ze skutečnosti, že stav 6 je trvalý (pokud již padla šestka, nemůže padnout vyšší počet ok). Rovněž pro n e N lze přímo určit
©"-(§)" o)"-®" ar
(ž)"-®" iff-iíľ (*)"-(§)" 00"
HT-iiT HT-iiT HT-iiT (I)n-(C
v Mš)" Mš)" Mš)" Mš)"
Hodnoty v prvním sloupci totiž odpovídají postupně pravděpodobnostem, že n-krát po sobě padne 1, ři-krát po sobě padne 1 nebo 2 a alespoň jednou 2 (odečítáme proto pravděpodobnost uvedenou v prvním řádku), n-krát po sobě padne 1, 2 nebo 3 a alespoň jednou padne 3, až v posledním řádku je pravděpodobnost, že aspoň jednou během n hodů padne 6 (tu lze snadno určit z pravděpodobnosti opačného jevu). Podobně např. ve čtvrtém sloupci jsou postupně nenulové pravděpodobnosti jevů „ř2-krát po sobě padne 1, 2, 3 nebo 4", „n-krát po sobě padne 1, 2, 3, 4 nebo 5 a alespoň jednou 5" a „alespoň jednou během n hodů padne 6". Interpretace matice T jako matice přechodu jistého Markovova procesu tak umožňuje rychlé vyjádření mocnin T", íieN. □
(§)" -(I)
o\
0 0 0 0
1/
159
C. MARKOVOVY PROCESY
4. VÍCE MATICOVÉHO POČTU
3.33. Sledujte určitou vlastnost daného živočišného druhu, která je podmíněna nezávisle na pohlaví jistým genem - dvojicí alel. Každý jedinec získává po jedné alele od obou rodičů zcela náhodně a nezávisle na sobě. Existují formy genu dané různými alelami a, A. Ty určují tři možné stavy aa, a A = Aa, AA vyšetřované vlastnosti.
(a) Předpokládejte, že každý jedinec jisté populace se bude rozmnožovat výhradně s jedincem jiné populace, ve které se vyskytuje pouze vlastnost podmíněná dvojicí a A. Právě jeden jejich (náhodně zvolený) potomek bude ponechán na stanovišti a také on se bude rozmnožovat výhradně s jedincem té jiné populace atd. Stanovte výskyt kombinací aa, aA, AA v uvažované populaci po dostatečně dlouhé době.
(b) Řešte úlohu uvedenou ve variantě (a), pokud je jiná populace tvořena pouze jedinci s dvojicí alel A A.
(c) Náhodně zvolené dva jedince opačného pohlaví zkřížíte. Z jejich potomstva opět náhodně vyberete dva jedince opačného pohlaví, které zkřížíte. Pokud takto budete pokračovat velmi dlouho dobu, vypočtěte pravděpodobnost, že oba křížení jedinci budou mít dvojici alel AA, příp. aa (proces křížení skončí).
(d) Řešte úlohu uvedenou ve variantě (c) bez kladení podmínky, že křížení jedinci mají stejné rodiče. Pouze tedy křížíte jedince jisté velké populace mezi sebou, potom křížíte potomky mezi sebou atd.
Řešení. Případ (a). Jedná se o Markovův proces zadaný maticí
'1/2 1/4 0 1/2 1/2 1/2 0 1/4 1/2,
přičemž pořadí stavů odpovídá pořadí dvojic alel aa, aA, AA. Hodnoty v prvním sloupci plynou z toho, že potomek jedince s dvojicí alel aa a jedince s dvojicí alel a A má s pravděpodobností 1 /2 dvojici aa a s pravděpodobností 1 /2 dvojici a A. Analogicky postupujeme pro třetí sloupec. Hodnoty ve druhém sloupci potom vyplývají z toho, že každý ze čtyř případů dvojic alel aa, a A, Aa, AA je stejně pravděpodobný u jedince, jehož oba rodiče mají dvojici alel a A. Uvědomme si, že na rozdíl od počítání pravděpodobností, kdy musíme rozlišovat dvojici a A od Aa (která z alel pochází od kterého z rodičů), vlastnosti podmíněné dvojicemi a A a Aa jsou samozřejmě stejné. Pro určení výsledného stavu stačí nalézt pravděpodobnostní vektor, který přísluší
(6) sloupce matice A zobrazení cp v ortonormální bázi tvoří ortonormální bázi prostoru W se standardním skalárním součinem
Důkaz. (1) =>■ (2): Zobrazení cp je prosté, proto musí být i na. Platí přitom cp(u)-v = cp(u)-cp(cp~x (v)) = u-cp~l(v).
(2) =)- (3): Standardní skalární součin je v K" vždy dán pro sloupce x, y skalárů výrazem x ■ y = xT Eý, kde E je jednotková matice. Vlastnost (2) tedy znamená, že matice A zobrazení cp je invertibilní a platí (Ax)Tý = xT A~ly. To znamená xT (Ä1y — A~ly) = 0 pro všechny x e W. Zejména dosazením výrazu v závorce za x zjistíme, že to je možné pouze při A1 = A-1.
(3) •<=>- (4): Je-li A1 = A~l v některé ortonormální bázi, pak to zaručuje platnost podmínky (2) (cp(u) ■ v = (Ax)TEý = x1EA~ly = u ■ cp~l(v)) a tedy i (3).
(4) =)- (5) Dokazované tvrzení je vyjádřeno prostřednictvím matice A zobrazení cp vztahem AAT = E, to je ale zaručeno podmínkou (4).
(5) =)- (6): Protože pro determinant platí \AT A\ = \E\ = \AAT\ = \A\\A\ = 1, existuje inverzní matice A-1. Přitom je AAT A = A, proto i AT A = E což vyjadřuje právě (6).
(6) =>■ (1): Ve vybrané ortonormální bázi je
cp(u) ■ cp{v)
iAx)TiAy) = xATAý = xTEý = xT ý
kde x a y jsou sloupce souřadnic vektorů u a v. Tím je zaručeno zachovávání skalárního součinu. □
Charakterizace z předchozí věty si zaslouží několik po-jj' „ známek. Matice A e Mat„(K) s vlastností A-1 = ÄT se nazývají unitární matice pro komplexní skaláry Í" (a v případě M jsme jim již říkali ortogonální ma-1 tice). Z definiční vlastnosti plyne, že součin unitárních (resp. ortogonálních) matic je unitární (resp. ortogonální), stejně pro inverze. Unitární matice tedy tvoří pod-grupu U in) c Gl„ (C) v grupě všech invertibilních komplexních matic s operací součinu. Ortogonální matice tvoří pod-grupu Oin) c Gl„ (M) v grupě reálných invertibilných matic. Hovoříme o unitární grupě a o ortogonální grupě. Jednoduchý výpočet
1 = det E = áetiAA1) = det A det A = | det A|z
ukazuje, že determinant unitární matice má vždy velikost rovnu jedné, v případě reálných skalárů pak determinant musí být ±1. Dále, je-li Ax = kx pro unitární či ortogonální matici, pak (Ax) • (Ax) = x • x = |A|2(x • x). Proto jsou reálné vlastní hodnoty ortogonálních matic v reálném oboru rovny ±1, vlastní hodnoty unitárních matic jsou vždy komplexní jednotky v komplexní rovině.
Stejně jako u ortogonálních zobrazení také docela snadno ověříme, že ortogonální doplňky k invariantním podprostorům vzhledem k unitárnímu cp : V -> V jsou vždy také invariatní. Skutečně, je-li cpiU) cU,ueUave U1-libovolné, pak
(piv) -cpicp~liu)) = v -cp~liu).
160
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
3. 34
.zobrazení
Protože je zúžení 7fo druhé kapitole letmo zmínili duální vektorový pro-r\Kw stor V* všech lineárních forem na vektorovém pro-: íf^ ' sotru V, viz 2.39.
Pro každé lineární zobrazení mezi vektorovými prostory Ý '■ V -» W můžeme přirozeně definovat jeho duální zobrazení ý* ■ W* -» V* vztahem
(3.6) {v,ý*(oí)) = (ý(v),a),
kde ( , ) značí vyčíslení formy (druhý argument) na vektoru (první argument), v e V a a e W* jsou libovolné.
Zvolme si báze v na V, w na W a pišme A pro matici zobrazení ý v těchto bazích. Pak snadno spočteme v duálních bazích matici zobrazení ý* v příslušných duálních bazí na duálních prostorech. Skutečně, definiční vztah říká, že pokud bychom reprezentovali vektory z W* v souřadnicích jako řádky skalárů, pak je zobrazení ý* je dáno toutéž maticí jako ý, pokud jí násobíme řádkové vektory zprava:
/V
(ý(v), a) = (au ..., an) ■ A ■
\vn/
To znamená, že maticí duálního zobrazení ý* je transponovaná matice AT, protože a ■ A = (AT ■ aT)T.
Předpokládejme nadále, že se pohybujeme ve vektorovém prostoru se skalárním součinem. Jestliže tedy zvolíme
(v, ý*(a)).
vlastnímu číslu 1 matice T, protože matice
'3/8 1/4 l/8> 1/2 1/2 1/2 \/S 1/4 3/8y
splňuje podmínku Perronovy-Frobeniovy věty (všechny její prvky j sou kladné). Hledaný pravděpodobnostní vektor je
1 1 lxr 4' 2' 4,
což již dává pravděpodobnosti 1/4, 1/2, 1/4 výskytu po řadě kombinací aa, a A, A A po velmi dlouhé (teoreticky nekonečné) době.
Případ (b). Pro pořadí dvojic alel A A, aA,aa nyní dostáváme pravděpodobnostní matici přechodu
'1 1/2 0^ 1/2 0
Ihned vidíme všechna vlastní čísla 1, 1/2 a 0 (odečteme-li je od diagonály, hodnost obdržené matice nebude 3, tj. touto maticí zadaná homogenní soustava bude mít netriviální řešení). Těmto vlastním číslům přísluší po řadě vlastní vektory
1
Proto je
1
0
-1
1 0
Odsud pro libovolné n e N plyne
-1 1
1
0
1 1
o o
-1 M 0 0
0 1 -2 0 0 0
0 0 1 / Vo 0 0
Zřejmě pro velká neN můžeme nahradit 2 " za 0, což implikuje
Pokud tedy plodí potomky jedinci původní populace výhradně s členy populace, ve které se vyskytuje pouze dvojice alel AA, nutně po dostatečně velkém počtu křížení dojde k tomu, že dvojice aAnaa zcela vymizí (bez ohledu na jejich původní četnost).
161
C. MARKOVOVY PROCESY
4. VÍCE MATICOVÉHO POČTU
Případ (c). Tentokráte budeme mít 6 možných stavů (v tomto pořadí)
AA,AA; aA,AA; aa, AA;
aA,aA; aa,aA; aa,aa, přičemž tyto stavy jsou dány různými případy genotypů rodičů. Matice odpovídajícího Markovova řetězce je
jl 1/4 0 1/16 0 0\
0 1/2 0 1/4 0 0
0 0 0 1/8 0 0
0 1/4 1 1/4 1/4 0
0 0 0 1/4 1/2 0
0 0 1/16 1/4 v
Pokud budeme např. uvažovat situaci (druhý sloupce), kdy jeden z rodičů má dvojici alel AA a druhý a A, pak zjevně může nastat každý ze čtyř případů (jde-li o dvojice alel jejich dvou náhodně zvolených potomků) ad jungovane_zobrazeni
AA, AA; AA,aA; aA,AA; aA,aA
se stejnou pravděpodobností. Pravděpodobnost setrvání ve druhém stavu je proto 1/2 a pravděpodobnost přechodu ze druhého stavu do prvního je 1/4 a do čtvrtého také 1 /4.
Nyní bychom měli opět určit mocniny T" pro velká n e N. Uvážením podoby prvního a posledního sloupce ihned zjistíme, že 1 je vlastním číslem matice T. Velmi lehce lze najít vlastní vektory
(l,0,0,0,0,0)r, (0,0,0,0,0, l)T
příslušné vlastnímu číslu 1. Přechodem ke čtyřrozměrné podmatici matice T (vynecháním právě prvního a šestého řádku a sloupce) nalezneme poté zbylá vlastní čísla
1 1 l-y/5 l + y/5
2' 4' 4 ' 4 ' Vzpomeneme-li si na řešení příkladu nazvaného Mlsný hazardér, nemusíme T" počítat. V tomto příkladu jsme dostali stejné vlastní vektory příslušné číslu 1 a ostatní vlastní čísla měla rovněž absolutní hodnotu ostře menší 1 (jejich přesné hodnoty jsme nevyužívali). Dostáváme tak totožný závěr, že proces se blíží k pravděpodobnostnímu vektoru
(a, 0,0, 0,0, 1 -af , kde a e [0, 1] je dáno výchozím stavem. Protože pouze na první a šesté pozici výsledného vektoru mohou být nenulová čísla, stavy
útA,AA; aa, AA; aA,aA; aa,aA
po mnohonásobném křížení vymizí. Uvědomme si dále (plyne z předešlého a z příkladu Mlsný hazardér), že pravděpodobnost toho, aby
pevně jeden vektor v e y, dosazování vektorů za druhý argument ve skalárním součinu nám dává zobrazení V -» V* = Hom(V, K)
V b v i-» (w i-» (v, w) e K).
Podmínka nedegenerovanosti skalárního součinu nám zaručuje, že toto zobrazení je bijekcí. Zároveň víme, že jde skutečně o lineární zobrazení nad komplexními nebo reálnými skaláry, protože jsme pevně zvolili druhý argument. Na první pohled je vidět, že vektory ortonormální báze jsou takto zobrazeny na formy tvořící bázi duální, a každý vektor můžeme prostřednictvím skalárního součinu chápat také jako lineární formu.
V případě vektorových prostorů se skalárním součinem proto převádí naše ztotožnění vektorového prostoru se svým duálem také duální zobrazení ý* na zobrazení ý* '■ W -» V zadané formulí
(3.7)
(ý(u), v) = (u, \jj*(v)),
kde stejným značením závorek jako v definičním vztahu (3.6) nyní myslíme skalární součin. Tomuto zobrazení se říká adjungované zobrazení k \jr.
Ekvivalentně lze brát vztah (3.27) za definici adjungo-vaného zobrazení ifr, např. dosazením všech dvojic vektorů ortonormální báze za vektory u a. v dostáváme přímo všechny hodnoty matice zobrazení ý*.
Předchozí výpočet pro duální zobrazení v souřadnicích nyní můžeme zopakovat, pouze musíme mít na paměti, že v ortonormálních bazích na unitárních prostorech vystupují souřadnice druhého argumentu konjugované:
(ý(v), w) = (wi, ..., w„) ■ A
(v, ý*(w))
Vidíme proto, že je-li A matice zobrazení \jr v ortonormální bázi, pak matice adjungovaného zobrazení ý* je matice transponovaná a konjugovaná, kterou značíme A* = ÄT.
Matici A* se říká adjungovaná matice k matici A. Všimněme si, že adjungované matice jsou dobře definované pro jakékoliv obdélníkové matice a nepleťme si je s maticemi algebraicky adjungovanými, které jsme u čtvercových matic používali při úvahách o determinantech.
Můžeme si tedy shrnout, že má-li jakékoliv lineární zobrazení ý '■ V W mezi unitárními prostory v ortonormálních bazích matici A, bude mít jeho duální zobrazení v bazích duálních matici AT. Pokud přitom zotožníme pomocí skalárního součinu vektorové prostory s jejich duálními prostory,
162
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
3.34a
pak nám duální zobrazení představuje adjungované zobrazení ý* '■ W -» V (které je zvykem značit stejně jako to zobrazení duální), které ale má matici A*. Rozdíl mezi maticemi duálního a adjungovaného zobrazení je tedy v dodatečné konjugaci, ta ale samozřejmě je důsledkem toho, že zo-tožnění unitárního prostoru s jeho duálním prostorem není komplexně lineární zobrazení (neboť z druhé pozice ve skalárním součinu se skaláry vytýkají konjugované).
3.28. Samoadjungovaná zobrazení. Zvláštním případem lineárních zobrazení jsou tedy ta, která splývají se svým adjungovaným zobrazením: ý* = ~* ý. Takovým zobrazením říkáme samoadjungovaná. Ekvivalentně můžeme říci, že jsou to ta zobrazení, jejichž matice A v jedné a tedy ve všech ortonormálních bazích splňují A = A*.
V případě euklidovských prostorů jsou samoadjungovaná zobrazení tedy ta, která mají v některé ortonormální bázi (a pak už všech) symetrickou matici. Často se jim proto říká symetrické matice a symetrická zobrazení.
V komplexním oboru se maticím splňujícím A = A* říká hermiteovské matice. Občas se také hermiteovským maticím říká samoadjungované matice. Všimněme si, že hermiteovské matice tvoří reálný vektorový podprostor v prostoru všech komplexních matic, není však podprostorem v komplexním oboru.
Poznámka. Obzvlášť zajímavý je v této souvislosti následující postřeh. Jestliže hermiteovskou matici A vynásobíme imaginární jednotkou, dostáváme matici B = i A, která má vlastnost B* = i A1 = —B. Takovým maticím říkáme anti-hermiteovské. Tak jako je tedy každá reálná matice součtem své symetrické a antisymetrické části
A = ^(A + AT)+l-(A- AT),
je v komplexním oboru obdobně A
^(A + A*) + (A — A*) 2 2i
a můžeme proto vyjádřit každou komplexní matici právě jedním způsobem jako součet
A = B + iC
s hermiteovskými maticemi B a C. Jde o obdobu rozkladu komplexního čísla na reálnou a ryze imaginární komponentu a skutečně se často v literatuře setkáme i se značením
5 = re A = -(A + A*), C 2
1
im A = —(A 2i
A*).
V řeči lineárních zobrazení to tedy znamená, že každý komplexní lineární automorfismus můžeme takto jednoznačně vyjádřit pomocí dvou samoadjungovaných zobrazení.
proces končil AA, A A, se rovná relativní četnosti výskytu A v počátečním stavu.
Případ (d). Nechť hodnoty a,b, c e [0, 1] udávají (při zachování pořadí) relativní četnosti výskytu dvojic alel AA, a A, aa v dané populaci. Chceme získat vyjádření relativních četností dvojic AA, a A, aa v potomstvu populace. Probíhá-li výběr dvojic pro páření náhodně, lze při velkém počtu jedinců očekávat, že relativní četnost páření jedinců s dvojicemi alel AA (u obou) je a2, relativní četnost páření jedinců, z nichž jeden má dvojici alel A A a druhý a A, je 2ab, relativní četnost páření jedinců s dvojicemi alel a A (u obou) je b2 atd. Potomek rodičů s dvojicemi AA, AA musí dvojici alel AA zdědit. Pravděpodobnost, že potomek rodičů s dvojicemi AA, a A bude mít AA, je zřejmě 1/2 a pravděpodobnost, že potomek rodičů s dvojicemi a A, a A bude mít A A, je pak 1 /4. Jiné případy pro potomka s dvojicí alel A A uvažovat nemusíme (pokud má jeden rodič dvojici alel aa, potomek nemůže mít dvojici AA). Relativní četnost výskytu dvojice alel AA v potomstvu je tedy
a2 ■ 1 + lab ■ - + b2
1 2 b2
- = a + ab H--
4 4
Analogicky stanovíme postupně relativní četnosti dvojic a A aaav potomstvu ve tvarech
b2
ab + bc + 2ac -\--
2
a
b2
c2 + bc H--.
4
Na tento proces můžeme nahlížet jako na zobrazení T, které transformuje vektor (a, b, c)T. Platí
(a\ / a2 + ab + b2/4 b \ h» lab+bc + 2ac + b2/2 c J \ c2 + bc + b2/4
Podotkněme, že za definiční obor (a pochopitelně i obor hodnot) T vlastně bereme pouze vektory
kde a, b, c e [0, 1], a + b + c = 1.
Chtěli bychom zadat operaci T pomocí násobení vektoru (a,b, c)T jistou konstantní maticí. To však očividně není možné (zobrazení T není lineární). Nejedná se tedy o Markovův proces a nelze zjednodušit určování, co se stane po velmi dlouhé době, jako v předešlých případech. Můžeme ale vypočítat, co se stane, když aplikujeme zobrazení T dvakrát po sobě. Ve druhém kroku dostáváme
a2 +ab +b2/4
T : lab + bc + 2ac + bz/2 h» řf , kde
cz + bc + b214
163
C. MARKOVOVY PROCESY
4. VÍCE MATICOVÉHO POČTU
3.35
2 , „u , " \ , l „2
a + ab H--) + [ a + ab -\--] [ ab + bc + 2ac -\--
4 J V 4 J \ 2
1/ ŕ2
+ — I ab + bc + 2ac -\--
4 V 2
a + ab +
ab + bc + 2ac + — ) +
U2\ / h2
+ ( ab + bc + 2ac + — j I cz + bc + — ) +
1
+ 2 [ a + ab -\--) [ c + bc -\--+ - ab + bc + 2ac H--
-2\2 / b2\ ( , ^2
i = {f + bc + j) + (ú
c2 + + — j + + bc + 2ac + — j \ cl + bc + —
1 / ŕ2
+ — I ab + bc + 2ac -\--
4 V 2
Lze ukázat (využitím a + b + c = í), že
ŕ2 ŕ2 ŕ2
Ú =a2+ab-\--, £ = ab + bc + 2ac-\--, £=c2 + bc-\--,
2 4 2 4
tj-
/ a2 + ab + b2/4 \ í a2+ab+b2/4
T : \ab+bc + 2ac + b2/2 h» \ab + bc+2ac + b2/2
\ c2 + bc + b2/4 J \ c2 + bc + b2/4
Získali jsme tak překvapivý výsledek, že dalším aplikováním transformace T se vektor obdržený v prvním kroku nezmění. To znamená, že výskyt uvažovaných dvojic alel je po libovolně dlouhé době totožný jako v první generaci potomstva. Pro velkou populaci jsme tak dokázali, že evoluční vývoj by se realizoval během jediné generace, kdyby nedocházelo k mutacím nebo k selekci. □
3.34. Nechť jsou dány dvě urny, které obsahují dohromady n bílých a n černých koulí. V pravidelných časových intervalech je z obou uren vylosována jedna koule a přemístěna do druhé urny, přičemž počet koulí v obou urnách je na začátku (a tedy po celou dobu) právě n. Zadejte tento Markovův proces pravděpodobnostní maticí přechodu T.
Řešení. Tento příklad se používá ve fyzice jako model prolínání dvou nestlačitelných kapalin (již v roce 1769 ho zavedl D. Bernoulli) nebo analogicky jako model difúze plynů. Stavy 0,1, ... ,n budou odpovídat kupř. počtu bílých koulí v jedné pevně zvolené urně. Tento údaj totiž současně zadává, kolik černých koulí je ve zvolené urně (všechny ostatní koule jsou pak ve druhé z uren). Pokud v jistém kroku dojde ke změně stavu j e {1, ...,«} na j — 1, znamená to, že ze zvolené urny
3.29. Spektrální rozklad. Uvažujme samoadjungované ji „ zobrazení ý : ľ ^ ľs maticí A v nějaké ortonormální bázi a zkusme postupovat obdobně jako v 2.50. $ Opět se nejprve obecně podíváme na invariantní podprostory samoadjungovaných zobrazení a jejich ortogonální doplňky. Jestliže pro libovolný podprostor W C V a samoadjungované zobrazení ý '■ V ~* V platí ý(W) C W, pak také platí pro všechny v e W^, w e W
(Ý(v)i w) = (ľ. Ý(w)) = 0. To ale znamená, že také ^(W-1) C W^.
Uvažme nyní matici A samoadjungovaného zobrazení v nějaké ortonormální bázi a A ■ x = kx pro nějaký vlastní vektor x e C". Dostáváme
k{x, x) = {Ax, x) = {x, Ax) = (x, kx) = k {x, x).
Kladným reálným číslem (x, x) můžeme krátit a proto musí být Ä = k, tj. vlastní čísla jsou vždy reálná.
Komplexních kořenů má charakteristický polynom det(A — k E) tolik, kolik je dimenze čtvercové matice A, a všechny jsou ve skutečnosti reálné. Dokázali jsme tak důležitý obecný výsledek:
Tvrzení. Ortogonální doplněk k invariantnímu podprostoru pro samoadjungované zobrazení je také invariantní. Navíc jsou všechna vlastní čísla hermiteovské matice A vždy reálná.
Ze samotné definice je zřejmé, že zúžení samoadjungovaného zobrazení na invariantní podprostor je opět samoadjungované. Předchozí tvrzení nám tedy zaručuje, že bude vždy existovat báze V z vlastních vektorů. Skutečně, zúžení ý na ortogonální doplněk invariantního podprostoru je opět samoadjungované zobrazení, takže můžeme do báze přibírat jeden vlastní vektor za druhým, až dostaneme celý rozklad V. Vlastní vektory příslušející různým vlastním číslům jsou navíc kolmé, protože z rovností Ý(u) = Ý(v) = lJiV vyplývá
k{u, v) = (ý(u), v) = {u, ý(v)) = jí(u, v) = fi{u, v).
Obvykle bývá náš výsledek formulován pomocí projekcí na vlastní podprostory. O projektoru P : V -> V říkáme, že je kolmý, je-li Im P _L Ker P. Dva kolmé projektory P, Q jsou vzájemně kolmé, je-li Im P _L Im Q.
Věta (O spektrálním rozkladu). Pro každé samoadjungované zobrazení \js : V ^ V na vektorovém prostoru se skalárním součinem existuje ortonormální báze z vlastních vektorů. Jsou-li k\, ..., k^ všechna různá vlastní čísla Ý a P i, ..., Pfr příslušné kolmé a navzájem kolmé projektory na vlastní podprostory k odpovídajícím vlastním číslům, pak
Ý = klPl + ■■■ + kkPk.
Dimenze obrazů těchto projektorů je přitom vždy rovna algebraické násobnosti vlastních čísel
164
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
3.30. Ortogonální diagonalizace. Zobrazení, pro která lze najít ortonormální bázi jako v předchozí větě o % spektrálním rozkladu se nazývají ortogonálně diagonalizovatelná. Jsou to samozřejmě právě ta zobrazení, pro která umíme najít ortonormální bázi tak, aby v ní jejich matice zobrazení byla diagonální. Zamysleme se, jak mohou vypadat.
Pro euklidovský případ je to snadné: diagonální matice jsou zejména symetrické, jedná se tedy právě o samoadjun-govaná zobrazení. Jako důsledek získáváme tvrzení, že ortogonální zobrazení euklidovského prostoru do sebe je ortogonálně diagonalizovatelné, právě když je zároveň samoadjun-gované (jsou to právě ta samoadjungovaná zobrazení s vlastními hodnotami ±1).
U komplexních unitárních prostorů je situace složitější. Uvažme libovolné lineární zobrazení cp : V -» V unitárního prostoru a nechť cp = + iř? Je (jednoznačně daný) rozklad cp na hermiteovskou a antihermiteovskou část. Máli cp ve vhodné ortonormální bázi diagonální matici D, pak D = reD+ňmD, kde reálná a imaginární část jsou právě matice ý a f\ (plyne z jednoznačnosti rozkladu). Zejména tedy platí ýor) = r)oý acpocp* = ■ (2) jsme již diskutovali.
(2) •<=>- (3): Stačí provést přímý výpočet
cpcp* = (ý + irj)(ý — irj) = ý2 + rj2 + i(rjif/ — ý1!) cp* cp = (ý — irj)(ý + irj) = ý2 + rj2 + i(if/rj — rjif/)
Odečtením dostaneme 2i(r)ý — Ýw)-
(2) =>■ (1): Nechť m e V je vlastní vektor normálního zobrazení cp. Pak
cp(u) ■ cp(u) = (cp*cp(u), u) = (cpcp*(u), u) = cp*(u) ■ cp*(u)
zejména tedy \cp(u)\ = \cp*(u)\. Je-li cp normální, je (cp — X id V)* = (cp* — X id V) a je proto i (cp — X id V) normální zobrazení. Z předešlé rovnosti tedy plyne, že je-li cp(u) = Xu, pak cp*(u) =Xu. Tzn., že cp a cp* mají stejné vlastní vektory a konjugované vlastní hodnoty.
Stejně jako u samoadjungovaných teď snadno dokážeme ortogonální diagonalizovatelnost. K tomu je nutné a stačí, aby ortogonální doplněk každého vlastního podprostoru pro
byla vytažena bílá koule a z druhé černá. To se stane s pravděpodobností
]_ ]_
n n
Přechodu ze stavu j e {0, ..., n—1} do j +1 odpovídá vytažení černé koule ze zvolené urny a bílé z té druhé s pravděpodobností
J n
j (n ~ jľ
n n n^
Soustava zůstane ve stavu j e {1, ..., n — 1}, jestliže z obou uren byly vytaženy koule stejné barvy, což má pravděpodobnost
l _ n- j n_- j j 2j (n - j) n
Dodejme, že ze stavu 0 se nutně (s pravděpodobností 1) přechází do stavu 1 a že ze stavu n se s jistotou přechází do stavu n — 1. Uvážením výše uvedeného dostáváme hledanou matici
í°
2-l(n- 1)
0 (n- l)2
0
0 V0
0
o
o
22
2 • 2(n - 2)
0 0 0
2 • (n - 2)2
22 0
0 0
0
(n - l)2
2- (n - 1)1
1
pro pořadí stavů 0, 1, ... ,n.
Při užití tohoto modelu ve fyzice nás samozřejmě zajímá složení uren po uplynutí určité doby (po daném počtu výměn v závislosti na předešlém složení uren). Bude-li počáteční stav např. 0, můžeme pomocí mocnin matice T sledovat, s jakou pravděpodobností přibývají ve zvolené urně bílé koule. Také lze potvrdit očekávaný výsledek, že počáteční rozdělení koulí bude ovlivňovat jejich rozdělení po delší době zanedbatelným způsobem.
Kdybychom jednotlivé koule očíslovali, místo výběru po jedné kouli z uren vylosovali nějaké z čísel 1, 2, ..., 2n a kouli, jejíž číslo bylo vytaženo, přemístili do druhé urny, obdrželi bychom Markovu v proces se stavy 0, 1, ..., 2n (počet koulí ve zvolené urně), kdy se tak už nerozlišuje barva koulí. Tento Markovův řetězec je rovněž ve fyzice důležitý. (P. a T. Ehrenfestovi jej zavedli v roce 1907.) Používá se jako model výměny tepla mezi dvěma izolovanými tělesy (teplota je reprezentována počtem koulí, tělesa urnami). □
3.35. Dva hráči A, B hrají o peníze opakovaně jistou hru, která může skončit pouze vítězstvím jednoho z hráčů. Pravděpodobnost výhry hráče A je v každé jednotlivé hře p e [0, 1 /2) a oba sází vždy (v libovolné hře) jen 1 Kč, tj. po každé hře s pravděpodobností p dá 1 Kč
165
D. UNITÁRNÍ PROSTORY
4. VÍCE MATICOVÉHO POČTU
veshj3916 (3.6)
hráč B hráči A a s pravděpodobností 1 — p naopak 1 Kč dá hráč A hráči B. Hrají ovšem tak dlouho, dokud jeden z nich nepřijde o všechny peníze. Jestliže má hráč A na začátku x Kč a hráč B má y Kč, určete pravděpodobnost, že hráč A vše prohraje.
Řešení. Tato úloha se nazývá Ruinovaní hráče. Jedná se o speciální Markovův řetězec (viz také příklad Mlsný hazardér) s mnoha důležitými aplikacemi. Hledaná pravděpodobnost činí
x+y'
Povšimněme sijakáje tato hodnota pro konkrétní volby p,x, y. Kdyby hráč B chtěl mít téměř jistotu a požadoval, aby pravděpodobnost, že hráč A s ním prohraje 1 000 000 Kč, byla alespoň 0,999, potom stačí, aby měl 346 Kč, je-li p = 0, 495 (či 1 727 Kč, je-li p = 0, 499). Proto je ve velkých kasinech možné, aby „vášniví" hráči mohli hrát téměř spravedlivé hry. □
3.36. V rámci jisté společnosti fungují dvě navzájem si konkurující oddělení. Vedení společnosti se rozhodlo, že každý týden bude poměřovat relativní (vzhledem k počtu zaměstnanců) zisky dosažené těmito dvěma odděleními. Do oddělení, které bude úspěšnější, pak budou přeřazeni dva pracovníci z druhého oddělení. Tento proces má probíhat tak dlouho, až jedno z oddělení zanikne. Získali jste zaměstnání v této společnosti a můžete si vybrat jedno z těchto dvou oddělení, kde budete pracovat. Chcete si zvolit to, které nebude v důsledku vnitropodnikové konkurence zrušeno. Jaká bude Vaše volba, když jedno oddělení má nyní 40 zaměstnanců, druhé 10 a když odhadujete, že to v současnosti menší z nich bude mít větší relativní zisky v 54 % případů?
Další využití Markovových řetězců viz příloha za kapitolou.
D. Unitární prostory
Již v minulé kapitole jsme definovali skalární součin v reálných
I 2 . 48
vektorových prostorech (2.40), v této kapitole rozšiřujeme jeho den nici i na komplexní vektorové prostory (3.23).
3.37. Grupy O(n) a U(n). Uvážíme-li všechna lineární zobrazení z M3 do M3, která zachovávají daný skalární součin, tedy vzhledem k definicím délky vektorů a odchylky dvou vektorů lineární zobrazení zachovávající délky a úhly, tak tato tvoří zřejmě vzhledem ke skládání zobrazení grupu (viz 1.1; složení dvou takových zobrazení je z definice zobrazení zachovávající délky a úhly, jednotkovým prvkem je identické zobrazení, inverzním prvkem k danému zobrazení je zobrazení k němu inverzní - díky podmínce na zachvávání velikostí existuje).
normální cp byl invariantní (je totiž zúžení normálního zobrazení na invariantní podprostor opět normální). Uvažme vlastní vektor u e V s vlastní hodnotou k, v e (u)-1. Platí
cp(v) ■ u = v ■ cp*(u) = (v,Xu) = Xu ■ v = 0
a tedy opět cp(v) e (w)-1.
(1) •<=>. (4): Výraz ^i . |2 je právě stopa matice AA*, to je matice zobrazení cp o cp*. Proto nezávisí na volbě ortonormální báze. Je-li tedy cp diagonalizovatelné, je tento výraz roven právě ^i |A;|2.
Opačná implikace je přímým důsledkem Schurovy věty o unitární triangulovatelnosti libovolného lineárního zobrazení V -» V, kterou dokážeme později v 3.37. Podle ní totiž existuje pro každé lineární zobrazení cp : V -» V ortonormální báze, ve které má cp horní trojúhelníkovou matici. Na její diagonále pak musí být právě všechny vlastní hodnoty cp. Jak jsme již ukázali, výraz ^i . |aí7|2 nezávisí na volbě ortonormální báze, proto z předpokládané rovnosti vyplývá, že všechny prvky mimo diagonálu musí být v této matici nulové. □
V termínech matic zobrazení dostáváme: zobrazení je normální právě, když jeho matice v některé ortonormální bázi (a ekvivalentně v každé) splňuje AA* = A* A. Takové matice nazýváme normální matice.
Poznámka. Všimněme si, že pro počet s lineárními zobrazeními na komplexním unitárním prostoru lze poslední větu chápat také jako zobecnění běžných počtů s komplexními čísly v goniometrickém tvaru (roli reálných čísel zde hrají sa-moadjungovaná zobrazení). Roli komplexních jednotek pak hrají unitární zobrazení. Zejména si všimněme analogie k vyjádření komplexních jednotek ve tvaru cos t + i sin t s vlastností cos2 t + sin2 t = 1:
Důsledek. Unitární zobrazení na unitárním prostoru V jsou právě ta normální zobrazení, pro která výše užívaný jednoznačný rozklad cp = ý + ir] splňuje ý2 + rj1 = id V.
Důkaz. Pro unitární zobrazení cp je cpcp* = id V = cp*cp a tedy cpcp* = (ý + ir])(ý — ir]) = + 0 + rj1 = id V. Naopak, pro normální zobrazení již poslední výpočet ukazuje, že opačná implikace platí také. □
3.31. Nezáporná zobrazení a odmocniny. Nezáporná reálná čísla jsou právě ta, která umíme psát jako druhé mocniny. Zobecnění takového chování pro matice a zobrazení lze vidět u součinů ma-tic B = A* ■ A (tj. složení zobrazení ý* o ý):
{B ■ x, x) = (A* • A • x, x) = (A • x, A ■ x) > 0
pro všechny vektory x. Navíc zjevně
B* = (A* • A)* = A* • A = B.
Hermiteovských maticím B s takovou vlastností říkáme pozitivně semidefinitní a pokud nastane nulová hodnota pouze
166
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
pro x = 0, pak jim říkáme pozitivně definitní. Obdobně hovoříme o pozitive definitních a a positivně semideftnitních.
, / , i, i, linearni_zoDrazeni zobrazeních ý : V -» V. 1-
Pro každé pozitivně semidefmitní zobrazení \jr : V -»
V umíme najít jeho odmocninu, tj. zobrazení n takové, že n o n = ý. Nejjednodušeji to uvidíme v ortonormální bázi, ve které bude mít ý diagonální matici. Taková podle našich předchozích úvah vždy existuje a matice A zobrazení i/> v ní bude mít na diagonále nezáporná reálná vlastní čísla zobrazení ý. Kdyby totiž bylo některé z nich záporné, nebyla by splněna podmínka nezápornosti již pro některý z bázových vektorů. Pak ovšem stačí definovat zobrazení n pomocí matice B s odmocninami příslušných vlastních čísel na diagonále.
3.32. Spektra a nilpotentní zobrazení. Na závěr této části se vrátíme k otázce, jak se mohou chovat lineární zobrazení v úplné obecnosti. Budeme i :^ nadále pracovat s reálnými nebo komplexními vektorovými prostory.
Připomeňme, že spektrum lineárního zobrazení f :
V -» V je posloupnost kořenů charakteristického polynomu zobrazení /, včetně násobností. Algebraickou násobností vlastní hodnoty rozumíme její násobnost jako kořenu charakteristického polynomu, geometrická násobnost vlastní hodnoty je dimenze příslušného podprostoru vlastních vektorů.
Lineární zobrazení / : V -» V se nazývá nilpotentní, jestliže existuje celé číslo k > 1 takové, že iterované zobrazení /* je identicky nulové. Nejmenší číslo k s touto vlastností se nazývá stupněm nilpotentnosti zobrazení /. Zobrazení / : V -» V se nazývá cyklické, jestliže existuje báze
..., un) prostoru V taková, že f(u\) = 0 a /(«/) = M/_i pro všechna i = 2, ..., n. Jinými slovy, matice / v této bázi je tvaru
/O 1 0 . 0 0 1.
v; ;
Je-li f (v) = a ■ v, pak pro každé přirozené k je fk(v) = ak ■ v. Zejména tedy může spektrum nilpotentnrho zobrazení obsahovat pouze nulový skalár (a ten tam vždy je).
Přímo z definice plyne, že každé cyklické zobrazení je nilpotentní, navíc je jeho stupeň nilpotentnosti roven dimenzi prostoru V. Operátor derivování na polynomech, D(xk) = kxk~l, je příkladem cyklického zobrazení na prostorech Kn[x] všech polynomů stupně nejvýše n nad skaláry K.
Kupodivu to platí i naopak a každé nilpotentní zobrazení je přímým součtem cyklických. Důkaz tohoto tvrzení nám dá hodně práce, proto napřed zformulujeme výsledky, ke kterým směrujeme, a pak se teprve dáme do technické práce. Ve výsledné větě o Jordánově rozkladu vvystupují vektorové (pod)prostory a lineární zobrazení na nich s jediným vlastním
Matice těchto zobrazení tedy tvoří vzhledem k násobení matic grupu (viz), říkáme jí ortogonální grupa, značíme 0(n). Je to podgrupa všech invertibilních zobrazení z MP do W.
Požadujeme-li navíc po maticích zobrazení, aby měly determinant roven jedné, hovoříme o speciální ortogonální grupě SO(n) (obecně může být determinantem matice z 0(n) číslo 1 či — 1).
Obdobně definujeme unitární grupu U(n) jakožto grupu všech (komplexních) matic, které odpovídají komplexně lineárním zobrazením z C" do C", která zachovávají daný skalární součin v unitárním prostoru. Stejně pak SU(n) značí podgrupu matic v U(n) s jednotkovým determinantem (obecně může být determinantem libovolná komplexní jednodnotka).
3.38. Uvažujme vektorový prostor V funkcí M -» C. Určete, zdaje zobrazení 1.
167
D. UNITÁRNÍ PROSTORY
4. VÍCE MATICOVÉHO POČTU
Řešení. Budeme dokazovat sporem. Předpokládáme tedy, že všechny vlastní podprostory operátoru C mají dim = 1. Pak můžeme pro libovolný vektor u psát u = ^ ckuk, kde uk jsou lineárně nezávislé vlastní vektory operátoru C vlastním číslem kk (a.ck = u.uk) Pro tyto vlastní vektory pak zjevně platí
0 = [A, C]uk = ACuk — CAuk = kkAuk — C(Auk)
Odtud vidíme, že Auk je vlastním vektorem matice C s vlastní hodnotou kk. To ovšm znamená, že Auk = k^uk pro nějaké číslo k£. Stejně tak odvodíme Buk = k^uk pro nějaké číslo kf. Pro komutátor matic A a S pak dostáváme
číslem k a maticí
BAuk — k^kfc uk — kfc k^uk
0
[A, B]uk = ABuk To ovšem znamená
[A, B]u = [A, B]J2ckUk ~ J2Ck[A> B]Uk = 0
k k
a protože u bylo libovolné, znamená to, že [A, B] = 0, což je spor. □
3.41. Použití v kvantové fyzice. V kvantové fyzice se fyzikální veličině nepřiřazuje číselná hodnota, tak jak tomu je v klasické fyzice, nýbrž hermiteovský operátor. To není nic jiného, než hermiteovsé zobrazení, které ovšem může vést, a často taky vede, mezi unitárnífiži.plžB story nekonečné dimenze (Můžeme si to představit třeba jako matici nekonečného rozměru). Vektory v tomto unitárním prostoru potom reprezentují stavy daného fyzikálního systému. Při měření dané fyzikální veličiny můžeme dostat jen hodnoty, které jsou vlastními hodnotami příslušného operátoru.
Například místo souřadnice x máme operátor souřadnice x. Jeli stav systému popsán vektorem v, pak platí x (v) = xv, tzn. je to násobení vektoru reálným číslem x. Na první pohled je tento hermiteovský operátor jiný než naše příklady z konečné dimenze. Evidentně je totiž každé reálné číslo vlastním číslem (x má tzv. spojité spektrum). Podobně, místo rychlosti (přesněji hybnosti) máme operátor p
dx
Vlastní vektory jsou řešení diferenciální rovnice —i^ = kv.lv tomto případě je spektrum spojité. To je vyjádřením faktu, že příslušná fyzikální veličina je spojitá (může nabývat libovolné reálné hodnoty). Naproti tomu máme fyzikální veličiny, např. energie, které mohou nabývat jen diskrétní hodnoty (energie je kvantována). Příslušné operátory jsou pak opracdu podobné hermiteovským maticím, jen mají nekonečný počet vlastních čísel.
3.42. Ukažte, že x a p jsou hermiteovské a že
[x, p] = i
(k 0
0
1
\o o o
o\
o
k)
Takovýmto maticím (a odpovídajícím invariantním podpro-storům) se říká Jordánův blok.
Věta (Jordánova věta o kanonickém tvaru). Nechť V je vektorový prostor dimenze n a f : V -» V je lineární zobrazení s n vlastními čísly včetně algebraických násobností. Pak existuje jednoznačný rozklad prostoru V na přímý součet pod-prostorů
V = Vi
takových, že f (Ví) C Ví, zúžení f na každé Ví má jediné vlastní číslo kt a zúžení f — A, • id na Ví je buď cyklické nebo nulové zobrazení.
Věta tedy říká, že ve vhodné bázi má každé lineární zobrazení blokově diagonální tvar s Jordánovými bloky podél diagonály. Celkový počet jedniček nad diagonálou v takovém tvaru je roven rozdílu mezi celkovou algebraickou a geometrickou násobností vlastních čísel.
3.33. Poznámky. Všimněme si, že jsme Jordánovu větu již dříve plně dokázali v případech, kdy jsou všechna vlastní čísla různá nebo když jsou geometrické a algebraické násobnosti vlastních čísel stejné. Zejména jsme ji plně dokázali pro unitární, normální a samoadjungovaná zobrazení.
Další užitečné pozorování je, že pro každé linerání zobrazení přísluší ke každému vlastnímu čislu jednoznačně určený invariantní podprostor, který odpovídá Jordánovým blokům s příslušnou vlastní hodnotou.
Také si všimněme jednoho velice užitečného důsledku Jordánovy věty (který jsme už použili u diskuse chování Markovových řetězců). Předpokládejme, že jsou vlastní hodnoty našeho zobrazení / všechny v abso-1S lutní hodnotě menší než jedna. Potom opakované působení lineárního zobrazení na jakémkoliv vektoru v e V vede k rychlému zmenšování všech souřadnic fk(v) nad všechny meze. Skutečně, předpokládejme pro jednoduchost, že na celém V má zobrazení / jediné vlastní číslo k a f — k id v je cyklické (tj. omezujeme se na jediný Jordánův blok), a nechť v\, ..., vi je příslušná báze. Pak podmínka z věty říká, že f(v2) = kv2 + vi, f2(v2) = k2v2 + kvi +kv\, a podobně pro ostatní vt a vyšší mocniny. V každém případě při iterování dostáváme stále vyšší a vyšší mocniny k u všech nenulových komponent, přičemž nejnižší z nich může být nejvýše o stupeň nilpotentnosti nižžší než násobnost iterace.
Tím je tvrzení dokázáno (a stejný argumet s aboslutní hodnotou vlastních čísel ostře větší nezjedná vede k neomezenému růstu všech souřadnic iterací fk(v)).
168
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
3. 37
3.37a
Zbytek této části třetí kapitoly je věnován důkazu Jor-danovy věty a několika k tomu potřebným po-Žlv jmům. Je výrazně obtížnější než dosavadní text a čtenář jej může případně přeskočit až do začátku 5. části této kapitoly.
3.34. Kořenové prostory. Na příkladech jsme viděli, že vlastní podprostory popisují dostatečně geometrické vlastnosti jen některých lineárních zobrazení. Zavedeme nyní jemnější nástroj, tzv. kořenové podprostory.
Definice. Nenulový vektor m e V se nazývá kořenovým vektorem lineárního zobrazení cp : V -» V, jestliže existuje a e K a celé číslo k > 0 takové, že (cp—a-idv)k(u) = 0, tj.&-tá iterace uvedeného zobrazení zobrazuje u na nulu. Množinu všech kořenových vektorů příslušných k pevnému skaláru k doplněnou o nulový vektor nazýváme kořenovým prostorem příslušným ke skaláru k e K, značíme TZx ■
Je-li u kořenový vektor a k z definice je vybráno nejme-nší možné, pak (cp — a ■ idy)*-1 (u) je vlastní vektor s vlastní hodnotou a. Je tedy TZx = {0} pro všechny skaláry k, které neleží ve spektru zobrazení cp.
Tvrzení. Pro lineární zobrazení cp : V -» V platí
(1) Pro každé k e Kj'e IZi C V vektorový podprostor.
(2) Pro každé k, fi e K je IZi invariantní vzhledem k lineárnímu zobrazení (cp — fi ■ idy), zejména tedy je IZi invariantní vzhledem k cp.
(3) Je-li fi ^ k, pak (cp — fi ■ idy)|^ je invertibilní.
(4) Zobrazení (cp — k ■ idy)|^ je nilpotentní.
Důkaz. (1) Ověření vlastností vektorového podprostoru je jednoduché a ponecháváme jej čtenáři.
(2) Předpokládejme, že (cp — k ■ idy)*(m) = 0 a uvažme v = (cp — \jl ■ idv)(u). Pak
(Cp-k-idy)k(v) =
= (cp — k ■ Ídy)k((cp - k ■ idy) +(k- H) ■ Ídy)(u) = (cp — k ■ Ídy)*+1(M) + (k - fl) ■ (Cp - k ■ Ídy)k(u) = 0
(3) Je-li u e Ker( V a zvolme takovou bázi u\, ... ,un prostoru V, že prvních k vektorů této báze je bazí
eto bázi má cp blokovou matici A = ^ ^ ^ |. Pak
budeme umět dokázat následující tvrzení:
Lemma. (1) Zobrazení cp indukuje lineární zobrazení cpv/u : V/U -+ V/U, cpv/u (v + U) = cp(v) + U s maticí D v indukované bázi uk+\ + U, ..., u„ + U na V/U.
(2) Charakteristický polynom cpv/u dělí charakteristický polynom cp.
Důkaz. Pro v, w e V, u e U, a e K máme cp(v + u) e cp(v) + U (protože U je invariantní), (cp(v) + U) + (cp(w) +
170
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
U) = cp(v + w) + U a a ■ (cp(v) + U) = a ■ (p(v) + U = cp(a ■ v) + U (protože cp je lineární), je tedy zobrazení cpV/u dobře definované a lineární. Navíc je přímo z dennice matice zobrazení patrné, že matice cpV/u v indukované bázi na V/U je právě matice D (při počítání obrazů bázových prvků nám koeficienty z matice C přispívají pouze do třídy U). Charakteristický polynom indukovaného zobrazení cpV/u je tedy \D — k ■ E\, zatímco charakteristický polynom původního zobrazení^ je \A — k ■ E\ = \B — k ■ E\\D - k ■ E\. □
Důsledek. Nechť V je vektorový prostor nad K dimenze n a nechť cp : V -» V je lineární zobrazení, jehož spektrum obsahuje n prvků (tj. všechny kořeny charakteristického polynomu leží v K a počítáme je včetně násobnosti). Pak existuje posloupnost invariantních podprostorů {0} = Vo C V\ C • • • C V„ = V s dimenzemi dim V; = i. V bázi u\, ..., u„ prostom V takové, že Vi = (u\, ..., u{), má cp horní trojúhelníkovou matici:
kn,
kde k]
k„ je posloupnost prvků spektra.
Důkaz. Konstrukci podprostorů Ví provedeme induktivně. Nechť ki, ... ,kn jsou prvky ve spektru zobrazení cp, tzn. charakteristický polynom zobrazení cp je tvaru (k — k\)-■ ■ ■ ■ (k — kn). Zvolme V0 = {0}, V\ = (u\), kde u\ je libovolný vlastní vektor s vlastní hodnotou k\. Podle předešlé věty je charakteristický polynom zobrazení cpv/vx tvaru
(k — k2).....(k — kn). Předpokládejme, že jsme již sestrojili
lineárně nezávislé vektory u\, ..., uk a invariantní podpro-story Ví = (u\ ... ,Ui),i = 1, ..., k < n, takové, že charakteristický polynom cpV/vk je tvaru (k — kk+i).....(k — kn)
a cp(ui) e (ki ■ Ui + Ví-i) pro všechna i = 1, ..., k.
Zejména tedy existuje vlastní vektor uk+i + Vk e V/Vk zobrazení cpV/vk s vlastní hodnotou kk+i. Uvažme nyní prostor Vk+i = (u\, ..., uk+i). Kdyby byl vektor uk+i lineární kombinací vektorů u\, ... ,uk, znamenalo by to, že uk+i + Vk je nulová třída v V/Vk, to ale není možné. Je proto dim Vk+\ = k + 1. Zbývá studovat indukované zobrazení cpV/vk+l ■ Charakteristický polynom tohoto zobrazení je stupně n — k — 1 a. dělí charakteristický polynom zobrazení cp. Přitom doplněním vektorů u\, ..., uk+i do báze V dostaneme blokovou matici zobrazení cp s horní trojúhelníkovou submaticí B v horním levém rohu a nulou v levém dolním rohu, jejíž diagonální prvky jsou právě skaláry k\, ..., kk+i. Proto mají kořeny charakteristického polynomu indukovaného zobrazení požadované vlastnosti. □
To jsou, opět jako v minulém příkladu, násobky vektoru (1, 2). To, že řešením této rovnice nejsou dva lineárně nezávislé vektory, říká, že Jordánův tvar v tomto případě nebude diagonální, ale bude to matice
1 1 0 1
. Bázi, ve které má matice A tento tvar, tvoří vlastní vektor
(1, 2) a vektor, který se na tento vektor zobrazí zobrazením A — E. Je tedy řešením soustavy rovnic
-2 1 -4 2
0
To jsou násobky vektoru (1,3). Dostáváme tedy stejnou bázi jako v minulém příkladu a můžeme psát
-4 3 J \2 3J\0 \J\-2 1 Zobrazení teď působí na vektor tak, že složka ve směru (1,3) zůstává stejná a ke složka ve směru (1, 2) se bude násobit součtem koeficientů, které určují složky ve směrech (1, 3) a (1, 2). □
3.49. Najděte Jordánův tvar matice A a napište příslušný rozklad. Jaká je geometrická interpretace rozkladu této matice?
-1
a Aj
a nakreslete (narýsujte), jak
se vektory v = (3, 0), A\v a A2v rozkládají vzhledem k bázi vlastních vektorů matice Ai]2.
Řešení. Matice mají stejné Jordánovy tvary jako matice v minulém příkladu a obě je mají v bázi tvořenou vektory (1, 2) a (1, —1), tj.
1
a
1 0 0 2
1
3.37c
3 (4 1 ) (2 -l) (o l) (2 -1, Pro vektor v = (3, 0) dostáváme v = (1, 2) + 2(1, —1) a pro jeho obrazy Arv = (5, -2) = (1, 2) + 2 • 2 • (1, -1) a A2v = (5, 4) = (2 + 1)-(1,2)+ 2-(1,-1). □
3.50. Singulární rozklad,polární rozklad, pseudoinverze. Spočí-
/0 0 -A
tej te singulární rozklad matice A = I — 1 0 0 I. Následně spočí-
\ 0 0 0 /
tejte její polární rozklad a najděte její pseudoinverzi.
Řešení. Nejprve spočítáme AT A:
0 -1 0\ / 0 0 0 0 0 -1 0
4 o 0/ V o o
a dostáváme diagonální matici. Potřebujeme ale najít takovou ortonormální bázi, ve které je matice diagonální a nulový řádek je až poslední. Toho zjevně docílíme otočením o pravý úhel kolem osy x (souřadnice y přejde na z a z přejde na -y). Toto otočení je ortogonální transformace
ATA
171
E. ROZKLADY MATIC
4. VÍCE MATICOVÉHO POČTU
1 0 0\
daná maticí V = I 0 0 II. Tím jsme bez počítání našli rozklad \0 -1 o)
ATA = VBVT, kde B je diagonální s vlastními čísly (1, |, 0) na diagonále. Protože teď máme B = (AV)T (AV), tvoří sloupce matice
/ 0 0 -A /l 0 0\ / 0 i 0^
Aľ= -1 0 0 0 0 1 = -1 0 0 \ 0 0 0 / \0 -1 0/ \ 0 0 0y
ortogonální systém vektoru, který znormalizujeme a doplníme do báze.
Tamá pak tvar (0, -1,0), (1,0,0), (0, 0, 1). Matice přechodu od této
0 1 0\
— 1 0 0 I. Dohromady tak dostá-0 0 1/
báze ke standardní je pak U ■ váme rozklad A = UV~BVT
0
-1 0
0 0 0
0
-1 0
0
Geometricky lze rozklad zobrazení interpretovat tak, že nejprve se vše otočí o pravý úhel kolem osy x, pak následuje projekce do roviny xy taková, že jednotková koule se zobrazí do elipsy s hlavními poloosami 1 a j a výsledek se otočí o pravý úhel kolem osy z.
P ■ W dostaneme ze singulárního jednoduše: \tj.
a z toho plyne 0
-1 0
0 0 0
3.37d
VS'UT, kde S
Pseudoinverzní matice je dána výrazem A( l) 'l 0 0\
0 2 0. Máme tedy ,0 0 0/
i(-D
□
3.51. QR rozklad. QR rozklad matice A se dobře hodí v případě, když je dán systém lineárních rovnic Ax = b, který sice nemá řešení, ale my potřebujeme najít jeho co nejlepší přiblížení. Chceme tedy minimalizovat II Ax — b\\. Podle Pythagorovy věty máme ||Ax — b\\2 =
3.37. Poznámky. Pokud existuje rozklad celého prostoru V na přímý součet vlastních podprostorů, existuje báze z vlastních podprostorů a předchozí věta vlastně neříká vůbec nic zajímavého. Její síla ovšem spočívá v tom, že jediným jejím předpokladem je existence dim V kořenů charakteristického polynomu (včetně násobností). To je ovšem zaručeno, je-li pole K algebraicky uzavřené, např. pro komplexní čísla C. Přímým důsledkem pak jsou zajímavá tvrzení o determinantu a stopě zobrazení: jsou vždy součinem, resp. součtem prvků ve spektru. Tuto skutečnost můžeme použít i pro všechny reálné matice. Můžeme je totiž vždy považovat za komplexní, spočítat potřebné, a protože determinant i stopa jsou algebraické výrazy v prvcích matice, výsledkem budou právě hledané reálné hodnoty.
Když je na vektorovém prostoru V zadán skalární součin, můžeme v každém induktivním kroku důkazu předchozího tvrzení využít skutečnosti, že vždy V/Vk ~ V^ a
V
B u h-» (u + Vk) e V/Vk- To znamená, že v každé
třídě rozkladu V/Vk existuje právě jeden vektor z Vk . Skutečně, tuto vlastnost má faktorový prostor podle libovolného podprostorů v unitárním prostoru - pokud u, v e VkL jsou v jedné třídě, pak jejich rozdíl patří do Vk H V^, tedy jsou stejné. Můžeme tedy jako reprezentanta uk+i nalezené třídy, tedy vlastního vektoru V je libovolné lineární zobrazení (reálného nebo komplexního) unitárního prostoru s m = dim V vlastními hodnotami (včetně násobonosti). Pak existuje ortonormální báze prostoru V taková, že cp v ní má horní trojúhelníkovou matici s vlastními čísly X\, ... ,Xm na diagonále.
3.38. Věta. Nechť cp V —> V je lineární zobrazení. Součet kořenových prostorů
nXx,...,nXk
příslušných různým vlastním hodnotám X\ ..., Xk je přímý. Navíc je pro každou vlastní hodnotu X dimenze podprostorů IZi rovna její algebraické násobnosti.
Důkaz. Důkaz provedeme indukcí přes počet k kořeno-\\ vých prostorů. Předpokládejme, že tvrzení vždy platí pro méně než k prostorů a že pro vektory u\ e TZXl, ..., Uk € lZik platí mi + ■ ■ - + uk = 0. Pro vhodné j pak (cp — kk ■ idv)j (uk) = 0 a zároveň jsou y i = (cp — kk ■ iávy (uí) nenulové vektory v TZXi, i = 1, — 1, pokud Ui jsou nenulové, viz. předchozí
věta.
Přitom ale
k
yi H-----h yk-i = ^( 0 je dimenze Pu-\ - Z definice plyne, že Pk_i c
Ker cp, tj. vždy cp(ek- l) Předpokládejme,
Pk-i =
j = 1, dejme
0.
ze
cp(Pk_2), nutně existují v ., pk-i, takové, že cp(ekj~2)
Pk-
V. Protože
vektory e-
k-2
ek: l. Předpoklá-
axe\ 1 +
'' + aPk-iePk_i + '
„k-2
>\ex
+ ••• + .
) ek~2
0.
Aplikací zobrazení cp na tuto lineární kombinaci získáme
+
ek~l
II Ax — b\\ ||2 + ||Ŕj_||2, kde b jsme rozložili na b\\, které patří do obrazu matice A a na ii, které je k tomuto obrazu kolmé. Projekci na obraz matice A můžeme psát ve tvaru QQT pro vhodnou ortogonální matici Q. Konkrétně tuto matici získáme Gram-Schmidtovou or-tonormalizací sloupců matice A. Potom máme b\\ = QQTb a proto Ax — b y = Q(QT Ax — QTb). Soustava v závorce už má řešení, pro které potom dostáváme ||Ax — b\\ = \\b±\\, což je minimální hodnota. Navíc matice R := QT A je horní trojúhelníková a proto požadované přibližné řešení najdeme velmi lehce.
Najděte přibližné řešení soustavy rovnic
x + 2y = 1 2x + 4y = 4
Řešení. Máme tedy soustavu Ax = b s A = ^la^
(která evidentně nemá řešení). Uděláme tedy ortonormalizaci sloupců matice A. Vezmeme první z nich a vydělíme ho jeho velikostí. Tím
dostaneme první vektor ortonormální báze . Druhý dostaneme
tak, že od druhého sloupce odečteme jeho komponentu ve směru už nalezeného prvního vektoru ortonormální báze. Druhý vektor je ovšem dvojnásobek prvního a proto v ortonormalizaci nulový. Máme proto Q = -jj ■ Projektor na obraz matice A je pak Q QT = j ^ 4^ >
dále spočítáme
9
71
Přibližné řešení pak splňuje Rx = Q Tb a to v našem případě znamená 5x + 9y = 9 (přibližné řešení tedy není jednoznačné). QR rozklad matice A je
'\ 2\ 1 /1\ 1
2 4
V5\V 75
(5 9)
□
3.52. Minimalizujte ||Ax — b\\ pro A
0 I a napište QR rozklad matice A.
Řešení. Normalizovaný první sloupec matice A je 000 2
0, proto jsou všechny b j = 0. e\
Pak ale i a j = 0, protože se jedná o kombinaci bázových
J — 1 J. Z druhého sloupce odečteme jeho složku ve
173
E. ROZKLADY MATIC
4. VÍCE MATICOVÉHO POČTU
směru e\. Máme
a proto dostaneme
1\ /-l
■1,
Tím jsme vyrobili ortogonální vektor, který normujeme a dostaneme e2 = "Tf I 1 I ■ Třetí sloupec matice A je už lineárně závislý
(můžeme ověřit spočítáním determinantu). Hledaná sloupcově-ortogonální matice je tedy
1 í2 ° V6 \ _j
Dále spočítáme
^ /6 -3 -3 \
VěU 3V3 -3V3/
■1
T
1 (?
Řešením rovnice Rx = QTbjex = y = z. Násobky vektoru (1, 1, 1) tedy minimalizuji \\Ax — b\\.
Zahrazení určené maticí A je projekce na rovinu s normálovým vektorem (1, 1, 1).
□
3.53. Lineární regrese. Znalosti, které jsme se v této kapitole naučili lze s výhodou použít v praxi při řešení problémů pomocí lineární regrese. Jde o to nalézt nejlepší přiblížení nějaké funkční závislosti pomocí lineární funkce.
Máme tedy zadánu funkční závislost v několika bodech (například zkoumáme hodnotu majetku lidí v závislosti na jejich inteligenci, na majetku rodičů, počtu společných známých s panem Kalouskem,...), tj. f(a\, ...,aln) = yi,..., f(a\, a\, ..., ak) = yk,k > n (máme tedy více rovnic než neznámých) a chceme tuto závislost „co nejlépe" odhadnout pomocí lineární funkce, tj. vyjádřit hodnotu majetku jakožto lineární funkci f(x\, ..., xn) = b\X\ + b2x2 + • • • + bnxn + c. Pokud
vektorů. Celkem jsme tedy ověřili lineární nezávislost všech 2pk-i zvolených vektorů. Doplňme je do báze
-i '
„k-2
ek~l Pk-i
ek~2 ek~2
^"2
"Pk-2
prostoru Pk-2- Navíc jsou obrazy přidaných bázových prvků v Pk-i, nutně tedy musejí být lineárními kombinacemi bázo-
vých prvků e1 , ..., e _^. Můžeme proto zaměnit zvolené vektory ek~2i+l, ek~22 vektory ek~2 - cp(ek~2). Tím docílíme, že doplněné vektory do báze Pk-2 patří do jádra zobrazení cp. Předpokládejme to přímo o zvolené bázi (1).
Předpokládejme dále, že již máme sestrojenu bázi pod-prostoru Pk-i takovou, že ji můžeme poskládat do schématu
ek-\...,ek~l
-i '
-l ' „*-3
Pk-l
k-2 k-2
„k-2
' ePk-V epk-\ + V • • • ' epk-2
e" - ek-3 ek~3 ei ' • • •' e»-r e»-i+ľ
k-i
„k-l „k-l
ek~3 ek~3
Pk-2' Pk-2 + ľ
„k-l k-l
"Pk-3
.. - .v „ .. ,v „ .. k l k l
1 '- - ■' Pk-l' ept-l+ľ- • •' e»-2' Pk-2 + ľ- ■ ■' Pk-3' ■ ■ Pk-l
kde hodnota zobrazení cp na libovolném bázovém vektoru se nachází nad ním, nebo je nulová, pokud nad zvoleným vektorem báze již nic není. Pokud je Pk-i ^ V, opět musí existovat vektory e\~l~l, ..., ekp~^~l, které se zobrazují na
„k-l
vektory
, epk_t a můžeme je doplnit do báze Pk-i-\, řekněme
ek-l-\,...,ek-1-1
'Pk-t+l' • • • ' "pk-e-i' Přitom postupným odečítáním hodnot iterací zobrazení cp na těchto vektorech dosáhneme opět toho, že doplněné vektory do báze Pk-i-\ budou ležet v jádru cp a analogicky jako výše ověříme, že skutečně dostaneme bázi Pk-i-\.
Po k krocích získáme bázi celého V, která má vlastnosti uvedené pro bázi prostoru Pk-i- Jednotlivé sloupce výsledného schématu pak generují hledané podprostory Vt a navíc jsme přímo našli báze těchto podprostorů ukazující, že příslušná zúžení cp jsou cyklická zobrazení. □
3.40. Důkaz Jordánovy věty. Nechť ki,...,kk jsou J.<.- všechny různé vlastní hodnoty zobrazení cp. Z předpokladů Jordánovy věty plyne, že V = TZ^l © • • • ®1Zxk-Zobrazení cpi = (cp\fix. — • id^.) jsou nilpotentní a proto je každý z kořenových prostorů přímým
součtem
prostorů na nichž je zúžení zobrazení cp — k,■ ■ idy cyklické. Matice těchto zúžených zobrazení na Prs jsou Jordánovy bloky příslušné k nulové vlastní hodnotě, zúžené zobrazení cp\prs má proto za matici Jordánův blok s vlastní hodnotou
v"
Pro důkaz Jordánovy věty zbývá dokázat tvrzení o jednoznačnosti. Protože diagonální hodnoty k{ jsou dány jako
174
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
kořeny charakteristického polynomu, je jejich jednoznačnost zřejmá. Vyjádříme rozměry jednotlivých Jordánových bloků prostřednictvím hodností rk(ki) zobrazení (cp — X{ • idy)*. Tím bude jasné, že až na pořadí jsou bloky jednoznačně určeny. Naopak, přehození bloků odpovídá přečíslování vektorů báze, lze je tedy získat v libovolném pořadí.
Je-li ý cyklický operátor na n-rozměrném prostoru, pak defekt iterovaného zobrazení xjŕ je k pro 0 n. Odtud plyne, že pokud matice J zobrazení cp obsahuje dk (X) Jordánových bloků řádu k s vlastní hodnotou X, pak defekt matice (J — X ■ E)1 je
dx(X) + 2d2(X) + . ..ldt(X) + ídl+l(X) + ...
Odtud spočítáme
n - n(X) = dx(X) + 2d2(X) + --- + £dl(X) + £dl+1(X) + .. dk(X) = rk_x(X) - 2rk(X) + rk+l(X)
(kde poslední řádek vznikne kombinací předchozího pro hodnoty l = k - 1, k, k + 1).
3.41. Poznámka. Důkaz věty o existenci Jordánova kano-pjj^ nického tvaru byl sice konstruktivní, nedává nám ale dokonale efektivní algoritmický postup
^ yL- pro jejich hledání. Nyní shrneme již odvozený N> i*-^* - postup explicitního výpočtu báze, v níž má dané zobrazení cp : V -> V matici v kanonickém Jordánově tvaru.
(1) Najdeme kořeny charakteristického polynomu.
(2) Jestliže jich je méně než n = dim V, včetně násobností, kanonický tvar neexistuje.
(3) Je-li n lineárně nezávislých vlastních vektorů, získáme bázi V z vlastních vektorů a v ní má cp diagonální matici.
(4) Nechť X je vlastní hodnota s geometrickou násobností menší než algebraickou a v\, ..., vk nechť jsou příslušné vlastní vektory. To by měly být vektory na horním okraji schématu z důkazu věty 3.39, je ovšem nutné najít vhodnou bázi aplikacemi iterací cp — X ■ idy. Zároveň přitom zjistíme, ve kterém řádku se vektory nacházejí, a najdeme lineárně nezávislá řešení u>; rovnic (cp — X id)(x) = ví z řádků pod nimi. Postup opakujeme iterativně (tj. pro u>; atd.). Najdeme tak „řetízky" bázových vektorů zadávajících podprostory, kde cp — X id je cyklické.
Postup je praktický pro matice, kde násobnosti vlastních hodnot jsou malé, nebo aspoň diskutované stupně nilpotentnosti jsou malé. Např. pro matici
(2 0 ŕ A = 0 2 1 \0 0 2>
dostaneme dvourozměrný podprostor vlastních vektorů
((1,0,0), (0,1,0)).
Potřebujeme proto najít řešení rovnic (A—2E)x = (a, b, 0)T pro vhodné konstanty a, b. Tento systém je ovšem řešitelný pouze pro a = b a jedno z možných řešení je v = (0, 0, 1),
navíc definujeme „co nejlépe" tím, že chceme minimalizovat
k / n
E v< E(/''v'1 r)
v závislosti na reálných konstantách b\, ... ,b„, c. Našim cílem je najít takovou lineární kombinanci sloupců matice A = (a'j) (s koeficienty b\, ...,&„), která bude mít co nej menší vzdálenost od vektoru (yi, ..., yk) v M.k, tedy vlastně najít kolmou projekci vektoru (yi, ..., yk) na podprostor generovaný sloupci matice A. Podle věty 3.49 je touto projekcí vektor (b\, ..., bn)T = A(_1)(yi, ..., b„).
3.54. Metodou nejmenších čverců řešte soustavu 2x + 3y + 4z = 1 x + y + z =2 3x + y + 2z = 0 2y-z = -l
Řešení.
□
175
E. ROZKLADY MATIC
5. ROZKLADY MATIC A PSEUDOINVERZE
a = b = 1. Celá hledaná báze pak je (1, 1, 0), (0, 0, 1), (1, 0, 0). Všimněme si, že jsme měli spoustu voleb a bazí s požadovanými vlastnostmi je tedy mnoho.
5. Rozklady matic a pseudoinverze
V minulé části jsme s soustředili na geometrický popis struktury zobrazení. Teď naše výsledky přeložíme do jazyku tzv. rozkladů matic, což je obzvlášť důležité téma pro numerické postupy a maticový počet obecně.
I při počítání s reálnými čísly užíváme pro zjednodušení rozklady na součiny. Nejjednodušším je vyjádření každého reálného čísla jednoznačně ve tvaru
a = sgn(út) • \a\,
tj. jako součin znaménka a abolutní hodnoty. V dalším textu si uvedeme stručně přehled několika takových rozkladů pro různé typy matic, které bývají nesmírně užitečné při numerických výpočtech s maticemi. Například jsme vhodný rozklad pro pozitivně semidefmitní symetrické matice využili v odstavci 3.31 pro konstrukci odmocniny z matice.
3.40 |
3.42. LU-rozklad. Začneme přeformulováním několika výsledků, které jsme už dávno odvodili. V '■} odstavcích 2.7 a 2.8 jsme upravovali matice nad skaláry z libovolného pole na řádkový 'fidf^t^J^— schodovitý tvar. K tomu jsme používali elementární úpravy, které spočívaly v postupném násobení naší matice invertibilními dolními trojúhelníkovými maticemi Pí, které postihovaly přičítání násobků řádků pod právě zpracovávaným.
Předpokládejme pro jednoduchost, že naše matice A je čtvercová a že při Gausově eliminaci nejsme nuceni přehazovat řádky, a proto všechny naše matice Pt mohou být dolní trojúhelníkové s jedničkami na diagonálách. Konečně, stačí si povšimnout, že inverzní matice k takovýmto Pt jsou opět dolní trojúhelníkové s jedničkami na diagonálách a dostáváme
U = P ■ A = Pk ■ ■ ■ Pi ■ A kde U je horní trojúhelníková matice a tedy A = L ■ U
kde L je dolní trojúhelníková matice s jedničkami na diagonále a U je horní trojúhelníková. Tomuto rozkladu se říká LU-rozklad matice A.
V případě obecné matice můžeme při Gausově eliminaci na řádkově schodovitý tvar potřebovat navíc permutace řádků, někdy i sloupců matice. Pak dostáváme obecněji
A = P ■ L ■ U ■ Q,
kde P a. Q jsou nějaké permutační matice.
176
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
3.43. Poznámky. Přímým důsledkem Gausovy eliminace bylo také zjištění, že až na volbu vhodných bází na definičním oboru a oboru hodnot je každé
~_ zobrazení / : V -» W zadáno maticí v blokově diagonálním tvaru s jednotkovou maticí, s rozměrem daným dimenzí obrazu /, a s nulovými bloky všude kolem. To lze přeformulovat takto: Každou matici A typu m/n nad polem skalárů K lze rozložit na součin
0 OJ U' kde P a. Q jsou vhodné invertibilní matice.
Pro čtvercové matice jsme v 3.32 ukázali při diskusi vlastností lineárních zobrazení / : V -» V na komplexních vektorových prostorech, že každou čtvercovou matici A dimenze m umíme rozložit na součin
A = P ■ B ■ P~\
kde B je blokově diagonální s Jordánovými bloky příslušnými k vlastním číslům na diagonále. Skutečně jde o pouhé přepsání Jordánovy věty, protože násobení maticí P a její inverzí z opačných stran odpovídá v tomto přípaě právě změně báze na vektorovém prostoru V a citovaná věta říká, že ve vhodné bázi má každé zobrazení Jordánův kanonický tvar.
Obdobně jsme také při diskusi samoadjungovaných zobrazení dokázali, že pro reálné symetrické nebo komplexní Hermiteovské matice existuje vždy rozklad na součin
A = P ■ B ■ P*,
kde B je diagonální matice se všemi (vždy reálnými) vlastními čísly na diagonále, včetně násobností. Skutečně, jde opět o součin s maticemi vystihující změnu báze, nicméně připouštíme nyní pouze změny mezi mezi ortonormálními bázemi a proto i matice přechodu P musí být ortogonální. Odtud P'1 = P*.
Pro reálná ortogonální zobrazení jsme odvodili obdobné vyjádření jako u symetrických, pouze naše B bude blokově diagonální s bloky rozměru dva nebo jedna vyjadřujícími buď rotaci nebo zrcadlení nebo identitu vzhledem k příslušným podprostorům.
3.44. Věta o singulárním rozkladu. Nyní se vrátíme k obecným lineárním zobrazením mezi (obecně různými) vektorovými prostory. Jestliže na nich je definován skalární součin a omezíme se přitom na ortonormální báze, musíme postupovat
o hodně rafinovaněji, než v případě bazí libovolných:
Věta. Nechť A je libovolná matice typu m/n nad reálnými nebo komplexními skaláry. Pak existují čtvercové unitární matice U a V dimenzí m a n, a reálná diagonální matice s nezápornými prvky D dimenze r, r < min{m, n}, takové,
Že
A = USV*, S = í q q
177
E. ROZKLADY MATIC
5. ROZKLADY MATIC A PSEUDOINVERZE
a r je hodnost matice A A*. Přitom je S určena jednoznačně až na pořadí prvků a prvky diagonálni matice D jsou druhé odmocniny vlastních čísel , komplexními prostory se standardními skalárními součiny, zadané maticí A ve standardních bazích.
Tvrzení věty můžeme přeformulovat tak, že existují ortonormální báze na W a W" ve kterých bude mít cp matici S z tvrzení věty.
Jak jsme viděli dříve, matice A* A je pozitivně semidefi-nitní. Proto má samá reálná nezáporná vlastní čísla a existuje ortonormální báze w v W, ve které má příslušné zobrazení cp*ocp diagonální matici s vlastními čísly na diagonále. Jinými slovy, existuje unitární matice V taková, že A*A = VBV* pro reálnou diagonální matici s nezápornými vlastními čísly (d\, di, ■ ■ ■, dr, 0, ..., 0) na diagonále, d{ ^ 0 pro všechny i = l,...,r. Odtud
B = V*A*AV = (AVT(AV).
To je aleje ekvivalentní tvrzení, že prvních r sloupců matice A y je ortogonálních a zbývající jsou nulové, protože mají nulovou velikost.
Označme nyní prvních r sloupců v\, ..., vr e W". Platí tedy (ví,Ví) = dh i = l,...,r, a normované vektory u i = -jjVi tvoří ortonormální systém nenulových vektorů. Doplňme je na ortonormální bázi u_ = u\, ... ,un celého Km. Vyjádříme-li naše původní zobrazení cp v bazích w na K" a u na W", dostáváme matici ~J~B. Přechody od standardních bází k nově vybraným odpovídají násobení zleva ortogonálními maticemi U a zprava V~l = V*.
Pokud je m > n, můžeme aplikovat předchozí část důkazu na matici A*. Odtud pak přímo plyne požadované tvrzení.
Pokud pracujeme nad reálnými skaláry, jsou všechny naše kroky v důkazu výše také realizovány v reálném oboru.
□
Tento důkaz věty o singulárním rozkladu je konstruktivní a můžeme jej opravdu použít pro výpočet unitárních, resp. ortogonálních, matic U, V a diagonálních nenulových prvků matice S.
3.45. Geometrická interpretace. Diagonálním hodnotám
matice D z předchozí věty se říká singulární hodnoty matice A. Přeformulujme si tuto větu v reálném případě geometrietěji.
178
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
Pro příslušné lineární zobrazení cp : M." -» W" mají singulární hodnoty skutečně jednoduchý geometrický význam: Nechť K c W je jednotková sféra pro standardní skalární součin. Obrazem cp(K) pak vždy bude (případně degenerovaný) m-rozměrný elipsoid. Singulární čísla matice A jsou přitom velikosti hlavních poloos a věta navíc říká, že původní sféra vždy připouští ortogonální sdružené průměry, jejichž obrazem budou právě všechny poloosy tohoto elipsoidu.
Pro čtvercové matice je vidět, že A je invertibilní právě, když všechna singulární čísla jsou nenulová. Poměr nej-většrho a nejmenšího singulárního čísla je důležitým parametrem pro robustnost řady numerických výpočtů s maticemi, např. pro výpočet inverzní matice. Poznamejme také, že existují rychlé metody výpočtů, resp. odhadů, vlastních čísel, proto lze se singulárním rozkladem velmi efektivně pracovat.
3.46. Věta o polárním rozkladu. Věta o singulárním rozkladu je východiskem pro mnoho mimořádně užitečných nástrojů. Uvažujme nyní nad několika přímými důsledky (které samy o sobě jsou dosti netriviální). Tvrzení věty říká pro libovolnou matici A, ať už reálnou nebo komplexní, A = U SW* s diagonální S s nezápornými reálnými čísly na diagonále a unitárními U, W. Pak ovšem také A = USU*UW* a pojmenujme si matice P = USU*, V = UW*. První z nich, P je hermiteov-ská (v reálném případě symetrická) a pozitivně semidefinitní, protože jde jen o zápis zobrazení s reálnou diagonální maticí S v jiné ortonormální bázi, zatímco V je coby součin dvou unitárních opět unitární (v reálném případě ortogonální). Navíc A* = WSU* a tedy A A* = USSU* = P2 a naše matice P je vlastně odmocninou ze snadno spočítatelné hermiteov-ské matice A A*.
Předpokládejme, že A = PV = QU jsou dva takové rozklady matice A na součin positivně semidefinitní hermi-teovské a unitární matice a předpokládejme, že A je invertibilní. Pak ovšem je
AA* = PVV*P = P2 = QUU*Q = Q2
pozitivně definitní a proto jsou matice Q = P = V AA* jednoznačně určené a invertibilní. Pak ovšem také U = V = P~lA.
Beze zbytku jsme tedy odvodili velice užitečnou analogii rozkladu reálného čísla na znaménko (ortogonální matice v případě dimenze jedna jsou právě ±1) a absolutní hodnotu (matice P, ke které umíme odmocninu).
Věta (Věta o polárním rozkladu). Každou čtvercovou komplexní matici A dimenze n lze vždy vyjádřit ve tvaru A = P ■ V, kde P je hermiteovská a positivně definitní čtvercová matice téže dimenze a V je unitární. Přitom P = V AA*. Jeli A invertibilní, je rozklad jednoznačný a V = (V AA*)-1 A.
Pokud pracujeme nad reálnými skaláry, je P symetrická a V ortogonální.
179
E. ROZKLADY MATIC
5. ROZKLADY MATIC A PSEUDOINVERZE
Když budeme tutéž větu aplikovat na A* místo A, dostaneme tentýž výsledek, ovšem s obráceným pořadím hermite-ovských a unitárních matic. Matice v příslušných pravých a levých rozkladech budou samozřejmě obecně různé.
V komplexním případě je analogie s rozkladem čísel ještě zábavnější — pozitivně semidefmitní P L_ hraje opět roli absolutní hodnoty komplexního čísla, unitární matice V pak má jednoznačné vyjádření jako součet V = re V + i im V s hermiteovkými reálnými a imaginárními částmi a s vlastností (re V7)2 + (im V7)2 = E, tj. dostáváme plnou analogii goniometrického tvaru komplexních čísel (viz závěrečná poznámka v 3.30). Všimněme si ale, že ve vícerozměrném případě je podstané, v jakém pořadí tento „goniometrický tvar" matice píšeme. Jde to oběma způsoby, výsledky jsou ale obecně různé.
Pro řadu praktických aplikací bývá rychlejší použití tzv. QR rozkladu matic, který je obdobou Schurovy věty o ortogonální triangulaci:
3.45 3.47. Věta. Pro každou komplexní matici A typu m/n existuje unitární matice Q a horní trojúhelníková matice R takové, že A = QTR.
Pokud pracujeme nad reálnými skaláry, jsou Q i R reálné.
Důkaz. V geometrické formulaci potřebujeme dokázat, „ že pro každé zobrazení n. Např. máme experimentem dáno mnoho naměřených reálných hodnot b j a chceme najít lineární kombinaci několika funkcí f i, která bude co nejlépe aproximovat hodnoty b j. Skutečné hodnoty zvolených funkcí v bodech y j e M zadají matici clí j = _/}(y;), jejíž sloupce jsou dány hodnotami jednotlivých funkcí /} v uvažovaných bodech, a naším úkolem je tedy určit koeficienty x j e M tak, aby součet kvadrátů odchylek od skutečných hodnot
m n m n
J> - (^v/V/Ov)))' = J> - (J>7*;))2
i=l j=l i=l j=l
byl minimální. Jinými slovy, hledáme lineární kombinaci funkcí fi takovou, abychom „dobře" proložili zadané hodnoty bi. Díky předchozí větě jsou hledané optimální koeficienty A{~l)b.
Abychom měli konkrétnější představu, uvažujme pouze dvě funkce f\(x) = x, fi(x) = x2 a předpokládejme, že „naměřené hodnoty" jejich neznámé kombinace g(x) = y\x + y2x2 v celočíselných hodnotách pro x mezi 1 a 10 jsou bT = (1.4410.644.4814.5631.1239.2054.8871.28 85.92104.16) Tento vektor vzniknul výpočtem hodnot x + x2 v daných bodech posunutých o náhodné hodnoty v rozmezí ±8. Matice A = (bij) je tedy v našem případě rovna
r_/l 234 5 6 7 8 9 10 \ VI 4 9 16 25 36 49 64 81 100/
a hledané koeficienty v kombinaci jsou
Výsledné proložení je možné dobře vidět na obrázku, kde zeleně jsou proloženy zadané hodnoty b lomenou čarou, zatímco červený je graf příslušné kombinace g. Výpočty byly provedeny v systému Maple pomocí příkazu leastsqrs(B,b). Pokud jste s Maplem (nebo jiným podobným softwarem) spřáteleni, zkuste si zaexperimentovat s podobnými úlohami.
E. ROZKLADY MATIC
5. ROZKLADY MATIC A PSEUDOINVERZE
184
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
F. Doplňující příklady k celé kapitole
3.55. Model vývoje populace velryb. Pro vývoj populace jsou podstatné samice a u nich není důležitý věk, ale plodnost. Z tohoto hlediska můžeme samice rozdělit na novorozené neboli juve-nilní, tj. dosud neplodné samice, mladé plodné samice, dospělé samice s nej větší plodností a samice postmenopauzní, které již plodné nejsou, ale mají velký význam při ochraně mláďat nebo vyhledávání zdrojů potravy.
Budeme modelovat vývoj takové populace v čase. Za časovou jednotku zvolíme dobu dosažení dospělosti. Novorozená samice, která tuto dobu přežije, dospěje k plodnosti. Vývoj mladé samice do plné plodnosti a vývoj dospělé samice k menopauze závisí na podmínkách prostředí. Přechod do další plodnostní kategorie je tedy náhodný jev. Stejně je náhodným jevem i úmrtí samice. Mladá plodná samice má za jednotku času průměrně méně mláďat, než samice plodná. Tyto poznatky vyjádříme formalizovane.
Označme xi(t), resp. x2(t), resp. x3(t), resp. x4(t), množství juvenilních, resp. mladých, resp. plně plodných, resp. postmenopauzních, samic v čase t. Množství může vyjadřovat počet jedinců, ale také počet jedinců vztažených na jednotkový areál (tzv. populační hustotu), případně také celkovou biomasu a podobně. Dále označme p\ pravděpodobnost, že juvenilní samice přežije jednotkový časový interval a tedy během něho dospěje, a p2, resp. p3, pravděpodobnost, že během jednotkové doby mladá, resp. plně plodná, samice, která neuhyne, dospěje do následující kategorie, tj. mladá do plné plodnosti a plně plodná k menopauze. Dalším náhodným jevem je umírání (pozitivně řečeno: přežívání) samic, které nedospějí do další kategorie; označme pravděpodobnosti přežití po řadě q2, q3 a q4 pro mladé, plně plodné a postmenopauzní samice. Každé z čísel p\, p2, p3, q2, q3, q4 jakožto pravděpodobnost je z intervalu [0, 1]. Mladá samice může přežít, dospět do plné plodnosti nebo uhynout; tyto jevy jsou neslučitelné, společně tvoří jev jistý a možnost úmrtí nelze vyloučit. Platí tedy p2 + q2 < l.Z podobných důvodů platí p3 + q3 < 1. Nakonec ještě označíme f2, resp. /3 průměrný počet dcer mladé, resp. plně plodné, samice. Tyto parametry splňují nerovnost 0 < f2 < f3.
Očekávaný počet novorozených samic v následujícím časovém období je součtem dcer mladých a plně plodných samic, tj.
xx(t + 1) = f2X2(t) + f3X3(t).
Označme na okamžik x2ti(t + 1) množství mladých samic v čase t + 1, které byly v předchozím období, tj. v čase t juvenilními, a x2^2(t + 1) množství mladých samic, které již v čase t byly plodné, jednotkový časový interval přežily, ale nedosáhly plné plodnosti. Pravděpodobnost p\, že juvenilní samice přežije jednotkový časový interval, můžeme vyjádřit jako klasickou, tj. jako poměr x2t\(t + \)/x\(t), a podobně můžeme vyjádřit pravděpodobnost q2 jako poměr x2^2(t + \)/x2(t). Poněvadž mladé samice v čase t + 1 jsou právě ty, které dospěly z juvenilnŕho stádia, a ty, které již plodné byly, přežily a nedospěly k plné plodnosti, platí
x2(t + 1) = x2,i(ř + 1) +*2,2(ř + 1) = p\x\{f) +q2x2(t).
Analogicky odvodíme očekávaný počet plně plodných samic jako
x3(ř + 1) = p2x2(t) + q3x3(t)
a očekávaný počet postmenopauzních samic
x4(t + 1) = p3x3(t) + q4x4 (0-
185
F. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE
5. ROZKLADY MATIC A PSEUDOINVERZE
10
20
30
40
Obrázek i. Vývoj populace kosatky dravé. Na vodorovné ose je čas v letech, na svislé velikost populace. Jednotlivé plochy zobrazují množství j u venil-ních, mladých, plně plodných a postmenopauzních samic v tomto pořadí zdola.
Nyní můžeme označit
/O f2 h
A =
x(t)
(xx(t)\
x3(t) \x4(t) J
a předchozí rekurentní formule přepsat v maticovém tvaru
0\
Pl 2 0 0 0 P2 3 0
yo o p3 q4j
50
ObrKosatky
x(t + 1) = Ax(t).
Pomocí této maticové diferenční rovnice snadno spočítáme očekávané množství velrybích samic v jednotlivých plodnostních kategoriích, pokud známe složení populace v nějakém počátečním čase.
Konkrétně, pro populaci kosatek dravých byly odpozorovány populační parametry pi= 0,9775, ^2 = 0,9111, f2 = 0,0043, p2 = 0,0736, q3 = 0,9534. f3 = 0,1132, p3 = 0,0452, q4 = 0,9804; časovou jednotkou je v tomto případě jeden rok.
Začneme-li v čase t = 0 s jednotkovým množstvím mladých samic v nějakém neobsazeném
areálu, tj. s vektorem x(0) = (0, 1, 0, 0)T, můžeme spočítat
x(l)
/ 0 0,0043 0,1132 0 > /0\ f0,0043\
0,9775 0,9111 0 0 1 0,9111
0 0,0736 0,9534 0 0 0,0736
V 0 0 0,0452 0,9804y W v. 0 )
/ 0 0,0043 0,1132 0 \ //0,0043> /0,01224925\
0,9775 0,9111 0 0 0,9111 0,83430646
0 0,0736 0,9534 0 0,0736 0,13722720
V 0 0 0,0452 0,9804/ v0,00332672y
x(2)
a tak můžeme pokračovat dále. Výsledky výpočtu můžeme také znázornit graficky; to je provedeno na obrázku 1. Vyzkoušejte si výpočet a grafické znázornění jeho výsledků i pro jiné počáteční složení
186
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
populace. Výsledkem by mělo být pozorovaní, že celková velikost populace roste jako exponenciální funkce, poměry velikostí jednotlivých plodnostních tříd se postupně ustálí na konstantních hodnotách. Matice A má vlastní hodnoty
ki = 1,025441326, k2 = 0,980400000, k3 = 0,834222976, k4 = 0,004835698,
vlastní vektor příslušný k největší vlastní hodnotě k\ je
w = (0,03697187, 0,31607121, 0,32290968, 0,32404724);
tento vektor je normován tak, aby součet jednotlivých složek byl roven 1.
Porovnejte vývoj velikosti populace s exponenciální funkcí F(t) = k[x0, kde x0 je celková velikost počáteční populace. Vypočítejte také relativní zastoupení jednotlivých plodnostních kategorií v populaci po jisté době vývoje a porovnejte ho se složkami vlastního vektoru w. Shoda je způsobena pouze tím, že matice A má jednu vlastní hodnotu, která má absolutní hodnotu největší z absolutních hodnot všech vlastních hodnot matice A, a tím, že vektorový podprostor generovaný vlastními vektory příslušnými k vlastním hodnotám k2, k3, k4 má s nezáporným orthantem jednoprvkový průnik (pouze nulový vektor). Struktura matice A však sama nezaručuje takto jednoduše předvídatelný vývoj, je totiž tzv. reducibilní (viz ??).
3.56. Model růstu populace bodláků Dipsacus sylvestris. Tuto rostlinu můžeme vidět ve čtyřech podobách. Buď jako kvetoucí rostlinu nebo jako růžici listů, přičemž u růžic můžeme rozlišit trojí velikost - malé, střední a velké. Životní cyklus této jednodomé víceleté byliny můžeme popsat následovně.
Kvetoucí rostlina vyprodukuje v pozdním létě větší množství semen a uhyne. Ze semen některá vyklíčí ještě v temže roce a vyroste z nich růžice listů, nejčastěji střední velikosti. Jiná semena zůstanou v zemi a přezimují. Některá z přezimujících semen na jaře vyklíčí a vyroste z nich růžice listů; poněvadž jsou ale prezimovaním oslabena, bude tato růžice s nejvyšší pravděpodobností malá. Většina z přezimujících semen zůstane v zemi, a ta z nich, která přežijí, na jaře vyklíčí a vyrostou z nich malé růžice. Po třech nebo více zimách „spící" (odborně řečeno dormantní) semena hynou, ztrácí schopnost vyklíčit. Podle podmínek prostředí, kde rostlina roste, může malá nebo střední růžice listů do dalšího roku vyrůst, kterákoliv z růžic může zůstat ve své velikostní kategorii nebo uhynout - uschnout, být sežrána nějakým hmyzem a podobně. Střední nebo velká růžice může v následujícím roce vykvést. Kvetoucí rostlina produkuje semena a celý cyklus se opakuje.
Abychom mohli předpovídat, jak rychle se bude populace uvažovaných bodláků v krajině šířit, potřebujeme popsané procesy nějak kvantifikovat. Botanici zjistili, že kvetoucí rostlina vyprodukuje průměrně 431 semen. Pravděpodobnosti klíčení různých semen, růstu růžic listů a vykvetení jsou shrnuty v tabulce:
187
F. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE
5. ROZKLADY MATIC A PSEUDOINVERZE
jev
pravděpodobnost
semeno vyprodukované rostlinou uhyne
ze semene vyroste malá růžice v temže roce
ze semene vyroste střední růžice v temže roce
ze semene vyroste velká růžice v temže roce
ze semene přezimujícího rok vyroste malá růžice
ze semene přezimujícího rok vyroste střední růžice
ze semene přezimujícího rok vyroste velká růžice
ze semene přezimujícího dva roky vyroste malá růžice
semeno po prvním prezimovaní uhyne
malá růžice přežije a nevyroste
střední růžice přežije a nevyroste
velká růžice přežije a nevyroste
z malé růžice vyroste střední
z malé růžice vyroste velká
ze střední růžice vyroste velká
střední růžice vykvete
velká růžice vykvete
0,172 0,008 0,070 0,002 0,013 0,007 0,001 0,001 0,013 0,125 0,238 0,167 0,125 0,036 0,245 0,023 0,750
Povšimněme si, že všechny relevantní jevy v životním cyklu rostliny mají pravděpodobnost přiřazenu a že se jedná o jevy neslučitelné.
Budeme si představovat, že populaci pozorujeme vždycky na začátku vegetačního roku, řekněme v březnu, a že ke všem uvažovaným jevům dochází ve zbytku času, dejme tomu od dubna do února. V populaci se vyskytují kvetoucí rostliny, růžice tří velikostí, vyprodukovaná semena a semena dor-mantní jeden nebo dva roky. Toto pozorování by mohlo svádět k tomu, že populaci rozdělíme do sedmi tříd - semena čerstvá, dormantní první rok a dormantní druhý rok, růžice malé střední a velké, kvetoucí rostliny. Avšak z vyprodukovaných semen se v temže roce vyvinou buď růžice nebo semena přezimují. Čerstvá semena tedy netvoří samostatnou třídu, jejíž velikost bychom na začátku roku
mohli určit. Označme tedy:
%\ (ŕ) — počet semen dormantních první rok na jaře roku ř
*2(0 — počet semen dormantních druhý rok na jaře roku ř
x3(t) — počet malých růžic na jaře roku t
x4(t) — počet středních růžic na jaře roku t
x5(t) — počet velkých růžic na jaře roku t
x6(t) — počet kvetoucích rostlin na jaře roku t Počet vyprodukovaných semen v roce t je 431x6(ř). Pravděpodobnost, že semeno zůstane jako dormantní první rok, je rovna pravděpodobnosti, že ze semena nevyroste žádná růžice a že neuhyne, tedy 1 - (0,008 + 0,070 + 0,002 + 0,172) = 0,748. Očekávaný počet semen dormantních jednu zimu v následujícím roce tedy je
Pravděpodobnost, že semeno, které již jeden rok bylo dormantní, zůstane dormantním i druhý rok je rovna pravděpodobnosti, že ze semena dormantnŕho jeden rok nevyroste žádná růžice a že neuhyne, tedy 1 — 0,013 — 0,007 — 0,001 — 0,013 = 0,966. Očekávaný počet semen dormantních dvě zimy v následujícím roce tedy bude
Malá růžice může vyrůst ze semena bezprostředně, ze semena dormantního jeden rok nebo dormantního dva roky. Očekávaný počet malých růžic vyrostlých bezprostředně v roce t je roven
xi(t + 1) = 0,748 • 431x6(ř) = 322,388x6(ř).
x2(t + 1) = 0,966x!(ř).
188
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
0,008 • 431x6(ŕ) = 3,448x6(ŕ). Očekávaný počet malých růžic vyrostlých ze semen dormantních jeden a dva roky je 0,013xi (ř) a 0,010x2(ŕ). S těmito nově vyrostlými malými růžicemi jsou v populaci rostlin také malé růžice starší, které nevyrostly; těch je 0,125x3(r). Celkový očekávaný počet malých růžic tedy je
x3(r + 1) = 0,013x^0 + 0,010x2(r) + 0,125x3(r) + 3,448x6(r). Analogicky určíme očekávaný počet středních a velkých růžic
x4(t + 1) =0,007x^0 + 0,125x3(ř) + 0,238x4(r) + 0,070 • 431x6(r) = =0,007xi (ř) + 0,125x3 (ř) +0,238x4(ř) + 30,170x6,
x5(ř + 1) =0,245x4(ř) +0,167x5(ř) +0,002 • 431x6(ř) =
=0,245x4 (ř) +0,167x5 (ř) +0,862x6(ř).
Kvetoucí rostlina může vyrůst ze střední nebo velké růžice. Očekávaný počet kvetoucích rostlin tedy bude
x6(ř + 1) = 0,023x4(ř) + 0,750x5 (ř).
Dospěli jsme tedy k šesti rekurentním formulím pro jednotlivé složky populace studované rostliny. Označíme nyní
/ 0 0 0 0 0 322,388\ íxx(t)\
0,966 0 0 0 0 0
0,013 0,010 0,125 0 0 3,448 , x(t) = x3(ř)
0,007 0 0,125 0,238 0 30,170 x4(ř)
0,008 0 0,038 0,245 0,167 0,862 *s(0
V 0 0 0 0,023 0,750 o ) \*6(0 /
a předchozí rovnosti zapíšeme v maticovém tvaru vhodném pro výpočet
x(ř + 1) = Ax(ř).
Pokud známe počty jednotlivých složek populace v nějakém počátečním roce t = 0, můžeme vypočítat očekávané počty rostlin a semen v letech následujících. Můžeme také počítat celkový počet jedinců
6
n(t) v čase t, n(t) = ^ Xi(t), relativní zastoupení jednotlivých složek Xi(t)/n(t), i = 1, 2, 3, 4, 5, 6
i=\
a meziroční relativní změnu populace n(t + \)/n(t). Výsledky takového výpočtu pro patnáct let a
případ, že na nějakou lokalitu jsme přesadili jednu kvetoucí rostlinu, jsou uvedeny v tabulce 1. Na
rozdíl od populace velryb by nyní obrázek nebyl příliš přehledný, počty rostlin jsou oproti počtům
semen zanedbatelné, v obrázku by splynuly.
Matice A má vlastní hodnoty X.i = 2,3339
X2 = -0,9569 + 1,4942i A3 = -0,9569 - 1,4942i Vlastní vektor příslušný k vlastní hodnotě k\ je
A-4
A6
0,1187 + 0,1953i 0,1187 -0,1953i -0,1274
w
(0,6377, 0,2640, 0,0122, 0,0693, 0,0122, 0,0046);
tento vektor je normován tak, aby součet jeho složek byl roven jedné. Vidíme, že s rostoucím časem t se relativní změna velikosti populace přibližuje vlastní hodnotě k\, relativní zastoupení jednotlivých složek populace se přibližují složkám normovaného vlastního vektoru příslušného k vlastní hodnotě
189
F. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE
5. ROZKLADY MATIC A PSEUDOINVERZE
t XI x2 x3 X4 x5 Xg n{t) 1
0 0,00 0,00 0,00 0,00 0,00 1,00 1,00
1 322,39 0,00 3,45 30,17 0,86 0,00 356,87
2 0,00 311,43 4,62 9,87 10,25 1,34 337,50
3 432,13 0,00 8,31 43,37 5,46 7,91 497,18
4 2550,50 417,44 33,93 253,07 22,13 5,09 3 282,16
5 1 641,69 2463,78 59,13 235,96 91,78 22,42 4514,76
6 7 227,10 1585,88 130,67 751,37 107,84 74,26 9 877,12
7 23 941,29 6981,37 382,20 2486,25 328,89 98,16 34 218,17
8 31646,56 23 127,29 767,29 3 768,67 954,73 303,85 60 568,39
9 97 958,56 30570,58 1 786,27 10381,63 1 627,01 802,72 143 126,78
10 258 788,42 94627,97 4570,24 27 597,99 4358,70 1 459,04 391 402,36
11 470376,19 249 989,61 9 912,57 52970,28 10991,08 3 903,78 798 143,52
12 1258 532,41 454383,40 23 314,10 134915,73 22317,98 9 461,62 1 902 925,24
13 3 050314,29 1215 742,31 56442,70 329 291,15 55 891,57 19 841,54 4727 523,56
14 6396675,73 2946603,60 127 280,49 705 398,22 133 660,97 49 492,37 10359 111,38
15 15 955 747,76 6179188,75 299182,59 1 721 756,52 293 816,44 116469,89 24566161,94
*2(0 x3(ř) x4(ř) *s(0 x6(t) n(t + 1)
ř n(t) n(t) n(t) n(t) n(t) n(t) n(t)
0 0,000 0,000 0,000 0,000 0,000 1,000 356,868
1 0,903 0,000 0,010 0,085 0,002 0,000 0,946
2 0,000 0,923 0,014 0,029 0,030 0,004 1,473
3 0,869 0,000 0,017 0,087 0,011 0,016 6,602
4 0,777 0,127 0,010 0,077 0,007 0,002 1,376
5 0,364 0,546 0,013 0,052 0,020 0,005 2,188
6 0,732 0,161 0,013 0,076 0,011 0,008 3,464
7 0,700 0,204 0,011 0,073 0,010 0,003 1,770
8 0,522 0,382 0,013 0,062 0,016 0,005 2,363
9 0,684 0,214 0,012 0,073 0,011 0,006 2,735
10 0,661 0,242 0,012 0,071 0,011 0,004 2,039
11 0,589 0,313 0,012 0,066 0,014 0,005 2,384
12 0,661 0,239 0,012 0,071 0,012 0,005 2,484
13 0,645 0,257 0,012 0,070 0,012 0,004 2,191
14 0,617 0,284 0,012 0,068 0,013 0,005 2,371
15 0,650 0,252 0,012 0,070 0,012 0,005
Tabulka 1. Modelovaný vývoj populace bodláku Dipsacus sylvestris. Velikosti jednotlivých složek populace, celková velikost populace, relativní zastoupení jednotlivých složek a relativní přírůstky velikosti.
X\. Každá nezáporná matice, která má nenulové prvky na stejných pozicích jako matice A je primitivní. Vývoj populace tedy zákonitě spěje ke stabilizované struktuře.
3.57. Nelineární model populace. Prozkoumejte podrobně vývoj populace pro nelineární model z učebnice (1.12) a hodnoty K = 1 a
i) míru růstu r = 1 a počáteční stav p(l) = 0,2
Ü) míru růstu r = 1 a počáteční stav p(\) = 2
iii) míru růstu r = 1 a počáteční stav p(\) = 3
iv) míru růstu r = 2, 2 a počáteční stav p(\) = 0,2
v) míru růstu r = 3 a počáteční stav p(\) = 0,2
Spočítejte několik prvních členů a odhadněte, jak bude populace dále růst. Řešení.
190
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
i) Prvních deset členů posloupnosti p(n) je v následující tabulce. Odtud je vidět, že velikost populace konverguje k hodnotě 1.
n P(n)
1 0,2
2 0,36
3 0,5904
4 0,83222784
5 0,971852502
6 0,999207718
7 0,999999372
Graf vývoje populace pro r = 1 a p(\) = 0, 2:
ii) Pro počáteční hodnotu p(\) =2 dostaneme p(2) = 0 a dál už se populace měnit nebude.
iii) Pro p(\) = 3 dostáváme
n P(n)
1 3
2 -15
3 -255
4 -65535
a odtud je vidět, že populace bude klesat pode všechny meze. iv) Pro míru růstu r = 2, 2 a počáteční stav p(\) = 0, 2 dostáváme
n P(n)
1 0,2
2 0,552
3 1,0960512
4 0,864441727
5 1,122242628
6 0,820433675
7 1,144542647
8 0,780585155
9 1,157383491
10 0,756646772
11 1,161738128
12 0,748363958
!3 1,162657716
14 0,74660417
Vidíme, že místo konvergence dostáváme v tomto případě oscilaci-po nějaké době bude populace přeskakovat mezi hodnotami 1,16 a 0,74. Graf vývoje populace pro r = 2, 2 a p(\) = 0, 2 pak vypadá následovně: v) Pro míru růstu r = 3 a počáteční stav p(\) = 0, 2 dostáváme
191
F. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE
5. ROZKLADY MATIC A PSEUDOINVERZE
n P(n)
1 0,2
2 0,68
3 1,3328
4 0,00213248
5 0,008516278
6 0,033847529
7 0,131953152
8 0,475577705
9 1,223788359
10 0,402179593
11 1,123473097
12 0,707316989
13 1,328375987
14 0,019755658
15 0,077851775
16 0,293224403
17 0,91495596
18 1,148390614
19 0,63715945
20 1,330721306
21 0,010427642
22 0,041384361
23 0,160399447
V tomto případě je už situace složitější-populace začne oscilovat mezi více hodnotami. Abychom lépe viděli mezi kterými, bylo by potřeba spočítat ještě víc členů. Pro členy z tabulky máme následující graf
□
3.58. V laboratoři je prováděn pokus se stejnou pravděpodobností úspěchu i neúspěchu. Pokud se pokus podaří, bude pravděpodobnost úspěchu druhého pokusu 0, 7. Jestliže skončí první pokus neúspěchem, bude pravděpodobnost úspěchu druhého pokusu pouze 0, 6. Dále se bude pokračovat v provádění pokusů, kdy úspěšnost předešlého znamená, že pravděpodobnost úspěchu následujícího bude 0, 7, a jeho neúspěšnost způsobí, že pravděpodobnost úspěchu následujícího bude 0, 6. Pro libovolné n e N stanovte pravděpodobnost, že n-tý pokus se podaří.
Řešení. Zaveďme pravděpodobnostní vektor
x» = fo1.^)7". «eN,
kde x\ je pravděpodobnost úspěchu n-tého pokusu a x2 = \ —x\ je pravděpodobnost jeho neúspěchu. Podle zadání je
a zřejmě také
_ /0, 7 0, 6\ /l/2\ _ /l3/20\ Xl ~ V0, 3 0, 4J ' \l/2 )-\ 7/20 ) ■
Při označení
/7/10 3/5\ V3/10 2/5J
192
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
platí
ves013666
(3.7)
*■« + !
T-x„, n e N,
ves013665
neboť pravděpodobnostní vektor xn+\ závisí pouze na xn a tato závislost je totožná jako pro x2 a.x\. Ze vztahu (3.7) bezprostředně plyne
(3.8)
T T x,
n-l
Tn-xu n > 2, n e N.
Proto vyjádříme T", n e N. Jedná se o Markovův proces, a tudíž je 1 vlastní číslo matice T. Druhé vlastní číslo 0, 1 vyplývá kupř. z toho, že stopa (součet prvků na diagonále) je rovna součtu všech vlastních čísel (každé vlastní číslo bereme tolikrát, jaká je jeho algebraická násobnost). Těmto vlastním číslům pak přísluší vlastní vektory
Dostáváme tak T =
tj. pro n e N je
1
1 o 0 1/10
1 o
0 1/10
1" o
0 10""
Dosazení
a roznásobení dává
1 (2 +10-3 V1 " 10~
Odtud, z (3.7) a (3.8) plyne
1
-i' 3 U
2 - 2 • 10"" 1 + 2 • 10""
1 1 3 + 6-10"
n e N.
n e N.
6-10"
Zvláště vidíme, že pro velká n je pravděpodobnost úspěchu n-tého pokusu blízká 2/3.
□
3.59. Student na koleji je značně společensky unaven (v důsledku toho není schopen plně vnímat smyslové podněty a koordinovat své pohyby). V tomto stavu se přesto rozhodne, že na právě probíhající večírek pozve známou, která má pokoj na jednom konci chodby. Na opačném konci chodby však bydlí někdo, koho pozvat rozhodně nehodlá. Je ovšem natolik „unaven", že rozhodnutí udělat krok zvoleným směrem se mu podaří realizovat pouze v 53 ze 100 pokusů (ve zbylých 47 jde přesně na opačnou stranu). Za předpokladů, že vyjde v polovině chodby a že vzdálenost k oběma dveřím na koncích chodby odpovídá jeho 20 krokům, stanovte pravděpodobnost, že nejdříve dorazí ke správným dveřím.
193
F. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE
5. ROZKLADY MATIC A PSEUDOINVERZE
3.60. Nechť n e N osob hraje tzv. tichou poštu. Pro jednoduchost předpokládejte, že první osoba zašeptá druhé právě jedno (libovolně zvolené) ze slov „ano", „ne". Druhá osoba pak potichu řekne třetí osobě to ze slov „ano", „ne", o kterém si myslí, že ho řekla první osoba. Takto to pokračuje až k n-té osobě. Jestliže pravděpodobnost toho, že při libovolném předání se zamění (nechtě, úmyslně) šířené slovo na to druhé, je p e (0, 1), stanovte pro velká n e N pravděpodobnost, že n-tá osoba určí správně slovo zvolené první osobou.
Řešení. Na tuto úlohu lze nahlížet jako na Markovův řetězec se dvěma stavy nazvanými Ano a Ne, kdy řekneme, že proces je ve stavu Ano v čase m e N, pokud si m-tá osoba bude myslet, že předávané slovo je „ano". Pro pořadí stavů Ano, Neje pravděpodobnostní matice přechodu
Součin matice Tm~ a pravděpodobnostního vektoru počáteční volby první osoby potom udává pravděpodobnosti toho, co si bude myslet m-tá osoba. Mocniny této matice ovšem počítat nemusíme, neboť všechny prvky matice T jsou kladná čísla. Navíc tato matice je dvojnásobně stochastická. Víme tudíž, že pro velká n e N bude pravděpodobnostní vektor blízký vektoru (1/2, 1 /2)T. Pravděpodobnost, že n-tá osoba řekne „ano", je proto přibližně stejná jako pravděpodobnost, že řekne „ne", a to nezávisle na tom, pro které slovo se rozhodla první osoba. Pro velký počet zúčastněných tak platí, že zhruba polovina z nich uslyší „ano" (zopakujme, že nezávisle na tom, které slovo bylo na začátku vybráno).
Pro úplnost zjistěme, jak by úloha dopadla, kdybychom předpokládali, že pravděpodobnost záměny „ano" na „ne" je u libovolné osoby p e (0, 1) a pravděpodobnost záměny „ne" na „ano" je obecně odlišné q e (0, 1). V tomto případě pro stejné pořadí stavů dostáváme pravděpodobnostní matici přechodu
Rovněž tentokrát při dostatečném počtu lidí nezáleželo na volbě slova, kterou učinila první osoba. Stručně řečeno, v tomto modelu platí, že nezáleží na původním rozhodnutí, protože o tom, jakou informaci si lidé předávají, rozhodují oni sami; přesněji řečeno, lidé sami rozhodují o četnosti výskytu „ano" a „ne", pokud je jich dostatečný počet (a chybí-li jakékoli ověřování).
Doplňme ještě, že výše uvedený závěr byl experimentálně ověřen. V psychologických pokusech byl mj. jedinec opakovaně vystaven vjemu, který šlo vnímat dvěma různými způsoby, a to v časových intervalech zaručujících, aby si subjekt pamatoval předešlý vjem. Viz např. „T. Havránek a kol.: Matematika pro biologické a lékařské vědy, Praha, Academia 1981", kde je uveden experiment, v němž je zábleskem osvětlován v pevných časových odstupech nejednoznačný obraz (třeba náčrt krychle vnímatelný jako nadhled i podhled). Takový proces je totiž Markovovým řetězcem s maticí přechodu
která vede (pro velká n e N) k pravděpodobnostnímu vektoru blízkému vektoru
\p + q p + q což kupř. plyne z vyjádření matice
kde p,q e (0, 1).
□
194
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
3.61. V jisté hře si můžete vybrat jednoho ze dvou soupeřů. Pravděpodobnost, že porazíte lepšího, je 1/4, zatímco horšího ze soupeřů porazíte s pravděpodobností 1/2. Soupeři ale nejsou rozlišeni, a tak nevíte, který z nich je ten lepší. Čeká Vás velké množství her (pro každou můžete zvolit jiného soupeře) a samozřejmě chcete dosáhnout celkově co největšího podílu vítězných her. Uvažte tyto dvě strategie:
1. Pro první hru si vyberete soupeře náhodně. Pokud nějakou hru vyhrajete, pokračujete se stejným soupeřem; jestliže ji prohrajete, změníte pro další hru soupeře.
2. Pro první dvě hry si vyberete (jednoho) soupeře náhodně. Dále se řídíte výsledkem předchozích dvou her, kdy na další dvě hry změníte soupeře, právě když obě předchozí prohrajete.
Kterou ze strategií (moudře) zvolíte?
Řešení. Obě strategie jsou vlastně Markovovým řetězcem. Pro jednoduchost horšího ze soupeřů označujme jako osobu A a lepšího ze soupeřů jako osobu B. V prvním případě pro stavy „hra s osobou A", „hra s osobou 5" (a toto jejich pořadí) dostáváme pravděpodobnostní matici přechodu
'1/2 3/4^ ,1/2 1/4,
Tato matice má všechny prvky kladné, a proto stačí najít pravděpodobnostní vektor x^, který přísluší vlastnímu číslu 1. Platí
3 2X T
.5 5,
Jeho složky odpovídají pravděpodobnostem, že po dlouhé řadě her bude soupeřem osoba A, resp. B.
Lze tedy očekávat, že 60 % her bude hráno proti horšímu ze soupeřů. Neboť
2 _ 3 1 2 1
5 = 5 ' 2 + 5 ' 4' vítězných her bude kolem 40 %.
Pro druhou strategii zaveďme stavy „dvě hry po sobě s osobou A" a „dvě hry po sobě s osobou 5",
které vedou na pravděpodobnostní matici přechodu
'3/4 9/16N 1/4 1/16,
Snadno určíme, že nyní je
9 4 13' 13,
Proti horšímu ze soupeřů by se tak hrálo (9/4)krát častěji než proti lepšímu z nich. Připomeňme, že
pro první strategii to bylo (3/2)krát častěji. Druhá strategie je proto výhodnější. Ještě poznamenejme,
že při druhé strategii bude přibližně 42,3 % her vítězných. Stačí totiž vyčíslit
11 9 1 4 1
0, 423 = — =---+---.
26 13 2 13 4
□
3.62. Petr se pravidelně setkává se svým kamarádem. Je ovšem „proslulý" svou nedochvilností. Snaží se ale změnit, a proto platí, že v polovině případů přijde včas a v jedné desetině případů dokonce ještě dříve, pokud na minulé setkání přišel pozdě. Jestliže minule přišel včas nebo dříve, než měl přijít, vrátí se ke své „bezstarostnosti" a s pravděpodobností 0,8 dorazí pozdě a pouze s pravděpodobností 0,2 včas. Jaké je pravděpodobnost, že na dvacáté setkání přijde pozdě, když na jedenácté přišel včas?
195
F. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE
5. ROZKLADY MATIC A PSEUDOINVERZE
Řešení. Zřejmě se jedná o Markovův proces se stavy „Petr přijde pozdě", „Petr přijde včas", „Petr přijde dříve" a s pravděpodobnostní maticí přechodu (pro uvedené pořadí stavů)
/0,4 0,8 0, 8\ T = 0,5 0,2 0,2 . \0, 1 0 0/
Jedenácté setkání je určeno pravděpodobnostním vektorem (0, 1, 0)T (s jistotou víme, že Petr přišel včas). Dvacátému setkání pak odpovídá pravděpodobnostní vektor
/0\ /0,571578 368\ T9 1 = 0,371316 224 . \0/ \0, 057 105 408/
Hledaná pravděpodobnost je tudíž 0, 571 578 368 (přesně). Dodejme, že je
/0, 571 316224 0,571578 368 0,571578 368\ T9 = 0,371512832 0,371316224 0,371316224 . \0,057170944 0,057105 408 0,057105 408/
Odtud vidíme, jak málo záleží na tom, zda přišel na jedenácté setkáni pozdě (první sloupec), včas nebo dříve (druhý a současně třetí sloupec). □
3.63. Dva studenti A a S tráví každé pondělní odpoledne hraním jisté počítačové hry o to, kdo z nich večer zaplatí společnou útratu v restauraci. Hra může rovněž skončit remízou, kdy večer oba platí právě polovinu útraty. Výsledek předešlé hry částečně ovlivňuje hru následující. Pokud tedy před týdnem vyhrál student A, potom s pravděpodobností 3/4 vyhraje opět a s pravděpodobností 1 /4 skončí hra remízou. Remíza se opakuje s pravděpodobností 2/3 a s pravděpodobností 1 /3 vyhraje ve hře následující po remíze student B. Pokud před týdnem vyhrál student B, pak s pravděpodobností 1 /2 své vítězství zopakuje a s pravděpodobností 1/4 vyhraje student A. Nalezněte pravděpodobnost, že dnes bude každý platit polovinu útraty, jestliže první hru před velmi dlouhou dobou vyhrál student A.
Řešení. Vlastně je zadán Markovův proces se stavy „vyhraje student A", „hra skončí remízou", „vyhraje student 5" (v tomto pořadí) pravděpodobnostní maticí přechodu
/3/4 0 l/4\ T = 1/4 2/3 1/4 . V 0 1/3 1/2/
Chceme najít pravděpodobnost přechodu z prvního stavu do druhého po velkém počtu n e N kroků (týdnů). Matice T je regulární, protože
/ 9/16 1/12 5/16 \ T2 = 17/48 19/36 17/48 . \ 1/12 7/18 1/3 /
Stačí tak najít vlastní pravděpodobnostní vektor x^ matice T příslušný vlastnímu číslu 1. Snadno lze spočítat, že
_ /2 3 2
x°° ~ Vř r 7
Víme, že vektor x^ se jen velmi málo liší od pravděpodobnostního vektoru pro velká n a téměř nezávisí na počátečním stavu, tj. pro velká n e N můžeme klást
/2/7 2/7 2/7\ T" « 3/7 3/7 3/7 . \2/7 2/7 2/7/
196
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET_
Hledaná pravděpodobnost je prvkem této matice na druhé pozici v prvním sloupci (je druhou složkou vektoru jc^). Poměrně rychle jsme nalezli výsledek 3/7. □
197
f. doplňující príklady k cele kapitole
5. rozklady matic a pseudoinverze
3.9.
2\/3 sin(n • (tt/6)) — 4cos(n • (jr/6)). -3(-l)" - 2cos(« • (2tt/3)) - 2v/3sin(« • ((2tt/3)). (-l)"(-2«2 + 8n -7).
2aX — 2a
3.10. xn
3.11. x„
3.12. x„
3.20. Leslieho matice daného modeluje (úmrtnost v první skupině označíme a)
'0 2 2\ a 0 0 ^0 1 0)
Podmínka stagnace populace odpovídá tomu, že matice má vlastní hodnotu 1, neboli polynom X3 má mít kořen 1, t.j a = 1/4. 3.23.
1 5
4
5
Matice má dominantní vlastní hodnotu 1, příslušný vlastní vektor je (|, 1). Protože je vlastní hodnota dominantní, tak se poměr diváků se ustálí na poměru 6:5.
3.26. Stejně jako v (3.25) skončí hra po třech sázkách. Jsou tedy opět všechny mocniny A, počínaje A3 shodné.
> 100
3.36. Můžeme využít výsledku úlohy označované jako Ruinovaní hráče. Pravděpodobnost, že zanikne to oddělení, které má nyní 40 zaměstnanců, je podle tohoto příkladu rovna
1 _ f 0.46 f 1 \ 1-0,46,/
/l 7/8 3/4 1/2 o\
0 0 0 0 0
0 0 0 0 0
0 0 0 0 0
\o 1/8 1/4 1/2 1/
,25
= 0, 56.
1 _ / 0.46 \ 1 \ 1-0,46,/
Stačilo dosadit p = 1 — 0, 54, y = 10/2 a x = 40/2 do (3.6). Prozíravější je tedy zvolit v tuto chvíli menší
oddělení. 3.44.
• Tvrzení je pravdivé. (B := A A, bij = (i-tý řádek A ) • (j-tý sloupec A)= bji = (j-tý řádek AT) ■ (i-tý sloupec A)=(j-tý sloupec A) ■ (i-tý řádek AT)
Tvrzení zřejmě neplatí. Uvažte např. A
n 1 .0 1
3.46.
1 / \0 0 0
3.59. Znovu se jedná o speciální případ Ruinovaní hráče. Stačí zadání vhodně přeformulovat. Pro p = 0, 47, y = 20 a x = 20 z (3.6) plyne výsledek
.20
1
0,917 = -
1
V 1-0,47)
v 1-0,47 J
198
KAPITOLA 4
Analytická geometrie
poloha, incidence, projekce ? — a zase skončíme u matic...
. 1
Vrátíme se teď k našemu pohledu na geometrii, když jsme zkoumali polohy bodů v rovině v 5. části první kapitoly, viz 1.23. Budeme se nejprve zajímat o vlastnosti prostorových objektů vymezených pomocí bodů, přímek, rovin apod. Podstatné přitom bude vyjasnění, jak jejich vlastnosti souvisí s pojmem vektorů a zda závisí na pojmu velikosti vektorů.
V další části pak použijeme lineární algebru pro studium objektů, které už lineárně definované nejsou. Opět přitom budeme potřebovat trochu více maticového počtu. Výsledky budou důležité později při diskusi technik pro optimalizace, tj. hledání extrémů funčkních hodnot.
Projektivní rozšíření afinních prostorů nám v závěru kapitoly ukáže, jak lze překvapivě snadno dosáhnout zjednodušení i stability algoritmických postupů typických pro práci s počítačovou grafikou.
1. Afinní a euklideovská geometrie
Když jsme si ujasňovali strukturu řešení systémů lineárních rovnic v první části předchozí kapitoly, zjistili jsme v ostavci 3.1, že všechna řešení ne-'s^zzz homogenních systémů rovnic sice netvoří vektorové podprostory, vždy ale vznikají tak, že k jednomu jedinému řešení přičteme celý vektorový prostor řešení příslušné homogenní soustavy. Naopak, rozdíl dvou řešení nehomogenní soustavy je vždy řešením soustavy homogenní. Obdobně se chovají lineární diferenční rovnice, jak jsme již viděli v odstavci 3.14.
4.1. Afinní prostory. Návod na teoretické uchopení takové situace dává již diskuse geometrie roviny, viz odstavec 1.25 a dále. Tam jsme totiž popisovali přímky a body jako množiny řešení systémů lineárních rovnic. Přímka pro nás pak byla „jednorozměrným" prostorem, přestože její body byly popisovány dvěmi souřadnicemi. Parametricky jsme ji zadávali tak, že k jednomu bodu (tj. dvojici souřadnic) jsme přičítali násobky pevně zvoleného směrového vektoru. Stejně budeme postupovat i teď v libovolné dimenzi.
i^_J Standardní afinní prostor [ Standarní afinní prostor A„ je množina všech bodů v W = A„ spolu s operací, kterou k bodu A = («1, ..., an) e A„ a vektoru v = (v\, ..., vn) e W = V
A. Afinní geometrie 4.1. Napište parametrické vyjádření přímky určené v M3 rovnicemi
x - 2y + z = 2, 2x + y - z = 5.
Řešení. Zřejmě postačuje vyřešit uvedenou soustavu rovnic. Můžeme ale postupovat také odlišně. Potřebujeme totiž najít nenulový (směrový) vektor, který bude kolmý na (normálové) vektory (1, —2, 1), (2, 1, —1). Vektorový součin
(1, -2, 1) x (2, 1, -1) = (1,3,5) ovšem takový vektor dává. Všimneme-li si, že např. uspořádaná trojice
(x, y, z) = (2,-1,-2) vyhovuje dané soustavě, dostaneme výsledek
[2,-1,-2]+ t (1,3, 5), íel.
□
4.2. V M4 je parametricky dána rovina
q : [0, 3, 2, 5] + t (1, 0, 1, 0) + s (2, -1, -2, 2), í,sel Vyjádřete tuto rovinu implicitně.
199
A. AFINNÍ GEOMETRIE
1. AFINNÍ A EUKLIDEOVSKÁ GEOMETRIE
Řešení. Úkolem je najít soustavu lineárních rovnic čtyř proměnných x, y, z, u (čtyři proměnné jsou dány dimenzí prostoru), jíž budou vyhovovat právě souřadnice bodů uvedené roviny. Poznamenejme, že hledaná soustava bude obsahovat 2 = 4—2 lineárně nezávislé rovnice. Příklad vyřešíme tzv. eliminací parametrů. Body [x, y, z, u] e q splňují
x = t + 2s,
y = 3 — s,
z = 2 + t - 2s,
u = 5 + 2s,
přičemž í,s é1. Odtud můžeme ihned přejít k maticovému zápisu
/1 2 -1 0 0 0 0 \
0 -1 0 -1 0 0 3
1 -2 0 0 -1 0 2
\o 2 0 0 0 -1 5/
kde první dva sloupce jsou směrové vektory roviny, za svislou čarou následuje záporně vzatá jednotková matice a za druhou svislou čarou jsou souřadnice bodu [0, 3, 2, 5]. Tento přepis vzniká tak, že na výše uvedenou soustavu rovnic nahlížíme jako na soustavu rovnic pro neznámé t, s, x, y, z, u a všechny členy přitom převádíme na jednu stranu rovnic. Získanou matici převedeme pomocí elementárních řádkových transformací do tvaru, kdy před první svislou čarou bude maximální možný počet nulových řádků. Přičtením (—1)násobku prvního a současně (—4)násobku druhého řádku ke třetímu řádku a dvojnásobku druhého ke čtvrtému řádku dostáváme
/1 2 -1 0 0 0 0 \
0 -1 0 -1 0 0 3
1 -2 0 0 -1 0 2
\0 2 0 0 0 -1 5 )
/1 2 -1 0 0 0 0
0 -1 0 -1 0 0 3
0 0 1 4 -1 0 -10
\0 0 0 -2 0 -1 11 )
Odkud plyne výsledek
x + 4y - z - 10= 0,
-2y - u + 11 = 0.
Koeficienty za první svislou čarou v řádcích, které jsou před touto svislou čarou nulové, určují totiž koeficienty obecných rovnic roviny.
Upozorněme, že kdybychom např. přepsali soustavu rovnic do matice
/1 0 0 0 1 2 0 \
0 1 0 0 0 -1 3
0 0 1 0 1 -2 2
0 0 1 0 2 5/
přiřadíme bod
A + v = (a\ + v\, ..., a„ + v„) ě8" = A„. Tyto operace splňují následující tři vlastnosti:
(1) A + 0 = A pro všechny body A e A„ a nulový vektor Oeľ,
(2) A + (v+w) = (A+v)+w pro všechny vektory v, w e V a body A e A„,
(3) pro každé dva body A, B e A„ existuje právě jeden vektor v e V takový, že A + v = B. Značíme jej v = B — A, někdy také AB.
Vektorový prostor W nazýváme zaměření standardního afinního prostoru A„.
Všimněme si několika formálních nebezpečí. Používáme ^ stejný symbol „+" pro dvě různé operace: ''SCLÄI' přičtení vektoru ze zaměření k bodu v afinním ^^SsS=Z£ prostoru, ale také sčítání vektorů v zaměření V = W. Také nezavádíme zvláštní písmena pro samotnou množinu bodů afinního prostoru, tj. A„ pro nás představuje jak samotnou množinu bodů, tak i celou strukturu definující afinní prostor.
Proč vlastně chceme rozlišovat množinu bodů prostoru A„ od jeho zaměření V, když se jedná jakoby o stejné W? Jde o velice podstatný formální krok k pochopení geometrie v W: Geometrické objekty jako přímky, body, roviny apod. nejsou totiž přímo závislé na vektorové struktuře na množině W a už vůbec ne na tom, že pracujeme s «-ticemi skalárů. Potřebujeme jen umět říci, co to znamená pohybovat se „rovně v daném směru". K tomu právě potřebujeme na jedné straně vnímat třeba rovinu jako neohraničenou desku bez zvolených souřadnic, ale s možností posunout se o zadaný vektor. Když přejdeme navíc k takovému abstraktnímu pohledu, budeme umět diskutovat „rovinnou geometrii" pro dvourozměrné podprostory, tj. roviny ve vícerozměrných prostorech, „prostorovou" pro třírozměrné atd., aniž bychom museli přímo manipulovat /c-ticemi souřadnic.
Tento pohled je zachycen v následující definici:
4.2. Definice. Afinním prostorem A se zaměřením V rozumíme množinu bodů V, spolu se zobrazením
V x V V, (A,v) ^ A + v,
kde V je vektorový prostor a naše zobrazení splňuje vlastnosti (l)-(3) z definice standardního afinního prostoru.
Pro libovolný pevně zvolený vektor v e V je tak definováno posunutí rv : A —> „4 jako zúžené zobrazení
rv : V ~ V x {v} V, A ^ A + v.
Dimenzí afinního prostoru A rozumíme dimenzi jeho zaměření.
Nadále nebudeme rozlišovat ve značení důsledně množinu bodů A a množinu vektorů V, budeme místo toho hovořit o bodech a vektorech afnního prostoru A.
4 . la
200
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
Z axiomů okamžitě plyne pro libovolné body A, B, C v afinním prostoru A
ľ] (4.1) A - A = 0 e V
U (4.2) B - A = -(A - B)
T\ (4.3) (C - B) + (B - A) = C - A.
Skutečně, (4.1) vyplýva z toho, že A + 0 = 0 a takový vektor musí být jednoznačný (první a třetí definiční vlastnost). Postupným přičtením B — A a. A — B k A (v uvedeném pořadí), zjevně dostaneme podle druhé definiční vlastnosti opět A, tedy jsme přičetli nulový vektor a to dokazuje (4.2). Obdobně z definiční vlastnosti 4.1 (2) a jednoznačnosti vyplýva (4.3).
Všimněme si, že volba jednoho pevného bodu Aq e A nám určuje bijekci mezi V a A. Při volbě pevné báze u ve V tak dostáváme pro každý bod A e A jednoznačné vyjádření
A = Aq + x\u\ + • • • + x„u„.
Hovoříme o afinní soustavě souřadnic (Aq, u\, ..., u„) zadané počátkem afinní souřadné soustavy Aq a bazí zaměření u nebo také o afinním repéru (Aq, u).
Slovy můžeme shrnout situaci takto: Afinní souřadnice bodu A v soustavě (Aq, u) jsou souřadnicemi vektoru A—Aq v bázi u zaměření V.
Volba afinního souřadného systému ztotožňuje jakýkoliv n -rozměrný afinní prostor A se standardním afinním prostorem A„.
T\
4.3. Afinní podprostory. Jestliže si vybereme v A j en body, které budou mít některé předem vybrané souřadnice nulové (třeba poslední jednu). Dostaneme opět množinu, která se bude chovat jako afinní prostor. Takto budeme skutečně parametricky popisovat tzv. afinní podprostory ve smyslu následující definice.
Podprostory afinního prostoru
Definice. Neprázdná podmnožina Q C A afinního prostoru A se zaměřením V se nazývá afinní podprostor v A, je-li podmnožina W = {B — A; A, B e Q} c V vektorovým podprostorem a pro libovolné A e Q,u e f je A + u e Q.
Je podstatné mít obě podmínky zahrnuty v definici, protože je snadné najít příklady podmnožin, které budou splňovat první, ale nikoliv druhou podmínku. Přemýšlejte např. o přímce v rovině s vyjmutým jedním bodem.
Pro libovolnou množinu bodů M c A v afinním prostoru se zaměřením V definujeme vektorový podprostor
Z(M) = ({B - A; B, A e M}) c V
všech vektorů generovaných rozdíly bodů z M.
Zejména je V = Z (A) a každý afinní podprostor Q C A splňuje sám axiomy afinního prostoru se zaměřením Z(Q).
která odpovídá situaci, kdy proměnné x,y,z,,u zůstávají na levé straně rovnic, totožná úprava
/1 0 0 0 1 2 0 \ / 1 0 0 0 1 2 0 \
0 1 0 0 0 -1 3 0 1 0 0 0 -1 3
0 0 1 0 1 -2 2 -i -4 1 0 0 0 -10
0 0 1 0 2 5 ) V 0 2 0 1 0 0 11 /
dává výsledek ve tvaru
4y 2y
+
+
10,
11.
Při přepisování soustavy do matice je tudíž nutné zohledňovat, zda svislá čára odděluje levou stranu rovnic od pravé (či nikoliv). Jak jsme částečně viděli v tomto příkladu, metoda eliminace parametrů může být zdlouhavá a při jejím použití se lze snadno dopustit chyb. Jiné řešení Hledali jsem přitom pouze dva lineárně nezávislé normálové vektory, tj. vektory kolmé na vektory (1,0, 1,0), (2, —1, —2, 2). Pokud bychom „uhodli", že takovými vektory jsou např. (0, 2, 0, 1), (—1, 0, 1, 2), dosazením x = 0, y = 3, z = 2, u = 5 do rovnic
2y
+
+ +
u 2u
a,
bychom obdrželi a dření
11, b
2y
12, následně hledané implicitní vyjá-
+
+ +
u 2u
11,
12.
□
4.3. Nalezněte parametrické vyjádření roviny procházející body
A = [2, 1,1], S = [3,4,5], C = [4,-2,3].
Poté parametricky vyjádřete otevřenou polorovinu obsahující bod C a vymezenou přímkou zadanou body A, B.
Řešení. K parametrickému vyjádření roviny potřebujeme jeden bod ležící v této rovině a dva směrové (lineárně nezávislé) vektory. Stačí zvolit bod A a vektory B - A = (1, 3, 4) a C - A = (2, -3, 2), které jsou očividně lineárně nezávislé. Bod [x, y, z] náleží do dané roviny právě tehdy, když existují čísla í, s ě R, pro která je
x =2 + l- t +2-s, y = 1 + 3 • ŕ - 3 • s, tj. hledané parametrické vyjádření roviny je
[2, 1,1]+ t (1,3, 4) +s (2, -3,2).
1 + 4 • t + 2 • s;
t, s e
Volba s = 0 zjevně dává přímku, která prochází body A, B. Pro t = 0, s > 0 dostáváme polopřímku začínající v bodě A a procházející bodem C. Libovolně pevně zvolené í é la měnné s > 0 pak
201
A. AFINNÍ GEOMETRIE
1. AFINNÍ A EUKLIDEOVSKÁ GEOMETRIE
zadávají polopřímku s počátkem na hraniční přímce a s body v polorovině, ve které se nachází bod C. To znamená, že hledanou otevřenou polorovinu můžeme vyjádřit parametricky takto
[2, 1, 1] + t (1, 3, 4) + s (2, -3, 2), t € R, s > 0.
□
4.4. Určete vzájemnou polohu přímek
p : [1,0, 3] + t (2,-1,-3), íel, q : [1,1, 3] + s (1,-1,-2), s el.
Řešení. Hledejme společné body zadaných přímek (průnik podpro-storů). Dostáváme soustavu
1 + 2t
0 - t 3 - 3ř
1 + s, 1 - s, 3 - 2s.
Z prvních dvou rovnic vyplývá, že t = 1, s = 2. To ovšem nevyhovuje třetí rovnici. Soustava tak nemá řešení. Neboť směrový vektor (2, —1, —3) přímky p není násobkem směrového vektoru (1, —1, —2) přímky q, přímky nejsou rovnoběžné. Jedná se proto o mimoběžky. □
4.5. Pro jaká čísla a e M jsou přímky
p : [4, -4, 8] +ř(2, 1, -4), íel,
q : [a, 6, -5] + s (1, -3,3), s e R
různoběžné?
Řešení. Přímky jsou různoběžné tehdy a jenom tehdy, když má soustava
4 + 2ř = a + s,
-4 + t = 6 - 3s,
8 - 4ř = -5 + 3s
právě 1 řešení. V maticovém zápisu řešíme (první sloupec odp|ovídaL proměnné t, druhý pak s)
2 1
-1 a - 4 \ / 1 2
-4
1 0 0
Vidíme, že soustava má právě 1 řešení tehdy a jenom tehdy, když je druhý řádek násobkem třetího. To je splněno pouze pro a = 3. Dodejme, že průsečíkem je v tomto případě bod [6, —3, 4]. □
Přímo z definic je také zřejmé, že průnik libovolné množiny afinních podprostorů je buď opět afinní podprostor nebo prázdná množina.
Afinní podprostor (M) v A generovaný neprázdnou podmnožinou M c i je průnikem všech afinních podprostorů, které obsahují všechny body podmnožiny M.
2 Afinní obal a parametrický popis podprostorů
Afinní podprostory si můžeme pěkně popsat pomocí jejich zaměření, jakmile si zvolíme jeden jejich bod Ao e M v generující množině bodů M. Skutečně, dostáváme (M) = {Ao + v; v e Z (M) c Z (A)}, tj. pro generování afinního podprostorů vezmeme vektorový podprostor Z(M) v zaměření generovaný všemi rozdíly bodů z M a ten pak přičteme k libovolnému z nich. Hovoříme také o afinním obalu množiny bodů M y A.
Naopak, kdykoliv zvolíme podprostor U v zaměření Z (A) a jeden pevný bod A e A, pak podmnožina A + U vzniklá všemi možnými součty jediného bodu A se všemi vektory v U je afinní podprostor. Takový postup vede k pojmu parametrizace podprostorů:
Nechť Q = A + Z(Q) je afinní podprostor v A„ a («i, ..., uk) je báze Z(Q) c R". Pak vyjádření podprostorů
Q = {A + tlUl + ■■■ + tkuk; t\, ...,tk el)
nazýváme parametrický popis podprostorů Q.
i
Již jsme viděli jinou možnost zadávání afinních podprostorů: Jestliže máme zvoleny afinní souřadnice, pak lze zaměření podprostorů popsat pomocí homogenního systému lineárních rovnic v těchto souřadnicích. Dosazením souřadnic jednoho bodu našeho podprostorů Q do získaného systému rovnic dostaneme pravou stranu nehomogenního systému se stejnou maticí a celý podprostor Q je pak právě množinou řešení tohoto systému. Zadání podprostorů Q systémem rovnic v daných souřadnicích nazýváme implicitní popis podprostorů Q.
Následující obecná věta říká, že takto umíme ve skutečnosti zadat všechny afinní podprostory a tím také ukazuje geometrickou podstatu vlastností množiny všech řešení systémů lineárních rovnic.
4.4. Věta. Nechť (Aq; u) je afinní souřadný systém v n-rozměrném afinním prostoru A. Afinní podprostory dimenze k v A, vyjádřené v daných souřadnicích, jsou právě množiny řešení
řešitelných systémů n — k lineárně nezávislých lineárních
rovnic v n proměnných.
Důkaz. Uvažujme libovolný řešitelný systém n — k lineárně nezávislých rovnic a{ (x) =ííi,ri el,i = 1,..., n—k. Je-li A = (íii,...,íi„)ľel" libovolné pevně zvolené řešení tohoto (nehomogenního) systému rovnic a je-li U C R" vektorový podprostor všech řešení zhomogenizovaného systému cti (x) = 0, pak dimenze U je k a podmnožina všech řešení daného systému je tvaru {B; B = A + (yi, ..., y„)T, y =
202
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
(yi ..., yn)T e U} C M", viz. 3.1. Příslušný afinní podpro-stor je tím popsán parametricky ve výchozích souřadnicích (A0; u).
Naopak, uvažme libovolný afinní podprostor Q C A„ a zvolme nějaký jeho bod B za počátek afinního souřadného systému (B, v) pro afinní prostor A. Protože Q = B +Z(Q), potřebujeme popsat zaměření podprostoru Q jako podprostor řešení homogenního systému rovnic. Zvolme tedy bázi v na Z (A) tak, aby prvních k vektorů tvořilo bázi Z(Q). Pak v těchto souřadnicích jsou vektory v e Z(Q) dány rovnostmi
a j (v) = 0, j = k + 1, ..., n,
kde cti jsou lineární formy z tzv. duální báze ku, tj. funkce přiřazení jednotlivých souřadnic v naší bázi v.
Náš vektorový podprostor Z(Q) dimenze k v n-rozměrném prostoru W je tedy skutečně dán jako řešení homogenního systému n — k nezávislých rovnic. Popis zvoleného afinního podprostoru v námi nově vybraném souřadném systému (B; v) je proto dán systémem homogenních lineárních rovnic.
Zbývá nám se vypořádat důsledky přechodu z původního zadaného souřadného systému (A; u) do našeho přizpůsobeného (B; v). Z obecné úvahy o transformacích souřadnic v následujícím odstavci vyplyne, že výsledný popis podprostoru bude opět pomocí systému rovnic, tentokrát ale už obecně nehomogenních. □
4.5. Transformace souřadnic. Dvě libovolně zvolené afinní soustavy souřadnic (A0,w), (B0,v) se obecně liší posunutím počátku o vektor (So — A0) a jinou bazí zaměření. Transformační rovnice mezi příslušnými souřadnicemi tedy vyčteme ze vztahu pro obecný bod X e A
X = B0 + x[ vi H-----\-x'nv„
= B0 + (A0 - B0) +xtui H-----\-x„u„.
Označme y = (yi, ..., yn)T sloupec souřadnic vektoru (A0 — B0) v bázi v a M = (útý) buď matice vyjadřující bázi u prostřednictvím báze v. Potom
x'l = yi + aUxl + • • • + tt\nxn
xn — yn + cin\X\ + ■ ■ ■ + cinnxn
tj. maticově
x' = y + M ■ x.
Jako příklad si můžeme vujádřit dopad takové změny jji ,. báze na souřadné vyjádření podmnožin pomocí sys-i> témů lineárních rovnic. Nechi" |x (A0; u) náš systém rovnic tvar
S ■ x = b
4.6. V M. stanovte vzájemnou polohu přímky p zadané implicitně rovnicemi
x x -2x - 1.
+
y
2y
+
4, -3
a rovmy q : y
Řešení. Normálový vektor q je (2, — 1, 0) (uvažte zápis q : 2x — y + 0z = 1). Lze postřehnout, že platí
(1,1,-1)+ (1,-2, 1) = (2,-1,0),
tj. že normálový vektor roviny q je lineární kombinací normálových vektorů p. Zaměření přímky (zadané nenulovým směrovým vektorem kolmým na uvedené dva normálové vektory) je proto podprostorem zaměření roviny q (směrový vektor přímky je nutně kolmý na vektor (2, — 1, 0)). Lehce jsme zjistili, že přímka p je rovnoběžná s rovinou q. Zajímá nás, zda se protínají (zda p leží v q). Soustava rovnic
x + y - z = 4, x - 2y + z = -3, 2x — y =1
má nekonečně mnoho řešení, neboť sečtením prvních dvou rovnic dostaneme právě třetí z rovnic. Přímka p tak musí ležet v rovině q. □ Následuje standardní příklad na průnik vektorových prostorů. Čtenář by měl být schopen následující příklad vyřešit. Doporučujeme nepokračovat ve čtení této učebnice, dokud tomu tak nebude.
4.7.
ôi
02
alezněte průnik podprostoru Q\ a Q2, je-li [4, -5, 1, -2] + h (3, 5, 4, 2) + t2 (2, 4, 5, 1) + ř3 (0, 3, 1, 2), [4, 4, 4, 4] + Sl (0, -6, -2, -4) + s2 (-1, -5, -3, -3),
kde t\, ti, h, s\,si e M. Řešení. Bod X = \x\, x2, x3, x4] e M4 náleží do Q\ D Q2 právě tehdy, když je
~ 4 " (3\ (2\ (0\
*2 X3 = -5 1 + h 5 4 + t2 4 5 + h 3 1
x4 -2 \V V) w
pro nějaká čísla ti, t2, t3 e M a současně když je
xx "4" /0\ /-1\
4 + *i -6 + S2 -5
X3 - 4 -2 -3
4
pro nějaká s\, s2 e M. Porovnáním získáváme
má v souřadnicích (3\ (2\ /0\ /4-4\ (0\ /- -1\
5 4 3 4 + 5 -6 -5
h 4 + h 5 + Í3 1 — 4 - 1 + Sl -2 + ^2 -3
w {4 + 2) V -v
203
A. AFINNÍ GEOMETRIE
1. AFINNÍ A EUKLIDEOVSKÁ GEOMETRIE
Při maticovém zápisu (pro pořadí proměnných t\, t2, h, s i, s2 a po převodu vektorů u si a s2 na levou stranu) řešme pomocí řádkových ope-
raci
/ 3 5 4
V 2 i
2 0 0 1
4 3 6 5
5 12 3 2 4 3
0 \ 9
3
6/
/ 3 2 0 0 1
0 2 9 18 10
0 7 3 6 5
\ 0 -1 6 12 7
0 \
27 9
18/
4 . 3
/3 00000\
0 2 0 0 0 0
0 0 1 2 0 3
\ 0 0 0 0 1 0 /
t2 = s2 = 0 a pro si = t e M je ř3 Podotkněme, že k určení QiC\ Q2 stačilo znát buďři, t2, ř3 nebo si, «2 Vraťme se nyní k vyjádření
Odtud vidíme, že t\
2t.
X\ "4" /0\ /- -1\ "4" /0\
x2 4 -6 -5 4 -6
x3 — 4 + *i -2 + s2 -3 — 4 + ř -2
X4 4 V -v 4
Průnikem zadaných podprostorů je tedy přímka (s [4,4,4,41 + ^(0,3,1,2), sel Pro kontrolu rovněž dosaďme
-2ř)
*1 " 4 " /3\ (2\ /0\
x3 = -5 1 + ři 5 4 + h 4 5 + 0 3 1
X4 -2 V) w
+ (3 - 2ř)
M
3 1
V2/
+ ř
/0\
-6 -2 V-4/
□
4.8. Zjistěte, zda leží body [0, 2, 1], [-1,2, 0], [-2, 5, 2] a [0, $£4E zťv jedné rovině.
Řešení. Libovolná dvojice zadaných bodů z afinního prostoru M3 určuje vektor (viz definice afinního prostoru; jeho souřadnice jsou dány po složkách rozdíly souřadnic daných dvou bodů). To, že dané čtyři body leží v rovině je ekvivalentní tomu, že jsou tři vektory dané jedním vybraným bodem a vždy jedním ze tří zbylých lineárně závislé. Vybereme např. bod [0, 2, 1] (na výběru nezáleží), pak uvažujeme vektory [0,2, 1] — [—1, 2, 0] = (1,0, 1),[0,2, l]-[-2, 5,2] = (2, -3, -1) a [0, 2, 1] - [0, 5, 4] = (0, -3, -3). Vidíme, že součet dvojnásobku prvního vektoru a třetího vektoru je roven druhému vektoru, vektory jsou tedy lineárně závislé (jinak má taky matice, jejíž
s maticí systému S. Potom
S ■ x = S ■ AT1 • (y + M ■ x) - S ■ AT1 • y = b.
Proto v nových výše uvažovaných souřadnicích (S0; v) bude mít náš systém rovnic tvar
(5 • AT1) • x'
+ (5 • M ) ■ y.
Pokud tedy máme nějakou podmnožinu popsánu systémem lineárních rovnic v jednom afinním repéru, pak tomu tak bude i ve všech ostatních afinních souřadných systémech. To plně dokončuje důkaz předchozí věty.
4.6. Příklady afinních podprostorů. (1) Jednorozměrný (standardní) afinní prostor je množina všech bodů reálné přímky A\. Její zaměření je jednorozměrný vektorový prostor M (a nosná množina také W). Afinní souřadnice dostaneme
volbou počátku a měřítka (tj. báze ve vektorovém prostoru W). Všechny vlastní afinní podprostory jsou 0-rozměrné, jsou to právě všechny body reálné přímky M.
(2) Dvourozměrný (standardní) afinní prostor je množina všech bodů prostoru A2 se zaměřením M2. (Nosnou množinou je M2.) Afinní souřadnice dostaneme volbou počátku a dvou nezávislých vektorů (směrů a měřítek). Vlastní afinní podprostory jsou pak všechny body a přímky v rovině (0-rozměrné a 1-rozměrné). Přímky přitom jednoznačně zadáme jejich jedním bodem a jedním generátorem zaměření (tzv. parametrický popis přímky).
(3) Trojrozměrný (standardní) afinní prostor je množina všech bodů prostoru A3 se zaměřením M3. Afinní souřadnice dostaneme volbou počátku a tří nezávislých vektorů (směrů a měřítek). Vlastní afinní podprostory jsou pak všechny body, přímky a roviny (0-rozměrné, 1-rozměrné a 2-rozměrné).
(4) Podprostor všech řešení jedné lineární rovnice a ■ x = b pro neznámý bod [xi, ..., xn] e A„, známý nenulový vektor koeficientů (a\, ..., an) a skalár b e M je afinní podprostor dimenze n — 1 (říkáme také, že je jeho kodimenze 1), tj. tzv. nadrovina v A„.
4.7. Afinní kombinace bodů. Zavedeme nyní obdobu lineárních kombinací vektorů. Nechť A0, ..., Ak jsou body v afinním prostoru A. Jejich afinní obal ({A0 ..., Ak}) můžeme zapsat jako
{A0 + 0(Ai - A0) + • • • + tk(Ak - A0); h,
a v libovolných afinních souřadnicích (tj. každý bod A, je vyjádřen sloupcem skalárů) můžeme tutéž množinu zapsat jako
k
p(A,C)
(4) V každé kartézké souřadné soustavě (Aq, e) mají body A = A0 + aiei-\-----\-anen, B = A0 + ^i \\u2\\2 = \\A-P\\.
Odtud již vyplývá, že nejmenší možné vzdálenosti je skutečně dosaženo, a to právě pro náš bod P. Vypočtená vzdálenost je skutečně ||«2ll-
Obdobně ukážeme obecný výsledek. Pro volbu libovolných bodů A e Kafi e Q je jejich rozdíl dán jako součet vektorů ux e Z{11) + Z(Q) a u2 e {Z{11) + Z(Q))-L, přičemž komponenta u2 nezávisí na volbě bodů. Přičtením vhodných vektorů ze zaměření 1Za.Q zjevně obdržíme body A' a B', jejichž vzdálenost je právě ||«2ll- D
Rozšíříme nyní náš stručný přehled elementárních úloh v analytické geometrii.
4.17. Příklady standardních úloh. (1) Najděte vzdálenost bodu A e £„ odpodprostoru Q c £„:
Postup při řešení je dán ve větě 4.16. (2) V £2 veďte bodem A přímku q svírající s danou přímkou p daný úhel: Připomeňme, že na úrovni rovinné geometrie jsme s odchylkami vektorů již pracovali (viz např. 2.43). Najdeme vektor u e M2 ležící v zaměření přímky q a zvolíme vektor v mající od u zadanou odchylku. Hledaná přímka je dána bodem A a zaměřením (v). Úloha má dvě nebo jedno řešení.
(3) Spočtěte patu kolmice vedené bodem na danou přímku: Postup je uveden v důkazu předposledního bodu věty
4.16.
(4) V £3 určete vzdálenost dvou přímek p, q:
Zvolíme libovolně jeden bod z každé přímky, A e p, B e q. Komponenta vektoru A — B v ortogonálním doplňku (Z(p) + Z(q))J- má velikost rovnu vzdálenosti p a q.
(5) V £3 najděte osu dvou mimobězek p a q:
Osou zde rozumíme příčku, která realizuje nejmenší možnou vzdálenost daných mimobězek pomocí bodů průniku. Opět lze postup dovodit z důkazu věty 4.16 (poslední bod). Nechť r] je podprostor generovaný jedním bodem A e p a součtem Z(p) + (Z(p) + Ziq))^. Pokud nejsou přímky p a q rovnoběžné, půjde o rovinu. Pak průnik r] n q spolu se zaměřením (Z(p) + Z(q))1- dávají parametrický popis hledané osy. Pokud jsou přímky rovnoběžné, bude mít úloha nekonečně mnoho řešení.
212
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
4 . 15
4.16
4.18. Odchylky. Stejně jako vzdálenost, i řada dalších geometrických pojmů jako odchylky, orientace, objem apod. je v bodových prostorech £„ zaváděna prostřednictvím vhodných pojmů vektorových euklidovských prostorech. Připomeňme, že odchylku dvou vektorů jsme definovali na konci třetí části druhé kapitoly, viz 2.43.
- ve
Skutečně, z Cauchyovy nerovnosti plyne 0
MINI
< 1,
má tedy smysl definice odchylky cp(u, v) vektorů u,veV v reálném vektorovém prostoru se skalárním součinem vztahem
cos =0, (Xi -X2,ui) =0, (Xi-X2,u2> =0,
tj-
((-3, 2, -5, -7, -3), ui) + pi (ui,ui) + qi {u2, ux)
- p2 (ví, ui) - q2 (v2, ui) = 0,
((-3, 2, -5, -7, -3), u2 ) + pi (uu u2 ) + qx (u2, u2 )
4.21
- P2 { vi, u2 ) - q2 { v2, u2 ) = (T,
((-3, 2, -5, -7, -3), vi ) + pi (ui, vi ) +qi (u2, vx )
- P2 ( vu t>i ) - q2 (v2, vx ) = 0,
((-3,2, -5, -7, —3), u2 ) + pi (uuv2) +qx (u2,v2)
- p2 (vu v2) - q2 {v2, v2) = 0.
Vyčíslením těchto skalárních součinů získáváme soustavu lineárních rovnic
6pi - 4qx - 9p2 - 3q2 = 7, -4pi + 6qx + 6q2 = 6,
9pi - 33p2 - q2 = 31,
3pt - 6qi - p2 - 9q2 = -11, kterou vyřešíme pomocí řádkových transformací v maticovém zápisu
/
V
9
3
0
-9 0
-33 -1
7 \
/ 1 0 0 0
0 10 0
0 0 10
V o o o i
o \
-1 -1
2 i
31
-11 /
Re ením této soustavy je tedy čtveřice (pi, qi, p2, q2) = (0, -1, -1, 2). Určili jsme
Xl-X2 = (-3, 2, -5, -7, -3)-u2+Vl-2v2 = (-3, 4, -2, -4, 2).
Potřebujeme ukázat, že odchylka libovolného v e U\ od U2 je nejméně tak velká jako odchylka u od U2. Tzn. že kosinus příslušného úhlu nesmí být větší. Podle předchozího lemmatu stačí diskutovat odchylku u a cp(u) e U2 a přitom víme, že ||«|| = 1. Zvolme tedy v e U\, v = a\U\ + • • • + akuk, Ef=i a2 = IMI2 = l-Pak
\\(p(v)f = cp(v) ■ cp(v) = (Ý o (p{v)) ■ v
< \\Ý o(p(v)\\\\v|| = \\Ýo(p(v)\\.
Předchozí lemma navíc dává i vzorec pro odchylku a vektoru v od podprostoru U2
Mv)\\
cos a
Ml
Mv)\l
Protože jsme zvolili za k\ největší z vlastních hodnot a součet kvadrátů souřadnic af je jedna, dostáváme
(cosa)2 = || 2 a vektory u\, ... ,un-\ e V. Dosadíme-li těchto n — 1 vektorů jako prvních n — 1 argumentů n-lineárníhho zobrazení definovaného pomocí determinantu při výpočtu objemu výše, pak nám zbude jeden volný argument, tj. lineární forma na V. Protože však máme k dispozici skalární součin, odpovídá každá lineární forma právě jednomu vektoru. Tento vektor v e V nazveme vektorový součin vektorů u\, ..., w„_i, tj. pro každý vektor w e V platí
(V, W) =[«!,..., M„_i, W].
Značíme v = u\ x ... x u„-\.
Jsou-li v nějaké ortonormální bázi souřadnice našich
vektorů v
Cyi, ■ ■ ■, yn)
w
(Xi
, x„) a u j
(u
... u
) , naše definice má vyjádření
yixi H-----h ynxn
un
tni
Wl(n-l) *1
Xfi.
která má jediné řešení (musí tomu tak být, protože sloupce matice soustavy jsou dány lineárně nezávislými vektory zaměření obou rovin) s = -8/19, t = 34/19, u = -54/19, v = -26/19. Dosazením hodnot parametrů s a t do parametrického vyjádření roviny q pak dostaneme souřadnice průniku [45/19, —16/19, 11/19, 18/19] (stejný výsledek pochopitelně obdržíme, dosadíme-li hodnoty parametrů u a v do parametrického vyjádření roviny r). □
4.34. Bodem [1,2] e přímky
M2 vedle přímku, která má odchylku 30° od p : [0,1] +f (1,1).
Řešení. Odchylka dvou přímek je dána úhlem, který svírají jejich směrové vektory. Stačí tedy najít směrový vektor v hledané přímky. Ten získáme například rotací směrového vektoru přímky p o 30°. Matice rotace o 30° je
cos 30° -sin30c sin 30° cos 30°
Hledaný vektor v je tedy
Rotovat jsme mohli i v opačném smyslu. Hledaná přímka (jedna ze dvou možných) má tedy parametrické vyjádření
/ y/3 1 73 l\ [1'21 + (--2-+2J'-
□
4.35. Určete cos a, kde a je odchylka dvou sousedních stěn pravidelného osmistěnu (těleso, jehož stěny tvoří osm rovnostranných trojúhelníků).
Řešení. Odchylky libovolných dvou sousedních stěn jsou ze symetrie osmistěnu shodné. Rovněž tak nezáleží na jeho velikosti. Uvažujme osmistěn s délkou hrany 1, který je umístěn do standardní kartézské souřadné soustavy v M3 tak, že jeho těžiště je v bodě [0, 0, 0]. Jeho vrcholy jsou pak v bodech A = 0, 0], B = [0, ^, 0], C = [-^, 0, 0], D = [0,0], £ = [0,0,-f]aF = [0, 0, ^].
Určeme odchylku stěn CD F a BCF. Taje dána odchylkou vektorů kolmých na jejich průnik a ležících v daných stěnách, tedy vekorů kolmých na CF. Těmi jsou vektory dané výškami z bodů D, resp. F na stranu C F v trojúhelnících CDF, resp. BCF. Výšky v rovostranném trojúhelníku splývají s těžnicemi, jedná se tedy o úsečky SD a SB, kde 5 j e střed strany C F. Protože známe souřadnice bodů CaF,mábod5
219
B. EUKLEIDOVSKÁ GEOMETRIE
1. AFINNÍ A EUKLIDEOVS KÁ GEOMETRIE
souřadnice [-^, 0, ^] a pro vektory máme SD = (^, -^)
a SB = Celkem
/ v2 v2 _vj\ /v2 vj v2\
v 4 ' 9' A / ' v zl ' 9 ' 4 /
COS Q!
KÍ.
vi
2 '
#)llll(f
Je tedy ot = 132°.
Odtud je přímo vidět, že vektor v je zadán jednoznačně a jeho souřadnice spočteme formálním rozvojem tohoto determinantu podle posledního sloupce. Zároveň jsou přímo z definice očekávatelné následující vlastnosti vektorového součinu:
r-j Věta. Pro vektorový součin v = u\ x ... x w„_i platí
4.36. V bodovém eukleidovském prostoru M5 vypočtěte odchylku cp podprostorů U, y, jestli e je
(a) U
V
(b) U
V
(c) U
V
(d) u
v
[3, 5, 1, 7, 2] + t (1, 0, 2, -2, 1), ř e R, [0, 1, 0, 0, 0] + s (2, 0, -2, 1, -1), s e M;
[4,1,1,0,1] +í (2, 0,0, 2,1), í e M,
Xi + X 2 + X 3 + X 5 = 7;
2xi — X2 + 2X3 + *5 =3, Xi + 2X2 + 2X3 + x5 = — 1;
[0, 1, 1,0, 0] + t (0,0,0, 1, -1), t e R,
[1,0, 1, 1, 1] +r (1, -1,2, 1,0) +s(0, 1,3,2,0)
+p (1, 0, 0, 1, 0)+q (1, 3, 1, 0, 0) , r, s, p, q
(e) U : [0, 2, 5, 0, 0] + t (2, 1, 3, 5, 3) + s (0, 3, 1, 4, -2)
+ r(l,2, 4,0, 3), t,s,r el,
V : [0, 0, 0, 0, 0] + p (-1, 1, 1, -5, 0)
+ q (1,5, 1, 13, -4), eK;
(f) £/ : [1, 1, 1, 1, l] + ř(l,0, 1, 1, 1) + s (1,0,0, 1, 1), t,s e
M,
V : [1, 1, 1, 1, 1] +p(l, 1, 1, 1, 1) +q (1, 1,0, 1, 1)
+ r (1, 1,0, 1,0), p,q,r € R.
Řešení. Nejdříve připomeňme, že odchylka afinních podprostorů je definována jako odchylka jejich zaměření, a proto při počítání cp ne-zohledňujeme posunutí vyjádřená přičtením bodu (příp. pravé strany soustav rovnic).
Varianta (a). Neboť oba podprostory U a V jsou jednodimenzionální, odchylka cp e [0, 7t/2] je dána vzorcem
pn„ „ _ | (1,0,2,-2,l)-(2,0,-2,1,-1)| _ 5 LUSV ||(1,0,2,-2,1)|m|(2,0,-2,1,-1)|| vTO-vTO"
Je tedy cos _ lšínejjednodušší křivky na řadě tzv. kuželosečky. Jsou v kartézkých souřadnicích zadány kvadratickými rovnicemi a podle
■(u/- ' koeficientů poznáme, zda jde o kružnici, elipsu, parabolu nebo hyperbolu, případně ještě může jít o dvě přímky nebo bod (degenerované případy).
Uvidíme, že naše nástroje umožní vcelku účinnou klasifikaci takovýchto objektů v libovolných konečných dimenzích i práci s nimi. Je přitom zřejmé, že v afinní geometrii nemůžeme odlišit kružnici od elipsy, proto začneme v geometrii euklidovské.
4.26. Kvadriky v £„. V analogii k rovnicím kuželoseček v rovině začneme poznámkami o objektech v euklidovských bodových prostorech, které jsou v dané ortnonormální bázi zadány kvadratickými rovnicemi, hovoříme o kvadrikách.
Varianta (c). Nadroviny U a V jsou zadány pomocí normálových vektorůw = (2, —1, 2, 0, 1) av = (1, 2, 2, 0, 1). Zřejmě j e odchylka^ rovna úhlu, který svírají přímky se směrovými vektory u a v. Platí tudí (viz variantu (a))
cos cp
(2,-1,2,0, !)■(!,2,2,0,1)
tj- M.. Stejně dobře můžeme přemýšlet o obecné symetrické bilineární formě na libovolném vektorovém prostoru.
Pro libovolnou bázi na tomto vektorovém prostoru bude hodnota f(x) na vektoru x = x\e\ +• • • +xnen dána vztahem
f(x) = F(x,x) = ^2xiXjF(ei,ej)
xT - A
kde A = (dij) je symetrická matice s prvky dij = F{ei? ej). Takovýmto zobrazením / říkáme kvddmtické formy a výše uvedený vzorec pro hodnotu formy s použitím zvolených souřadnic se nazývá dtidlytický tvdr formy.
Obecně rozumíme kvadratickou formou zúžení f(x) jakékoliv symetrické bilineární formy F(x, y) na argumenty tvaru (x,x). Evidentně umíme z hodnot f(x) zrekonstruovat celou bilineární formu F, protože
f(x +y) = F(x+y,x+y) = f(x) + f(y) + 2F(x, y).
Jestliže změníme bázi e; na jinou bázi e[, ..., e'n, dostaneme pro stejný vektor jiné souřadnice x = S ■ x' (zde 5 je příslušná matice přechodu) a tedy
f(x) = (S-x'y ■A.(S-x')
(ST • A • 5) • x'.
Předpokládejme opět, že je na našem vektorovém prostoru zadán skalární součin. Předchozí výpočet pak můžeme shrnout slovy, že matice bilineární formy F a tedy i kvadratické formy / se transformuje při změně souřadnic způsobem, který pro ortogonální změny souřadnic splývá s transformací matic zobrazení (skutečně, pak je 5_1 = ST). Tento výsledek můžeme intepretovat také jako následující pozorování:
222
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
Tvrzení. Nechť V je reálny vektorový prostor se skalárním součinem. Pak vztah
cp h-» F, F(u, u) = (cp(u), u)
zadává bijekci mezi symetrickými lineárními zobrazeními a kvadratickými formami na V.
Důkaz. Skutečně, bilineární forma s pevně zadaným ji ,. druhým argumentem je lineární formou au( ) = F( , u) a v přítomnosti skalárního součinu je nutně dána vztahem a(u)(v) = v ■ w pro vhodný vektor w. ifí1 ' Klademe cp(u) = w. Přímo ze vztahu v souřadnicích výše pak vyplývá, že cp je lineární zobrazení s maticí A. Je tedy samoadjungované.
Naopak, každé symetrické zobrazení cp zadává vztahem F(u,v) = (cp(u),v) = (u,cp(v)) symetrickou bilineární formu a jejím zúžením kvadratickou formu. □
Z tohoto tvrzení vyplývá okamžitý důsledek, že pro každou kvadratickou formu / existuje ortonormální báze zaměření, ve které má / diagonální matici (a diagonální hodnoty jsou jednoznačně určeny až na pořadí).
Díky ztotožnění kvadratických forem se zobrazeními můžeme také korektně zavést hodnost kvadratické formy jakožto hodnost její matice v kterékoliv bázi (tj. hodnost je rovna dimenzi obrazu příslušného zobrazení cp).
4.28. Klasifikace kvadrik. Vraťme se k naší rovnici (4.4). Naše výsledky o kvadratických formách nám umožňují dosáhnout rovnice ve tvaru
J2kix? + J2biXi+b = 0-
Můžeme tedy přímo předpokládat, že ji v takovém tvaru máme a v dalším kroku pro souřadnice x;- s k{ ^ 0 provedeme doplnění do čtverců, které „pohltí" kvadráty i lineární členy týchž neznámých (tzv. Lagrangeův algoritmus, kterému se budeme obecněji věnovat níže) . Tak nám zůstanou nejvýše ty neznámé, pro které byl jejich koeficient u kvadrátu nulový, a získáme tvar
i=\
Pif + bixi +c
j splňující k j = 0
0.
To odpovídá posunutí počátku souřadnic o vektor se souřadnicemi pi a zároveň volbě báze zaměření tak, abychom dostali požadovaný diagonální tvar v kvadratické části. Ve výše odvozeném ztotožnění forem se symetrickými zobrazeními to znamená, že cp je diagonální na ortogonálním doplňku svého jádra. Pokud nám opravdu zůstaly nějaké lineární členy, můžeme upravit ortonormální bázi zaměření na jádru zobrazení cp tak, aby odpovídající lineární forma byla
(p u (1,1,0, 1,1)) = 0, (pu - u, (1, 1, 0, 1, 0)) = 0,
což vede na soustavu rovnic
4a + 3b = 3, 3a + 3b = 2
s jediným řešením a = 1, b = —1/3. Tímto jsme určili
a z (4.2) již plyne
(2/3,2/3,0,2/3,1) h _ ^7
coscp
(1,0,0,1,1)
pu = (|,|,0,|,l)
3 , tj. ^ = 0,49 (^28°)
□
C. Geometrie kvadratických forem
4.37. Určete polární bázi formy / : 2x\x2 + x| + 4x2X3 + 6x|.
Řešení. Její matice je
i, f(x\, X2, X3) — 3x? +
Podle bodu (1) Lagrangeova algoritmu provedeme úpravy
1 2
f(xi,x2, x3) = — (3jci + x2)2 + -xf + 4x2x3 + 6x|
1 , 3 2 , = + 2(3^2+ 2y3)2
= 3*1 + ^2
a vidíme, že forma má hodnost 2 a matice přechodu do příslušné polární báze w se získá posbíráním provedených transformací: 2 2
Z3 = V3 = X3, Z2 = - V2 + 2y3 = -x2 + 2x3, zi = yi = 3xi + x2 Pokud by ale např. f(x\, x2, x3) = 2xix3 + x|, tj. matice je
pak hned v prvním kroku můžeme přehodit proměnné: yi = X2, y2 = x\, y3 = x3. Aplikace kroku (1) je pak triviální (nejsou tu žádné společné členy), pro další krok ale nastane situace z bodu (4). Zavedeme tedy transformaci z\ = yi, z2 = yi, Z3 = V3 — y2. Pak
f(xux2, x3) = z\ + 2z2(z3 + z2) = z\ + ^(2z2 + Z3)2 - ^z2-
Matici přechodu do příslušné polární báze opět dostaneme posbíráním jednotlivých transformací (tj. vynásobením jednotlivých dílčích matic přechodu). □
223
C. GEOMETRIE KVADRATICKÝCH FOREM
2. GEOMETRIE KVADRATICKÝCH FOREM
4.38. Nalezněte polární bázi kvadratické formy / : M? -» M, která je ve standardní bázi dána předpisem
/Cti, x2, X-}) = X\X2 + X\X3.
Řešení. Aplikací uvedeného Lagrangeova algoritmu dostáváme:
f(X\, X2, X-}) = 2x\X2 + x2x3
provedeme substituci podle bodu (4) algoritmu y2 — x2 — x\, yi — x\, y3 — x3 = 2xi(xi + y2) + C*i + y2)x3
násobkem prvního prvku duální báze. Umíme tedy již dosáhnout výsledného tvaru
Y^yf +byk+i +,
0,
2x\ + 2xiy2 + xix3 + y2x3
1 1 j 1 j 1 j
-(2xi + y2 + -x3) - -y| - -X3 + y2x3
4 .27
substituce yi = 2xi
■ ^2 ■
ix3
1
2 1 2 1 2 , 1 2 o/l 1 n2 , j 2
±x3
substituce y3 = ^y2 ■ = ^1 -2yf +^x|.
V souřadnicích yi, y3, x3 má tedy daná kvadratická forma diagonální tvar, to znamená že báze příslušná těmto souřadnicím je polární bází dané kvadratické formy. Pokud ji máme vyjádřit musíme získat matici přechodu od této polární báze ke standardní bázi. Z definice matice přechodu jsou pak její sloupce bázovými vektory polární bázi. Matici přechodu získáme tak, že buď vyjádříme staré proměnné (xi, x2, x3) pomocí nových proměnných (yi, y3, x3), nebo ekvivalentně vyjádříme nové proměnné pomocí starých (což jde jednodušeji), pak ale musíme spočítat inverzní matici.
Máme yi = 2xi + y2 + ^x3 = 2xi + (x2 — xi) + |x3 a y3
i*3
\xx + \x3
x3. Matice přechodu od standardní báze
ke zvolené polární je tedy
Pro inverzní matici pak máme
4 . 2ř
Jedna z polárních bazí dané kvadratické formy je tedy například báze {(1/3, 1/3, 0), (-2/3, 4/3, 0), (-1/2, 1/2, 1)}. □
4.39. Určete typ kuželosečky dané rovnicí:
3x? — 3xix2 + x2 — 1 = 0.
kde k je hodnost matice kvadratické formy /. Pokud je b 7^ 0, můžeme ještě další změnou počátku dosáhnout vynulování konstanty c v rovnici.
Celkem si tedy shrňme, že lineární člen se může (ale nemusí) objevit jen pokud je hodnost / menší než n, c e M může být nenulové pouze když je b = 0. Výsledné rovnice nazýváme kanonickými analytickými tvary kvadrik.
4.29. Případ £2. Pro ilustraci předchozího postupu projděme celou diskusi ještě jednou pro nejjed-Jy* nodušší případ netriviální dimenze. Původní fesz^ rovnice má tvar
útnx2 + a^y2 + 2a\2xy + útix + a2y + a = 0.
Volbou vhodné báze zaměření a následným doplněním čtverců dosáhneme tvaru (opět používáme stejného značení x, y pro nové souřadnice):
útnx2 + a^y2 + a\x + a2y + a = 0
kde a{ může být nenulové pouze v případě, že au je nulové. Posledním krokem obecného postupu, tj. v dimenzi n = 2 jen případnou volbou posunutí, dosáhneme právě jedné z rovnic:
0 0 0 0 0 0 0 0 0
1
x2/a2 + y2/b2 + 1 x2/a2 + y2/b2 - 1 x2/a2 — y2/b2 x2/a2 — 2py x2/a2 + y2/b2 x2/a2 - y2/b2
x2 +a2
prázdná množina elipsa hyperbola parabola bod
2 různoběžné přímky 2 rovnoběžné přímky 2 splývající přímky prázdná množina
Počátek kartézkých souřadnic je středem zkoumané kuželosečky, nalezená ortonormální báze zaměření zadává směr poloos, výsledné koeficienty a, b pak dávají velikosti poloos v nedegenerovaných směrech.
4.30. Afinní pohled. V předchozích dvou odstavcích jsme hledali podstatné vlastnosti a standardizované analytické popisy objektů zadávaných v eukli-.' dovskýchprostorech kvadratickými rovnicemi. Hledali jsme přitom co nejjednodušší rovnice v mezích daných volností výběru kartézských souřadnic. Geometrická formulace našeho výsledku pak může být taková, že pro dva různé objekty - kvadriky, zadané v obecně různých kartézských souřadnicích, existuje euklidovská transformace na £„ (tj. afinní bijektivní zobrazení zachovávající velikosti) tehdy a jen tehdy, pokud výše uvedený algoritmus vede na stejný analytický tvar, až na pořadí souřadnic. Navíc můžeme při
224
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
našem postupu přímo získat kartézské souřadnice, ve kterých jsou naše objekty dány výslednými kanonickými tvary, a tím i explicitní vyjádření euklidovské transformace, která naše objekty na sebe převádí (jak víme bude vždy složena z operací posunutí, otočení a zrcadlení vůči nadrovině).
Pochopitelně se můžeme ptát, do jaké míry umíme podobnou věc v afinních prostorech s volností výběru jakékoliv afinní souřadné soustavy. Např. v rovině to bude znamenat, že neumíme rozlišit kružnici od elipsy, samozřejmě bychom přitom měli odlišit hyperbolu a všechny ostatní typy kuželoseček. Hlavně ale splynou mezi sebou všechny hyperboly atd.
Ukážeme si hlavní rozdíl postupu na kvadratických formách a k záležitosti se pak ještě vrátíme ve třetí části této kapitoly.
Uvažme nějakou kvadratickou formu / na vektorovém prostoru V a její analytické vyjádření f(u) = xT Ax vzhledem ke zvolené bázi na V. Pro vektor u = x\U \ + • • • +xnun pak také zapisujeme formu / ve tvaru
Řešení. Pomocí algoritmu úpravy na čtverec postupně dostáváme:
@ij Xj
V předchozích odstavcích jsme již s využitím skalárního součinu ukázali, že pro vhodnou bázi bude matice A diagonální, tj. že pro příslušnou symetrickou formu F bude platit F(uí, Uj) = 0 při i 7^ j. Každou takovou bázi nazýváme polární báze kvadratické formy /. Samozřejmě si pro takový účel můžeme vždy skalární součin vybrat. Dokážeme si ale toto tvrzení znovu bez využití skalárních součinů tak, že získáme daleko jednodušší algoritmus na to, jak takovou polární bázi najít mezi všemi bázemi. Tím se zároveň dovíme podstatné informace o afinních vlastnostech kvadratických forem. Následující věta bývá v literatuře uváděna pod názvem Lagrangeův algoritmus.
Věta. Nechť V je reálný vektorový prostor dimenze n, f :
V -» M kvadratická forma. Pak na V existuje polární báze pro f.
Důkaz. (1) Nechť A je matice fy bázi u = (u\, ..., u„) na V a předpokládejme a\\ ^ 0. Pak můžeme psát
f(x\, ..., x„) = a\\x\ + 2a\2x\x2 + • • • + a22x\ + ...
= a[}{a\\x\ + anx2 H-----h a\nxn)2
+ členy neobsahující x\.
Provedeme tedy transformaci souřadnic (tj. změnu báze) tak, aby v nových souřadnicích bylo
x[ = anxi + anx2 H-----h a\nxn, x^ = x2, ■ ■ ■, x'n = x„.
To odpovídá nové bázi (spočtěte si jako cvičení příslušnou matici přechodu!)
vi = a^u\, v2 = u2 — a^a\2u\,
, v„
a tak, jak lze očekávat, v nové bázi bude příslušná symetrická bilinerání forma splňovat g(v\,v{) = 0 pro všechny i > 0
3xi — 3x^2 -\- x2 — 1
1
-(3*1 - -x2)
i
i
1 - 4 3 _ , _ -v? - -i-x2 - -Y + -V1 3 4 T 3
1
1
y\-*y\
2
2JÍ 3"z 3" Podle seznamu kuželoseček 4.25 se tedy jedná o hyperbolu.
□
4.40. Pomocí doplnění na čtverce vyjádřete kvadriku
-x2 + 3y2 + z2 + 6xy - 4z = 0 ve tvaru, ze kterého lze vyčíst její typ.
Řešení. Všechny členy obsahující x připojíme k — x2 a provedeme doplnění na čtverec. Tím získáme
-(x - 3y)2 + 9/ + 3y2 + z2 - 4z = 0.
Žádné „nežádoucí" členy obsahující y nemáme, a proto postup opakujeme pro proměnnou z, což dává
0.
-(x-3y)z + 12yz + (z-2)z-
Odtud plyne, že existuje transformace proměnných, při které obdržíme (rovnici můžeme nejdříve vydělit 4) rovnici
-ŕ+f+ž2
i =o.
□
au «12
«12 «22
O typu kuželosečky můžeme rozhodnout i bez úpravy na některý z tvarů uvedený v seznamu 4.29 Jak již víme, každou kuželosečku můžeme napsat ve tvaru
útnx2 + 2úti2xy + Q22V2 + 2a\j,x + 2út23y + ^33 = 0. a\\ a 12 ^13
Determinanty A = detA= a 12 a22 a23 a 8
a 13 «32 «33
jsou tzv. invariantami kuželosečky, což znamená, že se nemění při eukleidovské transformaci souřadnic (rotace a posunutí) navíc různé typy kuželoseček mají různá znaménka těchto determinantů.
• A / 0 vlastní kuželosečky:
elipsa pro 8 > 0, hyperbola pro 8 < 0 a parabola pro 8 = 0 Aby šlo o reálnou elipsu, nikoliv imaginární, musí být navíc (au + a22)A < 0.
• A = 0 nevlastní kuželosečky (degenerované), přímky Snadno se přesvědčíme, že znaménka, resp. nulovost, uvedených determinantů jsou skutečně invariantní vůči změně souřadnic. Označme
X = I y I a A je matice kvadratické formy. Pak příslušná kuželosečka má tvar XTAX = 0. Kuželosečku ve středovém základním
225
C. GEOMETRIE KVADRATICKÝCH FOREM
2. GEOMETRIE KVADRATICKÝCH FOREM
tvaru dostaneme otočením a posunutím, tedy transformací do nových souřadnicx', /, pro které platí
x = x' cos a — y' sin a -\- c\ y = x' siná + y' cos a + c2,
tedy maticově pro nové souřadnice X' = | / | platí
(4.3)
X
'cos a —srna c\ srn a cos a c2 0 0 1
MX'.
Dosazením vztahu X = MX' do rovnice kuželosečky, pak dostávame rovnici kuželosečky v nových souřadnicích, tj.
XTAX = 0 (MX')T A(MX') = 0 X'TMTA MX' = 0.
Označme A' matici kvadratické formy kuželosečky v nových souřadni-
(cosa —siná ciN sin a cos a c2 0 0 1
má jednotkový determinant, tedy
det A' = det MT det A det M = det A = A.
Nutně také deteminant A33, který je algebraickým doplňkem prvku a33 je nezávislý na změně souřadnic, protože pro nulové posunutí - tedy pouze otočení - je vztah det A' = det MT det A det M také
4.29
'cos a
sin a 0 >
platný. V tom případě matice M
sin a cos a 0 I a det Aó
33
0 0 1,
/i o Cl\
detA33 = 8. Pro samotné posunutí je matice M = I 0 1 c2 I a
\0 0 l/
tento subdeterminant neovlivňuje.
4.41. Určete typ kuželosečky 2x2 — 2xy + 3y2 — x + y — 1=0.
2 -1
Řešení. Determinant
-1 3
i i
"2 2
2
1
2 -1
5 > 0 jde tedy
(přepočtěte!). Má tedy / v nových souřadnicích analytický tvar a[lx\2 + h, kde h je kvadratická forma nezávislá na proměnné X\.
Z technických důvodů bývá lepší zvolit v nové bázi v\ = u\, opět dostaneme výraz f = f\ + h, kde f\ závisí pouze na x[, zatímco v h se x[ nevyskytuje. Přitom pak g(vi ,v\) = an.
(2) Předpokládejme, že po provedení kroku (1) dostaneme pro h matici (řádu o jedničku menšího) s koeficientem u x'2 2 různým od nuly. Pak můžeme zopakovat přesně stejný postup a získáme vyjádření / = f\+f2+h, kde v h vystupují pouze proměnné s indexem větším než dvě. Tak můžeme postupovat tak dlouho, až buďprovedeme n—1 kroků a získáme diagonální tvar, nebo v řekněme /-tém kroku bude prvek právě získané matice nulový.
(3) Nastane-li poslední možnost, ale přitom existuje jiný prvek újj 0 s j > i, pak stačí přehodit i-tý prvek báze s 7-tým a pokračovat podle předešlého postupu.
(4) Předpokládejme, že jsme narazili na situaci cijj = 0 pro všechny j > /. Pokud přitom neexistuje ani žádný jiný prvek cijk ^ Os j > /, k > /, pak jsme již úplně hotovi, neboť jsme již dosáhli diagonální matici. Předpokládejme, že ^ 0. Použijeme pak transformaci v j = u j + uk, ostatní vektory báze ponecháme (tj. x'k = xk — Xj, ostatní zůstávají). Pak h(vj, Vj) = h(uj, Uj) + h(uk, uk) + 2h(uk, uj) = 2a,jk ^ 0 a můžeme pokračovat podle postupu v (1). □
4.31. Afinní klasifikace kvadratických forem. Po výpočtu polární báze Lagrangeovým algoritmem můžeme ještě vylepšit bázové vektory pomocí násobení skalárem tak, aby v příslušném analytickém vyjádření naší formy vystupovaly v roli koeficientů u kvadrátů jednotlivých souřadnic pouze skaláry 1, —1 a 0. Následující věta o setrvačnosti říká navíc, že počet jedniček a mínus jedniček nezávisí na našich volbách v průběhu algoritmu. Tyto počty nyzýváme signaturou kvadratické formy. Opět tedy dostáváme úplný popis kvadratických forem ve smyslu, že dvě takové formy jsou převoditelná jedna na druhou pomocí afinní transformace tehdy a jen tehdy, když mají stejnou signaturu.
Věta. Pro každou nenulovou kvadratickou formu hodnosti r na reálném vektorovém prostoru V existuje celé číslo 0 < p < r a r nezávislých lineárních forem 0 zatímco pro v e <2je/(?j) < 0. Nutně tedy platí P f) Q = {0}, a proto dim P + dim Q < n. Odtud plyne p + (n — q) V vektorového prostoru na sebe .invertibilní, všechna projektivní zobrazení projektiv-I prostoru V„ na sebe jsou tedy invertibilní též. Říká se aké regulární kolineace nebo projektivní transformace. svídají v homogenních souřadnicích invertibilním mati-iimenze n + 1. Dvě takové matice zadávají stejnou pro-vní transformaci, právě když se liší o konstantní náso-
festliže si zvolíme první souřadnici jako tu, jejíž nulovost je nevlastní body, budou transformace, které zachovávají istní body, dány maticemi, jejichž první řádek musí být i první člen nulový. Jestliže budeme chtít přejít do afm-mcn souřadnic konečných bodů, tj. zafixujeme si hodnotu první souřadnice na jedničku, musí být první prvek na prvním řádku být také rovný jedné. Matice kolineací zachovávajících konečné body našeho afinního prostoru tedy mají tvar:
(l 0 ••• 0 \
,K)J
kde b = ib\,...,bn)L e W a A = (a^) je invertibilní matice dimenze n. Působení takové matice na vektoru (1, x\, ..., xn) je právě obecná afinní transformace, kde b zadává posunutí a A její lineární část. Jsou tedy afinní zobrazení právě ty kolineace, které zachovávají nadrovinu nevlastních bodů.
4.38. Určení kolineací. K zadání afinního zobrazení je nutné a stačí libovolně zadat obraz afinního repéru. V právě uvedeném popisu afinních transformací jako speciálního případu projektivních zobrazení to odpovídá vhodné volbě obrazu vhodné aritmetické báze vektorového prostoru V.
Obecně ale neplatí, že obraz aritmetické báze V jednoznačně určí kolineací. Ukažme si podstatu problému na jednoduchém příkladu afinní roviny. Jestliže si zvolíme v rovině čtyři body A, B, C, D tak, aby každá z nich utvořená trojice byla v obecné poloze (tj. žádné tři z nich neleží na jedné přímce), můžeme si libovolně zvolit jejich obraz v kolineací následujícím způsobem:
Zvolme jakkoliv jejich čtyři obrazy A', B', C, D' se stejnou vlastností a zvolme si jejich homogenní souřadnice u, v, w, z, u', v', w', z' vl3. Vektory z a z'pak můžeme jistě zapsat pomocí lineárních kombinací
z = c\u + c2v + c3w, z' = c\u' + c'2v' + c'3w',
přičemž všech šest koeficientů musí být nenulových, neboť jinak by některá trojice z našich bodů nebyla v obecné poloze.
Nyní si zvolíme nové aritmetické reprezentanty bodů A, S a C poradě jako ú = c\u,v = c2v aw = c3w a stejně ú' = c\u', v' = c2v' a w' = c3w' pro body A', B' a C. Tato volba zadává jediné lineární zobrazení de naJíl,
L J L J nejaký elementární
projektivní přímky.
Lze ale dokáz; jakkoliv malé otevřené oblasti v afinním prostoru
klasický důkaz jako
T , ji', jíl m ~.~' . ' ~ u ' ilustraci pro dif.
Lze ale dokázat daleko simejsi tvrzeni, ze zobrazeni počet p^ dodat
(n aDř o^32' jinak tady jen říci, že se tomu
koule bez hranice), do téhož afinního prostoru, které zobra- nebudeme věnovat zuje přímky na přímky, je ve skutečnosti zúžením jednoznačně určené projektivní transformace projektivního rozšíření VW+1 původního afinního prostoru W. A tyto transformace tedy nutně zachovávají i dvojpoměry.
Dualita. Projektivní nadroviny jsou definovány v n-rozměrném projektivním prosotu V(V) jako projek-tivizace rc-rozměrných vektorových podprostorů ve vektorovém prostoru V. Jsou tedy v homogenních souřadnicích definovány jako jádra lineárních forem a e V*, které jsou opět určeny až na skalární násobek.
Ve zvolené aritmetické bázi jsou tedy projektivní nadroviny dány řádkovým vektorem a = (a0, ..., an). Přitom ale jsou formy a dány jednoznačně, až na skalární násobek. Každá nadrovina ve V tedy je identifikována s právě jedním geometrickým bodem v projektivizací duálního prostoru V(V*). Hovoříme o duálním projektivním prostoru a dualitě mezi body a nadrovinami.
Na formách působí lineární zobrazení zadávající danou kolineací pomocí násobení řádkových vektorů zprava toutéž maticí
(«0, - - - , Oín) H> O! • A,
tj. matice duálních zobrazení je AT. Duální zobrazení ovšem zobrazuje formy opačným směrem z „cílového prostoru" ne „počáteční", proto potřebujeme pro současné studium vlivu regulární kolineace na body a jejich duální nadroviny zobrazení inverzní ke kolineaci /. To je dáno maticí A-1. Matice příslušného působení kolineace na formách je proto (Ar)_1. Protože je přitom inverzní matice rovna algebraicky adjun-gované matici A*lg, až na násobek inverzí determinantu, viz vztah (2.2) na str. 92, můžeme rovnou pracovat s projektivní transformací prostoru V(V*) zadanou maticí (A*lg)r (nebo bez transoponování, pokud násobíme řádkové vektory zprava).
Okamžitě z definic je vidět, že projektivní bod X patří nadrovině a, když pro jejich aritmetické souřadnice platí a ■ x = 0. To samozřejmě zůstává v platnosti i po působení libovolnou kolineací, protože opět
(a ■ A ) • (A • x)
a ■ x
0.
4 . 3ř
234
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
4.41. Samodružné body, středy a osy. Uvažujme regulárni kolineaci / zadanou v nějaké aritmetické 1__bázi projektivního prostom V(V) pomoci matice A.
Samodružným bodem kolineace / rozumíme bod A, který je zobrazen na sebe, tj. f (A) = A, samodruznou nadrovinou kolineace f rozumíme nadrovinu a, která je zobrazována na sebe, tj. f (a) c a.
Přímo z definice tedy vidíme, že samozdružné body mají za aritmetické reprezentanty právě vlastní vektory matice A.
V geometrii roviny jsme se s mnoha typy kolineaci již jistě setkali: symetrie podle středu, zrcadlení podle přímky, posunutí, stejnolehlost atd. Možná vzpomeneme i na různé typy promítání, např. promítání jedné roviny v M3 na druhou z nějakého středu S e M3.
Všimněme si, že kromě samodružných bodů se u všech takových afinních zobrazení objevovaly také samodružné přímky. Např. u symetrie podle středu se zachovávají také všechny přímky tímto středem procházející, u posunutí se (obdobně) zachovávají nevlastní body roviny.
Zastavíme se u tohoto jevu v obecné dimenzi. Nejprve zavedeme potřebné velmi klasických pojem související s incidencí bodů a nadrovin.
Trs nadrovin procházejí bodem A e V(V) je množina všech nadrovin, které obsahují bod A. Z definice je zřejmé, že pro každý bod A je příslušný trs nadrovin sám nadrovinou v duálním prostoru V(V*) (je zadán jednou homogenní lineární rovnicí v aritmetických souřadnicích).
Pro kolineaci / : V(V) -» V(V) řekneme, že bod S e V(V) je středem kolineace f jestliže všechny nadro-viny v trsu nadrovin určeném bodem S jsou samodružné. Řekneme, že ňadro vina a je osou kolineace f, jestliže jsou všechny její body samodružné.
Přímo z definice je zřejmé, že osa kolineace je středem kolineace duální, zatímco trs nadrovin zadávajících střed kolineace je sám osou kolineace duální.
Protože matice kolineace na původním a duálním prostoru se liší pouze transpozicí, jejich vlastní čísla splývají (vlastní vektory jsou sloupcové, resp. řádkové, k týmž vlastním číslům). Např. v projektivní rovině (a ze stejného důvodu v každém reálném projektivním prostoru sudé dimenze) má každá kolineace alespoň jeden samodružný bod, protože charakteristické polynomy příslušných lineárních zobrazení jsou lichého stupně a tedy mají alespoň jeden reálný kořen.
Nebudeme se již zde dále věnovat obecné teorii, ale budeme aspoň krátce ilustrovat její užitečnost na několika výsledcích pro projektivní roviny.
Tvrzení. Projektivní transformace roviny různá od identity má buď právě jeden střed a právě jednu osu, nebo nemá ani střed ani osu.
Důkaz. Uvažme kolineaci / na VM? a uvažme, že by měla dva různé středy A a B. Označme i přímku zadanou těmito středy a zvolme bod X v projektivní rovině mimo i.
Podle předchozí věty je tečna polárou bodu P, který má homogenní souřadnice (1:1: 1). Taje dána rovnicí (1, 1, l)A(x, y, z)T = 0, což v našem případě dává rovnici
2y - 2z = 0
Přechodem zpět k nehomogenním souřadnicím dostaneme rovnici tečny y = 1.
□
4.61. Určete souřadnice bodu dotyku osy y s kuželosečkou zadanou
rovnici
5x2 + 2xy + y2 - 8x = 0
Řešení. Osa y, tj. přímka x = 0, je polárou hledaného bodu P s homogenními souřadnicemi (p) = (pi : p2 : pj,). To znamená, že rovnice x = 0 je ekvivalentní rovnici poláry F(p,v) = pTAv = 0, kde v = (x, y, z,)T-To je splněno právě v případě, když Ap = (a, 0, 0)T pro nějaké a e M. Tato podmínka dává pro matici naší kuželosečky
A '
soustavu rovnic
5pi + P2 - 4p3 = aj Pi + P2 = 0 -4Pl = 0
Buď můžeme najít souřadnice bodu P pomocí inverzní matice, p = A~l(a, 0, 0)T, nebo vyřešit tuto soustavu rovnic přímo, zpětným dosazováním. V tomto případě takto dostaneme lehce řešení p = (0, 0, —\a). Osa y se tedy dotýká kuželosečky v počátku. □
4.62. Určete bod dotyku přímky x = 2 s kuželosečkou z předchozího příkladu.
Řešení. Přímka má v projektivním rozšíření rovnici x — 2z, = 0, a proto v tomto případě dostaneme pro bod dotyku P podmínku Ap = (a, 0, —2a), což dává soustavu
5pi + P2 - 4p3 = a Pi + P2 = 0 —4pi = —2a
Jejím řešením j e p = (^a, — \a, \ a). Tyto homogenní souřadnice j sou ekvivalentní souřadnicím (2, —2, 1) a proto proto má bod dotyku souřadnice [2, —2]. □
235
C. GEOMETRIE KVADRATICKÝCH FOREM
3. PROJEKTIVNÍ GEOMETRIE
4.63. Najděte rovnice tečen sestrojených z bodu P= [3, 4] ke kuželosečce zadané rovnicí
2xl
4xy + y2 - 2x + 6y - 3 = 0
Řešení. Předpokládejme, že bod dotyku T hledané tečny má homogenní souřadnice dané násobky vektoru t = (t\,t2, h). Podmínka, že T leží na kuželosečce je tT At = 0, což dává
2tf
\t\h + zf - 2řiř3 + 6ŕ2ŕ3 - 3t
0
Podmínka, že bod P leží na poláře bodu T je pT At = 0, kde p = (3, 4, 1) jsou homogenní souřadnice bodu P. Tato rovnice v našem případě dává
(3,4, 1)
-2 -1
Nyní můžeme dosadit například t2 = 3ři tické) rovnice. Potom dostaneme
-3ři + t2 + 6ř3 = 0 6ř3 do předchozí (kvadra-
4 . 42
-tf +4řiř3 - 3/f = 0
Protože pro f3 = 0 rovnice není splněna, můžeme přejít k nehomogenním souřadnicím (tj-, ^, 1), pro které dostáváme
*3 *3 r
"(£)2 + 4(£)-3
0
t3
3(|)
1 a £
-3, nebo -
*3
3 a a
*3
3. Body dotyku tedy mají homogenní souřadnice (1 : —3 : 1) a (3 : 3 : 1). Rovnice tečen dostaneme jako poláry těchto bodů. Výsledné rovnice tečen jsou Ix — 2y - 13 = Oax = -3. □
4.64. Napište rovnici tečny vedené počátkem ke kružnici zadané rovnicí
x2 + y2 - lOx - 4y + 25 = 0 Řešení. Bo dotyku (t\ : t2 : ř3) splňuje
/i 0 -5\AA (0, 0, 1) 0 1 -2 \\t2 = —5ři - 2ř2 + 25 = 0 \-5 -2 25/ VV
Odtud vyjádříme např. t2 a dosadíme do rovnice kuželosečky (kružnice), kterou musí bod (t\ : t2 : ř3) také splňovat. Dostaneme kvadratickou rovnici 29í2 - 250ři + 525 = 0, která má řešení t\ = 5 a t\ = Souřadnici ř2 dopočítáme a získáme body dotyku [5, 0] a [^, ^]. Hledané tečny jsou pak poláry těchto bodů. Ty mají rovnice y = 0a20x - 21y = 0.
Najděte rovnice tečen ke kružnici x2 + y2 = 5 rovnoběžných s přímkou 2x + y + 2 = 0.
Jsou-li p a q po řadě přímky procházející dvojicemi bodů (A, X) a (£, X), pak také f(p) = p a /() = 9 a tedy zejména je i bod X samodružný. To ale znamená, že všechny body roviny mimo L jsou samodružné. Každá přímka různá od i má tedy všechny body mimo i samodružné a proto je i její průnik s i samodružný. Je tedy / identické zobrazení a dokázali jsme, že neidentická projektivní transformace může mít nejvýše jeden střed. Tatáž úvaha pro duální projektivní rovinu nám dává výsledek o nejvýše jediné ose.
Jestliže má / střed A, pak všechny přímky procházející A j sou samodružné a odpovídaj í proto dvourozměrnému pod-prostoru vlastních řádkových vektorů příslušné matice pro transformaci /. Proto bude existovat dvourozměrný prostor sloupcových vlastních vektorů ke stejnému vlastnímu číslu a ten bude reprezentovat právě přímku samodružných bodů, tedy osu. Tatéž úvaha v obráceném pořadí dokazuje i opačné tvrzení — jestliže má projektivní transformace roviny osu, má i střed. □
Pro praktické problémy je užitečné i pro reálnou rovinu pracovat v jejích komplexním projektivním rozšíření a geometrické chování transformací je pak velmi dobře čitelné z případné existence reálných či imaginárních středů a os.
4.42. Projektivní klasifikace kvadrik. Závěrem se ještě vrátíme ke kuželosečkám a kvadrikám. V «-rozměrném afinním prostoru W zadáváme kvadriku Q v afinních souřadnicích pomocí obecné kvadratické rovnice (4.4), viz str. 222. Pohlížíme-li na afinní prostor W jako na afinní souřadnice v projektivním prostoru VM"+l, můžeme chtít tutéž množinu Q popsat pomocí homogenních souřadnic v projektivním prostoru. V nich by mělo jít o výraz, jehož všechny členy jsou druhého řádu, protože pouze vynulování takového homogenního výrazu bude mít pro homogenní souřadnice bodu smysl nezávisle na zvoleném konstantním násobku souřadnic (jco, jci, ..., xn). Hledáme tedy takový výraz, jehož zúžením na afinní souřadnice, tj. dosazením x0 = 1, získáme původní výraz z (4.4).
To je ale mimořádně jednoduché, prostě dopíšeme dostatek x0 ke všem výrazům - žádný ke kvadratickým členům, jedno k lineárním a x% ke konstantnímu členu v původní afinní rovnici pro Q.
Získáme tak dobře definovanou kvadratickou formu / na vektorovém prostoru W+1, jejíž nulové body korektně definují tzv. projektivní kvadriku Q.
Průnik „kužele" Q c nulových bodů této formy
s afinní rovinou x0 = 1 je původní kvadrika Q, jejíž body označujeme jako vlastní body kvadriky, zatímco další body Q \ Q v projektivním rozšíření jsou body nevlastní.
Klasifikace reálných či komplexních projektivních kvadrik, až na projektivní transformace, je úlohou, kterou jsme již zvládli — jde prostě o nalezení kanonické polární báze, viz odstavec 4.29. Z této klasifikace dané v reálném případě signaturou formy, v komplexním pouze hodností, vcelku snadno
236
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
můžeme dovodit i klasifikace kvadrik afinních. Stačí si všímat množiny nekonečných bodů v projektivním rozšíření naší afinní kvadriky. Ukážeme si podstatu postupu na případu kuželoseček v afinní a projektivní rovině.
Projektivní klasifikace dává následující možnosti, popsané v homogenních souřadnicích (x : y : z) v projektivní rovině VM3:
• imaginární regulární kuželosečka zadaná x2 + y2 + z2 = 0
• reálná regulární kuželosečka s rovnicí x2 + y2 — z2 = 0
• dvojice imaginárních přímek s rovnicí x2 + y2 = 0
„2_0
y
• dvojice reálných přímek s rovnicí x2
• dvojnásobná přímka x2 = 0.
Klasifikaci uvažujeme jako reálnou, tj. klasfikace kvadratických forem je dána nejen hodností, ale i signaturou, nicméně body kvadrik pak uvažujeme i v komplexním rozšíření. Tak je třeba chápat uvedené názvy, např. imaginární kuželosečka nemá žádné reálné body.
4.43. Afinní klasifikace kvadrik. Pro afinní klasifikaci musíme omezit projektivní transformace na ty, které zachovávají přímku nevlastních bodů. To ale můžeme také realizovat opačným postupem — pro zvolený projektivní typ kuželosečky Q, tj. její kužel gc83 budeme postupně různě volit afinní rovinu a c M3 neprocháející počátkem a sledovat, jak se mění množina bodů Q ľ\ a, které jsou v afinních souřadnicích realizovaných pomocí roviny a vlastními body Q.
V případě reálné regulární kuželosečky tedy máme k dispozici skutečný kužel Q zadaný rovnicí z2 = x2 + y2 a za rovinu a berme třebas tečné roviny jednotkové sféry. Začneme-li s rovinou z = 1, dostaneme jako průnik samé konečné body v ní ležící jednotkové kružnice Q. Postupnýnm nakláněním a budeme dostávat protaženější a protaženější elipsy, až dosáhneme náklonu a rovnoběžného s jednou z přímek kužele. V tom okamžiku se již objeví jeden (dvojnásobný) nekonečný bod naší kuželosečky, jejíž konečné body ale stále tvoří jednu souvislou komponentu, a dostáváme parabolu parabola. Pokračováním naklánění vzniknou nekonečné body dva a množina konečných bodů přestane být souvislá a tak dostáváme poslední regulární kvadriku v afinní klasifikaci, hyperbolu.
Z uvedeného postupu si můžeme vzít poučení, které nám snadno umožní pokračovat do vyšších dimenzí. Předně, si všimněme, že průnikem naší kuželosečky s projektivní přímkou nevlastních bodů je vždy opět kvadrika v dimenzi o jedničku nižší, tj. v našem případě šlo o prázdnou množinu nebo dvojnásobný bod nebo dva body jakožto typy kvadrik na projektivní přímce. Dále jsme zjistili, že afinní transformaci převádějící jednu z možných realizací zvoleného projektivního typu na druhou jsme našli jen tehdy, když příslušné kvadriky v nevlastní přímce byly projektivně ekvivalentní. Takovýmto způsobem lze pokračovat v klasifikaci kvadrik v dimenzi tři a dále.
V projektivním rozšíření se tyto tečny protínají v nevlastním bodě splňujícím 2x + y + z = 0 tj. v bodě s homogenními souřadnicemi (1 : —2 : 0). Jsou to tedy tečny spuštěné z tohoto bodu ke kružnici a postupovat můžeme stejně jako v předchozím příkladě. Matice kuželosečky (kružnice) je diagonální s diagonálou (1, 1, —5) a proto bod dotyku (ři : t2 : t3) hledaných tečen splňuje t\ — 2ř2 = 0. Dosazením o rovnice kružnice dostaneme 5í2 = 5. Odtud máme ř2 = ±1 a body dotyku proto jsou [2, 1] a [—2, —1]. □
2 2
4.65. Určete tečnu k elipse tz + \
16
5 ■
5 , 5 j. Tečny jsou
1 rovnoběžnou s přímkou x + y - 7 = 0.
Řešení. Rovnoběžky s danou přímkou se s ní protínají v nevklastním bodě (1 : — 1 : 0). Z tohoto bodu spustíme tečny k dané elipse. Bod dotyku T= (ři : ř2 : ř3) leží na jeho poláře a proto splňuje ^ — j = 0, tj. ř2 = j^t\. Dosazením do rovnice elipsy pak dostáváme t\ Body dotyku hledaných tečen tak jou [y, f ] a [ — -pak poláry těchto bodů. Ty mají rovnice x + y = 5ax + y = —5.
Tečna v nevlastním bodě kuželosečky se nazývá asymptota kuželosečky. Počet asymptot kuželosečky se tedy rovná počtu průsečíků kuželosečky s přímkou nevlastních bodů, tj. elipsa nemá žádnou reálnou asymptotu, parabola má jednu (která je ovšem nevlastní přímkou) a hyperbola dvě. □
4.66. Určete nevlastní body a asymptoty kuželosečky zadané rovnicí 4x2 - 8xy + 3y2 - 2y - 5 = 0
Řešení. Nejprve napíšeme rovnici kuželosečky v homogenních souřadnicích.
4x2 - 8xy + 3y2 - 2yz - 5z2 = 0
Nevlastní body kuželosečky jsou pak body určené homogenními souřadnicemi (x : y : 0) splňující tuto rovnici, to znamená
4x2 - 8xy + 3y2 = 0.
Pro podíl - dostaneme dvě řešení: -
fy y
1 X - ~ d —
2 y
\. Zadaná ku-
želosečka je tedy hyperbola s nevlastními body P= (—1 : 2 : 0) a Q= (—3:2:0). Asymptoty jsou potom poláry bodů P a Q, tj.
-\2x + 10y - 2 = 0
4 -4 0 \ x
-4 3 -1 V
0 -1 -5/ \l
(-3,2, 0)
4 -4 0 \ x
-4 3 -1 V
0 -1 -5/ \l
-20x + 18y - 2 = 0
□
237
C. GEOMETRIE KVADRATICKÝCH FOREM
3. PROJEKTIVNÍ GEOMETRIE
4.67. Určete nevlastní body a asymptoty kuželosečky zadané rovnicí 2x2 + 4xy + 2y2 - y + 1 = 0
Řešení, rovnice nevlastních bodů 2x2 + 4xy + 2ý- = 0 má řešení | = — 1. Jediným nevlastním bodem je tedy (1 : — 1 : 0) (daná kuželosečka jeparabola). Asymptota je polára tohoto bodu a tou je nevlastní přímka z = 0. □
4.68. Dokažte, že součin vzdáleností bodu libovolného bodu hyperboly od jejích asymptot je konstantní a určete velikost této konsatnty.
Řešení. Označme bod na hyperbole P. Rovnice asymptot hyperboly v kanonickém tvaruje bx ± ay = 0. Jejich normály jsou tedy (b, ±a) a odtud určíme průměty Pi, P2 bodu P na asymptoty. Pro vzdálenost bodu P od asymptot pak dostáváme \P Pit2\
čin je tedy roven
a2Í-b2p a2+b2
^ÉĚEi. Hledaný sou-
a2+h2> protože bod P leží na hyperbole.
□
aLbL
4.69. Určete úhel asymptot hyperboly 3x2 — y2 = 3.
Řešení. Pro kosinus úhlu, který svírají asymptoty hyperboly v kanonickém tvaru lze odvodir cos a = f2+^a2 ■ V našem případě tak dostáváme úhel 60°. □
4.70. Určete středy kuželoseček:
(a) 9x2 + 6xy - 2y - 2 = 0
(b) x2 + 2xy + y2+2x+y+2
(c) x2 - 4xy + 4y2 + 2x - 4y - 3 *2 1
(d) S^ + äĽJtt
Řešení, (a) Soustava As + a =0 pro výpočet vlastních středů má tvar
9si + 3s2 3*i -2
0 0
0 0
a jejím vyřešením dostaneme střed [|, —2].
(b) V tomto případě máme
^1+^2 + 1
^1+^2 + 5
a proto žádný vlastní střed neexistuje (kuželosečka je parabola). Pokud přejdeme do homogenních souřadnic, dostaneme nevlastní střed (1 : -1:0).
(c) Souřadnice středu v tomto případě splňují
si — 2s2 + 1 -2si +4s2-2
0 0
a řešením je tedy celá přímka středů. Je to proto, že kuželosečka je degenerovaná do dvojice rovnoběžných přímek.
238
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
(d) Z rovnic pro výpočet středu okamžitě plyne, že středem je (a, P). Souřadnice středu tedy udávají posunutí počátku souřadnic k repéru, ve kterém má epipsa základní tvar.
□
4.71. Určete rovnice os kuželosečky dané rovnicí 6xy + 8y2 + 4y + 2x - 13 = 0.
Řešení. Hlavní směry kuželosečky (směrové vektory os) jsou vlastní vektory matice (!? \ ). Charakteristická rovnice má tvar k2 — Sk —
3
9 = 0 a vlastní čísla jsou proto k\ = — 1, k2 = 9. Příslušné vlastní vektory jsou pak (3, —1) a (1, —3). Osy jsou polárami nevlastních bodů určených těmito směry. Pro (3, —1) tak dostáváme rovnici osy -3x + y + 1 = 0 a pro (1, -3) osu -9x - 21y - 5 = 0. □
4.72. Určete rovnice os kuželosečky dané rovnicí 4x2 + 4xy + y2 + 2x + 6y + 5 = 0.
/4 2\
Řešení. Vlastní čísla matice I ^ I jsou k\ = 0, k2 = 5 a příslušné
vlastní vektory (—1,2) a (2, 1). Pro osy pak dostáváme rovnice 5 = 0 a 2x + y + 1 = 0. První z nich očividně není splněna pro žádný bod. Existuje tedy jen jedna osa (zadaná kuželosečka je parabola). □
4.73. Harmonický dvojpoměr. Je-li dvojpoměr čtyř bodů ležících na přímce roven — 1, hovoříme o tzv. harmonické čtveřici. Nechť je dán čtyřúhelník ABCD. Označme K průsečík přímek AS a CD, M průsečík přímek AD a BC. Dále nechť L, resp. N, je průsečík přímky KM s přímkou AC, resp. BD. Ukažte, že body K, L, M, N tvoří harmonickou čtveřici.
239
d. doplňující príklady k cele kapitole
3. projektivní geometrie
D. Doplňující příklady k celé kapitole
4.74. Parametricky vyjádřete průnik následujících rovin v M3: er:2x+3y — z + 1 = 0 a p : x — 2y + 5 = 0.
4.75. Nalezněte osu mimoběžek
p : [1, 1, 1] + ř(2, 1, 0), q : [2, 2, 0] + f (1, 1, 1).
4.76. Jarda stojí v bodě [—1, 1, 0] a má tyč délky 4. Může se touto tyčí současně dotknout přímek p a q, kde
p : [0,-1,0] + ř(l,2, 1), q : [3,4, 8] + s(2, 1, 3)? (Tyč musí procházet bodem [—1, 1,0].)
4.77. Je dána krychle A SCD EFGH. Nechť bod T leží na hraně BF ,\BT\ = \\BF\. Určete kosinus odchylky rovin ATC a BZ)£".
4.78. Je dána krychle ABCDEFGH. Nechť bod T leží na hraně AE, \ AT\ = \\AE\ a 5 je střed strany AD. Určete kosinus odchylky rovin BDT a SCH.
4.79. Je dána krychle A BCD EFGH. Nechť bod T leží na hraně BF ,\BT\ = \\BF\. Určete kosinus odchylky rovin ATC & BDE.
240
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
Řešení cvičení
4.9. 2, 3, 4, 6, 7, 8. Polohy rovin, které realizují dané počty si rozmyslete samostatně.
4.26. Pro normálový vektor (a, b, c) hledaných rovin máme rovnice a + b = 0 (kolmost na p) a volbou a — —b — 1 (vektor (0, 0, 1) nevyhovuje podmínkám, takže vhodným pronásobením můžeme dosáhnout
— 5, celkem pak hledané
rovnice přímek jsou x — y ± Vó —1=0.
4.31. (-1,3,2).
4.74. Přímka (2ř, t, It) + [-5, 0, -9].
4.75. [3,2, l][8/3, 8/3,2/3].
4.76. Příčka [1, 1, l][-3, 1, -1], délky V2Ô, tyč stačit nebude.
4.77. ^
4.78. ^.
4.79.
podmínky a = —b — 1) pak dostáváme z podmínky pro odchylku
V^v/2+e2
241
KAPITOLA 5
Zřízení ZOO
jaké funkce potřebujeme pro naše modely?
— pořádný zvěřinec...
V této kapitole začneme budovat nástroje umožňujících modelování závislostí, které nejsou ani lineární ani diskrétní. S takovou potřebou se často setkáme, když popisujeme systém vyvíjející se v čase a to nejen v několika vybraných okamžicích, ale „souvisle", tj. pro všechny možné okamžiky. Někdy je to přímo záměr či potřeba (třeba ve fyzikálních modelech klasické mechaniky), jindy je to vhodné přiblížení diskrétního modelu (třeba u ekonomických, chemických nebo biologických modelů).
Klíčovým pojmem budou stále funkce. Čím větší třídu funkcí připustíme, tím obtížnější bude vybudovat nástroje pro naši práci. Když ale bude různých typů funkcí málo, nebudeme patrně umět budovat dobré modely pro reálné situace vůbec. Cílem následujících dvou kapitol bude proto explicitně zavést několik typů elementárních funkcí, implicitně popsat daleko více funkcí a vybudovat standardní nástroje pro práci s nimi. Souhrnně se tomu říká diferenciální a integrální počet jedné proměnné. Zatímco dosud jsme se spíše pohybovali v oblasti matematiky nazývané algebra, nyní se budeme postupně blížit k tzv. matematické analýze.
1. Interpolace polynomy
V předchozích kapitolách jsme pracovali často s posloupnostmi hodnot reálných nebo komplexních čísel, tj. se skalárními funkcemi N -» K nebo Z -» K, kde K byl zvolený číselný obor. Případně jsme pracovali s posloupnostmi vektorů nad reálnými nebo komplexními čísly.
Připomeňme si diskusi z odstavce 1.4, kde jsme přemýšleli nad způsoby, jak pracovat se skalárními funkcemi. Na této diskusi není třeba nic doplňovat a rádi bychom (pro začátek) uměli pracovat s funkcemi M -» M (reálné funkce reálné proměnné) nebo M -» C (komplexní funkce reálné proměnné), případně funkcemi Q -» Q (funkce jedné racionální proměnné s racionálními hodnotami) apod. Většinou půjdou naše závěry snadno rozšířit na případy s vektorovými hodnotami nad stejnými skaláry, ve výkladu se ale zpravidla omezíme jen na případ reálných a komplexních čísel.
Začneme od nejednodušších funkcí, které umíme zadat explicitně pomocí konečně mnoha algebraických operací se skaláry.
A. Interpolace polynomy
Na úvod této kapitoly se budeme snažit odhadnout funkce pomocí polynomů. Předpokládejme, že o neznámé funkci máme pouze kusé informace, totiž její hodnoty v několika bodech, popřípadě i hodnoty její první či druhé derivace v těchto bodech. Budeme se snažit najít polynom (co nejmenšího stupně) splňující tyto závislosti.
5.1. Nalezněte polynom P splňující následující podmínky:
P(2) = 1, P(3) = 0, P(4) = -1, P(5)
Řešení. Řešíme buď přímo, t.j. sestavením soustavy čtyř lineárních rovnic o čtyřech neznámých. Předpokládáme polynom ve tvaru a3x3 + a2x2 + a\X\ + a0. Víme, že polynom stupně nejvýše tři splňující podmínky v zadání je dán jednoznačně.
«0 + 2fli + 4a2 + 8^3 = 1
«0 + 3fli + 9a2 + 21 a3 = 0
ao + 4a\ + I6a2 + 64a3 = —1
«0 + 5fli + 25a2 + 125^3 = 6.
Každá rovnice vznikla z jedné z podmínek v zadání.
243
A. INTERPOLACE POLYNOMY
1. INTERPOLACE POLYNOMY
Druhou možností je vytvořit hledaný polynom pomocí fundamentálních Lagrangeových polynomů (viz 5.4):
(jc-3)(jc-4)(jc-5)
P(x) = 1-------- + 0- (...) +
(2-3)(2-4)(2-5)
(x-2)(x-3)(x-5) (x-2)(x-3)(x-4) ' (4 - 2)(4 - 3)(4 - 5) ' (5 - 2)(5 - 3)(5 - 4)
4 , ,101
= -z3 - 12Z2 + —z - 29. 3 3
Koeficienty tohoto polynomu jsou samozřejmě jediným řešením výše sestavené soustavy lineárních rovnic. □
5.2. Nalezněte polynom P splňující následující podmínky: P(l + i) = i, P(2) = 1, P(3) = -i.
5.3. Pro navzájem různé body x0, ..., xn e M. uvažme elementární Lagrangeovy polynomy (5.4)
Z,.(jc) := jceR, i=0,...,n.
Dokažte, že platí
n
E (x) = 1 pro všechna x e M.
Řešení. Zřejmě je
£/;(x0) = l + 0 + --- + 0=l,
i=0
5. la
E^(*i) = o+i + --- + o = i,
E^(*») = o + o + --- + i = i.
To znamená, že polynom Jľľ=o ^ (x) stupně nejvýše n nabývá v n + 1 bodech x0, ..., xn stejné hodnoty 1. Takový polynom (stupně nejvýše ň) však existuje právě jeden, a to konstantní polynom y = 1.
□
5.4. Nalezněte polynom P splňující následující podmínky: P(\) = 0, P'(l) = 1, P(2) = 3, P'(2) = 3.
Řešení. Opět ukážeme dvě možnosti řešení.
Dané podmínky určují čtyři lineární rovnice pro koeficienty hledaného polynomu. Budeme-li hledat polynom třetího stupně, dostáváme
5.1. Polynomy. Skaláry umíme sčítat a násobit a tyto ope-Mtés- race splňují řadu vlastností, které jsme vyjme-■*-nh novali už v odstavcích 1.1 a 1.3. Když připustíme konečný počet těchto operací, přičemž jednu proměnnou ponecháme jako neznámou a další vstupující skaláry budou pevně zvolené, dostáváme tzv. polynomy: j Polynomy ^ Polynomem nad okruhem skalárů ] / : K -» K dané výrazem
.«-i
[ rozumíme zobrazení
1
f(x) = a„x" + a„-ix" + • • • + cl\x + ao,
kde cii, i = 0, ... ,n, jsou pevně zadané skaláry, násobení je znázorněno prostým zřetězením symbolů a „+" označuje sčítání. Pokud je a„ ^ 0, říkáme, že polynom / je stupně n. Stupeň nulového polynomu není definován. Skaláry a; označujeme jako koeficienty polynomu f. ^^^^^^^^^^^^
Polynomy stupně nula jsou právě konstantní nenulová zobrazení x \-> a0. V algebře jsou častěji polynomy definovány jako formální výrazy uvedeného tvaru f(x), tj. jako posloupnosti koeficientů Clo, Cl\, . . . s konečně mnoha nenulovými prvky. V zápětí si ale ukážeme, že v analýze budou oba přístupy ekvivalentní.
Je snadné ověřit, že polynomy nad okruhem skalárů tvoří opět okruh, kde násobení a sčítání je dáno operacemi v původním okruhu K pomocí hodnot polynomů, tzn.
(/ • *)(*) = /(*) • řW, (/ + *)(*) = /(*) + sW,
kde nalevo a napravo musíme správně interpretovat příslušné operace v okruhu polynomů a v samotném okruhu skalárů.
5.2. Dělení polynomů se zbytkem. Jak jsme již zmínili, budeme v dalším pracovat výhradně s poli skalárů Q, M nebo C. Pro všechna pole skalárů však platí
Tvrzení (O dělení polynomů se zbytkem). Pro libovolné polynomy f stupně n a g stupně m, existují jednoznačně určené polynomy q ar takové, že f = q ■ g + r a přitom je stupeň r menší než m neboje r = 0.
Důkaz. Začněme jednoznačností. Předpokládejme, že IJ' „ máme dvě požadovaná vyjádření polynomu / s polynomy g,g', r a r1, tj. platí
q-g+r =q -g + r.
Pak také odečtením dostaneme 0 = (q — q') ■ g + (r — r').
Jestliže q = q1, pak také r = r1. Je-li q ^ q1, pak člen s nejvyšším stupněm v (q< — q') ■ g nemůže být vykompenzován r — r1, což vede na spor. Dokázali jsme tedy jednoznačnost výsledku dělení, pokud existuje.
Zbývá dokázat, že umíme polynom / vždy napsat požadovaným způsobem. Pokud by stupeň g byl větší než stupeň /, pak můžeme rovnou psát / = 0 • g + f. Předpokládejme proto n > m a dokažme tvrzení indukcí přes stupeň /.
244
KAPITOLA 5. ZŘÍZENÍ ZOO
Pokud je / polynom stupně nula, je tvrzení zřejmé. Přepokládejme tedy, že tvrzení platí pro stupně menší než n > 0 a uvažme výraz h(x) = f(x) — j-x"~m g(x). Buď je h(x) přímo nulový polynom a pak máme, co jsme hledali, nebo jde o polynom nižšího stupně a tedy jej již umíme napsat potřebným způsobem h(x) = q ■ g + r a tedy také
f(x) = h(x) + ^x"-mg(x) = (q + ^x"-m)g(x) + r
a tvrzení je dokázáno. □
Je-li pro nějaký prvek b e K hodnota f (b) = 0, pak to znamená, že v podílu f (x) = q(x)(x —b)+r musí být r = 0. Jinak by totiž nebylo možné dosáhnout f (b) = q(b) ■ 0 + r, kde stupeň r je nulový. Říkáme, že b je kořen polynomu f. Stupeň q je pak právě n—l. Pokud má q opět kořen, můžeme pokračovat a po nejvýše n krocích dojdeme ke konstatnímu polynomu. Dokázali jsme tedy, že každý nenulový polynom nad polem K má nejvýše tolik kořenů, kolik je jeho stupeň. Odtud již snadno dovodíme i následující pozorování:
Důsledek. Je-li K pole s nekonečně mnoha prvky, pak dva polynomy f a g jsou si rovny jako zobrazení, právě když mají shodné koeficienty.
Důkaz. Předpokládejme / = g, tj. / — g = 0, jako zobrazení. Polynom (/ — g)(x) tedy má nekonečně mnoho kořenů, což je možné pouze tehdy, je-li nulovým polynomem.
□
Uvědomme si, že u konečných polí samozřejmě takové tvrzení neplatí. Jednoduchým příkladem je např. polynom x2 + x nad Z2, který představuje nulové zobrazení.
5.3. Interpolační polynom. Často je užitečné zadat snadno počítatelný vztah pro funkci, pro kterou máme zadány hodnoty v předem daných bodech xq,...,x„. Pokud by šlo o nulové hodnoty, umíme přímo zadat polynom stupně n + 1
f{x) = ix - x0)ix - Xi) ... ix - x„), který bude mít nulové hodnoty právě v těchto bodech a nikde jinde. To ale není jediná polynomiální odpověď, protože požadovanou vlastnost má i nulový polynom. Ten je přitom jediný s touto vlastností ve vektorovém prostoru polynomů stupně nejvýše n. Obdobně to dopadne i v obecném případě:
' Interpolační polynomy
Nechť K je nekonečné pole skalárů. Interpolační polynom f pro množinu po dvou různých bodů xq, ... ,xn e K a předepsaných hodnot yo, ..., yn e K je polynom stupně nejvýše n nebo nulový polynom, který splňuje fixt) = y i pro všechna i = 0, 1, ..., n.
Věta. Pro každou množinu n + 1 po dvou různých bodů xq, ..., xn e IK a předepsaných hodnot yo, ..., yn e K existuje právě jeden interpolační polynom f.
tedy přesně tolik rovnic, kolik je neznámých koeficientů polynomu (nechť např. Pix) = a3x3 + a2x2 + a\x + a0):
Pil) = ia3+a2 + ai+a0 =0,
P\\) = 3a3 +2a2+ai = 1,
Pi2) = 8^3 + 4a2 + 2a i + a$ = 3,
P'{2) = I2a3 + 4a2 + ax = 3.
Vyřešením tohoto systému obdžíme polynom P{x) = —2x3 + 10x2 — 13x +5.
Jiné řešení. Použijeme fundamentální Hermiteovy polynomy:
2 ix - 1) ) (2 - x)2 = i2x - l)ix - 2)2,
h\ix) = i1
h\ix) = (5
h\ix) = ix
h\ix) = ix
Celkem
0 + (-l)
2x)ix - l)2,
Pix) = 0-h\ix)+3-h\ix)+\-h2Ax)+3-h22ix) = -2x3+10x2-13x+5.
□
5.5. Pomocí Lagrangovy interpolace spočítejte přibližnou hodnotu cos2 1. Použijte k tomu hodnoty funkce v bodech
Řešení. Nejprve určíme funkční hodnoty v zadaných bodech: cos2^) = 1/2, cos2(j) = 1/4, cos2(j) = 0. Dále určíme elementární Larangeovy polynomy, přitom můžeme spočítat hodnoty přímo v zadaném bodě:
ío(l)
hW =
Celkem tedy
(1 -f)(l 2 > 8(7r" 3)(7t- 2)
i71 m 71 \ f 71 3 A4 n) ~ 2 > o 7t2
(I" - ~) 2 > 9(7r" -4)(7t- -2)
71 3 71 \ f 71 4 ^3 n) ~ 2 > y 7t2
(i - ~) 3 ' 2i7t- 4)(7t- 3)
i71 71 \ { 71 4 >K2 n) ~ 3 > Z. 7t2
r — 3)(7t- 2) 1 9i7t- 4)(7t- 2)
7t2 4 y 7t2
+ 0
(5tt - 12) (tt - 2) i^2
0.288913.
Vidíme, že při výpočtu třetí elementrání polynom nebyl potřeba. Skutečná hodnota je cos2 1 = 0.291927. □
245
A. INTERPOLACE POLYNOMY
1. INTERPOLACE POLYNOMY
5.6. Franta potřebuje počítat hodnoty funkce sin, ale má k dispozici jen mobilní telefon s jednoduchou kalkulačkou, která umí základní operace. Protože si pamatuje hodnoty funkce sin v bodech 0, |-, f j a f- a ví, že přibližné hodnoty jt, Vl a VŠ jsou 3.1416, 1.4142 a 1.7321, rozhodl se, že použije k přibližnému výpočtu interpolaci. Pomozte mu sestrojit přibližný vztah s využitím všech hodnot.
Řešení. Sestrojíme elementární Larangeovy polynomy:
l0(x)
(x - f)(x - f)(x - f)(x - f) (0-£)(0-í)(0-£)(0-f)
1.4783x4 - 5.8052x3 + 8.1057x2 - 4.7746x + 1
Důkaz. Začněme jednodušší částí, tj. jednoznačností.
Jsou-li / a g dva interpolační polynomy se stejnými definičními hodnotami, pak je jejich rozdíl polynomem stupně n, který má n + 1 kořenů, a proto je / — g = 0.
Zbývá existence. Označme si prozatím neznámé koeficienty polynomu / stupně n
f
a„x + ■ ■ ■ + a\x + a$.
Dosazením požadovaných hodnot dostaneme systém n + 1 rovnic pro stejný počet neznámých koeficientů a{
ao + xqcii + • • • + (xo)"an
yo
h(x)
(x-0)(x-f)(x-f)(x-f) (f -0)(f-f)(f -f)(f -f)
-13.3046X4 + 45.2808x3 - 49.2419x2 + 17.1887x
(x-0)(x-f)(x-f)(x-f) (f - 0)(f - f)(f - f)(f - f)
23.6526x4 - 74.3070x3 + 71.3298x2 - 20.3718x
(x-0)(x-f)(x-^)(x-2i)
h(x) -
(t - 0)(
71 71 \ f 71 71 \ f 71 71
3 ě"^3" _ 4 ~ 2
)
-13.3046X4 + 38.3146x3 - 32.8279x2 + 8.5943x
l4(x)
(x-Q)(x-f)(x-f)(x-f)
(f -m-m -m -ř)
= 1.4783x4 - 3.4831x3 + 2.6343x2 - 0.6366x
Hodnota interpolačnŕho polynomou je pak
1 V2 73
P(x) = 0 • l0(x) + -h(x) + — h(x) + — h(x) + h(x)
= 0.0288x4 - 0.2043x3 + 0.0214x2 + 0.9956x.
Doplňující otázky: Může Franta tento přibližný výsledek použít i pro výpočet funkce sin na intervalu [ j, jt]? A pokud ne, jak by měl postupovat?
Jak by vypadaly přibližné vztahy, pokud by Franta ne použil všechny uzly, ale pro každý bod jen tři uzly nejbližší?
a0 + x„cii + ■ ■ ■ + (x„)"an — y„.
Existenci řešení tohoto systému rovnic můžeme snadno ukázat přímou konstrukcí patřičného polynomu pomocí tzv. Lagrangeových polynomů pro dané body x0, ..., xn, viz. další odstavec textu níže.
Nyní ale důkaz dokončíme pomocí jednoduchých znalostí z lineární algebry. Tento systém lineárních rovnic má totiž právě jedno řešení pokud je determinant jeho matice in-vertibilní skalár, tj. pokud je nenulový (viz 3.1 a 2.23). Jde o tzv. Vandermondův determinant, který jsme již diskutovali v příkladu 2.22 na straně 84.
Protože jsme ale už ověřili, že pro nulové pravé strany existuje řešení právě jedno, víme, že tento determinant nenulový být musí.
Protože polynomy jsou jako zobrazení stejné, právě když mají stejné koeficienty, věta je dokázána. □
«!- . f
x mm>oibtH\ rov/Hony
5.4. Užití interpolací. Na první pohled se může zdát, že reálné nebo případně racionální polynomy, tj. polynomiálně zadané funkce M. -> M. nebo Q -> * Q, tvoří hezkou velikou třídu funkcí jedné proměnné. Můžeme jimi proložit jakékoliv sady předem zadaných hodnot. Navíc se zdají být snadno vyjádřitelné,
246
KAPITOLA 5. ZŘÍZENÍ ZOO
takže by s jejich pomocí mělo být dobře možné počítat i hodnoty těchto funkcí pro jakoukoliv hodnotu proměnné. Při pokusu o praktické využití v tomto směru ovšem narazíme hned na několik problémů.
Prvním z nich je potřeba rychle vyjádřit polynom, kterým zadaná data proložíme. Pro řešení výše diskutovaného systému rovnic totiž budeme obecně potřebovat čas úměrný třetí mocnině počtu bodů, což při objemnějších datech je jistě těžko přijatelné. Podobným problémem je pomalé vyčíslení hodnoty polynomu vysokého stupně v zadaném bodě. Obojí lze částečně obejít tak, že zvolíme vhodné vyjádření intepo-lačnrho polynomu (tj. vybereme lepší bázi příslušného vektorového prostoru všech polynomů stupně nejvýše k, než je ta nejobvyklejší 1, x, x2, ..., x").
Ukážeme si pouze jediný příklad takového postupu:
| Lagrangeovy interpolační polynomy [ Lagrangeův interpolační polynom snadno zapíšeme pomocí tzv. elemntárních Lagrangeových polynomů lt stupně n s vlastnostmi
|l i = j
Zřejmě musí být tyto polynomy až na konstantu rovny výrazům (x — xq) ... (x — Xi-i)(x — xi+\)... (x — x„) a proto
T\j# (* ~ Xj)
li(x)
ru,-(*« -xj)'
Hledaný Lagrangeův interpolační polynom je pak dán vztahem
f(x) = y0t0(x) + yili(x) -\-----h y„t„(x).
Použití Lagrangeových polynomů je obzvlášť efektivní, když opakovaně prokládáme zadané hodnoty závislé proměnné y i pro stále stejné hodnoty nezávislé proměnné xt. Pak totiž máme elementární polynomy li předem připraveny.
Toto vyjádření má nevýhodu ve velké citlivosti na nepřesnosti výpočtu při malých rozdílech zadaných hodnot x;, protože se v něm těmito rozdíly dělí.
Další nepříjemností je velice špatná stabilita hodnot reálných nebo racionálních polynomů při zvětšující se hodnotě proměnné. Brzy budeme mít nástroje na přesný popis kvalitativního chování funkcí, nicméně i bez nich je zřejmé, že podle znaménka koeficientu u nejvyšší mocniny polynomu se hodnoty velice rychle při rostoucím x vydají buď do plus nebo mínus nekonečna. Ani toto znaménko koeficientu u nej-vyššrho stupně se ale u interpolačnŕho polynomu při malých změnách prokládaných hodnot nechová stabilně. Názorně to vidíme na dvou obrázcích, kde je proloženo jedenáct hodnot funkce sin(jc) s různými malými náhodnými změnami hodnot. Je na nich vynesena aproximovanMunkc^^oJ^c^jspu^ malinko posunuté hodnoty a jimi proložený jednoznačně za-daný interpolační polynom. Zatímco uvnitř intervalu je aproximace vcelku dobrá, stabilita na okrajích je otřesná.
5.7. Další den potřeboval Franta spočítat dvojkový logaritmus 25. a^J//. (Ve skutečnosti potřeboval přirozený logaritmus, ale protože ví, že ln 2 je zhruba 0.6931, vystačí s i s dvojkovým.) Nejprve tedy vzal uzly 16 a 32 s funkčními hodnotami 4 a 5 a sestrojil interpolační polynom (přímku) P(x) = + 3, takže f (25) = y| = 4.5625. Kvůli zpřesnění výsledku přidal další uzel 8 s funkční hodnotou 3. V tomto případě vyšel interpolační polynom roven P(x) = — ^x2 + j^x + |, což dává P(25) = 4.7266. Franta chtěl výsledek ještě zpřesnit, přidal tedy rovnou dva uzly, a to 2 a 4 s funkčními hodnotami 1 a 2. Jaké však bylo jeho překvapení, když mu vyšla hodnota P (25) = 5.892, která je určitě nesprávná vzhledem k tomu, že logaritmus je rostoucí funkce. Dokážete vysvětlit, kde se vzala taková chyba?
Řešení. Franta trochu pátral na internetu a zjistil, že chyba při interpolaci se dá vyjádřit ve tvaru
(x — Xo)(x — X\) ... (x — x„)
f(x) - Pn(x)
(n + 1)!
kde bod § není znám, ale leží v intervalu daném nejmenším a nej větším uzlem. Člen v čitateli zlomku způsobuje, že přidávání dalších vzdálených uzlů přesnost spiše zhoršuje. □
5.8. O týden později potřeboval Franta určit Napdlo ho problém otočit a použít tzv. inverzní interpolaci, tedy zaměnit roli uzlů a funkčních hodnot a určit přibližnou hodnotu vhodné funkce v nule. Jak postupoval?
Řešení. ~Jl je nulový bod funkce x2 — 1. Franta vzal uzly x0 = 2, x\ = 2.5, x2 = 3, příslušné funkční hodnoty jsou -3, -0.75 a 2. Pak prohodil úlohu uzlů a funkčních hodnot a získal elementární Lagrangeovy polynomy
k)(x) h(x) h(x)
(x +0.75)(x - 2) 4 (-3 + 0.75)(-3 - 2) ~ 45'
16 , 16 32
--x--x H--
99 99 33
6,3 9
—x1 H--x H--
55 11 55
1
-x 9
2 15
Pro V7 tak dostal přibližnou hodnotu 2 • l0(0) + 2.5 • h (0) + 3 • l2(0) = 1 = 2-6485.
Doplňující otázky: Frantovy se do výpočtu jednoho elementráního polynomu vloudila chyba, pokuste se ji vypátrat. Má tato chyba vliv na výslednou hodnotou?
Jak bychom mohli využít také hodnotu derivace v bodě 2.5? □
5.9. Nalezněte přirozený splajn 5, který splňuje podmínky 5(-l) = 0, 5(0) = 1, 5(1) = 0.
A. INTERPOLACE POLYNOMY
1. INTERPOLACE POLYNOMY
Řešení. Hledaný přirozený splajn bude složen ze dvou kubických polynomů, jednoho, řekněme 5i, pro interval (—1,0), druhého, řekněme 52 pro interval (0, 1). Slůvko „přirozený" navíc určuje, že hodnoty druhých derivací polynomů S\, resp. 52, budou nulové v bodě — 1, resp. 1. Díky předepsané společné hodnotě v bodě 0 víme že absolutní člen obou polynomů je 1, ze symetrie úlohy plyne, že společná hodnota první derivace v bodě 0 je nulová. Můžeme tedy psát Si(x) = ax3 + bx2 + 1 a 52(x) = cx3 + dx2 + 1, pro neznámé reálné parametry a, b, c ad. Dosazením těchto tvarů do čtyř podmínek Si(-l) = 0, 5i"(-l) = 0, 52(1) = 0a 52"(1) = 0 dostáváme čtyři lineární rovnice pro tyto parametry:
-a + b + í = 0,
-6a +2b = 0,
c + d + 1 = 0,
6c + 2d = 0.
5.4a
Jejich vyřešením pak 5i (x)
-±x3
2X
\x2 + 1, S2(x) = \x3
\x2 + 1. Celkem tedy
5(x)
-l-x3
,2
l-x3 -
2X
- fx2 + 1
\x2 + í
prox e (—1,0) prox e (0, 1)
□
5.10. Nalezněte splajn 5, který splňuje podmínky
5(-l) = 0, 5(0) = 1, 5(1) = 0, 5(-l) = 1, 5(1) = 1.
Řešení. Hledaný splajn se od splajnu z předchozí úlohy liší pouze hodnotami derivací v bodech -1 a 1. Obdobně jako v předchozí úloze tak dostáváme části 5i a 52 splajnu ve tvaru 5i (x) = ax3 + bx2 + 1 a 52(x) = cx3 + dx2 + 1, pro neznámé reálné parametry a, b, c a d. Dosazením do podmínek Si(-l) = 0, S[(-\) = 1, 52(1) = 0a 5^(1) = 1 dostáváme nyní soustavu
-a + b + í = 0,
3a-2b = 1,
c + d + 1 = 0,
3c + 2d = 1
s řešením a = — 1, b = —2, c = 3 a d funkce
5(x)
e5.1
-4, tedy hledaný splajn je
—x 3x3
- 2x2 + 1 4x2 + 1
prox e (-1,0) prox e (0, 1)
□
Kolem interpolačních polynomů existuje bohatá teorie, zájemce odkazujeme na speciální literaturu.
5.5. Poznámka. Numerická nestabilita způsobená případnou blízkostí (některých) z bodů x; je dobře viditelná i na systému rovnic z důkazu Věty 5.3. Při řešení systémů lineárních rovnic totiž nestabilita do značné míry souvisí s velikostí determinantu matice systému, tj. v našem případě Van-dermondova determinantu. Ten umíme vcelku snadno přímo spočíst:
Lemma. Pro posloupnost po dvou různých skalárů xq, ..., x„ e K platí
V(x0, ...,*„)= Y\
>k=0
Důkaz. Vztah dokážeme indukcí přes počet bodů xt. Evidentně je správný pro n = 1 (a pro n = 0 je úloha nezajímavá). Předpokládejme, že výsledek je správný pro n — 1, tj-
V(x0, x„_0
n-l
<>k=0
Xk)-
Více příkladů k interpolačním polynomům najdete na straně 307.
Nyní považujme hodnoty x0, ..., x„_i za pevné a hodnotu x„ ponechme jako volnou proměnnou. Rozvojem determinantu podle posledního řádku (viz ??) obdržíme hledaný determinant jako polynom (5.1)
V(x0, ...,x„) = (x„)"y(x0, ...,x„_i) - (x„)" 1 ••• .
Toto je polynom stupně n, protože víme, že jeho koeficient u (x„)" je nenulový dle indukčního předpokladu. Přitom bude zjevně nulový při dosazení kterékoliv hodnoty x„ = x; pro i < n, protože bude v takovém případě obsahovat původní determinant dva stejné řádky. Náš polynom tedy bude dělitelný výrazem
i.Xn Xo)(xn X\) • • • (xn Xn_i),
který má sám již stupeň n. Odtud vyplývá, že celý Vander-mondův determinant coby polynom v proměnné x„ musí být tomuto výrazu roven až na konstantní násobek, tj.
V(x0, ..., x„) = c ■ (x„ — x0)(x„ — Xi) • • • (x„ — X„_i).
248
KAPITOLA 5. ZŘÍZENÍ ZOO
5.4
e5.2
Porovnáním koeficientu u nejvyšší mocniny v (5.1) a tomto výrazu dostáváme
c = V(x0, ■ ■ ■ a tím je důkaz lemmatu ukončen.
Xn-l)
□
Opět tedy vidíme, že determinant bude velmi malý, pokud jsou malé vzdálenosti bodů x;.
5.6. Derivace polynomů. Zjistili jsme, že hodnoty polynomů s rostoucí proměnnou rychle míří k nekonečným hodnotám (viz také obrázky). Proto je zřejmé, že polynomy nemohou nikdy vhodně popisovat jakékoliv periodicky se opakující děje (jako jsou např. hodnoty goniometrických funkcí). Mohlo by se ale zdát, že podstatně lepší výsledky budeme alespoň mezi body x;- dosahovat, když si budeme kromě hodnot funkce hlídat, jak rychle naše funkce v daných bodech rostou.
Za tímto účelem zavedeme (prozatím spíše intuitivně) pojem derivace pro polynomy. Můžeme přitom pracovat opět s reálnými, komplexními nebo racionálními polynomy. Rychlost růstu v bodě x e M pro reálný polynom fix) dobře vyjadřují podíly
fix + Ax) - f{x)
(5.2)
Ax
a protože umíme spočíst (nad libovolným okruhem)
xk+kxk~1 Ax+- • ■+(k)xliAx)k-'+- ■ -+iAx)k, a„xn +■ ■ ■ +ao výše vedený
(x+Ax)
dostaneme pro polynom fix) podíl ve tvaru
-""1Ax +
/(x+Ax)-/(x)
-=a,
Ax
= nanxn~l + in
nx
•+(Ax)*
Ax
1K_!x"-2 +
Ax
■+a\ — Ax
+ ai + Ax(...)
kde výraz v závorce je polynomiálně závislý na Ax. Evidentně pro hodnoty Ax velice blízké nule dostaneme hodnotu libovolně blízkou následujícícmu výrazu:
_____^__) Derivace polynomů [
Derivací polynomu fix) = anxn + ■ ■ ■ + a0 podle proměnné x rozumíme polynom
/'(*)
nanxn 1 + in
1H_!x"-2 +
Z definice je jasné, že právě hodnota /'(x0) derivace polynomu nám dává dobré přiblížení jeho chování v okolí bodu x0. Přesněji řečeno, přímky
fix0 + Ax) - fix0)
y
Ax
-(x - x0) + fix0),
tj. sečny grafu polynomu procházející body [x0, fix^)] a [x0 + Ax, /(x0 + Ax)] se, se zmenšujícím se Ax, přibližují přímce
y = f'ix0)ix - x0) + f(x0),
B. Topologie komplexních čísel a jejich podmnožin 5.11. Vyznačte v komplexní rovině následující množiny:
i) {ze
ii) {z e
iii) {z e
iv) {z e
k-l| = |z + l| 1 < \z - i\ < 2} Re(z2) = 1}
Re(l) < \)
Řešení.
• imaginární osa
• mezikruží okolo i
• hyperbola a2 — b2 = 1.
• vnějšek jednotkového kruhu se středem v 1.
-1-,
□
5.12. Nalezněte hromadné, izolované, hraniční a vnitřní body množin N, b lze postupovat analogicky a že pro h e [a, b] se zřejmě úhel cp stále zvětšuje při zmenšujícím sex (cp = jt pro x = 0 a h e (a, b)).
Z podmínky h < a plyne, že úhel cp je ostrý, tj. cp e (0, Jt/2). Protože je funkce y = tg x rostoucí na intervalu (0, n/2), můžeme přejít k maximalizování hodnoty tg cp. Platí
A_ A_ a b—h_a—h
tgcp =tg(a-P)
tg «-tg P l+tgatg/3
x(b—a)
l + tdL.SzA x2+(b-h)(a-h)'
Stačí nám tedy najít globální maximum funkce
x{b—a)
/(*)
x2+(b-h)(a-h) '
x e [0, +oo).
Z vyjádření
r,, \ _ (b-a)[x2+(b-h)(a-h)]-2x2(b-a) _ (b-a)[(b-h)(a-h)-x2] [x2+(b-h)(a-h)f ~ [x2+(b-h)(a-h)f
x g
(0, +oo)
vidíme, že
f'(x) > 0 pro x e (o, y/(b - h)(a - hýj , f'(x) < 0 pro x e (y/(b — h)(a — h), +oo^ .
Pokud bychom věděli, že pro diferencovatelnou funkci x = f (y) je i y = f~l(x) diferencovatelná, pravidlo pro derivaci složené funkce nám okamžitě říká
1 = (id)'(x) = (/ o f-l)'(x) = f'(y) ■ (f-l)'(x)
a tedy pak přímo dostáváme vzorec (zjevně f'(y) v takovém případě nemůže být nulové)
-| Derivace inverzní funkce |_
(/-- 1
(5.6)
f'(y)
J
To dobře odpovídá intuitivní představě, že pro y = f (x) je přibližně /' = -ff zatímco pro x = f~l (y) je to přibližně (f~l)'(y) = Takto skutečně můžeme derivace inverzních funkcí počítat:
Věta. Je-li f reálná funkce diferencovatelná v bodě xq a v tomto bodě platí f'(xo) ^ 0, pak existuje na nějakém okolí bodu yo = f (xq) funkce f~l inverzní k f a platívztah (5.6).
Důkaz. Nejprve si povšimněme, že nenulovost derivace v xo znamená, že na nějakém okolí bodu xo je naše funkce / buď rostoucí nebo klesající, viz důsledek 5.32. Proto na nějakém okolí nutně existuje inverzní funkce. Protože je obrazem ohraničeného uzavřeného intervalu ve spojité funkci opět uzavřený interval, nutně je také pro každou otevřenou množinu U v definičním oboru / i obraz f(U) otevřený. Potom ale přímo z definice spojitosti pomocí okolí je tato inverzní funkce také spojitá.
Pro odvození našeho tvrzení nyní postačí pozorně znovu pročíst důkaz čtvrtého tvrzení věty 5.33. Jen volíme / místo funkce h a f~l místo / a místo předpokladu existence derivací pro obě funkce víme, že funkce složená je diferencovatelná (a víme, že je to identická funkce): Skutečně, podle lematu 5.31 existuje funkce ý spojitá v bodě y0 taková, že
f(y) - /(Jo) = y/y\ y2, vi,y2>0, ve které rovnost nastává právě pro y\ = y2. Volba
yi(x) = b^> yi(x)
totiž dává
(b-h)(a-h) x(b—a)
g(x) = yi(x) + y2(x) > 2y/ydx)y2(x) = ^ y/(b - h) (a-h). Pokud tak existuje x > 0, pro které je y\(x) = y2(x), má funkce g v bodě x globální minimum. Rovnice
= tj. ^ = ^ri,
má jediné kladné řešení xq = y/(b — h)(a — h).
Dvěma odlišnými způsoby jsem stanovili ideální vzdálenost turisty od stěny. Hodnotě x0 odpovídá
xq(b—a) _ b—a
cpo = arctg ■
xl + (b-h)(a-h)
arctg
2J(b-h)(a-h)"
Při pohledu z úrovně podlahy (kdyby se díval brouk) je h = 0, a tudíž je
xo
cpo = arctg
b—a 2 \fa~b
Je-li obraz vysoký 1 m a jeho dolní okraj je 2 m nad zemí (a = 2, b = 3), bude brouk vidět obraz pod největším úhlem 0. Také nyní nám substituce (tentokráte q = vfy umožní přejít ke kvadratickému výrazu (na levé straně nerovnice) a následně získat
(v2 -g[h + VF+ř]) (yl -g[h- VFTř]) > 0. Protože h < \Jh2 + P, musí být
v2 >
h + V/í2 +12 Nejmenší přípustné hodnotě
(5.6) v0 = potom odpovídá (viz (5.5))
(5.7) tg *o g'(x)
y fx)
lim -
x^xq g(x)
;Í;'/S''
/
Důkaz. Bez újmy na obecnosti můžeme předpokládat, že v x0 mají funkce / a g nulovou hodnotu. Výsledek je opět jednoduše představitelný pomocí obrázku. Uvažujme body [g(x), f(x)] e M2 parametrizované proměnnou x. Podíl hodnot pak odpovídá směrnici sečny mezi body [0, 0] a [fix), gix)]. Zároveň víme, že podíl derivací odpovídá směrnici tečny v příslušném bodě. Z existence limity směrnic tečen tedy chceme dovodit existenci limity směrnic sečen.
Technicky lze využít věty o střední hodnotě v parametrickém tvaru. Předně si uvědomme, že v tvrzení věty implicitně předpokládáme existenci výrazu f{x)/g'{x) na nějakém okolí x0 (kromě bodu x0 samotného), zejména tedy pro dostatečně blízké body c k x0 bude g'(c) ^ 0.8 Díky větě o střední hodnotě nyní
lim
fix)
x^x0 gix)
lim
x^-xq
fjx) - /(Jo) gix) - gix0)
lim
x^-xq
fiCx) g'iCx) '
7Ľ Hospital byl.
Pro samu existenci limity v obecném smyslu to vždy nutné není, nicméně pro tvrzení L'Hospitalovy věty je to potřebné. Podrobnou diskusi je možné najít (vygooglovat) v populárním článku 'R. P. Boas, Counterexamples to L'Hôpitaľs Rule, The American Mathematical Monthly, October 1986, Volume 93, Number 8, pp. 644-645.'
284
KAPITOLA 5. ZŘÍZENÍ ZOO
kde cx je číslo mezi x0 a x, závislé na x. Z existence limity
,. /'(*) lim -
x^*o g'(x)
vyplývá, že stejnou hodnotu bude mít i limita libovolné posloupnosti vzniklé dosazením hodnot x = xn jdoucích k x0 do f (x)/g'(x). Zejména tedy můžeme dosadit jakoukoliv posloupnost cXn pro xn -» x0 a proto bude existovat i limita
,. f'(cx) lim -
*^*0 g'(cx)
a poslední dvě limity zjevně budou mít stejnou hodnotu. Dokázali jsme tedy, že naše hledaná limita existuje a má také stejnou hodnotu. □
Z důkazu věty je samozřejmé, že její tvrzení platí i pro jednostranné limity.
5.40. Důsledky. LHospitalovo pravidlo můžeme jednoduše rozšířit i pro limity v nevlastních bodech ±00 a pro případ nevlastních hodnot limit. Je-li, např.
lim f(x) = 0, lim g(x) = 0,
potom je limx^0+ /(V*) = 0 a limx^0+ g{l/x) = 0.
Zároveň z existence limity podílu derivací v nekonečnu dostaneme
lim
(/(V*))'
x-o+ (g(l/x))>
lim
x^0+
lim
x^04
/'(l/x)(-l/x2) g'(\/x)(-\/x2)
lim
>'(1/x) x^oo g'(x)
Použitím předchozí věty tedy dostáváme, že v tomto případě bude existovat i limita podílu
,. fix) lim -
x->oo g(X)
lim
x^04
fil/x)
lim
fix)
f(l/x) x^oog'(X)
Ještě jednodušší je postup při výpočtu limity v případě,
kdy
lim f(x) = ±00, lim g(x) = ±00.
x^*xq x^*xq
Stačí totiž psát
lim
fix)
lim
l/gix)
x^xo g(x) x^x0 \/f(x) což je již případ pro použití LHospitalova pravidla z předchozí věty. Lze ale i dokázat, že LHospitalovo pravidlo platí ve stejné formě pro nevlastní limity:
Věta. Nechť f a g jsou funkce diferencovatelné v okolí bodu xq e M, ne však nutně v bodě xq samotném, a nechť existují
limity limx^xo f(x) existuje limita
pak existuje i limita
a jsou si rovny.
±00 a lirn^^ g(x) = ±00. Jestliže
lim
fix)
x^xo g'ix)
,. fix) lim -
x=>x0 g(x)
která říká, že míč v čase ř0 už klesal, a dokažme, že je pro v0 z (5.6) a l — l ■
Tím jsme ukázali, že při počáteční rychlosti uvedené v (5.6) může hráč koš dát.
Při trestném hodu, kdy hráč odhazuje míč ve výšce 2 m, je A = l,05m, l = 4, 225 m, g = 9, 80665 m • s"2, a tudíž minimální počáteční rychlost míče činí
9,806 65
m • s
1, 05 + v(l,05)2 + (4, 225)2 7, 28 m-s"1. Této rychlosti odpovídá úhel
oSÍn p cos2 cp' přičemž cp e (0, Jt/2).
Na rozdíl od Halleyovy úlohy je však hodnota v0 dána a měnné je R v závislosti na cp. Je tak vlastně R = R (cp) funkcí v proměnné cp, která musí splňovat (5.8) (je určena rovnicí (5.8)). Jedná se tedy o funkci zadanou implicitně. Rovnici (5.8) zapíšeme jako (R nahradíme R(cp))
R(cp)tgcp ■ 2u21cos2 — 1, b ^ 0, a přirozené n>2 platí (1 + b)n > 1 + nb.
vesddwgtt2
Důkaz. Pro n = 2 dostáváme
(1 + b)2 = 1 + 2b + b2 > 1 + 2b.
Dále postupujeme indukcí za předpokladu b > — 1. Předpokládejme, že tvrzení platí pro nějaké k > 2 a počítejme
(1 + b)k+1 = (1 + b)k(l + b) > (1 + kb)(l + b)
= 1 + (k + l)b + kb2 > 1 + (k + l)b
Tvrzení zřejmě platí také pro b = — 1. □
Pro dva po sobě jdoucí členy an naší posloupnosti můžeme nyní odhadnout jejich podíl
+
1\h
(n2 - l)nn
an-i
i
> (i--)-
n2n (n
-. 1.
1)
1 V n
nL ) n —
n n — 1
Je tedy naše posloupnost skutečně rostoucí.
Následující obdobný výpočet (opět s využitím Bernoul-liovy nerovnosti) ověřuje, že posloupnost čísel
1 +
1
n + l
1 +
1
1 +
1
R'(cp)vl sin2 o sin2 0+ nebo cp -> jt/2— hodnota R zmenšuje) a má derivaci v každém bodě tohoto intervalu, maxima musí nabývat tam, kde je derivace nulová. To znamená, že R(cp) může být maximální pouze tehdy, když je
(5.10) R (cp) =htg2cp.
Dosaďme proto (5.10) do (5.9). Získáváme
h tg 2cp sin 2cp — gh2 tg2 2cp + 2hv^ cos2 cp = 0. Tuto rovnici postupně upravíme
tg 2cp Vq sin 2cp + 2v% cos2 cp = gh tg2 2cp,
v,
2 sin2 2 „ 9,806 65-1,8
2 27,7782 +9,806 65-1,8
0, 774 2 rad « 44, 36'
Světový rekord Barbory Špotákové se ovšem hranici 80 m ani neblíží, přestože další vlivy (kupř. odpor vzduchu) lze zanedbat. Nesmíme však zapomenout, že IAAF (Mezinárodní asociace atletických federací) rozhodla o posunutí těžiště oštěpu směrem ke špičce k 1. dubnu 1 999 (v ženském oštěpu), čímž se zkrátila vzdálenost hodů zhruba o 10 %. Původní rekord (se „správně vyváženým" typem oštěpiif byl4 právě 80, 00 m.
Provedené úvahy a získaný výsledek lze uplatnit také v jiných atletických disciplínách a sportech. Při golfu je třeba h blízké 0, a tudíž právě při úhlu
mn = Hm i arccos 0gh ,
™ ■ «■ 2 vl+gh
h^0+
míček dopadne do největší vzdálenosti
2 arccos 0 = f rad
45'
R( 0), obvod se také zvětší a-krát a obsah a2-krát (jde
0 plošnou míru). Takže IP nezávisí na velikosti obrazce, nýbrž pouze na jeho tvaru. Uvažujme proto pravidelný n-úhelník vepsaný do jednotkové kružnice. Podle obrázku je
h = cos cp = cos -, £ = sin cp = sin -,
' n ' 2 ' n '
což dává vyjádření pro jeho obvod
o = n • x = 2n sin —
1 obsah
5 = n ■ \hx = n cos - sin -.
"2 n n
Pro pravidelný n-úhelník tak je IP
-COtg ^,
4«2 sin2 f
což můžeme ověřit kupř. pro čtverec (n = 4) s délkou strany a, kdy máme
IP
4ror (4a)2
— — — COtP —
4—4 <-ulS 4 •
Provedeme-li limitní přechod pro n -» 00 s použitím limity
1,
dostaneme izoperimetrický podíl pro kružnici
lim ^
x^O x
IP = lim - cotg - = lim
cos ň _ cosO
1.
Pochopitelně jsme také mohli pro kružnici o poloměru r přímo vypočítat
jp _ 4kS_ _ 471(71?-) _ o2 (2nr)2
Pro hranici kruhové výseče o poloměru r a středovém úhlu cp e (0, 27r)je
339
A. DERIVACE VYŠŠÍCH ŘÁDŮ
1. DERIVOVÁNÍ
(2r+r 0, = it/4. Tentokráte jsou však nulové koeficienty an, n e N U {0}. K nalezení zbývajících koeficientů využijeme metodu per partes a (7.8) (součinem 2 lichých funkcí je funkce sudá) se ziskem
x0+t
bn = Y f f (x) sin (ncúx) dx =
x0
J(x-l) sin tf- dx - f(x - 3) sin ^f-dx
[-(x - 1)^ cos =f ]J + sin =f £ -[-(x- 3) £ cos =f]
Ihned odsud vidíme, že pro sudá n je bn = 0. Sinovu Fourierovou fgdú7 díky tomu upravíme do tvaru
E [(£ [(-D"-l] + & sin f) sin ^]
V í ~4 4_ (-!)""'16 \ „;„ [2«-1]ttx 2- L^[2«-l]jr [2«-l]2jr2 / 5,111 4
« = 1
« = 1
Zároveň vidíme, že pro m = n je výsledkem reálné číslo úřx = 27T a přitom zjevně musí opět být velikosti jak sin(«x) tak cos(«x) stejné. Nutně proto pro kladná n dostáváme velikosti
COS(ř2x)|
ir,
sin(«x) |
ir.
Jen pro n = 0 dostáváme || 11|2 = 27r.
| Fourierovy řady
Řadu funkcí
F(x) = — + cos(«x) + bn sin(«x))
«=i
z Věty 7.5, s koeficienty
-I í
n Jx{
bn = ~ Í X Jx,
xq+2jT
g(x) cos(«x) dx,
;q+2jt
g(x) sin(«x) dx,
nazýváme Fourierova řada funkce g na intervalu [xq, xq + 2it].
Koeficienty a„ a b„ se nazývají Fourierovy koeficienty funkce g. ^mi^^^mmm.^m.^^m^\
V praktickém použití chceme pracovat s Fourierovými )(/ „ řadami s libovolnou délkou periody funkcí T místo hodnoty 27T. Stačí k tomu jen přejít k funkcím cos(y-řix), sin^řix). Jednoduchou substitucí pro-^ menných t = cox, kde co = y-, ověříme ortogonalitu našeho nového systému funkcí a přepočítáme koeficienty ve Fourierově řadě F(x) funkce g na intervalu [x0, x0 + T]:
F(x) = — + ^^(rz„ cos(ncůx) + b„ sin(ř2, X = {x e R; 0 < x < 1} v R.
Řešení. Množina N. Pro libovolné n e N očividně platí
Oi in) n N = in - 1, n + 1) n N = {n}.
Existuje tedy okolí bodu neNvl, které obsahuje pouze jeden prvek množiny N (pochopitelně právě uvažované n), tj. každý bod n e N je izolovaný. Množina vnitřních bodů je proto prázdná (je-li bod izolovaný, nemůže být vnitřní). Bod a e M je pak hromadným bodem A právě tehdy, když každé jeho okolí obsahuje nekonečně mnoho bodů A. Ovšem množina
Oi ia) n N = ia - 1, a + 1) n N, přičemž a sR,
je konečná, z čehož plyne, že N hromadné body nemá. To, že tato množina je konečná, dále implikuje
S i, := inf I b — n
inf I b - n I > 0 pro iei\N.
neOi(b)nN
249
B. TOPOLOGIE KOMPLEXNÍCH ČÍSEL A JEJICH PODMNOŽIN
1. INTERPOLACE POLYNOMY
Odsud máme Oh (b)f)N = 0, tj. žádné b e R \ N není hraničním bodem N. Současně víme, že každý bod dané množiny, který není vnitřním bodem, je nutně jejím hraničním bodem. Množina hraničních bodů tak obsahuje N. Shrneme-li to, množina hraničních bodů N je N.
Množina Q. Racionální čísla tvoří tzv. hustou podmnožinu množiny všech reálných čísel. To znamená, že ke každému reálnému číslu konverguje posloupnost racionálních čísel (představme si např. nekonečný desetinný rozvoj reálného čísla a jemu odpovídající posloupnost, kdy v následujícím členu přidáváme další cifru rozvoje).
O této posloupnosti lze navíc předpokládat, že všechny její členy Rsoiŕ navzájem různé (na poslední pozici konečného desetinného rozvoje se můžeme záměrně dopouštět chyby nebo kupř. číslu 1 přiřadíme desetinný rozvoj 0, 999 ... apod.). Množina hromadných bodů Q v M je proto celé R a každý bod x e R \ Q je hraniční. Zvláště dostáváme, že libovolné á-okolí
Og (- ) = f - - 8, - + 8 ) , kde p, q € Z, q ^ 0, \qj \q q J
racionálního čísla p/q musí obsahovat nekonečně mnoho racionálních čísel, což dává neexistenci izolovaných bodů. Číslo -v/2/10" není racionální pro žádné n e N. Předpokladem opaku (opět p, q e Z, g ^ 0)
V2
-, tj. V2
10" p
10" q q
totiž okamžitě obdržíme spor - o číslu ~J2 víme, že není racionální. Libovolné okolí racionálního čísla p Iq tak zároveň obsahuje nekonečně mnoho reálných čísel p/q + V2/10" (n e N), která nejsou racionální (množina Q jako těleso je uzavřená vzhledem k odečítání). Všechny body p/q e Q jsou tudíž rovněž hraniční a vnitřní body množina Q nemá.
Množina X = [0, 1). Nechť a e [0, 1) je zvoleno libovolně. Posloupnosti se členy (pro dostatečně velká n e N)
1 1
a + -, 1 - - C [0, 1)
n n
zjevně konvergují po řadě k hodnotám a, 1. Snadno jsme tak ukázali, že množina hromadných bodů obsahuje interval [0, 1]. Jiné hromadné body neexistují: pro jakékoli b £ [0, 1] existuje 8 > 0 takové, že Os (b) n [0, 1] = 0 (pro b < 0 postačuje položit 8 = — b a pro b > 1 potom 8 = b — 1). Protože každý bod intervalu [0, 1) je hromadným bodem, množina izolovaných bodů je prázdná. Pro a e (0, 1) označme menší z kladných čísel a, 1 — a jako 8a. Uvážíme-li
Osa (a) = (a - 8a, a + 8a) c (0, 1), a € (0, 1),
což tedy musí být tečna grafu polynomu /. Hovoříme o lineárním přiblížení polynomu / jeho tečnou.
Derivace polynomů je lineární zobrazení, které přiřazuje polynomům stupně nejvýše n polynomy stupně nejvýše n—1.
Iterací této operace dostáváme druhé derivace /", třetí derivace /(3) a obecně po ^-násobném opakování polynom f{k) stupně n — k. Po n + 1 derivacích je výsledkem nulový polynom. Toto lineárním zobrazení je příkladem tzv. cyklického nilpotentního zobrazení, která jsou podrobněji rozebírána v odstavci 3.32 o nilpotentních zobrazeních.
5.7. Hermiteův interpolační problém. Uvažme opět m+1 po dvou různých reálných hodnot x0, ..., xm, tj. xi 7^ Xj pro všechna i ^ j. Budeme chtít zase prokládat pomocí polynomů předem dané hod-1- noty, tentokrát ale budeme vedle hodnot předepisovat i první derivace. Tj. predpíšeme y; a ý pro všechna i. Hledáme polynom /, který bude nabývat těchto předepsaných hodnot a derivací.
Zcela analogicky jako u interpolace pouhých hodnot obdržíme pro neznámé koeficienty polynomu f(x) = anx" + ■ ■ ■ + a0 systém 2(m + l)rovnic
a0 +x0ai H-----h (x0)"a„
ao + Xmai + • • • + (xm)"an
CL\ + 2xqCÍ2 + • • • + n(xo)
n-l
ym
d\ -\- 2,Xmú.2 ~r"
+ n(xm)n lan = y'
Opět bychom mohli ověřit, že při volbě n = 2m + 1 bude determinant tohoto systému rovnic nenulový a tudíž bude existovat právě jedno řešení. Nicméně, obdobně ke konstrukci Lagrangeova polynomu lze zkonstruovat takový polynom / přímo. Prostě si vytvoříme jednu sadu polynomů s hodnotami nula nebo jedna jak u derivací tak u hodnot, abychom jejich jednoduchou lineární kombinací uměli dosáhnout potřebné hodnoty. Ověření následující definice a tvrzení necháme na čtenáři:
-| Hermiteův interpolační polynom |_ Hermiteův interpolační polynom definujeme pomocí fundamentálních Hermitéových polynomů:
h](x)
h]{x)
l"(Xj) l'(Xi)
(x - Xi)
(li(x)Y
{x - Xi) {íi{x)Y
250
KAPITOLA 5. ZŘÍZENÍ ZOO
kde£(x) = ULi(x h](xj)
(hD'iXj)
h2(Xj)
(hjYixj)
Xi). Tyto polynomy splňují:
1 pro i = j 0 pro i # j
0 0
a proto je Hermiteův interpolační polynom dán výrazem
k
f(x) = YJ{yih](xi) + y'ih2M))-
i = l
5. 5a
5.6
5.8. Příklady Hermiteových polynomů. Úplně nejjedno-dušší případ je zadání hodnoty a derivace v jediném bodě. Tím určíme beze zbytku polynom stupně jedna
f(x) = f(x0) + f'(x0)(x - x0)
tj. právě rovnici přímky zadané hodnotou a směrnicí v bodě x0. Když zadáme hodnotu a derivaci ve dvou bodech, tj. y0 =
/(*o), y0 = f'(xo), yi = f(x\), y[ = f'(x\) pro dva různé body Xi, dostaneme ještě pořád snadno počítatelný problém.
Ukažme si jej ve zjednodušeném provedení, kdy x0 = 0, x\ = 1. Pak matice systému a její inverze budou
/O 1 0
V3
1\
1
0
o/
j 2 -2 1 1 \
-3 3 -2 -1
0 0 1 0
V 1 0 0 0/
Přímým vynásobením A ■ (y0, y\, yb, yj )T pak vyjde vektor koeficientů (a3, a2, a,\, a0)T polynomu /, tj.
fix) = (2y0 - 2yi + y0 + y[)x3
+ (~3y0 + 3vi - 2yb - y[ )x2 + ý0x + y0-
5.9. Interpolace splajny. Obdobně můžeme předepisovat \. libovolný konečný počet derivací v jednotli-vých bodech a vhodnou volbou stupně polynomu obdržíme vždy jednoznačné interpolace. Nebudeme zde uvádět podrobnosti. Bohužel, u všech těchto interpolací pořád zůstávají problémy zmíněné už v případě jednoduchých interpolací hodnot - složitost výpočtů a nestabilita. Použití derivací však podbízí jednoduché vylepšení metodiky:
Jak jsme viděli na obrázcích demonstrujících nestabilitu interpolace jedním polynomem dostatečně vysokého stupně, malé lokální změny hodnot zapříčiňovaly dramatické celkové změny chování výsledného polynomu. Nabízí se tedy využití malých polynomiálních kousků nízkých stupňů, které ale musíme umět rozumně navazovat.
Nejjednodušší je propojení vždy dvou sousedních bodů polynomem stupně nejvýše jedna. Tak se nejčastěji zobrazují data. Z pohledu derivací to znamená, že budou na jednotlivých úsecích konstantní a pak se skokem změní.
vidíme, že libovolný bod intervalu (0, 1) je vnitřním bodem intervalu [0, 1). Pro každé 8 e (0, 1) je
os (0) n [0, i) = (-s, s) n [0, i) = [0, s),
os (i) n [0, i) = (i - s, í + s) n [0, i) = (i - s, i),
tj. každé á-okolí bodu 0 obsahuje jisté body intervalu [0, 1) a hodnoty z intervalu (—8,0) a každé á-okolí bodu 1 má neprázdný průnik s intervaly [0, 1), [1, 1 + 8). Body 0 a 1 jsou tedy hraničními body. Celkem jsme zjistili, že množina všech vnitřních bodů odpovídá intervalu (0, 1) a množina hraničních bodů je {0, 1}. Stačí si uvědomit, že bod nemůže být současně vnitřní a hraniční a že hraniční bod musí být izolovaný, nebo hromadný. □ Více příkladů k danému tématu najdete na straně 307
C. Limity
V následujících příkladech se budeme zabývat výpočtem limit posloupností, tedy tím, jak posloupnosti „vypadají v nekonečnu". Tj. pokud bychom chtěli předepsat n-tý člen posloupnosti pro hodně velké n, tak nám jej limita posloupnosti (pokud existuje) velmi dobře přiblíží. Limitám posloupností a posléze funkcí věnujeme v příkladovém sloupci hodně prostoru, proto s nimi začínáme dříve (a končíme později), než ve sloupci teorie.
Začněme s limitami posloupností. Potřebné definice nalezne čtenář na straně 256.
5.13. Spočítejte následující limity posloupností: i) lim
2«2+3« + l
n + l '
ii) lim 2"2+3"+1,
iii) lim ,
2" -2-"
iv) lim„.
v) lim
>-oo 2n+2-v/4n2+n
vi) lim \/4n2 + n — 2n.
Řešení.
i) lim
2«2+3« + l n + l
ii) lim ^s±i
' „^no 3«z+« + l
lim
r7=>00
2n+3+j 2+é + -
lim , i
oo.
iii) lim
n + l 2«2+3« + l
1 +
lim „ o i
„=>oo 2«+3+-
251
C. LIMITY
1. INTERPOLACE POLYNOMY
iv)
lim
2" - 2"" 2" + 2_"
lim
2Ĺ. _ i
2-n i 1
v) Podle věty o třech limitách (5.21): Vn e N : ^ < <
--. Dále pak lim ^
«=>oo "
lim
ř7=>cx)
2«
2, lim
lim ^ = 2. Tedy i lim ^-±-
vi)
lim V4«2 + n — 2n
lim
ř7=>cx)
(V4«2 + n - 2n)(V4nT+~ň + 2n)
V4«2 + n + 2n
n
lim —-_
V4«2 + n + 2n
1
lim - _
«=>oo v/4n2+n
+ 2
1
4
□
5.14. Buď c e M+ (kladné reálné číslo). Ukážeme, že lim j/č = 1.
Řešení. Uvažme nejprve c > 1. Vzhledem k tomu, že funkce ^/č je vzhledem k n klesající a její hodnoty jsou stále větší než 1, tak musí mít posloupnost f/č limitu a tou je infmium jejich členů. Předpokládejme, že by tato limita byla větší než 1, řekněme 1 + s, kde s > 0. Pak by podle definice limity byly všechny hodnoty dané posloupnosti od
2 2
jistého m menší než 1 + s + t.j. zejména a^fč < 1 + e + Potom by však
/c
(—,r2, dt v dt
(3) Předchozí tvrzení zůstává bezezbytku v platnosti i pokud <ř má také hodnoty ve vktorovém prostoru (a je lineární ve všech k argumentech).
Důkaz. (1) V lineární algebře se ukazuje, že lineární zobrazení jsou dána konstantní maticí skalárů A = (útý) tak, že
(n n \
z = l z = l '
Derivaci nyní provádíme po jednotlivých souřadnicích výsledku. Víme ale, že derivace se chová lineárně vůči skalárním lineárním kombinacím, viz Věta 5.33. Proto skutečně dostaneme derivaci *ľ o r(t) prostým vyčíslením původního lineárního zobrazení *ľ na derivaci / (ŕ).
(2) Zcela obdobně dostatneme i druhé tvrzení. V souřadnicích rozepíšeme vyčíslení /c-lineární formy na vektorech r\,..., rk takto
n
<í>(rl(t),...,rk(t)) = 5/l.../i-(ri)il(ř)...(rJt)/i(ř),
í'i,...,í';t=i
kde skaláry Bix,„ik jsou pro každou volbu indexů dány jako hodnota dané formy Q(eix, ..., eik) na zvolené /c-tici bázových vektorů. Pravidlo pro derivaci součinu skalárních funkcí nám dá právě dokazované tvrzení.
(3) Pokud má <ř vektorové hodnoty, je zadáno konečně mnoha komponentami a můžeme použít předchozí úvahu na každou z nich. □
Na euklidovském prostoru M3 máme kromě skalárního součinu, který dvěma vektorům přiřadí skalár, také vektorový součin, který dvěma vektorům u a. v přiřadí vektor u x v e M3, viz 4.24. Tento vektor u x v je kolmý na oba vektory u a. v, má velikost rovnou obsahu rovnoběžníka určeného vektory u a v (v tomto pořadí) a orientaci takovou, aby trojice u, v, u x v byla kladně orientovanou bází.
Z předchozí věty okamžitě vyplývají užitečná tvrzení:
Navíc víme, že rovnost nastává právě pro 1 budeme také uvažovat množinu všech po částech spojitých funkcí / jejichž všechny derivace až do řádu k včetně patří do 5° (tj. nemusí existovat ve všech bodech, ale existují jejich jednostranné limity ve všech bodech). Budeme pro ni používat značení 0, b e M. určené polohou a rychlostí bodu v počátečním čase. Funkci / = y lze získat např. vyřešením homogenní lineární diferenciální rovnice
/ + ců2y = 0
vyplývající z aplikace Newtonova zákonu síly pro daný pohyb. Doplňme, že funkce / má zřejmě periodu T = In/to (v mechanice se však častěji mluví o kmitočtu neboli frekvenci 1 /T) a že kladná hodnota a (vyjadřující maximální výchylku kmitajícího bodu od počátku) se nazývá amplituda, hodnota b (vyjadřující polohu bodu v počátečním čase) počáteční fáze a hodnota to pak úhlová frekvence kmitavého pohybu.
Podobně se můžeme zabývat funkcí g = z, která udává napětí v závislosti na čase t v elektrickém obvodu s indukčností L a kapacitou C a která je řešením diferenciální rovnice
(7.3)
z" + co2z =0.
Rozdíl mezi rovnicemi (7.2) a (7.3) (kromě odlišné fyzikální interpretace) je pouze v konstantě co. Pro rovnici (7.2) je co2 = k/m, kde k je konstanta úměrnosti a m je hmotnost hmotného bodu; a pro rovnici
(7.3) je co2 = (LC)-\
Ve skutečnosti každý periodický děj, který lze zadat funkcí ve tvaru (7.1), se označuje jako harmonické kmitání a pro konstanty a,co,b se používá takřka výhradně výše zmíněné označení převzaté z jednoduchého harmonického kmitání hmotného bodu v mechanice.
Když využijeme jednoho ze součtových vzorců
sin (a + P) = cos a sin+ siná cos a, jí e M, můžeme funkci / (viz (7.1)) zapsat jako
(7.4) f(t) = c cos (cot) + d sin (cot) ,
přičemž c = aúnb, d = a cosb. Rovněž tedy funkce / z (7.4) vystihuje harmonické kmitání s amplitudou a = \/c2 + d2 a s počáteční fází b e [0, 2jt) splňující sinb = c/a, cos b = d/a.
Nesmírně důležitou úlohou v aplikačních problémech je skládání (tzv. superpozice) různých harmonických kmitání. Klíčovou pozici potom zaujímá superpozice konečného počtu harmonických kmitání vyjádřených funkcemi ve tvaru
f„(x) = an cos (ncůx) + bn sin (ncox)
pro n e {1, ..., m}. Tyto jednotlivé funkce mají primitivní periodu 2jt/(nců). Jejich součet
(7.5)
a„ cos (jicůx) + bn sin (jicůx)
n = \
389
B. FOURIEROVY ŘADY
1. FOURIEROVY ŘADY
/esdwfj 3 6 8
/esdwfj 3 6 9
je proto periodickou funkcí s periodou Itt/ců. Obecně platí, že superpoS zicí libovolných konečně mnoha jednoduchých harmonických kmitání majících souměřitelné periody je periodický proces, jehož periodou je nej menší společný násobek primitivních period jednotlivých kmitání. Součet (7.5) doplněný o vhodné posunutí
uq y-—^
(7.6) --h an cos (ncůx) + bn sin (na>x)
n = l
je právě m-tým částečným součtem funkcionální řady
oo
Gq —^
(7.7) --h ían cos (na>x) + bn sin (na>x) ].
«=i
Z fyzikálního hlediska jde o složený periodický proces, jenž může sloužit jako přirozená aproximace superpozice nekonečného počtu jednoduchých harmonických kmitání (tzv. harmonických složek) funkcionální řady (7.7).
Nabízí se zde otázka, zda je možné naopak každý periodický proces „rozumně" vyjádřit superpozicí konečného a případně nekonečného počtu jednoduchých harmonických kmitání - zda každý periodický proces je výsledkem takové superpozice. Formulováno přesněji z pohledu matematiky, zda lze každou periodickou funkci vyjádřit jako konečný součet (7.6), příp. alespoň jako součet řady (7.7). Kladnou odpověď pro významnou a širokou třídu periodických funkcí samozřejmě dostáváme pouze pro součet nekonečný (viz teoretická část).
Již jsme řekli, že periodické procesy hrají důležitou roli ve většině fyzikálních i technických oborů. Tradičně vyzdvihněme alespoň akustiku, mechaniku, elektrotechniku, kde se nepopiratelně ukazuje nutnost zodpovězení uvedené otázky. Kromě toho však hledání odpovědi vedlo ke vzniku svébytné matematické partie - teorie Fourierových řad. Ta se poté začala využívat při řešení dalších tříd problémů (mj. k řešení většiny důležitých typů obyčejných a parciálních diferenciálních rovnic) a přispěla k rozvoji samotných teoretických základů matematiky (např. k přesnému vymezení tak fundamentálních pojmů, jakými jsou funkce a integrál).
e7 . 1
Název Fourierovy řady je pak na počest francouzského matematika a fyzika Jeana B. J. Fouriera, který jako první prakticky využil trigonometrické výrazy (7.6) ve své práci z roku 1822 věnované problematice vedení tepla (problematikou se začal zabývat v roce 1804 a práci sepsal již v roce 1811). Význam tohoto Fourierova počinu pro teoretickou fyziku, přestože se fyzice věnoval spíše okrajově, byl nesmírný: zavedl tím do oboru matematické metody, které dodnes patří ke klasickým nástrojům teoretické fyziky. Fourierova matematická teorie tepla se také stala základem pro George S. Ohma při odvození jeho slavného zákonu vedení elektrického proudu. Upozorněme ještě, že
7.3. (Ne)konečnost dimenze a ortogonalita. Zůstaňme na jp^ chvíli u naší definice L2-velikosti || ||2 na vek-t "^Tťf1'^ torovém prostoru = {? pror#j/
[1 pro* =7,
jde o tzv. ortonormální bázi. Připomeňme si v této souvislosti proceduru Gramovy-Schmidtovy ortogonalizace, viz 2.42, která z libovolného systému lineárně nezávislých generátorů f i vytvoří nové (opět lineárně nezávislé) ortogonální generátory gi téhož prostoru, tj. (gt, gj) =0 pro všechny i ^ j. Spočteme je přitom postupně jako g\ = f\ a vzorci
gi+i = fi+i + a\g\ H-----1" aigi, cii
pro l>\.
(fl + Ugi)
390
KAPITOLA 7. SPOJITÉ MODELY
Aplikujme tuto proceduru pro ilustraci na tři polynomy 1, x, x2 na intervalu [—1, 1]. Dostaneme gi = 1,
g2
-ľ -ľ
x ■ 1 dx ■ 1
0
II* 1
3
x2 ■ 1 dx ■ 1
II*
2ll2i-
* dx ' x
Příslušná ortogonální báze prostoru R2[x] všech polynomů stupně nejvýše tři na intervalu [—1, 1] je tedy í,x, x2 — 1/3. Normalizací, tj. vhodným násobením skalárem tak, aby prvky v bázi měly velikost jedna, dostaneme ortonormální bázi
h,
1 /5
Takovým ortonormálním generátorům dreovy polynomy.
1/3). i[x] se říká Legen-
7.4. Ortogonální systémy funkcí. Právě jsme si připomněli výhody, které ortonormální báze pod-prostorů mají pro konečněrozměrné vektorové prostory. V předchozím příkladu Legendreových polynomů generujících R2[x] C V = M.k[x], k > 2, bude pro libovolný polynom h e V funkce
H = (h, h])hi + {h, h2)h2 + (h, h3)h3
jednoznačně určenou funkcí, která minimalizuje naši L2-vzdálenost \\h — H\\ mezi všemi funkcemi v M,t[x], viz. 3.25.
Koeficienty pro nejlepší aproximaci zadané funkce pomocí funkce z vybraného podprostoru je možné tedy získat prostě integrací v definici skalárního součinu.
Uvedený příklad podbízí následující zobecnění: Když provedeme proceduru Gramovy-Schmidtovy ortogonalizace pro všechny monomy 1, x, x2, ..., tj. pro spočetný systém generátorů, co z toho vznikne?
Ortogonální systémy funkcí _
Libovolný konečný nebo spočetný systém lineárně nezávislých funkcí v £f![a,b] takový, že každé dvě různé z nich mají nulový skalární součin, se nazývá ortogonální systém funkcí. Jestliže jsou všechny funkce /„ v posloupnosti po dvou ortogonální a zároveň je pro všechna n velikost II/„|| 2 = 1, hovoříme o ortonormálním systému funkcí.
Uvažme tedy jakýkoliv ortogonální systém funkcí /„ e „|2||/J2 < llsll2-
n = l
(3) L2--vzdálenost g od částečných součtů st = Z~2n=i cnfn jde v limitě k nule, tj.
lim ||g - sk\
K=>0O
o,
tehdy a jen tehdy, když
oo n = l
Ještě než se pustíme do důkazu, zkusme lépe porozumět významu jednotlivých tvrzení této věty. Protože pracujeme s úplně libovolně zvoleným ortogonálním systémem funkcí, nemůžeme očekávat, že lze dobře aproximovat jakoukoliv funkci pomocí lineárních kombinací funkcí /.
Např. když se omezíme u Legendreových ortogonálních polynomů na intervalu [—1, 1] pouze na sudé stupně, určitě budeme dobře aproximovat pouze nanejvýš sudé funkce. Nicméně hned první tvrzení věty nám říká, že vždycky budeme dosahovat nejlepší možné aproximace částečnými součty (v L2-vdálenosti).
Druhé a třetí tvrzení pak můžeme vnímat jako analogii ke kolmým průmětům do podprostorů vyjádřeným pomocí kartézských souřadnic. Skutečně, pokud pro danou funkci g bodově konverguje řada F(x) = E^Li cnfn, pak je funkce
392
KAPITOLA 7. SPOJITÉ MODELY
F (x) v jistém smyslu kolmým průmětem g do vektorového podprostoru všech takovýchto řad.
Druhému tvrzení se říká Besselova nerovnost a je obdobou konečněrozměrného tvrzení, že kolmý průmět vektoru nemůže být větší než původní vektor. Rovnost ze třetího tvrzení se nazývá Parsevalova rovnost a říká, že jestliže se vektor kolmým průmětem do podprostoru ostře nezmenší, pak do tohoto podprostoru jistě sám patří.
Na druhé straně ale naše věta neříká, že by částečné součty uvažované řady musely bodově konvergovat k nějaké funkci. To je jev, který v konečněrozměrném světě nemá obdobu. Řada F(x) obecně nemusí být konvergentní (tj. pokud bychom uvažovali obecnější funkce než je náš prostor ~2T=i a všechny funkce /„ jsou stejnoměrně omezené na I, pak zřejmě řada F(x) = 2~2T=i cnfn konverguje v každém x. Nemusí ale přitom konvergovat všude k funkci g. K těmto úvahám se brzy vrátíme.
Důkaz všech třech tvrzení věty je velmi podobný jako u konečněrozměrných euklidovských prostorů. Není divu, protože odhady vzdálenosti g od částečného součtu / se vlastně dělají jen v konečněrozměrném lineárním obalu dotčených funkcí:
Důkaz Věty 7.5. Zvolme libovolnou lineární kombinaci / = Yln=i a"fn a spočtěme její vzdálenost od g. Dostáváme
\\g - ^anfn\\2 = / g(x) - ^anfn(x)
n = l Ja n = l
« = 1 -b
dx
/b r-b k
\g(x)\2dx- Y2g(x)anfn(x) dx-Ja n=\
/b k i>b k
^ an f„ (x)g (x) dx + ^anf„ (x)
~ n = l Ja n = l
h £ h 2 - J]^C„||./„||2 - J>„^||/„||2 + Ysal\\fn
n — 1 n — 1 n — 1
k
\\g\\2 + J]ll/„l|2((c„ -an)(cn -an)- \cn\2).
«=1
Evidentně lze poslední výraz minimalizovat právě volbou an = cn, čímž je první tvrzení dokázáno.
Dosazením této volby dostáváme tzv. Besselovu identitu
k k
\\g - J>„/„||2 = kil2 - lc»l2ll/»ll2'
«=i
«=i
ze které okamžitě díky nezápornosti levé strany vyplývá dokazovaná Besselova nerovnost
«=1
/_\\n_1
1—'-— cos (nx)
jt _ 4_ cos([2n —1]*) 2 jt ^ (2«-l)2
n = \
COSX + ^-|^ + ^f^ + -
32 1 52
Tuto řadu bylo možné nalézt i jednodušším způsobem - pomocí integrování Fourierovy řady Heavisideovy funkce (viz „hranatá vlnová funkce" v teoretické části).
Případ (c). Funkce má periodu T = 2, a proto použijeme obecnější vzorce
x0+t 1 0 1
a0 = j f g(x) dx = f g(x) dx = f 0dx + f x + 1 dx = |,
x0
-1
-1
0
x0+t 1
an = j f g(x) cos (na>x) dx = f g(x) cos (njtx) dx
x0 -1 0 1
/ 0 dx + f(x + 1) cos (nnx) dx -1 o
(-D"-l
n eN,
x0+t
1
^„ — j f g(x) sin (ncox) dx = f g (x) sin (njtx) dx =
x0 -1 0 1
/ Odx + f(x + 1) sin (njtx) dx = 1~2(~1)", n e N. -1 o
Výpočet a0 byl snadný a netřeba jej komentovat. K vyčíslení integrálů u an a bn raději doplňme, že opět stačilo jedenkrát použít metodu per partes (derivovat polynom u = x + 1). Hledaná Fourierova řada tak je
00 / \ + E cos (nnx) + sin (nnx)
n = l V 7
Dílčích zjednodušení zápisu můžeme docílit, když si např. uvědomíme, že pro neN platí
a podobně
"ňhfi Pro 11 liché, an = 0 pro n sudé
bn = pro n liché, b„ = — pro n sudé.
n = \
□
7.6. Nechť je dána Fourierova řada s koeficienty am, bn pro m e N U {0}, n e N funkce / na intervalu [—jt, 7t]. Dokažte následující tvrzení:
(a) Jestliže f (x) = f (x +7t), x e [—jt, 0], potom a2k-i = b2k-i = 0 pro každé & e N.
(b) Jestliže f (x) = —f (x + jt), x e [—jt, 0], potom a0 = a2k = b2k = 0 pro každé k e N.
Řešení. Případ (a). Tvrzení lze pro libovolné k e N dokázat přímo výpočty
jt
a.2k-\ = x f /(x) cos ([2£ — l]x) dx =
— jt
0 ji
l- j f (x) cos ([2* - l]x) dx+l- j f (x) cos ([2* - l]x) dx =
-jt 0
393
B. FOURIEROVY ŘADY
1. FOURIEROVY ŘADY
\x=y + jt\ = l- f f(y+ Jt) cos ([2k - l][y + jt]) dy +
-2jt
jt
- f f(x)cos([2k — l]x) dx = o
jt jt
l- j f (y) cos ([2/c - l][y + ir]) dy + l- j f (x) cos ([2/c - l]x) 1-,,77-
t—1 1+«2jt2 '
« = 1
7.9. Rozvoj periodických funkcí. Konvergentní Fourie-rova řada bude samozřejmě konvergovat i mimo původní interval [—7/2, 7/2] a bude periodickou funkcí na celém R. Jako přiklad uveďme Fourierovu řadu pro periodickou funkci vzniklou z Heavisideovy funkce g(x) zúžením na jednu periodu. Tj. naše funkce g bude na intervalu [—jt, 0] rovna —1 a na intervalu (0, 7t) bude rovna 1. Hodnotami v nule a v krajních bodech intervalu se nemusíme zabývat, protože stejně na koeficienty Fourierovy řady nebudou mít žádný vliv. Jejímu periodickému rozšíření na celé R se říkává „hranatá vlnová funkce".
Protože jde o funkci lichou, jistě budou všechny koeficienty u funkcí cos(«x) nulové. Pro koeficienty u funkcí sin(«x) spočteme
i r
\ = ~ /
X J-n
g(x) sin(«x) dx
2 r
* Jo
sin(«x) dx
nit
-(1-(-!)")■
Výsledná Fourierova řada je tedy tvaru
4 / 1 1
g(x) = — { sin(jc) H— sin(3x) H— sin(5x) + it V 3 5
a součet jejích prvních pěti a prvních padesáti členů je na následujících dvou obrázcích.
Pokud za základní periodu pro takovou hranatou vlnovou funkci zvolíme interval [—7/2, 7/2], tj. chceme pracovat s periodickým rozšířením Heavisideovy funkce s periodou 7, jednoduše přepočítáme, že výsledná Fourierova řada je tvaru
4 / 1 1
g(x) = — { sm(úDx) H— sin(3 0.
Skutečnost, že / je rostoucí, ani není třeba ověřovat výpočtem první derivace. Stačí úvaha nebo jednoduchá úprava
f(s) ~ f(r)
l+s l+r (l+s)(l+,
t > 0, s > r > 0.
r) ' —
Platí proto
d(x, z)
x-z.
1+1 x-z x-y__|_ _
x-y+y-z 1 + | x-y+y-z IJLzlJ- <
1 + | x-y | + | y—z | 1 + | x-y \ + \ y-z, | — 1 + | x-y
d(x, y) + d(y, z), x, y, z e S
x-y l+l y-z
1 + | x-y l + l y-z
x-y _|_ y-z
i+ly-z
□
7.22. Určete vzdálenost funkcí
f (x) = x, g(x) =
VT+í2'
x e [1,2]
jako prvků normovaného vektorového prostoru 5[1,2] spojitých funkcí na intervalu [1,2] s normou
(a) ll/IU = fl\f(x)\dx;
(b) || / ||M = max{|/(*) |; x € [1,2]}.
Řešení. Případ (a). Stačí vypočítat
■■ dx =
2 2
f\f(x)-g(x) \ dx=fx +
1 1
n+x2
n 2
| + VŠ - y/2.
Případ (b). Nyní chceme určit
max | f (x) - g (x)
xe[l,2]
| = max (x + ,x „ ) .
jceľl,21 V \/l+x2/
Při hledání extrémů funkcí je velmi silným a účinným nástrojem jejich derivování. Ihned z nerovnosti
x +
l\+x2
1 +
(■Jl+x2)1
>0, iě[1,2]
407
C. METRICKÉ PROSTORY
2. METRICKÉ PROSTORY
vidíme, že
max (x +
Jte[l,2]
2 +
2 + -2-
n+x2 / vi+22 Rostoucí funkce na uzavřeném intervalu totiž nabývá své maximální hodnoty v jeho pravém krajním bodě. □
7.23. Zjistěte, jestli je posloupnost {x„}„eN, kde
xx = 1, jc„ = l + i + + n eN\{l}, cauchyovská v M. Uvažujte nejprve běžnou metriku danou rozdílem v absolutní hodnotě (tj. indukovanou normou, kterou je absolutní hodnota) a poté metriku
d(x, y) : Řešení. Připomeňme, že
EÍ
1 + 1 x-y
x, y e
(7.28) Platí tak
oo,
tj-
k=\
lim \xn
EÍ
k—m
E
k—m + l
oo, m e N.
oo, m e N.
Odsud je vidět, že posloupnost {xn} nemůže být cauchyovská. Nalezli jsme odpověď pro běžnou metriku. Mohli jsme však hned využít toho, že posloupnost {xn} není podle (7.28) konvergentní, a vzpomenout si, že se nacházíme v úplném metrickém prostoru, kde cauchyovské a konvergentní posloupnosti splývají.
Pro metriku d si stačí uvědomit, že zobrazení / zavedené v (7.27) je spojitou bijekcí mezi množinami [0, oo) a [0, 1) s vlastností, že /(O) = 0. Libovolná posloupnost je tak konvergentní „v původním významu", právě když konverguje v metrickém prostoru M s metrikou d. Stejně tak platí, že posloupnost je cauchyovská v M vzhledem k běžné metrice právě tehdy, když je cauchyovská vzhledem k d. □
7.24. Je metrický prostor 1;
(b) ||/||0o=max{|/(x)|;xe[-l,l]} úplný?
Řešení. Případ (a). Pro každé n e N definujme funkci
fn(x) = 0, x e [-1,0), fn(x) = 1, x e [£, l],
/„(*) = nx, x e [0, i) .
Takto získaná funkční posloupnost {f„}„em C X2 mezi metrickými prostory s metrikami d\ a d2 řekneme, že je izometrie, jestliže pro všechny prvky x,y e X platí d2((p(x), cp(y)) = d\(x, y).
Každá izometrie je samozřejmě bijekcí na svůj obraz (plyne z vlastnosti, že vzdálenost liovolných různých prvků je nenulová) a příslušné inverzní zobrazení je také izometrie.
Uvažme nyní dvě vložení hustých podmnožin i\ : X -> Xi a í2 : X -> X2 do dvou zúplnění prostoru X a pišme d, d\ a di pro příslušné metriky. Evidentně je na husté podmnožině i\(X) C X\ dobře definované zobrazení
cp : tl(X)
X
X
2 •
Jeho obrazem je hustá podmnožina i2(X) C X2 a toto zobrazení je navíc zjevně izometrií. Stejně tak funguje i opačné zobrazení ti o u1.
408
KAPITOLA 7. SPOJITÉ MODELY
Každé izometrické zobrazení samozřejmě zobrazuje cau-chyovské posloupnosti na cauchyovské posloupnosti. Zároveň budou takové cauchyovské posloupnosti konvergovat ke stejnému prvku v zúplnění právě, když totéž bude platit o jejich obrazech v izometrii n(s). Spojitá funkce / proto musí splňovat
f(x) =0, x e [-1, 0], f (x) = 1, x e [e, 1] pro libovolně malé s > 0. Tedy nutně
f (x) = 0, x e [-1, 0], f (x) = 1, x e (0, 1].
Tato funkce však není spojitá na [—1, 1] - nepatří do uvažovaného metrického prostom. Posloupnost {/„} tak nemá limitu v 0 (chcete-li, ke každému s/2) existuje n(s) e N, pro které platí
s
(7.29) max | fm(x) - fn(x) | < -, m,n> n(s).
jce[-l,l] 2
Zvláště tak pro každé x e [—1,1] dostáváme cauchyovskou číselnou posloupnost {/„(x)}„eN c M. Neboť metrický prostor M s běžnou metrikou je úplný, každá (pro x e [—1,1]) posloupnost {/„(x)} je konvergentní. Označme
fix) := lim f„ix), x e [-1, 1].
Limitním přechodem pro m -> oo v (7.29) obdržíme
max | fix) - f„ix) | < f < s, n> n (e).
jce[-l,l] 2
To ovšem znamená, že posloupnost {/„}„£n stejnoměrně konverguje kfunkci / na [—1, 1]. Jinakřečeno, {/„}„£n konvergujek / vzhledem k zadané normě. Již dříve jsme navíc zjistili, že stejnoměrnou limitou spojitých funkcí je funkce spojitá. Díky tomu nemusíme dokazovat, že / e / '
První dvě vlastnosti metriky jsou očividně splněny. K dokázaní trojúhelníkové nerovnosti si stačí všimnout, že d(m, n) e (1, 4/3], je-li m 7^ n. Stejně lehce lze najít všechny cauchyovské posloupnosti. Těmi jsou tzv. skorostacionární posloupnosti - od jistého indexu konstantní (konstantní až na konečně mnoho výjimek). Každá cauchyovská posloupnost je tedy konvergentní a uvažovaný prostor úplný. Zaveďme množiny
A„ := {m e N; d(m, n) < 1 + ^} , n e N.
Neostrá nerovnost v jejich definici zaručuje, že se jedná o uzavřené množiny. Neboť An = {n, n + 1, ...}, (7.30) neplatí. Při vynechaní podmínky (7.31) by to znamenalo, že metrický prostor není úplný, což není pravda. Pro jistotu dodejme, že
lim sup {d(x, y); x, y e A„} = lim (l + ^-r) = 1^0.
□
7.26. Dokažte, že metrický prostor h je úplný.
Řešení. Uvažujme libovolnou cauchyovskou posloupnost {x„}„eN v prostoru Z2- Každým členem této posloupnosti je ovšem zase posloupnost, tj. xn = {x^}ken, nel Poznamenejme, že samozřejmě nezáleží na rozsahu indexování - zda n, k e N, resp. n, k e N U {0}. Zaveďme pomocné posloupnosti yk pro k e N tak, že
yk = KWn = KLeN-Je-li {xn} cauchyovská v l2, pak tím spíše musí být cauchyovská každá z posloupností yk v M (posloupnosti yk jsou posloupnostmi reálných čísel). Z úplnosti M (vzhledem k běžné metrice) plyne, že všechny posloupnosti yk jsou konvergentní. Jejich limity označme jako zk, k e N.
Stačí nám dokázat, že z = {zk}ken £ h a že posloupnost {xn} konverguje pro n -> 00 v h právě k posloupnosti z- Posloupnost {■*«}«eN C h je cauchyovská, a tak ke každému s > 0 existuje n (s) e N s vlastností, že
dostaneme snadno:
ď(x,z) = hm d(Xi, ži)
< lim d(Xi, y i) + lim 0 najdeme v původním prostoru nějaké y takové, že vzdálenost konstatní posloupnosti prvků y od zvolené posloupnosti x; nebude větší než e. Protože je však posloupnost x; cauchyovská, budou všechny dvojice xn, xm jejích členů sobě blíže než o e pro dostatečně veliké indexy man. Pak ale nutně také výběrem y = xn pro jeden takový index budou již sobě prvky y a xm blíže než o e a tedy i v limitě bude platit, že d(ý, x) < e.
Závěrem je tedy ještě třeba ukázat, že cauchyovské posloupnosti bodů rozšířeného prostoru X vzhledem k metrice d jsou už nutně konvergentní. Jinak řečeno, chceme ukázat, že opakováním předchozí konstrukce již nedostaneme nové body. To uděláme tak, že budeme umět postupně body cauchyovské posloupnosti xk přiblížit body yk z původního prostoru X tak, aby výsledná posloupnost y = {y;} byla limitou původní posloupnosti vzhledem k metrice d.
Protože již víme, že je X v X hustou podmnožinou, můžeme pro každý prvek xk z naší dané posloupnosti vybrat prvek z,k £ X tak, aby pro konstantní posloupnost žk platilo d(xk,ž,k) < l/k. Uvažme nyní posloupnost ž = {z,o,zi, ■■■}■ Původní posloupnost x je cauchyovská, tj. pro pevně zvolené číslo e > 0 najdeme index n(e) takový, že d(xn, xm) < e/2, kdykoliv budou m i n větší než n(e). Bez obav můžeme přitom předpokládat, že námi zvolený index n(e) je větší nebo roven číslu 4/e. Nyní dostáváme pro m i n větší než n(e):
d{Zm 1 Zn) — d(Zm , Zn )
— d(Zm 1 xm) ~i~ d(xm , Xn) -\- d(xn , Zn )
< l/m+e/2 + l/n < 2^- + |
Jde tedy o cauchyovskou posloupnost z,i prvků v X a tedy ž e X. Zkoumejme, zda vzdálenost d(xn,ž) skutečně jde k nule, jak jsme se snažili konstrukcí zajistit. Z trojúhelníkové nerovnosti
ď(Ž, Xn) <ď(l,Zn)+ ď(ln , Xn)-
Podle našich předchozích odhadů ale jdou oba sčítanci napravo k nule a tím je důkaz ukončen. □
V dalších třech odstavcích si uvedeme tři docela jednoduché věty o úplných metrických prostorech, které mají spoustu
410
KAPITOLA 7. SPOJITÉ MODELY
důležitých aplikací jak v samotné matematické analýze, tak v ověřování konvergence numerických metod.
7.19. Banachova věta o kontrakci. Zobrazení F : X -» X na metrickém prostoru X s metrikou d se nazývá kontrahující zobrazení, jestliže pro nějakou reálnou konstantu 0 < C < 1 a všechny prvky x, y v X platí
d(F(x), F (y)) < Cd(x,y).
Věta. Je-li F kontrahující zobrazení ]nfeuj^^^mgtfQ prostom X, pak existuje jeho pevný bod z t X, tj. F (z) = Z
Důkaz. Důkaz docela přímočaře sleduje intuitivní představy, že když je zobrazení kontrahující, mělo by se jeho iterované působení na nějaké počáteční hodnotě zo e X „hromadit" k nějakému bodu. K tomu pochopitelně potřebujeme úplnost, jinak by limitní bod už nemusel v X existovat.
Zvolme tedy libovolné zo e X a uvažme posloupnost zi, i =0,1,...
zi = F(zo), Z2 = F(zi), Zi+i = F(zí), ... Podle předpokladů platí
d(zi+i,Zi) =d(F(zi),F(zi-i))
< Cd(zi,Zi-i) <■■■< Cd(zuzo).
Z trojúhelníkové nerovnosti pak pro všechna přirozená čísla j dostáváme
d(zi+j,Zi) < y^^djzj+k, Zj+k-i)
k=\
j
< Ci+k-ld(zi,zo) = Cdizuzo) C
k=l k=l
n(s), n, l e N,
k=l
tj. (tentokráte l -> oo)
oo
(7.32) ^{zk-xlf n(e) už měly průměr menší než e. Pak ale nutně pro takto veliké indexy i, j bude také d(zi, Zj) < e a tedy je naše posloupnost cauchyovská. Bude proto mít limitní bod z e X, který pochopitelně musí být hromadným bodem všech A; a proto patří do všech Ai (když jsou všechny uzavřené) a tedy patří do jejich průniku.
Dokázali jsme tedy existenci z, zbývá odůvodnit jednoznačnost. Předpokládejme tedy, že máme body z a y, oba v průniku všech A;. Jejich vzdálenost pak ale musí být menší než průměr všech A;, ten ale konverguje k nule. Tím je důkaz ukončen. □
7.21. Věta (Bairova věta). Je-li X úplný metrický prostor,
pak průnik libovolného spočetného systému otevřených hustých množin A i je množina hustá v metrickém prostoru X.
Důkaz. Máme dán systém hustých a otevřených množin A{ \ X, i = 1, 2..., a chceme ukázat, že množina A = n^jA, má s libovolnou otevřenou množinou U C X neprázdný průnik. Budeme postupovat induktivně s pomocí předchozí věty.
Jistě existuje z\ e A\ Pit/, protože je ale množina A\ otevřená, patří bod z,i do tohoto průniku i s uzávěrem svého e\ okolí U\ pro dostatečně malé e\. Označme si uzávěr této e\-koule U\ jako B\. Předpokládejme dále, že již jsou vybrány body zí a jejich otevřená e;-okolí Ui pro i = 1, ..., n. Protože je množina An+\ otevřená a hustá v X, jistě existuje bod z,n+i £ A„+i n U„, protože je ale An+\ n U„ otevřená, patří do ní bod z,n+i i s dostatečně malým en+\ okolím Un+\. Pak jistě také pro uzávěry platí Bn+\ = Un+\ C U„ a tedy uzavřená množina Bn+\ je obsažena v An+\ n U„. Jistě přitom můžeme předpokládat i en < 1/n.
Jestliže takto induktivně postupujeme od původního bodu z,i a množiny B\, dostáváme neklesající posloupnost neprázdných uzavřených množin Bn, jejichž průměr jde k nule. Existuje tedy společný bod z všech těchto množin, tj.
z e n^ř/i = n^Bi c n~!A„ n u,
což jsme chtěli dokázat. □
412
KAPITOLA 7. SPOJITÉ MODELY
7.22. Ohraničené a kompaktní množiny. Pro reálná čísla se nám osvědčily následující pojmy, které nám ulehčovaly vyjadřování. Pro metrické prostory je můžeme převzít skoro beze změn:
Vnitřním bodem podmnožiny A v metrickém prostoru je takový prvek, který do A patří i s nějakým svým e-okolím.
Hraniční bod množiny A je takový prvek x e X, jehož každé okolí má neprázdný průnik jak s A tak s doplňkem X\A. Hraniční bod tedy může, ale nemusí patřit do samotné množiny A.
Otevřené pokrytí množiny A je takový systém otevřených množin Ui C X, i e I, že jejich sjednocení obsahuje celé A.
Izolovaným bodem množiny A rozumíme prvek a e A, který má v metrickém prostoru X e-okolí, jehož průnik s A je právě jednobodová množina {a}.
Množina A prvků metrického prostoru se nazývá ohraničená nebo omezená, jestliže je její průměr konečný, tj. existuje kladné reálné číslo r takové, že d(x, y) < r pro všechny prvky x, y e A. V opačném případě je neohraničená nebo neomezená.
Metrický prostor X se nazývá kompaktní, jestliže v něm má každá posloupnost x; e X podposloupnost konvergující k nějakému bodu x e X.
U reálných čísel jsme si uváděli několik charakterizací kompaktnosti. U metrických prostorů to je o něco složitější s pojmem ohraničenosti. Pro libovolné podmnožiny A, B c X v metrickém prostoru X s metrikou d definujeme vzdálenost
dist(A,S)= sup {d(x, y)}.
xeA,yeB
Je-li A = {x} jednobodová množina, hovoříme o vzdálenosti dist(x, B) bodu od množiny. Řekneme, že je metrický prostor X totálně omezený, jestliže ke každému kladnému číslu e > 0 existuje konečná množina A taková, že
dist(x, A) < e
pro všechny body x e X. Připomeňme, že metrický prostor je omezený, jestliže má celé X konečný průměr.
Je okamžitě vidět, že totálně omezený prostor je také omezený. Skutečně, průměr konečné množiny je vždy konečný a jeli A množina z definice totální omezenosti příslušná k e, pak vzdálenost dvou bodů d(x, y) můžeme vždy shora odhadnout součtem dist(x, A), dist(y, A) a diamA, což je konečné číslo. V případě metriky na podmožině koneč-něrozměrného euklidovského prostoru tyto pojmy splývají, neboť omezenost množiny zaručuje omezenost všech jednotlivých souřadnic v pevně vybrané ortonormální bázi a odtud již plyne i totální omezenost (ověřte si podrobně samostatně).
Věta. Následující podmínky na metrický prostor X jsou ekvivalentní
Řešení. Víme, že prostor l2 je úplný. Každá uzavřená podmnožina úplného metrického prostoru sama zadává úplný metrický prostor. Množina A je očividně uzavřená v l2, a tak k její kompaktnosti stačí ukázat, že je totálně omezená.
Vyjděme z nám dobře známého součtu
oo
V i- — ÍEl 2- k2 ~ 6 •
Pro každé s > 0 tak existuje n(s) e N splňující
E l2
2'
u k=n(e) + l
Z každého z intervalů [—1/n, 1/n] pro n e {1, ..., n (s)} můžeme vybrat konečně mnoho bodů x" , ..., x^(n) tak, aby pro libovolné x e [-1/n, 1/n] bylo
mm
j'e{l,...,m(«))
/5"
Uvažujme takové posloupnosti {y„ }„eN z l2, jejichž členy s indexy n > n (s) jsou nulové a současně platí
yi€[x1,..., xm(1)},..., yn{8) e , ..., xm(n(B)) j . Všech takových posloupností je konečně mnoho a tvoří e-síť pro A, neboť
____4- St- 4- £ < o . _k__1 4- £
Libovolnost s > 0 potom implikuje, že množina A je totálně omezená, což již dává její kompaktnost.
Rozhodnout o kompaktnosti množiny B je velmi snadné. Každá kompaktní množina totiž musí být uzavřená, a to množina B není. Jejím uzávěrem je
B = {{xn}neN e Zoo; | x„ | < \, n e N}. Množina B pak je kompaktní. Důkaz je výrazně jednodušší než pro množinu A, a proto jej přenecháváme čtenáři jako cvičení. □
D. Integrální operátory
7.30. Určete konvoluci f\ * f2 funkcí
1 — x pro x e (—2, 1) 0 jinak
fi
Í2
1 pro x e (0, 1) 0 jinak
7.31. Nalezněte Fourierovu transformaci F(f) = f funkce
/(ř) = sgnř, ře(-l,l); fit) = 0, řel\(-l,l), tj. /(O) = 0, fit) = 1 pro t e (0, 1) a fit) = -1 pro t e (-1, 0). Řešení. Fourierova transformace uvedené funkce je
413
D. INTEGRÁLNÍ OPERÁTORY
2. METRICKÉ PROSTORY
vesrfuuô
W)M = -vfc / f (t) e
dt
f sgn t (cos (a>t) — i sin ( 1 a \/p + \/q = 1, C > \f(x)\ na celém intervalu [a, b] (takové stejnoměrné omezení konstantou vždy existuje, když je / e ~x \f(x)\a vztahu 1 - 1/p = l/q.
Je tedy z prvního odhadu zjevné, že Lp-konvergence /n —> / bude pro jakékoliv p > 1 vždy silnější než L\-konvergence (a drobně upraveným odhadem ukážeme i obdobné silnější tvrzení, že Lq konvergence je silnější než Lp konvergence, kdykoliv je q > p, zkuste si sami). Pro použití druhého odhadu ale musíme požadovat stejnoměrnou omezenost posloupnosti funkcí /„, tj. omezení funkcí /„ konstantou C musí být nezávislé na n. Pak totiž můžeme odhadnout \f„(x) — f(x)\ < 2C a dostáváme z našeho odhadu, že L\-konvergence je silnější než Lp-konvergence.
414
KAPITOLA 7. SPOJITÉ MODELY
Jsou tedy všechny Lp-normy na našem prostom 5° [a, b] rovnocenné z hlediska konvergence stejnoměrně omezených posloupností funkcí.
Nejtěžší (a také nejzajímavější) bude dokázat první tvrzení Věty 7.8, které bývá v literatuře označováno jako Di-richletova podmínka (a byla údajně odvozena již v roce 1824). Dokážeme proto nejprve, jak z této vlastnosti bodové konvergence vyplývají tvrzení (2) a (3) dokazované věty. Bez újmy na obecnosti můžeme předpokládat, že pracujeme na intervalu [—7T, 7T], tj. s periodou T = lit.
Jako první krok si připravíme jednoduché odhady pro koeficienty Fourierovy řady. Samořejmý je odhad
přičemž C e M\{0}. Zahrnutím nulového řešení tak můžeme vyjádřit všechna řešení diferenciální rovnice (7.33) jako funkce
y(ců) = Ke-é, řel.
Doplňme určení konstanty K, pro niž získáváme právě T(f)(co). Později (v souvislosti s tzv. normálním rozdělením ve statistických metodách) se dozvíme, že
z čehož plyne
\a„\ <
i r
x J-7t
f e %1 dx = y/Ťt,
/ eTa? dt = ± f e~x2 dx
\f(x)\dx
a totéž pro všechna bn, neboťjak cos(x), tak sin(x) jsou v absolutní hodnotě ohraničené jedničkou. Pokud je ale / spojitá funkce v S1 [a, b], můžeme integrovat per partes a dostaneme
Platí proto
W)(0) = vk V? = ^ a současně T(f)(0) = K e° = K. Celkem máme
F(f)(co) = .
O-nif)
i r
x J-7t
f (x) cos(nx)dx
□
— [f (x) sin(«x)] niv
-bn(f').
n
* -—ľ f ~n nit J_n J
(x) sin(řix) dx 7.33. Stanovte funkci /, jejíž Fourierovou transformací je funkce
f (co) = -L. co^O.
Píšeme zde an(f) pro příslušný koeficient funkce / atd.
Vidíme tedy, že čím „hladší" funkce, tím rychleji se blíží Fourierovy koeficienty k nule. Iterací této procedury skutečně dostaneme odhad pro funkce / v Sk+l[—7t, 7t] se spojitými derivacemi až do řádu k včetně
Řešení. Inverzní Fourierova transformace dává
oo
1 f C sin oj aiojt 2tz
e'"" dco + f eimt dco
\cin(f)\ <
i r
nk+l7t J_K
\f(k+1)(x)\dx
Jestliže použijeme substituci, kdy nahradíme —co zuto y integrálu přes interval (—oo, 0], získáme
/ oo oo
f(.t) = £(fúŽfL e~imt dco + fs^f émt dco
a totéž pro bn(f). Jinak řečeno, pro dostatečně hladké funkce / jsou n^-násobky jejich Fourierových koeficentů an a bn ohraničeny L i -normou jejich k-té derivace f{k\
Předpokládejme tedy, že máme spojitou funkci / v prostoru Sl[a, b], jejíž částečné součty Fourierovy řady bodově konvergují k /. Můžeme pak odhadnout
1 C sin oj 2jt
\sn{x) - f(x)\
y (ak cos(kx) + bk &m(kx))
fc=7V+l oo
E (\ak\ + \h\).
k=N+l
Pravou stranu můžeme dále odhadnout pomocí koeficientů a'n a b'n derivace /' (s použitím Hólderovy nerovnosti pro Lp
f [cos (a>t) — i sin (a>t) + cos (cot) + i sin (cot) ] dco =
oo
- f ^ cos (cot) dco.
tz j oj v '
0
Poznamenejme, že předchozí vyjádření lze obdržet už z toho, že funkce y = ^f- s maximálním definičním oborem je sudá. Pomocí identity
sinx • cos (xy) = j (sin [x(l + y)] + sin [x(l — y)]) , x, y e M, která mj. vyplývá ze součtových vzorců (pro sinus), dostáváme
(oo oo f sin[^1+ž)] dco + f Sin[^-Ž)] dco o m o m
Substituce u = co (\ + t), v = co (\ — t) potom dávají
/ oo oo \
f(f) = ^lfÉ^du-f^dv) = 0, f >1;
415
D. INTEGRÁLNÍ OPERÁTORY
2. METRICKÉ PROSTORY
m = ^[fÉ^du + f^dv) =1-f^du, f e (-1,1);
0, ř<-l.
Vo o /
Dokázali jsme tak, že funkce / je nulová pro \t\ > la konstantní
(nutně nenulová) pro 11 | < 1. (Po celou dobu předpokládáme, že inverzní Fourierova transformace existuje.)
Určeme funkční hodnotu /(O). Pro funkci
g(t) = l, m\
platí
1 / &-imtdt
f cos (cút) dt
2_sin oj
2m a>
Odtud plyne, že /(O) = g(0)/2 = 1/2. Ještě vyzdvihněme vyčíslení integrálu
oo
f*2JLdu = Z;
Ju 2 '
0
které jsme rovněž obdrželi. 7.34. Vyřešte integrální rovnici
oo
/ fix) sin (xt) dt = e~x, x > 0 o
pro neznámou funkci /.
□
7.23
Řešení. Pokud obě strany rovnice vynásobíme číslem y/2/n, obdržíme na levé straně právě sinovou Fourierovu transformaci. Stačí tedy aplikovat na rovnici inverzní transformaci. Takto dostaneme
oo
f{t) = 2- f e~x sin(xř) dx, t > 0.
o
Dvojnásobným použitím metody per partes pak lze spočítat
/ e~x sin (xt) dx = í~ sm (xt) ~ ř cos (xt) ] + C, a tudíž je
oo
/ e~x sin ixt) dx = o
lim ([— sin ixt) — t cos ixt) ]) Řešením rovnice je proto funkce
f(t) = lT±ž, t>0.
l+t2
(-0
t
l+t2
□
7.35. Nalezněte řešení tzv. rovnice vedení tepla (rovnice difúze)
ut(x, t) = a2 uxxix, t), x e M, t > 0 splňující počáteční podmínku lim u(x,ť) = fix).
t^0+
Poznámky: Symbolem ut = ^- zde rozumíme parciální derivaci funkce u podle t (tj. derivujeme podle t, přičemž x považujeme za konstantní) a podobně uxx = ^ označuje druhou parciální derivaci
a Lq normy pro nekonečné řady s p = q = 2, viz 7.15, a Bes-selovy nerovnosti pro obecné Fourierovy řady. viz 7.5.(2))
oo ^
Áx) - fix)\ < t(KI + \K\)
\Sn(
k=N+l
oo i x 1/2 / oo \ 1/2
k=N+l ' \=N+1 1/2
X1 ) y/jt
V2 , \ 1
Dostali jsme takto nejen důkaz stejnoměrné konvergence naší řady k předjímané hodnotě, ale také odhad rychlosti konvergence:
sup|^(x) -fix)\ < (?!l\\f>\\\ ■ -L.
re! VV^ / VN
Tím je dokázáno tvrzení 7.8.(2) za předpokladu platnosti Di-richletovy podmínky 7.8.(1).
7.24. L2-konvergence. V dalším kroku našeho důkazu odvodíme L2-konvergenci Fourierových řad za % předpokladu stejnoměrné konvergence. Důkaz se opírá o obvyklou techniku aproximace nespojitých objektů spojitými, kterou popíšeme jen bez podrobností. V případě zájmu či potřeby by mělo být vcelku snadné detaily doplnit. Sformulujeme si napřed potřebné tvrzení obecně:
Lemma. Podmožina spojitých funkcí f v £P[a, b] na konečném intervalu [a, b] je v tomto prostoru hustá podmnožina vzhledem k L2-normě.
Myšlenka důkazu je dobře vidět na přikladu aproximace Heavisidovy funkce h na [—jt, 7t]. Pro každé jt > 8 > 0 definujeme funkci fs jako x/8 pro \x\ < 8 a fsix) = h(x) jinak. Zjevně jsou všechny funkce fs spojité, protože jsme bod nespojitosti překlenuli pomocí vhodné lineární funkce na intervalu, jehož velikost je kontrolována pomocí 8. Velmi jednoduše se spočte, že \\h — fs\\2 —> 0, neboť funkce / je omezená v absolutní hodnotě a tedy příspěvek integrace přes stále se zmenšující interval musí jít k nule.
Zcela stejným způsobem můžeme ošetřit všechny body nespojitosti obecné funkce /, kterých je maximálně konečně mnoho a tedy jsou skutečně všechny uvažované funkce hromadnými body posloupností spojitých funkcí.
Nyní je již náš důkaz jednoduchý, protože pro zadanou funkci / můžeme odhadnout vzdálenost od částečných součtů její Fourierovy řady pomocí spojitého přiblížení f€ takto (všechny normy v tomto odstavci jsou L2 normy):
ll/-^(/)ll < ll/-/e|| + ll/e-íiv(/e)ll + l|íiv(/e)-íiv(/)ll a jednotlivé sčítance napravo umíme kontrolovat.
416
KAPITOLA 7. SPOJITÉ MODELY
První z nich je nejvýše e, podle předpokladu o stejnoměrné konvergenci pro spojité funkce můžeme dosáhnout stejně malého ohraničení i druhého sčítance. U třetího je dobré si všimnout, že jde vlastně o velikost částečného součtu Fourierovy řady pro / — f€. Je tedy jistě
||/-/e-íiv(/-/e)ll < a proto také (díky trojúhelníkové nerovnosti)
<2||/-/e|| <2e.
Celkem jsme tedy odhadli celou vzdálenost pro dostatečně bllízké spojité funkce a dostačně velká TV číslem 4e. Tím je dokazovaná L2 konvergence potvrzena.
7.25. Dirichletovo jádro. A konečně se dáme do důkazu \\ prvního tvrzení věty 7.8. Přímo z definice Fourierovy řady F(t) funkce f(t) as využitím jejího vyjádření s komplexní exponenciálou v 7.7 dostáváme pro částečné součty sN(t) výraz
sN(t)
1 A fT/2 - J /«e"
■icúkx gicúkt
k=-N " ~T'2
kde T je základní perioda, se kterou pracujeme a a> = 2it/T. Tento výraz můžeme přepsat jako
í-t/2
Sn(í) = I KN(t — x)f(x)dx
j-t/2
a funkci
1 N
kn(j) = j E émky
k=-N
nazýváme Dirichletovo jádro. Všimněme si, že součet je kouskem geometrické řady s poměrem členů eímy. Můžeme ji tedy přímo vyjádřit pro všechna y ^ 0 následujícím způsobem (po cestě násobíme čitatel i jmenovatel výrazem — e~íft>:v/2, abychom uměli přepsat následně pomocí reálné funkce sin):
Y Q-iNmy _ QÍ(N+l)cúy
KN(y) =--:-
l — e-i(N+\/2)coy _|_ ei(JV+l/2)£oy
J1 QÍojy/2 _Q—icoy/2
1 sin((7V + l/2)cúy)
T sin(a>y/2)
Vboděy = 0samořejměpřímo vidíme KN(0) = j(2N+l).
Z posledního výrazu je také vidět, že KN(y) je sudá funkce a pomocí LHospitalova pravidla přímo rychle spočteme, že je to funkce všude spojitá. Protože všechny částečné součty řady pro konstantní funkci f(x) = 1 jsou také 1, dostáváme přímo z definice Dirichletova jádra
-t/2
K^{x)dx = 1.
-t/2
podle x (kdy dvakrát derivujeme podle x a na t nahlížíme při derivování jako na konstantu). Fyzikální interpretací úlohy je, že se snažíme určit teplotu u(x,t) v tepelně izolované a homogenní tyči nekonečné délky (rozsah proměnné x), je-li dána počáteční teplota tyče funkcí /. Tyč má konstantní průřez a teplo se v ní může šířit pouze vedením. Koeficient a2 je pak roven podílu —, kde a je koeficient tepelné vodi-
CQ
vosti, c je specifické teplo a q je hustota. Zvláště se tedy předpokládá, že a2 > 0.
Řešení. Na rovnici vedení tepla aplikujeme Fourierovu transformaci vzhledem k proměnné x. Platí ovšem
oo
T (ut) (ú), t) = -j= j ut(x, t) e~ioJX dx =
—oo
' oo N,
■j= j u(x,t)e-imx dx
K —OO '
kde je derivováno podle t, tj. je
T(ut) (co, t) = (T(u) (co, t))' = (T(u))t (co, t). Současně víme, že
T (a2 uxx) (ú), t) = a2 T (uxx) (a>, t) = —a2a)2 T (u) (a>, t). Při označení y(a>, t) = T (u) (a>, ť) tak přecházíme k rovnici
yt = -a2(ú2 y.
Podobnou diferenciální rovnici jsme již při počítání Fourierových transformací řešili, a tudíž pro nás není obtížné stanovit všechna její řešení
y{(ů, t) = K((ú) e-fl2íU\ K((ú) e R. Zbývá určit K(a>). Transformace počáteční podmínky dává T(f) (tu) = lim F(u) (tu, ř) = lim y(cú, t) = K((ú)eP = K(ců), a proto je
y{(ů, i) = T (/) (tu) e-a2°j2t, K((ú) e R.
Nyní se pomocí inverzní Fourierovy transformace vraťme k původní diferenciální rovnici s řešením
oo
u(x, t) = -j= j y(cú, t) émx dcú =
—oo
oo
■j= j T (f) ((ú) e-"2oj2t émx dcú =
—oo
oo / oo \
-L= f l-J= f f(s)e-ioJSds) e-a2°j2t émx dco =
—oo V —oo /
oo / oo \
j f (s) 1-1= f e-"2o^2t e-í0j(S-x) dM\ ds
Vypočítáním Fourierovy transformace F(f) funkce f(t) = e pro a > 0 jsme při přeznačení proměnných obdrželi
2ti
f e-cP2e~irPdp
/2c
e 4c; c > 0.
417
D. INTEGRÁLNÍ OPERÁTORY
2. METRICKÉ PROSTORY
Dle tohoto vztahu (uvažte c = a2t > 0, p = a>, r = s — x) platí
1 ľ „—a2oj2t n—ioj(s—x)
l2aLt
e 4azr ,
a tedy
u(x, t)
2a~Jjžt
J f (s) e i"2' ds.
□
7.36. Stanovte Laplaceovu transformaci £(f)(s) funkce
(a) f(t) = tat;
(b) f(t) = cieait + c2ď2t;
(c) f(t) = cos (bt);
(d) f(t) = sin (bt);
(e) f(t) = cosh (bt);
(f) f(t) = sinh(bt),
přičemž hodnoty b e laci,C2 e C jsou libovolné a kladné s e M je větší než reálné části čísel a,a\,a2 e Ca rovněž je větší než b ve variantách (e) a (f).
Řešení. Případ (a). Bezprostředně z definice Laplaceovy transformace plyne
oo oo
Um (S^t)
ř^oo V "(*-«)/
eu 1
-(s— a) s—a '
Případ (b). Pomocí výsledku varianty (a) a linearity nevlastního integrálu dostáváme
C (f) (s) =ci f ďlt e~st dt +c2 f ď2t e~st dt = ^ +
0 0 12
Případ (c). Protože
cos (bt) = \ (éht + e~iht) , volbaci = 1/2 = c2,a\ = ib,a2 = —ib v předchozí variantě již dává
oo
£ (f) (s) = f (le* + le-'*) e-' dt = ^ + ^ = 7fe.
o
Případy (d), (e), (f). Analogicky volby
(d) c\ = —i/2, c2 = i/2, a\ = ib, a2 = —ib;
(e) c\ = 1/2 = c2, a\ = b, a2 = —b;
(f) ci = 1/2, c2 = —1/2, a\ = b, a2 = —b
vedou na
(d) C(f)(s) = -^;
(e) £(f)(s) = -^;
(f) C(f)(s) = -^.
U periodických funkcí jsou jejich integrály přes intervaly délky periody nezávislé na volbě krajních bodů intervalu integrace. Proto můžeme pomocí změny souřadnic použít pro částečné součty též výraz
í-t/2
sN (x) = KN(y)f(x + y) dy.
J-t/2
Teď konečně máme vše připraveno. Nejprve se budeme věnovat případu, kdy je funkce / v bodě x spojitá a diferencovatelná. Chceme pro tento případ dokázat, že Fourierova řada F(x) v bodě x konverguje k hodnotě f(x). Dostáváme
í-t/2
sN(x)-f(x)= (f(x + y)-f (X))KN(y) dy.
J-t/2
Integrovaný výraz můžeme přepsat do tvaru, který bude připomínat opět Fourierovy koeficienty pro vhodné funkce:
fix + y) - f(x)
sin((N + \/2)(ůy)
□
sin(