Drsná matematika Martin Panák, Jan Slovák a „autorský kolektiv" i Projekt netradiční základní učebnice matematiky pro studenty přírodních věd, informatiky, ekonomie apod., přibližující podstatnou část matematiky v rozsahu čtyř semestrálních přednášek. Text by měl být dokončen a vydán v roce 2013. Práce na učebnici jsou podpořeny projektem Univerzitní výuka matematiky v měnícím se světě (CZ.1.07/2.2.00/15.0203) NVESTICE D O ROZVOJE VZDĚLÁVÁNÍ Obsah Kapitola 1. Rozcvička 5 1. Čísla a funkce 5 2. Kombinatorické veličiny 10 3. Diferenční rovnice 15 4. Pravděpodobnost 18 5. Geometrie v rovině 27 6. Relace a zobrazení 42 Kapitola 2. Elementární lineárni algebra 71 1. Vektory a matice 71 2. Determinanty 83 3. Vektorové prostory a lineárni zobrazení 93 4. Vlastnosti lineárních zobrazení 111 Kapitola 3. Linární modely a maticový počet 129 1. Lineárni procesy 129 2. Diferenční rovnice 131 3. Iterované lineárni procesy 138 4. Více maticového počtu 146 5. Rozklady matic a pseudoinverze 165 Kapitola 4. Analytická geometrie 189 1. Afmní a euklideovská geometrie 189 2. Geometrie kvadratických forem 207 3. Projektivní geometrie 213 iii Předmluva Příprava této učebnice byla motivována přednáškami pro informatické obory na Masarykově univerzitě, kde je celý program založen na precizním matematickém přístupu. Chtěli jsme proto rychle, ale zároveň pořádně, pokrýt zhruba tolik matematických metod, jako je obvyklé u větších kurzů v klasických technických oborech opřených o matematické metody. Zároveň jsme ale nechtěli rezignovat na úplný a matematicky korektní výklad. Chtěli jsme vedle sebe vyložit i obtížnější partie matematiky a spoustu elementárních i obtížnějších konkrétních příkladů, jak s uvedenými postupy ve skutečnosti pracovat. Nechtěli jsme přitom za čtenáře řešit, v jakém pořadí a kolik „teorie" či „praxe" pročítat. Z těchto podnětů vznikl dvousloupcový formát s oddělenými teoretickými úvahami a praktickými postupy, který kopíruje i skutečné rozdělení výkladu na přednáškách na „teoretické přednášky" a „demonstrovaná cvičení". Snažíme se tím vyjít vstříc jak čtenářům, kteří si napřed chtějí procvičit postupy při řešení úloh a teprve pak přemýšlet, proč a jak algoritmy fungují, tak těm druhým, kteří si napřed chtějí dělat jasno o tom proč a jak věci fungují a pak případně zkouší počítat příklady. Zároveň tím snad zbavujeme čtenáře stresu, že by měl přečíst úplně vše. Naopak, měl by mít radost z brouzdání textem a prožitku objevování vlastní cestičky. Text se přitom v obou svých částech snaží prezentovat standardní výklad matematiky s akcentem na smysl a obsah představovaných matematických metod. Řešené úlohy procvičují základní pojmy, ale zároveň se snažíme dávat co nej lepší příklady užití matematických modelů. Teoretický text je prezentován dosti kompaktním způsobem, mnoho prostoru je ponecháno pro dořešení podrobností čtenáři. Uváděné příklady se snaží pokrýt celou škálu složitosti, od banálních až po perličky ke skutečnému přemýšlení. Studenti navíc řešili a odevzdávali každý týden zadávané příklady. Čtenářům bychom rádi pomohli: • přesně formulovat definice základních pojmů a dokazovat jednoduchá matematická tvrzení, • vnímat obsah i přibližně formulovaných závislostí, vlastností a výhledů použití matematických nástrojů, • vstřebat návody na užívání matematických modelů a osvojit si jejich využití. K těmto ambiciózním cílům nelze dojít lehce a pro většinu lidí to znamená hledat si vlastní cestu s tápáním různými směry (s potřebným překonáváním odporu či nechutě). I proto je celý výklad strukturován tak, aby se pojmy a postupy vždy několikrát vracely s postupně rostoucí složitostí a šíří diskuse. Jsme si vědomi, že se tento postup může jevit jako chaotický. Domníváme se ale, že dává mnohem lepší šanci na pochopení u těch, kteří vytrvají. Vstup do matematiky je skoro pro každého obtížný — pokud už „víme", nechce se nám přemýšlet, pokud „nevíme", je to ještě horší. Jediný spolehlivý postup pro orientaci v matematice je hledat porozumnění v mnoha pokusech a to, pokud možno, při četbě v různých zdrojích. Určitě nepovažujeme tento text za dostatečný jediný zdroj pro každého. Doufáme, že může být dobrým začátkem a případně i dlouhodobým pomocníkem, zvláště pro ty, kdo se k jednotlivým částem budou znovu a znovu vracet. Pro ulehčení vícekolového přístupu ke čtení je text doprovázen emotivně laděnými ikonkami, které snad nejen oživí obvyklou strohou strukturu matematického textu, ale naznačí čtenáři, kde by složitější text měl být čten pozorněji, ale určitě ne přeskakován, případně kde by bylo možná lépe náročné pasáže přinejmenším napoprvé vůbec nečíst. Volba jednotlivých ikonek samozřejmě odráží hlavně pocity autorů. Přesto by postupně mohly být dobrým vodítkem pro čtenáře. Velice zhruba řečeno, používáme ikonky varující před pracností/složitostí/náročností, např. 1 Další označují ne úplně pohodovou zdlouhavost práce a potřebu trpělivosti či nadhledu, jako jsou tyto A konečně máme také ikonky vyjadřující pohodu nebo radost ze hry, třeba následující Snažili jsme se sloupce s příklady sepsat tak, aby byly čitelné prakticky víceméně samostatně. Bez ambicí pohrát si s hlubšími důvody, proč uváděné postupy fungují (nebo s prostým cílem „projít s písemkou"), by mělo skoro stačit probírat se jen příklady. Definice pojmů či popisy jejich vlastností používaných při řešení příkladů jsou v teoretickém sloupci zpravidla vyznačeny, aby o ně bylo možno snadno pohledem zavadit. Souvislost řešených příkladů s paralelně studovanou teorií je přitom spíše volná, snažili jsme ale ulehčit přeskakování „z teorie do praxe a zpět" co nejvíce. Příklady jsou vesměs řešené, u některých je řešení uvedeno až za celou kapitolou (čísla těchto příkladů jsou sázena kurzívou). Na konci každé kapitoly je pak uvedena ještě řada zajímavých doplňujících příkladů v širokém sloupci, které se z nejrůznějších důvodů nevešli do dvousloupcové sazby. Obsahově je celá učebnice ovlivněna představou, že pro praktické využití jsou velmi podstatné metody tzv. diskrétní matematiky, zatímco tzv. spojité modely jsou matematicky dobře uchopitelná přiblížení veskrze diskrétního světa kolem nás. Počítat koneckonců stejně umíme vždy jen s konečně mnoha racionálními čísly naráz. Bez spojité matematiky si lze ale těžko dobře představit koncepty jako konvergence procesu k limitnímu stavu nebo robustnost výpočtu. Bylo by bez ní také obtížné pracovat s odhady chyb při numerických procesech. Všechna témata a velmi podstatnou část textu jsme v létech 2005 - 2012 ověřovali při výuce studentů informatiky a později i matematiky na Masarykově univerzitě. Paralelně jsme přitom vytvořili také podklady pro praktické semináře matematického modelování a numerických metod. V nich se studenti věnují skutečnému využití výpočtových nástrojů a modelů. Závěrem stručně shrneme obsah celé učebnice. Samozřejmě předpokládáme, že si každý čtenář, případně přednášející, vybere témata a jejich pořadí. Pokusíme se proto zároveň vymezit bloky, se kterými lze takto nezávisle zacházet. Úvodní motivační kapitola se snaží ilustrovat několik přístupů k matematickému popisu problémů. Začínáme nejjednoduššími funkcemi (základní kombinatorické vzorce). Pak naznačujeme, jak pracovat se závislostmi zadanými pomocí okamžitých změn (jednoduché diferenční rovnice), užití kombinatoriky a množinové algebry diskutujeme prostřednictvím konečné klasické pravděpodobnosti. Předvádíme maticový počet pro jednoduché úlohy rovinné geometrie (práce s pojmem pozice a transformace) a závěrem vše trochu zformalizujeme {relace, uspořádní, ekvivalence). Nenechte se zde uvrhnout do chaotického zmatku rychlým střídáním témat — cílem je nashromáždit něco málo netriviálních námětů k přemýšlení a hledání jejich souvislostí i použití, ještě než zabředneme do úrovně problémů a teorií složitějších. Ke všem tématům této úvodní kapitoly se časem vrátíme. Další dvě kapitoly jsou věnovány základům počtu, který umožňuje práci s vícerozměrnými daty i grafikou. Jde o postupy tzv. lineární algebry, které jsou základem a konečným výpočetním nástrojem pro většinu matematických modelů. Nejprve probíráme jednoduché postupy pro práci s vektory a maticemi, třetí kapitola je pak věnována aplikacím maticového počtu v různých lineárních modelech (systémy lineárních rovnic, lineární procesy, lineární diferenční rovnice, Markovovy procesy, lineární regrese). Čtvrtá kapitola pak ilustruje použití maticového počtu v geometrických úlohách. Dozvíme se něco málo o afinní, euklidovské a projektivní geometrii. 2 V tomto okamžiku přerušíme diskusi diskrétních modelů a přejdeme ke spojitým. Chceme co nejnázorněji ukázat, že základní ideje, jak s funkcemi pracovat, bývají jednoduché. Stručně řečeno, velmi jednoduché úvahy spojené s popisem okamžitých změn sledovaných veličin umožňují dělat závěry pro jejich celkové chování. Složitosti se pojí skoro výhradně se zvládnutím rozumně velké třídy funkcí, pro které mají naše postupy být použitelné. Začínáme proto kapitolou, kde diskutujeme jaké funkce potřebujeme pro nelineární modely. Po polynomech a splajnech postupně diskutujeme pojmy spojitosti, limity posloupností a funkcí a derivace funkcí, připomeneme všechny základní elementární funkce a závěrem se seznámíme s mocninnými řadami. Tím je připravena půda pro klasický diferenciální a integrální počet. Ten prezentujeme v kapitole šesté s důrazem na co nejpřímočařejší pochopení souvislostí limitních procesů, integračních procesů a aproximací. Sedmá kapitola se věnuje náznakům aplikací a snaží se co nejvíce připomínat analogie k postupům jednoduché lineární algebry. Místo lineárních zobrazení mezi konečně rozměrnými vektorovými prostory tak pracujeme s lineárními operacemi mezi vektorovými prostory funkcí, definovanými buď integrálními nebo diferenciálními operátory. Zatímco diskusi diferenciální rovnic necháváme na později, zde studujeme nejprve aproximace funkcí s pomocí vzdálenosti definované integrálem (tzv. Fourierovy řady). Pak se věnujeme souvislostem s některými integrálními operátory (např. konvoluce) a integrálními transformacemi (zejména Fourirerova transformace). Po cestě si neodpustíme ilustraci obecného principu, že spojité modely jsou zpravidla ideovým podkladem a zároveň dobrou aproximací pro modely diskrétní. Poslouží nám k tomu stručné nahlédnutí na problematiky tzv. waveletů a diskrétní Fourierovy transformace. V osmé kapitole pokračujeme v našem stručném nastínění analytických spojitých metod, tentokrát pro modely s mnoha proměnnými. Nejprve rozšime základní postupy a výsledky týkající se derivací nafunkce více proměnných, včetně funkcí zadaných implicitně a tzv. vázaných extrémů. Hned poté rozšíříme teorii integrování o tzv. násobné integrály. Poté se věnujeme stručně modelům opřeným o známou změnu našich objektů, tj. diferenciálním rovnicím a malinko naznačíme obdobné problémy variační. Závěrem této kapitoly se pak stručně věnujeme numerickým přiblížením a odhadům. Devátá kapitola je věnována popisné statistice, matematické pravděpododobnosti a matematické statistice. Seznámíme se s pojmy pravděpodobnostní prostor, hustota pravděpodobnosti, normální rozdělení, střední hodnota, medián, kvantil, rozptyl, příklady diskrétních a spojitých rozdělení a budeme se náznakem věnovat statistickému zpracování dat, tj. výběrovým statistikým a jejich spolehlivosti. V další kapitole zamíříme zpět do světa diskrétních metod. Zabýváme se v ní základními pojmy a poznatky teorie grafů a jejich využitím v praktických problémech (např. prohledávání do šířky a hloubky, minimální pokrývající kostry, toky v sítích, hry popisované stromy). Závěrem se budeme zajímat o vytvořující funkce. Poslední kapitola se zabývá nejprve obecnými algebraickými strukturami s důrazem na elementární poznatky z teorie grup, okruhů polynomů. Zmíníme i něco málo aplikací v kódování. Dále se věnujeme úvodu do teorie čísel a vybrané aplikace, včetně šifrování informace. Pořádné poděkování všem zúčastněným, kteří nebudou přímo v autorském kolektivu, studentům apod. ??. ??. 2013, kolektiv autorů 3 KAPITOLA 1 Rozcvička „ hodnota, změna, poloha " — co to je a jak to uchopit? Cílem první kapitoly je uvést čtenáře do fascinujícího světa matematického myšlení. Vybíráme si k tomu co nej-konkrétnější příklady modelování reálných situací pomocí abstraktních objektů a souvislostí. Zároveň projdeme několik témat a postupů, ke kterým se postupně budeme vracet a v závěru kapitoly se budeme chvíli věnovat samotnému jazyku matematiky (se kterým budeme jinak zacházet spíše intuitivně). O co jednodušší jsou východiska a objekty, se kterými zde budeme pracovat, o to složitější je pochopit do důsledku jemnosti použitých nástrojů a postupů. Většinou je možné proniknout k podstatě věcí teprve v jejich souvislostech. Proto je také představujeme hned z několika pohledů zároveň. Přecházení od tématu k tématu se možná bude zdát jako zmatečné, ale to se jistě postupně spraví při našich návratech k jednotlivým úvahám a pojmům v pozdějších kapitolách. Název kapitoly lze chápat i jako nabádání k trpělivosti. I nejjednodušší úlohy a úvahy budou snadné jen pro ty, kteří už podobné řešili (a půjde pro ně jen o opakování znalosti ze střední školy). K postupnému poznání a ovládnutí matematického myšlení vede jen pozvolná a spletitá cesta. Začneme s tím nejjednodušším: obyčejnými čísly. 1. Čísla a funkce Lidé odjakživa chtějí mít jasno „kolik" něčeho je, případně „za kolik" to je, „jak dlouho" něco trvá apod. Výsledkem takových úvah je většinou nějaké „číslo". Za číslo přitom W/f1^ považujeme něco, co umíme sčítat a násobit a splňuje to obvyklé zákonitosti, ať už všechny nebo jen některé. Například výsledek sčítání nezávisí na pořadí, v jakém čísla sčítáme, máme k dispozici číslo nula, které přičtením výsledek nezmění, číslo jedna, kterým můžeme násobit, aniž bychom změnili výsledek, apod. Nejjednodušším příkladem jsou tzv. čísla přirozerJá^iůi. deme je značit N = {0, 1, 2, 3, ...}. Všimněme si, že jsme mezi přirozená čísla vzali i nulu, jak je obvyklé zvláště v informatice. Počítat „jedna, dvě, tři, ..." se učí děti už ve školce. O něco později se setkáváme s čísly celými Z = {..., —2, — 1, 0, 1, 2, ...} a nakonec si zvykneme na A. Čísla a funkce S přirozenými, celými, racionálními a reálnými čísly již počítat umíme. Zamyslíme se, proč racionální čísla nestačí (byť v počítači s jinými doopravdy počítat neumíme) a připomeneme si tzv. čísla komplexní (protože ani s reálnými čísly si při výpočtech nevystačíme). 1.1. Najděte nějaké reálné číslo, které není racionální. Řešení. Jedna z mnoha možných odpovědí je *Jl. Již staří Řekové věděli, že předepíšeme-li plochu čtverce a2 = 2, pak nelze najít racionální a, které by předpisu vyhovovalo. Proč? Víme, že každé přirozené číslo n lze jednoznačným způsobem vyjádřit jako součin n = p^1 ■ pr^ ... prkk, až na pořadí v součinu, kde p\, ..., Pk jsou po dvou různá prvočísla. Pokud by tedy platilo (p/q)2 = 2 pro přirozená čísla p a q, pak tedy p2 = 2q2. Na levé straně máme v rozkladu na prvočísla 2r se sudým r (případně r = 0), na pravé straně ale bude vždy mocnina dvojky lichá. To je spor s naším tvrzením a tedy předpoklad nemůže platit a žádné racionální číslo nemůže mít za svoji druhou mocninu dvojku. □ 1.2. Najděte řešení rovnice x2 = b pro libovolné reálné číslo b. Řešení. Víme, že tato rovnice má vždy řešení x v oboru reálných čísel, pokud je b nezáporné. Jestliže je b = —1, pak ale zjevně takové reálné x existovat nemůže. Musíme proto najít větší obor čísel, ve kterém už řešení existovat bude. 5 A. ČÍSLA A FUNKCE 1. ČÍSLA A FUNKCE pl. 3 K reálným číslům nejprve přidáme nové číslo i, tzv. imaginární jednotku a zkusíme dodefinovat sčítání a násobení tak, abychom |i na- dále zajistili obvyklé chování čísel, jak jsou shrnuty v odstavci 1. Jistě musíme umět nové číslo i násobit reálnými čísly a výsledky sčítat s jakýmikoliv reálnými čísly. Nutně proto musíme v novém číselném oboru komplexních čísel C pracovat s formálními výrazy z = a + i b. Aby byly splněny vlatnosti asociativity a distributivity, zavedeme sčítání tak, že se nezávisle sčítají reálné složky a imaginární složky. Stejně tak chceme násobení tak, jak by se násobily dvojčleny reálných čísel s jediným dodatečným pravidlem i2 = — 1, tj. (a + i b) + (c + i d) = {a + c) + i (b + d), (a + i b) ■ (c + i d) = (ac — bd) + i (bc + ad). □ Reálnému číslu a říkáme reálná složka komplexního čila z, reálnému číslu b pak imaginární složka, píšeme re(z) = a, im(z) = b. 1.3. Ověřte, že skutečně platí všechny vlastnosti (KG1-4), (01-4) a (P) skalárů z 1.1. Řešení. Nulou je číslo 0+/ 0, jedničkou číslo 1+i 0, které opět píšeme jako 0 a 1.Všechny vlastnosti se ověří přímočarým výpočtem. □ 1.4. Komplexní číslo je dáno dvojicí reálných čísel, jde tedy o bod v reálné rovině M2. Ukažte, že vzdálenost komplexního čísla z = a + ib od počátku je dána výrazem zž, kdež komplexně sdružené číslo a —i b. Řešení. Součin ,2 , r 2 zz (a2 + b2) + i (-ab + ba) ar + , je vždy reálné číslo a dává nám skutečně kvadrát vzdálenosti čísla z. od počátku 0. Platí tedy \z\2 = zz. □ 1.5. Interpretujte násobení imaginární jednotkou a vzetí komplexně sdruženého čísla jako geometrickou transformaci v rovině. Řešení. Imaginární jednotka i odpovídá bodu (0, 1) a všimněme si, že vynásobení jakéhokoliv čísla z = a + i b imaginární jednotkou dává výsledek i ■ (a + i b) = —b + i a což je v interpertaci v rovině otočení bodu z o pravý úhel v kladném smyslu, tj. proti směru hodinových ručiček. Přiřazení komplexně sdruženého čísla je symetrie podle osy reálných čísel: z = (a + i b) h-> (a — i b) = ž- □ desetinná čísla a víme, co znamená 1.19-násobek ceny díky 19% dani z přidané hodnoty. 1.1. Vlastnosti čísel. Abychom mohli s čísly pracovat opravdu, musíme se jejich definici a vlastnostem věnovat pořádněji. V matematice se těm základním tvrzením o vlastnostech objektů, jejichž platnost předpokládáme, aniž bychom se zabývali jejich dokazovaním, říká axiomy. Vhodná volba axiomů předurčuje jak dosah z nich vycházející teorie, tak její použitelnost v matematických modelech skutečnosti. | Vlastnosti skalárů | Vlastnosti sčítání: | (KG1) (a + b) + c = a + (b + c), pro všechna a, b, c (KG2) a + b = b + a, pro všechna a, b (KG3) existuje 0 taková, že pro všechna a platí a + 0 = a (KG4) pro všechna a existuje b takové, že a + b = 0 Vlastnostem (KG1) - (KG4) říkáme vlastnosti komutativní grupy. Jsou to po řadě asociativita, komutativita, existence neutrálního prvku (říkáme u sčítání také nulového prvku), existence inverzního prvku (říkáme u sčítání také opačného prvku k a a značíme ho —a). Vlastnosti násobení: (01) (a ■ b) ■ c = a ■ (b ■ c), pro všechny a, b, c (02) a ■ b = b ■ a, pro všechny a, b (03) existuje prvek 1 takový, že pro všechny a platí 1 • a = a (04) a ■ (b + c) = a ■ b + a ■ c, pro všechny a, b, c. Vlastnosti (01)-(04) se postupně nazývají asociativita, komutativita, existence jednotkového prvku a distributivita sčítání vůči násobení. Množiny s operacemi +, • a vlastnostmi (KG1)-(KG4), (01)-(04) se nazývají komutativní okruhy. Další vlastnosti násobení: (P) pro každé a ^ 0 existuje b takové, že a ■ b = 1. (01) je-li a ■ b = 0, potom buď a = 0 nebo b = 0. Vlastnost (P) se nazývá existence inverzního prvku vzhledem k násobení (tento prvek se pak značí a-1) a vlastnost (01) říká, že neexistují „dělitelé nuly". ^m^mmmmmmmmmmm Uvedli jsme si základní vlastnosti operací sčítání a násobení pro naše počty s čísly, která píšeme jako písmena a,b,c, .... Obě tyto operace fungují tak, že vezmeme dvě čísla a, b a aplikací sčí-tání nebo násobení dostaneme výsledné hodnoty a + b a a ■ b. Vlastnosti těchto operací budeme soustavně využívat, aniž bychom museli přesně vědět, s jakými objekty skutečně pracujeme. Tak se dostaneme k obecným matematickým nástrojům, je však vždy dobré mít představu o typických příkladech. 6 KAPITOLA 1. ROZCVIČKA Celá čísla Z jsou dobrým příkladem komutativní grupy, přirozená čísla nikoliv, protože nesplňují (KG4) (a případně neobsahují neutrální prvek, pokud někdo nulu do N nezahrnuje). Když komutativní okruh navíc splňuje i vlastnost (P), hovoříme o poli (často také o komutativním tělese). Poslední uvedená vlastnost (Ol) je automaticky splněna, pokud platí (P). Opačně to ovšem neplatí a tak říkáme, že vlastnost (Ol) je slabší než (P). Např. okruh celých čísel Z nesplňuje (P), ale splňuje (Ol). Hovoříme v takovém případě o oboru integrity. Všimněme si, že množina všech nenulových prvků v poli společně s operací násobení splňuje (Ol), (02), (03), (P), a je proto také komutativní grupa. Jen se místo sčítání mluví o násobení. Jako příklad můžeme vzít všechna nenulová reálná čísla. Prvky nějaké množiny s operacemi + a • splňujícími (ne nutně všechny) výše uvedené vlastnosti (tj. komutativní okruh, obor integrity, pole) budeme nazývat skaláry. Budeme pro ně vesměs užívat malá latinská písmena ze začátku nebo konce abecedy. Všechny vlastnosti (KG1)-(KG4), (01)-(04), (P), (01) z našich úvah je třeba brát jako axiomatickou definici příslušných matematických pojmů. Pro naše potřeby bude stačit si průběžně uvědomovat, že při dalších diskusích budeme důsledně používat pouze tyto vlastnosti skalárů a že i naše výsledky proto budou platné pro všechny objekty s těmito vlastnostmi. V tomto je pravá síla matematických teorií - nejsou platné jen pro konkrétní řešený příklad. Naopak, při rozumné výstavbě mají vždy univerzální použití. Budeme se snažit tento aspekt zdůrazňovat, přestože naše ambice mohou být v rámci daného rozsahu učebnice jen velice skromné. 1.2. Existence skalárů. K tomu, aby ale skutečně bylo možné budovat matematickou teorii, je třeba ověřit, že takové objekty mohou existovat. Pro pořádek si proto budeme postupně ukazovat, jak je možné zkonstruovat základní číselné obory. Pro konstrukci přirozených čísel začneme s předpokladem, že víme, co jsou to množiny. Prázdnou množinu si označíme 0 a definujeme (1.1) O := 0, n + 1 := n U {n} , neboli O:=0, 1 }, 2 := {O, 1}, ...,n + 1 := {O, 1, ...,n] Tímto zápisem říkáme, že pokud už máme definovaná všechna čísla O, 1, 2, ... n, pak číslo n + 1 definujeme jako množinu všech předchozích čísel. Přirozená čísla takto ztotožňujeme s počty prvků konkrétních množin. Číslo n je množina, která má n prvků a dvě přirozená čísla a, b jsou stejná, právě když příslušné množiny mají stejně prvků. V teorii množin se místo slovního spojení „počet prvků množiny" používá pojem „mohutnost 1.6. Využijte k popisu komplexních čísel úhel průvodiče a vzdálenost od počátku (tzv. gonimetrický tvar). Řešení. Komplexní čísla tvaru z = coscp + i sin
/l3- Z pravoúhlého trojúhelníka v obrázku pak snadno spočteme sin(
/l3 ^cos ^arccos ^ + sin( ( arcsin Zl '13// V W13, Převod komplexního čísla z goniometrického do algebraického je ještě jednodušší: 1 . V3~\ 3 . 3V3 Z2 = 3(cos(|)+/sin(|))=3^ + /.^=^ + , □ 1.9. Číslo (5 73 + 5i) ' zapište v co nejjednodušším tvaru. Řešení. Úpravy jako postupné umocňování nebo rozvoj podle binomické věty jsou v tomto případě časově náročné. Při vyjádření 5 73 + 5i = 10 + ^ = 10 (cos f + i sin f) užitím Moivreovy věty však snadno obdržíme (5V3 + 5i) 12 = 1012 (cos ^ + i sin ^f) = 1012. □ 7 A. ČÍSLA A FUNKCE 1. ČÍSLA A FUNKCE 1.10. Vyjádřete z = cos 0 + cos f + i sin f v goniometrickém tvaru. Řešení. Abychom mohli vyjádřit z = \z\ (coscp + i sin
n.
1.7. Tvrzení. Pro všechna přirozená čísla k a n platí
přeuspořádání, výběrů a tak podobně. Ve velké většině takovýchto problémů lze vystačit se „selským rozumem". Stačí vhodně používat pravidel součtu a součinu, která si ukážeme na následujících příkladech:
1.18. Maminka chce Jeníkovi a Mařence rozdělit pět hrušek a šest jablek. Kolika způsoby to může udělat? (Hrušky mezi sebou považujeme za nerozlišitelné, stejně tak jablka. Připouštíme, že některé z dětí nic nedostane.)
Řešení. Pět hrušek samostatně může maminka rozdělit šesti způsoby. (Rozdělení je určeno tím, kolik hrušek dá Jeníkovi, zbytek připadne Mařence.) Šest jablek pak nezávisle sedmi způsoby. Podle pravidla součinu pak obě ovoce současně může rozdělit 6 • 7 = 42 způsoby. □
1.19. Určete počet čtyřciferných čísel, která začínají cifrou 1 a nekončí cifrou 2, nebo končí cifrou 2 a nezačínají cifrou 1.
Řešení. Množina uvažovaných čísel je složená ze dvou disjunktních množin, totiž čísel, která začínají cifrou 1 a nekončí cifrou 2 (první množina) a čísel, která nezačínají cifrou 1 a končí cifrou 2. Celkový počet popsaných čísel dostaneme podle pravidla součtu tak, že sečteme počty čísel v těchto dvou množinách. V první z těchto množin máme čísla tvaru „1XXY", kde X je libovolná cifra a F je libovolná číslice mimo dvojky. Můžeme tedy provést deset voleb druhé cifry, nezávisle na tom můžeme provést deset voleb třetí cifry a opět nezávisle devět voleb poslední cifry. Tyto tři nezávislé volby jednoznačně určují dané číslo a podle pravidla součinu máme tedy 10 • 10-9 = 900 takových čísel. Obdobně ve druhé skupině máme 8 • 10 • 10 = 800 čísel (na první cifru máme pouze osm možností, neboť číslo nemůže začínat nulou a jedničku máme zakázánu). Celkem podle pravidla součtu je 900 + 800 = 1700 uvažovaných čísel. □
1.20. Určete počet způsobů, jak lze na šachovnici (8x8 polí) postavit bílou a černou věž tak, aby se neohrožovaly (nebyly ve stejném řádku ani sloupci).
Řešení. Nejprve umístíme např. bílou věž. Pro ni máme na výběr z 82 polí. Ve druhém kroku umístíme věž černou. Nyní máme „k dispozici" 72 polí. Podle pravidla součinu je výsledek 82 • 72 = 3 136.
□
V následujících příkladech už budeme při řešení používat pojmů kombinace, permutace, variace (případně s opakováním), které jsme definovali.
1.21. Během schůze má vystoupit 8 řečníků. Stanovte počet všech pořadí, v nichž dva předem určení řečníci nevystupují ihned po sobě.
11
B. KOMBINATORIKA
2. KOMBINATORICKÉ VELIČINY
Řešení. Označme si zmíněné dva řečníky jako osoby A a S. Pokud hned po vystoupení osoby A následuje vystoupení osoby B, můžeme na to nahlížet jako na projev jediného řečníka. Počet všech pořadí, v nichž vystupuje B ihned po A, je tedy roven počtu všech permutací ze sedmi prvků. Stejný je pochopitelně také počet všech pořadí, v nichž vystupuje A ihned po B. Neboť počet všech možných pořadí 8 řečníků je 8!, číslo 81 — 2-7! udává hledaný počet pořadí. □
1.22. Kolik existuje přesmyček slova PROBLÉM takových, že v nich
a) písmena B a R stojí vedle sebe,
b) písmena B a R nestojí vedle sebe.
Řešení, a) Dvojici písmen B a R můžeme považovat za jedno nedělitelné dvojpísmeno. Celkem tedy máme k dispozici šest různých písmen a šestipísmených slov složených z různých písmen je 6!. V našem případě však tento počet musíme ještě vynásobit dvěma, neboť naše dvojpísmeno může bít jak BR tak RB. Celkem dostáváme 2-6! různých přesmyček.
b) 7! — 2 • 6! (doplněk části a) do počtu všech sedmipísmenných slov složených z různých písmen. □
1.23. Kolika způsoby může sportovec umístit 10 různých pohárů do 5 polic, jestliže se na každou polici vejde všech 10 pohárů?
Řešení. K pohárům přidáme 4 navzájem nerozlišitelné předměty, kupř. tužky. Počet všech různých pořadí pohárů a tužek je zřejmě 14 !/4! (tužky jsou nerozlišitelné). Každé umístění pohárů do polic ovšem odpovídá právě jednomu seřazení pohárů a tužek. Stačí třeba říci, že poháry před první tužkou v pořadí dáme do první police (při zachování pořadí), poháry před druhou tužkou do druhé police atd. To znamená, že číslo 14!/4! je výsledkem. □
1.24. Určete počet čtyřciferných čísel sestavených z právě dvou různých cifer.
Řešení. Dvě různé cifry použité na zápis můžeme vybrat (j0) způsoby, ze dvou vybraných cifer můžeme sestavit 24 — 2 různých čtyřciferných čísel (dvojku odečítáme za dvě čísla složená pouze z jedné cifry). Celkem máme (j0) (24—2) = 630 čísel. Nyní jsme ale započítali i čísla začínající nulou. Těch je (j)(23 — 1) = 63. Celkově dostáváme 630 - 63 = 567 čísel. □
1.25. Určete počet sudých čtyřciferných čísel sestavených z právě dvou různých cifer.
Řešení. Obdobně jako v předchozím příkladu se nejprve nebudeme ohlížet na cifru nula. Dostaneme tak (j)(24 — 2) + 5 • 5(23 — 1) čísel (nejprve počítáme čísla pouze ze sudých cifer, druhý sčítanec udává
<*) g) = c"j
(2) g:í) = ©+Gy
(3) ELo g) =2"
Důkaz. První tvrzení je zjevné přímo z formule (1.3). Jestliže vyčíslíme pravou stranu z tvrzení (2), dostáváme
/n\ í n \ n\ n\
\ k j
+
n
k + 1
+
k\(n - k)\ ' (k + l)!(n (k + l)n\ + (n- k)n\
1)!
(k + l)!(n - k)\ _ (n + 1)! ~ (* + l)!(n -k)\
což je ale levá strana tohoto tvrzení.
Tvrzení (3) dokážeme tzv. matematickou indukcí. Tento 0 typ důkazu je vhodný právě pro tvrzení, která
říkají, že něco má platit pro všechna přiro-7OM zená čísla n. Matematická indukce se skládá ze dvou kroků. V prvním se tvrzení dokáže pro n = 0 (popřípadě n = 1 nebo další hodnoty ň). V druhém, tzv. indukčním, kroku předpokládáme, že tvrzení platí pro nějaké n (a všechny předešlé hodnoty), a za pomoci tohoto předpokladu dokážeme, že tvrzení platí i pro n + 1. Dohromady z toho pak vyvodíme, že tvrzení platí pro všechna přirozená n.
Tvrzení (3) zjevně platí pro n = 0, protože Q = 1 = 2°. (Stejně tak je přímo vidět i pro n = 1.) Předpokládejme, že platí pro nějaké n a spočtěme příslušnou sumu pro n + 1 s využitím tvrzení (2) i (3). Dostaneme
n + 1
E
*=0
n + 1 k
n + 1
E
jt=0 n
E
k=-\
n
k - 1
+
n + 1
+ E
k=0
2" +2" = 2'
n + 1
Všimněme si, že vzorec (3) udává počet všech podmnožin rc-prvkové množiny, neboť je počet všech jejích ^-prvkových podmnožin. Všimněme si také, že tvrzení (3) plyne přímo z (1.5) volbou a = b = 1.
Tvrzení (4) dokážeme opět matematickou indukcí, podobně jako (3). Zjevně platí pro n = 0, čímž je hotov první krok. Indukční předoklad říká, že (4) platí pro něj aké n. Spočtěme nyní příslušnou sumu pro n + 1 s využitím tvrzení (2) a indukčního předpokladu. Dostaneme
n + 1
E*
*=0
n + 1
n + 1
n \ In k-l) + \k
E*
n , x n+l , x
Ě(;hĚ<:)+í>(;;
12
KAPITOLA 1. ROZCVIČKA
2n i „„ o n — 1 .
•\n—i
(« + 1)2".
Tím je proveden indukční krok, a tvrzení je dokázáno pro všechna přirozená n. □
Druhá vlastnost z našeho tvrzení umožňuje sestavit všechna kombinační čísla do tzv. Pascalova trojúhelníku, kde každé číslo obdržíme jako součet dvou bezprostředně nad ním ležících sousedů:
n = 0 n = 1 n = 2 n = 3 n = 4 n = 5
1
4
1
1
3
10
1
2
1
3
10
1
4
1
Všimněme si, že v jednotlivých řádcích máme právě koeficienty u jednotlivých mocnin z výrazu (1.5), např. poslední uvedený řádek říká
(a + b)5 = a5 + 5a4b + \0a3b2 + \0a2b3 + 5ab4 + b5.
1.8. Výběr s opakováním. Pořadí n prvků, z nichž mezi některými nerozlišujeme, nazýváme permutace s opakovaním.
Nechť je mezi n danými prvky p\ prvků prvního druhu, p2 prvků druhého druhu, ..., Pk prvků &-tého druhu, p\ + p2 + ■ ■ ■ + Pk = n, potom počet pořadí těchto prvků s opakováním budeme značit P(pi,...,pk).
Podobně jako u permutací a kombinací bez opakování, pro výběr prvního z nich máme n možností, pro další n — 1 a tak dále, až po poslední, který zbude. Přitom ale za stejná považujeme pořadí nerozlišitelných objektů. Těch je pro každou skupinku o p{ objektech právě p{!, takže zřejmě platí
' Permutace s opakováním
P(pi
Pk)
P\\--- Pk]-
Volný výběr k prvků z n možností, včetně pořadí, nazýváme variace k-tého stupně s opakováním, jejich počet budeme značit V(n,k). Volný výběr v tomto případě znamená, že předpokládáme, že stále máme pro výběr stejně možností, např. díky tomu, že vybrané prvky před dalším výběrem vracíme nebo třeba házíme pořád stejnou kostkou. Zřejmě platí
| Variace s opakováním [
V(n,k) =nk
Pokud nás výběr zajímá bez zohlednění pořadí, hovoříme o kombinacích s opakováním a pro jejich počet píšeme C(n, k). Zde se na první pohled nezdá tak jednoduché, jak výsledný počet zjistit. Důkaz následující věty je pro matematiku typický - podaří se nám nový problém převést na problém jiný, který jsme už dříve zvládli. V našem
počet sudých čtyřciferných čísel složených ze sudé a liché cifry). Opět musíme odečíst čísla začínající nulou, těch je (23 — 1)4 + (22 — 1)5. Hledaný počet cifer tak je
(24 - 2) + 5 • 5(23 - 1) - (23 - 1)4 - (22 - 1)5 = 272.
□
1.26. Na koncertě je 730 lidí. Mají někteří z nich stejné iniciály? (Neuvažujeme háčky ani čárky)
Řešení. Písmen v abecedě (včetně CH) je 27. Počet všech možných iniciálu je tedy 272 = 729. Proto aspoň 2 lidé budou mít stejné iniciály.
□
1.27. Noví hráči se sejdou v jednom volejbalovém týmu (6 lidí). Kolikrát si při seznamování (každý s každým) podají ruce? Kolikrát si hráči podají ruce se soupeřem po odehrání zápasu?
Řešení. Seznamuje se každá dvojice z šesti hráčů. Počet podání rukou je teda roven kombinaci C(2, 6) = (^) = 15. Po zápase si každý z šesti hráčů podá ruku šestkrát (s každým z šesti soupeřů). Počet je teda dohromady 62 = 36. □
1.28. Jak se může rozesadit pět osob v pětimístném autě, když jen dva z nich mají řidičský průkaz? Jak se může rozesadit 20 cestujících a dva řidiči v 25-místném minibuse?
Řešení. Na místě řidiče máme dvě možnosti a na zbylých místech už je pořadí libovolné, tzn. pro spolujezdce 4 možnosti, pro další místo 3, pak 2 a 1. Celkově 2.4! = 48 možností. Podobně v minibuse máme dvě možnosti na místě řidiče a druhý řidič plus cestující mohou na zbylých 24 místech sedět libovolně. Nejprve vybereme místa, která budou obsazená, tj. (^J) a na těchto místech může být 21! různých pořadí. Dohromady máme 2.(2 M2 lze vcelku snadno uhádnout: Je-li totiž výsledkem matice se sloupci (a, c) a (b, d), pak první sloupec dostaneme násobením této matice s prvním vektorem báze (1,0) a druhý je vyčíslením na druhém vektoru báze (0, 1).
36
KAPITOLA 1. ROZCVIČKA
Z obrázku je proto vidět, že pro rotaci o úhel \jj proti směru hodinových ruček jsou v matici sloupce
'a b\ /l\ /cos i/A (a b\ Í0\ í— sini/^ , c d)[o) = \sin ý) \c d) \\) = \ cos f
Směr proti směru hodinových ruček označujeme jako kladný směr rotace, opačný je pak záporný. Proto dostáváme tvrzení:
«__| Matice rotace |
Rotace o předem daný úhel ý v kladném směru kolem počátku souřadnic je dána maticí R^,:
cos ý — sini/A (x
i-> Rý - v — .
Nyní, když už víme, jak vypadá matice otočení v rovině, můžeme ověřit, že otočení zachovává vzdálenosti a úhly (definované předešlým vzorcem). Označíme-li obraz vek-
toru v jako
R,i
vx cos ý — vy sm vx sin ý + vy cos ý) '
a podobně w' = R f ■ w, pak lze snadno přepočítat, že opravdu platí
llw'11 = II ^ II
V'XW'X + V'yw'y = VXWX + VyWy.
Předchozí výraz lze pomocí vektorů a matic napsat následovně
(Rý ■ w)T(Rf ■ v) = wTv.
Transponovaný vektor (R^, ■ w)T je roven wT ■ R^, kde je tzv. transponovaná matice k matici R^,. To je matice, jejíž řádky tvoří sloupce původní matice a sloupce naopak tvoří
x \ / cos oo
Řešení. Nechť (x, y)T je nadále libovolný reálný vektor. Pro matici A\ dostáváme
což znamená, že lineární zobrazení, které tato matice zadává, je projekce na osu x. Podobně vidíme, že matice A2 určuje zrcadlení vzhledem k ose y, protože
'' ^ SH7
Matici A3 lze vyjádřit ve tvaru
'cos 2+ + u\ — 2u\V\ + v\ + u\ — 2u2v2 + v\ = (Ui + ví)2 + (u2 + v2)2 + (Ui - ví)2 + (u2 - v2)2 = \\u+v\\2 + \\u-v\\2.
□
1.88. Ukažte, že složením lichého počtu středových souměrností v rovině dostaneme opět středovou symetrii.
Řešení. Středovou souměrnost v rovině se středem 5 reprezentujme předpisem X S — (X — S), neboli X h-» 25 — X. (Obraz bodu X ve středové symetrii podle středu 5 dostaneme tak, že k souřadnicím bodu 5 přičteme souřadnice vektoru opačného k vektoru X — 5.) Postupnou aplikací tří středových souměrností se středy 5, T a U tak dostáváme X h» 25 - X 2T - (25 - X) ^ 2U - (27 - (25 - X)) = 2(U -T + 5) - X, celkem X ^ 2(U - T + 5) - X, což je středová souměrnost se středem 5 — T + U. Složení libovolného lichého počtu středových souměrností tak postupně redukujeme až na složení tří středových souměrností, jde tedy o středovou symetrii (v principu se jedná o důkaz matematickou indukcí, zkuste si jej sami zformulovat). □
1.89. Sestrojte (2n + l)-úhelník, jsou-li dány všechny středy jeho stran.
1.26c
Řešení. K řešení využijeme toho, že složením lichého počtu středových souměrností je opět středová souměrnost (viz předchozí příklad). Označme vrcholy hledaného (2n + 1)-úhelníka po řadě A\, A2, ..., A2n+i a středy stran (počínaje středem strany A\A2) postupně S\, S2, ... S2n+\. Provedeme-li středové souměrnosti po řadě podle těchto středů, tak bod A\ je zjevně pevným bodem výsledné středové souměrnost, tedy jejím středem. K jeho nalezení tedy stačí provést uvedenou středovou souměrnost s libovolným bodem X roviny. Bod A i leží pak ve středu úsečky XX', kde X' je obrazem bodu X ve zmíněné
řádky původní matice. Vidíme tedy, že matice otočení splňují vztah ■ Rý = I, matice / (někdy píšeme prostě 1 a máme tím na mysli jednotku v okruhu matic), je tzv. jednotková matice
'l 0^
Tím jsme odvodili pozoruhodné tvrzení — matice F s vlastností, že F ■ Rý = I (budeme takové říkat inverzní matice k matici rotace R^) je maticí transponovanou k původní. To je logické, neboť inverzní zobrazení k rotaci o úhel ý je opět rotace, ale o úhel — ý, tj. inverzní matice je rovna matici
R.
cos(-ý) — sin(—ý) sin(—ý) cos(-ý)
cos ý sin ý - sin ý cos ý
Pokud bychom chtěli zapsat rotaci kolem jiného bodu P = O + w, P = [wx, wy], opět pomocí matice, snadno napíšeme potřebný vzorec pomocí posunutí:
Stačí si k tomu uvědomit, že můžeme místo rotace kolem daného bodu P napřed posunout P do našeho počátku, pak provést rotaci a pak udělat opačné posunutí, kterým celou rovinu vrátíme tam, kde měla celou dobu být, viz obrázek. Počítejme tedy
\-> v — w \-> • (v — w) \-> Rf ■ (v — w) + w
cos ý(x — wx) — sin \js(y sin ý(x — wx) + cos \js(y -
- Wy) + WX Wy)) + Wy
1.32. Zrcadlení. Dalším dobře známým příkladem zobra-zení, která zachovávají velikosti, je tzv. zrca-^-ií";-?*''' dlení vzhledem k přímce. Opět nám bude stačit WV r popsat zrcadlení vzhledem k přímkám prochá-zejícím počátkem O a ostatní se z nich odvodí pomocí posunutí, resp. rotací.
Hledejme tedy matici zrcadlení vzhledem k přímce s jednotkovým směrovým vektorem v svírajícím úhel ý s vektorem (1,0). Nejprve si uvědomme, že
7 - í1 °
z°-lo -1
38
KAPITOLA 1. ROZCVIČKA
l /VO
D
? U /1 o -by f ö_n
Obecně můžeme každou přímku otočit do směru vektoru (1,0) a tedy zapsat obecnou matici zrcadlení jako
= ■ Zq ■ R-,/,,
kdy nejprve otočíme maticí přímku do „nulové" polohy, odzrcadlíme maticí Z0 a vrátíme zpět otočením R^,.
Můžeme proto (díky asociativitě násobení matic) spočíst:
'cos ý —sinÝ
^ 'sin i/r cos Videos ý sin ý
sin ý —cos ý
'cos2 ý — sin2 ý 2 sin ý cos ý
'coslifr sin2i/f sin 2^ — cos 2^
1 0 \ / cos ý sin ý 0 — ly sin i/r cos ý
cos ý sin ý - sin i/f cos ý
2 sin i/f cos ý (cos2 i/f — sin2 ý)
Použili jsme přitom obvyklé součtové vzorce pro goniometrické funkce. Povšimněme si také, že • Z0 je dáno:
cos2i/f sin2i/f sin2i/f — cos2i/f
1 0 0 -1
cos2i/f — sin2i/f sin2i/f cos2i/f
Toto pozorování lze zakreslit a zformulovat následovně
* A'
61 2 ■
středové symetrii. Další vrcholy A2, ..., A2n+i získáme zobrazováním bodu A\ ve středových souměrnostech podle S\, . . . , S2n+\. □
1.90. Určete obsah trojúhelníku ABC, je-li A = [-8, 1], B = [-2,0], C = [5,9].
Řešení. Víme, že obsah je roven polovině determinantu matice, jejíž první sloupec je dán vektorem B—Au druhý sloupec vektorem C —A, tj. determinantu matice
-2-(-8) 5-(-8)N 0-1 9-1 Jednoduchý výpočet tak dává výsledek
I ((_2 - (-8)) . (9 - 1) - (5 - (-8)) • (0 - 1)) Dodejme, že při záměně pořadí vektorů by hodnota determinantu měla opačné znaménko (její absolutní hodnota by tedy zůstala stejná) a že by se vůbec nezměnila, kdybychom vektory (při zachování pořadí) napsali do řádků. □
1.91. Spočtěte obsah S čtyřúhelníku vymezeného jeho vrcholy [1, 1], [6, 1], [11, 4], [2,4].
Řešení. Nejprve si označme vrcholy (proti směru pohybu hodinových ručiček)
A = [1,1], S = [6,1], C = [11, 4], D = [2, 4].
Pokud rozdělíme čtyřúhelník ABC D na trojúhelníky ABC a ACD,
můžeme získat jeho obsah jako součet obsahů těchto trojúhelníků, a to
vyčíslením determinantů
6-1 11-1 dl ~ i _ i 4_i
11
4 -
- 1 1
5 10
0 3
10 1
3 3
kde ve sloupcích jsou postupně vektory B —A, C —A (pro d\) a C — A, D — A (pro d2). Potom
21.
c _ M má také dimenzi oo a nemá spočetnou bázi.
2.33. Souřadnice vektorů. Jestliže pevně zvolíme bázi (t>i, ..., vn) konečněrozměrného prostoru V, pak můžeme každý vektor w e V vyjádřit jako
|KtO% lineární kombinaci v = a\V\ + ■ ■ ■ + anvn. 'ftir*~t~^~ Předpokládejme, že to uděláme dvěma způsoby:
w = a\V\ + • • • + anvn = b\V\ + ■ ■ ■ + bnvn. Potom ale
0 = (en - b]) ■ vi H-----\-(a„ - b„) ■ v„
a proto a{ = b{ pro všechna i = 1. Dospěli jsme proto k závěru:
V konečněrozměrném vektorovém prostoru lze každý vektor zadat právě jediným způsobem jako lineární kombinaci bázových vektorů. Koeficienty této jediné lineární kombinace vyjadřující daný vektor w e V ve zvolené bázi v = (vi, ..., v„) se nazývají souřadnice vektoru w v této bázi.
Kdykoliv budeme mluvit o souřadnicích {a\, ..., an) vektoru w, které vyjadřujeme jako posloupnost, musíme mít pevně zvolenu i posloupnost bázových vektorů y_ = (i>i, ..., vn). Jakkoliv jsme tedy báze zavedli jako minimální množiny generátorů, ve skutečnosti s nimi budeme pracovat
100
KAPITOLA 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
jako s posloupnostmi (tedy s uspořádanými množinami, kde je pevně zadáno pořadí bázových prvků).
přiřazení souřadnic vektorům
Přiřazení, které vektoru u = a\Vi + ■ ■ ■ + a„v„ přiřadí jeho souřadnice v bázi y_, budeme značit stejným symbolem v : V -» K". Má tyto vlastnosti:
(1) v(u + w) = v(u) + v(w); Vw, w e V,
(2) v(a ■ u) = a ■ v(u); Va eK,V« e V.
Všimněme si, že operace na levých a pravých stranách těchto rovnic nejsou totožné, naopak, jde o operace na různých vektorových prostorech! Při této příležitosti se také můžeme zamyslet nad obecným případem báze M (možná nekonečněrozměrného) prostoru V. Báze pak nemusí být spočetná, pořád ale ještě můžeme definovat zobrazení M : V -» KM (tj. souřadnice vektoru jsou zobrazení z M do K).
Uvedené vlastnosti přiřazení souřadnic jsme viděli už dříve u zobrazení, kterým jsme v geometrii roviny říkali lineární (zachovávaly naši lineární strukturu v rovině). Než se budeme věnovat podrobněji závislosti souřadnic na volbě báze, podíváme se obecněji na pojem linearity zobrazení.
2.34. Lineární zobrazení. Pro jakékoliv vektorové tľ prostory (konečné i nekonečné dimenze), de-S&fQff linujeme „linearitu" zobrazení mezi prostory <í4§0é^t~ obdobně, jako jsme to viděli již v rovině M2: h.^^otm^ Definice lineárních zobrazení
Nechť V a W jsou vektorové prostory nad týmž polem skalárů K. Zobrazení / : V -» W se nazývá lineární zobrazení (homomorfismus) jestliže platí:
(1) f(u + v) = f(u) + f(v), Vu,veV
(2) f(a ■ u) = a ■ f(u), Va ěK,¥uě V.
Samozřejmě, že jsme taková zobrazení již viděli ve formě násobení matic:
s maticí typu m /n nad K.
Obraz Im/ := f (V) C W je vždy vektorový podpro-stor, protože lineární kombinace obrazů /(«/) je obrazem lineární kombinace vektorů u{ se stejnými koeficienty.
Stejně tak je vektorovým podprostorem množina všech vektorů Ker/ := /_1({0}) C V, protože lineární kombinace nulových obrazů bude vždy zase nulovým vektorem. Podprostor Ker / se nazývá jádro lineárního zobrazení f.
Lineární zobrazení, které je bijekcí nazýváme izomorfis-mus.
Podobně jako u abstraktní definice vektorových prostorů, opět je třeba ověřit zdánlivě samozřejmá tvrzení vyplývající z axiomů:
Tvrzení. Nechť f : V —> W je lineární zobrazení mezi libovolnými vektorovými prostory nad týmž polem skalárů K. Pro
2.62. Uvažme vektorový prostor mnohočlenů jedné neznámé stupně
nejvýše 2 s reálnými koeficienty. V tomto prostoru uvažme bázi 1, x,
x2. Napište matici zobrazení derivace v této bázi a také v bázi 1 + x2,
x, x + x2.
/O 1 0\ /O 1 1 \ Řešení. 002,21 3. □ \0 0 0/ \0 -1 -1/
2.63. Ve standardní bázi v M3 určete matici rotace o 90° v kladném smyslu kolem přímky (ř, t,t), t e M, orientované ve směru vektoru (1, 1, 1). Dále určete matici této rotace v bázi
£=((1,1,0), (1,0,-1), (0,1,1)).
Řešení. Snadno určíme matici uvažované rotace a to ve vhodné bázi, totiž v bázi dané směrovým vektorem přímky a dále dvěma navzájem kolmými vektory v rovině x + y + z = 0, tedy v rovině vektorů kolmých k vektoru (1, 1, 1). Uvědomme si, že matice rotace v kladném
smyslu o 90° v nějaké ortonormální bázi v M2 je
0 -1
1 0
, v orto-
gonální s velikostmi vekorů k, l potom ^QJ' Zvolíme-li v
rovině x + y + z = 0 kolmé vektory (1, — 1, 0) a (1, 1, —2) o velikostech 72 a y/6, tak v bázi / = ((1, 1, 1), (1, -1, 0), (1, 1, -2)) má
/l 0 0 \ uvažovaná rotace matici I 0 0 — V3 I. Abychom získali ma-
\0 1/V3 0 / tici uvažované rotace ve standardní bázi, stačí nám transformovat matici již známým způsobem. Matici přechodu T od báze / ke standardní dostaneme zapsáním souřadnic (ve standardní bázi) vektorů báze / do
/i i i\
sloupců matice T: T = I 1 —1 II. Celkem tedy pro hledanou
V o -V
matici R máme
'1
0
(2.3)
(2.4)
R
r-|o o -VšI -T-1 vo i/VŠ o /
1/3 1/3 - V3/3 1/3 + V3/3\ 1/3 + V3/3 1/3 1/3 - V3/3
J/3-V3/3 1/3 + V3/3 1/3 /
Tento výsledek můžeme ověřit dosazením do matice obecné rotace (2.1), normováním vektoru (1,1,1) dostáváme vektor (x, y, z) = (l/VŠ, l/VŠ, 1/V3), cos( (p)y^ (1 — coí>(p)yz — xsinip \zx(1 — cos Z dvou lineárních zobrazení / : V^Wag: W^Z)e opět lineární zobrazení.
(2) Lineární zobrazení / : V -> W je izomorfismus, právě když Im / = W a Ker / = {0} C V. Inverzní zobrazení k izomorfismu je opět izomorfismus.
(3) Pro libovolné podprostory V\, V2 C V a lineární zobrazení / : V -> W platí
f(Vi + V2) = /(Ví) + /(V2),
/(Vi n v2) c /(vo n /(v2).
(4) Zobrazení „přiřazení souřadnic" u : V -> K" dané libovolně zvolenou bází u = (u\, ..., un) vektorového prostoru V je izomorfismus.
(5) Dva konečněrozměrné vektorové prostory jsou izomorfní právě když mají stejnou dimenzi.
(6) Složení dvou izomorfismu je izomorfismus.
'-TN
Důkaz. Ověření prvního tvrzení je velmi snadné cvičení.
Pro důkaz druhého si uvědomme, že je-li / Y^- lineární bijekce, pak je vektor w vzorem line-rání kombinace au +bv, tj. w = f~1(au+bv),
právě když
f(w) =au+bv = f (a ■ f-l(u) + b ■ f~\v)).
Je tedy také w = af~l(u) + bf~l(v) a tedy je inverze k lineární bijekci opět lineární zobrazení.
Dále, / je surjektivní, právě když Im / = W a pokud Ker / = {0}, pak f(u) = f (v) zaručuje f(u — v) = 0, tj. u = v. Je tedy v tom případě / injektivní.
102
KAPITOLA 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
Další tvrzení se dokáže snadno přímo z definic. Najděte si protipříklad, že v dokazované inkluzi opravdu nemusí nastat rovnost! Zbý vaj ící body j sou j iž zřej mé. □
2.36. Opět souřadnice. Uvažujme libovolné vektorové prostory V a W nad K s dim V = n, dim W = m a mějme lineární zobrazení / : V -» W. Pro každou
u„) na V, v = (vi,
v„)
volbu bází u = (u\ V1 na W, máme k dispozici příslušná přiřazení souřad nic a celou situaci několika právě zmíněných zobrazení za chycuje následující diagram:
Spodní šipka /„je definována zbylými třemi, tj. jako zobrazení jde o složení
fu,v =vo f o u~l.
Matice lineárního zobrazení
Každé lineární zobrazení je jednoznačně určeno svými hodnotami na libovolné množině generátorů, zejména tedy na vektorech báze u. Označme
f(ux) = a\\ ■ v\ + a2\ • V2 H-----h amivm
f(u2) = a12-v1+a22-v2-\-----h am2vm
f(u„) — ai„ ■ vi + a2n ■ v2 + ■ ■ ■ + amnvm
tj. skaláry tvoří matici A, kde sloupce jsou souřadnice hodnot f(uj) zobrazení / na bázových vektorech vyjádření v bázi v na cílovém prostoru W.
Matici A = (ciij) nazýváme maticí zobrazení f v bázích u, v.
Pro obecný vektor u = x\u\ + • • • + xnun e V spočteme (vzpomeňme, že sčítání vektorů je komutativní a distributivní vůči násobení skaláry)
f(u) = xi/(«i) H-----\-xnf(un)
= xi(útni;i+- • ■+amivm) + ■ ■ ■ + x„(ai„vi+- ■ ■+amnvm) = (xiútn+- • ■+x„ai„)vi + ■ ■ ■ + (x\ami+- ■ ■+xnamn)vm.
Pomocí násobení matic lze nyní velice snadno a přehledně zapsat hodnoty zobrazení /„„(w) definovaného jednoznačně předchozím diagramem. Připomeňme si, že vektory v Kr chápeme jako sloupce, tj. matice typu r/1
fu,v(u(w)) = v(f(w)) = A ■ u(w).
Naopak, máme-li pevně zvoleny báze na V i W, pak každá volba matice A typu m/n zadává jednoznačně lineární zobrazení K" -> Km a tedy i zobrazení / : V -> W. Máme-li tedy zvoleny báze prostorů V a.W, odpovídá každé volbě matice typu m/n právě jedno lineární zobrazení V -> W a
2.67. Uvažme komplexní čísla jako reálný vektorový prostor a za jeho bázi zvolme 1 a i. V této bázi určete matici následujících lineárních zobrazení:
tonjugace, b) násobení číslem (2 + /).
Určete matici těchto zobrazení v bázi (1 — /), (1 + /).
Řešení.
'\ 0 ,0 -1
a)
b) V obou bazích je matice stejná a to Zamyslete se, proč tomu tak je.
1
□
2.68. Určete matici A, která ve standardní bázi prostoru M3 zadává kolmou projekci do vektorového podprostoru generovaného vektory ux = (-1, l,0)a«2 = (-1,0, 1).
Řešení. Nejprve poznamenejme, že uvedený podprostor je rovinou procházející počátkem s normálovým vektorem w3 = (1,1, 1). Uspořádaná trojice (1, 1, 1) je totiž očividným řešením soustavy —x\ + x2 =0,
—x\ + x3 = 0,
tj. vektor w3 je kolmý na vektory u\, u2. Podotkněme rovněž, že jsme tento příklad již vyřešili (matici A známe z dřívějšího příkladu).
Při dané projekci se vektory ui a u2 musejí zobrazit na sebe a vektor u3 potom na nulový vektor. V bázi složené po řadě z vektorů u\, u2, m3 je proto matice této projekce
'\ o o^
0 1 o ^0 0 Oj
Pomocí matic přechodu
1\ /_! 2
3 3 _ 1 _ l
3 3 3
III
3 3 3
od báze (u\, u2, u3) ke standardní bázi a od standardní báze k bázi («i, u2, u3) získáme
-1 -1 1\ /l 0 0\ ' 1 2 1 0 1-010-0 1 1/ \0 0 0/
□
103
H. VLASTNI CISLA A VLASTNI VEKTORY
3. VEKTOROVÉ PROSTORY A LINEÁRNI ZOBRAZENI
2.69. Napište matici zobrazení kolmé projekce do roviny procházející počátkem a kolmé na vektor (1, 1, 1).
2 .25a
Řešení. Obraz libovolného bodu (vektoru) x = (x\,x2,x3) e M v uvažovaném zobrazení získáme tak, že od daného bodu odečteme jeho kolmou projekci do normálového směru dané roviny, tedy do směru (1, 1, 1). Tato projekce p je dána (viz přednáška) jako
(x, (1, 1, 1)) _ X\ + X2 + X3 Xi+X2+X3 Xi+X2+X3
1(1, 1, 1)|2 ~ 3 ' 3 ' 3
Výsledné zobrazení je tedy
,2x\ x2 -\- x3 2x2 X\ -\- x3 2*3 i 3 ' ~3 3 ' ~3~
(-
X\ + x2
)
□
2.70. Ve vektorovém prostoru M3 určete matici kolmé projekce na rovinu x + y — 2z, = 0.
2.71. Ve vektorovém prostoru M3 určete matici kolmé projekce na rovinu 2x — y + 2z = 0.
H. Vlastní čísla a vlastní vektory
2 al3. (1) Uvažme zobrazení
2.72. Vlastní čísla a vlastní vektory mohou sloužit k názornému po pisu lineárních zobrazení, zejména v s maticí ve standardní bázi
Pak dostáváme
—k 0 1
\A - kE\ = 0 1 — k 0 = -ŕ + x2 + x - i,
1 0 —k
s kořeny k\t2 se spočtou:
1, k3 = — 1. Vlastní vektory s vlastní hodnotou k = 1
-ť
2.26
0
-1/ \o o o
s bází prostoru řešení, tj. všech vlastních vektorů s touto vlastní hodnotou
«i = (0,1,0), u2 = (1,0,1). Podobně pro k = — 1 dostáváme třetí nezávislý vlastní vektor
'\ 0 l\ /l 0 ŕ
0 2 0 - 0 2 0
1 0 1/ \0 0 0;
u3 = (-1,0, 1).
ukázali jsme bijekci mezi maticemi příslušného rozměru a lineárními zobrazeními V -> W.
2.37. Matice přechodu mezi souřadnicemi. Jestliže za V i W zvolíme tentýž prostor, ale s různými bázemi, a za / identické zobrazení, vyjadřuje postup z předchozího odstavce vektory báze u v souřadnicích vzhledem k v. Označme výslednou matici T. Když pak zadáme vektor u
U = X\U\ -\-' ' ' -\- Xnlln
v souřadnicích vzhledem ku a dosadíme za u{ jejich vyjádření pomocí vektorů z y_, obdržíme souřadné vyjádření x = (x\, ..., xn) téhož vektoru v bázi v. Stačí k tomu přesklá-dat pořadí sčítanců a vyjádřit skaláry u jednotlivých vektorů báze.
Ve skutečnosti teď děláme totéž, co v předchozím odstavci pro speciální případ identického zobrazení idy na vektorovém prostoru V. Matice tohoto identického zobrazení je T a tedy nutně musí naznačený přímý výpočet dát x = T ■ x. Situace se zobrazena na diagramu:
Výslednou matici T nazýváme matice přechodu od báze u vektorového prostoru V k bázi v téhož prostoru. Přímo z definice vyplývá:
| výpočet matice přechodu |_
Tvrzení. Matici T přechodu od báze u k bázi v získáme tak, ze souřadnice vektorů báze u v bázi v napíšeme do sloupců matice T.
1
Funkce matice přechodu je taková, že známe-li souřadnice x vektoru v bázi u, pak jeho souřadnice v bázi v se obdrží vynásobením sloupce x maticí přechodu (zleva). Protože inverzní zobrazení k identickému je opět totéž identické zobrazení, je matice přechodu vždy invertibilní a její inverze je právě matice přechodu opačným směrem, tj. od báze v k bázi u.
2.38. Více souřadnic. Nyní si ukážeme, jak se skládají souřadná vyjádření lineárních zobrazení. Uvažme ještě další vektorový prostor Z nad K dimenze k s bází w, lineární zobrazení g : W -> Z a označme příslušnou matici g^^.
V
W
fu,v
8v_,w
104
KAPITOLA 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
Složení go f na horním řádku odpovídá matici zobrazení W -» Kk dole a přímo spočteme (píšeme A pro matici / a B pro matici g ve zvolených bazích):
8v,w o fu,Áx) = w o g o v'1 o v o f o u~l
= B ■ (A ■ x) = (B ■ A) ■ x = (g o /)„,„,(*)
pro všechny x e W. Skládání obražení tedy odpovídá násobení příslušných matic. Všimněte si také, že isomorfismy odpovídají právě invertibilním maticím.
Stejný postup nám dává odpovědna otázku, jak se změní matice zobrazení, změníme-li báze na definičním oboru i oboru hodnot:
V
V
f
W
fu,v
W
kde T je matice přechodu od w' k u a S je matice přechodu od 1/ k v. Je-li tedy A původní matice zobrazení, bude nová dána jako A' = S^AT.
Ve speciálním případě lineárního zobrazení / : V -» V, tj. zobrazení má stejný prostor V jako definiční obor i obor hodnot, vyjadřujeme zpravidla / pomocí jediné báze u prostoru V. Pak tedy přechod k nové bázi w' s maticí před-chodu T od u/ k u bude znamenat změnu matice zobrazení na A' = T~1AT.
2.39. Lineární formy. Obzvlášť jednoduchým a zároveň důležitým případem lineárních zobrazení jsou tzv. lineární formy. Jde o lineární zobrazení z vektorového prostoru V nad polem skalárů K 'jLj^=— do skalárů K. Jsou-li dány souřadnice na V, je přiřazení jednotlivé /-té souřadnice vektorům právě takovou lineární formou. Přesněji řečeno, pro každou volbu báze v = (i>i, ..., vn) máme k dispozici lineární formy v* : V -» K takové, že v*(vj) = tj. nula pro různé indexy i a. j a. jednička pro stejné.
Vektorový prostor všech lineárních forem na V značíme V* a říkáme mu duální prostor vektorovému prostoru V. Předpokládejme nyní, že prostor V má konečnou dimenzi n. Bázi V* sestavenou z přiřazování jednotlivých souřadnic jako výše nazýváme duální báze. Skutečně se jedná o bázi prostoru V*, protože jsou tyto formy zjevně lineárně nezávislé (prověřte si!) a je-li a libovolná forma, pak platí pro každý vektor u = x\V\ + ■ ■ ■ + x„v„
a(u) = x\a(v\) + • • • + x„a(v„)
= íx(i;i)i;*(h) H-----h a(vn)v*(u)
a je tedy a lineární kombinací forem v*.
Při pevně zvolené bázi {1} na jednorozměrném prostoru skalárů K jsou s každou volbou báze v na V lineární formy a ztotožněny s maticemi typu l/n, tj. s řádky y. Právě komponenty těchto řádků jsou souřadnicemi obecných lineárních forem v duální bázi v*. Vyčíslení takové formy na vektoru je
V bázi u\, u2, «3 (všimněte si, že w3 musí být lineárně nezávislý na zbylých dvou díky předchozí větě aui,u2 vyšly jako dvě nezávislá řešení) má / diagonální matici
Celý prostor M3 je přímým součtem vlastních podprostorů, M3 = V\ © V2, dim V\ = 2, dim V2 = 1. Tento rozklad je dán jednoznačně a vypovídá mnoho o geometrických vlastnostech zobrazení /. Vlastní podprostor V\ je navíc přímým součtem jednorozměrných vlastních podprostorů, které lze však zvolit mnoha různými způsoby (takový další rozklad nemá tedy již žádný geometrický význam).
(2) Uvažme lineární zobrazení / : R2[x] -> R2[x] definované derivováním polynomů, tj. /(I) = 0, f(x) = 1, f(x2) = 2x. Zobrazení / má tedy v obvyklé bázi (1, x, x2) matici
Charakteristický polynom je \A — k ■ E\ = —A3, existuje tedy pouze jediná vlastní hodnota, k = 0. Spočtěme vlastní vektory:
Prostor vlastních vektorů je tedy jednorozměrný, generovaný konstantním polynomem 1.
2.73. Příklad i se změnou báze. Určete vlastní čísla a vlastní vektory matice
/l 1 f^ A = 1 2 1
V 2 h
Popište toto zobrazení a napište jeho matici v bázi:
ei = [1,-1,1] e2 = [1,2,0] e3 = [0, 1, 1]
Řešení. Charakteristický polynom dané matice je
= —k3 + 4k2 -2k = -k(k2 -4k + 2).
1 - k 1 0 1 2 — k 1 1 2 1 - k
Kořeny tohoto polynomu, vlastní čísla, udávají, kdy nebude mít matice
105
H. VLASTNI CISLA A VLASTNI VEKTORY
3. VEKTOROVÉ PROSTORY A LINEÁRNI ZOBRAZENI
plnou hodnost, tedy soustava rovnic
bude mít i jiné řešení než řešení x = (0, 0, 0). Vlastní čísla tedy jsou 0, 2 + a/2, 2 — a/2. Spočítejme vlastní vektory příslušné jednotlivým vlastním hodnotám:
• 0: Řešíme tedy soustavu
'1 1 0\ /jcA 1 2 1 \\x2 = 0 12 1/ \jc3/
Jejím řešením je jednodimenzionální vektorový prostor vlastních vektorů ((1, —1, 1)).
• 2 + a/2: Řešíme soustavu
(1 + V2) 1 0 \ /xA
1 -72 1 \\x2 = 0.
1 2 -(1 + V2)/ VsJ
Řešením je jednodimenzionální prostor ((1,1 + a/2, 1 + V2)>.
• 2 — a/2: Řešíme soustavu
'(a/2-1) 1 0 1 V2 1 1 2 (72 -
2.28
0.
Řešením je prostor vlastních vektorů ((1, 1 — a/2, 1 — \/2)).
Daná matice má vlastní čísla 0,2+a/2 a 2 — a/2, kterým přísluší po řadě jednorozměrné prostory vlastních vektorů ((1, —1, 1)), ((1,1 + a/2, 1 + a/2)) a ((1, 1 - a/2, 1 - a/2)).
Zobrazení tedy můžeme interpretovat jako projekci podél vektoru (1, -1, 1) do roviny dané vektory (1, 1 + a/2, 1 + a/2) a (1, 1 -a/2, 1 — a/2) složenou s lineárním zobrazením daným „natažením" daným vlastními čísly ve směru uvedených vlastních vektorů.
Nyní jej vyjádřeme v uvedené bázi. K tomu budeme potřebovat matici přechodu T od standardní báze k dané nové bázi. Tu získáme tak, že souřadnice vektorů staré báze v bázi nové napíšeme do sloupců matice T. My však snadněji zapíšeme matici přechodu od dané báze k bázi standardní, tedy matici T~l. Souřadnice vektorů nové báze pouze zapíšeme do sloupců:
Potom
pak dáno vynásobením příslušného řádkového vektoru y se sloupcem souřadnic x vektoru w e V v bázi u:
ot(u) = y - x = yxxx -\-----h ynxn.
Zejména tedy vidíme, že pro každý konečněrozměrný prostor V je V* izomorfní prostoru V. Realizace takového izo-morfismu je dána např. naší volbou duální báze ke zvolené bázi na prostoru V.
V tomto kontextu tedy znovu potkáváme skalární součin řádku n skalárů se sloupcem n skalárů, j ak j sme s ním pracovali již v odstavci 2.3 na straně 74.
U nekonečně rozměrného prostoru se věci mají jinak. A Např. už nejjednodušší příklad prostoru všech polynomů K[x] v jedné proměnné je vektorovým prostorem se spočetnou bazí s prvky vt = x1 a stejně jako výše můžeme definovat lineárně nezávislé formy v*. Jakýkoliv formální nekonečný součet YlT=o ai vľ Je nyní dobře definovanou lineární formou na K[x], protože bude vyčíslován vždy pouze na konečné lineární kombinaci bázových polynomů x1, i = 0, 1, 2, ....
Spočetná množina všech v* tedy není bazí. Ve skutečnosti lze ukázat, že tento duální prostor ani spočetnou bázi mít nemůže.
2.40. Velikost vektorů a skalární součin. V úvahách o geometrii roviny M2 jsme již v první kapitole v od-rf stavci 1.29 pracovali nejen s bázemi a lineár-sz. nimi zobrazeními, ale také s velikostí vektorů a jejich úhly. Pro zavedení těchto pojmů jsme také použili skalárního součinu dvou vektorů v = (x, y) a v' = (x', ý) ve tvaru u ■ v = xx' + yyf. Skutečně, souřadné vyjádření pro velikost v = (x, y) je dáno
IMI = a/x2 + y2 = y/v - v,
zatímco (orientovaný) úhel 0 a ||u||2 = (v, v) = 0 pouze při v = 0.
Číslu ||u|| = s/(v, v) říkáme velikost vektoru v.
Vektory v a w e V se nazývají ortogonální nebo kolmé, jestliže (v, w) = 0. Píšeme také v _L w. Vektor v se nazývá normovaný, jestliže ||t>|| = 1.
Báze prostoru V složená z ortogonálních vektorů se nazývá ortogonální báze. Jsou-li bázové vektory navíc i normované, je to ortonormální báze.
Skalární součin se také často zapisuje pomocí obvyklé tečky, tj. (u, v) = u ■ v. Z kontextu je pak třeba poznat, zda jde o součin dvou vektorů (tedy výsledkem je skalár) nebo něco jiného (stejně jsme značili součin matic a také někdy součin skalárů).
Protože je skalární součin lineární v každém ze svých argumentů, bude jistě úplně určen již svými hodnotami na dvojicích bázových vektorů. Skutečně, zvolme si bázi u = (ui, ..., un) prostoru V a označme
(Ui,Uj).
s jí a
Pak ze symetričnosti skalárního součinu plyne Síj z linearity součinu v každém z argumentů dostáváme:
(Ev'"'-EV;"-; = zZx'>'i{"'- ui) = J2suxiyj-
i j i,j i,j
Pokud je báze ortonormální, je matice S jednotkovou maticí Tím jsme dokázali následující užitečné tvrzení:
skalární součin a ortonormální báze
Tvrzení. Skalární součin je v každé ortonormální bázi dán v souřadnicích výrazem
(x, y) =xT ■ y.
Pro každou obecnou bázi prostoru V existuje symetrická matice S taková, že souřadné vyjádření skalárního součinu je
(x, y)
S-y.
2 . 33b
2.41. Ortogonální doplňky a projekce. Pro každý pevně zvolený podprostor W C V v prostoru se skalárním součinem definujeme jeho ortogonální doplněk takto
W1- = {u € V; alt) pro všechny v e W}.
Přímo z definice je zjevné, že W1- je vektorový podprostor. Jestliže W C V má bázi («!,..., uk), je podmínka pro W1-dána jako k homogenních rovnic pro n proměnných. Bude tedy mít W1- dimenzi alespoň n—k. Zároveň ale u e IVniy1
a pro matici B zobrazení v nové bázi pak máme (viz 2.38)
/O 5 2 B = TAT'1 = ( 0 -2 -1 \0 14 l
□
2.74. Naleznete vlastní čísla a jim příslušné vektorové prostory vlastních vektorů matice:
-1 0 0
5 5
6 3
2.75. Určete charakteristický polynom \A—XE\, vlastní čísla a vlastní vektory matice
ŕA -1 6^ 2 1 6 v2 -1
2.76. Stanovte vlastní hodnoty matice /-13 5 4 2\
0 -10 0 -30 12 9 5 \-12 6 4 1/
2.77. Udejte příklad čtyřrozměrné matice s vlastními čísly k\ = 6 a k2 = 1 takové, aby násobnost k2 jako kořene charakteristického polynomu byla 3 a aby
(a) dimenze podprostoru vlastních vektorů k2 byla 3;
(b) dimenze podprostoru vlastních vektorů k2 byla 2;
(c) dimenze podprostoru vlastních vektorů k2 byla 1.
2.78. Víte-li, že čísla 1,-1 jsou vlastní hodnoty matice
/-ll 5 4 l\
-3010 -21 11 8 2 \-9 5 3 1/ uvedlte v echna ře ení charakteristické rovnice | A — k E \ = 0. Nápověda: Označíme-li kořeny polynomu | A — k E \ jako k\, k2, k3, k4, je
| A | = ki ■ k2 ■ k3 ■ k4, tr A = ki + k2 + k3 + k4.
2.79. Pro libovolnou n x n matici A je její charakteristický polynom \ A — k E \ stupně n, je tedy tvaru
| A - k E I = cn kn + c„_i k"-1 + ■ ■ ■ + a k + c0, cn^0,
přičem platí
cn = (-!)", c„_i = (-l)"-1trA, c0 = |A|. Jestliže je matice A trojrozměrná, obdržíme
| A - k E I = -k3 + (tr A) k2 + ci k + I A |.
107
H. VLASTNI CISLA A VLASTNI VEKTORY
3. VEKTOROVÉ PROSTORY A LINEÁRNI ZOBRAZENI
Volbou X = 1 dostávame
\A-E\ = _i + trA+ci + |A|. Odsud získáváme vyjádření
\A-XE\ = -A3 + (trA)A2 + (|A-£'| + l-trA-|A|)A + |A|.
Využijte toto vyjádření k určení charakteristického polynomu a vlastních hodnot matice
2.80. Vypočítejte A5 a A"3, je-li
0
■1 1
2 0
1
2.81. Bez počítání napište spektrum lineárního zobrazení / : M3 -» M3 zadaného přiřazením (jci, x2, x3) h-» (xi + x3, x2, x\ + x3).
2.82. Pauliho matice. Ve fyzice se stav částice se spinem ^ popisuje Pauliho maticemi. Jsou to následující matice 2x2 nad komplexními čísly
'0 l\ /O -A íl 0
i o]'ff2 = li o]'CT3= 0 -1
2 . 33a
Ukažte, že pro komutátor matic (značený hranatými závorkami) platí [cti, a2] := o\o2— K, kde pro jakékoliv vektory u, v, w, z a skaláry a,b, c & d platí, stejně jako u skalárního součinu
a(au + bv, cw + dz) = aca(u, w) + ada(u, z)
+ bc a(v, w) + bd a(v, z)-
Pokud navíc platí
a(u, w) = a(w, u),
hovoříme o symetrické bilineární formě. Jestliže záměna argumentů vede k obrácení znaménka výsledku, hovoříme o antisymetrické bilineární formě.
Již v rovinné geometrii jsme zavedli determinant jako bilineární antisymetrickou formu a, tj. a(u, w) = —a(w, u). Obecně víme z věty 2.17, že je determinant v dimenzi n možno nahlížet jako «-lineární antisymetrickou formu.
Jako u lineárních zobrazení je zřejmé, že každá k-lineární forma je úplně určena svými hodnotami na všech /c-ticích bázových prvků v pevné bázi. V analogii k lineárním zobrazením tyto hodnoty můžeme vnímat jako /c-rozměrné analogie matic. Ukážeme si to v případě k = 2, kde půjde doopravdy o matice, jak jsme je zavedli.
110
KAPITOLA 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
Matice bilineární formy
Jestliže zvolíme bázi u na ľ a definujeme pro danou bilineární formu a skaláry atj = Uj), pak zjevně dostaneme pro vektory v, w se souřadnicemi x a y (jakožto sloupce souřadnic)
n
a (v, w) = ^2 atjXtyj = yT ■ A ■ x,
kde A je matice A
2.29
íj=i (aij).
Přímo z definice matice bilinerání formy je vidět, že forma je symetrická nebo antisymetrická, právě když má tutéž vlastnost její matice.
Každá bilineární forma a na vektorovém prostoru V definuje zobrazení V -» V*, v h-» a( , u), tj. dosazením pevného vektoru v za druhý argument dostáváme lineární formu, která je obrazem tohoto vektoru. Zvolíme-li pevně bázi na ko-nečněrozměrném prostoru V a duální bázi na V*, pak jde o zobrazení
y h-» (x h-» yT ■ A ■ x).
4. Vlastnosti lineárních zobrazení
Podrobnějším rozborem vlastností různých typů lineárních zobrazení se nyní dostaneme k lepšímu pochopení nástrojů, které nám vektorové prostory pro lineární modelování procesů a systémů nabízejí.
2.45.
Začneme čtyřmi příklady v nejnižší zajímavé di-ins> _ menzi. Ve standardní bázi roviny R2 se standardním skalárním součinem uvažujme následující matice zobrazení
•W///"'1 f \ R2 ^ M2:
1 0 0 0
B
0 1
o o
c
a 0 0 b
D
0 -1
1 0
Matice A zadává kolmou projekci podél podprostoru W C {(0,a); a e R} c R2
na podprostor
V C {(a, 0); a e R} C R2,
tj. projekce na osu x podél osy y. Evidentně pro toto zobrazení / : R2 -> R2 platí / o / = / a tedy zúžení /1 v daného zobrazení na obor hodnot je identické zobrazení. Jádrem / je právě podprostor W.
Matice B má vlastnost B2 = 0, platí tedy totéž o příslušném zobrazení /. Můžeme si jej představit jako matici derivování polynomů Ri[x] stupně nejvýše jedna v bázi (1, x) (derivacemi se budeme podrobně zabývat v kapitole páté, viz ??).
Matice C zadává zobrazení /, které první vektor báze zvětší út-krát, druhý b-kiát. Tady se nám tedy celá rovina
Dostáváme tak řešení
x\ = — 2t, X2 = —2s, X3 = 2s + 2t, yi = — s — t, y2 = s, yj,
t, s e R. Odtud dosazením získáváme obecný vektor průniku (x\ + x2 + x3\
X\ + X2 X\ + X3
\ x2 + x3
Vidíme, že
/ 0 \
-2t - 2s
2s
v 2t )
dim U n V
u n y
/0\ /0\
-1 -1
1 ' 0
w V1/1
□
2.88. Uvedte nějakou bázi podprostoru
vektorového prostoru reálných matic 3x2. Tuto bázi doplňte na bázi celého prostoru.
Řešení. Připomeňme, že bázi podprostoru tvoří množina lineárně nezávislých vektorů, které generují uvažovaný podprostor. Protože
celý podprostor U je generován pouze prvními dvěma maticemi. Ty jsou potom lineárně nezávislé (jedna není násobkem druhé), a tak zadávají bázi. Chceme-li ji doplnit na bázi celého prostoru reálných matic 3x2, musíme najít další čtyři matice (dimenze celého prostoru je zjevně 6) takové, aby výsledná šestice byla lineárně nezávislá. Můžeme využít toho, že známe např. standardní bázi
prostoru reálných matic 3x2, který lze přímo ztotožnit s R6. Sepíšeme-li dva vektory báze U a vektory standardní báze celého prostoru v tomto pořadí, výběrem prvních 6 lineárně nezávislých
111
I. BÁZE A SKALÁRNÍ SOUČINY
4. VLASTNOSTI LINEÁRNÍCH ZOBRAZENÍ
1 0 0 0 0 0
2 1 0 0 0 0
3 2 1 0 0 0
4 3 0 1 0 0
5 4 0 0 1 0
6 5 0 0 0 1
vektorů dostaneme hledanou bázi. Pokud však uvážíme, že kupř.
1,
můžeme ihned bázového vektory
'i 2^
3 4
podprostoru U doplnit maticemi (vektory prostoru matic)
^0 0\ /O 0\ /O 0\ /O 0>
10, 0 1, 0 0, 0 0
vo o/ \o o) \i o) \o 1,
na bázi. Upozorněme, že výše uvedený determinant lze vyčíslit velmi snadno - je roven součinu prvků na diagonále, neboť matice je v dolním trojúhelníkovém tvaru (nad diagonálou jsou všechny prvky nulové). □
2.89. Napište něj akou bázi reálného vektorového prostoru matic 3x3 nad M s nulovou stopou (součet prvků na diagonále) a napište souřadnice matice
'12 0
0 2 0
1 -2 -3,
v této bázi.
2.90. Zavedte nějaký skalární součin na vektorovém prostoru matic z předchozího příkladu. Spočítejte normu matice z předchozího příkladu, která je indukovaná Vámi zavedeným součinem.
2.91. Určete nějakou bázi vektorového prostoru antisymetrických reálných čtvercových matic typu 4x4. Uvažte standardní skalární součin v této bázi a pomocí tohoto součinu vyjádřete velikost matice
/0 3 1 0\ -3012 -1-1 0 2 \0 -2-2 0/
2.92. Najděte ortogonální doplněk U1- podprostoru
U = {(x\, x2, x3, X4); x\ = x3, xj = x3 + 6x4} c M4.
Řešení. Ortogonální doplněk U1- tvoří právě ty vektory, které jsou kolmé na každé řešení soustavy
xx
rozpadá na dva podprostory, které jsou zobrazením / zachovány a ve kterých jde o pouhou homotetii, tj. roztažení skalárním násobkem (první příklad byl speciální případem s a = 1, b = 0). Např. volba a = 1, b = — 1 odpovídá osové symetrii (zrcadlení) podle osy x, což je totéž jako komplexní konjugace x + iy 1-» x — iy na dvourozměrném reálném prostoru E2~Cv bázi (1,0- Toto je lineární zobrazení dvourozměrného reálného vektorového prostoru C, nikoliv však jednorozměrného komplexního prostoru C.
Matice D je maticí rotace o pravý úhel ve standardní bázi a na první pohled je vidět, že žádný jednorozměrný podpro-stor není zobrazením zachováván.
Taková rotace je bijekcí roviny na sebe, proto jistě umíme najít (různé) báze na definičním oboru a oboru hodnot, ve kterých bude jeho maticí jednotková matice E (prostě vezmeme jakoukoliv bázi na definičním oboru a její obraz na oboru hodnot). Neumíme ale v tomto případě totéž s jednou bází na definičním oboru i oboru hodnot.
Zkusme však uvažovat matici D jako matici zobrazení g : C2 -» C2 ve standardní bázi komplexního vektorového prostoru C2. Pak umíme najít vektory u = (i, 1), v = (—i, 1), pro které bude platit
g(v)
0 -1
1 0
0 -1
1 o
■1
1 ■ u,
-1 ■ v.
To ale znamená, že v bázi (u, v) na C2 má zobrazení g matici K
i 0 0 -i
a povšimněme si, že tato komplexní analogie k případu matice C má na diagonále prvky a = cos(ijr) + / sin(jjt) a kmoplexně sdružené ä. Jinými slovy, argument v goniometrickém tvaru tohoto komplexního čísla udává úhel otočení.
Tomu lze snadno porozumět, když si označíme reálnou a imaginární část vektoru u takto
xu + iyu = Re u -\- i Im u
+ i
x2
x3 x3
6x4
0, 0.
Vektor v je komplexně sdružený k u. Zajímá nás zúžení zobrazení g na reálný vektorový podprostor V = M2 n (u, v) c C2. Evidentně je
V = {u + ú, i(u - ú)) = {xu, -yu)
celá reálná rovina M2. Zúžení zobrazení g na tuto rovinu je právě původní zobrazení dané maticí A a z definice násobení komplexní jednotkou jde o otočení o úhel ^jt v kladném smyslu ve vztahu ke zvolené bázi xu, —yu (ověřte si přímým výpočtem a uvědomte si také, proč případné prohození pořadí vektorů u a. v povede k témuž výsledku, byť v jiné reálné bázi!).
112
KAPITOLA 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
2.30
2.46. Vlastní čísla a vlastní vektory zobrazení. Klíčem k popisu zobrazení v předchozích příkladech byly odpovědi na otázku „jaké jsou vektory "^tzz^ splňující rovnici f(u) = a-m pro nějaké vhodné skaláry a?".
Zvolme tedy pevně lineární zobrazní / : V -» V na vektorovém prostoru dimenze n nad skaláry K. Jestliže si představíme takovou rovnost zapsanou v souřadnicích, tj. s využitím matice zobrazení A v nějakých bázích, jde o výraz
A ■ x — a ■ x = (A — a ■ E) ■ x = 0.
Z předchozího víme, že taková soustava rovnic má jediné řešení x = 0, pokud je matice A — a E invertibilní. My tedy chceme najít takové hodnoty aéI, pro které naopak A—a E invertibilní není, a nutnou a dostatečnou podmínkou je (viz Věta 2.23)
e2.1 (2.4)
det(A - a ■ E) = 0.
Jestliže považujeme k = a za proměnnou v předchozí skalární rovnici, hledáme ve skutečnosti kořeny polynomu stupně n. Jak jsme viděli v případě matice D výše, kořeny mohou, ale nemusí existovat podle volby pole skalárů '.
Vlastní čísla a vlastní vektory Skaláry k vyhovující rovnici f(u) = k ■ u pro nenulový vektor u e V nazýváme vlastní čísla zobrazení f, příslušné nenulové vektory u pak vlastní vektory zobrazení f.
Jsou-li u, v vlastní vektory příslušné k témuž vlastnímu číslu k, pak i pro jejich jakoukoliv lineární kombinaci platí
f (au + bv) = af(u) + bf(v) = k(au + bv).
Proto tvoří vlastní vektory příslušné k vlastnímu číslu k, společně s nulovým vektorem, netriviální vektorový podprostor Vx, tzv. vlastní podprostor příslušný k. Např., je-li k = 0 vlastním číslem, je jádro Ker / vlastním podprostorem V0-
Z definice vlastních čísel je zřejmé, že jejich výpočet nemůže záviset na volbě báze a tedy matice zobrazení /. Skutečně, jako přímý důsledek trasformačních vlastností z odstavce 2.38 a Cauchyovy věty 2.19 pro výpočet determinantu součinu dostáváme jinou volbou souřadnic matici A' = P~l A P s invertibilní maticí P a
\P~lAP - kE\ = \P~lAP - P~lkEP\
= \P~1(A- kE)P\ = \p-1\\(A-kE\\P\ = \A- kE\,
protože násobení skalárů je komutativní a = li5!-1.
Z těchto důvodů používáme pro matice a zobrazení společnou terminologii:
ir-j Charakteristický polynom matice a obražení _^ Pro matici A dimenze n nad K nazýváme polynom | A — kE\ e K„[A] charakteristický polynom matice A.
Vektor je ovšem řešením této soustavy tehdy a jenom tehdy, když je kolmý na oba vektory (1,0, —1,0), (0, 1, —1, —6). Je tedy
U1- = {a ■ (1, 0, -1, 0) + b ■ (0, 1, -1, -6); a, b e R}.
□
2.93. Určete, zda jsou podprostory U = ((2, 1, 2, 2))
a V = ((-1,0, -1,2), (-1,0, 1,0), (0,0, 1, -1)) prostoru M4 na sebe kolmé. Pokud ano, je R4 = U © V, tj. je U1- = V?
Řešení. Vektor, který zadává podprostor U, je kolmý na každý ze tří vektorů, které generují V. Podprostory jsou tak na sebe kolmé. Avšak není pravda, že R4 = U © V. Podprostor V je totiž pouze dvojdimenzionální, protože
(-1,0, -1,2) = (-1,0, 1,0) -2(0,0, 1, -1).
□
2.94. V závislosti na parametru t e R stanovte dimenzi podprostoru U vektorového prostoru R3, je-li U generován vektory
(a) ui = (1, 1, 1), u2 = (í,t,\), m3 = (2, 2,0;
(b) ui = (t,t,t), u2 = (-4ř,-4ř, 40, u3 = (-2, -2, -2).
Řešení. V prvním případu je dim U = 2 pro t e {1,2}, jinak je dim U = 3. Ve druhém případu je dim U = 2 pro t ^ 0 a dim U = 1 pro t = 0. □
2.95. Sestrojte ortogonální bázi podprostoru
((1,1,1,1), (1,1,1,-1), (-1,1,1,1))
prostoru R4.
Řešení. Gramovým-Schmidtovým ortogonalizačním procesem lze obdržet výsledek
((1, 1, 1, 1), (1, 1, 1, -3), (-2, 1, 1,0)).
□
2.96. V prostoru R4 nalezněte nějakou ortogonální bázi podprostoru všech lineárních kombinací vektorů (1,0, 1,0), (0, 1,0, —7),
(4, —2, 4, 14) a podprostoru generovaného vektory (1, 2, 2, —1), (1, 1, -5, 3), (3,2, 8, -7).
Řešení. Při zachování pořadí podprostoru ze zadání jsou ortogonálními bázemi např.
((1,0, 1,0), (0, 1,0, -7))
a
((1, 2, 2, -1), (2, 3, -3, 2), (2, -1, -1, -2)).
113
I. BÁZE A SKALÁRNÍ SOUČINY
4. VLASTNOSTI LINEÁRNÍCH ZOBRAZENÍ
□
2.97. Pro jaké hodnoty parametrů a, b e M jsou vektory (1,1,2,0,0), (1,-1,0, l,a), (1,0,2,3,-2)
v prostoru M5 po dvou ortogonální? Řešení. Výsledek je a = 9/2, b = -
1+6 + 4 + 0 + 0 = 0,
—5, neboť musí mj. platit 1-6 + 0 + 3-2a =0.
□
2.98. V prostoru M5 uvažujte podprostor generovaný vektory
(1,1,-1,-1,0), (1,-1,-1,0,-1), (1,1,0,1,1),
(—1, 0, — 1, 1, 1). Najděte nějakou bázi jeho ortogonálního doplňku.
Řešení. Hledaná báze obsahuje jediný vektor. Jejím nějaký nenulový skalární násobek vektoru
(3, -7, 1, -5,9).
□
2 . 30a
2.99. Popište ortogonální doplněk podprostoru V prostoru M4, jeli V generován vektory (-1, 2, 0, 1), (3, 1, -2, 4), (-4, 1, 2, -4), (2,3, -2,5).
Řešení. Ortogonální doplněk (komplement) V7"1 je množina všech skalárních násobků vektoru (4, 2, 7, 0). □
2.100. V prostoru M5 určete ortogonální doplněk WL podprostoru W, jestliže
(a) W = {(r + s + ř, -r + ř, r + s, -t, s + t); r, s, t e
(b) W je množina řešení soustavy rovnic x\ — x3 = 0, x\
X3 — X4 + X5 = 0.
Řešení.
(a) W1- = <(1, 0, -1, 1, 0), (1, 3, 2, 1, -3)) ;
(b) W1- = <(1, 0, -1, 0, 0), (1, -1, 1, -1, 1)).
□
2.101. Nechť jsou v prostoru M4 dány vektory
(1,-2,2,1), (1,3,2,1).
Doplňte tyto dva vektory libovolným způsobem na ortogonální bázi celého M4. (Můžete k tomu využít Gramův-Schmidtův ortogonalizační proces.)
Řešení. Hledaných doplnění je pochopitelně nekonečně mnoho. Jedním (skutečně jednoduchým) je např.
(1,-2,2,1), (1,3,2,1), (1,0,0,-1), (1,0,-1,1).
Kořeny tohoto polynomu jsou vlastní čísla matice A. Jeli A matice zobrazení / : V -» V v jisté bázi, pak \A — XE\ nazýváme také charakteristický polynoni^obraz^ní^^^^^^^
Protože je charakteristický polynom lineárního zobrazení / : V -» V nezávislý na volbě báze V, jsou i jeho koeficienty u jednotlivých mocnin proměnné k skaláry vyjadřující vlastnosti zobrazení /, tj. nemohou záviset na naší volbě báze. Zejména jako jednoduché cvičení na počítání determinantů vyjádříme koeficienty u nejvyšších a nejnižších mocnin (předpokládáme dim V = n a matici zobrazení A = (útý) v nějaké bázi):
i n — l
*2 + vislé.
\A-k-E\= (-1)"A" + (-\)n-l(an + • • • + ann) ■ k + --- + \A\-k°.
Koeficient u nejvyšší mocniny říká jen, zda je dimenze prostoru V sudá nebo lichá. O determinantu matice zobrazení jsme už zmiňovali, že vyjadřuje, kolikrát dané lineární zobrazení zvětšuje objemy.
Zajímavé je, že i součet diagonálních členů matice zobrazení nezávisí na volbě báze. Nazýváme jej stopa matice a značíme TrA. Stopa zobrazení je definována jako stopa jeho matice v libovolné bázi. Ve skutečnosti to natolik překvapivé není, protože v kapitole osmé si jako příklad na metody diferenciálního počtu ukážeme, že stopa je ve skutečnosti lineárním přiblížením determinantu v okolí jednotkové matice, viz ??.
V dalším si uvedeme několik podstatných vlastností vlastních podprostoru.
2.47. Věta. Vlastní vektory lineárního zobrazení f : V —> V příslušné různým vlastním hodnotám jsou lineárně nezá-
Důkaz. Nechť a\, ... ,ak jsou různé vlastní hodnoty j.1 „ zobrazení / a u\, ..., uk vlastní vektory s těmito vlastními hodnotami. Důkaz provedeme indukcí přes počet lineárně nezávislých vektorů mezi zvolenými, f5 Předpokládejme, že u\, ..., ui jsou lineárně nezávislé a ul+i = JZ CíUí je jejich lineární kombinací. Alespoň i = 1 lze zvolit, protože vlastní vektory jsou nenulové. Pak ovšem f(ul+1) = al+1 ■ ul+1 = al+1 ■ q • ut, tj.
f(ul+1) = ^al+1 ■ Ct ■ ut = • /("/) = XIQ ' ai ' Ui'
Odečtením druhého a čtvrtého výrazu v rovnostech dostáváme 0 = $ľí=i(ai+i ~ ai)' ci' ■ uiVšechny rozdíly vlastních hodnot jsou však nenulové a alespoň jeden koeficient q je nenulový. To je spor s předpokládanou nezávislostí U\, . . . , Ui, takže i vektor ul+i musí být lineárně nezávislý na předchozích. □
114
KAPITOLA 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
Na právě dokázané tvrzení se můžeme podívat jako na rozklad lineárního zobrazení / na součet jednoduchých zobrazení. Pro vesměs různé vlastní hodnoty kt charakteristického polynomu budeme dostávat jednorozměrné vlastní pod-postory Vii. Každý z nich pak zadává projekci na tento invariantní jednorozměrný podprostor, na němž je zobrazení dáno jako násobení vlastním číslem A;. Celý prostor V je tak rozložen na přímý součet jednotlivých vlastních podpro-storů. Navíc lze tento rozklad na vlastní podprostory snadno spočíst:
' báze z vlastních vektorů
Důsledek. Jestliže existuje n navzájem různých kořenů charakteristického polynomu zobrazení f : V -» V, na n— rozměrném prostoru V, pak existuje rozklad V na přímý součet vlastních podprostorů dimenze 1. To znamená, že existuje báze V složená výhradně z vlastních vektorů a v této bázi má f diagonální matici. Tato báze je určená jednoznačně až na pořadí prvků.
Příslušnou bázi (vyjádřenou v souřadnicích vzhledem k libovolně zvolené bázi V) obdržíme řešením n systémů homogenních lineárních rovnic o n neznámých s maticemi (A — Xi ■ E), kde A je matice f ve zvolené bázi.
2 . 44
2.48. Invariantní podprostory. Viděli jsme, že každý vlastní vektor v zobrazení / : V -» V generuje podprostor (v) C V7, který je zobrazením / zachováván.
Obecněji říkáme, že vektorový podprostor W C V je invariantní podprostor pro lineární zobrazení /, jestliže platí f(W) C W.
Jestliže je V konečněrozměrný vektorový prostor a vybereme nějakou bázi (u\, ..., uk) podprostorů W, můžeme ji vždy doplnit na bázi (u\, ..., uk, uk+\, ■ ■ ■, un) celého V a v každé takové bázi má naše zobrazení matici A tvaru
3a
(2.5)
C D
kde S je čtvercová matice dimenze k, D je čtvercová matice dimenze n — k a C je matice typu n/(n — k). Naopak, jestliže je v nějaké bázi (u\, ..., un) matice zobrazení / tvaru (2.5), je W = (u\, ..., uk) invariantní podprostor zobrazení /.
Pochopitelně bude v naší matici zobrazení (2.5) sub-matice C nulová právě tehdy, když bude i podprostor (uk+i, ..., un) generovaný doplněnými vektory báze invariantní.
Z tohoto pohledu jsou vlastní podprostory lineárního zobrazení extrémní případy invariantních podprostorů a zejména v případě existence n = dim V různých vlastních čísel zobrazení / dostáváme rozklad V na přímý součet n vlastních podprostorů. V příslušné bázi z vlastních vektorů má pak naše zobrazení diagonální tvar s vlastními čísly na diagonále.
□
2.102. Nalezněte nějakou ortonormální bází podprostorů Vet, kde V = {(x\, x2, x3, x4) e M4 | x\ + 2x2 + x3 = 0}.
Řešení. Vidíme, že čtvrtá souřadnice se v omezení na podprostor nevyskytuje, bude tedy vhodné volit jeden z vektorů hledané ortonormální báze vektor (0, 0, 0, 1) a redukovat problém do prostoru M3. I dále se zkusíme vyhnout počítání: vidíme, že položíme-li druhou souřadnici rovnu nule, tak ve vyšetřovaném prostoru leží vektory s opačnou první a třetí souřadnicí, zejména jednotkový vektor (-^, 0, — -pj, 0). Na tento vektor je kolmý libovolný vektor, který má stejnou první a třetí souřadnici. Abychom se dostali do uvažovaného podprostorů, volíme druhou souřadnici rovnu záporné hodnotě součtu první a třetí souřadnice a normujeme, tedy volíme vektor (-^, — ^,0) a jsme hotovi. □
2.103. Věta (2.50) nám dává do ruky nástroje, jak poznat matici rotace v M3: má tři různá vlastní čísla s absolutní hodnotou 1, jedno z nich je přímo číslo 1 (jemu příslušný vlastní vektor je osa rotace). Argument zbylých dvou, tedy nutně komplexně sdružených, vlastních čísel potom udává úhel rotace v kladném smyslu v rovině určené bazí ux +ul, i[ux - ÍZX].
Určete, jaké lineární zobrazení zadává matice
Řešení. Již známým postupem zjistíme, že matice má následující vlastní čísla a jim příslušné vlastní vektory: 1, (1,2,0);
3 + ^5i, 1, (1, 1 +i, -1
0; \ - \i, (1, 1 - i, -1 + 0- Jde tedy o
5 1 ' v ' 1 ' '-"5 5
matici rotace (všechna vlastní čísla mají absolutní hodnotu 1 a jedna z vlastních hodnot je přímo 1), navíc víme, že se jedná o rotaci o arccos(|)) = 0, 2957T a to v kladném smyslu. □
115
I. BÁZE A SKALÁRNÍ SOUČINY
4. VLASTNOSTI LINEÁRNÍCH ZOBRAZENÍ
2 . 36 |
2.49. Ortogonální zobrazení. Podívejme se teď na speciální případ zobrazení / : V -» W mezi prostory se skalárními součiny, která zachovávají velikosti pro všechny vektory u e V.
Definice ortogonálních zobrazení j,.
Lineární zobrazení / : V -» W mezi prostory se skalárním součinem se nazývá ortogonální zobrazení, jesltiže pro všechny u e V
(f (u), f (u)) = (u, u).
Věta. Nechť V je reálný vektorový prostor se skalárním součinem a f : V -» V je lineární zobrazení. Pak f je ortogonální, právě když v některé ortonormální bázi (a pak už ve všech) má matici A splňující AT = A-1.
Z linearity / a ze symetrie skalárního součinu vyplývá pro všechny dvojice vektorů rovnost
(f(u + v), f(u + v)) = (f(u), f(u)) + (f(v), f (v))
+ 2(f(u),f(v)).
Proto všechny ortogonální zobrazení splňují i zdánlivě silnější požadavek, aby platilo pro všechny vektory u, v e V
(f(u),f(v)) = (u,v).
V úvodní diskusi o geometrii v rovině jsme ve Větě 1.33 dokázali, že lineární zobrazení M2 -» M2 zachovává velikosti vektorů, právě když jeho matice ve standardní bázi (a taje ortonormální vzhledem ke standardnímu skalárnímu součinu) splňuje AT ■ A = E, tj. A-1 = AT.
Obecně, ortogonální zobrazení / : V -» W musí být vždy injektivní, protože podmínka (f(u), f (u)) = 0 znamená i (u, u) = 0 a tedy u = 0. Je tedy vždy v takovém případě dimenze oboru hodnot alespoň taková, jako je dimenze definičního oboru /. Pak ovšem je dimenze obrazu rovna dimenzi oboru hodnot a víme, že / : V -> Im / je bijekce. Pokud Im/ W, doplníme ortonormální bázi na obrazu / na ortonormální bázi cílového prostoru a matice zobrazení bude obsahovat čtvercovou regulární matici A doplněnou nulovými řádky na potřebnou velikost. Bez újmy na obecnosti tedy předpokládejme W = V.
Naše podmínka pro matici ortogonálního zobrazení v ortonormální bázi pak říká pro všechny vektory x a y v prostoru K" toto:
(A • x)T ■ (A • y) = xT ■ (AT ■ A) ■ y = xT ■ y.
Speciálními volbami vektorů standardní báze za x a y dostaneme přímo, že AT ■ A = E, tedy tentýž výsledek jako v dimenzi dvě. Dokázali jsme tak následující tvrzení:
-| Matice ortogonálních zobrazení j.
1
116
KAPITOLA 2. ELEMENTÁRNI LINEÁRNI ALGEBRA
Důkaz. Skutečně, jestliže zachováva / velikosti, musí mít uvedenou vlastnost v každé ortonormální bázi. Naopak, předchozí výpočet ukazuje, že vlastnost matice v jedné bázi už zaručuje zachovávání velikostí. □
Čtvercovým maticím, které splňují rovnost AT = A~l říkáme ortogonální matice.
Důsledkem předchozí věty je také popis všech matic přechodu S mezi ortonormálními bázemi. Každá totiž musí zadávat zobrazení W -» W zachovávající velikosti a splňují tady také právě podmínku 5_1 = ST. Při přechodu od jedné ortonormální báze ke druhé se tedy matice (libovolných) lineárních zobrazení mění podle vztahu
A' = STAS.
2.50. Rozklad ortogonálního zobrazení. Podívejme se nyní podrobněji na vlastní vektory a vlastní čísla ortogonálních zobrazení na reálném vektorovém prostoru V se skalárním součinem.
Uvažujme pevně zvolené ortogonální zobrazení / : V -» V s maticí A v nějaké ortonormální bázi a zkusme postupovat obdobně jako s maticí rotace D v příkladu 2.58.
Nejprve se ale podívejme obecně na invariantní podpro-story ortogonálních zobrazení a jejich ortogonální doplňky. Jestliže pro libovolný podprostor W C V a ortogonální zobrazení / : V -» V platí f(W) C W, pak také platí pro všechny v e W^, w e W
(f(v), w) = (f(v), f o f~\w)) = (v, f~\w)) = 0
protože i f~l(w) e W. To ale znamená, že také f (W^) C W-1. Dokázali jsme tedy jednoduché, ale velice důležité tvrzení:
Tvrzení. Ortogonální doplněk k invariantnímu podprostoru je také invariantní.
Kdyby byla vlastní čísla ortogonálního zobrazení reálná, zaručovalo by už toto tvrzení, že bude vždy existovat báze V z vlastních vektorů. Skutečně, zúžení f na ortogonální doplněk invariantního podprostoru je opět ortogonální zobrazení, takže můžeme do báze přibírat jeden vlastní vektor za druhým, až dostaneme celý rozklad V. Nicméně většinou nejsou vlastní čísla ortogonálních zobrazení reálná. Musíme si proto pomoci opět výletem do komplexních vektorových prostorů. Zformulujeme rovnou výsledek:
Rozklad ortogonálních zobrazení
Věta. Nechť f : V —> V je ortogonální zobrazení na prostoru se skalárním součinem. Pak všechny kořeny charakteristického polynomu f mají velikost jedna a existuje rozklad V na jednorozměrné vlastní podprostory odpovídající vlastním číslům X = ± 1 a dvourozměrné podprostory P^l, na kterých působí f rotací o úhel rovný argumentu komplexního čísla X v kladném směru. Všechny tyto různé podprostory jsou po dvou ortogonální.
117
I. BÁZE A SKALÁRNÍ SOUČINY
4. VLASTNOSTI LINEÁRNÍCH ZOBRAZENÍ
Důkaz. Bez újmy na obecnosti můžeme pracovat s pro-c\Lg^, storem V = W" se standardním skalárním sou--*ár " činem. Zobrazení tedy bude dáno ortogonální ^g^jPs matici A, kterou můžeme stejně považovat za matici lineárního zobrazení na komplexním prostoru Cm (která je jen shodou okolností reálná). Zaručeně bude existovat právě m (komplexních) kořenů charakteristického polynomu, včetně jejich algebraické násobnosti (viz tzv. základní věta algebry, ??). Navíc, protože charakteristický polynom zobrazení bude mít výhradně reálné koeficienty, budou tyto kořeny buď reálné, nebo půjde o dvojice komplexně sdružených kořenů k a k. Příslušné vlastní vektory v Cm k takové dvojici komplexně sdružených vlastních čísel budou řešením dvou komplexně sdružených systémů homogenních lineárních rovnic, neboť příslušné matice systémů rovnic jsou celé reálné, až na samotná dosazená vlastní čísla. Evidentně proto budou také řešení těchto systémů komplexně sdružené vektory.
Nyní využijeme skutečnost, že ke každému invariantnímu podprostoru je i jeho ortogonální doplněk invariantní. Nejprve si najdeme všechny vlastní podprostory V±1 příslušné k reálným vlastním hodnotám a zúžíme naše zobrazení na ortogonální doplněk k jejich součtu. Bez újmy na obecnosti tedy můžeme předpokládat, že naše ortogonální zobrazení nemá žádná reálná vlastní čísla a že je dim V = 2n > 0.
Zvolme nyní nějaké vlastní číslo k a označme ux vlastní vektor příslušný k vlastnímu číslu k = a + i/3, f3 ^ 0. Zcela stejně jako v případě rotace v rovině zadané v odstavci 2.58 maticí D nás zajímá reálná část součtu dvou jednorozměrných podprostoru (ux) ®{úx), kde úx je vlastní vektor příslušný k vlastnímu číslu k.
Jde o průnik uvedeného součtu komplexních podprostoru s M2", který je generovaný vektory ux + úx a i(ux — úx), tj. reálný vektorový podprostor Px c M2" generovaný bazí danou reálnou a imaginární částí ux
xx=ľeux, -yx = -imux.
Protože A ■ (ux + úx) = kux +kúx a. podobně s druhým bázovým vektorem, jde zjevně o invariantní podprostor vůči násobení maticí A a dostáváme
A ■ xx = otxx + fíyx, A-yx = -ayx + fixx.
Protože naše zobrazení zachovává velikosti, musí být navíc velikost vlastní hodnoty k rovna jedné. To ale neznamená nic jiného, než že zúžení našeho zobrazení na Px je rotací o argument vlastní hodnoty k. Všimněme si, že volba vlastního čísla k místo k vede na stejný podprostor se stejnou rotací, pouze ji dostaneme vyjádřenou v bázi xx, yx, tj. musíme v souřadnicích rotovat o úhel s opačným znaménkem.
Důkaz celé věty tím dokončen, protože zúžením našeho zobrazení na ortogonální doplněk a opakováním předchozí úvahy dostaneme celý rozklad po n krocích. □
118
KAPITOLA 2. ELEMENTÁRNI LINEÁRNI ALGEBRA
K myšlenkám tohoto důkazu se ještě vrátíme v kapitole třetí, když budeme studovat komplexní rozšíření euklidovských vektorových prostorů, viz 3.23.
Poznámka. Specielně v dimenzi tři musí být alespoň jedno vlastní číslo ±1, protože je trojka liché číslo. '"^"T^"'*1 ovšem příslušný vlastní podprostor je osou Ctr rotace trojrozměrného prostoru o úhel daný ar-v'/lr-r- gumentem dalších vlastních čísel. Zkuste si rozmyslet, jak poznat, kterým směrem jde rotace a také, že vlastní číslo — 1 znamená ještě dodatečné zrcadlení podle roviny kolmé na osu rotace.
K diskusi vlastností matic a lineárních zobrazení se budeme vracet. Před pokračováním obecné teorie si napřed ukážeme v následující kapitole několik aplikací, ještě ale uzavřeme naši diskusi obecnou definicí:
* Spektrum lineárního zobrazení _
32 2.51. Definice. Spektrum lineárního zobrazení f : V -» V (resp. matice) je posloupnost kořenů charakteristického polynomu zobrazení /, včetně násobností. Algebraickou násobností vlastní hodnoty rozumíme její násobnost jakožto kořenu charakteristického polynomu, geometrická násobnost vlastní hodnoty je dimenze příslušného podprostoru vlastních vektorů.
Spektrálním poloměrem lineárního zobrazení (matice) je , největší z absolutní hodnot vlastních čísel.
V této terminologii můžeme naše výsledky o ortogonálních zobrazeních zformulovat tak, že jejich spektra jsou vždy celá podmnožinou jednotkové kružnice v komplexní rovině. To znamená, že v reálné části spektra mohou být pouze hodnoty ±1, jejichž algebraické a geometrické násobnosti jsou stejné. Komplexní hodnoty spektra pak odpovídají rotacím ve vhodných dvourozměrných podprostorech, které jsou na sebe po dvou kolmé.
j. doplňující príklady k cele kapitole
4. vlastnosti lineárních zobrazeni
ves0016
J. Doplňující příklady k celé kapitole
2.105. Řešte soustavu
x\ -\- X2 ~\~ X3 -\- X4 — 2X5
2X2 + 2x3 + 2x4 — 4X5
— x\ — X2 — X3 -\- X4 -\- 2x5
—2xi + 3x2 + 3x3 — 6x5 Řešení. Rozšířená matice soustavy je
3, 5, 0, 2.
/ 1 1 1 1 -2 3 \
0 2 2 2 -4 5
-1 -1 -1 1 2 0
V "2 3 3 0 -6 2/
Přičtením prvního řádku ke třetímu a jeho dvojnásobku ke čtvrtému a poté přičtením (—5/2)násobku druhého řádku ke čtvrtému obdržíme
/1 1 1 1 -2 3 \ / 1 1 1 1 -2 3 \
0 2 2 2 -4 5 0 2 2 2 -4 5
0 0 0 2 0 3 0 0 0 2 0 3
5 5 2 -10 8 / 0 0 -3 0 -9/2 /
Poslední řádek je zřejmě násobkem předposledního, a tak jej můžeme vynechat. Pivoti se nacházejí v 1., 2. a 4. sloupci, proto jsou volné proměnné X3 a X5, které nahradíme reálnými parametry t, s. Uvažujeme tak soustavu
Xi +
x2 2x2
+ +
t 2t
+ +
X4
2s 4s
3, 5, 3.
Víme tedy, že x4 = 3/2. Druhá rovnice dává
2x2 + 2t + 3 - 4s = 5, tj. x2 = 1 - t + 2s. z první potom plyne
xi + 1 - t + 2s + t + 3/2 - 2s = 3, tj. Xi = 1/2.
Celkem máme (2.5)
(Xi, X2, X3, X4, X5)
(1/2, \ -t + 2s,t, 3/2, s), t,s €
Také v tomto příkladu znovu uvažujme rozšířenou matici a převeďme ji pomocí řádkových úprav do schodovitého tvaru, kde první nenulové číslo v každém řádku je 1 a kde ve sloupci, ve kterém tato 1 je, jsou ostatní čísla 0. Ještě připomeňme, že čtvrtou rovnici, jež je kombinací prvních třech rovnic, budeme vynechávat. Po řadě vynásobením druhého a třetího řádku číslem 1 /2, odečtením třetího řádku od druhého a od prvního a odečtením druhého řádku od prvního získáme
0
1 1 1 1 -2 3^
0 2 2 2 -4 5
0 0 0 2 0 3^
1 1 1 0 -2 3/2
0 1 1 0 -2 1
0 0 0 1 0 3/2
1 0 0 0 0 0 110-2 0 0 0 1 0
120
KAPITOLA 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
Pokud opět zvolíme s (t, s € M), dostaneme odsud obecné řešení (2.5) ve stejném tvaru,
a to bezprostředně. Uvažte příslušné rovnice
Xi
x2 +
2s
1/2, 1, 3/2.
□
2.106. Najděte řešení soustavy lineárních rovnic zadané rozšířenou maticí
/ 3 3 2 1 3 \
2 1 1 0 4
0 5 -4 3 1
\5 3 3 -3 5/
Řešení. Uvedenou rozšířenou matici upravíme na schodovitý tvar. Nejprve první a třetí řádek opíšeme a do druhého řádku napíšeme součet (—2)násobku prvního a 3násobku druhého řádku a do čtvrtého řádku součet 5násobku prvního a (—3)násobku posledního řádku. Takto získáme
/ 3 3 2 1 3 \ / 3 3 2 1 3 \
2 1 1 0 4 0 -3 -1 -2 6
0 5 -4 3 1 0 5 -4 3 1
\5 3 3 -3 5 ) ^ 0 6 1 14 0/
Opsání prvních dvou řádků a přičtení 5násobku druhého řádku k 3násobku třetího a jeho 2násobku ke čtvrtému řádku dává
2
-1 -17 -1
/ 3 0 0
-1
-4
1
1
-2 3
14
3 \
1
0/
/ 3 0 0
V 0
o o
1
-2 -1 10
3 \
33
12/
Pokud první, druhý a čtvrtý řádek opíšeme a ke třetímu přičteme čtvrtý, dostaneme
/ 3 3 2 1 3 ( 3 3 2 1 3 \
0 -3 -1 -2 6 0 -3 -1 -2 6
0 0 -17 -1 33 0 0 -18 9 45
0 -1 10 12 ) \0 0 -1 10 12 /
Dále je (řádkové úpravy jsou již „obvyklé")
/ 3 3 2 1 3 \ / 3 3 2 1 3 \
0 -3 -1 -2 6 0 -3 -1 -2 6
0 0 -18 9 45 0 0 2 -1 -5
\o 0 -1 10 12 J V 0 0 1 -10 -12 J
/ 3 3 2 1 3 / 3 3 2 1 3 \
0 -3 -1 -2 6 0 -3 -1 -2 6
0 0 1 -10 -12 0 0 1 -10 -12
0 2 -1 -5 J \0 0 0 19 19 /
Vidíme, že soustava má právě 1 řešení. Určeme ho zpětnou eliminací
/ 3 0 0
o o
1 o
1
-2 -10
3 \
-12
/ 3 0 0
0
o
1 o
o o
0
1
2 \ 8
-2 1 /
121
J. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE
4. VLASTNOSTI LINEÁRNÍCH ZOBRAZENÍ
/ 3 3 0 0 6 \ /1 1 0 0 2 \
0 -3 0 0 6 0 1 0 0 -2
0 0 1 0 -2 0 0 1 0 -2
0 0 1 1 ) v 0 0 0 1 1 /
/1 0 0 0 4 \
0 1 0 0 -2
0 0 1 0 -2
v 0 0 0 1 1 )
Výsledek je tak
X\ = 4, x2 = —2, x3 = —2, Xi\ = 1.
2.107. Uvedlte všechna řešení homogenního systému
x + y = 2z + v, z + 4w + v = 0, — 3« =0, z = —v 4 lineárních rovnic 5 proměnných x, y, z, u, v.
Řešení. Systém přepíšeme do matice tak, že v prvním sloupci budou koeficienty u x, ve druhém sloupci koeficienty u y, až v pátém sloupci koeficienty u v, přičemž všechny členy v každé rovnici převedeme na levou stranu. Tímto způsobem přísluší systému matice
/l 1 -2 0 -l\
0 0 14 1
0 0 0-30
\0 0 1 0 1 /
Přičteme-li (4/3)násobek třetího řádku ke druhému a odečteme-li poté druhý řádek od čtvrtého, obdržíme
/l 1 -2 0 -l\ /l 1 -2 0 -l\ 0 0 1 4 1 0 0 1 0 1
000 -3 0 ~000 -3 0 \0 0 1 0 1/ \0 00 0 OJ
Dále vynásobíme třetí řádek číslem —1/3 a přičteme 2násobek druhého řádku k prvnímu, což dává
/l 1 -2 0 -l\ /l 1 0 0 l\
0 0 1 0 1 0 0 1 0 1
00 0 -3 0 ~00010
\0 0 0 0 0 / \0 0 0 0 0/
Z poslední matice můžeme přímo vypsat všechna řešení
ř, s e
neboť máme matici ve schodovitém tvaru, přičemž první nenulové číslo v každém řádku je 1 a ve sloupci, kde se taková 1 nachází, jsou na ostatních pozicích 0. Výše uvedené řešení ve tvaru lineární kombinace dvou vektorů je určeno právě sloupci bez prvního nenulového čísla nějakého řádku, tj. druhým a pátým sloupcem, kdy volíme 1 jako druhou složku pro druhý sloupec a jako pátou složku pro pátý sloupec a kdy čísla v příslušném sloupci bereme s opačným znaménkem a umisťujeme je na
/x\ /-1\ /-1\
y 1 0
z = t 0 + s -1
u 0 0
\v) \°) V 1 /
122
KAPITOLA 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
pozici danou sloupcem, ve kterém je první 1 v jejich řádku. Dodejme, že výsledek je ihned možné přepsat do tvaru
(x, y, z, u, v) = (—t — s, t, —s, 0, s) , t,s € M.
□
123
J. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE
4. VLASTNOSTI LINEÁRNÍCH ZOBRAZENI
Řešení cvičení
2.8. Taková matice X existuje právě jedna, a to
18 -32 5 -
10 -4\
2.13. A-1 = 1 12 -5
V> 5 -v
(2 -3 0 0 o\
-5 8 0 0 0
2.14. 0 0 -1 0 0
0 0 0 -5 2
0 0 3 -v
(0 1 1 o\
2.15. C"1 = 1 2 0 1 1 -1 0 0 -i 0
V -1 -1 1
2.76. V prvním případě dostáváme
-i_l (3 -i
A"
ve druhém potom
2 \i 1
'14 8 5> 2 1 1 1 1 01
2.17. Platí
A =
/o i 1 ... 1\
1 0 1 ... 1
1 1 0
■-. 1
V 1 1 0/
n - 1
2.18. -3,17,-1
2.27. Odečtením prvního řádku od všech ostatních řádků a následným rozvojem podle prvního sloupce obdržíme
V„(xi,x2,.....x„) —
1 x\
0 X2 — x\ AŤ — Xj
0 JCfi x\ x^ x^
X^ X ^2 Xy •
2 0 %n %1 xn Xj"
,-r1
-Ji-l _ „"-I „n-1 _ „"-I
Xj Xj
Vytkneme-li z /-tého řádku x!+i — jq pro / e {1, 2, ..., n — 1}, dostaneme
V„(xi,x2,----x„)
1 x2 + xi ... T!}Zo 4~j~2 x[
(x2 - xi) ■ ■ • (x„ - Xl)
1 xn -\- x\ ... 2~2j—0Xn
124
KAPITOLA 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
Odečtením od každého sloupce (počínaje posledním a konče druhým) x\-násobku předcházejícího lze docílit úpravy
1 X2 + x\
1 x„ + x\
1 x-.
n-j-2 i
xn~2 x2
xl~2
Proto
V„(xi,x2, ■ ■ ■, xn) — (x2 -xi) ■ ■ ■ (xn -xi) V„-i(x2, ... ,x„). Neboť je zřejmě
V2{xn—\, Xw) — xn xn—\,
platí (uvažme matematickou indukci)
V n (-*" i • xi----,x„)— Yi (xi ~ ■
1 1, vyhovují danému vztahu. Vztah také splňuje jejich libovolná tzv. lineární kombinace, tedy posloupnost cn = san + tbn, s, t e M. Čísla s a t můžeme zvolit tak, aby výsledná kombinace splňovala dané počáteční podmínky, v našem případě c\ = \, C2 = 1. Pro jednoduchost je vhodné navíc ještě dodefinovat nultý člen posloupnosti jako c0 = 0 a spočítat s a t z rovnic pro c0 a c\. Zjistíme,
že* = -7I'ř = 7!atedy r--1 (i + Všy - (i - Všy
Bmet (3.2) pn = -—-.
- 2"(V5)
Takto zadaná posloupnost splňuje danou rekurentní formuli a navíc počáteční podmínky c0 = 0, c\ = 1, jedná se tedy o tu jedinou posloupnost, která je těmito požadavky zadána. Všimněte si, že hodnota vzorce (3.2) je celočíselná pro libolné přirozené n (zadává totiž celočíselnou Fibonacciho posloupnost), i když to tak na první pohled nevypadá. □
IniProdukt
3.2. Zjednodušený model chování hrubého národního produktu.
Uvažujme diferenční rovnici
(3.3) yk+2 - a(l + b)yk+1 + abyk = 1,
kde yk je národní produkt v roce k. Konstanta a je takzvaný mezní sklon ke spotřebě, což je makroekonomický ukazatel, který udává jaký zlomek peněz, které mají obyvatelé k dispozici, utratí, a konstanta b popisuje, jak závisí míra investic soukromého sektoru na mezním sklonu ke spotřebě.
Předpokládáme dále, že velikost národního produktu je normována tak, aby na pravé straně rovnice vyšlo číslo 1.
Spočítejte konkrétní hodnoty pro a = |,& = |,yo = l,yi = l.
Řešení. Nejprve budeme hledat řešení homogenní rovnice (pravá strana nulová) ve tvaru r*. Číslo r musí být řešením charakteristické
V pevně zvolených souřadnicích pak máme matici A zobrazení cp a souřadné vyjádření vektoru b. Jak jsme si povšimnuli už v úvodu druhé kapitoly, množina všech řešení tzv. homogenní úlohy
A ■ x = 0
je vektorovým podprostorem.
Pokud je dimenze V konečná, řekněme n, a dimenze obrazu zobrazení cp je k, pak řešením této soustavy pomocí převodu na řádkově schodovitý tvar (viz 2.7) zjistíme, že dimenze podprostoru všech řešení je právě n — k. Skutečně, protože sloupce matice zobrazení jsou právě obrazy bázových vektorů, je v matici systému právě k lineárně nezávislých sloupců a tedy i stejný počet lineárně nezávislých řádků. Proto nám zůstane při převodu na řádkový schodovitý tvar právě n — k nulových řádků. Při řešení systému rovnic nám tak zůstane právě n — k volných parametrů a dosazením vždy jednoho z nich s hodnotou jedna a vynulováním ostatních získáme právě n—k lineárně nezávislých řešení. Všechna řešení jsou pak dána právě všemi lineárními kombinacemi těchto n — k řešení. Každé takové (n — &)-tici řešení říkáme fundamentální systém řešení daného homogenního systému rovnic. Dokázali jsme:
Věta. Množina všech řešení homogenního systému rovnic
A ■ x = 0
pro n proměnných s maticí A hodnosti k je vektorovým podprostorem v W dimenze n — k. Každá báze tohoto podprostoru tvoří fundamentální systém řešení daného homogenního systému.
3.2. Nehomogenní systémy rovnic. Uvažme nyní obecný systém rovnic
A ■ x = b.
Znovu si uvědomme, že sloupce matice A jsou ve skutečnosti obrazy vektorů standardní báze v W v lineárním zobrazení cp odpovídajícím matici A. Pokud má existovat řešení, musí být b v obrazu cp a tedy musí být lineární kombinací sloupců v A.
Jestliže tedy rozšíříme matici A o sloupec b, můžeme, ale nemusíme, také zvětšit počet lineárně nezávislých sloupců a tedy i řádků. Pokud se tento počet zvětší, pak b v obrazu není a tedy systém rovnic nemůže mít řešení. Jestliže ale naopak máme stejný počet nezávislých řádků i po přidání sloupce b k matici A, znamená to, že sloupec b musí být lineární kombinací sloupců matice A. Koeficienty takové kombinace jsou právě řešení našeho systému rovnic.
Uvažme nyní dvě pevně zvolená řešení x a y našeho systému a nějaké řešení z systému homogenního se stejnou maticí. Pak zjevně
A-(x-y) = b-b = 0 A ■ (x +z) = 0 + b = b. Můžeme proto shrnout:
130
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
3.2a
3.3. Věta. Řešení nehomogenního systému lineárních rovnic A- x = b existuje právě, když přidáním sloupce b k matici A nezvýšíme počet lineárně nezávislých řádků. V takovém případě je prostor všech řešení dán všemy součty jednoho pevně zvoleného partikulárního řešení systému a všech řešení systému homogenního se stejnou maticí.
3.4. ??? ...následuje výklad několika modelů založených na systémech rovnic / lineární procesy, může být 4-5 stran
3.2b
3.5.
999
2. Diferenční rovnice
Diferenčními rovnicemi jsme se stručně zabývali již v první kapitole, byť pouze těmi prvního řádu.Nyní si ukážeme obecnou teorii pro lineární rovnice s konstantními koeficienty, která poskytuje nejen velmi praktické nástroje, aleje také pěknou ilustrací pro koncepty vektorových podprostorů a lineárních zobrazení.
Homogenní lineární diferenční rovnice řádu k ^
3.10 3.6. Definice. Homogenní lineární diferenční rovnice řádu k je dána výrazem
a0x„ + a\xn-\ H-----Y akxn-k =0, a0 ^ 0 ak ^ 0,
kde koeficienty at jsou skaláry, které mohou případně i záviset na n.
Říkáme také, že taková rovnost zadává homogenní lineární rekurenci řádu k a často zapisujeme hledanou posloupnost jako funkci
f in) = --f(n - 1) a0
-f(n-k).
a0
Řešením této rovnice nazýváme posloupnost skalárů , pro všechna i e N, případně i e Z, které vyhovují rovnici s libovolným pevným n.
Libovolným zadáním k po sobě jdoucích hodnot x; jsou určeny i všechny ostatní hodnoty jednoznačně. Skutečně, pracujeme nad polem skalárů, takže hodnoty a$ i ak jsou inverti-bilní a proto z definičního vztahu lze vždy spočíst hodnotu xn ze známých ostatních hodnot a stejně tak pro xn_k. Indukcí tedy okamžitě dokážeme, že lze jednoznačně dopočíst všechny hodnoty jak pro kladná tak pro záporná celá n.
Prostor všech nekonečných posloupností x; je vektorový prostor, kde sčítání i násobení skaláry je dáno po složkách. Přímo z definice je zjevné, že součet dvou řešení homogenní lineární rovnice nebo skalární násobek řešení je opět řešení. Stejně jako u homogenních systémů lineárních tedy vidíme, že množina všech řešení je vektorový podprostor.
Počáteční podmínka na hodnoty řešení je dána jako k-rozměrný vektor v Kk. Součtu počátečních podmínek odpovídá součet příslušných řešení a obdobně se skalárními násobky. Dále si všimněme, že dosazením nul a jedniček do
rovnice
x2 - a(l + b)x +ab = 0, tj. x2 - x + ^ = 0,
která má dvojnásobný kořen Všechna řešení homogenní rovnice jsou potom tvaru a(^)n + bn(^)n.
Dále si všimněme, že najdeme-li nějaké řešení nehomogenní rovnice (tzv. partikulární řešení), tak pokud k němu přičteme libovolné řešení homogenní rovnice, obdržíme jiné řešení nehomogenní rovnice. Lze ukázat, že takto získáme všechna řešení nehomogenní rovnice.
V našem případě (tj. pokud jsou všechny koeficienty i nehomogenní člen konstantami) je partikulárním řešením konstanta y„ = c. Dosazením do rovnice máme c — c + jc = 1, tedy c = 4. Všechna řešení diferenční rovnice
1
yk+2 - yk+i + -•>;* = 1
jsou tedy tvaru 4 + a(^)n + bn(^)n. Požadujeme y0 = yi = 1 a tyto dvě rovnice dávají a = b = —3, tedy řešení naší nehomogenní rovnice je
Ä=4-3Q)"-3„QV'
Opět, protože víme, že posloupnost zadaná touto formulí splňuje danou diferenční rovnici a zároveň dané počáteční podmínky, jedná se vskutku o tu jedinou posloupnost, která je těmito vlastnostmi charakterizována. □
V předchozím příkladu jsme použili tzv. metodu neurčitých koeficientů. Ta spočívá v tom, že na základě nehomogenního členu dané diferenční rovnice „uhodneme" tvar partikulárního řešení. Tvary partikulárních řešení jsou známy pro celou řadu nehomogenních členů. Např. rovnice
(3.4)
yn+k + fli)>„+*_! H-----h akyn = Pm(n),
kde P (m) je polynom stupně n a příslušná charakteristická rovnice má reálné kořeny má (skoro vždy) partikulární řešení tvaru Qm (n), Qm (n) je polynom stupně m.
Další možnou způsobem řešení je tzv. medota variace konstant, kdy nejprve najdeme řešení
k
y(n) = ^Cifiin)
i = l
zhomogenizované rovnice a poté uvažujeme konstanty q jako funkce ci (jí) proměnné n a hledáme partikulární řešení dané rovnice ve tvaru
k
y(n) = ^2ci(n)f(n).
i = l
131
A. REKURENTNÍ ROVNICE
2. DIFERENČNÍ ROVNICE
Ukažme si na obrázku hodnoty f pro i < 35 a rovnicí 9
f(n) = -f(n - 1)
3 1 -f(n - 2) + -, 4J ' 2
/(O) = /(l) = 1.
3.11
0 5 10 15 20 25 30 35
Dále si procvičme, jak řešit lineární diferenční rovnice druhého řádu s konstantními koeficienty. Posloupnost vyhovující dané rekurentní rovnici druhého řádu je dána jednoznačně, pokud zadáme navíc nějaké dva její sousední členy. Znovu si povšimněme dalšího využití komplexních čísel: pro určení explicitního vzorce pro n-tý člen posloupnosti reálných čísel můžeme potřebovat výpočty s čísly komplexními (to nastává tehdy, pokud má charakteristický polynomLSiiél diferenční rovnice komplexní kořeny).
3.3. Nalezněte explicitní vzorec pro posloupnost vyhovující následující lineární diferenční rovnici s počátečními podmínkami:
xnjr2 = 2xn -\- n, X\ = 2, x2 = 2.
Řešení. Zhomogenizovaná rovnice je
xn_|_2 = 2xn.
Její charakteristický polynom je x2 — 2, jeho kořeny jsou ±V2. Řešení zhomogenizované rovnice je tedy tvaru
a(V2)n + b(-V2)n, pro libovolné a,beR.
Partikulární řešení budeme hledat metodou neurčitých koeficientů. Nehomogenní část dané rovnice je lineární polynom n, partikulární řešení proto budeme nejprve hledat ve tvaru lineárního polynomu v proměnné n, tedy kn + l, kde k, l e M. Dosazením do původní rovnice dostáváme
k(n + 2) + l = 2(kn +l)+n. Porovnáním koeficientů u proměnné n na obou stranách rovnice dostáváme vztah k = 2k + 1, tedy k = — 1, porovnáním absolutních členů pak vztah 2k + l = 21, tedy l = —2. Celkem je tedy partikulárním řešením je posloupnost —n — 2.
zadávaných počástečních k hodnot snadno získáme k lineárně nezávislých řešení naší rovnice. Jakkoliv jsou tedy zkoumané vektory nekonečné posloupnosti skalárů, samotný prostor všech řešení je konečněrozměrný, předem víme, že jeho dimenze bude rovna řádu rovnice k, a umíme snadno určit bázi všech těchto řešení. Opět hovoříme o fundamentálním systému řešení a všechna ostatní řešení jsou právě jejich lineární kombinace.
3.7. Řešení homogenních rekurencí s konstantními koeficienty. Těžko bychom hledali univerzální postup, jak hledat řešení obecných homogenních lineárních diferenčních rovnic, tj. přímo spočítatelný výraz pro obecné řešení xn.
V praktických modelech ale velice často vystupují rovnice, kde jsou koeficienty konstantní. V tomto přípdě se daří uhodnout vhodnou formu řešení a skutečně se nám podaří najít k lineárně nezávislých možností. Tím budeme mít problém vyřešený, protože všechny ostatní budou jejich lineární kombinací.
Pro jednoduchost začneme rovnicemi druhého řádu. Takové potkáváme obzvlášť často v praktických problémech, kde se vyskytují vztahy závisející na dvou předchozích hodnotách. Lineární diferenční rovnicí druhého řádu s konstantními koeficienty tedy rozumíme předpis
(3.1)
f(n + 2) = a ■ f(n + 1) + b ■ f (n) + c,
kde a, b, c jsou známé skalární koeficienty.
Např. v populačních modelech můžeme zohlednit, že jedinci v populaci dospívají a pořádně se rozmnožují až o dvě období později (tj. přispívají k hodnotě f (n +2) násobkem b ■ f (n) s kladným b > 1), zatímco nedospělí jedinci vysílí a zničí část dospělé populace (tj. koeficient a může být i záporný). Navíc si je třeba někdo pěstuje a průběžně si ujídá konstantní počet c < 0.
Speciálním takovým příkladem s c = 0 je např. Fibo-nacciho posloupnost čísel y0, y\, ..., kde yn+2 = y„+i + y„.
Jestliže při řešení matematického problému nemáme žádný nový nápad, vždy můžeme zkusit, do jaké míry funguje známé řešení podobných úloh. Zkusme proto dosadit do rovnice (3.1) s koeficientem c = 0 podobné řešení jako u rovnic lineárních, tj. f (ji) = k" pro nějaké skalární k. Dosazením dostáváme
k'
n+2
ak
n + l
bk" =kn(k2 -ak-b) =0.
Tento vztah bude platit buď pro k = 0 nebo při volbě hodnot
kt = ^(a + V'a2 + 4b), k2 = ^(a - y'a2 + 4b).
Zjistili jsme tedy, že skutečně opět taková řešení fungují, jen musíme vhodně zvolit skalár k. To nám ale nestačí, protože my chceme naj ít řešení pro j akékoliv počáteční hodnoty / (0) a /(l), a zatím jsme našli jen dvě konkrétní posloupnosti splňující danou rovnici (a nebo dokonce jen jednu, pokud je
^2 = ^l)-
132
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
el. 9
3.11a
Jak jsem již dovodili i u zcela obecných lineárních reku-rencí, součet dvou řešení f\(n) a f2(n) naši rovnice f(n + 2) — a ■ f (n + \) — b ■ f (n) = 0 je zjevně opět řešením téže rovnice a totéž platí pro konstatní násobky řešení. Naše dvě konkrétní řešení proto poskytují daleko obecnější řešení
f(n) = Ci*? + C2k\
pro libovolné skaláry C\ a C2 a pro jednoznačné vyřešení konkrétní úlohy se zadanými počátečními hodnotami /(O) a /(l) nám zbývá jen najít příslušné konstanty C\ a C2. (A také si musíme ujasnit, zda to pro všechny počáteční hodnoty půjde).
3.8. Volba skalárů. Ukažme si, jak to může fungovat alespoň na jednom příkladě. Soustředíme se přitom na problém, že kořeny charakteristického polynomu nevychází obecně ve stejném oboru skalárů, jako jsou koeficienty v rovnici.
1
(3.2)
-i + -2yn
yn+2 = y„H
y0 = 2,yi= 0. V našem případě je tedy Ai_2 = ^(1 ± -v/3) a zjevně y0 = Ci + C2 = 2
73)
yi
ici(l + V3) + ic2(l
je splněno pro právě jednu volbu těchto konstant. Přímým
výpočtem C\ jediné řešení
f(n) = (1
1 — \ V3, C2 = 1 + \V3 a naše úloha má
^V3W1 + 73)" + (1 + ^V3W1 - 73)" 3 2 3 2"
Všimněme si, že i když nalezená řešení pro rovnice s celočíselnými koeficienty vypadají složitě a jsou vyjádřena pomocí iracionálních (případně komplexních) čísel, o samotném řešení dopředu víme, že je celočíselné též. Bez tohoto „úkroku" do většího oboru skalárů bychom ovšem obecné řešení napsat neuměli.
S podobnými jevy se budeme potkávat velice často. Obecné řešení nám také umožňuje bez přímého vyčíslování konstant diskutovat kvalitativní chování posloupnosti čísel /(«), tj. zda se budou s rostoucím n blížit k nějaké pevné hodnotě nebo budou oscilovat v nějakém rozsahu nebo utečou do neomezených kladných nebo záporných hodnot.
3.9. Obecný případ homogenních rekurencí s konstantními koeficienty. Zkusme nyní stejně jako v případě druhého řádu dosadit volbu xn = k" pro nějaký ( zatím neznámý) skalár k do obecné homogenní rovnice z definice 3.6. Dostáváme pro každé n podmínku
k"-k(a0kk +aikk-
• • • + fljt) = 0
což znamená, že buď k = 0 nebo je A kořenem tzv. charakteristického polynomu v závorce. Charakteristický polynom ale už není závislý na n.
Řešení dané nehomogenní diferenční rovnice druhého řádu bez počátečních podmínek jsou tedy tvaru a{~j2)n + b{—~j2)n — n — 2, a, b e R.
Nyní dosazením do počátečních podmínek určíme neznámé a, b e R. Pro početní jednoduchost použijeme malého triku: z počátečních podmínek a daného rekurentního vztahu vypočteme člen x0 : x0 = \ (x2 — 0) = 1. Daný rekurentní vztah spolu s podmínkami x0 = 1 a %\ = 1 pak zřejmě splňuje tatáž posloupnost, která splňuje původní počáteční podmínky. Máme tedy následující vztahy pro a, b:
x0: fl(v/2)0 + Ŕ(-v/2)°-2= 1, tedy a+ b = 3, x\ : ~j2a — ~j2b = 5,
jejichž řešením dostáváme a = 6+54"^, b = ^—|^. Řešením je po-
sloupnost
□
3.4. Určete reálnou bázi prostoru řešení homogenní diferenční rovnice
-"-«+4 = -"-«+3 -"-« + 1 -*-«>
Řešení. Charakteristický polynom dané rovnice je x4 — x3 — x + 1. Hledáme-li jeho kořeny, řešíme reciprokou rovnici
x4 - x3 - x + 1 = 0
Standardním postupem nejprve vydělíme rovnici výrazem x2 a poté zavedeme substituci t = x + tedy t2 = x2 + + 2. Obdržíme rovnici
t2 - t - 2 = 0,
s kořeny t\ = — 1, t2 = 2. Pro obě tyto hodnoty neznámé t pak řešíme zvlášť rovnici danou substitučním vztahem:
1
x + - = -1.
X
\ + = cos(2tt/3) +
Ta má dva komplexní kořeny x\ = i sin(27r/3) a x2 = — \ — i& = cos(27r/3) — i sin(27r/3). Pro druhou hodnotu neznámé t dostáváme rovnici
x + - = 2
x
s dvojnásobným kořenem 1. Celkem je tedy bazí hledaného vektorového prostoru posloupností, které jsou řešením dané diferenční rovnice, následující čtveřice posloupností: {—\ + i'VŠ}^, {—\ —
133
A. REKURENTNÍ ROVNICE
2. DIFERENČNÍ ROVNICE
ř'V3}^i>{l}^i (konstantní posloupnost) a {n}™=1. Hledáme-li však reálnou bázi, musíme nahradit dva generátory (posloupnosti) z této báze s komplexními hodnotami generátory reálnými. Protože tyto generátory jsou geometrické řady, jejichž libovolné členy jsou komplexně sdružená čísla, můžeme vzít jako vhodné generátory posloupnosti dané polovinou součtu, resp. polovinou /-násobku rozdílu, daných komplexních generátorů. Takto dostaneme následující reálnou bázi řešení: {1}^ (konstantní posloupnost), {n}^=v {cos(« • 2tt/3)}^=1, {&m(n-27c/3)}?=1. □
3.5. Najděte posloupnost, která vyhovuje nehomogenní diferenční rovnici s počátečními podmínkami:
Xn+2 = Xn + 1 + 2xn + 1, X\ = 2, X2 = 2.
Řešení. Obecné řešení zhomogenizované rovnice je tvaru a(— 1)" + b2". Partikulárním řešením je konstanta —1/2. Obecné řešení dané nehomogenní rovnice bez počátečních podmínek je tedy
a(-l)n+b2n
Dosazením do počátečních podmínek zjistíme konstanty a = —5/6, b = 5/6. Dané rovnici s počátečními podmínkami tedy vyhovuje posloupnost
--(-1)" + -2""1 - -. 6 ' 3 2
□
3.6. Určete posloupnost reálných čísel, která vyhovuje následující nehomogenní diferenční rovnici s počátečními podmínkami:
2xnjr2 = —xn+\ + x„ + 2, x\ = 2, X2 = 3.
Řešení. Obecné řešení zhomogenizované rovnice je tvaru a(— 1)" + b(1/2)". Partikulárním řešením je konstanta 1. Obecné řešení dané nehomogenní rovnice bez počátečních podmínek je tedy
a(-l)n+b(^j +1.
Dosazením do počátečních podmínek zjistíme konstanty a = l,b = 4. Dané rovnici s počátečními podmínkami tedy vyhovuje posloupnost
(_iy+ 4 +1.
□
Předpokládejme, že má charakteristický polynom k různých kořenů k\, ..., kk. Můžeme za tímto účelem i rozšířit uvažované pole skalárů, např. Q na M nebo M na C, protože výsledkem výpočtu pak stejně budou řešení, která opět zůstanou v původním poli díky samotné rovnici. Každý z kořenů nám dává jedno možné řešení
xn = C^ž)"-
Abychom byli uspokojeni, potřebujeme k lineárně nezávislých řešení.
K tomu nám postačí ověřit nezávislost dosazením k hodnot pro n = 0, ..., k — 1 pro k možností k{. Dostaneme tzv. Vandermondovu matici a je pěkným (ale ne úplně snadným) cvičením spočíst, že pro všechna k a jakékoliv /c-tice různých ki je determinant takovéto matice nenulový, viz příklad 2.21 na straně 83. To ale znamená, že zvolená řešení jsou lineárně nezávislá.
Nalezli jsme tedy fundamentální systém řešení homogenní diferenční rovnice v případě, že všechny kořeny jejího charakteristického polynomu jsou po dvou různé.
Uvažme nyní násobný kořen k a dosaďme do definiční rovnice předpokládané řešení xn = nk". Dostáváme podmínku
a0nkn H----+ak(n- k)kn~k = 0.
Tuto podmínku je možné přepsat pomocí tzv. derivace polynomu, kterou značíme apostrofem:
k(a0kn +■■■+ akk"-ky = 0
a hned na začátku kapitoly páté uvidíme, že kořen polynomu / je vícenásobný právě, když je kořenem i jeho derivace /'. Naše podmínka je tedy splněna.
Při vyšší násobnosti l kořenu charakteristického polynomu můžeme postupovat obdobně a využijeme skutečnosti, že £-násobný kořen je kořenem všech derivací polynomu až do l — 1 včetně. Derivace přitom postupně vypadají takto:
f(X)=a0kn + ---+akk"-k
f'(k) = aonk"-1 + ■■■+ ak(n - k)kn-k~l
f"(k) = a0n(n - l)kn~2 + ■■■+ ak(n - k)(n -k- \)kn~k
f(l+1) =a0n...(n- í)kn~1-1 + ...
+ ak(n -k)...(n-k- £)A"-^_1
Podívejme se na případ trojnásobného kořenu k a hledejme řešení ve tvaru n2k". Dosazením do definiční podmínky dostaneme rovnost
a0n2kn + ---+ak(n- k)2kn~k = 0.
Zjevně je levá strana rovna výrazu k2 f"(k) + kf'(k) a protože je k kořenem obou derivací, je podmínka splněna.
Indukcí snadno dokážeme, že i obecnou podmínku pro hledané řešení ve tvaru xn = nlkn,
a{)nlkn + ...ak(n- kfkn~k = 0,
134
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
dostaneme jako vhodnou lineární kombinaci derivací charakteristického polynomu začínající Xl+l f{l+l) + ^Xl£(£ + l)fW + ... a dostali jsme se tedy blízko k úplnému důkazu následující:
Věta. Každá homogenní lineární diferenční rovnice řádu k nad libovolným číselným oborem K obsaženým v komplexních číslech K má za množinu všech řešení k—rozměrný vektorový prostor generovaný posloupnostmi x„ = nlXn, kde X jsou (komplexní) kořeny charakteristického polynomu a mocniny £ probíhají všechna přirozená čísla od nuly až do násobnosti příslušného kořenu X.
Důkaz. Výše použité vztahy násobnosti kořenů a derivací uvidíme později, a nebudeme tu dokazovat tvrzení, že každý komplexní polynom má právě tolik kořenů, včetně násobnosti, jaký má stupeň. Zbývá tedy ještě dokázat, že nalezená /c-tice řešení je lineárně nezávislá. I v tomto případě lze induktivně dokázat nenulovost příslušného determinantu, jako jsme zmiňovali u toho Vandermondova výše. □
3.12 |
3.10. Reálné báze řešení reálných differenčních rovnic.
Pro rovnice s reálnými koeficienty povedou reálné počáteční podmínky vždy na reálná řešení. Přesto ale budou příslušná fundamentální řešení z právě odvozené věty často existovat pouze v oboru komplexním.
Zkusme proto najít jiné generátory, se kterými se nám bude pracovat lépe. Potože jsou koeficienty charakteristického polynomu reálné, každý jeho kořen bude buď také reálný nebo musí kořeny vystupovat po dvou komplexně združených.
Jestliže si řešení popíšeme v goniometrickém tvaru jako
X" = \X|" (cos n l:l, 2,3,4 — -^-•
Nyní si všimněme, že kořeny charakteristické rovnice jsme mohli „uhodnout" rovnou. Je totiž
x5 + 1 = (x + l)(x4 - x3 + x2 - X + 1),
a tedy jsou kořeny polynomu x4 — x3 + x2 — x + 1 i kořeny polynomu x5 + 1, což jsou páté odmocniny z —1. Takto dostáváme, že řešením charakteristikého polynomu jsou čísla xi 2 = cos^isin^) ax34 = cos^) ± sin(^-). Tedy reálnou bází prostoru řešení dané diferenční rovnice je například báze posloupností cos^), sin^), cosiny1) a sin(3jp-), CQ- jSQU sjny akosmy argumentů příslušných mocnin kořenů
charakteristického polynomu.
Všimněme si, že jsme mimochodem odvodili algebraické výrazy pro cos(fO = 1±fi, sin(fO = ^10~2^, cos(^) = a sin(^) = 710+2^ (vzhledem k tomu, že všechny kořeny rovnice mají absolutní hodnotu 1, tak jsou to reálné, resp. imaginární, části příslušných kořenů). □
3.8. Určete explicitní vyjádření posloupnosti vyhovující diferenční rovnici x„+2 = 2x„+i — 2x„ se členy x\ =2, x2 = 2.
Řešení. Kořeny charakteristického polynomu x2 — 2x + 2 jsou 1 + i a 1 — i. Báze (komplexního) vektorového prostoru řešení je tedy tvořena posloupnostmi y„ = (1 + ;')" a z„ = (1 — /)"■ Hledanou posloupnost můžeme vyjádřit jako lineární kombinaci těchto poslopností (s komplexními koeficienty). Je tedy x„ = a ■ yn + b ■ zn, kde a = a\ + ia2,
135
A. REKURENTNÍ ROVNICE
2. DIFERENČNÍ ROVNICE
b = b\ + ib2. Z rekurentního vztahu dopočteme x0 = \ (2xi — x2) = 0 a dosazením «=0a« = ldo uvažovaného vyjádření xn dostáváme
1 = xq = ci\ + + b\ + ib2
2 = xi = («i + /fl2)(l + 0 + (bi + 1*2)(1 - 0.
a porovnáním reálné a komplexní složky obou rovnic dostáváme lineární soustavu čtyř rovnic o čtyřech neznámých
CL\ + b\ = 1
a2 + b2 = 0
a\ - a2 + b\ + b2 = 2
ai + a2 — b\ + b2 = 0
s resenim a\ = b\ = b2 = | a a2 posloupnost vyjádřit jako 1
-112. Celkem můžeme hledanou
(--l-i)(i + iy+ {l- + l-i)(i-iy.
Posloupnost můžeme však vyjádřit i pomocí reálné báze (komplexního) vektorového prostoru řešení, totiž posloupností un = \(y„ + zn) = (V2)"cos(f) a vn = \i(Zn - y„) = (72)" sin(f). Matice přechodu od komplexní báze k reálné je
T :--
2l
3 . 14
1 1
inverzní matice je T 1 = ~. ), pro vyjádření posloupnosti xn pomocí reálné báze, tj. souřadnice (c, d) posloupnosti xn v bázi {«„, vn}, pak máme
máme tedy alternativní vyjádření posloupnosti x„, ve kterém se nevyskytují komplexní čísla (ale zase jsou v něm odmocniny):
JtB = (V2)-cos(^) + (V2)-sin(^),
které jsme samozřejmě mohli získat též řešením dvou lineárních rovnic o dvou neznámých c, d, totiž 1 = xq = c ■ uq + d ■ vq = c a 2 = x\ = c • u\ + d • v\ = c + d. □
3.9. Určete explicitní vyjádření posloupnosti vyhovující diferenční rovnici xn+2 = 3x„+i + 3x„ se členy x\ = 1 a x2 = 3.
3.10. Určete explicitní vzorec pro n-tý člen jediné posloupnosti {xn}^Li vyhovující následujícím podmínkám:
Xn-^-2 — xn + l , , X\ — 1, X2 — 5.
Postupujeme tak, že najdeme jedno řešení a přičteme celý vektorový prostor dimenze k řešení odpovídajících systémů homogenních. Skutečně takto dostáváme řešení a protože je rozdíl dvou řešení nehomogenní rovnice zjevně řešením homogenní, dostáváme takto řešení všechna.
U systémů lineárních rovnic se mohlo stát, že nemusel vůbec mít řešení. To u našich diferenčních rovnic možné není. Zato ale bývá nesnadné nalézt to jedno potřebné partikulární řešení nehomogenního systému, pokud je chování skalárních koeficientů v rovnici složité.
Omezíme se tu na jediný případ, kdy příslušný homogenní systém má koeficienty konstantní a b(n) je polynom stupně s. Řešení pak lze hledat ve tvaru polynomu
x„ = q?o + din + • • • + asns
s neznámými koeficienty a,■, i = 1, ..., s. Dosazením do diferenční rovnice a porovnáním koeficientů u jednotlivých mocnin n dostaneme systém s + 1 rovnic pro s + 1 proměnných a i. Pokud má tento systém řešení, našli jsme řešení našeho původního problému. Pokud řešení nemá, může stačit zvětšit stupeň s hledaného polynomu.
Např. rovnice xn — x„_2 = 2 nemůže mít konstantní řešení, ale dosazením xn = a0+ain dostáváme řešení a i = 1 (a koeficient a0 může být libovolný) a proto je obecné řešení naší rovnice
x„ = Ci +C2(-1)" +n.
Všimněme si, že skutečně matice příslušného systému rovnic
pro polynom nižšího stupně nula ie nulová a rovnice 0-a0 = 2 doplnit pořádněji
diskusi řešitelnosti
nema resem.
pomoci variace konstant...
3.12. Lineární filtry. Uvažujme nyní nekonečné posloupnosti
■)
i ^-n + li • • • i -X-l, Xq, X\, . . . , Xn
a budeme, podobně jako u systémů lineárních rovnic, pracovat s operací T, která zobrazí celou posloupnost x na posloupnost z = Tx se členy
Zn
ü{)Xn + a\xn-\ + ■ ■ ■ + akxn-
S posloupnostmi x můžeme opět pracovat jako s vektory vzhledem ke sčítání i násobení skaláry po složkách. Pouze bude tento velký vektorový prostor nekonečněrozměrný. Naše zobrazení T je zjevně lineárním zobrazením na takovém vektorovém prostoru.
Posloupnosti si představme jako diskrétní hodnoty nějakého signálu, odečítané zpravidla ve velmi krátkých časových jednotkách, operace T pak může být filtrem, který signál zpracovává. Bude nás zajímat, jak odhadnout vlastnosti, které takový „filtr" bude mít.
Signály jsou velice často ze své podstaty dány součtem několika částí, které jsou samy o sobě víceméně periodické. Z naší definice je ale zřejmé, že periodické posloupnosti x„, tj. posloupnosti splňující pro nějaké pevné přirozené číslo p
136
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
3.15
budou mít i periodické obrazy z = T x
Zn+p = aOxn+p + a\xn-\+p + ' ' ' + akxn-k+p = ClQXn + a\X„-i + • • • + akXn_k = Zn
se stejnou periodou p.
Pro pevné zvolenou operaci T nás bude zajímat, které vstupní periodické posloupnosti zůstanou přibližně stejné (případně až na násobek) a které budou utlumeny na nulové hodnoty.
V druhém případě tedy hledáme jádro našeho lineárního zobrazení T. To je ale dáno právě homogenní diferenční rovnicí
aoxn + a\xn-\ + • • • + akxn-k kterou jsme se naučili řešit.
0, a0 0 ak ^ 0,
3.13. Špatný equalizer. Jako příklad uvažujme velmi jednoduchý lineární filtr zadaný rovnicí
Zn
(T x)n — Xn+2 + x„.
Výsledky takového zpracování signálu jsou naznačeny na následujících čtyřech obrázcích pro postupně se zvyšující frekvenci periodického signálu xn = cos(cpn). Červený je původní signál, zelený je výsledek po zpracování filtrem. Nerovnoměrnosti křivek jsou důsledkem nepřesného kreslení, oba signály jsou samozřejmě rovnoměrnými sinusovkami.
Všimněme si, že v oblastech, kde je výsledný signál přibližně stejně silný jako původní, dochází k dramatickému doplnit podrobný posuvu fáze signálu. Levné equalizery skutečně podobně výpočet pomocí špatně f ungují.
uvedených nástrojů
3.11. Určete explicitní vzorec pro n-tý člen jediné posloupnosti ix«}^Li vyhovující následujícím podmínkám:
~xn+3 = 2xn+2 + 2xn + i + X„, X\ = 1, X2 = 1, Xj, = 1.
3.12. Určete explicitní vzorec pro n-tý člen jediné posloupnosti ix«}^Li vyhovující následujícím podmínkám:
— xn+3 = 3x„+2 + 3x„ + i + X„, X\ = 1, X2 = 1, X3 = 1.
B. Populační modely
Populační modely, kterými se budeme zabývat, budou rekurentní vztahy ve vektorových prostorech. Neznámou veličinou tedy nebude posloupnost čísel nýbrž posloupnost vektorů. Roli koeficientů pak budou hrát matice. Začneme s jednoduchým (dvourozměrným) příkladem.
3.13. Spoření. S kamarádem spoříme na společnou dovolenou následujícím způsobem. Na začátku dám 10 EUR a on 20 EUR. Každý další měsíc pak dá každý z nás tolik, co minulý měsíc plus polovinu toho, co dal ten druhý z nás předchozí měsíc. Kolik budeme mít za rok dohromady naspořeno? Kolik peněz budu platit dvanáctý měsíc?
Řešení. Obnos peněz, který budu platit n-tý měsíc já označím xn a to, co bude platit kamarád označím y„. První měsíc tedy dáme x\ = 10, yi = 20. Pro další platby můžeme psát rekurentní rovnice:
xn + l
yn+i
xn ~\~ 2^n
yn 2Xn
Pokud označíme společný vklad zn = xn+yn, pak sečtením uvedených
rovnic dostaneme vztah zn
+i
Zn ~\~ ^Zn
\zn- To je geometrická
řada a dostáváme tedy z„ = 3.(|)" 1. Za rok budeme mít celkem naspořeno z i +Z2+- ■ -+Zi2-Tento částečný součet umíme lehce spočítat
3(l + - + --- + (-)n)
.(I)12
1
1
772, 5.
Za rok tedy dohromady naspoříme přes 772 euro.
Rekurentní soustavu rovnic popisující systém spoření můžeme napsat pomocí matice následovně
xn + l \ _ I 2l| Xn
Kyn+i) ~ \\ l) \yn, Jde tedy opět o geometrickou řadu. Jejími prvky jsou teď ovšem vektory a kvocient není skalár, ale matice. Řešení lze nicméně najít obdobně
137
B. POPULAČNÍ MODELY
3. ITEROVANÉ LINEÁRNÍ PROCESY
Mocninu matice působící na vektor (jci , yi) můžeme nalézt, když vyjá-
3.16
dříme tento vektor v bázi vlastních vektorů. Charakteristický polynom
1 n„.,,„^x^„;„™^.,, _3 1
^.Přišlu-
matice je (1 — X) — j — 0 a vlastní čísla jsou tedy Ai 2 šné vlastní vektory jsou po řadě (1, 1) a (1, —1). Pro počáteční vektor (xi, yi) = (1,2) spočítáme
a proto
3 " 2
n-l
1
2 1
' 2
«-i
To znamená, že já zaplatím 12. měsíc
Xl2
12
12
130
□
eur a můj kamarád v podstatě stejně.
Poznámka. Předchozí příklad lze řešit i bez matice následujícím přepsáním rekuretní rovnice: Xn = Xn + jyn = jXn + jZn-
Předcházející příklad byl vlastně modelem růstu (v daném případě růstu množství naspořených peněz). Nyní přejděme k modelům růstu popisujícím primárně růst nějaké populace. Leslieho model růstu, který jsme detailně rozebrali v teorii, velmi dobře popisuje nejen populace ovcí (podle kterých byl sestaven), ale uplatňuje se například i při modelování následujích populací:
3.14. Zajíci podruhé. Ukažme si, jak můžeme Leslieho modelem popsat populaci zajíců na louce, kterou jsme se zaobírali v příkladu (3.1). Uvažujme, že zajíci umírají po dovršení devátého měsíce věku (v původním modelu byl věk zajíců neomezen). Označme počty zajíců (resp. zaječic) podle stáří v měsících v čase t (měsíců) jako x\(ŕ), x2(t),..., x9(t), tak počty zajíců v jednotlivých věkových skupinách budou po jednom měsíci x\(t + 1) = x2(ř) + x3(ř) + • • • + x9(t), Xi(t + 1) = Xi-\(t), pro i = 2,3, ..., 10, neboli
/*l(í +1)\ ŕ 1 1 1 1 1 1 1
x2(ř+ 1) i 0 0 0 0 0 0 0 0 x2(ř)
x3(ř+ 1) 0 1 0 0 0 0 0 0 0 x3(ř)
x4(ř+ 1) 0 0 1 0 0 0 0 0 0 x4(ř)
x5(ř+ 1) = 0 0 0 1 0 0 0 0 0 x5(ř)
x6(ř+ 1) 0 0 0 0 1 0 0 0 0
x7(ř+ 1) 0 0 0 0 0 1 0 0 0 x7(ř)
xx(t+ 1) 0 0 0 0 0 0 1 0 0 n(t)
\x9(ř+ 1)/ Vo 0 0 0 0 0 0 1 0/ \x9(ř)/
Charakteristický polynom uvedené matice je X9 — X1 — X6 — X5 — X4 — X3 —X2 —X—1. Kořeny této rovnice nejsme schopni explicitně vyjádřit, jeden z nich však velmi dobře odhadnout, Xi = 1, 608 (proč muls menší než (>/5 + l)/2)?). Populace bude tedy podle tohoto modelu růst přibližně s geometrickou řadou 1, 608ř.
3. Iterované lineární procesy
3.14. Iterované procesy. V praktických modelech se často setkáváme se situací, kdy je vývoj systému v jednom časovém období dán lineárním procesem, zajímáme se ale o chování systému po mnoha iteracích. Často přitom samotný lineární proces zůstává pořád stejný, z pohledu našeho matematického modelu tedy nejde o nic jiného než opakované násobení stavového vektoru stále stejnou maticí.
Zatímco pro řešení systémů lineárních rovnic jsme potřebovali jen minumum znalostí o vlastnostech lineárních zobrazení, k pochopení chování iterovaného systému budeme účelně používat znalosti vlastních čísel, vlastností vlastních vektorů a další strukturní výsledky.
V jistém smyslu se pohybujeme v podobném prostředí jako u lineárních rekurencí a skutečně můžeme náš popis filtrů v minulých odstavcích takto také popsat. Představme si, že pracujeme se zvukem a uchováváme si stavový vektor
-k+l)
všech hodnot od aktuální až po poslední, kterou ještě v našem lineárních filtru zpracováváme. V jednom (ve vzorkovací frekveci audio signálu mimořádně krátkém) časovém intervalu pak přejdeme ke stavovému vektoru
f «+i
+i'
-k+2),
kde první hodnota xn+\ = a\xn + ■ ■ ■ + akxn-k+\ je spočtena jako u homogenních diferenčních rovnic, ostatní si jen posunujeme o jednu pozici a poslední zapomeneme. Příslušná čtvercová matice řádu k, splňující Yn+i = A ■ Yn, bude vypadat takto:
a2 . a-k\
1 0 . 0 0
0 1 ' 0 0
\o 0 . 1 0/
Pro takovou jednoduchou matici jsme si odvodili explicitní postup pro úplné řešení otázky, jak vypadá formule pro řešení. Obecně to tak snadno nepůjde ani pro velice podobné systémy. Jedním z typických případů je studium dynamiky populací v různých biologických systémech.
Všimněme si také, že vcelku pochopitelně má matice A za charakteristický polynom právě p(X) = Xk — aiXk~l — ■ ■ ■ — ak (snadno dovodíme pomocí rozvoje podle posledního sloupce a rekurencí). To je snadno vysvětlitelné přímo, protože řešení xn = X", X ^ 0 vlastně nyní znamená, že matice A vynásobením převede vlastní vektor (Xk, ..., X)T na jeho A-násobek. Musí být tedy X vlastním číslem matice A.
3.15. Model růstu populací. Představme si, že zkoumáme nějaký systém jednotlivců (pěstovaná zvířata, hmyz, buněčné kultury apod.) rozdělený do m skupin (třeba podle stáří, fází
138
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
vývoje hmyzu apod.). Stav X„ je tedy dán vektorem
X„ = (u\, ..., um)T
závisejícím na okamžiku ŕ„, ve kterém systém pozorujeme. Lineárni model vývoje takového systému je dán maticí A dimenze n, která zadává změnu vektoru Xn na
Xn+i = A ■ Xn
při přírůstku času z tk na tk+i.
Uvažujme jako příklad tzv. Leslieho model růstu, ve kterém vystupuje matice
/ fl h h ■ ■ ■ fm-l fm\
ti 0 0 ... o o
0 r2 0 ... 0 0 A = 0 0 r3 ' • • 0 0 '
\0 0 0 ... rm_! 0/
jejíž parametry jsou svázány s vývojem populace rozdělené do m věkových skupin tak, že ft označuje relativní plodnost příslušné věkové skupiny (ve sledovaném časovém skoku vznikne z N jedinců v /-té skupině ftN jedinců nových, tj. ve skupině první), zatímco r; je relativní úmrtnost /-té skupiny během jednoho období. Pochopitelně lze použít takový model s libovolným počtem věkových skupin.
Všechny koeficienty jsou tedy nezáporná reálná čísla a čísla r jsou mezi nulou a jedničkou (a pokud jsou všechna rovna jedné, jde vlastně o lineární rekurenci s konstantními koeficienty). Než se pustíme do obecnější teorie, trochu si pohrajeme s tímto konkrétním modelem.
Přímým výpočtem pomocí Laplaceova rozvoje podle posledního sloupce spočteme charakteristický polynom pm (k) matice A pro model s m skupinami:
pm(k) = det(A-kE) = -Apm_1(A)+(-l)m_1/mTi ... rm_i.
Vcelku snadno dovodíme indukcí, že tento charakteristický polynom má tvar
PmW = (—l)m(km — a\km 1 — ••• — am-\k — am)
s vesměs nezápornými koeficienty a\, ... ,am, pokud jsou všechny prametry r; a ft kladné. Např. je vždy am =
f m t\ ■ ■ ■ tm — 1 -
Zkusme kvalitativně odhadnout rozložení kořenů polynomu pm, detaily budeme umět přesně vysvětlit a ověřit až po absolvování příslušných partií tzv. matematické analýzy v kapitole páté a později. Vyjádříme si
pm(k) = ±km(l-q(k))
kde q(k) = a\k~l + ■ ■ ■ + amk~m je ostře klesající a nezáporná funkce pro k > 0. Evidentně bude proto existovat právě jedno kladné k, pro které bude q(k) = 1 a tedy také pm (k) = 0. Jinými slovy, pro každou Leslieho matici existuje právě jedno kladné reálné vlastní číslo.
Pro skutečné Leslieho modely populací bývají všechny koeficienty r; i /} mezi nulou a jedničkou a typicky nastává
3.15. Jezírko. Mějme jednoduchý model jezírka, ve kterém žije populace bílé ryby (plotice, ouklej, podoustev, ostroretka atd.). Předpokládáme, že druhého roku se dožije 20 % rybího plůdku a od tohoto stáří už jsou ryby schopny se reprodukovat. Z mladých ryb přežije z druhého do třetího roku přibližně 60 % a v dalších letech je už úmrtnost zanedbatelná. Dále předpokládáme, že roční přírůstek nových plůdků je třikrát větší než počet ryb (schopných reprodukce).
Tato populace by evidentně jezírko brzy přeplnila. Rovnováhu chceme dosáhnout nasazením dravé ryby, např. štiky. Předpokládejme, že jedna štika sní ročně asi 500 dospělých bílých ryb. Kolik štik pak musíme do jezírka nasadit, aby populace stagnovala?
Řešení. Pokud označíme p počet plůdku, m počet mladých ryb a r počet dospělých ryb, pak je stav populace v dalším roce popsán následovně:
p\ / 3m + 3r \ m I I 0, 2p I ,
r J y0, 6m + rr J
kde 1 — r je relativní úmrtnost dospělé ryby způsobená štikou. Příslušná matice popisující tento model je tedy
0 3 3\ 1,2 0 0 0 0,6 r j
Pokud má populace stagnovat, pak musí mít tato matice vlastní hodnotu 1. Jinými slovy, jednička musí být kořenem charakteristického polynomu této matice. Ten je tvaru k2(r — k)+0, 36—0, 6.(r —k) = 0. To znamená, že r musí splňovat
r - 1 +0, 36-0, 6(r - 1) = 0 0, 4r - 0, 04 = 0
Do dalšího roku tedy může přežít jen 10 % z dospělých ryb a zbytek by měla sníst štika. Označíme-li hledaný počet štik x, pak dohromady sní 500x ryb, což by mělo odpovídat podle předchozího výpočtu 0, 9r. Poměr počtu bílé ryby ku počtu štik by tedy měl být r- = ^j. To je přibližně jedna štika na 556 kusů bílé ryby. □ Obecněji můžeme zpracovat předcházející model takto:
3.16. Nechť je v populačním modelu dravec-kořist určen vztah mezi počtem dravců Dk a kořisti Kk v daném a následujícím měsíci (k e N U {0}) lineárním systémem
(a)
Djt+i = 0,6Dk + 0,5*:*,
Kk+l = -0,l6Dk + 1,2 Kk\
(b)
Djt+i = 0,6 Dk + 0,5*:*,
Kk+l = -0.175D* + 1,2*:*;
139
B. POPULAČNÍ MODELY
3. ITEROVANÉ LINEÁRNÍ PROCESY
(c)
Dk+i Kk+i
0,6Dk + 0,5**, -0, 135 D* + l,2Kk.
Analyzujte chovaní tohoto modelu po velmi dlouhé době.
Řešení. Všimněme si, že jednotlivé varianty se od sebe navzájem liší pouze v hodnotě koeficientu u Dk ve druhé rovnici. Můžeme proto všechny tři případy vyjádřit jako
:s)-(aJií) •(£:)• »«"■
kde budeme postupně klást a = 0, 16, a = 0, 175, a = 0, 135. Hodnota koeficientu a zde reprezentuje průměrný počet kusů kořisti zahubených jedním (očividně „nenáročným") dravcem za měsíc. Při označení
bezprostředně dostáváme
Dk Kk
0,6 0,5 a 1,2
D0
K0
keN.
Pomocí mocnin matice T tak můžeme určit vývoj populací dravce a kořisti po velmi dlouhé době. Snadno stanovíme vlastní čísla
(a) Xi
(b) Xi
(c) Xi
1, A2 = 0,8;
0, 95, X2 = 0, 85;
1,05, A2 = 0,75
matice T a jim (při zachování pořadí) příslušné vlastní vektory
(a) (5,4)r, (5,2)r;
(b) (10,7)r, (2, l)T;
(c) (10,9)r , (10, 3)T. Pro k € N tudíž platí
(a)
3. lř
5 5 4 2
1 0 0 0, 8
(b)
(c)
10 2 7 1
10 10
9 3
0,95 0
1,05 0
0 0, 85
0 0,75
10 2 7 1
10 10
9 3
situace, kdy jediné reálné vlastní číslo Xi je větší nebo rovno jedné, zatímco absolutní hodnoty ostatních vlastních čísel jsou ostře menší nezjedná.
Jestliže začneme s libovolnýmn stavovým vektorem X, který bude dán jako součet vlastních vektorů
X = X\ + • • • + Xm
s vlastními hodnotami A;, pak při iteracích dostáváme
Ak ■ X = X\X\ + ... XkmXm,
takže za předpokladu, že < 1 pro všechna i > 2, budou všechny komponenty ve vlastních podprostorech velmi rychle mizet, kromě kompomenty XiX\. Rozložení populace do věkových skupin se tak budou rychle blížit poměrům komponent vlastního vektoru k dominantnímu vlastnímu číslu k\.
Například pro matici (uvědomme si význam jednotlivých koeficientů, jsou převzaty z modelu pro chov ovcí, tj. hodnoty r zahrnují jak přirozený úhyn tak případné aktivity chovatelů na jatkách)
0.2 0
0.8 0 0
/ 0 0.95 0 0 0
V
vyjdou vlastní hodnoty přibližně
0.8 0 0
0.7 0
0.6 0 0 0
0.6
0\ 0 0 0
0/
1.03, 0, -0.5, -0,27 + 0.74/, -0.27 -0.74/
s velikostmi 1.03, 0, 0.5, 0.78, 0.78 a vlastní vektor příslušný dominantnímu vlastnímu číslu je přibližně
x = (30 27 21 14 8).
Zvolili jsme rovnou jediný vlastní vektor se součtem souřadnic rovným stu, zadává nám proto přímo výsledné procentní rozložení populace.
Pokud bychom chtěli místo tříprocentního celkového růstu populace setrvalý stav a předsevzali si ujídat více ovce třeba z druhé věkové skupiny, řešili bychom úlohu, o kolik máme zmenšit r2, aby bylo dominantní vlastní číslo rovno jedné.
3.16. Matice s nezápornými prvky. Reálné matice, které nemají žádné záporné prvky mají velmi speciální vlastnosti.
J ť ť J J ť tady by se hodilo
Zároveň jsou skutečně časté v praktických modelech. Nazna- trochu historie, číme proto teď proto tzv. Perronovu-Frobeniovu teorii, která
-L a näznäciiTie cäsi
se právě takovým maticím věnuje.
naznačíme cast výsledků Perrona, k
Začneme definicí několika pojmů, abychom mohli naše obecneja situaci se úvahy vůbec formulovat. vůbec
nedopracujeme.
Kladné a primitivní matice
Definice. Za kladnou matici budeme považovat takovou čtvercovou matici A, jejíž všechny prvky a^ jsou reálné a ostře kladné. Primitivní matice je pak taková čtvercová matice A, jejíž nějaká mocnina Ak je kladná.
Odtud dále pro velká k plyne
140
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
Připomeňme, že spektrálním poloměrem matice a nazývame maximum absolutních hodnot všech jejích (komplexních) vlastních čísel. Spektrálním poloměrem lineárního zobrazení na (konečněrozměrném) vektorovém prostoru rozumíme spektrální poloměr jeho matice v některé bázi. Normou
2
matice Aeř nebo vektoru x e W rozumíme součet absolutních hodnot všech jejich prvků. U vektorů x píšeme pro jejich normu \x\.
Následující výsledek je mimořádně užitečný a snad i dobře srozumitelný. Jeho důkaz se svou náročností dosti vymyká této učebnici, uvádíme ale alespoň jeho stručný nástin. Pokud by čtenář měl problém s plynulým čtení nástinu důkazu, doporučujeme jej přeskočit.
Věta (Perronova). Jestliže je a primitivní matice se spektrálním poloměrem ÄeK, pak je X jednoduchým kořenem charakteristického polynomu matice a, který je ostře větší než absolutní hodnota kteréhokoliv jiného vlastního čísla matice a. K vlastnímu číslu k navíc existuje vlastní vektor x s výhradně kladnými prvky x;-.
(a)
Náznak důkazu. V důkazu se budeme opírat o intuici
inspirováno materiálem na webu, viz http://www-
users.math.umd.edu/ elementární geometrie. Částečně budeme použité koncepty
~mmb/475/spec.pdf fe
upřesňovat už v analytické geometrii ve čtvrté kapitole, některé analytické aspekty budeme studovat podrobněji v kapitolách páté a později, přesné důkazy některých analytických kroků v této učebnici nepodáme vůbec. Snad budou následující úvahy nejen osvětlovat dokazovaný teorém, ale budou také samy o sobě motivací pro naše další studium geometrie i matematické analýzy. Začneme docela srozumitelně znějícím pomocným lemmatem:
Lemma. Uvažme libovolný mnohostěn P obsahující počátek 0 e W1. Jestliže nějaká iterace lineárního zobrazení ý : M" -» W1 zobrazuje P do jeho vnitřku, pak je spektrální poloměr zobrazení ý ostře menší než jedna.
Uvažme matici a zobrazení ý ve standardní bázi. Protože vlastní čísla ak jsou k-té mocniny vlastních čísel matice a, můžeme rovnou bez újmy na obecnosti předpokládat, že samotné zobrazení ý již zobrazuje P do vnitřku P. Zjevně tedy nemůže mít ý žádnout vlastní hodnotu s absolutní hodnotou větší než jedna.
Důkaz dále povedeme sporem. Předpokládejme, že existuje vlastní hodnota k s |A| = 1. Máme tedy dvě možnosti. Buďje kk = 1 pro vhodné k nebo takové k neexistuje.
Obrazem f je uzavřená množina (to znamená, že pokud se body v obrazu budou hromadit k nějakému bodu y v W, bude y opět v obrazu) a hranici P tento obraz vůbec nepro-tíná. Nemůže tedy mít ý pevný bod na hranici P ani nemůže existovat žádný bod na hranici, ke kterému by se mohly libovolně blížit body v obrazu. První argument vylučuje, že by nějaká mocnina k byla jedničkou, protože to by takový pevný bod na hranici P jistě existoval. Ve zbývajícím případě jistě existuje dvourozměrný podprostor w C M", na nějž se ý zužuje coby rotace o iracionální argument a jistě existuje bod
5 5\ (1 0\ (5 5 4 2) ' [O 0)'\4 2
j_ /-10 25\ 10 l -8 20/ '
(b)
(c)
10 2\ (0 0 7 1) ' \0 0
0 0 0 0
10 10\ /1,05* 0 9 3) ' \ 0 0
1,05* /-30 100 27 90
10 2 7 1
10 10
9 3
60
neboť právě pro velká & e N můžeme položit (a)
(b)
(c)
1 0
0 0, 8
0,95 0 0 0,85
i oy
o oř
o o o o
1,05 0 V _ /1,05* o^ 0 0,15) ~ V 0 Oj Podotkněme, že ve variantě (b), tj. pro a = 0, 175, nebylo nutné vlastní vektory počítat.
Obdrželi jsme tak
(a)
'BA 1 /-10 25\ /zV .KkJ~ 10 V-8 20J'{k0/
= J_(5 (-2A, + 5K0f 10 \4 (-2D0 + 5K0),
(b)
'DA _ (0 0\ (D0\ /0> ykk) ~\0 OJ' \Kq) \0) '
(c)
'Dk\ _ L05* /-30 100 .Kj™ 60 V -27 90
D0
K0
60
1,05* /10(-3A) + lOKo)
60 \9(-3D0 + lOKo) Tyto výsledky lze interpretovat následovně:
(a) Pokud 2Dq < 5Kq, velikosti obou populací se ustálí na nenulových hodnotách (říkáme, že jsou stabilní); jestliže 2Z)0 > 5K0, obě populace vymřou.
141
B. POPULAČNÍ MODELY
3. ITEROVANÉ LINEÁRNÍ PROCESY
(b) Obě populace vymřou.
(c) Pro3D0 < 10 K0 nastáva populační exploze obou druhů; pro 3 A) > 10v?o °bě populace vymřou.
To, že extrémně malá změna velikosti a může vést ke zcela odlišnému výsledku, je zapříčiněno neměnností hodnoty a v závislosti na velikosti obou populací. Poznamenejme, že toto omezení, kdy a v našich modelech považujeme za konstantní, nemá oporu ve skutečnosti. Přesto získáváme odhad velikosti a pro stabilní populace. □
3.17. Poznámka. Jiný model soužití populací dravce a kořisti poskytuje model pánů Lotky a Volterra, který popisuje vztah mezi populacemi soustavou dvou obyčejných diferenciálních rovnic. Podle tohoto modelu obě populace oscilují, což je i v souladu s pozorováními.
Nyní uveďme poněkud obsáhlejší model.
3.18. Model šíření jednoletých bylin. Budeme uvažovat rostliny, které na začátku léta vykvetou, na jeho vrcholu vyprodukují semena a samy uhynou. Některá ze semen vyklíčí ještě na konci podzimu (ozimé rostliny), jiná přečkají zimu v zemi a vyklíčí na začátku jara (jarní rostliny). Ozimé rostlinky (sazenice), které přes zimu nezmrznou, jsou na jaře větší než jarní a většinou z nich vyrostou větší rostliny než z jarních sazenic. Větší rostlina vyprodukuje více semen. Pak se celý vegetační cyklus opakuje.
Rok je tedy rozdělen na čtyři vegetační období a v každém z těchto
období můžeme rozlišit několik „forem" rostliny: Období stadia rostliny
začátek jara začátek léta vrcholné léto podzim
malé a velké sazenice
malé, střední a velké kvetoucí rostliny
semena
sazenice a přezimující semena
Označme x\(t), resp. x2(t), počet malých, resp. velkých, sazenic na začátku jara roku ř a y\(t), resp. y2(t), resp. y3(t), počet malých, resp. středních, resp. velkých rostlin v létě téhož roku. Z malých sazenic mohou vyrůst malé nebo střední rostliny, z velkých sazenic mohou vyrůst střední nebo velké rostliny. Kterákoliv ze sazenic samozřejmě může uhynout (uschnout, být spasena krávou a podobně) a nevyroste z ní nic. Označme bij pravděpodobnost, že ze sazenice j-té velikosti, j = 1,2, vyroste rostlina i-té velikosti, / = 1,2,3. Pak je
0 < bn < 1, bn = 0, 0 < 0 < b
hi < 1,
0 < b22 < 0,
'32 < 1, bn + hi < 1,
hi = 0,
, *22 + h2 < 1
(promyslete si, co každá z těchto nerovností vyjadřuje). Pokud pravděpodobnost považujeme za klasickou, můžeme bn vypočítat jako podíl
y v průniku W s hranicí P. Pak by ale byl bod y libovolně přesně přiblížen body z množiny (y) při průchodu přes všechny iterace a tedy by musel sám být také v obrazu. Došli jsme tedy ke sporu a lemma je ověřeno.
Nyní se dáme do důkazu Perronovy věty. Naším prvním krokem bude ověření existence vlastního vektoru, který má všechny prvky kladné. Uvažme za tím účelem tzv. standardní simplex
{x = (xi
l,Xi > 0, i = 1,
Protože všechny prvky v matici A jsou nezáporné, obraz A ■ x bude mít samé nezáporné souřadnice stejně jako x a alespoň jedna z nich bude vždy nenulová. Zobrazení x h-» \A ■ x\~l(A ■ x) proto zobrazuje S do sebe, Toto zobrazení S ^ S splňuje všechny předpoklady tzv. Browerovy věty o pevném bodě a proto existuje vektor y e 5 takový, že je tímto zobrazením zobrazen sám na sebe. To ale znamená, že
A ■ y = Xy, X = \A ■ y\
a našli jsme vlastní vektor, který leží v S. Protože ale má nějaká mocnina Ak podle našeho předpokladu samé kladné prvky a samozřejmě je také Ak-y = Xky, všechny souřadnice vektoru y jsou ostře kladné (tj. leží ve vnitřku 5) a X > 0.
Abychom dokázali zbytek věty, budeme uvažovat zobrazení zadané maticí A ve výhodnější bázi a navíc ho vynásobíme konstantou A-1:
B = X~l(Y~l -A-Y),
kde F je diagonální matice se souřadnicemi y; vektoru y na diagonále. Evidentně je B také primitivní matice a navíc je vektor z = (l,...,l)rjejím vlastním vektorem.
Jestliže nyní dokážeme, že \i = 1 je jednoduchým kořenem charakteristického polynomu matice B a všechny ostatní kořeny mají absolutní hodnotu ostře menší než jedna, bude Perronova věta dokázána.
K tomu se nám teď bude hodit dříve dokázané pomocné lemma. Uvažujme matici B jako matici lineárního zobrazení, které zobrazuje řádkové vektory
(«i
u„) h-» u ■ B
tj. pomocí násobení zprava. Díky tomu, že je z = (1, ..., 1)T vlastním vektorem matice B, je součet souřadnic řádkového vektoru v
n n
Uibi> = J2Ui = 1>
i,j=l i = l
kdykoliv je m e 5. Proto toto zobrazení zobrazuje simplex S na sebe a má také jistě v S vlastní (řádkový) vektor w s vlastní hodnotou jedna (pevný bod, opět dle Browerovy věty). Protože nějaká mocnina Bk obsahuje samé ostře pozitivní prvky, je nutně obraz simplexu S v k-té iteraci zobrazení daného B uvnitř S. To už jsme blízko použití našeho lematu, které jsme si pro důkaz připravili.
Budeme i nadále pracovat s řádkovými vektory a označme si P posunutí simplexu S do počátku pomocí vlastního
142
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
vektoru w, který jsme právě našli, tj. P = —w + S. Evidentně je P mnohostěn obsahující počátek a vektorový pod-prostor V C W generovaný P je invariantní vůči násobení maticí B násobením řádkových vektorů zprava. Zúžení našeho zobrazení na P tedy splňuje předpoklady pomocného lemmatu a proto nutně musí být všechny jeho vlastní hodnoty v absolutní hodnotě menší než jedna. Ještě se musíme vypořádat se skutečností, že právě uvažované zobrazení je dáno násobením řádkových vektorů zprava maticí B (zatímco nás původně zajímalo chování zobrazení, daného B pomocí násobení sloupcových vektorů zleva). To je ale ekvivalentní násobení transponovaných sloupcových vektorů transponovanou maticí B obvyklým způsobem zleva. Dokázali jsem tedy vlastně potřebné tvrzení o vlastních číslech pro matici transponovanou k naší matici B. Transponování ale vlastní čísla nemění.
Dimenze prostoru V je přitom n — 1, takže důkaz věty je ukončen. □
3.17. Jednoduché důsledky. Následující velice užitečné tvrzení má při znalosti Perronovy věty až překvapivě jednoduchý důkaz a ukazuje, jak silná je vlastnost primitívnosti matice zobrazení.
Důsledek. Jestliže A = (a^) je primitivní matice a x e W1 její vlastní vektor se samými nezápornými souřadnicemi a vlastní hodnotou k, pak k > Oje spektrální poloměr A. Navíc platí
foj^Oij e a, a, ŕ e K (z distributivity skalárního součinu). Tím jsme ověřili, že A1- je unitární podprostor ve V. Nechť (vi, ..., fj-) je nějaká báze (a), vybraná z prvků a, («1,..., «i) ortonormální báze vzniklá z Grammovy-Schmidtovy ortogonalizace vektorů (vi, ..., vk). Doplňme ji na ortonormální bázi celého V (obojí existuje podle již dokázaných částí věty). Protože se jedná o ortogonální bázi, je nutně {uk+\, ..., un) = (u\, ..., uic)~L = A1- a a c (uk+i, ■ ■ ■, u,,)1- (jak plyne z vyjádření souřadnic v ortonormální bázi). Je-li m _L (uk+i, ---, un), pak u je nutně lineární kombinací vektorů u i, ..., uk, to je ale právě tehdy, když je lineární kombinací vektorů v\, ..., vk, což je ekvivalentní příslušnosti u do (a).
(8) : Je pouze ekvivalentní formulací existence ortonormální báze. □
3.22. Důležité vlastnosti velikosti. Nyní máme vše připraveno pro základní vlastnosti spojené s naší definicí velikostí vektorů. Hovoříme také o normě definované skalárním součinem. Všimněme si také, že všechna tvrzení se týkají vždy konečných množin vektorů a jejich platnost proto nezávisí na dimenzi prostoru V, ve kterém se vše odehrává.
Věta. Pro libovolné vektory u, v v prostoru V se skalárním součinem platí
(1) \\u+v\\ < || m ||+ || ľ || Přitom rovnost nastane právě, když jsou u a v lineárně závislé.
(trojúhelníková nerovnost)
(2) \u ■ v\ < ||m|| ||f || Přitom rovnost nastane právě, když jsou u a v lineárně závislé.
(Cauchyova nerovnost)
(3) pro každý ortonormální systém vektorů (e\, ..., ek) platí INI2 > \u -ei|2 + ••• + \u -ek\2
(Besselova nerovnost).
(4) Pro ortonormální systém vektorů (e\, ..., ek)je vektor u v podprostorů e (e\, ... ,ek) právě když
||M||2 = |M-e1|2 + --- + |M-^|2.
(Parsevalova rovnost)
(5) Pro ortonormální systém vektorů (e\, ..., ek) a u e V je vektor
w = (u ■ !)! H-----h (u ■ ek)ek
jediným vektorem, který minimalizuje velikost \\u — v\\ pro všechny v e (e\, ..., ek).
Důkaz. Všechny důkazy spočívají v podstatě v přímých výpočtech:
tedy popisuje
Na konci týdne bude podle zadání stav popsán vektorem
0, 1 0,2\ íxB\ w . /O, 1 0,2
0,9 0,s)(xP)- MatlCe A = [0,9 0,8 náš (lineární) systém půjčování aut. Pokud má být na konci týdne v
pobočkách stejně aut jako na začátku, pak hledáme takový vektor x,
pro který platí Ax = x. To znamená, že hledáme vlastní vektor matice
A příslušný vlastnímu číslu 1.
Charakteristický polynom matice A je (0, 1—A)(0, 8—A)—0, 9.0, 2 =
(k—l)(A+0, 1) a 1 je tedy opravdu vlastní hodnota matice A. Příslušný xB\ ,„ . . . í-0,9 0,2 \ íxB
vlastní vektor x
xp) splňuje rovnici yog _02jyXp 0, 2
0.
Je to tedy násobek vektoru ( ' J. Pro zjištění procentuálního
rozložení hledáme takový násobek, aby xB + xP
vektor n (Jí; 9) = (°o, 11
Prahou je takové, že 18% aut bude v Brně a 82% aut v Praze
1. To splňuje . Správné rozložení aut mezi Brnem a
Pokud zvolíme libovolný počáteční stav x = ), pak bude stav
za n týdnů popsán vektorem x„ = A"x. Nyní je výhodné vyjádřit počáteční vektor x v bázi vlastních vektorů matice A. Vlastní vektor k vlastnímu číslu 1 už jsme našli a podobně se nalezne vlastní vektor
k vlastnímu číslu —0, 1. Tím je například vektor
-1 1
Počáteční vektor tedy můžeme vyjádřit jako lineární kombinaci '0, 2\ , Í-Ý
x=fl| |+
1
. Stav po n týdnech je pak
Druhý sčítanec se pro n —> 00 blíží nule a proto se stav ustálí na a ^j' > tedy složce počátečního vektoru ve směru prvního vlastního vektoru. Koeficient a lze jednoduše vyjádřit pomocí počátečních počtů aut: a = ^±f^. □
3.23. Sledovanost televizí. V jisté zemi vysílají jisté dvě televizní stanice. Z veřejného výzkumu vyplynulo, že po jednom roce přejde 1 /6 diváků první stanice ke druhé stanici, 1 /5 diváků druhé stanice přejde k první stanici. Popište časový vývoj počtu diváků sledujících dané stanice jako Markovův proces, napište jeho matici, nalezněte její vlastní čísla a vlastní vektory.
3.24. Studenti na přednášce. Studenty můžeme rozdělit řekněme do tří skupin - na ty, co jsou přítomni na přednášce a vnímají, na ty, co jsou rovněž přítomni, ale nevnímají a na ty, co sedí místo přednášky v hospodě. Nyní budeme hodinu po hodině sledovat, jak se mění počty studentů v těchto skupinách. Základem je vypozorovat, jaké jsou jednotlivé pravděpodobnosti změn stavu studenta. Dejme tomu, že by to mohlo být následovně:
149
C. MARKOVOVY PROCESY
4. VÍCE MATICOVÉHO POČTU
Ruleta
Student, který vnímá: s pravděpodobností 50% zůstane vnímat, 40% přestane vnímat a 10% odejde do hospody. Student, který je na přednášce a nevnímá: začne vnímat s pravděpodobností 10%, zůstane ve stejném stavu 50%, odejde do hospody 40%. Student, který sedí v hospodě má nulovou pravděpodobnost, že se vrátí na přednášku.
Jak se bude tento model vyvíjet v čase? Jak se situace změní, pokud budeme předpokládat aspoň desetiprocentní pravděpodobnost toho, že se student vrátí z hospody na přednášku (tu ovšem samozřejmě nevnímá)?
Řešení. Ze zadání se jedná o Markovovův proces s ma-/0,5 0,1 0\
ticí I 0,4 0,5 0 I. Její charakteristický polynom je \0, 1 0,4 1/
(0,5 - A)2(l - k) - 0, 4(1 — k) = 0. Evidentně je tedy 1 vlastní číslo této matice (další kořeny jsou pak 0,3 a 0,7). Postupem času se tedy studenti rozdělí do skupin tak, že stav bude
popsán příslušným vlastním vektorem. Ten je řešením rovnice -0,5 0,1 0\ /x\
0, 4 —0, 5 0 I j y I = 0, což jsou právě násobky vektoru 0, 1 0,4 0/ \z) (0.0.1). Jinými slovy, všichni studenti po čase skončí v hospodě.
Tento výsledek je zřejmý i bez počítání - tím, že je nulová
pravděpodopnost odchodu studenta do školy, se budou studenti
postupně hromadit v hospodě. Přidáním desetiprocentní možnosti
odchodu studenta do školy se toto změní. Příslušná matice bude '0, 5 0, 1 0 \
0, 4 0, 5 0, 1 I. Opět platí, že se stav usáli na vlastním vektoru v0, 1 0,4 0,9/ příslušnému vlastnímu číslu 1. Ten je v tomto případě řešením rovnice
-0,5 0, 1 0 0, 4 -0, 5 0, 1 0, 1 0,4 -0, 1
Řešením je například vektor (1, 5, 21). Poměrné rozložení studentů v
3.33
jednotlivých skupinách pak dá násobek tohoto vektoru, který ma sou čet složek roven 1, tj. vektor J=, |^). Opět tedy většina studentů
^27' 27' 27^
skončí v hospodě, někteří ale ve škole budou.
□
3.25. Ruleta. Hráč rulety má následující strategii: přišel hrát se 100 Kč. Vždy všechno, co aktuálně má. Sází vždy na černou (v ruletě je 37 čísel, z toho je 18 černých, 18 červených a nula). Hráč skončí, pokud nic nemá, nebo pokud získá 800 Uvažte tuto úlohu jako Markovův proces a napište jeho matici.
Řešení. V průběhu a na konci hry může mít hráč pouze následující peněžní obnosy (v Kč): 0,100,200,400, 800. Budeme-li nadanou situaci nahlížet jako na Markovův proces, toto budou jeho stavy a snadno také
(2): Definujme vektor w :
0< |M|2= NI2 0< IMI2IM|2 =
u-v v-v
(u-v
N ii-n
2 (« • v)
v\\z
v, tzn. w _L v a počítejme
2(u ■ v)(u ■ v) + (u ■ v)(u ■ v) l\\v\\2 > \u ■ v\2 a rovnost na-
Odtud již přímo plyne, že |N|2|| stane právě tehdy, když w = 0, tj. když jsou u a. v lineárně závislé.
(1): Opět stačí počítat ||w + i;||2 = ||«||2 + ||i;||2 + «-i; + i;-« = IN|2 + IM|2 + 2Re(M-i;)
< ||M||2+||i,||2 + 2|M.i;| < |N|2 + N|2 + 2|NIN
= (INI + IMI)2
Protože se přitom jedná o kladná reálná čísla, je opravdu || u + v || < || m || + || f ||. Navíc, při rovnosti musí nastat rovnost ve všech předchozích nerovnostech, to však je ekvivalentní podmínce, ze. u a v jsou lineárně závislé (podle předchozí části důkazu).
(3), (4): Nechť (e\, ..., ek) je ortonormální systém vektorů. Doplníme jej do ortonormální báze (e\, ..., en) (to vždy jde podle předchozí věty). Pak, opět podle předchozí věty, je pro každý vektor u e V
n n k
INI2 = J](w -ediU—e-) = J^\u -ei\2 > -gil2
i — l i — l i — l
To je ale právě dokazovaná Besselova nerovnost. Přitom rovnost může nastat právě tehdy, když u ■ e{ =0 pro všechny i > k, a to dokazuje Parsevalovu rovnost. (5): Zvolme libovolný v e {e\, ..., ek) a doplňme daný ortonormální systém na ortonormální bázi (ei, ... ,en). Nechť («i, ..., un) a (x\, ..., xk, 0, ..., 0) jsou souřadnice u av v této bázi. Pak
u-v
-xx\2-\-----\-\uk -x,t|2+N+1|2H-----H«„|2
a tento výraz je zjevně minimalizován při volbě jednotlivých vektorů x\ = u\, ..., xk = uk. □
3.23. Vlastnosti unitárních zobrazení. Vlastnosti ortogonálních zobrazení mají přímočarou obdobu v komplexním oboru. Můžeme je snadno zformulovat a dokázat společně:
Tvrzení. Uvažme lineární zobrazení (endomorfismus) cp : V —> V na prostoru se skalárním součinem. Pak jsou následující podmínky ekvivalentní:
(1) cp je unitární nebo ortogonální transformace
(2) cp je lineární isomorfismus a pro každé u, v e V platí cp(u) ■ v = u ■ cp~l(v)
(3) matice A zobrazení cp v libovolné ortonormální bázi splňuje A~l = AT (pro euklidovské prostory to znamená A~l = AT)
(4) matice A zobrazení cp v některé ortonormální bázi splňuje A~l = AT
150
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
(5) řádky matice A zobrazení (p v ortonormální bázi tvoří ortonormální bázi prostoru W se standardním skalárním součinem
(6) sloupce matice A zobrazení cp v ortonormální bázi tvoří ortonormální bázi prostoru W se standardním skalárním součinem
Důkaz. (1) =>■ (2): Zobrazení ■ (3): Standardní skalární součin je v W vždy dán pro sloupce x, y skalárů výrazem x ■ y = xT Eý, kde E je jednotková matice. Vlastnost (2) tedy znamená, že matice A zobrazení - (4): Je-li A1 = A~l v některé ortonormální bázi, pak to zaručuje platnost podmínky (2) (cp(u) ■ v = (Ax)TEý = x1EA~ly = u ■ cp~l(v)) a tedy i (3).
(4) =>■ (5) Dokazované tvrzení je vyjádřeno prostřednictvím matice A zobrazení ■ (6): Protože pro determinant platí |ArA| = \E\ = |AAr| = |A||A| = 1, existuje inverzní matice A-1. Přitom je AATA = A, proto i ATA = E což vyjadřuje právě (6).
(6) =>■ (1): Ve vybrané ortonormální bázi je
sestavíme jeho matici:
3:
a + ab + ab2 a + ab a 0 0 0
0 0 0
0 0 0
A"
/l 0
o o
o\ o o o
b 1/
a snadno zjistíme, že hra skončí s pravděpodobností a + ab + ab2 = 0, 885 prohrou a s pravděpodobností cca 0, 115 výhrou 800 Kč. (Maticí A°° vynásobíme počáteční vektor (0, 1, 0, 0, 0) a dostáváme vektor (a + ab + ab2, 0, 0, 0, b3).) □
3.26. Uvažujme situaci z předchozího případu a předpokládejme, že pravděpodobnost výhry i prohry je 1/2. Označme matici procesu A. Bez použití výpočetního software určete A100.
3.27. Roztržitý profesor. Uvažujme následující situaci: Roztržitý profesor s sebou nosí deštník, ale s pravděpodobností 1 /2 jej zapomene tam, odkud odchází. Ráno odchází do práce. V práci chodí na oběd do restaurace a zpět. Po skončení práce odchází domů. Uvažujme pro jednoduchost, že nikam jinam po dostatečně dlouhou dobu profesor nechodí a že v restauraci zůstává deštník na profesorově oblíbeném místě, odkud si ho může následující den vzít (pokud nezapomene). Uvažte tuto situaci jako Markovův proces a napište jeho matici. Jaká je pravděpodobnost, že se po mnoha dnech po ránu deštník bude nalézat v restauraci? (Je vhodné za časovou jednotku vzít jeden den - od rána do rána.)
Řešení.
'11/16 3/8 l/4> 3/16 3/8 1/4 1/8 1/4 1/2,
Spočítejme třeba prvek a\, tedy pravděpodobnost, že deštník začne den doma a skončí doma (bude tam i druhý den ráno): deštník může putovat třemi disjunktními cestami:
D Profesor ho hned ráno zapomene doma: p\ = j.
151
C. MARKOVOVY PROCESY
4. VÍCE MATICOVÉHO POČTU
DPD Profesor si ho vezme do práce, pak ho zapomene vzít na oběd a poté ho večer odnese domů: p2 = \ ■ \ ■ \ = |. DPRPD Profesor bere deštník všude a nikde ho nezapomene: p3 =
1 j_ i i
2 ' 2 ' 2 ' 2
J_ 16"
16"
Celkem a\ = p\ + p2 + p3
Vlastní vektor této matice příslušný dominantní vlastní hodnotě 1 je (2, 1, 1), je tedy hledaná pravděpodobnost 1/(2 + 1 + 1) = 4. □
3.28. Algoritmus na určování důležitosti stránek. Internetové vyhledávače umí na internetu vyhledat (skoro) všechny stránky obsahující dané slovo či frázi. Jak ale setřídit vyhledané stránky tak, aby uživatel dostal pokud možno seznam seřazený podle relevance daných stránek? Jednou z možností je následující algortitmus: soubor všech nalezených stránek považujme za systém a každou z nalezených stránek za jeden z jeho možných stavů. Popíšeme náhodné procházení těchto stránek jako Markovův proces. Pravděpodobnosti přechodu mezi jednotlivými stránkami jsou dány odkazy: každý odkaz, řekněme ze stránky A na stránku B určuje pravděpodobnost (l/(celkový počet odkazů ze stránky A)), se kterou se dostaneme ze stránky A na stránku B. Pokud z některé stránky nevedou žádné odkazy, tak ji uvažujeme jako stránku, ze které vedou odkazy na všechny ostatní. Tímto dostaneme pravděpodobnostní matici M (prvek m;i odpovídá pravděpodobnosti,
se kterou se dostaneme z i-té stránky na j-tou). Bude-li tedy človeJLnM. hodně klikat na odkazy v nalezených stránkách (pokud se dostane na stránku, ze které nevede odkaz, vybere si náhodně další), tak pravděpodobnost toho, že se v daný okamžik (dostatečně vzdálený od počátku klikání) bude nalézat na i-té stránce odpovídá i-té složce jednotkového vlastního vektoru matice M, odpovídajícího vlastnímu číslu 1. Podle velikosti těchto pravděpodobností pak určíme důležitost jednotlivých stránek.
Tento algoritmus lze modifikovat tím, že budeme předpokládat, že uživatel po nějaké době přestane klikat z odkazu na odkaz a opět začne náhodně na nějaké nové stránce. Řekněme, že s pravděpodobností d vybere náhodně novou stránku a s pravděpodobností (1-d). V takovéto situaci je nyní pravděpodobnost přechodu mezi libovolnými dvěma stránkami 5; a S j nenulová, je to totiž d/n+(l-d)/(celkový počet odkazů ze stránky Si), pokud ze stránky 5; vede odkaz na Sj, pokud ne, tak je tato pravděpodobnost d/n (1/n, pokud z 5; nevedou žádné odkazy), podle Frobeniovy-Perronovy věty je vlastní hodnota 1 jednonásobná a dominantní, takže jí odpovídající vlastní vektor je jediný (pokud bychom volili pravděpodobnosti přechodu pouze způsobem z předchozího odstavce, tak by tomu tak nemuselo být).
libovolné, pak
(piv) -(p((p~l(u)) = v -(p~l(u).
Protože je zúžení (p\V také unitární, musí to tedy být bijekce, zejména je (p~l(u) e U. Pak ovšem (p(v) ■ u = 0, protože v e U-1. To znamená, že i (p(v) e U^.
Odtud ovšem v komplexním oboru okamžitě dotáváme užitečný
Důsledek. Nechť (p : V -» V je unitární zobrazení komplexních vektorových prostorů. Pak je V ortogonálním součtem jednorozměrných vlastních podprostorů.
Důkaz. Jistě existuje alespoň jeden vlastní vektor v e V. Pak je zúžení (p na invariantní podprostor (v)1- opět unitární a jistě má opět nějaký vlastní vektor. Po n takovýchto krocích obdržíme hledanou ortogonální bázi z vlastních vektorů. Po vynormování vektorů získáme ortonormální bázi. □
Nyní už je možné snadno pochopit detaily důkazu spektrálního rozkladu ortogonálního zobrazení z 2.50 na konci druhé kapitoly — reálnou matici ortogonálního zobrazení interpretujeme jako matici unitárního zobrazení na komplexním rozšíření euklidovského prostoru a pečlivě sledujeme důsledky struktury kořenů reálného charakteristického polynomu nad komplexním oborem. Automaticky přitom dostáváme invariantní dvourozměrné podprostory zadané dvojicemi komplexně sdružených vlastních čísel a tedy příslušné rotace pro zúžené původní reálné zobrazení.
3.24. Duální a adjungovaná zobrazení. Při diskusi vektorových prostorů a lineárních zobrazení jsme již ve druhé kapitole letmo zmínili duální vektorový prostor V* všech lineárních forem na vektorovém prosotru V, viz 2.39.
Pro každé lineární zobrazení mezi vektorovými prostory Ý '■ V -» W můžeme přirozeně definovat zobrazení ty* '■ W* -» V* vztahem
{v, ý*(a)) = (ý(v), a),
kde ( , ) značí vyčíslení formy (druhý argument) na vektoru (první argument), v € V a. a € W* jsou libovolné. Zvolme si báze paľ.tcnaWa matici A pro zobrazení ty v těchto bazích. Pak snadno spočteme v duálních bazích matici zobrazení ý* v příslušných duálních bazí na duálních prostorech. Skutečně, definiční vztah říká, že pokud bychom reprezentovali vektory z W* v souřadnicích jako řádky skalárů, pak je zobrazení ý* je dáno toutéž maticí jako ty, pokud jí násobíme řádkové vektory zprava:
(Ý(v), a) = (ai, ..., an) ■ A
(v,
\v"/
{v, Ý*(a)).
To znamená, že maticí duálního zobrazení ý* je transponovaná matice AT, protože a ■ A = (AT ■ aT)T.
152
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
Předpokládejme nadále, že se pohybujeme ve vektorovém prostoru se skalárním součinem. Jestliže tedy zvolíme pevně jeden vektor v e V, dosazování vektorů za druhý argument ve skalárním součinu nám dává zobrazení v -» v* = Hom(V, K)
v b v i-» (w i-» (v, w) e K).
Podmínka nedegenerovanosti skalárního součinu nám zaručuje, že toto zobrazení je bijekcí. Zároveň víme, že jde skutečně o lineární zobrazení nad komplexními nebo reálnými skaláry, protože jsme pevně zvolili druhý argument. Na první pohled je vidět, že vektory ortonormální báze jsou takto zobrazeny na formy tvořící bázi duální, a každý vektor můžeme prostřednictvím skalárního součinu chápat také jako lineární formu.
V případě vektorových prostorů se skalárním součinem proto převádí naše ztotožnění vektorového prostoru se svým duálem také duální zobrazení ý* na zobrazení ý* '■ W -» v zadané formulí
(ý(u), v) = {u, ý*(v)),
kde stejným značením závorek nyní myslíme skalární součin. Tomuto zobrazení se říká adjungované zobrazení k \jr. Ekvivalentně lze brát poslední vztah za definici zobrazení ý*, např. dosazením všech dvojic vektorů ortonormální báze za vektory u a. v dostáváme přímo všechny hodnoty matice zobrazení ý*.
Předchozí výpočet pro duální zobrazení v souřadnicích nyní můžeme zopakovat, pouze musíme mít na paměti, že v ortonormálních bazích na unitárních prostorech vystupují souřadnice druhého argumentu konjugované:
(ý(v), w) = (wi,..., wn) ■ a ■
at ■
(v, ý*(w))
Vidíme proto, že je-li a matice zobrazení ý v ortonormální bázi, pak matice adjungovaného zobrazení ý* je matice transponovaná a konjugovaná, kterou značíme a* = ät.
Zvláštním případem lineárních zobrazení jsou tedy ty, které jsou rovny svému adjungovanému zobrazení: ý* = ý. Takovým zobrazením říkáme samoadjungovaná. Ekvivalentně můžeme říci, že jsou to ta zobrazení, jejichž matice a v jedné a tedy ve všech ortonormálních bazích splňují a = a*.
V případě euklidovských prostorů jsou samoadjungovaná zobrazení tedy ta, která mají v některé ortonormální bázi (a pak už všech) symetrickou matici. Často se jim proto říká symetrické matice a symetrická zobrazení. V komplexním oboru se maticím splňujícím a = a* říká hermiteovské matice. Všimněme si, že hermiteovské matice tvoří reálný
M
Pro názornost uvažme stránky A, B, C a D. Odkazy vedou z A na B a na C, z B na C a z C na A, z D pak nikam. Uvažujme, že pravděpodobnst toho, že uživatel náhodně zvolí novou stránku je 1/5. Potom by matice M vypadala následovně:
/1/20 1/20 17/20 l/4\
9/20 1/20 1/20 1/4
9/20 17/20 1/20 1/4
\l/20 1/20 1/20 1/4/
Vlastní vektor příslušný vlastní hodnotě 1 je (305/53, 175/53, 315/53, 1), důležitost stránek tedy bude stanovena v pořadí podle velikosti jeho odpovídajících složek, tedy C > a > B > D.
3.29. Na základě teploty ve 14.00 se rozdělují dny na teplé, průměrné a chladné. Dle celoročních statistik následuje po teplém dni teplý v polovině případů a průměrný ve 30 % případů, po průměrném dnu průměrný ve 40 % případů a chladný ve 30 % případů, po chladném dnu chladný v polovině případů a ve 30 % případů průměrný. Bez dalších informací zjistěte, kolik lze během roku očekávat teplých, průměrných a chladných dnů.
Řešení. Pro každý den musí nastav právě jeden ze stavů „teplý den", „průměrný den", „chladný den". Pokud vektor xn má za složky pravděpodobnosti toho, že jistý (označený jako n-tý) den bude teplý, průměrný, chladný (při zachování pořadí), potom složky vektoru
/0,5 0,3 0,2\ xn+l = 0, 3 0, 4 0, 3 • x„ \0,2 0,3 0,5/
udávají postupně pravděpodobnosti, že následující den bude teplý, průměrný, chladný. Pro ověření stačí dosadit
/i\ M
x„ = 0 , x„ = 1 , x„ = 0
W W vi.
přičemž např. pro třetí volbu musíme dostat pravděpodobnosti, že po chladném dnu bude následovat teplý, průměrný, chladný (v tomto pořadí). Vidíme tak, že úloha je Markovovým řetězcem s pravděpodobnostní maticí přechodu
^0,5 0,3 0^ 0,3 0,4 0,3 v0,2 0,3 0,5,
Neboť jsou všechny prvky této matice kladné, existuje pravděpodobnostní vektor
k němuž se blíží vektor x„ pro zvětšující se n nezávisle na tom, jaký byl vektor xn pro mnohem menší n. Navíc podle důsledku Perronovy-Frobeniovy věty je x^ vlastním vektorem matice T pro vlastní číslo 1.
153
C. MARKOVOVY PROCESY
4. VÍCE MATICOVÉHO POČTU
Má tedy platit
xL = 0,5*^ + 0,3x^ + 0,2x1
xl = 0,3x^ + + 0,3x1
x3 = 0,2x1 + 0,3x1 + 0,5x1
1 = 4, + x2 + x3
kde poslední podmínka znamená, že vektor x^ je pravděpodobnostní. Snadno se vypočítá, že tato soustava má jediné řešení
1 _ 2 _ 3 _ 1
XQO — XQO — XQO — ^ '
Lze tedy očekávat přibližně stejný počet teplých, průměrných a chladných dnů.
Zdůrazněme, že součet všech čísel z libovolného sloupce matice T musel být roven 1 (jinak by se nejednalo o Markovův proces). Protože TT = T (matice je symetrická), je součet všech čísel z libovolného řádku matice také roven 1. O matici s nezápornými prvky a s vlastností, že součet čísel v každém řádku a rovněž součet čísel v každém sloupci je 1, mluvíme jako o dvojnásobně (dvojitě, dvojně) stochastické. Důležitou vlastností každé dvojnásobně stochastické regfl^řg^"
matice (pro jakýkoli rozměr - počet stavů) je, že jí příslušný vektor Xoo má všechny složky stejné, tj. po dostatečně dlouhé době vyhodnocování se všechny stavy v odpovídajícím Markovově procesu jeví jako stejně časté. □
3.30. Jirka má ve zvyku si každý večer zaběhat. Má tři trasy - krátkou, střední a dlouhou. Pokud si někdy zvolí krátkou trasu, následující den si to vyčítá a rozhodne se libovolně (tj. se stejnou pravděpodobností) pro dlouhou, nebo střední. Jestliže si v některý den zvolí dlouhou trasu, v následujícím dnu volí zcela libovolně jednu z tras. Pokud běžel středně dlouhou trasu, cítí se dobře a druhý den si se stejnou pravděpodobností vybere buď střední, nebo dlouhou. Předpokládejte, že takto běhá každý večer už velmi dlouhou dobu. Jak často volí krátkou a jak často dlouhou trasu? Jaká je pravděpodobnost, že si zvolí dlouhou trasu, když si ji zvolil přesně před týdnem?
Řešení. Zřejmě se jedná o Markovův proces se třemi možnými stavy, a to volbami krátké, střední a dlouhé trasy. Toto pořadí stavů dává pravděpodobnostní matici přechodu
0 0 1/3N 1/2 1/2 1/3 ,1/2 1/2 1/3,
Stačí si uvědomit, že např. druhý sloupec odpovídá volbě střední trasy v minulém dnu, která znamená, že s pravděpodobností 1 /2 bude opět
vektorový podprostor v prostoru všech komplexních matic, není však podprostorem v komplexním oboru.
Poznámka. Obzvlášť zajímavý je v této souvislosti následující postřeh. Jestliže hermiteovskou matici A vynásobíme imaginární jednotkou, dostáváme matici B = i A, která má vlastnost B* = i ÄT = —B. Takovým maticím říkáme anti-hermiteovské. Tak jako je tedy každá reálná matice součtem své symetrické a antisymetrické části
1
1
2-(A + A') + -(A
je v koplexním oboru obdobně 1
1
2(A + A*) + -(A
AT),
A*),
tj. můžeme vyjádřit každou komplexní matici právě jedním způsobem jako součet
A = B + iC
s hermiteovskými maticemi B a C. Jde o obdobu rozkladu komplexního čísla na reálnou a ryze imaginární komponentu.
V řeši lineárních zobrazení to tedy znamená, že každý komplexní lineární automorfismus můžeme takto jednoznačně vyjádřit pomocí dvou samoadjungovaných zobrazení.
3.25. Spektrální rozklad samoadjungovaných zobrazení.
Uvažujme samoadjungované zobrazení ý '■ v -» v s maticí A v nějaké ortonormální bázi a zkusme postupovat obdobně jako v 2.50. Opět se nejprve obecně podíváme na invariantní podprostory samoadjungovaných zobrazení a jejich ortogonální doplňky. Jestliže pro libovolný podprostor w C v a samoadjungované zobrazení ý '■ v ~* v platí ý(w) C w, pak také platí pro všechny v e w^, w e w
(Ý(v), w) = (v, Ý(w)) = 0-
To ale znamená, že také ^(W-1) C w^.
Uvažme nyní matici A samoadjungovaného zobrazení v nějaké ortonormální bázi a A • x = kx pro nějaký vlastní vektor x e C". Dostáváme
k {x, x) = {Ax, x) = {x, Ax) = k (x, x).
Kladným reálným číslem (x, x) můžeme krátit a proto musí být Ä = k, tj. vlastní čísla jsou vždy reálná.
Komplexních kořenů má charakteristický polynom det(A — k E) tolik, kolik je dimenze čtvercové matice A, a všechny jsou ve skutečnosti reálné. Dokázali jsme tak důležitý obecný výsledek:
Tvrzení. Ortogonální doplněk k invariantnímu podprostoru pro samoadjungované zobrazení je také invariantní. Navíc jsou všechna vlastní čísla samoadjungované matice A vždy reálná.
Ze samotné definice je zřejmé, že zúžení samoadjungovaného zobrazení na invariantní podprostor je opět samoadjungované. Předchozí tvrzení nám tedy zaručuje, že bude vždy existovat báze v z vlastních vektorů. Skutečně, zúžení
154
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
Ý na ortogonální doplněk invariantního podprostoru je opět ortogonální zobrazení, takže můžeme do báze přibírat jeden vlastní vektor za druhým, až dostaneme celý rozklad V. Vlastní vektory příslušející různým vlastním číslům jsou navíc kolmé, protože z rovností Ý(u) = Ý(v) = lJiV vyplývá
X{u, v) = (ý(u), v) = {u, ý(v)) = fi{u, v).
Obvykle bývá náš výsledek formulován pomocí projekcí na vlastní podprostory. O projektoru P : V -» V říkáme, že je kolmý, je-li Im P _L Ker P. Dva kolmé projektory P, Q jsou vzájemně kolmé, je-li Im P _L Im Q.
Věta (O spektrálním rozkladu). Pro každé samoadjungo-vané zobrazení \js : V ^ V na vektorovém prostoru se skalárním součinem existuje ortonormální báze z vlastních vektorů. Jsou-li X\, ..., Xk všechna různá vlastní čísla f a P i, ..., Pt příslušné kolmé a navzájem kolmé projektory na vlastní podprostory, pak
f = XlPl +... + xkPk.
Dimenze obrazů těchto projektorů je přitom vždy rovna algebraické násobnosti vlastních čísel
3.26. Ortogonální diagonalizace. Zamysleme se, jak vypadají zobrazení, pro která lze najít ortonormální bázi jako v předchozí větě o spektrálním rozkladu se nazývají normální. Pro euklidovský případ je to snadné: diagonální matice jsou zejména symetrické, jedná se tedy právě o samoadjungovaná zobrazení. Jako důsledek získáváme tvrzení, že ortogonální zobrazení euklidovského prostoru do sebe je ortogonálně di-agonalizovatelné právě, když je zároveň samoadjungované (jsou to právě ta samoadjungovaná zobrazení s vlastními hodnotami ±1).
U komplexních unitárních prostorů je situace složitější. Uvažme libovolné lineární zobrazení cp : V -» V unitárního prostoru a nechť cp = + iř? Je (jednoznačně daný) rozklad cp na hermiteovskou a antihermiteovskou část. Máli cp ve vhodné ortonormální bázi diagonální matici D, pak D = reD+nmD, kde reálná a imaginární část jsou právě matice ý a f] (plyne z jednoznačnosti rozkladu). Zejména tedy platí ý °f] = < zcpocp* = cp* ocp. Zobrazení cp : V -» V s poslední uvedenou vlastností se nazývají normální.
Vzájemné souvislosti ukazuje následující věta (pokračujeme ve značení tohoto odstavce):
Tvrzení. Následující podmínky jsou ekvivalentní:
(1) cp je ortogonálně diagonalizovatelné
(2) cp* o cp = cp o cp* (tj. cp je normální zobrazení)
(3) ý 0 t] = i] 0 ý
(4) Pro matici A = (a^) zobrazení cp v nějaké ortonormální bázi a jejích m = dimV vlastních čísel A; platí
E,,Kl2 = ET=i l** l2-
Stručný důkaz. Implikaci (1) =)- (2) jsme již diskuto-
vali.
zvolena střední trasa (druhý řádek) a s pravděpodobností 1 /2 bude zvolena dlouhá trasa (třetí řádek). Neboť je
1/6 1/6 1/9^ 5/12 5/12 4/9 v5/12 5/12 4/9y
můžeme využít důsledků Perronovy-Frobeniovy věty pro Markovovy
procesy. Není obtížné vypočítat, že vlastním vektorem, který přísluší
vlastnímu číslu 1 a který je pravděpodobnostní, je právě
1 3 rT
Hodnoty 1/7,3/7,3/7 pak udávají po řadě pravděpodobnosti, že v náhodně určeném dnu volí trasu krátkou, střední, dlouhou.
Nechť si Jirka v jistý den (v čase n e N) vybere dlouhou trasu. Tomuto rozhodnutí odpovídá pravděpodobnostní vektor
xn = (0, 0, 1)T .
Pro následující den tedy platí
/O 0 1/3S
xn+l = 1/2 1/2 1/3
\l/2 1/2 1/3, až po sedmi dnech je
xn+i = T1 ■ 0 = T6 ■ |y3
Vyčíslením dostáváme jako složky xn+1 hodnoty
0,142 861225...; 0,428 569 387...; 0,428 569 387...
Tedy pravděpodobnost, že zvolí dlouhou trasu za podmínky, že si ji zvolil před sedmi dny, činí přibližně 0, 428 569 ~ 3/7 = 0, 428 571.
□
3.31. Výrobní linka nefunguje spolehlivě: jednotlivé výrobky se od sebe co do kvality nezanedbatelně liší. Navíc jistý pracovník ve snaze zvýšit kvalitu neustále zasahuje do výrobního procesu. Při rozdělení výrobků do tříd I, II, III podle kvality se zjistilo, že po výrobku třídy I následuje výrobek stejné kvality v 80 % případů a třídy II v 10 % případů, po výrobku třídy II se nezmění kvalita v 60 % případů a změní se na třídu I ve 20 % případů a že po výrobku třídy III následuje výrobek stejné kvality v polovině případů a se stejnou četností pak výrobky tříd I, II. Spočtěte pravděpodobnost, že 18. výrobek je třídy I, pokud 16. výrobek v pořadí náležel do třídy III.
Řešení. Nejprve úlohu vyřešme bez uvážení Markovova řetězce. Sledovanému jevu vyhovují případy (16. výrobek je třídy III)
• 17. výrobek byl zařazen do třídy I a 18. do třídy I;
• 17. výrobek byl zařazen do třídy II a 18. do třídy I;
155
C. MARKOVOVY PROCESY
4. VÍCE MATICOVÉHO POČTU
• 17. výrobek byl zařazen do třídy III a 18. do třídy I po řadě s pravděpodobnostmi
• 0, 25 • 0, 8 = 0, 2;
• 0, 25 • 0, 2 = 0, 05;
• 0, 5 • 0, 25 = 0, 125.
Lehce tak získáváme výsledek
0, 375 = 0, 2 + 0, 05 + 0, 125.
Nyní na úlohu nahlížejme jako na Markovův proces. Ze zadání plyne, že pořadí možných stavů „výrobek je třídy I", „výrobek je třídy II", „výrobek je třídy III" odpovídá pravděpodobnostní matice přechodu
0,8 0,2 0,25\ 0, 1 0, 6 0, 25 I . 0, 1 0, 2 0, 5 /
Situaci, kdy výrobek patří do třídy III, zadává pravděpodobnostní vektor (0, 0, 1)T. Pro následující výrobek dostáváme pravděpodobnostní vektor
0,25\ /0,8 0,2 0,25\ /0\ 0,25 = 0, 1 0,6 0,25 0 0, 5 / \0, 1 0,2 0,5 / \1/
a pro další výrobek v pořadí potom vektor
0,375\ /0, 8 0,2 0,25\ /0,25\ 0, 3 I = I 0, 1 0, 6 0, 25 0,25 , 0, 325/ \0, 1 0, 2 0, 5 / \ 0, 5 /
jehož první složka je hledanou pravděpodobností.
Doplňme, že první metoda řešení (bez zavedení Markovova procesu) vedla k výsledku zřejmě rychleji. Uvědomme si, jak výrazně by se však první metoda znepřehlednila, kdybychom např. místo 18. výrobku uvažovali 20., 22. nebo až 30. výrobek v pořadí. Ve druhé metodě se lze omezit na do jisté míry „bezmyšlenkovité" násobení (umocňování) matic. Při zavedení Markovova procesu jsme také současně vyšetřovali situace, kdy 18. výrobek náleží do tříd II a III. □
3.32. Opakovaně házíme hrací kostkou. Napište pravděpodobnostní matici přechodu T pro Markovův řetězec „maximální počet ok dosažených do n-tého hodu včetně" pro pořadí stavů 1, ..., 6. Poté určete T" pro každé n e N.
Řešení. Ihned můžeme uvést
T =
/l/6 0 0 0 0 0\
1/6 2/6 0 0 0 0
1/6 1/6 3/6 0 0 0
1/6 1/6 1/6 4/6 0 0
1/6 1/6 1/6 1/6 5/6 0
\l/6 1/6 1/6 1/6 1/6 V
(2) •<=>- (3): Stačí provést přímý výpočet
qxp* = (ý + if])(ý ~ i*)) = ý2 + + Ktfý ~ ý1!) cp* cp = (ý — + i*)) = ý2 + + kýv —
Odečtením dostaneme 2i(r)ý — Ýw)-
(2) =>■ (1): Nechť m e V je vlastní vektor normálního zobrazení cp. Pak
cp(u) ■ cp(u) = {cp*cp(u), u) = {cpcp*(u), u) = cp*(u) ■ cp*(u)
zejména tedy \cp(u)\ = \cp*(u)\. Je-li V, kterou dokážeme později v 3.32. Podle ní totiž existuje pro každé lineární zobrazení cp : V -> V ortonormální báze, ve které má cp horní trojúhelníkovou matici. Na její diagonále pak musí být právě všechny vlastní hodnoty cp. Jak jsme již ukázali, výraz ^i . |aí7|2 nezávisí na volbě ortonormální báze, proto z předpokládané rovnosti vyplývá, že všechny prvky mimo diagonálu musí být v této matici nulové. □
V termínech matic zobrazení dostáváme: zobrazení je normální právě, když jeho matice v některé ortonormální bázi (a ekvivalentně v každé) splňuje AA* = A*A. Takové matice nazýváme normální matice.
Poznámka. Všimněme si, že pro počet s lineárními zobrazeními na komplexním unitárním prostoru lze poslední větu chápat také jako zobecnění běžných počtů s komplexními čísly v goniometrickém tvaru (roli reálných čísel zde hrají sa-moadjungovaná zobrazení). Roli komplexních jednotek pak hrají unitární zobrazení. Zejména si všimněme analogie k jejich tvaru cos t + i sin t s vlastností cos2 t + sin2 t = 1:
Důsledek. Unitární zobrazení na unitárním prostoru V jsou právě ta normální zobrazení, pro která výše užívaný jednoznačný rozklad cp = \js + irj splňuje Ý2 -\- rj1 = iáV
156
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
Důkaz. Pro unitární je qxp* = id V = (p*(p a tedy qxp* = (ý + ir])(ý — iri) = \jj2 + Q + rj1 = idV. Naopak, pro normální poslední výpočet ukazuje, že opačná implikace platí také. □
3.27. Nezáporná zobrazení a odmocniny. Nezáporná reálná čísla jsou právě ta, která umíme psát jako druhé mocniny. Zobecnění takového chování pro matice a zobrazení lze vidět u součinů B = A* ■ A (tj. složení zobrazení ý* o ý):
(B ■ x, x) = (A* • A ■ x, x) = (A ■ x, A ■ x) > 0
pro všechny vektory x. Navíc zjevně
B* = (A* • A)* = A* ■ A = B.
Hermiteovských maticím B s takovou vlastností říkáme pozitivně semidefinitní a pokud nastane nulová hodnota pouze pro x = 0, pak jim říkáme pozitivně definitní. Obdobně hovoříme o pozitive definitních a a positivně semidefinitních zobrazeních ý '■ V ~* V-
Pro každé pozitivně semidefmitní zobrazení ý '■ v ~*
V umíme najít jeho odmocninu, tj. zobrazení r] takové, že r) o r) = ý. Nejjednodušeji to uvidíme v ortonormální bázi, ve které bude mít ý diagonální matici. Taková podle našich předchozích úvah vždy existuje a matice A zobrazení i/> v ní bude mít na diagonále nezáporná reálná vlastní čísla zobrazení ý. Kdyby totiž bylo některé z nich záporné, nebyla by splněna podmínka nezápornosti již pro některý z bázových vektorů. Pak ovšem stačí definovat zobrazení r] pomocí matice B s odmocninami příslušných vlastních čísel na diagonále.
3.28. Spektra a nilpotentní zobrazení. Na závěr této části se vrátíme k otázce, jak se mohou chovat lineární zobrazení v úplné obecnosti. Budeme i nadále pracovat s reálnými nebo komplexními vektorovými prostory.
Připomeňme, že spektrum lineárního zobrazení f :
V -» V je posloupnost kořenů charakteristického polynomu zobrazení /, včetně násobností. Algebraickou násobností vlastní hodnoty rozumíme její násobnost jako kořenu charakteristického polynomu, geometrická násobnost vlastní hodnoty je dimenze příslušného podprostoru vlastních vektorů.
Lineární zobrazení / : V -» V se nazývá nilpotentní, jestliže existuje celé číslo k > 1 takové, že iterované zobrazení /* je identicky nulové. Nejmenší číslo k s touto vlastností se nazývá stupněm nilpotentnosti zobrazení /. Zobrazení / : V -» V se nazývá cyklické, jestliže existuje báze (u\, ..., u„) prostoru V taková, že f(u\) = 0 a /(«;) = Ui-i pro všechna i = 2, ..., n. Jinými slovy, matice / v této bázi je tvaru
/O 1 0 . 0 0 1.
kde první sloupec je určen stavem 1 a pravděpodobností 1/6 pro jeho zachování (v dalším hodu padne 1) a pravděpodobností 1/6 jeho přechodu do libovolného ze stavů 2, ... ,6 (po řadě padne 2, ... ,6), druhý sloupec je zadán stavem 2 a pravděpodobností 2/6 pro jeho zachování (v dalším hodu padne 1 nebo 2) a pravděpodobností 1 /6 pro přechod do jakéhokoli ze stavů 3, ..., 6 (padne 3, ..., 6), až poslední sloupce získáme ze skutečnosti, že stav 6 je trvalý (pokud již padla šestka, nemůže padnout vyšší počet ok). Rovněž pro n e N lze přímo určit
( ar
(§)"-(*)" (§)"
(í)"-®" 00"-(t)n (*)"-(*'
«)"-(»" uí uí «)"-«:
V '"(Í)" MŠ)" '"(Í)"
(i)"
0\
0
o o o
1/
Hodnoty v prvním sloupci totiž odpovídají postupně pravděpodobnostem, že n-krát po sobě padne 1, n-krát po sobě padne 1 nebo 2 a alespoň jednou 2 (odečítáme proto pravděpodobnost uvedenou v prvním řádku), n-krát po sobě padne 1, 2 nebo 3 a alespoň jednou padne 3, až v posledním řádku je pravděpodobnost, že aspoň jednou během n hodů padne 6 (tu lze snadno určit z pravděpodobnosti opačného jevu). Podobně např. ve čtvrtém sloupci jsou postupně nenulové pravděpodobnosti jevů „ř2-krát po sobě padne 1, 2, 3 nebo 4", „rc-krát po sobě padne 1, 2, 3, 4 nebo 5 a alespoň jednou 5" a „alespoň jednou během n hodů padne 6". Interpretace matice T jako matice přechodu jistého Markovova procesu tak umožňuje rychlé vyjádření mocnin T", íieN. □
3.33. Sledujte určitou vlastnost daného živočišného druhu, která je podmíněna nezávisle na pohlaví jistým genem - dvojicí alel. Každý jedinec získává po jedné alele od obou rodičů zcela náhodně a nezávisle na sobě. Existují formy genu dané různými alelami a, A. Ty určují tři možné stavy aa, a A = Aa, AA vyšetřované vlastnosti.
(a) Předpokládejte, že každý jedinec jisté populace se bude rozmnožovat výhradně s jedincem jiné populace, ve které se vyskytuje pouze vlastnost podmíněná dvojicí a A. Právě jeden jejich (náhodně zvolený) potomek bude ponechán na stanovišti a také on se bude rozmnožovat výhradně s jedincem té jiné populace atd. Stanovte výskyt kombinací aa, aA, AA v uvažované populaci po dostatečně dlouhé době.
(b) Řešte úlohu uvedenou ve variantě (a), pokud je jiná populace tvořena pouze jedinci s dvojicí alel A A.
157
C. MARKOVOVY PROCESY
4. VÍCE MATICOVÉHO POČTU
(c) Náhodně zvolené dva jedince opačného pohlaví zkřížíte. Z jejich potomstva opět náhodně vyberete dva jedince opačného pohlaví, které zkřížíte. Pokud takto budete pokračovat velmi dlouho dobu, vypočtěte pravděpodobnost, že oba křížení jedinci budou mít dvojici alel AA, příp. aa (proces křížení skončí).
(d) Řešte úlohu uvedenou ve variantě (c) bez kladení podmínky, že křížení jedinci mají stejné rodiče. Pouze tedy křížíte jedince jisté velké populace mezi sebou, potom křížíte potomky mezi sebou atd.
Řešení. Případ (a). Jedná se o Markovův proces zadaný maticí
'1/2 1/4 0 1/2 1/2 1/2
0 1/4 1/2,
přičemž pořadí stavů odpovídá pořadí dvojic alel aa, a A, AA. Hodnoty v prvním sloupci plynou z toho, že potomek jedince s dvojicí alel aa a jedince s dvojicí alel a A má s pravděpodobností 1 /2 dvojici aa a s pravděpodobností 1 /2 dvojici a A. Analogicky postupujeme pro třetí sloupec. Hodnoty ve druhém sloupci potom vyplývají z toho, že každý ze čtyř případů dvojic alel aa, a A, Aa, AA je stejně pravděpodobný u jedince, jehož oba rodiče mají dvojici alel a A. Uvědomme si, že na rozdíl od počítání pravděpodobností, kdy musíme rozlišovat dvojici a A od Aa (která z alel pochází od kterého z rodičů), vlastnosti podmíněné dvojicemi a A a Aa jsou samozřejmě stejné. Pro určení výsledného stavu stačí nalézt pravděpodobnostní vektor, který přísluší vlastnímu číslu 1 matice T, protože matice
'3/8 1/4 1/8N 1/2 1/2 1/2 ,1/8 1/4 3/8,
splňuje podmínku Perronovy-Frobeniovy věty (všechny její prvky jsou kladné). Hledaný pravděpodobnostní vektor je
1 1 \xT v4' 2' 4,
což již dává pravděpodobnosti 1/4, 1/2, 1/4 výskytu po řadě kombinací aa, a A, AA po velmi dlouhé (teoreticky nekonečné) době.
Případ (b). Pro pořadí dvojic alel A A, aA,aa nyní dostáváme pravděpodobnostní matici přechodu
/l 1/2 Q\ 7=0 1/2 1 \0 0 Oj
Ihned vidíme všechna vlastní čísla 1, 1/2 a 0 (odečteme-li je od diagonály, hodnost obdržené matice nebude 3, tj. touto maticí zadaná homogenní soustava bude mít netriviální řešení). Těmto vlastním číslům
Je-li f (v) = a ■ v, pak pro každé přirozené k je fk(v) = ak ■ v. Zejména tedy může spektrum nilpotentního zobrazení obsahovat pouze nulový skalár (a ten tam vždy je).
Přímo z definice plyne, že každé cyklické zobrazení je nilpotentní, navíc je jeho stupeň nilpotentnosti roven dimenzi prostoru V. Operátor derivování na polynomech, D(xk) = kŕ~l, je příkladem cyklického zobrazení na Kn [x] pro libovolné n.
Kupodivu to platí i naopak a každé nilpotentní zobrazení je přímým součtem cyklických. Důkaz tohoto tvrzení nám dá hodně práce, proto napřed zformulujeme další výsledky a pak se teprve dáme do technické práce. Ve výsledné větě o Jordánově rozkladu vvystupují vektorové (pod)prostory a lineární zobrazení na nich s jediným vlastním číslem k a maticí
(k 1 0 ... 0\ Ok 1 ... 0
\0 0 0 ... kJ
Takovýmto maticím (a odpovídajícím invariantním podpro-storům) se říká Jordánův blok.
Věta (Jordánova věta o kanonickém tvaru). Nechť V je vektorový prostor dimenze n a f : V -» V je lineární zobrazení s n vlastními čísly včetně algebraických násobností. Pak existuje jednoznačný rozklad prostoru V na přímý součet pod-prostorů
V = V i © • • • © Vk
takových, že f (Ví) C Ví, zúžení f na každé Ví má jediné vlastní číslo kt a zúžení f — A, • id na Ví je buď cyklické nebo nulové zobrazení.
Věta tedy říká, že ve vhodné bázi má každé lineární zobrazení blokově diagonální tvar s Jordánovými bloky podél diagonály. Celkový počet jedniček nad diagonálou v takovém tvaru je roven rozdílu mezi celkovou algebraickou a geometrickou násobností vlastních čísel.
Všimněme si, že jsme tuto větu plně dokázali v případech, kdy jsou všechna vlastní čísla různá nebo když jsou geometrické a algebraické násobnosti vlastních čísel stejné. Také jsme ji plně dokázali pro unitární a samoadjungovaná zobrazení.
Také si všimněme, že v situaci, kdy jsou vlastní hodnoty v absolutní hodnotě menší nezjedná, opakované působení lineárního zobrazení na jakémkoliv vektoru v z jednoho z pod-prostorů Ví ve větě vede k rychlému zmenšování všech jeho souřadnic nad všechny meze. Skutečně, předpokládejme pro jednoduchost, že na celém V; je naše zobrazení cyklické, příslušná vlastní hodnota je k a v\, ..., vi nechť je příslušná báze. Pak podmínka z věty říká, že f(v2) = kv2 + v\, f2(vj) = k2v2 + kvi + kvi, a podobně pro ostatní vt a vyšší mocniny. V každém případě při iterování dostáváme stále vyšší a vyšší mocniny k u všech nenulových komponent.
158
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
3. 37
3.37a
Zbytek této části je věnován důkazu Jordánovy věty a několika k tomu potřebným pojmům. Je výrazně obtížnější než dosavadní text a čtenář jej může případně přeskočit až do začátku 5. části této kapitoly.
3.29. Kořenové prostory. Na příkladech jsme viděli, že vlastní podprostory popisují dostatečně geometrické vlastnosti jen některých lineárních zobrazení. Zavedeme nyní jemnější nástroj, tzv. kořenové podprostory.
Definice. Nenulový vektor u e V se nazývá kořenovým vektorem lineárního zobrazení cp : V -» V, jestliže existuje a e K a celé číslo k > 0 takové,že (cp — a-idv)k(u) =0,tj./c-tá iterace uvedeného zobrazení zobrazuje u na nulu. Množinu všech kořenových vektorů příslušných k pevnému skaláru k doplněnou o nulový vektor nazýváme kořenovým prostorem příslušným ke skaláru k e K, značíme TZx ■
Je-li u kořenový vektor ah definice je vybráno nejme-nší možné, pak (cp — a ■ idy)*-1 (u) je vlastní vektor s vlastní hodnotou a. Je tedy TZx = {0} pro všechny skaláry k, které neleží ve spektru zobrazení cp.
Tvrzení. Pro lineární zobrazení cp V -» V platí
(1) Pro každé k e Kje IZi C V vektorový podprostor.
(2) Pro každé k, fi e K je IZi invariantní vzhledem k lineárnímu zobrazení (cp — fi ■ idy), zejména tedy je IZi invariantní vzhledem k cp.
(3) Je-li fi ^ k, pak (cp — fi ■ idy)|^ je invertibilní.
(4) Zobrazení (cp — k ■ idy)|^ je nilpotentní.
Důkaz. (1) Ověření vlastností vektorového podprostoru je jednoduché a ponecháváme jej čtenáři.
(2) Předpokládejme, že (cp — k ■ idv)k(u) = 0 a uvažme v = (cp — fi ■ idv)(u). Pak
(cp—k ■ idv)k(v) =
= (Cp - k ■ Ídy)k((cp - k ■ idy) + (k — fl) ■ ÍdV)(u)
= (cp — k ■ idy)*+1(«) + (k — fi) ■ (cp — k ■ idv)k(u)
= o
(3) Je-li u € Ker(cp — n ■ idy)|^, pak
(cp — k-Ídy)(«) = (cp — fl-Ídy)(«) + (fl — k)-U = (fl — k) ■ U
Odtud 0 = (cp — k ■ idy)*(M) = (fi — k)k -Maje tedy nutně u = 0 pro k 7^ fi.
(4) Zvolme bázi e\,...,ep podprostoru TZx- Protože podle definice existují čísla kt taková, že (cp — k- idv)ki (e{) = 0, je nutně celé zobrazení (cp — k ■ idy)|^ nilpotentní. □
3.30. Faktorové prostory. Našim dalším cílem je ukázat, že dimenze kořenových prostorů je vždy rovna algebraické násobnosti příslušných vlastních čísel. Nejprve však zavedeme šikovné technické nástroje.
Definice. Nechť U c V je vektorový podprostor. Na množině všech vektorů ve V definujeme ekvivalenci takto: i>i ~ v2 právě tehdy, když vi — v2 e U. Axiomy ekvivalence
přísluší po řadě vlastní vektory
Proto je
fl -1 1 \ fl 0 0\ fl -1 1
7= 0 1 -2 0 1/2 0 0 1 -2
\0 0 1 / \0 0 0/ \0 0 1
'i-i i \ fi o o\ fi i ŕ
0 1 -2 0 1/2 0 0 1 2 v0 0 1 / \0 0 0/ \0 0 l,
Odsud pro libovolné n e N plyne
fl -1 1 \ fl 0 0\" fl 1 V T" =10 1 -2 0 1/2 0 0 1 2 \0 0 1 / \0 0 0/ \0 0 l,
'1-1 1 \ fl 0 0\ fl 1 v 0 1 -2 0 2"" 0 0 1 2 v0 0 1 / \0 0 0/ \0 0 1,
Zřejmě pro velká neN můžeme nahradit 2~" za 0, což implikuje
'i i i\ /ii ŕ
0 1 2 = 0 0 0 v0 0 1/ \0 0 Oy
Pokud tedy plodí potomky jedinci původní populace výhradně s členy populace, ve které se vyskytuje pouze dvojice alel AA, nutně po dostatečně velkém počtu křížení dojde k tomu, že dvojice aAnaa zcela vymizí (bez ohledu na jejich původní četnost).
Případ (c). Tentokráte budeme mít 6 možných stavů (v tomto pořadí)
AA, AA; aA,AA; aa,AA;
aA,aA; aa,aA; aa,aa,
přičemž tyto stavy jsou dány různými případy genotypů rodičů. Matice odpovídajícího Markovova řetězce je
(l 1/4 0 1/16
-1 M 0 0
0 1 -2 0 0 0
0 o 1 / \o 0 0
o o o o
1/2 0
1/4 0 0
1/4 1/8 1/4 1/4 1/16
0 0 0
1/4 1/2 1/4
0\ 0 0 0 0
Pokud budeme např. uvažovat situaci (druhý sloupce), kdy jeden z rodičů má dvojici alel AA a druhý a A, pak zjevně může nastat každý ze čtyř případů (jde-li o dvojice alel jejich dvou náhodně zvolených potomků)
AA, AA; AA,aA; aA, AA; aA,aA
159
C. MARKOVOVY PROCESY
4. VÍCE MATICOVÉHO POČTU
se stejnou pravdepodobností. Pravděpodobnost setrvání ve druhém stavu je proto 1/2 a pravděpodobnost přechodu ze druhého stavu do prvního je 1/4 a do čtvrtého také 1 /4.
Nyní bychom měli opět určit mocniny T" pro velká n e N. Uvážením podoby prvního a posledního sloupce ihned zjistíme, že 1 je vlastním číslem matice T. Velmi lehce lze najít vlastní vektory
(l,0,0,0,0,0)r, (0,0,0,0,0, l)T
příslušné vlastnímu číslu 1. Přechodem ke čtyřrozměrné podmatici matice T (vynecháním právě prvního a šestého řádku a sloupce) nalezneme poté zbylá vlastní čísla
1 1 l-y/5 l + VŠ
2' 4' 4 ' 4 ' Vzpomeneme-li si na řešení příkladu nazvaného Mlsný hazardér, nemusíme T" počítat. V tomto příkladu jsme dostali stejné vlastní vektory příslušné číslu 1 a ostatní vlastní čísla měla rovněž absolutní hodnotu ostře menší 1 (jejich přesné hodnoty jsme nevyužívali). Dostáváme tak totožný závěr, že proces se blíží k pravděpodobnostnímu vektoru
(a, 0,0, 0,0, 1 -af ,
kde a e [0, 1] je dáno výchozím stavem. Protože pouze na první a šesté pozici výsledného vektoru mohou být nenulová čísla, stavy
|3.37b
aA,AA; aa, AA; aA,aA; aa,aA
po mnohonásobném křížení vymizí. Uvědomme si dále (plyne z předešlého a z příkladu Mlsný hazardér), že pravděpodobnost toho, aby proces končil A A, A A, se rovná relativní četnosti výskytu A v počátečním stavu.
Případ (d). Nechť hodnoty a, b, c e [0, 1] udávají (při zachování pořadí) relativní četnosti výskytu dvojic alel AA, a A, aa v dané populaci. Chceme získat vyjádření relativních četností dvojic AA, aA, aa v potomstvu populace. Probíhá-li výběr dvojic pro páření náhodně, lze při velkém počtu jedinců očekávat, že relativní četnost páření jedinců s dvojicemi alel AA (u obou) je a2, relativní četnost páření jedinců, z nichž jeden má dvojici alel A A a druhý a A, je 2a b, relativní četnost páření jedinců s dvojicemi alel a A (u obou) je b2 atd. Potomek rodičů s dvojicemi AA, AA musí dvojici alel AA zdědit. Pravděpodobnost, že potomek rodičů s dvojicemi AA, a A bude mít AA, je zřejmě 1/2 a pravděpodobnost, že potomek rodičů s dvojicemi a A, a A bude mít A A, je pak 1 /4. Jiné případy pro potomka s dvojicí alel A A uvažovat nemusíme (pokud má jeden rodič dvojici alel aa, potomek nemůže mít dvojici AA). Relativní četnost výskytu dvojice alel AA v potomstvu
jdou ověřit snadno. Množina V/U tříd této ekvivalence, spolu s operacemi definovanými pomocí reprezentantů, tj. [v] + [w] = [v + w], a-[u] = [a-u], tvoří vektorový prostor, který nazýváme faktorový vektorový prostor prostoru V podle podprostoru U. Ověřte si korektnost definice operací a platnost všech axiomů vektorového prostoru!
Třídy (vektory) ve faktorovém prostoru V/U budeme často označovat jako formální součet jednoho reprezentanta se všemi vektory podprostoru U, např. u+U e V/U, u e V. Nulový vektor ve V/U je právě třída 0 + U, tj. vektor u e V reprezentuje nulový vektor ve V/U právě, když je u e U.
Jako jednoduché příklady si rozmyslete V/{0} = V, V/V = {0} a faktorový prostor roviny M2 podle libovolného jednorozměrného podprostoru, kde každý jednorozměrný podprostor U C M2 je přímka procházející počátkem, třídy ekvivalence jsou rovnoběžky s touto přímkou.
Tvrzení. Nechť U C V je vektorový podprostor a u\, ..., u„ je taková báze V, ze u\, ..., uk je báze U. Pak dim V/U = n — k a uk+\ + U, ..., u„ + U je báze V/U.
Důkaz. Protože V = (u\, ..., dotsun), je i V/U = {u\ + U, ... ,un + U). Přitom ale je prvních k generátorů nulových, takže je V/U = (uk+i + U, ... ,un + U). Předpokládejme, že ak+i ■ (uk+i + U) + ■ ■ ■ + an ■ (un + U) = (ak+i - uk+i + ■ ■ - + an - un) + f/ = 0e V/U. To je ale ekvivalentní příslušnosti lineární kombinace vektorů uk+i, ... ,un do podprostoru U. Protože U je generováno zbylými vektory, je nutně tato kombinace nulová, tj. všechny koeficienty a{ jsou nulové. □
3.31. Indukovaná zobrazení na faktorových prostorech.
Předpokládejme, že U C V je invariantní podprostor vzhledem k lineárnímu zobrazení cp : V -> V a zvolme bázi u\, ..., un prostoru V, že prvních k vektorů této báze je bazí
U. V této bázi má cp polorozpadlou matici A = ^ ^j.
Pak budeme umět dokázat následující tvrzení:
Lemma. (1) Zobrazení cp indukuje lineární zobrazení cpv/u : V/U -+ V/U, cpv/u (v + U) = cp(v) + U s maticí D v indukované bázi uk+\ + U, ..., u„ + U na V/U.
(2) Charakteristický polynom cpv/u dělí charakteristický polynom cp.
Důkaz. Pro v, w e V, u e U, a e K máme cp(v + u) e cp(v) + U (protože U je invariantní), (cp(v) + U) + (cp(w) + U) = cp(v + w) + U a a ■ (cp(v) + U) = a ■ cp(v) + U = cp(a ■ v) + U (protože cp je lineární), je tedy zobrazení cpV/u dobře definované a lineární. Navíc je přímo z definice matice zobrazení patrné, že matice cpV/u v indukované bázi na V/U je právě matice D (při počítání obrazů bázových prvků nám koeficienty z matice C přispívají pouze do třídy U). Charakteristický polynom indukovaného zobrazení cpV/u je tedy \D — k ■ E\, zatímco charakteristický polynom původního zobrazení^ je \A — k ■ E\ = \B — k ■ E\\D - k ■ E\. □
160
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
3.37c
Důsledek. Nechť V je vektorový prostor nad K dimenze n a nechť cp : V -» V je lineární zobrazení, jehož spektrum obsahuje n prvků (tj. všechny kořeny charakteristického polynomu leží v K a počítáme je včetně násobnosti). Pak existuje posloupnost invariantních podprostorů {0} = Vo C V\ C • • • C V„ = V s dimenzemi dim V; = i. V bázi u\, ..., u„ prostom V takové, že Vi = (u\, ..., u{), má cp horní trojúhelníkovou matici:
Ai •••
\ 0 ... kn
kde k\, ..., k„ je posloupnost prvků spektra.
Důkaz. Konstrukci podprostorů Ví provedeme induktivně. Nechť ki, ... ,kn jsou prvky ve spektru zobrazení cp, tzn. charakteristický polynom zobrazení cp je tvaru (k — k\) ■ ■ ■ ■ ■ (k — kn). Zvolme Vb = {0}, V\ = {u\), kde u\ je libovolný vlastní vektor s vlastní hodnotou k\. Podle předešlé věty je charakteristický polynom zobrazení cpv/vx tvaru
(k — k2).....(k — kn). Předpokládejme, že jsme již sestrojili
lineárně nezávislé vektory u\, ..., uk a invariantní podpro-story Ví = («i ..., Ui), i = 1, ..., k < n, takové, že charakteristický polynom cpv/Vk je tvaru (k — kk+i).....(k — kn)
a cp(ui) e (ki ■ Ui + Ví-i) pro všechna i = 1, ..., k.
Zejména tedy existuje vlastní vektor uk+i + Vk e V/Vk zobrazení cpv/Vk s vlastní hodnotou kk+i. Uvažme nyní prostor Vk+i = ..., uk+i). Kdyby byl vektor uk+i lineární kombinací vektorů u\, ..., uk, znamenalo by to, že uk+i + Vk je nulová třída v V/Vk, to ale není možné. Je proto dim Vk+i = k + 1. Zbývá studovat indukované zobrazení cpV/vk+l ■ Charakteristický polynom tohoto zobrazení je stupně n — k — 1 a. dělí charakteristický polynom zobrazení cp. Přitom doplněním vektorů u\, ..., uk+i do báze V dostaneme polorozpadlou matici zobrazení cp s horní trojúhelníkovou submaticí B v horním levém rohu, jejíž diagonální prvky jsou právě skaláry k\, ..., uk+i. Proto mají kořeny charakteristického polynomu indukovaného zobrazení požadované vlastnosti. □
3.32. Poznámky. Pokud existuje rozklad celého prostoru V na přímý součet vlastních podprostorů, existuje báze z vlastních podprostorů a předchozí věta vlastně neříká vůbec nic zajímavého. Její síla ovšem spočívá v tom, že jediným jejím předpokladem je existence dim V kořenů charakteristického polynomu (včetně násobností). To je ovšem zaručeno, je-li pole K algebraicky uzavřené, např. pro komplexní čísla C. Přímým důsledkem pak jsou zajímavá tvrzení o determinantu a stopě zobrazení: jsou vždy součinem, resp. součtem prvků ve spektru. Tuto skutečnost můžeme použít i pro všechny reálné matice. Můžeme je totiž vždy považovat za komplexní, spočítat potřebné, a protože determinant i stopa jsou algebraické výrazy v prvcích matice, výsledkem budou právě hledané reálné hodnoty.
je tedy
, 1 , 1 , b2
a1 ■ 1 + 2ab---\-b • - = a +ab-\--.
2 4 4
Analogicky stanovíme postupně relativní četnosti dvojic a A aaa\ potomstvu ve tvarech
b2
ab + bc + 2ac -\--
2
a
b2
c2 + bc + —.
4
Na tento proces můžeme nahlížet jako na zobrazení T, které transformuje vektor (a, b, c)T. Platí
(a\ / a2 + ab + b2/4 b I \ab+bc + 2ac + b2/2 c) \ c2 + bc + b2/4
Podotkněme, že za definiční obor (a pochopitelně i obor hodnot) T
vlastně bereme pouze vektory
( a\
, kde a, b, c e [0, 1], a +b + c = 1.
Chtěli bychom zadat operaci T pomocí násobení vektoru (a,b,c)T jistou konstantní maticí. To však očividně není možné (zobrazení T není lineární). Nejedná se tedy o Markovův proces a nelze zjednodušit určování, co se stane po velmi dlouhé době, jako v předešlých případech. Můžeme ale vypočítat, co se stane, když aplikujeme zobrazení T dvakrát po sobě. Ve druhém kroku dostáváme
a2 +ab +b2/4
T : | ab + bc + 2ac + b1 /2 | | tf | , kde
c2 + bc + b2 j4
b2\2 ( b2\ ( b2
t2l=[a2 + ab + —j + la2 + ab + —j lab +bc + 2ac + —
1/ b2
+ — I ab + bc + 2ac -\--
4 V 2
f2 = [a2 +ab + — J \ ab + bc + 2ac + — ) +
u2\ / h2
+ [ab+bc+ 2ac + — I lcz + bc + — ) +
9 -2\ / 9 b2\ 1 / u2
+ 2[az + ab + —j I cz + bc + — I + -1 ab + bc + 2ac + —
, / 9 b2\2 ( b2\ ( 7 b2
^ = ^cz + bc + —j + lab + bc + 2ac + — j I cl + bc + —
1 / b2^ + — I ab + bc + 2ac + —
161
C. MARKOVOVY PROCESY
4. VÍCE MATICOVÉHO POČTU
Lze ukázat (využitím a + b + c = 1), že
b2 b2 b2
tl=a2+ab-\--, ŕ? = ab + bc + 2ac-\--, £=c2 + bc-\--,
2 4 2 4
tj-
a2 + ab + 62/4 \ / a2 + ab + 62/4
7 : | ab + 6c + 2ac + b2/2 h» \ab + bc+2ac + b2/2
c2 + bc + b2/4 J \ c2 + bc + b2/4
Získali jsme tak překvapivý výsledek, že dalším aplikováním transformace T se vektor obdržený v prvním kroku nezmění. To znamená, že výskyt uvažovaných dvojic alel je po libovolně dlouhé době totožný jako v první generaci potomstva. Pro velkou populaci jsme tak dokázali, že evoluční vývoj by se realizoval během jediné generace, kdyby nedocházelo k mutacím nebo k selekci. □
3.34. Nechť jsou dány dvě urny, které obsahují dohromady n.
bílých
a n černých koulí. V pravidelných časových intervalech je z obou uren vylosována jedna koule a přemístěna do druhé urny, přičemž počet koulí v obou urnách je na začátku (a tedy po celou dobu) právě n. Zadejte tento Markovův proces pravděpodobnostní maticí přechodu T.
Řešení. Tento příklad se používá ve fyzice jako model prolínání dvou nestlačitelných kapalin (již v roce 1769 ho zavedl D. Bernoulli) nebo analogicky jako model difúze plynů. Stavy 0, 1, ..., n budou odpovídat kupř. počtu bílých koulí v jedné pevně zvolené urně. Tento údaj totiž současně zadává, kolik černých koulí je ve zvolené urně (všechny ostatní koule jsou pak ve druhé z uren). Pokud v jistém kroku dojde ke změně stavu j e {1, ...,«} na j — 1, znamená to, že ze zvolené urny byla vytažena bílá koule a z druhé černá. To se stane s pravděpodobností
■2
J
Přechodu ze stavu j e {0, 1} do j +1 odpovídá vytažení černé
koule ze zvolené urny a bílé z té druhé s pravděpodobností
n ~ i n- j (n- j)2
Soustava zůstane ve stavu j e {1, ..., n — 1}, jestliže z obou uren byly vytaženy koule stejné barvy, což má pravděpodobnost
J n — + -
J
2j (n - j)
Dodejme, že ze stavu 0 se nutně (s pravděpodobností 1) přechází do stavu 1 a že ze stavu n se s jistotou přechází do stavu n — 1. Uvážením
Když je na vektorovém prostoru V zadán skalární součin, můžeme v každém induktivním kroku důkazu předchozího tvrzení využít skutečnosti, že vždy V/Vk — a
B u i—> (u + Vk) e V/Vk. To znamená, že v každé třídě rozkladu V/Vk existuje právě jeden vektor z V^. Skutečně, tuto vlastnost má faktorový prostor podle libovolného podprostoru v unitárním prostoru - pokud u, v e jsou v jedné třídě, pak jejich rozdíl patří do Vk n VkL, tedy jsou stejné. Můžeme tedy jako reprezentanta uk+i nalezené třídy, tedy vlastního vektoru V je libovolné lineární zobrazení (reálného nebo komplexního) unitárního prostoru s m = dim V vlastními hodnotami (včetně násobonosti). Pak existuje ortonormální báze prostoru V taková, že cp v ní má horní trojúhelníkovou matici s vlastními čísly X\, ... ,Xmna diagonále.
3.33. Věta. Nechť cp V kořenových prostorů
V je lineární zobrazení. Součet
příslušných různým vlastním hodnotám XV ..., Xk je přímý. Navíc je pro každou vlastní hodnotu X dimenze podprostoru IZi rovna její algebraické násobnosti.
Důkaz. Důkaz provedeme indukcí přes počet k kořenových prostorů. Předpokládejme, že tvrzení vždy platí pro méně než k prostorů a že pro vektory u\ e 1Zxx, ... ,uk e 1Zxk platí «! + ••• + «£ =0. Pro vhodné j pak (cp — kk ■ iávy (uk) = 0 a zároveň jsou yt = (cp — kk ■ iávy (ui) nenulové vektory v 1Zxi ,i = 1 — 1, pokud w; jsou nenulové, viz. předchozí věta. Přitom ale
k
yi H----+ yk-i = ^2(cp - h ■ \áv)J(ui) = 0
i=\
a tedy podle indukčního předpokladu jsou všechny y; nulové. Pak ovšem i uk = 0 a lineární nezávislost je dokázána.
Zbývá ukázat, že dimenze každého kořenového prostoru TZx je rovna algebraické násobnosti kořenu k charakteristického polynomu. Nechť tedy je k vlastní hodnota cp, označme cp zúžení cp\fix a ý V/IZx —> V/TZx nechť je zobrazení indukované cp na faktorovém prostoru. Předpokládejme, že dimenze IZx je menší než násobnost kořenu k charakteristického polynomu. Podle věty ?? to znamená, že A je i vlastní hodnotou zobrazení ý. Nechť (v + IZx) £ V/TZx je příslušný vlastní vektor, tj. ifriv+Hx) = ^(v+7lx) což podle definice značí v £ IZx a cp(v) = k-v + w pro vhodné w e IZx - Máme tedy w = (cp — k-idv)(v) a (cp —k-iávy (w) = Opro vhodné j. Celkem tedy (cp — k- idy)i+1 (v) = 0 což je ve sporu s volbou v £ IZx- Tím jsme dokázali, že dimenze TZx je rovna násobnosti kořene k charakteristického polynomu cp. □
162
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
Důsledek. Pro každé lineární zobrazení cp : V -» V, jehož celé spektrum je v K, je V = IZ^ © • • • © lZin přímým součtem kořenových podprostorů. Zvolíme-li vhodně báze těchto podprostorů, pak cp má v této bázi blokově diagonální tvar s horními trojúhelníkovými maticemi v blocích a vlastními hodnotami na diagonále.
3.34. Nilpotentní a cyklická zobrazení. Nyní již máme skoro vše připraveno pro diskusi kanonických tvarů matic. Zbývá jen vyjasnit vztah mezi cyklickými a nilpotentními zobrazeními a poskládat dohromady již připravené výsledky.
Věta. Nechť cp V -» V je nilpotentní lineární zobrazení. Pak existuje rozklad V na přímý součet podprostorů V = V\ © • • • © Vk takových, že zúžení cp na kterýkoliv z nich je cyklické.
Důkaz. Ověření je docela jednoduché a spočívá v konstrukci takové báze prostoru V, že akce zobrazení cp na bázových vektorech přímo ukazuje rozklad na cyklická zobrazení. Postup bude ale poněkud zdlouhavý.
Nechť k je stupeň nilpotentnosti zobrazení cp a označme Pi = im(cpi), i = 0, ..., k, tzn.
výše uvedeného dostáváme hledanou matici
í°
T = -
nL
2- l(n - 1)
0 (n - l)2
0
0 V0
0
o
o
22
2 • 2(n - 2)
0 0 0
o o o
2 • (n - 2)2 (n - l)2
22 0
2- (n - 1)1 1
{0} = Pk C Pk-i C • • • C Pi C Po
V.
„k-1
epk-l Pr0St0rU Pk-U
Vyberme libovolnou bázi ex kde pk_i > 0 je dimenze Pk-i - Z definice plyne, že Pk-i c Kercp, tj. vždy 1/4 3/8 1/4 ,3/8 3/8 1/2,
1/2 0 l/3\ /0> 0 1 1/2 )(l 1/2 0 1/6/ \0>
163
C. MARKOVOVY PROCESY
4. VÍCE MATICOVÉHO POČTU
veshj 3 916
bude prostřední sloupec matice B" vždy (pro n e N) vektorem (0, 1, 0)T, tj. matice B nemůže být regulární. Součin
/1/3 1/2 0 0 \ M / 0 \
1/2 1/3 0 0 0 1/6 1/6 1/3 \l/6 0 5/6 2/3/
0
a
w
o
a/6 + b/3 \5a/6 + 2b/3j
a, b e
implikuje, že matice D2 bude mít v pravém horním rohu nulovou dvourozměrnou (čtvercovou) submatici. Opakováním této implikace dostáváme, že stejnou vlastnost mají matice D3 = D ■ D2, D4 = D ■ D3, ..., D" = D ■ D"-1, ..., tudíž matice D není regulární. Matice E je permutační (v každém řádku a sloupci má právě jeden nenulový prvek, a to 1). Není obtížné si uvědomit, že mocniny permutační matice jsou opět permutační matice. Matice E proto také není regulární. To lze rovněž ověřit výpočtem mocnin E2, E3, E4. Matice E4 je totiž jednotková. □
3.36. Dva hráči A, B hrají o peníze opakovaně jistou hru, která může skončit pouze vítězstvím jednoho z hráčů. Pravděpodobnost výhry hráče A je v každé jednotlivé hře p e [0, 1 /2) a oba sází vždy (v libovolné hře) jen 1 Kč, tj. po každé hře s pravděpodobností p dá 1 Kč hráč B hráči A a s pravděpodobností 1 — p naopak 1 Kč dá hráč A hráči B. Hrají ovšem tak dlouho, dokud jeden z nich nepřijde o všechny peníze. Jestliže má hráč A na začátku x Kč a hráč B má y Kč, určete pravděpodobnost, že hráč A vše prohraje.
Řešení. Tato úloha se nazývá Ruinovaní hráče. Jedná se o speciální Markovův řetězec (viz také příklad Mlsný hazardér) s mnoha důležitými aplikacemi. Hledaná pravděpodobnost činí
(3.6)
■ - te)
Povšimněme sijakáje tato hodnota pro konkrétní volby p,x, y. Kdyby hráč B chtěl mít téměř jistotu a požadoval, aby pravděpodobnost, že hráč A s ním prohraje 1 000 000 Kč, byla alespoň 0,999, potom stačí, aby měl 346 Kč, je-li p = 0, 495 (či 1 727 Kč, je-li p = 0, 499). Proto je ve velkých kasinech možné, aby „vášniví" hráči mohli hrát téměř spravedlivé hry. □
3.37. V rámci jisté společnosti fungují dvě navzájem si konkurující oddělení. Vedení společnosti se rozhodlo, že každý týden bude poměřovat relativní (vzhledem k počtu zaměstnanců) zisky dosažené těmito dvěma odděleními. Do oddělení, které bude úspěšnější, pak budou přeřazeni dva pracovníci z druhého oddělení. Tento proces má probíhat tak dlouho, až jedno z oddělení zanikne. Získali jste zaměstnání v této společnosti a můžete si vybrat jedno z těchto dvou oddělení,
Předpokládejme dále, že již máme sestrojenu bázi pod-prostoru Pk-i takovou, že ji můžeme poskládat do schématu
ek~l ■ ' Pk-i
e\~\ ■ ek~2 ■ ' Pk-i ek~2 Pk-\- H' • ek~2 ■ ' Pk-2
e\~\ ■ k-3 ' ' Pk-\ ek~3 Pk-l- H' • k-3 ' ' Pk-2
k-i ei ' • k-l ' ' Pk-\ k-l Pk-l- H' • k-l ' ' Pk-2
'Ä-2+ľ
Qk-l ~Pk-2+ľ
ak-3
"Pk-3
k-l k-i 1 Pk-3 ' ' ' ' Pk-
kde hodnota zobrazení cp na libovolném bázovém vektoru se nachází nad ním, nebo je nulová, pokud nad zvoleným vektorem báze již nic není. Pokud je Pk-i ^ V, opět musí
existovat vektory e
k-l-l
k-l
el ' • • • ' ~Pk-
vektory
„k-l-\
-Pk-t
, které se zobrazují na
epk_t a můžeme je doplnit do báze Pk_i_i, řekněme
„k-l-l
„k-l-l
Pk-í+^' " " " ' pk-e-i' Přitom postupným odečítáním hodnot iterací zobrazení n. Odtud plyne, že pokud matice J zobrazení cp obsahuje dk(k) Jordánových bloků řádu k s vlastní hodnotou
k, pak defekt matice (J -d1(k)+2d2(k) +
k-Efit
..£dl(k) + £dl+1(k) + ...
164
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
Odtud spočítáme
n - n(X) = dx(k) + 2d2(X) H----+ Id^X) + ídw(k) + ..
dk(X) = r*_i(A.) - 2rk(X) + rk+l(X)
(kde poslední řádek vznikne kombinací předchozího pro hodnoty l = k - 1, k, k + 1).
3.36. Poznámka. Důkaz věty o existenci Jordánova kanonického tvaru byl sice konstruktivní, nedává nám ale dokonale efektivní algoritmický postup pro jejich hledání. Nyní shrneme již odvozený postup explicitního výpočtu báze, v níž má dané zobrazení cp V -» V matici v kanonickém Jordánově tvaru.
(1) Najdeme kořeny charakteristického polynomu.
(2) Jestliže jich je méně než n = dim V, včetně násobností, kanonický tvar neexistuje.
(3) Je-li n lineárně nezávislých vlastních vektorů, získáme bázi V z vlastních vektorů a v ní má cp diagonální matici.
(4) Nechť k je vlastní hodnota s geometrickou násobností menší než algebraickou a v\, ..., vk nechť jsou příslušné vlastní vektory. To by měly být vektory na horním okraji schématu z důkazu věty 3.34, je ovšem nutné najít vhodnou bázi aplikacemi iterací cp — k ■ idy. Zároveň přitom zjistíme ve kterém řádku se vektory nacházejí a najdeme lineárně nezávislá řešení u>; rovnic (cp — k id) (x) = v{ z řádků pod nimi. Postup opakujeme iterativně (tj. pro u>; atd.). Najdeme tak „řetízky" bázových vektorů zadávajících podprostory, kde cp — k id je cyklické.
Postup je praktický pro matice, kde násobnosti vlastních hodnot jsou malé, nebo aspoň diskutované stupně nilpotentnosti jsou malé. Např. pro matici
(2 0 ŕ A = 0 2 1 \0 0 2y
dostaneme dvourozměrný podprostor vlastních vektorů
((1,0,0), (0,1,0)).
Potřebujeme proto najít řešení rovnic (A—2E)x = (a, b, 0)T pro vhodné konstanty a, b. Tento systém je ovšem řešitelný pouze pro a = b a jedno z možných řešení je v = (0, 0, 1), a = b = 1. Celá hledaná báze pak je (1, 1, 0), (0, 0, 1), (1, 0, 0). Všimněme si, že jsme měli spoustu voleb a bazí s požadovanými vlastnostmi je tedy mnoho.
5. Rozklady matic a pseudoinverze
V minulé části jsme s soustředili na geometrický popis struktury zobrazení. Teď naše výsledky přeložíme do jazyku tzv. rozkladů matic, což je obzvlášť důležité téma pro numerické postupy a maticový počet obecně.
I při počítání s reálnými čísly užíváme pro zjednodušení rozklady na součiny. Nejjednodušším je vyjádření každého reálného čísla jednoznačně ve tvaru
a = sgn(út) • \a\,
kde budete pracovat. Chcete si zvolit to, které nebude v důsledku vnitropodnikové konkurence zrušeno. Jaká bude Vaše volba, když jedno oddělení má nyní 40 zaměstnanců, druhé 10 a když odhadujete, že to v současnosti menší z nich bude mít větší relativní zisky v 54 % případů?
Další využití Markovových řetězců viz příloha za kapitolou.
D. Rozklady matic
3.38. Vyvraťte nebo dokažte:
• Nechť A je čtvercová matice n x n. Pak je matice AT A je symetrická.
• Nechť čtvercová matice A má pouze kladné reálné vlastní hodnoty. Pak je A symetrická.
3.39. Nalezněte LU-rozklad následující matice:
-2 1 0 -4 4 2 x -6 1 -1,
Řešení.
'\ 0 0\ 1-2 1 0> 2 1 0 0 2 2 v3 "I 1/ \0 0 1, Nejprve vynásobíme matice odpovídající Gaussově eliminaci, dostáváme tak pro původní matici A, XA = U, kde X je dolní trojúhelníková daná zmíněným součinem, U horní trojúhelníková. Z této rovnosti máme A = X~1U, což je hledaný rozklad (musíme tedy spočítat inverzi k X). □
/l 1 0
3.40. Nalezněte L [/-rozklad matice I 1 —1 2
V- 1 -h
3.41. Ray-tracing. V počítačové 3D-grafice se obraz zobrazuje pomocí algoritmu Ray-tracing. Základem tohoto algoritmu je aproximace světelných vln paprskem (přímka) a aproximace zobrazovaných objektů mnohostěny. Ty jsou tedy ohraničeny rovinami a je potřeba spočítat, kam se na těchto rovinách odráží světelné paprsky. Z fyziky přitom víme, jak se paprsky odráží - úhel odrazu je roven úhlu dopadu.
Paprsek světla ve směru v = (1, 2, 3) dopadá na rovinu určenou rovnicí x + y + z = 1- V jakém směru se paprsek odrazí? Řešení. Jednotkový normálový vektor k rovině je« = -^(1,1,1). Vektor určující směr odraženého paprsku vR bude ležet v rovině určené vektory v,n. Můžeme jej tedy vyjádřit jako lineární kombinaci těchto vektorů. Zároveň nám pravidlo úhel odrazu je roven úhlu dopadu jinými slovy říká, že (v, n) = — (vR, n). Odtud dostaneme kvadratickou rovnici pro koeficienty lineární kombinace.
165
D. ROZKLADY MATIC
5. ROZKLADY MATIC A PSEUDOINVERZE
Příklad můžeme vyřešit i jednoduším, geometrickým způsobem. Z obrázku můžeme přímo odvodit,že
vR = v — 2{v, n)n a v našem případě dostáváme vR = (—3, —2,
I)-
□
3.40
3.42. Najděte Jordánův tvar matice A a napište příslušný rozklad. Jaká je geometrická interpretace rozkladu této matice? -1 ť -6 4, -1 ť -4 3
i) A
ii) A
Řešení. i)Nejprve spočítáme charakteristický polynom matice A
\A - XE\
-1
A 1
4-A
A2 - 3A + 2
Vlastní čísla matice A jsou kořeny tohoto polynomu, to znamená A.i,2 = 1,2. Prtotože matice je řádu dva a máme dvě různé vlastní
hodnoty, je Jordánův tvar diagonální matice J = ^ ^ ■ Vlastní vektor (x, y) příslušný vlastní hodnotě 1 splňuje 0 = (A — E)x =
6 3) i^y)' ^' = ^' ^° Jsou Právě násobky vektoru (1,2).
Podobně zjistíme, že vlastním vektorem k vlastní hodnotě 2 je (1, 3). Matici P pak dostaneme napsáním těchto vlastních vektorů do sloupců,
tí-P
1 1
,2 3, matice k P má tvar P~l
■1 1 ■6 4
Pro matici A pak máme A = P ■ J ■ P 1. Inverzní
a dohromady pak dostáváme
1 1
2 3
1 0 0 2
■1
3.41
-2 1
Tento rozklad nám říká, že matice A určuje takové lineární zobrazení, které má v bázi vlastních vektorů (1,2), (1,3) výše uvedený diagonální tvar. To znamená, že ve směru (1,2) se nic neděje a ve směru (1, 3) se každý vektor protáhne na svůj dvojnásobek.
ii) Charakteristický polynom matice A je v tomto případě
|A - XE\
1 — A 1
-4 3 — A
Dostáváme tedy dvojnásobný kořen A (x, y) splňuje
0 = (A — E)x =
-- A2 - 2A + 1 = 0 1 a příslušný vlastní vektor
-2 1 -4 2
To jsou, opět jako v minulém příkladu, násobky vektoru (1, 2). To, že řešením této rovnice nejsou dva lineárně nezávislé vektory, říká, že Jordánův tvar v tomto případě nebude diagonální, ale bude to matice
'1 r
,0 1.
Bázi, ve které má matice A tento tvar, tvoří vlastní vektor
tj. jako součin znaménka a abolutní hodnoty. V dalším textu si uvedeme stručně přehled několika takových rozkladů pro různé typy matic, které bývají nesmírně užitečné při numerických výpočtech s maticemi. Například jsme vhodný rozklad pro pozitivně semidefmitní symetrické matice využili v odstavci 3.27 pro konstrukci odmocniny z matice.
3.37. LU-rozklad. Začneme přeformulováním několika výsledků, které jsme už dávno odvodili. V odstavcích 2.7 a 2.8 jsme upravovali matice nad skaláry z libovolného pole na řádkový schodovitý tvar. K tomu jsme používali elementární úpravy, které spočívaly v postupném násobení naší matice invertibilními dolními trojúhelníkovými maticemi Ph které postihovaly přičítání násobků řádků pod právě zpravová-vaným. Předpokládejme pro jednoduchost, že naše matice A je čtvercová a že při Gausově eliminaci nejsme nuceni přehazovat řádky a proto všechny naše matice Pt mohou být dolní trojúhelníkové s jedničkami na diagonálách. Konečně, stačí si povšimnout, že inverzní matice k takovýmto Pt jsou opět dolní trojúhelníkové s jedničkami na diagonálách a dostáváme
U = P ■ A = Pk ■ ■ ■ Pí ■ A kde U je horní trojúhelníková matice a tedy
A = L-U
kde L je dolní trojúhelníková matice s jedničkami na diagonále a U je horní trojúhelníková. Tomuto rozkladu se říká LU-rozklad matice A.
V případě obecné matice můžeme při Gausově eliminaci na řádkově schodovitý tvar potřebovat navíc permutace řádků, někdy i sloupců matice. Pak dostáváme obecněji A = P ■ L U Q, kde P a. Q jsou nějaké permutační matice.
3.38. Poznámky. Přímým důsledkem Gausovy eliminace bylo také zjištění, že až na volbu vhodných bází na definičním oboru a oboru hodnot je každé zobrazení / : V -» W zadáno maticí v blokově diagonálním tvaru s jednotkovou matici, s rozměrem daným dimenzí obrazu /, a s nulovými bloky všude kolem. To lze přeformulovat takto: Každou matici A typu m /n nad polem skalárů K lze rozložit na součin
E 0 0 0
Q,
kde P a Q jsou vhodné invertibilní matice.
Pro čtvercové matice jsme v 3.28 ukázali při diskusi vlastností lineárních zobrazení / : V -» V na komplexních vektorových prostorech, že každou čtvercovou matici A dimenze m umíme rozložit na součin
A = P ■ B ■ P~l
kde B je blokově diagonální s Jordánovými bloky příslušnými k vlastním číslům na diagonále. Skutečně jde o pouhé přepsání Jordánovy věty, protože násobení maticí P a její inverzí z opačných stran odpovídá v tomto přípaě právě změně
166
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
báze na vektorovém prostoru V a citovaná věta říká, že ve vhodné bázi má každé zobrazení Jordánův kanonický tvar.
Obdodně jsme tedy při diskusi samoadjungovaných zobrazení dokázali, že pro reálné symetrické nebo komplexní Hermiteovské matice existuje vždy rozklad na součin
A = P ■ B ■ P*,
kde B je diagonální matice se všemi (vždy reálnými) vlastními čísly na diagonále, včetně násobností. Skutečně, jde opět o součin s maticemi vystihující změnu báze, nicméně připouštíme nyní pouze změny mezi mezi ortonormálními bázemi a proto i matice přechodu P musí být ortogonální. Odtud P'1 = P*.
Pro reálná ortogonální zobrazení jsme odvodili obdobné vyjádření jako u symetrických, pouze naše B bude blokově diagonální s bloky rozměru dva nebo jedna vyjadřujícími buď rotaci nebo zrcadlení nebo identitu vzhledem k příslušným podprostorům.
3.39. Věta o singulárním rozkladu. Nyní se vrátíme k obecným lineárním zobrazením mezi (obecně různými) vektorovými prostory. Jestliže na nich je definován skalární součin a omezíme se přitom na ortonormální báze, musíme postupovat o hodně rafinovaněji, než v případě bazí libovolných
Věta. Nechť A je libovolná matice typu m/n nad reálnými nebo komplexními skaláry. Pak existují čtvercové unitární matice U a V dimenzí m a n, a reálná diagonální matice s nezápornými prvky D dimenze r, r < min{m, n}, takové,
Že
'D 0^ 0 0,
usv*
a r je hodnost matice A A*. Přitom je S určena jednoznačně až na pořadí prvků a prvky diagonální matice D jsou druhé odmocniny vlastních čísel di matice AA*. Pokud je A reálná matice, pak i matice U a V jsou ortogonální.
Důkaz. Předpokládejme nejprve m < n a označme ušfe3 = U\f~BUT a W := UVT,tj.
P=|-10 ONO ±0111 o
Pseudoinverzní matice je dána výrazem A( ^ 'l 0 0\
0 2 0 I. Máme tedy ,0 0 0/
t(-D
VS'UT, kde S
□
3.45. QR rozklad. QR rozklad matice A se dobře hodí v případě, když je dán systém lineárních rovnic Ax = b, který sice nemá řešení, ale my potřebujeme najít jeho co nejlepší přiblížení. Chceme tedy minimalizovat II Ax — b\\. Podle Pythagorovy věty máme ||Ax — b\\2 = || Ax — b\\ ||2 + ||6jJ|2, kde b jsme rozložili na b\\, které patří do obrazu matice A a na b±, které je k tomuto obrazu kolmé. Projekci
To je aleje ekvivalentní tvrzení, že prvních r sloupců matice A V je ortogonálních a zbývající jsou nulové, protože mají nulovou velikost.
Označme nyní prvních r sloupců v\, ..., vr e W". Platí tedy (ví,Ví) = d{, i = 1, ..., r a normované vektory u i = -jjjVi tvoří ortonormální systém nenulových vektorů. Doplňme je na ortonormální bázi u_ = u\, ... ,un celého Km. Vyjádříme-li naše původní zobrazení zobrazení n, můžeme aplikovat předchozí část důkazu na matici A*. Odtud pak přímo plyne požadované tvrzení.
Pokud pracujeme nad reálnými skaláry, jsou všechny naše kroky v důkazu výše také realizovány v reálném oboru.
□
Tento důkaz věty o singulárním rozkladu je konstruktivní a můžeme jej opravdu použít pro výpočet unitárních, resp. ortogonálních, matic U, V a diagonálních nenulových prvků matice S.
3.40. Geometrická interpretace singulárního rozkladu.
Diagonálním hodnotám matice D z předchozí věty se říká singulární hodnoty matice A. Přeformulujme si tuto větu v reálném případě geometrietěji.
Pro příslušné lineární zobrazení W" mají singulární hodnoty skutečně jednoduchý geometrický význam: Nechť K c M" je jednotková sféra pro standardní skalární součin. Obrazem cp(K) pak vždy bude (případně degenerovaný) m-rozměrný elipsoid. Singulární čísla matice A jsou přitom velikosti hlavních poloos a věta navíc říká, že původní sféra vždy připouští ortogonální sdružené průměry, jejichž obrazem budou právě všechny poloosy tohoto elipsoidu.
Pro čtvercové matice je vidět, že A je invertibilní právě, když všechna singulární čísla jsou nenulová. Poměr nej-většího a nejmenšího singulárního čísla je důležitým parametrem pro robustnost řady numerických výpočtů s maticemi, např. pro výpočet inverzní matice. Poznamejme také, že existují rychlé metody výpočtů, resp. odhadů, vlastních čísel, proto je se singulárním rozkladem velmi efektivně pracovat.
3.41. Věta o polárním rozkladu. Věta o singulárním rozkladu je východiskem pro mnoho mimořádně užitečných nástrojů. Uvažujme nyní nad několika přímými důsledky (které samy o sobě jsou dosti netriviální). Tvrzení věty říká pro libovolnou matici A, ať už reálnou nebo komplexní, A = USW* s diagonální S s nezápornými reálnými čísly na diagonále a unitárními U,W. Pak ovšem také A = USU*UW* a pojmenujme si matice P = USU*, V = UW*. První z nich, P je hermiteovská (v reálném případě symetrická) a pozitivně semidefmitní, protože jde jen o zápis zobrazení s reálnou diagonální maticí S v jiné ortonormální bázi, zatímco V je coby
168
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
součin dvou unitárních opět unitární (v reálném případě ortogonální). Navíc A* = WSU* a tedy AA* = USSU* = P2 a naše matice f je vlastně odmocninou ze snadno spočítatelné hermiteovské matice A A*.
Předpokládejme, že A = PV = QU jsou dva takové rozklady matice A na součin positivně semidefinitní hermiteovské a unitární matice a předpokládejme, že A je invertibilní. Pak ovšem je AA* = PVV*P = P2 = QUU*Q = Q2 pozitivně definitní a pro to jsou matice Q = P = VAÄ* jednoznačně určené a invertibilní. Pak ovšem také U = V = P~lA.
Beze zbytku jsme tedy odvodili velice užitečnou analogii rozkladu reálného čísla na znaménko (ortogonální matice v případě dimenze jedna jsou právě ±1) a absolutní hodnotu (matice P, ke které umíme odmocninu).
Věta (Věta o polárním rozkladu). Každou čtvercovou komplexní matici A dimenze n lze vždy vyjádřit ve tvaru A = P ■ V, kde P je hermiteovská a positivně definitní čtvercová matice téže dimenze a V je unitární. Přitom P = V AA*. Jeli A invertibilní, je rozklad jednoznačný a V = (V AA*)-1 A.
Pokud pracujeme nad reálnými skaláry, je P symetrická a V ortogonální.
Když budeme tutéž větu aplikovat na A* místo A, dostaneme tentýž výsledek, ovšem s obráceným pořadím hermite-ovských a unitárních matic. Matice v příslušných pravých a levých rozkladech budou samozřejmě obecně různé.
V komplexním případě je analogie s rozkladem čísel ještě zábavnější — pozitivně semidefinitní P hraje opět roli absolutní hodnoty komplexního čísla, unitární matice V pak má jednoznačné vyjádření jako součet V = Vr + i V, s her-miteovkými Vr a V, s vlastností V2 + V2 = E, tj. dostáváme plnou analogii goniometrického tvaru komplexních čísel (viz závěrečná poznámka v 3.26). Všimněme si ale, že ve vícerozměrném případě je podstané, v jakém pořadí tento „goniometrický tvar" matice píšeme. Jde to oběma způsoby, výsledky jsou ale obecně různé.
Pro řadu praktických aplikací bývá rychlejší použití tzv. QR rozkladu matic, který je obdobou Schurovy věty o ortogonální triangulaci:
3.42. Věta. Pro každou komplexní matici A typu m/n existuje unitární matice Q a horní trojúhelníková matice R takové, že A = QT R.
Pokud pracujeme nad reálnými skaláry, jsou Q i R reálné.
Důkaz. V geometrické formulaci potřebujeme dokázat, že pro každé zobrazení
dále spočítáme
'1 2\ J_
Přibližné řešení pak splňuje Rx = Q Tb a to v našem případě znamená 5x + 9y = 9 (přibližné řešení tedy není jednoznačné). QR rozklad matice A je
□
3.46. Minimalizujte \\Ax — b\\ pro A
V
0 I a napište QR rozklad matice A.
Řešení. Normalizovaný první sloupec matice A je 000 e\ = ( — 1 I. Z druhého sloupce odečteme jeho složku ve
l,
směru e\. Máme
169
D. ROZKLADY MATIC
5. ROZKLADY MATIC A PSEUDOINVERZE
Tím jsme vyrobili ortogonální vektor, který normujeme a dostaneme e2 = 7J2 I 1 I ■ Třetí sloupec matice A je už lineárně závislý
(můžeme ověřit spočítáním determinantu). Hledaná sloupcově-ortogonální matice je tedy
1 , 2 0
Q = — -1 V3
V6
■1
Dále spočítáme
R = QTA
-1
Velo V3 -73
3.46
Vě^O 3V3 -3737 2 -1 -1
ô^-^(o V3 -V3.
Řešením rovnice i?x = QTb je x = y = z. Násobky vektoru (1, 1, 1) tedy minimalizuji \\Ax — b\\.
Zahrazení určené maticí A je projekce na rovinu s normálovým vektorm (1, 1, 1).
3 . 47
□
Uvažme obrazy /_i, proto ve vyjádření (p(e{) v bázi u vystupují pouze vektory u 1, ..., u,■. Zahrazení cp má proto ve standardní bázi na W a ortonormální bázi u na Km horní trojúhelníkovou matici R. Přechod k bázi u na W" odpovídá násobení ortogonální maticí Q zleva, tj. R = Q A, ekvivalentně A = Q*R. □
Závěrem této části textu si všimněme mimořádně užitečné a důležité aplikace našich výsledků pro přibližné numerické výpočty.
3.43. Definice. Nechť A je reálná matice typu m/n a nechť
'D 0^
,0 o,
je její singulární rozklad (zejména D je invertibilní). Matici
Z)-1 0^
0 o,
nazýváme pseudoinverzní matice k matici A.
A = USV*, S
A(-D := ygu* g
Jak ukazuje následující věta, je pseudoinverze důležité zobecnění pojmu inverzní matice.
3.44. Věta. Nechť A je reálná nebo komplexní matice typu m/n. Pak pro její pseudoinverzní matici platí:
(1) Je-li A invertibilní (zejména tedy čtvercová), pak
A(-1) = A"1.
(2) pro pseudoinverzi A(_1) platí, že A(_1)A i AA(_1) jsou hermiteovské (v reálném případě) symetrické a
AA
(-D
A, A'-^AA
(-D a 4(-D
i(-D
(3) Je-li A matice systému lineárních rovnic Ax = b, s pravou stranou b e W", pak vektor y = A(_1)6 e K" minimalizuje velikost II Ax — b\\ pro všechny vektory x e K".
Důkaz. (1): Je-li A invertibilní, pak je matice S = U*AV také invertibilní a přímo z definice je $ = 5_1. Odtud vyplývá A(_1)A = AA(_1) = E.
(2): Přímým výpočtem dostáváme SS'S = S a S'SS' = 5", proto
AA(_1)A = USV*VS'U*USV* = USgSV* = USV* = A a analogicky pro druhou rovnost. Dále
(AA(_1))* = (USS'U*)* = U(S')*S*U*
= U(SS')*U* = USS'U* = AA(_1) a podobně se ukáže (A(_1)A)* = A(_1)A.
170
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
(3): Uvažme zobrazení^ : K" -» Km,x h-» Ax, a přímé součty K" = (Ker cp)1- © Kercp, Km = Imcp © (líru?)-1. Zúžené zobrazení cp := ^(Ker^ : (Kercp)1- -» Imcp je lineárni isomorfismus. Zvolíme-li vhodně ortonormální báze na (Ker cp)1- almip a doplníme je na ortonormální báze na celých prostorech, bude mít cp matici S a cp matici D z věty o singulárním rozkladu. Pro dané b e W" je bod z e Imcp minimalizující vzdálenost \\b — z\\ (tj. realizující vzdálenost od podprostoru p(b, Imcp)) právě komponenta z = b\ rozkladu b = b\ +b2,bi e Imcp, b2 e (Imcp)-1. Přitom ale ve zvolené bázi je zobrazení cp{~l\ původně zadané ve standardních bazích pseudoinverzí A(_1), dáno maticí S z věty o singulárním rozkladu, zejména je cp{~l) (\mcp) = (Kercp)1- a D~l matici zúžení (py^y a (p^^ ^± je nulové. Je tedy skutečně
cpocp(-1\b)=cp(cp(-1\z))=z a důkaz je ukončen. □
Lze také ukázat, že matice A(_1) minimalizuje výraz ||AA(_1) - E\\2 tj. součet kvadrátů všech prvků uvedené matice.
3.45. Lineární regrese. Aproximační vlastnost (3) předchozí věty je velice užitečná v případech, kdy máme najít co nejlepší přiblížení (neexistujícího) řešení přeurčeného systému Ax = b, kde A je reálná matice typu m/n a m je větší než n.
Např. máme experimentem dáno mnoho naměřených reálných hodnot b j a chceme najít lineární kombinaci několika funkcí f i, která bude co nejlépe aproximovat hodnoty b j. Skutečné hodnoty zvolených funkcí v bodech y j e M zadají matici clí j = fj(yi), jejíž sloupce jsou dány hodnotami jednotlivých funkcí /} v uvažovaných bodech, a naším úkolem je tedy určit koeficienty x j e M tak, aby součet kvadrátů odchylek od skutečných hodnot
m n m n
J> - C^xjfjtyi)))2 = £(*.■ - (£ w))2
i=i j=i i=i j=i
byla minimální. Jinými slovy, hledáme lineární kombinaci funkcí fi takovou, abychom „dobře" proložili zadané hodnoty bi. Díky předchozí větě jsou hledané optimální koeficienty A{~l)b.
Abychom měli konkrétnější představu, uvažujme pouze dvě funkce f\(x) = x, f2(x) = x2 a předpokládejme, že „naměřené hodnoty" jejich neznámé kombinace g(x) = y\x + y2x2 v celočíselných hodnotách pro x mezi 1 a 10 jsou
bT = (1.44 10.644.4814.5631.1239.2054.8871.28 85.92104.16).
Tento vektor vzniknul výpočtem hodnot x + x2 v daných bodech posunutých o náhodné hodnoty v rozmezí ±8. Matice A = (bij) je tedy v našem případě rovna
'1 234 5 6 7 8 9 10 1 4 9 16 25 36 49 64 81 100,
171
D. ROZKLADY MATIC
5. ROZKLADY MATIC A PSEUDOINVERZE
a hledané koeficienty v kombinaci jsou
Výsledné proložení je možné dobře vidět na obrázku, kde zeleně jsou proloženy zadané hodnoty b lomenou čarou, zatímco červený je graf příslušné kombinace g. Výpočty byly provedeny v systému Maple pomocí příkazu leastsqrs(B,b). Pokud jste s Maplem (nebo jiným podobným softwarem) spřáteleni, zkuste si zaexperimentovat s podobnými úlohami.
x
172
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
173
D. ROZKLADY MATIC 5. ROZKLADY MATIC A PSEUDOINVERZE
174
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
E. Doplňující příklady k celé kapitole
3.47. Model vývoje populace velryb. Pro vývoj populace jsou podstatné samice a u nich není důležitý věk, ale plodnost. Z tohoto hlediska můžeme samice rozdělit na novorozené neboli juve-nilní, tj. dosud neplodné samice, mladé plodné samice, dospělé samice s nej větší plodností a samice postmenopauzní, které již plodné nejsou, ale mají velký význam při ochraně mláďat nebo vyhledávání zdrojů potravy.
Budeme modelovat vývoj takové populace v čase. Za časovou jednotku zvolíme dobu dosažení dospělosti. Novorozená samice, která tuto dobu přežije, dospěje k plodnosti. Vývoj mladé samice do plné plodnosti a vývoj dospělé samice k menopauze závisí na podmínkách prostředí. Přechod do další plodnostní kategorie je tedy náhodný jev. Stejně je náhodným jevem i úmrtí samice. Mladá plodná samice má za jednotku času průměrně méně mláďat, než samice plodná. Tyto poznatky vyjádříme formalizovane.
Označme xi(t), resp. x2(t), resp. x3(t), resp. x4(ř), množství juvenilních, resp. mladých, resp. plně plodných, resp. postmenopauzních, samic v čase t. Množství může vyjadřovat počet jedinců, ale také počet jedinců vztažených na jednotkový areál (tzv. populační hustotu), případně také celkovou biomasu a podobně. Dále označme p\ pravděpodobnost, že juvenilní samice přežije jednotkový časový interval a tedy během něho dospěje, a p2, resp. p3, pravděpodobnost, že během jednotkové doby mladá, resp. plně plodná, samice, která neuhyne, dospěje do následující kategorie, tj. mladá do plné plodnosti a plně plodná k menopauze. Dalším náhodným jevem je umírání (pozitivně řečeno: přežívání) samic, které nedospějí do další kategorie; označme pravděpodobnosti přežití po řadě q2, q3 a q4 pro mladé, plně plodné a postmenopauzní samice. Každé z čísel p\, p2, p3, q2, q3, q4 jakožto pravděpodobnost je z intervalu [0, 1]. Mladá samice může přežít, dospět do plné plodnosti nebo uhynout; tyto jevy jsou neslučitelné, společně tvoří jev jistý a možnost úmrtí nelze vyloučit. Platí tedy p2 + q2 < l.X podobných důvodů platí p3 + q3 < 1. Nakonec ještě označíme f2, resp. f3 průměrný počet dcer mladé, resp. plně plodné, samice. Tyto parametry splňují nerovnost 0 < f2 < f3.
Očekávaný počet novorozených samic v následujícím časovém období je součtem dcer mladých a plně plodných samic, tj.
xx(t + 1) = f2X2(t) + f3X3(t).
Označme na okamžik x2,i(ř + 1) množství mladých samic v čase t + 1, které byly v předchozím období, tj. v čase t juvenilními, a x2_2(r + 1) množství mladých samic, které již v čase t byly plodné, jednotkový časový interval přežily, ale nedosáhly plné plodnosti. Pravděpodobnost p\, že juvenilní samice přežije jednotkový časový interval, můžeme vyjádřit jako klasickou, tj. jako poměr x2,i(ř + l)/xi(ř), a podobně můžeme vyjádřit pravděpodobnost q2 jako poměr x2]2(t + \)/x2(t). Poněvadž mladé samice v čase t + 1 jsou právě ty, které dospěly z juvenilnŕho stádia, a ty, které již plodné byly, přežily a nedospěly k plné plodnosti, platí
x2(t + 1) = x2,i(ř + 1) +x2,2(ř + 1) = pixi'ť) +q2x2(t).
Analogicky odvodíme očekávaný počet plně plodných samic jako
x3(t + 1) = p2x2(t) + q3x3(t)
a očekávaný počet postmenopauzních samic
x4(t + 1) = p3x3(t) + q4x4(t).
175
E. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE
5. ROZKLADY MATIC A PSEUDOINVERZE
10
20
30
40
Obrázek i. Vývoj populace kosatky dravé. Na vodorovné ose je čas v letech, na svislé velikost populace. Jednotlivé plochy zobrazují množství j u venil-ních, mladých, plně plodných a postmenopauzních samic v tomto pořadí zdola.
Nyní můžeme označit
/O f2 h
A =
x(t)
(xx(t)\
x3(t) \x4(t) J
a předchozí rekurentní formule přepsat v maticovém tvaru
0\
Pl 2 0 0 0 P2 3 0
yo o p3 q4j
50
ObrKosatky
x(t + 1) = Ax(t).
Pomocí této maticové diferenční rovnice snadno spočítáme očekávané množství velrybích samic v jednotlivých plodnostních kategoriích, pokud známe složení populace v nějakém počátečním čase.
Konkrétně, pro populaci kosatek dravých byly odpozorovány populační parametry pi= 0,9775, ^2 = 0,9111, f2 = 0,0043, p2 = 0,0736, q3 = 0,9534. f3 = 0,1132, p3 = 0,0452, q4 = 0,9804; časovou jednotkou je v tomto případě jeden rok.
Začneme-li v čase t = 0 s jednotkovým množstvím mladých samic v nějakém neobsazeném
areálu, tj. s vektorem x(0) = (0, 1, 0, 0)T, můžeme spočítat
x(l)
/ 0 0,0043 0,1132 0 > /0\ f0,0043\
0,9775 0,9111 0 0 1 0,9111
0 0,0736 0,9534 0 0 0,0736
V 0 0 0,0452 0,9804y W )
/ 0 0,0043 0,1132 0 \ //0,0043> /0,01224925\
0,9775 0,9111 0 0 0,9111 0,83430646
0 0,0736 0,9534 0 0,0736 0,13722720
V 0 0 0,0452 0,9804/ v0,00332672y
x(2)
a tak můžeme pokračovat dále. Výsledky výpočtu můžeme také znázornit graficky; to je provedeno na obrázku 1. Vyzkoušejte si výpočet a grafické znázornění jeho výsledků i pro jiné počáteční složení
176
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
populace. Výsledkem by mělo být pozorovaní, že celková velikost populace roste jako exponenciální funkce, poměry velikostí jednotlivých plodnostních tříd se postupně ustálí na konstantních hodnotách. Matice A má vlastní hodnoty
ki = 1,025441326, k2 = 0,980400000, A3 = 0,834222976, A4 = 0,004835698,
vlastní vektor příslušný k největší vlastní hodnotě k\ je
w = (0,03697187, 0,31607121, 0,32290968, 0,32404724);
tento vektor je normován tak, aby součet jednotlivých složek byl roven 1.
Porovnejte vývoj velikosti populace s exponenciální funkcí F(t) = k[x0, kde x0 je celková velikost počáteční populace. Vypočítejte také relativní zastoupení jednotlivých plodnostních kategorií v populaci po jisté době vývoje a porovnejte ho se složkami vlastního vektoru w. Shoda je způsobena pouze tím, že matice A má jednu vlastní hodnotu, která má absolutní hodnotu největší z absolutních hodnot všech vlastních hodnot matice A, a tím, že vektorový podprostor generovaný vlastními vektory příslušnými k vlastním hodnotám k2, A3, k4 má s nezáporným orthantem jednoprvkový průnik (pouze nulový vektor). Struktura matice A však sama nezaručuje takto jednoduše předvídatelný vývoj, je totiž tzv. reducibilní (viz ??).
3.48. Model růstu populace bodláků Dipsacus sylvestris. Tuto rostlinu můžeme vidět ve čtyřech podobách. Buď jako kvetoucí rostlinu nebo jako růžici listů, přičemž u růžic můžeme rozlišit trojí velikost - malé, střední a velké. Životní cyklus této jednodomé víceleté byliny můžeme popsat následovně.
Kvetoucí rostlina vyprodukuje v pozdním létě větší množství semen a uhyne. Ze semen některá vyklíčí ještě v temže roce a vyroste z nich růžice listů, nejčastěji střední velikosti. Jiná semena zůstanou v zemi a přezimují. Některá z přezimujících semen na jaře vyklíčí a vyroste z nich růžice listů; poněvadž jsou ale prezimovaním oslabena, bude tato růžice s nejvyšší pravděpodobností malá. Většina z přezimujících semen zůstane v zemi, a ta z nich, která přežijí, na jaře vyklíčí a vyrostou z nich malé růžice. Po třech nebo více zimách „spící" (odborně řečeno dormantní) semena hynou, ztrácí schopnost vyklíčit. Podle podmínek prostředí, kde rostlina roste, může malá nebo střední růžice listů do dalšího roku vyrůst, kterákoliv z růžic může zůstat ve své velikostní kategorii nebo uhynout - uschnout, být sežrána nějakým hmyzem a podobně. Střední nebo velká růžice může v následujícím roce vykvést. Kvetoucí rostlina produkuje semena a celý cyklus se opakuje.
Abychom mohli předpovídat, jak rychle se bude populace uvažovaných bodláků v krajině šířit, potřebujeme popsané procesy nějak kvantifikovat. Botanici zjistili, že kvetoucí rostlina vyprodukuje průměrně 431 semen. Pravděpodobnosti klíčení různých semen, růstu růžic listů a vykvetení jsou shrnuty v tabulce:
177
E. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE
5. ROZKLADY MATIC A PSEUDOINVERZE
jev
pravděpodobnost
semeno vyprodukované rostlinou uhyne
ze semene vyroste malá růžice v temže roce
ze semene vyroste střední růžice v temže roce
ze semene vyroste velká růžice v temže roce
ze semene přezimujícího rok vyroste malá růžice
ze semene přezimujícího rok vyroste střední růžice
ze semene přezimujícího rok vyroste velká růžice
ze semene přezimujícího dva roky vyroste malá růžice
semeno po prvním prezimovaní uhyne
malá růžice přežije a nevyroste
střední růžice přežije a nevyroste
velká růžice přežije a nevyroste
z malé růžice vyroste střední
z malé růžice vyroste velká
ze střední růžice vyroste velká
střední růžice vykvete
velká růžice vykvete
0,172 0,008 0,070 0,002 0,013 0,007 0,001 0,001 0,013 0,125 0,238 0,167 0,125 0,036 0,245 0,023 0,750
Povšimněme si, že všechny relevantní jevy v životním cyklu rostliny mají pravděpodobnost přiřazenu a že se jedná o jevy neslučitelné.
Budeme si představovat, že populaci pozorujeme vždycky na začátku vegetačního roku, řekněme v březnu, a že ke všem uvažovaným jevům dochází ve zbytku času, dejme tomu od dubna do února. V populaci se vyskytují kvetoucí rostliny, růžice tří velikostí, vyprodukovaná semena a semena dor-mantní jeden nebo dva roky. Toto pozorování by mohlo svádět k tomu, že populaci rozdělíme do sedmi tříd - semena čerstvá, dormantní první rok a dormantní druhý rok, růžice malé střední a velké, kvetoucí rostliny. Avšak z vyprodukovaných semen se v temže roce vyvinou buď růžice nebo semena přezimují. Čerstvá semena tedy netvoří samostatnou třídu, jejíž velikost bychom na začátku roku
mohli určit. Označme tedy:
%\ (ŕ) — počet semen dormantních první rok na jaře roku ř
*2(0 — počet semen dormantních druhý rok na jaře roku ř
x3(t) — počet malých růžic na jaře roku t
x4(t) — počet středních růžic na jaře roku t
x5(t) — počet velkých růžic na jaře roku t
x6(t) — počet kvetoucích rostlin na jaře roku t Počet vyprodukovaných semen v roce t je 431x6(ř). Pravděpodobnost, že semeno zůstane jako dormantní první rok, je rovna pravděpodobnosti, že ze semena nevyroste žádná růžice a že neuhyne, tedy 1 - (0,008 + 0,070 + 0,002 + 0,172) = 0,748. Očekávaný počet semen dormantních jednu zimu v následujícím roce tedy je
Pravděpodobnost, že semeno, které již jeden rok bylo dormantní, zůstane dormantním i druhý rok je rovna pravděpodobnosti, že ze semena dormantnŕho jeden rok nevyroste žádná růžice a že neuhyne, tedy 1 — 0,013 — 0,007 — 0,001 — 0,013 = 0,966. Očekávaný počet semen dormantních dvě zimy v následujícím roce tedy bude
Malá růžice může vyrůst ze semena bezprostředně, ze semena dormantního jeden rok nebo dormantního dva roky. Očekávaný počet malých růžic vyrostlých bezprostředně v roce t je roven
xi(t + 1) = 0,748 • 431x6(ř) = 322,388x6(ř).
x2(t + 1) = 0,966x!(ř).
178
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
0,008 • 431x6(ŕ) = 3,448x6(ŕ). Očekávaný počet malých růžic vyrostlých ze semen dormantních jeden a dva roky je 0,013xi (ř) a 0,010x2(ŕ). S těmito nově vyrostlými malými růžicemi jsou v populaci rostlin také malé růžice starší, které nevyrostly; těch je 0,125x3(r). Celkový očekávaný počet malých růžic tedy je
x3(t + 1) = 0,013x^0 + 0,010x2(r) + 0,125x3(r) + 3,448x6(r). Analogicky určíme očekávaný počet středních a velkých růžic
x4(t + 1) =0,007x^0 + 0,125x3(ř) + 0,238x4(r) + 0,070 • 431x6(r) = =0,007xi (ř) + 0,125x3 (ř) +0,238x4(ř) + 30,170x6,
x5(t + 1) =0,245x4(ř) +0,167x5(ř) +0,002 • 431x6(ř) =
=0,245x4 (ř) +0,167x5 (ř) +0,862x6(ř).
Kvetoucí rostlina může vyrůst ze střední nebo velké růžice. Očekávaný počet kvetoucích rostlin tedy bude
x6(t + 1) = 0,023x4(ř) + 0,750x5 (ř).
Dospěli jsme tedy k šesti rekurentním formulím pro jednotlivé složky populace studované rostliny. Označíme nyní
/ 0 0 0 0 0 322,388\ (xi(t)\
0,966 0 0 0 0 0 x2(t)
0,013 0,010 0,125 0 0 3,448 , x(ř) = x3(ř)
0,007 0 0,125 0,238 0 30,170 x4(ř)
0,008 0 0,038 0,245 0,167 0,862 x5(t)
V 0 0 0 0,023 0,750 o ) \*6(0 /
a předchozí rovnosti zapíšeme v maticovém tvaru vhodném pro výpočet
x(t + 1) = Ax(ř).
Pokud známe počty jednotlivých složek populace v nějakém počátečním roce t = 0, můžeme vypočítat očekávané počty rostlin a semen v letech následujících. Můžeme také počítat celkový počet jedinců
6
n(t) v čase t, n(t) = ^ Xi(t), relativní zastoupení jednotlivých složek Xi(t)/n(t), i = 1, 2, 3, 4, 5, 6
i=\
a meziroční relativní změnu populace n(t + \)/n(t). Výsledky takového výpočtu pro patnáct let a
případ, že na nějakou lokalitu jsme přesadili jednu kvetoucí rostlinu, jsou uvedeny v tabulce 1. Na
rozdíl od populace velryb by nyní obrázek nebyl příliš přehledný, počty rostlin jsou oproti počtům
semen zanedbatelné, v obrázku by splynuly.
Matice A má vlastní hodnoty X.i = 2,3339
A2 = -0,9569 + 1,4942i A3 = -0,9569 - 1,4942i Vlastní vektor příslušný k vlastní hodnotě k\ je
A-4
k6
0,1187 + 0,1953i 0,1187 -0,1953i -0,1274
w
(0,6377, 0,2640, 0,0122, 0,0693, 0,0122, 0,0046);
tento vektor je normován tak, aby součet jeho složek byl roven jedné. Vidíme, že s rostoucím časem t se relativní změna velikosti populace přibližuje vlastní hodnotě k\, relativní zastoupení jednotlivých složek populace se přibližují složkám normovaného vlastního vektoru příslušného k vlastní hodnotě
179
E. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE
5. ROZKLADY MATIC A PSEUDOINVERZE
t XI x2 x3 XA x5 Xg n{t) 1
0 0,00 0,00 0,00 0,00 0,00 1,00 1,00
1 322,39 0,00 3,45 30,17 0,86 0,00 356,87
2 0,00 311,43 4,62 9,87 10,25 1,34 337,50
3 432,13 0,00 8,31 43,37 5,46 7,91 497,18
4 2550,50 417,44 33,93 253,07 22,13 5,09 3 282,16
5 1 641,69 2463,78 59,13 235,96 91,78 22,42 4514,76
6 7 227,10 1585,88 130,67 751,37 107,84 74,26 9 877,12
7 23 941,29 6981,37 382,20 2486,25 328,89 98,16 34 218,17
8 31646,56 23 127,29 767,29 3 768,67 954,73 303,85 60 568,39
9 97 958,56 30570,58 1 786,27 10381,63 1 627,01 802,72 143 126,78
10 258 788,42 94627,97 4570,24 27 597,99 4358,70 1 459,04 391 402,36
11 470376,19 249 989,61 9 912,57 52970,28 10991,08 3 903,78 798 143,52
12 1258 532,41 454383,40 23 314,10 134915,73 22317,98 9 461,62 1 902 925,24
13 3 050314,29 1215 742,31 56442,70 329 291,15 55 891,57 19 841,54 4727 523,56
14 6396675,73 2946603,60 127 280,49 705 398,22 133 660,97 49 492,37 10359 111,38
15 15 955 747,76 6179188,75 299182,59 1 721 756,52 293 816,44 116469,89 24566161,94
*2(0 x3(ř) x4(ř) *s(0 x6(t) n(t + 1)
ř n(t) n(t) n(t) n(t) n(t) n(t) n(t)
0 0,000 0,000 0,000 0,000 0,000 1,000 356,868
1 0,903 0,000 0,010 0,085 0,002 0,000 0,946
2 0,000 0,923 0,014 0,029 0,030 0,004 1,473
3 0,869 0,000 0,017 0,087 0,011 0,016 6,602
4 0,777 0,127 0,010 0,077 0,007 0,002 1,376
5 0,364 0,546 0,013 0,052 0,020 0,005 2,188
6 0,732 0,161 0,013 0,076 0,011 0,008 3,464
7 0,700 0,204 0,011 0,073 0,010 0,003 1,770
8 0,522 0,382 0,013 0,062 0,016 0,005 2,363
9 0,684 0,214 0,012 0,073 0,011 0,006 2,735
10 0,661 0,242 0,012 0,071 0,011 0,004 2,039
11 0,589 0,313 0,012 0,066 0,014 0,005 2,384
12 0,661 0,239 0,012 0,071 0,012 0,005 2,484
13 0,645 0,257 0,012 0,070 0,012 0,004 2,191
14 0,617 0,284 0,012 0,068 0,013 0,005 2,371
15 0,650 0,252 0,012 0,070 0,012 0,005
Tabulka i. Modelovaný vývoj populace bodláku Dipsacus sylvestris. Velikosti jednotlivých složek populace, celková velikost populace, relativní zastoupení jednotlivých složek a relativní přírůstky velikosti.
x\. Každá nezáporná matice, která má nenulové prvky na stejných pozicích jako matice a je primitivní. Vývoj populace tedy zákonitě spěje ke stabilizované struktuře.
3.49. Nelineární model populace. Prozkoumejte podrobně vývoj populace pro nelineární model z učebnice (1.12) a hodnoty K = 1 a
i) míru růstu r = 1 a počáteční stav p(l) = 0,2
Ü) míru růstu r = 1 a počáteční stav p(\) = 2
iii) míru růstu r = 1 a počáteční stav p(\) = 3
iv) míru růstu r = 2, 2 a počáteční stav p(\) = 0,2
v) míru růstu r = 3 a počáteční stav p(\) = 0,2
Spočítejte několik prvních členů a odhadněte, jak bude populace dále růst. Řešení.
180
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
i) Prvních deset členů posloupnosti p(n) je v následující tabulce. Odtud je vidět, že velikost populace konverguje k hodnotě 1.
n P(n)
1 0,2
2 0,36
3 0,5904
4 0,83222784
5 0,971852502
6 0,999207718
7 0,999999372
Graf vývoje populace pro r = 1 a p(\) = 0, 2:
ii) Pro počáteční hodnotu p(\) =2 dostaneme p(2) = 0 a dál už se populace měnit nebude.
iii) Pro p(\) = 3 dostáváme
n P(n)
1 3
2 -15
3 -255
4 -65535
a odtud je vidět, že populace bude klesat pode všechny meze. iv) Pro míru růstu r = 2, 2 a počáteční stav p(\) = 0, 2 dostáváme
n P(n)
1 0,2
2 0,552
3 1,0960512
4 0,864441727
5 1,122242628
6 0,820433675
7 1,144542647
8 0,780585155
9 1,157383491
10 0,756646772
11 1,161738128
12 0,748363958
!3 1,162657716
14 0,74660417
Vidíme, že místo konvergence dostáváme v tomto případě oscilaci-po nějaké době bude populace přeskakovat mezi hodnotami 1,16 a 0,74. Graf vývoje populace pro r = 2, 2 a p(\) = 0, 2 pak vypadá následovně: v) Pro míru růstu r = 3 a počáteční stav p(\) = 0, 2 dostáváme
181
E. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE
5. ROZKLADY MATIC A PSEUDOINVERZE
n P(n)
1 0,2
2 0,68
3 1,3328
4 0,00213248
5 0,008516278
6 0,033847529
7 0,131953152
8 0,475577705
9 1,223788359
10 0,402179593
11 1,123473097
12 0,707316989
13 1,328375987
14 0,019755658
15 0,077851775
16 0,293224403
17 0,91495596
18 1,148390614
19 0,63715945
20 1,330721306
21 0,010427642
22 0,041384361
23 0,160399447
V tomto případě je už situace složitější-populace začne oscilovat mezi více hodnotami. Abychom lépe viděli mezi kterými, bylo by potřeba spočítat ještě víc členů. Pro členy z tabulky máme následující graf
□
3.50. V laboratoři je prováděn pokus se stejnou pravděpodobností úspěchu i neúspěchu. Pokud se pokus podaří, bude pravděpodobnost úspěchu druhého pokusu 0, 7. Jestliže skončí první pokus neúspěchem, bude pravděpodobnost úspěchu druhého pokusu pouze 0, 6. Dále se bude pokračovat v provádění pokusů, kdy úspěšnost předešlého znamená, že pravděpodobnost úspěchu následujícího bude 0, 7, a jeho neúspěšnost způsobí, že pravděpodobnost úspěchu následujícího bude 0, 6. Pro libovolné n e N stanovte pravděpodobnost, že n-tý pokus se podaří.
Řešení. Zaveďme pravděpodobnostní vektor
kde x\ je pravděpodobnost úspěchu n-tého pokusu a x2 = \ —x\ je pravděpodobnost jeho neúspěchu. Podle zadání je
a zřejmě také
_ /0, 7 0, 6\ /l/2\ _ /l3/20\ Xl ~ {O, 3 0,4)' \l/2) ~\ 7/20 ) ■
Při označení
/7/10 3/5\ V3/10 2/5J
182
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
platí
ves013666
(3.7)
*-« + !
T-x„, n e N,
ves013665
neboť pravděpodobnostní vektor xn+\ závisí pouze na xn a tato závislost je totožná jako pro x2 a.x\. Ze vztahu (3.7) bezprostředně plyne
(3.8)
T T x
n-l
Tn-xu n > 2, n e N.
Proto vyjádříme T", n e N. Jedná se o Markovův proces, a tudíž je 1 vlastní číslo matice T. Druhé vlastní číslo 0, 1 vyplývá kupř. z toho, že stopa (součet prvků na diagonále) je rovna součtu všech vlastních čísel (každé vlastní číslo bereme tolikrát, jaká je jeho algebraická násobnost). Těmto vlastním číslům pak přísluší vlastní vektory
Dostáváme tak T =
tj. pro n e N je
1
1 o 0 1/10
1 o
0 1/10
1" o
0 10""
Dosazení
a roznásobení dává
1 (2 +10-3 V1 " 10~
Odtud, z (3.7) a (3.8) plyne
1
-i' 3 U
2 - 2 • 10"" 1 + 2 • 10""
1 1 3 + 6-10"
n e N.
n e N.
6-10"
Zvláště vidíme, že pro velká n je pravděpodobnost úspěchu ři-tého pokusu blízká 2/3.
□
3.51. Student na koleji je značně společensky unaven (v důsledku toho není schopen plně vnímat smyslové podněty a koordinovat své pohyby). V tomto stavu se přesto rozhodne, že na právě probíhající večírek pozve známou, která má pokoj na jednom konci chodby. Na opačném konci chodby však bydlí někdo, koho pozvat rozhodně nehodlá. Je ovšem natolik „unaven", že rozhodnutí udělat krok zvoleným směrem se mu podaří realizovat pouze v 53 ze 100 pokusů (ve zbylých 47 jde přesně na opačnou stranu). Za předpokladů, že vyjde v polovině chodby a že vzdálenost k oběma dveřím na koncích chodby odpovídá jeho 20 krokům, stanovte pravděpodobnost, že nejdříve dorazí ke správným dveřím.
183
E. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE
5. ROZKLADY MATIC A PSEUDOINVERZE
3.52. Nechť n e N osob hraje tzv. tichou poštu. Pro jednoduchost předpokládejte, že první osoba zašeptá druhé právě jedno (libovolně zvolené) ze slov „ano", „ne". Druhá osoba pak potichu řekne třetí osobě to ze slov „ano", „ne", o kterém si myslí, že ho řekla první osoba. Takto to pokračuje až k n-té osobě. Jestliže pravděpodobnost toho, že při libovolném předání se zamění (nechtě, úmyslně) šířené slovo na to druhé, je p e (0, 1), stanovte pro velká n e N pravděpodobnost, že n-tá osoba určí správně slovo zvolené první osobou.
Řešení. Na tuto úlohu lze nahlížet jako na Markovův řetězec se dvěma stavy nazvanými Ano a Ne, kdy řekneme, že proces je ve stavu Ano v čase m e N, pokud si m-tá osoba bude myslet, že předávané slovo je „ano". Pro pořadí stavů Ano, Neje pravděpodobnostní matice přechodu
Součin matice Tm~ a pravděpodobnostního vektoru počáteční volby první osoby potom udává pravděpodobnosti toho, co si bude myslet m-tá osoba. Mocniny této matice ovšem počítat nemusíme, neboť všechny prvky matice T jsou kladná čísla. Navíc tato matice je dvojnásobně stochastická. Víme tudíž, že pro velká n e N bude pravděpodobnostní vektor blízký vektoru (1/2, 1 /2)T. Pravděpodobnost, že n-tá osoba řekne „ano", je proto přibližně stejná jako pravděpodobnost, že řekne „ne", a to nezávisle na tom, pro které slovo se rozhodla první osoba. Pro velký počet zúčastněných tak platí, že zhruba polovina z nich uslyší „ano" (zopakujme, že nezávisle na tom, které slovo bylo na začátku vybráno).
Pro úplnost zjistěme, jak by úloha dopadla, kdybychom předpokládali, že pravděpodobnost záměny „ano" na „ne" je u libovolné osoby p e (0, 1) a pravděpodobnost záměny „ne" na „ano" je obecně odlišné q e (0, 1). V tomto případě pro stejné pořadí stavů dostáváme pravděpodobnostní matici přechodu
Rovněž tentokrát při dostatečném počtu lidí nezáleželo na volbě slova, kterou učinila první osoba. Stručně řečeno, v tomto modelu platí, že nezáleží na původním rozhodnutí, protože o tom, jakou informaci si lidé předávají, rozhodují oni sami; přesněji řečeno, lidé sami rozhodují o četnosti výskytu „ano" a „ne", pokud je jich dostatečný počet (a chybí-li jakékoli ověřování).
Doplňme ještě, že výše uvedený závěr byl experimentálně ověřen. V psychologických pokusech byl mj. jedinec opakovaně vystaven vjemu, který šlo vnímat dvěma různými způsoby, a to v časových intervalech zaručujících, aby si subjekt pamatoval předešlý vjem. Viz např. „T. Havránek a kol.: Matematika pro biologické a lékařské vědy, Praha, Academia 1981", kde je uveden experiment, v němž je zábleskem osvětlován v pevných časových odstupech nejednoznačný obraz (třeba náčrt krychle vnímatelný jako nadhled i podhled). Takový proces je totiž Markovovým řetězcem s maticí přechodu
která vede (pro velká n e N) k pravděpodobnostnímu vektoru blízkému vektoru
\p + q p + q což kupř. plyne z vyjádření matice
kde p,q e (0, 1).
□
184
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET
3.53. V jisté hře si můžete vybrat jednoho ze dvou soupeřů. Pravděpodobnost, že porazíte lepšího, je 1/4, zatímco horšího ze soupeřů porazíte s pravděpodobností 1/2. Soupeři ale nejsou rozlišeni, a tak nevíte, který z nich je ten lepší. Čeká Vás velké množství her (pro každou můžete zvolit jiného soupeře) a samozřejmě chcete dosáhnout celkově co největšího podílu vítězných her. Uvažte tyto dvě strategie:
1. Pro první hru si vyberete soupeře náhodně. Pokud nějakou hru vyhrajete, pokračujete se stejným soupeřem; jestliže ji prohrajete, změníte pro další hru soupeře.
2. Pro první dvě hry si vyberete (jednoho) soupeře náhodně. Dále se řídíte výsledkem předchozích dvou her, kdy na další dvě hry změníte soupeře, právě když obě předchozí prohrajete.
Kterou ze strategií (moudře) zvolíte?
Řešení. Obě strategie jsou vlastně Markovovým řetězcem. Pro jednoduchost horšího ze soupeřů označujme jako osobu A a lepšího ze soupeřů jako osobu B. V prvním případě pro stavy „hra s osobou A", „hra s osobou 5" (a toto jejich pořadí) dostáváme pravděpodobnostní matici přechodu
'1/2 3/4^ ,1/2 1/4,
Tato matice má všechny prvky kladné, a proto stačí najít pravděpodobnostní vektor x^, který přísluší vlastnímu číslu 1. Platí
3 2X T
.5 5,
Jeho složky odpovídají pravděpodobnostem, že po dlouhé řadě her bude soupeřem osoba A, resp. B.
Lze tedy očekávat, že 60 % her bude hráno proti horšímu ze soupeřů. Neboť
2 _ 3 1 2 1
5 = 5 ' 2 + 5 ' 4' vítězných her bude kolem 40 %.
Pro druhou strategii zaveďme stavy „dvě hry po sobě s osobou A" a „dvě hry po sobě s osobou 5",
které vedou na pravděpodobnostní matici přechodu
'3/4 9/16N 1/4 1/16,
Snadno určíme, že nyní je
9 4 13' 13,
Proti horšímu ze soupeřů by se tak hrálo (9/4)krát častěji než proti lepšímu z nich. Připomeňme, že
pro první strategii to bylo (3/2)krát častěji. Druhá strategie je proto výhodnější. Ještě poznamenejme,
že při druhé strategii bude přibližně 42,3 % her vítězných. Stačí totiž vyčíslit
11 9 1 4 1
0, 423 = — =---+---.
26 13 2 13 4
□
3.54. Petr se pravidelně setkává se svým kamarádem. Je ovšem „proslulý" svou nedochvilností. Snaží se ale změnit, a proto platí, že v polovině případů přijde včas a v jedné desetině případů dokonce ještě dříve, pokud na minulé setkání přišel pozdě. Jestliže minule přišel včas nebo dříve, než měl přijít, vrátí se ke své „bezstarostnosti" a s pravděpodobností 0,8 dorazí pozdě a pouze s pravděpodobností 0,2 včas. Jaké je pravděpodobnost, že na dvacáté setkání přijde pozdě, když na jedenácté přišel včas?
185
E. DOPLŇUJÍCÍ PŘÍKLADY K CELÉ KAPITOLE
5. ROZKLADY MATIC A PSEUDOINVERZE
Řešení. Zřejmě se jedná o Markovův proces se stavy „Petr přijde pozdě", „Petr přijde včas", „Petr přijde dříve" a s pravděpodobnostní maticí přechodu (pro uvedené pořadí stavů)
/0,4 0,8 0, 8\ T = 0,5 0,2 0,2 . \0, 1 0 0/
Jedenácté setkání je určeno pravděpodobnostním vektorem (0, 1, 0)T (s jistotou víme, že Petr přišel včas). Dvacátému setkání pak odpovídá pravděpodobnostní vektor
/0\ /0,571578 368\ T9 1 = 0,371316 224 . \0/ \0, 057 105 408/
Hledaná pravděpodobnost je tudíž 0, 571 578 368 (přesně). Dodejme, že je
/0, 571 316224 0,571578 368 0,571578 368\ T9 = 0,371512832 0,371316224 0,371316224 . \0,057170944 0,057105 408 0,057105 408/
Odtud vidíme, jak málo záleží na tom, zda přišel na jedenácté setkáni pozdě (první sloupec), včas nebo dříve (druhý a současně třetí sloupec). □
3.55. Dva studenti A a S tráví každé pondělní odpoledne hraním jisté počítačové hry o to, kdo z nich večer zaplatí společnou útratu v restauraci. Hra může rovněž skončit remízou, kdy večer oba platí právě polovinu útraty. Výsledek předešlé hry částečně ovlivňuje hru následující. Pokud tedy před týdnem vyhrál student A, potom s pravděpodobností 3/4 vyhraje opět a s pravděpodobností 1 /4 skončí hra remízou. Remíza se opakuje s pravděpodobností 2/3 a s pravděpodobností 1 /3 vyhraje ve hře následující po remíze student B. Pokud před týdnem vyhrál student B, pak s pravděpodobností 1 /2 své vítězství zopakuje a s pravděpodobností 1/4 vyhraje student A. Nalezněte pravděpodobnost, že dnes bude každý platit polovinu útraty, jestliže první hru před velmi dlouhou dobou vyhrál student A.
Řešení. Vlastně je zadán Markovův proces se stavy „vyhraje student A", „hra skončí remízou", „vyhraje student 5" (v tomto pořadí) pravděpodobnostní maticí přechodu
/3/4 0 l/4\ T = 1/4 2/3 1/4 . V 0 1/3 1/2/
Chceme najít pravděpodobnost přechodu z prvního stavu do druhého po velkém počtu n e N kroků (týdnů). Matice T je regulární, protože
/ 9/16 1/12 5/16 \ T2 = 17/48 19/36 17/48 . \ 1/12 7/18 1/3 /
Stačí tak najít vlastní pravděpodobnostní vektor x^ matice T příslušný vlastnímu číslu 1. Snadno lze spočítat, že
_ /2 3 2 X°° ~ Vř 7' 7
Víme, že vektor x^ se jen velmi málo liší od pravděpodobnostního vektoru pro velká n a téměř nezávisí na počátečním stavu, tj. pro velká n e N můžeme klást
/2/7 2/7 2/7\ T" « 3/7 3/7 3/7 . \2/7 2/7 2/7/
186
KAPITOLA 3. LINÁRNÍ MODELY A MATICOVÝ POČET_
Hledaná pravděpodobnost je prvkem této matice na druhé pozici v prvním sloupci (je druhou složkou vektoru jc^). Poměrně rychle jsme nalezli výsledek 3/7. □
187
e. doplňující príklady k cele kapitole
5. rozklady matic a pseudoinverze
3.9.
2\/3 sin(n • (tt/6)) — 4cos(n • (jr/6)). -3(-l)" - 2cos(« • (2tt/3)) - 2-v/3sin(n • ((2tt/3)). (-l)"(-2«2 + 8n -7).
2aX — 2a
3.10. xn
3.11. x„
3.12. x„
3.20. Leslieho matice daného modeluje (úmrtnost v první skupině označíme a)
'0 2 2\ a 0 0 ^0 1 0)
Podmínka stagnace populace odpovídá tomu, že matice má vlastní hodnotu 1, neboli polynom X3 má mít kořen 1, t.j a — 1/4. 3.23.
1 5
4
5
Matice má dominantní vlastní hodnotu 1, příslušný vlastní vektor je (|, 1). Protože je vlastní hodnota dominantní, tak se poměr diváků se ustálí na poměru 6:5.
3.26. Stejně jako v (3.25) skončí hra po třech sázkách. Jsou tedy opět všechny mocniny A, počínaje A3 shodné.
> 100
3.37. Můžeme využít výsledku úlohy označované jako Ruinovaní hráče. Pravděpodobnost, že zanikne to oddělení, které má nyní 40 zaměstnanců, je podle tohoto příkladu rovna
1 _ ( 0.46 f 1 \ 1-0,46,/
/l 7/8 3/4 1/2 o\
0 0 0 0 0
0 0 0 0 0
0 0 0 0 0
\o 1/8 1/4 1/2 1/
,25
= 0, 56.
1 _ / 0.46 \ 1 \ 1-0,46,/
Stačilo dosadit p — 1 — 0, 54, y — 10/2 a x — 40/2 do (3.6). Prozíravější je tedy zvolit v tuto chvíli menší
oddělení. 3.38.
• Tvrzení je pravdivé. (B := A A, bij — (i-tý řádek A ) • (j-tý sloupec A)= bji — (j-tý řádek AT) ■ (i-tý sloupec A)=(j-tý sloupec A) ■ (i-tý řádek AT)
Tvrzení zřejmě neplatí. Uvažte např. A
n 1 .0 1
3.40.
1 / \0 0 0
3.57. Znovu se jedná o speciální případ Ruinovaní hráče. Stačí zadání vhodně přeformulovat. Pro p — 0, 47, y — 20 a x — 20 z (3.6) plyne výsledek
.20
1
0,917 = -
1
V 1-0,47 J
V 1-0,47 J
188
KAPITOLA 4
Analytická geometrie
poloha, incidence, projekce ? — a zase skončíme u matic...
Vrátíme se teď k úlohám elementární geometrie z podobného pohledu, jako když jsme zkoumali polohy bodů v rovině v 5. části první kapitoly, viz 1.23. Budeme se nejprve zajímat o vlastnosti objektů vymezených pomocí bodů, přímek, rovin apod. Podstatné přitom bude vyjasnění, které vlastnosti závisí či nezávisí na pojmu velikosti vektorů.
V další části pak použijeme lineární algebru pro studium objektů, které už lineárně definované nejsou. Opět přitom budeme potřebovat trochu více maticového počtu. Výsledky budou naprosto zásadní později při diskusi technik pro optimalizace, tj. hledání extrémů funčkních hodnot.
Projektivní rozšíření afinních prostorů nám v závěru kapitoly ukáže, jak lze překvapivě dosáhnout zjednodušení i stability algoritmických postupů typických pro práci s počítačovou grafikou.
1. Afinní a euklideovská geometrie
Když jsme si ujasňovali dopady obecné teorie na systémy rovnic v první části předchozí kapitoly, zjistili jsme v ostavci 3.1, že všechna řešení nehomogenních systémů rovnic sice netvoří vektorové podprostory, vždy ale vznikají tak, že k jednomu jedinému řešení přičteme celý vektorový prostor řešení příslušné homogenní soustavy. Naopak, rozdíl dvou řešení nehomogenní soustavy je vždy řešením homogenní. Obdobně se chovají lineární difereční rovnice, jak jsme viděli již v odstavci 3.11.
Návod na teoretické uchopení takové situace dává již diskuse geometrie roviny, viz odstavec 1.25 a dále. Tam jsme totiž popisovali přímky a body jako množiny řešení systémů lineárních rovnic. Přímka pro nás pak byla „jednorozměrným" prostorem, přestože její body byly popisovány dvěmi souřadnicemi. Parametricky jsme ji zadávali tak, že k jednomu bodu (tj. dvojici souřadnic) jsme přičítali násobky pevně zvoleného směrového vektoru. Stejně budeme postupovat i teď v libovolné dimenzi.
___^_j Standardní afinní prostor [
4.1. Afinní prostory. Standarní afinní prostor A„ je množina všech bodů v W = A„ spolu s operací, kterou k bodu A = (a\,...,an) e A„ a vektoru v = (vi, ..., vn) e W = V přiřadíme bod
A + v = (ai + vi, ..., a„ + v„) e R" = A„.
A. Afinní geometrie
4.1. Napište parametrické vyjádření přímky určené rovnicemi
x - 2y + z = 2, 2x + y - z = 5
vl3.
Řešení. Zřejmě postačuje vyřešit uvedenou soustavu rovnic. Můžeme ale postupovat také odlišně. Potřebujeme totiž najít nenulový (směrový) vektor, který bude kolmý na (normálové) vektory (1, —2, 1), (2, 1, —1). Vektorový součin
(1, -2, 1) x (2, 1, -1) = (1,3,5) ovšem takový vektor dává. Všimneme-li si, že např. uspořádaná trojice
(x, y, Z) = (2,-1,-2) vyhovuje dané soustavě, dostaneme výsledek
[2,-1,-2]+ t (1,3, 5), íel.
□
4.2. Rovinu
q : [0, 3, 2, 5] + t (1, 0, 1, 0) + s (2, -1, -2, 2), í,sel ve čtyřrozměrném eukleidovském prostoru zadejte implicitně.
189
A. AFINNÍ GEOMETRIE
1. AFINNÍ A EUKLIDEOVSKÁ GEOMETRIE
4.3. Parametricky vyjádřete průnik následujících rovin v M3: er:2x+3y — z + 1 = 0 a p : x — 2y + 5 = 0.
Řešení. Úkolem je najít soustavu lineárních rovnic čtyř proměnných x, y, z, u (čtyři proměnné jsou dány dimenzí prostoru), jíž budou vyhovovat právě souřadnice bodů uvedené roviny. Poznamenejme, že hledaná soustava bude obsahovat 2 = 4—2 lineárně nezávislé rovnice. Příklad vyřešíme tzv. eliminací parametrů. Body [x, y, z, u] e q splňují
x = t + 2s,
y = 3 — s,
z = 2 + t - 2s,
u = 5 + 2s,
přičemž í,s é1. Odtud můžeme ihned přejít k maticovému zápisu
/1 2 -1 0 0 0 0 \
0 -1 0 -1 0 0 3
1 -2 0 0 -1 0 2
2 0 0 0 -1 5/
kde první dva sloupce jsou směrové vektory roviny, za svislou čarou následuje záporně vzatá jednotková matice a za druhou svislou čarou jsou souřadnice bodu [0, 3, 2, 5]. Tento přepis vzniká tak, že na výše uvedenou soustavu rovnic nahlížíme jako na soustavu rovnic pro neznámé t, s, x, y, z, u a všechny členy přitom převádíme na jednu stranu rovnic. Získanou matici převedeme pomocí elementárních řádkových transformací do tvaru, kdy před první svislou čarou bude maximální možný počet nulových řádků. Přičtením (—1)násobku prvního a současně (—4)násobku druhého řádku ke třetímu řádku a dvojnásobku druhého ke čtvrtému řádku dostáváme
/1 2 -1 0 0 0 0 \
0 -1 0 -1 0 0 3
1 -2 0 0 -1 0 2
\0 2 0 0 0 -1 5 )
/1 2 -1 0 0 0 0
0 -1 0 -1 0 0 3
0 0 1 4 -1 0 -10
\0 0 0 -2 0 -1 11 )
Odkud plyne výsledek
x + 4y - z - 10= 0,
-2y - u + 11 = 0.
Koeficienty za první svislou čarou v řádcích, které jsou před touto svislou čarou nulové, určují totiž koeficienty obecných rovnic roviny.
Tyto operace splňují následující tři vlastnosti:
(1) A + 0 = A pro všechny body A e A„ a nulový vektor 0 e y
(2) A+(v+w) = (A+v)+w pro všechny vektory v, w e V, A e A„
(3) pro každé dva body A, B e A„ existuje právě jeden vektor v e V takový, že A + v = B. Značíme jej B — A, někdy také AB.
Vektorový prostor M." nazýváme zaměření afinního prostoru
Všimněme si několika formálních nebezpečí. Používáme stejný symbol „+" pro dvě různé operace: přičtení vektoru ze zaměření k bodu v afinním prostoru, ale také sčítání vektorů v zaměření V = W. Také nezavádíme zvláštní písmena pro samotnou množinu bodů afinního prostoru, tj. A„ pro nás představuje jak samotnou množinu bodů, tak i celou strukturu definující afinní prostor.
Proč vlastně chceme rozlišovat množinu bodů prostoru A„ od jeho zaměření V, když se jedná jakoby o stejné W? Jde o velice podstatný formální krok k pochopení geometrie vř:
Geometrické objekty jako přímky, body, roviny apod. nejsou totiž přímo závislé na vektorové struktuře na množině W a už vůbec ne na tom, že pracujeme s n-ticemi skalárů. Potřebujeme jen umět říci, co to znamená pohybovat se „rovně v daném směru". K tomu právě potřebujeme na jedné straně vnímat třeba rovinu jako neohraničenou desku bez zvolených souřadnic, ale s možností posunout se o zadaný vektor. Když přejdeme navíc k takovému abstraktnímu pohledu, budeme umět diskutovat „rovinnou geometrii" pro dvourozměrné podprostory, tj. roviny ve vícerozměrných prostorech, „prostorovou" pro třírozměrné atd., aniž bychom museli přímo manipulovat &-ticemi souřadnic.
Tento pohled je zachycen v následující definici:
Nadále nebudeme rozlišovat AaV v označení. Z axiomů okamžitě plyne pro libovolné body A, B, C v afinním prostoru A
(4) A - A = 0 e V
(5) B - A = -(A- B)
(6) (C - B) + (B - A) = (C - A).
4.1a 4.2. Definice. Afinním prostorem A se zaměřením V rozumíme množinu bodů V, spolu se zobrazením
V x V V, (A, v) A + v,
splňujícím vlastnosti (l)-(3) výše.
Pro libovolný pevně zvolený vektor v e V je tak definováno posunutí rv : A —> „4. jako zúžené zobrazení
rv : V ~ V x {v} V, A ^ A + v.
Dimenzí afinního prostoru A rozumíme dimenzi jeho zaměření.
190
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
Skutečně, (4) vyplýva z toho, že A + 0 = 0 a takový vektor musí být jednoznačný (první a třetí definiční vlastnost). Postupným přičtením B — A a. A — B k A (v uvedeném pořadí), zjevně dostaneme podle druhé definiční vlastnosti opět A, tedy jsme přičetli nulový vektor a to dokazuje (5). Obdobně z platnosti (2) a jednoznačnosti vyplýva (6).
Všimněme si, že volba jednoho pevného bodu A0 e A nám určuje bijekci mezi V a A. Při volbě pevné báze u ve V tak dostáváme pro každý bod A e A jednoznačné vyjádření
A = Aq + x\u\ + • • • + x„u„.
Hovoříme o afinní soustavě souřadnic (Aq, u\, ..., u„) zadané počátkem afinní souřadné soustavy Aq a bazí zaměření u. Hovoříme také o afinním repéru (Aq, u).
Slovy můžeme shrnout situaci takto: Afinní souřadnice bodu A v soustavě (Aq, u) jsou souřadnicemi vektoru A—Aq v bázi u zaměření V.
Volba afinního souřadného systému ztotožňuje n-rozměrný afinní prostor A se standardním afinním prostorem A
4.3. Afinní podprostory. Jestliže si vybereme v A j en body, které budou mít některé předem vybrané souřadnice nulové (třeba poslední jednu). Dostaneme opět množinu, která se bude chovat jako afinní prostor. Takto budeme skutečně parametricky popisovat tzv. afinní podprostory ve smyslu následující definice.
Definice. Neprázdná podmnožina Q C A afinního prostoru A se zaměřením V se nazývá afinní podprostor v A, je-li podmnožina W = {B — A; A, B e Q} c V vektorovým podprostorem a pro libovolné A e Q,u e f je A + u e Q.
Je podstatné mít obě podmínky zahrnuty v definici, protože je snadné najít příklady podmnožin, které budou splňovat první, ale nikoliv druhou. Přemýšlejte např. o přímce v rovině s vyjmutým jedním bodem.
Pro libovolnou množinu bodů M c A v afinním prostoru se zaměřením V definujeme vektorový podprostor
Z(M) = {{B - A; B, A e M}) c V
všech vektorů generovaných rozdíly bodů z M.
Zejména je V = Z (A) a každý afinní podprostor Q C A splňuje sám axiomy afinního prostoru se zaměřením Z(Q).
Přímo z definic je také zřejmé, že průnik libovolné množiny afinních podprostorů je buď opět afinní podprostor nebo prázdná množina.
Afinní podprostor (M) v A generovaný neprázdnou podmnožinou M c A je průnikem všech afinních podprostorů, které obsahují všechny body podmnožiny M.
Afinní podprostory si můžeme pěkně popsat pomocí jejich zaměření, jakmile si zvolíme jeden jejich bod Aq e M v generující množině bodů M. Skutečně, dostáváme (M) = {Aq + v; v e Z(M) c Z(A)}, tj. pro generování afinního podprostorů vezmeme vektorový podprostor Z (M) v
Upozorněme, že kdybychom např. přepsali soustavu rovnic do matice
/ 1 0 0 0 0 10 0 0 0 10 V 0 0 0 1
která odpovídá situaci, kdy proměnné x, y, z, u zůstávají na levé straně rovnic, totožná úprava
1 2 0 \
0 -1 3
1 -2 2
0 2 5/
j 1 0 0 0 1 2 0 \ / 1 0 0 0 1 2 0 \
0 1 0 0 0 -1 3 0 1 0 0 0 -1 3
0 0 1 0 1 -2 2 -i -4 1 0 0 0 -10
0 0 1 0 2 5 ) V 0 2 0 1 0 0 11 /
dává výsledek ve tvaru
4y 2y
+
+
10,
11.
Jinak řečeno, při přepisování soustavy do matice je nutné zohledňovat, zda svislá čára odděluje levou stranu rovnic od pravé (či nikoliv). Nabízí se, že metoda eliminace parametrů může být zdlouhavá a že se při jejím použití lze snadno dopustit chyb(y). V tomto příkladu jsme přitom hledali pouze dva lineárně nezávislé normálové vektory, tj. vektory kolmé na vektory (1, 0, 1, 0), (2, —1, —2, 2). Pokud bychom si uvědomili, že takovými vektory jsou např. (0, 2, 0, 1), (—1, 0, 1, 2), dosazením x = 0, y = 3, z = 2, u = 5 do rovnic
2y + u = a,
—x + z + 2u = b
12, následně hledané implicitní vyjá-
bychom obdrželi a dření
11, b
2y
+
+ +
u 2u
11,
12.
□
4.4. Nalezněte parametrické vyjádření roviny procházející body
A = [2, 1,1], S = [3,4,5], C = [4,-2,3].
Poté parametricky vyjádřete otevřenou polorovinu obsahující bod C a vymezenou přímkou zadanou body A, B.
Řešení. K parametrickému vyjádření roviny potřebujeme jeden bod ležící v této rovině a dva směrové (lineárně nezávislé) vektory. Stačí zvolit bod A a vektory B - A = (1, 3, 4) a C - A = (2, -3, 2), které jsou očividně lineárně nezávislé. Bod [x, y, z] náleží do dané roviny právě tehdy, když existují čísla í, s ě R, pro která je
x =2 + \-t +2-s, y = \ +3 ■ t - 3 ■ s, z = l + 4-r + 2-s;
tj. hledané parametrické vyjádření roviny je
[2, 1, 1] + t (1, 3, 4) + s (2, -3, 2), (,seK.
191
A. AFINNÍ GEOMETRIE
1. AFINNÍ A EUKLIDEOVSKÁ GEOMETRIE
Volba s = 0 zjevně dává přímku, která prochází body A, B. Pro t = 0, s > 0 dostáváme polopřímku začínající v bodě A a procházející bodem C. Libovolně pevně zvolené t e M. a měnné s > 0 pak zadávají polopřímku s počátkem na hraniční přímce a s body v polorovině, ve které se nachází bod C. To znamená, že hledanou otevřenou polorovinu můžeme vyjádřit parametricky takto
□
[2, 1, 1] + t (1, 3, 4) + s (2, -3, 2), í e 1, s > 0.
4.5. Určete vzájemnou polohu přímek
p : [1,0, 3] + t (2,-1,-3), řeK, q : [1, 1, 3] + s (1,-1, -2), sel
Řešení. Hledejme společné body zadaných přímek (průnik podpro-storů). Dostáváme soustavu
1 +
0 -3 -
2t t 3t
1 + 1 -
3 -
s, s, 2s.
Z prvních dvou rovnic vyplývá, že t = 1, s = 2. To ovšem nevyhovuje třetí rovnici. Soustava tak nemá řešení. Neboť směrový vektor (2, —1, —3) přímky p není násobkem směrového vektoru (1, —1, —2)
Q-
přímky q, přímky nejsou rovnoběžné. Jedná se proto o mimoběžk-y^
61
4.6. Pro jaká čísla a e M jsou přímky
p : [4, -4, 8] + ř (2, 1, -4). q : [a, 6, -5] + s (1, -3, 3)
různoběžné?
t e ] s e
Řešení. Přímky jsou různoběžné tehdy a jenom tehdy, když má soustava
4 + 2t = a + s, -4 + t = 6 - 3s, 8 - 4t = -5 + 3s
právě 1 řešení. V maticovém zápisu řešíme (první sloupec odpovídá
proměnné t, druhý pak s)
2 1
■1 a - 4 \ / 1 2
-4
1 0 0
Vidíme, že soustava má právě 1 řešení tehdy a jenom tehdy, když je druhý řádek násobkem třetího. To je splněno pouze pro a = 3. Dodejme, že průsečíkem je v tomto případě bod [6, —3, 4]. □
zaměření generovaný všemi rozdíly bodů z M a ten pak přičteme k libovolnému z nich. Hovoříme také o afinním obalu množiny bodů M y A.
Naopak, kdykoliv zvolíme podprostor U v zaměření Z (A) a jeden pevný bod A e A, pak podmnožina A + U vzniklá všemi možnými součty jediného bodu A se všemi vektory v U je afinní podprostor. Takový postup vede k pojmu parametrizace podprostorů:
Nechť Q = A + Z(Q) je afinní podprostor v A„ a ..., uk) je báze Z(Q) c M". Pak vyjádření podprostorů
Q = {A + řii 0},
(4) obecněji k- rozměrné poloprostory a = {P + t\ ■ v\ + ■■■ + tk-vk; tu...,tkeR,tk> 0},
(5) ) úhly v dvojrozměrných podprostorech = {P +1\ ■ v\ + h ■ V2\ h > 0, ř2 > 0}, atd.
Přímo z definice také plyne, že průnik libovolného systému konvexních množin je opět konvexní. Průnik všech konvexních množin obsahujících danou množinu M nazýváme konvexní obal K,(M) množiny M.
Věta. Konvexní obal libovolné podmnožiny M C A je
s
K(M) = {Mi + • • • + tsAs; J^ti = L ř* > 0, Ať e M]
i = l
Důkaz. Označme S množinu všech afinních kombinací na pravé straně dokazované rovnosti. Nejprve ověříme, že je S konvexní. Zvolme tedy dvě sady parametrů ř;-, i = 1, .., s\, tj, j = 1,..., s2 s požadovanými vlastnosti. Bez újmy na obecnosti můžeme předpokládat, že si = s2 a že v obou kombinacích vystupují stejné body z M (jinak prostě přidáme sčítance s nulovými koeficienty). Uvažme libovolný bod úsečky zadané takto získanými body:
e(tlAl + --- + tsAs) + (l-e)(ťlAl + --- + ťsAs), 0 < e < 1.
Zřejmě jsou opět všechny v S.
Zbývá ukázat, že konvexní obal bodů Ai,...,As nemůže být menší než S. Samotné body A; odpovídají volbě parametrů t j = 0 pro všechny j ^ i a ř;- = 1. Předpokládejme, že tvrzení platí pro všechny množiny s nejvýše s — 1 body. To znamená, že konvexní obal bodů A\, ..., as_i je (podle předpokladu) tvořen právě těmi kombinacemi z pravé strany dokazované rovnosti, kde ts = 0. Uvažme nyní libovolný bod a = t\A\ + • • • + tsAs é 5, í, / 1, a afinní kombinace
€(fiAi + --- + fs_iAs_i) + (l-€(l-fs))As, 0 < e < T4-.
řádky jsou tvořeny souřadnicemi daných vektorů, hodnost nižší než tři; v tomto případě se tedy jedná o matici
která má hodnost dva). Dané body tedy leží v rovině.
□
4.10. Na kolik částí mohou dělit prostor (M3) tři roviny? Pro každou možnost popište odpovídající případ.
4.11. Rozhodněte, zda leží bod [2, 1,0] uvnitř konvexního obalu bodů [0, 2, 1], [1, 0, 1], [3, -2, -1], [-1,0, 1].
Řešení. Sestavíme nehomogenní lineární soustavu, pro koeficienty t\, h, h, t a,, afinní kombinace daných bodů, která dává první bod (jsou určeny jednozačně, pokud dané body neleží v rovině).
/Ol 3 -l\ /řA Í2\ 2 0 -2 0 h _ 1 11-11 t3 ~ 0
\i i i i / w W
Poslední rovnice udává, že jde o afinní kombinaci. Jejím řešením dostáváme (ři, ř2, Í3, t4) = (1,0, 1/2,-1 /2), nejedná se tedy o konvexní kombinaci, (nelze odvodit pomocí projekcí na jednotlivé osy). □
4.12. Nalezněte předpis afinního zobrazení / daného ve standardní bázi v M2 jako
/<*■*>=(o!)(::;)+(:
v souřadné soustavě dané bází m = {(1, 1), (—1, 1)} a počátkem [2, 0].
Řešení. Matice přechodu od dané báze u ke standardní bázi k je
1 -1 1 1
Matici zobrazení v bázi ([2, 0], u) získáme tak, že nejprve transformujeme souřadnice v bázi ([2, 0], u) na souřadnice ve standardní bázi, tedy v bázi ([0, 0], (1, 0), (0, 1)), poté aplikujeme matici zobrazení / ve standardní bázi a na závěr výsledek transformujeme zpět do souřadnic v bázi ([2, 0], u). Transformační rovnice přechodu od suouřadnic yi, y2 v bázi ([2, 0], u) k souřadnicím x\, x2 v standardní bázi jsou
Odtud máme, že
1 -1 1 1
1 -1 1 1
::: + o
2i \
2 2
Mt
195
A. AFINNÍ GEOMETRIE
1. AFINNÍ A EUKLIDEOVSKÁ GEOMETRIE
Pro předpis zobrazení pak dostáváme
/(Ji, y2)
1 i
~\ \
2 2
2 0 -1 1
2 1 0 1
+
+
+
+
□
4 . 8
4.13. Mějme dánu standardní souřadnou soustavu v prostoru M3. Agent K sídlí v bodě S o souřadnicích [0,1,2] a ústředí mu přidělilo pro používání souřadnou soustavu s počátkem S a bází {(1, 1,0), (-1,0, 1), (0, 1,2)}. Agent Sokol bydlí domě D na kótě [1, 1, 1] a používá souřadnou soustavu s bází {(0, 0, 1), (-1,1, 2), (1, 0, 1)}. Agent K žádá Sokola o schůzku v cihelně, která leží podle jeho souřadné soustavy v bodě [1, 1, 0]. Kam má přijít Sokol (podle jeho souřadnic)?
Řešení. Matice přechodu od báze agenta K k Sokolově bázi (při stejných počátcích) je
/-4 2 -1 7=1 0 1 \2 -1 1 /
Vektor (0, 1, 2) má tedy souřadnice T ■ (0,1, 2)T = (0, 2, 1)T, posunutím počátku (přičteme vektor (—1,0, 1)) dostáváme výsledek (-1,2,2). □
4.14. Najděte příčku přímek (úsečku, jejíž jeden koncový bod leží na jedné z přímek, druhý pak na druhé z nich)
p : [1,1,1]+ ř(2, 1, 0), q : [2, 2, 0] + ř(l, 1, 1),
takovou, že přímka jí určená prochází bodem [1, 0, 0].
Řešení.
Nalezneme průsečík hledané příčky s přímkou q (nazveme jej Q). Hledaná příčka obsahuje nějaký bod na přímce p a bod [1,0,0], nutně tedy leží v rovině p určené tímto bodem a přímkou p, tedy v rovině
[1, 1, 1] + ř(2, 1,0) + ^(0, 1, 1).
Bod Q je pak průnikem této roviny s přímkou q. Ten nalezneme vyřešením soustavy
1 + 2t = 2 +u 1 + t + s = 2 +u 1 + s = u
Levé strany rovnic reprezentují postupně všechny tři souřadnice libovolného bodu roviny p, pravé pak souřadnice libovolného bodu na q
Jde o úsečku s krajními body určenými parametry e = 0 (bod A,) a e = 1/(1 — řs) (bod v konvexním obalu bodů A\, ..., As_i). Bod A je vnitřním bodem této úsečky s parametrem e = 1. □
Konvexní obaly konečných množin bodů se nazývají konvexní mnohostěny. Jsou-li definující body Aq, ..., A* konvexního mnohostěnu v obecné poloze, dostáváme právě k-rozměrný simplex. V případě simplexu je vyjádření jeho bodů ve tvaru afinní kombinace definujících vrcholů jednoznačné.
Zvláštním příkladem jsou konvexní mnohostěny generované jedním bodem a konečně mnoha vektory: Nechť u\, ..., uk, jsou libovolné vektory v zaměření W, A e A„ je libovolný bod. Rovnoběžnostěn Vk(A; u\, ..., uk) c A„ je množina
Vk(A; u\, ..., uk) = {A + H-----h ckuk; 0 < q < 1}.
Jsou-li vektory u\,...,uk nezávislé, hovoříme o k-rozměrném rovnoběžnostěnu Vk(A; u\, ..., uk) c A„. Z definice je zřejmé, že rovnoběžnostěny jsou konvexní. Ve skutečnosti jde o konvexní obaly jejich vrcholů.
4.10. Příklady standardních afinních úloh. (l)Kpodpro-storu zadanému implicitně nalézt parametrický popis a naopak:
Nalezením partikulárního řešení nehomogenního systému a fundamentálního řešení zhomogenizovaného systému rovnic získáme (v souřadnicích, ve kterých byly rovnice zadány) právě hledaný parametrický popis. Naopak, zapíšeme-li parametrický popis v souřadnicích, můžeme volné parametry t\, ..., tk vyeliminovat a získáme právě rovnice zadávající daný podprostor implicitně.
(2) Nalézt podprostor generovaný několika podprostory Qi, ■ ■ ■, Qs (obecně různých dimenzí, např. v R3 nalézt rovinu danou bodem a přímkou, třemi body apod.) a zadat jej implicitně či parametricky:
Výsledný podprostor Q je vždy určen jedním pevně zvoleným bodem A; v každém z nich a součtem všech zaměření. Např.
Q = A1 + (Z({A1
Ak}) + Z(Q1) + --- + Z(QS)).
Pokud jsou podprostory zadány implicitně, je možné je nejdříve převést na parametrický tvar. V konkrétních situacích bývají funkční i jiné postupy. Všimněme si, že obecně je skutečně nutné využít jednoho bodu z každého podprostoru. Např. dvě paralelní přímky v rovině vygenerují celou rovinu, ale sdílí totéž jednorozměrné zaměření. (3) Nalézt průnik podprostoru Q\, ..., Qs:
Pokud jsou zadány v implicitním tvaru, stačí sjednotit všechny rovnice do jednoho systému (a případně vynechat lineárně závislé). Pokud je vzniklý systém neřešitelný, je průnik prázdný. V opačném případě získáme implicitní popis afinního podprostoru, který je hledaným průnikem.
196
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
Pokud máme dány parametrické tvary, můžeme také hledat přímo společné body jako řešení vhodných rovnic, podobně jako při hledání průniků vektorových podprostorů. Získáme tak přímo opět parametrický popis. Pokud je podprostorů více než dva, musíme průnik hledat postupně.
Máme-li jeden prostor zadaný parametricky a ostatní implicitně, stačí dosadit parametrizované souřadnice a řešit výsledný systém rovnic.
(4) Nalezení příčky mimoběžek p, qv Aj, procházející daným bodem nebo mající předem daný směr (tj. zaměření): Příčkou rozumíme přímku, která má neprázdný průnik s oběmi mimoběžkami. Výsledná příčka r tedy bude jednorozměrným afinním podprostorem. Pokud máme zadán jeho bod A e r, pak afinní podprostor generovaný p a A jebuďpřímka (A e p) nebo rovina (A ^ p). V prvém případě máme nekonečně mnoho řešení, jedno pro každý bod z q, v druhém stačí najít průnik B roviny (p U A) s q a r = ({A, B}). Pokud je průnik prázdný, úloha nemá řešení, v případě že q c (p D A), máme opět nekonečně mnoho řešení, a pokud je průnik jednoprvkový, dostáváme právě jedno řešení.
Máme-li místo bodu dán směr u e M", tj. zaměření r, pak uvažujeme opět podprostor Q generovaný p a zaměřením Z(p) + (u) c M". Opět, pokud q c Q, máme nekonečně mnoho řešení, jinak uvážíme průnik Q s g a úlohu dokončíme stejně jako v předchozím případě.
Řešení mnoha dalších standardních geometrických úloh spočívá v používání výše uvedených kroků.
4.11. Afinní zobrazení. Zobrazení / : A -» B mezi afinními prostory nazýváme afinní zobrazení, jestliže mezi jejich zaměřeními existuje lineání zobrazení cp : Z (A) -» Z(B) takové, že pro všechny A e A, v e Z (A) platí
f(A + v) = f(A) + cp(v).
Zobrazení / a cp jsou jednoznačně zadána touto vlastnostní a libovolně zvolenými obrazy (dim^l +1) bodů v obecné poloze.
Pro libovolnou afmní kombinaci bodů řoAo + - • -+ts As e A pak dostaneme
f(t0A0 + ■■■ + tsAs) =
= /(A0 + ři(Ai - A0) + • • • + ts(As - A0)) = /(A0) + h dostáváme souřadné vyjádření afinního zobrazení / : A -» B. Přímo z definice je zřejmé, že stačí vyjádřit obraz f(A0) počátku souřadnic v A v souřadnicích na £>, tj. vyjádřit vektor f(A0) — Bq v bázi v jako sloupec souřadnic y0 a vše ostatní je pak určeno násobením maticí zobrazení yo + Y ■ x,
kde y0 je jako výše a F je matice zobrazení U2. Zobrazení ý '■ U2 -> U\ nechť vznikne podobně z kolmého průmětu na
U\. Tato zobrazení mají v bazích (e\, matice
ek) a (',
e\ ■ e
(e\
B
ßk ■ e
\ U\ má tedy symetrickou pozitivně semidefmitní matici AT A a ý je zobrazení adjungované k cp. Viděli jsme, že každé takové zobrazení má pouze nezáporná reálná vlastní čísla a že má ve vhodné ortonormální bázi diagonální matici s těmito vlastními čísly na diagonále, viz 3.25 a 3.27.
Nyní můžeme odvodit obecný postup pro výpočet odchylky a = cp(U\, U2).
Věta. V předchozím označení nechť X je největší vlastní hodnota matice AT A. Pak cos2 a = X
202
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
Důkaz. Nechť u e ř7i je vlastní vektor zobrazení \jr o cp příslušný největší vlastní hodnotě k. Uvažme všechna vlastní čísla k\, ..., kk (včetně násobnosti) a nechť u = (u\, ..., un) je příslušná ortonormální báze U\ z vlastních vektorů. Můžeme přímo předpokládat, že A = k\, u = u\. Potřebujeme ukázat, že odchylka libovolného v e U\ od ř/2 je nejméně tak velká jako odchylka u od ř/2- Tzn. že kosinus příslušného úhlu nesmí být větší. Podle předchozího lemmatu stačí diskutovat odchylku u a cp(u) e U2 a přitom víme, že ||w|| = 1. Zvolme tedy v e U\, v = a\U\ + • • • + akuk, ELi«2 = IIHI2 = 1-Pak
\\(p(v)f = (p{v) ■ (p{v) = iý o (piv)) ■ v
< || V o (piv)|| ||v|| = \\Ýo(piv)\\.
Předchozí lemma navíc dává i vzorec pro odchylku a vektoru v od podprostoru U2
Mv)\\
cos a
Ml
Mv)\l
Protože jsme zvolili za k\ nej větší z vlastních hodnot a součet kvadrátů souřadnic af je jedna, dostáváme
(cosa)2 = \\ 0 (přepočtěte!). Má tedy / v nových souřadnicích analytický tvar a^x[2 + h, kde h je kvadratická forma nezávislá na proměnné X\.
Z technických důvodů bývá lepší zvolit v nové bázi v\ = u\, opět dostaneme výraz f = f\ + h, kde f\ závisí pouze na x[, zatímco v h se x[ nevyskytuje. Přitom pak g(v\,v\) = an.
(2) Předpokládejme, že po provedení kroku (1) dostaneme pro h matici (řádu o jedničku menšího) s koeficientem u x'22 různým od nuly. Pak můžeme zopakovat přesně stejný postup a získáme vyjádření / = /i+/2+^,kde v h vystupují pouze proměnné s indexem větším než dvě. Tak můžeme postupovat tak dlouho, až buďprovedeme n—1 kroků a získáme diagonální tvar, nebo v řekněme /-tém kroku bude prvek au dosud získané matice nulový.
(3) Nastane-li poslední možnost, ale přitom existuje jiný prvek ajj ^ 0 s j > i, pak stačí přehodit i-tý prvek báze s 7-tým a pokračovat podle předešlého postupu.
(4) Předpokládejme, že jsme narazili na situaci a^ = 0 pro všechny j > /. Pokud přitom neexistuje ani žádný jiný prvek ajk ^ Os j > /, k > /, pak jsme již úplně hotovi neboť jsme již dosáhli diagonální matici. Předpokládejme, že ajk ^ 0. Použijeme pak transformaci v j = u j + uk, ostatní vektory báze ponecháme (tj. x'k = xk — Xj, ostatní zůstávají). Pak h(vj, Vj) = h(uj, Uj) +h(uk, uk) +2h(uk, uj) = 2ajk ^ 0 a můžeme pokračovat podle postupu v (1). □
pak totiž obdržíme 0 zatímco pro v e Q)&f(v) < 0. Nutně tedy platí P f) Q = {0} a proto dim P + dim Q < n. Odtud plyne p + (n — q) < n, tj. p < q. Opačnou volbou podprostoru však získáme i q < p.
Je tedy p nezávislé na volbě polární báze. Pak ovšem pro dvě matice se stejnou hodností a stejným počtem kladných koeficientů v diagonálním tvaru příslušné kvadratické formy získáme stejný analytický tvar. □
Při diskusi symetrických zobrazení jsme hovořili o defi-nitních a semidefitních zobrazeních. Tatáž diskuse má jasný
212
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
smysl i pro symetrické bilineární formy a kvadratické formy. Kvadratickou formu / forma na reálném vektorovém prostoru V nazýváme
(1) positivně definitní, je-li f(u) > 0 pro všechny íí / O
(2) positivně semidefinitní, je-li f(u) > 0 pro všechny u e V
(3) negativně definitní, je-li f(u) < 0 pro všechny « / O
(4) negativně semidefinitní, je-li /(w) < 0 pro všechny m e
(5) indefinitní, je-li /(i/) > Oa/(u) < 0 pro vhodné w, i; e
y.
Stejné názvy používáme i pro symetrické reálné matice, jsou-li maticemi patřičných kvadratických forem. Signaturou symetrické matice pak rozumíme signaturu přísluané kvadratické formy.
3. Projektivní geometrie
V mnoha elementárních textech o analytické geometrii autoři končí afinními a euklidovskými objekty popsanými výše. Na mnoho praktických úloh euklidovská nebo afinní geometrie stačí, na jiné bohužel ale nikoliv.
Tak třeba při zpracovávání obrazu z kamery nejsou zachovávány úhly a rovnoběžné přímky se mohou (ale nemusí) protínat. Dalším dobrým důvodem pro hledání širšího rámce geometrických úloh a úvah je požadovaná robustnost a jednoduchost numerických operací. Daleko jednodušší jsou totiž operace prováděné prostým násobením matic a velice těžko se totiž od sebe odlišují malinké úhly od nulových, proto je lepší mít nástroje, které takové odlišení nevyžadují.
Základní ideou projektivní geometrie je rozšíření afinních prostorů o body v nekonečnu způsobem, který bude dobře umožňovat manipulace s lineárními objekty typu bodů, přímek, rovin, projekcí, apod.
4.26. Projektivní rozšíření afinní roviny. Začneme tím nejjednodušším zajímavým případem, geometrií v rovině. Jestliže si body roviny A2 představíme jako rovinu z = 1 v V?, pak každý bod P naší afinní roviny představuje vektor u = (x, y, 1) e M3 a tím i jednorozměrný podprostor (u) c M3. Naopak, skoro každý podprostor v M3 protíná naši rovinu v právě jednom bodě P a jednotlivé vektory takového podprostoru jsou dány souřadnicemi (x, y, z) jednoznačně, až na společný skalární násobek. Žádný průnik s naší rovinou nebudou mít pouze podprostory s body o souřadnicích (x, y, 0).
Projektivní rovina V2 je množina všech jednorozměrných podprostorů v M3. Homogenní souřadnice bodu P = (x : y : z) v projektivní rovině jsou trojice reálných čísel určené až na společný skalární násobek a alespoň jedno z nich musí být nenulové. Přímka v projektivní rovině je definována jako množina jednorozměrných podprostorů (tj. bodů vV2)
a z (4.2) již plyne
(2/3,2/3,0,2/3,1)
co&cp
(1,0,0,1,1)
JI
3 '
tj. = 0, 49 (^28°)
□
C. Geometrie kvadratických forem
4.38. Určete polární bázi formy / : M3 -2x\x2 + x| + 4x2X3 + 6x|.
Řešení. Její matice je
, f(xu x2,x3) = 3x2 +
Podle bodu (1) Lagrangeova algoritmu provedeme úpravy
1 , 2
f(x\, x2, x3)
-(3xí + x2)2 + -xf + 4x2x3 + 6x|
1,32 , = 3)? + 2(3^2 + 2ys)
1 3
,2 , J 2
= 3*1 + ~2z2
a vidíme, že forma má hodnost 2 a matice přechodu do příslušné polární báze w se získá posbíráním provedených transformací:
2 2
z3 = y3 = x3, z2 = -y2 + 2y3 = -x2 + 2x3, z\ = yi = 3*i + x2 Pokud by ale např. f(xi, x2, x3) = 2xix3 + x|, tj. matice je
pak hned v prvním kroku můžeme přehodit proměnné: yi = x2, y2 = %\, y3 = x3. Aplikace kroku (1) je pak triviální (nejsou tu žádné společné členy), pro další krok ale nastane situace z bodu (4). Zavedeme tedy transformaci z\ = yi, z2 = y2, z3 = y3 — y2. Pak
f(xl,x2,x3) = z\ + 2z2(z3 + z2) = z2 + ^(2z2 + z3)2 - ^z2.
Matici přechodu do příslušné polární báze opět dostaneme posbíráním jednotlivých transformací (tj. vynásobením jednotlivých dílčích matic přechodu). □
4.39. Nalezněte polární bázi kvadratické formy / : je ve standardní bázi dána předpisem
f(X\, X2, X3) = XiX2 + XiX3.
I, která
213
C. GEOMETRIE KVADRATICKÝCH FOREM
3. PROJEKTIVNÍ GEOMETRIE
Řešení. Aplikací uvedeného Lagrangeova algoritmu dostávame:
f(xX, x2, X-}) = 2xXX2 + x2x3
provedeme substituci podle bodu (4) algoritmu y2 — x2 — xx, yx — x\, y3
= 2xx(xx + y2) + (xx + y2)x3 = 2x\ + 2xiy2 + xxx3 + y2x3 = 1 1,1,1,
substituce yx — 2xx + y2 + jx3
= 2yi ~2~ú- g-*? + y2*3 = ^yf - 2(-y2 - -x3y + -4 =
substituce y3 = Ay2 — ix3
Příklad. V afinním prostoru M2 uvažujme dvě přímky Lx : y — x — l=0a L2:y — jc + 1 = 0. Jestliže budeme body přímek Lx a L2 chápat jako konečné X3 body v projektivním prostoru V2, budou zjevně jejich homogenní souřadnice (x : y : z) splňovat rovnice
1
2)f +ň
V souřadnicích yx, y3, x3 má tedy daná kvadratická forma diagonální tvar, to znamená že báze příslušná těmto souřadnicím je polární bází dané kvadratické formy. Pokud ji máme vyjádřit musíme získat matici přechodu od této polární báze ke standardní bázi. Z definice matice přechodu jsou pak její sloupce bázovými vektory polární bázi. Matici přechodu získáme tak, že buď vyjádříme staré proměnné (xx, x2, x3) pomocí nových proměnných (yx, y3, x3), nebo ekvivalentně vyjádříme nové proměnné pomocí starých (což jde jednodušeji), pak ale musíme spočítat inverzní matici.
Máme yx = 2xx + y2 + \x3 = 2xx + (x2 - xx) + \x3 a y3 = iy2 — ^x3 = —\x\ + \x3 — jx3. Matice přechodu od standardní báze ke zvolené polární je tedy
Pro inverzní matici pak máme
, . 3 3 2
-1 | J_ 4 1
3 3 2
v0 0 1
Jedna z polárních bazí dané kvadratické formy je tedy například báze {(1/3, 1/3, 0), (-2/3, 4/3, 0), (-1/2, 1/2, 1)}. □
4.40. Určete typ kuželosečky dané rovnicí:
3x2 — 3xix2 + x2 — 1 = 0.
Řešení. Pomocí algoritmu úpravy na čtverec postupně dostáváme:
3x2 - 3xíX2 + x2 - 1 = - ^x2)2 - ^ + x2 - 1 =
1 , 4 3 1 , 1
= -yf - -i-x2 - -) + - - i =
V1 3 4 T 3 1 2 4 2 2
Podle uvedeného seznamu kuželoseček se tedy jedná o hyperbolu. □
Li : y
0,
L2 : y - x + z = 0.
Podívejme se, jak budou rovnice těchto přímek vypadat v souřadnicích v afinní rovině, která bude dána jako y = 1. Za tím účelem stačí dosadit y = 1 do předchozích rovnic:
L[:l
0,
L2: 1
x +z = 0
Nyní jsou „nekonečné" body naší původní afinní roviny dány vztahem z = 0 a vidíme, že naše přímky L[ a L2 se protínají v bodě (1, 1, 0). To odpovídá geometrické představě, že rovnoběžné přímky Lx, L2 v afinní rovině se protínají v nekonečnu (a to v bodě (1:1: 0)).
4.27. Projektivní prostory a transformace. Postup z roviny se přirozeným způsobem zobecňuje na každou konečnou dimenzi. Volbou libovolné afinní nadroviny A„ ve vektorovém prostoru W+1, která neprochází počátkem, můžeme ztotožnit body P e A„ s jednorozměrnými podprostory, které tyto generují. Zbylé jednorozměrné podprostory vyplní rovinu rovnoběžnou s A„ a říkáme jim „nekonečné body" v projektivním rozšíření V„ afinní roviny A„. Zjevně je vždy množina nekonečných bodů v V„ projektivním prostorem dimenze o jedničku nižším. Abstraktněji hovoříme o projekti-vizaci vektorového prostoru: pro libovolný vektorový prostor V dimenze n + 1 definujeme
V(V) = {P C V; P je jednorozměrný vektorový podprostor}.
Volbou libovolné báze w ve V dostáváme tzv. homogenní souřadnice na V(V) tak, že pro P eV(V) použijeme jeho libovolný nenulový vektor m e V a souřadnice tohoto vektoru v bázi u. Afinní přímka má tedy ve svém projektivním rozšíření pouze jediný bod (oba konce se „potkají" v nekonečnu a projektivní přímka vypadá jako kružnice), projektivní rovina má projektivní přímku nekonečných bodů atd.
Při zvolených homogenních souřadnicích je možné jednu z jejich hodnot zafixovat na jedničku (tj. vyloučíme všechny body projektivního prostoru s touto souřadnicí nulovou) a získáme tak vložení «-rozměrného afinního prostoru A„ C V(V). To je přesně konstrukce, kterou jsme použili v opačném směru v příkladu projektivní roviny.
Každé prosté lineární zobrazení r : Vx -> V2 mezi vektorovými prostory samozřejmě zobrazuje jednorozměrné podprostory na jednorozměrné podprostory. Tím vzniká zobrazení na projektivizacích T : V(VX) -> V(V2). Takovým zobrazením říkáme projektivní zobrazení. Jinak řečeno, projektivní zobrazení je takové zobrazení mezi projektivními prostory, že v každé soustavě homogenních souřadnic na definičním oboru i obrazuje toto zobrazení zadáno násobením vhodnou maticí. Obecněji, pokud naše pomocné lineární zobrazení není prosté, definuje projektivní zobrazení pouze mimo
214
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
svoje jádro, tj. na bodech, jejichž homogenní souřadnice se nezobrazují na nulu.
4.28. Perspektivní projekce. Velmi dobře jsou výhody projektivní geometrie vidět na perspektivní projekci M3 -» M2. Bod (X, Y, Z) „reálného světa" se promítá na bod (x, y) na průmětně takto:
X
y
Y
'r
-f 0 0 0^ 0-/00 0 0 10;
To je nejen nelineární formule, ale navíc při Z malém bude velice problematická přesnost výpočtů.
Při rozšíření této transformace na zobrazení Vj, -» V2 dostáváme zobrazení (X : Y : Z : W) h» (x : y : z) = (—fX : — fY : Z), tj. popsané prostou lineární formulí
(X\ Y Z
W
Tento jednoduchý výraz zadává perspektivní projekci pro všechny konečné body vM3 C V3, které dosazujeme jako výrazy s W = 1. Navíc jsme odstranili problémy s body, jejichž obraz leží v nekonečnu. Skutečně, je-li Z-ová souřadnice skutečného bodu scény blízká nule, bude hodnota třetí homogenní souřadnice obrazu mít souřadnici blízkou nule, tj. bude představovat bod blízký nekonečnu.
4.29. Afinní a projektivní transformace. Invertibilní projektivní zobrazení projektivního prostoru V„ na sebe odpovídají v homogenních souřadnicích invertibilním maticím dimenze n + í. Dvě takové matice zadávají stejnou projektivní transformaci právě, když se liší o konstantní násobek.
Jestliže si zvolíme první souřadnici jako tu, jejíž nulovost určuje nekonečné body, budou transformace, které zachovávají konečné body, dány maticemi, jejichž první řádek musí být až na první člen nulový. Jestliže budeme chtít přejít do afinních souřadnic konečných bodů, tj. zafixujeme si hodnotu první souřadnice na jedničku, musí být první prvek na prvním řádku být také rovný jedné. Matice projektivních transformací zachovávajících konečné body tedy mají tvar:
/l 0
0\
kde b = (bi, ..., bn)T e W a A = (a^) je invertibilní matice dimenze n. Působení takové matice na vektoru (1, x\, ..., xn) je právě obecná afinní transformace.
4.30. Projektivní klasifikace kvadrik. Závěrem ještě poznámka o složitějších objektech studovaných v afinní geometrii nejlépe prostřednictvím projektivních rozšíření. Jestliže popíšeme kvadriku v afinních souřadnicích pomocí obecné
4.41. Určete rovnici kuželosečky (a poté její typ), která prochází body
[-2,-4], [8,-4], [0,-2], [0,-6], [6,-2].
Řešení. Do obecné rovnice kuželosečky
aux2 + «22 y2 + 2ai2xy + a\x + a2y + a = 0
postupně dosadíme souřadnice zadaných bodů. Takto obdržíme soustavu
4au + 16^22 + 16^12 — 2úti —
64útn + 16^22 — 64úti2 + 8«! — 4a22 -36a22 -
36fln + 4út22 — 24úti2 + 6a\ —
V maticovém zápisu provedeme úpravy
(4 16 16 -2 -4 l\
64 16 -64 8 -4 1
0 4 0 0 -2 1
0 36 0 0 -6 1
\36 4 -24 6 -2 1/
4a2 + a = 0,
4a2 + a = 0,
2a2 + a = 0,
6a2 + a = 0,
2a2 + a = 0.
16 -2 -4
-64 8 -4
0 0 -2
0 0 -6
-24 6 -2
16 -2 -4
0 0 -2
0 4
0 0 64 -8 12
0 0 0 24
\0 0 0 0
1 \ 1
-9
-36 27 3 -2/
/48 0 0 0 0 -l\
0 12 0 0 0 -1
0 0 64 0 0 0
0 0 0 24 0 3
\0 0 0 0 3 -2/
Hodnotu a můžeme zvolit. Zvolíme-li a = 48, dostaneme
au = 1, «22 = 4, a\2 = 0, a\ = —6, «2 = 32.
Kuželosečka má tudíž rovnici
x2 + 4y2 -6x + 32y + 48 = 0.
V této rovnici doplníme výrazy x2 — 6x, 4y2 + 32y na druhé mocniny dvojčlenů, což dává
resp.
(x - 3)2 + 4(y + 4)2
(x-3)2 (y+4)2
52
(I)2
25 = 0,
1 =0.
Vidíme, že se jedná o elipsu se středem v bodě [3, —4].
□
215
C. GEOMETRIE KVADRATICKÝCH FOREM
3. PROJEKTIVNÍ GEOMETRIE
4.42. Pomocí doplnění na čtverce vyjádřete kvadriku
-x2 + 3y2 + z2 + 6xy - 4z, = 0 ve tvaru, ze kterého lze vyčíst její typ.
Řešení. Všechny členy obsahující x připojíme k —x2 a provedeme doplnění na čtverec. Tím získáme
-(x - 3y)2 + 9y2 + 3y2 + z2 - 4z = 0.
Žádné „nežádoucí" členy obsahující y nemáme, a proto postup opakujeme pro proměnnou z, což dává
-(x - 3y)2 + 12y2 + (z - 2)2 - 4 = 0.
Odtud plyne, že existuje transformace proměnných, při které obdržíme (rovnici můžeme nejdříve vydělit 4) rovnici
-ŕ + f +-z2 -i = o.
□
kvadratické rovnice, viz výše, jejím přepsáním v homogenních souřadnicích dostaneme vždy výlučně homogenní výraz, jehož všechny členy jsou druhého řádu. Důvod je ten, že pouze takové homogenní výrazy budou mít pro homogenní souřadnice smysl nezávisle na zvoleném konstantním násobku souřadnic (x0, x\, ..., xn). Hledáme tedy takový, jehož zúžením na afinní souřadnice, tj. dosazením x0 = 1, získáme původní výraz. To je ale mimořádně jednoduché, prostě dopíšeme dostatek x0 ke všem výrazům - žádny ke kvadratickým členům, jedno k lineárním a x2, ke konstantnímu členu.
Získáme tak dobře definovanou kvadratickou formu na našem pomocném vektorovém prostoru W+1, ale jsme už vůči libovolné volbě báze klasifikovali. Zkuste si samostatně převést tuto klasifikaci do projektivní i afinní podoby. (Hezké a náročné cvičení na závěr semestru!)
216
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
217
C. GEOMETRIE KVADRATICKÝCH FOREM 3. PROJEKTIVNÍ GEOMETRIE
218
KAPITOLA 4. ANALYTICKÁ GEOMETRIE
Řešení cvičení
4.3. Přímka (2ŕ, t, It) + [-5, 0, -9]. 4.3. [3,2, l][8/3, 8/3,2/3].
4.70. 2, 3, 4, 6, 7, 8. Polohy rovin, které realizují dané počty si rozmyslete samostatně.
4.27. Pro normálový vektor (a, b, c) hledaných rovin máme rovnice a + b = 0 (kolmost na p) a volbou a — —b — 1 (vektor (0, 0, 1) nevyhovuje podmínkám, takže vhodným pronásobením můžeme dosáhnout
— j, celkem pak hledané
rovnice přímek jsou x — y ± Vó —1=0. 4.32. (-1,3,2).
podmínky a — —b — 1) pak dostáváme z podmínky pro odchylku
V3v/2+e2
219