ZÁKLADY MATEMATIKY I Katedra aplikované matematiky a informatiky Ekonomicko-správní fakulta MU v Brně Email: vesely@econ.muni.cz http: // www. math. muni. cz/ ~vesely Obsah 1. Úvod 4 1.1. Základy výrokového počtu 4 1.2. Základy teorie množin 10 1.3. Číselné obory 26 2. Algebraické struktury 33 2.1. Relace a operace 34 2.2. Uspořádané množiny 38 2.3. Ekvivalence a kongruence 42 2.4. Struktury s jednou binární operací 44 2.5. Struktury se dvěma binárními operacemi 52 3. Lineární algebra 57 3.1. Vektorové prostory 57 3.2. Vektorové podprostory, generátory 60 3.3. Závislost, nezávislost, báze, dimenze 62 3.4. Lineární zobrazení 66 3.5. Faktor prostory a přímý součet 70 3.6. Prostory s normou a skalárním součinem 74 4. Teorie matic 88 4.1. Matice a jejich základní druhy 89 4.2. Základní maticové operace 93 4.3. Matice jako operátor a hodnost matice 98 Date: 26. září 2007. 4.4. Převod na schodovitý tvar a lu-rozklad 114 4.5. Permutace, determinant a stopa matice 126 5. Řešení systému lineárních rovnic 144 5.1. SLR s regulární trojúhelníkovou maticí A řádu n 148 5.2. SLR s libovolnou maticí soustavy A rozměru m × n 149 5.3. SLR s pásovou (tridiagonální) maticí soustavy 154 5.4. Přibližné řešení SLR metodou nejmenších čtverců 155 5.5. Řešení maticové rovnice A.X = B a výpočet inverze A-1 158 5.6. Problémy s numerickou nestabilitou při řešení SLR 159 5.7. Iterační metody pro řešení systému lineárních rovnic 160 6. Transformace souřadnic a diagonalizace matic 165 Příloha A. Operace s komplexními čísly 166 A.1. Sečítání, odčítání 166 A.2. Násobení 166 A.3. Dělení 166 A.4. Umocňování 166 A.5. Odmocňování 167 A.6. Goniometrické vzorce 168 Příloha B. Maticová reprezentace abstraktních vektorových prostorů konečné dimenze 170 Příloha C. Matematické symboly v systému LATEX 173 Příloha D. Důkazy vybraných tvrzení 184 2 Literatura ke studiu Základní: [KaSk] Karásek J., Skula L.: Algebra a geometrie, PC-DIR Real s.r.o., Brno 2002 (skripta VUT Brno, Fakulta strojního inženýrství) [Šik] Šik F.: Lineární algebra zaměřená na numerickou analýzu, PřF MU Brno, 1998 (skripta) [Ho] Horák P.: Cvičení z algebry a teoretické aritmetiky I., PřF MU Brno, 2002 (sbírka řešených i neřešených úloh) * Pracovní texty vytvořené přednášejícím, které jsou ke stažení v elektronické podobě z IS MU u příslušného předmětu. Doplňující: [Mi] Minorskij V.P.: Sbírka úloh z vyšší matematiky, SNTL Praha, 1964 [FaSo] Faddejev A.K.,Sominskij J.S.: Zbierka úloh z vyššej algebry, ALFA Bratislava, 1968 Poznámka: V tomto textu jsou úseky látky (definice, věty, důkazy a pod.) z hlediska důležitosti rozlišeny ve třech úrovních změnou sazby příslušného klíčového slova takto: 1. Základní: podtrženě velkými písmeny (např. VĚTA). 2. Důležité: velkými písmeny (např. VĚTA). 3. Doplňující: jsou vysázeny obyčejně (např. Věta). U důkazů stačí vyložit podstatné myšlenky (postup) vlastními slovy. 3 1. Úvod 1.1. Základy výrokového počtu. Teorie: [KaSk: s.7-9] Příklady: [Ho:řešené č.1; s.5-6], [Ho:neřešené §1; s.39-42] Matematické vyjadřování: * Stručnost: užívání symbolů (viz přílohu C) * Přesnost: definice, tvrzení, pomocné tvrzení (lemma), věta (teorém), poznámka, seznam označení: s := v nebo v =: s interpretujeme jako označení výrazu v symbolem s. Účelem definice je přesné vymezení významu nově zaváděného matematického pojmu. Účelem tvrzení, mezi něž patří lemmata i věty (důležitá tvrzení), je vyvodit z výchozích předpokladů přesné logické závěry postupnou aplikací logických pravidel. Tomuto postupu říkáme důkaz. Univerzální předpoklady matematických teorií se nazývají axiomy: vyjadřují předem dané skutečnosti, které považujeme za univerzálně platné. Výroky: při užití logických pravidel vystupuje jeden ze základních pojmů logiky -- pojem výroku. Výrokem rozumíme libovolné sdělení (tvrzení), o kterém má smysl říci, jestli je pravdivé nebo nepravdivé. Říkáme také, že výrok platí nebo neplatí. Logická hodnota 1 značí výrok, který je vždy pravdivý a podobně logická hodnota 0 značí výrok, který je vždy nepravdivý. Výroky v dalším budeme označovat symbolicky, například V . Pokud výrok závisí na dalších proměnných (obvykle opět výrocích) A, B, . . . , píšeme V (A), V (A, B) a po- dobně. 4 Výrokový počet: kalkulus s výroky, kdy pomocí logických operací v tzv. výrokových formulích konstruujeme složené výroky ze zadaných elementárních výroků vystupujících v roli operandů. Základní operace jsou popsány pomocí pravdivostních (0­1) tabulek, které každé kombinaci pravdivostních hodnot elementárních výroků přiřazují pravdivostní hodnotu výsledného složeného výroku: Operace negace: , A A 0 1 1 0 Slovní vyjádření: A neplatí Operace implikace: A B A B 0 0 1 0 1 1 1 0 0 1 1 1 Slovní vyjádření: A implikuje B; B plyne z A; B je důsledkem A; A je postačující podmínka pro B; B je nutná podmínka pro A; jestliže platí A, pak platí B. 5 Operace ekvivalence: , A B A B 0 0 1 0 1 0 1 0 0 1 1 1 Slovní vyjádření: A je ekvivalentní s B; A je nutná a postačující podmínka pro B; B je nutná a postačující podmínka pro A; A platí právě když B platí; A platí tehdy a jen tehdy, když platí B. Výrok V (A, B, . . . ) 1 (vždy pravdivý) se nazývá tautolo- gie. Operace `A' neboli logický součin neboli konjunkce: &, A B A B = min(A, B) 0 0 0 0 1 0 1 0 0 1 1 1 Slovní vyjádření: platí A i B; platí A a B. Operace `NEBO' neboli logický součet neboli disjunkce: A B A B = max(A, B) 0 0 0 0 1 1 1 0 1 1 1 1 Slovní vyjádření: platí A nebo B. 6 Operace `BUĎ A NEBO': xor A B xor(A, B) 0 0 0 0 1 1 1 0 1 1 1 0 Slovní vyjádření: platí buď A nebo B. Univerzální kvantifikátor: x s vlastností U : V (x) Slovní vyjádření: pro každé x s vlastností U platí V (x). Existenční kvantifikátor: x s vlastností U : V (x) Slovní vyjádření: existuje x s vlastností U splňující V (x). VĚTA 1.1. Platí následující ekvivalence výroků: (1) A A. (2) A B B A, A B B A. (3) DeMorganova pravidla: (A B) A B , (A B) A B . (4) (A B) (A B), (A B) (B A ). (5) (A B) (A B ), (A B) (B A ). (6) (A B) (A B)(B A), (A B) (A B ). (7) (A B) (A B)(B A), (A B) (A B ). (8) Asociativní zákony: A (B C) (A B) C, A (B C) (A B) C. (9) Distributivní zákony: A (B C) (A B) (A C), A (B C) (A B) (A C). (10) ( x s vlastností U : V (x)) ( x s vlastností U : V (x) ) (11) ( x s vlastností U : V (x)) ( x s vlastností U : V (x) ) Poznámka: A B := (A B) , A B := (A B) . 7 DŮKAZ. CVIČENÍ Důkazové techniky: Matematické věty většinou vyjadřují slovně implikace výroků A B (A nazýváme předpokladem věty a B tvrzením věty) nebo ekvivalence výroků A B. Přímý důkaz implikace A B: konstruujeme posloupnost pravdivých výroků: A A1, A1 A2, . . . , An-1 An, An B, tj. dokazujeme, že je pravdivý výrok (A A1) (A1 A2) (An-1 An) (An B). Důkaz implikace A B sporem: provádíme přímý důkaz ekvivalentní implikace B A , která pak vede ke sporu s platností předpokladu A, pokud by za jeho platnosti tvrzení B neplatilo. Důkaz ekvivalence A B: dokazujeme platnost ekvivalentního výroku (A B)(B A) ve dvou krocích: samostatně dokazujeme platnost obou implikací A B a B A. Důkaz platnosti následujícího výroku matematickou indukcí: n n0 : V (n), kde n, n0 jsou přirozená čísla. Nekonečný přímý důkaz tvaru V (n0) (V (n0) V (n0 + 1) V (n0 + 2), . . . ) nahradíme ověřením platnosti ekvivalentního výroku: n > n0 : (V (n0) V (n0 + 1) V (n - 1)) V (n). Důkaz tak probíhá ve dvou krocích: * Počáteční krok: ověření platnosti výroku V (n0) * Indukční krok: pro každé n > n0 ověříme platnost implikace (V (n0) V (n0 + 1) V (n - 1)) V (n). 8 ANGLICKÁ TERMINOLOGIE VÝROKOVÉHO POČTU definice definition tvrzení statement, proposition věta theorem poznámka remark označení notation důkaz proof axiom axiom výrok sentence, proposition pravdivý, nepravdivý true, false negace negation implikace implication A implikuje B A implies B B plyne z A B follows from A B je důsledkem A B is a consequence of A A je postačující podmínka pro B A is a sufficient condition for B B je nutná podmínka pro A B is a necessary condition for A jestliže platí A, pak platí B if A holds then B holds tvrzení platí the statement holds A je ekvivalentní s B A is equivalent with B A je nutná a postačující podmínka pro B A is a necessary and sufficient condition for B A platí právě když (tehdy a jen tehdy když) B platí A holds if and only if (iff) B holds logický součin: A logical AND logický součet: NEBO (logical) OR BUĎ . . . A NEBO logical EXCLUSIVE OR, EITHER . . . OR univerzální kvantifikátor universal quantifier pro každé x s vlastností U platí V (x) V (x) is true for all x having property U existenční kvantifikátor existential quantifier existuje x s vlastností U splňující V (x) there exists x having property U such that V (x) is true 9 1.2. Základy teorie množin. Teorie a příklady: [KaSk: s.9-25,37-43] Příklady: [Ho:řešené č.2-4,7-10; s.6-12], [Ho:neřešené kap.1§2§5; s.42-45,51-54] DEFINICE 1.2 (Naivní pojetí teorie množin: Cantor 1849­1918). Množinou rozumíme soubor libovolných objektů, které nazýváme prvky této množiny. Množina se nazývá konečná, resp. nekonečná, jestliže má konečně, resp. nekonečně mnoho prvků. Zapisujeme: a A, A a . . . a je prvkem A. a / A, A a . . . a není prvkem A. A := {a1, a2, . . . , an} . . . specifikace konečné množiny výčtem prvků. A := {x | x má vlastnost V} . . . specifikace množiny s prvky majícími vlastnost V, například R+ := {x | x R, x 0} značí množinu všech nezáporných reálných čísel. := {} . . . prázdná množina neobsahuje žádný prvek. Výše uvedená definice je příliš široká a vede proto k logickým paradoxům. Nejznámější je Russelův paradox: Definujeme-li M := {X | X je množina: X / X}, pak pro M mohou nastat jen dvě možnosti, obě vedoucí k logickému sporu: (1) M M, což z definice implikuje M / M, nebo (2) M / M, což z definice implikuje M M. MNOŽINOVÉ INKLUZE A = B . . . množiny A a B jsou si rovny, mají-li tytéž prvky. A = B . . . množiny A a B jsou různé, nemají-li tytéž prvky. A B, B A . . . A je podmnožinou B nebo též B je nadmnožinou A, jestliže každý prvek A je také prvkem B. A B, B A . . . A je vlastní podmnožinou B, jestliže A B a současně A = B, tj. kromě všech prvků z A, existuje v B ještě alespoň jeden další prvek. Příklad: N Z Q R C. 10 VĚTA 1.3. Platí A = B tehdy a jen tehdy, když A B a B A. Označení (Intervaly). Nechť a, b R jsou daná reálná čísla. Pak intervalem reálných čísel nazýváme kteroukoli z níže uvedených podmnožin v R: [a, b] := {x | x R : a x b}. . . uzavřený interval; (a, b) := {x | x R : a < x < b}. . . otevřený interval; [a, b) := {x | x R : a x < b}. . . interval zleva uzavřený a zprava otevřený; (a, b] := {x | x R : a < x b}. . . interval zleva otevřený a zprava uzavřený; (-, ) := R; (-, b) := {x | x R : x < b}; (-, b] := {x | x R : x b}; (a, ) := {x | x R : a < x}; [a, ) := {x | x R : a x}. ZOBRAZENÍ DEFINICE 1.4. Buďte A, B množiny. Pravidlo f, které každému prvku a A přiřazuje právě jeden prvek b B, se nazývá zobrazení množiny A do množiny B. Píšeme b = f(a) nebo a f(b). Prvek b se nazývá obraz a v zobrazení f. Zobrazení f se nazývá prosté nebo také injektivní, když platí: a1, a2 A, a1 = a2 f(a1) = f(a2) (nebo ekvivalentně: f(a1) = f(a2) a1 = a2). Zobrazení f se nazývá A na B nebo také surjektivní, když ke každému b B existuje a A tak, že b = f(a). Je-li f prosté zobrazení A na B, nazývá se bijekce nebo také jednojednoznačná korespondence mezi A a B. Bijekce A na A se nazývá permutace množiny A. Zápisy: f : A B . . . zobrazení f z A do B. f : A B . . . prosté zobrazení f z A do B. 11 f : A B . . . zobrazení f z A na B. f : A B . . . bijekce f z A na B. Dvě zobrazení f : A B a g : C D jsou stejná právě když A = C, B = D a f(x) = g(x) pro každé x A. DEFINICE 1.5. Je-li f : A B, C A, D B, pak definujeme: f(C) := {f(a) | a C} . . . obraz množiny C v zobrazení f. f|C : C B definované vztahem f|C (c) := f(c) pro každé c C nazýváme restrikcí zobrazení f na množinu C. f-1 (D) := {a | a A : f(a) D} . . . úplný vzor množiny D v zobrazení f. Je-li f bijekce A na B, pak f-1 ({f(a)}) = {a} pro každé a A a f(f-1 ({b})) = {b} pro každé b B. V takovém případě píšeme zjednodušeně f-1 (f(a)) = a a f(f-1 (b)) = b a takto získané (bijektivní) zobrazení f-1 : B A nazýváme inverzní zobrazení k f. Zřejmě platí: f-1 (b) = a b = f(a). Zobrazení IA : A A definované vztahem IA(a) := a pro každé a A je zřejmě bijekce. Nazývá se identické zobrazení na A. Je-li B A, pak zobrazení 1B : A {0, 1} definované vztahem 1B(a) := ( 1 pro a B 0 pro a / B nazýváme charakteristickou funkcí podmnožiny B (v množině A). DEFINICE 1.6. Zobrazení f : I A, kde I Z, nazýváme posloupností prvků z A a zapisujeme jej ve tvaru {an}nI , kde an := f(n). Pokud I = N, resp. I = Z, píšeme také {an} n=1, resp. {an} n=-. DEFINICE 1.7. Nechť f : A B a g : B C jsou dvě zobrazení, pak zobrazení h : A C definované vztahem h(a) := g(f(a)) pro každé a A, nazýváme složením zobrazení f a g a píšeme h = gf. PŘÍKLAD 1.8. Uvažujme funkční předpis f(x) := x2 , pak f : R R není ani prosté ani surjektivní, 12 f : R R+ je surjektivní, ale není prosté, f : R+ R+ je prosté i surjektivní, tj. je bijekcí. MNOŽINOVÉ OPERACE Nechť dále Ai, i I značí nějaký systém množin indexovaný prvky i z indexové množiny I. DEFINICE 1.9 (Sjednocení množin). A B := {x | (x A) (x B)} A B C := {x | (x A) (x B) (x C)} A1 A2 An := {x | i {1, 2, . . . , n} : x Ai} ... [ iI Ai := {x | i I : x Ai} DEFINICE 1.10 (Průnik množin). A B := {x | (x A) (x B)} A B C := {x | (x A) (x B) (x C)} A1 A2 An := {x | i {1, 2, . . . , n} : x Ai} ... \ iI Ai := {x | i I : x Ai} Jestliže A B = , říkáme, že množiny A a B jsou disjunktní. DEFINICE 1.11 (Rozdíl množin). A - B := {x | (x A) (x / B)} Příklad: R - Q (resp. šířeji C - Q) . . . množina všech iracionálních čísel. 13 DEFINICE 1.12 (Doplněk (komplement) množiny). Jestliže všechny uvažované množiny jsou podmnožinami jisté pevně zvolené univerzální množiny (prostoru) X, pak množinu X - A nazýváme doplňkem nebo také komplementem množiny A (v X) a píšeme A nebo Ac . DEFINICE 1.13 (Symetrická diference). A ÷ B := (A - B) (B - A) DEFINICE 1.14 (Kartézský součin množin). A × B := {[a, b] | (a A) (b B)} A × B × C := {[a, b, c] | (a A) (b B) (c C)} A1 × A2 × × An := {[a1, a2, . . . , an] | i {1, 2, . . . , n} : ai Ai} ... Y iI Ai := XiI Ai := { | : I [ iI Ai, kde (i) Ai i I }, kde [a, b], [a, b, c],. . . ,[a1, a2, . . . , an] značí uspořádané dvojice, trojice atd. až n-tice: i-tou složku uspořádané n-tice lze považovat za obraz čísla i {1, 2, . . . , n} v nějakém zobrazení : {1, 2, . . . , n} Sn i=1 Ai, kde ai := (i) Ai. Odtud pramení zobecnění definice kartézského součinu na libovolný systém množin, kde každá složka koresponduje s indexem i I z libovolné indexové množiny I. Jsou-li všechny množiny v kartézském součinu identické, pak značí: A2 := A × A (kartézský čtverec množiny A), A3 := A ×A ×A, . . . , An := A × A × × A | {z } n× a obecně AI := X iI A. Zejména tedy AI := { | : I A} označuje množinu všech zobrazeni I do A. 14 PŘÍKLAD 1.15. (1) Nechť A := {a, b, c, d} a B := {c, d, e, f}, pak A B = {a, b, c, d, e, f}, A B = {c, d}, A - B = {a, b}, B - A = {e, f} a A ÷ B = {a, b, e, f}. (2) R2 . . . koresponduje s množinou všech bodů roviny, R3 . . . s množinou všech bodů 3-rozměrného prostoru, Rn . . . s množinou všech bodů n-rozměrného prostoru a RN , resp. RZ s množinou všech posloupností reálných čísel. MNOŽINOVÉ IDENTITY VĚTA 1.16. (1) Komutativita: A B = B A (2) Asociativita: (A B) C = A (B C) = A B C (3) Obecná asociativita a komutativita: Všechna možná sjednocení vytvořená všemi možnými uzávorkováními posloupnosti množin A1, A2, . . . , An v libovolném pořadí jsou rovna jedinému prvku A1 A2 An. (4) A A = A, A = A (5) A B A C B C pro libovolné C (6) A A B pro libovolné B (7) A B = B A B Důkaz. CVIČENÍ VĚTA 1.17. (1) Komutativita: A B = B A (2) Asociativita: (A B) C = A (B C) = A B C (3) Obecná asociativita a komutativita: Všechny možné průniky vytvořené všemi možnými uzávorkováními posloupnosti množin A1, A2, . . . , An v libovolném pořadí jsou rovny jedinému prvku A1 A2 An. (4) A A = A, A = (5) A B A C B C pro libovolné C 15 (6) A B A pro libovolné B (7) A B = A A B Důkaz. CVIČENÍ VĚTA 1.18 (Distributivní zákon). A (B C) = (A B) (A C) A (B C) = (A B) (A C) A (B - C) = (A B) - (A C) Důkaz. CVIČENÍ Věta 1.19 (Obecný distributivní zákon ). Nechť I je indexová množina a Ji jsou indexové množiny pro každé i I. Nechť ke každé uspořádané dvojici indexů [i, j], i I, j Ji, je přiřazena množina Aij. Pak platí: \ iI [ jJi Aij = [ K \ iI Ai(i) [ iI \ jJi Aij = \ K [ iI Ai(i), kde K := X iI Ji. Poznámka 1.20. Distributivní zákon A (B C) = (A B) (A C) z věty 1.18 je speciálním případem 1.19 (analogicky po vzájemné záměně operací průniku a sjednocení): Jestliže provedeme přeznačení množin A11 := A, A21 := B a A22 := C a zavedeme indexové množiny I := {1, 2}, J1 := {1} a J2 := {1, 2}, pak K := J1×J2 = {[1, 1], [1, 2]}, takže dostáváme: A11 (A21 A22) = (A11 A21) (A11 A22). Výše uvedený postup můžeme zobecnit do následujícího důsledku věty 1.19. Ten ilustruje skutečnost, že obecný distributivní zákon pro 16 průniky a sjednocení funguje analogicky jako při roznásobování součinu součtů čísel. DŮSLEDEK 1.21. (A1 A2 A3 . . . ) (B1 B2 B3 . . . ) (C1 C2 C3 . . . ) = = [ [j,k,l,... ] (Aj Bk Cl . . . ) (A1 A2 A3 . . . ) (B1 B2 B3 . . . ) (C1 C2 C3 . . . ) = = \ [j,k,l,... ] (Aj Bk Cl . . . ) PŘÍKLAD 1.22 (CVIČENÍ). (A B C) (D E) (F G H) =?. LEMMA 1.23. A - B = A B , kde komplement B uvažujeme v nějaké množině obsahující A i B. VĚTA 1.24 (DeMorganova pravidla ). Nechť A je množina a {Ai}iI systém množin. Pak platí: A - \ iI Ai = [ iI (A - Ai) A - [ iI Ai = \ iI (A - Ai) DŮSLEDEK 1.25. [KaSk:Věta 1.4 s.15] ( \ iI Ai) = [ iI Ai ( [ iI Ai) = \ iI Ai, kde komplementy uvažujeme v nějaké množině obsahující všechny množiny Ai, i I, neboli obsahující jejich sjednocení. 17 VĚTA 1.26 (Vlastnosti symetrické diference ). Platí (1) Komutativita: A ÷ B = B ÷ A (2) Asociativita: (A ÷ B) ÷ C = A ÷ (B ÷ C) (3) Distributivita s průnikem: A (B ÷ C) = (A B) ÷ (A C) (4) A ÷ A = , A ÷ = ÷ A = A DEFINICE 1.27. Nechť {An} n=1 je posloupnost množin. Pak definujeme: lim sup An (limes superior) jako množinu všech prvků, které leží v nekonečně mnoha množinách An a lim inf An (limes inferior) jako množinu všech prvků, které leží ve skoro všech množinách An (tj. ve všech s výjimkou konečného počtu). Zřejmě platí lim inf An lim sup An. Platí-li lim inf An = lim sup An =: A, pravíme, že posloupnost množin {An} n=1 je konvergentní a píšeme A = lim An. VĚTA 1.28. Platí lim inf An = [ k=1 \ n=k An lim sup An = \ k=1 [ n=k An DŮKAZ. x lim sup An x leží v nekonečně mnoha množinách An x S n=k pro každé k = 1, 2, . . . x T k=1 S n=k An. Druhá identita se dokáže analogicky (cvičení). DŮSLEDEK 1.29. Monotonní posloupnost je konvergentní. Přitom (1) je-li posloupnost neklesající: A1 A2 A3 . . . , pak lim An = S n=1 An =: A a píšeme An A. (2) je-li posloupnost nerostoucí: A1 A2 A3 . . . , pak lim An = T n=1 An =: A a píšeme An A. 18 MOHUTNOSTI MNOŽIN A KARDINÁLNÍ ČÍSLA DEFINICE 1.30. Množiny A a B se nazývají ekvivalentní, píšeme A B, jestliže existuje bijekce A na B. Říkáme také, že A a B mají stejnou mohutnost a píšeme card A = card B. Symbol a := card A pak nazýváme mohutností nebo kardinálním číslem množiny A. Jestliže existuje injekce A do B (neboli A je ekvivalentní s nějakou podmnožinou B), píšeme card A card B. Pokud přitom A a B nemají stejnou mohutnost, tj. card A = card B, píšeme card A < card B. DEFINICE 1.31. Každá množina ekvivalentní s množinou všech přirozených čísel N se nazývá spočetná. DEFINICE 1.32. Nekonečná množina, která není spočetná se nazývá nespočetná. VĚTA 1.33 ( viz také dále 1.34 a 1.35). Interval [0, 1] je nespočetný. DEFINICE 1.34. Říkáme, že množina M je množina o mohutnosti kontinua, je-li M [0, 1]. VĚTA 1.35 ( viz také dále 1.59(2)). Každý netriviální interval (tj. interval obsahující více jak jeden prvek) má mohutnost kontinua. Poznámka 1.36. (1) Pro množiny, které nejsou nekonečné, udává mohutnost počet jejich prvků: card =: 0 card {a1, a2, . . . , an} =: n (2) Pro zápis mohutnosti nekonečných množin je používán symbol (čteme alef : písmeno A hebrejské abecedy): A spočetná: card A =: 0 A o mohutnosti kontinua: card A =: . (3) Pro zápis mohutnosti disjunktního sjednocení množin je používán symbol + nebo P : 19 card ( S iI Ai) =: P iI card Ai card (A1 A2 An) =: card A1 + card A1 + + card An. (4) Pro zápis mohutnosti kartézského součinu množin je používán symbol nebo Q : card ( X iI Ai) =: Q iI card Ai, resp. card (AI ) =: (card A)card I , Speciálně card (A ) =: (card A)0 =: 1, tj. množina všech zobrazení z prázdné množiny do A se považuje za jednoprvkovou množinu obsahující tzv. prázdné zobrazení. card (A1 × A2 × × An) =: card A1 card A1 card An, resp. card (An ) =: (card A)n . VĚTA 1.37. Buď I indexová množina a {Ai}iI a {Bi}iI dva systémy množin takové, že Ai Bi pro každé i I. Pak platí: (1) X iI Ai X iI Bi (2) Jsou-li množiny Ai po dvou disjunktní a rovněž množiny Bi po dvou disjunktní, platí také S iI Ai S iI Bi. DŮSLEDEK 1.38. A1 B1, A2 B2 A1 × A2 B1 × B2. Jsou-li navíc jak A1, A2 tak B1, B2 disjunktní, platí navíc A1 A2 B1 B2. VĚTA 1.39. Buď dán systém množin {Ai}iI , kde množiny Ai jsou po dvou disjunktní a Ai A pro každé i I. Pak S iI Ai I × A a P iI (card Ai) = card I card A. VĚTA 1.40 ([KaSk:V4.6 s.39],). Nechť A2 A1 A a nechť A2 A. Pak také A1 A. Neboli card A2 card A1 card A card A1 = card A. DŮSLEDEK 1.41. Nechť A, B jsou dvě množiny, z nichž každá je ekvivalentní s podmnožinou druhé. Pak A B. Zejména tedy platí: (card A card B) (card B card A) (card A = card B). 20 Zejména tedy pro žádné dvě množiny A a B nemůže současně platit card A < card B a card B < card A. Věta 1.42 (Komut. zákon pro kartézský součin ). Nechť je dán systém množin {Ai}iI , ai := card Ai, a I J, kde f je bijekce J na I. Pak X iI Ai X jJ Af(j) a Q iI ai = Q jJ af(j). DŮSLEDEK 1.43. (1) Je-li f permutace množiny I, pak platí X iI Ai X iI Af(i) a Q iI ai = Q iI af(i). (2) A × B B × A a card A card B = card B card A. Věta 1.44 (Asoc. zákon pro kartézský součin ). Nechť je dán systém množin {Ai}iI , ai := card Ai, a I = S kK Ik, kde množiny Ik jsou po dvou disjunktní. Pak platí X iI Ai X kK ( X iIk Ai), Q iI ai = Q kK ( Q iIk ai). DŮSLEDEK 1.45. (1) Platí A × (B × C) (A × B) × C A × B × C, a(bc) = (ab)c = abc, kde a, b, c značí po řadě mohutnosti množin A, B, C. (2) Nechť I = S kK Ik, kde Ik jsou po dvou disjunktní. Pak platí AI X kK AIk a (card A) P kK card Ik = Q kK (card A)card Ik . Zejména AI1I2 AI1 × AI2 a card Acard I1+card I2 = card Acard I1 card Acard I2 , jsou-li I1 a I2 disjunktní. (3) Nechť M je množina, m := card M, a nechť je dán systém množin {Ai}iI , ai := card Ai. Pak platí ( X iI Ai)M X iI AM i , ( Q iI ai)m = Q iI am i . Zejména (A × B)M AM × BM , (a b)m = am bm , kde a, b jsou po řadě mohutnosti množin A, B. 21 (4) Pro libovolné množiny A, M, N a jejich mohutnosti a, m, n platí AM×N (AM )N , amn = am an . Věta 1.46 (Distr. zákony pro kartézský součin ). Nechť I je indexová množina a Ji jsou indexové množiny pro každé i I. Nechť ke každé uspořádané dvojici indexů [i, j] je přiřazena množina Aij. Pak platí: XiI [ jJi Aij = [ K XiI Ai(i) XiI \ jJi Aij = \ K XiI Ai(i) kde K := X iI Ji. DŮSLEDEK 1.47. Platí A × (B C) = (A × B) (A × C) A × (B C) = (A × B) (A × C) VĚTA 1.48. Buď M množina a B množina obsahující dva prvky. Označme P(M) množinu všech podmnožin množiny M (někdy se také značí poněkud nepřesně jako 2M ). Pak P(M) BM a card (P(M)) = 2card M . VĚTA 1.49 (Cantorova věta [KaSk:V4.14-15 s.41]). Pro každé kardinální číslo a platí 2a > a. VĚTA 1.50. Množina A je spočetná tehdy a jen tehdy, když její prvky lze očíslovat přirozenými čísly, tj. když ji lze psát ve tvaru posloupnosti: A := {a1, a2, . . . , an, . . . } = {an} n=1. PŘÍKLAD 1.51. Příklady spočetných množin: * N := {1, 2, 3, . . . , n, . . . } . . . množina přirozených čísel * {2, 4, 6, . . . , 2n, . . . } . . . množina sudých přirozených čísel 22 ˇ {1, 3, 5, . . . , 2n - 1, . . . } . . . množina lichých přirozených čísel * {1, 4, 9, . . . , n2 , . . . } . . . množina kvadrátů přirozených čísel * {1, 1 2 , 1 3 , . . . , 1 n , . . . } . . . množina převrácených hodnot přirozených čísel VĚTA 1.52 (Vlastnosti spočetných množin). (1) Každá nekonečná množina obsahuje (vlastní) spočetnou pod- množinu. (2) Každá nekonečná podmnožina spočetné množiny je spočetná. (3) Rozdíl spočetné množiny a konečné množiny je spočetná množina (0 - n = 0 pro každé n N). (4) Sjednocení spočetné množiny a konečné množiny je spočetná množina (0 + n = 0 pro každé n N). (5) Sjednocení konečného počtu spočetných množin je spočetná množina (n 0 = 0 pro každé n N). (6) Sjednocení spočetné množiny neprázdných po dvou disjunktních konečných množin je spočetná množina (0 n = 0 pro každé n N). (7) Kartézský součin konečného počtu spočetných množin je spočetná množina (n 0 = 0 pro každé n N). Důkaz. . DŮSLEDEK 1.53. (1) Sjednocení spočetné množiny spočetných množin je spočetná množina. (2) Množina všech celých i racionálních čísel je spočetná. (3) Množina všech racionálních čísel netriviálního intervalu reálných čísel je spočetná. (4) Množina všech bodů v rovině (v prostoru) s racionálními souřadnicemi je spočetná. (5) Množina všech komplexních čísel s racionální reálnou i imaginární částí je spočetná. 23 (6) Množina všech polynomů s celými (racionálními) koeficienty je spočetná. (7) Množina všech algebraických čísel je spočetná (algebraickým číslem rozumíme reálné číslo, které je kořenem nějakého polynomu s celočíselnými koeficienty). VĚTA 1.54. Je-li M nekonečná a A nejvýše spočetná množina (tj. konečná nebo spočetná), pak M A M (neboli M A má stejnou mohutnost jako M). DŮSLEDEK 1.55. Nechť M je spočetná množina, pak P(M) má mohutnost kontinua a platí 20 = > 0. VĚTA 1.56. Buď M nespočetná množina a A její nejvýše spočetná podmnožina. Pak M - A M. Je-li A konečná, platí tvrzení i pro spočetnou množinu M dle 1.52(3). DŮSLEDEK 1.57. Množina M je nekonečná právě když obsahuje vlastní podmnožinu stejné mohutnosti jako M. VĚTA 1.58 (Vlastnosti množin o mohutnosti kontinua). (1) Každá množina o mohutnosti kontinua obsahuje vlastní podmnožinu o mohutnosti kontinua [plyne z 1.57]. (2) Rozdíl množiny o mohutnosti kontinua a nejvýše spočetné množiny má mohutnost kontinua ( - n = - 0 = pro každé n N) [plyne z 1.56]. (3) Sjednocení množiny o mohutnosti kontinua a nejvýše spočetné množiny je množina o mohutnosti kontinua ( + n = + 0 = pro každé n N) [plyne z 1.54]. (4) Sjednocení nejvýše spočetné množiny po dvou disjunktních množin o mohutnosti kontinua má mohutnost kontinua (n = 0 = pro každé n N) . 24 (5) Kartézský součin spočetně mnoha dvouprvkových množin má mohutnost kontinua ( = 20 > 0) [plyne z 1.55 a z 1.48]. (6) Množina všech posloupností přirozených čísel má mohutnost kontinua (0 0 = ) . (7) Kartézský součin nejvýše spočetně mnoha množin o mohutnosti kontinua má mohutnost kontinua (n = 0 = pro každé n N) . DŮSLEDEK 1.59. (1) Sjednocení nejvýše spočetné množiny množin o mohutnosti kontinua má mohutnost kontinua [plyne z 1.58(4) užitím 1.40]. (2) Každý netriviální interval i jeho nejvýše spočetná mocnina mají mohutnost kontinua [viz 1.54, 1.56 a 1.58(4)(7)]. Zejména Rn pro každé n N i RN mají mohutnost kontinua. (3) Množina všech iracionálních čísel má mohutnost kontinua [plyne ze (2) a z 1.58(2)] . (4) Množina všech transcendentních čísel má mohutnost kontinua (transcendentním číslem nazýváme každé reálné číslo, které není algebraické) [plyne ze 1.53(7) a z 1.58(2)]. (5) Množina všech bodů v rovině má mohutnost kontinua [plyne ze (2)]. Zejména C má také mohutnost kontinua. (6) Buď dán systém množin {Ai}iI , kde množiny Ai jsou po dvou disjunktní a každá z nich má mohutnost kontinua stejně jako indexová množina I. Pak S iI Ai má rovněž mohutnost kontinua [plyne z 1.58(7) spolu s 1.39]. (7) Kartézský součin spočetně mnoha nejvýše spočetných množin o alespoň dvou prvcích má mohutnost kontinua (n0 = 0 0 = pro každé n N, n 2) [plyne z 1.58(5)(6) užitím 1.40]. 25 1.3. Číselné obory. V této kapitole shrneme základní poznatky o číselných oborech, které se nejčastěji vyskytují v matematice. MNOŽINA PŘIROZENÝCH ČÍSEL N N := {1, 2, . . . , n, . . . }. Operace: sečítání +, násobení . a z něj odvozené umocňování: nk := n × n × × n | {z } k× , k N, n0 := 1. Význačné prvky: jednotkový prvek 1 (1.n = n.1 = n n N) Mohutnost: card N = 0 dle 1.31 a 1.36(2). MNOŽINA CELÝCH ČÍSEL Z Příklady: [Ho:neřešené §3; s.45-47] Z := {. . . , -2, -1, 0, 1, 2, . . . , n, . . . } = {-n | n N} {0} N. Operace: sečítání +, odečítání -, násobení . a z něj odvozené umocňování: nk := n × n × × n | {z } k× , k N, n0 := 1 pro n = 0. Význačné prvky: * jednotkový prvek 1 (1.n = n.1 = n n Z) * nulový prvek 0 (0 + n = n + 0 = n n Z) Mohutnost: card Z = 0 dle 1.53(2). MNOŽINA CELÝCH ČÍSEL MODULO N: ZN ZN := {0, 1, . . . , N - 1} pro každé N N. Jelikož každé celé číslo n Z lze jednoznačně vyjádřit ve tvaru n = q.N +r (q je celá část podílu a r ZN zbytek po dělení), můžeme zavést surjektivní zobrazení N : Z ZN přiřazující každému celému číslu n jeho zbytek po dělení číslem N: tzv. operace modulo. Pomocí této operace zavedeme tzv. modulární aritmetiku na ZN . Operace: * sečítání modulo N: a b := a + b mod N := a + b N , * odečítání modulo N: a b := a - b mod N := a - b N , * násobení modulo N: a b := a.b mod N := a.b N 26 a z něj odvozené umocňování modulo N: nk mod N := nk N , k N, n0 mod N := 1 pro n = 0. Význačné prvky: * jednotkový prvek 1 při N > 1 (1 n = n 1 = n n ZN ) * nulový prvek 0 (0 n = n 0 = n n ZN ) Mohutnost: card ZN = N dle 1.36(1). MNOŽINA RACIONÁLNÍCH ČÍSEL Q Q := {p q | p q je hodnota zlomku s čit. p a jmenov. q, p, q Z, q = 0}. Je-li q = 1, pak p q = p a tedy Z Q. Operace: sečítání +, odečítání -, dělení nenulovým číslem /, násobení . a z něj odvozené umocňování: rk := r × r × × r | {z } k× , k N; pro r = 0 definujeme r0 := 1 a r-k := (1/r)k . Význačné prvky: * jednotkový prvek 1 (1.r = r.1 = r r Q) * nulový prvek 0 (0 + r = r + 0 = r r Q) Mohutnost: card Q = 0 dle 1.53(2). MNOŽINA REÁLNÝCH ČÍSEL R R := {r | r = dk dk-1 . . . d0, d-1 d-2 . . . je desetinné vyjádření čísla r}. Tedy r = Pk j=- dj10j , k Z, k 0, kde dj Z10, jsou dekadické cifry vyjádření čísla r v soustavě o základu 10, tj. pro k N je dk-1 k-tá cifra před desetinnou čárkou a d-k k-tá cifra za desetinnou čár- kou. Každé reálné číslo lze vyjádřit v libovolné soustavě o základu N N, N 2, kdy r = Pk j=- djNj , k Z, k 0, kde dj ZN . V paměti počítačů se užívají soustavy o základu N = 2 (dvojková, binární, dyadická), kde cifry dj {0, 1}; N = 8 (osmičková, oktalová) nebo N = 16 (šestnáctková, hexadecimální), kde cifry dj 10 obvykle nahrazujeme písmeny: 10 =: A, 11 =: B, 12 =: C, 13 =: D, 14 =: E, 15 =: F. 27 Množina R představuje zúplnění množiny Q v tom smyslu, že každé reálné číslo je 'limitou' nějaké posloupnosti racionálních čísel. Například stačí vzít useknuté desetinné rozvojePk j=-m dj10j = dk dk-1 . . . d0, d-1 d-2 . . . d-m postupně s m = 1, 2, . . . místy za desetinnou čárkou, které představují racionální čísla blížící se pro m k číslu r. Operace: sečítání +, odečítání -, dělení nenulovým číslem /, násobení . a z něj odvozené umocňování rk := r × r × × r | {z } k× , kde r R a k N; pro r = 0 definujeme r0 := 1 a r-k := (1/r)k . Pokud r > 0, lze umocňování dále rozšířit na rs i pro reálný exponent s R, přičemž platí r-s := (1/r)s . Význačné prvky: * jednotkový prvek 1 (1.r = r.1 = r r R) * nulový prvek 0 (0 + r = r + 0 = r r R) Mohutnost: card R = dle 1.59(2). MNOŽINA IRACIONÁLNÍCH ČÍSEL I I := R - Q. Mohutnost: card I = dle 1.59(3). MNOŽINA ALGEBRAICKÝCH ČÍSEL A Dle 1.53(7) algebraickým číslem rozumíme každé reálné číslo a R, které je kořenem nějakého polynomu s celočíselnými koeficienty, tj. platí P(a) = 0, pro nějaký polynom P(x) = p0 + p1x + + pnxn stupně n N, kde pi Z i Z, pn = 0. Je Q A, neboť každé racionální číslo p q , q = 0, je řešením lineární rovnice q.x - p = 0. Existují však další algebraická čísla: například n m pro libovolné m, n N, n > 1, je řešením rovnice xn - m = 0. Zejména 2 je algebraické číslo, které není racionální. Mohutnost: card A = 0 dle 1.53(7). 28 MNOŽINA TRANSCENDENTNÍCH ČÍSEL T Dle 1.59(4) definujeme T := R - A R - Q = I. Nejznámějšími příklady transcendentních čísel jsou čísla e := 2.718281828459 . . . základ tzv. přirozeného logaritmu ln a := 3.1415926535897 . . . Ludolfovo číslo=délka kružnice o průměru 1. Mohutnost: card T = dle 1.59(4). MNOŽINA KOMPLEXNÍCH ČÍSEL C Motivací pro zavedení komplexních čísel je skutečnost, že některé polynomické rovnice P(x) = 0 s reálnými koeficienty nemají reálný kořen. Například x2 + 1 > 0 pro každé x R. Jestliže označíme speciálním symbolem i := -1 nazývaným imaginární jednotka, pak i2 = -1 můžeme považovat za řešení odpovídající rovnice x2 + 1 = 0 (někdy místo i se používá symbol j). Zavedeme-li množinu tzv. komplexních čísel jako množinu formálních součtů reálných čísel s reálnými násobky imaginární jednotky, tj. C := {a + i.b | a R, b R}, pak se dá ukázat, že uvedený problém bude odstraněn: každý polynom stupně n s komplexními koeficienty bude mít právě n kořenů. To odpovídá zkušenosti z reálného oboru s rovnicí x2 - 1, která má dva kořeny -1 a 1. V rozšířeném oboru komplexních čísel C pak podobně rovnice x2 + 1 má dva kořeny -i a i. Značení: Je-li c = a + i.b komplexní číslo, pak značí Re c := a . . . reálnou část c Im c := b . . . imaginární část c |c| := a2 + b2 . . . velikost (absolutní hodnotu, modul) c := arctan( b a ), 0 < 2 . . . argument c c := a - i.b . . . číslo komplexně sdružené k c (zřejmě c.c = |c|2 ). Zřejmě C {[a, b] | a R, b R} = R2 , takže každé komplexní číslo a + i.b můžeme znázornit jako bod v kartézské rovině o souřadnicích a, b. Tato rovina se pak nazývá komplexní rovina. 29 Dostáváme tak tři základní tvary pro vyjádření komplexního čísla: * kartézský: c = a + i.b * goniometrický: c = A(cos + i sin ), který odpovídá přechodu k polárním souřadnicím: a = A cos , b = A sin . * Eulerův: c := Aei , kde ei := cos + i sin je komplexní číslo na jednotkové kružnici v komplexní rovině. R = {c C | Im c = 0} C, přičemž operace z R rozšíříme formálně na C za užití vlastnosti i2 = -1 při operacích násobení a dělení. Operace sečítání (odečítání) se provádí po složkách jako s vektory v rovině. Tyto výpočty pak formálně usnadňuje Eulerův zápis. Odtud dostáváme s uvážením 1 i = i i.i = -i: i0 = 1, i1 = i, i2 = -1, i3 = -i, i4 = 1, obecně: i4n+k = ik n, k Z. Operace (podrobněji viz přílohu A): sečítání +, odečítání -, dělení nenulovým číslem /, násobení . a z něj odvozené umocňování (resp. odmocňování) ck := c × c × × c | {z } k× , kde c C a k N; pro c = 0 lze umocňování dále rozšířit na cs i pro komplexní exponent s C, přičemž platí c-s := (1/c)s . Význačné prvky: * jednotkový prvek 1 := 1 + i.0 (1.c = c.1 = c c C) * nulový prvek 0 := 0 + i.0 (0 + c = c + 0 = c r R). Mohutnost: card C = dle 1.59(5). 30 ANGLICKÁ TERMINOLOGIE TEORIE MNOŽIN množina, prázdná množina set, empty set (vlastní) podmnožina, nadmnožina (proper) subset, superset zobrazení, prosté, inverzní mapping, injective, inverse surjektivní (na), bijektivní surjective (onto), bijective permutace permutation obraz, úplný vzor image, preimage (inverse image) posloupnost sequence sjednocení, průnik union, intersection (kartézský) součin, mocnina (cartesian) product, power disjunktní, po dvou disjunktní disjoint, pairwise disjoint rozdíl, symetrická diference difference, symmetric difference monotonní, konvergentní monotone, convergent mohutnost, kardinální číslo cardinality, cardinal number spočetný, nespočetný countable, uncountable mohutnost kontinua continuum power konečný, nekonečný finite, infinite množina všech podmnožin power set číslo, reálné, komplexní mumber, real, complex celé, racionální, iracionální integer, rational, irrational algebraické, transcendentní algebraic, transcendental komplexně sdružené číslo complex conjugate number 31 MATLAB logical . . . transformace čísla na logický typ: a = 0 logical(a)=true (platí), logical(0)=false (neplatí) mod . . . operace modulo: mod(n,N) = n N . i,j . . . imaginární jednotka. Logické operátory: A (negace A), A & B (konjunkce), A | B (disjunkce), xor(A,B). . . buď a nebo. Ostatní logické operátory se z nich složí pomocí ekvivalentních logických formulí (viz 1.1). Zápisy množin: například {a1,a2,a3} nebo [a1,a2,a3] . . . řádková verze. Jako oddělovač lze užít i středník (sloupcová verze). Množinové operace: ismember(A,B) . . . testuje příslušnost prvků z A v B unique(A) . . . odstraní z A duplicitní prvky union(A,B) . . . sjednocení množin A a B intersect(A,B) . . . průnik množin A a B setdiff(A,B) . . . rozdíl množin A a B setxor(A,B) . . . symetrická diference množin A a B Ostatní operace lze vytvořit (simulovat) pomocí vhodných složených výrazů. 32 2. Algebraické struktury Teorie a příklady: [KaSk: s.26-36,44-53] Příklady: [Ho:řešené č.5,6,11-15; s.8,9,13-16], [Ho:neřešené kap.1,§4-7,kap.2 s.47-80] MOTIVACE V reálném světě se objekty zařazované do množin často vyznačují specifickými vlastnostmi: můžeme je dávat do nejrůznějších souvislostí (relací) ­ např. je porovnávat, vybírat mezi nimi jisté význačné prvky se specifickou rolí, provádět různé operace, měřit velikost či vzdálenost, nebo u některých podmnožin jejich délku, plochu, objem, hmotnost apod. Nejnázornějším motivačním příkladem může sloužit v tomto směru množina reálných čísel R. Její prvky lze porovnávat (relace uspořádání), sečítat či násobit, roli význačných prvků hraje 0 a 1, velikost a vzdálenost měříme absolutní hodnotou, intervaly jsou specifické podmnožiny, jimž lze přiřadit délku apod. Algebraické struktury představují abstraktní konstrukci umožňující přenášet vybrané strukturní vlastnosti reálné přímky i na množiny sice s jinými prvky ale podobného charakteru. Nepřeneseme-li vlastnosti všechny, ale jen některé, část strukturních rysů reálné přímky ztratíme, některé však zůstanou zachovány. Cílem této (ale i následující) kapitoly je podat přehled nejčastěji používaných matematických struktur a jejich základních vlastností. DEFINICE 2.1. V širším smyslu (algebraickou) strukturou rozumíme uspořádanou dvojici (N, S), kde N = je samotná množina, tzv. nosič algebraické struktury, a S systém množin popisující její strukturu (množina relací, operací, význačných prvků, specifických podmnožin apod.). Jestliže například S = {+, , 1}, píšeme také (N, +, , 1) místo (N, {+, , 1}). 33 DEFINICE 2.2. Jsou-li (N1, S1) a (N2, S2) dvě algebraické struktury téhož typu1 a f : N1 N2 zobrazení přenášející konzistentně1 strukturu S1 do S2, pak říkáme, že zobrazení f zachovává strukturu na (N1, S1) a f nazýváme homomorfizmem (N1, S1) do (N2, S2); píšeme f : (N1, S1) (N2, S2). Homomorfizmus (N, S) do (N, S) se nazývá endomorfizmus struktury (N, S). Bijektivní homomorfizmus se nazývá izomorfizmus, jestliže f-1 : (N2, S2) (N1, S1) je rovněž homomorfizmem. V takovém případě píšeme (N1, S1) (N2, S2). 2.1. Relace a operace. DEFINICE 2.3. Buďte M1, M2, . . . , Mn, n N, neprázdné množiny, pak každou podmnožinu M1 × M2 × × Mn nazýváme n-ární relací mezi množinami M1, M2, . . . , Mn (pro n = 1 unární, pro n = 2 binární, pro n = 3 ternární atd.). Je-li M1 = M2 = . . . Mn =: M, pak Mn nazýváme n-ární relací na množině M. Řekneme pak, že (M, ) je množina s relací. V případě binární relace se obvykle místo [x, y] píše x y a říká se, že prvek x je v relaci s prvkem y. Podobně píšeme x y nebo x non y, jestliže tomu tak není. DEFINICE 2.4. Buďte M a M1, M2, . . . , Mn, n {0} N, neprázdné množiny, pak zobrazení f : M1 × M2 × × Mn M nazýváme funkcí n proměnných na M1 × M2 × × Mn. Je-li M1 = M2 = . . . Mn =: M, pak f : Mn M nazýváme n-ární operací na množině M (pro n = 0 nulární, pro n = 1 unární, pro n = 2 binární, pro n = 3 ternární atd.). Řekneme pak, že (M, f) je množina s operací. Píšeme obvykle místo f([x1, . . . , xn]) zjednodušeně f(x1, . . . , xn). V případě binární operace se obvykle místo y = f(x1, x2) píše y = x f y, pokud f reprezentuje vhodný operátor (např. + pro operaci sečítání). 1Přesný význam určuje každá konkrétní struktura -- viz dále 34 Poznámka 2.5. Někdy také relaci ztotožňujeme s její charakteristickou funkcí (viz 1.5) a v souladu s 2.4 píšeme (x1, x2, . . . , xn) = 1, resp. (x1, x2, . . . , xn) = 0, jestliže prvky xi Mi (i = 1, 2, . . . , n) jsou, resp. nejsou v relaci . Každá unární relace na M koresponduje s nějakou podmnožinou v M. Relační struktury představují základní aparát konstrukce tzv. relačních databázových systémů, kde jsou dle potřeby do vzájemného vztahu dávány informace uložené v databázi. Poznámka 2.6. (1) Pro danou funkci n proměnných můžeme zavést (n + 1)-ární relaci f M1 × × Mn × M takto: f (x1, . . . , xn, y) = 1 právě když y = f(x1, . . . , xn). Zřejmě f pak můžeme považovat za graf funkce f. Obvykle však neděláme rozdíl mezi funkcí a jejím grafem. Z definice zobrazení naopak plyne, že daná (n+1)-ární relace M1 × × Mn × M může být grafem nejaké funkce n proměnných M1 × M2 × × Mn do M právě když má tuto vlastnost: pro každou uspořádanou n-tici x1 M1, . . . , xn Mn existuje jediné y M : (x1, . . . , xn, y) = 1. Funkční hodnotou je pak právě tento prvek y. (2) Zvláštní roli hraje nulární operace na M. Podle 1.36(4) ji totiž můžeme považovat za zobrazení M M, tj. za zobrazení, které prázdnému zobrazení přiřazuje nějaký význačný prvek z M. Opět nerozlišujeme mezi význačným prvkem a nulární operací, která jej vybrala: strukturu s jedním význačným prvkem pak zapisujeme například takto: (R, 1). Pokud nebude řečeno jinak, budeme nadále ve zbytku této kapitoly uvažovat algebraické struktury (M, S), kde S obsahuje pouze relace a operace. 35 DEFINICE 2.7. Binární relace na M se nazývá: a) reflexivní, když a a pro každé a M; b) areflexivní, když a a pro každé a M; c) symetrická, když a b b a pro libovolné a, b M; d) asymetrická, když a b b a pro libovolné a, b M; e) antisymetrická, když a b, b a a = b pro libovolné a, b M; f) tranzitivní, když a b, b c a c pro libovolné a, b, c M; g) atranzitivní a b, b c a c pro libovolné a, b, c M; h) antitranzitivní, když a b, b c, a c (a = b) (b = c) (a = c) pro libovolné a, b, c M; i) úplná, když pro každé a, b M platí a b nebo b a. DEFINICE 2.8. Binární operace na M se nazývá: a) asociativní, když a (b c) = (a b) c pro libovolné a, b, c M; b) komutativní, když a b = b a pro libovolné a, b M; Význačný prvek e M se nazývá neutrálním prvkem binární operace , jestliže a e = e a = a pro každé a M; Definice 2.9. Řekneme, že dvě algebraické struktury (M1, S1) a (M2, S2) jsou téhož typu, jestliže existuje bijekce S1 na S2 přiřazující každé relaci (operaci) z S1 odpovídající relaci (operaci) v S2 téže arity. Definice 2.10. Pro dvě algebraické struktury (M1, S1) a (M2, S2) téhož typu považujeme ve smyslu definice 2.2 za homomorfizmus (M1, S1) do (M2, S2) každé zobrazení f : M1 M2 s těmito vlast- nostmi: (1) pro každou relaci 1 S1 a odpovídající relaci 2 S2 téže arity n platí: 1(x1, . . . , xn) = 1 2(f(x1), . . . , f(xn)) = 1; (2) pro každou operaci 1 S1 a odpovídající operaci 2 S2 téže arity n platí: f(1(x1, . . . , xn)) = 2(f(x1), . . . , f(xn)). 36 Zejména f zobrazí každý význačný prvek v (M1, S1) na odpovídající význačný prvek v (M2, S2). Zřejmě složení dvou homomorfizmů je opět homomorfizmus (viz též dále konec poznámky 2.61). Definice 2.11 (Přímý součin algebraických struktur). Nechť {(Mi, Si)}iI je systém algebraických struktur téhož typu: Si = {ij}jJ , kde ij je pro každé i I buď operace nebo relace téže arity nj. Algebraickou strukturu (M, S) nazveme přímým součinem algebraických struktur (Mi, Si), jestliže M = X iI Mi, kde S := {j}jJ obsahuje relace (operace) definované po složkách: nechť , k M pro k = 1, . . . , nj a j J, pak (1) jsou-li ij relace pro každé i I, definujeme j-tou relaci takto: j(1, . . . , nj ) = 1 právě když ij(1(i), . . . , nj (i)) = 1 pro všechna i I; (2) jsou-li ij operace pro každé i I, definujeme j-tou operaci takto: j(1, . . . , nj )(i) := ij(1(i), . . . , nj (i)) pro každé i I. Značíme také S =: X iI Si, případně (M, S) =: X iI (Mi, Si). Je-li I konečná, například I = {1, 2, . . . , q}, pak také explicitně: S =: S1 ×S2 × ×Sq a (M, S) =: (M1, S1)×(M2, S2)× ×(Mq, Sq). Definice 2.12 (Algebraické podstruktury). Nechť (M, S) a (M , S ) jsou algebraické struktury téhož typu: S = {j}jJ a S = {j}jJ , kde j a j jsou pro každé j J buď operacemi nebo relacemi téže arity nj. Řekneme, že (M , S ) je algebraickou podstrukturou algebraické struktury (M, S), jestliže M M a pro každé j J a x1, . . . , xnj M platí: (1) jsou-li j a j relace, pak j(x1, . . . , xnj ) = 1 právě když j(x1, . . . , xnj ) = 1, neboli j = M nj j; (2) jsou-li j a j operace, pak x := j(x1, . . . , xnj ) M a j(x1, . . . , xnj ) = x. 37 Říkáme také, že podmnožina M M je uzavřená vzhledem ke struktuře S a píšeme (M , S ) (M, S) nebo jen M M. Zejména M musí obsahovat všechny význačné prvky z M. Definice 2.13 (Generátory). Nechť (M, S) je algebraická struktura a G M nějaká její podmnožina. Jestliže existuje nejmenší2 podmnožina M M obsahující G (tj. G M ) taková, že (M , S) je podstrukturou v (M, S), pak G nazýváme množinou generátorů struktury (M , S) nebo také říkáme, že struktura (M , S) je generována svou podmnožinou G a píšeme M = S(G) (zde S vystupuje spíše v roli symbolu pro struktury téhož typu). Příklad 2.14. (N, +) je algebraická podstruktura v (Z, +) generovaná jednoprvkovou podmnožinou G = {1} Z. Poznámka 2.15. Binární relace či operace na konečných množinách nevelkého rozsahu lze zadat tabulkou (viz [KaSk:obr.8,15 s.26,45]). Binární relace je také možno znázornit graficky ([KaSk:obr.9 s.27]). V dalších odstavcích této kapitoly se již zaměříme na speciální případy jednoduchých struktur, které spolu s příklady budou dobře ilustrovat obecnou koncepci, kterou jsme zavedli v tomto odstavci. 2.2. Uspořádané množiny. DEFINICE 2.16. Binární relace na M se nazývá (částečné) uspořádání, je-li reflexivní, antisymetrická a tranzitivní. Nazývá se úplné uspořádání nebo také lineární uspořádání, je-li navíc úplná. Algebraická struktura (M, ) se pak nazývá (částečně, příp. lineárně) uspořádaná množina. Relace uspořádání se obvykle značí symbolem nebo a pod. Píšeme pak (M, ) nebo (M, ) a pod. 2(M , S) (M, S), G M (M , S) (M , S) . . . viz dále 2.20 38 PŘÍKLAD 2.17. Lineárně uspořádané množiny: (N, ), (Z, ), (Q, ) a (R, ) s obvyklým uspořádáním. Částečně uspořádané množiny, které nejsou lineárně uspořádány: (N, |), kde n|m značí, že n je dělitelem m; (P(M), ); Poznámka 2.18. Uspořádané množiny lze graficky znázornit pomocí tzv. Hasseova diagramu (viz [KaSk:obr.11,12 s.28-29]). VĚTA 2.19 (Důkaz D.1). Nechť je uspořádání na M. Definujme na M relaci < takto: a < b (a b) (a = b). Pak < je relace areflexivní a tranzitivní. Naopak, je-li < areflexivní a tranzitivní relace na M a definujeme-li a b (a < b) (a = b), pak je uspořádání na M. DEFINICE 2.20. Buď (M, ) uspořádaná množina. Prvek a M se nazývá nejmenší, resp. největší prvek v M, platí-li x a, resp. x a pro každé x M. Prvek a M se nazývá minimální, resp. maximální prvek v M, jestliže pro žádné x M neplatí x < a, resp. x > a. VĚTA 2.21 (Důkaz D.2). [KaSk:V3.1 s.28] (1) Libovolná uspořádaná množina má nejvýše jeden nejmenší a nejvýše jeden největší prvek. (2) Má-li uspořádaná množina nejmenší, resp. největší prvek, pak tento prvek je zároveň jejím jediným minimálním, resp. maximálním prvkem. (3) V úplně uspořádané množině existuje nejvýše jeden minimální, resp. maximální prvek, který je zároveň jejím nejmenším, resp. největším prvkem. (4) Každá neprázdná konečná uspořádaná množina má alespoň jeden minimální a alespoň jeden maximální prvek. 39 Definice 2.22. Nechť (M, ) je uspořádaná množina. Pro prvky a, b M řekneme, že b pokrývá a, jestliže a < b a neexistuje c M tak, že a < c < b. Věta 2.23 (Důkaz D.3). Nechť (M, ) je konečná uspořádaná množina. Pak platí a < b existuje konečný počet prvků a = t0 < t1 < < tn = b tak, že ti pokrývá ti-1 pro každé i = 1, . . . , n. DEFINICE 2.24. Buď (M, ) uspořádaná množina a N M. Prvek a M se nazývá dolní, resp. horní závora (hranice) podmnožiny N (v M), platí-li x a, resp. x a pro každé x N. DEFINICE 2.25. Buď (M, ) uspořádaná množina a N M. Prvek a M se nazývá největší dolní závora, resp. nejmenší horní závora neboli infimum, resp. supremum množiny N (v M), platí-li: (1) a je dolní, resp. horní závora N, (2) pro každou dolní, resp. horní závoru t množiny N platí t a, resp. t a. Pak píšeme a = inf N, resp. a = sup M. Má-li N nejmenší, resp. největší prvek, pak tento prvek je zřejmě jejím infimem, resp. supremem. DEFINICE 2.26 (srov. s 1.27 a s 1.28). Buď (M, ) uspořádaná množina a N := {an} n=1 posloupnost jejích prvků. Pokud existuje bk := inf{an} n=k pro každé k N i a:= supkN bk , pak anazýváme limes inferior posloupnosti {an} a píšeme a= lim inf an. Analogicky duálně: pokud existuje b+ k := sup{an} n=k pro každé k N i a+ := infkN b+ k , pak a+ nazýváme limes superior posloupnosti {an} a píšeme a+ = lim sup an. Pokud existuje ai a+ , pak platí lim inf an lim sup an (CVIČENÍ: návod D.4). Platí-li rovnost, pak jejich společnou hodnotu a := a= a+ nazýváme limitou posloupnosti {an}nN a píšeme a = lim an. Říkáme také, že posloupnost {an} n=1 konverguje k a. 40 VĚTA 2.27 (Důkaz D.5). (1) Je-li posloupnost neklesající, a1 a2 a3 . . . , a existuje a := sup an, pak lim an = a a píšeme také an a. (2) je-li posloupnost nerostoucí, a1 a2 a3 . . . , a existuje a := inf an, pak lim an = a a píšeme také an a. DEFINICE 2.28 (viz 2.2 a 2.10(1)). Buďte (M, ) a (N, ) uspořádané množiny. Zobrazení f : M N se nazývá homomorfizmus nebo také monotonní zobrazení, jestliže pro libovolné prvky x, y M, x y, platí f(x) f(y). V souladu s 2.2 píšeme f : (M, ) (N, ). Zobrazení f se nazývá izomorfismus, jestliže navíc rovněž f-1 : N M je homomorfizmem, neboli pro libovolné prvky x, y M platí x y f(x) f(y). Věta 2.29 (Důkaz D.6). Buďte (M, ) a (N, ) uspořádané množiny a f : (M, ) (N, ) izomorfizmus. Nechť P M je nějaká podmnožina. Pak inf P, resp. sup P existuje v M právě když existuje inf f(P), resp. sup f(P) v N. V takovém případě platí f(inf P) = inf f(P), resp. f(sup P) = sup f(P). Důsledek 2.30. Nechť v předchozí větě P = {an} n=1 je posloupnost. Pak lim inf an, resp. lim sup an existuje v M právě když existuje lim inf f(an), resp. lim sup f(an) v N. V takovém případě platí f(lim inf an) = lim inf f(an), resp. f(lim sup an) = lim sup f(an). DEFINICE 2.31 (Přímý součin uspořádaných množin ­ viz 2.11(1)). Nechť (M, ) a (N, ) jsou dvě uspořádané množiny a (M × N, ) jejich přímý součin. Buďte [m1, n1], [m2, n2] M × N dva prvky, pak [m1, n1] [m2, n2] (m1 m2) (n1 n2). Analogicky (po složkách) uspořádáme prvky přímého součinu konečně mnoha uspořádaných množin či libovolného systému takových množin. 41 2.3. Ekvivalence a kongruence. DEFINICE 2.32. Binární relace na množině M se nazývá ekvivalencí na této množině, jestliže je reflexivní, symetrická a tranzitivní. Obvykle se značí symboly , nebo a pod. Píšeme pak (M, ),(M, ) nebo (M, ) a pod. Množinu všech ekvivalencí na M budeme dále značit E(M). Tato množina je uspořádána inkluzí neboli pro ekvivalence , E(M) je [xy xy]. DEFINICE 2.33. Buď M neprázdná množina. Rozkladem M na množině M rozumíme neprázdný systém po dvou disjunktních neprázdných podmnožin M := {Mi}iI množiny M, jejichž sjednocením je celá množina M. Prvky M se nazývají třídy tohoto rozkladu. Vybereme-li z každé třídy Mi nějaký prvek mi, pak mi se nazývá reprezentantem třídy Mi a množina všech reprezentantů {mi | i I} se nazývá systém reprezentantů rozkladu M. Přiřadíme-li každému prvku m M (jednoznačně určenou) třídu rozkladu m, do níž m patří, pak toto zobrazení (pruh nahoře) je surjekcí M na M a nazývá se kanonickým zobrazením rozkladu M. Jeho restrikce na systém reprezenantů je pak bijekce na M. VĚTA 2.34 (Důkaz D.7). [KaSk:V3.2 s.31] Buď M rozklad na množině M. Definujme relaci na M takto: xy existuje třída m M tak, že x m, y m. Pak je ekvivalence na M. VĚTA 2.35 (Důkaz D.8). [KaSk:V3.3 s.31] Buď ekvivalence na množině M. Pak existuje jediný rozklad Mna M takový, že pro x, y M platí xy existuje třída m M tak, že x m, y m. DEFINICE 2.36. Rozklad M příslušný k ekvivalenci na M popsaný v předchozí větě značíme M =: M/. Označme R(M) množinu všech rozkladů na množině M. 42 Definice 2.37. Buďte M, fM R(M). Pravíme, že M je jemnější než fM, neboli fM je hrubší než M, když ke každé třídě m M existuje třída em fM tak, že m em. Píšeme M fM. Snadno nahlédneme, že je uspořádání na R(M). Věta 2.38 (Důkaz D.9). Buď M neprázdná množina a pro libovolné E(M) položme f() := M/. Pak f je izomorfismus (E(M), ) na (R(M), ). VĚTA 2.39 (Důkaz D.10). Nechť M, N jsou neprázdné množiny a f : M N zobrazení. Definujme na M relaci f takto: x f y f(x) = f(y). Pak f je ekvivalence na M a třídy rozkladu M/ f jsou právě úplné vzory všech prvků z f(M), tj. M/ f = {f-1 ({n}) | n f(M)}. Zejména dostáváme bijekci (jednojednoznačnou korespondenci) mezi třídami rozkladu, jejich reprezentanty a obrazem f(M) množiny M v N. DEFINICE 2.40. Rozklad M/ f z předchozí věty se nazývá kanonický rozklad příslušný k zobrazení f. Důsledek 2.41 (Důkaz D.11). Nechť M, N, P jsou neprázdné množiny a f : M N a g : N P dvě zobrazení. Označíme-li gf : M P složené zobrazení, pak f gf a tedy kanonický rozklad příslušný k f je vždy jemnější než kanonický rozklad příslušný ke složenému zobrazení gf. DEFINICE 2.42. Buď dána algebraická struktura (M, S) a nějaká ekvivalence na M. Řekneme, že je kongruencí na struktuře (M, S), jestliže pro každou n-ární operaci na M, S, platí: (1) a1 b1, . . . , an bn (a1, . . . , an) (b1, . . . , bn). Na M := M/ lze pak zavést strukturu S stejného typu jako S takto: (i) pro každou relaci S n-ární definujeme S téže arity: (a1, . . . , an) := 1 právě když pro nějaký výběr reprezentantů a1, . . . , an je (a1, . . . , an) = 1; 43 (ii) pro každou operaci S n-ární definujeme S téže arity takto: a) n = 0: význačným prvkem je třída obsahující význačný prvek , b) n > 0: (a1, . . . , an) := (a1, . . . , an) pro nějaký výběr reprezentantů a1, . . . , an (dle (1) na výběru nezáleží). Strukturu (M, S) pak značíme (M, S)/ a nazýváme ji faktorovou (podílovou) strukturou struktury (M, S) vzhledem ke kongruenci . VĚTA 2.43 (Důkaz D.12). Buď dána algebraická struktura (M, S) a nějaká kongruence na M. Pak příslušné kanonické zobrazení je homomorfizmus (M, S) na (M, S). Je-li naopak f : (M, S) (N, S ) nějaký homomorfizmus, pak f v příslušném kanonickém rozkladu M := M/ f je kongruence na (M, S). Přitom (f(M), S ) je podstruktura v (N, S ) izomorfní s (M, S). 2.4. Struktury s jednou binární operací. DEFINICE 2.44. Algebraická struktura (M, ) s jednou binární operací se nazývá grupoid. Grupoid (M, ), v němž platí asociativní zákon se nazývá pologrupa. Každá pologrupa, v níž existuje neutrální prvek e se nazývá monoid -- píšeme (M, , e). Je-li operace multiplikativního typu (například , ), pak hovoříme o multiplikativním grupoidu (pologrupě, monoidu). Je-li aditivního typu (například +, -), hovoříme o aditivním grupoidu (pologrupě, monoidu). Neutrální prvek e multiplikativního, resp. aditivního grupoidu se obvykle nazývá jeho jednotkovým, resp. nulovým prvkem a místo e se značí 1, resp. 0. Grupoid (pologrupa, monoid) se nazývá komutativní, jestliže operace je komutativní. PŘÍKLAD 2.45. Nechť S je množina nějakých symbolů, například 26 malých písmen 44 abecedy spolu se znakem nahrazujícím mezeru: S = {a, b, . . . , z, }. Označme S množinu všech konečných řetězců (posloupností) znaků z S včetně prázdného řetězce, tj. S = { s1s2 . . . sn | si S pro i = 1, . . . , n; n N} { }. Nechť (S , , ) je algebraická struktura, kde je operace skládání řetězců (konkatenace), tj. například definujeme 'auto ''jede':='auto jede'. Pak (S , , ) je zřejmě nekomutativní monoid, jehož neutrálním prvkem je prázdný řetězec . VĚTA 2.46 (Obecný asoc. zákon ,[KaSk:V5.1 s.46]). Nechť (M, ) je pologrupa a a1, a2, . . . , an M. Potom všechny možné součiny vytvořené všemi možnými uzávorkováními posloupnosti {ai}n i=1 jsou rovny jednomu a témuž prvku. VĚTA 2.47. Každý grupoid má nejvýše jeden neutrální prvek. DEFINICE 2.48. Nechť (M, ) je grupoid s neutrálním prvkem e. Nechť dále a M a nechť pro jisté b M platí a b = b a = e. Potom b se nazývá inverzní prvek k a a značí se a-1 . V aditivním grupoidu se obvykle nazývá prvkem opačným k a a značí se -a. DEFINICE 2.49. Nechť grupoid (M, ) má tyto vlastnosti: (1) Operace je asociativní (neboli (M, ) je pologrupa). (2) Existuje jednotkový prvek e (neboli (M, ) je dokonce mo- noid). (3) Ke každému prvku a M existuje inverzní prvek a-1 . Potom algebraická struktura (M, , e)3 se nazývá grupa: multiplikativní, resp. aditivní dle typu operace. Je-li operace navíc komutativní, pak grupa (M, , e) se nazývá komutativní grupa nebo také abelovská grupa. 3Přesněji bychom měli psát (M, , -1 , e), neboť grupa je strukturou s jednou binární operací , jednou unární operací -1 a jedním neutrálním prvkem e. 45 VĚTA 2.50. ,[KaSk:V5.11 s.50] Nechť (M, , e) je grupa. Potom pro každé a je a-1 určeno jednoznačně, tj. každý prvek má právě jeden inverzní prvek. PŘÍKLAD 2.51. a) Množina komplexních čísel C s obvyklými operacemi +, , tvoří grupoidy (C, +), (C, ), (C, -). Obvyklé dělení / na množině C není operace, neboť není definován např. prvek 2/0. Dělení / je ale operace na množině C všech nenulových komplexních čísel. (C , /) je tedy nekomutativní grupoid. Navíc (C, +, 0) je abelovská grupa, zatímco (C, , 1) je jen komutativním monoidem a (C, -, 0) pouze nekomutativním grupoidem, neboť odečítání není ani asociativní ani komutativní. Nenulová čísla (C , , 1) však již tvoří abelovskou grupu vzhledem k násobení, ne tak (C , /, 1) vzhledem k dělení přestože každý prvek má inverzní (jelikož a/a = 1, je dokonce každý prvek inverzní sám k sobě). Dělení totiž není podobně jako odečítání ani asociativní ani komutativní operací. b) Analogicky jako v a) nechť +, , - mají obvyklý význam. Pak (R, +), (R, ), (R, -), (Q, +), (Q, ), (Q, -), (Z, +), (Z, ), (Z, -), jsou grupoidy s obdobnými vlastnostmi jako v a). Je-li / obvyklé dělení na množinách R = R - {0}, Q = Q - {0}, jsou (R , /), (Q , /) grupoidy. Naproti tomu / není operace na množině celých nenulových čísel, neboť např. 2/3 není celé nenulové číslo. Podobně také (ZN , , 0) je abelovská grupa, (ZN , , 1) je komutativní monoid a (ZN , , 0) nekomutativní grupoid s operacemi sečítání , odečítání a násobení modulo N (viz 1.3). c) Operace + a jsou také operace na množině N, tedy (N, +), (N, ) jsou komutativní grupoidy. Naproti tomu - a / nejsou operace na N. 46 d) Je-li X libovolná množina, pak průnik množin , sjednocení množin , rozdíl množin (-) a symetrická diference množin (÷) jsou operace na množině všech podmnožin 2X . Jsou tedy: (2X , ), (2X , ), (2X , -) a (2X , ÷) grupoidy. Navíc (2X , ÷, ) je abelovská grupa dle věty 1.26, kde každý prvek je opačný sám k sobě, (2X , , ) i (2X , , X) jsou pouze komutativní monoidy, zatímco (2X , -) pouze nekomutativní grupoid, neboť rozdíl množin není ani komutativní ani asociativní. Naproti tomu kartézský součin × není obecně operace na množině 2X . e) Nechť X je libovolná neprázdná množina. Symbol XX označuje systém všech zobrazení množiny X do X. Pro f XX , g XX je složené zobrazení g f opět prvkem množiny XX . Tedy je operace na množině XX a (XX , ) je (obecně nekomutativní) pologrupa. Označíme-li IX : X X identické zobrazení (IX (x) = x pro každé x X), pak (XX , , IX ) je dokonce monoid. Prvek f XX má inverzní prvek v monoidu (XX , , I) právě když f je bijekce. Inverzní prvek k f je pak roven inverznímu zobrazení f-1 k zobrazení f. VĚTA 2.52 ([KaSk:V5.8 s.48]). Nechť (M, , e) je monoid. Nechť a, a1, a2, . . . , an M mají inverzní prvky v (M, ). Pak platí: (a) e-1 = e, (b) (a-1 )-1 = a, (c) (a1 a2 . . . an)-1 = a-1 n a-1 n-1 . . . a-1 1 , (d) pro b M jsou prvky x = a-1 b, y = b a-1 jediná řešení rovnic a x = b, y a = b v grupoidu (M, ). Definice 2.53. Nechť (M, ) je grupoid. Jestliže pro každou dvojici prvků a, b M existuje jediný prvek x tak, že a x = b, pak říkáme, že v grupoidu platí levý zákon o jednoznačném dělení (resp. odečítání v aditivním případě). Jestliže pro každou dvojici prvků a, b M existuje jediný prvek y tak, že y a = b, pak říkáme, 47 že v grupoidu platí pravý zákon o jednoznačném dělení (resp. odečítání v aditivním případě). Věta 2.54. Pologrupa (M, ) je grupou právě když v ní platí levý i pravý zákon o jednoznačném dělení. DEFINICE 2.55. Nechť (M, ) je grupoid. Jestliže pro každou trojici prvků a, x, y M platí implikace a x = a y x = y, pak říkáme, že v grupoidu platí levý zákon o krácení (resp. rušení v aditivním případě). Jestliže obdobně x a = y a x = y, pak říkáme, že v grupoidu platí pravý zákon o krácení (resp. rušení v aditivním případě). Říkáme take, že v (M, ) lze krátit zleva, případně zprava. VĚTA 2.56 ([KaSk:V5.13 s.51]). V každé grupě lze krátit zleva i zprava. Označení . Nechť (G, ) je pologrupa a nechť a G. Pro přirozené číslo n položíme: an := a a . . . a| {z } n prvků a . Má-li grupoid (G, ) jedničku e, položíme: a0 := e. Nechť (G, ) má jedničku a prvek a nechť má inverzní prvek a-1 v grupoidu (G, ). Pak položíme: a-n := (a-1 )n := a-1 a-1 . . . a-1 | {z } n prvků a-1 . Pro takto zavedené umocňování platí známá pravidla: am an = am+n a (am )n = amn (viz [KaSk:V5.9 s.49]). V aditivním grupoidu a - b := a + (-b) a dále píšeme na místo an a -na místo a-n , takže výše uvedená pravidla pak přepíšeme takto: ma + na = (m + n)a a n(ma) = (nm)a = (mn)a. 48 DEFINICE 2.57. Algebraickou podstrukturu grupoidu (pologrupy, monoidu, grupy) nazýváme jeho/jejím podgrupoidem (podpologrupou, podmonoidem, podgrupou). POZNÁMKA 2.58. Nechť (M, ) je grupoid a N M, N = . Uvažme následující vlastnosti podmnožiny N: (1) x, y N x y N (uzavřenost k binární operaci ); (2) je-li e neutrální prvek v (M, ), pak e N (uzavřenost k nulární operaci vybírající neutrální prvek); (3) je-li x N a x-1 k němu inverzní prvek v (M, ), pak x-1 N (uzavřenost k unární operaci -1 ). Podle definice 2.12 je tedy a) (N, ) podgrupoidem (podpologrupou) grupoidu (pologrupy) (M, ) právě když má vlastnost (1); b) (N, , e) je podmonoidem monoidu (M, , e) právě když má vlastnosti (1) a (2); c) (N, , e) je podgrupou grupy (M, , e) právě když má vlastnosti (1) a (3) [pak má zřejmě i vlastnost (2)]. Každý monoid (každá grupa) (M, , e) má alespoň dva podmonoidy (dvě podgrupy): (M, , e) a triviální podmonoid (podgrupu) ({e}, , e). Věta 2.59. Nechť (M, , e) je grupa a N M, N = . Pak následující výroky jsou ekvivalentní: (1) (N, , e) je podgrupa v (M, , e), (2) x, y N x y-1 N, (3) x, y N x-1 y N. PŘÍKLAD 2.60. Podpologrupy: * (N, +) (Z, +), * množina všech bijekcí X X z příkladu 2.51e) je grupou, která je podmonoidem v (XX , , IX ). Podgrupy: 49 ˇ (Z, +, 0) (Q, +, 0) (R, +, 0) (C, +, 0); * (R+ - {0}, , 1) (R , , 1) . . . viz příklad 2.51b); * Naopak (ZN , ) není ani podgrupoid v (Z, +). POZNÁMKA 2.61. Nechť (M, ) a (N, ) jsou grupoidy a f : M N zobrazení. Uvažme následující vlastnosti zobrazení f: (1) x, y M f(x y) = f(x) f(y); (2) jsou-li e, E neutrální prvky po řadě v (M, ) a (N, ), pak f(e) = E; (3) je-li a M a a-1 k němu inverzní prvek v (M, ), pak f(a-1 ) je inverzní k f(a) v (N, ), neboli f(a-1 ) = f(a)-1 . Podle definice 2.10 tedy platí: a) f : (M, ) (N, ) je homomorfizmus grupoidů právě když má vlastnost (1); b) f : (M, , e) (N, , E) je homomorfizmus monoidů právě když má vlastnost (1) a (2); c) f : (M, , e) (N, , E) je grupový homomorfizmus právě když má vlastnosti (1) a (3) [pak má zřejmě i vlastnost (2)] nebo vlastnosti (1) a (2) [pak má zřejmě i vlastnost (3) uvážíme-li větu 2.50]; Kterýkoli z výše uvedených homomorfizmů je izomorfizmem právě když f je bijekce. Snadno se totiž ověří, že f-1 : N M je rovněž homomorfizmus z (N, ) do (M, ): f-1 (E) = f-1 (f(e)) = e, f-1 (f(a) f(b)) = f-1 (f(a b)) = a b = f-1 (f(a)) f-1 (f(b)). Tento homomorfizmus je ovšem také izomorfizmem. Poznamenejme, že obdobnou vlastnost mají nejen struktury s jednou binární operací, ale každá struktura obsahující pouze operace a žádnou relaci: každý bijektivní homomorfizmus je pak také automaticky izomorfizmem. PŘÍKLAD 2.62. (1) Nechť (S , , ) je monoid z příkladu 2.45 a d : S Z zobrazení přiřazující každému řetězci jeho délku. Pak d je homomorfizmus nekomutativního monoidu (S , , ) do abelovské grupy (Z, +, 0). 50 (2) Zobrazení modulo f:= N z odst. 1.3 je grupovým homomorfizmem (Z, +, 0) na (ZN , , 0). Pak f je grupovou kongruencí příslušného kanonického rozkladu (věta 2.43) a platí: a f b právě když N je dělitelem b - a. 51 2.5. Struktury se dvěma binárními operacemi. Tyto struktury již zachycují všechny podstatné vlastnosti běžných číselných oborů. DEFINICE 2.63. Algebraická struktura (M, +, , 0) s dvěma binárními operacemi + (aditivní) a (multiplikativní) se nazývá okruh, jestliže jsou splněny následující podmínky: (1) (M, +, 0) je abelovská grupa; (2) (M, ) je pologrupa; (3) Pro libovolnou trojici prvků a, b, c M platí distributivní zákony: (a + b) c = a c + b c c (a + b) = c a + c b. Okruh (M, +, , 0) se nazývá okruhem s jednotkou, jestliže existuje neutrální prvek 1 M takový, že (M, , 1) je monoid. Pak píšeme (M, +, , 0, 1). Okruh (M, +, , 0) se nazývá komutativní, jestliže (M, ) je komutatitvní pologrupa. DEFINICE 2.64. Algebraickou podstrukturu okruhu nazýváme jeho podokruhem. POZNÁMKA 2.65. Nechť (M, +, , 0) je okruh a N M, N = . Podle definice 2.12 a s uvážením poznámky 2.58 tedy vidíme, že (N, +, , 0) je podokruhem v (M, +, , 0) právě když platí: (1) x, y N x + y N; (2) x, y N x y N; (3) je-li x N, pak -x N. (4) je-li 1 jednotka okruhu (M, +, , 0, 1), pak 1 N; Podle poznámky 2.58 je tedy (N, +, , 0) podokruhem okruhu (M, +, , 0, 1) právě když (N, +, 0) je podgrupou v (M, +, 0) a současně (N, ) je podpologrupou v (M, ), případně (N, , 1) je podmonoidem v (M, , 1). 52 VĚTA 2.66. V každém okruhu (M, +, , 0) platí pro jeho libovolné prvky a, b, c M následující identity: (a - b) c = a c - b c c (a - b) = c a - c b a 0 = 0 a = 0. Definice 2.67. Nenulový prvek a okruhu (M, +, , 0) se nazývá dělitelem nuly tohoto okruhu, když v M existuje b = 0 takové, že a b = 0 nebo b a = 0. Definice 2.68. Komutativní okruh s jednotkou, který nemá dělitele nuly se nazývá obor integrity. Věta 2.69. V každém oboru integrity (M, +, , 0, 1) lze krátit (vzhledem ke komutativitě zleva i zprava) nenulovým prvkem: a, b, c M, a = 0, a b = a c b = c Důsledek 2.70. Je-li (M, +, , 0, 1) obor integrity, pak (M - {0}, ) je komutativní grupoid, v němž platí levý i pravý zákon o krácení. Definice 2.71 (Charakteristika oboru integrity). Nechť (M, +, , 0, 1) je obor integrity. Jestliže existuje přirozené číslo n tak, že n1 = 0, potom řekneme, že obor integrity (M, +, , 0, 1) má konečnou charakteristiku. Nejmenší přirozené číslo s touto vlastností se nazývá charakteristikou tohoto oboru integrity. V opačném případě říkáme, že obor integrity (M, +, , 0, 1) má nekonečnou charakteristiku nebo též charakteristiku nula. Věta 2.72. Nechť obor integrity (M, +, , 0, 1) má konečnou charakteristiku n, pak n je prvočíslo. 53 DEFINICE 2.73. Okruh s jednotkou (M, +, , 0, 1), v němž (M - {0}, , 1) je grupa se nazývá těleso. Je-li tato grupa komutativní, potom (M, +, , 0, 1) se nazývá komutativní těleso nebo také pole. Věta 2.74. Pole je oborem integrity. Věta 2.75. Každý konečný obor integrity je polem. Příklad 2.76 (viz 2.51). * (N, +, , 0, 1) (Z, +, , 0, 1) (Q, +, , 0, 1) (R, +, , 0, 1) (C, +, , 0, 1) jsou do sebe vnořené obory integrity, z nichž poslední tři jsou dokonce pole nekonečné charakteristiky. * (ZN , , , 0, 1) je komutativním okruhem s jednotkou, který není podokruhem žádného z výše uvedených okruhů. (ZN , , , 0, 1) je oborem integrity jen když N je prvočíslo. V takovém případě je dokonce polem dle věty 2.75. * Množina všech polynomů s koeficienty například z C tvoří rovněž obor integrity vzhledem k obvyklému sečítání a násobení polynomů. * (2X , ÷, , , X) je dle věty 1.26 komutativním okruhem s jednotkou X (totiž AX = A pro každou podmnožinu A X), který není oborem integrity, pokud X má více jak jeden prvek (pak totiž lze vždy najít dvě různé neprázdné podmnožiny s prázdným průnikem). POZNÁMKA 2.77. Nechť (M, +, , 0) a (N, , , 0) jsou okruhy (tělesa) a f : M N zobrazení. Uvážíme-li 2.61b)c), potom f je homomorfizmem těchto struktur ve smyslu 2.10 právě když jak f : (M, +, 0) (M, , 0) tak i f : (M, ) (N, ) jsou homomorfizmy, tj. právě když f má následující vlastnosti: (1) a, b M f(a + b) = f(a) f(b), (2) a, b M f(a b) = f(a) f(b), (3) f(0) = 0 a f(1) = 1, pokud oba okruhy mají jednotku. 54 Poznamenejme ještě, že ve (3) lze podmínku f(0) = 0 nahradit podmínkou a M f(-a) = -f(a), a v případě těles i podmínku f(1) = 1 podmínkou 0 = a M f(a-1 ) = f(a)-1 . PŘÍKLAD 2.78. Grupový homomorfizmus f:= N z příkladu 2.62(2) je i okruhovým homomorfizmem (Z, +, , 0, 1) na (ZN , , , 0, 1), při- čemž f je pak také okruhová kongruence. 55 ANGLICKÁ TERMINOLOGIE ALGEBRAICKÝCH STRUKTUR algebraická (pod)struktura algebraic (sub)structure homomorfizmus, endomorfizmus homomorphism, endomorphism izomorfizmus, relace, operace isomorphism, relation, operation nulární, unární, binární, n-ární nullary, unary, binary, n-ary význačný, neutrální singular, neutral reflexivní, symetrická, úplná reflexive, symmetric, complete antisymetrická, tranzitivní antisymmetric, transitive asociativní, komutativní associative, commutative generátor, generovaný podmnožinou generator, generated by a set přímý součin, uspořádaná množina direct product, ordered set částečně (lineárně) uspořádaná partially (linearly) ordered menší (větší) nebo roven než less (greater) than or equal to nejmenší (největší) least (greatest) minimální (maximální) minimal (maximal) dolní (horní) závora lower (upper) bound infimum (supremum) infimum (supremum) limes inferior (limes superior) inferior limit (superior limit) ekvivalence, kongruence equivalence, congruence rozklad na třídy, kanonický partition into classes, canonical faktorová struktura factor structure (pod)grupoid, (pod)pologrupa (sub)groupoid, (sub)semigroup (pod)monoid, pod(grupa) (sub)monoid, (sub)group abelovská grupa abelian group opačný (inverzní) prvek negated (inverse) element nulový (jednotkový) prvek zero, null (unit) element (levý, pravý) zákon o krácení (left, right) cancellation law zákon o jednoznačném dělení unique division law okruh, obor integrity ring, domain of integrity dělitel nuly, charakteristika divisor of zero, characteristic těleso, pole division ring, field 56 3. Lineární algebra Teorie a příklady: [KaSk: s.54-129], [Šik: s.1-131] Příklady: [Ho:řešené č.16-36; s.17-37], [Ho:neřešené kap.3-7 s.81-167] 3.1. Vektorové prostory. DEFINICE 3.1. Nechť (F, +, , 0, 1), 0 = 1 je pole (tzv. pole skalárů), jehož prvky budeme nazývat skaláry. Nechť (V, +, 0, SF) je algebraická struktura s jednou binární operací +, nulovým prvkem 0 a zobrazením SF : F×V V určujícím pro každý skalár F jednu unární operaci {}×V V zapisovanou ve tvaru SF(, x) =: x a nazývanou násobení skalárem. Nechť (V, +, 0) je abelovská grupa a pro každé , F a x, y V nechť platí: (L1) Distributivní zákon vzhledem k sečítání vektorů: (x + y) = x + y (L2) Distributivní zákon vzhledem k sečítání skalárů: ( + )x = x + x (L3) Asociativní zákon vzhledem k násobení skaláry: (x) = ()x (L4) 1x = x. Pak algebraická struktura (V, +, 0, SF) se nazývá vektorový (lineární) prostor nad polem F, prvky množiny V se nazývají vektory a operace x x se nazývá násobení vektoru x skalárem . Vektorový prostor se nazývá reálný (resp. komplexní), jestliže F = R (resp. F = C). Poznámka 3.2. (1) Jestliže nerozlišujeme mezi skalárem a odpovídající unární operací, pak v souladu s 2.1 můžeme vektorový prostor považovat za algebraickou strukturu (V, LF), kde LF = {+, (-), 0} F představuje popis operací lineární struktury (symbol (-) značí unární operaci výběru opačného prvku v aditivní grupě). 57 (2) Bude-li pole skalárů zřejmé z kontextu, budeme psát též stručně L místo LF. V dalším budeme často pracovat s reálným nebo komplexním vektorovým prostorem, kde L := LR nebo L := LC. (3) Pojem vektorového prostoru lze zavést i nad nekomutativním tělesem F. V takovém případě je nutno rozlišovat mezi násobením skaláry zleva a zprava a zavést tzv. levý (resp. pravý) vektorový prostor nad F. Je-li F pouze okruh s 1 = 0, pak se toto pojetí dále zobecňuje a zavádí se tzv. levý (resp. pravý) modul nad F (nebo též F-modul). VĚTA 3.3 (Důkaz D.13). [Šik:V3.6 s.25] Nechť V je vektorový prostor nad F a , , i F; x, y, xj V . Pak platí: (L5) x = 0 = 0 nebo x = 0 (L6) -x = (-x) = (-)x (L7) (x - y) = x - y (L8) ( - )x = x - x (L9) (x1 + + xn) = x1 + + xn (L10) (1 + + m)x = 1x + + mx (L11) Pm i=1 i Pn j=1 xj = Pm i=1 i Pn j=1 xj = Pm i=1 Pn j=1 ixj = Pn j=1( Pm i=1 i)xj PŘÍKLAD 3.4 ([Šik:Př.3.5 s.25]). (1) (F, LF) je vektorový prostor nad polem F. Vlastnosti (L1) a (L2) jsou důsledkem okruhových distributivních zákonů, (L3) plyne z asociativity okruhového násobení a (L4) rovněž platí, neboť 1 je jednotkou okruhového násobení. Zejména (R, LR), resp. (C, LC) je reálný, resp. komplexní vektorový prostor. (2) Užitím přímého součinu z definice 2.11 lze konstruovat další (vícerozměrné) vektorové prostory (n N, n > 1): (Fn , LF) := (F, LF) × × (F, LF) | {z } n× . . . n-tice skalárů z F. Zejména (Rn , LR) (resp. (Cn , LC)) je reálný (resp. komplexní) 58 vektorový prostor n-tic reálných (resp. komplexních) čísel. V těchto prostorech jsou tedy dle 2.11 všechny operace definovány po složkách: [x1, . . . , xn] + [y1, . . . , yn] := [x1 + y1, . . . , xn + yn] 0 := [0, . . . , 0] . . . nulový vektor -[x1, . . . , xn] := [-x1, . . . , -xn] . . . opačný vektor [x1, . . . , xn] := [x1, . . . , xn] . . . skalární násobek (3) Analogicky: (RN , LR) := X nN (R, LR) a (Cn , LC) := X nN (C, LC) jsou po řadě vektorové prostory všech reálných, resp. komplexních posloupností s operacemi po složkách jako ve (2). (4) Analogicky: (RI , LR) := X nI (R, LR) a (CI , LC) := X nI (C, LC) jsou po řadě vektorové prostory všech reálných, resp. komplexních funkcí definovaných na množině I (tj. funkcí z I do R, resp. z I do C) opět s operacemi po složkách. Tedy definujeme pro každé i I: (f + g)(i) := f(i) + g(i), (-f)(i) := -f(i), f 0 f(i) = 0 pro každé i I, (f)(i) := f(i). (5) Označme po řadě R[t], resp. C[z] množinu všech polynomů jedné proměnné t R, resp. z C s koeficienty z R, resp. z C. Pak tyto množiny tvoří vzhledem k obvyklému sečítání a násobení skalárem reálný, resp. komplexní vektorový prostor, který lze ztotožnit s reálnými, resp. komplexními posloupnostmi koeficientů (viz (3)) tvaru {a0, a1, . . . , an, 0, . . . , 0, . . . } pro libovolné n N. Omezíme-li se na pevné n, dostaneme vektorové prostory Rn[t], resp. Cn[z] všech polynomů s reálnými, resp. komplexními koeficienty stupně nejvýše n. DEFINICE 3.5. Nechť (V, LF) je vektorový prostor, x1, . . . , xn V a 1, . . . , n F. Pokud x V lze vyjádřit ve tvaru x = 1x1 + + nxn, pak řekneme, že vektor x je lineární kombinací vektorů x1, . . . , xn. 59 3.2. Vektorové podprostory, generátory. DEFINICE 3.6. Algebraickou podstrukturu (definice 2.12) vektorového prostoru (V, LF) nazýváme jeho vektorovým (lineárním) podprostorem. VĚTA 3.7 (Důkaz D.14). Nechť (V, LF) je vektorový prostor a = W V jeho podmnožina. Pak (W, LF) je vektorovým podprostorem prostoru (V, LF) (píšeme (W, LF) (V, LF)) právě když má následující vlastnosti: (1) x, y W x + y W (uzavřenost vzhledem ke grupovému sečítání) (2) x W, F x W (uzavřenost vzhledem ke skalárnímu násobení). DŮSLEDEK 3.8 (Důkaz D.15). Každý vektorový podprostor (W, LF) prostoru (V, LF) je uzavřený k libovolným lineárním kombinacím svých prvků, tj. platí: xi W, i F pro i = 1, . . . , n 1x1 + + nxn W. Poznámka 3.9. V každém vektorovém prostoru (V, LF) existuje nejmenší vektorový podprostor ({0}, LF) nazývaný také nulový podprostor a největší podprostor totožný s celým prostorem (V, LF). VĚTA 3.10 (Důkaz D.16). Nechť {(Wi, LF)}iI je systém vektorových podprostorů prostoru (V, LF). Pak jejich průnik T iI Wi je rovněž vektorový podprostor ve V . DEFINICE 3.11. Nechť (V, LF) je vektorový prostor a G V jeho podmnožina. Pak v souladu s definicí 2.13 nejmenší vektorový podprostor ve V obsahující G nazveme podprostorem generovaným množinou G nebo také lineárním obalem množiny G ve V . Značíme jej LF(G) nebo stručněji L(G). Prvky množiny G nazýváme generátory tohoto podprostoru. 60 VĚTA 3.12 (Důkaz D.17). Nechť (V, LF) je vektorový prostor a G V jeho podmnožina. Pak L(G) vždy existuje a platí: (1) L(G) = T {W | (W, LF) (V, LF) : G W} (neboli L(G) je průnikem podprostorů ve V obsahujících G) (2) Je-li G = , pak L(G) = { Pn i=1 ixi | i F, xi G pro i = 1, . . . , n; n N} (neboli L(G) tvoří všechny lineární kombinace vektorů z G). Zejména L() = {0} je nulový podprostor. Poznámka 3.13. Podle 3.12(2) tedy zápis x L(G) vyjadřuje fakt, že x je nějakou lineární kombinací vektorů z množiny G. VĚTA 3.14 (Vlastnosti generátorů, důkaz D.18). Nechť (V, LF) je vektorový prostor, W jeho podprostor a M, N, G podmnožiny ve V . Pak platí: (1) 0 L(G) pro každé G V (2) M L(G) L(M) L(G) (3) M N L(M) L(N) (4) W = L(W) a zejména L(M) = L(L(M)) (5) je-li nějaký generátor lineární kombinací ostatních generátorů, pak jej lze vynechat: x G, x L(G - {x}) L(G - {x}) = L(G). (6) každý generátor lze zaměnit za jeho nenulový skalární náso- bek: x G, 0 = F L((G - {x}) {x}) = L(G). (7) ke každému generátoru lze přičíst libovolnou lineární kombinaci ostatních generátorů: x G, y L(G - {x}) L((G - {x}) {x + y}) = L(G). Úpravy uvedené v (5) až (7) se nazývají elementární úpravy množiny generátorů. 61 3.3. Závislost, nezávislost, báze, dimenze. DEFINICE 3.15. Minimální podmnožina ve V generující vektorový prostor (V, LF) se nazývá báze tohoto prostoru, neboli platí implikace: G báze ve V, M G systém generátorů prostoru V M = G. Zejména za bázi nulového prostoru tedy můžeme považovat prázdnou množinu. DEFINICE 3.16. Nechť (V, LF) je vektorový prostor a M := {x1, . . . , xn} V jeho nějaká neprázdná konečná podmnožina navzájem různých vektorů. Řekneme, že M je (resp. vektory x1, . . . , xn jsou) lineárně nezávislá(é), jestliže nulový vektor nelze vyjádřit jako netriviální lineární kombinaci těchto vektorů, tj.: i F, i = 1, . . . , n; 1x1 + + nxn = 0 1 = = n = 0. Nekonečná podmnožina ve V se nazývá lineárně nezávislá, jestliže každá její neprázdná konečná podmnožina je lineárně nezávislá. Podmnožina (resp. vektory) vektorového prostoru V se nazývá (nazývají) lineárně závislá(é), jestliže není (nejsou) lineárně nezávislá(é). VĚTA 3.17 (Důkaz D.19). Jestliže M je lineárně nezávislá množina nějakého vektorového prostoru, pak platí: (1) Každá neprázdná podmnožina v M je lineárně nezávislá; (2) 0 / M; (3) Je-li M =: {x1, . . . , xn} konečná, x L(M) a x = Pn i=1 ixi = Pn i=1 ixi, pak i = i pro i = 1, . . . , n. (4) Každý vektor 0 = x L(M) má až na pořadí sčítanců jediné vyjádření ve tvaru lineární kombinace s nenulovými koeficienty a navzájem různými vektory z M. VĚTA 3.18 (Důkaz D.20). Neprázdná podmnožina M vektorového prostoru (V, LF) je lineárně závislá právě když existuje vektor x M, který je lineární kombinací některých dalších vektorů z M, tj. x L(M - {x}). 62 VĚTA 3.19 (Důkaz D.21). [Šik:V3.18,V3.25 s.27-29] Nechť = G V je podmnožina nenulového vektorového prostoru (V, LF). Pak následující výroky jsou ekvivalentní: (1) G je báze ve V . (2) G je maximální lineárně nezávislá podmnožina ve V . (3) G je lineárně nezávislá a generuje V , tj. L(G) = V . DŮSLEDEK 3.20 (Důkaz D.22). [Šik:V3.22 s.28] Z každé množiny generátorů G nenulového vektorového prostoru V lze vybrat bázi prostoru V jako maximální nezávislou podmnožinu v G. Dokonce to lze udělat tak, aby obsahovala jakoukoli předem danou nezávislou podmnožinu v G. VĚTA 3.21 (Steinitzova věta o výměně, [Šik:V3.23 s.28],). Nechť M, N jsou konečné podmnožiny vektorového prostoru (V, LF), M L(N) lineárně nezávislá. Potom v N existuje podmnožina N s těmito vlastnostmi: (1) N má týž počet prvků jako M, (2) L((N - N ) M) = L(N). DŮSLEDEK 3.22 (Důkaz D.23). [Šik:3.26 s.29] Má-li nenulový vektorový prostor (V, LF) konečný systém generátorů, pak ve V existuje konečná báze a všechny báze mají týž (konečný) počet prvků. DEFINICE 3.23. Má-li vektorový prostor (V, LF) konečnou bázi o n prvcích. Pak (jednoznačně určené) číslo n nazýváme dimenzí tohoto prostoru a píšeme dim V = n. Prostor V pak nazýváme n-rozměrným (n-dimenzionálním) vektorovým prostorem nebo také konečně rozměrným (konečně dimenzionálním) vektorovým prostorem. Zejména s uvážením definice 3.15 má každý nulový prostor dimenzi 0 (jeho báze je totiž prázdná množina). Vektorový prostor V , v němž neexistuje konečný systém generátorů se nazývá nekonečně rozměrný (nekonečně dimenzionální), píšeme dim V = . 63 DŮSLEDEK 3.24 (Další důsledky Steinitzovy věty, Důkaz D.24). [Šik:V3.31-2 s.30] (1) Pro každou lineárně nezávislou množinu vektorů x1, . . . , xk vektorového prostoru V platí k dim V , přičemž každou takovou množinu lze doplnit (rozšířit) na bázi prostoru V . (2) Každý vektorový prostor má bázi. (3) Pro každý lineární podprostor W vektorového prostoru V platí dim W dim V . Přitom každou bázi ve W lze rozšířit na bázi ve V . Je-li dim V < a W = V , pak dim W < dim V . (4) Nechť V je vektorový prostor, dim V = n, 0 < n < , a G jeho podmnožina. Pak následující výroky jsou ekvivalentní: (i) G je báze ve V . (ii) G je n-prvková a lineárně nezávislá. (iii) G je n-prvková a generuje V . PŘÍKLAD 3.25. Pro vektorové prostory z příkladu 3.4 platí: (1) pro každé n N: (Qn , LQ) (Rn , LQ), (Rn , LR) (Cn , LR), (Rn[t], LR) (R[t], LR), (Cn[z], LC) (C[z], LC). (2) pro každé n N: (Qn , LR) (Rn , LR), (Rn , LC) (Cn , LC), (Rn , LR) (Cn , LC), (R[z], LC) (C[z], LC), (R[z], LR) (C[z], LC). (3) {1} je báze v (F, LF) a tedy dim F = 1. Zejména dim R = dim C = 1. Podle věty 3.14(6) je bází také každá jednoprvková podmnožina {a}, a = 0. (4) En := {[1, 0, . . . , 0], [0, 1, . . . , 0], . . . , [0, 0, . . . , 1]} je tzv. přirozená báze v (Fn , LF). Pro každé i = 1, . . . , n bude nadále i := [0, . . . , 1 i , . . . , 0] značit i-tý prvek této báze. Zejména tedy dim Rn = dim Cn = n. Opět podle věty 3.14(6) a s uvážením 3.24(4) je bází také každá podmnožina {a11, . . . , ann}, kde ai = 0 pro i = 1, . . . , n. (5) Podle 3.4(5) lze každý polynom a0 + a1t + + antn z Rn[t], resp. z Cn[t] ztotožnit s jeho vektorem n + 1 koeficientů 64 [a0, a1, . . . , an], takže roli přirozené báze v Rn[t], resp. v Cn[t] hrají homogenní polynomy t0 1, t1 , . . . , tn a platí tedy dim Rn[t] = dim Cn[t] = n + 1. (6) Pokud I je nekonečná množina, pak prostory (RI , LR) i (CI , LC) mají nekonečnou dimenzi. Zejména tedy mají nekonečnou dimenzi také prostory posloupností (RN , LR) a (CN , LC) stejně jako prostory polynomů R[t] a C[z]. 65 3.4. Lineární zobrazení. DEFINICE 3.26. Nechť (V1, LF) a (V2, LF) jsou dva vektorové prostory. Pak zobrazení T : V1 V2, které je homomorfizmem (definice 2.10) nazýváme lineárním zobrazením (lineárním operátorem) z vektorového prostoru (V1, LF) do vektorového prostoru (V2, LF) a píšeme T : (V1, LF) (V2, LF)4 . Speciálně lineární zobrazení T : (V, LF) (F, LF) se nazývá lineární funkcionál na V (viz též 3.4(1)). Lineární zobrazení se nazývá izomorfizmem vektorových prostorů (V1, LF) a (V2, LF), jestliže je bijekcí V1 na V2 (viz úvahu na konci poznámky 2.61). Je-li T pouze prosté lineární zobrazení, nazývá se izomorfní vnoření prostoru (V1, LF) do (V2, LF). Existuje-li alespoň jeden izomorfizmus (V1, LF) na (V2, LF), říkáme, že vektorové prostory (V1, LF) a (V2, LF) jsou izomorfní a píšeme (V1, LF) (V2, LF) nebo jen stručně V1 V2. Existuje-li pouze izomorfní vnoření, píšeme (V1, LF) (V2, LF) nebo V1 V2. VĚTA 3.27 (Důkaz: D.25). Nechť (V1, LF) a (V2, LF) jsou dva vektorové prostory. Pak zobrazení T : V1 V2 je lineární právě když má následující vlastnosti: (1) x, y V1 T(x + y) = T(x) + T(y) (vlastnost zachování grupového sečítání) (2) x V1, F T(x) = T(x) (vlastnost zachování skalárního násobení). Je-li T izomorfizmus, pak T-1 je rovněž lineární zobrazení (a tedy izomorfizmus) z (V2, LF) na (V1, LF). Zřejmě složení dvou lineárních zobrazení je rovněž lineární zobrazení. DŮSLEDEK 3.28 (Důkaz D.26). Každé lineární zobrazení T : (V1, LF) (V2, LF) zachovává libovolné 4místo y = T (x) píšeme stručněji také y = T x 66 lineární kombinace vektorů, tj. pro i F a xi V1, i = 1, . . . , n, platí: T(1x1 + + nxn) = 1T(x1) + + nT(xn). VĚTA 3.29 (Důkaz D.27). Nechť T : (V1, LF) (V2, LF) je lineární operátor, pak N(T) := {x V1 | Tx = 0} je vektorový podprostor v (V1, LF) nazývaný jádro (nulový podprostor) operátoru T. Podobně R(T) := {y V2 | x V1 : y = Tx} je vektorový podprostor ve (V2, LF) nazývaný obor hodnot operátoru T. DŮSLEDEK 3.30 (Důkaz D.28). Nechť T : (V1, LF) (V2, LF) je lineární operátor. Pak (1) T je izomorfní vnoření právě když N(T) = {0}. (2) T je izomorfizmus právě když N(T) = {0} a R(T) = V2. (3) T je izomorfní vnoření právě když obraz každé neprázdné konečné množiny lineárně nezávislé ve V1 je také lineárně nezávislá množina ve V2 s týmž počtem prvků. (4) T je izomorfizmus právě když obraz nějaké báze ve V1 je také báze ve V2 téže mohutnosti. V takovém případě dokonce každá báze ve V1 se zobrazí na bázi ve V2. DEFINICE 3.31. Nechť (V, LF) je n-rozměrný vektorový prostor a E := {e1, . . . , en} jeho báze. Definujme zobrazení []E : V Fn , které každému vektoru x V přiřazuje vektor jeho souřadnic v bázi E, tj. [x]E := [1, . . . , n] je ona dle 3.17(3) jednoznačně určená n-tice skalárů taková, že x = 1e1 + + nen. Pokud báze E ve V bude pevně dána, budeme též psát stručně [x] místo [x]E. VĚTA 3.32 (Důkaz D.29). Zobrazení []E : V Fn z předchozí definice je izomorfizmus vektorového prostoru (V, LF) na (Fn , LF). DŮSLEDEK 3.33 (Důkaz D.30). (1) Dva konečně rozměrné vektorové prostory V1 a V2 nad týmž polem F mají stejnou dimenzi právě když (V1, LF) (V2, LF). 67 (2) Pro dva konečně rozměrné vektorové prostory (V1, LF), (V2, LF) platí dim V1 dim V2 právě když (V1, LF) (V2, LF). POZNÁMKA 3.34. Každý lineární operátor T : (V1, LF) (V2, LF), V1 = L(E1), je dle 3.28 jednoznačně určen jen svými hodnotami T(E1) = {Te}eE1 na generátorech e E1. Je-li x V1 libovolný vektor a x = 1e1 + + nen nějaké jeho vyjádření jako lineární kombinace generátorů ei E1, i = 1, . . . , n (viz 3.13), pak totiž Tx = 1T(e1)+ +nT(en) dle 3.28. Poznamenejme, že zatímco toto vyjádření nemusí být jediné možné (je tomu tak jen když E1 je báze), obraz Tx je vždy jediný bez ohledu na volbu tohoto vyjádření. DEFINICE 3.35. Nechť T : (V1, LF) (V2, LF) je lineární operátor, E1 n-prvková báze ve V1 a E2 m-prvková báze ve V2. Pak dle předchozí poznámky a s ohledem na 3.32 je T jednoznačně určen vektory souřadnic [Te]E2 pro e E1. Systém n vektorů (každý délky m) značený [T]E1,E2 := {[Te]E2 }eE1 pak nazýváme souřadnicovou reprezentací operátoru T v bázích E1 a E2. Jsou-li obě báze pevně dány, píšeme opět stručně [T] místo [T]E1,E2 . VĚTA 3.36 (Důkaz D.31). Nechť T : (V1, LF) (V2, LF) je lineární operátor, V1 = L(E1). Pak platí: (1) T(E1) generuje R(T). (2) T(E1) generuje V2 právě když T je surjekce. (3) Je-li T izomorfní vnoření a E1 báze, pak T(E1) je báze v R(T). (4) Je-li T izomorfní vnoření a E1 báze, pak T(E1) je lineárně nezávislá podmnožina ve V2. (5) Je-li T izomorfizmus a E1 báze, pak T(E1) je báze ve V2. (6) Každé zobrazení f báze E1 do prostoru V2 se dá jednoznačně rozšířit na lineární operátor V1 do V2. Je-li f prosté zobrazení do nějaké báze E2 ve V2 (resp. bijekce na E2), pak toto rozšíření je izomorfní vnoření (resp. izomorfizmus). 68 PŘÍKLAD 3.37. Uvážíme-li 3.25(5), pak zobrazení (a0 + a1t + + antn ) := [a0, a1, . . . , an] definuje izomorfizmus z (Rn[t], LR) na (Rn+1 , LR), resp. z (Cn[z], LC) na (Cn+1 , LC). Analogicky (a0 + a1t + + antn ) := {a0, a1, . . . , an, 0, . . . } definuje izomorfní vnoření z (Rn[t], LR) do (RN , LR), resp. z (Cn[t], LC) do (CN , LC). VĚTA 3.38. Nechť (V1, LF) a (V2, LF) jsou dva vektorové prostory. Nechť L(V1, V2) značí množinu všech lineárních operátorů z V1 do V2 s operacemi z LF definovanými po složkách jako v 3.4(4), tj. pro T, T1, T2 L(V1, V2) a každé x V1 klademe: (T1 + T2)(x) := T1(x) + T2(x), (-T)(x) := -T(x), T 0 T(x) = 0, (T)(x) := T(x). Pak L(V1, V2) je vektorový prostor nad F. Důkaz. Zřejmý: axiomy (L1)­(L4) prostoru (V2, LF) se po složkách přenesou na L(V1, V2). 69 3.5. Faktor prostory a přímý součet. Věta 3.39. Nechť (V, LF) je vektorový prostor a nějaká relace ekvivalence na V a V := V/ příslušný rozklad na V . Pak relace je kongruence na (V, LF) ve smyslu definice 2.42 právě když pro x, x1, x2, x , x1, x2 V platí implikace: (1) x1 x1, x2 x2 x1 + x2 x1 + x2, (2) F, x x x x . V takovém případě třída 0 V obsahující nulový prvek je vektorovým podprostorem ve V . Důsledek 3.40. Každý vektorový podprostor W vektorového prostoru (V, LF) určuje kongruenci W na V s vlastností W = 0 a naopak dle 3.39. Příslušný faktor prostor (V , LF) tvořený odpovídajícími třídami rozkladu pak značíme jako V/W a nazýváme jej faktor prostorem V modulo (podle) W. Každá jeho třída obsahující vektor x je jednoznačně určena podprostorem W ve tvaru x = {x + w | w W}. Místo x pak píšeme x + W. Zejména samotný podprostor W = 0 + W tvoří třídu obsahující nulový vektor 0. Přitom platí x W y y - x W. V takovém případě říkáme, že vektory x a y jsou kongruentní modulo W. Pro příslušné kanonické lineární zobrazení V V/W z věty 2.43, x x + W, pak tedy platí: (x + y) + W = (x + W) + (y + W), (-x) + W = -(x + W), 0 W, (x) + W = (x + W) pro každé F. Důsledek 3.41. Je-li T : (V1, LF) (V2, LF) lineární zobrazení a V1/ T příslušný kanonický rozklad dle definice 2.40, pak V1/ T = V1/N(T). Poznámka 3.42. Podobně každá faktor grupa V/W grupy (V, +, 0) je určena nějakou 70 podgrupou W ve V . Stačí vlastnost (2) ve větě 3.39 nahradit vlastností: x x -x -x . Příkladem je grupa (ZN , , 0), která je izomorfní s faktor grupou grupy (Z, +, 0) podle podgrupy NZ := {Nk | k Z}. Píšeme pak ZN Z/NZ. Pak a NZ b b-a NZ b-a = Nk pro nějaké k Z N|(b-a), což přesně odpovídá kongruenci z příkladu 2.62(2). DEFINICE 3.43. Nechť {(Wi, LF)}iI je systém vektorových podprostorů vektorového prostoru (V, LF). Pak podprostor W := L( S iI Wi) nazýváme součtem vektorových podprostorů Wi, i I a píšeme W = P iI Wi. Jestliže navíc platí Wi L( S jI,j=i Wj) = {0} pro každé i I, pak součet nazýváme přímým součtem vektorových podprostorů Wi, i I a píšeme W = P iI Wi. Speciálně v případě součtu dvou, resp. konečného počtu (n 2) podprostorů píšeme W = W1 + W2, resp. W = W1 + + Wn. Podobně v případě přímého součtu dvou5 , resp. konečného počtu (n 2) podprostorů píšeme W = W1 W2, resp. W = W1 Wn. Poznámka 3.44. Součet ani přímý součet podprostorů zřejmě nezávisí na pořadí a uzávorkování sčítanců a jsou to tedy komutativní a asociativní operace. VĚTA 3.45. Pro podprostory z předchozí definice platí: (1) W = P iI Wi právě když W = {x V | x = P jJ xj, xj Wj, J I, card J < }. (2) W = W1 + + Wn právě když W = {x1 + + xn | xi Wi, i = 1, . . . , n}. (3) W = P iI Wi právě když W = {x V | x = P jJ xj, xj Wj, J I, card J < }, 5dodatečná podmínka je v tomto případě tvaru W1 W2 = {0}. 71 kde vyjádření každého vektoru x W ve tvaru součtu x =P jJ xj je jediné až na pořadí a počet nulových sčítanců xj. (4) W = W1 Wn právě když W = {x1 + + xn | xi Wi, i = 1, . . . , n}, kde vyjádření x1 + +xn každého vektoru je až na pořadí sčítanců jediné. DŮSLEDEK 3.46. W = W1 Wn právě když W W1 × × Wn. VĚTA 3.47 ([Šik:V3.43 s.32]). Ke každému podprostoru W vektorového prostoru (V, LF) existuje (obecně ne jediný) podprostor W ve V tak, že V = W W a dim V = dim W +dim W . Podprostor W se nazývá přímý doplněk W ve V . Věta 3.48 ([Šik:V3.44 s.33]). Nechť (V, LF) je vektorový prostor a V = W1 W2, pak V/W1 W2 a každá třída rozkladu V/W1 obsahuje právě jeden prvek z W2 (podobně po záměně role W1 a W2). VĚTA 3.49 ([Šik:V3.45 s.33]). Nechť (V, LF) je vektorový prostor a V = W1 W2, pak dim V = dim(W1 + W2) = dim W1 + dim W2. VĚTA 3.50 ([Šik:V3.46 s.33]). Nechť (V, LF) je vektorový prostor a W1 a W2 jeho podprostory, pak dim(W1 W2) + dim(W1 + W2) = dim W1 + dim W2. PŘÍKLAD 3.51. (1) Nechť 0 = u R2 je nějaký vektor, pak W := L({u}) = {u | R} je jednorozměrný vektorový podprostor v (R2 , LR) generovaný vektorem u. Tento podprostor je v Euklidovské rovině s pevně zvoleným počátkem reprezentován přímkou procházející tímto počátkem ve směru vektoru u. Pak rozklad R2 /W dle 3.40 je tvořen všemi přímkami rovnoběžnými s W. 72 (2) Nechť W1 a W2 jsou dva různé jednorozměrné vektorové podprostory jako v (1) reprezentované dvěma přímkami procházejícími počátkem v různých směrech u1 a u2. Pak R2 = W1 W2, neboť W1 W2 = {[0, 0]} a R2 = L(W1 W2) = L({u1, u2}), neboť u1, u2 jsou zřejmě nezávislé a tudíž tvoří bázi v R2 . Dle 3.49 podle očekávání platí 2 = dim R2 = dim W1 + dim W2 = 1 + 1. (3) Nechť W1 a W2 jsou dva různé dvourozměrné podprostory v (R3 , LR) reprezentované různými rovinami procházejícími počátkem Eukleidovského prostoru R3 . Zřejmě R3 = W1+W2 a dle 3.50 platí dim(W1 W2) = dim W1 +dim W2 -dim R3 = 2 + 2 - 3 = 1. Podle očekávání je tedy průnikem těchto rovin nějaká přímka procházející počátkem a součet R3 = W1 +W2 tedy nemůže být přímým součtem. Toho lze dosáhnout jen když W1 je přímka a W2 rovina (nebo naopak), kdy dim(W1 W2) = 1 + 2 - 3 = 0, tj. W1 W2 = {[0, 0, 0]}. DEFINICE 3.52. Nechť W je vektorový podprostor vektorového prostoru (V, LF) a P : V W lineární operátor s vlastností: Px = x pro každé x W. Pak P se nazývá projekční. P je zřejmě surjektivní a P2 = P, tj. P(Px) = Px pro každé x V (tzv. vlastnost idempotence). VĚTA 3.53. Nechť (V, LF) je vektorový prostor a V = W1 W2. Definujme zobrazení P1 : V W1 takto: P1(x) := x1 je onen dle věty 3.45(4) jednoznačně určený prvek z vyjádření x = x1 + x2, x1 W1, x2 W2. Pak P1 je projekční operátor nazývaný operátorem rov- noběžné6 projekce na podprostor W1, přičemž N(P1) = W2 a V/ P1 = V/W2. 6rozumí se rovnoběžně s podprostorem W2 73 3.6. Prostory s normou a skalárním součinem. Všude v tomto odstavci uvažujeme pouze reálné nebo komplexní vektorové prostory, tj. F C, zpravidla F = R nebo F = C. DEFINICE 3.54. Nechť V je (reálný nebo komplexní) vektorový prostor. Normou na V rozumíme funkci7 : V R+ s těmito vlastnostmi: (N1) x + y x + y pro každé x, y V (trojúhelníková nerovnost). (N2) x = || x pro každé x V a F. (N3) Pro každé x V platí x 0, přičemž x = 0 x = 0. Vektorový prostor V pak nazýváme normovaným lineárním (vektorovým) prostorem, zkráceně NL-prostorem a píšeme (V, LF, ). VĚTA 3.55. Vlastnosti normy, důkaz D.32 Z axiomů (N1) až (N3) bezprostředně vyplývají některé další užitečné vlastnosti normy, například: (N4) | x - y | x y x + y pro každé x, y V. PŘÍKLAD 3.56. (1) Absolutní hodnota || je normou v (F, LF). (2) Podobně pro x =: [x1, . . . , xn] Fn , n N, definuje vztah x 1 := |x1| + + |xn| tzv. 1-normu v (Fn , LF). (3) Dá se ukázat, že pro libovolné p N je rovněž x p := p p |x1|p + + |xn|p tzv. p-norma v (Fn , LF). V limitě pro p dostaneme normu x := max(|x1|, . . . , |xn|). POZNÁMKA 3.57. Norma představuje míru pro velikost vektorů ve vektorovém prostoru. Norma x 2 z předchozího příkladu je běžně užívaná Euklidovská norma. 7někdy také budeme psát V místo , abychom zdůraznili příslušnost normy k prostoru V . 74 DEFINICE 3.58. Nechť V je (reálný nebo komplexní) vektorový prostor. Skalárním (vnitřním) součinem na V rozumíme funkci8 , : V × V F s těmito vlastnostmi: (S1) x + y, z = x, z + y, z pro každé x, y, z V . (S2) x, y = x, y pro každé x, y V a F. (S3) y, x = x, y pro každé x, y V , zejména tedy x, x R. (S4) Pro každé x V platí x, x 0, přičemž x, x = 0 x = 0. Vektorový prostor V pak nazýváme lineárním (vektorovým) prostorem s vnitřním součinem, zkráceně VS-prostorem a píšeme (V, LF, , ). VĚTA 3.59. (Vlastnosti skalárního součinu, důkaz D.33) Z axiomů (S1) až (S4) vyplývají některé další užitečné vlastnosti skalárního součinu, například: (S5) x, y + z = x, y + x, z pro každé x, y, z V . (S6) x, y = x, y pro každé x, y V a F. (S7) 0, x = x, 0 = 0 pro každé x V . POZNÁMKA 3.60. Je-li V reálný vektorový prostor (F = R), pak (S3) a (S6) jsou tvaru: (S3') y, x = x, y pro každé x, y V (symetrie). (S6') x, y = x, y pro každé x, y V a R. Vlastnosti (S1), (S2), (S5) a (S6'), resp. (S6), znamenají, že , je tzv. bilineární forma na V. Vlastnost (S3') znamená, že , je dokonce symetrická bilineární forma. Vzhledem k vlastnostem bilinearity můžeme dále s výhodou provádět 8někdy také budeme psát , V místo , , abychom zdůraznili příslušnost skalárního součinu k prostoru V . 75 následující úpravy (i, j F, xi, yj V ): nX i=1 ixi, mX j=1 jyj = nX i=1 i xi, mX j=1 jyj = nX i=1 i mX j=1 j xi, yj = = nX i=1 mX j=1 ij xi, yj . (3.1) VĚTA 3.61 ((Cauchy-)Schwarzova nerovnost, důkaz D.34). [KaSk:V11.5 s.105] (S8) | x, y | p x, x p y, y (S9) = x y pro každé x, y V , přičemž rovnost nastane jen v případě, že x, y jsou lineárně závislé, tj. jen když jeden z nich je skalárním násobkem druhého (viz větu 3.18). DŮSLEDEK 3.62 (Důkaz D.35). (S9) x := p x, x je norma na V nazývaná normou odvozenou ze skalárního součinu , nebo také normou indukovanou skalárním součinem , . Věta 3.63 (Důkaz D.36). V NL-prostoru V s normou lze zavést vnitřní součin , indukující tuto normu dle (S9) právě když platí tzv. rovnoběžníkový zákon (součet délek úhlopříček rovnoběžníku=součet délek stran): (S10) x + y 2 + x - y 2 = 2( x 2 + y 2 ) pro každé x, y V . PŘÍKLAD 3.64. * (Cn , LC), n N, je VS-prostorem s vnitřním součinem x, y = Pn i=1 xiyi. * (Rn , LR), n N, je VS-prostorem s vnitřním součinem x, y = Pn i=1 xiyi. * Indukovanou normou je v obou případech euklidovská norma, neboť x, x = Pn i=1 xixi = Pn i=1|xi|2 = x 2 2. * Protože každé dva nenulové reálné vektory x, y generují nejvýše 76 dvourozměrný podprostor v (Rn , LR), který je dle 3.32 izomorfní s (R2 , LR) můžeme bez újmy na obecnosti předpokládat, že x, y R2 . Pak užitím Pythagorovy věty dostáváme ( a jsou úhly, které po řadě vektory x a y svírají s osou x): x, y = x1y1 + x2y2 = = ( x cos ) ( y cos ) + ( x sin ) ( y sin ) = = x y (cos cos + sin sin ) = = x y cos( - ). Pak := - je úhel mezi směrově orientovanými vektory x a y a můžeme psát: -1 cos := x, y x y 1, 0 , (3.2a) což poskytuje geometrickou interpretaci Schwarzovy nerovnosti. V komplexním případě je x, y obecně komplexní číslo, takže úhel můžeme zavést jen jako úhel mezi neorientovanými vektory: 0 cos := | x, y | x y 1, 0 2 , (3.2b) Skalární součin tedy prostřednictvím Schwarzovy nerovnosti umožňuje zavést úhlovou geometrii do libovolného abstraktního vektorového prostoru se skalárním součinem dle následující definice. DEFINICE 3.65. Nechť V je reálný (resp. komplexní) vektorový prostor a x, y V jeho dva nenulové vektory. Pak úhlem mezi x a y (svíraným vektory x a y) rozumíme úhel určený svým kosinem dle (3.2a) (resp. dle (3.2b)). Je-li x = 0 nebo y = 0, klademe definitoricky = 2 . * Řekneme, že vektory x a y jsou ortogonální, jestliže x, y = 0 (tj. když svírají pravý úhel), píšeme x y. Zřejmě nulový vektor 0 je dle (S7) kolmý na každý vektor x V a dle (S4) je to současně jediný vektor, který je kolmý sám na sebe. * Podobně podmnožiny M, N V se nazývají k sobě ortogonální, 77 jestliže x y pro každou dvojici x M a y N. Píšeme opět M N (místo {x} N píšeme stručně x N). * Řekneme, že množina M V je ortogonální, jestliže x y pro každou dvojici x, y M, x = y. Ortogonální množina M se nazývá ortonormální9 , jestliže navíc x = 1 pro každé x M. VĚTA 3.66 (Důkaz D.37). [KaSk:V11.8 s.106] Nechť E := {e1, . . . , en} je ortogonální množina VS-prostoru V . Pak platí: (a) množina {1e1, . . . , nen} je ortogonální pro libovolná čísla 1, . . . , n F, (b) pokud E neobsahuje nulové vektory, pak E lze normalizovat: množina { 1 e1 e1, . . . , 1 en en} je ortonormální. VĚTA 3.67 (Pythagorova věta, Důkaz D.38). [KaSk:V11.9 s.106] (S11) x + y 2 = x 2 + y 2 pro každé x, y V , x y. Je-li E = {e1, . . . , en}, n N, ortogonální množina vektorového prostoru V . Pak platí (S11') e1 + e2 + + en 2 = e1 2 + e2 2 + + en 2 . VĚTA 3.68 (Důkaz D.39). Nechť E je ortogonální množina VS-prostoru V neobsahující nulové prvky. Pak E je lineárně nezávislá. Zejména tedy každá ortonormální množina E V je lineárně nezávislá. Jestliže taková množina E generuje celý prostor V (viz 3.19(3)), nazývá se ortogonální, resp. ortonormální báze prostoru V (zkráceně OB, resp. ONB). DŮSLEDEK 3.69 (Důkaz D.40). Nechť E je ONB VS-prostoru V , pak každý vektor x V má jediné vyjádření ve tvaru x = P eE x, e e, kde suma má nejvýše konečně mnoho nenulových sčítanců, neboť card {e E | x, e = 0} < . 9Na rozdíl od ortogonální množiny nemůže dle (N3) ortonormální množina obsahovat nulové prvky. 78 Je-li V konečně rozměrný a E = {e1, . . . , en}, pak x má v této bázi vektor souřadnic10 [x]E = [ x, e1 , . . . , x, en ]. DŮSLEDEK 3.70 (Souřadnicové vyjádření skalárního součinu v ONB). Nechť E je ONB VS-prostoru V , x, y V , pak skalární součin lze vyjádřit ve tvaru x, y = P eE x, e y, e , kde suma má nejvýše konečně mnoho nenulových sčítanců. Zejména v případě x = y platí x = qP eE| x, e |2. Je-li V konečně rozměrný a E = {e1, . . . , en}, pak x, y = Pn i=1 ii a x = pPn i=1|i|2, kde [x]E =: [1, . . . , n], [y]E =: [1, . . . , n], i = x, ei a i = y, ei pro i = 1, . . . , n. Důkaz. D.41. Věta 3.71 (Důkaz D.42). Nechť = M V je podmnožina VS-prostoru V . Pak množina M := {x V | x M} je vektorový podprostor ve V a platí L(M) = M . Množina M se nazývá ortogonální doplněk (komplement) množiny M ve V . Přitom M N N M . POZNÁMKA 3.72. Z předchozí věty vyplývá důležitý fakt: k tomu, aby nějaký vektor x V byl kolmý na nějaký podprostor W ve V stačí, aby byl kolmý na nějakou obvykle podstatně menší množinu jeho generátorů (konečná množina, pokud dim W < ). VĚTA 3.73 (Důkaz D.43). Nechť {(Wi, LF)}iI je systém navzájem kolmých VS­podprostorů VS-prostoru (V, LF), Wi Wj pro i = j. Pak jejich součet W := P iI Wi je přímý a nazývá se ortogonální součet podprostorů {Wi}iI . Místo W = P iI Wi v takovém případě píšeme W = L iI Wi. Speciálně v případě ortogonálního součtu dvou, resp. konečného počtu (n 2) podprostorů píšeme W = W1 W2, resp. W = W1 Wn. 10viz definici 3.31 79 VĚTA 3.74 (Důkaz D.44). Nechť (V, LF) je VS-prostor a V = W W . Pak W = W je jediný přímý doplněk ortogonální k W. V tomto případě operátor rovnoběžné projekce V na W zavedený ve větě 3.53 nazýváme operátorem ortogonální projekce a značíme jej PW . Každý vektor x V lze pak jednoznačně rozložit na součet x = bx + x , kde bx := PW x W je ortogonální projekce x na W a x W je jednoznačně určená reziduální složka vektoru x, x W. DŮSLEDEK 3.75 (Důkaz D.45). I-PW je operátor ortogonální projekce V na W a platí W = W. VĚTA 3.76 (Některé vlastnosti operátoru ortogonální projekce). Nechť W1 a W2 jsou vektorové podprostory VS-prostoru V a PW1 a PW2 operátory ortogonální projekce prostoru V po řadě na W1 a W2. Pak platí: (1) x W1 PW1 x = x. (2) x W 1 PW1 x = 0. (3) W2 W1 PW2 (PW1 x) = PW2 x pro každé x V. DŮKAZ. D.46 VĚTA 3.77 (Věta o ortogonální projekci). Nechť (V, LF) je VS-prostor, V = W W a bx = PW x pro nějaký vektor x V . Pak x - bx = infyW x - y a bx je jediný prvek ve W s takovou vlastností. Je-li W = L(E), pak bx = 1e1 + + nen pro vhodné11 vektory ei E a i F, i = 1, . . . , n, n N. Vektor bx proto také nazýváme nejlepší lineární aproximací x pomocí vektorů z E podle normy . Je-li E ONB ve W, pak i = bx, ei = x, ei pro i = 1, . . . , n. DŮKAZ. D.47 11zatímco bx je určen jednoznačně, jeho lineární reprezentace pomocí j a ej E je jediná jen v případě, že E je báze. 80 VĚTA 3.78 (Gram-Schmidtova ortogonalizace, [KaSk:V11.11 s.107]). Nechť V je vektorový prostor se skalárním součinem , a nechť v1, . . . , vn (n N) je báze12 vektorového podprostoru W prostoru V . Položme Wk := L({v1, . . . , vk}) pro každé k N, 1 k n a definujme rekurentně vektory e1, . . . , en V takto: e1 = v1, ek = vk - PWk-1 vk = vk - k-1X j=1 vk, ej ej 2 ej pro každé k = 2, . . . , n. Pak L({e1, . . . , ek}) = Wk pro každé k = 1, . . . , n, přičemž vektory e1, . . . , ek tvoří ortogonální bázi ve Wk. Zejména tedy vektory e1, . . . , en tvoří ortogonální bázi ve W = Wn. Důkaz. D.48 DŮSLEDEK 3.79 (Důkaz D.49). [KaSk:V11.12 s.107] Každý VS-prostor V konečné dimenze má ortogonální i ortonormální bázi. Přitom každou jeho ortogonální množinu bez nulových prvků lze doplnit na OB ve V a každou jeho ortonormální množinu lze doplnit na ONB ve V . VĚTA 3.80 (Důkaz D.50). Pro každý konečně rozměrný podprostor W vektorového prostoru (V, LF) platí V = W W a tedy v takovém případě lze vždy použít větu o ortogonální projekci. Důsledek 3.81. Nechť = M V je podmnožina VS-prostoru V generující ve V podprostor L(M) konečné dimenze. Pak M = L(M). Důkaz. W := L(M), dim W < 3.80 V = W W 3.75 W = W = L(M) 3.71 = M . 12algoritmus lze po modifikaci užít i v případě, že v1, . . . , vn pouze generují prostor V : v rekurzi pro ek sčítáme jen přes ta j, pro něž ej = 0; bázi pak tvoří jen nenulové vektory ej . 81 VĚTA 3.82 (Důkaz D.51). Nechť (V1, LF) a (V2, LF) jsou dva VS-prostory a T : V1 V2 lineární operátor. Jestliže existuje zobrazení T : V2 V1 takové, že Tx, y = x, T y platí pro každé x V1 a y V2, pak T je jediné takové a určuje lineární operátor nazývaný operátorem adjungovaným k T. Je-li V1 = V2 a T = T , pak T se nazývá samoadjungovaný operátor. Věta 3.83. Je-li T lineární operátor jako v 3.82 a dim R(T) =: n < pak T existuje a zkonstruuje se takto: (1) V R(T) vybereme nějakou n-prvkovou ortonormální bázi E a b1, . . . , bn V1 takové, že E = {T(b1), . . . , T(bn)}. (2) Pak B := {b1, . . . , bn} je lineárně nezávislá ve V1 a tedy generuje ve V1 podprostor W := L(B) rovněž dimenze n. (3) Nechť E =: {e1, . . . , en} je ONB ve W získaná Gram-Schmidtovou ortogonalizací báze B dle 3.78. (4) Pro každé y V2 položíme T y := Pn j=1 y, Tej ej. POZNÁMKA 3.84. Každý lineární operátor V1 V2 určuje vztahem Tx, y bilineární formu V1 ×V2 F (srov. 3.60), kterou lze vzhledem k linearitě T opět upravovat podle vztahů analogických k (3.1): T nX i=1 ixi , mX j=1 jyj = nX i=1 mX j=1 ij Txi, yj . (3.3) Je-li V := V1 = V2, pak zobrazení V V definované vztahem Tx, x nazýváme kvadratickou formou. Pokud navíc platí T = T , pak tato forma nabývá pouze reálných hodnot, neboť Tx, x = x, Tx (S3) = Tx, x . Samoadjungovaný operátor T se nazývá (striktně) pozitivní, jestliže Tx, x 0 pro každé x V ( Tx, x > 0 pro každé x = 0), neboli když jím určená kvadratická forma nabývá pouze nezáporných hodnot (kladných hodnot pro nenulová x). Píšeme T 0 (T > 0). 82 VĚTA 3.85 (Vlastnosti adjungovaných operátorů, Důkaz D.52). Nechť (V1, LF), (V2, LF) a (V3, LF) jsou VS-prostory, T : V1 V2 a U : V2 V3 lineární operátory a T : V2 V1 a U : V3 V2 operátory k nim adjungované. Pak platí (1) T je operátor adjungovaný k T , tj. platí T = T. (2) T U je operátor adjungovaný ke složenému operátoru UT : V1 V3, tj. platí (UT) = T U . (3) Identický operátor I : V1 V1 je samoadjungovaný, tj. I = I. (4) TT i T T jsou pozitivní operátory a tedy také samoadjun- gované. Věta 3.86 (Charakterizace ortogonální projekce, Důkaz D.53). Nechť (V, LF) je VS-prostor a P surjektivní zobrazení V na nějaký jeho podprostor W. Pak následující výroky jsou ekvivalentní: (1) P = PW , tj. P je operátor ortogonální projekce V na W. (2) Pro každé x V platí x - Px W. (3) P je lineární operátor s vlastnostmi: P2 = P (tj. P je projekční) a P = P (tj. P je samoadjungovaný). Důsledek 3.87 (Důkaz D.54). Každý operátor ortogonální projekce je pozitivní. Věta 3.88 (ilustrační obr. V3-88obr.tif(->ZIP), Důkaz D.55). Nechť (V1, LF), (V2, LF) jsou VS-prostory, T : V1 V2 lineární operátor a T : V2 V1 operátor k němu adjungovaný. Pak platí: (1) N(T) = R(T ) a N(T ) = R(T) . (2) T = T N(T) = R(T) . (3) N(T T) = N(T) a N(TT ) = N(T ). (4) T surjektivní T je izomorfní vnoření. T surjektivní T je izomorfní vnoření. (5) Jestliže dim R(T) < nebo dim R(T ) < , pak (i) V1 = R(T ) N(T), V2 = R(T) N(T ), (ii) N(T) = R(T ), N(T ) = R(T), 83 (iii) R(T T) = R(T ) a R(TT ) = R(T). (iv) T |R(T ) : R(T) R(T ) i T|R(T ) : R(T ) R(T) jsou izomorfizmy a tedy dim R(T) = dim R(T ) =: n. (v) dim V1 = n + dim N(T) a dim V2 = n + dim N(T ). (vi) T izomorfizmus T je izomorfizmus, (T-1 ) existuje a platí (T-1 ) = (T )-1 . DEFINICE 3.89. Lineární operátor z VS-prostoru V1 do VS-prostoru V2 se nazývá unitární (ortogonální13 ), jestliže zobrazuje nějakou ONB ve V1 na ONB ve V2 o stejné mohutnosti. Každý unitární operátor je dle 3.30(4) izomorfizmem, nazývá se proto také unitárním izomorfizmem prostorů V1 a V2. Jestliže existuje unitární operátor V1 na V2, pak říkáme, že prostory V1 a V2 jsou unitárně izomorfní a píšeme (V1, LF) U (V2, LF). Jestliže V1 je unitárně izomorfní pouze s nějakým podprostorem ve V2, pak píšeme (V1, LF) U (V2, LF) a každý unitární operátor V1 na R(V1) V2 nazýváme unitárně izomorfním vnořením V1 do V2. VĚTA 3.90 (Charakterizace unitárních operátorů, Důkaz D.56). Nechť (V1, LF), (V2, LF) jsou VS-prostory a existuje ONB ve V1. Nechť dále T : V1 V2 je lineární operátor. Pak následující výroky jsou ekvivalentní: (1) T je unitární. (2) T zobrazuje každou ONB ve V1 na ONB ve V2 o stejné mo- hutnosti. (3) T je surjekce zachovávající skalární součin: Tx, Ty = x, y pro každé x, y V1. (4) T je surjekce zachovávající normu (tzv. izometrie): Tx = x pro každé x V1. (5) T existuje a platí T = T-1 . (6) T existuje a T T je identický operátor. 13Termín ortogonální se obvykle užívá v případě reálných prostorů (F = R). 84 V takovém případě T-1 = T je rovněž unitární operátor z V2 na V1 a platí nejen T T = IV1 dle (6), ale i TT = IV2 . DŮSLEDEK 3.91 (Charakterizace unitárně izomorfních vnoření). Za předpokladů předchozí věty jsou ekvivalentní následující výroky: (1') T je unitárně izomorfní vnoření. (2') T zobrazuje každou ONB ve V1 na ortonormální množinu ve V2 o stejné mohutnosti. (3') T zachovává skalární součin: Tx, Ty = x, y pro každé x, y V1. (4') T zachovává normu: Tx = x pro každé x V1. (5') T : R(T) V1 existuje a platí T = T-1 na R(T). (6') T existuje a T T je identický operátor. V takovém případě T-1 = T je rovněž unitární operátor z R(T) na V1 a platí nejen T T = IV1 dle (6'), ale i TT = IR(T ). Důkaz. Je přímým důsledkem věty 3.90, jestliže uvážíme, že T : V1 V2 je unitárně izomorfním vnořením právě když T : V1 R(T) je unitárním izomorfizmem. Stačí tedy ve formulacích dle potřeby V2 zaměnit za R(T). Přitom surjektivita na R(T) je automatická, takže tento požadavek lze ve (3') a (4') vypustit. DŮSLEDEK 3.92 (Důkaz D.57). Je-li (V, LF) VS-prostor konečné dimenze n, a E jeho ONB, pak izomorfizmus []E : V Fn z věty 3.32 je dokonce unitární izomorfizmus (V, LF) na (Fn , LF). DŮSLEDEK 3.93 (Důkaz D.58). (1) Dva konečně rozměrné reálné (komplexní) VS-prostory V1 a V2 mají stejnou dimenzi právě když (V1, LF) U (V2, LF). (2) Pro dva konečně rozměrné reálné (komplexní) VS-prostory (V1, LF), (V2, LF) platí dim V1 dim V2 právě když (V1, LF) U (V2, LF). 85 ANGLICKÁ TERMINOLOGIE Z LINEÁRNÍ ALGEBRY skalár scalar skalární součin dot product vektor vector vektorový (lineární) prostor vector (linear) space podprostor subspace lineární kombinace linear combination lineární obal linear span (lineárně) generovaný (čím) spanned by báze basis lineárně (ne)závislý linearly (in)dependent dimenze dimension n-dimenzionální n-dimensional vícerozměrný multivariate lineární zobrazení (operátor) linear mapping (operator) vnoření embedding nulový podprostor (jádro) operátoru null space prostor hodnot operátoru range space souřadnice co-ordinates faktor prostor factor space kongruentní modulo congruent modulo (přimý) součet (direct) sum přímý doplněk direct complement projekční operátor projection operator norma norm normovaný prostor normed space vnitřní (skalární) součin inner (scalar) product prostor s vnitřním součinem inner product space bilineární forma bilinear form kvadratická forma quadratic form Pythagorova věta Pythagorean theorem rovnoběžníkový zákon parallelogram law úhel mezi angle between 86 kolmý, ortogonální perpendicular, orthogonal ortonormální orthonormal ortogonální doplněk orthogonal complement ortogonální součet orthogonal sum ortogonální projekce orthogonal projection nejlepší lineární aproximace best linear approximation ortogonalizace orthogonalization (samo)adjungovaný (self-)adjoint (striktně) pozitivní (strictly) positive unitární operátor unitary operator unitárně izomorfní unitary isomorphic 87 4. Teorie matic Teorie a příklady: [KaSk: s.63-129], [Šik: s.1-23] Příklady: [Ho:řešené č.16-36; s.17-37], [Ho:neřešené kap.4, 5 s.100-137] Teorie matic představuje formální kalkulus pro manipulaci s vektory a lineárními zobrazeními ve VS-prostoru (Fn , LF). Prostřednictvím unitárního izomorfizmu z 3.92 lze tento aparát užít i pro jakýkoli abstraktní vektorový prostor (V, LF) konečné dimenze. Numerické výpočetní prostředí MATLAB používá matice nad komplexními čísly (F = C) jako základní proměnné a je tedy ideálním výpočetním prostředím pro řešení úloh lineárního charakteru. Má však daleko širší záběr i nad tento lineární rámec. Název systému je odvozen z angličtiny: MATLAB=MATrix LABoratory. Systém produkuje americká společnost MathWorks, Inc. (http://www.mathworks.com) a jejím výhradním distributorem pro Českou republiku je pražská firma Humusoft, s.r.o. (http://www.humusoft.cz). Obecně lze systém MATLAB charakterizovat jako maticově orientované výpočetní prostředí s vlastním programovacím jazykem vhodným pro efektivní implementaci, provádění a vizualizaci numerických výpočtů vyžadujících náročný aparát z nejrůznějších oblastí matematiky. Je dostupný na všech běžných platformách (WINDOWS, LINUX, UNIX, atd.) při zachování takřka stoprocentní přenositelnosti vytvořených programů a datových souborů. Vzhledem ke svému snadnému a intuitivnímu ovládání bude proto MATLAB nadále využíván k demonstracím i ve cvičeních. Cvičení v MATLABu: tmcv1, tmcv2, tmcv3, tmcv4 88 4.1. Matice a jejich základní druhy. DEFINICE 4.1. Nechť I a J jsou konečné lineárně uspořádané množiny (m := card I, n := card J), pak každé zobrazení A : I ×J F nazýváme maticí nad F typu m/n (rozměru m × n). Pro každé i I a j J značíme hodnotu tohoto zobrazení jako aij := A(i, j) (aij F) a nazýváme prvkem matice A v i-tém řádku a j-tém sloupci nebo také (i, j)-tým prvkem matice A. Množina I, resp. J se nazývá množinou řádkových, resp. sloupcových indexů matice A. V dalším se bez újmy na obecnosti můžeme omezit na standardně užívané indexové množiny I = {1, 2, . . . , m} a J = {1, 2, . . . , n}. Matici A pak zapisujeme jako podrobný výčet všech jejích prvků uspořádaný do tabulky: A = 2 6 6 6 4 a11 a12 a1n a21 a22 a2n ... ... ... ... am1 am2 amn 3 7 7 7 5 . (4.1) Pokud aij nepředstavují konkrétní hodnoty, vystačíme se zjednodušeným symbolickým zápisem A = [aij]. Speciální případy: * m = n: A nazýváme čtvercovou maticí řádu m. * m = 1: A nazýváme řádkovým vektorem délky n. * n = 1: A nazýváme sloupcovým vektorem délky m. * m = n = 1: A ztotožňujeme s jejím jediným prvkem, tj. [a] = a. * m = 0: A nazýváme prázdným řád. vektorem délky n. * n = 0: A nazýváme prázdným sloup. vektorem délky m. * m = n = 0: A nazýváme prázdnou maticí typu 0/0. Je-li m = 0 nebo n = 0, pak A se nazývá prázdná matice14 . Píšeme A = [ ]. 14Prázdná matice koresponduje s prázdným zobrazením zavedeným v poznámce 1.36(4). 89 DEFINICE 4.2 (Submatice). Matici B =: [bkl] nazveme submaticí matice A =: [aij], jestliže existují řádkové indexy 1 i1 < i2 < < ip m a sloupcové indexy 1 j1 < j2 < < jq n tak, že bkl = aikjl pro každé k = 1, . . . , p a l = 1, . . . , q. Píšeme B = A([i1, . . . , ip], [j1, . . . , jq]). Speciální případy: * p = m (vybrány všechny řádky): B =: A(:, [j1, . . . , jq]), * q = n (vybrány všechny sloupce): B =: A([i1, . . . , ip], :), * p = 1 (vybrán jeden řádek i := i1): B =: A(i, [j1, . . . , jq]), * q = 1 (vybrán jeden sloupec j := j1): B =: A([i1, . . . , ip], j), * i-tý řádek matice A: B =: A(i, :), * j-tý sloupec matice A: B =: A(:, j). Poznámka 4.3. (1) Matice lze sestavovat i po blocích ve tvaru (4.1), kde aij mohou být nahrazeny submaticemi Aij kompatibilních rozměrů. Při sestavování matice pomocí bloků skládaných vedle sebe (pod sebe) budeme v souladu se syntaxí jazyka MATLAB v zápisech užívat jako oddělovače čárku (středník). Například matici A ze (4.1) můžeme pomocí jejích sloupců sj := A(:, j), resp. řádků ri := A(i, :) zapsat také takto: A = [s1, . . . , sn], resp. A = [r1; . . . ; rm]. (2) Ztotožníme-li řádkové, resp. sloupcové vektory délky n s prvky vektorového prostoru Fn , můžeme matici A typu m/n interpretovat dvojím způsobem: a) jako uspořádaný systém m řádkových vektorů z Fn , b) jako uspořádaný systém n sloupcových vektorů z Fm . Takový systém může v příslušném prostoru hrát roli systému generátorů nějakého podprostoru, jeho báze apod. Označení . Mm,n := Mm,n(F) . . . množina všech matic nad F typu m/n, ij = ( 1 pro i = j 0 pro i = j . . . Kroneckerův symbol . 90 x Fn . . . sloupcový vektor (pokud nebude řečeno jinak). i := [1,i; 2,i; . . . ; n,i] . . . i-tý prvek přirozené báze E dle 3.25(4). In := [i,j] . . . jednotková matice řádu n: In(i, :) = In(:, i) = i; její i-tý řádek (sloupec) je právě i, pokud neděláme rozdíl mezi řádkovou či sloupcovou formou zápisu. 0m,n . . . nulová matice typu m/n: všechny prvky jsou nuly. 1m,n . . . matice jedniček typu m/n: všechny prvky jsou jedničky. Eij Mm,n . . . matice, kde Eij(i, j) = 1 a ostatní prvky jsou nuly. diag(A) =: [a11, a22, . . . ] . . . hlavní diagonála matice A. [a1n, a2,n-1, a3,n-2, . . . ] . . . vedlejší diagonála matice A. Poznámka 4.4. Je-li x = [x1; . . . ; xn], pak zřejmě x = Pn i=1 xii a tedy složky xi jsou dle 3.31 přímo souřadnicemi x v přirozené bázi. Tudíž x = [x]E a zobrazení []E : Fn Fn je identita. DEFINICE 4.5 (Matice se speciální strukturou). Konstantní matice: A = [aij], kde aij = a i, j, neboli matice, jejíž všechny prvky jsou stejné, například 0m,n a 1m,n. Diagonální matice: D = [dij], dij = 0 pro i = j, neboli matice, která má všechny prvky mimo hlavní diagonálu nulové. diag(d), diag(d1, . . . , dn) . . . čtvercová diagonální matice řádu n s hlavní diagonálou d = [d1, . . . , dn]. Symetrická matice: A = [aij], aij = aji i, j, neboli matice se stejnými řádky a sloupci: A(i, :) = A(:, i) i (symetrie vzhledem k hlavní diagonále). Antisymetrická matice: A = [aij], aij = -aji i, j, neboli matice, kde řádky a sloupce mají opačné znaménko: A(i, :) = -A(:, i) i (antisymetrie vzhledem k hlavní diagonále). Jelikož aii = -aii, tak každá antisymetrická matice má nulovou hlavní diagonálu. Hermitovsky symetrická matice (F C): A = [aij], aij = aji i, j, neboli matice, kde řádky a sloupce jsou vůči sobě komplexně sdružené: A(i, :) = A(:, i) i (hermitovská symetrie vzhledem k hlavní diagonále). Jelikož aii = aii, tak každá hermitovsky symetrická matice má na hlavní diagonále reálná čísla. 91 Je-li aij R i, j, pak hermitovská symetrie je zřejmě ekvivalentní se symetrií. Hermitovsky antisymetrická matice (F C): A = [aij], aij = -aji i, j (tj. Re aij = -Re aji a Im aij = Im aji), neboli matice, kde řádky a sloupce se liší znaménkem v reálné části: A(i, :) = -A(:, i) i (hermitovská antisymetrie vzhledem k hlavní diagonále). Jelikož aii = -aii, tak každá hermitovsky antisymetrická matice má na hlavní diagonále ryze imaginární čísla nebo nuly. Je-li aij R i, j, pak hermitovská antisymetrie je zřejmě ekvivalentní s antisymetrií. Horní trojúhelníková matice: U = [uij], uij = 0 pro i > j, neboli matice, která má všechny prvky pod hlavní diagonálou nulové. Dolní trojúhelníková matice: L = [lij], lij = 0 pro i < j, neboli matice, která má všechny prvky nad hlavní diagonálou nulové. Schodovitá matice: S = [sij] matice m × n, která je buď nulová nebo existují přirozená čísla k m a 1 j1 < j2 < . . . < jk n s těmito vlastnostmi: (a) siji = 0 pro 1 i k, (b) sir = 0 pro 1 i k, 1 r < ji, (c) sij = 0 pro k < i m, 1 j n. Snadno jako cvičení se dokáže následující věta. VĚTA 4.6. Nechť S je nenulová schodovitá matice jako v definici 4.5, pak S([1, . . . , k], [j1, . . . , jk]) je její horní trojúhelníková submatice s nenulovými prvky siji na hlavní diagonále. 92 4.2. Základní maticové operace. V hranaté závorce za názvem operace uvádíme její syntaxi v MATLABu. DEFINICE 4.7 (LINEÁRNÍ OPERACE). Operace sečítání matic téhož typu, výběru opačné matice a násobení matice skalárem definujeme po složkách: Sečítání [X = A + B]: X m×n = A m×n + B m×n def. X(i, j) := A(i, j) + B(i, j) i, j. Opačná matice [X = -A]: X m×n = - A m×n def. X(i, j) := -A(i, j) i, j. Násobení matice skalárem a F [X = a*A]: X m×n = a A m×n def. X(i, j) := aA(i, j) i, j. DEFINICE 4.8 (TRANSFORMACE MATICE NA VEKTOR). Operátor vec : Mmn Fmn [A(:)]: vec A m×n := [A(:, 1); A(:, 2); . . . ; A(:, n)]. Tento operátor skládá tedy sloupce matice A pod sebe do sloupcového vektoru. Věta 4.9. Stejně jako v příkladu 3.4(4) tvoří množina všech matic Mm,n opatřená výše uvedenými operacemi vektorový prostor (Mm,n, LF) s nulovou maticí 0m,n jako nulovým prvkem. Operátor vec je zřejmě lineární a dokonce izomorfizmus vektorových prostorů (Mm,n, LF) a (Fmn , LF). Uvážíme-li 3.33 a 3.25(4), pak dim Mm,n = mn, přičemž roli přirozené báze v Mm,n hraje systém matic Eij (i = 1, . . . , m; j = 1 . . . , n). DEFINICE 4.10 (TRANSPOZICE MATIC). Transponovaná matice [X = A.']: X n×m = AT m×n def. X(i, j) := A(j, i) i, j. 93 Tento operátor zaměňuje sloupce a řádky, tj.: X(i, :) = A(:, i) nebo ekvivalentně X(:, i) = A(i, :) i. Hermitovsky (konjugovaně) transponovaná matice (F C) [X = A']: X n×m = A m×n def. X(i, j) := A(j, i) i, j. Tento operátor zaměňuje řádky (resp. sloupce) za komplexně sdružené sloupce (resp. řádky): X(i, :) = A(:, i), resp. ekvivalentně X(:, i) = A(i, :) i. Transpoziční operátory mají zřejmě následující vlastnosti: VĚTA 4.11 (Vlastnosti (hermitovské) transpozice). (1) (A + B)T = AT + BT , (A + B) = A + B . (2) (aA)T = aAT , (aA) = aA a F. (3) 0 m,n = 0T m,n = 0n,m, 1 m,n = 1T m,n = 1n,m, E ij = ET ij = Eji i, j. (4) (AT )T = A, (A ) = A. (5) A reálná A = AT . (6) A je symetrická AT = A, A je hermitovsky symetrická A = A. (7) D diagonální DT = D, zejména platí I n = IT n = In. (8) A horní (dolní) trojúhelníková A i AT jsou dolní (horní) trojúhelníkové matice. (9) a(A + AT ), resp. a(A - AT ) je symetrická, resp. antisymetrická matice pro každou čtvercovou matici A a každé a F. (10) a(A+A ), resp. a(A-A ) je hermitovsky symetrická, resp. hermitovsky antisymetrická matice pro každou čtvercovou matici A a každé a R. (11) Každou čtvercovou matici A lze rozložit na její (hermitovsky) symetrickou a antisymetrickou část: A = 1 2 (A+AT )+ 1 2 (A-AT ), A = 1 2 (A+A )+ 1 2 (A-A ). 94 Poznámka 4.12. Jelikož transpozice transformuje sloupcový (řádkový) vektor na řádkový (sloupcový), platí zejména [x1; . . . ; xn] = [x1, . . . , xn]T . V dalším budeme pro zápis sloupcových vektorů přednostně užívat tvar [x1, . . . , xn]T , který je v matematice standardní (užívání středníku je totiž motivováno pouze syntaxí jazyka MATLAB). DEFINICE 4.13 (MULTIPLIKATIVNÍ OPERACE). Maticové násobení [X = A * B]: X m×p = A m×n . B n×p def. X(i, j) := Pn k=1 A(i, k).B(k, j) i, j. Výše uvedené lze ekvivalentně vyjádřit dvojím způsobem: a) X(:, j) = Pn k=1 A(:, k).B(k, j) j . . . j-tý sloupec X je lineární kombinací sloupců matice A pomocí koeficientů z j-ho sloupce matice B, nebo ekvivalentně: X(:, j) = A.B(:, j). b) X(i, :) = Pn k=1 A(i, k).B(k, :) i . . . i-tý řádek X je lineární kombinací řádků matice B pomocí koeficientů z i-ho řádku matice A, nebo ekvivalentně: X(i, :) = A(i, :).B. Hadamardův součin matic [X = A .* B]: X m×n = A m×n B m×n def. X(i, j) := A(i, j).B(i, j) i, j. Hadamardův součin je tedy operace součinu pro matice téhož typu zavedená po složkách podobně jako v případě sečítání. Kroneckerův (přímý) součin matic [X = kron(A,B)]: X mm ×nn = A m×n B m ×n def. X = [A(i, j)B] i, j. X je tedy matice sestavená z m × n bloků (submatic) A(i, j)B o rozměru m × n . Věta 4.14 (Vlastnosti multiplikativních operací). (1) Asociativita: (A.B).C = A.(B.C), (A B) C = A (B C), (A B) C = A (B C). 95 (2) Distributivita zprava: A.(B + C) = A.B + A.C, A (B + C) = A B + A C, A (B + C) = A B + A C. (3) Distributivita zleva: (A + B).C = A.C + B.C, (A + B) C = A C + B C, (A + B) C = A C + B C. (4) Komutativita: A B = B A. Maticový součin ani Kroneckerův součin nejsou obecně komutativní operace. (5) Jednotkový prvek: Im.A = A.In = A, 1m,n A = A 1m,n = A, 11,1 A = A 11,1 = A, In Im = Imn. (6) (Hermitovská) transpozice součinu: (A.B)T = BT .AT , (A.B) = B .A , (A B)T = AT BT , (A B) = A B , (A B)T = AT BT , (A B) = A B . (7) Pravidlo smíšeného součinu: (A B).(C D) = A.C B.D pro matice kompatibilních rozměrů: A je m × n, C je n × p A.C je m × p, B je m × n , D je n × p B.D je m × p , Odtud: A B je (mm × nn ) a C D je (nn × pp ), takže (A B).(C D) má rozměr (mm × pp ), který je stejný jako rozměr matice A.C B.D. (8) Maticový součin dvou vektorů: a) součin řádkového vektoru se sloupcovým: x = [x1; . . . ; xn], y = [y1; . . . ; yn] xT y = yT x = Pn i=1 xiyi. b) součin sloupcového vektoru s řádkovým: x = [x1; . . . ; xm], y = [y1; . . . ; yn] xyT = [xiyj] Mm,n. (9) Skalární součiny pomocí maticového násobení (F C): x = [x1; . . . ; xn], y = [y1; . . . ; yn] y x = Pn i=1 xiyi = x, y , X = [xij] Mn,p, Y = [yij] Mn,m Y X =: Z Mm,p, 96 kde Z =: [zij], zij = X(:, j), Y (:, i) (S3) = Y (:, i), X(:, j) i, j. Tedy zij je skalární součin j-ho sloupce matice X s i-tým sloupcem matice Y . Speciálně pro X = Y Mn,m je X X =: Z Mm,m, kde Z =: [zij], zij = X(:, j), X(:, i) (S3) = X(:, i), X(:, j) i, j. Matice X X je tzv. Gramova matice. (10) Součin s diagonální maticí: Nechť D = diag(d1, . . . , dm). Pak A =: [r1; . . . ; rm] DA = [d1r1; . . . ; dmrm] a podobně A =: [s1, . . . , sm] AD = [d1s1, . . . , dmsm]. Tedy vynásobení diagonální čtvercovou maticí zleva (zprava) vede k vynásobení řádků (sloupců) odpovídajícími diagonálními prvky. (11) Provedení permutace pomocí maticového násobení: Nechť : J J je permutace transformující přirozeně uspořádanou množinu indexů J := {1, . . . , m} na permutovanou množinu {(1), . . . , (m)} a nechť P je matice, která vznikne z jednotkové matice In stejnou permutací jejích řádků (řádek (i) se přesune na i-tou pozici), tj. P := [(i),j]. Pak A = [r1; . . . ; rm] P .A = [r(1); . . . ; r(m)] a podobně A = [s1, . . . , sm] A.P T = [s(1), . . . , s(m)]. Tedy permutace řádků (sloupců) nějaké matice dosáhneme jejím vynásobením zleva (zprava) maticí, která vznikne z jednotkové matice provedením stejné permutace s jejími řádky (sloupci). Je-li A = D = diag(d1, . . . , dm) diagonální, pak složení téže řádkové a sloupcové permutace zřejmě stejným způsobem permutuje diagonálu v D: P DP T = diag(d(1), . . . , d(m)). (12) Maticový součin dvou trojúhelníkových (diagonálních) matic: Výsledkem maticového součinu dvou dolních (horních) trojúhelníkových matic je opět dolní (horní) trojúhelníková matice. Na diagonále jsou přitom součiny odpovídajích diagonálních prvků. Analogicky pro diagonální matice. Důkaz. S výjimkou (7) jsou všechny vlastnosti bezprostředním důsledkem definic příslušných operací. 97 4.3. Matice jako operátor a hodnost matice. Označení . V konečně rozměrných vektorových prostorech lze báze vždy považovat za množiny lineárně uspořádané svými indexy. Vektory souřadnicového vyjádření operátoru T : V1 V2 z definice 3.35 (dim V1 = n, dim V2 = m, E1 báze ve V1, E2 báze ve V2) pak rovněž můžeme uspořádat jako sloupce v matici, tj. [T]E1,E1 =: [[Te1]E2 , . . . , [Ten]E2 ] je pak maticí rozměru m × n nazývanou maticovou reprezentací operátoru T. Nadále ve všech uvažovaných vektorových prostorech předpokládáme souřadnicové vyjádření v pevně zvolených a lineárně uspořádaných bázích, zejména pak v (Fn , LF) jimi budou přirozené báze E, pokud nebude řečeno jinak. V souladu s definicemi 3.31 a 3.35 tedy budou vynechávány indexy jak ve vyjádření vektorů tak i operátorů: píšeme stručně [x] a [T] = [[Te1], . . . , [Ten]]. VĚTA 4.15. Každá matice T Mm,n určuje předpisem x T .x (x Fn ) tzv. maticový lineární operátor T : (Fn , LF) (Fm , LF). Přitom platí: (1) Je-li M =: [x1, . . . , xk] systém vektorů z Fn uspořádaný do sloupců matice, pak jeho obraz v operátoru T je matice T(M) = [T .x1, . . . , T .xk] 4.13a) = T .M. (2) [T] = [[T1], . . . , [Tn]] = T . (3) R(T ) := R(T) = L(s1, . . . , sn) a R(T T ) = L(r1, . . . , rm), kde ri jsou řádky a sj sloupce matice T . (4) Součinu dvou matic odpovídá složení příslušných maticových operátorů. (5) Identická matice určuje identický operátor. Jestliže F C, pak navíc platí: (6) Každá hermitovsky transponovaná matice T určuje operátor adjungovaný k operátoru určenému maticí T , přičemž R(T ) = L(r1, . . . , rm). V případě reálné matice T hraje tutéž roli transponovaná matice T T . 98 (7) Operátor určený maticí T je samoadjungovaný právě když matice T je hermitovsky symetrická. V případě reálné matice T hraje tutéž roli symetrická matice. (8) Matice T určuje unitárně izomorfní vnoření právě když její sloupce tvoří ortnormální množinu . Je-li T v takovém případě navíc čtvercová, pak určuje unitární operátor a nazývá se proto unitární maticí (resp. ortogonální maticí v případě F R). DŮKAZ. K důkazu linearity stačí ověřit vlastnosti (1) a (2) z věty 3.27: T .(x + y) = T .x + T .y je důsledkem distributivity 4.14(2). T .(x) = T .x plyne přímo z definice 4.13 maticového násobení:Pn k=1 T(i, k)xk = Pn k=1 T(i, k)xk. (1) je opět přímým důsledkem maticového násobení dle 4.13a): totiž j-tý sloupec T(M) je lineární kombinací sloupců T pomocí j-tého sloupce M(:, j) = xj, což je totéž jako T .xj. (2) [T] = [[T1], . . . , [Tn]] 4.4 = [T1, . . . , Tn] (1) = T .In 4.14(5) = T . (3) Podle 4.13a) je T .x lineární kombinací sloupců T pomocí koeficientů vektoru x Fn . Pak R(T ) = {T .x | x Fn } 3.12(2) = L(s1, . . . , sn). Podobně pro R(T T ) a R(T ) v (6). (4) je přímým důsledkem asociativity maticového násobení: (U.T ).x 4.14(1) = U.(T .x). (5) dle 4.14(5) platí In.x = x pro každé x Fn . (6) T .x, y 4.14(9) = y .(T .x) 4.14(1) = (y .T ).x 4.11(4) = (y .T ).x = 4.14(6) = (T .y) .x 4.14(9) = x, T .y . Je-li T reálná, pak T = T T dle 4.11(5). (7) T určuje samoadjungovaný operátor (6) T = T 4.11(6) T je hermitovsky symetrická. (8) ˇ Nechť sloupce T jsou ortonormální. Podle (2) jsou obrazem ONB E a jelikož generují podprostor R(T ) v Fm , tak matice 99 T určuje unitárně izomorfní vnoření dle 3.89. * Nechť naopak matice T určuje unitárně izomorfní vnoření. Pak její sloupce musí být jakožto obraz ONB E také ortonormální dle 3.91(2'). * Je-li T čtvercová, pak počet jejích sloupců je roven jejich délce m, která je dimenzí celého prostoru Fm . Sloupce pak tvoří jeho bázi dle 3.24(4)(ii). T tedy určuje unitární operátor opět dle 3.89. Poznámka 4.16. Podle věty 4.15 není tedy nadále třeba rozlišovat mezi maticí T , příslušným lineárním operátorem T a jeho maticovou reprezentací [T] v přirozené bázi. Poznamenejme však, že týž operátor může mít v jiné než přirozené bázi jinou maticovou reprezentaci. Naopak táž matice může v různých bázích reprezentovat různé operátory. Jak je ukázáno ve větě B.1 z přílohy B, mohou v tomto smyslu matice dokonce reprezentovat i lineární operátory mezi libovolnými abstraktními vektorovými prostory konečné dimenze. DEFINICE 4.17 (HODNOST MATICE). Sloupcovou (řádkovou) hodností matice A Mm,n, nazýváme dimenzi vektorového podprostoru R(A) v Fm (R(AT ) v Fn ), což je dle 4.15(3) právě podprostor generovaný sloupci (řádky) matice A. Podle níže dokázané věty 4.23 je sloupcová i řádková hodnost stejná, nazývá se hodností matice A a značí se r(A). Matice A se nazývá maticí sloupcově (řádkově) plné hodnosti, jestliže r(A) = n (r(A) = m). Matice A se nazývá regulární15 , je-li současně řádkově i sloupcově plné hodnosti. Čtvercová matice, která není regulární se nazývá sin- gulární. 15Regulární matice musí být čtvercová, neboť počet lineárně nezávislých sloupců n nemůže přesáhnout dimenzi prostoru Fm , tj. musí platit n m. Analogicky z lineární nezávislosti řádků dostáváme m n. 100 Poznámka 4.18. S ohledem na větu 3.19 a její důsledek 3.20 udává sloupcová (řádková) hodnost matice počet prvků libovolné báze (neboli maximální lineárně nezávislé podmnožiny) vybrané z generující množiny všech jejích sloupců (řádků). Zejména tedy: a) Matice je sloupcově (řádkově) plné hodnosti právě když všechny její sloupce (řádky) jsou lineárně nezávislé. b) Matice je regulární právě když je čtvercová a má lineárně nezávislé všechny řádky i sloupce15 . V dalším se zaměříme na důkaz tvrzení o shodnosti sloupcové a řádkové hodnosti matice. Zde budou klíčovou roli hrát takové transformace dané matice, které zachovají beze změny její sloupcovou i řádkovou hodnost. Dále budeme psát A B, pokud matice A a B mají shodné sloupcové i řádkové hodnosti. Takto zavedená relace je zřejmě ekvivalencí na množině všech matic nad týmž skalárním polem F. VĚTA 4.19. (1) Každá regulární matice má stejnou sloupcovou a řádkovou hodnost. (2) A je regulární právě když AT je regulární. (3) Nechť A([i1, . . . , ir], [j1, . . . , jr]) je regulární submatice řádu r matice A typu m/n. Pak sloupce A(:, j1), . . . , A(:, jr) i řádky A(i1, :), . . . , A(ir, :) jsou lineárně nezávislé. (4) Jednotková matice je regulární. DŮKAZ. (1) Dle 4.18b) má regulární matice stejný počet řádků (=řádková hodnost) i sloupců (=sloupcová hodnost). (2) Tvrzení je opět důsledkem 4.18b), neboť AT vznikne z A záměnou řádků za sloupce a naopak. (3) Pr k=1 kA(:, jk) = 0m,1 Pr k=1 kA([i1, . . . , ir], jk) = 0r,1 1 = 0, . . . , r = 0 dle 4.18b). Nezávislost řádků se dokáže podobně. (4) Řádky i sloupce jednotkové matice jsou prvky přirozené báze a tudíž jsou lineárně nezávislé. 101 VĚTA 4.20. (1) Matice A je sloupcově plné hodnosti právě když příslušný maticový operátor je izomorfní vnoření. (2) Matice A je řádkově plné hodnosti právě když příslušný maticový operátor je surjektivní. (3) Matice A je regulární právě když příslušný maticový operátor je izomorfizmus. DŮKAZ. (1) Matice A typu m/n je sloupcově plné hodnosti 4.18a) její sloupce jsou lineárně nezávislé 4.13a) [A.x = 0 x = 0] N (A) = {0} 3.30(1) A určuje izomorfní vnoření. (2) Ukážeme ekvivalenci negovaných výroků (viz 1.1(6)): Matice A typu m/n není řádkově plné hodnosti AT nemá lineárně nezávislé sloupce A nemá lineárně nezávislé sloupce (srov. důkaz 4.23) matice A typu n/m není sloupcově plné hodnosti (1) maticový operátor příslušný k A není izomorfní vnoření 3.30(1) 0 = y Fm : A y = 0 3.58(S4) 0 = y Fm : A y, A y = 0 0 = y Fm : Ax, y 3.82,4.15(6) = x, A y = 0 x Fn 0 = y R(A) z Rm - R(A) : z = PR(A)z + y (bez újmy na obecnosti lze za z zvolit rovnou 0 = y R(A) ) maticový operátor příslušný k A není surjektivní. (3) Matice A je regulární 4.17 je současně sloupcově i řádkově plné hodnosti (1),(2) A určuje surjektivní izomorfní vnoření A určuje izomorfizmus. 102 LEMMA 4.21. Sloupcová ani řádková hodnost matice se nemění při jejím násobení zleva (zprava) maticí sloupcově (řádkově) plné hodnosti. DŮKAZ. Nechť R Mp,m je matice sloupcově plné hodnosti m a A nějaká matice typu m/n. Pak a) R(R.A) = {R.(A.x) | x Fn } = {R.y | y R(A)} 4.20(1) R(R.A) je izomorfním obrazem podprostoru R(A) 3.33 dim R(R.A) = dim R(A) matice R.A a A mají stejnou sloupcovou hodnost. b) RT je řádkově plné hodnosti 4.20(2) RT je surjekce R((R.A)T ) 4.14(6) = R(AT .RT ) = {AT .(RT .x) | x Fp } = {AT .y | y R(RT ) = Fm } = R(AT ) dim R((R.A)T ) = dim R(AT ) 4.17 matice R.A a A mají stejnou řádkovou hod- nost. Násobení zprava maticí řádkově plné hodnosti lze transpozicí převést na násobení zleva maticí sloupcově plné hodnosti: (A.R)T = RT .AT . Dle předcházející části mají (A.R)T a AT stejnou řádkovou i sloupcovou hodnost a tedy totéž musí platit i pro A.R a A. VĚTA 4.22 (Skeletní rozklad matice). Nechť A je nenulová matice typu m/n sloupcové hodnosti r, pak existuje matice sloupcově plné hodnosti B typu m/r a matice řádkově plné hodnosti C typu r/n tak, že A = B.C. Přitom C má stejnou řádkovou i sloupcovou hodnost r a platí R(A) = R(B), R(AT ) = R(CT ) a N(A) = N(C). Přitom C lze zvolit tak, aby Ir byla její submaticí. DŮKAZ. Položme B := A(:, [j1, . . . , jr]) rovno submatici v A sestávající z vhodně vybraných sloupců tvořících bázi v R(A). Takový výběr je vždy možný dle 3.20. Tyto sloupce jsou lineárně nezávislé, takže B je dle 4.18a) sloupcově plné hodnosti a přitom R(A) = R(B). Každý sloupec matice A patří do R(A), takže musí být nějakou lineární kombinací bázových sloupců z B. Nechť C je matice, jejíž j-tý 103 sloupec C(:, j) je příslušný vektor souřadnic j-tého sloupec matice A v bázi B. Na základě 4.13a) tedy můžeme psát A = B.C. Vektorem souřadnic k-tého bázového sloupce A(:, jk) je k (k = 1, . . . , r), což znamená, že jednotková matice Ir = C(:, [j1, . . . , jr]) je submaticí matice C. Jelikož Ir je dle 4.19(4) regulární, jsou podle 4.19(3) lineárně nezávislé jak všechny řádky matice C (tj. C je řádkově plné hodnosti), tak i sloupce C(:, j1), . . . , C(:, jr). Ty dokonce tvoří bázi v R(C) = Fr , neboť dim Fr = r (viz 3.24(4)(ii)). Tedy r je nejen řádková, ale i sloupcová hodnost matice C. V části b) důkazu lemmatu 4.21 jsme ukázali R(AT ) = R((B.C)T ) = R(CT ). Platí také N(A) = N(C): B určuje dle 4.20(1) izomorfní vnoření, takže N(B) 3.30(1) = {0} a platí x N(A) 0 = A.x = B.(C.x) C.x N(B) = {0} 0 = C.x x N(C). VĚTA 4.23 (Tvrzení o shodě řádkové a sloupcové hodnosti). Každá matice A má stejnou řádkovou i sloupcovou hodnost, neboli dim R(A) = dim R(AT ). Zejména platí r(A) = r(AT ). V případě F C platí také r(A) = r(A ). DŮKAZ. Nechť A = B.C je skeletní rozklad matice A. Pak A C dle 4.21. Tedy matice A má stejnou řádkovou i sloupcovou hodnost jako C. Ta má však obě hodnosti stejné, takže totéž musí platit pro A. V případě F C rovnost h := r(A) = r(A ) plyne z 3.88(5)(iv). Dá se ale dokázat i přímo jako důsledek faktu, že operace komplexního sdružení zachovává lineární nezávislost: totiž značí-li ri například řádky matice A pak ri jsou sloupce matice A . Přitom Pk j=1 jrij = 0 = 0 = Pk j=1 jrij , kde j = 0 j = 0. V důsledku toho je ri1 , . . . , rih maximální lineárně nezávislá mezi všemi řádky A právě když ri1 , . . . , rih je maximální lineárně nezávislá mezi všemi komplexně sdruženými řádky matice A, tj. mezi všemi sloupci matice A . 104 VĚTA 4.24 (Řádkové/sloupcové úpravy zachovávající hodnost). (1) Hodnost matice se nemění při jejím násobení zleva (zprava) maticí sloupcově (řádkově) plné hodnosti. (2) Součin dvou matic sloupcově (řádkově) plné hodnosti je opět matice sloupcově (řádkově) plné hodnosti. (3) Hodnost matice se nemění při jejím násobení zleva nebo zprava regulární maticí. (4) Součin regulárních matic je regulární matice. (5) Hodnost matice se nemění permutací jejích sloupců nebo řádků. (6) Hodnost matice se nemění vynecháním sloupce (řádku), který je lineární kombinací ostatních sloupců (řádků). (7) Hodnost matice se nemění vynásobením některého sloupce nebo řádku nenulovým skalárem. (8) Hodnost matice se nemění přičtením skalárního násobku některých sloupců (řádků) k jinému sloupci (řádku). (9) Hodnost matice se nemění vynecháním nulových sloupců nebo řádků. DŮKAZ. Vzhledem k 4.23 všechny úvahy prováděné dále se sloupci platí i pro řádky a naopak. Tvrzení (1) již bylo dokázáno v lemmatu 4.21. Tvrzení (2) je speciálním případem (1) stejně jako (3), neboť regulární matice má plnou sloupcovou i řádkovou hodnost. Podobně (4) je důsledkem (3). Tvrzení (2) a (4) lze jinou úvahou odvodit také z věty 4.20: totiž součinu matic sloupcově (řádkově) plné hodnosti, resp. regulárních, odpovídá dle 4.15(4) složení dvou izomorfních vnoření (surjektivních lineárních zobrazení), resp. izomorfizmů, což je opět lineární zobrazení téhož typu. Tvrzení (5) je zřejmé, neboť prostor generovaný řádky nebo sloupci (a tedy ani jeho dimenze) nezávisí na uspořádání množiny generátorů. Tvrzení (6)­(8) jsou elementární úpravy z věty 3.14, které rovněž nemění generovaný podprostor a tedy ani jeho dimenzi. Tvrzení (9) je speciálním případem (6), neboť každý nulový sloupec či řádek lze považovat za nulovou lineární kombinaci ostatních sloupců (řádků). 105 VĚTA 4.25. Čtvercová matice A řádu n je regulární právě když existují čtvercové matice A1, A2 řádu n takové, že A1.A = A.A2 = In. V takovém případě A1 = A2 =: A-1 je jediná, je regulární a určuje maticový operátor inverzní k operátoru určenému maticí A. Matici A-1 nazýváme maticí inverzní k A [v MATLABu: inv(A)]. DŮKAZ. A je regulární 4.20(3) A určuje izomorfizmus. * Jestliže A určuje izomorfizmus, nechť A-1 je maticová reprezenatce inverzního operátoru. Pak A-1 .A = A.A-1 = In dle 4.15(4)(5). * Nechť platí A1.A = A.A2 = In. Protože identický operátor In je prosté a surjektivní zobrazení, platí: A.x = A.y A1.A.x = A1.A.y In.x = In.y x = y A je prosté. Podobně pro každé y máme y = In.y = A.A2.y R(A) A je také surjektivní. Celkem A je tedy izomorfizmus. Přitom A2 = In.A2 = A1.A.A2 = A1.In = A1. Po záměně role A a A-1 vidíme, že A-1 je rovněž regulární a určuje izomorfizmus inverzní k izomorfizmu určenému maticí A. VĚTA 4.26. Každá permutační matice P je regulární a v případě F C je dokonce unitární. DŮKAZ. P řádu n je regulární na základě věty 4.24(5), neboť je dle 4.14(11) permutací řádků jednotkové matice In, která je regulární dle 4.19(4). V případě F C unitárnost matice P pak plyne z 3.90(3): P .x, P .y 4.14(9) = Pn i=1 x(i)y(i) = Pn i=1 xiyi 4.14(9) = x, y , neboť sečítání je komutativní a nezávisí tedy na permutaci sčítanců. VĚTA 4.27. Čtvercová trojúhelníková (diagonální) matice je regulární právě když všechny její prvky na hlavní diagonále jsou nenulové. Důkaz. Vzhledem k 4.19(2) a 4.11(8) stačí tvrzení ověřit například pro horní trojúhelníkovou matici A řádu n. * Nechť aii = 0 pro každé i = 1, . . . , n. Dle 4.18b) a 4.23 stačí ukázat například jen lineární nezávislost řádků. Z rovnosti [0, . . . , 0] = 106 Pn i=1 iA(i, :) postupně dostáváme: 0 = 1a11, 0 = 1a12 + 2a22, . . . , 0 = Pn-1 k=1 kakn + nann. Z 1. rovnice a11 = 0 1 = 0, po dosazení do 2. rovnice analogicky a22 = 0 2 = 0, atd. až z poslední rovnice ann = 0 n = 0. * Předpokládejme, že aii = 0 pro nějaké i. Vezměme nejmenší takové i. Je-li i = 1, pak 1. sloupec je nulový a A tedy není regulární. Je-li i > 1, pak A([1, . . . , i-1], [1, . . . , i-1]) je horní trojúhelníková submatice řádu i - 1 s nenulovou diagonálou a tudíž regulární dle předchozí části. Dle 4.19(3) jsou nezávislé celé sloupce A(:, 1), . . . , A(:, i - 1) a protože A([i, . . . , n], [1, . . . , i]) je nulová submatice v důsledku aii = 0, je sloupec A(:, i) lineární kombinací prvých i - 1 sloupců, tj. sloupce A jsou závislé a A opět nemůže být regulární. Diagonální matice je speciálním případem trojúhelníkové matice. DŮSLEDEK 4.28 (Vlastnosti inverzních matic). Nechť A, B jsou dvě čtvercové matice řádu n. Pak (1) A je regulární právě když AT je regulární. V takovém případě platí (AT )-1 = (A-1 )T . (1') V případě F C je obdobně A regulární právě když A je regulární. V takovém případě platí (A )-1 = (A-1 ) . (2) A, B regulární (A.B)-1 = B-1 .A-1 . (3) Je-li P permutační matice určená permutací dle 4.14(11), pak P -1 = P -1 = P T . (4) Je-li A =: [aij] regulární dolní (horní) trojúhelníková matice řádu n, pak A-1 je rovněž dolní (horní) trojúhelníková matice s prvky a-1 11 , . . . , a-1 nn na hlavní diagonále. Je-li A dokonce diagonální, pak A-1 je rovněž diagonální. Důkaz. (1) AT regulární 4.19(2) A je regulární 4.25 A-1 .A = A.A-1 = In 4.14(6) AT .(A-1 )T = (A-1 )T .AT = IT n 4.11(7) = In 4.25 (AT )-1 = (A-1 )T . 107 (1') Pro A se ukáže podobně. S ohledem na 4.15(6) plyne také přímo z 3.88(5)(vi). (2) Plyne z toho, že inverzní zobrazení se skládají v opačném pořadí. Jiné odvození se opět může opírat o větu 4.25: B-1 .A-1 .A.B = B-1 .B = In a analogicky A.B.B-1 .A-1 = A.A-1 = In. (3) Dle 4.14(11): P = [(i),j] P T = [j,(i)] = [-1(j),i], neboť j = (i) právě když -1 (j) = -1 ((i)) = i. Matice P T tedy reprezentuje operátor inverzní permutace -1 , tj. P -1 = P T . Vezmeme-li v 4.14(11) za diagonální matici jednotkovou matici D = In, pak D se nezmění při permutaci samých jedniček na diagonále. Platí tedy P .P T = P .In.P T = In a po záměně za -1 si matice P a P T rovněž zamění roli, takže také platí P T .P = In a P -1 4.25 = P T . (4) Nechť A =: [aij] je například dolní trojúhelníková regulární matice řádu n. Dle 4.27 jsou aii = 0 pro i = 1, . . . , n. Podle 4.25 musí pro matici X =: [xj,k] inverzní k A platit In = A.X. Srovnáváním naddiagonálových prvků v i-tém řádku a k-tém sloupci na levé a pravé straně této rovnice dostáváme postupně pro i = 1, . . . , n a k i: 1k = Pn j=1 a1jxjk = a11x1k 1 = a11x11 a 0 = a11x1k pro k > 1 x11 = a-1 11 a x1k = 0 pro k > 1. Analogicky pro i = 2: 2k = Pn j=1 a2jxjk = a21x1k + a22x2k = a22x2k x22 = a-1 22 a x2k = 0 pro k > 2, atd. Případ horní trojúhelníkové matice převedeme na předchozí situaci transpozicí užitím 4.11(8) a 4.14(6): Podle 4.25 musí také platit In = X.A, odtud In = IT n = (X.A)T = AT .XT , kde AT je dolní trojúhelníková, takže dle předchozí části je také XT dolní trojúhelníková a tedy X horní trojúhelníková. Diagonálové prvky se transpozicí také nemění. Matice A je diagonální právě když je současně horní i dolní trojúhelníková, takže její inverze musí také mít obě vlastnosti, tj. musí být diagonální. 108 VĚTA 4.29 (Zjišťování hodnosti). Nechť A je matice typu m/n a B typu n/p. Pak platí: (1) r(A) min(m, n). (2) r(A.B) min(r(A), r(B)). Je-li A sloupcově plné hodnosti, resp. B řádkově plné hodnosti, pak nastane rovnost a r(A.B) = r(B), resp. r(A.B) = r(A). (3) Hodnost nenulové matice A je rovna největšímu řádu nějaké její regulární submatice. (4) r(A) = n - dim N(A). (5) V případě F C platí r(A.A ) = r(A .A) = r(A) = r(A ) a speciálně je-li A sloupcově, resp. řádkově plné hodnosti, pak A .A, resp. A.A je regulární. (5') V případě F R platí r(A.AT ) = r(AT .A) = r(A) = r(AT ) a speciálně je-li A sloupcově, resp. řádkově plné hodnosti, pak AT .A, resp. A.AT je regulární. Důkaz. (1) Hodnost matice odpovídá maximálnímu počtu lineárně nezávislých sloupců (řádků) matice a nemůže proto přesáhnout dimenzi prostoru, do něhož náleží, tj. musí platit r(A) m a současně r(A) n. (2) R(A.B) R(A) 3.24(3) dim R(A.B) dim R(A) 4.17 r(A.B) r(A). Užitím této nerovnosti na transpozici součinu dostaneme i druhou nerovnost: r(A.B) 4.23 = r((A.B)T ) = r(BT .AT ) r(BT ) 4.23 = r(B). Je-li B řádkově plné hodnosti, pak r(A.B) 4.24(1) = r(A) = min(r(A), r(B)), neboť dle (1) je r(A) min(m, n) n = r(B). Analogicky pro A sloupcově plné hodnosti: r(A.B) 4.24(1) = r(B) = min(r(A), r(B)), neboť dle (1) máme r(B) min(n, p) n = r(A). 109 (3) A nenulová existuje alespoň jeden nenulový prvek aij určující regulární submatici [aij] řádu 1. Označíme-li r největší řád nějaké regulární submatice, pak tedy r 1 a dle 4.19(3) lze v matici vybrat r nezávislých řádků (resp. sloupců), které lze doplnit na bázi o h := r(A) prvcích. Platí tedy h r. Naopak z matice A hodnosti h lze vybrat submatici B o h lineárně nezávislých sloupcích (sloupcová báze), která má sloupcovou plnou hodnost h. Dle 4.23 je i řádková hodnost matice B rovna h, takže z B lze vybrat h nezávislých řádků. Výsledná submatice řádu h má rovněž h nezávislých řádků (a tedy i sloupců) a je proto regulární. Protože r udává největší řád takové submatice, platí i opačná nerovnost h r a celkem tedy h = r. Takto zkonstruovaná submatice má pak největší možný řád h. (4) Nechť A = B.C je skeletní rozklad podle věty 4.22, r := r(A). Nechť Q je vhodná permutační matice (viz 4.14(11)), kterou přeuspořádáme sloupce C tak, aby jednotková matice Ir obsažená v C byla jejím prvním blokem: C.Q =: [Ir, C ]. Stejným způsobem přeuspořádáme vektory x Fn : QT .x =: [y; t], kde výsledný vektor rozdělíme na dva sloupcové bloky y Fr a t Fn-r . Pak dostáváme: x N(A) 4.22 = N(C) C.x = 0 4.28(3) C.Q.QT .x = 0 [Ir, C ].[y; t] = 0 Ir.y + C .t = 0 y = -C .t [y; t] = [-C ; In-r] | {z } =:C .t x = Q.[y; t] R(Q.C ). Tedy N(A) = R(Q.C ) dim N(A) = dim R(Q.C ) = r(Q.C ) 4.24(5) = r(C ) (3) = n - r, neboť C obsahuje regulární submatici In-r, která je maximálního možného řádu, protože n - r je sloupcový rozměr matice C . (5) Rovnost hodností plyne ihned jako důsledek obecného tvrzení 3.88(5)(iii),(iv). Můžeme ji však dokázat elementárnějším postupem i přímo. Nerovnost r(A .A) r(A) =: r 110 platí dle (2). Nechť 0 = (A .A).c je nějaká nulová lineární kombinace (vybraných) sloupců matice A .A s koeficienty c (cj = 0 pro nevybrané sloupce). Pak 0 = c .A .A.c 4.14(1)(6) = (A.c) .(A.c) 4.14(9) = A.c, A.c 3.62(S9) = A.c 2 , takže dle axiomu normy 3.54(N3) je A.c = 0 a tedy A.c je také nulovou lineární kombinací odpovídajících sloupců v A. Zde lze však vybrat r lineárně nezávislých sloupců což si vynutí c = 0, takže odpovídající sloupce v A .A budou také lineárně nezávislé a tudíž r(A .A) r = r(A). Všimněme si, že jsme vlastně ukázali netriviální implikaci c N (A .A) c N(A), neboli N(A .A) N(A). Jelikož opačná inkluze je triviální (Ac = 0 A .Ac = 0), tak máme N(A .A) = N(A), kdy r(A .A) = r(A) dostaneme také jako přímý důsledek rovnosti (4), neboť obě matice mají stejný počet sloupců n. V případě A sloupcově plné hodnosti je A .A čtvercová řádu n téže hodnosti n = r a tudíž regulární. Záměnou rolí A a A dostáváme také identitu r(A.A ) = r(A .A ) = r(A ), takže tvrzení je plně dokázáno, neboť r(A) = r(A ) platí podle věty 4.23. (5') Je důsledkem (5), neboť v případě reálné matice je A = AT dle 4.11(5). DŮSLEDEK 4.30. Hodnost schodovité matice je rovna počtu jejích nenulových řádků (tzv. schodů). Důkaz. Pro nulovou matici je tvrzení zřejmé. Nechť S typu m/n je schodovitá matice s k nenulovými řádky, k 1. Vynecháme-li m - k nulových řádků, dostaneme dle 4.24(9) matici S typu k/n stejné hodnosti: r(S) = r(S ). Podle 4.6 matice S obsahuje horní trojúhelníkovou submatici řádu k s nenulovou diagonálou, která je regulární dle 4.27. Jelikož řádkový rozměr matice S je k, je tato submatice maximální taková a tedy celkem r(S) = r(S ) 4.29(3) = k. 111 PŘÍKLAD 4.31. Vlastnost (5') neplatí obecně pro matice s prvky z nereálného skalárního pole F. Jednoduchý protipříklad najdeme již v případě komplexních matic (F = C): Uvažujme matici A = 1 i -i 1 , kde [-i, 1] = -i[1, i] r(A) = 1. Totiž za sloupcovou (řádkovou) bázi (maximální lineárně nezávislou podmnožinu) matice A lze v tomto případě zvolit jednoprvkovou množinu tvořenou libovolným sloupcem (řádkem), neboť každá jednoprvková množina obsahující nenulový vektor je triviálně lineárně nezávislá dle 3.3(L5). Pak dostáváme A.AT = 1 i -i 1 . 1 -i i 1 = 0 0 0 0 = r(A.AT ) = 0. AT .A = 1 -i i 1 . 1 i -i 1 = 0 0 0 0 = r(AT .A) = 0. Podstata problému tkví v tom, že prvky například matice AT .A jsou sice konstruovány podobně jako u Gramovy matice v 4.14(9), tj. jsou ve tvaru výrazů x1y1 + x2y2, kde x a y jsou vybrány ze sloupců A. Tyto výrazy jsou skalárními součiny v R, nikoliv avšak v C, kde ztrácíme platnost axiomu (S3) a tím i ortogonalitu: například pro sloupce A máme [1, -i], [i, 1] = 1.i + (-i).1 = 1.(-i) + (-i).1 = -2.i = 0, i když 1.i+(-i).1 = 0. Vzhledem k 3.68 tak nemáme garantovánu ani lineární nezávislost, kterou jsme v tomto příkladu skutečně ztratili. Ztratili jsme takto dokonce i vlastnost ortogonálního rozkladu dle 3.88(5)(i), přestože 3.88(5)(v) platí dle 4.29(4): dim N(A) = dim C2 r(A) = 2 - 1 = 1. Totiž C2 nemůže být ortogonálním součtem podprostorů R(AT ) a N(A), neboť není ani jejich přímým součtem: 1. sloupec v A.AT je roven A.[1, i]T = [0, 0]T [1, i]T N (A). Současně ale také AT .[1, 0]T = [1, i]T [1, i]T R(AT ) a tedy 0 = [1, i]T R(AT ) N (A) 3.43 R(AT ) + N(A) = R(AT ) N(A). 112 POZNÁMKA 4.32 (Maticový zápis bilineární a kvadratické formy). Nechť A =: [aij] je čtvercová matice řádu n a x =: [x1; . . . ; xn], y =: [y1; . . . ; yn] vektory z Fn . Bilineární forma určená maticí A je funkce Fn ×Fn F definovaná vztahem: yT .A.x = nX i=1 ( nX j=1 aijxj)yi = nX i=1 nX j=1 aijyixj, kde výraz v závorce je i-tá složka vektoru A.x. Pro x = y bilineární forma přejde v zobrazení Fn F a nazývá se kvadratickou formou určenou maticí A: xT .A.x = nX i=1 nX j=1 aijxixj. V případě F R je můžeme vzhledem k 4.14(9) a 4.15(6) vyjádřit také pomocí skalárního součinu: yT .A.x = A.x, y , resp. xT .A.x = A.x, x , což je v souladu s poznámkou 3.84. V komplexním případě F C užijeme A místo AT , takže dostáváme vyjádření: A.x, y = y .A.x = nX i=1 nX j=1 aijyixj, A.x, x = x .A.x = nX i=1 nX j=1 aijxixj. Matice A se nazývá pozitivně semidefinitní (pozitivně definitní), jestliže určuje operátor, který je pozitivní (striktně pozitivní) ve smyslu poznámky 3.84. V takovém případě kvadratická forma nabývá pouze reálných nezáporných hodnot (kladných hodnot pro x = 0) a A je hermitovsky symetrická matice. 113 4.4. Převod na schodovitý tvar a lu-rozklad. Věta 4.29 sice uvádí některé užitečné vlastnosti hodnosti matic umožňující její zjištění v některých speciálních případech, nikoliv však obecně pro libovolnou zadanou matici A, řekněme typu m/n. V tomto odstavci odvodíme univerzální algoritmus tzv. Gaussovy eliminace, který požadovanou úlohu beze zbytku řeší a navíc dává konstrukci báze obou prostorů svázaných s maticí (operátorem) A, tj. jak oboru hodnot R(A), tak jádra N(A). Jako jeho důsledek obdržíme navíc tzv. LU-rozklad matice A, který představuje jeden z mnoha možných skeletních rozkladů. Na rozdíl od důkazu věty 4.22, který byl nekonstruktivní, Gaussova eliminace poskytuje (nikoliv obecně jednoznačnou) konstrukci takového rozkladu. Princip Gaussovy eliminace spočívá v postupném provádění elementárních řádkových úprav16 , které nemění hodnost matice. V zásadě vystačíme pouze s úpravami typu (5) a (8) z věty 4.24 a to dokonce ve zjednodušené podobě: záměna dvou řádků a přičtení skalárního násobku nějakého řádku k jinému řádku. V dalším zkonstruujeme speciální regulární transformační matice, kterými budeme danou matici postupně násobit zleva -- viz též 4.24(3). Výsledkem bude převod zadané matice A na schodovitý tvar, jehož hodnost (shodná s r(A)) se snadno zjistí podle 4.30. DEFINICE 4.33 (Transformační matice pro některé řádkové úpravy). Nechť m je řádkový rozměr transformované matice A. (1) Záměna i-ho a j-ho řádku: Nechť := ij značí permutaci provádějící záměnu indexu i a j. Pak zřejmě = -1 . Označíme-li P i,j := P odpovídající permutační matici řádu m, pak P i,j = P -1 i,j 4.28(3) = P T i,j a tedy při násobení touto maticí zleva (zprava) dochází k záměně i-tého a j-tého řádku (sloupce) -- viz 4.14(11). V případě i = j je P ii = Im identita. (2) Přičtení -násobku j-ho řádku k i-tému (i = j): 16Obdobně je možno provádět sloupcové úpravy. Jelikož je lze transpozicí matice vždy převést na řádkové úpravy, upřednostňujeme nadále tento případ. 114 Nechť pro F značí R () ij := Im + Eij čtvercovou matici řádu m. Tato matice je trojúhelníková s jednotkovou diagonálou, prvkem v i-tém řádku a j-tém sloupci a nulami všude jinde. Zřejmě platí R ()T ij = R () ji , přičemž při násobení maticí R () ij zleva (maticí R () ji zprava) dochází k přičtení -násobku j-tého řádku (sloupce) k i-tému řádku (sloupci). (3) Vynásobení i-ho řádku skalárem = 0: Podle 4.14(10) je příslušnou transformační maticí diagonální matice D () i := diag(1, . . . , 1, , 1, . . . , 1), kde je i-tým prvkem na jinak jednotkové diagonále. Věta 4.34 (Vlastnosti transformačních matic P ij, R () ij a D () i ). Všechny uvedené matice jsou regulární a platí pro ně: (1) Nechť index j je pevný a i F je m skalárů (i = 1, . . . , m), kde j = 0. Pak R () j := R (1) 1j . . . R (m) mj je jednotková matice, k jejímuž j-tému sloupci je přičten vektor := [1, . . . , m]T . Tato matice realizuje složení m řádkových úprav: k i-tému řádku je přičten i-násobek j-tého řádku pro i = 1, ..., m. Na pořadí provádění těchto úprav (tj. na pořadí násobení matic R (i) ij ) přitom nezáleží. Zřejmě = 0 R () j = Im. (2) Výsledná matice R () j je regulární a pokud i = 0 pro i j (i j), pak je navíc dolní (horní) trojúhelníková. V takovém případě budeme obvykle psát L () j (U () j ) místo17 R () j . Inverzní matice je určena vztahem: (R () j )-1 = R (-) j . Je tedy téhož typu, kde pouze skaláry mají obrácené znaménko. Zejména také dostáváme (R () ij )-1 = R (-) ij , neboť R () ij je speciálním případem matice R () j , kde i = a k = 0 pro k = i. (3) Pro libovolné tři indexy i, j, k {1, . . . , m}, i = j, k = j platí P ik.R () j = R (P ik.) j .P ik. 17Značení je dáno zvyklostmi anglosaské odborné literatury: písmeno L, resp. U je odvozeno od počátečních písmen slov Lower a Upper. 115 Tedy matice P ik a R () j jsou při násobení záměnitelné až na pořadí skalárů ve vektoru , kde dojde k záměně jeho složek i a k. (4) L := L (1) 1 .L (2) 2 . . . L (m) m a U := U (m) m .U (m-1) m-1 . . . U (1) 1 je po řadě regulární dolní a horní trojúhelníková matice s jednotkovou diagonálou, kde L(i, j) = j(i) a U(i, j) = j(i) pro každé i = j, neboli sloupce v L, resp. U odpovídají po řadě příslušným sloupcům matic L (j ) j , resp. U (j ) j . Poznamenejme, že na rozdíl od (1) v tomto případě již záleží na pořadí provádění úprav (tj. na pořadí násobení matic L (j ) j , resp. U (j ) j ). (5) D (1) 1 .D (2) 2 . . . D (m) m = diag(1, 2, . . . , m) je při všech nenulových i = 0 regulární diagonální matice. Tato matice realizuje složení m řádkových úprav: i-tý řádek je vynásoben skalárem i pro i = 1, ..., m. Na pořadí provádění těchto úprav (tj. na pořadí násobení matic D (i) i ) přitom nezáleží. Důkaz. Pro větší názornost zobrazme nejprve strukturu matice R () j : R () j = 2 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 4 1 . . . 0 1 0 . . . 0 . . . 0 ... ... ... ... ... ... ... ... ... 0 . . . 1 j-1 0 . . . 0 . . . 0 0 . . . 0 1 0 . . . 0 . . . 0 0 . . . 0 j+1 1 . . . 0 . . . 0 ... ... ... ... ... ... ... ... ... 0 . . . 0 i 0 . . . 1 . . . 0 ... ... ... ... ... ... ... ... ... 0 . . . 0 m 0 . . . 0 . . . 1 3 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 5 . Všechny uvažované matice jsou buď trojúhelníkové nebo diagonální s jednotkovou diagonálou, případně jsou součinem takových matic. Podle 4.27 a případně i s ohledem na 4.24(4) jsou tedy regulární. 116 Součin dolních (horních) trojúhelníkových matic je opět matice téhož typu dle 4.14(12). Strukturu matic ve tvaru součinu si čtenář snadno odvodí jako snadné cvičení provedením tohoto součinu, resp. příslušných řádkových úprav při postupném násobení zprava doleva. Při důkazu tvrzení (2) stačí podobně na základě věty 4.25 ověřit přímým vynásobením platnost identit: R (-) j .R () j = R () j .R (-) j = Im. Poznámka 4.35. Je-li A matice typu m/n, pak s uvážením 4.14(8)b) snadno nahlédneme, že R () j .A = A+.A(j, :). Maticový výraz vpravo tak představuje alternativní způsob provedení stejných řádkových úprav v matici A, jaké odpovídají násobení maticí R () j zleva. V některých situacích může být tento druhý způsob z hlediska programové implementace efektivnější, neboť není třeba dopředu vytvářet a do paměti ukládat matici R () j , která je řídká (má velké množství nulových prvků), což může vést k plýtvání pamětí. VĚTA 4.36 (Převod matice na schodovitý tvar Gaussovou elimi- nací18 ). Každá matice se dá konečným počtem řádkových elementárních transformací typu 4.33(1),(2) převést na matici ve schodovitém tvaru o stejné hodnosti. DŮKAZ. Důkaz této věty je konstruktivní, to znamená, že dává postup řešení této úlohy, který je možno použít v konkrétním případě. Tento postup bývá nazýván Gaussův algoritmus a spočívá v následujících krocích pro matici A =: [aij] typu m/n: (G0) Jestliže matice A je nulová, již je ve schodovitém tvaru a jsme hotovi. (G1) V opačném případě nechť j1 je index prvního nenulového sloupce. Existuje tedy k N, 1 k m tak, že akj1 = 0. Řádek k-tý vyměňme s prvním řádkem, pokud k = 1. Tím dostaneme matici B =: [buv] typu m/n takovou, že sloupce 1, 2, . . . , j1 - 1 jsou nulové a b1j1 = 0. 18 viz též skripta [KaSk:V9.3 s.80-81] nebo [Šik:V1.26 s.9-10] 117 (G2) V matici B ke každému u-tému řádku (2 u m) přičteme první řádek vynásobený číslem - buj1 b1j1 . Dostaneme matici C = [cuv] typu m/n takovou, že sloupce 1, 2, . . . , j1 - 1 jsou nulové, c1j1 = 0 a cuj1 = 0 pro každé 2 u m. Tím je určen první řádek hledané schodovité matice. Není-li matice C ještě ve schodovitém tvaru, aplikujeme kroky (G1) a (G2) na submatici C([2, . . . , m], :). Po jejich provedení bude druhý řádek celé matice druhým řádkem hledané schodovité matice, atd. Tímto způsobem postupujeme tak dlouho, až obdržíme matici ve schodovitém tvaru, tj. jakmile buď byl proveden maximální možný počet kroků m a nebo všechny zbývající řádky jsou již nulové. Důsledek 4.37 (Maticový zápis Gaussovy eliminace). Nechť A je matice typu m/n, r(A) = r. Pak Gaussova eliminace rekurentně konstruuje posloupnost matic A =: A0 A1 Ar =: S téže hodnosti, kde S =: [sij] je schodovitá matice s r nenulovými řádky (schody) a horní trojúhelníkovou submaticí řádu r s diagonálovými prvky siji = 0, 1 j1 < < jr n (viz 4.6). Nechť pro i {1, . . . , r} byla již zkonstruována matice Ai-1. Pak Ai dostaneme ve dvou krocích takto: (G1) Záměna i-tého a k-ho řádku v matici Ai-1: Bi := P i.Ai-1 =: [buv], kde P i := P ik pro vhodné i k m takové, že Ai-1(k, ji) = 0 (k závisí na i). Takto zajistíme biji = 0. (G2) Eliminace koncové části ji-tého sloupce v matici Bi: Ai := L (i) i .Bi, kde i = [0, . . . , 0 | {z } i× , - bi+1ji biji , . . . , - bmji biji ]T . Sloučením obou kroků do jednoho dostáváme rekurentní vztah: Ai = L (i) i .P i.Ai-1 pro i = 1, . . . , r. Sloučením všech kroků, pak dostáváme: 118 R.A = S, kde R := L (r) r .P r . . . L (2) 2 .P 2.L (1) 1 .P 1 je regulární matice řádu m realizující provedení všech elementárních úprav převodu na schodovitý tvar. Důkaz. Transformační vztahy jsou důsledkem 4.33(1) a 4.34(1)(2), kde transformační matice R (i) i = L (i) i je skutečně dolní trojúhelníková, neboť i(u) = 0 pro u i. Volba i(u) = - buji biji pro i+1 u m pak zajistí požadovanou eliminaci koncové části ji-tého sloupce, neboť přičtením i(j)-tého násobku i-tého řádku matice Bi k jejímu u-tému řádku dostáváme: a) ji-tý sloupec: Ai(u, ji) = buji + i(u)biji = buji + (- buji biji )biji = 0. b) Úvodní sloupce pro 1 v < ji: Ai(u, v) = buv + i(u)biv = 0 zůstávají nulové, neboť buv = biv = 0 byly nulové již z předchozích kroků. Regularita výsledné transformační matice R je důsledkem 4.24(4) a regularity všech zúčastněných matic. DŮSLEDEK 4.38 (LU-rozklad matice). Platí L.S = P .A, kde L =: [lui] je čtvercová dolní trojúhelníková matice řádu m s jednotkovou diagonálou (lii = 1 pro i = 1, . . . , m) a pod hlavní diagonálou s prvky lui = 8 < : buji biji pro i = 1, . . . , r 0 pro i = r + 1, . . . , m , kde u = i+1, . . . , m a buji jsou prvky z ji-tého sloupce matice Bi := Ai-1 ze všech r kroků (G1) provedených během Gaussovy eliminace předem permutované matice P .A, přičemž P = P r . . . P 2.P 1 je matice permutace vzniklé složením všech r řádkových záměn provedených v krocích (G1) během Gaussovy eliminace původní nepermutované matice A. 119 ˇ Označíme-li L := L(:, [1, . . . , r]) a S = S([1, . . . , r], :) submatice po řadě v L, resp. S tvořené jejich prvými r sloupci, resp. řádky, dostáváme modifikovaný rozklad L .S = P .A. * Je-li speciálně A čtvercová a regulární, pak L = L a S = S =: U, kde U je horní trojúhelníková matice s nenulovou diagonálou, takže dostáváme rozklad L.U = P .A, který je obvykle nazýván LU-rozkladem matice A. V dalším takto budeme nazývat i kterýkoli z výše uvedených obecnějších rozkladů L.S = P .A nebo L .S = P .A, které jsou platné pro libovolnou matici A. Důkaz. Matice L má tuto strukturu: L = 2 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 4 1 0 . . . 0 0 . . . 0 b2j1 b1j1 1 . . . 0 0 . . . 0 ... ... ... ... ... ... ... brj1 b1j1 brj2 b2j2 . . . 1 0 . . . 0 br+1j1 b1j1 br+1j2 b2j2 . . . br+1jr brjr 1 . . . 0 ... ... ... ... ... ... ... bmj1 b1j1 bmj2 b2j2 . . . bmjr brjr 0 . . . 1 3 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 5 . * Konstrukce rozkladu L.S = P .A: Dle 4.37 platí S = R.A, kde R := L (r) r .P r . . . L (2) 2 .P 2.L (1) 1 .P 1. Užijme opakovaně 4.34(3) pro postupné provádění záměn: P 2.L (1) 1 = L (P 2.1) 1 .P 2, P 3.L (2) 2 = L (P 3.2) 2 .P 3, P 3.L (P 2.1) 1 = L (P 3.P 2.1) 1 .P 3, atd. Po jejich provedení obdržíme: S = L (r) r .L (P r.r-1) r-1 . . . L (P r...P 3.2) 2 .L (P r...P 2.1) 1 . P r . . . P 1 | {z } P .A. Odtud: L (r) r .L (P r.r-1) r-1 . . . L (P r...P 3.2) 2 .L (P r...P 2.1) 1 -1 .S = P .A. 120 Stačí jen upravit inverzi ze součinu matic vlevo, kterou označíme L: L := L (r) r .L (P r.r-1) r-1 . . . L (P r...P 3.2) 2 .L (P r...P 2.1) 1 -1 4.28(2) = L (P r...P 2.1) 1 -1 . L (P r...P 3.2) 2 -1 . . . L (P r.r-1) r-1 -1 . L (r) r -1 4.34(2) = L (-P r...P 2.1) 1 .L (-P r...P 3.2) 2 . . . L (-P r.r-1) r-1 .L (-r) r . L (0) r+1 . . . L(0) m | {z } =Im . Matice L má dle 4.34(4) požadovanou strukturu. K tomu stačí jen uvážit, že permutace P r . . . P i+1 prováděné s vektory koeficientů i z úpravy matice A přesně odpovídají nepermutovaným vektorům i koeficientů z úpravy předem permutované matice P .A, kdy krok (G1) vynecháváme, neboť pro každé i = 1, . . . , r již máme předem zajištěno Ai-1(i, ji) = 0, tj. P i = Im a tedy Bi := Ai-1 pro každé i = 1, . . . , m. * L .S = L.S: Stačí uvážit, že posledních m - r řádků schodovité matice S je nulových, takže při násobení maticí L zleva na jejích hodnotách v posledních m - r sloupcích nezáleží (jsou během součinu násobeny nulami). * Případ regulární čtvercové matice A: V tomto případě m = r, takže L = L a S = S . Navíc také n = r, takže S je čtvercová řádu r a dle 4.6 současně obsahuje regulární horní trojúhelníkovou submatici U téhož řádu r. To může nastat, jen když S = U. DŮSLEDEK 4.39 (Konstrukce báze prostoru R(A)). Nechť A je matice typu m/n a A = L.S = L .S je její LU-rozklad, kde U = S (:, [j1, . . . , jr]) je regulární horní trojúhelníková submatice v S . Pak sloupce matice L tvoří bázi prostoru R(A) a rovněž A(:, j1), . . . , A(:, jr) tvoří jeho sloupcovou bázi. DŮKAZ. Sloupce L jsou lineárně nezávislé, neboť jsou vybrány z nezávislé množiny sloupců regulární matice L, tvoří tak bázi v R(L ) a současně L je sloupcově plné hodnosti. Dále A(:, [j1, . . . , jr]) = L .S (:, [j1, . . . , jr]) = L .U 4.24(1) 121 r(A(:, [j1, . . . , jr])) = r(S) = r 4.36 = r(A) sloupce A(:, j1), . . . , A(:, jr) jsou lineárně nezávislé a tvoří proto podle 3.24(4)(ii) bázi prostoru R(A), neboť dim R(A) = r. Z vyjádření A = L .S současně plyne (viz 4.13a)), že každý sloupec matice A (tj. každý z generátorů prostoru R(A)) je lineární kombinací sloupců L , tj. patří do R(L ). Pak A(:, j1), . . . , A(:, jr) musí také tvořit bázi v R(L ) a oba prostory jsou proto stejné. DŮSLEDEK 4.40 (Konstrukce báze prostoru N(A)). Nechť A je matice typu m/n a A = L .S je její LU-rozklad, kde U = S (:, [j1, . . . , jr]) je regulární horní trojúhelníková submatice v S . Nechť S je submatice v S tvořená zbývajícími n - r sloupci nezařazenými do matice U. Buď Q vhodná permutační matice, kterou přeuspořádáme sloupce S tak, aby U byla prvním blokem a S druhým blokem: S .Q = [U, S ]. Pak n - r sloupců blokově sestavené matice N =: Q.[-U-1 .S ; In-r] Mn,n-r tvoří bázi prostoru N(A). DŮKAZ. Všech n - r sloupců matice N je zřejmě lineárně nezávislých, neboť N obsahuje regulární submatici maximálního možného řádu n-r (viz 4.29(3)). Podle téže věty dim N(A) 4.29(4) = n-r, takže stačí ukázat, že každý sloupec matice N patří do N(A). Podle 4.15(1) je tedy třeba ověřit, že A.N je nulová matice: A.N = L .S Q.QT .N = L .[U, S ].QT .Q.[-U-1 .S ; In-r] = L .[U, S ].[-U-1 .S ; In-r] = L .(-U.U-1 .S + S .In-r) = L .(-S + S ) = 0n,n-r. Poznámka 4.41. (1) Při konstrukci báze prostoru N(A) dle 4.40 se inverzní matice U-1 snadno spočte postupem naznačeným v důkazu 4.28(4). V rovnici Ir = X.U postupně počítáme neznámé prvky matice X := U-1 srovnáváním prvého sloupce vlevo a vpravo (tím spočteme prvý sloupec X), pak prvého řádku vlevo a vpravo (tím dopočteme prvý řádek X), pak podobně pro druhý sloupec a řádek, atd. Alternativně můžeme také 122 řešit maticovou rovnici U.X = -S postupně pro jednotlivé sloupce: U.X(:, j) = -S (:, j), což je vzhledem k trojúhelníkové struktuře matice U snadné (podrobněji bude probráno později v odstavci věnovaném řešení systémům lineárních rovnic). Obdržíme tak matici X = -U-1 .S , což je právě horní blok ve vyjádření řádkově permutované matice N. (2) LU-rozklad A = L .S není nic jiného než speciální případ skeletního rozkladu 4.22, kde L hraje roli matice B a S hraje roli matice C. Porovnání obou rozkladů ukazuje, že se liší ve dvou aspektech: * Roli regulární jednotkové submatice řádu r v B nyní hraje horní trojúhelníková submatice U řádu r v S . Konstrukce prostoru N(A) popsaná v důkazu tvrzení 4.29(4) koresponduje s konstrukcí ze 4.40: jestliže U nahradíme jednotkovou maticí Ir, tak horní blok -U-1 .S ve vyjádření N přejde v matici -I-1 n .S = -S , která koresponduje s maticí -C . Nevýhodou je nutnost vypočítat -U-1 .S , což dle (1) odpovídá řešení maticové rovnice U.X = -S . * Konstrukce LU-rozkladu je konstruktivní, zatímco důkaz 4.22 nikoliv: u konkrétní matice totiž obvykle není snadné určit její sloupcovou bázi pro konstrukci B. Teoreticky bychom mohli sice využít 4.39. Mnoho bychom si však nepomohli, protože nalezení C by vyžadovalo řešit vzhledem k C maticovou rovnici A = B.C, což opět není snadné, neboť B nemá obecně žádnou speciální strukturu, která by toto usnadnila. Tyto komplikace zdaleka nejsou vyváženy výhodou snadného nalezení báze prostoru N(A), které nevyžaduje řešení žádné inverzní úlohy. (3) LU-rozklad není jediným užitečným rozkladem skeletního typu. Další hojně využívaný (jen pro F C) je tzv. QR-rozklad: 123 A = Q.R. Jeho výhodou je, že sloupce matice Q tvoří ortonormální bázi prostoru R(A), matice R je horní trojúhelníková a dle 4.13a) její sloupce opět představují vektory souřadnic sloupců matice A v ONB dané maticí Q. Sloupce Q lze vždy doplnit na ONB celého prostoru Fm (viz 3.79) a matici R pak stejným počtem nulových řádků. Můžeme tedy bez újmy na obecnosti předpokladat, že Q je unitární matice: analogie s LU-rozkladem, kde regulární matici L můžeme považovat za doplnění sloupcové báze L prostoru R(A) na bázi celého prostoru Fm . QR-rozklad se s výhodou užívá místo Gram-Schmidtova algoritmu 3.78 k nalezení ONB prostoru R(A). Ten totiž trpí numerickou nestabilitou v situacích, kdy některý sloupcový vektor matice A je blízký lineární kombinaci ostatních. Při numerických výpočtech se proto doporučuje dávat přednost QR-algoritmu. Teoretické odvození QR-rozkladu jde nad rámec tohoto kurzu. Čtenář jej může najít například ve skriptech [Šik : odst. 13.2 s.105 - 110]. (4) Jordanova eliminace je modifikací Gaussovy eliminace, kdy v matici A eliminujeme postupně nejen pod diagonálou, ale i nad diagonálou. Regulární horní trojúhelníková submatice S([1, . . . , r], [j1, . . . , jr]), ve schodovitém tvaru se tak stane diagonální maticí s nenulovou diagonálou (r = r(A)). Můžeme také postupovat tak, že eliminujeme horní části sloupců S([1, . . . , i - 1], ji), i = 1, . . . , r ve schodovitém tvaru S až dodatečně. Jestliže každý řádek takto získané diagonální submatice S([1, . . . , r], [j1, . . . , jr]) navíc vydělíme nenulovým diagonálním prvkem siji , i = 1, . . . , r (neboli násobíme S zleva postupně regulárními transformačními maticemi D (1/siji ) i pro i = 1, . . . , r), přejde S([1, . . . , r], [j1, . . . , jr]) dokonce v jednotkovou matici Ir. Výše uvedeným postupem lze tedy každou regulární matici A převést na jednotkovu matici In, neboť v tomto případě 124 r = n. Na závěr poznamenejme, že příslušná transformační matice R realizující Jordanovu eliminaci na diagonální tvar (ať obecný či s jednotkovou diagonálou) sice zůstane regulární, ztratí však svůj dolní trojúhelníkový tvar. Podobně v příslušném LU-rozkladu již ani matice L nebude dolní trojúhelníková, ale jen regulární. Relevantní procedury v MATLABu: rref . . . převod matice na schodovitý tvar a určení sloupcové báze (rref=reduced row echelon form) lu . . . nalezení LU-rozkladu matice qr . . . nalezení QR-rozkladu matice orth . . . nalezení ONB prostoru R(A) užitím QR-rozkladu null . . . nalezení ONB prostoru N(A). 125 4.5. Permutace, determinant a stopa matice. V tomto odstavci zavedeme dvě z nejdůležitějších skalárních veličin přiřazovaných k matici: determinant matice a stopu matice. Pojem determinantu patří mezi základní pojmy lineární algebry. V tomto odstavci uvedeme některé jeho základní vlastnosti a metody jeho výpočtu. Poznamenejme, že v dnešní době je praktické použití determinantů na ústupu vzhledem k existenci efektivnějších algoritmů pro řešení úloh, v nichž se tradičně používaly (řešení systému lineárních rovnic, inverze matice aj.) Nicméně pro teoretickou oblast lineární algebry, vyjadřování různých algebraických i geometrických vlastností je pojem determinantu stále nezbytný. Pojem determinantu se vztahuje ke čtvercovým maticím následovně: Každé čtvercové matici A = [aij] řádu n je podle přesně uvedeného pravidla (viz dále 4.44) přiřazen skalár z F (obvykle reálné nebo komplexní číslo) nazývané determinantem matice A a označované sym- boly det A nebo a11 a1n ... ... an1 ann =: |A|. I když je det A skalár, užíváme pro determinant názvy týkající se matic a rozumíme jimi názvy pojmů matice A. Tak například mluvíme o řádku determinantu, sloupci, hlavní diagonále determinantu a pod. Ke přesné definici determinantu je nezbytné nejprve zavést pojem parity permutace. DEFINICE 4.42 (Parita permutace [Šik:odst.2.1 s.12]). Nechť je permutace nějaké n-prvkové úplně uspořádané množiny J. Bez újmy na obecnosti můžeme předpokládat J = {1, 2, . . . , n}. Jestliže označíme (i) := i, pak pro permutaci budeme používat buď jednořádkový zápis [] := [1, 2, . . . , n] 126 nebo dvouřádkový zápis = 1 2 . . . n 1 2 . . . n nebo případně i1 i2 . . . in j1 j2 . . . jn , kde i1, i2, . . . , in jsou prvky J uspořádané v jiném pořadí a jk = (ik) pro k = 1, 2, . . . , n. Říkáme, že i, j stojí v inverzi, jestliže i < j a i > j. Permutace se pak nazývá sudá, resp. lichá, když (-1)p = +1, resp. (-1)p = -1, kde p je počet inverzí permutace (neboli když v permutaci je sudý, resp. lichý počet navzájem různých dvojic i, j stojících v inverzi). Číslo sgn := (-1)p se pak nazývá paritou nebo také znaménkem permutace . Jestliže existuje k > 1 navzájem různých prvků K := {i1, . . . , ik} množiny J takových, že [i1 , . . . , ik ] představuje permutaci množiny K, pak tuto permutaci nazýváme cyklem permutace a číslo k délkou cyklu. Cyklům délky 2 se říká záměna prvků i1 a i2. VĚTA 4.43 (Vlastnosti parity permutace). (1) Identická permutace má sudou paritu. (2) Inverzní permutace k permutaci má stejnou paritu: sgn -1 = sgn . (3) Při skládání permutací se jejich parity násobí: sgn (12) = sgn (21) = sgn 1.sgn 2. (4) Záměnou dvou různých prvků v jednořádkovém zápisu permutace dostaneme novou permutaci s opačnou paritou (zna- ménkem). (5) Jsou-li [] a [ ] jednořádkové zápisy dvou permutací, pak jeden z druhého se dá dostat posloupností záměn19 a obě permutace mají stejnou (různou) paritu právě když počet záměn je sudý (lichý). (6) Počet všech permutací je n!, přičemž pro n > 1 je toto číslo sudé, jedna polovina permutací má sudou paritu a druhá polovina lichou paritu. 19dokonce se můžeme omezit jen na záměny sousedních prvků. 127 Důkaz. (1) V identické permutaci nevystupuje žádná inverze (-1)0 = 1 a parita je tedy sudá. (2) i, j jsou v inverzi i < j a k := i > j =: l l < k a j = -1 (l) > -1 (k) = i -1 (l), -1 (k) jsou v inverzi. Tedy i -1 mají stejný počet inverzí a tudíž i stejnou paritu. (3) Nechť := 21, p1 je počet inverzí v 1 a p2 počet inverzí v 2. Pak každá z p2 inverzí permutace 2 buď zruší nějakou existující inverzi v 1 nebo ji naopak přidá. Protože (-1)p1+1 = (-1)p1-1 , bude mít paritu (-1)p1+p2 = (-1)p1 (-1)p2 = (sgn 1)(sgn 2). Pro 12 analogicky záměnou role 1 a 2. (4) Nechť i < j a [] = [1 . . . i . . . j . . . n], [ ] = [1 . . . j . . . i . . . n]. Pokud i, j jsou sousední (j - i = 1), dojde ke změně inverze jen jednou a to u dvojice i, j. Tedy parita permutace se změní. Pokud j - i > 1, změní se navíc inverze ještě všech indexů k, kde i < k < j, a to jak vzhledem k i, tak vzhledem j. Takových indexů k je j - i - 1, takže celkový počet změn je liché číslo 2(j - i - 1) + 1 a tudíž i v tomto případě dojde ke změně parity permutace. (5) [ ] dostaneme ze [] následující posloupností záměn: Je-li i1 = 1 a i1 = 1, pak záměnou 1 a i1 dosáhneme správného umístění 1 na první pozici. Podobně pro i2 = 2 a i2 = 2 záměnou 2 a i2 umístíme 2 správně na druhou pozici, atd. Každou záměnu na pozicích, které nejsou sousední přitom jistě můžeme nahradit posloupností záměn sousedních prvků. (6) Pro n > 1 je n! = 1.2 . . . sudé číslo. Vyberme libovolně nějakou permutaci (J). K [] můžeme dle (4) přiřadit permutaci [ ] opačné parity záměnou prvých dvou prvků 128 v []. Ze zbylého sudého počtu n! - 2 permutací opět analogicky vytvoříme další obdobnou dvojici. Celkem dostaneme n!/2 takových dvojic, kde jeden člen má sudou a jeden lichou paritu. DEFINICE 4.44 (Determinant). Nechť A =: [aij] je čtvercová matice řádu n a (J) množina všech permutací (card (J) = n!) množiny jejích sloupcových indexů J = {1, 2, . . . , n}. Pak číslo (skalár) det A := X (J) (sgn )a11 . . . ann nazýváme determinantem matice A. Součin a11 . . . ann nazýváme členem determinantu a sgn jeho znaménkem. Poznámka 4.45. Z definice plyne, že každý člen determinantu se dostane jako součin prvků matice A vybraných přesně po jednom z každého jejího řádku. Podle věty 4.43(6) je počet všech členů n!, přičemž pro n > 1 jedna polovina z nich má kladné a druhá polovina záporné znaménko. VĚTA 4.46 (Základní vlastnosti determinantu [Šik:V2.6 s.14]). Nechť A =: [aij] =: [a1; . . . ; an] je matice řádu n a a1, . . . , an její řádky. Pak platí (1) Obsahuje-li A nulový řádek, pak det A = 0. (2) Je-li b =: [b1, . . . , bn] řádkový vektor, pak pro matici získanou z A přičtením vektoru b k jejímu i-tému řádku ai 129 (i = 1, . . . , n) platí: det 2 6 6 6 6 6 6 6 6 6 6 6 4 a1 ... ai-1 ai + b ai+1 ... an 3 7 7 7 7 7 7 7 7 7 7 7 5 = det 2 6 6 6 6 6 6 6 6 6 6 6 4 a1 ... ai-1 ai ai+1 ... an 3 7 7 7 7 7 7 7 7 7 7 7 5 | {z } A + det 2 6 6 6 6 6 6 6 6 6 6 6 4 a1 ... ai-1 b ai+1 ... an 3 7 7 7 7 7 7 7 7 7 7 7 5 . (3) Výměnou dvou různých řádků v matici A se změní znaménko jejího determinantu det A. (3a) Důsledek 120 : Má-li A dva různé řádky stejné, pak det A = 0. (3b) Důsledek 2: Je-li nějaká permutace množiny {1, . . . , n} a P příslušná permutační matice (viz 4.14(6)), pak det P = sgn . Zejména det P i,j = -1, kde P i,j je permutační matice řádu n pro záměnu i-ho a j-tého řádku jako v definici 4.33(1). (3c) Důsledek 3: det(P A) = det P . det A = sgn . det A a podobně det(AP ) = det A. det P = sgn . det A. Zejména det(P i,jA) = det P i,j. det A = - det A a podobně det(AP i,j) = det A. det P i,j = - det A. (4) Determinant trojúhelníkové (diagonální) matice je roven součinu jejích prvků v hlavní diagonále. (4a) det In = 1, kde In je jednotková matice řádu n. (5) det AT = det A. (5a) Důsledek: Všechny výroky této věty týkající se řádků platí i pro sloupce. (5b) Důsledek: V případě F C platí det A = det A. 20Toto tvrzení platí jen když pole skalárů F nemá charakteristiku 2 (srov. 2.71), tedy například pro F = R nebo F = C, což jsou pole nekonečné charakteristiky (viz příklad 2.76). 130 (6) Nechť A je matice získaná z A vynásobením některého jejího řádku skalárem , pak det A = . det A. (6a) Důsledek 1: det D () i = , kde D () i je transformační matice řádu n jako v definici 4.33(3). (6b) Důsledek 2: det(D () i A) = det D () i . det A = . det A a podobně det(AD () i ) = det A. det D () i = . det A. (6c) Důsledek 3: det(.A) = n . det A. (7) det A se nemění přičtením -násobku j-ho řádku k i-tému (i = j). (7a) Důsledek 1: det R () ij = 1, kde R () ij je transformační matice řádu n jako v definici 4.33(2). (7b) Důsledek 2: det(R () ij A) = det R () ij . det A = det A a podobně det(AR () ij ) = det A. det R () ij = det A. (8) Je-li R součin transformačních matice typu P ij, R () ij nebo D () i pak det(RA) = det R. det A a det(AR) = det A. det R. (8a) Je-li T trojúhelníková (diagonální) matice řádu n, pak det(T A) = det T . det A a podobně det(AT ) = det A. det T . (9) Cauchyova věta o determinantu součinu matic: Pro libovolnou čtvercovou matici B řádu n platí det(AB) = (det A).(det B). (10) Matice A je regulární (neboli dle 4.18b) má lineárně nezávislé řádky, resp. sloupce) právě když det A = 0. (11) Nechť X je čtvercová matice, pro niž platí AX = In (resp. XA = In), pak platí také druhá identita XA = In (resp. AX = In) a tedy X = A-1 (viz též větu 4.25)21 . (12) Když A-1 existuje, pak det A-1 = (det A)-1 . Důkaz. (1) Nechť ai je nulový řádek. Pak det A := P (J)(sgn )a11 . . . aii . . . ann = 0, neboť aii = 0 pro každou permutaci (J). 21Toto tvrzení říká, že k definici inverzní matice stačí jen jeden z definičních vztahů AX = In nebo XA = In. 131 (2) Pro determinant na levé straně rovnosti platí vztah: X (J) (sgn )a11 . . . (aii + bi ) . . . ann = X (J) (sgn )a11 . . . aii . . . ann + X (J) (sgn )a11 . . . bi . . . ann , což je právě součet determinantů matic vpravo. (3) Nechť B =: [bij] je matice vzniklá z A záměnou řádků ai a aj. Pak det B = X (J) (sgn )b11 . . . bii . . . bjj . . . bnn = X (J) (sgn )a11 . . . aji . . . aij . . . ann = X (J) (-sgn )a11 . . . aii . . . ajj . . . ann = - det A, neboť [ ] vznikla ze [] záměnou i a j, takže dle 4.43(4) sgn = -sgn ve všech členech determinantu. (3a) Nechť ai = aj pro i = j. Jejich záměnou se matice nezmění, takže det A = det B (3) = - det A. Odtud (2 det A) = 0 a tedy také det A = 0, pokud F nemá charakteristiku 2. (3b) Podle 4.43(5) se [] dá získat posloupností záměn z identické permutace. Pak dle 4.43(1)(4) sgn = (-1)p , kde p je počet takových záměn. Tvrzení je pak důsledkem (3) a (4a): P dostaneme z In pomocí p řádkových záměn, takže det P = (-1)p det In (4a) = (-1)p . (3c) P A je matice získaná z A pomocí p řádkových záměn určujících jako ve (3b). Pak det(P A) (3) = (-1)p det A (3b) = det P . det A. 132 (4) Člen determinantu dolní trojúhelníkové matice může být nenulový jen když do něj nevybíráme nulové prvky nad hlavní diagonálou. V 1. řádku jediný takový prvek je a11, ve 2. řádku a21 již vybrat nelze, takže zbývá a22, atd. až z posledního řádku zbude také jen možnost ann. Jediný člen který může být nenulový je tedy a11 . . . ann, který odpovídá identické permutaci sudé parity. V případě horní trojúhelníkové matice obdobně postupujeme odzdola nahoru. (4a) Plyne ze (4), neboť jednotková matice je speciální případ diagonální matice. (5) Označíme-li AT =: [aij], aij := aji a a := a11 . . . ann člen determinantu det A, pak a = a11 . . . ann = a1-1(1) . . . an-1(n) je také členem determinantu det AT odpovídajícímu permutaci -1 . Parita obou permutací je stejná dle 4.43(2), takže oba determinanty maji všechny členy stejné včetně znaménka. (5a) Zřejmé užitím (5). (5b) det A 4.10 = det AT 4.44 = det AT (5) = det A. (6) Z každého členu determinatu lze vytknout a tedy jej lze vytknout i z det A, který je jejich součtem. (6a) Matice det D () i vznikla z In vynásobením jejího i-ho řádku číslem . Pak tedy det D () i (6) = . det In (4a) = . (6b) Je důsledkem (6) a (6a). (6c) A je matice, jejíž každý řádek byl vynásoben číslem . Stačí aplikovat (6) postupně pro každý z n řádků. (7) Ve (2) položme b = aj. Užitím (6) pak poslední sčítanec bude ve tvaru součinu čísla s determinantem matice, v níž je řádek aj dvakrát. Podle (3a) je proto nulový a zůstane tak jen prvý sčítanec det A. (7a) Plyne ze (4a), neboť R () ij vznikne z jednotkové matice přičtením -násobku jejího j-tého řádku k i-tému. Tvrzení plyne také přímo ze (4), neboť R () ij je trojúhelníková matice s jednotkovou diagonálou. 133 (7b) Je důsledkem (7) a (7a). (8) Dostane se opakovaným užitím (3c), (6b) nebo (7b). (8a) Nechť T =: [tij] je například horní trojúhelníková matice. Snadno nahlédneme, že T = D (tnn) n . . . R (t2n) 2n . . . R (t23) 23 D (t22) 2 R (t1n) 1n . . . R (t12) 12 D (t11) 1 . Násobení těmito maticemi v pořadí zprava doleva postupně vytváří 1. řádek, pak 2. řádek, atd. až poslední řádek matice T . V případě dolní trojúhelníkové matice postupujeme obdobně od posledního řádku k prvnímu. Tvrzení je pak důsledkem (8). (9) Nechť P A = LU je LU-rozklad matice A dle 4.38. Pak det P . det(AB) (3c) = det(P AB) = det(L(UB)) (8a) = (det L. det U). det B (8a) = det(LU). det B = det(P A). det B (3c) = det P . det A. det B. Po zkrácení hodnotou det P (3b) = 1 dostáváme požadovaný vztah. (10) Matice A řádu n je podle definice 4.17 regulární r(A) = n 4.37 po Gaussově eliminaci schodovitým tvarem matice A je horní trojúhelníková čtvercová matice S řádu n s nenulovou diagonálou pro schodovitý tvar S =: [sij] matice A platí 0 = s11 . . . snn (4) = det S (3),(7) = det A det A = 0. (11) Platí-li AX = In pro čtvercové matice A a X, pak 1 (4a) = det In = det(AX) (9) = (det A)(det X). Tedy zejména det A = 0 a tudíž podle (10) je matice A regulární a na základě 4.25 k ní existuje inverzní matice A-1 . Vynásobením rovnice AX = In = AA-1 zleva maticí A-1 obdržíme X = A-1 AX = A-1 AA-1 = A-1 . (12) AA-1 = In (det A)(det A-1 ) (9) = det In (4a) = 1 a tedy det A-1 = (det A)-1 . 134 DEFINICE 4.47 (Minory, adjunkt matice). Nechť A je matice rozměru m × n a B = A([i1, . . . , ik], [j1, . . . , jk]), 1 i1 < < ik m, 1 j1 < < jk n její čtvercová submatice (viz též definici 4.2) řádu k min(m, n), pak det B nazýváme minorem (nebo též subdeterminantem) řádu k matice A. Tento minor budeme značit M := M i1,...,ik j1,...,jk (A). Doplňkovým minorem (stručně doplňkem) minoru M ve čtvercové matici A řádu n při k < n rozumíme minor složený ze zbývajících řádků a sloupců matice A. Značíme jej C i1,...,ik j1,...,jk (A) nebo jen stručně C. Algebraický doplněk minoru M je C i1,...,ik j1,...,jk (A) := (-1)s C i1,...,ik j1,...,jk (A), kde s = i1 + + ik + j1 + + jk. Je-li minor složen z jediného prvku aij (tj. k = 1, i1 = i a j1 = j), pak jeho doplněk, resp. algebraický doplněk značíme Cij(A), resp. Cij(A). V tomto případě tedy platí Cij(A) = (-1)i+j Cij(A). Matice A := [aij], kde aij = Cji(A) se nazývá adjunktem k matici A a značí se adj A. Poznámka 4.48 (Značení). Pokud nebude hrozit nedorozumění (pevně daná matice A), budeme nadále minory matice A a jejich doplňky označovat zjednodušeně M i1,...,ik j1,...,jk , C i1,...,ik j1,...,jk , Cij, C i1,...,ik j1,...,jk a Cij nebo jen M, C a C, pokud rovněž výběrové indexy budou pevně dány. V dalším budeme v případě čtvercové matice A řádu n pracovat s následujícími výrazy : R(i1, . . . , ik) := X t1,...,tk M i1,...,ik t1,...,tk C i1,...,ik t1,...,tk , S(j1, . . . , jk) := X t1,...,tk M t1,...,tk j1,...,jk C t1,...,tk j1,...,jk , kde t1, . . . , tk probíhají všechna přirozená čísla s vlastností 1 t1 < < tk n. Počet sčítanců v každém z výrazů je tedy n k . 135 VĚTA 4.49 (Laplaceova věta o rozvoji determinantu). Předpokládejme označení z poznámky 4.48. Pak pro každý výběr řádkových indexů i1, . . . , ik, resp. sloupcových indexů j1, . . . , jk platí R(i1, . . . , ik) = S(j1, . . . , jk) = det A. Důkaz. Nechť M := M i1...ik j1...jk je nějaký minor matice A a C = (-1)s C jeho algebraický doplněk, kde s := Pk t=1(it + jt). Položme J := {j1, . . . , jk} a J := {1, . . . , n} - J1. 1) Předpokládejme nejprve, že M leží vlevo nahoře (it = jt = t), pak s := Pk t=1(t + t) = 2(1 + 2 + + k) je sudé číslo, takže jeden ze sčítanců M.C = M.C ve výrazu R(i1, . . . , ik) nabude tvaru M.C 4.44 = X (J) (sgn )a11 . . . akk . X (J ) (sgn )ak+1,1 . . . an,n-k = X (J) X (J ) (sgn )a11 . . . akk (sgn )ak+1,1 . . . an,n-k 4.43(3) = X (J) X (J ) (sgn )a11 . . . akk ak+1,k+1 . . . ann , kde [ ] = [1, . . . , k, k+1, . . . , n] je permutace množiny {1, . . . , n} získaná složením dvou cyklů [] =: [1, . . . , k] a [ ] =: [1, . . . , n-k], kde i =: k+i pro i = 1, . . . , n - k. Každý ze sčítanců je tedy jedním členem determinantu d := det A včetně správného znaménka. 2) Nechť nyní minor M je tvořen řádky a sloupci s obecnými indexy i1 < < ik a j1 < < jk. Přemístěme řádky a sloupce (sousedními výměnami) na prvních k pozic tak, aby se zachovalo jejich pořadí. Výměn řádků a sloupců bude celkem (i1 -1)+ +(ik -k)+(j1 -1)+ +(jk -k) = s-2(1+2+ +k). Výměnami přejde determinant d v nový determinant d 4.46(3) = (-1)s-2(1+2++k) d = (-1)s d, 136 kde M se přesune do levého horního rohu a jeho doplněk C do pravého dolního rohu. Podle části 1) součin M.C bude roven součtu některých členů determinantu d , opatřených znaménky, která jim přísluší v determinantu d . Tato znaménka se liší od znamének členů determinantu d jen faktorem (-1)s , takže M.C = M.(-1)s C je součet některých členů determinantu d, která jim přísluší v d. Je patrné, že sčítanci v M.C jsou (formálně) různí a jejich počet je k!(n - k)!. Když uvážíme, že lze vybrat n k minorů z (pevně) zvolených k řádků matice A, bude všech sčítanců k!(n-k)! n k = k!(n-k)! n! k!(n-k)! = n!, tj. celkem součet všech členů determinantu d včetně správných znamének. Užijeme-li k výpočtu determinantu matice A výrazu R(i1, . . . , ik) resp. S(j1, . . . , jk), pak řekneme, že jsme jej počítali Laplaceovým rozvojem podle řádků i1, . . . , ik resp. sloupců j1, . . . , jk nebo že jsme det A rozvinuli (Laplaceovým rozvojem) podle řádků i1, . . . , ik resp. sloupců j1, . . . , jk. DŮSLEDEK 4.50 (Laplaceův rozvoj podle jednoho řádku/sloupce). Nechť i je nějaký řádkový, resp. j sloupcový index. Pak platí nX t=1 aitCit = nX t=1 atjCtj = det A. Lemma 4.51. Nechť A = [aij] je čtvercová matice řádu n a nechť i, j N, 1 i, j n. Pak platí: (1) Pn t=1 aitCjt(A) = ( 0, jestliže i = j det A, jestliže i = j, (2) Pn t=1 atjCti(A) = ( 0, jestliže i = j det A, jestliže i = j. Důkaz. Jestliže i = j, pak výraz (1) je dle 4.50 Laplaceův rozvoj det A podle i-tého řádku a obdobně výraz (2) Laplaceův rozvoj podle i-tého sloupce. 137 Jestliže i = j, pak výraz (1) je dle 4.50 Laplaceův rozvoj podle j-tého řádku determinantu matice, jejíž j-tý řádek byl nahrazen i-tým řádkem. Obdobně výraz (2) představuje Laplaceův rozvoj podle i-tého sloupce determinantu matice, jejíž i-tý sloupec byl nahrazen j-tým sloupcem. Tyto determinanty jsou však podle 4.46(3a) nulové. VĚTA 4.52. Pro čtvercovou matici A řádu n máme: A(adj A) = (adj A)A = (det A).In Důkaz. Tvrzení plyne z lemmatu 4.51 a z definice matice adj A ve 4.47. DŮSLEDEK 4.53. Pro regulární čtvercovou matici A platí A-1 = 1 det A adj A. Důkaz. Podle 4.46(10) je det A = 0. Rovnici ve 4.52 můžeme tedy tímto determinantem vydělit, takže dostáváme A 1 det A adj A = 1 det A adj A A = In, a tedy A-1 = 1 det A adj A podle 4.25. DŮSLEDEK 4.54 (Cramerovo pravidlo). Nechť A je regulární čtvercová matice řádu n a b sloupcový vektor délky n. Pak A-1 b = hdet A1 det A , . . . , det An det A iT , kde Aj je matice získaná z A nahrazením jejího j-tého sloupce vektorem b (j = 1, . . . , n). DŮKAZ. Označme b =: [bt] a položme y := [yj] := (adj A)b. Pak yj = Pn t=1 Ctjbt = Pn t=1 btCtj představuje Laplaceův rozvoj podle j-tého sloupce determinantu matice Aj, tj. yj = det Aj (j = 1, . . . , n). Tvrzení pak ihned dostáváme po vynásobení rovnice ve 4.53 zprava vektorem b. 138 POZNÁMKA 4.55 (Metody výpočtu determinantu). * Přímý výpočet z definice 4.44: Je vhodný pouze pro matice nízkých řádů, obvykle nejvýše řádu 3: Řád 1: Pro čtvercovou matici A = [a] řádu 1 je výpočet jednoduchý. Jedinou permutací jednoprvkové množiny je identická permutace sudé parity, takže dostáváme: det A = det[a] = a. Řád 2: Jedinými permutacemi dvouprvkové mmnožiny je identická permutace [1, 2] sudé parity a [2, 1] liché parity. Dostáváme tak vztah: det A = a11a22 - a12a21. (4.2a) Řád 3: Tříprvkovou mmnožinu lze uspořádat šesti způsoby (= 3!), přičemž dle 4.43(6) tři permutace mají sudou paritu (+) a tři lichou paritu (-): [1, 2, 3], [2, 3, 1], [3, 1, 2] s počtem inverzí po řadě 0, 2, 2 (+) [3, 2, 1], [2, 1, 3], [1, 3, 2] s počtem inverzí po řadě 3, 1, 1 (-). Dostáváme tak vztah: det A = a11a22a33 + a12a23a31 + a13a21a32 - a13a22a31 - a12a21a33 - a11a23a32. (4.2b) Výše uvedené vztahy si lze snadno zapamatovat takto: trojice prvků vybíraná rovnoběžně s hlavní diagonálou dává příslušnému členu znaménko +, zatímco trojice prvků vybíraná rovnoběžně s vedlejší diagonálou dává znaménko -. Toto pravidlo je také známo jako tzv. Sarrusovo pravidlo. * Rekurentní výpočet užitím Laplaceova rozvoje: Opakovaným používáním Laplaceova rozvoje postupně na zadaný determinant, pak na vybírané minory a jejich doplňky, atd. vede k postupnému snižování řádu determinantů až na úroveň, kde můžeme užít přímý výpočet. Indexy i1, . . . , ik, resp. j1, . . . , jk vybíráme tak, aby ve vybraných řádcích, resp. sloupcích bylo co nejvíce nulových 139 prvků. Pak totiž mnoho minorů v rozvoji bude nulových a výpočet se zjednoduší. Můžeme také tomu napomoci prováděním vhodných elementárních transformací dle 4.46(7-7b), které nemění hodnotu počítaného determinantu. Obvykle se provádí rozvoj pouze podle jednoho řádku, resp. sloupce, z něhož nejprve eliminujeme co nejvíce nenulových prvků. Ideální je, když tam zůstane pouze jeden takový prvek, řekněme aij. Pak se rozvoj redukuje jen na jeden sčítanec det A = aij(-1)i+j Cij, kde Cij je řádu n - 1. Na něj pak aplikujeme podobný postup, čímž se řád dále sníží na n - 2, atd. * Užití Gaussovy eliminace, resp. LU-rozkladu: Při Gaussově eliminaci se matice A řádu n převede posloupností elementárních řádkových úprav 4.46(7) a řádkových záměn 4.46(3) na čtvercovou matici ve schodovitém tvaru S rovněž řádu n. Uvažme dále, že S je horní trojúhelníková matice. Zatímco řádkové úpravy 4.46(7) nemění hodnotu det A, tak každá řádková záměna 4.46(3) obrací její znaménko. Označíme-li p počet provedených řádkových záměn, dostáváme (-1)p det A = det S 4.46(4) = s11 . . . snn a odtud hledaný vztah det A = (-1)p s11 . . . snn. (4.3) Obdobný vztah dostáváme z rovnice L.S = P A pro LU-rozklad dle 4.38. Totiž L je dolní trojúhelníková s jednotkovou diagonálou, takže det L = 1 dle 4.46(4). Matice P je permutační matice složená z výše zmíněných řádkových záměn, takže det P = (-1)p dle 4.43(3) a 4.46(3b). Kromě determinantu, další běžně užívanou skalární veličinou přiřazovanou čtvercové matici je stopa matice: DEFINICE 4.56 (Stopa matice). Stopou (angl. trace) čtvercové matice A =: [aij] řádu n nazýváme součet jejích prvků na hlavní diagonále. Píšeme tr A := Pn i=1 aii. V teorii polynomů hraje důležitou roli tzv. Vandermondova matice: 140 DEFINICE 4.57 (Vandermondova matice). Vandermondovou maticí danou vektorem x := [x1, . . . , xn] Fn rozumíme následující čtvercovou matici řádu n: V (x) := V (x1, . . . , xn) := 2 6 6 6 4 1 x1 x2 1 xn-1 1 1 x2 x2 2 xn-1 2 ... ... ... ... 1 xn x2 n xn-1 n 3 7 7 7 5 . (4.4a) V jejím i-tém řádku a j-tém sloupci se nachází prvek xj-1 i , můžeme proto psát stručně22 V (x) = [xj-1 i ]. VĚTA 4.58 (Vandermondův determinant). Determinant z Vandermondovy matice se nazývá Vandermondův determinant. Vandermondův determinant řádu n 2 se spočte z následujícího vztahu: det V (x1, . . . , xn) = Y 1i 2 (indukční krok): Předpokládejme, že (4.4b) již bylo dokázáno pro n-1. Proveďme s maticí (4.4a) následující sloupcové úpravy neměnící hodnotu determinantu (viz 4.46(5a)(7)): Pro každé j = n, n - 1, . . . , 2 odečteme od j-tého sloupce xn-násobek (j - 1)-ho sloupce. V posledním řádku zůstane v 1. sloupci jediný nenulový prvek 1, podle něhož determinant rozvineme: det V (x1, . . . , xn) = 1.(-1)n+1 det C, kde z každého řádku determinantu doplňkové matice C lze před něj vytknout rozdíl (xi - xn), 22pokud xi = 0, pak v 1. sloupci neurčitý výraz 00 nahradíme jedničkou. 141 i = 1, . . . , n - 1 (užijeme (n - 1)-krát vlastnost 4.46(6)). Pak det C = (x1 - xn) . . . (xn-1 - xn) det V (x1, . . . , xn-1) I.P. = (-1)n-1 (xn - x1) . . . (xn - xn-1) Y 1i< >: y (i) p jestliže j = jp pro nějaké p a 1 jestliže j = kq pro q = i 0 jestliže j = kq pro nějaké q = i. Tento systém je nezávislý, neboť matice z nich vytvořená obsahuje jednotkovou submatici řádu n - r, která je regulární (viz 4.19(3)(4)). Protože je u(i) N(S ) a dim N(S ) = n-r(S ) = n-r, musí tvořit jeho bázi (viz též 3.24(4)(ii)). Množina všech řešení je pak určena dle 5.3(2) následujícími vztahy, kde t1, . . . , tn-r F jsou libovolně zvolené volné proměnné: x1 = x (0) 1 + t1.u (1) 1 + + tn-r.u (n-r) 1 x2 = x (0) 2 + t1.u (1) 2 + + tn-r.u (n-r) 2 ... ... ... ... xn = x (0) n + t1.u (1) n + + tn-r.u (n-r) n (5.4) Poznámka: Pomocí systému MATLAB lze (dokonce ortonormální) bázi jádra N(A) = N(S ) snadno nalézt užitím příkazu null(A). 151 (2) Jordanova eliminace Postupujeme analogicky jako při Gaussově eliminaci (1) s tím rozdílem, že v kroku a) provádíme převod na schodovitý tvar pomocí Jordanovy metody popsané v poznámce 4.41(4). Při této metodě je v každém kroku eliminována i část sloupce nad každým schodem. Za cenu většího počtu výpočetních operací tak získáme jednodušší schodovitý tvar S , v němž regulární horní trojúhelníková submatice U se stane diagonální maticí, což výrazně zjednoduší výpočty v následných krocích c) a d). Rovnice (5.3) má diagonální matici soustavy, takže vázané proměnné partikulárního řešení určíme z rovnice Uy = b pouhým vydělením diagonálními prvky ujj = 0: yj = bj ujj pro j = 1, . . . , r. Stejně snadno určíme v kroku d) vázané proměnné bázových vektorů u (i) j : y (i) j = -U (j,i) ujj = -S (j,ki) ujj pro j = 1, . . . , r a i = 1, . . . , n - r. (3) Užití LU-rozkladu Nechť P A = LS je LU-rozklad matice A. Zřejmě platí: Ax = b P Ax = P b LSx = P b Lz = P b, kde z := Sx. Celý postup hledání řešení tak sestává ze čtyř kroků: a) Konstrukce matic L, U a P podle 4.38 b) Provedení permutace pravé strany P b c) Řešení soustavy Lz = P b algoritmem dopřed. dosazování (5.2a) Matice L je dolní trojúhelníková a regulární, takže podle 5.3(1) existuje právě jedno řešení z. Matice L =: [lij] má dokonce jednotkovou diagonálu, takže při dopředném dosazování nemusíme v rovnicích (5.2a) dělit diagonálními prvky lii = 1. d) Řešení soustavy Sx = z algoritmem zpětného dosazování (5.2b) Rozhodneme o řešitelnosti a případně hledáme řešení stejně jako v krocích b) až d) Gaussovy eliminace (1). Pouze pravou stranu b zaměníme vektorem z. 152 5.7. Výpočetní složitost algoritmů (1) až (3). Všechny algoritmy mají stejnou kubickou aditivní i multiplikativní složitost: Aditivní složitost: O() = n3 - n 3 + n2 - n 2 Multiplikativní složitost: O(, /) = n3 - n 3 + n2 Z hlediska výpočtové složitosti jsou všechny algoritmy ekvivalentní. Vzhledem k tomu, že ve všech třech metodách má nejvyšší výpočetní nároky triangularizace (převod na horní trojúhelníkový tvar: faktor n3 -n 3 ), resp. diagonalizace u Jordanovy metody, bude algoritmus (3) výhodnější v případě, že řešíme systém opakovaně s různými pravými stranami b a stejnou maticí soustavy A. V takovém případě totiž stačí provést triangularizaci P A = LU jen jednou, neboť nezávisí na pravé straně, a pak opakovaně provádět kroky b) až d) pro jednotlivé pravé strany. Tohoto postupu lze využít při řešení maticových rovnic typu A.X = B, jehož speciálním případem je úloha nalezení inverze regulární čtvercové matice (viz dále odst. 5.5). (4) Cramerovo pravidlo pro regulární čtvercovou matici soustavy A. Je-li A regulární čtvercová matice řádu n, pak x = A-1 b je zřejmě (jediné) hledané řešení soustavy Ax = b, neboť AA-1 b = b v důsledku rovnosti AA-1 = In. Toto řešení můžeme spočíst Cramerovým pravidlem 4.54. Metoda však vyžaduje spočtení n + 1 determinantů řádu n a je proto použitelná jen pro soustavy o malém počtu rovnic (n 3) a nebo ve speciálních případech, např. při vyjadřování řešení v symbolickém tvaru u rovnic, kde matice soustavy závisí na dalších parametrech. Pro numerické řešení větších soustav není 153 vhodná také vzhledem k šíření numerických chyb při výpočtu (důsledek velkého počtu prováděných operací). Dochází tak ke ztrátě přesnosti, zejména v případech, kdy A se blíží k singulární matici (det A je nepřesně spočtené malé číslo, kterým se při Cramerově pravidlu dělí). Takovým maticím říkáme špatně podmíněné (podrobněji viz dále odst. 5.6). 5.3. SLR s pásovou (tridiagonální) maticí soustavy. Věta 5.8. Nechť Ax = b, kde A je regulární pásová tridiagonální matice (aij = 0 pro |i - j| > 1) rozměru n × n: A = 2 6 6 6 6 6 4 a1 c1 0 . . . 0 0 0 b2 a2 c2 . . . 0 0 0 ... ... ... ... ... ... ... 0 0 0 . . . bn-1 an-1 cn-1 0 0 0 . . . 0 bn an 3 7 7 7 7 7 5 . Potom její LU-rozklad A = LU je tvaru L = 2 6 6 6 6 6 4 1 0 . . . 0 0 2 1 . . . 0 0 ... ... ... ... ... 0 0 . . . 1 0 0 0 . . . n 1 3 7 7 7 7 7 5 , U = 2 6 6 6 6 6 4 1 c1 0 . . . 0 0 2 c2 . . . 0 ... ... ... ... ... 0 0 0 . . . cn-1 0 0 0 . . . n 3 7 7 7 7 7 5 , kde 1 = a1 i = bi i-1 i = ai - ici-1 pro i = 2, 3, . . . , n. (5.5a) Důkaz. Vztahy pro neznámé i a i snadno nalezneme formálním porovnáním prvků matic na levé a pravé straně po roznásobení maticové rovnice A = LU: viz též poznámku 5.9(3). 154 Poznámka 5.9. (1) Jinou variantu algoritmu (5.5a) lze odvodit pro L = 2 6 6 6 6 6 4 1 0 . . . 0 0 b2 2 . . . 0 0 ... ... ... ... ... 0 0 . . . n-1 0 0 0 . . . bn n 3 7 7 7 7 7 5 , U = 2 6 6 6 6 6 4 1 1 . . . 0 0 0 1 . . . 0 0 ... ... ... ... ... 0 0 . . . 1 n-1 0 0 . . . 0 1 3 7 7 7 7 7 5 , kde 1 = a1, 1 = c1 1 i = ai - bii-1 i = ci i pro i = 2, 3, . . . , n. (5.5b) (2) Analogické algoritmy obdržíme pro blokově tridiagonální matice, kde ai, bi, ci, i, i (resp. i) jsou submatice kompatibilních rozměrů. Pak místo 1 i-1 násobíme inverzní maticí -1 i-1 zprava v (5.5a) (resp. místo 1 i maticí -1 i zleva v (5.5b)). (3) V případě obecné regulární čtvercové matice A lze výše popsaný postup zobecnit pro přímý výpočet prvků matic L a U tak, že postupně sestavujeme rovnice pro prvky 1. řádku U, 1. sloupce L, 2. řádku U, 2. sloupce L, atd. 5.4. Přibližné řešení SLR metodou nejmenších čtverců. Pokud neexistuje řešení SLR Ax = b, je to důsledkem toho, že b / R(A). V tomto případě má smysl hledat řešení x, které minimalizuje v nějakém smyslu chybu b-Ax. Chybu obvykle měříme vhodnou normou b - Ax . Nejčastěji se pro tento účel užívají p-normy (viz 3.56). Pokud je norma odvozena24 z nějakého vnitřního součinu , , stačí nahradit pravou stranu b její ortogonální projekcí bb R(A) na 24viz 3.62(S9). 155 R(A), což je dle věty o ortogonální projekci 3.77 vektor z R(A) minimalizující b - bb . Místo původní rovnice pak řešíme rovnici Ax = bb tzv. metodou nejmenších čtverců (MNČ) podle následující věty. VĚTA 5.10 (Metoda nejmenších čtverců ve (V, LF)). Nechť (V, LF) je VS-prostor nad skalárním polem F C a W := L(A) jeho vektorový podprostor generovaný konečnou množinou vektorů A := {a1, . . . , an}. Pak =: [1, . . . , n] Fn je ve smyslu věty 3.77 řešením úlohy ortogonální projekce PW b =: bb = 1a1 + + nan vektoru b V na podprostor W právě když je přesným řešením následujícího systému lineárních rovnic, který je vždy řešitelný: a1, a1 1 + a2, a1 2 + . . . + an, a1 n = b, a1 a1, a2 1 + a2, a2 2 + . . . + an, a2 n = b, a2 ... ... ... ... a1, an 1 + a2, an 2 + . . . + an, an n = b, an . (5.6a) DŮKAZ. W je konečně rozměrný, takže podle 3.80 lze užít větu 3.77 o ortogonální projekci. Podle věty 3.86 je PW b = bb b - bb W 3.72 b - bb ai pro i = 1, . . . , n b - Pn j=1 jaj, ai = 0 pro i = 1, . . . , n (3.1) b, ai - Pn j=1 j aj, ai = 0 pro i = 1, . . . , n Pn j=1 j aj, ai = b, ai pro i = 1, . . . , n je řešením (5.6a). Řešitelnost tohoto systému je garantována větou o ortogonální pro- jekci. DŮSLEDEK 5.11 (Metoda nejmenších čtverců ve (Fm , LF)). Nechť A =: [a1, . . . , an] je matice typu m/n tvořená sloupcovými vektory a1, . . . , an a b Fm libovolný vektor. Pak x Fn je řešením rovnice Ax = bb nad skalárním polem F C právě když x je přesným řešením následujícího systému lineárních rovnic: (A A)x = A b. (5.6b) 156 Tento systém je vždy řešitelný a jeho maticí soustavy je Gramova matice A A -- viz 4.14(9). DŮKAZ. Jestliže nahradíme v předchozí větě vektorem x, pak bb = x1a1 + + xnan 4.13 = Ax. Vektor x je tedy řešením této úlohy právě když je řešením SLR (5.6a), kde i = xi. Tomuto systému odpovídá dle 4.14(9) maticový zápis (5.6b). Jeho řešitelnost je dána předchozí větou nebo také přímo plyne ihned z toho, že jeho pravá strana A b R(A ) 3.88(5)(iii) = R(A A). Poznámka 5.12. (1) Jestliže F R, pak v (5.6b) je A 4.11(5) = AT . (2) Je-li W nějaká pozitivně definitní matice řádu m (tzv. váhová matice), pak lze pomocí ní zavést v Fm vážený skalární součin x, y W := W x, y 4.14(9) = y W x (podrobnosti dále v kapitole 6). Systém (5.6a) tak přejde v (A W A)x = A W b. (5.6c) Jeho řešení nazýváme řešením úlohy Ax = bb tzv. váženou metodu nejmenších čtverců s váhovou maticí W . Obvykle W je diagonální matice s kladnými diagonálními vahami wii > 0 (jinak W by totiž nebyla pozitivně definitní). Nechť r := b - Ax značí vektor odchylek řešení od pravé strany (tzv. reziduální vektor). Malá hodnota wii v odvozené normě r W = p W r, r W = rW r = pPm i=1 wiiriri = pPm i=1 wii|ri|2 snižuje vliv odchylky ri na hodnotu normy a připouští tudíž větší odchylku i-té složky oproti j-té složce, kde wjj > wii. (3) Je-li b R(A), pak bb = PW b 3.76(1) = b, takže každé řešení soustavy (5.6b) je současně přesným řešením původní rovnice Ax = b. V MATLABu pro nečtvercovou matici pomocí operátoru levého dělení x = A\b spočteme nějaké (partikulární) 157 MNČ-řešení systému (5.6b). Toto řešení je přesné, pokud je původní systém řešitelný -- viz poznámku v 5.2(1)c). 5.5. Řešení maticové rovnice A.X = B a výpočet inverze A-1 . Nechť A typu m/n a B typu m/p jsou dané matice. Řešením maticové rovnice A.X = B rozumíme každou matici X kompatibilního typu n/p, která tuto rovnici splňuje. Protože A.X = B A.X(:, k) = B(:, k) pro k = 1, . . . , p, vidíme, že sloupce X jsou po řadě řešení p systémů lineárních rovnic s pravými stranami tvořenými odpovídajícími sloupci matice B. Všechny tyto systémy mají přitom stejnou maticí soustavy A. V zásadě můžeme po drobné modifikaci užít metody (1) až (3) z odst. 5.2. (1) Gaussova nebo Jordanova eliminace V kroku a) převádíme na schodovitý tvar matici soustavy rozšířenou o všechny pravé strany, tj. matici eA = [A, B]. Obdržíme [S, B ]. V kroku b) rozhodnutí o řešitelnosti maticové rovnice spočívá v rozhodnutí o řešitelnosti všech ekvivalentních soustav s měnícími se pravými stranami B (:, k), k = 1, . . . , p. Snadno nahlédneme, že nutnou a postačující podmínkou je opět podmínka r(A) = r( eA), tj. stejný počet nenulových řádků v maticích S a [S, B ]. V kroku c) pak (5.3) řešíme postupně s pravými stranami b = B (:, k) pro k = 1, . . . , p. Krok d) zůstane beze změny, neboť nezávisí na pravé straně. (2) Užití LU-rozkladu Jak již bylo zmíněno v 5.7, stačí vlastní LU-rozklad z kroku a) provést pouze jednou, v kroku b) pak provedeme řádkovou permutaci P B celé matice B, což odpovídá řádkovým permutacím všech pravých stran. Nakonec pro každou pravou stranu (sloupce matice B) opakujeme kroky c)d), čímž postupně dostáváme jako řešení odpovídající sloupce neznámé matice X. 158 Analogicky jako v odst. 5.4 lze přibližné MNČ-řešení maticové rovnice A.X = B nalézt řešením maticové rovnice (A A)X = A B, která je vždy řešitelná. Je-li A regulární čtvercová matice řádu n, pak k nalezení inverze X = A-1 stačí podle 4.46(11) řešit maticovou rovnici A.X = In. Tato úloha je tak speciálním případem maticové rovnice (m = n = p). Poznamenejme ještě, že v případě regulární matice, je A-1 B (jediným) řešením obecné maticové rovnice s libovolnou pravou stranou B. V případě regulární matice A nízkého řádu, můžeme pro výpočet její inverze užít také determinantovou metodu dle důsledku 4.53. 5.6. Problémy s numerickou nestabilitou při řešení SLR. Matice A se nazývá špatně podmíněná, jestliže malé změny pravé strany b mají za následek velké změny řešení x. Například pro čtvercovou matici A tato situace nastává v případech, kdy A je sice regulární, avšak s malou hodnotou determinantu, neboli říkáme, že je "skoro singulární". Tato situace nastane, když některý sloupcový (řádkový) vektor v A svírá malý úhel s nadrovinou generovanou ostatními sloupci (řádky). Jako příklad uvažme následující systém dvou lineárních rovnic: x + 2y = 2 2x + 3y = 3, 4 Přesné řešení x = 0, 8, y = 0, 6 aproximujme dosti nepřesně hodnotami ex = 1, ey = 0, 48. Po jejich dosazení do obou rovnic dostáváme po řadě 1, 96 místo 2 a 3, 44 místo 3, 4, což jsou malé odchylky řádově v setinách ve srovnání s chybou řešení, která je řádově v desetinách. Příčina tkví v tom, že hledáme průsečík dvou přímek, které svírají velmi malý úhel o směrnicích -1 2 a -2 3 . Řádky [1, 2] a [2, 3] matice soustavy v tomto případě totiž reprezentují souřadnice kolmic k oběma přímkám a svírají tedy stejný úhel jako přímky samotné. 159 Se zmenšujícím se úhlem se blížíme ke stavu lineární závislosti obou vektorů, tj. ke stavu, kdy matice soustavy je singulární. Podobně lze zkonstruovat situace, kdy při libovolně velké odchylce řešení lze dosáhnout libovolně malé odchylky od pravé strany. ZÁVĚR: Nelze tedy hodnotit přesnost nalezeného řešení podle odchylek od pravé strany po jeho dosazení do rovnic! Lze pouze hodnotit podmíněnost matice. Ta se měří číslem podmíněnosti, které se zpravidla počítá jako poměr největšího ku nejmenšímu singulárnímu číslu matice. Singulární čísla matice A jsou druhé odmocniny vlastních čísel symetrické matice AT A -- tedy v případě symetrické matice splývají s jejími vlastními čísly (podrobněji viz následující kapitolu). Toto číslo podmíněnosti v systému MATLAB počítá funkce cond. Čím větší číslo podmíněnosti má daná matice, tím je hůře podmíněná a více se blíží k singulární matici. Jinak počítané reciproké číslo podmíněnosti v intervalu [0, 1] vrací funkce rcond. V tomto případě špatnou podmíněnost indikují hodnoty blízké k nule. 5.7. Iterační metody pro řešení systému lineárních rovnic. Princip: Rovnici Ax = b, kde A je čtvercová regulární matice řádu n, převedeme na rovnici tvaru x = x + , kterou generujeme posloupnost iterací. Obecný postup hledání a : Matici A vhodně rozložíme do tvaru A = N -M, kde N je regulární matice. Pak platí Ax = b (N - M)x = b Nx = Mx + b x = N-1 M| {z } x + N-1 b| {z } . 160 Iterační proces: x(0) . . . počáteční iterace x(k+1) = x(k) + pro k = 0, 1, . . . . (5.7) DEFINICE 5.13 (Jacobiho prosté iterace). Položíme N := diag(A) = 2 6 6 6 4 a11 0 . . . 0 0 a22 . . . 0 ... ... ... ... 0 0 . . . ann 3 7 7 7 5 M := N - A = 2 6 6 6 4 0 -a12 . . . -a1n -a21 0 . . . -a2n ... ... ... ... -an1 -an2 . . . 0 3 7 7 7 5 , pak = 2 6 6 6 6 4 0 -a12 a11 . . . -a1n a11 -a21 a22 0 . . . -a2n a22 ... ... ... ... - an1 ann - an2 ann . . . 0 3 7 7 7 7 5 , = 2 6 6 6 6 4 b1 a11 b2 a22 ... bn ann 3 7 7 7 7 5 . Rozepsáním (5.7) do jednotlivých rovnic dostáváme Jacobiho iterační proces: x (0) 1 , . . . , x (0) n . . . počáteční iterace x (k+1) j = 1 ajj bj - Pn i=1 i=j aji x (k) i , j = 1, . . . , n; k = 0, 1, . . . . (5.8) 161 Vidíme, že vztah pro x (k+1) j odpovídá formálnímu vyřešení j-té rovnice vzhledem k proměnné xj. Jestliže nyní v (5.8) použijeme pro i < j již spočtenou iteraci x (k+1) i místo x (k) i , obdržíme následující zřejmě poněkud rychleji konvergující iterační proces. DEFINICE 5.14 (Gauss-Seidelovy iterace). Položíme N := 2 6 6 6 4 a11 0 . . . 0 a21 a22 . . . 0 ... ... ... ... an1 an2 . . . ann 3 7 7 7 5 , M := N - A = 2 6 6 6 4 0 -a12 . . . -a1n 0 0 . . . -a2n ... ... ... ... 0 0 . . . 0 3 7 7 7 5 , pak z Nx(k+1) = Mx(k) + b dostáváme ihned rovnice pro Gauss-Seidelův iterační proces: x (0) 1 , . . . , x (0) n . . . počáteční iterace x (k+1) j = 1 ajj bj - Pj-1 i=1 aji x (k+1) i - Pn i=j+1 aji x (k) i , j = 1, . . . , n; k = 0, 1, . . . . (5.9) DEFINICE 5.15. Čtvercová matice A řádu n se nazývá striktně diagonálně dominantní, jestliže |ajj| > Pn i=1 i=j |aji| pro j = 1, 2, . . . , n. VĚTA 5.16 (Konvergence Jacobiho a Gauss-Seidelovy metody). Nechť A je striktně diagonálně dominantní matice. Potom systém lineárních rovnic Ax = b má jediné řešení a Jacobiho i Gauss-Seidelův 162 iterační proces konverguje k tomuto řešení při libovolně zvolené počáteční aproximaci x(0) . POZNÁMKA 5.17. Obecně z konvergence jedné z obou metod neplyne konvergence druhé. Pokud konvergují obě, pak Gauss-Seidelova metoda konverguje rychleji. PŘÍKLAD 5.18. Jak ukazuje následující příklad, může pouhou změnou pořadí rovnic dojít ke ztrátě konvergence. Uvažme SLR 4x - y + z = 7 4x - 8y + z = -21 -2x + y + 5z = 15 Jacobiho iterace tohoto SLR odstartované v počáteční aproximaci x(0) = [1, 2, 2] konvergují k přesnému řešení x = [2, 4, 3], neboť matice soustavy je striktně diagonálně dominantní. Jestliže zaměníme první a poslední rovnici, tak se tato vlastnost poruší a SLR -2x + y + 5z = 15 4x - 8y + z = -21 4x - y + z = 7 při téže počáteční iteraci diverguje od přesného řešení. Poznámka 5.19. Iterační metody jsou vhodné zejména pro rozsáhlé systémy lineárních rovnic s řídkou maticí soustavy (malým počtem nenulových prvků), kde u Gaussovy eliminace bývají problémy s numerickou stabilitou (viz 5.6) a větší výpočetní nároky vzhledem k nemožnosti účelně využít případné řídkosti matice soustavy. Snažíme se vhodnou záměnou pořadí rovnic (řádkovou permutací rozšířené matice soustavy) a změnou pořadí nezávisle proměnných (sloupcová permutace matice soustavy) soustředit největší nenulové prvky kolem hlavní diagonály s cílem dosáhnout (pokud možno) striktně diagonální dominantnosti. To je zpravidla snazší u řídké matice, která se stane pásovou (nenulové prvky soustředěny kolem hlavní di- agonály). 163 ANGLICKÁ TERMINOLOGIE PRO LINEÁRNÍ ROVNICE systém lineárních rovnic (SLR) system of linear equations (SLE) matice systému matrix of the system pravá strana right-hand side vektor neznámých vector of unknowns (ne)homogenní systém (non-)homogeneous system rozšířená matice SLR augmented matrix of a SLE množina řešení solution set partikulární řešení particular solution algoritmus dopředného dosazování forward-substitution algorithm algoritmus zpětného dosazování back-substitution algorithm SLR s dolní trojúhelníkovou maticí lower-triangular SLE SLR s horní trojúhelníkovou maticí upper-triangular SLE výpočetní složitost computational complexity tridiagonální matice tridiagonal matrix pásová matice band matrix přibližné řešení approximate solution metoda nejmenších čtverců (MNČ) least-squares (LSQ) solution vážená MNČ weighted LSQ method váhová matice weight matrix maticová rovnice matrix equation numerická (ne)stabilita numerical (in)stability špatně podmíněná matice badly-conditioned matrix dobře podmíněná matice well-conditioned matrix číslo podmíněnosti condition number iterační metoda iterative method 164 6. Transformace souřadnic a diagonalizace matic Látka je předběžně zpracována v souborech TrSour.tif a DiagMat.tif, které jsou zkomprimovány v TrSour.zip a v DiagMat.zip. 165 Příloha A. Operace s komplexními čísly Nechť dále značí a := a1 + ia2, b := b1 + ib2 dvě komplexní čísla v kartézském tvaru a a = |a|(cos + i sin ) = |a|ei , b = |b|(cos + i sin ) = |b|ei jejich vyjádření v goniometrickém, resp. Eulerově tvaru. Jelikož funkce kosinus je sudá (cos(-x) = cos(x)) a funkce sinus lichá (sin(-x) = - sin(x)), dostáváme: ei = e-i a tedy a = |a|e-i a b = |b|e-i . A.1. Sečítání, odčítání. a + b := (a1 + b1) + i(a2 + b2) a - b := (a1 - b1) + i(a2 - b2) A.2. Násobení. ab = (a1 + ia2)(b1 + ib2) = (a1b1 - a2b2) + i(a2b1 + a1b2) nebo ab = |a|ei |b|ei = |a||b|ei(+) = |a||b|(cos( + ) + i sin( + )). Zejména platí aa = a2 1 + a2 2 = |a|2 . A.3. Dělení. Nechť b = 0, pak a b = ab bb = a1b1 + a2b2 b2 1 + b2 2 + i a2b1 - a1b2 b2 1 + b2 2 nebo a b = |a|ei |b|ei = |a| |b| ei(-) = |a| |b| (cos( - ) + i sin( - )). A.4. Umocňování. Tvrzení (Moivreova věta). an = |a|n (cos n + i sin n), kde n Z Důkaz. Indukcí vzhledem k |n| užitím vztahu A.2 pro násobení při n > 0, resp. vztahu A.3 pro dělení komplexních čísel při n < 0. 166 A.5. Odmocňování. 1. Druhá odmocnina v kartézských souřadnicích a1 + ia2 = (u1 + iu2), kde u1 = r 1 2 (|a| + a1) u2 = sgn(a2) r 1 2 (|a| - a1), kde sgn(a2) udává znaménko a2. 2. n-tá odmocnina Uvažme, že vzhledem k periodicitě funkcí kosinus a sinus platí a = |a|(cos +i sin ) = |a|(cos(+2k)+i sin(+2k)) = |a|ei(+2k) pro každé k Z. Odtud dostaneme ihned vztah pro všechny n-té odmocniny z a: n a = n p |a|ei +2k n = n p |a| cos + 2k n + i sin + 2k n pro k = 0, 1, . . . , n - 1. 3. n-tá odmocnina z 1 Z předchozího dostaneme volbou a = 1 všechny n-té odmocniny z 1: n 1 = ei 2k n = cos 2k n + i sin 2k n pro k = 0, 1, . . . , n - 1. Tvrzení (Vlastnosti). (1) Všechny hodnoty n-té odmocniny z komplexního čísla a dostaneme vynásobením jedné z těchto hodnot všemi hodnotami n-té odmocniny z 1. (2) Jsou-li 1, 2 n-té odmocniny z 1, pak 12 je rovněž n-tá odmocnina z 1. (3) Je-li k-tá odmocnina z 1 a l = kq, pak je rovněž l-tá odmocnina z 1. 167 (4) Je-li n-tá odmocnina z 1, pak k := k je rovněž n-tá odmocnina z 1 pro k = 0, 1, . . . , n - 1. (5) se nazývá primitivní n-tá odmocnina z 1, platí-li: (i) n = 1 (ii) k = 1 pro k = 1, 2, . . . , n - 1. (6) Je-li n-tá odmocnina z 1, pak je primitivní právě když hodnoty k jsou pro k = 0, 1, . . . , n - 1 navzájem různé. Zejména := e i2 n je vždy primitivní, neboť k = e i2k n jsou pro k = 0, 1, . . . , n - 1 navzájem různá komplexní čísla. (7) Nechť je primitivní n-tá odmocnina z 1. Pak k je primitivní n-tá odmocnina z 1 právě když n a k jsou nesoudělné. (8) Nechť p je prvočíslo, pak všechny p-té odmocniny z 1 různé od 1 jsou primitivní. A.6. Goniometrické vzorce. 1. Vyjádření goniometrických funkcí sin n, cos n pomocí sin , cos Použitím Moivreovy věty a binomické věty dostáváme: cos n + i sin n = (cos + i sin )n = = nX k=0 n k ! cosk (i)n-k sinn-k . Stačí pak porovnat reálné, popřípadě imaginární části výrazů vlevo a vpravo. Zejména pro n = 2 tak dostáváme známé vztahy pro dvojnásobný úhel: cos 2 = cos2 - sin2 , sin 2 = 2 sin cos . Ty jsou však speciálním případem obecnějších vztahů pro součet a rozdíl úhlů, získaných z A.2 volbou a1 = cos , a2 = sin a b1 = cos() = cos , b2 = sin() = sin . Jelikož |a| = |b| = 1, obdržíme: cos( ) = cos cos sin sin , sin( ) = sin cos cos sin . 168 2. Vyjádření goniometrických funkcí sinn , cosn pomocí sin k, cos k Z Eulerova vztahu dostáváme vyjádření pro sin a cos : sin = ei - e-i 2i , cos = ei + e-i 2 . Ty stačí umocnit na n-tou opět užitím binomické věty: sinn = 1 2nin nX k=0 n k ! eik (-1)n-k e-i(n-k) cosn = 1 2n nX k=0 n k ! eik e-i(n-k) . Například spočtěme sin3 = 1 23i3 (ei3 - 3ei2 e-i + 3ei e-i2 - e-i3 ) = = 1 8i3 (2i sin 3 - 3.2i sin ) = 1 4i2 (sin 3 - 3 sin ) = = 1 4 (3 sin - sin 3). 169 Příloha B. Maticová reprezentace abstraktních vektorových prostorů konečné dimenze Věta B.1. Nechť (V1, LF), (V2, LF) a (V3, LF) jsou tři vektorové prostory konečných dimenzí dim V1 = n, dim V2 = m a dim V3 = p. Pak zobrazení T [T] (T L(V1, V2)) je izomorfizmem vektorového prostoru L(V1, V2) všech lineárních operátorů z V1 do V2 (viz 3.38) na vektorový prostor všech matic Mm,n (viz 4.9). Přitom platí: (1) [Tx] = [T].[x] pro každé x V1. (2) Složení dvou operátorů T : V1 V2 a U : V2 V3 odpovídá v souřadnicovém vyjádření součin matic: [UT] = [U].[T]. (3) Maticovou reprezentací identického operátoru I : V1 V1 je jednotková matice: [I] = In. (4) Operátor T je surjektivní právě když je reprezentován maticí řádkově plné hodnosti25 . (5) Operátor T je izomorfní vnoření právě když je reprezentován maticí sloupcově plné hodnosti25 . (6) Operátor T je izomorfizmus právě když je reprezentován regulární maticí25 . Přitom platí [T]-1 = [T-1 ], kde [T]-1 je matice inverzní26 k [T]. V případě VS-prostorů (F C) navíc platí: (7) Maticovou reprezentací operátoru adjungovaného k T je hermitovsky transponovaná matice: [T ] = [T] . Zejména maticovou reprezentaci samoadjungovaného operátoru je hermitovsky symetrická matice. (8) Operátor T je unitární právě když je reprezentován unitární maticí. Důkaz. Nadále E = {e1, . . . , e1} je nějaká pevně zvolená báze ve V1. * Linearita zobrazení T [T]: [T1 + T2] = [[(T1 + T2)e1], . . . , [(T1 + T2)en]] = 25Viz definici 4.17. 26Matice určující maticový operátor inverzní k operátoru určenému maticí [T ] dle věty 4.25. 170 [[T1e1 + T2e1], . . . , [T1en + T2en]] 3.92 = [[T1e1] + [T2e1], . . . , [T1en] + [T2en]] = [[T1e1], . . . , [T1en]] + [[T2e1], . . . , [T2en]] = [T1] + [T2]. [T] = [[(T)e1], . . . , [(T)en]] = [[(Te1)], . . . , [(Ten)]] 3.92 = [[Te1], . . . , [Ten]] = [[Te1], . . . , [Ten]] = [T]. * T [T] je prosté: T1 = T2 3.35 i : T1ei = T2ei 3.92 i : [T1ei] = [T2ei] [[T1e1], . . . , [T1en]] = [[T2e1], . . . , [T2en]] [T1] = [T2]. * T [T] je surjekce: Buď A libovolná matice typu m/n. Dle 3.92 je [] surjekce, takže ke každému sloupci A(:, j) existuje vektor vj V2 tak, že [vj] = A(:, j). Podle 3.36(6) lze zobrazení ej vj rozšířit na lineární operátor V1 V2, takže [Tej] = [vj] = A(:, j) [T] = [[Te1], . . . , [Ten]] = [A(:, 1), . . . , A(:, n)] = A. * Vlastnost (1): Nechť x = Pn i=1 iei, tj. = [x]. Pak [Tx] = [T( Pn i=1 iei)] = [ Pn i=1 iTei] 3.92 = Pn i=1 i[Tei] 4.13a) = [[Te1], . . . , [Ten]]. = [T].[x]. * Vlastnost (2): [UT] = [[U(Te1)], . . . , [U(Ten)]] (1) = [[U].[Te1], . . . , [U].[Ten]] 4.15(1) = [U].[[Te1], . . . , [U].[Ten]] = [U].[T]. * Vlastnost (3): [I] = [[Ie1], . . . , [Ien]] = [[e1], . . . , [en]] = [1, . . . , n] = In. * Vlastnosti (4)­(6),(8): Označíme-li S1 : V1 Fn a S2 : V2 Fm unitární izomorfizmy přiřazení souřadnic (Si zastupije zápis [] ve 3.92), pak [Tx] (1) = [T].[x] lze psát ve tvaru S2Tx = [T].(S1x) 4.15 = [T]S1x pro každé x Fn , což je ekvivalentní s rovností složených operátorů S2T = [T]S1. Aplikujeme-li na tuto rovnost S-1 2 zleva, resp. S-1 1 zprava, obdržíme vyjádření: T = S-1 2 [T]S1, resp. [T] = S2TS-1 1 . Složení tří izomorfních vnoření (surjekcí, izomorfizmů) je zřejmě opět izomorfní vnoření (surjekce, izomorfizmus). Jelikož S1 i S2 jsou izomorfizmy (surjektivní 171 izomorfní vnoření), z výše uvedených vyjádření T a [T] vidíme, že T je izomorfní vnoření (surjekce, izomorfizmus) [T] určuje izomorfní vnoření (surjekci, izomorfizmus), což je podle věty 4.20 ekvivalentní s dokazovanými tvrzeními o matici [T]. Protože Si jsou unitární izomorfizmy a také složení tří unitárních izomorfizmů je rovněž unitární izomorfizmus, dostáváme podobně ekvivalenci s unitaritou maticového operátoru [T] a tedy i s maticí [T] (viz 4.15(8)). T izomorfizmus T-1 T = I a TT-1 = I jsou identity na V1 a V2 (2),(3) [T-1 ].[T] = In a [T].[T-1 ] = Im, což podle věty 4.25 znamená, že [T-1 ] = [T]-1 . * Vlastnost (7): Nechť x V1 a y V2 jsou libovolné. Protože [] je unitární, dostáváme užitím 3.90(3): Tx, y = [Tx], [y] (1) = [T].[x], [y] 4.15(6) = [x], [T] .[y] , x, T y = [x], [T y] (1) = [x], [T ].[y] . Pak Tx, y = x, T y [x], [T] .[y] = [x], [T ].[y] , kde [x], resp. [y] probíhá všechny prvky Fn , resp. Fm (totiž [] je izomorfizmus a tedy surjekce). Adjungovaný operátor je dle 3.82 určen jednoznačně, takže operátory určené maticemi [T] a [T ] jsou stejné. Dle úvodní části důkazu této věty existuje jednojednoznačná korespondence mezi maticemi a příslušnými operátory, takže také [T] = [T ]. 172 Příloha C. Matematické symboly v systému LATEX MATHEMATICAL FONTS DEMO (mathfont.aml) (definitions from the input file mathfont.tex assumed) Math roman \mathrm: ABCDEFGH. Math roman bold \mathbf: ABCDEFGH. Math blackboard bold \mathbb or \Bbb ABCDEFGH. Math normal \mathnormal: ABCDEFGH. Math bold normal \bm: ABCDEF GH. Math italic \mathit: ABCDEFGH . Math sans serif \mathsf: ABCDEFGH. Math typewriter \mathtt: ABCDEFGH. Math script \mathcal or \cal: ABCDEFGH. Math bold script \bcal: ABCDEFGH. Euler script \matheu or \eu: ABCDEFGH. Euler bold script \beu: ABCDEFGH. Math fraktur \mathfrak or \frak: ABCDEFGH. Math bold fraktur \bfrak: ABCDEFGH. The set of natural numbers \Nset: N The set of integers \Zset: Z The set of integers modulo N \ZNset{N}: ZN The set of rational numbers \Qset: Q The set of real numbers \Rset: R The set of complex numbers \Cset: C 173 GREEK CHARACTERS (greek.tex) Type: Print: Type: Print: Type: Print: \alpha \beta \gamma \digamma \delta \epsilon \varepsilon \zeta \eta \theta \vartheta \iota \kappa \varkappa \lambda \mu \nu \xi \pi \varpi \rho \varrho \sigma \varsigma \tau \upsilon \phi \varphi \chi \psi \omega Type: Print: Type: Print: \Gamma \varGamma \Delta \varDelta \Theta \varTheta \Lambda \varLambda \Xi \varXi \Pi \varPi \Sigma \varSigma \Upsilon \varUpsilon \Phi \varPhi \Psi \varPsi \Omega \varOmega HEBREW LETTERS (hebrew.tex) Type: Print: Type: Print: \aleph \beth \daleth \gimel 174 BINARY OPERATIONS (binoper.tex) Type: Print: Type: Print: \pm \mp \dotplus \cdot \times × \centerdot \ltimes \rtimes \leftthreetimes \rightthreetimes \ast \star \diamond \circ \bullet ˇ \div ÷ \setminus \ \smallsetminus \cap \cup \Cap \Cup \sqcap \sqcup \wedge \vee \barwedge \doublebarwedge \curlywedge \curlyvee \veebar \intercal \oplus \ominus \uplus \And & \otimes \oslash \odot \circleddash \circledast \circledcirc \boxminus \boxtimes \boxdot \boxplus \triangleleft \triangleright \lhd \rhd \unlhd \unrhd ¤ \bigtriangleup \bigtriangledown \dagger \ddagger \wr \bigcirc \amalg \divideontimes 175 BIG OPERATORS (bigoper.tex) Type: Print: Type: Print: \prod {i=1}^{n} Qn i=1 \coprod {i=1}^{n} `n i=1 \bigcap {i=1}^{n} Tn i=1 \bigcup {i=1}^{n} Sn i=1 \bigvee {i=1}^{n} Wn i=1 \bigwedge {i=1}^{n} Vn i=1 \bigsqcup {i=1}^{n} Fn i=1 \biguplus {i=1}^{n} Un i=1 \bigotimes {i=1}^{n} Nn i=1 \bigoplus {i=1}^{n} Ln i=1 \bigodot {i=1}^{n} Jn i=1 \sum {i=1}^{n} Pn i=1 \int a^b R b a \oint a^b H b a \iint {E 2} RR E2 \iiint {E 3} RRR E3 \iiiint {E 4} RRRR E4 \idotsint {E n} R R En nY i=1 na i=1 n\ i=1 n[ i=1 n_ i=1 n^ i=1 nG i=1 n] i=1 nO i=1 nM i=1 nK i=1 nX i=1 Z b a I b a ZZ E2 ZZZ E3 ZZZZ E4 Z Z En 176 BINARY RELATIONS (binrel.tex) Type: Print: Type: Print: \leq \geq \leqslant \geqslant \eqslantless \eqslantgtr \lesssim \gtrsim \lessapprox \gtrapprox \approxeq \lessdot \gtrdot \ll \gg \lll \ggg \lessgtr \gtrless \lesseqgtr \gtreqless \lesseqqgtr \gtreqqless \prec \succ \preceq \succeq \doteqdot \eqcirc \circeq \fallingdotseq \risingdotseq \triangleq \equiv \sim \simeq \backsim \thicksim \backsimeq \approx \thickapprox \preccurlyeq \succcurlyeq \curlyeqprec \curlyeqsucc \precsim \succsim \precapprox \succapprox 177 Type: Print: Type: Print: \subset \supset \subseteq \supseteq \subseteqq \supseteqq \Subset \Supset \sqsubset ` \sqsupset a \sqsubseteq \sqsupseteq \vartriangleleft \vartriangleright \trianglelefteq \trianglerighteq \vdash \dashv \vDash \Vdash \Vvdash \models |= \smile \smallsmile \frown \smallfrown \mid | \shortmid \parallel \shortparallel \asymp \cong = \bumpeq \Bumpeq \between \pitchfork \propto \varpropto \bowtie \Join I \in \ni \backepsilon \doteq . = \blacktriangleleft \blacktriangleright \therefore \because \perp 178 NEGATED BINARY RELATIONS (nebinrel.tex) Type: Print: Type: Print: \ne = \notin / \nless \ngtr \nleq \ngeq \nleqslant \ngeqslant \nleqq \ngeqq \lneq \gneq \lneqq \gneqq \lvertneqq \gvertneqq \lnsim \gnsim \lnapprox \gnapprox \nprec \nsucc \npreceq \nsucceq \precneqq \succneqq \precnsim \succnsim \precnapprox \succnapprox \nsim \ncong \nshortmid \nshortparallel \nmid \nparallel \nvdash \nvDash \nVdash \nVDash \ntriangleleft \ntriangleright \ntrianglelefteq \ntrianglerighteq 179 Type: Print: Type: Print: \nsubseteq \nsupseteq \nsubseteqq \nsupseteqq \subsetneq \supsetneq \varsubsetneq \varsupsetneq \subsetneqq \supsetneqq \varsubsetneqq \varsupsetneqq To put a slash through a symbol type \not before it, e.g. \not= gives =. 180 ARROWS (arrows.tex) Type: Print: Type: Print: \leftarrow \rightarrow or \to \longleftarrow - \longrightarrow \Leftarrow \Rightarrow \Longleftarrow = \Longrightarrow = \leftrightarrow \longleftrightarrow \Leftrightarrow \Longleftrightarrow \leftleftarrows \rightrightarrows \leftrightarrows \rightleftarrows \Lleftarrow \Rrightarrow \twoheadleftarrow \twoheadrightarrow \leftarrowtail \rightarrowtail \looparrowleft \looparrowright \uparrow \downarrow \Uparrow \Downarrow \upuparrows \downdownarrows \updownarrow \Updownarrow \nearrow \searrow \swarrow \nwarrow \mapsto \longmapsto \hookleftarrow \hookrightarrow \leftharpoonup \rightharpoonup \leftharpoondown \rightharpoondown \upharpoonleft \upharpoonright \downharpoonleft \downharpoonright \multimap \rightsquigarrow \leftrightsquigarrow \leadsto Y Type: Print: Type: Print: \nleftarrow \nrightarrow \nLeftarrow \nRightarrow \nleftrightarrow \nLeftrightarrow 181 MISCELLANEOUS SYMBOLS (miscell.tex) Type: Print: Type: Print: \hbar \hslash \imath i \jmath \ell \complement \wp \Re Re \Im Im \partial \infty \smallint \P \S § \prime \backprime \emptyset \varnothing \Bbbk k \backslash \ \diagup \diagdown \triangle \nabla \vartriangle \blacktriangle \triangledown \blacktriangledown \square \lozenge \Box P \Diamond Q \blacksquare \blacklozenge \forall \exists \nexists \neg \angle \sphericalangle \measuredangle \| \surd \Vert \top \bot \dag \ddag \flat \natural \sharp \clubsuit \diamondsuit \heartsuit \spadesuit \circledS \bigstar \mho H \eth \Finv \Game 182 Additional symbols can be made by stacking one symbol on top of another with the \stackrel command, e.g. $A \stackrel{\alpha}{\rightarrow} B$ gives A B. 183 Příloha D. Důkazy vybraných tvrzení D.1. Důkaz věty 2.19: Nechť a, b M jsou libovolné prvky. I. Ukážeme, že < je areflexivní a symetrická, je-li uspořádání (reflexivní, antisymetrická a tranzitivní relace): areflexivita: (a a) (a = a) neplatí a a tranzitivita: (a < b) (b < c) (a b) (b c) (a = b) (b = c) a c v důsledku tranzitivity relace a a = c v důsledku její antisymetrie (kdyby a = c, pak a = b je v rozporu s a = b); tedy platí (a c) (a = c) neboli a < c. II. Ukážeme, že je reflexivní, antisymetrická a tranzitivní, je-li < areflexivní a tranzitivní relace: reflexivita: (a < a) (a = a) platí a a tranzitivita: (a b)(b c) ((a < b)(a = b))((a < b)(b = c)) a odtud pro všechny čtyři možné případy: a) a = b, b = c a = c a c b) a = b, b < c a < c a c c) a < b, b = c a < c a c d) a < b, b < c a < c (tranzitivita <) a c. antisymetrie: (a b) (b a) a a v důsledku již dokázané tranzitivity (a < a) (a = a), přičemž a < a nemůže nastat (areflexivita <), a tedy platí a = a. D.2. DŮKAZ věty 2.21: (1) jsou-li a, a dva takové prvky, pak platí současně a a i a a a tedy a = a v důsledku antisymetrie. (2) a nejmenší x a x M v M neexistuje x < a a tedy a je minimální v M. (3) sporem: kdyby existovaly dva takové prvky a = a , pak vzhledem k úplnému uspořádání množiny M platí a < a nebo a < a, takže alespoň jeden z prvků a, a nemůže být maximální, resp. minimální. (4) sporem: kdyby například neexistoval minimální prvek, pak v M lze vybrat nekonečnou posloupnost prvků a1 > a2 > a3 > . . . (a1 184 vybereme libovolně, protože není minimální, existuje a2 < a1, ten také není minimální, atd.), což je spor s konečností množiny M. D.3. Důkaz věty 2.23: tato implikace plyne z tranzitivity relace < je-li a < b v konečné množině M, pak její uspořádaná podmnožina A0 := {c M | a < c b} je rovněž konečná a dle věty 2.21(4) má alespoň jeden minimální prvek t1. Pokud t1 < b vezmeme minimální prvek t2 podmnožiny A1 := {c M | t1 < c b}, atd. Vzhledem ke konečnosti množiny M musí po konečném počtu n kroků nastat případ tn = b. D.4. DŮKAZ nerovnosti z definice 2.26: Důkaz probíhá ve třech návazných krocích: I. Nejprve ukážeme, že bk b+ N pro každé k, N N: II. Ukážeme, že lim sup an je horní závora posloupnosti {bk }kN: III. Ověříme požadovanou nerovnost lim inf an lim sup an: D.5. DŮKAZ věty 2.27: (1) pro neklesající posloupnost {an} je b+ k = sup{an} n=k = sup{an} n=1 konstantní posloupnost, jejíž infimum (=lim sup{an} n=1) je tatáž konstanta sup{an} n=1. Podobně bk = inf{an} n=k = ak, takže opět lim inf{an} n=1 = sup{bk } k=1 = sup{ak} k=1. (2) se dokazuje analogicky. D.6. Důkaz věty 2.29: Tvrzení dokážeme pro supremum (postup pro infimum je analogický). a = sup P existuje a x x P f(a) f(x) f(x) f(P) f(a) je horní závora f(P). Je-li naopak t N nějaká horní závora f(P), pak t f(x) x P f-1 (t) f-1 f(x) = x x P f-1 (t) je horní závora P f-1 (t) a t = ff-1 (t) f(a) f(a) = sup f(P) existuje. Implikace [sup f(P) existuje sup P existuje] plyne z předchozího záměnou f f-1 a P f(P). 185 D.7. DŮKAZ věty 2.34: Pro zavedenou relaci ověříme, že má vlastnosti ekvivalence: reflexivita: a M = S iI Mi i I : a Mi aa. tranzitivita: ab, bc i, j I : a, b Mi; b, c Mj b Mi Mj i = j, neboť Mi Mj = pro i = j a, c Mi ac. symetrie: ab i I : a, b Mi i I : b, a Mi ba. D.8. DŮKAZ věty 2.35: Pro každé a M položme Ma := {x M | xa} (podmnožina všech prvků v M ekvivalentních s x) a M := {Ma}aM . Ukážeme, že M je rozklad na množině M: * M = a M a Ma M M = a Ma = pro každé Ma M. * pro každé a M je a Ma a Ma M, takže platí M S aM M a tedy M = S aM . * Ma Mb = c Ma Mb ac, cb. Pak x Ma xa xb v důsledku tranzitivity, neboť je xacb x Mb a tedy jsme dokázali Ma Mb. Záměnou role a a b analogicky platí též Mb Ma. Celkem tedy Ma = Mb. Závěr: dvě množiny z M jsou buď disjunktní a nebo stejné. * Celkem jsme tedy ukázali, že M tvoří na M rozklad (po vynechání duplicitních množin). Zřejmě platí xy x, y Mx. D.9. Důkaz věty 2.38: f je prosté: 1, 2 E(M), 1 = 2 [x, y] 1 - 2 nebo [x, y] 2 - 1. Nechť například [x, y] 1 - 2. Pak x, y M1 x M/1, x M2 x M/2, ale y / M2 x M1 x = M2 x v příslušných rozkladech existují alespoň dvě různé třídy, takže rozklady jsou různé množiny: f(1) = M/1 = M/2 = f(2). f je surjekce: je přímým důsledke věty 2.34 Zatím jsme tedy ukázali, že f je bijekce. f je monotonní: 1 2 M1 x := {y | y1x} M2 x := {z | z2x} pro každé x M (tj. pro všechny třídy z M/1) f(1) f(2). f-1 je monotonní: nechť naopak f(1) f(2) a x1y pro nějaká 186 x, y M. Pak y M1 x M2 x x2y a tedy 1 2. Celkem f je izomorfizmus uspořádaných množin. D.10. DŮKAZ věty 2.39: reflexivita: f(x) = f(x) x f x symetrie: x f y f(x) = f(y) f(y) = f(x) y f x tranzitivita: x f y, y f z f(x) = f(y), f(y) = f(z) f(x) = f(z) x f z. D.11. DŮKAZ důsledku 2.41: x f y f(x) = f(y) g(f(x)) = g(f(y)) (gf)(x) = (gf)(y) x gf y. D.12. Důkaz věty 2.43: I. Nechť je kongruence na M: * Je-li S nějaká n-ární relace, pak (a1, . . . , an) = 1 (a1, . . . , an) = 1 dle 2.42(i) a tedy zobrazení ,,pruh nahoře je podle 2.10(1) homomorfizmem vzhledem k . * Je-li S nějaká n-ární operace, pak (a1, . . . , an) = (a1, . . . , an) dle 2.42(ii) a tedy zobrazení ,,pruh nahoře je podle 2.10(2) homomorfizmem vzhledem k . II. Naopak nechť f je homomorfizmus, pak a1 f b1, . . . , an f bn f(ai) = f(bi) pro i = 1, . . . , n f((a1, . . . , an)) = (f(a1), . . . , f(an)) = (f(b1), . . . , f(bn)) = f((b1, . . . , bn)) pro libovolnou n-ární operaci (a1, . . . , an) f (b1, . . . , bn) f je kongruence. 187 D.13. DŮKAZ věty 3.3: (L5) a) = 0: x L4 = 1x = (1 + 0)x L2 = 1x + 0x L4 = x + 0x 0 = -x + x = -x + (x + 0x) = (-x + x) + 0x = 0 + 0x = 0x. b) x = 0: y = y + 0 y = (y + 0) L1 = y + 0 0 = -y+y = -y+(y+0) = (-y+y)+0 = 0+0 = 0. (L5) Jestliže x = 0, pak nastanou 2 případy: a) = 0, kdy tvrzení platí, nebo b) = 0, kdy x L4 = 1x = (-1 )x L3 = -1 (x) = -1 0 = 0 dle předchozí části důkazu. (L6) (-)x + x L2 = (- + )x = 0x L5 = 0, (-x) + x L1 = (-x + x) = 0 L5 = 0, Prvek opačný k x je jediný, takže -x = (-x) = (-)x. (L7) (x-y) = (x+(-y)) L1 = x+(-y) L6 = x+(-y) = x-y. (L8) (-)x = (+(-))x L2 = x+(-)x L6 = x+(-x) = x-x. (L9) Opakovaně aplikujeme axiom L1 s využitím asociativity sečítání v grupě (V, +, 0). (L10) Opakovaně aplikujeme axiom L2 s využitím asociativity sečítání v aditivní grupě (F,+ ,0). (L11) Pm i=1 i Pn j=1 xj L10 = Pm i=1 i Pn j=1 xj = 1(x1 + + xn) + +m(x1 + +xn) L9 = 1x1 + +1xn + +mx1 + +mxn =Pm i=1 Pn j=1 ixj, kde poslední rovnost je důsledkem komutativity sečítání v grupě (V, +, 0). Poslední dokazovanou rovnost dostaneme analogicky užitím L10 místo L9 (místo i před součet vektorů v závorce vytýkáme xj za součet skalárů v závorce). D.14. DŮKAZ věty 3.7: sečítání a násobení skaláry jsou operacemi struktury LF a tudíž podprostor k nim musí být uzavřen. 188 Platí-li (1) a (2), je třeba ještě ověřit uzavřenost ke zbývajícím grupovým operacím v grupě (V, +, 0) (tj. vlastnosti (2) a (3) z poznámky 2.58(2)(3)): * Jelikož W = , tak existuje x W a užitím (2) a L5 dostáváme 0 = 0x W. * Pro x W analogicky užitím (2) a L6 dostáváme -x = (-1)x W. D.15. DŮKAZ důsledku 3.8: ixi W i I dle (1) a jejich součet tedy rovněž leží ve W podle obecného asociativnícho zákona 2.46. D.16. DŮKAZ věty 3.10: Pro T iI Wi je třeba ověřit vlastnosti (1) a (2) z věty 3.7: (1) x, y T iI Wi x, y Wi i I (1) x + y Wi i I x + y T iI Wi. (2) x T iI Wi x Wi i I (2) x Wi i I a F x T iI Wi. D.17. DŮKAZ věty 3.12: (1) Položme W(G) := T {W | W je podprostor ve V : G W}. Potom W(G) je podprostor ve V dle 3.10. Z jeho konstrukce plyne G W(G) W pro každý podprostor W obsahující G. W(G) je tedy nejmenší a tudíž L(G) = W(G). Je-li G = , pak nutně W(G) = {0}, neboť 0 je prvkem každého podprostoru a {0} je nejmenší z nich dle poznámky 3.9, přičemž {0} platí triviálně. (2) Položme L(G) := { Pn i=1 ixi | i F, xi G, n N}. Pak platí: * G L(G), neboť pro každé x G je x = 1x L(G). * L(G) je podprostor dle 3.7, neboť součet dvou lineárních kombinací prvků z G je opět lineární kombinace prvků z G. Podobně pro skalární násobek: (1x1 + + nxn) L9 = (1x1) + + (nxn) L3 = (1)x1 + + (n)xn. Tedy L(G) je podprostor obsahující G a protože L(G) je nejmenší 189 takový, tak musí platit L(G) L(G). Podle 3.8 musí být L(G) uzavřen ke všem lineárním kombinacím svých prvků, tedy zejména i těch z G, takže také platí opačná inkluze L(G) L(G). Celkem jsme tak ukázali L(G) = L(G). D.18. DŮKAZ věty 3.14: (1) L(G) je podprostor 3.9 {0} L(G) 0 L(G). (2) Mohou nastat 2 případy: * M = , kdy {0} = L(M) L(G) dle (1). * M = , M L(G), kdy dle 3.8 každá lineární kombinace prvků z M padne do L(G), takže s uvážením 3.12(2) dostáváme L(M) L(G). (3) Postupujeme analogicky jako v předchozím případě: * M = {0} = L(M) L(N) dle (1). * M = , M N dle 3.8 každá lineární kombinace prvků z M je současně také lineární kombinací prvků z N, takže opět s uvážením 3.12(2) dostáváme L(M) L(N). (4) Inkluze W L(W) je přímo z definice 3.11. Naopak nechť x L(W) je libovolný prvek. Protože W = , je dle 3.12(2) x = Pn i=1 ixi, kde xi W, takže x W dle 3.8. Tedy také platí opačná inkluze L(G) W a celkem L(G) = W. (5) G - {x} G (3) L(G - {x}) L(G). Naopak: x L(G - {x}) G = (G - {x}) {x} L(G - {x}) (2) L(G) L(G - {x}). Celkem jsme dokázali L(G) = L(G - {x}). (6) (G - {x}) {x} L(G) (2) L((G - {x}) {x}) L(G). Naopak: G = (G - {x}) {-1 (x)} L((G - {x}) {x}) (2) L(G) L((G - {x}) {x}). Celkem jsme dokázali L(G) = L((G - {x}) {x}). (7) (G - {x}) {x + y} L(G) (2) L((G - {x}) {x + y}) L(G). Naopak: G = (G - {x}) {x + y - y} L((G - {x}) {x + y}) (2) L(G) L((G - {x}) {x + y}). Celkem jsme dokázali L(G) = L((G - {x}) {x + y}). 190 D.19. DŮKAZ věty 3.17: (1) Nechť = N M. Vyšetříme dva případy: a) M nekonečná lineárně nezávislá: Všechny konečné podmnožiny v N jsou také konečnými podmnožinami v M a jsou proto lineárně nezávislé, když M je lineárně nezávislá. b) M =: {x1, . . . , xn} konečná lineárně nezávislá: bez újmy na obecnosti můžeme položit N := {x1, . . . , xk}, k n. Pak 0 = 1x1 + + kxk + 0xk+1 + + 0xn 1 = = k = 0, neboť M je lineárně nezávislá. Tedy rovněž N je lineárně nezávislá. (2) 1 0 = 0, kde 1 = 0 {0} není lineárně nezávislá (1) {0} M 0 / M. (3) 0 = x - x = Pn i=1 ixi - Pn i=1 ixi () = Pn i=1(ixi - ixi) L7 =Pn i=1(i -i)xi i -i = 0 pro i = 1, . . . , n i = i -i +i = 0 + i = i pro i = 1, . . . , n. Na závěr poznamenejme, že rovnost () platí vzhledem ke komutativitě a asociativitě sečítání. (4) Tvrzení je důsledkem (1) a (3). Sporem: kdyby totiž existovala dvě různá vyjádření x = Pn i=1 ixi = Pm j=1 jyj, kde xi, yj M a i = 0, j = 0 (i = 1, . . . , n, j = 1, . . . , m), pak vhodným doplněním nulových koeficientů tato vyjádření lze přepsat jako dvě navzájem různé lineární kombinace vektorů z konečné podmnožiny N := {x1, . . . , xn}{y1, . . . , ym}. Podle (3) toto není možné (spor), neboť N je dle (1) lineárně nezávislá. D.20. DŮKAZ věty 3.18: = M V je lineárně závislá M není lineárně nezávislá v M existuje neprázdná konečná podmnožina N = {x1, . . . , xn}, která rovněž není lineárně nezávislá (srov. 3.16 a 3.17(1)) 0 = 1x1 + +nxn, kde i = 0 pro nějaké i ixi = -1x1 - i-1xi-1 - i+1xi+1 - - nxn, i = 0 L3,L6,L9 xi = (-1 i i)xi = (--1 i 1)x1+ +(--1 i i-1)xi-1+(--1 i i+1)xi+1+ +(--1 i n)xn existuje xi =: x M: x L(M - {x}). Poslední implikaci lze i obrátit, neboť stačí položit i = 1 (totiž 1 = 0) a užít L4. 191 D.21. DŮKAZ věty 3.19: (1) (2) G báze ve V 3.15 G je minimální s vlastností L(G) = V . Pak nutně G musí být nezávislá, neboť jinak by dle 3.18 existoval prvek x G: x L(G - {x}) 3.14(5) L(G - {x}) = L(G), což je spor s minimalitou G. G je maximální s touto vlastností, neboť každý další prvek x V - G leží v L(G), takže G {x} již musí být dle 3.18 lineárně závislá. (2) (3) G je dle (2) lineárně nezávislá, zbývá tedy ukázat, že generuje celý prostor. Kdyby tomu tak nebylo, pak L(G) V a můžeme vybrat nějaký prvek x V - L(G), x = 0, neboť 0 L(G). Jeho přidáním ke G dostaneme lineárně nezávislou vlastní nadmnožinu G{x} G, takže G by nebyla maximální taková (spor). K ověření lineární nezávislosti této nadmnožiny stačí ověřit, že každá její neprázdná konečná podmnožina N G {x} je lineárně nezávislá (srov. 3.16). Mohou nastat dva případy: a) N G, kdy N musí být nezávislá dle 3.17(1), neboť G je nezávislá; b) x N, kdy N =: {x, x1, . . . , xk}, xi G pro i = 1, . . . , k, k 0. Z podmínky x + 1x1 + + kxk = 0 dostáváme = 0. Při k = 0 toto plyne z L5, při k > 0 analogicky jako v důkazu D.20 předpoklad = 0 vede ke sporu x = (--1 1)x1 + + (--1 k)xk L(G). Jelikož = 0, musí být v případě k > 0 nulové i ostatní koeficienty i pro i = 1, . . . , k, neboť xi patří do lineárně nezávislé množiny G. (3) (1) Dle (3) L(G) = V platí. Zbývá ukázat, že G je minimální s touto vlastností. Kdyby tomu tak nebylo, pak existuje vlastní podmnožina G G: L(G ) = V a prvek x G-G je lineární kombinací prvků z G G 3.18 G je lineárně závislá, což je spor s (3). D.22. Důkaz důsledku 3.20: Zvolme nějakou lineárně nezávislou podmnožinu N0 v G, L(N0) = V . Alespoň jedna taková existuje: totiž V = {0} G = a existuje 0 = x G. Dle L5 pak stačí položit N0 = {x}. Pokud existuje nějaká vlastní lineárně nezávislá nadmnožina množiny N0, označme ji N1, 192 atd. Dostaneme tak konečný nebo nekonečný řetězec lineárně nezávislých množin N0 N1 N2 . . . , jehož sjednocením N = S i Ni je hledaná maximální lineárně nezávislá množina (tedy báze) obsahující N0. N je opravdu lineárně nezávislá, neboť každá její neprázdná konečná podmnožina je podmnožinou některé lineárně nezávislé množiny Ni a tudíž lineárně nezávislá dle 3.17(1). Z konstrukce plyne, že N je maximální taková (v opačném případě by musela být nekoncovým prvkem řetězce). D.23. DŮKAZ důsledku 3.22: Podle 3.20 lze z konečného systému generátorů vybrat bázi, která je ovšem také konečná. Jsou-li ve Steinitzově větě obě množiny M a N bázemi, pak jejich role lze zaměnit: V N existuje podmnožina N : card M = card N card N a současně v M existuje podmnožina M : card N = card M card M. Celkem tedy card N = card M. D.24. DŮKAZ důsledku 3.24: (1) Jestliže dim V = , pak k dim V platí triviálně. Pokud n := dim V < , tak ve V existuje báze N o n prvcích a ve větě 3.21 stačí položit M := {x1, . . . , xk}. M má právě k prvků, protože x1, . . . , xk musí být navzájem různé, když jsou lineárně nezávislé. Pak N N má tedy také k prvků a tudíž k n. Nerovnost i tvrzení o rozšíření také plyne přímo z věty 3.19(2) nebo jejího důsledku 3.20. (2) Je-li V = {0}, pak bází je prázdná množina. V opačném případě ve V existuje nenulový prvek x a jednoprvková množina {x} je dle 3.3(L5) lineárně nezávislá. Podle (1) ji lze doplnit na bázi. (3) Jestliže dim V = , pak dim W dim V platí triviálně, neboť dim W = nebo dim W < . Pokud n := dim V < , pak dle 3.19(2) ve V může existovat nejvýše n-prvková lineárně nezávislá podmnožina a tudíž každá báze W může mít nejvýše n prvků. S uvážením 3.22 a 3.23 je tedy dim W dim V . Pokud W = V , pak žádná báze W negeneruje V a nemůže být dle 193 3.19(2)(3) maximální lineárně nezávislou podmnožinou ve V a tudíž je třeba přidat nejméně jeden prvek, aby jí byla. Pak ovšem nutně dim W < dim V . (4) (i) (ii) G báze G má n prvků dle 3.22 a 3.23 a je lineárně nezávislá dle 3.19. (ii) (iii) Sporem: Kdyby lineárně nezávislá podmnožina o n prvcích negenerovala V , pak dle (1) ji lze na bázi ve V rozšířit přidáním alespoň jednoho prvku, tj. platilo by dim V > n, spor. (iii) (i) Sporem: Kdyby n-prvková množina generovala V a nebyla by bází, pak by dle 3.15 nebyla minimální taková, tj.existovala by její vlastní podmnožina rovněž generující V a platilo by tedy dim V < n, spor. D.25. DŮKAZ věty 3.27: Je-li T lineární zobrazení (tj. homomorfizmus), pak musí zachovávat všechny operace z LF, tj. zejména také grupové sečítání a násobení skaláry, což jsou právě vlastnosti (1) a (2). Má-li T vlastnosti (1) a (2), zbývá ověřit, že má i ty zbývající: a) T zachovává unární operaci výběru opačného prvku: T(-x) L6 = T((-1)x) (2) = (-1)T(x) L6 = -1 T(x) L4 = -T(x). b) T zachovává nulový prvek: T(0) L5 = T(0 x) (2) = 0 T(x) L5 = 0. Je-li T bijekce, pak inverzní zobrazení je homomorfizmus, protože vektorový prostor je strukturou bez relací (viz poznámku 2.61). Složení dvou homomorfizmů dokonce libovolných struktur je vždy homorfizmus (viz dedinici 2.10). V případě vektorových prostorů stačí pro složení dvou lineárních zobrazení T1 : V1 V2 a T2 : V2 V3 toto tvrzení snadno ověřit jen pro vlastnosti (1) a (2): (1) (T2T1)(x+y) = T2(T1(x+y)) = T2(T1(x)+T1(y)) = T2(T1(x))+ T2(T1(y)) = (T2T1)(x) + (T2T1)(y). 194 (2) (T2T1)(x) = T2(T1(x)) = T2(T1(x)) = T2(T1(x)) = (T2T1)(x). D.26. DŮKAZ důsledku 3.28: Opakovaným užitím věty 3.27 dostáváme: T(1x1 + + nxn) (1) = T(1x1) + + T(nxn) (2) = 1T(x1) + + nT(xn). D.27. DŮKAZ věty 3.29: Pro obě množiny stačí pomocí věty 3.27 ověřit vlastnosti 3.7(1)(2): a) pro N(T): (1) x1, x2 N(T) T(x1) = 0, T(x2) = 0 T(x1 + x2) = T(x1) + T(x2) = 0 + 0 = 0 x1 + x2 N(T). (2) x1 N(T), F T(x1) = 0 a T(x1) = T(x1) = 0 L5 = 0 x1 N(T). b) pro R(T): (1) y1, y2 R(T) x1, x2 V1 : y1 = Tx1, y2 = Tx2 y1+y2 = Tx1 + Tx2 = T(x1 + x2) y1 + y2 R(T). (2) y R(T), F x V1 : y = Tx a y = Tx = T(x) y R(T). D.28. Důkaz důsledku 3.30: (1) T izomorfní vnoření T je prosté kromě 0 se žádný jiný prvek ve V1 nemůže zobrazit na nulový prvek ve V2 N(T) = {0}. Nechť N(T) = {0} a Tx = Ty. Pak T(x - y) = Tx - Ty = 0 x - y N(T) x - y = 0 x = y. (2) T je izomorfizmus T je surjektivní izomorfní vnoření (1) N(T) = {0} a R(T) = V2. (3) Nechť T je izomorfní vnoření a E := {e1, . . . , en} nějaká neprázdná (n N) n-prvková množina, tj. ei = ej pro i = j. Protože T je prosté, tak obraz T(E) má tytéž vlastnosti a je tedy také n-prvková. Nechť E je navíc lineárně nezávislá. Pak 0 = 1Te1 + +nTen 3.28 = T(1e1 + + nen) 1e1 + + nen N(T) (1) = {0} 1e1 + + nen = 0 1 = = n = 0, neboť prvky E 195 jsou lineárně nezávislé. Tedy T(E) je rovněž lineárně nezávislá. Nechť naopak T zobrazí každou konečnou neprázdnou lineárně nezávislou množinu na lineárně nezávislou množinu s týmž počtem prvků. Podle (1) stačí ukázat, že v takovém případě N(T) = {0}. Pokud V1 = {0}, pak je toto splněno triviálně. V opačném případě ve V1 existuje alespoň jeden nenulový prvek. Sporem ukážeme, že žádný takový prvek nemůže ležet v N(T). Kdyby tomu tak bylo, tj. kdyby existoval 0 = x N(T), pak jednoprvková množina {x} by byla dle (L5) lineárně nezávislá a tedy podle předpokládané vlastnosti zobrazení T by musela být lineárně nezávislá také jednoprvková množina {Tx}. Je však Tx = 0, neboť x N(T) a dostáváme tak spor s 3.17(2). (4) Nechť T je izomorfizmus a E libovolná báze ve V1. Rovnost mohutností card T(E) = card E je zřejmá, neboť T je prosté. K tomu, aby T(E) byla báze stačí podle 3.19(3) ukázat, že T(E) je lineárně nezávislá a L(T(E)) = V2: a) lineární nezávislost T(E): podle definice 3.16 stačí ukázat, že každá její konečná podmnožina = N T(E) je lineárně nezávislá. To plyne bezprostředně ze (3), protože N je obrazem konečné podmnožiny T-1 (N) E, která je lineárně nezávislá dle 3.17(1). b) T(E) generuje V2: Jelikož T je surjektivní, tak každý prvek y V2 je obrazem nějakého prvku z V1 = L(E), tj. je obrazem nějaké lineární kombinace: y = T(1e1 + + nen) 3.28 = 1Te1 + + nTen L(T(E)). Tedy V2 = L(T(E)), což se mělo dokázat. Předpokládejme, že T zachovává nějakou bázi E ve V1 včetně mohutnosti. Je třeba ověřit, že pak T je izomorfizmus, neboli: a) T je izomorfní vnoření: dle (1) stačí ukázat N(T) = {0}. Podle předpokladu je T(E) báze ve V2. Nechť x N(T), pak x = 1e1 + + nen, ei E a 0 = Tx = T(1e1 + + nen) 3.28 = 1Te1 + + nTen 1 = = n = 0 v důsledku nezávislosti báze T(E) x = 0. Tedy v jádře leží pouze nulový prvek. a) T je surjekce: buď y V2 libovolný. Protože T(E) je báze ve V2, 196 tak y = 1Te1 + + nTen 3.28 = T(1e1 + + nen) pro vhodná i F a nějaká ei E. Tedy T je surjekce. D.29. DŮKAZ věty 3.32: Dle 3.30(2) stačí ověřit N([]E) = {0} a R([]E) = Fn : * x N([]E) [x]E = [0, . . . , 0] x = 0 e1 + + 0 en = 0 N([]E) = {0}. * Buď [1, . . . , n] Fn libovolná n-tice, pak x := 1e1 + +nen L(E) = V [x]E = [1, . . . , n]. Tedy každá n-tice je obrazem nějakého vektoru z V , takže []E je surjekce. D.30. DŮKAZ důsledku 3.33: (1) Nechť dim V1 = dim V2 =: n a E1 a E2 jsou nějaké n-prvkové báze pořadě ve V1 a V2. Pak dle 3.32 V1 i V2 jsou izomorfní s Fn , takže jsou nutně izomorfní navzájem: stačí složit izomorfizmy V1 []E1 --- Fn []-1 E2 --- V2. Je-li T : (V1, LF) (V2, LF) izomorfizmus a E1 nějaká n-prvková báze ve V1 pak T(E1) je dle 3.30(4) rovněž n-prvková báze ve V2 a tudíž dim V1 = dim V2 = n. (2) Nechť n := dim V1 dim V2 =: m a E1 je nějaká n-prvková báze ve V1 a E2 m-prvková báze ve V2. Libovolných n prvků vybraných z E2 generuje ve V2 podprostor dimenze n (viz 3.24(4)), který je dle (1) izomorfní s V1, takže V1 lze izomorfně vnořit do V2. Je-li naopak T : V1 V2 nějaké izomorfní vnoření, pak R(T) je podprostor ve V2 (viz 3.29) izomorfní s V1 a opět dle (1) dostáváme dim V1 = dim R(T) dim V2 s uvážením 3.24(3). D.31. DŮKAZ věty 3.36: Tato věta je shrnutím některých předchozích výsledků: (1) R(T) = {Tx | x V1 = L(E1)} 3.12(2) = {T( Pn i=1 iei) | i F, ei E1, i = 1, . . . , n; n N} 3.28 = { Pn i=1 iT(ei) | i F, T(ei) T(E1), i = 1, . . . , n; n N} 3.12(2) = L(T(E1)). 197 (2) L(T(E1)) = V2 (1) R(T) = V2 T je surjekce. (3) T : V1 V2 izomorfní vnoření T : V1 R(T) je izomorfizmus. Pak T(E1) je báze v R(T) pro každou bázi E1 ve V1 dle 3.30(4). (4) E1 báze ve V1 3.19 E1 je lineárně nezávislá ve V1 3.30(3) T(E1) je lineárně nezávislá ve V2. (5) Jedná se přímo o tvrzení 3.30(4). Je také důsledkem (3) uvážíme-li, že v případě izomorfizmu je R(T) = V2. (6) Nechť f : E1 V2 je libovolné zobrazení. Podle poznámky 3.34 hledaný operátor T je pro libovolné x V1 jednoznačně určen vztahem Tx := 1f(e1) + + nf(en), kde x = 1e1 + + nen je vyjádření vektoru x pomocí vhodných bázových prvků ei E1. Protože E1 je jakožto báze lineárně nezávislá množina (viz 3.19) je dle 3.17(4) až na případné nulové koeficienty toto vyjádření jediné, takže T je korektně definováno. Zřejmě restrikce T na E1 je právě f, neboť Te = T(1 e) = 1 f(e) = f(e) pro každé e E1. Zbývá ověřit, že takto zavedené zobrazení je lineární, tj. ověřit vlastnosti 3.27(1)(2). Jejich platnost je však bezprostředním důsledkem elementárních vlastností (L3) a (L11): * x = (1e1 + + nen) = (1)e1 + + (n)en T(x) = (1)f(e1)+ +(n)f(en) = (1f(e1)+ +nf(en)) = T(x). * Podobně pro sečítání. Nechť y = 1e1 + + nen je další vektor, kde e1, . . . , en jsme zvolili jako sjednocení bázových vektorů z vyjádření pro x a y vhodným doplněním nulových koeficientů k a j. Pak x+y = (1e1 + +nen)+(1e1 + +nen) = (1 +1)e1 + + (n + n)en T(x + y) = (1 + 1)f(e1) + + (n + n)f(en) = (1f(e1) + + nf(en)) + (1f(e1) + + nf(en)) = Tx + Ty. * Nechť navíc f (a tedy i T) je prosté zobrazení do nějaké báze E2, resp. bijekce na E2. Pak f(E1) je s uvážením 3.17(1) lineárně nezávislá podmnožina v E2 téže mohutnosti generující R(T): to plyne z 3.12(2), neboť dle konstrukce T prvky z R(T) jsou právě všechny lineární kombinace prvků z f(E1). Obraz f(E1) je tedy dle 3.19(3) báze v R(T) a podle 3.30(4) je pak T izomorfizmus V1 na R(T), a tudíž 198 izomorfní vnoření V1 do V2. Je-li f dokonce bijekce, pak f(E1) = E2 je báze ve V2, takže R(T) = V2 a T je tedy izomorfizmus. D.32. DŮKAZ věty 3.55: Pro libovolné x, y V dostáváme: x = (x - y) + y N1 x x - y + y x - y x - y . Analogicky záměnou role x a y: -( x - y ) = y - x y - x = (-1)(x - y) N2 = x - y . Protože absolutní hodnota rozdílu se od něj liší pouze znaménkem, dostáváme z obou podtržených nerovností: | x - y | x - y . Dosazením -y místo y, pak y N2 = y a platí tedy i obdobná nerovnost pro normu součtu: | x - y | = | x - -y | x - (-y) = x + y . Dokázali jsme tak levou z obou nerovností. Pravá nerovnost je vlastně přímo trojúhelníková nerovnost (N1): x y x + y N2 = x + y . D.33. DŮKAZ věty 3.59: (S5) x, y + z S3 = y + z, x S1 = y, x + z, x = y, x + z, x S3 = x, y + x, z . (S6) x, y S3 = y, x S2 = y, x = y, x S3 = x, y . (S7) 0, x L5 = 0 x, x S2 = 0 x, x = 0; x, 0 S3 = 0, x = 0 = 0. D.34. Důkaz věty 3.61: Ve speciálním případě F = R existuje jednodušší důkaz, který lze nalézt v [KaSk:V11.5 s.105]. Zde uvedeme obecný důkaz platný i pro F = C. Pro x, y V ; , F libovolné užitím (S1) až (S6) dostáváme následující úpravu jakožto speciální případ vztahu (3.1): 0 S4 x+y, x+y = x, x + x, y + y, x + y, y . Hlavní myšlenka důkazu spočívá ve vhodné volbě , tak, aby nerovnost přešla na tvar kvadratické nerovnosti At2 +2Bt + C 0, kde 199 t, A, B, C R. Položíme := t R a := ( 1 pro x, y = 0, x,y | x,y | pro x, y = 0. Pak zřejmě platí = ||2 = 1 a v případě x, y = 0 máme: x, y = x, y x, y | x, y | = | x, y |2 | x, y | = | x, y | = = | x, y | = x, y = x, y S3 = y, x . Poznamenejme, že rovnost zarámovaných výrazů je zřejmě triviálně splněna i pro druhý případ x, y = 0. Jelikož = t je reálné číslo, tak = = t a po dosazení do výše uvedené nerovnosti tato přejde do požadovaného tvaru: x, x | {z } =:A t2 + 2 | x, y | | {z } =:B t + y, y | {z } =:C 0. Tato kvadratická nerovnost platí pro libovolné t R, takže příslušná kvadratická rovnice může mít nejvýše jeden reálný kořen, což nastane právě tehdy, když její diskriminant není kladný, tj. právě když | x, y |2 - x, x y, y 0, tj. právě když | x, y |2 x, x y, y , což již po odmocnění dává dokazovanou nerovnost (S8). Zbývá už jen ověřit, kdy nastane rovnost. Pokud x, y jsou lineárně závislé, například y = ax, pak | x, y | = | x, ax | = |a x, x | = |a| x 2 = |a| x x = x ax = x y a rovnost platí. Nechť naopak platí rovnost. Pak mohou nastat dvě situace: a) x = 0 nebo y = 0, kdy x = 0 y nebo y = 0 x a x, y jsou tedy lineárně závislé (viz též 3.17(2)); b) x = 0 a y = 0. Nastane-li rovnost v (S8), pak při popsané volbě , to znamená, že platí rovnost i ve výchozí nerovnosti, tj. 0 = x + y, x + y S4 x + y = 0 při = t a ||2 = 1, tj. zejména = 0 a x, y jsou tedy lineárně závislé. 200 D.35. DŮKAZ důsledku 3.62: Pro x := p x, x ověříme platnost axiomů (N1)­(N3). (N1) x+y 2 S9 = x+y, x+y (3.1) = x, x + x, y + y, x + y, y S3 = x, x + x, y + x, y + y, y = x, x + 2Re x, y + y, y x, x +2| x, y |+ y, y S8,S9 x 2 +2 x y + y 2 = ( x + y )2 x + y x + y . (N2) x = p x, x S2,S6 = p x, x S9 = p ||2 x 2 = || x . (N3) x = 0 p x, x = 0 x, x = 0 S4 x = 0. D.36. Důkaz věty 3.63: Je-li V VS-prostor, pak podobně jako při ověřování axiomu (N1) v předchozím důkazu dostáváme: x + y 2 + x - y 2 = ( x 2 + x, y + y, x + y 2 ) + ( x 2 - x, y - y, x + -y 2 ) = 2( x 2 + y 2 ). Platí-li v NL-prostoru (S10), zavedeme v něm skalární součin následovně pomocí tzv. polarizační identity: x, y := 8 >< >: 1 4 { x + y 2 - x - y 2 } pro F = R 1 4 { x + y 2 - x - y 2 + +i( x + iy 2 - x - iy 2 )} pro F = C. Ověření axiomů (S3) a (S4) je snadné zatímco (S1) a (S2) vyžadují poněkud větší úsilí. D.37. DŮKAZ věty 3.66: (a) ie1, jej = ij ei, ej = 0 pro libovolné i, j {1, . . . , n}, i = j, neboť ei, ej = 0 v důsledku ortogonality ei ej. (b) ei = 0 i = 1, . . . , n N3 ei = 0 i = 1, . . . , n a { 1 ei ei} je ortogonální dle (a), přičemž 1 ei ei N2 = 1 ei ei = 1, takže je celkem ortonormální. 201 D.38. DŮKAZ věty 3.67: x y x, y = y, x = 0 x + y 2 = x + y, x + y = x, x + x, y + y, x + y, y = x, x + y, y = x 2 + y 2 . D.39. DŮKAZ věty 3.68: Nechť {e1, . . . , en} E je libovolná konečná podmnožina. Jelikož E je ortogonální s nenulovými prvky, tak ei, ej = 0 i, j {1, . . . , n}, i = j a ej, ej = 0 dle (S4). Pak Pn i=1 iei = 0 pro libovolné j {1, . . . , n} dostáváme 0 S7 = 0, ej =Pn i=1 iei, ej = Pn i=1 i ei, ej = j ej, ej j = 0 pro každé j = 1, . . . , n, neboť ej, ej = 0. Tedy e1, . . . , en jsou lineárně nezávislé a E rovněž dle definice 3.16, neboť výběr konečné podmnožiny byl libovolný. D.40. DŮKAZ důsledku 3.69: E báze ve V pro každé x V existují i F, ei E, i = 1, . . . , n taková, že x = Pn i=1 iei x, ej = Pn i=1 iei, ej = Pn i=1 i ei, ej = j ej, ej = j ej 2 = j pro každé j = 1, . . . , n vzhledem k ortonormalitě E. Toto vyjádření je přitom jediné možné dle 3.17(4). D.41. DŮKAZ důsledku 3.70: Dle 3.69 můžeme po případném doplnění nulových koeficientů zapsat x i y jako lineární kombinaci týchž vektorů: x = Pn i=1 iei a y = Pn j=1 jej, kde ei E pro i = 1, . . . , n. Pak x, y = Pn i=1 iei, Pn j=1 jej (3.1) = Pn i,j=1 ij ei, ej = Pn i=1 ii. x = y x = p x, x = qPn i=1 ii = pPn i=1|i|2. Vztahy pro souřadnice i = x, ei a j = y, ej dostáváme z 3.69. D.42. Důkaz věty 3.71: a) M je podprostor: dle 3.7 stačí ukázat uzavřenost M vzhledem k sečítání a násobení skaláry: x1, x2 M x1, y = 0, x2, y = 0 pro každé y M x1 + x2, y S2 = x1, y + x2, y = 0 + 0 = 0 pro každé y M x1 + x2 M . 202 x M x, y = 0 pro každé y M x, y S2 = x, y = 0 = 0 pro každé y M a F x M . b) L(M) M : x L(M) x y pro každé y L(M) x y pro každé y M L(M) x M . c) M L(M) : x M x M. Buď y L(M) libovolný, pak existují i F a yi M, i = 1, . . . , n: y = Pn i=1 iyi a x, y = x, Pn i=1 iyi (3.1) = Pn i=1 i x, yi | {z } =0 = 0. Tedy x L(M) . d) M N N M : zřejmé neboť každý prvek kolmý na N musí být též kolmý na M, když platí M N. D.43. DŮKAZ věty 3.73: Pro každé i I platí: Wi Wj pro i = j Wi S j=i Wj 3.71,3.72 Wi L( S j=i Wj). Pokud x Wi L( S j=i Wj), pak x x 0 = x, x S4 x = 0. Tedy Wi L( S j=i Wj) = {0} pro každé i I a tudíž součet W = P iI Wi je přímý podle definice 3.43. D.44. DŮKAZ věty 3.74: Nechť W je nějaký přímý doplněk ortogonální k W, pak samozřejmě W W . Zbývá ukázat i opačnou inkluzi. Nechť tedy naopak x W je libovolný prvek, pak x = w + w , kde w W a w W , přičemž 0 = x, w = w + w , w S1 = w, w + w , w | {z } =0 = w, w S4 w = 0 x = w W . Platí tedy také W W a tedy celkem W = W . D.45. DŮKAZ důsledku 3.75: Plyne ze symetrie V = W W = W W ve větě 3.74: záměnou role W a W dostáváme W = W a PW x = x = x - x = Ix-PW x = (I-PW )x, takže I-PW = PW je skutečně operátorem ortogonální projekce. D.46. DŮKAZ věty 3.76: (1) x W PW1 x = x, neboť x = x + 0, kde 0 je kolmý na 203 každý vektor (viz 3.65) a tedy zejména 0 W (tvrzení plyne též přímo z 3.52 a 3.53, protože PW je dle 3.74 projekční operátor). PW1 x = x x W1, neboť PW1 x W1. (2) x W 1 3.75&(1) (I-PW1 )x = x x-PW1 x = x PW1 x = 0. (3) Pro každé x V platí x = PW1 x+x , x W 1 a tedy PW2 x = PW2 (PW1 x) + PW2 x . Odtud: PW2 x = PW2 (PW1 x) x V PW2 x = 0 x V PW2 y = 0 y W 1 (2) y W 2 y W 1 W 1 W 2 3.71 W2 W1 s uvážením identit W1 = W 1 , W2 = W 2 plynoucích z 3.75. Zdůvodněme ještě podrobněji implikaci (opačná implikace je zřejmá, neboť x W 1 ): Libovolné y W 1 lze uvážit v roli x, neboť W 1 V . Jelikož PW1 y (2) = 0, tak y = y a PW2 y = PW2 y = 0. D.47. DŮKAZ věty 3.77: a) Vlastnost nejlepší aproximace: Buď x V libovolně, ale pevně zvolený. Pak pro každé y W dostáváme: x - y = x - bx | {z } =x + bx - y | {z } W S11 x - y 2 = x - bx 2 + bx - y 2 | {z } 0 x - bx 2 . Tedy x - bx je nejmenší prvek uspořádané množiny { x - y | y W} a tudíž její infimum dle 2.25. b) bx je jediný: Nechť ex W je prvek s vlastností x-ex = x-bx = infyW x - y . Položíme-li y = ex v důkazu a), pak x - ex 2 = x - bx 2 + bx - ex 2 0 = bx - ex 2 N3 bx = ex. c) Souřadnice prvku bx: Je-li W = L(E), kde E je ONB ve W, pak i = bx, ei = x - x , ei = x, ei - x , ei | {z } =0 = x, ei je dle 3.69 jediné souřadnicové vyjádření. 204 D.48. DŮKAZ věty 3.78: Indukcí vzhledem k n: n = 1: e1 = v1 3.17(2) = 0 je báze ve W = W1 = L(e1), která je triviálně ortogonální, neboť je jednoprvková. Indukční krok pro n > 1: Podle indukčního předpokladu (I.P.) nechť tvrzení platí pro n - 1. Zřejmě v1, . . . , vn-1 je lineárně nezávislá (viz 3.17(1)) a tedy dle 3.19(3) tvoří bázi ve Wn-1 := L({v1, . . . , vn-1}). Dle I.P. je Wn-1 = L({e1, . . . , en-1}), kde e1, . . . , en-1 je ortogonální báze, tj. zejména ej ek pro j = k a ej = 0; j, k {1, . . . , n - 1}. Ukážeme, že totéž platí i po doplnění této báze o prvek en: * ortogonalita: en = vn -PWn-1 vn 3.74 W n-1 en {e1, . . . , en-1} a tedy celkem máme ej ek pro každé j, k {1, . . . , n}, j = k. * en = 0 sporem: Kdyby en = 0, pak vn = PWn-1 vn Wn-1 = L(v1, . . . , vn-1) 3.18 v1, . . . , vn jsou lineárně závislé, takže dle 3.19(3) nemohou tvořit bázi, spor s předpokladem věty. * L({e1, . . . , en}) ? = Wn: Inkluze je zřejmá, neboť e1, . . . , en Wn. v1, . . . , vn-1 Wn-1 = L({e1, . . . , en-1}) L({e1, . . . , en}) vn = en + Pn-1 j=1 vn,ej ej 2 ej L({e1, . . . , en}) 3.14(2) Wn = L({v1, . . . , vn}) L({e1, . . . , en}). Celkem tedy e1, . . . , en je ortogonální báze ve W podle 3.68. Výpočet projekce v k-tém kroku: PWk-1 vk 3.77 = Pk-1 j=1 vk, ej ej ej ej S6 = Pk-1 j=1 1 ej vk, ej ej ej , neboť { ej ej }k j=1 je dle 3.66(b) ortonormální báze vzniklá normalizací ortogonální báze {ej}k j=1. D.49. DŮKAZ věty 3.79: Tvrzení o existenci OB, resp. ONB plyne z toho, že dle 3.24(2) má každý vektorový prostor bázi, kterou lze dle 3.78 ortogonalizovat a případně dle 3.66(b) i normalizovat. 205 Tvrzení o doplnění plyne z toho, že každá ortogonální množina s nenulovými prvky je dle 3.68 lineárně nezávislá, takže ji lze dle 3.24(1) doplnit na bázi a tu pak ortogonalizovat užitím 3.78, kde zřejmě dostaneme ej = vj, pokud vj jsou pro j = 1, . . . , k již ortogonální. Totiž suma ve vztahu pro vk se vynuluje v důsledku vk Wk-1, kdy vk, ej = 0 pro j = 1, . . . , k - 1. D.50. DŮKAZ věty 3.80: Nechť dim W =: n < . Vzhledem k 3.73 stačí ukázat V = W +W . K tomu stačí ověřit V W + W , neboť opačná inkluze platí vždy. Podle 3.79 existuje ve W nějaká ONB, označme ji E =: {e1, . . . , en}. Zvolme x V libovolně a položme w := Pn i=1 x, ei ei W. Potom x-w E, neboť x- Pn i=1 x, ei ei, ej S1 = x, ej - Pn i=1 x, ei ei, ej = x, ej - x, ej = 0 pro každé j vzhledem k ortonormalitě E, kdy eiej = 0 pro i = j a ejej = ej 2 = 1. Podle 3.72 je x - w W a x = w|{z} W + x - w | {z } W 3.45(2) x W + W . D.51. Důkaz věty 3.82: a) Jednoznačnost: Nechť T a T jsou dvě zobrazení s vlastností: Tx, y = x, T y = x, T y x V1 a y V2 S5 0 = x, T y-T y x V1 a y V2 speciálně pro x = T y-T y dostáváme 0 = T y - T y, T y - T y y V2 S4 T y - T y = 0 y V2 T y = T y y V2 T = T . b) Linearita T : Pro libovolná x V1, y, y1, y2 V2 a F je třeba ověřit vlastnosti (1) a (2) z věty 3.27: (1) x, T (y1+y2) = Tx, y1+y2 S5 = Tx, y1 + Tx, y2 = x, T y1 + x, T y2 S5 = x, T y1 + T y2 a) T (y1 + y2) = T y1 + T y2. (2) x, T (y) = Tx, y S6 = Tx, y = x, T y S6 = x, T y a) T (y) = T y. D.52. DŮKAZ věty 3.85: Pro libovolně zvolené prvky x V1, y V2, z V3 ověříme (1)­(4). 206 Využijeme přitom jednoznačnosti adjungovaného operátoru garantované větou 3.82: (1) T y, x S3 = x, Ty = Tx, y S3 = y, Tx 3.82 T = T . (2) (UT)x, z = U(Tx), z = Tx, U z = x, T (U z) = x, (T U )z) 3.82 (UT) = T U . (3) Ix, y = x, y = x, Iy 3.82 I = I. (4) (T T) (2) = T T (1) = T T a podobně (TT ) (2) = T T (1) = TT TT i T T jsou samoadjungované operátory. Dále s uvážením 3.84 platí: T Tx, x = Tx, T x (1) = Tx, Tx S4 0 T T je pozitivní. TT y, y = T y, T y S4 0 TT je pozitivní. D.53. Důkaz věty 3.86: (1) (2) P = PW 3.74 x V : x = PW x + x , kde x W x - PW x W. (2) (1) W + W V platí triviálně. Naopak V W + W rovněž platí, neboť pro každé x V je x = Px|{z} W + x - Px | {z } W . Tedy celkem V = W + W = W W , přičemž z jednoznačnosti tohoto rozkladu (ortogonální součet je totiž přímým součtem dle 3.73) dostáváme PW x = Px x V P = PW je operátorem ortogonální projekce na W. (1) (3) Je-li P operátorem ortogonální projekce (tj. P = PW ), pak je dle 3.74 speciálním případem projekčního operátoru a tudíž lineární a splňuje P2 = P (viz 3.52, 3.53). Vlastnost P2 = P můžeme ověřit i přímo: u := Px W; Pu W u - Pu W W = {0} Px = u = Pu = P(Px) = P2 x x V . Zbývá ověřit samoadjungovanost P = P . Zvolme x, y V libovolně. 207 Pak Px, y = bx, by + y S5 = bx, by + bx, y | {z } =0 = bx, by + x , by | {z } =0 S1 = bx + x , by = x, Py . (3) (2) Položme M := {x V | Px = x}. Zřejmě M W. Platí i opačná inkluze. Totiž pro každé x V je Px M, neboť Px = P2 x = P(Px) W = R(P) M. Celkem tedy M = W. Pak pro každé u M = W a x V dostáváme: x - Px, u S1,S2 = x, u - Px, u = x, u - x, P u = x, u - x, Pu = x, u - x, u = 0. Tedy x - Px W pro každé x V . D.54. DŮKAZ věty 3.87: 3.86(3) P = P P = P P 3.85(4) P je pozitivní. D.55. Důkaz věty 3.88: (1) x N(T) Tx = 0 Tx, y = 0 y V2 x, T y = 0 y V2 x R(T ) . Zdůvodněme ještě podrobněji implikaci (opačná implikace je důsledkem S7): položíme-li y = Tx, pak Tx, Tx = 0 S4 Tx = 0. Záměnou role T a T dostáváme N(T ) = R(T ) 3.85(1) = R(T) . (2) je speciálním případem (1) při T = T . (3) ˇ N (T) ? N (T T): x N(T) Tx = 0 T Tx = T 0 = 0 x N(T T). * N(T) ? N(T T): x N(T T) T Tx = 0 S7 0 = x, T Tx 3.82 = Tx, Tx S4 Tx = 0 x N(T). * N(T ) ? = N(TT ) plyne z již dokázaného záměnou role T a T : N(TT ) 3.85(1) = N(T T ) = N(T ). (4) T surjektivní R(T) = V2 N(T ) (1) = R(T) = V 2 = {0}, neboť jediný prvek ve V2 kolmý na V2 a tedy i kolmý sám na sebe je dle 3.65 právě jen nulový prvek. Pro T se analogické tvrzení dokáže opět záměnou role T a T . 208 (5) Nechť například dim R(T) < . (i) V2 3.80 = R(T) R(T) (1) = R(T) N(T ). (ii) V2 (i) = N(T ) R(T) 3.74 R(T) = N(T ) . (iii) a) R(TT ) ? = R(T): Inkluze R(TT ) R(T) je zřejmá, neboť každý prvek y R(TT ) je tvaru y = TT y , kde T y V1 a tedy y R(T). Pak dim R(TT ) dim R(T) dle 3.24(3) a (ii) lze tak aplikovat i na operátor TT : V2 V2: R(TT ) (ii) = N((TT ) ) 3.85(4) = N(TT ) (3) = N(T ) (ii) = R(T). b) R(T T) ? = R(T ): Inkluze R(T T) R(T ) platí analogicky jako v případě a). K důkazu opačné inkluze je však třeba užít jiný postup, neboť není garantována konečnost dimenze prostoru R(T ): Libovolný prvek x R(T ) je tvaru x = T y, kde V2 y (i) = by + y , by R(T), y N(T ). Pak ovšem x = T (by + y ) = T by + T y | {z } =0 = T by R(T) a tedy existuje x V1: by = Tx a tudíž x = T Tx , takže x R(T T). (iv) R(T T) (iii) = R(T ) T |R(T ) je surjekce na R(T ) a tedy R(T |R(T )) = R(T ). N(T |R(T )) = {y R(T) | T y = 0} = R(T) N(T ) (ii) = N(T ) N(T ) = {0}, neboť dle 3.65 jedině nulový vektor může být kolmý sám na sebe. Celkem T |R(T ) je tedy podle 3.30(2) izomorfizmem. Podle 3.33 platí dim R(T) = dim R(T ) =: n < . Při důkazu (iv) jsme ukázali, že také dim R(T ) < . Vzhledem k rovnosti T 3.85(1) = T můžeme všude v (5) provést záměny T Y T , T Y T, V1 Y V2 a V2 Y V1, což dá duální tvrzení dosud nedokázaná v (i),(ii) a (iv): V2 = R(T) N(T ) Y V1 = R(T ) N(T), N(T ) = R(T) Y N(T) = R(T ) a 209 T |R(T ) je izomorfizmus Y T|R(T ) je izomorfizmus . Z týchž důvodů je možno (5) analogicky dokazovat s výchozím předpokladem dim R(T ) < namísto zde užitého dim R(T) < . (v) je důsledkem (i) a vět 3.73 a 3.49. (vi) T izomorfizmus 3.30(2) N(T) = {0} (i) V1 = R(T ) T je surjektivní. Protože T je také surjektivní, tak podle (4) je T současně izomorfním vnořením. Celkem tedy T je izomorfi- zmus. Buďte x V1 a y V2 libovolně zvolené prvky. Jelikož T je izomorfizmus a tudíž surjekce, tak x = T y pro vhodné y V2. Pak T-1 y, x = T-1 y, T y = TT-1 y, y = y, y = y, (T )-1 x a tedy (T-1 ) = (T )-1 vzhledem k jednoznačnosti dle 3.82. D.56. Důkaz věty 3.90: (1) (3) T unitární pro nějakou ONB E ve V1 je T(E) rovněž ONB ve V2 téže mohutnosti, zejména tedy je zobrazení T : E1 E2 bijekcí. Zvolme x, y V1 libovolně. Pak podle 3.69 existuje konečně mnoho e1, . . . , en E, ei = ej pro i = j tak, že x = Pn i=1 iei a y = Pn j=1 jej. Pak Tx = Pn i=1 iTei a Ty = Pn j=1 jTej, kde Tei = Tej pro i = j. Oba vektory i jejich obrazy mají tedy stejné souřadnice v ONB E i v ONB T(E), takže dle 3.70 platí: Tx, Ty = Pn i=1 Pn j=1 j = x, y . T je také surjektivní, neboť je dle 3.89 izomorfizmem. (3) (2) * T je izomorfizmus: x N(T) Tx = 0 0 S4 = Tx, Tx (3) = x, x S4 x = 0, takže N(T) = {0}. Současně také platí R(T) = V2, neboť T je surjekce. Celkem je tedy T izomorfizmus podle 3.30(2). * T zachovává ortonormální báze: Je-li E libovolná ONB ve V1, pak T(E) je podle 3.30(4) bází ve V2 téže mohutnosti. Zbývá ověřit její ortonormalitu: 210 a) Pro každý prvek Te T(E) je Te S9 = p Te, Te (3) = p e, e S9 = e = 1. b) Pro libovolné dva prvky Te1, Te2 T(E), Te1 = Te2 jistě platí také e1 = e2, e1 e2, takže Te1, Te2 (3) = e1, e2 = 0 Te1 Te2. (2) (1) Podle předpokladu věty existuje ve V1 alespoň jedna ONB, která se při platnosti (2) zobrazí na ONB ve V2 téže mohutnosti, takže T je podle definice 3.89 unitární. (3) (4) Tx S9 = p Tx, Tx (3) = p x, x S9 = x x V1, kde T je surjektivní. (4) (3) Pro libovolné x, y V1 lze výpočtem opírajícím se o (S9) a bilinearitu 3.1 skalárního součinu ověřit (cvičení) platnost tzv. polarizační identity (viz též důkaz rovnoběžníkového zákona D.36) 27 : x, y = 1 4 { x + y 2 - x - y 2 + i( x + iy 2 - x - iy 2 )} ve V1 a Tx, Ty = 1 4 { Tx + Ty 2 - Tx - Ty 2 + + i( Tx + iTy 2 - Tx - iTy 2 )} ve V2, kde Tx Ty = T(x y) (4) = x y a podobně Tx iTy = T(x iy) (4) = x iy implikuje Tx, Ty = x, y . (3) (5) Již byla ukázána ekvivalence (3) (1), takže T je unitární a zejména izomorfizmus dle 3.89. Proto T-1 existuje a pro každé x V1 a y V2 můžeme psát: x, T-1 y (3) = Tx, TT-1 y = Tx, y 3.82 T = T-1 . (5) (6) T = T-1 T T = T-1 T = I a TT = TT-1 = I. 27člen v kulaté závorce se dá upravit na tvar 2i( y, x - x, y ), takže v případě F = R se vynuluje v důsledku symetrie (S3'). 211 (6) (3) TT = I T je surjekce a současně pro každé x, y V1 platí Tx, Ty 3.82 = x, T Ty = x, Iy = x, y . Pokud T je unitární, tak T-1 rovněž: totiž pro každé x, y V2 je T-1 x, T-1 y (3) = TT-1 x, TT-1 y = x, y , přičemž samozřejmě T-1 je izomorfizmus a tedy zejména surjektivní. Pro T-1 tak platí (3) a je proto unitární. D.57. Důkaz důsledku 3.92: dim V < 3.79 ve V existuje ONB. Pak []E : V Fn je izomorfizmus dle 3.32 (tedy i surjekce), který je dokonce unitární na základě 3.90(3), neboť pro ONB E =: {e1, . . . , en} a každé x, y V dostáváme: x, y 3.70 = Pn i=1 ii 3.64 = , 3.69 = [x]E, [y]E , kde i = x, ei a i = y, ei . D.58. Důkaz důsledku 3.93: Protože v konečně rozměrných prostorech lze dle 3.79 vždy vybrat ortonormální báze, tak izomorfizmy, resp. izomorfní vnoření z důkazu D.30 důsledku 3.33 budou podle 3.92 unitární, jestliže navíc uvážíme triviální fakt, že skládáním unitárních izomorfizmů, resp. izomorfních vnoření dostáváme opět unitární izomorfizmus, resp. izomorfní vnoření. Totiž složení dvou lineárních zobrazení majících např. vlastnost 3.90(2), resp. 3.91(2') bude jistě zase lineární zobrazení s touž vlast- ností. 212