1. NĚCO MÁLO K DUALITĚ Nechť U C V je vektorový podprostor a uvažujme vložení a k němu duální surjektivní zobrazení t* : V* -» U*, které je zřejmě dáno předpisem r] i—> r)\jj. Definujme U± = ker 6* = {77 G V* | Vu G C/ : (u, 77) = 0}, kde podmínku (u,rj) = 0 si lze představovat jako "U _L neboli r) £ ř7^"; proto také tento podprostor duálního prostoru značíme tímto symbolem. Pokud je V reálný vektorový prostor se skalárním součinem, je zobrazení R:V^V*, «h>(«,-) izomorŕismus a lze jej použít pro ztotožnění V* s V. Při tomto ztotožnění U1 tn{v€V \ Vu€U :(u, Rv) = 0}, přičemž (u,Rv) = Rv(u) = (v,—)(u) = (v,u). Jedná se tedy o opravdový kolmý doplněk a není špatné si jej takto představovat i pokud nemáme skalární součin k dispozici. Vraťme se nyní do obecné situace. Přiřazení U 1—> je zobrazení Dy : {podprostory V} —> {podprostory V*}, které zjevně obrací uspořádání, tj. pokud Uq C U±, pak Uq J5 U^. Navíc, pokud U má dimenzi d, pak má dimenzi n — d (také říkáme, že má kodimenzi d). To je proto, že je jádrem surjektivního zobrazení V* -» U* z n-rozměrného do evv 1—> evv \ jj±. Při identifikaci v = v** je tedy ř7J"L množina všech vektorů v, které se nulují na všech formách z U^. Protože se však všechny formy z podle definice nulují na U, platí U C U^^. Zároveň mají oba prostory stejnou dimenzi, musí být tedy totožné, ULL = U. Věta 1.1. Zobrazení U 1—> určuje bijektivní zobrazení Dy : {podprostory V} —> {podprostory V*} s následujícími vlastnostmi • Dy převrací uspořádání, • je-li U dimenze d, pak DyU = je dimenze n — d, . (u0nu1)± = u(j- + ut, 1 2 Důkaz. Vseje důsledkem prvního bodu, dokonce i vztah mezi dimenzemi. Můžeme totiž vyčíst dimenzi U jako délku d nejdelšího striktně rostoucího řetězce podprostorů 0 = Uq C U\ C ■■■CUd = U. □ Pěknou aplikací je popsání svazku všech rovin v prostoru procházejících danou přímkou p. Přechodem ke kolmým doplňkům to znamená popsat všechny přímky obsažené v rovině p^. To je ale jednoduché - jejich směrové vektory jsou právě všechny nenulové prvky p^. Pokud je p zadaná implicitně jako řešení soustavy a(v) = (3{v) = 0 dvou rovnic, je p^ = [a, (3] a přímka ležící v p^ je proto generovaná libovolnou jejich nenulovou lineární kombinací aa + b(3. Přechodem zpátky vidíme, že rovnice odpovídající roviny obsahující p je {aa + b/3)(v) = 0, ve výsledku tedy libovolná nenulová lineární kombinace definujících rovin přímky p. Dalším vztahem mezi podprostory V a V* je ten mezi implicitním a parametrickým popisem. Nechť je podprostor W C V* zadán parametricky jako W = [i]1,... ,i]k]. Potom W± = {v G V | V?? G W : (v, rj) = 0}. Protože je však W popsán parametricky, stačí podmínky zkontrolovat na generátorech, W± = {v G V | (v, r]1) = • • • = (v, r]k) = 0}. To je ale popis jako prostoru řešení soustavy lineárních rovnic ^(v) = 0,... ,i]k(v) = 0, tedy implicitní popis. Stejný princip funguje naopak. Je-li U = [v±,..., Vd], pak ^={»16^1 (Vl,v) = --- = (vd,r,)=0.} Formálně tak převod parametrického popisu na implicitní je elementární. Parametrický popis U je ekvivalentní implicitnímu popisu U^, ten lze pomocí vyřešení soustavy s parametry převést na parametrický popis, který je zpětně ekvivalentní implicitnímu popisu U. Tvrzení 1.2. Nechi jsou na V zadány formy r]0,!]1,..., r)k. Jestliže libovolné v G V splňující rfiv) = • • • = 7]k{v) = 0 splňuje zároveň rf(v) = 0, pak r]° G [i]1,..., r]k]. Poznámka. Opačná implikace je triviální: je-li rf G [i]1,..., r]k], pak z ^(v) = ■ ■ ■ r]k(v) = 0 plyne jednoduše rf{v) = 0. V případě implikace {^{v) = ••• = r]k(v) = 0) (i]°(v) = 0) můžeme mluvit o tom, že rovnice rp{v) = 0 je logickým důsledkem zmíněné soustavy. Věta tedy říká, že pokud je rp(v) = 0 logickým důsledkem, je ve skutečnosti "algebraickým" důsledkem; lze odvodit ze soustavy tím nejtriviálnějším možným způsobem - je kombinací rovnic soustavy. V jistém smyslu se jedná o úplnost jistého logického systému: implikace, které platí, jsou právě ty, které lze dokázat (pomocí zmíněného jednoduchého pravidla). Důkaz. Implikaci lze vyjádřit jako [r]°,r]1,...,r]k]± = [r]1,...,r]k]±. Druhou aplikací Dy dostáváme [r]°, rj1,..., rjk] = [rj1,..., rjk] a zejména r/0 G [r/1,..., rjk\. □ Následující tvrzení je dobře známe z teorie řešení soustavy lineárních rovnic a lze jej vyvodit z Gaussovy eliminační metody. Uvádíme zde alternativní důkaz pomocí duality. Tvrzení 1.3. Soustava rovnic Ax+b = 0 nemá řešení, právě když existuje lineární kombinace jejích řádků (tedy rovnic) tvaru 1 = 0. 3 Důkaz. Trik spočívá v "projektivizaci" soustavy. Původní soustava nemá řešení, právě když každé řešení soustavy Ax + bt = 0 splňuje také t = 0. Podle předchozího tvrzení to nastane právě když forma zadaná řádkem (0,..., 0,1) je lineární kombinací řádků rozšířené matice (A\b). □ 2. NĚCO MÁLO K TENZOROVÉMU SOUČINU Pointa tenzorového součinu je, že chceme převést bilineární zobrazení na lineární. Konkrétně bilineární zobrazení U x V —» W bude ekvivalentní lineárnímu zobrazení U ® V —> W. Symbolicky Lin2([/, V; W) *á Hom([/ ®V,W), kde však pro úplnost říkáme víc než v předchozím - vyžadujeme, aby se jednalo o izomor-fismus vektorových prostorů (a ne jen o bijekci). Tímto vztahem je tenzorový součin určen jednoznačně až na izomorfismus a ve většině aplikací není potřeba znát přesnou definici a vystačíme si s touto vlastností. Pokusme se s její pomocí "odvodit" definici tenzorového součinu. Dosaďme do uvedeného vztahu W = k. Dostáváme Lin2([/,F;k) 2í (U®V)*. Budeme-li nyní předpokládat, že má U ® V konečnou dimenzi, lze psát U®V ^Lin2([/,F;k)* Chceme-li tedy dostát tomu, že tenzorový součin převádí bilineární zobrazení na lineární, jsme vedeni k následujícímu: Definice 2.1. Nechť U a V jsou vektorové prostory konečné dimenze. Definujeme jejich tenzorový součin U ® V d= Lin2(ř7, V; k)*. Definujme nyní bilineární zobrazení t : U x V —> U ®V předpisem t(u,v) : 3> 1-4- $(u,v), jedná se tedy o "evaluaci" (viz srovnání druhého duálu s původním vektorovým prostorem). V následujícím budeme značit u ® v = t(u, v) a je to tedy zobrazení, které každou bilineární formu posílá na její hodnotu na dvojici (u,v). Lemma 2.2. Zobrazení t je bilineární, tj. {a\u\ + a2u2) ® v = ai • ui ® v + a2 • u2 ® v a analogicky pro druhou složku. Důkaz. Levá strana je dána evaluací <í> 1-4- <í>(ai«i + a2u2, v), zatímco pravá je dána jako lineární kombinace evaluací, tedy <í> 1-4- ai$(«i, v) + a2í>(n2, v). Tyto dva výrazy se rovnají díky bilinearitě <í>. □ Věta 2.3. Nechť vektory {ej | i = l,...,n}, tvoří bázi prostoru U a vektory {ěj \ j = 1,..., m}, tvoří bázi prostoru V. Pak vektory {ej ®ej \ i = 1,..., n; j = 1,..., m}, tvoří bázi prostoru U ® V. 4 Poznámka. Při práci s tenzorovým součinem je výhodnější se vzdát uspořádání prvků báze a pracovat s neuspořádanými bázemi. V dalším budeme zkracovat na "{e^} je báze U". Před tím, než budeme moct dokázat předchozí větu, je dobré popsat bázi prostoru všech bilineárních forem. Nechť tedy máme báze jako ze znění věty a k nim duální báze f1 a f3. Definujme bilineární formu /'•.P : T x T - {u,v)^ř{u)f!{v) (součin funkčních hodnot - prvků tělesa k). Prvně dokážeme Lemma 2.4. Množina {fl ■ f1} tvoří bázi Lin2(ř7, V;k). Důkaz. Pointou důkazu je, že dvě bilineární formy se rovnají, právě když dávají stejné hodnoty na všech dvojicích (er,es) bázových vektorů. Pokusme se napsat bilineární formu <ř jako kombinaci -ľ »,ŕ-u"-.pi. i, j Tato rovnost bude podle předchozího splněna, právě když pro každé r, s bude platit $(er, ě8) = ^ ®íj ■ (ľ ■ fj)(er,es) = JI ®ij f'^r) = 4 si Je tedy vidět, že koeficienty existují a to jediné, <řrs = <ř(er,es). To ale přesně znamená, že daná množina je báze. □ Důkaz Věty 2.3. Ukážeme nyní, že {ej ®ej} tvoří duální bázi k bázi {/* • f1} z lemmatu. Stačí tedy počítat (e* ® e,){ľ ■ ľ) = (f • f= ľ{el)Js{e]) = ó^, což je 0 s výjimkou případu i = r, j = s. To je ale přesně podmínka na duální bázi. □ Vraťme se nyní ke vztahu, který jsme použili k motivaci definice tenzorového součinu a ověřme, že opravdu platí. Připomeňme kanonické zobrazení t : U x V —> U ® V dané (u, v) i—> u (g> v. Věta 2.5. Existují přirozené izomorfismy Hom([/ ® V, W) -=-► Lm2(U, V; W) <-=- Hom([/, Hom(F, W)), první z nichž je dán p i—> p o í. Důkaz. První izomorfismus je zjevně lineární zobrazení a jedná se o bijekci podle univerzální vlastnosti tenzorového součinu. Druhé zobrazení posílá / : U —> Hom(V, W) na (u,v) ^ f(u)(v). Je to přesně zobrazení zprostředkující bijekci (Wv)u = WUxV, kterou znáte z diskrétní matematiky, jenom je zúžené na vhodně lineární zobrazení. Jeho inverze posílá g : U x V —» W nau4 g(u, —), kde g(u, —) je "parciální zobrazení" v i—> g(u,v). □ Tvrzení 2.6. Zobrazení U* 0 V* Lin2([/, V; k) = (U 0 V)* dané předpisem r) ® 6 i—> ?j • 9 je izomorfismus. 5 Důkaz. Zobrazení převádí bázi f1 (g> f3 na bázi fl ■ f3. □ Jakožto zobrazení U (8> V —» k je obraz r] ® 6 dán předpisem m0d h> • #(v) a lze jej tedy popsat jako kompozici kde přirozený izomorŕismus k (g> k = k je dán předpisem a (g> 6 i—?► a&. V dalším budeme potřebovat analogii předchozího tvrzení pro antisymetrické tenzory. Z technických důvodů změníme předchozí zobrazení vynásobením konstantou q\. Tvrzení 2.7. Zobrazení AqV* —> Jj'mq(V,... ,V; k)antiSym dané předpisem r]1 A • • • A rf ^ ^ sign a ■ rf^ • • • r]a{-q) je izomorfismus. Důkaz. Prvně se zabývejme tím, jaký efekt na multilineární formu příslušnou tenzoru t £ (V*)®q má permutace a: (PaiV1 ® • • • ® í?9) )(«1, • • • ,Vg) = (í?^^ 0 • • • (g> V^XVl, ...,Vg) = Va(1)(v1).....rr(9)(vq)=ri1(va-Hl)).....ri9(v*-Hg)) = (rj1 ® •••®í79)(uť7-i(i)'---'^-1(9)) Proto obecně platí (po-íX^i) • • • ,vq) = t{va- ■ ■ ■ ^a-1^)) a zejména t je antisymetrický, právě když je antisymetrická příslušná multilineární forma. Proto se izomorfismus z předchozího tvrzení zúží na izomorfismus AqV* s podprostorem antisymetrických g-lineárních forem. Vynásobení číslem q\ na tom nic nezmění. □ Vysvětleme nyní, proč je vynásobení číslem q\ výhodné. Je to proto, že platí (f A-Af')(eíl,...,S) = l. To se nám bude hodit v příští kapitole. Uveďme nyní ještě verzi věty o determinantu pro antisymetrické multilineární formy. Je-li p : U —> U lineární zobrazení, platí ((^Tfa1 ® • • • ® Vn))(ui, ...,Un) = (K)) = (V1 ® • • • ® 77n)((ui), • • • , ^(«n)) a stejný vztah tedy platí i pro antisymetrické n-lineární formy, íj),.. .,p(un)) = ((* )An U. Jeho vnější mocnina (ip*)An ■ Ant/* AnU* totiž posílá Vol na nějaký násobek Vol a z části o vnějších mocninách víme, že je to právě Vol((/5(ui),.. .,p(un)) = (det 0. Vraťme se nyní k obecné situaci reálného vektorového prostoru U. 7 Věta 3.3. Dvě báze a, (3 jsou shodně orientované, právě když je lze spojit cestou, tj. právě když existuje spojité zobrazení 7 : [0,1] U x • • • x U = Un splňující následující • 7(0) = a, 7(1) = (3 a • pro každé t £ [0,1] je n-tice *y(t) bází U. Poznámka. Spojitost jistě dává smysl pro U = W1. Avšak libovolný (konečně rozměrný) reálný vektorový prostor je izomorfní W1 a spojitost lze definovat ve smyslu tohoto izomorfismu -hlavně na volbě takového izomorfismu nezávisí. Důkaz. Není těžké se přesvědčit, že každou čtvercovou matici s kladným determinantem lze napsat jako součin elementárních s kladným determinantem. Prohození dvou sloupců lze nahradit kompozicí operací / —> / + II —> II — I, I —> I + II, která samozřejmě zároveň s prohozením sloupců také jeden z nich vynásobí číslem —1, ale Gaussova eliminace lze provádět i s touto operací. Vynásobení dvou sloupců číslem —1 lze nahradit provedením dvou předchozích složených operací za sebou. Dále není těžké se přesvědčit, že každá z elementárních matic Tj s kladným determinantem lze spojit s jednotkovou maticí E cestou Ti procházející pouze maticemi s kladným determinantem. Jejich součin T = T\ - ■ • pak lze spojit s jednotkovou maticí jednoduše pomocí cesty íM.ri(í)---rfe(í). Jelikož však platí a = (3 ■ T, hledaná cesta mezi bázemi a, (3 lze volit například jako ŕM./3.ri(ŕ)"-rfe(ŕ). V opačném směru veličina (det id7(í-)a) G Mx závisí spojitě na t a její hodnota pro t = 0 je 1. Proto i její hodnota pro t = 1 musí být kladná, tj. (detid^) > 0 a báze a, (3 jsou shodně orientované. □ Důležitým příkladem objemové formy je objemová forma vzniklá ze skalárního součinu na orientovaném Eukleidovském prostoru £. To by nemělo být překvapující - skalární součin na £ udává smysl velikosti vektorů a úhlů mezi nimi; z těchto údajů lze objem spočítat. Objemová forma však udává orientovaný objem, proto je navíc potřeba ještě volba orientace. Z jiného úhlu pohledu na Eukleidovském prostoru jsou dvě objemové formy a není žádný důvod preferovat jednu z nich; ten nastává až při zafixování orientace. Pro neorientovaný Eukleidovský prostor bychom mohli nadefinovat pouze neorientovanou objemovou "formu" | Vol |; k ní se vrátíme za chvíli. Nechť (ei,...,en) je libovolná kladně orientovaná ortonormální báze. Kanonickou objemovou formu zafixujeme požadavkem Vol(ei,... ,en) = 1. Je-li (Z1,..., fn) duální báze, pak platí (ŕ a • • • a r)(ei, ...,en)=Y^ sigw r(1)(ei) • • • r(n)(en) = 1, neboť jediný nenulový člen se objevuje pro a = id. Lze tedy položit \ol = f1 A---Afn. Z tohoto vztahu lze vidět, že objemová forma nezávisí na volbě kladné ortonormální báze -matice přechodu mezi dvěma ortonormálními bázemi je ortogonální a má tedy determinant ±1; pokud jsou báze navíc kladné, musí být roven 1 a to stejné platí pro determinant matice přechodu mezi duálními bázemi (je totiž stejný). Ve výsledku pro jinou volbu báze (ei,..., en) a k ní duální (f1,..., fn) platí Vol = f1 A • • • A P = f1 A • • • A fn. Pro orientovaný objem platí vztah /fini) ••• /VnA Vol(Ul,...,un) = signa ■f^1\u1)---f^n\un) = det : : Jelikož fl{uj) je i-tá souřadnice vektoru Uj, můžeme výpočet shrnout v následujícím. Tvrzení 3.4. Orientovaný objem Vol(«i,... ,un) lze spočítat jako determinant matice, jejíž j-tý sloupec je tvořen souřadnicemi vektoru u j v libovolné kladné ortonormální bázi (ta však musí být stejná pro všechny sloupce). Jeho druhou mocninu lze spočítat jako Gramův determinant (Vol(«i,..., un))2 = det((ui,Uj)) z matice, jejíž prvek na pozici je skalární součin (uí, Uj). Důkaz. Druhé tvrzení plyne z prvního vynásobením popsaných matice zleva maticí k ní transponovanou. Na pozici dostaneme součin i-tého a j-tého sloupce, tedy Y^fk{^)fk{uJ) = {u^uJ) k (jedná se o vzorec pro skalární součin v ortonormálních souřadnicích). □ Jako důsledek dostáváme vzorec pro neorientovaný objem na Eukleidovském prostoru jako odmocninu z Gramová determinantu - ten závisí pouze na skalárním součinu a nikoliv na orientaci. Z tohoto pohledu lze interpretovat Gramův-Schmidtův ortogonalizační proces jako vzorec pro objem. Během něj totiž měníme každý vektor pouze přičítáním násobků předchozích vektorů a nemění se tedy orientovaný objem. Přitom po provedení celého procesu a pro vzniklý ortogonální systém (v±,... ,vn) je Gramová matice diagonální a neorientovaný objem je tak roven | Vol(«i,.. .,un)\ = |«i| • • • \vn\, součinu velikostí vektorů v±,..., vn. Znaménko je též jako u původního orientovaného objemu a je tedy určeno tím, zdaje (u±,..., un) báze kladná či záporná (v případě, že se nejedná vůbec o bázi, je objem beztak nulový). Přitom velikost vektoru ví je rovna výšce rovnoběžnostěnu určeného u±,..., uí s podstavou danou prvními i — 1 vektory. Jedná se tedy o vzorec objem rovnoběžnostěnu = objem postavy x výška Hlavní význam této formulky je v tom, že po několika stránkách je snad konečně zřejmé, proč tomuto objektu říkáme orientovaný objem. 9 4. Geometrie v rovině a prostoru Prvně se zabývejme rovinou £2, kterou budeme chápat jako M2 se standardním skalárním součinem a standardní orientací. Ta je mimochodem totožná s tou vzniklou z komplexní struktury na C = l2. Pro vektory u, v £ £2 počítejme neorientovaný objem z Gramová determinantu (Yol(u,v))2 = kde a je úhel mezi vektory u, v a rovnost plyne z (u, v) = \u\\v\ cos a. Odmocněním dostáváme vztah |Vol(u,u)| = sin aI. Standardně bereme a £ [0, tt] , díky orientaci můžeme nyní rozšířit definiční obor na a G (—7T, 7r] a zvolit znaménko podle orientace (u, v). Mluvíme pak o orientovaném úhlu od vektoru u k vektoru v a můžeme psát u1 v1 v? v2 Budeme psát a = <(u,v). Orientovaný úhel se hodí v úlohách, ve kterých je potřeba (zejména algoritmicky) rozhodnout o viditelnosti objektů v rovině. Dalším případem je úloha rozhodnout, zda mnohoúhelník A\ ■ ■ ■ An zadaný posloupností vrcholů je kladně či záporně orientovaný (v případě, že nevíme, zda je konvexní). Velice jednoduchým způsobem (alespoň z teoretického pohledu) je spočítat všechny orientované úhly <(AnAi, AľA2), <(A±A2, A2A3),..., <(An^An, AnA{) podél mnohoúhelníka a sečíst je. Pokud je součet roven 2tv, je mnohoúhelník kladně orientovaný, pokud — 2tv, je záporně orientovaný. Ostatní případy nemohou pro mnohoúhelník nastat a lze takto i detekovat některé případy, kdy se nejedná o mnohoúhelník (zdaleka ne však všechny). V případě, kdy je mnohoúhelník konvexní, budou mít všechny úhly stejné znaménko a to lze spočítat pomocí orientovaného objemu (u čtyřúhelníku stačí spočítat znaménka i v nekonvexním případě). Jiným řešením je sečíst orientované objemy \ Vol(AiA2, A1A3) + ••• + £ Vol(AiAn_i, AiAn). Pokud je výsledek kladný, je mnohoúhelník kladně orientovaný a naopak. Příklad 4.1. Ukažme nyní, že výše uvedený součet vyjadřuje obsah mnohoúhelníku A\ ■ ■ ■ An. V prvním kroku dokážeme o něco obecněji, že součet Vol(XA1,XA2) + --- + Vol(XAn-1,XAn)+Vol(XAn,XA1) nezávisí na volbě bodu X. To je tím, že Vol(YAi, YAi+1) = Vol(YX + XA,t, YX + XAi+1) = Vol(XAi,XAi+1)+Vol(YX,XAi+1)+Vol(XAi,YX), kde členy Vol(YX, XAi+1) se při sečtení vyruší se členy Vol(XAi,YX) = — Vol(YX, XA-i). V dalším kroku ukážeme, že existuje vnitřní diagonála AíAj, která protíná mnohoúhelník pouze v koncových bodech. Pak lze induktivně předpokládat, že vzorec pro obsah funguje pro oba mnohoúhelníky vzniklé rozdělením podél AíAj a jejich sečtením dokázat, že tento vzorec funguje také pro náš mnohoúhelník. Nechť Ai je bod s nejmenší x-ovou souřadnicí. Pokud (u, u) {u, v) (v,u) (v,v) I |2| |2 \u\ \v\ (u,vý 1 i2i i2 ■ 2 \u\ \v\ sm a, = Vol(u,v) = \u\\v\ siná. 10 leží uvnitř trojúhelníku nějaký další vrchol mnohoúhelníku, zvolíme za Aj ten s nejmenší x-ovou souřadnicí. Pokud ne, zvolíme za dělící diagonálu Aí-iAí+i. Poznámka. Orientovaná Eukleidovská rovina1 je kanonicky (jednorozměrným) komplexním vektorovým prostorem: izomorŕismus C —> V je zadán tím, že posílá 1 i—> e± a i i—> e2, kde (ei,e2) je libovolná kladně orientovaná ortonormální báze. Jiná volba se liší o matici z SO(2) = U(l) a proto je komplexní struktura jednoznačná. Tím lze také definovat orientovaný úhel mezi nenulovými vektory u,v jako 0 a je tedy (u, v, u x v) kladně orientovaná (za předpokladu, že se jedná o bázi; v opačném případě však u x v = 0 a jeho orientaci není potřeba určovat). Ve skutečnosti stačí mít skalární součin zadán až na násobek — takové struktuře se říká konformní; lze v ní měřit úhly a porovnávat velikosti. Typickým příkladem konformního zobrazení, které není ortogonální, je stejnolehlost. 11 Zbývá spočítat velikost u x v. Pomocí Gramová determinantu \u x v\2 = (u x v, u x v) = Vol(u, v, u x v) = = (\u\2\v\2-(u,v)2)1/2-\uxv\ Pomocí úhlu a mezi vektory u, v dostáváme finální vztah \u x v\ = \u\\v\ siná. Tentokrát není možné přiřadit úhlu a orientaci jako v rovinném případě. Věta 4.2. Vektorový součin má následující vlastnosti (které ho jednoznačně určují) • Vektorový součin — x — je antisymetrické bilineární zobrazení. • Vektor u x v je kolmý na u a v. • Vektor u x v je nenulový, právě když jsou u, v lineárně nezávislé a pak • báze (u, v, u x v) je kladně orientovaná. • Platí \u x v\ = \u\\v\sin<(u, v). 5. Mooreova-Penroseova pseudoinverze Nechť p : U —> V je lineární zobrazení mezi Eukleidovskými prostory. Zabývejme se otázkou, zda existuje inverzní zobrazení a v případě, že neexistuje, otázkou, jak blízko se k inverzi můžeme přiblížit. Nechť tedy ip :V ^ U ]e libovolné zobrazení a zkoumejme složení ipp a ífnj). Zřejmě je ipip = 0 na ker tp a nejlepší, co můžeme očekávat, je, že bude toto složení rovno identitě na nějakém doplňku ker U se nazývá Mooreova-Penroseova pseudoinverze lineárního zobrazení tp : U —> V, jestliže • tpíp = id na (ker ip)1- a • iptp = id na (keľp)^. Protože je vždy ipp = 0, je první podmínka ekvivalentní tomu, že ipp je kolmá projekce na (ker p)^. Lemma 5.2. Pro Mooreovu-Penroseovu pseudoinverzi platíimp = (keiíp)^. Důkaz. Podle druhé podmínky z definice platí (ker tp)1- C im ip, ukážeme nyní opačnou inkluzi. Prvně si uvědomme, že platí pipp = p — na kei p jsou obě strany nulové a na (keip)^ to plyne z první podmínky. Jinými slovy tato rovnost znamená, že píp = id na \~rnp. Zároveň je však kompozice píp projekce, musí tedy nutně imp ležet v jejím obraze (keiíp)^. □ Symbolicky budeme situaci z předchozí definice/lemmatu znázorňovat diagramem f (ker ip)1- , = ; im p e Ve ker (ker p)^ značí, že je nulové na komplementu (ymp)^ a jeho komponenta v ker)^ = ker ip a ip je Mooreovou-Penroseovou pseudoinverzí tp. Tímto dostáváme jednoduše následující tvrzení. Tvrzení 5.3. Nechť p> : U —> V je lineární zobrazení mezi Eukleidovskými prostory (konečné dimenze). Potom Mooreova-Penroseova pseudoinverze existuje a je jediná. Značíme ji ip+. □ Tradičně se Mooreova-Penroseova pseudoinverze definuje pomocí singulárního rozkladu (singulár value decomposition). Tento přístup je výhodný i z dalších důvodů. Uvažujme proto adjungované zobrazení tp* : V —> U. Lemma 5.4. Zobrazení pŕp> je samoadjungované a platí (ip*ip(u),u) > 0 (říkáme, že ip*p> je pozitivně semidefinitní). Navíc ker( a můžeme ji zvolit tak, že [ur+i,... ,um] = ker (p>*p>) = ker p> a tím pádem ...,ur] = (kerť/j)"1. Nechť vlastní čísla příslušná u±,..., um jsou Ai,..., Am. Podle naší volby Ar+i = • • • = Am = 0 a zbylá Aj jsou nenulová. Stále podle předchozího lemmatu platí Xi = (XíUí,uí) = {p>*p>{ui),Ui) > 0 Zkonstruujme nyní vhodnou ortonormální bázi V, vzhledem k níž bude mít p> co nejjednodušší tvar. Prvně se zabývejme obrazem tp, který je generován íp{u\),..., ip{ur): ((«i)l = V^i = sí-Tato čísla nazýváme singulární hodnoty zobrazení tp. Položíme pro i = 1,..., r a doplníme v±,..., vr do ortonormální báze (3 = (v±,..., vn) prostoru V. 13 Vzhledem k těmto bázím má

)> \o (tato matice má rozměry m x n). Poznamenejme, že matice adjungovaného zobrazení tp* je "stejná", akorát má rozměry n x m. V těchto bázích je také extrémně jednoduché napsat Mooreovu-Penroseovu pseudoinverzi -i J a/3 0 o V o 7 Tímto souřadnicovým zápisem se často Mooreova-Penroseova pseudoinverze definuje. Elegantně to lze provést následující úvahou. Pracujme pro jednoduchost ve standardních Eukleidovských prostorech a místo p> pracujme s maticí M. Ve výše popsaných bázích a, (3 má M diagonální matici, označme ji S. To znamená, že lze psát M = PĽQ*, kde P, Q jsou ortogonální matice. Tomuto rozkladu matice M se říká singulární rozklad. Mooreovu-Penroseovu pseudoinverzi potom můžeme spočítat jako M+ = QT,+ P*, kde S+ vznikne (tak jako výše) z diagonální matice S inverzí všech nenulových prvků. Poznamenejme ještě, že z matice {p)pa lze také odvodit geometrický význam singulárních hodnot. Uvážíme-li v U jednotkovou sféru, pak její obraz při zobrazení p je (v některých směrech možná zdegenerovaný) elipsoid, jehož délky poloos jsou právě singulární hodnoty. Tvrzení 5.5. Platí následující vztahy • Je-li p injektivní, potom p+ = (p*p)~1 Je-li p surjektivní, potom p>^ má ip*ip na diagonále pouze čísla sf. Proto ((p*^)^1 existuje a má na diagonále čísla s^2 a tím pádem pravá strana má na diagonále prvky s^1. Týž diagonální tvar levé strany jsme odvodili před tvrzením. Podobná analýza funguje v případě surjektivního tp. □ Věta 5.6. Platí (1) (p(p+(p = (p (2) ip+ipip+ = ip+ (3) >p+p> je samoadjungované (4) ipip+ je samoadjungované Naopak každé zobrazení splňující tyto čtyři vztahy je Mooreovou-Penroseovou pseudoinverzi. 14 Důkaz. Je jednoduché ověřit vztahy z tvrzení pro Mooreovu-Penroseovu pseudoinverzi; vlastnosti (3) a (4) platí proto, že příslušné kompozice jsou kolmé projekce na podprostory imtp a (ker (f)^. V tomto i opačném směru je podstatné si uvědomit, že projekce je samoadjungovaná, právě když je kolmá2. Podle (1) a (3) je (f+(f samoadjungovaná projekce (neboť ((p+(p)2 = (p+(f) ve směru kei(ip+ip) = kenp, nutně tedy kolmá. Proto je jejím obrazem (ker Zn odpovídají přesně celočíselným maticím typu m x n. Matice A G MatnxmZ odpovídá homomorfismu x i—> Ax. Důkaz. Každý homomorfismus grup tp : Z" které ale můžou být libovolné: 1 je jednoznačně určen obrazy 0 a tyto jsou potom určené zcela jednoznačně. V dalším budeme vždy tuto volbu preferovat. 17 Důkaz. Hlavním krokem je pomocí řádkových a sloupcových operací vyrobit v levém horním rohu největší společný dělitel všech prvků matice, dále pomocí něj vyeliminovat všechny prvky pod ním a vpravo od něj a následně použít indukci. Základním krokem je vytvoření největšího společného dělitele prvků ležících v témž řádku nebo sloupci. K tomu budeme využívat Eukleidův algoritmus, který spočítá největšího společného dělitele následujícím způsobem: jsou-li a, b taková, že \a\ > vydělíme číslo a číslem b se zbytkem, a = qb + r. Potom gcd(a, b) = gcd(r, b). Po konečném (ve skutečnosti velmi malém) počtu kroků vyjde r = 0; potom příslušné b v tomto kroku je hledaný největší společný dělitel. Vraťme se nyní k naší matici A. Prvně přesuňme na pozici (1,1) pomoci operací libovolný nenulový prvek matice A (rozmyslete si zvlášť případ A = 0). V dalších krocích se bude vždy prvek na této pozici zmenšovat, díky čemuž bude náš algoritmus konečný. Pomocí Eukleidova algoritmu a jeho implementací pomocí řádkových a sloupcových operací můžeme dosáhnout toho, že prvek v levém horním rohu dělí všechny prvky pod ním a také vpravo od něj, íb\ 0 ••• 0\ 0 * * B = ^0 * • • • *J Pokud by nyní prvek b\ nedělil nějaký prvek matice B, můžeme jej pomocí přičtení řádku dostat do prvního řádku a pomocí předchozího opět na pozici (1,1) vyrobit prvek (nutně menší!), který jej již dělit bude. Po konečném počtu kroku tak b\ dělí všechny prvky matice B. Na submatici vzniklou vynecháním prvního řádku a sloupce můžeme použít indukční předpoklad a převést jej na Smithův normální tvar. Protože b\ dělil všechny prvky této submatice, dělí i levý horní roh jejího Smithova normálního tvaru (z konkrétního popisu ze znění věty) a tím pádem i všechny ostatní prvky. Zbývá dokázat jednoznačnost. Podle předchozího jsou nutně matice P a Q součinem elementárních matic. Zároveň je téměř jasné (přesně to dokážeme v následujícím odstavci), že pravá strana (1) pro Smithův normální tvar je právě součin q± ■ ■ - qi. Stačí tak ukázat, že pravá strana je invariantní vůči řádkovým operacím (invariance vůči sloupcovým operacím pak plyne ze symetrie). Vraťme se prvně krátce k největšímu společnému děliteli subdeterminantů matice B v Smithově normálním tvaru. Zřejmě, pokud submatice obsahuje k-tý řádek, nikoliv však k-tý sloupec matice B, pak její determinant je nulový (jelikož obsahuje nulový řádek). Proto stačí uvažovat submatice složené z nějakých řádků a týchž sloupců. Ty jsou diagonální a jejich determinant je roven součinu prvků na diagonále - libovolných i prvků diagonály B. Tedy největší společný dělitel z (1) je gcd{gfcl ■■■qki I l 0 a jako (—a) • (—%), pokud a < 0. Toto označení by čtenáři mělo být známe z multiplikativního zápisu xa, kde značí přesně to stejné. Výhodou tohoto zápisu je, že v každé (komutativní) grupě umíme automaticky násobit celými čísly, můžeme se tedy bavit o celočíselných kombinacích a používat okamžitě některé další pojmy z vektorových prostorů. Nechť xi,..., xn 6 M jsou libovolné prvky komutativní grupy M. Uvažujme následující homomorfismus grup p:Zn^M, (ai,..., an) 1-4- aixi H----anxn, který není od věci zapisovat jako "řádkový vektor" (x±,... ,xn) (ve vektorových prostorech jsou vektory brány jako sloupcové a proto se jejich n-tice - zejména báze - organizují do řádků. To má tu výhodu, že je můžeme jednoduše zprava násobit sloupcem koeficientů a dostat tak jejich lineární kombinace. Případně je můžeme zprava násobit maticemi a dostat nové soubory vektorů, hlavně pak nové báze. Přesně to samé máme na mysli zde). Lemma 8.1. Zobrazení tp je skutečně homomorfismus grup. Navíc platí (1) p je surjektivní, právě když prvky x±,..., xn generují M. (2) p je injektivní, právě když jsou "lineárně nezávislé nad Z ". □ Omezme se nyní na situaci, kdy prvky x±,..., xn generují M. Potom je p podle předchozího surjektivní a z algebry známe následující fakt. M ^ Zn/kerp K pochopení konečně generovaných komutativních grup bude tedy dobré zkoumat grupu Zn a její podgrupy. Věta 8.2. Každá podgrupa Zn je opět konečně generovaná a ve skutečnosti izomorfníZm pro nějaké m Z, (ai,..., an+1) h-» an+i Opět p{M) C Z je podgrupa a tedy p{M) = Z • a. Nechť c G M je nějaké takové, že a = p(c). Dále uvažme podgrupu ker p C Zn+1, která je zřejmě izomorfní Zn a můžeme tedy na ní aplikovat indukční předpoklad. Nechť tedy Mnkerp = <6i,...,6m) Tvrdíme nyní, že M = (b±,..., bm, c). Uvažme proto libovolné x G M. Podle konstrukce máme p{x) = ka a x = kc + {x — kc), kde x — kc G M D ker p a tedy x = kc + Zi&i H-----h /m6m. Podrobnějším prozkoumáním důkazu lze též dokázat induktivně, že prvky b±,... ,bm,c jsou lineárně nezávislé nad Z, pokud jsou lineárně nezávislé b±,..., bm a a ^ 0. □ Poznámka. Podobné tvrzení pro nekomutativní grupy neplatí. Existuje grupa, která je generována dvěma prvky (jedná se o volnou grupu na dvou generátorech), která obsahuje jako podgrupu grupu, která je generovaná třemi, čtyřmi, ... prvky a dokonce i podgrupu, která není konečně generovaná. Přejděme nyní k hlavnímu konceptu této části - prezentacím. Nechť M je komutativní grupa generovaná prvky x±,..., xn a uvažme surjektivní homomorfismus

: Zm -» kerp. Zavedeme-li pro složení Zm —> ker p Zn označení A, budeme vzniklou situaci zapisovat zm -A+ in M. V každé takové posloupnosti budeme vyžadovat, aby p> byl surjektivní homomorfismus grup a ker p> = im A. Potom dostáváme izomorfismus M^Zn/ker(^ = Zn/imA. Všimněme si, že pravá strana Zn/im A závisí pouze na homomorfismu (matici) A. Říkáme proto, že A prezentuje komutativní grupu M. Poznámka. Prezentace grupy M lze definovat konkrétněji pomocí generátorů M a relací mezi nimi. Generátory e±,..., en grupy Zn odpovídají (zvoleným) generátorům x±,..., xn grupy M a generátory grupy Zm budou odpovídat relacím mezi x±,..., xn. Obrazy generátorů e j G Zm jsou nějaké celočíselné kombinace aij-ei H-----h anjen. Z podmínky ker p> = im A plyne, že analogické kombinace ClljXi -\- ' ' ' -\- ClnjXn 20 jsou nulové. To jsou přesně ony zmiňované relace mezi generátory M a M je v jistém smyslu "nejobecnější" komutativní grupa s generátory xi,...,xn splňujícími tento systém relací. Přesněji, je-li ./V jiná komutativní grupa s prvky yi,... ,yn splňujícími tytéž relace aijVi H-----h anjyn = 0, existuje jediný homomorfismus grup M —» N posílající X{ na y i. Tento fakt nebudeme dokazovat, poznamenejme ale, že plyne (celkem snadno) z univerzální vlastnosti kvocientu Zn /im A. Konečně generované komutativní grupy jsou ve výsledku prezentovány celočíselnými maticemi. Nyní ukážeme, že ze znalosti Smithova normálního tvaru lze prezentovanou grupu zcela zrekonstruovat, samozřejmě až na izomorfismus. Obecněji se zabývejme případem ekvivalentních matic a jimi prezentovaných komutativních grup 1 m a v u? n /Li Q t lLi P 7/ m v n? n íLi t ĺLí A' 4- + M' Tvrdíme, že naznačený homomorfismus M —> M' existuje a je to navíc izomorfismus. Prezentované grupy můžeme ztotožnit s kvocienty podle obrazů a hledáme tedy homomorfismus Zn/imA^Zn/imA'. Ten lze jednoduše definovat předpisem x + im A i—> Px + im A'. Jelikož se každý jiný reprezentant třídy x + im A liší od x o prvek tvaru Ay, příslušná pravá strana se změní o třídu prvku PAy = A'Qy G im A' a zůstane proto stejná; zobrazení je dobře definované. Inverzní zobrazení je určené týmž předpisem s P nahrazeným P-1. Tento výsledek lze vyjádřit heslem: izomorfní prezentace určují izomorfní grupy. Zabývejme se nyní tím, jakou grupu prezentuje matice ve Smithově normálním tvaru. Lemma 8.3. Je-li A ve Smithově normálním tvaru s nenulovými prvky qi\---\qr na diagonále, pak Zn/imA^Z/qi x ■■■Z/qr x ZIl-'r Důkaz. Potřebné zobrazení se definuje snadno (xi, ...,xn) +imA i-> ([xi],..., [xr],xr+1, ...,xn) a je jednoduché ověřit, že se jedná o dobře definovaný homomorfismus grup. Stejně snadno se definuje i inverzní zobrazení. □ V kombinaci s předchozími úvahami dostáváme první část následující věty. Věta 8.4. Každá konečně generovaná komutativní grupa je izomorfní součinu cyklických grup (2) Z/gi x • • • x Z/qr x Zk, kde 1 ^ qi \ ■ ■ ■ \ qr. Dvě takové grupy jsou izomorfní, právě když se rovnají odpovídající řády qi,..., qr konečných cyklických faktorů a exponenty k beztorzních částí. 21 Důkaz. Existenční část plyne z toho, že každá konečně generovaná komutativní grupa má prezentaci a taje ekvivalentní prezentaci ve Smithově normálním tvaru. Činitele tvaru Z/l = 0 můžeme vynechat. Jednoznačnost se dokáže následovně. Jsou-li dvě grupy tvaru (2) izomorfní, musí být izomorfní i jejich torzní části Z/gi x • • • x Z/gr. Přitom qr je řád nej větší konečné cyklické podgrupy a musí být tedy stejný pro obě grupy. Součin zbylých konečných cyklických grup je kvocient torzní části podle její největší cyklické podgrupy a musí být tedy opět izomorfní pro obě grupy. Podle indukčního předpokladu se musí tedy rovnat všechna odpovídající q±,..., qr. Kvocient podle torzní části je roven Zfc a opět musí být tato grupa izomorfní odpovídající grupě Zfc . Tento izomorfismus je zprostředkován invertibilní maticí. Jelikož každá taková musí být nutně čtvercová, dostáváme k = k'. □ Je-li M konečná, lze dát invariantnímu faktoru qn následující význam. Jedná se o nejmenší číslo t vzhledem k dělitelnosti (což je téměř to samé co vzhledem k velikosti), pro které t ■ M = 0, tedy nejmenší číslo dělitelné řádem každého prvku. Poněkud abstraktněji definujme Ann(M) = {t G Z | t ■ M = 0}, anihilátor komutativní grupy M. Jedná se vždy o podgrupu a platí Ann(M) = Z • qn. Podobnou iterpretaci lze dát s trochou práce i zbývajícím invariantním faktorům, konkrétně Ann(An~mM) =Z-9i, k tomu je však potřeba definovat vnější mocniny komutativních grup, což značně přesahuje obsah kurzu. Vzhledem k jednoznačnosti z předchozí věty můžeme zformulovat jednoznačnost prezentace konečně generované komutativní grupy. Pro každé dvě prezentace musí jejich Smithovy normální tvary být shodné až na jedničky na diagonále (ty zhruba řečeno odpovídají přidání nového generátoru x společně s relací x = 0) a nadbytečné nulové sloupce (ty zase odpovídají relacím, které lze odvodit z ostatních relací). Mají-li matice A, B stejné rozměry, pak prezentují stejnou grupu, právě když jsou ekvivalentní (ve smyslu, že je lze na sebe převést řádkovými a sloupcovými úpravami). 9. Smithův normální tvar polynomiálních matic Polynomiální matice tvaru n x m je kolekce polynomů A = {á1-) indexovaná dvojicemi i = 1,..., n, j = 1,..., m. Tedy á1- je polynom, přesněji polynom s koeficienty v tělese k a v proměnné A. Píšeme A G Matnxm k [A]. Lemma 9.1. Polynomiální matice A je invertibilní, právě když je čtvercová a její determinant je nenulový konstantní. Důkaz. Důkaz se provede stejně jako pro celočíselné matice. □ 22 Věta 9.2 (o Smithově normálním tvaru). Pro libovolnou polynomiální matici A existují in-vertibilní polynomiální matice P a Q takové, že 0 q2 A = P 0\ Vo 0 o 0/ Q -i kde qi\q2\ • • • \qr se postupně dělí. Polynomy qí se nazývají invariantní faktory, pravá strana se nazývá Smithův normální tvar polynomiální matice A. Každý jiný takový se liší pouze vynásobením qí nenulovou konstantou. Konkrétněji (3) Qi """ q% = gcdjdet S | S je submatice A tvaru i x i} Důkaz. Důkaz se provede stejně jako pro celočíselné matice; jeho základem byl Eukleidův algoritmus, který funguje i nad k[A]. □ Opět můžeme vyžadovat polynomy qí normované, dostaneme pak Smithův normální tvar zcela jednoznačně. Poznámka. Je zajímavé se zamyslet nad tím, které (komutativní) okruhy umožňují Smithův normální tvar. Potřebujeme nějakou formu Eukleidova algoritmu a pro tzv. Eukleidovské obory (obory integrity s Eukleidovým algoritmem) není naprosto žádný problém. Ve skutečnosti lze tuto větu zobecnit na obory hlavních ideálů (obory integrity, kde každý ideál je hlavní), nevystačíme si však již s elementárními operacemi: k vyrobení největšího společného dělitele nestačí odčítat násobky, ale jsou potřeba obecnější (invertibilní) lineární kombinace. Ve výsledku se dá ukázat, že nad obory hlavních ideálů již není každá invertibilní matice součinem elementárních. Rozdíl mezi invertibilními maticemi a součiny elementárních matic je jedním z důležitých aspektů studovaných algebraickou K-teorií okruhu R. Ta je velmi důležitá v rozličných odvětvích matematiky - od geometrie, přes algebru až k teorii čísel. Stejně jako celočíselné matice měly vztah ke konečně generovaným komutativním grupám a jejich prezentacím, mají také polynomiální matice vztah k nějakým matematickým objektům a jejich prezentacím. Pokusme se jejich definici motivovat následujícím porovnáním číselné matice A G Matnxmk lineární zobrazení km —> kn celočíselné matice A G MatnxmZ homomorfismy grup Zm —> Zn polynomiální matice A G Matnxm k[A] homomorfismy ??? k[A]m k[A]n Definice 9.3. Nechť M je komutativní grupa. Řekneme, že M je k[A]-modul, jestliže je zadáno zobrazení k[A] x M M, (p,x) ^ p ■ x, 23 nazývané "násobení skaláry", splňující obvyklé axiomy vektorového prostoru p ■ (q ■ x) = (p ■ q) ■ x 1 • x = x p ■ (x + y) = p ■ x + p ■ y {p + q)-x=p-x + q- x Příklad 9.4. Důležitým k[A]-modulem je k[A]n, tj. množina všech n-tic polynomů společně se sčítáním po složkách a násobením po složkách V ■ (qi, ...,qn) = (pqi, ■ ■ -,pqn) Každý k[A]-modul M je automaticky vektorovým prostorem nad k: když umíme prvky M násobit polynomy, umíme je zejména násobit konstantními polynomy, které lze jednoduše ztotožnit s prvky tělesa k, lze psát k ^ k [A]. Zároveň násobení lineárním polynomem A je zobrazení m\ : M —> M, x \—> A • x, o kterém ověříme, že se jedná o lineární zobrazení: m\(ax + by) = A • ax + A • by = (aA) • x + (6A) • y = a{m\x) + b{m\y) Věta 9.5. Předchozí konstrukce zadává vzájemně jednoznačnou korespondenci {k[X]-moduly M} <==t [dv0]lCe {V^)'Me Z ]e ^toro^\ yprostor a 1 : V —> V je operátor J M i-v (M, m x) V i-1 (V, T) Důkaz. Zbývá ukázat, jak se pro operátor T : V —> V na vektorovém prostoru V definuje násobení skaláry z k[A]. Má-li se jednat o inverzi ke konstrukci (M, mx), jsme nuceni položit px = (p0 + pi\ H-----h pkXk)x = pqx + piTx H-----h pkTkx, kde T'lx značí i-násobnou iteraci operátoru T, tj. T'lx = (T o • • • o T)x = T(- • • T{Tx) ■■■); je totiž A!x = A(- • • X(Xx) • • •) = T(- • • T(Tx) • • •). □ Z předchozího důkazu si zapamatujme vztah pro násobení polynomem p na k[A]-modulu (V,T). Budeme ho zapisovat ve tvaru p ■ x = p(T)x, kde p(T) značí, tak jako v důkazu, výsledek formálního dosazení operátoru T do polynomu p, tj. p(T) = po Id +PlT + • • • + PkTk. Poznámka. Hlavní myšlenkou předchozího důkazu je, že okruh polynomů k[A] je generovaný tělesem k a jedním prvkem A splňujícím a ■ A = A • a, tedy prvek A je přidán "volně" pouze s tím, že má komutovat se všemi prvky z původního tělesa. Pro strukturu modulu to znamená, že musíme zadat násobení prvky tělesa k (strukturu vektorového prostoru) a násobení prvkem A, kde jedinou podmínkou je, že tyto mají komutovat, tj. násobení prvkem A musí být lineární. To je přesně tvrzení věty. 24 Poznámka. Výhodou uvažování k[A]-modulů namísto operátorů je to, že základním stavebním kamenem (konečně generovaných) k[A]-modulů je k[A]n (jak za chvíli uvidíme), který je jako vektorový prostor s operátorem nekonečně rozměrný a tedy z pohledu lineární algebry dost netypický. Konkrétně k[A] jako vektorový prostor je kffiNo = {(a0, ai,...) | 3k G N0 : V/ > k : ař = 0}, množina posloupností čísel (odpovídajících posloupnostem koeficientů polynomů), která jsou od jistého indexu počínaje všechna nulová. Operátor je pak dán (a0,ai,...) i-> (0,a0,ai,...) Dalším přirozeným pojmem je homomorfismus k[A]-modulů, který je přímou analogií lineárního zobrazení. Definice 9.6. Nechť M, N jsou dva k[A]-moduly. Zobrazení p> : M —> N se nazývá homo-morfismem k[X]-modulů, jestliže platí ip(x + y) = ip(x) + tp(y), tp(px) =pip(x). pro libovolná x,yGMapGk[A]. Opět převedeme tento pojem do řeči operátorů. Je zřejmé zúžením definiční podmínky na konstantní polynomy, že každý homomorfismus k[A]-modulů je lineární zobrazení. Tvrzení 9.7. Nechť jsou dány operátory T na V a S na U. Lineární zobrazení p> : V —> U je homomorfismus k[X]-modulů, právě když komutuje následující diagram. Důkaz. Jelikož je p> lineární, zachovává násobení všemi konstantními polynomy. Zbývá tedy zkontrolovat zachovávání násobení polynomem A, ale to jsou přesně operátory v diagramu. □ Vraťme se k naší původní motivaci s polynomiálními maticemi. Lemma 9.8. Nechť x±,..., xn G M jsou libovolné prvky k[X]-modulu M. Pak existuje jediný homomorfismus k[X]-modulů tp : k[A]n —> M splňující p>{ei) = X{, kde je opět n-tice polynomů (0,..., 0,1, 0,..., 0) s konstantním polynomem 1 na i-tém místě. Speciálně homomorfismy k[X]-modulů k[A]m —> k[A]n jsou v bijekci s polynomiálními maticemi A G Matnxm k[A], jejímž i-tým sloupcem je právě obraz e^. Příslušný homomorfismus je dán x i—> Ax. Důkaz. Vše je jasné z rovnosti tp(p!,... ,pn) = p>{piex H----pnen) = pnp{ei) H-----h pn^{en) = piXi H-----VpnXn- Naopak výsledný vzorec je homomorfismus k[A]-modulů pro libovolné ..., xn G M. □ V dalším se nám ještě budou hodit kvocienty k[A]-modulů. Nechť M je k[A]-modul. Pod-modul ./V C M je podmnožina uzavřená na nulu, sčítání a násobení skaláry. Zejména je ./V 25 podgrupa vzhledem ke sčítání. Na kvocientu grup M/N definujeme strukturu k[A]-modulu následovně: p • (x + N) d= px + N Je jednoduché ověřit, že se jedná o dobře definované zobrazení, které splňuje všechny axiomy k[A]-modulu. 10. Kanonická prezentace operátoru na kn Nechť T : kn —> kn je operátor na kn a uvažujme příslušný k[A]-modul (kn, T). Narozdíl od situace pro konečně generované komutativní grupy existuje kanonická prezentace (tj. taková, která nezávisí na žádných volbách a je "přirozená"). Uvažujme homomorfismus k[A]-modulů p : k[A]n kn jednoznačně určený tím, že posílá ej i—> ej, kde na levé straně je ej interpretováno jako n-tice polynomů, zatímco na pravé straně jako n-tice čísel3. V obou případech se jedná o n-tici složenou z 1 na i-tém místě a z 0 na zbylých místech. Zřejmě je p surjektivní zobrazení, popíšeme nyní jeho jádro a dostaneme tím prezentaci pro (kn, T). Tvrzení 10.1. Nechi T je operátor na kn. Potom k[A]n T~AE > k[A]n (kn,T) je prezentace příslušného k[X]-modulu. Důkaz. Zbývá ukázat, že im(T — XE) = ker «o + Tví H-----h Tkvk. 26 Nyní dáme dohromady kanonickou prezentaci se Smithovým normálním tvarem tak, jak jsme učinili pro konečně generované komutativní grupy. Nechť Smithův normální tvar T — XE je polynomiální matice S(X). Její vztah ke kanonické prezentaci je vyjádřen v následujícím diagramu k [A] O(A) í k [A] T-XE >k[A]ř P(A) 5(A) >k[A]ř i i £ 4- ^k[X]n/imS(X) Opět se jednoduše přesvědčíme, že k[A]7im5(A)^k[A]/(gi) x • • • x k[\]/(qn), kde q± \ ■ ■ ■ \ qn jsou polynomy vyskytující se na diagonále Smithova normálního tvaru S(X). Věta 10.2. Dva operátory T, T' jsou podobné, právě když polynomiální matice T — XE, T' — XE mají týž Smithův normální tvar. Zejména lze problém podobnosti řešit algoritmicky. Poznámka. Nad algebraicky uzavřeným tělesem lze problém podobnosti "řešit" s pomocí Jordánova kanonického tvaru. Algoritmicky je však tento přístup nevhodný, protože obecně nelze spočítat vlastní čísla a tím pádem ani Jordánův kanonický tvar. Na druhou stranu Smithův normální tvar je zcela algoritmický. Důkaz. Jsou-li operátory T a T" podobné, T" = PTP^1, budou podobné i T1 - XE = P{T - XE)P-1. Tím spíš budou ekvivalentní a proto budou mít týž Smithův normální tvar. Nechť naopak T — XE, T' — XE mají týž Smithův normální tvar. Potom jsou ekvivalentní a podle předchozího diagramu jsou izomorfní prezentované moduly (kn, T) = (kn, T"). To ale přesně znamená, že operátory jsou podobné podle Tvrzení 9.7. □ Poznámka. Výhodou oproti případu komutativních grup je existence kanonické prezentace. O něco obtížněji lze také dokázat, že dva k[A]-moduly prezentované libovolnými (v kontrastu s kanonickými) polynomiálními maticemi týchž rozměrů jsou izomorfní, právě když mají tyto matice týž Smithův normální tvar; viz případ komutativních grup. Místo Jordánova kanonického tvaru je možné popsat jiný kanonický tvar, který nevyžaduje nalezení kořenů charakteristického polynomu a lze jej spočítat algoritmicky. Jelikož je (kn,T) ^k[A]/(gi) x ••• xk[A]/(?„), stačí popsat k[A]-modul k[A]/(g) jako vektorový prostor společně s operátorem. Nalezneme vhodnou (kanonickou) bázi a v ní matici příslušného operátoru m\. Nechť q = clq + a±X + • • • + ak-i^k 1 + Potom takovou bází je a = ([1], [A], • • • , [Afc_1]) a jednoduše (m\)aa í° 1 0 Vo 0 '•• o 0 1 -a0 \ -ai -o-k-i/ 27 Operátor na součinu modulů je blokově diagonální a tedy (kn, T) má ve vhodné bázi blokově diagonální tvar s bloky výše uvedeného tvaru na diagonále. Tento tvar se nazývá racionální kanonický tvar operátoru - pro jeho kanoničnost je však nutno vyžadovat, aby se polynomy příslušné jednotlivým blokům postupně dělily tak jako ve Smithově kanonickém tvaru. Invariantní faktor qn má poměrně jednoduchou interpretaci v řeči k[A]-modulů, z níž lze jednoduše dokázat následující větu. Tvrzení 10.3 (Cayleyho-Hamiltonova věta). Nechť x(A) = det(T — XE) značí charakteristický polynom T. Potom platí \{T) = 0. Důkaz. Z věty o Smithově normálním tvaru platí x = Qi""" Qn ■ Přitom pro libovolné xek[\]/{qi) X • • • X k[X]/(qn) zjevně platí qnx = 0. Protože je však tento k[A]-modul izomorfní (kn,T), platí to samé i pro k[A]-modul (kn,T). Pro libovolné v £ kn tak máme qn(T)v = 0. Protože ale toto platí pro libovolné v, musí být qn{T) = 0 jakožto operátory na kn. Tím spíš tedy x(T) =0. □ Definice 10.4. Z důkazu předchozí věty plyne, že ve skutečnosti platí již qn{T) = 0 a není těžké se přesvědčit, že qn je nejmenší polynom (vzhledem k dělitelnosti), pro který tento vztah platí. Nazývá se minimální polynom operátoru T. Poznámka. Opět poněkud abstraktněji lze minimální polynom popsat následovně. Definujme anihilátor k[A]-modulu M jako Ann(M) = {p G k[A] | p • M = 0}. Není těžké se přesvědčit, že se vždy jedná o ideál a v našem případě je Ann(M) = (qn). Opět s trochou práce lze dát význam i zbylým invariantním faktorům, Ann(A«-;+1M) = (qt), kde například Ajj^jM je kvocient A2M podle podprostoru generovaného rozdíly TxAy—xATy. Operátor na tomto kvocientu je zadán předpisem T[x A y] d= [Tx A y] = [x A Ty]. 11. Jordánův kanonický tvar Jelikož Smithův normální tvar T — XE zcela určuje operátor T až na podobnost, nemělo by být překvapením, že z něj lze spočítat Jordánův kanonický tvar T. Nechť proto nyní k je algebraicky uzavřené těleso. Potom každý cyklický modul k[A]/(g) lze psát s využitím rozkladu q = (A - Ai)ri • • • (A - Xk)rk ve tvaru4 k[A]/(g) ^ k[A]/((A - AiD x • • • x k[A]/((A - Afc)rfe) (formální podobnost s rozkladem na prvočinitele není vůbec náhodná). Zbývá tedy popsat k[A]-modul tvaru k[A]/((A-AoD. Jednoduchý důkaz tohoto faktu využívá Smithův normální tvar — k[A]-modul napravo je prezentován diagonální maticí s mocninami (A — Aí)r* na diagonále; její Smithův normální tvar má na diagonále 1,..., 1, q. 28 Tvrzení 11.1. Cyklický k[A]-modul k[A]/((A - A0) /A0 0 \o 0 je izomorfní operátoru na kr s maticí 0 Ao)T 0 1 Ao/ bázi Důkaz. Jakožto vektorový prostor má k[A]/((A ([(A-A0)r-1])...)[A-Ao],[l]) Počítejme matici operátoru m\ (násobení polynomem A) vzhledem k této bázi. Zjevně platí A[(A - Ao)4-1] = ((A - Ao) + Ao)[(A - Ao)*"1] = [(A - A0)J] + A0[(A - X^1}. V případě i = r pak [(A — Ao)r] = 0 a dostáváme přesně matici z tvrzení. □ Lemma 11.2. Součinu k[X]-modulů odpovídajících operátorům odpovídá operátor v blokovém tvaru s jednotlivými operátory na diagonále. Důkaz. Vše je jasné z toho, že v součinu k[A]-modulů se násobení děje po složkách. □ Věta 11.3. Je-li těleso k algebraicky uzavřené, je každý operátor podobný operátoru v Jordánově kanonickém tvaru. Obecněji tvrzení platí pro operátor T nad libovolným tělesem, nad kterým se charakteristický polynom T zcela rozkládá. □ Je-li T — XE ekvivalentní J — XE, řekněme J-XE = P(X)(T - XE)Q(X), (nyní u Q(X) nebudeme psát inverzi, protože v tomto tvaru dostaneme ekvivalenci z algoritmu počítajícím Smithův normální tvar) lze spočítat matice přechodu mezi oběma operátory. Začněme s maticí přechodu od T k J. Tu dostaneme z následujícího diagramu k [A] n^-^k[A]r <---r QW P(X) k[xy J-XE >k[xy ; (kn,T) I I R 4- naznačené zobrazení kn —> k[A]n zobrazí n-tici čísel na n-tici příslušných konstantních polynomů (a nejedná se o homomorfismus Ik[A]-modulů). Složením dostaneme pro P = P0 + APi + následující vyjádření v 1-4- evj(P(X)v) (P0 + JPi + + XkPk + JkPk)v = PMt(J)v, kde poslední zápis značí dosazení matice J do polynomiální matice -P(A) zleva. Matice přechodu v opačném směru lze získat buď jako inverzní matici k Pleft(J) nebo pomocí transponování všech matic (formálně přechodu k duálním prostorům). Konkrétně 29 dostáváme diagram k [A] n^fk[A] n < z P* (A) k[xy J*-XE %k[xy ^n,T*) i sž i s* 4- -+ (kn, J*) nebo jednodušeji rovnici J* -XE = Q*(A)(T* - XE)P*(X) Podle předchozího dostáváme S* = (Q*)leít(J*) a zpětným transponováním s = ((Q*)left(j*)ľ = (Qo + J*Q1 + ■■■ + (J*)kQtT = Q0 + Q1J+... + QkJk = QT^ht(J). Jelikož je S matice přechodu od J k T, skládají se její sloupce z vektorů báze, v níž T nabývá Jordánova kanonického tvaru J. Matici Q (A) lze získat tak, že veškeré sloupcové operace provádíme zároveň na matici T — XE a na jednotkové matici (řádkové operace však pouze na T — XE). Pokud takto převedeme T — XE na J — XE, vytvoří sloupcové operace přesně matici Q(X). Dosadíme-li pak do ní matici J zprava, získáme hledanou matici přechodu S. Vhodnou adaptací lze výpočet zjednodušit. Není potřeba pomocí dalších operací převádět Smithův normální tvar na J — XE, neboť lze využít bázi k[A]n/imi? z důkazu Tvrzení 11.1, kde B je Smithův normální tvar T — XE. Uveďme si to na příkladu B í1 0 Vo 0 o \ (A - A0)7 Potom forma fl na prostoru kn vpravo nahoře se zobrazí na formu na k[A]n s týmž názvem, dále pak pomocí Q*{X) na flQ(X), tj. na i-tý řádek matice Q(X). Na závěr je potřeba spočítat, jakou formu na kn v pravém dolním rohu tato reprezentuje. Vyjádříme ji proto ve tvaru5 rQw = Ylfr(x-x°yai modulo im B = (f1,..., f'^1, f'{X — Ao)r). Matice a*- je hledanou maticí přechodu (v případě B = J — XE se výpočet zjednodušil tím, že počítání modulo imi? je dosazování J). 12. Symplektické vektorové prostory V této části dokážeme větu o kanonickém tvaru nedegenerovaných antisimetrických bi-lineárních forem, tzv. symplektických forem. Nechť V je komplexní vektorový prostor se skalárním součinem (-,-):V®V ^C. Nechť uj : V (g> V —> C je antisymetrická bilineární forma. Ta lze jednoznačně vyjádřit jako u{u, v) = (Ju, v), -'Koeficienty aj jsou členy Taylorova rozvoje polynomu (/lQ(A))r (tj. prvku Q(A)* matice Q(A)) v bodě Aq. 30 kde J: V —> V je antilineární zobrazení. Z antisymetrie uj dostáváme vztah (Ju, v) = — (Jv, u). Druhá iterace J2: V —> V je již lineární, ukážeme nyní, že je samoadjungovaná, (J2u,v) = —(Jv,Ju) = —(Ju,Jv) = (J2v,u) = (u,J2v). Lze proto ortogonálně diagonalizovat. Navíc také pro libovolný normovaný vlastní vektor u s vlastním číslem A platí A = (u, J2u) = —(Ju, Ju) < 0, takže všechna vlastní čísla musí být reálná, nekladná. Je-li navíc A < 0, je také vektor Ju nenulový a má velikost s = y/—X. Vektory Ju, u jsou na sebe kolmé, neboť platí (Ju, u) = Lú(u, u) = 0. Proto vektory u, v = Ju- tvoří ortonormální systém, v němž je matice J rovna Přitom vektor v je opět vlastním vektorem J2 s vlastním číslem — s2 = A. Proto je kolmý doplněk [u, v]^ invariantní vzhledem k J2 a lze induktivně zkostruovat ortonormální bázi (ui,..., Uk, vi,..., Vk), v níž má J matici / -Sl ••• 0 \ 0 : '•• : 0 • • • -sk si • • • 0 : '•• : 0 \0 ••• sk ) Čísla s\,... ,sk jsou jednoznačně určena z vlastních čísel J2 (ta závisí pouze na lo a skalárním součinu). V případě, že J zachovává skalární součin, (u, v) = (Jv, Ju), říkáme, že symplektická forma je kompatibilní se skalárním součinem. Jinak se dá také tento požadavek vyjádřit jako (u,v) = -(J2u,v), neboli J2 = — id. Potom zobrazení J zadává na V strukturu kvaternionického vektorového prostoru předpisem v j = Jv. Zabývejme se nyní tím, co taková struktura obnáší. Právě jsme zjistili, že J je antilineární zobrazení, jehož druhá iterace je — id, tedy platí (vi)j = J(vi) = -(Jv)i = -(vj)i, (vj)j = J(Jv) = -v. Znamená to, že na tomto prostoru má akci algebra H generovaná prvky které splňují ij = -ji, i2 = -i, ŕ = -i- Označíme-li dále k = ij, dostáváme další vztahy ki = iji = —iij = j, ik = iij = —j jk = jij = -ijj = i, kj = ijj = -i k2 = i ji j = —iij j = — 1 31 Této algebře se říká kvaterniony a podle předchozího není komutativní.6 Typickým příkladem symplektického vektorového prostoru je prostor U © U , na němž je symplektická forma daná předpisem u(u + r], v + 9) = 6{u) — r){v). Skalární součin na tomto součtu, daný skalárním součinem na U a indukovaným skalárním součinem na U* je kompatibilní s touto symplektickou formou. Věta 12.1. Platí 0(2n, R) D Sp(2n, R) = U(n) a U(2n) n Sp(2n, C) = Sp(n). Důkaz. Dokážeme první vztah. Pro A G 0(2n, R) platí A G Sp(2n, R) právě když J = ATJA = A'1.J A A J = JA, tj. právě když je komplexně lineární. Potom lze napsat jako A={c ~b)=b + c* a platí (b + Cif = bt - CT i = ( B^T #t ) = AT■ Tedy rovnost ATA = E je v komplexním -x zápisu b + Ci {b + Ci) = -E, tj. A = i? + Ci je unitární. Je-li naopak A unitární, pak je zjevně ortogonální a komplexně lineární. Podle předchozího je J = A-1 J A = ATJA, tedy je také symplektická. □ Poznámka. Existuje bezsouřadnicová verze důkazu, která popisuje komplexní skalární součin jako (u, v)c = (u, v) + (ui, v)i = (u, v) + (Ju, v)i = (u, v) + lú{u, v)i. Proto každé zobrazení zachovávající reálný skalární součin zachovává komplexní strukturu, právě když zachovává symplektickou formu, právě když zachovává komplexní skalární součin. Kvaternionická verze je {u,v)u = (u,v) +j{uj,v) = (u,v) + j{Ju,v) = (u,v) +juj(u,v) = (u,v) +JĽ(u,v)j. Zabývejme se nyní tím, jakou strukturu na komplexním vektorovém prostoru zadává nede-generovaná symetrická bilineární forma /: V (g> V —> C. Opět ji můžeme psát ve tvaru f(u,v) = (Cu,v), kde C : V —> V je antilineární. Nad M je C samoadjungované a tedy ortonormálně diag-onalizovatené. Nechť nyní v je vlastní vektor, tj. Cv = vs pro nějaké reálné s G R. Potom C (vi) = —(Cv)i = —(vs)i = vi(—s) a proto násobení i prohazuje vlastní podprostory příslušné kladným vlsatním číslům s těmi příslušnými záporným vlastním číslům. Dostáváme tak rozklad V = 0 ker(C - sE) © 0 ker(C - sE) s>0 s<0 kde první sčítanec je reálný podprostor U C V a platí V = U (B Ui. Zejména, V = Uc. Je-li navíc / kompatibilní se skalárním součinem ve smyslu C2 = id, potom Cv = v. Navíc lineární 6Z tohoto důvodu nelze úvahu jednoduše zopakovat a dostat další algebru ze struktury kvaternionického vektorového prostoru společně s antilineární antiinvolucí. 32 zobrazení zachovávající sklární součin zachovává /, právě když zachovává reálný podprostor U. Proto platí U(n)nO(n,C) = 0(n,M). (Grupa 0(n, C) je grupa komplexně lineárních zobrazení zachovávajících standardní nedegen-erovanou symetrickou bilineární formu s jednotkovou maticí). Shrňme tedy, že na komplexním vektorovém prostoru kompatibilní nedegenerovaná anti-symetrická bilineární forma zadává rozšíření na kvaternionický vektorový prostor, zatímco symetrická naopak "zúžení" na reálný vektorový prostor (přesněji to znamená, že vektorový prostor je komplexifikací reálného vektorového prostoru). 13. Dodatek ke geometrii v prostoru V této části dáme do souvislosti geometrii v prostoru s kvaterniony. Připomeňme, že kvater-niony vzniknou z komplexních čísel přidáním jednotky j, která antikomutuje s komplexní jednotkou i, tj. platí ij = —ji, a splňuje i2 = j2 = —1. Označme k = ij. Potom máme následující q = {a + xi) + (y + zi)j = a + (xi + y j + zk). Číslo a nazveme reálnou částí kvaternionu q a v = xi + y j + zk jeho vektorovou částí; lze totiž tuto část ztotožnit s vektorem (x,y,z) £ M3. Chápeme proto komplexní jednotky i, j, k jako vektory standardní báze. Pro jejich součin platí jednoduché vztahy, díky nimž se snadno ověří, že v ■ w = — (v,w) + v x w. Jelikož je skalární součin komutativní a vektorový součin antikomutativní, dostáváme snadno vztahy (v, w) = — ^(vw + wv), v x w = ^(vw — wv). Orientovaný objem Vól(u,v,w) snadno získáme jako reálnou část Vól(u,v,w) = — ~Re(uvw). Zabývejme se nyní inverzí kvaternionu q = a+v. K tomu nám poslouží konjugovaný kvaternion q* = a — v. Platí q*q = (a — v) (a + v) = aa — vv = aa + (v, v) = \a\2 + \v\2 = \q\2 a tedy q^1 = l^l-2^*. Zejména, pokud je g jednotkový kvaternion, tj. |g| = 1, dostáváme q^1 = q*. Kvaterniony mají také goniometrický tvar; my si vystačíme s jednotkovými kvaterniony, pro něž platí q = cos tp + v sin tp, kde ip G [0, jt] a d é l3 je jednoznačně určený jednotkový vektor s výjimkou q = ±1, kdy není určený vůbec. Občas je také výhodné zapisovat ef° = cos tp + v sin tp. Tento vztah dává smysl zejména, když výraz vlevo rozvineme do Taylorovy řady a využijeme vztahu v2 = —\v\2 = —1. Pro inverzní kvaternion platí (e^)-1 = e^^'". Obecně pak platí vztah log(evew) = v+ w + vxw + -- - 33 a známé pravidlo pro násobení mocnin v kvaternionech neplatí — důvodem je, že nejsou komutativní. Obecně platí vw = wv, právě když v \\ w a vw = —wv, právě když je v _L w. Lze proto spočítat pro v \\ w e vwv je na vektorech v \\ w rovno vwv = vvw = —w a na vektorech v _L w rovno vwv = —vvw = w. Jedná se tedy o reflexi vzhledem k rovině kolmé na vektor v (opět předpokládáme, že \v\ = 1). Zabývejme se nyní tím, co se stane při složení dvou reflexí, prvně podle roviny kolmé na v a poté podle roviny kolmé na v'. Dostaneme w 1—> v'vwvv' = ( — (v', v) + v' x v)w( — (v, v') + v x v'), tj. rotaci okolo vektoru v' xv o úhel —2 arccos(i/, v). O něco esteticky uspokojivější je vyjádření jako rotace okolo vektoru v x v' o úhel 2<(v, v').