Lineární algebra a geometrie III Doc. RNDr. Martin Čadek, CSc. Bc. Lukáš Vokřínek, PhD. 21. října 2024 Obsah Úvod 2 Sylabus přednášky 2 1 Afinní a projektivní prostory 3 2 Polyedry a lineární programování 12 3 Nadkvadriky v afinním a projektivním prostoru 24 4 Metrická klasifikace nadkvadrik 31 5 Mooreova Penroseova pseudoinverze 43 6 Multilineární algebra 49 7 Tenzorový součin 57 8 Symetrické a antisymetrické tenzory 68 9 Determinanty, objemy a orientace 78 10 Smithův normální tvar celočíselných matic 88 11 Smithův normální tvar polynomiálních matic 95 1 Úvod Obsah skript je zřejmý z následujícího podrobného sylabu. Většina kapitol kromě teoretického výkladu obsahuje vyřešené příklady a na konci kontrolní otázky a úlohy k samostatnému procvičení. Rádi bychom poděkovali Richardu Lastoveckému, který značnou část textu přepsal v I^-T^Xu a opatřil úlohami k samostatnému řešení. Místa označená jednou hvězdičkou „*" považujeme za těžká a jejich studium doporučujeme pouze studentům usilujícím o lepší známku. Místa označená dvěma hvězdičkami „**" jsou ještě náročnější. Části označené „cv" se dělaly na cvičení a „nd" se nedělaly vůbec. Martin Čadek & Lukáš Vokřínek Sylabus přednášky 1. Afinní a projektivní prostory: afinní prostor, komplexifikace vektorového a afinního prostoru, projektivní prostor, projektivní rozšíření afinního prostoru. 2. Nadkvadriky v afinním a projektivním prostoru: nadkvadriky v afinním a projektivním prostoru, vztah projektivních nadkvadrik a bilineárních forem a jejich klasifikace, klasifikace afinních nadkvadrik. 3. Metrická klasifikace nadkvadrik: polárně sdružené body vzhledem k nadkvadrice, střed nadkvadriky, hlavní směry, hlavní nadroviny, vrcholy nadkvadriky, metrická klasifikace nadkvadrik. 4. Mooreova Penroseova pseudoinverze: Mooreova-Penroseova pseudoinverze, singulární hodnoty, singulární rozklad, aproximace řešení soustavy lineárních rovnic, lineární regrese. 5. Multilineární algebra: faktorový prostor, multilineární zobrazení, duální prostor, duální báze, duální zobrazení, dualita a podprostory, báze prostoru multilineárních forem. 6. Tenzorový součin: tenzorový součin a jeho univerzální vlastnost, asociativita, komutati-vita a další vlastnosti tenzorového součinu, vztah tenzorového součinu a prostoru lineárních zobrazení, tenzorová algebra vektorového prostoru, souřadnice tenzorů při změně báze. 7. Symetrické a antisymetrické tenzory: symetrické tenzory, symetrická algebra vektorového prostoru a její báze, antisymetrické tenzory, vnější algebra vektorového prostoru a její báze, vztah vnější mocniny a determinantu. 8. Determinanty, objemy a orientace: antisymetrické formy a objemy, orientace, objem v Eukleidovském prostoru, geometrie v rovině a prostoru, kvaterniony a jejich vztah ke geometrii v prostoru. 9. Smithův normální tvar celočíselných matic: celočíselné matice a jejich Smithův normální tvar, prezentace konečně generovaných komutativních grup, klasifikace konečně generovaných komutativních grup. 10. Smithův normální tvar polynomiálních matic: polynomiální matice a jejich Smithův normální tvar, K[A]-moduly a jejich vztah k operátorům na vektorových prostorech, kanonická prezentace operátorů na Kn, racionální kanonický tvar, Cayleyho-Hamiltonova věta, Jordánův kanonický tvar. 2 1. Afinní a projektivní prostory Začněme s krátkou motivací. Naším cílem bude studium kuželoseček a jejich více-rozměrných analogií, kvadrik a nadkvadrik. Na kuželosečky se dá pohlížet dvěma způsoby - geometricky jako na množiny bodů, které splňují nějakou kvadratickou rovnici a algebraicky jako na tuto rovnici samotnou. Klasifikace kuželoseček pak spočívá v nalezení jistých kanonických tvarů - geometricky to znamená, že po posunutí a otočení každá kuželosečka vypadá jako elipsa, hyperbola, parabola, atd. a algebraicky pak to, že po jisté vhodné lineární substituci rovnice kuželosečky vypadá nějakým specifickým způsobem. Aby byly tyto dva pohledy ekvivalentní, je potřeba uvažovat „komplexně", neboť například x2 + y2 = —1 a x2 = —1 není možné převést na sebe, nicméně mají tyto rovnice totožnou množinu řešení, totiž prázdnou. Pokud bychom uvažovali i komplexní řešení, budou se jejich množiny chovat geometricky jinak. Kromě komplexních bodů bude ještě výhodné přidat k naší rovině „body v nekonečnu". Například by mělo být zřejmé, že střed elipsy hraje zásadní roli (elipsa je podle něj symetrická). Představme si nyní, že jeden konec elipsy držíme na místě a druhý konec táhneme směrem od prvního - střed se bude vzdalovat poloviční rychlostí. V limitním případě, kdy pohyblivý konec elipsy zmizí v nekonečnu, stane se z elipsy parabola a ta již střed mít nebude, protože jsme jej také přesunuli do nekonečna. Nicméně, tento bod v nekonečnu je stále v jistém smyslu středem paraboly a je vhodné jej mít k dispozici. O něco jednodušší příklad je dvojice různoběžných přímek, jejichž průsečík přesunujeme do nekonečna. Pokud budeme vhodnou dvojici bodů držet na místě, stane se v limitním případě z dvojice různoběžných přímek dvojice rovnoběžných přímek. Pokud budeme uvažovat i body v nekonečnu, přímky se budou stále protínat (tak, jak se nám zdá, že se koleje v dálce protínají). V dalším tedy obohatíme rovinu (obecněji afinní prostor) o komplexní body a později o body v nekonečnu. Mluvíme o komplexním a projektivním rozšíření. 1.1. Komplexifikace reálného vektorového prostoru Nechť V je reálný vektorový prostor. Jeho komplexním rozšířením (komplexifikací) je komplexní vektorový prostor Vc s nosnou množinou V x V, na které je definováno sčítání a násobení komplexním číslem takto: Není těžké dokázat, že jde skutečně o vektorový prostor nad C s nulovým prvkem (0,0). (Dobrou motivací je způsob, jakým se konstruují komplexní čísla jako dvojice reálných čísel.) Vektory v £ V ztotožníme s prvky (v,0) £ Vc a budeme tak V považovat za podmnožinu prostoru Vc. Platí Poznámka. Poněkud abstraktní, ale velice užitečné pozorování je následující univerzální vlast- (v,w) + (v',w') (a + ib)(v, w) (v + v', w + w') (av — bw, bv + aw) (v, w) = (v, 0) + i(w, 0) = v + iw ip{v + iw) = if(v) + iip{w) = ip{v) + iíp{w). To, že je vskutku C-lineární se ověří snadno (stačí zachovávání násobení i). 3 1. Afínní a projektivní prostory Věta 1.1. Každá báze (ei, ..., en) prostoru V je bází prostoru V . cv Důkaz. Nechť u + iv £ Vc je libovolný vektor. Chceme ukázat, že existují jediná komplexní čísla Zk = a,k + ibk taková, že u + iv = ziei H-----h znen = (ai + ibi)ei H-----h (an + ibn)en. Porovnáním reálných a imaginárních částí dostáváme ekvivalentní soustavu u = a\e\ H-----\-anen, v = b\e\ H-----h&nen. Tato soustava má jediné řešení: a\. je fc-tá souřadnice u a je fc-tá souřadnice □ Příklad. Komplexní rozšíření vektorového prostoru Wl je izomorfní s Cn. Nejlépe se to vidí pomocí předchozí poznámky a věty: inkluze W1 —> Cn se rozšiřuje na (Mn)c —> Cn, které posílá bázový vektor na bázový vektor a je tedy isomorfismem. cv Příklad. Dokažte, že komplexní rozšíření prostoru polynomů s reálnými koeficienty je izomorfní s prostorem polynomů s komplexními koeficienty C[x]. Definice 1.2. Nechť tp: V —> W je lineární zobrazení mezi reálnými vektorovými prostory. Komplexní rozšíření ipc: Vc —> Wc je zobrazení definované předpisem ipC(v + iw) = if(v) + i(p(w). Toto zobrazení je opět lineární. Věta 1.3. Je-li A matice lineárního zobrazeníip: V —> W v bázích a a f3, pak ipc: Vc —> Wc má v bázích a a (3 opět matici zobrazení A. cv Důkaz. Nechť a = (ei,..., en), (3 = (ei,..., em). Matice A = (a^) je definována takto: k Pro (pc platí k (fC(ej) = ip(ej) = y^ějdij. i=i Tedy ( O +v, bijekce a můžeme tedy ztotožnit S s vektorovým prostorem Dir S. Důležité je ale mít na paměti, že tato identifikace závisí na volbě počátku. Každá jiná identifikace se však liší pouze o translaci, v i—> PÔ + v. Naopak, každý vektorový prostor V lze chápat jako afinní prostor se zaměřením V tím, že počátek „zapomeneme", tj. požadované zobrazení V x V —> V bude sčítání ve V. Definice 1.5. Báze afinního prostoru S je {n + l)-tice (O, e±, ..., en), kde O G S je bod (počátek) a (ei, ..., en) je báze vektorového prostoru V. Souřadnice bodu A G S v této bázi je (n + l)-tice skalárů (1, x\, ..., xn)T taková, že Xl A = O + xiei H-----h xnen = (O, ei, ..., en) Souřadnice vektoru v G Dir S v této bázi je (n + l)-tice skalárů (0, x±, ..., xn)T taková, že v = xiei H-----h ineř (O, e /0\ Xl 1) • • • ) t-nj Alternativně zapisujeme souřadnice bodů [x\ torů {xi, ...,xn) = (0,x1,..., xn)T. ,..., j.nj (l,xi ,..., xn)T a souřadnice vek- Příklad. Kařdý afinní podprostor vektorového prostoru je afinní prostor. Příklad. Standardním afinním prostorem dimenze n budeme rozumět prostor An = {(l,x1,...,xn)£Kn+1} = {(x0,x1,...,xn)£Kn+1\x0 = l}. Vzhledem k předchozí diskuzi lze An považovat za „prostor souřadnic". Konkrétně, báze afinního prostoru S zadává izomorfismus An —> S daný násobením zleva řádkem (O, e±, ..., en) Inverzní zobrazení S —> An pak přiřazuje každému bodu jeho souřadnice. V afinním prostoru můžeme definovat afinní kombinace: jsou-li Aq, ... ,An G S body a xq, ..., xn G K čísla taková, že xq + • • • + xn = 1, položíme x0A0 + ■■■ + xnAn = P + x0PA0 + ■■■+ xnPAn G 5, cv kde P G S je libovolně zvolený bod. Snadno se ukáže, že výsledek na této volbě nezávisí. Příklad. Prostorem barycentrických souřadnic dimenze n budeme rozumět prostor Bn = {{xQ,xi, ...,xn) G Xq H-----h X% !}• 5 1. Afínní a projektivní prostory Stejně jako izomorfismy An — S odpovídají bázím S, izomorfismy Bn = S odpovídají bodovým bázím, tj. (n + l)-ticím bodů Eq, ..., En takovým, že každý bod A lze jednoznačně vyjádřit jako A = xqEq + • • - + xnEn, xq + • • • +xn = 1. Koeficienty x i nazýváme bary centrické souřadnice bodu A. Nechť S je afinní prostor, jehož zaměření V je reálný vektorový prostor. Komplexním rozšířením (komplexifikací) afinního prostoru S je množina 5C = S x V s operací + : SC xVC ^ SC definovanou předpisem (A, u) + (v, w) = (A + v, u + w). Jednoduše se dá ověřit, že takto definovaná operace má všechny vlastnosti z definice afinního prostoru, např. vlastnost (3) je splněna, protože rovnice (A,u) + (v,w) = (B,t) má jediné řešení (v, w) = (ÄÉ, t — u). Bod A G S ztotožníme s bodem (A, 0) G 5C a budeme tak opět chápat S jako podmnožinu 5C. Pro každý bod (A,u) G 5C pak platí (A, u) = (A, 0) + (0, u) = A + iu. cv Příklad. Je-li T C S afinní podprostor s parametrickým popisem {P + Mi + • • • + tkvk | íi,..., tk G M}, pak Tc je afinní podprostor v 5C s parametrickým popisem {P + Mi H-----h ífc^fc | íi,.. •,ífc e C}. cv Příklad. Je-li T = {x G Mn | Ar = 6} afinní podprostor všech reálných řešení soustavy rovnic Ax = b, pak = {x G Cn | = 6} je prostorem všech komplexních řešení téže soustavy. Definice 1.6. Zobrazení tp: S —> T mezi afinními prostory se nazývá afinní, jestliže existuje lineární zobrazení tp: Dir S —> Dir T takové, že T je afinní zobrazení mezi reálnými afinními prostory. Jeho komplexní rozšíření pc: 5C —> je definováno předpisem pc(A + iu) = p{Á) + ip(u), kde p je indukované lineární zobrazení. cv Zobrazení pc je opět afinní s indukovaným lineárním zobrazením pc = pc. 6 1. Afínní a projektivní prostory 1.3. Projektivní prostor Nechť V je {n + l)-rozměrný vektorový prostor nad tělesem K (obvykle K = M nebo C). Definice 1.8. Množinu V (V) všech jednorozměrných podprostorů vektorového prostoru V nazveme n-rozměrným projektivním prostorem nad K. Vektorový prostor V se nazývá aritmetickým základem projektivního prostoru V (V). Prvky projektivního prostoru se nazývají body. Každý nenulový vektor v G V \ {0} určuje jednorozměrný podprostor [v] = {kv G V | k G K} G P(F); vektor u se nazývá aritmetickým zástupcem bodu [u]. Zjevně každý jiný aritmetický zástupce je nenulovým násobkem v a můžeme tedy alternativně V (V) chápat jako rozklad (V \ {0}) / ~ podle relace ekvivalence v ~ kv, k G Kx. Příklad. Standardním projektivním prostorem dimenze n budeme rozumět Vn = "P(Kn+1). K popisu bodů budeme používat označení {xq : • • • : xn) = [(x0, ■ ■ .,xn)]. Jedna z možných názorných představ o projektivním prostoru s aritmetickým základem Mn+1 je založena na pozorování, že každá přímka v Mn+1 protne sféru Sn = {(x0,... ,xn) G Rn+1 \x2Q + • • • + xl = 1} právě ve dvou bodech. Tedy Vn je Sn, kde „ztotožníme" protilehlé body. O něco lépe představitelná je identifikace bodů na okraji hemisféry. Takto lze podmnožiny projektivního prostoru v omezené míře i namalovat, viz přednášky. Poznámka. Na přednášce jsem měl delší odbočku ohledně ploch, orientace, atd. Konkrétně jsem mluvil o Riemannovských plochách, Móbiově pásku, Kleinově láhvi a projektivním prostoru. Libovolná baze ql — (^o? • • • > ^n) vektorového prostoru V zádava identifikaci V —y IKn^ a následně V (V) ^> Vn, [v] i—> [(v)a]. O obrazu bodu [v] budeme hovořit jako o jeho homogenních souřadnicích. Konkrétně, je-li (v)a = (xq, ... ,xn), jsou homogenní souřadnice [v] rovny {x$ : • • • : xn) a tyto nezávisí na volbě aritmetického základu v. 1.4. Projektivní podprostory Jednorozměrné podprostory v {k + l)-rozměrném podprostorů W C V tvoří fc-rozměrný projektivní podprostor V(W) v projektivním prostoru V (V). Jednorozměrný projektivní podprostor se nazývá projektivní přímka. Příklad. Každé dvě přímky p, q v v2 mají společný bod. V aritmetickém základu K3 přímkám p a q odpovídají podprostory U a V dimenze 2. Protože dim U n V = dim U + dim V - dim(ř7 + V) a dim(č7 + V) < 3, je dimč7 n V > 1. Tedy p D q obsahuje alespoň jeden bod projektivního prostoru 7*2- 7 1. Afínní a projektivní prostory Nechť V(W) C Vn je fc-rozměrný projektivní podprostor, zadaný {k + l)-rozměrným podprostorem W C Kn+1 popsaným homogenní soustavou rovnic Ax = 0. Stejná soustava rovnic pak popisuje homogenní souřadnice bodů projektivního prostoru V(W), tj. ViW) = {[x] | Ax = 0}. 1.5. Kolineace Nechť V (V) a V(W) jsou dva projektivní prostory dimenze n. Zobrazení <í>: V (V) —> V(W) se nazývá kolineace, jestliže existuje lineární izomorŕismus p: V —> W takový, že = [p(v)] pro všechna v G V. Píšeme <£ = [ Vn tvoří grupu, kterou budeme značit PGL(Vn). cv Poznámka. Analogicky k situaci ve vektorových a afinních prostorech existuje pojem báze projektivního prostoru - konkrétně geometrická báze je (n + 2)-tice bodů tvaru [eo], • • •, [en], [eo + • • • + en] pro nějakou bázi aritmetického základu. Platí, že kolineace je jednoznačně určena tím, kam posílá bázi a tu může poslat na libovolnou jinou bázi. Viz cvičení. 1.6. Afinní prostor jako podmnožina projektivního prostoru Nyní se k afinnímu prostoru pokusíme přidat body v nekonečnu. Názornou představu o tomto procesu si můžeme učinit tím, že afinní prostor budeme vnímat jako rovinu nad níž se nachází pozorovatel (jako když se díváme na podlahu). Pak když pozorujeme svět kolem sebe tak vidíme jednak body této roviny a jednak body na horizontu1. Body na horizontu mají speciální význam, odpovídají směrům v rovině - například každé dvě rovnoběžné přímky v rovině se protínají na horizontu přesně v bodě odpovídajícím jejich společnému směru, atd. Pokusíme se nyní tuto situaci popsat obecně. Nechť V (V) je n-rozměrný projektivní prostor s aritmetickým základem V. Nechť J\í C V je afinní nadrovina neprocházející počátkem. Pro každý bod X G V (V) nastane právě jedna z následujících dvou možností: • X n J\í = 0, potom X G V(BiľJ\í) nebo • X n J\í 7^ 0, potom je tímto průnikem jediný bod. Naopak, každým bodem A G J\í prochází jediný jednorozměrný podprostor X G V (V). Dostáváme tak identifikaci J\í = V (V) \ V(DiľJ\í). Definujme nevlastní prostor afinního prostoru S jako ľ( tP + v. Mohli bychom tedy definovat ľ = Kx Dir S, bijekce z předchozího odstavce ale bohužel závisí na volbě počátku P. Pokusme se nyní této závislosti zbavit a uvažujme tedy jinou volbou počátku Q a počítejme Zřejmě tedy platí tP + v = sQ + w, právě když s = íav = sPQ + w. Je-li nyní S libovolný afinní prostor, uvážíme na K x S x Dir S relaci ekvivalence, jejíž třídy [(i, P, v)] budeme značit íP + ti a budeme tedy požadovat tP + v = sQ + w, právě když platí s = t a v — w = sPCj. Potom lze na vzniklém rozkladu V(S) = (Ix5x Dir 5)/~ zavést strukturu vektorového prostoru (platí tP+v = tO + (t()P+v) a položíme (tO +v) + (sO+w) = (i + s)0 + (v + w)). Bod A £ S ztotožníme s vektorem 1A + 0 G V(S) a tímto způsobem budeme chápat S jako nadrovinu ve V(S). Dostáváme tak projektivní rozšíření S = V{V{S)). cv Cvičení. Popište projektivní přímku procházející dvěma vlastními body; vlastním a nevlastním bodem (řešte stejným způsobem). 1.7. Projektivní rozšíření afinních podprostorů Nechť T C S je afinní podprostor. Naším cílem bude zkonstruovat projektivní podprostor tak, že T bude projektivním rozšířením T. Předpokládejme tedy, že S C V jako afinní nadrovina a pokusme se najít vektorový podprostor W C V, v němž bude T ležet jako afinní nadrovina. Protože T C S neprochází počátkem, stačí za W zvolit lineární obal T, který je zjevně W = {0} * T (spojení počátku a T - to je afinní podprostor obsahující počátek, tj. vektorový podprostor). Pro dimenzi platí dimVF = dim{0} + 1 + dimT = dimT + 1, takže v něm vsktuktu leží T jako afinní nadrovina neprocházející počátkem. Můžeme tedy psát T = V(W) a jedná se o projektivní podprostor S - hovoříme o projektivním rozšíření afinního podprostorů. Z konstrukce vidíme, že se jedná o nejmenší projektivní podprostor S obsahující T. Z předchozí sekce víme, že T = T U v(T) a tedy T obsahuje krom bodů z T také směry v zaměření DirT. To podává uspokojivé vysvětlení, proč (a kde!) se protínají rovnoběžné přímky. Zabývejme se nyní početním aspektem. Nechť je T zadán soustavou (nehomogenních) lineárních rovnic b + Ax = 0. Tu můžeme vhodně zapsat jako (b | Áj í—\ = 0. Protože jsou 9 1. Afínní a projektivní prostory tedy body T dány soustavou (6|A)^=0, *0 = 1, je zjevně T afinní nadrovinou ve vektorovém podprostoru zadaném první (homogenní) sou- stavou rovnic = 0 (speciálně je třeba vyřešit případ, že by původní soustava neměla řešení2). Podívejme se na tento podprostor poněkud elementárněji: platí X = {x$ : x\ : • • • : xn) £ T, právě když xq 7^ 0 a X = (1 : x±/xq : • • • : xn/xo) = (1, x±/xq, ..., xn/xo) £ T, tj. právě když xq 7^ 0 a b + A(x1/x0,xn/xQ)T = 0. Přenásobením xq 7^ 0 dostáváme ekvivalentní podmínku bx0 + A(xi,..., xn)T = (b\ A) (x0,xi,xn)T = 0. Dostaneme tedy popis projektivního rozšíření T tak, že do soustavy zadávající T dosadíme (1, xi/xq, ..., xn/xo) = {xq : x\ : ••• : xn), přenásobením xq z ní uděláme opět lineární soustavu a zapomeneme na podmínku xq 7^ 0 (tím přesně přidáme nevlastní body - navíc je jasné, že tyto přidané body budou právě ty s xq = 0, tj. řešení homogenizované soustavy). 1.8. Vztah afinních zobrazení, lineárních zobrazení a kolineací Zabývejme se vztahem afinních zobrazení Am —> An a lineárních zobrazení Km+1 —> Kn+1. Zjevně, každé lineární zobrazení T: Km+1 —> Kn+1 s vlastností T(Am) C An dává po zúžení afinní zobrazení tp: Am —> -An. Budeme-li T psát blokově tvaru (1 + n) x (1 + m), pak T(1) = (k c\(l\ = (k + cx\( 1 \ \x J \b AJ\xJ \b + Ax) \b + Ax) a je vidět, že musí platit k = 1, c = 0. Naopak, nechť tp je afinní zobrazení. Potom * 0 = * (í) + ^ (x) = (ô) + (ax) = (6 + ' pokud vezmeme za b souřadnice íp{e$) a za A matici p ve standardních bázích. Proto je p zúžením lineárního zobrazení s maticí T = (5 ^) • Na cvičení ukážeme, že, je-li kolineace <í> reprezentována dvěma lineárními izomorfismy p, V>, pak platí ip = kip. Díky předchozí analýze je pak jednoduché vidět, že každá kolineace je reprezentována maximálně jedním afinním zobrazením a tento případ nastane, právě když <í> zachovává rozklad na vlastní a nevlastní podprostory. Ve výsledku tedy lze říct, že afinní zobrazení jsou kolineace zachovávající rozklad An = An U u(An). 2V takovém případě je T = 0 a tedy podle naší definice je T = 0. Z druhého pohledu je pak T = 0 s netriviálním zaměřením daném řešeními příslušně homogenní soustavy a T = T U u (T) = V(DirT). 10 1. Afínní a projektivní prostory Kontrolní otázky 1. Nechť V je reálny vektorový prostor. Definujte jeho komplexifikaci Vc. Ukažte na příkladu V = reálných polynomů stupně nejvýše 2. Co je Vc v tomto případě? 2. Vyslovte definici afinního prostoru a afinního zobrazení. Demonstrujte na několika příkladech. 3. Co jsou body projektivního prostoru Vnl Co jsou přímky v Vnl Mají každé dvě projektivní přímky v V3 neprázdný průnik? 4. Vysvětlete projektivní rozšíření afinní roviny a2 na projektivní prostor 7*2- Představujte si a2 jako rovinu v M3 zadanou v souřadnicích rovnicí xq = 1. Co jsou v tomto případě nevlastní body? Příklady k procvičení 1. Ke komplexnímu vektorovému prostoru V lze definovat konjugovaný prostor V takto: množinově V = V, sčítání vektorů je stejné jako ve V a násobení skalárem 0 definujeme předpisem (a + ib) 0 u = (a — ib) ■ u. Dokažte, že V je komplexní vektorový prostor. 2. Ke komplexnímu vektorovému prostoru V lze definovat jeho realifikaci VK takto: množinově VK = V, sčítání vektorů je stejné jako ve V a násobení reálným číslem je stejné. Nechť (ei,..., en) je báze V. Najděte nějakou bázi VK. [Řešení: Např. (ei,..., en,iei,..., ien).] 3. Dokažte, že pro reálný vektorový prostor V platí (Vcf ~v®v. 4. Dokažte, že pro komplexní vektorový prostor V platí (VR)C ~v®v. 5. Nechť íp: V —> W je lineární zobrazení mezi komplexními vektorovými prostory. Zobrazením tp je indukováno zobrazení Dokažte, že ip^ je lineární zobrazení mezi reálnými vektorovými prostory. 6. Jsou-li v prostorech V a W z předchozího příkladu zvoleny báze a = (e±,... ,en) a (3 = (ei,..., em), můžeme najít matice A a B takové, že matice zobrazení {ip)pa = A + iB. Zvolme v prostoru VK bázi aK = (ei,..., en,iei,... ,ien) a v prostoru WK bázi /3K = (ei,..., em, ie±,..., iem). Dokažte, že matice zobrazení 0 pro stejné třídy funkcí. V dalším nás bude nejvíce zajímat případ lineárních nerovnic ax+/3 > 0, kde používáme značení a G (Mn)*, (3 G M. Z tohoto pohledu neumíme rozlišit mezi množinou tří bodů v rovině a trojúhelníkem mající tyto tři body za vrcholy, protože tyto množiny splňují přesně tytéž lineární nerovnice -to si lze snadno rozmyslet, když si uvědomíme, že množina řešení nerovnice je polorovina, a že tyto dvě množiny leží ve stejných polorovinách (přesněji pokud v nějaké polorovině leží trojice bodů, bude v ní automaticky ležet i celý trojúhelník). Přitom trojúhelník je v jistém smyslu speciální, protože to je celá množina řešení jistého systému nerovnic. Situace se snadno popíše pomocí tzv. Galoisovy konexe. Zásadní výsledek, i když velmi snadný, je, že vždy dostáváme bijekci mezi množinami řešení na straně jedné a množinami vztahů na straně druhé. Tato dualita bude v našem výkladu hrát zásadní roli a lze ji velice hezky ilustrovat na předchozím příkladu. Viděli jsem, že pokud tři body patří do množiny řešení systému lineárních nerovnic, bude tam ležet i celý trojúhelník jimi "generovaný". Naopak trojúhelník lze zadat třemi nerovnicemi vyjadřujícími náležitost do tří polorovin určených jednotlivými hranami trojúhelníka. Samozřejmě bude trojúhelník splňovat také spoustu dalších nerovnic, ale ty budou opět "generovány" těmi zmíněnými třemi. Trojúhelník tedy lze zadat třemi body nebo třemi nerovnicemi. Ve vyšších dimenzích už tyto počty nebudou totožné, ale vždy bude platit, že daný útvar lze zadat konečným počtem bodů, právě když jej lze zadat konečným počtem lineárních nerovnic a takovéto útvary budeme nazývat polyedry. Zabývejme se nyní krátce tím, jak vypadají polyedry dimenze 2. S výjimkou celé roviny se jedná o mnohoúhelníky s tím, že některé vrcholy můžou ležet "v nekonečnu"; například (konvexní) úhel je trojúhelník mající dva vrcholy v nekonečnu. Jestliže k rovině přidáme body v nekonečnu (půjde o jisté projektivní rozšíření), můžeme pak s body v nekonečnu nakládat stejně jako s ostatními body a situace se stane homogenní; po pravdě se opravdu stanou definující rovnice homogenní, jak časem uvidíme. Protože je tato homogenní situace výrazně jednodušší, začneme prvně s ní a budeme tedy zkoumat podmnožiny W1 skrze homogenní lineární nerovnice, které tato podmnožina splňuje. Začneme s Galoisovou konexí, která je sice poměrně snadným pojmem, ale bude i přesto velmi užitečná. Definice 2.1. Galoisova konexe je dvojice zobrazení F: A < > B :G mezi uspořádanými množinami A, B, splňující: 12 2. Polyedry a lineární programování • a < a' =4> Fa > Fa', • b Gb', • a < GFa, • b < FGb. První dvě podmínky říkají, že obě F, G obrací uspořádání, pro vysvětlení zbylých dvou budeme prvky v obrazu G nazývat G-uzavřené a prvky v obrazu F pak F-uzavřené. Pro a G A je GFa tedy G-uzavřený, nyní ukážeme, že je dokonce nejmenší G-uzavřený nad a: nechť tedy a < Gb, pak b < FGb < Fa a nakonec a < GFa < Gb. Budeme tedy říkat, že GFa je G-uzávěr a, složení GF budeme nazývat uzáverový operátor a zejména vidíme, že a je G-uzavřený, právě když GFa = a. Lemma 2.2. Galoisova konexe se zužuje na bijekci mezi G-uzavřenými a F-uzavřenými prvky. □ 2.1. Polyedrální kužely Prvně se budeme zabývat homogenní situací, tedy homogenními lineárními nerovnicemi. Uvažme následující Galoisovu konexi (—)°: {podmnožiny U} < 1 {podmnožiny U*} :( —)° posílající podmnožinu X C U na množinu všech homogenních lineárních nerovnic, které tato podmnožina splňuje, přesněji 1° = {a G U* I Vx G X: ax > 0} Zobrazení v opačném směru je definováno zcela analogicky: přiřadí systému A lineárních nerovnic množinu řešení tohoto systému, A° = {x G U I Va G A: ax > 0}. Evidentně (—)°-uzavřené podmnožiny, tj. prvky obrazu ( —)°, jsou právě množiny řešení systémů homogenních lineárních rovnic a ( —)°-uzávěr množiny X je pak množina X°° řešení systému všech homogenních nerovnic, které X splňuje. O něco přehledněji je množina řešení jedné nerovnice poloprostor procházející počátkem a X°° je tedy průnik všech poloprostorů procházejících počátkem, ve kterých X leží. Následující tvrzení poměrně snadno charakterizuje ( —)°-uzavřené množiny, v dalším jej ale nebudeme používat. Tvrzení 2.3. Podmnožina X C U je ( —)° -uzavřená, právě když je X uzavřená na nezáporné lineární kombinace a zároveň uzavřená ve smyslu topologie? 3Zjevně každá množina řešení A0 je uzavřený konvexní kužel (například je to průnik poloprostorů 0 13 2. Polyedry a lineární programování Množinám uzavřeným na nezáporné lineární kombinace budeme říkat konvexní kužely. Definujme coneX = {t±xi + ■ ■ ■ +tnxn \ n > 0, X{ £ X, ti > 0}, tj. množinu všech nezáporných lineárních kombinací prvků (pro n = 0 dostaneme 0 6 coneX). Množina X je tedy konvexní kužel, pokud X = cone X. Podle předchozího tvrzení se Galoisova konexe zužuje na bijekci {uzavřené konvexní kužely v U} = {uzavřené konvexní kužely v U*}, v dalším nás ale budou zajímat jen ty konvexní kužely, které jsou v nějakém smyslu konečné a které budou zjevně (—)°-uzavřené. Definujme %-kužel jakožto množinu tvaru A° pro libovolnou konečnou množinu A, tedy jakožto množinu řešení konečného systému homogenních lineárních nerovnic. Definujme dále V-kužel jakožto množinu tvaru X°° pro nějakou konečnou množinu X; jedná se tedy o nejmenší (—)°-uzavřenou množinu obsahující X a je tedy v jistém smyslu generovaná konečnou množinou X - následující věta tuto situaci popíše konkrétně. Evidentntě pak dostáváme zúžením Galoisovy korespondence bijekce {V-kužely v U} 2á {^-kužely v U*} {^-kužely v U} 2á {V-kužely v U*} Věta 2.4. Následující podmínky jsou ekvivalentní: 1. C je V-kužel, 2. C = coneX pro nějakou konečnou množinu X, 3. C = X°° pro nějakou konečnou množinu X, tj. C je Tí-kužel. Množinám tohoto tvaru budeme říkat polyedrální kužely. Pro důkaz bude zcela zásadní tzv. Motzkinova eleminace, kterou lze teoreticky použít i k řešení soustavy nerovnic - konkrétně ji lze použít k rozhodování, zda daný systém má nějaké řešení. Uvažujme soustavu homogenních lineárních nerovnic bt + Ax > 0 v proměnných t, xi,..., xn jako soustavu nerovnic v jedné proměnné t a považujme tedy x±,..., xn za parametry. Budeme zkoumat, kdy má tato soustava řešení. Jednotlivé nerovnice v systému rozdělíme podle koeficientu fy: fyt + CLiX > 0 Pokud fy = 0, je tato nerovnice ekvivalentní cijX > 0. Pokud (3^ > 0, je tato nerovnice ekvivalenntí t > — a/t/Ä • x. Pokud fy < 0, je tato nerovnice ekvivalenntí t < —ai/fy ■ x. Zjevně lze systém skládající se z posledních dvou typů nerovnic vyřešit vzhledem k t, právě když každá horní mez je větší nebo rovna každé dolní mezi, tj. -ai/fy ■ x > -ak/f3k ■ x nebo ekvivalentně ( 0. (v opačném případě by vzdálenost x + tx od u byla pro malé t > 0 menší než vzdálenost žodu), takže a G X0, přitom au = (x — u, u) < (x — u, x) = 1/2 ■ ^ | (tx — u,ťx — u) = 0 (v opačném případě by vzdálenost tx od u byla pro t blízko 1 menší než vzdálenost x od u), takže u nesplňuje au > 0 a tedy u £ X"". 14 2. Polyedry a lineární programování Společně s nerovnicemi prvního typu, tj. cijX > 0, dostáváme soustavu A'x > 0, pro níž platí: pro každou volbu parametru x má původní soustava bt + Ax > 0 nějaké řešení t, právě když platí A'x > 0. Symbolicky: 3t:bt + Ax>0 <3> A'x > 0. Poslední formulace říká, že lze Motzkinovu eliminaci považovat za tzv. eliminaci (existenčních) kvantifikátorů, protože pro danou formuli s existenčním kvantifikátorem najdeme ekvivalentní formuli bez kvantifikátoru, přičemž iterací lze samozřejmě odstranit libovolný konečný počet existenčních kvantifikátorů. Důkaz. Prvně ukážeme 2 =4> 3. Nechť tedy X = {x±,... ,Xk}, pak coneX je zjevně množina těch x, které splňují formuli 3ti ■ ■ ■ 3tk: x = t±xi + • • • + tfcXfc, ti > 0,..., t k > 0 Protože je však tato formule ekvivalentní formuli Ax > 0 díky Motzkinově eliminaci, jedná se o %-kužel. Nyní ukážeme 1 => 2, přesněji pro konečnou množinu X dokážeme X°° = coneX. Protože je X°° nejmenší množina tvaru A° obsahující X, stačí ukázat, že coneX splňuje totéž. Podle právě dokázané implikace 2 =4> 3 je coneX tvaru A° (navíc pro konečnou množinu A). Zároveň je každá množina tvaru A° uzavřená na nezáporné lineární kombinace, takže pokud obsahuje X, musí obsahovat i coneX a tím pádem je coneX nejmenší. Implikace 3 1 je jednoduchou aplikací duality a již dokázané implikace 1 2 3, totiž C je %-kužel C° je V-kužel => C° je %-kužel C je V-kužel. □ Důsledek 2.5 (Farkasovo lemma pro kužely). Nechi C: Ax > 0 je polyedrální kužel. Pak C splňuje lineární nerovnici cx > 0, právě když je tato nezápornou lineární kombinací generujících nerovnic, tj. c = y A pro nějaké y > 0. Důkaz. Podle předpokladu platí C = A°, kde A nyní bereme jako množinu řádků matice A, tedy jako podmnožinu A C U*. Jestliže C splňuje cx > 0, pak c G C° = A°° = coneA, protože je A konečná. To ale přesně znamená, že c je nezápornou lineární kombinací řádků matice A. □ 2.2. Polyedry Uvažujme U jako podprostor {1} x U C M x U se souřadnicemi t na M a x na U, tedy jako podprostor {t = 1}. Zjevně řešení systému b + Ax > 0 jsou právě průniky {bt + Ax > 0} n {t = 1} polyedrálních kuželů s nadrovinou {t = 1}. Takovým podmnožinám budeme říkat polyedry. Zabývejme se nyní podrobněji zobrazením {kužely v M x U} —> {polyedry v U} daným právě průnikem s {t = 1}. Označme pro jednoduchost C\ = C n {t = 1}, v dalším budeme potřebovat také Co = C D {t = 0}. Je-li polyedr P obrazem kuželu C, pak zřejmě P = Ci C C, takže P°° C C a následně P c (P°°)! c Ci 15 2. Polyedry a lineárni programování a protože P = C\, dostáváme P = (P°°)i. Máme tedy přirozeného kandidáta na inverzní zobrazení, totiž P i—> P°°. Zřejmě kužely tohoto tvaru budou obsaženy v t > 0, protože celý prostor {t = 1} je v tomto poloprostoru obsažen. Navíc, pokud P 7^ 0, není P°° zcela obsažen v {t = 0}. Budeme tedy říkat, že kužel C je kladný, pokud C C {t > 0}, C % {t = 0}. Ve zbylém případě P = 0 je pak P°° = 0. Kladným kuželům společně s nulovým budeme říkat nezáporné. Věta 2.6. Zobrazení C *—> C\ je bijekce {nezáporné kužely ulx U} —> {polyedry v U} s inverzí P i—> P°°. Důkaz. Již jsme ukázali, že pro polyedr P platí P = (P°°)i, zbývá tedy dokázat C = pro nezáporné kužely C. Protože se jedná o ( —)°-uzavřené množiny, je toto ekvivalentní C° = C\, přičemž implikace =4> je triviální. Nechť tedy cx > 0 platí na Ci a ukážeme, že platí i na C. Protože každý prvek C s t > 0 je kladným násobkem prvku z Ci bude nerovnice cx > 0 pro takové prvky splněna a zbývá vyřešit případ v G Co- Nechť xq £ Ci je libovolný bod. Pak xq + Xv G Ci pro libovolné A > 0 a musí tedy platit c(xq + Xv) > 0 pro libovolné A > 0 a tedy jistě cv > 0, takže v také splňuje uvažovanou nerovnici. □ Nyní vysvětlíme, jak popsat polyedry pomocí V-kuželů. Protože je V-kužel obsažen v t > 0, můžeme jeho generující vektory psát jako (1, x i) nebo (0, Vj). Jejich nezáporná kombinace leží v {t = 1}, právě když je tvaru Aixi H-----h Xkxk + ii^i H-----h íz«z, kde Ai + • • • + Afc = 1 a všechny koeficienty jsou nezáporné. Jedná se tedy o součet konvexního obalu convjxi,... ,xk} bodů a konvexního kužele conej^i,... ,vi} vektorů. Druhá množina je pak zároveň průnikem s {t = 0} a lze ji tedy považovat za "zaměření" polyedru. Poznámka. Podmnožina conv X = {Xixi H-----h XkXk \X\-\-----h Afc = 1, A« > 0} je nejmenší konvexní podmnožina obsahující X, tj. nejmenší podmnožina uzavřená na konvexní kombinace (nezáporné se součtem koeficientů 1). Platí totiž, že konvexní kombinace konvexních kombinací je opět konvexní. Navíc lze každou takovou dostat iterováním konvexní kombinace pro dva prvky, kde Xx + fiy = x + /x(y — x) jsou přesně body úsečky xy, protože fi G [0,1], takže podmnožina je konvexní, právě když s každými dvěma body obsahuje i příslušnou úsečku. Uvažujme nyní kladný polyedrální kužel C: Ax > bt. Průnikem s {t = 1} tak dostaneme polyedr P: Ax > b. Naopak, každá neprázdná množina tohoto tvaru dostaneme jako C\ pro kladný kužel C: Ax > bt, t > 0. Díky jednoznačnosti platí P°° = C a tedy nerovnice, které P splňuje jsou právě nezáporné lineární kombinace Ax > bt, 0 > —t, což můžeme díky t = 1 přepsat jako nezáporné lineární kombinace Ax >b,0x> -1, tedy lineární nerovnice, které P splňuje jsou právě nezáporné kombinace generujících nerovnic a triviální nerovnice 0 > — 1. 16 2. Polyedry a lineární programování Tvrzení 2.7 (Farkasovo lemma pro polyedry). Polyedr P: Ax > b je prázdný, tj. soustava Ax > b nemá řešení, právě když nezápornou lineární kombinací nerovnic z Ax > b lze vyrobit 0 > 1. Důkaz. Soustava nemá řešení, právě když kužel C: Ax > bt má prázdný průnik s {t = 1}, tj. právě když leží v 0 > t. To je ale právě když je 0 > t nezápornou lineární kombinací nerovnic z Ax > bt. Tvrzení se dostane dosazením t = 1. □ 2.3. Afinní obal polyedru Lemma 2.8. Nechi P: Ax > b je neprázdný polyedr. Pak jsou následující podmínky ekvivalentní: 1. P nesplňuje žádnou netriviální rovnici. 2. P nesplňuje žádnou netriviální nerovnici z Ax > b jako rovnici. 3. Existuje bod P splňující všechny netriviální nerovnice v Ax > b ostře. Zjevně první podmínka znamená, že P neleží v žádném vlastním afinním podprostoru, tedy že afinní obal P je celý prostor U. V takovém případě řekneme, že dimenze P je rovna dimenzi U. Body z podmínky 3 nazveme vnitřní body polyedru P, takže budeme říkat, že P je polyedr s neprázdným vnitřkem. Obecně lze uvažovat P uvnitř svého afinního obalu, kde podmínky již splněny budou (některé nerovnice se po zúžení na afinní obal stanou triviálními) a dimenze P je pak rovna dimenzi tohoto afinního obalu. Vnitřní body P chápaného jako podmnožinu svém afinním obalu nazveme relativně vnitřní. Snadno se ukáže, že každý bod je relativně vnitřním bodem právě jedné stěny (a každá neprázdná stěna má nějaký relativně vnitřní bod), totiž stěny určené všemi nerovnicemi z Ax > b, které jsou v daném bodě splněné jako rovnice. Ostatní jsou splněny ostře, takže podle lemmatu je bod relativně vnitřním bodem této stěny. Je tedy každý polyedr disjunktním sjednocením relativních vnitřků stěn. Důkaz. Budeme předpokládat, že všechny nerovnice v Ax > b jsou netriviální. Implikace 1 =4> 2 je zřejmá. Pro implikaci 2 =4> 3 předpokládáme, že každá nerovnice a^x > /3j systému Ax > b je v nějakém bodě x;t £ P splněna ostře. Potom barycentrum \x\ + • • • + \xk bude všechny nerovnice splňovat ostře. Zbývá 3 1. Budeme ekvivalentně dokazovat, že žádná netriviální nerovnice není na P splněna jako rovnice. Uvažme tedy nerovnici cx > S, která je splněna na P a musí tedy být nezápornou lineární kombinací nerovnic z Ax > b, Ox > —1. Pokud je navíc netriviální, musí být nějaký koeficient nenulový. Každý bod splňující jednotlivé nerovnice ostře, jehož existence je zaručena podle 3, bude splňovat ostře i nerovnici cx > S a tato nerovnice tedy nemůže být na P splněna jako rovnice. □ 2.4. Stěny polyedrů Nechť cx > S je lineární nerovnice, kterou polyedr P splňuje. Potom průnik P s podprostorem cx = S nazveme stěnou polyedru P. Dva speciální případy nerovnic, které P splňuje jsou Ox > —1, Ox > 0, které odpovídají stěnám 0, P. 17 2. Polyedry a lineárni programování Nechť nyní P: Ax > b. Již víme, že cx > S platí na P, právě když je nezápornou lineární kombinací nerovnic ze systému Ax > b a Ox > — 1. Jestliže má být průnik polyedru P s podprostorem cx = S neprázdný, jistě nebude poslední nerovnice v kombinaci vystupovat. Navíc pokud cx > S je kombinací, ve které vystupují s nenulovými koeficienty právě řádky o-íX > fy, řekněme s koeficienty Aj > 0, pak pro libovolné x £ P platí cx = S 4^ Ví : diX = fii (jinak by musela platit pro nějaké i nerovnost ajX > /3« a protože je nerovnice brána s kladným koeficientem, bylo by i cx > 5). Je tedy obecná stěna dána tím, že některé z nerovnic systému Ax > b nahradíme rovnicemi. Lemma 2.9. Nechi P: Ax > b je polyedr s neprázdným vnitřkem. Předpokládejme, že žádná nerovnice systému Ax > b není nadbytečná (tj. důsledkem zbylých nerovnic). Potom přiřazení {nerovnice systému Ax > b} —> {stěny P kodimenze 1}, posílající nerovnici ax > (3 na stěnu P n {ax = /3}, je bijekce. Důkaz. Prvně ukážeme, že je zobrazení dobře definované, tedy že pro každou nerovnici ax > (3 systému je příslušná stěna kodimenze 1, tedy že má uvnitř nadroviny {ax = /3} neprázdný vnitřek. Označme podsoustavu vzniklou odstraněním nerovnice jako A'x > b'. Protože má P neprázdný vnitřek, existuje z splňující A'z > b', az > (3. Protože není naše nerovnice nadbytečná, musí existovat bod y splňující A'y > b', ay < (3. Vhodnou kombinací y, z s kladnými koeficienty dostaneme bod x splňující A'x > b', ax = /3, jedná se tedy o vnitřní bod stěny P n {ax = /3}. Každá stěna je dána nahrazením některých nerovnic systému příslušnými rovnicemi. Pokud by byly alespoň dvě, příslušný afinní prostor by měl kodimenzi alespoň dvě a stěna by nemohla mít kodimenzi 1. Je tedy zobrazení surjektivní. Každá stěna kodimenze 1 má jako afinní obal afinní nadrovinu a protože má P neprázdný vnitřek, leží P právě v jednom poloprostoru určeném touto nadrovinou. Je tedy nerovnice zadávající stěnu určena jednoznačně až na kladný násobek. Díky nenadbytečnosti je v systému maximálně jedna taková nerovnice. Je tedy zobrazení injektivní. □ Z důkazu je navíc zřejmé, že nenadbytečné nerovnice jsou jednoznačné až na kladný násobek (formulace analogického výsledku pro polyedry s prázdným vnitřkem je výrazně složitější). Důsledek 2.10. Minimální (tj. minimální neprázdné) stěny jsou afinní podprostory. Je-li polyedr P: Ax > b, jsou minimální stěny tvaru {A'x = b'}, kde A'x > b' je podsystém Ax > b. Důkaz. Každá stěna je dána nahrazením některých nerovnic systému příslušnými rovnicemi. Označme podprostor určený těmito rovnicemi U' C U. Pokud je stěna minimální, musí být zbylé nerovnice triviální na U', jinak by existovala nějaká nenadbytečná a ta by určovala nějakou stěnu. Jestliže jsou však ostatní nerovnice nadbytečné, je celé U' stěnou. Navíc vidíme, že je U' prostor řešení systému rovnic určeného podsystémem Ax > b. Poznamenejme, že z toho, že další nerovnice musí být na U' triviální, snadno plyne, že každá minimální stěna má zaměření {Ax = 0}, zejména je tedy stejné pro všechny minimální stěny. □ 18 2. Polyedry a lineární programování Polyedr, jehož minimální stěny jsou body se nazývá bodovaný a jeho minimální stěny se nazývají vrcholy. Samozřejmě každý neprázdný polyedr obsahuje nějakou minimální stěnu, zejména každý neprázdný bodovaný polyedr obsahuje vrchol. Vrcholy jsou dány jako řešení (některých) systémů n nezávislých rovnic A'x = b' jako v důsledku. Příklad. Každý polyedr {Ax = b, x > 0} je bodovaný, protože neobsahuje přímku. Vrcholy jsou {Ax = b, z = 0}, kde z jsou některé souřadnice x; ne každá volba určuje vrchol. Pokud má systém Ax = b nezávislé řádky, můžeme souřadnice brát tak, že systém Ax = b, z = 0 má n řádků a hodnost n. Jsou tedy vrcholy popsány (obecně nejednoznačné) některými {n — k)-prvkovými podmnožinami M C {l,...,n}, kde k je hodnost matice A. To nám výrazně zjednoduší počítání s vrcholy. Poznámka. Polytop je polyedr tvaru P = conv J pro X konečnou množinu bodů. Platí, že prvky X, které nejsou nadbytečné, jsou právě vrcholy P: Díky nenadbytečnosti y ^ conv(X \ {y}). Existuje tedy nějaká nerovnice cx > S, která je splněna na conv(X \ {y}), ale nikoliv na y, tj. cy < S. Potom cx > cy je nerovnice, kterou splňuje P, a přitom příslušná stěna P n {cx = cy} je tvořena právě bodem y, takže se jedná o vrchol. Naopak pokud by vrchol y, zadaný nerovnicí cx > S, byl kombinací zbylých vrcholů polyedru, musely by tyto také ležet na opěrné nadrovině cx = S, takže by příslušná stěna obsahovala víc bodů a nejednalo by se o vrchol. Nenadbytečné generující body tedy odpovídají vrcholům, nenadbytečné generující nerovnice odpovídají stěnám - pěkný příklad duality. 2.5. Faces of polyhedral cones For a cone CC^we define the lineality space s{C) to be the maximal vector subspace of C. Since C is closed under sums, it is easy to see that s{C) is the union of all vector subspaces of C and thus equals s(C) = {v G V I +v,-v G C}. We say that C is pointed if s(C) = 0. By passing to the quotients C/s(C) C V/s(C) we may replace any cone by a pointed one and thus we restrict ourselves to pointed cones, only commenting occasionally on general versions of the results (our main application - the simplex method for solving linear programs - works with pointed cones anyway). Remark. Dually, S(C) = s(nC)n is the minimal linear subspace containing C, i.e. the linear span of C. Again by restricting V to this linear span, one may assume that S(C) = V; this is useful for defining dimension of C, the interior of C etc. We define a face of C to be the subset C n {cx = 0} for some c G nC, i.e. such that cx > 0 on C.4 We observe that faces are closed under intersections: This follows from (C n {cx = o}) n (C n {dx = o}) = c n {(c + d)x = o}. Thus, if C: Ax > 0, replacing any number of inequations from the system Ax > 0 by equations produces a face. Conversely, for any face C D {cx = 0}, Farkas lemma says that c is a 4In other words, we add —c to nC. 19 2. Polyedry a lineární programování nonnegative linear combination of A and the above equality read backwards shows that this face is then given by replacing in Ax > 0 certain inequations by equations, namely those that appear in the combination with a positive coefficient. This shows, in particular, that a face of a face is a face.5 For this reason, the face relation is an order and coincides with the inclusion of faces. Let C = coneX be pointed and assume that 0 ^ X. Let x G X. Since — x ^ C, there exists ax G nC such that axx > 0. Then the sum a® = ^2xex a% ^ UC ls sucn that a® > 0 on X and thus also on C \ 0. Thus, the corresponding face C n {ao = 0} = 0 is zero and is thus the smallest face. (More generally, when C is not pointed, the smallest face is s{C).) We will now study the minimal faces (minimal above 0). Remark. It is useful to visualize the cone C as a subset of the "positive projective space" V+(y) of the rays (halffines) in V. This is in bijection with the unit sphere. Now the above ao 6 DC allows one to setup the coordinate system so that ao = x° and then all the points of C C V+(y) are proper points and we thus obtain a (compact) subset of the affine space. The property of C being closed under nonnegative linear combinations is then translated to the convexity of this subset. This reduction of dimension by 1 allows us to visualize cones in dimension 4 by looking at the picture in the affine space of dimension 3. Let C = coneX be pointed and let x G X be irredundant, i.e. such that cone(X \ x) C coneX. Then there exists a G V* such that a{X \ x) > 0 and ax < 0. A suitable linear combination b = a + tao, for some t > 0, then satisfies b{X \ x) > 0 and bx = 0 and thus the corresponding face equals cones, the ray spanned by x. Clearly, this is then a minimal face. Conversely, any face is easily of the form coney for some Y C X (namely, if the face is given by ex = 0 then the subset is Y = X n {cx = 0}; not every subset of X qualifies) and thus minimal faces are exactly the rays spanned by elements of X; these must then be irredundant (if b gives a face cone a; then for some suitable t > 0 we get that a = b — tao satisfies a{X \ x) > 0 and ax < 0, making x irredundant). Remark. In the affine picture, minimal faces are irredundant points, i.e. vertices. Remark. The dual version of the above argument is that (when C = Au is a cone with S{C) = V) irredundant elements of A correspond to maximal faces of C and that these are of codimension one. In detail, there exists vq G C such that Avq > 0 and for each irredundant a there exists v such that (A\a)v > 0 and av < 0; for some t > 0 defining u = v + tvQ we obtain (A \ a)u > 0 while au = 0 yielding that u lies in the interior of C n {ax = 0} and thus the face has codimension 1 (as such it must be maximal). Any face is given by Bx = 0 for some B C A 5 One can prove this without using the defining system: If the face is given by b and inside that the face is given by Co then for any t > 0 it is also given by c = Co + tb. For a suitable choice of t, the corresponding c G nC and as such gives a face of C. 20 2. Polyedry a lineární programování and thus maximal faces are given by a single element of A (again it is irredundant since one can produce from an interior point of C and from an interior point of the face C D {ax = 0} a point that satisfies the inequations from A \ a but not a). 2.6. Úloha lineárního programování Jde o úlohu minimalizovat (nebo maximalizovat) lineární funkci cx na polyedru P: Ax > b. Úlohu budeme zapisovat minjcx | Ax > b}. Stejný zápis samozřejmě značí minimální hodnotu této funkce, nám však půjde o to najít bod x £ P, v němž minimum nastává. Poznamenejme, že z vyjádření P = conv J + coneV a z linearity funkce cx vyplývá, že obraz cP C M je opět polyedr, tedy uzavřený interval. Máme tři možnosti - buď je obraz prázdný, to nastane právě když je P prázdný, nebo je zdola neomezený nebo má minimum S. V posledním případě je množina všech bodů ve kterých nastává minimum {cx = S} D P a jedná se tedy o (neprázdnou) stěnu polyedru, neboť cx > S na P. Pokud je polyedr P bodovaný, nastává minimum nutně v nějakém vrcholu. Toho využívá metoda pro nalezení optima, tzv. simplexová metoda. Uvedeme dva speciální případy, které jsou ekvivalentní úloze v obecném tvaru, ale zároveň jsou velmi důežité - jednak kvůli dualitě a jednak kvůli simplexové metodě. Následující typy úloh jsou ekvivalentní: minjcx | Ax > b} minjcx | Ax > b, x > 0} minjcx | Ax = b, x > 0} Tím je myšleno, že pro každou úlohu prvního typu umíme sestrojit úlohu druhého typu, z jejíhož řešení umíme vyrobit řešení v původní úloze, atd. Ukážeme nyní tedy redukce prvního typu na druhý a druhého na třetí. V opačných směrech není potřeba úlohu měnit, protože se jedná o postupně speciálnější tvary. Pro úlohu minjcx | Ax > b} nahradíme neznámý vektor x rozdílem dvou nezáporných vektorů, x = x+ — X-, kde tedy > 0. Dostaneme tak úlohu minjcx | Ax > b} ~ min{cx+ — cx_ | Ax+ — Ax_ > b, x+, x_ > 0} druhého typu, řešení původní úlohy se dostane jako x = x+ — X-. Pro úlohu minjcx | Ax > b,x > 0} zavedeme substituci s = Ax — b > 0, čímž nerovnici Ax > b nahradíme rovnicí Ax — s = b, kde tedy s > 0 (tzv. přebytek). Dostaneme tak úlohu minjcx | Ax > b, x > 0} ~ minjcx | Ax — s = b, x, s > 0} třetího typu, řešení původní úlohy se dostane zapomenutím s. 2.7. Dualita v lineárním programování Nejjednodušší je: minjcx | Ax > b} lze popsat jako největší dolní závoru, přičemž S je dolní závora, pokud Ax > b =ŕ cx > S, takže podle Farkasova lemmatu to nastane, právě když je cx > S nezápornou lineární kombinací Ax > b (také bychom mohli použít Ox > —1, tím bychom ale dostali menší dolní závoru, takže ignorování této nerovnice maximum nezmění). minjcx | Ax > b} = m&x{S \ 3y > 0: c = y A, S = yb} = m&x{yb | c = y A, y > 0} 21 2. Polyedry a lineárni programování Duálně samozřejmě minjcx | Ax = b, x > 0} = max{yb \ c > yA}. Uveďme ještě symetričtější verzi pro prostřední typ úlohy lineárního programování: minjcx | Ax > b, x > 0} = max{S \ 3y > 03z > 0: c = y A + zE, S = yb + z0} = max{yb \ 3z > 0: c = y A + z, y > 0} = max{yb \ c > y A, y > 0} (přitom lze elementárně vidět, že každé yb je menší nebo rovno každému cx, takže stejná nerovnost bude platit i pro maximum a minimum: yb < y{Ax) = {yA)x < cx). 2.8. Simplexová metoda Prvně uveďme metody, které sice fungují, ale nejsou příliš efektivní. Zaprvé lze Motzkinovou eliminací popsat obraz P při zobrazení cx, tj. popsat množinu {8 | 3x: cx = S, Ax = b, x > 0}. Bude se jednat o interval a jeho minimum je právě minimum úlohy. K němu pak lze opět Motzkinovou eliminací nalézt nějaké řešení. Druhou metodou je prvně sestavit seznam všech vrcholů a poté porovnat funkční hodnoty v nich. K tomu lze použít popis vrcholů jakožto řešení soustav Ax = b, z = 0, kde z je nějaká podmnožina proměnných x, viz níže. Budeme předpokládat úlohu ve tvaru minjcx | Ax = b, x > 0}, kde o soustavě rovnic Ax = b budeme navíc předpokládat, že jsou z ní odstraněny nadbytečné rovnice, takže její hodnot je rovna počtu řádků k. Položme n = k + l, tedy l je dimenze podprostoru {Ax = b}. Vrcholy polyedru P: Ax = b, x > 0 budeme popisovat množinou indexů, pro které X{ = 0. Pišme souhrnně tyto proměnné jako z a zbylé proměnné jako y. Protože předpokládáme, že podprostor {Ax = b, z = 0} má dimenzi 0 (jedná se o vrchol) a soustava Ax = b má lineárně nezávislé řádky, můžeme případným zredukováním proměnných z dosáhnout toho, že je těchto právě l a tedy proměnných v y je právě k. Soustavu Ax = b pak lze upravit do ekvivalentního tvaru y + Az = b, tj. rozřešit ji vzhledem k proměnným y, konkrétně y = b — Az. V takovém případě je vrcholem právě (y,z) = (6,0). Pak lze ale také lineární funkci cx na podprostoru Ax = b napsat pouze v proměnných z (dosazením y = b — Az). Lemma 2.11. Pokud má vyjádření cx pomocí z všechny koeficienty nezáporné, je vrchol (6, 0) bodem, ve kterém nastává minimum. Předpokládejme tedy dále, že koeficient u zq je záporný, označme zbylé proměnné z'', pak pro zq > 0, z' = 0 dostaneme bod s menší funkční hodnotou. Uvažme tedy přímku {Ax = b, z' = 0}. Ta protíná polyedr P v hraně, jejímž jedním vrcholem je bod (6, 0). Každá nerovnice y i > 0 zadává omezující podmínku na zq: y + aqzq + A'z' = b vzhledem k z' = 0 dává yi + ctiqzq = /3j, tedy (^íqZq ^ /3j. Pokud aiq ^ 0, nedává tato rovnice na zq žádné omezení shora, budeme tedy v dalším uvažovat pouze ty rovnice s ctiq > 0, kdy tato rovnice je ekvivalentní zq < fiijaiq. 22 2. Polyedry a lineární programování Lemma 2.12. Pokud jsou všechna ctiq < O, je hrana neomezená a funkce cx podél ní klesá, takže nenabývá minima. Předpokládáme tedy, že nějaké ctiq > 0 a mezi nimi vyberme index p, pro který je poměr /3p/apq minimální. Pak druhým vrcholem hrany je zq = /3p/apq a tedy yp = 0. Dostaneme tedy nový vrchol tak, že v proměnných y nahradíme yp za zq. Obě volby indexů p, q jsou nejednoznačné. Pokud bude v každém kroku /3 > 0, hodnota se vždy zmenší a vzhledem ke konečnému počtu vrcholů se algoritmus zastaví. Toto nastane pro nedegenerované polyedry, tj. polyedry, ve kterých se v každém vrcholu potkává právě l stěn, tj. v každém vrcholu je nulových právě l souřadnic. Tato situace je obecná ve smyslu, že libovolně malou změnou pravé strany b lze dosáhnout nedegenerovanosti. V případě degenerovaného polyedru je třeba opatrnosti při výběru proměnných, jinak může dojít k zacyklení - v každém kroku měníme proměnné popisující vrchol, ale vlastní vrchol se nemění, přičemž po nějaké době opět dospějeme k téže množině proměnných. K zacyklení nedojde při použití tzv. Blandova pravidla, které říká, že máme volit q nejmenší možné a v rámci této volby také p nejmenší možné. Důkaz nezacyklení zde uvádět nebudeme. 2.9. Nalezení vrcholu Na započetí výpočtu je potřeba nalézt vrchol polyedru P: Ax = b, x > 0. To se nám podaří následující metodou. Případným vynásobením některých rovnic systému koeficientem — 1 můžeme předpokládat b > 0. Přidejme umělé proměnné i > 0 a uvažme pomocnou úlohu min{lí | Ax +í = b, x > 0, t > 0}, ve které li = íi + • • • +1 k je součet pomocných proměnných (tj. 1 reprezentuje řádek složený ze samých jedniček). Zjevně minimum takové úlohy bude existovat, protože je hodnota funkce zdola omezena nulou a pomocný polyedr obsahuje vrchol (x, i) = (0, b) zadaný rovnicemi x = 0. Protože pro pomocnou úlohu máme počáteční vrchol, můžeme na ni aplikovat simplexovou metodu. V případě, že nalezneme minimum větší než nula, dostaneme P = 0, v případě, že minimum bude nula, dostaneme bod polyedru P. Případnými dodatečnými kroky můžeme dosáhnout toho, že příslušný pomocný vrchol bude zadán rovnicemi z = 0, i = 0, kde z je tvořen některými z proměnných x jako předtím, takže se jedná také o vrchol polyedru P. 23 3. Nadkvadriky v afinním a projektivním prostoru 3.1. Definice nadkvadriky v reálném afinním prostoru Uvažujme reálný afinní prostor S s bází (O, e\, ..., en), pro jednoduchost můžeme předpokládat S = A n se standardní bazi. Nadkvadrikou v An rozumíme množinu Q C An všech bodů, jejichž souřadnice v dané bázi splňují rovnici n n ^ ciíjXiXj + 2 ^ aíOxí + aoo = 0, i,j=l i=l kde a,ij = a,ji G M a aspoň jedno 7^ 0 pro i, j G {1,..., n}. Nadkvadriky v A2 se nazývají kuželosečky, nadkvadriky v ^,3 kvadriky. Mnohé rovnice výše uvedeného typu (např. x\ + x\ + 1 = 0) nemají v reálném oboru řešení. Proto je výhodné místo s nadkvadrikami v An pracovat s nadkvadrikami v komplexním rozšíření Aft. Poznámka. Za chvíli uvidíme, že tato definice nezávisí na souřadnicích a ve skutečnosti lze provést ve vektorovém obalu afinního prostoru pomocí symetrické bilineární formy. 3.2. Definice nakvadriky v komplexním rozšíření afinního prostoru Uvažujme komplexní rozšíření Aft reálného afinního prostoru. Nechť (O, e±, ..., en) je nějaká báze An. Nadkvadrikou v A^ rozumíme množinu Q C A^ všech bodů, jejichž souřadnice v dané bázi splňují rovnici n n ^ ciíjXiXj + 2 ^ ai0Xi + a0o = 0, i,j=l i=l kde a,ij = a jí G M a aspoň jedno 7^ 0 pro i, j G {1,..., n}. Pro nadkvadriky v afinním prostoru chceme definovat takové pojmy jako střed, tečná nadrovina, asymptotická nadrovina, a to nejlépe v řeči koeficientů a^, aby nalezení těchto objektů bylo početně co nejjednodušší. To se nám podaří celkem snadno, když od afinního prostoru přejdeme k jeho projektivnímu rozšíření a od kvadriky Q C A% C A% k jejímu rozšíření Q C A%- Popišme nyní nadkvadriku Q v homogenních souřadnicích A^. Nechť tedy X = (xq : x\ : • • • : xn) G A%- Potom tento bod leží na Q, právě když X je vlastní, tj. xq 7^ 0 a pak X = (1 ~. — : • • • : ^IL), a navíc platí n n aij--- + 2 } ai0--h a00 = 0. . J x0 x0 ^—' x0 Po vynásobení xq 7^ 0 dostáváme ekvivalentní rovnici ^ aíjXiXj + 2 ^ ai0XiX0 + aoo^o = °- i,j = l i=l Množinu všech bodů A^, jejichž homogenní souřadnice splňují výše uvedenou rovnici, nazveme projektivním rozšířením nadkvadriky Q a budeme ji označovat Q. Množina Q může obsahovat i nevlastní body z v(A^) o souřadnicích (0 : x\ : ■ ■ ■ : xn). 24 3. Nadkvadriky v afínním a projektivním prostoru Položíme-li aoi = ciíq a A = (a^-)" -=0, je A nenulová symetrická matice typu (n+1) x (n+1). Výše uvedenou rovnici můžeme psát ve tvaru n i,j=0 Symetrická matice A definuje reálnou bilineární formu / na aritmetickém základu projektivního prostoru An předpisem n f(x> y) = 5ľ ai3xíV3 = xTAy- i,j=0 Blok matice A příslušný kladným indexům i > 0, j > 0 budeme označovat A, odpovídá kvadratické části původní rovnice. 3.3. Definice nadkvadriky v projektivním prostoru Nechť V (V) je reálný projektivní prostor dimenze n. Nechť / je nenulová reálná symetrická bilineární forma na V. Nadkvadrika Q v projektivním prostoru V(VC) je množina bodů [v] G V{VC), pro které f(v,v)=0. V souřadnicovém vyjádření v nějaké bázi V jde o řešení rovnice n X j^X — ^ Cl'íjOC'íOCj — 0, i,j=0 kde clíj = a jí G M a clíj 7^ 0 pro nějaké Důležitým aspektem je homogennost této rovnice, díky níž platnost této rovnice nezávisí na volbě reprezentanta. Poznámka. Nechť Q C je afinní nadkvadrika. Pak množina Q je nejmenší projektivní nadkvadrika, která obsahuje Q. Toto tvrzení není zcela triviální a přenecháváme jej čtenáři k věření. Lemma 3.1. Nadkvadrika Q v je rozšířením nějaké kvadriky v Aft právě tehdy, když existuje nějaký nevlastní bod X G u{A^), který v Q neleží. Důkaz. Nechť je projektivní nadkvadrika Q C zadána symetrickou bilineární formou / s maticí A. Potom Q není rozšířením afinní nadkvadriky, právě když je blok A nulový, tj. právě když je zúžení / na nevlastní podprostor nulové. To je ale právě tedhy, když je rovnice f(x,x) = 0 splněna pro všechny nevlastní body X = [x] G u{A^). □ 3.4. Vztah mezi nadkvadrikami a symetrickými bilineárními formami Nechť K,n je množina všech nadkvadrik v V^, nechť Bn je množina všech symetrických bi-lineárních forem na aritmetickém základu Mn+1. Protože se jedná o vektorový prostor, můžeme uvažovat příslušný projektivní prostor V{Bn) = {Bn \ {0})/~. Zobrazení ip: £>n \ {0} —> K.n, definované předpisem fCn. 25 3. Nadkvadriky v afínním a projektivním prostoru Věta 3.2. Zobrazení p: V{Bn) —> fCn je bijekce. Důkaz. Z definice existuje ke každé nadkvadrice příslušná bilineární symetrická forma, tedy p je surjektivní zobrazení. Chceme dokázat, že je také injektivní, to znamená, že zadávají-li dvě bilineární symetrické formy / a g tutéž kvadriku, pak g = k ■ f pro nějaké k G M. Vezměme u G Mn+1 takové, že f (u, u) 7^ 0. Protože f a g zadávají tutéž kvadriku, je také g(u,u) 7^ 0. Můžeme proto psát g(u,u) = kf(u,u) pro nějaké 0 7^ k G M. Vezměme nyní libovolné v G Cn+1. Potom výrazy f (tu + v, tu + v) = t2 f (u, u) + 2tf(u, v) + f (v, v) g (tu + v,tu + v) = t2g(u, u) + 2tg(u, v) + g(v, v), chápané jako polynomy druhého stupně v proměnné t, mají podle předpokladů stejné kořeny íl, Í2- Z algebry víme, že koeficienty polynomů stejného stupně (v našem případě 2) a se stejnými kořeny musí být úměrné, proto ze vztahu g(u, u) = kf(u, u) plyne g(v, v) = k f (v, v). Protože vektor v byl volen libovolně, platí g = k ■ f. □ Poznámka. Podobné tvrzení platí také pro afinní nadkvadriky, konkrétně dvě kvadratické rovnice q(x) = 0, r(x) = 0 zadávají stejnou nadkvadriku, tj. mají stejnou množinu řešení, právě když r = k ■ q pro nějaké k G Mx. Důkaz se provede stejně jako v projektivním případě, jen je potřeba zvolit u nevlastní; pak se stejně ukáže, že g(x,x) = kf(x,x) pro x = (1, xi,..., xn) vlastní. To je ale přesně rovnice r(x) = kq(x). 3.5. Klasifikace nadkvadrik v projektivním prostoru Věta 3.3. Nechi Q C je nadkvadrika. Potom v Mn+1 existuje báze, v níž je nadkvadrika dva imaginární body dva reálné body dvojný bod imaginární regulární kuželosečka reálná regulární kuželosečka dvojice imaginárních přímek dvojice reálných přímek dvojnásobná přímka imaginární regulární kvadrika nepřímková regulární kvadrika přímková regulární kvadrika imaginární kuželová plocha reálná kuželová plocha imaginární dvojice rovin reálná dvojice rovin popsána právě jednou z rovnic (a) pro n = 1 (b) pro n = 2 X0 + x\ = 0 x0 — x\ = 0 -y-. 2 x0 = 0 x0 + x\ + 4 = 0 x0 + x\ -y-. 2 x2 = 0 x0 + x\ = 0 x0 — x\ = 0 -y-. 2 x0 = 0 (c) pro n = 3 -y-. 2 x0 + x\ + 4 + 4 = 0 -y-. 2 x0 + x\ + 4 -4 = 0 x0 + x\ — x\ — x3 = 0 x0 + x\ + 4 = 0 -y-. 2 x0 + x\ -y-. 2 x2 = 0 -y-. 2 x0 + x\ = 0 4 — x\ = 0 26 3. Nadkvadriky v afínním a projektivním prostoru Xq = O dvojnásobná rovina Důkaz. Každá nadkvadrika je určena nějakou reálnou symetrickou bilineární formou / na aritmetickém základu Mn+1. Pro tuto formu lze nalézt vhodnou bázi Mn+1, v níž má / diagonální tvar s koeficienty ±1 nebo 0 na diagonále. Případným vynásobením číslem —1 dostaneme rovnici tvaru 2 i i 2 2 2 _ f\ Xq "T • • • T" Xp ' xp+q kde p, q > 0, p + l>q&p + q C je lineárni zobrazení, je buď im f (x, —) = 0 nebo C. Dále dimker f (x, —) = n + 1 — dimim/(x, —), což dává tvrzení lemmatu. □ Příklad (a). V uvažujme kvadriku 2 i 2 2 2 _ r\ X-y ~\~ — U. Polárně sdružené body k bodu [(1,1, 0, V2)] mají homogenní souřadnice (2/1,2/2, 2/3,2/4) a tvoří rovinu 0 = /((l, 1,0, \Í2), (2/1,2/2,2/3,2/4)) = 2/1 +2/2 - v/22/4- 31 4. Metrická klasifíkace nadkvadrik Příklad (b). V uvažujme kuželosečku Polárně sdružené body k bodu [(0,0,1)] jsou všechny body "P^, neboť pro jejich homogenní souřadnice (2/1,2/2,2/3) platí 0 • 2/1 + 0 • 2/2 = 0. Definice 4.3. Bod [x] G V% se nazývá regulárním bodem vzhledem k nadkvadrice Q, jestliže množina polárně sdružených bodů k [x] je nadrovina v V^. Tato nadrovina se nazývá polární nadrovina (v "Pfp stručně polára). Definice 4.4. Bod [x] G V% se nazývá singulárním bodem nadkvadriky Q, jestliže množina polárně sdružených bodů k [x] je celý prostor V^ - (Speciálně platí [x] G Q.) Definice 4.5. Nadkvadrika Q v se nazývá regulární, jsou-li všechny její body regulární. Nadkvadrika se nazývá singulární, obsahuje-li nějaký singulární bod. nd Lemma 4.6. Nadkvadrika Q C je regulární právě tehdy, když hodnost symetrické matice A, která ji definuje v souřadnicích, je rovna n + 1. nd Důkaz. Hodnost A je rovna n + 1 právě tehdy, když xTA 7^ 0 pro každé x 7^ 0. To je ale ekvivalentní tomu, že existuje y 7^ 0 takové, že xTAy 7^ 0, neboli bod [x] je regulární. □ Lemma 4.7. Jestliže Q C je regulární nadkvadrika, pak součet dimenzí podprostoru U a jeho polárního doplňku je vždy n — 1 a platí = U. Říkáme, že to jsou podprostory komplementární dimenze. Důkaz. Pokud má aritmetický základ IÁ bázi (uq, ..., uj), pak jeho polární komplement má aritmetický základ popsaný soustavou d+1 rovnic f(uo, —) = ••• = f(ud, —) = 0. Tyto rovnice jsou lineárně nezávislé, protože jejich kombinace /(xqUq + • • • + x^u^, —) je nulová pouze pro xquq + • • • + XdUd = 0, tj. xq = ■ ■ ■ = Xd = 0, díky regularitě Q. Proto má aritmetický základ dimenzi n — d a v součtu pak mají U a dimenzi d + (n — d — 1) = n — 1. Druhé tvrzení plyne z prvního, protože zřejmě platí U C (ř/*)* a oba podprostory mají stejnou dimenzi. □ Lemma 4.8. Nechť Q C je nadkvadrika se singulárním bodem X. Jestliže Y 7^ X je dalším bodem nadkvadriky Q, pak v Q leží celá přímka XY*. Důkaz. Pro aritmetické zástupce x, y bodů X a Y a bilineární formu /, která definuje nad-kvadriku Q, platí f{x,x) = 0 a f{x,y) = 0, neboť [x] = X je singulární bod, a f{y,y) = 0, neboť [y] = Y G Q. Potom f(ax + by, ax + by) = a2f(x, x) + 2abf(x, y) + b2f(y, y) = 0. Tedy [ax + by] e Q. □ Speciální případ, kdy singulární bod [v] G v{A^) je nevlastní, má následující geometrickou interpretaci: s každým bodem Y G Q obsahuje nadkvadrika Q i celou přímku procházející Y se směrovým vektorem v. 32 4. Metrická klasifíkace nadkvadrik 4.2. Tečná nadrovina Na základě předchozí motivace můžeme vyslovit následující definici. Definice 4.9. Tečná nadrovina nadkvadriky Q C v regulárním bodě X 6 Q je polární nadrovina k X. Věta 4.10. Nadrovina r v je tečnou nadrovinou k nadkvadrice Q v regulárním bodě X £ Q právě tehdy, když tCQ nebo r (~)Q je singulární kvadrika v r se singulárním bodem X. Důkaz. Nechť r je tečná nadrovina v bodě X = [x], r = {[y] \ f(x,y) = 0}. Pak Q flr = {[y] 6 r | f(y,y) = 0} a máme dvě možnosti - buď je zúžení / na aritmetický základ r nulové, pak je r C Q, nebo nenulové, pak je Q n r opět nadkvadrika a přímo podle definice je X její singulární bod Q. Opačný směr je analogický. □ Důsledek 4.11. Přímka p je tečnou ke kuželosečce Q právě tehdy, když p C Q nebo p(~]Q je jednobodová množina (čítaje nevlastní body, viz případ osy paraboly nebo přímky mající směr asymptoty hyperboly). □ Příklad. Najděte tečnu kuželosečky Q v bodě IeQ. Q:8xl+ 4Xlx2 + bx22 + 16xi + 4x2 - 28 = 0, X = [0; 2] Řešení. Daná kuželosečka je zadána v afinní rovině. Rozšíříme ji prvně na projektivní rovinu. V této rovině je bilineární forma kuželosečky Q f(x, y) = Sxiyi + 2xiy2 + 2x2yi + 5x2y2 + 8xiy0 + 8x0yi + 2x2y0 + 2x0y2 - 28x0y0. Bod X má homogenní souřadnice x\ = 0, x2 = 2, xq = 1. Jeho dosazením do f(x,y) získáme rovnici tečny v homogenních souřadnicích: 12yi + 12y2 - 24y0 = 0. V afinní rovině je tečnou vedenou bodem X ke kuželosečce Q přímka 2/1+2/2-2 = 0. o Příklad. Bodem X 0 Q veďte tečnu ke kuželosečce Q. Q:2x\- 4xix2 + x2 - 2xx + 6x2 - 3 = 0, X = [3; 4] Řešení. Kuželosečku Q zadanou v afinní rovině rozšíříme na kuželosečku Q v projektivní rovině. Příslušná bilineární forma pro Q je f(x, y) = 2x\y\ - 2x\y2 - 2x2y\ + x2y2 - xiy0 - x0yi + 3x2y0 + 3x0y2 - 3x0y0. Nechť T = (to,ti,t2) je bodem dotyku hledané tečny. Tedy T £ Q a T a X jsou polárně sdružené. To vede na rovnice 2t\ - 4txt2 + t\ - 2íií0 + 6í2ío -3ÍQ = 0 -3íi + í2 + 6í0 = 0 33 4. Metrická klasifíkace nadkvadrik Dosazením 12 = 3íi + 6ío do první rovnice dostaneme -t\ - 3Íq + 4íií0 = 0. Položíme íq = 1 a, řešíme rovnici -t\ + 4íi - 3 = 0. Řešení íi = 3 a 1 vede k bodům T\ = (1, 3, 3) a T2 = (1,1, —3). Hledané tečny jsou potom x\ — 3 = 0 a 7a; 1 — 2a?2 — 13 = 0. o 4.3. Střed nadkvadriky v afinním prostoru V tomto paragrafu budeme pracovat s nadkvadrikou Q v afinním prostoru Aft a s jejím projektivním rozšířením Q v A^- Body z Q \ Q nazýváme nevlastní body nadkvadriky Q. Obecně pak o bodech z v(A%) budeme hovořit jako o směrech. Dennice 4.12. Bod S G A^ se nazývá střed nadkvadriky Q, jestliže je polárně sdružen se všemi nevlastními body. Poznámka. Střed může být vlastní i nevlastní bod v A^- Následující věta říká, že vlastní střed má právě ty vlastnosti, které po středu v geometrii požadujeme. Věta 4.13. Bod S G Aft je středem nadkvadriky Q právě tehdy, když Q je středově souměrná podle S. Důkaz. Nechť s G Cn+1 je aritmetický zástupce středu nadkvadriky S G Aft C A^. Potom pro všechny vektory v ze zaměření afinního prostoru Aft platí f(s, v) = 0. Odtud dostáváme f(s +tv,s+ tv) = f(s, s) + 2f(s, v)t + f (v, v)t2 = f(s, s) + f (v, v)t2. Tato rovnice v proměnné t má buď nekonečně mnoho řešení (oba koeficienty jsou nulové), zádně řešení (pouze kvadratický je nulový) nebo právě dvě řešení t = ±ío- V každém případě je množina řešení symetrická podle počátku a proto Q symetrická podle S. ** V opačném směru je potřeba ještě uvážit jednu možnost symetricky rozložených řešení, konkrétně jediné řešení t = 0, kdy lineární člen nemusí být nulový. Potom bude nulový kvadratický člen, tj. f (v, v) = 0. Protože je ale zúžení bilineární formy / na nevlastní podprostor Dir„4n nenulové, existuje báze (ei,..., en) taková, že /(e^, e^) 7^ 0, jak se snadno ukáže. Podle předchozího tak musí platit f(s, e^) = 0 a proto je S polárně sdružený s [ej] a tím pádem se všemi nevlastními body. □ Výpočet středu. Chceme-li najít středy S nadkvadriky Q zadané v homogenních souřadnicích A^ bilineární symetrickou formou f(x, x) = xTAx, řešíme soustavu ai0s0 + ansi + ... + ai„sn = 0 dnOSQ + aniSi + ... + annSn = 0 Ta vznikne ze vztahu 0 = f(x, s) = xTAs postupným dosazením Chceme-li najít vlastní střed, pokládáme sq = 1, ideálně pak převedeme členy ajoso na pravou stranu. (Pro výpočet nevlastního středu bychom položili sq =0.) 34 4. Metrická klasifíkace nadkvadrik Lemma 4.14. Regulární nadkvadrika má právě jeden (vlastní nebo nevlastní) střed. Důkaz. To plyne buď z lemmatu o dimenzích polárních duálů (střed je polární duál nevlastní nadroviny, která má dimenzi n — 1) nebo z předchozího popisu výpočtu. □ Příklad. Najděte středy kuželosečky Q (vlastní i nevlastní). Q: 4xix2 + 3x22 + 6xi + 12x2 - 36 = 0 Řešení. Bilineární forma pro kuželosečku Q je f(x, y) = 2xií/2 + 2x2yi + 3x2y2 + 3xiy0 + 3x0yi + 6x2y0 + 6x0y2 - 36x0y0- Rovnice pro střed S = (yo> 2/i> 2/2) jsou 2y2 + 3y0 = 0 2yi + 3y2 + 6y0 = 0 Pro yo = 1 dostaneme jediné řešení S = ( — f, —§, 1)- Pro í/o = 0 dostame yi = y2 = 0, což nedává v projektivní rovině žádný bod. Daná kuželosečka má tedy vlastní střed S = [— |, — |] a nemá žádný nevlastní střed. o Příklad. Najděte středy kvadriky Q (vlastní i nevlastní). Q: x\ + X1X2 + 2x2 — x3 ~ 2 = 0 Řešení. Bilineární forma pro kvadriku Q je 2f(x, y) = 2xiyi + xxy2 + x2yi + 4x2y2 - 2:3^0 - - 4x0y0- Soustava rovnic pro střed S = (2/0)2/1)2/2)2/3) Je 22/1 +2/2 =0 2/1 + 4y2 =0 -2/0 = 0 Tato soustava nemá řešení pro yo 7^ 0. Pro yo = 0 má řešení (0,0,0,i). Tedy daná kvadrika nemá vlastní střed a má jeden nevlastní střed o homogenních souřadnicích (0, 0, 0,1). o 4.4. Eukleidovský afinní prostor Řekneme, že afinní prostor S je Eukleidovský, jestliže je na Dir5 zadán skalární součin. Standardní Eukleidovský prostor £n dimenze n je standardní afinní prostor An vybavený stadardním skalárním součinem ((0,xi,... ,xn), (0,yi,.. • ,2/n)) = xiyi -\-----V xnyn. Skalární součin bodů nebudeme uvažovat, protože geometricky nedává smysl. V této části budeme nadkvadriky uvažovat v komplexním rozšíření £^ a v jeho projektivním rozšíření Tyto nadkvadriky budeme popisovat nyní pouze v souřadnicích reálných ortonormálních bází (O, e±,..., en) v £n. To znamená, že O G £n a (ei,..., en) tvoří ortonormální bázi Dir £n. Říkáme, že směry [u] a [v] jsou kolmé, jestliže uli). Jak již bylo řečeno, kolmost vlastních bodů nedává geometricky smysl. 35 4. Metrická klasifíkace nadkvadrik 4.5. Hlavní směry Směr [u] zadaný reálným vektorem u G Dir£n se nazývá hlavní směr nadkvadriky Q, jestliže všechny k němu kolmé směry v Dir £^ jsou s ním polárně sdružené. Jinými slovy: Je-li nadkvadrika Q popsána bilineární formou /, pak pro všechny v G Dir£^, iilw platí f(u,v)=0. Nechť (O, ei,..., en) je nějaká ortonormální báze v £n. Nechť A = (clíj)™'-_0 je matice bilineární formy / na Mn+1. Nechť A je matice bilineární formy / zúžené na Dir£n v bázi (ei,...,en), tj. A = (aij)?j=1. Věta 4.15. Nenulový vektoru G Dir£n určuje hlavní směr nadkvadriky Q právě tehdy, když je vlastním vektorem lineárního zobrazení zadaného maticí A. Důkaz. Lineární zobrazení Dir £^ —> Dir £^ zadané maticí A označme opět A. Nechť u / 0 určuje hlavní směr. Potom 0 = f(u,v) = (Äu, v) pro všechna uli). Proto Au G (u^)^ = [u], tj. Au = Xu. Nechť obráceně u 7^ 0 je vlastním vektorem zobrazení A, tj. Au = Xu. Pro všechna ulu pak platí f(u,v) = (Au,v) = (Xu,v) = X(u,v) = 0. Tedy u určuje hlavní směr. □ Z důkazu je zároveň vidět, že pro normovaný vektor u zadávající hlavní směr platí f(u, u) = X(u,u) = X. V ortonormální bázi složené z vlastních vektorů tedy bude A diagonální s vlastními čísly na diagonále (to by nebyla pravda bez normovanosti!). Důsledek 4.16. Ke každé nadkvadrice Q v £^ existuje ortonormální báze v Dir£n, jejíž vektory určují hlavní směry nadkvadriky Q. Důkaz. K symetrické reálné matici A existuje ortonormální báze tvořená reálnými vlastními vektory. □ Definice 4.17. Vlastní čísla matice A se nazývají hlavní čísla nadkvadriky Q. Tato čísla nejsou určena jednoznačně, ale pouze až na společný násobek, je tedy jednoznačný jejich poměr (Ai : • • • : An), který lze chápat jako prvek projektivního prostoru V(M.n) (protože vlastní čísla symetrických matic jsou reálná). 4.6. Nadkvadriky a symetrie Již dříve jsme podali definici středu nadkvadriky v afinním prostoru. K této definici jsme nepotřebovali skalární součin. O symetrii nadkvadriky vzhledem k nadrovině však můžeme mluvit pouze tehdy, když máme na zaměření afinního prostoru zadán skalární součin. Definice 4.18. Nadrovina r v £n se nazývá hlavní nadrovinou nadkvadriky Q, jestliže je buď • polární nadrovinou k regulárnímu hlavnímu směru nadkvadriky Q C £C nebo • kolmou nadrovinou k singulárnímu hlavnímu směru nadkvadriky Q C £^. 36 4. Metrická klasifíkace nadkvadrik Osová nadrovina pro n = 2 se nazývá osová přímka nebo osa. Poznamenejme, že i v prvním případě je hlavní nadrovina kolmá k danému hlavnímu směru [u] - ten je totiž polárně sdružen s [u]^ a to je tedy zaměření této hlavní nadroviny. Poznámka. V dalším ukážeme, že hlavní nadroviny Q jsou osovými nadrovinami Q; obrácené tvrzení platí až na drobnou výjimku také a nebudeme proto mezi těmito pojmy rozlišovat. Příklad. Uvažujme parabolu xf+2x2 = 0 ve standardní ortonormální bázi vl2 = 82- Matice A je 0 1\ 0 1 0 v 0 0/ A Matice A = ^ ^ jj J má vlastní čísla 1 a 0 s vlastními vektory (1,0) a (0,1). Ty určují hlavní směry a jsou regulárními nevlastními body o homogenních souřadnicích (0 : 1 : 0) a (0:0: 1). Polára k (0 : 1 : 0) v £^ je dána rovnici x1 = 0. Polára k (0 : 0 : 1) v £2" Je dána rovnicí x0 = 0. Tedy v £2 má parabola pouze jedinou osovou přímku x1 = 0. Příklad. Uvažujme dvojici reálných rovnoběžek x\ - 1 = 0 ve standardní ortonormální bázi M = £0. Matice H 0 0 1 0 U 0 0/ Vlastní čísla matice A jsou 1 a 0 s vlastními vektory (1,0) a (0,1). Ty určují 2 hlavní směry o homogenních souřadnicích (0 : 1 : 0) a (0 : 0 : 1). (0 : 1 : 0) je regulární nevlastní bod. Polára k němu je x1 = 0. (0 : 0 : 1) je singulární nevlastní bod. Všechny přímky kolmé na (0,1) v £2 jsou X2 = c, kde c je nějaká konstanta. Daná kuželosečka má tedy osové přímky x\ = 0 a X2 = c, c G M. Věta 4.19. Nechi r je hlavní nadrovina Q v £^. Pak je Q symetrická podle t. Důkaz. Nechť r je osová nadrovina v £n k hlavnímu směru [u] a nechť 5ět. Potom [s + íu] G Q, právě když 0 = f(s + tu, s + iu) = f(s, s) + 2/(s, u)í + f(u, u)t2 = f(s, s) + f(u, u)t2 a opět kořeny tohoto polynomu v proměnné t jsou symetricky rozložené okolo 0, tedy Q je symetrická podle r. □ Definice 4.20. Průsečnice dvou osových rovin kvadriky Q se nazývá osová přímka nebo osa kvadriky Q. Body průniku osové přímky s kvadrikou se nazývají vrcholy. 37 4. Metrická klasifíkace nadkvadrik 4.7. Metrická klasifikace kuželoseček a kvadrik Klasifikaci provedeme indukcí. Předpokládejme prvně, že existuje singulární směr a označme JeJ [en], kde en je normovaný. Zvolme libovolnou vlastní nadrovinu r kolmou na en; podle klasifikace v dimenzi n — 1 existuje ortonormální afinní báze (V, e±,..., en_i), v níž má Q D t kanonický tvar. Doplňme tuto bázi vektorem en do ortonormální afinní báze An a zkoumejme matici nadkvadriky v této bázi. Protože byl [en] singulární, je tato stejná jako pro QDt, pouze doplněná nulovým řádkem a nulovým sloupcem. Zejména, rovnice Q je totožná s rovnicí QDt. Budeme tedy v dalším předpokládat, že žádný singulární směr neexistuje. Poznamenejme ještě krátce, že v případě singulárního vlastního bodu je celá nadkvadrika kuželem a klasifikace se redukuje na (metrickou) projektivní klasifikaci nadkvadrik. Nechť je nejdříve Q středová a zvolme střed S za počátek. Dále zvolme ortonormální bázi (ei,..., en) zaměření Dir £n složenou z vektorů reprezentujících hlavní směry. To je možné díky ortonormální diagonalizovatelnosti symetrických bilineárních forem. V bázi (S, e±,..., en) má Q matici 0 • • °\ 0 Ai 0 0 An/ jelikož platí: /(e^e,) = 0, i / j, protože jsou [e^] hlavní směry; f(S,ei) = 0, protože je S střed. Ve skutečnosti je au = f{ci,Ci) = (Aej,ej) = (Aje^ej) = Aj, protože |ej| = 1, a aoo = f(S,S). V nestředovém případě se stačí omezit na regulární nadkvadriky, protože vlastní singulární bod by byl tím spíše vlastním středem. Díky regularitě je {u{£^))^ nularozměrný, označme jeho jediný bod [en] a předpokládejme opět en normovaný. Zkoumejme nyní kolmý doplněk [en]^ C v(£n). To je projektivní podprostor dimenze n — 2 a proto má jeho polární doplněk dimenzi 1, přičemž průnik tohoto doplňku s [en]* = v(£n) je ([enj^ + fen])* = {^{^n ))* = [en], takže doplněk obsahuje krom [en] ještě vlastní přímku o, tzv. osu nadkvadriky Q. Protože není o tečná k [en] (neleží v [en]* = u(£^)), je průnik Qn o regulárni a obsahuje tedy krom [en] i druhý bod V, nutně vlastní, který zvolíme za počátek. Zvolíme libovolnou ortonormální bázi zaměření složenou z vektorů zadávajících hlavní směry, přičemž cn bude aritmeticky zástupce středu (hlavního směru příslušného hlavnímu číslu 0). Nadkvadrika Q pak bude mít matici /o 0 0 p\ 0 Ai 0 ••• 0 0 0 '• An_i 0 \p 0 0 0/ Z výpočetního hlediska je dobré si zapamatovat, že i v singulárním případě se regulární střed dostane jako střed kolmý na všechny singulární směry. Osa je pak přímka mající směr tohoto regulárního středu polárně sdružená se všemi hlavními směry odpovídajícími nenulovým hlavním číslům (stačí spočítat jediný takový bod, protože směr již známe). Dostáváme tak následující klasifikační větu. Věta 4.21. Pro každou nadkvadriku Q v £^ lze najít takovou ortonormální bázi (O, e±,..., en), že v jejích souřadnicích má Q právě jednu z rovnic 38 4. Metrická klasifíkace nadkvadrik (a) pro n = 1,2,3 — +1 = 0 a následující kužel (b) pro n = 2, 3 ^ -i = o xi = 0 + + + 1 = 0 1 = o 1 = o + 2x2 = O a následující kužele íiy+(2 Oil) \°í2, OL\ (c) pro n ■ 'xi ai 'xi 'xi 'xi ai + + + + + X2 a2 Xi 'íi y _ z' í^ a následující kužele Oil J \Oí2j \OS3, O O +i^y+^y+i=o 1 = o + 1 = 0 1 = o + 2x3 = O + 2x3 = O O O dvojice imaginárních bodů/přímek/rovin dvojice reálnych bodů/přímek/rovin dvojnásobný bod/přímka/rovina imaginární elipsa/imaginární eliptický válec reálná elipsa/reálný eliptický válec hyperbola/hyperbolický válec parabola/parabolický válec imaginární různoběžné přímky/roviny reálné různoběžné přímky/roviny imaginární elipsoid reálný elipsoid dvoudílný (nepřímkový) hyperboloid jednodílný (přímkový) hyperboloid eliptický paraboloid hyperbolický paraboloid imaginární kuželová plocha reálná kuželová plocha xi \ / x2 \ _ / x3 ,Oíl) \a2/ \a3, Pro koeficienty platí clí > O, olí > O, přičemž koeficienty cti jsou určeny až na násobek; jinými 39 4. Metrická klasifíkace nadkvadrik slovy, hraje roli pouze poměr (a± : • • • : an). Příklad. Najděte hlavní směry, osové rovin, osové přímky, vrcholy a kanonickou rovnici ve vhodné bázi kvadriky x\ — 4a?2 + 6x1X3 + x2 + 4xi + 16x2 — 4x3 — 16 = 0. Rešení. Matice Vlastní čísla Ai, A2, A3 matice A jsou kořeny charakteristického polynomu det(A - XE) = -A3 - 2A2 + 16A + 32. Tyto kořeny, pokud jsou celočíselné, musí dělit absolutní člen 32. Tak zjistíme, že Ai = -2, A2 = 4, A3 = -4. Odpovídající vlastní vektory U{ jsou řešeními soustavy (A — XíE)uí = 0. Dostáváme ui = (1, 0,-1), U2 = (1, 0,1) a 113 = (0,1, 0). Osové roviny má kvadrika 3 a jsou to roviny polární k u\, U2 a u%. x\ — X3 — 2 = 0 x\ + x3 = 0 x2 - 2 = 0 Osové přímky jsou opět tři a jejich popis je dán výběrem 2 z předchozích 3 rovnic. Průnik všech tří osových rovin je jediný bod S = (1, 2,-1). Ten je středem kvadriky. Parametrické vyjádření os je potom následující: 01: (l,2,-l)+í(0,l,0) o2: (1,2,-1) +t(l,0,l) o3: (1,2,-1) +t(l,0,-l) Z parametrického vyjádření osy o\ dosadíme do rovnice kvadriky a pro parametr t dostaneme kvadratickou rovnici t2 — 1 =0. Vrcholy na ose t± jsou tedy A = (1, 3, — 1) a B = (1,1, — 1). Z parametrického vyjádření osy 02 dostaneme kvadratickou rovnici 2í2 + l = 0. Na 02 tedy k.1 ~l~ ^2^1 2, -l + #), E: (1 &i 2 2 ') ^1 -1-4) leží dva komplexně sdružené vrcholy E Konečně pro osu 03 dostaneme opět rovnici t2 a D = (0,2,0). Z popisu os a reálných vrcholů vyplývá, že daná kvadrika je jednodílný hyperboloid. V bázi 1 = 0, která dává vrcholy C = (2, 2, —2) S, vi platí ^(1,0, -1), V2 U3 budeme mít souřadnice y\, 1/2> Vs, Pro které 40 4. Metrická klasifíkace nadkvadrik Tedy v homogenních souřadnicích xi w Tedy rovnice kvadriky v souřadnicích y je /l 0 o o\ 1 2 v-1 -±- 0 0 0 1 1 1 n V2 V2 u/ /ž/o\ íyo\ = p ž/i ž/2 ž/2 Via/ W yPTAPy = 0, kde A f-16 2 8 -2\ 2 1 0 3 8 0-4 0 V "2 3 0 1 / PTAP í4 0 0 o\ 0 -2 0 0 0 0 4 0 Vo 0 0 -V Rovnice v nových souřadnicích je -2^+4^-4^ + 4 = 0. Kontrolní otázky 1. Podejte definici hlavních směrů a vysvětlete, kterou větu použijete k jejich výpočtu. 2. Jak se liší hlavní čísla regulárních kvadrik? 3. Kolik osových (hlavních) rovin mají jednotlivé kvadriky? (Použijte jejich metrickou klasifikaci.) 4. Napište kanonické rovnice kvadrik s 1, 2, 4, 6 a nekonečně mnoha reálnými vrcholy. 5. Zvolte si nějakou kvadriku a popište všechny její symetrie. Příklady k procvičení 1. Určete hlavní čísla a hlavní směry nadkvadriky, její střed a její kanonickou rovnici v příslušné ortonormální bázi. (a) 3xf + 10xix2 + 3x^ - 2xx - 14x2 13 [Řešení: Ai 8, A2 -2, Ul = ( i i v/2' v/2 0 V &2 ), u2 = 'v/2' ^), S = [2;-l], hyperbola *?-^ = l] (b) 7x\ + 6xix2 - x\ + 28xi + 12x2 + 28 = 0 v £■ [Řešení: Ai = 8, A2 = různoběžky x\ — ^ = 0] 2' Ul = (^o'Ä}' U2 Tu' 10 ; -2;0], 41 4. Metrická klasifíkace nadkvadrik (c) 9x1 + 12xiX2 + 4xj ~ 24xi ~ 16x2 + 3 = O v £2 [Řešení: Ax = 13, A2 = O, Ul = (7=5,7=), u2 = (-^-, --^-), S* = [2í; 3 - 2í], rovnoběžky x^ = 1] (d) x\ + x\ + 5x| — 6x1X2 — 2x1X3 + 2x2X3 — 6x1 + 6x2 — 6x3 + 9 = 0 v £3 [Řešení: Ax = 3, A2 = 6, A3 = -2, ux = (-1=, - J=, J=), u2 = (-^,^,^), 2 2 u3 = (75, 75, 0), S = [1; —1; 1], reálná kuželová plocha + X2 — ^ =0] (e) 5xf + 8x2 + 5x| + 4xix2 - 8x1x3 + 4x2x3 - 27 = 0 v £3 [Řešení: Ai,2 = 9, A3 = 0, Ul = (7=, 0, -^), n2 = (^, 575), n3 = (-§, §, -§), S* = [0; 0; 0], reálná eliptická válcová plocha + = 1] (f) xf - 2x2 + x3 + 4xiX2 - 8x1x3 - 4x2x3 - 14xi - 4X2 + 14x3 + 16 = 0 v £3 [Řešení: Ai,2 = -3, A3 = 6, Ul = (-±=,--|,0), u2 = (^=, ^, ^), n3 = 2 2 (|, |, — |), S = [1; 1; —1], reálná kuželová plocha ^ + ^ — x| = 0.] (g) 2x^ + 5x2 + 2x\ — 2x\x2 — 4x1X3 + 2x2X3 + 2xi — 10x2 — 2x3 — 1 = 0 v £3 [Řešení: Ax = 6, A2 = 3, A3 = 0, m = (J=,- J=), u2 = 2 u3 = (75, 0, 75)) S = [í; 2; í], reálná eliptická válcová plocha x\ + ^ = 1.] (h) x\ + x\ - 2xix2 + 2xi + 2x2 - 2^2^:3 - 8 = 0 v £3 [Řešení: Ax = 2, A2,3 = 0, Ul = (j=,-^=,0), u2 = (7575,0), u3 = (0,0,1), nestředová, parabolická válcová plocha x\ + 2x3 = 0.] 2. Určete osové nadroviny a vrcholy nadkvadrik z příkladu (1). [Řešení: (a) Osy 01: xi + x2 = 1, o2: x\ - x2 = 3, vrcholy Vi,2 = [2 ± 75; -1 T 75] příslušné k 01, F3i4 = [2 ± ^; -1 ± příslušné k o2; (b) Osy xi + x2 = -6, xi - 3x2 = -2, vrcholy V\ = [-§, -|] k 01, V2 = [-2; 0] k o2; (c) Osa 3xi + 2x2 = 4, nevlastní vrchol určený zaměřením osy (-2,3,0); (d) Osové roviny a\: x\ — x2 + x3 = 3, o2: x\ — x2 — 2x3 = 0, 03: xi + X2 = 0, 6 os zadaných průniky vždy dvou rovin, vrchol V = [1; — 1; 1]; (e) Osové roviny 2xi — X2 — 2x3 = p pro Vp G M, dále všechny roviny obsahující osu o: xi + 2x2 = 0,4xi — 2x2 — 5x3 = 0, další osy jsou přímky na tuto osu kolmé, vrcholy jsou všechny body kvadriky; (f) Osové roviny a: 2x\ + x2 — 2x3 = 5, dále všechny roviny procházející osou o: xi — X2 = —3,4xi + 2x2 + 5x3 = 1, vrchol V = [1; —1; 1]; (g) Osové roviny o\: xi — 2x2 — x3 = —2, a2: x\ + x2 — x3 = 1, osa daná průnikem rovin a nevlastní vrchol určený jejím zaměřením (1,0,1,0); (h) Osová rovina xi = X2.] 42 5. Mooreova—Penroseova pseudoinverze 5.1. Pseudoinverze Nechť p: U —> V je lineární zobrazení mezi Eukleidovskými prostory. Zabývejme se otázkou, zda existuje inverzní zobrazení a v případě, že neexistuje, otázkou, jak blízko se k inverzi můžeme přiblížit. Nechť tedy ip:V^-U]e libovolné zobrazení a zkoumejme složení ipp a píp. Zřejmě je ipp = 0 na ker p a nejlepší, co můžeme očekávat, je, že bude toto složení rovno identitě na nějakém doplňku ker U se nazývá Mooreova-Penroseova pseudoinverze lineárního zobrazení p: U —> V, jestliže • ipíp = id na (keip)^ a • iptp = id na (keiip)^. Protože na ~keip je vždy ipp = 0, je první podmínka ekvivalentní tomu, že ipp je kolmá projekce na (keip)^. Lemma 5.2. Pro Mooreovu-Penroseovu pseudoinverzi platíimp = (keiip)^. Důkaz. Podle druhé podmínky z definice platí (ker xp)1- C im p, ukážeme nyní opačnou inkluzi. Prvně si uvědomme, že platí pipp = p - na ker (ker p)^ značí, že je nulové na komplementu (ivup)^ a jeho komponenta v ker im p existuje jediná, dostáváme jednoduše následující tvrzení. Tvrzení 5.3. Nechť p: U —> V je lineární zobrazení mezi Eukleidovskými prostory (konečné dimenze). Potom Mooreova-Penroseova pseudoinverze existuje a je jediná. Značíme ji p+. □ 43 5. Mooreova-Penroseova pseudoinverze Tradičně se Mooreova-Penroseova pseudoinverze definuje pomocí singulárního rozkladu (singulár value decomposition). Tento přístup je výhodný i z dalších důvodů. Uvažujme proto adjungované zobrazení tp* : V —> U. Lemma 5.4. Zobrazení p*p je samoadjungované a platí (p*p(u),u) > 0 (říkáme, že ip*ip je pozitivně semidefinitní). Navíc kei(p*p) = ker p. Důkaz. Z definice adjungovaného zobrazení platí (p*p{u),v) = (p(u),p(v)) = (u,p*p(v)) a navíc prostřední člen je pro u = v nezáporný. Inkluze ker( 0 Zkonstruujme nyní vhodnou ortonormální bázi V, vzhledem k níž bude mít p co nejjednodušší tvar. Prvně se zabývejme obrazem p, který je generován p(ui),..., p{ur): (p(ui),p(uj)) = (p*p(ui),Uj) = \i(ui,Uj) = XiSij. Jsou tedy vektory p{ui) navzájem kolmé o velikostech W{uí)\ = \/Xí = Si. Tato čísla nazýváme singulární hodnoty zobrazení p. Položíme Vi = j- matici ís1 0 ...... 0\ 0 '•• '•• : (+ = má ip*ip na diagonále pouze čísla s2. Proto (ip*^)^1 existuje a má na diagonále čísla s^2 a tím pádem pravá strana má na diagonále prvky s^1. Týž diagonální tvar levé strany jsme odvodili před tvrzením. Podobná analýza funguje v případě surjektivního tp. □ cv Poznámka. Je-li U = V © W, má každý vektor u G U jednoznačné vyjádření u = v + w, kde v G V a w G W. Označme v = p{u) a dostáváme tak lineární zobrazení p: U —> U (s hodnotami ve V), kterému říkáme projekce na V ve směru W. Uveďme nyní ještě dvě alternativní charakterizace. Lineární zobrazení p: U —> U je projekce na V ve směru W, právě když p\y = id a p\\y = 0. Lineární zobrazení p: U —> U je projekce, právě když pop = p; v takovém případě se jedná o projekci na imp ve směru kerp. Ukažte, že projekce je samoadjungovaná, právě když je kolmá6. Věta 5.6. Platí 1. ipip+p> = p> 2. , tj. ip = ip+. Důkaz. Je jednoduché ověřit vztahy z tvrzení pro Mooreovu-Penroseovu pseudoinverzi; vlastnosti (3) a (4) platí proto, že příslušné kompozice jsou kolmé projekce na podprostory im p> a (ker p)^. V tomto i opačném směru je podstatné si uvědomit, že projekce je samoadjungovaná, právě když je kolmá. Podle (1) a (3) je p+p samoadjungovaná projekce (neboť (p+p)2 = p+p) ve směru kei(p+p) = ker p (neboť ~keip C kei(p+p) C ~kei(pp+p) = ~keip), nutně tedy kolmá. Proto je jejím obrazem (ker p)^ a p>+ tedy splňuje první definiční vztah. Druhý se dokáže symetricky. Téměř v jakékoliv knize pojednávající o Mooreově-Penroseově pseudoinverzi lze najít alternativní důkaz hrubou silou. □ 5.2. Aproximace řešení soustavy lineárních rovnic Zabývejme se soustavou lineárních rovnic Ax = v. Pokud je matice A čtvercová a invertibilní, lze formálně tuto soustavu vyřešit vynásobením inverzí A^1, x = A~1Ax = A~1v. V případě, že A nemá inverzi nebo dokonce není ani čtvercová, lze stále něco říct o řešeních pomocí Mooreovy-Penroseovy pseudoinverze. Tvrzení 5.7. Soustava Ax = v má řešení, právě když AA+v=v Důkaz. Pokud platí AA+v = v, pak zřejmě A+v je řešením. Naopak, pokud Ax = v pro nějaké x, potom AA+v = AA+ Ax = Ax = v. Jiný důkaz spočívá v tom, že AA+ je projekce na imi, a proto rovnost AA+v = v je ekvivalentní tomu, že v G im A, což je zřejmě to samé, že soustava má řešení. □ Vidíme tedy, že i v případě, že A nemá inverzi, nebo dokonce není ani čtvercová, můžeme nějaké její řešení (v případě, že existuje) najít jako A+v. V následujícím ukážeme, jaký geometrický význam toto řešení má. Obecněji se budeme zabývat otázkou geometrického významu A+v i v případě, kdy soustava Ax = v nemá řešení. Řekneme, že x je nejlepší aproximace řešení, jestliže minimalizuje výraz |Ac — v\, tj. pokud pro libovolné y platí \Ax — v\ < \Ay — v\ Zřejmě je tedy Ax bod imi, který je nejblíž v, je to tedy kolmá projekce vektoru v do podprostoru imA Tu umíme podle předchozího napsat pomocí pseudoinverze jako AA+v. Platí tedy Lemma 5.8. Vektor x je nejlepší aproximací řešení soustavy Ax = v, právě když platí Ax = AA+v. 46 5. Mooreova-Penroseova pseudoinverze Zejména tedy A+v je nejlepší aproximace řešení. Obecně je takových nejlepších aproximací víc. Mezi nimi lze A+v charakterizovat pomocí následující věty Věta 5.9. Vektor A+v je nejlepší aproximace řešení soustavy Ax = v s nejmenší normou, „zkráceně" nejmenší nejlepší aproximace řešení. Důkaz. Množina nejlepších aproximací je právě množinou řešení soustavy Ax = AA+v a jedná se tedy o afinní podprostor se zaměřením ker A. Vektor z tohoto afinního podprostoru s nejmenší normou je tedy jediný a to právě ten, který je kolmý na zaměření ker A. Přitom ale A+v G im A+ = (ker A)L. □ Příklad (Aproximace přímkou). Nechť jsou v rovině dány body (x±,yi),..., (xn, yn). Úkolem je vést těmito body přímku. Pokud by to bylo možné přesně, existovaly by a, b (koeficienty v rovnici přímky a + bx = y) takové, že a ■ 1 + b ■ x\ = y± a ■ 1 + b ■ xn = yn Naším úkolem je tedy vyřešit soustavu (vzhledem k neznámým a, b) s rozšířenou maticí \ 1 x n yn J Její nejmenší nejlepší aproximace řešení je (a,b) t \1 xn) XUn) Přímka s rovnicí y = a + bx se nazývá aproximací přímkou zadané n-tice bodů. Je potřeba však vysvětlit, v jakém smyslu je to nejoptimálnější odpověď na naší otázku proložení přímky zadanými body. Tato přímka minimalizuje ^ ((a + bxi Vi) , i=l tedy součet čtverců odchylek funkčních hodnot a + bx^ od zadaných í/j. Tato aproximace se používá, pokud víme, že zadané hodnoty yi můžou být zatíženy chybou, ale X{ jsou naměřeny přesně. 47 5. Mooreova-Penroseova pseudoinverze 5.3. Kolmá projekce do podprostoru Nechť V = [vi,... ,Vk] C U je podprostor. Kolmá projekce vektoru u do F je takový vektor P{u) = x\V\ + • • • + XkVk, který je nejblíž k u. Jedná se tedy o nejlepší aproximaci řešení soustavy x±vi + • • • + xkvk = u. Označíme-li A = (v± • • • v^) matici na levé straně, dostáváme z předchozího formulku (x\ • • • Xk)T = A+u a tedy P(u) = («!••• vk)(x! • • • xk)T = AA+v. Předpokládáme-li nyní, že vektory v±,... ,vk jsou lineárně nezávislé, je A maticí injektivního zobrazení a dostáváme tak formulku P = A(A*A)-1A*. V případě, že byl systém vektorů dokonce ortonormální, je matice uprostřed jednotková a tedy P = AA*. 48 6. Multilineární algebra V celé této kapitole budeme pracovat s vektorovými prostory nad pevným tělesem K. 6.1. Báze a souřadnice Prvně připomeňme důležité vlastnosti bází a souřadnic. Lineární zobrazení a: Kn —> U je jednoznačně určené obrazy U{ = a(ej) a lze jej tedy chápat jako n-tici vektorů (u±,... ,un). Přitom se jedná o bázi, tj. a posílá bázi na bázi, právě když je a izomorfismus. Inverzní zobrazení p> = aT1: U —> Kn pak posílá každý vektor u na jeho souřadnice (u)a a budeme mu tedy říkat souřadnicové zobrazení (nebo prostě souřadnice na U). Lemma 6.1. Vektory ui,...,un tvoří bázi U, právě když se každé zobrazení {u{\ —> V jednoznačně rozšiřuje na lineární zobrazení U —> V. Poznámka. V řeči univerzální algebry to znamená, že báze vektorového prostoru je koncept totožný s volnou algebrou. Následující důkaz je vhodné v tomto směru chápat. Důkaz. To, že báze má vlastnost z tvrzení, známe z dřívějška. Nechť tedy naopak u±,... ,un mají vlastnost z trvzení. Zejména tedy existuje zobrazení p: U —» Kn, posílající uí i—> ej. Ze stejné vlastnosti standardní báze dostáváme zobrazení a: Kn —> U posílající i—> U{. Protože složené zobrazení ap posílá uí i—> uí, stejně jako identické zobrazení, plyne z jednoznačnosti rozšíření ap = id a symetricky také tpa = id; tím pádem je a skutečně báze. □ 6.2. Faktorový prostor Nechť U je vektorový prostor, V jeho podprostor. Tento podprostor definuje na U ekvivalenci u\ ~ U2 právě tehdy, když u\ — u2 G V. Třídu ekvivalence obsahující vektor u budeme značit [u]. Je to množina [u] = u + V = {u + v | v G V}. Množinu všech tříd ekvivalence označujeme U /V. Jakožto kvocient komutativní grupy podle její podgrupy je to opět komutativní grupa, navíc můžeme na této množině definovat násobení skalárem z K takto: [u] + [v] = [u + v] k[u] = [ku] Tyto operace jsou nezávislé na výběru reprezentantů a není obtížné se přesvědčit, že z UjV vytvářejí vektorový prostor nad K. Je-li W komplementární podprostor k V, tj. U = W © V, pak projekce U —> U/V se zužuje na izomorfismus W —?► U /V: ke každému u + V G U /V hledejme vzor w G W tak, že u + V = w + V, tj. u = w + v pro nějaký vektor v G V; podle definice přímého součtu lze toto jediným způsobem. Je-li U konečněrozměrný prostor, pak dim U /V = dim U — dim V. Důkaz je jednoduchý: Zvolme bázi v±, ..., Vk prostoru V a doplňme ji na bázi v±, ..., Vk, Vk+i, ..., vn prostoru U. Stačí ukázat, že [vfc+i], ..., [vn] je báze prostoru U /V. 49 6. Multilineární algebra Cvičení. Dokažte předchozí tvrzení. Označme p: U —> UjV surjektivní lineární zobrazení definované předpisem p(u) = [u]. Toto zobrazení se nazývá projekce. Nechť tp: U —> W je lineární zobrazení a nechť V C ~keip. Potom existuje právě jedno lineární zobrazení Tp: U jV —> W takové, že ip =Tpop, tedy že následující diagram komutuje U— U/V p> musí být definováno předpisem Tp([u]) = (p{u). Díky tomu, že pro v G V je (p{v) = 0, je pro u\ ~ u2 (p{ui) = W je lineární zobrazení. Pak známá věta z algebry říká U/ ker tp = im tp, což pro dimenze znamená dim U — dim ker tp = dim im tp (známe z dřívějška). 6.3. Prostory lineárních a multilineárních zobrazení Lineární zobrazení z vektorového prostoru U do vektorového prostoru V vytvářejí vektorový prostor, který budeme označovat Bom(U,V). Důvodem pro toto označení je skutečnost, že lineární zobrazení se často nazývají homomor-fismy vektorových prostorů. Nechť Ui, ..., Uq, V jsou vektorové prostory. Zobrazení tp: Ui x • • • x Uq —> V se nazývá multilineární (nebo g-lineární), jestliže je lineární v každé své složce, tj. ip{lli, ...,CLUi+ bVi, ...,Un)= CLp){ui, ...,uq)= onp{ui, ...,un)+ top{ui,.. .,uq). Speciálně platí Lini(f/;F) =Hom(U,V). 50 6. Multilineární algebra Příklad. Na M3 uvažujme lineární zobrazení /, g: M3 —> M zadaná předpisem f(x1,x2,x3)=x3, 5(2/1,2/2,2/3) = 2/1- Ukážeme, že zobrazení fK3xl3^t, M). Tedy «Ěl3, u=\x2\, nG(M3)*, r] = (y1,y2,y3). ,x3 Vyčíslení formy rj na vektoru u je potom maticové násobení a x 3 v(u) = (2/1,2/2,2/3) [ x2 \ = yix1 +y2x2 +y3x3 j3 Nechť a = (u±,... ,un) je báze W1. Matice přechodu od a ke standardní bázi e = (ei,... ,en) je (id)£)Q, = A {ui, ■ ■ ■, un) = (ei,..., en)(id)£)a. Duální báze k (ei,..., en) }e f1 = (1, 0,..., 0), ..., fn = (0,..., 0,1) a duální báze (rj1,..., nn) k (ui,..., un) je určena řádky matice A^1, neboť musí platit : • (ui, ...,un) = (rfiuj)) = (oj) = E. \vn) Důsledek 6.3 (o druhém duálu). Nechť U je vektorový prostor konečné dimenze. Pro vektor u £ U efinujme lineární formu evu G (U*)* na duálním prostoru U* pomocí předpisu evu(r]) = i](u). Potom vzniklé zobrazeníev: U —> (U*)* je lineární izomorfismus. Důkaz. Podle předchozí věty k bázi (ei, ..., en) prostoru U lze najít duální bázi (f1, ..., fn) prostoru U*. Ukážeme, že (evei, ..., even ) tvoří duální bázi k (f1, ..., fn). Platí totiž evc,(/.) = /-(,,) = (i w°':3: I (J pro 1 7^ j Protože je zjevně ev lineární a převádí bázi na bázi, jedná se o izomorfismus. □ 52 6. Multilineární algebra * Poznámka. Zabývejme se nyní krátce tím, co se stane pro U nekonečné dimenze. Jak jsme viděli, formy f1 jsou bází jistého podprostoru U* a eveí jsou k nim opět duální, takže jsou lineárně nezávislé. Zobrazení ev je tedy injektivní a U je izomorfní podprostoru U daného právě prvky tvaru evu. Od tohoto okamžiku budeme považovat prostory U a ([/*)* za totožné. Zobrazení ( —, —): U* x U —> K definované (r],u) = r){u) je bilineární a někdy se nazývá dualita nebo párování. Pomocí duality se dají vyjádřit podmínky pro duální bázi jako (/■J,ej) = 5\ a pro souřadnice platí symetrické vztahy (/■',«) = v?, (r],e,i) = r]i. 6.5. Duální lineární zobrazení Nechť tp: U —> V je lineární zobrazení. Zobrazení tp*: V* —> U* definované pro 9 £ V* předpisem p*{9) = 9 o p, tj. p*(9)(u)=9{p(u)) se nazývá duální lineární zobrazení k zobrazení p. Poznámka. Pomocí dualit ( —, — )jj : U* x U —> K a (—, —)y: F* x V —> K lze definici psát (^(ř?),n)l/=(ř?,^))y, což formálně připomíná definici adjungovaného zobrazení, kde skalární součiny jsou nahrazeny dualitami. Výhodou tohoto zápisu je jeho symetrie a lepší přehlednost. Podobnost s definicí adjungovaného zobrazení není náhodná. Je-li totiž U reálný Eukleidovský vektorový prostor, je zobrazení R:U^U*, u^(u,-} izomorfismus - prostory mají stejnou dimenzi a injektivita plyne z toho, že (u, —} = 0 znamená zejména \u\2 = (u,u) = 0, tj. u = 0. Při této identifikaci R pak dualita vypadá (Ru,v) = ((u, -),v) = (u,v), tj. dualita je přesně skalární součin. Pro komplexní skalární součin je R izomorfismus U = U* a situace je o něco komplikovanější. Příklad. Nechť tp: U —> U je zobrazení p{u) = 3u. Vypočtěte p*: U* —> U* z definice. Platí ^p*{9)yu) = 0{ip{u)) = 9{3u) = 39{u). Tedy *(0) = 39. Zabývejme se nyní souřadnicovým zápisem duálního zobrazení. Připomeňme, že vektory zapisujeme do sloupce, zatímco lineární formy do řádku a dualita je násobení matic. Definice duálního zobrazení íp*{rj) = r]p> pak v souřadnicích dává (ip*(r]))a = (i])p((p)pa a je tedy dáno násobením maticí {ip)pa zprava. 53 6. Multilineární algebra 6.6. Dualita a podprostory Nechť U C V je vektorový podprostor a uvažujme vložení a k němu duální surjektivní zobrazení t*: V* -» U*, které je zřejmě dáno předpisem rj i—> r}\jj. Definujme U± = ker 6* = {77 G V* | Vtí G [/: (77, u) = 0}, kde podmínku (77, tí) = 0 si lze představovat jako „77 _L U neboli r] G Č7^"; proto také tento podprostor duálního prostoru značíme tímto symbolem. Přiřazení U 1—> zadává zobrazení -Dy: {podprostory V} —> {podprostory V*}, které zjevně obrací uspořádání, tj. pokud Uq C ř7i, pak U$ Č7-J1. Navíc, pokud U má dimenzi d, pak má dimenzi n — d (také říkáme, že má kodimenzi d); to je proto, že je jádrem surjektivního zobrazení V* -» U* z n-rozměrného do d-rozměrného prostoru. Naším dalším krokem bude ukázat, že zobrazení Dy je bijekce (a tedy antiizomorfismus uspořádaných množin - ve skutečnosti svazů). Zabývejme se proto tím, co se stane při druhé aplikaci „kolmého doplňku". Geometrická intuice z Eukleidovských prostorů říká, že druhý kolmý doplněk musí nutně obsahovat původní prostor a ve skutečnosti se musí rovnat, protože mají stejné dimenze. Stejný argument funguje i obecně, (U^ = {v G V I Ví? G UL : (v, v) = 0}, Protože se však všechny formy z podle definice nulují na U, platí U C (ř7~L)~L. Zároveň mají oba prostory stejnou dimenzi, musí být tedy totožné, (ř7_L)-L = U. Věta 6.4. Přiřazení U 1—> určuje bijektivní zobrazení Dy. {podprostory V} —> {podprostory V*}, U 1—> s následujícími vlastnostmi • Dy převrací uspořádání, • je-li U dimenze d, pak je dimenze n — d, • ([/oílí/1)1 = u^ + ut, □ Poznámka. Vše je důsledkem prvního bodu, dokonce i vztah mezi dimenzemi. Můžeme totiž vyčíst dimenzi U jako délku d nejdelšího striktně rostoucího řetězce podprostorů 0 = U~o C u1c...cud = u. 54 6. Multilineární algebra Pěknou aplikací je popsání svazku všech rovin v prostoru procházejících danou přímkou p. Přechodem ke kolmým doplňkům to znamená popsat všechny přímky obsažené v rovině p^. To je ale jednoduché - jejich směrové vektory jsou právě všechny nenulové prvky p^. Pokud je p zadaná implicitně jako řešení soustavy a (v) = (3(v) = 0 dvou rovnic, je p^ = [a, (3] a přímka ležící v p^ je proto generovaná libovolnou jejich nenulovou lineární kombinací aa + 6/3. Přechodem zpátky vidíme, že rovnice odpovídající roviny obsahující p je {aa + b/3)(v) = 0, ve výsledku tedy libovolná nenulová lineární kombinace definujících rovin přímky p. Zabývejme se dále vztahem mezi podprostory zadanými implicitním a parametrickým popisem. Nechť je podprostor W C V* zadán parametricky jako W = [rj1,... ,i]k]. Potom W± = {v G V | V?? G W: (r),v) = 0} = {v G V | (q1, v) = ■■■ = (r]k,v) = 0}. To je ale popis jako prostoru řešení soustavy lineárních rovnic ^(v) = 0,... ,i]k(v) = 0, tedy implicitní popis. Stejný princip funguje naopak. Je-li U = [v±,..., Vd], pak U± = {V€V*\ (v,v1)=--- = (r,,vd)=0.} Formálně tak převod parametrického popisu na implicitní je elementární. Parametrický popis U je ekvivalentní implicitnímu popisu U^, ten lze pomocí vyřešení soustavy s parametry převést na parametrický popis, který je zpětně ekvivalentní implicitnímu popisu U. Tvrzení 6.5. Nechi jsou na V zadány formy r]°,r)1,..., r)k. Jestliže libovolné v G V splňující rfiv) = • • • = nk{v) = 0 splňuje zároveň rf{v) = 0, pak rf G [i]1,..., r)k]. Poznámka. Opačná implikace je triviální: je-li rf G [i]1,... ,r)k], pak z ^(v) = ■ ■ - r)k(v) = 0 plyne jednoduše rp{v) = 0. V případě implikace (^(v) = • • • = r)k(v) = 0) (t]°(v) = 0) můžeme mluvit o tom, že rovnice rp{v) = 0 je logickým důsledkem zmíněné soustavy. Věta tedy říká, že pokud je rf{v) = 0 logickým důsledkem, je ve skutečnosti „algebraickým" důsledkem; lze odvodit ze soustavy tím nej triviálnějším možným způsobem - je kombinací rovnic soustavy. V jistém smyslu se jedná o úplnost jistého logického systému: implikace, které platí, jsou právě ty, které lze dokázat (pomocí zmíněného jednoduchého pravidla). Důkaz. Implikaci lze vyjádřit jako [r]°,r]1,...,r]Y = [r]\...,r]Y. Druhou aplikací Dy dostáváme [rj°, rj1,..., r)k] = [rj1,..., r)k] a zejména rf G [i]1,..., rjk]. □ Následující tvrzení je dobře známe z teorie řešení soustavy lineárních rovnic a lze jej vyvodit z Gaussovy eliminační metody. Uvádíme zde alternativní důkaz pomocí duality. Tvrzení 6.6. Soustava rovnic Ax + b = 0 nemá řešení, právě když existuje lineární kombinace jejích řádků (tedy rovnic) tvaru 1 = 0. Důkaz. Trik spočívá v „projektivizaci" soustavy. Původní soustava nemá řešení, právě když každé řešení soustavy Ax + bt = 0 splňuje také t = 0. Podle předchozího tvrzení to nastane právě tehdy, když forma zadaná řádkem (0,..., 0,1), tj. (0 | 1) je lineární kombinací řádků rozšířené matice (A \ b). □ 55 6. Multilineární algebra 6.7. Prostory multilineárních forem Zabývejme se nyní multilineárními formami. Pro jednoduchost zápisu se omezíme pouze na případ Lin2(č7, V;K). Nechť rj G U*, 9 G V* jsou lineární formy. Definujme bilineární formu 0Qr]:UxV^K, (9 0 rj)(u, v) = n(u) ■ 6 (v) (součin funkčních hodnot - prvků tělesa K); všimněte si, že argumenty se dosazují do lineárních forem v opačném pořadí než je pořadí jejich zápisu - toto bude naše konvence, která není úplně běžná. Poznámka. Při práci s bilineárními formami a později s tenzorovým součinem je výhodnější se vzdát uspořádání prvků báze a pracovat s neuspořádanými bázemi. V dalším budeme zkracovat na „{e^} je báze Č7". Lemma 6.7. Nechť {e{\ je báze U, {ej} báze V* s příslušnými duálními bázemi {f1} a {f1}. Potom množina {f1 0 f1 \ i = 1,..., n; j = 1,..., m} tvoří bázi Lin2(č7, V; K). Důkaz. Pointou důkazu je, že dvě bilineární formy se rovnají, právě když dávají stejné hodnoty na všech dvojicích (ei,ej) bázových vektorů (to by mělo být čtenáři známo, případně by to měl zvládnout dokázat sám). Pokusme se napsat bilineární formu <í> jako kombinaci r,s Tato rovnost bude podle předchozího splněna, právě když pro každé i, j bude platit r,s r,s §r §a 1 J Je tedy vidět, že koeficienty existují a to jediné: <&íj = <ř(ej,ej). To ale přesně znamená, že daná množina je báze. □ Poznámka. Předchozí důkaz je analogií vztahu rji = f]{ei) pro souřadnice formy - souřadnice bilineární formy jsou také dány hodnotami na prvcích báze, <&íj = <ř(ej, ej). 56 7. Tenzorový součin 7.1. Tenzorový součin vektorových prostorů Pointa tenzorového součinu je, že chceme převést bilineární zobrazení na lineární. Konkrétně bilineární zobrazení U x V —» W bude ekvivalentní lineárnímu zobrazení U (8> V —> W. Symbolicky Lm2(U, V; W) ^ Hom([/ © V, W), kde však říkáme víc než v předchozím - vyžadujeme, aby se jednalo o izomorfismus vektorových prostorů (a ne jen o bijekci). Tímto vztahem je tenzorový součin určen jednoznačně až na izomorfismus a ve většině aplikací není potřeba znát přesnou definici a vystačíme si s touto vlastností. Pokusme se s její pomocí „odvodit" definici tenzorového součinu. Dosaďme do uvedeného vztahu W = K. Dostáváme Lm2(U,V;K) = {U®V)*. Budeme-li nyní předpokládat, že má U (8> V konečnou dimenzi, lze psát U ®V ^Lin2([/,F;K)* Chceme-li tedy dostát tomu, že tenzorový součin převádí bilineární zobrazení na lineární, jsme vedeni k následujícímu: Definice 7.1. Nechť U & V jsou vektorové prostory konečné dimenze. Definujeme jejich tenzorový součin U (g> V á= Lin2(č7, V; K)*. Prvek tenzorového součinu t G U (8> V nazýváme tenzor. (V analogii k předchozímu výkladu pro lineární formy jde o verzi „druhého duálu" pro více činitelů.) Definujme nyní bilineární zobrazení t: U x V —> U ®V předpisem t(u,v): 3> 1-4- $(u,v), jedná se tedy o „evaluaci" (viz srovnání druhého duálu s původním vektorovým prostorem). V následujícím budeme značit u (g> v = t(u, v) a je to tedy zobrazení, které každou bilineární formu posílá na její hodnotu na dvojici (u,v). Lemma 7.2. Zobrazení t je bilineární, tj. (aiui + 02^2) <8> v = ai ■ ui (g> v + a2 ■ u2 (g> v a analogicky pro druhou složku. Důkaz. Levá strana je dána evaluací <í> 1-4- <í>(ai«i + a2u2,v), zatímco pravá je dána jako lineární kombinace evaluací, tedy <í> 1-4- ai$>(ui,v) + a2Q(u2, v). Tyto dva výrazy se rovnají díky bilinearitě <í>. □ 57 7. Tenzorový součin Tenzory tvaru u U ®V dané (u, v) i—> u 0 v. Věta 7.4 (Univerzální vlastnost tenzorového součinu). Nechi; F: U x V —^ W je bilineární zobrazení. Potom existuje právě jedno lineární zobrazení tp: U 0 V —> W takové, že p{u ®w) = F(u, v), tj. takové, že následující diagram komutuje U x V—^W t / Důkaz. Jsme nuceni položit p{ei 0 ej) = F(ei,ej). Jelikož takové tenzorové součiny tvoří bázi, je tímto p díky linearitě jednoznačně určeno. Zbývá ukázat, že podmínka opravdu platí. Přitom jsou ale obě F,ipot bilineární zobrazení U x V —> W. Podle předchozího se shodují na dvojicích bázových vektorů a musí tedy být stejné. □ * Důsledek 7.5. Existuje přirozený izomorfismus Hom([/ 0 V, W) -=-► Lin2([/, V; W), daný p> i—> p> o t. Následující tvrzení říká, že tenzorový součin je svou univerzální vlastností určen až na izomorfismus jednoznačně. 58 7. Tenzorový součin * Věta 7.6 (o jednoznačnosti tenzorového součinu). Nechť S je vektorový prostor a nechť s: Ui x • • • x Un —> S je n-lineární zobrazení, které má stejnou vlastnost jako zobrazení t: Ui x • • • x Un —» Č7i g> • • • ®Un z předchozí věty. Potom existuje právě jeden izomorfismus o: ř/i g> • • • g> Č7n —> S ak němu inverzní r: S —?► Č7i g> • • • g> Č7n tak, že komutuje diagram Ui x • • • x U, Důkaz. Provedeme pouze náznak. Existence lineárního zobrazení o plyne z univerzální vlastnosti t, existence lineárního zobrazení r plyne z univerzální vlastnosti zobrazení s. Identity r o a = id, o o r = id se dokáží dalším použitím předchozí věty (především jejího tvrzením o jednoznačnosti). □ Poznámka. Existují i jiné definice tenzorového součinu vektorových prostorů než je ta, kterou jsme použili. Podle předchozího tvrzení lze však vždy ukázat, že jsou na prostorech konečné dimenze ekvivalentní s naší definicí. Jedna z možností, která funguje i pro U, V nekonečné dimenze, je U®V = T/T0, kde T je vektorový prostor všech formálních lineárních kombinací dvojic (u,v) £ U x V (pro K nekonečné a U, V netriviální nemá T konečnou dimenzi!), tj. T je volný vektorový prostor na množině U x V, a Tq je jeho podprostor generovaný prvky [au\ + bu2, v) — a(ui,v) — b(u2,v) (u, av± + bv2) — a(u, v±) — b(u, V2) Zobrazení t: U x V —> T/Tq je t(u,v) = [(u,v)]. 7.3. Asociativita a komutativita tenzorového součinu Uvažujme zobrazení U± x U2 x U3 —> (U± (g> U2) <8> U3, (111,112,113) i-> [u\ (g> 112) ® 113. To je zřejmě lineární v každé složce (protože tenzorový součin vektorů je lineární v každé složce) a díky univerzální vlastnosti tenzorového součinu tak existuje jediné lineární zobrazení a: U1 (Č7i 0 U2) ® U3, ui (ui (g) u2) (g> najedná se o izomorfismus, protože posílá bázi na bázi. Obdobně pro každou permutaci o množiny {1,..., n} existuje právě jeden lineární izomorfismus Pa ■ Ui ® ■ ■ ■ ® Un -> ř7CT(i) ® ■ ■ ■ ® ř7CT(n), Ui <%>■■■<%> Un i-> Ua(i} (g) • • • (g) Uff(n). Jednotkou pro tenzorový součin je těleso K, tj. platí K (g U = U. Tento izomorfismus je předepsán g> u4 ku (skalární násobení v U). 59 7. Tenzorový součin 7.4. Tenzorový součin lineárních zobrazení Nechť ifi'. U i —> Ví jsou lineární zobrazení. Potom zobrazení Ui x • • • x Un —> V\ (g> • • • (g> Vn, definované předpisem (u±,... ,un) i—> • • • (g> • • • (g> ř7n Vi (g> • • • (g> Fn takové, že (g> • • • (g> n(«l (8> • • • (8> U«) = ^l(^l) ® • • • <8> n(«n)- Zobrazení • • • <8> n nazýváme tenzorovým součinem lineárních zobrazení tpi,..., ipn. 7.5. Tenzorový součin a dualita Tvrzení 7.7. Nechť U a V mají konečnou dimenzi. Pak zobrazení V* 0 U* Lm2(U, V; K) = (ř7 (g> V)* dané předpisem 6<3r]*-^>r]Q6je izomorfismus. Důkaz. Zobrazení převádí bázi f1 (g> fl na bázi f1 0 fl (ve druhém vyjádření jsou pak obrazy P (š f duální ke!®3). □ Jakožto zobrazení U ® V —» K je obraz tenzoru 9 (g> rj dán předpisem u (g> v i—?► • #(w) a lze jej tedy popsat jako kompozici U®V -J^fL/. K (g) K = K, kde přirozený izomorfismus K (g> K = K je dán předpisem a (g> 6 i—> a&. 7.6. Izomorfismus mezi Hom(ř7, V) a Uvažujme bilineární zobrazení F x U* -+ Hom([7, F) definované předpisem (v, rj) i—> v ■ f] kde v ■ f] je lineární zobrazení u i—?► v ■ r](u) (skalární násobek vektoru v). V souřadnicích je toto zobrazení opět dáno násobením matic, tentokrát v opačném pořadí než u evaluace. Podle univerzální vlastnosti tenzorového součinu toto zobrazení indukuje lineární zobrazení V®U* -^Hom(U,V). Věta 7.8. Je-li U konečné dimenze, pak je výše uvedené zobrazení izomorfismus. 60 7. Tenzorový součin Důkaz. Nechť a = (ej) je báze U s duální bází (/■?) a nechť (3 = (ej) je báze prostoru V. Ukážeme, že ke každému tp: U —> V existuje jediný vzor, ten si označme 'i,3 Jeho obraz je Y2i j{eí ' f1)01) a stačí porovnat hodnoty na bázových vektorech es 'i,3 't Dostáváme tak jediné řešení: a'ls musí být i-tá souřadnice p{es). Zejména je tedy a* rovno prvku matice zobrazení p, a\ = {{ip)pa)ís- O Poznámka. V souřadnicích lze identifikovat Hom(č7, V) s prostorem matic m x n. Zobrazení z předchozí věty pak posílá eí ® f3 na matici , která má jediný nenulový prvek na místě roven 1. Zjevně matice Ej tvoří bázi prostoru všech matic, což dává alternativní důkaz předchozí věty. Z předchozí věty je dobře vidět, že většina tenzorů není „jednoduchých", tj. tvaru v ® rj. Takovým nenulovým tenzorům totiž odpovídají přesně zobrazení U —> V hodnosti 1, neboť jejich obraz je právě podprostor generovaný v. Ve skutečnosti má ale většina zobrazení maximální hodnost min{dimč7, diml/}. cv Cvičení. Jaký je vzor id £ Hom(č7, U)l 7.7. Tenzorová algebra vektorového prostoru Definice 7.9. Algebrou rozumíme vektorový prostor A, který je současně okruhem a to takovým způsobem, že násobení A x A —» A je bilineární. Alternativně tedy můžeme psát násobení jako lineární zobrazení A ® A —> A. Známe již poměrně dost příkladů algeber - algebru čtvercových matic, algebru komplexních čísel (obecněji libovolné rozšíření těles), za chvíli poznáme algebru kvaternionů. Tenzorový součin p kopií duálního prostoru U* a q kopií prostoru U se označuje T«U = U®---®U®U* ®---®U*. Jeho prvky se nazývají tenzory typu (p, q). Díky Větě 7.8 je TpU = Hom(č7®p, U®q). Naším dalším cílem bude z těchto prostorů vyrobit tzv. tenzorovou algebru vektorového prostoru U. Prvně definujeme násobení V-v-' V-v-' V-v-' t^u tqi+q*u tj. součinem tenzoru typu (pi,qi) a tenzoru typu (j>2,Q2) Je tenzor typu (pi +P259i + Q2), konkrétně ((ui © • • • ® uqi) ® (n1 ® ■ ■ ■ ® if1)) ® ((vi ® ■ ■ ■ ® vq2) ® (61 ® ■ ■ ■ ® 6P2)) ^ ^(u1®---®uqi®v1®---®vq2)®(r]1®---®if1®e1®---®eP2) 61 7. Tenzorový součin * Abychom z jednotlivých prostorů TpU a násobení mezi nimi vyrobili jedinou algebru, je nutné tyto prostory dát nějakým způsobem dohromady. K tomu nám poslouží pojem direktního součtu, tentokráte ovšem pro nekonečný počet sčítanců (sjednocení vektorových prostorů není vektorový prostor). Pro vektorové prostory Ví, i G /, položme ©* = { {ví)íei £ W Ví | ví je nenulové pouze pro konečně mnoho i G /|. iei iei Budeme identifikovat v G Vj s prvkem (wj)jg/ takovým, že Vj = v a ostatní komponenty jsou nulové. Pro v = (ví)íej s nenulovými složkami v^,... ,Vin platí v = + • • • + Vín a je tedy direktní součet generován jednotlivými sčítanci Ví. Zřejmě je toto vyjádření navíc jednoznačné a tedy lineární zobrazení Q)iej Ví —> W je jednoznačně určeno svými zúženími Ví —> W, kterážto mohou být libovolná lineární zobrazení. * Položme Tq U = K. Potom tenzorová algebra vektorového prostoru U je direktní součet vektorových prostorů oo p,q=0 To je opět vektorový prostor, i když nekonečné dimenze. Násobení na T*U je jednoznačně určeno tím, že má být bilineární a svým chováním na jednotlivých TpU. Příklad. Součinem tenzorů 2/1 ® iii ® u2 - 3f2 u3 0 u3, 4/3 ® u3 - f2 0 iii je tenzor (2/1 ® ui ® u2 - 3f2 ®u3® u3) 0 (4/3 ®u3- f2 ® ui) = = 8/1 ® f ®u1®u2®u3- 2 f ® f2 ®u1(S)U2®u1 -I2f2 ® f3 ®u3®u3®u3 + 3f2 0 f2 (8> u3 (8> u3 (8> «i. 7.8. Souřadnice tenzorů Nechť a = {e{\ je báze prostoru U a a* = {f1} duální báze prostoru U*. Potom všechny tenzory tvaru eh ® ■ ■ ■ ® eiq ® fjl ® ■ ■ ■ ® fp tvoří bázi prostoru Tp(U) a každý tenzor t G Tp(U) lze psát právě jedním způsobem ve tvaru £ • eil ® • • • ® ei? ® ® • • • ® íl,...,jq jl,-,jp Čísla ilj^"%jv £ K nazýváme souřadnicemi tenzoru í G Tp(U) v bázi a. Všimněte si, že dolní index p značí počet dolních indexů, zatímco horní index q značí počet horních indexů u souřadnic. Každý vektor u G U je tenzorem typu (0,1), neboť To(U) = U. 62 7. Tenzorový součin Jeho souřadnice v bázi a budeme zapisovat pomocí horních indexů n u = ale,i. i=i Každá lineární forma r] £ U* je tenzorem typu (1,0), neboť 7?(í/) = U*. Její souřadnice v bázi a budeme zapisovat pomocí dolních indexů n V = ^2 ^ f. Každá bilineární forma g na U je tenzorem typu (2, 0), neboť T2°([7) = U* 0 U* ~ Lin2([/ x U,K). Její souřadnice v bázi a budeme zapisovat pomocí dolních indexů i, j Každé lineární zobrazení p: U —> U je tenzorem typu (1,1), neboť Tl(U) = U®U* ~ Hom([/, [/). Jeho souřadnice v bázi a budeme zapisovat takto: p = ^2a)eí®fj. i, j Ukážeme, že matice lineárního zobrazení p: U —> U v bázi a je ( kde i označuje řádek a j sloupec. Platí totiž, že v i-tém řádku a j-tém sloupci matice ((p)a,a je i-tá souřadnice vektoru p(ej), tj. f\p{e3)) = ľ(^ďser® A{e3) ^ r,s ' = fi('£arserr ^ r,s Od této chvíle budeme tedy v kapitole o multilineární algebře značit matice zobrazení jako (ap, kde i značí řádek a j sloupec. 63 (erJ = a j 7. Tenzorový součin Násobení tenzorů lze v souřadnicích popsat takto: (t (g> sÝ1'lqi+q2 = £n"'íql SÍ K na dvojici vektorů u a v je postupně součin tenzorů g ®u®v a následná kontrakce prvních a druhých složek (tj. složení s evaluací U (g> U* —> K). V souřadnicích i,3,t,s i,j Vyčíslení lineárního zobrazení p: U —> U na vektoru u £ U je postupně součin tenzorů p®uíiU®U*®U a kontrakce mezi druhou a první složkou. V souřadnicích i d s = a)xsfj(es)ei = £ ( £ aja^' | eť Souřadnice výsledného vektoru jsou tedy • a*x-'. Kroneckerův tenzor S je prvkem ř70ř7*, který odpovídá identickému zobrazení z Hom(č7, U). Jeho souřadnice v libovolné bázi jsou 7.9. Grafický kalkulus Ve cvičení jsme reprezentovali tenzory pomocí obrázků, dále pak jejich tenzorový součin, identitu, evaluaci, skládání, atd. Základní identity jsou u u®u*®u u u* u*®u®u* -^->-u* Díky nim lze přecházet mezi zobrazeními U®p —> U®q a tenzory z TpU. Dále jsme definovali stopu zobrazení, tj. prvku T\\J jako napojení výstupu do vstupu (kontrakce). 7.10. Souřadnice tenzorů při změně báze Nechť a = jej} je báze prostoru U s duální bází a* = {f1} prostoru U* a nechť (3 = {ej} je jiná báze prostoru U s duální bází /3* = {f1}. Nechť A = (ďj), i značí řádky, j značí sloupce, je matice přechodu od báze a k bázi /3, tj. A = (id)^a, (ei,... ,en) = (ěi,.. .,ěn)A. 64 7. Tenzorový součin Dále nechť B V/v Dualita potom říká E V/v lei )•••)°n) B V/v (el)• • • ) en)A, díky čemuž B = A 1. Označíme-li Z? = (&*•), pak dostáváme vztahy jejichž dosazením do vztahu deřinicujícího souřadnice tenzoru dostaneme následující větu. Věta 7.10. Nechť t 6 Tp(U) je tenzor o souřadnicích t1^"1? ^ bázi a. Jeho souřadnice v bázi /3 jsou při použití sumační konvence Vi-X ~~ ak\ak2 kq hh-.-lp jl j2 (Sčítáme tedy přes všechny indexy k\, ..., kq, l\, ..., lp.) □ Příklad. Nechť u je vektor se souřadnicemi x% v bázi a a xl v bázi /3. Podle předchozí věty (2 uX Tedy (u)p = A(u)a = (id)íga(u)c což je nám známo již z dřívějška. Příklad. Nechť / je lineární forma se souřadnicemi y j v bázi a* a souřadnicemi yj v bázi /3*. Podle předchozí věty ví = ^yrfj i Tedy (/)/?* = (f)a'B = (/)a.(Íd)a/3, kde jsou ale souřadnice forem brány jako řádky jako obvykle. Příklad. Lineární zobrazení p: U —> U je tenzor typu (1,1). Jeho matice (p)aa = (íp je zadána souřadnicemi tohoto tenzoru. Podle předchozí věty jsou jeho souřadnice v bázi /3 *5 = £aÍtŕ&i = Eai(E*ŕ« 'i,3 maticově (W = A(p)aaB = A(p)aaA 1 = (id^^^id)^, což je nám již známý vztah pro transformaci matice zobrazení. 65 7. Tenzorový součin Příklad. Bilineární forma na U je tenzor typu (2,0). Matice této formy je dána souřadnicemi tenzoru (tij) (i značí řádek, j sloupec). Podle předchozí věty maticově Ť = BTTB = (id)^T(idW, což je nám již z dřívějška známý vztah pro transformaci matice bilineární formy. Poznámka. Pořadí má být opačné. Příklad. Nechť V je vektorový prostor s bází (ei, e2) a duální bází (f1, f2). Vyjádřete tenzor f ®{ei+e2) £Tl{V) v bázi (éi, e2) a duální bázi (f1, f2), jestliže (ěí,ě2) = (e1,e2)^ * Řešení. Platí (ei,ě2) = (e1,e2)A. Chceme vyjádřit e±, e2 pomocí e{, e2 a f1, f2 pomocí f1, f2. Z předchozí rovnice okamžitě dostáváme (ei,e2) = {e1,e2)A 1 = {e1,e2) ^ ^ Dále hledáme vyjádření ve tvaru Platí E = (f{ej)) = (ei,e2) = 5 (í^J {e\,e2)A~x = B • EA'1 = B • A"1. Tedy musí být B = A^1, proto (J2) = (3 2) (já) • Odtud dosadíme do našeho tenzoru f1 ® (ei + e2) = (Z1 + J2) ® {-2eí + 3e~2 + e\ - e2) = {71+72)®{-e1+2e2) = -f1 ® é{ - f2 ® eí + 2/1 ® e2 + 2/2 © ř2. 66 7. Tenzorový součin 7.11. Tenzory ve fyzice, jiná definice tenzoru Předchozí věta o transformaci souřadnic tenzoru při změně báze nám umožňuje porozumět tomu, jak jsou tenzory chápány ve fyzice. Tenzor typu (p, q) nad vektorovým prostorem U každé bázi a v U přiřazuje np+9-tici čísel ^h"%Jv ^ P^čemž Při změně báze probíhá transformace těchto čísel podle věty z předchozího paragrafu. 67 p 8. Symetrické a antisymetrické tenzory 8.1. Symetrická mocnina Od této chvíle nechť K je těleso charakteristiky 0. Grupu permutací množiny {l,...,q} označme T,q. Dennice 8.1. Definujme symetrickou mocninu SqU jako kvocient (^)q U podle vektorového podprostoru generovaného tenzory tvaru ua(l) <8> • • • <8> ^cr(g) - Ui (g) ■ ■ ■ (g) Uq. Třídu prvku u\ : Y\q U —> V multilineární zobrazení, pak existuje jediné lineární zobrazení G: &)q U —> V díky univerzální vlastnosti tenzorového součinu. Je-li navíc <í> symetrické, pak G{uari) <8> • • • ®Ua(q)) = $(nCT(l), • • • = $(«i, ...,uq) = G{ui ■ ■ ■ Uq) (Uq+l Sq+rU má tvar {u\ ■ ■ ■ uq) ■ {uq+\ ■ ■ ■ uq+r) = Ui ■ --UqUq+1 ■ ■■Uq+r. 68 8. Symetrické a antisymetrické tenzory ** 8.2. Symetrické tenzory Uvedeme nyní alternativní definici SqU, konkrétně jako podprostoru (g)9 U. K tomu budeme potřebovat několik definic. Pro permutaci o G T,q máme lineární zobrazení Pa: (g)9 U ->• (g)9 U, ui (g> • • • (g> uq i-)- (g> • • • (g> . cv Platí pT o pa = paOT; to je proto, že pTpa{u\ <8> • • • <8> tig) vznikne z výše uvedeného vztahu pro pa{u\ (2> • • -®uq) tím, že na t-té místo napíšeme člen na r(i)-tém místě, tj. iicr(r(j)). Výsledkem tak bude uo-(t(1)) (8> • • • (8> MCT(r(9)) = Po-r(«l (8> • • • (8> Konkrétně si lze předchozí důkaz demonstrovat na příkladu P(23)P(12)(U1 ®u2 ®U3) = P(23)(^2 ® Ul <8> M3) = ^2 <8> ti3 ® «1 = P(123)(ul ® ^2 <8> «3)1 přičemž (12)(23) = (123) / (23)(12). Definice 8.3. Řekneme, že tenzor i G (g)9 ř7 je symetrický, jestliže pCTí = í pro každou permutaci u\ (8> ti2 dostaneme tenzor (sčítance odpovídají postupně permutacím id, (12), (23), (13), (231) a (321)) 1, -(til ®Ui®U2 + Ui®Ui®U2+Ui®U2®Ui+U2®Ui®Ui+Ui®U2® U\ + 6 . 1 1 1 +ii2 (8> «1 (8> til) = -Ul (g) iii (g) ii2 + -til (X1 U2 (g> iil + -ii2 0 til 0 til o o o Symetrizace zjevně zadává lineární zobrazení Sym: (g)9 ř7 —> (g)9 ř7. Lemma 8.5. Platí pa o Sym = Sym = Symop^. Důkaz. Dokážeme první rovnost, druhá se dostane podobně. Platí pCT(Sym(í)) = ^ Y PÁPÁt)) = J Y PTOtrt = Í E Prt = Sy™^) (pro r G Sg zjevně probíhají permutace t o a přes každý prvek T,q právě jednou). □ Důsledek 8.6. Obraz Sym((g)9 U) sestává právě ze symetrických tenzorů. Důkaz. Podle lemmatu je pcr(Sym(í)) = Sym(í), takže Sym(í) je vždy symetrický. Na druhou stranu každý symetrický tenzor t leží v obraze Sym, neboť reSq reSq 69 8. Symetrické a antisymetrické tenzory Ve skutečnosti z důkazu jednoduše plyne Sym o Sym = Sym, takže Sym je projekce na prostor symetrických tenzorů. Druhá rovnost z lemmatu říká Sym(ui (g> • • • (g> uq) = Sym(ucr(1-) (g> • • • (g> Mff(9)), tj. Sym faktorizuje přes S*9?/, takže dostáváme indukované zobrazení s: SqU —> U. Platí s(ui • • • u9) = Sym(ui (g> • • • (g> u9) = ^ ^ uct(1) (g> • • • (g> , z čehož dostáváme p(s(u! • • • Ug)) = ^^2 uCT(1) • • • uct(9) = ^ Ul ■ ■ ■ Uq = Ul ■ ■ ■ Uq reSq reSq a tím pádem p o s = id. Názorně to znamená, že s vybírá z každé třídy rozkladu SqU = (^)9č7/kerp nějakého reprezenta této třídy; proto p indukuje izomorfismus ims ^> SqU. Přitom zjevně im s = im Sym a podle důsledku se jedná o prostor symetrických tenzorů. 8.3. Báze prostoru symetrických tenzorů Budeme používat zkrácené značení u"1 ... u^k, pokud se vektor u j vyskytuje v součinu a j-krát. Věta 8.7. Nechť (e±,..., en) je báze prostoru U. Potom {e"1 ... | a± + • • • + an = q} je báze Sq{U). Důkaz. Tvrzení dokážeme s pomocí Lemmatu 6.1, budou nás tedy zajímat lineární zobrazení Sq(U) —> V nebo ekvivalentně symetrická g-lineární zobrazení <í>: Y\q U —> V. To je jednoznačně určeno svými hodnotami na g-ticích bázových vektorů s tím, že tyto hodnoty mohou být libovolné, ale symetrické, tj. jsou jednoznačně určeny (libovolnými) hodnotami na (e^,..., ej ), kde i\ < ■ ■ ■ < iq. Při izomorfismu Lmq(U, ...,U; V)sym 9á Rom(SqU, V) odpovídá <í> lineárnímu zobrazení F: SqU —> V a platí tedy, že toto je jednoznačně určené svými (libovolnými) hodnotami F(eh ■■■eíq) = *(eil,...,ei?), kde i\ < ■ ■ ■ < iq, jak jsme chtěli dokázat. □ Důsledek 8.8. Dimenze prostoru Sq(U) je (n+^ 1)- Důkaz. Spočítejte, kolik existuje n-tic (a±,..., an) nezáporných celých čísel takových, že a± + ■ ■ ■ + an = q. (Je jich stejně, jako je různých posloupností q znaků • a n — 1 znaků |, například (1,0,2,1) odpovídá • | | •• | •.) □ Speciálně pro U = (Kn)* můžeme chápat formy f1 z duální standardní báze jako proměnné xl (jsou to zobrazení Kn —> K jejichž hodnota na (x1,..., xn) je právě xl). Potom lze symetrickou algebru S^K™)* ztotožnit s algebrou K[a;1,..., xn] polynomů nad tělesem K v proměnných prvky této algebry pak interpretovat jako polynomiální funkce na Kn. 70 8. Symetrické a antisymetrické tenzory 8.4. Antisymetrická mocnina Označme signcr znaménko permutace o. Zopakujeme předchozí výklad pro antisymetrická (nebo též alternující) g-lineární zobrazení, tj. zobrazení <í>: Y\q U —> V splňující $(uCT(i), • • -,u^g)) = signcr • ...,uq) pro libovolnou permutaci (zjevně stačí zkontrolovat pro transpozice, které generují T,q). Vektorový prostor antisymetrických g-lineárních zobrazení budeme značit Ling(č7,..., U; V)ait- Definice 8.9. Definujme antisymetrickou mocninu AqU jako kvocient (^)q U podle vektorového podprostoru generovaného tenzory tvaru ua(l) ® • • • ® ua(q) ~ sign O ■ Ui ® ■ ■ ■ ® Uq. Třídu prvku u\ uq budeme značit u\ A • • • A uq; platí tedy uCT(i) A • • • A ua^ = sign o • ui A • • • A uq. Zejména platí u\ A • • • A uq = 0, kdykoliv U{ = u j (prohozením Ui, u j se výraz jednak nezmění a podle definice změní znaménko; v nulové charakteristice to znamená, že je tento výraz nulový). Antisymetrická mocnina AqU má opět jistou univerzální vlastnost: XV u-*—t v Li S / t ^ , / AqU Je-li <ř multilineární zobrazení, pak existuje jediné lineární zobrazení G: &)q U —> V díky univerzální vlastnosti tenzorového součinu. Je-li navíc <ř antisymetrická, pak G{ua(i) ® ■ ■ ■ ®ua(q)) = $(nCT(i),... = sign o-•$(«!,..., u9) = sign a ■ G{ux ® ■ ■ ■ ® uq). Proto G indukuje jediné lineární zobrazení F, pro které zjevně platí F(Ul A • • • A uq) = Naopak, pokud je F lineární zobrazení, pak kompozice F o po t je antisymetrické g-lineární zobrazení. Věta 8.10. Platí Hom(A9ř7, V) = Lin9(ř7, ...,[/; F)ait. □ Ukážeme nyní, že AqU je ve skutečnosti kvocientem podle ideálu, takže se jedná opět o algebru. Protože je (^)q U generovaný jednoduchými tenzory, stačí ukázat, že iua(i) ® • • • • • • (g> uq+r) opět leží v jádře projekce a podobnou symetrickou vlastnost. To je ale jasné, neboť se jedná o generující tenzor pro permutaci cr + id, která je a na prvních q prvcích a identita na posledních r prvcích. Násobení AqU (g> ArU —> Aq+rU má tvar (u\ A • • • A uq) • {uq+\ A • • • A uq+r) = ui A • • • A uq A uq+i A • • • A uq+r. 71 8. Symetrické a antisymetrické tenzory ** 8.5. Antisymetrické tenzory Uvedeme nyní alternativní definici AqU, konkrétně jako podprostoru (^)q U. K tomu budeme potřebovat několik definic. Definice 8.11. Řekneme, že tenzor t £ &)q U je antisymetrický, jestliže pat = signcr • t pro každou permutaci o. Definice 8.12. Antisymetrizace tenzoru t je tenzor Alt (i) = ^ STe£q signcr • Prt- V předchozí definici používáme nulovou charakteristiku K k tomu, abychom mohli dělit nenulovým číslem q\ 7^ 0. Příklad. Antisymetrizací tenzoru u\ (g> u\ (8> íí2 dostaneme tenzor (sčítance odpovídají postupně permutacím id, (12), (23), (13), (231) a (321)) 1, -iUl®Ul®U2-Ul®Ul®U2-Ul®U2®Ul-U2®Ul®Ul+Ul®U2®Ul+U2®Ul®Ul)={) O Antisymetrizace zjevně zadává lineární zobrazení Alt: U —> &)q U. Lemma 8.13. Platí pa o Alt = sign a ■ Alt = Alt opa. Důkaz. Dokážeme první rovnost, druhá se dostane podobně. Platí pCT(Alt(í)) = ^ E SÍgnT ' PÁPÁť)) = g\ E SÍgnřJ ' S1Sn(T ° a) • Proat reSq reSq = sign o" • sign r • pTi = signcr • Alt (i) (pro těS, zjevně probíhají permutace roj přes každý prvek T,q právě jednou). □ Důsledek 8.14. Obraz Alt((^)9č7) sestává právě ze symetrických tenzorů. Důkaz. Podle lemmatu je pcr(Alt(í)) = sign a ■ Alt (i), takže Alt(í) je vždy antisymetrický. Na druhou stranu každý antisymetrický tenzor t leží v obraze Alt, neboť Alt(í) = i^signr.frí = i^t = í. □ reSq reSq Ve skutečnosti z důkazu jednoduše plyne Alt o Alt = Alt, takže Alt je projekce na prostor antisymetrických tenzorů. Druhá rovnost z lemmatu říká Alt(ucr(1-) (g> • • • <8> ^o-(g)) = slSn ° ' Alt(«i (g> • • • <8> uq), tj. Alt faktorizuje přes AqU, takže dostáváme indukované zobrazení s: AqU —> &)q U. Platí s(ui A • • • A uq) = Alt(«i (g> • • • (g> uq) = |f ^ sign a • ^(í) <8> • • • <8> ^(g), r£Sq z čehož dostáváme A • • • A Ua)) = |f E SÍgI1 °" ' A " " " A Uv{q) = Jí E ^1 A • • • A Ug = U\ A • • • A Ug reSq reSq a tím pádem p o s = \á. Názorně to znamená, že s vybírá z každé třídy rozkladu AqU = (^)9č7/kerp nějakého reprezenta této třídy; proto p indukuje izomorfismus ims ^> AqU. Přitom zjevně im s = im Alt a podle důsledku se jedná o prostor antisymetrických tenzorů. 72 8. Symetrické a antisymetrické tenzory 8.6. Báze prostom antisymetrických tenzorů Věta 8.15. Nechť (ei,..., en) je báze prostom U. Potom {e^ A • • • A ejg | i\ < ■ ■ ■ < iq} je báze Ag(U). Důkaz. Důkaz je analogický symetrickému případu s tím, že antisymetrická g-lineární forma í>: Y\q U —> K je jednoznačně určena svými hodnotami na g-ticích bázových vektorů s tím, že tyto hodnoty mohou být libovolné, ale antisymetrické, tj. jsou jednoznačně určeny (libovolnými) hodnotami na (e^,..., ej ), kde i\ < ■ ■ ■ < iq. Při izomorfismu Lmq(U, ...,[/; V)alt = Hom(A9í/, V) odpovídá <í> lineárnímu zobrazení F: AqU —> K a platí tedy, že toto je jednoznačně určená svými (libovolnými) hodnotami F(eh f\--- f\eiq) = $(eil,...,ei?), kde i\ < ■ ■ ■ < iq. □ Důsledek 8.16. Platí l 71 dimA^t/) = kde n = dim U. Věta 8.17 (Lineární nezávislost a vnější součin). Vektory u±,..., uq G U jsou lineárně závislé právě tehdy, když u\ A • • • A uq = 0. Důkaz. Jsou-li u±,..., uq lineárně nezávislé, lze je doplnit na bázi (u±,..., uq, uq+i,..., un) prostoru U. Potom u\ A • • • A uq je jeden z prvků báze Xq(U), tudíž je různý od nuly. Jsou-li ui,..., uq lineárně závislé, pak jeden z nich je lineární kombinací ostatních, nechť je to 9-1 uq = alUi. 1=1 Potom u\ A • • • A uq = ui A • • • A Ug-i A ( alu,i J ^ i=i ' 9-1 = ^2 a%ul A • • • A Uq-i A Ui = 0. □ i=l 8.7. Vnější mocnina lineárního zobrazení Nechť ip: U —> V je lineární zobrazení. Již dříve jsme ukázali, že existuje lineární zobrazení y>®9 = yxg>...(g>y>: 0qU^0qV takové, že tf^iUi ® ■ ■ ■ (g> Uq) = ) • • • (f(uq). 73 8. Symetrické a antisymetrické tenzory Nyní ukážeme, že existuje zobrazení na kvocientech (g)9 U ► (g)9 v p p MU---^ MV Aq K tomu zjevně stačí p o íp®q{uari) ® • • • ® ua{q)) = sign o- • p o pm(ui ® ■■■®uq) neboli MV. 8.8. Vnější mocniny a determinanty Věta 8.18. Nechť p: U —» U je lineárni zobrazení, které má v bázi a = (ei,..., en) prostom U matici A = (cŕj). Potom platí p^n{ei A • • • A en) = det A ■ e\ A • • • A en. Důkaz. Platí U posílající standardní bázi (ei,..., en) na danou n-tici vektorů, pro tato zobrazení pak platí (3 = a o P a dostáváme komutativní diagram ei A • • • A e. det P ■ e\ A • • • A er Tvrzení jednoduše plyne z komutativity. □ 74 8. Symetrické a antisymetrické tenzory Příklad. Nechť matice A AA2? Řešení. AA2: A2R = R ->• Příklad. Nechť 1 2 3 4 reprezentuje lineární zobrazení'. '. Čemu se rovná A2 Podle předchozí věty je matice tohoto zobrazení rovna detA = -l. c A (\ 0 0 0\ 4 0 0 0 3 8 2 0 \2 1 4 3/ Najděte kanonický tvar matice AA3. Matice A má vlastní čísla 1, 0, 2, 3 a příslušné vlastní vektory u±, u2, 113, 114 tvoří bázi R4. Potom Ui A u j A Uk tvoří bázi A3M4. Protože Aa3(uí A Uj A iíj) = Auí A Au j A Au^ = XiXjXkUi A u j A u^, má matice AA3 vlastní vektory, které tvoří bázi A3M4 s vlastními čísly 0, 0, 0, 6. Tedy Jordánův kanonický tvar matice AA3 bude /0 0 0 0\ 0 0 0 0 0 0 0 0 \0 0 0 6/ Kontrolní otázky 1. Nechť lineární transformace tp: U —> U má vlastní čísla Ai, A2, A3, ..., Afc. Jaká vlastní čísla má duální zobrazení p>*: U* —> U*l 2. Nechť M.s[x] je vektorový prostor polynomů stupně nejvýše 3. Udejte příklad nenulové lineární formy M.s[x] —> M, nenulové bilineární formy M.s[x] xl[i] —> M, nenulové 3-lineární formy R3[x] x R3[x] x R3[x] ->• R. 3. Vyslovte definici tenzorového součinu U <® V a vysvětlete, co je tenzor u® v, kde u g ř7 a u g F. 4. Ukažte, jak se použije univerzální vlastnost tenzorového součinu pro definici zobrazení ipi (g> ip2, kde p>\ \ XJ\ —> Vi, p>2 '■ U2 —> V2 jsou lineární zobrazení. Nechť p>\ je dáno maticí '1 2\ . . , /3 4\ ,r Í3\ (1N 4 I, p>2 je dano matici I I. Vypočtete p>i (g> ip2 na I ^ I (g> I 5. Udejte příklad nenulového symetrického tenzoru S'3(M2). 6. Vysvětlete, co znamená symbol ivu, kde v g ř7, íj g Afc(ř7*). Vyjádřete pro ř7 uj(x, y) = xxy2 - x2yi + x2y3 - x3y2 a v = (1, 2, 3). Příklady k procvičení 1. Vyčíslete tenzory: 75 8. Symetrické a antisymetrické tenzory (a) t = f1 0 e2 + f ® (ei + 3e3) G T^M3) na vektoru v = e± + 5e2 + 4e3 a formě / = /1 + /2+/3- (b) i G T2 (M4) se všemi souřadnicemi rovnými 3 na pětici (v, v, v, f, /), kde f = f1 — f4 a v = e\ + 2e2 + 3e3 + 4e4. (c) r = 2 • í (g> s + s 0 i, kde i = 2 • Z1 <8> ei, s = f2 0 (2ei — e2), na čtveřici (ei, 3ei — 62,2/! +Z2,/1). [Řešení: (a) Z) = 21; (b) t(v, v, v, f, f) = 0; (c) r(e1,3e1 - e2, 2Z1 + Z2, Z1) = -16.] 2. Spočtěte souřadnice (a) t\2 tenzoru t G T2(M2), jehož souřadnice jsou v bázi (ei, e2) všechny rovny 1, v nové bázi (ěLěi) = (ei, e2) (b) í}2 tenzoru i = Z1 0 Z2 ® (ei + e2) £ ^(M2) v nové bázi (ěi,ěi) = (ei, e2) (c) í31 tenzoru /2 ® J1 ® e3 ® ei + /3 ® /3 ® ei ® e2 £ Tf (M3) v nové bázi /l 0 0 (ěT,ě2",ě^) = (ei,e2,e3) 2 1 0 \3 2 1 (d) t123 tenzoru í G T2(M3) se všemi souřadnicemi rovnými dvěma v bázi (ei,e2,e3) v nové bázi /l 2 3^ (ěT,^,^) = (ei,e2,e3) 0 1 2 \0 0 1, [Řešení: (a) t{2 = -9; (b) t\2 = 4; (c) tfx = 3; (d) í}23 = 0.] 3. Spočtěte kontrakci tenzoru (a) 3 • Z1 <8> ei 0 e2 — 2 • Z2 0 e2 0 e2 podle 1. a 2. složky. (b) (Z1 - 2Z3 + 3Z4) ® (ei + 3e2 - e3) (c) (Z1 + Z2 + Z3 + Z4) ® ei + (Z1 + 2Z2 + 2Z3 + 4Z4) ®e2+ 2{f - f2 - Z4) 0 e3 (d) Z2 ® Z1 ® e3 (8> ei + f3 (g> f3 e2 podle druhých složek. [Řešení: (a) -2e2; (b) 3; (c) 3; (d) f2 0 e3.] 76 8. Symetrické a antisymetrické tenzory 4. Pomocí matice /2 1 0 0\ 110 0 "0011 \0 0 1 2/ proveďte snížení a povýšení tenzoru (f1 + f2) (g> (e3 + e^) — (f1 + /3) (g> e3 [Řešení: Snížení (3ei + 2e2) (g> (e3 + e4) - (2e± + e2 + e3 + e4) (g> e2, povýšení (Z1 + /2) (g> /3 + (/l+/3)0(/4_2/3).] 5. Necht t g Tq(U) je symetrický a s g T^iJJ) antisymetrický tenzor. Dokažte, že tenzor vzniklý násobením a následnou kontrakcí v obou složkách tijS13 je roven nule. 6. Dokažte, že pro operátory symetrizace S: Tq{U) —> Sq{U) a antisymetrizace A: Tq{U) —> Aq{U) platí SoA = AoS = 0. 7. Dokažte, že pro dimč7 > 2 nejsou prostory A2(A2(Č7)) a A4(Č7) izomorfní. 8. Dokažte, že tenzor t^/u g Tq(U) symetrický vzhledem k i, j a antisymetrický vzhledem k j, k je roven nule. 77 9. Determinanty, objemy a orientace 9.1. Objemová forma a determinant Objemová forma na U je libovolná nenulová antisymetrická n-lineárni forma Vol: l|n U —> K, kde n = dim U, tj. Vol g Linn([/,..., U; K)alt = Hom(An[/, K) 3 vol; odpovídající lineární formu budeme značit vol: AnU —> K. Nechť (ei,...,en) je libovolná báze Č7. Nenulovost Vol je ekvivalentní tomu, že vol(ei A • • • Aen) = Vol(ei,..., en) 7^ 0, neboť Anč7 je generovaný e\ A • • • A en. Hodnotu Vol(ui,... ,un) nazýváme orientovaným objemem rovnoběžnostěnu určeného těmito vektory. Díky objemové formě můžeme interpretovat determinant operátoru p>: U —> U. Platí totiž Vol((/5(ui),..., p>{un)) = vol((/j(ui) A • • • A p>{un)) = det tp ■ vol(«i A • • • A un) = det 0. Vraťme se nyní k obecné situaci reálného vektorového prostoru U. Věta 9.1. Dvě báze a, (3 jsou shodně orientované, právě když je lze spojit cestou, tj. právě když existuje spojité zobrazení 7: [0,1] U x • • • x U = Un splňující následující • 7(0) = a, 7(1) = (3 a • pro každé t g [0,1] je n-tice *y(t) bází U. Poznámka. Spojitost jistě dává smysl pro U = Mn. Avšak libovolný (konečně rozměrný) reálný vektorový prostor je izomorfní W1 a spojitost lze definovat ve smyslu tohoto izomorfismu -hlavně na volbě takového izomorfismu nezávisí. 79 9. Determinanty, objemy a orientace Důkaz. Není těžké se přesvědčit, že každou čtvercovou matici s kladným determinantem lze napsat jako součin elementárních s kladným determinantem. Prohození dvou sloupců lze nahradit kompozicí operací / —> I + II, II —> II — I, I —> I + II, která samozřejmě zároveň s prohozením sloupců také jeden z nich vynásobí číslem —1, ale Gaussova eliminace lze provádět i s touto operací. Vynásobení dvou sloupců číslem — 1 lze nahradit provedením dvou předchozích složených operací za sebou. Dále není těžké se přesvědčit, že každá z elementárních matic Tj s kladným determinantem lze spojit s jednotkovou maticí E cestou Ti procházející pouze maticemi s kladným determinantem. Jejich součin T = T\- ■ -Tk pak lze spojit s jednotkovou maticí jednoduše pomocí cesty í^ri(í)---rfc(í). Jelikož však platí a = 13 ■ T, hledaná cesta mezi bázemi a, /3 lze volit například jako t ^ p ■T1(t)---Tk(t). V opačném směru veličina (det id^^a) £ Mx závisí spojitě na t a její hodnota pro t = 0 je 1. Proto i její hodnota pro t = 1 musí být kladná, tj. (detid^) > 0 a báze a, /3 jsou shodně orientované. □ Důležitým příkladem objemové formy je objemová forma vzniklá ze skalárního součinu na orientovaném Eukleidovském prostoru £. To by nemělo být překvapující - skalární součin na £ udává smysl velikosti vektorů a úhlů mezi nimi; z těchto údajů lze objem spočítat. Objemová forma však udává orientovaný objem, proto je navíc potřeba ještě volba orientace. Z jiného úhlu pohledu na Eukleidovském prostoru jsou dvě objemové formy a není žádný důvod preferovat jednu z nich; ten nastává až při zafixování orientace. Pro neorientovaný Eukleidovský prostor bychom mohli nadefinovat pouze neorientovanou objemovou „formu" | Vol |; k ní se vrátíme za chvíli. Nechť a = (e±,... ,en) je libovolná kladně orientovaná ortonormální báze. Kanonickou objemovou formu zafixujeme požadavkem Vol(ei,... ,en) = 1. Je-li (é"i,..., é~n) jiná kladně orientovaná ortonormální báze, pak matice přechodu má kladný determinant a je ortogonální, takže tento determinant musí být roven 1, a proto Vol(ěi,..., én) = 1 • Vol(ei,..., en) = 1 a požadavek na Vol tedy nezávisí na volbě báze a. Nechť nyní /3 = (u±,... ,un) je libovolná n-tice vektorů a pišme /3 = a ■ P, kde „transformační matice" P má prvky souřadnice vektorů Uj v bázi a, tj. pl- = fl(uj). Potom Vol(ui,..., un) = det P ■ Vol(ei,..., en) = det P. Jelikož je báze a kladná, má /3 stejné znaménko jako det P, tedy jako Vol(ui,..., un). 80 9. Determinanty, objemy a orientace Tvrzení 9.2. Orientovaný objem Vol(«i,... ,un) lze spočítat jako determinant matice, jejíž j-tý sloupec je tvořen souřadnicemi vektoru u j v libovolné kladné ortonormální bázi (ta však musí být stejná pro všechny sloupce). Zejména signVol(«i, ...,un)= sign(ui,.. .,un). Jeho druhou mocninu lze spočítat jako Gramův determinant (Vol(ui,... ,un))2 = det((ui,Uj)) z matice, jejíž prvek na pozici je skalární součin (uí,Uj). Důkaz. Druhé tvrzení plyne z prvního uvážením det(PTP). Na pozici dostaneme součin i-tého a j-tého sloupce P, tedy Y^fk{^)fk{u]) = {u^u]) k (jedná se o vzorec pro skalární součin v ortonormálních souřadnicích). □ Jako důsledek dostáváme vzorec pro neorientovaný objem na Eukleidovském prostoru jako odmocninu z Gramová determinantu - ten závisí pouze na skalárním součinu a nikoliv na orientaci. Z tohoto pohledu lze interpretovat Gramův-Schmidtův ortogonalizační proces jako vzorec pro objem. Během něj totiž měníme každý vektor pouze přičítáním násobků předchozích vektorů a nemění se tedy orientovaný objem. Přitom po provedení celého procesu a pro vzniklý ortogonální systém (v±,... ,vn) je Gramová matice diagonální a neorientovaný objem je tak roven | Vol(«i,.. .,un)\ = |«i| • • • \vn\, tedy součinu velikostí vektorů v±,... ,vn. Znaménko je též jako u původního orientovaného objemu a je tedy určeno tím, zda je (ui,... ,un) báze kladná či záporná (v případě, že se nejedná vůbec o bázi, je objem beztak nulový). Přitom velikost vektoru v{ je rovna výšce rovnoběžnostěnu určeného u±,..., uí s podstavou danou prvními i—l vektory. Jedná se tedy o vzorec objem rovnoběžnostěnu = objem podstavy x výška Hlavní význam této formulky je pro nás v tom, že po několika stránkách je snad konečně zřejmé, proč tomuto objektu říkáme orientovaný objem. 9.3. Geometrie v rovině a prostoru Prvně se zabývejme rovinou £2, kterou budeme chápat jako M 2 se standardním skalárním součinem a standardní orientací. Ta je mimochodem totožná s tou vzniklou z komplexní struktury na C = ffi2. Pro vektory u, v g £2 počítejme neorientovaný objem z Gramová determinantu (Vol(u,v)ý (u,u) (u,v) (v,u) (v,v) \u\ \v\ (u,v)2 i 121 12 ■ 2 \u\ \v\ sm a, kde a je úhel mezi vektory u, v a rovnost plyne z (u,v) = \u\\v\ cos a. Odmocněním dostáváme vztah | Vol(u,v)\ = \u\\v\\sina|. 81 9. Determinanty, objemy a orientace Standardně bereme a g [0,7r], díky orientaci můžeme nyní rozšířit definiční obor na a £ (—7t, 7r] a zvolit znaménko podle orientace (u, v). Mluvíme pak o orientovaném úhlu od vektoru u k vektoru v a můžeme psát = Vol(u, = |u| |u| sin a. Budeme psát a = <(u, v). (Lépe je samozřejmě brát a g M/27rZ.) Orientovaný úhel se hodí v úlohách, ve kterých je potřeba (zejména algoritmicky) rozhodnout o viditelnosti objektů v rovině. Dalším případem je úloha rozhodnout, zda mnohoúhelník A\ ■ ■ ■ An zadaný posloupností vrcholů je kladně či záporně orientovaný (v případě, že nevíme, zda je konvexní). Velice jednoduchým způsobem (alespoň z teoretického pohledu) je spočítat všechny orientované úhly <(AnAu AľA2), <(A±A2, A2A3),<(An^An, AnA{) podél mnohoúhelníka a sečíst je. Pokud je součet roven 2tv, je mnohoúhelník kladně orientovaný, pokud — 2tv, je záporně orientovaný. Ostatní případy nemohou pro mnohoúhelník nastat a lze takto i detekovat některé případy, kdy se nejedná o mnohoúhelník (zdaleka ne však všechny). V případě, kdy je mnohoúhelník konvexní, budou mít všechny úhly stejné znaménko a to lze spočítat pomocí orientovaného objemu (u čtyřúhelníku stačí spočítat znaménka i v nekonvexním případě). Jiným řešením je sečíst orientované objemy \ Vol(AiA2, A1A3) + + Í VoKAiAn-i, A1An). Pokud je výsledek kladný, je mnohoúhelník kladně orientovaný a naopak. Příklad. Ukažme nyní, že výše uvedený součet vyjadřuje obsah mnohoúhelníku A\ ■ ■ ■ An. V prvním kroku dokážeme o něco obecněji, že součet Vol(XAu XA2) + ■■■+ Vol(XAn_i, XAn) + Vol(XAn, XA{) nezávisí na volbě bodu X. To je tím, že Vol(YAi, YAi+1) = Vol(YX + li,, YX + XAi+1) = Vol(XAi,XAi+1) + Vol(YX,XAi+1) + Vol(XAi,YX), kde členy Vol(yX, XAi+1) se při sečtení vyruší se členy Vol(XAj, YX) = - Vol(yX, XAj). V dalším kroku ukážeme, že existuje vnitřní diagonála AiAj, která protíná mnohoúhelník pouze v koncových bodech. Pak lze induktivně předpokládat, že vzorec pro obsah funguje pro oba mnohoúhelníky vzniklé rozdělením podél AiAj a jejich sečtením dokázat, že tento vzorec funguje také pro původní mnohoúhelník (členy obsahující diagonálu se vyruší). Nechť Ai je bod s nejmenší x-ovou souřadnicí. Pokud leží uvnitř trojúhelníku Aí-iAíAí+i nějaký další vrchol mnohoúhelníku, zvolíme za Aj ten s nejmenší x-ovou souřadnicí. Pokud ne, zvolíme za dělící diagonálu Aí-iAí+i. Poznámka. Orientovaná Eukleidovská rovina7 je kanonicky (jednorozměrným) komplexním vektorovým prostorem: násobení i je rotace o 90° v kladném směru. Tím lze také definovat 7Ve skutečnosti stačí mít skalární součin zadán až na násobek - takové struktuře se říká konformní; lze v ní měřit úhly a porovnávat velikosti. Typickým příkladem konformního zobrazení, které není ortogonální, je stejnolehlost. 82 9. Determinanty, objemy a orientace orientovaný úhel mezi nenulovými vektory u, v jako <(u, v) = &ľg(v/u) - je totiž v = z-u pro jediné komplexní číslo z, jehož argument je přesně onen orientovaný úhel. Neorientovaná rovina má dvě komplexní struktury, které se navzájem liší o komplexní konjugaci. Ve výsledku je tak úhel jednoznačný až na znaménko. Přejděme nyní ke standardnímu orientovanému Eukleidovskému třírozměrnému prostoru £3. Krom skalárního součinu lze na £3 definovat vektorový součin pomocí objemové formy. Po dosazení dvou vektorů u, v £ £3 se z objemové formy stane lineární forma Vo\(u,v, -): £3 ->• R. Každá lineární forma je rovna skalárnímu součinu s jednoznačně určeným vektorem, který v tomto případě značíme u x v. Je tedy definován vztahem Vól(u,v,w) = (u x v,w). V kladné ortonormální bázi lze vektorový součin spočítat jako u x v = (u x v, e±) ■ e\ + (u x v, e2) ■ e2 + (u x v, e%) ■ e% u1 v1 1 u1 v1 0 u1 v1 0 u1 v1 ei u2 v2 0 ei + u2 v2 1 e2 + u2 v2 0 es = u2 v2 u3 v3 0 u3 v3 0 u3 v3 1 u3 v3 es kde výsledný determinant dává smysl pouze, pokud jej rozvineme podle třetího sloupce; dostaneme pak korektní vzorec u x v u2 v2 u3 v3 ei + u3 v3 u1 v1 e2 + u1 v1 u2 v2 es- Zabývejme se nyní abstraktními vlastnostmi vektorového součinu. Z antisymetrie platí (u x v, u) = Vol(u, v, u) = 0, a proto je u x v kolmý na u a analogicky také na v. Tím je určen jeho směr, nyní určíme orientaci a na závěr jeho velikost. Orientace je dána tím, že Vol(u, v, u x v) = (u x v, u x v) > 0 a je tedy (u,v,u x v) kladně orientovaná (za předpokladu, že se jedná o bázi; v opačném případě však u x v = 0 a jeho orientaci není potřeba určovat). Zbývá spočítat velikost u x v. Pomocí Gramová determinantu \u x v\2 = (u x v, u x v) = Vól(u, v,u x v) (u,u) (u,v) (v,u) (v,v) o o o 0 (u x v, u x v) 1/2 \u\2\v\2 1 \2\l/2 1 1 (u, v) ) -\ux v\ Pomocí úhlu a mezi vektory u, v dostáváme finální vztah \u x v\ = \u\\v\ sin a. Tentokrát není možné přiřadit úhlu a orientaci jako v rovinném případě. 83 9. Determinanty, objemy a orientace Věta 9.3. Vektorový součin má následující vlastnosti (které ho jednoznačně určují) • Vektorový součin — x — je antisymetrické bilineární zobrazení. • Vektor u x v je kolmý na u a v. • Vektor u x v je nenulový, právě když jsou u, v lineárně nezávislé a pak • báze (u, v, u x v) je kladně orientovaná. • Platí \u x v\ = \u\\v\sin<(u, v). 9.4. Vztah kvaternionů a orientovaného objemu Obecně můžeme říct, že objemová forma je kompatibilní se skalárním součinem, jestliže I Vol(ui,..., un)\ = \ui \ ■ ■ ■ \un\ kdykoliv u\,..., un tvoří ortonormální systém vektorů. Nad M je pak objemová forma Vol určena jednoznačně až na znaménko (orientaci), nad C jednoznačně až na násobek komplexní jednotkou. Jednoduchou modifikací ortonormální báze lze najít takovou ortonormální bázi, jejíž objem je roven 1. Standardní báze W1 a Cn jsou příklady takových bází. Zabývejme se prvně krátce situací v reálné Eukleidovské rovině £2. Objemová forma je Vol: £2 x £2 R, kterou můžeme díky skalárnímu součinu přepsat jako Vol(u, v) = (Iu, v). Protože je objemová forma kompatibilní se skalárním součinem, máme Vol(ei, ei) = 0, Vol(ei, e2) = 1, Vol(e2, ei) = -1, Vol(e2, e2) = 0 a tedy Ie\ = e2, 7e2 = —e\. Díky tomu I2 = — id a zobrazení / zadává na V strukturu komplexního vektorového prostoru: v (a + bi) = va + I(vb) (samozřejmě, / je rotace o 90° v kladném směru). Nyní se zabývejme stejnou situací v „komplexní Eukleidovské rovině" £^- Předpokládejme, že skalární součin je lineární v druhé složce a tzv. „konjugovaně lineární" v první složce, tj. platí (au, v) = a(u, v). Objemová forma je Vol: £2 x £2 —> C, kterou můžeme díky skalárnímu součinu přepsat jako Vol(u, v) = (Ju, v). Tentokrát je J: —> £2 konjugovaně lineární, (J(ua),v) =Yo\(ua,v) = a\o\(u, v) = a(Ju,v) = ((Ju)a,v), tj. J{ua) = (Ju)ä. Z kompatibility se skalárním součinem Je± = e2, Je2 = — e\ a proto J2 = — id (druhá iterace už je lineární) a zobrazení J zadává na £2 strukturu kvaternio-nického vektorového prostoru: definujme kvaternionickou algebru H jako podalgebru generovanou /, J £ Hom^V, V), kde I = iE je násobení imaginární jednotkou i. Ukážeme, že jako vektorový prostor je generovaná E, I, J, K = IJ: už víme, že platí I2 = J2 = —E, IJ = —JI = K, počítejme nyní K2 = —JUJ = J2 = —E a obdobně JK = —KJ = /, KI = -IK = J. Platí Ee\ = e\, le\ = e\i, Je\ = e2, Ke\ = e2i 84 9. Determinanty, objemy a orientace a tedy zobrazení H —> £^ , Q >—> Qc\ je izomorŕismus. Obrazy E, I, J, K značíme postupně 1, i, j, k a v dalším budeme o H uvažovat jako o prostoru M4 = k] společně s násobením daným výše uvedenými vztahy. 1 i j k 1 1 i j k i i -1 k -j j j -k -1 i k k j —i -1 9.5. Dodatek ke geometrii v prostoru V této části dáme do souvislosti geometrii v prostoru s kvaterniony. Připomeňme, že kva-terniony vzniknou z komplexních čísel přidáním jednotky j, která antikomutuje s komplexní jednotkou i, tj. platí ij = —ji, a splňuje i2 = j2 = —1. Označme k = ij. Potom máme následující q = (a + xi) + (y + zi)j = a + (xi + y j + zk). Číslo a nazveme reálnou částí kvaternionu q a v = xi + y j + zk jeho vektorovou částí; lze totiž tuto část ztotožnit s vektorem (x, y, z) g M3. Chápeme proto komplexní jednotky i, j, k jako vektory standardní báze. Pro jejich součin platí výše uvedená tabulka, díky níž se snadno ověří, že v ■ w = —(v,w) + v x w. Jelikož je skalární součin komutativní a vektorový součin antikomutativní, dostáváme snadno vztahy (v, w) = —^{vw + wv) = — Re(uv), v x w = ^(vw — wv) = Im(uv). Orientovaný objem Vól(u,v,w) získáme jako reálnou část Vol(u, v, w) = —j(uvw — vuw + wuv — wvu) = — Ke(uvw). Zabývejme se nyní inverzí kvaternionu q = a+v. K tomu nám poslouží konjugovaný kvaternion q* = a — v. Platí q*q = (a — v)(a + v) = aa — vv = aa + (v, v) = \a\2 + \v\2 = \q\2 a tedy q^1 = \q\~2q*. Zejména, pokud je q jednotkový kvaternion, tj. \q\ = 1, dostáváme q^1 = q*. Kvaterniony mají také goniometrický tvar; my si vystačíme s jednotkovými kvaterniony, pro něž platí q = cos tp + v sin tp, kde ip g [0,7r] a v g M3 je jednoznačně určený jednotkový vektor s výjimkou q = ±1, tj. ip g {0,7r}, kdy není určený vůbec. Občas je také výhodné zapisovat ef° = cos ip + v sin ip. Tento vztah dává smysl zejména, když výraz vlevo rozvineme do Taylorovy řady a využijeme vztahu v2 = — \v\2 = —1. Pro inverzní kvaternion platí (e^)-1 = e-^. 85 9. Determinanty, objemy a orientace Poznámka. Obecně pak platí vztah log(evew) = v + w+ vxw + -- - a známé pravidlo pro násobení mocnin v kvaternionech neplatí - důvodem je, že nejsou komutativní. Dva ryze imaginární kvaterniony komutují, vw = wv, právě když v \\ w a antikomutují, vw = —wv, právě když v _L w. Lze proto spočítat pro v \\ w což znamená, že vektor w se touto konjugací zachovává. Naopak pro v _L w platí we-Pv = ^(cos tp — v sin tp) = (cos tp + v sin ip)w = e^w a proto é^we-^ = é^é^w = e2^vw = (cos2^)w + (sm2p>)v x w. Vektor v x w je kolmý jak na v, tak na w a má stejnou velikost jako w. Leží tedy épvwe~Lpv na kružnici procházející w a v x w a nachází se od w vzdálen o úhel 2tp. Ve výsledku tak konjugace épv geometricky odpovídá rotaci o úhel 2tp okolo osy dané vektorem v. Z těchto úvah plyne poměrně praktický popis toho, jak spočítat složení dvou rotací. Příklad. Nechť například R je rotace okolo osy x o úhel 60° a S je rotace okolo osy z o úhel 90°. Potom R odpovídá konjugaci kvaternionem e71"/6'* a S konjugaci e7T^4'k. Jejich složení SR je potom dané kvaternionem e*/4-ke*/6-i = (72/2 + 72/2 • fc)(v/3/2 + 1/2 • i) = 76/4 + V2/4 • i + V2/4 • j + 76/4 • k. Ve výsledku se tak jedná o rotaci okolo osy dané vektorem (1,1, y/Š) o úhel 2 arccos(\/6/4). Poznamenejme, že tento příklad lze počítat také pomocí matic. Složení dvou zadaných rotací má matici u 2 2 10 0. V° 4 \) Vlastní vektor příslušný vlastnímu číslu 1 je (l,l,\/3), jak se snadno spočítá, a stopa této matice je | = 1 + (cos ip + i sin ip) + (cos ip — i sin ip) = 1 + 2 cos ip, z čehož vychází ip = arccos(—^). Těžší je zjistit, jestli se jedná o rotaci v kladném či záporném směru. Podobně se dají reprezentovat reflexe. Zobrazení w 1—> vwv je na vektorech v \\ w rovno vwv = vvw = —w a na vektorech v _L w rovno vwv = —vvw = w. /I o 0 \ \o 4 o \ 2 \) 86 9. Determinanty, objemy a orientace Jedná se tedy o reflexi vzhledem k rovině kolmé na vektor v (opět předpokládáme, že \v\ = 1). Zabývejme se nyní tím, co se stane při složení dvou reflexí, prvně podle roviny kolmé na v a poté podle roviny kolmé na v'. Dostaneme w i—> v'vwvv' = (—v'v)w(—vv') = ((v', v) — v' x v)w((v, v') — v x v'), tj. rotaci okolo vektoru v x v' = —v' x v o úhel 2 arccos(?j, v'). 87 10. Smithův normální tvar celočíselných matic 10.1. Celočíselné matice Celočíselná matice tvaru n x m je kolekce celých čísel A = {á1-) indexovaná dvojicemi i = 1,... ,n a j = 1,... ,m. Píšeme A G Matnxm^- Celočíselné matice odpovídají homo-mornsmům grup: Lemma 10.1. Homomorfismy grup 7Lm —> 7Ln odpovídají přesně celočíselným maticím typu m x n. Homomorfismus příslušný matici A G MatnxmZ je x i—> Ax. Důkaz. Každý homomorfismus grup p: 7Lm —> Tli1 je jednoznačně určen obrazy p{e\),..., p{em) které ale můžou být libovolné: p{x1, ...,xm)= p{e1x1 + ■■■+ emxm) = pie^x1 + ■■■ + p(em)xm (p^) ■ ■ ■ p(em)) □ \xm) Naším cílem bude nyní každý takový homomorfismus reprezentovat „ve vhodných bázích" co nejjednodušší maticí. Bude nás tedy zajímat nalezení invertibilních matic P a Q takových, že PAQ^1 je co nejjednodušší. Stejně jako v případě vektorových prostorů jsou invertibilní matice součinem „elementárních matic", tj. matic odpovídajícím řádkovým/sloupcovým operacím, jen musíme dávat pozor na násobení řádků a sloupců. Jediné operace tohoto typu, které jsou invertibilní, jsou totiž násobení ±1. V dalším proto budeme za řádkové operace považovat pouze: přičtení násobku jednoho řádku k druhému, prohození dvou řádků a vynásobení řádku číslem —1. To samé samozřejmě platí pro sloupcové operace. Obecně máme následující charakterizaci: Lemma 10.2. Celočíselná matice A je invertibilní, právě když je čtvercová a její determinant je roven ±1. Důkaz. Prvně si uvědomme, že libovolná celočíselná inverze je zároveň inverzí nad Q a proto musí být matice A čtvercová (s nenulovým determinantem). Zároveň 1 = det E = det(AA_1) = det A • det A'1 a, jelikož A^1 je celočíselná, musí být také celočíselný její determinant, det A^1 G Z. Proto det A = ±1. Nechť naopak A je čtvercová, jejíž determinant je ±1. Potom inverzní matici můžeme spočítat pomocí matice algebraických doplňků: A — det A ^adj a je celočíselná. □ Poznámka. Podobný důkaz funguje nad libovolným komutativním okruhem R (to by mělo být zřejmé alespoň pro obor integrity, kde Q je nahrazeno podílovým tělesem): matice A G Matnxm R je invertibilní, právě když je čtvercová a det A G Rx je invertibilní. Komutativita okruhu R je důležitá - bez ní by jednak nebylo možné definovat determinant a navíc existují okruhy s invertibilními obdélníkovými maticemi! 88 10. Smithův normální tvar celočíselných matic Věta 10.3 (o Smithově normálním tvaru). Pro libovolnou celočíselnou matici A existují invertibilní celočíselné matice P a Q takové, že (qi o 0 q2 P-1AQ Vo ......... •••/ kde q± \ q2 \ • • • \ qr se postupně dělí. Čísla qi se nazývají invariantní faktory, pravá strana se nazývá Smithův normální tvar celočíselné matice A. Každý jiný takový se liší pouze znaménky qí. Konkrétněji platí qi = di/di-i, kde di = gcdjdet S \ S je submatice A tvaru i x i} Poznámka. Je tedy vhodné vyžadovat qi > 0 a tyto jsou potom určené zcela jednoznačně. V dalším budeme vždy tuto volbu preferovat. Důkaz. Hlavním krokem je pomocí řádkových a sloupcových operací vyrobit v levém horním rohu největší společný dělitel všech prvků matice, dále pomocí něj vyeliminovat všechny prvky pod ním a vpravo od něj a následně použít indukci. Základním krokem je vytvoření největšího společného dělitele prvků ležících v témž řádku nebo sloupci. K tomu budeme využívat Eukleidův algoritmus, který spočítá největšího společného dělitele následujícím způsobem: jsou-li a, b nenulová celá čísla taková, že \a\ > vydělíme číslo a číslem b se zbytkem, a = qb + r. Potom gcd(a, b) = gcd(6, r). Nahrazením dvojice (a, b) dvojicí (6, r) se tedy největší společný dělitel nezmění. Navíc po konečném (ve skutečnosti velmi malém) počtu kroků vyjde r = 0; potom příslušné b v tomto kroku je hledaný největší společný dělitel. Pokud se vyskytují a, b v jednom sloupci, můžeme výše popsaný algoritmus realizovat pomocí řádkových operací a nahradit tak tyto dva prvky dvojicí (d, 0), kde d je největší společný dělitel a, b. To samé lze aplikovat na výskyt a, b v temže řádku pomocí sloupcových operací. 1. Vraťme se nyní k naší matici A. Prvně přesuňme na pozici (1,1) pomoci operací libovolný nenulový prvek matice A (rozmyslete si zvlášť případ A = 0). V dalších krocích se bude vždy prvek na této pozici zmenšovat, díky čemuž bude náš algoritmus konečný. 2. Pomocí Eukleidova algoritmu a jeho implementace pomocí řádkových a sloupcových operací můžeme dosáhnout toho, že prvek v levém horním rohu je jediný nenulový prvek v prvním řádku a prvním sloupci, tj. dostaneme matici tvaru 0 A 89 10. Smithův normální tvar celočíselných matic 3. Pokud by nyní prvek a\ nedělil nějaký prvek a*- matice A, můžeme jej pomocí přičtení řádku dostat do prvního řádku a pomocí kroku 2. opět na pozici (1,1) vyrobit menší prvek. Po konečném počtu kroku tak vznikne matice blokového tvaru qi o\ o A'J' v níž bude prvek q± v levém horním rohu dělit všechny prvky matice A'. 4. Na submatici A' můžeme použít indukční předpoklad a převést ji na Smithův normální tvar s invariantními faktory q2,...,qr. Protože q± dělil všechny prvky A', dělí i q2 (podle indukčního předpokladu je to největší společný dělitel všech prvků A') a tím pádem q± \ q2 \ ■ ■ ■ | qr tak, jak požadujeme. Zbývá dokázat jednoznačnost; ta bude plynout z invariantnosti di vůči řádkovým/sloupcovým operacím a z jednoduchého výpočtu největších společných dělitelů di pro matici ve Smithově normálním tvaru, kterým začneme. Zřejmě, pokud submatice obsahuje k-tý řádek, nikoliv však k-tý sloupec matice ve Smithově normálním tvaru, pak její determinant je nulový (jelikož obsahuje nulový řádek). Proto stačí uvažovat submatice složené z nějakých řádků a týchž sloupců. Ty jsou diagonální a jejich determinant je roven součinu prvků na diagonále - libovolných i prvků diagonály. Tedy největší společný dělitel je di = gcd{qkl ■■■qki \ 1 < fa < ■ ■ ■ < fa < r} = qi ■ ■ ■ qi a vskutku platí qi = di/di-i pro matici ve Smithově normálním tvaru. Zbývá dokázat invarianci největšího společného dělitele di vzhledem ke sloupcovým operacím. Uvažujme tedy „starou" a „novou" matici, kde nová vznikne ze staré pomocí sloupcových operací (zatím ne nutně invertibilních). Zřejmě každý sloupec každé nové submatice je celočíselnou kombinací starých sloupců a její determinant je tedy celočíselnou kombinací starých subdeterminantů; zejména je každý nový subdeterminant dělitelný největším společným dělitelem di starých subdeterminantů a zejména je nové di dělitelné starým di. Pokud byly operace invertibilní, lze také starou matici vyrobit z nové a proto je i staré di dělitelné novým di a tudíž se rovnají. □ Poznámka. Není špatné si povšimnout, že z existenční části plyne, že každá invertibilní matice je součinem elementárních matic, neboť jediná invertibilní matice ve Smithově normálním tvaru je jednotková matice, tedy P~ľAQ = E a A = PQ^1, a v převodu na Smithův normální tvar jsme používali pouze elementární matice. Smithův normální tvar je vhodný k algoritmickým výpočtům s komutativními grupami. Platí totiž následující vztahy im A = [qi ■ Pe\,..., qr ■ Per] ker A = [Qer+1,.. .,Qem], tedy obraz i jádro homomorfismu A lze jednoduchým způsobem získat ze sloupců matic P a Q a z invariantních faktorů qi. 90 10. Smithův normální tvar celočíselných matic 10.2. Prezentace konečně generovaných komutativních grup Nechť M je komutativní grupa. V následujícím budeme komutativní grupy uvažovat vždy aditivně, tj. grupovou operaci budeme značit +, jednotku 0 a inverzi prvku a značíme —a. Nechť k G Z a a G M. Definujme a ■ k jako 0, pokud k = 0, jako a + • • • + a pokud k > 0 a jako ( — k) ■ (—a), pokud k < 0. Toto označení by čtenáři mělo být známe z multiplikativního zápisu ak, kde značí přesně to stejné. Výhodou tohoto zápisu je, že v každé (komutativní) grupě umíme automaticky násobit celými čísly, můžeme se tedy bavit o celočíselných kombinacích a používat okamžitě některé další pojmy z vektorových prostorů. Nechť cii,..., an £ M jsou libovolné prvky komutativní grupy M. Uvažujme následující homomorfismus grup p:Zn^M, (x1,... ,xn) ^ aix1 H----anxn. Lemma 10.4. Zobrazení p je skutečně homomorfismus grup. Navíc platí 1. p je surjektivní, právě když prvky a±,... ,an generují M. 2. p je injektivní, právě když jsou prvky a±,... ,an „lineárně nezávislé nad Z". □ Omezme se nyní na situaci, kdy prvky a±,... ,an generují M. Potom je p podle předchozího surjektivní a z algebry známe následující fakt, M ^ Zn/kerp, nazývaný první věta o izomorfismu. K pochopení konečně generovaných komutativních grup bude tedy dobré zkoumat grupu Zn a její podgrupy. Věta 10.5. Každá podgrupa Zn je opět konečně generovaná a ve skutečnosti izomorfní Zm pro nějaké m opět konečně generovaná komutativní grupa a můžeme tedy najít další surjektivní homomorfismus Zavedeme-li pro složení Zm —> ker p> TU1 označení R, budeme vzniklou situaci zapisovat Zm Zn M. V každé takové posloupnosti budeme vyžadovat, aby p> byl surjektivní homomorfismus grup a ker p> = im R. Potom dostáváme izomorfismus M ^ Zn/ker(^ = Zn/imR. Všimněme si, že pravá strana Zn/imi? závisí pouze na homomorfismu (matici) R. Říkáme proto, že R prezentuje komutativní grupu M. Poznámka. Prezentace grupy M lze definovat konkrétněji pomocí generátorů M a relací mezi nimi. Generátory e±,..., en grupy Zn odpovídají (zvoleným) generátorům a±,..., an grupy M a generátory grupy Zm budou odpovídat relacím mezi a±,..., an. Obrazy generátorů e j g 7Lm jsou nějaké celočíselné kombinace R(ej) =eir) + --- + enr™. Z podmínky ker p> = im R plyne, že analogické kombinace aiVj H-----h anrr- = 0 jsou nulové. To jsou přesně ony zmiňované relace mezi generátory M a M je v jistém smyslu „nejobecnější" komutativní grupa s generátory ai,...,an splňujícími tento systém relací. Přesněji, je-li ./V jiná komutativní grupa s prvky b±,..., bn splňujícími tytéž relace hr] + • • • + 6nr™ = 0, existuje jediný homomorfismus grup M —?► N posílající aj na 6j. Tento fakt nebudeme dokazovat, poznamenejme ale, že plyne (celkem snadno) z univerzální vlastnosti kvocientu 7Ln j im i?. 92 10. Smithův normální tvar celočíselných matic Konečně generované komutativní grupy jsou ve výsledku prezentovány celočíselnými maticemi. Nyní ukážeme, že ze znalosti Smithova normálního tvaru lze prezentovanou grupu zcela zrekonstruovat, samozřejmě až na izomorfismus. Obecněji se zabývejme případem ekvivalentních matic a jimi prezentovaných komutativních grup Z n -> M 1 Q s P 1 z m—>z n —v N Tvrdíme, že naznačený homomorfismus M —» N existuje a je to navíc izomorfismus. Prezentované grupy můžeme ztotožnit s kvocienty podle obrazů a hledáme tedy homomorfismus Zn/imR^Zn/imS. Ten lze jednoduše definovat předpisem i + imfí^ Px + imS. Jelikož se každý jiný reprezentant třídy x+imfí liší od x o prvek tvaru Ry, příslušná pravá strana se změní o třídu prvku PRy = SQy £ im S* a zůstane proto stejná - zobrazení je dobře definované. Inverzní zobrazení je určené týmž předpisem s P nahrazeným P-1. Tento výsledek lze vyjádřit heslem: izomorfní prezentace určují izomorfní grupy. Zabývejme se nyní tím, jakou grupu prezentuje matice ve Smithově normálním tvaru. Lemma 10.6. Je-li S ve Smithově normálním tvaru s nenulovými prvky q±\ ■ ■ ■ \qr na diagonále, pak Zn/ im S -=-► Z/qi x • • • Z/qr x Zn-'r Důkaz. Potřebné zobrazení se definuje snadno (x\...,xn)+imS^([x1},...,[xrlxr+1,...,xn) a je jednoduché ověřit, že se jedná o dobře definovaný homomorfismus grup. Stejně snadno se definuje i inverzní zobrazení. □ V kombinaci s předchozími úvahami dostáváme první část následující věty. Věta 10.7. Každá konečně generovaná komutativní grupa je izomorfní součinu cyklických grup (1) Z/qi x • • • x Z/qr x Zk, kde 1 7^ qi \ ■ ■ ■ \ qr. Dvě takové grupy jsou izomorfní, právě když se rovnají odpovídající řády qi,..., qr konečných cyklických faktorů a exponenty k beztorzních částí. Důkaz. Existenční část plyne z toho, že každá konečně generovaná komutativní grupa má prezentaci a taje ekvivalentní prezentaci ve Smithově normálním tvaru. Činitele tvaru Z/l = 0 můžeme vynechat. nd Jednoznačnost se dokáže následovně. Jsou-li dvě grupy tvaru (1) izomorfní, musí být izomorfní i jejich torzní části Zjq\ x • • • x Z/qr. Přitom qr je řád největší konečné cyklické 93 10. Smithův normální tvar celočíselných matic podgrupy a musí být tedy stejný pro obě grupy. Součin zbylých konečných cyklických grup je kvocient torzní části podle její největší cyklické podgrupy a musí být tedy opět izomorfní pro obě grupy. Podle indukčního předpokladu se musí rovnat všechna odpovídající q±,... ,qr-i-Kvocient podle torzní části je roven Zk a opět musí být tato grupa izomorfní odpovídající grupě 7jk . Tento izomorfismus je zprostředkován invertibilní maticí. Jelikož každá taková musí být nutně čtvercová, dostáváme k = k'. □ Poznámka. V tom důkazu jednoznačnosti je díra (největší cyklická podgrupa není jednoznačná a není jasné, proč by měl existovat izomorfismus velkých grup převádějící jednu na druhou), asi to chce fakt dělat přes vnější mocniny, viz níže. Alternativní věta dává rozklad každé konečně generované komutativní groupy na součin cyklických grup, jejichž řád je mocninou prvočísla. To snadno plyne opět ze Smithova normálního tvaru: jelikož je grupa Z/pkl x • • • x Z/p^r prezentována diagonální maticí s čísly pkl,... ,p^r na diagonále a tato má invariantní faktory 1,..., l,^1 • • -pkrr (jelikož dr_i = 1), platí Z/p'l1 x • • • x Z/pf = Z/p'l1 ---pf (tomuto tvrzení se také říká Čínská zbytková věta). V opačném směru pak lze každou cyklickou grupu rozložit na součin cyklických grup, jejichž řád je mocninou prvočísla. Tento rozklad je také jednoznačný. ** 10.3. Poznámky Je-li M konečná, lze dát invariantnímu faktoru qn následující význam. Jedná se o nejmenší číslo t, pro které M ■ t = 0, tedy nejmenší číslo dělitelné řádem každého prvku. Poněkud abstraktněji definujme Ann(M) = {i £ Z | M • í = 0}, anihilátor komutativní grupy M. Jedná se vždy o podgrupu a platí Ann(M) = qn ■ 7L. Podobnou iterpretaci lze dát s trochou práce i zbývajícím invariantním faktorům, konkrétně Ann^+^M) = q,t ■ Z, k tomu je však potřeba definovat vnější mocniny komutativních grup, což značně přesahuje obsah kurzu. Vzhledem k jednoznačnosti z předchozí věty můžeme zformulovat jednoznačnost prezentace konečně generované komutativní grupy. Pro každé dvě prezentace musí jejich Smithovy normální tvary být shodné až na jedničky na diagonále (ty zhruba řečeno odpovídají přidání nového generátoru x společně s relací x = 0) a nadbytečné nulové sloupce (ty zase odpovídají relacím, které lze odvodit z ostatních relací). Mají-li matice R, S stejné rozměry, pak prezentují stejnou grupu, právě když jsou ekvivalentní (ve smyslu, že je lze na sebe převést řádkovými a sloupcovými úpravami). 94 11. Smithův normální tvar polynomiálních matic 11.1. Polynomiální matice Polynomiální matice tvaru n x m je kolekce polynomů A indexovaná dvojicemi i 1,... ,n, j = 1,... ,m. Tedy ď- je polynom, přesněji polynom s koeficienty v tělese K a v proměnné A. Píšeme A £ MatnxmK[A]. Lemma 11.1. Polynomiální matice A je invertibilní, právě když je čtvercová a její determinant je nenulový konstantní. Důkaz. Důkaz se provede stejně jako pro celočíselné matice. □ Věta 11.2 (o Smithově normálním tvaru). Pro libovolnou polynomiální matici A existují invertibilní polynomiální matice P a Q takové, že 0 P-XAQ 0 Q2 0\ \o ............ 0 OJ kde Qi\q2\~ "\Qr se postupné dělí. Polynomy qi se nazývají invariantní faktory, pravá strana se nazývá Smithův normální tvar polynomiální matice A. Každý jiný takový se liší pouze vynásobením qi nenulovou konstantou. Konkrétněji platí qi = di/di-i, kde di = gcdjdet S \ S je submatice A tvaru i x i} Důkaz. Důkaz se provede stejně jako pro celočíselné matice; jeho základem byl Eukleidův algoritmus, který funguje i pro K [A]. □ Opět můžeme vyžadovat polynomy qi normované, dostaneme pak Smithův normální tvar zcela jednoznačně. Poznámka. Je zajímavé se zamyslet nad tím, které (komutativní) okruhy umožňují Smithův normální tvar. Potřebujeme nějakou formu Eukleidova algoritmu a pro tzv. Eukleidovské obory (obory integrity s Eukleidovým algoritmem) není naprosto žádný problém. Ve skutečnosti lze tuto větu zobecnit na obory hlavních ideálů (obory integrity, kde každý ideál je hlavní), nevystačíme si však již s elementárními operacemi: k vyrobení největšího společného dělitele nestačí odčítat násobky, ale jsou potřeba obecnější (invertibilní) lineární kombinace. Ve výsledku se dá ukázat, že nad obory hlavních ideálů již není každá invertibilní matice součinem elementárních. Rozdíl mezi invertibilními maticemi a součiny elementárních matic je jedním z důležitých aspektů studovaných algebraickou K-teorií okruhu R. Ta je velmi důležitá v rozličných odvětvích matematiky - od geometrie, přes algebru až k teorii čísel. 95 11. Smithův normální tvar polynomiálních matic Stejně jako celočíselné matice měly vztah ke konečně generovaným komutativním grupám a jejich prezentacím, mají také polynomiální matice vztah k nějakým matematickým objektům a jejich prezentacím. Pokusme se jejich definici motivovat následujícím porovnáním číselné matice A G MatnxmK lineární zobrazení Km —> Kn celočíselné matice A G MatnxmZ homomoríismy grup Zm —> TU1 polynomiální matice A G MatnXm K[X] homomoríismy ??? K[X]m -+ K[X] n Definice 11.3. Nechť M je komutativní grupa. Řekneme, že M je K.[X]-modul, jestliže je zadáno zobrazení K[X] x M —^ M, (p,x)h+p-x, nazývané „násobení skaláry", splňující obvyklé axiomy vektorového prostoru p • (q • x) = (p • q) • x 1 • x = x p ■ (x + y) = p ■ x + p ■ y {p + q) ■ x = p ■ x + q ■ x Příklad. Důležitým K[A]-modulem je K[A]n, tj. množina všech n-tic polynomů společně se sčítáním po složkách a násobením po složkách P • (qi, ...,qn) = (pqi, ■ ■ -,pqn) Každý K[A]-modul M je automaticky vektorovým prostorem nad K: když umíme prvky M násobit polynomy, umíme je zejména násobit konstantními polynomy, které lze jednoduše ztotožnit s prvky tělesa K, lze psát K^K[X\. Zároveň násobení lineárním polynomem A je zobrazení m\ : M —> M, x \—> X ■ x, o kterém ověříme, že se jedná o lineární zobrazení: m\(ax + by) = A • ax + A - by = (aX) • x + (bX) • y = a{m\x) + b{m\y) Věta 11.4. Předchozí konstrukce zadává bijektivní korespondenci {K[X]-moduly M} í*"0*** ^T*'1^* je vektorový\ [prostor a 1 : V —^ V je operátor J M i-> (M, m x) V <-1 (V, T) V dalším budeme pro operátor T na vektorovém prostoru V používat pro odpovídající K[A]-modul označení (V,T). 96 11. Smithův normální tvar polynomiálních matic Důkaz. Zbývá ukázat, jak se pro operátor T: V —> ľ na vektorovém prostoru V definuje násobení skaláry z K[A]. Má-li se jednat o inverzi ke konstrukci (M, m\), jsme nuceni položit px = (p0 + pi\ -\-----h pkXk)x = pqx + piTx H-----h pkTkx, kde T*x značí i-násobnou iteraci operátoru T, tj. = (T o • • • o T)x = T(- • • T{Tx) ■■■)■ je totiž Vx = A(- • • X{Xx) • • •) = T(- • • T(Tx) • • • )• □ Z předchozího důkazu si zapamatujme vztah pro násobení polynomem p na K[A]-modulu (V,T). Budeme ho zapisovat ve tvaru p ■ x = p(T)x, kde p(T) značí, tak jako v důkazu, výsledek formálního dosazení operátoru T do polynomu p, tj. p(T) = po Id +PlT + ■■■+ pkTk. Poznámka. Výhodou uvažování K[A]-modulů namísto operátorů je to, že základním stavebním kamenem (konečně generovaných) K[A]-modulů je K[A]n (jak za chvíli uvidíme), který je jako vektorový prostor s operátorem nekonečně rozměrný a tedy z pohledu lineární algebry dost netypický. Konkrétně K [A] jako vektorový prostor je {(a0,ai,...) \ 3k e N0: VI > k: ai = 0}, množina posloupností čísel (odpovídajících posloupnostem koeficientů polynomů), která jsou od jistého indexu počínaje všechna nulová. Operátor je pak dán (a0,ai,...) i-)- (0,a0,ai,...) Dalším přirozeným pojmem je homomorfismus K[A]-modulů, který je přímou analogií lineárního zobrazení. Definice 11.5. Nechť M, N jsou dva K[A]-moduly. Zobrazení tp: M —> N se nazývá homo-morfismem 'K[X]-modulů, jestliže platí p(x + y) = p(x) +tp(y), p(px)=pp(x). pro libovolná x, y g M a p g K[A]. Opět převedeme tento pojem do řeči operátorů. Je zřejmé zúžením definiční podmínky na konstantní polynomy, že každý homomorfismus K[A]-modulů je lineárni zobrazení. Tvrzení 11.6. Nechť jsou dány operátory T na V a S na U. Lineární zobrazení p: V —> U je homomorfismus 'K[X]-modulů, právě když komutuje následující diagram. 97 11. Smithův normální tvar polynomiálních matic Důkaz. Jelikož je tp lineární, zachovává násobení všemi konstantními polynomy. Zbývá tedy zkontrolovat zachovávání násobení polynomem A, ale to jsou přesně operátory v diagramu. □ V případě, že je p invertibilní, lze předchozí diagram přepsat jako S = pTp^1, tj. operátory S, T jsou podobné. Vraťme se k naší původní motivaci s polynomiálními maticemi. Lemma 11.7. Nechť ai,...,an g M jsou libovolné prvky K[A]-modulu M. Pak existuje jediný homomorfismus ¥^[\]-modulů tp: K[A]n —> M splňující p (ej) = aj, kde ej je opět n-tice polynomů (0,..., 0,1, 0,..., 0) s konstantním polynomem 1 na i-tém místě. Speciálně homomorfismy ¥^[\]-modulů K[A]m —> K[A]n jsou v bijekci s polynomiálními maticemi A g MatnxmK[A], jejímž i-tým sloupcem je právě obraz ej. Příslušný homomorfismus je dán x \—> Ax. Důkaz. Vše je jasné z rovnosti p{p\ ...,pn)= p>{expx + • • -enpn) = (^(ei)p1 + • • • + p{en)pn = aip1 -\-----h anpn. Naopak výsledný vzorec je homomorfismus K[A]-modulů pro libovolné &1,..., an g M. □ V dalším se nám ještě budou hodit kvocienty K[A]-modulů. Nechť M je K[A]-modul. Podmodul N C M je podmnožina uzavřená na nulu, sčítání a násobení skaláry. Zejména je N podgrupa vzhledem ke sčítání. Na kvocientu grup M/N definujeme strukturu K[A]-modulu následovně: {x + N) ■ p = xp + N Je jednoduché ověřit, že se jedná o dobře definované zobrazení, které splňuje všechny axiomy K[A]-modulu. * 11.2. Kanonická prezentace operátoru na Kn Nechť T: Kn —> Kn je operátor na Kn a uvažujme příslušný K[A]-modul (Kn, T). Narozdíl od situace pro konečně generované komutativní grupy existuje kanonická prezentace (tj. taková, která nezávisí na žádných volbách). Uvažujme homomorfismus K[A]-modulů ej, kde na levé straně je ej interpretováno jako n-tice polynomů, zatímco na pravé straně jako n-tice čísel8. V obou případech se jedná o n-tici složenou z 1 na i-tém místě a z 0 na zbylých místech. Zřejmě je tp surjektivní zobrazení, popíšeme nyní jeho jádro a dostaneme tím prezentaci pro (Kn,T). Tvrzení 11.8. Nechť T je operátor na Kn. Potom K[X]n T~XE > K[A]n (Kn, T) je prezentace příslušného K.[\]-modulu. 8Alternativní pohled na prvky K[A]n je jako polynomy s koeficienty v K". Zobrazení je pak dáno předpisem u0 + A«i H-----h \kvk i-> «o + Tví H-----h Tkvk. 98 11. Smithův normální tvar polynomiálních matic Důkaz. Zbývá ukázat, že im(T — XE) = ker p. Zaprvé platí p o (T — XE) = 0, neboť pro generátory G K[A]n platí ^ o (T - AS)(ei) = p(Tei - Xei) = Ta - Ta = 0. Proto im(T — A-E) C ker KÍMn-> K[A]n/ im S(X) S(X) Opět se jednoduše přesvědčíme, že K[A]7imiS(A) ^ K[X]/(qi) x • • • x K[X]/(qn), kde q± \ ■ ■ ■ \qn jsou polynomy vyskytující se na diagonále Smithova normálního tvaru S(X). Věta 11.9. Dva operátory T, T' jsou podobné, právě když polynomiální matice T — XE, T' — XE mají týž Smithův normální tvar. Zejména lze problém podobnosti řešit algoritmicky. Poznámka. Nad algebraicky uzavřeným tělesem lze problém podobnosti „řešit" s pomocí Jordánova kanonického tvaru. Algoritmicky je však tento přístup nevhodný, protože obecně nelze spočítat vlastní čísla a tím pádem ani Jordánův kanonický tvar. Na druhou stranu Smithův normální tvar je zcela algoritmický. Důkaz. Jsou-li operátory T a T' podobné, T' = PTP^1, budou podobné i T' - XE = P(T - XE)P-1. Tím spíš budou ekvivalentní a proto budou mít týž Smithův normální tvar. Nechť naopak T — XE, T' — XE mají týž Smithův normální tvar. Potom jsou ekvivalentní a podle předchozího diagramu jsou izomorfní prezentované moduly (Kn,T) = (Kn, T'). To ale přesně znamená, že operátory jsou podobné podle Tvrzení 11.6. □ 99 11. Smithův normální tvar polynomiálních matic Poznámka. Výhodou oproti případu komutativních grup je existence kanonické prezentace. O něco obtížněji lze také dokázat, že dva K[A]-moduly prezentované libovolnými (v kontrastu s kanonickými) polynomiálními maticemi týchž rozměrů jsou izomorfní, právě když mají tyto matice týž Smithův normální tvar; viz případ komutativních grup. Místo Jordánova kanonického tvaru je možné popsat jiný kanonický tvar, který nevyžaduje nalezení kořenů charakteristického polynomu a lze jej spočítat algoritmicky. Jelikož je (Kn,T)^K[X]/(qi) x...xK[%), stačí popsat K[A]-modul K[A]/(g) jako vektorový prostor společně s operátorem. Nalezneme vhodnou (kanonickou) bázi a v ní matici příslušného operátoru m\. Nechť q = ao + a±X + • • • + ak-iXk 1 + Xk. Potom takovou bází je a = ([1], [A], • • • , [Afc_1]) a jednoduše ( 0 1 0 o o 0 1 -a0 \ -a-k-i) Tedy (Kn,T) má ve vhodné bázi blokově diagonální tvar s bloky výše uvedeného tvaru na diagonále. Tento tvar se nazývá racionální kanonický tvar operátoru - pro jeho kanoničnost je však nutno vyžadovat, aby se polynomy příslušné jednotlivým blokům postupně dělily tak jako ve Smithově normálním tvaru. Invariantní faktor qn má poměrně jednoduchou interpretaci v řeči K[A]-modulů, z níž lze jednoduše dokázat následující větu. Tvrzení 11.10 (Cayleyho-Hamiltonova věta). Nechť x(A) tický polynom T. Potom platí x{T) = 0. det(T — XE) značí charakteris- Důkaz. Z věty o Smithově normálním tvaru platí x = Qi • • • Qn- Přitom pro libovolné x€K[X]/(gi) x---xK[X]/(qn) zjevně platí qnx = 0. Protože je však tento K[A]-modul izomorfní (Kn, T), platí to samé i pro K[A]-modul (Kn,T). Pro libovolné v g Kn tak máme qn(T)v = 0. Protože ale toto platí pro libovolné v, musí být qn{T) = 0 jakožto operátory na Kn. Tím spíš tedy x(T) =0. □ Definice 11.11. Z důkazu předchozí věty plyne, že ve skutečnosti platí již qn{T) = 0 a není těžké se přesvědčit, že qn je nejmenší polynom (vzhledem k dělitelnosti), pro který tento vztah platí. Nazývá se minimální polynom operátoru T. Poznámka. Opět poněkud abstraktněji lze minimální polynom popsat následovně. Definujme anihilátor K[A]-modulu M jako Ann(M) = {p g K [A] | p ■ M = 0}. Není těžké se přesvědčit, že se vždy jedná o ideál a v našem případě je Ann(M) s trochou práce lze dát význam i zbylým invariantním faktorům, ). Opět AnntA-^M) 100 11. Smithův normální tvar polynomiálních matic kde například A^j^M je kvocient A2 M podle podprostoru generovaného rozdíly TxAy—xATy. Operátor na tomto kvocientu je zadán předpisem T[x A y] d= [Tx A y] = [x A Ty}. 11.3. Jordánův kanonický tvar Jelikož Smithův normální tvar T — XE zcela určuje operátor T až na podobnost, nemělo by být překvapením, že z něj lze spočítat Jordánův kanonický tvar T. Nechť proto nyní K je algebraicky uzavřené těleso. Potom každý cyklický modul K[A]/(g) lze psát s využitím rozkladu q = (A — Ai)ri • • • (A — Xk)Vk ve tvaru9 K[X]/(q) =■ K[A]/((A - AxD x • • • x K[A]/((A - Afc)rfe) (formální podobnost s rozkladem na prvočinitele není vůbec náhodná). Zbývá tedy popsat K[A]-modul tvaru K[A]/((A-Ao)r). Tvrzení 11.12. Cyklický 'K[X]-modul K[A]/((A — Ao)r) je izomorfní operátoru na W s maticí /A0 0 0\ 0 XqJ Důkaz. Jakožto vektorový prostor má K[A]/((A — Ao)r) bázi ([(A-A0)r-1])...)[A-Ao],[l]) Počítejme matici operátoru m\ (násobení polynomem A) vzhledem k této bázi. Zjevně platí A[(A - Aor1] = ((A - A0) + A0)[(A - Aq)^1] = [(A - A0)J] + A0[(A - Aoř1]. V případě i = r pak [(A — Ao)r] = 0 a dostáváme přesně matici z tvrzení. □ Věta 11.13. Je-li těleso K algebraicky uzavřené, je každý operátor podobný operátoru v Jordánově kanonickém tvaru. Obecněji tvrzení platí pro operátor T nad libovolným tělesem, nad kterým se charakteristický polynom T zcela rozkládá. □ Je-li T — XE ekvivalentní J — XE, řekněme J-XE = P(A)(T - XE)Q(X) 9Jednoduchý důkaz tohoto faktu využívá Smithův normální tvar - K[A]-modul napravo je prezentován diagonální maticí s mocninami (A — \i)ri na diagonále; její Smithův normální tvar má na diagonále 1,... , 1, q. 101 11. Smithův normální tvar polynomiálních matic (nyní u -P(A) nebudeme psát inverzi, protože v tomto tvaru dostaneme výsledek z algoritmu počítajícího Smithův normální tvar), lze spočítat matice přechodu mezi oběma operátory. Začněme s maticí přechodu od T k J. Tu dostaneme z následujícího diagramu K[\]'> t-xe >K[A] QW V]n<- - -*(Kn,T) I P(A) 1 Sž 1 R ^ eVj ■» (Kn, J) naznačené zobrazení Kn —> K[A]n zobrazí n-tici čísel na n-tici příslušných konstantních polynomů (a nejedná se o homomorfismus K[A]-modulů). Složením dostaneme pro P = p0 + APi + • • • + XkPk následující vyjádření pro matici přechodu R: v ^ evj(P(X)v) = PQv + JPlV + ■■■ + JkPkv = PMt(J)v, kde poslední zápis značí dosazení matice J do polynomiální matice -P(A) zleva. Matice přechodu v opačném směru lze získat buď jako inverzní matici k Pleft(J) nebo pomocí transponování všech matic (formálně přechodu k duálním prostorům). Konkrétně dostáváme diagram in i r K[A]ní—^> K[A] P*(A) K[X]r ;(Kn,r*) I 0* (A) s 15* J*-\e >K[\y ■+(Kn,J*) nebo jednodušeji rovnici J* -XE = Q*{X){T* - XE)P*{X) Podle předchozího dostáváme S* = (Q*)leít(J*) a zpětným transponováním S = ((Q*)left(J*))* = (Q*0 + J*Ql + ■■■ + {rfQlT = Qo + Qi J + • • • + QkJk = QTÍght(J). Jelikož je S matice přechodu od J k T, skládají se její sloupce z vektorů báze, v níž T nabývá Jordánova kanonického tvaru J. Matici Q(X) lze získat tak, že veškeré sloupcové operace provádíme zároveň na matici T — XE a na jednotkové matici (řádkové operace však pouze na T — XE). Pokud takto převedeme T — XE na J — XE, vytvoří sloupcové operace přesně matici Q(X). Dosadíme-li pak do ní matici J zprava, získáme hledanou matici přechodu S. Vhodnou adaptací lze výpočet zjednodušit. Není potřeba pomocí dalších operací převádět Smithův normální tvar na J — XE, neboť lze využít bázi K[A]n/imfíz důkazu Tvrzení 11.12, kde B je Smithův normální tvar T — XE. Uveďme si to na zásadním příkladu B /l 0 0 o \ 1 o (A - A0)7 102 11. Smithův normální tvar polynomiálních matic Potom forma fl na prostoru Kn vpravo nahoře se zobrazí na formu na K[A]n s týmž názvem, dále pak pomocí Q*(X) na flQ(X), tj. na i-tý řádek matice Q(X). Na závěr je potřeba spočítat, jakou formu na Kn v pravém dolním rohu tato reprezentuje. Vyjádříme ji proto ve tvaru10 modulo imi? = (f1,..., /r_1, fr(X — Ao)r). Matice ál- je hledanou maticí přechodu (v případě B = J — XE se výpočet zjednodušil tím, že počítání modulo imi? je dosazování J). O něco složitější, ale stále zvládnutelný, je případ, kdy q = (A — Ai)ri • • • (A — XkYk• P&k za bázi kvocientu K[A]/(g) lze vzít polynomy psát ar,_i^ + - • -+q0 (A—A£)ri = {Ort-l{*-W 1 + - ■ -+ao)(A-A,)^ = (X—Xf)re ' lze lmeární kombinaci přepsat do tvaru Pij^xTyT + ''' + Pfc (A-Afc)rfc a JeJí nUj,°vost dává (A — \e)Te \ pe, protože ostatní členy jsou (A — \e)re dělitelné a naopak ^_\tyt je s ním nesoudělné. Protože je ale stupeň pi menší než r£, musí být pi = 0.) Matice m\ je v této bázi v Jordánově kanonickém tvaru postupně s bloky příslušnými Ai,..., Ar rozměrů r±,... ,r\. Položíme-li r = r\ + • • • + r^, je pro výpočet i-tého řádku potřeba vyjádřit modulo imi? = (Z1,..., f 1,frq), kde a(£) značí i-tý sloupcový blok matice přechodu, tj. a(£)j je j-tf bázový vektor ^-tého bloku Jordánovy báze.11 Kontrolní otázky 1. Jak se mění determinant polynomiální matice při provádění jednotlivých elementárních řádkových operací? 2. Napište dva maticové polynomy stupně 1, jejichž součin je polynom stupně 1. 3. Vysvětlete, jaký je vztah mezi podobností matic a ekvivalencí jejich charakteristických matic. 4. Vyslovte definici kanonického tvaru polynomiální matice. Proč je tento kanonický tvar určen jednoznačně? 5. Jaký je vztah mezi maticí J v Jordánově kanonickém tvaru a kanonickým tvarem její charakteristické matice J — XE? Napište několik matic v Jordánově kanonickém tvaru s více buňkami různých velikostí a s několika vlastními čísly a k nim najděte příslušný kanonický tvar charakteristické matice. 6. Vyslovte definici minimálního polynomu matice A / 0. Jak najdeme minimální polynom matice pomocí kanonického tvaru její charakteristické matice? Najděte matice 4x4 s minimálním polynomem stupně 1, 2, 3 a 4. 10Koeficienty aj jsou až na faktor ^j1^, členy Taylorova rozvoje polynomu (flQ(\))r (tj. prvku Q{\)\. matice Q(A)) v bodě A0. 1:LOpět lze koeficienty a(£)j získat z Taylorových polynomů Q(\)lr a ,x_\ yt v bodech Ai,..., A^. fQ(A) = ^r(A-A0) j 103 11. Smithův normální tvar polynomiálních matic Příklady k procvičení. 1. Najděte Jordánův kanonický tvar následujících matic Ai a matice podobnosti Pj takové, že J = Rr1 • Ai ■ P. Řešení: Ao AA Ji ■h (\ 1 0 0\ 0 10 0 0 0 11 \o 0 0 l/ J3 Ja /6 1 0 0\ 0 6 10 0 0 6 0 \0 0 0 6/ /o -1 -1 V-i n 1 2 -V2 " 1 0 1\ 1 0 1/ 1\ 1 2 8/ A, P P> Ps 1 3) 0 0 0 ly 0 -1\ 0 0 1 1 1 0/ -1 0 \ -1 1 0 2 / Pl /0 3 -2 -9\ 9 -3 -1 -9 9 0-3-9 \9 0 0 0 y 2. Které z následujících matic jsou navzájem podobné? /-13 5 4 2\ /2 0 Si 0 -30 V-12 -10 0 12 9 5 6 4 1/ 1 2 0 0 \0 0 1 -2 0 2/ -9 -7 -4 0 2\ -2 2 2 1 0 2/ P5 = /2 0 0 'A 0 3 1 0 0 -1 1 0 \o 0 0 v B3 /-l 0 0 2 \ 1 -1 -2 2 0 0 -1 1 \o 0 0 "V p4 /2 0 1 2 0 0 \o 0 104 11. Smithův normální tvar polynomiálních matic [Řešení: B\ je podobná B%, B2, B4 a b5 jsou si navzájem podobné.] 3. Určete kanonické tvary charakteristických matic příslušných maticím [Řešení: Ci C3 /l -3 0 3\ -2 -6 0 13 0 -3 1 3 V-i -4 0 8/ í2 0 0 °\ 1 2 0 0 1 1 2 3 \o 0 0 "V c2 /4 6 2 4 V 9 9 Ca K1 = K2 (l 0 0 1 0 0 (1-A) Vo o o (A-l)V Ks /l 0 0 0 1 o 0 0 (A + l) \o o o \ (A + 1)(A-2)V -3\ "8/ 0 0 (A + 1)(A-1)S 4. Určete minimální polynom následujících matic /3 3 0 5 \ 0 D2 = 1 3 0 D v Vo 0 3 ) (~l 4 0 0 o\ 0 3 0 0 0 0 -4 -1 0 0 3 -9 -4 2 -1 \1 5 4 1 4/ 4); m2 -- = (A- 3)2; m3 = = (A -3) m4 = (A-3)2(A + l).] 5. Najděte matici, jejíž minimální polynom je (a) polynom A2 a matice má rozměry 3x3 (b) polynom prvního řádu a matice má rozměry 2x2 105 11. Smithův normální tvar polynomiálních matic [Řešení: např. (a) 106 Rejstřík Algebra, 61 Antisymetrická mocnina, 71 Antisymetrizace, 72 Aritmetický základ prostoru, 7 Aritmetický zástupce bodu, 7 Barycentrické souřadnice, 6 Bod projektivního prostoru, 7 Bodová báze afinního prostoru, 6 Báze afinního prostoru, 5 Celočíselná matice, 88 Dualita, 53 Duální báze, 51 lineární zobrazení, 53 vektorový prostor, 51 Eukleidovský afinní prostor, 35 Geometrická báze projektivního prostoru, 8 Hlavní nadrovina nadkvadriky, 36 směr nadkvadriky, 36 čísla nadkvadriky, 36 Homomorfismus K[A]-modulů, 97 Invariantní faktory, 89, 95 K[A]-modul, 96 Kladná báze, 79 Kolineace, 8 Kolmé směry, 35 Komplementární dimenze, 32 Komplexifikace afinního prostoru, 6 vektorového prostoru, 3 Komplexní rozšíření afinního prostoru, 6 afinního zobrazení, 6 lineárního zobrazení, 4 vektorového prostoru, 3 Kuželosečka, 24 Kvadrika, 24 Lineární forma, 51 Minimální polynom, 100 Mooreova-Penroseova pseudoinverze, 43 Nadkvadrika v afinním prostoru, 24 v komplexním rozšíření, 24 Nejlepší aproximace řešení, 46 Nevlastní bod nadkvadriky, 34 bod projektivního prostoru, 8 prostor, 8 Objemová forma, 78 Objemová forma kompatibilní se skalárním součinem, Opačně orientované báze, 79 Orientace vektorového prostoru, 79 Orientovaný objem, 78 vektorový prostor, 79 úhel, 82 Osa kuželosečky, 37 kvadriky, 37 nadkvadriky, 38 Osová nadrovina nadkvadriky, 37 Osová přímka kuželosečky, 37 kvadriky, 37 Polára, 32 Polární doplněk, 31 Polární nadrovina, 32 Polárně sdružené body, 31 Projektivní podprostor, 7 přímka, 7 Projektivní rozšíření afinního prostoru, 8 nadkvadriky, 24 Prostor afinní, 4 107 projektivní, 7 standardní afinní, 5 standardní projektivní, 7 Racionální kanonický tvar, 100 Realifikace, 11 Regulární bod vzhledem k nadkvadrice, 32 nadkvadrika, 32 Reálná část kvaternionu, 85 Shodně orientované báze, 78 Singulární bod nadkvadriky, 32 hodnoty zobrazení, 44 nadkvadrika, 32 rozklad, 45 Smithův normální tvar celočíselné matice, 89 polynomiální matice, 95 Směr, 8, 34 Souřadnice bodu afinního prostoru, 5 homogenní, 7 Střed nadkvadriky, 34 Symetrická mocnina, 68 Symetrizace, 69 Tenzor, 57 antisymetrický, 72 jednoduchý, 58 symetrický, 69 Tenzor typu (p,q), 61 Tenzorová algebra vektorového prostoru, 62 Tenzorový součin lineárních zobrazení, 60 vektorových prostorů, 57 Tečná nadrovina nadkvadriky, 33 Vektorová část kvaternionu, 85 Vlastní bod, 8 Vrchol nadkvadriky, 37 Zaměření afinního prostoru, 4 Zobrazení afinní, 6 indukované lineární, 6 Záporná báze, 79 108 Další literatura [D] M. Doupovec, Diferenciální geometrie a tenzorový počet, VUT Brno, 1999. [JS] J. Janyška, A. Sekaninová, Analytická geometrie kuľeloseček a kvadrik, MU Brno, 1996. [K] A. I. Kostrikin, Exercises in algebra: A collection of exercises in algebra, linear algebra and geometry, Gordon and Breach Publishers, 1996. [KM] A. I. Kostrikin, Yu. I. Manin, Linear algebra and geometry, Gordon and Breach Publishers, 1997. [S] J. Slovák, Lineární algebra, elektronický učební text, www.math.muni.cz/~slovak. Ke kapitolám 1, 2 a 3 lze doporučit [JS], [K] a [KM], ke kapitolám 5, 6 a 7 [D], [K], [KM] a [S] a ke kapitole 10 [S]. Mnohé příklady v tomto textu pocházejí z [JS] a [K]. 109