Pavel Horák LINEÁRNÍ ALGEBRA A GEOMETRIE I. UČEBNÍ TEXT Tento učební text je určen pro předmět Lineární algebra a geometrie L, který je povinným předmětem ve všech studijních oborech studijnho programu Aplikovaná matematika, včetně distanční formy studia, na přírodovědecké fakultě Masarykovy Univerzity v Brně. Jedná se o jednosemestrální kurz, který je doporučen absolvovat ve 2. semestru studia a který navazuje na předmět Základy matematiky. Učební text předpokládá jednak elementární znalosti středoškolské matematiky a dále pak základní znalosti látky absolvované v předmětu Základy matematiky. Po formální stránce je výklad veden co nejpodrobněji, přičemž se vždy výslovně připomínají drobná úskalí a důležité maličkosti, které by méně zkušený čtenář mohl často přehlédnout. Z těchto důvodů má podrobné studium poznámek a komentářů přinejmenším stejný význam jako „učení se" definic a vět. Totéž platí i pro důkazy jednotlivých tvrzení, které jsou zde v převážné většině naprosto přirozené, průhledné a bez umělých obratů. Konec důkazu je v textu vždy opticky označen symbolem D, umístěným na konci příslušného řádku. Pro označování základních číselných množin jsou v textu použity následující standardní symboly: N Z množina všech přirozených čísel, tzn. čísel 1,2,3, množina všech celých čísel množina všech racionálních čísel množina všech reálných čísel množina všech komplexních čísel. Obsah 1 Vektorové prostory 2 1 Vektorový prostor nad číselným tělesem........... 2 2 Podprostory vektorového prostom .............. 6 3 Lineární závislost a nezávislost vektorů............ 12 4 Báze a dimenze vektorového prostoru............. 19 2 Matice a determinanty 28 1 Pořadí a permutace....................... 28 2 Determinanty.......................... 33 3 Algebra matic.......................... 43 4 Hodnost matice......................... 52 5 Další vlastnosti a užití matic ................. 56 3 Soustavy lineárních rovnic 67 1 Gaussova metoda řešení soustav lineárních rovnic...... 67 2 Základní vlastnosti soustav lineárních rovnic......... 73 3 Homogenní soustavy lineárních rovnic............ 77 4 Euklidovské vektorové prostory 84 1 Skalární součin, velikost a odchylka vektorů......... 84 2 Ortogonálnost.......................... 89 5 Lineární zobrazení vektorových prostorů 96 1 Základní vlastnosti lineárního zobrazení........... 96 2 Lineární transformace a její matice.............. 104 3 Vlastní vektory a vlastní hodnoty lineární transformace . . 112 4 Ortogonální zobrazení, ortogonální matice.......... 118 1 Kapitola 1 Vektorové prostory §1. Vektorový prostor nad číselným tělesem Pojem vektoru a vektorového prostoru je jedním ze základních pojmů moderní matematiky, kterého se využívá nejenom v řadě disciplín ryzí matematiky, ale rovněž v mnoha aplikacích, ať už v přírodních vědách nebo jinde. Při zavádění pojmu vektorového prostoru se oproti předchozí kapitole situace poněkud komplikuje v tom, že tentokrát vycházíme ze dvou algebraických struktur, a to z jisté komutativní grupy (V,+), jejíž prvky budeme označovat tučnými písmeny, a dále z jistého číselného tělesa (T, +, •). Mezi těmito dvěma strukturami pak budou platit určité vazby. Pro zjednodušení vyjadřování si zaveďme následující úmluvu. Úmluva. Při zapisování algebraických struktur už nebudeme vždy důsledně vypisovat symboly operací jako doposud, ale často budeme k označení celé struktury používat pouze symbol nosné množiny. Tedy např. místo o grupě (V, +) budeme stručně hovořit o grupě V, místo o tělese (T, +, •) budeme stručně hovořit o tělese T, atd. Přitom je však třeba mít stále na paměti, že se jedná o zjednodušené označení, protože, jak víme, algebraickou strukturu nelze ztotožňovat pouze s její nosnou množinou. Definice. Nechť (V, +) je komutativní grupa (jejíž prvky nazýváme vektory) a (T, +, •) je číselné těleso. Nechť pro každé číslo í G T a každý vektor u G V je definován vektor t ■ u €V tak, že platí: 2 1 Vektorový prostor nad číselným tělesem 3 (1) t ■ (u + v) = t ■ u + t ■ v, (2) (t + s) ■ u = t ■ u + s ■ ti, (3) (t ■ s) ■ u = t ■ (s ■ u), (4) 1 • u = u pro lib. t, s E T a m, v E V. Potom V se nazývá vektorový prostor nad tělesem T. Označení. Nulový prvek z (V, +) se nazývá nulový vektor a označuje se symbolem o. Opačný prvek k vektoru u E V se nazýva opačný vektor k vektoru u a označuje se symbolem —u. Vektor t ■ u se nazývá součin čísla t s vektorem u. Poznámka. Výše definovaný součin čísla s vektorem je vlastně speciálním typem zobrazení, a sice zobrazením T x V —> V, které se někdy nazývá vnější operace, na rozdíl od (binární) operace na množině, např. V, což je zobrazení V x V —> V, které se pak nazývá vnitřní operace. V definici vektorového prostoru se setkáváme se třemi vnitřními operacemi a jednou vnější operací, přičemž některé z nich označujeme stejnými symboly (sčítání ve V a sčítání v T symbolem +, resp. násobení v T a součin čísla s vektorem symbolem •). I když nemůže dojít k nedorozumění (vzhledem k tomu, že vektory zľa čísla z T odlišujeme graficky), je třeba si tuto skutečnost dobře uvědomit. Připomeňme, že máme-li korektně definovat nějaký konkrétní vektorový prostor, pak z předchozí definice plyne, že musíme: (1) zadat číselné těleso T, (2) zadat množinu vektorů V, (3) zadat, jak je definováno sčítání vektorů, (4) zadat, jak je definován součin čísla z T s vektorem z V, (5) ověřit, že (V, +) je komutativní grupa a že platí axiomy (1) - (4) z definice vektorového prostoru. Příklad 1.1. 1. Nechť T je libovolné číselné těleso, n je pevné přirozené číslo a nechť: i — n^x,..., xn) | äľi,..., xn Eij (tzn. Tn je množina všech uspořádaných n-tic prvků z tělesa T) je množina 4 Vektorové prostory vektorů. Definujme pro lib. u = (u\,... ,un), v = (v\,... ,vn) € Tn a teT: u + v = {ui +vi,...,un + vn), t • U = (t • U\, . . . ,t-Un), kde symboly +, resp. • na pravých stranách značí obyčejné sčítání, resp. násobení čísel (stručně říkáme, že sčítání vektorů a násobení čísla s vektorem je definováno „po složkách"). Pak (Tra,+) je komutativní grupa (viz příklad 1.7.4, kap. II) a lehce se ověří, že platí axiomy (l)-(4) z definice vektorového prostoru. Tedy Tn je vektorovým prostorem nad tělesem T. Poznamenejme, že nulovým vektorem je v Tn zřejmě uspořádaná n-tice (0,0,..., 0) a opačným vektorem k (u\,..., un) je vektor (—u\,..., -«„). Specielně, např. M3, QČ, C2, Q(\/2 )4, atd. jsou různé vektorové prostory tohoto typu. 2. Vezměme těleso W reálných čísel. Množinou vektorů bude množina všech polynomů o neurčité x s reálnými koeficienty, kterou označme M[rc]. Sčítání vektorů definujeme jako obvyklé sčítání polynomů a součin čísla s vektorem definujeme jako obvyklé násobení polynomu reálným číslem. Lehce se ověří, že (M[a;], +) je komutativní grupa a že platí axiomy (1) -(4). Tedy M[x] je vektorovým prostorem nad tělesem IR (nulovým vektorem tohoto vektorového prostoru je pak zřejmě tzv. nulový polynom, tj. polynom, jehož všechny koeficienty jsou nulové). 3. Nechť n je pevné přirozené číslo. Vezměme opět těleso W reálných čísel a množinou vektorů nechť je množina sestávající z nulového polynomu a dále ze všech polynomů o neurčité x s reálnými koeficienty stupně < n, kterou označíme symbolem IR^ [x]. Tedy: Mn[x] = {üQXn + a\xn~l + • • • + an-\x + an | ao,ai,... ,an G M}. Sčítání vektorů a součin čísla s vektorem definujeme stejně jako v předchozím příkladu. Lehce se ověří, že (ffin[a;],+) je komutativní grupa a že platí axiomy (l)-(4). Tedy IR^ je vektorovým prostorem nad tělesem R. 4. Nechť T je libovolné číselné těleso a V = {v} je libovolná jednoprvková množina. Sčítání vektorů a součin čísla s vektorem definujeme (jediným možným způsobem, a sice): v + v = v, resp. t ■ v = v pro každé t G T. Pak zřejmě (V, +) je komutativní grupa a platí axiomy (1) - (4). Tedy V je vektorový prostor nad tělesem T, který budeme nazývat nulový vektorový prostor (nad T). Je to tedy vektorový prostor obsahující jediný vektor - a to nulový, tzn. v = o. 2 Podprostory vektorového prostoru 5 Poznámka. Uvědomme si, že množina vektorů V je vždy neprázdná, dále že nulový vektor ve V existuje jediný a opačný vektor k libovolnému vektoru z V existuje rovněž jediný (to vše plyne ihned z faktu, že (V, +) je grupa). Přitom je potřeba důsledně rozlišovat symboly o a 0, tzn. nulový vektor a číslo nula. Dále připomeňme, že podle dříve zavedené úmluvy budeme místo u + (—v) psát stručně u — v. Následující věta nám pak dá další pravidla pro počítání s vektory. Věta 1.1. Nechť V je vektorový prostor nad tělesem T, nechť t,s,G T, u,v € V lib. Pak platí: (1) t ■ (u — v) = t ■ u — t ■ v, (2) (t — s) ■ u = t ■ u — s ■ u, (3) t ■ u = o <í=^ t = 0 nebo u = o, (4) t ■ {-u) = (-t) • ti = -(ť ■ ti). Důkaz. Provedeme většinou užitím axiomů (1) - (4) vektorového prostoru. (1): t-(u-v) = t-(u+(-v))+t-v-t-v = t-(u+(-v)+v)-t-v = t-u-t-v. (2): (t-s)-u = (t+(—s))-u+s-u—s-u = (t+(—s)+s)-u—s-u = tu—s-u. (3): „<=": Je-li ť = 0, pakO-tí = (0-0)-tí = 0--u-0--u = o podle (2). Je-li u = o, pak t ■ o = t ■ (o — o)=to — to = o podle (1). „=>": Nechť í • « = o a í ^ 0. Potom u = 1 ■ u = (j • t) ■ u = j ■ (t ■ U) = j ■ O = O. (4): Plyne z (1), (2) a (3), a sice: t ■ (—u) = t ■ (o — u) = t ■ o — t ■ u = o — t ■ u = —t ■ u, resp. (—t) ■ u = (0 — t) ■ u = 0 ■ u — t ■ u = — t ■ u. D Poznámka. Pomocí předchozí věty můžeme upřesnit naši představu o počtu vektorů ve vektorovém prostoru. Je-li totiž V libovolný vektorový prostor nad T různý od nulového prostoru (jinými slovy řečeno - V obsahuje alespoň jeden nenulový vektor), pak musí prostor V obsahovat nekonečně mnoho vektorů. Vezmeme-li totiž libovolný vektor u G V, u ^ o a tvoříme součiny všech prvků z číselného tělesa T (kterých je nekonečně mnoho) s tímto vektorem it, dostáváme nekonečně mnoho navzájem různých vektorů (je-li totiž ti ■ u = t2 ■ u, pro íi,Í2 £ T, pak (ti — Í2) • u = o, odkud podle věty 1.1. (3) je (ti — t^) = 0, neboli ti = t^)- 6 Vektorové prostory §2. Podprostory vektorového prostoru Definice. Nechť V je vektorový prostor nad tělesem T. Neprázdná podmnožina W množiny V se nazývá podprostor vektorového prostoru V, jestliže platí: (1) u,v £W libololné =>• u + v G W, (2)t£T,u£W libovolné =► t-u£W. Poznámka. 1. Lehce se dá ověřit (proveďte si podrobně sami!), že podmínky (1) a (2) z předchozí definice jsou ekvivalentní následující jediné podmínce: (3) u,v eW.t.s GT libovolné =>• t ■ u + s ■ v G W. 2. Každý podprostor W vektorového prostoru V musí vždycky obsahovat nulový vektor (je-li u € W libovolný, pak podle (2) a podle věty 1.1. (3) je 0 • u = o G W). Vidíme tedy, že se např. nemůže stát, aby dva podprostory vektorového prostoru V byly disjunktní. Věta 2.1. Nechť W je podprostor vektorového prostom V nad tělesem T. Pak W je sám vektorovým prostorem nad tělesem T. Důkaz. Součet dvou vektorů z W, resp. součin čísla z T s vektorem z W jsou definovány stejně jako ve V. Definice podprostoru nám zaručuje, že jde o vnitřní, resp. vnější operaci na W. Dále nechť ti, v G W libovolné. Pak (—1) • v = —v G W, a tedy u — v = u + (—v) G W (podle věty 1.1. (4) a definice podprostoru). Podle V.2.3., kap. II je pak (W, +) podgrupou komutativní grupy (V, +), tzn. (W, +) je komutativní grupou. Axiomy (l)-(4) z definice vektorového prostoru jsou ve W zřejmě splněny (poněvadž jsou splněny v celém V). Tedy W je vektorový prostor nad tělesem T. D Příklad 2.1. 1. Nechť V je libovolný vektorový prostor nad tělesem T. Pak zřejmě W = {o} a W = V jsou vždy podprostory ve V. Tyto dva podprostory se nazývají triviální podprostory ve V. Všechny ostatní podprostory ve V (pokud existují) se pak nazývají netriviálni podprostory ve V. 2. Uvažme vektorový prostor IR3 (viz příklad 1.1.1.). Potom např.: (a) W\ = {(x,y,0) | x, y G ffi lib.} je podprostor vektorového prostoru K3. 2 Podprostory vektorového prostoru 7 (b) W'i = {(x, y, z) | x, y, z G M A x — 2y + 3z = 0} je podprostor v M3. (c) Nechť (it, d, w) je pevný vektor prostoru M3. Potom W3 = {k-(u, v,w) \ k € R} je podprostor v M3. Je vidět, že vektorový prostor M3 obsahuje nekonečně mnoho podprostorů. Na druhé straně samozřejmě ne každá podmnožina v M3 je podprostorem K3. Např. W4 = {(x,y, 1) | x,y G R} není podprostorem v M3 (zdůvodněte proč!). 3. Uvažme vektorový prostor W[x] všech polynomů (viz příklad 1.1.2.). Pak např.: (a) Wi = {f(x) G R[x] I f(x) = f(-x)} je podprostor v R[x]. (b) W2 = {/(x) G M[x] I 2 • /(O) + 3 • /(l) = 0} je podprostorem v M[x]. (c) Vektorový prostor Mn[x] (viz příklad 1.1.3.) je podprostorem v R[x]. Na druhé straně např. množina W3 = {x2 + ax + b \ a, 6 G K lib.} není podprostorem v M[a;]. Věta 2.2. Nechť V je vektorový prostor nad tělesem T, nechť I je neprázdná indexová množina a nechť pro každé a £ I je Wa podprostor ve V. Potom D Wa je podprostor ve V. aei Důkaz. Množina \\ Wa je zřejmě neprázdná (neboť obsahuje jistě nulový vektor o). Zbývá tedy ověřit platnost podmínek (1) a (2) z definice podprostorů. Nechť u,v £ f) Wa, t G T libovolné. Potom u, v G Wa pro každé a £ I, a. tedy (poněvadž Wa je podprostor) je u + v G Wa a t ■ u G Wa pro každé a € I. Pak ale u + v G D Wa a t ■ u G f] Wa. D ctdl adl Poznamenejme, že indexová množina I byla libovolná (neprázdná), a tedy předchozí věta platí jak pro konečný, tak pro nekonečný počet podprostorů. Stručně řečeno, věta tvrdí, že průnikem libovolného počtu podprostorů ve V je opět podprostor ve V. Tohoto faktu využijeme v následující důležité úvaze. Nechť M je libovolná podmnožina vektorového prostoru V (tzn. M obecně není podprostorem!). Pak existuje alespoň jeden podprostor obsahující množinu M (např. celý prostor V má tuto vlastnost). Můžeme tedy utvořit průnik všech podprostorů ve V obsahujících množinu M, který označme symbolem [M]. Tedy: [M] = f]Wa (1) 8 Vektorové prostory (Wa je podprostor ve V takový, že Wa 5 M) a platí následující tvrzení. Věta 2.3. Nechť M je libovolná podmnožina ve vektorovém prostoru V. Potom: (1) [M] je podprostor ve V, (2) [M] je nejmenší (vzhledem k C) podprostor ve V obsahující množinu M. Důkaz. (1): Plyne ihned z věty 2.2. (2): Plyne z (1) a ze základních vlastností množinového průniku. D Je-li množina M konečná, např. M = {m, ...,«&}, pak místo symbolu [{«i,..., Uk}] budeme psát stručněji [tli,..., uk]. V tomto případě je tedy: [ui,...,«/t] = C\Wa (Wa je podprostor ve V takový, že u\,..., uk G Wa). Může se samozřejmě též stát, že množina M je prázdná. V takovém případě zřejmě je [0] = {o}. Definice. Nechť M je podmnožina ve vektorovém prostoru V a nechť W = [M]. Pak podprostor W se nazývá podprostor generovaný množinou M. Je-li specielně M = {ui,... ,«&}, pak W se nazývá podprostor generovaný vektory «i,..., Uk a vektory «i,..., u\~ se nazývají generátory pod-prostoru W. Uvědomme si, že na rozdíl od průniku podprostorů není množinové sjednocení podprostorů (dokonce ani dvou) obecně podprostorem daného vektorového prostoru. Například pro podprostory W\ a Wi vektorového prostoru R3 z příkladu 2.1.2. jejich sjednocení W\ U W^ není podprostorem v K3 (neboť např. (1,1,0), (1,2,1) G Wx U W2, ale (1,1,0) + (1,2,1) = (2,3,1) ^ W\ U W 2) jsou podprostory vektorového prostoru V. Pak množina W\ + W2 + • • • + W/t definovaná: Wi+W2+- ■ -+Wk = {ui+u2+- ■ -+uk j m G Wi, u2 G W2, ...,ukG Wk} 2 Podprostory vektorového prostoru 9 se nazývá součet podprostorů W\, ..., Wk- Věta 2.4. Necht W\, W2, ■ ■ ■, Wk (K > 2) jsou podprostory ve V. Pak platí: (1) součet podprostorů W\ + W2 + • • • + Wk je podprostorem ve V, (2) Wi + W2-\-------h Wk = [Wi U W2 U • • • U Wk], tzn. součet podprostorů W\, ..., Wk je roven podprostorů generovanému jejich množinovým sjednocením. Důkaz. (1): Zřejmě je Wi-\------VWk + § (neboť W{ / 0). Dále nechť u, v G W\ + • • • + Wk, t € T libovolné. Potom u = «1 + • • - + Uk, v = v\-\------\-Vk, kde Ui, Vi G Wi, i = 1,..., k. Potom ale: u + v = (iti H-------\- uk) + (vt H-------h «A;) = ("i + «1) H-------^(uk + vk) e W1 + ■ ■ • + Wjb, í • w = í • (wi H-------h wjfc) = ť • wi H-------h ť • uk G W\ H-------h Wfc, a tedy W\ + • • • + Wk je podprostor ve V. (2): Vzhledem k (1) budeme dokazovat množinovou rovnost: W1 + --- + Wk = f]Ua {Ua je podprostor ve V takový, že Ua ~D W\ U • • • U Wk)- „C": Nechť u G W\ + • • • + Wk. Potom u = ui + • • • + uk, kde Ui G Wj. Je tedy Ui € Ua, kde ř7a je libovolný podprostor ve V takový, že Ua ^ W^i U • • • U W^. Potom však u\-\-----+ itfc = u G ř7a, a tedy it G ÍIČ/q, (ř^a je podprostor ve V a Ua ^ Wi U • • • U W&). „D": Zřejmě je Wi C Wi H-----+ W^ (neboť pro itj G Wj libovolný je Ui = o H-------h it; H-------Vo eW\-\-------h W&), a tedy W\ U • • • U Wk C Wi + • • • + W^. Podle 1. části věty je však W\ H-----+ Wk podprostorem ve V, tzn. z vlastností množinového průniku pak již plyne žádaná množinová inkluze. D Vidíme tedy, že součet podprostorů W\ + • • • + Wk je nejmenším podprostorem ve V obsahujícím množinové sjednocení W\U- • -UWk těchto podprostorů. Samozřejmě, že součet podprostorů obecně není roven jejich množinovému sjednocení. Dále si uvědomme, že vyjádření vektoru u G W\-\------VWk ve tvaru: u = u\A-----+ Uk, 10 Vektorové prostory kde u\ G Wi, ..., itfc G W&, nemusí být jednoznačné. Obojí se ukáže na jednoduchém příkladu, a to pro k = 2, což je situace, s níž se budeme v praxi nejčastěji setkávat. V tomto případě je tedy: Wi + w2 = {«i + u2\ui e Wi, u2 g w2} = [Wi u w2]. Schematicky je tato situace znázorněna na obr. 8. obr. 8. Příklad 2.2. Ve vektorovém prostoru M3 mějme dány dva podprostory: W! = {(x,y,0) \x,y£R}, W2 = {(u,0,v) | u,v Gl}. Zřejmě platí, že: W1UW2 = {(a, 6, c) | a, 6, c G M, b = 0 nebo c = 0}, resp. Vidíme tedy, že WiUW2 ^Wt+ W2. Dále, vyjádření vektoru u G Wi + W2 ve tvaru: W = U\ + «2, (2) kde u\ G Wi, t*2 G W2, zde obecně není jednoznačné, neboť např. (0,0,0) G Wí + W2, přičemž třeba (0,0,0) = (0,0,0) + (0,0,0) = (1,0,0) + (-1,0,0) jsou dvě různá vyjádření tvaru (2). Poznamenejme, že v tomto případě má každý vektor z W\ + W2 dokonce nekonečně mnoho různých vyjádření tvaru (2). 2 Podprostory vektorového prostoru 11 Definice. Nechť W\, W2, ••-, Wt (ft > 2) jsou podprostory vektorového prostoru V. Součet podprostorů Wi,..., W& se nazývá přímý součet a označuje Wi+W2^i------i-Wfe, jestliže libovolný vektor u G W\ + • • • + Wk lze vyjádřit jediným způsobem ve tvaru: u = u\ -\-----+ Uk, (3) kde tli G Wi, ..., ti/s G W&. Věta 2.5. Nechť W\, W2, ■ ■ ■, Wk (k > 2) jsou podprostory vektorového prostoru V. Pak součet podprostorů Wi,..., Wk je přímým součtem <í=^ pro každé i = 1, 2,..., k platí: Wi n (Wx + • • • + Wť_i + Wi+i + • • • + W*) = {o}. (4) Důkaz. „=^": Nechť součet podprostorů Wi, ..., Wk je přímý a nechť pro l<í<Ä;jea?eWin (Wi H------h W;_i + Wi+i H------h W/t) libovolný. Potom je x = U\ H-------h Mj_i + Ui+i -\-------h ti/s, kde Uj G Wj, a dále x G Wj, tzn. také —x G Wj. Pak ale: o = ui-\-------h Wi_i + (-a;) + ui+i H-------\-Uk, resp. o = o + o+--|-o jsou dvě vyjádření nulového vektoru o ve tvaru (3), tzn. podle předpokladu musí být x = o. Tedy je W; n (WH-------h W_i + Wi+1 H-------h W/t) C {o}. Opačná inkluze je však triviálni, tzn. dohromady platí rovnost. Poněvadž i bylo libovolné (s vlastností 1 < i < k), platí všechny podmínky (4). „<í=": Nechť platí podmínky (4), nechť x G Wi + • • • + W& libovolný a nechť: x = u\-\-------h Uk = u[ H-------h u'k, kde Wj, tt^ G Wi, i = 1,2,..., ft jsou dvě vyjádření vektoru íc ve tvaru (3). Potom pro libovolné i = 1, 2,..., ft dostáváme: («i - U-) = (u[ - Ml) H-------h («•_! - Ui-i) + (u'i+1 - Uj+i) H-------h («'/. - Uk), tzn.: («i - u'i) g W n (Wi + • • • + W_i + wi+1 + • • • + Wt), 12 Vektorové prostory odkud však podle (4) plyne, že («j—Uj) = o, neboli t^ = u\. Tedy vyjádření vektoru x ve tvaru (3) je jednoznačné a součet podprostorů Wi,..., Wk je přímý. D Poznámka. Rozepíšeme-li si předchozí větu pro některá konkrétní k, pak dostáváme např.: pro k = 2: součet podprostorů W\, W- Wi n (w2 + w3) = {0} a w2 n (Wi + w3) = {o} a w3 n (Wi + w2) = {o}. Příklad 2.3. Ve vektorovém prostoru M3 mějme dány podprostory: W\ = {(x,x,0) I x Gl}, W2 = {(u,0,«) j «,« GK}, W3 = {(0,ä:,ä:) j A; € M}. Potom užitím věty 2.5. dostáváme, že: 1. součet podprostorů W\, W2 je přímý (je-li w G Wi fl W2? pak w = (x, x, 0) = (u, 0, w) ==> x = 0, tzn. i« = (0,0,0) a podle věty 2.5. je součet přímý), 2. součet podprostorů W\, W% je přímý, 3. součet podprostorů W2, W% je přímý, 4. součet podprostorů Wi, W2, W% není přímý (neboť např. W\ n (W2 + W3) = Wi fit3 = W\ 7^ {o}, a tedy podle věty 2.5. součet není přímý). §3. Lineární závislost a nezávislost vektorů Definice. Nechť V je vektorový prostor nad T a nechť u\,..., uk je konečná posloupnost vektorů z V. Pak vektor: u = t1-u1-\-------\-tk-uk, kde t\,..., t k G T, se nazývá lineární kombinace konečné posloupnosti vektorů u\,..., u k nebo stručně lineární kombinace vektorů u\,..., uk. Množina všech lineárních kombinaci vektorů u\,..., uk se bude označovat symbolem L{u\,..., m&), tzn.: i(«i,..., u k) = {ti ■ u\ + • • • + t k • Uk I ti,..., t k € T libovolné}. 3 Lineární závislost a nezávislost vektorů 13 Poznámka. 1. Všimněme si, že v předchozí definici hovoříme o „konečné posloupnosti vektorů «i,..., «&". Tímto obratem chceme říct, že je možné, aby se zde některý z vektorů vyskytoval případně vícekrát (tzn. může se stát, že Ui = Uj pro i ^ j) a dále, že vektory chápeme v uvedeném pořadí (tento fakt však bude hrát důležitou roli až v dalším paragrafu). Z důvodů stručnosti budeme však v dalším místo „konečná posloupnost vektorů «i,..., tijt" říkat obvykle pouze „vektory m,..., «&". 2. Symbol L(ui,..., u/t) znamená množinu všech (možných) lineárních kombinací vektorů u\,..., Uk, kterých je zřejmě obecně nekonečně mnoho. Uvědomme si dále, že množina L(u\,..., Uk) obsahuje vždy mimo jiné: - každý z vektorů ui,...,Uk (neboť u-i = 0 • U\ + ■ ■ ■ + 0 • Mj_i + 1 • Ui + 0-iij+i H----------hO-iijt), - nulový vektor (neboť o = 0-«i + --- + 0- «&). 3. V předchozím paragrafu jsme hovořili o podprostoru generovaném konečnou množinou vektorů. Je zřejmě, že místo „konečné množiny vektorů" můžeme vzít též „konečnou posloupnost vektorů" (případné opakující se vektory zde nehrají žádnou roli) a použít stejnou symboliku. Je-li tedy «i,..., Uk konečná posloupnost vektorů z V, pak: [tii,...,«A:] = nwa (i) (Wa je podprostor ve V takový, že «i,..., Uk G Wa) je podprostor generovaný vektory «i,..., Uk- Následující věta nám pak ukáže, že [«i,..., Uk] a L(ui,..., Uk) jsou vlastně jedno a totéž. Věta 3.1. Nechť V je vektorový prostor nad T a nechť U\,... ,Uk je konečná posloupnost vektorů z V. Pak platí: (1) L(ui,..., Uk) je podprostor ve V, (2) [«i,...,Uk] = L(ui,...,Uk), tzn. podprostor generovaný vektory u\,... ,Uk je roven množině všech lineárních kombinací vektorů U\,...,Uk- Důkaz. (1): Zřejmé (ověřením definice podprostoru). (2): Vzhledem k (1) budeme dokazovat množinovou rovnost: f]Wa = L(uu...,uk) (2) {Wa je podprostor ve V A «i,..., uk G Wa). „C": Plyne z vlastností množinového průniku, uvědomíme-li si, že 14 Vektorové prostory L(ui,..., u k) je podprostor ve V (podle 1. části) a že u\,... ,Uk E L(ui,..., M&). „D": Množina na levé straně (2) je podprostor ve V obsahující vektory ui,... ,Uk, tzn. musí pak obsahovat také jejich libovolnou lineární kombinaci. D Důsledek. Nechť V je vektorový prostor nadT, nechť Ui,... ,Uk je konečná posloupnost vektorů z V a nechť ví,... ,vs E L(ui,..., Uk). Pak platí: (1) L(vi,...,vs) C L(ui,...,uk) (neboli [vi,...,vs] C [m,... ,uk]), (2) [ui,...,uk,v1,...,vs] = [ui,...,uk]. Důkaz. (1): Plyne ihned z (1) a z předchozí věty, část (2). (2): Inkluze „D" plyne z (1). Dokažme inkluzi „C". Ale triviálně je «i,... ,Uk E L(ui,..., M/t), resp. podle předpokladu je ví,... ,vs E L(ui,... ,Uk). Podle části (1) je pak [mi, ... ,Uk,Vi,..., vs] E [mi,...,m^]. Dohromady pak platí dokazovaná rovnost. D Vidíme tedy, že přidáme-li ke generátorům daného podprostoru W libovolný vektor, který je jejich lineární kombinací, dostáváme opět generátory W', resp. (totéž - jinak řečeno) odstraníme-li z generátorů podprostoru W vektor, který je lineární kombinací zbývajících, dostáváme opět generátory W. Příklad 3.1. 1. Rozepsáním se lehce ověří, že např.: ffi2 = [(1,0), (0,1)] = [(1,1), (1,2)] = [(0,2), (1,1), (0,1)] = [(1,3), (2,1), (1,-1), (-2,3)], atd. Vidíme tedy, že vektorový prostor M2 je možno generovat dvěma a více vektory (zřejmě i nekonečně mnoha). Na druhé straně, prostor M2 evidentně nelze generovat jedním vektorem (neboť [(a, b)] = L((a,b)) = {(k ■ a,k ■ b) \kER} Cl2). 2. Ve vektorovém prostoru Tn označme vektory: d =(1,0,0,...,0,0), e2 = (0,1,0,...,0,0), en = (0,0,0,...,0,1). Pak platí, že Tn = [ei,..., en], tzn. vektory ei,..., en jsou generátory vektorového prostoru Tn (zřejmě pro libovolný vektor u = (iti,... ,un) E 3 Lineární závislost a nezávislost vektorů 15 Tn je u = u\ • e\ + • • • + un • en, tzn. Tn C [ei,..., en] a opačná inkluze je triviální). 3. Ve vektorovém prostoru ^n[x] označme vektory (tj. polynomy): /i = l, S 2 = xi fz=xi tn+1 = x ■ Pak zřejmě ffi„ [x] = [/1?..., /n+i], tzn. polynomy 1, x, x2,..., xn jsou generátory vektorového prostoru IR„ [x]. Definice. Nechť V je vektorový prostor nad T a nechť: uu...,uk (3) je konečná posloupnost vektorů z V. Jestliže existují čísla t\,..., í^ G T, z nichž alespoň jedno je různé od nuly, tak, že: ti • iti H-------\- tk • uk = o, (4) pak říkáme, že vektory u\,..., uk jsou lineárně závislé. V opačném případě říkáme, že vektory ui,...,Uk jsou lineárně nezávislé. Poznámka. Vidíme, že pojem lineární nezávislosti je negací pojmu lineární závislosti. Explicitně vyjádřeno to znamená: Vektory tti,..., uk jsou lineárně nezávislé, jestliže pro všechna íi,..., t k € T, z nichž alespoň jedno je různé od nuly, platí: ti-ui-\-------VtfUk^o. S touto definicí by se však zřejmě nešikovně pracovalo, a proto ji přeformulujeme do ekvivalentního, ale praktičtějšího tvaru: Vektory u\,..., u^ jsou lineárně nezávislé, jestliže platí: t\-u\-\-------h tk ■ uk = o => ti = í2 = • • • = tk = 0. Praktické zjišťování závislosti či nezávislosti daných vektorů (3) provádíme obvykle tak, že hledáme všechna čísla t\,...,tk G T splňující rovnost (4). Zjistíme-li, že (4) je splněno pouze pro ti = • • • = tk = 0, pak jsou vektory (3) lineárně nezávislé. Je-li rovnost (4) splněna i pro nějaké ti ^ 0, pak jsou dané vektory lineárně závislé. 16 Vektorové prostory Příklad 3.2. 1. Ve vektorovém prostoru IR2 jsou např. vektory (1,0), (0,1) lineárně nezávislé. Podobně vektory (1,1), (1,2) jsou též lineárně nezávislé (obojí dostaneme rozepsáním podle předchozího návodu). Na druhé straně např. vektory (0,2), (1,1), (0,1) jsou lineárně závislé a podobně vektory (1,3), (2,1), (1,-1), (—2,3) jsou též lineárně závislé (ověřte si sami!). 2. Ve vektorovém prostoru Tn jsou vektory e\ = (1,0, ...,0), e% = (0,1,0,... , 0), ..., en = (0,..., 0,1) lineárně nezávislé (neboť je-li t\ ■ e\ + -----hín-en = (0,...,0), pak (íl5...,ín) = (0, ...,0), a tedy íi = t2 = ■■■ = tn = 0). 3. Ve vektorovém prostoru Mn[x] jsou vektory (polynomy) fľ = 1, /2 = x, ..., /n_|_i = xn lineárně nezávislé (je-li ti-l+t2-x+- ■ ■-\-tn+i-xn = o, kde o značí nulový polynom, tj. polynom, jehož všechny koeficienty jsou rovny nule, potom je t\ = ty = • • • = tn = 0, neboť dva polynomy se rovnají, právě když se rovnají jejich koeficienty u stejných mocnin x). Jestliže uvažovaná posloupnost vektorů obsahuje pouze jediný vektor, např. ti, pak je zjišťování lineární závislosti či nezávislosti velmi jednoduché, neboť z předchozí definice a z věty 1.1. (3) plyne (rozmyslete si podrobně jak!), že platí: vektor u je lineárně závislý <í=^ u = o. (5) O trošku složitější je situace, když uvažovaná posloupnost (3) obsahuje alespoň dva vektory. Kriteria lineární závislosti nám pro tento případ udává následující věta. Věta 3.2. Nechť V je vektorový prostor nadT, nechť k > 2 a «i, «2,... ,Uk G V. Pak následující výroky jsou ekvivalentní: (1) vektory ui,...,Uk jsou lineárně závisle, (2) 3i (1 < i < k) tak, že vektor U{ je lineární kombinací zbývajících vektorů (tj. vektorů ui,..., Mj-i, «í+i, ..., u^), (3) 3i (1 < i < k) tak, že [ui,...,uk] = [«1,... ,«;_i,«j+i,... ,uk]. Důkaz. „(1) =>- (2)": Nechť U\,...,Uk jsou lineárně závislé. Pak existují čísla ti,...,tk G T, z nichž alespoň jedno je nenulové, tak, že t\ ■ u\ + ■ ■ ■ +tk ■ Uk = o. Nechť např. ťj 7^ 0. Pak ale úpravou z předchozí rovnice dostáváme: 3 Lineární závislost a nezávislost vektorů 17 Ui = -£- ■ lil----------K2- ■ Ui-l - tjf^ ■ Ui+1----------^ • Uk, což znamená, že vektor Ui je lineární kombinací zbývajících vektorů. „(2) =>• (3)": Plyne přímo z 2. části důsledku věty 3.1. „(3) =>• (1)": Nechť platí (3). Pak ale Ui G \u\,... ,uk] = [u\,..., Wj_i,«j_|_i,..., «&] = L(ui,..., «j_i, Wj+i, ...,uk), tzn. «j = pí • iti H-------h Pi-i • «j_i + Pi+i • Wj+i + • • • + j)fc • ttfc, kde j3j G T. Pak po úpravě dostáváme: p\-ui-\-------\-pi-i -Ui-i + (-1) -Ui+pi+1 -ui+1 -\-------Vpk-uk = o, odkud již plyne, že vektory ui,...,Uk jsou lineárně závislé. D Poznámka. Je třeba si uvědomit, že část (2) předchozí věty nám zajišťuje pouze existenci vektoru, který lze vyjádřit jako lineární kombinaci zbývajících vektorů. Nelze tedy obecně tvrdit, že každý z lineárně závislých vektorů «i, U2-,... ,Uk se dá vyjádřit jako lineární kombinace zbývajících vektorů. Např. ve vektorovém prostoru M2 jsou vektory: «i = (o, i), u2 = (i,i), m = (0,-2) lineárně závislé (neboť 2 • u\ + 0 • u 2), a dokážeme jej pro r. Podle předpokladu a předchozího důsledku jsou vektory u\,... ,ur-\ lineárně nezávislé, tzn. (podle indukčního předpokladu) r — 1 < s a po vhodném přečíslování je: L(vu ...,vs) = L{ui,..., «r_i, vr,..., vs). (6) Ale podle předpokladu věty je ur G L(v\,... ,vs) = L(u\,... ,ur-\,vr,... ,vs), odkud především plyne, že r — 1 < s (jinak spor s lineární nezávislostí vektorů «i,..., ur), tzn. platí r < s. Dále lze psát: ur = t\ • u\ + • • • + ír_i • uT-\ + tr • vr + • • • + ts • vs, (7) přičemž alespoň jedno z čísel ti,...,ts musí být nenulové (jinak opět spor s lineární nezávislostí vektorů u\,... ,ur). Přečíslujme je tak, aby tr ^ 0. Potom: t\ tr-\ 1 tr+i ts . Vr = -— • Ut--------------— • Ur-l + — -Ur-----— • Vr+1-----------— -Vg. (8) Podle důsledku věty 3.1. (užitím (7) a (8)) dostáváme, že L{u\,..., ur-i,vr,..., vs) = L(u\,..., ur, vr+i,..., vs). Odsud a z (6) pak plyne, že L(v\,..., vs) = L(ui,..., ur, wr+i) • • •) Vs), c°ž je žádaná rovnost. D 4 Báze a dimenze vektorového prostoru 19 §4. Báze a dimenze vektorového prostoru Definice. Nechť V je vektorový prostor nad T. Konečná posloupnost vektorů «i,..., un z V se nazývá báze vektorového prostoru V, jestliže platí: (1) vektory m,..., un jsou lineárně nezávislé, (2) vektory m,...,un generují vektorový prostor V, tzn. [m,...,un] = V. Poznámka. Místo obratu „konečná posloupnost vektorů u\,..., un je bází V" budeme častěji říkat stručně „vektory u\,...,un jsou bází V". Dále si uvědomme, že předchozí definice nezaručuje existenci báze ani nic neříká o počtu bází ve V. Celou situaci si nejprve ilustrujeme na několika příkladech. Příklad 4.1. Z příkladů 3.1. a 3.2. bezprostředně plyne, že: 1. Vektory (1,0), (0,1) jsou bází vektorového prostoru I?. Podobně vektory (1,1), (1,2) jsou též bází M2. Zřejmě vektorový prostor M2 má nekonečně mnoho různých bází. Na druhé straně, např. vektory (0,2), (1,1), (0,1), resp. (1,3), (2,1), (1,-1), (-2,3), resp. (1,2), (2,4), resp. (1,2) nejsou bází K2. 2. Vektory e\ = (1,0,..., 0), ..., en = (0,..., 0,1) jsou bází vektorového prostoru Tn. 3. Vektory (polynomy) f1 = l,f2 = x,..., /n+i = xn jsou bází vektorového prostoru K„ [x]. Příklad 4.2. 1. Nulový vektorový prostor V = {o} nemá bázi, neboť libovolná konečná posloupnost vektorů z V má tvar o, o,..., o, a je tedy lineárně závislá. 2. Vektorový prostor R[x] nemá bázi, neboť žádná konečná posloupnost vektorů (polynomů) z R[x] negeneruje celý prostor R[x]. Je-li totiž ffi,... ,ffn libovolná konečná posloupnost polynomů z R[x] a jestliže polynom gi má stupeň ki, potom jistě existuje přirozené číslo t s vlastností: t > ki pro každé i = 1,..., n. Pak ale např. polynom g = xl se nedá napsat jako lineární kombinace polynomů gľ,..., gn, a je tedy [g1,..., gn] C E[x]. Rozebereme-li si předchozí definici podrobněji, pak vidíme, že báze «i,..., u vektorového prostoru V je z hlediska generátorů „nejchudobnější" posloupností vektorů. Přesněji řečeno, pokud bychom některý z vektorů «i,..., un 20 Vektorové prostory vypustili, pak zbývající vektory už nebudou generovat vektorový prostor V (plyne z věty 3.2. - rozmyslete si podrobně jak). Na druhé straně, z hlediska lineární nezávislosti je báze „nejbohatší" posloupností vektorů z V, jak v dalším ukážeme. Definice. Řekneme, že konečná posloupnost vektorů ui,...,un z V je maximální lineárně nezávislá posloupnost vektorů ve V, jestliže: (1) vektory u\,...,un jsou lineárně nezávislé, (2) pro libovolné w & V jsou vektory u\,..., un, w lineárně závislé. Věta 4.1. Konečná posloupnost vektorů «i,... ,un je bázi vektorového prostoru V, právě když je maximální lineárně nezávislou posloupností vektorů ve V. Důkaz. „=>": Nechť u\,...,un je báze ve V. Pak vektory ui,...,un jsou lineárně nezávislé a pro libovolný vektor w G V je w G [ui,...,un] = L(ui,..., un). Podle věty 3.2. jsou pak vektory u\,..., un, w lineárně závislé, a tedy u\,..., un je maximální lineárně nezávislá posloupnost vektorů. „-4=": Nechť u\,..., un je maximální lineárně nezávislá posloupnost vektorů ve V. Pak ui,...,un jsou lineárně nezávislé. Dokážeme, že [u\,..., un] = V, neboli L(u\,... ,un) = V. Ale inkluze „C" je triviální. Naopak, nechť w G V libovolné. Pak podle předpokladu jsou vektory u\,..., un, w lineárně závislé, tzn. existují čísla ťi,...,ín,ť G T, z nichž alespoň jedno je různé od nuly, tak, že: ti ■ U\ + • • • + tn • Un + t ■ W = O. Musí však být t / 0 (jinak spor s lineární nezávislostí vektorů u\,..., un), a tedy: w = -f-f Ui---------if • un G L(ut,..., un), což jsme chtěli ukázat. D Následující věta nám pak podá ještě jednu charakterizaci báze vektorového prostoru. Věta 4.2. Konečná posloupnost vektorů u\,... ,un je bázi vektorového prostoru V, právě když každý vektor w £V je možno jediným způsobem vyjádřit ve tvaru: w = t1-u1-\-------\-tn-un, (1) 4 Báze a dimenze vektorového prostoru 21 kde ťi,... ,tn € T. Důkaz. „=>": Nechť «i,... ,ti„ je báze ve V. Pak existence vyjádření (1) plyne z definice báze. Dokážeme jeho jednoznačnost. Nechť tedy: w-ti-U\-\-------h tn ■ un - n ■ «i H-------h rn • un, kde íj,rj G T. Pak odečtením a úpravou dostáváme: (íi - n) ■ ui H-------h (ín - rn) un = o. Vektory «i,..., ttra jsou však lineárně nezávislé, tzn. musí být (U — r i) = 0, neboli ti = r i pro každé i = 1,..., n. „<£=": Nechť každý vektor w G V se dá jednoznačně vyjádřit ve tvaru (1). Potom je V = L(ui,..., un) = [u\,..., un]. Zbývá ukázat, že vektory «i,..., un jsou lineárně nezávislé. Nechť tedy: ti ■ tii H--------h ín • iín = o. Zřejmě však je 0 • U\ + • • • + 0 • un = o, a tedy z jednoznačnosti vyjádření (1) plyne, že ťi = • • • = tn = 0, tzn. iti,...,tira jsou lineárně nezávislé. Dohromady pak dostáváme, že vektory ui,...,un jsou bází V. D Věta 4.3. Nechť u\,... ,un je báze vektorového prostoru V. Pak platí: (1) jestliže v\,..., vm je báze prostoru V, pak je m = n, (2) jestliže vektory w\,... ,ws generuji prostor V, pak z nich lze vybrat bázi, (3) každou konečnou posloupnost lineárně nezávislých vektorů z V lze doplnit na bázi V. Důkaz. (1): Aplikujeme-li dvakrát Steinitzovu větu, dostáváme n < m a m < n, odkud plyne, že m = n. (2): Podle předpokladu má prostor V bázi, tzn. musí být V ^ {o}. Nechť vektory w\,..., ws generují prostor V. Pak alespoň jeden z nich je různý od nulového vektoru a zřejmě je lze přečíslovat tak, že wi,... ,Wi jsou lineárně nezávislé &w-l,...,Wí,Wj jsou lineárně závislé pro každé j s vlastností i < j < n. Odtud (podobnou úvahou jako v závěru důkazu věty 4.1.) plyne, že Wj G L(w\,... ,Wi), a tedy V = L(w\,... ,ws) C L(w\,... ,Wi). Opačná inkluze je však triviálni, tzn. je V = L(w\,..., Wi) a vektory w\,..., Wi jsou bází prostoru V. (3): Nechť w\,..., wr jsou lineárně nezávislé vektory z V. Podle Steinit-zovy věty je (po vhodném přečíslování) V = L(u\,... ,un) = L(wi,... ,wr,u 22 Vektorové prostory odkud podle právě dokázaných částí (1) a (2) dostáváme, že w\,..., wr, «r+i, • • •, u, je báze V. D První část předchozí věty nám říká, že má-li vektorový prostor nějakou bázi, pak všechny jeho báze sestávají vždy ze stejného počtu vektorů. Na základě tohoto faktu můžeme vyslovit následující definici. Definice. Nechť V je vektorový prostor nad T. Pak: (1) je-li V nulovým vektorovým prostorem (tzn. V = {o}), říkáme, že dimenze V je nula, (2) existuje-li báze u\,... ,un prostoru V, pak říkáme, že dimenze V je n, (3) je-li V j^ {o} a nemá-li žádnou bázi, pak říkáme, že dimenze V je nekonečno. Píšeme: dim V = 0, resp. dim V = n, resp. dim y = oo. Vektorové prostory z (1) a (2) se nazývají konečnědimenzionální, vektorové prostory z (3) se nazývají nekonečnědimenzionální. Příklad 4.3. Z příkladů 4.1. a 4.2. bezprostředně plyne, že: 1. dimM2 =2, 2. dimTra = n (tzn. specielně např. dimlR3 = 3, dimQ5 = 5, dimC4 = 4, atd.), 3. dimlR^fa;] = n + 1 (tzn. specielně např. dimlRgfa;] = 6, atd.), 4. dimR[a;] = oo. Úmluva. Všude v dalším se budeme zabývat pouze konečnědimenzionál-ními vektorovými prostory. Řekneme-li tedy, že V je vektorový prostor nad T, bude to automaticky znamenat, že V je konečnědimenzionální, tzn. buď nulový prostor, nebo vektorový prostor, v němž existuje báze. K tomu ještě poznamenejme, že každý podprostor konečnědimenzionálního vektorového prostoru je sám také ko-nečnědimenzionálním vektorovým prostorem (plyne z vět 2.1. a 4.I.). V praxi se poměrně často setkáme s úlohou, že ve vektorovém prostoru V, jehož dimenzi známe, např. dim V = n, ověřujeme, zda nějaká posloupnost sestávající z n vektorů je bází. V takovém případě stačí ověřovat pouze jednu z podmínek (1) a (2) z definice báze, jak ukazuje následující věta. 4 Báze a dimenze vektorového prostoru 23 Věta 4.4. Nechť V je vektorový prostor nad T, dim V = n (n > 1) a nechť «i,...,wn je konečná posloupnost n vektorů z V. Pak následující výroky jsou ekvivalentní: (1) vektory u\,..., un jsou bází prostoru V, (2) vektory u\,..., un jsou lineárně nezávislé, (3) vektory u\,..., un generují prostor V. Důkaz. „(1) =>■ (2)": Zřejmé (plyne z definice báze). „(2) =>- (3)": Nechť ui,...,un jsou lineárně nezávislé. Podle věty 4.3. (3) (vzhledem k předpokladu dim V = n) jsou však vektory ui,...,un bází prostoru V, tzn. generují prostor V. „(3) =>• (1)": Nechť ui,...,un generují prostor V. Podle věty 4.3.(2) (vzhledem k tomu, že dim V = n) však jsou vektory ui,...,un bází prostoru V. D Věta 4.5. Nechť Wi, W2 jsou podprostory vektorového prostoru V. Potom platí: (1) WlCW2 => dirndl < dimW2, (2) WiCW2 A dimWi = dimW2 => Wi = W2. Důkaz. Pokud Wi = {o} nebo W2 = {o}, pak obě tvrzení zřejmě platí. Nechť tedy W\, W2 ^ {o} a nechť u\,..., ur je báze V^i, resp. vi,...,vs je báze W^- Jestliže W\ C iy2, pak it^ G W2 = -ť(^i, • • •, vs), i = l,...,r, přičemž vektory u\,..., ur jsou lineárně nezávislé, tzn. jsou splněny předpoklady Steinitzovy věty. Potom: (1): podle Steinitzovy věty je r < s, neboli dimTVi < dim W2, (2): je-li navíc dimTVi = dimW2, tzn. r = s, pak opět podle Steinitzovy věty je L(vi,..., vs) = L(u\,..., ur), neboli W\ = W2. D Poznámka. Z předchozí věty plyne několik zřejmých, ale důležitých důsledků: 1. Dimenze podprostoru je vždy menší nebo rovna dimenzi celého prostoru. 2. Je-li podprostor W\ vlastní podmnožinou podprostoru W2 (tzn. W\ ^ W2), potom je dimWi < dimW^- Jinými slovy řečeno, nemůže se stát, aby dva podprostory stejné dimenze byly ostře v inkluzi. 3. Předpoklad W\ C W2 v předchozí větě byl podstatný, tzn. pokud dva podprostory nejsou v inkluzi, pak o vzájemném vztahu jejich dimenzí nemůžeme nic říct. 24 Vektorové prostory Věta 4.6. (Věta o dimenzi součtu a průniku podprostorů) Nechť W\, W2 jsou podprostory vektorového prostoru V. Pak platí: dim(W! + W2) + dim(VFi n W2) = áimWi + dimVF2. Důkaz. Je-li W\ = {0} nebo W2 = {o}, pak tvrzení zřejmě platí (rozmyslete si podrobně proč!). Nechť tedy dimWi =r^0a dimW2 = r j (tj. jestliže větší z obou čísel předchází v daném pořadí číslu menšímu). Pořadí, v němž celkový počet inverzí je sudé číslo (resp. liché číslo), se nazývá sudé pořadí (resp. liché pořadí). Hovoříme pak též o paritě pořadí. Příklad 1.1. Nechť n = 8. Potom: 1. pořadí (1,2,3,4,5,6,7,8) je sudé (celkový počet inverzí je 0), 2. pořadí (3,1, 2, 7, 5,8, 6,4) je liché (celkový počet inverzí je 9). Celkový počet inverzí v daném konkrétním pořadí zřejmě nejrychleji zjistíme tak, že bereme odleva jedno číslo po druhém a pro každé z nich spo- 28 1 Pořadí a permutace 29 čítáme, kolik menších čísel stojí za ním (napravo). Sečtením těchto hodnot pak dostaneme celkový počet inverzí v daném pořadí. Definice. Nechť R = (ri,..., rn), S = (s\,..., sn) jsou dvě pořadí. Nechť existují indexy i j^ j tak, že Si = rj, s j = r i a dále r^ = s^ pro k j^ i,j. Potom řekneme, že pořadí S vzniklo z pořadí R provedením jedné transpozice. Poznámka. Jinými slovy řečeno, provedení jedné transpozice znamená vzájemnou záměnu dvou různých prvků v daném pořadí, přičemž všechny ostatní prvky zůstávají na původním místě. Věta 1.1. Nechť n je pevné přirozené číslo. Pak platí: (1) z n prvků lze utvořit celkem n\ různých pořadí, (2) všech n\ pořadí z n prvků lze seřadit tak, že každé následující pořadí obdržíme z předcházejícího provedením jedné transpozice. Přitom lze vyjít z libovolného pořadí. Důkaz. Připomeňme, že symbol n\ (čti „n faktoriál") značí přirozené číslo definované: n\ = n • (n — 1).....2-1. Dokazovat budeme obě části věty najednou, a to matematickou indukcí. a) Pro n = 1 obě tvrzení triviálně platí. ß) Předpokládejme, že obě tvrzení platí pro 1,..., n — 1, a budeme je dokazovat pro n. Nechť (ri,...,rn) je libovolné pořadí z n prvků. Podle indukčního předpokladu je všech pořadí, která mají na posledním místě prvek rn, celkem (n — 1)! a lze je seřadit tak, že následující vznikne z předchozího provedením jedné transpozice. V posledním z těchto pořadí proveďme transpozici prvků rn a Vi (1 < i < n — 1) a stejnou úvahou jako výše dostaneme (n — 1)! pořadí s prvkem r i na posledním místě. Takto vystřídáme na posledním místě všech n prvků, čímž dostaneme všechna různá pořadí z n prvků, kterých je tedy n • (n — 1)! = n!, přičemž následující pořadí vzniklo vždy z předchozího provedením jedné transpozice. D Věta 1.2. Provedení jedné transpozice změní paritu daného pořadí. Důkaz. Provedeme ve dvou krocích. Nejprve pro transpozici sousedních prvků a potom pro transpozici libovolných dvou různých prvků daného pořadí. 30 Matice a determinanty a) Nechť v pořadí R = (ri,..., rj,rj+i, ...,rn) je t inverzí. Provedením transpozice sousedních prvků r, a rj+i dostaneme pořadí R' = (n,..., rj+i, r v němž je buď í — 1, nebo í + 1 inverzí. Tedy i?' má opačnou paritu než R. ß) Nechť R = (ri,...,rj,..., 7-j,..., rn) je dané pořadí. Provedením transpozice prvků r, a r j dostaneme pořadí R' = (n,..., rj,..., r i,..., rn). Tuto transpozici však lze realizovat postupným provedením (j — i) + (j — í — 1) = 2(j — i) — 1 transpozic sousedních prvků. Ale číslo 2(j — i) — 1 je liché, tzn. užitím a) dostáváme tvrzení. D Věta 1.3. Nechť n > 2. Pöä; 2 celkového počtu n\ různých pořadí z n prvků je y sudých a y lichých pořadí. Důkaz. Tvrzení věty plyne ihned v vět 1.1. a 1.2. D Definice. Nechť M = {1,2,... ,n} je konečná množina o n prvcích. Pak bijektivní zobrazení P množiny M na sebe se nazývá permutace množiny M nebo krátce permutace. Permutaci P definovanou: P (it) = jr, Pr0 t = 1,..., n, budeme zapisovat ve formě dvouřádkové tabulky tvaru: í k i-i ■■■ in\ \jl h ■■■ in)' Poznámka. Permutace množiny M je tedy bijekce M —y M, kterou zapisujeme ve tvaru dvouřádkové tabulky. Znamená to, že v horním i dolním řádku této tabulky musí být vždy nějaké pořadí z n prvků. Zřejmě lze tutéž permutaci P zapsat v uvedeném tvaru celkem n\ formálně různými způsoby (zaměníme-li pořadí sloupců v tabulce permutace). Všech těchto n\ zápisů permutace P je samozřejmě naprosto rovnocenných, i když nejčastěji budeme permutaci zapisovat v tzv. základním tvaru: (\ 2 ••• n\ \h k2 ■■■ knJ' Příklad 1.2. Pro n = 5 jsou: (1 2 3 4 5\ /3 2 1 4 5\ ÍA 1 5 2 3\ V2 3 5 4 \y reSp- V5 3 2 4 l)1 reSp' \4 2 1 3 5J 1 Pořadí a permutace 31 tři formálně různé zápisy téže permutace (z celkového počtu 5! = 120 možných zápisů této jedné permutace). Věta 1.4. Počet různých permutací n-prvkové množiny je roven n\. Důkaz. Zapíšeme-li každou permutaci v základním tvaru: íl 2 ••• n \ki k2 ■■■ kn pak různých permutací bude přesně tolik, kolik bude různých pořadí v dolním řádku. Těch je však n! podle věty 1.1. (1). D Definice. Permutace P se nazývá sudá permutace, resp. lichá permutace, jestliže počtu inverzí v horním a dolním řádku tabulky permutace P je sudé číslo, resp. liché číslo. Hovoříme pak též o paritě permutace. Poznámka. I když danou permutaci P můžeme zapsat n\ formálně různými tabulkami, je předchozí definice korektní, neboť při libovolném zápisu permutace P je parita horního a dolního řádku (chápaných jako pořadí) buď vždy stejná, nebo vždy rozdílná. Tento fakt plyne z toho, že při přechodu od jednoho zápisu permutace P k jinému provádíme totiž jistý počet transpozic, a to současně v horním i dolním řádku. Věta 1.5. Nechť n > 2. Pak z celkového počtu n\ různých permutací n-prvkové množiny je y sudých permutací a y lichých permutací. Důkaz. Každou permutaci zapíšeme v základním tvaru: íl 2 ••• n \k\ k2 ■■■ kn Parita permutace je pak shodná s paritou pořadí v dolním řádku a věta plyne bezprostředně z věty 1.3. D Na závěr paragrafu využijeme příležitosti, kterou nám permutace poskytují, a vrátíme se krátce k algebraickým strukturám. Jak bylo výše řečeno, permutace n-prvkové množiny M je bijekce M -4- M, tedy zobrazení. Pro permutace tak platí všechny základní poznatky o zobrazeních, uvedené dříve. Například můžeme permutace skládat (ve smyslu skládání 32 Matice a determinanty zobrazení), přičemž zřejmě výsledné zobrazení (tj. složení dvou bijekcí) je také bijekce M —> M, čili permutace. Konkrétně, zapíšeme-li permutace P, R ve tvaru: p'1 2 ••• n\ R=(ll *2 ••• i, KH «2 ••• inj \Jl J2 ••• Jn pak složením P a R (y tomto pořadí) dostaneme permutaci: RoP=(1 2 - n \Jl J2 ••• Jn Tedy množina všech permutací n-prvkové množiny M s operací o skládání permutací je grupoid, který podle V.5.2. kap. I. je pologrupou. Platí však ještě více, jak ukazuje následující věta. Věta 1.6. Množina všech permutací n-prvkové množiny s operaci o skládáni permutací je grupou. Tato grupa je pro n > 3 nekomutativní. Důkaz. Podle předchozí poznámky jde o pologrupu. Dále zřejmě permutace: je jedničkou a k libovolné permutaci: P=(H ••• existuje inverzní permutace, a sice: h ■■■ Jn %\ ••• %n Tedy množina všech permutací n-prvkové množiny s operací o je grupa. Nechť n > 3. Pak pro: 1 2 3 --A A 2 3 3 1 2 ...y' \1 3 2 platí R o P ý: P o R (ověřte si detailně sami!), a tedy operace o není komutativní. D Poznámka. Předchozí věta udává jeden z nejjednodušších příkladů nekomutativní grupy. Tato grupa se obvykle nazývá grupa permutací (na n-prvkové množině M) nebo též symetrická grupa permutací stupně n. 2 Determinanty 33 §2. Determinanty Jedním ze základních pojmů celé moderní matematiky je pojem matice. Teorie matic hraje ústřední úlohu v tzv. lineární algebře. Její výsledky se pak aplikují při řešení soustav lineárních rovnic, při studiu vektorových prostorů a v celé řadě dalších odvětví nejenom matematiky. Definice. Nechť T je číselné těleso, m, n jsou přirozená čísla. Pak obdélníkové schéma tvaru: A = «21 «22 • • • (í2n \Gto1 Q>m1 ' ' ' Q"mnJ (1) kde a-ij G T pro i = 1,..., m aj = 1,..., n, se nazývá matice typu m/n (nad tělesem T). Označení: A = (öy) typu m/n. Čísla a,ij G T se nazývají prvky matice A. Matice A = (a,j) typu m/n a matice B = (bij) typu p/q jsou si rovny, jestliže jsou stejného typu (tj. m = pAn = q)& je-li a,j = bij pro každé hj- Poznámka. 1. Předchozí definice matice je sice názorná, ale přísně vzato není zcela korektní, neboť se v ní používá formálně nejasného a nepřesného pojmu „obdélníkové schéma" (a je pak nutné hovořit o rovnosti dvou matic). Zcela přesně by bylo třeba matici typu m/n nad tělesem T definovat jakožto zobrazení: /:{l,2,...,m}x{l,2,...,n}^T, kde f((i,j)) = a,ij. Při této definici by však většina tvrzení o maticích byla formálně značně komplikovaná a nepřehledná. Ponecháme tedy definici matice tak, jak byla původně uvedena (tj. vypisujeme vlastně funkční hodnoty uvedeného zobrazení / do onoho „obdélníkového schématu"). 2. Každý jednotlivý řádek matice A typu m/n nad tělesem T můžeme zřejmě uvažovat jako uspořádanou n-tici prvků (tj. čísel) z tělesa T, tzn. jinak řečeno, jako vektor z vektorového prostoru Tn. Má smysl pak hovořit o sčítání řádků matice, násobení řádku číslem z T, lineární kombinaci řádků, lineární závislosti a nezávislosti řádků, atd., a to ve smyslu uvedených operací, resp. pojmů tak, jak byly definovány ve vektorovém prostoru Tn. Matici A lze pak též chápat jako uspořádanou m-tici vektorů z Tn. 34 Matice a determinanty Analogicky můžeme sloupce matice A chápat jako vektory z vektorového prostoru Tm a provádět s nimi tytéž úvahy. Definice. Nechť A = (a^) je matice typu m/n nad T. Potom: (1) je-li resp. Cki,---,Ckn je k-tý řádek matice B, resp. C. Potom det A = det B + det C. Schématicky zapsáno, platí: on h\ + Chi ani air, hn + an ftfcl air, hr ani ' ' ' 0"n + «11 Cyfcl Olr C/cr Oni • • • ar, Důkaz. Tvrzení plyne přímo z definice determinantu, neboť pro každý člen determinantu det A platí: (_l)/(jl,-.,Ín).aiji. (_l)/0'l.-Jn).Olji •&jt :3k ''' ' ("*jfc + c/cjj; J.....anjn — ínjn + (-l)I{n'-'Jn)-ain.....ckjk.....anjn. D Poznámka. Předchozí větu lze zřejmě rozšířit pro libovolný konečný počet sčítanců v /s-tém řádku matice A (dokáže se pomocí matematické indukce). Věta 2.3. Nechť matice B vznikne z matice A: (1) záměnou dvou různých řádků. Potom je det B = — det A. (2) vynásobením, jednoho řádku pevným číslem t G T. Potom je det B = t ■ det A. 2 Determinanty 37 Důkaz. (1): Zaměňme v matici A k-tý řádek s r-tým řádkem, kde k ^ r. Pak součiny vyskytující se v det A a det B zůstanou stejné, ale mají vždy opačná znaménka, protože permutace: •• k ■■ r n\ a n ■■ ■■ k ■■ r n JI ■■ ■■ J k ■■ ■■ Jr ■■ ■ ■ 3n) Ui •• ■■ Jr ■■ ■■ Jk ■■ Jn mají (podle věty 1.2.) různou paritu. Potom však det B = — det A. (2): Plyne přímo z definice determinantu, neboť vynásobíme-li v matici A např. k-tý řádek prvkem t G T, potom: det B = £(-l)'üi,...jn) . aiji.....t ■ akjk.....anjn = t. £(_i)/Üi,...jn) . aiji.....anjn = t. det A. D Věta 2.4. Nechť v matici A: (1) jeden řádek sestává ze samých nul. Potom je det A = 0. (2) dva různé řádky jsou shodné. Potom je det A = 0. (3) jeden řádek je t-násobkem jiného řádku (t £ T lib.). Potom je det A = 0. (4) jeden řádek je lineární kombinací ostatních řádků. Potom je det A = 0. Důkaz. (1): Plyne přímo z definice determinantu. Každý člen det A je totiž roven nule, poněvadž obsahuje nulu (a sice z toho řádku, který sestává ze samých nul). (2): Zaměníme-li ty dva řádky matice A, které jsou shodné, pak matice A se zřejmě nezmění. Podle věty 2.3. (1) však musí být det A = — det A, tj. 2 • det A = 0, odkud však dostáváme, že det A = 0. (3): Plyne přímo z věty 2.3. (2) a z právě dokázané části (2). (4): Nechť např. k-tý řádek matice A je lineární kombinací ostatních řádků. Pak det A lze podle poznámky za větou 2.2. vyjádřit jako součet (n — 1) determinantů, z nichž však v každém je k-tý řádek násobkem nějakého jiného řádku. Podle části (3) této věty je však každý z těchto (n — 1) determinantů roven nule, a tedy detJ4 = 0 + 0 + --- + 0 = 0. D Věta 2.5. Hodnota determinantu matice A se nezmění, jestliže: (1) k jednomu řádku matice A přičteme libovolný násobek jiného řádku, 38 Matice a determinanty (2) k jednomu řádku matice A přičteme libovolnou lineární kombinaci ostatních řádků, (3) jeden řádek matice A ponecháme beze změny a k ostatním řádkům přičteme jeho libovolné násobky. Důkaz. (1): Plyne bezprostředně z vět 2.2. a 2.4. (3). (2): Plyne z poznámky za větou 2.2. a z věty 2.4. (4). (3): Plyne z (1), jejím opakováním. D Poznámka. Z věty 2.1. plyne, že ke každé z následujících vět, tj. 2.2., 2.3. a 2.4. platí analogická věta, kterou získáme tak, že v původní formulaci slovo „řádek" nahradíme slovem „sloupec". Například, platí tedy tvrzení: „jestliže v matici A je jeden sloupec lineární kombinací ostatních sloupců, potom je detA = 0", atd. Tuto úvahu lze zřejmě uplatnit na každé tvrzení o determinantech matice, týkající se řádků matice. Dostaneme tak stejné tvrzení, týkající se sloupců. Analogicky naopak (tzn. z každého platného tvrzení o determinantech, týkajícího se sloupců dané matice, dostaneme záměnou slova „sloupec" za slovo „řádek" platné tvrzení, týkající se řádků). Větu 2.5. (a odpovídající větu pro sloupce) často využíváme při konkrétních výpočtech determinantů, kdy se přičítáním vhodných násobků jedněch řádků (resp. sloupců) k jiným řádkům (resp. sloupcům) snažíme matici upravit na takový tvar, z něhož již determinant lehce spočítáme. Napří- A latici /au A tvari Ol2 • i: al,(n-l) din 0 Ö22 • a2,(n-l) (l2n 0 0 • ' a(n-l),(n-l) a{n—l),n \o 0 • 0 Q>nn (tj. všude pod hlavní diagonálou jsou nuly), pak det A = au ■ 022.....ann, jak plyne ihned z definice determinantu. Stejný výsledek (tzn. hodnota determinantu je rovna součinu prvků v hlavní diagonále) dostaneme, jestliže v matici jsou samé nuly nad hlavní diagonálou. Ve zbývající části tohoto paragrafu pak odvodíme ještě jeden způsob jak zjednodušit výpočet determinantu. 2 Determinanty 39 Definice. Nechť A = (ay) je čtvercová matice řádu n. Nechť je zvoleno k jejích řádků a sloupců (k < n), a sice: 1 < i\ < i^ < ■ ■ ■ < ik < n, resp. 1 < ji < j2 < • • • < Jjt < n. Pak matice: /a. M «Úl *Í2Í1 V '«fc.71 *«1J2 *«*J2 Ji2Ji **AJ* se nazývá submatice matice A určená řádky i\,..., i^ a sloupci ji ■ ■ ■ -,jk-Její determinant \M\ se nazývá minor řádu A; matice A. Zbývajícími (n — k) řádky a (n — k) sloupci je určena submatice M matice A, která se nazývá doplňková submatice k submatici M a její minor \M\ se nazývá doplněk minoru \M\. Označme sm = i\ + «2 H-------Hjt + ji H-------h jjt- Pak číslo (-1)SM • |M| se nazývá algebraický doplněk minoru \M\. Člen doplňku \M\ vynásobený číslem (—1)Sm se pak nazývá člen algebraického doplňku minoru \M\. Příklad 2.2. Nechť A je čtvercová matice řádu 4 nad tělesem M: A / 1 2 3 4\ 0 12-3 -12 0 1 \ 6-2 -1 3/ Zvolíme-li «i = 1, «2 = 3, ji = 2, J2 = 3, tj. první a třetí řádek, resp. druhý a třetí sloupec, pak submatice M určená zvolenými řádky a sloupci je tvaru: M 2 3 2 0 tzn. minor \M\ = —6. Doplňkovou submatici je pak: M Dále je sm 0 -3 6 3 -18. tzn. doplněk \M\ 1 + 3 + 2 + 3 = 9, tzn. algebraický doplněk minoru \M\ je: (-1)SM ■ \M\ = (-1)9 • 18 = -18. 40 Matice a determinanty Poznámka. Označíme-li s-^ součet indexů řádků a sloupců určujících doplňkovou submatici M, pak zřejmě platí (—1)SM = (—1)sm, neboť sm + sj^ = 2 ■ (1 + 2 + • • • + n) je sudé číslo, a tedy sm a sj^ musí být obě buď současně sudá, nebo současně lichá. Tedy algebraický doplněk minoru \M\ je též roven číslu (—1)sm ■ \M\, což lze někdy při praktických výpočtech s výhodou použít. Věta 2.6. Nechť A je čtvercová matice řádu n, nechť \M\ je minor řádu k matice A (k < n). Pak součin libovolného členu minoru \M\ s libovolným členem jeho algebraického doplňku je členem determinantu \A\. Důkaz. Nechť submatice M je určena řádky i\,..., ik a sloupci ji,... ,jk matice A, přičemž ii < Í2 < ■ ■ ■ < ik, resp. ji < ji < ■ ■ ■ < j f.. Zaměňme ii-tý řádek matice A s {i\ — l)-tým řádkem, pak s {i\ — 2)-tým řádkem, atd., až s prvním řádkem. Celkem jsme takto provedli {i\ — 1) záměn řádků matice A. Podobně pomocí («2 — 2) záměn řádků přemístíme «2-tý řádek na místo druhého řádku, atd., až pomocí {if. — k) záměn řádků přemístíme ik-tý řádek na místo k-tého řádku. Celkem jsme tedy provedli («i - 1) + («2 - 2) + • • • + {ik - k) = («i + • • • + ik) - (1 + 2 + • • • + k) záměn řádků matice A. Analogicky pomocí (ji H------\~ jk) — (1 + 2 + • • • + /s) záměn sloupců matice A přemístíme ji,... ,i/t-tý sloupec na místo prvního, ..., až A;-tého sloupce. (Důležité je, že se po provedení těchto úprav nezměnilo původní pořadí řádků a sloupců submatice M ani její doplňkové submatice M, tzn. nezměnily se hodnoty jednotlivých členů minoru \M\ ani členů jeho doplňku \M\.) Tedy pomocí {ii~\-------\- ik + ji + • • • + jk) — 2 • (H-------\-k) záměn řádků, resp. sloupců jsme z matice A dostali jistou matici B, přičemž podle věty 2.3. (1) platí: \ß\ = Ml . (_l)ň+-+«fc+Ji+-+Ífc-2-(l+-+A;) _ \M . (_iyi+-+ik+3i+"+3k odkud po vynásobení číslem (—l)nH ^k+ji+-+jk dostáváme: \A\ = \B\ ■ {-i)ií+-+ik+Ji+-+Jk_ (2) Submatice M je v matici B určena prvními k řádky a prvními k sloupci. Potom však součin libovolného členu minoru \M\ s libovolným členem doplňku \M\ je členem determinantu \B\, neboť označíme-li B = (bij), pak člen minoru \M\, resp. člen doplňku \M\ jsou tvaru: (_l)/(*i,..A).6líi.....htki resp. (_1)/(í*+i,..)í«).6a:+1 .....6nín? (3) 2 Determinanty 41 (I ••• k\ kde /(íi,..., ífc) značí počet inverzí v permutaci I , resp. iU^+i, \*1 • • • * A;/ značí počet inverzí v permutaci I I. Označíme-li I (ti,..., tn) V ífe+l • • • *n/ počet inverzí v permutaci I j, pak platí (rozmyslete si proč!): \*i • • • tnj I (ti,..., t k) + J(tfc_|_i,... ,tn) = I (ti,... ,tn). Potom však vynásobením obou členů z (3) dostáváme: (—iy(ti,—,tn) . 0lt^.....bntn, což je však člen determinantu \B\. Odtud (podle (2)) součin libovolného členu minoru \M\ s libovolným členem doplňku \M\ vynásobený číslem (—l)ílH i-h+jiH K?* je členem determinantu \A\. To však je již žádané tvrzení, neboť libovolný člen algebraického doplňku minoru \M\ v matici A obdržíme z libovolného členu doplňku \M\ vynásobením číslem (—l)ílH ^k+h-\ h?'*, q Věta 2.7. (Laplaceova věta) Nechť A = (ciy) je čtvercová matice řádu n, nechť je pevně zvoleno k řádků matice A, kde 0 < k < n. Pak determinant \A\ je roven součtu všech (k) součinů minoru řádu k vybraných ze zvolených k řádků s jejich algebraickými doplňky. Důkaz. Ze zvolených řádků lze zřejmě vybrat minor řádu k právě (k) různými způsoby. Podle věty 2.6. je součin členu takového minoru s členem jeho algebraického doplňku členem determinantu \A\. Přitom je zřejmé, že dostáváme navzájem různé členy. K důkazu našeho tvrzení tedy stačí spočítat, zda uvedeným způsobem dostaneme všechny členy determinantu |.A| (kterých, jak víme, je n!). Ale každý minor řádu k má A;! členů, každý jeho algebraický doplněk má (n — k)\ členů a vybraných minoru je (u), tzn. celkem dostáváme: k\-(n-k)\-(^)=k\-(n-k)\- M^]I = n\ členů determinantu |.A|, a tedy věta platí. D Poznámka. Laplaceova věta se také někdy nazývá „věta o rozvoji determinantu podle zvolených k řádků". Její praktický význam spočívá v tom, že výpočet determinantu určitého řádu, např. n, převádíme na výpočet jistého počtu determinantů matic řádu menšího než n. Připomeňme, že na základě věty 2.1. platí analogická věta k Laplaceově větě zformulovaná pro sloupce (tzn. slovo „řádek" v Laplaceově větě nahra- 42 Matice a determinanty dime slovem „sloupec"). Říkáme pak, že jsme determinant vyjádřili rozvinutím podle daných k sloupců. Definice. Nechť A = (a^) je čtvercová matice řádu n. Pak algebraický doplněk jednoprvkové submatice sestávající z prvku Oy budeme krátce nazývat algebraický doplněk prvku a\j a označovat symbolem Aij. Důsledek. Nechť A = (a^) je čtvercová matice řádu n, nechť i, resp. j je pevně zvolený řádkový, resp. sloupcový index. Pak plati: resp. \A\ = au ■ Au + ai2 • Ai2 H-------h ain ■ Ain, \A\ = aij • Aij + a2j ■ A2j H-------V anj ■ Anj. Důkaz. Uvedený důsledek je doslovným přepisem Laplaceovy věty, a sice pro k = 1. D Příklad 2.3. Užitím Laplaceovy věty spočtěme determinant \A\, kde A je matice řádu 4 (nad R) tvaru: A (l 1 3 4^ 2 0 0 8 3 0 0 2 \4 4 7 5/ 1. Výpočet provedeme rozvinutím podle 2. a 3. řádku (při praktickém výpočtu je zřejmě nejvýhodnější volit řádky, v nichž se vyskytuje pokud možno hodně nul). Pak: \A\ 0 0 0 0 2 0 3 0 1 4 4 5 3 4 -(-1)8 + 7 5 {■> ^ •(-1)10 + 2 0 3 0 2 8 3 2 0 8 0 2 1 3 4 7 1 4 4 5 1 3 4 7 -1)9 + \ii + 2 8 3 2 0 8 0 2 1 3 4 7 1 1 4 4 •(-1)10 + (-1)12 = (-20) • (-5) = 100. 2. Spočtěme tentýž determinant rozvinutím podle 1. sloupce. Pak: 3 Algebra matic 43 \A\ = 1 0 0 8 1 3 4 0 0 2 •(-l)2+ 2- 0 0 2 4 7 5 4 7 5 1 3 4 0 0 8 .(-1)5 = 0-2- 0 0 2 (-l)3 + 3- 2 • 10 + 3 • 40 + 0 = 100. 1 3 4 0 0 8 4 7 5 {-iY §3. Algebra matic V tomto paragrafu se nejprve vrátíme k maticím typu m/n (tj. obecně k obdélníkovým maticím) a ukážeme si některé algebraické struktury, které lze pomocí matic utvořit. Budeme předpokládat, že všechny matice jsou uvažovány nad pevným číselným tělesem T (nebude-li výslovně řečeno jinak). Označení. Všude v dalším budeme symbolem Matmn(T) označovat množinu všech matic typu m/n nad pevným číselným tělesem T. Napíšeme-li tedy, že A E Matmn(T), pak to bude znamenat, že A je matice typu m/n nad tělesem T. Definice. Nechť A = {a,ij),B = (bij) G Matmn(T), tET libovolné. Pak: (1) matice A + B = (cy) E Matmn(T) definovaná: C-ij — Q>ij + Oij pro i = 1,..., m, j = 1,..., n se nazývá součet matic A, B, (2) matice t ■ A = (d{j) G Matmn(T) definovaná: d v t • o,ij pro i = 1,..., ra, j = 1,..., n se nazývá součin čísla t s maticí A. Vidíme, že součet matic je definován pouze pro matice stejného typu, přičemž pak sčítáme „odpovídající si prvky obou matic". Sčítání matic je zřejmě operací na množině Matmn(T). Podobně, při součinu čísla s maticí násobíme tímto číslem každý prvek dané matice. Součin čísla s maticí tedy můžeme chápat jako vnější operaci. Věta 3.1. (Matmn(T),+) je komutativní grupa. 44 Matice a determinanty Důkaz. Z předchozí definice a ze známých vlastností obyčejného sčítání čísel plyne, že (Matmn(T),+) je pologrupa, která je komutativní. Lehce se ověří, že nulová matice 0mn je nulou, resp. pro libovolnou matici A = (ciij) G Matmn(T) je matice (—ßy) € Matmn(T) opačným prvkem k A. Označujeme (—ßy) = —A. Tedy (Matmn(T),+) je komutativní grupa. D Věta 3.2. Množina Matmn(T) je vektorový prostor nad T (vzhledem k operacím sčítání matic a součinu čísla s maticí), jehož dimenze je rovna m-n. Důkaz. Podle předchozí věty je (Matmn(T), +) komutativní grupou. Dále, rozepsáním se lehce ověří platnost vztahů: (1) t-(A + B) = t-A + t-B, (2) (t + s) ■ A = t ■ A + s ■ A, (3) (t-s)-A = t-(s-A), (4) 1 • A = A pro lib. t, s e T a A, B G MatTOn(T). Tedy z definice vektorového prostoru plyne, že Matmn(T) je vektorový prostor nad T (roli vektorů hrají tedy matice typu m/n nad T). Zbývá ukázat, že dimMatmn(T) = m-n, což provedeme tak, že zkonstruujeme bázi vektorového prostoru Matmn(T). Pro r = l,...,m, s = 1,... ,n označme symbolem Urs matici typu m/n, která má na r, s-tém místě (tj. v r-tém řádku a s-tém sloupci) jedničku a všude jinde samé nuly. Tedy: TT / w i ^A (l pioi = r, j = s Urs = (uij) typu m/n, kde Uij = < .. Dostáváme tak celkem m-n matic U\\,..., U\n, £%, • • •, t^n? ■ ■ ■ -, Um\,... ,Ur o nichž se rozepsáním lehce ukáže (proveďte si podrobně sami!), že jsou lineárně nezávislé a že generují celý prostor Matmn(T), tzn. jsou jeho bází. D Definice. Nechť A = (ay-) je matice typu m/n, B = (bij) je matice typu n/p (obě nad týmž tělesem T). Pak matice A- B = (c-ij) typu m/p, kde: n C-ij = 2-*i ^ik ' ok j, k=l pro i = l,...,m, j = l,...,p, se nazývá součin matic A,B (v tomto pořadí). 3 Algebra matic 45 Příklad 3.1. Nechť A, B jsou matice nad M tvaru: A 1 2 -1 0 0 1 -1 -7 8 0 0 -5 B ( 3 2\ -4 1 1 0 V-2-3/ Pak: A-B resp. součin B ■ A není vůbec definován. Poznámka. Při násobení dvou matic A, B zřejmě podstatně záleží na jejich pořadí. Z předchozího příkladu vidíme, že se může stát, že součin A ■ B je definován, kdežto součin B ■ A definován není. Ale i v případě, že oba součiny A- B a B ■ A jsou definovány a jsou stejného typu (tzn. A, B jsou čtvercové matice stejného typu), neznamená to, že A ■ B = B ■ A, jak je vidět z následujícího příkladu. Příklad 3.2. Nechť n > 2 a A, B jsou čtvercové matice řádu n (nad T) tvaru: A (l 0 ••• 0\ 0 0 ••• 0 \o o B /O 0 ••• 0\ 1 0 ••• 0 0/ \o o 0/ Pak přímým výpočtem zjistíme, že A ■ B = 0nra, kdežto B ■ A = B, což znamená, že A ■ B ^ B ■ A. Vidíme tedy, že násobení matic obecně není komutativní. Na druhé straně, násobení matic je však asociativní a násobení matic je distributivní vzhledem ke sčítání matic (samozřejmě za předpokladu, že všechny použité součty a součiny matic jsou definovány), jak ukazují následující dvě věty. Věta 3.3. Násobení matic je asociativní, tj. nechť matice A je typu m/n, B je typu n/p a C je typu p/q. Potom platí: 46 Matice a determinanty A-{B ■ C) = {A-B)-C. Důkaz. Nechť platí předpoklady věty, přičemž A = (dij), B = (bij), C = n (cíj). Pak matice A • B = (dij) je typu m/p, přičemž dij = X] o,íu • buj. u=l p Dále pak (A • B) • C = (fij) je matice typu m/q, kde fij = X)^m> ' cvj = v-l p n X) X] aiy. ' buv • cvj i přičemž v posledním výrazu není třeba v součinu za v=lu=l sumačními znaky závorkovat, neboť se jedná o součin čísel (z T), pro který platí asociativní zákon. p Podobně, matice B • C = (gij) je typu n/q, kde gij = X^w ° cvj. Dále v=l pak A • (B • C) = (hij) je matice typu m/q, kde: n n p p n ">ij = 2-*i ^iu ' Suj = 2~i ^iu ' 2-*i "i" ' Cvj = Z-/ 2-*i ^iu ' Ouv ' Cvj = J i j • u=l «=1 v=l v=lu=l Dohromady tedy platí dokazovaná rovnost. D Věta 3.4. Násobení matic je distributivní vzhledem ke sčítání matic, tj.: (1) Nechť matice A je typu m/n, resp. B, C jsou typu n/p. Potom platí: A-(B + C) = A-B + A-C. (2) Nechť matice F, G jsou typu m/n, resp. H je typu n/p. Potom platí: (F + G)-H = F-H + G-H. Důkaz. (1): Nechť A = (a^) je typu m/n, resp. B = (bij), C = (cíj) jsou typu n/p. Potom A • (B + C) = (dij) je matice typu m/p, přičemž n dij = X] aik • (bkj + ckj)- Dále, matice A- B + A- C = (fij) je matice typu k=i m/p a platí: n n n fij = Yl,aik' bkj + Yl,aik' ckj = XI aik - (bkj + Ckj) = dij. k=l k=l k=l 3 Algebra matic 47 Dohromady tedy platí (1). (2): Dokáže se analogickým způsobem jako (1). D Definice. Čtvercová matice řádu n (nad T) tvaru: /l 0 0 •• 0 °\ 0 1 0 •• 0 0 0 0 1 •• 0 0 0 0 0 • • 1 0 \o 0 0 •• 0 v E„ (tj. matice mající v hlavní diagonále samé jedničky a všude jinde samé nuly) se nazývá jednotková matice (řádu n). Věta 3.5. Množina všech čtvercových matic řádu n (nad T) s operacemi sčítání matic a násobení matic, tj. (Matnn(T), +, •), je okruhem s jedničkou. Tento okruh pro n > 2 není komutativní a obsahuje dělitele nuly. Důkaz. Je zřejmé, že sčítání matic, resp. násobení matic jsou operace na množině Matnn(T). Z vět 3.1., 3.3. a 3.4. pak ihned plyne, že (Matnn(T), +, •) je okruh. Dále, pro libovolnou matici A G Matnn(T) zřejmě platí (ověřte si rozepsáním!), že: En -A — A • Er, A, a tedy jednotková matice En je jedničkou okruhu (Matnn(T), +, •). Z příkladu 3.2. pak plyne, že pro n > 2 tento okruh není komutativní a obsahuje dělitele nuly (nulou je zde zřejmě nulová matice řádu n, tzn. 0, D Poznamenejme, že okruh (Matnn(T), +, •), stručně též nazývaný „okruh matic", je jedním z nejjednodušších příkladů nekomutativního okruhu. Věta 3.6. Nechť A = (a^) je matice typu m/n, B = (bij) je matice typu n/p. Pak platí: (A ■ B)' = B' -A' (tj. transponovaná matice k součinu matic je rovna součinu transponovaných matic v opačném pořadí). 48 Matice a determinanty Důkaz. Matice (A • B)' = (cý) je typu p/m, přičemž c,j je prvek stojící n v matici A-B v j-tém řádku a i-tém sloupci, tzn. Cý- = ^(ijk'bki- Dále pak fc=i n n matice B' ■ A' = (dij) je typu p /m, kde dý- = J] 6fei • ajk = J] ajfe • bki = cih k-l k-l a tedy platí dokazovaná rovnost. D Věta 3.7. (Cauchyova věta) Necht A = (ay), i? = (bij) jsou čtvercové matice řádu n. Pak platí: \A-B\ = \A\-\B\. Důkaz. Uvažme matici H řádu 2n tvaru: (a\\ (ii2 • • • a\n ' H «21 «22 dni an2 -1 0 0 -1 ď2n 0 o o o o o &11 &12 &21 &22 o o bin fon V 0 0 ••• -1 bni bn2 ■■■ bnnJ Užitím Laplaceovy věty (a sice rozvinutím podle prvních n řádků) dostáváme: \M\ = \A\.\B\. (1) Nyní ke každému z posledních n sloupců přičteme vhodnou kombinaci prvních n sloupců tak, aby na místě každého bij vznikla nula (přesněji řečeno: k (n + j)-tému sloupci přičteme fty-krát 1. sloupec + • • • + 6nj-krát n-tý sloupec, pro j = 1,..., n). Dostáváme tak matici: K (O-ll «12 «21 «22 dni (ín2 -1 0 0 -1 V o o a>ln cll c12 0>2n C21 C22 Q>nn Cnl Cn2 0 0 0 0 0 0 -10 0 Cln\ C2n Cnn 0 o 0/ 3 Algebra matic 49 n v níž Cij = au ■ bij H-------h ain ■ bnj = Y^aik • hj, Pr0 h 3 = !,■■■,n. Při k=i tomto označení je tedy (cy) = A-B. Rozvinutím podle posledních n sloupců matice K pak dostáváme: \K\ = |A-S|-(-l)n-(-l)1+-+n+(n+1)+-+2n = \A-B\-{-lf-n-{n+1^ = \A-B\. (2) Ale úpravy, pomocí nichž jsme z matice ií dostali matici K, nemění hodnotu determinantu (podle věty 2.5. (2) zformulované pro sloupce), a tedy \H\ = \K\, odkud pomocí (1) a (2) dostáváme: \A\.\B\ = \A.B\, což je žádané tvrzení. D Definice. Čtvercová matice A se nazývá regulární matice (resp. singulární matice), je-li |^4| ^ 0 (resp. \A\ = 0). Důsledek. Nechť A, B jsou čtvercové matice stejného řádu n. Pak platí: matice A- B je regulární <í=^ obě matice A í B jsou regulární. Důkaz. Tvrzení plyne přímo z definice regulární matice a z Cauchyovy věty. D Definice. Nechť A je čtvercová matice řádu n. Matice X s vlastností: A ■ X = En A X ■ A = En (3) (pokud taková existuje) se nazývá inverzní matice k matici A a označuje se symbolem A~ľ. Poznámka. Z (3) především plyne, že inverzní matice (pokud existuje) musí být také čtvercová a řádu n. Dále, vzhledem k tomu, že (Matran(T), •) je pologrupa s jedničkou En (viz věta 3.5.) a pojem inverzní matice je totožný s pojmem inverzního prvku v této pologrupě, může k matici A existovat nejvýše jedna inverzní matice (podle V.l.3., kap. II.) a označení A~ľ je tedy korektní. Následující věta a její důsledek nám pak udává nutnou a dostatečnou podmínku existence inverzní matice a vzorec pro její výpočet. 50 Matice a determinanty Věta 3.8. Nechť A = (ay) je čtvercová matice řádu n. Potom platí: k maticí A existuje matice inverzní <í=^ A je regulární matice. Důkaz. „=£-": Nechť k A existuje inverzní matice A~ľ. Pak platí En = A ■ A'1, odkud 1 = \En\ = \A-A~1\ = |^4| -1>1—1|. Pak ale je \A\ ^ 0, a tedy A je regulární matice. „<=u: Nechť A je regulární matice, tzn. \A\ ^ 0. Označme: A* (A1X A2l A\2 A22 \Aln A: 2n Ani\ An2 Ann J matici, v níž na i,j-tém. místě je Aß (pozor na pořadí indexů!), tzn. algebraický doplněk prvku stojícího na j,i-tém místě v původní matici A. Poznamenejme, že matice A* se nazývá adjungovaná matice k matici A. Nyní dokážeme, že matice X = Ar • A* je inverzní maticí k matici A. n Nechť A ■ X = (c{j), tzn. Cý- = m • Yl dik ' ^jfe- Potom ale: 1 ' fc=i n -pro i = j je ca = t4t • J2aik • Aik = At ■ \A\ = 1 (užitím důsledku Laplaceovy věty), \A\ Z^"í/c ^iH, — \A\ k=l -pro i + j je Cij = Ar • E°ifc • 4j* = pr • 0 = 0 (výraz Eaik • Ajk je ái=1 fc=l roven nule, neboť podle důsledku Laplaceovy věty se jedná o determinant matice, v níž i-tý a j-tý řádek jsou stejné). Vidíme tedy, že A ■ X = (cý-) = En. Analogickou úvahou se zjistí, že X- A = En, tzn. dohromady dostáváme, že X = A-1, a tedy k matici A existuje matice inverzní. n Důsledek. Nechť A je regulární matice. Pak A-1 = ( m ) ■ A*. Důkaz. Tvrzení plyne ihned z 2. části důkazu předchozí věty. D Některé jednoduché základní vlastnosti inverzních matic, resp. regulárních matic nám popisují následující dvě věty. Věta 3.9. Nechť A, B jsou regulární matice řádu n. Pak platí: (1) (A"1)"1 = A, 3 Algebra matic 51 (2) (A ■ B)-1 = B-1 ■ A'1, (3) \A I = JÄ\> (4) (A')-1 = (A-1)'. Důkaz. (1) a (2) plynou z věty 1.4., kap. IL, a z věty 3.8., uvědomíme-li si, že (Matnn(T), •) je pologrupa s jedničkou. (3): Zřejmě A ■ A-1 = En, odkud podle Caucliyovy věty je \A\ ■ \A_1\ = \En\ = l, tzn. I^"1!^. (4): Podle věty 3.6. je (A'1)' ■ A' = (A ■ A'1)' = E'n = En a analogicky též A' ■ (^4-1)' = En, tzn. podle (3) je {A~1)' inverzní maticí k matici A', neboli platí (4). □ Věta 3.10. Nechť Matnn(T) značí množinu všech regulárních matic řádu n (nad T). Pak (Matnn(T), •) je grupa, která je pro n > 2 nekomutativní. Důkaz. Zřejmě En G Matnn(T). Podle důsledku Caucliyovy věty a podle vět 3.3. a 3.8. ihned dostáváme, že (Matnn(T), •) je grupa. Dále nechť n > 2. Vezměme matice A, B řádu n tvaru: A í1 ľ 0 1 0 0 0 • 0 • 1 • • 0 • 0 • 0 0 0 0 0 \0 0 0 • 0 • • 1 • 0 0 1/ /O 0 ••• 0 0 ••• = 0 0 ••• 0 1 ••• \1 0 ••• 0 0 1\ 0 1 0 1 0 0 0 0 0 0 0 0/ Potom zřejmě A, B jsou regulární, tj. A, B G Matnn(T) a platí A-B ^ B-A (ověřte si výpočtem!). Tedy uvažovaná grupa není komutativní. n Multiplikativní grupa regulárních matic řádu n (n > 2) je dalším poměrně jednoduchým příkladem nekomutativní grupy. Poznámka. Všimněme si, že z věty 3.8. bezprostředně plyne, že při praktickém ověřování, zda matice X je inverzní maticí k A, stačí ověřovat pouze jednu z rovností (3), tzn. rovností: A ■ X = En, X-A = En, 52 Matice a determinanty poněvadž druhá rovnost je již vynucena. (Je-li např. A ■ X = En, pak A je regulární a existuje matice A-1. Pak vynásobením výchozího vztahu zleva maticí A-1 a zprava maticí A dostáváme: A-1 ■ (A ■ X) ■ A = A-1 ■ En • A, tzn. po úpravě: X ■ A = En.) §4. Hodnost matice matici typu m/n nad číselným \0"tnl 0to2 ' ' ' Oirnn) kde a-ij E T. Jak již bylo dříve řečeno, řádky matice A můžeme chápat jako vektory z vektorového prostoru Tn. Potom vektory - řádky matice A generují v Tn jistý podprostor W a my se v dalším budeme zajímat o jeho dimenzi. Podobně, sloupce matice A lze chápat též jako vektory - tentokrát z vektorového prostoru Tm, přičemž tyto vektory - sloupce matice A generují v Tm jistý podprostor H. Je samozřejmé, že Tn a Tm jsou obecně dva zcela rozdílné vektorové prostory a totéž platí i o podprostorech W a H. Přesto však ukážeme, že dimenze obou těchto podprostoru musí být stejné, tzn. dimiy = dimií. Definice. Nechť A = (ajj) je matice typu m/n nad T. Pak dimenze vektorového podprostoru v Tn generovaného řádky matice A se nazývá hodnost matice A a označuje se symbolem h(A). Věta 4.1. Hodnost matice je rovna maximálnímu počtu jejích lineárně nezávislých řádků. Důkaz. Tvrzení plyne ihned z definice hodnosti matice, definice dimenze, definice báze a z věty 4.1., kap. I. D Poznámka. Z předchozího je zřejmé, že hodnost matice A je rovna nule, právě když A je nulovou maticí. Je-li tedy matice A nenulová, pak její hodnost je rovna některému přirozenému číslu. V tomto paragrafu bude A tělesem T, tzn.: (ay-) značit A í au 0,21 Ol2 Ö22 4 Hodnost matice 53 Další možnost vyjádření hodnosti matice nám ukáže následující věta. Poznamenejme k ní ještě to, že pojem minoru řádu k matice A lze zřejmě stejným způsobem jako v §2 definovat i pro libovolnou (obecně obdélníkovou) matici A typu m/n za předpokladu, že k < min{m, n}. Je-li však m 7^ n, nelze pak již samozřejmě hovořit o doplňku tohoto minoru. Věta 4.2. Nechť A je nenulová matice typu m/n. Pak hodnost matice A je rovna maximálnímu z řádů nenulových minoru matice A. Důkaz. Nechť A = (ojj) je nenulová matice typu m/n. Pak zřejmě existuje minor \M\ řádu k > 0 tak, že \M\ ^ 0 a všechny minory řádu většího než k (pokud vůbec existují) jsou rovny nule. Bez újmy na obecnosti lze předpokládat, že submatice M je určena prvními k řádky a prvními k sloupci matice A. Chceme nyní dokázat, že h(A) = k. Ale platí: a) Prvních k řádků matice A je lineárně nezávislých. V opačném případě by byly i řádky submatice M lineárně závislé a podle věty 3.2., kap. L, resp. věty 2.4. by byl \M\ = 0, což je spor. ß) r-tý řádek (k < r < m) matice A je lineární kombinací prvních k řádků. Nechť tedy k < r < m a nechť 1 < j' < n libovolné. Utvořme matici: I au ■ ■ ■ difc a\j > Dj= '■'■■'■ '■ Ofci • • • o,kk ak j tak, že matici M „ovroubíme" odpovídajícími prvky r-tého řádku a j-tého sloupce matice A. Determinant \Dj\ je zřejmě roven nule, neboť pro j > k je \Dj\ minorem řádu k + 1, resp. pro j < k obsahuje matice D j dva stejné sloupce. Rozviňme nyní \Dj\ podle posledního sloupce. Dostáváme: 0 = \Dj| = aij ■ Li + ü2j ■ L'2 H------+ a^j ■ Lk + arj ■ \M\, kde Li (i = l,...,k) jsou algebraické doplňky prvků posledního sloupce (uvědomme si, že Li nezávisí na j). Poněvadž \M\ ^ 0, můžeme psát: ari = ~ \M\ ' aij — ' " — rjvTf ' akj pro každé j = 1,2,..., n, což však znamená, že r-tý řádek je lineární kombinací prvních k řádků. 54 Matice a determinanty Z a) a ß) plyne, že maximálni počet lineárně nezávislých řádků matice A je roven číslu A, a tedy podle věty 4.1. je /i(^4) = fe. D Důsledek. Transponováním matice se její hodnost nezmění, tj. h(A) = h{Ä). Důkaz. Je-li A nulová matice, pak A' je též nulová matice a tvrzení platí. Nechť tedy A je nenulová matice a nechť h(A) = k. Pak podle předchozí věty existuje v A nenulový minor řádu k a všechny minory řádu většího než k jsou rovny nule. Uvažme nyní transponovanou matici A'. Vzhledem k tomu, že transponováním se nemění hodnoty minorů (plyne z věty 2.1.), existuje tedy i v matici A' nenulový minor řádu k a všechny minory řádu většího než k y A1 jsou rovny nule. To ale znamená (opět podle předchozí věty), že h(A') = k, a tedy h(A) = h(A'). D Věta 4.3. Hodnost matice je rovna maximálnímu počtu jejích lineárně nezávislých sloupců. Důkaz. Podle předchozího důsledku a podle věty 4.1. je hodnost matice A rovna maximálnímu počtu lineárně nezávislých řádků transponované matice A', tj. maximálnímu počtu lineárně nezávislých sloupců původní matice A. D Z předchozích tvrzení již vyplývá to, o čem jsme hovořili na začátku paragrafu, a sice je-li matice A matice typu m/n, pak dimenze podprostoru (v Tn) generovaného řádky matice A je rovna dimenzi podprostoru (v Tm) generovaného sloupci matice A. V dalším si nejprve všimneme případu, kdy matice A je čtvercová. Věta 4.4. Nechť A je čtvercová matice řádu n. Pak následující výroky jsou ekvivalentní: (1) matice A je regulární, (2) h(A) = n, (3) řádky matice A jsou lineárně nezávislé, (4) sloupce matice A jsou lineárně nezávisle. Důkaz. „(1) ^> (2)": Nechť A je regulární, tzn. \A\ / 0. Pak z věty 4.2. plyne, že h(A) = n. „(2) => (3)": Plyne z věty 4.1. 4 Hodnost matice 55 „(3) =^ (4)": Plyne z vět 4.1. a 4.3. „(4) =» (1)": Plyne z vět 4.3. a 4.2. D Předchozí věta nám samozřejmě zároveň podává i charakterizaci singulární matice. Provedením obměn všech implikací totiž dostáváme, že ekvivalentní jsou též výroky: (1) matice A je singulární, (2) h(A) < n, (3) řádky matice A jsou lineárně závislé, (4) sloupce matice A jsou lineárně závislé. Věta 4.5. Nechť A je matice typu m/n. Pak platí: (1) je-li B matice typu n/p, pak: h(A-B). Z úsporných důvodů provádíme obvykle vždy několik elementárních řádkových úprav typu (3) najednou. Tedy pak: A^ 1 2 0 0-1-2^ 0 110 11 113 0 0-4 2 1-3 0-1 2/ ^12 0 0-1-2^ 0 110 11 0 0 0 0-4-9 \0 0 0 0 4 9/ ->■ ->■ 1 2 0 0-l-2\ 0 110 11 0 3 3 0-1-6 0-3-3 0 1 6 J 1 2 0 0-l-2\ 0 110 11 0 0 0 0-4-9 0 0 0 0 0 0/ 60 Matice a determinanty Vidíme, že poslední matice (která je ve schodovitém tvaru) má 3 nenulové řádky, a tedy h(Á) = 3. Předchozí metodu (která je samozřejmě jen jednou z mnoha známých metod určování hodnosti matice) můžeme s výhodou použít při řešení celé řady úloh o vektorovém prostoru Tn. Chceme-li například v Tn zjistit dimenzi a bázi nějakého podprostoru W generovaného konečným počtem zadaných vektorů, pak tyto vektory napíšeme jako řádky do matice, kterou elementárními řádkovými úpravami převedeme na schodovitý tvar. Nenulové řádky takto získané matice ve schodovitém tvaru jsou pak bází podprostoru W (jak plyne z vět 5.1. a 5.3.). Podobným způsobem lze postupovat například při zjišťování dimenze a báze součtu dvou podprostoru v Tn, atd. Příklad 5.2. Ve vektorovém prostoru M5 jsou dány podprostory W\ = [«i,tt2,u3] &W2 = [vi,v2,v3], kde ui = (1,-1,2,4,0), u2 = (0,0,1,3,2), «3 = (1, -1,1,1, -2), resp. «i = (0,1,0, 2, -2), v2 = (-1, 2,1, 3, -2), «3 = (—1,0,1, —1, 2). Určete dimenzi a bázi podprostoru W\ + W2. Řešení: Vektory m, u2, «3, V\,v2, v% generují W\+W2 (proč?), tzn. W\ + W2 = [ui,U2,U3,Vi,V2,Vz]. Stačí tedy napsat uvedených šest vektorů do řádků matice a tuto matici převést elementárními řádkovými úpravami na schodovitý tvar, Tedy: / 1 -1 2 4 0\ 0 0 13 2 1-1 1 1-2 0 10 2-2 -1 2 1 3-2 V-l 0 1-1 2/ 1 /l-l 2 4 0\ 0 10 2-2 0 0 13 2 0 0-1-3 -2 7 -2 3 2/ /l-l 0 1 0 1 3 \0 -1 3 2 4 0\ 0 10 2-2 0 0 13 2 0 0 0 0 0 0 0 0-4-6 V0 0 0-4-6/ /l-l 2 4 0\ 0 10 2-2 0 0 13 2 0 0-1-3 -2 0 0 3 \0 0 3 2 4 0\ 0 2-2 0 0 13 2 0 0 0 4 6 0 0 0 0 0 \o o o o 0/ o 0/ Tedy dim(Wi + W2) = 4, přičemž bázi W\ + W2 tvoří například nenulové řádky poslední matice, tj. vektory w\ = (1, —1,2,4,0), tü2 = (0,1,0, 2, —2), «>3 = (0,0,1,3,2), ii>4 = (0,0,0,4,6). 5 Další vlastnosti a užití matic 61 Jednou z dalších základních úloh lineární algebry je hledání inverzní matice k dané čtvercové regulární matici A řádu n. Z důsledku věty 3.8. víme, že: A - \A\ A ' kde A* je adjungovaná matice k matici A, a podle tohoto vzorce můžeme též inverzní matici A-1 přímo spočítat. Je však vidět, že pro větší n bude výpočet příliš pracný (je třeba vypočítat jeden determinant matice řádu n a dále n2 determinantů matic řádu n — 1). Proto si nyní odvodíme jednu poměrně jednoduchou a pro ruční výpočet celkem vhodnou metodu nalezení inverzní matice. Věta 5.4. Nechť A je regulární matice řádu n nad T. Pak platí: (1) matici A lze konečným počtem elementárních řádkových úprav převést na jednotkovou maticí En, (2) provedení řádkové elementární úpravy matice A je ekvivalentní vynásobení matice A zleva jistou regulární maticí řádu n. Důkaz. (1): Podle předpokladu je h(A) = n, a tedy (podle vět 5.2. a 5.3.) matici A lze konečným počtem elementárních řádkových úprav převést na tvar, v němž v hlavní diagonále jsou nenulové prvky a pod ní jsou samé nuly. Vynásobením jednotlivých řádků vhodnými nenulovými čísly z T dostaneme v hlavní diagonále samé jedničky a pak konečným počtem elementárních řádkových úprav typu (3) nad diagonálou samé nuly. Tedy dostaneme jednotkovou matici En. (2): Rozepsáním se bezprostředně ověří, že: a) Záměna dvou řádků (í-tého a j-tého) matice A je ekvivalentní vynásobení matice A zleva maticí F, kde F je matice vzniklá z jednotkové matice En (řádu n) záměnou i-tého a j-tého řádku. Zřejmě ale |.F| = —1, tzn. matice F je regulární. ß) Vynásobení i-tého řádku matice A nenulovým číslem í G T je ekvivalentní vynásobení matice A zleva maticí G, kde G je matice vzniklá z jednotkové matice En vynásobením i-tého řádku číslem t. Ale \G\ = t ^ 0, tzn. matice G je regulární. 7) Přičtení í-násobku j-tého řádku k i-tému řádku matice A (kde i 7^ j at € T libovolný) je ekvivalentní vynásobení matice A zleva maticí H, kde H je matice vzniklá z jednotkové matice En přičtením í-násobku j-tého řádku k «-tému řádku. Podle věty 2.5. (1) však \H\ = 1, tzn. H je regulární matice. D 62 Matice a determinanty Z předchozí věty už nyní přímo plyne metoda výpočtu inverzní matice k matici A. Spočívá v tom, že elementárními řádkovými úpravami převedeme matici A na jednotkovou matici En a tytéž elementární řádkové úpravy paralelně aplikujeme na jednotkovou matici En, která nám nakonec přejde v hledanou inverzní matici A-1, neboť podle předchozí věty existují regulární matice R\,..., Rs takové, že: (Rs.....-R2 • -Ri) • A = En, což znamená, že (Rs.....R% ■ R\) = A-1. Současně však: {Rs «2 • «i) • En = (Rs Ri ■ «i), odkud tedy jako výsledek dostáváme matici (Rs.....R2 ■ Ri) = A-1. Prakticky provádíme výpočet tak, že obě matice, tj. A a En, napíšeme vedle sebe a oddělíme svislou čarou. Pak provádíme zvolené elementární řádkové úpravy, a to současně pro obě matice najednou. Výsledné matice budeme mezi sebou oddělovat symbolem ~. Příklad 5.3. K dané regulární matici A (nad tělesem M) nalezněte inverzní matici A-1. Přitom: A Řešení: Hledanou inverzní maticí je tedy matice: A- 5 Další vlastnosti a užití matic 63 V našich předchozích úvahách o vektorových prostorech jsme doposud vystačili vždy s jednou pevnou bází daného vektorového prostoru, vzhledem k níž jsme vyjadřovali například souřadnice vektoru, atd. Na závěr tohoto paragrafu budeme nyní vyšetřovat vzájemný vztah mezi dvěma bázemi daného vektorového prostoru, resp. vztah mezi souřadnicemi téhož vektoru v různých bázích daného prostoru. Ukážeme si, že v obou případech lze s výhodou použít maticového způsobu zápisu, čímž se formálně značně zjednoduší naše vyjadřování. Definice. Nechť V je vektorový prostor nad T a nechť: U\,...,Un (1) Vl,...,Vn (2) jsou dvě jeho báze. Nechť dále je: V\ = on • Ui + a2l • V-2 + ■ • • + anl • un V2 = Ö12 • Ui + a22 • «2 + • ■■ + an2-un (3) V n = Cbln ■Ui+CL2n-U2 + ■ • • + CLnn ■ Un Pak matice A tvaru: /öll Ö12 ••• ain\ A = 0.21 a22 • • • ď2n \flnl an2 ■ ■ ■ ďnnj se nazývá matice přechodu od báze (1) k bází (2). Poznámka. 1. Rozebereme-li si předchozí definici, pak vidíme, že matici A přechodu od jedné báze ke druhé bázi prostoru V zkonstruujeme tak, že j-tý vektor druhé báze vyjádříme jako lineární kombinaci vektorů první báze a její koeficienty pak zapíšeme do j-tého sloupce matice A (pro j = 1,2,..., n). Přitom je samozřejmé, že jak pořadí obou bází, tak i pořadí vektorů v těchto bázích je podstatné a nelze je nijak zaměňovat. 2. Matice přechodu od jedné báze k druhé bázi prostoru V je vždy regulární (plyne z (3) a z lineární nezávislosti vektorů druhé báze). 64 Matice a determinanty Příklad 5.4. Ve vektorovém prostoru M3 mějme dány dvě báze: «1 = (1,1,1), «2 = (1,1,0), u3 = (1,0,0), (4) «i = (2,3,2), «2 = (3,1,2), v3 = (4,3,3). (5) Lehce se ověří, že platí: Vi = 2 • U\ +U2 - Us, V2 = 2 • U\ - U2 + 2 • 113, v3 = 3 • u\ + u3, resp. U\ = vi+v2 -v3, u2 = -4 • «i - 5 • v2 + 6 • «3, t*3 = -3 • ví - 3 • v2 + 4 • «3, odkud již plyne, že matice A přechodu od báze (4) k bázi (5), resp. matice B přechodu od báze (5) k bázi (4) mají tvar: / 2 2 3\ / 1 -4 -3 A= i 1-1 0 , resp. 5=1 1-5-3 \-l 2 1/ \-l 6 4 Vidíme tedy, že především je ^4 7^ B, ale na druhé straně se výpočtem lehce zjistí, ze A ■ B = E3, & tedy B = .A-1. Tedy, zaměněním pořadí bází (4) a (5) jsme dostali matici přechodu, která je k původní matici přechodu inverzní. Následující věta ukáže, že tomu tak musí být vždycky. Věta 5.5. Nechť (1), resp. (2) jsou dvě báze vektorového prostoru V nad T. Nechť A je matice přechodu od báze (1) k bázi (2). Potom A~ľ je maticí přechodu od báze (2) k bázi (1). Důkaz. Nechť A = (a^). Pak podle definice matice přechodu od (1) k (2) je: n vj = Ysakj -ukl j = l,...,n. k=i Nechť dále B = (bij) je matice přechodu od báze (2) k bázi (1). Pak je: n Uk= T,brk-vr, k = l,...,n. r=l 5 Další vlastnosti a užití matic 65 Po dosazení dostáváme: J3 n n n / n \ = E °fcj • Y,brk-vr = E E Kk ■ akj ) • vr, j = 1,...,n. k=l r=\ r=\ \k=l J Podle věty 4.2., kap. L, se každý vektor z V dá napsat pouze jediným způsobem jako lineární kombinace vektorů dané báze. Zřejmě však je: v j = 0 • vi H-------HO- Vj-i + 1 ■ Vj + 0 ■ Vj+i H-------\-0-vn, j = 1,..., n. Porovnáním posledních dvou rovností pak dostáváme: A, ÍO pror^j Z^ brk ■ 0,kj = \ . jt=i [1 pror = j což maticově vyjádřeno říká, že B ■ A = En, odkud již plyne, že B = A-1. D Poznámka. Z definice matice přechodu plyne, že zadáním bází (1) a (2) je jednoznačně určena matice přechodu od (1) k (2), tj. jistá regulární matice A. Podobně však, máme-li dánu bázi (1) a nějakou regulární matici A, pak je těmito dvěma údaji (pomocí vztahů (3)) jednoznačně určena báze (2) taková, že matice A je maticí přechodu od (1) k (2). Stejně tak, zadáním báze (2) a regulární matice A je jednoznačně určena báze (1) taková, že A je maticí přechodu od (1) k (2). Bázi (1) můžeme v tomto případě zkonstruovat např. užitím věty 5.5. (tzn. ze vztahů (3), pomocí báze (2) a inverzní matice A-1). Zcela na závěr nyní ještě odvodíme, jaký je vzájemný vztah mezi souřadnicemi jednoho vektoru ve dvou různých bázích prostoru V. Je samozřejmé, že při změně báze se změní i souřadnice vektoru vzhledem k bázi. Poněvadž mnohdy pro jednoduchost výpočtů je vhodná speciální volba báze, je důležité znát pravidla, podle nichž se mění souřadnice vektoru při změně báze. Touto otázkou, nazývanou transformace souřadnic vektoru, se nyní budeme zabývat. Nechť tedy (1) a (2) jsou dvě báze vektorového prostoru V a nechť A = (öy) je matice přechodu od báze (1) k bázi (2). Dále nechť w G V je pevný vektor, přičemž w má v bázi (1), resp. v bázi (2), souřadnice: ^i\ (y\ , resp. \.%n I 66 Matice a determinanty To ale znamená, že platí: w = x\ ■ u\ H-------h xn ■ un (6) w = yi ■ vi H-------Vyn-Vn (7) Dosadíme-li do (7) vztahy (3), dostáváme: n n n n / n \ ™ = Ey? • «j = Ey? • Eafc? • «* = E ( Ea*y • %■ • wfe- (8) j=l j=l Ai=l fc=l Vj=l / Nyní však porovnáním pravých stran (6) a (8) dostáváme: aľi-iti H------\-xn-un = (aiiyiH------\-alnyn)-ut-\------h(aniŽ/iH------^annyn)-uni odkud z jednoznačnosti obou vyjádření plyne rovnost odpovídajících si koeficientů, tj.: x\ = anyi H-------h a\nyn x2 = ö2iyi H-------1- a2nyn xn = a-niVi H-------1- annyn což však můžeme zapsat v maticovém tvaru: Tímto jsme tedy dostali souřadnice vektoru w v bázi (I) vyjádřené pomocí souřadnic téhož vektoru v bázi (2). Kdybychom chtěli naopak vyjádřit souřadnice vektoru w v bázi (2) pomocí jeho souřadnic v bázi (1), pak stačí obě strany poslední maticové rovnice vynásobit zleva maticí A~ľ (která existuje, neboť matice A je regulární). Dostaneme pak: í Ví \Vn X\ x\ A- Kapitola 3 Soustavy lineárních rovnic §1. Gaussova metoda řešení soustav lineárních rovnic Se soustavami lineárních rovnic a jejich řešením je možné se v určitých jednoduchých, resp. speciálních případech setkat již na střední škole. V tomto paragrafu ukážeme jednu z mnoha známých metod praktického řešení obecných soustav lineárních rovnic. Výklad je veden tak, že je možno tento paragraf studovat nezávisle na jeho zařazení do III. kapitoly (z předchozí látky se používá pouze pojem matice, matice ve schodovitém tvaru, elementární řádková úprava matice a některé jednoduché vlastnosti vektorového prostoru Tn) a je pak možno jej použít při řešení konkrétních příkladů vztahujících se k problematice probírané dříve. Definice. Nechť T je číselné těleso. Pak soustava rovnic: auxi + ayiX'1 H-------V a\nxn = b\ akl ak2 Oln\ (l2n (ihn) resp. A fan 0,21 \a*ki a\2 0,22 Ok2 0\n 02n b2 Okn hj se nazývá matice soustavy (1), resp. rozšířená matice soustavy (1). Abychom opticky odlišili absolutní členy od koeficientů soustavy (1), budeme obvykle v rozšířené matici soustavy A psát před sloupcem absolutních členů svislou čáru. 2. Každé řešení soustavy (1) je, jak bylo v definici řečeno, uspořádaná n-tice prvků z tělesa T, tzn. může být považováno za vektor z vektorového prostoru Tn. Množinu všech řešení soustavy (1) lze pak chápat jako jistou podmnožinu prostoru Tn (která může být případně i prázdná, nemá-li soustava (1) žádné řešení). 3. Označíme-li: Xl X resp. B \&n ) (bi \h pak můžeme zřejmě soustavu (1) zapsat krátce maticovou rovnicí: A-X = B. Tento maticový způsob zápisu soustav lineárních rovnic nám pak v dalším často umožní přehledné a stručné vyjadřování. Definice. Soustava lineárních rovnic se nazývá řešitelná soustava (resp. neřešitelná soustava), jestliže existuje alespoň jedno (resp. neexistuje žádné) její řešení. 1 Gaussova metoda řešení soustav lineárních rovnic 69 Dvě soustavy lineárních rovnic o n neznámých (nad týmž tělesem T) se nazývají ekvivalentní soustavy, jestliže množiny jejich řešení si jsou rovny. Jakákoliv úprava dané soustavy lineárních rovnic, po níž vznikne soustava ekvivalentní, se nazývá ekvivalentní úprava dané soustavy lineárních rovnic. Uvědomme si, že „řešit" danou soustavu lineárních rovnic znamená buď najít všechna její řešení, nebo zjistit, že je neřešitelná. Pokud jde o počet řešení soustavy lineárních rovnic, nastane zřejmě vždycky právě jeden z následujících tří případů: (1) soustava nemá žádné řešení (tj. je neřešitelná), (2) soustava má jediné řešení, (3) soustava má více než jedno řešení (ukážeme, že nekonečně mnoho). Věta 1.1. Nechť je dána soustava lineárních rovnic (1). Pak následující úpravy jsou ekvivalentními úpravami soustavy (1): (1) libovolná záměna pořadi rovnic, (2) vynásobení libovolné rovníce nenulovým číslem z T, (3) k jedné rovnici přičtení jiné rovníce vynásobené libovolným číslem (4) vypuštění z (1) rovnice, která je lineárni kombinací ostatních rovnic. Důkaz. (1), (2): Zřejmé. (3): Vzhledem k (1) můžeme předpokládat, že k první rovnici soustavy (1) přičteme druhou rovnici vynásobenou číslem p G T. Dostáváme tak soustavu (2) tvaru: anxi H-------h alnxn + p ■ (a21xľ -\-------h a2nxn) = h + p ■ b2 a2\X\ H-------Y a2nxn = h. : t2) (ik\x\ H-------h aknxn = bk Nyní, je-li (t\,..., tn) řešením soustavy (1), pak zřejmě je (íi,..., tn) řešením soustavy (2). Naopak, nechť (íi,... ,tn) je řešením soustavy (2). Pak po dosazení do první rovnice soustavy (2) dostáváme: aiih H-------h a\ntn +p- (a2ih H-------h a2ntn) = h+p-b2. Podle předpokladu však 021^1 H------\-a2ntn = b2, tzn. po dosazení a odečtení dostáváme: 70 Soustavy lineárních rovnic duti + • • • + ainUi — bi-, odkud již ihned plyne, že (íi,...,ín) je řešením soustavy (1) (poněvadž druhá až k-tá rovnice v (2) a v (1) jsou stejné). Dokázali jsme tedy, že soustavy (1) a (2) jsou ekvivalentní. (4): Vzhledem k (1) předpokládejme, že v soustavě (1) je první rovnice lineární kombinací ostatních rovnic, tj. soustava (1) je tvaru: P2 ■ (a,2ixi H--------h a2nXn) H--------h Pk ■ {akixi H--------h aknxn) = P2 ■ b2 H--------h Pk ■ h Cl2lXi H---------h Cl2nXn = h a-kixi H--------Y aknxn = bk (3) kde p2, ■ ■ ■ ,Pk £ T. Uvažme dále soustavu (4), která vznikne ze soustavy (3) vypuštěním první rovnice, tj.: a-iix\ H--------h a2nxn = b2 ; (4) a-kixi H--------h aknxn = bk Nyní je však bezprostředně vidět, že (ti,..., tn) je řešením (3), právě když (íi,..., tn) je řešením (4), neboli že soustavy (3) a (4) jsou ekvivalentní. D Při provádění ekvivalentních úprav dané soustavy lineárních rovnic není nutné stále opisovat celou soustavu i s neznámými, ale zřejmě stačí pracovat s její rozšířenou maticí soustavy. Uvědomme si, že pak provádění úprav (1) - (4) na dané soustavě je ekvivalentní provádění elementárních řádkových úprav na její rozšířené matici soustavy doplněnému o vypouštění řádků matice, které jsou lineárními kombinacemi ostatních řádků. Na této úvaze je pak založena metoda řešení soustav lineárních rovnic, kterou nyní popíšeme. Její princip spočívá v tom, že danou soustavu lineárních rovnic převedeme na ekvivalentní, ale „jednodušší" soustavu, jejíž řešení (která jsou zároveň i řešeními původní soustavy) bude možno víceméně ihned vypsat. Gaussova metoda řešení soustavy lineárních rovnic Nechť je dána soustava lineárních rovnic (1). Pak ekvivalentními úpravami z věty 1.1. převedeme soustavu (1) na soustavu (ľ), jejíž rozšířená matice soustavy je ve schodovitém tvaru, přičemž vždy vypustíme každou 1 Gaussova metoda řešení soustav lineárních rovnic 71 rovnici, která je lineární kombinací ostatních rovnic (z předchozí úvahy a z věty 5.2., kap. IL, plyne, že toho lze po konečném počtu kroků vždy dosáhnout). Nechť soustava (ľ) má s rovnic. Potom: 1. Vyskytne-li se v (ľ) rovnice, v níž všechny koeficienty jsou nulové a absolutní člen je různý od nuly, pak zřejmě soustava (ľ), a tedy i soustava (1) je neřešitelná. V opačném případě je soustava (1) řešitelná, a sice: 2. Má jediné řešení, je-li s = n. Toto řešení lehce spočítáme postupným dosazováním ze soustavy (ľ). 3. Má nekonečně mnoho řešení, je-li s < n. V tomto případě (opět postupným dosazováním z (ľ)) vyjádříme jistých s neznámých pomocí zbývajících (n — s) neznámých (které se nazývají volné neznámé). Dosazujeme-li za volné neznámé libovolně čísla z T (kterých je nekonečně mnoho), dostáváme pak jednotlivá konkrétní řešení soustavy (1) (kterých je tedy také nekonečně mnoho). Ilustrujme si nyní Gaussovu metodu řešení soustavy lineárních rovnic na několika typických příkladech. Příklad 1.1. Řešte soustavu lineárních rovnic (nad ff): X\ + 2íC2 - X3 + X4 = 1 —2a; i — 3a;2 + 2xs — 3x^ = 2 X\ + X2 - X3 + 2X4 = -1 X2 + 2^4 = 3 Řešení: Napíšeme rozšířenou matici této soustavy a pomocí elementárních řádkových úprav ji převedeme na schodovitý tvar. Navíc vypouštíme řádky, které jsou lineární kombinací ostatních řádků (pokud se takové vyskytnou) . ( 1 2-1 1 -2 -3 2 -3 11-12 V 0 1 0 2 1\ 2 -1 3/ /l 2-1 1 !\ 0 10-1 4 0-101 -2 \0 1 0 2 3/ 1 2 -1 1 1\ 0 1 0 -1 4 0 0 0 0 2 0 0 0 3 -1/ ->■ 72 Soustavy lineárních rovnic I když poslední matice ještě není formálně upravena na schodovitý tvar, vidíme, že daná soustava je neřešitelná, neboť ve třetím řádku poslední matice, tj. ve třetí rovnici poslední soustavy jsou všechny koeficienty u neznámých nulové, kdežto absolutní člen je od nuly různý. Příklad 1.2. Řešte soustavu lineárních rovnic (nad M): x\ - 2a;2 + x3 = -1 X\ + X3 = 1 2x\ — 5x2 + 4^3 = 0 2x\ — 3^2 = —4 Řešení: /l -2 1 1 0 1 2-5 4 \2 -3 0 -1\ 1 0 -4/ /l -2 1 -1\ 0 2 0 2 0-12 2 \0 1-2 -2/ ->■ 1 -2 1 -1 0 1 0 1 0 0 2 3 Tedy z poslední rovnice: 22:3 = 3, neboli x% = |. Dále z předposlední rovnice dostáváme přímo: i2 = lä konečně z první rovnice: íci = — 1 + 2x2 — ^3, tj. po dosazení: x\ = — ^. Daná soustava má tedy jediné řešení (—5,1, §)• Příklad 1.3. Řešte soustavu lineárních rovnic (nad M): íci - 2aí2 + x3 x\ — 2x2 — %3 X\ — 2rE2 + 3íC3 Řešení: 1-211 1-2-1 1 1-231 1 -2 1 1 2 0 0 -2 0 -4 0 0 2 0 4 2:4 = 2 2:4 = —2 2:4 = 6 ->■ 1 -2 1 0 0 1 Tedy dostáváme soustavu, v níž budou dvě volné neznámé (zřejmě kterékoliv dvě z neznámých x\, 2:2, x±, nikoliv však neznámá 2:3). Zvolíme-li za volné neznámé např. neznámé xi-, 2:4, pak lehce vypočteme: 2:3 = 2, X\ = 22Í2 — X4. Tedy (položíme-li 2:2 = t, X4 = s) daná soustava má nekonečně mnoho řešení tvaru (2t — s, t, 2, s), kde t, s jsou libovolná reálná čísla. 2 Základní vlastnosti soustav lineárních rovnic 73 Poznámka. Jestliže má soustava lineárních rovnic nekonečně mnoho řešení, pak z Gaussovy metody vyplývá pouze to, kolik neznámých volíme za volné neznámé, nikoliv však, které neznámé to jsou. Může se totiž stát, že některou neznámou nesmíme volit za volnou neznámou (např. neznámou x$ v příkladu 1.3.) nebo naopak, některou neznámou musíme volit za volnou neznámou (např. v soustavě dvou rovnic o čtyřech neznámých tvaru: X\ + 2^3 + X4 = 1 X3 — X4 = 0 musíme zřejmě za jednu ze dvou volných neznámých zvolit neznámou x^)- §2. Základní vlastnosti soustav lineárních rovnic Mějme dánu soustavu k lineárních rovnic o n neznámých nad T, tj. soustavu: a\\X\ + ayiX2 H-------V a\nxn (1<2\X\ + (122X2 H---------h Ü2nXn akixi + ak2X2 H-------h aknxn kde A, resp. A bude značit matici této soustavy, resp. rozšířenou matici této soustavy. Zajímáme-li se o hodnost matic A a, A, pak ihned vidíme, že zřejmě mohou dva případy: buď je h(A) = h(A), nebo je h(A) = h(A) + 1. Přitom h(Ä) = h(A) nastane právě tehdy, když sloupec absolutních členů je lineární kombinací sloupců matice A (rozmyslete si podrobně proč). Nyní si uvedeme důležitou větu, která nám umožní rozhodnout o řešitelnosti či neřešitelnosti soustavy lineárních rovnic, aniž bychom hledali její řešení. Věta 2.1. (Frobeniova věta, resp. Kronecker-Capelliho věta) Soustava lineárních rovnic (nad T) je řešitelná, právě když hodnost matice této soustavy je rovna hodností rozšířené matice této soustavy. Důkaz. Uvažujme soustavu (1), kde A, resp. A značí matici soustavy (1), resp. rozšířenou matici soustavy (1). „=^": Nechť (1) je řešitelná soustava a nechť (t\,...,tn) je řešení (1). Pak platí: &2 h (1) 74 Soustavy lineárních rovnic aníi + 012^2 021Í1 + «22^2 + (ílntn — b\ + 0>2ntn = °2 (Iklh + dk2h H------+ (Ikntn = h neboli: 62 h «21 + Í2 /°12\ «22 + t. íain\ 0-2n \hj \akij \ak2J \aknj což znamená, že sloupec absolutních členů je lineární kombinací sloupců matice A, a tedy h(A) = h(A). „<=u: Nechť h(A) = h(A). Potom (jak bylo řečeno v úvodu tohoto paragrafu) sloupec absolutních členů je lineární kombinací sloupců matice A. Označíme-li koeficienty v této lineární kombinaci ti,...,tn, pak stejným ob- ratem jako v f. části důkazu dostaneme, že (t\, (1). Tedy soustava (1) je řešitelná. ,tn) je řešením soustavy D Frobeniova věta je jednoduchým a elegantním kriteriem řešitelnosti soustav lineárních rovnic, ovšem v případě řešitelné soustavy neříká nic o počtu řešení ani o tom, jak všechna řešení vypadají. Takové úvahy budou nyní obsahem zbytku tohoto paragrafu. Nejprve vyšetříme specielní případ soustavy (1), kdy k = n (tzn. rovnic je tolik jako neznámých) a navíc matice soustavy je regulární. Věta 2.2. (Cramerovo pravidlo) Nechť je dána soustava n lineárních rovnic o n neznámých, jejíž matice soustavy A je regulární. Pak soustava má jediné řešení (xi,..., xn), přičemž: _ \Aj\ ■ _ 1 0 kde Aj je matice vzniklá z matice A nahrazením j-tého sloupce sloupcem absolutních členů. Důkaz. Uvažme soustavu (1), v níž k = n, a kterou tedy můžeme maticově zapsat ve tvaru: X\ A-X = B, kde X B (2) \Xr. 2 Základní vlastnosti soustav lineárních rovnic 75 Matice A je však podle předpokladu regulární, tzn. existuje inverzní matice A~l. Potom vynásobením rovnosti (2) zleva maticí A~l dostaneme A-1 ■ (A ■ X) = A'1 ■ B, odkud: X = A'1 -B, (3) což je tedy řešení dané soustavy, které (jak plyne z odvození) je jediné. Pokusme se nyní nalezené řešení explicitně vyjádřit. Podle důsledku věty 3.8., kap. IL, je: (An A21 ■■■ Anl\ A-1 - -L A - \A\ Al3 A2j ■ A, nj \A\n A2n ■ ■ ■ AnnJ kde Aij je algebraický doplněk prvku öy v matici A. Z (3) pak dostáváme: i 1-4.1 ^ • (Axj ■b1 + A2j-b2 + --- + Anj ■ bn) : «11 • • • °1 J-l h öl,j+l • • • öln Q>nl ' ' ' ^n,j—l on ön,j+l ' ' ' ^nn užitím důsledku Laplaceovy věty. Tedy skutečně x j = Wŕ pro j = 1,... 1-4.1 ,n. D Nyní vyřešíme obecný případ, tzn. popíšeme řešení obecné soustavy k lineárních rovnic o n neznámých, o níž víme, že je řešitelná. Věta 2.3. (Obecné Cramerovo pravidlo) Nechť (1) je řešitelná soustava lineárních rovnic a nechť h(A) = r. Dále: - Vybereme z matice A r lineárně nezávislých řádků a dále uvažujeme pouze ty rovníce, jejichž koeficienty se nacházejí ve vybraných řádcích. - Ponecháme na levé straně takových r neznámých, že matice sestavená z koeficientů u těchto neznámých je regulární. Ostatní neznámé (pokud existují) převedeme na pravé strany a nazveme je volné neznámé. Potom, zvolíme-lí za volné neznámé libovolně pevné prvky z T a vypočitáme-li Cramerovym pravidlem zbývajici neznámé, dostaneme tímto způsobem právě všechna řešení soustavy (1). 76 Soustavy lineárních rovnic Důkaz. Podle předpokladu je h(A) = h(A) = r. Vzhledem k větě 1.1. (1) můžeme předpokládat, že prvních r řádků matice A je lineárně nezávislých a ostatní řádky jsou lineární kombinací prvních r řádků. Potom podle věty 1.1. (4) je soustava (1) ekvivalentní soustavě: cinxi H-------\-ciinxn = b\ ; (4) Oíf\X\ ~\~ \ (ífnXji — Of Nyní mohou nastat dva případy: I. Je-li r = n, pak \A\ ^ 0 a podle věty 2.2. existuje jediné řešení soustavy (4), a tedy i soustavy (1), které spočteme Cramerovým pravidlem, tzn. tvrzení platí. II. Nechť r < n a nechť pro přehlednost zápisu je nenulový minor řádu r matice soustavy (4) tvořen prvními r sloupci. Převedením zbývajících neznámých na pravé strany a dosazením x j = Cj, kde Cj GT,j = r+1,..., n dostáváme: aiixi + • • • + aifXf = b\ — aijr+icr+i — • • • — a\ncn \ (5) Na soustavu (5) můžeme použít Cramerovo pravidlo, čímž dostaneme jediné řešení (ci,..., cr) soustavy (5). Potom však (ci,..., cr, cr+i,..., cn) je zřejmě řešením (4), tzn. i řešením (1). Naopak, musíme ukázat, že každé řešení soustavy (1) lze obdržet popsaným způsobem. Nechť tedy {d\,... ,án) je libovolné řešení soustavy (1). Pak (di,... ,dn) je řešením soustavy (4). Dosadíme-li dj za Xj pro j = r + 1,..., n, pak (d\,..., dr) je řešením soustavy (5), a musí tedy být rovno tomu jedinému řešení, které dostaneme použitím Cramerova pravidla. Tedy řešení (di,..., dn) jsme dostali postupem uvedeným ve větě. D Důsledek. Nechť je dána soustava lineárních rovnic (1). Potom: (1) soustava (1) má jediné řešení <í=^ h(A) = h(A) = n, (2) soustava (1) má nekonečně mnoho řešení *<=> h(Á) = h(A) < n. Důkaz. Obě tvrzení plynou přímo z Probeniovy věty a z důkazu obecného Cramerova pravidla, podle něhož má soustava (1) jediné řešení, právě když neexistuje žádná volná neznámá, tzn. právě když h(A) = n. D 3 Homogenní soustavy lineárních rovnic 77 Poznámka. Poznamenejme, že řešení soustav lineárních rovnic pomocí Cramerova pravidla, resp. obecného Cramerova pravidla má spíše teoretický význam, protože je numericky poměrně náročné (např. rozhodně náročnější než Gaussova metoda popsaná v §1). Na druhé straně nám ale Cramerovo pravidlo umožňuje přímý výpočet jednotlivých neznámých, což může být někdy výhodné (např. jsme-li v situaci, kdy nás zajímá pouze hodnota jedné neznámé). §3. Homogenní soustavy lineárních rovnic Definice. Soustava: a\\X\ + ayiX2 H-------h a\nxn = 0 \ (1) akixi + ak2x2 -\-------h aknxn = 0 kde (lij E T, se nazývá homogenní soustava k lineárních rovnic o n neznámých nad T. Poznámka. Matici soustavy (1), resp. rozšířenou matici soustavy (1) budeme opět značit A, resp. A. Protože matice A vznikla z matice A přidáním sloupce skládajícího se ze samých nul, je zřejmě h(A) = h(A), a tedy (podle Frobeniovy věty) homogenní soustava (1) je vždy řešitelná. Evidentně, uspořádaná n-tice (0,0,..., 0) je řešením soustavy (1). Toto řešení se nazývá nulové řešení. Vidíme tedy, že homogenní soustava má buď jediné řešení (a sice nulové), anebo má nekonečně mnoho řešení (tj. kromě nulového i nenulová řešení). Kriterium pro oba případy udává následující věta. Věta 3.1. Nechť (1) je homogenní soustava s maticí soustavy A. Potom: (1) soustava (1) má pouze nulové řešení -<=^ h(A) = n, (2) soustava (1) má též nenulová řešení *<=> h(A) < n. Důkaz. Tvrzení plyne přímo z důsledku věty 2.3., neboť v (1) je h(A) = h(Ä). D Poznámka. Z předchozí věty a z věty 4.4., kap. IL, plyne, že ve specielním případě, kdy počet rovnic je roven počtu neznámých (tj. k = n), má homogenní soustava pouze nulové řešení (resp. má též nenulová řešení), právě když |^| + 0 (resp. \A\ = 0). 78 Soustavy lineárních rovnic Jak již bylo dříve řečeno, každé řešení soustavy lineárních rovnic o n neznámých nad T je možno považovat za vektor z vektorového prostoru Tn. Množina W všech řešení této soustavy je pak podmnožinou v Tra, která v případě nehomogenní soustavy zřejmě není nikdy podprostorem v Tn (neboť zcela jistě neobsahuje nulový vektor). V případě homogenních soustav je však situace jiná, jak ukazuje následující věta. Věta 3.2. Množina W všech řešení homogenní soustavy (1) je podprostorem ve vektorovém prostoru Tn a platí: dim TV = n — h(A). Důkaz. I. Dokážeme, že W je podprostor v Tn. Zřejmě je (0,0,..., 0) G W, tzn. W ^ 0. Dále, nechť (ci,..., cn), (d\,..., dn) G W, t,s G T libovolné, n n tzn. je: ^ aijcj = 0> S aí?4? = 0 Pro « = 1, • • •, A. Pak ale: n n n J^ aij(t ■ Cj + s ■ dj) = i • X) a-ijCj + s ■ ^2 aijdj =t-0 + s-0 = 0 j=l 3=1- 3=1- pro i = 1,..., k. To znamená, že í • (ci,..., cn) + 2r ari ar2 ■ ' *„ a\ix\ + ayixi -\-----+ a\rxr + air+ixr+i -\-------h a\nxn = 0 ar\X\ + ar2X2 + • • • + arrxr + ar r+ia;r+i + • • • + arnxn = 0 (2) v níž za neznámé av+i,... ,xn volíme libovolně jisté prvky z T. Označme i«i,..., wn-r následující řešení soustavy (2), a tedy i soustavy (1): 3 Homogenní soustavy lineárních rovnic 79 w\ = (cil, ■■■,cir, 1,0,0, ...,0,0) W2 = (C21, ...,C2r, 0,1,0,... ,0,0) 1Vn—r = [fin—r,l i • • • i Cn—r,r i U, U, U, . . . , U, 1J a ukážeme, že tvoří bázi podprostoru W. a) Vektory w\,... ,wn-r jsou zřejmě lineárně nezávislé (rozmyslete si podrobně proč). ß) Nechť u = (tíi,..., un) £ W libovolný, tzn. u je řešením soustavy (1). Uvažme vektor w = ur+\ • w\ + • • • + un • wn-r. Zřejmě je w G W a platí w = (yi,...,yr,ur_|_i,...,un), kde yi,...,yr jsou nějaká čísla z T. Vidíme, že vektory u & w mají posledních (n — r) složek shodných a oba jsou z W, tzn. oba jsou řešeními (2). Pak ovšem podle obecného Cramerova pravidla musí být y\ = u\, ..., yr = ur, odkud plyne, že u = w, tzn. vektor u je lineární kombinací vektorů wi,... ,wn-r, které tedy generují podprostor W. Dohromady dostáváme, že dimW = n — r = n — h(Ä). D Poznámka. 1. Na základě předchozí věty jsme u homogenní soustavy oprávněni hovořit o podprostoru všech řešení místo o množině všech řešení. Dále je dobré si uvědomit, že číslo n — h(Ä) udává počet volných neznámých, a tedy dimenze podprostoru řešení dané homogenní soustavy je rovna počtu volných neznámých v této soustavě. 2. Při praktickém hledání báze podprostoru řešení W je nejvýhodnější postupovat tak, že si nejprve obecně vyjádříme řešení dané soustavy, potom (n — r) volných neznámých zvolíme (n — r) lineárně nezávislými způsoby a spočítáme vektory báze W. Je zřejmé, že bází W je nekonečně mnoho, přičemž početně nejjednodušší volbou bude volba provedená v důkazu předchozí věty (tj. volba vždy jedné jedničky a ostatních nul). Příklad 3.1. Nalezněte dvě báze podprostoru řešení W homogenní soustavy lineárních rovnic (nad M): %1 + %2 + %3 — %4 = 0 X3 + X4 = 0 Řešení: Soustavu zřejmě není nutné upravovat, volné neznámé budou dvě, např. x 0). Nechť: Ui = («n, «12, •-., «ln ), Iťn—k = \U"n—k,l i ^n—k,2 i ■ ■ ■ i ^"n—k,nj je pevná báze podprostoru U. Uvažme další homogenní soustavu: UuXi + 1*12^2 H-------h U\nXn = 0 i (4) Un-k,\Xl + Un-k,2X2 H--------1" Un-k,nXn = 0 3 Homogenní soustavy lineárních rovnic 81 o níž dokážeme, zeje hledanou soustavou, tzn. označíme-li podprostor řešení soustavy (4) jako W, musíme dokázat, že W = W. Ale Wj je řešením soustavy (4) (což plyne z toho, že u\,..., wn-A; Jsou řešeními soustavy (3)) pro j = l,...,/c, a tedy w\,... ,Wk € W, odkud dostáváme, že W = L(wi,..., Wk) C W. Dále, hodnost matice soustavy (4) je zřejmě n — k, tzn. podle věty 3.2. je pak dim W = n — (n — k) = k = dim W. Dohromady je tedy W C W A dim VF = dim VF, odkud podle věty 4.5. (2), kap. L, dostáváme, žeW = W. D Poznámka. Je třeba si uvědomit, že homogenní soustava, jejíž existenci předchozí věta zaručuje, není zřejmě určena jednoznačně. Dále, obratů uvedených v důkazu předchozí věty se používá při řešení konkrétních příkladů, a je proto nutné je znát. Příklad 3.2. Nalezněte soustavu lineárních rovnic (nad R), jejíž množina řešení je rovna podprostoru W vektorového prostoru R4, kde W je generován vektory: ti>i = (l,2,l,l), ttf2 = (0,1,-1,1), ™3 = (1,3,0,2). Řešení: Nejprve si napíšeme soustavu (3) (přitom není nutné z generátorů W předem vybrat bázi W', neboť eventuelní nadbytečné rovnice v (3) během výpočtu stejně vypadnou), pak najdeme bázi jejího podprostoru řešení U a nakonec pak složky vektorů báze U budou vystupovat jako koeficienty v hledané soustavě (4). Nejprve tedy řešíme soustavu: X\ + 2X2 + %3 + X4 = 0 X2 - X3 + X4 = 0 X\ + 3íC2 + 2rE4 = 0 1 2 0 1 1 1 -1 1 1 2 1 1 0 0 1 -1 1 0 1 3 0 2 0 0^ oj ) ->■ odkud dostáváme X2 = X3 — X4, x\ = —3xz + X4, tzn. báze podprostoru řešení této soustavy je například u\ = (—3,1,1,0), 1*2 = (1, —1,0,1). Hledaná soustava lineárních rovnic je pak například: —3a; 1 + X2 + £3 =0 X\ — X2 + X4 = 0 82 Soustavy lineárních rovnic Na závěr celé kapitoly se vrátíme ještě k obecným soustavám lineárních rovnic (nad T) a budeme se snažit říci něco více o množině řešení takové soustavy. Hlavní význam následujících úvah a tvrzení se však ukáže a využije později v geometrii. Definice. Nechť je dána soustava lineárních rovnic nad T: a\\X\ + a\2X2 H-------h a\nxn = b\ i (5) ak\x\ + ak2x2 H-------h aknxn = bk Pak homogenní soustava lineárních rovnic s týmiž koeficienty u neznámých, tj.: anxi + ai23;2 H-----+ ainxn = 0 ; (6) ak\x\ + ak2x2 H-------h aknxn = 0 se nazývá zhomogenízovaná soustava k soustavě (5). Věta 3.4. Nechť je dána soustava lineárních rovnic (5). Pak platí: (1) součet libovolného řešení soustavy (5) s libovolným řešením k ní zho-mogenizované soustavy je řešením soustavy (5), (2) rozdíl libovolných dvou řešení soustavy (5) je řešením k ní zhomoge-nizované soustavy. Důkaz. (1): Nechť u = (ui,...,un) je řešení soustavy (5) a nechť v' = (v[,...,v'n) je řešení k ní zhomogenizované soustavy (6), tzn. platí: n n Y^ciijUj = bi, resp. Y,aijv'j = ° pro i = 1,..., k. Pak u + v' = (u\ +v[,...,un + v'n) a platí: n n n Ysaijiuj + v'j) = Ysaijuj + Y,aijv'j =bi + 0 = bi j=l j=l j=l pro i = 1,..., A, a tedy u + v' je řešením soustavy (5). (2): Nechť u = (ui,..., un), resp. v = (i>i,..., vn) jsou dvě řešení soustavy (5), tzn. platí: n n Yjaijuj = bi, resp. Yjaijvj = bi 3 Homogenní soustavy lineárních rovnic 83 pro i = 1,..., k. Pak u — v = (u\ — ví,..., un — vn) a platí: n n n j-1 j-1 j=l pro i = 1,..., k, a tedy m — v je řešením zhomogenizované soustavy (6). D Věta 3.5. Nechť (5) je řešitelná soustava lineárních rovnic. Pak všechna řešení soustavy (5) obdržíme přičtením všech řešení zhomogenizované soustavy (6) k jednomu pevnému řešení soustavy (5). Důkaz. Označme M množinu všech řešení soustavy (5). Podle předpokladu je M ^ 0. Nechť «o G M je pevné řešení soustavy (5). Označme dále: M = {uq + v'\v' je řešení (6)}. Dokážeme, že M = M. „C": Nechť m G M je libovolné řešení soustavy (5). Podle věty 3.4. (2) je u — Uq řešením zhomogenizované soustavy (6). Ale pak je: u = Uo + (u — «o) e M. „D": Plyne ihned z věty 3.4. (1). D Kapitola 4 Euklidovské vektorové prostory §1. Skalární součin, velikost a odchylka vektorů Při našich dosavadních úvahách o vektorových prostorech jsme pomocí operací sčítání vektorů a násobení čísla s vektorem vyšetřovali pojmy jako byla lineární závislost a nezávislost vektorů, generovatelnost, souřadnice vektoru, atd. Prozatím jsme však neměli možnost ve vektorových prostorech „měřit", tzn. zjišťovat a porovnávat délky vektorů, resp. odchylky (tj. velikosti úhlů), což jsou pojmy, které hrají podstatnou roli např. v geometrii. Jejich definice jsou založeny na pojmu skalárního součinu, který nyní zavedeme. Omezíme se přitom však pouze na vektorové prostory nad tělesem reálných čísel. Úmluva. Všude v dalším v této kapitole budeme vektorovým prostorem rozumět reálný vektorový prostor, tj. (konečnědimenzionální) vektorový prostor nad tělesem M reálných čísel. Definice. Nechť V je vektorový prostor (nad M) a nechť každé dvojici vektorů u, v G V je přiřazeno reálné číslo u ■ v tak, že pro libovolné u,v,w G V, r G R platí: (1) u • v = v • u, (2) (u + v) ■ w = (u ■ w) + (v ■ w), (3) (r ■ u) ■ v = r ■ (u ■ v), (4) je-li u ^ o, pak u ■ u > 0. 84 1 Skalární součin, velikost a odchylka vektorů 85 Potom reálné číslo u ■ v se nazývá skalární součin vektorů ti, v. Vektorový prostor, v němž je definován skalární součin, se nazývá euklidovský vektorový prostor nebo krátce euklidovský prostor. Poznámka. 1. Z definice plyne, že euklidovský prostor je vlastně uspořádaná dvojice (V, •) sestávající z vektorového prostoru V a ze skalárního součinu • definovaného ve V. Z důvodů stručnosti však budeme obvykle říkat pouze „euklidovský prostor Vli (tzn. zavedeme podobnou úmluvu jako u grup nebo těles, u nichž při označování vynecháváme symboly operací, pokud není nebezpečí nedorozumění). 2. Z kapitoly I. víme, že každý podprostor vektorového prostoru V nad T je sám vektorovým prostorem nad T. Je-li specielně V euklidovským prostorem, tzn. je reálný s definovaným skalárním součinem, pak zřejmě axiomy skalárního součinu budou jistě splněny i v jeho libovolném (vektorovém) podprostoru. To znamená, že každý (vektorový) podprostor euklidovského prostoru V je sám euklidovským prostorem. Budeme jej stručně nazývat podprostor euklidovského prostoru. Předchozí definice nic neříká o tom, zda v libovolném vektorovém prostoru (nad ff) lze definovat skalární součin, resp. kolika způsoby. Odpověď na tyto otázky nám dá následující příklad a věta. Příklad 1.1. Nechť V = R2 a nechť u = (uuu2),v = (i>i,i>2) 2, pak jsou opět splněny axiomy skalárního součinu (ověřte si sami podrobným rozepsáním!), tzn. M2 s tímto skalárním součinem je euklidovským prostorem. Je vidět, že i když se v obou případech jedná o tentýž vektorový prostor K2, jsou definované skalární součiny různé, a tedy různé jsou pak i pomocí nich získané euklidovské prostory. Příklad 1.2. Nechť V = M„[x] a nechť / = f(x),g = g(x) G Mn[x] jsou libovolné vektory - polynomy. Položíme-li f ■ g = f0 f (x) ■ g (x) dx, pak rozepsáním (užitím základních vět o integrování známých z analýzy) se ověří platnost axiomů skalárního součinu. Tedy Mn[x] s tímto skalárním součinem je euklidovský prostor. 86 Euklidovské vektorové prostory Věta 1.1. V každém reálném vektorovém prostoru V lze definovat skalární součin. Důkaz. Pro nulový vektorový prostor věta zřejmě platí (stačí položit 00 = 0). Nechť tedy dim V = n > 0 a nechť ei,..., en je pevná báze prostoru V. Pak libovolné vektory u, v G V lze (jednoznačně) vyjádřit ve tvaru: u = xi-ei-\-------Yxn -en, resp. Položíme-li: v = y1 ■ ei H-------\-yn-en. u-v = xiyi H-------\-xnyn, pak zřejmě u ■ v G Ma lehce se ověří, že jsou splněny axiomy (1) - (4) skalárního součinu. D Shrneme-li naše dosavadní úvahy, můžeme říct, že z každého reálného vektorového prostoru lze utvořit euklidovský prostor, obecně však nikoliv jediným způsobem. Věta 1.2. Nechť V je euklidovský vektorový prostor. Pak platí: (1) u ■ (v + w) = (u ■ v) + (u ■ w), (2) u ■ (r ■ v) = r ■ (u ■ v), / m \ / n \ m n (3) 5>t • m ) ■ Er? " VJ = E £Pi*j • (uí ■ Vj), (4) o • u = u ■ o = 0, (4) u ■ u = 0 <í=^ ti = o pro u,v,w,Ui,Vj G V, r,pi,rj G K /«'&. Důkaz. (1) a (2): Jsou zřejmé důsledky definice skalárního součinu. (3): Dokážeme lehce matematickou indukcí. (4): o • u = (0 • o) • u = 0 • (o • u) = 0. Zbytek analogicky. (5): „=>": Plyne z axiomu (4) skalárního součinu. „<í=": Plyne z (4). D Definice. Nechť V je euklidovský prostor, u € V. Pak nezáporné reálné číslo: 1 Skalární součin, velikost a odchylka vektorů 87 ||« || = yJU ■ U se nazývá délka nebo též velikost vektoru u. Je-li || «|| = 1, pak říkáme, že vektor u je normovaný. Věta 1.3. (Schwarzova nerovnost) Nechť V je euklidovský prostor, «,dG V libovolné. Pak platí: \u ■ v\ < \\u\\ ■ \\v ||, (1) tzn. absolútni hodnota skalárního součinu dvou vektorů je menší nebo rovna součinu velikostí těchto vektorů. Důkaz. Je-li v = o, pak |« • o\ = 0 = ||« || • || o|| a věta platí. Předpokládejme tedy, že v ^ o a uvažme vektor u — r-v, kde r G M je libovolné. Pak je: 0 < (« — r • v) ■ (u — r ■ v) = u ■ « — 2r • (« • v) + r2 ■ (v ■ v). Zvolíme-li nyní r = ^ (což lze, neboť podle předpokladu v ■ v > 0), dostaneme: 0<«-«-2-^-(«■«) + \^jž ■ (v ■ v), odkud po vykráčení a pak vynásobení číslem v ■ v (> 0) dostáváme: 0 < (« • «) • (v ■ v) — (u ■ v)2, neboli: (« ■ v)2 < (u ■ u) ■ (v ■ v), což po odmocnění dává dokazovanou nerovnost (1). D Důsledek. Ve Schwarzově nerovnosti (1) nastane rovnost, právě když vektory «, v jsou lineárně závislé. Důkaz. Z důkazu předchozí věty plyne, že v (1) nastane rovnost, právě když v = o nebo « — r • v = o, tzn. právě když «, v jsou lineárně závislé. D Poznámka. Schwarzovu nerovnost (1) často zapisujeme v ekvivalentním tvaru: Euklidovské vektorové prostory (u ■ v)2 < \\u\\ ■ ||v |2 Poznamenejme ještě, že pro nerovnost (1) se v literatuře používá též pojmenování „Cauchyova nerovnost", resp. „Cauchy-Bunjakovského nerovnost", event. „Cauchy-Schwarzova nerovnost". Věta 1.4. Nechť V je euklidovský prostor, «, v G V, r G KL Pak platí: (1) II u || > 0; přičemž \\u\\ = 0, právě když u = o, (2) ||r • « || = \r\ ■ ||« ||, (3) ||« + v || < ||«|| + \\v ||, (4) je-li u ^ o, pak tAj • « je normovaný vektor. Důkaz. (1) a (4): Jsou bezprostředními důsledky definice velikosti vektoru. (2): || r ■ u II = (r • «) • (r • «) = r2 • (« • «), odkud po odmocnění dostáváme: • «II = -y/r2 •(«•«) « (3): Z definice velikosti vektoru a Schwarzovy nerovnosti plyne: ||« + v || -(« + v) ■ (« + v) = (« • «) + 2 • (« • v) + (v ■ v) < (« • «) + 2 • ||«|| • || v || + (v • t>) = ||« || + 2 • ||«|| • || v || + || v || = (||«|| + || v ||) . Protože však ||« + t; || i (|| «|| + || v ||) jsou nezáporná čísla, dostáváme po odmocnění žádané tvrzení. □ Poznámka. 1. Nerovnost uvedená ve 3. části věty se obvykle nazývá „trojúhelníková nerovnost". 2. Použijeme-li obratu provedeného ve 4. části věty (tzn. vektor « násobíme číslem Tprr), pak říkáme, že jsme vektor « „normovali". \\u\\ Definice. Nechť «, v jsou nenulové vektory z euklidovského prostoru V. Pak reálné číslo tp splňující vztahy: u -v COS (f = j.-----n----r.----77 A 0 < (f < 7T (2) ||« || • ||« || se nazývá odchylka vektorů u,v. Poznámka. Je potřeba si rozmyslet, že uvedená definice odchylky je korektní, tzn. že číslo tp splňující (2) existuje, a to jediné. Ale Schwarzovu nerovnost můžeme pro nenulové vektory «, v přepsat ve tvaru: 2 Ortogonálnost 89 ||-u||-||«| < 1, tzn. INI < 1, odkud -1 < n "'ff n < 1. — ' — ||-u||-||«|| — Vidíme tedy (na základě našich znalostí o goniometrických funkcích), že existuje právě jedno reálné číslo tp splňující podmínky (2). Poznamenejme ještě, že odchylka vektorů není definována pro případ, kdy některý z těchto vektorů je nulovým vektorem. §2. Ortogonálnost Definice. Nechť V je euklidovský prostor a nechť: uu...,uk (1) je konečná posloupnost vektorů z V. Řekneme, že: (1) posloupnost (1) je ortogonální (nebo stručně, že vektory i*i,...,itfc jsou ortogonální), jestliže je: u-i • u j = 0 pro každé i,j = l,...,k A i j^ j, (2) posloupnost (1) je ortonormální (nebo stručně, že vektory u\,..., u^ jsou ortonormální), je-li ortogonální a každý její vektor je normovaný, (3) posloupnost (1) je ortogonální báze (resp. ortonormální báze) euklidovského prostoru V, jestliže je ortogonální (resp. ortonormální) a navíc je bází prostoru V. Poznámka. Rozebereme-li si definici ortogonálnosti pro nejjednodušší případy, pak ihned vidíme, že: pro k = 1: Posloupnost sestávající z jednoho vektoru je vždy ortogonální (bez ohledu na to, zda např. daný vektor je nulový či nikoliv). pro k = 2: Vektory 111,1*2 jsou ortogonální, právě když 111-1*2 = 0. V tomto případě budeme psát 1*1 ± 112 nebo 1*2 _L iti (zřejmě zde nezáleží na pořadí vektorů). Dále, jsou-li oba vektory 111,1*2 nenulové, pak zřejmě jsou ortogonální, právě když jejich odchylka je ^ (plyne z definice odchylky). Na druhé straně, dva vektory, z nichž alespoň jeden je nulový, jsou vždycky ortogonální (přičemž jejich odchylka samozřejmě není definována). Další vlastnosti ortogonálních vektorů popisují následující tvrzení. Věta 2.1. Nechť V je euklidovský prostor. Pak pro vektory z V (1) n _L i* <í=> i* = o, (2) n _L x pro každé x G V <í=> u = o, 90 Euklidovské vektorové prostory f k \ (3) u _l_ Wi pro i = 1,..., k <í=^ u _l_ I J^r, • Wi j pro každé V{ G M. Důkaz. (1), (2): Ihned plyne z předchozí definice a z definice skalárního součinu. (3): „=>": Nechť ti _L toj, tzn. u ■ Wj = 0 pro i = 1,...,A. Pak pro libovolná r j G M je: ŕ k \ k \i=l / i=l a tedy u _L í £>; • t«; j. „-4=": Zvolíme-li r, = 1 a r j = 0 pro j 7^ i, pak m ± to j, i = 1,..., k. D Věta 2.2. Nenulové ortogonální vektory euklidovského prostoru V jsou lineárne nezávislé. Důkaz. Nechť Ui,...,uk G V jsou nenulové ortogonální vektory. Nechť n ■ ui H-------\-rk-uk = o. Provedeme-li (pro libovolné i = l,...,/s) skalární součin vektoru ti, s oběma stranami této rovnosti, dostaneme: (ri • «1 H-------h r/; • uk) ■ Ui = o ■ uÍ7 odkud po rozepsání a s využitím ortogonálnosti zadaných vektorů dostáváme r i ■ (u-i ■ Ui) = 0. Protože však Ui 7^ o, je Ui ■ u-i 7^ 0, a musí tedy být r, = 0 (pro každé í = 1,..., k). To však znamená, že vektory m, ...,«& jsou lineárně nezávislé. D Poznamenejme, že předpoklad nenulovosti všech vektorů je v předchozí větě podstatný a bez něj věta neplatí. Jinak řečeno, jsou-li ortogonální vektory z V lineárně závislé, znamená to, že alespoň jeden z nich musí být nulový. Věta 2.3. Nechť V je euklidovský prostor, U\,...,uk G V libovolné. Pak existují ve V ortogonální vektory ei,... ,ek, které generují tentýž podpro-stor jako vektory ui,...,Uk, tzn. platí: 2 Ortogonálnost 91 L(ui, ...,Uk) = L(e1,..., ek). Důkaz. Provedeme matematickou indukcí vzhledem ke k. a) Pro k = 1 tvrzení platí (stačí položit e\ = U\). ß) Předpokládejme, že tvrzení věty platí pro i = 1,2,..., k — 1 (k > 2). Tedy existují ortogonální vektory ei,..., ek-i tak, že platí: L(ui,..., Mfc-i) = L(ei,..., e/;_i). (2) Položme: ek=pi-e1-\-------h Pfe—i • ek-i + u/t, (3) kde pi G M, a určíme koeficienty p, tak, aby ek ■ e^ = 0 pro i = 1,..., k — 1. Ale po provedení skalárního součinu vektoru e-i s oběma stranami (3) dostaneme: ek ■ ei = 0 = pi ■ (ei ■ e;) + («* • e;), odkud: Í-^T1 je-lie^o (libovolné je-li e, = o Potom tedy vektory ei,...,ek jsou ortogonální. Zbývá nám ještě dokázat rovnost L(u\,... ,uk) = L(e\,...,ek). Ale z (2) a (3) plyne jednak, že «i,... ,uk £ -ť(ei,... ,ek), tzn. L(u\,... ,uk) C Z/(ei,...,ejt), a také, že ei,... ,e/t G £(«i,... ,«*), tzn. L(ei,...,ek) C L(ui,..., Mfc). Dohromady pak dostáváme žádanou rovnost. D Poznámka. 1. Důkaz předchozí věty byl konstruktivní a jeho algoritmus se nazývá Gram-Schmidtův ortogonalizační proces (používá se při řešení konkrétních příkladů!). 2. V předchozí větě se nic nepředpokládá o lineární závislosti nebo nezávislosti vektorů ui,...,uk. Proto výsledné ortogonální vektory ei,..., ek mohou, ale nemusí být všechny nenulové. Přesněji řečeno, je-li dimXí(«i,..., uk) = f (< k), pak tedy i dimL(ei,... ,ek) = r, což znamená, že právě (k — r) z vektorů ei,..., ek je nulových a zbývajících r vektorů je nenulových a tvoří ortogonální bázi podprostoru L(u\,... ,uk), tj. podprostoru generovaného vektory u\,..., uk. Specielně tedy, jsou-li vektory m,...,uk lineárně nezávislé, tzn. tvoří bázi podprostoru L(ui,..., uk), pak vektory ei,..., ek tvoří ortogonální bázi tohoto podprostoru. 92 Euklidovské vektorové prostory Věta 2.4. V každém nenulovém euklidovském prostoru V existuje ortogonální báze (resp. ortonormální báze). Důkaz. Nechť txi,... ,txn je libovolná báze V. Pak podle předchozí věty a poznámky existuje ortogonální báze ei,...,en prostoru V. Normováním každého z vektorů e\,..., en pak dostaneme ortonormální bázi tAtt • llei| ei,...,T^-|T -en prostoru V. D Příklad 2.1. V euklidovském prostoru ffi4 se skalárním součinem definovaným: (x1,X2,x3,X4) ■ (yi,2/2,2/3,2/4) = xiy1 + x2y2 + x3y3 + x^yi nalezněte ortogonální bázi podprostoru W generovaného vektory txi, 1x2, 1x3. Přitom: «i = (0,1,2,1), ti2 = (-1,1,1,1), «a = (1,0,1,0). Řešení: Platí VK = £(1x1,1x2,1*3), tzn. použijeme Gram-Schmidtova or-togonalizačního procesu: ei = «i = (0,1, 2,1). e2 = p ■ ei + ti2, kde p = -^ = -§. Tedy e2 = (-1, ±, -±, ±). e3 = pí • ei +P2 • e2 + 1x3, kde pí = -^|i = -±, p2 = -ffíff = 1. Tedy e3 = -5 • ei + e2 + «3 = (0,0,0,0) = o. Výsledek: ortogonální bázi podprostoru W tvoří např. vektory ei,e2- Definice. Nechť A, B jsou libovolné podmnožiny euklidovského prostoru V. Je-li: a ■ b = 0 pro každé a G A, b G .B, pak říkáme, že A, B jsou ortogonální množiny a píšeme ALB nebo i? _L A Poznámka. Jinak řečeno, A, B jsou ortogonální množiny, právě když a, b jsou ortogonální vektory pro každé a € A, b € B. Ve specielních případech: prázdná množina, resp. množina {0} jsou zřejmě ortogonální ke každé podmnožině ve V. Dále z definice plyne, že: A±B => inß = Ö nebo A n B = {o}. Následující věta pak ukáže, že při studiu ortogonálních množin bude mít smysl omezit se pouze na podprostory euklidovského prostoru V. 2 Ortogonálnost 93 Věta 2.5. Nechť A, B jsou podmnožiny euklidovského prostoru V. Pak platí: ALB ^^ [A] ± [B], tzn. dvě množiny jsou ortogonální, právě když jsou ortogonální podprostory generované těmito množinami. Důkaz. ,,<=": Plyne z definice, uvědomíme-li si, že A C [A], B C [B]. „=£-": Pro A = 0 nebo B = $ tvrzení zřejmě platí (neboť [0] = {o}). Předpokládejme tedy A^§, B j^§ & ALB. Nechť dále u € [A], v € [B] libovolné. Ale podprostor [A] je roven množině všech lineárních kombinací konečně mnoha vektorů z A (plyne z věty 2.3. (2), kap. I. - rozepište si podrobně sami!), tzn. u = p\ ■ a\ + • • • + pf. ■ a,k, kde o, G A, a podobně v = ri • &i + • • • + rm ■ bm, kde bj G ß. Potom však: / k \ / m \ km u-v = [ YsPi ■ o-i • I X) r j • 6j = X) Eftrj • (a? • fy) = °> neboť Oj • bj = 0. Tedy platí [A] _L [5], což jsme měli dokázat. D Definice. Nechť W je podprostor euklidovského prostoru V. Pak množina: W1 = {x€V\x-w = 0 pro každé w G W} se nazývá ortogonální doplněk podprostoru W (ve V). Poznámka. Zřejmě platí W _L VK a ve specielních případech přímo z definice dostáváme, že V1 = {o}, resp. {o}^ = V. Základní obecné vlastnosti ortogonálního doplňku pak popisují následující věty. Věta 2.6. Nechť W je podprostor euklidovského prostoru V. Pak platí: (1) W1- je podprostor ve V, (2) V = W+W^, tzn. prostor V je přímým součtem podprostoru W a WL. Důkaz. (1): Zřejmě o G WL, a tedy WL ^ 0. Dále nechť x,y G W1, r G ffi libovolné. Pak pro libovolný vektor w G W je: (a? + y) ■ w = (x ■ w) + (y ■ w) = 0 + 0 = 0, 94 Euklidovské vektorové prostory resp. (r • a?) • w = r ■ (x ■ w) = r ■ O = O, a tedy W1- je podprostor ve V. (2): Je-li W = {o}, pak W1 = V a tvrzení platí. Nechť tedy W ^ {o} a nechť ei,..., e& je ortonormální báze TV (její existence je zaručena větou 2.4.). a) Dokážeme, že W + W1- = V. Zřejmě stačí dokázat inkluzi „D". Nechť tedy ti e F libovolný. Označme: x = (u ■ ei) • ei H-------h (u • e*) • e*. Pak zřejmě x G W. Dále vezměme vektor (—a? + u) a spočtěme: (-a; + u) ■ e, = -(a; • e-i) + (m • e-i) = -(u ■ e,) + (u ■ e,) = 0 pro « = !,...,&, odkud plyne, že (—x + u) G VF1. Potom však m = x + (-x + u) e W + WL. b) Platí W n Tyx = {o}, neboť loelfn T^-1 =>• io-io = 0 =>• tu = o. Dohromady pak dostáváme, že T^ = W+WL. D Poznámka. Je-li VF libovolný podprostor ve F, pak (podle 2. části předchozí věty a podle definice přímého součtu podprostorů) se libovolný vektor u G V dá napsat, a to jediným způsobem, ve tvaru: u = x + y, kde x £W, y £ W1. Poznamenejme, že vektor x z tohoto vyjádření se nazývá ortogonální projekce vektoru u do podprostoru W. Následující věta ukáže, že ortogonální projekce součtu dvou vektorů je rovna součtu jejich ortogonálních projekcí a podobně tomu je pro násobek vektoru. Věta 2.7. Nechť W je podprostor euklidovského prostoru V, nechť x (resp. x') je ortogonální projekce vektoru u (resp. u') do podprostoru W a nechť r £ R libovolné. Pak platí: (1) (a? + x') je ortogonální projekce vektoru (u + u') do W, (2) r • x je ortogonální projekce vektoru r ■ u do W. 2 Ortogonálnost 95 Důkaz. Podle předpokladu je u = x + y, u' = x' + y', kde íc, x' G W, y, y' G W1. Potom: (1): (« + «') = (x + y) + (x' + yl) = (x + x') + (y + y'), kde x + x' G W, y + y' GW1, (2): r ■ u = r ■ (x + y) = r ■ x + r ■ y, kde r • x G W, r ■ y G W^, odkud již podle předchozí poznámky plyne tvrzení. D Věta 2.8. Necht W, S jsou podprostory euklidovského prostoru V. Pak platí: (1) (W1)1 = W, (2) (w + s)1 = w1ns1; (3) (wn(s)1 = w1 + Ä1. Důkaz. (1): Podle věty 2.6. je W+W± = V a také W^+O^-1-)1- = F, odkud plyne, že dim TV = dimF — dim VF1- = dim(Ty±)±. Je tedy dim W = dim(VFJ-)-1-, přičemž zřejmě W C (Ty^)1, tzn. pak (podle věty 4.5. (2), kap. l.)jeW = {WL)L. (2): Inkluze „C" je zřejmá. Dokážeme inkluzi „D". Nechť íc G VK1- í~l S1-a nechť ti G (W + S) je libovolný, tzn. u = w + s, kde w G TV, séS. Potom: a tedy je x G (TV + S)1. Je tedy W1 n S1 C (TV + Ä)1 a dohromady platí žádaná rovnost. (3): Užitím (1) a (2) dostáváme: (wns) = (wL)L n (s1)1 = (w1 + s1)1, odkud: (iy n ä)1 = ((W1 + S1)1)1 = WL + SL. D Kapitola 5 Lineární zobrazení vektorových prostorů §1. Základní vlastnosti lineárního zobrazení V našich předchozích úvahách o vektorových prostorech jsme vždy vyšetřovali vlastnosti jednoho vektorového prostoru (pro úplnost připomeňme, že vektorovým prostorem rozumíme vždy konečnědimenzionální vektorový prostor). V této kapitole se naopak budeme zabývat vzájemnými vztahy mezi dvěma (případně i více) vektorovými prostory. Tyto „vzájemné vztahy" budeme studovat pomocí zobrazení jednoho vektorového prostoru do druhého. Aby naše úvahy měly praktický smysl, bude zřejmě nutné pracovat s takovými zobrazeními, která nějakým způsobem „zachovávají" operace, s nimiž se ve vektorových prostorech setkáváme, tj. zachovávají jednak součet vektorů a jednak násobek čísla s vektorem. Přitom zřejmě druhý požadavek bude moci být splněn jen tehdy, když uvažované vektorové prostory budou nad stejným číselným tělesem. Definice. Nechť V, V jsou vektorové prostory nad týmž číselným tělesem T. Zobrazení

V je lineární zobrazení, pak ověřujeme buď podmínky (1) a (2), nebo jedinou podmínku (3). Dále, matematickou indukcí lze (3) rozšířit na libovolný konečný počet sčítanců, tzn. pro lineární zobrazení

platí: ip(ti -Ui-\--------h tk ■ uk) = ti ■ V definované: Mn[x] definované: S(f(x))=f(x) PT0Vf(x)eMn[x], tj. zobrazení přiřazující polynomu /(x) jeho derivaci /'(re), je lineární zobrazení (při ověřování podmínek (1) a (2) se využije některých vět o derivování funkcí známých z analýzy). Zřejmě ö není bijektivní zobrazení, a tedy není izomorfismem. Věta 1.1. Nechť ip : V —> V je lineární zobrazení. Pak platí: (1) («&) jsou lineárně závislé vektory (ve V). Důkaz. (1): Zřejmě je o = 0 • o, tzn. pak existují ti,...,tn £ T, z nichž alespoň jedno je různé od nuly, tak, že t\ • u\ + • • • + t& • u^ = o. Pak ale yj(ťi-itH-------\-tk-uk) = ip(o), tzn. ti-ip(ui)-\-------\-tk-(p(uk) = o', a tedy 9?(«i),..., V zobrazení a W je podmnožina ve V, pak symbolem V je lineární zobrazení, W podprostor ve V. Pak: (1) (p(ui),..., dim V, ip : V —> V" lineární zobrazení, pak ip o tp : V —> V" je lineární zobrazení. Důkaz. Ověříme podmínku (3). Pro ti, v G V, t, s G T je: (lp o (f)(t ■ U + S ■ V) = 4>(ip(t ■ U + S ■ V)) = 1p(t ■ (p(u) + S ■ 0(p)(v)), a tedy (ip o ip) je lineárni zobrazení. D Následující důležitá věta ukáže, že k úplnému zadání lineárního zobrazení V —> V stačí zadat pouze obrazy vektorů pevné báze prostoru V a obrazy zbývajících vektorů z V jsou pak již jednoznačně vynuceny. Na druhé straně, takovýto výsledek se dá celkem očekávat, uvědomíme-li si, že každý vektor z V je jistou lineární kombinací vektorů báze a že lineární zobrazení „zachovává lineární kombinace vektorů". Věta 1.4. (Základní věta o lineárních zobrazeních) Nechť V, V jsou vektorové prostory nadT, nechť Ui,... ,unje báze prostoru V a nechť v^,..., v'n jsou libovolné vektory z V. Pak existuje jediné lineární zobrazení tp : V —>• V takové, že V je lineární zobrazení takové, že ip(ui) = v\, ..., ip(un) = v'n. Pak pro libovolný vektor x € V (pro nějž x = x\ ■ U\ + • • • + %n ' un) je: 100 Lineární zobrazení vektorových prostorů ip(x) = ip(xí • «H-------h xn • un) = xx ■ ip{ui) -\-------h xn • ip(un) = Xfv[-\-------h xn ■ v'n = ip(x), což však znamená, že ip = (p. D Definice. Nechť (p : V —> V je lineární zobrazení. Pak: (1) množina Ker (p = {u G V | V je lineární zobrazeni. Pak: (1) jádro Ker (p je podprostorem ve V, (2) obraz Im (p je podprostorem ve V'. Důkaz. (1): Zřejmě o G Ker": Nechť a? G Ker op libovolný. Pak V. Pak zobrazení V je bijektivní a ukážeme, že je lineární zobrazení. Nechť m', v' G V, t,s G T libovolné a označme <í3_1(ti/) = m, V je ízomorfismus. Pak platí: (1) «!,...,«£ G V jsou lineárně závislé -<=^ ip(u\),... , V bijektivní lineární zobrazení a podle důkazu předchozí věty je V také bijektivní lineární zobrazení. Potom: (1): Plyne z věty 1.1. (3) aplikované na dimV = dimV. Důkaz. „=>": Plyne přímo z věty 1.9. (4). ,,^=": Je-li dim V = dim V = 0, pak zřejmě V = V. Nechť tedy dim V = dim V' = n (> 1) a nechť u\,..., un je báze V, resp. u\,...,u'n'^e báze V'. Nechť dále x G V libovolný, přičemž x = x\ • u\ + • • • + xn • un (víme, že toto vyjádření existuje, a to jediné). Položme: ip{x) = xi-u[-\-------\-xn- u'n. Pak zřejmě

V je zobrazení a rozepsáním se ukáže, že

V se nazývá lineární transformace vektorového prostoru V. Je-li navíc tp bijektivní, pak se nazývá automorfismus vektorového prostoru V. Poznámka. Vidíme, že lineární transformace je pouze specielním případem lineárního zobrazení, a sice pro V' = V. Znamená to tedy, že všechny úvahy a tvrzení z předchozího paragrafu zůstávají v platnosti i pro lineární transformace, přičemž bude zřejmě platit ještě něco navíc. Specielně zdůrazněme, že podle základní věty o lineárních zobrazeních je lineární transformace nenulového prostoru V jednoznačně určena zadáním obrazů pevné báze prostoru V. Dále si všimněme toho, že je-li V = {o}, pak existuje pouze jediná, a to identická lineární transformace prostoru V a všechny úvahy o ní jsou víceméně triviální. Proto se v dalším budeme zabývat pouze lineárními transformacemi nenulových vektorových prostorů. Nejprve uvedeme větu, která nám podá řadu ekvivalentních podmínek pro to, aby lineární transformace byla automorfismem, tj. aby byla bijektivní. Věta 2.1. Nechť

(2)": Zřejmé. „(2) =>■ (3)": Nechť ■ (4)": Je-li - (5)": Nechť u\,...,Uk G V jsou lineárně nezávislé vektory. Ale lineárně nezávislé vektory z V lze doplnit na bázi V, odkud užitím (4) dostaneme, že ■ (1)": Z (5) plyne, že Ker^ = {o} (neboť je-li x ^ o libovolný, pak x je lineárně nezávislý, a tedy podle (5) je in\ (í2l «22 • • • «2n \Clfil Oin2 • • • dnny se nazývá matice lineární transformace

V. Zřejmě je jC(V) j^ 0, neboť například identické zobrazení idy G £(V). Na množině C(V) nyní určitým přirozeným způsobem definujeme součet a součin, resp. násobek číslem a popíšeme základní vlastnosti takto vzniklých algebraických struktur. Definice. Nechť (p,tp G £(V), í G T libovolné. Pak zobrazení: (1) (p + ip : V —> V definované ((p + ip)(u) = (p(u) + ip(u) pro \/u 6ľse nazývá součet lineárních transformací (p a ip, (2) ipoif; : V —> V definované {tpoijj)(u) = (p(ý(u)) pro V« G V se nazývá součin lineárních transformací (p a iß, (3) t ■ (p : V —> V definované (t ■ V. Rozepsáním se bezprostředně ověří, že jsou to lineární zobrazení. (2): Dokáže se rozepsáním. Přitom roli nulového prvku hraje nulová lineární transformace lo : V —> V (definovaná lo(u) = o pro Vít G V), resp. 2 Lineární transformace a její matice 107 opačným prvkem k (p G C(V) je lineární transformace g : V —> V definovaná g(u) = —(p(u) pro Vít £ V. (3): Dokáže se opět rozepsáním, s využitím (2). Jedničkou okruhu je zřejmě identická transformace idy. (4): Dokáže se užitím (2) a bezprostředním ověřením axiomů vektorového prostoru. D Věta 2.3. Nechť ip, ip jsou lineární transformace prostoru V, dim y = n > 1 a nechť maticí (p (resp. tp) v bázi (1) je matice A (resp. B). Potom: (1) maticí lineární transformace f + ip v bázi (1) je matice A + B, (2) maticí lineární transformace ip o ip v bázi (1) je matice A ■ B, (3) maticí lineární transformace t ■

1. PaÄ; veA;-torový prostor C(V) je izomorfní vektorovému prostoru Matnn(T). Důkaz. Nechť (1) je pevná báze V. Definujme zobrazení F : jĺ(V) —> Matnra(T) takto: pro libovolné (p € C(V) položme: 108 Lineární zobrazení vektorových prostorů F( 1). Pak platí: A, B jsou maticemi téže lineární transformace prostoru V (ve vhodných bázích) <í=^ existuje regulární matice S tak, že B = 51-1 • A ■ S. Důkaz. „=>": Nechť A = (öy), resp. B = (bij) je matice lineární transformace tp v bázi (1), resp. v bázi (ľ) (kde (1) je báze u\,... ,un, resp. (ľ) je báze u\,... ,u'n). Dále nechť S = (s i j) je matice přechodu od báze (1) k bázi (ľ), tzn. S je regulární matice a platí: n U j = 2^i Si j • U j i=l pro j = 1,..., n. Potom však: 2 Lineární transformace a její matice 109 n n n n / n \ VÍK) = Ehj -u'k= Ehj ■Ylsik-Ui = Y,( Esikhj ■ uí k=l k=l i=l 1=1 \k=l J a také: ŕ n \ n n n (flu1,) = je lineární transformace vektorového prostoru V. Podprostor W vektorového prostoru V se nazývá invariantní podprostor vzhledem k p>, je-li: tp(W) C W, tzn. pro libovolný vektor x G W platí (p(x) G W. Příklad 3.1. Nechť V je libovolný pevný vektorový prostor nad T. Uvažme: 1. Identickou lineární transformaci idy : V —> V. Pak zřejmě každý podprostor W ve V je invariantní vzhledem k idy. 2. Nulovou lineární transformaci co : V —> V (definovanou oj{x) = o pro Víc G V). Pak opět každý podprostor W ve V je invariantní vzhledem k co. 3. Libovolnou lineární transformaci

V. Pak triviální podpro-story ve V (tzn. podprostory {o} a V) jsou invariantní vzhledem k ip. Příklad 3.2. Ve vektorovém prostoru I? uvažme podprostor W = {(x, 0) | x G K} a dále uvažme dvě lineární transformace

2,0), ip((x1,x2)) = (x2,x1) pro každé (2:1,2:2) £ K2. Lehce se ověří, že W je invariantní podprostor vzhledem k {u\ H-------h Uk) = V je identická lineární transformace prostoru V. Pak zřejmě každý nenulový vektor z V je vlastním vektorem idy příslušným vlastní hodnotě A = 1 (což je jediná vlastní hodnota idy). 2. Nechť oj : V —> V je nulová lineární transformace prostoru V. Pak podobně každý nenulový vektor z V je vlastním vektorem transformace oj příslušným vlastní hodnotě A = 0 (což je opět jediná vlastní hodnota oj). 3. Nechť (p : V —> V je libovolná lineární transformace. Pak všechny nenulové vektory z Ker

^n[x] je lineární transformace derivování (viz příklad 1.3.). Bezprostředně je vidět, že polynomy stupně nula (tj. nenulové reálné konstantní polynomy) jsou vlastními vektory transformace ô příslušnými vlastní hodnotě A = 0 a že žádné jiné vlastní hodnoty a vlastní vektory 6 neexistují. 3 Vlastní vektory a vlastní hodnoty lineární transformace 115 Předchozí příklady vlastních hodnot a vektorů byly víceméně triviální. Úplný popis vlastních hodnot a vlastních vektorů lineární transformace v obecném případě podává následující věta. Věta 3.3. Nechť tp je lineární transformace vektorového prostoru V nad T. Pak: (1) vlastními hodnotami tp jsou právě všechny kořeny (patřící do T) charakteristického polynomu transformace tp, (2) je-li X £ T vlastní hodnota tp, pak vlastní vektory tp příslušné X jsou právě všechny nenulové vektory z podprostoru Ker( — X ■ idy) vektorového prostoru V. (1): Z právě dokázaného a z vět 2.8. a 1.7. plyne: A je vlastní hodnota ip <í=^ A G T a Ker( <^=^ A G T a \A — X ■ En\ =0, neboli A G T je kořenem charakteristického polynomu lineární transformace (p. D Důsledek. Nechť tp je lineární transformace prostoru V, nechť A = (a-ij), 1 < «, j < rij je matice tp (v dané bází prostoru V) a nechť X je vlastní hodnota tp. Pak vlastní vektory transformace tp příslušné X (vyjádřené v dané bázi) jsou právě všechna nenulová řešeni soustavy lineárních rovnic: (an - X)xi + ai2^2 H-------\- ainxn = 0 «21^1 + (ö22 - A)a;2 H--------h 02n^n = 0 • (3) anixi + an2^2 H-------h (ann - X)xn = 0 116 Lineární zobrazení vektorových prostorů Důkaz. Nechť Mi,..., un je daná báze V a nechť vektor u má v této bázi souřadnice (x\,... ,xn), tj. u = x\ ■ U\ + • • • + xn ■ un. Pak po dosazení a úpravě dostáváme: (ip — A • idy) (ti) = V' je lineární zobrazení, pro něž platí: u • v = bijektivní, pak se nazývá izomorfizmus euklidovského prostoru V na, V a, euklidovské prostory V, V se nazývají izomorfní. Je-li specielně V = V, pak se ortogonální zobrazení tp nazývá ortogonální transformace euklidovského prostoru V. Podmínku „zachování skalárního součinu" z předchozí definice je možné vyjádřit několika ekvivalentními způsoby, jak ukazuje následující věta. Věta 4.1. Nechť V, V jsou euklidovské prostory a ip : V —¥ V je lineární zobrazení. Pak následující výroky jsou ekvivalentní: (1) u • v = (2)": Nechť platí (1) a nechť u E V. Pak (užitím (1)) dostáváme: || u || = u ■ u = (3)": Nechť platí (2) a nechť u\,... ,Uk jsou ortonormální vektory ve V. Nechť i, j = 1,..., k. Pak (užitím (2)): - pro i = j platí: ip(Ui) ■ ip(Ui) = || ip(Ui) ||2 = || Ui ||2 = 1, - pro i t^ j platí: 2-ip(Ui) -- (1)": Nechť platí (3) a u,v E V. Je-li m = o, pak zřejmě platí (1). Nechť tedy u ^ o. Mohou nastat dva případy: a) Vektory u, v jsou lineárně nezávislé. Pak podle poznámky za větou 2.3., kap. IV., existují ortonormální vektory ei, e2 tak, že u = u\ ■ e\ + u^ ■ ela nechť dále: ei,..., en je ortonormální báze V, resp. e'1?..., e'n je ortonormální báze V. Nechť u £ V je libovolný vektor, přičemž: n U = Y^ui • ei-i=l Položme: n (p(u) = x>ť ■ e'i- Pak (f je zřejmě zobrazení prostoru V do V, o němž se rozepsáním lehce ověří, že je bijektivní a že je lineárním zobrazením. Navíc je: \\ip(u)\\2 = ip(u) - V je ortogonální zobrazení. Pak

• V je ortogonální transformace euklidovského prostoru V. Pak platí: (1)

V a podle důkazu věty 1.8. je ip~l lineární zobrazení. Dále, nechť u, v G V libovolné. Označme ip~l{u) = x, (p~l(y) = y. Potom _1(u), tzn. dostáváme, že (p~l je ortogonální transformace euklidovského prostoru V. (3): Nechť A je vlastní hodnota (p (tj. musí být A G IR) a nechť u je vlastní vektor ip příslušný vlastní hodnotě A. Pak je (p(u) = A • u a u j^ o, odkud: u • u = (p(u) ■ (p(u) = (A • u) ■ (A • u) = A2 • (u • u). Ale u ■ u j^ 0 (poněvadž u j^ o), a tedy musí být A2 = 1, neboli A = ±1. □ Každá ortogonální transformace (euklidovského) prostoru V je zřejmě lineární transformací tohoto (vektorového) prostoru V, a tedy můžeme sestrojit její matici v nějaké dané bázi prostoru V, specielně např. v dané ortonormální bázi prostoru V. Ukážeme, že v takovém případě bude pak mít tato matice jistý speciální tvar. 122 Lineární zobrazení vektorových prostorů Definice. Nechť A je čtvercová matice nad M taková, že A je regulární a platí A~l = A' (tj. inverzní matice je rovna matici transponované). Pak matice A se nazývá ortogonální matice. Věta 4.5. Nechť A je čtvercová matice řádu n nad R. Pak následující výroky jsou ekvivalentní: (1) A je ortogonální matice, (2) A-A' = En, (3) A'-A = En. Důkaz. Věta plyne bezprostředně z definice ortogonální matice, definice inverzní matice a poznámky za větou 3.10., kap. II. D Věta 4.6. Nechť A, B jsou ortogonální matice řádu n. Pak platí: (1) A ■ B je ortogonální matice, (2) A~ľ je ortogonální matice, (3) \A\ = ±1. Důkaz. (1): (A ■ B) ■ (A ■ B)' = A ■ (B ■ B') ■ A' = A ■ En ■ A' = A ■ A' = En, a tedy podle věty 4.5. je A ■ B ortogonální maticí. (2): Plyne z věty 4.5., uvážíme-li, že (A1)' = A. (3): Víme, že \A\ = \A'\, tzn. pak z věty 4.5. a z Cauchyovy věty dostáváme: l = \En\ = \A-A'\ = \A\-\A'\ = \A\2, odkud \A\ = ±1. D Důsledek. Množina všech ortogonálních matic řádu n s operací násobení matic je grupou. Důkaz. Tvrzení plyne z předchozí věty, uvědomíme-li si, že násobení matic je asociativní a že jednotková matice En je ortogonální. D Věta 4.7. Nechť V je euklidovský prostor a tp : V —>• V je lineární transformace. Pak (p je ortogonální transformace *<=> matice transformace

(«) = E^i • y(ej) = E^i • E «K • efc = E Y,akiUi ■ ek, i=l i=l k=l k=l \i=l / odkud rozepsáním a úpravou dostáváme: n n / n \ IM«) II = («)•(«) = E E ( Eßfcjöfej pj%, i=ij=i \fc=i / tzn. po dosazení (2) je pak: n IM«) II2 = E«?. Dohromady tedy ||u|| = || («) ||, což znamená, že tp je ortogonální transformace. D Na závěr ještě ukážeme, že maticemi přechodu od ortonormální báze k ortonormální bázi euklidovského prostoru jsou právě ortogonální matice. 124 Lineární zobrazení vektorových prostorů Věta 4.8. Nechť: «i,...,«n (3) vt,...,vn (4) jsou báze euklidovského prostoru V a nechť báze (3) je ortonormální. Pak platí: matice přechodu od báze (3) k bázi (4) je ortogonální -4=>- báze (4) je ortonormální. Důkaz. Nechť A = (a^) je matice přechodu od báze (3) k bázi (4), tzn. platí: n Vi = Yl aki ■ Uk fc=l pro i = 1,..., n. Potom však: vi ■ v j = \Yj aki ■ Uk\ ■ [ Í2alj ■ ul ) = alialj H--------1" aniünj, odkud již (užitím věty 4.5.) bezprostředně plyne celé tvrzení věty. D