Pavel   Horák
LINEÁRNÍ ALGEBRA A GEOMETRIE I. UČEBNÍ   TEXT
Tento učební text je určen pro předmět Lineární algebra a geometrie L, který je povinným předmětem ve všech studijních oborech studijnho programu Aplikovaná matematika, včetně distanční formy studia, na přírodovědecké fakultě Masarykovy Univerzity v Brně. Jedná se o jednosemestrální kurz, který je doporučen absolvovat ve 2. semestru studia a který navazuje na předmět Základy matematiky.
Učební text předpokládá jednak elementární znalosti středoškolské matematiky a dále pak základní znalosti látky absolvované v předmětu Základy matematiky. Po formální stránce je výklad veden co nejpodrobněji, přičemž se vždy výslovně připomínají drobná úskalí a důležité maličkosti, které by méně zkušený čtenář mohl často přehlédnout. Z těchto důvodů má podrobné studium poznámek a komentářů přinejmenším stejný význam jako „učení se" definic a vět. Totéž platí i pro důkazy jednotlivých tvrzení, které jsou zde v převážné většině naprosto přirozené, průhledné a bez umělých obratů. Konec důkazu je v textu vždy opticky označen symbolem D, umístěným na konci příslušného řádku.
Pro označování základních číselných množin jsou v textu použity následující standardní symboly:
N Z
množina všech přirozených čísel, tzn. čísel 1,2,3, množina všech celých čísel množina všech racionálních čísel množina všech reálných čísel množina všech komplexních čísel.
Obsah
1    Vektorové prostory                                                                          2
1        Vektorový prostor nad číselným tělesem...........       2
2       Podprostory vektorového prostom    ..............       6
3       Lineární závislost a nezávislost vektorů............      12
4       Báze a dimenze vektorového prostoru.............      19
2    Matice a determinanty                                                                  28
1        Pořadí a permutace.......................     28
2       Determinanty..........................     33
3       Algebra matic..........................     43
4       Hodnost matice.........................     52
5       Další vlastnosti a užití matic    .................     56
3    Soustavy lineárních rovnic                                                           67
1        Gaussova metoda řešení soustav lineárních rovnic......     67
2        Základní vlastnosti soustav lineárních rovnic.........     73
3       Homogenní soustavy lineárních rovnic............     77
4    Euklidovské vektorové prostory                                                  84
1        Skalární součin, velikost a odchylka vektorů.........     84
2        Ortogonálnost..........................     89
5    Lineární zobrazení vektorových prostorů                                  96
1        Základní vlastnosti lineárního zobrazení...........     96
2       Lineární transformace a její matice..............    104
3       Vlastní vektory a vlastní hodnoty lineární transformace   . .    112
4       Ortogonální zobrazení, ortogonální matice..........    118
1
Kapitola 1 Vektorové prostory
§1.   Vektorový prostor nad číselným tělesem
Pojem vektoru a vektorového prostoru je jedním ze základních pojmů moderní matematiky, kterého se využívá nejenom v řadě disciplín ryzí matematiky, ale rovněž v mnoha aplikacích, ať už v přírodních vědách nebo jinde.
Při zavádění pojmu vektorového prostoru se oproti předchozí kapitole situace poněkud komplikuje v tom, že tentokrát vycházíme ze dvou algebraických struktur, a to z jisté komutativní grupy (V,+), jejíž prvky budeme označovat tučnými písmeny, a dále z jistého číselného tělesa (T, +, •). Mezi těmito dvěma strukturami pak budou platit určité vazby. Pro zjednodušení vyjadřování si zaveďme následující úmluvu.
Úmluva. Při zapisování algebraických struktur už nebudeme vždy důsledně vypisovat symboly operací jako doposud, ale často budeme k označení celé struktury používat pouze symbol nosné množiny.
Tedy např. místo o grupě (V, +) budeme stručně hovořit o grupě V, místo o tělese (T, +, •) budeme stručně hovořit o tělese T, atd. Přitom je však třeba mít stále na paměti, že se jedná o zjednodušené označení, protože, jak víme, algebraickou strukturu nelze ztotožňovat pouze s její nosnou množinou.
Definice. Nechť (V, +) je komutativní grupa (jejíž prvky nazýváme vektory) a (T, +, •) je číselné těleso. Nechť pro každé číslo í G T a každý vektor u G V je definován vektor t ■ u €V tak, že platí:
2
1 Vektorový prostor nad číselným tělesem
3
(1)  t ■ (u + v) = t ■ u + t ■ v,
(2)  (t + s) ■ u = t ■ u + s ■ ti,
(3)  (t ■ s) ■ u = t ■ (s ■ u),
(4)  1 • u = u
pro lib. t, s E T a m, v E V. Potom V se nazývá vektorový prostor nad tělesem T.
Označení. Nulový prvek z (V, +) se nazývá nulový vektor a označuje se symbolem o. Opačný prvek k vektoru u E V se nazýva opačný vektor k vektoru u a označuje se symbolem —u. Vektor t ■ u se nazývá součin čísla t s vektorem u.
Poznámka. Výše definovaný součin čísla s vektorem je vlastně speciálním typem zobrazení, a sice zobrazením T x V —> V, které se někdy nazývá vnější operace, na rozdíl od (binární) operace na množině, např. V, což je zobrazení V x V —> V, které se pak nazývá vnitřní operace.
V definici vektorového prostoru se setkáváme se třemi vnitřními operacemi a jednou vnější operací, přičemž některé z nich označujeme stejnými symboly (sčítání ve V a sčítání v T symbolem +, resp. násobení v T a součin čísla s vektorem symbolem •). I když nemůže dojít k nedorozumění (vzhledem k tomu, že vektory zľa čísla z T odlišujeme graficky), je třeba si tuto skutečnost dobře uvědomit.
Připomeňme, že máme-li korektně definovat nějaký konkrétní vektorový prostor, pak z předchozí definice plyne, že musíme:
(1)  zadat číselné těleso T,
(2)  zadat množinu vektorů V,
(3)  zadat, jak je definováno sčítání vektorů,
(4)  zadat, jak je definován součin čísla z T s vektorem z V,
(5)  ověřit, že (V, +) je komutativní grupa a že platí axiomy (1) - (4) z definice vektorového prostoru.
Příklad 1.1.
1. Nechť T je libovolné číselné těleso, n je pevné přirozené číslo a nechť:
i    — n^x,..., xn) | äľi,..., xn Eij (tzn. Tn je množina všech uspořádaných n-tic prvků z tělesa T) je množina
4
Vektorové prostory
vektorů. Definujme pro lib. u = (u\,... ,un), v = (v\,... ,vn) € Tn a teT:
u + v = {ui +vi,...,un + vn),
t • U = (t • U\, . . . ,t-Un),
kde symboly +, resp. • na pravých stranách značí obyčejné sčítání, resp. násobení čísel (stručně říkáme, že sčítání vektorů a násobení čísla s vektorem je definováno „po složkách"). Pak (Tra,+) je komutativní grupa (viz příklad 1.7.4, kap. II) a lehce se ověří, že platí axiomy (l)-(4) z definice vektorového prostoru. Tedy Tn je vektorovým prostorem nad tělesem T.
Poznamenejme, že nulovým vektorem je v Tn zřejmě uspořádaná n-tice (0,0,..., 0) a opačným vektorem k (u\,..., un) je vektor (—u\,..., -«„).
Specielně, např. M3, QČ, C2, Q(\/2 )4, atd. jsou různé vektorové prostory tohoto typu.
2.  Vezměme těleso W reálných čísel. Množinou vektorů bude množina všech polynomů o neurčité x s reálnými koeficienty, kterou označme M[rc]. Sčítání vektorů definujeme jako obvyklé sčítání polynomů a součin čísla s vektorem definujeme jako obvyklé násobení polynomu reálným číslem.
Lehce se ověří, že (M[a;], +) je komutativní grupa a že platí axiomy (1) -(4). Tedy M[x] je vektorovým prostorem nad tělesem IR (nulovým vektorem tohoto vektorového prostoru je pak zřejmě tzv. nulový polynom, tj. polynom, jehož všechny koeficienty jsou nulové).
3.  Nechť n je pevné přirozené číslo. Vezměme opět těleso W reálných čísel a množinou vektorů nechť je množina sestávající z nulového polynomu a dále ze všech polynomů o neurčité x s reálnými koeficienty stupně < n, kterou označíme symbolem IR^ [x]. Tedy:
Mn[x] = {üQXn + a\xn~l + • • • + an-\x + an | ao,ai,... ,an G M}.
Sčítání vektorů a součin čísla s vektorem definujeme stejně jako v předchozím příkladu.
Lehce se ověří, že (ffin[a;],+) je komutativní grupa a že platí axiomy (l)-(4). Tedy IR^ je vektorovým prostorem nad tělesem R.
4.  Nechť T je libovolné číselné těleso a V = {v} je libovolná jednoprvková množina. Sčítání vektorů a součin čísla s vektorem definujeme (jediným možným způsobem, a sice): v + v = v, resp. t ■ v = v pro každé t G T. Pak zřejmě (V, +) je komutativní grupa a platí axiomy (1) - (4). Tedy V je vektorový prostor nad tělesem T, který budeme nazývat nulový vektorový prostor (nad T). Je to tedy vektorový prostor obsahující jediný vektor - a to nulový, tzn. v = o.
2 Podprostory vektorového prostoru
5
Poznámka. Uvědomme si, že množina vektorů V je vždy neprázdná, dále že nulový vektor ve V existuje jediný a opačný vektor k libovolnému vektoru z V existuje rovněž jediný (to vše plyne ihned z faktu, že (V, +) je grupa). Přitom je potřeba důsledně rozlišovat symboly o a 0, tzn. nulový vektor a číslo nula.
Dále připomeňme, že podle dříve zavedené úmluvy budeme místo u + (—v) psát stručně u — v. Následující věta nám pak dá další pravidla pro počítání s vektory.
Věta 1.1. Nechť V je vektorový prostor nad tělesem T, nechť t,s,G T, u,v € V lib. Pak platí:
(1)  t ■ (u — v) = t ■ u — t ■ v,
(2)  (t — s) ■ u = t ■ u — s ■ u,
(3)  t ■ u = o <í=^ t = 0 nebo u = o,
(4)  t ■ {-u) = (-t) • ti = -(ť ■ ti).
Důkaz. Provedeme většinou užitím axiomů (1) - (4) vektorového prostoru.
(1): t-(u-v) = t-(u+(-v))+t-v-t-v = t-(u+(-v)+v)-t-v = t-u-t-v.
(2): (t-s)-u = (t+(—s))-u+s-u—s-u = (t+(—s)+s)-u—s-u = tu—s-u.
(3): „<=": Je-li ť = 0, pakO-tí = (0-0)-tí = 0--u-0--u = o podle (2). Je-li u = o, pak t ■ o = t ■ (o — o)=to — to = o podle (1).
„=>": Nechť í • « = o a í ^ 0. Potom u = 1 ■ u = (j • t) ■ u =
j ■ (t ■ U) = j ■ O = O.
(4): Plyne z (1), (2) a (3), a sice: t ■ (—u) = t ■ (o — u) = t ■ o — t ■ u = o — t ■ u = —t ■ u, resp. (—t) ■ u = (0 — t) ■ u = 0 ■ u — t ■ u = — t ■ u.        D
Poznámka. Pomocí předchozí věty můžeme upřesnit naši představu o počtu vektorů ve vektorovém prostoru. Je-li totiž V libovolný vektorový prostor nad T různý od nulového prostoru (jinými slovy řečeno - V obsahuje alespoň jeden nenulový vektor), pak musí prostor V obsahovat nekonečně mnoho vektorů. Vezmeme-li totiž libovolný vektor u G V, u ^ o a tvoříme součiny všech prvků z číselného tělesa T (kterých je nekonečně mnoho) s tímto vektorem it, dostáváme nekonečně mnoho navzájem různých vektorů (je-li totiž ti ■ u = t2 ■ u, pro íi,Í2 £ T, pak (ti — Í2) • u = o, odkud podle věty 1.1. (3) je (ti — t^) = 0, neboli ti = t^)-
6
Vektorové prostory
§2.   Podprostory vektorového prostoru
Definice. Nechť V je vektorový prostor nad tělesem T. Neprázdná podmnožina W množiny V se nazývá podprostor vektorového prostoru V, jestliže platí:
(1) u,v £W libololné =>• u + v G W,
(2)t£T,u£W libovolné  =► t-u£W.
Poznámka. 1. Lehce se dá ověřit (proveďte si podrobně sami!), že podmínky (1) a (2) z předchozí definice jsou ekvivalentní následující jediné podmínce: (3) u,v eW.t.s GT libovolné =>• t ■ u + s ■ v G W. 2. Každý podprostor W vektorového prostoru V musí vždycky obsahovat nulový vektor (je-li u € W libovolný, pak podle (2) a podle věty 1.1. (3) je 0 • u = o G W). Vidíme tedy, že se např. nemůže stát, aby dva podprostory vektorového prostoru V byly disjunktní.
Věta 2.1. Nechť W je podprostor vektorového prostom V nad tělesem T. Pak W je sám vektorovým prostorem nad tělesem T.
Důkaz. Součet dvou vektorů z W, resp. součin čísla z T s vektorem z W jsou definovány stejně jako ve V. Definice podprostoru nám zaručuje, že jde o vnitřní, resp. vnější operaci na W.
Dále nechť ti, v G W libovolné. Pak (—1) • v = —v G W, a tedy u — v = u + (—v) G W (podle věty 1.1. (4) a definice podprostoru). Podle V.2.3., kap. II je pak (W, +) podgrupou komutativní grupy (V, +), tzn. (W, +) je komutativní grupou.
Axiomy (l)-(4) z definice vektorového prostoru jsou ve W zřejmě splněny (poněvadž jsou splněny v celém V).
Tedy W je vektorový prostor nad tělesem T.                                       D
Příklad 2.1.
1.  Nechť V je libovolný vektorový prostor nad tělesem T. Pak zřejmě W = {o} a W = V jsou vždy podprostory ve V. Tyto dva podprostory se nazývají triviální podprostory ve V. Všechny ostatní podprostory ve V (pokud existují) se pak nazývají netriviálni podprostory ve V.
2.  Uvažme vektorový prostor IR3 (viz příklad 1.1.1.). Potom např.:
(a) W\ = {(x,y,0) | x, y G ffi lib.} je podprostor vektorového prostoru K3.
2 Podprostory vektorového prostoru
7
(b)  W'i = {(x, y, z) | x, y, z G M A x — 2y + 3z = 0} je podprostor v M3.
(c)  Nechť (it, d, w) je pevný vektor prostoru M3. Potom W3 = {k-(u, v,w) \ k € R} je podprostor v M3.
Je vidět, že vektorový prostor M3 obsahuje nekonečně mnoho podprostorů. Na druhé straně samozřejmě ne každá podmnožina v M3 je podprostorem K3. Např. W4 = {(x,y, 1) | x,y G R} není podprostorem v M3 (zdůvodněte proč!).
3. Uvažme vektorový prostor W[x] všech polynomů (viz příklad 1.1.2.). Pak např.:
(a)  Wi = {f(x) G R[x] I f(x) = f(-x)} je podprostor v R[x].
(b)  W2 = {/(x) G M[x] I 2 • /(O) + 3 • /(l) = 0} je podprostorem v M[x].
(c)  Vektorový prostor Mn[x] (viz příklad 1.1.3.) je podprostorem v R[x]. Na druhé straně např. množina W3 = {x2 + ax + b \ a, 6 G K lib.} není podprostorem v M[a;].
Věta 2.2. Nechť V je vektorový prostor nad tělesem T, nechť I je neprázdná indexová množina a nechť pro každé a £ I je Wa podprostor ve V.
Potom  D Wa je podprostor ve V. aei
Důkaz. Množina \\ Wa je zřejmě neprázdná (neboť obsahuje jistě nulový
vektor o). Zbývá tedy ověřit platnost podmínek (1) a (2) z definice podprostorů. Nechť u,v £   f) Wa, t G T libovolné. Potom u, v G Wa pro každé
a £ I, a. tedy (poněvadž Wa je podprostor) je u + v G Wa a t ■ u G Wa pro každé a € I. Pak ale u + v G  D Wa a t ■ u G  f] Wa.                               D
ctdl                            adl
Poznamenejme, že indexová množina I byla libovolná (neprázdná), a tedy předchozí věta platí jak pro konečný, tak pro nekonečný počet podprostorů. Stručně řečeno, věta tvrdí, že průnikem libovolného počtu podprostorů ve V je opět podprostor ve V. Tohoto faktu využijeme v následující důležité úvaze.
Nechť M je libovolná podmnožina vektorového prostoru V (tzn. M obecně není podprostorem!). Pak existuje alespoň jeden podprostor obsahující množinu M (např. celý prostor V má tuto vlastnost). Můžeme tedy utvořit průnik všech podprostorů ve V obsahujících množinu M, který označme symbolem [M]. Tedy:
[M] = f]Wa                                         (1)
8
Vektorové prostory
(Wa je podprostor ve V takový, že Wa 5 M) a platí následující tvrzení.
Věta 2.3. Nechť M je libovolná podmnožina ve vektorovém prostoru V. Potom:
(1)  [M] je podprostor ve V,
(2)  [M] je nejmenší (vzhledem k C) podprostor ve V obsahující množinu M.
Důkaz. (1): Plyne ihned z věty 2.2.
(2): Plyne z (1) a ze základních vlastností množinového průniku.        D
Je-li množina M konečná, např. M = {m, ...,«&}, pak místo symbolu [{«i,..., Uk}] budeme psát stručněji [tli,..., uk]. V tomto případě je tedy:
[ui,...,«/t] = C\Wa
(Wa je podprostor ve V takový, že u\,..., uk G Wa). Může se samozřejmě též stát, že množina M je prázdná. V takovém případě zřejmě je [0] = {o}.
Definice. Nechť M je podmnožina ve vektorovém prostoru V a nechť W = [M]. Pak podprostor W se nazývá podprostor generovaný množinou M.
Je-li specielně M = {ui,... ,«&}, pak W se nazývá podprostor generovaný vektory «i,..., Uk a vektory «i,..., u\~ se nazývají generátory pod-prostoru W.
Uvědomme si, že na rozdíl od průniku podprostorů není množinové sjednocení podprostorů (dokonce ani dvou) obecně podprostorem daného vektorového prostoru. Například pro podprostory W\ a Wi vektorového prostoru R3 z příkladu 2.1.2. jejich sjednocení W\ U W^ není podprostorem v K3 (neboť např. (1,1,0), (1,2,1) G Wx U W2, ale (1,1,0) + (1,2,1) = (2,3,1) ^ W\ U W<z)- V dalším si nyní zavedeme pojem tzv. součtu podprostorů, ukážeme, že je podprostorem a jaký má vztah k množinovému sjednocení těchto podprostorů.
Definice. Nechť W\, W2, ••-, Wjt (k > 2) jsou podprostory vektorového prostoru V. Pak množina W\ + W2 + • • • + W/t definovaná:
Wi+W2+- ■ -+Wk = {ui+u2+- ■ -+uk j m G Wi, u2 G W2, ...,ukG Wk}
2 Podprostory vektorového prostoru
9
se nazývá součet podprostorů W\, ..., Wk-
Věta 2.4. Necht W\, W2, ■ ■ ■, Wk (K > 2) jsou podprostory ve V. Pak platí:
(1)  součet podprostorů W\ + W2 + • • • + Wk je podprostorem ve V,
(2)  Wi + W2-\-------h Wk = [Wi U W2 U • • • U Wk], tzn. součet podprostorů
W\, ..., Wk je roven podprostorů generovanému jejich množinovým sjednocením.
Důkaz. (1): Zřejmě je Wi-\------VWk + § (neboť W{ / 0). Dále nechť u, v G
W\ + • • • + Wk, t € T libovolné. Potom u = «1 + • • - + Uk, v = v\-\------\-Vk,
kde Ui, Vi G Wi, i = 1,..., k. Potom ale:
u + v = (iti H-------\- uk) + (vt H-------h «A;) = ("i + «1) H-------^(uk + vk) e
W1 + ■ ■ • + Wjb, í • w = í • (wi H-------h wjfc) = ť • wi H-------h ť • uk G W\ H-------h Wfc,
a tedy W\ + • • • + Wk je podprostor ve V.
(2): Vzhledem k (1) budeme dokazovat množinovou rovnost:
W1 + --- + Wk = f]Ua
{Ua je podprostor ve V takový, že Ua ~D W\ U • • • U Wk)-
„C": Nechť u G W\ + • • • + Wk. Potom u = ui + • • • + uk, kde Ui G Wj. Je tedy Ui € Ua, kde ř7a je libovolný podprostor ve V takový, že Ua ^ W^i U • • • U W^. Potom však u\-\-----+ itfc = u G ř7a, a tedy it G ÍIČ/q,
(ř^a je podprostor ve V a Ua ^ Wi U • • • U W&).
„D": Zřejmě je Wi C Wi H-----+ W^ (neboť pro itj G Wj libovolný
je Ui = o H-------h it; H-------Vo eW\-\-------h W&), a tedy W\ U • • • U Wk C
Wi + • • • + W^. Podle 1. části věty je však W\ H-----+ Wk podprostorem ve
V, tzn. z vlastností množinového průniku pak již plyne žádaná množinová inkluze.                                                                                                      D
Vidíme tedy, že součet podprostorů W\ + • • • + Wk je nejmenším podprostorem ve V obsahujícím množinové sjednocení W\U- • -UWk těchto podprostorů. Samozřejmě, že součet podprostorů obecně není roven jejich množinovému sjednocení. Dále si uvědomme, že vyjádření vektoru u G W\-\------VWk
ve tvaru:
u = u\A-----+ Uk,
10
Vektorové prostory
kde u\ G Wi, ..., itfc G W&, nemusí být jednoznačné. Obojí se ukáže na jednoduchém příkladu, a to pro k = 2, což je situace, s níž se budeme v praxi nejčastěji setkávat. V tomto případě je tedy:
Wi + w2 = {«i + u2\ui e Wi, u2 g w2} = [Wi u w2].
Schematicky je tato situace znázorněna na obr. 8.
obr. 8.
Příklad 2.2. Ve vektorovém prostoru M3 mějme dány dva podprostory:
W! = {(x,y,0) \x,y£R}, W2 = {(u,0,v) | u,v Gl}.
Zřejmě platí, že:
W1UW2 = {(a, 6, c) | a, 6, c G M,  b = 0 nebo c = 0},
resp.
Vidíme tedy, že WiUW2 ^Wt+ W2.
Dále, vyjádření vektoru u G Wi + W2 ve tvaru:
W = U\ + «2,                                                (2)
kde u\ G Wi, t*2 G W2, zde obecně není jednoznačné, neboť např. (0,0,0) G Wí + W2, přičemž třeba (0,0,0) = (0,0,0) + (0,0,0) = (1,0,0) + (-1,0,0) jsou dvě různá vyjádření tvaru (2). Poznamenejme, že v tomto případě má každý vektor z W\ + W2 dokonce nekonečně mnoho různých vyjádření tvaru (2).
2 Podprostory vektorového prostoru
11
Definice. Nechť W\, W2, ••-, Wt (ft > 2) jsou podprostory vektorového prostoru V. Součet podprostorů Wi,..., W& se nazývá přímý součet a označuje Wi+W2^i------i-Wfe, jestliže libovolný vektor u G W\ + • • • + Wk lze
vyjádřit jediným způsobem ve tvaru:
u = u\ -\-----+ Uk,                                       (3)
kde tli G Wi, ..., ti/s G W&.
Věta 2.5. Nechť W\, W2, ■ ■ ■, Wk (k > 2) jsou podprostory vektorového prostoru V. Pak součet podprostorů Wi,..., Wk je přímým součtem <í=^ pro každé i = 1, 2,..., k platí:
Wi n (Wx + • • • + Wť_i + Wi+i + • • • + W*) = {o}.               (4)
Důkaz. „=^": Nechť součet podprostorů Wi, ..., Wk je přímý a nechť pro
l<í<Ä;jea?eWin (Wi H------h W;_i + Wi+i H------h W/t) libovolný. Potom
je x = U\ H-------h Mj_i + Ui+i -\-------h ti/s, kde Uj G Wj, a dále x G Wj, tzn.
také —x G Wj. Pak ale:
o = ui-\-------h Wi_i + (-a;) + ui+i H-------\-Uk,
resp.
o = o + o+--|-o
jsou dvě vyjádření nulového vektoru o ve tvaru (3), tzn. podle předpokladu
musí být x = o. Tedy je W; n (WH-------h W_i + Wi+1 H-------h W/t) C {o}.
Opačná inkluze je však triviálni, tzn. dohromady platí rovnost. Poněvadž i bylo libovolné (s vlastností 1 < i < k), platí všechny podmínky (4).
„<í=": Nechť platí podmínky (4), nechť x G Wi + • • • + W& libovolný a nechť:
x = u\-\-------h Uk = u[ H-------h u'k,
kde Wj, tt^ G Wi, i = 1,2,..., ft jsou dvě vyjádření vektoru íc ve tvaru (3). Potom pro libovolné i = 1, 2,..., ft dostáváme:
(«i - U-) = (u[ - Ml) H-------h («•_! - Ui-i) + (u'i+1 - Uj+i) H-------h («'/. - Uk),
tzn.:
(«i - u'i) g W n (Wi + • • • + W_i + wi+1 + • • • + Wt),
12
Vektorové prostory
odkud však podle (4) plyne, že («j—Uj) = o, neboli t^ = u\. Tedy vyjádření vektoru x ve tvaru (3) je jednoznačné a součet podprostorů Wi,..., Wk je přímý.                                                                                                        D
Poznámka. Rozepíšeme-li si předchozí větu pro některá konkrétní k, pak dostáváme např.:
pro k = 2: součet podprostorů W\, W<i je přímým součtem -<=^ Wi n W2 = {o},
pro k = 3: součet podprostorů W\, W2, W3 je přímým součtem   -4=>-
Wi n (w2 + w3) = {0} a w2 n (Wi + w3) = {o} a w3 n (Wi + w2) = {o}.
Příklad 2.3. Ve vektorovém prostoru M3 mějme dány podprostory:
W\ = {(x,x,0) I x Gl}, W2 = {(u,0,«) j «,« GK}, W3 = {(0,ä:,ä:) j A; € M}.
Potom užitím věty 2.5. dostáváme, že:
1.  součet podprostorů W\, W2 je přímý (je-li w G Wi fl W2? pak w = (x, x, 0) = (u, 0, w) ==> x = 0, tzn. i« = (0,0,0) a podle věty 2.5. je součet přímý),
2.  součet podprostorů W\, W% je přímý,
3.  součet podprostorů W2, W% je přímý,
4.  součet podprostorů Wi, W2, W% není přímý (neboť např. W\ n (W2 + W3) = Wi fit3 = W\ 7^ {o}, a tedy podle věty 2.5. součet není přímý).
§3.   Lineární závislost a nezávislost vektorů
Definice. Nechť V je vektorový prostor nad T a nechť u\,..., uk je konečná posloupnost vektorů z V. Pak vektor:
u = t1-u1-\-------\-tk-uk,
kde t\,..., t k G T, se nazývá lineární kombinace konečné posloupnosti vektorů u\,..., u k nebo stručně lineární kombinace vektorů u\,..., uk.
Množina všech lineárních kombinaci vektorů u\,..., uk se bude označovat symbolem L{u\,..., m&), tzn.:
i(«i,..., u k) = {ti ■ u\ + • • • + t k • Uk I ti,..., t k € T libovolné}.
3 Lineární závislost a nezávislost vektorů
13
Poznámka. 1. Všimněme si, že v předchozí definici hovoříme o „konečné posloupnosti vektorů «i,..., «&". Tímto obratem chceme říct, že je možné, aby se zde některý z vektorů vyskytoval případně vícekrát (tzn. může se stát, že Ui = Uj pro i ^ j) a dále, že vektory chápeme v uvedeném pořadí (tento fakt však bude hrát důležitou roli až v dalším paragrafu). Z důvodů stručnosti budeme však v dalším místo „konečná posloupnost vektorů «i,..., tijt" říkat obvykle pouze „vektory m,..., «&".
2.  Symbol L(ui,..., u/t) znamená množinu všech (možných) lineárních kombinací vektorů u\,..., Uk, kterých je zřejmě obecně nekonečně mnoho. Uvědomme si dále, že množina L(u\,..., Uk) obsahuje vždy mimo jiné:
- každý z vektorů ui,...,Uk (neboť u-i = 0 • U\ + ■ ■ ■ + 0 • Mj_i + 1 • Ui + 0-iij+i H----------hO-iijt),
- nulový vektor (neboť o = 0-«i + --- + 0- «&).
3.  V předchozím paragrafu jsme hovořili o podprostoru generovaném konečnou množinou vektorů. Je zřejmě, že místo „konečné množiny vektorů" můžeme vzít též „konečnou posloupnost vektorů" (případné opakující se vektory zde nehrají žádnou roli) a použít stejnou symboliku. Je-li tedy «i,..., Uk konečná posloupnost vektorů z V, pak:
[tii,...,«A:] = nwa                                       (i)
(Wa je podprostor ve V takový, že «i,..., Uk G Wa) je podprostor generovaný vektory «i,..., Uk- Následující věta nám pak ukáže, že [«i,..., Uk] a L(ui,..., Uk) jsou vlastně jedno a totéž.
Věta 3.1. Nechť V je vektorový prostor nad T a nechť U\,... ,Uk je konečná posloupnost vektorů z V. Pak platí:
(1)  L(ui,..., Uk) je podprostor ve V,
(2)  [«i,...,Uk] = L(ui,...,Uk), tzn. podprostor generovaný vektory u\,... ,Uk je roven množině všech lineárních kombinací vektorů U\,...,Uk-
Důkaz. (1): Zřejmé (ověřením definice podprostoru).
(2): Vzhledem k (1) budeme dokazovat množinovou rovnost:
f]Wa = L(uu...,uk)                                     (2)
{Wa je podprostor ve V A «i,..., uk G Wa).
„C": Plyne z vlastností množinového průniku, uvědomíme-li si, že
14
Vektorové prostory
L(ui,..., u k) je podprostor ve V (podle 1. části) a že u\,... ,Uk E L(ui,..., M&).
„D": Množina na levé straně (2) je podprostor ve V obsahující vektory ui,... ,Uk, tzn. musí pak obsahovat také jejich libovolnou lineární kombinaci.                                                                                                 D
Důsledek. Nechť V je vektorový prostor nadT, nechť Ui,... ,Uk je konečná posloupnost vektorů z V a nechť ví,... ,vs E L(ui,..., Uk). Pak platí:
(1)  L(vi,...,vs) C L(ui,...,uk) (neboli [vi,...,vs] C [m,... ,uk]),
(2)  [ui,...,uk,v1,...,vs] = [ui,...,uk].
Důkaz. (1): Plyne ihned z (1) a z předchozí věty, část (2).
(2): Inkluze „D" plyne z (1). Dokažme inkluzi „C". Ale triviálně je «i,... ,Uk E L(ui,..., M/t), resp. podle předpokladu je ví,... ,vs E L(ui,... ,Uk). Podle části (1) je pak [mi, ... ,Uk,Vi,..., vs] E [mi,...,m^]. Dohromady pak platí dokazovaná rovnost.                                                                   D
Vidíme tedy, že přidáme-li ke generátorům daného podprostoru W libovolný vektor, který je jejich lineární kombinací, dostáváme opět generátory W', resp. (totéž - jinak řečeno) odstraníme-li z generátorů podprostoru W vektor, který je lineární kombinací zbývajících, dostáváme opět generátory W.
Příklad 3.1.
1.  Rozepsáním se lehce ověří, že např.:
ffi2 = [(1,0), (0,1)] = [(1,1), (1,2)] = [(0,2), (1,1), (0,1)] = [(1,3), (2,1), (1,-1), (-2,3)], atd.
Vidíme tedy, že vektorový prostor M2 je možno generovat dvěma a více vektory (zřejmě i nekonečně mnoha). Na druhé straně, prostor M2 evidentně nelze generovat jedním vektorem (neboť [(a, b)] = L((a,b)) = {(k ■ a,k ■ b) \kER} Cl2).
2.  Ve vektorovém prostoru Tn označme vektory:
d =(1,0,0,...,0,0), e2 = (0,1,0,...,0,0),
en = (0,0,0,...,0,1).
Pak platí, že Tn = [ei,..., en], tzn. vektory ei,..., en jsou generátory vektorového prostoru Tn (zřejmě pro libovolný vektor u = (iti,... ,un) E
3 Lineární závislost a nezávislost vektorů
15
Tn je u = u\ • e\ + • • • + un • en, tzn. Tn C [ei,..., en] a opačná inkluze je triviální).
3. Ve vektorovém prostoru ^n[x] označme vektory (tj. polynomy):
/i = l,
S 2 = xi fz=xi
tn+1 = x   ■
Pak zřejmě ffi„ [x] = [/1?..., /n+i], tzn. polynomy 1, x, x2,..., xn jsou generátory vektorového prostoru IR„ [x].
Definice. Nechť V je vektorový prostor nad T a nechť:
uu...,uk                                              (3)
je konečná posloupnost vektorů z V. Jestliže existují čísla t\,..., í^ G T, z nichž alespoň jedno je různé od nuly, tak, že:
ti • iti H-------\- tk • uk = o,                                  (4)
pak říkáme, že vektory u\,..., uk jsou lineárně závislé.
V opačném případě říkáme, že vektory ui,...,Uk jsou lineárně nezávislé.
Poznámka. Vidíme, že pojem lineární nezávislosti je negací pojmu lineární závislosti. Explicitně vyjádřeno to znamená:
Vektory tti,..., uk jsou lineárně nezávislé, jestliže pro všechna íi,..., t k € T, z nichž alespoň jedno je různé od nuly, platí: ti-ui-\-------VtfUk^o.
S touto definicí by se však zřejmě nešikovně pracovalo, a proto ji přeformulujeme do ekvivalentního, ale praktičtějšího tvaru:
Vektory u\,..., u^ jsou lineárně nezávislé, jestliže platí: t\-u\-\-------h tk ■ uk = o => ti = í2 = • • • = tk = 0.
Praktické zjišťování závislosti či nezávislosti daných vektorů (3) provádíme obvykle tak, že hledáme všechna čísla t\,...,tk G T splňující rovnost (4). Zjistíme-li, že (4) je splněno pouze pro ti = • • • = tk = 0, pak jsou vektory (3) lineárně nezávislé. Je-li rovnost (4) splněna i pro nějaké ti ^ 0, pak jsou dané vektory lineárně závislé.
16
Vektorové prostory
Příklad 3.2.
1.  Ve vektorovém prostoru IR2 jsou např. vektory (1,0), (0,1) lineárně nezávislé. Podobně vektory (1,1), (1,2) jsou též lineárně nezávislé (obojí dostaneme rozepsáním podle předchozího návodu).
Na druhé straně např. vektory (0,2), (1,1), (0,1) jsou lineárně závislé a podobně vektory (1,3), (2,1), (1,-1), (—2,3) jsou též lineárně závislé (ověřte si sami!).
2.  Ve vektorovém prostoru Tn jsou vektory e\ = (1,0, ...,0), e% = (0,1,0,... , 0), ..., en = (0,..., 0,1) lineárně nezávislé (neboť je-li t\ ■ e\ +
-----hín-en = (0,...,0), pak (íl5...,ín) = (0, ...,0), a tedy íi = t2 = ■■■ =
tn = 0).
3.  Ve vektorovém prostoru Mn[x] jsou vektory (polynomy) fľ = 1, /2 = x, ..., /n_|_i = xn lineárně nezávislé (je-li ti-l+t2-x+- ■ ■-\-tn+i-xn = o, kde o značí nulový polynom, tj. polynom, jehož všechny koeficienty jsou rovny nule, potom je t\ = ty = • • • = tn = 0, neboť dva polynomy se rovnají, právě když se rovnají jejich koeficienty u stejných mocnin x).
Jestliže uvažovaná posloupnost vektorů obsahuje pouze jediný vektor, např. ti, pak je zjišťování lineární závislosti či nezávislosti velmi jednoduché, neboť z předchozí definice a z věty 1.1. (3) plyne (rozmyslete si podrobně jak!), že platí:
vektor u je lineárně závislý <í=^ u = o.                      (5)
O trošku složitější je situace, když uvažovaná posloupnost (3) obsahuje alespoň dva vektory. Kriteria lineární závislosti nám pro tento případ udává následující věta.
Věta 3.2. Nechť V je vektorový prostor nadT, nechť k > 2 a «i, «2,... ,Uk G
V. Pak následující výroky jsou ekvivalentní:
(1)  vektory ui,...,Uk jsou lineárně závisle,
(2)  3i (1 < i < k) tak, že vektor U{ je lineární kombinací zbývajících vektorů (tj. vektorů ui,..., Mj-i, «í+i, ..., u^),
(3)  3i (1 < i < k) tak, že [ui,...,uk] = [«1,... ,«;_i,«j+i,... ,uk].
Důkaz. „(1) =>- (2)": Nechť U\,...,Uk jsou lineárně závislé. Pak existují čísla ti,...,tk G T, z nichž alespoň jedno je nenulové, tak, že t\ ■ u\ + ■ ■ ■ +tk ■ Uk = o. Nechť např. ťj 7^ 0. Pak ale úpravou z předchozí rovnice dostáváme:
3 Lineární závislost a nezávislost vektorů
17
Ui = -£- ■ lil----------K2- ■ Ui-l - tjf^ ■ Ui+1----------^ • Uk,
což znamená, že vektor Ui je lineární kombinací zbývajících vektorů.
„(2) =>• (3)": Plyne přímo z 2. části důsledku věty 3.1.
„(3) =>• (1)": Nechť platí (3). Pak ale Ui G \u\,... ,uk] = [u\,..., Wj_i,«j_|_i,..., «&] =
L(ui,..., «j_i, Wj+i, ...,uk), tzn. «j = pí • iti H-------h Pi-i • «j_i + Pi+i •
Wj+i + • • • + j)fc • ttfc, kde j3j G T. Pak po úpravě dostáváme:
p\-ui-\-------\-pi-i -Ui-i + (-1) -Ui+pi+1 -ui+1 -\-------Vpk-uk = o,
odkud již plyne, že vektory ui,...,Uk jsou lineárně závislé.                     D
Poznámka. Je třeba si uvědomit, že část (2) předchozí věty nám zajišťuje pouze existenci vektoru, který lze vyjádřit jako lineární kombinaci zbývajících vektorů. Nelze tedy obecně tvrdit, že každý z lineárně závislých vektorů «i, U2-,... ,Uk se dá vyjádřit jako lineární kombinace zbývajících vektorů. Např. ve vektorovém prostoru M2 jsou vektory:
«i = (o, i),   u2 = (i,i),   m = (0,-2)
lineárně závislé (neboť 2 • u\ + 0 • u<i + 1 • «3 = o), ale přitom je zřejmé, že vektor 1*2 nelze vyjádřit jako lineární kombinaci vektorů 111,113.
Důsledek. Nechť V je vektorový prostor nad T a nechť (3) je konečná posloupnost vektorů z V. Pak platí:
(1)  obsahuje-li posloupnost (3) nulový vektor, pak je lineárně závislá,
(2)  obsahuje-li posloupnost (3) dva stejné vektory, pak je lineárně závislá,
(3)  je-li nějaká posloupnost vybraná ze (3) lineárně závislá, pak je i (3) lineárně závislá,
(4)  je-li (3) lineárně nezávislá, pak každá posloupnost vybraná ze (3) je lineárně nezávislá.
Důkaz. Všechna tvrzení důsledku plynou přímo z definice lineární závislosti, resp. z předchozí věty.                                                                      D
Na závěr paragrafu uvedeme nyní větu, která patří k nejdůležitějším větám celé teorie vektorových prostorů.
Věta 3.3. (Steinitzova věta o výměně) Nechť V je vektorový prostor nad T, u\,..., ur,v\,... ,vs G V. Nechť vektory u\,..., ur jsou lineárně nezávislé a nechť Ui € L(v\,..., vs) pro i = 1,..., r. Potom platí:
18
Vektorové prostory
(1)  r < s,
(2)  při vhodném přečíslování vektorů v\,..., vs je:
L(vi,..., vs) = L(ut,..., ur,vr+1, ...,vs
Důkaz. Provedeme matematickou indukcí vzhledem k r.
a) Nechť r = 1. Pak je jistě r < s. Z předpokladů věty dále plyne, že «i/o (podle (5)) a je u\ = t\ • v\ + • • • + ts ■ vs. Pak ale alespoň jedno z čísel ti,..., ts musí být nenulové. Přečíslujeme vektory v\,... ,vs tak, aby íl / 0. Potom:
v1 = ±-u1-tri-v2---------|
J31
tzn. «i G L(u\,V2,..., vs). Triviálně je V2,..., vs G L(u\,V2, ■ ■ ■, ws), a tedy podle důsledku věty 3.1. je L{v\,... ,vs) C L(u\,V2, ■ ■ ■ ,vs). Opačnou inkluzi dostaneme stejným způsobem (užitím předpokladu u\ G L(vi,..., vs)), a tedy platí žádaná rovnost L(v\,V2, • • • ,vs) = L(u\,V2, ■ ■ ■ ,vs).
ß) Přepokládáme, že tvrzení věty platí pro 1,2, ...,r — 1 (r > 2), a dokážeme jej pro r.
Podle předpokladu a předchozího důsledku jsou vektory u\,... ,ur-\ lineárně nezávislé, tzn. (podle indukčního předpokladu) r — 1 < s a po vhodném přečíslování je:
L(vu ...,vs) = L{ui,..., «r_i, vr,..., vs).                    (6)
Ale podle předpokladu věty je ur G L(v\,... ,vs) = L(u\,... ,ur-\,vr,... ,vs), odkud především plyne, že r — 1 < s (jinak spor s lineární nezávislostí vektorů «i,..., ur), tzn. platí r < s. Dále lze psát:
ur = t\ • u\ + • • • + ír_i • uT-\ + tr • vr + • • • + ts • vs,            (7)
přičemž alespoň jedno z čísel ti,...,ts musí být nenulové (jinak opět spor s lineární nezávislostí vektorů u\,... ,ur). Přečíslujme je tak, aby tr ^ 0. Potom:
t\                    tr-\                1            tr+i                       ts             .
Vr = -— • Ut--------------— • Ur-l + — -Ur-----— • Vr+1-----------— -Vg.   (8)
Podle důsledku věty 3.1. (užitím (7) a (8)) dostáváme, že L{u\,..., ur-i,vr,..., vs) = L(u\,..., ur, vr+i,..., vs). Odsud a z (6) pak plyne, že L(v\,..., vs) = L(ui,..., ur, wr+i) • • •) Vs), c°ž je žádaná rovnost.                                   D
4 Báze a dimenze vektorového prostoru
19
§4.   Báze a dimenze vektorového prostoru
Definice. Nechť V je vektorový prostor nad T. Konečná posloupnost vektorů «i,..., un z V se nazývá báze vektorového prostoru V, jestliže platí:
(1)  vektory m,..., un jsou lineárně nezávislé,
(2)  vektory m,...,un generují vektorový prostor V, tzn. [m,...,un] = V.
Poznámka. Místo obratu „konečná posloupnost vektorů u\,..., un je bází V" budeme častěji říkat stručně „vektory u\,...,un jsou bází V".
Dále si uvědomme, že předchozí definice nezaručuje existenci báze ani nic neříká o počtu bází ve V. Celou situaci si nejprve ilustrujeme na několika příkladech.
Příklad 4.1. Z příkladů 3.1. a 3.2. bezprostředně plyne, že:
1.  Vektory (1,0), (0,1) jsou bází vektorového prostoru I?. Podobně vektory (1,1), (1,2) jsou též bází M2. Zřejmě vektorový prostor M2 má nekonečně mnoho různých bází. Na druhé straně, např. vektory (0,2), (1,1), (0,1), resp. (1,3), (2,1), (1,-1), (-2,3), resp. (1,2), (2,4), resp. (1,2) nejsou bází K2.
2.  Vektory e\ = (1,0,..., 0), ..., en = (0,..., 0,1) jsou bází vektorového prostoru Tn.
3.  Vektory (polynomy) f1 = l,f2 = x,..., /n+i = xn jsou bází vektorového prostoru K„ [x].
Příklad 4.2.
1.  Nulový vektorový prostor V = {o} nemá bázi, neboť libovolná konečná posloupnost vektorů z V má tvar o, o,..., o, a je tedy lineárně závislá.
2.  Vektorový prostor R[x] nemá bázi, neboť žádná konečná posloupnost vektorů (polynomů) z R[x] negeneruje celý prostor R[x]. Je-li totiž ffi,... ,ffn libovolná konečná posloupnost polynomů z R[x] a jestliže polynom gi má stupeň ki, potom jistě existuje přirozené číslo t s vlastností: t > ki pro každé i = 1,..., n. Pak ale např. polynom g = xl se nedá napsat jako lineární kombinace polynomů gľ,..., gn, a je tedy [g1,..., gn] C E[x].
Rozebereme-li si předchozí definici podrobněji, pak vidíme, že báze «i,..., u vektorového prostoru V je z hlediska generátorů „nejchudobnější" posloupností vektorů. Přesněji řečeno, pokud bychom některý z vektorů «i,..., un
20
Vektorové prostory
vypustili, pak zbývající vektory už nebudou generovat vektorový prostor V (plyne z věty 3.2. - rozmyslete si podrobně jak). Na druhé straně, z hlediska lineární nezávislosti je báze „nejbohatší" posloupností vektorů z V, jak v dalším ukážeme.
Definice. Řekneme, že konečná posloupnost vektorů ui,...,un z V je maximální lineárně nezávislá posloupnost vektorů ve V, jestliže:
(1)  vektory u\,...,un jsou lineárně nezávislé,
(2)  pro libovolné w & V jsou vektory u\,..., un, w lineárně závislé.
Věta 4.1. Konečná posloupnost vektorů «i,... ,un je bázi vektorového prostoru V, právě když je maximální lineárně nezávislou posloupností vektorů ve V.
Důkaz. „=>": Nechť u\,...,un je báze ve V. Pak vektory ui,...,un jsou lineárně nezávislé a pro libovolný vektor w G V je w G [ui,...,un] = L(ui,..., un). Podle věty 3.2. jsou pak vektory u\,..., un, w lineárně závislé, a tedy u\,..., un je maximální lineárně nezávislá posloupnost vektorů.
„-4=": Nechť u\,..., un je maximální lineárně nezávislá posloupnost vektorů ve V. Pak ui,...,un jsou lineárně nezávislé. Dokážeme, že [u\,..., un] = V, neboli L(u\,... ,un) = V. Ale inkluze „C" je triviální. Naopak, nechť w G V libovolné. Pak podle předpokladu jsou vektory u\,..., un, w lineárně závislé, tzn. existují čísla ťi,...,ín,ť G T, z nichž alespoň jedno je různé od nuly, tak, že:
ti ■ U\ + • • • + tn • Un + t ■ W = O.
Musí však být t / 0 (jinak spor s lineární nezávislostí vektorů u\,..., un), a tedy:
w = -f-f   Ui---------if • un G L(ut,..., un),
což jsme chtěli ukázat.                                                                              D
Následující věta nám pak podá ještě jednu charakterizaci báze vektorového prostoru.
Věta 4.2. Konečná posloupnost vektorů u\,... ,un je bázi vektorového prostoru V, právě když každý vektor w £V je možno jediným způsobem vyjádřit ve tvaru:
w = t1-u1-\-------\-tn-un,                                 (1)
4 Báze a dimenze vektorového prostoru
21
kde ťi,... ,tn € T.
Důkaz. „=>": Nechť «i,... ,ti„ je báze ve V. Pak existence vyjádření (1) plyne z definice báze. Dokážeme jeho jednoznačnost. Nechť tedy:
w-ti-U\-\-------h tn ■ un - n ■ «i H-------h rn • un,
kde íj,rj G T. Pak odečtením a úpravou dostáváme:
(íi - n) ■ ui H-------h (ín - rn)   un = o.
Vektory «i,..., ttra jsou však lineárně nezávislé, tzn. musí být (U — r i) = 0, neboli ti = r i pro každé i = 1,..., n.
„<£=": Nechť každý vektor w G V se dá jednoznačně vyjádřit ve tvaru (1). Potom je V = L(ui,..., un) = [u\,..., un]. Zbývá ukázat, že vektory «i,..., un jsou lineárně nezávislé. Nechť tedy:
ti ■ tii H--------h ín • iín = o.
Zřejmě však je 0 • U\ + • • • + 0 • un = o, a tedy z jednoznačnosti vyjádření (1) plyne, že ťi = • • • = tn = 0, tzn. iti,...,tira jsou lineárně nezávislé. Dohromady pak dostáváme, že vektory ui,...,un jsou bází V.               D
Věta 4.3. Nechť u\,... ,un je báze vektorového prostoru V. Pak platí:
(1)  jestliže v\,..., vm je báze prostoru V, pak je m = n,
(2)  jestliže vektory w\,... ,ws generuji prostor V, pak z nich lze vybrat bázi,
(3)  každou konečnou posloupnost lineárně nezávislých vektorů z V lze doplnit na bázi V.
Důkaz. (1): Aplikujeme-li dvakrát Steinitzovu větu, dostáváme n < m a m < n, odkud plyne, že m = n.
(2): Podle předpokladu má prostor V bázi, tzn. musí být V ^ {o}. Nechť vektory w\,..., ws generují prostor V. Pak alespoň jeden z nich je různý od nulového vektoru a zřejmě je lze přečíslovat tak, že wi,... ,Wi jsou lineárně nezávislé &w-l,...,Wí,Wj jsou lineárně závislé pro každé j s vlastností i < j < n. Odtud (podobnou úvahou jako v závěru důkazu věty 4.1.) plyne, že Wj G L(w\,... ,Wi), a tedy V = L(w\,... ,ws) C L(w\,... ,Wi). Opačná inkluze je však triviálni, tzn. je V = L(w\,..., Wi) a vektory w\,..., Wi jsou bází prostoru V.
(3): Nechť w\,..., wr jsou lineárně nezávislé vektory z V. Podle Steinit-zovy věty je (po vhodném přečíslování) V = L(u\,... ,un) = L(wi,... ,wr,u
22
Vektorové prostory
odkud podle právě dokázaných částí (1) a (2) dostáváme, že w\,..., wr, «r+i, • • •, u, je báze V.                                                                                                  D
První část předchozí věty nám říká, že má-li vektorový prostor nějakou bázi, pak všechny jeho báze sestávají vždy ze stejného počtu vektorů. Na základě tohoto faktu můžeme vyslovit následující definici.
Definice. Nechť V je vektorový prostor nad T. Pak:
(1)  je-li V nulovým vektorovým prostorem (tzn. V = {o}), říkáme, že dimenze V je nula,
(2)  existuje-li báze u\,... ,un prostoru V, pak říkáme, že dimenze V je n,
(3)  je-li V j^ {o} a nemá-li žádnou bázi, pak říkáme, že dimenze V je nekonečno.
Píšeme: dim V = 0, resp. dim V = n, resp. dim y = oo.
Vektorové prostory z (1) a (2) se nazývají konečnědimenzionální, vektorové prostory z (3) se nazývají nekonečnědimenzionální.
Příklad 4.3. Z příkladů 4.1. a 4.2. bezprostředně plyne, že:
1.  dimM2 =2,
2.  dimTra = n (tzn. specielně např. dimlR3 = 3, dimQ5 = 5, dimC4 = 4, atd.),
3.  dimlR^fa;] = n + 1 (tzn. specielně např. dimlRgfa;] = 6, atd.),
4.  dimR[a;] = oo.
Úmluva.  Všude v dalším se budeme zabývat pouze konečnědimenzionál-ními vektorovými prostory.
Řekneme-li tedy, že V je vektorový prostor nad T, bude to automaticky znamenat, že V je konečnědimenzionální, tzn. buď nulový prostor, nebo vektorový prostor, v němž existuje báze. K tomu ještě poznamenejme, že každý podprostor konečnědimenzionálního vektorového prostoru je sám také ko-nečnědimenzionálním vektorovým prostorem (plyne z vět 2.1. a 4.I.).
V praxi se poměrně často setkáme s úlohou, že ve vektorovém prostoru V, jehož dimenzi známe, např. dim V = n, ověřujeme, zda nějaká posloupnost sestávající z n vektorů je bází. V takovém případě stačí ověřovat pouze jednu z podmínek (1) a (2) z definice báze, jak ukazuje následující věta.
4 Báze a dimenze vektorového prostoru
23
Věta 4.4. Nechť V je vektorový prostor nad T, dim V = n (n > 1) a nechť «i,...,wn je konečná posloupnost n vektorů z V. Pak následující výroky jsou ekvivalentní:
(1)  vektory u\,..., un jsou bází prostoru V,
(2)  vektory u\,..., un jsou lineárně nezávislé,
(3)  vektory u\,..., un generují prostor V.
Důkaz. „(1) =>■ (2)": Zřejmé (plyne z definice báze).
„(2) =>- (3)": Nechť ui,...,un jsou lineárně nezávislé. Podle věty 4.3. (3) (vzhledem k předpokladu dim V = n) jsou však vektory ui,...,un bází prostoru V, tzn. generují prostor V.
„(3) =>• (1)": Nechť ui,...,un generují prostor V. Podle věty 4.3.(2) (vzhledem k tomu, že dim V = n) však jsou vektory ui,...,un bází prostoru V.                                                                                                     D
Věta 4.5. Nechť Wi, W2 jsou podprostory vektorového prostoru V. Potom platí:
(1)  WlCW2 => dirndl < dimW2,
(2)  WiCW2 A dimWi = dimW2  => Wi = W2.
Důkaz. Pokud Wi = {o} nebo W2 = {o}, pak obě tvrzení zřejmě platí. Nechť tedy W\, W2 ^ {o} a nechť u\,..., ur je báze V^i, resp. vi,...,vs je báze W^- Jestliže W\ C iy2, pak it^ G W2 = -ť(^i, • • •, vs), i = l,...,r, přičemž vektory u\,..., ur jsou lineárně nezávislé, tzn. jsou splněny předpoklady Steinitzovy věty. Potom:
(1): podle Steinitzovy věty je r < s, neboli dimTVi < dim W2, (2): je-li navíc dimTVi = dimW2, tzn. r = s, pak opět podle Steinitzovy věty je L(vi,..., vs) = L(u\,..., ur), neboli W\ = W2.                           D
Poznámka. Z předchozí věty plyne několik zřejmých, ale důležitých důsledků:
1.  Dimenze podprostoru je vždy menší nebo rovna dimenzi celého prostoru.
2.  Je-li podprostor W\ vlastní podmnožinou podprostoru W2 (tzn. W\ ^ W2), potom je dimWi < dimW^- Jinými slovy řečeno, nemůže se stát, aby dva podprostory stejné dimenze byly ostře v inkluzi.
3.  Předpoklad W\ C W2 v předchozí větě byl podstatný, tzn. pokud dva podprostory nejsou v inkluzi, pak o vzájemném vztahu jejich dimenzí nemůžeme nic říct.
24
Vektorové prostory
Věta 4.6. (Věta o dimenzi součtu a průniku podprostorů) Nechť W\, W2 jsou podprostory vektorového prostoru V. Pak platí:
dim(W! + W2) + dim(VFi n W2) = áimWi + dimVF2.
Důkaz. Je-li W\ = {0} nebo W2 = {o}, pak tvrzení zřejmě platí (rozmyslete si podrobně proč!). Nechť tedy dimWi =r^0a dimW2 = <s 7^ 0.
Průnik Wi(~)W2 je podprostorem ve V, a tedy je buď WiflW^ = {o}-, nebo existuje báze W1DW2, tj. lineárně nezávislé vektory wi,...,wks vlastností W1nW2 = L(w1,...,wk).
Podle věty 4.3. (3) existují vektory uk+i, ■ ■ ■ ,ur G W\ tak, že w\,..., wk, uk+i,..., wr je báze Wi, a podobně existují vektory i^+i,..., vs G W2 tak, že w\,..., «;jt, •Ufc+ii •••)vs je báze W2 (v případě W\ D W2 = {0} je zřejmě k = 0).
Nyní dokážeme, že vektory:
«Ji,..., wkl uk+1,..., ur,vk+1, ...,vs                         (2)
jsou bází podprostorů W\ + W2-
a) Dokážeme, že vektory (2) jsou lineárně nezávislé. Nechť:
ti-wi-\------\-tk-wk+tk+1-uk+1-\------\-tr-ur+ťk+1-vk+1-\------\-ťs-vs = o. (3)
Označme:
x = ti-wi-\-------h tk ■ wk + íjfc+i • uk+i H-------\-tr-ur.            (4)
Ze (3) dostáváme, že x = —t'k+1 ■ vk+i — ■ ■ ■ — ťs ■ vs, tzn. x G W\ n W2 a lze psát:
a? = g1-w1-\------\-gk-wk =gi-wi-\------\-gk-wk + 0-uk+1-\------\-0-ur. (5)
Ale to 1,..., wk, uk+i,..., ur je báze Wi, tzn. že z (4) a (5) podle věty 4.2. plyne, že tk+\ = ■ ■ ■ = tr = 0. Dosadíme-li tyto hodnoty do (3), dostáváme:
U ■ wi H-------h tk ■ wk + ťk+1 ■ vk+1 H-------\-ťs-vs = o,
odkud plyne (poněvadž w\,..., wk, vk+i,... ,vs jsou lineárně nezávislé), že t\ = ■ ■ ■ = tk = t'k+1 = ■ ■ ■ = ťs = 0. Dohromady dostáváme, že vektory (2) jsou lineárně nezávislé.
4 Báze a dimenze vektorového prostoru
25
ß) Dokážeme, že vektory (2) generují podprostor W\ + W2, tzn. že platí:
Wi + W2 = L(wi,... ,wk,uk+1,... ,ur,vk+1,... ,vs).            (6)
Inkluze „D" je zřejmá. Naopak, nechť x G W\ + W2 libovolný. Potom x = X\+X2, kde X\ G W\, X2 G W2. Ale x G W\ = L(w\,..., wk, «/t+i, • • •, «r) Cj I/(tüi,...,iüjt,ti/c+i,...,Mr,'ü/c+i,...,'üs)  a podobně pro a?2. Tedy x  = X\ + X2 G L(w\,..., lüfc, tijt+i,..., «r, v^+i,..., vs) a dohromady pak dostáváme žádanou rovnost (6).
Dokázali jsme, že vektory (2) jsou bází W\ + W2, tzn. dim(Wi + W2) = r + s - k. Potom však dim(Wi + W2) + dim(Wi n W2) =r+s-k+k= r + s = dim W\ + dim W2.                                                                         D
Poznamenejme, že předchozí větu nelze přímo zobecnit pro více než dva podprostory daného vektorového prostoru, jak plyne z následujícího příkladu.
Příklad 4.4. Ve vektorovém prostoru IR3 uvažme podprostory:
W\ = {Ol, 372,0)   I  XUX2 G M},
W2 = {(3/1,0,2/3)  i yi,V3 e«}, W3 = {(0,z2,z3) \z2,z3eR}.
Zřejmě je dim W\ = dim W2 = dim W3 = 2 a dále je Wi + W2 + W3 = R3, resp. WirW2nW3 = {o}. Jetedy dim(Wri+Wr2+W3)+dim(WrinW2nW3) = 3 + 0 = 3, ale dim Wi + dimTy2 + dim W3 = 2 + 2 + 2 = 6.
Poznámka. V našich úvahách o konečných posloupnostech vektorů v předchozím paragrafu (tj. v úvahách o lineární závislosti a nezávislosti) nehrálo pořadí vektorů žádnou podstatnou roli. Se zavedením pojmu báze se však otázka pořadí vektorů okamžitě vynoří a je zřejmě podstatné, v jakém pořadí vektory báze uvažujeme (i když doposud, kdy jsme pracovali vždy jen s jednou bází, se to možná na první pohled nezdálo). Přesněji řečeno, danou bází m,...,un vektorového prostoru V chápeme jako uspořádanou n-tici vektorů z V, a tedy např. rovnost dvou bází znamená rovnost dvou uspořádaných n-tic vektorů z V. Důležitost této poznámky se ukáže v dalším, při zavádění pojmu souřadnic vektoru.
Definice. Nechť:
«i,...,«n                                              (7)
26
Vektorové prostory
je báze vektorového prostoru V a nechť vektor w E V je vyjádřen ve tvaru:
W = h-Ui-\-------hín-Mn,                                 (8)
kde ti,...,tn £ T. Pak číslo í j nazýváme «-tou souřadnicí vektoru w v bázi (7) a uspořádanou n-tici (ti,...,tn) nazýváme souřadnicemi vektoru w v bází (7).
Poznámka. Je nutné si uvědomit, že pojem souřadnic vektoru je vždy vázán na nějakou pevnou bázi prostoru V. Zřejmě jeden vektor má v různých bázích obecně různé souřadnice.
Dále si uvědomme, že věta 4.2. zajišťuje korektnost předchozí definice, tzn. při dané bázi (7) má každý vektor w G V souřadnice (v bázi (7)), které jsou stanoveny jednoznačně. Také naopak, ke každé uspořádané n-tici (íi,...,ín) čísel z T existuje zřejmě jediný vektor, jehož souřadnice v bázi (7) jsou právě (ti,..., tn).
Konečně poznamenejme, že souřadnice vektoru v dané bázi budeme psát nejen do řádku, jak bylo výše zavedeno, ale také někdy podle potřeby i do sloupce.
Příklad 4.5. Ve vektorovém prostoru IR3 vezměme vektor w = (1, —2,3). Potom:
(a)  vektor w má v bázi e\ = (1,0,0), e<i = (0,1,0), e% = (0,0,1) souřadnice (1, —2,3),
(b)  vektor w má v bázi e2 = (0,1,0), e\ = (1,0,0), e% = (0,0,1) souřadnice (—2,1,3),
(c)  vektor w má v bázi u\ = (1,1,1), u^ = (0,1,1), «3 = (1,0,1) souřadnice (—4,2,5),
jak se lehce zjistí rozepsáním z definice.
Věta 4.7. Nechť (7) je báze vektorového prostoru V. Nechť t € T a nechť vektor x € V, resp. y £ V má v bázi (7) souřadnice (x\,... ,xn), resp. (yii-'-iVn)- Potom:
(1)  vektor x + y má v bází (7) souřadnice (x\ + í/i, ..., xn + yn),
(2)  vektor t ■ x má v bází (7) souřadnice (t ■ x\,..., t ■ xn).
Důkaz. Podle předpokladu je x = x\ ■ U\ -\------\-xn-un, resp. y = y\ ■ U\ +
''' + Un • «m tzn- potom (po úpravě):
x + y = {xi+y{)-Ui-\-------h (xn + yn) ■ tt„,
t ■ x = (t ■ xi) ■ Ui -\-------\- (t ■ xn) ■ un,
4 Báze a dimenze vektorového prostoru                                                   27
odkud již plyne tvrzení věty.                                                                     D
Kapitola 2
Matice a determinanty
§1.   Pořadí a permutace
Permutací libovolné množiny M se obecně rozumí každé bijektivní zobrazení množiny M na sebe samu. Naším cílem však není studium obecných vlastností permutací libovolných množin, nýbrž permutace nám budou pouze pomocným nástrojem ke studiu dalších algebraických pojmů. Omezíme se proto v tomto paragrafu jen na výklad nejzákladnějších vlastností permutací konečné množiny M, řekněme n-prvkové. Pro zjednodušení vyjadřování budeme v dalším předpokládat, že množina M se skládá z prvních n přirozených čísel, tzn. M = {l,2,...,n}.
Definice. Nechť M = {1, 2,... ,n}. Pak libovolná uspořádaná n-tice utvořená z prvků množiny M se nazývá pořadí z n prvků 1,2,..., n nebo stručně pořadí
Nechť R = (n,... ,rn) je libovolné pořadí. Řekneme, že dvojice r-i^rj je inverze v pořadí fi, jestliže i < j a r-i > r j (tj. jestliže větší z obou čísel předchází v daném pořadí číslu menšímu).
Pořadí, v němž celkový počet inverzí je sudé číslo (resp. liché číslo), se nazývá sudé pořadí (resp. liché pořadí). Hovoříme pak též o paritě pořadí.
Příklad 1.1. Nechť n = 8. Potom:
1.  pořadí (1,2,3,4,5,6,7,8) je sudé (celkový počet inverzí je 0),
2.  pořadí (3,1, 2, 7, 5,8, 6,4) je liché (celkový počet inverzí je 9). Celkový počet inverzí v daném konkrétním pořadí zřejmě nejrychleji zjistíme tak, že bereme odleva jedno číslo po druhém a pro každé z nich spo-
28
1 Pořadí a permutace
29
čítáme, kolik menších čísel stojí za ním (napravo). Sečtením těchto hodnot pak dostaneme celkový počet inverzí v daném pořadí.
Definice. Nechť R = (ri,..., rn), S = (s\,..., sn) jsou dvě pořadí. Nechť existují indexy i j^ j tak, že Si = rj, s j = r i a dále r^ = s^ pro k j^ i,j. Potom řekneme, že pořadí S vzniklo z pořadí R provedením jedné transpozice.
Poznámka. Jinými slovy řečeno, provedení jedné transpozice znamená vzájemnou záměnu dvou různých prvků v daném pořadí, přičemž všechny ostatní prvky zůstávají na původním místě.
Věta 1.1. Nechť n je pevné přirozené číslo. Pak platí:
(1)  z n prvků lze utvořit celkem n\ různých pořadí,
(2)  všech n\ pořadí z n prvků lze seřadit tak, že každé následující pořadí obdržíme z předcházejícího provedením jedné transpozice. Přitom lze vyjít z libovolného pořadí.
Důkaz. Připomeňme, že symbol n\ (čti „n faktoriál") značí přirozené číslo
definované: n\ = n • (n — 1).....2-1. Dokazovat budeme obě části věty
najednou, a to matematickou indukcí.
a) Pro n = 1 obě tvrzení triviálně platí.
ß) Předpokládejme, že obě tvrzení platí pro 1,..., n — 1, a budeme je dokazovat pro n. Nechť (ri,...,rn) je libovolné pořadí z n prvků. Podle indukčního předpokladu je všech pořadí, která mají na posledním místě prvek rn, celkem (n — 1)! a lze je seřadit tak, že následující vznikne z předchozího provedením jedné transpozice. V posledním z těchto pořadí proveďme transpozici prvků rn a Vi (1 < i < n — 1) a stejnou úvahou jako výše dostaneme (n — 1)! pořadí s prvkem r i na posledním místě. Takto vystřídáme na posledním místě všech n prvků, čímž dostaneme všechna různá pořadí z n prvků, kterých je tedy n • (n — 1)! = n!, přičemž následující pořadí vzniklo vždy z předchozího provedením jedné transpozice.                                   D
Věta 1.2. Provedení jedné transpozice změní paritu daného pořadí.
Důkaz. Provedeme ve dvou krocích. Nejprve pro transpozici sousedních prvků a potom pro transpozici libovolných dvou různých prvků daného pořadí.
30
Matice a determinanty
a) Nechť v pořadí R = (ri,..., rj,rj+i, ...,rn) je t inverzí. Provedením transpozice sousedních prvků r, a rj+i dostaneme pořadí R' = (n,..., rj+i, r v němž je buď í — 1, nebo í + 1 inverzí. Tedy i?' má opačnou paritu než R.
ß) Nechť R = (ri,...,rj,..., 7-j,..., rn) je dané pořadí. Provedením transpozice prvků r, a r j dostaneme pořadí R' = (n,..., rj,..., r i,..., rn). Tuto transpozici však lze realizovat postupným provedením (j — i) + (j — í — 1) = 2(j — i) — 1 transpozic sousedních prvků. Ale číslo 2(j — i) — 1 je liché, tzn. užitím a) dostáváme tvrzení.                                                    D
Věta 1.3. Nechť n > 2. Pöä; 2 celkového počtu n\ různých pořadí z n prvků je y sudých a y lichých pořadí.
Důkaz. Tvrzení věty plyne ihned v vět 1.1. a 1.2.                                   D
Definice. Nechť M = {1,2,... ,n} je konečná množina o n prvcích. Pak bijektivní zobrazení P množiny M na sebe se nazývá permutace množiny M nebo krátce permutace.
Permutaci P definovanou: P (it) = jr, Pr0 t = 1,..., n, budeme zapisovat ve formě dvouřádkové tabulky tvaru:
í k    i-i    ■■■    in\
\jl     h     ■■■      in)'
Poznámka. Permutace množiny M je tedy bijekce M —y M, kterou zapisujeme ve tvaru dvouřádkové tabulky. Znamená to, že v horním i dolním řádku této tabulky musí být vždy nějaké pořadí z n prvků. Zřejmě lze tutéž permutaci P zapsat v uvedeném tvaru celkem n\ formálně různými způsoby (zaměníme-li pořadí sloupců v tabulce permutace). Všech těchto n\ zápisů permutace P je samozřejmě naprosto rovnocenných, i když nejčastěji budeme permutaci zapisovat v tzv. základním tvaru:
(\     2     •••     n\
\h    k2    ■■■    knJ'
Příklad 1.2. Pro n = 5 jsou:
(1   2   3   4   5\              /3   2    1   4   5\              ÍA   1    5   2   3\
V2   3   5   4   \y  reSp- V5   3   2   4   l)1  reSp' \4   2    1   3   5J
1 Pořadí a permutace
31
tři formálně různé zápisy téže permutace (z celkového počtu 5! = 120 možných zápisů této jedné permutace).
Věta 1.4. Počet různých permutací n-prvkové množiny je roven n\.
Důkaz. Zapíšeme-li každou permutaci v základním tvaru:
íl     2     •••     n
\ki    k2    ■■■     kn
pak různých permutací bude přesně tolik, kolik bude různých pořadí v dolním řádku. Těch je však n! podle věty 1.1. (1).                                         D
Definice. Permutace P se nazývá sudá permutace, resp. lichá permutace, jestliže počtu inverzí v horním a dolním řádku tabulky permutace P je sudé číslo, resp. liché číslo. Hovoříme pak též o paritě permutace.
Poznámka. I když danou permutaci P můžeme zapsat n\ formálně různými tabulkami, je předchozí definice korektní, neboť při libovolném zápisu permutace P je parita horního a dolního řádku (chápaných jako pořadí) buď vždy stejná, nebo vždy rozdílná. Tento fakt plyne z toho, že při přechodu od jednoho zápisu permutace P k jinému provádíme totiž jistý počet transpozic, a to současně v horním i dolním řádku.
Věta 1.5. Nechť n > 2. Pak z celkového počtu n\ různých permutací n-prvkové množiny je y sudých permutací a y lichých permutací.
Důkaz. Každou permutaci zapíšeme v základním tvaru:
íl     2     •••     n \k\    k2    ■■■    kn
Parita permutace je pak shodná s paritou pořadí v dolním řádku a věta plyne bezprostředně z věty 1.3.                                                                 D
Na závěr paragrafu využijeme příležitosti, kterou nám permutace poskytují, a vrátíme se krátce k algebraickým strukturám. Jak bylo výše řečeno, permutace n-prvkové množiny M je bijekce M -4- M, tedy zobrazení. Pro permutace tak platí všechny základní poznatky o zobrazeních, uvedené dříve. Například můžeme permutace skládat (ve smyslu skládání
32
Matice a determinanty
zobrazení), přičemž zřejmě výsledné zobrazení (tj. složení dvou bijekcí) je také bijekce M —> M, čili permutace. Konkrétně, zapíšeme-li permutace P, R ve tvaru:
p'1     2    •••     n\    R=(ll    *2    •••    i,
KH     «2     •••      inj               \Jl     J2     •••      Jn
pak složením P a R (y tomto pořadí) dostaneme permutaci:
RoP=(1     2      -     n
\Jl     J2     •••      Jn
Tedy množina všech permutací n-prvkové množiny M s operací o skládání permutací je grupoid, který podle V.5.2. kap. I. je pologrupou. Platí však ještě více, jak ukazuje následující věta.
Věta 1.6. Množina všech permutací n-prvkové množiny s operaci o skládáni permutací je grupou. Tato grupa je pro n > 3 nekomutativní.
Důkaz. Podle předchozí poznámky jde o pologrupu. Dále zřejmě permutace:
je jedničkou a k libovolné permutaci:
P=(H    •••
existuje inverzní permutace, a sice:
h    ■■■    Jn %\    •••    %n
Tedy množina všech permutací n-prvkové množiny s operací o je grupa. Nechť n > 3. Pak pro:
1    2    3    --A             A    2    3
3    1    2    ...y'           \1    3    2
platí R o P ý: P o R (ověřte si detailně sami!), a tedy operace o není komutativní.                                                                                              D
Poznámka. Předchozí věta udává jeden z nejjednodušších příkladů nekomutativní grupy. Tato grupa se obvykle nazývá grupa permutací (na n-prvkové množině M) nebo též symetrická grupa permutací stupně n.
2 Determinanty
33
§2.   Determinanty
Jedním ze základních pojmů celé moderní matematiky je pojem matice. Teorie matic hraje ústřední úlohu v tzv. lineární algebře. Její výsledky se pak aplikují při řešení soustav lineárních rovnic, při studiu vektorových prostorů a v celé řadě dalších odvětví nejenom matematiky.
Definice. Nechť T je číselné těleso, m, n jsou přirozená čísla. Pak obdélníkové schéma tvaru:
A =
«21       «22      • • •       (í2n \Gto1     Q>m1     ' ' '      Q"mnJ
(1)
kde a-ij G T pro i = 1,..., m aj = 1,..., n, se nazývá matice typu m/n (nad tělesem T). Označení: A = (öy) typu m/n. Čísla a,ij G T se nazývají prvky matice A.
Matice A = (a,j) typu m/n a matice B = (bij) typu p/q jsou si rovny, jestliže jsou stejného typu (tj. m = pAn = q)& je-li a,j = bij pro každé hj-
Poznámka. 1. Předchozí definice matice je sice názorná, ale přísně vzato není zcela korektní, neboť se v ní používá formálně nejasného a nepřesného pojmu „obdélníkové schéma" (a je pak nutné hovořit o rovnosti dvou matic). Zcela přesně by bylo třeba matici typu m/n nad tělesem T definovat jakožto zobrazení:
/:{l,2,...,m}x{l,2,...,n}^T,
kde f((i,j)) = a,ij. Při této definici by však většina tvrzení o maticích byla formálně značně komplikovaná a nepřehledná. Ponecháme tedy definici matice tak, jak byla původně uvedena (tj. vypisujeme vlastně funkční hodnoty uvedeného zobrazení / do onoho „obdélníkového schématu").
2. Každý jednotlivý řádek matice A typu m/n nad tělesem T můžeme zřejmě uvažovat jako uspořádanou n-tici prvků (tj. čísel) z tělesa T, tzn. jinak řečeno, jako vektor z vektorového prostoru Tn. Má smysl pak hovořit o sčítání řádků matice, násobení řádku číslem z T, lineární kombinaci řádků, lineární závislosti a nezávislosti řádků, atd., a to ve smyslu uvedených operací, resp. pojmů tak, jak byly definovány ve vektorovém prostoru Tn. Matici A lze pak též chápat jako uspořádanou m-tici vektorů z Tn.
34
Matice a determinanty
Analogicky můžeme sloupce matice A chápat jako vektory z vektorového prostoru Tm a provádět s nimi tytéž úvahy.
Definice. Nechť A = (a^) je matice typu m/n nad T. Potom:
(1)  je-li <iij = 0 pro každé i, j (tj. všechny prvky matice jsou rovny nule), matice se nazývá nulová matice (typu m/n) a označuje se symbolem
Umn?
(2)  je-li m = n (tj. počet řádků je roven počtu sloupců), matice A se nazývá čtvercová matice řádu n,
(3)  matice A' typu n/m, která vznikne z matice A záměnou řádků za sloupce, tj.:
(a\\    a,2i    •••     ami\
0-12     0-22     • • •      dm2
A =       .
\CL\n     Ü2n     ' ' '      O'mn/
se nazývá transponovaná matice k matici A.
Ve zbývající části tohoto paragrafu se budeme zabývat pouze čtvercovými maticemi řádu n nad pevným číselným tělesem T. Pro tyto matice nejprve zavedeme následující pojem.
Definice. Nechť A = (a^) je čtvercová matice řádu n nad tělesem T. Pak determinant matice A je číslo z tělesa T označené det^4 (nebo též |.A|) a definované vztahem:
detA=     E    (-l)JÜi.-J«) • aln ■ a2n.....anjn,
0'li-Jn)
kde I(j\,... ,jn) značí celkový počet inverzí v permutaci:
1     2    •••     n
h   h   •••   in
použitých řádkových a sloupcových indexů. Sčítání se provádí přes všechna různá pořadí (ji,... ,jn) sloupcových indexů. Součin:
(_l)/Üi....Jn) . a       a     .....a
2 Determinanty
35
se nazývá člen determinantu.
Poznámka. Rozebereme-li si předchozí definici podrobněji, pak vidíme, že determinant det A je číslo z T, které dostaneme sečtením celkem n\ členů determinantu (viz věta 1.1. (1)). Přitom každý jednotlivý člen determinantu je součinem n prvků matice A vybraných tak, že z každého řádku a každého sloupce je vybrán právě jeden prvek a tento součin je „opatřen znaménkem + nebo —" podle toho, zda permutace utvořená z řádkových a sloupcových indexů vybraných n prvků je sudá nebo lichá.
Dále je třeba si uvědomit zásadní rozdíl mezi pojmem matice (tj. jakýmsi obdélníkovým, resp. čtvercovým schématem) a pojmem determinantu matice (tj. pevným číslem z T).
Příklad 2.1. Rozepišme si předchozí definici determinantu pro nejjednodušší případy, tj. n = 1,2,3.
1
n
n
n = 3
Oll|	= Oil,	
(ill	(112	
021	(Í22	
Oll	(il2     (il3	
(121	(i22     (i23	
(131	(Í32	(Í33
(ill • «22 — Ö12 " «21?
— «li • (122 • «33 + Ö12 • «23 " «31 + ^13 " «21 • «32 ~ — (ii3 • (Í22 • Ö31 — Ö12 • «21 • (l33 — ^11 " «23 - «32-
Je vidět, že výpočet determinantu matice pouze na základě definice by byl neúnosně zdlouhavý a pracný, zejména pro větší n. Např. pro n = 10 by bylo nutno spočítat přes tři a půl milionu desetičlenných součinů (neboť 10! = 3 628 800). Z tohoto důvodu uvedeme nyní několik vět popisujících základní vlastnosti determinantů, které mnohdy výpočet determinantu podstatně usnadní.
Všude v dalším v tomto paragrafu budeme symbolem A označovat čtvercovou matici A = (a,j) řádu n nad tělesem T.
Věta 2.1.   Transponováním matice A se hodnota determinantu nezmění, tj. det A1 = det A.
Důkaz. Nechť (ji, j2,..., jn) je libovolné pořadí z n prvků. Pak součin • •   • CLnjn se vyskytuje právě jednou v det A i det A'. Tento
(liji   •  (l2J2   •      ' '
součin je v det^4 vynásoben číslem (—l)r, resp. v det^ť číslem r, resp. s značí celkový počet inverzí v permutaci:
kde
36
Matice a determinanty
1     2
n
Jn
resp.
Ji     J2
1     2
3n
Zřejmě však r = s, odkud již plyne tvrzení.
Věta 2.2. Nechť prvky k-tého řádku matice A máji tvar:
o-ki
(Ík2
bki + Cki,
bk2 + Ck2,
D
Qkn — "fen ~r C-kn
a nechť matice B, resp. C se liší od matice A pouze v prvcích k-tého řádku, přičemž hi,-■■ ,hn> resp. Cki,---,Ckn je k-tý řádek matice B, resp. C. Potom det A = det B + det C. Schématicky zapsáno, platí:
on
h\ + Chi
ani
air,
hn +
an
ftfcl
air,
hr
ani     ' ' '      0"n
+
«11
Cyfcl
Olr
C/cr
Oni     • • •      ar,
Důkaz. Tvrzení plyne přímo z definice determinantu, neboť pro každý člen determinantu det A platí:
(_l)/(jl,-.,Ín).aiji.
(_l)/0'l.-Jn).Olji
•&jt
:3k
'''  ' ("*jfc + c/cjj; J.....anjn —
ínjn + (-l)I{n'-'Jn)-ain.....ckjk.....anjn.
D
Poznámka. Předchozí větu lze zřejmě rozšířit pro libovolný konečný počet sčítanců v /s-tém řádku matice A (dokáže se pomocí matematické indukce).
Věta 2.3. Nechť matice B vznikne z matice A:
(1)  záměnou dvou různých řádků. Potom je det B = — det A.
(2)  vynásobením, jednoho řádku pevným číslem t G T. Potom je det B = t ■ det A.
2 Determinanty
37
Důkaz. (1): Zaměňme v matici A k-tý řádek s r-tým řádkem, kde k ^ r. Pak součiny vyskytující se v det A a det B zůstanou stejné, ale mají vždy opačná znaménka, protože permutace:
	•• k    ■■	r	n\	a	n ■■	■■ k    ■■	r	n
JI ■■	■■    J k    ■■	■■     Jr     ■■	■ ■      3n)		Ui ••	■■      Jr     ■■	■■    Jk    ■■	Jn
mají (podle věty 1.2.) různou paritu. Potom však det B = — det A.
(2): Plyne přímo z definice determinantu, neboť vynásobíme-li v matici A např. k-tý řádek prvkem t G T, potom:
det B = £(-l)'üi,...jn) . aiji.....t ■ akjk.....anjn =
t. £(_i)/Üi,...jn) . aiji.....anjn = t. det A.
D
Věta 2.4. Nechť v matici A:
(1)  jeden řádek sestává ze samých nul. Potom je det A = 0.
(2)  dva různé řádky jsou shodné. Potom je det A = 0.
(3)  jeden řádek je t-násobkem jiného řádku (t £ T lib.). Potom je det A = 0.
(4)  jeden řádek je lineární kombinací ostatních řádků. Potom je det A = 0.
Důkaz. (1): Plyne přímo z definice determinantu. Každý člen det A je totiž roven nule, poněvadž obsahuje nulu (a sice z toho řádku, který sestává ze samých nul).
(2): Zaměníme-li ty dva řádky matice A, které jsou shodné, pak matice A se zřejmě nezmění. Podle věty 2.3. (1) však musí být det A = — det A, tj. 2 • det A = 0, odkud však dostáváme, že det A = 0.
(3): Plyne přímo z věty 2.3. (2) a z právě dokázané části (2).
(4): Nechť např. k-tý řádek matice A je lineární kombinací ostatních řádků. Pak det A lze podle poznámky za větou 2.2. vyjádřit jako součet (n — 1) determinantů, z nichž však v každém je k-tý řádek násobkem nějakého jiného řádku. Podle části (3) této věty je však každý z těchto (n — 1) determinantů roven nule, a tedy detJ4 = 0 + 0 + --- + 0 = 0.                   D
Věta 2.5. Hodnota determinantu matice A se nezmění, jestliže: (1) k jednomu řádku matice A přičteme libovolný násobek jiného řádku,
38
Matice a determinanty
(2)  k jednomu řádku matice A přičteme libovolnou lineární kombinaci ostatních řádků,
(3)  jeden řádek matice A ponecháme beze změny a k ostatním řádkům přičteme jeho libovolné násobky.
Důkaz. (1): Plyne bezprostředně z vět 2.2. a 2.4. (3). (2): Plyne z poznámky za větou 2.2. a z věty 2.4. (4). (3): Plyne z (1), jejím opakováním.                                                       D
Poznámka. Z věty 2.1. plyne, že ke každé z následujících vět, tj. 2.2., 2.3. a 2.4. platí analogická věta, kterou získáme tak, že v původní formulaci slovo „řádek" nahradíme slovem „sloupec". Například, platí tedy tvrzení: „jestliže v matici A je jeden sloupec lineární kombinací ostatních sloupců, potom je detA = 0", atd.
Tuto úvahu lze zřejmě uplatnit na každé tvrzení o determinantech matice, týkající se řádků matice. Dostaneme tak stejné tvrzení, týkající se sloupců. Analogicky naopak (tzn. z každého platného tvrzení o determinantech, týkajícího se sloupců dané matice, dostaneme záměnou slova „sloupec" za slovo „řádek" platné tvrzení, týkající se řádků).
Větu 2.5. (a odpovídající větu pro sloupce) často využíváme při konkrétních výpočtech determinantů, kdy se přičítáním vhodných násobků jedněch řádků (resp. sloupců) k jiným řádkům (resp. sloupcům) snažíme matici upravit na takový tvar, z něhož již determinant lehce spočítáme. Napří-
A
latici /au	A tvari Ol2      •	i: al,(n-l)	din
0	Ö22      •	a2,(n-l)	(l2n
0	0     •	'      a(n-l),(n-l)	a{n—l),n
\o	0     •	0	Q>nn
(tj. všude pod hlavní diagonálou jsou nuly), pak det A = au ■ 022.....ann,
jak plyne ihned z definice determinantu. Stejný výsledek (tzn. hodnota determinantu je rovna součinu prvků v hlavní diagonále) dostaneme, jestliže v matici jsou samé nuly nad hlavní diagonálou.
Ve zbývající části tohoto paragrafu pak odvodíme ještě jeden způsob jak zjednodušit výpočet determinantu.
2 Determinanty
39
Definice. Nechť A = (ay) je čtvercová matice řádu n. Nechť je zvoleno k jejích řádků a sloupců (k < n), a sice: 1 < i\ < i^ < ■ ■ ■ < ik < n, resp. 1 < ji < j2 < • • • < Jjt < n. Pak matice:
/a.
M
«Úl
*Í2Í1
V
'«fc.71
*«1J2
*«*J2
Ji2Ji
**AJ*
se nazývá submatice matice A určená řádky i\,..., i^ a sloupci ji ■ ■ ■ -,jk-Její determinant \M\ se nazývá minor řádu A; matice A.
Zbývajícími (n — k) řádky a (n — k) sloupci je určena submatice M matice A, která se nazývá doplňková submatice k submatici M a její minor \M\ se nazývá doplněk minoru \M\.
Označme sm = i\ + «2 H-------Hjt + ji H-------h jjt- Pak číslo (-1)SM • |M|
se nazývá algebraický doplněk minoru \M\. Člen doplňku \M\ vynásobený číslem (—1)Sm se pak nazývá člen algebraického doplňku minoru \M\.
Příklad 2.2. Nechť A je čtvercová matice řádu 4 nad tělesem M:
A
/   1    2    3    4\
0    12-3 -12    0    1 \  6-2 -1    3/
Zvolíme-li «i = 1, «2 = 3, ji = 2, J2 = 3, tj. první a třetí řádek, resp. druhý a třetí sloupec, pak submatice M určená zvolenými řádky a sloupci je tvaru:
M
2    3 2    0
tzn. minor \M\ = —6.
Doplňkovou submatici je pak:
M Dále je sm
0 -3 6    3
-18.
tzn. doplněk \M\
1 + 3 + 2 + 3 = 9, tzn. algebraický doplněk minoru \M\ je: (-1)SM ■ \M\ = (-1)9 • 18 = -18.
40
Matice a determinanty
Poznámka. Označíme-li s-^ součet indexů řádků a sloupců určujících doplňkovou submatici M, pak zřejmě platí (—1)SM = (—1)sm, neboť sm + sj^ = 2 ■ (1 + 2 + • • • + n) je sudé číslo, a tedy sm a sj^ musí být obě buď současně sudá, nebo současně lichá. Tedy algebraický doplněk minoru \M\ je též roven číslu (—1)sm ■ \M\, což lze někdy při praktických výpočtech s výhodou použít.
Věta 2.6. Nechť A je čtvercová matice řádu n, nechť \M\ je minor řádu k matice A (k < n). Pak součin libovolného členu minoru \M\ s libovolným členem jeho algebraického doplňku je členem determinantu \A\.
Důkaz. Nechť submatice M je určena řádky i\,..., ik a sloupci ji,... ,jk matice A, přičemž ii < Í2 < ■ ■ ■ < ik, resp. ji < ji < ■ ■ ■ < j f..
Zaměňme ii-tý řádek matice A s {i\ — l)-tým řádkem, pak s {i\ — 2)-tým řádkem, atd., až s prvním řádkem. Celkem jsme takto provedli {i\ — 1) záměn řádků matice A. Podobně pomocí («2 — 2) záměn řádků přemístíme «2-tý řádek na místo druhého řádku, atd., až pomocí {if. — k) záměn řádků přemístíme ik-tý řádek na místo k-tého řádku. Celkem jsme tedy provedli («i - 1) + («2 - 2) + • • • + {ik - k) = («i + • • • + ik) - (1 + 2 + • • • + k) záměn
řádků matice A. Analogicky pomocí (ji H------\~ jk) — (1 + 2 + • • • + /s) záměn
sloupců matice A přemístíme ji,... ,i/t-tý sloupec na místo prvního, ..., až A;-tého sloupce. (Důležité je, že se po provedení těchto úprav nezměnilo původní pořadí řádků a sloupců submatice M ani její doplňkové submatice M, tzn. nezměnily se hodnoty jednotlivých členů minoru \M\ ani členů jeho doplňku \M\.)
Tedy pomocí {ii~\-------\- ik + ji + • • • + jk) — 2 • (H-------\-k) záměn řádků,
resp. sloupců jsme z matice A dostali jistou matici B, přičemž podle věty 2.3. (1) platí:
\ß\ = Ml . (_l)ň+-+«fc+Ji+-+Ífc-2-(l+-+A;) _ \M . (_iyi+-+ik+3i+"+3k odkud po vynásobení číslem (—l)nH    ^k+ji+-+jk dostáváme:
\A\ = \B\ ■ {-i)ií+-+ik+Ji+-+Jk_                             (2)
Submatice M je v matici B určena prvními k řádky a prvními k sloupci. Potom však součin libovolného členu minoru \M\ s libovolným členem doplňku \M\ je členem determinantu \B\, neboť označíme-li B = (bij), pak člen minoru \M\, resp. člen doplňku \M\ jsou tvaru:
(_l)/(*i,..A).6líi.....htki resp. (_1)/(í*+i,..)í«).6a:+1       .....6nín?   (3)
2 Determinanty
41
(I    •••     k\ kde /(íi,..., ífc) značí počet inverzí v permutaci I                     , resp. iU^+i,
\*1     • • •      * A;/
značí počet inverzí v permutaci I                         I. Označíme-li I (ti,..., tn)
V ífe+l      • • •      *n/
počet inverzí v permutaci I                    j, pak platí (rozmyslete si proč!):
\*i    • • •    tnj
I (ti,..., t k) + J(tfc_|_i,... ,tn)   =  I (ti,... ,tn). Potom však vynásobením
obou členů z (3) dostáváme: (—iy(ti,—,tn) . 0lt^.....bntn, což je však
člen determinantu \B\.
Odtud (podle (2)) součin libovolného členu minoru \M\ s libovolným členem doplňku \M\ vynásobený číslem (—l)ílH i-h+jiH K?* je členem determinantu \A\. To však je již žádané tvrzení, neboť libovolný člen algebraického doplňku minoru \M\ v matici A obdržíme z libovolného členu doplňku \M\ vynásobením číslem (—l)ílH    ^k+h-\    h?'*,                           q
Věta 2.7. (Laplaceova věta) Nechť A = (ciy) je čtvercová matice řádu n, nechť je pevně zvoleno k řádků matice A, kde 0 < k < n. Pak determinant \A\ je roven součtu všech (k) součinů minoru řádu k vybraných ze zvolených k řádků s jejich algebraickými doplňky.
Důkaz. Ze zvolených řádků lze zřejmě vybrat minor řádu k právě (k) různými způsoby. Podle věty 2.6. je součin členu takového minoru s členem jeho algebraického doplňku členem determinantu \A\. Přitom je zřejmé, že dostáváme navzájem různé členy. K důkazu našeho tvrzení tedy stačí spočítat, zda uvedeným způsobem dostaneme všechny členy determinantu |.A| (kterých, jak víme, je n!). Ale každý minor řádu k má A;! členů, každý jeho algebraický doplněk má (n — k)\ členů a vybraných minoru je (u), tzn. celkem dostáváme:
k\-(n-k)\-(^)=k\-(n-k)\- M^]I = n\
členů determinantu |.A|, a tedy věta platí.                                                 D
Poznámka. Laplaceova věta se také někdy nazývá „věta o rozvoji determinantu podle zvolených k řádků". Její praktický význam spočívá v tom, že výpočet determinantu určitého řádu, např. n, převádíme na výpočet jistého počtu determinantů matic řádu menšího než n.
Připomeňme, že na základě věty 2.1. platí analogická věta k Laplaceově větě zformulovaná pro sloupce (tzn. slovo „řádek" v Laplaceově větě nahra-
42
Matice a determinanty
dime slovem „sloupec"). Říkáme pak, že jsme determinant vyjádřili rozvinutím podle daných k sloupců.
Definice. Nechť A = (a^) je čtvercová matice řádu n. Pak algebraický doplněk jednoprvkové submatice sestávající z prvku Oy budeme krátce nazývat algebraický doplněk prvku a\j a označovat symbolem Aij.
Důsledek. Nechť A = (a^) je čtvercová matice řádu n, nechť i, resp. j je pevně zvolený řádkový, resp. sloupcový index. Pak plati:
resp.
\A\ = au ■ Au + ai2 • Ai2 H-------h ain ■ Ain,
\A\ = aij • Aij + a2j ■ A2j H-------V anj ■ Anj.
Důkaz. Uvedený důsledek je doslovným přepisem Laplaceovy věty, a sice pro k = 1.                                                                                                  D
Příklad 2.3. Užitím Laplaceovy věty spočtěme determinant \A\, kde A je matice řádu 4 (nad R) tvaru:
A
(l     1    3    4^
2     0    0    8
3     0    0    2
\4    4    7    5/
1. Výpočet provedeme rozvinutím podle 2. a 3. řádku (při praktickém výpočtu je zřejmě nejvýhodnější volit řádky, v nichž se vyskytuje pokud možno hodně nul). Pak:
\A\
0  0 0  0
2   0
3   0
1   4
4  5
3   4   -(-1)8 + 7  5    {■> ^
•(-1)10 +
2   0
3   0
2   8
3   2
0  8 0  2 1   3
4  7
1   4 4  5 1   3
4  7
-1)9 +
\ii
+
2   8
3   2 0  8 0  2
1   3
4  7 1   1 4  4
•(-1)10 + (-1)12 =
(-20) • (-5) = 100.
2. Spočtěme tentýž determinant rozvinutím podle 1. sloupce. Pak:
3 Algebra matic
43
\A\ = 1
0  0	8			1   3  4
0  0  2		•(-l)2+ 2-		0  0  2
4  7  5				4  7  5
	1   3  4			
	0  0  8		.(-1)5 = 0-2-	
	0	0  2		
(-l)3 + 3-
2 • 10 + 3 • 40 + 0 = 100.
1	3  4
0	0  8
4	7  5
{-iY
§3.   Algebra matic
V tomto paragrafu se nejprve vrátíme k maticím typu m/n (tj. obecně k obdélníkovým maticím) a ukážeme si některé algebraické struktury, které lze pomocí matic utvořit. Budeme předpokládat, že všechny matice jsou uvažovány nad pevným číselným tělesem T (nebude-li výslovně řečeno jinak).
Označení. Všude v dalším budeme symbolem Matmn(T) označovat množinu všech matic typu m/n nad pevným číselným tělesem T. Napíšeme-li tedy, že A E Matmn(T), pak to bude znamenat, že A je matice typu m/n nad tělesem T.
Definice. Nechť A = {a,ij),B = (bij) G Matmn(T), tET libovolné. Pak:
(1)  matice A + B = (cy) E Matmn(T) definovaná:
C-ij — Q>ij + Oij
pro i = 1,..., m, j = 1,..., n se nazývá součet matic A, B,
(2)  matice t ■ A = (d{j) G Matmn(T) definovaná:
d
v
t • o,ij
pro i = 1,..., ra, j = 1,..., n se nazývá součin čísla t s maticí A.
Vidíme, že součet matic je definován pouze pro matice stejného typu, přičemž pak sčítáme „odpovídající si prvky obou matic". Sčítání matic je zřejmě operací na množině Matmn(T). Podobně, při součinu čísla s maticí násobíme tímto číslem každý prvek dané matice. Součin čísla s maticí tedy můžeme chápat jako vnější operaci.
Věta 3.1.  (Matmn(T),+) je komutativní grupa.
44
Matice a determinanty
Důkaz. Z předchozí definice a ze známých vlastností obyčejného sčítání čísel plyne, že (Matmn(T),+) je pologrupa, která je komutativní. Lehce se ověří, že nulová matice 0mn je nulou, resp. pro libovolnou matici A = (ciij) G Matmn(T) je matice (—ßy) € Matmn(T) opačným prvkem k A. Označujeme (—ßy) = —A. Tedy (Matmn(T),+) je komutativní grupa.    D
Věta 3.2. Množina Matmn(T) je vektorový prostor nad T (vzhledem k operacím sčítání matic a součinu čísla s maticí), jehož dimenze je rovna m-n.
Důkaz. Podle předchozí věty je (Matmn(T), +) komutativní grupou. Dále, rozepsáním se lehce ověří platnost vztahů:
(1)  t-(A + B) = t-A + t-B,
(2)  (t + s) ■ A = t ■ A + s ■ A,
(3)  (t-s)-A = t-(s-A),
(4)  1 • A = A
pro lib. t, s e T a A, B G MatTOn(T). Tedy z definice vektorového prostoru plyne, že Matmn(T) je vektorový prostor nad T (roli vektorů hrají tedy matice typu m/n nad T).
Zbývá ukázat, že dimMatmn(T) = m-n, což provedeme tak, že zkonstruujeme bázi vektorového prostoru Matmn(T). Pro r = l,...,m, s = 1,... ,n označme symbolem Urs matici typu m/n, která má na r, s-tém místě (tj. v r-tém řádku a s-tém sloupci) jedničku a všude jinde samé nuly. Tedy:
TT        /     w           i     ^A              (l    pioi = r, j = s
Urs = (uij) typu m/n, kde Uij = <       ..
Dostáváme tak celkem m-n matic U\\,..., U\n, £%, • • •, t^n? ■ ■ ■ -, Um\,... ,Ur o nichž se rozepsáním lehce ukáže (proveďte si podrobně sami!), že jsou lineárně nezávislé a že generují celý prostor Matmn(T), tzn. jsou jeho bází.
D
Definice. Nechť A = (ay-) je matice typu m/n, B = (bij) je matice typu n/p (obě nad týmž tělesem T). Pak matice A- B = (c-ij) typu m/p, kde:
n
C-ij =  2-*i ^ik ' ok j,
k=l
pro i = l,...,m, j = l,...,p, se nazývá součin matic A,B (v tomto pořadí).
3 Algebra matic
45
Příklad 3.1. Nechť A, B jsou matice nad M tvaru:
A
1	2	-1	0
0	1	-1	-7
8	0	0	-5
B
(  3    2\
-4    1
1    0 V-2-3/
Pak:
A-B
resp. součin B ■ A není vůbec definován.
Poznámka. Při násobení dvou matic A, B zřejmě podstatně záleží na jejich pořadí. Z předchozího příkladu vidíme, že se může stát, že součin A ■ B je definován, kdežto součin B ■ A definován není. Ale i v případě, že oba součiny A- B a B ■ A jsou definovány a jsou stejného typu (tzn. A, B jsou čtvercové matice stejného typu), neznamená to, že A ■ B = B ■ A, jak je vidět z následujícího příkladu.
Příklad 3.2. Nechť n > 2 a A, B jsou čtvercové matice řádu n (nad T) tvaru:
A
(l    0    •••    0\
0   0   •••    0
\o o
B
/O   0   •••    0\ 1    0   •••    0
0/
\o o
0/
Pak přímým výpočtem zjistíme, že A ■ B = 0nra, kdežto B ■ A = B, což znamená, že A ■ B ^ B ■ A.
Vidíme tedy, že násobení matic obecně není komutativní. Na druhé straně, násobení matic je však asociativní a násobení matic je distributivní vzhledem ke sčítání matic (samozřejmě za předpokladu, že všechny použité součty a součiny matic jsou definovány), jak ukazují následující dvě věty.
Věta 3.3. Násobení matic je asociativní, tj. nechť matice A je typu m/n, B je typu n/p a C je typu p/q. Potom platí:
46
Matice a determinanty
A-{B ■ C) = {A-B)-C. Důkaz. Nechť platí předpoklady věty, přičemž A = (dij), B = (bij), C =
n
(cíj). Pak matice A • B = (dij) je typu m/p, přičemž dij =  X] o,íu • buj.
u=l
p Dále pak (A • B) • C = (fij) je matice typu m/q, kde fij = X)^m> ' cvj =
v-l p     n
X) X] aiy. ' buv • cvj i přičemž v posledním výrazu není třeba v součinu za
v=lu=l
sumačními znaky závorkovat, neboť se jedná o součin čísel (z T), pro který
platí asociativní zákon.
p Podobně, matice B • C = (gij) je typu n/q, kde gij = X^w ° cvj. Dále
v=l
pak A • (B • C) = (hij) je matice typu m/q, kde:
n                            n               p                            p     n
">ij =  2-*i ^iu ' Suj =  2~i ^iu '  2-*i "i" ' Cvj =  Z-/ 2-*i ^iu ' Ouv ' Cvj = J i j • u=l                       «=1          v=l                       v=lu=l
Dohromady tedy platí dokazovaná rovnost.                                              D
Věta 3.4. Násobení matic je distributivní vzhledem ke sčítání matic, tj.:
(1)  Nechť matice A je typu m/n, resp. B, C jsou typu n/p. Potom platí:
A-(B + C) = A-B + A-C.
(2)  Nechť matice F, G jsou typu m/n, resp. H je typu n/p. Potom platí:
(F + G)-H = F-H + G-H.
Důkaz. (1): Nechť A = (a^) je typu m/n, resp. B = (bij), C = (cíj) jsou typu n/p. Potom A • (B + C) = (dij) je matice typu m/p, přičemž
n
dij = X] aik • (bkj + ckj)- Dále, matice A- B + A- C = (fij) je matice typu
k=i m/p a platí:
n                           n                           n
fij =  Yl,aik' bkj + Yl,aik' ckj =  XI aik - (bkj + Ckj) = dij. k=l                      k=l                       k=l
3 Algebra matic
47
Dohromady tedy platí (1).
(2): Dokáže se analogickým způsobem jako (1).                                    D
Definice. Čtvercová matice řádu n (nad T) tvaru:
/l	0	0	••    0	°\
0	1	0	••    0	0
0	0	1	••    0	0
0	0	0	• •   1	0
\o	0	0	••    0	v
E„
(tj. matice mající v hlavní diagonále samé jedničky a všude jinde samé nuly) se nazývá jednotková matice (řádu n).
Věta 3.5. Množina všech čtvercových matic řádu n (nad T) s operacemi sčítání matic a násobení matic, tj. (Matnn(T), +, •), je okruhem s jedničkou. Tento okruh pro n > 2 není komutativní a obsahuje dělitele nuly.
Důkaz. Je zřejmé, že sčítání matic, resp. násobení matic jsou operace na množině Matnn(T). Z vět 3.1., 3.3. a 3.4. pak ihned plyne, že (Matnn(T), +, •) je okruh. Dále, pro libovolnou matici A G Matnn(T) zřejmě platí (ověřte si rozepsáním!), že:
En -A — A • Er,
A,
a tedy jednotková matice En je jedničkou okruhu (Matnn(T), +, •).
Z příkladu 3.2. pak plyne, že pro n > 2 tento okruh není komutativní a obsahuje dělitele nuly (nulou je zde zřejmě nulová matice řádu n, tzn.
0,
D
Poznamenejme, že okruh (Matnn(T), +, •), stručně též nazývaný „okruh matic", je jedním z nejjednodušších příkladů nekomutativního okruhu.
Věta 3.6. Nechť A = (a^) je matice typu m/n, B = (bij) je matice typu n/p. Pak platí:
(A ■ B)' = B' -A'
(tj. transponovaná matice k součinu matic je rovna součinu transponovaných matic v opačném pořadí).
48
Matice a determinanty
Důkaz. Matice (A • B)' = (cý) je typu p/m, přičemž c,j je prvek stojící
n
v matici A-B v j-tém řádku a i-tém sloupci, tzn. Cý- = ^(ijk'bki- Dále pak
fc=i
n                        n
matice B' ■ A' = (dij) je typu p /m, kde dý- = J] 6fei • ajk = J] ajfe • bki = cih
k-l                    k-l
a tedy platí dokazovaná rovnost.                                                               D
Věta 3.7. (Cauchyova věta) Necht A = (ay), i? = (bij) jsou čtvercové matice řádu n. Pak platí:
\A-B\ = \A\-\B\.
Důkaz. Uvažme matici H řádu 2n tvaru: (a\\    (ii2    • • •     a\n     '
H
«21      «22
dni     an2 -1        0 0        -1
ď2n
0
o
o o
o    o
&11      &12
&21      &22
o o
bin fon
V 0       0     •••     -1    bni   bn2    ■■■    bnnJ
Užitím Laplaceovy věty (a sice rozvinutím podle prvních n řádků) dostáváme:
\M\ = \A\.\B\.                                          (1)
Nyní ke každému z posledních n sloupců přičteme vhodnou kombinaci prvních n sloupců tak, aby na místě každého bij vznikla nula (přesněji řečeno: k (n + j)-tému sloupci přičteme fty-krát 1. sloupec + • • • + 6nj-krát n-tý sloupec, pro j = 1,..., n). Dostáváme tak matici:
K
(O-ll     «12
«21     «22
dni     (ín2
-1      0
0      -1
V o        o
a>ln     cll     c12
0>2n      C21      C22
Q>nn     Cnl      Cn2
0       0       0 0       0       0
-10      0
Cln\ C2n
Cnn
0
o
0/
3 Algebra matic
49
n
v níž Cij = au ■ bij H-------h ain ■ bnj = Y^aik • hj, Pr0 h 3 = !,■■■,n. Při
k=i tomto označení je tedy (cy) = A-B. Rozvinutím podle posledních n sloupců
matice K pak dostáváme:
\K\ = |A-S|-(-l)n-(-l)1+-+n+(n+1)+-+2n = \A-B\-{-lf-n-{n+1^ = \A-B\.
(2) Ale úpravy, pomocí nichž jsme z matice ií dostali matici K, nemění hodnotu determinantu (podle věty 2.5. (2) zformulované pro sloupce), a tedy \H\ = \K\, odkud pomocí (1) a (2) dostáváme:
\A\.\B\ = \A.B\, což je žádané tvrzení.                                                                                D
Definice. Čtvercová matice A se nazývá regulární matice (resp. singulární matice), je-li |^4| ^ 0 (resp. \A\ = 0).
Důsledek. Nechť A, B jsou čtvercové matice stejného řádu n. Pak platí: matice A- B je regulární <í=^   obě matice A í B jsou regulární.
Důkaz. Tvrzení plyne přímo z definice regulární matice a z Cauchyovy
věty.                                                                                                          D
Definice. Nechť A je čtvercová matice řádu n. Matice X s vlastností:
A ■ X = En A X ■ A = En                                  (3)
(pokud taková existuje) se nazývá inverzní matice k matici A a označuje se symbolem A~ľ.
Poznámka. Z (3) především plyne, že inverzní matice (pokud existuje) musí být také čtvercová a řádu n. Dále, vzhledem k tomu, že (Matran(T), •) je pologrupa s jedničkou En (viz věta 3.5.) a pojem inverzní matice je totožný s pojmem inverzního prvku v této pologrupě, může k matici A existovat nejvýše jedna inverzní matice (podle V.l.3., kap. II.) a označení A~ľ je tedy korektní. Následující věta a její důsledek nám pak udává nutnou a dostatečnou podmínku existence inverzní matice a vzorec pro její výpočet.
50
Matice a determinanty
Věta 3.8. Nechť A = (ay) je čtvercová matice řádu n. Potom platí: k maticí A existuje matice inverzní <í=^  A je regulární matice.
Důkaz. „=£-": Nechť k A existuje inverzní matice A~ľ. Pak platí En = A ■ A'1, odkud 1 = \En\ = \A-A~1\ = |^4| -1>1—1|. Pak ale je \A\ ^ 0, a tedy A je regulární matice.
„<=u: Nechť A je regulární matice, tzn. \A\ ^ 0. Označme:
A*
(A1X    A2l
A\2      A22
\Aln   A:
2n
Ani\
An2 Ann J
matici, v níž na i,j-tém. místě je Aß (pozor na pořadí indexů!), tzn. algebraický doplněk prvku stojícího na j,i-tém místě v původní matici A. Poznamenejme, že matice A* se nazývá adjungovaná matice k matici A. Nyní dokážeme, že matice X = Ar • A* je inverzní maticí k matici A.
n
Nechť A ■ X = (c{j), tzn. Cý- = m • Yl dik ' ^jfe- Potom ale:
1  '   fc=i
n
-pro i = j je ca = t4t • J2aik • Aik = At ■ \A\ = 1 (užitím důsledku
Laplaceovy věty),
\A\      Z^"í/c    ^iH,  —   \A\ k=l
-pro i + j je Cij = Ar • E°ifc • 4j* = pr • 0 = 0 (výraz  Eaik • Ajk je
ái=1                                                                                                        fc=l
roven nule, neboť podle důsledku Laplaceovy věty se jedná o determinant
matice, v níž i-tý a j-tý řádek jsou stejné). Vidíme tedy, že A ■ X = (cý-) = En.
Analogickou úvahou se zjistí, že X- A = En, tzn. dohromady dostáváme, že X = A-1, a tedy k matici A existuje matice inverzní.                          n
Důsledek. Nechť A je regulární matice. Pak A-1 = ( m ) ■ A*.
Důkaz. Tvrzení plyne ihned z 2. části důkazu předchozí věty.                 D
Některé jednoduché základní vlastnosti inverzních matic, resp. regulárních matic nám popisují následující dvě věty.
Věta 3.9. Nechť A, B jsou regulární matice řádu n. Pak platí: (1) (A"1)"1 = A,
3 Algebra matic
51
(2)  (A ■ B)-1 = B-1 ■ A'1,
(3)   \A    I = JÄ\>
(4)  (A')-1 = (A-1)'.
Důkaz. (1) a (2) plynou z věty 1.4., kap. IL, a z věty 3.8., uvědomíme-li si, že (Matnn(T), •) je pologrupa s jedničkou.
(3): Zřejmě A ■ A-1 = En, odkud podle Caucliyovy věty je \A\ ■ \A_1\ = \En\ = l, tzn. I^"1!^.
(4): Podle věty 3.6. je (A'1)' ■ A' = (A ■ A'1)' = E'n = En a analogicky též A' ■ (^4-1)' = En, tzn. podle (3) je {A~1)' inverzní maticí k matici A', neboli platí (4).                                                                                         □
Věta 3.10. Nechť Matnn(T) značí množinu všech regulárních matic řádu n (nad T). Pak (Matnn(T), •) je grupa, která je pro n > 2 nekomutativní.
Důkaz. Zřejmě En G Matnn(T). Podle důsledku Caucliyovy věty a podle vět 3.3. a 3.8. ihned dostáváme, že (Matnn(T), •) je grupa. Dále nechť n > 2. Vezměme matice A, B řádu n tvaru:
A
í1 ľ 0   1 0   0	0   • 0   • 1  •	•     0 •     0 •     0	0 0
0   0 \0   0	0   • 0   •	•   1 •    0	0 1/
	/O   0   •••
	0   0   •••
=	0   0   •••
	0   1    •••
	\1   0   •••
0	0	1\
0	1	0
1	0	0
0	0	0
0	0	0/
Potom zřejmě A, B jsou regulární, tj. A, B G Matnn(T) a platí A-B ^ B-A (ověřte si výpočtem!). Tedy uvažovaná grupa není komutativní.              n
Multiplikativní grupa regulárních matic řádu n (n > 2) je dalším poměrně jednoduchým příkladem nekomutativní grupy.
Poznámka. Všimněme si, že z věty 3.8. bezprostředně plyne, že při praktickém ověřování, zda matice X je inverzní maticí k A, stačí ověřovat pouze jednu z rovností (3), tzn. rovností:
A ■ X = En, X-A = En,
52
Matice a determinanty
poněvadž druhá rovnost je již vynucena. (Je-li např. A ■ X = En, pak A je regulární a existuje matice A-1. Pak vynásobením výchozího vztahu zleva maticí A-1 a zprava maticí A dostáváme: A-1 ■ (A ■ X) ■ A = A-1 ■ En • A, tzn. po úpravě: X ■ A = En.)
§4.   Hodnost matice
matici typu m/n nad číselným
\0"tnl     0to2     ' ' '      Oirnn)
kde a-ij E T. Jak již bylo dříve řečeno, řádky matice A můžeme chápat jako vektory z vektorového prostoru Tn. Potom vektory - řádky matice A generují v Tn jistý podprostor W a my se v dalším budeme zajímat o jeho dimenzi.
Podobně, sloupce matice A lze chápat též jako vektory - tentokrát z vektorového prostoru Tm, přičemž tyto vektory - sloupce matice A generují v Tm jistý podprostor H. Je samozřejmé, že Tn a Tm jsou obecně dva zcela rozdílné vektorové prostory a totéž platí i o podprostorech W a H. Přesto však ukážeme, že dimenze obou těchto podprostoru musí být stejné, tzn. dimiy = dimií.
Definice. Nechť A = (ajj) je matice typu m/n nad T. Pak dimenze vektorového podprostoru v Tn generovaného řádky matice A se nazývá hodnost matice A a označuje se symbolem h(A).
Věta 4.1. Hodnost matice je rovna maximálnímu počtu jejích lineárně nezávislých řádků.
Důkaz. Tvrzení plyne ihned z definice hodnosti matice, definice dimenze, definice báze a z věty 4.1., kap. I.                                                             D
Poznámka. Z předchozího je zřejmé, že hodnost matice A je rovna nule, právě když A je nulovou maticí. Je-li tedy matice A nenulová, pak její hodnost je rovna některému přirozenému číslu.
V tomto paragrafu bude A tělesem T, tzn.:
(ay-) značit
A
í au
0,21
Ol2 Ö22
4 Hodnost matice
53
Další možnost vyjádření hodnosti matice nám ukáže následující věta. Poznamenejme k ní ještě to, že pojem minoru řádu k matice A lze zřejmě stejným způsobem jako v §2 definovat i pro libovolnou (obecně obdélníkovou) matici A typu m/n za předpokladu, že k < min{m, n}. Je-li však m 7^ n, nelze pak již samozřejmě hovořit o doplňku tohoto minoru.
Věta 4.2. Nechť A je nenulová matice typu m/n. Pak hodnost matice A je rovna maximálnímu z řádů nenulových minoru matice A.
Důkaz. Nechť A = (ojj) je nenulová matice typu m/n. Pak zřejmě existuje minor \M\ řádu k > 0 tak, že \M\ ^ 0 a všechny minory řádu většího než k (pokud vůbec existují) jsou rovny nule. Bez újmy na obecnosti lze předpokládat, že submatice M je určena prvními k řádky a prvními k sloupci matice A. Chceme nyní dokázat, že h(A) = k. Ale platí:
a) Prvních k řádků matice A je lineárně nezávislých. V opačném případě by byly i řádky submatice M lineárně závislé a podle věty 3.2., kap. L, resp. věty 2.4. by byl \M\ = 0, což je spor.
ß) r-tý řádek (k < r < m) matice A je lineární kombinací prvních k řádků. Nechť tedy k < r < m a nechť 1 < j' < n libovolné. Utvořme matici:
I au    ■ ■ ■    difc    a\j >
Dj=       '■'■■'■        '■
Ofci    • • •     o,kk    ak j
tak, že matici M „ovroubíme" odpovídajícími prvky r-tého řádku a j-tého sloupce matice A. Determinant \Dj\ je zřejmě roven nule, neboť pro j > k je \Dj\ minorem řádu k + 1, resp. pro j < k obsahuje matice D j dva stejné sloupce. Rozviňme nyní \Dj\ podle posledního sloupce. Dostáváme:
0 = \Dj| = aij ■ Li + ü2j ■ L'2 H------+ a^j ■ Lk + arj ■ \M\,
kde Li (i = l,...,k) jsou algebraické doplňky prvků posledního sloupce (uvědomme si, že Li nezávisí na j). Poněvadž \M\ ^ 0, můžeme psát:
ari = ~ \M\ ' aij — ' " — rjvTf ' akj
pro každé j = 1,2,..., n, což však znamená, že r-tý řádek je lineární kombinací prvních k řádků.
54
Matice a determinanty
Z a) a ß) plyne, že maximálni počet lineárně nezávislých řádků matice A je roven číslu A, a tedy podle věty 4.1. je /i(^4) = fe.                              D
Důsledek. Transponováním matice se její hodnost nezmění, tj. h(A) = h{Ä).
Důkaz. Je-li A nulová matice, pak A' je též nulová matice a tvrzení platí. Nechť tedy A je nenulová matice a nechť h(A) = k. Pak podle předchozí věty existuje v A nenulový minor řádu k a všechny minory řádu většího než k jsou rovny nule. Uvažme nyní transponovanou matici A'. Vzhledem k tomu, že transponováním se nemění hodnoty minorů (plyne z věty 2.1.), existuje tedy i v matici A' nenulový minor řádu k a všechny minory řádu většího než k y A1 jsou rovny nule. To ale znamená (opět podle předchozí věty), že h(A') = k, a tedy h(A) = h(A').                                                 D
Věta 4.3. Hodnost matice je rovna maximálnímu počtu jejích lineárně nezávislých sloupců.
Důkaz. Podle předchozího důsledku a podle věty 4.1. je hodnost matice A rovna maximálnímu počtu lineárně nezávislých řádků transponované matice A', tj. maximálnímu počtu lineárně nezávislých sloupců původní matice A.                                                                                                              D
Z předchozích tvrzení již vyplývá to, o čem jsme hovořili na začátku paragrafu, a sice je-li matice A matice typu m/n, pak dimenze podprostoru (v Tn) generovaného řádky matice A je rovna dimenzi podprostoru (v Tm) generovaného sloupci matice A.
V dalším si nejprve všimneme případu, kdy matice A je čtvercová.
Věta 4.4. Nechť A je čtvercová matice řádu n. Pak následující výroky jsou ekvivalentní:
(1)  matice A je regulární,
(2)  h(A) = n,
(3)  řádky matice A jsou lineárně nezávislé,
(4)  sloupce matice A jsou lineárně nezávisle.
Důkaz. „(1) ^> (2)": Nechť A je regulární, tzn. \A\ / 0. Pak z věty 4.2. plyne, že h(A) = n.
„(2) => (3)": Plyne z věty 4.1.
4 Hodnost matice
55
„(3) =^ (4)": Plyne z vět 4.1. a 4.3.
„(4) =» (1)": Plyne z vět 4.3. a 4.2.                                                      D
Předchozí věta nám samozřejmě zároveň podává i charakterizaci singulární matice. Provedením obměn všech implikací totiž dostáváme, že ekvivalentní jsou též výroky:
(1)  matice A je singulární,
(2)  h(A) < n,
(3)  řádky matice A jsou lineárně závislé,
(4)  sloupce matice A jsou lineárně závislé.
Věta 4.5. Nechť A je matice typu m/n. Pak platí:
(1)  je-li B matice typu n/p, pak:
h(A-B)<h(A)   a  h(A-B)<h(B),
(2)  je-li R (resp. S) regulární čtvercová matice řádu n (resp. řádu m), pak:
h(A-R) = h(A)   a  h(S-A) = h(A).
Důkaz. (1): Nechť A = (ay-), B = (bij). Označme A ■ B = (cy) a dále označme:
(Oil       •••       «In       Cn       •••       Cip\ "ml     ' ' '      ďmn     C-ml     ' ' '      C-mpJ
Matici D můžeme chápat jakožto matici A, k níž bylo přidáno jistých p sloupců. Ale poněvadž:
n
Cij = Yliaik' bkj = bij ■ au + &2j • öj2 + • • • + bnj ■ a{n
k=l
pro pevné j a i = 1,..., ra, vidíme, že přidané sloupce jsou vždy lineární kombinací prvních n sloupců, a tedy je h(D) = h(A).
Matici D však můžeme též chápat jako matici A ■ B, k níž jsme (zleva) přidali jistých n sloupců, tzn. pak zřejmě platí h(A-B) < h(D). Dohromady dostáváme, že h(A ■ B) < h(A).
Analogickým způsobem (přidáním všech řádků matice A ■ B k řádkům matice B) se dokáže, že h(A ■ B) < h(B).
56
Matice a determinanty
(2): Podle právě dokázané části (1) je h(A ■ R) < h(A). Ale zřejmě A = {A-R)-R-1, a tedy opět podle (1) je h(A) = /i((A-Ä)-Ä_1) < h(A-R). Dohromady pak dostáváme, že h(A ■ R) = h(A).
Druhá část tvrzení (2) se dokáže analogicky.                                        D
§5.   Další vlastnosti a užití matic
V první části tohoto paragrafu si odvodíme jednoduché metody výpočtu hodnosti matice, resp. výpočtu inverzní matice a ukážeme si některé možnosti aplikací těchto postupů při řešení úloh o vektorových prostorech.
Definice. Nechť A je matice typu m/n nad tělesem T. Pak každá z následujících úprav matice A se nazývá elementárni řádková úprava matice A:
(1)  libovolná záměna pořadí řádků,
(2)  vynásobení libovolného řádku nenulovým číslem z T,
(3)  k jednomu řádku přičtení jiného řádku vynásobeného libovolným číslem z T.
Poznámka. Řekli jsme si, že řádky matice A budeme chápat jako vektory z vektorového prostoru Tn. V tomto smyslu pak elementární řádkové úpravy matice A chápeme jako výše popsané manipulace s vektory z Tn.
Řádky matice A generují ve vektorovém prostoru Tn jistý podprostor W. Důležité je (jak ukáže následující věta), že provedení elementární řádkové úpravy neovlivní tento podprostor W.
Věta 5.1. Nechť A je matice typu m/n nad T a nechť matice B vznikne z matice A provedením elementární řádkové úpravy. Pak podprostor (ve vektorovém prostoru Tn) generovaný řádky matice A je roven podprostoru generovanému řádky matice B.
Důkaz. Řádky matice A (chápané jako vektory ve vektorovém prostoru Tn) označme u\,..., um. Podle věty 3.1. (2), kap. L, je podprostor generovaný řádky matice A roven množině všech lineárních kombinací těchto řádků, tzn.:
[«i,..., um] =L(u1,...,um).
Podprostor [m,..., um] se nezmění, jestliže:
5 Další vlastnosti a užití matic
57
a) zaměníme libovolně pořadí řádků matice A, neboť zřejmě L(ui,... ,um) = L(uí17 ..., «im), kde («i,... ,im) je libovolné pořadí indexů 1,..., m,
ß) vynásobíme i-tý řádek matice A nenulovým číslem t G T, neboť L(«i,..., «i,..., um) = L{u\,..., t ■ Ui,..., «m), jak se lehce ověří rozepsáním,
7) přičteme k i-tému řádku matice A t-násobek j-tého řádku (i 7^ j), neboť L(ui,..., iíj, ..., um) = L(ui,..., u-i + t ■ Uj,..., um), jak se opět ověří rozepsáním.
Ukázali jsme tedy, že podprostor [m,..., um] v Tn se nezmění provedením libovolné elementární řádkové úpravy matice A.                                n
Důsledek. Provedení libovolné elementární řádkové úpravy matice A nezmění hodnost matice A.
Důkaz. Tvrzení plyne bezprostředně z definice hodnosti matice a z předchozí věty.                                                                                                 D
Z předchozích úvah vyplývá, že při praktickém zjišťování hodnosti dané matice A bude zřejmě výhodné pomocí elementárních řádkových úprav (které nemění hodnost) převést matici A na nějaký „jednoduchý tvar", z něhož již hodnost okamžitě určíme. Tento „jednoduchý tvar" popisuje následující definice.
Definice. Nechť A je matice typu m/n. Řekneme, že A je matice ve schodovitém tvaru, jestliže v matici A každý nenulový řádek začíná větším počtem nul než předchozí řádek.
Poznámka. Rozebereme-li si podrobněji předchozí definici, pak vidíme, že:
1.  Libovolná matice typu 1/n, tj. matice sestávající pouze z jednoho řádku, je vždy ve schodovitém tvaru.
2.  Je-li matice A ve schodovitém tvaru, pak případné nulové řádky musí být v matici A umístěny „dole". Specielně, nulová matice 0mra je zřejmě zvláštním případem matice ve schodovitém tvaru.
3.  Je-li nenulová matice A ve schodovitém tvaru, pak svým tvarem skutečně odpovídá tomuto názvu, neboť nuly v matici A tvoří jakési „schody". Přitom první řádek může, ale nemusí začínat nulou (resp. nulami), druhý řádek však již musí začínat alespoň jednou nulou, třetí řádek musí začí-
58
Matice a determinanty
nat alespoň dvěma nulami, atd. Schematicky znázorněna vypadá nenulová matice A ve schodovitém tvaru takto:
A
( 0 • • 0 aln  ■■■■
0......0 Cl2j2
Vo
kde 1 < ji < h <
pro i = 1,2,..., k.
0 akjk
ain\
0-2n
•  0
0/
< jk < ni resp. 1 < k < minim,1».}, resp. a^. ^ 0
Věta 5.2. Každou matici lze konečným počtem elementárnich řádkových úprav převést na schodovitý tvar.
Důkaz. Nechť A = (a^) je matice typu m/n. Je-li A nulová matice, pak je již ve schodovitém tvaru a jsme hotovi. Nechť tedy A je nenulová matice. Důkaz nyní provedeme matematickou indukcí vzhledem km (tj. vzhledem k počtu řádků matice ^4).
a) Pro m = 1 je matice A již ve schodovitém tvaru a tvrzení platí.
ß) Předpokládejme, že každou matici o 1,2,...,m řádcích lze konečným počtem elementárních řádkových úprav převést na schodovitý tvar. Nechť nyní A je matice o (m + 1) řádcích. Nechť s-tý sloupec je prvním nenulovým sloupcem matice A. Pak případnou výměnou dvou řádků dostaneme z matice A matici B = (bij), která má v 1. řádku a s-tém sloupci
nenulový prvek b\s ^ 0. Nyní k «-tému řádku matice B přičteme ( — f^\-násobek prvního řádku, postupně pro i = 2, ...,m + 1. Dostaneme tak matici C = (čij), která má v prvních s sloupcích samé nuly s výjimkou prvku cis ť^ 0. Aplikujeme-li nyní na matici sestávající z posledních m řádků matice C indukční předpoklad, dostáváme tvrzení věty (rozmyslete si podrobně proč!).                                                                                    D
Věta 5.3. Hodnost matice ve schodovitém tvaru je rovna počtu jejich nenulových řádků.
Důkaz. Nechť A je matice typu m/n ve schodovitém tvaru. Je-li A nulová matice, pak h(A) = 0 a tvrzení platí.
5 Další vlastnosti a užití matic
59
Nechť tedy A je nenulová matice ve schodovitém tvaru, která obsahuje k nenulových řádků. Těchto k řádků musí být lineárně nezávislých (plyne rozepsáním přímo z definice matice ve schodovitém tvaru) a všechny ostatní řádky (pokud existují) jsou nulové. To znamená, že maximální počet lineárně nezávislých řádků matice A je roven k, a tedy podle věty 4.1. je h{A) = k.                                                                                                  D
Pomocí posledních dvou vět a důsledku věty 5.1. můžeme nyní poměrně jednoduše zjišťovat hodnost dané matice A. Matici A nejprve převedeme pomocí elementárních řádkových úprav na schodovitý tvar (algoritmus je popsán v důkazu věty 5.2., který byl konstruktivní), v němž pak jen spočítáme počet nenulových řádků. Celý postup si ukážeme na následujícím příkladu.
Příklad 5.1. Určete hodnost matice A (nad tělesem M) tvaru:
A
0     110    11^
1     2    0    0-1-2 -113    0    0-4
2     1-3    0-1    2/
Řešení: Nejprve záměnou 1. a 2. řádku dosáhneme toho, že v levém horním rohu matice bude nenulový prvek. Potom vynásobením 1. řádku vhodným číslem (zde reálným) a jeho přičtením k 2., 3., resp. 4. řádku dosáhneme toho, že pod tímto nenulovým prvkem v 1. sloupci budou samé nuly. Analogickým způsobem pak upravujeme submatici sestávající z 2., 3. a 4. řádku, atd., až nakonec dostaneme matici ve schodovitém tvaru.
Poznamenejme, že po úpravě budeme mezi jednotlivými maticemi psát symbol —>. Z úsporných důvodů provádíme obvykle vždy několik elementárních řádkových úprav typu (3) najednou. Tedy pak:
A^
1  2 0 0-1-2^ 0 110 11 113 0 0-4
2  1-3 0-1 2/ ^12 0 0-1-2^
0 110 11
0 0 0 0-4-9
\0 0 0 0 4 9/
->■
->■
1 2 0 0-l-2\ 0 110 11 0 3 3 0-1-6 0-3-3 0 1 6 J 1 2 0 0-l-2\ 0 110 11 0 0 0 0-4-9 0 0 0 0 0 0/
60
Matice a determinanty
Vidíme, že poslední matice (která je ve schodovitém tvaru) má 3 nenulové řádky, a tedy h(Á) = 3.
Předchozí metodu (která je samozřejmě jen jednou z mnoha známých metod určování hodnosti matice) můžeme s výhodou použít při řešení celé řady úloh o vektorovém prostoru Tn. Chceme-li například v Tn zjistit dimenzi a bázi nějakého podprostoru W generovaného konečným počtem zadaných vektorů, pak tyto vektory napíšeme jako řádky do matice, kterou elementárními řádkovými úpravami převedeme na schodovitý tvar. Nenulové řádky takto získané matice ve schodovitém tvaru jsou pak bází podprostoru W (jak plyne z vět 5.1. a 5.3.). Podobným způsobem lze postupovat například při zjišťování dimenze a báze součtu dvou podprostoru v Tn, atd.
Příklad 5.2. Ve vektorovém prostoru M5 jsou dány podprostory W\ = [«i,tt2,u3] &W2 = [vi,v2,v3], kde ui = (1,-1,2,4,0), u2 = (0,0,1,3,2), «3 = (1, -1,1,1, -2), resp. «i = (0,1,0, 2, -2), v2 = (-1, 2,1, 3, -2), «3 = (—1,0,1, —1, 2). Určete dimenzi a bázi podprostoru W\ + W2.
Řešení: Vektory m, u2, «3, V\,v2, v% generují W\+W2 (proč?), tzn. W\ + W2 = [ui,U2,U3,Vi,V2,Vz]. Stačí tedy napsat uvedených šest vektorů do řádků matice a tuto matici převést elementárními řádkovými úpravami na schodovitý tvar, Tedy:
/   1 -1    2    4    0\
0    0    13    2
1-1     1     1-2
0     10    2-2
-1     2     1    3-2
V-l    0    1-1    2/
1
/l-l    2    4    0\ 0    10    2-2 0    0    13    2 0    0-1-3 -2 7 -2 3    2/ /l-l 0    1
0    1    3 \0 -1    3 2    4    0\ 0    10    2-2 0    0    13    2 0    0    0    0    0 0    0    0-4-6 V0    0    0-4-6/
/l-l    2    4    0\ 0    10    2-2 0    0    13    2 0    0-1-3 -2
0    0    3
\0    0    3
2    4    0\ 0    2-2
0    0     13    2
0    0    0    4    6
0    0    0    0    0
\o   o   o   o    0/
o
0/
Tedy dim(Wi + W2) = 4, přičemž bázi W\ + W2 tvoří například nenulové řádky poslední matice, tj. vektory w\ = (1, —1,2,4,0), tü2 = (0,1,0, 2, —2), «>3 = (0,0,1,3,2), ii>4 = (0,0,0,4,6).
5 Další vlastnosti a užití matic
61
Jednou z dalších základních úloh lineární algebry je hledání inverzní matice k dané čtvercové regulární matici A řádu n. Z důsledku věty 3.8. víme, že:
A      - \A\    A '
kde A* je adjungovaná matice k matici A, a podle tohoto vzorce můžeme též inverzní matici A-1 přímo spočítat. Je však vidět, že pro větší n bude výpočet příliš pracný (je třeba vypočítat jeden determinant matice řádu n a dále n2 determinantů matic řádu n — 1). Proto si nyní odvodíme jednu poměrně jednoduchou a pro ruční výpočet celkem vhodnou metodu nalezení inverzní matice.
Věta 5.4. Nechť A je regulární matice řádu n nad T. Pak platí:
(1)  matici A lze konečným počtem elementárních řádkových úprav převést na jednotkovou maticí En,
(2)  provedení řádkové elementární úpravy matice A je ekvivalentní vynásobení matice A zleva jistou regulární maticí řádu n.
Důkaz. (1): Podle předpokladu je h(A) = n, a tedy (podle vět 5.2. a 5.3.) matici A lze konečným počtem elementárních řádkových úprav převést na tvar, v němž v hlavní diagonále jsou nenulové prvky a pod ní jsou samé nuly. Vynásobením jednotlivých řádků vhodnými nenulovými čísly z T dostaneme v hlavní diagonále samé jedničky a pak konečným počtem elementárních řádkových úprav typu (3) nad diagonálou samé nuly. Tedy dostaneme jednotkovou matici En.
(2): Rozepsáním se bezprostředně ověří, že:
a) Záměna dvou řádků (í-tého a j-tého) matice A je ekvivalentní vynásobení matice A zleva maticí F, kde F je matice vzniklá z jednotkové matice En (řádu n) záměnou i-tého a j-tého řádku. Zřejmě ale |.F| = —1, tzn. matice F je regulární.
ß) Vynásobení i-tého řádku matice A nenulovým číslem í G T je ekvivalentní vynásobení matice A zleva maticí G, kde G je matice vzniklá z jednotkové matice En vynásobením i-tého řádku číslem t. Ale \G\ = t ^ 0, tzn. matice G je regulární.
7) Přičtení í-násobku j-tého řádku k i-tému řádku matice A (kde i 7^ j at € T libovolný) je ekvivalentní vynásobení matice A zleva maticí H, kde H je matice vzniklá z jednotkové matice En přičtením í-násobku j-tého řádku k «-tému řádku. Podle věty 2.5. (1) však \H\ = 1, tzn. H je regulární matice.                                                                                                      D
62
Matice a determinanty
Z předchozí věty už nyní přímo plyne metoda výpočtu inverzní matice k matici A. Spočívá v tom, že elementárními řádkovými úpravami převedeme matici A na jednotkovou matici En a tytéž elementární řádkové úpravy paralelně aplikujeme na jednotkovou matici En, která nám nakonec přejde v hledanou inverzní matici A-1, neboť podle předchozí věty existují regulární matice R\,..., Rs takové, že:
(Rs.....-R2 • -Ri) • A = En,
což znamená, že (Rs.....R% ■ R\) = A-1. Současně však:
{Rs
«2 • «i) • En = (Rs
Ri ■ «i),
odkud tedy jako výsledek dostáváme matici (Rs.....R2 ■ Ri) = A-1.
Prakticky provádíme výpočet tak, že obě matice, tj. A a En, napíšeme vedle sebe a oddělíme svislou čarou. Pak provádíme zvolené elementární řádkové úpravy, a to současně pro obě matice najednou. Výsledné matice budeme mezi sebou oddělovat symbolem ~.
Příklad 5.3. K dané regulární matici A (nad tělesem M) nalezněte inverzní matici A-1. Přitom:
A
Řešení:
Hledanou inverzní maticí je tedy matice:
A-
5 Další vlastnosti a užití matic
63
V našich předchozích úvahách o vektorových prostorech jsme doposud vystačili vždy s jednou pevnou bází daného vektorového prostoru, vzhledem k níž jsme vyjadřovali například souřadnice vektoru, atd. Na závěr tohoto paragrafu budeme nyní vyšetřovat vzájemný vztah mezi dvěma bázemi daného vektorového prostoru, resp. vztah mezi souřadnicemi téhož vektoru v různých bázích daného prostoru. Ukážeme si, že v obou případech lze s výhodou použít maticového způsobu zápisu, čímž se formálně značně zjednoduší naše vyjadřování.
Definice. Nechť V je vektorový prostor nad T a nechť:
	U\,...,Un			(1)
Vl,...,Vn				(2)
jsou dvě jeho báze. Nechť dále je:				
V\  = on • Ui + a2l • V-2 + ■		• • + anl • un		
V2 = Ö12 • Ui + a22 • «2 + •		■■ + an2-un		(3)
V n = Cbln ■Ui+CL2n-U2 + ■		• • + CLnn ■ Un		
Pak matice A tvaru:				
/öll     Ö12     •••		ain\		
A =	0.21      a22      • • •	ď2n		
\flnl     an2     ■ ■ ■      ďnnj
se nazývá matice přechodu od báze (1) k bází (2).
Poznámka. 1. Rozebereme-li si předchozí definici, pak vidíme, že matici A přechodu od jedné báze ke druhé bázi prostoru V zkonstruujeme tak, že j-tý vektor druhé báze vyjádříme jako lineární kombinaci vektorů první báze a její koeficienty pak zapíšeme do j-tého sloupce matice A (pro j = 1,2,..., n). Přitom je samozřejmé, že jak pořadí obou bází, tak i pořadí vektorů v těchto bázích je podstatné a nelze je nijak zaměňovat.
2. Matice přechodu od jedné báze k druhé bázi prostoru V je vždy regulární (plyne z (3) a z lineární nezávislosti vektorů druhé báze).
64
Matice a determinanty
Příklad 5.4. Ve vektorovém prostoru M3 mějme dány dvě báze:
«1 = (1,1,1),    «2 = (1,1,0),    u3 = (1,0,0),                  (4)
«i = (2,3,2),    «2 = (3,1,2),    v3 = (4,3,3).                   (5)
Lehce se ověří, že platí:
Vi = 2 • U\ +U2 - Us, V2 = 2 • U\ - U2 + 2 • 113,
v3 = 3 • u\ + u3, resp.
U\ = vi+v2 -v3,
u2 = -4 • «i - 5 • v2 + 6 • «3,
t*3 = -3 • ví - 3 • v2 + 4 • «3,
odkud již plyne, že matice A přechodu od báze (4) k bázi (5), resp. matice B přechodu od báze (5) k bázi (4) mají tvar:
/  2    2    3\                      /   1 -4 -3
A= i    1-1    0    ,  resp. 5=1    1-5-3
\-l    2    1/                      \-l    6    4
Vidíme tedy, že především je ^4 7^ B, ale na druhé straně se výpočtem lehce zjistí, ze A ■ B = E3, & tedy B = .A-1. Tedy, zaměněním pořadí bází (4) a (5) jsme dostali matici přechodu, která je k původní matici přechodu inverzní. Následující věta ukáže, že tomu tak musí být vždycky.
Věta 5.5. Nechť (1), resp. (2) jsou dvě báze vektorového prostoru V nad T. Nechť A je matice přechodu od báze (1) k bázi (2). Potom A~ľ je maticí přechodu od báze (2) k bázi (1).
Důkaz. Nechť A = (a^). Pak podle definice matice přechodu od (1) k (2) je:
n
vj = Ysakj -ukl  j = l,...,n. k=i
Nechť dále B = (bij) je matice přechodu od báze (2) k bázi (1). Pak je:
n
Uk= T,brk-vr,   k = l,...,n.
r=l
5 Další vlastnosti a užití matic
65
Po dosazení dostáváme:
J3
n             n                       n    /  n                 \
= E °fcj • Y,brk-vr = E    E Kk ■ akj ) • vr,  j = 1,...,n.
k=l        r=\                 r=\ \k=l             J
Podle věty 4.2., kap. L, se každý vektor z V dá napsat pouze jediným způsobem jako lineární kombinace vektorů dané báze. Zřejmě však je:
v j = 0 • vi H-------HO- Vj-i + 1 ■ Vj + 0 ■ Vj+i H-------\-0-vn,  j = 1,..., n.
Porovnáním posledních dvou rovností pak dostáváme:
A,                 ÍO    pror^j
Z^ brk ■ 0,kj = \ .
jt=i                  [1    pror = j
což maticově vyjádřeno říká, že B ■ A = En, odkud již plyne, že B = A-1.
D
Poznámka. Z definice matice přechodu plyne, že zadáním bází (1) a (2) je jednoznačně určena matice přechodu od (1) k (2), tj. jistá regulární matice A. Podobně však, máme-li dánu bázi (1) a nějakou regulární matici A, pak je těmito dvěma údaji (pomocí vztahů (3)) jednoznačně určena báze (2) taková, že matice A je maticí přechodu od (1) k (2). Stejně tak, zadáním báze (2) a regulární matice A je jednoznačně určena báze (1) taková, že A je maticí přechodu od (1) k (2). Bázi (1) můžeme v tomto případě zkonstruovat např. užitím věty 5.5. (tzn. ze vztahů (3), pomocí báze (2) a inverzní matice A-1).
Zcela na závěr nyní ještě odvodíme, jaký je vzájemný vztah mezi souřadnicemi jednoho vektoru ve dvou různých bázích prostoru V. Je samozřejmé, že při změně báze se změní i souřadnice vektoru vzhledem k bázi. Poněvadž mnohdy pro jednoduchost výpočtů je vhodná speciální volba báze, je důležité znát pravidla, podle nichž se mění souřadnice vektoru při změně báze. Touto otázkou, nazývanou transformace souřadnic vektoru, se nyní budeme zabývat.
Nechť tedy (1) a (2) jsou dvě báze vektorového prostoru V a nechť A = (öy) je matice přechodu od báze (1) k bázi (2). Dále nechť w G V je pevný vektor, přičemž w má v bázi (1), resp. v bázi (2), souřadnice:
^i\                (y\
,   resp.
\.%n I
66
Matice a determinanty
To ale znamená, že platí:
w = x\ ■ u\ H-------h xn ■ un                                 (6)
w = yi ■ vi H-------Vyn-Vn                                  (7)
Dosadíme-li do (7) vztahy (3), dostáváme:
n                     n           n                        n    / n               \
™ = Ey? • «j = Ey? • Eafc? • «* = E ( Ea*y • %■  • wfe-     (8)
j=l                    j=l       Ai=l                       fc=l Vj=l               /
Nyní však porovnáním pravých stran (6) a (8) dostáváme:
aľi-iti H------\-xn-un = (aiiyiH------\-alnyn)-ut-\------h(aniŽ/iH------^annyn)-uni
odkud z jednoznačnosti obou vyjádření plyne rovnost odpovídajících si koeficientů, tj.:
x\ = anyi H-------h a\nyn
x2 = ö2iyi H-------1- a2nyn
xn = a-niVi H-------1- annyn
což však můžeme zapsat v maticovém tvaru:
Tímto jsme tedy dostali souřadnice vektoru w v bázi (I) vyjádřené pomocí souřadnic téhož vektoru v bázi (2). Kdybychom chtěli naopak vyjádřit souřadnice vektoru w v bázi (2) pomocí jeho souřadnic v bázi (1), pak stačí obě strany poslední maticové rovnice vynásobit zleva maticí A~ľ (která existuje, neboť matice A je regulární). Dostaneme pak:
í Ví
\Vn
X\
x\
A-
Kapitola 3
Soustavy lineárních rovnic
§1.   Gaussova metoda řešení soustav lineárních rovnic
Se soustavami lineárních rovnic a jejich řešením je možné se v určitých jednoduchých, resp. speciálních případech setkat již na střední škole. V tomto paragrafu ukážeme jednu z mnoha známých metod praktického řešení obecných soustav lineárních rovnic. Výklad je veden tak, že je možno tento paragraf studovat nezávisle na jeho zařazení do III. kapitoly (z předchozí látky se používá pouze pojem matice, matice ve schodovitém tvaru, elementární řádková úprava matice a některé jednoduché vlastnosti vektorového prostoru Tn) a je pak možno jej použít při řešení konkrétních příkladů vztahujících se k problematice probírané dříve.
Definice. Nechť T je číselné těleso. Pak soustava rovnic:
auxi + ayiX'1 H-------V a\nxn = b\
a<i\X\ + CL22X2 H----------h a,2nXn = h
:                               W
akixi + ak2X2 H-------h aknxn = bk
kde üij G T, 6j G T, se nazývá soustava k lineárních rovníc o n neznámych (nad tělesem T).
Řešení soustavy (1) je každá uspořádaná n-tice (íi,...,ín) prvků z T taková, že po dosazení t{ za X{ (i = 1,... ,n) všechny rovnice v (1) přejdou v identity, tj. platí:
67
Soustavy lineárních rovnic
aníi + 012^2 021Í1 + «22^2
+ 0\vtn — b\ + ďžntn = O2
(Iklh + dk2Í2 H-----+ (Ikntn = H
Poznámka. 1. Pro lepší vyjadřování zaveďme ještě následující označení a názvy: číslo a-ij v soustavě (1) budeme nazývat koeficient (v i-té rovnici u j-té neznámě), resp. číslo b-i budeme nazývat absolutní člen i-té rovnice. Dále, matice:
/■
A
on
Ö21
«12 «22
\a>kl     ak2
Oln\ (l2n
(ihn)
resp. A
fan
0,21
\a*ki
a\2
0,22 Ok2
0\n 02n
b2
Okn     hj
se nazývá matice soustavy (1), resp. rozšířená matice soustavy (1). Abychom opticky odlišili absolutní členy od koeficientů soustavy (1), budeme obvykle v rozšířené matici soustavy A psát před sloupcem absolutních členů svislou čáru.
2.  Každé řešení soustavy (1) je, jak bylo v definici řečeno, uspořádaná n-tice prvků z tělesa T, tzn. může být považováno za vektor z vektorového prostoru Tn. Množinu všech řešení soustavy (1) lze pak chápat jako jistou podmnožinu prostoru Tn (která může být případně i prázdná, nemá-li soustava (1) žádné řešení).
3.  Označíme-li:
Xl
X
resp. B
\&n )
(bi
\h
pak můžeme zřejmě soustavu (1) zapsat krátce maticovou rovnicí:
A-X = B.
Tento maticový způsob zápisu soustav lineárních rovnic nám pak v dalším často umožní přehledné a stručné vyjadřování.
Definice. Soustava lineárních rovnic se nazývá řešitelná soustava (resp. neřešitelná soustava), jestliže existuje alespoň jedno (resp. neexistuje žádné) její řešení.
1 Gaussova metoda řešení soustav lineárních rovnic                                69
Dvě soustavy lineárních rovnic o n neznámých (nad týmž tělesem T) se nazývají ekvivalentní soustavy, jestliže množiny jejich řešení si jsou rovny. Jakákoliv úprava dané soustavy lineárních rovnic, po níž vznikne soustava ekvivalentní, se nazývá ekvivalentní úprava dané soustavy lineárních rovnic.
Uvědomme si, že „řešit" danou soustavu lineárních rovnic znamená buď najít všechna její řešení, nebo zjistit, že je neřešitelná. Pokud jde o počet řešení soustavy lineárních rovnic, nastane zřejmě vždycky právě jeden z následujících tří případů:
(1)  soustava nemá žádné řešení (tj. je neřešitelná),
(2)  soustava má jediné řešení,
(3)  soustava má více než jedno řešení (ukážeme, že nekonečně mnoho).
Věta 1.1. Nechť je dána soustava lineárních rovnic (1). Pak následující úpravy jsou ekvivalentními úpravami soustavy (1):
(1)  libovolná záměna pořadi rovnic,
(2)  vynásobení libovolné rovníce nenulovým číslem z T,
(3)  k jedné rovnici přičtení jiné rovníce vynásobené libovolným číslem
(4)  vypuštění z (1) rovnice, která je lineárni kombinací ostatních rovnic.
Důkaz. (1), (2): Zřejmé.
(3): Vzhledem k (1) můžeme předpokládat, že k první rovnici soustavy (1) přičteme druhou rovnici vynásobenou číslem p G T. Dostáváme tak soustavu (2) tvaru:
anxi H-------h alnxn + p ■ (a21xľ -\-------h a2nxn) = h + p ■ b2
a2\X\ H-------Y a2nxn = h.
:                          t2)
(ik\x\ H-------h aknxn = bk
Nyní, je-li (t\,..., tn) řešením soustavy (1), pak zřejmě je (íi,..., tn) řešením soustavy (2).
Naopak, nechť (íi,... ,tn) je řešením soustavy (2). Pak po dosazení do první rovnice soustavy (2) dostáváme:
aiih H-------h a\ntn +p- (a2ih H-------h a2ntn) = h+p-b2.
Podle předpokladu však 021^1 H------\-a2ntn = b2, tzn. po dosazení a odečtení
dostáváme:
70
Soustavy lineárních rovnic
duti + • • • + ainUi — bi-,
odkud již ihned plyne, že (íi,...,ín) je řešením soustavy (1) (poněvadž druhá až k-tá rovnice v (2) a v (1) jsou stejné).
Dokázali jsme tedy, že soustavy (1) a (2) jsou ekvivalentní.
(4): Vzhledem k (1) předpokládejme, že v soustavě (1) je první rovnice lineární kombinací ostatních rovnic, tj. soustava (1) je tvaru:
P2 ■ (a,2ixi H--------h a2nXn) H--------h Pk ■ {akixi H--------h aknxn) = P2 ■ b2 H--------h Pk ■ h
Cl2lXi H---------h Cl2nXn = h
a-kixi H--------Y aknxn = bk
(3) kde p2, ■ ■ ■ ,Pk £ T. Uvažme dále soustavu (4), která vznikne ze soustavy
(3)  vypuštěním první rovnice, tj.:
a-iix\ H--------h a2nxn = b2
;                                        (4)
a-kixi H--------h aknxn = bk
Nyní je však bezprostředně vidět, že (ti,..., tn) je řešením (3), právě když (íi,..., tn) je řešením (4), neboli že soustavy (3) a (4) jsou ekvivalentní.    D
Při provádění ekvivalentních úprav dané soustavy lineárních rovnic není nutné stále opisovat celou soustavu i s neznámými, ale zřejmě stačí pracovat s její rozšířenou maticí soustavy. Uvědomme si, že pak provádění úprav (1) -
(4)  na dané soustavě je ekvivalentní provádění elementárních řádkových úprav na její rozšířené matici soustavy doplněnému o vypouštění řádků matice, které jsou lineárními kombinacemi ostatních řádků.
Na této úvaze je pak založena metoda řešení soustav lineárních rovnic, kterou nyní popíšeme. Její princip spočívá v tom, že danou soustavu lineárních rovnic převedeme na ekvivalentní, ale „jednodušší" soustavu, jejíž řešení (která jsou zároveň i řešeními původní soustavy) bude možno víceméně ihned vypsat.
Gaussova metoda řešení soustavy lineárních rovnic
Nechť je dána soustava lineárních rovnic (1). Pak ekvivalentními úpravami z věty 1.1. převedeme soustavu (1) na soustavu (ľ), jejíž rozšířená matice soustavy je ve schodovitém tvaru, přičemž vždy vypustíme každou
1 Gaussova metoda řešení soustav lineárních rovnic
71
rovnici, která je lineární kombinací ostatních rovnic (z předchozí úvahy a z věty 5.2., kap. IL, plyne, že toho lze po konečném počtu kroků vždy dosáhnout). Nechť soustava (ľ) má s rovnic. Potom:
1.  Vyskytne-li se v (ľ) rovnice, v níž všechny koeficienty jsou nulové a absolutní člen je různý od nuly, pak zřejmě soustava (ľ), a tedy i soustava (1) je neřešitelná.
V opačném případě je soustava (1) řešitelná, a sice:
2.  Má jediné řešení, je-li s = n. Toto řešení lehce spočítáme postupným dosazováním ze soustavy (ľ).
3.  Má nekonečně mnoho řešení, je-li s < n. V tomto případě (opět postupným dosazováním z (ľ)) vyjádříme jistých s neznámých pomocí zbývajících (n — s) neznámých (které se nazývají volné neznámé). Dosazujeme-li za volné neznámé libovolně čísla z T (kterých je nekonečně mnoho), dostáváme pak jednotlivá konkrétní řešení soustavy (1) (kterých je tedy také nekonečně mnoho).
Ilustrujme si nyní Gaussovu metodu řešení soustavy lineárních rovnic na několika typických příkladech.
Příklad 1.1. Řešte soustavu lineárních rovnic (nad ff):
X\ + 2íC2  -     X3 +     X4 =      1
—2a; i — 3a;2 + 2xs — 3x^ =    2
X\ +     X2  -     X3 + 2X4 = -1 X2            + 2^4 =      3
Řešení: Napíšeme rozšířenou matici této soustavy a pomocí elementárních řádkových úprav ji převedeme na schodovitý tvar. Navíc vypouštíme řádky, které jsou lineární kombinací ostatních řádků (pokud se takové vyskytnou) .
(   1    2-1     1
-2 -3    2 -3
11-12
V  0     1     0    2
1\
2
-1 3/
/l    2-1     1	!\
0    10-1	4
0-101	-2
\0    1    0    2	3/
1	2	-1	1	1\
0	1	0	-1	4
0	0	0	0	2
0	0	0	3	-1/
->■
72
Soustavy lineárních rovnic
I když poslední matice ještě není formálně upravena na schodovitý tvar, vidíme, že daná soustava je neřešitelná, neboť ve třetím řádku poslední matice, tj. ve třetí rovnici poslední soustavy jsou všechny koeficienty u neznámých nulové, kdežto absolutní člen je od nuly různý.
Příklad 1.2. Řešte soustavu lineárních rovnic (nad M):
x\ - 2a;2 +   x3 = -1
X\             +     X3 =       1
2x\ — 5x2 + 4^3 =    0 2x\ — 3^2            = —4
Řešení:
/l -2    1
1    0    1
2-5    4
\2 -3    0
-1\
1
0 -4/
/l -2     1    -1\
0    2    0       2
0-12       2
\0     1-2    -2/
->■
1	-2	1	-1
0	1	0	1
0	0	2	3
Tedy z poslední rovnice: 22:3 = 3, neboli x% = |. Dále z předposlední rovnice dostáváme přímo: i2 = lä konečně z první rovnice: íci = — 1 + 2x2 — ^3, tj. po dosazení: x\ = — ^.
Daná soustava má tedy jediné řešení (—5,1, §)•
Příklad 1.3. Řešte soustavu lineárních rovnic (nad M):
íci - 2aí2 +   x3 x\ — 2x2 —   %3
X\  — 2rE2  + 3íC3
Řešení:
1-211 1-2-1 1 1-231
1	-2	1	1	2
0	0	-2	0	-4
0	0	2	0	4
2:4 = 2 2:4 = —2 2:4 =    6
->■
1 -2     1 0    0    1
Tedy dostáváme soustavu, v níž budou dvě volné neznámé (zřejmě kterékoliv dvě z neznámých x\, 2:2, x±, nikoliv však neznámá 2:3). Zvolíme-li za volné neznámé např. neznámé xi-, 2:4, pak lehce vypočteme: 2:3 = 2,
X\ = 22Í2 — X4.
Tedy (položíme-li 2:2 = t, X4 = s) daná soustava má nekonečně mnoho řešení tvaru (2t — s, t, 2, s), kde t, s jsou libovolná reálná čísla.
2 Základní vlastnosti soustav lineárních rovnic
73
Poznámka. Jestliže má soustava lineárních rovnic nekonečně mnoho řešení, pak z Gaussovy metody vyplývá pouze to, kolik neznámých volíme za volné neznámé, nikoliv však, které neznámé to jsou. Může se totiž stát, že některou neznámou nesmíme volit za volnou neznámou (např. neznámou x$ v příkladu 1.3.) nebo naopak, některou neznámou musíme volit za volnou neznámou (např. v soustavě dvou rovnic o čtyřech neznámých tvaru:
X\            + 2^3 + X4 = 1
X3  — X4 = 0
musíme zřejmě za jednu ze dvou volných neznámých zvolit neznámou x^)-
§2.   Základní vlastnosti soustav lineárních rovnic
Mějme dánu soustavu k lineárních rovnic o n neznámých nad T, tj. soustavu:
a\\X\ + ayiX2 H-------V a\nxn
(1<2\X\ + (122X2 H---------h Ü2nXn
akixi + ak2X2 H-------h aknxn
kde A, resp. A bude značit matici této soustavy, resp. rozšířenou matici této soustavy. Zajímáme-li se o hodnost matic A a, A, pak ihned vidíme, že zřejmě mohou dva případy: buď je h(A) = h(A), nebo je h(A) = h(A) + 1. Přitom h(Ä) = h(A) nastane právě tehdy, když sloupec absolutních členů je lineární kombinací sloupců matice A (rozmyslete si podrobně proč).
Nyní si uvedeme důležitou větu, která nám umožní rozhodnout o řešitelnosti či neřešitelnosti soustavy lineárních rovnic, aniž bychom hledali její řešení.
Věta 2.1. (Frobeniova věta, resp. Kronecker-Capelliho věta)  Soustava lineárních rovnic (nad T) je řešitelná, právě když hodnost matice této soustavy je rovna hodností rozšířené matice této soustavy.
Důkaz. Uvažujme soustavu (1), kde A, resp. A značí matici soustavy (1), resp. rozšířenou matici soustavy (1).
„=^": Nechť (1) je řešitelná soustava a nechť (t\,...,tn) je řešení (1). Pak platí:
&2
h
(1)
74
Soustavy lineárních rovnic
aníi + 012^2 021Í1 + «22^2
+ (ílntn — b\ + 0>2ntn = °2
(Iklh + dk2h H------+ (Ikntn = h
neboli:
62
h
«21
+ Í2
/°12\
«22
+ t.
íain\
0-2n
\hj            \akij           \ak2J                   \aknj
což znamená, že sloupec absolutních členů je lineární kombinací sloupců matice A, a tedy h(A) = h(A).
„<=u: Nechť h(A) = h(A). Potom (jak bylo řečeno v úvodu tohoto paragrafu) sloupec absolutních členů je lineární kombinací sloupců matice A. Označíme-li koeficienty v této lineární kombinaci ti,...,tn, pak stejným ob-
ratem jako v f. části důkazu dostaneme, že (t\, (1). Tedy soustava (1) je řešitelná.
,tn) je řešením soustavy
D
Frobeniova věta je jednoduchým a elegantním kriteriem řešitelnosti soustav lineárních rovnic, ovšem v případě řešitelné soustavy neříká nic o počtu řešení ani o tom, jak všechna řešení vypadají. Takové úvahy budou nyní obsahem zbytku tohoto paragrafu. Nejprve vyšetříme specielní případ soustavy (1), kdy k = n (tzn. rovnic je tolik jako neznámých) a navíc matice soustavy je regulární.
Věta 2.2. (Cramerovo pravidlo) Nechť je dána soustava n lineárních rovnic o n neznámých, jejíž matice soustavy A je regulární. Pak soustava má jediné řešení (xi,..., xn), přičemž:
_ \Aj\       ■ _ 1   0
kde Aj je matice vzniklá z matice A nahrazením j-tého sloupce sloupcem absolutních členů.
Důkaz. Uvažme soustavu (1), v níž k = n, a kterou tedy můžeme maticově zapsat ve tvaru:
X\
A-X = B,   kde X
B
(2)
\Xr.
2 Základní vlastnosti soustav lineárních rovnic
75
Matice A je však podle předpokladu regulární, tzn. existuje inverzní matice A~l. Potom vynásobením rovnosti (2) zleva maticí A~l dostaneme A-1 ■ (A ■ X) = A'1 ■ B, odkud:
X = A'1 -B,
(3)
což je tedy řešení dané soustavy, které (jak plyne z odvození) je jediné.
Pokusme se nyní nalezené řešení explicitně vyjádřit. Podle důsledku věty 3.8., kap. IL, je:
(An    A21    ■■■    Anl\
A-1 - -L A     - \A\
Al3    A2j
■    A,
nj
\A\n    A2n    ■ ■ ■     AnnJ kde Aij je algebraický doplněk prvku öy v matici A. Z (3) pak dostáváme:

i 1-4.1
^ • (Axj ■b1 + A2j-b2 + --- + Anj ■ bn) :
«11     • • •      °1 J-l     h     öl,j+l     • • •      öln Q>nl     ' ' '      ^n,j—l     on     ön,j+l     ' ' '      ^nn
užitím důsledku Laplaceovy věty. Tedy skutečně x j = Wŕ pro j = 1,...
1-4.1
,n.
D
Nyní vyřešíme obecný případ, tzn. popíšeme řešení obecné soustavy k lineárních rovnic o n neznámých, o níž víme, že je řešitelná.
Věta 2.3. (Obecné Cramerovo pravidlo) Nechť (1) je řešitelná soustava lineárních rovnic a nechť h(A) = r. Dále:
-  Vybereme z matice A r lineárně nezávislých řádků a dále uvažujeme pouze ty rovníce, jejichž koeficienty se nacházejí ve vybraných řádcích.
-  Ponecháme na levé straně takových r neznámých, že matice sestavená z koeficientů u těchto neznámých je regulární. Ostatní neznámé (pokud existují) převedeme na pravé strany a nazveme je volné neznámé.
Potom, zvolíme-lí za volné neznámé libovolně pevné prvky z T a vypočitáme-li Cramerovym pravidlem zbývajici neznámé, dostaneme tímto způsobem právě všechna řešení soustavy (1).
76
Soustavy lineárních rovnic
Důkaz. Podle předpokladu je h(A) = h(A) = r. Vzhledem k větě 1.1. (1) můžeme předpokládat, že prvních r řádků matice A je lineárně nezávislých a ostatní řádky jsou lineární kombinací prvních r řádků. Potom podle věty 1.1. (4) je soustava (1) ekvivalentní soustavě:
cinxi H-------\-ciinxn = b\
;                                        (4)
Oíf\X\ ~\~           \   (ífnXji  —  Of
Nyní mohou nastat dva případy:
I. Je-li r = n, pak \A\ ^ 0 a podle věty 2.2. existuje jediné řešení soustavy (4), a tedy i soustavy (1), které spočteme Cramerovým pravidlem, tzn. tvrzení platí.
II.  Nechť r < n a nechť pro přehlednost zápisu je nenulový minor řádu r matice soustavy (4) tvořen prvními r sloupci. Převedením zbývajících neznámých na pravé strany a dosazením x j = Cj, kde Cj GT,j = r+1,..., n dostáváme:
aiixi + • • • + aifXf = b\ — aijr+icr+i — • • • — a\ncn
\                                                             (5)
Na soustavu (5) můžeme použít Cramerovo pravidlo, čímž dostaneme jediné řešení (ci,..., cr) soustavy (5). Potom však (ci,..., cr, cr+i,..., cn) je zřejmě řešením (4), tzn. i řešením (1).
Naopak, musíme ukázat, že každé řešení soustavy (1) lze obdržet popsaným způsobem. Nechť tedy {d\,... ,án) je libovolné řešení soustavy (1). Pak (di,... ,dn) je řešením soustavy (4). Dosadíme-li dj za Xj pro j = r + 1,..., n, pak (d\,..., dr) je řešením soustavy (5), a musí tedy být rovno tomu jedinému řešení, které dostaneme použitím Cramerova pravidla. Tedy řešení (di,..., dn) jsme dostali postupem uvedeným ve větě.    D
Důsledek. Nechť je dána soustava lineárních rovnic (1). Potom:
(1)  soustava (1) má jediné řešení <í=^ h(A) = h(A) = n,
(2)  soustava (1) má nekonečně mnoho řešení *<=> h(Á) = h(A) < n.
Důkaz. Obě tvrzení plynou přímo z Probeniovy věty a z důkazu obecného Cramerova pravidla, podle něhož má soustava (1) jediné řešení, právě když neexistuje žádná volná neznámá, tzn. právě když h(A) = n.                     D
3 Homogenní soustavy lineárních rovnic
77
Poznámka. Poznamenejme, že řešení soustav lineárních rovnic pomocí Cramerova pravidla, resp. obecného Cramerova pravidla má spíše teoretický význam, protože je numericky poměrně náročné (např. rozhodně náročnější než Gaussova metoda popsaná v §1). Na druhé straně nám ale Cramerovo pravidlo umožňuje přímý výpočet jednotlivých neznámých, což může být někdy výhodné (např. jsme-li v situaci, kdy nás zajímá pouze hodnota jedné neznámé).
§3.   Homogenní soustavy lineárních rovnic
Definice. Soustava:
a\\X\ + ayiX2 H-------h a\nxn = 0
\                                 (1)
akixi + ak2x2 -\-------h aknxn = 0
kde (lij E T, se nazývá homogenní soustava k lineárních rovnic o n neznámých nad T.
Poznámka. Matici soustavy (1), resp. rozšířenou matici soustavy (1) budeme opět značit A, resp. A. Protože matice A vznikla z matice A přidáním sloupce skládajícího se ze samých nul, je zřejmě h(A) = h(A), a tedy (podle Frobeniovy věty) homogenní soustava (1) je vždy řešitelná.
Evidentně, uspořádaná n-tice (0,0,..., 0) je řešením soustavy (1). Toto řešení se nazývá nulové řešení. Vidíme tedy, že homogenní soustava má buď jediné řešení (a sice nulové), anebo má nekonečně mnoho řešení (tj. kromě nulového i nenulová řešení).
Kriterium pro oba případy udává následující věta.
Věta 3.1. Nechť (1) je homogenní soustava s maticí soustavy A. Potom:
(1)  soustava (1) má pouze nulové řešení -<=^ h(A) = n,
(2)  soustava (1) má též nenulová řešení *<=> h(A) < n.
Důkaz. Tvrzení plyne přímo z důsledku věty 2.3., neboť v (1) je h(A) =
h(Ä).                                                                                                         D
Poznámka. Z předchozí věty a z věty 4.4., kap. IL, plyne, že ve specielním případě, kdy počet rovnic je roven počtu neznámých (tj. k = n), má homogenní soustava pouze nulové řešení (resp. má též nenulová řešení), právě když |^| + 0 (resp. \A\ = 0).
78
Soustavy lineárních rovnic
Jak již bylo dříve řečeno, každé řešení soustavy lineárních rovnic o n neznámých nad T je možno považovat za vektor z vektorového prostoru Tn. Množina W všech řešení této soustavy je pak podmnožinou v Tra, která v případě nehomogenní soustavy zřejmě není nikdy podprostorem v Tn (neboť zcela jistě neobsahuje nulový vektor). V případě homogenních soustav je však situace jiná, jak ukazuje následující věta.
Věta 3.2. Množina W všech řešení homogenní soustavy (1) je podprostorem ve vektorovém prostoru Tn a platí: dim TV = n — h(A).
Důkaz. I. Dokážeme, že W je podprostor v Tn. Zřejmě je (0,0,..., 0) G W, tzn. W ^ 0. Dále, nechť (ci,..., cn), (d\,..., dn) G W, t,s G T libovolné,
n                           n
tzn. je: ^ aijcj = 0> S aí?4? = 0 Pro « = 1, • • •, A. Pak ale:
n                                                    n                          n
J^ aij(t ■ Cj + s ■ dj) = i • X) a-ijCj + s ■ ^2 aijdj =t-0 + s-0 = 0
j=l                                               3=1-                      3=1-
pro i = 1,..., k. To znamená, že í • (ci,..., cn) + <s • (e?i,..., dn) G W, a tedy W je podprostor v Tra.
II. Dokážeme, že dimVF = n — r, kde r = h(Ä). Zřejmě musí být 0 < r < n. Je-li r = 0, pak W = Tn, resp. je-li r = n, pak TV = {(0,0,..., 0)}, a v obou případech je dim TV = n — r.
Předpokládejme tedy, že 1 < r < n — 1. Protože /i(-A) = r, lze v matici ^4 soustavy (1) najít nenulový minor řádu r. Bez újmy na obecnosti můžeme předpokládat, že:
^0.
Podle obecného Cranierova pravidla je pak W rovno množině všech řešení soustavy:
(ill	«12      •	■    air
«21	«22      •	■      a>2r
ari	ar2    ■	' *„
a\ix\ + ayixi -\-----+ a\rxr + air+ixr+i -\-------h a\nxn = 0
ar\X\ + ar2X2 + • • • + arrxr + ar r+ia;r+i + • • • + arnxn = 0
(2)
v níž za neznámé av+i,... ,xn volíme libovolně jisté prvky z T.
Označme i«i,..., wn-r následující řešení soustavy (2), a tedy i soustavy (1):
3 Homogenní soustavy lineárních rovnic
79
w\ = (cil,       ■■■,cir,       1,0,0, ...,0,0)
W2 = (C21,        ...,C2r,        0,1,0,... ,0,0)
1Vn—r = [fin—r,l i • • • i Cn—r,r i U, U, U, . . . , U, 1J
a ukážeme, že tvoří bázi podprostoru W.
a) Vektory w\,... ,wn-r jsou zřejmě lineárně nezávislé (rozmyslete si podrobně proč).
ß) Nechť u = (tíi,..., un) £ W libovolný, tzn. u je řešením soustavy (1). Uvažme vektor w = ur+\ • w\ + • • • + un • wn-r. Zřejmě je w G W a platí w = (yi,...,yr,ur_|_i,...,un), kde yi,...,yr jsou nějaká čísla z T. Vidíme, že vektory u & w mají posledních (n — r) složek shodných a oba jsou z W, tzn. oba jsou řešeními (2). Pak ovšem podle obecného Cramerova pravidla musí být y\ = u\, ..., yr = ur, odkud plyne, že u = w, tzn. vektor u je lineární kombinací vektorů wi,... ,wn-r, které tedy generují podprostor W. Dohromady dostáváme, že dimW = n — r = n — h(Ä).                      D
Poznámka. 1. Na základě předchozí věty jsme u homogenní soustavy oprávněni hovořit o podprostoru všech řešení místo o množině všech řešení. Dále je dobré si uvědomit, že číslo n — h(Ä) udává počet volných neznámých, a tedy dimenze podprostoru řešení dané homogenní soustavy je rovna počtu volných neznámých v této soustavě.
2. Při praktickém hledání báze podprostoru řešení W je nejvýhodnější postupovat tak, že si nejprve obecně vyjádříme řešení dané soustavy, potom (n — r) volných neznámých zvolíme (n — r) lineárně nezávislými způsoby a spočítáme vektory báze W. Je zřejmé, že bází W je nekonečně mnoho, přičemž početně nejjednodušší volbou bude volba provedená v důkazu předchozí věty (tj. volba vždy jedné jedničky a ostatních nul).
Příklad 3.1. Nalezněte dvě báze podprostoru řešení W homogenní soustavy lineárních rovnic (nad M):
%1 + %2 + %3 — %4 =   0 X3 + X4 =   0
Řešení: Soustavu zřejmě není nutné upravovat, volné neznámé budou dvě, např. x<i a x±, přičemž pak je x% = —x^ x\ = —x^ + 2x^. Obecné řešení soustavy je tedy tvaru (—t + 2s, ť, —s, s), kde ť, s G M.
Volíme-li např. t = 1, s = 0, resp. t = 0, s = 1, dostáváme bázi podprostoru řešení W ve tvaru (—1,1,0,0), (2,0, —1,1).
80
Soustavy lineárních rovnic
Podobně, volíme-li např. t = 1, s = 1, resp. t = — 1, s = \f7, (uvědomme si, že se jedná o dvě lineárně nezávislé volby!), dostáváme bázi podprostoru řešení W ve tvaru (1,1, -1,1), (1 + 2^2", -1, -y/2,y/2).
Předchozí věta v podstatě říká, že homogenní soustavou lineárních rovnic o n neznámých je určen jistý podprostor vektorového prostoru Tn. Toto tvrzení lze však také obrátit, jak ukazuje následující věta.
Věta 3.3. Nechť W je libovolný podprostor vektorového prostoru Tn. Pak existuje homogenní soustava lineárních rovníc (o n neznámých, nad T), jejíž množina řešení je rovna právě W.
Důkaz. Je-li W = {(0,..., 0)}, resp. W = Tn, pak věta zřejmě platí (hledanou soustavou je pak např. soustava s maticí soustavy En, resp. 0nn). Nechť tedy {(0,..., 0)} C W C Tn a nechť vektory:
Wl  = (lun, W-Í2, •••, Win) Wk  =  (Wkl, Wk2,  ..., Wkn)
tvoří bázi podprostoru W. Uvažme následující homogenní soustavu:
w\\x\ + W12X2 -\-------h vjlnxn = 0
i                                (3)
Wkix-í + wk2x2 H-------h wknxn = 0
Hodnost matice soustavy (3) je rovna A, neboť její řádky jsou lineárně nezávislé. Označme písmenem U podprostor řešení soustavy (3). Podle věty 3.2. je pak dimř/ = n - k (> 0). Nechť:
Ui = («n,        «12,        •-., «ln       ),
Iťn—k = \U"n—k,l i ^n—k,2 i ■ ■ ■ i ^"n—k,nj
je pevná báze podprostoru U. Uvažme další homogenní soustavu:
UuXi +      1*12^2 H-------h        U\nXn = 0
i                          (4)
Un-k,\Xl + Un-k,2X2 H--------1" Un-k,nXn = 0
3 Homogenní soustavy lineárních rovnic
81
o níž dokážeme, zeje hledanou soustavou, tzn. označíme-li podprostor řešení soustavy (4) jako W, musíme dokázat, že W = W.
Ale Wj je řešením soustavy (4) (což plyne z toho, že u\,..., wn-A; Jsou řešeními soustavy (3)) pro j = l,...,/c, a tedy w\,... ,Wk € W, odkud dostáváme, že W = L(wi,..., Wk) C W.
Dále, hodnost matice soustavy (4) je zřejmě n — k, tzn. podle věty 3.2. je pak dim W = n — (n — k) = k = dim W.
Dohromady je tedy W C W A dim VF = dim VF, odkud podle věty 4.5. (2), kap. L, dostáváme, žeW = W.                                                         D
Poznámka. Je třeba si uvědomit, že homogenní soustava, jejíž existenci předchozí věta zaručuje, není zřejmě určena jednoznačně. Dále, obratů uvedených v důkazu předchozí věty se používá při řešení konkrétních příkladů, a je proto nutné je znát.
Příklad 3.2. Nalezněte soustavu lineárních rovnic (nad R), jejíž množina řešení je rovna podprostoru W vektorového prostoru R4, kde W je generován vektory:
ti>i = (l,2,l,l),   ttf2 = (0,1,-1,1),   ™3 = (1,3,0,2).
Řešení: Nejprve si napíšeme soustavu (3) (přitom není nutné z generátorů W předem vybrat bázi W', neboť eventuelní nadbytečné rovnice v (3) během výpočtu stejně vypadnou), pak najdeme bázi jejího podprostoru řešení U a nakonec pak složky vektorů báze U budou vystupovat jako koeficienty v hledané soustavě (4).
Nejprve tedy řešíme soustavu:
X\ + 2X2 + %3 +     X4 =   0
X2  - X3 +    X4 =   0
X\ + 3íC2           + 2rE4 =   0
1    2 0    1
1   1 -1   1
1     2	1	1	0
0     1	-1	1	0
1    3	0	2	0
0^			
oj	)		
->■
odkud dostáváme X2 = X3 — X4, x\ = —3xz + X4, tzn. báze podprostoru řešení této soustavy je například u\ = (—3,1,1,0), 1*2 = (1, —1,0,1). Hledaná soustava lineárních rovnic je pak například:
—3a; 1 + X2 + £3           =0
X\  — X2           + X4 =   0
82
Soustavy lineárních rovnic
Na závěr celé kapitoly se vrátíme ještě k obecným soustavám lineárních rovnic (nad T) a budeme se snažit říci něco více o množině řešení takové soustavy. Hlavní význam následujících úvah a tvrzení se však ukáže a využije později v geometrii.
Definice. Nechť je dána soustava lineárních rovnic nad T:
a\\X\ + a\2X2 H-------h a\nxn = b\
i                                     (5)
ak\x\ + ak2x2 H-------h aknxn = bk
Pak homogenní soustava lineárních rovnic s týmiž koeficienty u neznámých, tj.:
anxi + ai23;2 H-----+ ainxn = 0
;                                 (6)
ak\x\ + ak2x2 H-------h aknxn = 0
se nazývá zhomogenízovaná soustava k soustavě (5).
Věta 3.4. Nechť je dána soustava lineárních rovnic (5). Pak platí:
(1)  součet libovolného řešení soustavy (5) s libovolným řešením k ní zho-mogenizované soustavy je řešením soustavy (5),
(2)  rozdíl libovolných dvou řešení soustavy (5) je řešením k ní zhomoge-nizované soustavy.
Důkaz. (1): Nechť u = (ui,...,un) je řešení soustavy (5) a nechť v' = (v[,...,v'n) je řešení k ní zhomogenizované soustavy (6), tzn. platí:
n                                          n
Y^ciijUj = bi,  resp. Y,aijv'j = ° pro i = 1,..., k. Pak u + v' = (u\ +v[,...,un + v'n) a platí:
n                                    n                     n
Ysaijiuj + v'j) =  Ysaijuj + Y,aijv'j =bi + 0 = bi j=l                                j=l                 j=l
pro i = 1,..., A, a tedy u + v' je řešením soustavy (5).
(2): Nechť u = (ui,..., un), resp. v = (i>i,..., vn) jsou dvě řešení soustavy (5), tzn. platí:
n                                 n
Yjaijuj = bi,   resp. Yjaijvj = bi
3 Homogenní soustavy lineárních rovnic
83
pro i = 1,..., k. Pak u — v = (u\ — ví,..., un — vn) a platí:
n                                n                   n
j-1                            j-1               j=l
pro i = 1,..., k, a tedy m — v je řešením zhomogenizované soustavy (6).    D
Věta 3.5. Nechť (5) je řešitelná soustava lineárních rovnic. Pak všechna řešení soustavy (5) obdržíme přičtením všech řešení zhomogenizované soustavy (6) k jednomu pevnému řešení soustavy (5).
Důkaz. Označme M množinu všech řešení soustavy (5). Podle předpokladu je M ^ 0. Nechť «o G M je pevné řešení soustavy (5). Označme dále:
M = {uq + v'\v' je řešení (6)}.
Dokážeme, že M = M.
„C": Nechť m G M je libovolné řešení soustavy (5). Podle věty 3.4. (2) je u — Uq řešením zhomogenizované soustavy (6). Ale pak je: u = Uo + (u — «o) e M.
„D": Plyne ihned z věty 3.4. (1).                                                           D
Kapitola 4
Euklidovské vektorové prostory
§1.   Skalární součin, velikost a odchylka vektorů
Při našich dosavadních úvahách o vektorových prostorech jsme pomocí operací sčítání vektorů a násobení čísla s vektorem vyšetřovali pojmy jako byla lineární závislost a nezávislost vektorů, generovatelnost, souřadnice vektoru, atd. Prozatím jsme však neměli možnost ve vektorových prostorech „měřit", tzn. zjišťovat a porovnávat délky vektorů, resp. odchylky (tj. velikosti úhlů), což jsou pojmy, které hrají podstatnou roli např. v geometrii. Jejich definice jsou založeny na pojmu skalárního součinu, který nyní zavedeme. Omezíme se přitom však pouze na vektorové prostory nad tělesem reálných čísel.
Úmluva. Všude v dalším v této kapitole budeme vektorovým prostorem rozumět reálný vektorový prostor, tj. (konečnědimenzionální) vektorový prostor nad tělesem M reálných čísel.
Definice. Nechť V je vektorový prostor (nad M) a nechť každé dvojici vektorů u, v G V je přiřazeno reálné číslo u ■ v tak, že pro libovolné u,v,w G V, r G R platí:
(1)  u • v = v • u,
(2)  (u + v) ■ w = (u ■ w) + (v ■ w),
(3)  (r ■ u) ■ v = r ■ (u ■ v),
(4)  je-li u ^ o, pak u ■ u > 0.
84
1 Skalární součin, velikost a odchylka vektorů
85
Potom reálné číslo u ■ v se nazývá skalární součin vektorů ti, v.
Vektorový prostor, v němž je definován skalární součin, se nazývá euklidovský vektorový prostor nebo krátce euklidovský prostor.
Poznámka. 1. Z definice plyne, že euklidovský prostor je vlastně uspořádaná dvojice (V, •) sestávající z vektorového prostoru V a ze skalárního součinu • definovaného ve V. Z důvodů stručnosti však budeme obvykle říkat pouze „euklidovský prostor Vli (tzn. zavedeme podobnou úmluvu jako u grup nebo těles, u nichž při označování vynecháváme symboly operací, pokud není nebezpečí nedorozumění).
2. Z kapitoly I. víme, že každý podprostor vektorového prostoru V nad T je sám vektorovým prostorem nad T. Je-li specielně V euklidovským prostorem, tzn. je reálný s definovaným skalárním součinem, pak zřejmě axiomy skalárního součinu budou jistě splněny i v jeho libovolném (vektorovém) podprostoru. To znamená, že každý (vektorový) podprostor euklidovského prostoru V je sám euklidovským prostorem. Budeme jej stručně nazývat podprostor euklidovského prostoru.
Předchozí definice nic neříká o tom, zda v libovolném vektorovém prostoru (nad ff) lze definovat skalární součin, resp. kolika způsoby. Odpověď na tyto otázky nám dá následující příklad a věta.
Příklad 1.1. Nechť V = R2 a nechť u = (uuu2),v = (i>i,i>2) <E K2- Pak:
1.  Položíme-li u ■ v = u\V\ + U2V2,
jsou zřejmě splněny axiomy skalárního součinu al2s tímto skalárním součinem je euklidovským prostorem.
2.  Položíme-li u ■ v = AuiVi + 2uiV2 + 2u2Vi + 3it2i>2,
pak jsou opět splněny axiomy skalárního součinu (ověřte si sami podrobným rozepsáním!), tzn. M2 s tímto skalárním součinem je euklidovským prostorem.
Je vidět, že i když se v obou případech jedná o tentýž vektorový prostor K2, jsou definované skalární součiny různé, a tedy různé jsou pak i pomocí nich získané euklidovské prostory.
Příklad 1.2. Nechť V = M„[x] a nechť / = f(x),g = g(x) G Mn[x] jsou libovolné vektory - polynomy. Položíme-li f ■ g = f0 f (x) ■ g (x) dx, pak rozepsáním (užitím základních vět o integrování známých z analýzy) se ověří platnost axiomů skalárního součinu. Tedy Mn[x] s tímto skalárním součinem je euklidovský prostor.
86
Euklidovské vektorové prostory
Věta 1.1. V každém reálném vektorovém prostoru V lze definovat skalární součin.
Důkaz. Pro nulový vektorový prostor věta zřejmě platí (stačí položit 00 = 0). Nechť tedy dim V = n > 0 a nechť ei,..., en je pevná báze prostoru V. Pak libovolné vektory u, v G V lze (jednoznačně) vyjádřit ve tvaru:
u = xi-ei-\-------Yxn -en,
resp.
Položíme-li:
v = y1 ■ ei H-------\-yn-en.
u-v = xiyi H-------\-xnyn,
pak zřejmě u ■ v G Ma lehce se ověří, že jsou splněny axiomy (1) - (4) skalárního součinu.                                                                                    D
Shrneme-li naše dosavadní úvahy, můžeme říct, že z každého reálného vektorového prostoru lze utvořit euklidovský prostor, obecně však nikoliv jediným způsobem.
Věta 1.2. Nechť V je euklidovský vektorový prostor. Pak platí:
(1)  u ■ (v + w) = (u ■ v) + (u ■ w),
(2)  u ■ (r ■ v) = r ■ (u ■ v),
/ m             \       / n             \         m    n
(3)     5>t • m ) ■    Er? " VJ    = E £Pi*j • (uí ■ Vj),
(4)  o • u = u ■ o = 0,
(4) u ■ u = 0 <í=^ ti = o pro u,v,w,Ui,Vj G V, r,pi,rj G K /«'&.
Důkaz. (1) a (2): Jsou zřejmé důsledky definice skalárního součinu. (3): Dokážeme lehce matematickou indukcí. (4): o • u = (0 • o) • u = 0 • (o • u) = 0. Zbytek analogicky. (5): „=>": Plyne z axiomu (4) skalárního součinu.
„<í=": Plyne z (4).                                                                           D
Definice. Nechť V je euklidovský prostor, u € V. Pak nezáporné reálné číslo:
1 Skalární součin, velikost a odchylka vektorů
87
||« ||  = yJU ■ U
se nazývá délka nebo též velikost vektoru u.
Je-li || «|| = 1, pak říkáme, že vektor u je normovaný.
Věta 1.3. (Schwarzova nerovnost) Nechť V je euklidovský prostor, «,dG V libovolné. Pak platí:
\u ■ v\ < \\u\\ ■ \\v ||,                                       (1)
tzn. absolútni hodnota skalárního součinu dvou vektorů je menší nebo rovna součinu velikostí těchto vektorů.
Důkaz. Je-li v = o, pak |« • o\ = 0 = ||« || • || o|| a věta platí. Předpokládejme tedy, že v ^ o a uvažme vektor u — r-v, kde r G M je libovolné. Pak je:
0 < (« — r • v) ■ (u — r ■ v) = u ■ « — 2r • (« • v) + r2 ■ (v ■ v).
Zvolíme-li nyní r = ^ (což lze, neboť podle předpokladu v ■ v > 0), dostaneme:
0<«-«-2-^-(«■«) + \^jž ■ (v ■ v),
odkud po vykráčení a pak vynásobení číslem v ■ v (> 0) dostáváme:
0 < (« • «) • (v ■ v) — (u ■ v)2,
neboli:
(« ■ v)2 < (u ■ u) ■ (v ■ v),
což po odmocnění dává dokazovanou nerovnost (1).                                 D
Důsledek. Ve Schwarzově nerovnosti (1) nastane rovnost, právě když vektory «, v jsou lineárně závislé.
Důkaz. Z důkazu předchozí věty plyne, že v (1) nastane rovnost, právě když v = o nebo « — r • v = o, tzn. právě když «, v jsou lineárně závislé.
D
Poznámka. Schwarzovu nerovnost (1) často zapisujeme v ekvivalentním tvaru:
Euklidovské vektorové prostory
(u ■ v)2 < \\u\\   ■ ||v
|2
Poznamenejme ještě, že pro nerovnost (1) se v literatuře používá též pojmenování „Cauchyova nerovnost", resp. „Cauchy-Bunjakovského nerovnost", event. „Cauchy-Schwarzova nerovnost".
Věta 1.4. Nechť V je euklidovský prostor, «, v G V, r G KL Pak platí:
(1)  II u || > 0; přičemž \\u\\ = 0, právě když u = o,
(2)  ||r • « || = \r\ ■ ||« ||,
(3)  ||« + v || < ||«|| + \\v ||,
(4)  je-li u ^ o, pak tAj • « je normovaný vektor.
Důkaz. (1) a (4): Jsou bezprostředními důsledky definice velikosti vektoru. (2): || r ■ u II   = (r • «) • (r • «) = r2 • (« • «), odkud po odmocnění dostáváme:
• «II = -y/r2 •(«•«)
«
(3): Z definice velikosti vektoru a Schwarzovy nerovnosti plyne: ||« + v ||   -(« + v) ■ (« + v) = (« • «) + 2 • (« • v) + (v ■ v) < (« • «) + 2 • ||«|| • || v || + (v • t>) = ||« ||   + 2 • ||«|| • || v || + || v ||    =  (||«|| + || v ||) . Protože však ||« + t; || i (|| «|| + || v ||) jsou nezáporná čísla, dostáváme po odmocnění žádané tvrzení.                                                                                          □
Poznámka. 1. Nerovnost uvedená ve 3. části věty se obvykle nazývá „trojúhelníková nerovnost".
2. Použijeme-li obratu provedeného ve 4. části věty (tzn. vektor « násobíme číslem Tprr), pak říkáme, že jsme vektor « „normovali".
\\u\\
Definice. Nechť «, v jsou nenulové vektory z euklidovského prostoru V. Pak reálné číslo tp splňující vztahy:
u -v
COS (f = j.-----n----r.----77        A       0 < (f < 7T                                    (2)
||« || • ||« ||
se nazývá odchylka vektorů u,v.
Poznámka. Je potřeba si rozmyslet, že uvedená definice odchylky je korektní, tzn. že číslo tp splňující (2) existuje, a to jediné. Ale Schwarzovu nerovnost můžeme pro nenulové vektory «, v přepsat ve tvaru:
2 Ortogonálnost
89
||-u||-||«|
< 1, tzn.
INI
< 1, odkud -1 < n "'ff n < 1.
—    '                      —  ||-u||-||«||  —
Vidíme tedy (na základě našich znalostí o goniometrických funkcích), že existuje právě jedno reálné číslo tp splňující podmínky (2).
Poznamenejme ještě, že odchylka vektorů není definována pro případ, kdy některý z těchto vektorů je nulovým vektorem.
§2.   Ortogonálnost
Definice. Nechť V je euklidovský prostor a nechť:
uu...,uk                                              (1)
je konečná posloupnost vektorů z V. Řekneme, že:
(1)  posloupnost (1) je ortogonální (nebo stručně, že vektory i*i,...,itfc jsou ortogonální), jestliže je:
u-i • u j = 0 pro každé i,j = l,...,k A i j^ j,
(2)  posloupnost (1) je ortonormální (nebo stručně, že vektory u\,..., u^ jsou ortonormální), je-li ortogonální a každý její vektor je normovaný,
(3)  posloupnost (1) je ortogonální báze (resp. ortonormální báze) euklidovského prostoru V, jestliže je ortogonální (resp. ortonormální) a navíc je bází prostoru V.
Poznámka. Rozebereme-li si definici ortogonálnosti pro nejjednodušší případy, pak ihned vidíme, že:
pro k = 1: Posloupnost sestávající z jednoho vektoru je vždy ortogonální (bez ohledu na to, zda např. daný vektor je nulový či nikoliv).
pro k = 2: Vektory 111,1*2 jsou ortogonální, právě když 111-1*2 = 0. V tomto případě budeme psát 1*1 ± 112 nebo 1*2 _L iti (zřejmě zde nezáleží na pořadí vektorů). Dále, jsou-li oba vektory 111,1*2 nenulové, pak zřejmě jsou ortogonální, právě když jejich odchylka je ^ (plyne z definice odchylky). Na druhé straně, dva vektory, z nichž alespoň jeden je nulový, jsou vždycky ortogonální (přičemž jejich odchylka samozřejmě není definována).
Další vlastnosti ortogonálních vektorů popisují následující tvrzení.
Věta 2.1. Nechť V je euklidovský prostor. Pak pro vektory z V
(1)  n _L i*  <í=> i* = o,
(2)  n _L x pro každé x G V  <í=> u = o,
90
Euklidovské vektorové prostory
f k          \
(3) u _l_ Wi pro i = 1,..., k  <í=^ u _l_ I J^r, • Wi j pro každé V{ G M.
Důkaz. (1), (2): Ihned plyne z předchozí definice a z definice skalárního součinu.
(3): „=>": Nechť ti _L toj, tzn. u ■ Wj = 0 pro i = 1,...,A. Pak pro libovolná r j G M je:
ŕ k               \          k
\i=l            /        i=l
a tedy u _L í £>; • t«; j.
„-4=": Zvolíme-li r, = 1 a r j = 0 pro j 7^ i, pak m ± to j, i = 1,..., k.
D
Věta 2.2. Nenulové ortogonální vektory euklidovského prostoru V jsou lineárne nezávislé.
Důkaz. Nechť Ui,...,uk G V jsou nenulové ortogonální vektory. Nechť
n ■ ui H-------\-rk-uk = o.
Provedeme-li (pro libovolné i = l,...,/s) skalární součin vektoru ti, s oběma stranami této rovnosti, dostaneme:
(ri • «1 H-------h r/; • uk) ■ Ui = o ■ uÍ7
odkud po rozepsání a s využitím ortogonálnosti zadaných vektorů dostáváme r i ■ (u-i ■ Ui) = 0.
Protože však Ui 7^ o, je Ui ■ u-i 7^ 0, a musí tedy být r, = 0 (pro každé í = 1,..., k). To však znamená, že vektory m, ...,«& jsou lineárně nezávislé.
D
Poznamenejme, že předpoklad nenulovosti všech vektorů je v předchozí větě podstatný a bez něj věta neplatí. Jinak řečeno, jsou-li ortogonální vektory z V lineárně závislé, znamená to, že alespoň jeden z nich musí být nulový.
Věta 2.3. Nechť V je euklidovský prostor, U\,...,uk G V libovolné. Pak existují ve V ortogonální vektory ei,... ,ek, které generují tentýž podpro-stor jako vektory ui,...,Uk, tzn. platí:
2 Ortogonálnost
91
L(ui, ...,Uk) = L(e1,..., ek).
Důkaz. Provedeme matematickou indukcí vzhledem ke k.
a) Pro k = 1 tvrzení platí (stačí položit e\ = U\).
ß) Předpokládejme, že tvrzení věty platí pro i = 1,2,..., k — 1 (k > 2). Tedy existují ortogonální vektory ei,..., ek-i tak, že platí:
L(ui,..., Mfc-i) = L(ei,..., e/;_i).                           (2)
Položme:
ek=pi-e1-\-------h Pfe—i • ek-i + u/t,                          (3)
kde pi G M, a určíme koeficienty p, tak, aby ek ■ e^ = 0 pro i = 1,..., k — 1. Ale po provedení skalárního součinu vektoru e-i s oběma stranami (3) dostaneme:
ek ■ ei = 0 = pi ■ (ei ■ e;) + («* • e;),
odkud:
Í-^T1        je-lie^o (libovolné   je-li e, = o
Potom tedy vektory ei,...,ek jsou ortogonální.
Zbývá nám ještě dokázat rovnost L(u\,... ,uk) = L(e\,...,ek). Ale z (2) a (3) plyne jednak, že «i,... ,uk £ -ť(ei,... ,ek), tzn. L(u\,... ,uk) C Z/(ei,...,ejt), a také, že ei,... ,e/t G £(«i,... ,«*), tzn. L(ei,...,ek) C L(ui,..., Mfc). Dohromady pak dostáváme žádanou rovnost.                    D
Poznámka. 1. Důkaz předchozí věty byl konstruktivní a jeho algoritmus se nazývá Gram-Schmidtův ortogonalizační proces (používá se při řešení konkrétních příkladů!).
2. V předchozí větě se nic nepředpokládá o lineární závislosti nebo nezávislosti vektorů ui,...,uk. Proto výsledné ortogonální vektory ei,..., ek mohou, ale nemusí být všechny nenulové. Přesněji řečeno, je-li dimXí(«i,..., uk) = f (< k), pak tedy i dimL(ei,... ,ek) = r, což znamená, že právě (k — r) z vektorů ei,..., ek je nulových a zbývajících r vektorů je nenulových a tvoří ortogonální bázi podprostoru L(u\,... ,uk), tj. podprostoru generovaného vektory u\,..., uk.
Specielně tedy, jsou-li vektory m,...,uk lineárně nezávislé, tzn. tvoří bázi podprostoru L(ui,..., uk), pak vektory ei,..., ek tvoří ortogonální bázi tohoto podprostoru.
92
Euklidovské vektorové prostory
Věta 2.4. V každém nenulovém euklidovském prostoru V existuje ortogonální báze (resp. ortonormální báze).
Důkaz. Nechť txi,... ,txn je libovolná báze V. Pak podle předchozí věty a poznámky existuje ortogonální báze ei,...,en prostoru V. Normováním každého z vektorů e\,..., en pak dostaneme ortonormální bázi tAtt •
llei|
ei,...,T^-|T -en prostoru V.                                                                      D
Příklad 2.1. V euklidovském prostoru ffi4 se skalárním součinem definovaným:
(x1,X2,x3,X4) ■ (yi,2/2,2/3,2/4) = xiy1 + x2y2 + x3y3 + x^yi
nalezněte ortogonální bázi podprostoru W generovaného vektory txi, 1x2, 1x3. Přitom:
«i = (0,1,2,1),   ti2 = (-1,1,1,1),   «a = (1,0,1,0).
Řešení: Platí VK = £(1x1,1x2,1*3), tzn. použijeme Gram-Schmidtova or-togonalizačního procesu:
ei = «i = (0,1, 2,1).
e2 = p ■ ei + ti2, kde p = -^ = -§. Tedy e2 = (-1, ±, -±, ±).
e3 = pí • ei +P2 • e2 + 1x3, kde pí = -^|i = -±, p2 = -ffíff = 1. Tedy e3 = -5 • ei + e2 + «3 = (0,0,0,0) = o.
Výsledek: ortogonální bázi podprostoru W tvoří např. vektory ei,e2-
Definice. Nechť A, B jsou libovolné podmnožiny euklidovského prostoru V. Je-li:
a ■ b = 0  pro každé a G A, b G .B,
pak říkáme, že A, B jsou ortogonální množiny a píšeme ALB nebo i? _L A
Poznámka. Jinak řečeno, A, B jsou ortogonální množiny, právě když a, b jsou ortogonální vektory pro každé a € A, b € B.
Ve specielních případech: prázdná množina, resp. množina {0} jsou zřejmě ortogonální ke každé podmnožině ve V. Dále z definice plyne, že:
A±B => inß = Ö nebo A n B = {o}.
Následující věta pak ukáže, že při studiu ortogonálních množin bude mít smysl omezit se pouze na podprostory euklidovského prostoru V.
2 Ortogonálnost
93
Věta 2.5. Nechť A, B jsou podmnožiny euklidovského prostoru V. Pak platí:
ALB ^^ [A] ± [B],
tzn. dvě množiny jsou ortogonální, právě když jsou ortogonální podprostory generované těmito množinami.
Důkaz. ,,<=": Plyne z definice, uvědomíme-li si, že A C [A], B C [B].
„=£-": Pro A = 0 nebo B = $ tvrzení zřejmě platí (neboť [0] = {o}). Předpokládejme tedy A^§, B j^§ & ALB. Nechť dále u € [A], v € [B] libovolné. Ale podprostor [A] je roven množině všech lineárních kombinací konečně mnoha vektorů z A (plyne z věty 2.3. (2), kap. I. - rozepište si podrobně sami!), tzn. u = p\ ■ a\ + • • • + pf. ■ a,k, kde o, G A, a podobně v = ri • &i + • • • + rm ■ bm, kde bj G ß. Potom však:
/ k             \       / m             \         km
u-v = [ YsPi ■ o-i    • I X) r j • 6j    = X) Eftrj • (a? • fy) = °> neboť Oj • bj = 0. Tedy platí [A] _L [5], což jsme měli dokázat.                 D
Definice. Nechť W je podprostor euklidovského prostoru V. Pak množina:
W1 = {x€V\x-w = 0 pro každé w G W} se nazývá ortogonální doplněk podprostoru W (ve V).
Poznámka. Zřejmě platí W _L VK    a ve specielních případech přímo z definice dostáváme, že V1 = {o}, resp. {o}^ = V.
Základní obecné vlastnosti ortogonálního doplňku pak popisují následující věty.
Věta 2.6. Nechť W je podprostor euklidovského prostoru V. Pak platí:
(1)  W1- je podprostor ve V,
(2)  V = W+W^, tzn. prostor V je přímým součtem podprostoru W a
WL.
Důkaz. (1): Zřejmě o G WL, a tedy WL ^ 0. Dále nechť x,y G W1, r G ffi libovolné. Pak pro libovolný vektor w G W je:
(a? + y) ■ w = (x ■ w) + (y ■ w) = 0 + 0 = 0,
94
Euklidovské vektorové prostory
resp.
(r • a?) • w = r ■ (x ■ w) = r ■ O = O,
a tedy W1- je podprostor ve V.
(2): Je-li W = {o}, pak W1 = V a tvrzení platí. Nechť tedy W ^ {o} a nechť ei,..., e& je ortonormální báze TV (její existence je zaručena větou 2.4.).
a)  Dokážeme, že W + W1- = V. Zřejmě stačí dokázat inkluzi „D". Nechť tedy ti e F libovolný. Označme:
x = (u ■ ei) • ei H-------h (u • e*) • e*.
Pak zřejmě x G W. Dále vezměme vektor (—a? + u) a spočtěme:
(-a; + u) ■ e, = -(a; • e-i) + (m • e-i) = -(u ■ e,) + (u ■ e,) = 0
pro « = !,...,&, odkud plyne, že (—x + u) G VF1. Potom však m = x + (-x + u) e W + WL.
b)  Platí W n Tyx = {o}, neboť loelfn T^-1 =>• io-io = 0 =>• tu = o. Dohromady pak dostáváme, že T^ = W+WL.                                       D
Poznámka. Je-li VF libovolný podprostor ve F, pak (podle 2. části předchozí věty a podle definice přímého součtu podprostorů) se libovolný vektor u G V dá napsat, a to jediným způsobem, ve tvaru:
u = x + y,
kde x £W, y £ W1.
Poznamenejme, že vektor x z tohoto vyjádření se nazývá ortogonální projekce vektoru u do podprostoru W. Následující věta ukáže, že ortogonální projekce součtu dvou vektorů je rovna součtu jejich ortogonálních projekcí a podobně tomu je pro násobek vektoru.
Věta 2.7. Nechť W je podprostor euklidovského prostoru V, nechť x (resp. x') je ortogonální projekce vektoru u (resp. u') do podprostoru W a nechť r £ R libovolné. Pak platí:
(1)  (a? + x') je ortogonální projekce vektoru (u + u') do W,
(2)  r • x je ortogonální projekce vektoru r ■ u do W.
2 Ortogonálnost
95
Důkaz. Podle předpokladu je u = x + y, u' = x' + y', kde íc, x' G W, y, y' G W1. Potom:
(1): (« + «') = (x + y) + (x' + yl) = (x + x') + (y + y'), kde x + x' G W, y + y' GW1,
(2): r ■ u = r ■ (x + y) = r ■ x + r ■ y, kde r • x G W, r ■ y G W^, odkud již podle předchozí poznámky plyne tvrzení.                                  D
Věta 2.8. Necht W, S jsou podprostory euklidovského prostoru V. Pak platí: (1) (W1)1 = W,
(2) (w + s)1 = w1ns1;
(3)  (wn(s)1 = w1 + Ä1.
Důkaz. (1): Podle věty 2.6. je W+W± = V a také W^+O^-1-)1- = F, odkud plyne, že dim TV = dimF — dim VF1- = dim(Ty±)±. Je tedy dim W = dim(VFJ-)-1-, přičemž zřejmě W C (Ty^)1, tzn. pak (podle věty 4.5. (2), kap. l.)jeW = {WL)L.
(2): Inkluze „C" je zřejmá. Dokážeme inkluzi „D". Nechť íc G VK1- í~l S1-a nechť ti G (W + S) je libovolný, tzn. u = w + s, kde w G TV, séS. Potom:
a tedy je x G (TV + S)1. Je tedy W1 n S1 C (TV + Ä)1 a dohromady platí žádaná rovnost.
(3): Užitím (1) a (2) dostáváme:
(wns) = (wL)L n (s1)1 = (w1 + s1)1,
odkud:
(iy n ä)1 = ((W1 + S1)1)1 = WL + SL.
D
Kapitola 5
Lineární zobrazení vektorových prostorů
§1.   Základní vlastnosti lineárního zobrazení
V našich předchozích úvahách o vektorových prostorech jsme vždy vyšetřovali vlastnosti jednoho vektorového prostoru (pro úplnost připomeňme, že vektorovým prostorem rozumíme vždy konečnědimenzionální vektorový prostor). V této kapitole se naopak budeme zabývat vzájemnými vztahy mezi dvěma (případně i více) vektorovými prostory. Tyto „vzájemné vztahy" budeme studovat pomocí zobrazení jednoho vektorového prostoru do druhého. Aby naše úvahy měly praktický smysl, bude zřejmě nutné pracovat s takovými zobrazeními, která nějakým způsobem „zachovávají" operace, s nimiž se ve vektorových prostorech setkáváme, tj. zachovávají jednak součet vektorů a jednak násobek čísla s vektorem. Přitom zřejmě druhý požadavek bude moci být splněn jen tehdy, když uvažované vektorové prostory budou nad stejným číselným tělesem.
Definice. Nechť V, V jsou vektorové prostory nad týmž číselným tělesem T. Zobrazení <p : V —t V splňující:
(1)  ip(u + v) = (p(u) + (p(v),
(2)  <p(t-u) = t- <p(u)
pro «,» G ľ, í é T libovolné se nazývá lineární zobrazení vektorového prostoru F do V.
Je-li navíc tp bijektivní, pak se nazývá izomorfizmus vektorového prostoru V na V.
96
1 Základní vlastnosti lineárního zobrazení                                               97
Poznámka. 1. Je nutné si uvědomit, že vektorové prostory V a V jsou obecně různé, a tedy i operace sčítání vektorů (resp. násobení čísla s vektorem) ve V a ve V jsou pak samozřejmě také různé. Přesto však je budeme pro jednoduchost označovat stejným symbolem + (resp. •). Nebude moci dojít k nedorozumění, poněvadž ze souvislosti a z ostatní symboliky bude vždy zřejmé, o kterou operaci se jedná. Pro ulehčení orientace budeme vektory z V' obvykle označovat čárkovaně, kdežto vektory z V nečárkovaně. Specielně tedy o' bude značit nulový vektor z V', kdežto o bude značit nulový vektor z V.
2. Lehce se ukáže, že podmínky (1) a (2) z předchozí definice jsou ekvivalentní jediné podmínce:
(3) <p(t ■ u + s ■ v) = t ■ ip(u) + s ■ (p(v)   pro u, v G V, í, s G T libovolné. Ověřujeme-li tedy, že zobrazení (p : V —> V je lineární zobrazení, pak ověřujeme buď podmínky (1) a (2), nebo jedinou podmínku (3).
Dále, matematickou indukcí lze (3) rozšířit na libovolný konečný počet sčítanců, tzn. pro lineární zobrazení <p> platí:
ip(ti -Ui-\--------h tk ■ uk) = ti ■ <p(ui) H--------h tk ■ ip(uk).
Příklad 1.1. Nechť V, V jsou vektorové prostory nad T, nechť t G T. Pak:
1.  Zobrazení </? : V —> V definované:
<p{u) = t ■ u  pro každé u G V
je lineárni zobrazení. Je-li í ^ 0, pak (p je dokonce izomorfismus (ověřte si obojí rozepsáním!). Specielně, pro t = 1 dostáváme identické zobrazení idy, které je tedy izomorfismem vektorového prostoru V na V.
2.  Zobrazení oj : V —V V definované:
ui(u) = o'  pro každé u G V je lineární zobrazení, které budeme nazývat nulové lineární zobrazení.
Příklad 1.2. Zobrazení <p : IR3 —y IR2 definované:
ip((xi,X2,X3)) = (2zi +x3lxi -x2 -x?,)   pro V(a;i,£2,2:3) G R3
je lineární zobrazení, které není izomorfismem. Dále, např. zobrazení ift : M3 —y M2 definované:
98
Lineární zobrazení vektorových prostorů
ip((xi,X2,X3)) = (2íci + 1,íci - x2 - x3)   pmV(x1,X2,x3) € R3 není lineární zobrazení (zřejmě neplatí (1) ani (2)).
Příklad 1.3. Zobrazení ô : Mn[x] —> Mn[x] definované:
S(f(x))=f(x)    PT0Vf(x)eMn[x],
tj. zobrazení přiřazující polynomu /(x) jeho derivaci /'(re), je lineární zobrazení (při ověřování podmínek (1) a (2) se využije některých vět o derivování funkcí známých z analýzy). Zřejmě ö není bijektivní zobrazení, a tedy není izomorfismem.
Věta 1.1. Nechť ip : V —> V je lineární zobrazení. Pak platí:
(1)  <p(o) = o', tj. nulový vektor se musí zobrazit na nulový vektor,
(2)  ip(—u) = —<p{u)   pro Vít £ V,
(3)  «i,... ,Uk € V jsou lineárně závislé vektory   =>•   <p{u{),..., <£>(«&) jsou lineárně závislé vektory (ve V).
Důkaz. (1): Zřejmě je o = 0 • o, tzn. pak <p(o) = tp(0 • o) = 0 • f (o) = o'.
(2): <p(-u) = y((-l) • u) = (-1) • <p(u) = -<p(u) podle věty 1.1. (4), kap. I.
(3): ui,...,Uk jsou lineárně závislé ==> existují ti,...,tn £ T, z nichž alespoň jedno je různé od nuly, tak, že t\ • u\ + • • • + t& • u^ = o. Pak ale
yj(ťi-itH-------\-tk-uk) = ip(o), tzn. ti-ip(ui)-\-------\-tk-(p(uk) = o', a tedy
9?(«i),..., <p{uk) jsou lineárně závislé.                                                      D
Další věta si všímá toho, jak se lineární zobrazení chová vůči podprosto-rům. Připomeňme, že je-li <p : V —> V zobrazení a W je podmnožina ve V, pak symbolem <p(W) označujeme množinu obrazů všech prvků z W, tj.:
<p(W) = {x' eV \3w eW tak, že y(w) = x'}.
Věta 1.2. Nechť <p : V —> V je lineární zobrazení, W podprostor ve V. Pak:
(1)  <p(W) je podprostor ve V,
(2)  i*i,..., itjfc jsou generátory podprostoru W    =4>    (p(ui),..., <p(uk) jsou generátory podprostoru <p(W),
(3)  dimW > dim<p(W).
1 Základní vlastnosti lineárního zobrazení
99
Důkaz. (1): Provede se přímým ověřením definice podprostoru.
(2): Nechť x' G <p(W) libovolný, tzn. existuje w G W tak, že ip(w) = x'. Ale podle předpokladu w = t\ ■ u\ + ■ ■ ■ + tk • Uk, a tedy x' = ip(ti ■ u\ +
-----Vtk-Uk) =ti-(p(ui)-\------\-tk-<p(uk), odkud plyne, že <p(ui),... ,<p(uk)
jsou generátory <p(W).
(3): Je-li W = {o}, pak tvrzení zřejmě platí. Nechť tedy W ^ {o} a nechť «i,..., um je báze W. Pak podle (2) jsou vektory y(«i),..., <p{um) generátory ip(W), a tedy dim</?(W) < m = dim W.                                  D
Věta 1.3. Složením lineárních zobrazení dostaneme opět lineární zobrazení, tj. jsou-li (p : V —> V, ip : V —> V" lineární zobrazení, pak ip o tp :
V —> V" je lineární zobrazení.
Důkaz. Ověříme podmínku (3). Pro ti, v G V, t, s G T je:
(lp o (f)(t ■ U + S ■ V) = 4>(ip(t ■ U + S ■ V)) = 1p(t ■ (p(u) + S ■ <f(v)) = t- ({ip o (p)(u)) +S- {{íl>0(p)(v)),
a tedy (ip o ip) je lineárni zobrazení.                                                          D
Následující důležitá věta ukáže, že k úplnému zadání lineárního zobrazení V —> V stačí zadat pouze obrazy vektorů pevné báze prostoru V a obrazy zbývajících vektorů z V jsou pak již jednoznačně vynuceny. Na druhé straně, takovýto výsledek se dá celkem očekávat, uvědomíme-li si, že každý vektor z V je jistou lineární kombinací vektorů báze a že lineární zobrazení „zachovává lineární kombinace vektorů".
Věta 1.4. (Základní věta o lineárních zobrazeních) Nechť V, V jsou vektorové prostory nadT, nechť Ui,... ,unje báze prostoru V a nechť v^,..., v'n jsou libovolné vektory z V. Pak existuje jediné lineární zobrazení tp : V —>•
V  takové, že <p{u{) = v[, ..., <p{un) = v'n.
Důkaz. I. existence: Nechť x € V libovolný, přičemž x = x\ ■ U\ + • • • + xn ■
un. Položme <p(x) = x\ ■ v'x -\-----+ xn ■ v'n. Potom cp je zobrazení V do V',
které je lineární zobrazení (obojí si podrobně rozmyslete, resp. dokažte!). Dále, zřejmě <p(ui) = v\ pro i = 1,..., n.
II. jednoznačnost: Nechť <p je výše zkonstruované lineární zobrazení a nechť dále ip : V —> V je lineární zobrazení takové, že ip(ui) = v\, ..., ip(un) = v'n. Pak pro libovolný vektor x € V (pro nějž x = x\ ■ U\ + • • • + %n ' un) je:
100
Lineární zobrazení vektorových prostorů
ip(x) = ip(xí • «H-------h xn • un) = xx ■ ip{ui) -\-------h xn • ip(un) =
Xfv[-\-------h xn ■ v'n = ip(x),
což však znamená, že ip = (p.                                                                     D
Definice. Nechť (p : V —> V je lineární zobrazení. Pak:
(1)  množina Ker (p = {u G V | <p(u) = o1} se nazývá jádro lineárního zobrazení <p,
(2)  množina Im (p = <p(V) se nazývá obraz lineárního zobrazení (p.
Poznámka. Označení Ker 99, resp. Im (p jsou v literatuře běžně používané zkratky pro anglické názvy „kernel" = jádro, resp. „image" = obraz.
Následující tvrzení ukáží, že obě podmnožiny jsou podprostory a popíší jejich základní vlastnosti.
Věta 1.5. Nechť ip : V —> V je lineární zobrazeni. Pak:
(1)  jádro Ker (p je podprostorem ve V,
(2)  obraz Im (p je podprostorem ve V'.
Důkaz. (1): Zřejmě o G Ker</?, a tedy Ker op ^ 0. Dále, nechť u,v G Ker op, tzn. je (p(u) = o', (p(v) = o'. Pak (p(u + v) = <p(u) + <p(v) = o1 + o' = o', a tedy u + v G Ker op. Podobně pro u G Ker opaíGTjeť-itG Ker op. Dohromady tedy Ker op je podprostor ve V.
(2): Jde o specielní případ věty 1.2. (1).                                                D
Věta 1.6. Lineárni zobrazení op je injektivní <í=^ Ker op = {o}.
Důkaz. „=>": Nechť a? G Ker op libovolný. Pak <p(x) = o' = op(o) užitím věty 1.1. (1). Z injektivnosti zobrazení op pak dostáváme x = o, tzn. Ker op = {o}, „-4=": Nechť op(*u) = </?(«). Potom op(*u — v) = o', neboli u-íj € Ker op = {o}. Tedy u — v = o, neboli u = v, což znamená, že op je injektivní zobrazení.                                                                                                  D
Definice. Nechť ip : V —> V je lineární zobrazení. Pak dimenze jádra Ker op se nazývá defekt lineárního zobrazení op a dimenze obrazu Im op se nazývá hodnost lineárního zobrazení op.
Věta 1.7. Necht tp : V —>■ V je lineární zobrazeni. Pak součet defektu a hodnosti lineárního zobrazení ip je roven dimenzi prostoru V, tj.:
1 Základní vlastnosti lineárního zobrazení
101
dim(Ker ip) + áim(lm.(p) = dim y.
Důkaz. Je-li Im (p = {o'}, pak Ker ip = V a věta zřejmě platí. Nechť je tedy Irnip ^ {o1} a nechť w[,... ,w'r je báze Imip. Pak existují vektory «i, ...,urGV tak, že <p{u{) = w'x, ..., <p{ur) = w'r. Z věty 1.1. (3) plyne, žeui,...,ur jsou lineárně nezávislé, tzn. je pak:
dim_L(iti,... ,ur) = r = dim(Im<y9).                          (1)
Dále:
I.  Ukážeme, že Ker (p + L(ui,..., ur) = V.
Ale inkluze „C" je zřejmá a naopak, je-li x £ V libovolný, pak <p{x) G Im ip, tzn. ip(x) = c\ ■ w[ + • • • + cr ■ w'r, kde Cj G T. Uvažme nyní vektor u = c\ ■ u\ + • • • + cr ■ ur. Zřejmě je u € L(ui,..., ur) a dále:
<p{u) = ip(ci • ui + ■ ■ ■ + cr • ur) = c\ • <p{u\) + • • • + cr • <p{ur) = ci-w[-\-------h cr ■ w'r = <p(x),
odkud (p(x — u) = o', neboli x — u G Ker ip. Potom však:
x = (x — u) + u € Ker ip + L{u\,..., itr),
což jsme potřebovali dokázat.
II.  Ukážeme, že Ker (p fl L(u\,... ,ur) = {o}.
Nechť x G Ker (p fl L{u\,..., ur). Pak <^(a;) = o' a současně a; = ťi • «i + • • • + tr ■ ur, odkud:
o' = <p(x) = t\ ■ (p(u\) H-----+ tr ■ (p(ur) =ti-w[-\-------\-tr ■ w'r.
Ale z lineární nezávislosti vektorů w^,...,w'r plyne, že t\ = ■ ■ ■ = tr = 0, a tedy po dosazení dostáváme x = o.
Nyní, z I. a II. užitím věty o součtu a průniku podprostorů a vztahu (1) dostáváme:
dim F = dim (Ker (p + L(ui,... ,ur)) =
dimKer (p + dim_L(iti,... ,ur) — dim (Ker (p fl L(u\,... ,ur)) =
dim Ker ip + dim Im (p — 0 = dim Ker (p + dim Im ip.
D
Definice. Nechť V', V' jsou vektorové prostory nad T a nechť existuje izomoríismus vektorového prostoru V na V'. Pak říkáme, že V a, V' jsou izomorfní vektorové prostory a píšeme V = V.
102
Lineární zobrazení vektorových prostorů
Věta 1.8. Relace = je relací ekvivalence na množině všech (konečnědi-menzíonálních) vektorových prostorů nad tělesem T.
Důkaz, reflexivita: Je zřejmá (neboť idy je izomoríismus V na V).
symetrie: Nechť V = V', tzn. existuje izomoríismus tp : V —> V. Pak zobrazení </?_1 : V' —> V je bijektivní a ukážeme, že je lineární zobrazení. Nechť m', v' G V, t,s G T libovolné a označme <í3_1(ti/) = m, </?_1(t;/) = v. Potom je ip(u) = m', (p(v) = v'. Nyní:
</?_1(í • U' + S ■ V1) = <y2_1 (t ■ ip(u) + S ■ ip(v))  = <y2_1 (</?(í • U + S ■ V))  =
t ■ u + s ■ v = t ■ </?_1(m') + s ■ (p-1^').
Je tedy V =* V.
tranzitivita: Plyne z vlastností bijekce a z věty 1.3.                              D
Věta 1.9. Nechť tp : V —> V je ízomorfismus. Pak platí:
(1)  «!,...,«£  G V jsou lineárně závislé   -<=^    ip(u\),... ,<p(uk) jsou lineárně závislé,
(2)  «i,... ,Uk G V jsou lineárně nezávislé   -<=^   ip(ui),..., <p{uk) jsou lineárně nezávislé,
(3)  Mi,... ,un je báze V -<=^ <p{u{),..., <p(un) je báze V,
(4)  dimV = dimy/.
Důkaz. Podle předpokladu je <p : V —> V bijektivní lineární zobrazení a podle důkazu předchozí věty je </?_1 : V —> V také bijektivní lineární zobrazení. Potom:
(1): Plyne z věty 1.1. (3) aplikované na </?, resp. <^_1.
(2): Je logickým důsledkem (1).
(3): Plyne z (2) a z věty 1.2. (2), uvědomíme-li si, že <p(V) = V a ^(V') = V.
(4): Je-li V nulovým prostorem, pak je tvrzení zřejmé. V ostatních případech plyne z (3).                                                                                    D
Poznámka. Utvoříme-li na množině všech (konečnědimenzionálních) vektorových prostorů nad T rozklad příslušný ekvivalenci =, pak v každé třídě tohoto rozkladu budou vždy všechny navzájem izomorfní vektorové prostory. Z věty 1.9. pak plyne, že tyto izomorfní vektorové prostory mají z algebraického hlediska naprosto stejné vlastnosti (jedná se tedy o pouze formálně různé exempláře shodných vlastností). V matematice se obvykle
2 Lineární transformace a její matice
103
o takovýchto objektech říká, že jsou „stejné, až na izomorfismus" a často se dokonce ztotožňují.
Následující věta pak podá velmi jednoduchou charakterizaci izomorfních vektorových prostorů, tj. vektorových prostorů patřících dojedná třídy zmíněného rozkladu.
Věta 1.10. (Věta o izomorfismu vektorových prostorů) Necht V, V jsou vektorové prostory nad T. Pak:
V**V <=> dimV = dimV.
Důkaz. „=>": Plyne přímo z věty 1.9. (4).
,,^=": Je-li dim V = dim V = 0, pak zřejmě V = V. Nechť tedy dim V = dim V' = n (> 1) a nechť u\,..., un je báze V, resp. u\,...,u'n'^e báze V'. Nechť dále x G V libovolný, přičemž x = x\ • u\ + • • • + xn • un (víme, že toto vyjádření existuje, a to jediné). Položme:
ip{x) = xi-u[-\-------\-xn- u'n.
Pak zřejmě <p : V —> V je zobrazení a rozepsáním se ukáže, že <p je bijektivní (proveďte si podrobně sami!). Dokažme, že ip je lineární zobrazení. Nechť
x,y eV,t,s G T, přičemž x = xi-u\-\------\-xn-un, y = yi-iíiH------\-yn-un.
Potom:
ip(t ■ x + s ■ y) = <p((txt + syt) • ux -\-------h (txn + syn) ■ un) =
(txi + syt) -u[^-------h (txn + syn) ■ u'n =
t-(xi-u[-\-------h xn ■ u'n) + s ■ (yt • u[ H-------\-Vn • u'n) = t • (p(x) + s ■ (p(y).
Dohromady pak ip je izomorfismus prostoru V na V', a tedy V = V.      D
Poznámka. Z předchozí věty plyne, že při zadaném číselném tělese T je každý vektorový prostor jednoznačně (až na izomorfismus) určen svojí dimenzí. Přitom např. zřejmě každý nenulový n-dimenzionální vektorový prostor nad T je izomorfní s prostorem Tn. Vidíme tedy, že vektorové prostory Tn pro n = 1, 2,3,... vyčerpávají (až na izomorfismus) všechny nenulové vektorové prostory nad T. Mohlo by se tedy na první pohled zdát, že při budování obecné teorie vektorových prostorů by vlastně stačilo omezit se pouze na prostory Tn. Je však ihned vidět, že bychom tímto nedosáhli žádného zjednodušení, neboť z důkazu předchozí věty plyne, že použitý izomorfismus závisí na volbě báze. Pokud bychom tedy chtěli nějaké tvrzení o prostoru Tn přenést na libovolný «-dimenzionální vektorový prostor, znamenalo by to vždy dokázat jeho nezávislost na volbě báze.
104
Lineární zobrazení vektorových prostorů
§2.   Lineární transformace a její matice
Definice. Nechť V je vektorový prostor nad T. Lineární zobrazení (p : V —> V se nazývá lineární transformace vektorového prostoru V.
Je-li navíc tp bijektivní, pak se nazývá automorfismus vektorového prostoru V.
Poznámka. Vidíme, že lineární transformace je pouze specielním případem lineárního zobrazení, a sice pro V' = V. Znamená to tedy, že všechny úvahy a tvrzení z předchozího paragrafu zůstávají v platnosti i pro lineární transformace, přičemž bude zřejmě platit ještě něco navíc.
Specielně zdůrazněme, že podle základní věty o lineárních zobrazeních je lineární transformace nenulového prostoru V jednoznačně určena zadáním obrazů pevné báze prostoru V.
Dále si všimněme toho, že je-li V = {o}, pak existuje pouze jediná, a to identická lineární transformace prostoru V a všechny úvahy o ní jsou víceméně triviální. Proto se v dalším budeme zabývat pouze lineárními transformacemi nenulových vektorových prostorů.
Nejprve uvedeme větu, která nám podá řadu ekvivalentních podmínek pro to, aby lineární transformace byla automorfismem, tj. aby byla bijektivní.
Věta 2.1. Nechť <p je lineární transformace prostoru V. Pak následující výroky jsou ekvivalentní:
(1)  (p je automorfismus,
(2)  tp je ínjektivní zobrazení,
(3)  (p je surjektívni zobrazeni,
(4)  tp zobrazuje libovolnou bází prostoru V na bází prostoru V,
(5)  f zobrazuje libovolné lineárně nezávislé vektory opět na lineárně nezávislé vektory.
Důkaz. „(1) => (2)": Zřejmé.
„(2) =>■ (3)": Nechť </? je injektivní zobrazení. Pak podle věty 1.6. je Ker<£ = {o}, a tedy podle věty 1.7. musí být dimlm</? = diniF, neboli <p(V) = V. To však znamená, že f je surjektivní zobrazení.
„(3) =>■ (4)": Je-li </? surjektivní, pak ip(V) = V. Nechť nyní u\,... ,un je báze prostoru V. Podle věty 1.2.(2) jsou (p(ui),... ,ip(un) generátory <p(V) = V. Ale z generátorů prostoru V lze vybrat bázi V, která však v našem případě musí sestávat z n vektorů, což znamená, že (p{u\),..., <p{un)
2 Lineární transformace a její matice
105
je báze V.
„(4) =>- (5)": Nechť u\,...,Uk G V jsou lineárně nezávislé vektory. Ale lineárně nezávislé vektory z V lze doplnit na bázi V, odkud užitím (4) dostaneme, že </?(«i),..., <p(uk) jsou lineárně nezávislé vektory.
„(5) =>■ (1)": Z (5) plyne, že Ker^ = {o} (neboť je-li x ^ o libovolný, pak x je lineárně nezávislý, a tedy podle (5) je <p(x) také lineárně nezávislý, neboli <p(x) ^ o). Ale je-li Ker</? = {o}, pak z věty 1.6. plyne, že tp je injektivní, a užitím věty 1.7. dostaneme, že </? je surjektivní. Dohromady tedy <£ je automorfismus.                                                                          D
Definice. Nechť <p je lineární transformace prostoru V. Nechť:
«l,---!«í
je pevná báze prostoru V a platí:
(1)
(f(ui) = an-ui + Ü21-U2 -\-------h an\ ■ un
<p(u2) = (Íi2 • Ui + a22 ■ U2 H---------h Ön2 • «n
Pak matice:
<^(wn) = ain ■ ui + a2n ■ u2 H-------h ann • ^
A
fan    o-vi    ■■■    a>in\
(í2l      «22      • • •      «2n
\Clfil     Oin2     • • •      dnny
se nazývá matice lineární transformace <p v bází (1).
Poznámka. 1. Vidíme, že matice A je čtvercová řádu n (kde n = dim V) a je utvořena tak, že souřadnice vektoru <p(uj) v bázi (1) jsou napsány do j-tého sloupce matice A (j = l,...,n). Tyto souřadnice jsou určeny jednoznačně, a tedy i matice A je jednoznačně určena.
Uvědomme si dále, že pojem matice lineární transformace je vázán podstatným způsobem na pevnou bázi prostoru V. Zřejmě matice téže lineární transformace tp v různých bázích prostoru V budou obecně různé.
2. Všimněme si ještě vzájemného vztahu mezi pojmem „matice přechodu" (definovaným v §5, kap. II.) a pojmem „matice lineární transformace". Jsou-li ui,...,«n a»i,...,«n dvě báze prostoru V a označíme-li
106
Lineární zobrazení vektorových prostorů
symbolem (p lineární transformaci prostoru V zadanou určením obrazů báze tak, že vektory první báze se postupně zobrazují na vektory druhé báze, tzn.:
(f(ui)   = Vi,
<p(un) = vn,
pak ihned vidíme, že matice přechodu od báze u\,..., un k bázi v\,..., vn je rovna matici lineární transformace ip v bázi u\,..., un.
Označení. Množinu všech lineárních transformací prostoru V budeme označovat symbolem C(V).
Prvky množiny jC(V) jsou tedy lineární transformace vektorového prostoru V, tj. jistá zobrazení V —> V. Zřejmě je jC(V) j^ 0, neboť například identické zobrazení idy G £(V). Na množině C(V) nyní určitým přirozeným způsobem definujeme součet a součin, resp. násobek číslem a popíšeme základní vlastnosti takto vzniklých algebraických struktur.
Definice. Nechť (p,tp G £(V), í G T libovolné. Pak zobrazení:
(1)  (p + ip : V —> V definované ((p + ip)(u) = (p(u) + ip(u) pro \/u 6ľse nazývá součet lineárních transformací (p a ip,
(2)  ipoif; : V —> V definované {tpoijj)(u) = (p(ý(u)) pro V« G V se nazývá součin lineárních transformací (p a iß,
(3)  t ■ (p : V —> V definované (t ■ <p)(u) = t • (93(1*)) pro Vít G V se nazývá součin čísla t s lineární transformací (p.
Věta 2.2. Nechť (p,tp jsou lineární transformace prostoru V, t G T libovolné. Pak: (tyip + tpjípoip^-tp jsou lineární transformace prostoru V,
(2)  (C(V),+) je komutativní grupa,
(3)  (jC(V),+,o) je okruh s jedničkou,
(4)  C(V) je vektorový prostor nad tělesem T (vzhledem k +, resp. •).
Důkaz. (1): Zřejmě (p + ip, (p o ip, t • ip jsou zobrazení V —> V. Rozepsáním se bezprostředně ověří, že jsou to lineární zobrazení.
(2): Dokáže se rozepsáním. Přitom roli nulového prvku hraje nulová lineární transformace lo : V —> V (definovaná lo(u) = o pro Vít G V), resp.
2 Lineární transformace a její matice
107
opačným prvkem k (p G C(V) je lineární transformace g : V —> V definovaná g(u) = —(p(u) pro Vít £ V.
(3): Dokáže se opět rozepsáním, s využitím (2). Jedničkou okruhu je zřejmě identická transformace idy.
(4): Dokáže se užitím (2) a bezprostředním ověřením axiomů vektorového prostoru.                                                                                                   D
Věta 2.3. Nechť ip, ip jsou lineární transformace prostoru V, dim y = n > 1 a nechť maticí (p (resp. tp) v bázi (1) je matice A (resp. B). Potom:
(1)  maticí lineární transformace f + ip v bázi (1) je matice A + B,
(2)  maticí lineární transformace ip o ip v bázi (1) je matice A ■ B,
(3)  maticí lineární transformace t ■ <p v bázi (1) je matice t ■ A.
Důkaz. Nechť A = (a^), B = (bij), i,j = l,...,n. Při tomto označení pak platí:
n                                       n
<p(uj) = Yarj ■ ur,  ip(uj) = Y^rj ■ ur
r=l                                   r=l
pro j = 1,... ,n. Pak:
n                       n                       n
(1): (cp + ý)(uj) = <p(uj) + 1p(Uj) =  Y O-Tj ■ «r + Y brj -Ur =  Yl {o-rj +
r=l                   r=l                   r=l
brj) ■ ur pro j = 1,..., n, a tedy maticí lineární transformace (p + ip v bázi (1) je matice (a^ + bij) = A-\- B.
n
(2): Označme A ■ B = (qj), tzn. Cý- =  Yaik * ^fcj Pro ^J = 1,... ,ti.
fc=i
(n                \          n                              n             n
Y brj -Ur\   =   Y brj ■ <p(Ur) =  Y brj ' Y asr ■ Us = r=l                J        r=l                          r=l         s=\
n    / n             \                 n
Y ( Yasrbrj ) ' us = Ycsj ' ws? odkud plyne, že maticí lineární transfor-
5=1 \r=l           J               ä=1
mace ip o ip v bázi (1) je matice ^4 • _B.
n                       n
(3): (í• cp)(uj) = t■ <p(uj) = t- Yarj 'ur = Y(ťarj)''"r? a tedy maticí
r=l                   r=l
lineární transformace t ■ (p v bázi (1) je matice (t ■ clíj) = t ■ A.                 D
Věta 2.4. Nechť V je vektorový prostor nad T, dim V = n > 1. PaÄ; veA;-torový prostor C(V) je izomorfní vektorovému prostoru Matnn(T).
Důkaz. Nechť (1) je pevná báze V. Definujme zobrazení F : jĺ(V) —> Matnra(T) takto: pro libovolné (p € C(V) položme:
108
Lineární zobrazení vektorových prostorů
F(<p) = A,
kde A je matice lineární transformace ip v bázi (1). Nyní dokážeme, že:
I.  F je bijektivní zobrazení.
Nechť A G Matnra(T) libovolná. Označme w\,... ,wn vektory z V, jejichž souřadnicemi v bázi (1) (tj. bázi u\,... ,un) jsou po řadě sloupce matice A. Podle základní věty o lineárních zobrazeních existuje jediná lineární transformace <p prostoru V s vlastností <p(ui) = w\, ..., <p(un) = wn. Ale maticí <p v bázi (1) je pak právě matice A. Tedy existuje právě jedno ip £ JĹ(V) tak, že F (up) = A, neboli matice A má při zobrazení F právě jeden vzor, což znamená, že F je bijektivní zobrazení.
II.  F je lineární zobrazení.
Nechť (p,ip £ C(V), t G T libovolné, přičemž F(<p) = A, F(ip) = B. Pak podle věty 2.3. (1) je F((p + ip) = A + B = F(ip) + F(ip) a podle věty 2.3. (3) je F(t ■ tp) = t ■ A = t ■ F(ip). Tedy F je lineární zobrazení.
Dohromady dostáváme, že F je izomoríismus, neboli £(V) = Matran(T).
D
Poznamenejme, že z předchozí věty a z věty o izomorfismu vektorových prostorů plyne, že dim.C(V) = n2 (poněvadž, jak víme, dimMatnra(T) = n2).
Na závěr paragrafu si ještě stručně všimneme toho, jak vypadají matice téže lineární transformace v různých bázích prostoru V a jaké jsou některé jejich základní vlastnosti.
Věta 2.5. Nechť A, B G Matnn(T), nechť dim V = n (> 1). Pak platí:
A, B jsou maticemi téže lineární transformace prostoru V (ve vhodných bázích)  <í=^   existuje regulární matice S tak, že B = 51-1 • A ■ S.
Důkaz. „=>": Nechť A = (öy), resp. B = (bij) je matice lineární transformace tp v bázi (1), resp. v bázi (ľ) (kde (1) je báze u\,... ,un, resp. (ľ) je báze u\,... ,u'n). Dále nechť S = (s i j) je matice přechodu od báze (1) k bázi (ľ), tzn. S je regulární matice a platí:
n U j = 2^i Si j • U j
i=l
pro j = 1,..., n. Potom však:
2 Lineární transformace a její matice
109
n                        n             n                      n   /  n             \
VÍK) = Ehj -u'k= Ehj ■Ylsik-Ui = Y,( Esikhj   ■ uí k=l                    k=l       i=l                   1=1 \k=l           J
a také:
ŕ  n                \         n                              n             n
(flu1,) = <pl Y^skj-Uk) = Eskj ■ <p(uk) = Eskj -J2aik-Ui =
\k=l              J        k=l                          k=l         i=l
n   /  n             \
E     Y,aikSkj        Ui, i=l \fc=l            /
odkud porovnáním pravých stran (na základě jednoznačnosti vyjádření vektoru ip(uj) pomoci báze (1)) dostáváme, že:
n                     n
/ . Sik"kj        Z-í ^ik^kj k=l                 k=l
pro i,j = l,...,n, což však znamená, že S ■ B = A -S1, neboli B = S-1 -A-S. „<£=": Nechť B = S-1 ■ A ■ S a nechť (1) je pevná báze prostoru V. Pak (podle důkazu věty 2.4.) existuje jediná lineární transformace </? prostoru V taková, že A je maticí <p v bázi (1). Dále, S je regulární matice, tzn. existuje (jediná) báze (ľ) prostoru V taková, že S je matice přechodu od báze (1) k (ľ). Konečně, podle předpokladu je S ■ B = A ■ S, neboli
n                      n
^2sikhj =  Eaífcsfcj Pro h j = !,•••,n. Potom stejnými úpravami jako
k=i                  k=i
v první části důkazu dostáváme:
n   /  n             \                n   /  n             \                 n
<ŕ(w'j) = E  E aikSkj) • uí = E  E sikhj) ■ uí = E hj ■ u'k
i=l \fc=l            /               i=l \k=l           J               k=l
pro j = 1,... ,n, což však znamená, že B je maticí lineární transformace (p v bázi (ľ). Tedy matice A, B jsou maticemi téže lineární transformace prostoru V.                                                                                               D
Definice. Nechť A,B£ Matnra(T) a nechť existuje regulární matice S taková, že B = S1-1 -A- S. Pak říkáme, že matice A, B jsou podobné matice a píšeme A ~ B.
Věta 2.6. Relace ~ podobnosti matic je relací ekvivalence na množiné Matnn(T).
Důkaz, a) reflexivita: Pro libovolnou matici A G Matnra(T) je zřejmě A = E~l ■ A ■ En, kde En je jednotková matice řádu n. Je tedy A ~ A
110
Lineární zobrazení vektorových prostorů
b)  symetrie: Nechť A ~ i?, tzn. existuje regulární matice S tak, že B = S-1-A-S. PakaleA = S-B-S~l = (S"1)"1 • A• (S"1), kde S"1 je zřejmě regulární. Tedy B ~ A.
c)  tranzitivita: Nechť A ~ B a B ~ C, tzn. existují regulární matice 5, Q tak, že B = S-1 • A ■ S a C = Q-1 • B • Q. Po dosazení dostáváme C = Q-1 ■ S'1 • A • S ■ Q = (S • Q)"1 -A-(S-Q), přičemž matice S ■ Q je zřejmě regulární. Tedy je ^4 ~ C.                                                              D
Definice. Nechť ^4 = (a^) je čtvercová matice řádu n (nad T) a nechť A je proměnná. Pak determinant:
\A-\En\ =
OH — A        Ö12
a21         a22 ~~ A
din (l2n
O-nl
0-n2
se nazývá charakteristický polynom matice A.
Poznámka. Provedeme-li výpočet předchozího determinantu (např. užitím věty 2.2., kap. IL), dostaneme:
\A -XEn\ = (-l)n ■ \n + (-l)""1 • (au + a22
).A™-1 + ... + |^|.
Je tedy okamžitě vidět, že se skutečně jedná o polynom proměnné A, který je stupně n a jeho koeficienty jsou z číselného tělesa T. Konkrétně, například pro n = 3 dostaneme rozepsáním:
\A-XE3\ = -A3 + (au + a22 + 033) • A2 -
on - A	Ö12		Ö13	
«21          Ö22 — A			Ö23	
«31               «32			(Z33 - A	
«li     a12	+	OH	Ö13	+
«21     «22		Ö31	Ö33	
Ö22     Ö23 Ö32     Ö33
•A + L4|.
Věta 2.7. Nechť A, B jsou podobné matice. Pak matice A, B mají:
(1)  stejné determinanty, tj. \A\ = \B\,
(2)  stejnou hodnost, tj. h(A) = h(B),
(3)  stejné charakteristické polynomy, tj. \A — \En\ = \B — \En\.
Důkaz. Nechť A, B G Matnra(T) jsou podobné matice, tzn. existuje regulární matice S tak, že B = S-1 • A- S. Potom:
(1): Užitím Cauchyovy věty a věty 3.9. (3), kap. IL, dostáváme:
2 Lineární transformace a její matice
111
\B\ = \S-^A-S\ = ±-\A\.\S\ = \A\.
(2): Užitím věty 4.5. (2), kap. IL, je:
h(B) = hiS-1 -A-S) = h(A-S) = h(A).
(3): Užitím Cauchyovy věty a zřejmého faktu, že \En = 51-1 • (\En) ■ S, dostáváme:
\B - XEn\ = IS'1 -A-S-S-1- (XEn) ■ S\ = {S'1 ■ (A - XEn) ■ S\ = ±-\A-\En\-\S\ = \A-\En\.
D
Poznámka. Připomeňme, že předchozí větu nelze obrátit, tzn. rovnost determinantů, rovnost hodností a rovnost charakteristických polynomů dvou matic jsou pouze nutné, nikoliv však dostatečné podmínky pro podobnost těchto matic. Vezmeme-li např. matice:
E2=\0   l)'    B=\0   !)'
pak zřejmě {E^l = \B\, /i(£,2) = h(B) a \E% — XE2\ = \B — \E<z\, ale matice Ei a B nejsou podobné (neboť pro každou regulární matici S řádu 2 je 5_1 -E2-S = E2, což znamená, že matice E2 je podobná pouze sama sobě).
Jak již bylo řečeno, všechny matice dané lineární transformace 93 jsou navzájem podobné. Z předchozí věty potom plyne, že determinant (resp. hodnost, resp. charakteristický polynom) všech matic dané lineární transformace (p je vždy stejný. Vidíme tedy, že tyto pojmy závisí pouze na lineární transformaci samotné, nikoliv na její konkrétní matici v jisté bázi. Z tohoto zjištění pak plyne korektnost následujícího pojmu a věty.
Definice. Nechť 93 je lineární transformace vektorového prostoru V a nechť A je matice lineární transformace 93 (v jisté bázi prostoru V). Pak charakteristický polynom matice A, tj. \A—XEn\, se nazývá charakteristický polynom lineární transformace tp.
Věta 2.8. Nechť<p je lineární transformace vektorového prostoru V a nechť A je matice lineární transformace tp (v jisté bází prostoru V). Pak:
dimlm</? = h(A),
112
Lineární zobrazení vektorových prostorů
nebolí hodnost lineární transformace tp je rovna hodností její matice A.
Důkaz. Nechť A je matice lineární transformace p v bázi ui,...,un, kterou označme (1). Podle věty 1.2. (2) vektory p(u\),..., <p(un) jsou generátory podprostoru <p(V) = Imcp, přičemž souřadnice těchto vektorů v bázi (1) tvoří po řadě řádky matice A', tj. transponované matice k matici A.
Přiřadíme-li nyní každému vektoru z V uspořádanou n-tici jeho souřadnic v bázi (1), dostaneme izomorfismus prostoru V na prostor Tn, pomocí něhož již lehce ukážeme, že h(A') = dim Im p (rozmyslete si podrobně sami!). Ale h(A') = h(A), a tedy dim Im ip = h(A).                                   \J
§3.   Vlastní vektory a vlastní hodnoty lineární transformace
Definice. Nechť <p> je lineární transformace vektorového prostoru V. Podprostor W vektorového prostoru V se nazývá invariantní podprostor vzhledem k p>, je-li:
tp(W) C W,
tzn. pro libovolný vektor x G W platí (p(x) G W.
Příklad 3.1. Nechť V je libovolný pevný vektorový prostor nad T. Uvažme:
1.  Identickou lineární transformaci idy : V —> V. Pak zřejmě každý podprostor W ve V je invariantní vzhledem k idy.
2.  Nulovou lineární transformaci co : V —> V (definovanou oj{x) = o pro Víc G V). Pak opět každý podprostor W ve V je invariantní vzhledem k co.
3.  Libovolnou lineární transformaci <p : V —> V. Pak triviální podpro-story ve V (tzn. podprostory {o} a V) jsou invariantní vzhledem k ip.
Příklad 3.2. Ve vektorovém prostoru I? uvažme podprostor W = {(x, 0) | x G K} a dále uvažme dvě lineární transformace <p a i/) prostoru K2 definované:
<p((xi,X2)) = (Xi +3>2,0),
ip((x1,x2)) = (x2,x1)
pro každé (2:1,2:2) £ K2. Lehce se ověří, že W je invariantní podprostor vzhledem k </?, zatímco tentýž podprostor W není invariantním podprosto-rem vzhledem k ý (neboť například (1,0) G W, ale ^((1? 0)) = (0,1) g" W).
3 Vlastní vektory a vlastní hodnoty lineární transformace                     113
Poznámka. V příkladu 3.1. jsou uvedeny speciální, triviální případy. Uvědomme si, že obecně podprostor W může, ale nemusí být invariantní vzhledem k ip a dále, že podprostor, který je invariantní vzhledem k jedné lineární transformaci, nemusí být invariantní vzhledem k jiné lineární transformaci (viz příklad 3.2.). Vidíme tedy, že pojem invariantního podprostoru je vždy vázán na pevnou lineární transformaci.
Další příklady obecných konstrukcí invariantních podprostoru (vzhledem k ip) nám ukáží následující dvě věty.
Věta 3.1. Nechť <p je lineární transformace prostoru V. Pak jádro Kenp a obraz lm<p jsou invariantními podprostory vzhledem k <p.
Důkaz. Podle věty 1.5. jsou Ker </? i Im (p podprostory ve V. Ukážeme jejich invariantnost vzhledem k <p. Nechť u G Ker<^ libovolný. Pak <p(u) = o G Ker<y2, a tedy Ker</? je invariantní vzhledem k (p. Dále nechť u G Imcp libovolný, tzn. zřejmě u € V. Pak ale <p(u) G tp(V) = Im tp, a Im tp je tedy invariantní vzhledem k tp.                                                                         D
Věta 3.2. Necht (p je lineární transformace prostoru V a nechť'W\,..., Wk jsou podprostory ve V, které jsou invariantní vzhledem k cp. Pak průnik (Wi H • • • H Wk) a součet (W\ + • • • + Wk) jsou invariantní podprostory vzhledem k <p.
Důkaz. Víme, že (W\ fl • • • H Wk), resp. (W\ -\-----+ Wk) jsou podprostory
ve V. Dále:
a)  Nechť u G W\ C\ ■ ■ ■ D Wk libovolný. Pak u £Wi & podle předpokladu ip(u) G Wi pro i = 1,..., k. Tedy ip(u) G W\ fl • • • fl Wk, což znamená, že W\ fl • • • fl Wk je invariantní podprostor vzhledem k ip.
b)  Označme W = W\ -\-------h Wk- Nechť u GW, tzn. u = U\ -\-------h Uk,
kde Ui G Wi. Pak ale ip(u) = <p>{u\ H-------h Uk) = <p(u{) H-------h <p(uk) G W,
neboť podle předpokladu <p{ui) G Wj. Tedy W je invariantní podprostor vzhledem k cp.                                                                                            □
Důležitou roli při studiu lineárních transformací hrají jednodimenzionální invariantní podprostory. Z kapitoly o vektorových prostorech víme, že jednodimenzionální podprostor W ve vektorovém prostoru V (nad T) je generován jedním nenulovým vektorem u G V, tzn. je pak:
W = L(u) = {t-u\t£T}.
114
Lineární zobrazení vektorových prostorů
Máme-li navíc dánu lineární transformaci <p prostoru V, pak zřejmě pod-prostor W = L(u) je invariantní vzhledem k 92, právě když existuje číslo A £ T tak, že f(u) = A • u1 tzn. právě když se generátor u podprostoru W zobrazí na jistý svůj násobek (rozepište si podrobně sami!). A právě vektory tohoto typu se budeme v dalším zabývat.
Definice. Nechť 93 je lineární transformace vektorového prostoru V (nad T). Nechť u € F, A G T splňují:
u ^ o   A   ip(u) = A • u.
Pak číslo A se nazývá vlastní hodnota lineami transformace <p a vektor u se nazývá vlastní vektor lineární transformace tp příslušný vlastní hodnotě A.
Poznámka. Z předchozí definice ihned plyne, že je-li u vlastním vektorem ip příslušným vlastní hodnotě A, pak také každý nenulový vektor w G L (u), tj. každý nenulový násobek vektoru u, je rovněž vlastním vektorem <p příslušným téže vlastní hodnotě A.
Příklad 3.3. Nechť V je vektorový prostor nad T. Dále:
1.  Nechť idy : V —> V je identická lineární transformace prostoru V. Pak zřejmě každý nenulový vektor z V je vlastním vektorem idy příslušným vlastní hodnotě A = 1 (což je jediná vlastní hodnota idy).
2.  Nechť oj : V —> V je nulová lineární transformace prostoru V. Pak podobně každý nenulový vektor z V je vlastním vektorem transformace oj příslušným vlastní hodnotě A = 0 (což je opět jediná vlastní hodnota oj).
3.  Nechť (p : V —> V je libovolná lineární transformace. Pak všechny nenulové vektory z Ker <p (pokud existují) jsou vlastními vektory <p příslušnými vlastní hodnotě A = 0. Přitom samozřejmě <p může obecně mít další vlastní hodnoty a jim odpovídající vlastní vektory.
Příklad 3.4. Nechť S : Kn[a;] —> ^n[x] je lineární transformace derivování (viz příklad 1.3.). Bezprostředně je vidět, že polynomy stupně nula (tj. nenulové reálné konstantní polynomy) jsou vlastními vektory transformace ô příslušnými vlastní hodnotě A = 0 a že žádné jiné vlastní hodnoty a vlastní vektory 6 neexistují.
3 Vlastní vektory a vlastní hodnoty lineární transformace                     115
Předchozí příklady vlastních hodnot a vektorů byly víceméně triviální. Úplný popis vlastních hodnot a vlastních vektorů lineární transformace v obecném případě podává následující věta.
Věta 3.3. Nechť tp je lineární transformace vektorového prostoru V nad T. Pak:
(1)  vlastními hodnotami tp jsou právě všechny kořeny (patřící do T) charakteristického polynomu transformace tp,
(2)  je-li X £ T vlastní hodnota tp, pak vlastní vektory tp příslušné X jsou právě všechny nenulové vektory z podprostoru Ker(</? — A • idy).
Důkaz. (2): Nechť A G T je vlastní hodnota tp. Pak u £ V je vlastní vektor tp příslušný vlastní hodnotě A, právě když:
u ^ o   A   tp(u) = X ■ u.                                   (1)
Ale X-u = A-idy(ií), a tedy po dosazení a úpravě (1) dostáváme ekvivalentní podmínku:
u^o   A    (ip - X ■ idy)(ií) = o.                             (2)
Ale množina vektorů splňujících (2) je rovna množině všech nenulových vektorů z podprostoru Kei(<p> — X ■ idy) vektorového prostoru V.
(1): Z právě dokázaného a z vět 2.8. a 1.7. plyne: A je vlastní hodnota ip <í=^ A G T a Ker(</? — A • idy) ^ {o} <í=^ A G T a matice lineární transformace tp — X ■ idy (v pevné bázi prostoru V) je singulární. Ale je-li A maticí lineární transformace <p (v pevné bázi V), pak (^4 — A • En) je maticí lineární transformace <p — X ■ idy (v téže bázi). Tedy pak A je vlastní hodnota <p> <^=^ A G T a \A — X ■ En\ =0, neboli A G T je kořenem charakteristického polynomu lineární transformace (p.                              D
Důsledek. Nechť tp je lineární transformace prostoru V, nechť A = (a-ij), 1 < «, j < rij je matice tp (v dané bází prostoru V) a nechť X je vlastní hodnota tp. Pak vlastní vektory transformace tp příslušné X (vyjádřené v dané bázi) jsou právě všechna nenulová řešeni soustavy lineárních rovnic:
(an - X)xi +           ai2^2 H-------\-           ainxn = 0
«21^1  +  (ö22 - A)a;2  H--------h              02n^n  = 0
•                  (3)
anixi +          an2^2 H-------h (ann - X)xn = 0
116
Lineární zobrazení vektorových prostorů
Důkaz. Nechť Mi,..., un je daná báze V a nechť vektor u má v této bázi souřadnice (x\,... ,xn), tj. u = x\ ■ U\ + • • • + xn ■ un. Pak po dosazení a úpravě dostáváme:
(ip — A • idy) (ti) = <p(u) — A • u = ((au - X)xi + 0,12X2 H--------h ainxn) ■ ui + (ö2i#i + (ö22 - A)aľ2 H--------h
Ö2n^n) • U2 H--------h (úSnl^l + an2X2 H--------h (cinn - \)xn) ■ Un.
Podle předchozí věty je však u vlastním vektorem transformace <p příslušným vlastní hodnotě A, právě když u j^ o a u £ Ker(</? — A • idy). Ale to vzhledem k předchozímu vyjádření nastane, právě když u je nenulový a jeho souřadnice splňují (3).                                                                              D
Poznámka. 1. S problémem nalezení vlastních hodnot a vlastních vektorů se velmi často setkáváme při řešení praktických úloh, a to nejen v matematice, ale i v různých technických aplikacích. Uvědomme si však, že předchozí věta nám dává odpověď pouze na teoretické úrovni, neboť hledání vlastních hodnot převádí na hledání kořenů polynomu n-tého stupně, což je úloha, která obecně není algoritmicky řešitelná. Samozřejmě existuje pro hledání vlastních hodnot a vlastních vektorů řada numerických metod, které však zde nebudeme uvádět, neboť přesahují rámec tohoto kurzu.
2. Poznamenejme ještě, že z hlediska aplikací bývá výhodné sestavit z vlastních vektorů bázi prostoru V (pokud samozřejmě taková báze vůbec existuje), neboť potom se celá situace početně velmi zjednoduší. Důvodem je, že daná lineární transformace má pak v takové bázi diagonální matici. (Diagonální matice je čtvercová matice, v níž všude mimo hlavní diagonálu stojí samé nuly. Přitom v hlavní diagonále nuly být mohou, ale nemusí.)
Skutečně, je-li ui,...,un báze prostoru V sestávající z vlastních vektorů lineární transformace tp příslušných vlastním hodnotám Ai,..., An, pak je
(f(ui) = Al -«i,  ..
(p v bázi «i,... ,tir
, <p(un) = An • Mn, a tedy matice lineární transformace má tvar:
/%
0 0
0
o
A2 0
0 0
0
o
A3
0 0
0
o o
An-1
0
0\ 0
o o
An/
(4)
Naopak, má-li lineární transformace tp v nějaké bázi mi, ..., un diagonální matici tvaru (4), pak Mi,...,Mn jsou zřejmě vlastními vektory lineární
3 Vlastní vektory a vlastní hodnoty lineární transformace
117
transformace tp příslušnými vlastním hodnotám Ai,..., An (jak plyne ihned z definice matice lineární transformace).
Následující úvahy nás přivedou k jedné dostatečné podmínce pro existenci výše popsané báze, tj. báze sestávající z vlastních vektorů dané lineární transformace.
Věta 3.4. Nechť tp je lineární transformace prostoru V. Pak vlastni vektory lineární transformace tp příslušné navzájem různým vlastním hodnotám jsou lineárně nezávislé.
Důkaz. Nechť u\,..., Uk jsou vlastní vektory lineární transformace tp příslušné navzájem různým vlastním hodnotám Ai,...,Afc. Z posloupnosti vektorů «i,..., Uk vybereme libovolnou maximální lineárně nezávislou posloupnost. Bez újmy na obecnosti lze předpokládat, že ji tvoří například prvních r vektorů, tj. u\,... ,ur. Zřejmě je 1 < r < k. Dále pokračujme sporem. Předpokládejme, že r < k. Pak lze ale psát:
r ur+l = ZX • uh    U S T,                                      (5)
i-1
odkud po vynásobení číslem Ar_|_i dostáváme:
r
Xr+1 • Ur+l = zJ'V+l ' ti ' ui-
i=l
Současně však je:
(r               \          r
YU • Ui     = XX • Xi -Ui. i-1           J        i-1
Porovnáním pravých stran pak dostáváme:
r                                    r
E^r+1 'ti- Ui = Y^ti • Xi • Ui, i-1                                i-1
odkud:
r
Yti • (Ar+i - Xi)   uí = o.
i-1
Z předpokládané lineární nezávislosti vektorů ui,...,ur však plyne, že ti •
(Xr+i — Xi) = 0 pro i = 1,..., r. Podle předpokladu věty je však Ar_|_i — XíÝ 0, a tedy musí být ti = 0 pro i = 1,..., r. Po dosazení do (5) pak dostáváme,
118
Lineární zobrazení vektorových prostorů
že ur+i = o, což je ale spor s definicí vlastního vektoru. Je tedy r = k, tzn. vektory ui,...,Uk jsou lineárně nezávislé.                                                D
Důsledek. Nechť <p je lineárni transformace n-dimenzionálního vektorového prostoru V, která má n navzájem různých vlastních hodnot. Pak matice lineárni transformace <p v bázi sestávající z vlastních vektorů příslušných těmto vlastním, hodnotám je diagonální.
Důkaz. Nechť u\,..., un jsou vlastní vektory příslušné navzájem různým vlastním hodnotám Ai,..., Ara lineární transformace <p. Pak podle předchozí věty vektory ui,...,un tvoří bázi prostoru V a tvrzení důsledku ihned plyne z 2. části poslední poznámky.                                                          D
§4.   Ortogonální zobrazení, ortogonální matice
V tomto paragrafu se vrátíme k euklidovským vektorovým prostorům (tj. k vektorovým prostorům nad R, v nichž je definován skalární součin) a budeme studovat vzájemné vztahy mezi nimi. Použijeme k tomu lineárních zobrazení (podobně jako u vektorových prostorů v §1 a §2), která však navíc budou „zachovávat skalární součin".
Definice. Nechť V, V jsou euklidovské vektorové prostory. Nechť ip : V —> V' je lineární zobrazení, pro něž platí:
u • v = <p(u) • <p(v)
pro každé u, v G V. Pak <p se nazývá ortogonální zobrazení euklidovského prostoru V do V.
Je-li navíc zobrazení y> bijektivní, pak se nazývá izomorfizmus euklidovského prostoru V na, V a, euklidovské prostory V, V se nazývají izomorfní.
Je-li specielně V = V, pak se ortogonální zobrazení tp nazývá ortogonální transformace euklidovského prostoru V.
Podmínku „zachování skalárního součinu" z předchozí definice je možné vyjádřit několika ekvivalentními způsoby, jak ukazuje následující věta.
Věta 4.1. Nechť V, V jsou euklidovské prostory a ip : V —¥ V je lineární zobrazení. Pak následující výroky jsou ekvivalentní: (1) u • v = <p(u) • <p(v)   pro každé u,v G V,
4 Ortogonální zobrazení, ortogonální matice
119
(2)  || u || = || (p{u) ||   pro každé u E V,
(3)  jsou-li «i,... ,Uk ortonormální vektory ve V, pak p{u\),..., </?(«&) jsou ortonormální vektory ve V.
Důkaz. „(1) ^> (2)": Nechť platí (1) a nechť u E V. Pak (užitím (1)) dostáváme:
|| u ||   = u ■ u = <p(u) ■ <p{u) = || <p(u) || ,
odkud pak ||ti|| = || <p(u) ||.
„(2) =4> (3)": Nechť platí (2) a nechť u\,... ,Uk jsou ortonormální vektory ve V. Nechť i, j = 1,..., k. Pak (užitím (2)):
- pro i = j platí:
ip(Ui) ■ ip(Ui) = || ip(Ui) ||2 = || Ui ||2 = 1,
- pro i t^ j platí:
2-ip(Ui) -<p(Uj) = ip(Ui + Uj) ■ ip(Ui + Uj) - <p(Ui) ■ ip(Ui) - tp(Uj) ■ tp(Uj) = ||<ŕ(«i + Uj) ||    -||<ŕ(«i)ll    _ II ^(^j) II     =llwí+wjll    — lluíll    — llujll    =
2 ■ Ui ■ Uj = 0,
odkud tedy 9?(mj) • <p(uj) = 0.
Dohromady dostáváme, že vektory (p(u\),..., <p(uk) jsou ortonormální.
„(3) =>- (1)": Nechť platí (3) a u,v E V. Je-li m = o, pak zřejmě platí (1). Nechť tedy u ^ o. Mohou nastat dva případy:
a) Vektory u, v jsou lineárně nezávislé. Pak podle poznámky za větou 2.3., kap. IV., existují ortonormální vektory ei, e2 tak, že u = u\ ■ e\ + u^ ■ e<i, v = v\ ■ e\ + v^ ■ e.i- Podle (3) však y(ei), <p{e2) jsou ortonormální vektory a platí:
<p(u) ■ <p(v) = <p(ui ■ ei + U2 ■ e2) • <p(vi ■ e\ + w2 • e2) = u\V\ + «2^2 =
u ■ v.
ß) Vektory ií, v jsou lineárně závislé. Pak opět podle poznámky za větou 2.3., kap. IV., existuje normovaný vektor e tak, že u = t ■ e, v = s ■ e. Podle (3) je vektor (p(e) normovaný a platí:
(f (u) ■ (p(v) = (p(t ■ e) • (p(s ■ e) = t ■ s = (t ■ e) • (s ■ e) = u ■ v.
Dohromady tak dostáváme, že platí (1).                                                   D
120
Lineární zobrazení vektorových prostorů
Věta 4.2. (Věta o izomorfismu euklidovských prostorů) Dva euklidovské prostory jsou izomorfní, právě když mají stejnou dimenzí.
Důkaz. Nechť V, V jsou euklidovské prostory. Potom:
„=£-": Nechť V, V jsou izomorfní (ve smyslu izomorfismu euklidovských
prostorů). Pak jsou V, V izomorfní jako vektorové prostory a podle věty
o izomorfismu vektorových prostorů je dim V = dim V.
„<=u: Nechť dim V = dim V = n. Je-li n = 0, pak zřejmě V a V jsou
izomorfní. Nechť tedy n>la nechť dále:
ei,..., en je ortonormální báze V, resp.
e'1?..., e'n je ortonormální báze V. Nechť u £ V je libovolný vektor, přičemž:
n
U = Y^ui • ei-i=l
Položme:
n
(p(u) = x>ť ■ e'i-
Pak (f je zřejmě zobrazení prostoru V do V, o němž se rozepsáním lehce ověří, že je bijektivní a že je lineárním zobrazením. Navíc je:
\\ip(u)\\2 = ip(u) -<p(u) = í E^-eíJ • í 1tuj-e'j) =
U\U\ + • • • + UnUn = U • U =  I) U I)   ,
tzn.  j) (p{u) || = || ti ||, a tedy tp je podle věty 4.1. ortogonální zobrazení. Dohromady pak (p je izomorfismem euklidovského prostoru V na V.       D
Věta 4.3. Nechť V, V jsou euklidovské prostory, tp : V —> V je ortogonální zobrazení. Pak <p je injektivní zobrazení.
Důkaz. Nechť x G Ker^, tzn. (f(x) = o'. Pak podle věty 4.1. je:
|| a; || = || </?(#) || = || o'|| = 0,
4 Ortogonální zobrazení, ortogonální matice
121
a tedy (podle věty 1.4. (1), kap. IV.) je x = o. Dostáváme, že Ker ip = {o}, odkud podle věty 1.6. plyne, že <p je injektivní zobrazení.                         D
Ve zbývající části tohoto paragrafu se budeme zabývat ortogonálními transformacemi daného euklidovského prostoru V. Je-li specielně V = {o} nulový euklidovský prostor, pak zřejmě jedinou možnou ortogonální transformací prostoru V je identické zobrazení. Tento triviální případ nebudeme v dalším uvažovat a budeme se zabývat pouze ortogonálními transformacemi nenulového euklidovského prostoru V. Některé základní vlastnosti ortogonální transformace nenulového euklidovského prostoru popisuje následující věta.
Věta 4.4. Nechť (p : V —>• V je ortogonální transformace euklidovského prostoru V. Pak platí:
(1)  <p je bijektivní zobrazení,
(2)  inverzní zobrazení (p~l je ortogonální transformací prostoru V,
(3)  je-li A vlastní hodnota ortogonální transformace <p, pak A = ±1.
Důkaz. (1): Plyne přímo z vět 4.3. a 2.1.
(2): Zřejmě ip~l : V —> V a podle důkazu věty 1.8. je ip~l lineární zobrazení. Dále, nechť u, v G V libovolné. Označme ip~l{u) = x, (p~l(y) = y. Potom <p(x) = u, <p{y) = v a platí:
u ■ v = ip(x) ■ ip(y) = x ■ y = ^(u) ■ </>_1(u),
tzn. dostáváme, že (p~l je ortogonální transformace euklidovského prostoru V.
(3): Nechť A je vlastní hodnota (p (tj. musí být A G IR) a nechť u je vlastní vektor ip příslušný vlastní hodnotě A. Pak je (p(u) = A • u a u j^ o, odkud:
u • u = (p(u) ■ (p(u) = (A • u) ■ (A • u) = A2 • (u • u).
Ale u ■ u j^ 0 (poněvadž u j^ o), a tedy musí být A2 = 1, neboli A = ±1.    □
Každá ortogonální transformace (euklidovského) prostoru V je zřejmě lineární transformací tohoto (vektorového) prostoru V, a tedy můžeme sestrojit její matici v nějaké dané bázi prostoru V, specielně např. v dané ortonormální bázi prostoru V. Ukážeme, že v takovém případě bude pak mít tato matice jistý speciální tvar.
122
Lineární zobrazení vektorových prostorů
Definice. Nechť A je čtvercová matice nad M taková, že A je regulární a platí A~l = A' (tj. inverzní matice je rovna matici transponované). Pak matice A se nazývá ortogonální matice.
Věta 4.5. Nechť A je čtvercová matice řádu n nad R. Pak následující výroky jsou ekvivalentní:
(1)  A je ortogonální matice,
(2)  A-A' = En,
(3)  A'-A = En.
Důkaz. Věta plyne bezprostředně z definice ortogonální matice, definice inverzní matice a poznámky za větou 3.10., kap. II.                                 D
Věta 4.6. Nechť A, B jsou ortogonální matice řádu n. Pak platí:
(1)  A ■ B je ortogonální matice,
(2)  A~ľ je ortogonální matice,
(3)  \A\ = ±1.
Důkaz. (1): (A ■ B) ■ (A ■ B)' = A ■ (B ■ B') ■ A' = A ■ En ■ A' = A ■ A' = En, a tedy podle věty 4.5. je A ■ B ortogonální maticí.
(2): Plyne z věty 4.5., uvážíme-li, že (A1)' = A.
(3): Víme, že \A\ = \A'\, tzn. pak z věty 4.5. a z Cauchyovy věty dostáváme:
l = \En\ = \A-A'\ = \A\-\A'\ = \A\2,
odkud \A\ = ±1.                                                                                        D
Důsledek. Množina všech ortogonálních matic řádu n s operací násobení matic je grupou.
Důkaz. Tvrzení plyne z předchozí věty, uvědomíme-li si, že násobení matic je asociativní a že jednotková matice En je ortogonální.                           D
Věta 4.7. Nechť V je euklidovský prostor a tp : V —>• V je lineární transformace. Pak (p je ortogonální transformace *<=> matice transformace <p v ortonormální bázi prostoru V je ortogonální.
Důkaz. Nechť:
ei,...,en                                              (1)
4 Ortogonální zobrazení, ortogonální matice
123
je ortonormální báze prostoru V a nechť A = (oý-) je matice lineární transformace (p v bázi (1). Dále:
„=£-": Nechť tp je ortogonální transformace prostoru V. Pak podle věty 4.1. vektory </?(ei),..., <^(en) tvoří ortonormální bázi prostoru V. Označme ,4- ,4' = B = {bij). Potom:
n
fy? = Haik- a j k = (an ■ e\ H-------h ain ■ en) ■ (aji ■ e\ H-------h ajn ■ en) =
<p(ei) ■ <p(ej),
odkud plyne, že bij = 1 pro i = j, resp. bij = 0 pro i ^ j. Tedy A ■ A' = En a podle věty 4.5. je matice A ortogonální.
„<í=": Nechť matice A je ortogonální, tzn. platí (dle věty 4.5. (3)):
"                    í 1    pro i = j
E «fei • Ofcj = < n           ...                                (2)
k=i                  [0    proí^j
n
Nechť dále u £ V libovolný, přičemž u = E1*« ■ e,. Potom:
i=l
n2
i«ir = «•« = EM?-
Dále:
n                          n           n                       n    / n           \
</>(«) = E^i • y(ej) = E^i • E «K • efc = E  Y,akiUi  ■ ek,
i=l                       i=l        k=l                   k=l \i=l          /
odkud rozepsáním a úpravou dostáváme:
n    n    /  n              \
IM«) II = </>(«)•</>(«) = E E ( Eßfcjöfej pj%,
i=ij=i \fc=i       /
tzn. po dosazení (2) je pak:
n
IM«) II2 = E«?.
Dohromady tedy ||u||   = || <p(u) || , neboli ||u|| = || <£>(«) ||, což znamená, že tp je ortogonální transformace.                                                              D
Na závěr ještě ukážeme, že maticemi přechodu od ortonormální báze k ortonormální bázi euklidovského prostoru jsou právě ortogonální matice.
124
Lineární zobrazení vektorových prostorů
Věta 4.8. Nechť:
«i,...,«n                                                        (3)
vt,...,vn                                              (4)
jsou báze euklidovského prostoru V a nechť báze (3) je ortonormální. Pak platí: matice přechodu od báze (3) k bázi (4) je ortogonální -4=>- báze (4) je ortonormální.
Důkaz. Nechť A = (a^) je matice přechodu od báze (3) k bázi (4), tzn. platí:
n
Vi =   Yl aki ■ Uk fc=l
pro i = 1,..., n. Potom však:
vi ■ v j =  \Yj aki ■ Uk\ ■ [ Í2alj ■ ul )  = alialj H--------1" aniünj,
odkud již (užitím věty 4.5.) bezprostředně plyne celé tvrzení věty.           D