Pavel Horák LINEÁRNÍ ALGEBRA A GEOMETRIE 1 UČEBNÍ TEXT 2 0 1 7 Obsah 1 Vektorové prostory 2 1 Vektorový prostor, podprostory . . . . . . . . . . . . . . . . . . . . . . . . 2 2 Generování podprostor ‌u . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 3 Lineární závislost a nezávislost vektor ‌u . . . . . . . . . . . . . . . . . . . . 13 4 Báze a dimenze vektorového prostoru . . . . . . . . . . . . . . . . . . . . . 17 2 Matice a determinanty 25 1 Pořadí a permutace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 2 Determinanty . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 3 Algebra matic . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 4 Hodnost matice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 5 Další vlastnosti a užití matic . . . . . . . . . . . . . . . . . . . . . . . . . . 52 3 Soustavy lineárních rovnic 58 1 Gaussova metoda řešení soustav lineárních rovnic . . . . . . . . . . . . . . 58 2 Základní vlastnosti soustav lineárních rovnic . . . . . . . . . . . . . . . . . 63 3 Homogenní soustavy lineárních rovnic . . . . . . . . . . . . . . . . . . . . . 67 4 Euklidovské vektorové prostory 73 1 Skalární součin, velikost a odchylka vektorů . . . . . . . . . . . . . . . . . 73 2 Ortogonálnost . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 5 Lineární zobrazení vektorových prostorů 85 1 Základní vlastnosti lineárního zobrazení . . . . . . . . . . . . . . . . . . . . 85 2 Lineární transformace a její matice . . . . . . . . . . . . . . . . . . . . . . 93 3 Vlastní vektory a vlastní hodnoty . . . . . . . . . . . . . . . . . . . . . . . 101 4 Ortogonální zobrazení, ortogonální matice . . . . . . . . . . . . . . . . . . 106 ii Ú V O D Tento učební text je určen pro předmět M 1115 Lineární algebra a geometrie 1, který je povinným předmětem v bakalářském studijním programu Matematika, studijních oborech Matematika se zaměřením na vzdělávání a Matematika pro víceoborové studium na přírodovědecké fakultě Masarykovy Univerzity v Brně. Jedná se o jednosemestrální kurz, který je doporučeno absolvovat ve 2. semestru studia a který navazuje na předmět M 1125 Základy matematiky. Učební text předpokládá jednak elementární znalosti středoškolské matematiky a dále pak základní znalosti látky absolvované v předmětu Základy matematiky. Po formální stránce je výklad veden co nejpodrobněji, přičemž se vždy výslovně připomínají drobná úskalí a důležité maličkosti, které by méně zkušený čtenář mohl často přehlédnout. Z těchto důvodů má podrobné studium poznámek a komentářů přinejmenším stejný význam jako "učení se" definic a vět. Totéž platí i pro důkazy jednotlivých tvrzení, které jsou zde v převážné většině naprosto přirozené, průhledné a bez umělých obratů. Konec důkazu je v textu vždy opticky označen symbolem , umístěným na konci příslušného řádku. Pro označování základních číselných množin jsou v textu použity následující standardní symboly: N . . . množina všech přirozených čísel, tzn. čísel 1, 2, 3, . . . Z . . . množina všech celých čísel Q . . . množina všech racionálních čísel R . . . množina všech reálných čísel C . . . množina všech komplexních čísel. iii Obsah 1 Kapitola 1 Vektorové prostory §1. Vektorový prostor, podprostory Pojem vektoru a vektorového prostoru je jedním ze základních pojmů moderní matematiky, kterého se využívá nejenom v řadě disciplín ryzí matematiky, ale rovněž v mnoha aplikacích, ať už v přírodních vědách nebo jinde. Při zavádění pojmu vektorového prostoru se situace poněkud komplikuje v tom, že pracujeme současně se dvěma algebraickými strukturami, a to s jistou komutativní grupou (V, +), jejíž prvky budeme označovat tučnými písmeny, a dále s jistým číselným tělesem (T, +, ·). Mezi těmito dvěma strukturami pak budou platit určité vazby. Pro zjednodušení vyjadřování si zaveďme následující úmluvu : při zapisování algebraických struktur už nebudeme vždy důsledně vypisovat symboly operací, ale často budeme k označení celé struktury používat pouze symbol nosné množiny. Tedy např. místo o grupě (V, +) budeme stručně hovořit o grupě V , místo o tělese (T, +, ·) budeme stručně hovořit o tělese T, atd. Přitom je však třeba mít stále na paměti, že se jedná o zjednodušené označení, protože, jak víme, algebraickou strukturu nelze ztotožňovat pouze s její nosnou množinou. Definice. Nechť V je komutativní grupa (jejíž prvky nazýváme vektory) a T je číselné těleso. Nechť pro každé číslo t ∈ T a každý vektor u ∈ V je definován vektor t · u ∈ V tak, že pro libovolné t, s ∈ T a u, v ∈ V platí: 1. t · (u + v) = t · u + t · v, 2. (t + s) · u = t · u + s · u, 3. (t · s) · u = t · (s · u), 4. 1 · u = u Potom V se nazývá vektorový prostor nad tělesem T. Označení. Nulový prvek grupy V se nazývá nulový vektor a označuje se symbolem o. Opačný prvek k vektoru u se nazývá opačný vektor k vektoru u a označuje se symbolem −u. Vektor t · u se nazývá součin čísla t s vektorem u. Poznámka. Výše definovaný součin čísla s vektorem je vlastně speciálním typem zobrazení, a sice zobrazením T × V → V , které se někdy nazývá vnější operace, na rozdíl od (binární) operace na množině, např. V , což je zobrazení V × V → V , které se pak nazývá vnitřní operace. V definici vektorového prostoru se setkáváme se třemi vnitřními operacemi a jednou vnější operací, přičemž některé z nich označujeme stejnými symboly (sčítání ve V a sčítání v T symbolem +, resp. násobení v T a součin čísla s vektorem symbolem ·). I když nemůže dojít k nedorozumění (vzhledem k tomu, že vektory z V a čísla z T odlišujeme graficky), je třeba si tuto skutečnost dobře uvědomit. 2 Připomeňme, že máme-li korektně definovat nějaký konkrétní vektorový prostor, pak z předchozí definice plyne, že musíme: 1. zadat číselné těleso T, 2. zadat množinu vektorů V , 3. zadat, jak je definováno sčítání vektorů, 4. zadat, jak je definován součin čísla z T s vektorem z V , 5. ověřit, že (V, +) je komutativní grupa a že platí vlastnosti 1. až 4. z definice vektorového prostoru. Příklad 1.1. 1. Vektorový prostor Tn . Nechť T je libovolné číselné těleso a nechť množinou vektorů je Tn = {(x1, . . . , xn) | x1, . . . , xn ∈ T} (tzn. Tn je množina všech uspořádaných n-tic prvků z tělesa T). Definujme pro libovolné u = (u1, . . . , un), v = (v1, . . . , vn) ∈ Tn a libovolné t ∈ T: u + v = (u1 + v1, . . . , un + vn) a t · u = (t · u1, . . . , t · un), kde symboly +, resp. · na pravých stranách značí obyčejné sčítání, resp. násobení čísel (stručně říkáme, že sčítání vektorů a násobení čísla s vektorem je definováno "po složkách"). Pak (Tn , +) je komutativní grupa a lehce se ověří, že platí vlastnosti 1. až 4. z definice vektorového prostoru. Tedy Tn je vektorovým prostorem nad tělesem T. Speciálně, těleso T je samo vektorovým prostorem nad T. Poznamenejme, že nulovým vektorem je ve vektorovém prostoru Tn zřejmě uspořádaná n-tice (0, 0, . . . , 0) a opačným vektorem k (u1, . . . , un) je vektor (−u1, . . . , −un). Speciálně, například R3 , Q5 , C2 , Q( √ 2 )4 , atd. jsou různé vektorové prostory tohoto typu. 2. Vektorový prostor R[x] . Číselným tělesem nechť je těleso R reálných čísel. Množinou vektorů bude množina všech polynomů o neurčité x s reálnými koeficienty, kterou označíme symbolem R[x]. Sčítání vektorů definujeme jako obvyklé sčítání polynomů a součin čísla s vektorem definujeme jako obvyklé násobení reálného čísla s polynomem. Lehce se ověří, že (R[x], +) je komutativní grupa a že platí vlastnosti 1. až 4. z definice vektorového prostoru. Tedy R[x] je vektorovým prostorem nad tělesem R. Nulovým vektorem tohoto vektorového prostoru je pak zřejmě tzv. nulový polynom, tj. polynom, jehož všechny koeficienty jsou nulové. 3. Vektorový prostor Rn[x] . Nechť n je pevné přirozené číslo. Vezměme opět těleso R reálných čísel a množinou vektorů nechť je množina sestávající z nulového polynomu a dále ze všech polynomů o neurčité x s reálnými koeficienty stupně ≤ n, kterou označíme symbolem Rn[x]. Tedy: Rn[x] = {anxn + an−1xn−1 + · · · + a1x + a0 | a0, a1, . . . , an ∈ R}. Sčítání vektorů a součin čísla s vektorem definujeme stejně jako v předchozím příkladu. Lehce se ověří, že (Rn[x], +) je komutativní grupa a že platí vlastnosti 1. až 4. z definice vektorového prostoru. 3 Tedy Rn[x] je vektorovým prostorem nad tělesem R. 4. Nulový vektorový prostor. Nechť T je libovolné číselné těleso a V = {o} je libovolná jednoprvková množina. Sčítání vektorů a součin čísla s vektorem definujeme (jediným možným způsobem) takto: o + o = o a t · o = o, pro každé t ∈ T. Pak zřejmě (V, +) je komutativní grupa a platí vlastnosti 1. až 4. z definice vektorového prostoru. Tedy V je vektorový prostor nad tělesem T, který budeme nazývat nulový vektorový prostor (nad T). Je to tedy vektorový prostor obsahující jediný vektor – a to nulový. Poznámka. Uvědomme si, že množina vektorů V je vždy neprázdná, dále že nulový vektor ve V existuje jediný a opačný vektor k libovolnému vektoru z V existuje rovněž jediný (to vše plyne ihned z faktu, že (V, +) je grupa). Přitom je potřeba důsledně rozlišovat symboly o a 0, tzn. nulový vektor a číslo nula. Dále připomeňme, že podle obvyklé úmluvy budeme místo u+(−v) psát stručně u−v. V následující větě nyní uvedeme další základní pravidla pro počítání s vektory. Věta 1.1. Nechť V je vektorový prostor nad tělesem T, nechť t, s, ∈ T, u, v ∈ V . Pak platí : 1. t · (u − v) = t · u − t · v 2. (t − s) · u = t · u − s · u 3. t · u = o ⇐⇒ t = 0 nebo u = o 4. t · (−u) = (−t) · u = − (t · u) ; speciálně pak (−1) · u = −u . Důkaz. Důkaz provedeme užitím předchozí úmluvy a užitím axiomů 1. až 4. z definice vektorového prostoru, případně užitím již dokázaných početních pravidel. Rozmyslete si vždy sami, která z uvedených vlastností se právě používá. 1: t·(u − v) = t· u + (−v) + t·v − t·v = t· u + (−v) + v − t·v = t·u − t·v. 2: (t − s)·u = t + (−s) ·u + s·u − s·u = t + (−s) + s ·u − s·u = t·u − s·u. 3: dokážeme postupně obě implikace. "⇒": Nechť t · u = o a nechť t = 0 . Potom je : u = 1 · u = 1 t · t · u = 1 t · (t · u) = 1 t · o = 1 t · (o − o) = 1 t · o − 1 t · o = o . "⇐": Je-li t = 0 , pak t · u = 0 · u = (0 − 0) · u = 0 · u − 0 · u = o . Je-li u = o , pak t · u = t · o = t · (o − o) = t · o − t · o = o . 4: t · (−u) = t · (o − u) = t · o − t · u = o − t · u = −(t · u) , (−t) · u = (0 − t) · u = 0 · u − t · u = o − t · u = −(t · u) . Poznámka. V předchozí větě je důležitá zejména její třetí část, která uvádí nutnou a dostatečnou podmínku pro to, aby součin čísla s vektorem byl roven nulovému vektoru. Pomocí ní můžeme mimo jiné upřesnit naši představu o počtu vektorů ve vektorovém prostoru. 4 Je-li V libovolný vektorový prostor nad T různý od nulového prostoru (jinými slovy řečeno – prostor V obsahuje alespoň jeden nenulový vektor), pak musí tento vektorový prostor obsahovat nekonečně mnoho vektorů. Vezmeme-li totiž libovolný nenulový vektor u ∈ V a tvoříme součiny všech prvků z číselného tělesa T (kterých je nekonečně mnoho, protože, jak víme, každé číselné těleso T obsahuje množinu racionálních čísel Q) s tímto vektorem u, dostáváme nekonečně mnoho navzájem různých vektorů, protože platí: u = o ∧ t1 = t2 =⇒ t1 · u = t2 · u . Dokažme toto tvrzení (nepřímo). Je-li t1 · u = t2 · u a u = o , pak (t1 − t2) · u = o , odkud podle věty 1.1. 3. plyne, že je (t1 − t2) = 0 , neboli t1 = t2 . Vidíme tedy, že vektorový prostor nad číselným tělesem musí sestávat buď z jednoho vektoru (nulového) nebo z nekonečně mnoha vektorů. Definice. Nechť V je vektorový prostor nad tělesem T. Neprázdná podmnožina U množiny V se nazývá podprostor vektorového prostoru V , jestliže platí: 1. u, v ∈ U libovolné =⇒ u + v ∈ U 2. t ∈ T, u ∈ U libovolné =⇒ t · u ∈ U. Poznámka. 1. Lehce se dá ověřit (proveďte si podrobně sami!), že podmínky 1. a 2. z předchozí definice jsou ekvivalentní následující jediné podmínce: 3. u, v ∈ U, t, s ∈ T libovolné =⇒ t · u + s · v ∈ U. 2. Každý podprostor U vektorového prostoru V musí vždycky obsahovat nulový vektor (je-li u ∈ U libovolný, pak podle 2. a podle věty 1.1. 3. je 0 · u = o ∈ U). Vidíme tedy, že dva podprostory vektorového prostoru V nemohou být nikdy disjunktní !! Věta 1.2. Nechť U je podprostor vektorového prostoru V nad tělesem T. Pak U je sám vektorovým prostorem nad tělesem T. Důkaz. Součet dvou vektorů z U, resp. součin čísla z T s vektorem z U jsou definovány stejně jako ve V . Definice podprostoru nám potom zaručuje, že jde o vnitřní operaci, resp. vnější operaci na U. Nyní dokážeme, že (U, +) je komutativní grupa, a to tak, že dokážeme, že (U, +) je podgrupou grupy (V, +). K tomu stačí (jak víme) například dokázat, že pro dva vektory u, v ∈ U platí: u − v ∈ U. Nechť u, v ∈ U libovolné. Pak (−1) · v = −v ∈ U, a tedy u − v = u + (−v) ∈ U (podle věty 1.1. 4. a definice podprostoru). Tedy (U, +) je komutativní grupou. Podmínky 1. až 4. z definice vektorového prostoru jsou v U zřejmě splněny (poněvadž jsou splněny v celém V ). Tedy U je vektorový prostor nad tělesem T. 5 Příklad 1.2. 1. Nechť V je libovolný vektorový prostor nad tělesem T. Pak zřejmě U = {o} a U = V jsou vždy podprostory ve V . Tyto dva podprostory se nazývají triviální podprostory. Všechny ostatní podprostory ve V (pokud existují) se nazývají netriviální podprostory. 2. Uvažme vektorový prostor R3 (viz příklad 1.1. 1.). Potom například : U1 = {(x, y, 0) | x, y ∈ R lib.} je podprostor vektorového prostoru R3 , U2 = {(x, y, z) | x, y, z ∈ R ∧ x − 2y + 3z = 0} je podprostor v R3 , Nechť (a, b, c) je pevný vektor prostoru R3 . Potom U3 = {k · (a, b, c) | k ∈ R} je podprostor v R3 . Z posledního příkladu je vidět, že vektorový prostor R3 obsahuje nekonečně mnoho podprostorů. Na druhé straně je jasné, že každá podmnožina v R3 nemusí být podprostorem R3 . Například U4 = {(x, y, 1) | x, y ∈ R} není podprostorem v R3 (zdůvodněte proč!). 3. Uvažme vektorový prostor R[x] všech polynomů (viz příklad 1.1. 2.). Pak např.: U1 = {f(x) ∈ R[x] | f(x) = f(−x)} je podprostor v R[x] U2 = {f(x) ∈ R[x] | 2·f(0) + 3 ·f(1) = 0 } je podprostor v R[x]. Na druhé straně například množina U3 = {x2 + ax + b | a, b ∈ R lib.} není podprostorem v R[x] (proč ?). Definice. Nechť V je vektorový prostor nad T , nechť u1, . . . , uk je konečná posloupnost vektorů z V a t1, . . . , tk ∈ T. Pak vektor: u = t1 · u1 + · · · + tk · uk se nazývá lineární kombinace vektorů u1, . . . , uk. Množinu všech lineárních kombinací vektorů u1, . . . , uk budeme nazývat lineární obal vektorů u1, . . . , uk a budeme ji označovat symbolem L(u1, . . . , uk). Je tedy L(u1, . . . , uk) = { t1·u1 + . . . + tk·uk | t1, . . . , tk ∈ T libovolné } . Poznámka. 1. V předchozí definici hovoříme o "konečné posloupnosti vektorů u1, . . . , uk". Znamená to, že je možné, aby se zde některý z vektorů vyskytoval případně vícekrát (tzn. může se stát, že ui = uj pro i = j) a dále, že vektory chápeme v uvedeném pořadí (tento fakt však bude hrát důležitou roli až v posledním paragrafu této kapitoly). Z důvodů stručnosti budeme však v dalším místo "konečná posloupnost vektorů u1, . . . , uk" říkat obvykle pouze "vektory u1, . . . , uk". 2. Symbol L(u1, . . . , uk) označuje množinu všech (možných) lineárních kombinací vektorů u1, . . . , uk, kterých je zřejmě obecně nekonečně mnoho. Uvědomme si dále, že množina L(u1, . . . , uk) obsahuje vždy mimo jiné : – každý z vektorů u1, . . . , uk (neboť ui = 0·u1 +· · ·+0·ui−1 +1·ui +0·ui+1 +· · ·+0·uk) – nulový vektor (neboť o = 0 · u1 + · · · + 0 · uk). 6 Věta 1.3. Nechť V je vektorový prostor nad T a nechť u1, . . . , uk je konečná posloupnost vektorů z V . Pak lineární obal L(u1, . . . , uk) je podprostorem ve V . Důkaz. Tvrzení dostaneme bezprostředním ověřením definice podprostoru. V tomto textu budeme často dokazovat, že lineární obaly dvou konečných posloupností vektorů jsou v inkluzi nebo že se rovnají. Následující věta nám umožní zjednodušit technické výpočty při těchto důkazech. Věta 1.4. Nechť V je vektorový prostor nad T a nechť u1, . . . , uk a v1, . . . , vs jsou konečné posloupnosti vektorů z V . Pak platí : u1, . . . , uk ∈ L(v1, . . . , vs) =⇒ L(u1, . . . , uk) ⊆ L(v1, . . . , vs) . Důkaz. Tvrzení se dokáže bezprostředním technickým rozepsáním. Jak již bylo řečeno, předchozí větu lze s výhodou použít při práci s lineárními obaly vektorů. Například k tomu, abychom dokázali, že platí množinová rovnost L(u1, . . . , uk) = L(v1, . . . , vs) tedy na základě předchozí věty stačí dokázat, že platí u1, . . . , uk ∈ L(v1, . . . , vs) a dále, že platí v1, . . . , vs ∈ L(u1, . . . , uk). 7 §2. Generování podprostor ‌u Na úvod tohoto paragrafu si nejprve všimneme chování podprostorů vektorového prostoru vzhledem k množinovému průniku. Ukážeme, že průnik libovolného neprázdného systému podprostorů vektorového prostoru V je opět podprostorem ve V . Všimněte si přitom způsobu, jak jsou uvažované podprostory označovány. Vzhledem k tomu, že nevíme "kolik" jich je, musíme k jejich označování použít indexovou množinu. Věta 2.1. Nechť V je vektorový prostor nad tělesem T, nechť I je neprázdná indexová množina a nechť pro každé α ∈ I je Uα podprostor ve V . Potom α∈I Uα je podprostor ve V . Důkaz. Množina α∈I Uα je zřejmě neprázdná (neboť obsahuje jistě nulový vektor o). Zbývá tedy ověřit platnost podmínek 1. a 2. z definice podprostoru. Nechť u, v ∈ α∈I Uα, t ∈ T libovolné. Potom u, v ∈ Uα pro každé α ∈ I, a tedy (poněvadž Uα je podprostor) je také u + v ∈ Uα a t · u ∈ Uα pro každé α ∈ I. To však znamená, že u + v ∈ α∈I Uα a t · u ∈ α∈I Uα . Podmínky 1. a 2. jsou tedy splněny. Poznamenejme, že indexová množina I byla libovolná (neprázdná), a tedy předchozí věta platí jak pro konečný, tak pro nekonečný počet podprostorů. Stručně řečeno, věta tvrdí, že průnikem libovolného počtu podprostorů ve V je opět podprostor ve V . Tohoto faktu využijeme v následující důležité úvaze. Nechť M je libovolná podmnožina vektorového prostoru V (tzn. M obecně není podprostorem!). Pak existuje alespoň jeden podprostor obsahující množinu M (např. celý prostor V má tuto vlastnost). Můžeme tedy utvořit průnik všech podprostorů ve V obsahujících množinu M, který označme symbolem [M] (čti "M v hranaté závorce"). Tedy: [M] = Uα ( Uα je podprostor ve V takový, že M ⊆ Uα ) (1) a platí následující tvrzení. Věta 2.2. Nechť M je libovolná podmnožina ve vektorovém prostoru V . Potom: 1. [M] je podprostor ve V , 2. [M] je nejmenší (vzhledem k ⊆) podprostor ve V obsahující množinu M. Důkaz. 1: Plyne ihned z věty 2.1. 2: Plyne z 1 a ze základních vlastností množinového průniku. Může se stát, že množina M je prázdná. Potom je [ ∅ ] = {o} , tj. podprostor generovaný prázdnou množinou je roven nulovému podprostoru (rozmyslete si proč). 8 Je-li množina M konečná, např. M = {u1, . . . , uk}, pak místo symbolu [{u1, . . . , uk}] budeme psát stručněji [u1, . . . , uk] (čti "u1 až uk v hranaté závorce"). Je tedy: [u1, . . . , uk] = Uα ( Uα je podprostor ve V takový, že u1, . . . , uk ∈ Uα ) (2) Definice. Nechť M je podmnožina ve vektorovém prostoru V . Pak podprostor [M] se nazývá podprostor generovaný množinou M. Dále, podprostor [u1, . . . , uk] se nazývá podprostor generovaný vektory u1, . . . , uk a vektory u1, . . . , uk se nazývají generátory tohoto podprostoru. Poznámka. V předchozí úvaze a definici jsme hovořili o podprostoru generovaném konečnou množinou vektorů. Je zřejmě, že místo "konečné množiny vektorů" můžeme vzít též "konečnou posloupnost vektorů" (případné opakující se vektory ani jejich pořadí zde nehrají žádnou roli) a použít stejnou symboliku. Následující věta nám ukáže, že podprostor generovaný vektory u1, . . . , uk a lineární obal vektorů u1, . . . , uk jsou vlastně jedno a totéž. Věta 2.3. Nechť V je vektorový prostor a nechť u1, . . . , uk je konečná posloupnost vektorů z V . Pak podprostor generovaný vektory u1, . . . , uk je roven lineárnímu obalu těchto vektorů, tzn. [u1, . . . , uk] = L(u1, . . . , uk) Důkaz. Vzhledem k (2) budeme dokazovat množinovou rovnost : Uα ( Uα je podprostor ve V ∧ u1, . . . , uk ∈ Uα ) = L(u1, . . . , uk) . (3) "⊆": Plyne z vlastností množinového průniku, uvědomíme-li si, že L(u1, . . . , uk) je podprostor ve V (podle věty 1.3.) a že je u1, . . . , uk ∈ L(u1, . . . , uk). "⊇": Množina na levé straně (3) je podprostorem ve V obsahujícím vektory u1, . . . , uk, tzn. musí pak obsahovat také jejich libovolnou lineární kombinaci. Příklad 2.1. 1. Rozepsáním se lehce ověří, že například R2 = [(1, 0), (0, 1)] = [(1, 1), (1, 2)] = [(1, 3), (2, 1), (1, −1), (−2, 3)] , atd. Vidíme tedy, že vektorový prostor R2 je možno generovat dvěma a více vektory (zřejmě i nekonečně mnoha). Na druhé straně, prostor R2 evidentně nelze generovat jedním vektorem, neboť : [(a, b)] = L((a, b)) = { (k·a, k·b) | k ∈ R} R2 . 2. Ve vektorovém prostoru Tn označme vektory: e1 = (1, 0, 0, . . . , 0, 0) , e2 = (0, 1, 0, . . . , 0, 0) , . . . , en = (0, 0, 0, . . . , 0, 1) . Potom zřejmě platí, že Tn = L(e1, . . . , en) = [e1, . . . , en] (dokažte si podrobně sami) , tzn. vektory e1, . . . , en jsou generátory vektorového prostoru Tn . 9 3. Ve vektorovém prostoru Rn[x] označme vektory (tj. polynomy): f1 = 1 , f2 = x , f3 = x2 , . . . fn+1 = xn . Pak zřejmě Rn[x] = L(f1, . . . , fn+1) = [f1, . . . , fn+1] , tzn. polynomy 1 , x , x2 , . . . , xn jsou generátory vektorového prostoru Rn[x] . Uvědomme si, že na rozdíl od průniku podprostorů není množinové sjednocení podprostorů (dokonce ani dvou) obecně podprostorem daného vektorového prostoru. Například pro podprostory U1 a U2 vektorového prostoru R3 z příkladu 1.2. 2. jejich sjednocení U1 ∪ U2 není podprostorem v R3 (neboť např. (1, 1, 0), (1, 2, 1) ∈ U1 ∪ U2, ale (1, 1, 0) + (1, 2, 1) = (2, 3, 1) ∈ U1 ∪ U2). V dalším si nyní zavedeme pojem tzv. součtu podprostorů, dokážeme, že je podprostorem a ukážeme, jaký má vztah k množinovému sjednocení těchto podprostorů. Definice. Nechť U1, . . . , Uk jsou podprostory vektorového prostoru V . Pak množina U1 + · · · + Uk definovaná: U1 + · · · + Uk = {u1 + · · · + uk | u1 ∈ U1, . . . , uk ∈ Uk} se nazývá součet podprostorů U1, . . . , Uk . Věta 2.4. Nechť U1, ..., Uk jsou podprostory ve V . Pak platí: 1. součet podprostorů U1 + · · · + Uk je podprostorem ve V 2. U1 + · · · + Uk = [ U1 ∪ · · · ∪ Uk ] , tj. součet podprostorů U1, ..., Uk je roven podprostoru generovanému jejich množinovým sjednocením. Důkaz. 1: Zřejmě je U1 + · · · + Uk = ∅ (neboť Ui = ∅). Dále nechť u, v ∈ U1 + · · · + Uk, t ∈ T libovolné. Potom u = u1 + · · · + uk, v = v1 + · · · + vk, kde ui, vi ∈ Ui, i = 1, . . . , k. Potom ale: u + v = (u1 + · · · + uk) + (v1 + · · · + vk) = (u1 + v1) + · · · + (uk + vk) ∈ U1 + · · · + Uk, t · u = t · (u1 + · · · + uk) = t · u1 + · · · + t · uk ∈ U1 + · · · + Uk, a tedy U1 + · · · + Uk je podprostor ve V . 2: Vzhledem k (1) budeme dokazovat množinovou rovnost: U1 + · · · + Uk = Wα ( Wα je podprostor ve V takový, že U1 ∪ · · · ∪ Uk ⊆ Wα ) . "⊆": Nechť u ∈ U1 + · · · + Uk. Potom u = u1 + · · · + uk, kde ui ∈ Ui. Je tedy také ui ∈ Wα, kde Wα je libovolný podprostor ve V takový, že U1 ∪· · ·∪Uk ⊆ Wα. Potom však u1 +· · ·+uk = u ∈ Wα, a tedy u ∈ Wα (Wα je podprostor ve V ∧ U1 ∪· · ·∪Uk ⊆ Wα). "⊇": Zřejmě je Ui ⊆ U1+· · ·+Uk (neboť pro ui ∈ Ui libovolný je ui = o+· · ·+ui+· · ·+o ∈ U1 + · · · + Uk), a tedy U1 ∪ · · · ∪ Uk ⊆ U1 + · · · + Uk. Podle 1. části věty je však U1 + · · · + Uk podprostorem ve V , tzn. z vlastností množinového průniku pak již plyne žádaná množinová inkluze. 10 Vidíme tedy, že součet podprostorů U1 + · · · + Uk je nejmenším podprostorem ve V obsahujícím množinové sjednocení U1 ∪ · · · ∪ Uk těchto podprostorů. Dá se očekávat, že součet podprostorů obecně nebude roven jejich množinovému sjednocení. Dále si uvědomme, že vyjádření vektoru u ∈ U1 + · · · + Uk ve tvaru: u = u1 + · · · + uk, kde u1 ∈ U1, . . . , uk ∈ Uk, nemusí být jednoznačné. Obojí si ukážeme na jednoduchém příkladu, a to pro k = 2, což je situace, s níž se budeme v praxi nejčastěji setkávat. V tomto případě je tedy: U1 + U2 = {u1 + u2 | u1 ∈ U1, u2 ∈ U2} = [U1 ∪ U2]. Schematicky je tato situace znázorněna na obr. 1. U1 U2 U1 + U2 V Obr. 1. Příklad 2.2. Ve vektorovém prostoru R3 mějme dány dva podprostory: U1 = {(x, y, 0) | x, y ∈ R} a U2 = {(u, 0, v) | u, v ∈ R} . Zřejmě platí, že: U1 ∪ U2 = {(a, b, c) | a, b, c ∈ R, b = 0 nebo c = 0} , resp. U1 + U2 = R3 . Vidíme tedy, že U1 ∪ U2 U1 + U2 , tzn. součet obou podprostorů není roven jejich množinovému sjednocení. Dále, vyjádření vektoru u ∈ U1 + U2 ve tvaru: u = u1 + u2 , kde u1 ∈ U1, u2 ∈ U2, zde není jednoznačné, neboť například vektor (0, 0, 0) ∈ U1 + U2 , a přitom (0, 0, 0) = (0, 0, 0) + (0, 0, 0) = (1, 0, 0) + (−1, 0, 0) jsou dvě různá vyjádření vektoru (0, 0, 0) v uvedeném tvaru. Poznamenejme, že v takovém případě má každý vektor z U1+U2 dokonce nekonečně mnoho různých vyjádření uvedeného tvaru. Definice. Nechť U1, . . . , Uk jsou podprostory vektorového prostoru V . Součet podprostorů U1, . . . , Uk se nazývá přímý součet a označuje U1 ˙+ · · · ˙+Uk, jestliže každý vektor u ∈ U1 + · · · + Uk lze vyjádřit jediným způsobem ve tvaru: u = u1 + · · · + uk, kde u1 ∈ U1, . . . , uk ∈ Uk. (4) 11 Věta 2.5. Nechť U1, U2, . . . , Uk (k ≥ 2) jsou podprostory vektorového prostoru V . Pak součet podprostorů U1, U2, . . . , Uk je přímým součtem právě když platí Ui ∩ (U1 + · · · + Ui−1 + Ui+1 + · · · + Uk) = {o} pro každé i = 1, 2, . . . , k . (5) tj. průnik každého z podprostorů se součtem zbývajících podprostorů je roven nulovému prostoru. Důkaz. "⇒": Nechť součet podprostorů U1, . . . , Uk je přímý a nechť pro 1 ≤ i ≤ k je x ∈ Ui ∩ (U1 + · · · + Ui−1 + Ui+1 + · · · + Uk) . Potom je možno psát : x = u1 + · · · + ui−1 + ui+1 + · · · + uk, kde uj ∈ Uj . Kromě toho je x ∈ Ui, tzn. také −x ∈ Ui. Pak ale: o = u1 + · · · + ui−1 + (−x) + ui+1 + · · · + uk a o = o + · · · + o + o + o + · · · + o jsou dvě vyjádření nulového vektoru ve tvaru (4), tzn. podle předpokladu musí být −x = o a tedy x = o . Dokázali jsme tak, že Ui ∩(U1 +· · ·+Ui−1 +Ui+1 +· · ·+Uk) ⊆ {o}. Opačná inkluze je však zřejmá (proč ?), tzn. dohromady platí rovnost. Poněvadž i bylo libovolné (s vlastností 1 ≤ i ≤ k), platí všechny podmínky (5). "⇐": Nechť platí podmínky (5), nechť x ∈ U1 + · · · + Uk libovolný a nechť: x = u1 + · · · + uk = u1 + · · · + uk, kde ui, ui ∈ Ui, i = 1, 2, . . . , k jsou dvě vyjádření vektoru x ve tvaru (4). Potom pro libovolné i = 1, 2, . . . , k po úpravě dostáváme: (ui − ui) = (u1 − u1) + · · · + (ui−1 − ui−1) + (ui+1 − ui+1) + · · · + (uk − uk) , odkud okamžitě plyne, že : (ui − ui) ∈ Ui ∩ (U1 + · · · + Ui−1 + Ui+1 + · · · + Uk) . Podle předpokladu, z podmínek (5) plyne, že (ui − ui) = o, neboli ui = ui. Tedy vyjádření vektoru x ve tvaru (4) je jednoznačné a součet podprostorů U1, . . . , Uk je přímý. Poznámka. Rozepíšeme-li si předchozí větu pro některá konkrétní k, pak dostáváme např.: pro k = 2 : součet podprostorů U1, U2 je přímým součtem ⇐⇒ U1 ∩ U2 = {o}, pro k = 3 : součet podprostorů U1, U2, U3 je přímým součtem ⇐⇒ U1 ∩ (U2 + U3) = {o} ∧ U2 ∩ (U1 + U3) = {o} ∧ U3 ∩ (U1 + U2) = {o}. 12 §3. Lineární závislost a nezávislost vektor ‌u Definice. Nechť V je vektorový prostor nad T a nechť u1, . . . , uk je konečná posloupnost vektorů z V . Jestliže existují čísla t1, . . . , tk ∈ T, z nichž alespoň jedno je různé od nuly, tak, že: t1 · u1 + · · · + tk · uk = o , (1) pak říkáme, že vektory u1, . . . , uk jsou lineárně závislé. V opačném případě říkáme, že vektory u1, . . . , uk jsou lineárně nezávislé. Poznámka. 1. Vidíme, že pojem lineární nezávislosti je negací pojmu lineární závislosti. Explicitně vyjádřeno to znamená: jestliže pro všechna t1, . . . , tk ∈ T, z nichž alespoň jedno je různé od nuly, platí : t1 · u1 + · · · + tk · uk = o , pak říkáme, že vektory u1, . . . , uk jsou lineárně nezávislé. 2. Z definice lineární nezávislosti bezprostředně plyne, že: vektory u1, . . . , uk jsou lineárně nezávislé právě když platí implikace: t1 · u1 + · · · + tk · uk = o =⇒ t1 = t2 = · · · = tk = 0 . 3. Praktické zjišťování lineární závislosti či nezávislosti daných vektorů u1, . . . , uk provádíme obvykle tak, že napíšeme rovnost t1 · u1 + · · · + tk · uk = o a hledáme všechna čísla t1, . . . , tk ∈ T , která tuto rovnost splňují. Přitom mohou nastat dvě možnosti: – zjistíme, že rovnost je splněna pouze pro t1 = · · · = tk = 0 . Pak jsou vektory u1, . . . , uk lineárně nezávislé. – zjistíme, že rovnost je splněna i pro nějaké ti = 0. Pak jsou vektory u1, . . . , uk lineárně závislé. Příklad 3.1. 1. Ve vektorovém prostoru R2 jsou například vektory (1, 0), (0, 1) lineárně nezávislé. Podobně vektory (1, 1), (1, 2) jsou též lineárně nezávislé. Obojí dostaneme rozepsáním podle návodu uvedeného v předchozí poznámce. Na druhé straně například vektory (1, 3), (2, 1), (1, −1), (−2, 3) jsou lineárně závislé, což opět zjistíme výpočtem podle výše uvedeného návodu. Poznamenejme, že všechny výše zmiňované výpočty vedou v tomto případě na řešení soustav lineárních rovnic se dvěma neznámými. 2. Ve vektorovém prostoru Tn jsou vektory e1 = (1, 0, 0, . . . , 0, 0) , e2 = (0, 1, 0, . . . , 0, 0) , . . . , en = (0, 0, 0, . . . , 0, 1) lineárně nezávislé. Je-li totiž t1 · e1 + · · · + tn · en = (0, . . . , 0) , pak po dosazení a úpravě dostáváme, že (t1, . . . , tn) = (0, . . . , 0) , a tedy t1 = t2 = · · · = tn = 0 . 13 3. Ve vektorovém prostoru Rn[x] jsou vektory (polynomy) f1 = 1 , f2 = x , . . . , fn+1 = xn lineárně nezávislé. Je-li totiž t1 · 1 + t2 · x + · · · + tn+1 · xn = o , kde o značí nulový polynom, tj. polynom, jehož všechny koeficienty jsou rovny nule, potom je t1 = t2 = · · · = tn = 0 (neboť dva polynomy se rovnají, právě když se rovnají jejich koeficienty u stejných mocnin x) . Jestliže uvažovaná posloupnost vektorů obsahuje pouze jediný vektor, např. u, pak je zjišťování lineární závislosti či nezávislosti velmi jednoduché, neboť z předchozí definice a z věty 1.1. 3. plyne (rozmyslete si podrobně jak !), že platí: vektor u je lineárně závislý ⇐⇒ u = o. (2) Pokud uvažovaná posloupnost vektorů obsahuje alespoň dva vektory, pak ekvivalentní podmínku pro jejich lineární závislost nám udává následující věta. Věta 3.1. Nechť V je vektorový prostor nad T, nechť k ≥ 2 a nechť u1, u2, . . . , uk ∈ V . Pak následující výroky jsou ekvivalentní : 1. vektory u1, u2, . . . , uk jsou lineárně závislé 2. ∃i (1 ≤ i ≤ k) tak, že vektor ui je lineární kombinací zbývajících vektorů (tj. vektorů u1, . . . , ui−1, ui+1, . . . , uk), Důkaz. "1 ⇒ 2": Nechť vektory u1, . . . , uk jsou lineárně závislé. Pak existují čísla t1, . . . , tk ∈ T, z nichž alespoň jedno je nenulové, tak, že t1 · u1 + · · · + tk · uk = o. Nechť např. ti = 0. Pak ale úpravou z předchozí rovnice dostáváme: ui = −t1 ti · u1 − · · · − ti−1 ti · ui−1 − ti+1 ti · ui+1 − · · · − tk ti · uk , což znamená, že vektor ui je lineární kombinací zbývajících vektorů. "2 ⇒ 1": Nechť platí 2, tzn. existuje index i tak, že ui = t1 · u1 + · · · + ti−1 · ui−1 + ti+1 · ui+1 + · · · + tk · uk . Pak (po úpravě, s využitím toho, že −ui = (−1)·ui ) dostáváme o = t1 · u1 + · · · + ti−1 · ui−1 + (−1) · ui + ti+1 · ui+1 + · · · + tk · uk , tzn. (podle definice lineární závislosti) vektory u1, . . . , uk jsou lineárně závislé. Poznámka. Je třeba si uvědomit, že druhá část předchozí věty nám pouze zajišťuje existenci vektoru, který lze vyjádřit jako lineární kombinaci zbývajících vektorů. Nelze tedy obecně tvrdit, že každý z lineárně závislých vektorů u1, u2, . . . , uk se dá vyjádřit jako lineární kombinace zbývajících vektorů. Např. ve vektorovém prostoru R2 jsou vektory: u1 = (0, 1), u2 = (1, 1), u3 = (0, −2) lineárně závislé (neboť např. 2·u1 + 0·u2 + 1·u3 = o), ale přitom je zřejmé, že vektor u2 nelze vyjádřit jako lineární kombinaci vektorů u1, u3. 14 Věta 3.2. Nechť V je vektorový prostor nad T a nechť u1, . . . , uk je konečná posloupnost vektorů z V . Pak platí : 1. obsahuje-li posloupnost u1, . . . , uk nulový vektor, pak je lineárně závislá 2. obsahuje-li posloupnost u1, . . . , uk dva stejné vektory, pak je lineárně závislá 3. je-li nějaká posloupnost vybraná z posloupnosti u1, . . . , uk lineárně závislá, pak je i celá posloupnost u1, . . . , uk lineárně závislá 4. je-li posloupnost u1, . . . , uk lineárně nezávislá, pak je každá posloupnost z ní vybraná také lineárně nezávislá. Důkaz. První tři tvrzení plynou bezprostředně z definice lineární závislosti vektorů (proveďte příslušné důkazy podrobně sami !). Čtvrté tvrzení je zřejmě ekvivalentní s třetím tvrzením (jedná se o obměnu implikace), tzn. není třeba je dokazovat. Věta 3.3. (Steinitzova věta o výměně) Nechť V je vektorový prostor nad T, u1, . . . , ur, v1, . . . , vs ∈ V . Nechť vektory u1, . . . , ur jsou lineárně nezávislé a nechť vektory u1, . . . , ur ∈ L(v1, . . . , vs). Potom platí: 1. r ≤ s, 2. po vhodném přečíslování vektorů v1, . . . , vs je : L(v1, . . . , vr, vr+1, . . . , vs) = L(u1, . . . , ur, vr+1, . . . , vs). Důkaz. Provedeme matematickou indukcí vzhledem k r. α) Nechť r = 1. Pak jistě platí, že r ≤ s. Nyní dokážeme pro r = 1 ještě druhou část tvrzení věty. Podle předpokladů věty je vektor u1 lineárně nezávislý a platí : u1 = t1 · v1 + · · · + ts · vs . (3) Protože je u1 lineárně nezávislý, pak podle (2) je u1 = o a tedy alespoň jedno z čísel t1, . . . , ts musí být nenulové. Přečíslujme vektory v1, . . . , vs tak, aby t1 = 0. Potom po úpravě z rovnice (3) dostáváme : v1 = 1 t1 · u1 − t2 t1 · v2 − · · · − ts t1 · vs , což znamená, že v1 ∈ L(u1, v2, . . . , vs). Triviálně je však v2, . . . , vs ∈ L(u1, v2, . . . , vs), a tedy podle věty 1.4. dostáváme, že L(v1, . . . , vs) ⊆ L(u1, v2, . . . , vs). Opačná inkluze plyne ze (3) a ze zřejmého faktu, že v2, . . . , vs ∈ L(v1, . . . , vs), opět užitím věty 1.4.. Dohromady tedy platí rovnost : L(v1, . . . , vs) = L(u1, v2, . . . , vs). β) Přepokládáme, že tvrzení věty platí pro 1, . . . , r−1 (r ≥ 2), a dokážeme nyní toto tvrzení pro r. Nechť tedy vektory u1, . . . , ur jsou lineárně nezávislé a platí, že u1, . . . , ur ∈ L(v1, . . . , vs). Uvažujme nyní vektory u1, . . . , ur−1 . Tyto vektory jsou podle věty 3.2. (část 4.) lineárně nezávislé a zřejmě platí u1, . . . , ur−1 ∈ L(v1, . . . , vs) . Vektory u1, . . . , ur−1 tedy splňují předpoklady věty a můžeme na ně použít indukční předpoklad. Jeho užitím dostáváme : 15 r−1 ≤ s (4) a po vhodném přečíslování vektorů v1, . . . , vs platí : L(v1, . . . , vs) = L(u1, . . . , ur−1, vr, . . . , vs). (5) Nyní uvažme vektor ur . Podle předpokladu věty je ur ∈ L(v1, . . . , vs) , odkud podle vztahu (5) dostáváme, že ur ∈ L(u1, . . . , ur−1, vr, . . . , vs) , tzn. ur = t1 · u1 + · · · + tr−1 · ur−1 + tr · vr + · · · + ts · vs. (6) Z (6) a z předpokladu, že u1, . . . , ur jsou lineárně nezávislé pak plyne, že v (4) nemůže nastat rovnost (při r−1 = s by totiž platilo, že ur = t1 ·u1 +· · ·+tr−1 ·ur−1 , a vektory u1, . . . , ur by byly lineárně závislé). Je tedy r−1 < s , odkud ihned plyne, že 1. platí r ≤ s , což je první část tvrzení věty. 2. alespoň jedno z čísel tr, . . . , ts musí být nenulové. Přečíslujme vektory vr, . . . , vs tak, aby bylo tr = 0. Potom z (6) úpravou dostáváme : vr = − t1 tr · u1 − · · · − tr−1 tr · ur−1 + 1 tr · ur − tr+1 tr · vr+1 − · · · − ts tr · vs. (7) Podle věty 1.4. , užitím (7) a (6) , pak dostáváme (rozmyslete si podrobně sami, že skutečně platí obě množinové inkluze), že L(u1, . . . , ur−1, vr, . . . , vs) = L(u1, . . . , ur, vr+1, . . . , vs) . (8) Ze vztahů (5) a (8) pak ihned plyne, že L(v1, . . . , vs) = L(u1, . . . , ur, vr+1, . . . , vs), což je druhá část tvrzení věty. 16 §4. Báze a dimenze vektorového prostoru Definice. Nechť V je vektorový prostor nad T. Konečná posloupnost vektorů u1, . . . , un z V se nazývá báze vektorového prostoru V , jestliže platí: 1. vektory u1, . . . , un jsou lineárně nezávislé 2. vektory u1, . . . , un generují vektorový prostor V . Poznámka. Místo obratu "konečná posloupnost vektorů u1, . . . , un je bází V " budeme častěji říkat stručně "vektory u1, . . . , un jsou bází V ". Připomeňme, že podmínka "vektory u1, . . . , un generují vektorový prostor V " znamená, že lineárním obalem vektorů u1, . . . , un je celý prostor V , což jinak řečeno znamená, že platí rovnost: [u1, . . . , un] = L(u1, . . . , un) = V . Uvědomme si, že předchozí definice nezaručuje existenci báze ani nic neříká o tom, kolik bází se ve vektorovém prostoru V dá sestrojit. Z následujících dvou příkladů bude vidět, že vektorový prostor buď bázi nemá nebo má nekonečně mnoho bází (rozmyslete si vždy proč). Příklad 4.1. Z příkladů 2.1. a 3.1. bezprostředně plyne, že: 1. Bází vektorového prostoru R2 jsou např. vektory (1, 0), (0, 1) nebo vektory (1, 1), (1, 2) . Vektorový prostor R2 má zřejmě nekonečně mnoho různých bází. 2. Bází vektorového prostoru Tn jsou například vektory e1 = (1, 0, . . . , 0) , e2 = (0, 1, 0, . . . , 0) , . . . , en = (0, . . . , 0, 1) . Vektorový prostor Tn má zřejmě nekonečně mnoho různých bází. 3. Bází vektorového prostoru Rn[x] jsou například vektory (tj. polynomy) f1 = 1 , f2 = x , . . . , fn+1 = xn . Vektorový prostor Rn[x] má zřejmě nekonečně mnoho různých bází. Příklad 4.2. 1. Nulový vektorový prostor V = {o} nemá bázi, neboť libovolná konečná posloupnost vektorů z V může v tomto případě sestávat pouze z nulových vektorů a je tedy lineárně závislá. 2. Vektorový prostor R[x] nemá bázi, neboť konečná posloupnost vektorů (polynomů) z R[x] nikdy negeneruje celý prostor R[x]. Je-li totiž g1, . . . , gn libovolná konečná posloupnost polynomů z R[x] a jestliže polynom gi má stupeň ki, potom jistě existuje přirozené číslo t s vlastností: t > ki pro každé i = 1, . . . , n. Pak ale např. polynom f = xt se evidentně nedá napsat jako lineární kombinace polynomů g1, . . . , gn a je tedy [g1, . . . , gn] R[x]. 17 Poznámka. Rozebereme-li si definici báze podrobněji, pak vidíme, že – báze u1, . . . , un vektorového prostoru V je z hlediska lineární nezávislosti "nejpočetnější" posloupností vektorů z V . Přesněji řečeno, pokud k bázi přidáme další vektor, pak získané vektory sice nadále budou generátory prostoru V , ale nebudou již lineárně nezávislé (plyne z věty 3.1. – rozmyslete si podrobně jak). – báze u1, . . . , un vektorového prostoru V je z hlediska generátorů "nejméně početná" posloupnost vektorů. Přesněji řečeno, pokud bychom některý z vektorů báze u1, . . . , un vypustili, pak zbývající vektory sice budou lineárně nezávislé, ale nebudou již generovat vektorový prostor V (plyne z věty 3.2.4. a věty 3.1. – rozmyslete si proč). Následují dvě věty, z nichž první uvádí ekvivalentní podmínku pro to, aby vektory tvořily bázi vektorového prostoru a druhá popisuje další důležité vlastnosti bází. Věta 4.1. Vektory u1, . . . , un jsou bází vektorového prostoru V právě když každý vektor x ∈ V je možno jediným způsobem vyjádřit ve tvaru: x = t1 · u1 + · · · + tn · un , kde t1, . . . , tn ∈ T . (1) Důkaz. "⇒": Nechť u1, . . . , un je báze ve V . Pak: – existence vyjádření (1) plyne ihned z definice báze (proč?) – dokážeme jednoznačnost vyjádření (1). Nechť tedy: x = t1 · u1 + · · · + tn · un = r1 · u1 + · · · + rn · un , kde ti, ri ∈ T. Pak odečtením a úpravou dostáváme: (t1 − r1) · u1 + · · · + (tn − rn) · un = o. Vektory u1, . . . , un jsou však lineárně nezávislé, tzn. musí být (ti − ri) = 0, neboli ti = ri pro každé i = 1, . . . , n. Vyjádření (1) je tedy jednoznačné. "⇐": Nechť každý vektor x ∈ V se dá jednoznačně vyjádřit ve tvaru (1). Potom: – vektory u1, . . . , un generují vektorový prostor V , protože z existence vyjádření (1) plyne, že V ⊆ L(u1, . . . , un) a opačná inkluze, tj. L(u1, . . . , un) ⊆ V je triviální. Dostáváme tak, že V = L(u1, . . . , un). – zbývá ukázat, že vektory u1, . . . , un jsou lineárně nezávislé. Nechť tedy: t1 · u1 + · · · + tn · un = o. Nulový vektor se však zřejmě dá také napsat ve tvaru 0 · u1 + · · · + 0 · un = o. Vidíme, že jsme nulový vektor vyjádřili dvěma způsoby ve tvaru (1). Z předpokladu jednoznačnosti vyjádření (1) pak plyne, že t1 = · · · = tn = 0, což znamená, že vektory u1, . . . , un jsou lineárně nezávislé. Dohromady pak dostáváme, že vektory u1, . . . , un jsou bází prostoru V . 18 Poznámka. Jsou-li vektory u1, . . . , un bází vektorového prostoru V , pak V = L(u1) ⊕ · · · ⊕ L(un) . Věta 4.2. Nechť V je vektorový prostor ve kterém existuje báze. Pak platí: 1. jestliže u1, . . . , un a v1, . . . , vk jsou dvě báze prostoru V , pak je n = k 2. jestliže vektory v1, . . . , vs generují prostor V , pak z nich lze vybrat bázi V 3. jestliže vektory v1, . . . , vr jsou lineárně nezávislé, pak je lze doplnit na bázi V . Důkaz. 1: Aplikujeme-li dvakrát Steinitzovu větu (proveďte si podrobně sami !), dostáváme jednak n ≤ k a jednak k ≤ n, odkud již plyne, že n = k. 2: Nechť vektory v1, . . . , vs generují prostor V . Podle předpokladu má prostor V bázi, tzn. musí být V = {o}. Pak lze vektory v1, . . . , vs přečíslovat tak, že v1, . . . , vi jsou lineárně nezávislé a v1, . . . , vi, vj jsou lineárně závislé pro každé j s vlastností i < j ≤ s. Odtud plyne (proč ?), že vj ∈ L(v1, . . . , vi), a tedy V = L(v1, . . . , vs) ⊆ L(v1, . . . , vi). Inkluze L(v1, . . . , vi) ⊆ L(v1, . . . , vs) je však triviální a tedy je V = L(v1, . . . , vi). Protože vektory v1, . . . , vi jsou lineárně nezávislé, tvoří bází prostoru V . 3: Nechť u1, . . . , un je nějaká báze prostoru V (podle předpokladu věty taková báze existuje) a nechť v1, . . . , vr jsou lineárně nezávislé vektory z V . Potom (podle definice báze a podle Steinitzovy věty) po vhodném přečíslování vektorů u1, . . . , un dostáváme : V = L(u1, . . . , un) = L(v1, . . . , vr, ur+1, . . . , un) , odkud podle částí 2 a 1 této věty plyne, že vektory v1, . . . , vr, ur+1, . . . , un jsou bází V . První část předchozí věty nám říká, že má-li vektorový prostor nějakou bázi, pak všechny jeho báze sestávají vždy ze stejného počtu vektorů. Na základě tohoto faktu můžeme vyslovit následující definici. Definice. Nechť V je vektorový prostor nad T. Pak: 1. je-li V nulovým vektorovým prostorem, pak říkáme, že dimenze V je nula 2. existuje-li báze u1, . . . , un prostoru V , pak říkáme, že dimenze V je n 3. je-li V nenulový prostor, který nemá bázi, říkáme, že dimenze V je nekonečno. Píšeme potom: dim V = 0 , resp. dim V = n , resp. dim V = ∞. Vektorové prostory z 1 a 2 se nazývají konečnědimenzionální, vektorové prostory z 3 se nazývají nekonečnědimenzionální. Příklad 4.3. Z příkladů 4.1. a 4.2. bezprostředně plyne, že: 1. dim R2 = 2, 2. dim Tn = n (tzn. speciálně např. dim R3 = 3, dim Q5 = 5, dim C4 = 4, atd.), 3. dim Rn[x] = n + 1 (tzn. speciálně např. dim R5[x] = 6, atd.), 4. dim R[x] = ∞. 19 Úmluva. Všude v dalším v tomto textu se budeme zabývat pouze konečnědimenzionálními vektorovými prostory !! Řekneme-li tedy, že V je vektorový prostor nad T, bude to automaticky znamenat, že V je konečnědimenzionální, tzn. buď nulový prostor, nebo vektorový prostor, v němž existuje báze. K tomu ještě poznamenejme, že každý podprostor konečnědimenzionálního vektorového prostoru musí být zřejmě sám také konečnědimenzionálním vektorovým prostorem. V praxi se poměrně často setkáme s úlohou, že ve vektorovém prostoru V , jehož dimenzi známe, např. dim V = n, ověřujeme, zda nějaká posloupnost sestávající z n vektorů (tzn. vektorů je tolik, kolik je dimenze prostoru) je bází. V takovém případě stačí ověřovat pouze jednu z podmínek 1 a 2 z definice báze, jak ukazuje následující věta. Věta 4.3. Nechť V je vektorový prostor nad T, dim V = n (n ≥ 1) a nechť u1, . . . , un je konečná posloupnost n vektorů z V . Pak následující výroky jsou ekvivalentní: 1. vektory u1, . . . , un jsou bází prostoru V 2. vektory u1, . . . , un jsou lineárně nezávislé 3. vektory u1, . . . , un generují prostor V . Důkaz. "1 ⇒ 2": Zřejmé (plyne z definice báze). "2 ⇒ 3": Nechť u1, . . . , un jsou lineárně nezávislé vektory. Podle věty 4.2. 3. je lze doplnit na bázi, která však musí obsahovat n vektorů (vzhledem k předpokladu, že dim V = n). Tedy vektory u1, . . . , un jsou bází prostoru V , což znamená, že také generují prostor V . "3 ⇒ 1": Nechť u1, . . . , un generují prostor V . Podle věty 4.2. 2. z nich lze vybrat bázi, která však musí obsahovat n vektorů (vzhledem k předpokladu že dim V = n). Tedy vektory u1, . . . , un jsou bází prostoru V . Věta 4.4. Nechť U1, U2 jsou podprostory vektorového prostoru V takové, že U1 ⊆ U2. Potom platí: 1. dim U1 ≤ dim U2 2. dim U1 = dim U2 ⇐⇒ U1 = U2. Důkaz. Pokud U1 = {o} nebo U2 = {o}, pak obě tvrzení zřejmě platí (rozmyslete si podrobně proč). Nechť tedy U1, U2 = {o} a nechť u1, . . . , ur je báze U1, resp. v1, . . . , vs je báze U2. Podle předpokladu věty je U1 ⊆ U2, tzn. musí být u1, . . . , ur ∈ U2 = L(v1, . . . , vs), přičemž vektory u1, . . . , ur jsou lineárně nezávislé. Jsou tedy splněny předpoklady Steinitzovy věty. Potom: 1: podle Steinitzovy věty je r ≤ s, neboli dim U1 ≤ dim U2. 2: implikace "⇐" zřejmě platí. Dokazujme implikaci opačnou. Je-li tedy dim U1 = dim U2, tzn. r = s, pak opět podle Steinitzovy věty dostáváme, že L(v1, . . . , vs) = L(u1, . . . , ur), neboli U1 = U2. 20 Poznámka. Z předchozí věty plyne několik zřejmých, ale důležitých důsledků: 1. Dimenze podprostoru je vždy menší nebo rovna dimenzi celého prostoru. 2. Je-li podprostor U1 vlastní podmnožinou podprostoru U2 (tzn. U1 U2), potom je dim U1 < dim U2. Jinými slovy řečeno, nemůže se stát, aby dva podprostory stejné dimenze byly ostře v inkluzi. Věta 4.5. (Věta o dimenzi součtu a průniku dvou podprostorů) Nechť U1, U2 jsou podprostory vektorového prostoru V . Pak platí: dim(U1 + U2) + dim(U1 ∩ U2) = dim U1 + dim U2 . Důkaz. Je-li U1 = {o} nebo U2 = {o}, pak tvrzení zřejmě platí (rozmyslete si podrobně proč!). Nechť tedy dim U1 = r = 0 a dim U2 = s = 0. Průnik U1 ∩ U2 je podprostorem ve V , a tedy je buď U1 ∩ U2 = {o}, nebo existuje báze U1 ∩ U2, tj. lineárně nezávislé vektory u1, . . . , uk s vlastností U1 ∩ U2 = L(u1, . . . , uk). Podle věty 4.2. 3. lze lineárně nezávislé vektory doplnit na bázi. Existují tedy vektory ak+1, . . . , ar ∈ U1 tak, že u1, . . . , uk, ak+1, . . . , ar je báze U1, a podobně existují vektory bk+1, . . . , bs ∈ U2 tak, že u1, . . . , uk, bk+1, . . . , bs je báze U2 (v případě U1 ∩ U2 = {o} je zřejmě k = 0). Nyní dokážeme, že vektory: u1, . . . , uk, ak+1, . . . , ar, bk+1, . . . , bs (2) jsou bází podprostoru U1 + U2. α) Dokážeme, že vektory (2) jsou lineárně nezávislé. Nechť tedy: t1 · u1 + · · · + tk · uk + tk+1 · ak+1 + · · · + tr · ar + tk+1 · bk+1 + · · · + ts · bs = o. (3) Označme: x = t1 · u1 + · · · + tk · uk + tk+1 · ak+1 + · · · + tr · ar. (4) Ze (3) při tomto označení dostáváme, že x = −tk+1 ·bk+1 −· · ·−ts ·bs. To však znamená, že x ∈ U1 ∩ U2 a lze pak psát: x = p1 · u1 + · · · + pk · uk = p1 · u1 + · · · + pk · uk + 0 · ak+1 + · · · + 0 · ar. (5) Ale u1, . . . , uk, ak+1, . . . , ar je báze U1, a tedy ze (4) , (5) a z jednoznačnosti vyjádření vektoru pomocí báze plyne (mimo jiné), že tk+1 = · · · = tr = 0. Dosadíme-li tyto hodnoty do (3), dostáváme: t1 · u1 + · · · + tk · uk + tk+1 · bk+1 + · · · + ts · bs = o . Vektory u1, . . . , uk, bk+1, . . . , bs jsou však bází U2 , tzn. jsou lineárně nezávislé a dostáváme tedy, že také t1 = · · · = tk = tk+1 = · · · = ts = 0. Ukázali jsme, že všechny koeficienty v rovnici (3) jsou rovny nule, a tedy vektory (2) jsou lineárně nezávislé. β) Dokážeme, že vektory (2) generují podprostor U1 + U2, tzn. že platí rovnost : L(u1, . . . , uk, ak+1, . . . , ar, bk+1, . . . , bs) = U1 + U2 . (6) 21 "⊆" : tato inkluze zřejmě platí (dokažte si sami technickým rozepsáním). "⊇" : nechť x ∈ U1 + U2 , tzn. lze psát x = x1 + x2, kde x1 ∈ U1, x2 ∈ U2. Potom však x1 ∈ U1 = L(u1, . . . , uk, ak+1, . . . , ar) ⊆ L(u1, . . . , uk, ak+1, . . . , ar, bk+1, . . . , bs) x2 ∈ U2 = L(u1, . . . , uk, bk+1, . . . , bs) ⊆ L(u1, . . . , uk, ak+1, . . . , ar, bk+1, . . . , bs) , odkud již plyne, že x = x1 + x2 ∈ L(u1, . . . , uk, ak+1, . . . , ar, bk+1, . . . , bs). Dohromady tak dostáváme žádanou rovnost (6). Dokázali jsme, že vektory (2) jsou bází U1 +U2, tzn. dim(U1 +U2) = r +s−k. Potom však: dim(U1 + U2) + dim(U1 ∩ U2) = r + s − k + k = r + s = dim U1 + dim U2 , což je požadované tvrzení věty. Poznamenejme, že předchozí větu nelze přímo zobecnit pro více než dva podprostory daného vektorového prostoru, jak plyne z následujícího příkladu. Příklad 4.4. Ve vektorovém prostoru R3 uvažme podprostory: U1 = {(a, b, 0) | a, b ∈ R}, U2 = {(r, 0, s) | r, s ∈ R}, U3 = {(0, u, v) | u, v ∈ R}. Zřejmě je dim U1 = dim U2 = dim U3 = 2 a dále je (rozmyslete si proč) U1 + U2 + U3 = R3 a U1 ∩ U2 ∩ U3 = {o}. Je tedy dim(U1 + U2 + U3) + dim(U1 ∩ U2 ∩ U3) = 3 , ale dim U1 + dim U2 + dim U3 = 6. Poznámka. V našich úvahách o konečných posloupnostech vektorů v předchozím textu (tj. v úvahách o lineární závislosti či nezávislosti vektorů a úvahách o generování) nehrálo pořadí vektorů žádnou podstatnou roli. Se zavedením pojmu báze se však otázka pořadí vektorů okamžitě vynoří a bude podstatné, v jakém pořadí vektory báze uvažujeme. Přesněji řečeno, danou bází u1, . . . , un vektorového prostoru V chápeme jako uspořádanou n-tici vektorů z V , a tedy například rovnost dvou bází znamená rovnost dvou uspořádaných n-tic vektorů z V . Důležitost této poznámky se ukáže v dalším, při zavádění pojmu souřadnic vektoru. Definice. Nechť u1, . . . , un je báze vektorového prostoru V a nechť vektor u ∈ V je vyjádřen ve tvaru: u = t1 · u1 + · · · + tn · un . Pak číslo ti nazýváme i-tou souřadnicí vektoru u v bázi u1, . . . , un a uspořádanou ntici čísel (t1, . . . , tn) nazýváme souřadnicemi vektoru u v bázi u1, . . . , un. Píšeme u = (t1, . . . , tn) v bázi u1, . . . , un . 22 Poznámka. Je nutné si uvědomit, že pojem souřadnic vektoru je vždy vázán na nějakou pevnou bázi prostoru V . Zřejmě jeden vektor má v různých bázích obecně různé souřadnice. Dále si uvědomme, že věta 4.1. zajišťuje korektnost předchozí definice v tom smyslu, že každý vektor u ∈ V má v dané bázi u1, . . . , un souřadnice a navíc jsou tyto souřadnice určeny jednoznačně. Konečně poznamenejme, že souřadnice vektoru v dané bázi budeme psát nejen do řádku, jak bylo výše zavedeno, ale také někdy podle potřeby i do sloupce. Příklad 4.5. Ve vektorovém prostoru R3 vezměme vektor u = (1, −2, 3). Potom: 1. vektor u má v bázi e1 = (1, 0, 0), e2 = (0, 1, 0), e3 = (0, 0, 1) souřadnice (1, −2, 3) 2. vektor u má v bázi e2 = (0, 1, 0), e1 = (1, 0, 0), e3 = (0, 0, 1) souřadnice (−2, 1, 3) 3. vektor u má v bázi u1 = (1, 1, 1), u2 = (0, 1, 1), u3 = (1, 0, 1) souřadnice (−4, 2, 5) jak se lehce zjistí rozepsáním z definice souřadnic vektoru v bázi (proveďte si podrobně sami). Věta 4.6. Nechť u1, . . . , un je báze vektorového prostoru V . Nechť t ∈ T a nechť vektor x ∈ V , resp. y ∈ V má v bázi u1, . . . , un souřadnice (x1, . . . , xn), resp. (y1, . . . , yn). Potom: 1. vektor x + y má v bázi u1, . . . , un souřadnice (x1 + y1, . . . , xn + yn) 2. vektor t · x má v bázi u1, . . . , un souřadnice (t · x1, . . . , t · xn). Důkaz. Podle předpokladu je x = x1 · u1 + · · · + xn · un , resp. y = y1 · u1 + · · · + yn · un , tzn. potom (po úpravě) dostáváme, že x + y = (x1 + y1) · u1 + · · · + (xn + yn) · un t · x = (t · x1) · u1 + · · · + (t · xn) · un odkud již ihned plyne tvrzení věty. Uvažujme ve vektorovém prostoru V dvě báze u1, . . . , un a v1, . . . , vn. Nechť má vektor u v bázi u1, . . . , un vyjádření u = u1 u1 + · · · + un un (7) a v bázi v1, . . . , vn vyjádření u = u1 v1 + · · · + un vn . (8) Vyjádříme vztah mezi souřadnicemi vektoru u v obou bázích. Vektory z báze v1, . . . , vn se dají v bázi u1, . . . , un vyjádřit jako v1 = a11 u1 + · · · + an1 un , ... (9) vn = a1n u1 + · · · + ann un . 23 Dosazením vyjádření (9) do (8) dostaneme u = u1 (a11 u1 + · · · + an1 un) + · · · + un (a1n u1 + · · · + ann un) = (a11 u1 + a12 u2 + · · · + a1n un) u1 + · · · + (an1 u1 + an2 u2 + · · · + ann un) un a porovnáním koeficientů u vektorů u1, . . . , un v tomto vyjádření a v (7) dostaneme vztah u1 = a11 u1 + a12 u2 + · · · + a1n un , ... (10) un = an1 u1 + an2 u2 + · · · + ann un . Rovnice (10) se nazývají transformace souřadnic vektoru u při přechodu od báze u1, . . . , un k bázi v1, . . . , vn. 24 Kapitola 2 Matice a determinanty §1. Pořadí a permutace Permutací libovolné množiny M se obecně rozumí každé bijektivní zobrazení množiny M na sebe samu. Naším cílem však tentokrát nebude studium obecných vlastností permutací libovolných množin, nýbrž permutace nám budou pouze pomocným nástrojem ke studiu dalších pojmů. Omezíme se proto v tomto paragrafu jen na výklad nejzákladnějších vlastností permutací konečné množiny M, řekněme n-prvkové. Pro zjednodušení vyjadřování budeme v dalším předpokládat, že množina M se skládá z prvních n přirozených čísel, tzn. M = {1, 2, . . . , n}. Definice. Nechť M = {1, 2, . . . , n}. Pak libovolná uspořádaná n-tice utvořená ze všech prvků množiny M se nazývá pořadí z n prvků 1, 2, . . . , n nebo stručně pořadí. Nechť R = (r1, . . . , rn) je libovolné pořadí. Řekneme, že dvojice ri, rj je inverze v pořadí R, jestliže i < j a ri > rj (tj. jestliže větší z obou čísel předchází v daném pořadí číslu menšímu). Pořadí, v němž celkový počet inverzí je sudé číslo (resp. liché číslo), se nazývá sudé pořadí (resp. liché pořadí). Hovoříme pak též o paritě pořadí. Příklad 1.1. Nechť n = 8. Potom: 1. pořadí (1, 2, 3, 4, 5, 6, 7, 8) je sudé (celkový počet inverzí je 0), 2. pořadí (3, 1, 2, 7, 5, 8, 6, 4) je liché (celkový počet inverzí je 9). Celkový počet inverzí v daném konkrétním pořadí zřejmě nejrychleji zjistíme tak, že bereme odleva jedno číslo po druhém a pro každé z nich spočítáme, kolik menších čísel stojí za ním (napravo). Sečtením těchto hodnot pak dostaneme celkový počet inverzí v daném pořadí. Definice. Nechť R = (r1, . . . , rn), S = (s1, . . . , sn) jsou dvě pořadí. Nechť existují indexy i = j tak, že si = rj, sj = ri a dále rk = sk pro k = i, j. Potom řekneme, že pořadí S vzniklo z pořadí R provedením jedné transpozice. Poznámka. Jinými slovy řečeno, provedení jedné transpozice znamená vzájemnou záměnu dvou různých prvků v daném pořadí, přičemž všechny ostatní prvky zůstávají na původním místě. Věta 1.1. Nechť n je pevné přirozené číslo. Pak platí: 1. z n prvků lze utvořit celkem n! různých pořadí, 2. všech n! pořadí z n prvků lze seřadit tak, že každé následující pořadí obdržíme z předcházejícího provedením jedné transpozice. Přitom lze vyjít z libovolného pořadí. 25 Důkaz. Nejprve připomeňme, že symbol n! (čti "n faktoriál") značí přirozené číslo definované: n! = n·(n−1)· · · · ·2·1. Dokazovat budeme obě části věty najednou, a to matematickou indukcí vzhledem k n. α) Pro n = 1 obě tvrzení triviálně platí. β) Předpokládejme, že obě tvrzení platí pro 1, . . . , n − 1, a budeme je dokazovat pro n. Nechť (r1, . . . , rn) je libovolné pořadí z n prvků. Podle indukčního předpokladu je všech pořadí, která mají na posledním místě prvek rn, celkem (n − 1)! a lze je seřadit tak, že následující vznikne z předchozího provedením jedné transpozice. V posledním z těchto pořadí proveďme transpozici prvků rn a ri (1 ≤ i ≤ n − 1) a stejnou úvahou jako výše dostaneme (n−1)! pořadí s prvkem ri na posledním místě. Takto vystřídáme na posledním místě všech n prvků, čímž dostaneme všechna různá pořadí z n prvků, kterých je tedy n · (n − 1)! = n!, přičemž následující pořadí vzniklo vždy z předchozího provedením jedné transpozice. Věta 1.2. Provedení jedné transpozice změní paritu daného pořadí. Důkaz. Důkaz provedeme ve dvou krocích. Nejprve pro transpozici dvou sousedních prvků a potom pro transpozici libovolných dvou různých prvků daného pořadí. α) Nechť v pořadí R = (r1, . . . , ri, ri+1, . . . , rn) je t inverzí. Provedením transpozice sousedních prvků ri a ri+1 dostaneme pořadí R = (r1, . . . , ri+1, ri, . . . , rn), v němž je buď t − 1, nebo t + 1 inverzí (proč ?). Tedy R má opačnou paritu než R. β) Nechť R = (r1, . . . , ri, . . . , rj, . . . , rn) je dané pořadí. Provedením transpozice prvků ri a rj dostaneme pořadí R = (r1, . . . , rj, . . . , ri, . . . , rn). Tuto transpozici však lze realizovat postupným provedením (j − i) + (j − i − 1) = 2(j − i) − 1 transpozic sousedních prvků. Ale číslo 2(j − i) − 1 je liché, tzn. užitím α) dostáváme tvrzení. Věta 1.3. Nechť n ≥ 2. Pak z celkového počtu n! různých pořadí z n prvků je n! 2 pořadí sudých a n! 2 pořadí lichých. Důkaz. Tvrzení věty plyne ihned v vět 1.1. a 1.2. Definice. Nechť M = {1, 2, . . . , n} je konečná množina o n prvcích. Pak bijektivní zobrazení P množiny M na sebe se nazývá permutace množiny M nebo krátce permutace. Permutaci P, definovanou předpisem : P(it) = jt, pro t = 1, . . . , n, budeme zapisovat ve tvaru dvouřádkové tabulky : i1 i2 · · · in j1 j2 · · · jn . Poznámka. Permutace množiny M je tedy bijekce M → M, kterou zapisujeme ve tvaru dvouřádkové tabulky. Znamená to, že v horním i dolním řádku této tabulky musí být vždy nějaké 26 pořadí z n prvků. Zřejmě lze tutéž permutaci P zapsat v uvedeném tvaru celkem n! formálně různými způsoby (zaměníme-li pořadí sloupců v tabulce permutace). Všech těchto n! zápisů permutace P je samozřejmě naprosto rovnocenných, i když nejčastěji budeme permutaci zapisovat v tzv. základním tvaru: 1 2 · · · n k1 k2 · · · kn . (1) Příklad 1.2. Pro n = 5 jsou: 1 2 3 4 5 2 3 5 4 1 , resp. 3 2 1 4 5 5 3 2 4 1 , resp. 4 1 5 2 3 4 2 1 3 5 tři formálně různé zápisy téže permutace (z celkového počtu 5! = 120 možných zápisů této jedné permutace). Věta 1.4. Počet různých permutací n-prvkové množiny je roven číslu n! . Důkaz. Zapíšeme-li každou permutaci v základním tvaru (1) , pak různých permutací bude přesně tolik, kolik bude různých pořadí v dolním řádku. Těch je však n! , podle věty 1.1. 1. Definice. Permutace P se nazývá sudá permutace, resp. lichá permutace, jestliže součet počtu inverzí v horním a dolním řádku tabulky permutace P je sudé číslo, resp. liché číslo. Hovoříme pak též o paritě permutace. Poznámka. I když danou permutaci P můžeme zapsat n! formálně různými tabulkami, je předchozí definice korektní, neboť při libovolném zápisu permutace P je parita horního a dolního řádku (chápaných jako pořadí) buď vždy stejná, nebo vždy rozdílná. Tento fakt plyne z toho, že při přechodu od jednoho zápisu permutace P k jinému provádíme totiž jistý počet transpozic, a to současně v horním i dolním řádku. Věta 1.5. Nechť n ≥ 2. Pak z celkového počtu n! různých permutací n-prvkové množiny je n! 2 permutací sudých a n! 2 permutací lichých. Důkaz. Každou permutaci zapíšeme v základním tvaru: 1 2 · · · n k1 k2 · · · kn . Parita permutace je pak shodná s paritou pořadí v dolním řádku a věta plyne bezprostředně z věty 1.3. 27 §2. Determinanty Jedním ze základních pojmů celé moderní matematiky je pojem matice. Teorie matic hraje ústřední úlohu v tzv. lineární algebře. Její výsledky se pak aplikují při řešení soustav lineárních rovnic, při studiu vektorových prostorů a v celé řadě dalších odvětví nejenom matematiky. Definice. Nechť T je číselné těleso, m, n jsou přirozená čísla. Pak obdélníkové schéma tvaru: A =      a11 a12 · · · a1n a21 a22 · · · a2n ... ... ... ... am1 am2 · · · amn      , (1) kde aij ∈ T pro i = 1, . . . , m a j = 1, . . . , n, se nazývá matice typu m/n (nad tělesem T). Označení: A = (aij) typu m/n. Čísla aij ∈ T se nazývají prvky matice A. Matice A = (aij) typu m/n a matice B = (bij) typu p/q jsou si rovny, jestliže jsou stejného typu (tj. m = p ∧ n = q) a je-li aij = bij pro každé i, j. Poznámka. 1. Předchozí definice matice je sice názorná, ale přísně vzato není zcela korektní, neboť se v ní používá formálně nejasného a nepřesného pojmu "obdélníkové schéma" (a je pak nutné v ní hovořit o rovnosti dvou matic). Zcela přesně by bylo možné matici typu m/n nad tělesem T definovat jakožto zobrazení: f : {1, 2, . . . , m} × {1, 2, . . . , n} → T, kde f (i, j) = aij. Při této definici by však většina tvrzení o maticích byla formálně značně komplikovaná a nepřehledná. Ponecháme tedy definici matice tak, jak byla původně uvedena (tj. vypisujeme vlastně funkční hodnoty uvedeného zobrazení f do onoho "obdélníkového schématu"). 2. Každý jednotlivý řádek matice A typu m/n nad tělesem T můžeme zřejmě uvažovat jako uspořádanou n-tici čísel z tělesa T, tzn. jinak řečeno, jako vektor z vektorového prostoru Tn . Má smysl pak hovořit o sčítání řádků matice, násobení řádku číslem z T, lineární kombinaci řádků, lineární závislosti a nezávislosti řádků, atd., a to ve smyslu uvedených operací, resp. pojmů tak, jak byly definovány ve vektorovém prostoru Tn . Matici A lze pak též chápat jako uspořádanou m-tici vektorů z Tn . Analogicky můžeme sloupce matice A chápat jako vektory z vektorového prostoru Tm a provádět s nimi tytéž úvahy. Definice. Nechť A = (aij) je matice typu m/n nad T. Potom: 1. je-li aij = 0 pro každé i, j (tj. všechny prvky matice jsou rovny nule), matice se nazývá nulová matice (typu m/n) a označuje se symbolem 0mn 2. je-li m = n (tj. počet řádků je roven počtu sloupců), matice A se nazývá čtvercová matice řádu n 28 3. matice A typu n/m, která vznikne z matice A záměnou řádků za sloupce, tj.: A =      a11 a21 · · · am1 a12 a22 · · · am2 ... ... ... ... a1n a2n · · · amn      se nazývá transponovaná matice k matici A. Ve zbývající části tohoto paragrafu se budeme zabývat pouze čtvercovými maticemi řádu n nad pevným číselným tělesem T. Pro tyto matice nejprve zavedeme následující pojem. Definice. Nechť A = (aij) je čtvercová matice řádu n nad tělesem T. Pak determinant matice A je číslo z tělesa T označené det A (nebo též |A|) a definované vztahem: det A = (j1,...,jn) (−1)I(j1,...,jn) · a1j1 · a2j2 · · · · · anjn , kde I(j1, . . . , jn) značí celkový počet inverzí v permutaci: 1 2 · · · n j1 j2 · · · jn použitých řádkových a sloupcových indexů. Sčítání se provádí přes všechna různá pořadí (j1, . . . , jn) sloupcových indexů. Výraz (−1)I(j1,...,jn) · a1j1 · a2j2 · · · · · anjn se nazývá člen determinantu. Poznámka. Rozebereme-li si předchozí definici podrobněji, pak vidíme, že determinant det A je číslo z T, které dostaneme sečtením celkem n! členů determinantu (viz věta 1.1. 1.). Přitom každý jednotlivý člen determinantu je součinem n prvků matice A vybraných tak, že z každého řádku a každého sloupce je vybrán právě jeden prvek a tento součin je "opatřen znaménkem + nebo −" podle toho, zda permutace utvořená z řádkových a sloupcových indexů vybraných n prvků je sudá nebo lichá. Dále je třeba si uvědomit zásadní rozdíl mezi pojmem matice (tj. jakýmsi obdélníkovým, resp. čtvercovým schématem) a pojmem determinantu matice (tj. pevným číslem z T). Příklad 2.1. Rozepišme si předchozí definici determinantu pro nejjednodušší případy, tj. n = 1, 2, 3. n = 1 : a11 = a11 n = 2 : a11 a12 a21 a22 = a11 · a22 − a12 · a21 n = 3 : a11 a12 a13 a21 a22 a23 a31 a32 a33 = a11 · a22 · a33 + a12 · a23 · a31 + a13 · a21 · a32 − − a13 · a22 · a31 − a12 · a21 · a33 − a11 · a23 · a32 . 29 Je vidět, že výpočet determinantu matice pouze na základě definice by byl neúnosně zdlouhavý a pracný, zejména pro větší n. Např. pro n = 10 by bylo nutno spočítat přes tři a půl milionu desetičlenných součinů (neboť 10! = 3 628 800). Z tohoto důvodu uvedeme nyní několik vět popisujících základní vlastnosti determinantů, které mnohdy výpočet determinantu podstatně zjednoduší. Všude v dalším v tomto paragrafu budeme symbolem A označovat čtvercovou matici A = (aij) řádu n nad tělesem T. Věta 2.1. Transponováním matice A se hodnota determinantu nezmění, tj. det A = det A. Důkaz. Nechť (j1, j2, . . . , jn) je libovolné pořadí z n prvků. Pak součin a1j1 · a2j2 · · · · · anjn se vyskytuje právě jednou v det A i det A . Tento součin je v det A vynásoben číslem (−1)r , resp. v det A číslem (−1)s , kde r, resp. s značí celkový počet inverzí v permutaci: 1 2 · · · n j1 j2 · · · jn , resp. j1 j2 · · · jn 1 2 · · · n . Zřejmě však r = s, odkud již plyne tvrzení. Věta 2.2. Nechť prvky k-tého řádku matice A mají tvar: ak1 = bk1 + ck1 , ak2 = bk2 + ck2 , . . . akn = bkn + ckn a nechť matice B, resp. C se liší od matice A pouze v prvcích k-tého řádku, přičemž bk1, . . . , bkn je k-tý řádek matice B, resp. ck1, . . . , ckn je k-tý řádek matice C. Potom platí : det A = det B + det C . Schématicky zapsáno tedy platí : a11 · · · a1n ... ... ... bk1 + ck1 · · · bkn + ckn ... ... ... an1 · · · ann = a11 · · · a1n ... ... ... bk1 · · · bkn ... ... ... an1 · · · ann + a11 · · · a1n ... ... ... ck1 · · · ckn ... ... ... an1 · · · ann . Důkaz. Tvrzení plyne přímo z definice determinantu, neboť pro každý člen determinantu det A platí: (−1)I(j1,...,jn) · a1j1 · · · · · (bkjk + ckjk ) · · · · · anjn = = (−1)I(j1,...,jn) · a1j1 · · · · · bkjk · · · · · anjn + (−1)I(j1,...,jn) · a1j1 · · · · · ckjk · · · · · anjn . Poznámka. Předchozí větu lze zřejmě rozšířit pro libovolný konečný počet sčítanců v k-tém řádku matice A (dokáže se pomocí matematické indukce). 30 Věta 2.3. Nechť matice B vznikne z matice A: 1. záměnou dvou různých řádků. Potom je det B = − det A. 2. vynásobením jednoho řádku pevným číslem t ∈ T. Potom je det B = t · det A. Důkaz. 1: Zaměňme v matici A k-tý řádek s r-tým řádkem, kde k = r. Pak součiny vyskytující se v det A a det B zůstanou stejné, ale mají vždy opačná znaménka, protože permutace: 1 · · · k · · · r · · · n j1 · · · jk · · · jr · · · jn a 1 · · · k · · · r · · · n j1 · · · jr · · · jk · · · jn mají (podle věty 1.2.) různou paritu. Potom však det B = − det A. 2: Plyne přímo z definice determinantu, neboť vynásobíme-li v matici A např. k-tý řádek prvkem t ∈ T, potom: det B = (j1,...,jn) (−1)I(j1,...,jn) · a1j1 · · · · · t · akjk · · · · · anjn = = t · (j1,...,jn) (−1)I(j1,...,jn) · a1j1 · · · · · akjk · · · · · anjn = t · det A . Věta 2.4. Nechť v matici A: 1. jeden řádek sestává ze samých nul. Potom je det A = 0. 2. dva různé řádky jsou shodné. Potom je det A = 0. 3. jeden řádek je násobkem jiného řádku. Potom je det A = 0. 4. jeden řádek je lineární kombinací ostatních řádků. Potom je det A = 0. Důkaz. 1: Plyne přímo z definice determinantu. Každý člen det A je totiž roven nule, poněvadž obsahuje nulu (a sice z toho řádku, který sestává ze samých nul). 2: Zaměníme-li ty dva řádky matice A, které jsou shodné, pak matice A se zřejmě nezmění. Podle věty 2.3. 1. však musí být det A = − det A, tj. 2·det A = 0, odkud však dostáváme, že det A = 0. 3: Plyne přímo z věty 2.3. 2. a z právě dokázané části 2. 4: Nechť např. k-tý řádek matice A je lineární kombinací ostatních řádků. Pak det A lze podle poznámky za větou 2.2. vyjádřit jako součet (n − 1) determinantů, z nichž však v každém je k-tý řádek násobkem nějakého jiného řádku. Podle části 3 této věty je však každý z těchto (n − 1) determinantů roven nule, a tedy det A = 0 + 0 + · · · + 0 = 0. Věta 2.5. Hodnota determinantu matice A se nezmění, jestliže: 1. k jednomu řádku matice A přičteme libovolný násobek jiného řádku 2. k jednomu řádku matice A přičteme libovolnou lineární kombinaci ostatních řádků 31 Důkaz. 1: Plyne bezprostředně z vět 2.2. a 2.4. 3.. 2: Plyne z poznámky za větou 2.2. a z věty 2.4. 4.. Poznámka. Z věty 2.1. plyne, že ke každé z následujících vět, tj. 2.2., 2.3. a 2.4. platí analogická věta, kterou získáme tak, že v původní formulaci slovo "řádek" nahradíme slovem "sloupec". Například tedy platí tvrzení: "jestliže v matici A je jeden sloupec lineární kombinací ostatních sloupců, potom je det A = 0" , atd. Tuto úvahu lze zřejmě uplatnit na každé tvrzení o determinantech matice, týkající se řádků matice. Dostaneme tak stejné tvrzení, týkající se sloupců. Analogicky naopak (tzn. z každého platného tvrzení o determinantech, týkajícího se sloupců dané matice, dostaneme záměnou slova "sloupec" za slovo "řádek" platné tvrzení, týkající se řádků). Větu 2.5. (a odpovídající větu pro sloupce) často využíváme při konkrétních výpočtech determinantů, kdy se přičítáním vhodných násobků jedněch řádků (resp. sloupců) k jiným řádkům (resp. sloupcům) snažíme matici upravit na takový tvar, z něhož již determinant lehce spočítáme. Například, dojdeme-li k matici A tvaru: A =        a11 a12 · · · a1,(n−1) a1n 0 a22 · · · a2,(n−1) a2n ... ... ... ... ... 0 0 · · · a(n−1),(n−1) a(n−1),n 0 0 · · · 0 ann        (tj. všude pod hlavní diagonálou jsou nuly), pak det A = a11 · a22 · · · · · ann, jak plyne ihned z definice determinantu. Stejný výsledek (tzn. hodnota determinantu je rovna součinu prvků v hlavní diagonále) dostaneme, jestliže v matici jsou samé nuly nad hlavní diagonálou. Ve zbývající části tohoto paragrafu pak odvodíme ještě jeden způsob jak zjednodušit výpočet determinantu. Definice. Nechť A = (aij) je čtvercová matice řádu n. Nechť je zvoleno k jejích řádků a sloupců (k < n), a sice: 1 ≤ i1 < i2 < · · · < ik ≤ n, resp. 1 ≤ j1 < j2 < · · · < jk ≤ n. Pak matice vytvořená ze zvolených řádků a sloupců, tj. matice M =      ai1j1 ai1j2 · · · ai1jk ai2j1 ai2j2 · · · ai2jk ... ... ... ... aikj1 aikj2 · · · aikjk      se nazývá submatice matice A určená řádky i1, . . . , ik a sloupci j1 . . . , jk. Její determinant |M| se nazývá minor řádu k matice A. Zbývajícími (n − k) řádky a (n − k) sloupci je určena submatice M matice A, která se nazývá doplňková submatice k submatici M a její minor |M| se nazývá doplněk minoru |M|. 32 Označme sM = i1 + i2 + · · · + ik + j1 + · · · + jk. Pak číslo (−1)sM · |M| se nazývá algebraický doplněk minoru |M|. Člen doplňku |M| vynásobený číslem (−1)sM se pak nazývá člen algebraického doplňku minoru |M|. Příklad 2.2. Nechť A je čtvercová matice řádu 4 nad tělesem R: A =     1 2 3 4 0 1 2 −3 −1 2 0 1 6 −2 −1 3    . Zvolíme-li i1 = 1, i2 = 3, j1 = 2, j2 = 3, tj. první a třetí řádek, resp. druhý a třetí sloupec, pak submatice M určená zvolenými řádky a sloupci je tvaru: M = 2 3 2 0 , tzn. minor |M| = −6. Doplňkovou submaticí je pak: M = 0 −3 6 3 , tzn. doplněk |M| = +18. Dále je sM = 1 + 3 + 2 + 3 = 9, tzn. algebraický doplněk minoru |M| je: (−1)sM · |M| = (−1)9 · 18 = −18. Poznámka. Označíme-li sM součet indexů řádků a sloupců určujících doplňkovou submatici M, pak zřejmě platí (−1)sM = (−1)sM , neboť sM + sM = 2 · (1 + 2 + · · · + n) je sudé číslo, a tedy čísla sM a sM musí být obě buď současně sudá, nebo současně lichá. Tedy algebraický doplněk minoru |M| je též roven číslu (−1)sM ·|M|, což lze někdy při praktických výpočtech s výhodou použít. Věta 2.6. Nechť A je čtvercová matice řádu n, nechť |M| je minor řádu k matice A (k < n). Pak součin libovolného členu minoru |M| s libovolným členem jeho algebraického doplňku je členem determinantu |A|. Důkaz. Nechť submatice M je určena řádky i1, . . . , ik a sloupci j1, . . . , jk matice A, přičemž i1 < i2 < · · · < ik, resp. j1 < j2 < · · · < jk. Zaměňme i1-tý řádek matice A s (i1 − 1)-tým řádkem, pak s (i1 − 2)-tým řádkem, atd., až s prvním řádkem. Celkem jsme takto provedli (i1 −1) záměn řádků matice A. Podobně pomocí (i2 − 2) záměn řádků přemístíme i2-tý řádek na místo druhého řádku, atd., až pomocí (ik −k) záměn řádků přemístíme ik-tý řádek na místo k-tého řádku. Celkem jsme tedy provedli (i1 − 1) + (i2 − 2) + · · · + (ik − k) = (i1 + · · · + ik) − (1 + 2 + · · · + k) záměn řádků matice A. Analogicky pomocí (j1 +· · ·+jk)−(1+2+· · ·+k) záměn sloupců matice A přemístíme j1, . . . , jk-tý sloupec na místo prvního, . . . , až k-tého sloupce. (Důležité je, že se po provedení těchto úprav nezměnilo původní pořadí řádků a sloupců submatice M ani její doplňkové submatice M, tzn. nezměnily se hodnoty jednotlivých členů minoru |M| ani členů jeho doplňku |M|.) Tedy pomocí (i1 + · · · + ik + j1 + · · · + jk) − 2 · (1 + · · · + k) záměn řádků, resp. sloupců jsme z matice A dostali jistou matici B, přičemž podle věty 2.3. 1. platí: 33 |B| = |A| · (−1)i1+···+ik+j1+···+jk−2·(1+···+k) = |A| · (−1)i1+···+ik+j1+···+jk , odkud po vynásobení číslem (−1)i1+···+ik+j1+···+jk dostáváme: |A| = |B| · (−1)i1+···+ik+j1+···+jk . (2) Submatice M je v matici B určena prvními k řádky a prvními k sloupci. Potom však součin libovolného členu minoru |M| s libovolným členem doplňku |M| je členem determinantu |B|, neboť označíme-li B = (bij), pak člen minoru |M|, resp. člen doplňku |M| jsou tvaru: (−1)I(t1,...,tk) · b1t1 · · · · · bktk resp. (−1)I(tk+1,...,tn) · bk+1,tk+1 · · · · · bntn (3) kde I(t1, . . . , tk) značí počet inverzí v permutaci 1 · · · k t1 · · · tk , resp. I(tk+1, . . . , tn) značí počet inverzí v permutaci k + 1 · · · n tk+1 · · · tn . Označíme-li I(t1, . . . , tn) počet inverzí v per- mutaci 1 · · · n t1 · · · tn , pak platí (rozmyslete si proč!): I(t1, . . . , tk) + I(tk+1, . . . , tn) = I(t1, . . . , tn). Potom však vynásobením obou členů z (3) dostáváme: (−1)I(t1,...,tn) · b1t1 · · · · · bntn , což je však člen determinantu |B|. Odtud (podle (2)) součin libovolného členu minoru |M| s libovolným členem doplňku |M| vynásobený číslem (−1)i1+···+ik+j1+···+jk je členem determinantu |A|. To však je již žádané tvrzení, neboť libovolný člen algebraického doplňku minoru |M| v matici A obdržíme z libovolného členu doplňku |M| vynásobením číslem (−1)i1+···+ik+j1+···+jk . Věta 2.7. (Laplaceova věta) Nechť A je čtvercová matice řádu n a nechť je pevně zvoleno k řádků matice A, kde 0 < k < n. Pak determinant matice A je roven součtu všech n k součinů minorů řádu k, vybraných ze zvolených k řádků, s jejich algebraickými doplňky. Důkaz. Ze zvolených k řádků lze zřejmě vybrat submatici řádu k právě n k různými způsoby. Podle věty 2.6. součin členu příslušného minoru s členem jeho algebraického doplňku je členem determinantu matice A. Přitom je zřejmé, že dostáváme navzájem různé členy determinantu matice A. K důkazu našeho tvrzení tedy stačí spočítat, zda uvedeným způsobem dostaneme všechny členy determinantu matice A (kterých, jak víme, je n!). Ale každý minor řádu k má k! členů, každý jeho algebraický doplněk má (n − k)! členů a vybraných minorů je n k , tzn. celkem dostáváme: k! · (n − k)! · n k = k! · (n − k)! · n! k!·(n−k)! = n! členů determinantu matice A, a tedy věta platí. Poznámka. Laplaceova věta se také někdy nazývá "věta o rozvoji determinantu podle zvolených k řádků". Její praktický význam spočívá v tom, že výpočet determinantu matice určitého řádu převádíme na výpočet jistého počtu determinantů matic menšího řádu. Připomeňme, že na základě věty 2.1. platí analogická věta k Laplaceově větě zformulovaná pro sloupce (tzn. slovo "řádek" v Laplaceově větě nahradíme slovem "sloupec"). Říkáme pak, že jsme determinant vyjádřili rozvinutím podle daných k sloupců. 34 Definice. Nechť A = (aij) je čtvercová matice řádu n. Pak algebraický doplněk minoru jednoprvkové submatice sestávající z prvku aij budeme krátce nazývat algebraický doplněk prvku aij a označovat symbolem Aij. Důsledek. Nechť A = (aij) je čtvercová matice řádu n. Pak platí 1. nechť i je pevně zvolený řádkový index. Potom |A| = ai1 · Ai1 + ai2 · Ai2 + · · · + ain · Ain 2. nechť j je pevně zvolený sloupcový index. Potom |A| = a1j · A1j + a2j · A2j + · · · + anj · Anj. Důkaz. První část důsledku je doslovným přepisem Laplaceovy věty, a sice pro k = 1. Druhá část důsledku je Laplaceova věta přeformulovaná pro sloupce (ve smyslu předchozí poznámky), a to opět pro k = 1. Příklad 2.3. Užitím Laplaceovy věty spočtěme determinant |A|, kde A je matice řádu 4 (nad R) : A =     1 1 3 4 2 0 0 8 3 0 0 2 4 4 7 5     . 1. Výpočet provedeme rozvinutím podle 2. a 3. řádku (při praktickém výpočtu je zřejmě nejvýhodnější volit řádky, v nichž se vyskytuje pokud možno hodně nul). Pak: |A| = 2 0 3 0 · 3 4 7 5 · (−1)8 + 2 0 3 0 · 1 4 4 5 · (−1)9 + 2 8 3 2 · 1 3 4 7 · (−1)10 + + 0 0 0 0 · 1 4 4 5 · (−1)10 + 0 8 0 2 · 1 3 4 7 · (−1)11 + 0 8 0 2 · 1 1 4 4 · (−1)12 = = 2 8 3 2 · 1 3 4 7 = (−20) · (−5) = 100 . 2. Spočtěme tentýž determinant rozvinutím podle 1. sloupce. Pak: |A| = 1· 0 0 8 0 0 2 4 7 5 ·(−1)2 + 2· 1 3 4 0 0 2 4 7 5 ·(−1)3 + 3· 1 3 4 0 0 8 4 7 5 ·(−1)4 + 4· 1 3 4 0 0 8 0 0 2 ·(−1)5 = = 0 − 2 · 10 + 3 · 40 + 0 = 100 . 35 §3. Algebra matic V tomto paragrafu se nejprve vrátíme k maticím typu m/n (tj. obecně k obdélníkovým maticím) a ukážeme si některé algebraické struktury, které lze pomocí matic utvořit. Budeme stále předpokládat, že všechny matice jsou uvažovány nad pevným číselným tělesem T (nebude-li výslovně řečeno jinak). Označení. Všude v dalším budeme symbolem Matmn(T) označovat množinu všech matic typu m/n nad pevným číselným tělesem T. Napíšeme-li tedy, že A ∈ Matmn(T), pak to bude znamenat, že A je matice typu m/n nad tělesem T. Definice. Nechť A = (aij), B = (bij) ∈ Matmn(T), t ∈ T libovolné. Pak: 1. matice A + B = (cij) ∈ Matmn(T) definovaná : cij = aij + bij pro i = 1, . . . , m , j = 1, . . . , n se nazývá součet matic A, B 2. matice t · A = (dij) ∈ Matmn(T) definovaná: dij = t · aij pro i = 1, . . . , m , j = 1, . . . , n se nazývá součin čísla t s maticí A. Vidíme, že součet matic je definován pouze pro matice stejného typu, přičemž pak sčítáme "odpovídající si prvky" obou matic. Sčítání matic je zřejmě operací na množině Matmn(T). Podobně, při součinu čísla s maticí násobíme tímto číslem každý prvek dané matice. Věta 3.1. (Matmn(T), +) je komutativní grupa. Důkaz. Z předchozí definice a ze známých vlastností obyčejného sčítání čísel ihned plyne, že (Matmn(T), +) je pologrupa, která je komutativní. Lehce se ověří, že nulová matice 0mn je nulou této pologrupy. Dále, pro libovolnou matici A = (aij) ∈ Matmn(T) je zřejmě matice (−aij) ∈ Matmn(T) opačným prvkem k A. Označujeme (−aij) = −A. Tedy (Matmn(T), +) je komutativní grupa. Věta 3.2. Množina Matmn(T) je vektorový prostor nad T (vzhledem k operacím sčítání matic a součinu čísla s maticí), jehož dimenze je rovna m·n . 36 Důkaz. Podle předchozí věty je (Matmn(T), +) komutativní grupou. Dále, rozepsáním se lehce ověří, že pro pro libovolné t, s ∈ T a A, B ∈ Matmn(T) platí : 1. t · (A + B) = t · A + t · B 2. (t + s) · A = t · A + s · A 3. (t · s) · A = t · (s · A) 4. 1 · A = A . Tedy z definice vektorového prostoru plyne, že Matmn(T) je vektorový prostor nad T. Roli vektorů zde tedy hrají matice typu m/n nad T. Zbývá ukázat, že dim Matmn(T) = m · n, což provedeme tak, že zkonstruujeme bázi vektorového prostoru Matmn(T). Pro r = 1, . . . , m, s = 1, . . . , n označme symbolem Urs matici typu m/n, která má na r, s-tém místě (tj. v r-tém řádku a s-tém sloupci) jedničku a všude jinde samé nuly. Tedy: Urs = (uij) je typu m/n , přičemž uij = 1 pro i = r, j = s 0 jinak Dostáváme tak celkem m · n matic : U11 , . . . , U1n , U21 , . . . , U2n , . . . , Um1 , . . . , Umn , o nichž se rozepsáním lehce ukáže (proveďte si podrobně sami!), že jsou lineárně nezávislé a že generují celý prostor Matmn(T), tzn. jsou jeho bází. Definice. Nechť A = (aij) je matice typu m/n, B = (bij) je matice typu n/p (obě nad týmž tělesem T). Pak matice A · B = (cij) , typu m/p , kde : cij = n k=1 aik · bkj , pro i = 1, . . . , m, j = 1, . . . , p, se nazývá součin matic A, B (v tomto pořadí). Příklad 3.1. Nechť A, B jsou matice nad R tvaru: A =   1 2 −1 0 0 1 −1 −7 −8 0 0 −5   , B =     3 2 −4 1 1 0 −2 −3     . Pak: A · B =   −6 4 9 22 −14 −1  , resp. součin B · A není vůbec definován. Poznámka. Při násobení dvou matic A, B zřejmě podstatně záleží na jejich pořadí. Z předchozího příkladu vidíme, že se může stát, že součin A·B je definován, kdežto součin B·A definován není. Ale i v případě, že oba součiny A · B a B · A jsou definovány a jsou stejného typu (tzn. A, B jsou čtvercové matice stejného typu), neznamená to, že A · B = B · A, jak je vidět z následujícího příkladu. 37 Příklad 3.2. Nechť n ≥ 2 a A, B jsou čtvercové matice řádu n (nad T) tvaru: A =      1 0 · · · 0 0 0 · · · 0 ... ... ... ... 0 0 · · · 0      , B =      0 0 · · · 0 1 0 · · · 0 ... ... ... ... 0 0 · · · 0      . Pak přímým výpočtem zjistíme, že A · B = 0nn, kdežto B · A = B, což znamená, že A · B = B · A. Vidíme tedy, že násobení matic obecně není komutativní. Na druhé straně, násobení matic je však asociativní a násobení matic je distributivní vzhledem ke sčítání matic (samozřejmě za předpokladu, že všechny použité součty a součiny matic jsou definovány), jak ukazují následující dvě věty. Věta 3.3. Násobení matic je asociativní, tj. nechť matice A je typu m/n, B je typu n/p a C je typu p/q. Potom platí: A · (B · C) = (A · B) · C. Důkaz. Nechť platí předpoklady věty, přičemž A = (aij), B = (bij), C = (cij). Pak matice A · B = (dij) je typu m/p, přičemž dij = n u=1 aiu · buj. Dále pak (A · B) · C = (fij) je matice typu m/q, kde fij = p v=1 div · cvj = p v=1 n u=1 aiu · buv · cvj, přičemž v posledním výrazu není třeba v součinu za sumačními znaky závorkovat, neboť se jedná o součin čísel (z T), pro který platí asociativní zákon. Podobně, matice B · C = (gij) je typu n/q, kde gij = p v=1 biv · cvj. Dále pak A · (B · C) = (hij) je matice typu m/q, kde: hij = n u=1 aiu · guj = n u=1 aiu · p v=1 buv · cvj = p v=1 n u=1 aiu · buv · cvj = fij. Dohromady tedy platí dokazovaná rovnost. Věta 3.4. Násobení matic je distributivní vzhledem ke sčítání matic, tj.: 1. Nechť matice A je typu m/n, resp. B, C jsou typu n/p. Potom platí: A · (B + C) = A · B + A · C. 2. Nechť matice F, G jsou typu m/n, resp. H je typu n/p. Potom platí: (F + G) · H = F · H + G · H. 38 Důkaz. 1: Nechť A = (aij) je typu m/n, resp. B = (bij), C = (cij) jsou typu n/p. Potom A · (B + C) = (dij) je matice typu m/p, přičemž dij = n k=1 aik · (bkj + ckj). Dále, matice A · B + A · C = (fij) je typu m/p a platí: fij = n k=1 aik · bkj + n k=1 aik · ckj = n k=1 aik · (bkj + ckj) = dij , tzn. dokázali jsme 1. 2: Dokáže se analogickým způsobem jako 1. Definice. Čtvercová matice řádu n (nad T) tvaru: En =        1 0 0 · · · 0 0 0 1 0 · · · 0 0 ... ... ... ... ... ... 0 0 0 · · · 1 0 0 0 0 · · · 0 1        (tj. matice mající v hlavní diagonále samé jedničky a všude jinde samé nuly) se nazývá jednotková matice (řádu n). Věta 3.5. Množina všech čtvercových matic řádu n (nad T) s operacemi sčítání matic a násobení matic, tj. (Matnn(T), +, ·), je okruhem s jedničkou. Tento okruh je pro n ≥ 2 nekomutativní a obsahuje dělitele nuly. Důkaz. Je zřejmé, že sčítání matic, resp. násobení matic jsou operace na množině Matnn(T). Z vět 3.1., 3.3. a 3.4. pak ihned plyne, že (Matnn(T), +, ·) je okruh. Dále, pro libovolnou matici A ∈ Matnn(T) zřejmě platí (ověřte si rozepsáním!), že: En · A = A · En = A, a tedy jednotková matice En je jedničkou okruhu (Matnn(T), +, ·). Z příkladu 3.2. pak plyne, že pro n ≥ 2 tento okruh není komutativní a obsahuje dělitele nuly (nulou je zde zřejmě nulová matice řádu n, tzn. 0nn). Poznamenejme, že okruh (Matnn(T), +, ·), stručně též nazývaný "okruh matic", je jedním z nejjednodušších příkladů nekomutativního okruhu. Věta 3.6. Nechť A je matice typu m/n a B je matice typu n/p. Pak platí: (A · B) = B · A tj. transponovaná matice k součinu matic je rovna součinu transponovaných matic v opačném pořadí. 39 Důkaz. Nechť A = (aij) je typu m/n, resp. B = (bij) je typu n/p. Pak matice (A · B) = (cij) je typu p/m, přičemž její prvek cij je prvkem, který v matici A · B stojí v j-tém řádku a i-tém sloupci, tzn. cij = n k=1 ajk · bki. Analogicky, matice B · A = (dij) je typu p/m, kde dij = n k=1 bki · ajk = n k=1 ajk · bki . Dostáváme tak, že cij = dij , tzn. platí dokazovaná rovnost. Věta 3.7. (Cauchyova věta) Nechť A , B jsou čtvercové matice řádu n. Pak platí: |A · B| = |A| · |B| . Důkaz. Nechť A = (aij), B = (bij) . Uvažme matici H řádu 2n tvaru: H =              a11 a12 · · · a1n 0 0 · · · 0 a21 a22 · · · a2n 0 0 · · · 0 ... ... ... ... ... ... ... ... an1 an2 · · · ann 0 0 · · · 0 −1 0 · · · 0 b11 b12 · · · b1n 0 −1 · · · 0 b21 b22 · · · b2n ... ... ... ... ... ... ... ... 0 0 · · · −1 bn1 bn2 · · · bnn              . Užitím Laplaceovy věty (a sice rozvinutím podle prvních n řádků) dostáváme: |H| = |A| · |B| . (1) Nyní ke každému z posledních n sloupců přičteme vhodnou kombinaci prvních n sloupců tak, aby na místě každého bij vznikla nula (přesněji řečeno: k (n+j)-tému sloupci přičteme b1j-krát 1. sloupec + · · · + bnj-krát n-tý sloupec, pro j = 1, . . . , n). Dostáváme tak matici: K =              a11 a12 · · · a1n c11 c12 · · · c1n a21 a22 · · · a2n c21 c22 · · · c2n ... ... ... ... ... ... ... ... an1 an2 · · · ann cn1 cn2 · · · cnn −1 0 · · · 0 0 0 · · · 0 0 −1 · · · 0 0 0 · · · 0 ... ... ... ... ... ... ... ... 0 0 · · · −1 0 0 · · · 0              , v níž cij = ai1 · b1j + · · · + ain · bnj = n k=1 aik · bkj, pro i, j = 1, . . . , n. Při tomto označení je tedy (cij) = A · B. Rozvinutím podle posledních n řádků matice K pak dostáváme: |K| = (−1)n · |A · B| · (−1)1+···+n+(n+1)+···+2n = |A · B| · (−1)2·n·(n+1) = |A · B| . (2) 40 Ale úpravy, pomocí nichž jsme z matice H dostali matici K, nemění hodnotu determinantu (podle věty 2.5. 2. zformulované pro sloupce), a tedy |H| = |K|, odkud pomocí (1) a (2) dostáváme ihned tvrzení věty. Definice. Čtvercová matice A se nazývá regulární matice, je-li |A| = 0, resp. singulární matice, je-li |A| = 0 . Důsledek. Nechť A, B jsou čtvercové matice stejného řádu n. Pak platí : matice A · B je regulární ⇐⇒ obě matice A i B jsou regulární. Důkaz. Tvrzení plyne přímo z definice regulární matice a z Cauchyovy věty. Definice. Nechť A je čtvercová matice řádu n. Matice X s vlastností: A · X = En ∧ X · A = En (3) se nazývá inverzní matice k matici A a označuje se symbolem A−1 . Poznámka. Předchozí definice zřejmě nezaručuje, že k dané čtvercové matici A musí existovat matice inverzní. Nicméně, z faktu, že (Matnn(T), ·) je pologrupa s jedničkou En (což bezprostředně vyplývá z věty 3.5.) a z faktu, že pojem inverzní matice k matici A je totožný s pojmem inverzního prvku k danému prvku v této pologrupě, plyne , že k matici A existuje nejvýše jedna inverzní matice a používání označení A−1 je tedy korektní. Následující věta uvede nutnou a dostatečnou podmínku existence inverzní matice k matici A. Její důsledek pak uvede vzorec pro výpočet této inverzní matice A−1 . K tomu však bude potřeba nejprve zavést následující pojem. Definice. Nechť A = (aij) je čtvercová matice řádu n. Pak matice A∗ =      A11 A21 · · · An1 A12 A22 · · · An2 ... ... ... ... A1n A2n · · · Ann      . se nazývá adjungovaná matice k matici A. Poznámka. Vidíme, že v adjungované matici A∗ se na i, j-tém místě nachází číslo Aji (pozor na pořadí indexů!), tzn. algebraický doplněk prvku stojícího na j, i-tém místě v původní matici A. Ilustrujme si tento pojem na jednoduchém příkladu (příslušné výpočty si sami ověřte). Nechť A =   1 2 1 0 3 2 1 0 2  . Potom A∗ =   A11 A21 A31 A12 A22 A32 A13 A23 A33   =   6 -4 1 2 1 -2 -3 2 3  . 41 Věta 3.8. Nechť A je čtvercová matice řádu n. Pak platí : k matici A existuje matice inverzní ⇐⇒ A je regulární matice. Důkaz. Nechť A = (aij) je čtvercová matice řádu n. Dokážeme postupně obě implikace. "⇒": Nechť k matici A existuje inverzní matice A−1 . Pak platí En = A · A−1 , odkud přechodem k determinantům a použitím Cauchyovy věty dostáváme : 1 = |En| = |A · A−1 | = |A| · |A−1 | . Musí tedy být |A| = 0 , což znamená, že A je regulární matice. "⇐": Nechť A je regulární matice, tzn. |A| = 0. Nyní vezmeme matici X = 1 |A| · A∗ a dokážeme, že X je inverzní maticí k matici A. Označme A · X = (cij) . Potom po rozepsání dostáváme:        c11 c12 · · · c1n ... ... ... ci1 ci2 · · · cin ... ... ... cn1 cn2 · · · cnn        = 1 |A| ·        a11 a12 · · · a1n ... ... ... ai1 ai2 · · · ain ... ... ... an1 an2 · · · ann        ·        A11 · · · Aj1 · · · An1 A12 · · · Aj2 · · · An2 ... ... ... ... ... ... A1n · · · Ajn · · · Ann        odkud cij = 1 |A| · (ai1 · Aj1 + ai2 · Aj2 + · · · + ain · Ajn). Potom – pro i = j dostáváme (užitím důsledku Laplaceovy věty) cii = 1 |A| · (ai1 · Ai1 + ai2 · Ai2 + · · · + ain · Ain) = 1 |A| · |A| = 1. – pro i = j dostáváme (opět užitím důsledku Laplaceovy věty) cii = 1 |A| · (ai1 · Aj1 + ai2 · Aj2 + · · · + ain · Ajn) = 1 |A| · 0 = 0. uvědomme si, že výraz v závorce je roven nule, protože podle důsledku Laplaceovy věty se jedná o determinant matice, v níž i-tý a j-tý řádek jsou stejné (oba dva zmiňované řádky sestávají z prvků ai1, ai2, · · · ain ). Dostáváme tedy, že A·X = En . Analogickým způsobem se dokáže, že také X ·A = En , což znamená, že matice X je hledaná inverzní maticíe k matici A. Důsledek. Nechť A je regulární matice. Pak A−1 = 1 |A| · A∗ . Důkaz. Tvrzení plyne ihned z 2. části důkazu předchozí věty. Poznámka. Pokud ověřujeme, zda matice X je inverzní maticí k matici A, pak stačí ověřovat pouze 42 jednu z obou podmínek uvedených v definici inverzní matice k matici A, tj. jednu z rovností A · X = En ∧ X · A = En , protože druhá rovnost je v tomto případě již vynucena. Je – li například A · X = En, pak je matice A regulární a existuje matice A−1 . Po vynásobení výchozího vztahu zleva maticí A−1 a zprava maticí A dostáváme A−1 · (A · X) · A = A−1 · En · A , odkud po úpravě vychází X · A = En . Některé jednoduché základní vlastnosti inverzních matic k regulárním maticím nám popisují následující dvě věty. Věta 3.9. Nechť A, B jsou regulární matice řádu n. Pak platí : 1. (A−1 )−1 = A 2. (A · B)−1 = B−1 · A−1 3. |A−1 | = 1 |A| 4. (A )−1 = (A−1 ) . Důkaz. 1. a 2. plynou z věty 3.8., z faktu, že (Matnn(T), ·) je pologrupa s jedničkou a ze známých vlastností pologrup. 3: Zřejmě A · A−1 = En, odkud podle Cauchyovy věty je |A| · |A−1 | = |En| = 1 , tzn. |A−1 | = 1 |A| . 4: Podle věty 3.6. je (A−1 ) · A = (A · A−1 ) = En = En a analogicky též A · (A−1 ) = En , tzn. podle (3) je (A−1 ) inverzní maticí k matici A , neboli platí 4. Věta 3.10. Množina všech regulárních matic řádu n (nad T) s operací násobení matic je grupa, která je pro n ≥ 2 nekomutativní. Důkaz. Označme množinu všech regulárních matic řádu n nad T symbolem (Regnn(T), ·). Podle důsledku Cauchyovy věty je (Regnn(T), ·) grupoidem, podle věty 3.3. je pologrupou a zřejmě En ∈ Regnn(T) je zde jedničkou. Podle věty 3.8. ke každému prvku (tj. matici) z Regnn(T) existuje prvek (matice) inverzní, a tedy (Regnn(T), ·) je grupou. Dále nechť n ≥ 2. Vezměme matice A, B řádu n tvaru: 43 A =          1 1 0 · · · 0 0 0 1 0 · · · 0 0 0 0 1 · · · 0 0 ... ... ... ... ... ... 0 0 0 · · · 1 0 0 0 0 · · · 0 1          , B =          0 0 · · · 0 0 1 0 0 · · · 0 1 0 0 0 · · · 1 0 0 ... ... ... ... ... ... 0 1 · · · 0 0 0 1 0 · · · 0 0 0          . Potom zřejmě A, B jsou regulární, tj. A, B ∈ Regnn(T) a platí A · B = B · A (ověřte si sami výpočtem – počítejte přitom prvek v prvním řádku a (n − 1) - ním sloupci obou součinů matic). Tedy uvažovaná grupa není komutativní. Poznamenejme, že výše uvedená multiplikativní grupa regulárních matic řádu n (n ≥ 2) je dalším poměrně jednoduchým příkladem nekomutativní grupy. 44 §4. Hodnost matice V tomto paragrafu bude A = (aij) značit matici typu m/n nad číselným tělesem T, tzn.: A =      a11 a12 · · · a1n a21 a22 · · · a2n ... ... ... ... am1 am2 · · · amn      kde aij ∈ T . Jak již bylo dříve řečeno, řádky matice A můžeme chápat jako vektory z vektorového prostoru Tn . Potom vektory – řádky matice A generují v Tn jistý podprostor U a my se v dalším budeme zajímat o jeho dimenzi. Podobně, sloupce matice A lze chápat též jako vektory – tentokrát z vektorového prostoru Tm , přičemž tyto vektory – sloupce matice A generují v Tm jistý podprostor H. Je zřejmé, že Tn a Tm jsou obecně dva různé vektorové prostory a totéž platí i o podprostorech U a H. Přesto však ukážeme, že dimenze obou těchto podprostorů musí být stejné, tzn. dim U = dim H. Definice. Nechť A je matice typu m/n nad T. Pak dimenze podprostoru vektorového prostoru Tn , který je generován řádky matice A, se nazývá hodnost matice A a označuje se symbolem h(A). Věta 4.1. Hodnost matice je rovna maximálnímu počtu jejích lineárně nezávislých řádků. Důkaz. Tvrzení plyne ihned z definice hodnosti matice, definice dimenze vektorového prostoru a z definice báze vektorového prostoru. Poznámka. Z předchozího je zřejmé, že hodnost matice A je rovna nule, právě když A je nulovou maticí. Je-li matice A nenulová, pak její hodnost je rovna některému přirozenému číslu. Další možnost vyjádření hodnosti matice nám ukáže následující věta. Poznamenejme k ní ještě to, že pojem minoru řádu k matice A lze zřejmě stejným způsobem jako v §2 definovat i pro libovolnou (obecně obdélníkovou) matici A typu m/n za předpokladu, že k ≤ min{m, n}. Je-li však m = n, nelze pak již samozřejmě hovořit o doplňku tohoto minoru. Věta 4.2. Nechť A je nenulová matice typu m/n. Pak hodnost matice A je rovna maximálnímu z řádů nenulových minorů matice A. Důkaz. Nechť A = (aij) je nenulová matice typu m/n. Pak zřejmě existuje minor |M| řádu k > 0 45 tak, že |M| = 0 a všechny minory řádu většího než k (pokud vůbec existují) jsou rovny nule. Bez újmy na obecnosti lze předpokládat, že submatice M je určena prvními k řádky a prvními k sloupci matice A. Chceme nyní dokázat, že h(A) = k. Ale platí: α) Prvních k řádků matice A je lineárně nezávislých. V opačném případě by byly i řádky submatice M lineárně závislé, tzn. podle věty 3.1. kapitoly I. a věty 2.4. by byl |M| = 0, což je spor. β) r-tý řádek (k < r ≤ m) matice A je lineární kombinací prvních k řádků. Nechť tedy k < r ≤ m a nechť 1 ≤ j ≤ n libovolné. Utvořme matici: Dj =      a11 · · · a1k a1j ... ... ... ... ak1 · · · akk akj ar1 · · · ark arj      tak, že matici M "ovroubíme" odpovídajícími prvky r-tého řádku a j-tého sloupce matice A. Determinant |Dj| je zřejmě roven nule, neboť pro j > k je |Dj| minorem řádu k + 1, resp. pro j ≤ k obsahuje matice Dj dva stejné sloupce. Rozviňme nyní |Dj| podle posledního sloupce. Dostáváme: 0 = |Dj| = a1j · L1 + a2j · L2 + · · · + akj · Lk + arj · |M|, kde Li (i = 1, . . . , k) jsou algebraické doplňky prvků posledního sloupce (uvědomme si, že Li nezávisí na j). Poněvadž |M| = 0, můžeme psát: arj = − L1 |M| · a1j − · · · − Lk |M| · akj pro každé j = 1, 2, . . . , n, což však znamená, že r-tý řádek je lineární kombinací prvních k řádků. Z α) a β) plyne, že maximální počet lineárně nezávislých řádků matice A je roven číslu k, a tedy podle věty 4.1. je h(A) = k. Důsledek. Transponováním matice se její hodnost nezmění, tj. h(A) = h(A ). Důkaz. Je-li A nulová matice, pak A je též nulová matice a tvrzení platí. Nechť tedy A je nenulová matice a nechť h(A) = k. Pak podle předchozí věty existuje v A nenulový minor řádu k a všechny minory řádu většího než k jsou rovny nule. Uvažme nyní transponovanou matici A . Vzhledem k tomu, že transponováním se nemění hodnoty minorů (plyne z věty 2.1.), existuje tedy i v matici A nenulový minor řádu k a všechny minory řádu většího než k v A jsou rovny nule. To ale znamená (opět podle předchozí věty), že h(A ) = k, a tedy h(A) = h(A ). Věta 4.3. Hodnost matice je rovna maximálnímu počtu jejích lineárně nezávislých sloupců. Důkaz. Podle předchozího důsledku a podle věty 4.1. je hodnost matice A rovna maximálnímu počtu lineárně nezávislých řádků transponované matice A , tj. maximálnímu počtu lineárně nezávislých sloupců původní matice A. 46 Z předchozích tvrzení již vyplývá to, o čem jsme hovořili na začátku paragrafu, a sice je-li matice A matice typu m/n, pak dimenze podprostoru (v Tn ) generovaného řádky matice A je rovna dimenzi podprostoru (v Tm ) generovaného sloupci matice A. V dalším si nejprve všimneme případu, kdy matice A je čtvercová a uvedeme charakterizaci regulární matice pomocí její hodnosti, resp. pomocí lineární nezávislosti jejích řádků nebo sloupců. Věta 4.4. Nechť A je čtvercová matice řádu n. Pak následující výroky jsou ekvivalentní: 1. matice A je regulární, 2. h(A) = n, 3. řádky matice A jsou lineárně nezávislé, 4. sloupce matice A jsou lineárně nezávislé. Důkaz. "1 ⇒ 2": Nechť A je regulární, tzn. |A| = 0. Pak z věty 4.2. plyne, že h(A) = n. "2 ⇒ 3": Plyne z věty 4.1. "3 ⇒ 4": Plyne z vět 4.1. a 4.3. "4 ⇒ 1": Plyne z vět 4.3. a 4.2. Předchozí věta nám samozřejmě zároveň podává i odpovídající charakterizaci singulární matice. Provedením obměn všech implikací totiž dostáváme, že ekvivalentní jsou též výroky: 1. matice A je singulární, 2. h(A) < n, 3. řádky matice A jsou lineárně závislé, 4. sloupce matice A jsou lineárně závislé. Nyní se vrátíme ještě k obdélníkovým maticím a ukážeme si, co je možno říci o hodnosti součinu dvou matic. Věta 4.5. Nechť A je matice typu m/n. Pak platí: 1. je-li B matice typu n/p, pak: h(A · B) ≤ h(A) a h(A · B) ≤ h(B), 2. je-li R regulární matice řádu n, resp. S je regulární matice řádu m, pak: h(A · R) = h(A) a h(S · A) = h(A). Důkaz. 1: Nechť A = (aij), B = (bij). Označme A · B = (cij) a dále označme: D =    a11 · · · a1n c11 · · · c1p ... ... ... ... ... ... am1 · · · amn cm1 · · · cmp   . 47 Matici D můžeme chápat jakožto matici A, k níž bylo (vpravo) přidáno jistých p sloupců. Z definice součinu matic ale plyne, že : cij = n k=1 aik · bkj = b1j · ai1 + b2j · ai2 + · · · + bnj · ain pro pevné j a pro každé i = 1, . . . , m. Jinak zapsáno to znamená, že pro každé j = 1, . . . , p platí:    c1j ... cmj    = b1j ·    a11 ... am1    + b2j ·    a12 ... am2    + · · · + bnj ·    a1n ... amn    . Vidíme tedy, že každý přidaný sloupec je vždy lineární kombinací prvních n sloupců, odkud vyplývá, že h(D) = h(A) . Matici D však můžeme také chápat jakožto matici A · B, k níž jsme (zleva) přidali jistých n sloupců. Přidáním sloupců k nějaké matici se však hodnost buď nezmění nebo zvětší. Poto tedy platí h(A · B) ≤ h(D) . Dohromady tak dostáváme, že h(A · B) ≤ h(A) . Analogickým způsobem (tj. přidáním všech řádků matice A · B k řádkům matice B) se dokáže, že h(A · B) ≤ h(B) (rozmyslete si podrobně sami !). 2: Podle právě dokázané části 1 je h(A · R) ≤ h(A). Dokážeme, že platí také opačná nerovnost. Podle předpokladu je matice R regulární, tzn. existuje k ní inverzní matice R−1 a lze psát: A = (A · R) · R−1 . Nyní však opět podle již dokázané části 1 je h(A) = h((A · R) · R−1 ) ≤ h(A · R) . Dohromady pak dostáváme, že h(A · R) = h(A) . Druhá část tvrzení 2 se dokáže analogicky (proveďte si podrobně sami). Na závěr tohoto paragrafu si odvodíme jednu jednoduchou praktickou metodu výpočtu hodnosti matice. K tomu však bude potřeba nejprve zavést následující pojem. Definice. Nechť A je matice typu m/n nad tělesem T. Pak každá z následujících úprav matice A se nazývá elementární řádková úprava matice A: 1. libovolná záměna pořadí řádků, 2. vynásobení libovolného řádku nenulovým číslem z T, 3. k jednomu řádku přičtení jiného řádku vynásobeného libovolným číslem z T. Poznámka. Řekli jsme si, že řádky matice A budeme chápat jako vektory z vektorového prostoru Tn . V tomto smyslu pak elementární řádkové úpravy matice A chápeme jako výše popsané 48 manipulace s vektory z Tn . Řádky matice A generují ve vektorovém prostoru Tn jistý podprostor U. Důležité je (jak ukáže následující věta), že provedení libovolné elementární řádkové úpravy neovlivní tento podprostor U. Věta 4.6. Nechť A je matice typu m/n nad T a nechť matice B vznikne z matice A provedením elementární řádkové úpravy. Pak podprostor (ve vektorovém prostoru Tn ) generovaný řádky matice A je roven podprostoru generovanému řádky matice B. Důkaz. Řádky matice A (chápané jako vektory ve vektorovém prostoru Tn ) označme u1, . . . , um. Podle věty 2.3. 2., kap. I., je podprostor generovaný řádky matice A roven množině všech lineárních kombinací těchto řádků, tzn.: [u1, . . . , um] = L(u1, . . . , um). Podprostor L(u1, . . . , um) se nezmění, jestliže: α) zaměníme libovolně pořadí řádků matice A, což je zřejmé. β) vynásobíme i-tý řádek matice A nenulovým číslem t ∈ T. Zřejmě je u1, . . . , ui, . . . , um ∈ L(u1, . . . , t · ui, . . . , um) (rozmyslete si, jak se přitom využije fakt, že t = 0 ), a tedy podle věty 1.4., kap. I. je L(u1, . . . , ui, . . . , um) ⊆ L(u1, . . . , t · ui, . . . , um). Podobně je u1, . . . , t · ui, . . . , um ∈ L(u1, . . . , ui, . . . , um) , a tedy opět podle věty 1.4., kap. I. je L(u1, . . . , t · ui, . . . , um) ⊆ L(u1, . . . , ui, . . . , um). Dohromady pak dostáváme požadovanou rovnost: L(u1, . . . , ui, . . . , um) = L(u1, . . . , t · ui, . . . , um). γ) přičteme k i-tému řádku matice A t-násobek j-tého řádku (i = j). Platí, že u1, . . . , ui, . . . , um ∈ L(u1, . . . , ui +t·uj, . . . , um) (rozmyslete si podrobně proč tomu tak je a zejména si uvědomte, jakým způsobem se vektor ui napíše jako lineární kombinace vektorů u1, . . . , ui + t · uj, . . . , um ). Potom podle věty 1.4., kapitoly I. dostáváme, že L(u1, . . . , ui, . . . , um) ⊆ L(u1, . . . , ui + t · uj, . . . , um) . Podobně je u1, . . . , ui + t · uj, . . . , um ∈ L(u1, . . . , ui, . . . , um) , a tedy podle věty 1.4., kapitoly I. dostáváme, že L(u1, . . . , ui + t · uj, . . . , um) ⊆ L(u1, . . . , ui, . . . , um) . Dohromady potom platí rovnost: L(u1, . . . , ui, . . . , um) = L(u1, . . . , ui + t · uj, . . . , um). Ukázali jsme tedy, že podprostor [u1, . . . , um] v Tn se nezmění provedením libovolné elementární řádkové úpravy matice A. Důsledek. Provedení libovolné elementární řádkové úpravy matice A nezmění hodnost matice A. Důkaz. Tvrzení plyne bezprostředně z definice hodnosti matice a z předchozí věty. 49 Z předchozích úvah vyplývá, že při praktickém zjišťování hodnosti dané matice A bude zřejmě výhodné pomocí elementárních řádkových úprav (které nemění hodnost) převést matici A na nějaký "jednoduchý tvar", z něhož již hodnost okamžitě určíme. Tento "jednoduchý tvar" popisuje následující definice. Definice. Nechť A je matice typu m/n. Řekneme, že A je matice ve schodovitém tvaru, jestliže v matici A každý nenulový řádek začíná větším počtem nul než předchozí řádek. Poznámka. Rozebereme-li si podrobněji předchozí definici, pak vidíme, že: 1. Libovolná matice typu 1/n, tj. matice sestávající pouze z jednoho řádku, je vždy ve schodovitém tvaru. 2. Je-li matice A ve schodovitém tvaru, pak případné nulové řádky musí být v matici A umístěny "dole". Speciálně, nulová matice 0mn je zřejmě zvláštním případem matice ve schodovitém tvaru. 3. Je-li nenulová matice A ve schodovitém tvaru, pak svým tvarem skutečně odpovídá tomuto názvu, neboť nuly v matici A tvoří jakési "schody". Přitom první řádek může, ale nemusí začínat nulou (resp. nulami), druhý řádek však již musí začínat alespoň jednou nulou, třetí řádek musí začínat alespoň dvěma nulami, atd. Schématicky znázorněna vypadá nenulová matice A ve schodovitém tvaru takto: A =           0 · · 0 a1j1 · · · · · · · · · · · · · · · · · · · · a1n 0 · · · · · · · 0 a2j2 · · · · · · · · · · · · · · · a2n · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 0 · · · · · · · · · · · · 0 akjk · · · · · · · · · · akn 0 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 0 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 0 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 0           , kde 1 ≤ j1 < j2 < · · · < jk ≤ n, resp. 1 ≤ k ≤ min{m, n}, resp. aiji = 0 pro i = 1, 2, . . . , k. Věta 4.7. Každou matici lze konečným počtem elementárních řádkových úprav převést na schodovitý tvar. Důkaz. Nechť A = (aij) je matice typu m/n. Je-li A nulová matice, pak je již ve schodovitém tvaru a jsme hotovi. Nechť tedy A je nenulová matice. Důkaz nyní provedeme matematickou indukcí vzhledem k m (tj. vzhledem k počtu řádků matice A). α) Pro m = 1 je matice A již ve schodovitém tvaru a tvrzení platí. β) Předpokládejme, že každou matici o 1, 2, . . . , m řádcích lze konečným počtem elementárních řádkových úprav převést na schodovitý tvar. Nechť nyní A je matice o (m + 1) řádcích. Nechť s-tý sloupec je prvním nenulovým sloupcem matice A. Pak případnou výměnou dvou řádků dostaneme z matice A matici B = (bij), která má v 1. řádku a s-tém sloupci nenulový prvek b1s = 0. Nyní k i-tému řádku matice B přičteme −bis b1s násobek prvního řádku, postupně pro i = 2, . . . , m + 1. Dostaneme tak matici C = (cij), která má v prvních s sloupcích samé nuly s výjimkou prvku c1s = 0. Aplikujeme-li nyní 50 na matici sestávající z posledních m řádků matice C indukční předpoklad, dostáváme tvrzení věty (rozmyslete si podrobně proč!). Věta 4.8. Hodnost matice ve schodovitém tvaru je rovna počtu jejích nenulových řádků. Důkaz. Nechť A je matice typu m/n ve schodovitém tvaru. Je-li A nulová matice, pak h(A) = 0 a tvrzení platí. Nechť tedy A je nenulová matice ve schodovitém tvaru, která obsahuje k nenulových řádků. Těchto k řádků musí být lineárně nezávislých (plyne rozepsáním přímo z definice matice ve schodovitém tvaru) a všechny ostatní řádky (pokud existují) jsou nulové. To znamená, že maximální počet lineárně nezávislých řádků matice A je roven k, a tedy podle věty 4.1. je h(A) = k. Pomocí posledních dvou vět a důsledku věty 4.6. můžeme nyní poměrně jednoduše zjišťovat hodnost dané matice A. Matici A nejprve převedeme pomocí elementárních řádkových úprav na schodovitý tvar (algoritmus je popsán v důkazu věty 4.7., který byl konstruktivní), v němž pak jen spočítáme počet nenulových řádků. Celý postup si ukážeme na následujícím příkladu. Příklad 4.1. Určete hodnost matice A (nad tělesem R) tvaru: A =     0 1 1 0 1 1 1 2 0 0 −1 −2 −1 1 3 0 0 −4 2 1 −3 0 −1 2    . Řešení: Nejprve záměnou 1. a 2. řádku dosáhneme toho, že v levém horním rohu matice bude nenulový prvek. Potom vynásobením 1. řádku vhodným číslem (zde reálným) a jeho přičtením k 2., 3., resp. 4. řádku dosáhneme toho, že pod tímto nenulovým prvkem v 1. sloupci budou samé nuly. Analogickým způsobem pak upravujeme submatici sestávající z 2., 3. a 4. řádku, atd., až nakonec dostaneme matici ve schodovitém tvaru. Poznamenejme, že po úpravě budeme mezi jednotlivými maticemi psát symbol →. Z úsporných důvodů provádíme obvykle vždy několik elementárních řádkových úprav typu 3 najednou. Tedy : A →     1 2 0 0 −1 −2 0 1 1 0 1 1 −1 1 3 0 0 −4 2 1 −3 0 −1 2     →     1 2 0 0 −1 −2 0 1 1 0 1 1 0 3 3 0 −1 −6 0 −3 −3 0 1 6     → →     1 2 0 0 −1 −2 0 1 1 0 1 1 0 0 0 0 −4 −9 0 0 0 0 4 9     →     1 2 0 0 −1 −2 0 1 1 0 1 1 0 0 0 0 −4 −9 0 0 0 0 0 0     . Vidíme, že poslední matice je ve schodovitém tvaru a má 3 nenulové řádky. Je tedy h(A) = 3. 51 §5. Další vlastnosti a užití matic V tomto paragrafu si nejprve ukážeme možnosti užití výpočtu hodnosti matice při řešení úloh o vektorových prostorech Tn a následně odvodíme další metodu výpočtu inverzní matice k dané matici. Na závěr se budeme zabývat užitím maticového aparátu při studiu vztahů mezi dvěma bázemi téhož vektorového prostoru. Metodu výpočtu hodnosti matice pomocí elementárních řádkových úprav můžeme s výhodou použít při řešení celé řady úloh o vektorovém prostoru Tn . Chceme-li například v Tn zjistit dimenzi a bázi nějakého podprostoru U, generovaného konečným počtem zadaných vektorů, pak tyto vektory napíšeme jako řádky do matice, kterou elementárními řádkovými úpravami převedeme na schodovitý tvar. Nenulové řádky takto získané matice ve schodovitém tvaru jsou pak bází podprostoru U (jak plyne z vět 4.6. a 4.8.). Podobným způsobem lze postupovat například při zjišťování dimenze a báze součtu dvou podprostorů v Tn , jak ukazuje následující příklad. Příklad 5.1. Ve vektorovém prostoru R5 jsou dány podprostory U1 = [a1, a2, a3] a U2 = [b1, b2, b3], kde a1 = (1, −1, 2, 4, 0), a2 = (0, 0, 1, 3, 2), a3 = (1, −1, 1, 1, −2) , resp. b1 = (0, 1, 0, 2, −2), b2 = (−1, 2, 1, 3, −2), b3 = (−1, 0, 1, −1, 2) . Určete dimenzi a bázi podprostoru U1 + U2 . Řešení: Vektory a1, a2, a3, b1, b2, b3 generují podprostor U1 + U2 , tzn. U1 + U2 = [a1, a2, a3, b1, b2, b3] (rozepište si podrobně sami, že tomu tak skutečně je !). Stačí tedy napsat uvedených šest vektorů do řádků matice a tuto matici převést elementárními řádkovými úpravami na schodovitý tvar.         1 −1 2 4 0 0 0 1 3 2 1 −1 1 1 −2 0 1 0 2 −2 −1 2 1 3 −2 −1 0 1 −1 2         →         1 −1 2 4 0 0 1 0 2 −2 0 0 1 3 2 0 0 −1 −3 −2 0 1 3 7 −2 0 −1 3 3 2         →         1 −1 2 4 0 0 1 0 2 −2 0 0 1 3 2 0 0 −1 −3 −2 0 0 3 5 0 0 0 3 5 0         → →         1 −1 2 4 0 0 1 0 2 −2 0 0 1 3 2 0 0 0 0 0 0 0 0 −4 −6 0 0 0 −4 −6         →         1 −1 2 4 0 0 1 0 2 −2 0 0 1 3 2 0 0 0 4 6 0 0 0 0 0 0 0 0 0 0         . Tedy dim(W1 + W2) = 4, přičemž bázi W1 + W2 tvoří například nenulové řádky poslední matice, tj. vektory u1 = (1, −1, 2, 4, 0), u2 = (0, 1, 0, 2, −2), u3 = (0, 0, 1, 3, 2), u4 = (0, 0, 0, 4, 6) . 52 Jednou z dalších základních úloh lineární algebry je hledání inverzní matice k dané čtvercové regulární matici A řádu n. Z důsledku věty 3.8. víme, že: A−1 = 1 |A| · A∗ , kde A∗ je adjungovaná matice k matici A, a podle tohoto vzorce můžeme též inverzní matici A−1 přímo spočítat. Je však vidět, že pro větší n bude výpočet příliš pracný (je třeba vypočítat jeden determinant matice řádu n a dále n2 determinantů matic řádu n − 1). Proto si nyní odvodíme jednu poměrně jednoduchou a pro ruční výpočet celkem vhodnou metodu nalezení inverzní matice k dané matici A . Věta 5.1. Nechť A je regulární matice řádu n nad T. Pak platí: 1. matici A lze konečným počtem elementárních řádkových úprav převést na jednotkovou matici En 2. provedení jedné řádkové elementární úpravy matice A je ekvivalentní vynásobení matice A zleva jistou regulární maticí řádu n. Důkaz. 1: Podle předpokladu je h(A) = n, a tedy (podle vět 4.7. a 4.8.) matici A lze konečným počtem elementárních řádkových úprav převést na tvar, v němž v hlavní diagonále jsou nenulové prvky a pod ní jsou samé nuly. Vynásobením jednotlivých řádků vhodnými nenulovými čísly z T dostaneme v hlavní diagonále samé jedničky a pak konečným počtem elementárních řádkových úprav typu 3 nad diagonálou samé nuly. Tedy dostaneme jednotkovou matici En. 2: Rozepsáním se bezprostředně ověří, že: α) Záměna dvou řádků (i-tého a j-tého) matice A je ekvivalentní vynásobení matice A zleva maticí F, kde F je matice vzniklá z jednotkové matice En (řádu n) záměnou i-tého a j-tého řádku. Zřejmě ale |F| = −1, tzn. matice F je regulární. β) Vynásobení i-tého řádku matice A nenulovým číslem t ∈ T je ekvivalentní vynásobení matice A zleva maticí G, kde G je matice vzniklá z jednotkové matice En vynásobením i-tého řádku číslem t. Ale |G| = t = 0, tzn. matice G je regulární. γ) Přičtení t-násobku j-tého řádku k i-tému řádku matice A (kde i = j a t ∈ T libovolný) je ekvivalentní vynásobení matice A zleva maticí H, kde H je matice vzniklá z jednotkové matice En přičtením t-násobku j-tého řádku k i-tému řádku. Podle věty 2.5. 1. však |H| = 1, tzn. H je regulární matice. Z předchozí věty už nyní bezprostředně vyplývá metoda výpočtu inverzní matice k matici A. Spočívá v tom, že elementárními řádkovými úpravami převedeme matici A na jednotkovou matici En a tytéž elementární řádkové úpravy současně aplikujeme na jednotkovou matici En, která nám nakonec přejde v hledanou inverzní matici A−1 , neboť podle předchozí věty existují regulární matice R1, . . . , Rs takové, že: (Rs · · · · · R2 · R1) · A = En, což znamená, že (Rs · · · · · R2 · R1) = A−1 . Současně však tytéž úpravy aplikujeme na jednotkovou matici En a dostaneme : (Rs · · · · · R2 · R1) · En = (Rs · · · · · R2 · R1) = A−1 . 53 Prakticky provádíme výpočet tak, že obě matice, tj. A a En, napíšeme vedle sebe a oddělíme svislou čarou. Pak provádíme zvolené elementární řádkové úpravy, a to současně pro obě matice najednou. Výsledné matice budeme přitom oddělovat šipkou. Příklad 5.2. K dané regulární matici A (nad tělesem R) nalezněte inverzní matici A−1 . Přitom: A =   1 1 1 1 3 2 1 1 0  . Řešení:   1 1 1 1 0 0 1 3 2 0 1 0 1 1 0 0 0 1   →   1 1 1 1 0 0 0 2 1 −1 1 0 0 0 −1 −1 0 1   →   1 1 1 1 0 0 0 1 1 2 −1 2 1 2 0 0 0 1 1 0 −1   → →   1 1 0 0 0 1 0 1 0 −1 1 2 1 2 0 0 1 1 0 −1   →   1 0 0 1 −1 2 1 2 0 1 0 −1 1 2 1 2 0 0 1 1 0 −1  . Hledanou inverzní maticí je tedy matice: A−1 =   1 −1 2 1 2 −1 1 2 1 2 1 0 −1  . V našich předchozích úvahách o vektorových prostorech jsme doposud vystačili vždy s jednou pevnou bází daného vektorového prostoru, vzhledem k níž jsme vyjadřovali například souřadnice vektoru, atd. Nyní budeme vyšetřovat vzájemný vztah mezi dvěma bázemi daného vektorového prostoru, resp. vztah mezi souřadnicemi téhož vektoru v různých bázích daného prostoru. Definice. Nechť V je vektorový prostor nad T a nechť u1, . . . , un a v1, . . . , vn jsou dvě báze prostoru V . Nechť dále je: v1 = a11 · u1 + a21 · u2 + · · · + an1 · un v2 = a12 · u1 + a22 · u2 + · · · + an2 · un ... vn = a1n · u1 + a2n · u2 + · · · + ann · un (1) Pak matice A =      a11 a12 · · · a1n a21 a22 · · · a2n ... ... ... ... an1 an2 · · · ann      se nazývá matice přechodu od báze u1, . . . , un k bázi v1, . . . , vn . 54 Poznámka. 1. Rozebereme-li si předchozí definici, pak vidíme, že matici A přechodu od jedné báze ke druhé bázi prostoru V zkonstruujeme tak, že j-tý vektor druhé báze vyjádříme jako lineární kombinaci vektorů první báze a její koeficienty pak zapíšeme do j-tého sloupce matice A (pro j = 1, 2, . . . , n). Přitom je samozřejmé, že jak pořadí obou bází, tak i pořadí vektorů v těchto bázích je podstatné a nelze je žádným způsobem zaměňovat. 2. Matice přechodu od jedné báze k druhé bázi vektorového prostoru V musí být vždy regulární, což plyne z rovnic (1) a z lineární nezávislosti vektorů druhé báze (proveďte si sami podrobné rozepsání). Příklad 5.3. Ve vektorovém prostoru R3 mějme dány dvě báze: u1 = (1, 1, 1), u2 = (1, 1, 0), u3 = (1, 0, 0), v1 = (2, 3, 2), v2 = (3, 1, 2), v3 = (4, 3, 3). Technickým rozepsáním se ověří, že platí: v1 = 2 · u1 + u2 − u3 v2 = 2 · u1 − u2 + 2 · u3 v3 = 3 · u1 + u3 resp. u1 = v1 + v2 − v3 u2 = −4 · v1 − 5 · v2 + 6 · v3 u3 = −3 · v1 − 3 · v2 + 4 · v3 odkud již plyne, že matice A přechodu od báze u1, . . . , un k bázi v1, . . . , vn , resp. matice B přechodu od báze v1, . . . , vn k bázi u1, . . . , un mají tvar: A =   2 2 3 1 −1 0 −1 2 1   resp. B =   1 −4 −3 1 −5 −3 −1 6 4  . Vidíme tedy, že především je A = B, ale na druhé straně se výpočtem lehce zjistí, že A · B = E3, což znamená, že B = A−1 . Tedy, zaměněním pořadí bází u1, . . . , un a v1, . . . , vn jsme v tomto případě dostali matici přechodu, která je k původní matici přechodu inverzní. Následující věta ukáže, že tomu tak musí být vždycky. Věta 5.2. Nechť u1, . . . , un a v1, . . . , vn jsou dvě báze vektorového prostoru V . Nechť matice A je maticí přechodu od báze u1, . . . , un k bázi v1, . . . , vn . Potom maticí přechodu od báze v1, . . . , vn k bázi u1, . . . , un je matice A−1 . Důkaz. Nechť A = (aij). Pak podle definice matice přechodu od báze u1, . . . , un k bázi v1, . . . , vn je: vj = n k=1 akj · uk pro každé j = 1, . . . , n . Nechť dále B = (bij) je matice přechodu od báze v1, . . . , vn k bázi u1, . . . , un. Pak je: uk = n i=1 bik · vi pro každé k = 1, . . . , n. 55 Po dosazení dostáváme: vj = n k=1 akj · n i=1 bik · vi = n i=1 n k=1 bik · akj · vi pro každé j = 1, . . . , n . Podle věty 4.1., kap. I., se každý vektor z V dá napsat pouze jediným způsobem jako lineární kombinace vektorů dané báze. Zřejmě však lze také psát : vj = 0 · v1 + · · · + 0 · vj−1 + 1 · vj + 0 · vj+1 + · · · + 0 · vn, pro každé j = 1, . . . , n. Porovnáním posledních dvou rovností pak dostáváme: n k=1 bik · akj = 0 pro i = j 1 pro i = j což maticově vyjádřeno říká, že B · A = En , odkud již plyne, že B = A−1 . Poznámka. Z definice matice přechodu plyne, že zadáním dvou bází prostoru V je jednoznačně určena matice přechodu od první báze ke druhé bázi, tj. jistá regulární matice A. Podobně však, máme-li dánu bázi u1, . . . , un a nějakou regulární matici A, pak je těmito dvěma údaji (pomocí vztahů (1)) jednoznačně určena báze v1, . . . , vn taková, že matice A je maticí přechodu od báze u1, . . . , un k bázi v1, . . . , vn. Stejně tak, zadáním báze v1, . . . , vn a regulární matice A je jednoznačně určena báze u1, . . . , un taková, že A je maticí přechodu od báze u1, . . . , un k bázi v1, . . . , vn. Bázi u1, . . . , un můžeme v tomto případě zkonstruovat např. užitím věty 5.2. (tzn. ze vztahů (1), pomocí báze v1, . . . , vn a matice A−1 ). Zcela na závěr nyní ještě odvodíme, jaký je vzájemný vztah mezi souřadnicemi jednoho vektoru ve dvou různých bázích prostoru V . Je samozřejmé, že při změně báze se změní i souřadnice vektoru vzhledem k bázi. Poněvadž mnohdy pro jednoduchost výpočtů je vhodná speciální volba báze, je důležité znát pravidla, podle nichž se mění souřadnice vektoru při změně báze. Touto otázkou, nazývanou transformace souřadnic vektoru, se nyní budeme zabývat. Nechť tedy u1, . . . , un a v1, . . . , vn jsou dvě báze vektorového prostoru V a nechť A = (aij) je matice přechodu od báze u1, . . . , un k bázi v1, . . . , vn. Dále nechť w ∈ V je vektor, přičemž w má v bázi u1, . . . , un, resp. v bázi v1, . . . , vn, souřadnice:    x1 ... xn   , resp.    y1 ... yn   . To ale znamená, že platí: w = x1 · u1 + · · · + xn · un (2) w = y1 · v1 + · · · + yn · vn (3) 56 Dosadíme-li do (3) vztahy (1), dostáváme: w = n j=1 yj · vj = n j=1 yj · n k=1 akj · uk = n k=1 n j=1 akj · yj · uk. (4) Nyní však porovnáním pravých stran (2) a (4) dostáváme: x1 · u1 + · · · + xn · un = (a11y1 + · · · + a1nyn) · u1 + · · · + (an1y1 + · · · + annyn) · un, odkud z jednoznačnosti obou vyjádření plyne rovnost odpovídajících si koeficientů, tj.: x1 = a11y1 + · · · + a1nyn x2 = a21y1 + · · · + a2nyn ... xn = an1y1 + · · · + annyn což však můžeme zapsat v maticovém tvaru:    x1 ... xn    = A ·    y1 ... yn   . Tímto způsobem jsme tedy dostali souřadnice vektoru w v bázi u1, . . . , un vyjádřené pomocí souřadnic téhož vektoru v bázi v1, . . . , vn. Kdybychom chtěli naopak vyjádřit souřadnice vektoru w v bázi v1, . . . , vn pomocí jeho souřadnic v bázi u1, . . . , un, pak stačí obě strany poslední maticové rovnice vynásobit zleva maticí A−1 (která existuje, neboť matice A je regulární). Dostaneme pak:    y1 ... yn    = A−1 ·    x1 ... xn   . 57 Kapitola 3 Soustavy lineárních rovnic §1. Gaussova metoda řešení soustav lineárních rovnic Se soustavami lineárních rovnic a jejich řešením je možné se v určitých jednoduchých, resp. speciálních případech setkat již na střední škole. V tomto paragrafu ukážeme jednu z mnoha známých metod praktického řešení obecných soustav lineárních rovnic. Výklad je veden tak, že je možno tento paragraf studovat nezávisle na jeho zařazení do III. kapitoly (z předchozí látky se používá pouze pojem matice, matice ve schodovitém tvaru, elementární řádková úprava matice a některé jednoduché vlastnosti vektorového prostoru Tn ) a je pak možno jej použít při řešení konkrétních příkladů vztahujících se k problematice probírané dříve. Definice. Nechť T je číselné těleso. Pak soustava rovnic: a11x1 + a12x2 + · · · + a1nxn = b1 a21x1 + a22x2 + · · · + a2nxn = b2 ... ak1x1 + ak2x2 + · · · + aknxn = bk (1) kde aij ∈ T, bi ∈ T, se nazývá soustava k lineárních rovnic o n neznámých (nad T). Řešení soustavy (1) je každá uspořádaná n-tice (t1, . . . , tn) prvků z T taková, že po dosazení ti za xi (i = 1, . . . , n) všechny rovnice v (1) přejdou v identity, tj. platí: a11t1 + a12t2 + · · · + a1ntn = b1 a21t1 + a22t2 + · · · + a2ntn = b2 ... ak1t1 + ak2t2 + · · · + akntn = bk Poznámka. 1. Pro lepší vyjadřování zaveďme ještě následující označení a názvy: číslo aij v soustavě (1) budeme nazývat koeficient (v i-té rovnici u j-té neznámě), resp. číslo bi budeme nazývat absolutní člen (i-té rovnice). Dále, matice: A =      a11 a12 · · · a1n a21 a22 · · · a2n ... ... ... ... ak1 ak2 · · · akn      , resp. A =      a11 a12 · · · a1n b1 a21 a22 · · · a2n b2 ... ... ... ... ... ak1 ak2 · · · akn bk      se nazývá matice soustavy (1), resp. rozšířená matice soustavy (1). Abychom opticky odlišili absolutní členy od koeficientů soustavy (1), budeme obvykle v rozšířené matici soustavy A psát před sloupcem absolutních členů svislou čáru. 2. Každé řešení soustavy (1) je, jak bylo v definici řečeno, uspořádaná n-tice prvků z tělesa T, tzn. může být považováno za vektor z vektorového prostoru Tn . Množinu všech řešení 58 soustavy (1) lze pak chápat jako jistou podmnožinu prostoru Tn (která může být případně i prázdná, nemá-li soustava (1) žádné řešení). 3. Označíme-li: X =    x1 ... xn    , resp. B =    b1 ... bk   , pak můžeme zřejmě soustavu (1) zapsat stručněji maticovou rovnicí: A · X = B. Tento maticový způsob zápisu soustav lineárních rovnic nám pak v dalším často umožní přehledné a stručné vyjadřování. Definice. Soustava lineárních rovnic se nazývá řešitelná soustava (resp. neřešitelná soustava), jestliže existuje alespoň jedno její řešení (resp. neexistuje žádné její řešení). Dvě soustavy lineárních rovnic o n neznámých (nad týmž tělesem T) se nazývají ekvivalentní soustavy, jestliže množiny jejich řešení si jsou rovny. Jakákoliv úprava dané soustavy lineárních rovnic, po níž vznikne soustava ekvivalentní, se nazývá ekvivalentní úprava dané soustavy lineárních rovnic. Uvědomme si, že "řešit" danou soustavu lineárních rovnic znamená buď najít všechna její řešení, nebo zjistit, že je neřešitelná. Pokud jde o počet řešení soustavy lineárních rovnic, nastane zřejmě vždycky právě jeden z následujících tří případů: 1. soustava nemá žádné řešení (tj. je neřešitelná) 2. soustava má jediné řešení 3. soustava má více než jedno řešení (ukážeme, že nekonečně mnoho). Věta 1.1. Nechť je dána soustava lineárních rovnic (1). Pak následující úpravy jsou ekvivalentními úpravami této soustavy: 1. libovolná záměna pořadí rovnic 2. vynásobení libovolné rovnice nenulovým číslem z T 3. k jedné rovnici přičtení jiné rovnice vynásobené libovolným číslem z T 4. vypuštění rovnice, která je lineární kombinací ostatních rovnic. Důkaz. 1, 2: Zřejmé. 3: Vzhledem k 1. můžeme předpokládat, že k první rovnici soustavy (1) přičteme druhou rovnici vynásobenou číslem p ∈ T. Dostáváme tak soustavu (2) tvaru: a11x1 + · · · + a1nxn + p · (a21x1 + · · · + a2nxn) = b1 + p · b2 a21x1 + · · · + a2nxn = b2 ... ak1x1 + · · · + aknxn = bk (2) Nyní, je-li uspořádaná n–tice (t1, . . . , tn) řešením soustavy (1), pak zřejmě je (t1, . . . , tn) také řešením soustavy (2). 59 Naopak, nechť (t1, . . . , tn) je řešením soustavy (2). Pak po dosazení do první rovnice soustavy (2) dostáváme: a11t1 + · · · + a1ntn + p · (a21t1 + · · · + a2ntn) = b1 + p · b2 . Podle předpokladu však a21t1 + · · · + a2ntn = b2, tzn. po dosazení a odečtení dostáváme: a11t1 + · · · + a1ntn = b1, odkud již ihned plyne, že (t1, . . . , tn) je řešením soustavy (1) (poněvadž druhá až k-tá rovnice v (2) a v (1) jsou stejné). Dokázali jsme tedy, že soustavy (1) a (2) jsou ekvivalentní. 4: Vzhledem k 1. předpokládejme, že v soustavě (1) je první rovnice lineární kombinací ostatních rovnic, tj. soustava (1) je tvaru: p2 · (a21x1 + · · · + a2nxn) + · · · + pk · (ak1x1 + · · · + aknxn) = p2 · b2 + · · · + pk · bk a21x1 + · · · + a2nxn = b2 ... ak1x1 + · · · + aknxn = bk (3) kde p2, . . . , pk ∈ T. Uvažme dále soustavu (4), která vznikne ze soustavy (3) vypuštěním první rovnice, tj.: a21x1 + · · · + a2nxn = b2 ... ak1x1 + · · · + aknxn = bk (4) Nyní je však bezprostředně vidět, že (t1, . . . , tn) je řešením (3), právě když (t1, . . . , tn) je řešením (4), neboli že soustavy (3) a (4) jsou ekvivalentní. Při provádění ekvivalentních úprav dané soustavy lineárních rovnic není nutné stále opisovat celou soustavu i s neznámými, ale zřejmě stačí pracovat s její rozšířenou maticí soustavy. Uvědomme si, že pak provádění úprav 1. – 4. na dané soustavě rovnic je ekvivalentní provádění elementárních řádkových úprav na její rozšířené matici soustavy doplněnému o vypouštění řádků matice, které jsou lineárními kombinacemi ostatních řádků. Na této úvaze je pak založena metoda řešení soustav lineárních rovnic, kterou nyní popíšeme. Její princip spočívá v tom, že danou soustavu lineárních rovnic převedeme na ekvivalentní, ale "jednodušší" soustavu, jejíž řešení (která jsou zároveň i řešeními původní soustavy) bude možno víceméně ihned vypsat. Gaussova metoda řešení soustavy lineárních rovnic. Nechť je dána soustava lineárních rovnic (1). Pak ekvivalentními úpravami z věty 1.1. převedeme soustavu (1) na soustavu (1’), jejíž rozšířená matice soustavy je ve schodovitém tvaru, přičemž vždy vypustíme každou rovnici, která je lineární kombinací ostatních rovnic (z předchozí úvahy a z věty 4.7., kap. II., plyne, že toho lze po konečném počtu kroků vždy dosáhnout). Nechť soustava (1’) má s rovnic. Potom: 1. Vyskytne-li se v (1’) rovnice, v níž všechny koeficienty jsou nulové a absolutní člen je různý od nuly, pak zřejmě soustava (1’), a tedy i soustava (1) je neřešitelná. V opačném případě je soustava (1) řešitelná, a sice: 60 2. Má jediné řešení, je-li s = n. Toto řešení lehce spočítáme postupným dosazováním ze soustavy (1’). 3. Má nekonečně mnoho řešení, je-li s < n. V tomto případě (opět postupným dosazováním z (1’)) vyjádříme jistých s neznámých pomocí zbývajících (n − s) neznámých (které budeme též nazývat volné neznámé). Dosazujeme-li za volné neznámé libovolně čísla z T (kterých je nekonečně mnoho), dostáváme pak jednotlivá konkrétní řešení soustavy (1) (kterých je tedy také nekonečně mnoho). Ilustrujme si nyní Gaussovu metodu řešení soustavy lineárních rovnic na několika typických příkladech. Příklad 1.1. Řešte soustavu lineárních rovnic (nad R): x1 + 2x2 − x3 + x4 = 1 −2x1 − 3x2 + 2x3 − 3x4 = 2 x1 + x2 − x3 + 2x4 = −1 x2 + 2x4 = 3 Řešení: Napíšeme rozšířenou matici této soustavy a pomocí elementárních řádkových úprav ji převedeme na schodovitý tvar. Navíc vypouštíme řádky, které jsou lineární kombinací ostatních řádků (pokud se takové vyskytnou).     1 2 −1 1 1 −2 −3 2 −3 2 1 1 −1 2 −1 0 1 0 2 3     →     1 2 −1 1 1 0 1 0 −1 4 0 −1 0 1 −2 0 1 0 2 3     →     1 2 −1 1 1 0 1 0 −1 4 0 0 0 0 2 0 0 0 3 −1     . I když poslední matice ještě není formálně upravena na schodovitý tvar, vidíme, že daná soustava je neřešitelná, neboť ve třetím řádku této matice, tj. ve třetí rovnici poslední soustavy, jsou všechny koeficienty u neznámých nulové a absolutní člen je od nuly různý. Příklad 1.2. Řešte soustavu lineárních rovnic (nad R): x1 − 2x2 + x3 = −1 x1 + x3 = 1 2x1 − 5x2 + 4x3 = 0 2x1 − 3x2 = −4 Řešení:     1 −2 1 −1 1 0 1 1 2 −5 4 0 2 −3 0 −4     →     1 −2 1 −1 0 2 0 2 0 −1 2 2 0 1 −2 −2     →   1 −2 1 −1 0 1 0 1 0 0 2 3   . Z poslední rovnice dostáváme: 2x3 = 3, neboli x3 = 3 2 . Dále z předposlední rovnice přímo plyne: x2 = 1 a konečně z první rovnice dostáváme: x1 = −1 + 2x2 − x3, tj. po dosazení za x2 a x3 je pak: x1 = −1 2 . Daná soustava má tedy jediné řešení −1 2 , 1 , 3 2 . 61 Příklad 1.3. Řešte soustavu lineárních rovnic (nad R): x1 − 2x2 + x3 + x4 = 2 x1 − 2x2 − x3 + x4 = −2 x1 − 2x2 + 3x3 + x4 = 6 Řešení:   1 −2 1 1 2 1 −2 −1 1 −2 1 −2 3 1 6   →   1 −2 1 1 2 0 0 −2 0 −4 0 0 2 0 4   → 1 −2 1 1 2 0 0 1 0 2 . Dostáváme soustavu rovnic, v níž budou dvě volné neznámé (zřejmě kterékoliv dvě z neznámých x1, x2, x4, nikoliv však neznámá x3). Zvolíme-li za volné neznámé např. neznámé x2, x4, pak lehce vypočteme : x3 = 2 , x1 = 2x2 − x4 . Tedy (položíme-li x2 = t , x4 = s) daná soustava má nekonečně mnoho řešení tvaru (2t − s , t , 2 , s), kde t, s jsou libovolná reálná čísla. Výsledek můžeme podle potřeby též zapsat v množinovém tvaru, tzn. můžeme říci, že daná soustava lineárních rovnic má množinu řešení {(2t − s, t, 2, s) | t, s ∈ R libovolná } . Poznámka. Jestliže má soustava lineárních rovnic nekonečně mnoho řešení, pak z Gaussovy metody vyplývá pouze to, kolik neznámých volíme za volné neznámé, nikoliv však, které neznámé to jsou. Může se totiž stát, že některou neznámou nesmíme volit za volnou neznámou (např. neznámou x3 v příkladu 1.3.) nebo naopak, některou neznámou musíme volit za volnou neznámou. Například v soustavě dvou lineárních rovnic o čtyřech neznámých tvaru: x1 + 2x3 + x4 = 1 x3 − x4 = 0 musíme zřejmě za jednu ze dvou volných neznámých zvolit neznámou x2 . 62 §2. Základní vlastnosti soustav lineárních rovnic Mějme dánu soustavu k lineárních rovnic o n neznámých nad T, tj. soustavu: a11x1 + a12x2 + · · · + a1nxn = b1 a21x1 + a22x2 + · · · + a2nxn = b2 ... ak1x1 + ak2x2 + · · · + aknxn = bk (1) kde A, resp. A bude značit matici této soustavy, resp. rozšířenou matici této soustavy. Zajímáme-li se o hodnost matic A a A, pak ihned vidíme, že zřejmě mohou dva případy: buď je h(A) = h(A), nebo je h(A) = h(A) + 1. Přitom h(A) = h(A) nastane právě tehdy, když sloupec absolutních členů je lineární kombinací sloupců matice A (proč ?). Nyní si uvedeme důležitou větu, která nám umožní rozhodnout o řešitelnosti či neřešitelnosti soustavy lineárních rovnic, aniž bychom hledali její řešení. Věta 2.1. (Frobeniova věta, resp. Kronecker-Capelliho věta) Soustava lineárních rovnic (nad T) je řešitelná, právě když hodnost matice této soustavy je rovna hodnosti rozšířené matice této soustavy. Důkaz. Uvažujme soustavu (1), kde A, resp. A značí matici soustavy (1), resp. rozšířenou matici soustavy (1). "⇒": Nechť (1) je řešitelná soustava a nechť (t1, . . . , tn) je řešení (1). Pak platí: a11t1 + a12t2 + · · · + a1ntn = b1 a21t1 + a22t2 + · · · + a2ntn = b2 ... ak1t1 + ak2t2 + · · · + akntn = bk neboli:      b1 b2 ... bk      = t1 ·      a11 a21 ... ak1      + t2 ·      a12 a22 ... ak2      + · · · + tn ·      a1n a2n ... akn      , což znamená, že sloupec absolutních členů je lineární kombinací sloupců matice A, a tedy h(A) = h(A). "⇐": Nechť h(A) = h(A). Potom (jak bylo řečeno v úvodu tohoto paragrafu) sloupec absolutních členů musí být lineární kombinací sloupců matice A. Označíme-li koeficienty v této lineární kombinaci t1, . . . , tn, pak stejným obratem jako v 1. části důkazu dostaneme, že (t1, . . . , tn) je řešením soustavy (1). Tedy soustava (1) je řešitelná. Frobeniova věta je jednoduchým kriteriem řešitelnosti soustav lineárních rovnic, ovšem v případě řešitelné soustavy neříká nic o počtu řešení ani o tom, jak všechna řešení vypadají. Takové úvahy budou nyní obsahem zbytku tohoto paragrafu. Nejprve vyšetříme speciální případ soustavy (1), kdy k = n (tzn. rovnic je tolik jako neznámých) a navíc matice soustavy je regulární. 63 Věta 2.2. (Cramerovo pravidlo) Nechť je dána soustava n lineárních rovnic o n neznámých, jejíž matice soustavy A je regulární. Pak soustava má jediné řešení (x1, . . . , xn), přičemž platí : xj = |Aj| |A | pro j = 1, 2, . . . , n , kde Aj je matice vzniklá z matice A nahrazením j-tého sloupce sloupcem absolutních členů. Důkaz. Uvažme soustavu (1), v níž k = n, a kterou tedy můžeme maticově zapsat ve tvaru: A · X = B, kde X =    x1 ... xn    , B =    b1 ... bn    . (2) Matice A je však podle předpokladu regulární, tzn. existuje inverzní matice A−1 . Potom vynásobením rovnosti (2) zleva maticí A−1 dostaneme A−1 · (A · X) = A−1 · B, odkud: X = A−1 · B , (3) což je tedy řešení dané soustavy, které (jak plyne z provedeného odvození) je jediné. Pokusme se nyní nalezené řešení explicitně vyjádřit. Podle důsledku věty 3.8., kap. II., je: A−1 = 1 |A | ·        A11 A21 · · · An1 ... ... ... ... A1j A2j · · · Anj ... ... ... ... A1n A2n · · · Ann        , kde Aij je algebraický doplněk prvku aij v matici A. Dosazením do (3) dostáváme :        x1 ... xj ... xn        = 1 |A | ·        A11 A21 · · · An1 ... ... ... ... A1j A2j · · · Anj ... ... ... ... A1n A2n · · · Ann        ·        b1 ... bj ... bn        Vyjádříme-li z této maticové rovnice neznámou xj, pak rozepsáním a užitím důsledku Laplaceovy věty dostáváme : xj = 1 |A | ·(A1j ·b1 +A2j ·b2 +· · ·+Anj ·bn) = 1 |A | · a11 · · · a1,j−1 b1 a1,j+1 · · · a1n ... ... ... ... ... ... ... ... ... ... ... ... ... ... an1 · · · an,j−1 bn an,j+1 · · · ann . Tedy skutečně je : xj = |Aj| |A | pro každé j = 1, . . . , n . Nyní vyřešíme obecný případ, tzn. popíšeme řešení obecné soustavy k lineárních rovnic o n neznámých, o níž víme, že je řešitelná. 64 Věta 2.3. (Obecné Cramerovo pravidlo) Nechť (1) je řešitelná soustava lineárních rovnic a nechť h(A) = r. Dále : – vybereme z matice A r lineárně nezávislých řádků a dále uvažujeme pouze ty rovnice, jejichž koeficienty se nacházejí ve vybraných řádcích. – ponecháme na levé straně takových r neznámých, že matice sestavená z koeficientů u těchto neznámých je regulární. Ostatní neznámé (pokud existují) převedeme na pravé strany a nazveme je volné neznámé. Potom, zvolíme-li za volné neznámé libovolně pevné prvky z T a vypočítáme-li Cramerovým pravidlem zbývající neznámé, dostaneme tímto způsobem právě všechna řešení soustavy (1). Důkaz. Podle předpokladu je h(A) = h(A) = r. Vzhledem k větě 1.1. 1. můžeme bez újmy na obecnosti předpokládat, že prvních r řádků matice A je lineárně nezávislých a ostatní řádky jsou lineární kombinací prvních r řádků. Potom podle věty 1.1. 4. je soustava (1) ekvivalentní soustavě lineárních rovnic: a11x1 + · · · + a1nxn = b1 ... ar1x1 + · · · + arnxn = br (4) Nyní mohou nastat dva případy: I. Je-li r = n, pak |A| = 0 a podle věty 2.2. existuje jediné řešení soustavy (4), a tedy i soustavy (1), které spočteme Cramerovým pravidlem, tzn. tvrzení platí. II. Nechť r < n a nechť pro přehlednost zápisu je nenulový minor řádu r matice soustavy (4) tvořen prvními r sloupci. Převedením zbývajících neznámých na pravé strany a dosazením xj = cj, kde cj ∈ T, j = r + 1, . . . , n dostáváme: a11x1 + · · · + a1rxr = b1 − a1,r+1cr+1 − · · · − a1ncn ... ar1x1 + · · · + arrxr = br − ar,r+1cr+1 − · · · − arncn (5) Na soustavu (5) můžeme nyní použít Cramerovo pravidlo, čímž dostaneme jediné řešení (c1, . . . , cr) soustavy (5). Potom však je uspořádaná n-tice (c1, . . . , cr, cr+1, . . . , cn) zřejmě řešením soustavy (4), a tedy i řešením soustavy (1). Naopak musíme ukázat, že každé řešení soustavy (1) lze obdržet popsaným způsobem. Nechť tedy (c1, . . . , cn) je libovolné řešení soustavy (1). Pak (c1, . . . , cn) je řešením soustavy (4). Dosadíme-li cj za xj pro j = r + 1, . . . , n, pak (c1, . . . , cr) je řešením soustavy (5), a musí tedy být rovno tomu jedinému řešení, které dostaneme použitím Cramerova pravidla. Tedy řešení (c1, . . . , cn) jsme dostali postupem uvedeným ve větě. Důsledek. Nechť je dána soustava lineárních rovnic (1). Potom: 1. soustava (1) má jediné řešení právě když h(A) = h(A) = n, 2. soustava (1) má nekonečně mnoho řešení právě když h(A) = h(A) < n. 65 Důkaz. Obě tvrzení plynou přímo z Frobeniovy věty a z důkazu obecného Cramerova pravidla, podle něhož má soustava (1) jediné řešení, právě když neexistuje žádná volná neznámá, tzn. právě když h(A) = n. Poznámka. Poznamenejme, že řešení soustav lineárních rovnic pomocí Cramerova pravidla, resp. obecného Cramerova pravidla má spíše teoretický význam, protože je numericky poměrně náročné (např. rozhodně náročnější než Gaussova metoda popsaná v §1). Na druhé straně nám ale Cramerovo pravidlo umožňuje přímý výpočet jednotlivých neznámých, což může být někdy výhodné. 66 §3. Homogenní soustavy lineárních rovnic Definice. Soustava lineárních rovnic a11x1 + a12x2 + · · · + a1nxn = 0 ... ak1x1 + ak2x2 + · · · + aknxn = 0 (1) kde aij ∈ T, se nazývá homogenní soustava k lineárních rovnic o n neznámých nad T. Poznámka. Matici soustavy (1), resp. rozšířenou matici soustavy (1) budeme opět značit A, resp. A. Protože matice A vznikla z matice A přidáním sloupce skládajícího se ze samých nul, je zřejmě h(A) = h(A), a tedy (podle Frobeniovy věty) homogenní soustava (1) je vždy řešitelná. Uspořádaná n-tice (0, 0, . . . , 0) je zřejmě vždy řešením soustavy (1). Toto řešení se nazývá nulové řešení. Vidíme tedy, že homogenní soustava má buď jediné řešení (a sice nulové), anebo má nekonečně mnoho řešení (tj. kromě nulového i nenulová řešení). Kriterium pro oba případy udává následující věta. Věta 3.1. Nechť je dána homogenní soustava (1) s maticí soustavy A. Potom: 1. soustava (1) má pouze nulové řešení ⇐⇒ h(A) = n 2. soustava (1) má též nenulová řešení ⇐⇒ h(A) < n . Důkaz. Tvrzení plyne přímo z důsledku věty 2.3., neboť v (1) je h(A) = h(A). Jak již bylo dříve řečeno, každé řešení soustavy lineárních rovnic o n neznámých nad T je možno považovat za vektor z vektorového prostoru Tn . Množina U všech řešení této soustavy je pak podmnožinou v Tn , která v případě nehomogenní soustavy zřejmě není nikdy podprostorem v Tn (neboť zcela jistě neobsahuje nulový vektor). V případě homogenních soustav je však situace jiná, jak ukazuje následující věta. Věta 3.2. Množina U všech řešení homogenní soustavy (1) je podprostorem ve vektorovém prostoru Tn a platí : dim U = n − h(A) . Důkaz. I. Dokážeme, že U je podprostor v Tn . Zřejmě je (0, 0, . . . , 0) ∈ U, tzn. U = ∅. Dále, nechť (c1, . . . , cn), (d1, . . . , dn) ∈ U, t, s ∈ T libovolné, tzn. je: n j=1 aijcj = 0, n j=1 aijdj = 0 pro každé i = 1, . . . , k. Potom je : n j=1 aij(t · cj + s · dj) = t · n j=1 aijcj + s · n j=1 aijdj = t · 0 + s · 0 = 0 67 pro každé i = 1, . . . , k. To však znamená, že t · (c1, . . . , cn) + s · (d1, . . . , dn) ∈ U, a tedy U je podprostor v Tn . II. Dokážeme, že dim U = n − h(A) . Označme h(A) = r . Zřejmě musí být 0 ≤ r ≤ n. Je-li r = 0, pak U = Tn , resp. je-li r = n, pak U = {(0, 0, . . . , 0)}, a v obou případech platí, že dim U = n − r = n − h(A) . Předpokládejme tedy, že 1 ≤ r ≤ n − 1. Protože h(A) = r, lze v matici A soustavy (1) najít nenulový minor řádu r. Bez újmy na obecnosti můžeme předpokládat, že: a11 a12 · · · a1r a21 a22 · · · a2r ... ... ... ... ar1 ar2 · · · arr = 0. Podle obecného Cramerova pravidla je pak U rovno množině všech řešení soustavy: a11x1 + a12x2 + · · · + a1rxr + a1,r+1xr+1 + · · · + a1nxn = 0 ... ar1x1 + ar2x2 + · · · + arrxr + ar,r+1xr+1 + · · · + arnxn = 0 (2) v níž volnými neznámými jsou neznámé xr+1, . . . , xn . Označme u1, . . . , un−r následující řešení soustavy (2), a tedy i soustavy (1): u1 = (c11, . . . , c1r, 1, 0, 0, . . . , 0, 0) u2 = (c21, . . . , c2r, 0, 1, 0, . . . , 0, 0) ... un−r = (cn−r,1 , . . . , cn−r,r , 0, 0, 0, . . . , 0, 1) . Tedy u1, . . . , un−r ∈ U a ukážeme, že tyto vektory tvoří bázi podprostoru U . α) Vektory u1, . . . , un−r jsou zřejmě lineárně nezávislé (rozmyslete si podrobně proč). β) Dokážeme, že vektory u1, . . . , un−r generují U , tzn., že L(u1, . . . , un−r) = U . Inkluze "⊆" je zřejmá a stačí tedy dokázat inkluzi opačnou. Nechť v = (v1, . . . , vn) ∈ U , tzn. v je řešením soustavy (1). Uvažme vektor y = vr+1 · u1 + · · · + vn · un−r . Zřejmě je y ∈ U a platí y = (y1, . . . , yr, vr+1, . . . , vn), kde y1, . . . , yr jsou nějaká čísla z T. Vidíme, že vektory v a y mají posledních (n − r) složek shodných a oba jsou z U, tzn. oba jsou řešeními (2). Pak ovšem podle obecného Cramerova pravidla musí být y1 = v1 , . . . , yr = vr , odkud plyne, že v = y . Vektor v je tedy lineární kombinací vektorů u1, . . . , un−r , což jsme měli dokázat. Dohromady dostáváme, že dim U = n − r = n − h(A) . Poznámka. 1. Na základě předchozí věty jsme u homogenní soustavy oprávněni hovořit o podprostoru všech řešení místo o množině všech řešení. Dále je dobré si uvědomit, že číslo n − h(A) udává počet volných neznámých, a tedy dimenze podprostoru řešení dané homogenní soustavy je rovna počtu volných neznámých v této soustavě. 68 2. Při praktickém hledání báze podprostoru řešení U je nejvýhodnější postupovat tak, že si nejprve obecně vyjádříme řešení dané homogenní soustavy, potom (n − h(A)) volných neznámých zvolíme (n − h(A)) lineárně nezávislými způsoby a spočítáme vektory báze U. Je zřejmé, že bází U je nekonečně mnoho, přičemž početně nejjednodušší volbou bude volba provedená v důkazu předchozí věty (tj. volba vždy jedné jedničky a ostatních nul). Příklad 3.1. Nalezněte dvě báze podprostoru řešení U homogenní soustavy (nad R) : x1 + x2 + x3 − x4 = 0 x3 + x4 = 0 Řešení: Soustavu zřejmě není nutné upravovat, volné neznámé budou dvě, například x2 a x4, přičemž pak je x3 = −x4, x1 = −x2 + 2x4. Řešení soustavy jsou tedy tvaru (−t + 2s, t, −s, s) pro libovolná t, s ∈ R . 1. volíme-li například t = 1, s = 0 , resp. t = 0, s = 1 , dostáváme bázi podprostoru řešení U tvaru (−1, 1, 0, 0) , (2, 0, −1, 1) . 2. podobně, volíme-li například t = 1, s = 1 , resp. t = −1, s = √ 2 (uvědomme si, že se jedná o dvě lineárně nezávislé volby!), dostáváme bázi podprostoru řešení U tvaru (1, 1, −1, 1) , (1 + 2 √ 2 , −1, − √ 2 , √ 2 ) . Předchozí věta v podstatě říká, že homogenní soustavou lineárních rovnic o n neznámých je určen jistý podprostor vektorového prostoru Tn . Toto tvrzení lze však také obrátit, jak ukazuje následující věta. Věta 3.3. Nechť U je libovolný podprostor vektorového prostoru Tn . Pak existuje homogenní soustava lineárních rovnic (o n neznámých, nad T), jejíž množina řešení je rovna U. Důkaz. Je-li U = {(0, . . . , 0)}, resp. U = Tn , pak věta zřejmě platí (hledanou soustavou je pak např. soustava s maticí soustavy En, resp. 0nn). Nechť tedy {(0, . . . , 0)} U Tn a nechť vektory: u1 = (u11, u12, . . . , u1n) , . . . , uk = (uk1, uk2, . . . , ukn) jsou bází podprostoru U. Utvořme nejprve homogenní soustavu lineárních rovnic u11x1 + u12x2 + · · · + u1nxn = 0 ... uk1x1 + uk2x2 + · · · + uknxn = 0 . (3) Hodnost matice soustavy (3) je rovna k, neboť její řádky jsou lineárně nezávislé. Označme písmenem W podprostor řešení soustavy (3). Podle věty 3.2. je dim W = n − k (> 0). Nechť: w1 = (w11, w12, . . . , w1n) , . . . , wn−k = (wn−k,1 , wn−k,2 , . . . , wn−k,n) 69 je pevná báze podprostoru W. Utvořme další homogenní soustavu lineárních rovnic w11x1 + w12x2 + · · · + w1nxn = 0 ... wn−k,1x1 + wn−k,2x2 + · · · + wn−k,nxn = 0 . (4) o níž dokážeme, že je hledanou soustavou, tzn. označíme-li podprostor řešení soustavy (4) jako H, musíme dokázat, že U = H . α) Nejprve dokážeme množinovou inkluzi U ⊆ H . Platí, že vektor u1 je řešením soustavy (4), protože po jeho dosazení do (4), úpravě a využití toho, že vektory w1 , . . . , wn−k splňují první rovnici ze (3) dostáváme : w11u11 + · · · + w1nu1n = u11w11 + · · · + u1nw1n = 0 ... ... wn−k,1u11 + · · · + wn−k,nu1n = u11wn−k,1 + · · · + u1nwn−k,n = 0 . Tedy u1 ∈ H . Analogickým způsobem se dokáže, že také u2, . . . , uk ∈ H . To však znamená, že L(u1, . . . , uk) ⊆ H , neboli U ⊆ H . β) Dále, hodnost matice soustavy (4) je zřejmě n − k, tzn. podle věty 3.2. je pak dim H = n − (n − k) = k = dim U . Dokázali jsme tedy, že U ⊆ H ∧ dim U = dim H, odkud již podle věty 4.4. 2., kap. I., dostáváme, že U = H . Poznámka. Je třeba si uvědomit, že homogenní soustava, jejíž existenci předchozí věta zaručuje, není zřejmě určena jednoznačně. Dále připomeňme, že obratů uvedených v důkazu předchozí věty se používá při řešení konkrétních příkladů, a je proto nutné algoritmus popsaný v důkazu věty znát. Příklad 3.2. Nalezněte soustavu homogenních lineárních rovnic (nad R), jejíž množina řešení je rovna podprostoru U vektorového prostoru R4 , kde U je generován vektory: u1 = (1, 2, 1, 1), u2 = (0, 1, −1, 1), u3 = (1, 3, 0, 2) . Řešení: Nejprve si napíšeme soustavu (3) (přitom není nutné z generátorů podprostoru U předem vybírat bázi U, neboť eventuelní nadbytečné rovnice v (3) během výpočtu stejně vypadnou), pak najdeme bázi jejího podprostoru řešení W a nakonec pak složky vektorů báze W budou vystupovat jako koeficienty v hledané soustavě (4). Nejprve tedy řešíme soustavu lineárních rovnic: x1 + 2x2 + x3 + x4 = 0 x2 − x3 + x4 = 0 x1 + 3x2 + 2x4 = 0 ⇒   1 2 1 1 0 0 1 −1 1 0 1 3 0 2 0   → · · · → 1 2 1 1 0 0 1 −1 1 0 , 70 odkud dostáváme x2 = x3 − x4 , x1 = −3x3 + x4 , tzn. báze podprostoru řešení této soustavy je například u1 = (−3, 1, 1, 0) , u2 = (1, −1, 0, 1) . Hledaná soustava lineárních rovnic je pak například: −3x1 + x2 + x3 = 0 x1 − x2 + x4 = 0 Na závěr celé kapitoly se vrátíme ještě k obecným soustavám lineárních rovnic (nad T) a budeme se snažit říci něco více o množině řešení takové soustavy. Hlavní význam následujících úvah a tvrzení se však ukáže a využije později v geometrii. Definice. Nechť je dána soustava lineárních rovnic nad T: a11x1 + a12x2 + · · · + a1nxn = b1 ... ak1x1 + ak2x2 + · · · + aknxn = bk (5) Pak homogenní soustava lineárních rovnic s týmiž koeficienty u neznámých, tj.: a11x1 + a12x2 + · · · + a1nxn = 0 ... ak1x1 + ak2x2 + · · · + aknxn = 0 (6) se nazývá zhomogenizovaná soustava k soustavě (5). Věta 3.4. Nechť je dána soustava lineárních rovnic (5). Pak platí: 1. součet libovolného řešení soustavy (5) s libovolným řešením k ní zhomogenizované soustavy je řešením soustavy (5), 2. rozdíl libovolných dvou řešení soustavy (5) je řešením k ní zhomogenizované soustavy. Důkaz. 1: Nechť u = (u1, . . . , un) je řešení soustavy (5) a nechť v = (v1, . . . , vn) je řešení k ní zhomogenizované soustavy (6), tzn. platí: n j=1 aijuj = bi a n j=1 aijvj = 0 pro i = 1, . . . , k. Pak u + v = (u1 + v1, . . . , un + vn) a platí: n j=1 aij(uj + vj) = n j=1 aijuj + n j=1 aijvj = bi + 0 = bi pro i = 1, . . . , k, a tedy u + v je řešením soustavy (5). 2: Nechť u = (u1, . . . , un), resp. v = (v1, . . . , vn) jsou dvě řešení soustavy (5), tzn. platí: n j=1 aijuj = bi a n j=1 aijvj = bi pro i = 1, . . . , k. 71 Pak u − v = (u1 − v1, . . . , un − vn) a platí: n j=1 aij(uj − vj) = n j=1 aijuj − n j=1 aijvj = bi − bi = 0 pro i = 1, . . . , k, a tedy u − v je řešením zhomogenizované soustavy (6). Věta 3.5. Nechť (5) je řešitelná soustava lineárních rovnic. Pak všechna řešení soustavy (5) obdržíme přičtením všech řešení zhomogenizované soustavy (6) k jednomu pevnému řešení soustavy (5). Důkaz. Označme M množinu všech řešení soustavy (5). Podle předpokladu je M = ∅. Nechť u0 ∈ M je pevné řešení soustavy (5). Označme dále: M = {u0 + v | v je řešení (6)}. Dokážeme, že M = M. "⊆": Nechť u ∈ M je libovolné řešení soustavy (5). Podle věty 3.4. 2. je u − u0 řešením zhomogenizované soustavy (6). Ale pak je: u = u0 + (u − u0) ∈ M. "⊇": Plyne ihned z věty 3.4. 1.. 72 Kapitola 4 Euklidovské vektorové prostory §1. Skalární součin, velikost a odchylka vektorů Při našich dosavadních úvahách o vektorových prostorech jsme pomocí operací sčítání vektorů a násobení čísla s vektorem vyšetřovali pojmy jako byla lineární závislost a nezávislost vektorů, generování, souřadnice vektoru, atd. Prozatím jsme však neměli možnost ve vektorových prostorech "měřit", tzn. zjišťovat a porovnávat délky vektorů, resp. odchylky (tj. velikosti úhlů), což jsou pojmy, které hrají podstatnou roli např. v geometrii. Jejich definice jsou založeny na pojmu skalárního součinu, který nyní zavedeme. Omezíme se přitom však pouze na vektorové prostory nad tělesem reálných čísel. Úmluva. Všude v dalším v této kapitole budeme vektorovým prostorem rozumět reálný vektorový prostor, tj. konečnědimenzionální vektorový prostor nad tělesem reálných čísel R. Definice. Nechť V je vektorový prostor (nad R) a nechť každé dvojici vektorů u, v ∈ V je přiřazeno reálné číslo u · v tak, že pro každé u, v, w ∈ V , r ∈ R platí : 1. u · v = v · u, 2. (u + v) · w = (u · w) + (v · w), 3. (r · u) · v = r · (u · v), 4. je-li u = o, pak u · u > 0. Potom reálné číslo u · v se nazývá skalární součin vektorů u, v. Vektorový prostor, v němž je definován skalární součin, se nazývá euklidovský vektorový prostor nebo krátce euklidovský prostor. Poznámka. 1. Z definice plyne, že euklidovský prostor je vlastně uspořádaná dvojice (V, ·) sestávající z vektorového prostoru V a ze skalárního součinu · definovaného ve V . Z důvodů stručnosti však budeme obvykle říkat pouze "euklidovský prostor V " (tzn. zavedeme podobnou úmluvu jako u grup nebo těles, u nichž při označování vynecháváme symboly operací, pokud není nebezpečí nedorozumění). 2. Z kapitoly I. víme, že každý podprostor vektorového prostoru V nad T je sám vektorovým prostorem nad T. Je-li speciálně V euklidovským prostorem, tzn. je to reálný vektorový prostor s definovaným skalárním součinem, pak zřejmě axiomy skalárního součinu budou jistě splněny i v jeho libovolném (vektorovém) podprostoru. To znamená, že každý (vektorový) podprostor euklidovského prostoru V je sám euklidovským prostorem. Budeme jej stručně nazývat podprostor euklidovského prostoru. Předchozí definice nic neříká o tom, zda v libovolném vektorovém prostoru (nad R) lze definovat skalární součin, resp. kolika způsoby. Odpověď na tyto otázky nám dá následující příklad a věta. 73 Příklad 1.1. Nechť V = R2 a nechť u = (u1, u2), v = (v1, v2) ∈ R2 . Pak: 1. Položíme-li u · v = u1v1 + u2v2, jsou zřejmě splněny axiomy skalárního součinu a R2 s tímto skalárním součinem je euklidovským prostorem. 2. Položíme-li u · v = 4u1v1 + 2u1v2 + 2u2v1 + 3u2v2, pak jsou opět splněny axiomy skalárního součinu (ověřte si sami podrobným rozepsáním!), tzn. R2 s tímto skalárním součinem je euklidovským prostorem. Je vidět, že i když se v obou případech jedná o tentýž vektorový prostor R2 , jsou definované skalární součiny různé, a tedy různé jsou pak i pomocí nich získané euklidovské prostory. Příklad 1.2. Nechť V = Rn[x] a nechť f = f(x) , g = g(x) ∈ Rn[x] jsou libovolné vektory, tj. polynomy. Položíme-li f · g = 1 0 f(x) · g(x) dx , pak rozepsáním (s využitím základních vět o integrování, známých z analýzy) se ověří platnost axiomů skalárního součinu. Tedy Rn[x] s tímto skalárním součinem je euklidovský prostor. Věta 1.1. V každém reálném vektorovém prostoru V lze definovat skalární součin. Důkaz. Pro nulový vektorový prostor věta zřejmě platí (stačí položit o · o = 0). Nechť tedy dim V = n > 0 a nechť e1, . . . , en je pevná báze prostoru V . Pak libovolné vektory u, v ∈ V lze (jednoznačně) vyjádřit ve tvaru: u = x1 · e1 + · · · + xn · en resp. v = y1 · e1 + · · · + yn · en . Položíme-li : u · v = x1y1 + · · · + xnyn , pak zřejmě u · v ∈ R a technickým rozepsáním se lehce ověří, že jsou splněny axiomy 1. – 4. z definice skalárního součinu. Shrneme-li naše dosavadní úvahy, můžeme říct, že z každého reálného vektorového prostoru lze utvořit euklidovský prostor, obecně však nikoliv jediným způsobem. Věta 1.2. Nechť V je euklidovský vektorový prostor a nechť u, v, w, ui, vj ∈ V , r, pi, rj ∈ R . Pak platí: 1. u · (v + w) = (u · v) + (u · w) 2. u · (r · v) = r · (u · v) 3. m i=1 pi · ui · n j=1 rj · vj = m i=1 n j=1 pirj · (ui · vj) 4. o · u = u · o = 0 5. u · u = 0 ⇐⇒ u = o . 74 Důkaz. 1 a 2: bezprostředně vyplývá z definice skalárního součinu. 3: dokáže se matematickou indukcí. 4: o · u = (0 · o) · u = 0 · (o · u) = 0. Zbytek tvrzení se dokáže analogicky. 5: "⇒": plyne z axiomu 4 skalárního součinu "⇐": plyne z právě dokázané části 4. Definice. Nechť V je euklidovský prostor, u ∈ V . Pak nezáporné reálné číslo √ u · u se nazývá velikost vektoru u a označuje se symbolem u . Je-li u = 1 , pak říkáme, že vektor u je normovaný. Věta 1.3. (Schwarzova nerovnost) Nechť V je euklidovský prostor, u, v ∈ V libovolné. Pak platí : |u · v| ≤ u · v , (1) tzn. absolutní hodnota skalárního součinu dvou vektorů je menší nebo rovna součinu velikostí těchto vektorů. Důkaz. Je-li v = o, pak |u · o| = 0 = u · o a věta platí. Nechť tedy v = o . Uvažme vektor (u − r · v), kde r ∈ R je libovolné. Pak je : 0 ≤ (u − r · v) · (u − r · v) = u · u − 2r · (u · v) + r2 · (v · v) . Zvolíme-li nyní r = u · v v · v (což lze, neboť v = o , a tedy v · v > 0), dostaneme : 0 ≤ u · u − 2 · (u · v) (v · v) · (u · v) + (u · v)2 (v · v)2 · (v · v) , odkud po úpravě a sečtení posledních dvou členů a následném vynásobení obou stran nerovnosti (kladným !) číslem v · v dostáváme : 0 ≤ (u · u) · (v · v) − (u · v)2 , neboli: (u · v)2 ≤ (u · u) · (v · v), což po odmocnění dává dokazovanou nerovnost (1). Důsledek. Ve Schwarzově nerovnosti (1) nastane rovnost, právě když vektory u, v jsou lineárně závislé. Důkaz. Z důkazu předchozí věty plyne, že v (1) nastane rovnost, právě když 75 v = o ∨ u − r · v = o , tzn. právě když vektory u, v jsou lineárně závislé. Poznámka. Schwarzovu nerovnost (1) často zapisujeme v ekvivalentním tvaru: (u · v)2 ≤ u 2 · v 2 . Poznamenejme ještě, že pro nerovnost (1) se v literatuře používá též pojmenování "Cauchyova nerovnost", resp. "Cauchy-Bunjakovského nerovnost", event. "CauchySchwarzova nerovnost". Věta 1.4. Nechť V je euklidovský prostor, u, v ∈ V , r ∈ R. Pak platí : 1. u ≥ 0 , přičemž u = 0 právě když u = o 2. r · u = | r | · u 3. u + v ≤ u + v 4. je-li u = o , pak 1 u · u je normovaný vektor . Důkaz. 1. a 4. jsou bezprostředními důsledky definice velikosti vektoru. 2: užitím definice velikosti vektoru, úpravou a odmocněním dostáváme : r · u = (r · u) · (r · u) = r2 · (u · u) = | r | · u . 3: Z definice velikosti vektoru, rozepsáním a užitím Schwarzovy nerovnosti dostáváme : u + v 2 = (u + v) · (u + v) = (u · u) + 2 · (u · v) + (v · v) ≤ ≤ (u · u) + 2 · u · v + (v · v) = u 2 + 2 · u · v + v 2 = u + v 2 . Protože však u + v i u + v jsou nezáporná čísla, dostáváme po odmocnění žádané tvrzení. Poznámka. 1. Nerovnost uvedená ve 3. části věty se obvykle nazývá "trojúhelníková nerovnost". 2. Použijeme-li obratu provedeného ve 4. části věty (tzn. nenulový vektor u vynásobíme převrácenou hodnotou jeho velikosti), pak říkáme, že jsme vektor u "normovali". Definice. Nechť u, v jsou nenulové vektory z euklidovského prostoru V . Pak reálné číslo ϕ splňující vztahy: cos ϕ = u · v u · v ∧ 0 ≤ ϕ ≤ π (2) se nazývá odchylka vektorů u, v. 76 Poznámka. Je potřeba si rozmyslet, že uvedená definice odchylky je korektní, tzn. že číslo ϕ splňující podmínky (2) existuje, a to jediné. Ale užitím pravidel pro počítání s absolutními hodnotami a užitím Schwarzovy nerovnosti dostáváme : u · v u · v = |u · v| u · v ≤ 1 , což znamená, že platí : −1 ≤ u · v u · v ≤ 1 . Vidíme tedy (na základě našich znalostí o goniometrických funkcích), že existuje právě jedno reálné číslo ϕ, splňující podmínky (2). Zdůrazněme, že v definici odchylky dvou vektorů je podstatný předpoklad, že oba uvažované vektory jsou nenulové ! Znamená to, že odchylka dvou vektorů není definována pro případ, kdy některý z těchto vektorů je nulovým vektorem. 77 §2. Ortogonálnost Definice. Nechť V je euklidovský prostor a nechť u1, . . . , uk je konečná posloupnost vektorů z V . Řekneme, že posloupnost vektorů u1, . . . , uk je ortogonální nebo stručně, že vektory u1, . . . , uk jsou ortogonální, jestliže pro každé i = j je ui · uj = 0 . Je-li každý z ortogonálních vektorů u1, . . . , uk navíc normovaný, pak říkáme, že vektory u1, . . . , uk jsou ortonormální . Jsou-li ortogonální (resp. ortonormální) vektory navíc bází, prostoru V , nazývají se ortogonální báze (resp. ortonormální báze) prostoru V . Poznámka. Rozebereme si definici ortogonálních vektorů u1, . . . , uk pro nejjednodušší hodnoty k . α ) k = 1 . Posloupnost sestávající z jednoho vektoru je vždy ortogonální (bez ohledu na to, zda např. daný vektor je nulový či nikoliv). Tento fakt plyne ihned z předchozí definice (rozmyslete si podrobně proč) β ) k = 2 . Vektory u1, u2 jsou ortogonální, právě když u1 · u2 = 0. V tomto případě budeme psát u1 ⊥ u2 nebo u2 ⊥ u1 (zřejmě zde nezáleží na pořadí vektorů). Jsou-li dva vektory u1, u2 nenulové, pak tyto vektory jsou ortogonální, právě když jejich odchylka je π 2 (plyne ihned z definice odchylky). Na druhé straně, dva vektory, z nichž alespoň jeden je nulový, jsou vždycky ortogonální, přičemž jejich odchylka samozřejmě není definována. Věta 2.1. Nechť V je euklidovský prostor. Pak pro vektory z V platí: 1. u ⊥ u ⇐⇒ u = o 2. u ⊥ x pro každé x ∈ V ⇐⇒ u = o, 3. u ⊥ wi pro i = 1, . . . , k ⇐⇒ u ⊥ k i=1 ri · wi pro každé ri ∈ R. Důkaz. 1 a 2: obě tvrzení ihned plynou z předchozí definice a z definice skalárního součinu. 3: "⇒": Nechť u ⊥ wi, tzn. u · wi = 0 pro i = 1, . . . , k. Užitím věty 1.4. 3. dostáváme u · k i=1 ri · wi = k i=1 ri · (u · wi) = k i=1 ri · 0 = 0 , a tedy u ⊥ k i=1 ri · wi . "⇐": Zvolíme-li ri = 1 a rj = 0 pro j = i, pak u ⊥ wi, pro i = 1, . . . , k. 78 Následující důležité tvrzení ukazuje, jaká je vzájemná souvislost mezi ortogonálností vektorů a lineární nezávislostí vektorů. Věta 2.2. Nechť u1, . . . , uk ∈ V jsou nenulové ortogonální vektory v euklidovském prostoru V . Potom vektory u1, . . . , uk ∈ V jsou lineárně nezávislé. Důkaz. Předpokládáme, že u1, . . . , uk ∈ V jsou nenulové ortogonální vektory a budeme dokazovat, že jsou lineárně nezávislé. Nechť tedy : t1 · u1 + · · · + tk · uk = o . Provedeme-li (pro libovolné i = 1, . . . , k) skalární součin vektoru ui s oběma stranami této rovnosti, dostaneme : (t1 · u1 + · · · + tk · uk) · ui = o · ui, odkud po úpravě, s využitím ortogonálnosti zadaných vektorů dostáváme : ti · (ui · ui) = 0 . Protože podle předpokladu je ui = o, je potom ui · ui = 0, a musí tedy být ti = 0 (pro každé i = 1, . . . , k). To však znamená, že vektory u1, . . . , uk jsou lineárně nezávislé. Poznámka. Poznamenejme, že předpoklad nenulovosti všech vektorů je v předchozí větě podstatný a bez něj věta neplatí. Jinak řečeno, jsou-li ortogonální vektory z V lineárně závislé, znamená to, že alespoň jeden z nich musí být nulový. Při úvahách o podprostorech euklidovských prostorů je výhodné pracovat s generátory nebo bázemi které sestávají z ortogonálních vektorů, protože skalární součiny ortogonálních vektorů jsou rovny nule a výpočty se technicky zjednoduší. Následující věta ukáže, jak se takové ortogonální vektory sestrojí. Důkaz věty je konstruktivní a jeho algoritmus se nazývá Gram-Schmidtův ortogonalizační proces. Věta 2.3. Nechť u1, . . . , uk ∈ V jsou libovolné vektory z euklidovského prostoru V . Pak existují ve V ortogonální vektory e1, . . . , ek, které generují tentýž podprostor jako vektory u1, . . . , uk , tzn. platí L(u1, . . . , uk) = L(e1, . . . , ek). Důkaz. Důkaz provedeme matematickou indukcí vzhledem ke k. α) nechť k = 1. Položme e1 = u1 . Pak vektor e1 je ortogonální (protože, jak víme, každá posloupnost sestávající z jednoho vektoru je vždy ortogonální) a zřejmě platí, že L(u1) = L(e1) . β) Předpokládejme, že tvrzení věty platí pro 1, 2, . . . , k − 1 (k ≥ 2). Dokážeme nyní tvrzení věty pro k. Nechť tedy u1, . . . , uk jsou libovolné vektory z V . Vezměme z nich vektory u1, . . . , uk−1 . Podle indukčního předpokladu existují ortogonální vektory e1, . . . , ek−1 tak, že : L(u1, . . . , uk−1) = L(e1, . . . , ek−1). (1) 79 Nyní zkonstruujeme vektor ek . Položíme : ek = p1 · e1 + · · · + pk−1 · ek−1 + uk, (2) kde pi ∈ R, a určíme koeficienty pi tak, aby platilo ek · e1 = 0 ∧ ek · e2 = 0 ∧ . . . ∧ ek · ek−1 = 0 . To provedeme tak, že rovnici (2) postupně skalárně vynásobíme vektory e1, . . . , ek−1. Po provedení skalárního součinu vektoru ei (pro i = 1, 2, . . . , k−1) s oběma stranami rovnice (2) dostaneme : ek · ei = 0 = pi · (ei · ei) + (uk · ei) (využili jsme přitom předpoklad, že vektory e1, . . . , ek−1 jsou ortogonální), odkud již lehce vypočítáme koeficienty pi : pi =    − uk · ei ei · ei je-li ei = o libovoln je-li ei = o Dosazením takto získaných hodnot p1, . . . , pk−1 do rovnice (2) dostaneme vektor ek. Vektory e1, . . . , ek jsou tedy nyní ortogonální. Zbývá už jen dokázat množinovou rovnost L(u1, . . . , uk) = L(e1, . . . , ek) . "⊆" : stačí dokázat, že u1, . . . , uk ∈ L(e1, . . . , ek). Ale z (1) plyne: u1, . . . , uk−1 ∈ L(u1, . . . , uk−1) = L(e1, . . . , ek−1) ⊆ L(e1, . . . , ek) a ze (2) plyne: uk = − p1 · e1 − . . . − pk−1 · ek−1 + ek ∈ L(e1, . . . , ek). "⊇" : stačí dokázat, že e1, . . . , ek ∈ L(u1, . . . , uk). Ale z (1) plyne: e1, . . . , ek−1 ∈ L(e1, . . . , ek−1) = L(u1, . . . , uk−1) ⊆ L(u1, . . . , uk). Z (1) plyne, že každý z vektorů e1, . . . , ek−1 je lineární kombinací vektorů u1, . . . , uk−1 a proto pak ze (2) plyne, že ek ∈ L(u1, . . . , uk). Platí tedy : L(u1, . . . , uk) = L(e1, . . . , ek) a celá věta je tak dokázaná. Poznámka. V předchozí větě se nic nepředpokládá o lineární závislosti nebo nezávislosti vektorů u1, . . . , uk. Proto výsledné ortogonální vektory e1, . . . , ek mohou, ale nemusí být všechny nenulové. Přesněji řečeno, je-li dim L(u1, . . . , uk) = r (≤ k), pak je samozřejmě také dim L(e1, . . . , ek) = r , což znamená (vzhledem k tomu, že vektory e1, . . . , ek jsou ortogonální), že právě (k − r) z vektorů e1, . . . , ek musí být nulových. Zbývajících r vektorů je pak nenulových a tvoří ortogonální bázi podprostoru L(u1, . . . , uk). Specielně, jsou-li výchozí vektory u1, . . . , uk lineárně nezávislé, tzn. tvoří bázi podprostoru L(u1, . . . , uk), pak vektory e1, . . . , ek tvoří ortogonální bázi tohoto podprostoru. Věta 2.4. V každém nenulovém euklidovském prostoru V existuje ortogonální báze (resp. ortonormální báze). 80 Důkaz. Nechť u1, . . . , un je libovolná báze V . Pak podle předchozí věty a poznámky existuje ortogonální báze e1, . . . , en prostoru V . Normováním každého z vektorů e1, . . . , en pak dostaneme ortonormální bázi 1 e1 · e1, . . . , 1 en · en prostoru V . Příklad 2.1. V euklidovském prostoru R4 se skalárním součinem definovaným: (x1, x2, x3, x4) · (y1, y2, y3, y4) = x1y1 + x2y2 + x3y3 + x4y4 nalezněte ortogonální bázi podprostoru U generovaného vektory u1, u2, u3. Přitom: u1 = (0, 1, 2, 1), u2 = (−1, 1, 1, 1), u3 = (1, 0, 1, 0). Řešení: Platí U = L(u1, u2, u3). Potom : e1 = u1 = (0, 1, 2, 1). Položíme e2 = p · e1 + u2 a spočítáme koeficient p . Pak e2 · e1 = 0 = p · e1 · e1 + u2 · e1 ⇒ p = −u2·e1 e1·e1 = −2 3 . Tedy e2 = −2 3 · e1 + u2 = (−1, 1 3 , −1 3 , 1 3 ) . Položíme e3 = p1 · e1 + p2 · e2 + u3 a spočítáme koeficienty p1 a p2 . Pak e3 · e1 = 0 = p1 · e1 · e1 + p2 · e2 · e1 + u3 · e1 ⇒ p1 = −u3·e1 e1·e1 = −1 3 . e3 · e2 = 0 = p1 · e1 · e2 + p2 · e2 · e2 + u3 · e2 ⇒ p2 = −u3·e2 e2·e2 = 1 . Tedy e3 = −1 3 · e1 + 1 · e2 + u3 = (0, 0, 0, 0) = o. Výsledek: ortogonální bázi podprostoru U tvoří například vektory e1, e2 . Definice. Nechť A, B jsou libovolné podmnožiny euklidovského prostoru V . Je-li: a · b = 0 pro každé a ∈ A , b ∈ B , pak říkáme, že A, B jsou ortogonální množiny a píšeme A ⊥ B nebo též B ⊥ A. Poznámka. Řečeno jinými slovy, A, B jsou ortogonální množiny, právě když pro každé a ∈ A, b ∈ B jsou vektory a, b ortogonální. Ve specielních případech dostáváme : prázdná množina a množina {o} jsou zřejmě ortogonální ke každé podmnožině ve V . Dále z definice bezprostředně plyne, že: A ⊥ B =⇒ A ∩ B = ∅ ∨ A ∩ B = {o} . Následující věta pak ukáže, že při studiu ortogonálních množin bude mít smysl omezit se pouze na podprostory euklidovského prostoru V . Věta 2.5. Nechť A, B jsou podmnožiny euklidovského prostoru V . Pak platí: A ⊥ B ⇐⇒ [A] ⊥ [B] , tzn. dvě množiny jsou ortogonální, právě když jsou ortogonální podprostory generované těmito množinami. 81 Důkaz. "⇐": Plyne z předchozí definice, uvědomíme-li si, že A ⊆ [A] a B ⊆ [B]. "⇒": Předpokládejme, že A ⊥ B . Nechť dále u ∈ [A], v ∈ [B]. Podprostor [A] je roven množině všech lineárních kombinací konečně mnoha vektorů z A. Tento fakt se dokáže analogickým způsobem, jako jsme dokazovali větu 2.3., kapitoly I. (proveďte si podrobně sami!). Podobně, podprostor [B] je roven množině všech lineárních kombinací konečně mnoha vektorů z B . Je tedy : u = p1 · a1 + · · · + pk · ak , kde ai ∈ A a v = r1 · b1 + · · · + rm · bm , kde bj ∈ B . Potom však: u · v = k i=1 pi · ai · m j=1 rj · bj = k i=1 m j=1 pirj · (ai · bj) = 0, protože ai · bj = 0. Tedy platí [A] ⊥ [B] , což jsme měli dokázat. Definice. Nechť U je podprostor euklidovského prostoru V . Pak množina: U⊥ = {x ∈ V | x · u = 0 pro každé u ∈ U} se nazývá ortogonální doplněk podprostoru U (ve V ). Poznámka. Zřejmě platí, že U ⊥ U⊥ , tzn. množiny U a U⊥ jsou ortogonální. Ve speciálních případech přímo z definice ortogonálního doplňku dostáváme, že V ⊥ = {o} a {o}⊥ = V . Základní vlastnosti ortogonálních doplňků podprostorů v euklidovském prostoru popisují následující dvě věty. Věta 2.6. Nechť U je podprostor euklidovského prostoru V . Pak platí: 1. U⊥ je podprostor ve V 2. V = U ˙+ U⊥ , tzn. celý prostor V je přímým součtem podprostorů U a U⊥ . Důkaz. 1: Zřejmě o ∈ U⊥ , a tedy U⊥ = ∅. Nechť x, y ∈ U⊥ , r ∈ R. Dokážeme, že x + y ∈ U⊥ a r · x ∈ U⊥ . Nechť tedy u je libovolný vektor z podprostoru U. Pak: (x + y) · u = (x · u) + (y · u) = 0 + 0 = 0 a (r · x) · u = r · (x · u) = r · 0 = 0 , což znamená, že x + y ∈ U⊥ a r · x ∈ U⊥ . Tedy U⊥ je podprostor ve V . 2: Je-li U = {o}, pak U⊥ = V a tvrzení platí. Nechť tedy U = {o} a nechť e1, . . . , ek je ortonormální báze U (její existence je zaručena větou 2.4.). a) Dokážeme, že U + U⊥ = V . Inkluze "⊆" je zřejmá. Budeme dokazovat inkluzi "⊇". Nechť tedy v ∈ V . Označme: 82 x = (v · e1) · e1 + · · · + (v · ek) · ek. Pak zřejmě x ∈ U. Dále vezměme vektor (−x + v) a pro libovolné i = 1, . . . , k spočtěme skalární součin (−x + v) · ei . Užitím předchozího vztahu dostaneme: (−x + v) · ei = −(x · ei) + (v · ei) = −(v · ei) + (v · ei) = 0 . Potom však je (−x+v) ∈ U⊥ (proč?), odkud dostáváme, že v = x+(−x+v) ∈ U +U⊥ . b) Dokážeme, že U ∩ U⊥ = {o} . Inkluze "⊇" je zřejmá a budeme tedy dokazovat pouze inkluzi opačnou. Nechť v ∈ U ∩ U⊥ . Pak je v ∈ U a v ∈ U⊥ , a tedy v · v = 0 . To však znamená (podle věty 1.2. 5.), že je v = o . Dohromady pak z a) a b) plyne, že V = U ˙+ U⊥ . Věta 2.7. Nechť U, S jsou podprostory euklidovského prostoru V . Pak platí : 1. (U⊥ )⊥ = U 2. (U + S)⊥ = U⊥ ∩ S⊥ 3. (U ∩ S)⊥ = U⊥ + S⊥ . Důkaz. 1: Podle věty 2.6. je U ˙+ U⊥ = V a také U⊥ ˙+ (U⊥ )⊥ = V , odkud plyne (užitím věty o dimenzi součtu a průniku podprostorů), že dim U = dim V − dim U⊥ a také dim(U⊥ )⊥ = dim V − dim U⊥ . Tedy dimenze podprostorů U a (U⊥ )⊥ se rovnají a dále zřejmě platí, že U ⊆ (U⊥ )⊥ . Potom (podle věty 4.4. 2., kapitoly I.) je U = (U⊥ )⊥ . 2: Inkluze "⊆" je zřejmá. Dokážeme inkluzi "⊇". Nechť x ∈ U⊥ ∩ S⊥ a nechť v ∈ (U + S) je libovolný, tzn. v = u + s, kde u ∈ U, s ∈ S. Potom: x · v = x · (u + s) = x · u + x · s = 0 + 0 = 0, a tedy je x ∈ (U + S)⊥ . Je tedy U⊥ ∩ S⊥ ⊆ (U + S)⊥ a dohromady platí žádaná rovnost. 3: Užitím 1 a 2 dostáváme: (U ∩ S) = (U⊥ )⊥ ∩ (S⊥ )⊥ = (U⊥ + S⊥ )⊥ , odkud plyne: (U ∩ S)⊥ = (U⊥ + S⊥ )⊥ ⊥ = U⊥ + S⊥ , což je požadované tvrzení. Definice. Nechť U je podprostor ve V a nechť vektor v ∈ V je vyjádřen ve tvaru: v = x + y kde x ∈ U, y ∈ U⊥ . Pak vektor x se nazývá ortogonální projekce vektoru v do podprostoru U . 83 Poznámka. Uvědomme si, že předchozí definice je korektní, protože podle 2. části předchozí věty se libovolný vektor v ∈ V dá napsat ve výše uvedeném tvaru, a to jediným způsobem. Tedy ortogonální projekce vektoru v do podprostoru U je vždy jednoznačně určena. Věta 2.8. Nechť U je podprostor euklidovského prostoru V . Nechť x je ortogonální projekce vektoru v do podprostoru U, nechť x je ortogonální projekce vektoru v do podprostoru U a nechť r ∈ R libovolné. Pak platí: 1. (x + x ) je ortogonální projekce vektoru (v + v ) do U 2. r · x je ortogonální projekce vektoru r · v do U . Důkaz. Obě tvrzení věty dostaneme bezprostředním technickým rozepsáním z definice ortogonální projekce (proveďte si podrobně sami). Příklad 2.2. V euklidovském prostoru R4 se skalárním součinem definovaným: (x1, x2, x3, x4) · (y1, y2, y3, y4) = x1y1 + x2y2 + x3y3 + x4y4 nalezněte ortogonální projekci vektoru v = (4, −1, −3, 4) do podprostoru U generovaného vektory u1, u2, u3. Přitom: u1 = (1, 1, 1, 1), u2 = (1, 0, 0, 3), u3 = (1, 2, 2, −1). Řešení: Je - li podprostor zadán pomocí generátorů, pak je dobré nejprve zkusit z generátorů vybrat bázi. Pokud zadané generátory bázi tvoří, pak je tento výpočet sice vlastně zbytečný, ale pokud generátory bázi netvoří, pak se celý další výpočet technicky velmi zjednoduší a zkrátí. Hledejme tedy bázi podprostoru U.   1 1 1 1 1 0 0 3 1 2 2 −1   →   1 1 1 1 0 1 1 −2 0 −1 −1 2   →   1 1 1 1 0 1 1 −2 0 0 0 0   . Vidíme, že dim U = 2 , tzn. bází podprostoru U jsou například vektory u1, u2. Vektor v lze jednoznačně vyjádřit ve tvaru v = x + y , kde x ∈ U , y ∈ U⊥ . Protože x ∈ U , lze psát x = t1 · u1 + t2 · u2 , odkud po dosazení dostáváme: v = t1 · u1 + t2 · u2 + y . Poslední rovnici nyní skalárně vynásobíme nejprve vektorem u1 a potom vektorem u2 (využijeme přitom faktu, že u1 · y = 0 a u2 · y = 0) . Dostáváme tak soustavu dvou lineárních rovnic o dvou neznámých t1, t2 tvaru: v·u1 = t1 · u1·u1 + t2 · u2·u1 + 0 v·u2 = t1 · u1·u2 + t2 · u2·u2 + 0 =⇒ 4 t1 + 4 t2 = 4 4 t1 + 10 t2 = 16 odkud po jednoduchém výpočtu vychází, že t1 = −1 , t2 = 2 . Tedy x = (−1) · u1 + 2 · u2 = (1, −1, −1, 5) je hledaná ortogonální projekce vektoru v do podprostoru U . 84 Kapitola 5 Lineární zobrazení vektorových prostorů §1. Základní vlastnosti lineárního zobrazení V našich předchozích úvahách o vektorových prostorech jsme vždy vyšetřovali vlastnosti jednoho vektorového prostoru (pro úplnost připomeňme, že vektorovým prostorem rozumíme vždy konečnědimenzionální vektorový prostor nad číselným tělesem). V této kapitole se naopak budeme zabývat vzájemnými vztahy mezi dvěma, případně i více vektorovými prostory. Tyto "vzájemné vztahy" budeme studovat pomocí zobrazení jednoho vektorového prostoru do druhého. Aby naše úvahy měly praktický smysl, bude zřejmě nutné pracovat s takovými zobrazeními, která nějakým způsobem "zachovávají strukturu" daných vektorových prostorů, tj. zachovávají jednak součet vektorů a jednak násobek čísla s vektorem. Přitom zřejmě druhý požadavek bude moci být splněn jen tehdy, když uvažované vektorové prostory budou nad stejným číselným tělesem. Definice. Nechť V , V jsou vektorové prostory nad týmž číselným tělesem T. Zobrazení ϕ : V → V splňující pro každé u, v ∈ V , t ∈ T vztahy : 1. ϕ(u + v) = ϕ(u) + ϕ(v) 2. ϕ(t · u) = t · ϕ(u) se nazývá lineární zobrazení vektorového prostoru V do V . Je-li navíc ϕ bijektivní, pak se nazývá izomorfismus vektorového prostoru V na V . Poznámka. 1. Je nutné si uvědomit, že vektorové prostory V a V jsou obecně různé, a tedy i operace sčítání vektorů (resp. násobení čísla s vektorem) ve V a ve V jsou pak samozřejmě také různé. Přesto však je budeme pro jednoduchost označovat stejným symbolem + (resp. symbolem ·). Nebude moci dojít k nedorozumění, poněvadž ze souvislosti a z ostatní symboliky bude vždy zřejmé, co který symbol znamená. Pro ulehčení orientace budeme vektory z V obvykle označovat čárkovaně, kdežto vektory z V nečárkovaně. Speciálně tedy symbol o bude značit nulový vektor z V , kdežto o bude značit nulový vektor z V . 2. Lehce se ukáže, že podmínky 1 a 2 z předchozí definice jsou ekvivalentní jediné podmínce : 3. ϕ(t · u + s · v) = t · ϕ(u) + s · ϕ(v) pro u, v ∈ V , t, s ∈ T libovolné. Ověřujeme-li tedy, že zobrazení ϕ : V → V je lineární zobrazení, pak ověřujeme buď podmínky 1 a 2 nebo pouze jedinou podmínku 3. Matematickou indukcí lze zřejmě platnost podmínky 3 rozšířit na libovolný konečný počet sčítanců. Je-li tedy ϕ lineární zobrazení, pak pro u1, . . . , uk ∈ V a t1, . . . tk ∈ T platí : 85 ϕ(t1 · u1 + · · · + tk · uk) = t1 · ϕ(u1) + · · · + tk · ϕ(uk) . Příklad 1.1. Nechť V , V jsou vektorové prostory nad T, nechť t ∈ T. Pak: 1. Zobrazení ϕ : V → V definované: ϕ(u) = t · u pro každé u ∈ V je lineární zobrazení. Je-li t = 0, pak ϕ je dokonce izomorfismus (ověřte si rozepsáním!). Speciálně, pro t = 1 dostáváme identické zobrazení idV , které je tedy izomorfismem vektorového prostoru V na V . 2. Zobrazení ω : V → V definované: ω(u) = o pro každé u ∈ V je lineární zobrazení, které budeme nazývat nulové lineární zobrazení. Příklad 1.2. Zobrazení ϕ : R3 → R2 definované: ϕ (x1, x2, x3) = (2x1 + x3, x1 − x2 − x3) pro ∀ (x1, x2, x3) ∈ R3 je lineární zobrazení, které není izomorfismem. Dále, například zobrazení ψ : R3 → R2 definované: ψ (x1, x2, x3) = (2x1 + 1, x1 − x2 − x3) pro ∀ (x1, x2, x3) ∈ R3 není lineární zobrazení (ověřte si sami, že neplatí žádná z podmínek 1 , 2 z definice lineárního zobrazení). Příklad 1.3. Zobrazení δ : Rn[x] → Rn[x] definované: δ f(x) = f (x) pro ∀ f(x) ∈ Rn[x], tj. zobrazení přiřazující polynomu f(x) jeho derivaci f (x), je lineární zobrazení (při ověřování podmínek 1 a 2 se využije některých vět o derivování funkcí známých z analýzy). Zobrazení δ není bijektivní (proč ?), a tedy není izomorfismem. Následující tři věty uvedou další početní pravidla pro lineární zobrazení a ukáží, jak se lineární zobrazení chová vůči základním pojmům a vlastnostem vektorových prostorů (tzn. lineární závislosti vektorů, resp. podprostorům, jejich generování a dimenzi, resp. skládání lineárních zobrazení a izomorfizmu). Věta 1.1. Nechť ϕ : V → V je lineární zobrazení. Pak platí: 1. ϕ(o) = o , tj. nulový vektor se vždy musí zobrazit na nulový vektor 2. ϕ(−u) = −ϕ(u) pro ∀u ∈ V 3. u1, . . . , uk ∈ V jsou lineárně závislé vektory =⇒ ϕ(u1), . . . , ϕ(uk) jsou lineárně závislé vektory (ve V ). 86 Důkaz. 1: zřejmě je o = 0·o , tzn. pak (užitím definice lineárního zobrazení a toho, že násobením nulou dostaneme vždy nulový vektor) : ϕ(o) = ϕ(0 · o) = 0 · ϕ(o) = o . 2: užitím definice lineárního zobrazení a věty 1.1. 4., kapitoly I dostáváme: ϕ(−u) = ϕ (−1) · u = (−1) · ϕ(u) = − ϕ(u) . 3: nechť u1, . . . , uk jsou lineárně závislé vektory. Potom existují čísla t1, . . . , tk ∈ T, z nichž alespoň jedno je různé od nuly, tak, že platí : t1 · u1 + · · · + tk · uk = o . Pak ϕ(t1 · u1 + · · · + tk · uk) = ϕ(o) , odkud užitím definice lineárního zobrazení a právě dokázané části 1. dostáváme : t1 · ϕ(u1) + · · · + tk · ϕ(uk) = o , což znamená (vzhledem k tomu, že alespoň jedno z čísel t1, . . . , tk je různé od nuly), že vektory ϕ(u1), . . . , ϕ(uk) jsou lineárně závislé. Všimněme si toho, že předchozí věta nic neříká o tom, jak se lineární zobrazení chová k lineárně nezávislým vektorům. Je to proto, že lineární zobrazení může lineárně nezávislé vektory někdy zobrazit na lineárně nezávislé vektory a jindy na lineárně závislé vektory (rozmyslete si sami příslušné příklady). Další věta se zabývá otázkou, jak se lineární zobrazení chová vůči podprostorům. Připomeňme v této souvislosti dřívější úmluvu, že je-li ϕ : V → V zobrazení a A je jakákoliv neprázdná podmnožina ve V , pak symbolem ϕ(A) označujeme množinu obrazů všech prvků z A, tj.: ϕ(A) = {x ∈ V | ∃ u ∈ A tak, že ϕ(u) = x }. Věta 1.2. Nechť ϕ : V → V je lineární zobrazení a nechť U je podprostor ve V . Pak: 1. ϕ(U) je podprostor ve V 2. u1, . . . , uk jsou generátory podprostoru U =⇒ ϕ(u1), . . . , ϕ(uk) jsou generátory podprostoru ϕ(U) 3. dim ϕ(U) ≤ dim U . Důkaz. 1: dokáže se přímým ověřením definice podprostoru (proveďte si sami). 2: nechť x ∈ ϕ(U) je libovolný. Pak existuje u ∈ U tak, že x = ϕ(u) . Podle předpokladu je však u = t1 · u1 + · · · + tk · uk , a tedy x = ϕ(u) = ϕ(t1 · u1 + · · · + tk · uk) = t1 · ϕ(u1) + · · · + tk · ϕ(uk) , odkud plyne, že vektory ϕ(u1), . . . , ϕ(uk) jsou generátory podprostoru ϕ(U). 3: je-li U = {o}, pak ϕ(U) = {o } a tvrzení zřejmě platí. Nechť tedy U = {o} a nechť u1, . . . , uk je báze podprostoru U. Pak podle části 2 jsou vektory ϕ(u1), . . . , ϕ(uk) generátory podprostoru ϕ(U) , a tedy platí (proč ?), že dim ϕ(U) ≤ k = dim U . 87 Věta 1.3. 1. složení dvou lineárních zobrazení je opět lineárním zobrazením 2. inverzní zobrazení k izomorfizmu je opět izomorfizmem. Důkaz. 1: Nechť ϕ : V → V , ψ : V → V jsou lineární zobrazení. Ověříme, že složené zobrazení (ψ ◦ ϕ) splňuje definici lineárního zobrazení. Nechť tedy u, v ∈ V , t ∈ T . Pak : (ψ◦ϕ)(u+v)=ψ(ϕ(u+v))=ψ(ϕ(u)+ϕ(v))=ψ(ϕ(u))+ψ(ϕ(v))=(ψ◦ϕ)(u)+(ψ◦ϕ)(v) (ψ ◦ ϕ)(t · u) = ψ (ϕ(t · u)) = ψ (t · ϕ(u)) = t · (ψ(ϕ(u)) = t · ((ψ ◦ ϕ)(u)), a tedy (ψ ◦ ϕ) je lineární zobrazení. 2: Nechť ϕ : V → V je izomorfizmus. Vzhledem k tomu, že zobrazení ϕ je bijektivní, existuje k němu inverzní zobrazení ϕ−1 : V → V , které je (jak víme) také bijektivní. Zbývá tedy dokázat, že zobrazení ϕ−1 je lineárním zobrazením. Nechť tedy u , v ∈ V , t ∈ T. Označme ϕ−1 (u ) = u , ϕ−1 (v ) = v . Potom z definice inverzního zobrazení ϕ−1 plyne, že ϕ(u) = u , ϕ(v) = v a platí ϕ(u + v) = ϕ(u) + ϕ(v) = u + v a tedy ϕ−1 (u + v ) = u + v = ϕ−1 (u ) + ϕ−1 (v ) ϕ(t · u) = t · ϕ(u) = t · u a tedy ϕ−1 (t · u ) = t · u = t · ϕ−1 (u ) . Dokázali jsme tak, že ϕ−1 je izomorfizmus. Následující důležitá věta ukáže, že k úplnému zadání lineárního zobrazení V → V stačí zadat pouze obrazy vektorů pevné báze prostoru V a obrazy zbývajících vektorů z V jsou pak již jednoznačně vynuceny. Na druhé straně se ale takovýto výsledek dá celkem očekávat, pokud si uvědomíme, že každý vektor z V je jistou, jednoznačně určenou lineární kombinací vektorů báze a že lineární zobrazení "zachovává lineární kombinace vektorů". Věta 1.4. (Základní věta o lineárních zobrazeních) Nechť V , V jsou vektorové prostory nad T, nechť u1, . . . , un je báze prostoru V a nechť v1, . . . , vn jsou libovolné vektory z V . Pak existuje jediné lineární zobrazení ϕ : V → V takové, že ϕ(u1) = v1 , ...... , ϕ(un) = vn . Důkaz. Větu dokážeme postupně ve dvou krocích, a to tak, že nejprve dokážeme (a to konstruktivně) existenci hledaného lineárního zobrazení ϕ a potom dokážeme jednoznačnost tohoto zobrazení. I. důkaz existence lineárního zobrazení ϕ. Nechť x ∈ V je libovolný vektor, přičemž x = x1 · u1 + · · · + xn · un . Položme : ϕ(x) = x1 · v1 + · · · + xn · vn . Potom ϕ je zobrazení V do V , pro které zřejmě platí (rozmyslete si podrobně proč), že ϕ(u1) = v1 , . . . , ϕ(un) = vn . Zbývá tedy dokázat, že ϕ je lineárním zobrazením. Nechť tedy x, y ∈ V , t ∈ T , přičemž : x = x1 · u1 + · · · + xn · un , y = y1 · u1 + · · · + yn · un . 88 Potom : x + y = (x1 + y1) · u1 + · · · + (xn + yn) · un , t · x = (tx1) · u1 + · · · + (txn)un . Podle definice zobrazení ϕ a po úpravě pak dostáváme, že ϕ(x + y) = (x1 + y1) · v1 + · · · + (xn + yn) · vn = = (x1 · v1 + · · · + xn · vn) + (y1 · v1 + · · · + yn · vn) = ϕ(x) + ϕ(y) , a podobným způsobem dostáváme, že ϕ(t · x) = (tx1) · v1 + · · · + (txn) · vn = t · (x1 · v1 + · · · + xn · vn) = t · ϕ(x) . Dokázali jsme tedy, že ϕ je lineární zobrazení s požadovanými vlastnostmi. II. důkaz jednoznačnosti lineárního zobrazení ϕ . Nechť ϕ je výše zkonstruované lineární zobrazení a nechť dále ψ : V → V je lineární zobrazení takové, že ψ(u1) = v1, . . . , ψ(un) = vn. Budeme dokazovat, že je ψ = ϕ . K tomu zřejmě stačí dokázat, pro libovolné x ∈ V platí ψ(x) = ϕ(x) . Nechť tedy x ∈ V přičemž je x = x1 · u1 + · · · + xn · un . Potom : ψ(x) = ψ(x1 ·u1 +· · ·+xn ·un) = x1 ·ψ(u1)+· · ·+xn ·ψ(un) = x1 ·v1 +· · ·+xn ·vn = ϕ(x) . Dokázali jsme tak, že zobrazení ϕ je určeno jednoznačně. Definice. Nechť ϕ : V → V je lineární zobrazení. Pak: 1. množina Ker ϕ = {u ∈ V | ϕ(u) = o } se nazývá jádro lineárního zobrazení ϕ 2. množina Im ϕ = ϕ(V ) se nazývá obraz lineárního zobrazení ϕ . Poznámka. Označení Ker ϕ, resp. Im ϕ jsou v literatuře běžně používané zkratky pro anglické názvy "kernel" = jádro, resp. "image" = obraz. Následující tvrzení ukáží, že obě podmnožiny jsou dokonce podprostory a popíší jejich základní vlastnosti. Věta 1.5. Nechť ϕ : V → V je lineární zobrazení. Pak platí : 1. jádro Ker ϕ je podprostorem ve V 2. obraz Im ϕ je podprostorem ve V . Důkaz. 1: Zřejmě o ∈ Ker ϕ, a tedy Ker ϕ = ∅. Dále, nechť u, v ∈ Ker ϕ, tzn. je ϕ(u) = o , ϕ(v) = o . Pak platí : ϕ(u + v) = ϕ(u) + ϕ(v) = o + o = o , což znamená, že u + v ∈ Ker ϕ . Podobně se dokáže, že pro u ∈ Ker ϕ , t ∈ T je t·u ∈ Ker ϕ. Dohromady tedy dostáváme, že Ker ϕ je podprostorem ve V . 2: tvrzení je pouze speciálním případem věty 1.2. 1.. 89 Věta 1.6. Nechť ϕ : V → V je lineární zobrazení. Pak ϕ je injektivní ⇐⇒ Ker ϕ = {o} . Důkaz. "⇒": Nechť ϕ je injektivní zobrazení. Dokážeme množinovou rovnost Ker ϕ = {o} . Inkluze "⊇" je však zřejmá (protože ϕ(o) = o ), tzn. stačí dokázat inkluzi opačnou. Nechť tedy x ∈ Ker ϕ . Pak ϕ(x) = o . Víme však, že je také ϕ(o) = o , tzn. dostáváme tak, že ϕ(x) = ϕ(o) . Zobrazení ϕ je však injektivní, a tedy x = o ∈ {o} . Dokázali jsme tak, že Ker ϕ ⊆ {o} a dohromady pak Ker ϕ = {o} . "⇐": Nechť je Ker ϕ = {o} . Dokážeme, že zobrazení ϕ je injektivním zobrazením. Nechť je tedy ϕ(u) = ϕ(v). Potom ϕ(u) − ϕ(v) = o a užitím toho, že ϕ je lineární zobrazení dostáváme ϕ(u − v) = o . To však znamená, že u − v ∈ Ker ϕ , odkud podle předpokladu plyne, že u − v = o , tzn. u = v . Dokázali jsme tak, že zobrazení ϕ je injektivní. Věta 1.7. (Věta o dimenzi jádra a obrazu lineárního zobrazení) Nechť ϕ : V → V je lineární zobrazení. Pak platí : dim(Ker ϕ) + dim(Im ϕ) = dim V . Důkaz. Je-li Im ϕ = {o }, pak Ker ϕ = V a věta zřejmě platí. Nechť je tedy Im ϕ = {o } a nechť v1, . . . , vr je báze Im ϕ. Pak existují vektory (obecně nikoliv jednoznačně !) u1, . . . , ur ∈ V tak, že ϕ(u1) = v1 , . . . , ϕ(ur) = vr . Z věty 1.1. 3. plyne, že vektory u1, . . . , ur jsou lineárně nezávislé, tzn. platí potom, že dim L(u1, . . . , ur) = r = dim(Im ϕ) . (1) Dále : I. Ukážeme, že Ker ϕ + L(u1, . . . , ur) = V . Inkluze "⊆" je však zřejmá, tzn. budeme dokazovat inkluzi opačnou. Nechť tedy x ∈ V , libovolný. Pak ϕ(x) ∈ Im ϕ . Vyjádříme vektor ϕ(x) pomocí báze Im ϕ : ϕ(x) = c1 · v1 + · · · + cr · vr , kde ci ∈ T . Uvažme nyní vektor u = c1 · u1 + · · · + cr · ur. Zřejmě je u ∈ L(u1, . . . , ur) a dále: ϕ(u) = ϕ(c1 ·u1 +· · ·+cr ·ur) = c1 ·ϕ(u1)+· · ·+cr ·ϕ(ur) = c1 ·v1 +· · ·+cr ·vr = ϕ(x), odkud ϕ(x) − ϕ(u) = o , tzn. ϕ(x − u) = o , neboli x − u ∈ Ker ϕ. Potom však: x = (x − u) + u ∈ Ker ϕ + L(u1, . . . , ur), II. Ukážeme, že Ker ϕ ∩ L(u1, . . . , ur) = {o} . Zřejmě stačí dokazovat pouze inkluzi "⊆" . Nechť tedy x ∈ Ker ϕ ∩ L(u1, . . . , ur). Pak ϕ(x) = o a současně x = t1 · u1 + · · · + tr · ur , odkud dostáváme : o = ϕ(x) = t1 · ϕ(u1) + · · · + tr · ϕ(ur) = t1 · v1 + · · · + tr · vr. Z lineární nezávislosti vektorů v1, . . . , vr nyní plyne, že t1 = · · · = tr = 0, a tedy po dosazení dostáváme x = o . 90 Z I. a II., užitím věty dimenzi o součtu a průniku podprostorů a vztahu (1) pak dostáváme : dim V = dim Ker ϕ + L(u1, . . . , ur) = = dim Ker ϕ + dim L(u1, . . . , ur) − dim Ker ϕ ∩ L(u1, . . . , ur) = = dim Ker ϕ + dim Im ϕ − 0 = dim Ker ϕ + dim Im ϕ a věta tedy platí. Definice. Nechť V , V jsou vektorové prostory nad T a nechť existuje izomorfismus vektorového prostoru V na V . Pak říkáme, že V a V jsou izomorfní vektorové prostory a píšeme V ∼= V . Věta 1.8. Relace ∼= je relací ekvivalence na množině všech (konečnědimenzionálních) vektorových prostorů nad tělesem T. Důkaz. Reflexivnost relace ∼= je zřejmá, neboť idV je izomorfismus V na V , a tedy V ∼= V . Symetrie: nechť platí V ∼= V , tzn. existuje izomorfismus ϕ : V → V . Pak zobrazení ϕ−1 : V → V je podle věty 1.3. 2. také izomorfizmus, což znamemá, že V ∼= V . Tranzitivita relace ∼= plyne z vlastností bijekce a z věty 1.3. 1. Věta 1.9. Nechť ϕ : V → V je izomorfismus a u1, . . . , uk ∈ V . Pak platí : 1. u1, . . . , uk jsou lineárně závislé ⇐⇒ ϕ(u1), . . . , ϕ(uk) jsou lineárně závislé 2. u1, . . . , uk jsou lineárně nezávislé ⇐⇒ ϕ(u1), . . . , ϕ(uk) jsou lineárně nezávislé 3. u1, . . . , un je báze V ⇐⇒ ϕ(u1), . . . , ϕ(un) je báze V 4. dim V = dim V . Důkaz. Podle předpokladu je ϕ : V → V bijektivní lineární zobrazení a podle důkazu předchozí věty je ϕ−1 : V → V také bijektivní lineární zobrazení. Potom: 1: Plyne z věty 1.1. 3. aplikované na ϕ, resp. na ϕ−1 . 2: Je logickým důsledkem 1. 3: Plyne z 2 a z věty 1.2. 2., uvědomíme-li si, že ϕ(V ) = V a ϕ−1 (V ) = V . 4: Je-li V nulovým prostorem, pak je tvrzení zřejmé. V ostatních případech plyne z 3. Poznámka. Utvoříme-li na množině všech (konečnědimenzionálních) vektorových prostorů nad T rozklad příslušný ekvivalenci ∼=, pak v každé třídě tohoto rozkladu budou vždy všechny navzájem izomorfní vektorové prostory. Z věty 1.9. pak plyne, že tyto izomorfní vektorové prostory mají z algebraického hlediska stejné vlastnosti. V matematice se obvykle o takových algebraických strukturách říká, že jsou "stejné, až na izomorfismus" a často se dokonce ztotožňují. 91 Následující věta pak podá velmi jednoduchou charakterizaci izomorfních vektorových prostorů, tj. vektorových prostorů patřících do jedné třídy zmíněného rozkladu. Ukáže se, že dva vektorové prostory jsou izomorfní právě když mají stejnou dimenzi. Věta 1.10. (Věta o izomorfismu vektorových prostorů) Nechť V , V jsou vektorové prostory nad T. Pak: V ∼= V ⇐⇒ dim V = dim V . Důkaz. "⇒": Plyne přímo z věty 1.9. 4.. "⇐": Je-li dim V = dim V = 0, pak oba prostory jsou nulovými vektorovými prostory a zřejmě je V ∼= V . Nechť tedy dim V = dim V = n , kde n ≥ 1 a nechť u1, . . . , un je báze V a u1, . . . , un je báze V . Nyní sestrojíme hledaný izomorfizmus prostoru V do prostoru V . Nechť x ∈ V , přičemž x = x1 · u1 + · · · + xn · un (víme, že toto vyjádření existuje, a to jediné). Položme : ϕ(x) = x1 · u1 + · · · + xn · un . Pak zřejmě ϕ : V → V je zobrazení, o kterém ukážeme, že je hledaným izomorfizmem. I. ϕ je bijektivní zobrazení. Libovolný vektor x ∈ V , kde x = t1 · u1 + · · · + tn · un má při zobrazení ϕ jediný vzor ve V , a to vektor x = t1 · u1 + · · · + tn · un , což ihned plyne z definice zobrazení ϕ a z jednoznačnosti vyjádření vektorů pomocí báze. Tedy ϕ je bijektivní zobrazení. II. ϕ je lineární zobrazení. Nechť x, y ∈ V , t ∈ T, přičemž x = x1 · u1 + · · · + xn · un , y = y1 · u1 + · · · + yn · un . Potom je x + y = (x1+y1) · u1 + · · · + (xn+yn) · un , t · x = (tx1) · u1 + · · · + (txn)un . Podle definice zobrazení ϕ a po úpravě pak dostáváme : ϕ(x + y) = (x1+y1) · u1 + · · · + (xn+yn) · un = = (x1u1 + · · · + xnun) + (y1u1 + · · · + ynun) = ϕ(x) + ϕ(y) . Analogickým způsobem (rozepište si podrobně sami) dostaneme, že ϕ(t · x) = t · ϕ(x). Tedy ϕ je lineární zobrazení. Dohromady dostáváme, že ϕ je izomorfismus prostoru V na V a je tedy V ∼= V . Poznámka. Z předchozí věty plyne, že při zadaném číselném tělese T je každý vektorový prostor jednoznačně (až na izomorfismus) určen svojí dimenzí. Přitom např. zřejmě každý nenulový n-dimenzionální vektorový prostor nad T je izomorfní s prostorem Tn . Vidíme tedy, že vektorové prostory Tn pro n = 1, 2, 3, . . . vyčerpávají (až na izomorfismus) všechny nenulové vektorové prostory nad T. Mohlo by se tedy na první pohled zdát, že při budování obecné teorie vektorových prostorů by vlastně stačilo omezit se pouze na prostory Tn . Je však ihned vidět, že bychom tímto nedosáhli podstatného zjednodušení, neboť z důkazu předchozí věty plyne, že použitý izomorfismus závisí na volbě báze. Pokud bychom tedy chtěli nějaké tvrzení o prostoru Tn přenést na libovolný n-dimenzionální vektorový prostor, znamenalo by to vždy dokázat jeho nezávislost na volbě báze. 92 §2. Lineární transformace a její matice Definice. Nechť V je vektorový prostor nad T. Lineární zobrazení ϕ : V → V se nazývá lineární transformace vektorového prostoru V . Je-li navíc ϕ bijektivní, pak se nazývá automorfismus vektorového prostoru V . Poznámka. Vidíme, že lineární transformace je speciálním případem lineárního zobrazení, a sice pro V = V . Znamená to tedy, že všechny úvahy z předchozího paragrafu zůstávají v platnosti i pro lineární transformace a pro lineární transformace bude zřejmě platit ještě něco navíc. Dále si všimněme toho, že je-li V = {o}, pak existuje pouze jediná, a to identická lineární transformace prostoru V a všechny úvahy o ní jsou víceméně triviální. Proto se v dalším budeme zabývat pouze lineárními transformacemi nenulových vektorových prostorů. Nejprve uvedeme větu, která nám podá řadu ekvivalentních podmínek pro to, aby lineární transformace byla automorfismem, tj. aby byla bijektivní. Věta 2.1. Nechť ϕ je lineární transformace prostoru V . Pak následující výroky jsou ekvivalentní : 1. ϕ je automorfismus 2. ϕ je injektivní zobrazení 3. ϕ je surjektivní zobrazení 4. ϕ zobrazuje libovolnou bázi prostoru V na bázi prostoru V 5. ϕ zobrazuje libovolné lineárně nezávislé vektory opět na lineárně nezávislé vektory. Důkaz. "1 ⇒ 2": Zřejmé. "2 ⇒ 3": Nechť ϕ je injektivní zobrazení. Pak podle věty 1.6. je Ker ϕ = {o}, a tedy podle věty o dimenzi jádra a obrazu lineárního zorazení je dim Im ϕ = dim V . Protože však je Im ϕ ⊆ V , musí být ϕ(V ) = V . To však znamená, že ϕ je surjektivní zobrazení. "3 ⇒ 4": Nechť ϕ surjektivní zobrazení, tzn. ϕ(V ) = V . Nechť nyní u1, . . . , un je báze prostoru V . Podle věty 1.2. 2. jsou ϕ(u1), . . . , ϕ(un) generátory ϕ(V ) = V . Ale z generátorů prostoru V lze vybrat bázi V , která však v našem případě musí sestávat z n vektorů, což znamená, že ϕ(u1), . . . , ϕ(un) je báze V . "4 ⇒ 5": Nechť platí 4. a nechť u1, . . . , uk ∈ V jsou lineárně nezávislé vektory. Ale lineárně nezávislé vektory z V lze doplnit na bázi prostoru V , například u1, . . . , uk, vk+1, . . . , vn . Podle 4. jsou vektory ϕ(u1), . . . ϕ(uk), ϕ(vk+1), . . . , ϕ(vn) bází prostoru V , tzn. jsou lineárně nezávislé. Potom také vektory ϕ(u1), . . . , ϕ(uk) jsou lineárně nezávislé. "5 ⇒ 1": Nechť platí 5. Nejprve dokážeme, že je Ker ϕ = {o}. Je-li však x = o, pak je vektor x lineárně nezávislý, a tedy podle 5 je ϕ(x) také lineárně nezávislý, což znamená, že ϕ(x) = o. Dokázali jsme tak, že Ker ϕ = {o}. Je-li Ker ϕ = {o}, pak z věty 1.6. plyne, že zobrazení ϕ je injektivní. Dále pak, stejným způsobem jako v důkazu implikace "2 ⇒ 3" dokážeme, že zobrazení ϕ je surjektivní. Dohromady dostáváme, že ϕ je bijektivní lineární transformace, tzn. automorfismus. 93 Definice. Nechť ϕ je lineární transformace prostoru V . Nechť u1, . . . , un je pevná báze prostoru V a platí : ϕ(u1) = a11 · u1 + a21 · u2 + · · · + an1 · un ϕ(u2) = a12 · u1 + a22 · u2 + · · · + an2 · un ... ϕ(un) = a1n · u1 + a2n · u2 + · · · + ann · un Pak matice: A =      a11 a12 · · · a1n a21 a22 · · · a2n ... ... ... ... an1 an2 · · · ann      se nazývá matice lineární transformace ϕ v bázi u1, . . . , un . Poznámka. Vidíme, že matice A je čtvercovou maticí řádu n (kde n = dim V ), která je utvořena tak, že souřadnice vektoru ϕ(uj) v bázi u1, . . . , un jsou napsány do j-tého sloupce matice A (j = 1, . . . , n). Tyto souřadnice jsou určeny jednoznačně, což znamená, že i matice A je určena jednoznačně. Uvědomme si dále, že pojem matice lineární transformace je vázán podstatným způsobem na pevnou bázi prostoru V . Zřejmě matice téže lineární transformace ϕ v různých bázích prostoru V budou obecně různé. Označení. Množinu všech lineárních transformací prostoru V budeme označovat symbolem L(V ). Prvky množiny L(V ) jsou tedy lineární transformace vektorového prostoru V , tj. jistá zobrazení V → V . Zřejmě je L(V ) = ∅, neboť například identické zobrazení idV ∈ L(V ). Na množině L(V ) nyní určitým přirozeným způsobem definujeme součet a součin, resp. násobek číslem a popíšeme základní vlastnosti takto vzniklých algebraických struktur. Definice. Nechť ϕ, ψ ∈ L(V ), t ∈ T libovolné. Pak zobrazení : 1. ϕ + ψ : V → V definované (ϕ + ψ)(u) = ϕ(u) + ψ(u) pro ∀ u ∈ V se nazývá součet lineárních transformací ϕ a ψ 2. ϕ ◦ ψ : V → V definované (ϕ ◦ ψ)(u) = ϕ ψ(u) pro ∀ u ∈ V se nazývá součin lineárních transformací ϕ a ψ 3. t · ϕ : V → V definované (t · ϕ)(u) = t · ϕ(u) pro ∀ u ∈ V se nazývá součin čísla t s lineární transformací ϕ. 94 Věta 2.2. Nechť ϕ, ψ jsou lineární transformace prostoru V , t ∈ T libovolné. Pak platí : 1. ϕ + ψ, ϕ ◦ ψ, t · ϕ jsou lineární transformace prostoru V 2. (L(V ), +) je komutativní grupa 3. (L(V ), +, ◦) je okruh s jedničkou 4. L(V ) je vektorový prostor nad tělesem T (vzhledem k +, resp. ·). Důkaz. 1: Zřejmě ϕ + ψ , ϕ ◦ ψ , t · ϕ jsou zobrazení V → V . Rozepsáním se bezprostředně ověří, že jsou to lineární zobrazení. 2: Dokáže se rozepsáním. Přitom roli nulového prvku hraje nulová lineární transformace ω : V → V , definovaná : ω(u) = o pro ∀ u ∈ V ) , resp. opačným prvkem k ϕ ∈ L(V ) je lineární transformace : V → V , definovaná : (u) = −ϕ(u) pro ∀ u ∈ V . 3: Dokáže se opět rozepsáním, s využitím 2. Jedničkou tohoto okruhu je zřejmě identická transformace idV . 4: Dokáže se užitím 2 a bezprostředním ověřením axiomů vektorového prostoru. Věta 2.3. Nechť ϕ, ψ jsou lineární transformace prostoru V , dim V = n ≥ 1. Nechť maticí lineární transformace ϕ v bázi u1, . . . , un je matice A a nechť maticí lineární transformace ψ v bázi u1, . . . , un je matice B. Potom : 1. maticí lineární transformace ϕ + ψ v bázi u1, . . . , un je matice A + B 2. maticí lineární transformace ϕ ◦ ψ v bázi u1, . . . , un je matice A · B 3. maticí lineární transformace t · ϕ v bázi u1, . . . , un je matice t · A. Důkaz. Nechť A = (aij), B = (bij), i, j = 1, . . . , n. Při tomto označení pak platí: ϕ(uj) = n r=1 arj · ur , ψ(uj) = n r=1 brj · ur pro j = 1, . . . , n. Potom : 1: Pro j = 1, . . . , n je (ϕ + ψ)(uj) = ϕ(uj) + ψ(uj) = n r=1 arj · ur + n r=1 brj · ur = n r=1 (arj + brj) · ur a tedy maticí lineární transformace ϕ + ψ v bázi u1, . . . , un je matice (aij + bij) = A + B. 2: Označme A · B = (cij), tzn. cij = n k=1 aik · bkj pro i, j = 1, . . . , n. Potom (ϕ ◦ ψ)(uj) = ϕ n r=1 brj · ur = n r=1 brj · ϕ(ur) = n r=1 brj · n s=1 asr · us = n s=1 n r=1 asrbrj · us = n s=1 csj · us , odkud plyne, že maticí lineární transformace ϕ ◦ ψ v bázi u1, . . . , un je matice A · B. 95 3: Pro j = 1, . . . , n je (t · ϕ)(uj) = t · ϕ(uj) = t · n r=1 arj · ur = n r=1 (t · arj) · ur , a tedy maticí lineární transformace t · ϕ v bázi u1, . . . , un je matice (t · aij) = t · A. Věta 2.4. Nechť V je vektorový prostor nad T, dim V = n ≥ 1. Pak platí : 1. grupa (L(V ), +) je izomorfní s grupou (Matnn(T), +) 2. okruh (L(V ), +, ◦) je izomorfní s okruhem (Matnn(T), +, ·) 3. vektorový prostor L(V ) je izomorfní s vektorovým prostorem Matnn(T). Důkaz. Nechť u1, . . . , un je pevná báze V . Definujme zobrazení F : L(V ) → Matnn(T) takto: pro libovolné ϕ ∈ L(V ) položme: F(ϕ) = A , kde A je matice lineární transformace ϕ v bázi u1, . . . , un. Nyní dokážeme, že: I. F je bijektivní zobrazení. Nechť A ∈ Matnn(T) libovolná. Označme v1, . . . , vn vektory z V , jejichž souřadnicemi v bázi u1, . . . , un jsou po řadě sloupce matice A. Podle základní věty o lineárních zobrazeních existuje jediná lineární transformace ϕ prostoru V s vlastností ϕ(u1) = v1, . . . , ϕ(un) = vn . Ale maticí lineární transformace ϕ v bázi u1, . . . , un je pak právě matice A. Tedy existuje právě jedno ϕ ∈ L(V ) tak, že F(ϕ) = A, neboli matice A má při zobrazení F právě jeden vzor, což znamená, že F je bijektivní zobrazení. II. F je homomorfizmus grup, resp. homomorfizmus okruhů, resp. lineární zobrazení. Důkaz provedeme pro poslední případ, ve zbývajících případech se postupuje analogicky (proveďte si podrobně sami). Nechť tedy ϕ, ψ ∈ L(V ), t ∈ T libovolné, přičemž F(ϕ) = A, F(ψ) = B. Pak podle věty 2.3. 1., resp. podle věty 2.3. 3. je F(ϕ + ψ) = A + B = F(ϕ) + F(ψ) , resp. F(t · ϕ) = t · A = t · F(ϕ) . Dokázali jsme tak, že F je lineární zobrazení. Dohromady, F je izomorfismus vektorových prostorů, neboli L(V ) ∼= Matnn(T). Poznamenejme, že z předchozí věty okamžitě plyne, že okruh (L(V ), +, ◦) je pro n ≥ 2 nekomutativní (proč ?) a dále, že dimenze vektorového prostoru L(V ) je n2 (proč ?). Na závěr paragrafu si ještě stručně všimneme toho, jak vypadají matice téže lineární transformace v různých bázích prostoru V a jaké jsou některé jejich základní vlastnosti. Věta 2.5. Nechť A, B ∈ Matnn(T), nechť dim V = n (≥ 1). Pak platí : A, B jsou maticemi téže lineární transformace prostoru V (ve vhodných bázích) právě když existuje regulární matice S tak, že B = S−1 · A · S . 96 Důkaz. "⇒": Nechť A = (aij) je matice lineární transformace ϕ v bázi u1, . . . , un a nechť B = (bij) je matice téže lineární transformace ϕ v bázi u1, . . . , un. Dále nechť S = (sij) je matice přechodu od báze u1, . . . , un k bázi u1, . . . , un, tzn. S je regulární matice a platí : uj = n i=1 sij · ui pro j = 1, . . . , n . Potom však : ϕ(uj) = n k=1 bkj · uk = n k=1 bkj · n i=1 sik · ui = n i=1 n k=1 sikbkj · ui a také: ϕ(uj) = ϕ n k=1 skj · uk = n k=1 skj · ϕ(uk) = n k=1 skj · n i=1 aik · ui = n i=1 n k=1 aikskj · ui, odkud porovnáním pravých stran (na základě jednoznačnosti vyjádření vektoru ϕ(uj) pomocí báze u1, . . . , un) dostáváme, že : n k=1 sikbkj = n k=1 aikskj pro i, j = 1, . . . , n , což však znamená, že S · B = A · S , neboli B = S−1 · A · S . "⇐": Nechť B = S−1 · A · S a nechť u1, . . . , un je pevná báze vektorového prostoru V . Pak (podle důkazu věty 2.4.) existuje jediná lineární transformace ϕ prostoru V taková, že A je maticí ϕ v bázi u1, . . . , un. Dále, S je regulární matice, tzn. existuje (jediná) báze u1, . . . , un prostoru V taková, že S je matice přechodu od báze u1, . . . , un k bázi u1, . . . , un. Konečně, podle předpokladu je S · B = A · S, neboli n k=1 sikbkj = n k=1 aikskj pro i, j = 1, . . . , n . Potom stejnými úpravami jako v první části důkazu dostáváme: ϕ(uj) = n i=1 n k=1 aikskj · ui = n i=1 n k=1 sikbkj · ui = n k=1 bkj · uk pro j = 1, . . . , n, což však znamená, že B je maticí lineární transformace ϕ v bázi u1, . . . , un. Tedy matice A, B jsou maticemi téže lineární transformace prostoru V . Definice. Nechť A, B ∈ Matnn(T) a nechť existuje regulární matice S taková, že B = S−1 · A · S. Pak říkáme, že matice A, B jsou podobné matice a píšeme A ∼ B. Věta 2.6. Relace ∼ podobnosti matic je relací ekvivalence na množině Matnn(T). 97 Důkaz. Reflexivita: pro libovolnou matici A ∈ Matnn(T) zřejmě platí, že A = E−1 n · A · En, kde En je jednotková matice řádu n. Je tedy A ∼ A. Symetrie: nechť A ∼ B, tzn. existuje regulární matice S tak, že B = S−1 · A · S. Pak ale A = S · B · S−1 = (S−1 )−1 · A · (S−1 ) , kde S−1 je zřejmě regulární. Tedy B ∼ A. Tranzitivita: nechť A ∼ B a B ∼ C, tzn. existují regulární matice S, Q tak, že B = S−1 · A · S a C = Q−1 · B · Q . Po dosazení dostáváme C = Q−1 · S−1 · A · S · Q = (S · Q)−1 · A · (S · Q) , přičemž matice S · Q je zřejmě regulární. Tedy je A ∼ C. Definice. Nechť A = (aij) je čtvercová matice řádu n (nad T) a nechť λ je proměnná. Potom determinant : |A − λEn| = a11 − λ a12 · · · a1n a21 a22 − λ · · · a2n ... ... ... ... an1 an2 · · · ann − λ se nazývá charakteristický polynom matice A. Poznámka. Provedeme-li výpočet předchozího determinantu (např. užitím věty 2.2., kap. II.), dostaneme: |A − λEn| = (−1)n · λn + (−1)n−1 · (a11 + a22 + · · · + ann) · λn−1 + · · · + |A|. Je tedy okamžitě vidět, že se skutečně jedná o polynom proměnné λ, který je stupně n a jeho koeficienty jsou z číselného tělesa T. Konkrétně, například pro n = 3 dostaneme rozepsáním : |A − λE3| = a11 − λ a12 a13 a21 a22 − λ a23 a31 a32 a33 − λ = = −λ3 + (a11 + a22 + a33) · λ2 − a11 a12 a21 a22 + a11 a13 a31 a33 + a22 a23 a32 a33 · λ + |A| . Věta 2.7. Nechť A, B jsou podobné matice. Pak : 1. matice A, B mají stejné determinanty, tj. |A| = |B| 2. matice A, B mají stejnou hodnost, tj. h(A) = h(B) 3. matice A, B mají stejné charakteristické polynomy, tj. |A − λEn| = |B − λEn| . 98 Důkaz. Nechť A, B ∈ Matnn(T) jsou podobné matice, tzn. existuje regulární matice S tak, že B = S−1 · A · S. Potom: 1: Užitím Cauchyovy věty a věty 3.9. 3., kap. II., dostáváme: |B| = |S−1 · A · S| = 1 |S| · |A| · |S| = |A|. 2: Užitím věty 4.5. 2., kap. II., je: h(B) = h(S−1 · A · S) = h(A · S) = h(A). 3: Užitím Cauchyovy věty a zřejmého faktu, že λEn = S−1 · (λEn) · S, dostáváme: |B − λEn| = |S−1 · A · S − S−1 · (λEn) · S| = = |S−1 · (A − λEn) · S| = 1 |S| · |A − λEn| · |S| = |A − λEn| . Poznámka. Poznamenejme, že předchozí větu nelze obrátit, tzn. rovnost determinantů, rovnost hodností a rovnost charakteristických polynomů dvou matic jsou pouze nutné, nikoliv však dostatečné podmínky pro podobnost těchto matic. Vezmeme-li například matice E2 = 1 0 0 1 a B = 1 1 0 1 , pak zřejmě |E2| = |B| a h(E2) = h(B) a |E2 − λE2| = |B − λE2| , ale matice E2 a B evidentně nejsou podobné, protože pro každou regulární matici S řádu dva je S−1 · E2 · S = E2 , což znamená, že matice E2 je podobná pouze sama sobě. Jak již bylo řečeno, všechny matice dané lineární transformace ϕ jsou navzájem podobné. Z předchozí věty potom plyne, že determinant (resp. hodnost, resp. charakteristický polynom) všech matic dané lineární transformace ϕ je vždy stejný. Vidíme tedy, že tyto pojmy závisí pouze na lineární transformaci samotné, nikoliv na její konkrétní matici v jisté bázi. Z tohoto zjištění pak plyne korektnost následujícího pojmu a věty. Definice. Nechť ϕ je lineární transformace vektorového prostoru V a nechť A je matice lineární transformace ϕ (v jisté bázi prostoru V ). Pak charakteristický polynom matice A, tj. |A − λEn|, se nazývá charakteristický polynom lineární transformace ϕ. Věta 2.8. Nechť ϕ je lineární transformace vektorového prostoru V a nechť A je matice lineární transformace ϕ (v jisté bázi prostoru V ). Pak platí : dim Im ϕ = h(A) , 99 Důkaz. Nechť A je matice lineární transformace ϕ v bázi u1, . . . , un. Podle věty 1.2. 2., vektory ϕ(u1), . . . , ϕ(un) jsou generátory podprostoru ϕ(V ) = Im ϕ, přičemž souřadnice těchto vektorů v bázi u1, . . . , un tvoří po řadě řádky matice A , tj. transponované matice k matici A. Přiřadíme-li nyní každému vektoru z V uspořádanou n-tici jeho souřadnic v bázi u1, . . . , un, dostaneme izomorfismus prostoru V na prostor Tn , pomocí něhož již lehce ukážeme, že h(A ) = dim Im ϕ (rozmyslete si podrobně sami!). Ale h(A ) = h(A), a tedy dostáváme, že dim Im ϕ = h(A). 100 §3. Vlastní vektory a vlastní hodnoty Definice. Nechť ϕ je lineární transformace vektorového prostoru V . Podprostor U vektorového prostoru V se nazývá invariantní podprostor vzhledem k ϕ, je-li: ϕ(U) ⊆ U , tzn. pro libovolný vektor x ∈ U platí ϕ(x) ∈ U. Příklad 3.1. Nechť V je libovolný pevný vektorový prostor nad T. Uvažme : 1. Identickou lineární transformaci idV : V → V . Pak zřejmě každý podprostor U ve V je invariantní vzhledem k idV . 2. Nulovou lineární transformaci ω : V → V (definovanou ω(x) = o pro ∀x ∈ V ). Pak opět každý podprostor U ve V je invariantní vzhledem k ω. 3. Libovolnou lineární transformaci ϕ : V → V . Pak triviální podprostory ve V (tzn. podprostory {o} a V ) jsou invariantní vzhledem k ϕ. Příklad 3.2. Ve vektorovém prostoru R2 uvažme podprostor U = {(x, 0) | x ∈ R} a dále uvažme dvě lineární transformace ϕ a ψ prostoru R2 definované: ϕ (x1, x2) = (x1 + x2, 0) a ψ (x1, x2) = (x2, x1) pro každé (x1, x2) ∈ R2 . Lehce se ověří, že U je invariantní podprostor vzhledem k ϕ, zatímco tentýž podprostor U není invariantním podprostorem vzhledem k ψ (neboť například (1, 0) ∈ U, ale ψ (1, 0) = (0, 1) ∈ U). Poznámka. V příkladu 3.1. jsou uvedeny speciální, triviální případy. Uvědomme si, že obecně podprostor U může, ale nemusí být invariantní vzhledem k ϕ a dále, že podprostor, který je invariantní vzhledem k jedné lineární transformaci, nemusí být invariantní vzhledem k jiné lineární transformaci (viz příklad 3.2.). Vidíme tedy, že pojem invariantního podprostoru je vždy vázán na pevnou lineární transformaci. Další příklady obecných konstrukcí invariantních podprostorů (vzhledem k ϕ) nám ukáží následující dvě věty. Věta 3.1. Nechť ϕ je lineární transformace prostoru V . Pak jádro Ker ϕ a obraz Im ϕ jsou invariantními podprostory vzhledem k ϕ. Důkaz. Podle věty 1.5. jsou Ker ϕ i Im ϕ podprostory ve V . Ukážeme jejich invariantnost vzhledem k ϕ. Nechť u ∈ Ker ϕ . Pak ϕ(u) = o ∈ Ker ϕ, a tedy Ker ϕ je invariantní vzhledem k ϕ. Dále nechť u ∈ Im ϕ . Zřejmě je u ∈ V . Pak ale ϕ(u) ∈ ϕ(V ) = Im ϕ, a Im ϕ je tedy invariantní vzhledem k ϕ. Věta 3.2. Nechť ϕ je lineární transformace prostoru V a nechť U1, . . . , Uk jsou podprostory ve V , které jsou invariantní vzhledem k ϕ. Pak průnik (U1 ∩ · · · ∩ Uk) a součet (U1 + · · · + Uk) jsou invariantní podprostory vzhledem k ϕ. 101 Důkaz. Víme, že (U1 ∩ · · · ∩ Uk), resp. (U1 + · · · + Uk) jsou podprostory ve V . Dodážeme, že se v obou případech jedná o invariantní podprostory vzhledem k ϕ . a) Nechť u ∈ U1 ∩ · · · ∩ Uk libovolný. Pak u ∈ Ui a podle předpokladu ϕ(u) ∈ Ui pro každé i = 1, . . . , k. Tedy ϕ(u) ∈ U1 ∩· · ·∩Uk, což znamená, že U1 ∩· · ·∩Uk je invariantní podprostor vzhledem k ϕ. b) Nechť u ∈ U1 + · · · + Uk, tzn. u = u1 + · · · + uk, kde ui ∈ Ui. Pak : ϕ(u) = ϕ(u1 + · · · + uk) = ϕ(u1) + · · · + ϕ(uk) ∈ U1 + · · · + Uk , neboť podle předpokladu ϕ(ui) ∈ Ui. Tedy U1 + · · · + Uk je invariantní podprostor vzhledem k ϕ. Důležitou roli při studiu lineárních transformací hrají jednodimenzionální invariantní podprostory. Z kapitoly o vektorových prostorech víme, že jednodimenzionální podprostor U ve vektorovém prostoru V (nad T) je generován jedním nenulovým vektorem u ∈ V , tzn. je pak : U = L(u) = {t · u | t ∈ T} . Máme-li navíc dánu lineární transformaci ϕ prostoru V , pak zřejmě podprostor U = L(u) je invariantní vzhledem k ϕ, právě když existuje číslo λ ∈ T tak, že ϕ(u) = λ·u, tzn. právě když se generátor u podprostoru U zobrazí na jistý svůj násobek (rozepište si podrobně sami!). A právě vektory tohoto typu se budeme v dalším zabývat. Definice. Nechť ϕ je lineární transformace vektorového prostoru V (nad T). Nechť u ∈ V , λ ∈ T splňují: u = o ∧ ϕ(u) = λ · u . Pak číslo λ se nazývá vlastní hodnota lineární transformace ϕ a vektor u se nazývá vlastní vektor lineární transformace ϕ příslušný vlastní hodnotě λ. Poznámka. Z předchozí definice ihned plyne, že je-li u vlastním vektorem lineární transformace ϕ, příslušným vlastní hodnotě λ, pak také každý nenulový vektor v ∈ L(u), tj. každý nenulový násobek vektoru u, je také vlastním vektorem lineární transformace ϕ, příslušným téže vlastní hodnotě λ . Příklad 3.3. Nechť V je libovolný pevný vektorový prostor nad T. Dále nechť : 1. idV : V → V je identická lineární transformace prostoru V . Pak zřejmě každý nenulový vektor z V je vlastním vektorem idV příslušným vlastní hodnotě λ = 1 (což je jediná vlastní hodnota idV ). 2. ω : V → V je nulová lineární transformace prostoru V . Pak každý nenulový vektor z V je vlastním vektorem transformace ω příslušným vlastní hodnotě λ = 0 (což je opět jediná vlastní hodnota ω). 3. ϕ : V → V je libovolná lineární transformace prostoru V . Pak všechny nenulové vektory z Ker ϕ (pokud existují) jsou vlastními vektory ϕ příslušnými vlastní hodnotě λ = 0. Přitom samozřejmě ϕ může obecně mít další vlastní hodnoty a jim odpovídající vlastní vektory. 102 Příklad 3.4. Nechť δ : Rn[x] → Rn[x] je lineární transformace derivování (viz příklad 1.3.). Bezprostředně je vidět, že polynomy stupně nula (tj. nenulové reálné konstantní polynomy) jsou vlastními vektory lineární transformace δ, příslušnými vlastní hodnotě λ = 0 a že žádné jiné vlastní hodnoty a vlastní vektory lineární transformace δ neexistují. Předchozí příklady vlastních hodnot a vektorů byly víceméně triviální. Úplný popis vlastních hodnot a vlastních vektorů lineární transformace v obecném případě podává následující věta. Věta 3.3. Nechť ϕ je lineární transformace vektorového prostoru V nad T. Pak : 1. vlastními hodnotami ϕ jsou právě všechny kořeny (patřící do T) charakteristického polynomu lineární transformace ϕ 2. je-li λ ∈ T vlastní hodnota ϕ, pak vlastní vektory ϕ příslušné λ jsou právě všechny nenulové vektory z podprostoru Ker (ϕ − λ · idV ) . Důkaz. Nejprve dokážeme 2. část věty a potom 1. část věty. 2: Nechť λ ∈ T je vlastní hodnota ϕ. Pak u ∈ V je vlastní vektor ϕ příslušný vlastní hodnotě λ, právě když: u = o ∧ ϕ(u) = λ · u. (1) Ale λ · u = λ · idV (u), a tedy po dosazení a úpravě (1) dostáváme ekvivalentní podmínku: u = o ∧ (ϕ − λ · idV )(u) = o. (2) Množina vektorů splňujících (2) je však rovna množině všech nenulových vektorů z podprostoru Ker (ϕ − λ · idV ) vektorového prostoru V . 1: Z právě dokázaného a z vět 2.8. a 1.7. plyne : λ je vlastní hodnota ϕ ⇐⇒ λ ∈ T ∧ Ker (ϕ − λ · idV ) = {o} ⇐⇒ ⇐⇒ λ ∈ T ∧ matice lineární transformace (ϕ − λ · idV ) je singulární. Je-li A maticí lineární transformace ϕ (v pevné bázi prostoru V ), pak zřejmě (A − λ · En) je maticí lineární transformace (ϕ − λ · idV ) v téže bázi. Tedy pak : λ je vlastní hodnota ϕ ⇐⇒ λ ∈ T ∧ |A − λ · En| = 0 , neboli λ ∈ T je kořenem charakteristického polynomu lineární transformace ϕ. Důsledek. Nechť ϕ je lineární transformace prostoru V , nechť A = (aij), 1 ≤ i, j ≤ n, je matice ϕ (v dané bázi prostoru V ) a nechť λ je vlastní hodnota ϕ. Pak vlastní vektory transformace ϕ příslušné λ (vyjádřené v dané bázi) jsou právě všechna nenulová řešení soustavy lineárních rovnic: (a11 − λ)x1 + a12x2 + · · · + a1nxn = 0 a21x1 + (a22 − λ)x2 + · · · + a2nxn = 0 ... an1x1 + an2x2 + · · · + (ann − λ)xn = 0 (3) 103 Důkaz. Nechť u1, . . . , un je daná báze V a nechť vektor u má v této bázi souřadnice (x1, . . . , xn), tj. u = x1 · u1 + · · · + xn · un. Pak po dosazení a úpravě dostáváme : (ϕ − λ · idV )(u) = ϕ(u) − λ · u = (a11−λ)x1 + a12x2 + · · · + a1nxn ·u1+ + a21x1 + (a22−λ)x2 + · · · + a2nxn ·u2 + · · · + an1x1 + an2x2 + · · · + (ann−λ)xn ·un . Podle předchozí věty je však u vlastním vektorem transformace ϕ příslušným vlastní hodnotě λ, právě když u = o a u ∈ Ker(ϕ − λ · idV ). Ale to vzhledem k předchozímu vyjádření nastane, právě když u je nenulový a jeho souřadnice splňují (3). Poznámka. 1. S problémem nalezení vlastních hodnot a vlastních vektorů se velmi často setkáváme při řešení praktických úloh, a to nejen v matematice, ale i v různých technických aplikacích. Uvědomme si však, že předchozí věta nám dává odpověď pouze na teoretické úrovni, neboť hledání vlastních hodnot převádí na hledání kořenů polynomu n-tého stupně, což je úloha, která obecně není algoritmicky řešitelná. Samozřejmě existuje pro hledání vlastních hodnot a vlastních vektorů řada numerických metod, které však zde nebudeme uvádět, neboť přesahují rámec tohoto kurzu. 2. Poznamenejme ještě, že z hlediska aplikací bývá výhodné sestavit z vlastních vektorů bázi prostoru V (pokud samozřejmě taková báze vůbec existuje), neboť potom se celá situace početně velmi zjednoduší. Důvodem je, že daná lineární transformace má pak v takové bázi diagonální matici. (Diagonální matice je čtvercová matice, v níž všude mimo hlavní diagonálu stojí samé nuly. Přitom v hlavní diagonále nuly být mohou, ale nemusí.) Skutečně, je-li u1, . . . , un báze prostoru V sestávající z vlastních vektorů lineární transformace ϕ příslušných vlastním hodnotám λ1, . . . , λn, pak je ϕ(u1) = λ1 · u1 , . . . , ϕ(un) = λn · un , a tedy matice lineární transformace ϕ v bázi u1, . . . , un má tvar :          λ1 0 0 · · · 0 0 0 λ2 0 · · · 0 0 0 0 λ3 · · · 0 0 ... ... ... ... ... ... 0 0 0 · · · λn−1 0 0 0 0 · · · 0 λn          . (4) Naopak, má-li lineární transformace ϕ v nějaké bázi u1, . . . , un diagonální matici tvaru (4), pak u1, . . . , un jsou zřejmě vlastními vektory lineární transformace ϕ příslušnými vlastním hodnotám λ1, . . . , λn (jak plyne ihned z definice matice lineární transformace). Následující úvahy nás přivedou k jedné dostatečné podmínce pro existenci výše popsané báze, tj. báze sestávající z vlastních vektorů dané lineární transformace. Věta 3.4. Nechť ϕ je lineární transformace prostoru V . Pak vlastní vektory lineární transformace ϕ příslušné navzájem různým vlastním hodnotám jsou lineárně nezávislé. 104 Důkaz. Nechť u1, . . . , uk jsou vlastní vektory lineární transformace ϕ příslušné navzájem různým vlastním hodnotám λ1, . . . , λk. Z posloupnosti vektorů u1, . . . , uk vybereme libovolnou maximální lineárně nezávislou posloupnost. Bez újmy na obecnosti lze předpokládat, že ji tvoří například prvních r vektorů, tj. u1, . . . , ur. Zřejmě je 1 ≤ r ≤ k. Dále pokračujme sporem. Předpokládejme, že r < k. Pak lze ale psát: ur+1 = r i=1 ti · ui, ti ∈ T, (5) odkud po vynásobení číslem λr+1 dostáváme: λr+1 · ur+1 = r i=1 λr+1 · ti · ui. Současně však je: λr+1 · ur+1 = ϕ(ur+1) = ϕ r i=1 ti · ui = r i=1 ti · λi · ui. Porovnáním pravých stran pak dostáváme: r i=1 λr+1 · ti · ui = r i=1 ti · λi · ui, odkud: r i=1 ti · (λr+1 − λi) · ui = o. Z předpokládané lineární nezávislosti vektorů u1, . . . , ur však plyne, že ti ·(λr+1 −λi) = 0 pro i = 1, . . . , r. Podle předpokladu věty je však λr+1 − λi = 0, a tedy musí být ti = 0 pro i = 1, . . . , r. Po dosazení do (5) pak dostáváme, že ur+1 = o, což je ale spor s definicí vlastního vektoru. Je tedy r = k, tzn. vektory u1, . . . , uk jsou lineárně nezávislé. Důsledek. Nechť ϕ je lineární transformace n-dimenzionálního vektorového prostoru V , která má n navzájem různých vlastních hodnot. Pak matice lineární transformace ϕ v bázi sestávající z vlastních vektorů příslušných těmto vlastním hodnotám je diagonální. Důkaz. Nechť u1, . . . , un jsou vlastní vektory příslušné navzájem různým vlastním hodnotám λ1, . . . , λn lineární transformace ϕ. Pak podle předchozí věty vektory u1, . . . , un tvoří bázi prostoru V a tvrzení důsledku ihned plyne z 2. části poslední poznámky. 105 §4. Ortogonální zobrazení, ortogonální matice V tomto paragrafu se vrátíme k euklidovským vektorovým prostorům a budeme studovat vzájemné vztahy mezi nimi. Použijeme k tomu lineárních zobrazení, která však navíc budou "zachovávat skalární součin". Definice. Nechť V , V jsou euklidovské vektorové prostory. Nechť ϕ : V → V je lineární zobrazení, pro něž platí: u · v = ϕ(u) · ϕ(v) pro každé u, v ∈ V . Pak ϕ se nazývá ortogonální zobrazení euklidovského prostoru V do V . Je-li navíc zobrazení ϕ bijektivní, pak se nazývá izomorfismus euklidovského prostoru V na V a euklidovské prostory V , V se nazývají izomorfní. Je-li speciálně V = V , pak se ortogonální zobrazení ϕ nazývá ortogonální transformace euklidovského prostoru V . Podmínku "zachování skalárního součinu" z předchozí definice je možné pro lineární zobrazení vyjádřit několika ekvivalentními způsoby, jak ukazuje následující věta. Věta 4.1. Nechť V , V jsou euklidovské prostory a ϕ : V → V je lineární zobrazení. Pak následující výroky jsou ekvivalentní: 1. u · v = ϕ(u) · ϕ(v) pro každé u, v ∈ V , 2. u = ϕ(u) pro každé u ∈ V , 3. jsou-li u1, . . . , uk ortonormální vektory ve V , pak ϕ(u1), . . . , ϕ(uk) jsou ortonormální vektory ve V . Důkaz. "1 ⇒ 2": Nechť platí 1 a nechť u ∈ V . Pak (užitím 1) dostáváme : u 2 = u · u = ϕ(u) · ϕ(u) = ϕ(u) 2 , odkud pak u = ϕ(u) . "2 ⇒ 3": Nechť platí 2 a nechť u1, . . . , uk jsou ortonormální vektory ve V . Nechť i, j = 1, . . . , k. Pak (užitím 2) : – pro i = j platí : ϕ(ui) · ϕ(ui) = ϕ(ui) 2 = ui 2 = 1 – pro i = j platí : 2 · ϕ(ui) · ϕ(uj) = ϕ(ui + uj) · ϕ(ui + uj) − ϕ(ui) · ϕ(ui) − ϕ(uj) · ϕ(uj) = = ϕ(ui+uj) 2 − ϕ(ui) 2 − ϕ(uj) 2 = ui+uj 2 − ui 2 − uj 2 = 2·ui·uj = 0 odkud tedy plyne, že ϕ(ui) · ϕ(uj) = 0 . Dohromady dostáváme, že vektory ϕ(u1), . . . , ϕ(uk) jsou ortonormální. 106 "3 ⇒ 1": Nechť platí 3 a u, v ∈ V . Je-li u = o, pak výrok 1 zřejmě platí. Nechť tedy u = o. Mohou nastat dva případy : α) Vektory u, v jsou lineárně nezávislé. Pak podle poznámky za větou 2.3., kap. IV., existují ortonormální vektory e1, e2 tak, že u = u1 · e1 + u2 · e2 a v = v1 · e1 + v2 · e2 . Podle 3 však ϕ(e1) , ϕ(e2) jsou ortonormální vektory a platí : ϕ(u) · ϕ(v) = ϕ(u1 · e1 + u2 · e2) · ϕ(v1 · e1 + v2 · e2) = u1v1 + u2v2 = u · v . β) Vektory u, v jsou lineárně závislé. Pak opět podle poznámky za větou 2.3., kap. IV., existuje normovaný vektor e tak, že u = t · e a v = s · e . Podle 3 je vektor ϕ(e) normovaný a platí: ϕ(u) · ϕ(v) = ϕ(t · e) · ϕ(s · e) = t · s = (t · e) · (s · e) = u · v . Dohromady tak dostáváme, že platí 1. Věta 4.2. (Věta o izomorfismu euklidovských prostorů) Dva euklidovské prostory jsou izomorfní, právě když mají stejnou dimenzi. Důkaz. Nechť V , V jsou euklidovské prostory. Dokážeme postupně obě implikace. "⇒": Nechť V , V jsou izomorfní (ve smyslu izomorfismu euklidovských prostorů). Pak jsou V , V izomorfní jako vektorové prostory a podle věty o izomorfismu vektorových prostorů je dim V = dim V . "⇐": Nechť dim V = dim V = n. Je-li n = 0, pak zřejmě V a V jsou oba nulovými euklidovskými prostory a jsou tedy zřejmě izomorfní. Nechť tedy n ≥ 1 a nechť : e1, . . . , en je ortonormální báze V a e1, . . . , en je ortonormální báze V . Nechť u ∈ V je libovolný vektor, přičemž : u = u1 · e1 + · · · + un · en . Položme nyní : ϕ(u) = u1 · e1 + · · · + un · en . Pak ϕ je zřejmě zobrazení prostoru V do V , o němž se rozepsáním lehce ověří, že je bijektivní a že je lineárním zobrazením (proveďte si sami !). Navíc je : ϕ(u) 2 = ϕ(u)·ϕ(u) = n i=1 ui · ei · n j=1 uj · ej = u1u1 + · · · + unun = u·u = u 2 , tzn. ϕ(u) = u , a tedy ϕ je podle věty 4.1. ortogonální zobrazení. Dohromady pak dostáváme, že ϕ je izomorfismus euklidovského prostoru V na V . Podmínka zachovávání skalárního součinu, požadovaná v definici ortogonálního zobrazení ϕ je poměrně velmi silná. Následující věta ukáže, že tato podmínka vynutí injektivnost zobrazení ϕ . 107 Věta 4.3. Nechť V , V jsou euklidovské prostory a nechť ϕ : V → V je ortogonální zobrazení. Pak ϕ je injektivní zobrazení. Důkaz. Injektivnost zobrazení ϕ budeme tentokrát dokazovat pomocí věty 1.6., tzn. budeme dokazovat, že jádro Ker ϕ = {o} . Přitom zřejmě stačí dokázat inkluzi "⊆" . Nechť tedy x ∈ Ker ϕ, tzn. ϕ(x) = o . Pak podle věty 4.1. je: x = ϕ(x) = o = 0 , a tedy, podle věty 1.4. 1., kap. IV., je x = o. Dostáváme tak, že Ker ϕ = {o}, odkud podle věty 1.6. plyne, že ϕ je injektivní zobrazení. Ve zbývající části tohoto paragrafu se budeme zabývat ortogonálními transformacemi daného euklidovského prostoru V . Je-li speciálně V = {o} nulový euklidovský prostor, pak zřejmě jedinou možnou ortogonální transformací prostoru V je identické zobrazení. Tento triviální případ nebudeme v dalším uvažovat a budeme se zabývat pouze ortogonálními transformacemi nenulového euklidovského prostoru V . Některé základní vlastnosti ortogonální transformace nenulového euklidovského prostoru popisuje následující věta. Věta 4.4. Nechť ϕ : V → V je ortogonální transformace euklidovského prostoru V . Pak platí: 1. ϕ je bijektivní zobrazení 2. inverzní zobrazení ϕ−1 je ortogonální transformací prostoru V 3. je-li λ vlastní hodnota ortogonální transformace ϕ, pak λ = ±1. Důkaz. 1: Plyne přímo z věty 4.3. a věty 2.1. 2: Podle právě dokázaného bodu 1. je ϕ bijektivním lineárním zobrazením. Potom podle věty 1.3. 2. je ϕ−1 : V → V izomorfizmem vektorového prostoru V , tzn. ϕ−1 je bijektivním lineárním zobrazením. Zbývá tedy dokázat, že ϕ−1 splňuje podmínku z definice ortogonálního zobrazení, tj. "zachovává skalární součin". Nechť u, v ∈ V libovolné. Označme ϕ−1 (u) = a, ϕ−1 (v) = b. Potom je ϕ(a) = u, ϕ(b) = v a platí (s využitím faktu, že ϕ je ortogonálním zobrazením) : u · v = ϕ(a) · ϕ(b) = a · b = ϕ−1 (u) · ϕ−1 (v) , tzn. dostáváme, že ϕ−1 je ortogonální transformace euklidovského prostoru V . 3: Nechť λ je vlastní hodnota ortogonální transformace ϕ (tj. musí být λ ∈ R) a nechť u je vlastní vektor ϕ příslušný vlastní hodnotě λ. Pak je ϕ(u) = λ · u a u = o , odkud : u · u = ϕ(u) · ϕ(u) = (λ · u) · (λ · u) = λ2 · (u · u) . Ale u · u = 0 (poněvadž u = o), a tedy musí být λ2 = 1 , neboli λ = ±1 . Každá ortogonální transformace (euklidovského) prostoru V je zřejmě lineární transformací tohoto (vektorového) prostoru V , a tedy můžeme sestrojit její matici v nějaké dané bázi prostoru V , speciálně například v dané ortonormální bázi prostoru V . Ukážeme, že v takovém případě bude pak mít tato matice jistý speciální tvar. 108 Definice. Nechť A je čtvercová matice nad R taková, že A je regulární a platí A−1 = A (tj. inverzní matice je rovna matici transponované). Pak matice A se nazývá ortogonální matice. Věta 4.5. Nechť A je čtvercová matice řádu n nad R. Pak následující výroky jsou ekvivalentní : 1. A je ortogonální matice 2. A · A = En 3. A · A = En . Důkaz. Věta plyne bezprostředně z definice ortogonální matice, definice inverzní matice a poznámky za větou 3.8., kapitoly II. Věta 4.6. Nechť A, B jsou ortogonální matice řádu n. Pak platí: 1. A · B je ortogonální matice 2. A−1 je ortogonální matice 3. |A| = ±1. Důkaz. 1: tvrzení dokážeme užitím 2. části předchozí věty. Platí : (A · B) · (A · B) = A · (B · B ) · A = A · En · A = A · A = En, odkud podle věty 4.5. dostáváme, že A · B je ortogonální maticí. 2: ověříme definici ortogonální matice pro matici A−1 . S využitím věty 3.9. 4. , kapitoly II. dostáváme: (A−1 )−1 = (A )−1 = (A−1 ) což znamená, že matice A−1 je ortogonální. 3: víme, že |A| = |A |, tzn. pak z věty 4.5. a z Cauchyovy věty dostáváme: 1 = |En| = |A · A | = |A| · |A | = |A|2 , odkud ihned plyne, že |A| = ±1 . Důsledek. Množina všech ortogonálních matic řádu n s operací násobení matic je grupou, která je pro n ≥ 2 nekomutativní. Důkaz. První část důsledku plyne z předchozí věty, uvědomíme-li si navíc, že násobení matic je asociativní a že jednotková matice En je ortogonální. Dále nechť n ≥ 2. Vezměme matice A, B řádu n tvaru: A =          1 0 0 · · · 0 0 0 −1 0 · · · 0 0 0 0 −1 · · · 0 0 ... ... ... ... ... ... 0 0 0 · · · −1 0 0 0 0 · · · 0 −1          , B =          0 0 · · · 0 0 1 0 0 · · · 0 1 0 0 0 · · · 1 0 0 ... ... ... ... ... ... 0 1 · · · 0 0 0 1 0 · · · 0 0 0          . 109 Potom zřejmě matice A, B jsou ortogonální, a platí A · B = B · A (ověřte si sami výpočtem – počítejte přitom prvek v prvním řádku a n - tém sloupci obou součinů matic). Tedy uvažovaná grupa je pro n ≥ 2 nekomutativní. Věta 4.7. Nechť V je euklidovský prostor a ϕ : V → V je lineární transformace. Pak ϕ je ortogonální transformace ⇐⇒ matice transformace ϕ v ortonormální bázi prostoru V je ortogonální. Důkaz. Nechť e1, . . . , en je ortonormální báze prostoru V a nechť A = (aij) je matice lineární transformace ϕ v této bázi e1, . . . , en . Dokážeme postupně obě implikace. "⇒": Nechť ϕ je ortogonální transformace euklidovského prostoru V . Pak podle věty 4.1. jsou vektory ϕ(e1), . . . , ϕ(en) ortonormální. Označme A · A = (bij). Pak platí : ϕ(ei) · ϕ(ej) = (a1i · e1 + · · · + ani · en) · (a1j · e1 + · · · + anj · en) = n k=1 aki · akj = bij, odkud plyne, že bij = 1 pro i = j, resp. bij = 0 pro i = j. Tedy A · A = En a podle věty 4.5. je pak matice A ortogonální. "⇐": Nechť matice A je ortogonální, tzn. platí (dle věty 4.5. 3.): n k=1 aki · akj = 1 pro i = j 0 pro i = j (1) Nechť dále u ∈ V libovolný, přičemž u = n i=1 ui · ei. Potom je: u 2 = u · u = n i=1 u2 i . Dále je: ϕ(u) = n i=1 ui · ϕ(ei) = n i=1 ui · n k=1 aki · ek = n k=1 n i=1 akiui · ek, odkud rozepsáním a úpravou (užitím ortonormálnosti vektorů e1, . . . , en) dostáváme : ϕ(u) 2 = ϕ(u) · ϕ(u) = . . . = n i=1 n j=1 n k=1 akiakj uiuj , tzn. po dosazení z (1) je pak: ϕ(u) 2 = n i=1 u2 i . Dohromady potom dostáváme, že u 2 = ϕ(u) 2 , neboli u = ϕ(u) , což znamená, že ϕ je ortogonální transformace. 110 Rejstřík báze vektorového prostoru, 16 dimenze vektorového prostoru, 18 generátory podprostoru, 8 konečnědimenzionální vektorový prostor, 18 lineární kombinace vektorů, 5 lineární nezávislost vektor ‌u, 12 lineární obal vektorů, 5 lineární závislost vektor ‌u, 12 nekonečnědimenzionální vektorový prostor, 18 netriviální podprostory, 5 nulový vektor, 1 nulový vektorový prostor, 3 opačný vektor k vektoru u, 1 přímý součet podprostorů, 10 podprostor generovaný množinou, 8 podprostor generovaný vektory, 8 podprostor vektorového prostoru, 4 součet podprostorů, 9 součin čísla t s vektorem u, 1 souřadnice vektoru, 22 Steinitzova věta o výměně, 14 transformace souřadnic, 23 triviální podprostory, 5 vektorový prostor nad tělesem T, 1 111