FI: PODZIM 2009 Verze: 14. května 2010
Přednášky k předmětu MB 101
Přednášející: Roman Šimon Hilscher
Obsah
Přehled přednášek podle strany ukončení iv
1. Čísla a číselné obory 1
1.1. Číselné obory 1
1.2. Vlastnosti sčítání a násobení 1
2. Základy kombinatoriky 2
2.1. Motivace 2
2.2. Uspořádaný výběr (variace) 2
2.3. Neuspořádaný výběr (kombinace) 3
2.4. Výběr obsahující prvky dvou (a více) druhů 4
3. Elementární pravděpodobnost 6
3.1. Náhodné jevy 6
3.2. Pravděpodobnost 7
3.3. Podmíněná pravděpodobnost 8
3.4. Nezávislost náhodných jevů 10
3.5. Geometrická pravděpodobnost 13
4. Elementární geometrie 14
4.1. Rovina K2 14
4.2. Přímky v rovině 14
4.3. Lineární zobrazení a matice 15
4.4. Euklidovská rovina 16
4.5. Obsah trojúhelníka 17
4.6. Obsah mnohoúhelníka 18
4.7. Viditelnost v rovině 18
5. Relace a zobrazení 20
5.1. Relace mezi množinami 20
5.2. Skládání relací a funkcí 22
5.3. Relace na množině 23
5.4. Supremum a infimum v uspořádaných množinách 24
5.5. Rozklad podle ekvivalence 26
6. Řešení systému lineárních rovnic 28
6.1. Ekvivalentní systémy 29
6.2. Systém ve schodovitém tvaru (Gaussova eliminace) 31
6.3. Gauss Jordánova eliminace 32
6.4. Homogenní systémy 33
7. Vektory 35
7.1. Vektory v Rn 35
ii
7.2. Lineární kombinace vektorů v IRn 36
7.3. Systémy lineárních rovnic II 37
7.4. Lineární (ne)závislost vektorů v IRn 37
8. Matice a maticový počet 41
8.1. Matice 41
8.2. Systémy lineárních rovnic III 42
8.3. Součin matic 43
8.4. Čtvercové matice 44
8.5. Mocniny matic 46
8.6. Inverzní matice 46
8.7. Komutující matice 49
8.8. Transponovaná matice 49
8.9. Symetrické matice 49
8.10. Systémy lineárních rovnic IV 51
8.11. Výpočet inverzní matice 55
8.12. Hodnost matice 57
8.13. Systémy lineárních rovnic V 58
8.14. Lineární (ne)závislost vektorů pomocí matice 59
9. Determinanty 61
9.1. Definice determinantu 61
9.2. Vlastnosti determinantů 64
9.3. Lineární (ne)závislost vektorů pomocí determinantu 68
9.4. Adjungovaná matice a výpočet inverze 68
9.5. Systémy lineárních rovnic VI - Kramerovo pravidlo 70
10. Vektorové prostory 72
10.1. Definice a příklady 72
10.2. Lineární (ne)závislost vektorů 74
10.3. Podprostory 76
10.4. Jádro a obraz matice, řádkový prostor 77
10.5. Generování podprostorů 79
10.6. Báze a dimenze 80
10.7. Souřadnice a změna báze 83
10.8. Lineární zobrazení mezi vektorovými prostory 88
10.9. Maticová reprezentace lineárních zobrazení 91
10.10. Lineární transformace vektorového prostoru 94
10.11. Podobnost matic 96
11. Euklidovský prostor 98
11.1. Skalární součin v IRn 98
11.2. Ortogonální podprostory v IRn 100
11.3. Ortogonální doplněk v IRn 101
11.4. Fundamentální podprostory matice 103
12. Obecné vektorové prostory se skalárním součinem 106
12.1. Definice a příklady 106
12.2. Normované vektorové prostory 109
12.3. Problém nej menších čtverců 111
12.4. Ortogonální podmnožiny a podprostory 115
12.5. Ortogonální matice 120
12.6. Projekce vektoru na podprostor 122
12.7. Gram-Schmidtův ortogonalizační proces 125
13. Vlastní hodnoty a vlastní vektory 129 13.1. Definice a příklady 129
iii
13.2. Struktura charakteristického polynomu 134
13.3. Lineární nezávislost vlastních vektorů 136
13.4. Další základní vlastnosti 137
13.5. Báze z vlastních vektorů 140
13.6. Diagonalizovatelné matice 141
13.7. Mocniny diagonalizovatelných matic 144
13.8. Cayley-Hamiltonova věta 146
13.9. Iterované procesy 147
13.10. Symetrické matice 150
13.11. Pozitivně a negativně definitní a semidefinitní matice 154 Reference 157
přehled přednášek podle strany ukončení
Konec 1. přednášky (21.9.2009) . Konec 2. přednášky (5.10.2009) . Konec 3. přednášky (12.10.2009) Konec 4. přednášky (19.10.2009) Konec 5. přednášky (26.10.2009) Konec 6. přednášky (2.11.2009) . Konec 7. přednášky (9.11.2009) . Konec 8. přednášky (16.11.2009) Konec 9. přednášky (23.11.2009) Konec 10. přednášky (30.11.2009) Konec 11. přednášky (7.12.2009) Konec 12. přednášky (14.12.2009) Konec dokumentu ...................
1
1. čísla a číselné obory
1.1. Číselné obory.
N přirozená čísla
N = {1,2,3,...} (bez nuly!)
Formálně lze zkonstruovat z prázdne množiny, ozn.
0 := { }, prázdná množina
1 := {0} = {{ }}, jednoprvková množina.
2 := {0,1} = j{ },{{}}}> dvouprvková
množ ma.
n + 1 := {0,1, 2,..., n}, n + 1-prvková množina.
Umíme +, ., uspořádat (m < n def. jako m G n, případně m < n def. jako m = n nebo m E n). Z celá čísla
Z = {0,±1,±2,±3,...}
Umíme +, ., <, navíc —. Q racionální čísla (zlomky)
Q = {f, m e Z, n e N}
Umíme +, ., <, —, navíc : , obsahují „mezery". IR reálná čísla (všechny body na přímce) C komplexní čísla
1.2. Vlastnosti sčítání a násobení.
(a + b) + c = a + (b + c) asociativní zákon a + b = b + a komutativní zákon 3 (existuje) prvek 0 tak, že a + 0 = a nulový prvek k + V (pro všechny) a existuje prvek —a tak, že a + {—a) = 0 opačný prvek Tyto vlastnosti definují (komutativní) grupu.
(a.b).c = a.(b.c) asociativní zákon a.b = b.a komutativní zákon 3 prvek 1 tak, že a.l = a jednotkový prvek k . a.(b + c) = a.b + a.c distributivní zákon Tyto vlastnosti definují (komutativní) okruh.
Va^O existuje prvek a-1 tak, že a.a^1 = 1 inverzní prvek Tyto vlastnosti definují (komutativní) těleso.
2
2. základy kombinatoriky
2.1. Motivace. Základní kombinatorické pravidlo: z m různých (=rozlišitelných) prvků {a±,..., am} a n různých prvků ..., bn} lze vytvořit m.n párů (ai} bj) obsahujících jeden prvek z každé skupiny.
Pro trojice (až r-tice) platí obdobné pravidlo: {q,,..., q} dává m.n.l trojic (a^, q,).
V praktických příkladech používáme následující reformulaci: Pokud vybíráme fc-krát za sebou, přičemž v i-tém kroku je n,i různých možností, potom je celkem n1.n2 ...n^ různých výsledků.
Příklad 1.
(a) Lidé - pohlaví (m, ž) 2, stav (svobodný, ženatý, rozvedený, ovdovělý) 4, profese (...) řekněme 17. Tedy celkem je 2.4.17=136 různých kategorií.
(b) Umisťujeme k (rozlišitelných) koulí do n (rozlišitelných) přihrádek. Pro každou kouli je n možností, tedy celkem n.n „ . n = nk možností. □
fc—krát
2.2. Uspořádaný výběr (variace). Z n prvků {a1;..., an} vybíráme uspořádané fc-tice
iah ■>■■■■> aík)
(pro jednoduchost, např. postupně po jednom prvku). Pak máme dvě možnosti:
(i) výběr s opakováním
- v každém kroku vybíráme z celé skupiny
- celkem je
V(n, k) := n.n .. .n = nk
možností
(ii) výběr bez opakování
- vybíraný prvek už není v dané skupině přítomen, nelze ho už vybrat podruhé celkem je
v(n, k) = (n)^ := n.(n — l).(n — 2)... (n — k + 1)
možností
- pro k > n položíme (n)k '■= 0 (nelze vybrat např. 3 prvky z dvouprvkové množiny, aniž bychom se opakovali)
Speciálním případem variace je permutace pro k = n, neboli permutace je uspořádaný výběr n prvků z n prvků (bez opakování),
p(n) = v(n, n) = (n)n = n.(n — l).(n — 2)... (n — n + 1) = n\
možností. Dodefinujme 0! := 1.
Příklad 2. Uspořádání 3-prvkové množiny, celkem 3! = 6 možností
123 132 213 231 312 321.
□
2.3. Neuspořádaný výběr (kombinace). Nezáleží na pořadí prvků, ale jen na tom, zda byl daný prvek vybrán. Tj., kolika způsoby lze vybrat k prvků z celkem n prvků?
(i) Kombinace bez opakování - Záleží-li na pořadí, pak máme (n)^ možností. Nechceme ale rozlišovat těch k\ možností, kdy mají vybrané prvky pouze různá pořadí. Proto je celkem
(n)k n.(n — 1)... (n — k + 1) n\ írr
C^'^ '" k\ k\ {n-k)\.k\ \ky
možností. Dostáváme tzv. kombinační číslo (též binomický koeficient). Udává také koeficient v binomickém rozvoji výrazu (a + b)n,
(a + b)n = an + n cŕ^b + n(n - 1) an~2&2 + • • • + n ab^1 + bn
^),. + Q^+0a»-v + ... + (n!i)a,-1 + (;:),
£ (ľ)
h—n \ /
fc=0
Vlastnosti kombinačních čísel
'n\ í n \ ín + l\ ín\ í n k) = \n-k), \k + l) = \k) + \k + 1
jr Q = t (a = b = i), J2k(nk)=nr^ (indukcí)-
k=0 ^ ' k=0 ^ '
Pascalův trojúhelník
n = 0 Q 1
1 Q C) 1 1
2 () (?) g) 12 1
3 () (S (S () 13 3 1
- = 4 (Ž) (í) (í) S) (í) 1 4 6 4 1
« = 5 (o) (D (D (S (D © 1 5 10 10 5 1
(ii) Kombinace s opakováním - neuspořádaný výběr k prvků z celkem n prvků, přičemž každý prvek můžeme brát vícekrát
'5 96
O O O O
původních n prvků, k — 1 žolíků, každý již
vybíráme po jednom + vybraný prvek je
exempláři z nich dále zastoupen
žolíkem
celkem n + k — 1 prvků, z nichž vybíráme k prvků
Celkem je tedy
C(n, k)
možností.
n + k — 1 k
Nebo: Prvky umístíme do posloupnosti (původně n přihrádek)
• o • /. O O
•l 0 0 0 •2 0
n + k — 1 prvků
Potřebujeme nyní akorát vědět, kolik prvků je v každé přihrádce, tedy C(n, k) je počet umístění n — 1 přihrádek, tedy
'n + k — I" n — 1
C(n,fc)
Příklad 3. Kolik řešení má v N rovnice
xi + x2 H-----V xk = rů (1)
Nejprve v Z+ := N U {0}. Každé řešení (yi,V2, ■ ■ ■ ,Vk) splňující rovnici (1) můžeme popsat jako posloupnost 1 a 0:
mm o i_n o mínili o ... o 111^ ;
í/!-krát í/2-krát í/3-krát í/^-krát
ve které je celkem n jedniček a k — 1 nul. A naopak, každá taková posloupnost určuje nějaké řešení. Protože je celkem (Jl+k^1^ takových posloupností, je i přesně tolik řešení v Z+.
Pro řešení v N uvažme, že (xi,X2,..., xk) je řešení rovnice (1) pro Xi G N, právě když celá nezáporná čísla íji := Xi — 1 tvoří řešení (yi,y2, ■ ■ ■ ,Vk) v Z+ rovnice
Vi + Ví H-----Wk = n-k. (2)
Podle předchozí úvahy je počet těchto řešení
\n — k) + k — l\ ŕ n — l\ f n — V
n —k J \n — k J \k — l.
D
2.4. Výběr obsahující prvky dvou (a více) druhů. Nechť je k\ prvků 1. druhu a k2 prvků 2. druhu, přičemž prvky daného druhu jsou nerozeznatelné. Označme k := kľ + k2. Kolika způsoby lze uspořádat takovou množinu?
1. řešení - Prvky označíme čísly
1, 2,..., fci, fci + 1,..., fc . 1. druh 2. druh
Dostáváme k různých prvků, jejichž uspořádání je k\. Nerozlišujeme ale k\\ a A^! uspořádání v rámci daného druhu prvků, celkem je tedy
k\
k^k~2~\
možností.
2. řešení - Vybereme kľ pozic z celkového počtu k pozic, na které umístíme prvky 1. druhu (zbytek obsadí prvky 2. druhu), tedy máme (^) možností. Nebo naopak, (^) možností.
Nechť ki + k2 + - ■ - + km = n, kde k,i G N. Počet způsobů, jakým lze n prvků rozdělit na posloupnost m částí, z nichž 1. část obsahuje kľ prvků, 2. část k2 prvků, ..., m-tá část km prvků, je
P(fci, k2,..., km) = . '—t—..
fci! k2l ... km\
5
Toto číslo se nazývá multinomický koeficient (pro m = 2 máme binomický koeficient), též permutace s opakováním.
6
3. Elementární pravděpodobnost
3.1. Náhodné jevy. Elementární jevy jsou možné výsledky náhodného pokusu, tvoří tzv. základní prostor. V tomto předmětu budeme uvažovat pouze konečně mnoho elementárních jevů.
íž (omega) základní prostor - neprázdná množina možných výsledků náhodného pokusu. Tedy
í) = {o01,002, ■ ■ - ,Un}-
A jevové pole - systém podmnožin základního prostoru Q s určitými vlastnostmi. Vzhledem ke konečnosti množiny Q budeme vždy uvažovat systém všech podmnožin.
A,B,C,... náhodné jevy (prvky množiny A), tedy A,B,C C fž.
Příklad 4. Házíme kostkou, fž = {ooi,oo2, ■ ■ ■ tj. padne číslo 1,2,... ,6. Necht
A = {ujx,002,003} padne číslo menší než 4.
B = {^,^3,^5} padne liché číslo.
C = {^,^2,^3,^4,^5} nepadne číslo 6.
□
Příklad 5. Házíme dvěmi kostkami (neboli házíme 2-krát jednou kostkou). Necht
A = {(oox,oo3), (002,002), (oo3,oo1)^ padne součet 4.
□
Příklad 6. Umístění 2 rozlišitelných koulí do 2 rozlišitelných přihrádek,
fi={ {ab,-}, {a,b}, {b,a}, {-,ab} } ... 4 prvky
'j0\ OO2 OO3 OO4
Necht
A = {002,003,004} první přihrádka má nejvýše jednu kouli,
B = {oo1} oo2, oo3} první přihrádka má alespoň jednu kouli,
C = {oo2, oo3} = A fl B první přihrádka má právě jednu kouli.
□
Příklad 7. Umístění 2 nerozlišitelných koulí do 2 rozlišitelných přihrádek,
Q = {{**,-},{*,*},{-,**}} ... 3 prvky
□
Příklad 8. Umístění 2 nerozlišitelných koulí do 2 nerozlišitelných přihrádek,
Q = {{**, —},{*, *}} ... 2 prvky
□
7
Příklad 9. Házíme kostkou do trávy,
í) = {i0l,UJ2, ■ ■ • ,^6,^7,^8};
kde cj7=kostka zůstane na hraně, cj8=zakutálí se. □
Vždy záleží na dohodě, konvenci, dané situaci, co se rozhodneme považovat za základní prostor. Terminologie náhodných jevů:
íž jev jistý
0, { } jev nemožný
{uj} elementární jev
A H B, C\i£iAi společné nastoupení náhodných jevů (průnik)
A U B, UieiAi nastoupení alespoň jednoho náhodného jevu (sjednocení)
A C B jev A má za důsledek jev B
A\B nastoupí jev A a současně nenastoupí jev B (rozdíl)
A H B = 0 Jevy A Si B jsou neslučitelné
Q \ A =: Ac jev opačný k jevu A (komplement)
3.2. Pravděpodobnost. Pravděpodobnost P je reálná funkce P : A —► IR s vlastnostmi
(i) nezáporná: P (A) > 0 VA G A,
(ii) aditivní: P (A U B) = P (A) + P (B) pro neslučitelné jevy A, B,
(iii) normovaná: P(íž) = 1.
V našem případě, kdy je fž konečná množina, je
Ml
P (A) = = relativní četnost.
kde \A\ je počet možných výsledků příznivých jevu A a |fž| je počet všech možných výsledků.
Nevylučujeme možnost, že nějaký elementární jev má nulovou pravděpodobnost. Takový jev pak lze teoreticky z množiny fž vypustit. Prakticky ale často neznáme pravděpodobnosti jednotlivých elementárních elementárních jevů, tedy ani nemusíme dopředu znát ty elementární jevy s kladnou pr avděp o dobnost í.
Příklad 10.
(a) Stejně jako v Příkladu 5 (házení 2 kostkami) je
3 1
A = padne součet 4, \A\ = 3, |í)| = 36, P(A) = — = —. p , i i , i i ' v ; 36 12
(b) Stejně jako v Příkladu 9 (házení kostkou do trávy) můžeme odhadnout, že
P{u)j) = 0.6 (zůstane na hraně) P(cl)8) = 0.1 (zakutálí se) P^) = ... = P(uj6) = 0.05
Dohromady je P({ui,..., uj$}) = 1. □
Klasická pravděpodobnost .. .všechny elementární jevy mají stejnou pravděpodobnost
Tedy Příklad 10(b) není klasická pravděpodobnost. V klasické pravděpodobnosti je pak pro náhodný jev A = {ujl7 ...,uk} = J2í=i p|
Základní pravidla:
P(AUB) < P(A) + P(B)
Je-li elementární jev u E A a, zároveň uj E B, potom je na pravé straně počítána jeho pravděpodobnost dvakrát. Proto je
P (A U B) = P (A) + P {B) - P (A n B). Pro více náhodných jevů se toto pravidlo nazývá jako princip inkluze a exkluze, viz skripta Věta 1.31.
Jsou-li A, B neslučitelné, tj. pokud je P (A fl B) = 0, pak je
P(AUB) = P(A) + P(B) (jak víme z definice pravděpodobnosti).
Hypergeometrické rozdělení - mnoho kombinatorických úloh vede na následující příklad. V množině o n prvcích je n\ bílých a ri2 = n — n\ černých. Náhodně vybereme k prvků (k = 1,..., n). Jaká je pravděpodobnost p,n že náhodně vybraná množina bude obsahovat právě i bílých prvků? (Zřejmě je i < min{ni, k}.)
Náhodně vybraná fc-tice obsahuje právě i bílých a k — i černých prvků. Bílé prvky lze vybrat (n3) způsoby, černé prvky lze vybrat (^) způsoby. Celkem je tady hledaná pravděpodobnost
Ví/ \k—íJ /o"\
P, = (3)
Příklad 11. (Kontrola kvality) Bedny s n výrobky procházejí kontrolou, kdy se náhodně z bedny vybírá k výrobků. Vadných výrobků (=bílé prvky) je v celé bedně ni - neznámý počet. V k náhodně vybraných výrobcích kontrola najde i vadných. Pak pravděpodobnost splňuje vztah (3), ze kterého lze odhadovat na základě vypozorovaných čísel velikost čísla ni (tzv. statistická analýza). □
3.3. Podmíněná pravděpodobnost.
Příklad 12. Populace N lidí obsahuje Na barvoslepých lidí a Nh žen. Necht
NA
A = náhodně vybraná osoba je barvoslepá P (A) = -j^r,
H = náhodně vybraná osoba je žena P{H) =
Zajímáme se o podmnožinu této polulace, jež tvoří pouze ženy. Nechť Nha Je počet barvoslepých žen. Pak je pravděpodobnost výběru barvoslepé ženy z populace žen rovna ^J1, neboli je to pravděpodobnost, že vybraná osoba je barvoslepá za podmínky, že je žena:
PU/H) - ^ - 5l _ P(AnH^ P{A/H) ~ NH ~ j£ " P{H)
U
Nechť H (hypotéza) je náhodný jev s kladnou pravděpodobností. Pro libovolný náhodný jev A definujeme
PWH) := (4, a čteme jako podmíněná pravděpodobnost jevu A za podmínky (nastoupení jevu) H. Jestliže mají všechny elementární jevy stejnou pravděpodobnost, pak je
jako v Příkladu 12.
\H\
Každý výběrový podsoubor lze považovat za samostatný soubor. Potom se podmíněná pravděpodobnost v rámci tohoto podsouboru stává normální pravděpodobností.
Příklad 13. Pojišťovna studuje výskyt pojistných událostí způsobených bleskem (jev A). Zřejmě má pojišťovna několik kategorií pojišťovaných objektů (průmyslové, rodinné domy, městské, venkovské, atd.). Ozn. jev H - škoda na průmyslovém objektu. Tedy škody bleskem způsobené bleskem na průmyslových objektech jsou pak chápány ve smyslu P(A/H).
Ovšem pro jinou pojišťovnu specializující se na průmyslové objekty je H celý základní prostor a P(A/H) se redukuje na P (A). □
Všechny věty pro pravděpodobnosti náhodných jevů lze chápat (=přepsat) do podmíněné pravděpodobnosti, protože lze vzít H jako nový základní prostor. Např.
P (A U B/H) = P(A/H) + P(B/H) - P (A H B/H).
Vztah (4) definující podmíněnou pravděpodobnost se často užívá ve tvaru
P (A r\H)= P(A/H).P(H).
Pro tři náhodné jevy A, B, C pak má tvar: (nejprve položne H := B fl C) p (A n B n C) = p (A f]h) = p(A/H).p(H)
= p(A/BnC).p(BnC) nyní položme H := C = p(A/B n C).P(B/H).P(H) Odvodili jsme tedy větu o násobení podmíněných pravděpodobností (pro 3 jevy)
p {a n B n c) = p{a/b n C).p{b/c).p{C).
(Pro více náhodných jevů analogicky.)
Nechť Hi,..., Hn jsou náhodné jevy, které se navzájem vylučují, ale jeden z nich určitě nastane (tj. Hi U • • • U Hn = Q). Pak libovolný náhodný jev A může nastat pouze tehdy, pokud nastane zároveň nějaký jev Hi, neboli
A = (An#i) u - --u (AnHn).
Protože jsou jevy A fl Hi navzájem neslučitelné, jejich pravděpodobnosti se sčítají, tj.
p(A) = YJP(AnHt).
Odvodili jsme tedy větu o celkové pravděpodobnosti
P(A) = 52P(A/Hi).P(Hi).
1=1
10
Příklad 14. Urna obsahuje n koulí (bílé, černé), počet bílých není znám, ale víme, že urna byla naplněna takto: 77-krát bylo hozeno mincí, padne-li hlava, vložíme bílou kouli, padne-li orel, vložíme černou kouli.
Z takto naplněné urny vybereme náhodně jednu kouli. Jaká je pravděpodobnost, že je bílá? Označme
A = vytažená koule je bílá,
Hi = urna obsahuje právě i bílých koulí, i = 0,1,..., n. Jevy Hi jsou po dvou neslučitelné,
PiHi) = ^, P(A/Ht) = %-
(z n-tice, kde je právě i bílých koulí, vytáhneme bílou kouli s pravděpodobností ^). Potom je podle věty o celkové pravděpodobnosti
n n . /n\
P{A) = YJP{A/Hl).P{Hl) = YJ1-.^-Uvážíme-li, že P(A/H0) = 0, dostaneme
n\ 1 ^ (n-1)!
p(a) = iri n] =lv_^li
y 1 2n ^ ra ' i\(n- i)\ 2n^(i-l)\
i=l
r
í=i y ' i=i v ' K '
1 / n — 1
2n ^ \ i - 1
j := i - 1 j = 0,. . ., 77 - 1
n — 1\ 1 „ -, 1
— ( . ) = — . 2n 1 = - ^samozřejmě).
2n ^—' \ i 2n 2
i=o
□
3.4. Nezávislost náhodných jevů. Obecně u podmíněné pravděpodobnosti neplatí vztah
P{A/H) = P{A)
(tj. podmíněná pravděpodobnost jevu A = absolutní pravděpodobnost jevu A). Jinak řečeno, znalost toho, zda nastoupí jev H nebo ne, ovlivňuje naši „sázku" na jev A.
Je-li P(A/H) = P (A), potom nastoupení jevu A nezávisí na nastoupení nebo nenastoupení jevu H (a tudíž i Hc). Protože P(A/H) = ^^p, dostáváme vztah
P(AnH) = P(A).P(H). Tento vztah je symetrický vzhledem k A a H, tedy můžeme definovat:
Dva náhodné jevy A, B jsou (stochasticky) nezávislé, jestliže
P(Af]B) = P(A).P(B).
Toto pravidlo je v souladu se základním kombinatorickým pravidlem o výběru prvků, viz Odstavec 2.1.
Příklad 15.
11
(a) Vybíráme kartu z balíčku 52 karet. Potom náhodné jevy „eso" (jev A) a „piky" (jev B) jsou intuitivně nezávislé. Skutečně,
P(A) = — = —, P(B) = — = -, P(AnB) = —, P(A).P(B) = —.- = —. 1 ; 52 13' v ; 52 4' v ; 52' u u 13 4 52
(b) Házíme dvakrát kostkou. Potom jevy „padne 6 v 1. hodu" (jev A) a „padne sudé číslo ve 2. hodu" (jev B) jsou nezávislé, protože
P(A HB) = P({62, 64, 66}) = A = _L P(A).P(B) = l-.l- = ^.
□
Jestliže nelze vyvodit závislost mezi jevy A a B, pak nelze vyvodit závislost ani mezi jevy A a Bc, neboli
A a, B jsou (ne)závislé <š=> A a, Bc jsou (ne)závislé
Ac a, B jsou (ne)závislé Ac a Bc jsou (ne)závislé.
Pozor! Pro 3 náhodné jevy A, 5, C, které jsou po dvou nezávislé, pravidlo součinu
P{AnBnC) = P{A).P{B).P{C) (5) nemusí platit, jak ukazuje následující příklad.
Příklad 16. Nechť Q := množina všech permutací písmen a,b,c (tj. 6 možností) a přidáme k nim trojice aaa, bbb, ccc. Tedy je |fž| = 9 a každému prvku z množiny Q přiřadíme pravděpodobnost |. Dále uvažujme náhodné jevy
A = na 1. místě je písmeno a = {abc, acb, aaa}. B = na 2. místě je písmeno a = {bac, cab, aaa}, C = na 3. místě je písmeno a = {bca, cba, aaa}.
Potom je
P(A) = P(B) = P(C) = 3-=1-.
Dále, protože je průnik dvou libovolných těchto náhodných jevů jednoprvková množina (elementární jev) {aaa}, je
P (A HB) = P (A n C) = P{B n C) = P({aaa}) = ^.
9
A protože zároveň platí
P(A).P(B) = P(A).P(C) = P(B).P(C) = 1-1 = 1-, jsou náhodné jevy A, B, C po dvou nezávislé. Na druhé straně, je
P(AnBnC) = P({aaa})=1-, ale P(A).P(B).P(C) = ±.±.± = ±
Tedy náhodné jevy A,B,C nesplňují multiplikativní vztah (5). Intuitivně vzato, tyto náhodné jevy nemohou být nezávislé, protože např. společné nastoupení jevů A, B implikuje nastoupení jevu C. □
12
Tedy nezávislost tří (a více) náhodných jevů je nutné definovat složitějším způsobem: Náhodné jevy Ai,... ,An jsou nezávislé (jako skupina náhodných jevů), pokud platí příslušné multiplikativní vztahy pro všechny fc-tice (k = 2,..., n), tj.
P{AinAj)=P{Ai).P{Aj), Vi< j, P(At n Aj n Ak) = P{Ai).P{Aj).P{Ak), Vi < j < k,
P(A1n---nAn) = P(A1).....P{An).
Opakované nezávislé pokusy - v každém pokusu jsou možné pouze dva výsledky, označme je jako „1" neboli „úspěch" s pravděpodobností p, a jako „0" neboli „neúspěch" s pravděpodobností q : = 1 — p. Základní prostor Q je při n opakování pokusu tvořen 2n prvky, které můžeme zapsat jako posloupnost nul a jedniček 0010101110. Protože se jedná o nezávislé pokusy, jejich pravděpodobnosti
n číslic
se násobí.
Příklad 17.
(a) házení mincí: p = q = |,
(b) házení kostkou: „padne 6"=úspěch s pravděpodobností p = |, „nepadne 6"=neúspěch s pravděpodobností q = \:
(c) kontrola zmetků: vyhovující výrobek s pravděpodobností p, nevyhovující výrobek s pravděpodobností q. □
Jaká je pravděpodobnost, že úspěch nastane právě fc-krát (v posloupnosti n pokusů)?
PÁk)=(^j.pk.qn-k (6)
počet kombinací fc-krát (n — /c)-krát fc-krát úspěch úspěch neúspěch z n pokusů
Takové rozdělení pravděpodobností se nazývá binomické rozdělení. Vzorec (6) je k-tf člen v binomickém rozvoji (p + q)n (též Bernoulliovo rozdělení).
Pravděpodobnost žádného úspěchu je gn, pravděpodobnost alespoň jednoho úspěchu je 1 — qn.
Příklad 18. Předpokládejme, že pravděpodobnost vyhrání partie v šachu je ^, remíza není možná a opakované partie jsou nezávislé. Potom pravděpodobnost výhry ve
(a) 3 partiích ze 4 je p4(3) = Q . Q)3 . Q) = \ = 0.25,
(b) 5 partiích z 8 je p8(5) = © . Q)5 . Q)3 = £ « 0.22. □
13
3.5. Geometrická pravděpodobnost. Nechť Q je podmožina v IRn (pro jednoduchost berme pouze n = 1,2,3), přičemž „umíme" vypočítat její „míru" volfž (délka, obsah, objem v závislosti na n = 1, 2, 3). V tomto (a pouze v tomto) odstavci připouštíme, že Q má nekonečně mnoho prvků. (Jak ale uvidíme, jednotlivé prvky v možině Q nebudou hrát ve výsledku žádnou roli.)
Pro každou podmnožinu A C fž, pro kterou „umíme" vypočítat vol A (tzv. měřitelné množiny), je její geometrická pravděpodobnost definována jako
Používá se u pokusů interpretovatelných jako náhodná volba v oblasti Q se stejnými šancemi pro každý bod.
Geometrická pravděpodobnost je základ pro metodu Monte Carlo - numerické výpočty pomocí simulací.
Příklad 19. Na počítači se náhodně zvolí dvě čísla x, y G [0,1]. Pokud x2 + y2 < 1 (tj. bod o souřadnicích [x,y] leží ve čtvrtkruhu o poloměru 1), zvýší se nějaký čítač N (A) o jedničku. Na počítači je snadné provést N = 106, 108 pokusů, ... Tedy je
7T N (A) A.N(A) ^-jy-, a proto je tt «———.
□
Příklad 20. Dva kamarádi se chtějí setkat v Brně na České pod hodinami, přičemž si dají sraz na "kdykoliv mezi 16:00 a 17:00". Časy příchodů obou kamarádů jsou na sobě nezávislé. Mají domluvu, že kdo přijde na místo setkání první, počká na toho druhého 20 minut a potom odejde. Určete pravděpodobnost, že se tito dva kamarádi setkají.
Označme čas (v minutách) příchodu prvního, resp. druhého kamaráda jako x, resp. y. Potom x, y G [0, 60] a oba kamarádi se potkají, pokud
\x-y\<20, tj. -20 < x-y < 20.
Tedy je
y>x-20, y < 1 splňující známý vztah (cos-í/>)2 + (sin-í/>)2 = 1.
Pro dva vektory v a w můžeme jejich úhel popsat pomocí souřadnic v = (x(v),y(v)), w = (x(w),y(w)) takto:
x(v) ■ x(w) + y (v) ■ y(w) \\v\\ ■ \\w\\
Příklady lineárních zobrazení:
Rotace (kolem počátku): o předem daný úhel ip. Je dáno formulí s maticí
x\ _ ícosip — sin-í/A íx
y J ^ \smijj cosip J \y
Specielně, aplikací na jednotkový vektor (1,0) dostáváme skutečně právě očekávaný výsledek (cosip, sin ■)/>).
Rotace (kolem jiného bodu): rotaci kolem jiného bodu P = O + w snadno napíšeme pomocí posunutí:
x \
j =íiKt) - w i—► ■ (v — w)
i—► Roi, ■ (v — w) + w
cosip(x — x(w)) — sinifj(y — y(w)) + x(w] sinifj(x — x(w)) + cosip(y — y(w)) + y(w]
17
Zrcadlení (vzhledem k přímce): Stačí popsat zrcadlení vzhledem k přímkám procházejícím počátkem O a ostatní se z nich odvodí pomocí posunutí. Hledejme matici Z^ zrcadlení vzhledem k přímce s jednotkovým směrovým vektorem v svírajícím úhel ip s vektorem (1,0). Např.
1 0 0 -1
a obecně můžeme psát (otočíme do „nulové" polohy, odzrcadlíme a vrátíme zpět)
= ■ Zo ■ R-ý.
Můžeme proto (díky asociativitě násobení matic) spočítat
cosip —sinip\ fl 0 \ ( cos ip sin ip
^ ^siiľi/) cosip J \0 — lj \^—sinip cosip
cos tp — sin tp\ (cos tp sin tp
s'mtp costp J \smip — costp
cos2 tp — sin2 ip 2 sin tp cos tp \ _ (cos 2tp sin 2tp
2 sin ip cos ip —(cos2ip — sm2íp)J \sm2tp —cos 2ip
Všimněme si, že
Zf ■ Zo -
což je otočení o úhel 2ip. Tedy jsme ukázali
cos2ip sin2ip \ fl 0\_/cos2tp — sin2tp s'm2ip —cos2ip) \0 —1J \s'm2tp cos 2ip
Otočení o úhel ip obdržíme následným provedením dvou zrcadlení vzhledem ke směrům, které spolu svírají úhel | tp.
4.5. Obsah trojúhelníka. Trojúhelník je vymezen dvojicí vektorů v & w, které, přiloženy do počátku O, zadají zbylé dva vrcholy. Chceme najít formuli (skalární funkci vol), která těmto vektorům přiřadí číslo rovné obsahu volA(t>,-u;) takto definovaného trojúhelníku A(v,w).
Musí platit (plochu je součin základny krát výška / 2, přičemž výška součtu je jistě součtem výšek)
vol A(v + v', w) = vol A(v, w) + vol A(v', w) vo\A(av,w) = a vol A(v,w)
a přidejme požadavek
volA(t>,-u;) = — vol A(w, v). který odpovídá představě, že opatříme plochu znaménkem podle toho, v jakém pořadí bereme vektory.
Pokud vektory v a w napíšeme do sloupců matice A, tj.
A = (x(v) x(w)\
" \y(v) y(w)J :
potom
(v, w) = A det A
splňuje všechny tři naše požadavky.
Kolik takových zobrazení ale může být? Každý vektor umíme vyjádřit pomocí dvou souřadných vektorů v = (1,0) a w = (0,1) a evidentně tedy každá možnost pro vol A je jednoznačně určena
18
svou hodnotou na této jediné dvojici argumentů (v,w). Jsou si tedy všechny možnosti rovny až na skalární násobek. Ten určíme požadavkem
volA((l,0),(l,0)) = ^,
tj. volíme orientaci a měřítko.
Tedy determinant matice A, jejíž sloupce tvoří vektory v a w (v tomto pořadí) zadává plochu rovnoběžnostěnu určeného těmito vektory, a tedy plocha trojúhelníka je poloviční:
vo\A(v,w) = - \A\.
2
4.6. Obsah mnohoúhelníka. Mnohoúhelník rozdělíme na trojúhelníky, jejichž obsahy sečteme.
4.7. Viditelnost v rovině. Předchozí popis lze použít pro určování viditelnosti orientovaných úseček. Orientovanou úsečkou rozumíme dva body v rovině IR2 s určeným pořadím. Můžeme si ji představovat jako šipku od prvého k druhému bodu (= vektor umístěný do prvního bodu). Taková orientovaná úsečka rozděluje rovinu na dvě poloroviny, říkejme jim „levou" a „pravou".
Jestliže uvažujeme obvyklou orientaci proti směru hodinových ručiček pro hranici mnohoúhelníka, pak pozorovatel stojící vně takového mnohoúhelníka některé jeho hrany vidí a některé nevidí. Pokud je daný mnohoúhelník „konvexní", tj. jeho hrany „zatáčejí" pouze doleva, potom pozorovatel vidí právě ty hrany (orientované úsečky), od nichž je napravo, viz obr.
Je-li AB vektor takové orientované úsečky, potom pro bod C ležící napravo od ní platí, že vektory
CA = A — C a CB = B — C, které směřují z bodu C do bodů A a B, jsou vzájemně orientovány v záporném směru, a proto je jejich jejich
vol A (CM, CB) < 0, úsečku AB z bodu C vidíme.
Naopak, pro bod C ležící nalevo od AB platí, že
vo\A(CA,CB) > 0, úsečku AB z bodu C nevidíme.
Protože je funkce vol A pouze kladným násobkem funkce det A, kde sloupce matice A jsou vektory CA, CB v tomto pořadí, stačí pouze sledovat znaménka příslušných determinantů. Pro konvexní mnohoúhelník nastanou zřejmě právě 2 znaménkové změny v posloupnosti těchto determinantů.
Příklad 21. Určete, které hrany jsou vidět z bodu C = [2, 0] pro čtyřúhelník daný vrcholy
A =[0,0], B = [2,1], D = [3, 3], E =[1,4].
Body jsou již seřazeny v kladném směru a tvoří konvexní čtyřúhelník. Vypočítáme příslušné determinanty
\A-C,B-C\ \D-C,E-C\
Pororovatel v bodě C tedy vidí pouze první dvě hrany: AB a BD. □
-2 0
0 1
1 -1 3 4
-2<0, \B-C,D-C\ 7>0, \E-C,A-C\ =
0 1
1 3
-1 -2
4 0
-1 < 0, 8 > 0.
19
Uvedený jednoduchý postup je často využíván pro testování polohy při standardních úlohách v 2D (a podobně pro příslušnou funkci vol v 3D) grafice.
Příklad 22. Na (nejvýše) kolik částí dělí rovinu n kružnic?
Pro maximální počet pn oblastí, na které dělí rovinu kružnice, odvodíme rekurentní vzorec
Pn+1 =pn + 2n
(n + 1). kružnice totiž protíná n předchozích maximálně v 2n průsečících (a tato situace skutečně může nastat). Navíc zřejmě p± = 2. Pro počet pn tedy dostáváme
n—1
Pn = Pn-1 + 2(n - 1) = Pn-2
+ 2(n-2) + 2(n- 1)
Pi + Y,21
i=l
Tedy např. 10 kružnic může rozdělit rovinu na nejvýše pio = 2 + 10.9
92 částí.
□
20
5. Relace a zobrazení
Uspořádanou dvojicí rozumíme dvojici [x,y], kdy víme, že prvek x je „první" v pořadí a prvek y je druhý v pořadí. Formálně lze uspořádanou dvojici definovat jako množinu
[x,y] ■■= { {x}, {x,y} }.
Potom lze snadno ukázat, že [x,y] = [u,v], právě když x = u a y = v.(Vyzkoušejte! Důkaz „-<=" je triviální, důkaz má dvě části, a to buď {x} = {u} nebo {x} = {u,v}.)
Nechť A a, B jsou množiny. Kartézským součinem těchto množin (v tomto pořadí) je množina uspořádaných dvojic [a, b], kde a G A a b G B, tedy
A x B = {[a,b], a e A, b e B). Má-li množina A n prvků a množina B m prvků, potom má zřejmě množina A x B m.n prvků.
5.1. Relace mezi množinami. (Binární) Relací mezi množinami A a, B rozumíme libovolnou podmnožinu R kartézského součinu A x B, tj.
R C A x B.
Často píšeme a b pro vyjádření skutečnosti, že [a, b] G i?, tj. že body a E A & b E B jsou v relaci R.
Příklad 23. Příklady relací mezi množinami A, B jsou A x B, 0 (prázdná relace), A x {b} (kde & G -B je určitý prvek, konstantní relace), {a} x B (prvek a G A je v relaci se všemi prvky z B). □
Definičním oborem relace je podmnožina D = Dr = D(R)
D C A, D = {a G A; 3b G B, [a, b] G R}.
Podobně „oborem hodnot relace" je podmnožina I = Ir = I(R)
ICB, I = {b G B; 3a G A, [a, b] G R}.
Grafický zápis relací
— pomocí tabulky
a b c
^ 1 1 tj. např. [a, a] G R, [b, c] G R, [b, b] G- R, [c, b] G- R.
c
— pomoci „orientovaných šipek", viz obr. Šipka od prvku a k prvku b znamená, že [a, b] G R. Je-li cílová množina opět A, potom příslušnost prvku [a, a] k relaci R zobrazujeme „smyčkou" v bodě a.
Speciálním případem relace je zobrazení z množiny A do množiny B. Je to případ, kdy pro každý prvek definičního oboru relace existuje právě jeden prvek z oboru hodnot, který je s ním v relaci. Nám známým případem zobrazení jsou skalární funkce, kde oborem hodnot zobrazení je množina skalárů, třeba celých nebo reálných čísel. Pro zobrazení zpravidla používáme značení, které jsme také u skalárních funcí zavedli. Píšeme
f : I, f(á) = b, kde D C A, I C B, příp. b = f(a) pro vyjádření skutečnosti, že [a, b] patří do relace, a říkáme, že b je hodnotou zobrazení / v bodě a.
21
Dále říkáme, že / je
• zobrazení množiny A do množiny B, jestliže D f = A (tj. vynechali jsme úvodní předložku
X)T —
• surjektivní zobrazení (neboli zobrazení „na"), tj. je to zobrazení množiny A na množinu B, tj. je Df = A a If = B,
• injektivní zobrazení (neboli prosté zobrazení), jestliže je D f = A a pro každé b G // existuje právě jeden vzor a E A takový, že f (a) = b (tedy různé vzory se zobrazí na různé hodnoty).
• bijektivní zobrazení (neboli bijekce), pokud je současně surjektivní a injektivní, neboli pokud existuje jedno-jednoznačná korespondence mezi prvky množin A a B.
Příklad 24.
(a) Následující zobrazení je surjektivní, ale není injektivní:
A B
°i \
o2 —► •„ tento prvek má dva „vzory'1
°3 *b
°4 —► «c
(b) Následující zobrazení je injektivní, ale není surjektivní:
A
°i \
°2 \
°3 \
°4 \
B
a tento prvek nemá žádný „vzor"
(c) Následující zobrazení je bijektivní:
A = 2.N
I
B = N
2 4 6 8 10 ... n 12 3 4 5...?
(d) Následující zobrazení není ani surjektivní ani injektivní:
B
A
o o o
tento prvek má tři „vzory" tento prvek nemá žádný „vzor"
□
Vyjádření zobrazení / : A —► B jakožto relace
fCAxB, f = známe také pod názvem graf zobrazení /.
{[a, f (á)]; a E A}
22
5.2. Skládání relací a funkcí. Je-li zobrazení (tj. speciální relace) / : A —► B a g : B —► C, pak jejich „složení" g o f je definováno jako
(gof)(a) :=g(f(a)).
Ve značení používaném pro relace totéž můžeme zapsat jako
fCAxB, f={[a,f(a)]; a e A} gCBxC, g={[b,g(b)]; b G B} gofCAxC, gof={[a,g(f(a))]; a e A}.
Obdobně definujeme „skládání relací", v předchozích vztazích jen doplníme existenční kvantifikátory, tj. musíme uvažovat všechny „vzory" a všechny „obrazy".
Uvažujme relace RCAxB&SCBxC. Potom
SoRCAxC, SoR= {[a,c];3be B, [a, b] G R, [b,c]eS}.
Speciálním případem relace je identické zobrazení
id^ = {[a, a] G A x A; a G Á}
na množině A. Je neutrální vzhledem ke skládání s každou relací s definičním oborem nebo oborem hodnot A.
Pro každou relaci R C A x B definujeme „inverzní relaci"
R-1 = {[b,a]; [a,b] G i?} C B x A.
Pozor! U zobrazení je stejný pojem užíván ve specifičtější situaci. Samozřejmě, pro každé zobrazení existuje jeho invezní relace, ta však nemusí být zobrazením. Zcela logicky proto hovoříme o existenci inverzního zobrazení, pokud každý prvek b G B je obrazem pro právě jeden vzor v A. V takovém případě je samozřejmě inverzní zobrazení právě inverzní relací.
Složením zobrazení a jeho inverzního zobrazení (pokud obě existují) vždy vznikne identické zobrazení, u obecných relací tomu tak být nemusí.
Príklad 25. Viz Príklad 24(a). Zde je
R={[l,a], [2, a], [3,6], [4,c]}CAxB, fT^ÍKl], M [6,3], [c,4]} C B x A, R-1oR={[lA], [1,2], [2,1], [2,2], [3,3], [4,4]} C A x A, R o R-1 = {[a, a], [b, b], [c, c]} C B x B. Všimnete si, že vždy ale platí
idA C R'1 o R, ideCRoR-1.
D
23
5.3. Relace na množině. V případě A = B hovoříme o relaci na množině A. Říkáme, že relace R je:
• reflexivní, pokud id^ C R (tj. pokud [a, a] E R pro všechny a E A),
• symetrická, pokud R~ľ = R (tj. pokud [a, b] G R, pak i [b, a] G R),
• antisymetrická, pokud R~ľ fl R C id^ (tj. pokud [a, b] G R a zároveň [6, a] G i?, pak a = b),
• tranzitivní, pokud f? o R C J?, tj. pokud z [a, 6] G R a [6, c] G i? vyplývá i [a, c] G i?.
5.3.1. Ekvivalence. Relace se nazývá ekvivalence, pokud je současně reflexivní, symetrická i tranzitivní. Pokud je relace R ekvivalence, budeme příslušnost dvojice [a, b] k relaci R značit symbolem a ~ b.
Příklad 26. Rozhodněte, zda následující relace na množině M jsou relace ekvivalence:
(a) M = {f : R -+ R}, (f ~ g) & /(O) = g(0).
Ano. Ověříme tři vlastnosti ekvivalence:
(i) Reflexivita: pro libovolnou reálnou funkci / je /(O) = /(O).
(ii) Symetrie: jestliže platí /(O) = g(0), pak i g(0) = /(O).
(iii) Tranzitivita: jestliže platí /(O) = g(0) a g(0) = h(0), pak platí i /(O) = h(0).
(b) M = {f : R -+ R}, (f~g)& /(O) = g(l).
Ne. Definovaná relace není reflexivní, např pro funkci sin máme sin(O) 7^ sin(l).
(c) M je množina přímek v rovině, dvě přímky jsou v relaci, jestliže se neprotínají.
Ne. Relace opět není reflexivní (každá přímka protíná sama sebe).
(d) M je množina přímek v rovině, dvě přímky jsou v relaci, jestliže jsou rovnoběžné.
Ano. Třídy ekvivalence pak tvoří množinu neorientovaných směrů v rovině.
(e) M = N, (m ~ n) <š=> S(m) + S (n) = 20, kde S (n) značí ciferný součet čísla n.
Ne. Relace není reflexivní. S(l) + S(l) = 2. □
5.3.2. Uspořádání. Relace se nazývá uspořádání jestliže je reflexivní, tranzitivní a antisymetrická. Relaci uspořádání obvykle značíme < (případně případně >, >r). čili dva prvky a, b jsou v relaci R (uspořádání), [a, b] G R, píšeme jako a < b (a W> W> íc}> ía>c}> {&>c)> {a,&,c}. (10)
Viz obr. □
Všimněte si, že ostrá nerovnost < není v tomto smyslu uspořádání, protože to není reflexivní relace (a a).
Říkáme, že uspořádání je úplné, když pro každé dva prvky platí že jsou „srovnatelné", tj. buď a < b nebo b < a. Příkladem úplného uspořádání je „normální" uspořádání < přirozených (celých, racionálních, reálných) čísel, neboť o libovolných dvou číslech a, b platí, že buď a < b nebo b < a.
Všimněme si, že ne všechny dvojice [X, Y] podmnožin v A v Příkladu 27 jsou srovnatelné v tomto smyslu. Přesněji, pokud je v A více než jeden prvek, existují podmnožiny X kdy není ani X CY ani Y C X.
Příklad 29. Dalším příkladem uspořádání je relace „dělitelnosti" na přirozených číslech. Řekneme, že číslo a je v relaci s číslem b, pokud a dělí b, tj. pokud je podíl - opět přirozené číslo. Tento fakt (tuto relaci) zapíšeme jako a\b a čteme „a dělí 6". Ukážeme, že tato relace je uspořádání:
— pro každé a G N platí a\a (reflexivní relace),
— jestliže a\b a b\c, potom platí a\c (tranzitivní relace), neboť je-li ^ = n G N a současně | = m G N, potom Je f = f • ^ = m-n £ N,
— je-li a\b a zároveň b\a, musí být nutně a = b (antisymetrická relace), neboť je-li - = n G N a současně | = m G N, potom je a = b.m = (a.n).m = a.(m.n). Odsud plyne, že m.n = 1, tj. m = n = 1, z čehož máme a = b.
Toto uspořádání ale zřejmě není úplné. (Porovnejte s touto relací na Q \ {0}. Je to vůbec v tomto případě uspořádání?) □
5.4. Supremum a infimum v uspořádaných množinách. Nechť je dána neprázdná množina A a na ní nějaká relace uspořádání, označme tuto relaci < (uvažme ale, že toto uspořádání nemusí nutně znamenat „být menší nebo roven" ve smyslu uspořádání reálných čísel - prostě je to relace uspořádání ve smyslu vlastností, které tato relace musí mít jako uspořádání). Dvojici (A,<) pak nazýváme uspořádanou množinou.
Nechť B C A je neprázdná podmnožina. Prvek b E A nazveme
horní závorou množiny B, pokud Ví G B : x < b, tj. pokud je prvek b „větší" (ve smyslu uspořádání <) než všechny prvky v množině B. viz obr.
Obdobně se definuje dolní závora množiny B, tj. je to prvek a E A s vlastností, že a < x pro všechny x G B, viz obr.
Příklad 30. Je-li A systém (10) všech podmnožin tříprvkové množiny, viz Příklad 28, pak je { } dolní závorou a {a, b, c} horní závorou každé podmnožiny tohoto systému. □
25
Řekneme, že množina B je shora ohraničená (shora omezená) v množině A, pokud má B v množině A alespoň jednu horní závoru. Podobně se definuje zdola ohraničená (zdola omezená) množina B v množině A.
Množina B je ohraničená (omezená) v množině A, pokud je B současně zdola i shora ohraničená v A. viz příklady reálných intervalů.
Nejmenší (ve smyslu uspořádání <) horní závora množiny B v množině A se nazývá supremum množiny B v množině A. Tj. prvek b G A je supremum množiny B v množině A, pokud jsou splněny následující dvě podmínky:
— V x G B : x < b (tj. b je horní závora množiny B),
— je-li y G A horní závora množiny B, potom je b < y (tj. b je nejmenší horní závora).
Supremum množiny B v množině A značíme jako
b = sup B, případně jen b = sup B.
A
Obdobně se definuje infimum množiny B v množině A, neboli je to největší (ve smyslu uspořádání <) dolní závora množiny B v množině A, značíme
a = inf B, případně jen a = inf B.
A
Příklad 31.
(a) Vezměme A = IR. Je-li B libovolný z intervalů (0,1), [0,1], [0,1) nebo (0,1], potom je vždy
sup B = 1 a inf B = 0.
(b) Je-li A systém (10) všech podmnožin tříprvkové množiny, viz Příklad 28, pak je supremum libovolného podsystému B množiny A rovno sjednocení všech prvků z B, a infimum libovolného podsystému B množiny A rovno průniku všech prvků z B. □
Má-li množina B největší prvek b (tj. všechny ostatní prvky jsou menší než b ve smyslu uspořádání <), potom je b = supB. Podobně, má-li množina B nejmenší prvek a (tj. všechny ostatní prvky jsou menší než a ve smyslu uspořádání <), potom je a = inf B. Výhoda suprema či infima oproti největšímu či nejmenšímu prvku spočívá v tom, že největší či nejmenší prvek nemusí v B existovat, ale supremum a infimum (za velmi obecných podmínek) existují vždy.
Příklad 32. V teorii (reálných) čísel je existence suprema (nebo infima) de facto axiomem, bez kterého by tato teorie vůbec nefungovala:
(i) Každá neprázdná shora ohraničená množina BC8 má supremum v množině IR.
(ii) Každá neprázdná zdola ohraničená množina BC8 má infimum v množině IR.
□
Věta 1. Nechť (A, <) je neprázdná uspořádaná množina a B C A její neprázdná podmnožina. Označme a : = inf B a b := sup B.
(i) Prvek a G B, právě když existuje nejmenší prvek množiny B. V tomto případě je a rovno tomuto nejmenšímu prvku.
(ii) Prvek b G B, právě když existuje největší prvek množiny B. V tomto případě je b rovno tomuto největšímu prvku.
26
Pojmy suprema a infima jsou jedními z nej důležitějších v teoretické matematice, během přednášek MB101-MB104 se s nimi ještě setkáme mnohokrát.
5.5. Rozklad podle ekvivalence. Každá ekvivalence R na množině A zadává přirozeným způsobem rozklad množiny A na podmnožiny vzájemně ekvivalentních prvků, tzv. „třídy ekvivalance". Pro libovolné a E A položme
Ra := {b G A; [a, b] G R} ... třída ekvivalence příslušející prvku a.
Příklad 33. Uvažujme množinu M všech studentů zapsaných na podzim 2006 do předmětu MB101. Uvažujme relaci R na množině M definovanou jako:
X je v relaci s Y, pokud X chodí do stejné seminární skupiny jako Y.
Zkráceně budeme místo [X, Y] G R zapisovat X ~ Y. Ověřte, že se jedná o relaci ekvivalence. Tato relace přirozeně „rozkládá" množinu M všech studentů na jednotlivé třídy = seminární skupiny.
Přitom pro vyučujícího je nyní mnohem snazší komunikovat s jedním zástupcem = reprezentantem (letos by bylo celkem 12 reprezentantů) z každé třídy rozkladu místo se všemi 530 studenty. □
Často budeme psát pro Ra prostě [a], je-li z kontextu zřejmé, o kterou ekvivalenci jde.
Zjevně Ra = R^ neboli [a] = [b] právě, když [a, b] G R. Každá taková podmnožina Ra je tedy reprezentovatelná kterýmkoliv svým prvkem, tzv. „reprezentantem".
Zároveň RaC\ Rb ^ $ právě, když Ra = R^, tj. třídy ekvivalence jsou po dvou disjunktní.
Konečně, A = UaeJíRa, tj. celá množina A se skutečně rozloží na jednotlivé třídy.
Můžeme také třídám rozkladu rozumět tak, že třídu [a] vnímáme jako prvek a „až na ekvivalenci".
Následující příklad je převzat z [ ].
Příklad 34. Mějme dánu množinu N přirozených čísel, na které umíme sčítat a násobit.
(a) Konstrukce celých čísel z N. Na N umíme sice sčítat a víme, že přičtením nuly se číslo nezmění. Umíme i definovat odečítání, při něm ale jen někdy existuje výsledek. Základní ideou konstrukce celých čísel z přirozených je tedy přidat k nim chybějící rozdíly. To můžeme udělat tak, že místo „výsledku" odečítání budeme pracovat s uspořádanými dvojicemi čísel, které nám samozřejmě vždy výsledek dobře reprezentují, tj. pro a, b G N je výsledek operace odčítání a —b definován jako výraz a —b (např. výraz „5 — 7" je výsledek odečtení 7 od 5). Zbývá jen dobře definovat, kdy jsou (z hlediska výsledku odečítání) takové dvojice ekvivalentní:
[a, b] ~ [a', b'] ^ -<=^ a - b = a' - b^j -<=^ a + b' = a' + b.
(výraz „5 — 7" je ekvivalentní s např. s výrazem „1 — 3", protože 5 + 3 = 8 = 1 + 7.)
Všimněme si, že zatímco výrazy v prostřední rovnosti v přirozených číslech neumíme, výrazy napravo už ano. Snadno ověříme, že skutečně jde o ekvivalenci a její třídy rozkladu označíme jako celá čísla Z. Formálně vzato jsou tedy prvky a G Z třídy rozkladu, tj. měli bychom správně psát [a]. Přitom třídu rozkladu [a] odpovídající přirozenému číslu a G N, tj. např. dvojici [a, 0], ztotožníme s prvkem a G Z, a třídu rozkladu [a — b], kde a — b G- N, ztotožníme s prvkem a — b G Z (např. [5 — 7] = —2 G Z).
27
Na třídách ekvivalence definujeme operaci sčítání (a s ní i odečítání) pomocí reprezentantů. Např.
[[a, b]] + [[c,d]] := [[a + c,b + d]], což zjevně nezávisí na výběru reprezentantů. Lze si přitom vždy volit reprezentanty [a, 0] pro kladná čísla a reprezentanty [0, a] pro čísla záporná, se kterými se nám bude počítat nejlépe.
Tento jednoduchý přklad ukazuje, jak důležité je umět nahlížet na třídy ekvivalence jako na celistvé objekty a soustředit se na vlastnosti těchto objektů, nikoliv na formální popis jejich konstrukce.
V Z nám stále ještě chybí inverze! Např. 2_1 G- Z.
(b) Konstrukce racionálních čísel ze Z. Racionální čísla Q můžeme zkonstruovat z celých čísel přidáním všech chybějících inverzí zcela obdobným způsobem, jak jsme konstruovali Z z N. Na množině uspořádaných dvojic [p,q], kde p, q G Z a q ^ 0, definujeme relaci ~ tak, jak očekáváme, že se mají chovat podíly -:
[p, q] ~ \p', q']
p ■ q' = p' ■ q.
V Z neumíme prostřední rovnost, zatímco rovnost na pravé straně již ano. Zjevně jde o relaci ekvivalence (ověřte podrobnosti!) a racionální čísla jsou pak její třídy ekvivalence. Když budeme formálně psát | místo třídy rozkladu [[p, q\] příslušející dvojici [p, q] a když budeme definovat operace sčítání a násobení pomocí známých vzorců
[[p, q}} + [[r, s]] := [[ps + qr, qs}}, [[p, q}} ■ [[r, s]] := [\pr, qs]],
dostaneme právě těleso racionálních čísel.
Příklad 35. Jiným dobrým a jednoduchým příkladem jsou tzv. zbytkové třídy Zn celých čísel. Pro pevně zvolené přirozené číslo n definujeme equivalenci ~n tak, že dvě čísla a, b G Z jsou ekvivalentní, tj. a ~n b, jestliže jejich zbytek po dělení číslem n je stejný, neboli a (mod n) = b (mod n). Výslednou množinu tříd ekvivalence označujeme Zn. Je tedy
Zn = {[0],[l],[2],...,[n-1]},
což ztotožníme s množinou
Zn = {0,1,2,...,ri-l}.
Např. pro n = 2 dostáváme Z2 = {0,1}, kde 0 reprezentuje sudá čísla (zbytek po dělení dvojkou je 0), zatímco 1 reprezentuje lichá čísla (zbytek pop dělení dvojkou je 1). Nebo Z7 = {0,1, 2, 3,4,5, 6}.
Opět lze snadno zjistit, že pomocí reprezentantů můžeme definovat násobení a sčítání. Tedy pro a, b G Zn (všimněte si, že již automaticky nepoužíváme zápis [a], [b] G Zn pomocí tříd ekvivalence) je
a + b = c (mod n), a.b = d (mod n), kde c,d G Zn, tj. c, d G {0,1,..., n — 1}. Např. v Z7 je 3 + 5 = 8 (mod 7) = 1 nebo 3.5 = 15 (mod 7) = 1.
Zkuste si ověřit, že Zn je komutativním tělesem právě, když je n prvočíslo. □
Konec 2. přednášky (5.10.2009)
28
6. řešení systému lineárních rovnic Lineární rovnice je rovnice typu
a\Xi + 02^2 + • • • + o,nxn = b Xi,..., xn jsou neznámé (též proměnné), a1;..., an, b jsou koeficienty.
Příklad 36. Rovnice
(a) 2xi + ax2 — x% = 1 je lineární,
(b) 2xi + ax\ — xj, = 1 není lineární,
(c) 2xi + ax2x3 — x3 = 1 není lineární,
(d) 2xi — x3 = 1 je lineární.
Systém m lineárních rovnic v n proměnných (též m x n-systém) je tvaru
CLuXi + 012^2 +----\~ a,lnXn = &i
a21xl + a22^2 + ' ' ' + 0>2rixri = ^2
: ; (ls)
Q"mlxl Q"m2x2 ~\~ ' ' ' ~\~ ďmnxn ^m-
Xi,..., xn jsou neznámé, a^-, bj jsou koeficienty (i = 1,..., n, j = 1,..., m).
Příklad 37. Systémy lineárních rovnic:
(a) 2 x 2-systém, má jediné řešení (xi,X2) = (1,3).
Xi + 2rr2 = 7 2xi — x2 = — 1
(b) 2 x 3-systém, má nekonečně mnoho řešení (x1,x2,x3) = (t,t, 1) pro í G f,
xi — x2 + 2xs = 2 -Xi + x2 + x3 = 1
(c) 3 x 2-systém, nemá žádné řešení {xi,x2).
xi + x2 = 4 2^1 — ^2 = —1 xi — x2 = O
□
Systém, který má alespoň jedno řešení, se nazývá konzistentní, pokud nemá žádné řešení, je nekonzistentní. Tedy v Příkladu 37 jsou systémy (a) a (b) konzistentní, zatímco systém (c) je nekonzistentní.
Řešení systému (LS) je uspořádaná n-tice čísel (xi,... ,xn). Při řešení systému lineárních rovnic vždy hledáme množinu všech řešení (nazvěme ji množina řešení tohoto systému).
Příklad 38. Systém se dvěma proměnnými (n = 2) lze řešit geometricky:
29
(a) jediné řešení (xi,X2) = (1,3)
xi + 2x2 = 7 pi : x2 = -~ xi + l, , . .
o i o i i (vlz obr0
2xi - rr2 = -1 P2 : x2 = 2x1 + 1. v '
(b) nekonečně mnoho řešení {xi,x2) = {t,2t + 1) pro t G
-2^i + x2 = 1 _^ pi : x2 = 2x1 + 1, / • -u >
2xi - rr2 = -1 P2 • x2 = 2xi + 1. (px = p2)
(c) žádné řešení (xi,x2),
—2x-i + x2 = 2 p-i : x2 = 2x\ +2, , . . .
2*1 - *I = -1 =* £: ^ = 2,; + L (Pl||p2) (™ote0
□
6.1. Ekvivalentní systémy. Dva lineární systémy jsou ekvivalentní, pokud mají stejnou množinu řešení (uvažte, že tato relace zadává relaci ekvivalence na množině všech lineárních systémů).
Máme-li jeden lineární systém (LS), potom následující úpravy nemění množinu řešení: I. Záměna dvou rovnic v systému. II. Vynásobení některé rovnice nenulovým číslem. III. Přičtení násobku jedné rovnice k rovnici jiné.
Při řešení systému lineárních rovnic budeme aplikovat tyto operace, abychom získali systém, který lze řešit jednodušeji: tzv. trojúhelníkový systém (viz obr.). Tj. systém, ve kterém je v i-tém řádku prvních i — 1 koeficientů nulových a i-tý koeficient nenulový.
Příklad 39.
3xi + x2 + 3rc3 — X4 = 4
- x2 - x3 + xA = 1
x3 + xA = 0
— 2x4 = 4
má jediné řešení (x1}x2,x3,x4) = (2,-5,2,-2), které získáme řešením systému „odspoda", tj. od poslední rovnice. □
Metoda uvedená v Příkladu 39 se nazývá zpětná eliminace (též zpětná substituce).
Jednotlivé rovnice můžeme psát bez proměnných x,-n dostaneme tak matici systému (LS) - kde vystupují pouze koeficienty z levé strany systému:
(a\\ a12 ■ ■ ■ aln \
a21 a22 ... a2n
m radku a n sloupců.
\(imi dm2 ... dmnJ a dále rozšířenou matici systému (LS) - včetně pravých stran:
(a\\ a12 ■ ■ ■ aln bi ^
a2i a22 ... a2n b2 \Qjmi dm2 ... dmn bm)
m řádků a n + 1 sloupců.
30
Příklad 40. Matice systému a rozšířená matice systému v Příkladu 39 jsou
1 3 -l\ /3 1 3 —1 I -3\
f3 1 3 -l\ 0-1-1 1
0 0 11
\0 0 0 -2/
f3 1 3-1
0-1-11 1
0 0 11 o
\0 0 0 -2 4
□
Elementární řádkové úpravy na rozšířené matici systému, které nemění systém řešení, proto jsou: I. Záměna dvou řádků.
II. Vynásobení některého řádku nenulovým číslem. III. Přičtení násobku jednoho řádku k jinému řádku.
Jestliže má lineární n x n-systém ekvivalentní trojúhelníkový tvar, potom má zřejmě jediné řešení.
Postup pro nalezení ekvivalentního trojúhelníkového systému k danému n x n systému:
1. Určíme pivota ©, tj. první nenulový koeficient v prvním řádku. Někdy je nutné zaměnit řádky, abychom dostali nenulové číslo na první pozici. Řádek, který obsahuje pivota, se nazývá pivotní řádek. Většinou je výhodné, aby byl pivot roven 1 (ale není to nutné). To docílíme použitím II. elementární řádkové úpravy (vynásobení řádku nenulovým číslem):
|*\
I*
I* \*J
2. Koeficienty pod pivotem vynulujeme pomocí elementárních řádkových úprav - zejméma pomocí III. elementární řádkové úpravy (přičtení násobku pivotního řádku postupně k ostatním řádkům):
/© * 0 *
\0 *
3. Tuto proceduru aplikujeme na podmatici, atd.
0 © ... *
l*\
I* I*
i* i*
Pokud v daném sloupci není žádný nenulový prvek k výběru pivota, potom systém nemá ekvivalentní trojúhelníkový tvar.
31
6.2. Systém ve schodovitém tvaru (Gaussova eliminace). Používá se pro nxn systémy, které nemají ekvivalentní trojúhelníkový tvar nebo pro obecné m x n systémy.
Matice systému (případně rozšířená matice systému) je v (řádkově) schodovitém tvaru, pokud splňuje:
(i) první nenulový prvek v každém řádku je 1,
(ii) jestliže je některý řádek nenulový, potom má následující řádek více nul na začátku,
(iii) řádky, které obsahují jen nuly, jsou na konci.
0 0 1 * * 0 0 0 0 1
0 0 0 0 0 0 0 0 0 0 \0 0 0 0 0
1 0
0/
pnp.
0 0 1 * * . . * *
0 0 0 0 1 .. * *
0 0 0 0 0 .. . 1 *
0 0 0 0 0 .. . 0 0
\o 0 0 0 0 .. . 0 0/
Příklad 41.
-2 1 1
0 0 5 0
0 0 0 0
-2 1 1\
0 0 1 0
0 0 0 °/
-2 1 1\
0 0 0 0
0 0 1 o
není ve schodovitém tvaru.
je ve schodovitém tvaru.
není ve schodovitém tvaru.
□
Gaussova eliminace je řešení systému lineárních rovnic metodou úpravy rozšířené matice systému na schodovitý tvar (a poté zpětnou eliminací).
Příklad 42. Metodou Gaussovy eliminace vyřešte systém
—Xi — x2 + 2rr3 — rr4 = 1.
Axi + 2x2 — %3 + 2x4 = 2,
3xi + X2 + x% + X4 = 3.
Řešení.
11—21
0 1 ~\ 1 .0 0 0 0
32
Tato matice je ve schodovitém tvaru. Odtud volbou x% := s a x^ = t dostaneme dosazením do prvních dvou rovnic
x2 = — 3 + \ s — t, xi = 2 — § s,
tedy množina řešení je
j (2- §s, -3 + \s-t, s, t), t,se m|.
□
6.3. Gauss—Jordánova eliminace. Pokud v (rozšířené) matici systému, která je ve schodovitém tvaru, vynulujeme všechny prvky nad všemi pivoty (zpětnou eliminací), pak tuto metodu nazýváme Gauss-Jordánova eliminace. Tj.
(1 * 0 * s... * \
0 0 1 * s... *
0 0 0 0 1 ... *
0 0 0 0 0 ... 1
0 0 0 0 0 ... 0
0 0 0 0 ... 0 /
(\ * o * o ... 0\
o o 1 * o ... o
o o o o 1 ... o
o o o o o ... 1
o o o o o ... o
\0 0 0 0 0 ... OJ
případně
(1 * 0 * 0 ... * 1 A
0 0 1 * 0 ... * *
0 0 0 0 1 ... * *
0 0 0 0 0 ... 1 *
0 0 0 0 0 ... 0 0
^0 0 0 0 0 ... 0
n * 0 * 0 .. . 0 *\
0 0 1 * 0 .. . 0 *
0 0 0 0 1 .. . 0 *
0 0 0 0 0 .. . 1 *
0 0 0 0 0 .. . 0 0
0 0 0 0 .. . 0 0/
Příklad 43. Metodou Gauss-Jordanovy eliminace vyřešte systém z Příkladu 42.
Řešení. Z Příkladu 42 máme
-1 -1 2 -1 I 1\ /l [T] —2 1 I -A 4 2 -1 2 2 ) ~ I 0 1 —I 1 -3 3 1 1 1 I 3/ \0 0 0 0 I 0 /
Tato matice je ve schodovitém tvaru. Vynulováním prvků nad všemi pivoty dostáváme
/l 0 f 0 I 2 \ ~ 0 1 -\ 1 -3 .
\o o o o 1 oj
Odtud již volbou i3 := s a i4 = í přímo dostaneme
x2 = — 3 + \ s — t, xi = 2 — § s,
33
tedy množina řešení je (jako v Příkladu 42)
j (2- §s, -3 + l-s-t, s, t), t,se m|.
□
Gauss-Jordanova eliminace bude zejména užitečná pro výpočet inverzních matic.
6.4. Homogenní systémy. Lineární syslém se nazývá homogenní, pokud jsou všechny koeficienty b j = 0 (tj. všechny pravé strany jsou nulové):
/**... * 0\
* * ... * o
I 0
\* * ... * 0/
Homogenní systém je vždy konzistentní (tj. má vždy alespoň jedno řešení), protože nulové řešení
(x1,...,xn) = (0, ...,0) je vždy řešení takového systému. Toto nulové řešení se také nazývá triviální řešení.
Příklad 44. Vyřešme lineární systém:
-1 -1 2 1
4 3
2 -1 -1 2 1
1
0N 0
0,
'1
'1 1
0 1
o o
1 -2 1
-2 -2
7 7
-2 -2
0N 0
o,
-2
7 2
1 1 0
o
0.
Odtud již volbou 13 := s a 14 = í dostaneme
7
x2
s — t, X\
2 <
tedy množina řešení je
|( - f s, \ s - t, s, t), t, s e M j neboli j ( - 3s, 7 s - t, 2s, t), t, s G M j.
□
Z Příkladu 44 je vidět, že při úpravách homogenního systému se pravé strany nemění, protože z nul na pravé straně nelze při násobení a sčítaní/odčítání získat nic jiného než opět jen nuly. Proto se někdy homogenní systém zapisuje pouze svou maticí systému
/* * ... *\ * * ... *
\* * ... */
(místo rozšířené matice systému). Příklad 44 potom vypadá následovně:
34
Příklad 45. Vyřešme lineární systém:
-1 -1 2 4 2-1 3 1 1
O O,
Odtud již volbou = t dostaneme (víme, že na pravé straně jsou samé nuly)
7 3
tedy množina řešení je
|( - f s, \ s - í, s, t), t, s E IR j neboli j ( - 3s, 7 s - í, 2s, t), t, s e M j.
□
Rozmyslete si, jak by se ukázalo následující jednoduché tvrzení: Tvrzení 1.
(i) Lineární homogenní n x n systém (tj. m = n) má pouze triviální řešení, pokud jej lze převést na ekvivalentní trojúhelníkový systém.
(ii) Je-li m < n, tj. je-li počet rovnic menší než počet neznámých, potom má lineární homogenní m x n systém netriviální řešení.
(iii) Má-li lineární homogenní m x n systém netriviální řešení, potom již má nutně nekonečně mnoho řešení.
(iv) Má-li lineární homogenní m x n systém řešení x a y, potom jsou x + y a c - x také řešení pro libovolné c G IR.
Důkaz. Důkaz třetího tvrzení plyne z části (iv).
□
35
7. Vektory
7.1. Vektory v IRn. Vektor je uspořádaná n-tice reálných čísel, značíme
u = (u1,... ,un), v = (v1,..., vn), w = (w1,..., wn), ....
Pevně zvolené n G N se nazývá dimenze vektoru.
Reálné číslo a je zřejmě speciální případ vektoru (dimenze 1).
Sčítání vektorů definujeme po složkách:
u + v = (u1 + v1,...,un + vn).
Násobení vektoru u číslem a G IR definujeme tak, že každý prvek n-tice u vynásobíme číslem a:
a ■ u = a ■ (ui,..., un) = (a ■ u±,..., a ■ un). Pro sčítání vektorů v IRn zjevně platí pravidla v odstavci 1.2 s nulovým prvkem
0 = (0,...,0) G Wl.
Pro nulový vektor úmyslně používáme stejný symbol jako pro nulu reálných čísel. Podobně budeme pro sčítání a násobení vektorů používat stále stejný symbol (plus a buď tečku nebo prosté zřetězení znaků). Navíc nebudeme používat pro vektory žádné speciální značení, zda se jedná o vektory či čísla bude zřejmé z kontextu. Pro skaláry budeme spíše používat písmena ze začátku abecedy (a, b,c,...) a pro vektory od konce (u, v, w,...), prostředek abecedy nám zůstane na indexy proměných a součtů (i,j,k,...).
Pro vektory u, v G IRn a skaláry a, b G IR platí
a • (u + v) = a ■ u + a ■ v, (VI) (a + b) ■ u = a ■ u + b ■ u, (V2) a ■ (b ■ u) = (a ■ b) ■ u, (V3) 1 • u = u. (V4)
Skalární součin dvou vektorů u, v G IRn je reálné číslo
U ■ V = (Ui, . . . , Un) ■ (Vt, . . . , Vn) = Mi • V1 + U2 ■ V2 H-----h Un ■ Vn = y^^Uj ■ Vj.
1=1
Skalární součin lze tedy brát jako zobrazení • : IRn x IRn —► IR. Příklad 46.
(1, 2, 3) • (2, -3,1) = 1 • 2 + 2 • (-3) + 3-1 = 2- 6 + 3 =-1
□
Pozor! Nepleťte si „násobení vektoru skalárem" (tj. násobení vektoru číslem, kdy je výsledek opět vektor) se „skalárním násobením" (dvou vektorů, kdy je výsledek číslo)!
Pomocí skalárního součinu lze zjednodušit geometrický vztah pro úhel dvou vektorů v odstavci 4.4
u ■ v
COS"í/> = tj———-.
\\u\\ \\v\\'
případně zavést pojem kolmosti mezi vektory, tj. u + v pokud u■ v = 0 (neboli cosip = 0, tj. ip = |).
36
Všimněte si, že pro velikost vektoru u = (ui,..., un) platí
u\\ = \lu\ + • • • + u2n = \Ju ■ u, neboli u ■ u = \\u\\2.
Je-li dimenze obou vektorů 1, je zřejmě skalární násobení vektorů (= čísel) obyčejným násobením čísel.
7.2. Lineární kombinace vektorů v IRn. Mějme vektory v1}... ,vm G IRn (tj. obecně m vektorů, každý z nich má dimenzi n). Potom jejich lineární kombinace je výraz (vektor) tvaru
w = aivi + a2v2 H-----h amvm, kde oi,...,ameI. (11)
Říkáme, že vektor w G IRn je lineární kombinace vektorů v±,... ,vm, pokud existují reálná čísla G IR taková, že platí vztah (11).
Příklad 47. Vektor w = (1,-7,-4) je lineární kombinací vektorů u = (2,1,1) a v = (1,3,2), protože platí
w = 2u-3v = 2-(2,l,l) + (-3) • (1, 3, 2) = (1, -7, -4).
□
Příklad 48. Vektor x = (2 — |s, — 3 + |s — t, s, ŕ) je lineární kombinací vektorů protože platí
u= (2,-3,0,0), v= (-§, |,1,0), ™ = (o,-i,o,i;
a: = 1 -u + s -v + t ■ w = (2, -3,0,0) + s ■ (-§, |, 1, 0) + í • (0,-1,0,1). viz množina řešení v Příkladu 43. □
Množinu všech lineárních kombinací vektorů v1}... ,vm značíme
Span (vi,..., vm), nebo také jen (vi,...,vm).
Příklad 49. V Příkladu 44 (viz také částečně Příklad 48) je množina řešení uvedeného lineárního homogenního systému rovna množině
Span ((-|,|,1,0), (0,-1,0,1)),
protože je každé řešení tohoto systému rovno lineární kombinaci vektorů
^ = (-§,1,1,0), w = (0,-1,0,1).
□
37
7.3. Systémy lineárních rovnic II. Lineární kombinace vektorů lze jednoduše využít pro stanovení řešitelnosti systému lineárních rovnic. Uvažujme lineární m x n systém (LS) z odstavce 6. Označme jako
/ a12\ / aln\
flN := 0.21 a22 , aW: = a2n , b:=
\Oml/ \bmJ
sloupce matice tohoto systému a jako b sloupec pravých stran. Tedy matice systému je potom tvaru
A = (aW a® ... aN) . Potom můžeme lineární systém (LS) zapsat ve tvaru
/ 0-11 \ / a12\ / aln\
a.21 x1 + a22 x2-\-----h a2n Xn b2
\fl"mri) \bm)
tj. ve tvaru
a[1]x1 + a[2]x2 H-----h a[n]xn = b.
Hledané řešení x±,... ,xn můžeme chápat jako koeficienty v lineární kombinaci. Vidíme tedy, že vektor b musí být lineární kombinací sloupců matice A a tudíž jsme dokázali následující charakterizaci řešitelnosti systému lineárních rovnic.
Tvrzení 2. Systém lineárních rovnic (LS) má (alespoň jedno) řešení
sloupec pravých stran b je lineární kombinací sloupců matice systému, tj. b e Span (all],al2],...,aln]).
7.4. Lineární (ne)závislost vektorů v Příklad 50. Nechť jsou dány vektory
Ul = \ l , u2 = i , u3
(a) Množina všech lineárních kombinací dvou vektorů u\ a u2 je Span (ui, u2) = {ai u\ + a2 u2, a±,a2 G IR}
ai
-A
2 + a2 i , a1,a2 G
^ i )
38
(b) Množina všech lineárních kombinací tří vektorů u±, u2 a u3 je
Span (ui,u2,u3) = {ai ui + a2u2 + a3 u3, a1; a2,a3 E R}
'1\ /-2\ /<ř Oi i 2 + a2\ 1 + a3 5 i , a1; a2, % G
1/ \ 1
Pokud si ale všimneme, že vektor
2Ul + u2 = 2 I 2 I + I 1 I = I 5 I =u3
tj. vektor u3 je lineární kombinací vektorů ui a u2, potom lze množinu Span (u1} u2,u3) zapsat pouze pomocí vektorů ui a,u2:
dl Ui + a2u2 + a3u3 = a1u1 + a2u2 + a3 (2ui + u2) = (aľ + 2a3) ui + (a2 + a3) u2.
Tedy je
Span(-Ui,-u2,M3) = Span(-ui,-u2). neboli vektor u3 není potřeba.
Všimněte si také, že platí vztah závislosti mezi těmito vektory
2-ui +lu2 -lu3 =0. \ I / nenulové koeficienty.
□
Má smysl se tedy ptát, kdy v dané množině vektorů některé vektory „přebývají" (ve smyslu generování lineárních kombinací) či kdy tam jsou všechny vektory potřeba.
Definice 1. Vektory ui,...,Uk E Rn jsou lineárně závislé, pokud existují čísla ai,...,a,k E R, z nichž je alespoň jedno nenulové, tak že platí vztah závislosti
ai ui + a2 u2 H-----h ak uk = 0. (12)
V opačném případě se vektory u1} G Rn nazývají lineárně nezávislé, tj. jediné koeficienty
<2i,..., <2fc G IR, pro které platí vztah (12), jsou
al = a2 = ' ' ' = ak = 0.
□
Je zřejmé, že pokud by některý z vektorů itj byl nulový vektor, potom jej můžeme vyřadit, protože do výsledných lineárních kombinací ničím nepřispívá. Budeme proto v dalším bez újmy na obecnosti předpokládat, že všechny vektory u±,..., uk jsou nenulové.
39
Příklad 51.
(a) Vektory u\ a u2 v Příkladu 50(a) jsou lineárně nezávislé, neboť vztah
m /-2\ /*>
ai ui + a2 u2 = ai 2 + a2 \ 1 i = i 0
W v1 / v°,
nutně implikuje, že koeficienty a1; a2 vyhovují homogennímu systému rovnic
ai — 2a2 = 0. 2<2i + 02 = 0. ai + a2 = 0.
který má pouze triviální řešení (01,02) = (0,0) (Ověřte si to!).
(b) Vektory uí} u2 a u3 v Příkladu 50(b) jsou lineárně závislé, neboť splňují vztah
2 Mi + 1 u2 - 1 u3 = 0. tedy ai = 2, a2 = 1, a3 = — 1, přičemž alespoň jeden z těchto koeficientů je nenulový.
Ovšem kdybychom tyto koeficienty neznali, postupovali bychom následovně: položíme
/l\ /-2\ M (ť
ai ui + a2 u2 + a3 -u3 = ai 2 + a2 \ 1 + a3 5 = 0
vv V1 / v3/ v°,
což nutně implikuje, že koeficienty a±, a2, a3 vyhovují homogennímu systému rovnic
ai — 2a2 = 0.
2ai + a2 + 5a3 = 0. fli + «2 + 3a3 = 0.
Tento systém vyřešíme Gaussovou nebo Gauss-Jordanovou eliminací:
'1 -2 0 I 0\ (l -2 0 I 0\ /l 0 2 I 01
2 1 5 0 ~ ••• ~ í 0 1 1 0 ~ í 0 1 1 0 113 OJ \0 0 0 OJ \0 0 0 0,
Volbou a3 = t pak dostaneme a2 = —t, a± = —2t. Jsou tedy řešení tohoto systému tvaru
(ai, a2, a3) = (-2Í, -t, t) = t ■ (-2, -1,1).
Existuje tedy nenulové řešení (a1} a2, a3), a proto jsou vektory ui, u2, u3 lineárně závislé.
Všimněte si, že volbou t = — 1 dostaneme (a1} a2, a3) = (2,1, —1), tedy naše známé koeficienty.
□
V předchozím příkladu jsme tedy viděli, jak poznáme, jestli jsou vektory Ui,u2,... ,Uk lineárně nezávislé nebo závislé. Prostě potřebujeme znát, jestli má homogenní systém
a1u1+a2u2 +----\-akuk = 0 (13)
pouze triviální řešení (a1} a2,..., ak) = (0, 0,..., 0) (=^ lineární nezávislost) nebo alespoň jedno netriviální řešení (a1} a2,..., ak) (=>• lineární závislost, a v tomto případě víme z Tvrzení l(iii) v odstavci 6.4, že těchto řešení je nekonečně mnoho).
Všimněte si, že homogenní systém (13) je typu n x k, protože každý vektor Ui má dimenzi n (tj. máme n rovnic) a neznámých je právě k (tj. tolik, kolik je celkem vektorů ui).
40
Příklad 52. Je snadné ověřit, že dva vektory u, v G IRn jsou lineárně závislé, právě když je jeden z nich násobkem toho druhého. Skutečně, pokud je
a>i u + a2 v = 0, pro nějaké a1; a2 £ ^> (ai> ^2) 7^ (0, 0).
potom je (řekněme, že např. a2 Ý 0)
ai
u, tj. vektor i? je násobkem vektoru u. a2
□
Další vlastnosti lineárně nezávislých vektorů uvedeme později v obecnějším kontextu vektorových prostorů.
41
8. Matice a maticový počet
8.1. Matice. Maticí typu m x n rozumíme obdélníkové schéma reálných čísel
/ all a12 ■ ■ ■ aln \
A
a21 a22 ■ ■ ■ a2n \Qjml dm2 . . . dmn/
m řádků
n sloupců
kde a,j_j G IR pro všechny indexy 1 < i < m, 1 < j < n. Matici A s prvky značíme také A = (a^). Vektor (au, di2,..., ajn) £ IRn nazýváme (i-tý) řádek matice A, i
1,... ,m.
Vektor (a±j, a,2j,... ,a
mj,
nazýváme (j-tý) sloupec matice A, j = 1,..., n.
Matici můžeme také chápat jako zobrazení
A : {1,... ,m} x {1,... ,n} R. Matice typu 1 x n (= řádek) nebo n x 1 (= sloupec) jsou vlastně právě vektory v IRn.
Reálné číslo a je zřejmě speciální případ matice (typu lxl), striktně vzato ale v zápise (a).
I obecné matice lze však chápat jako vektory v
prostě zapomeneme na řádkování.
HJJ;
Zejména tedy je definováno sčítání a odčítání matic a násobení matic skaláry: Jsou-li A B = (bij) matice stejného typu a je-li c G IR, potom klademe
A + B := (a,j_j + b^), A — B := (a^- — b^), c ■ A = (c ■ a^).
Výsledkem sčítání a odčítání matic a násobení matice skalárem je opět matice, která má vždy stejný typ jako původní matice. Později uvidíme, že toto pravidlo obecně neplatí pro násobení matic.
Dále pak matice se nazývá matice opačná k matici A a matice
0 =
-A
se nazývá nulová matice (vhodného typu). Příklad 53. Necht
A --
Potom je
A + B A-B -2- A
2 1 0 1 3 2
■1) 1 ■1) 3
B
2 0 + 3 2 2 + 1
-12 3 -1 2 1
1-2 0-3 3-2 2-1
-2 • 2 -2 • 1
-2 • 1 -2-3
-2-0 -2 • 2
1 3 3 0 5 3
3 2
-4 -2
-1 -3
1 1
-2 0
-6 -4
42
□
Platí proto následující tvrzení:
Tvrzení 3. Předpisy pro matice A + B, c ■ A, —A, 0 zadávají na množině všech matic typu m x n operace sčítání a násobení skaláry splňující axiomy (V1)-(V4), tj.
c-(A + B)=c-A + c-B, (c + d) ■ A = c ■ A + d ■ A, c • (d- A) = (c • d) ■ A. 1 ■ A = A.
8.2. Systémy lineárních rovnic III. Matice lze vhodně využít pro zápis systémů lineárních rovnic. Uvažujme následující systém m rovnic v n proměnných:
CLuXi + 012^2 + • • • + alnxn = bi a2\Xi + a22^2 + • • • + a2nxn = b2
Posloupnost Xi,..., xn lze chápat jako vektor proměnných, tj. jako sloupec v matici typu n x 1 a pravé strany b±,..., bm lze chápat jako sloupec v matici typu m x 1, tj.
ÍXA
X = i, H
\bmJ
Systém rovnic lze pak formálně psát ve tvaru A ■ x = b, neboli
Původní rovnice nyní obdržíme tak, že bereme postupně řádek z matice A a skalárně jej vynásobíme s vektorem proměnných x, tj.
{o-ili ai2, ■ ■ ■ , din) ' x = anX\ + (li2X2 + • • • + dínXn = 6j,
kde i = 1, 2,..., m.
V rovině, tj. pro vektory dimenze 2, jsme už zavedli takovýto počet a viděli jsme, že s ním lze pracovat velice efektivně (viz odstavec 4.3). Nyní budeme postupovat obecněji a zavedeme i na maticích operace násobení.
Konec 3. přednášky (12.10.2009)
43
8.3. Součin matic. Pro libovolnou matici A = (clíj) typu m x n a libovolnou matici B = (b j k) typu n x q definujeme jejich součin jako matici C = A ■ B = (cik), která je typu m x q s prvky
cík — '^^aíjbjk — (ail ai2 ■ ■ ■ din)
fblk\
b2k
\bnk/
pro všechny 1 < i < m, 1 < k < q.
Tj. prvek ve výsledné matici součinu dostaneme tak, že skalárně vynásobíme
(i-tý řádek matice A) ■ (k-tf sloupec matice B).
Pro součin matic symbol • většinou vynecháváme a píšeme jen C = AB, případně Ax = b.
Příklad 54. Je-li matice A typu 2 x 3 a matice B typu 3x4,
A
1 2 3 -2 0 1
-13 2 1 3 = í 2 1 -12 1-10 3.
je jejich součin C = AB maticí typu 2x4, (1 2 3) • ( ^ ) (1 2 3)
C
( -2 0 1 ) • [ 2 J ("'Ol). (-201)- (-1 j (-201)
6 2 0 14 3-7-4 1
Všimněte si, že součin BA není v tomto případě definován, protože „nesedí" dimenze matic. □
Tvrzení 4. Platí následující algebraická pravidla pro počítání s maticemi (kdykoliv jsou tyto operace definovány, tj. kdykoliv mají matice příslušné dimenze):
(i) Sčítání matic je komutativní a asociativní,
A + B = B + A, (A + B)+C = A+(B + C).
(ii) Násobení matic je asociativní,
(A ■ B) ■ C = A ■ (B ■ C).
(iii) Platí distributivní zákony
A-{B + C) = A-B + A-C, (A + B)-C = A-C + B-C.
Důkaz, (i) Výpočet je triviální, protože je sčítání matic definováno po složkách, přičemž komutativita a asociaticita sčítání reálných čísel platí.
44
(ii) Protože reálná čísla splňují asociativní, distributivní i komutativní zákony, můžeme spočítat pro matice A = (a^) typu m x n, B = (bjk) typu n x p a C = (cki) typu p x q
n x q.
A ■ B = í ^ aij ■ bjk j typu mxp, B ■ C = (YbJk ■ cki J typu
^ j=l ' ^ k=l '
(P n x , n p x
Y (' ' °H ) = ( Y a'li ' hik ' °H ) typu m X q-
k=l j=l ' ^ j=l k=l '
(n p x , n p x
^ Oý- • (^ bjk ■ Cki) J = í ^ ^ aý- • • cM J typu m x g. Í=l fc=l ^ ^ j=l k=l '
Platí tedy asociativní zákon pro násobení matic.
(iii) Pro první distributivní zákon musí být matice B a, C stejného typu n x q (přičemž matice A je typu m x n). Ověřte platnost tohoto zákona, stejně tak jako platnost druhého distributivního zákona. □
Jak jsme již ukázali v odstavci 4.3, násobení matic není obecně komutativní. Zejména, je-li součin AB definován, pak BA definován být nemusí. Ale dokonce i když součin BA definován je, nemusí být roven součinu AB (např. může mít jinou dimenzi). Najděte takové příklady matic.
Má-li matice A typ 1 x n (řádek) a matice B typ n x 1 (sloupec), je pak zřejmě násobení matic obyčejným skalárním násobením (vektorů).
Je-li typ obou matic 1 x 1, je zřejmě součin matic (= čísel) obyčejným násobením čísel.
8.4. Čtvercové matice. Je-li v matici A stejný počet řádků a sloupců, tj. m = n, hovoříme o čtvercové matici. Počet řádků (nebo sloupců) pak nazýváme řád (též dimenze) matice A.
Matice
se nazývá jednotková matice (na hlavní diagonále má 1, jinak všude 0). Někdy budeme psát In pro zdůraznění dimenze jednotkové matice (podobně pro nulovou čtvercovou matici 0n). Symbol udává tzv. Kroneckerovu delta funkci,
s .= / X> Pľoi = 3; 13 ' \ 0, pro i Ý j.
Jednotková matice hraje roli jednotkového prvku vzhledem k násobení matic, tj. pro libovolnou matici A typu m x n je
A ■ In = A, Im ■ A = A.
45
8.4.1. Trojúhelníkové matice. Speciálním případem čtvercové matice je matice trojúhelníková, která má buď pod hlavní diagonálou pouze nuly (tzv. horní trojúhelníková matice) nebo nad hlavní diagonálou pouze nuly (tzv. dolní trojúhelníková matice). Na hlavní diagonále mohou být prvky nenulové nebo i nulové.
Tj. čtvercová matice A = (a^) řádu n je horní trojúhelníková, pokud = 0 pro všechny indexy i >j, tj.
A
0 * ..
0 0..
Vo o ..
o */
případně A je dolní trojúhelníková, pokud = 0 pro všechny indexy i < j, tj.
/* 0 ..
A
0 0\
0 o
* o
Příklad 55.
(a) Příklady horních trojúhelníkových matic jsou jednotková matice I nebo nulová matice 0 (obě řádu n) nebo např. matice
2 1 0 0
0 2 0 3
'2 3 -1 0 0 1 0 0-1
(b) Příklady dolních trojúhelníkových matic jsou jednotková matice I nebo nulová matice 0 (obě řádu n) nebo např. matice
2 0 1 3
2 0
3 0
'2 0 0 1 0 0
.3 3 -1
□
Ověřte si, že součin dvou (či více) horních trojúhelníkových matic (případně dolních trojúhelníkových matic) je opět horní trojúhelníková matice (případně dolní trojúhelníková matice).
8.4.2. Diagonální matice. Je-li matice A současně horní i dolní trojúhelníková, potom má mimo hlavní diagonálu pouze nuly. Taková matice se nazývá diagonální. Na hlavní diagonále mohou být prvky nenulové nebo i nulové. Tj. čtvercová matice A = (a^) řádu n je diagonální, pokud = 0 pro všechny indexy i ^ j, tj.
/* 0 ... 0 0\
A
0 * ..
0 0..
Vo o ..
o o
* o
o */
46
Příklad 56. Příklady diagonálních matic jsou jednotková matice I nebo nulová matice 0 (obě řádu n) nebo např. matice
'2 0 0
2 0\ 0 0 0 0 J ' l 0 3
0 3 0 0 0-1
Ověřte si, že součin dvou (či více) diagonálních matic je opět diagonální matice.
8.5. Mocniny matic. Pro čtvercovou matici A řádu n definujeme její mocninu jako A2 := A ■ A, Ak := (A*-1) ■ A = A - (A^1) = A-A---A,
k—krát
přičemž klademe také
Příklad 57. Pro matici
mame
A1 := a A° := I.
A
1 1 1 1
1 M -1 (2 2
1 2
1 ^ i (A 4
1 i 4
a = (j j i • (; ; i = c : i = 2A
2 2 2 2
a3 = f l 11 • i; ; i = 4A
An — \ " I — 9n~1 4
i 2n—^ i 2n—^
Platí jednoduchá pravidla pro počítání s mocninami matic jako u mocnin reálných čísel:
j\k _ j^m _ j^k+m (A^)m _ j^k-m
□
□
8.6. Inverzní matice. S reálnými čísly umíme počítat tak, že z rovnosti a ■ x = b umíme vyjádřit x = a~ľ ■ b = \ ■ b, kdykoliv a ^ 0 (tj. kdykoliv existuje inverze k číslo a). Podobně bychom to měli umět s maticemi, máme ale problém, jak poznat, zda taková „inverzní matice" existuje a jak ji případně spočítat.
Nechť A je čtvercová matice řádu n. Říkáme, že matice B je matice inverzní k matici A, pokud
A ■ B = B ■ A = I.
(Tedy matice I je nutně také řádu n a B je nutně také čtvercová matice a má řád n.)
Píšeme B = A-1. Matici, k níž existuje matice inverzní, říkáme, že je regulární (též invertibilní).
47
Příklad 58. Pro
0 i / 1 0
A = 2 1 0 , B=\ 1 °
\6 3 1 o -3 1/
mame
AB
BA
je tedy B = A a. matice A je regulární.
Všimněte si, že role matic A a B mohou být prohozeny a tedy je také A = B~ľ a B je rovněž regulární. □
Příklad 59. Matice
'0 1
a =
nemá inverzi. Pokud by měla být nějaká matice
B =
0 0
a b c d
inverzní k matici A, potom by muselo platit
"-(s;)-C9-(síK;
což nelze splnit pro libovolnou volbu čísel a, b, c, d. □ Pokud (čtvercová) matice A nemá inverzi, nazývá se singulární.
Základní vlastnosti regulárních a singulárních matic jsou shrnuty v následujícím tvrzení.
Tvrzení 5. Nechť A, B jsou čtvercové matice řádu n.
(i) Je-li A regulární, je její inverze A~ľ určena jednoznačně.
(ii) Je-li A regulární, pak je
(A'1)-1 = A.
(iii) Jsou-li A i B regulární, potom je také AB regulární a platí
(ab)-1 = B~1A~1. (Pozor, pořadí u inverzí se vyměnilo!)
Důkaz, (i) Jsou-li B a C dvě inverze k matici A, tak potom platí vztahy
AB = BA = I, AC = CA = I. S využitím asociativity násobení matic je potom
B = B-I = B{AC) = {BA)C = I-C = C.
(ii) Tento vztah je triviální.
(iii) Má-li nějaká (čtvercová) matice C být inverzí k matici AB, musí splňovat vztahy
{AB)C = C{AB) = I.
48
Snadno se ověří, že matice C := B 1A 1 tyto vztahy splňuje. Podle bodu (i) je pak tato matice (jedinou) inverzí k matici AB, a proto je také součin AB regulární maticí. □
Poznámka 1. Ještě trochu více přesněji k tvrzení (iii) - lze ukázat, že pokud je A regulární, tak potom je AB (a tedy i BA) rovněž regulární, právě když je B regulární.
Tvrzení o inverzi k součinu lze jednoduše rozšířit na součin tří (a více) matic (za předpokladu regularity příslušných matic):
{ABC)-1 = C^B^A-1.
□
Protože s maticemi umíme počítat zrovna jako s čísly, jen mají složitější chování, můžeme formálně snadno řešit systémy lineárních rovnic: Jestliže vyjádříme soustavu n rovnic pro n neznámých součinem matic
••: ':)■{]) (:) .
\Qinl . . . CLnn/ \XnJ \bn/
a existuje-li matice inverzní k matici A, pak lze násobit zleva maticí A~ľ a dostaneme
A'1 ■ b = A'1 ■ A ■ x = I ■ x = x. tj. hledané řešení je součin matice A^1 s vektorem pravých stran.
Naopak rozepsáním podmínky A-A~ľ = I pro neznámé hodnoty v (hledané) matici A~ľ dostaneme n systémů lineárních rovnic se stejnou maticí A na levé straně a s vektory (postupně)
f1}
0 i 0
Voj {o) W
napravo.
Později si ukážeme, jak lze jednoduše vypočítat matici A-1. Pro začátek ale můžeme uvést vzorec pro výpočet inverze k matici typu 2x2:
A
a b c d
A'1
1 í d -b
detA \-c a
kde det A = ad — bc je determinant matice A. Ověřte přímým výpočtem, že jsou splněny definiční vztahy pro inverzi.
Je tedy vidět, že matice A řádu 2 je regulární <š=> det A/0(a tedy A je singulární <š=> det A = 0.)
Pomocí mocnin lze nyní snadno definovat „záporné mocniny" regulárních matic:
A'2 ■= (A'1)2 = A'1 ■ A~\ A-k := A~k+1 ■ A~\ S těmito zápornými exponenty se pak počítá jako s normálními exponenty u reálných čísel, např.
A'3 ■ A4 = A-3+4 = Al = A, A3- A'3 = A3'3 = A° = I, (A3)'2 = A3<^ = A~6.
49
8.7. Komutující matice. Pokud se (náhodou) stane, že pro součin dvou matic platí
a-b = b-a
(a pak jsou nutně matice a i b čtvercové a stejného řádu), pak o těchto maticích říkáme, že komutují.
Např. jednotková matice In komutuje s libovolnou maticí a řádu n. Matice a komutuje se sebou samou či se svou libovolnou mocninou. Regulární matice a komutuje se svou inverzí a~ľ či s libovolnou její mocninou. Libovolná diagonální matice a komutuje s libovolnou diagonální maticí b (téhož řádu).
Najděte konkrétní příklady komutujících matic, alespoň pro řád n = 2.
8.8. Transponovaná matice. Nechť a = (a^) je matice typu m x n. Matici at := (aji), nazýváme transponovaná matice k matici a.
Matice at vznikne tak, že řádky matice a napíšeme do sloupců (nebo sloupce matice a do řádků). Má tedy matice at typ n x m.
Příklad 60.
/2 1\
a = 2 2 , at
2 2 1 1 2 3
b=i: :i, bt = í2 1\=b.
1 3
□
Tvrzení 6. Platí následující vztahy:
(at)t = a, (a + b)t = at + bt, {ab)t = btat (Pozor, pořadí u transponovaných matic se vyměnilo!).
(aTV = (a-Y-
Důkaz. Zkuste si provést důkazy sami, jsou opravdu jednoduché. □
8.9. Symetrické matice. Nechť a je čtvercová matice řádu n. Matice a se nazývá symetrická, pokud at = a.
Příklad 61. Jednotková matice In a nulová matice 0n jsou symetrické. Dále, např.
'2 ť
je symetrická.
není symetrická, je symetrická.
□
Tvrzení 7.
(i) Pro libovolnou (třeba i obdélníkovou) matici A typu m x n jsou následující matice symetrické:
ATA řádu n, AAT řádu m.
(ii) Je-li A symetrická (tedy čtvercová) matice, potom jsou následující matice také symetrické:
Ak, pro všechna k G N.
(iii) Je-li A symetrická (tedy čtvercová) regulární matice, potom jsou následující matice také symetrické:
a-1, A~k, pro všechna k G N. Důkaz. Symetrie uvedených matic se snadno ověří za pomoci Tvrzení 6. □
Příklad 62. Jsou-li A i B symetrické matice, potom jejich součin AB nemusí být symetrická matice! Vskutku, pro
A = (2 3) ' B = (yl -2) ' ^S°U symetrické;
□
Tvrzení 8. Nechť A a B jsou symetrické matice. Potom je AB symetrická matice <š=> matice A a B komutují.
Důkaz. Předpokládejme, že AB je symetrická, tj. (AB)T = AB. Potom je
AB = (AB)T = BTAT = BA,
neboť jsou matice A, B symetrické. Tedy matice A a, B komutují.
Naopak, předpokládejme, že matice A a, B komutují, tj. AB = BA. Potom je
(AB)T = BTAT = BA = AB,
tedy je matice AB symetrická. □
Příklad 63. Matice A & B z Příkladu 62 nekomutují, protože jejich součin AB není symetrická matice. Ověřte tento fakt přímým výpočtem toho druhého součinu BA. □
51
8.10. Systémy lineárních rovnic IV. Elementární řádkové úpravy, viz odstavec 6.1, lze jednoduše popsat pomocí maticového násobení.
Nechť A je matice typu m x n. Následující elementární řádkové úpravy jsou reprezentovány vynásobením matice A zleva (!) čtvercovou maticí E typu m x m, kde
I. záměna i-tého a j-tého řádku matice A je reprezentována maticí
/l 0 ... \ 0 1 '••
E1
0 ... 1
1 ... 0
v
1/
tj. tato matice vznikne z jednotkové m x m matice I tak, že v matici I zaměníme i-tý a j-tý řádek (viz Příklad 64 níže).
II. vynásobení i-tého řádku matice A nenulovým číslem a je reprezentováno maticí
A \
E<)
1
V
1/
tj. tato matice vznikne z jednotkové m x m matice J tak, že v i-tém řádku matice I napíšeme místo jedničky číslo a.
III. přičtení a-násobku i-tého řádku k j-tému řádku je reprezentováno maticí
\
A o
0 1
E-*
1
1/
tj. tato matice vznikne z jednotkové m x m matice J tak, že v matici I napíšeme na ji-tou pozici místo nuly číslo a (viz Příklad 64 níže).
Matice Ek uvedené výše se nazývají elementární matice příslušející jednotlivým elementárním úpravám.
52
Příklad 64. Mějme matici
A = Potom
I. záměna druhého (tj. i = 2 a j = 3) a třetí řádku matice A je reprezentována maticí
/l 0 0\ /l 0 0\ / 2 1 3\ / 2 1 3N
£i=001 tj. Ex ■ A = 0 0 1 • -1 0 1 = 2 24 \0 1 0/ ^0 10/^224/ \-l 0 ly
II. vynásobení prvního (tj. i = 1) řádku matice A číslem 5 je reprezentováno maticí
2
#2=010 tj. E2- A
tj. E3-A
tj. #4-^4
3^
=
' \
= 1 a j
, /
=
= 3 a j
, /
=
4y
□
Všimněte si, že násobení matice A některou elementární maticí zleva způsobuje v matici A příslušnou řádkovou úpravu.
Kdybychom definovali elementární sloupcové úpravy podobným způsobem jako jsme v odstavci 6.1 definovali elementární řádkové úpravy, potom těmto sloupcovým úpravám odpovídá násobení matice A příslušnou elementární maticí E^ zprava.
Příklad 65. Vyzkoušejte si násobení matice A a Příkladu 64 příslušnými elementárními maticemi zprava:
I. záměna druhého (tj. i = 2 a j = 3) a třetí sloupce matice A je reprezentována maticí
/l 0 0\ / 2 1 3\ (l 0 0\ / 2 3 1N
E1 = 0 0 1 tj. A-E1 = I-1 0 1 • 0 0 1 = I-1 1 0 \0 1 0/ \ 2 2 4/ \0 1 0/ \24 2y
II. vynásobení prvního (tj. i = 1) sloupce matice A číslem 5 je reprezentováno maticí
/5 0 0\ £2 = í 0 1 0 tj. A ■ E2 =
53
lila. přičtení dvojnásobku prvního sloupce ke třetímu sloupci (tj. i = 1 a j = 3) je reprezentováno maticí
/l 0 2\ / 2 1 3\ (l 0 2\ / 2 1 7
£73 = ( 0 1 0 tj. a-£3 = I-1 0 1 • 0 1 0 = I-1 0 -1 \0 0 1/ \ 2 2 4/ \0 0 1/ \2 2
Illb. přičtení dvojnásobku třetího sloupce k prvnímu sloupci (tj. i = 3 a j = 1) je reprezentováno maticí
'2 1 3N
£74 = | 0 1 0 | tj. A ■ EA = | -1 0 1
2 2 4,
□
Protože ale sloupcové úpravy nezachovávají množinu řešení lineárního systému (v podstatě zaměňují pořadí proměnných Xi), nebudeme se sloupcovým úpravám výrazněji věnovat. Soupcové úpravy (přesněji tedy násobení matice A elementárními maticemi E\~ zprava) ale budou důležité pro odvození různých rozkladů matic.
Tvrzení 9. Každá elementární matice E^ je regulární a její inverze E^1 je elementární maticí téhož typu.
Důkaz. I. Inverzní operace k výměně dvou řádků je následná výměna těchže řádků, a proto je 1 = El
II. Inverzní operací k vynásobení i-tého řádku matice A nenulovým číslem a je vynásobení i-tého řádku matice A číslem ^, tedy je E^1 elementární matice téhož typu jako je E2, ale na místě čísla a je číslo -.
J a
III. Inverzní operací k přičtení a-násobku i-tého řádku k j-tému řádku je opětovné přičtení — a-násobku i-tého řádku k j-tému řádku, tj. tedy je E^1 elementární matice téhož typu jako je E3, ale na místě čísla a je číslo —a. □
Příklad 66. Stejně jako v Příkladu 64 je
I. záměna druhého a třetího (tj. i = 2 a j = 3) řádku matice A je reprezentována maticí
A o o\ (i o o\
£i = o 0 1 , E,1 = 0 0 1 , \0 1 0/ \0 1 0/
II. vynásobení prvního (tj. i = 1) řádku matice A číslem 5 je reprezentováno maticí
/5 0 0\ A 0 0\
£2 = 0 1 0 , E2X = j 0 1 0 J . \0 0 1/ \0 0 1/
lila. přičtení dvojnásobku prvního řádku ke třetímu řádku (tj. i = 1 a j = 3) je reprezentováno maticí
/l 0 0\ / 1 0 0\
£73=010, E,1 = 0 10, \2 0 1/ \-2 0 1/
54
Illb. přičtení dvojnásobku třetího řádku k prvnímu řádku (tj. i = 3 a j = 1) je reprezentováno maticí
/l 0 2\ /l 0 -2N
£4=010, EAX = 0 1 0
\0 0 1/ \0 0 1
Ověřte přímým výpočtem, že v každé z výše uvedených situací je Ek ■ Ek 1 = Ek 1 • Ek = I. □
O dvou maticích A, B říkáme, že jsou (řádkově) ekvivalentní, pokud lze jednu z nich převést konečně mnoha (řádkovými) elementárními úpravami na druhou, tj. pokud existují elementární matice Ei,..., E k takové, že
B = EkEk-\ ■ ■ ■ EXA.
Tedy dva systémy Ax = b a Bx = c lineárních rovnic jsou ekvivalentní, pokud jsou jejich rozšířené matice (A | b) a (B | c) (řádkově) ekvivalentní.
V podstatě jsme tedy dokázali následující tvrzení.
Tvrzení 10. Nechť A je matice typu n x n. Potom
matice A je regulární <š=> matice A je ekvivalentní s jednotkovou maticí I řádu n,
homogenní lineární systém Ax = 0 má pouze triviální řešení, lineární systém Ax = b má jediné řešení, a to řešení x = A~ľb, matice A je singulární <š=> homogenní lineární systém Ax = 0 má netriviální řešení.
Předchozí tvrzení také přímo dokazuje část (i) ve Tvrzení 1 (které se týká lineárních homogenních systémů).
Zbývá ukázat, jak najít inverzní matici A~ľ k (regulární) matici A a jak poznat, jestli je matice A regulární.
Úprava matice na schodovitý tvar má následující důležitý důsledek. Pro libovolnou matici A dostaneme násobením vhodnou regulární maticí P := E\~ - • • E\ zleva (odpovídající elementárním řádkovým úpravám) její ekvivalentní řádkový schodovitý tvar A' := P ■ A.
Podobně, jestliže aplikujeme tentýž eliminační postup na sloupce, dostaneme z každé matice B její sloucový schodovitý tvar B' vynásobením vhodnou regulární maticí Q := Qi ■ ■ -Qg.
Pokud ale začneme s maticí B = A', která již je v řádkově schodovitém tvaru, eliminuje takový postup pouze všechny dosud nenulové prvky mimo hlavní diagonálu této matice. Na závěr lze ještě i tyto diagonální prvky změnit elementárními operacemi změnit na jedničky. Celkem jsme tedy ukázali důležitý výsledek, ke kterému se budeme mnohokrát vracet:
Věta 2. Pro každou matici A typu m x n existují čtvercové regulární matice P řádu m a Q řádu n takové, že matice P ■ A je v řádkově schodovitém tvaru a platí
(\ ... 0 0 ... .
P-A-Q
0 0
1 0
o o
o o
o o ...... 0/
55
8.11. Výpočet inverzní matice. V Tvrzení 10 jsme viděli, že regularita n x n matice A znamená, že je A ekvivalentní s jednotkovou matici J, tj. existují elementární matice E±,..., Ek takové, že
EkEk-i ■ ■ ■ EiA = I.
Využijme asociativitu násobení matic a uzávorkujme tento vztah následovně:
(EkEk-1...E1)-A = I, neboli (EkEk^ ... E{) ■ I = A'1. (14)
Potom lze snadno vidět, že pro matici
B := EkEk-x ...Ex platí B ■ A = I neboli B = A'1.
Našli jsme tedy inverzní matici A 1 k matici A. Zbývá jen „přečíst", jak se výše uvedená matice B = A~ľ zkonstruuje.
Vidíme, že je matice B součinem elementátních matic Ek a víme, že tyto elementární matice reprezentují postup, jak matici A převést na ekvivalentní jednotkovou matici J. Vztah (14) můžeme proto číst jako postup pro nalezení inverzní matice k matici A:
Tvrzení 11. Nechť A je čtvercová matice řádu n.
(i) Tytéž elementární řádkové úpravy, které převádí matici A na jednotkovou matici I, také převádí jednotkovou matici I na matici A~ľ. Neboli matici A~ľ nalezneme tak, že rozšířenou matici (A | J) převedeme řádkovými úpravami na matici (I | *); a potom na místě * je matice A~ľ. Tj. platí
(A\I) ~ (IIA-1).
(ii) Pokud se při elementárních úpravách matice (A | J) objeví na levé straně řádek nul, potom matice A nemá inverzi, tj. A je singulární matice.
Příklad 67. Rozhodněte, zda existuje matice inverzní k následujícím maticím a případně tyto inverze vypočtěte:
/l 0 l\ /l 0 1
A=3 3 4, 5=3 2 4 \2 2 3/ \2 2 3
56
Řešení. Pro matici A máme
'i o GG
10 10
^0 0 1
'10 0 10 10
,0 0 1
0 1 1 0 0\ (-3) e 1 (-2)©
3 4 0 1 0
2 3 0 0 1/
0 1 1 0 0N
3 1 -3 1 0 )<—
2 1 -2 0 1, ' (-1) © 1
0 1 1 0 °\
1 0 -1 1 - -i (-2) e 1
Í2l 1 -2 0 1/-
Je tedy
A
-i
(Ověřte, že platí A • A~ = A~ ■ A = I.
Pro matici B máme
(B\I)
0 1
2 4 2 3
1 0 1 0 2 1
0 2 1
1 0 1 0 2 1 0 0 0
řádek nul v levé matici
Matice B je tedy singulární, tj. neexistuje k ní inverzní matice.
□
Příklad 68. Vyřešte lineární systém Ax = b, kde matice A je dána v Příkladu 67 a vektor pravých stran je
57
Řešení. Protože jsme v Příkladu 67 spočítali inverzní matici k matici A, je hledané řešení jedniné (viz také Tvrzení 10) a to
x = A~xb =
Tedy je množina řešení tohoto systému rovna
(0,-1, i;
□
8.12. Hodnost matice. Nechť A je matice typu m x n. Hodnost h(Á) matice A je maximální počet jejích lineárně nezávislých řádků. Je tedy vždy h(A) G {0,1,..., m}.
h(B) = 2, h(C) = 2.
Hodnost nulové matice je 0, hodnost jednotkové matice je n, tj. h(0) = 0, h(I) = n. □
Protože elementární (řádkové či sloupcové) úpravy nemění hodnost matice, je číslo h(A) rovno počtu nenulových řádků v ekvivalentním schodovitém tvaru matice A. Zejména se hodnost matice A nemění při násobení matice A regulární maticí (ať už zleva nebo zprava).
Pokud bychom upravili matici A do schodovitého tvaru pomocí Gauss-Jordanovy eliminace (tj. včetně vyeliminování všech prvků nad všemi pivoty), potom je h(Á) rovno počtu vedoucích jedniček v nenulových řádcích = počtu pivotů = maximálnímu počtu lineárně nezávislých sloupců, viz Věta 2, ve které jsme ukázali
0 0 ...... 0\
1 0 ...... 0
0 0 ...... 0 '
0 0 ...... 0/
Platí tedy následující tvrzení.
Věta 3. Nechť A je matice typu m x n. Matice A má stejný počet h(Á) Unárně nezávislých řádků a lineárně nezávislých sloupců. Zejména je hodnost matice A vždy nejvýše rovna menšímu z rozměrů man matice A, tj. h(A) < min{m, n}.
Přiklad 69. Pro matice
'o J1
jsou jejich hodnosti
HA) = 1,
P-A-Q
0 0
Vo
Z této věty např. plyne, že hodnost každé regulární matice řádu n je právě n, protože každá regulární matice je ekvivalentní s jednotkovou maticí řádu n.
58
8.13. Systémy lineárních rovnic V. Pomocí hodnosti matice systému h(Á) a hodnosti rozšířené matice systému h(A\b) lze jednoduše testovat řešitelnost systému lineárních rovnic (LS) s maticí A typu m x n a vektorem pravých stran b G IRm. Zřejmě je vždy h(Á) < h(A\b), protože přidání sloupce b může hodnost matice případně jenom zvýšit. Otázka je, kdy přidání sloupce b skutečně zvýší hodnost matice systému a kdy nikoliv.
Věta 4 (Frobeniova věta). Systém lineárních rovníc (LS) má (alespoň jedno) řešení
hodnost matice systému je rovna hodnosti rozšířené matice systému, tj. h(A) = h(A\b).
Důkaz. Toto tvrzení plyne přímo z Tvrzení 2 (o řešitelnosti systému lineárních rovnic pomocí lineárních kombinací) v odstavci 7.3. Je-li totiž x G IRn řešením systému Ax = b, je podle Tvrzení 2 sloupec pravých stran b lineární kombinací sloupců matice A, a tedy je nutně h(Á) = h(A\b).
Naopak, platí-li h(Á) = h(A\b), potom je (co se týká generování lineárních kombinací pomocí sloupců matice vektor b „zbytečný", tj. vektor b je lineární kombinací sloupců matice A.
Neboli existují čísla tak, že platí
/all\ / a12\ / aln\
021 X1 + a22 x2-\-----h a2n Xn b2
Vml/ \bm)
viz odstavec 7.3. Je tedy n-tice ) hledaným řešením systému Ax = b. □
Příklad 70. Pomocí Frobeniovy věty rozhodněte o řešitelnosti systému lineárních rovnic
2x\ + x2 — x% — X4 = —3.
xi — x2 + x% — X4 = —2.
3xi + 3^3 — 5x4 = —8.
—2a:! — x2 + 4x3 — 2x4 = 0.
Řešení. Gaussovou eliminační metodou upravíme rozšířenou matici systému (a tedy současně také matici systému) na schodovitý tvar:
-3\ A -1 1 -1 I -2\
(2 1
-1 -1 1-11-1
3 0 3 -5
-2 -1 4 -2
0 3 0 0
^0 0 0 0
Je tedy
h(A) = 3, h(A\b) = 3, h(A) = h(A\b),
a proto má tento systém alespoň jedno řešení. Můžete si ověřit (viz demonštratívni cvičení), že množina řešení je
t.
2,2
'3 ^ 3
t,t-l, t), t G IR j.
□
59
Příklad 71. Pomocí Frobeniovy věty rozhodněte o řešitelnosti systému lineárních rovnic
2x1 + x2 - x3 — rc4 = -3
Xi - x2 + x3 — rc4 = -2
3xi + 3x3 — 5rr4 = 7
2xx - x2 + 4x3 — 2rr4 = 0
Řešení. Gaussovou eliminační metodou upravíme rozšířenou matici systému (a tedy současně také matici systému) na schodovitý tvar:
f 2 1 -1 -1 -3\ (l -i 1 -1 -2\
1 -1 1 -1 -2 0 3 -3 1 1
3 0 3 -5 7 0 0 1 -1 4
V"2 -1 4 -2 °J 0 0 0 -15/
Je tedy
h(A) = 3, h(A\b) = 4, h(A) < h(A\b), a proto tento systém nemá řešení. □
Všimněte si, že pro homogenní systém je podmínka h(Á) = h(A\b) splněna vždy, neboť je b = 0 (nulový vektor). Tedy podle Frobeniovy věty má každý homogenní systém alespoň jedno řešení (samozřejmě, je to alespoň triviální řešení).
8.14. Lineární (ne)závislost vektorů pomocí matice. Regulární a singulární matice umožňují jednoduše charakterizovat lineární nezávislost a závislost n vektorů u±,..., un g IRn (viz odstavec 7.4, kde položíme počet vektorů k = n). Mají-li být vektory u±,..., un lineárně nezávislé, musí mít lineární
systém
a,i Ui + a2 u2 + • • • + an un = 0 (15)
pouze triviální řešení (a1}... ,an) = (0,..., 0) (viz Tvrzení 10). To nastane právě tehdy, když je čtvercová matice
U := (ui ... un) , jejíž sloupce jsou právě vektory u1}..., un, regulární.
A naopak, pro lineární závislost vektorů u1}... ,un musí mít systém (15) alespoň jedno netriviální řešení (a1;..., an), tedy matice U musí být singulární.
Platí tedy následující charakterizace lineární (ne)závislosti n vektorů v IRn.
Tvrzení 12. Nechť jsou dány vektory u±, ...,ii„el" a nechť U je matice, jejíž sloupce jsou vektory Ui,..., un. Potom
vektory u±,..., un jsou lineárně nezávislé ^ matice U je regulární, vektory u±,..., un jsou lineárně závislé ^ matice U je singulární.
60
Příklad 72. Rozhodněte o lineární (ne)závislosti vektorů
Ul = \ l , u2 = l , u3
(viz také Příklad 50(b) v odstavci 7.4). Řešení. Matice U je
Matici £7 upravíme Gaussovou eliminací na schodovitý tvar:
'1 -2 0\ /l -2 0'
2 1 5 ~ ••• ~ I 0 1 1 vl 1 3/ \0 0 0,
Protože se objevil řádek nul, je matice U singulární (srovnejte s Tvrzením ll(ii)), a tedy jsou vektory u±, u2, u% lineárně závislé. □
Konec 4. přednášky (19.10.2009)
61
9. Determinanty
V odstavcích 4.3 (lineární zobrazení a matice pro n = 2), 4.5 (obsah trojúhelníka) a 8.6 (inverzní matice) jsme viděli, že pro čtvercovou matici A = (" hd) řádu 2 je užitečné sledovat číslo
áetA
a b c d
:= ad — bc.
které lze využít např pro výpočet obsahu trojúhelníka (nebo kosodélníka) či pro test regularity matice A.
Pro n = 1, tedy matici A = (a) řádu 1 tuto funkci plní přímo číslo a (matice A je v tomto případě regulární, pokud je det A = a ^ 0).
Nyní budeme takové číslo det A G IR definovat pro libovolnou čtvercovou matici řádu n a ukážeme, že má právě ty vlastnosti, které jsme potřebovali výše.
9.1. Definice determinantu. Nechť A = (a^) je čtvercová matice řádu n. Označme jako její podmatici řádu n — 1, která vznikne tak, že v matici A vynecháme i-tý řádek a j-tý sloupec. Potom výraz |Mý| nazveme jako minor příslušející prvku a^.
Dále nazveme výraz Aíj := (—l)1"1^' |Mý| jako algebraický doplněk příslušející prvku a^.
Příklad 73. Pro matici
A
je
\M-
12
3 4 2 3
minor příslušející prvku a±2,
matici A jsme vynechali první řádek a druhý sloupec) a
a+2
M-
12
3 4 2 3
je algebraický doplněk příslušející prvku a±2.
Případně je
IM-
33
\3+3
M:
33
1 0
3 3
1 0
3 3
minor příslušející prvku a33, algebraický doplněk příslušející prvku 033.
□
Příklad 74. Pro matici
máme
an = a Mu = d, An = (-1 l1- -1 Mu = d,
au = b M12 = c, A12 = (-1 l1- 2 |M12 = —c
a2i = c M21 = b, A21 = (-1 )2- -1 M21 = -b
a22 = d M22 = a, A22 = (-1 )2- -2 M22 = a.
62
Všimněte si nyní, že výraz det A = ad — bc je roven kterémukoliv z výrazů
au Au + a12A12 = ad + 6(-c), (16) «21 ^21 + «22^22 = c(-b) + da. aii^ii + a21A21 = ad + c(—b), a12A12 + a22^22 = K~c) +
□
Definice 2. Determinant matice A = (a^) řádu n je číslo det A G
det A = \A\
all a12 0-21 a22
aln a2n
anl an2
(In,
auAu + a12A12
alnA
ln;
pokud n = 1. pokud n > 1.
Tento výraz se nazývá (Laplaceův) rozvoj determinantu podle prvního řádku. Řád n matice A se v tomto případě nazývá řád (též stupeň) determinantu \A\. □
Příklad 75.
i) Pro determinant matice A z Příkladu 73 je
au Au + 012^12 + a13A13
1 0 1
3 3 4
2 2 3
1-r-l
, í+i
0-r-l
(9
3 4 2 3
0 + (6-6) = 1.
,1+2
3 4 2 3
1-r-l
,1+3
3 3 2 2
[i) Pro determinant matice A z Příkladu 74 je
a ^ = ad + b(—c) = ad — bc. (viz vzorec (16).)
□
Šipka u prvního řádku v Příkladu 75 naznačuje, že byl determinant vypočítán rozvojem podle prvního řádku.
Determinant řádu n se tedy (z definice) převede na výpočet n determinantů řádu n — 1. Poté se každý z těchto n determinantů řádu n — 1 převede na výpočet n — 1 determinantů řádu n — 2, atd. Tedy výše uvedená definice determinantu je rekurentní vzhledem k řádu determinantu.
Více odborně lze determinant řádu n definovat přímo za pomoci permutací množiny {1,2,... ,n}, viz skripta prof. Slováka.
63
Poznámka 2. V Příkladu 74 jsme viděli, že determinant libovolného z výrazů
a b c d
au Au + a12A12 = ad + b(—c),
a21A21 + a22A22 = c(—b) + da, onAn + a21A21 = ad + c(—b), a12A12 + a22A22 = b(-c) + da,
a b c d
ad — bc lze spočítat pomocí
rozvoj podle 1. řádku.
rozvoj podle 2. řádku, rozvoj podle 1. sloupce, rozvoj podle 2. sloupce.
Toto je vlastnost všech determinantů, tj. platí následující tvrzení.
Věta 5. Determinant \A\ můžeme vypočítat rozvojem podle libovolného řádku nebo sloupce, tj. det A = anAn + ai2Ai2 + • • • + ainAin, ... rozvoj podle i-tého řádku.
= aijAij + a2jA2j + • • • + anjAnj, ... rozvoj podle j-tého sloupce.
Důkaz. Důkaz nebudu uvádět, lze jej nalézt ve skriptech.
□
Při výpočtu determinantu budeme proto vždy naznačovat šipkou řádek nebo sloupec, který použijeme pro rozvoj determinantu (vyjma determinantu řádu 2, který umíme vypočítat přímo, případně kromě determinantu řádu 3, pokud tento budeme počítat Saarusovým pravidlem).
Dokonce lze determinant počítat pomocí rozvoje podle několika (libovolných) řádků nebo sloupců, pokud bychom definovali příslušné minory. Tuto obecnější metodu ale nebudeme probírat.
Důsledek 1 (Saarusovo pravidlo). Pro determinant \A\ řádu n = 3 platí pravidlo
=alla22a33 + a12a23a31 + a13a21a32 — a13a22a31 — a12a21a33 — alla23a32-
an a i3
a2i a22 a23
O31 «32 033
Důkaz. Rozvojem podle prvního řádku dostáváme
all a12 a13
a21 a22 a23
«31 a32 033
«11 (-1
,1+1
a22 a23 a32 a33
«12 ("I
1+2
a21 a23 a31 a33
0.13 (-1
>l+3
a2i a22
a31 a32
— «11 («22^33 — 023a32) — «12 (021^33 — 023a3l) + a13 («21 «32 _ O22O31).
Přeskládáním jednotlivých sčítanců dostáváme výsledek.
□
Toto pravidlo si lze jednoduše zapamatovat (odvodit), pokud si napíšeme první dva sloupce determinantu řádu 3 ještě jednou vedle našeho determinantu, tj.
all a12 a13
a2i a22 a23
0.31 O32 033
all a12 0.21 0.22 O31 032
Nyní budeme brát tři součiny na hlavních diagonálách s kladným znaménkem © a tři součiny na vedlejších diagonálách se záporným znaménkem 0 (viz obr.).
64
Příklad 76. Pro determinant z Příkladu 75 platí podle Saarusova pravidla
1 0 1 1 0 1 1 0
3 3 4 = 3 3 4 3 3 = 1.3.3 + 0.4.2 + 1.3.2 - 1.3.2 - 1.4.2 - 0.3.3 = 9-8 = 1
2 2 3 2 2 3 2 2
□
Nejvýhodnější je počítat determinant rozvojem podle toho řádku či sloupce, který obsahuje nejvíce nul.
Příklad 77.
I
2 10 3 3-120 0 2 3 2 -1-2 0 3
-156.
□
Determinant můžeme chápat jako zobrazení det : Matnxn —► IR, kde označujeme jako Matr množinu všech matic typu m x n (tedy Matnxn je množina všech čtvercových matic řádu n).
9.2. Vlastnosti determinantů. Je zřejmé, že determinant jednotkové matice je 1, tj. |J| = 1, a determinant nulové matice je 0, tj. |0| = 0.
Nechť A = (dij) a B = (bij) jsou čtvercové matice řádu n.
Věta 6. Determinant matice splňuje následující vlastnosti:
(i) Determinant matice A a matice transponované je tentýž, tj.
\A\ = \AT\.
(ii) Determinant součinu matic je roven součinu determinantů (tzv. Cauchyova věta), tj.
\AB\ = \A\. \B\.
(iii) Je-li A regulární matice, potom je
1
w
\A
-i
(iv) Je-li A (horní nebo dolní) trojúhelníková matice, potom je \A\ roven součinu prvků na hlavní diagonále, tj.
— alla22 • • • ann-
Zejména je determinant diagonální matice roven součinu prvků na hlavní diagonále.
(v) Jestliže je v matici A nulový řádek nebo sloupec, potom je \A\ = 0.
65
Důkaz, (i) Rozvoj determinantu \A\ podle i-tého řádkuje roven rozvoji determinantu \A\ podle i-tého sloupce, což je rozvoj determinantu \AT\ podle i-tého řádku. Proto je \A\ = \AT\.
(ii) Tento důkaz vynecháme, ale je uveden ve skriptech.
(iii) Pro regulární matici A platí AA
\AA
-ii
\A\ . lA'1] a tedy platí, že \A
L - /, a proto je \AA 1
-i| J_
- \A\-
\I\ = 1. Podle části (ii) je ale
(iv) Determinant trojúhelníkové matice se jednoduše spočítá rozvojem podle prvního sloupce (pro horní trojúhelníkovou matici), případně podle prvního řádku (pro dolní trojúhelníkovou matici), např.
\A\
i
au * 0 a22
0 0 0 0
an—l,n—l *
0
ar
au A
ii
au (-1
I
a22 * 0 a33
0 0 0 0
an—l,n—1 *
0 Q"nr
axxa22 (-1
, í+i
I
0
fllla22 • • • ann-
(v) Je-li v matici A nulový řádek nebo sloupec, potom rozvoj determinantu podle tohoto řádku nebo sloupce dává \A\ = 0. □
V dalším uvedeme vlastnosti determinantu a řádkových elementárních úprav (viz odstavec 8.10). Tyto vlastnosti ukážeme pro řádkové úpravy (pomocí násobení elementárními maticemi zleva), analogicky by se ukázaly pro sloupcové úpravy (pomocí násobení elementárními maticemi zprava).
I. Záměna dvou řádků v determinantu. Již víme, že záměna dvou řádků v matici A je realizována vynásobením matice A zleva elementární maticí
o
\
0
1
\
1/
Snadno se vypočítá, že \E\
|£i
1, např. pro n = 3 a záměnu 2. a 3. řádku je 1 0 0
1.
0 0 1 0 1 o
0 1
1 o
Dále je podle Věty 6(ii) o determinantu součinu
1^1 = 1^1. |A| = -L4|.
66
Platí proto následující pravidlo.
Tvrzení 13. Záměna dvou řádků nebo sloupců v determinantu mění znaménko determinantu.
II. Vynásobení i-tého řádku determinantu číslem a. Tato operace je realizována vynásobením ma-
\
tice A zleva elementární maticí
/l
1
V
v
a. Dále je podle
Podle Věty 6(iv) o determinantu diagonální matice se snadno spočítá, že \E2\ Věty 6(ii) o determinantu součinu
\E2A\ = \E2\.\A\ =a\A\.
Platí proto následující pravidlo.
Tvrzení 14. Vynásobení některého řádku nebo sloupce determinantu číslem a dává a-\A\. Zejména lze vytýkat společného činitele v libovolném řádku či sloupci před determinant.
Příklad 78.
44 33 77
2
3
1
7
14
4 3 S 4 3 1
= 11 • 2 1 0 = 11-7- 2 1 1
3 8 E3 3 8 2
□
III. Přičtení a-násobku i-tého řádku determinantu k j-tému řádku determinantu. Tato operace je realizována vynásobením matice A zleva elementární maticí
(\ 0 \ 0 1
\
1/
Protože je E% trojúhelníková matice se samými jedničkami na hlavní diagonále, je podle Věty 6(iv) o determinantu trojúhelníkové matice = 1, a proto je
\E3A\ = \E3\.\A\ = \A\.
Platí proto následující pravidlo.
Tvrzení 15. Přičtení a-násobku některého řádku (sloupce) determinantu k jinému řádku (sloupci) nemění hodnotu determinantu.
67
Pravidlo v Tvrzení 15 je velmi užitečné, protože ho lze použít pro značné zjednodušení determinantu (vytvoření co nejvíce nul v některém řádku či sloupci), pro úpravu determinantu na trojúhelníkový tvar, atd.
Příklad 79. Vypočtěte determinant
12 3 1
2 13 1
3 2 11 12 2 3
Řešení. Přičteme (—2)-násobek 1. řádku ke 2. řádku, (—3)-násobek 1. řádku ke 3. řádku, a násobek 1. řádku ke 4. řádku. Dostaneme tedy
I
1 2 3 1 1 2 3 1
2 1 3 1 0 -3 -3 -1
3 2 1 1 0 -4 -8 -2
1 2 2 3 0 0 -1 2
2 ■
\3+2
0
3 1 2 1
2.í-1
,3+3
3 3 2 4
2 • {(3 - 2) + 2 . (12 - 6)} = 2 .13 = 26.
■2)-
3 3 1 2 4 1 0-12
□
Následující věta udává důležitou charakterizaci regulárních a singulárních matic pomocí determinantu.
Věta 7. Pro každou čtvercovou maticí A řádu n platí:
A je regulární \A\ ý 0;
A je singulární \A\ = 0.
Důkaz. Podle Tvrzení 10 je matice A regulární, právě když je ekvivalentní s jednotkovou maticí J, tj. existují elementární matice E±,... ,Ek takové, že
EkEk-i... E\A = L
Protože mají všechny elementární matice nenulový determinant (viz výše) a |J| = 1 a protože je
\Ek Ek-i £i|
je snadno vidět že A je regulární, právě když platí \A\ ^ 0.
Negací již dokázané ekvivalence pak máme druhou část věty. □
68
9.3. Lineární (ne)závislost vektorů pomocí determinantu. Obsah Věty 7 dává společně s Tvrzením 12 o lineární (ne)závislosti n vektorů ui,... ,un GR™ pomocí matice (viz odstavec 8.14) následující jednoduchý test.
Tvrzení 16. Nechť jsou dány vektory uí} ...,ii„el" a nechť U je matice, jejíž sloupce jsou vektory Ui,..., un. Potom
vektory u±,..., un jsou lineárně nezávislé <š=> |ř7| ^ 0. vektory u1}... ,un jsou lineárně závislé <š=> \U\ = 0.
Příklad 80. Rozhodněte o lineární (ne)závislosti vektorů
ux = I 2 I , u2
(viz také Příklad 72 v odstavci 8.14).
^3
'0N
5
.3.
Řešení. Determinant matice U je
1 -2 0
2 1 5 1 1 3
a tedy jsou vektory u±, u2, u% lineárně závislé.
0 (Ověřte!)
□
9.4. Adjungovaná matice a výpočet inverze. Nechť A = (a^) je čtvercová matice řádu n (n > 2). V odstavci 9.1 jsme pro každý prvek definovali příslušný algebraický doplněk Aíj,
A, := (-l)i+''|MÍ3-|,
kde \Míj\ je minor příslušející prvku a^-, tj. je to determinant podmatice řádu n — 1, která vznikne tak, že v matici A vynecháme i-tý řádek a j-tý sloupec (proto volíme n > 2, jinak by to nedávalo smysl).
Matice adjungovaná (též algebraicky adjungovaná) k matici A je matice A* = (a*j) definovaná jako
A* := (A
fAn A12 ... Aln\ A2\ A22 ... A2n
\An\ An2 ... Ann)
T
(Nezapomeňte transponovat!^
Matice adjungovaná k matici A se tedy vytvoří tak, že místo každého prvku napíšeme jeho algebraický doplněk a nakonec celou takto vznikou matici transponujeme.
Příklad 81. Příklady adjungovaných matic jsou I* = I a 0* = 0, tj. adjungovaná matice k jednotkové (případně nulové) matici řádu n je jednotková (případně nulová) matice řádu n. Nebo pro obecnou matici 2. řádu je
A= (a h\ A* = ( d ~°\ = ( d ~b^\
\c dJ' 1—6 a J \ —c a j
□
69
Příklad 82.
/l
A
A*
2 2 2 1 2
2 1
1 2
2 2
2 1 2 3
1 -2
2 3
1 -2
2 1
r
-5
-8
-6
-5 8 -6
2 -3 2
4 -7 5
□
Následující věta udává mimo jiné vzorec pro výpočet inverzní matice pomocí matice adjungované.
Věta 8. Nechť A je libovolná čtvercová matice řádu n. Potom je
AA* = A*A = \A\. L (17)
Zejméne je-li matice A regulární, pak
A-^-^-A*. (18)
Důkaz. Označme C = (q,) := A ■ A*. Potom je prvek c^ ve výsledné matici C roven Cíj = dna*j + aj2a2j + ''' + ainanj = ai\Aj\ + ai2Aj2 + • • • + ainAjn. Je-li i = j, dostáváme
cu = a%\Ai\ + a,i2A,i2 + • • • + ainAin = \A\, neboť uvedený součet je rozvoj determinantu matice A podle i-tého řádku.
Pokud je i ý Ji jde o rozvoj determinantu matice, v níž je i-tý a j-tý řádek stejný, a proto je Cíj = 0.
Celkem jsme ukázali, že součin A ■ A* je diagonální matice a každý prvek hlavní diagonály je roven číslu \A\. Je tedy A A* = \A\ . I. Obdobně se ukáže druhá rovnost.
Je-li A regulární matice, má nenulový determinant. Vzorec pro A~ľ pak plyne z rovnosti (17) vynásobením obou stran rovnice inverzní maticí A~ľ a vydělením obou stran rovnice číslem \A\. □
Příklad 83. Pro matici A z Příkladu 82 je
\A\
a proto je
1 -2 2
2 1 2 2 3 1
-1, (Spočítejte si to!)
A'1 = -A* =
Ověřte si přímým výpočtem, že platí AA~ľ = I = A~ľA
5-8 6 -2 3 -2|
-4 7 -5
□
Nakonec uveďme pro zajímavost následující vlastnosti adjungované matice.
70
Tvrzení 17. Nechť A je libovolná čtvercová matice řádu n. Potom je
{A*)T = (AT)*, \A*\ = \A\n-\ (A*)* = \A\n-2A.
Důkaz. Tyto vlastnosti nebudeme dokazovat. Všimněte si jen, že prostřední vlastnost plyne z rovnosti (17), protože determinant matice (tj. determinant diagonální matice, kde každý prvek na
diagonále je roven číslu \A\) je roven \A\n. □
9.5. Systémy lineárních rovnic VI — Kramerovo pravidlo. Pomocí determinantu lze také řešit lineární systém rovnic Ax = b s regulární maticí A.
Věta 9. Nechť A je regulární matice řádu n a b G IRn a uvažujme systém lineárních rovnic Ax = b. Označme jako Ai matici, kterou získáme z matice A záměnou jejího i-tého sloupce za sloupec pravých stran b. Potom (jediné) řešení x = (xi,... ,xn) tohoto systému je dáno vztahem
X;t , % 1, ... ,n.
Důkaz. Zřejmě je x = A~ľb jediným řešením tohoto systému. Podle vzorce (18) pro výpočet inverzní matice pomocí matice adjungované je
x = —--— A* b. \A\
neboli
(*-tý prvek (sloupcového) vektoru A* b) {hAu + b2A2i H-----h bnAni)
( rozvoj determinantu (podle i-tého sloupce) matice A, ve které je \ l právě 2-tý sloupec nahrazen vektorem b j
D
1
JÄ\ 1
JÄ\ 1
JÄ\
\M
\A\
Příklad 84. Vyřešte následující systém Kramerovým pravidlem:
xl + 2x2 + 3x3 = 2,
2xi — 3x2 — x3 = —3,
—33?! + x2 + 2rr3 = —3.
Řešení. Máme
/ 1 2 3 \ / 2
A = 2 -3 -1 , b = -3
71
Tedy je
\a2
\a3
1 2 3
2 -3 -1 -3 1 2
-3
-3
2 3 -3 -1 1 2
1
2
1 2
2 -3 -3 1
-28,
Množina řešení je tedy
-28
-56
28
{(1,2,-1)}.
= |^i| -28 _ Xl \A\ -28 ~ '
-56
X 2
\a\ -28
= 2.
_ |A3| 28 ^ |A| ~ -28 ~
□
Kramerovo pravidlo je výhodné použít pro systémy s malým n (řekněme n < 3) nebo pro systémy, kde je v matici systému hodně nul.
Konec 5. přednášky (26.10.2009)
72
10. Vektorové prostory
10.1. Definice a příklady. Jaká matematická struktura je potřeba, pokud pracujeme s lineárními objekty? Které vlastnosti lineárních objektů jsou ty důležité? ... Sčítání (objektů) a násobení (objektu) reálným číslem.
Viděli jsme, jak se sčítají vektory v IRn a jak se vektor v IRn násobí reálným číslem.
Viděli jsme, jak se sčítají matice a jak se matice násobí reálným číslem.
Definice 3 (Axiomy vektorového prostoru). Nechť V je množina, na které jsou definovány operace sčítání a násobení reálným číslem, tj. libovolným prvkům u,v G V lze jednoznačně přiřadit prvek u + v G V a libovolnému prvku iíGľa číslu a G IR lze jednoznačně přiřadit prvek a-u G V. Množina V s těmito operacemi se nazývá vektorový prostor, pokud jsou splněny následující axiomy:
Pro libovolné u,v,w G V a libovolné a, b G M
AI. u + v = v + u, tj. operace + je komutativní,
A2. (u + v) + w = u + (v + w), tj. operace + je asociativní,
A3. existuje prvek 0 G V takový, že 0 + u = u (existence nulového vektoru vzhledem k +),
A4. existuje prvek —u G V takový, že u + {—u) = 0 (existence opačného vektoru vzhledem k +),
A5. a ■ (u + v) = a ■ u + a ■ v, tj. operace + a • jsou distributivní (první část),
A6. (a + b) ■ u = a ■ u + b ■ u, tj. operace + a • jsou distributivní (druhá část),
A7. (a . b) ■ u = a ■ (b ■ u), tj. operace • je asociativní,
A8. 1 • u = u, tj. násobení jedničkou nemění daný vektor.
□
Pro vektorový prostor používáme označení (V,+, •), pokud chceme zdůraznit příslušné operace + a •, nebo případně jen V. Prvky u E V nazýváme vektory, čísla a G IR pak skaláry. Operace • se pak nazývá násobení skalárem.
Poznámka 3. Pojem vektoru u G V je zde velmi abstraktní, protože množina V nemusí být jen množinou vektorů v IRn, ale může to být „libovolná" množina nějakých prvků, na kterých jsou definovány příslušné operace. Např. to mohou být také matice, polynomy, funkce, atd.
Všimněte si, že používáme stejný symbol + pro sčítání dvou vektorů u + v (výsledkem je vektor) a pro sčítání dvou skalárů a + b (výsledkem je skalár). Obecně, mezi dvěma vektory vždy používáme sčítání + (vektorů), mezi vektorem a skalárem používáme násobení skalárem • (výsledkem je vektor) a mezi dvěma skaláry používáme „normální" sčítání a násobení reálných čísel.
Dále si všimněte, že definice vektorového prostoru obsahuje uzavřenost množiny V vzhledem ke sčítání (vektorů) a k násobení skalárem:
Ul. pro všechny u, v G V platí u + v G V, U2. pro všechny u G V a a G IR platí a ■ u G V.
73
Příklad 85. Množina
w := {(2,x), x e:
s obvyklými operacemi sčítání a násobení po složkách, tj.
x2) Č W,
{2,x1) + (2,x2)
4
2,x) = (\2a\, 2x) £ W (pro a ^ 1)
není vektorový prostor, aniž bychom museli ověřovat platnost axiomů A1-A8 a U1-U2.
Příklad 86.
(a) Množina IRn s operacemi
+ ... „normální" sčítání vektorů a
■ ... „normální" násobení vektoru reálným číslem
je vektorový prostor, tj. splňuje axiomy A1-A8 a U1-U2. (Ověřte si to!) Píšeme (IRn, +, •).
(b) Množina Matmxn všech matic typu m x n s operacemi
+ ... sčítání matic a
■ ... násobení matice reálným číslem
je vektorový prostor, tj. splňuje axiomy A1-A8 a U1-U2. (Ověřte si to!) Píšeme (Matmxn, +, •).
(c) Množina T všech funkcí / :M->Ks operacemi
+ ... sčítání funkcí, tj. (/ + g)(x) := f(x) + g(x), a
■ ... násobení funkce reálným číslem, tj. (a ■ f)(x) := a ■ f(x),
je vektorový prostor, tj. splňuje axiomy A1-A8 a U1-U2. (Ověřte si to!) Píšeme (JF, +, •).
(d) Množina Vn všech polynomů stupně nejvýše n s operacemi
+ ... sčítání polynomů (funkcí), tj. (p + q)(x) := p(x) + q(x), a
■ ... násobení polynomu (funkce) reálným číslem, tj. (a ■ p)(x) := a ■ p(x).
je vektorový prostor, tj. splňuje axiomy A1-A8 a U1-U2. (Ověřte si to!) Píšeme (Vn, +, •).
(e) Množina IR+ všech kladných reálných čísel s operacemi
© ... sčítání, pro x, y G IR+ definujme x © y := xy, a 0 ... násobení skalárem, pro x G IR+ a a G IR definujme a 0 x := xa, (např. 2 © 5 = 2.5 = 10, -3 0 2 = 2~3 = |)
je vektorový prostor, tj. splňuje axiomy A1-A8 a U1-U2. Píšeme (M+, ©, ©).
(f) Množina C[a, 6] všech spojitých funkcí na intervalu [a, b] (pokud ještě netušíte, co to je, tak počkejte do MB102) s operacemi
+ ... sčítání funkcí, tj. (/ + g)(x) := f(x) + g(x), a
■ ... násobení funkce reálným číslem, tj. (a ■ f)(x) := a ■ f(x),
je vektorový prostor, tj. splňuje axiomy A1-A8 a U1-U2. Píšeme (C[a, b], +, •).
(g) Množina C1[a, b] všech spojitě diferencovatelných funkcí na intervalu [a, b] (pokud ještě netušíte, co to je, tak počkejte do MB102) s operacemi
+ ... sčítání funkcí, tj. (/ + g)(x) := f(x) + g(x), a
■ ... násobení funkce reálným číslem, tj. (a ■ f)(x) := a ■ f(x),
je vektorový prostor, tj. splňuje axiomy A1-A8 a U1-U2. Píšeme (C1[a, b], +, •).
(h) Množina V všech polynomů (všech možných stupňů) s operacemi
+ ... sčítání polynomů (funkcí), tj. (p + q)(x) := p(x) + q(x), a
■ ... násobení polynomu (funkce) reálným číslem, tj. (a ■ p)(x) := a ■ p(x).
74
je vektorový prostor, tj. splňuje axiomy A1-A8 a U1-U2. (Ověřte si to!) Píšeme (V,+,-). Zřejmě je
oc
V = Vn, kde Vn je vektorový prostor z části (d).
n=0
[i) Množina C komplexních čísel s obvyklými operacemi
+ ... „normální" sčítání komplexních čísel: (a + f3i) + (7 + Si) := (a + 7) + (f3 + 8) i, ■ ... „normální" násobení komplexního čísla reálným číslem: a ■ (a + f3i) := (a.a) + (a.(3) i.
je vektorový prostor, tj. splňuje axiomy A1-A8 a U1-U2. (Ověřte si to!) Píšeme (C, +, •).
□
Příklad 87.
(a) Množina W všech polynomů sudého stupně s operacemi
+ ... sčítání polynomů (funkcí), tj. (p + q)(x) := p(x) + q(x), a ■ ... násobení polynomu (funkce) reálným číslem, tj. (a ■ p)(x) := c ■ p(x).
není vektorový prostor. Není splněna podmínka uzavřenosti množiny W na operaci +, tj. axiom Ul. Např. pro polynomy p(x) = x4 + x3 + x2 a q(x) = —x4 + 1, pro které je p, q G W, platí (p + q)(x) = x3 + x2 + 1 (není sudého stupně).
(b) Množina Gln všech (čtvercových) regulárních matic řádu n s operacemi
© ... „sčítání", definované pro A, B E Gln jako A © B := AB, a © ... násobení matice skalárem, tj. pro A G Gln aaGlRjea0A:=a-A není vektorový prostor. Není např. splněna podmínka AI (komutativita operace ©). Prozkoumejte, které axiomy splněny jsou! Zejména si všimněte, že pro A, B E Gln je také A © B = AB G Gln (tj. platí axiom Ul), oproti tomu pro A G Gln aaGlRjea-AG Gl„ pouze pokud a^O (tj. obecně neplatí axiom U2).
□
Následující tvrzení plyne přímo z definice vektorového prostoru.
Tvrzení 18. Nechť (V, +, •) je vektorový prostor a nechť u, v E V a a, b G IR. Potom
0 • u = 0, (—1) • u = —u, a ■ (u — v) = a ■ u — a ■ v, (a — b) ■ u = a ■ u — b ■ u. Přitom platí, že a ■ u = 0 <š=> a = 0 nebo u = 0.
10.2. Lineární (ne)závislost vektorů. Lineární závislost a nezávislost vektorů se v obecném vektorovém prostoru definuje naprosto stejně jako v odstavci 7.4 pro vektory v IRn.
Definice 4. Vektory u1}..., u\~ G V jsou lineárně závislé, pokud existují čísla a1;..., ak G IR, z nichž je alespoň jedno nenulové, tak že platí vztah závislosti
a1u1 + a2u2-\-----\-akuk = 0. (19)
V opačném případě se vektory u±,... ,uk G V nazývají lineárně nezávislé, tj. jediné koeficienty ai,..., ak G IR, pro které platí vztah (19), jsou
Oi = a2 = ■ ■ ■ = ak = 0.
□
75
Je zřejmé, že pokud by některý z vektorů Ui byl nulový vektor (množiny V), potom jej můžeme vyřadit, protože do výsledných lineárních kombinací ničím nepřispívá. Budeme proto v dalším bez újmy na obecnosti předpokládat, že všechny vektory u1} jsou nenulové.
Stejně tak se symbolem
Span {ui,..., Uk) = |u> G V, kde w = aľ •«! + ••• + a*. • u^, a1;..., a k G IR j> značí množina všech lineárních kombinací (ve V) vektorů ui,... ,Uk G V.
Příklad 88.
(a) Ve vektorovém prostoru Mat2x3 (viz Příklad 86(b)) jsou „vektory" (= matice)
a _ A 2 3\ (0 1 2\ (-2 0 2\ (1 1 0\
A~\4 5 q)> ^ - V3 4 57 ' V 1 1 V ' V001/
lineárně nezávislé. Toto ověříme standardním způsobem tj. položíme jejich lineární kombinaci
rovnu nulovému prvku tohoto vektorového prostoru,
a>i ■ A + a2 ' B + 03 • C + 04 • D = 0,
/l 2 3\ /O 1 2\ /-2 0 2\ A 1 0\ _ /O 0 0\
fll ' J 5 6 J + °2 J3 4 5J + °3 J 1 1 J + °4 ' V° 0 V V° 0 °; ' a vyřešíme příslušný homogenní systém - nyní 6 rovnic pro 4 neznámé ú^, a2, 03, 04. Snadno se ověří, že tento systém má pouze triviální řešení (a1; a2, a3, a4) = (0, 0, 0, 0).
(b) „Vektory" (= matice)
A = (1 5 ô) ' S = (3 4 5) ' C = ( 2 3 1) ' D = ( 1 2 3)
lineárně závislé. Toto ověříme standardním způsobem tj. položíme jejich lineární kombinaci rovnu nulovému prvku tohoto vektorového prostoru,
a\ ■ A + a2 • B + 03 • C + 04 • D = 0,
A 2 3\ /O 1 2\ (-1 0 l\ /-2 -1 0\ _ /0 0 0\
fll J4 5 6 J + °2 J3 4 5 J + °3 J 2 3 4 J + °4 J 1 2 3J ~ ^0 0 oj ;
a vyřešíme příslušný homogenní systém - nyní 6 rovnic pro 4 neznámé a\,a2,aj,,a\. Snadno se ověří, že tento systém má řešení
[a\, a2, 03, 04) = (s + 2í, — 2s — 3t, s, ť), kde s,íeK.
Např. pro
(s, í) = (1, 0) je (ai, a2, a3, a4) = (1, -2,1, 0),
nebo pro
(s,í) = (0,1) je (ai,a2,a3,a4) = (2,-3,0,1). Existuje tedy netriviální řešení (a1; a2, a3, a4), a proto jsou tyto matice lineárně závislé.
□
Hlavním výsledkem tohoto oddílu je ukázat, že lineární kombinace lineárně nezávislých vektorů jsou určeny jednoznačně, neboli dvě různé sady koeficientů a±,..., dk dávají dvě různé lineární kombinace.
Tvrzení 19. Nechť u\,..., Uk G V. Vektor w G Span (ui,..., Uk) lze napsat jediným způsobem jako lineární kombinaci vektorů u1}..., <š=> vektory u1}..., jsou lineárně nezávislé.
76
Důkaz. Nechť w G Span (ui,..., uk), tj.
w = aiUi + • • • + akuk, pro nějaké a1;..., ak G IR. (20)
Předpokládejme, že také
u; = biUi + • • • + bkuk, pro nějaké 61;..., bk G IR. (21)
Potom jsou-li vektory iti,...,uk lineárně nezávislé, tak odečtením (20) a (21) dostaneme
{a1-b1)u1^-----h (ak - bk) uk = 0, (22)
tedy di — bi = 0 pro všechna i = 1,..., k, tj. <2j = 6« pro všechna i = 1,... ,k.
Obráceně, chceme ukázat, že z a; = 6j pro všechna i = 1,..., k plyne lineární nezávislost vektorů Mi,..., itfc. Tedy pokud by byly tyto vektory lineárně závislé, potom má rovnice (22) netriviální řešení, tj. alespoň jeden koeficient ai — bi ý 0, tj. alespoň jeden koeficient <2j ý bi, tj. vektor w lze napsat (alespoň) dvěma různými způsoby jako lineární kombinaci vektorů u\,..., uk. □
Příklad 89. Ve vektorovém prostoru Vn všech polynomů stupně nejvýše n (viz Příklad 86(d)) jsou „vektory" (= polynomy)
lineárně nezávislé. (Ověřte si to!) Tedy podle Tvrzení 19 lze každý „vektor" (= polynom) p G Vn vyjádřit jediným způsobem jako lineární kombinaci těchto polynomů, tj. jako
p(x) = a0xn + aix^1 + • • • + an_ix + an. (Samozřejmě!) □
10.3. Podprostory. Nechť (V, +, •) je vektorový prostor a uvažujme nějakou podmnožinu W C V. Potom samozřejmě víme, že pro libovolné u,v £ V & a EM platí
u + v £ V, a ■ u G V.
Je-li ale
u + v eW, a-ueW, (23) tj. pokud je množina W uzavřená vzhledem ke sčítání vektorů a k skalárnímu násobku vektorů, potom se množina W, či přesněji trojice (W, +, •), nazývá vektorový podprostor (nebo jen podprostor) vektorového prostoru V.
Příklad 90. Nechť V = R2 a
W := {{x1,x2) G IR2, x1 +x2 = 0}.
Potom je W vektorový podprostor prostoru IR2, neboť pro {xi,x2), (yi,y2) G W a pro a G IR platí
{x1,x2) + (yi,y2) = (x1 + y\,x2 + y2), přičemž
{xi + ž/i) + (z2 + ž/2) = (%i + x2) + (ž/i + y2) = 0.
=0 =0
tj. (x1,x2) + (wi,í/2) G W
a ■ (xi,x2) = (axi, ax2), přičemž ax\ + ax2 = a (x± + x2) = 0, tj. a ■ (xi,x2) G W
=0
□
77
Tedy pokud platí podmínky (23), lze se na podprostor W dívat jako na samostatný vektorový prostor, přičemž jeho operace + a • jsou „zděděny" z původního vektorového prostoru V. Tedy
(W, +, •) je vektorový prostor.
Příklady vektorových podprostorů daného prostoru V jsou {0} a V. Těmto dvěma podprostorům říkáme triviální podprostory, protože jsou obsaženy ve V vždy. Všechny ostatní podprostory, pokud existují (tj. všechny „zajímavé" podprostory), pak nazýváme vlastní podprostory.
Příklad 91.
(a) Množina
W := {(x1,x2,x3) G IR3, x2 = x3} je vlastní podprostor vektorového prostoru IR3.
(b) Množina
W := {A G Matnxn, matice A má samé nuly na hlavní diagonále} je vlastní podprostor vektorového prostoru Matnxn.
(c) Vektorový prostor Cľ[a, b] je vlastní podprostor vektorového prostoru C[a,b], viz také Příklad 86(f,g), protože např. funkce \x — G C[a, b] \ C1[a, b].
(d) Vektorový prostor IR je vlastní podprostor vektorového prostoru C.
□
10.4. Jádro a obraz matice, řádkový prostor. Nechť A je matice typu m x n. Množina
Ker A := {x G Rn, Ax = 0}
se nazývá jádro (od slova „kernel") matice A. Jádro matice A je tedy množina řešení lineárního homogenního systému Ax = 0. Někdy se pro Ker A používá značení N (A) (od „nulový prostor" matice A). Abychom byli úplně přesní, tak si musíme uvědomit, že je množina Ker A tvořena sloupcovými vektory x G IRn, aby bylo možno maticové násobení A ■ x vůbec provést.
Množina
R(A) := [x G IRn, x G Span (řádky matice A}}
se nazývá „řádkový prostor" matice A. Řádkový prostor matice A je tedy množina všech lineárních kombinací řádků matice A. Na rozdíl od Ker A je množina R(A) tvořena řádkovými vektory x G IRn.
Množina
ImA := {x G IRm, x G Span (sloupce matice A)]
se nazývá obraz (též obor hodnot, od slova „image", též sloupcový prostor) matice A. Obraz matice A je tedy množina všech lineárních kombinací sloupců matice A. Stejně jako u množiny Ker A je množina ImA tvořena sloupcovými vektory x G IRm.
Zřejmě triviálně platí
R(A) = lmAT, lmA = R(AT).
Jednoduše se pak ukáže následující tvrzení (viz také Tvrzení l(iv) o množině řešení homogenního systému v odstavci 6.4).
Tvrzení 20. Pro každou maticí A typu m x n jsou množiny Ker A a R(A) podprostory vektorového prostoru IRn a množina ImA je podprostor vektorového prostoru IRm.
78
Příklad 92. Najděte Ker A, R(A) a Imi pro matici
/l 2 -3 4\ A = 2 1 2 2 \3 3 -1 6/
Řešení. Matice A je typu 3 x 4, tj. m = 3 a n = 4. Např. Gaussovou eliminační metodou získáme
-3 4
Tedy množina řešení lineárního systému Ax = 0 je Ker A = i
í fo\
1 8 3 +t- -2
l 1 W 0
, ŕ,s G
Span
8 3 -2
1 ; 0
W \ 1 /
C
Protože má matice A po převedení na schodovitý tvar dva lineárně nezávislé řádky, je h(A) = 2. Protože jsou první dva řádky lineárně nezávislé, je
R(A) = {s-(1,2,-3,4) + í- (2,1,2,2), í,set} = Span ((1,2,-3,4), (2,1,2,2)) = Span <(1, 2, -3,4), (0, -3, 8, -6)) C IR4.
Dále ze schodovitého tvaru matice A vidíme, že první dva sloupce matice A jsou lineárně nezávislé (jsou to sloupce, ve kterých jsou pivoti), tj. platí
lmA =
Pozor! Pro množinu Im A nelze použít sloupcové vektory ze schodovitého tvaru matice A, tj.
□
79
10.5. Generování podprostorů.
Tvrzení 21. Nechť Wi, i El, jsou vektorové podprostory ve V. Potom je také
Wi vektorový podprostor prostoru V.
iei
Důkaz. Jsou-li a, b E IR a u,v E rije/Wj, potom pro všechny i E I platí a ■ u + b ■ v E Wi, to ale znamená, že a ■ u + b ■ v E ClieiWi. □
Zejména je tedy podprostorem průnik všech podprostorů W C V, které obsahují předem danou množinu vektorů M C V. Říkáme, že tato množina M generuje podprostor (M), nebo že prvky M jsou generátory podprostorů (M).
Následující tvrzení poskytuje důležitý nástroj pro generování vektorových podprostorů.
Věta 10. NechťUi,..., uk E V. Množina Span (ui,..., uk) je podprostor vektorového prostoru V. Důkaz. Je jednoduchý, proveďte si jej sami. □
Příklad 93. Označme jako jednotkové vektory v IRn, tj. na i-té pozici je jednička jinak samé nuly. Potom Span (e1; e2) (= rovina xy) je podprostor ve vektorovém prostoru IR3. □
Jestliže
Span (ui,..., Uk) = V, resp. Span (ui,..., Uk) = W C V. potom říkáme, že vektory u±,... ,uk generují vektorový prostor V, resp. podprostor W.
Příklad 94.
(a) Vektory e1; e2, e3 generují vektorový prostor IR3, stejně tak vektory e1; e2, e3, (1, 2,1) generují vektorový prostor IR3.
(b) „Vektory" (= polynomy) x — l a x+1 generují vektorový prostor V\ (polynomy stupně nejvýše 1, tj. všechny lineární funkce), protože každý polynom p(x) = kx + q E V\ můžeme psát ve tvaru
j^-_q j^- j q
p(x) = kx + q = a ■ (x — 1) + b • (x + 1), kde a = -, b = -.
(Ověřte si to!) Platí tedy, že
V\ = Span (x — 1, x + 1) = Span (x,l).
(c) Ověřte si sami, že
Mat2X2 = Span
1 o\ f o i\ [o 0\ [0 0
o oř (o ord o r (o i
Zejména jsou uvedené čtyři matice lineárně nezávislé ve vektorovém prostoru Mat2x2.
□
Výše uvedené příklady motivují přirozenou otázku, jak najít minimální množinu vektorů, které ještě generují daný vektorový prostor V či podprostor W.
80
10.6. Báze a dimenze. Vektory u±,... ,Uk (či obecněji podmnožina M C V) se nazývá báze vektorového prostoru V, pokud jsou tyto vektory lineárně nezávislé a generují celý prostor V, tj.
Span (ui,..., Uk) = V, (resp. Span (M) = V). Podobně definujeme bázi vektorového podprostoru W C V. Příklad 95.
(a) Tzv. standardní báze prostoru IRn je tvořena jednotkovými vektory
e1, e2,..., en.
(b) Následující množina je také báze prostoru IR3:
{(1,1,1), (1,1,0), (1,0,0)}.
(c) Matice
E,.-{1 Jj), *,:-(« J), E,,-{1 Jj), *.:-(«! tvoří bázi vektorového prostoru Mat2X2-
(d) Polynomy
-i 2 n
/ >> /■>> / >>
X ^ eX/ ^ eX/ ^ . . . ^ tXj
tvoří bázi vektorového prostoru Vn.
(e) Množina polynomů
1; «x ^... ^ % j... j" == ^x ; /c 0,1, 2,... } tvoří bázi vektorového prostom V.
(f) Komplexní čísla
1, i
tvoří bázi vektorového prostom C.
□
Vektorový prostor V či podprostor W je jednoznačně určen prvky (libovolné) své báze, protože každý vektor u E V (či u E W) lze jednoznačně vyjádřit jako lineární kombinaci bázových vektorů. Tedy abychom určili podprostor W, stačí najít jeho bázi.
Tvrzení 22. Jestliže množina lineárně nezávislých vektorů ui,...,un generuje vektorový prostor V (tj. je-li ui,... ,un báze ve V), potom libovolná množina vektorů o více než n prvcích je nutně lineárně závislá.
Důkaz. Uvažujme vektory v1}... ,vm G V, kde m > n (je jich více než vektorů u1}...,un). Potom lze každý z vektorů v1}... ,vm jednoznačně vyjádřit jako lineární kombinaci vektorů u1}...,un, tj.
v1 = au ui + a12u2-\-----h alnun,
v2 = a21 ui + a22u2 +----h a2nun,
«mi ^i ~t~ am2 U2 ~\~ ' ' ' ~\~ amn Un.
81
O lineární závislosti či nezávislosti vektorů v±,... ,vm rozhodneme podle toho, zda existuje v jejich lineární kombinaci
civ1 + c2 v2 H-----\~ cmvm = 0 (24)
(alespoň jeden) nenulový koeficient Cj nebo zda všechny tyto koeficienty jsou nutně rovny nule. Do rovnice (24) dosadíme vyjádření vektorů v j pomocí vektorů u±,... ,un a dostaneme
0 = ci (gn ui + a12 u2 H-----h a\n un) + c2 (a21 ux + a22 u2 H-----h a2n un)
s-v-' s-v-'
+ ' ' ' + cm \aml ul + am2 u2 + ' ' ' + amn MnJ
%
= (ci au + c2 a21 H-----hcm aml) Mi + (ci a12 + c2a22-\-----hcm am2) u2
tj. dostáváme nulovou lineární kombinaci vektorů u±,..., itn. Protože jsou vektory Mi,..., un lineárně nezávislé, musí být koeficient každého z vektorů Ui roven nule, tedy
Ci au + c2 a2i + • • • + cm ami = 0.
ci a12 + c2a22-\-----h cm am2 = 0.
cl aln + c2 a2n + ' ' ' + cm amn = 0.
Toto je homogenní systém n rovnic pro m proměnných c1}... ,cm, a protože je m > n, má tedy více proměnných než rovnic. Tedy podle Tvrzení l(ii) (o homogenních systémech v odstavci 6.4) má tento systém netriviální řešení Ci,..., cm, a tedy jsou vektory v±,..., vm lineárně závislé. □
Poznámka 4. Obsah předchozího tvzení lze také chápat tak, že je-li u1}... ,un báze ve V, potom každá množina lineárně nezávislých vektorů má nutně nejvýše n prvků. □
Důsledek 2. Všechny báze ve vektorovém prostoru V mají stejný počet prvků.
Důkaz. Buď u1}..., un a v1}..., vm dvě báze ve V. Protože Span (u1}..., un) = V, přičemž vektory Ui,... ,un jsou lineárně nezávislé, musí podle Poznámky 4 nutně být m < n.
Naopak, protože Span (vi,..., vm) = V, přičemž vektory vľ,..., vm jsou lineárně nezávislé, musí podle Poznámky 4 nutně být n < m.
Celkem tedy dostáváme m = n. □
Počet bázových vektorů v nějaké (a tedy v libovolné) bázi vektorového prostoru V se nazývá dimenze vektorového prostoru V, píšeme dim V. Dimenze triviálního vektorového prostoru {0} je 0. Má-li prostor V konečnou bázi (řekněme o n prvcích), potom říkáme, že V je konečněrozměrný (nebo též konečnědimenzionální) prostor. V opačném případě se V nazývá nekonečněrozměrný (nebo též nekonečnědimenzionální).
Bázi n-rozměrného prostoru budeme obvykle zapisovat jako n-tici
u := (iti, ...,un)
bázových vektorů. Jde tu především o zavedení konvence: U konečněrozměrných podprostorů budeme totiž vždy uvažovat bázi včetně zadaného pořadí prvků, i když jsme ji takto, striktně vzato, nedefinovali.
82
Příklad 96. Zřejmě platí
dim IR = 1, dimIRn = n, dimVn = n+l,
dimMat2X2 = 4, dimMatmxn = m.n, dimC = 2.
viz příklady vektorových prostorů a jejich bází v Příkladech 86 a 95. Odsud je vidět, že existují vektorové prostory s libovolně velkou (ale konečnou) dimenzí. Naproti tomu je
diuĽP = oo.
a protože platí V C Cľ[a, b] C C[a, b] C JF, je také
dim C1 [a, b] = dim C[a, b] = dim T = oo. Poslední fakt je důležitý např. pro aproximace (spojitých či obecných) funkcí pomocí polynomů. □
Příklad 97. Je-li A matice typu m x n, potom je zřejmě (viz definice řádkového prostoru v odstavci 10.4)
h(A) = dim R(A) a n = h(A) + dim Ker A.
Druhý vztah můžeme interpretovat tak, že celkový počet proměnných (= n) v lineárním homogenním systému Ax = 0 musí být roven počtu lineárně nezávislých řádků (tedy i sloupců) matice A plus počtu volných proměnných v systému Ax = 0.
Všimněte si pak, že Tvrzení 3 v odstavci 8.12 říká, že
h(A) = dimR(A) = dimlmA < min{m,n}.
Například v Příkladu 92 je m = 3, n = 4, h(A) = 2 a dim Ker A = 2. □
Konec 6. přednášky (2.11.2009)
Dále můžeme z Důsledku 2 odvodit následující.
Tvrzení 23. Jestliže dim V = n > 0, potom
• každá množina o n vektorech, které jsou lineárne nezávislé, generuje celý prostor V (a tedy je to báze),
• každá množina o n vektorech, které generují celý prostor V, je lineárne nezávislá.
Tedy v konečnědimenzionálních prostorech (s dimenzí n > 0) je vlastnost „generování celého prostoru Vu stejná jako je vlastnost „lineární nezávislosti".
Příklad 98. Rozhodněte, zda množina vektorů
A\
i
o
/-2\
0
1
V 1 J
2
-1 \2J
0
2
v-v
tvoří bázi prostoru IR4.
83
Řešení. Protože je dimlR4 = 4 a v uvedené množině jsou právě čtyři vektory, stačí ukázat, že jsou tyto vektory lineárně nezávislé. Toto můžeme otestovat např. pomocí determinantu (viz Tvrzení 16 v odstavci 9.3):
1 -2 1 1 0 2 0 1 -1 0 1 2
Proto jsou tyto vektory lineárně nezávislé, tvoří tedy bázi prostoru IR4. □
0 0 2
-3 Ý O-
Tvrzení 24. Jestliže dim V = n > 0, potom
(i) libovolných m lineárně nezávislých vektorů, kde m < n, generuje vlastní podprostor vektorového prostoru V,
(ii) libovolnou množinu o méně než n lineárně nezávislých vektorech lze doplnit na bázi prostoru V (o n vektorech),
(iii) libovolnou množinu o více než n vektorech, která generuje celý prostor V, lze zredukovat na bázi prostoru V (o n vektorech).
Důkaz. Je uveden ve skriptech prof. Slováka. □
10.7. Souřadnice a změna báze. Ve vektorových prostorech (alespoň u některých z těch, které jsme zde explicitně uvedli) většinou bereme standardní báze jako např.
Rn : (ei,e2,...,en),
Mat2X2 : (En, E12, E2\, E22);
1~^n . (x , X , . . . , X, 1).
Někdy je ale výhodnější vybrat si jinou bázi (v závislosti na konkrétním problému). Tedy se otvírá otázka, jak přejít od jedné báze ke druhé.
Příklad 99. Při výměně peněz bereme za standardní bázi 1 Kč. Při cestování do jiných zemí se musíme přizpůsobit jiné bázi - 1 USD, 1 £, 1 EUR, atd. Změna mezi těmito bázemi se provádí pomocí směnného kurzu, tedy je to multiplikativní proces. □
Nechť u = (ui,... ,un) je nějaká pevně zvolená báze (konečněrozměrného) vektorového prostoru V. Potom každý vektor w G V lze jednoznačně vyjádřit jako lineární kombinaci bázových vektorů, tj. pro každý vektor w G V existuje jednoznačně určená n-tice reálných čísel ( ) s vlastností
w = ai ui +----V anun.
Potom sloupcový vektor (a\,..., an)T nazýváme souřadnicemi vektoru w v bázi u a píšeme
Příklad 100.
(a) Vektor w = (3, 2,1) má ve standardní bázi e = (ei; e2, e%) prostoru IR3 souřadnice
w
'3N
zatímco v bázi u= ((1,1,1), (1,1,0), (1,0,0)) (viz Příklad 95(b)) má w souřadnice M«= f 1 | , Protože w= (3,2,1) =|T|-(1,1,1) +|T|-(1,1,0) +0-(1,0,0).
Všimněte si, že když říkáme „vektor w = (3,2,1)", tak tím vlastně automaticky myslíme tento vektor vztažený na standardní bázi e.
(b) Matice A = (ac hd) má ve standardní bázi E = (En, E\2, E2\, E22) prostoru Mat2X2 souřadnice
b
c
\dj
protože A= ^ = \ä\ ■ Eu + \b\ ■ E12 + [č] ■ E21 + \ď\ ■ E22.
(c) Polynom p(x) = kx + q má ve standardní bázi e = (x,l) prostoru V\ (lineární funkce) souřadnice
[PÍX)]e = [I
zatímco v bázi u=(x — l,x + l) má polynom p(x) souřadnice
[p(x)]u = I 1 ' Protože P(x) = kx + q viz Příklad 94(b).
k—q
(x-r
k+q 2
ÍX+1]
□
Příklad 101. Uvažujme vektorový prostor IR3, vektor w = (3, 2,1) a dvě báze
e = (ei,e2,e3,.
u
[1,1,1), (1,1,0), (1,0,0)),
(viz Příklad 100(a)). Viděli jsme, že souřadnice vektoru w v jednotlivých bázích jsou
w
'3'
w
'V
Zejména si všimněte, že
T
Me = I 1 I > \U2\e = I 1 I , [u3]e :
jsou souřadnice vektorů ui, u2, u3 v bázi e. Vztah dvou souřadnicových vektorů pro vektor w můžeme
85
jednoduše popsat pomocí maticového násobení. Pokud dáme vektory báze u (či přesněji souřadnice vektorů báze u v bázi e) do sloupců matice (označme ji jako T), potom je
w
'3N
r v
1 1 1 \
1 1 0
1 0 0 )
T T T
= :T
1 I = T-\w},„.
Matici T říkáme matice přechodu od báze u k bázi e.
□
Pravidlo uvedené v Příkladu 101 lze jednoduše zobecnit na libovolný (konečněrozměrný) vektorový prostor V. Tedy je-li e = (ei,..., en) nějaká (říkejme ji „standardní") báze ve vekrorovém prostoru V a je-li u = (ui,..., un) nějaká další báze prostoru V, potom označme jako
T := ... [un]e) G Matnxrí
matici přechodu od báze u k bázi e, tj. souřadnice bázových vektorů báze u v bázi e tvoří sloupce matice T.
Věta 11. Pro souřadnice libovolného vektoru w G V v bázích e a u platí vztah kde T je maticí přechodu od báze u k bázi e.
(25)
Důkaz. Protože tvoří vektory u±,... ,un bázi prostoru V, lze libovolný vektor w G V napsat jednoznačně jako jejich lineární kombinaci, tj. existují čísla G IR tak, že
w = a1u1-\-----\-anun, tj. [w]u
(26)
Protože ve standardní bázi platí
W = [w]e, UX = [«4, . . . , Un = [un]Ě_
vztah (26) se pomocí maticového násobení přepíše jako
«n) • I i I = ([Ul]e ■ ■ ■ [Un]e) " H« = T ' [w]u-
Tedy souřadnice bázových vektorů báze u v bázi e tvoří sloupce matice T.
□
Ze vztahu (25) je vidět, proč se matici T říká
„matice přechodu od báze u k bázi e"
a ne
„matice přechodu od báze e k bázi uíl.
Je to proto, že pomocí matice T dostaneme souřadnice vektoru w v bázi e ze souřadnic vektoru w v bázi u.
Ze vztahu (25) dále plyne, že matice přechodu od báze e k bázi m je T 1, protože
H« = t-1 ■ [
w
(27)
Uvědomme si, že souřadnice vektoru w v (standardní) bázi e většinou známe, a proto je pro nás mnohem užitečnější vztah (27), který udává, jak z [w]e vypočítat souřadnice vektoru w v nějaké „nové" bázi u. Tedy je nutné vypočítat inverzní matici T_1 k matici T (viz odstavec 8.11).
Příklad 102. Ve vektorovém prostoru "P2 (polynomy stupně nejvýše 2, tj. lineární a kvadratické polynomy) určete matici přechodu od báze e = (l,x,x2) (= standardní báze) k bázi
u
fl, x + 1, 1 - xz).
Řešení. Nejdříve najdeme matici přechodu T od báze u k bázi e, tj. sloupce matice T jsou tvořeny souřadnicemi vektorů báze u v bázi e, tj.
t = ([1]« [X + l]e [1 " X\)
1
0
Potom najdeme matici inverzní k matici T, tj.
'1 1 1 | 1 0 0\ /l 0 0
(T|J) = | 0 1 0 0 1 0|-----10 10
,0 0 -1
0 0 1
0 0 1
'1 -1 1
T-1 = I 0 1 0 I je hledaná matice přechodu od báze e k bázi u. ,0 0 -1
Například nyní snadno spočteme
[1 + x + x\ = T_1 • [1 + x + rr2].
□
Pokud máme dány dvě báze
u= (u1,...,un), v = (v1,...,vn)
a zajímá nás matice přechodu T mezi nimi, řekněme od báze u k bázi v (a přitom ani jedna z těchto bází není „standardní"), potom jsou samozřejmě sloupce matice T tvořeny souřadnicemi vektorů báze u v bázi v, tj.
t := ([u^v ... [un]v) , [w]v = t ■ [w]u Vw G V.
Tyto souřadnice [u,^ ale nemusí být snadné nalézt (známe je hned, pokud je v = e „standardní" báze). Proto je výhodnější nejdříve přejít od báze u ke „standardní" bázi e, tj.
[w]e = U ■ [w]u
pomocí matice přechodu
U := ([iíi]g ... [un]e) , tu umíme napsat přímo.
87
a následně přejít od „standardní" báze e k bázi v, tj.
[w]e = v ■ [w]v, [w]v = v'1 ■ [w]e
pomocí matice přechodu v~ľ, kde
v := ([vi]e ■ ■ ■ [vn]e) , tu umíme také napsat přímo.
Výsledná hledaná matice T je potom součinem těchto matic přechodu (pozor na správné pořadí!),
t = v~1 ■ u, (28)
protože pro libovolný vektor w G v platí
[w]v_ = v-1 • He = v-1 ■ {u • h J = {v^u) • Hm = t ■ Mm
u
u —> e „stará báze" „standardní" báze
v-xu \ | v-1
v
„nová báze"
Příklad 103. Ve vektorovém prostom IR2 najděte matici přechodu T od báze u = (u1,u2) k bázi v = (vi, v2), kde
u= ((3,1), (4,1)), v= ((1,2), (1,1)).
Řešení. Matice přechodu u od báze u k bázi e, matice přechodu v od báze v k bázi e a matice přechodu v~ľ od báze e k bázi v jsou postupně
u = ^ ^ , v = ^ j^j ) = ^ 2 (ověřte si výpočet inverze),
a proto je matice přechodu T od báze u k bázi v rovna
2 -IJ \l 1] \5 7 Všimněte si nyní, že ze sloupců matice T přečteme souřadnice vektorů u\ a u2 v bázi v, tj.
Míí = ( 52) , N» = í ?3
Ověřte si sami, že skutečně platí vztahy ui = —2vľ + 5v2 a, u2 = —3-Ui + 7v:
2-
Všimněte si dále, že pokud má vektor w v bázi m souřadnice [w]^ = (j^), potom jsou jeho souřadnice v bázi v
lw]v = t ■ H„
Ve standardní bázi se zřejmě jedná o vektor
W = [w]e = u ■ [w]u --
neboli také
W = [w]e = v ■ [w]v ~-
? i ■ í-i) - \
2 l) ' ( 3 ) li/'
88
□
10.8. Lineární zobrazení mezi vektorovými prostory. V tomto odstavci se budeme snažit najít odpověď na otázky:
• Co to jsou lineární zobrazení mezi dvěma vektorovými prostory?
• Jakým způsobem reprezentujeme lineární zobrazení? Co nám takové reprezentace říkají o samotném lineárním zobrazení?
Definice 5. Zobrazení L vektorového prostoru V do vektorového prostoru W je lineární zobrazení (též lineární operátor), pokud
L(a • u + b • v) = a ■ L(u) + b ■ L (v) pro všechny u, v G V, a, b G IR.
□
Všimněte si, že na levé straně (uvnitř Ľ) jsou operace • a + v prostoru V, zatímco na pravé straně jsou operace • a + v prostoru W. Ačkoliv jsou tyto operace v prostorech V a W formálně různé, budeme je značit stejným symbolem • a + a z kontextu bude vždy jasné, ve kterém vektorovém prostoru se právě pohybujeme.
Zobrazení L : V —► W je tedy lineární, pokud zachovává lineární kombinace. Zejména tedy platí
L(0V) = 0W (pro a = b = 0), tj. zkráceně L(0) = 0. L(—u) = —L(u) (pro a = —1, b = 0).
Pokud je cílový vektorový prostor W totožný s výchozím prostorem V, potom nazýváme lineární zobrazení L : V —► V lineární transformace prostoru V.
Například identické zobrazení X : V —► V, 1{u) = u (každému vektoru přiřadí ten samotný vektor) nebo nulové zobrazení J\í : V —► W, J\í(u) = 0W (každému vektoru přiřadí nulový vektor prostoru W) jsou lineární.
Příklad 104. Následující zobrazení jsou lineární transformace na vektorovém prostoru IR2 (ověřte si to!).
(a) Prodloužení nebo zkrácení vektoru (viz obr),
L(u) = a • u.
(b) Rotace o | v kladném směru,
L(u) = (—y,x), kde u = (x,y).
Obecněji, rotace o úhel ip v kladném směru
(cos^ -sinyA/s smif cos ip I \y
(c) Projekce vektoru na některou souřadnou osu (viz obr.)
Li(u) = x ■ ei = (x, 0) projekce na osu x. L/2(u) = y ■ e2 = (0, y) projekce na osu y.
89 □
Příklad 105. Příklady lineárních zobrazení L : Rn —> Rm jsou:
(a) pro u = (x1,x2,x3),
L : M3 -»■ E, L(u) = + 2x2 - ar3,
(b) pro u = (x1,x2,x3)
L : R3 - R2, = ( Xl " 3X3 .
y x2 + x3 I 1
(c) pro u = (x1,x2),
3xi + x2
L : M2 -»■ M3, = ( aľi — 2x2
2x1 + 3rc2y
Všimněte si, že všechna tato lineární zobrazení můžeme zapsat pomocí matic a maticového násobení:
(a) L(u) = (1 2 -1) ■ I xl j , (b) L(«) = (J J • í S j , (c) L(u) = í 1^ -2 j ■
□
Příklad 106. Je-li A matice typu m x n, potom je přiřazení
LA:Rn^Rm, LA(u) = A-u, \/u E Rn, lineárni zobrazení. (Ověřte si to!) □
Příklad 107. Příklady lineárních zobrazení mezi prostory funkcí jsou (viz MB102 příští semestr):
(a) určitý integrál
L:C[a,b]^R, L(f) = í f(x)dx,
J a
(b) derivace
D : C^b] ^ C[a,b], D(f) = f,
zejména je D : Vn —>• Vn-i, protože derivace polynomu je opět polynom, ale o jedničku nižšího stupně,
(c) druhá derivace
D2:C2[a,b]^C[a,b], D(f) = f",
(potom je také D2 + D lineární zobrazení a tedy je např. diferenciální rovnice y" + y = g (x) pouhou linární rovnicí (D2 + D)(y) = g v příslušném vektorovém prostoru funkcí),
□
90
Nechť L : V —► W je lineární zobrazení mezi vektorovými prostory. Jádro Ker L zobrazení L a obraz (též obor hodnot) Im L zobrazení L je množina
Ker L := {u E V, L(u) = 0W} C V.
ImL := L(V) = {v E W, 3u E V tak, že L(u) =v}CW.
Platí následující jednoduché tvrzení (srovnejte s Tvrzením 20 v odstavci 10.4).
Tvrzení 25. Nechť L : V —► W je lineární zobrazení mezi vektorovými prostory.
(i) Množina Ker L je vektorový podprostor prostoru V.
(ii) Je-li U podprostor prostoru V, potom je množina L(U) vektorový podprostor prostoru W.
Důkaz. Ověřte si, že jsou splněny vlastnosti Ul a U2 pro daný vektorový podprostor (viz odstavec 10.1 a 10.3). □
Tvrzení 25 nám také ukazuje další způsob, jak generovat podprostory daného vektorového prostoru - pomocí jádra a oboru hodnot lineárních zobrazení (z dřívějška to umíme pomocí lineárních kombinací vektorů, viz odstavec 10.5).
Příklad 108.
(a) Pro lineární zobrazení projekce vektoru u = (x, y) E IR2 na některou souřadnou osu (viz také Příklad 104(c)) je
L\(u) = x ■ e\ = (x, 0) projekce na osu x. L2(u) = y ■ e2 = (0, y) projekce na osu y.
A proto platí
Li (u) =0 x = 0 tedy je Ker Lľ = Span (e2), L2(u) =0 y = 0 tedy je Ker L2 = Span (ei).
(b) Pro lineární zobrazení La dané maticí A typu m x n z Příkladu 106 platí
Ker La = Ker A C Rn, lmLA = ImA C Rm (srovnejte s odstavcem 10.4).
(c) Pro lineární zobrazení D : V —► V a D2 : V —► V (derivace, viz Příklad 107(b,c) a MB102) na vektorovém prostoru V všech polynomů je
Ker D = {p(x) E V, p'(x) = 0} = Vo (konstantní polynomy),
ImD = V (každý polynom je derivací nějakého jiného polynomu).
Ker D2 = {p(x) E V, p"(x) = 0} = V\ (lineární polynomy).
□
91
10.9. Maticová reprezentace lineárních zobrazení. Již víme z Příkladu 106, že každá matice A typu m x n přirozeným způsobem vytváří lineární zobrazení La '■ IRn —► IR"\ L(u) = A ■ u.
Ukážeme, že takto lze reprezentovat každé lineární zobrazení L : IRn —► IRm, tj. že každé lineární zobrazení L je tvaru La pro vhodnou matici A typu m x n.
Věta 12. Necht L : IRn —► IRm je lineárni zobrazení. Potom existuje matice A typu m x n taková, že L (u) = A ■ u pro všechny u G Wl, neboli L = La- Navíc, sloupce matice A jsou obrazy bázových vektoru ei,..., en, tj.
A = (aW ... aM) , kde a[i] = L(eť) G Rm, i = l,...,n.
Důkaz. Nechť u = (xi,..., xn)T G IRn je libovolný vektor. Potom u = x\ e\ + • • • + xn en a tedy L (u) = L(xi ei + • • • + xn en) = xľ L(e{) + • • • + xn L(en)
= Xl a[1] + • • • + xn a[n] = (aW ... aN) . j : J = A-u.
\xnJ
Platí proto rovnost L = La pro výše uvedenou m x n matici A. □
Příklad 109. Jak již víme, lineární zobrazení rotace v IR2 o úhel ip v kladném směru kolem počátku je reprezentováno maticí
A
cos ip — srn ip sin ip cos íp
Podobně, rotace v IR3 kolem dané přímky procházející počátkem lze reprezentovat pomocí matice, viz demonštratívni cvičení. □
V předchozím jsme tedy ukázali, že každé lineární zobrazení mezi vektorovými prostory IRn a IRm je v podstatě matice. Totéž lze říci i o lineárních zobrazeních mezi obecnými konečněrozměrnými vektorovými prostory.
Nechť V je vektorový prostor dimenze n, v němž zvolíme nějakou bázi u = (u1}... ,un). Nechť W je (cílový) vektorový prostor dimenze m, v němž zvolíme nějakou bázi v = (vi,..., vm). A nechť L : V —► W je libovolné lineární zobrazení mezi těmito prostory.
Je-li w g V libovolný (ale pevně zvolený) vektor, potom jej lze jednoznačně vyjádřit jako lineární kombinaci bázových vektorů prostoru V, tj.
w = x1u1-\-----\-xnun, tj.[w]u=\ : |g
\Xri
Potom pro obraz vektoru u v zobrazení L platí
'X\
L(w) = L(x1u1 H-----h xn Un) = x± L{u\) -\-----h xn L{un) = (L(iti) ... L{un))
\XTi
Pokud tedy napíšeme obě strany této rovnosti v bázi v cílového prostoru W, potom je
lL(w)]v = ([£(^i)k • • • [L(un)]v) ■ [w]u. A proto platí následující tvrzení o maticové reprezentaci lineárních zobrazení.
92
Věta 13. Pro každé lineární zobrazení L : V —► W mezi (konečnérozmérnými) vektorovými prostory V (dimenze n s bází u) a W (dimenze m s bází v) existuje matice A typu m x n s vlastností
[L(w)]v = A ■ [w]u pro všechny vektory w E V.
Matice A reprezentuje toto lineárni zobrazení L v bázích u a v, přičemž sloupce matice A jsou
souřadnice obrazů bázových vektorů ui,...,un (výchozího prostoru V) v bázi v (cílového prostoru W), tj.
A = (aW ... aM) , kde a[i] = [L{uí)]„ eRm, i = l,...,n.
Výše uvedený výsledek můžeme zobrazit pomocí následujícího schématu:
L TTT L
V
w
w
Lw)
La
[w\u>■ [L(w)]v
w]ußRn, [LW]»eISm, [Lfm^A-Hj
Tedy abychom znali, jak lineární zobrazení L vlastně vypadá, stačí znát obrazy bázových vektorů výchozího prostoru V v (nějaké) bázi cílového prostoru W.
Konec 7. přednášky (9.11.2009)
Příklad 110. Nechť L : IR3 —► IR2 je pro dáno předpisem:
íXl\
L(u) = x1 v1 + (x3 - x2) v2, kde u = I x2 , v1 = ,
w
Určete matici A, která reprezentuje toto lineární zobrazení
v2
(a) v bázích e = (ei, e2, e3) a e = (ei, e2) (standardní báze prostorů IR3 a IR2)
(b) v bázích e = (ei, e2, e3) a v = (vi, v2).
Řešení.
(a) Zobrazení L v bázích e = (e1,e2, e3) a e = (e1; e2). Protože je
L(u]
2xx - x2 + x3
-Xi + 2x2 — 2X;-
L(e1)=(1, L(e2
L(e3)
a protože ve standardní bázi e cílového prostoru IR2 je w = [w]e, je maticová reprezentace zobrazení L v těchto bázích
2—1 1 \ ±. T, , (2-11 A = Ae,e = ( 4 2 _2 , tj. L(u) = _x 2 _2
^2
93
(b) Zobrazení L v bázích e = (ei, e2, e3) a v = (vi,v2). Protože je
^(ei) = = v1, L(e2) = ( = ~v<2> L(es) = =
[£(ei)k=(j), [L(e2)]- = (-l) ' tL(e3)k=(?);
je maticová reprezentace zobrazení L v těchto bázích
5 = BŘ,v = (J ^ {) , tj. = í J _°x J ) • I x2
x2 x3í
Např. obraz vektoru u = (1, 2, 3) má v bázi e souřadnice
[**•)].=**•>=(a v _y • h i=(-3
zatímco v bázi v má souřadnice
[L{u)]v = ( g ^ l) ' ( ^ j = (^j ' (Všimněte si, že tedy platí L[u) = lv± + lv2.)
□
Samozřejmě je mnohem jednodušší napsat matici lineárního zobrazení ve standardních bázích prostorů IRn (resp. obecného vektorového prostoru V dimenze n) a IRm (resp. obecného vektorového prostoru W dimenze m) než za použití jiných bází. Při použití jiných bází, např. pro bázi u = (ui,...,un) prostoru V a bázi v = (v1}... ,vm) prostoru W, máme k dispozici příslušné matice přechodu mezi těmito bázemi a příslušnými „standardními" bázemi (pokud je standardní báze k dispozici), viz odstavec 10.7.
Tedy je-li w G V libovolný (ale pevně zvolený) vektor, potom platí
[w]e_ = U ■ M„, [L(w)]e_ = V ■ [L(w)]v;
kde
U je matice přechodu od báze u k bázi e ve výchozím prostoru V, tj. U G Matnxn. V je matice přechodu od báze v k bázi e v cílovém prostoru W, tj. V G Matmxm .
Tedy je-li A G Matmxn matice lineárního zobrazení L : V —► W ve standardních bázích e a e, potom má matice tohoto lineárního zobrazení v bázích u & v tvar
B = B%,v = V'1 ■ A ■ U (GMatmxn),
protože platí
[L(w)]v_ = V'1 ■ [L{w)]e_ = V-1-A- [w]e = V-1-A-U- M„.
Odvodili jsme tedy následující tvrzení.
94
Tvrzení 26. Každé lineární zobrazení L : V —► W má v bázích u = (ui,... ,un) prostoru V a v = (vi,... ,vm) prostoru W maticovou reprezentaci
B = B^V_ = V-1-A-U, tj. [L(w)]v = B ■ H„ VweV,
kde A = AĚje Je matice tohoto zobrazení ve standardních bázích e a e a U a V jsou příslušné matice přechodu od bází u a v k bázím e a e.
Příklad 111. V Příkladu 110(b) je matice přechodu of báze v = (v1} v2) k bázi e (v cílovém prostoru W)
v={[Vl]e_ n,) = (,1 ,2) = í_21 M, v-i = -\(~? -21) = (\_
3
a tedy je podle Tvrzení 26 matice uvažovaného lineárního zobrazení v bázích e a v rovna
—-(A -«■ (A V i) - (i i ( "
□
Pokud zvolíme W = V a zobrazení L = idy je identické zobrazení na prostoru V, tj. L(u) = u pro všechny m G V, je zřejmě maticová reprezentace takového zobrazení ve standardních bázích e a e jednotková matice řádu n, tj.
A = AŘ,e = I, neboť [L(w)]e = L(w) = w = I ■ [w]e-
Odsud a z Tvrzení 26 potom plyne, že matice identického zobrazení v bázích u a v je
B = Bu,v = V'1 ■ I ■ U = V'1 ■ U = T,
neboli je to matice přechodu od báze u k bázi v, viz vzorec (28) v odstavci 10.7.
Důsledek 3. Nechť u = (ui,..., un) av = (ví,..., vn) jsou dvě báze vektorového prostoru V. Potom matice přechodu T od báze u k bázi v reprezentuje identické zobrazení idy : V —► V v bázích u a v.
10.10. Lineární transformace vektorového prostoru. Pokud se cílový vektorový prostor shoduje s výhozím prostorem, tj. pokud je W = V a tedy L : V —► V, nazýváme lineární zobrazení L lineární transformací vektorového prostoru V. V tomto případě má tedy smysl zvolit v „cílovém" prostoru stejnou bázi jako ve „výchozím" prostoru, tj. matice takovéto transformace je vztažena pouze na jedinou bázi u = (ui,..., un) prostoru V.
Příklad 112. Lineární transformace rotace v IR2 o úhel ip v kladném směru kolem počátku je ve standardní bázi e reprezentována maticí
A = AP
cos ip — srn ip sin ip cos íp
viz také Příklad 109. □
V předchozím odstavci jsme viděli, že matice lineárního zobrazení závisí na volbě bází ve výchozím a cílovém prostoru. A tedy i matice lineární transformace na prostoru V závisí na volbě báze u. Dostáváme se tedy ke dvěma důležitým otázkám:
Jak vhodně zvolit bázi prostoru V, aby např. byla matice lineární transfomace L co „nejjed-nodušší"?
95
Jaký je vztah mezi maticovými reprezentacemi lineární transfomace L vzhledem k různým bázím prostoru VI
Příklad 113. Uvažujme lineární transformaci L : IR —► IR danou vztahem
A = Ae=[ n O1 ) > ťJ- iLH]e = L(W) =A-W = A- He-
(a) Určete matici transformace L ve standardní bázi e = (e1; e2) prostoru IR2
-2 -:
0 2
(b) Určete matici transformace L v bázi w = (ui,u2), kde
A A'
1 l) ' M2 " ^2/ '
í. řešení. Potřebujeme znát souřadnice obrazů bázových vektorů ui a u2 v bázi w. Tedy vzhledem k bázi e platí
L(ui) = A ■ ui L{u2) = A-u2
0 21)-(l) (23 0 2 J'(2) = ( 4
Matice přechodu od báze u k bázi e je
'1 U rT-l
U = ([«l]e [íí2]e) = 2) ' a tedy ^
je matice přechodu od báze e k bázi u. A proto je
[^Mk = ÍA1 • [L(u2)} Proto má hledaná matice transformace L v bázi u tvar
-1 1
-1 íJ'U; v s
2 -l\ /-4\ /"-12 -1 1 j " V 4
-8 -12 5 8
řešení. Potřebujeme najít matici B = Bu, pro kterou platí
[L{w)]lt = B-[w]lt Vwem2.
Za použití standardní báze e ale platí
[L(w)]u = U'1 ■ [L(w)]e_ = U-1-A- He = U'1 ■ A ■ U ■ M„ a tudíž má hledaná matice B tvar
B = U'1 ■ A ■ U =
2 -1\ -2 -1\ /l 1\ _ /-8 -12 -1 lJ'lO 2 J ' ll 2 J ~ l 5 8
□
96
V obecném vektorovém prostoru V, ve kterém zafixujeme báze u = (ui,..., un) &v= (vi,..., vn) potom platí následující věta.
Věta 14. Nechť L : V —► V je lineární transformace na vektorovém prostoru V. Nechť T je matice přechodu od báze v k bázi u (tedy T_1 je matice přechodu od báze u k bázi v). Je-li A = Am matice transformace L v bázi u, potom je matice této transformace v bázi v rovna
B = R, = T"1 ■ A- T.
Důkaz. Z definice matice přechodu od báze v k bázi u platí
[w]u = T ■ [w]v, [w]v = T_1 • [w]u Vw e V.
A protože je
= A ■ H„.
platí
[L(w)]v = T-1 ■ [L(w)]u =T-1-A- H„ = T-1 ■ A ■ T ■ [w],, = B ■ [w]
(29)
□
Vzhledem k Důsledku 3 (o matici přechodu a identickém zobrazení na V) pak lze tvrzení Věty 14 shrnout do následujícího diagramu:
báze u:
báze v:
L=L,
L=L,
[W\ id v
\w
id.
L=Lf
B
[L(w)]t_
10.11. Podobnost matic. V předchozím odstavci jsme odvodili, že matice A a B téže lineární transformace v různých bázích splňují vztah (29), tj. jsou „svázány" pomocí regulární matice T. Tento vztah je velmi důležitý a má v teorii matic své jméno.
Definice 6. Dvě čtvercové matice A, B řádu n se nazývají podobné, pokud pro nějakou regulární matici T platí
B = T'1 ■ A ■ T.
Pro vztah podobnosti mezi maticemi A a B se často používá symbol A ~ B. □ Tedy platí následující.
Důsledek 4. Matice A a B téže lineární transformace L : V —► V v různých bázích u = (u1}..., un) a v = («!,..., vn) jsou podobné. Vztah podobnosti B = T~xAT je zprostředkován maticí T, která je maticí přechodu od báze v k bázi u.
Všimněte si, že vztahy
B = T'1 AT a A = TBT~ľ = (T'1)-1 AT'1 jsou ekvivalentní, tj. A ~ B je ekvivalentní s B ~ A. Zejména je
A ~ A, neboť A = I'1 ■ A ■ I. Dále, je-li i~5a současně B ~ C, tj.
B = T-X -A-T, C = S-1-B-S
97
pro nějaké regulární matice T a S, potom je
C = S'1 ■ B ■ S = S'1 ■ [T'1 -A-T)-S= (TS)-1 ■ A ■ (T S),
neboli A ~ C. Jedná se tedy o relaci ekvivalence na množině Matnxn, a tato ekvivalence vytváří třídy rozkladu navzájem podobných matic.
Podobné matice mají spoustu důležitých vlastností, např.
• mají stejný determinant (dokažte si to),
• mají stejnou stopu, přičemž stopa (z angl. „trace") čtvercové matice A = (a^) je číslo
tr A := au + a22 H-----h ann,
tj. je to součet prvků na hlavní diagonále,
• mají stejné vlastní hodnoty (viz později v Sekci 13).
98
11. Euklidovský prostor
Do vektorového prostom (IRn, +, •) nyní doplníme další „strukturu", abychom dokázali odvodit více informací např. o vzájemné poloze vektorů, podprostorů, délce, vzdálenosti, úhlech, atd. Budeme zkoumat otázky typu
• Jak daleko leží nějaký bod od podprostorů?
• Který bod v podprostorů je nejblíže k nějakému zvolenému bodu (který leží mimo tento podprostor)?
11.1. Skalární součin v IRn. V odstavci 7.1 jsme definovali skalární součin dvou vektorů u,ti£R" jako číslo
U ■ V = UiVi + • • • + un vn. (To lze zapsat i pomocí maticového násobení jako uT -v, pokud chápeme vektory v IRn jako sloupcové vektory.) Evidentně platí vztah symetrie u ■ v = v ■ u.
Vektorový prostor IRn s výše uvedeným skalárním součinem nazýváme Euklidovský (vektorový) prostor.
Délka (též norma) vektoru u G W1 je pak definována jako
||w|| := y/u ■ u = \Ju\ H-----h u2n.
Úhel mezi dvěma nenulovými vektory u,v G IRn je číslo ip G [0,7r] splňující
u ■ v
U ■ V = \\U\\\\V cos if, tj. COS9?=-r———-.
\\u\\ \\v\\
To, že vůbec lze takto úhel dvou vektorů definovat (tj. že výraz napravo je číslo z intervalu [—1,1]) plyne z následující Cauchyovy (též Cauchy-Schwarzovy) nerovnosti.
Tvrzení 27. Pro libovolné dva vektory u, v G W1 platí
\u • v\ < \\u\\ \\v\\, (30)
přičemž rovnost nastane právě když jsou vektory u a v lineárně závislé (tj. jeden z nich je násobkem toho druhého).
Důkaz. Definujme pomocný vektor
u ■ v
w := u — -—— v. \\v\\
Potom w ■ v = 0, protože
u ■ v u ■ v
w ■ v = u ■ v — -—— (v ■ v) = u ■ v — -—— \\v\\ = 0. \\v\\2 Wvy^
Odsud plyne
0 < \\w\\2 = w • w = w • (u
99
Vynásobením této nerovnosti číslem \\v\\2 dostaneme
o < IM|2 IMI2 — \u ■ v\2,
tj. platí uvedená nerovnost (30). Dále, rovnost v (30) nastane právě když w = 0, tj. právě když jsou vektory u a v lineárně závislé. □
Poznámka 5. Pokud nastane v Cauchyově nerovnosti rovnost, tj. pokud \u-v\ = \\u\\ \\v\\ (tj. víme, že jeden z vektorů je násobkem toho druhého vektoru), potom platí
u ■ v = \\u\\ \\v\\ nebo u ■ v = — \\u\\ \\v\\.
V prvním případě je tento násobek kladné číslo, tj. cosip = 1 neboli ip = 0, ve druhém případě je tento násobek záporné číslo, tj. cosip = — 1 neboli >p> = tt. □
Pro každý nenulový vektor iíéK" definujeme jeho směrový vektor wu jako jednotkový vektor, tj. \\wu\\ = 1, který má stejný směr jako původní vektor u. Zřejmě je tedy
1
wu = tí—rru-
\\u\\
Je-li wu směrový vektor vektoru u a wv směrový vektor vektoru v, potom pro úhel vektorů u a, v zřejmě platí vztah
u ■ v wu ■ wv
COS if =--:—-—- =--:—--- = Wu ■ Wv.
\u\\ \\v\\ \\wu\\ \\wv\\
Řekneme, že vektory u a v jsou navzájem kolmé (též ortogonální), pokud je jejich skalární součin roven nule, tj. pokud u ■ v = 0. Píšeme u _L v. To zřejmě nastane pokud je jeden z těchto vektorů nulový vektor 0 G Mn nebo pokud svírají tyto vektory pravý úhel, tj. cos>p> = 0.
Příklad 114.
(a) Nulový vektor 0 G Mn je kolmý na libovolný vektor u G IRn.
(b) Vektory (2, —1) a (1,2) jsou kolmé.
(c) Vektory standardní báze e = (ei,..., en) jsou navzájem kolmé, tj. _L e,- pro i ^ j.
(d) Normálový vektor N roviny p C IR3 je kolmý na tuto rovinu, tj. na všechny vektory u ležící v rovině p (viz obr.).
□
100
11.2. Ortogonální podprostory v IRn. Kolmost podprostorů prostoru IRn definujeme stejně jako kolmost jednotlivých vektorů, jen musí být příslušný skalární součin nulový pro všechny vektory z daných podprostorů. Tj. dva podprostory laľ prostoru IRn jsou navzájem kolmé (též ortogonální), pokud
u _L v (tj. u ■ v = 0) pro všechny vektory u E X, v E Y.
Příklad 115.
(a) Je-li X = Span (ei) a Z = Span (e3) v IR3, potom libovolný vektor u E X a, libovolný vektor w E Z mají tvar
íUl\ (0 \
u = 0 , «)= 0 , a tedy u ■ w = 0.
\0 / w
Platí proto X J_ Z.
(b) Podobně, je-li Y = Span (e2), pak platí I 1 ľ a ľ 1 Z.
(c) Je-li U = Span (ei, e2) (= rovina xy), potom libovolný vektor u E U má tvar
V
u = I u2 I , a tedy u ■ w = 0 pro w E Z.
0
Platí proto U L Z.
(d) Všimněte si, že je-li V = Span(e2,e3) (= rovina yz), tak potom podprostory U a V kolmé nejsou. Např. pro vektory
'A (o-
u=\1\eU, v=\1\eV platí u-v = 0 + 1 + 0 = 1, tj.uJĹv.
0 \1
□
Příklad 116. Nechť A je matice typu mxn. V odstavci 10.4 jsme definovali jádro Ker A CW1 matice A jako množinu řešení iGl™ lineárního homogenního systému Ax = 0, řádkový prostor R(A) C IR™ matice A jako množinu lineárních kombinací řádků matice A a sloupcový prostor ImAC IRm matice A jako množinu lineárních kombinací sloupců matice A.
Pro x E Ker A je tedy
A ■ x =
tj. vektory x E Ker A splňují
x _L všechny řádky matice A, tj.
x _L všechny lineární kombinace řádků matice A, tj. x _L R(A), x _L všechny sloupce matice AT, tj.
x _L všechny lineární kombinace sloupců matice AT, tj. x _L lmAT.
101
Ukázali jsme tedy důležitý fakt, že
Ker A _L R(A) a KerA±lmAT. (31)
□
11.3. Ortogonální doplněk v IRn. Je-li Y podprostor Euklidovského prostoru IRn, potom se množina
Y± := {-u G W1, u _L v pro všechny vektory v G nazývá ortogonální kompement podprostoru Y (v prostoru IRn).
YL je tedy množina všech vektorů, které jsou kolmé na všechny vektory v podprostoru Y.
Příklad 117. Se stejným značením jako v Příkladu 115 máme v prostoru IR3 následující.
(a) Pro V = Span (e2, e3) je
V± = j:r G IR3, x _L v pro všechny vektory v G V"}
= jiG IR3, x ■ (0,^2,^3) = 0 pro všechny koeficienty «2,^3 G IR}
= [iG IR3, x = (xu 0, 0), x1 G IR} = Span (e^ = X. Je tedy V± = X.
(b) Podobně platí
X± = Span (e2, e3) = V7^, Z-1 = Span (ei, e2) = ř7.
(c) Všimněte si, že ačkoliv X _L Z, není podprostor Z ortogonální doplněk prostoru X (a naopak).
(d) Triviální podprostory {0} a IRn tvoří navzájem ortogonální doplňky, tj.
{0}^=»™, (Mn)± = {0}.
Tyto vztahy zřejmě interpretujeme tak, že nulový vektor je kolmý ke všem vektorům a že jediný vektor, který je kolmý ke všem vektorům, je právě nulový vektor.
□
Evidentně pro libovolný podprostor Y platí, že Y _L YL. Ovšem pokud Y _L Z, neplyne z toho nutně, že Z = YL, jak uvádíme výše v Příkladu 117(c). Množina YL může zřejmě být „větší", než je množina Z. V tomto případě ale vždy platí inkluze Z C YL.
Tvrzení 28. Necht X a Y jsou podprostory Euklidovského prostoru W1.
(i) Je-li X _L Y, potom je X f]Y = {0}.
(ii) YL (a samozřejmě i XL) je také podprostor prostoru W1.
Důkaz, (i) Je-li u G X fl Y, potom je u _L u, tj. ||w||2 = u ■ u = 0. To je možné jenom tehdy, pokud je u = 0.
(ii) Musíme ukázat, že platí vlastnosti uzávěru pro operace + (sčítání vektorů) a • (násobení vektoru číslem), tj. vlastnosti Ul a U2 v odstavci 10.1.
102
Ul. Nechť u,v E YL. Potom ?i-«i = 0a«-iíJ = 0 pro všechny vektory w G Y. A tedy pro wEY platí
(u + v) ■ w = (u ■ w) + (v ■ w) = 0 + 0 = 0, tj. u + v 0, přičemž (u,u) = 0 <š=> u = 0.
(ii) je symetrické, tj.
(u,v) = (v,u),
(iii) je lineární v první složce, tj.
(a • u + b • v,w) = a . (u, w) + b. (v, w).
Skalární součin na V tedy přiřazuje dvěma vektorům u, v G V (objektům z prostoru V) reálné číslo (u,v). Vlastnost symetrie implikuje linearitu také ve druhé složce, tj.
(u, a • v + b • w) = (a ■ v + b ■ w,u) = a . (v,u) + b. (w, u) = a . (u,v) + b. (u, w).
Jak uvidíme níže v Příkladu 121, na některých vektorových prostorech lze definovat více (i nekonečně mnoho) různých skalárních součinů (•,•), zatímco na jiných prostorech skalární součin vůbec definovat nelze. Vektorový prostor V, na kterém je definován (nějaký) skalární součin pak jednoduše nazýváme vektorový prostor se skalárním součinem.
Příklad 121.
(a) V prostoru IRn můžeme zvolit
(u, v) := u ■ v = Ui v i (obvyklý skalární součin).
í=i
případně pro pevně zvolená kladná čísla w1}... ,wn můžeme vzít
(u, v) := w,i u,L v,i (skalární součin s vahou w = (wi,..., wn)). í=i
(b) V prostoru Matmxn můžeme zvolit
m n
(A, B) : Y.Y.""b'r
i=i j=i
Tj. vynásobíme prvky na stejných pozicích a výsledné součiny sečteme. (Ověřte si, že se skutečně jedná o skalární součin, tj. jsou splněny výše uvedené vlastnosti (i)-(iii).) Všimněte si, že skalární součin má ve své definici požadavek na lineární kombinace matic a tedy ho lze definovat pouze pro matice stejného typu.
107
(c) viz později v MB102 - v prostoru C[a, b] spojitých funkcí na intervalu [a, b] můžeme zvolit
(f,g) ■= / f(x)g(x)dx,
J a
případně pro pevně zvolenou kladnou spojitou funkci w(x) na [a, b] můžeme vzít
(f,g)
ŕ
/ w(x) f(x) g{x) dx, (skalární součin s vahou w(x)).
J a
(d) Zvolme n +1 různých bodů xq,Xi, ... ,xn EWL. Potom v prostoru Vn polynomů stupně nejvýše n můžeme zvolit
n
ÍP,q) ■= ^2p(xi)q(xi).
(Ověřte si, že se skutečně jedná o skalární součin.) Případně pro pevně zvolená kladná čísla
w0, Wi,..., wn můžeme vzít
(p, q) := W;Lp(x,j) q{x,j) (skalární součin s vahou w = (w0, wi,... ,wn)).
(e) Na vektorovém prostoru T všech funkcí / : IR —► IR skalární součin definovat nelze. (Dokonce zde nelze definovat ani normu, tj. prostor T není ani normovaný prostor, viz dále.)
□
Každý skalární součin (•, •) definuje přirozeným způsobem normu (též délku) každého vektoru u E V následovně:
||w|| := \/(u,u).
Příklad 122.
(a) V prostoru IRn s obvyklým skalárním součinem je
||it|| = a/(u, u) = \Ju- u = \Jx\ + • • • + x\, kde u = (xľ,..., xn). Tuto normu budeme nazývat Euklidovská norma prostoru IRn a značit s indexem 2, tj.
ini2 == V^í + ••• + <■ (b) Tzv. Frobeniova norma v prostoru Matmxn je definována jako
4-
\\A\\F:= v/(^4) = EEl i=i j=i
Číslo || A || p je tedy součet kvadrátů všech prvků matice A. Např.
1 3 1
2 2 1
v7!+ 9 + 1 + 4 + 4 + 1 = V2Ô = 2VŠ.
F
(c) viz MB102 - tzv. L2-norma v prostoru C[a, b] je definována jako
= VUJJ=\I rf2(x)dx.
□
108
Podobně jako v prostoru IRn i v libovolném vektorovém prostoru se skalárním součinem platí Cauchyova nerovnost (viz Tvrzení 27 v odstavci 11.1).
Tvrzení 33. Je-li V vektorový prostor se skalárním součinem, potom pro libovolné dva vektory u, v G V platí
\(u,v)\< IMHMI, (34)
přičemž rovnost nastane právě když jsou vektory u a v lineárně závislé (tj. jeden z nich je násobkem toho druhého).
Důkaz. Důkaz je identický s důkazem pro prostor IRn, viz Tvrzení 27, a proto jej vynecháme. □
Na základě Cauchyovy nerovnosti lze definovat úhel (též odchylka) mezi dvěma vektory u a v jako číslo ip G [0,7r] splňující
(u,v)
COS íf
\u\\ \\v
Dva vektory u, v G V nazýváme kolmé (též ortogonální), pokud je (u, v) = 0. V souladu se zvyklostí v IRn pak píšeme u _L v.
Tvrzení 34 (Pythagorova věta). Je-li V vektorový prostor se skalárním součinem, potom pro libovolné dva vektory u, v G V, u _L v, platí
II i Il2 II ||2 , || ||2
\\u + v\\ = \\u\\ + \\v\\ .
Důkaz. Důkaz je v podstatě triviální,
\\u + v\\2 = (u + v, u + v) = (u, u) + (u, v) + (v, u) +(v, v) = II-u II2 + II v II2,
=0 =0
íviz obr.). □
Příklad 123. viz MB102 - v prostoru C[—tt,tt] jsou funkce 1 (konstantní funkce f(x) = 1) a smrč navzájem ortogonální, protože platí
/7T 1. sinxdx = 0, tj. 1 _L s'mx.
Dále je např.
||1|| = 7(1,1) = J J ldx=V2^,
sin rr || = a/(sinrr, sinx) = J sin2 xdx = \[Ťx, cos x|| = a/(cosrr, cosx) = J J cos2 x dx = yfň.
109
Tedy pokud vezmeme váhovou funkci w{x) = - na [—tv,tv], potom je
sinx|| = \J(sinx, sinx) = \ [ — sin2 xdx = 1.
V J-7t
cos
a? II = \J(cosx, cosx) = \ l I — cos2 x dx = 1.
7T
r i
(sinx, cosx) = / — (sinx) (cosx) dx = 0.
Jsou tedy vektory (= funkce) sinx a cosx navzájem ortogonální jednotkové vektory vzhledem k tomuto (váženému) skalárnímu součinu v prostoru C[—tv,7t]. (Toto dává základ pro Fourierovu analýzu.) □
12.2. Normované vektorové prostory. V předchozím odstavci jsme viděli, že norma vektoru je přirozeným způsobem dána skalárním součinem. Na daném vektorovém prostoru ovšem mohou existovat i další „normy", které např nemusejí pocházet z nějakého skalárního součinu. Případně taková „norma" může být korektně definována na vektorovém prostoru, na kterém skalární součin definovat nelze.
Buď (V, +, •) vektorový prostor. Zobrazení || • || : V —► IR nazýváme norma (též délka), pokud má následující vlastnosti:
(i) je tzv. pozitivně definitní, tj.
Ml > 0, přičemž ||it|| =0 u = 0.
(ii) je pozitivně homogenní, tj.
a . u\\ = \a\ . \\u
(iii) splňuje trojúhelníkovou nerovnost, tj.
u + v\\ < \\u\\ + \\v
Norma na prostoru V tedy přiřazuje každému vektoru u E V (objektům z prostoru V) reálné číslo ||it||. Ověřte si, že norma definovaná pomocí skalárního součinu splňuje výše uvedené vlastnosti normy.
Jak uvidíme níže v Příkladu 124, na některých vektorových prostorech lze definovat více (i nekonečně mnoho) různých norem || • ||, zatímco na jiných prostorech normu vůbec definovat nelze. Vektorový prostor V, na kterém je definována (nějaká) norma pak nazýváme normovaný vektorový prostor.
Příklad 124. V Příkladu 122 jsme viděli některé normy, které jsou na daném vektorovém prostoru indukovány skalárním součinem. Obecněji, následující příklady jsou také normy na příslušných prostorech (ale tyto normy už nejsou indukovány skalárním součinem).
110
(a) V prostoru IRn můžeme definovat např. následující normy: pro u = (xi,..., xn) G
i'
||it||i := ^^|rEj| tzv. 1-norma.
|w||oo := max \xí\ tzv. stejnoměrná norma.
KKn
n
\xí\p J tzv. p-norma (pro p > 1).
.i=i
Norma || • ||2 uvedená v Příkladu 122(a) je speciálním případem p-normy pro p = 2. Jako jediná je odvozena ze skalárního součinu. Norma || • ||i je zřejmě také p-norma pro p = 1. V prostorech s normou || • ||p s p ^ 2 ale např. neplatí Pythagorova věta.
(b) V prostoru Matmxn můžeme definovat např. následující normy: pro A = (a^) G Matmxrí
m n
|A||i := tzv. 1-norma.
í=i j=i
\\A\loo := max \a^\ tzv. stejnoměrná norma.
l 1).
Norma || • ||^2 uvedená v Příkladu 122(c) je speciálním případem Lp-normy pro p = 2. Jako jediná je odvozena ze skalárního součinu. Norma || • ||^i je zřejmě také Lp-norma pro p = 1.
□
Následující diagram ukazuje vztah mezi jednotlivými typy vektorových prostorů:
vektorové prostory se skalárním součinem.
např.
(Matmxn, II • ■(C[a,b],\\.\\L2)
normované vektorové prostory.
např.
. (M",II • y, P^2
• (Matmxn, || • ||i) . (C[a, b], ||- \\LP), pÝ2
vektorové prostory.
např.
• T
• C (M)
111
Norma měří vzdálenost mezi vektory, tj. číslo \\u — v\\ je vzdálenost mezi vektory u a v v normovaném vektorovém prostoru V. To pak motivuje následující otázky:
• Je-li dán podprostor W vektorového prostoru V a vektor u E V ale u G- W. Jaká je pak vzdálenost vektoru u od podprostoru Wl Jak najít (pokud vůbec existuje) vektor w E W, který je k vektoru u nejblíže (ve smyslu zvolené normy)?
12.3. Problém nejmenších čtverců. Základní otázku tohoto odstavce lze formulovat takto:
• Jak můžeme aproximovat daná data (v rovině) pomocí nějaké funkce (lineární, kvadratické, atd.), která tato data aproximuje nejlépe? (= má nejmenší chybu), viz obr.
Zejména, pokud máme systém lineárních rovnic Ax = b, který nemá řešení, tak se má smysl ptát na existenci (a algoritmus nalezení) vektoru x s vlastností, že hodnota Ax je k vektoru b nejblíže. Přesněji, pro matici A typu m x n a vektor b G W71 položme
r (x) := Ax — b tzv. reziduálni vektor.
a vezměme v prostom IRm normu || • || := || • ||2 (tedy normu pocházející ze skalárního součinu, pro jednoduchost budeme index 2 vynechávat). Potom výraz
měří vzdálenost mezi vektory Ax a b (a přitom je ||r(rr)|| = 0 <š=> systém Ax = b má řešení).
Vektor x G IRn, který minimalizuje výraz ||r(rr)|| (nebo ||r(x)||2) nazýváme řešení systému Ax = b nalezené metodou nejmenších čtverců (protože se minimalizují kvadráty odchylek).
Vektor p := Ax G Im A je právě ten vektor v prostoru ImA, který je nejblíže k vektoru b (viz obr.). Ukážeme nyní, že takový nejbližší vektor skutečně existuje a odvodíme, jak jej nalézt.
Věta 15. Nechť W je podprostor v W71. Potom pro každý vektor b G IRm existuje jediný vektor p G W, který je nejblíže k vektoru b, tj.
||6 — p|| < ||6 — y\\ pro všechny vektory y E W, y ý P-
Navíc, vektor p E W je nejbližší k vektoru b E W71 <š=> b — p E WL.
Důkaz. Protože platí přímý součet IRm = W © WL, můžeme vektor b rozložit jediným způsobem na součet b = p + z, přičemž p E W & z E WL. Potom se ukáže, že vektor p je k vektoru b nejblíže. Všimněte si, že pokud je již b E W, potom je dekompozice vektoru b tvaru b = b + 0, tj. p = b. □
Vektor p ve Větě 15 se nazývá projekce vektoru b na podprostor W.
Pro metodu nejmenších čtverců pak vezmeme IV := ImA a tedy p je v tomto případě projekce vektoru b pravých stran na prostor ImA, tj. na obraz matice A.
Je-li x řešení problému nejmenších čtverců pro systém Ax = b, potom je podle Věty 15
No a protože podle Tvrzení 32 v odstavci 11.4 je (ImA)1 = Ker AT, je x řešení problému nejmenších čtverců <š=> r(x) E Ker AT, tj.
případně
r(x) = b — Ax = b — p E (Im A)
ATr\x) = 0, tj. AT{b - Ax) = 0,
neboli
x je řešení tzv. normálního systému ATA x = ATb .
112
Příklad 125. Určete řešení problému nej menších čtverců
Řešení. Pro tento systém je
A
Xi + x2 = 1,
Xi - 2x2 = 2,
3xi + x2 = -1
2x1 — x2 = 2.
A 1 \
1 -2 2
3 1 b = -1
V2 -v
a zřejmě systém Ax = b nemá řešení (tj. je nekonzistentní). Příslušný normální systém je ATAx = ATb.
A i\
A 1 3 2 \ 1-2 1 -2 1 -1J ' 3 1
V2 -v
'15 0 0 7
tedy hledané řešení problému nej menších čtverců je
4 15
113 2 1-2 1-1
Xi
x2
6
'7"
2
-1
V27
□
Normální systém může mít obecně více než jedno řešení (a potom již má tento systém nekonečně mnoho řešení, viz kapitola 6). To nastane, pokud je matice ATA singulární. Pokud jsou ale např. vektory x a, y dvě různá řešení tohoto normálního systému, potom je
p = Ax = Aý,
protože podle Věty 15 je vektor p určen jednoznačně.
Věta 16. Nechť A je m x n matice s hodností h(A) = n (tj. hodnost je počet proměnných). Potom má metoda nejmenších čtverců právě jedno řešení
x = (ATA)-1ATb.
Vektor p G Im A, který je nejblíže k vektoru pravých stran b, pak je
p = A{ATA)-1ATb.
Důkaz. Je-li h(Á) = n, potom je matice ATA čtvercová matice řádu n a je regulární. Tedy existuje k ní inverzní matice (ATA)^1, pomocí níž vypočítáme z normálního systému jediné řešení x. □
Čtvercová matice P := A(ATA)^1 AT řádu m z Věty 16 je projekce prostoru IRm na podprostor Im A. Obecně, čtvercová matice P je projekce, pokud splňuje
P2 = P, tj. P-P = P.
(Ověřte si, že matice A(ATA)~1AT tuto podmínku splňuje.) Projekce vlastně funguje tak, že daný vektor u zobrazí na vektor Pu, který se již při dalším zobrazování v projekci P nemění.
113
Projekce jsou obvykle singulární matice, jediná regulární projekce je jednotková matice I (viz také demonštratívni cvičení).
Příklad 126. Matice A v Příkladu 125 je typu 4 x 2 a přitom je h(A) = 2. Má tedy daný problém nej menších čtverců jediné řešení. □
Příklad 127. Úkolem fyzikálního pokusu je změřit tuhost pružiny (pružinovou konstantu). Závaží o hmotnosti (postupně)
m = 2,3,5,8,10
prodloužilo danou pružinu o (postupně)
6,8,14,22,26 cm.
(Měření zřejmě obsahují drobné odchylky.) Podle Hookova zákona je prodloužení pružiny přímo úměrné síle, která toto prodloužení způsobuje, tj.
k . I = m . g.
kde g = 10 m/s2 je (zaokrouhlená) gravitační konstanta a A; je hledaná pružinová konstanta (a l musíme převést na metry). Je tedy
0.06 k = 20, 0.08 k = 30, 0.14 k = 50, 0.22 k = 80, 0.26 k = 100.
Řešení tohoto systému metodou nejmenších čtverců pak dává
/20\ 30 50 80
Viooy
(0.06 0.08 0.14 0.22 0.26)
/0.06\
0.08
0.14 k
0.22
^0.26 yi
0.1456 k
k = (0.06 0.08 0.14 0.22 0.26)
Je tedy k « 372.25 N/m.
□
Metoda nejmenších čtverců se také používá pro nalezení interpolačního polynomu. Máme-li naměřená data
čas t0 h
hodnota T0 Ti T
pak hledáme (např. lineární, kvadratický, atd.) polynom, který nejlépe - ve smyslu metody nejmenších čtverců - tato data aproximuje.
Lineární aproximace - hledáme hodnoty fc,g G K tak, že data [to,To], ..., [ín,Tn] leží co nejblíže přímce y = kx + q. Tato metoda se také nazývá lineární regrese. Musí být tedy „splněn" systém
kt0 + q = T0, ktx + q = Ti,
114
neboli
(h 1\ /T0\
1 Ti
Řešení (/c, q), tj. přímka y = kx + q, nalezené metodou nejmenších čtverců se nazývá regresní přímka.
Příklad 128. Měřením výšky dítěte se zjistilo, že ve věku t měsíců dítě měřilo y cm,
t měsíců 0 1 3 6 9 12
y cm 50 53 57 65 68 72
Určete regresní přímku udávající závislost výšky dítěte na věku, která aproximuje tato data. Řešení. Matice A a vektor b mají tvar
/50\
53
57 65 68 V72/
A
f°
1 1
3 1
6 1
9 1
\12 1/
Tedy normální systém ATAx = ATb je
0 1 3 6 9 12 11111 1
/O 1\
1 1
3 1
6 1
9 1
Vl2 lj
271 31
31 6
0 1 3 6 9 12 11111 1
/50\
53
57 65 68 V72/
/2090\ l 365 ) '
Protože je |^4T^4| = 665 (vypočítejte si to!), je pomocí inverzní matice k matici ATA (spočítané přes matici adjungovanou)
'k\ —( 6 ~31^ f2090\ ^/ 1225\ /1.84 ^q) ~ 665 V-31 271) ' ^ 365 ) ~ 665 1,34125J ~ ^51.32,
Tedy hledaná regresní přímka má rovnici
y = 1.84í + 51.32.
□
Kvadratická aproximace - hledáme hodnoty a,b,c G IR tak, že data [to,To], [ín,Tn] leží co nejblíže ke kvadratickému polynomu y = ax2 + bx + c (označení „6" je zde náhodné, nepleťte si ho s označením vektoru pravých stran b v normálním systému). Musí být tedy „splněn" systém
aťl + bt0 + c = T0, at\ + bti + c = Ti,
atl + btn + c = Tn;
115
neboli
(t\ t0 1\
t\ h i
\t
n tn
1/
(To\
Ti
Příklad 129. Při měření volného pádu tělesa byla v čase t sekund naměřena výška y metrů,
t sekund 0 1 3 4
y m 100 95 55 20
Metodou nejmenších čtverců určete kvadratickou aproximaci těchto dat. Řešení. Matice A a vektor b mají tvar
A
/o 0 1\ Aoo\
1 1 1 b — 95
9 3 1 i u 55
\16 4 V {20j
Tedy normální systém ATAx = ATb je
0 1 9 16
0 1 3 4
1 1 1 1
910^
340 1.
270 y
Aoo\
\ 95
55
/
'338 92 92 26 26
Nyní např. Gauss-Jordanovou eliminační metodou dostaneme jediné řešení
(a, b, c) = (-5,0,100), tj. y(ť) = 100-512.
Všimněte si, že nalezená funkce vyhovuje „naměřeným" datům zcela přesně.
□
12.4. Ortogonální podmnožiny a podprostory. Ve vektorových prostorech se skalárním součinem se zajímáme o ty báze, jejichž prvky jsou vzájemně ortogonální vektory.
Nechť V je vektorový prostor se skalárním součinem (•, •). Množina vektorů {u±,... ,uk} C. V se nazývá ortogonální množina vektorů, pokud u,i _L u j pro všechny indexy i ^ j.
Příklad 130.
(a) Množina vektorů {e1;..., en} v prostoru IRn (s obvyklým skalárním součinem) tvoří ortogonální množinu vektorů, protože
(ej, Cj) = e,j_ ■ Cj = 0, pro všechny i ^ j.
116
(b) Vektory
/A /-A /-r
«1=1, U2 = 1 , íi3 = -1
W W V 2
tvoří ortogonální množinu vektorů, protože
(ui,u2) = ux ■ U2 = 0, (U!,U3) = Mi • u3 = 0, (u2,u3) = u2 ■ u3 = 0.
(c) V prostom Mat2X2 tvoří „vektory" (= matice)
ortogonální množinu, viz Příklad 121 v odstavci 12.1, kde jsme uvedli definici příslušného skalárního součinu.
(d) viz také Příklad 123 v prostoru C[—tv,7t].
□
Tvrzení 35. Nechť V je vektorový prostor se skalárním součinem (•, •). Potom jsou nenulové vektory v libovolné ortogonální množině prostoru V lineárně nezávislé.
Důkaz. Je-li {u±,... ,uk} C. V ortogonální množina vektorů, potom z rovnosti
al ul + ' ' ' + ak uk = 0
plyne (skalárním vynásobením s vektorem Uj)
dl {ui,Uj)-\-----h aj (uj,Uj)-\-----h ak (uk,Uj) = (0,Uj),
=o =KII2 =o =o
tj. dostaneme rovnost
Protože byl index j G {1,..., k} libovolný, plyne odsud lineární nezávislost vektorů u±,..., uk. □
aj \\uj\\2 = 0) ťj. a,j = 0.
Ortogonální množina vektorů {u1}... ,uk} C V se nazývá ortonormální množina, pokud mají všechny vektory u,i velikost 1, tj. ||itj|| = 1, neboli pokud
("Uj, Uj} Ó~ij,
kde bij je Kroneckerova delta funkce, viz odstavec 8.4.
Zřejmě platí jednoduché tvrzení, že z každé ortogonální množiny lze vytvořit množinu ortonormální, protože stačí každý vektor „znormalizovať', tj. místo množiny {u±,... ,uk} C V vzít množinu
1 1
Ul,--- ,7]-^Uk
\Ul\\ \\Uk\
Příklad 131.
(a) Množina vektorů {ei,..., en} v prostoru IRn (s obvyklým skalárním součinem) tvoří ortonormální množinu vektorů.
117
(b) Matice
- (i o) ■ *> - (s i) ■ * - (; t) ■ *. - (s;)
tvoří ortonormální bázi vektorového prostom Mat2X2 s obvyklým skalárním součinem z Příkladu 121 (b). Viz také Příklad 95(c).
(c) V Příkladu 130(b) je
||mi||2 = = 3, \\u2\\2 = (u2,u2) = 2, \\u3\\2 = (u3,u3) = 6.
a proto jsou vektory
ortonormální.
(d) V Příkladu 130(c) je
\\A\\2 = (A,A) = 3, \\B\\2 = (B, B) = 2, \\C\\2 = (C, C) = 6, \\D\\2 = (D, D) = 1, a proto jsou „vektory" (= matice)
bi:=^b=("oä D- *==*=(!! í
ortonormální.
□
Příklad 132. Fourierova analýza. Ve vektorovém prostoru C[—L, L] uvažujme skalární součin
1 fL , 1
(/; 9) := ^~ J f{x) ■ 9ÍX) dx tj. váhová funkce je w(x) = —.
Potom množina funkcí
r 1 rmx nnx ,
COS_ŽT' Sm_^' n = 1'2'3'---)
118
tvoří ortonormální množinu, neboť platí vztahy
,J_
'V2
ívkx
COS
rmx
sin
(cos ——, sin
L
nmx
L
nnx (sin ——, sin
L
nmx
L
ívkx
(cos-, cos
L
nmx
L
cos
srn
L
II 1
tvkx
1T
i z i z
1
z
1
z
1
z
—L L
-L L
L L
L L
nnx cos —— dx
rmx sin —— dx ■
o, o,
n-nx nmx cos —— sin —-— dx = 0,
Li Lj
n-kx nmx sin —— sin —-— dx = om
Lj Lj
n-kx nmx
cos- cos-dx = oT:
Tj L
■J_ J_ y/2'V2
)
1
Z
-L
n7rx nnx (cos ——, cos —— )
L
nnx (sin ——, sin
L
L
n-kx n
- drr = 1. 1
Z 1
z
cos
-L L
nnx n-kx
sin
1.
□
Báze vektorového prostom V, která tvoří ortonormální množinu, se nazývá ortonormální báze.
Tvrzení 36. Je-li u = (u1}..., un) ortonormální báze vektorového prostoru V, potom jsou souřadnice libovolného vektoru w G V v bázi u dány pomocí skalárního součinu vektoru w s bázovými vektory Ui, tj.
M„=l i |, kde ai = {w,Ui), Vi = l,...,n. \ar
Důkaz. Je-li
w = dl Ui + • • • + a j u j + • • • + an un, potom po skalárním vynásobení s vektorem Uj dostaneme
(w,Uj) = ai (ui,Uj) + • • • + a j {u j,u j) + • • • + an (un,Uj) = aj \\uj\\2 = aj.
□
Příklad 133. Určete souřadnice vektoru
vzhledem k ortonormální bázi v = (vi,v2,v3) z Příkladu 131(c).
119
Řešení. Podle Tvrzení 36 platí pro souřadnice vektoru w vzhledem k bázi v, že
[w]v= I (W,V2)
Ověřte si, že skutečně platí vztah
6 1 3
□
Důsledek 6. Skalární součin dvou libovolných vektorů v,w £ V, kde dim V = n, je roven skalárnímu součinu vektorů jejich souřadnic vzhledem k nějaké ortonormální bázi u prostoru V, tj.
(V,W)V = Hu)Rn.
Důkaz. Je-li
v = a,i Ui+ ■■■ + a,j Uj + ■■■ + an un, tj. [v]u
w = b1u1-\-----h bj Uj H-----Vbnun, tj. [w]u
potom po skalárním vynásobení vektorů v a w dostaneme
ai
Au
(v, w)v = ^2^2aí bj (uh Uj) = ^ a'L bi Sii = ^2aíbí = [v]u ■ [w]u = ([v]u, [w]u)i
i=l j=l 1=1 j=l 1=1
□
Důsledek 7 (Parsevalova rovnost). Norma libovolného vektoru w G V, kde dim V = n, je rovna normě vektoru jeho souřadnic vzhledem k nějaké ortonormální bázi u prostoru V, tj.
IMI = || Mu||2!
přičemž norma || • ||2 na pravé straně je Euklidovská norma v prostoru W1.
Příklad 134. V prostoru Mat2X2 Je (Frobeniova) norma matice
A --
a b c d
rovna
\A\
sj(A, A) = Va2 + b2 + c2 + d2
b
c
\dj
kde E = (En, E12, E2i, E22) je standardní (ortonormální) báze prostoru Mat2x2. Viz také Příklad 131 (b) a Příklad 122(b). ' □
120
Konec 9. přednášky (23.11.2009)
12.5. Ortogonální matice. Čtvercová matice Q řádu n je ortogonální matice, pokud její sloupce tvoří ortonormální množinu vektorů v IRn, tj. pokud platí
QTQ = I, tj. Q'1 = QT.
Ze vztahu QTQ = I plyne, že každá ortogonální matice je regulární a že determinant každé ortogonální matice je buď 1 nebo —1, nebot
1 = \I\ = \QTQ\ = \QT\.\Q\ = \Q\2.
Příklad 135. Nejjednodušším příkladem ortogonální matice je jednotková matice I. Dále uvádím následující.
(a) Matice rotace v IR2 o úhel ip v kladném směru
Q
je ortogonální matice a tedy platí
cos ip — srn íp sin ip cos if
q-i=qt= cosv? sin^ srn ip cos if
(b) Tzv. permutační matice, např.
0 1
1 0
f0 0 0 l\ 0 10 0 10 0 0 \0 0 1 OJ
jsou příklady ortogonálních matic. Permutační matice vzniknou z jednotkové matice I tak, že se přehážou její řádky (nebo sloupce). Tedy každá permutační matice má v každém řádku i sloupci právě jednu jedničku, jinak samé nuly.
íc) Matice
Q
je ortogonální, protože její sloupce tvoří ortonormální bázi prostoru IR3, viz Příklad 131(c).
□
Tvrzení 37. Je-li Q ortogonální matice řádu n, potom platí
(Qx,Qy) = (x,y) pro všechny vektory x,y G IRn, (35) IIQ^Ih = H^lh pro všechny vektory x G IRn. (36)
121
Důkaz. Důkaz je téměř stejný (či odsud plyne) jako důkaz Důsledku 6. Označme sloupce matice Q jako vektory u±,..., un} tj.
Q = (ui ■■■ un) ,
přičemž tyto vektory tvoří ortonormální bázi prostoru IRn (označme tuto bázi jako u). Potom pro každý vektor
x
G IRn platí Qx = (ui ... un) • : I = xľ Ui
\Xri! \Xr.
neboli vektor x je vektor souřadnic vektoru Qx vzhledem k bázi u, tj.
Podobně pro vektor y G IRn je [Qy]u = y, a tedy podle Důsledku 6 s V = IRn je
{Qx,Qy} = {[Qx\u, [Qy]u) = {x,y}.
Druhá část tvrzení plyne z první části volbou y = x. □
Příklad 136. Samozřejmě víme, že při rotaci v IR2 (nebo obecně v IRn) se nemění délka (= norma) vektoru. To je v souladu se vzorcem (36), který ovšem platí pro libovolnou ortogonální matici Q (tedy i pro ortogonální matice odpovídající rotaci). □
Následující tvrzení je jednoduchým důsledkem předchozích úvah, které aplikujeme na metodu nejmenších čtverců.
Věta 17. Nechť je dána matice A typu mxn a vektor b G IRm. Tvoří-li sloupce matice A ortonormální množinu v prostoru W71, potom je vektor x = ATb řešením problému nejmenších čtverců pro systém Ax = b.
Důkaz. Všimněte si, že pokud tvoří sloupce matice A ortonormální množinu v prostoru IRm, potom je nutně počet těchto vektorů nejvýše n, tj. n < m. A protože jsou ortonormální vektory lineárně nezávislé, je hodnost matice A v tomto případě právě n, tj. h(A) = n. Pro matici A pak platí
ATA = I řádu n,
a tedy z Věty 16 o řešení problému nejmenších čtverců dostáváme
x = (ATA)-1ATb = ATb.
Všimněte si, že z Věty 16 dále plyne, že vektor p G Im A, který je nejblíže k vektoru pravých stran b, je
p = A(ATA)-1ATb = AATb.
□
122
Příklad 137. Vyřešte problém nejmenších čtverců Ax = b, kde
/1\
2
-1
A
0 ?
\7Í 01
V2/
Řešení. Máme m = 4 a n = 2. Protože sloupce matice A tvoří ortonormální množinu v prostoru IR4, h(A) = 2, je hledané řešení tvaru
/1\
2
-1
V2/
f = ATb
75 0 0 A 0 75 75 0
Vektor p E Im A, který je nejblíže k vektoru pravých stran b, je potom
/1\
2
-1
v2 y
p = AATb
(ji °\ 0 ?
0 73
7! 0 0 Ti 0 7S 7Í 0
\7S V
2 ľ ľ 2
o H 0
0 I I 0
vi ° ° v
\ (l\ A\ í ? I /3\
2 i 1
-1 " 2 1
1 V2/ w
Přitom vzdálenost vektoru 6 od prostom Im A je pak
i
.2
v (b, Im A) = \\b — p\\2
3
v ľ/
19 9 1
7+7+7+7 4 4 4 4
n/Š.
□
12.6. Projekce vektoru na podprostor. Nechť V je (obecný) vektorový prostor se skalárním součinem a W jeho (vlastní) podprostor. Příklad 137 motivuje problém nalezení vektoru p G W, který je nejblíže k předem danému vektoru v E V (zřejmě má smysl uvažovat pouze situaci, kdy v G- W, protože v opačném případě je p = v G W), viz také Věta 15 pro prostor IRm.
Věta 18. Nechť W je podprostor vektorového prostoru V a nechť je dán vektor v E V. Je-li u = (ui,..., Uk) ortonormální báze podprostoru W, potom má vektor p E W, který je nejblíže k vektoru v, tvar
p = cii • Ui + ■ ■ ■ + afc • Uk, kde a;t = (v, Ui), i = 1,..., k.
Platí tedy, že
123
Důkaz. Protože je V = W © WL, můžeme vektor v napsat jediným způsobem jako součet
v = p + w, kde p E W, w E WL. Protože jsou bázové vektory u,i E W, je u,i _L w, tj. {u,-nw) \/i = 1,..., k.
Na druhou stranu, vektor p E W můžeme vyjádřit jako lineární kombinaci bázových vektorů ui, ...,uk, tj.
p = aiuľ H-----h akuk,
odkud již plyne vztah
(v, Ui) = (p, Ui) + {w, Ui) = aľ (ul7 Ui) H-----V ak (uk, Uí)
=o
= a;t (Ui, Ui) = a;t \U;t ||2 = Oj \/Í = 1, . . . , k.
=1
□
Vektor p E W ve Větě 18 se nazývá projekce vektoru v na podprostor W. Protože je vektor p lineární kombinací bázových (tj. lineárně nezávislých) vektorů, je tento vektor vždy určen jednoznačně.
Poznámka 6. Z důkazu Věty 18 plyne, že pokud by báze podprostoru W nebyla ortonormální, ale „jen" ortogonální (tj. bázové vektory jsou navzájem kolmé, ale nemusejí mít velikost rovnu jedné), potom pro koeficienty ve vyjádření projekce p platí
(v,Uj) _ (v,Uj) {Uí,Uí) \\Ui\\2 '
Tedy projekce p vektoru v na podprostor W je pak tvaru
(v,ui) (v,uk) („7, P = -,-r ■ ui H-----h -,-r • uk. (37)
{u1,u1} {uk,uk}
□
Definice 8. Číslo v(v, W) := \\v — p\\ nazýváme vzdálenost vektoru v od podprostoru W. Odchylka vektoru v od podprostoru W (viz obr.) je definována jako úhel, který svírá vektor v se svou projekcí p na podprostor W, tj. je to úhel ip E [0, |], pro který je
bil
cos ip = |—-.
□
Pokud je vektor v kolmý na podprostor W, tj. pokud v E W , potom je jeho projekce na podprostor W nulový vektor, tj. p = 0. A protože je ||0|| = 0, pro odchylku takového vektoru v od podprostoru W pak platí cosip = 0, tj. >p> = | (samozřejmě!).
124
Příklad 138. V Příkladu 137 jsme viděli, že vektor
je projekce vektoru b
'v
p
i
2
-1
V2 J
na podprostor W = Im A. Tuto projekci můžeme také vypočítat pomocí Věty 18 následovně: Označme sloupce matice A jako u\ a u2, tj.
0 0
u2
1
t
V o y
Potom je ImA = Span (ui, u2) a u := (ui,u2) je ortonormální báze tohoto podprostoru. Podle Věty 18 je pak projekce p vektoru b na Im A tvaru
p = (&,«i) • ui + (b,u2) ■ u2
V2
0 0
1
72
i
V o y
'v
i
Dále jsme viděli, že vzdálenost vektoru b od podprostoru Im A je
v(b,lmA) = \\b — p\\ = VŠ. Odchylka vektoru b od podprostoru Im A je pak úhel Lp, pro který platí
]p\\2 1 V2 71
COS íf
10
□
Příklad 139. Určete projekci funkce e x v prostoru V = C[0,1] na podprostor W = V± lineárních polynomů (pro detailní výpočty viz MB102).
Řešení. Nejprve musíme najít nějakou ortonormální bázi podprostoru V±, např. je to dvojice lineárních polynomů
Ui(x) = 1, u2(x) = \[V2 {^x —
neboť platí
lMilU2
\U2\\L2
(ui,u2)
1
l2dx = VÍ=l.
o
jf 12 - 0 = v7! = 1. jí 1. v7!^ ^ - 0 tfe = 0.
Podle Věty 18 má potom projekce funkce e x na podprostor "Pí tvar
p(rr) = ai Ui(x) + a2 ^O^)) kde ai = (e~x,u1), a2 = (e~x,u2).
125
Jelikož platí
ľ1 e-1 cli = (e x,ui}= / e x.ldx=-.
jf'e-.VÍ2(I-i)dI=^(e-3),
a2 = (e w2)
je hledaná projekce p(x) tvaru
p(x) = di Ui(x) + a2 -u2(x) =-. 1 + ^ (e — 3). VT2 ^rc — -
12(e-3) 17-5e = -^ x +-« -1.244 x + 1.254.
e e
Tedy tato funkce p(x) je nejbližší lineární funkce k funkci e~x ve smyslu normy || • ||^2.
Všimněte si, že vzdálenost (v normě || • 11^2) funkce e~x od podprostoru V±, tj. od své nejbližší lineární funkce, je
Z1 (e~* - 12(6 3) x - ™—**)2dx
o
1
- 70.033 « 0.181.
e 2e2 2
Uvědomte si, že ať zvolíme ortonormální bázi v podprostoru V\ jakkoliv, projekce p[x) funkce e~x na podprostor V\ bude vždy stejná, protože je vždy určena jednoznačně. □
12.7. Gram—Schmidtův ortogonalizační proces. V minulém odstavci (a zejména pak v Příkladu 139) jsme viděli, že pro nalezení projekce daného vektoru v na podprostor W potřebujeme znát ortonormální bázi podprostoru W. V tomto odstavci si ukážeme, jak z libovolné báze podprostoru W zkonstruovat bázi ortogonální (a poté bázi ortonormální). Tento proces se nazývá Gram-Schmidtův ortogonalizační proces.
Pro popis tohoto „ortogonalizačního procesu" není zřejmě potřeba se omezovat na báze a podprostor W, ale můžeme uvažovat libovolnou množinu lineárně nezávislých vektorů v prostoru V.
Nechť jsou tedy dány lineárně nezávislé vektory u±,..., un G V. V první fázi najdeme ortogonální množinu vektorů v±,..., vn takovou, že
Span(wi,.. .,vn) = Span(wi,.. .,un),
tj. ortogonální vektory v1}... ,vn generují stejný podprostor jako původní vektory u1}...,un.
1. krok Položme I v\ := u\ I, tj. první vektor se nemění.
2. krok Najděme projekci pi vektoru u2 na podprostor W := Span^i). Podle Poznámky 6 (kde v := u2) je
Pi = i-r - ví-
Potom vektor
u2 ~ -,-r • vi
(^1,^1)
v2 := u2 - pi
splňuje podmínky v2 _L vľ a Span(w1,w2) = Span (u1} u2), viz obr.
126
3. krok Najděme projekci p2 vektoru u3 na podprostor W := Span (vi,v2). Podle Poznámky 6 (kde v := u3) je
(m3,Wi) (u3,v2)
P2 =--T • Vi + ~-r • v2-
(V2,V2)
Potom vektor
v3 := u3 - p2
(W3,wi) (U3,V2)
u3 ---- • vl ---- • v2
(vuvi)
(v2,v2)
splňuje podmínky v3 _L ví} v3 _L v2 a Span (vi,v2, v3) = Span (ui, u2, u3}} viz obr.
[k + 1). krok Pokud již máme zkonstruovány ortogonální vektory v1}..., vk takové, že
Span {vu ...,vk) = Span {uu ...,uk),
pak najděme projekci pk vektoru uk+i na podprostor W := Span (vi,..., vk). Podle Poznámky 6 (kde v := uk+i) je
{Uk+l, vk)
Vk = —,-r- • v1
(Vk,Vk)
Vk-
Potom je vektor
vk+i := uk+i - Pk
Uk+i--;-— • vi
(uk+1,vk)
(vi^x) (vk,vk) kolmý na všechny předchozí vektory v±,..., Vk a splňuje podmínku
Span^i,.. -,vk+1) = Span(ui,.. -,uk+1).
■ vk
□
Nyní jsme z lineárně nezávislých vektorů ui,..., un zkonstruovali ortogonální vektory vi,..., vn, které generují stejný podprostor. Nakonec, pokud potřebujeme ortonormální množinu vektorů, stačí každý z vektorů v1}... ,vn „znormalizovať', tj. místo vektorů v1}... ,vn vezmene vektory
1 1
wi := Ti—ÍT ' v^ • • •' wn-= fi—n ' Vn-
Příklad 140. Určete ortonormální bázi podprostoru W = Span (u1} u2, u3) C IR4, přičemž
fl\ f-l\
1 4 -2
Ul = 1 , u2 = 4 2
{-v W
Řešení, l.krok. Položíme
v1 := Mi
A\
i
i
VV
2.krok. Určíme projekci p± vektoru u2 na podprostor Span(-Ui), tj.
\U2,Vi)
Pl
(V1,V!)
Vl
fl\
6 1 1
4 ' 1 1
w VI/
127
a poté položíme
v2 := u2 - pi
f-l\ (1)
4 1
4 1
v-v
3.krok. Určíme projekci p2 vektoru w3 na podprostor Span(w1,w2), tj.
(m3,Wi) (u3,v2)
P2 =--T • Vi +--r • v2
a poté položíme
(^2,^2)
A\ /a ^2\
4 1 -10 1 1 1 -1 0
4 ' 1 + 25 ' A= 1 + -1 0
w w i1) W
?J3 := u3 - p2
/4\ /2\ (2\
-2 0 -2
2 0 2
V 0 / v) V"2/
Nakonec vektory v±, v2, v3 znormalizujeme. Protože je
INI = V(vi,vi) = 2, \\v2\\ = V(v2,v2) = 5, hledaná ortonormální báze podprostoru W je
Wi
^2
^2
^3
l2
v3
□
Příklad 141. Určete projekci vektoru
/"A
2
3
W
na podprostor z Příkladu 140, vzdálenost vektoru v od podprostoru a odchylku vektoru v od podprostoru W.
Řešení. Protože jsme v Příkladu 140 již určili ortonormální bázi podprostoru W, je projekce p vektoru v na podprostor W tvaru
(\)
w3 = 4 • 1 + 1- 1 + (-2)- 12 = l
vij \\)
Vzdálenost vektoru -u od podprostoru je pak
2
iy) = \\v - p\\2 =
V4y
VI/
/5 \
V
32
3.
Odchylka vektoru v od podprostoru W je pak úhel ip, pro který platí
129
13. Vlastní hodnoty a vlastní vektory
Je-li A čtvercová matice řádu n, pak uvažujme lineární zobrazení La : W1 —► IRn, které je dáno maticí A (viz např. odstavec 10.9). V tomto lineárním zobrazení nás zajímají „směry", které toto zobrazení „preferuje" (zachovává), tj. zajímá nás, které vektory íiGMnse zobrazí na svůj násobek. Číslo vyjadřující tento násobek pak můžeme chápat jako „přirozenou frekvenci" zobrazení La a příslušný vektor (nebo vektory) jako „přirozené směry" zobrazení La-
13.1. Definice a příklady. V celé této sekci budeme uvažovat pouze čtvercové matice řádu n. Navíc, i když budeme nuceni občas pracovat s komplexními čísly, prvky matice A budou vždy reálné.
Definice 9. Vlastní hodnota (též vlastní číslo) matice A je číslo A G C, pro které existuje (alespoň jeden) nenulový vektor u G Cn s vlastností
A ■ u = X ■ u. (38)
Vektor u se pak nazývá vlastní vektor matice A příslušející vlastní hodnotě A.
Množina všech vlastních vektorů příslušejících téže vlastní hodnotě A (společně s nulovým vektorem) se nazývá vlastní prostor příslušející vlastní hodnotě A a značíme ji Eigen(A) (z angl. „eigen-space"). □
Příklad 142.
(a) Uvažujme matici A a vektory u a, v, kde
Potom platí
•4'«=i i 4)'0)=(:0=M)'(í1=W)'"
A-v=, -? ?W?W.ťi=2./?l=2.,,.
5 A) \5J \10J \5
Jsou tedy Ai = — 1 a A2 = 2 vlastní hodnoty matice A a jejich příslušné vlastní vektory jsou právě vektory u (pro Ai = — 1) a v (pro A2 = 2).
-1 1 \ / 1 \ / 1
A = _ „ , u
(b) Uvažujme matici A a vektory u & v, kde
-1 M u=i
v -10 -3^ ' \-l + 3i) ' V-l - 3í
Potom platí
A-»=(-10 i) ■ (-1+3.) = (:? - *)=<-2+■ (-1V 3.) = <-2+3í> ■ «■ A ■"=("10 -3) ■ (-1 _ 3.) = (:?; 9.;) = <-2 - 3':> ■ (-1 _ 3e)=<-2 - ■ -
Jsou tedy Ai = —2 + 3i a A2 = —2 — 3i vlastní hodnoty matice A a jejich příslušné vlastní vektory jsou právě vektory u (pro Ai = —2 + 3i) a v (pro A2 = —2 — 3i).
□
130
Nulový vektor u = 0 vždy vyhovuje rovnici A ■ u = X • u, a proto je v Definici 9 požadavek na existenci nenulového vlastního vektoru.
Je-li u vlastní vektor matice A příslušející vlastní hodnotě A, potom je také libovolný jeho (nenulový) násobek vlastní vektor příslušející téže vlastní hodnotě, protože
A (au) = a (Au) = a(Xu) = A (au).
Podobně, jsou-li u,v vlastní vektory matice A příslušející vlastní hodnotě A, potom je také jejich součet vlastní vektor příslušející téže vlastní hodnotě, protože
A(u + v) = (Au) + (Av) = (A u) + (A v) = A (u + v).
Vlastní vektory příslušející téže vlastní hodnotě tedy tvoří (společně s nulovým vektorem) podprostor vektorového prostoru IRn. To také zdůvodňuje terminologii „vlastní prostor".
Příklad 143.
(a) Pro matici A v Příkladu 142(a) je
Eigen(—1) = Span (u) = Span Eigen(2) = Span (v) = Span
(b) Pro matici A v Příkladu 142(b) je
Eigen(—2 + 3i) = Span (u) = Span
Eigen(—2 — 3i) = Span (v) = Span
1
-1 + 3« -1 - 3i
□
V Příkladu 142(b) vidíme, že i když má matice A pouze reálné prvky, vlastní hodnoty (a vlastní vektory) mohou být komplexní. Avšak vlastní vektory příslušející reálným vlastním hodnotám jsou vždy reálné.
Tvrzení 38. Je-li A reálná vlastní hodnota matice A, potom jsou všechny příslušné vlastní vektory taktéž reálné.
Důkaz. Protože je A G IR, má matice A — XI taktéž pouze reálné prvky. Tedy má homogenní systém (A — XI) ■ u = 0 reálná řešení, tj. vlastní vektory u jsou reálné. □
Ze vztahu (38) plyne, že vlastní vektory jsou nenulová řešení homogenního systému (A-XI)-u = A-u-X-u = 0, tedy je Eigen(A) = Ker (A — XI). Z Tvrzení 10 v odstavci 8.10 pak plyne, že matice
A — XI musí být singulární.
tj. podle Tvrzení 7 v odstavci 9.2
\A-XI\
au — X <2i2 • • • din 0>21 0,22 — X ... a2n
an\ Q"n2 • • • Q"nn A
0. (39)
131
Matici A—A / dostaneme tedy tak, že v matici A odečteme od každého diagonálního prvku proměnnou A (či číslo A, pokud ho již jako vlastní hodnotu známe).
Příklad 144.
(a) Pro matici A v Příkladu 142(a) je
-3 2\ (\ 0
A-XI
-5 4
0 A
-3 - A 2 -5 4 - A
(-3 - A) (4 - A) - (-10) = A2 - A - 2 = (A + 1) (A - 2).
(b) Pro matici A v Příkladu 142(b) je \A-\I\ =
-1 1 10 -3
-1 - A 1
\° -10 -3-A
-1 - A) (-3 - A) - (-10) = A2 + 4A + 13.
□
V předchozích příkladech je vidět, že výraz \A — \I\ je polynom v proměnné A. Pro matici řádu n má tento polynom stupeň právě n. Výraz
p(A) := \A-\I\
se proto nazývá charakteristický polynom matice A a rovnice
p(X) = \A-XI\ = 0
se nazývá charakteristická rovnice matice A. A protože má každý polynom stupně n právě n kořenů (počítáno včetně násobností), platí tedy následující tvrzení.
Tvrzení 39. Vlastní hodnoty matice A jsou právě kořeny charakteristického polynomu.
Příklad 145. Určete vlastní hodnoty a vlastní vektory matice
'2 3\ 0 2 ■
A
Řešení.
' 2-X 3 0 2- A
a proto je Ai = 2 (násobnosti 2) jediná vlastní hodnota této matice.
\A-\I\
(2-A):
Vlastní prostor pro Ai = 2:
{A- Ai/|0) = (A-2I\0)
0 3 0N
oo oř
Volbou volné proměnné xi = t dostaneme řešení (£, 0) = t ■ (1, 0), tj. vlastní vektor a příslušný vlastní prostor jsou
Eigen(2) = Span 1
Ui
□
132
Definice 10. Algebraická násobnost vlastní hodnoty A je definována jako násobnost čísla A jakožto kořene charakteristického polynomu. Geometrická násobnost vlastní hodnoty A je definována jako dimenze příslušného vlastního prostoru Eigen(A).
Lze ukázat, že geometrická násobnost je vždy nejvýše rovna algebraické násobnosti, protože počet lineárně nezávislých vlastních vektorů příslušejících téže vlastní hodnotě A nemůže převýšit násobnost čísla A jakožto kořene charakteristického polynomu. Např. v Příkladu 145 je geometrická násobnost vlastní hodnoty A = 2 rovna dimEigen(2) = 1, zatímco algebraická násobnost této vlastní hodnoty je 2. (V dalším uvidíme, že tyto dvě násobnosti jsou stejné právě když je matice A tzv. „diagonali-zovatelná".)
Poznámka 7. Má-li vlastní hodnota A (algebraickou) násobnost 1 (tj. jedná se o jednoduchý kořen charakteristického polynomu), potom k ní přísluší (alespoň jeden) vlastní vektor ít / 0. Je tedy geometrická násobnost této vlastní hodnoty alespoň 1. Ale protože, jak jsme výše uvedli, nemůže být geometrická násobnost větší než algebraická násobnost, plyne odsud, že v tomto případě jsou tyto dvě násobnosti stejné (obě jsou rovny 1). □
Postup pro nalezení vlastních hodnot a vlastních vektorů matice A je tedy následující:
1. Najdeme kořeny charakteristického polynomu, tj. vyřešíme charakteristickou rovnici
p(A) = \A-XI\=0.
2. Pro každou vlastní hodnotu A najdeme (bázi prostotu) řešení homogenního systému
[A- XI) -u = 0.
Z definice vlastní hodnoty musí tento systém mít netriviální řešení.
Příklad 146. Určete vlastní hodnoty a vlastní vektory matice
A =
Řešení.
\A-XI\
2-A -3 1 1 -2-A 1 1 -3 2 - A
-A (A - l)2, (Ověřte si to!)
a proto jsou Ai = 0 (násobnosti 1) a A2 = 1 (násobnosti 2) vlastní hodnoty této matice. Vlastní prostor pro Ai = 0:
'2 -3 1
[A- Ai J|0) = (A|0) = I 1 -2 1
1 -3 2
Volbou volné proměnné x3 = t dostaneme řešení (t,t,t) = t ■ (1,1,1), tj. vlastní vektor a příslušný vlastní prostor jsou
T
Eigen(O) = Span ( ( 1
133
-3 1 , (1 -3 1
1 -3 1 0 1 ~ 0 0 0 °
v -3 1 oj V> 0 0
Vlastní prostor pro \2 = 1:
{A- A2/|0) = (A- J|0)
Volbou volných proměnných x3 = t, x2 = s dostaneme řešení (3s — t,s,t) = t ■ (—1, 0,1) + s ■ (3,1, 0). tj. vlastní vektory a příslušný vlastní prostor jsou
Eigen(l) = Span
n v1 y v°y1
□
-1\ (3\
u2 = 0
^ 1 )
Příklad 147.
(a) Jednotková matice I řádu n má pouze jedinou vlastní hodnotu A = 1 násobnosti n, protože její charakteristický polynom je
I/- A/1
1 - A 0 0 1-A ..
0 0
0 0
0 0
0 0
1-A 0 0 1-A
(i - xr.
Příslušný vlastní prostor je řešením homogenního systému
(7 — 1. J | 0) = (0 | 0), tj. Eigen(l)=Mn;
neboli každý (nenulový) vektor je vlastní vektor. (Samozřejmě, protože pro každý vektor u platí I ■ u = 1 • u.)
(b) Nulová matice 0 řádu n má pouze jedinou vlastní hodnotu A = 0 násobnosti n, protože její charakteristický polynom je
10- A/1
-A 0 ..
0 -A ..
0 0 ..
0 0 ..
0 0
0 0
-A 0
0 -A
-l)nAn.
Příslušný vlastní prostor je řešením homogenního systému
(0 — 0 . Z | 0) = (0 | 0), tj. Eigen(0)=Mn,
neboli každý (nenulový) vektor je vlastní vektor. (Samozřejmě, protože pro každý vektor u platí ^_()_^ • u = ■ u.)
matice číslo
□
134
13.2. Struktura charakteristického polynomu. Protože je p(X) := \ A — \I\ polynom stupně n, je tvaru
p(\) =cn\n + cn_i A™"1 + • • • + ci A + c0.
Příklad 148. Pro matice řádu n = 2 je
a b c d
p(X)
tj. c2 = 1, cľ = —(a + d), c0 = ad — bc.
a — A b c d — A
(a — A) (d — A) — bc = A2 — (a + d) A + ad — bc,
Odtud vidíme, že absolutní člen tohoto polynomu, tj. koeficient cq, je
c0=p(0) = \A-0.I\ = \A\.
□
(40)
Dále, koeficient cn u nejvyšší mocniny dostaneme tak, že ve výrazu (39) vynásobíme všechny koeficienty u proměnné A, protože součin diagonálních prvků matice A — A / je zcela určitě jeden ze sčítanců v rozvoji determinantu \A — tj.
Cn = (-1)".
Dále, každý polynom stupně n lze jednoznačně napsat jako součin kořenových činitelů, přičemž jednotlivé kořenové činitele odpovídají kořenům polynomu p(X), tj. vlastním hodnotám matice A. Tzn. Jsou-li Ai,..., An vlastní hodnoty matice A (a každá vlastní hodnota se zde vyskytuje tolikrát, jaká je její algebraická násobnost - tedy celkem je n kořenů pro polynom p(X) stupně n), potom je
p(A) = (-l)n (A - Ai) (A - A2) ... (A - An). (41)
Tedy opětovnou volbou A = 0 dostaneme
p(0) = (-l)n (-Ai) (-A2) ... (-An) = (-1)" (-1)" Xi A2 ... An = Xi A2 ... An. Porovnáním se vzorcem (40) jsme tedy odvodili následující důležitý fakt.
Tvrzení 40. Determinant matice A je roven součinu všech jejích vlastních hodnot. Tedy jsou-li Xi,... ,Xn vlastní hodnoty matice A (a každá vlastní hodnota se zde vyskytuje tolikrát, jaká je její algebraická násobnost), potom je
\A\ = Ai A2 ... An.
Příklad 149.
(a) V Příkladu 142(a) je
3 2 5 4
L4| = AiA2 = (-l).2 = -2 = V Příkladu 142(b) je
\A\ = Ai A2 = (-2 + 3i). (-2 - 3i) = 4 + 9 = 13
-1 1 -10 -3
(b) V Příkladu 146 je
\A\ = AiA2A2 = 0.1.1 = 0
2 -3 1 1 -2 1 1 -3 2
135
(c) V Příkladu 147 je
a™ = r
|0| = A™ = O"
0.
□
Konec 10. přednášky (30.11.2009)
V Příkladu 148 jsme viděli, že pro matici řádu n = 2 je koeficient c\ = — (a + d) = — tr A. Podobné pravidlo lze odvodit i obecně, neboli koeficient cn_i u mocniny An_1 v charakteristickém polynomu má tvar
cn_x = (-l)"-1 tr A = (-l)™-1 (au + a22 + • • • + ann). (42)
Na druhou stranu, tento koeficient můžeme určit ze součinů ve vyjádření (41). Zejména musí koeficient cn_! u mocniny An_1 obsahovat
(—l)n (—Ai) ... ve všech závorkách kromě té první násobíme A (to dává mocninu An_1).
-1)"
-ir
-A2) -A3)
. ve všech závorkách kromě té druhé násobíme A (to dává mocninu An 1] . ve všech závorkách kromě té třetí násobíme A (to dává mocninu An_1).
(—l)n (—An) ... ve všech závorkách kromě té poslední násobíme A (to dává mocninu An 1). Celkově je tedy koeficient u An_1 roven součtu výše uvedených čísel, tj.
cn-i = (-l)n (-Ai) + (-l)n (-A2) + • • • + (-l)n (-An) = (-1)™-1 (Ai + A2 + • • • + An).
Porovnáním s výrazem v rovnici (42) dostáváme následující.
Tvrzení 41. Stopa matice A je rovna součtu všech jejích vlastních hodnot. Tedy jsou-li X±,..., Xn vlastní hodnoty matice A (a každá vlastní hodnota se zde vyskytuje tolikrát, jaká je její algebraická násobnost), potom je
tr A = Ai + A2 + • • • + An.
Příklad 150.
(a) V Příkladu 142(a) je
tr A = Ai + A2 = (-1) + 2 = 1 = tr
-3 2 -5 4/ '
V Příkladu 142(b) je
tr A = Ai + A2 = (-2 + 3i) + (-2 - 3i) = -4 = tr
-1 1 -10 -3
(b) V Příkladu 146 je
I 1
(c) V Příkladu 147 je
tr I = n . Ai = n . 1 = n, tr 0 = n . Ai = n . 0 = 0.
136
□
13.3. Lineární nezávislost vlastních vektorů. Jednou z nej důležitějších vlastností vlastních vektorů je to, že vlastní vektory příslušející různým vlastním hodnotám jsou lineárně nezávislé.
Tvrzení 42. Jsou-li Ai,..., Xk navzájem různé vlastní hodnoty matice A a u1}..., uk jejich příslušné vlastní vektory, potom jsou vektory u1}..., uk lineárně nezávislé.
Důkaz. Lineární nezávislost vektorů u1}...,uk ukážeme indukcí vzhledem k počtu těchto vektorů. Pro k = 1 tvrzení zřejmě platí, protože jeden vlastní vektor uľ tvoří sám o sobě lineárně nezávislou množinu.
Předpokládejme tedy, že tvrzení platí pro libovolnou množinu k — l vlastních vektorů příslušejících různým vlastním hodnotám. Lineární závislost či nezávislost vektorů u±,..., uk určíme z jejich nulové lineární kombinace, tj.
a1u1 + a2u2-\-----\-akuk = 0. (43)
Chceme ukázat, že musí platit aľ = a2 = ■ ■ ■ = ak = 0.
Předně si uvědomme, že pro i = 1,..., k je
(A - Ai I) Ui = Auí - Ai Ui = Xi Ui - \1ui = (A* - Ai) iti;
zejména pro i = 1 je pak (A — Ai /) uľ = 0. Rovnici (43) tedy vynásobíme zleva maticí A — X± I & dostaneme
0 = (A — X1I) (ai ui + a2 u2 + a3 it3 +----h ak uk)
= ai (A - Ai /) ui +a2 (A — X1I)u2 + as(A — X1I)us-\-----h ak (A - X11) uk
"-v-'
=o
= a2 (A2 - Ai) u2 + a3 (A3 — Ai) u3 H-----h ak (Xk - Ai) uk.
Dostali jsme tedy nulovou lineární kombinaci vlastních vektorů u2,... ,uk, kterých je k — 1. Podle indukčního předpokladu je tato množina k — 1 vektorů lineárně nezávislá, a tedy musí platit
a2 (A2 - Ai) = a3 (A3 - Ai) = • • • = ak (Xk - Ai) = 0.
Ale protože jsou vlastní hodnoty Ai,..., A& navzájem různé, tj. X2 ý Ai, A3 ý Ai, • • •, A& 7^ Ai, plyne z předchozího
a2 = a3 = ■ ■ ■ = ak = 0.
Potom ale ze vztahu (43) plyne, že aľ uľ = 0. A protože je uľ 7^ 0, je také koeficient aľ = 0.
Ukázali jsme tedy, že všechny koeficienty v lineární kombinaci (43) musí být nulové, a proto jsou vlastní vektory u1}..., uk lineárně nezávislé. □
Příklad 151. V Příkladu 146 máme
Ai = 0, Eigen(O) = Span ^ ^1
A2 = 1, Eigen(l) = Span ( ( 0 J , íl
137
Vidíme, že vlastní vektor
Ui= II příslušející vlastní hodnotě Ai = 0 (či libovolný nenulový násobek vektoru u{) je lineárně nezávislý s každým z vektorů
-1\ f3\
1 u2 = 0 1 1 ' U3= \
1 x 1 ) 1 1
(či s libovolnou nenulovou lineární kombinací vektorů u2 a m3).
Uvědomte si také, že vektory u2 a u% jsou lineárně nezávislé a tedy celkově,
vlastní vektory u1}u2,u3 jsou lineárně nezávislé.
□
Důležitým důsledkem Tvrzení 42 je situace, kdy jsou všechny vlastní hodnoty matice A navzájem různé.
Důsledek 8. Má-li matice A n navzájem různých vlastních hodnot, potom je množina příslušných vlastních vektorů (on prvcích) lineárně nezávislá a tedy tvoří bázi prostoru W1.
13.4. Další základní vlastnosti. Dále platí následující jednoduché tvrzení.
Tvrzení 43. Je-li A G C vlastní hodnota matice A a u G Cn příslušný vlastní vektor, potom splňují vztah
{Au, u) u1Au (u,u) \\u\
\JT-ÍLL, Lil LI lí LI
A = \__ 'A7 = -. (44)
Důkaz. Vynásobením rovnice Au = Xu zleva vektorem uT dostaneme vztah uT(Au) = XuTu, tj. platí vztah (44). □
Příklad 152. Pro matici A v Příkladu 146 máme
uTAux 0
Ai = 0, u1= 1 , -jfí—TJi = - = 0 = Ai,
IKII2 3
-1 ] 1
u\Au2 2
A2 = 1, u2 = 0 , = - = 1 = A2.
IF2II2 2
□
V Příkladu 147 jsme popsali jednu speciální situaci, kdy hledáme vlastní hodnoty diagonální matice J a 0, tj. pro které je jejich determinant roven součinu prvků na hlavní diagonále. Protože toto pravidlo pro výpočet determinantu platí, jak jsme viděli ve Větě 6 v odstavci 9.2, i pro (horní nebo dolní) trojúhelníkové matice, dostáváme odsud následující.
Tvrzení 44. Je-li A (horní nebo dolní) trojúhelníková matice, potom jsou její vlastní hodnoty rovny prvkům na hlavní diagonále. Zejména toto pravidlo platí pro matice diagonální.
138
Příklad 153. Protože je jednotková matice I diagonální a má na hlavní diagonále samé jedničky, je A = 1 její jediná vlastní hodnota násobnosti n. Protože je nulová matice 0 diagonální a má na hlavní diagonále samé nuly, je A = 0 její jediná vlastní hodnota násobnosti n. □
Z vlastností kořenů polynomu vyplývá, že pokud má matice A pouze reálné prvky, tak potom pokud má komplexní vlastní hodnotu A = a + fli, tak potom je vlastní hodnota i číslo komplexně sdružené A = a—fli, tj. komplexní vlastní hodnoty se vyskytují jako komplexně sdružené páry. Přitom vlastní vektory příslušné komplexně sdruženým vlastním hodnotám jsou také navzájem komplexně sdružené, viz Příklad 142(b).
Pomocí vlastních hodnot lze jednoduše charakterizovat regulární a singulární matice.
Tvrzení 45.
(i) Matice A je singulární <š=> A = 0 je vlastní hodnota matice A.
(ii) Matice A je regulární <š=> všechny vlastní hodnoty matice A jsou různé od nuly.
Důkaz, (i) Je-li matice A singulární, potom (dle Tvrzení 10) má homogenní systém Au = 0 netriviální řešení u. Tedy pro tento vektor u platí Au = 0 . u, neboli u je vlastní vektor příslušející vlastní hodnotě A = 0. Naopak, je-li A = 0 vlastní hodnota matice A, potom pro příslušný vlastní vektor u 0) platí vztah Au = 0 . u = 0, tedy matice A je singulární podle Tvrzení 10.
(ii) Tato část plyne z části (i), protože A = 0 nemůže být vlastní hodnota regulární matice A.
Alternativně, důkaz obou částí plyne z Tvrzení 40 o výpočtu \A\ pomocí vlastních hodnot. □
Příklad 154. Matice
A
'2
-3 ľ -2 1 -3 2.
v Příkladu 146 je singulární, protože A = 0 je její vlastní hodnota. Ověřte si, že \A\ = 0.
□
Tedy regulární matice mají nenulové vlastní hodnoty. Tzn. matice inverzní A 1 má také nenulové vlastní hodnoty, protože je také rgulární. Jaký pak vztah mezi vlastními hodnotami matic A a A^1!
Tvrzení 46. Nechť A je regulární matice. Číslo A G C je vlastní hodnota matice A <š=> číslo j je vlastní hodnota matice A-1.
Důkaz. Toto tvrzení plyne přímo ze vztahu 0=\A-XI\ = \A (I - A A-1)
paW
Xn.\A\.
\XA\
I-A-1
1
A
I-A
-i
J^. \A\ .(-l)n. ^° ^
kde jsme použili větu o determinantu součinu (Věta 6(ii)). Tedy číslo A G C je vlastní hodnota matice A <š=> číslo j je vlastní hodnota matice A-1.
□
139
Příklad 155. Matice
/_ 3 2\
A = I ^ ^ j má vlastní hodnoty Ai = — 1, A2 = 2. viz Příklad 142. Tedy vlastní hodnoty matice
A'1 jsou Ai = -1, A2 = ^.
(Ověřte si to výpočtem této inverzní matice a jejich vlastních hodnot!) □
V odstavci 10.11 (o reprezentaci lineární transformace pomocí matice) jsme se zabývali podobnými maticemi, tj. A ~ B pokud B = T-1 AT pro nějakou regulární matici T.
Tvrzení 47. Podobné matice mají stejný charakteristický polynom.
Důkaz. Je-li B = T-1 AT, potom je charakteristický polynom matice B roven
pB(X) = \B-\I\ = {T^AT-Ml = \T~1 (A — XT IT^1) T| = |T_1| .\A — XI\. \T\ = \A- A/|. {T]'1 \T\ = \A-\I\ =pA(X), tj. charakteristické polynomy matic A a, B jsou totožné. □
Kombinací tohoto výsledku s Tvrzením 40 a Tvrzením 41 dostaneme očekávaný výsledek z konce odstavce 10.11.
Důsledek 9. Podobné matice mají stejné vlastní hodnoty a tedy i stejný determinant a stejnou stopu (součet prvků na hlavní diagonále). Tj. je-li B = T-1 AT, potom
\A\ = \B\, tiA = trB.
Předchozí důsledek říká, že vlastní hodnoty a vlastní vektory (tj. „preferované násobky" a „preferované směry") lineární transformace nezávisejí na volbě báze, v níž tuto lineární transformaci reprezentujeme pomocí matice.
Jelikož je charakteristický polynom založen na výpočtu determinantu a determinant lze spočítat rozvojem podle libovolného řádku nebo sloupce (viz Věta 5), mají matice A a AT stejný charakteristický polynom a tedy i stejné vlastní hodnoty.
Tvrzení 48. Matice A a matice AT mají stejný charakteristický polynom a tedy i stejné vlastní hodnoty.
Příklad 156. Ověřte si přímým výpočtem, že matice
/ 2 1 1
AT = -3 -2 -3 \ 1 1 2
má charakteristický polynom p(X) = —X (A — l)2 a tedy vlastní hodnoty Ai = 0 (násobnosti 1) a A2 = 1 (algebraické násobnosti 2), což se shoduje s charakteristickým polynomem a vlastními hodnotami matice
Í2 -3 ť A = 1 -2 1
viz Příklad 146.
140
13.5. Báze z vlastních vektorů. V Důsledku 8 jsme viděli, že někdy je množné zvolit bázi prostoru IRn z vlastních vektorů matice A.
Uvažujeme lineární transformaci L : IRn —► IRn zadanou maticí A, tj. L(u) = A ■ u (tedy L = La), viz odstavec 10.10. Tam jsme viděli, že maticová reprezentace takové lineární transformace záleží na volbě báze u prostoru IRn. Pokud ale zvolíme bázi u „šikovně", může být maticová reprezentace transformace L velmi jednoduchá.
Tvrzení 49. Má-li matice A n lineárně nezávislých vlastních vektorů uÍ7... ,un a označíme-li jako u := (ui,..., un) příslušnou bázi, potom má lineární zobrazení La v této bázi diagonální maticovou reprezentaci. Navíc, na hlavní diagonále jsou právě vlastní hodnoty příslušné (postupně) vlastním vektorům u\,..., un.
Důkaz. Označme jako Ai,..., An vlastní hodnoty příslušné vlastním vektorům u\,..., un. (Uvědomte si ale, že zde nepředpokládáme, že všechny vlastní hodnoty jsou navzájem různé. To co zde potřebujeme, je pouze fakt, že lineárně nezávislých vlastních vektorů je celkem n.) Podle odstavce 10.10 musíme najít matici D s vlastností, že pro každý vektor w G IRn platí
[La{w)]u = [Aw]u = D ■ [w]u. Napíšeme-li vektor w jako lineární kombinaci bázových vektorů u1}..., un, tj.
w = a,i «! + ••• + an un,
potom je
Aw = A(a,i «! + ••• + an un) = ai Aui + • • • + an Aun = ai XiUi + • • • + an Xnun. A tedy pro souřadnice těchto vektorů platí 'a{
Ma= I ; I , [Aw]^= I ; 1 = 1: ■.. ; I • I ; I = D-Hfi.
/Ai 1 /
\Xn Qin) '"I
) 1 \flrJ
=:D
Hledaná matice D je tedy diagonální a na své diagonále má vlastní hodnoty matice A (v pořadí odpovídajícímu pořadí vektorů u±,..., un v bázi u). □
A
Příklad 157. Uvažujme lineární transformaci L : IR2 —► IR2 z Příkladu 113 v odstavci 10.10. Je to transformace zadaná maticí
'-2 -ť 0 2
Přitom ve standardní bázi e = (ei, e2) prostoru IR2 je právě matice A^ = A reprezentací této lineární transformace. Dále jsme v Příkladu 113 ukázali, že tato transformace má v bázi u = (■u1,-u2), kde
1\ íl
maticovou reprezentaci
B = Bu = ( 5 812 Je snadné nahlédnout, že vlastní hodnoty a vlastní vektory matice A jsou
Ai =-2, Vl=\ij, a Ai=2, v2=(}4.
141
Tedy v bázi v = (vi,v2) rná tato lineární transformace maticovou reprezentaci
—Co a-(o29-
Z Věty 11 v odstavci 10.7 (o matici přechodu) pak plyne, že matice přechodu od báze v k bázi e je
T=([Vl]e_ \v2]ey-
1 1
0 -4
a tedy podle Věty 14 platí multiplikativní vztah
-2 0\
o 2 J ~ i o -i r 1 o 2 r l 0 -4 i '
D = r-..4.r, y. "2 0>\ = A O ^ 11 1
4
Předchozí vztah znamená, že matice A a, D jsou podobné (jak již víme z Důsledku 4 v odstavci 10.11). Píšeme ho obvykle v obráceném pořadí, tj. jako
A = T ■ D-T-1,
a pak vidíme, že je matice A tzv. „diagonalizovatelná". □
13.6. Diagonalizovatelná matice. Je-li A čtvercová matice řádu n, potom nás zajímá,
Kolik lineárně nezávislých vlastních vektorů matice A vlastně má?
Viděli jsme příklady matic, které mají právě n (tj. maximální počet) lineárně nezávislých vlastních vektorů (např. Příklad 146), ale i ty, které mají méně než n lineárně nezávislých vlastních vektorů (např. Příklad 145).
Pokud má matice A plný počet (tj. n) lineárně nezávislých vlastních vektorů, potom lze tuto matici „diagonalizovat". Označme jako Ai,...,An vlastní hodnoty (nemusí být nutně všechny navzájem různé) a jako ui,...,un příslušné lineárně nezávislé vlastní vektory (jako sloupcové vektory!), a položme
P:= \Ul ... un , D := : •.. : VI 1/ \0 ... An
Matice P se nazývá matice vlastních vektorů a matice D se nazývá matice vlastních hodnot.
Poznámka 8. Podobně jako v Příkladu 157 je matice P maticí přechodu od báze u = (ui,..., un) složenou z vlastních vektorů matice A ke standardní bázi e prostoru IRn. Je tedy matice P vždy regulární. Naproti tomu je matice D regulární <š=> 0 není vlastní hodnota matice A, tj. právě když Xi Ý 0 V i = l,...,n.
Potom vynásobením matice P zleva maticí A dostaneme
A ■ P = A ■ I ui ... un \ = I Au\ ... Aun I = I Ai iii • • • An ur,
Ul ... un • : •.. : \=P-D.
142
Všimněte si, že násobení matice P diagonální maticí D zprava přesně odpovídá sloupcovým elementárním úpravám, jak jsme si je popsali v odstavci 8.10, zejména pak v Příkladu 65. Výše uvedný výpočet pak lze přepsat jako
A = PDP-1.
Příklad 158.
(a) V Příkladu 157 je (P := T)
pMo 4)'D-
Ověřte si platnost vtahu A = PDP ľ\
(b) V Příkladu 146 je
A = I 1 -2 1 I , P = (ui u2 u3)
1 i \
v 2 ) Ho
(x, oN \_( -2 0
o A2, 0 2
Ai 0 0
P-1 = I 1 -3 2 I , £> = I 0 A2 0
2
0 0 A2
Ověřte si platnost vtahu A = PDP ľ\
□
Definice 11. Čtvercová matice A řádu n se nazývá diagonalizovatelná, jestliže je podobná diagonální matici, tj. jestliže existuje diagonální matice D a regulární matice P takové, že platí
A = PDP-1, neboli D = P^AP. (45)
Proces nalezení diagonální matice D a regulární matice P se nazývá diagonalizace matice A □
Příklad 159. Matice A z Příkladu 158 jsou diagonalizovatelná. Každá diagonální matice je automaticky diagonalizovatelná (položíme P := I), tj. např. jednotková matice I a nulová matice 0 jsou diagonalizovatelná. □
Dále z Důsledku 8 bezprostředně plyne následující.
Důsledek 10. Každá matice A, která má n navzájem různých vlastních hodnot, je diagonalizovatelná.
V předchozím textu jsme tedy ukázaji, že pokud má matice A plný počet (tj. n) lineárně nezávislých vlastních vektorů, potom je diagonalizovatelná a že proces diagonalizace zahrnuje výpočet vlastních hodnot a vlastních vektorů matice A. Jak nyní ukážeme, platí i obrácené tvrzení, tj. existence plného počtu vlastních vektorů je nutná a postačující podmínka pro diagonalizovatelnost matice A.
Tvrzení 50. Čtvercová matice A řádu n je diagonalizovatelná <š=> matice A má plný počet (tj. n) lineárně nezávislých vlastních vektorů.
143
Důkaz. Vzhledem k předchozímu již stačí ukázat jen obrácený směr, tj. „=>". Předpokládejme proto, že existuje diagonální matice D a regulární matice P takové, že platí vztah (45). Označme diagonální prvky matice D jako d1}..., dn a soupce matice P jako u1}... ,un, tj.
pro každou vlastní hodnotu A^ matice A je její geometrická násobnost rovna násobnosti algebraické.
13.7. Mocniny diagonalizovatelných matic. Vzorec (45), tj.
A = PDP-1
lze dobře využít k výpočtu mocnin diagonalizovatelných matic. Např. pro druhou mocninu matice A platí
A2 = A ■ A = (PDP-1) ■ (PDP-1) = PD(P-1P)DP-1 = PD2p-1, přičemž druhá mocnina diagonální matice je opět diagonální matice, jejíž diagonální prvky jsou druhými mocninami původních prvků, tj.
'Ai ... 0\ /Ai ... 0\ /A2 ... 0
D
2
0 ... XJ \0 ... XJ V 0 ... A
n'
Podobně se ukáže pomocí matematické indukce, že
Ak = PDkp-\ kde Dk = \ : •.. : I. (46)
145
Příklad 162. Určete matici Ak pro matici
A =
viz Příklad 161. Řešení. Z Příkladu 161 máme A = PDP-\ kde P =
4 -2 1
2 0 1
2 -2 3
r-2 3
-i 1
^ 2 -2
\ /2 0
2 °
/ \o 0 3
Vzorec (46) platí i pro záporné mocniny matice A. Zejména jej lze použít pro rychlý výpočet inverzní matice A~ľ k regulární matici A, tj.
• 0\
A'1 = PD^P-1
kde ÍT1
0
A„1 j
(i
Příklad 163. Pro matici
A
4 -2 1
2 0 1
2 -2 3
z Příkladů 161 a 162 je
A'1 = PD^P-1 =
(Ověřte si výpočet inverze a platnost vztahů AA~ľ = I = A~ľA\) □
2 0 0\ /-2 3
1 2 0 • -1 1
0 0 y V2 -2
146
Poznámka 9. Vzorec (46) lze v podstatě zobecnit na „libovolnou funkci matice" A. Přesněji, je-li / : IR —► IR nějaká reálná funkce, potom můžeme definovat matici f (A) G Matnxn jako
7(Ai) ... o
f(A):=P-f(D)-P-\ kde f(D)
0 ... /(An)y
kdykoliv všechny funkce /(Aj) mají smysl.
Např. má-li matice A všechny vlastní hodnoty nezáporné, tj. pokud Aj > 0 V i, potom „druhá odmocnina" z této matice je matice
AAT ... o \
B = VÄ = P ■ VĎ ■ P'1, kde VĽ: =
\ 0
An /
Pro tuto matici B pak zřejmě platí vztah
B = B ■ B = A.
□
13.8. Cayley—Hamiltonova věta. Poslední důležitý vztah, který lze bezprostředně vyvodit z mocniny diagonalizovatelné matice, je tzv. Cayley-Hamiltonova věta, která říká, že každá (tzn. nejen diagonalizovatelná) matice A „je kořenem" svého charakterictického polynomu.
Věta 19. Je-li A čtvercová matice řádu n a
p(A) = (-l)n An + cn_x A™"1 + • • • + Cl A + c0 její charakterictický polynom, potom platí identita
p(A) = (-l)nAn + cn_1An-1 + --- + c1A + c0I = 0.
Důkaz. Pro diagonalizovatelné matice je důkaz je přímým důsledkem aplikace vztahu (46). Nejprve vypočtěme hodnotu charakteristického polynomu na diagonální matici D. Tedy je
p{D) = (-l)n Dn + cn_x Dn-X + • • • + Cl D + c0 /
-i)n I ; ••. ; I +cn-i I ; ••. ; I +--- + C!
^p(Ai) ... 0
^r1
+ C„_l
V o
l-l
A„
n—1
o,
0 ... p(An), protože jsou vlastní čísla matice A kořeny polynomu p(X).
Dále je
p(A) = (-l)n An + cn_x A"'1 + • • • + Cl A + c0 /
= (-l)n PDTIP-1 + cn_i PD^P-1 + • • • + ci PUP"1 + c0 PP"1
p- <; (-i)nDn + Cn_iDn-1 + --- + ciZ) + c0/]. -p-1
P-p(D)-P-L = 0. =o
147
Pro obecné matice (bez předpokladu jejich diagonizovatelnoti) se důkaz provede pomocí Jordánova kanonického tvaru matice A. Toto téma zde ale neprobíráme. □
Příklad 164. Pro matici
A -2 r
A = 2 0 1 V2 "2 3,
z Příkladů 161, 162 a 163 je její charakteristický polynom tvaru
p(A) = -A3 + 7A2-16A + 12,
a tedy platí
= -A3 + 7 A2 - 16 A + 12 J = 0. (Ověřte si to přímým výpočtem!) □
Cayley-Hamiltonova větu lze využít k výpočtu n-té mocniny matice A pomocí mocnin nižšího řádu, neboť podle této věty platí
(_!)" An = - (Cn_! A""1 + • • • + Cl A + C0 J) , tj. A" = (-l)™-1 (Cn_! A""1 + • • • + Cl A + C0 /) .
Příklad 165. Pro matici
/4 -2 ť A = 2 0 1 V2 "2 3, z Příkladů 161, 162, 163 a 164 je
A3 = 7 A2 - 16 A + 12 J.
(Ověřte si to přímým výpočtem!) □
13.9. Iterované procesy, viz přiložený soubor s anglickým textem. Tento text je převzat z [ ].
Konec 11. přednášky (7.12.2009)
První z uvedených iterovaných procesů (stěhování populace mezi městem a předměstím) je speciální případ tzv. Markovova procesu (též Markovova řetězce). V takovém procesu se systém může nacházet v n různých stavech s různou pravděpodobností. V jistém okamžiku je ve stavu s pravděpodobností <2j pro stav i a k přechodu z možného stavu i do stavu j dojde s pravděpodobností tij.
Můžeme tedy Markovův proces zapsat takto: V čase k je systém popsán pravděpodobnostním vektorem
To znamená, že všechny komponenty vektoru jsou reálná nezáporná čísla a jejich součet je roven jedné. Komponenty udávají rozdělení pravděpodobnosti jednotlivých možností stavů systému. Rozdělení pravděpodobností pro čas k + 1 bude dáno vynásobením vektoru x^ pravděpodobnostní (též stochastickou) maticí T = (íjj), tj.
xk+l = T ■ Xfr.
148
Protože předpokládáme, že vektor x zachycuje všechny možné stavy, budou všechny sloupce matice T tvořeny také pravděpodobnostními vektory. Všimněme si, že každý pravděpodobnostní vektor xk je opět zobrazen na vektor se součtem souřadnic jedna, neboť
n , n \ n / n \ n
i=i ^ j=i ' j=i ^ ^—t—y
i-tá komponenta součet prvků v j-tém
vektoru xk+1 sloupci matice T
je roven 1
Protože je součet prvků v každém sloupci matice T vždy roven 1, (tj. součet všech řádků je roven řádkovému vektoru v := (1,..., 1), je
(1\ / součet prvků v 1. řádku matice TT ■.) = [ 1 / \součet prvků v n-tém řádku matice TT,
součet prvků v 1. soupci matice T \ /V
^součet prvků v n-tém sloupci matice T/ \l/
Je tedy A = 1 vlastním číslem matice TT a tudíž i matice T (viz Tvrzení 48) a k ní musí existovat vlastní vektor x0. Abychom mohli podrobněji pochopit chování Markovových procesů, uvedeme si docela snadno pochopitelné obecné tvrzení o maticích, tzv. Perronovu-Frobeniovu větu. Její důkaz však uvádět nebudeme.
Věta 20. Nechť A je reálná čtvercová matice řádu n s kladnými prvky. Pak platí:
(i) Exituje reálné vlastní číslo Xn matice A takové, že pro všechna ostatní vlastní čísla A platí |A| < An.
(ii) Vlastní číslo Xn má algebraickou násobnost jedna.
(iii) Vlastní podprostor příslušející vlastní hodnotě Xn obsahuje vektor se všemi souřadnicemi kladnými.
(iv) Platí odhad
n n
min > au < Xn < max > a^. (47)
Kj 0 je zachována, symetrie se změní na vlastnost
(u,v) = (v,u),
a linearita v první i ve druhé složce zůstane také zachována, zatímco „vytýkání" z druhé složky zahrnuje komplexní sdruženost, tj.
□
Eigen(Aj) _L Eigen(Aj) pro A j ^ \j.
Rn = Eigen(Ai) © • • • © Eigen(Afc)
(48)
Potom pro symetrickou matici A zřejmě platí (Au, v) = (Au)T ■ v = uT ■ AT ■
v = uT ■ A ■ v = uT ■ Av = (u, Av).
(49)
151
Všimněte si, že norma indukovaná tímto skalárním součinem je
\u||2 = \J(u, u) = VuT ■ u = Vut ■
u
a splňuje vlastnosti normy z odstavce 12.1. Zejména je výraz u ■ u reálné číslo. Pro reálné vektory se výše uvedený skalární součin a norma shodují se skalárním součinem a normou z odstavce 11.1 a 12.1.
Tento komplexní skalární součin budeme potřebovat pouze pro důkaz faktu, že vlastní hodnoty symetrické matice A jsou reálné. Z Tvrzení 38 pak plyne, že i všechny vlastní vektory jsou reálné a jsme tedy pak již v předchozí situaci reálného skalárního součinu. □
Důkaz Tvrzení 52. (i) Protože je matice A reálná, její případné komplexní vlastní hodnoty se vyskytují v komplexně sdružených párech A, A, přičemž příslušné vlastní vektory jsou také komplexně sdružené, viz odstavec 13.4. Tedy je-li A G C vlastní hodnota a u G Cn příslušný vlastní vektor, potom je A také vlastní hodnota a u je příslušný vlastní vektor, tj. platí
Au = \u, Au = \ú, IMI2 = (uiu) > 0-
Potom je
A (u, u) = (A u, u) = (Au, u) = (Au)T ■ ú = uTATú = uTAu = uT ■ (\u) = Ä (uT ■ u) = Ä (u, u). >o >o A tedy je A = Ä, neboli A G IR.
(ii) Důkaz této části nebudeme uvádět.
(iii) Je-li Au = Xu a Av = fiv, přičemž vlastní hodnoty A / /1 jsou reálné (podle části (i)) a příslušné vlastní vektory u, v jsou také reálné (podle Tvrzení 38), potom je
A (u, v) = (A u, v) = (Au, v) = (Au)T ■ v = uTATv = uTAv = uT(fi v) = fi [uT ■ v) = fi (u, v).
Tedy platí, že
(A — fi) (u, v) = 0, tj. (u, v) = 0, neboť A — fi 7^ 0. Jsou tedy vlastní vektory u a v ortogonální.
(iv) Pro každou vlastní hodnotu A j najdeme ortogonální bázi příslušného vlastního prostoru pomocí Gram-Schmidtova ortogonalizačního procesu (viz odstavec 12.7). Podle části (ii) má tato báze ki prvků. Všechny tyto bázové vektory znormalizujeme. Potom souhrn všech těchto bázových vektorů pro všechny vlastní hodnoty tvoří ortonormální bázi prostoru IRn, protože součet násobností všech vlastních hodnot je právě n. □
Tedy každá symetrická matice má úplný (a to dokonce ortogonální - čili po normalizaci každého vektoru i ornonormální) systém vlastních vektorů. Tedy podle Tvrzení 50 v odstavci 13.6 platí následující.
Důsledek 12. Každá symetrická matice A je diagonalizovatelná, tj. A = PDP~ľ, přičemž matice P i D jsou reálné a matici P lze vybrat tak, aby byla ortogonální, tj. aby splňovala P~ľ = PT, neboli platí
A = PDPT.
Důkaz. Pokud vybereme systém vlastních vektorů jako ortonormální, tvoří tyto vektory sloupce matice P, která je ortogonální, viz odstavec 12.5. □
152
.4
Příklad 167. Pro matici
/ 0 1 1 -l\ 10-11 1-10 1 -11 1 o /
určete její vlastní hodnoty, vlastní prostory, její diagonalizaci, a ortonormální bázi prostoru IR4 složenou z vlastních vektorů matice A.
V
/
Řešení, (a) Vlastní hodnoty: Matice A je symetrická, a proto musí mít reálné vlastní hodnoty. Pro výpočet determinantu použijeme nejprve úpravy - např. (—l)-krát 4. řádek přičteme k 1. řádku (vytvoříme tak dvě nuly v prvním řádku) a dále 4. řádek přičteme ke 2. a 3. řádku (vytvoříme tak dvě nuly v prvním sloupci), tj.
-A
p(X) = \A-\I\
(A-ťf
1 -A 1 -1 -1 1
-10 0 1 0-10-1 0 0-1-1
-11 1 -A
1 -1 1 - A 0 0 A - 1
-1 1 0 1 - A 0 1 - A
-A 1 0 0 1 - A 1 - A
1 -A -1 1 1 -A
-1) z 1., 2. a 3. řádku)
(A-l)M(-l)
-1 0 -1
0 -1 -1
1 1 -A
0-10 0 0-1 -1 1 1
= (A - l)3 {(-1) (-A - 2) - (-1)} = (A - l)3 (A + 3) Vlastní hodnoty jsou tedy Ai = 1 (násobnosti ki = 3) a A2 = —3 (násobnosti k2 = 1).
(b) Vlastní vektory: Pro Ai = 1
J e
/-l 1 1 -1 0\ (-1 1 1 -1 0\
1-1-11 0 0 0 0 0 0
1-1-11 0 0 0 0 0 0
\-l 1 1 -1 °/ 0 0 0
(A-\1I\0) = (A-I\0)
Volné proměnné jsou tedy tři (x2 — t. X^ — Sj X^ = t), a proto je řešení tohoto homogenního systému
f r + s - t\
\
Je tedy
Eigen(l) = Span
/
A\
i
o
A\ i
o
A\
0
1
v°y
Ui =: u2
+ s ■
Í-A o
o
0
1
v°y
í-i\
o
o
V1/
dim Eigen(l) = 3.
Pro A2 = —3 je
(A- A2/|0) = (A + 3/|0) =
f 3 1 1 -1 0\ (1 -1 -1 -3 0\
1 3 -1 1 0 0 1 0 1 0
1 -1 3 1 0 0 0 1 1 0
V-1 1 1 3 0 0 0 °y
153
Volná proměnná je jedna (x± = t), a proto je řešení tohoto homogenního systému
u
-t = t ■ -1
-t -1
w
Je tedy
Eigen (—3) = Span
1 1
vy
114
dimEigen(—3) = 1.
Všimněte si, že u\ _L U4, u2 _L U4, u% _L U4 (tj. vlastní vektory příslušné různým vlastním hodnotám jsou ortogonální), tj.
Eigen(l) _L Eigen(-3), IR4 = Eigen(l) © Eigen(-3). (c) Diagonalizace matice A: Platí A = PDP~ľ, kde
P
Ux U2 U3 U4
(l 1 -1 1\
1 0 0 -1
0 1 0 -1
0 1
D
0 0 o\ A 0 0 0\
0 Ai 0 0 0 1 0 0
0 0 Ai 0 0 0 1 0
V° 0 0 x2) ^0 0 0 -V
Vypočtěte si matici P 1 a ověřte platnost vztahu A = PDP 1.
(d) Ortogonalizace vlastních vektorů: Stačí ortogonalizovat pouze vektory u1,u2,u3, protože vektor U4 je již na ně kolmý. Podle Gram-Schmidtova ortogonalizačního procesu (viz odstavec. 12.7) položíme
A\
v1 := Mi
1 0
v°;
Potom určíme projekci pi vektoru u2 na podprostor Span(-Ui), tj.
Pi
■ Vi
(l\ (\) 2
1 1
2 ' 0 W 0 W
a poté položíme
v2 := u2 - pi
0 0, jestliže
(Au, u) > 0 pro všechny vektory líGl", n / 0.
• pozitivně semidefinitní, píšeme A > 0, jestliže
(Au,u) > 0 pro všechny vektory u G M.n,
• negativně definitní, píšeme A < 0, jestliže
(Au, u) < 0 pro všechny vektory u G IRn, n^O.
• negativně semidefinitní, píšeme A < 0, jestliže
(Alt, -u) < 0 pro všechny vektory uGl"
155
Příklad 168.
(a) Matice I je pozitivně definitní, matice — I je negativně definitní. Nulová matice 0 je současně pozitivně semidefinitní i negativně semidefinitní.
(b)
il ľ)>o, s=(-2 }2)o, d=(-_\ :}i
□
Nakonec uveďme charakterizaci pozitivně, resp. negativně, (semi)definitních matic pomocí jejich vlastních hodnot či tzv. vedoucích hlavních minorů, resp. pomocí hlavních minorů. Vedoucí hlavní minory čtvercové matice A jsou determinanty podmatic, které vzniknou z matice A vynecháním posledních několika (postupně n — 1, n — 2, až 0) jejích řádků a sloupců (viz obr.). Tedy každá
čtvercová matice A minory mají tvar
011 = čili;
{aij}7j=i řádu n má právě n vedoucích hlavních minorů a tyto vedoucí hlavní
au <2i2 0-21 a22
(In d\2 <2i3 a2\ a22 a23 a31 a32 a33
<"nl
(lir.
\A\.
Oproti tomu hlavní minory matice A jsou determinanty podmatic, které vzniknou z matice A vynecháním stejné skupiny řádků a sloupců (viz obr., tedy nemusíme vynechávat jen skupinu posledních řádků a sloupců, jak tomu je u vedoucích hlavních minorů). Můžeme tedy například vynechat první a třetí řádek a sloupec a takto vytvořit hlavní minor (takovýto hlavní minor ale zřejmě není vedoucí hlavní minor). Takže hlavní minory výše uvedené matice A jsou např. všechny diagonální prvky
all | = On, | a22 | = ČÍ22) • • • j | ann \ = 0>nn;
dále pak různé kombinace determinantů řádu 2 tvaru
au d\2 0>21 0,22
du 013 0-31 a33
«22 ČÍ23 «32 ^33
On— l,n—1 —1,
Q"n,n—1 Onn
dále všechny různé kombinace determinantů řádu 3 tvaru
"Ji
lij
ijj djk , pro k e {1,... ,n}, i < j < k,
Okí Okj Okk
a tak dále, no a nakonec je samozřejmé hlavním minorem samotný determinant matice A. Zřejmě je každý vedoucí hlavní minor současně hlavním minorem, ale obráceně to neplatí.
Tvrzení 53. Nechť A je symetrická matice řádu n.
(i) Matice A je pozitivně definitní
všechny její vlastní hodnoty jsou kladné, tj. \ > 0 \/i, všechny její vedoucí hlavní minory jsou kladné.
(ii) Matice A je pozitivně semidefinitní
všechny její vlastní hodnoty jsou nezáporné, tj. Aj > 0 \/i, všechny její hlavní minory jsou nezáporné.
156
(iii) Matice A je negativně definitní
všechny její vlastní hodnoty jsou záporné, tj. Aj < O \/i, všechny její vedoucí hlavní minory střídají znaménka, počínaje záporným. (iv) Matice A je negativně semidefinitní
všechny její vlastní hodnoty jsou nekladné, tj. A« < O \/i,
všechny její hlavní minory lichého stupně jsou nekladné a všechny její hlavní minory sudého stupně jsou nezáporné.
Důkaz. Protože je matice A symetrická, má podle Tvrzení 52 reálné vlastní hodnoty a příslušný systém vlastních vektorů tvoří ortonormální bázi u = (u±,..., un) prostoru IRn. Vlastní hodnoty matice A uspořádejme je podle velikosti, tj.
Amin := Ai < A2 < • • • < An =: Amax;
přičemž v tomto výčtu jsou všechny vlastní hodnoty matice A tolikrát, jaká je jejich násobnost. Čísla Amin a Amax označují nejmenší a největší vlastní hodnotu.
Pro důkaz části (i) stačí zřejmě ukázat, že A je pozitivně definitní <š=> Amm > 0. Nechť w G IRn, w ý 0, je libovolný vektor. Potom v bázi u vlastních vektorů je
w = ai ui +----V anun,
Aw = A(ai ui +----h an un) = a1Au1 +----h an Aun = ai Ai ui +----h an \nun,
neboli platí
A tedy pro skalární součin (Aw,w) podle Důsledku 6 v odstavci 12.4 platí
n n
(Aw, W) = ([Aw]u, [w]u) = ^ Aí > Amin ^ ^ = Amin || H«||2 ' (50)
Je tedy (Aw,w) > 0, právě když Amui > 0 (pro pozitivní defininitnost matice A). Podobně, (Aw,w) > 0, právě když Amui > 0 (pro pozitivní semidefininitnost matice A).
Důkaz pro negativní (semi)defininitnost matice A se provede stejně, ale místo nejmenší vlastní hodnoty Amui se použije největší vlastní hodnota Amax a místo znamení „>" se ve vztahu (50) použije znamení „<". Potom je (Aw,w) < 0, právě když Amax < 0 (pro negativní defininitnost matice A), a podobně je (Aw,w) < 0, právě když Amax < 0 (pro negativní semidefininitnost matice A).
Tvrzení o vedoucích hlavních minorech (pro pozitivní a negativní definitnost) a o hlavních minorech (pro pozitivní a negativní semidefinitnost) ponecháváme bez důkazu. □
157
Příklad 169. Symetrická matice řádu n = 2 má tvar
Potom je matice A pozitivně definitní, pokud (podle kritéria o vedoucích hlavních minorech, viz Tvrzení 53(i))
a > 0, \A\ = ad — b2 > 0, vedoucí hlavní minory jsou kladné.
zatímco matice A negativně definitní, pokud (podle kritéria o vedoucích hlavních minorech, viz Tvrzení 53(iii))
a < 0, \A\ = ad — b2 > 0 vedoucí hlavní minory střídají znaménka, počínaje záporným.
□
Příklad 170. Symetrická matice řádu n = 2 má tvar
,b ds
Potom je matice A pozitivně semidefinitní, pokud (podle kritéria o hlavních minorech, viz Tvrzení 53(ii))
a > 0, d > 0, \A\ = ad — b2 > 0, všechny hlavní minory jsou nezáporné.
zatímco matice A negativně semidefinitní, pokud (podle kritéria o hlavních minorech, viz Tvrzení 53 (iv))
a < 0, d < 0, všechny hlavní minory stupně 1 (lichý stupeň) jsou nekladné. \A\ = ad — b2 > 0, všechny hlavní minory stupně 2 (sudý stupeň) jsou nezáporné.
□
Příklad 171. Matice
A
( 0 1 1
v-
1 o
-1 1
0
1
-1\
z Příkladu 167 není ani pozitivně (semi)definitní ani negativně (semi)definitní, protože má jednu vlastní hodnotu kladnou (Ai = 1) a jednu vlastní hodnotu zápornou (X2 = —3). □
Konec 12. přednášky (14.12.2009)
Reference
[1] C. H. Edwards, D. E. Penney, Differential Equations & Linear Algebra, Prentice Hall, Upper Saddle River, NJ, 2001.
[2] D. C. Lay, Linear Algebra and Its Applications, 2nd Edition, Addison-Wesley, Reading, MA, 1997. [3] M. Panák, J. Slovák, Drsná matematika, kapitoly 1-4, elektronický text k předmětu FI: MB101, 2007.
Konec dokumentu