20. JORDANOV KANONICKÝ TVAR V tejto kapitole si ukážeme, že i nediagonalizovateľné lineárne operátory či matice možno voľbou vhodnej bázy upraviť na tzv. Jordanov kanonický tvar, ktorý je -aspoň na pohľad - veľmi blízky diagonálnemu. Dôkaz tohto výsledku je však podstatne náročnejší než všetky dôkazy, s ktorými sme sa doteraz v tomto kurze stretli. Preto najprv iba sformulujeme príslušné vety a predvedieme, ako sa úprava na Jordanov kanonický tvar v niektorých jednoduchých prípadoch robí. S takýmito vedomosťami vystačíme vo väčšine prípadov. Jednako pre náročnejšieho čitateľa uvádzame úplný dôkaz, ktorý nám zaberie celé dva paragrafy 20.4 a 20.5. Na jeho základe potom popíšeme ďalšiu metódu úpravy matice na Jordanov kanonický tvar. S niektorými aplikáciami výsledkov o Jordanovom kanonickom tvare sa oboznámime až v dvoch nasledujúcich kapitolách. 20.1. Jordanov kanonický tvar matice Hovoríme, že matica A G KnXn je v Jordanovom kanonickom tvare, skrátene JKT, ak má blokovo diagonálny tvar A = diag( Jni (Ai),..., Jnk(Xk)), kde Jni (\i) sú Jordánové bunky rozmerov rii xrii prislúchajúce skalárom A^ G K (pozri príklad 19.1.3). Zrejme v takom prípade je n\ + . . . + n& = n a A má charakteristický polynóm det(A - xl) = (Ai - x)ni ... (A* - x)nk. Vidíme, že skalár A G K je vlastnou hodnotou matice A práve vtedy, keď sa nachádza v zozname Ai,. . . , A&. Keďže skaláry Ai,. . . , A& nemusia byť nevyhnutne rôzne, algebraická násobnost A vzhľadom na A je súčet veľkostí blokov s hodnotou A na diagonále, čiže ^A-=An*- Ako vyplýva z príkladu 19.1.3, každému bloku Jni(\i)} bez ohľadu na veľkosť n^, zodpovedá len jednorozmerný vlastný podpriestor - preto geometrická násobnost A vzhľadon na A je rovná počtu takýchto blokov, t. j. počtu prvkov množiny {i < k; \i = A}. Jordánovým kanonickým tvarom matice A G KnXn nazývame ľubovoľnú maticu J G LnXn v JKT, kde pole L je nejaké rozšírenie poľa K, podobnú (nad poľom L) s maticou A. Upraviť maticu A na Jordanov kanonický tvar znamená nájsť s ňou podobnú maticu J G LnXn v Jordanovom kanonickom tvare a regulárnu maticu P G LnXn takú, že J = P-1 A-P. Potom lineárny operátor x \—> A-x na (stĺpcovom) vektorovom priestore Ln má v báze tvorenej stĺpcami matice P maticu J v JKT. Kľúčové výsledky tejto kapitoly možno zhrnúť do nasledujúcich dvoch viet. 20.1.1. Veta. JVeci (p: V —> V je lineárny operátor na vektorovom priestore V konečnej dimenzie n nad poľom K. Ak (p má nad K spektrum algebraickej váhy n, tak existuje taká báza ß priestoru V, vzhľadom na ktorú má (p maticu (p)ß v Jordanovom kanonickom tvare. Pritom Jordanov kanonický tvar matice zobrazenia p je určený jednoznačne až na poradie Jordánových blokov. 1 2 PAVOL ZLATOŠ: LINEÁRNA ALGEBRA A GEOMETRIA 20.1.2. Veta. Nech matica A G KnXn má nad poľom K spektrum algebraickej váhy n. Potom A je podobná s maticou J £ KnXn v Jordanovom kanonickom tvare. Pritom matica J je určená jednoznačne až na poradie Jordánových blokov. 20.1.3. Dôsledok. Nech matice A} B G KnXn majú v poli K spektrum algebraickej váhy n. Potom A ss B práve vtedy, keď A a B majú rovnaký Jordanov kanonický tvar. Všimnite si, že predpoklad o plnej algebraickej váhe spektra je splnený práve vtedy, keď K obsahuje rozkladové pole charakteristického polynomu lineárneho operátora
- en-i i->- ... i->- e2 i->- e1 i->- 0,
t. j. Jn ■ e\ = 0 (inak povedané, e\ je vlastný vektor matice «7n(A)), a Jn ■ ei = e{-\ pre 1 < i < n.
Ak má teda lineárny operátor — A^ idy = 5 ako funkcie jeho koeficientov zostavené pomocou operácií sčítania, odčítania, násobenia, delenia a mocnín s racionálnym exponentom.1 Ani pre polynomy stupňa 3 a 4, pre ktoré takéto vzorce existujú, však nie sú pre svoju ťažkopádnosť prakticky upotrebiteľné. Takže použiteľné explicitné vzorce máme k dispozícii len na riešenie rovníc stupňa 1 a 2.
Tým vzrastá význam približných numerických metód výpočtu vlastných čísel a vektorov a JKT. Tieto otázky však už nie sú predmetom nášho kurzu. Momentálne nie je našim cieľom výpočtovo zvládnuť uvedenú problematiku v celej všeobecnosti, ale porozumieť jej základným súvislostiam. Keďže práve výsledky a metódy lineárnej algebry hrajú v modernej numerickej matematike významnú úlohu, je takéto prvotné porozumenie jedným z nevyhnutných predpokladov zvládnutia pokročilejších numerických metód.
Jeden numerický aspekt výpočtu JKT však nemožno v tejto súvislosti nespomenúť. Numerické metódy väčšinou dávajú len približné výsledky s istou vopred zadanou presnosťou. Navyše často pracujú so vstupnými údajmi získanými meraním, teda už od začiatku zaťaženými určitými chybami. Na druhej strane, „takmer všetky" štvorcové matice nad C sú podobné s diagonálnymi.2 Pri hocako malej náhodnej zmene
1 Dôkaz neriešiteľnosti rovníc piateho a vyššieho stupňa pomocou radikálov je súčasťou tzv. Galoisovej teórie a patrí k vrcholným výkonom algebry 19. storočia.
2Presnejšie, topologická dimenzia množiny všetkých matíc A G <[2nXn ; ktoré nie sú podobné s dia-
4
PAVOL ZLATOŠ: LINEÁRNA ALGEBRA A GEOMETRIA
prvkov sa takáto matica s pravdepodobnosťou hraničiacou s istotou stane podobnou diagonálnej. Teda matice s nediagonálnym JKT sú vlastne atypickými výnimkami s nekonečne málo pravdepodobným výskytom. To jednak činí numerický výpočet JKT značne chúlostivou záležitosťou, jednak navodzuje otázku, aký má vôbec význam zaoberať sa nediagonalizovateľnými maticami a lineárnymi operátormi. Dodajme teda, že na druhej strane typická matica A £ V. Pre A; G N, A G Spec(/? označme
Ker^ = Ker((^ - \)k = {veV;( — A) (Ima) = Im a pre všetky A; G N, hodnosť lineárneho operátora ((p — A)r \ IniA : Im a ~~> ImA sa rovná dimenzii podpriestoru IniA- Preto podľa dôsledku 6.2.4 je to injektívny operátor a
KerAnImA = Ker ((p - A)r fImA) = {0}.
Nakoľko súčet dimenzií oboch podpriestorov je n, z toho plynie V = KerA © IniA-
20.4.2. Lema. Nech A ^ /i sú vlastné hodnoty lineárneho operátora (p. Potom
(a) KerA je invariantný podpriestor operátora (p — /í;
(b) lineárny operátor ((p — /i) f KerA : KerA —► KerA je bijektívny;
(c) Ker a C Im,,.
Dôkaz, (a) Nech u G KerA, t. j. ( — //)(«). Potom
(ip-\ý(v) = (íp-X)k(íp-\ + \-n)(u)
= ( V zrejme pozostáva z jedinej vlastnej hodnoty 0; spektrum posunutého operátora Ker^,- sú nilpotentné.
Na dovŕšenie dôkazu viet 20.1.1 a 20.1.2 o JKT tak v podstate stačí dokázať prvú z nich pre nilpotentné lineárne operátory. Ak sú totiž ß\,. . . , ßk Jordánové bázy nilpotentných operátorov (p\1}. . . }(p\k} t. j. operátor V je nilpotentný lineárny operátor rádu r. Potom existujú prirodzené čísla /i,. . . , lr také, že ^„=1 plp = n, a vektory upj G V rádu p také, že všetkých n vektorov - d = . . . = cm = 0.
Hovoríme, že vektory X\,. . . , xm tvoria bázu priestoru V vzhľadom na podpriestor S} ak sú lineárne nezávislé vzhľadom na S a V = S-\-[x\,. . . , xm\. Zrejme X\,. . . , xm G V sú lineárne nezávislé (tvoria bázu V) práve vtedy, keď sú lineárne nezávislé (tvoria bázu V) vzhľadom na podpriestor {0}.
Jednoduchý dôkaz nasledujúcej lemy prenechávame ako cvičenie čitateľovi (porovnajte s dôkazmi viet 5.4.1 o dimenzii súčtu a prieniku podpriestorov a 6.2.3 o dimenzii jadra a obrazu).
20.5.2. Lema. Nech S C V je lineárny podpriestor G V. Potom nasledujúce podmienky sú ekvivalentné:
(i) vektory X\,. . . , xm sú Hneme nezávislé vzhľadom na S; (n) pre ľubovoľnú bázu V\,. . . , Vk podpriestoru S vektory V\,. . . , Vk, X\,. . . , xm sú
lineárne nezávislé; (iii) existuje báza í?i, . . . , v k podpriestoru S taká, že vektory v\,. . . , Vk} a?i,. . . , xm sú lineárne nezávislé.
Na základe lemy 20.5.2 už ľahko odvodíme nasledujúce zovšeobecnenie vety AAA.
20.5.3. Lema. JVeci S C. V je lineárny podpriestor a vektory a?i,. . . ,xm G V sú lineárne nezávislé vzhľadom na podpriestor S. Potom existujú y\,. . . , y\ G V také, že l = dim V — dim S — m a vektory X\,. . . , xm, y\,. . . , y\ tvoria bázu priestoru V vzhľadom na S.
Dôkaz. Stačí zvoliť ľubovoľnú bázu V\,. . . ,v^ podpriestoru S a lineárne nezávislý systém V\,. . . , Vk, a?i, • • • , xm doplniť vektormi y\,. . . ,y\ na bázu V.
20.5.4. Lema. JVeci S C T C V sú lineárne podpriestory také, že (Jc_1(S') C T. Potom pre lubovolne vektory X\,. . . , xrn G V lineárne nezávislé vzhľadom na T vektory (fi(xi),. . . , (fi(xm) sú lineárne nezávislé nad S.
Dôkaz. Nech platí c\(p(x\) + • • • + cm(p(xm) = íp(c\Xi + . . . + cmxm) G S. Potom c\X\ + . . . cmxm G tp~1(S) C T & z nezávislosti vektorov X\,. . . ,xm nad T vyplýva c\ = . . . = cm = 0, teda Lp(x\),. . . , (p(xm) sú nezávislé nad S.
Dôkaz tvrdenia 20.5.1. Operátor p > 1. Predpokladajme, že sme už zostrojili všetky stĺpce schémy s číslami r, r —1,. . . ,p + 1 a vektory každého stĺpca q} kde r > q > p + 1, tvoria bázu priestoru Sq vzhľadom na jeho podpriestor Sq-\. Označme a?i,. . . }xm vektory stĺpca p + 1. Keďže x\,. . . ,xm sú nezávislé nad Sp = (p~1(Sp-i), podľa lemy 20.5.4 sú vektory (f(xi)}. . . , (fi(xm) G Sp nezávislé nad Sp-\. Podľa (dôkazu) lemy 20.5.3 ich možno vhodnými vektormi up\,. ..}upi £ Sp doplniť do bázy podpriestoru Sp vzhľadom na
podpriestor Sp-\. Stĺpec p je potom tvorený vektormi tp(x\),..., (fi(xm)} upi}. . . , up\ .
Na dokončenie dôkazu treba ešte overiť, že systém takto zostrojených vektorov vpi = íPP~t(upj)i 1 — P — r' ^ — J — lpi ^ — * — -P' naozaJ tvorí bázu priestoru V.
Z konštrukcie vyplýva, že vektory v stĺpci 1 sú lineárne nezávislé. Nech teda 1 < P < f je najväčšie číslo také, že vektory v stĺpcoch 1,... ,p sú lineárne nezávislé. Stačí ukázať rovnosť p = r. V opačnom prípade by vektory v stĺpcoch 1,. . . , p, p+1 boli lineárne závislé. To by však znamenalo, že vektory v stĺpci p + 1 sú lineárne závislé vzhľadom na podpriestor Sp (podrobne si rozmyslite prečo). Ale to odporuje podmienkam našej konštrukcie. Teda všetky vektory „veľkej schémy" sú lineárne nezávislé.
Konečne ukážeme, že zostrojené vektory generujú celé V. Na to stačí overiť, že ich počet, ktorý je zrejme ^„=1P^>, sa naozaj rovná n = dim V. Pri konštrukcii p-teho
stĺpca sme k (,c-obrazom vektorov predošlého stĺpca vždy pridávali
r
lp = dim Sp — dim Sp-i — 2_, h
i=p+l
vektorov. Sčítaním uvedených rovností pre 1 < p < r dostaneme
r r r r
^2 lp = ^2(dim Sp - dim Sp-!)-^2 ^2 ^
p=l p=l p=l i=p-{-l
r i — l r
= dim Sr — dim Sq — / / h = n — > (i —ľ) U,
i=l p=l i=l
teda YJp=iPh = n-
Dokončenie dôkazu viet 20.1.1 a 20.1.2 si už vyžaduje len ukázať jednoznačnosť Jor-danovho kanonického tvaru.
Predovšetkým spektrum {Ai,. . . , A&} lineárneho operátora
stĺpcov matice Cr podľa vety 4.4.4 tak, aby dopĺňali bázu podpriestoru 1Z\A
t. j. stĺpce matice Cr_i, do bázy podpriestoru IZ(A^).
(4) Keď už máme zostrojené stĺpce r, ...,p + 1, kde r > p > 1, pričom stĺpec p-\-1 je tvorený vektormi Xi,. . . , xm} tak p-ty stĺpec bude pozostávať z vektorov A\ ■ xi,. . . , A\ ■ xm, Upi,. ..}upip} pričom vektory upi,. . . }uplp získame tak, že bázu Cp-i podpriestoru 1Z{APX J rozšírenú o vektory A\ ■ Xi,. . . , A\ ■ xm (ktoré, podľa lemy 20.5.4 tvoria spolu lineárne nezávislý systém) doplníme do bázy podpriestoru IZ(A^) vhodnými stĺpcami matice Cp podľa vety AAA.
(5) Vlastnej hodnote A potom zodpovedá Jordánova báza zložená z takto zostrojených reťazcov a matica v JKT
diag(Jr(A),...,Jr(A),......,J1(A),...,J1(A))
s lp blokmi Jp(X).
(6) Nakoniec zoradíme vektory Jordánových báz pre jednotlivé vlastné hodnoty pekne za sebou a príslušné JKT blokovo diagonálne. Tým získame výslednú Jordánovu bázu (maticu prechodu) a JKT pôvodnej matice A.
Poznámka. 1. S trochou skúsenosti a šikovnosti možno obe metódy úpravy na JKT výhodne kombinovať a budovať reťazce Jordánových báz zároveň zľava i sprava.
2. Nad nekonečným poľom K (najmä v typických prípadoch polí R a C) možno nové vektory upi,. . . }upi v bodoch (3), (4) voliť v podstate náhodne. Treba si len vopred zistiť ich počet, t.j. lr = h(Br-i) — h(Br) a lp = h(Bp-i) — h(Bp) — m pre r > p > 1. Za predpokladu lp > 0 je totiž nekonečne málo pravdepodobné, že pri skutočne náhodnej volte lp vektorov z podpriestoru TZ\A^j budú vektory
20
PAVOL ZLATOŠ: LINEÁRNA ALGEBRA A GEOMETRIA
lineárne závislé vzhladom na podpriestor 7Z(APX ).
Problémom však môže byť zvoliť vektory upj „naozaj náhodne". Často práve v snahe o to - spolu s mimovolhou tendenciou voliť „čo najjednoduchšie" či „čo najkrajšie" vektory - môžeme nakoniec dostať vektory závislé nad 1Z\APX ). Podobne, ako je niekedy ťažké nakresliť „naozaj všeobecný" trojuholník.
20.6.1. Príklad. Matica
/-5 3 1
-3 0 1
-4 4 1
-1 1 0
V-6 3 1
-1 6\
-5 3
4 4
2 1
-1 7/
>5 X5
má charakteristický polynóm
det(A - xl) = 1 - 5x + 10x2
10x3 +5x4
(1-xf
a jediné vlastné číslo xis = 1 s algebraickou násobnosťou 5.
Postupne vypočítame mocniny matice A — /, ich redukované stupňovité tvary a bázy podpriestorov riešení sústav (A — I)p ■ x = 0:
A-I
f-6 -3 3 -1 1 1 -1 6\ -5 3 /l 0 0 0 1 0 0 1 0
-4 4 0 4 4 r^j 0 0 1 -4 0
-1 V-6 1 3 0 1 1 1 -1 6/ 0 0 0 Vo 0 0 0 0 0 0 /
fundamentálny systém riešení tvoria dva lineárne nezávislé vlastné vektory, ktoré zapíšeme ako stĺpce matice
/0 lx
Druhá mocnina je
(A-If
/-12 0
4 0
-16 0
-4 0
V—12 0
Ci
4 1 3
-1 0
4 0
1 0
V 0 1/
-12 12 \
4 -4
-16 16
-4 4
-12 12/
í1 ° 0 0
0 o
o o
Vo o
-1/4 1
o o
o o
o o
o o
0
o o o /
s fundamentálnym systémom riešení tvoreným stĺpcami matice
Co
í° 1 1 0 -1 0 0
0 4 0 0
0 Vo 0 0 1 0 0 1/
20. JORDANOV KANONICKÝ TVAR
21
Konečne (A — i")3 = 0 (takže B% = 0, C3 = J5), a ďalšie mocniny nemusíme počítat.
Keďže máme dva lineárne nezávislé vlastné vektory, Jordánova báza bude mať dva reťazce. Dlhší z nich bude mať dlžku 3, teda ten kratší musí mať nutne dlžku 5 — 3 = 2.
Počiatočný vektor dlhšieho reťazca zvolíme tak, aby dopĺňal stĺpce matice C2 na bázu priestoru IR5 = 1Z\(A — I)3)', vyhovuje napr. 1*3 = (1,0,0,0,0) . Druhý a tretí vektor reťazca potom sú 1*2 = (A — i") • 1*3 = (—6, —3, —4, —1, —6)
T
1*1
(A-I)-u2 = (A- If ■ u3 = (-12,4, -16,
-12)
T
Počiatočný vektor kratšieho reťazca vyberieme spomedzi stĺpcov matice C2 tak, aby dopĺňal stĺpce matice (Ci,«2) na bázu priestoru 1Z\(A — I)2). Vyhovuje druhý stĺpec V2 = (1, 0, 4, 0, 0) . Druhý vektor kratšieho reťazca potom je v\ = (A — I)-V2 = (-2,l,-4,-l,-2f.
Lineárne nezávislé vektory Ui,V\ tvoria bázu vlastného podpriestoru 1Z{A — J), takže ďalej už nemusíme nič dopĺňať.
Jordanov tvar matice A teda je
diag(J3(l),J2(l))
/l 1 0 0 0\
0 110 0
0 0 10 0
0 0 0 11
Vo o o o 1/
a stĺpce matice prechodu P tvoria vektory Jordanovej bázy ß = («1,1*2,1*3,^1,^2)5 t.j.
/-12 -6 1 -2 1\
4 -3 0 1 0
-16 -4 0 -4 4
-4 -1 0 -1 0
V-12 -6 0 -2 0/