19. SPEKTRUM LINEÁRNEHO OPERÁTORA V tejto kapitole budeme pokračovať v štúdiu štruktúry lineárnych operátorov na konečnorozmerných vektorových priestoroch. Zavedieme dôležitý, ešte v predchádzajúcej kapitole avizovaný pojem spektra lineárneho operátora, ako i pojmy algebraickej a geometrickej násobnosti vlastnej hodnoty, ktoré nám umožnia klasifikovať prípadné prekážky jeho diagonalizovateľnosti. Ďalej si ujasníme, aký vplyv má riešiteľnosť polynomických rovníc v základnom poli na spektrum lineárneho operátora. Vhodným rozšírením tohto poľa možno dosiahnuť, aby každý lineárny operátor na n-rozmernom priestore mal n vlastných hodnôt, ak každú z nich počítame toľkokrát, aká je jej algebraická násobnosť. 19.1. Spektrum lineárneho operátora a matice Aby sme sa mohli pohnúť ďalej, je potrebné si pripomenúť pár základných poznatkov o polynómoch. Aspoň v prípade polí Q a R, a možno aj C, by malo ísť o záležitosti známe zo stredoškolskej matematiky; prechod k ľubovoľnému poľu však nepredstavuje žiadnu ťažkosť. Hovoríme, že polynóm f(x) K[x] delí polynóm g(x) K[x], ak existuje polynóm p(x) K[x] taký, že g(x) = f(x) p(x). Zrejme, ak f(x) delí g(x), tak stupeň f(x) je menší alebo rovný stupňu g(x). Nech f(x) K[x] je polynóm stupňa n 1. Skalár K je koreňom polynómu f(x) (t. j. f() = 0) práve vtedy, keď polynóm x - delí polynóm f(x). Hovoríme, že skalár K je m-násobný koreň polynómu f(x) K[x], ak (x - )m je najvyššia mocnina polynómu x - , ktorá ešte delí f(x). Miesto 1-násobný hovoríme jednoduchý koreň. Z úvahy o stupňoch vyplýva, že polynóm f(x) stupňa n 1 má nanajvýš n koreňov, ak každý z nich počítame aj s jeho násobnosťou. Presnejšie, ak 1, . . . , k sú všetky navzájom rôzne korene polynómu f(x) stupňa n a m1, . . . , mk sú ich násobnosti, tak m1 + . . . + mk n. Ďalej budene striedavo hovoriť raz o maticiach a inokedy o lineárnych operátoroch, podľa toho, čo bude pre nás v danej chvíli výhodnejšie. Na čitateľa nechávame, aby si podľa potreby sám urobil preklad z maticovej reči do operátorovej alebo naopak. Skalár K sa nazýva m-násobná vlastná hodnota matice A Kn×n , ak je m-násobným koreňom jej charakteristického polynómu chA(x); hovoríme tiež, že algebraická násobnosť vlastnej hodnoty matice A je m. Miesto 1-násobná hovoríme jednoduchá vlastná hodnota. Podobne definujeme aj pojem m-násobnej vlastnej hodnoty a algebraickej násobnosti vlastnej hodnoty pre lineárne operátory na konečnorozmerných priestoroch. Z našich úvah o koreňoch polynómov vyplýva, že ak matica A Kn×n má k navzájom rôznych vlastných hodnôt 1, . . . , k K s algebraickými násobnosťami 1 2 PAVOL ZLATOŠ: LINEÁRNA ALGEBRA A GEOMETRIA m1, . . . , mk, tak m1 + . . . + mk n. Inak povedané, matica rádu n má nanajvýš n vlastných hodnôt, ak každú z nich počítame s jej násobnosťou. Spektrom lineárneho operátora na konečnorozmernom vektorovom priestore nazývame množinu všetkých jeho vlastných hodnôt a označujeme ju Spec . Podotýkame, že takto definujeme spektrum len v konečnorozmernom prípade; definícia spektra lineárneho operátora na nekonečnorozmernom vektorovom priestore je podstane zložitejšia záležitosť, ktorá presahuje rámec lineárnej algebry. Rovnako definujeme aj spektrum matice A Kn×n , ktoré značíme Spec A. Algebraickou váhou spektra Spec nazývame súčet algebraických násobností všetkých vlastných hodnôt Spec . Hovoríme, že lineárny operátor má jednoduché spektrum, ak sa jeho algebraická váha rovná počtu jeho prvkov, t. j. práve vtedy, keď všetky vlastné hodnoty operátora sú jednoduché. Popri algebraickej násobnosti zavedieme aj tzv. geometrickú násobnosť. Spomeňme si, že množina všetkých lineárnych operátorov na vektorovom priestore V sama tvorí vektorový priestor L(V, V ) nad poľom K, ktorého prvkom je aj identický operátor idV : V V (pozri paragraf 6.5). Preto pre L(V, V ) a K aj zobrazenie - idV , dané predpisom x (x) - x, je lineárny operátor na V ; stručne ho budeme značiť - . Zrejme 0 = v V je vlastný vektor operátora prislúchajúci k jeho vlastnej hodnote práve vtedy, keď v Ker( - ). Lineárny podpriestor Ker( - ) V nazývame vlastný podpriestor lineárneho operátora : V V prislúchajúci k jeho vlastnej hodnote K. Zrejme pre všetky v Ker( - ) platí (v) = v, teda Ker( - ) je invariantný podpriestor operátora . Geometrickou násobnosťou vlastnej hodnoty lineárneho operátora nazývame dimenziu dim Ker( - ) jeho vlastného podpriestoru prislúchajúceho k . Geometrická násobnosť vlastnej hodnoty matice A Kn×n sa zrejme rovná číslu dim R(A-I). Pripomíname, že R(A-I) označuje podpriestor riešení homogénnej sústavy s maticou A - I, takže platí 1 dim R(A - I) = n - h(A - I) n (pozri paragraf 9.1). Geometrickou váhou spektra lineárneho operátora na konečnorozmernom vektorovom priestore nazývame súčet geometrických násobností všetkých jeho vlastných hodnôt. Pojmy ako vlastný podpriestor, algebraická či geometrická násobnosť (ak za ňu pripustíme aj nulu) možno formálne rovnako zaviesť pre lineárny operátor a ľubovoľný skalár K, nielen pre jeho vlastné hodnoty. No K je vlastná hodnota práve vtedy, keď Ker(-) = {0}, čo je ekvivalentné s nenulovosťou tak geometrickej ako aj algebraickej násobnosti vzhľadom na . Tak napr. " nevlastné hodnoty" lineárneho operátora neprispievavjú k algebraickej ani geometrickej váhe jeho spektra. Pokúsme sa teraz nejako usúvzťažniť množstvo nových pojmov, ktoré sme práve definovali. Začneme jedným pomocným tvrdením. 19.1.1. Lema. Nech je lineárny operátor na konečnorozmernom vektorovom priestore V a S V je jeho invariantný podpriestor. Označme 1 = S zúženie lineárneho operátora na podpriestor S. Potom charakteristický polynóm ch1 (x) 19. SPEKTRUM LINEÁRNEHO OPERÁTORA 3 delí charakteristický polynóm ch(x). Ak navyše T V je invariantný podpriestor taký, že V = S T, a 2 = T, tak ch(x) = ch1 (x) ch2 (x). Dôkaz. Nech (u1, . . . , uk, uk+1, . . . , un) je báza priestoru V , pričom jej prvých k členov tvorí bázu podpriestoru S. Ako sme si ujasnili v paragrafe 18.2, vzhľadom na takúto bázu má maticu v blokovom tvare A = () = A1 M 0n-k,k A2 , kde A1 Kk×k je matica operátora 1 : S S v báze (u1, . . . , uk) a M Kk×(n-k) , A2 K(n-k)×(n-k) . Pomocou tvrdenia 10.2.2 dostávame ch(x) = chA(x) = |A - xIn| = A1 - xIk M 0n-k,k A2 - xIn-k = |A1 - xIk| |A2 - xIn-k| = chA1 (x) chA2 (x) = ch1 (x) chA2 (x). Druhá časť lemy je už triviálnym dôsledkom našich úvah. 19.1.2. Tvrdenie. Nech je vlastná hodnota lineárneho operátora na konečnorozmernom vektorovom priestore V . Potom jej geometrická násobnosť je menšia alebo rovná jej algebraickej násobnosti. Dôkaz. Nech S = Ker( - ) je vlastný podpriestor operátora prislúchajúci k a 1 = S. Potom k = dim S je geometrická násobnosť vzhľadom na ; algebraickú násobnosť vzhľadom na označíme m. Nech = (v1, . . . , vk) je ľubovoľná báza S. Keďže každé vi je vlastný vektor operátora prislúchajúci k , zrejme (1) = Ik. Preto ch1 (x) = ( - x)k . Podľa predchádzajúcej lemy tento polynóm delí ch(x). Nakoľko (x - )m je najvyššia mocnina x - , ktorá delí ch(x), platí k m. Ak algebraická násobnosť skalára vzhľadom na operátor je 1, t. j. ak je vlastná hodnota, tak aj geometrická násobnosť vzhľadom na je aspoň 1 (teda nie je 0). Ako ukazuje nasledujúci veľmi dôležitý príklad, až na toto minimálne obmedzenie môže byť rozdiel medzi algebraickou a geometrickou násobnosťou vlastnej hodnoty lineárneho operátora ľubovoľne veľký. 19.1.3. Príklad. Označme Jn Kn×n štvorcovú maticu rádu n, ktorej prvky na miestach (i, i + 1) sú rovné 1 pre 1 i n - 1 a všetky ostatné prvky sú rovné 0. Zrejme h(Jn) = n - 1. Ďalej položme Jn() = In + Jn = 1 0 . . . 0 0 1 . . . 0 ... ... ... ... ... 0 0 . . . 1 0 0 . . . 0 , 4 PAVOL ZLATOŠ: LINEÁRNA ALGEBRA A GEOMETRIA pre K. Teda Jn() je tvorená diagonálou z n lámbd, vedľajšou diagonálou vpravo od nej z n - 1 jednotiek a zvyšok sú nuly. Tak napríklad J1() = (), J2() = 1 0 , J3() = 1 0 0 1 0 0 , atď. Každá matica tvaru Jn() sa nazýva Jordanova bunka, prípadne Jordanov blok rádu n prislúchajúci skaláru . Zrejme aj Jn = Jn(0) je Jordanova bunka. Charakteristický polynóm Jordanovej bunky Jn() je det(Jn() - xIn) = det Jn( - x) = ( - x)n . Táto matica má jedinú vlastnú hodnotu x = s algebraickou násobnosťou n. Na druhej strane, podpriestor riešení homogénnej sústavy s maticou Jn()-In = Jn je jednorozmerný, generovaný vlastným vektorom e1 = (1, 0, . . . , 0)T . Teda geometrická násobnosť vlastnej hodnoty matice Jn() je stále len 1, bez ohľadu na to, aké veľké je n. Preto Jn() pre n 2 nie je podobná so žiadnou diagonálnou maticou. Ako sme už spomínali, podobné matice sú maticami toho istého lineárneho operátora. Tvrdenie 18.2.1 tak možno zosilniť do nasledujúcej podoby. 19.1.4. Tvrdenie. Podobné matice majú rovnaké spektrum, vrátane algebraickej i geometrickej násobnosti každej vlastnej hodnoty. Pomocou pojmov spektra a algebraickej a geometrickej násobnosti teraz môžeme podstatne spresniť charakterizáciu diagonalizovateľných operátorov z vety 18.2.2. 19.1.5. Veta. Nech je lineárny operátor na konečnorozmernom vektorovom priestore V dimenzie n. Potom nasledujúce podmienky sú ekvivalentné: (i) je diagonalizovateľný; (ii) geometrická váha spektra Spec sa rovná n; (iii) algebraická váha spektra Spec sa rovná n a algebraická násobnosť každej vlastnej hodnoty sa rovná jej geometrickej násobnosti; (iv) algebraická i geometrická váha spektra Spec sa rovná n. Dôkaz. Z vety 18.2.2 vyplývajú implikácie (iv) (i) (ii); (ii) (iii) (iv) sú zasa dôsledkom tvrdenia 19.1.2. Práve vyslovená veta nám umožňuje rozdeliť prekážky, ktoré bránia diagonalizácii nejakého lineárneho operátora na n-rozmernom vektorovom priestore V , do dvoch kategórií: (1) algebraická váha spektra Spec je menšia než n = dim V , inak povedané, má " málo" vlastných hodnôt v poli K, i keď každú z nich počítame aj s jej algebraickou násobnosťou; (2) geometrická váha spektra Spec je menšia než jeho algebraická váha, čiže geometrická násobnosť niektorých vlastných hodnôt nedosahuje ich algebraickú ná- sobnosť. 19. SPEKTRUM LINEÁRNEHO OPERÁTORA 5 Uvedené dva typy prekážok sa môžu u lineárnych operátorov vyskytovať každá zvlášť i obe súčasne. V druhej polovici tejto kapitoly si ukážeme, ako možno prekážky prvého typu prekonať prechodom do " bohatšieho" poľa (niečo také sme už naznačili v príklade 18.4.2). Prekážky druhého typu majú zásadnejší charakter a definitívne vylučujú diagonalizáciu. Ako však uvidíme v nasledujúcej kapitole, i v tomto prípade sa možno do značnej miery priblížiť diagonálnemu tvaru pomocou blokovo diagonálnych matíc zložených z Jordanových buniek. 19.2. Schurova veta o triangularizácii Zatiaľ aspoň dokážeme, že v maticiach s " dostatočne mnoho" vlastnými hodnotami možno vynulovať všetky prvky pod diagonálou. Z toho priamo vyplýva, že každý lineárny operátor s plnou algebraickou váhou spektra má vo vhodnej báze hornú trojuholníkovú maticu (pozri koniec paragrafu 10.2), ktorej diagonálu tvorí spektrum operátora, vrátane algebraickej násobnosti každej vlastnej hodnoty. 19.2.1. Veta. (Schurova veta o triangularizácii) Nech matica A Kn×n má spektrum algebraickej váhy n. Potom A je podobná s hornou trojuholníkovou maticou C = P -1 A P , ktorej diagonálu tvoria všetky vlastné hodnoty matice A, pričom každá sa tu vyskytuje toľkokrát, aká je jej algebraická násobnosť. Navyše možno zabezpečiť, aby matica prechodu P bola v prípade poľa K = R ortogonálna a v prípade poľa K = C unitárna. Dôkaz. Najprv sa sústredíme iba na prvú časť vety. Dokážeme len existenciu hornej trojuholníkovej matice C A. Zvyšok vety je už nevyhnutným dôsledkom jej trojuholníkového tvaru. Budeme postupovať indukciou podľa n. Pre n = 1 má už samotná matica A = (a) žiadaný tvar. Nech teda n 2 a predpokladajme, že každá matica z K(n-1)×(n-1) s plnou algebraickou váhou spektra je podobná s nejakou hornou trojuholníkovou maticou. Nech je niektorá z vlatných hodnôt matice A. Keďže k nej príslušný vlastný vektor generuje A-invariantný podpriestor, A je podobná s blokovou maticou B = z 0 B1 , kde 0 K(n-1)×1 , z K1×(n-1) , B1 K(n-1)×(n-1) . Preto B = R-1 A R pre nejakú regulárnu maticu R Kn×n . Keďže A aj B majú spektrum algebraickej váhy n, algebraická váha spektra B1 je n - 1. Podľa indukčného predpokladu B1 je podobná s hornou trojuholníkovou maticou C1, teda C1 = Q-1 B1 Q pre vhodnú regulárnu maticu Q K(n-1)×(n-1) . Potom aj diag(1, Q) Kn×n je regulárna. Pomocou pravidla pre násobenie blokových matíc (pozri paragraf 2.2.3) dostávame A (R diag(1, Q))-1 A (R diag(1, Q)) = diag(1, Q)-1 R-1 A R diag(1, Q) = diag 1, Q-1 z 0 B1 diag(1, Q) = z Q 0 Q-1 B1 Q = z Q 0 C1 , 6 PAVOL ZLATOŠ: LINEÁRNA ALGEBRA A GEOMETRIA čo je opäť horná trojuholníková matica. Podľa prvej časti vety existuje regulárna matica P taká, že matica C = P -1 AP je horná trojuholníková. V prípade poľa R resp. C označme S maticu, ktorá vznikne ortogonalizáciou stĺpcov matice P podľa Gramovho-Schmidtovho procesu (vzhľadom na štandardný skalárny súčin v Rn resp. v Cn ) a ich následným znormovaním. Potom S je ortogonálna resp. unitárna matica, a vzhľadom na to, že k-ty vektor vznikajúci pri Gramovom-Schmidtovom procese je vždy lineárnou kombináciou prvých k -1 pôvodných vektorov, S = P T pre jednoznačne určenú regulárnu hornú trojuholníkovú maticu T . Potom T -1 C T = T -1 P -1 A P T = S-1 A S je horná trojuholníkva matica, podobná s maticou A prostredníctvom ortogonálnej resp. unitárnej matice S. Preformulovaním práve dokázanej vety do reči lineárnych operátorov okamžite dostávame nasledujúci dôsledok. 19.2.2. Dôsledok. Nech je lineárny operátor na n-rozmernom vektorovom priestore V nad poľom K so spektrom s algebraickou váhou n. Potom existuje báza priestoru V , vzhľadom na ktorú má hornú trojuholníkovú maticu s diagonálou tvorenou jeho vlastnými hodnotami. V prípade poľa K = R a euklidovského priestoru V resp. poľa K = C a unitárneho priestoru V možno navyše zabezpečiť, aby báza bola ortonormálna. Charakteristický polynóm hornej trojuholníkovej matice C Kn×n s diagonálou (1, . . . , n) je chC(x) = (1 - x) . . . (n - x) = 1 . . . n - . . . + (-1)n-1 (1 + . . . + n)xn-1 + (-1)n xn , a jeho koeficienty pri mocninách x0 a xn-1 možno tentokrát (na rozdiel od všeobecnej matice) nahliadnuť naozaj bez ťažkostí. Taktiež platí det C = 1 . . . n, tr C = 1 + . . . + n. Kedže podobné matice majú rovnaký determinant, stopu aj charakteristický polynóm, z práve vety 19.2.1 taktiež vyplýva 19.2.3. Tvrdenie. Nech matica A Kn×n má n vlastných hodnôt 1, . . . , n, pričom každá z nich sa v tejto postupnosti vyskytuje so svojou algebraickou násobnosťou. Potom det A = 1 . . . n, tr A = 1 + . . . + n a v charakteristickom polynóme chA(x) sú koeficienty u mocnín x0 a xn-1 rovné det A resp. (-1)n-1 tr A. 19. SPEKTRUM LINEÁRNEHO OPERÁTORA 7 19.2.4. Príklad. Uvažujme reálnu maticu A = 12 0 -28 11 1 -29 7 0 -16 . Jej charakteristický polynóm chA(x) = 12 - x 0 -28 11 1 - x -29 7 0 -16 - x = 4 - 3x2 - x3 = (1 - x)(2 + x)2 má jednoduchý koreň x1 = 1 a dvojnásobný koreň x2,3 = -2. Homogénna sústava s maticou A - I3 = 11 0 -28 11 0 -29 7 0 -17 1 0 0 0 0 1 0 0 0 má jednorozmerný podpriestor riešení generovaný vektorom (0, 1, 0)T . Homogénna sústava s maticou A + 2I3 = 14 0 -28 11 3 -29 7 0 -14 1 0 -2 0 1 -7/3 0 0 0 má opäť len jednorozmerný podpriestor riešení generovaný vektorom (6, 7, 3)T . Matica A teda má jednoduché vlastné číslo 1, ku ktorému prislúcha vlastný vektor (0, 1, 0)T a algebraicky dvojnásobné vlastné číslo -2 s geometrickou násobnosťou 1, ku ktorému prislúcha vlastný vektor (6, 7, 3)T . Preto A nie je podobná so žiadnou diagonálnou maticou. Ukážeme, ako k nej možno nájsť podobnú hornú trojuholníkovú maticu. Vlastný vektor (0, 1, 0)T prislúchajúci k vlastnému číslu 1 doplníme do bázy R3 tvorenej stĺpcami matice P = 0 1 0 1 0 0 0 0 1 . Potom A P -1 A P = 1 11 -29 0 12 -28 0 7 -16 = B. O matici B1 R2×2 tvoriacej pravý dolný matice B už vieme, že má jediné algebraicky dvojnásobné vlastné číslo -2. K nemu príslušný vlastný vektor nájdeme riešením homogénnej sústavy s maticou B1 + 2I2 = 14 -28 7 -14 1 -2 0 0 . 8 PAVOL ZLATOŠ: LINEÁRNA ALGEBRA A GEOMETRIA Podpriestor riešení je generovaný vektorom (2, 1)T . Doplnením tohto vektora do bázy priestoru R2 dostaneme (napr.) maticu Q = 2 1 1 0 . Potom 12 -28 7 -16 Q-1 12 -28 7 -16 Q = -2 7 0 -2 . Všimnite si, že vlastná hodnota -2 sa nám zákonite objavila aj v pravom dolnom rohu " sama od seba". Stĺpce matice R = P diag(1, Q) = 0 2 1 1 0 0 0 1 0 tvoria bázu, vzhľadom na ktorú má lineárny operátor x A x na R3 hornú trojuholníkovú maticu. Kedže (11, -29) Q = (-7, 11) (z = (11, -29) je prvý riadok matice B bez prvého člena), bez ďalšieho násobenia vidíme, že táto matica má tvar R-1 A R = 1 -7 11 0 -2 7 0 0 -2 A. Ešte poznamenajme, že pre maticu A rádu n > 3 by sme museli procedúru vyčleňovania vlastných čísel a príslušných vlastných podpriestorov opakovať viackrát, pokým by sme sa nedopracovali k hornej trojuholníkovej matici rádu 2 (ak by sme náhodou nemali šťastie a nedospeli už skôr k hornej trojuholníkovej matici väčšieho rádu). Až potom by sme mohli začať z dielčích matíc prechodu spätne skladať výslednú maticu prechodu a pomocou nej získať hornú trojuholníkovú maticu podobnú s A. 19.3. Rozšírenia polí, algebraicky uzavreté polia Pri ďalšom štúdiu spektra lineárnych operátorov sa nezaobídeme bez niektorých hlbších vedomostí o štruktúre polí a polynómov nad nimi. Ak by sme trvali na úplnosti a sebestačnosti nášho výkladu, museli by sme v tejto chvíli značne odbočiť od našej hlavnej témy a začať rozvíjať inú časť algebry. Miesto toho iba sformulujeme niekoľko základných výsledkov, o ktoré sa budeme ďalej opierať. Ich dôkazy vynecháme, takže ich vlastne len predložíme čitateľovi na uverenie. Ich formulácia si však vyžaduje zaviesť niekoľko nových pojmov, pri ktorých nám prídu vhod i niektoré poznatky z lineárnej algebry. Pripomíname (pozri paragraf 1.2), že pole K sa nazýva podpoľom poľa L, prípadne pole L sa nazýva rozšírením poľa K, ak K L, obe polia majú tú istú nulu 0 a 19. SPEKTRUM LINEÁRNEHO OPERÁTORA 9 jednotku 1 a pre všetky a, b K sa ich súčet a + b a súčin ab v K rovná ich súčtu a + b resp. súčinu ab v L. Z toho už vyplýva, že pre 0 = a K sa inverzný prvok a-1 v K zhoduje s inverzným prvkom a-1 v L. Ak pole L je rozšírením poľa K, tak L možno považovať za vektorový priestor nad poľom K (pozri príklad 1.6.1). Hovoríme, že pole L je konečným rozšírením poľa K, ak L je konečnorozmerný vektorový priestor nad K; jeho dimenziu nazývame stupňom rozšírenia L nad K a značíme ju [L :K] = dimK L. Teda konečné rozšírenie je také, ktoré má konečný stupeň. Prvok c L sa nazýva algebraický nad K, ak c je koreňom nejakého polynómu f(x) K[x] stupňa 1. Rozšírenie L poľa K sa nazýva algebraické, ak každý prvok c L je algebraický nad K. 19.3.1. Tvrdenie. Každé konečné rozšírenie poľa K je algebraické nad K. Dôkaz uvádzame ako jednoduchú ukážku použitia metód lineárnej algebry v teórii polí. Nech L je konečné rozšírenie poľa K stupňa [L : K] = n. Zvoľme ľubovoľné c K. Potom (n + 1)-tica (1, c, c2 , . . . , cn ) prvkov z L nemôže byť lineárne nezávislá nad K, preto existujú a0, a1, . . . , an K, nie všetky rovné 0, také, že a0 + a1c + . . . + ancn = 0. Ale to znamená, že c je koreňom polynómu f(x) = a0 + a1x + . . . + anxn K[x]. Poznamenajme, že obrátená implikácia neplatí, t. j. algebraické rozšírenie daného poľa môže mať nekonečný stupeň. Z dôkazu navyše vyplýva, že každý prvok konečného rozšírenia L poľa K stupňa [L : K] = n je koreňom polynómu f(x) K[x] stupňa n. Pre naše potreby má kľúčový význam nasledujúca skutočnosť. 19.3.2. Tvrdenie. Nech f(x) = a0 + a1x + . . . + anxn K[x], an = 0, je polynóm stupňa n 1 nad poľom K. Potom existuje konečné (teda nutne algebraické) rozšírenie L poľa K také, že f(x) má v L[x] rozklad na lineárne faktory f(x) = an(x - 1) . . . (x - n). Inak povedané, f(x) má práve n koreňov 1, . . . , n L, ak každý z nich počítame aj s jeho násobnosťou. Rozšírenie L možno navyše zvoliť tak, že každý jeho prvok má tvar G(1, . . . , n) pre nejaký polynóm G(x1, . . . , xn) v n premenných s koeficientmi z K ­ pole L, ktoré je týmito podmienkami určené jednoznačne až na izomorfizmus polí, nazývame rozkladové pole polynómu f(x). Pre stupeň rozkladového poľa platí [L : K] n!. (Prenechávame čitateľovi, aby si sám sformuloval pojem izomorfizmu polí.) Pole L sa nazýva algebraicky uzavreté, alebo tiež algebraicky úplné, ak každý polynóm f(x) L[x] stupňa aspoň 1 má v L aspoň jeden koreň. Pomerne jednoducho možno nahliadnuť (prípadne dokázať matematickou indukciou podľa stupňa n), 10 PAVOL ZLATOŠ: LINEÁRNA ALGEBRA A GEOMETRIA že pole L je algebraicky úplné práve vtedy, keď každý polynóm f(x) L[x] stupňa aspoň 1 má v L[x] rozklad na lineárne faktory (skúste sami). Algebraické rozšírenie poľa K, ktoré je navyše samo algebraicky uzavreté, sa nazýva algebraický uzáver poľa K. Nie celkom elementárnymi prostriedkami možno dokázať nasledujúcu vetu. 19.3.3. Veta. Ku každému poľu K existuje jeho algebraický uzáver. Podobne ako rozkladové pole polynómu, aj algebraický uzáver daného poľa je určený jednoznačne až na izomorfizmus polí. Na druhej strane, algebraický uzáver daného poľa nemusí byť jeho konečným rozšírením. V jednom dôležitom prípade však tomu tak je. Pole C všetkých komplexných čísel má ako rozšírenie poľa R všetkých reálnych čísel stupeň [C : R] = 2. Aby sme sa teda utvrdili v tom, že je algebraickým uzáverom poľa R, stačí sa odvolať na nasledujúci klasický a hlboký výsledok, známy ako základná veta algebry. 19.3.4. Veta. Pole C všetkých komplexných čísel je algebraicky úplné. Zhrňme si teraz stručne niektoré dôsledky práve vykonaných úvah pre spektrá matíc. Predovšetkým, spektrum matice A Kn×n závisí na príslušnom poli. Presnejšie, takúto maticu možno považovať aj za maticu A Ln×n , kde L je ľubovoľné rozšírenie poľa K. Ak označíme SpecK A, SpecL A príslušné spektrá (t. j. množiny vlastných hodnôt matice A v poli K resp. L), tak zrejme SpecK A SpecL A. Na druhej strane, každé SpecK A má zrejme rovnakú algebraickú i geometrickú násobnosť, ktorá nezávisí na príslušnom poli. Z tvrdenia 19.3.2 priamo vyplýva 19.3.5. Tvrdenie. Ku každej matici A Kn×n existuje konečné rozšírenie L poľa K také, že charakteristický polynóm matice A možno v L[x] rozložiť na súčin lineárnych faktorov chA(x) = (1 - x) . . . (n - x). Inak povedané, A má n vlastných hodnôt 1, . . . , n L, vrátane ich algebraickej násobnosti. Potom pre každé rozšírenie M poľa L už platí SpecM A = SpecL A. Aplikáciou tvrdenia 19.3.5 na Schurovu vetu 19.2.1 okamžite dostávame 19.3.6. Tvrdenie. Ku každej matici A Kn×n existuje konečné rozšírenie L poľa K také, že A je nad L podobná s hornou trojuholníkovou maticou B Ln×n , ktorej diagonálu tvoria vlastné hodnoty matice A v L, vrátane ich algebraickej násobnosti. Napokon si ešte uvedomme, že tvrdenia 19.3.5 a 19.3.6 sú automaticky (t. j. pre L = K) splnené pre štvorcové matice nad algebraicky uzavretým poľom K. Špeciálne to platí pre štvorcové matice nad poľom C. 19.4. Komplexifikácia Pozrime sa teraz na výsledky sformulovné v závere predchádzajúceho paragrafu z hľadiska vedúceho zámeru tejto kapitoly, ktorým je diagonalizácia matice lineárneho operátora : V V na konečnorozmernom vektorovom priestore V . Zdá sa, že sme na tejto ceste naozaj kus pokročili a skutočne ukázali, ako možno prekonať prípadnú 19. SPEKTRUM LINEÁRNEHO OPERÁTORA 11 prekážku spočívajúcu v nedostatočnej algebraickej váhe spektra. Pokiaľ by sme sa zaujímali len o samotné matice, bolo by tomu tak. Nezabúdajme však, že v prvom rade nám ide o lineárne operátory a matice používame len ako viac-menej pomocné objekty slúžiace na ich popis. Ak L je rozšírenie poľa K, tak každá matica A Kn×n Ln×n prirodzene určuje lineárny operátor operátor : Kn Kn ako aj lineárny operátor : Ln Ln . Hoci aj sú oba definované tým istým predpisom x A x, (okrem triviálneho prípadu, keď L = K) sú to rôzne operátory, lebo operujú na rôznych vektorových priestoroch, navyše nad rôznymi poľami. Napriek tomu akosi podvedome cítime, že tým " správnym" analógom vektorového priestoru Kn nad poľom K je práve vektorový priestor Ln nad poľom L. Potom operátoru : Kn Kn , kde (x) = A x pre x Kn , " prirodzene" zodpovedá operátor : Ln Ln , kde (x) = Ax pre x Ln . No v situácii, keď : V V je lineárny operátor na " abstraktnom" vektorovom priestore V nad poľom K, otázka, akým vektorovým priestorom W nad poľom L máme nahradiť V a aký lineárny operátor : W W by mal zodpovedať operátoru , už nie je zďaleka taká jasná. Príslušnú konštrukciu možno elegantne popísať v jazyku tenzorových súčinov. Aj elementárnymi prostriedkami, ktoré máme v tejto chvíli k dispozícii však dokážeme zvládnuť pre nás najdôležitejší špeciálny prípad ­ totiž prechod od R k C. Budeme si počínať v podstate rovnako ako pri dôverne známej konštrukcii poľa C z poľa R. Komplexifikáciou vektorového priestoru V nad poľom R nazveme vektorový priestor V C nad poľom C, ktorého prvkami sú všetky formálne lineárne kombinácie tvaru z = x + iy, kde x, y V a i C je imaginárna jednotka. Pre x, y, u, v V kladieme x + iy = u + iv x = u & y = v. Píšeme tiež x = Re z, y = Im z a vektory x, y V nazývame reálnou resp. imaginárnou časťou vektora z V C . Sčítanie takýchto vektorov definujeme " po zložkách", čiže (x + iy) + (u + iv) = (x + u) + i(y + v). Konečne násobenie skalárom a + ib C, kde a, b R, definujeme vzťahom (a + ib)(x + iy) = (ax - by) + i(ay + bx). Čitateľ si určite aj sám ľahko overí, že komplexifikácia V C reálneho vektorového priestoru V s takto definovanou rovnosťou a operáciami naozaj tvorí vektorový priestor nad poľom C. Ešte dodajme, že ­ rovnako ako v samotnom poli C ­ komplexne združeným vektorom k vektoru z = x + iy V C nazývame vektor z = x - iy. Poznámka. Komplexifikácia V C vektorového priestoru V sa tiež zvykne označovať C R V , prípadne len C V , t. j. ako tenzorový súčin C a V nad poľom R. V tejto chvíli však ide naozaj len o " nevinné" označenie a práve popísaná konštrukcia ani jej ďalšie využitie si nijakú znalosť tenzorových súčinov nevyžadujú. 19.4.1. Tvrdenie. Nech V je reálny vektorový priestor. Potom dimC V C = dimR V. 12 PAVOL ZLATOŠ: LINEÁRNA ALGEBRA A GEOMETRIA Dôkaz. Nech dimR V = n a u1, . . . , un je nejaká báza priestoru V nad R. Ponechávame na čitateľa, aby si sám overil, že tie isté vektory u1, . . . , un tvoria aj bázu V C nad C. 1 Taktiež ľahko nahliadneme, že dimR V = má za následok dimC V C = . Komplexifikácia vektorového priestoru nad R je v istom zmysle opačnou konštrukciou k zreálneniu vektorového priestoru nad C (pozri paragraf 17.1). Vzťahu oboch konštrukcií sa budeme podrobnejšie venovať v cvičeniach. Komplexifikáciou lineárneho zobrazenia : V U medzi reálnymi vektorovými priestormi V , U nazývame lineárne zobrazenie C : V C UC dané predpisom C (x + iy) = (x) + i(y), pre x, y V . Špeciálne C (x) = (x) pre x V . Opäť sa ľahko overí, že C je naozaj lineárne zobrazenie medzi vektorovými priestormi nad C. Taktiež nasledujúce tvrdenie je zrejmé z práve vyslovenej definície a predchádzajúceho tvrdenia. 19.4.2. Tvrdenie. Nech U, V sú reálne vektorové priestory s bázami resp. a : V U je lineárne zobrazenie. Potom (), = C , . Inak povedané a jeho komplexifikácia C : V C UC majú tú istú maticu vzhľadom na bázy , . Ak ľubovoľný vektor z = (x1 + iy1, . . . , xn + iyn)T Cn rozložíme na reálnu a imaginárnu časť z = x + iy = Re z + i Im z, kde x = Re z = (x1, . . . , xn)T , y = Im z = (y1, . . . , yn)T sú reálne vektory tvorené reálnymi resp. imaginárnymi časťami kanonických súradníc vektora z, prirodzene tým stotožníme komplexifikáciu (Rn )C priestoru Rn s priestorom Cn . Za takýchto okolností je komplexifikáciou lineárneho zobrazenia : Rn Rm s maticou A (vzhľadom na kanonické bázy) zobrazenie C : Cn Cm , ktoré má (v kanonických bázach) rovnakú maticu A. Vidíme teda, že naša " abstraktná" konštrukcia komplexifikácie sa plne zhoduje s " konkrétnou komplexifikáciou" Cn priestorov Rn a lineárnych zobrazení medzi takýmito priestormi. Z hľadiska vedúceho zámeru tejto kapitoly spočíva hlavný význam komplexifikácie v nasledujúcom tvrdení. 19.4.3. Veta. Nech V je vektorový priestor konečnej dimenzie n nad poľom R a : V V je lineárny operátor. Potom lineárny operátor C : V C V C má, vrátane algebraickej násobnosti, n vlastných čísel 1, . . . , n C. Samozrejme, reálne spomedzi vlastných čísel 1, . . . , n operátora C sú priamo vlastnými číslami pôvodného operátora . S istou dávkou zjednodušenia však nazývame aj hodnoty j s nenulovou imaginárnou časťou komplexnými vlastnými číslami (reálneho) operátora . 1Striktne podľa definície by sme mali hovoriť o vektoroch u1 + i0, . . . , un + i0. Prirodzene však píšeme x + i0 = x, 0 + iy = iy, a V stotožňujeme s množinou {x + i0; x V } V C. 19. SPEKTRUM LINEÁRNEHO OPERÁTORA 13 Inak povedané, prekážku diagonalizácie matice lineárneho operátora na konečnorozmernom vektorovom priestore nad R, spočívajúcu v nedostatočnej algebraickej váhe jeho spektra, vieme prekonať komplexifikáciou príslušného priestoru a operátora. Poznamenajme, že nahradením poľa C rozkladovým poľom príslušného charakteristického polynómu a istým zovšeobecnením metódy komplexifikácie možno rovnaký cieľ dosiahnuť aj pre lineárne operátory na konečnorozmerných vektorových priestoroch nad ľubovoľným poľom. Tieto výsledky však už presahujú rámec nášho kurzu. 19.5. Geometrický význam komplexných vlastných čísel Geometrický význam reálnych vlastných čísel lineárnej transformácie vektorového priestoru V nad poľom R je zrejmý: ak R je vlastné číslo, tak príslušný vlastný vektor v V (i každý vektor vlastnej priamky [v]) sa zobrazením zobrazí na svoj -násobok. Pri našej " podvedomej" geometrickej interpretácii priestoru V (keď doňho mimovoľne vnášame euklidovskú štruktúru), sa dĺžka vektora v zmení na jej ||-násobok; ak > 0, tak orientácia vektora v sa zachová, ak < 0, zmení sa na opačnú. Tentokrát sa však nemusíme odvolávať na nijaké " podvedomé" geometrické súvislosti. Z podmienky homogenity (pozri paragraf 13.3) totiž vyplýva, že rovnosť (v) = || v platí pre ľubovoľnú normu na V . V príklade 18.4.2 sme sa však videli, že aj lineárna transformácia reálneho vektorového priestoru môže mať komplexné vlastné čísla. Cieľom tohto paragrafu je ukázať, že uvedený príklad je svojim spôsobom typický, presnejšie, za výskytom komplexných vlastných čísel reálnej lineárnej transformácie sa vždy skrýva nejaké otočenie (pri spomínanej mimovoľnej euklidovskej interpretácii). Tým by sa mal z úlohy komplexných vlastných čísel definitívne vytratiť akýkoľvek mystický ráz. 19.5.1. Tvrdenie. Nech C je vlastné číslo matice A Rn×n a w je k nemu prislúchajúci vlastný vektor. Potom aj je vlastné číslo matice A a prislúcha k nemu vlastný vektor w. Navyše vlastné čísla a majú rovnakú algebraickú i geometrickú násobnosť. Dôkaz. Najprv dokážeme, že komplexné číslo je m-násobným koreňom polynómu f(x) = a0 + a1x + . . . + anxn R[x] práve vtedy, keď je jeho m-násobným koreňom. Stačí ukázať, že z deliteľnosti f(x) mocninou (x-)m vyplýva jeho deliteľnosť mocninou (x - )m . Nech teda f(x) = (x - )m p(x) pre nejaký polynóm p(x) = c0 + c1x + . . . + ckxk C[x]. Potom zrejme (x - )m (c0 + c1x + . . . + ckxk ) = a0 + a1x + . . . + anxn = f(x), lebo pre koeficienty polynómu f(x) R[x] platí aj = aj. Ak teda je algebraicky m-násobné vlastné číslo matice A Rn×n , tak aj je jej vlastné číslo s tou istou algebraickou násobnosťou. Nech w Cn je vlastný vektor prislúchajúci k , čiže A w = w. Potom tiež A w = w. Keďže A = A je reálna, vyplýva z toho Aw = w, t. j. w je vlastný vektor matice A prislúchajúci k . Teda zobrazenie w w je semilineárny izomorfizmus (pozri cvičenia ku kapitole 17) vlastných podpriestorov R(A - I) R(A - I), 14 PAVOL ZLATOŠ: LINEÁRNA ALGEBRA A GEOMETRIA preto tieto priestory majú rovnakú dimenziu a vlastné čísla , majú rovnakú geometrickú násobnosť. Teda komplexné vlastné čísla s nenulovou imaginárnou časťou reálnych matíc resp. lineárnych transformácií reálnych vektorových priestoroch sa vždy vyskytujú v komplexne združených pároch , , rovnako ako k nim príslušné vlastné vektory. Ukážeme si, že za takýmto výskytom sa vždy skrýva dvojrozmerný invariantný podpriestor, na ktorom príslušná matica operuje ako rotácia o uhol zložená s rovnoľahlosťou s koeficientom r > 0, kde = r(cos + i sin ) je goniometrický tvar čísla . Nech teda : V V je lineárny operátor na reálnom vektorovom priestore V , = a + ib, = a - ib, kde a, b R, b = 0, sú komplexne združené vlastné čísla jeho komplexifikácie C : V C V C a w V C resp. w V C sú k nim prislúchajúce vlastné vektory. Potom zúženie operátora C na jeho dvojrozmerný invariantný podpriestor [w, w] V C má v báze (w, w) maticu diag(, ). Označme u = Re w = Re w = 1 2 (w + w), v = - Im w = Im w = 1 2i (w - w) vektory z pôvodného reálneho priestoru V . Potom w = u - iv, w = u + iv. Ľahko nahliadneme, že u, v sú lineárne nezávislé (nad R), teda tvoria bázu dvojrozmerného podpriestoru [u, v] V . Počítajme (u) = C (u) = 1 2 C (w) + C (w) = 1 2 (w + w) = Re(w) = au + bv, (v) = C (v) = 1 2i C (w) - C (w) = 1 2i (w - w) = Im(w) = -bu + av. Vidíme, že [u, v] V je dvojrozmerný invariantný podpriestor operátora a zúženie na [u, v] má v báze (u, v) reálnu maticu, ktorú možno pomocou goniometrického vyjadrenia vlastných čísel = r(cos + i sin ) = r ei , = r(cos - i sin ) = r e-i (t. j. a = r cos , b = r sin ) zapísať v tvare a -b b a = r cos -r sin r sin r cos = r cos - sin sin cos = rR. Tým sme vlastne dokázali nasledujúcu vetu. 19.5.2. Veta. Nech je lineárna transformácia reálneho vektorového priestoru V , = a + ib = r(cos + i sin ) je jej komplexná vlastná hodnota s nenulovou imaginárnou časťou, ku ktorej vo V C prislúcha vlastný vektor u - iv, kde u, v V . Potom (u, v) je bázou invariantného podpriestoru [u, v] V a zúženie na [u, v] má v tejto báze reálnu maticu a -b b a = rR. V úvode ku kapitole 13 sme zdôrazňovali, že hovoriť o kvantitatívnych geometrických veličinách ako dĺžka či uhol v abstraktných vektorových priestoroch, hoc aj nad poľom R, nedáva dobrý zmysel. Až prítomnosť skalárneho súčinu v takomto priestore nám to umožňuje. Teda, prísne vzaté, zatiaľ stále nemáme právo tvrdiť, že na invariantnom podpriestore [u, v] pôsobí ako kompozícia otočenia o uhol a rovnoľahlosti 19. SPEKTRUM LINEÁRNEHO OPERÁTORA 15 s koeficientom r a stredom v počiatku. Na [u, v] si však možno (navyše jednoznačne) zvoliť skalárny súčin tak, aby vektory u, v vzhľadom naň tvorili ortonormálnu bázu. Potom lineárna transformácia [u, v] euklidovského priestoru [u, v] naozaj zodpovedá kompozícii rotácie R a rovnoľahlosti rI2. Ak si uvedomíme, že každý polynóm f(x) R[x] nepárneho stupňa má aspoň jeden reálny koreň, môžeme zaznamenať ešte jeden dôsledok vety 19.5.2. 19.5.3. Dôsledok. Nech je lineárny operátor na konečnorozmernom vektorovom priestore V nad poľom R. Potom má aspoň jeden invariantný podpriestor dimenzie 1 alebo 2. Ak dim V je nepárne číslo, tak má aspoň jedno reálne vlastné číslo a k nemu prislúchajúci invariantný podpriestor dimenzie 1.