13. EUKLIDOVSKÉ PRIESTORY Naše štúdium vektorových priestorov sa doteraz nieslo prevažne v algebraickom duchu a bolo vedené takmer výlučne algebraickými prostriedkami. Geometria bola v tomto poňatí zredukovaná väčšinou len na otázky rovno- či rôznobežnosti a pretínania lineárnych a afinných podpriestorov, t. j. na tzv. štruktúru incidencie. Popri tom však geometrický názor bol pre nás dôležitým zdrojom prvotných motivácií alebo dodatočných ilustrácií mnohých pojmov. To bolo umožnené hlavne tým, že hoci sme sa zaoberali vektorovými priestormi nad ľubovoľným poľom, ako typické príklady sme si pod nimi väčšinou predstavovali vektorové priestory malej dimenzie nad poľom reálnych čísel a vektory v nich ako orientované úsečky (s počiatkom v bode 0), ktoré majú určitú dĺžku, smer a orientáciu. Inak povedané, lineárnu algebru sme často vedome a ešte častejšie podvedome zasadzovali do rámca elementárnej geometrie roviny alebo priestoru. Prísne vzaté nám však len samotná štruktúra vektorového priestoru (ani keby sme sa obmedzili iba na prípad poľa R) neumožňuje vôbec hovoriť o dĺžke – takýto pojem v doterajšom kontexte nemá žiadny zmysel. Pritom práve dĺžka, a spolu s ňou tiež uhol sú základnými kvantitatívnymi veličinami elementárnej euklidovskej geometrie. Naplnenie lineárnej algebry geometrickým obsahom teda v prvom rade vyžaduje dať práve týmto pojmom určitý dobre zakotvený význam, ktorý – hoci by sa neopieral len o náš geometrický názor – bol by s ním v dobrej zhode. V tejto kapitole sa o to pokúsime vo vektorových priestoroch nad poľom R. Ukazuje sa, že celú základnú geometrickú štruktúru, vrátane dĺžok a uhlov, možno odvodiť z jedinej kladne definitnej symetrickej bilineárnej formy na takomto priestore. 13.1. Skalárny súčin Skalárnym alebo tiež vnútorným súčinom na reálnom vektorovom priestore V rozumieme ľubovoľnú kladne definitnú, symetrickú bilineárnu formu na V . Hodnotu tejto formy na vektoroch x, y ∈ V budeme značiť x, y . Nezávisle na znalosti uvedených pojmov možno skalárny súčin na V definovať ako binárnu operáciu V × V → R, ktorá každej dvojici (x, y) vektorov z V priradí reálne číslo x, y také, že pre všetky x, y, x1, x2 ∈ V a ľubovoľné c ∈ R platí: x1 + x2, y = x1, y + x2, y (aditivita), cx, y = c x, y (homogenita), x, y = y, x (symetria), x = 0 ⇒ x, x > 0 (kladná definitnosť). Spojenie aditivity a homogenity skalárneho súčinu dáva jeho linearitu ako funkcie prvej premennej (pri pevnej druhej premennej). Vďaka symetrii z toho vyplýva aj 1 2 PAVOL ZLATOŠ: LINEÁRNA ALGEBRA A GEOMETRIA linearita skalárneho súčinu ako funkcie druhej premennej (pri pevnej prvej premennej), t. j. rovnosti x, y1 + y2 = x, y2 + x, y2 , x, cy = c x, y , pre všetky x, y1, y2 ∈ V a c ∈ R. Z (bi)linearity takisto vyplýva nasledujúci podrobnejší rozpis podmienky kladnej definitnosti x, x ≥ 0 & x, x = 0 ⇔ x = 0 pre každé x ∈ V . Prvá časť tejto podmienky nám umožňuje definovať normu alebo dĺžku vektora x rovnosťou x = x, x . Výraz x 2 treba zatiaľ chápať len ako iné označenie pre kvadratickú formu x, x indukovanú skalárnym súčinom. O oprávnenosti názvu ” dĺžka“ ako aj o ďalších vlastnostiach normy podrobnejšie pojednáme až v paragrafe 13.3. Euklidovským priestorom nazývame ľubovoľný konečnorozmerný reálny vektorový priestor so skalárnym súčinom. Hoci sa v tejto kapitole hodláme sústrediť práve na euklidovské priestory, všetky pojmy a výsledky, v ktorých konečnosť dimenzie nehrá podstatnú úlohu, sa budeme snažiť formulovať tak, aby zahŕňali všetky (teda i nekonečnorozmerné) priestory so skalárnym súčinom. 13.1.1. Príklad. Náš čitateľ sa už na strednej škole v rámci analytickej geometrie, prípadne v rámci fyziky, asi stretol so skalárnym súčinom x, y = x1y1+x2y2 v rovine R2 a so skalárnym súčinom x, y = x1y1+x2y2+x3y3 v priestore R3 . Ľahko sa možno presvedčiť, že rovnaká formulka funguje pre každé n, t. j. pre x = (x1, . . . , xn)T , y = (y1, . . . , yn)T je predpisom x, y = xT · y = n i=1 xiyi definovaný skalárny súčin na stĺpcovom vektorovom priestore Rn . V prípade riadkového priestoru Rn máme x, y = x · yT = n i=1 xiyi pre x = (x1, . . . , xn), y = (y1, . . . , yn). Takýto skalárny súčin budeme nazývať štandardným skalárnym súčinom na Rn . Štandardný skalárny súčin vektorov x, y ∈ Rn (či už ide o riadkové alebo stĺpcové vektory) sa obvykle značí x · y. Dĺžka vektora x vzhľadom na štandardný skalárny súčin je x = √ x · x = n i=1 x2 i 1/2 . V rámci analytickej geometrie sa pre nenulové vektory x, y dokazuje známy vzťah x · y = x y cos α, ktorý zväzuje štandardný skalárny súčin v R2 či v R3 s dĺžkou príslušných vektorov a nimi zvieraným uhlom α. 13. EUKLIDOVSKÉ PRIESTORY 3 13.1.2. Príklad. Nech V označuje vektorový priestor C a, b všetkých spojitých reálnych funkcií definovaných na uzavretom intervale a, b , kde a < b sú reálne čísla, prípadne jeho ľubovoľný lineárny podpriestor. Pre f, g ∈ V položme f, g = b a f(x)g(x) dx. Z komutatívnosti násobenia v R a aditivity a homogenity integrálu vyplýva, že f, g je symetrická bilineárna forma na V (podrobne si premyslite ako). Na dôkaz kladnej definitnosti si stačí uvedomiť, že pre f = 0 (t. j. f nie identicky rovné nule), je f2 (x) ≥ 0 pre každé x ∈ a, b . Zo spojitosti funkcie f (a teda tiež f2 ) vyplýva existencia nejakého netriviálneho uzavretého podintervalu a1, b1 ⊆ a, b takého, že f2 (x) > 0 pre všetky x ∈ a1, b1 . Keďže f na a1, b1 nadobúda minimum, máme f, f = b a f2 (x) dx ≥ b1 a1 f2 (x) dx ≥ (b1 − a1) min a1≤x≤b1 f(x) > 0. Teda predpisom (f, g) → f, g je definovaný skalárny súčin na C a, b ako aj na jeho ľubovoľnom lineárnom podpriestore, napr. na priestoroch polynómov R[x], R(n) [x], n ∈ N, uvažovaných ako spojité funkcie na a, b . V prípade priestorov C a, b , či R[x] ide o skalárny súčin na nekonečnorozmerných vektorových priestoroch. Norma spojitej funkcie f : a, b → R potom je f = f, f = b a f2 (x) dx 1/2 . 13.2. Gramova matica a Cauchyho-Schwartzova nerovnosť Nech α = (u1, . . . , uk) je ľubovoľná usporiadaná k-tica vektorov vo vektorovom priestore V so skalárnym súčinom. Takmer všetky podstatné informácie o týchto vektoroch sú ukryté v tzv. Gramovej matici G(α) = G(u1, . . . , uk) = ui, uj k×k vektorov u1, . . . , uk. Determinant Gramovej matice det G(α) = |G(u1, . . . , uk)| = u1, u1 . . . u1, uk ... ... ... uk, u1 . . . uk, uk sa nazýva Gramovým determinantom vektorov u1, . . . , uk. 4 PAVOL ZLATOŠ: LINEÁRNA ALGEBRA A GEOMETRIA 13.2.1. Tvrdenie. Nech u1, . . . , uk sú ľubovoľné vektory vo vektorovom priestore V so skalárnym súčinom. Potom (a) G(u1, . . . , uk) je kladne semidefinitná symetrická matica; (b) vektory u1, . . . , uk sú lineárne nezávislé práve vtedy, keď G(u1, . . . , uk) je kladne definitná. Dôkaz. Označme G = G(u1, . . . , uk). (a) Symetria matice G je priamym dôsledkom symetrie skalárneho súčinu. Zostáva dokázať, že pre ľubovoľný vektor c = (c1, . . . , ck) ∈ Rk platí c · G · cT ≥ 0. Položme v = c1u1 + . . . + ckuk. Potom z bilinearity a kladnej definitnosti skalárneho súčinu vyplýva c · G · cT = k i=1 k j=1 cicj ui, uj = v, v ≥ 0. (b) Ak u1, . . . , uk sú lineárne nezávislé, tak tvoria bázu lineárneho podpriestoru S = [u1, . . . , uk] ⊆ V . Zúženie skalárneho súčinu x, y na podpriestor S je skalárny súčin (t. j. kladne definitná symetrická bilineárna forma) na S. G je maticou tejto formy vzhľadom na bázu u1, . . . , uk, teda kladne definitná matica. Ak u1, . . . , uk sú lineárne závislé, tak v Rn existuje vektor c = (c1, . . . , ck) = 0 taký, že v = c1u1 + . . . + ckuk = 0. Potom podľa (a) c · G · cT = v, v = 0, 0 = 0, teda G nie je kladne definitná. Práve dokázané tvrdenie má spolu s vetou 12.2.4 nasledujúci dôsledok. 13.2.2. Dôsledok. Pre ľubovoľné u1, . . . , uk ∈ V platí |G(u1, . . . , uk)| ≥ 0. Pritom |G(u1, . . . , uk)| = 0 práve vtedy, keď vektory u1, . . . , uk sú lineárne závislé. Špeciálne pre ľubovoľné dva vektory u, v ∈ V platí |G(u, v)| = u, u u, v v, u v, v = u, u v, v − u, v v, u = u 2 v 2 − u, v 2 ≥ 0, pričom rovnosť nastane práve vtedy, keď vektory u, v sú lineárne závislé. Tým sme dokázali nasledujúci vzťah, známy ako Cauchyho-Schwartzova nerovnosť. 13.2.3. Tvrdenie. Pre ľubovoľné vektory u, v ∈ V v priestore V so skalárnym súčinom platí | u, v | ≤ u v , pričom rovnosť nastane práve vtedy, keď vektory u, v sú lineárne závislé. 13. EUKLIDOVSKÉ PRIESTORY 5 13.3. Dĺžka vektora a uhol dvoch vektorov Normou na reálnom vektorovom priestore V rozumieme ľubovoľné zobrazenie V → R, ktoré vektoru x ∈ V priradí reálne číslo x , nazývané normou alebo tiež dĺžkou vektora x, také, že pre všetky x, y ∈ V a ľubovoľné c ∈ R platí x + y ≤ x + y (trojuholníková nerovnosť), cx = |c| x (pozitívna homogenita), x = 0 ⇒ x = 0 (oddeliteľnosť). Z uvedených podmienok vyplýva nezápornosť normy, t. j. x ≥ 0 pre každé x ∈ V . Keďže vďaka pozitívnej homogenite platí 0 = 0 a −x = x , s použitím trojuholníkovej nerovnosti naozaj dostávame x = 1 2 x + −x ≥ 1 2 x − x = 1 2 0 = 0. Navyše, vďaka oddeliteľnosti máme x > 0 pre každé 0 = x ∈ V ; inak povedané, každý nenulový vektor môžeme pomocou jeho normy ” oddeliť“ od nulového vektora. Reálny vektorový priestor s normou nazývame normovaný priestor. Intuitívne sa na normovaný priestor dívame ako na vektorový priestor, v ktorom možno merať dĺžky vektorov. Tri definujúce podmienky pre normu zaručujú, že takéto meranie dĺžok, t. j. priradenie x → x , má rozumné vlastnosti, aké od dĺžok očakávame. Vzdialenosťou bodov x, y vo vektorovom priestore V s normou · nazývame dĺžku vektora x − y, t. j. číslo x − y . Pomocou vzdialeností bodov možno trojuholníkovú nerovnosť vyjadriť iným, ekvivalentným spôsobom, ktorý vari ešte názornejšie osvetľuje jej názov: x − y + y − z ≥ x − z pre všetky x, y, z ∈ V . Všeobecnou problematikou normovaných priestorov sa v tomto kurze nebudeme zaoberať. Obmedzíme sa len na normy, ktoré pochádzajú od skalárnych súčinov. 13.3.1. Tvrdenie. Nech V je reálny vektorový priestor so skalárnym súčinom. Potom rovnosťou x = x, x je definovaná norma na V . Dôkaz. Zvoľme x, y ∈ V . S použitím bilinearity a symetrie skalárneho súčinu a Cauchyho-Schwartzovej nerovnosti dostávame x + y 2 = x + y, x + y = x, x + x, y + y, x + y, y = x 2 + 2 x, y + y 2 ≤ x 2 + 2 x y + y 2 = x + y 2 . To dokazuje trojuholníkovú nerovnosť. Jednoduchý dôkaz ďalších dvoch podmienok prenechávame čitateľovi. 6 PAVOL ZLATOŠ: LINEÁRNA ALGEBRA A GEOMETRIA Z Cauchyho-Schwartzovej nerovnosti vyplýva, že pre ľubovoľné nenulové vektory x, y vo vektorovom priestore so skalárnym súčinom platí −1 ≤ x, y x y ≤ 1. Preto existuje jediné reálne číslo α také, že 0 ≤ α ≤ π a cos α = x, y x y . Číslo α nazývame uhlom alebo tiež odchýlkou vektorov x, y a značíme ho α = ∢(x, y). Zo symetrie skalárneho súčinu vyplýva ∢(x, y) = ∢(y, x), to znamená, že ide o neorientovaný uhol. Pri takejto definícii uhla dvoch nenulových vektorov zostáva vzťah x, y = x y cos ∢(x, y), platný pre štandardný skalárny súčin v R2 a R3 , zachovaný v ľubovoľnom priestore so skalárnym súčinom. Treba si však uvedomiť, že z logického hľadiska postupujeme obrátene ako v stredoškolskej analytickej geometrii. Tam totiž vopred vieme (či aspoň sa tak tvárime), čo sú to dĺžky a uhly vektorov, a pomocou nich definujeme skalárny súčin uvedeným vzťahom, prípadne rovnosťou x · y = xiyi, kedy musíme uvedený vzťah dokázať. Pri našom postupe vychádzame z pojmu skalárneho súčinu a pomocou neho definujeme dĺžky a uhly vektorov tak, že platnosť klasických poučiek analytickej geometrie zostáva zachovaná, ba dokonca ju rozširujeme na vektorové priestory ľubovoľnej konečnej i nekonečnej dimenzie vybavené skalárnym súčinom. Hovoríme, že vektory x, y ∈ V sú (navzájom) kolmé alebo tiež ortogonálne, označenie x ⊥ y, ak x, y = 0. Teraz uvedieme niekoľko bezprostredných dôsledkov našich definícií. Ich jednoduché dôkazy prenechávame ako cvičenie čitateľovi. 13.3.2. Tvrdenie. Nech V je vektorový priestor so skalárnym súčinom. Potom pre ľubovoľné nenulové vektory x, y ∈ V platí: (a) ∢(x, y) = 0 ⇔ (∃ c ∈ R)(c > 0 & x = cy); (b) ∢(x, y) = π ⇔ (∃ c ∈ R)(c < 0 & x = cy); (c) ∢(x, y) = π/2 ⇔ x ⊥ y; (d) ∢(−x, −y) = ∢(x, y), ∢(−x, y) = ∢(x, −y) = π − ∢(x, y). Pokračujeme štyrmi poučkami klasickej analytickej geometrie. 13.3.3. Tvrdenie. Nech V je vektorový priestor so skalárnym súčinom. Potom pre ľubovoľné nenulové vektory x, y ∈ V platí: (a) (kosinová veta) x + y 2 = x 2 + y 2 + 2 x y cos ∢(x, y), x − y 2 = x 2 + y 2 − 2 x y cos ∢(x, y); (b) (Pytagorova veta) x ⊥ y ⇒ x + y 2 = x − y 2 = x 2 + y 2 ; 13. EUKLIDOVSKÉ PRIESTORY 7 (c) (pravidlo rovnobežníka) x + y 2 + x − y 2 = 2 x 2 + y 2 ; (d) (uhlopriečky kosoštvorca sú na seba kolmé) x = y ⇒ x + y ⊥ x − y. (Samozrejme, tvrdenia (b), (c), (d) platia aj bez predpokladu nenulovosti vektorov x, y – vidno to i z nášho dôkazu.) Dôkaz. (a) Ako sme ukázali v dôkaze tvrdenia 13.3.1, pre ľubovoľné x, y ∈ V máme x + y 2 = x 2 + y 2 + 2 x, y . Z toho už okamžite vyplýva prvá podoba kosinovej vety; jej druhú podobu dostaneme z prvej na základe 13.3.2 (d). (b) Pytagorova veta je zvláštnym prípadom kosinovej vety. (c) Pravidlo rovnobežníka dostaneme sčítaním oboch verzií kosinovej vety. (d) priamo vyplýva z identity x + y, x − y = x 2 − y 2 . 13.4. Ortogonálne a ortonormálne bázy Usporiadaná k-tica α = (u1, . . . , uk) vektorov z vektorového priestoru so skalárnym súčinom V , sa nazýva ortogonálna, ak ui ⊥ uj pre všetky 1 ≤ i < j ≤ k. Voľne tiež hovoríme, že vektory u1, . . . , uk sú (navzájom) ortogonálne alebo kolmé. Usporiadaná k-tica (u1, . . . , uk) sa nazýva ortonormálna, ak je ortogonálna a ui = 1 pre všetky i ≤ k. Taktiež hovoríme, že vektory u1, . . . , uk tvoria ortonormálny systém. Podobne možno definovať pojmy ortogonálnosti a ortonormálnosti aj pre nekonečné postupnosti (uk)∞ k=0 vektorov z V , prípadne pre množiny X ⊆ V . Nasledujúce tvrdenie je bezprostredným dôsledkom našich definícií. 13.4.1. Tvrdenie. Nech V je vektorový priestor so skalárnym súčinom. Potom pre ľubovoľnú k-ticu α = (u1, . . . , uk) ∈ V k platí: (a) α je ortogonálna práve vtedy, keď jej Gramova matica G(α) je diagonálna; (b) α je ortonormálna práve vtedy, keď G(α) = Ik. Z posledného tvrdenia a dôsledku 13.2.2 priamo vyplýva 13.4.2. Dôsledok. Ak u1, . . . , uk ∈ V sú navzájom kolmé nenulové vektory, špeciálne, ak u1, . . . , uk tvoria ortonormálny systém, tak sú lineárne nezávislé. V priestore Rn so štandardným skalárnym súčinom kanonická báza ε = (e1, . . . , en) je zrejme ortonormálna a v zhode s posledným dôsledkom možno ľahko nahliadnuť rovnosť G(ε) = In. Ortogonálne a ortonormálne bázy však existujú v ľubovoľných euklidovských priestoroch. 13.4.3. Veta. Každý euklidovský priestor má ortonormálnu bázu. Dôkaz. Nech V je euklidovský priestor. Keďže skalárny súčin je kladne definitná, symetrická bilineárna forma na konečnorozmernom reálnom priestore V , na základe vety 11.3.5, dôsledku 12.1.3 a tvrdenia 12.2.1 existuje taká báza β priestoru V , 8 PAVOL ZLATOŠ: LINEÁRNA ALGEBRA A GEOMETRIA vzhľadom na ktorú má tento súčin jednotkovú maticu. Inak povedané, G(β) = In, čiže β je ortonormálna báza. Nasledujúce tvrdenie zhŕňa niekoľko užitočných vlastností ortonormálnych báz v euklidovskom priestore. Podmienka (c), rovnako ako istý jej nekonečnorozmerný variant, sa nazýva Parsevalova rovnosť. 13.4.4. Tvrdenie. Nech α = (u1, . . . , un) je ortonormálna báza euklidovského priestoru V . Potom pre ľubovoné vektory x, y ∈ V platí: (a) x = n i=1 x, ui ui, t. j. (x)α = x, u1 , . . . , x, un T ; (b) x, y = n i=1 x, ui ui, y ; (c) x 2 = n i=1 x, ui 2 . Dôkaz. (a) Keďže α je báza, x možno vyjadriť v tvare x = n i=1 ciui pre jednoznačne určené koeficienty c1, . . . , cn. Z ortonormálnosti vektorov u1, . . . , un vyplýva x, uj = n i=1 ci ui, uj = ci pre každé 1 ≤ j ≤ n. (b) Ak α je ortonormálna báza, tak matica skalárneho súčinu vzhľadom na bázu α je G(α) = In. Preto x, y = (x)T α · (y)α pre všetky x, y ∈ V . Potrebný záver vyplýva z (a). (c) je špeciálnym prípadom (b). Pre istotu ešte si ešte raz zopakujme, čo vyplýva z tvrdenia 13.4.1, vety 13.4.3 a tvrdenia 13.4.4: V ľubovoľnom n-rozmernom euklidovskom priestore V skalárny súčin vektorov x, y ∈ V splýva so štandardným skalárnym súčinom v Rn x, y = n i=1 xiyi = (x)α · (y)α ich súradníc (x)α = (x1, . . . , xn)T , (y)α = (y1, . . . , yn)T vzhľadom na ľubovoľnú ortonormálnu bázu α = (u1, . . . , un) priestoru V . Podmienka (a) posledného tvrdenia nám navyše udáva explicitný tvar týchto súradníc: xi = x, ui , yi = y, ui . Teraz popíšeme algoritmus, ktorý umožňuje zostrojiť ortonormálne bázy, známy ako Gramov-Schmidtov ortogonalizačný proces. Nech V je vektorový priestor so skalárnym súčinom a u1, . . . , un ∈ V sú lineárne nezávisle vektory. Chceme zostrojiť ortogonálne vektory v1, . . . , vn tak, aby pre každé k ≤ n platilo [v1, . . . , vk] = [u1, . . . , uk]. Ak položíme v1 = u1, tak samozrejme [v1] = [u1]. Vektor v2 ∈ [u1, u2] = [v1, u2] budeme hľadať v tvare v2 = av1 + bu2, kde a, b ∈ R. Ak má však platiť [v1, v2] = [u1, u2], musí byť b = 0. To najjednoduchšie dosiahneme voľbou b = 1. Navyše vektor v2 = u2 + av1 má byť kolmý na vektor v1, t. j. 0 = v2, v1 = u2, v1 + a v1, v1 . 13. EUKLIDOVSKÉ PRIESTORY 9 Odtiaľ dostávame a = − u2, v1 v1, v1 . Predpokladajme, že 2 ≤ k ≤ n a už sme zostrojili ortogonálne vektory v1, . . . , vk−1 také, že pre každé 1 ≤ i ≤ k − 1 platí [v1, . . . , vi] = [u1, . . . , ui]. Poučení prípadom k = 2 budeme vektor vk ∈ [u1, . . . , uk−1, uk] = [v1, . . . , vk−1, uk] hľadať v tvare vk = uk + a1v1 + · · · + ak−1vk−1, kde a1, . . . , ak−1 ∈ R. Navyše vektor vk musí byť kolmý na každý z vektorov vi pre 1 ≤ i ≤ k − 1, čiže 0 = vk, vi = uk, vi + k−1 j=1 aj vj, vi = uk, vi + ai vi, vi , lebo podľa nášho predpokladu vj, vi = 0 pre j = i. Z toho dôvodu ai = − uk, vi vi, vi . Tým sme dokázali nasledujúcu vetu. 13.4.5. Veta. Nech V je vektorový priestor so skalárnym súčinom a u1, . . . , un ∈ V sú lineárne nezávisle vektory. Vektory v1, . . . , vn ∈ V definujeme rekurziou: v1 = u1 a vk = uk − k−1 i=1 uk, vi vi, vi vi, pre 1 < k ≤ n. Potom v1, . . . , vn sú ortogonálne vektory a pre každé 1 ≤ k ≤ n platí [v1, . . . , vk] = [u1, . . . , uk]. Špeciálne, ak u1, . . . , un je báza priestoru V , tak v1, . . . , vn je ortogonálna báza priestoru V ; potom vektory v1 −1 v1, . . . , vn −1 vn tvoria ortonormálnu bázu priestoru V . Poznámka. Gramov-Schmidtov ortogonalizačný proces funguje aj pre nekonečné postupnosti (uk)∞ k=0 lineárne nezávislých vektorov v nekonečnorozmernom vektorovom priestore so skalárnym súčinom V . Rekurziou cez množinu všetkých prirodzených čísel v0 = u0 a vk = uk − k−1 i=0 uk, vi vi, vi vi, pre k > 0, je i v tomto prípade definovaná ortogonálna postupnosť (vk)∞ k=0 taká, že [v0, . . . , vk] = [u0, . . . , uk] pre každé k ∈ N. Z toho už vyplýva lineárna nezávislosť postupnosti (vk)∞ k=0. Ak (uk)∞ k=0 bola bázou V , tak (vk)∞ k=0 je ortogonálna a vk −1 vk ∞ k=0 ortonormálna báza vo V . 10 PAVOL ZLATOŠ: LINEÁRNA ALGEBRA A GEOMETRIA 13.4.6. Príklad. Na základe Sylvestrovho kritéria (veta 12.2.4) ľahko nahliadneme, že symetrická matica A =   2 1 −1 1 2 0 −1 0 3   ∈ R3×3 je kladne definitná. To znamená, že predpisom x, y = xT · A · y je definovaný skalárny súčin na (stĺpcovom) priestore R3 . Aplikáciou GramovhoSchmidtovho ortogonalizačného procesu na kanonickú bázu (e1, e2, e3) zostrojíme ortogonálnu bázu (v1, v2, v3) priestoru R3 s uvedeným skalárnym súčinom: v1 = e1 = (1, 0, 0)T , v2 = e2 − e2, v1 v1, v1 v1 = e2 − 1 2 v1 = (−1/2, 1, 0)T , v3 = e3 − e3, v1 v1, v1 v1 − e3, v2 v2, v2 v2 = e3 + 1 2 v1 − 1 3 v2 = (2/3, −1/3, 1)T , keďže e2, v1 = 1, v1, v1 = 2, e3, v1 = −1, e3, v2 = 1/2 a v2, v2 = 3/2. Ak ešte dopočítame v3, v3 = 7/3, dostaneme dĺžky jednotlivých vektorov v1 = √ 2, v2 = 3/2, v3 = 7/3. Príslušná ortonormálna báza je potom tvorená vektormi 1 √ 2 v1 = 1 √ 2   1 0 0   , 2 3 v2 = 1 √ 6   −1 2 0   , 3 7 v3 = 1 √ 21   2 −1 3   . 13.4.7. Príklad. Na vektorovom priestore R[x] všetkých reálnych polynómov v premennej x je daný skalárny súčin f, g = 1 −1 f(x)g(x) dx (pozri príklad 13.1.2). Postupnosť (xn )∞ n=0 všetkých mocnín premennej x tvorí bázu v R[x]. Gramovou-Schmidtovou metódou z nej zostrojíme ortogonálnu bázu Ln(x) ∞ n=0 priestoru R[x] – jej prvky sa niekedy nazývajú Legendreove polynómy. Ak si uvedomíme, že xm , xn = 1 −1 xm xn dx = xm+n+1 m + n + 1 1 −1 = 2 m+n+1 , ak m + n je párne, 0, ak m + n je nepárne, postupne dostaneme L0(x) = 1, L1(x) = x − x, L0 L0, L0 L0(x) = x, L2(x) = x2 − x2 , L0 L0, L0 L0(x) − x2 , L1 L1, L1 L1(x) = x2 − 1 3 , L3(x) = x3 − x3 , L0 L0, L0 L0(x) − x3 , L1 L1, L1 L1(x) − x3 , L2 L2, L2 L2(x) = x3 − 3 5 x, 13. EUKLIDOVSKÉ PRIESTORY 11 atď. Vidíme, že Ln(x) = xn − . . . je polynóm n-tého stupňa, ktorý pre párne n obsahuje len párne mocniny premennej x a pre nepárne n len nepárne mocniny x. S trochou námahy možno odvodiť explicitné vyjadrenie Ln(x) = n! (2n)! dn dxn (x2 − 1)n . V literatúre sa Legendreovými polynómami zvyčajne nazývajú násobky Pn(x) = 1 2n 2n n Ln(x) = 1 2nn! dn dxn (x2 − 1)n polynómov Ln(x), normované tak, aby pre každé n platilo Pn(1) = 1. Gramovu-Schmidtovu ortogonalizáciu možno alternatívne vykonať len vhodnými úpravami istých matíc. Ak α = (u1, . . . , un) je lineárne nezávislá n-tica vektorov v priestore so skalárnym súčinom V , tak podľa tvrdenia 13.2.1 (b) jej Gramova matica G(α) je kladne definitná a je to matica skalárneho súčinu zúženého na lineárny podpriestor S = [u1, . . . , un] ⊆ V v báze α. Podľa vety 12.2.3 ju možno výlučne úpravami typu (1+ ) upraviť na diagonálny tvar D = diag(d1, . . . , dn) s kladnými prvkami na diagonále. Elementárne stĺpcové operácie zodpovedajúce týmto úpravám postupne vykonané na matici In nás privedú k hornej trojuholníkovej matici P = (pij) ∈ Rn×n s jednotkami na diagonále, t. j. pii = 1 a pij = 0 pre každé i ≤ n a j < i. Ak položíme α · P = β = (v1, . . . , vn), tak P = Pα,β, t. j. P je maticou prechodu z bázy β do bázy α (pozri paragraf 7.5). Potom D je maticou skalárneho súčinu zúženého na podpriestor S v báze β, teda G(β) = D, takže β je ortogonálna báza S. Navyše, vzhľadom na tvar matice P , platí v1 = u1 a vk = uk + k−1 i=1 pikui, pre 1 < k ≤ n, z čoho možno ľahko nahliadnuť rovnosti [v1, . . . , vk] = [u1, . . . , uk] pre všetky k ≤ n. Taktiež normy vektorov vk si možno prečítať priamo z matice D. Platí totiž dk = vk 2 pre každé k ≤ n. Teda príslušná ortonormálna báza je tvorená vektormi (1/ √ d1)v1, . . . , (1/ √ dn)vn. Tento posledný krok možno samozrejme realizovať úpravami typu (4) matice G(β) a príslušnými ESO na matici P (pozri paragraf 11.3). Ak V = Rm s akýmkoľvek (t. j. nie nutne štandardným skalárnym súčinom), tak po stotožnení bázy α s maticou, ktorej stĺpce sú vektory tejto bázy, možno k báze β dospieť priamo (t. j. bez matice P ), vykonaním príslušných ESO na matici α. 12 PAVOL ZLATOŠ: LINEÁRNA ALGEBRA A GEOMETRIA 13.4.8. Príklad. Prepočítajme si ešte raz príklad 13.4.6 práve opísanou metódou. Uvedená matica A je zároveň Gramovou maticou G(ε). Najprv pomocou prvku na mieste (1, 1) vynulujeme ostatné prvky prvého riadku i stĺpca. Potom pomocou prvku na mieste (2, 2) vynulujeme prvky na miestach (2, 3) a (3, 2): G(ε) =   2 1 −1 1 2 0 −1 0 3   ≡   2 0 0 0 3/2 1/2 0 1/2 5/2   ≡   2 0 0 0 3/2 0 0 0 7/3   = G(β). Zrejme šlo o úpravy typu (1+ ). Vykonaním príslušných ESO na jednotkovej matici dostaneme I3 =   1 0 0 0 1 0 0 0 1   ≀   1 −1/2 1/2 0 1 0 0 0 1   ≀   1 −1/2 2/3 0 1 −1/3 0 0 1   = β. Čitateľ by si mal samostatne premyslieť detaily výpočtu. Vidíme, že výsledné matice sa presne zhodujú s výsledkom príkladu 13.4.6. 13.4.9. Príklad. Vráťme sa ešte k príkladu 13.4.7. Bez podrobnejšieho komentára zortogonalizujeme systém (1, x, x2 , x3 ) prvých štyroch mocnín x v R[x]. Postupnými úpravami typu (1+ ) Gramovej matice G(1, x, x2 , x3 ) dostaneme G(1, x, x2 , x3 ) =    2 0 2/3 0 0 2/3 0 2/5 2/3 0 2/5 0 0 2/5 0 2/7    ≡    2 0 0 0 0 2/3 0 2/5 0 0 8/45 0 0 2/5 0 2/7    ≡    2 0 0 0 0 2/3 0 0 0 0 8/45 0 0 0 0 8/175    = G(L0, L1, L2, L3). Príslušné ESO vykonané na jednotkovej matici dávajú I4 =    1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1    ≀    1 0 −1/3 0 0 1 0 0 0 0 1 0 0 0 0 1    ≀    1 0 −1/3 0 0 1 0 −3/5 0 0 1 0 0 0 0 1    = P . Potom (L0, L1, L2, L3) = 1, x, x2 , x3 · P = 1, x, − 1 3 + x2 , − 3 5 x + x3 , rovnako ako v príklade 13.4.7. Pohľad na maticu G(L0, L1, L2, L3) nám navyše prezradí normy polynómov Ln(x) pre n ≤ 3: L0 = √ 2, L1 = 2 3 , L2 = 8 45 = 2 3 2 5 , L3 = 8 175 = 2 5 2 7 . Pre normy Legendreových polynómov Pn(x), n ≤ 3, z toho vyplýva P0 = √ 2, P1 = 2 3 , P2 = 2 5 , P3 = 2 7 . 13. EUKLIDOVSKÉ PRIESTORY 13 13.4.10. Príklad. V euklidovskom priestore R4 so štandardným skalárnym súčinom je daný lineárny podpriestor S generovaný stĺpcami matice α =    0 1 −1 1 1 2 −1 1 0 1 1 0    . Nájdeme nejakú ortonormálnu bázu podpriestoru S. Zrejme stĺpce matice α sú lineárne nezávislé, teda α je bázou S. Jej Gramovu maticu G(α) = αT · α upravíme pomocou úprav typu (1+ ) na s ňou kongruentný diagonálny tvar G(α) =   3 1 2 1 4 1 2 1 3   ≡   3 0 0 0 11/3 1/3 0 1/3 11/3   ≡   3 0 0 0 11/3 0 0 0 40/11   = G(β). Príslušnými ESO na matici α dostaneme α =    0 1 −1 1 1 2 −1 1 0 1 1 0    ≀    0 1 −1 1 2/3 4/3 −1 4/3 2/3 1 2/3 −2/3    ≀    0 1 −12/11 1 2/3 14/11 −1 4/3 6/11 1 2/3 −8/11    = β. Ortonormálna báza podpriestoru S je potom tvorená stĺpcami matice β vynásobenými prevrátenými hodnotami druhých odmocnín príslušných diagonálnych prvkov matice G(β), teda vektormi 1 √ 3    0 1 −1 1    , 3 11    1 2/3 4/3 2/3    = 1 √ 33    3 2 4 2    , 11 40    −12/11 14/11 6/11 −8/11    = 1 √ 110    −6 7 3 −4    . 13.5. Ortogonálne matice Videli sme, že z vyjadrenia súradníc vektorov v euklidovských priestoroch vzhľadom na ortonormálne bázy vyplývajú dodatočné výhody, aké nám bázy, ktoré nespĺňajú túto podmienku, neposkytujú. Bude preto zaujímavé preskúmať, ako vyzerajú matice prechodu medzi takýmito bázami. Odpoveď na naznačenú otázku je prekvapivo jednoduchá. Matica A ∈ Rn×n sa nazýva ortogonálna, ak platí AT · A = In, alebo, čo je to isté, A−1 = AT . Uvedomme si, že prvá podmienka vlastne hovorí, že stĺpce matice A tvoria ortonormálnu bázu euklidovského priestoru Rn so štandardným skalárnym súčinom. Potom tiež platí A·AT = In, teda takisto riadky matice A tvoria ortonormálnu bázu v Rn . Z tých dôvodov by bolo vari priliehavejšie nazývať takéto matice ortonormálnymi. Budeme sa však držať zaužívanej terminológie. 14 PAVOL ZLATOŠ: LINEÁRNA ALGEBRA A GEOMETRIA 13.5.1. Veta. Nech V je n-rozmerný euklidovský priestor, α je ortonormálna a β je ľubovoľná báza priestoru V . Potom báza β je ortonormálna práve vtedy, keď matica prechodu Pα,β z bázy β do bázy α je ortogonálna. Inak povedané, každá matica prechodu medzi ortonormálnymi bázami je ortogonálna, a tiež naopak, každá ortogonálna matica je maticou prechodu medzi ortonormálnymi bázami. Dôkaz. Označme α = (u1, . . . , un), β = (v1, . . . , vn) a P = Pα,β. Podľa definície matice prechodu z paragrafu 7.5 a tvrdenia 13.4.4 (a) pre i ≤ n platí si(P ) = (vi)α = vi, u1 , . . . , vi, un T , teda P = vi, uj n×n . Keďže báza α je ortonormálna, podľa tvrdenia 13.4.4 (b) má (i, k)-ty prvok matice P T · P tvar si(P )T · sk(P ) = n j=1 vi, uj uj, vk = vi, vk . Teda matica P je ortogonálna, t. j. P T · P = In, práve vtedy, keď vi, vk = δik pre všetky i, k ≤ n, t. j. práve vtedy, keď β je ortonormálna báza. Ortogonálne matice možno tiež charakterizovať ako matice, násobenie ktorými zachovávava štandardný skalárny súčin resp. euklidovskú dĺžku vektorov. 13.5.2. Veta. Nech Rn je stĺpcový euklidovský priestor so štandardným skalárnym súčinom a A ∈ Rn . Potom nasledujúce podmienky sú ekvivalentné: (i) A je ortogonálna matica; (ii) pre všetky x, y ∈ Rn platí A · x, A · y = x, y ; (iii) pre všetky x ∈ Rn platí A · x = x . Dôkaz. (i) ⇒ (ii) Nech A je ortogonálna a x, y ∈ Rn . Potom A · x, A · y = (A · x)T · (A · y) = xT · AT · A · y = xT · In · y = x, y . (ii) ⇒ (i) Z podmienky (ii) pre vektory x = ei, y = ej, kde i, j ≤ n, vyplýva si(A)T · sj(A) = si(A), sj(A) = A · ei, A · ej = ei, ej = δij, teda AT · A = In, čiže A je ortogonálna. (ii) ⇒ (iii) platí triviálne a (iii) ⇒ (ii) je dôsledkom rovnosti x, y = 1 2 x + y 2 − x 2 − y 2 . Podrobnejší popis štruktúry ortogonálnych matíc nám umožnia až niektoré ďalšie poznatky o spektrálnych vlastnostiach matíc a lineárnych zobrazení, ktoré si začneme zadovažovať počnúc kapitolou 18. Ortogonálne matice rádu n ≤ 2 však možno preskúmať celkom elementárnymi prostriedkami. Čísla ±1 sú zrejme jediné dve ortogonálne matice rozmeru 1 × 1. Prvý netriviálny prípad teda nastáva pre n = 2. 13. EUKLIDOVSKÉ PRIESTORY 15 13.5.3. Veta. Nech A ∈ R2×2 . Potom A je ortogonálna práve vtedy, keď je maticou rotácie okolo počiatku, t. j. A = cos α − sin α sin α cos α = Rα pre nejaké α ∈ R, alebo maticou osovej súmernosti podľa osi prechádzajúcej počiatkom, t. j. A = cos 2β sin 2β sin 2β − cos 2β = Sβ pre nejaké β ∈ R. Dôkaz. Nech A = a b c d . Potom AT · A = a c b d · a b c d = a2 + c2 ab + cd ba + dc b2 + d2 , teda podmienka AT · A = I2, je ekvivalentná s rovnosťami a2 + c2 = 1, ab + cd = 0, b2 + d2 = 1. Prvá z nich je ekvivalentná s existenciou α ∈ R takého, že a = cos α, c = sin α, a tretia s existenciou β ∈ R takého, že b = sin β, d = cos β. Podľa druhej rovnice musí pre ne platiť cos α sin β + sin α cos β = sin(α + β) = 0, t. j. α + β = kπ, kde k ∈ Z. Pre k párne z toho dostávame b = sin β = − sin α, d = cos β = cos α, teda A má tvar A = cos α − sin α sin α cos α = Rα. Pre k nepárne máme b = sin β = sin α, d = cos β = − cos α, čo vedie na maticu tvaru A = cos α sin α sin α − cos α = Sα/2. Substitúciou (teraz už iného) β = α/2 dostávame tvar uvedený v znení vety.