14. ORTOGONÁLNE PROJEKCIE A PODPRIESTORY V tejto kapitole budeme pokračovať v štúdiu euklidovských priestorov s cieľom po- dať kvantitatívny popis vzájomnej polohy afinných podpriestorov v takomto priestore pomocou dvoch základných parametrov ­ ich vzdialenosti a odchýlky (uhla). Našim hlavným nástrojom pri tom budú lineárne operátory kolmého priemetu, zvané tiež ortogonálne projekcie, vektorov do lineárnych podpriestorov. V druhej časti kapitoly predvedieme tri aplikácie rozpracovaných pojmov a metód ­ využijeme ich jednak na zavedenie tzv. sférických súradníc v euklidovských priestoroch, jednak pri konštrukcii " najlepších približných riešení" neriešiteľných sústav lineárnych rovníc a lineárnej re- gresii, a napokon sa oboznámime s formuláciu základných pojmov teórie pravdepodob- nosti v jazyku euklidovských priestorov. 14.1. Ortokomplement a ortogonálna projekcia Relácia ortogonality (kolmosti) vo vektorovom priestore so skalárnym súčinom má niekoľko zrejmých vlastností, ktoré tu zaznamenáme bez dôkazu. 14.1.1. Tvrdenie. Nech V je vektorový priestor so skalárnym súčinom. Potom pre ľubovoľné x, y, z V , c, d R platí: (a) x 0; (b) x x x = 0; (c) x y y x; (d) x y & x z x (cy + dz). Ortogonálnym doplnkom alebo tiež ortokomplementom ľubovoľnej množiny X V vo vektorovom priestore so skalárnym súčinom nazveme množinu X = {y V ; ( x X)(x y)} všetkých vektorov y V kolmých na každý vektor x X. 14.1.2. Tvrdenie. Nech V je vektorový priestor so skalárnym súčinom. Potom pre ľubovoľné množiny X, Y V platí: (a) = {0} = V , V = {0}; (b) X = [X] = [X ]; (c) X Y Y X ; (d) X X ; (e) X = X ; (f) X X = {0}, ak 0 X, a X X = , ak 0 / X; (g) (X Y ) = (X + Y ) = X Y . Dôkaz. Jednotlivé podmienky sú priamymi dôsledkami predošlého tvrdenia, ich jed- noduché dôkazy preto prenechávame ako cvičenie čitateľovi. Na ukážku predvedieme, 1 2 PAVOL ZLATOŠ: LINEÁRNA ALGEBRA A GEOMETRIA ako vyplýva (e) z podmienok (c) a (d). Podľa (d) platí X X , z čoho podľa (c) vyplýva X X . Obrátená inklúzia X X je opäť dôsledkom (d). Z podmienky (b) okrem iného vyplýva, že X je lineárnym podpriestorom vo V pre každú podmnožinu X V . Nech S V je lineárny podpriestor priestoru so skalárnym súčinom V a x V . Hovoríme, že vektor z S je kolmým priemetom alebo tiež ortogonálnou projekciou vektora x do podpriestoru S, ak x - z S . Tento vektor (ak existuje) budeme značiť z = prS(x) = xS. 14.1.3. Veta. Nech V je vektorový priestor so skalárnym súčinom, S V je jeho konečnorozmerný lineárny podpriestor a x V . Potom (a) kolmý priemet vektora x do podpriestoru S existuje a je jednoznačne určený rovnosťou prS(x) = xS = k i=1 x, ui ui, kde (u1, . . . , uk) je ľubovoľná ortonormálna báza podpriestoru S; (b) pre ľubovoľný vektor y S platí x - xS x - y pričom rovnosť nastane práve vtedy, keď y = xS; (c) ak x = 0 a S = {0}, tak pre ľubovoľný vektor 0 = y S platí xS x | x, y | x y , pričom rovnosť nastane práve vtedy, keď vektory xS, y sú lineárne závislé. Dôkaz. (a) Nech (u1, . . . , uk) je ľubovoľná ortonormálna báza podpriestoru S. Ak má kolmý priemet vektora x do S existovať, musí mať tvar xS = c1u1 + . . . + ckuk pre nejaké c1, . . . , ck R. Podmienka x - xS S je podľa predchádzajúceho tvrdenia ekvivalentná s konjunkciou podmienok x - xS ui pre každé i k. Z toho vyplýva 0 = x - xS, ui = x, ui - k j=1 ci uj, ui = x, ui - ci, teda lineárna kombinácia c1u1 +. . .+ckuk je kolmým priemetom x do S práve vtedy, keď ci = x, ui , pre každé i. (b) Nech y S. Potom tiež y - xS S, teda (x - xS) (y - xS). Podľa Pytagorovej vety platí x - y 2 = (x - xS) + (y - xS) 2 = x - xS 2 + y - xS 2 x - xS 2 , pričom rovnosť nastane práve vtedy, keď y = xS. (c) Pre y S máme (x - xS) y, preto x, y = xS, y + x - xS, y = xS, y . Ak y = 0, tak s použitím Cauchyho-Schwartzovej nerovnosti z toho dostávame | x, y | x y = | xS, y | x y xS y x y = xS x . Rovnosť zrejme nastane práve vtedy, keď vektory xS, y sú lineárne závislé. Podmienka (a) práve dokázanej vety má nasledujúci dôsledok. 14. ORTOGONÁLNE PROJEKCIE A PODPRIESTORY 3 14.1.4. Dôsledok. Nech V je vektorový priestor so skalárnym súčinom a S, T V sú jeho konečnorozmerné lineárne podpriestory. Potom (a) S = S , (S T) = S + T a V = S S ; (b) prS : V V je lineárny operátor; (c) ( x V )(x S prS(x) = x); (d) Im prS = S a Ker prS = S ; (e) x - xS je kolmým priemetom vektora x do podpriestoru S . Lineárny operátor prS nazývame ortogonálnou projekciou na podpriestor S. Poznámka. Ak V je euklidovský priestor, tak veta 14.1.3 a dôsledok 14.1.4 samo- zrejme platia pre ľubovoľný podpriestor S V . Za istých okolností, ktorých roz- bor však presahuje rámec lineárnej algebry (tzv. úplnosť priestoru V a uzavretosť podpriestoru S), spomínané výsledky platia aj pre nekonečnorozmerné podpriestory. V cvičeniach uvedieme príklad vektorového priestoru so skalárnym súčinom V a jeho nekonečnorozmerného podpriestoru S = V takého, že S = {0}. Potom pre žiaden vektor x V S nemôže existovať jeho kolmý priemet do S; rovnako SS = S = V . x xS x - xS S Predpokladajme, že kolmý priemet vektora x do lineárneho podpriestoru S existu- je. Vysvetlíme si, ako možno za tohto predpokladu definovať vzdialenosť aj odchýlku vektora x od každého z podpriestorov S, S . Situácia je znázornená na obrázku. Vektor x - xS je kolmý na každú priamku v podpriestore S, špeciálne trojuholník tvorený vektormi x, xS, x-xS je pravouhlý, s pravým uhlom pri " konci" vektora xS. Podmienka (b) vety 14.1.3 nás oprávňuje nazvať dĺžku vektora x-xS vzdialenosťou vektora x od podpriestoru S. Budeme ju značiť dist(x, S) = x - xS = min{ x - y ; y S}. Vzhľadom na podmienku (e) dôsledku 14.1.4 je vzdialenosť (anglicky distance) vek- tora x od podpriestoru S daná vzťahom dist x, S = xS . 4 PAVOL ZLATOŠ: LINEÁRNA ALGEBRA A GEOMETRIA Podobne, keďže kosinus je na intervale 0, klesajúca funkcia, podmienka (c) vety 14.1.3 nás oprávňuje nazvať výraz (x, S) = arccos xS x = min{(x, y); 0 = y S} odchýlkou vektora x = 0 od podpriestoru S = {0}, prípadne uhlom vektora x a podpriestoru S. Odchýlka (x, S) je teda jednoznačne určená ako také reálne číslo 0, /2 , pre ktoré platí cos = xS x , alebo ekvivalentne, sin = x - xS x . Zrejme opäť ide o neorientovaný uhol. Ak xS = 0, tak (x, S) = (x, xS); ak xS = 0, t. j. ak x S , tak samozrejme (x, S) = /2. Ešte si všimnite, že zatiaľ čo uhol dvoch vektorov nadobúda hodnoty z intervalu 0, , hodnoty, ktoré nadobúda uhol vektora a podpriestoru, sú obmedzené na interval 0, /2 . Vzhľadom na podmienku 14.1.3 (e), ak S = {0}, tak odchýlka vektora x = 0 od podpriestoru S je daná vzťahom x, S = arccos x - xS x = arcsin xS x . Konečne časť (a) vety 14.1.3 nám dáva priamy návod, ako nájsť kolmý priemet vek- tora x do konečnorozmerného podpriestoru S V , a tým aj vzdialenosti dist(x, S), dist x, S a odchýlky (x, S), x, S ­ potrebujeme však poznať aspoň jednu ortonormálnu bázu v S. Ak máme k dispozícii len nejakú " obyčajnú" bázu pod- priestoru S, je potrebné ju najprv ortonormalizovať, až potom možno použiť spomí- naný vzorec. Diagonalizáciu Gramovej matice si však môžeme odpustiť, rovnaký výsle- dok sa totiž z nej dá získať aj priamo. 14.1.5. Tvrdenie. Nech V je vektorový priestor so skalárnym súčinom, S je jeho konečnorozmerný lineárny podpriestor s bázou = (u1, . . . , uk) a x V . Potom pre c = (c1, . . . , ck)T Rk platí xS = c1u1 + . . . + ckuk práve vtedy, keď c je riešením sústavy lineárnych rovníc G() c = x, T , kde x, označuje riadkový vektor x, u1 , . . . , x, uk Rk . Dôkaz. Pre c = (c1, . . . , ck)T Rk platí xS = c1u1 + . . . + ckuk práve vtedy, keď pre každé i k máme 0 = x - c1u1 + . . . + ckuk, ui = x, ui - c1 u1, ui - . . . - ck uk, ui . Inými slovami, c musí vyhovovať sústave G()T c = x, T . Ale G()T = G() vzhľadom na symetriu Gramovej matice. Vďaka regularite matice G() ( je báza S) má táto sústava jediné riešenie. 14. ORTOGONÁLNE PROJEKCIE A PODPRIESTORY 5 Ešte si všimnime, že rozšírená matica G() | x, T uvedenej sústavy je vlastne Gramovou maticou G(u1, . . . , uk, x) rádu k + 1, z ktorej sme vynechali posledný riadok. Ak je ortonormálna báza, tak G() = Ik, t. j. príslušná sústava je už vo vyriešenom tvare c = x, T , presne v zhode s podmienkou (a) vety 14.1.3. Poznámka. Tvrdenie zostáva bezo zmeny v platnosti, aj keď je ľubovoľný konečný (teda nie nutne lineárne nezávislý) systém generátorov v S. Jediné, čo sa zmení, je nejednoznačnosť vyjadrenia kolmého priemetu xS = c1u1 + . . . + ckuk ako lineárnej kombinácie vektorov systému . Samotný kolmý priemet xS je, samozrejme, určený jednoznačne. Rozmyslite si, prečo je to tak. 14.1.6. Príklad. V R4 so štandardným skalárnym súčinom je daný vektor x = (1, 1, 1, 1)T a rovina S = [u, v], kde u = (0, -1, 0, 1)T , v = (1, -2, 1, -3)T . Nájdeme kolmý priemet vektora x do roviny S a vypočítame vzdialenosť dist(x, S) a odchýlku (x, S). Kolmý priemet budeme hľadať v tvare xS = cu + dv, kde (c, d)T R2 vyhovuje sústave s rozšírenou maticou u, u v, u u, v v, v x, u x, v = 2 -1 -1 15 0 -3 . Jej riešením dostaneme c = -3/29, d = -6/29, teda kolmý priemet vektora x do roviny [u, v] je xS = (u, v) c d = 0 1 -1 -2 0 1 1 -3 -3/29 -6/29 = 3 29 -2 5 -2 5 . Ako skúšku správnosti si overte rovnosti x-xS, u = x-xS, v = 0. Pre vzdialenosť resp. odchýlku x od S potom dostávame dist(x, S) = x - xS = 7 29 (5, 2, 5, 2)T = 7 29 58, sin (x, S) = x - xS x = 7 229 58 = 7 58 . S požitím kalkulačky možno zistiť (x, S) = arcsin 7 58 1, 1659 rad 66 48 5 . 14.1.7. Príklad. Nech A Rm×n , pričom m n a h(A) = n, t. j. stĺpce matice A sú lineárne nezávislé vektory v euklidovskom priestore Rm so štandardným skalárnym súčinom. Označme S Rm lineárny podpriestor generovaný stĺpcami matice A. Potom ortogonálna projekcia na podpriestor S je lineárny operátor prS : Rm Rm . Nájdeme jeho maticu B = prS , Rm×m vzhľadom na kanonickú ortonormálnu bázu priestoru Rm . 6 PAVOL ZLATOŠ: LINEÁRNA ALGEBRA A GEOMETRIA Ak stotožníme maticu A s usporiadanou n-ticou jej stĺpcov, tak A je bázou S. Podľa tvrdenia 14.1.5 obraz y = prS(x) vektora x Rm dostaneme v tvare y = A c, kde c Rn je (jediné) riešenie sústavy G(A) c = x, A T . Uvedomme si, že G(A) = AT A je regulárna matica. Ďalej platí x, A = xT A, čiže x, A T = AT x. Z toho dostávame c = G(A)-1 x, A T = AT A -1 AT x, y = A c = A AT A -1 AT x. Teda hľadaná matica ortogonálnej projekcie prS je B = prS , = A AT A -1 AT . 14.2. Vzdialenosť dvoch afinných podpriestorov Nech V je vektorový priestor so skalárnym súčinom a X, Y sú jeho dve neprázdne podmnožiny. Vzdialenosťou množín X, Y vo V nazývame číslo dist(X, Y ) = inf{ x - y ; x X & y Y }. Problematikou vzdialeností množín v plnom rozsahu sa tu zaoberať nebudeme. Ob- medzíme sa len na vzdialenosti konečnorozmerných afinných podpriestorov. Úlohu prevedieme na určenie vzdialenosti vektora od lineárneho podpriestoru. 14.2.1. Lema. Nech V je vektorový priestor so skalárnym súčinom a M, N sú jeho afinné podpriestory. Potom pre ľubovoľné body p M, q M platí: dist(M, N) = dist(p - q, Dir M + Dir N). Dôkaz. Označme S = Dir M, T = Dir N zamerania podpriestrov M, N. Potom M = p + S, N = q + T. Podľa definície vzdialenosti platí dist(M, N) = inf (p + u) - (q + v) ; u S & v T , dist(p - q, S + T) = inf (p - q) - (u + v) ; u S & v T . Stačí teda overiť rovnosť množín na pravých stranách. Túto jednoduchú úlohu prene- chávame ako cvičenie čitateľovi. Hovoríme, že body p M, q N tvoria priečku afinných podpriestorov M, N, ak dist(M, N) = p - q , t. j. ak sa vzdialenosť podpriestorov M, N realizuje ako dĺžka vektora p - q. 14. ORTOGONÁLNE PROJEKCIE A PODPRIESTORY 7 14.2.2. Tvrdenie. Nech M, N sú konečnorozmerné afinné podpriestory vektorového priestoru so skalárnym súčinom V . Potom (a) body p M, q N tvoria priečku podpriestorov M, N práve vtedy, keď p-q (Dir M + Dir N) ; (b) pre ľubovoľné body p M, q N a vektory u Dir M, v Dir N platí: body p + u, q + v tvoria priečku podpriestorov M, N práve vtedy, keď vektor v - u je kolmým priemetom vektora p - q do lineárneho podpriestoru Dir M + Dir N; (c) existujú body p M, q N tvoriace priečku podpriestorov M, N. Dôkaz. (a) je bezprostredným dôsledkom vety 14.1.3 (b) a lemy 14.2.1; (b) priamo vyplýva z (a). Konečne (c) dostaneme z (b) a vety 14.1.3 (a). 14.2.3. Dôsledok. Pre konečnorozmerné afinné podpriestory M, N V vektorové- ho priestoru so skalárnym súčinom platí dist(M, N) = 0 práve vtedy, keď M N = . Podmienky 14.1.3 (a) a 14.2.2 (b) nám spolu s tvrdením 14.1.5 poskytujú priamy návod ako nájsť priečku a vzdialenosť ľubovoľných konečnorozmerných afinných pod- priestorov. Ak M = p + [u1, . . . , um], N = q + [v1, . . . , vn] sú zadané parametricky, stačí nájsť jedno riešenie c = (c1, . . . , cm, cm+1, . . . , cm+n)T Rm+n sústavy G() c = p - q, T , kde = (u1, . . . , um, v1, . . . , vn), a položiť u = c1u1 + . . . cmum, v = cm+1v1 + . . . + cm+nvn. Potom vektor w = u + v = c je kolmým priemetom vektora p - q do lineárneho podpriestoru Dir M + Dir N = [u1, . . . um, v1, . . . , vn] a priečka podpriestorov M, N je tvorená bodmi p - u, q + v. V dôsledku toho dist(M, N) = (p - u) - (q + v) = p - q - w . Rozmyslite si, prečo ­ napriek formulácii tvrdenia 14.1.5 ­ si nemusíme robiť starosti s lineárnou nezávislosťou vektorov u1, . . . , um, v1, . . . , vn. 14.2.4. Príklad. V euklidovskom priestore R4 so štandardným skalárnym súčinom nájdeme vzdialenosť rovín M = (1, 1, 2, -2)T + [e1 + e2, e1 + e2 + e3], N = (0, 0, 5, -1)T + [e2 + e4, e2 + e3 + e4]. Z príslušných skalárnych súčinov zostavíme (takmer Gramovu) rozšírenú maticu sús- tavy G() c = p - q, T a upravíme ju na redukovaný stupňovitý tvar 2 2 1 1 2 3 1 2 1 1 2 2 1 2 2 3 2 -1 0 -3 1 0 0 -1 0 1 0 1 0 0 1 1 0 0 0 0 13/3 -3 -2/3 0 . 8 PAVOL ZLATOŠ: LINEÁRNA ALGEBRA A GEOMETRIA So zreteľom na poslednú otázku si riešenie sústavy napíšeme vo všeobecnom tvare ct = (13/3 + t, -3 - t, -2/3 - t, t)T s parametrom t R. Položme ut = c1(e1 + e2) + c2(e1 + e2 + e3) = (4/3, 4/3, -3 - t, 0)T , vt = c3(e2 + e4) + c3(e2 + e3 + e4) = (0, -2/3, t, -2/3)T Potom pre každé t R dvojica bodov pt = (1, 1, 2, -2)T - ut = (-1/3, -1/3, 5 + t, -2)T qt = (0, 0, 5, -1)T + vt = (0, -2/3, 5 + t, -5/3)T tvorí priečku podpriestorov M, N. Vektory ut + vt = (4/3, 2/3, -3, -2/3)T , pt - qt = 1 3 (-1, 1, 0, -1)T však od parametra t nezávisia (a nie je to náhoda), rovnako ako vzdialenosť dist(M, N) = pt - qt = 1 3 . Pokiaľ by nás teda zaujímala len vzdialenosť podpriestorov M, N, prípadne by sme chceli nájsť len akúkoľvek ich jednu priečku, skutočne by stačilo použiť iba jedno riešenie c uvažovanej sústavy. Ešte si rozmyslite, ako zo získaných výsledkov vyplýva čiastočná rovnobežnosť podpriestorov M, N (pozri paragraf 8.4). 14.3. Odchýlka dvoch afinných podpriestorov Odchýlku alebo uhol dvoch netriviálnych konečnorozmerných afinných podpriestorov ve vektorovon priestrore so skalárnym súčinom V značíme (M, N) a definujeme ju ako odchýlku (Dir M, Dir N) ich zameraní. Stačí teda povedať, čo rozumieme pod odchýlkou alebo uhlom (S, T) dvoch netriválnych konečnorozmerných lineárnych podpriestorov S, T V . Pre S T alebo T S položíme (S, T) = 0. Ak S T = {0}, kladieme (S, T) = inf{(x, y); 0 = x S & 0 = y T}. Ak by sme takýmto spôsobom definovali odchýlku (S, T), aj keď S T = {0}, ľubovoľný spoločný nenulový vektor x S T by sa postaral o to, aby platilo (S, T) = (x, x) = 0, čo nevyzerá príliš rozumne. Preto pokiaľ S T = {0}, S T ani T S, položíme S1 = S (S T) , T1 = T (S T) . Zrejme S1, T1 V sú netriválne lineárne podpriestory a S1 T1 = {0} (za predpo- kladu S T = {0} dokonca platí S1 = S, T1 = T). Preto môžeme konečne definovať (S, T) = (S1, T1). Takto definovaný uhol podpriestorov S, T je číslo z intervalu 0, /2 a platí preň (S, T) = (T, S), teda je to neorientovaný uhol. Je užitočné si uvedomiť, že na výpočet odchýlky dvoch podpriestorov stačí mini- malizovať odchýlku vhodných vektorov z jedného podpriestoru od druhého z nich. 14. ORTOGONÁLNE PROJEKCIE A PODPRIESTORY 9 Tvrdenie 14.3.1. Nech V je vektorový priestor so skalárnym súčinom a S, T sú jeho konečnorozmerné lineárne podpriestory, pričom S T ani T S. Potom (S, T) = inf (x, T); 0 = x S (S T) . Dôkaz. Pre ľubovoľné x = 0 je xT T a x - xT T . Pre x S (S T) však platí xT = x - (x - xT ) (S T) + T = (S T) , lebo z inklúzie S T T podľa podmienky 14.1.2 (c) vyplýva T (S T) . Teda xT T (S T) , preto (S, T) je menšia alebo rovná, ako výraz na pravej strane. Keďže arccos je klesajúca funkcia, opačná nerovnosť je dôsledkom rovnosti (x, T) = arccos xT x -1 a vety 14.1.3 (c). Výpočet odchýlky dvoch všeobecných konečnorozmerných podpriestorov si teda vyžaduje minimalizovať hodnotu istého výrazu. To naznačuje možnosť jej výpočtu s použitím diferenciálneho počtu ako extrému funkcie viac premenných. Nebudeme sa však púšťať touto cestou, lebo neskôr hodláme predviesť elegantnejší spôsob vy- jadrenia odchýlky. Prostriedkami, ktoré máme zatiaľ k dispozícii, dokážeme zrátať len odchýlku ľubovoľného netriviálneho konečnorozmerného podpriestoru od priamky alebo nadroviny, prípadne odchýlky podpriestorov, ktoré možno na tieto prípady pre- viesť. Ako vyplýva z vety 14.1.3 (c), odchýlka priamky [x], kde x = 0, a konečnorozmer- ného lineárneho podpriestoru S = {0} je daná vzťahom [x], S = (x, S) = arccos xS x = (x, xS), ak xS = 0, t. j. ak x / S , /2, ak xS = 0, t. j. ak x S . Túto úlohu už vieme riešiť (pozri tvrdenie 14.1.5 a príklad 14.1.6). 14.3.2. Príklad. Vypočítame odchýlku rovín M, N R4 z príkladu 14.2.4. Podľa definície (M, N) = (S, T), kde S = [e1 +e2, e1 +e2 +e3], T = [e2 +e4, e2 +e3 +e4]. Ľahko nahliadneme, že S T = [e3], teda (S T) = [e1, e2, e4]. V dôsledku toho S1 = S (S T) = [e1 + e2], T1 = T (S T) = [e2 + e4]. Keďže e1 + e2, e2 + e4 = 1 0, (M, N) = (e1 + e2, e2 + e4) = arccos 1 2 = 3 = 60 . Podľa dôsledku 14.1.4 (a) má každý (n - 1)-rozmerný lineárny podpriestor S v n- rozmernom euklidovskom priestore V tvar S = [a] pre vhodný nenulový vektor a V ; potom každá nadrovina N V so zameraním S má tvar N = p + [a] pre nejaké p N. Vektor a sa nazýva normála alebo normálový vektor nadroviny N. Normála nadroviny je zrejme určená jednoznačne až na skalárny násobok. Výpočet odchýlky nadroviny a netriviálneho vlastného afinného podpriestoru možno previesť na výpočet odchýlky normály nadroviny a tohto podpriestoru. Tento prevod sa za- kladá na nasledujúcom tvrdení. 10 PAVOL ZLATOŠ: LINEÁRNA ALGEBRA A GEOMETRIA 14.3.3. Tvrdenie. Nech S je netriviálny, vlastný lineárny podpriestor euklidovského priestoru V a 0 = a V . Potom [a] , S = 2 - (a, S) = a, S . Dôkaz. Keďže druhá rovnosť je zrejmá, stačí dokázať prvú. Podmienky aS = 0, a S a S [a] sú ekvivalentné. Podobne, [a] S je ekvivalentné s podmienkou S [a]. V oboch prípadoch platí [a] , S = 0 = a, S , (a, S) = /2. Nech teda aS = 0 a [a], S ani [a] , S nie sú vo vzťahu inklúzie. Označme aST kolmý priemet vektora aS do podpriestoru T = [a] . Postupne dokážeme rovnosti [a] , S = arccos aST aS = 2 - (a, S). Prvú z nich dokážme v dvoch krokoch. Najprv si uvedomme, že z dôsledku 14.1.4 (a) vyplýva [a] S = [a] + S , teda aS = a - (a - aS) [a] + S = [a] S . Takže [a] , S arccos aST aS -1 na základe tvrdenia 14.3.1. Na dôkaz opač- nej nerovnosti stačí podľa toho istého tvrdenia overiť aST aS xS x pre všetky 0 = x [a] [a] S . Zrejme x, aS = xS, aS , lebo x-xS S . Keďže x [a] + S , vektory xS, aS sú lineárne závislé (rozmyslite si prečo); preto | xS, aS | = xS aS . Nakoľko x [a] = T, s použítím vety 14.1.3 (c) z toho vyplýva xS x = | xS, aS | x aS = | x, aS | x aS aST aS . Druhú rovnosť overíme priamym výpočtom 2 - (a, S) = 2 - (aS, a) = 2 - aS, [a] = aS, [a] = arccos aST aS . Ako zvláštny prípad pre odchýlku dvoch nadrovín dostávame 14.3.4. Dôsledok. Nech M, N sú dve nadroviny v euklidovskom priestore V s nor- málami a, resp. b. Potom (M, N) = (a, [b]) = min (a, b), (a, -b) . V euklidovskom priestore Rn so štandardným skalárnym súčinom vystupuje nor- málový vektor danej nadroviny priamo v jej (všeobecnej) rovnici. Ak je totiž nadrovina M daná rovnicou a1x1 + . . . + anxn = b, tak a = (a1, . . . , an)T = 0 je jej normála a uvedenú rovnicu možno skrátene zapísať v tvare x, a = b. 14. ORTOGONÁLNE PROJEKCIE A PODPRIESTORY 11 14.3.5. Príklad. V euklidovskom priestore V vypočítame odchýlku roviny S = [u, v] a nadroviny T = [a] . Podľa tvrdenia 14.3.5 platí (S, T) = 2 - (a, S) = arcsin aS a . Súradnice c, d kolmého priemetu aS = cu+dv vzhľadom na bázu (u, v) podpriestoru S získame riešením sústavy G(u, v) c d = a, u a, v podľa Cramerovho pravidla v tvare c = a, u v, u a, v v, v |G(u, v)| , d = u, u a, u u, v a, v |G(u, v)| . Spätné dosadenie do vzorca pre odchýlku (S, T) si odpustíme. Tieto vzorce možno zrejmým spôsobom zovšeobecniť aj pre odchýlku k-rozmerného podpriestoru S a priamky, resp. nadroviny. vo V . Pre k 3 však výpočet pomocou Gramových de- terminantov už nie je výhodný. 14.3.6. Príklad. Podaktorý čitateľ si možno kladie otázku, prečo sme miesto tvrde- nia 14.3.3 nedokázali silnejší výsledok, totiž rovnosť (S, T) + S , T = 2 , pre každý netriválny vlastný (teda nie len jednorozmerný) lineárny podpriestor S a každý netriviálny lineárny podpriestor T euklidovského priestoru V . Uvedené tvrde- nie, ako aj náš geometrický názor nám totiž napovedajú, že také niečo by malo platiť. O to bizarnejší sa nám preto bude zdať nasledujúci veľmi jednoduchý príklad, ktorý v ľubovoľnej dimenzii n > 3 našu domnienku vyvracia. V euklidovskom priestore Rn so štandardným skalárnym súčinom sú dané lineárne podpriestory S = [e1, e2], T = [e1, e3]. Zrejme S T = [e1], teda S [e1] = [e2] a T [e1] = [e3]. V dôsledku toho (S, T) = [e2], [e3] = 2 . Na druhej strane S = [e1, e2] = [e3, . . . , en]. Takže S T = [e3], z čoho dostá- vame S [e3] = [e4, . . . , en] a T [e3] = [e1]. Konečne S , T = [e4, . . . , en], [e1] = 2 . Teda hodnota súčtu (S, T) + S , T je tentokrát , a nie /2, ako sme očaká- vali. Voľne povedané, podpriestor T je kolmý tak na podpriestor S, ako aj na jeho ortokomplement S . Samozrejme, platí tiež S, S = /2. 12 PAVOL ZLATOŠ: LINEÁRNA ALGEBRA A GEOMETRIA 14.4. Polárne a sférické súradnice Ortonormálne bázy umožňujú zaviesť v euklidovských priestoroch aj iné typy súrad- níc, ako sme používali doteraz. Polárne súradnice v rovine sú obdobou goniometrického vyjadrenia komplexných čísel. Ak = (u1, u2) je nejaká ortonormálna báza dvojrozmerného euklidovského priestoru V , tak polárne (prípadne tiež sférické) súradnice vektora x V , so súradni- cami (x) = (x1, x2)T vzhľadom na bázu , tvorí usporiadaná dvojica (r, ) reálnych čísel r 0, - < takých, že x1 = r cos , x2 = r sin . (Rovnako dobre by sme mohli vziať z intervalu 0, 2).) Inak povedané, r = x je dĺžka vektora x a pre x = 0 je je orientovaný uhol vektorov u1, x, t. j. uhol, o ktorý treba otočiť vektor u1, aby splynul s vektorom r-1 x; pri otočení v kladnom zmysle (proti smeru hodinových ručičiek) je 0, v zápornom zmysle 0. Prípad x = 0 je singulárny: jeho polárne súradnice tvorí každá usporiadaná dvojica tvaru (0, ), kde (-, . (Pozri obrázok vľavo.) Sférické súradnice v priestore majú názornú geografickú interpretáciu: Nájdeme ich tak, že koncovým bodom daného vektora x preložíme " glóbus" so stredom v počiatku a polomerom r = x , a určíme " zemepisnú šírku" a " zemepisnú dĺžku" tohto koncového bodu. (Pozri obrázok vpravo.) Presnejšie, ak = (u1, u2, u3) je nejaká ortonormálna báza trojrozmerného eukli- dovského priestoru V , tak sférické súradnice vektora x V so súradnicami (x) = (x1, x2, x3)T vzhľadom na bázu tvorí usporiadaná trojica (r, , ) reálnych čísel r 0, - < , -1 2 1 2 takých, že x1 = r cos cos , x2 = r sin cos , x3 = r sin . 14. ORTOGONÁLNE PROJEKCIE A PODPRIESTORY 13 Teda r = x je opäť dĺžka vektora x. Ak x / [u3], t. j ak (x1, x2) = (0, 0), tak je orientovaný uhol, ktorý zviera vektor u1 a kolmý priemet xS vektora x do roviny S = [u1, u2], a je orientovaný uhol, ktorý zviera tento kolmý priemet a pôvodný vektor x. Inak povedané, ( xS , ) sú polárne súradnice vektora xS S vzhľadom na ortonormálnu bázu (u1, u2) roviny S. Priamka [u3] je singulárna: ak 0 = x [u3], tak (-, môže byť ľubovoľné a = 1 2 , podľa toho, či x3 0; ak x = 0, tak aj -/2, /2 môže byť ľubovoľné. Ak sa obmedzíme len na sférickú plochu s daným polomerom r a stredom v počiat- ku, stačí, samozrejme, sférické súradnice bodov na jej povrchu udávať v tvare dvojice " zemepisných súradníc" (, ). Pozorný čitateľ v prechode od polárnych k sférickým súradniciam asi zahliadol všeobecnejšiu rekurentnú schému. Ak n 3 a = (u1, . . . , un) je ortonormálna báza n-rozmerného euklidovského priestoru V , tak sférické súradnice vektora x V vzhľadom na bázu tvorí usporiadaná n-tica (r, , 1, . . . , n-2) reálnych čísel r 0, - < , -1 2 i 1 2 pre 1 i n - 2, takých, že x1 = r cos cos 1 cos 2 cos 3 . . . cos n-2, x2 = r sin cos 1 cos 2 cos 3 . . . cos n-2, x3 = r sin 1 cos 2 cos 3 . . . cos n-2, x4 = r sin 2 cos 3 . . . cos n-2, ... xn-1 = r sin n-3 cos n-2, xn = r sin n-2. Inak povedané, r = x a pre x / [un] sú ( xS , , 1, . . . , n-3) sférické súradníce kolmého priemetu xS vektora x do nadroviny S = [u1, . . . , un-1] vzhľadom na jej ortonormálnu bázu (u1, . . . , un-1); n-2 je orientovaný uhol vektorov xS a x. Disku- siu singulárneho prípadu x [un] prenechávame ako cvičenie čitateľovi. (Uvedomte si, že singulárny je vlastne celý (n - 2)-rozmerný podriestor [u1, u2] !) Sférické súradnice možno s výhodou použiť pri riešení úloh so sférickou symetriou. Ako príklad môže poslúžiť výpočet n-rozmerných integrálov f(x1, . . . , xn) dx1 . . . dxn cez n-rozmernú guľu B(n) (R) = {x Rn ; x R} s polomerom R v euklidov- skom priestore Rn so štandardným skalárnym súčinom.1 Tie totiž možno substitíciou sférických súradníc previesť na integrály tvaru . . . F(r, , 1, . . . , n-2) (x1, . . . , xn) (r, , 1, . . . , n2 ) dr d d1 . . . dn-2 1Sledovanie ďalšieho textu a nasledujúceho príkladu si od čitateľa vyžaduje základné znalosti z integrálneho počtu funkcií viac premenných. 14 PAVOL ZLATOŠ: LINEÁRNA ALGEBRA A GEOMETRIA cez karteziánsky súčin intervalov 0, R × -, × -/2, /2 n-2 , kde F(r, , 1, . . . , n-2) = f(x1, . . . , xn), pričom pôvodné súradnice x1, . . . , xn sú chápané ako funkcie sférických súradníc r, , 1, . . . , n-2, a výraz (x1,...,xn) (r,,1,...,n2 ) je tzv. jakobián, t. j. determinant Jacobiho matice sférickej transformácie súradníc x1 r x1 x1 1 . . . x1 n-2 x2 r x2 x2 1 . . . x2 n-2 ... ... ... ... ... xn r xn xn 1 . . . xn n-2 . Priamym výpočtom, ktorý prenechávame ako cvičenie čitateľovi, sa možno presvedčiť, že jakobián sférických súradníc je (x1, . . . , xn) (r, , 1, . . . , n2 ) = rn-1 cos 1 cos2 2 . . . cosn-2 n-2. 14.4.1. Príklad. Vypočítame objem štvorrozmernej gule B(4) (R) v euklidovskom priestore R4 . Tento objem je daný štvorrozmerným integrálom V4(R) = B(4)(R) dx1 dx2 dx3 dx4, Po substitúcii sférických súradníc x1 = r cos cos 1 cos 2, x2 = r sin cos 1 cos 2, x3 = r sin 1 cos 2, x4 = r sin 2 a s využitím Fubiniho vety prejde tento integrál na súčin štyroch jednoduchých inte- grálov V4(R) = R 0 - /2 -/2 /2 -/2 (x1, x2, x3, x4) (r, , 1, 2) dr d d1 d2 = R 0 r3 dr - d /2 -/2 cos 1 d1 /2 -/2 cos2 2 d2 = r 4 R 0 - sin 1 /2 -/2 22 + sin 22 4 /2 -/2 = R4 4 2 2 2 = 2 2 R4 . 14. ORTOGONÁLNE PROJEKCIE A PODPRIESTORY 15 14.5. Riešenie neriešiteľných sústav a lineárna regresia V celom tomto paragrafe označujú m, n pevné kladné celé čísla. Stĺpcové vektorové priestory Rm a Rn sú vybavené štandardným skalárnym súčinom, takže to sú eukli- dovské priestory. Nech A Rm×n , b Rm . Uvažujme sústavu lineárnych rovníc A x = b a označme S = [s1(A), . . . , sn(A)] lineárny podpriestor v Rm generovaný stĺpcami matice A. Podľa Frobeniovej vety naša sústava má nejaké riešenie x Rn práve vtedy, keď b S. Zložky riešenia x = (x1, . . . , xn)T Rn sú potom koeficienty lineárnej kombinácie x1s1(A) + . . . + xnsn(A) = A x = b. No i v prípade, keď b / S, t. j. riešenie sústavy neexistuje, sa môžeme pokúsiť nahradiť jej pravú stranu b čo najbližším vektorom podpriestoru S. Takto získaná nová sústava už má riešenie, ktoré môžeme právom považovať za najlepšie možné približné riešenie pôvodnej sústavy. Podľa vety 14.1.3 (b) je najbližší vektor podpriestoru S k vektoru b určený jednoznačne, a je to jeho kolmý priemet bS do tohto podpriestoru. Pseu- doriešenie neriešiteľnej (hovorí sa tiež preurčenej) sústavy A x = b teda definujeme ako riešenie (tento raz už istotne riešiteľnej) sústavy A x = bS. Ak je pôvodná sústava riešiteľná, t. j. ak b S, tak bS = b a obe sústavy splývajú, takže každé jej pseudoriešenie je priamo riešením pôvodnej sústavy. 14.5.1. Tvrdenie. Nech A Rm×n , b Rm . Potom x Rn je pseudoriešením sústavy A x = b práve vtedy, keď x je riešením sústavy AT A x = AT b so štvorcovou maticou AT A Rn×n a ľavou stranou AT b Rn . Dôkaz. Najprv si uvedomme, že AT A = G(s1(A), . . . , sn(A)) je Gramovou mati- cou prislúchajúcou stĺpcom matice A. Podľa tvrdenia 14.1.5 a za ním nasledujúcej poznámky je lineárna kombinácia x1s1(A) + . . . + xnsn(A) = A x kolmým prieme- tom vektora b do podpriestoru S = [s1(A), . . . , sn(A)], t. j. platí A x = bS, práve vtedy, keď AT A x = AT b. Pseudoriešenie preurčenej sústavy A x = b teda hľadáme ako riešenie zaručene riešiteľnej sústavy AT A x = AT b. V typickom prípade má pôvodná sústava viac rovníc než neznámych, čiže m > n a A je obdĺžniková matica, " vyššia ako širšia". Potom je veľmi pravdepodobné, že štvorcová matica AT A rádu n (ako Gramova matica " malého" počtu stĺpcových vektorov v euklidovskom priestore " veľkej" dimen- zie) je regulárna, teda k nej existuje inverzná matica AT A -1 . V takom prípade je pseudoriešenie pôvodnej sústavy určené jednoznačne: x = AT A -1 AT b. 16 PAVOL ZLATOŠ: LINEÁRNA ALGEBRA A GEOMETRIA Samozrejme, ak m = n a už samotná matica A je regulárna, dostávame AT A -1 AT = A-1 a x = A-1 b je priamo jediným riešením pôvodnej sústavy. V úlohách lineárnej regresie máme zadané hodnoty y1, . . . , ym neznámej funkcie f v bodoch x1, . . . , xm jej definičného oboru, získané väčšinou meraním. Funkciu f chceme aproximovať lineárnou kombináciou funkcií f1, . . . , fn, ktoré poznáme, či aspoň sú nám známe ich hodnoty aij = fj(xi) v bodoch x1, . . . , xm. Zvyčajne je m podstatne väčšie ako n. V optimálnom prípade sa nám môže podariť zostrojiť funkciu f = c1f1 + . . . + cnfn priamo ako lineárnu kombináciu funkcií fj tak, aby f v bodoch xi nadobúdala vopred predpísané hodnoty yi, t. j. yi = f(xi) = n j=1 cjfj(xi) = n j=1 aijcj. Ak označíme A = (aij) Rm×n , y = (y1, . . . , ym)T Rm , c = (c1, . . . , cn)T Rn , vidíme, že vlastne hľadáme riešenie c sústavy A c = y. Táto sústava je v typickom prípade preurčená, teda jej riešenie neexistuje. Úloha lineárnej regresie potom splýva s metódou najmenších štvorcov a spočíva v nájdení takých koeficientov cj, ktoré minimalizujú výraz m i=1 yi - n j=1 aijcj 2 = y - A c 2 . Toto minimum sa nadobúda pre c také, že Ac = yS, kde S je podpriestor v Rm gene- rovaný stĺpcami matice A. Inak povedané, hľadanú lineárnu kombináciu dostaneme pre pseudoriešenie c sústavy A c = y. Pre hodnoty pochádzajúce z rozumne po- stavených praktických úloh je takmer isté, že matica AT A je regulárna. V takom prípade c = AT A -1 AT y, čiže hľadaná lineárna kombinácia f = c1f1 + . . . + cnfn = (f1, . . . , fn) c je určená jednoznačne. Metódu lineárnej regresie, ako aj to, čo približne rozumieme pod " rozumne posta- venou úlohou", si ilustrujeme na jednom typickom a dôležitom príklade. 14.5.2. Príklad. V rovine R2 je daných m 2 bodov (x1, y1), . . . , (xm, ym), zís- kaných meraním hodnôt nejakej neznámej funkcie f vo vybraných bodoch xi jej definičného oboru. Túto funkciu hodláme aproximovať priamkou s rovnicou y = a+bx tak, aby výraz m i=1(yi - a - bxi)2 bol minimálny. Ak si uvedomíme, že funkcia 14. ORTOGONÁLNE PROJEKCIE A PODPRIESTORY 17 y = a + bx je lineárnou kombináciou konštantnej funkcie y = 1 a identickej funkcie y = x, hneď vidíme, že ide o úlohu lineárnej regresie. Sústava 1 x1 ... ... 1 xm a b = y1 ... ym je okrem triviálneho prípadu, keď všetky body (xi, yi) ležia na jednej priamke, pre- určená. Koeficienty a, b teda nájdeme ako pseudoriešenie tejto sústavy. Jej maticu si označíme A. Jednoduchý výpočet dáva AT A = m xi xi x2 i , det AT A = m m i=1 x2 i - m i=1 xi 2 = i 0 pre každé x X (v opačnom prípade môžeme nemožné elementárne javy z množiny X jednoducho vylúčiť).2 Inak povedané, A = je jediný nemožný jav A X. Náhodnou premennou na pravdepodobnostnom priestore X rozumieme ľubovoľnú funkciu f : X R. Množina RX všetkých náhodných premenných tvorí vektorový priestor nad poľom R (pozri odstavec 1.6.5). Zrejme dim RX = # X. Vďaka nášmu predpokladu, podľa ktorého p(x) > 0 pre každé x X, je rovnosťou f, g = xX f(x)g(x)p(x), 2Treba poznamenať, že v nekonečnom pravdepodobnostnom priestore X by už takýto predpoklad spôsobil nielen značnú ujmu na všeobecnosti ale i ďalšie vážne ťažkosti. 20 PAVOL ZLATOŠ: LINEÁRNA ALGEBRA A GEOMETRIA kde f, g sú náhodné premenné, definovaný skalárny súčin na RX . Priestor RX všetkých náhodných premenných je tak euklidovským priestorom. Množina C = f RX ; ( x, y X)(f(x) = f(y)) všetkých konštantných náhodných premenných tvorí jednorozmerný lineárny pod- priestor priestoru RX . Keďže zobrazenie, ktoré reálnemu číslu a priradí konštantnú náhodnú premennú f Rn takú, že f(x) = a pre každé x X, je lineárny izomorfiz- mus R = C, môžeme si dovoliť stotožniť toto číslo s príslušnou konštantnou náhodnou premennou. Nakoľko konštantná náhodná premenná 1 tvorí zrejme ortonormálnu bázu podprie- storu C, lineárny operátor prC ortogonálnej projekcie na podpriestor C má tvar E(f) = prC(f) = f, 1 = xX f(x)p(x) pre f RX . Výraz E(f) nazývame strednou alebo aj očakávanou hodnotou náhodnej premennej f (označenie operátora E: RX RX pochádza z anglického slova expect- ation). Ortokoplementom podpriestoru C je podľa dôsledku 14.1.4 (d) lineárny podpriestor N = C = Ker E = {f RX ; E(f) = 0}, tvorený všetkými náhodnými premennými s nulovou strednou hodnotou. Potom ná- hodná premenná f - E(f) je kolmým priemetom f RX do nadroviny N. Disperziou alebo tiež rozptylom náhodnej premennej f RX nazývame výraz D(f) = f - E(f) 2 . Zrejme platí D(f) = f - E(f) = dist(f, C). To znamená, že toto číslo, nazývané stredná kvadratická odchýlka prípadne smero- dajná odchýlka náhodnej premennej f, udáva akúsi strednú mieru nekonštantnosti f, presnejšie, vzdialenosť f od jej očakávanej hodnoty. Nech f, g RX sú náhodné premenné s nenulovými disperziami. Ich korelačný koeficient definujeme vzťahom R(f, g) = cos (f - E(f), g - E(g)) = f - E(f), g - E(g) f - E(f) g - E(g) . To znamená, že arccos R(f, g) je uhol, ktorý zvierajú kolmé priemety náhodných pre- menných f, g do podpriestoru N náhodných premenných s nulovou strednou hodno- tou. Špeciálne pre f, g N je R(f, g) = cos (f, g) = f, g f g . Niekoľko doplňujúcich informácií o " geometrii pravdepodobnosti" môže čitateľ nájsť v cvičeniach.