14. ORTOGONÁLNÍ PROJEKCE A PODPROSTORY Budeme pokračovat ve studiu euklidovských prostorů s cílem podat kvantitativní popis vzájemné polohy afinních podprostorů v takovémto prostoru pomocí dvou základních parametrů -jejich vzdálenosti a odchylky (úhlu). Naším hlavním nástrojem při tom budou lineární operátory kolmého průmětu, zvané též ortogonální projekce, vektorů do lineárních podprostorů. V závěru kapitoly předvedeme aplikace rozpracovaných pojmů a metod. i 14.1. Ortokomplement a ortogonální projekce Relace ortogonality (kolmosti) má několik následujících zřejmých vlastností. Tvrzení 1. Nechť V je vektorový prostor se skalárním součinem. Potom pro všechna x, y, z V, c,dGR platí: (a) x _L 0; (b) x _L x O x = 0; ícjxly ylx; (d) (x _L y & x _L z) =>* x _L (cy + dz). Ortogonálním doplňkem nebo též ortokomple-mentem libovolné množiny X C V ve vektorovém prostoru se skalárním součinem nazveme množinu X± = {yeV; (VxGl)(xly)} všech vektorů y £ V kolmých na každý vektor x G X. Tvrzení 2. Nechť V je vektorový prostor so skalárním součinem. Potom pro všechny množiny X, Y C V platí: (a) 0^ = {0}^ = V, V± = {0}; (b) X1- = IX}1- = IX1-' -L <- vl. (c) X CY CX (d) X C X±J-; (e) X^1- = XL; (f) Iílli = {0}, pokud 0 £ X, a X f] X1- = 0, pokud 0<£X; (g) (X U Y)1- = (X + Y)1- = X±n YL Z podmínky (b) mimo jiné plyne, že X je lineární podprostor ve V pro každou podmnožinu X c v. Nechť S C V je lineární podprostor prostoru so skalárním součinem V a x £ V. Říkáme, že vektor z G S je kolmým průmět nebo též ortogonální projekce vektoru x do pod prostoru S, pokud x — z G S^-. Tento vektor (pokud existuje) budeme značit z = Pľg(x) = xg. 5 Věta 3. Nechť V je vektorový prostor so skalárním součinem, S C V je jeho konečně rozměrný lineární podprostor a x £ V. Potom (a) kolmý průmět vektoru x do podprostoru S existuje a je jednoznačně určený rovností k pr5(x) = x5 = J2(^ui)uh i=l kde (ui,. .. , Ufc) je libovolná ortonormální báze podprostoru S\ (b) pro libovolný vektor y G S platí x-x5 < x-y přičemž rovnost nastane právě tehdy, když y = xs; 6 (c) pokud x^Oa {0}, tak pro libovolný vektor O^yGS piati > (x, y) X X přičemž rovnost nastane právě tehdy, když vektory xg, y jsou lineárně závislé. Důsledek 4. Nechť V je vektorový prostor se skalárním součinem a 5, T C V jsou jeho konečně rozměrné lineární podprostory. Potom (a) S = S-L-L, (5nT)i = 5i + Ti a V = S © S~^~', (b) pľg : V —> V je lineární operátor; 7 (c) (VxG VO(xe S & pr5(x) = x); (d) Impr^ = S a Kerpľg = 5 (ej x — xg je kolmý průmět vektoru x do pod-prostoru S^~. Lineárni operátor pľg nazýváme ortogonální projekcí na pod prostor S. 8 Předpokládejme, že kolmý průmět vektoru x do lineárního podprostoru S existuje. Vysvětlíme si, jak můžeme za tohoto předpokladu definovat vzdálenost i odchylku vektoru x od každého z podprostoru S, S^~. Situace je znázorněná na následujícím obrázku. Vektor x — xg je kolmý na každou přímku v podprostoru S, speciálně trojúhelník tvořený vektory x, xg, x — xg je pravoúhlý, s pravým úhlem při „konci" vektoru xg. 9 Podmínka (b) věty 3 nás oprávňuje nazvat délku vektoru x — xg vzdáleností vektoru x od pod-prostoru S. Budeme ji značit dist(x, S) = ||x—X5H = min{||x—y||; y £ S} Vzhledem k podmínce (e) důsledku 4 je vzdálenost (anglicky distance) vektoru x od pod-prostoru daná vztahem dist(x,5±) = ||x5 10 Podobně, protože kosinus je na intervalu (0, 7r) klesající funkce, podmínka (c) věty 3 nás oprávňuje nazvat výraz Xc <(x, S) = arccos-— = min{<(x, y); 0 ^ y G S} x|| odchylkou vektoru x ^ 0 od pod prostoru S ^ {0}, případně úhlem vektoru x a podprostoru S. Odchylka <(x, S) je tedy jednoznačně určená jako takové reálné číslo a G (0,7r/2), pro které platí cos a = x t. j. sin a = X X 11 Zřejmě opět půjde o neorientovaný uhel. Pokud xg ^ 0, tak <(x, S) = <(x, X5); pokud xg = 0, t.j. pokud x £ S^~, tak samozřejmě <(x,S) = tt/2. Úhel dvou vektorů nabývá hodnoty z intervalu (0,7r), hodnoty, které nabývá úhel vektoru a podprostoru, jsou omezené na interval (0, tt/2). Z podmínky věty 3(e), pokud ^ {0}, tak odchylka vektoru x ^ 0 od podprostoru je daná vztahem <(x, S^~) = arccos x-x5 = arcsin x x 12 Z části (a) věty 3 máme přímý návod, jak najít kolmý průmět vektoru x do konečně rozměrného podprostoru S C V, a tím i vzdálenosti dist(x, S), dist(x, 5T) a odchylky <(x, 5), <(x,5±). Tvrzení 5. Nechť V je vektorový prostor so skalárním součinem, S je jeho konečně rozměrný lineární podprostor s bazí a = (ui,. . ., UjJ a x £ V. Potom pro c = (ci,..., c^)T £ Mfc platí xg = c\Mi + .. . + CfcUfc právě tehdy, když c je řešením soustavy lineárních rovnic G (a) • c = (x, a) , kde (x, a) označuje řádkový vektor «x,ui),...,(x,ufc)) 6 1 13 Rozšířená matice (G(a) | (x, a) ) uvedené soustavy je Gramovou maticí G(u]_,. .. , u^, x) řádu k + 1, ze které jsme vynechali poslední řádek. Je-li a ortonormální báze, tak G (a) = 1^, t.j. příslušná soustava je už ve vyřešeném tvaru c = (x, a)T, t.j. ve shodě s podmínkou (a) věty 3. Totiž pľg(x) = xg = (x, a)T • a = c • a. 14 Příklad 6. V M4 se standardním skalárním součinem je daný vektor x = (1,1,1,1)T a rovina S = [u,v], kde u = (0,-1,0,1)T, v = (l,-2,l,-3)T Najdeme kolmý průmět vektoru x do roviny S a vypočítáme vzdálenost dist(x, S) a odchylku <(x, S). Kolmý průmět budeme hledat ve tvaru xg = cu + dv, kde (c, d)T E K vyhovuje soustavě s rozšírenou maticí (u, u) (v, u) (u, v) (v, v) / 2 -1 v -1 15 (x, u) (x, v) 15 Jejím řešením dostaneme c = —3/29, d = —6/29, tedy kolmý průmět vektoru x do roviny [u, v] je XS = (u,v) V c d 29 ( -2\ 5 -2 5 V ŕ o M -1 -2 0 1 1 -3 V V -3/29 -6/29 Pro vzdálenost x od S potom dostáváme dist(x, S) = ||x—xg 7 29 (5,2,5,2) T = -V58. 29 16 Pro odchylku x od S dostaneme sin <(x, S) = x-x5 X 7 Všš = 7 2-29 S použitím kalkulačky či tabulek můžeme zjistit, že <(x, S) = arcsin 7 VŠ8 O aqI r 11 1,1659 rad « 66u48'5 17 Příklad 7. Nechť A G RmXn, přičemž m > n a /&(A) = n, t.j. sloupce matice A jsou lineárně nezávislé vektory v euklidovském prostoru Mm se standardním skalárním součinem. Označme S C W71 lineární podprostor generovaný sloupci matice A. Potom ortogonální projekce na podprostor S je lineární operátor pr5:Mm^Mm. Najděme jeho matici B = (prs)££ e RmXm vzhledem ke kanonické ortonormální bázi e prostoru Rm. Pokud ztotožníme matici A s uspořádanou n-ticí jejich sloupců, tak A je bazí S. 18 Podle tvrzení 5 obraz y = pľg(x) vektoru x £ Mm dostaneme ve tvaru y = A • c, kde c £ Mn je jediné řešení soustavy G(A)-c = (x,A)T Z nezávislosti sloupců matice A víme, že G(A) AT - A je regulární matice. Dále platí (x, A) = xT • A, tedy (x, A)T = AT-x. 19 Po dosazení c = G(A)"1 • (x, A)T = (AT • A)"1 • AT • x, y = A • c = A • (AT • A)-1 • AT • x. Tedy hledaná matice ortogonální projekce prg je B = (pr5)£)£ = A • (AT • A)"1 • AT. 20 14.2. Vzdálenost dvou afinních podprostorů Nechť V je vektorový prostor se skalárním součinem a X, Y jsou jeho dvě neprázdné podmnožiny. Vzdáleností množin X, Y v V nazýváme číslo distpf, Y) = inf{||x - y|| ; x G X k y G Y} Lemma 8. Nechť V je vektorový prostor se skalárním součinem a M, N jsou jeho afinní podprostory. Potom pro libovolné body p G M, q G M platí: dist(M, N) = dist(p - q, DirM + DirTV). 21 Říkáme, že body p G M, q G iV tvoří příčku afinních podprostorů M, iV, pokud dist(M,A0 = ||p-q t.j. pokud se vzdálenost podprostorů M, iV realizuje jako délka vektoru p — q. 22 Tvrzení 9. Nechť M, N jsou konečně rozměrné afinní podprostory vektorového prostoru se skalárním součinem V. Potom (a) body p £ M, q£ iV tvoří příčku pod prostorů M, iV právě tehdy, když p — q £ (DirM + DirAf)-1; (b) pro libovolné body p £ M, q £ iV a vektory u £ DirM, v £ DirAf platí: body p + u, q + v tvoří příčku pod prostorů M, N právě tehdy, když vektor v — u je kolmým průmětem vektoru p — q do lineárního podprostoru DirM + D\rN; (c) existují body p £ M, q £ N tvořící příčku podprostoru M, N. 23 Důsledek 10. Pro konečně rozměrné afinní pod prostory M, N C V vektorového prostoru se skalárním součinem platí dist(M, N) = 0 právě tehdy, když M H TV ^ 0. Přímý návod jak najít příčku a vzdálenost libovolných konečně rozměrných afinních podprostorů Jsou-li M = p + [ui,..., um]. N = q + vi,...,Vn] zadané parametricky, stačí najít jedno řešení c = (ci,..., cm, cm+i,..., cm+n)T G Mm+n soustavy G(7)-c= (p-q,7)T? kde 7 = (ui,.. ., um, vi,. .. , vn), a položit U = ClUl + . .. cmum, v = cm+ivi + .. .+cm+nvn. 24 Potom vektor w = u+v = 7*c je kolmým průmětem vektoru p—q do lineárního podprostoru DirM + D'\rN = [ui,... um, vi,..., vn] a příčka podprostorů M, N je tvořená body p — u, q + v. V důsledku toho dist(M,A0 = p - u) - (q + v) p — q — w 25 Odchylka dvou afinních podprostorů Odchylku neboli úhel dvou netriviálních konečně rozměrných afinních podprostorů ve vektorovém prostoru so skalárním součinem V značíme <(M, N) a definujeme ji jako odchylku <(DirM, DirTV) jejich zaměření. Odchylku neboli úhel <(5, T) dvou netriviálních konečně rozměrných lineárních podprostorů S,TCy definujeme následovně: Pro S C T nebo T C S položíme <(S,T) = 0. Pokud S H T = {0}, klademe <(S, T) = inf {<(x, y);0^x£S&0^y£ 26 Pokud bychom takovýmto způsobem definovali odchylku <(5,T), i když SnT^ {0}, libovolný společný nenulový vektor x £ SnT by se postaral o to, aby platilo <(5, T) = <(x, x) = 0, což nevypadá příliš rozumně. Tedy pro S D T ŕ {0}, S g T, T g S, položíme Si = 5 n (5 n T)-1, Ti = rn(5nr)1. Zřejmě S\, T\ C- V jsou netrivální lineárni podprostory a 5i D = {0} (za předpokladu 5 n T = {0} dokonce platí S\ = S, T\ = T). Proto můžeme konečně definovat <(S,T) = <(ShTí). 27 Takto definovaný úhel podprostorů S, T je číslo z intervalu (0, tt/2) a platí pro něj <(£, T) = <(T, S), tedy je to neorientovaný úhel. Tvrzení 11. Nechť y je vektorový prostor so skalárním součinem a S, T jsou jeho konečně rozměrné lineární podprostory, přičemž 5 g T ani T g 5. Potom <(5, T) = inf{<(x, T); 0 ^ x G Sr^SriT)-1}. 28 Odchylka přímky [x], kde x ^ 0, a konečně rozměrného lineárního podprostoru S ^ {0} je daná vztahem <([x],S) = <(x,S0 = arccos llx.sll = , <(x,xs)> x tt/2, pokud X5 ^ 0, t.j. x^ S±t pokud X5 = 0, t.j. x G 5-1. 29 Každý (n — l)-rozměrný lineární podprostor S v n-rozměrném euklidovském prostoru V má tvar S = V. a _L pro vhodný nenulový vektor a G Každá nadrovina N C V se zaměřením 5 má tvar N = p + a _L pro nějaké p G N. Vektor a se nazývá normála neboli normálový vektor nadroviny N. Normála nadroviny je určená jednoznačně až na skalární násobek. V euklidovském prostoru Mn se standardním skalárním součinem vystupuje normálový vektor dané nadroviny přímo v její (obecné) rovnici. Pokud je totiž nadrovina M daná rovnicí ^1*^1 H- • • • H- dfiXfi — by tak a = (ai,..., an)T ^ 0 je její normála a uvedenou rovnici můžeme zapsat ve tvaru (x, a) = b. 30 Tvrzení 12. Nechť 5 je netriviální, vlastní lineární podprostor euklidovského prostoru V a O^aGľ. Potom < a _L 7t ,S) = |-<(a,S) = <(a, S^). Důsledek 13. Nechť M, AT jsou dvě nadro-viny v euklidovském prostoru V s normálami a, resp. b. Potom <(M, N) = <(a, [b]) = min{<(a, b), <(a, -b)} 31