13. SKALÁRNÍ SOUČIN NAD R i C Jan Paseka Masarykova univerzita Brno 20. března 2020 Abstra kt V této kapitole se pokusíme o naplnění lineární algebry geometrickým obsahem ve vektorových prostorech nad číselnými tělesy R i C. V této kapitole se pokusíme o naplnění lineární algebry geometrickým obsahem ve vektorových prostorech nad číselnými tělesy R i C. Ukazuje se, že celou základní geometrickou strukturu, včetně délek a úhlů, můžeme odvodit z jediné kladně definitní symetrické bilineární formy na reálném prostoru. Obsah přednášky I Skalární součin ► Skalární součin nad tělesem reálných čísel. ► Skalární součin nad tělesem komplexních číse Obsah přednášky I Skalární součin ► Skalární součin nad tělesem reálných číse ► Skalární součin nad tělesem komplexních číse Délka vektoru a úhel dvou vektorů ► Gramová matice. Cauchyho-Schwartzova nerovnost. Úhel dvou vektorů. Délka vektoru. Ortogonální a ortonormální báze ► Gramův-Schmidtův ortogonalizační proces. ► QR-rozklad. ► ► ► Skalární součin I Motivace: Uvažujme prostor K2. Jsou-li vektory x = (xi,X2) a Y — {yiiYi) na sebe kolmé, platí Pythagorova věta. 2 y - x z = + y (yi - xi)2 + (y2 - x2)2 = x2 + x2 + y2 + y2 Skalární součin Motivace: Uvažujme prostor IR2. Jsou-li vektory x = (xi,x2) a Y = (yi?y2) na sebe kolmé, platí Pythagorova věta. 9 9 9 y — x = x + y (yi - xi)2 + (y2 - x2)2 = x2 + x2 + y2 + y2 Ekvivalentně, y2 - 2yixi + x2 + y| - 2y2x2 + x| = x2 + x| + y2 + yf. Skalární součin I Motivace: Uvažujme prostor K2. Jsou-li vektory x = (xi,x2) a Y — {yiiYi) na sebe kolmé, platí Pythagorova věta. 9 9 9 y — x = x + y (yi - xi)'2 + (y2 - x2)2 = x2 + x2 + y2 + y2 Ekvivalentně, y2 - 2yixi + x2 + y| - 2y2x2 + x| = To je právě tehdy, když -2yixi - 2y2x2 = 0 tj. xiyi + x2y2 = 0. Platí-li Pythagorova věta, jsou na sebe vektory x a y kolmé a xiVi +x2y2 = 0. Skalární součin Výraz (x, y) = x\y\ + x^yi měří, zda jsou vektory x a y na sebe kolmé. Nazýváme jej skalární součin. Skalární součin Výraz (x, y) = x\y\ + x^yi měří, zda jsou vektory x a y na sebe kolmé. Nazýváme jej skalární součin. Jedná se o symetrickou bilineární formu, přičemž příslušná kvadratická forma je tvaru a je pozitivně definitní a měří velikost vektoru v druhé mocnině. Skalární součin Výraz (x, y) = x\y\ + x^yi měří, zda jsou vektory x a y na sebe kolmé. Nazýváme jej skalární součin. Jedná se o symetrickou bilineární formu, přičemž příslušná kvadratická forma je tvaru a je pozitivně definitní a měří velikost vektoru v druhé mocnině. Definice Skalárním nebo též vnitřním součinem na reálném vektorovém prostoru V rozumíme libovolnou pozitivně definitní, symetrickou bilineární formu na V. Hodnotu této formy na vektorech x, y G V budeme značit (x, y Skalární součin Nezávisle na znalosti uvedených pojmů můžeme skalární součin na V definovat jako binární operaci V x V —>> IR, která každé dvojici (x, y) vektorů z V přiřadí reálné číslo (x, y), takové, že pro všechny x, y,Xi,X2 £ V a libovolné c G IR platí: (xi + x2, y) = (xi, y) + (x2, y) (aditivita), Skalární součin Nezávisle na znalosti uvedených pojmů můžeme skalární součin na V definovat jako binární operaci V x V —>> IR, která každé dvojici (x, y) vektorů z V přiřadí reálné číslo (x, y), takové, že pro všechny x, y,Xi,X2 £ V a libovolné c G IR platí: xi + x2, y) = (xi, y) + (x2, y) (aditivita), (cx,y) = c(x,y) (homogenita), Skalární součin Nezávisle na znalosti uvedených pojmů můžeme skalární součin na V definovat jako binární operaci V x V —>> IR, která každé dvojici (x, y) vektorů z V přiřadí reálné číslo (x, y), takové, že pro všechny x, y,Xi,X2 £ V a libovolné c G IR platí: xi + x2, y) = (xi, y) + (x2, y) (aditivita), cx,y) = c(x,y (homogenita), x,y = y,x (symetrie), Skalární součin Nezávisle na znalosti uvedených pojmů můžeme skalární součin na V definovat jako binární operaci V x V —>> IR, která každé dvojici (x, y) vektorů z V přiřadí reálné číslo (x, y), takové, že pro všechny x, y,Xi,X2 G V a libovolné c G IR platí: xi + x2, y) = (xi, y) + (x2, y) (aditivita), cx,y) = c(x,y (homogenita), x,y = y,x (symetrie), x ^ 0=^(x,x) > 0 (kladná definitnost) Skalární součin Nezávisle na znalosti uvedených pojmů můžeme skalární součin na V definovat jako binární operaci V x V —>> IR, která každé dvojici (x, y) vektorů z V přiřadí reálné číslo (x, y), takové, že pro všechny x, y,Xi,X2 £ V a libovolné c G IR platí: xi + x2, y) = (xi, y) + (x2, y) (aditivita), cx,y) = c(x,y (homogenita), x,y = y,x (symetrie), x ^ 0=^(x,x) > 0 (kladná definitnost) Spojení aditivity a homogenity skalárního součinu nám dává jeho linearitu jako funkci první proměnné (při pevné druhé proměnné). Skalární součin IV Ze symetrie plyne i linearita skalárního součinu jako funkce druhé proměnné (při pevné první proměnné), t.j. rovnosti x,yi + y2/=(x,y2/ + (x,Y2 x, cy)=c(x,y), pro všechna x, y1? y2, y G V a c e IR. Skalární součin IV Ze symetrie plyne i linearita skalárního součinu jako funkce druhé proměnné (při pevné první proměnné), t.j. rovnosti x,yi + y2/=(x,y2/ + (x,Y2 x, cy)=c(x,y), pro všechna x, y1,y2,y £ V a c e IR. Z (bi)linearity plyne podmínka kladné definitnosti x, x) > 0 & ((x, x) = 0 ^ x = 0) pro každé x G V. Skalární součin IV Ze symetrie plyne i linearita skalárního součinu jako funkce druhé proměnné (při pevné první proměnné), t.j. rovnosti x,yi + y2/=(x,y2/ + (x,Y2 x, cy)=c(x,y), pro všechna x, y1? y2, y G V a c e IR. Z (bi)linearity plyne podmínka kladné definitnosti x, x) > 0 & ((x, x) = 0 ^ x = 0) pro každé x G V. První část této podmínky nám umožňuje definovat normu neboli délku vektoru x rovností x = \ X, X . Skalární součin V Výraz x budeme zatím chápat jen jako jiné označení pro kvadratickou formu (x, x) indukovanou skalárním součinem Skalární součin V Výraz x budeme zatím chápat jen jako jiné označení pro kvadratickou formu (x, x) indukovanou skalárním součinem Definice Euklidovským prostorem nazýváme libovolný konečně rozměrný reálný vektorový prostor se skalárním součinem. Skalární součin V Výraz ||x||2 budeme zatím chápat jen jako jiné označení pro kvadratickou formu (x, x) indukovanou skalárním součinem. Definice Euklidovským prostorem nazýváme libovolný konečně rozměrný reálný vektorový prostor se skalárním součinem. Příklad Ze střední školy v rámci analytické geometrie, případně v rámci fyziky jsme se potkali s skalárním součinem (x, y) = X\y\ + X2J/2 v rovině IR2 a se skalárním součinem (x, y) = X\y\ + X2J/2 + X3J/3 v prostoru IR3. Skalární součin VI Lehce se můžeme přesvědčit, že stejný vzoreček funguje pro každé n, t.j. pro x = (xi,... ,x„)T, y = (yi,... ,yn)T je předpi T sem n i=i definovaný skalární součin na sloupcovém vektorovém prostoru IRn. Skalární součin VI Lehce se můžeme přesvědčit, že stejný vzoreček funguje pro každé n, t.j. pro x = (xi,... ,x„)T, y = (yl5... ,yn)T je předp T isem n i=i definovaný skalární součin na sloupcovém vektorovém prostoru IRn V případě řádkového prostoru IRn máme n x,y) =xyT = J^Xíyí i=l pro x = (xi,..., x„), y = (yi,..., yn) Skalární součin VI Takovýto skalární součin budeme nazývat standardní skalární součin na IRn. Standardní skalární součin vektorů x,y G IRn (ať už jde o řádkové nebo sloupcové vektory) se obvykle značí x • y. Skalární součin VI Takovýto skalární součin budeme nazývat standardní skalární součin na IRn. Standardní skalární součin vektorů x,y G IRn (ať už jde o řádkové nebo sloupcové vektory) se obvykle značí x • y. Délka vektoru x vzhledem ke standardnímu skalárnímu součinu je x 1/2 Skalární součin VI Takovýto skalární součin budeme nazývat standardní skalární součin na IRn. Standardní skalární součin vektorů x,y G IRn (ať už jde o řádkové nebo sloupcové vektory) se obvykle značí x • y. Délka vektoru x vzhledem ke standardnímu skalárnímu součinu je x ^ i=l ' 1/2 V rámci analytické geometrie se pro nenulové vektory x, y dokazuje známý vztah xy = x cos a který spojuje standardní skalární součin v IR2 či v IR3 s délkou příslušných vektorů a jimi sevřeným úhlem a. Skalární součin VI Příklad Nechť V označuje vektorový prostor C (a, b) všech spojitých reálných funkcí definovaných na uzavřeném intervalu (a, b), kde a < b jsou reálná čísla, případně jeho libovolný lineární podprostor. Skalární součin VI Příklad Nechť V označuje vektorový prostor C (a, b) všech spojitých reálných funkcí definovaných na uzavřeném intervalu (a, b), kde a < b jsou reálná čísla, případně jeho libovolný lineární podprostor. Pro ŕ, g G V položme (f,g)= / f(x)g(x)dx. Z komutativity násobení v IR a aditivity a homogenity integrálu vyplýva, že (f,g) je symetrická bilineární forma na V. Skalární součin VI Příklad Nechť V označuje vektorový prostor C (a, b) všech spojitých reálných funkcí definovaných na uzavřeném intervalu (a, b), kde a < b jsou reálná čísla, případně jeho libovolný lineární podprostor. Pro ŕ, g G V položme (f,g)= / f(x)g(x)dx. Z komutativity násobení v IR a aditivity a homogenity integrálu vyplýva, že (f,g) je symetrická bilineární forma na V. Pro ověření pozitivní definitnosti si stačí uvědomit, že pro f ^ 0 (t. j. f ne identicky rovné nule), je f2(x) > 0 pro každé x G (a, b) Ze spojitosti funkce f (a teda též f2) vyplývá existence nějakého netriviálního uzavřeného podintervalu (ai,bi) C (a, b) tak, že f2(x) > 0 pro všechna x G (ai, b\ Skalární součin IX Protože f na (ai,bi) nabývá minimum, máme (f, f)= f ŕ2(x)dx > / 1 ŕ2(x)dx > (bi - ai) min f(x) > 0. j a jai ai / 1 ŕ2(x)dx > (bi - ai) min f(x) > 0. j a jai ai / 1 ŕ2(x)dx > (bi - ai) min f(x) > 0. j a jai ai takové, že pro všechny x, y,Xi,x2 G V a libovolné c G C platí: xi + x2,y) = xi,y) + (x2,y (aditivita), cx, y = c\x,y (homogenita) x,y = y.x (kosá symetrie), Komplexní skalární součin I Skalární nebo též vnitřní součin na komplexním vektorovém prostoru V budeme definovat jako binární operaci V x V —C, která každé dvojici (x, y) vektorů z V přiřadí komplexní číslo (x, y takové, že pro všechny x, y,Xi,x2 G V a libovolné c G C platí: xi + x2,y) = xi,y) + (x2,y (aditivita), cx, y = c\x,y (homogenita) x,y = y.x (kosá symetrie), x^O x, x) > 0 (kladná definitnost). mplexní skalární součin II Komplexní vektorový prostor V se skalárním součinem nazýváme unitární prostor. mplexní skalární součin II Komplexní vektorový prostor V se skalárním součinem nazýváme unitární prostor. Spojení aditivity a homogenity skalárního součinu dává jeho linearitu jako funkce první proměnné (při pevné druhé proměnné). Komplexní skalární součin Komplexní vektorový prostor V se skalárním součinem nazýváme unitární prostor. Spojení aditivity a homogenity skalárního součinu dává jeho linearitu jako funkce první proměnné (při pevné druhé proměnné) Dík kosé symetrii z toho vyplývá antilinearita skalárního součinu jako funkce druhé proměnné (při pevné první proměnné), t.j. rovnosti (x,Yi + y2) = (x,y2) + (x,y2), (x,cy) = č(x,y), pro všechny x, y1? y2 6 V a c G C. Komplexní skalární součin Komplexní vektorový prostor V se skalárním součinem nazýváme unitární prostor. Spojení aditivity a homogenity skalárního součinu dává jeho linearitu jako funkce první proměnné (při pevné druhé proměnné) Dík kosé symetrii z toho vyplývá antilinearita skalárního součinu jako funkce druhé proměnné (při pevné první proměnné), t.j. rovnosti (x,yi + y2) = (x^) + (x,y2), (x,cy) = č(x,y), pro všechny x, y1? y2 £ V a c £ C. Z kosé symetrie vyplývá reálnost výrazu (x, x) = (x, x) pro každé x £ V, což dává smysl podmínce pozitivní definitnosti. Komplexní skalární součin Komplexní vektorový prostor V se skalárním součinem nazýváme unitární prostor. Spojení aditivity a homogenity skalárního součinu dává jeho linearitu jako funkce první proměnné (při pevné druhé proměnné) Dík kosé symetrii z toho vyplývá antilinearita skalárního součinu jako funkce druhé proměnné (při pevné první proměnné), t.j. rovnosti (x,Yi + y2) = (x,y2) + (x,y2), (x,cy) = č(x,y), pro všechny x, y1? y2 6 V a c G C. Z kosé symetrie vyplývá reálnost výrazu (x, x) = (x, x) pro každé x E V, což dává smysl podmínce pozitivní definitnosti. Máme pak (x, x) > 0 & ((x, x) = 0 ^ x = 0) pro každé x E V. Zejména platí (x, 0) = (0,x) = 0. Komplexní skalární součin Příklad Nechť V = cn. Pak pro x = (xi,...,xn)T, y = (y1?...,yn)T definujeme předpisem n x,y) =xr y = J^x/y,- ;=1 standardní skalární součin na sloupcovém vektorovém prostoru C. mplexní skalární součin III Příklad Nechť V = cn. Pak pro x = (xi,..., xn)T, y = (y1?..., yn) definujeme předpisem n (x, y) =xT-y = ^x/y- i=i standardní skalární součin na sloupcovém vektorovém prostoru cn. Většinu pojmů, které jsme definovali pro euklidovské prostory, můžeme zavést i pro (konečně rozměrné) unitární prostory a většinu výsledků o euklidovských prostorech můžeme s malými modifikacemi dokázat i pro (konečně rozměrné) unitární prostory. mplexní skalární součin IV Protože 0 < (x, x) G R, délku neboli též normu vektoru x v unitárním prostoru V můžeme definovat jako nezáporné reálné číslo x = \ X, X . mplexní skalární součin IV Protože 0 < (x,x) G R, délku neboli též normu vektoru x v unitárním prostoru V můžeme definovat jako nezáporné reálné číslo x = v(x?x)- Říkáme, že vektory x, y jsou kolmé y unitárním prostoru V, pokud (x,y) =0. Komplexní skalární součin IV Protože 0 < (x, x) G R, délku neboli též normu vektoru x v unitárním prostoru V můžeme definovat jako nezáporné reálné číslo x = \ X, X . Říkáme, že vektory x, y jsou kolmé y unitárním prostoru V, pokud x,y) = 0. Příklad Uvažme spojité funkce na intervalu [a, b] s hodnotami v C. Jedná se o komplexní vektorový prostor se skalárním součinem (f,g)= I f(x)g(x)dx. J a Gramová matice Nechť ol = (ui,. .. , U/c) je libovolná uspořádaná /c-tice vektorů v reálném vektorovém prostoru V se skalárním součinem. Téměř všechny podstatné informace o těchto vektorech jsou ukryté v tzv. Gramové matici G(a) = G(ui,...,Ufc) = ((u/,u lJ'Jkxk vektorů Ui,..., u^. Gramová matice Nechť ol = (ui,. .. , U/c) je libovolná uspořádaná /c-tice vektorů v reálném vektorovém prostoru V se skalárním součinem. Téměř všechny podstatné informace o těchto vektorech jsou ukryté v tzv. Gramové matici G(a) = G(ui,...,Ufc) = ((u/,u 5 J' J kxk vektorů Ui,..., u^. Determinant Gramový matice detG(a) = |G(ui,..., uk)\ = Ui.Ui U/c,Ui • • • Ul, ufc • • • U/c, Ufc se nazývá Gramovým determinantem vektorů Ui,..., U/<. Gramová matice Tvrzení Nechť Ui,. . ., u k jsou libovolné vektory v reálném vektorovém prostoru V se skalárním součinem. Potom (a) G(ui,. . . , U/c) je kladně semidefinitnísymetrická matice; (b) vektory Ui,.. . , u k jsou lineárně nezávislé právě tehdy když G(ui,. . . , Uk) je kladně definitní. Gramová matice Tvrzení Nechť Ui,. . ., u k jsou libovolné vektory v reálném vektorovém prostoru V se skalárním součinem. Potom (a) G(ui,. . . , U/c) je kladně semidefinitnísymetrická matice; (b) vektory Ui,.. . , u k jsou lineárně nezávislé právě tehdy když G(ui,. . . , Uk) je kladně definitní. Důsledek Pro libovolné Ui,. . . , G V platí |G(ui,. . . , Uk)\ > 0. Přitom |G(ui,. .. , Uk)\ = 0 právě tehdy když vektory Ui,. . ., Uk jsou lineárně závislé. Gramová matice Tvrzení Nechť Ui,. . ., U/t jsou libovolné vektory v reálném vektorovém prostoru V se skalárním součinem. Potom (a) G(ui,..., U/c) je kladně semidefinitnísymetrická matice; (b) vektory Ui,..., u k jsou lineárně nezávislé právě tehdy když G(ui,..., Uk) je kladně definitní. Důsledek Pro libovolné Ui,. . . , G V platí |G(ui,..., u^)| |G(ui, ..., Uk)\ = 0 právě tehdy když vektory Ui, . lineárně závislé. Speciálně pro libovolné dva vektory u,v G V platí > 0. Přitom ,uk jsou G(u,v)| = u, u v, u u,v v, v = (U,U)(V,V> - U,V h V, U u v - u, v > o přičemž rovnost nastane právě tehdy, když vektory u, v jsou mearne závisle auchyho-Schwartzova nerovnost I Tím je dokázaná tzv. Cauchyho-Schwartzova nerovnost pro reálné vektorové prostory: Věta (^Cauchyho-Schwartzova nerovnostJ Pro libovolné vektory u, v G V v prostoru V nad IR nebo C se skalárním součinem platí < u v přičemž rovnost nastane právě tehdy, když vektory u, v jsou lineárně závislé. auchyho-Schwartzova nerovnost I Tím je dokázaná tzv. Cauchyho-Schwartzova nerovnost pro reálné vektorové prostory: Věta (^Cauchyho-Schwartzova nerovnostJ Pro libovolné vektory u, v G V v prostoru V nad IR nebo C se skalárním součinem platí < u v přičemž rovnost nastane právě tehdy když vektory u, v jsou lineárně závislé. Pro skalární součin na IRn to znamená, že *iyi+*2y2H-----hxnyn < Jxl + xf h-----hx% Jyi+y%-\-----Vyl Cauchyho-Schwartzova nerovnost Pro skalární součin na C[a, b] to znamená, že b I rb I rb f(x)g(x)áx 0 pro každé x G V. Z oddělitelnosti máme ||x|| > 0 pro každé O^xG V. Délka vektoru Reálný či komplexní vektorový prostor V s normou nazýváme normovaný prostor. Intuitivně sa na normovaný prostor díváme jako na vektorový prostor, ve kterém můžeme měřit délky vektorů. Délka vektoru Reálný či komplexní vektorový prostor V s normou nazýváme normovaný prostor. Intuitivně sa na normovaný prostor díváme jako na vektorový prostor, ve kterém můžeme měřit délky vektorů. Tři definující podmínky pro normu zaručují, že takovéto měření délek, tj. přiřazení x i—>> ||x||, má rozumné vlastnosti, jaké od délek očekáváme. Délka vektoru Reálný či komplexní vektorový prostor V s normou nazýváme normovaný prostor. Intuitivně sa na normovaný prostor díváme jako na vektorový prostor, ve kterém můžeme měřit délky vektorů. Tři definující podmínky pro normu zaručují, že takovéto měření délek, tj. přiřazení x i—>> ||x||, má rozumné vlastnosti, jaké od délek očekáváme. Vzdáleností bodů x, y ve vektorovém prostoru V s normou nazýváme délku vektoru x — y, t.j. číslo ||x — y| . Pomocí vzdálenosti bodů můžeme trojúhelníkovou nerovnost vyjádřit jiným, ekvivalentním způsobem: x-y + y-z > x — z pro všechny x, y, z G V. Délka vektoru Tvrzení Nechť V je reálný či komplexní vektorový prostor se skalárním součinem. Rovností x = \ x, X je definovaná norma na V. Tvrzení Nechť V je reálný vektorový prostor se skalárním součinem. Potom pro libovolné nenulové vektory x, y G V platí: (a) <(x,y) = 0 ^ (3 c G R)(c > 0 & x = cy); (b) <(x,y) = 7ľ & (3 c G R)(c < 0 & x = cy); (cj <(x,y) = tt/2 ^ x JL y; (d) <(-x,y) = <(x, -y) = 7T-<(x,y)f <(-x,-y) = <(x,y). Délka vektoru a Cauchyho-Schwartzova nerovnost IV Tvrzení Nechť V je vektorový prostor se skalárním součinem. Potom pro libovolné nenulové vektory x, y G V platí: (a) (^kosinová věta) x + y 2_ X 2 + y 2 + 2 X y x-y 2_ X 2 + y 2-2 X y (b) (Pythagorova veta) x _L y x + y 2_ x-y 2 _ + y (c) (pravidlo rovnoběžníka^ x + y||2 + ||x-y||2 = 2(||x||2 + ||y||2); (d) (úhlopříčky kosoštvorce jsou na sebe kolméj Ortogonální a ortonormální báze I Uspořádaná /c-tice ex = (iii,. .. , u^) vektorů z vektorového prostoru se skalárním součinem V, se nazývá ortogonální, pokud u i _L Uj pro všechna 1 < / < j < /c. Říkáme též, že vektory Ui,..., jsou (navzájem) ortogonální neboli kolmé. Ortogonální a ortonormální báze I Uspořádaná /c-tice ex = (iii,. .. , u^) vektorů z vektorového prostoru se skalárním součinem V, se nazývá ortogonální, pokud u i _L Uj pro všechna 1 < / < j < /c. Říkáme též, že vektory Ui,..., jsou (navzájem) ortogonální neboli kolmé. Uspořádaná /c-tice (ui,..., Uk) sa nazývá ortonormální, pokud je ortogonální a ||u/|| = 1 pro všechna / < k. Říkáme, že vektory Ui,..., U/f tvoří ortonormální systém. Ortogonální a ortonormální báze I Uspořádaná /c-tice ex = (iii,. .. , Uk) vektorů z vektorového prostoru se skalárním součinem V, se nazývá ortogonální, pokud u i _L Uj pro všechna 1 < / < j < /c. Říkáme též, že vektory Ui,..., jsou (navzájem) ortogonální neboli kolmé. Uspořádaná /c-tice (ui,..., Uk) sa nazývá ortonormální, pokud je ortogonální a ||u/|| = 1 pro všechna / < k. Říkáme, že vektory Ui,..., U/f tvoří ortonormální systém. Podobně můžeme definovat pojmy ortogonálnosti a ortonormálnosti i pro nekonečné posloupnosti (u/J^Lq vektorů z V, případně pro množiny X C V. Ortogonální a ortonormální báze II Tvrzení Nechť V je vektorový prostor so skalárním součinem. Potom pro libovolnou k-tici ol = (ui,. . . , U/J 6 Vk platí: (a) ex je ortogonální právě tehdy, když její Gramová matice G(cx) je diagonální; (b) ex je ortonormální právě tehdy když G(cx) = l/c- Ortogonální a ortonormální báze II Tvrzení Nechť V je vektorový prostor so skalárním součinem. Potom pro libovolnou k-tici ol = (ui,. . . , U/J 6 Vk platí: (a) ex je ortogonální právě tehdy, když její Gramová matice G(cx) je diagonální; (b) ex je ortonormální právě tehdy, když G(cx) = l/c-Důsledek Pokud Ui,.. . , Ufc G V jsou navzájem kolmé nenulové vektory, speciálně, pokud Ui,. .. , u k tvoří ortonormální systém, tak jsou lineárně nezávislé. Ortogonální a ortonormální báze II Tvrzení Nechť V je vektorový prostor so skalárním součinem. Potom pro libovolnou k-tici ol = (ui,. . . , U/J 6 Vk platí: (a) ex je ortogonální právě tehdy, když její Gramová matice G(cx) je diagonální; (b) ex je ortonormální právě tehdy když G(cx) = l/c-Důsledek Pokud Ui,.. . , Ufc G V jsou navzájem kolmé nenulové vektory speciálně, pokud Ui,. .. , u k tvoří ortonormální systém, tak jsou lineárně nezávislé. Věta Každý euklidovský prostor má ortonormální bázi. Ortogonální a ortonormální báze III Tvrzení Nechť ex = (ui,. .. , un) je ortonormální báze euklidovského prostoru V. Potom pro libovolné vektory x, y G V platí: (a) n X = J^(X,U/)U/, ;=1 (x)a = ((X, Ui), . . . , (X,U„ (b) (x,y) = Eľ=i(x,u/)(u/,y); (c) ||: T 2 = Er=i(x,u/)2. Podmínka (c), stejně jako její nekonečně rozměrná varianta, se nazývá Parsevalova rovnost. Gramův-Schmidtův ortogonalizační proces I Popíšeme algoritmus, který umožňuje sestrojit ortonormální báze, známý pod názvem Gramův-Schmidtův ortogonalizační proces. Gramův-Schmidtův ortogonalizační proces Popíšeme algoritmus, který umožňuje sestrojit ortonormální báze, známý pod názvem Gramův-Schmidtův ortogonalizační proces. Nechť V je vektorový prostor se skalárním součinem a Ui,.. . , un G V jsou lineárně nezávislé vektory. Gramův-Schmidtův ortogonalizační proces I Popíšeme algoritmus, který umožňuje sestrojit ortonormální báze, známý pod názvem Gramův-Schmidtův ortogonalizační proces. Nechť V je vektorový prostor se skalárním součinem a Ui,.. . , un G V jsou lineárně nezávislé vektory. Chceme sestrojit ortogonální vektory Vi,. .. , vn tak, aby pro každé k < n platilo [Vi,...,Vfr] = [ui,...,u*]. Gramův-Schmidtův ortogonalizační proces Popíšeme algoritmus, který umožňuje sestrojit ortonormální báze, známý pod názvem Gramův-Schmidtův ortogonalizační proces. Nechť V je vektorový prostor se skalárním součinem a Ui,.. . , un G V jsou lineárně nezávislé vektory. Chceme sestrojit ortogonální vektory Vi,. .. , vn tak, aby pro každé k < n platilo [Vi,...,Vfr] = [ui,...,u*]. Pokud položíme Vi = Ui, tak samozřejmě [vi] = [ui]. Vektor v2 G [ui, u2] = [vi, u2] budeme hledat ve tvaru v2 = av! + bu2, kde a, b G IR. Pokud má však platit [vi, v2] = [ui, u2], musí být b ^ 0 To nejlépe dosáhneme volbou b = 1. Gramův-Schmidtův ortogonalizační proces la Gramův-Schmidtův ortogonalizační proces Ib - obrácené pořadí vektorů Vi == Ui Gram ův-Sch m idtův ortogonalizační proces Navíc vektor v2 = u2 + avi má být kolmý na vektor Vi, tj 0 = (v2, vi) = (u2, vi) + a(vi, vi). Odtud dostáváme a = — U2, Vl Vl, Vi Gramův-Schmidtův ortogonalizační proces Navíc vektor v2 = u2 + avi má být kolmý na vektor Vi, t j 0 = (v2, vi) = (u2, vi) + a(vi, vi). Odtud dostáváme a = — Vl, Vi Předpokládejme, že 2 < k < n a už jsme sestrojili ortogonální vektory Vi,.. . , Vk-i takové, že pro každé 1 < / < k — 1 platí [Vi,...,V/] = [Ui,...,U/]. Gramův-Schmidtův ortogonalizační proces Navíc vektor v2 = U2 + avi má být kolmý na vektor Vi, t j 0 = (v2, vi) = (u2, vi) + a(vi, vi). Odtud dostáváme a = — Vl, Vi Předpokládejme, že 2 < k < n a už jsme sestrojili ortogonální vektory Vi,.. . , Vk-i takové, že pro každé 1 < / < k — 1 platí [Vi,...,V/] = [Ui,...,U/]. Poučení případem k = 2 budeme vektor v/c G [ui,..., U/f-i, U/c] = [vi,..., V/f-i, U/c] hledat ve tvaru v/, = uk + aivi H-----h afc_iVfr_if kde ai,..., a/r-i G IR. Gramův-Schmidtův ortogonalizační proces Navíc vektor musí být kolmý na každý z vektorů v,- pro 1 < / < k - 1, tj. k-i 0 = (v*, v/) = (uk, v/) + ^2 aj(yJiv'') = (u^>v/) + a''(v 7=1 neboť dle našeho předpokladu (vy, v,-) = 0 pro 7 7^ /. Gramův-Schmidtův ortogonalizační proces Navíc vektor musí být kolmý na každý z vektorů v,- pro 1 < i < k - 1, tj. k-l 0 = (vk, v,-} = (u*, v/) + ay(vy, v,-) = (uk, v,-) + ař-(v neboť dle našeho předpokladu (vy, v,-} = 0 pro_/ 7^ /. Z tohoto důvodu a/ = v,, v, Gramův-Schmidtův ortogonalizační proces IV Věta Nechť V je vektorový prostor se skalárním součinem a Ui,.. . , un G V jsou lineárně nezávislé vektory. Vektory Vi,. . ., vn £ V definujeme pomocí rekurze: k-l Vi = Ui ;=1 Ufc, V, V/, V/ V/, pro 1 < k < n. Potom Vi,..., v„ Jsou ortogonální vektory a pro každé 1 < k < n platí [vi,..., vfc] = [ui,..., ufc]. Speciálně, pokud Ui,..., u„ _/e táze prostoru V, tak Vi,..., v„ _/e ortogonální báze prostoru V; potom vektory Vl V, • • •, ||vj| 1vn ti/on ortonormální bázi prostoru V Gramův-Schmidtův ortogonalizační proces V Příklad Na základě Sylvestrova kritéria vidíme, že symetrická matice A = e IR 3x3 je kladně definitní. To znamená, že předpisem x,y) =xT- A y je definovaný skalární součin na (sloupcovém) prostoru IRs Gramův-Schmidtův ortogonalizační proces V Příklad Na základě Sylvestrova kritéria vidíme, že symetrická matice A = G IR 3x3 je kladně definitní. To znamená, že předpisem x,y) =xT- A y je definovaný skalární součin na (sloupcovém) prostoru IR3. Aplikací Gramův-Schmidtova ortogonalizačního procesu na kanonickou bázi (ei,e2,es) sestrojíme ortogonální bázi (vi,V2 prostoru IR3 s uvedeným skalárním součinem: Gramův-Schmidtův ortogonalizační proces VI = ei v2 = e2 V3 = e3 T = «2 - MÁ V! = 62 - i Vi = (-1/2, 1, 0)T (e3,vi) (e3,v2) v2 (Vi,Vi) Vl ~ (v2,v2> = e3 + ivi-|v2 = (2/3,-l/3,l)T, Totiž (e2,vi) = 1, (vi,vi) = 2, (e3,vi) = -1, (e3,v2) = 1/2 a (v2,v2) = 3/2. Pokud ještě dopočítáme (v3,v3) = 7/3, dostaneme délky jednotlivých vektorů ||vi|| = \/2, ||v2|| = \/3/2, ||v3|| = \/7/3. Príslušná ortonormální báze je potom tvořená vektory 1 1 Vl = V2 V2 Gramův-Schmidtův OP a QR-rozklad VII Nechť V = Mm se standardním skalárním součinem a Ui,.. . , un G Km jsou lineárně nezávislé vektory, tedy n < m. Víme, že pomocí Gramova-Schmidtova ortogonalizačního procesu můžeme najít ortogonální (a tedy nenulové) vektory Vi,. . . , vn tak, že ui=vx a uk= ^——-V/ + v*, pro 1 < k < n. Položme A = (ui,..., u„) a Q = (vi,..., v„) Gramův-Schmidtův OP a QR-rozklad VII Nechť V = Mm se standardním skalárním součinem a Ui,.. . , un G Km jsou lineárně nezávislé vektory, tedy n < m. Víme, že pomocí Gramova-Schmidtova ortogonalizačního procesu můžeme najít ortogonální (a tedy nenulové) vektory Vi,. . . , vn tak, že ui=vx a uk= ^——-V/ + v*, pro 1 < k < n. Položme A = (ui,..., un) a Q = (vi,..., vn) Pak A a Q jsou typu m x n a hodnosti n, navíc QT Q = \n. Dále definujme regulární matici R = (r/,-) typu n x r? jako horní trojúhelníkovou matici s prvky r,y = yl| pro všechna j < n a / < j, rjj = 1 pro všechna j < n, a r// = 0 pro všechna j < n a j < i. Gramův-Schmidtův OP a QR-rozklad VII Nechť V = Mm se standardním skalárním součinem a Ui,.. . , un G IRm jsou lineárně nezávislé vektory, tedy n < m. Víme, že pomocí Gramova-Schmidtova ortogonalizačního procesu můžeme najít ortogonální (a tedy nenulové) vektory Vi,. . . , vn tak, že Ui = Vi U/c = u/o v; V/, V/ pro 1 < /c < n. Položme A = (ui,..., u„) a Q = (vi,..., vn). Pak A a Q jsou typu m x n a hodnosti n, navíc QT Q = \n. Dále definujme regulární matici R = (r/,-) typu r? x r? jako horní trojúhelníkovou matici s prvky r,y = yl| pi'o všechna j < n a i < j, rjj = 1 pro všechna j < n, a r;j = 0 pro všechna j < n a j < i. Máme tedy A = Q • R, tedy tzv. QR-rozklad matice A (pro ověření stačí porovnat k-tý sloupec matice A, tedy uk s /c-tým sloupcem součinu Q • R, tj. se součinem Q • s/(R), což je právě výše uvedená rovnost). Gramův-Schmidtův ortogonalizační proces jinak VIII Gramovu-Schmidtovu ortogonalizaci lze alternativně provést pomocí vhodných úprav jistých matic. Pokud je a = (ui,..., un) lineárně nezávislá r?-tice vektorů v prostoru se skalárním součinem V, tak její Gramová matice G(a) je pozitivně definitní a je to zároveň matice skalárního součinu zúženého na vektorový pod prostor S = [ Ui,..., un] C \/ v bázi a. Gramův-Schmidtův ortogonalizační proces jinak VIII Gramovu-Schmidtovu ortogonalizaci lze alternativně provést pomocí vhodných úprav jistých matic. Pokud je a = (ui,..., un) lineárně nezávislá r?-tice vektorů v prostoru se skalárním součinem V, tak její Gramová matice G(a) je pozitivně definitní a je to zároveň matice skalárního součinu zúženého na vektorový pod prostor S = [ Ui,..., un] C \/ v bázi ex. Podle Jacobiho věty a Sylvestrova kritéria můžeme výlučně úpravami typu (1+) upravit G(a) na diagonální tvar D = diag(cfi,..., dn) s kladnými prvky na diagonále. Elementární sloupcové operace odpovídající těmto úpravám postupně provedené na matici ln nás přivádí k horní trojúhelníkové matici P = (pij) G Rnxn s jedničkami na diagonále, t.j. p\\ — 1 a Pij = 0 pro všechna / < n a j < i. Gramův-Schmidtův ortogonalizační proces jinak VIII Gramovu-Schmidtovu ortogonalizaci lze alternativně provést pomocí vhodných úprav jistých matic. Pokud je a = (ui,..., un) lineárně nezávislá r?-tice vektorů v prostoru se skalárním součinem V, tak její Gramová matice G(a) je pozitivně definitní a je to zároveň matice skalárního součinu zúženého na vektorový pod prostor S = [ Ui,..., un] C \/ v bázi a. Podle Jacobiho věty a Sylvestrova kritéria můžeme výlučně úpravami typu (1+) upravit G(a) na diagonální tvar D = diag(cfi,..., dn) s kladnými prvky na diagonále. Elementární sloupcové operace odpovídající těmto úpravám postupně provedené na matici ln nás přivádí k horní trojúhelníkové matici P = (pij) £ Rnxn s jedničkami na diagonále, t.j. p\\ — 1 a Pij = 0 pro všechna / < n a j < i. Pokud položíme OL • P = 0 = (Vi, . . . ,V„), tak P = Pq,?/3, t.j. P je maticí přechodu z báze (3 do báze a. Gramův-Schmidtův ortogonalizační proces jinak IX Potom D je maticí skalárního součinu zúženého na podprostor S v bázi (3 a tedy G(/3) = D. Proto je (3 ortogonální báze podprostoru S. Navíc, vzhledem ke tvaru matice P, platí k-l Vl = ui a Mk = Uk + ^ PikUi i=l pro 1 < k < n. Gramův-Schmidtův ortogonalizační proces jinak IX Potom D je maticí skalárního součinu zúženého na podprostor S v bázi (3 a tedy G(/3) = D. Proto je (3 ortogonální báze podprostoru S. Navíc, vzhledem ke tvaru matice P, platí k-l vi = ui a \ik = uk + J^p/frU/, i=i pro 1 < k < n. Nutně tedy pro všechna k < n platí [vi,...,vjj = [ui,...,uaJ. Rovněž normy vektorů si můžeme přečíst přímo z matice D. Platí totiž dk = \\vk\\2 pro každé k < n. Tedy příslušná ortonormální báze je tvořená vektory (l/y/ď[)\fi,..., (1 /y/ďij)vn. Tento poslední krok můžeme realizovat úpravami vynásobení sloupce nenulovým skalárem matice D = G(/3) a příslušnými ESO na matici P. Gramův-Schmidtův ortogonalizační proces jinak X Pokud V = Mm s jakýmkoliv (tj. ne nutně standardním skalárním součinem), tak po ztotožnění báze a s maticí, jejíž sloupce jsou vektory této báze, lze k bázi (3 dospět přímo (tj. bez matice P), vykonáním příslušných ESO na matici a. Gramův-Schmidtův ortogonalizační proces jinak X Pokud V = Mm s jakýmkoliv (tj. ne nutně standardním skalárním součinem), tak po ztotožnění báze a s maticí, jejíž sloupce jsou vektory této báze, lze k bázi (3 dospět přímo (tj. bez matice P), vykonáním příslušných ESO na matici a. Příklad Použijeme nyní výše uvedenou metodu na již dříve definovaný skalární součin pomocí pozitivně definitní matice A, kde A = 3x3 Uvedená matice A je zároveň Gramovou maticí G(s). Nejprve pomocí prvku na místě (1,1) vynulujeme ostatní prvky prvního řádku i sloupce. Potom pomocí prvku na místě (2,2) vynulujeme prvky na místech (2,3) a (3,2) Gramův-Schmidtův ortogonalizační proces jinak XI l 2 1 -1 1 0 0 \ / 2 0 0 100 \ 1 2 0 0 1 0 1 3/ '21/2 010 -1 0 3 0 0 1 1 V '2 5/2 001 /""v j 1 0 0 1- V '21/2 f 0 1 0 0 1 0 V o 0 1 / V 0 0 1 / I2 0 0 100 \ 0 0 100 0 3/ 12 1, 12 -1/210 0 3, 12 0 -1/210 0 1, 12 5, 12 1/2 01 0 1, 12 7/3 1/201 1-1/ 12 1, 12 ( 1 -1, 12 2/3 0 1 0 0 1 -1/3 0 1 / \o 0 1 Gramův-Schmidtův ortogonalizační proces jinak XII (2 0 0 0 3/ 12 0 0 1/ 12 7/ 'Z 1 -1/ 12 2/ 13 0 1 -1/ 13 \o 0 1 100 ^ 1/210 1/201 /2 0 o 0 3/2 0 1 0 1/2 1 0 o o 7/3 2/3 1/3 1 1 00 ^ 1/2 10 2/3-1/31 2 0 0 G(/3) = | 0 3/2 0 0 0 7/3 1 -1/2 2/3 /3 = | 0 1 -1/3 0 0 1