Ortogonální pod
oooooooooo
Matematika I - 9. přednáška Euklidovské prostory, skalární součin
Michal Bulant
Masarykova univerzita Fakulta informatiky
1. 4. 2009
□ S
Obsah přednášky
Q Euklidovské prostory
Q Vektorové prostory se skalárním součinem
Ortogonální podmnožiny a podprostory
• Ortogonální matice
• Gram-Schmidtův ortogonalizační proces
□ s
Doporučene zdroje
• Martin Panák, Jan Slovák - Drsná matematika, e-text.
• Roman Hilscher - MB101, e-text.
• Slidy z přednášek a democvičeni
□ s -
Doporučene zdroje
• Martin Panák, Jan Slovák - Drsná matematika, e-text.
• Roman Hilscher - MB101, e-text.
• Slidy z přednášek a democvičení
• Pavel Horák, Úvod do lineárni algebry, MU Brno, skripta
(http://www.math.muni.cz/~horak)
• Luboš Motl, Miloš Zahradník, Pěstujeme lineární algebru, 3. vydání, Univerzita Karlova v Praze, Karolinum, 348 stran (elektronické vydání také na http://www.kolej.mff.cuni.cz/~lmotm275/skripta/).
Plan přednášky
Q Euklidovské prostory
:ory se skalárním
Ortogonální podmnožiny a podprostory
• Ortogonální matice
• Gram-Schmidtův ortogonalizační proces
n S - = -E -00*0
Euklidovské prostory
Do vektorového prostoru (Rn, +, •) nyní doplníme další strukturu, abychom dokázali odvodit více informací např. o vzájemné poloze vektorů, podprostoru, délce, vzdálenosti, úhlech, atd. Budeme zkoumat otázky typu
• Jak daleko leží nějaký bod od podprostoru?
Euklidovské prostory
Do vektorového prostoru (Rn, +, •) nyní doplníme další strukturu, abychom dokázali odvodit více informací např. o vzájemné poloze vektorů, podprostoru, délce, vzdálenosti, úhlech, atd. Budeme zkoumat otázky typu
• Jak daleko leží nějaký bod od podprostoru?
• Který bod v podprostoru je nejblíže k nějakému zvolenému bodu (který leží mimo tento podprostor)?
Skalární součin
Již dříve jsme definovali skalární součin dvou vektorů u, v G M" jako číslo
u ■ v = U\ ví -\--------\- unvn.
(To lze zapsat i pomocí maticového násobení jako uT ■ v, pokud chápeme vektory v R" jako sloupcové vektory.) Evidentně platí vztah symetrie u ■ v = v ■ u.
□ s -
Skalární součin
Již dříve jsme definovali skalární součin dvou vektorů u, v G R" jako číslo
u ■ v = U\ ví -\--------\- unvn.
(To lze zapsat i pomocí maticového násobení jako uT ■ v, pokud
chápeme vektory v R" jako sloupcové vektory.) Evidentně platí
vztah symetrie u ■ v = v ■ u.
Vektorový prostor R" s výše uvedeným skalárním součinem
nazýváme Euklidovský (vektorový) prostor.
Délka (též norma) vektoru u G R" je pak definována jako
V u ■ u
ui +
+ <
Ortogonální pod
oooooooooo
Úhel mezi dvěma nenulovými vektory u, 1/ e K" je číslo ip G [0,7r] splňující
u ■ v = \\u\\ \\v\\ cosíp, tj. cos
^. Rovnost přitom nastává, jsou-li zmíněné vektory lineárně závislé, tj. je-li x = 2t,y = 4ř, t G R, odkud t = ^ a (x,y) = (^, ^).
□ S
Kolmost vektoru
Definice
Řekneme, že vektory u a v jsou navzájem kolmé (též ortogonální), pokud je jejich skalární součin roven nule, tj. pokud u ■ v = 0. Píšeme u _L v. To zřejmě nastane pokud je jeden z těchto vektorů nulový vektor OgR" nebo pokud svírají tyto vektory pravý úhel, tj. cosip = 0.
Kolmost vektoru
Definice
Řekneme, že vektory u a v jsou navzájem kolmé (též ortogonální), pokud je jejich skalární součin roven nule, tj. pokud u ■ v = 0. Píšeme u _L v. To zřejmě nastane pokud je jeden z těchto vektorů nulový vektor OgR" nebo pokud svírají tyto vektory pravý úhel, tj. cosip = 0.
Příklad
Kolmost vektoru
Definice
Řekneme, že vektory u a v jsou navzájem kolmé (též ortogonální), pokud je jejich skalární součin roven nule, tj. pokud u ■ v = 0. Píšeme u _L v. To zřejmě nastane pokud je jeden z těchto vektorů nulový vektor OgR" nebo pokud svírají tyto vektory pravý úhel, tj. cosip = 0.
Příklad
(a) Nulový vektor 0 G M" je kolmý na libovolný vektor u G
(b) Vektory (2, -1) a (1,2) jsou kolmé.
Kolmost vektoru
Definice
Řekneme, že vektory u a v jsou navzájem kolmé (též ortogonální), pokud je jejich skalární součin roven nule, tj. pokud u ■ v = 0. Píšeme u _L v. To zřejmě nastane pokud je jeden z těchto vektorů nulový vektor OgR" nebo pokud svírají tyto vektory pravý úhel, tj. cosip = 0.
Příklad
(a) Nulový vektor 0 G M" je kolmý na libovolný vektor u G I
(b) Vektory (2, -1) a (1,2) jsou kolmé.
(c) Vektory standardní báze e = (ei,..., e„) jsou navzájem kolmé, tj. e; _L e,- pro / ^ j.
Kolmost vektoru
Definice
Řekneme, že vektory u a v jsou navzájem kolmé (též ortogonální), pokud je jejich skalární součin roven nule, tj. pokud u ■ v = 0. Píšeme u _L v. To zřejmě nastane pokud je jeden z těchto vektorů nulový vektor OgR" nebo pokud svírají tyto vektory pravý úhel, tj. cosip = 0.
Příklad
(a) Nulový vektor 0 G M" je kolmý na libovolný vektor u G M".
(b) Vektory (2, -1) a (1,2) jsou kolmé.
(c) Vektory standardní báze e = (ei,..., e„) jsou navzájem kolmé, tj. e; _L e,- pro / ^ j.
(d) Normálový vektor N roviny p C R3 je kolmý na tuto rovinu, tj. na všechny vektory u ležící v rovině p.
•t
IS
Kolmost podprostoru prostoru R" definujeme stejně jako kolmost jednotlivých vektorů, jen musí být příslušný skalární součin nulový pro všechny vektory z daných podprostoru.
Definice
Podprostory X a Y prostoru R" jsou navzájem kolmé (též ortogonální), pokud
u _L v (tj. u ■ v = 0) pro všechny vektory u G X, v E Y.
Definice
Je-li Y podprostor Euklidovského prostoru R", potom se množina
Y := {u G R", u -L v pro všechny vektory v G Y]
nazýva ortogonální komplement (doplněk) podprostoru Y (v
prostoru R").
Y1- je tedy množina všech vektorů, které jsou kolmé na všechny vektory v podprostoru Y.
□ s
Definice
Je-li Y podprostor Euklidovského prostoru R", potom se množina
Y± := {u G R", u -L v pro všechn y vektory v G Y]
nazývá ortogoná ní komplement (doplněk) podprostoru Y (v
prostoru R").
Y je tedy množina všech vektorů, které jsou kolmé na všechny vektory v podprostoru Y.
Příklad ^
(a) Pro V = ■ nazýváme skalární součin (též vnitřní součin z angl. inner product) na prostoru V, pokud má následující vlastnosti:
(i) je tzv. pozitivně definitní, tj.
(u, u) > 0, přičemž (u, u) = 0 <ř» u = 0,
(ii) je symetrické, tj. (u, v) = (v, u),
(iii) je lineární v první složce, tj.
{a • u + b • v, w) = a. {u, w) + b. {v, w).
Ortogonální pod
oooooooooo
Příklad
(a) V prostoru R" můžeme zvolit
n
(u, v) := u ■ v = 2_\ ui vi (obvyklý skalární součin), ;=i
případně pro pevně zvolená kladná čísla w\,... ,wn lze
n
(u, v) := y^ wi Ui v/ (skalární součin s vahou w\,..., wn). ;=i
-/'j
Ortogonální pod
oooooooooo
Příklad
(a) V prostoru R" můžeme zvolit
n
(u, v) := u ■ v = 2_\ ui vi (obvyklý skalární součin), ;=i
případně pro pevně zvolená kladná čísla w\,... ,wn lze
n
(u, v) := y^ wi Ui v/ (skalární součin s vahou w\,..., wn). ;=i
(b) V prostoru Matmxn můžeme zvolit
m n
;=i 7=1
Tj. vynásobíme prvky na stejných pozicích a výsledné součiny sečteme.
Ortogonální pod
oooooooooo
Příklad
(c) viz později v MB102 - v prostoru C[a, b] spojitých funkcí na intervalu [a, b] můžeme zvolit
{f,g)-=J f(x)g(x)dx, případně pro vážený spojitou funkcí w{x) > 0.
Ortogonální pod
oooooooooo
Příklad
(c) viz později v MB102 - v prostoru C[a, b] spojitých funkcí na intervalu [a, b] můžeme zvolit
(f,g)
f(x) g(x) dx,
případně pro vážený spojitou funkcí w{x) > 0. (d) Zvolme n + 1 různých bodů xo,xi, ...,x„Gl Potom v prostoru polynomů stupně nejvýše n můžeme zvolit
(P,q) := J^p(x/)(7(x/).
;=o
Případně opět váženo wq, w\, ..., wn.
Ortogonální pod
oooooooooo
Příklad
(c) viz později v MB102 - v prostoru C[a, b] spojitých funkcí na intervalu [a, b] můžeme zvolit
(f,g)
f (x) g(x) dx,
případně pro vážený spojitou funkcí w{x) > 0. (d) Zvolme n + 1 různých bodů xo,xi, ...,x„Gl Potom v prostoru polynomů stupně nejvýše n můžeme zvolit
n
(P,q) := J^p(x/)(7(x/).
Případně opět váženo m/o, wi,..., wn.
(e) Na vektorovém prostoru všech funkcí f : R —> R skalární součin definovat nelze. (Dokonce zde nelze definovat ani normu, tj. prostor není ani tzv. normovaný prostor, viz dále.)
Délka (norma) vektoru
Definice
Skalární součin (•,•) definuje přirozeným způsobem normu (též délku) každého vektoru u e V předpisem:
VWüJ-
□ s
Délka (norma) vektoru
Definice
Skalární součin (•,•) definuje přirozeným způsobem normu (též délku) každého vektoru u e V předpisem:
VWüJ-
Příklad
(a) V prostoru R" s obvyklým skalárním součinem je
kde u = (xi,...,x„).
Ml = V(u,u) = \lxl H------^xn>
Tuto normu budeme nazývat Euklidovská norma prostoru a značit s indexem 2, tj.
"2
*í +
+ Xn2.
Ortogonální pod
oooooooooo
Příklad
(b) Tzv. Frobeniova norma v prostoru MatmXn je definována jako
;=i 7=1
□ s
Ortogonální pod
oooooooooo
Příklad
(b) Tzv. Frobeniova norma v prostoru MatmXn je definována jako
;=i 7=1
(c) viz MB102 - tzv. /2-norma v prostoru C[a, b] je definována jako
\f\\L*-=yfWJ) = \lfaf2(x)dx.
□ s - = -=. -o<\(y
Ortogonální pod
oooooooooo
Podobně jako v prostoru R" i v libovolném vektorovém prostoru se skalárním součinem platí Cauchyova nerovnost.
Věta (Cauchy-Schwarzova)
Je-li V vektorový prostor se skalárním součinem, potom pro libovolné dva vektory u, v G V platí
\(u,v)\ < \\u\\ \\v\\,
přičemž rovnost nastane právě když jsou vektory u a v lineárně závislé (tj. jeden z nich je násobkem toho druhého).
□ s
Ortogonální pod
oooooooooo
Podobně jako v prostoru R" i v libovolném vektorovém prostoru se skalárním součinem platí Cauchyova nerovnost.
Věta (Cauchy-Schwarzova)
Je-li V vektorový prostor se skalárním součinem, potom pro libovolné dva vektory u, v G V platí
\(u,v)\ < \\u\\ \\v\\,
přičemž rovnost nastane právě když jsou vektory u a v lineárně závislé (tj. jeden z nich je násobkem toho druhého).
Definice
Na základě Cauchyovy nerovnosti definujeme úhel (též odchylka) mezi dvěma vektory u a v jako číslo ■ R nazýváme norma (též délka), pokud má následující vlastnosti:
(i) je tzv. pozitivně definitní, tj. INI — 0, přičemž
0 & u = 0,
(ii) je pozitivně homogenní, tj. ||a.u|| = |a|.||u||, (iii) splňuje trojúhelníkovou nerovnost, tj. ||u + v\\ < \\u\\ + \\v\\.
Ortogonální pod
oooooooooo
Norma na prostoru V tedy přiřazuje každému vektoru u G V (objektům z prostoru V) reálné číslo ||u||. Ověřte si, že norma definovaná pomocí skalárního součinu splňuje výše uvedené vlastnosti normy.
Jak uvidíme níže, na některých vektorových prostorech lze definovat více (i nekonečně mnoho) různých norem || • ||, zatímco na jiných prostorech normu vůbec definovat nelze. Vektorový prostor V, na kterém je definována (nějaká) norma pak nazýváme normovaný vektorový prostor.
□ s
Ortogonální pod
oooooooooo
Norma na prostoru V tedy přiřazuje každému vektoru u G V (objektům z prostoru V) reálné číslo ||u||. Ověřte si, že norma definovaná pomocí skalárního součinu splňuje výše uvedené vlastnosti normy.
Jak uvidíme níže, na některých vektorových prostorech lze definovat více (i nekonečně mnoho) různých norem || • ||, zatímco na jiných prostorech normu vůbec definovat nelze. Vektorový prostor V, na kterém je definována (nějaká) norma pak nazýváme normovaný vektorový prostor.
Viděli jsme některé normy, které jsou na daném vektorovém prostoru indukovány skalárním součinem. Následující příklady jsou také normy na příslušných prostorech (ale tyto normy už nejsou indukovány skalárním součinem).
□ s
Ortogonální pod
oooooooooo
Příklad
O V prostoru R" můžeme definovat např. následující normy: pro iy = (xi,...,xn)eMn
Hli:=El
tzv. 1-norma,
;=i
\uWoo := max x; tzv. stemomerna norma,
Kir
J=i
tzv. p-norma (pro p > 1).
Norma || • H2 uvedená v předchozím příkladu je speciálním případem p-normy pro p = 2. Jako jediná je odvozena ze skalárního součinu. Norma || • ||i je zřejmě také p-norma pro p = 1. V prostorech s normou || • ||p s p 7^ 2 ale např. neplatí Pythagorova věta. Obdobně lze p-normu nebo stejnoměrnou normu definovat i pro prostor matic nebo spojitých funkcí.
:ory se skalárním
Ortogonální podmnožiny a podprostory
• Ortogonální matice
• Gram-Schmidtův ortogonalizační proces
Ortogonální pod
oooooooooo
Ortogonální množina vektorů
Definice
Nechť V je vektorový prostor se skalárním součinem (•, •). Množina vektorů {u\,..., Uk} C V se nazývá ortogonální množina vektorů, pokud u\ _L Uj pro všechny indexy / ^ j.
□ s
Ortogonální pod
oooooooooo
Ortogonální množina vektorů
Definice
Nechť V je vektorový prostor se skalárním součinem (•, •). Množina vektorů {u\,..., Uk} C V se nazývá ortogonální množina vektorů, pokud u\ _L Uj pro všechny indexy / ^ j.
Nechi V je vektorový prostor se skalárním součinem (■, ■). Potom jsou nenulové vektory v libovolné ortogonální množině prostoru V lineárně nezávislé.
□ s
Ortogonální pod
oooooooooo
Ortogonální množina vektorů
Definice
Nechť V je vektorový prostor se skalárním součinem (•, •). Množina vektorů {u\,..., Uk} C V se nazývá ortogonální množina vektorů, pokud u\ _L Uj pro všechny indexy / ^ j.
Nechi V je vektorový prostor se skalárním součinem (■, ■). Potom jsou nenulové vektory v libovolné ortogonální množině prostoru V lineárně nezávislé.
Důkaz.
Snadný: je-li {u\,..., Uk} C V ortogonální, pak z
a\ u\ + ■ ■ ■ + 3k Uk = 0 dostaneme skalárním vynásobením s
vektorem Uj (pro libovolné j)
a\ (ui, Uj)-\--------h aj {uj, Uj)-\--------h ak {uk, uj) = (0, uj) = 0, a tedy
a-, \\u;\\2 = 0, odkud a-, = 0. D
Ortogonální pod
oooooooooo
Definice
Ortogonální množina vektorů {u\,..., Uk} C V se nazývá ortonormální množina, pokud mají všechny vektory u-, velikost 1,
ti. Ikll = 1.
□ S
Ortogonální pod
oooooooooo
Definice
Ortogonální množina vektorů {u\,..., Uk} C V se nazývá ortonormální množina, pokud mají všechny vektory u-, velikost 1,
ti. Ikll = 1.
Poznámka
Zřejmě platí jednoduché tvrzení, že z každé ortogonální množiny lze vytvořit množinu ortonormální, protože stačí každý vektor znormalizovat, tj. místo množiny {u\,..., Uk} C V vzít množinu
"i
Ul,...,
\uk\
Uk
□ s
Ortogonální pod
oooooooooo
Příklad (Fourierova analýza)
Ve vektorovém prostoru C[—L, L] uvažujme skalární součin
1 fL 1
(f,g) := — \ f(x) -g{x) dx tj. váhová funkce je w{x) = -. L J-L L
Potom množina funkcí
rmx
rmx
{-=, cos — , sin—, n = 1,2,3,...)
V2 tvoří ortonormální množinu.
□ s
Ortogonální pod
oooooooooo
Ortonormální báze
Proč je výhodné pracovat ve vektorovém prostoru se skalárním součinem s ortonormální bází ukazují následující tvrzení.
Je-li ti = (ui,..., un) ortonormální báze vektorového prostoru V, potom jsou souřadnice libovolného vektoru w G V v bázi li dány pomocí skalárního součinu vektoru w s bázovými vektory u,, tj.
Mu = (ai,...,an)T, kde
3i
(w,uí), V/ = l,....
n.
□ s -
Ortogonální pod
oooooooooo
Ortonormální báze
Proč je výhodné pracovat ve vektorovém prostoru se skalárním součinem s ortonormální bází ukazují následující tvrzení.
Je-li ti = (ui,..., un) ortonormální báze vektorového prostoru V, potom jsou souřadnice libovolného vektoru w G V v bázi li dány pomocí skalárního součinu vektoru w s bázovými vektory u,, tj.
[w\u_ = (ai,...,an)T, kde
3i
(w,uí), V/ = l,...,n.
Důsledek
Skalární součin dvou libovolných vektorů v, w G V, kde
dim V = n, je roven skalárnímu součinu vektorů jejich souřadnic (v
R"J vzhledem k nějaké ortonormální bázi li prostoru V, tj.
{v,w)V = {[v]u,[w]u)s.n.
Ortogonální matice
Definice
Čtvercová matice Q řádu sloupce tvoří ortonormální QTQ = n je ortogonální množinu vektorů /, tj. Q-1 = matice vR", -QT. , pokud její tj. pokud platí <
□ s
Ortogonální matice
Definice
Čtvercová matice Q řádu sloupce tvoří ortonormální QTQ = n je ortogonální množinu vektorů /, tj. Q-1 = matice vR", -QT. , pokud její tj. pokud platí
Poznámka
Ze vztahu QTQ = I plyne, že každá ortogonální matice je regulární a že determinant každé ortogonální matice je buď 1 nebo —1, neboť
1 = 1/1 = \QTQ\ = |Qr|.|Q| = |Q|2.
Ortogonální
o«oooooo
Příklad
(a) Matice rotace vťo úhel ip v kladném směru
Q
cos (p — s\np s\np cos p
je ortogonální matice a tedy platí
Q-1 = QT = ( cosip siniP\ s\r\p cosp) '
Ortogonální
o«oooooo
Příklad
(a) Matice rotace vťo úhel ip v kladném směru
Q
cos (p — s\np s\np cos p
je ortogonální matice a tedy platí Q"1 = QT = (b) Tzv. permutační matice jsou ortogonální, např.
cosp s\np -sin(/? cosp
0 1
1 0
1 0 0\ /O 0 1
0 0 1, 0 10
0 1 0/ \1 0 0
/O 0 0 1\
0 10 0
10 0 0
\o 0 1 o/
Permutační matice vzniknou z jednotkové matice / tak, že se
r\röh^7/-iii löir r^HU\/ ínůhn cl/~ii i r\/-ö í
B
Je-li Q ortogonální matice řádu n, potom platí
{Qx, Qy) = -- (x,y) pro všechny vektory x jGR",
\\Qxh = z IWI2 pro všechny vektory x G M".
Důkaz.
Plyne snadno z předchozích tvrzení.
□ s - = ■€. -o<\(y
Ortogonální pod
oo«ooooooo
B
Je-li Q ortogonální matice řádu n, potom platí
{Qx, Qy) = -- (x,y) pro všechny vektory x jgR",
\\Qxh = z IWI2 pro všechny vektory x el".
Důkaz.
Plyne snadno z předchozích tvrzení.
Poznámka
Z předchozího plyne jako velmi speciální případ intuitivně zřejmé tvrzení, že rotací v R2 se nemění délka vektorů.
n S - = -E -00*0
Projekce vektoru na podprostor
Necht W je podprostor vektorového prostoru V a necht je dán vektor v E V. Je-li u_ = (u\,... ,Uk) ortonormální báze pod prostoru W, potom má vektor p E W, který je nejblíže k vektoru v, tvar
p = a\ ■ u\ H--------Y ak- uk-,
Platí tedy, že
kde
(v,uí), i = l,...,k.
Ortogonální pod
oooo»ooooo
Protože je V = W © W-1, můžeme vektor v napsat jediným způsobem jako součet
v = p + w, kde p G W, we W^.
Protože jsou bázové vektory u-, G W, je u-, _L w, tj. (uj, w) = 0 V/ = 1,..., k.
Ortogonální pod
oooo»ooooo
Protože je V = W © W-1, můžeme vektor v napsat jediným způsobem jako součet
v = p + w, kde p G W, we W^.
Protože jsou bázové vektory u-, G W, je u-, _L w, tj. (uj, w) = 0 V/ = 1,..., k.
Na druhou stranu, vektor p G W můžeme vyjádřit jako lineární kombinaci bázových vektorů u\,..., u^, tj.
p = a1u1-\--------\-akuk,
odkud již plyne vztah
(v, u i) = (p, u i) + (w, u i) = a\ (ui, u i) H--------h ak (uk, u i)
=o
a i (uí, u i)
a; u;
V/ = 1,..., k.
Poznámka
Z důkazu plyne, že pokud by báze podprostoru 1/1/ nebyla ortonormální, ale jen ortogonální, potom pro koeficienty a,- ve vyjádření projekce p platí
a;
(v, U i) (v, U i)
(u;,U;) \\u;\\2
Tedy projekce p vektoru v na podprostor 1/1/ je pak tvaru
(v,ui) , , (v,uk) P = 7--------r • ui + • • • + t--------r • uk.
{Ul,Ul) {Uk,Uk)
□ s
Vzdálenost a odchylka vektoru od podprostoru
Definice
Číslo v(v, 1/1/) := ||v — p\\ nazýváme vzdálenost vektoru v od podprostoru 1/1/. Odchylka vektoru v od podprostoru 1/1/je definována jako úhel, který svírá vektor v se svou projekcí p na podprostor 1/1/, tj. je to úhel