Odchylka vektorů v euklidovském prostoru En Buď n > 1 přirozené číslo. Vektorový prostor Rn všech n-tic reálných čísel x = (x1, x2, . . . , xn) opatřený standardním skalárním součinem definovaným pro libovolné dva vektory x = (x1, x2, . . . , xn) a y = (y1, y2, . . . , yn) předpisem x, y = x1y1 + x2y2 + · · · + xnyn je euklidovský prostor dimenze n a značí se En. Na tento euklidovský prostor En lze nahlížet také jako na bodový prostor – v tom případě se pro jeho prvky, jimiž jsou pořád všechny n-tice reálných čísel, používá značení X = [x1, x2, . . . , xn]. Jsou-li pak X = [x1, x2, . . . , xn] a Y = [y1, y2, . . . , yn] dva body v En, jejich rozdíl Y − X = (y1 − x1, y2 − x2, . . . , yn − xn) zpravidla bývá považován za vektor vedoucí z bodu X do bodu Y . Vezměme nulový vektor o = (0, 0, . . . , 0) v En, který lze vnímat také jako bod O = [0, 0, . . . , 0] a který je možno považovat za přirozený počátek v euklidovském prostoru En, chápeme-li En jako bodový prostor. Je-li X = [x1, x2, . . . , xn] libovolný bod v En ležící mimo počátek O, pak lze skrze body O a X proložit přímku – jediný jednorozměrný afinní podprostor v En obsahující jmenované dva body. Tyto body O a X pak vytínají na právě zmíněné přímce úsečku OX. Uvažme v této situaci vektor x = X − O, tj. vektor x = (x1, x2, . . . , xn). Délka úsečky OX je potom standardně nazývána euklidovskou normou takto určeného vektoru x a pro tuto normu vektoru x se pak obvykle užívá označení ||x||. Přijmeme-li za intuitivně zřejmý fakt, že v euklidovském prostoru En libovolné dva vektory y a z mající vlastnost, že množiny indexů jejich nenulových složek jsou vzájemně disjunktní, jsou navzájem kolmé v klasickém smyslu, potom vícenásobným použitím Pythagorovy věty odvodíme pro euklidovskou normu ||x|| výše zmíněného vektoru x následující vztah: ||x|| = x2 1 + x2 2 + · · · + x2 n = x, x . Poslední rovnost přitom plyne z výše uvedené definice standardního skalárního součinu užívaného v euklidovském prostoru En. Mějme nyní dva nenulové vektory x = (x1, x2, . . . , xn) a y = (y1, y2, . . . , yn) v euklidovském prostoru En. Jsou-li tyto vektory x, y lineárně nezávislé, generují dvourozměrný vektorový podprostor [x, y] v En. Jsou-li vektory x, y lineárně závislé, pak lze zvolit dvourozměrný vektorový podprostor v En obsahující oba tyto vektory x, y. Bereme-li místo uvedených vektorů jim odpovídající body X = [x1, x2, . . . , xn] a Y = [y1, y2, . . . , yn], takže pak x = X − O a y = Y − O, přičemž oba body X, Y potom leží mimo počátek O, lze tutéž situaci nahlížet následovně. Neleží-li body X, Y a O na přímce, lze jimi proložit rovinu – jediný dvourozměrný afinní podprostor v En obsahující všechny tři jmenované body. V opačném případě lze zvolit rovinu v En procházející počátkem O a obsahující oba body X, Y . Označme η takto získanou rovinu v prostoru En obsahující jeho počátek O a procházející oběma jeho uvažovanými body X a Y . Uvažujme dále polopřímky −−→ OX a −−→ OY v prostoru En vycházející z počátku O a procházející body X a Y . Tyto polopřímky −−→ OX a −−→ OY vytínají v rovině η 1 dutý úhel (nulový úhel, jsou-li tyto polopřímky totožné, případně přímý úhel, jsou-li tyto polopřímky opačné) s vrcholem v počátku O. Označme ϕ tento úhel vyťatý zmíněnými polopřímkami v rovině η. Vrátíme-li se k počátečnímu pohledu z předchozího odstavce na tuto situaci skrze nenulové vektory x = X − O a y = Y − O, pak o úhlu ϕ mluvíme jako o úhlu vektorů x a y v prostoru En a píšeme ϕ = (x, y). Velikostí tohoto úhlu v radiánech pak rozumíme délku oblouku kružnice o jednotkovém poloměru mající střed v počátku O a ležící v rovině η, a to jmenovitě délku oblouku této kružnice vyťatého na ní polopřímkami −−→ OX a −−→ OY týmž způsobem, jímž tyto polopřímky vytínají v rovině η již řečený úhel ϕ. Tuto velikost úhlu ϕ = (x, y) potom nazýváme odchylkou vektorů x a y v prostoru En a značíme ji rovněž symbolem (x, y). Centrálním tématem tohoto textu pak je hledání odpovědi na otázku, jak určit tuto odchylku (x, y) dvou nenulových vektorů x a y v euklidovském prostoru En. Vraťme se ještě jednou k bodům X = [x1, x2, . . . , xn] a Y = [y1, y2, . . . , yn] v En takovým, že x = X − O a y = Y − O. Označme navíc jako z vektor Y −X = (y1 −x1, y2 −x2, . . . , yn −xn). Pak ovšem samozřejmě máme z = y−x. Celá situace v rovině η je ilustrována na následujícím obrázku. O X Y x y z ϕ Klíčem ke zodpovězení posledně položené otázky je dvojí možnost, jak vypočíst délku úsečky XY v rovině η. S ohledem na dříve uvedenou formuli pro euklidovskou normu ||x|| libovolného vektoru x z En zjišťujeme, znovu podle Pythagorovy věty, že délkou zmíněné úsečky XY je právě euklidovská norma ||z|| výše zavedeného vektoru z. Jde tedy řeč o dvojí možnosti, jak stanovit onu euklidovskou normu tohoto vektoru z = y − x. První možnost vychází ze shora uvedené definice standardního skalárního součinu v En a z jeho vlastností (symetrie, bilinearita). Tehdy umocněním již citované formule pro euklidovskou normu vektoru a její aplikací na posledně jmenovaný vektor z obdržíme: ||z||2 = ||y − x||2 = y − x, y − x = y, y − x, y − y, x + x, x = ||x||2 + ||y||2 − 2 x, y . Druhou možností je použití kosinové věty z trigonometrie. Zde je na místě pozna- 2 menat, že klasické odvození kosinové věty se také určitou měrou opírá o intuici. Připomeňme znovu, že euklidovská norma ||z|| vektoru z je délkou úsečky XY . Tato úsečka je ovšem stranou trojúhelníka OXY ležící naproti jeho vnitřnímu úhlu ϕ. Zbývající dvě strany OX a OY tohoto trojúhelníka mají podle výše uvedených poznatků délky ||x|| a ||y||. Podle kosinové věty tedy platí: ||z||2 = ||x||2 + ||y||2 − 2 ||x||·||y||· cos ϕ. Vzpomeneme-li si, že ϕ = (x, y), pak porovnáním posledních dvou vztahů po jednoduché úpravě dostaneme formuli: cos (x, y) = x, y ||x||·||y|| . Toto je tedy onen hledaný vztah pro odchylku dvou nenulových vektorů x a y v prostoru En. Dlužno zde podotknout, že v euklidovském prostoru En, tedy ve vektorovém prostoru Rn se standardním skalárním součinem dost dobře není možné tuto formuli chápat jednoduše přímo jen jako definici odchylky dvou nenulových vektorů, jak se tato odchylka vektorů běžně zavádí v textech z lineární algebry. Je třeba v tomto kontextu současně hledět na tuto formuli jako na výsledek, který byl odvozen, třebas s využitím intuice (byť jen v omezené míře), z elementárních faktů známých z trigonometrie. Z těchto faktů pak zmíněná formule snadno plyne na základě běžných vlastností skalárního součinu. Pokud bychom se ovšem chtěli obejít zcela bez intuice, pak opravdu nezbude, než vzít výše odvozenou formuli prostě za definici odchylky dvou nenulových vektorů v euklidovském prostoru En. Korektnost této definice by pak ale bylo nutno prokázat, což je však snadné na základě Cauchyho-Schwarzovy nerovnosti, o níž je řeč níže a kterou lze odvodit přímo z definičních vlastností skalárního součinu. Nicméně naprosto bez intuice se ani tak obejít nelze. Výše uvedené odvození formule pro odchylku dvou nenulových vektorů v prostoru En opřené do určité míry o intuici přinejmenším potvrzuje, že definice odchylky dvou nenulových vektorů v prostoru En přímo založená na této formuli je tou „správnou” definicí odchylky vektorů v En. Je také na místě připomenout, že funkce kosinus je spojitá klesající funkce na intervalu <0, π> a že zde nabývá hodnot z celého intervalu <−1, 1>. V kontextu s posledně odvozenou formulí to znamená, že pro každé dva nenulové vektory x, y z prostoru En platí nerovnosti −1 x, y ||x||·||y|| 1. Tento fakt je instancí výsledku známého jako Cauchyho-Schwarzova nerovnost. Zde se objevil jako bezprostřední důsledek elementárních úvah (opírajících se do jisté míry o intuici) provedených v euklidovském prostoru En. Zároveň tento fakt znamená, že každé dva nenulové vektory x, y z prostoru En mají podle poslední formule odvozené v předchozím odstavci jednoznačně určenou odchylku (x, y) nacházející se v intervalu <0, π>. 3