Petr Olšák Lineární algebra Praha, 2000-2007 E Text je šířen volně podle licence ftp://math.feld.cvut.cz/pub/olsak/linal/licence.txt. Text ve formátech TEX (csplain), PostScript, dvi, PDF najdete na adrese ftp://math.feld.cvut.cz/pub/olsak/linal/. Verze textu: 31. 7. 2007 Poznámka ke změnám v textu. V září 2006 jsem původní text rozšířil o mnoho nových partií, protože se změnily osnovy algebry pro první ročník otevřením programu STM na naší fakultě. Veškerý nový text jsem připojoval na konce stávajících kapitol, abych zachoval číslování definic a vět původního textu. Na konec první kapitoly o lineárních prostorech jsem připojil text o grupách a tělesech. Na konec druhé kapitoly (o obalech a bázích) jsem vložil Steinitzovu větu o výměně. Na konci kapitoly o maticích přibyly věty o hodnosti součinu matic. Na konec kapitoly o soustavách lineárních rovnic jsem přidal několik dodatků na postupy řešení soustav. Na konec kapitoly o lineárních zobrazeních jsem připojil definici pojmu vlastní číslo a vlastní vektor včetně povídání o základních vlastnostech, jako například podobnost s diagonální maticí. Na konec textu jsem připojil zcela novou kapitolu 10 obsahující úvod do kódování. V červnu 2007 jsem tento text použil ve skriptech [18]. Tam je navíc ke každé kapitole připojena rozsáhlá sbírka cvičení a je přidána kapitola o polynomech. Tyto věci ve verzi volně šířené na internetu nejsou. Zdrojový text volně šířeného textu i skript je společný (veřejně vystavený soubor linal.tex). Překlad textu TEXem se při zpracování skript a internetové verze liší jen na několika místech (viz přepínač \ifbook). Při tisku skript se pochopitelně odkazuje na další zdrojové soubory, které nejsou na internetu zveřejněny. Korektury, které jsem zapracoval při vydání skript, jsou zaneseny i do této verze volně šířeného textu. Změnil jsem značení pro lineární obal řádků matice a dále skládání zobrazení (◦) v nové verzi textu čteme zprava doleva. Při výrobě skript vznikl též seznam literatury a rejstřík, což jsou věci, které jsem nově zařadil i do internetové verze textu. Copyright c RNDr. Petr Olšák, 2000, 2001, 2002, 2003, 2005, 2006, 2007 Obsah Gaussova eliminační metoda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 Úvodní příklad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 Další příklad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Popis metody . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Diskuse po převedení matice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Příklad, kdy soustava nemá řešení . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1. Lineární prostor, grupa, těleso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 Definice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 Věta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 Důkaz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 Definice lineárního prostoru . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 Prostor R2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Prostor Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 Prostor funkcí . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 Prostor polynomů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Lineární podprostor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Průnik prostorů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Prostor orientovaných úseček . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Triviální prostor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 Grupa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 Pologrupa, grupoid . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 Podgrupa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 Těleso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 Galoisovo těleso se dvěma prvky . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 GF(p), Zp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 Lineární prostor nad tělesem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 2. Lineární závislost a nezávislost, lineární obal, báze, dimenze . . . . . . . . . . . . . . . . 18 Lineární kombinace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 Triviální lineární kombinace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 Lineární závislost skupiny . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 Lineární nezávislost skupiny . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 Základní vlastnosti lineární (ne)závislosti . . . . . . . . . . . . . . . . . . . . . . . 21 Jeden vektor je lineární kombinací ostatních . . . . . . . . . . . . . . . . . . . . . 22 Závislost orientovaných úseček . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 Lineární (ne)závislost nekonečných množin . . . . . . . . . . . . . . . . . . . . . . 23 Lineární obal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 Prvek lineárního obalu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 Vlastnosti lineárního obalu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 Lineární obal je podprostor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 Rozšíření LN množiny . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 Charakteristika LN množiny . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 Báze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 Existenece a jednoznačnost báze . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 Báze jsou stejně velké . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 Dimenze prostoru . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 Dimenze podprostoru . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 Počet prvků v LN množině . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 3. Matice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 Definice matice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 Lineární prostor matic . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 Symetrie relace „∼ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 Gaussova eliminace zachovává obal . . . . . . . . . . . . . . . . . . . . . . . . . . 32 Hodnost matice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 Trojúhelníkové matice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 Numericky nestabilní matice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 Transponovaná matice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 Násobení matic . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 Komutující matice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 Matice vektorů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 Jednotková matice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 Inverzní matice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 Regulární, singulární matice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 Výpočet inverzní matice eliminací . . . . . . . . . . . . . . . . . . . . . . . . . . 38 Hodnost součinu matic . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 4. Determinant . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 Permutace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 Znaménko permutace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 Definice determinantu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 Základní vlastnosti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 Metoda počítání determinantu . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 Rozvoj determinantu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 Součin determinantů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 Existence inverzní matice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 5. Soustavy lineárních rovnic . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 Frobeniova věta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 Princip eliminační metody . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 Řešení homogenní soustavy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 Řešení nehomogenní soustavy . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 Strojové řešení soustav . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 Nejednoznačnost zápisu řešení . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 Soustavy se čtvercovou maticí . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 Dodatky k řešení soustav . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 Soustava lineárních soustav . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 6. Více o lineárních prostorech konečné dimenze . . . . . . . . . . . . . . . . . . . . . . . 60 Spojení prostorů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 Dimenze průniku a spojení . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 Souřadnice vektoru . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 Existence a jednoznačnost souřadnic . . . . . . . . . . . . . . . . . . . . . . . . . 62 Matice přechodu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 Souřadnice vektoru a matice přechodu . . . . . . . . . . . . . . . . . . . . . . . . 64 Přechod od báze (B) přes (C) k (D) . . . . . . . . . . . . . . . . . . . . . . . . . 65 Sestavení matic přechodu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 7. Lineární zobrazení . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 Definice zobrazení . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 Zobrazení „na . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 Prosté zobrazení . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 Definice lineárního zobrazení . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 Princip superpozice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 Zachování obalů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 Jádro zobrazení . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 Defekt a hodnost zobrazení . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 Souřadnice jako lineární zobrazení . . . . . . . . . . . . . . . . . . . . . . . . . . 70 Lineární zobrazení na bázi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 Zobrazení lineárně nezávislých vektorů . . . . . . . . . . . . . . . . . . . . . . . . 71 Složené zobrazení . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 Inverzní zobrazení . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 Izomorfismus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 Matice lineárního zobrazení . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 Hodnost matice zobrazení . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 Zobrazení souřadnic . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 Defekt + hodnost zobrazení . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 Matice složeného zobrazení . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 Matice identity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 Zobrazení do stejného prostoru . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 Vlastní číslo, vlastní vektor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 Podobnost s diagonální maticí . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 8. Lineární prostory se skalárním součinem . . . . . . . . . . . . . . . . . . . . . . . . . 83 Definice skalárního součinu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 Skalární součiny na Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 Symetrické a pozitivně definitní matice . . . . . . . . . . . . . . . . . . . . . . . . 84 Velikost vektoru . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 Úhel dvou vektorů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 Vzdálenost vektorů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 Kolmé vektory . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 Ortonormální báze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 Ortogonalizační proces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 9. Aplikace lineární algebry v geometrii . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 Euklidovský prostor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 Souřadnice orientovaných úseček . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 Skalární součin orientovaných úseček . . . . . . . . . . . . . . . . . . . . . . . . . 90 Kolmý průmět vektoru na vektor . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 Ortonormální báze v UO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 Kladně orientovaná báze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 Vektorový součin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 Smíšený součin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 Prostor V3 volných vektorů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 Součet bodu s vektorem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 Přímka a rovina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 Souřadnicový systém v E3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 Rovnice přímky . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 Vzájemná poloha dvou přímek . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 Rovnice roviny . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 Vzájemná poloha přímky a roviny . . . . . . . . . . . . . . . . . . . . . . . . . . 102 Vzájemná poloha dvou rovin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 Souměrné body . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 Tři roviny . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 10. Lineární algebra v teorii kódování . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 Těleso Z2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 Počítání v Z2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 Kód, kódové slovo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 Kódování s detekcí a opravou chyb . . . . . . . . . . . . . . . . . . . . . . . . . . 107 Lineární kód . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 Generující a kontrolní matice . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 Kodér lineárního kódu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 Dekodér lineárního kódu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 Hammingův kód . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114 Rozšířený Hammingův kód . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 11. Literatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 12. Rejstřík . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 Gaussova eliminační metoda Než se pustíme do studia lineárních prostorů a podprostorů, závislosti a nezávislosti vektorů, bází a lineárních obalů, uvedeme si v této úvodní kapitole metodu, která se nám bude často hodit. Protože se k řešení soustav vrátíme podrobněji v kapitole páté, řekneme si zde jen to nejnutnější a budeme se v některých případech vyjadřovat možná poněkud těžkopádně. Vše napravíme v kapitole 5. Gaussova eliminační metoda je metoda usnadňující řešení soustav lineárních rovnic. Soustava lineárních rovnic je jedna nebo (obvykle) více lineárních rovnic, které mají být splněny všechny současně. Lineární rovnice je rovnice, ve které se jedna nebo (obvykle) více neznámých vyskytuje pouze v první mocnině. Neznámé mohou být násobené různými konstantami a tyto násobky se v součtu mají rovnat dané konstantě, tzv. pravé straně. Řešit soustavu rovnic znamená najít řešení, tj. najít taková reálná čísla, která po dosazení za neznámé v rovnicích splňují všechny rovnice současně. Takové řešení může existovat pro danou soustavu jediné, může se ale stát, že je takových řešení více nebo není žádné. Úvodní příklad Metodu si nejprve vysvětlíme na jednoduchém příkladě následující soustavy dvou lineárních rovnic o dvou neznámých x, y: 2x − 5y = 16 − x + 2y = − 7 Ze střední školy asi znáte dvě metody, jak takové soustavy řešit: buď postupným dosazením, nebo násobením rovnic konstantami a vzájemným sčítáním rovnic. Metoda postupného dosazení by mohla vypadat takto: 2x − 5y = 16 ⇒ 2(2y + 7) − 5y = 14 − y = 16 ⇒ y = −2 − x + 2y = − 7 ⇒ x = 2y + 7 ⇒ x = 2(−2) + 7 = 3, ale nemá s Gaussovou eliminační metodou moc společného. Pro rozsáhlejší soustavy (mnoho rovnic, mnoho neznámých) se moc nehodí. Zaměříme se proto na druhou metodu „sčítání rovnic . V této metodě měníme postupně soustavu rovnic na jinou soustavu se stejným řešením. Změny soustavy, které nemění řešení, jsou následující: (1) Prohození rovnic mezi sebou. (2) Vynásobení rovnice nenulovou konstantou. (3) Přičtení libovolného násobku nějaké rovnice k jiné. Pomocí těchto úprav převedeme soustavu rovnic na jinou soustavu, ze které je již řešení snadno čitelné. Jednotlivé modifikace naší soustavy od sebe oddělujeme znakem „∼ . 2x − 5y = 16 − x + 2y = − 7 ∼ 2x − 5y = 16 − 2x + 4y = − 14 ∼ 2x − 5y = 16 0x − y = 2 ∼ 2x − 5y = 16 y = − 2 ∼ 2x + 0y = 6 y = − 2 ∼ x = 3 y = − 2 Nejprve jsme vynásobili druhou rovnici dvěma, pak jsme obě rovnice sečetli a výsledek napsali na místo druhé rovnice, dále jsme druhou rovnici vynásobili číslem −1, pak jsme pětinásobek druhé rovnice přičetli k první a nakonec jsme první rovnici vynásobili číslem 1/2. Z poslední soustavy čteme přímo řešení. Gaussova eliminační metoda je vlastně shodná s právě použitou metodou „sčítání rovnic . Navíc Gaussova metoda upřesňuje postup, jak rovnice násobit a sčítat mezi sebou, abychom se cíleně dobrali k výsledku i u rozsáhlých soustav mnoha rovnic s mnoha neznámými. Než tento postup popíšeme, zamyslíme se nad tím, jak stručně můžeme soustavy rovnic zapisovat. V soustavě rovnic není při hledání řešení podstatné, zda se neznámé jmenují x, y, z nebo třeba α, β, γ. Podstatné jsou jen koeficienty, které násobí jednotlivé neznámé a samozřejmě ještě hodnoty na pravých stranách rovnic. Oddělíme tedy „zrno od plev a vypíšeme z naší soustavy jen to podstatné (koeficienty u neznámých a hodnoty pravých stran) do tabulky čísel, které budeme říkat matice: 2 −5 16 −1 2 −7 Pokud chceme prohodit rovnice, v novém značení to znamená prohodit řádky matice. Vynásobení rovnice nenulovou konstantou odpovídá vynásobení řádku matice touto konstantou. Konečně přičtení násobku jedné rovnice k druhé je totožné s přičtením násobku jednoho řádku ke druhému. Postup řešení našeho příkladu tedy můžeme zapsat takto: 2 −5 16 −1 2 −7 ∼ 2 −5 16 −2 4 −14 ∼ 2 −5 16 0 −1 2 ∼ 2 −5 16 0 1 −2 ∼ 2 0 6 0 1 −2 ∼ 1 0 3 0 1 −2 1 Lineární algebra Gaussova eliminační metoda Další příkladPřed výkladem Gaussovy eliminační metody na obecné soustavě lineárních rovnic si ukážeme postup ještě na jednom příkladu, který bude mít čtyři rovnice a pět neznámých. Příklad je zvolen záměrně tak, aby vycházela malá celá čísla, takže se nám to bude dobře počítat bez použití výpočetní techniky. To je obvyklé v tzv. modelových příkladech, se kterými se setkáte u písemné části zkoušky a při řešení úloh ze skript. Jakmile se ale dostanete k úlohám z praxe, budete postaveni před soustavy třeba s tisíci rovnicemi a se zhruba stejným počtem neznámých. Na malá celá čísla budete muset zapomenout. Bez výpočetní techniky se to pak řešit nedá. Pamatujte tedy, že řešení modelových příkladů ze skript není konečným cílem naší teorie, ale jen pomůckou k pochopení rozsáhlejších souvislostí. Máme řešit následující soustavu lineárních rovnic − 4x1 + 4x2 − x3 + x4 − 7x5 = −11 2x1 − 2x2 + x3 + 3x5 = 4 4x1 − 4x2 + 5x3 + x4 + 7x5 = − 3 − 6x1 + 6x2 − 4x3 + x4 − 12x5 = −7 Koeficienty této soustavy přepíšeme do matice a matici budeme upravovat pomocí tzv. kroků Gaussovy eliminační metody, mezi které patří prohození řádků mezi sebou, vynásobení řádku nenulovou konstantou nebo přičtení libovolného násobku nějakého řádku k jinému.     −4 4 −1 1 −7 −11 2 −2 1 0 3 4 4 −4 5 1 7 −3 −6 6 −4 1 −12 −7     ∼ Nejprve potřebujeme sčítáním násobků řádků dostat nulu pod první prvek v prvním sloupci. Aby se nám to lépe dělalo, prohodíme první řádek s druhým. ∼     2 −2 1 0 3 4 −4 4 −1 1 −7 −11 4 −4 5 1 7 −3 −6 6 −4 1 −12 −7     ∼ Pod dvojkou v prvním sloupci budeme postupně vytvářet nuly. Vezmeme dvojnásobek prvního řádku a přičteme jej ke dru- hému. ∼     2 −2 1 0 3 4 0 0 1 1 −1 −3 4 −4 5 1 7 −3 −6 6 −4 1 −12 −7     ∼ Zatím nemáme v prvním sloupci pod dvojkou všude nuly. Budeme si stále „pomáhat násobky prvního řádku, který opíšeme. Minus dvojnásobek prvního řádku přičteme ke třetímu a trojnásobek prvního řádku přičteme ke čtvrtému. ∼     2 −2 1 0 3 4 0 0 1 1 −1 −3 0 0 3 1 1 −11 0 0 −1 1 −3 5     ∼ Nyní bychom měli vytvářet nuly ve druhém sloupci. To se v tomto případě stalo (výjimečně) samo, takže se zaměříme na třetí sloupec. Tam pod první jedničkou v druhém řádku vytvoříme nuly takto: minus trojnásobek druhého řádku přičteme ke třetímu a dále druhý řádek přičteme ke čtvrtému. První a druhý řádek opisujeme. ∼     2 −2 1 0 3 4 0 0 1 1 −1 −3 0 0 0 −2 4 −2 0 0 0 2 −4 2     ∼ Znovu se přesuneme na další sloupec (tentokrát čtvrtý) a vytvoříme nulu pod minus dvojkou ze třetího řádku. K tomu stačí sečíst třetí řádek se čtvrtým a výsledek napsat na místo čtvrtého řádku. ∼     2 −2 1 0 3 4 0 0 1 1 −1 −3 0 0 0 −2 4 −2 0 0 0 0 0 0     ∼ Třetí řádek ještě (spíše pro parádu) vynásobíme číslem −1/2. Čtvrtý řádek nemusíme psát, protože tento řádek odpovídá rovnici 0x1 + 0x2 + 0x3 + 0x4 + 0x5 = 0, která je zřejmě splněna pro libovolná x1, x2, x3, x4, x5. ∼   2 −2 1 0 3 4 0 0 1 1 −1 −3 0 0 0 1 −2 1   Dostáváme matici, která má ve své „dolním levém koutě nuly. Přesněji: každý další řádek má zleva aspoň o jednu nulu více než předešlý. To je cílem tzv. přímého chodu Gaussovy eliminační metody, který jsme právě ukončili. Naši matici koeficientů původní soustavy jsem převedli pomocí Gaussovy eliminační metody na matici odpovídající nové soustavě, která má stejnou množinu řešení, jako původní. Stačí se proto dále zabývat touto novou soustavou. Pro názornost si ji zde zapíšeme 2x1 − 2x2 + x3 + 3x5 = 4 x3 + x4 − x5 = − 3 x4 − 2x5 = 1 2 Lineární algebra Gaussova eliminační metoda Každá rovnice umožní spočítat hodnotu jedné neznámé, pokud jsou dány hodnoty ostatních. Máme tři rovnice o pěti neznámých, umíme tedy spočítat jen tři neznámé. Pomocí poslední rovnice budeme počítat například x4, pomocí předposlední rovnice budeme počítat x3 a z první rovnice spočítáme například x1. Ostatní neznámé nejsou těmito rovnicemi určeny a mohou nabývat libovolných hodnot. To dáme najevo například takto: x5 = u, x2 = v, u ∈ R, v ∈ R. Nyní budeme počítat hodnoty ostatních neznámých dosazovací metodou, postupujeme od poslední rovnice k první: x5 = u x2 = v x4 − 2u = 1 ⇒ x4 = 1 + 2u x3 + (1 + 2u) − u = − 3 ⇒ x3 = − 4 − u 2x1 − 2v + (−4 − u) + 3u = 4 ⇒ x1 = 4 − u + v Řešení jsme zapsali pomocí dvou parametrů u, v, které mohou nabývat libovolných hodnot. Všimneme si, že počet parametrů, kterými popíšeme řešení libovolné soustavy lineárních rovnic je roven počtu neznámých mínus počet nenulových rovnic, které získáme po eliminaci Gaussovou eliminační metodou. V našem případě: počet parametrů = 5 − 3. Zadaná soustava má sice čtyři rovnice, ale po eliminaci se nám soustava redukovala na pouhé tři nenulové rovnice. Pokud bychom se rozhodli například z první rovnice počítat x2, pak by neznámá x1 mohla nabývat libovolných hodnot a výsledek by byl formálně zapsán poněkud jinak: x1 = w, x2 = −8 + 2u + 2w, x3 = −4−u, x4 = 1+2u, x5 = u, u ∈ R, w ∈ R. Vidíme tedy, že neexistuje jednoznačný zápis výsledku. Oba zápisy popisují stejnou množinu řešení, každý trochu jiným způsobem. Popis metody Nyní se pustíme do výkladu Gaussovy eliminační metody pro obecnou soustavu lineárních rovnic. Nejprve vysvětlíme proceduru, kterou budeme v této metodě s prvky matice mnohokrát opakovat. Tato procedura vytvoří nuly v s-tém sloupci pod nenulovým prvkem matice v r-tém řádku. Názorně:           • · · · • sloupec s ↓ • • · · · • ... ... • řádek r → 0 · · · 0 a • · · · • 0 · · · 0 b1 • · · · • ... ... ... 0 · · · 0 bk • · · · •           ∼           • · · · • sloupec s ↓ • • · · · • ... ... • 0 · · · 0 a • · · · • ← řádek r 0 · · · 0 0 • · · · • ... ... ... 0 · · · 0 0 • · · · •           Tečkami jsou v tomto obrázku vyznačeny prvky matice, jejichž hodnoty nás momentálně nezajímají. Prvek a musí být nenulový. Procedura vytvoření nul pod prvkem a se provede takto: K1. Řádky 1 až r opíšeme beze změny. K2. K řádku r+1 přičítáme (−b1/a) násobek řádku r, k řádku r+2 přičítáme (−b2/a) násobek řádku r, atd., až konečně k řádku poslednímu přičítáme (−bk/a) násobek řádku r. Tímto úkonem se neporuší nulové prvky ve sloupcích vlevo od sloupce s a vzniknou nové nuly pod prvkem a ve sloupci s. Popíšeme algoritmus, který převede libovolnou matici na matici, která má „v levém dolním rohu nuly. Přesněji, matice bude mít v každém řádku zleva aspoň o jednu nulu více v souvislé řadě nul, než předchozí řádek. V algoritmu se pracuje s proměnnou r označující aktuální řádek a s proměnnou s, která znamená sloupec, ve kterém v daném okamžiku vytváříme nuly. Pokud se v algoritmu zvětšuje r, a přitom r již označuje poslední řádek matice, ukončíme činnost. Pokud by se mělo zvětšit s, a přitom s už označuje poslední sloupec matice, ukončíme činnost. V těchto případech je už matice převedena do požadovaného tvaru. G1. Nastavíme r = 1, s = 1. G2. Nechť a je prvek matice z s-tého sloupce a r-tého řádku. Pokud je a = 0 a všechny prvky pod prvkem a v s-tém sloupci jsou také nulové, zvětšíme s o jedničku a opakujeme krok G2. G3. Je-li a = 0, a přitom existuje nenulový prvek pod prvkem a v s-tém sloupci na řádku r1, prohodíme řádek r s řádkem r1. Od této chvíle je v nové matici prvek na r-tém řádku a s-tém sloupci nenulový. G4. Vytvoříme nuly pod nenulovým prvkem a z r-tého řádku a s-tého sloupce způsobem, popsaným v krocích K1 a K2. G5. Existují-li v matici řádky celé nulové, z matice je odstraníme. G6. Zvětšíme r o jedničku a s o jedničku a celou činnost opakujeme od kroku G2 znova. 3 Lineární algebra Gaussova eliminační metoda Při eliminační metodě jsme převedli matici koeficientů soustavy na jinou matici odpovídající jiné soustavě, ale se stejnou množinou řešení, protože při úpravách jsme použili jen tyto elementární kroky: (1) Prohození řádků matice. (2) Pronásobení řádku nenulovou konstantou. (3) Přičtení násobku řádku k jinému. (4) Odstranění nulového řádku. Diskuse po převedení matice Již dříve jsme vysvětlili, že tím dostáváme modifikovanou matici odpovídající nové soustavě se stejnou množinou řešení. Stačí se tedy zaměřit na tuto novou soustavu. Nejprve rozhodneme, zda soustava má vůbec nějaké řešení. Pokud je poslední řádek ve tvaru: (0 0 · · · 0 | c), c = 0 soustava nemá řešení. Tento řádek totiž odpovídá rovnici 0x1 + 0x2 + · · · + 0xn = c, c = 0, kterou nelze splnit pro žádná x1, x2, . . . , xn. Pokud poslední řádek obsahuje nenulový prvek mezi koeficienty soustavy (vlevo od svislé čáry), soustava má řešení. V takovém případě můžeme říci, kolik těch řešení bude: pokud má soustava (po úpravě eliminační metodou) stejný počet rovnic, jako neznámých, má jediné řešení. Je-li počet rovnic menší, než počet neznámých, je řešení nekonečně mnoho. Počet rovnic po eliminaci nemůže nikdy přesáhnout počet neznámých, vyloučíme-li případ řádku (0 · · · 0 | c), c = 0. Rozmyslete si, proč. Zadaná soustava může mít podstatně více rovnic než neznámých, ale po eliminaci se v takovém případě zákonitě počet rovnic zmenší. Má-li soustava řešení, pak pro každou rovnici rozhodneme, kterou neznámou budeme použitím této rovnice počítat (v dané rovnici musí být tato neznámá násobena nenulovým koeficientem). V každé rovnici je nejprve zleva skupina nulových koeficientů a pak existuje nějaký první nenulový koeficient. Doporučujeme počítat tu neznámou, která je násobena tímto prvním nenulovým koeficientem. Neznámé, které nebudeme počítat pomocí žádné rovnice, mohou nabývat libovolných hodnot. Takové neznámé dále považujeme za parametry. Pro počet parametrů tedy platí: počet parametrů = počet neznámých celkem − počet rovnic po eliminaci Spočítáme nejprve neznámou z poslední rovnice a výsledek dosadíme do ostatních rovnic. Pak spočítáme další neznámou z předposlední rovnice atd. až se dostaneme k první rovnici. Tím máme vyjádřena všechna řešení dané soustavy lineárních rovnic. Příklad, kdy soustava nemá řešení Příklad. Gaussovou eliminační metodou budeme řešit následující soustavu čtyř rovnic o čtyřech neznámých α, β, γ, δ. α + 2β + 3γ + δ = 1 2α + 4β + 7γ + 7δ = 4 α + 2γ = − 2 3α + 7β + 10γ + 6δ = 7 Zapíšeme koeficienty soustavy a hodnoty pravých stran do matice a začneme tuto matici eliminovat způsobem popsaným výše.     1 2 3 1 1 2 4 7 7 4 1 0 2 0 −2 3 7 10 6 7     (1) ∼     1 2 3 1 1 0 0 1 5 2 0 −2 −1 −1 −3 0 1 1 3 4     (2) ∼     1 2 3 1 1 0 1 1 3 4 0 −2 −1 −1 −3 0 0 1 5 2     (3) ∼ ∼     1 2 3 1 1 0 1 1 3 4 0 0 1 5 5 0 0 1 5 2     (4) ∼     1 2 3 1 1 0 1 1 3 4 0 0 1 5 5 0 0 0 0 3     V úpravě (1) jsme vytvořili nuly pod jedničkou z prvního sloupce a prvního řádku. V úpravě (2) jsme přehodili druhý řádek se čtvrtým v souladu s krokem G3 našeho algoritmu (na druhém řádku a druhém sloupci totiž byl nulový prvek). V úpravě (3) jsme vytvořili nuly pod jedničkou z druhého řádku v druhém sloupci. V poslední úpravě (4) jsme vytvořili nulu pod jedničkou v třetím sloupci z třetího řádku. Tím máme matici v požadovaném tvaru. Pohledem na poslední řádek okamžitě vidíme, že soustava nemá řešení. 4 1. Lineární prostor, grupa, těleso 1.1. Poznámka. O formě definice-věta-důkaz. V tomto textu narazíte na tři základní „slohové útvary : definice, věta a důkaz. Vesměs každé solidní matematické sdělení používá tyto pojmy. Přitom je možné, že s takto systematickým použitím pojmů definice, věta, důkaz se setkáváte poprvé. Proto si tyto pojmy vysvětlíme. DefiniceDefinice vysvětluje (definuje) nový pojem, který bude dále v teorii používán. Definice se opírá o pojmy, které byly definovány v předchozích definicích. V přísně exaktních teoriích bychom museli na začátku vyjmenovat pojmy, které nedefinujeme, ale budeme s nimi pracovat, protože jinak bychom nebyli schopni zapsat první definici. V tomto textu nebudeme takto přísně exaktní a budeme se opírat o mateřský jazyk a o pojmy známé ze střední školy (předpokládáme, že jsou známé pojmy množina, reálné číslo apod.). Nově definovaný pojem bude v definici vyznačen kurzívou. VětaVěta je tvrzení, které nám sděluje nějakou vlastnost týkající se definovaných pojmů. Dosti často se věta dá formálně rozčlenit na předpoklady a vlastní tvrzení. Předpoklady bývají uvozeny slovy „nechť , „budiž , „jestliže , „předpokládejme atd. Vlastní tvrzení obvykle začíná slovem „pak nebo „potom . Věta se musí dokázat. Proto se hned za větu připojuje další slohový útvar: důkaz. Po dokázání věty se v následujícím textu dá věta použít. To bývá obvykle provedeno tak, že se ověří v daném kontextu platnost předpokladů věty a na základě toho se prohlásí, že platí vlastní tvrzení věty. DůkazDůkaz je obhajoba platnosti věty. Při této obhajobě můžeme použít předchozí definice (zaměníme použitý pojem ve větě skupinou pojmů, kterými je pojem definován) a dále můžeme použít dříve dokázané věty (ověříme předpoklady dříve dokázané věty a použijeme pak její vlastní tvrzení). Dále se v důkazech používá logických obratů, které byste měli znát ze střední školy (například výrok „není pravda, že existuje prvek, pro který platí tvrzení A lze přeformulovat na totožný výrok: „pro všechny prvky neplatí tvrzení A ). V exaktních teoriích se ke skupině nedefinovaných pojmů na začátku teorie připojuje i několik tvrzení, která nelze prostředky teorie dokázat, ale pro důkazy dalších vět je nutné jejich platnost předpokládat. Takovým tvrzením se říká axiomy. V našem textu nebudeme teorii stavět jen na axiomech, ale někdy použijeme spíše intuitivní přístup. Není nutné být za každou cenu přísně exaktní. Pro matematické sdělení nových poznatků je obvykle členění textu na definice, věty a důkazy dostačující. V této učebnici si navíc budeme ilustrovat novou problematiku na příkladech a občas prohodíme nějakou poznámku. Dokladem toho je i tato poznámka 1.1. 1.2. Poznámka. V následující definici lineárního prostoru 1.6 se pracuje s množinami blíže nespecifikovaných objektů. Jediné, co s těmi objekty umíme dělat, je vzájemně objekty sčítat a násobit objekt reálným číslem. Přitom tyto operace (sčítání a násobení reálným číslem) je potřeba pro konkrétní množiny objektů definovat. Pro každou množinu objektů mohou tyto operace vypadat jinak. Skutečnost, že není řečeno, jak objekty a operace s nimi konkrétně vypadají, může být pro některé čtenáře poněkud frustrující. Proto před definicí uvedeme příklady množin objektů, které lze sčítat a násobit konstantou. 1.3. Příklad. Nechť R2 je množina všech uspořádaných dvojic reálných čísel, tj. R2 = {(a, b); a ∈ R, b ∈ R} (symbolem R označujeme reálná čísla, složky uspořádané dvojice píšeme do kulatých závorek a oddělujeme čárkou). Definujme sčítání dvou uspořádaných dvojic: (a, b) ⊕ (c, d) df = (a + c, b + d) (1.1) a násobení uspořádané dvojice reálným číslem α ∈ R: α (a, b) df = (α a, α b). (1.2) Všimneme si, že jsme definovali operaci ⊕ sčítání objektů tak, že výsledek sčítání je zase uspořádaná dvojice. Stejně součin reálného čísla s uspořádanou dvojicí je zase uspořádaná dvojice, tedy prvek množiny R2 . Naše sčítání je tedy operace, do které vstupují dva prvky množiny R2 a vystupuje z ní prvek množiny R2 . Naše násobení je operace, do které vstupuje reálné číslo a prvek z R2 a vystupuje z ní prvek z R2 . Tuto skutečnost zapíšeme pomocí kartézského součinu množin: ⊕ : R2 × R2 → R2 , : R × R2 → R2 . (1.3) 5 Lineární algebra 1. Lineární prostor, grupa, těleso Všimneme si dále, že jsme definovali nové operace ⊕ a prostřednictvím operací sčítání a násobení reálných čísel, tj. prostřednicvím operací, jejichž vlastnosti jsou známy ze střední školy. Příkladem takové vlastnosti je komutativní zákon (pro reálná čísla x a y platí: x+y = y+x). Naše nově definovaná operace ⊕ má také tuto vlastnost: (a, b) ⊕ (c, d) = (c, d) ⊕ (a, b), protože podle definice je (a, b) ⊕ (c, d) = (a + c, b + d) a (c, d) ⊕ (a, b) = (c + a, d + b), ovšem dvě uspořádané dvojice se rovnají, pokud se rovnají odpovídající složky. V tomto případě první složka první dvojice a + b se rovná první složce druhé dvojice b + a, neboť pro sčítání reálných čísel platí komutativní zákon. Podobně ověříme i druhou složku. Uvědomíme si, že není vůbec automaticky zaručeno, že nově definované operace musejí tyto zákony splňovat. Pokud bychom například definovali jiné sčítání dvou uspořádaných dvojic předpisem: (a, b) ⊕ (c, d) df = (2a + d, b + c), (1.4) pak se dá snadno ukázat, že pro ⊕ není splněn komutativní zákon (ověřte si sami). 1.4. Příklad. Označme P množinu všech polynomů, tedy funkcí p : R → R, které pro x ∈ R mají hodnotu danou vzorcem: p(x) = anxn + an−1xn−1 + · · · + a1x + a0, (an, an−1, . . . , a1, a0 jsou nějaká reálná čísla). (1.5) Na této množině polynomů definujeme sčítání ⊕ : P × P → P a násobení : R × P → P takto: pro každé p ∈ P, q ∈ P, α ∈ R je (p ⊕ q)(x) df = p(x) + q(x) ∀x ∈ R, (α p)(x) df = α p(x) ∀x ∈ R. Řečeno pečlivěji: v definici jsme zavedli novou funkci p ⊕ q : R → R tak, že jsme řekli, jakou bude tato funkce mít hodnotu v každém bodě x jejího definičního oboru. Tuto hodnotu podle definice počítáme jako součet hodnoty funkce p a hodnoty funkce q v bodě x. Tyto hodnoty jsou reálná čísla, takže sčítání funkcí (nové sčítání nových objektů) vlastně definujeme pomocí sčítání reálných čísel (sčítání, které známe ze střední školy). Podobně definujeme násobek funkce reálným číslem. Dá se ověřit, že pro p ∈ P, q ∈ P, α ∈ R je p ⊕ q zase polynom a α p je také polynom. Rovněž se dá ověřit, že pro operaci ⊕ platí komutativní zákon. 1.5. Poznámka. V předchozích dvou příkladech jsme definovali na množině nějakých objektů sčítání a násobení reálným číslem. Pro větší přehlednost jsme nově definované operace zapisovali do kroužku, abychom je odlišili od operací sčítání a násobení reálných čísel. To ale není potřeba. Stačí používat tytéž znaky, protože podle typu objektů, které do operace vstupují, okamžitě poznáme, jakou operaci máme použít (zda nově definovanou nebo známou operaci na reálných číslech). Takové automatické přizpůsobení operace podle typu operandů znají programátoři objektově orientovaných jazyků. Tam se tomu říká „přetěžování operátorů . Definici sčítání uspořádaných dvojic tedy stačí zapsat takto: Pro všechna (a, b) ∈ R2 , (c, d) ∈ R2 je (a, b) + (c, d) df = (a + c, b + d). Přitom poznáme, že první znak „+ v uvedeném vzorci označuje sčítání uspořádaných dvojic a ostatní dva znaky „+ znamenají sčítání reálných čísel. V dalším textu budeme skoro vždy používat znaky „+ a „· i pro nově definované operace, protože podle typu operandů nemůže dojít k nedorozumění. Také znak násobení „· budeme někdy vynechávat, jako jsme zvyklí jej vynechávat při zápisu násobení reálných čísel. Definice lineárního prostoru 1.6. Definice. Lineárním prostorem nazýváme každou neprázdnou množinu L, na které je definováno sčítání + : L × L → L a násobení reálným číslem · : R × L → L a tyto operace splňují pro každé x ∈ L, y ∈ L, z ∈ L, α ∈ R, β ∈ R vlastnosti: (1) x + y = y + x (komutativní zákon sčítání), (2) (x + y) + z = x + (y + z) (asociativní zákon sčítání), (3) α · (β · x) = (αβ) · x (asociativní zákon násobení), (4) α · (x + y) = α · x + α · y (distributivní zákon pro sčítání prvků z L), (5) (α + β) · x = α · x + β · x (distributivní zákon pro sčítání čísel), (6) 1 · x = x (vlastnost reálného čísla 1), (7) existuje o ∈ L, že pro každé x ∈ L je 0 · x = o (existence nulového prvku). 6 Lineární algebra 1. Lineární prostor, grupa, těleso Prvky lineárního prostoru nazýváme vektory. Reálnému číslu v kontextu násobení · : R × L → L říkáme skalár. Prvku o ∈ L z vlastnosti (7) říkáme nulový prvek nebo nulový vektor. 1.7. Věta. Pro nulový prvek o lineárního prostoru L platí vlastnosti: (1) x + o = x ∀ x ∈ L, (2) α · o = o ∀ α ∈ R, (3) Nechť x ∈ L. Je-li α · x = o a α = 0, pak x = o. Důkaz. Použijeme vlastnosti z definice 1.6. Pro přehlednost píšeme nad rovnítka číslo použité vlastnosti. (1) x + o (7) = x + 0 · x (6) = 1 · x + 0 · x (5) = (1 + 0) · x = 1 · x (6) = x. (2) α · o (7) = α · (0 · x) (3) = (α · 0) · x = 0 · x (7) = o. (3) x (6) = 1 · x = 1 α α · x (3) = 1 α · (α · x) (z předpokladu) = 1 α · o (vlastnost (2) věty 1.7) = o. 1.8. Poznámka. Ve vlastnostech (1) až (7) v definici 1.6 se pracuje se znaky „+ a „· v souladu s poznámkou 1.5 ve dvojím významu. Buď to jsou operace s prvky množiny L nebo operace s reálnými čísly. Například ve vlastnosti (5) je první symbol „+ použit ve významu sčítání na množině reálných čísel, zatímco druhý symbol „+ je použit ve významu sčítání na množině L. Jako cvičení zkuste o každé použité operaci ve vzorcích (1) až (7) rozhodnout, jakého je druhu. Prostor R2 1.9. Příklad. Ukážeme, že množina R2 z příkladu 1.3 se sčítáním a násobením skalárem podle definic (1.1) a (1.2) tvoří lineární prostor. Místo znaků „⊕ a „ budeme nadále používat znaky„+ a „· . Nejprve je třeba zjistit, zda operace „+ a „· jsou skutečně definovány způsobem, jak požaduje definice 1.6, tj. zda platí + : R2 × R2 → R2 a · : R × R2 → R2 . To jsme ale už ověřili dříve, viz (1.3). Dále zjistíme platnost vlastností (1) až (7) z definice 1.6. Vlastnost (1) jsme podrobně ověřovali v příkladu 1.3. Pokračujeme tedy vlastností (2). Pro každé a, b, c, d, e, f ∈ R platí: (a, b) + (c, d) + (e, f) = (a + c, b + d) + (e, f) = (a + c) + e, (b + d) + f = = a + (c + e), b + (d + f) = (a, b) + (c + e, d + f) = (a, b) + (c, d) + (e, f) . Při úpravách jsme nejprve dvakrát použili definici (1.1), pak jsme v jednotlivých složkách využili toho, že pro sčítání reálných čísel platí asociativní zákon a konečně jsme zase dvakrát použili definici (1.1). Nyní dokážeme další vlastnosti. Pro každé a, b, c, d, α, β ∈ R platí: (3) α · β · (a, b) = α · β a, β b = α (β a), α (β b) = (α β) a, (α β) b = (α β) (a, b), (4) α · (a, b) + (c, d) = α · (a + c, b + d) = α (a + c), α (b + d) = (α a + α c, α b + α d) = = (α a, α b) + (α c, α d) = α (a, b) + α (c, d), (5) (α + β) · (a, b) = (α + β) a, (α + β) b = (α a + β a, α b + β b) = (α a, α b) + (β a, β b) = = α (a, b) + β (a, b), (6) 1 · (a, b) = (1 a, 1 b) = (a, b), (7) dvojice (0, 0) splňuje: (0, 0) = 0 · (a, b), protože 0 · (a, b) = (0 a, 0 b) = (0, 0). Použili jsme nejprve definice (1.1) a (1.2), pak jsme využili vlastnosti reálných čísel v jednotlivých složkách dvojice. Nakonec jsme znovu použili definice (1.1) a (1.2). Vidíme, že nulovým vektorem lineárního prostoru R2 je dvojice (0, 0). Podle konvence ze závěru definice 1.6 jsme oprávněni uspořádaným dvojicím se sčítáním a násobením podle definic (1.1) a (1.2) říkat vektory. 1.10. Příklad. Množina R2 se sčítáním ⊕ podle definice (1.4) a násobením podle (1.2) netvoří lineární prostor. Není totiž splněna například vlastnost (1) z definice 1.6. 7 Lineární algebra 1. Lineární prostor, grupa, těleso Prostor Rn 1.11. Příklad. Znakem Rn označíme množinu všech uspořádaných n-tic reálných čísel, (n je nějaké přirozené číslo, n ≥ 1). Jinými slovy: Rn = {(a1, a2, . . . , an); a1 ∈ R, a2 ∈ R, . . . , an ∈ R}. Definujme + : Rn × Rn → Rn , · : R × Rn → Rn takto: pro každé (a1, . . . , an) ∈ Rn , (b1, . . . , bn) ∈ Rn , α ∈ R je (a1, . . . , an) + (b1, . . . , bn) df = (a1 + b1, . . . , an + bn), α · (a1, . . . , an) df = (α a1, . . . , α an). Množina Rn s takto definovanými operacemi tvoří lineární prostor. Důkaz bychom provedli analogicky jako v příkladu 1.9, ale pro úsporu místa to již nebudeme opakovat. Vidíme tedy, že uspořádané n-tice s takto definovaným sčítáním a násobením skalárem můžeme nazývat vektory. Speciálně v případě uspořádaných n-tic mluvíme o aritmetických vektorech. Číslo ai nazýváme i-tou složkou vektoru a = (a1, a2, . . . , an). 1.12. Příklad. Množina R s obvyklým sčítáním reálných čísel a násobení reálného čísla reálným číslem tvoří lineární prostor. To je zřejmé. Sčítání a násobení reálných čísel totiž splňuje vlastnosti (1) až (7) z definice 1.6. Tento poznatek si jistě přinášíte ze střední školy. V tomto textu jsme jej už použili, když jsme ověřovali, že R2 nebo Rn je lineární prostor. Nulovým prvkem lineárního prostoru R je číslo 0. V kontextu sčítání a násobení můžeme tedy říkat reálným číslům vektory, ale obvykle to neděláme. Prostor funkcí 1.13. Příklad. Uvažujme množinu FD všech reálných funkcí reálné proměnné definovaných na nějaké množině D ⊆ R, tj. FD = {f; f : D → R}. Pro libovolné funkce f ∈ FD, g ∈ FD a pro libovolné reálné číslo α definujme součet f + g a násobek skalárem α · f takto: (f + g)(x) df = f(x) + g(x) ∀x ∈ D (1.6), (α · f)(x) df = α f(x) ∀x ∈ D (1.7) (srovnejte s definicí ⊕ a v příkladu 1.4). Ukážeme, že množina FD s takto definovaným sčítáním a násobením skalárem tvoří lineární prostor. Potřebujeme ověřit, zda součet funkcí z množiny FD je opět funkce z množiny FD a skalární násobek je také funkce z FD. To ale platí, protože sčítáním funkcí ani násobením funkce konstantou podle naší definice se nemění definiční obor a výsledkem operací je znovu reálná funkce reálné proměnné. Dále potřebujeme ověřit vlastnosti (1) až (7) z definice 1.6. Pro libovolné f ∈ FD, g ∈ FD, h ∈ FD, α ∈ R, β ∈ R a pro všechna x ∈ D platí: (1) (f + g)(x) = f(x) + g(x) = g(x) + f(x) = (g + f)(x), (2) (f + g) + h (x) = (f + g)(x) + h(x) = f(x) + g(x) + h(x) = f(x) + g(x) + h(x) = = f(x) + (g + h)(x) = f + (g + h) (x), (3) α · (β · f) (x) = α (β · f)(x) = α β f(x) = (α β)f(x) = (α β) · f)(x), (4) α · (f + g) (x) = α (f + g)(x) = α (f(x) + g(x)) = α f(x) + α g(x) = = (α · f)(x) + (α · g)(x) = (α · f + α · g)(x), (5) (α + β) · f (x) = (α + β) f(x) = α f(x) + β f(x) = (α · f)(x) + (β · f)(x) = (α · f + β · f)(x), (6) (1 · f)(x) = 1 · f(x) = f(x), (7) (0 · f)(x) = 0 · f(x) = o(x), kde funkce o má pro všechna x ∈ D hodnotu 0. Ačkoli tyto vzorce vypadají na první pohled jen jako „hraní se závorkami , musíme si uvědomit, že rovnost funkcí zde dokazujeme na základě rovnosti jejich hodnot v každém bodě x ∈ D a že při důkazu používáme nejprve rozepsání operací podle definic (1.6) a (1.7). Tím problém převádíme na sčítání a násobení reálných čísel, kde jsou vlastnosti (1) až (7) zaručeny. Jako cvičení si zkuste přepsat tyto vzorce tak, že odlišíte operace sčítání funkcí a násobení funkce skalárem od běžných operací „+ a „· pro reálná čísla. Použijte například symbolů ⊕ a , jako v příkladu 1.4. Vidíme, že množina FD s definicí sčítání a násobení skalárem podle (1.6) a (1.7) je lineárním prostorem. Funkce z FD jsme tedy podle definice 1.6 oprávněni nazývat vektory. Nulovým vektorem je v tomto případě funkce, která má pro všechna x ∈ D nulovou hodnotu. 8 Lineární algebra 1. Lineární prostor, grupa, těleso Prostor polynomů 1.14. Příklad. Ukážeme, že množina P všech polynomů s definicemi sčítání a násobení skalárem podle příkladu 1.4 tvoří lineární prostor. Především součet dvou polynomů je polynom a skalární násobek polynomu je polynom, takže platí, že + : P × P → P a · : R × P → P. To je ale vše, co potřebujeme dokázat. Ověřováním vlastností (1) až (7) se nemusíme zdržovat, protože jsme definice sčítání a násobení polynomů převzali z prostoru funkcí FD, o němž jsme dokázali v příkladu 1.13, že se jedná o lineární prostor (volíme D = R). Při ověřování vlastností (1) až (7) bychom dělali vlastně to samé jako v příkladu 1.13, jen na podmnožině P ⊆ FD. 1.15. Příklad. Nechť n ∈ N, n ≥ 0 (symbolem N značíme množinu přirozených čísel). Množina Pn všech polynomů právě n-tého stupně s definicemi sčítání a násobení skalárem podle příkladu 1.4 netvoří lineární prostor. Připomeneme, že stupeň polynomu se definuje jako největší k ∈ N takové, že ak je ve vzorci (1.5) nenulové. Jsou-li všechna ak nulová, definujeme stupeň takového polynomu jako −1. Proč není množina Pn lineárním prostorem? Sečteme-li totiž dva polynomy n-tého stupně, například xn + 2 a −xn − 2, dostáváme nulový polynom, což je polynom stupně −1. Tento protipříklad ukazuje, že neplatí vlastnost + : Pn × Pn → Pn. Dokonce neplatí ani · : R × Pn → Pn (zkuste násobit polynom n-tého stupně nulou). 1.16. Poznámka. Příklady 1.14 a 1.15 ukazují, že můžeme vymezit podmnožinu M ⊆ L lineárního prostoru L a převzít pro ni operace sčítání a násobení konstantou z L. Za jistých okolností množina M s převzatými operacemi může být lineárním prostorem, ale nemusí být vždy. Z příkladu 1.14 navíc vidíme, že stačí ověřit vlastnosti + : M × M → M a · : R × M → M, abychom mohli prohlásit, že M je lineární prostor. Vlastnosti (1) až (7) není třeba znovu ověřovat. Podmožinu lineárního prostoru, která je sama lineárním prostorem při použití stejných operací, nazýváme lineárním podprostorem. Přesněji viz následující definice. Lineární podprostor 1.17. Definice. Nechť L je lineární prostor s operacemi „+ a „· . Neprázdnou množinu M ⊆ L nazýváme lineárním podprostorem prostoru L, pokud pro všechna x ∈ M, y ∈ M a α ∈ R platí: (1) x + y ∈ M, (2) α · x ∈ M. 1.18. Příklad. Množina všech polynomů P z příkladu 1.14 je lineárním podprostorem množiny všech funkcí FD z příkladu 1.13, kde volíme D = R. Množina Pn všech polynomů právě n-tého stupně z příkladu 1.15 není lineárním podprostorem lineárního prostoru FD ani lineárního prostoru P. 1.19. Příklad. Množina P≤n všech polynomů nejvýše n-tého stupně je lineárním podprostorem lineárního prostoru všech polynomů P i lineárního prostoru všech reálných funkcí FD. Je to dáno tím, že (1) součtem polynomů nejvýše n-tého stupně dostáváme polynom nejvýše n-tého stupně a (2) vynásobením polynomu nejvýše n-tého stupně reálným číslem dostaneme zase polynom nejvýše n-tého stupně. 1.20. Příklad. Uvažujme M ⊆ Rn , M = {(a, a, . . . , a); a ∈ R}. Předpokládáme tedy, že množina M obsahuje takové n-tice, ve kterých se všechny složky vzájemně rovnají. Ukážeme, že M je lineární podprostor lineárního prostoru Rn . Stačí pro množinu M dokázat vlastnosti (1) a (2) z definice 1.17. Platí (1) součet dvou uspořádaných n-tic, ve kterých se složky rovnají, je uspořádaná n-tice, ve kterých se složky rovnají. (2) vynásobením uspořádané n-tice, ve které se složky rovnají, reálným číslem, dostáváme zase uspořádanou n-tici, ve které se složky rovnají. 1.21. Příklad. Uvažujme množiny M ⊆ R3 , N ⊆ R3 a S ⊆ R3 , které jsou definovány takto: M = {(x, y, z); x + 2y = 0, z libovolné }, N = {(x, y, z); 2x + y − z = 0}, S = {(x, y, z); 2x + y − z = 3}. Ukážeme, že M a N jsou lineárními podprostory lineárního prostoru R3 , zatímco S není lineárním podprostorem lineárního prostoru R3 . Ověříme vlastnost (1) z definice 1.17: Nechť (x1, y1, z1) ∈ M a (x2, y2, z2) ∈ M. Pak platí x1+2y1 = 0 a x2 + 2y2 = 0. Pro součet (x1 + x2, y1 + y2, z1 + z2) platí x1 + 2y1 + x2 + 2y2 = 0 (sečetli jsme 9 Lineární algebra 1. Lineární prostor, grupa, těleso předchozí rovnice), tj. (x1 + x2) + 2(y1 + y2) = 0, takže i součet leží v množině M. Nyní vlastnost (2): Jestliže (x, y, z) ∈ M, α ∈ R, pak platí x + 2y = 0. Vynásobením rovnice číslem α dostáváme, že též α x + 2α y = 0, což ale znamená, že i trojice α · (x, y, z) leží v množině M. Ověření, že množina N je lineárním podprostorem, lze provést podobně. Množina S není lineárním podprostorem, protože například 0 · (x, y, z) = (0, 0, 0), což je ale prvek, který neleží v S. Neplatí totiž 2 · 0 + 0 − 0 = 3. Průnik prostorů 1.22. Věta. Nechť M ⊆ L a N ⊆ L jsou lineární podprostory lineárního prostoru L. Pak platí: (1) M ∩ N je lineární podprostor lineárního prostoru L. (2) M ∪ N nemusí být lineární podprostor lineárního prostoru L. Důkaz. (1) Z předpokladů věty a definice 1.17 víme, že pro x ∈ M, y ∈ M, α ∈ R je x + y ∈ M a α · x ∈ M. Totéž platí pro množinu N. Pokud nyní x ∈ M ∩ N, y ∈ M ∩ N, pak x i y leží současně v M i N, takže platí, že x + y ∈ M, α · x ∈ M a současně x + y ∈ N, α · x ∈ N. Prvky x + y a α · x leží v obou množinách M a N současně a to není jinak možné, než že leží v průniku těchto množin. (2) Abychom ukázali, že sjednocení M ∪ N nemusí být lineárním podprostorem, stačí najít vhodný příklad. Nechť M = {(a, 0); a ∈ R}, N = {(0, b); b ∈ R}. Je zřejmé, že M a N jsou lineárními podprostory lineárního prostoru R2 . Sjednocením těchto množin je množina uspořádaných dvojic, pro které je první nebo druhá složka nulová. Vezmeme nyní (1, 0) ∈ M ∪ N a (0, 1) ∈ M ∪ N. Součet (1, 0) + (0, 1) = (1, 1) je uspořádaná dvojice, která neleží ve sjednocení M ∪ N. 1.23. Příklad. Uvažujme podprostory M a N z příkladu 1.21. Podle věty 1.22 je také M ∩ N lineárním podprostorem lineárního prostoru R3 . Prostor ori- entovaných úseček 1.24. Příklad. Zvolme jeden bod v prostoru, který nás obklopuje, a označme jej písmenem O. Uděláme to třeba tak, že nakreslíme na papír křížek a prohlasíme jej za bod O. Dále s papírem nehýbáme. Uvažujme všechny orientované úsečky, které začínají v bodě O a končí v nějakém jiném bodě v prostoru. Přidejme k tomu „degenerovanou úsečku, která začíná i končí v bodě O a označme množinu všech těchto úseček znakem UO. Definujme nyní sčítání + : UO × UO → UO ryze konstruktivně takto: Úsečky u ∈ UO, v ∈ UO doplníme na rovnoběžník. Úhlopříčku, která začíná v bodě O a končí v protějším bodě rovnoběžníka, prohlásíme za součet úseček u a v, tedy u+v. Dále definujme násobení skalárem · : R×UO → UO takto: změříme nějakým měřítkem (pracujeme pořád se stejným měřítkem, jedno jakým) velikost úsečky u. Tím dostáváme nezáporné reálné číslo. Toto číslo vynásobíme skalárem α a výsledek násobení označme písmenem c ∈ R. Je-li c > 0, naneseme výslednou úsečku α · u na stejnou polopřímku, na které leží u a velikost má c. Je-li c < 0, naneseme výslednou úsečku α · u na opačnou polopřímku a velikost bude rovna |c|. Je-li c = 0 položme α · u rovnu degenerované úsečce, která začíná i končí v bodě O. Množina UO s takto konstruktivně definovaným sčítáním a násobením reálným číslem tvoří lineární prostor. Abychom toto tvrzení obhájili, musíme dokázat vlastnosti (1) až (7) z definice 1.6. (1) u + v = v+u, protože v obou případech doplňujeme na stejný rovnoběžník. (2) (u+v)+w = u+(v+w), protože postupné doplnění úhlopříčky rovnoběžníku u, v a úsečky w na rovnoběžník vede ke stejnému výsledku, jako když nejprve sestavíme úhlopříčku rovnoběžníku v, w a tu doplníme na rovnoběžník s úsečkou u (udělejte si náčtrek). (3) α·(βu) = (α β)·u, protože velikost těchto úseček je stejná (pro získání velikosti násobíme mezi sebou jen reálná čísla) a úsečky mají stejnou orientaci. (4) α · (u + v) = α · u + α · v, protože příslušné rovnoběžníky pro sčítání jsou podobné a druhý je α krát větší než první. Proto též jeho úhlopříčka bude α krát větší. (5) (α + β) · u = α · u + β · u, protože obě úsečky mají stejnou velikost a orientaci (pro získání velikosti násobíme a sčítáme reálná čísla). (6) 1 · u = u, protože obě úsečky mají stejnou velikost a orientaci. (7) 0 · u je vždy úsečka s nulovou velikostí, což je degenerovaná úsečka začínající i končící v bodě O. Ta je tedy nulovým prvkem našeho lineárního prostoru. Vidíme, že orientované úsečky s výše definovaným geometrickým sčítáním a násobením skalárem můžeme v souladu s definicí 1.6 nazývat vektory. V kapitole deváté jim budeme říkat vázané vektory (vázané bodem O). 1.25. Příklad. Nechť M ⊂ UO jsou jen takové úsečky, které leží ve stejné rovině, jako leží náš papír, na který jsme v příkladu 1.24 nakreslili křížek. Vidíme, že M = UO, protože například úsečka nenulové velikosti kolmá na náš papír neleží v M. Ukážeme, že množina M je lineární podprostor lineárního 10 Lineární algebra 1. Lineární prostor, grupa, těleso prostoru UO. Skutečně, součet libovolných dvou úseček leží ve stejné rovině (protože tam leží celý rovnoběžník) a násobek úsečky leží dokonce na stejné přímce, jako původní úsečka, takže nutně zůstává ve stejné rovině. Každá rovina, která prochází bodem O, obsahuje podmnožinu úseček z UO, které tvoří lineární podprostor lineárního prostoru UO. Uvažujme nyní dvě roviny, které mají společný bod O, ale nejsou totožné. Jejich průnik je nějaká přímka, procházející bodem O. Všechny orientované úsečky z UO, které leží v této přímce, tvoří podle věty 1.22 rovněž lineární podprostor lineárního prostoru UO. Triviální prostor 1.26. Poznámka. Zamysleme se, jak může vypadat lineární prostor s nejmenším počtem prvků. Podle definice 1.6 je lineární prostor vždy neprázdná množina, takže musí obsahovat aspoň jeden prvek. Ukazuje se, že jednobodová množina L = {o} je skutečně nejmenší možný lineární prostor. Přitom o je nulový prvek z vlastnosti (7). Sčítání je definováno předpisem o + o df = o a násobení skalárem α předpisem α · o df = o. Takový lineární prostor nazýváme triviální. 1.27. Poznámka. Ukážeme, že konečná množina obsahující aspoň dva prvky nemůže být lineárním prostorem. Znamená to, že se nám pro takovou množinu L nepovede najít operace + : L × L → L a · : R × L → L takové, aby současně splňovaly vlastnosti (1) až (7) z definice 1.6. Jeden z prvků množiny L musí být nulový prvek (označme jej o) a jiný prvek označme třeba x. Další prvky označovat nemusíme. Uvažujme množinu K = {α · x; α ∈ R}. Protože K ⊆ L, je i K konečná množina. Protože reálných čísel je nekonečně mnoho, a přitom K je konečná, musejí existovat dvě různá reálná čísla β = γ taková, že β · x = γ · x. Z definice lineárního prostoru 1.6 dostáváme: o = 0 · x = (β − β) · x = β · x + (−β) · x = γ · x + (−β) · x = (γ − β) · x. Nyní máme splněny předpoklady vlastnosti (3) věty 1.7 (volíme α = γ − β). Dostáváme tedy x = o. To je ale spor s předpokladem, že jsme vybrali prvek x jiný než nulový. Konečná množina obsahující aspoň dva prvky tedy nemůže být lineárním prostorem. Existuje tedy jednobodový lineární prostor a pak dlouho nic . . . a všechny ostatní lineární prostory musejí mít nekonečné množství prvků. 1.28. Příklad. Ukážeme si jeden příklad poněkud exotického lineárního prostoru. Jedná se o množinu kladných reálných čísel R+ , na které je definováno „sčítání ⊕ : R+ × R+ → R+ a „násobení reálným číslem : R × R+ → R+ takto: pro x ∈ R+ , y ∈ R+ , α ∈ R je x ⊕ y df = x · y, α x df = xα , kde znakem „· je míněno běžné násobení reálných čísel a xα je reálná mocnina o kladném základu. V tomto příkladě jsme se pokorně vrátili ke kroužkování nových operací sčítání a násobení skalárem, protože bychom je velmi těžko odlišovali od běžného sčítání a násobení reálných čísel. Nové sčítání vlastně definujeme jako běžné násobení a nové násobení jako běžnou mocninu. Aby R+ s operacemi ⊕ a byl lineárním protorem, musí splňovat vlastnosti (1) až (7) z definice 1.6. Pro x ∈ R+ , y ∈ R+ , z ∈ R+ , α ∈ R, β ∈ R je (1) x ⊕ y = x · y = y · x = y ⊕ x, (2) (x ⊕ y) ⊕ z = (x · y) · z = x · (y · z) = x ⊕ (y ⊕ z), (3) α (β x) = (β x)α = (xβ )α = xα·β = (α β) x, (4) α (x ⊕ y) = (x ⊕ y)α = (x · y)α = xα · yα = (α x) · (α y) = (α x) ⊕ (α y), (5) (α + β) x = xα+β = xα · xβ = (α x) · (β x) = (α x) ⊕ (β x), (6) 1 x = x1 = x, (7) 0 x = x0 = 1 ∈ R+ . Z poslední vlastnosti vyplývá, že nulový prvek tohoto lineárního prostoru je číslo 1. 1.29. Poznámka. Následující text až do konce kapitoly je poněkud abstraknější povahy. Přitom se jeho znalost nepředpokládá pro pochopení dalších kapitol. Pokud tedy čtenář nechce být hned v počátku studia zahlcen pojmy o algebraických strukturách, může tento text přeskočit. 11 Lineární algebra 1. Lineární prostor, grupa, těleso 1.30. Poznámka. Reálná čísla jsou množina prvků, které umíme vzájemně sčítat a vzájemně násobit. Přesněji, je to množina R, na které jsou definovány obvyklé operace + : R × R → R a · : R × R → R s jistými vlastnostmi (asociativní zákon, distributivní zákon, atd.). Těmito vlastnostmi se budeme inspirovat a pokusíme se vybudovat abstraktní algebraickou strukturu, tzv. těleso. Jedním z možných konkrétních příkladů tělesa pak samozřejmě budou reálná čísla. Jenomže kromě nich budeme nacházet i jiné příklady těles. Začneme nejprve strukturou s jedinou operací. Grupa1.31. Definice. Množinu G, na které je definována operace : G × G → G nazýváme grupou, pokud pro tuto operaci platí: (1) ∀x, y, z ∈ G : (x y) z = x (y z) (asociativní zákon), (2) ∃e ∈ G, pro které platí ∀x ∈ G : e x = x e = x (existence neutrálního/jednotkového prvku), (3) ∀x ∈ G ∃y ∈ G : x y = y x = e (existence opačného/inverzního prvku y pro každý prvek x). Pokud navíc platí (4) ∀x, y ∈ G : x y = y x (komutativní zákon), pak grupu G nazýváme komutativní grupou. Z historických důvodů a z úcty k norskému matematikovi, který rozpracoval teorii grup a bohužel zemřel mlád na zákeřnou nemoc ve věku 26 let, se komutativní grupa nazývá též Abelova grupa. 1.32. Poznámka. Niels Abel mimo jiné pomocí teorie grup dokázal, že nelze pro obecný polynom stupně vyššího než 4 najít vzorec na výpočet jeho kořenů z jeho koeficientů. Pro polynomy stupně 1, 2, 3 a 4 přitom takové vzorce existují. Pro stupeň 2 se jej žáci učí zpaměti: x1,2 = (−b ± √ b2 − 4ac)/2a. 1.33. Příklad. Jednoprvková množina G = {e} s operací e e = e je nejmenší možnou grupou. 1.34. Příklad. Množina R s operací sčítání tvoří grupu. Skutečně platí asociativní zákon pro sčítání reálných čísel: (x + y) + z = x + (y + z), dále existuje neutrální prvek 0, pro který 0 + x = x + 0 = 0 a konečně pro každé x ∈ R existuje y = −x tak, že x+y = y +x = 0. Navíc se jedná o grupu komutativní, protože sčítání reálných čísel je komutativní. Pokud operaci grupy značíme symbolem „+ (jako v tomto příkladě), pak obvykle o prvku e z vlastnosti (2) mluvíme jako o neutrálním prvku a značíme ho symbolem „0 (též nula, nulový prvek) a prvek y z vlastnosti (3) nazývame opačný a značíme −x. Přičtení opačného prvku v komutativní grupě pak nazýváme odečítání a místo a + (−b) píšeme a − b. 1.35. Příklad. Množina R \ {0} s operací násobení tvoří grupu. Skutečně platí asociativní zákon pro násobení reálných čísel: (x · y) · z = x · (y · z), dále existuje jednotkový prvek 1, pro který 1 · x = x · 1 = 1 a konečně pro každé x ∈ R \ {0} existuje y = x−1 tak, že x · y = y · x = 1. Navíc se jedná o grupu komutativní, protože násobení reálných čísel je komutativní. Pokud operaci grupy značíme symbolem „· , pak obvykle prvek e z vlastnosti (2) značíme symbolem „1 (jedna, jednotkový prvek). Prvek y z vlastnosti (3) nazývame inverzní a značíme x−1 . Násobení inverzním prvkem v komutativní grupě nazýváme dělení a místo a · b−1 píšeme a/b nebo a b . 1.36. Příklad. Množina R s operací násobení netvoří grupu, protože 0 nemá inverzní prvek. 1.37. Příklad. Množina všech reálných funkcí F = {f : R → R, f je prostá a „na } s operací skládání funkcí ◦ : F × F → F, definovanou pomocí (g ◦ f)(x) = g f(x) ∀x ∈ R, tvoří grupu. Skutečně platí asociativní zákon (f ◦ g) ◦ h = f ◦ (g ◦ h) a existuje jednotkový prvek: identické zobrazení i, pro které i(x) = x. Ke každé prosté funkci f lze setrojit funkci inverzní f−1 tak, že f ◦ f−1 = f−1 ◦ f = i. Přitom se nejedná o grupu komutativní, protože například pro f(x) = x3 , g(x) = 1 + x je (f ◦ g)(x) = (1 + x)3 , zatímco (g ◦ f)(x) = 1 + x3 . 1.38. Příklad. Kdybychom v předchozím příkladě místo funkcí f z R na R uvažovali prostá zobrazení p z nějaké množiny M na M, dostáváme znovu grupu, která nemusí být komutativní. V případě konečné množiny M se jedná o grupu permutací. 12 Lineární algebra 1. Lineární prostor, grupa, těleso 1.39. Příklad. S další grupou se seznámíme ve třetí kapitole. Množina všech regulárních matic stejného typu (n, n) (viz 3.51) s operací násobení matic tvoří příklad nekomutativní grupy. 1.40. Příklad. Množina čísel {0, 1, 2, . . . , k − 1} s operací a ⊕ b = a + b modulo k tvoří komutativní grupu. Připomínáme, že „x modulo y je zbytek při dělení čísla x číslem y. Neutrálním prvkem této grupy je 0 a opačným prvkem k prvku a = 0 je prvek k − a. Samozřejmě, opačným prvkem k prvku neutrálnímu je prvek neutrální, což ostatně platí v libovolné grupě. 1.41. Příklad. Lineární prostor se svou operací sčítání vektorů (podle definice 1.6) tvoří komutativní grupu. Skutečně, asociativní zákon je postulován vlastností (2) v definici 1.6, neutrálním prvkem je nulový vektor (viz vlastnost (1) věty 1.7) a opačný vektor k vektoru x je vektor −x = (−1) · x, protože (−1) · x + x = (−1) · x + 1 · x = (−1 + 1) · x = 0 · x = o. Konečně z vlastnosti (1) definice 1.6 plyne, že se jedná o grupu komutativní. 1.42. Poznámka. Obráceně, pomocí pojmu grupa můžeme významně zkrátit naší definici lineárního prostoru 1.6: Lineárním prostorem je množina L, která s operací + : L × L → L tvoří komutativní grupu. Dále musí být na množině L definována operace · : R × L → L, s vlastnostmi ∀α, β ∈ R, ∀x, y ∈ L: (A) α · (β · x) = (αβ) · x, (B) α · (x + y) = α · x + α · y, (C) (α + β) · x = α · x + β · x, (D) 1 · x = x. Vzhledem k tomu, že vlastnosti (1), (2) definice 1.6 přímo korespondují s vlastnostmi komutativní grupy, stačí ověřit, že nám z této nové definice vyplyne vlastnost (7) definice 1.6, která jediná zde chybí. Existence nulového vektoru je zajištěna jako existence neutrálního prvku o v grupě. Je potřeba ukázat, že pro libovolný x ∈ L je vektor 0 · x roven neutrálnímu prvku o. K vektoru 0 · x ovšem existuje v grupě prvek opačný − 0 · x. Ten přičteme k oběma stranám rovnice 0 · x = (0 + 0) · x = 0 · x + 0 · x. Na levé straně dostáváme 0 · x + (− 0 · x) = o. Na pravé straně je 0 · x + 0 · x + (−0 · x) = 0 · x + o = 0 · x. Porovnáním levé a pravé strany máme výsledek o = 0 · x. 1.43. Poznámka. Axiomy grupy v definici 1.31 explicitně neuvádějí, že v grupě existuje jen jediný neutrální prvek a ke každému prvku existuje jen jediný prvek opačný. Následující věta ukazuje, že to nicméně platí jako jednoduchý důsledek axiomů. 1.44. Věta. (A) Každá grupa má jen jediný neutrální/jednotkový prvek. (B) Ke každému prvku grupy existuje jediný opačný/inverzní prvek. Důkaz. (A) Předpokládáme dva neutrální prvky e1, e2. Musí platit e1 = e1 e2, protože e2 je neutrální. Musí také platit e2 = e1 e2, protože e1 je neutrální. Takže e1 = e1 e2 = e2 a neutrální prvky se neliší. (B) Nechť x ∈ G má dva inverzní/opačné prvky y1 a y2. Označme e jednotkový prvek. Pak platí: y1 = e y1 = (y2 x) y1 = y2 (x y1) = y2 e = y2, takže y1 = y2. 1.45. Věta. Nechť na neprázdné množině G je dána operace : G×G → G, pro kterou platí asociativní zákon (1) z definice grupy 1.31. Pak vlastnosti (2) a (3) z definice grupy jsou ekvivalentní s vlastností: pro každé a, b ∈ G existují x, y ∈ G, které řeší rovnice a x = b a y a = b. Důkaz. Nechť nejprve platí vlastnosti (1), (2), (3) z definice grupy 1.31. Označme a−1 inverzní prvek k prvku a. Pak x = a−1 b řeší rovnici a x = b, protože a (a−1 b) = (a a−1 ) b = e b = b. Z podobných důvodů y = b a−1 řeší rovnici y a = b. Nechť nyní platí asociativní zákon (1) a umíme řešit uvedené rovnice. Volme a ∈ G. Označme ea řešení rovnice a x = a, tj. platí a ea = a. Ukážeme nejprve, že pro libovolné b ∈ G je b ea = b. Nechť y ∈ G řeší rovnici y a = b. Pak platí b ea = (y a) ea = y (a ea) = y a = b. Vidíme tedy, že řešení ea rovnice a x = a nezávisí na volbě prvku a, takže stačí prvek ea označovat e. Podobně lze ukázat, že také řešení rovnice y a = a nezávisí na volbě prvku a. Označme toto řešení f. Nyní podobně jako v důkazu věty 1.44 je f e = f, protože e řeší a e = a a platí f e = e, protože f řeší y a = a. Takže e = f a toto je jednotkový prvek grupy. Sestrojíme inverzní prvek k prvku x ∈ G. Nechť u řeší rovnici x u = e a v řeší rovnici v x = e. Platí v = v e = v (x u) = (v x) u = e u = u, takže u = v je inverzní prvek k prvku x. 13 Lineární algebra 1. Lineární prostor, grupa, těleso Pologrupa, grupoid 1.46. Poznámka. Vzhledem k předchozí větě se v některé literatuře definuje grupa jen pomocí asociativního zákona a řešitelnosti rovnic (jen dvě vlastnosti). Pokud platí jen asociativní zákon a řešitelnost rovnic není požadována, mluví se o pologrupě. Pokud je pouze dána operace : G × G → G bez dalších vlastností, mluví se v některé literatuře o grupoidu. Takže množina s operací je grupoid. Grupoid s asociativním zákonem je pologrupa. Pologrupa s řešitelností rovnic je grupa. Podgrupa1.47. Definice. Nechť G je grupa s operací . Pokud G1 ⊂ G je sama o sobě grupou se stejnou operací (tj. speciálně : G1 × G1 → G1 a platí vlastnosti (1)–(3) definice grupy 1.31), nazýváme G1 podgrupou grupy G. 1.48. Poznámka. Výše uvedenou definici uvádím hlavně proto, aby měl čtenář možnost ji porovnat s definicí podprostoru 1.17 a shledal, že základní myšlenka definice podstruktury je pořád stejná. V případě ověřování podgrupy je kontrola asociativního zákona (1) zbytečná (je zaručen už ve vnější grupě), ale vlastnosti x y ∈ G1, e ∈ G1 a existence inverzního prvku v G1 jsou podstatné. 1.49. Příklad. Množina Z celých čísel s operací sčítání „+ je podgrupou grupy R reálných čísel se stejnou operací. 1.50. Příklad. Množina Z \ {0} celých nenulových čísel s operací násobení „· není podgrupou grupy R \ {0} reálných čísel se stejnou operací, protože k číslům různým od −1 a 1 neexistuje na množině Z \ {0} inverzní prvek. Na druhé straně se jedná o pologrupu, protože násobení je uzavřeno na nenulová celá čísla a je samozřejmě asociativní. Těleso1.51. Definice. Těleso je množina T se dvěma operacemi obvykle označovanými + : T × T → T a · : T × T → T, které mají následující vlastnosti: (1) T s operací „+ je komutativní grupa. Neutrální prvek této grupy je označen symbolem 0. (2) T \ {0} s operací „· je komutativní grupa. Jednotkový prvek této grupy se značí symbolem 1. (3) Operace „+ a „· splňují distributivní zákon: a · (b + c) = a · b + a · c. 1.52. Poznámka. Někteří autoři v definici tělesa nepožadují komutativitu grupy vzhledem k násobení a pokud je splněna, mluví o komutativním tělese. Existují příklady, kdy komutativita násobení není splněna Důležitým příkladem jsou kvaterniony: čísla podobná komplexním, ale se třemi nezávislými imaginárními jednotkami. Kvaterniony se užívají například při popisu 3D transformací v počítačové grafice [26]. V našem textu budeme u těles vždy předpokládat komutativitu obou operací. 1.53. Příklad. Reálná čísla s operacemi sčítání a násobení tvoří těleso. 1.54. Příklad. Racionální čísla jsou podtělesem tělesa reálných čísel. Podtěleso je definováno v souladu s poznámkou 1.48 jako podmnožina tělesa, která sama o sobě se stejnými operacemi tvoří těleso. 1.55. Příklad. Množina celých čísel s operacemi sčítání a násobení netvoří těleso, protože pro operaci násobení neexistuje pro všechna nenulová celá čísla inverzní prvek jako celé číslo. Toto je příklad struktury, která má všechny vlastnosti tělesa s výjimkou jediné: není zaručena existence inverzního prvku pro násobení. Taková struktura se nazývá okruh. 1.56. Příklad. Množina komplexních čísel s operacemi sčítání a násobení tvoří těleso. 1.57. Věta. Pro libovolné prvky a, b z tělesa platí: a · b = 0 právě tehdy, když a = 0 nebo b = 0. Důkaz. (⇒): T \ {0} musí být podle vlastnosti (2) definice 1.51 vzhledem k násobení grupa, tj. součin dvou nenulových prvků musí být prvek nenulový. Jinými slovy, pokud součin vychází nulový, musí aspoň jeden z činitelů být nula. (⇐): Je třeba dokázat, že 0·a = 0. Protože 0 je neutrální prvek vzhledem ke sčítání, platí 0+0 = 0. Díky distributivnímu zákonu je 0 · a = (0 + 0) · a = 0 · a + 0 · a. K oběma stranám rovnosti přičteme opačný prvek k prvku 0 · a, tedy prvek − 0 · a. Na levé straně dostáváme 0 a na pravé 0 · a. Galoisovo těleso se dvěma prvky 1.58. Příklad. Těleso musí podle definice obsahovat 0 a 1 a tyto dva prvky musejí být různé. Takže těleso musí obsahovat aspoň dva prvky. Ukážeme, že existuje těleso, které obsahuje jen tyto dva prvky, tedy T = {0, 1}. 14 Lineární algebra 1. Lineární prostor, grupa, těleso Operaci „+ definujeme: 0 + 0 = 0, 0 + 1 = 1 + 0 = 1, 1 + 1 = 0. Operaci „· definujeme jako obvyklé násobení: 0 · 0 = 0 · 1 = 1 · 0 = 0, 1 · 1 = 1. Množina T = {0, 1} s takto zavedenými operacemi tvoří těleso. Skutečně, pro operaci „+ platí asociativní zákon, 0 je neutrální prvek, opačný prvek k 0 je 0 a opačný prvek k 1 je 1. Grupa T \ {0} vzhledem k násobení je jednoprvková a všechny vlastnosti grupy zde platí zcela samozřejmě. Je rovněž splněn distributivní zákon. Sčítání je v tomto tělese totéž co odečítání. Inverzní prvek k 1 je 1. Tělesa s konečně mnoha prvky se z historických důvodů nazývají Galoisova tělesa. V našem příkladě T = {0, 1} se tedy jedná o Galoisovo těleso se dvěma prvky. Évariste Galois byl francouzský matematik, který bohužel zemřel mlád ve věku 20 let na následky zranění v souboji. I jeho teorie dokazuje mimo jiné nemožnost algebraického popisu kořenů polynomů stupně většího než 4. Tato teorie je známější než Abelova, ovšem byla zveřejněna o pět let později. 1.59. Poznámka. Chceme-li na dvouprvkové množině definovat operace sčítání a násobení tak, abychom získali těleso, nemůžeme to udělat jinak, než v příkladu 1.58. Především 0 je neutrální prvek vzhledem ke sčítání, takže podle vlastnosti (2) definice grupy 1.31 musí 0 + 0 = 0, 0 + 1 = 1 + 0 = 1. Dále množina {1} musí být grupou vzhledem k násobení, takže musí 1 · 1 = 1. Dále musí platit 0 · a = a · 0 = 0, jinak by nebyla splněna věta 1.57. Zbývá otázka, zda můžeme definovat 1 + 1 = 1. Nemůžeme, protože pak by prvek 1 neměl prvek opačný. GF(p), Zp1.60. Příklad. Na množině {0, 1, . . . , p−1} definujme operace „+ a „· jako obvyklé sčítání a násobení, ovšem na výsledek aplikujme proces „modulo p . Takže například pro p = 5 pracujeme s množinou {0, 1, 2, 3, 4} a platí 4 + 3 = 2, protože zbytek po dělení čísla 7 číslem 5 je 2. Nebo 4 · 4 = 1, protože zbytek po dělení čísla 16 číslem 5 je 1. Nechť nejprve p není prvočíslo, tj. je tvaru součinu p = m n. Pak m · n = 0 modulo p, a přitom čísla m a n jsou nenulová. Podle věty 1.57 se nemůže jednat o těleso, protože součin nenulových čísel musí v tělese vyjít jako číslo nenulové. Nechť p je prvočíslo. Ukážeme, že M = {0, 1, . . . , p − 1} s operacemi „+, · modulo p tvoří těleso. Především M se sčítáním modulo p je komutativní grupa (viz příklad 1.40). Operace násobení modulo p je asociativní, komutativní a jednotkovým prvkem je číslo 1. Distributivní zákon plyne z distributivního zákona běžných operací „+ a „· . Nejvíce práce dá nalezení inverzního prvku pro a ∈ M \ {0}. Prvek a nechme pevný a uvažujme všechna čísla „ak modulo p pro k ∈ {1, 2, . . . , p − 1}. Tato čísla jsou pro různá k vzájemně různá (viz níže) a pokrývají tedy celou množinu {1, 2, . . . , p − 1}. Musí tedy existovat takové k, že ak = 1 mod p. Toto k je inverzním prvkem k prvku a. V úvaze ještě chybí obhájit, že čísla „ak modulo p jsou pro různá k vzájemně různá. Předpokládejme, že existují čísla k1, k2 ∈ M \ {0}, k1 ≥ k2 taková, že ak1 = ak2 mod p, tj. a(k1 − k2) = mp pro nějaké m ≥ 0. Rovnost vydělíme číslem a. Protože a < p a p je prvočíslo, existuje m1 ≥ 0, že po vydělení číslem a dostáváme k1 − k2 = m1p. Vlevo je číslo menší než p, takže musí být m1 = 0, tj. k1 = k2. Podle počtu prvků p se toto těleso označuje GF(p). Jiné značení Zp dává najevo, že se jedná o celá čísla „modulo p . Předchozí příklad 1.58 definuje konečné těleso Zp pro p = 2. 1.61. Definice. Charakteristika tělesa udává nejmenší kladný počet jedniček, jejichž součet dává nulu. Tedy pokud je λ 1 1 = 0 a λ je nejmenší kladné číslo s touto vlastností, pak těleso má charakteristiku λ. Pokud tato vlastnost není splněna pro žádný počet jedniček, je charakteristika rovna ∞. 1.62. Příklad. Charakteristika tělesa reálných čísel je ∞. Charakteristika tělesa Zp je p. 1.63. Věta. Charakteristika tělesa je nekonečná nebo to je prvočíslo. Důkaz. Sporem. Nechť pro charakteristiku λ platí λ = mn, m = λ, n = λ. Z distributivního zákona plyne ( m 1 1)·( n 1 1) = mn 1 1 = λ 1 1 = 0. Podle věty 1.57 musí být aspoň jedna suma v závorce rovna nule, protože jejich součin je nulový. To je spor s tím, že λ je nejmenší počet jedniček, jejichž součet je nulový. 1.64. Poznámka. Kromě GF(p), kde p je prvočíslo, existují konečná tělesa s počtem prvků pm , kde p je prvočíslo, m je libovolná mocnina, značení: GF(pm ). Jak jsme ukázali v příkladě 1.60, konstrukce operací pro GF(pm ) nemůže vycházet jen z myšlenky „modulo p . Ve skutečnosti je konstrukce tělesa GF(pm ) výrazně komplikovanější. V následujícím příkladě je pro ilustraci popsáno těleso GF(23 ). 15 Lineární algebra 1. Lineární prostor, grupa, těleso Z věty 1.63 plyne, že i tělesa GF(pm ) musejí mít charakteristiku ve tvaru prvočísla. Kdybychom zde měli prostor na podrobnější popis těles GF(pm ), shledali bychom, že mají charakteristiku p. Dá se dále ukázat, že pokud má mít těleso konečný počet prvků, pak tento počet nemůže být jiný než pm , kde p je prvočíslo a m přirozené číslo. Navíc operace na konečném tělese lze definovat jediným možným způsobem (lišit se může jen způsob označení prvků). 1.65. Příklad. Uvažujme množinu všech uspořádaných trojic prvků ze Z2 indexovaných čísly. Nulová trojice nemá žádný index a ostatní trojice mají přiřazeny indexy 0 až 6: {(0, 0, 0)∗, (1, 0, 0)0, (0, 1, 0)1, (0, 0, 1)2, (1, 1, 0)3, (0, 1, 1)4, (1, 1, 1)5, (1, 0, 1)6}. Prvky této množiny budeme sčítat tak, že si indexů nebudeme všímat a budeme sčítat jen uspořádané trojice v aritmetice Z2. Například (1, 1, 0)3 +(0, 1, 1)4 = (1, 0, 1)6, protože je (1, 1, 0)+ (0, 1, 1) = (1, 0, 1) v aritmetice Z2. Výsledek násobení kteréhokoli prvku s prvkem (0, 0, 0)∗ definujeme jako (0, 0, 0)∗. Jedná se o nulový prvek tělesa. Násobení nenulových prvků definujeme tak, že si nevšímáme uspořádaných trojic, ale jen indexů. Ty sečteme a provedeme operaci modulo 7. Například (0, 1, 1)4 · (1, 1, 1)5 = (0, 0, 1)2, protože 4 + 5 modulo 7 = 2. Dá se ukázat, že tento příklad splňuje axiomy tělesa. Obsahuje 23 prvků, takže se jedná o příklad tělesa GF(23 ). Jak již bylo řečeno, je (0, 0, 0)∗ nulový prvek. Rovněž je zřejmé, že (1, 0, 0)0 je jednotkový prvek tohoto tělesa. Inverzní prvek například k (0, 0, 1)2 je (1, 1, 1)5, protože 2 + 5 modulo 7 = 0. Opačný prvek k libovolnému prvku x je prvek x, protože v aritmetice Z2 je 1 + 1 = 0. Charakteristika tohoto tělesa je 2. Prosím čtenáře, aby se nesnažil hrubou silou ověřit platnost distributivního zákona tohoto tělesa (jde to, ale není to příliš účelné) ani příliš nehloubal nad tím, proč například trojice (1, 1, 1) má index 5. Pro odpovědi na tyto otázky je potřeba použít vlastnosti ireducibilních polynomů nad tělesem Z2 (obecně nad tělesem Zp), což bohužel překračuje rámec tohoto úvodního textu. Lineární prostor nad tělesem 1.66. Poznámka. V definici lineárního prostoru 1.6 jsme sice byli dostatečně abstraktní (vektory, ani operace s nimi jsme blíže nespecifikovali), ale pracovali jsme tam s docela konkrétní množinou R reálných čísel. Pokud v této definici nahradíme množinu R pojmem těleso (s blíže nespecifikovanými prvky a operacemi), dostáváme lineární prostor nad tělesem. Můžeme pak pracovat s lineárním prostorem nad tělesem komplexních čísel, lineárním prostorem nad tělesem Z2 atd. Pokusíme se tedy do třetice přepsat definici lineárního prostoru, tentokrát nad libovolným tělesem. 1.67. Definice. Množinu L nazýváme lineárním prostorem nad tělesem T, pokud jsou definovány operace + : L×L → L a · : T ×L → L tak, že L tvoří s operací + komutativní grupu, a dále ∀α, β ∈ T, ∀x, y ∈ L: (A) α · (β · x) = (α · β) · x, (B) α · (x + y) = α · x + α · y, (C) (α + β) · x = α · x + β · x, (D) 1 · x = x. 1.68. Poznámka. Volíme-li za těleso T v této definici množinu reálných čísel R, dostáváme vzhledem k poznámce 1.42 definici lineárního prostoru 1.6. Abych uklidnil čtenáře, tak konstatuji, že v dalších kapitolách tohoto textu nebudeme potřebovat lineární prostor v takové obecnosti (nad libovolným tělesem) a vystačíme si většinou s lineárním prostorem nad reálnými čísly. Pokud tedy nebude výslovně řečeno jinak (například lineární prostor nad Z2 studovaný v kapitole 10), pak pojmem lineární prostor myslíme lineární prostor nad R a stačí použít definici 1.6. 1.69. Příklad. Vrátíme se k příkladu lineárního prostoru reálných uspořádaných n-tic 1.11 a zobecníme ho na lineární prostor uspořádaných n-tic prvků libovolného tělesa. Nechť T je těleso. Uvažujme množinu uspořádaných n-tic prvků z tělesa T (označme ji Tn ) a definujme na ni operace + : Tn × Tn → Tn , · : T × Tn → Tn takto: pro každé (a1, . . . , an) ∈ Tn , (b1, . . . , bn) ∈ Tn , α ∈ T je (a1, . . . , an) + (b1, . . . , bn) df = (a1 + b1, . . . , an + bn), α · (a1, . . . , an) df = (α · a1, . . . , α · an). Snadno se dá ověřit, že množina Tn s takto definovanými operacemi tvoří lineární prostor nad tělesem T. 16 Lineární algebra 1. Lineární prostor, grupa, těleso 1.70. Poznámka. Volíme-li za těleso T = Z2, je Tn podle předchozího příkladu diskrétní lineární prostor, který je používán v teorii kódování. Jednotlivé vektory (tzv. binární slova) jsou uspořádané n-tice jedniček a nul. Tento lineární prostor má celkem 2n různých vektorů. 1.71. Poznámka. V případě lineárního prostoru nad konečným tělesem dostáváme konečný lineární prostor. V tomto případě tedy neplatí tvrzení poznámky 1.27. Můžete si všimnout, že toto tvrzení se opíralo o skutečnost, že „reálných čísel je nekonečně mnoho . Poznámka 1.27 zůstává v platnosti pro lineární prostory nad nekonečnými tělesy. 17 2. Lineární závislost a nezávislost, lineární obal, báze, dimenze 2.1. Poznámka. Ačkoli jsme v předchozí kapitole uvedli desítky příkladů, které měly ilustrovat definici lineárního prostoru, je možné, že smysl této definice se tím nepodařilo objasnit. Můžete se ptát, proč jsme nuceni ověřovat u různých množin, zda jsou či nejsou při definování určitých operací sčítání a násobení reálným číslem lineárními prostory. Neuvedli jsme totiž, že pokud nějaká množina je lineárním prostorem, lze na ni zkoumat mnoho dalších vlastností a zavést plno užitečných pojmů, které jsou společné všem lineárním prostorům. Tyto vlastnosti a pojmy předpokládají pouze to, že vektory (tj. prvky nějaké blíže neurčené množiny) umíme sčítat a násobit reálným číslem, a přitom tyto operace splňují vlastnosti (1) až (7) z definice 1.6. Kdybychom tuto jednotící definici neměli, museli bychom například zvlášť zavádět pojmy lineární závislost, báze a dimenze pro množinu orientovaných úseček, zvlášť pro množinu uspořádaných n-tic a zvlášť pro množinu reálných funkcí. Až bychom třeba později zjistili, že můžeme kupříkladu nekonečné posloupnosti reálných čísel sčítat a násobit skalárem, znovu bychom pro tuto množinu byli nuceni definovat pojmy lineární závislost, báze a dimenze. Přitom k zavedení těchto pojmů je zapotřebí dokázat několik tvrzení, která bychom tak museli dokazovat pro každou konkrétní množinu zvlášť. Snad každý uzná, že to je docela zbytečná práce. Je přeci jen jednodušší ověřit, že nějaká množina tvoří lineární prostor a okamžitě pro ni používat všechny další vlastnosti a pojmy, které se dozvíme v této kapitole. 2.2. Poznámka. Sčítání má podle definice 1.6 dva operandy. Když bychom chtěli sečíst třeba tři vektory x + y + z, měli bychom uvést, v jakém pořadí budeme operace provádět, tj. zda provedeme (x + y) + z nebo x + (y + z). Vlastnost (2) definice 1.6 nás ale od této povinnosti osvobozuje, protože zaručuje, že oba případy povedou ke stejnému výsledku. Proto nebudeme v takovém případě nadále závorky uvádět a například pro vektory x1, x2, . . . , xn budeme jejich součet zapisovat jednoduše: x1 + x2 + · · · + xn. Dále budeme místo x+(−1)·y zapisovat stručně x−y. Tím vlastně máme zavedenu operaci odčítání vektorů, ačkoli tato operace není v definici 1.6 vůbec zmíněna. Abychom v textu odlišili vektory (tj. prvky nějakého lineárního prostoru) od reálných čísel, budeme vektory označovat malými písmeny anglické abecedy a vždy je zvýrazníme tučně, tedy takto: x, y, a, x1 atd. V psaném textu se často vektory zvýrazňují zápisem šipky nad písmeno, podtržením písmene nebo i jinak. Lineární kombinace 2.3. Definice. Nechť x1, x2, . . . , xn jsou vektory (tj. prvky nějakého lineárního prostoru). Lineární kombinací vektorů x1, x2, . . . , xn rozumíme vektor α1 · x1 + α2 · x2 + · · · + αn · xn, kde α1, α2, . . . , αn jsou nějaká reálná čísla. Těmto číslům říkáme koeficienty lineární kombinace. 2.4. Příklad. Lineární kombinací vektorů x, y, z může být třeba vektor x+y+z (všechny tři koeficienty jsou rovny jedné), nebo vektor 2x − y + 3,18z (koeficienty jsou čísla 2; −1; 3,18), nebo také vektor α x + β y + γ z (koeficienty α, β, γ ∈ R jsme blíže neurčili). Triviální lineární kombinace 2.5. Definice. Triviální lineární kombinace vektorů x1, x2, . . . , xn je taková lineární kombinace, která má všechny koeficienty nulové, tj. 0x1 +0x2 +· · ·+0xn. Netriviální lineární kombinace je taková lineární kombinace, která není triviální, tj. aspoň jeden její koeficient je nenulový. 2.6. Věta. Triviální lineární kombinace je vždy rovna nulovému vektoru. Důkaz. Podle vlastnosti (7) v definici 1.6 je každý sčítanec v triviální lineární kombinaci roven nulovému vektoru a podle vlastnosti (1) věty 1.7 je i součet nulových vektorů roven nulovému vektoru. Lineární závislost skupiny 2.7. Definice. Skupinu vektorů x1, x2, . . . , xn nazýváme lineárně závislou, pokud existuje netriviální lineární kombinace vektorů x1, x2, . . . , xn, která je rovna nulovému vektoru. Stručně říkáme, že vektory x1, x2, . . . , xn jsou lineárně závislé. 2.8. Poznámka. Pokud bychom rozvedli pojem netriviální lineární kombinace podle definic 2.5 a 2.3, můžeme říci, že vektory x1, x2, . . . , xn jsou lineárně závislé, pokud existují reálná čísla α1, α2, . . . , αn tak, že aspoň jedno z nich je nenulové, a přitom platí α1 · x1 + α2 · x2 + · · · + αn · xn = o. 18 Lineární algebra 2. Lineární závislost a nezávislost, lineární obal, báze, dimenze Lineární nezávislost skupiny 2.9. Definice. Skupinu vektorů x1, x2, . . . , xn nazýváme lineárně nezávislou, pokud není lineárně závislá. Stručně říkáme, že vektory x1, x2, . . . , xn jsou lineárně nezávislé. 2.10. Poznámka. Vektory jsou lineárně nezávislé, pokud (podle definic 2.7 a 2.9) neexistuje netriviální lineární kombinace těchto vektorů, která je rovna nulovému vektoru. Jinak řečeno, jedině triviální lineární kombinace je rovna nulovému vektoru. Při použití definice 2.5 můžeme říci, že vektory x1, x2, . . . , xn jsou lineárně nezávislé, pokud z předpokladu α1 · x1 + α2 · x2 + · · · + αn · xn = o nutně plyne, že α1 = α2 = · · · = αn = 0. 2.11. Poznámka. Ačkoli se vesměs používá stručná formulace: „vektory x1, x2, . . . , xn jsou lineárně závislé/nezávislé místo přesnějšího: „skupina vektorů x1, x2, . . . , xn je lineárně závislá/nezávislá , je potřeba si uvědomit, že stručná formulace může vést k nepochopení. Rozhodně se tím nechce říci, že jednotlivé vektory jsou lineárně závislé/nezávislé (tj. x1 je lineárně závislý/nezávislý, x2 je lineárně závislý/nezávislý atd.), ale jedná se vždy o vlastnost celé skupiny vektorů jako celku. Pojem lineární závislosti a nezávislosti vektorů má v lineární algebře zásadní důležitost. Závislost vektorů je možná názornější z pohledu následující věty 2.21, ovšem při ověřování lineární závislosti abstraktních vektorů je definice 2.7 použitelnější. Má proto smysl definicím 2.7 a 2.9 věnovat náležitou pozornost. 2.12. Příklad. Uvažujme lineární prostor R3 (viz příklad 1.11, n = 3). Jsou dány tři vektory z R3 : x = (1, 2, 3), y = (1, 0, 2), z = (−1, 4, 0). Zjistíme z definice, zda jsou vektory x, y, z lineárně závislé či nezávislé. Podle poznámek 2.8 a 2.10 stačí zjistit, jaké mohou být koeficienty α, β, γ, pokud položíme α x + β y + γ z = o. Dosazením do této rovnice dostáváme α (1, 2, 3) + β (1, 0, 2) + γ (−1, 4, 0) = (0, 0, 0). Zde jsme využili toho, že nulový vektor v R3 je roven trojici (0, 0, 0). Dále podle definice sčítání a násobení skalárem na R3 dostáváme (α + β − γ, 2 α + 4 γ, 3 α + 2 β) = (0, 0, 0). Dvě uspořádané trojice se rovnají, pokud se rovnají jejich odpovídající složky. Musí tedy platit tyto rovnice: α + β − γ = 0, 2 α + 4 γ = 0, 3 α + 2 β = 0. Tato soustava má nekonečně mnoho řešení (zkuste si to ověřit třeba Gaussovou eliminační metodou). Mezi těmito řešeními je jediné triviální, všechna ostatní jsou netriviální. Příkladem takového netriviálního řešení může být třeba α = 2, β = −3, γ = −1, takže 2 (1, 2, 3) − 3 (1, 0, 2) − 1 (−1, 4, 0) = (0, 0, 0). Existuje tedy netriviální lineární kombinace vektorů x, y, z, která je rovna nulovému vektoru, což podle definice 2.7 znamená, že vektory x, y, z jsou lineárně závislé. 2.13. Příklad. V lineárním prostoru R3 jsou dány tři vektory z R3 : x = (1, 2, 3), y = (1, 0, 2), z = (−2, 1, 0). Zjistíme z definice, zda jsou vektory x, y, z lineárně závislé či nezávislé. Podle poznámek 2.8 a 2.10 stačí zjistit, jaké mohou být koeficienty α, β, γ, pokud položíme α x+β y+γ z = o. Dosazením do této rovnice dostáváme α (1, 2, 3) + β (1, 0, 2) + γ (−2, 1, 0) = (0, 0, 0), (α + β − 2 γ, 2 α + γ, 3 α + 2 β) = (0, 0, 0). Dvě uspořádané trojice se rovnají, pokud se rovnají jejich odpovídající složky. Musí tedy platit tyto rovnice: α + β − 2 γ = 0, 2 α + γ = 0, 3 α + 2 β = 0. Tato soustava má jediné řešení α = 0, β = 0, γ = 0 (zkuste si to ověřit třeba Gaussovou eliminační metodou). Vidíme tedy, že jedině triviální lineární kombinace vektorů x, y, z je rovna nulovému vektoru, což podle definice 2.9 znamená, že vektory x, y, z jsou lineárně nezávislé. 19 Lineární algebra 2. Lineární závislost a nezávislost, lineární obal, báze, dimenze 2.14. Příklad. Uvažujme lineární prostor všech reálných funkcí definovaných na R a v něm tři funkce f, g, h, které jsou zadané těmito vzorci: f(x) = sin(x), g(x) = cos(x), h(x) = 4 ∀x ∈ R. Ověříme, zda jsou tyto tři funkce lineárně nezávislé či závislé. Položíme jejich lineární kombinaci rovnu nulové funkci: α · sin(x) + β · cos(x) + γ · 4 = 0 ∀x ∈ R (2.1) a zjistíme, jakých hodnot mohou nabývat koeficienty α, β, γ. Tato rovnost má být splněna pro všechna x ∈ R. Je možné, že při volbě tří hodnot x ∈ R už vynutíme trivialitu lineární kombinace v (2.1). Zkusme štěstí například pro x ∈ 0, π 2 , π . V rovnici (2.1) se tedy omezíme na α · sin(x) + β · cos(x) + γ · 4 = 0 pro x ∈ 0, π 2 , π . (2.2) Po dosazení hodnot x dostáváme tři rovnice: 0 α + β + 4 γ = 0, α + 0 β + 4 γ = 0, 0 α − β + 4 γ = 0. Tato soustava má jediné řešení α = 0, β = 0, γ = 0 (zkuste si to ověřit třeba Gaussovou eliminační metodou). Takže pokus se zdařil. Z rovnice (2.1) plyne (2.2) a z ní pak α = 0, β = 0, γ = 0. To podle definice znamená, že vektory f, g, h jsou lineárně nezávislé. 2.15. Příklad. Uvažujme lineární prostor všech reálných funkcí definovaných na R a v něm tři funkce f, g, h, které jsou zadané těmito vzorci: f(x) = sin2 (x), g(x) = 3 cos2 (x), h(x) = 4 ∀x ∈ R. Ověříme, zda jsou tyto tři funkce lineárně nezávislé či závislé. Položíme jejich lineární kombinaci rovnu nulové funkci: α · sin2 (x) + β · 3 cos2 (x) + γ · 4 = 0 ∀x ∈ R a zjistíme, jakých hodnot mohou nabývat koeficienty α, β, γ. Jako v příkladu 2.14 zkusíme volit nějaké tři hodnoty x. Po dosazení x = 0, x = π/2 a x = π dostáváme soustavu 3 β + 4 γ = 0, α + 4 γ = 0, 3 β + 4 γ = 0. Vidíme, že jedna rovnice je zde napsaná dvakrát, takže zbývají dvě rovnice o třech neznámých. Taková soustava rovnic má nekonečně mnoho řešení, jedním z nich je například α = 12, β = 4, γ = −3. To nám ale k závěru o lineární závislosti funkcí nestačí, protože my musíme najít netriviální kombinaci rovnou nule pro všechna x ∈ R, nikoli jen pro tři vyvolené hodnoty. Výsledek ale napovídá, jaké by mohly být koeficienty hledané netriviální lineární kombinace: 12 · sin2 (x) + 4 · 3 cos2 (x) − 3 · 4 = 12 (sin2 (x) + cos2 (x)) − 12 = 0 ∀ x ∈ R. Zde jsme využili vzorce sin2 (x) + cos2 (x) = 1 pro všecha x ∈ R. Našli jsme tedy netriviální lineární kombinaci, která je rovna nulové funkci na celém definičním oboru, a proto jsou funkce f, g, h lineárně závislé. 2.16. Příklad. Nechť u, v, w jsou prvky nějakého (blíže nespecifikovaného) lineárního prostoru. Předpokládejme, že jsou lineárně nezávislé. Úkolem je zjistit, pro které a ∈ R jsou vektory x = 2 u − v, y = u + 3 v − 2 w, z = v + a w lineárně závislé. 20 Lineární algebra 2. Lineární závislost a nezávislost, lineární obal, báze, dimenze Položíme tedy lineární kombinaci vektorů x, y, z rovnu nulovému vektoru a budeme zjišťovat, jaké musí být koeficienty α, β, γ: α x + β y + γ z = o. Dosadíme: α (2 u − v) + β (u + 3 v − 2 w) + γ (v + a w) = o a po úpravách dostáváme (2 α + β) u + (−α + 3 β + γ) v + (−2 β + a γ) w = o. Protože podle předpokladů jsou vektory u, v, w lineárně nezávislé, musí být tato lineární kombinace jedině triviální, tj. všechny koeficienty jsou nulové: 2 α + β = 0, − α + 3 β + γ = 0, − 2 β + a γ = 0. Například pomocí Gaussovy eliminační metody se můžeme přesvědčit, že soustava má jediné řešení α = 0, β = 0, γ = 0 pro 7a + 4 = 0. V takovém případě budou vektory x, y, z lineárně nezávislé. Jestliže naopak 7a + 4 = 0, má soustava nekonečně mnoho řešení, mezi kterými se jistě najde i netriviální řešení. Vektory x, y, z jsou tedy lineárně závislé pro a = −4/7. Základní vlastnosti lineární (ne)závislosti 2.17. Věta. Nechť x1, x2, . . . , xn jsou prvky nějakého lineárního prostoru L. Pak platí: (1) Lineární závislost či nezávislost vektorů x1, x2, . . . , xn se nezmění při změně pořadí těchto vektorů. (2) Jestliže se mezi x1, x2, . . . , xn vyskytuje nulový vektor, pak jsou tyto vektory lineárně závislé. (3) Jestliže se ve skupině vektorů x1, x2, . . . , xn některý vektor vyskytuje aspoň dvakrát, je tato skupina vektorů lineárně závislá. (4) Jestliže jsou vektory x1, x2, . . . , xn lineárně závislé a xn+1 ∈ L, pak jsou i vektory x1, x2, . . . , xn, xn+1 lineárně závislé. (5) Jestliže jsou vektory x1, x2, . . . , xn lineárně nezávislé, pak jsou i vektory x1, x2, . . . , xn−1 lineárně nezávislé. (6) Samotný vektor x1 (chápaný ovšem jako skupina vektorů o jednom prvku) je lineárně nezávislý právě tehdy, když je nenulový. Důkaz. (1) Lineární kombinace vektorů x1, x2, . . . , xn nezávisí na jejich pořadí, protože sčítání vektorů je podle definice 1.6 komutativní. (2) Vzhledem k vlastnosti (1) stačí bez újmy na obecnosti předpokládat, že o = x1. Pak platí: 1 · o + 0 · x2 + 0 · x3 + · · · + 0 · xn = o, což je netriviální lineární kombinace rovna nulovému vektoru. (3) Vzhledem k vlastnosti (1) stačí bez újmy na obecnosti předpokládat, že x1 = x2. Pak platí: 1 · x1 + (−1) · x2 + 0 · x3 + · · · + 0 · xn = (1 − 1) · x1 = o, což je netriviální lineární kombinace rovna nulovému vektoru. (4) Podle předpokladu existuje netriviální lineární kombinace α1 x1 + α2 x2 + · · · + αn xn rovna nulovému vektoru. Potom platí α1 x1 + · · · + αn xn + 0 · xn+1 = o, což je netriviální lineární kombinace vektorů x1, x2, . . . , xn, xn+1 rovna nulovému vektoru. (5) Dokážeme to sporem. Budeme předpokládat negaci tvrzení věty (tj. že vektory x1, x2, . . . , xn−1 jsou lineárně závislé). Pak ale podle vlastnosti (4) musejí být lineárně závislé i vektory x1, x2, . . . , xn, což je spor s předpokladem, že tyto vektory jsou lineárně nezávislé. (6) Je-li x1 = o, pak je x1 podle vlastnosti (2) lineárně závislý. Předpokládejme nyní x1 = o a položme α x1 = o. Kdyby bylo α = 0, mohli bychom psát x1 = 1 · x1 = 1 α α · x1 = 1 α (α x1) = 1 α · o = o. To je ale spor. Musí tedy být α = 0. To znamená, že pouze triviální lineární kombinace je rovna nulovému vektoru, takže vektor x1 je lineárně nezávislý. 21 Lineární algebra 2. Lineární závislost a nezávislost, lineární obal, báze, dimenze 2.18. Poznámka. Vlastnost (4) předchozí věty nelze „obrátit . Přesněji: z lineární závislosti vektorů x1, x2, . . . , xn neplyne nic o lineární závislosti či nezávislosti vektorů x1, x2, . . . , xn−1. Může se třeba stát, že vektory x1, x2, . . . , xn−1 jsou lineárně nezávislé a lineární závislost vektorů x1, x2, . . . , xn je způsobena tím, že vektor xn je nulový. Může se ale také stát, že vektory x1, x2, . . . , xn−1 zůstávají lineárně závislé. 2.19. Poznámka. Vlastnost (5) předchozí věty nelze „obrátit . Přesněji: z lineární nezávislosti vektorů x1, x2, . . . , xn neplyne nic o lineární závislosti či nezávislosti vektorů x1, x2, . . . , xn+1. Vektor xn+1 totiž může být nulový, ale také může být takový, že vektory x1, x2, . . . , xn+1 zůstávají lineárně nezávislé. 2.20. Příklad. Nechť x1, x2, . . . , xm jsou vektory z lineárního prostoru Rn . Ukážeme, že pokud m > n, jsou nutně tyto vektory lineárně závislé. Podle definice lineární závislosti hledejme netriviální lineární kombinaci, pro kterou α1 x1 + α2 x2 + · · · + αm xm = o. Rozepsáním tohoto požadavku do složek dostáváme n rovnic o m neznámých. Protože pravé strany rovnic jsou nulové, soustava má určitě aspoň triviální řešení. Protože je v soustavě více neznámých než rovnic existuje nekonečně mnoho řešení této soustavy. Mezi těmito řešeními je jen jediné triviální a všechna ostatní jsou netriviální. Poznamenejme ještě, že matematicky korektnější argumentace k tomuto příkladu vychází jako důsledek věty 2.56. Poznamenejme, že příklad ukazuje důležitou vlastnost lineárních prostorů Rn : všechny lineárně nezávislé skupiny vektorů mají počet vektorů menší nebo roven n. Jeden vektor je lineární kombinací ostatních 2.21. Věta. Nechť n ≥ 2. Vektory x1, x2, . . . , xn jsou lineárně závislé právě tehdy, když existuje index r ∈ {1, . . . , n} takový, že vektor xr je roven lineární kombinaci ostatních vektorů. Důkaz. Věty formulované ve tvaru ekvivalence (výrok A platí právě tehdy, když platí výrok B) se obvykle dokazují ve dvou krocích. Nejprve dokážeme, že z A plyne B a pak dokážeme, že z B plyne A. Dokazujme tedy nejprve, že z lineární závislosti vektorů x1, x2, . . . , xn plyne existence indexu r výše uvedené vlastnosti. Z definice lineární závislosti víme, že existuje netriviální lineární kombinace rovna nulovému vektoru, tj. α1 x1 + α2 x2 + · · · + αn xn = n i=1 αi xi = o, (2.3) a přitom aspoň jeden koeficient lineární kombinace je nenulový. Existuje tedy r ∈ {1, . . . , n} takové, že αr = 0. Přičteme nyní vektor −αr xr k oběma stranám rovnice (2.3) n i=1 i=r αi xi = −αr xr. Po vynásobení obou stran rovnice koeficientem −1/αr dostáváme n i=1 i=r αi −αr xi = xr. Vektor xr je tedy roven lineární kombinaci ostatních vektorů. V druhé části důkazu předpokládáme existenci koeficientu r takového, že vektor xr je roven lineární kombinaci ostatních vektorů. Dokážeme lineární závislost vektorů x1, x2, . . . , xn. Pro nějaké r ∈ {1, . . . , n} tedy platí xr = n i=1 i=r βi xi. Přičteme-li k oběma stranám této rovnice vektor −xr, dostáváme n i=1 i=r βi xi + (−1) · xr = o, což je netriviální lineární kombinace vektorů x1, x2, . . . , xn (její r-tý koeficient je jistě nenulový), která je rovna nulovému vektoru. 22 Lineární algebra 2. Lineární závislost a nezávislost, lineární obal, báze, dimenze 2.22. Poznámka. Věta 2.21 se dá přeformulovat též takto: vektory x1, x2, . . . , xn jsou lineárně nezávislé právě tehdy, když žádný z vektorů xi, i ∈ {1, . . . , n}, není lineární kombinací ostatních vektorů. 2.23. Poznámka. Věta 2.21 má pro n = 2 tento důsledek: dva nenulové vektory x, y jsou lineárně závislé právě tehdy, když existuje α ∈ R tak, že x = α y. Lidově řečeno: jeden vektor je násobkem druhého. Závislost oriento- vaných úseček 2.24. Příklad. Uvažujme lineární prostor UO všech orientovaných úseček z příkladu 1.24. (1) Leží-li dvě úsečky u, v ∈ UO ve stejné přímce, pak jsou lineárně závislé, protože jedna je násobkem druhé. Neleží-li úsečky u, v ve společné přímce, pak jsou lineárně nezávislé. (2) Nechť u, v ∈ UO jsou lineárně nezávislé. Pak množina všech lineárních kombinací α u + β v vyplňuje množinu všech úseček, které mají koncový bod v rovině určené úsečkami u, v. Abychom to dokázali, potřebujeme určitou představivost a zkušenosti s euklidovskou geometrií. Připomeňme, že O značí společný počátek všech orientovaných úseček našeho lineárního prostoru. Zvolme nyní libovolnou orientovanou úsečku x s počátkem v O, která leží v rovině určené úsečkami u, v. Ukážeme, že existují α, β ∈ R tak, že x = α u + β v. Leží-li x na společné přímce s úsečkou u nebo na přímce společné s úsečkou v, pak je x násobkem této úsečky a druhý koeficient hledané lineární kombinace je nulový. Nechť tedy x neleží na žádné z těchto přímek. Koncový bod úsečky x označme X. Veďme bodem X rovnoběžku s úsečkou u a rovnoběžku s úsečkou v. První z nich nutně protne přímku, na které leží úsečka v, v nějakém bodě P a druhá protne přímku, na které leží úsečka u, v nějakém bodě Q. Zvolme α, β ∈ R tak, aby α u = −−→ OQ a β v = −−→ OP (symbolem −→ OA značíme orientovanou úsečku s počátkem v bodě O a koncem v bodě A). Z definice sčítání orientovaných úseček pomocí rovnoběžníka vidíme, že x = α u + β v. Udělejte si náčrtek. (3) Leží-li tři usečky u, v, w ∈ UO ve společné rovině, pak jsou lineárně závislé, protože z (2) plyne, že jedna z nich je lineární kombinací ostatních. Dále použijeme větu 2.21. (4) Pokud u a v ∈ UO jsou lineárně nezávislé a w leží mimo rovinu danou úsečkami u, v, pak jsou u, v, w lineárně nezávislé. (5) Nechť u, v, w ∈ UO jsou lineárně nezávislé. Pak množina všech lineárních kombinací α u + β v + γ w vyplňuje celý lineární prostor UO. Abychom to dokázali, potřebujeme opět určitou představivost. Nechť je rovina určená úsečkami u a v. Ukážeme, že pro libovolnou orientovanou úsečku x s počátkem v O existují reálná čísla α, β, γ taková, že x = α u+β v+γ w. Leží-li x v rovině , položíme γ = 0 a dále využijeme výsledku z (2). Nechť tedy x neleží v rovině . Označme X koncový bod úsečky x. Veďme bodem X rovnoběžku s úsečkou w. Ta nutně protne rovinu v nějakém bodě P. Podle (2) existují α, β ∈ R takové, že −−→ OP = α u + β v. Nechť c je vzdálenost bodu X od bodu P. Pokud mezi bodem X a koncovým bodem úsečky w leží rovina , volme γ = −c, jinak volme γ = c. Z definice sčítání orientovaných úseček pomocí rovnoběžníka je vidět, že x = −−→ OP + γ w = α u + β v + γ w. 2.25. Poznámka. Až dosud jsme pracovali s pojmem lineární závislost či nezávislost konečných skupin vektorů. Skupina, na rozdíl od množiny, může obsahovat stejné prvky. V následující definici rozšíříme pojem lineární závislost či nezávislost na konečné i nekonečné množiny vektorů. Lineární (ne)závislost nekonečných množin 2.26. Definice. Nechť L je lineární prostor. Neprázdná konečná množina vektorů K ⊆ L, K = {x1, x2, . . . , xn} se nazývá lineárně závislá, pokud jsou vektory x1, x2, . . . , xn lineárně závislé. Nekonečná množina vektorů M ⊆ L se nazývá lineárně závislá, pokud existuje konečná K ⊆ M, která je lineárně závislá. Množina M ⊆ L se nazývá lineárně nezávislá, pokud není lineárně závislá. Prázdnou množinu považujeme vždy za lineárně nezávislou. 2.27. Poznámka. Uvedeme si podrobněji, jak poznáme lineární nezávislost množin. Neprázdná konečná množina vektorů K ⊆ L, K = {x1, x2, . . . , xn} se nazývá lineárně nezávislá, pokud jsou vektory x1, x2, . . . , xn lineárně nezávislé. Nekonečná množina vektorů M ⊆ L se nazývá lineárně nezávislá, pokud všechny konečné podmnožiny K ⊆ M jsou lineárně nezávislé. 23 Lineární algebra 2. Lineární závislost a nezávislost, lineární obal, báze, dimenze 2.28. Příklad. Nechť M = {1, x, x2 , x3 , . . .} je nekonečná podmnožina lineárního prostoru všech polynomů P. Ukážeme, že M je lineárně nezávislá. Podle definice 2.26 a poznámky za ní stačí ukázat, že každá konečná podmnožina polynomů K = {xk1 , xk2 , . . . , xkn }, n ∈ N, ki ∈ N ∪ {0} pro i ∈ {1, 2, . . . , n}, k1 < k2 < · · · < kn je lineárně nezávislá. Položme tedy lineární kombinaci prvků množiny K rovnu nulovému polynomu: α1 xk1 + α2 xk2 + · · · + αn xkn = 0 ∀ x ∈ R a ptejme se, co z toho plyne pro koeficienty α1, . . . , αn. Protože k1 < k2 < · · · < kn, odpovídají čísla α1, . . . , αn vybraným koeficientům polynomu. Nulový polynom je ovšem pouze takový polynom, který má všechny koeficienty nulové . Takže všechna čísla α1, . . . , αn musejí být rovna nule. Nulovému polynomu se tedy rovná pouze triviální lineární kombinace, takže množina K je lineárně nezávislá. Lineární obal 2.29. Definice. Nechť L je lineární prostor. Lineární obal skupiny vektorů x1, x2, . . . , xn je množina všech lineárních kombinací vektorů x1, x2, . . . , xn. Lineární obal konečné množiny K ⊆ L, K = {x1, x2, . . . , xn} ztotožňujeme s lineárním obalem skupiny vektorů x1, x2, . . . , xn. Lineární obal nekonečné množiny M ⊆ L je sjednocení lineárních obalů všech konečných podmnožin množiny M. Lineární obal skupiny vektorů x1, x2, . . . , xn značíme x1, x2, . . . , xn . Lineární obal množiny M značíme symbolem M . 2.30. Poznámka. Jsou-li x1, x2, . . . , xn vektory nějakého lineárního prostoru L, pak podle definice 2.29 je x1, x2, . . . , xn = {α1 x1 + α2 x2 + · · · + αn xn; α1 ∈ R, α2 ∈ R, . . . , αn ∈ R}. 2.31. Příklad. Uvažujme lineární prostor R3 . Najdeme lineární obal vektorů x = (1, 2, 3), y = (2, −1, 0). Podle poznámky 2.30 je (1, 2, 3), (2, −1, 0) = {α (1, 2, 3) + β (2, −1, 0); α ∈ R, β ∈ R} = {(α + 2β, 2α − β, 3α); α ∈ R, β ∈ R}. 2.32. Příklad. Jsou dány x = (1, 2, 3), y = (1, 0, 2), z = (−2, 1, 0). Ukážeme, že x, y, z = R3 . Množina lineárních kombinací prvků nějakého lineárního prostoru L je vždy podmnožinou L. Jde tedy pouze o to ukázat, že R3 ⊆ x, y, z . Volme libovolný vektor (a, b, c) ∈ R3 . Ukážeme, že (a, b, c) leží v x, y, z . K tomu je potřeba najít lineární kombinaci vektorů x, y, z, která je rovna vektoru (a, b, c). Hledejme tedy koeficienty α, β, γ, pro které platí (a, b, c) = α (1, 2, 3) + β (1, 0, 2) + γ (−2, 1, 0). Po úpravě a porovnání jednotlivých složek dostáváme soustavu α + β − 2γ = a, 2α + γ = b, 3α + 2β = c. Například Gaussovou eliminační metodou zjistíme, že soustava má řešení pro všechna a, b, c ∈ R. Proto (a, b, c) ∈ x, y, z . Prvek lineárního obalu 2.33. Poznámka. Zamysleme se nad tím, co to znamená, že z ∈ M . Existuje konečná podmnožina K ⊆ M taková, že z ∈ K . Nechť K = {x1, x2, . . . , xn}. Skutečnost, že z ∈ K znamená, že existuje nějaká lineární kombinace vektorů x1, x2, . . . , xn, která je rovna vektoru z. Vidíme tedy, že z ∈ M právě tehdy, když existuje konečně mnoho vektorů x1, x2, . . . , xn ∈ M a existují reálná čísla α1, α2, . . . , αn taková, že z = α1 x1 + α2 x2 + · · · + αn xn. (2.4) 24 Lineární algebra 2. Lineární závislost a nezávislost, lineární obal, báze, dimenze Vlastnosti lineárního obalu 2.34. Věta. Nechť L je lineární prostor, M ⊆ L, N ⊆ L. Pokud je M ⊆ N, pak platí M ⊆ N . Důkaz. Nechť z ∈ M , tj. předpokládáme, že z lze zapsat jako lineární kombinaci konečně mnoha prvků z M. Protože tyto prvky leží i v N, můžeme říci, že z lze zapsat jako lineární kombinaci konečně mnoha prvků z N. To podle poznámky 2.33 znamená, že z ∈ N . 2.35. Věta. Nechť L je lineární prostor a M ⊆ L. Pak platí: (1) M ⊆ M . (2) M = M . (3) Je-li z ∈ M , pak M = M ∪ {z} . Důkaz. (1) Stačí ukázat, že pokud z ∈ M pak z ∈ M . Platí z = 1 · z, takže pro z existuje konečně mnoho prvků z M (jmenovitě prvek z samotný) tak, že z je lineární kombinací těchto prvků. To podle poznámky 2.33 znamená, že z ∈ M . (2) Protože platí věta 2.34 a vzhledem k (1) stačí ukázat, že M ⊆ M . Nechť z ∈ M , ukážeme že z ∈ M . Protože z ∈ M , existují vektory x1, x2, . . . , xn ∈ M takové, že platí (2.4). Pro každé i ∈ {1, . . . , n} je xi ∈ M , tj. existuje konečně mnoho vektorů yi,1, . . . , yi,ki ∈ M takových, že xi = βi,1 yi,1 + · · · + βi,ki yi,ki . Dosazením těchto rovnic do (2.4) a roznásobením dostáváme výsledek, že z je lineární kombinací konečně mnoha vektorů yi,j ∈ M, i ∈ {1, . . . , n}, j ∈ {1, . . . , ki}. To znamená, že z ∈ M . (3) Toto tvrzení je důsledkem (1) a (2). Protože M ⊆ M a {z} ⊆ M , je M ∪ {z} ⊆ M . Obalením levé i pravé strany této množinové inkluze dostáváme M ∪ {z} ⊆ M = M . Obrácená inkluze plyne z věty 2.34. 2.36. Poznámka. Vlastnost (1) věty 2.35 lidově řečeno znamená, že „lineární obalení množiny může přidat do této množiny další prvky, ale pokud tento proces zopakujeme, další prvky už podle vlastnosti (2) nezískáme. Takové množiny, které při „lineárním obalení již nepřidávají žádné další prvky, jsou vždy lineárními podprostory. To ukazuje následující věta. Lineární obal je podprostor 2.37. Věta. Nechť L je lineární prostor, M ⊆ L. Množina M je lineárním podprostorem lineárního prostoru L právě tehdy, když M = M. Důkaz. Dokážeme nejprve „M je lineární podprostor, potom M = M . Vezmeme z ∈ M a dokážeme, že z ∈ M. Protože z ∈ M , existuje konečně mnoho vektorů x1, x2, . . . , xn ∈ M takových, že lze psát z = α1 x1 + α2 x2 + · · · + αn xn. Každý sčítanec leží podle vlastnosti (2) definice 1.17 v množině M. Podle vlastnosti (1) definice 1.17 v množině M leží i součet těchto vektorů, tedy z ∈ M. Zbývá dokázat „ M = M, potom M je lineární podprostor . Uvažujme x ∈ M, y ∈ M. Abychom dokázali, že M je lineární podprostor, stačí ověřit, že lineární kombinace 1 · x + 1 · y leží v M a dále α · x + 0 · y leží v M. Protože x ∈ M, y ∈ M, je podle definice lineárního obalu každá jejich lineární kombinace prvkem M a podle předpokladu je M = M. V množině M tedy leží i uvedené dvě lineární kombinace vektorů x, y. 2.38. Věta. Nechť L je lineární prostor a M ⊆ L je libovolná neprázdná množina. Pak P = M je nejmenší lineární podprostor, pro který platí M ⊆ P. Důkaz. Skutečnost, že P = M je lineární podprostor, ukazuje věta 2.37. Stačí ukázat, že P je nejmenší podprostor. Nechť Q je nějaký podprostor, pro který také platí M ⊆ Q. Podle věty 2.37 je Q = Q. Dále použijeme větu 2.34 na inkluzi M ⊆ Q a dostáváme P = M ⊆ Q = Q. 25 Lineární algebra 2. Lineární závislost a nezávislost, lineární obal, báze, dimenze Rozšíření LN množiny 2.39. Věta. Nechť L je lineární prostor, M ⊆ L je lineárně nezávislá množina a z ∈ M . Pak též M ∪ {z} je lineárně nezávislá množina. Důkaz. Důkaz povedeme sporem. Předpokládejme, že M ∪ {z} je lineárně závislá. Pak existuje konečně mnoho prvků x1, x2, . . . , xn ∈ M takových, že α1 x1 + α2 x2 + · · · + αn xn + αn+1 z je netriviální lineární kombinace rovna nulovému vektoru. Pro αn+1 = 0 zůstává netriviální lineární kombinace vektorů x1, x2, . . . , xn rovna nulovému vektoru, neboli konečná podmnožina M je lineárně závislá. To je ve sporu s tím, že M je lineárně nezávislá. Pro αn+1 = 0 je vektor z lineární kombinací vektorů x1, x2, . . . , xn (převedeme násobek vektoru z na druhou stranu rovnosti a podělíme −αn+1, jako v důkazu věty 2.21). To je ve sporu s tím, že z ∈ M . Pro oba případy hodnot αn+1 dostáváme spor, takže M ∪ {z} nemůže být lineárně závislá. Charakte- ristika LN množiny 2.40. Věta. Nechť L je lineární prostor. Množina N ⊆ L je lineárně nezávislá právě tehdy, když pro všechny vlastní podmnožiny M ⊂ N, M = N platí M ⊂ N , M = N . Důkaz (pro hloubavé čtenáře). Předpokládejme nejprve, že N je lineárně nezávislá. Nechť M ⊂ N, M = N. Zvolme vektor z ∈ N takový, že z ∈ M. Vektor z nelze vyjádřit jako lineární kombinaci žádné konečné podmnožiny prvků množiny M. Kdyby to bylo možné, tj. kdyby existovala K ⊆ M konečná a taková, že z by byl roven lineární kombinaci prvků množiny K, pak je podle věty 2.21 množina K ∪ {z} ⊆ N lineárně závislá. To je ve sporu s předpokladem, že N je lineárně nezávislá. Platí tedy, že z ∈ M , a přitom z ∈ N . Předpokládejme nyní, že N je lineárně závislá. Najdeme množinu M ⊂ N, M = N takovou, že M = N . Protože N je lineárně závislá, existuje konečná množina vektorů K1 ⊆ N, která je lineárně závislá. Podle věty 2.21 existuje prvek z ∈ K1 takový, že z lze zapsat jako lineární kombinaci ostatních vektorů z K1. Zvolíme M = N \ {z} a dokážeme, že M = N . Je z ∈ K1 \ {z} ⊆ N . Podle věty 2.35 vlastnosti (3) je N = N ∪ {z} = M . 2.41. Poznámka. Abychom vyjádřili nějaký lineární (pod)prostor jako lineární obal nějaké množiny, je vhodné pro tento účel volit lineárně nezávislou množinu. Předchozí věta 2.40 nám ukazuje, že to je „nejúspornější opatření , protože odebráním jakéhokoli prvku z takové množiny způsobí, že lineární obal už nebude pokrývat celý (pod)prostor. Žádné prvky takové množiny tedy nejsou při popisu (pod)prostoru pomocí lineárního obalu zbytečné. To nás vede (kromě jiných důležitých důvodů) k definici báze lineárního (pod)prostoru. Báze2.42. Definice. Báze lineárního prostoru L je taková podmnožina B ⊆ L, pro kterou platí (1) B je lineárně nezávislá, (2) B = L. 2.43. Poznámka. V definici 2.42 se mluví o L jako o lineárním prostoru. Není ale vyloučeno, že L je lineární podprostor nějakého jiného (většího) lineárního prostoru P, protože lineární podprostor je podle poznámky 1.16 sám o sobě lineárním prostorem. 2.44. Příklad. Množina vektorů B = {(1, 2, 3), (1, 0, 2), (−2, 1, 0)} je bází lineárního prostoru R3 , protože je podle příkladu 2.13 lineárně nezávislá a podle příkladu 2.32 je B = R3 . 2.45. Příklad. Množina vektorů B = {(1, 0, 0), (0, 1, 0), (0, 0, 1)} je bází lineárního prostoru R3 . Snadno zjistíme, že je lineárně nezávislá a navíc pro vektor (a, b, c) ∈ R3 je (a, b, c) = a (1, 0, 0) + b (0, 1, 0) + c (0, 0, 1). Každý vektor (a, b, c) lze tedy zapsat jako lineární kombinaci vektorů z B, neboli B = R3 . Všimněme si, že jsme už našli dvě báze lineárního prostoru R3 (v příkladu 2.44 a v tomto příkladu). Vidíme tedy, že báze není určena lineárním prostorem jednoznačně. Například pro α = 0 jsou množiny Bα = {α (1, 0, 0), (0, 1, 0), (0, 0, 1)} různé báze lineárního prostoru R3 . Bází je tedy nekonečně mnoho. 2.46. Příklad. Množina uspořádaných n-tic B = {(1, 0, 0, . . . , 0), (0, 1, 0, . . . , 0), . . . , (0, 0, 0, . . . , 0, 1)} tvoří bázi lineárního prostoru Rn . Je lineárně nezávislá a platí B = Rn z analogických důvodů, jako v příkladu 2.45. Takovou bázi lineárního prostoru Rn nazýváme standardní bází. 26 Lineární algebra 2. Lineární závislost a nezávislost, lineární obal, báze, dimenze 2.47. Příklad. Množina B = {1, x, x2 , x3 , . . .} tvoří bázi lineárního prostoru P všech polynomů. Podle příkladu 2.28 je lineárně nezávislá. Zbývá tedy ověřit, že B = P. Zvolme nějaký polynom p ∈ P. Ukážeme, že p ∈ B . Pro každý polynom p ∈ P existuje n ∈ N a reálná čísla a0, a1, . . . , an taková, že hodnota polynomu p v bodě x je dána vzorcem p(x) = an xn + · · · + a1 x + a0 ∀x ∈ R. Existuje tedy konečná podmnožina K ⊆ B, K = {1, x, x2 , . . . , xn } taková, že p je lineární kombinací prvků z K (koeficienty této lineární kombinace jsou čísla a0, a1, . . . , an). Z toho plyne, že p ∈ B . 2.48. Příklad. Uvažujme lineární prostor P≤n všech polynomů nejvýše n-tého stupně z příkladu 1.19. Ukážeme, že množina Bn = {1, x, x2 , . . . , xn } tvoří bázi lineárního prostoru P≤n. Předně, Bn je lineárně nezávislá, protože je podmnožinou lineárně nezávislé množiny B z příkladu 2.47 (každá podmnožina lineárně nezávislé množiny je podle poznámky 2.27 lineárně nezávislá). Analogicky jako v příkladu 2.47 lze ukázat, že Bn = P≤n. 2.49. Příklad. Vraťme se k lineárnímu prostoru UO všech orientovaných úseček se společným počátkem. Podle (5) z příkladu 2.24 je každá lineárně nezávislá množina vektorů {u, v, w} bází lineárního prostoru UO. Existenece a jednoznačnost báze 2.50. Poznámka. O existenci a jednoznačnosti báze. Příklad 2.45 ilustroval skutečnost, že báze lineárního (pod)prostoru není určena jednoznačně. Lineární (pod)prostor může mít dokonce nekonečně mnoho bází. Následující věta dokládá, že každý lineární prostor má bázi. Výjimkou je pouze triviální lineární prostor L = {o}, který jediný nemá bázi (někteří autoři uvádějí prázdnou množinu jako bázi triviálního lineárního prostoru, ovšem k tomu je potřeba mírně modifikovat definici lineárního obalu). Následující věta dokonce tvrdí, že každou lineárně nezávislou množinu lze doplnit přidáním případně dalších prvků na bázi a naopak, z každé množiny M, pro kterou M = L, lze případně odebrat nějaké prvky tak, aby zbylá množina tvořila bázi. Větu bohužel nebudeme dokazovat, protože vyžaduje použití hlubších poznatků z teorie množin (tzv. Zornovo lemma), které v tuto chvíli nemáme k dispozici. 2.51. Věta. Nechť L je lineární prostor. Pro každou lineárně nezávislou množinu N ⊆ L existuje báze B lineárního prostoru L taková, že N ⊆ B. Pro každou množinu M ⊆ L takovou, že M = L, existuje báze B lineárního prostoru L taková, že B ⊆ M. 2.52. Příklad. Je-li N = {x1, x2, . . . , xk} lineárně nezávislá množina lineárního prostoru Rn , pak podle předchozí věty existuje množina B = {x1, x2, . . . , xm}, m ≥ k taková, že B je báze. Ukážeme v tomto příkladě, jak bychom takovou bázi nalezli. Pokud už N = Rn , pak N samotná je báze a položíme B = N. Pokud ale N = Rn , pak existuje prvek x ∈ Rn , pro který x ∈ N Ptáme se, zda už N ∪ {x} je báze. Podle věty 2.39 tato množina zůstává lineárně nezávislá. Pokud N ∪ {x} = Rn , pak jsme našli bázi. Jestliže tato vlastnost neplatí, opakujme postup s přidáním dalšího prvku y ∈ N ∪ {x} znovu. Tento postup budeme opakovat tak dlouho, dokud budou existovat vektory mimo lineární obal naší postupně rozšiřované množiny. Podle příkladu 2.20 dospějeme k výsledku po konečně mnoha krocích, protože v Rn nelze vytvořit lineárně nezávislou množinu, která by měla více než n prvků. Poznamenejme, že tento postup vedl k cíli, protože jsme měli zaručeno, že báze bude mít konečně mnoho prvků. Pro nekonečné báze bychom se tímto postupem mohli „utopit v nekonečnu . Na druhé straně postup lze aplikovat na libovolný lineární prostor, který má konečné báze, nemusíme se nutně omezovat na Rn . 2.53. Příklad. Druhou část věty 2.51 si dokážeme aspoň pro konečnou množinu M. Je M = L a máme dokázat, že existuje B ⊆ M taková, že B = L a navíc B je lineárně nezávislá. Uvažujme všechny podmnožiny Ai ⊆ M, pro které Ai = L. Vidíme, že existuje aspoň jedna taková podmnožina, sice množina M samotná. Ze všech takových podmnožin Ai vyberme tu, která má nejmenší počet prvků (všechny tyto podmnožiny jsou konečné, takže pro každou můžeme spočítat její počet prvků). Je možné, že takových množin s nejmenším počtem prvků bude existovat více, pak je jedno, kterou z nich zvolíme. Označme ji B. Víme, že B = L (tuto vlastnost mají všechny podmnožiny Ai, takže jmenovitě též množina B). Dále víme, že odebráním jakéhokoli prvku z množiny B už nebude pro novou B1 platit B1 = L. Kdyby to platilo, tak nebyla vybrána B s nejmenším počtem prvků. Nyní použijeme větu 2.40. Množina B je tedy lineárně nezávislá. 27 Lineární algebra 2. Lineární závislost a nezávislost, lineární obal, báze, dimenze 2.54. Poznámka. Příklad báze prostoru FD všech funkcí definovaných na množině D ⊂ R nebudeme uvádět, protože nemáme prostředky, jak takovou bázi zapsat. Báze je nekonečnou množinou, která má větší mohutnost, než je mohutnost množiny přirozených čísel. Báze jsou stejně velké 2.55. Poznámka. Ukážeme, že dvě (obecně různé) báze stejného lineárního prostoru mají stejný počet prvků. Tento důkaz se tradičně opírá o Steinitzovu větu o výměně. Čtenář si může pro větší názornost vytvořit množinu M černých kamínků a lineárně nezávislou množinu N bílých kamínků, které všechny leží v lineárním obalu černých. Může začít vyměňovat postupně černé kamínky za bílé kus za kus. Při použití následující Steinitzovy věty o výměně čtenář shledá, že výměnu lze udělat tak, aby lineární obal původní množiny M zůstal zachován i přesto, že v ní jsou nahrazeny některé černé kameny všemi bílými. 2.56. Věta (Steinitzova o výměně). Nechť L je lineární prostor, M ⊆ L je libovolná množina a N ⊆ M je lineárně nezávislá množina, obsahující k vektorů. Pak lze odebrat z množiny M jejích k vektorů a vytvořit tak množinu M1, pro kterou platí: M = M1 ∪ N . Jinými slovy, odebráním vhodných k vektorů z M a nahrazením těchto vektorů všemi lineárně nezávislými vektory z N se lineární obal M nezmění. Důkaz (pro hloubavé čtenáře). Použijeme matematickou indukci podle k (o indukci viz důkaz věty 4.3). Pro k = 0 věta platí, protože množinu M vůbec neměníme. Nechť nyní věta platí pro každou lineárně nezávislou množinu s k prvky a dokážeme, že platí i pro množinu s k + 1 prvky. Nechť N = {v1, v2, . . . , vk, vk+1} ⊆ M . Označme N1 = {v1, v2, . . . , vk}. Z množiny M lze odebrat k vektorů tak, že vznikne množina M1, pro kterou je M = M1 ∪ N1 = M1 ∪ N . První rovnost je indukční předpoklad a druhá rovnost plyne z toho, že vk+1 ∈ M = M1 ∪ N1 a z třetí vlastnosti věty 2.35. Stačí tedy najít v M1 vektor w1 tak, aby jej šlo odebrat a obal se nezměnil, tedy M1 ∪ N = M1 \ {w1} ∪ N . Protože vk+1 ∈ M = M1 ∪ N1 , existuje konečně mnoho vektorů w1, w2, . . . , wn ∈ M1 tak, že vk+1 = α1w1 + α2w2 + · · · + αnwn + β1v1 + · · · + βkvk. Protože N je lineárně nezávislá, tak (A) při k = 0 musí být vk+1 nenulový a (B) při k > 0 nesmí vk+1 být lineární kombinací vektorů v1, v2, . . . , vk (věta 2.21). Z toho plyne, že n > 0 a nemohou být všechny koeficienty αi nulové. Uspořádáme nyní w1, w2, . . . , wn tak, aby α1 = 0. Z předchozí rovnosti plyne w1 = 1 α1 vk+1 − α2 α1 w2 − · · · − αn α1 wn − β1 α1 v1 − · · · − βk α1 vk, takže w1 ∈ M1 \ {w1} ∪ N1 ∪ {vk+1} . Podle (3) z věty 2.35 se přidáním vektoru w1 do množiny M1 \ {w1} ∪ N lineární obal množiny nezmění, takže je M1 \ {w1} ∪ N = M1 ∪ N = M . Uvedený postup přitom zaručil w1 ∈ M1, takže z množiny M jsme celkem odebrali k + 1 vektorů. 2.57. Poznámka. Steinitzova věta má následující důsledky. 2.58. Věta. Nechť L je lineární prostor, M ⊆ L je libovolná množina a N ⊆ M je lineárně nezávislá množina. Pak počet prvků množiny N je menší nebo roven počtu prvků množiny M. Důkaz. Věta 2.56 tvrdí, že z množiny M lze odebrat tolik vektorů, kolik jich má množina N. Kdyby měla množina N více vektorů než množina M, pak by tento úkon nešel provést, tj. dostali bychom se do sporu se Steinitzovou větou. 2.59. Věta. Dvě báze stejného lineárního prostoru jsou obě nekonečné nebo mají stejný počet prvků. Důkaz. Uvažujme dvě konečné báze B1 a B2 lineárního prostoru L. Protože B1 ⊆ B2 a B1 je lineárně nezávislá, musí podle věty 2.58 mít B2 aspoň tolik prvků, jako má B1. Protože B2 ⊆ B1 a B2 je lineárně nezávislá, musí podle stejné věty mít B1 aspoň tolik prvků, jako má B2. Takže počet prvků těchto množin musí být stejný. Co se stane, když B1 je konečná a B2 nekonečná? Pak každá konečná podmnožina K ⊆ B2 je lineárně nezávislá. Vezmu takovou konečnou podmnožinu K, která má více prvků, než B1. Protože K ⊆ B1 a K je lineárně nezávislá, musí mít B1 aspoň tolik prvků, jako K. To ale nemá. Dostáváme tedy spor, takže situace „jedna báze konečná a druhá nekonečná nemůže nastat. 28 Lineární algebra 2. Lineární závislost a nezávislost, lineární obal, báze, dimenze Dimenze prostoru 2.60. Definice. Dimenze lineárního prostoru L je počet prvků báze tohoto prostoru L. Dimenzi prostoru L označujeme symbolem dim L. Dimenzi jednobodového lineárního prostoru L = {o} pokládáme rovnu nule. 2.61. Poznámka. Věta 2.59 nám zaručuje smysluplnost definice dimenze. Ačkoli lineární prostor může mít více bází, všechny tyto báze mají podle této věty stejný počet prvků, nebo jsou nekonečné. V tomto druhém případě klademe dim L = ∞. 2.62. Příklad. dim Rn = n, viz příklad 2.46. dim P≤n = n + 1, viz příklad 2.48. dim P = ∞, viz příklad 2.47. Konečně dim UO = 3 podle příkladu 2.49. Važme si toho, že nás Stvořitel obklopil lineárním prostorem dimenze 3 nejen proto, že trojka je šťastné číslo. Dimenze podprostoru 2.63. Věta. Nechť L je lineární prostor a M ⊆ L je lineární podprostor lineárního prostoru L. Pak dim M ≤ dim L. Důkaz. Označme BL nějakou bázi lineárního prostoru L. Báze BM množiny M je lineárně nezávislá množina, pro kterou je BM ⊆ BL . Podle věty 2.58 má BM nejvýše tolik prvků, jako BL. Počet prvků v LN mno- žině 2.64. Věta. Nechť L je lineární prostor, dim L = n a M = {x1, x2, . . . , xm}. Pak platí: (1) Je-li M lineárně nezávislá, pak m ≤ n. (2) Je-li m > n, pak M je lineárně závislá. (3) Nechť m = n. Pak M je lineárně nezávislá právě tehdy, když M = L. Důkaz. (1) Množinu M lze doplnit podle věty 2.51 na případně větší množinu B, která je bází. Tato množina má podle věty 2.59 vždy n prvků. Protože M ⊆ B, musí m ≤ n. (2) Toto tvzení je ekvivalentní s tvrzením (1). (3) Nechť nejprve M je lineárně nezávislá. Kdyby M = L, pak lze přidat do množiny M vektor x ∈ M , a přitom podle věty 2.39 zůstane rozšířená množina lineárně nezávislá. To ale podle (1) není možné. Musí tedy M = L. Předpokládejme nyní, že M je lineárně závislá. Kdyby M = L, pak podle věty 2.51 existuje báze B ⊆ M, a přitom B bude mít méně prvků než množina M (protože M je lineárně závislá). To podle věty 2.59 není možné, neboť každá báze má n prvků. Musí tedy M = L. 2.65. Poznámka. Uvědomíme si význam této věty. Báze je podle (1) nejpočetnější lineárně nezávislá množina. Dále podle (3) každá lineárně nezávislá množina, která má počet prvků rovný konečné dimenzi, je bází. 2.66. Příklad. Množina {(1, 1, 1), (0, 1, 1), (0, 0, 2)} je bází lineárního prostoru R3 , protože je lineárně nezávislá a její počet prvků je roven dim R3 . Stačí použít větu 2.64, vlastnost (3) a nemusíme pracně ověřovat z definice, že lineární obal této množiny pokrývá celé R3 . 29 3. Matice S pojmem matice jako s tabulkou čísel jsme se už seznámili v úvodu do Gaussovy eliminační metody. Nyní si definujeme pojem matice přesněji. Definice matice 3.1. Definice. Matice typu (m, n) je uspořádaná m-tice prvků z Rn . Jednotlivé složky této m-tice nazýváme řádky matice. Nechť ar = (ar,1, ar,2, . . . , ar,n) je r-tý řádek matice typu (m, n). s-tá složka tohoto řádku ar,s ∈ R se nazývá (r, s)-tý prvek matice. Řádky matice A zapisujeme jako skutečné řádky pod sebe takto: A =     a1,1, a1,2, . . . , a1,n a2,1, a2,2, . . . , a2,n ... am,1, am,2, . . . , am,n     nebo zapíšeme jen stručně prvky matice A: A = (ar,s), r ∈ {1, 2, . . . , m}, s ∈ {1, 2, . . . , n}. Nechť A = (ar,s), r ∈ {1, . . . , m}, s ∈ {1, . . . , n}. Uspořádanou m-tici reálných čísel (a1,s, a2,s, . . . , am,s) nazýváme s-tým sloupcem matice A. Matici typu (m, n), která má všechny prvky nulové, nazýváme nulovou maticí. Matici typu (m, n) nazýváme čtvercovou maticí, pokud m = n. 3.2. Poznámka. Dvě matice se rovnají, pokud jsou stejného typu a všechny prvky jedné matice se rovnají odpovídajícím prvkům matice druhé. To vyplývá z definice: rovnost dvou uspořádaných m-tic řádků z Rn je definována tak, že všechny složky první m-tice se rovnají odpovídajícím složkám druhé m-tice, jinými slovy odpovídající řádky se rovnají. Rovnost řádků jako uspořádaných n-tic reálných čísel je definována tak, že se odpovídající složky těchto řádků rovnají. Lineární prostor matic 3.3. Definice. Nechť A = (ar,s), B = (br,s) jsou matice typu (m, n). Matici C typu (m, n) nazýváme součtem matic A, B (značíme C = A + B), pokud pro prvky matice C = (cr,s) platí cr,s = ar,s + br,s, r ∈ {1, 2, . . . , m}, s ∈ {1, 2, . . . , n}. Nechť α ∈ R. α-násobek matice A je matice α·A = (α ar,s). Názorně: A + B =     a1,1 + b1,1, a1,2 + b1,2, . . . , a1,n + b1,n a2,1 + b2,1, a2,2 + b2,2, . . . , a2,n + b2,n ... am,1 + bm,1, am,2 + bm,2, . . . , am,n + bm,n     , α · A =     α a1,1, α a1,2, . . . , α a1,n α a2,1, α a2,2, . . . , α a2,n ... α am,1, α am,2, . . . , α am,n     . 3.4. Věta. Množina všech matic shodného typu (m, n) tvoří se sčítáním matic a násobením matice reálným číslem podle definice 3.3 lineární prostor. Nulový vektor tohoto prostoru je nulová matice. Důkaz. Důkaz si čtenář provede sám jako cvičení. Srovnejte s příklady 1.9 a 1.11. 3.5. Příklad. Množina B =      1 0 0 0 0 0   ,   0 1 0 0 0 0   ,   0 0 1 0 0 0   ,   0 0 0 1 0 0   ,   0 0 0 0 1 0   ,   0 0 0 0 0 1      tvoří bázi lineárního prostoru M3,2 všech matic typu (3, 2). Abychom to ukázali, ověříme lineární nezávislost B a dále vlastnost B = M3,2. Nejprve ověříme lineární nezávislost. Položme lineární kombinaci prvků z B rovnu nulové matici: α   1 0 0 0 0 0   + β   0 1 0 0 0 0   + γ   0 0 1 0 0 0   + δ   0 0 0 1 0 0   + ε   0 0 0 0 1 0   + ζ   0 0 0 0 0 1   =   0 0 0 0 0 0   Odpovídající složky se musejí rovnat, což vede k šesti rovnicím: α = 0, β = 0, γ = 0, δ = 0, ε = 0, ζ = 0. Jedině triviální lineární kombinace je rovna nulovému vektoru. 30 Lineární algebra 3. Matice Ověříme nyní vlastnost (2) z definice 2.42. Nechť   a b c d e f   je nějaká matice z lineárního prostoru M3,2. Snadno zjistíme, že existuje lineární kombinace matic z množiny B, která je rovna této matici (stačí volit α = a, β = b, γ = c, δ = d, µ = e, ν = f). Tím jsme dokázali, že B = M3,2 a B je tedy báze lineárního prostoru matic M3,2. Nazýváme ji standardní bází. Dimenze lineárního prostoru M3,2 je podle definice 2.60 rovna šesti. 3.6. Příklad. Je-li Mm,n lineární prostor všech matic typu (m, n), pak dim Mm,n = m · n. Analogicky jako v příkladu 3.5 lze totiž sestrojit bázi lineárního prostoru Mm,n, která má m · n prvků. 3.7. Poznámka. Na matice můžeme pohlížet jako na prvky lineárního prostoru, protože je umíme sčítat a násobit reálným číslem. Kromě toho se ale naučíme s maticemi dělat další kousky. Například umíme řádky matice modifikovat způsobem, jaký jsme se naučili při Gaussově eliminační metodě. V následující části textu ukážeme, že modifikace matice podle Gaussovy eliminační metody má několik velmi důležitých vlastností s praktickými důsledky. 3.8. Poznámka. Protože řádky matice typu (m, n) jsou podle definice 3.1 prvky lineárního prostoru Rn , umíme je sčítat, násobit reálným číslem, rozhodovat o jejich lineární nezávislosti, sestrojovat lineární obaly, podprostory, hledat báze, dimenze apod. 3.9. Definice. Symbolem A ∼ B označujeme skutečnost, že matice B vznikla z matice A konečným počtem kroků podle Gaussovy eliminační metody. Za krok Gaussovy eliminační metody je považováno prohození řádků, pronásobení řádku nenulovou konstantou, přičtení násobku řádku k jinému, odstranění nulového řádku nebo přidání nulového řádku. Symetrie relace „∼ 3.10. Věta. Relace „∼ je symetrická, tj. A ∼ B právě tehdy, když B ∼ A. Důkaz. Stačí ukázat, že po provedení jednoho kroku podle Gaussovy eliminační metody se lze pomocí dalších kroků podle Gaussovy eliminační metody vrátit k původní matici. (1) Prohození dvou libovolných řádků mezi sebou. Stačí prohodit tytéž řádky mezi sebou ještě jednou a máme původní matici. (2) Vynásobení jednoho řádku nenulovým reálným číslem α. Stačí vynásobit tento řádek číslem 1/α a dostáváme původní matici. (3) Přičtení α-násobku nějakého řádku a k řádku b (řádek a se v tomto kroku opisuje). K původní matici se pak vrátíme tak, že k právě změněnému řádku přičteme (−α)-násobek řádku a. (4) Vynechání nebo přidání nulového řádku. Jestliže nulový řádek při přechodu k matici B vynecháme, tak jej zas při návratu k matici A přidáme. Pokud jej při přechodu k matici B přidáme, pak jej při návratu k matici A odebereme. 3.11. Poznámka. V některé literatuře se místo kroku (3) uvádí přičtení lineární kombinace ostatních řádků ke zvolenému řádku b. Tento krok lze samozřejmě nahradit konečným opakováním kroku (3). V jiné literaruře se někdy neuvádí prohození řádků jako samotný krok Gaussovy eliminační metody, protože tento krok lze (poněkud těžkopádně) provést opakovaným použitím kroku (3) a v závěru aplikací kroku (2): a b ∼ a a + b ∼ a − (a + b) a + b = −b a + b ∼ −b a ∼ b a . 3.12. Definice. Množinu všech řádků matice A značíme r: A. Lineární obal množiny všech řádků matice A je tedy označen symbolem r: A . 31 Lineární algebra 3. Matice Gaussova eliminace zachovává obal 3.13. Věta. Je-li A ∼ B, pak r: A = r: B . Jinými slovy: Gaussova eliminační metoda zachovává lineární obal řádků matice. Důkaz. Dokážeme nejdříve pomocné tvrzení: jestliže A1 je matice, která vznikne z matice A jedním krokem podle Gaussovy eliminační metody, pak r: A1 ⊆ r: A . Všechny řádky matice A1 lze zapsat jako lineární kombinaci řádků matice A. Je přitom jedno, zda matice A1 vznikla prohozením řádků, pronásobením jednoho řádku nenulovým reálným číslem, přičtením násobku jednoho řádku k jinému, odebráním nebo přidáním nulového řádku. Platí tedy, že řádky matice A1 leží v r: A . Proto r: A1 ⊆ r: A . Podle věty 2.35 je r: A = r: A , takže r: A1 ⊆ r: A . Pomocné tvrzení máme dokázáno. Pokud toto tvrzení uplatníme opakovaně (matice B vznikla z matice A po konečně mnoha krocích podle Gaussovy eliminační metody), máme výsledek r: B ⊆ r: A . Tvrzení dokazované věty nyní plyne ze symetrie relace „∼ , tj. z věty 3.10. 3.14. Příklad. Řádky matice A i matice B uvedené níže mají podle věty 3.13 stejné lineární obaly. Tyto obaly tvoří podle věty 2.37 nějaký lineární podprostor lineárního prostoru R5 . A =    1 2 3 4 5 2 3 4 4 7 1 1 1 3 4 3 5 7 8 12    ∼    1 2 3 4 5 0 1 2 4 3 0 1 2 1 1 0 1 2 4 3    ∼   1 2 3 4 5 0 1 2 4 3 0 0 0 3 2   = B Snadno ověříme, že řádky matice B jsou lineárně nezávislé. Takže tyto řádky tvoří bázi lineárního podprostoru r: B = r: A . Vidíme tedy, že dim r: A = 3. Hodnost matice 3.15. Definice. Hodnost matice A (anglicky rank) značíme hod(A) a definujeme hod(A) = dim r: A . 3.16. Příklad. Matice A z příkladu 3.14 má hodnost 3. 3.17. Věta. Je-li A ∼ B, pak hod(A) = hod(B). Jinými slovy, Gaussova eliminační metoda nemění hodnost matice. Důkaz. Věta je jednoduchým důsledkem věty 3.13 a definice 3.15. 3.18. Věta. Hodnost matice je maximální počet lineárně nezávislých řádků matice. Přesněji řečeno, hodnost udává počet prvků takové množiny řádků, která je nejpočetnější, a přitom lineárně nezávislá. Důkaz. Jak jsme již řekli v poznámce 2.65, báze podprostoru r: A je nejpočetnější lineárně nezávislá množina. Tedy hod A = dim r: A = počet prvků báze lineárního prostoru r: A . 3.19. Poznámka. Například ve skriptech [7] je hodnost matice definována jako maximální počet lineárně nezávislých řádků matice. Pro důkaz věty 3.17 je v těchto skriptech vyvinuto poněkud větší úsilí, protože se tento důkaz neopírá o pojmy lineární obal a o výsledky z kapitoly 2.0. Trojúhel- níkové matice 3.20. Poznámka. Matice B v příkladu 3.14 je typickou ukázkou matice, která vznikne po ukončení přímého chodu Gaussovy eliminační metody. Jedná se o matici, ve které každý následující řádek má aspoň o jednu nulu v souvislé řadě nul (psané z leva) více, než řádek předchozí. Přitom matice neobsahuje nulové řádky. Takovým maticím budeme říkat horní trojúhelníkové (nenulové prvky jsou jen v „pásmu horního trojúhelníka ). 3.21. Definice. Nechť matice A má řádky a1, a2, . . . , an a nechť žádný z nich není nulový. Nechť pro každé dva po sobě jdoucí řádky ai, ai+1 platí: má-li řádek ai prvních k složek nulových, musí mít řádek ai+1 aspoň prvních k + 1 složek nulových. Pak matici A nazýváme horní trojúhelníkovou maticí. 3.22. Věta. Horní trojúhelníková matice má vždy lineárně nezávislé řádky. Důkaz. Lineární nezávislost ověříme z definice. Nechť matice A má řádky a1, a2, . . . , an a položme α1 a1 + α2 a2 + · · · + αn an = o. Po převedení této rovnosti do soustavy rovnic odpovídají koeficienty jednotlivých rovnic sloupcům matice A. Přitom tato soustava má vždy pouze triviální řešení. Z první nenulové rovnice totiž okamžitě plyne, že α1 = 0. Dosazením tohoto výsledku do ostatních rovnic dostaneme z některé z následujících rovnic výsledek α2 = 0. Znovu dosadíme. Tento postup opakujeme tak dlouho, dokud nedostaneme αi = 0 ∀i ∈ {1, . . . , n}. 32 Lineární algebra 3. Matice 3.23. Věta. Každou matici lze převést konečným počtem kroků Gaussovy eliminační metody na horní trojúhleníkovou matici. Důkaz. Plyne z popisu přímého chodu Gaussovy eliminační metody. 3.24. Poznámka. Tato věta nám společně s větou 3.13 dává záruky, že hodnost libovolné matice můžeme spočítat postupem, jaký jsme zvolili v příkladu 3.14. 3.25. Poznámka. Je zřejmé, že matice, která vznikne z horní trojúhelníkové matice přehozením některých sloupců, má také lineárně nezávislé řádky. Nemusíme tedy nutně při hledání hodnosti matice vytvářet v jednotlivých etapách Gaussovy eliminační metody nulové prvky v těsně následujících sloupcích. Je-li to z nějakých důvodů výhodné, můžeme nejprve třeba vytvořit nuly pod prvním řádkem v osmém sloupci, pak opíšeme první a druhý řádek a vytváříme nuly ve třetím sloupci atd. Tento sofistikovanější postup doporučujeme ale použít jen tehdy, když jste důkladně seznámeni s klasickým postupem přímého chodu Gaussovy eliminační metody. Jinak může velmi snadno dojít k omylům. 3.26. Poznámka. Postup přímého chodu Gassovy eliminační metody podle poznámky 3.25 se může hodit ve dvou případech. (1) Počítáme modelové příklady a snažíme se držet malých celých čísel. Přitom v prvním sloupci jsou nesoudělná čísla, což vede po eliminaci ke zbytečně velkým celým číslům. Poznamenejme ale, že modelové příklady ze skript se v praxi většinou nevyskytují, takže podstatnější pro nás bude druhý případ využití. (2) Při implementaci Gaussovy eliminačí metody do počítače je vhodné se snažit minimalizovat zaokrouhlovací chyby. Ty mohou nežádoucím způsobem ovlivnit výsledek, pokud se například snažíme dělit číslem blízkým nule. Algoritmus by měl vyhledat optimální cestu při řešení Gaussovou eliminační metodou, aby se pokud možno vyhnul dělením takovými čísly. Numericky nestabilní matice 3.27. Poznámka. Numerické vyhodnocování hodnosti matice v počítači má svá úskalí, která vyplývají z možných zaokrouhlovacích chyb. Hodnost je definována jednoznačně jako přirozené číslo (nebo nula), ale v praktických situacích se může stát, že toto číslo nelze zjistit zcela přesně. Podívejme se kupříkladu na tuto matici: C = 28,33333 11,33333 56,66667 22,66666 , Kdybychom čísla v této matici považovali za zcela přesná, museli bychom říci, že hod(C) = 2. Pokud ale připustíme, že na posledním desetinném místě mohou být zaokrouhlovací chyby, pak nemáme jistotu, zda hodnost této matice není náhodou rovna jedné. Dobře implementovaný algoritmus Gaussovy eliminační metody v počítači by nás měl upozornit, je-li výsledek skutečně zaručen, nebo zda může dojít k závažným chybám, jako v této matici. Takovým maticím, jako matice C v tomto příkladě, říkáme numericky nestabilní matice. Problematiku numerických metod v tuto chvíli opustíme, protože není obsahem tohoto předmětu. Transponovaná matice 3.28. Definice. Nechť A = (ai,j) je matice typu (m, n). Matici AT = (aj,i), která je typu (n, m), nazýváme transponovanou maticí k matici A. Matice AT tedy vznikne z matice A přepsáním řádků matice A do sloupců matice AT , respektive přepsáním sloupců matice A do řádků matice AT . 3.29. Příklad. Je-li třeba A = 1 2 3 4 5 6 , pak je AT =   1 4 2 5 3 6   . 3.30. Věta. Pro každou matici A platí: (AT )T = A. Důkaz. Věta plyne přímo z definice 3.28. 33 Lineární algebra 3. Matice 3.31. Věta. Pro každou matici A platí: hod(AT ) = hod(A). Důkaz (pro hloubavé čtenáře). Ukážeme nejprve, že hod(AT ) ≥ hod(A). Nechť A je typu (m, n) a označme k = hod(A). Podle věty 3.18 existuje k lineárně nezávislých řádků matice A. Označme je b1, b2, . . . , bk. Zapišme si, co to znamená, že tyto řádky jsou lineárně nezávislé. Pro α1 b1 + α2 b2 + · · · + αk bk = o musí být αi = 0 ∀i ∈ {1, . . . , k}. Tento požadavek vede na soustavu rovnic, která musí mít jedině triviální řešení: α1 b1,1 + α2 b2,1 + · · · + αk bk,1 = 0, α1 b1,2 + α2 b2,2 + · · · + αk bk,2 = 0, · · · α1 b1,n + α2 b2,n + · · · + αk bk,n = 0. (3.1) Koeficienty jednotlivých rovnic soustavy (3.1) odpovídají částem sloupců matice A. Částmi sloupců v tomto důkazu budeme označovat uspořádané k-tice obsahující jen ty prvky z daného sloupce, které leží ve vybraných řádcích b1, b2, . . . , bk. Aby bylo zaručeno pouze triviální řešení soustavy (3.1), musíme po přímém chodu Gaussovy eliminační metody dostat trojúhelníkovou matici o k-řádcích (méně řádků by vedlo na nekonečně mnoho řešení). To podle vět 3.18 a 3.13 znamená, že existuje k lineárně nezávislých částí sloupců matice A. Tytéž celé sloupce matice A jsou lineárně nezávislé (kdyby byly závislé, pak by stejná netriviální lineární kombinace celých sloupců dávala nulový vektor i na částech sloupců, ale my víme, že části sloupců jsou lineárně nezávislé). Máme tedy zaručeno, že v matici A je aspoň k lineárně nezávislých sloupců (zatím není vyloučeno, že jich může být více). Podle věty 3.18 tedy je hod(AT ) ≥ k = hod(A). Máme hod (AT )T ≥ hod(AT ) ≥ hod(A), a přitom podle věty 3.30 je (AT )T = A, takže všechny uvedené hodnosti se rovnají. 3.32. Poznámka. Ukázali jsme, že hodnosti matice A a AT se rovnají. To vysvětluje, proč jsme nedefinovali zvlášť „řádkovou hodnost matice jako dimenzi lineárního obalu řádků a zvlášť „sloupcovou hodnost jako dimezi lineárního obalu sloupců. Tato čísla jsou podle věty 3.31 stejná. 3.33. Věta. Nechť A je matice typu (m, n). Pak hod(A) ≤ min(m, n). Důkaz. Hodnost matice je menší nebo rovna počtu řádků z věty 3.18 a je menší nebo rovna počtu sloupců z věty 3.31. Násobení matic 3.34. Definice. Nechť A = (ai,j) je matice typu (m, n) a B = (bj,k) je matice typu (n, p). Pak je definován součin matic A · B (v tomto pořadí) jako matice typu (m, p) takto: každý prvek ci,k matice A · B je dán vzorcem ci,k = ai,1 b1,k + ai,2 b2,k + · · · + ai,n bn,k = n j=1 ai,j bj,k, i ∈ {1, . . . , m}, k ∈ {1, . . . , p}. (3.2) 3.35. Poznámka. Všimneme si, že násobení je definováno jen tehdy, pokud počet sloupců první matice je roven počtu řádků druhé matice. Výsledná matice má stejný počet řádků, jako první matice a stejný počet sloupců, jako druhá matice. Názorně: m       ◦ ◦ · · · ◦ ◦ ◦ · · · ◦ · · · ◦ ◦ · · · ◦ n    · n         ◦ · · · ◦ ◦ · · · ◦ ◦ · · · ◦ · · · ◦ · · · ◦ p      =    ◦ · · · ◦ ◦ · · · ◦ · · · ◦ · · · ◦ p       m Každý prvek matice A · B přitom musíme počítat podle vzorce (3.2) jako součet součinů odpovídajících prvků řádku první matice a sloupce druhé matice. Začátečníci mohou použít tzv. „dvouprstovou vizuální metodu : při výpočtu čísla ci,k přiložte ukazováček levé ruky na začátek i-tého řádku první matice a ukazováček pravé ruky na začátek k-tého sloupce druhé matice. Pak pronásobte mezi sebou čísla, na která ukazují prsty, a výsledek uložte do sčítací paměti. Posuňte levý prst na další prvek v řádku a pravý prst na další prvek v sloupci. Znovu vynásobte a přičtěte výsledek ke sčítací paměti. Posunujte dále levý prst v řádku a pravý prst ve sloupci, násobte a sčítejte ve sčítací paměti tak dlouho, dokud nevyčerpáte celý řádek první matice. To se stane podle definice v okamžiku, kdy též vyčerpáte celý sloupec druhé matice. Výsledek sčítací paměti pak napište jako prvek ci,k do postupně budované výsledné matice A·B. 34 Lineární algebra 3. Matice 3.36. Příklad.   1 2 3 4 5 6 7 8 0 2 1 0   ·    1 2 3 4 5 6 2 7    =   1 · 1 + 2 · 3 + 3 · 5 + 4 · 2 1 · 2 + 2 · 4 + 3 · 6 + 4 · 7 5 · 1 + 6 · 3 + 7 · 5 + 8 · 2 5 · 2 + 6 · 4 + 7 · 6 + 8 · 7 0 · 1 + 2 · 3 + 1 · 5 + 0 · 2 0 · 2 + 2 · 4 + 1 · 6 + 0 · 7   =   30 56 74 132 11 14   · 3.37. Příklad. 1 1 1 1 · 1 1 −1 −1 = 0 0 0 0 , 1 1 −1 −1 · 1 1 1 1 = 2 2 −2 −2 . Tento příklad ilustruje, že násobení matic obecně nesplňuje komutativní zákon ani pro čtvercové matice, tj. existují matice A, B, pro které neplatí A · B = B · A. Pokud některá z matic A, B není čtercová, pak součin B · A nemusí být vůbec definován, přestože součin A · B definován je. Příklad dále ukazuje, že není splněna ani vlastnost nuly, na kterou jsme zvyklí při násobení reálných čísel: je-li a = 0, b = 0, pak a b = 0. V příkladu násobíme dvě nenulové matice, a přitom dostáváme matici nulovou. Musíme si z toho odnést ponaučení, že násobení matic nesplňuje všechny vlastnosti, na které jsme zvyklí, a proto při úpravách vzorců obsahujících násobení matic si musíme dát pozor, co můžeme v dané situaci udělat. Nabízí se přirozená otázka, zda násobení matic splňuje aspoň nějaké zákony, na které jsme zvyklí (jinak by bylo skoro zbytečné tuto operaci nazývat násobením). Následující věta ukazuje, že násobení matic je asociativní a také distributivní vzhledem ke sčítání matic. 3.38. Věta. Nechť α ∈ R a matice A, B, C jsou odpovídajících typů tak, aby níže uvedené součiny a součty byly definovány. Pak platí (1) (A · B) · C = A · (B · C) (asociativní zákon), (2) (A + B) · C = A · C + B · C (distributivní zákon), (3) C · (A + B) = C · A + C · B (distributivní zákon), (4) α(A · B) = (α A) · B = A · (α B), (5) (A · B)T = BT · AT . Důkaz. Jako cvičení doplňte ke každému vzorci věty předpoklady o typech matic. Tyto předpoklady se budou pro různé vzorce lišit. V tomto důkazu předpokládáme typy matic (m, n), (n, p) a (p, q). (1) Označme A = (ai,j), B = (bj,k), C = (ck,l), A · B = (di,k), B · C = (fj,l), (A · B) · C = (gi,l), A · (B · C) = (hi,l) pro i ∈ {1, . . . , m}, j ∈ {1, . . . , n}, k ∈ {1, . . . , p}, l ∈ {1, . . . , q}. Jde o to ukázat, že gi,l = hi,l pro všechna i ∈ {1, . . . , m} a l ∈ {1, . . . , q}. Podle definice 3.34 je di,k = n j=1 ai,j bj,k, fj,l = p k=1 bj,k ck,l, takže platí gi,l = p k=1 di,k ck,l = p k=1 n j=1 ai,j bj,k ck,l = p k=1 n j=1 ai,j bj,k ck,l = X, hi,l = n j=1 ai,j fj,l = n j=1 ai,j p k=1 bj,k ck,l = n j=1 p k=1 ai,j bj,k ck,l = Y. Vysvětlíme si, proč platí X = Y . Volme i, l pevná. Součiny ai,j · bj,k · ck,l můžeme zapsat do tabulky, ve které index j odpovídá řádku tabulky a index k sloupci. Hodnota X pak znamená součet sloupcových mezisoučtů v tabulce a hodnota Y součet řádkových mezisoučtů. Každá účetní ví, že obě hodnoty musí dát stejný výsledek. My ostatní to snadno nahlédneme. (2) Označme A = (ai,j), B = (bi,j), C = (cj,k), (A+B)·C = (di,k) pro i ∈ {1, . . . , m}, j ∈ {1, . . . , n}, k ∈ {1, . . . , p}. Pak podle definic 3.34 a 3.3 platí di,k = n j=1 (ai,j + bi,j) cj,k = n j=1 (ai,j cj,k + bi,j cj,k) = n j=1 ai,j cj,k + n j=1 bi,j cj,k, 35 Lineární algebra 3. Matice což odpovídá prvkům matice A · C + B · C. (3) Důkaz bychom provedli obdobně, jako v případě (2). (4) Označme A = (ai,j), B = (bj,k) pro i ∈ {1, . . . , m}, j ∈ {1, . . . , n}, k ∈ {1, . . . , p}. Platí α n j=1 ai,j bj,k = n j=1 α ai,j bj,k = n j=1 (α ai,j) bj,k = n j=1 ai,j (α bj,k), což dokazuje vzorec: (4). (5) Označíme A = (ai,j), B = (bj,k), C = A · B = (ci,k), i ∈ {1, . . . , m}, j ∈ {1, . . . , n}, k ∈ {1, . . . , p}. Je tedy AT = (αj,i), BT = (βk,j), kde αj,i = ai,j, βk,j = bj,k. Označme ještě součin D = BT · AT = (dk,i). Podle definice násobení je ci,k = n j=1 ai,j bj,k = n j=1 βk,j αj,i = dk,i, takže DT = C, což dokazuje vzorec (5). 3.39. Příklad. Nechť A, B, C jsou čtercové matice. Spočítáme (A+B)·(B+C). Podle (3) ve větě 3.38 je (A + B) · (B + C) = (A + B) · B + (A + B) · C = A · B + B · B + A · C + B · C. Místo zápisu B · B budeme užívat zkratku B2 . Konečný výsledek je A · B + B2 + A · C + B · C. Jiný příklad: (A + B)2 = (A + B) · (A + B) = (A + B) · A + (A + B) · B = A2 + B2 + A · B + B · A. Tento výsledek obecně nelze zjednodušit, protože násobení matic není komutativní. Pouze tehdy, když pro tyto matice platí A · B = B · A, můžeme psát výsledek ve tvaru A2 + 2 A · B + B2 . Komutující matice 3.40. Příklad. Nechť je dána čtercová matice A typu (n, n). Pokud matice B splňuje rovnost A · B = B·A, říkáme, že matice B komutuje s maticí A. Ukážeme, že množina všech komutujících matic s danou maticí A tvoří lineární podprostor lineárního prostoru všech matic typu (n, n). Především každá taková matice B musí mít stejný počet řádků jako matice A sloupců (aby bylo definováno A·B) a také musí mít stejný počet sloupců jako matice A řádků (aby bylo definováno B·A). To prakticky znamená, že matice B musí být také čtvercová, typu (n, n). Podle definice 1.17 stačí ukázat, že pokud jsou B a C komutující matice s maticí A a α ∈ R, pak též B + C a α B jsou komutující matice. Předpokládejme tedy, že platí A · B = B · A, A · C = C · A. V následujícím výpočtu použijeme věty 3.38, vzorce (2) až (4) a našeho předpokladu. A · (B + C) = A · B + A · C = B · A + C · A = (B + C) · A, A · (α B) = α (A · B) = α (B · A) = (α B) · A. 3.41. Příklad. Najdeme bázi a dimenzi lineárního podprostoru M všech matic komutujících s maticí A = 1 2 3 4 . Podle předchozího příkladu musejí být matice komutující s maticí A rovněž typu (2, 2). Předpokládejme, že matice B lze zapsat ve tvaru B = a b c d . Jednotlivé součiny pak vypadají následovně a b c d · 1 2 3 4 = a + 3b 2a + 4b c + 3d 2c + 4d , 1 2 3 4 · a b c d = a + 2c b + 2d 3a + 4c 3b + 4d . Tyto součiny se mají rovnat. Podle poznámky 3.2 se dvě matice rovnají, pokud se vzájemně rovnají všechny jejich odpovídající prvky. To nás vede ke čtyřem rovnicím o čtyřech neznámých, které upravíme Gaussovou elmininační metodou. 3b − 2c = 0 2a + 3b − 2d = 0 − 3a − 3c + 3d = 0 − 3b + 2c = 0    0 3 −2 0 2 3 0 −2 −1 0 −1 1 0 −3 2 0    ∼ 2 3 0 −2 0 3 −2 0 2a + 3b − 2d = 0 3b − 2c = 0 36 Lineární algebra 3. Matice Proměnné c a d můžeme volit libovolně. Uvedené dvě rovnice nám umožňují dopočítat proměnné b a a takto: b = 2/3 c, a = d−c. Všechny matice, které komutují s maticí A jsou tedy určeny dvěma parametry: B = d − c 2 3 c c d = c −1 2 3 1 0 + d 1 0 0 1 , c ∈ R, d ∈ R. Lineární prostor všech komutujících matic M se nám podařilo vyjádřit jako množinu všech lineárních kombinací dvou konstantních matic. Tuto skutečnost zapíšeme pomocí lineárního obalu takto: M = −1 2 3 1 0 , 1 0 0 1 = −3 2 3 0 , 1 0 0 1 . Poslední úpravu (pronásobení první matice třemi) jsme nemuseli dělat, pokud se spokojíme se zlomkem ve výsledku. V modelových příkladech se dosti často snažíme dostat výsledek vyjádřitelný v malých celých číslech. Není to samozřejmě naší povinností, pouze pak výsledek lépe vypadá a nás více potěší. Protože poslední dvě uvedené matice jsou lineárně nezávislé (to snadno zjistíme) a jejich lineární obal je celý podprostor M, máme výsledek: Báze M = −3 2 3 0 , 1 0 0 1 , tj. dim M = 2. Matice vektorů 3.42. Poznámka. V definici 3.1 jsme zavedli matice, jejíž prvky jsou reálná čísla. Občas se ale setkáme s maticemi, jejíž prvky jsou vektory, tedy prvky libovolného lineárního prostoru. Za matici vektorů typu (m, n) budeme považovat uspořádanou m-tici prvků z Ln , kde L je nějaký lineární prostor a znakem Ln zde označujeme množinu uspořádaných n-tic prvků z L. Protože lze prvky lineárního prostoru podle definice 1.6 násobit reálným číslem, lze přirozeně definovat též maticové násobení A · B, kde A = (ai,j) je matice reálných čísel typu (m, n) a B = (bj,k) je matice vektorů typu (n, p). Výsledná matice A · B je maticí vektorů typu (m, p) s prvky ci,k, pro které platí: ci,k = ai,1 b1,k + ai,2 b2,k + · · · + ai,n bn,k = n j=1 ai,j bj,k. 3.43. Příklad. Nechť A je matice reálných čísel typu (1, n) a B je matice vektorů typu (n, 1). Pak součin A · B je lineární kombinace vektorů z B, přičemž prvky z A jsou koeficienty této lineární kombinace. Názorně: ( a1, a2, · · · , an ) ·     b1 b2 ... bn     = a1 b1 + a2 b2 + · · · + an bn. Jednotková matice 3.44. Definice. Čtvercovou matici E typu (n, n) nazýváme jednotkovou maticí, pokud pro její prvky ei,j platí: ei,j = 0 pro i = j a ei,j = 1 pro i = j. Názorně: E =    1 0 0 · · · 0 0 1 0 · · · 0 · · · 0 0 0 · · · 1    . 3.45. Poznámka. Z definice maticového násobení okamžitě plyne, že pro každou čtvercovou matici A typu (n, n) je E · A = A · E = A. Jednotková matice má tedy stejnou vlastnost vzhledem k násobení, jako jednička při násobení reálných čísel. Pro reálná čísla taky platí, že 1 · a = a · 1 = a. Všimneme si také, že jednotková matice je komutující s každou čtvercovou maticí. 3.46. Poznámka. Vraťme se k příkladu 3.41. Tam jsme našli bázi, ve které je jednotková matice. To nás nepřekvapí, protože jednotková matice je komutující s každou maticí. Dále s maticí A komutuje stejná matice A. Pokud víme, že dim M = 2 a matice A a E jsou lineárně nezávislé, můžeme rovnou prohlásit, že hledaná báze lineárního podprostoru M je {A, E}. Zdálo by se, že jsme výpočty v příkladu 3.41 dělali zbytečně. Není to tak docela pravda, protože dopředu nevíme, zda dimenze hledaného prostoru bude rovna dvěma. 37 Lineární algebra 3. Matice Inverzní matice 3.47. Poznámka. V definici 3.44 jsme zavedli jednotkovou matici s podobnými vlastnostmi, jako má reálné číslo 1. Vraťme se znovu ke srovnání s reálnými čísly. Pro každé nenulové reálné číslo a existuje reálné číslo b takové, že ab = 1. Takové reálné číslo obvykle nazýváme převrácenou hodnotou čísla a a označujeme 1/a nebo též a−1 . Analogicky definujeme „převrácenou hodnotu matice , tzv. inverzní matici. 3.48. Definice. Nechť A je čtvercová matice typu (n, n) a E je jednotková matice stejného typu. Matici B typu (n, n), která splňuje vlastnost A · B = E = B · A nazýváme inverzní maticí k matici A. Inverzní matici k matici A označujeme symbolem A−1 . 3.49. Věta. Pokud k matici A existuje inverzní matice, pak je tato inverzní matice jednoznačně určena. Důkaz. Nechť má čtvercová matice A dvě inverzní matice B a C. Ukážeme, že pak B = C. Platí: B = B · E = B · (A · C) = (B · A) · C = E · C = C. Zde jsme po řadě využili: poznámku 3.45, vlastnost, že C je inverzní matice k A, vlastnost (1) z věty 3.38, vlastnost, že B je inverzní matice k A, a konečně znovu poznámku 3.45. 3.50. Věta. Ke čtvercové matici typu (n, n) existuje inverzní matice právě tehdy, když hod(A) = n. Důkaz. Důkaz této věty přesuneme až do příští kapitoly o determinantech. Věta ukazuje, že matice, které mají hodnost rovnu počtu řádků (tj. podle věty 3.18 jsou všechny řádky lineárně nezávislé) mají inverzní matici. Pokud jsou řádky lineárně závislé, inverzní matice neexistuje. Můžeme tedy říci, že pokud jsou řádky ve čtvercové matici lineárně závislé, je matice z hlediska maticového násobení „skoro nulová v tom smyslu, že k ní neexistuje inverzní matice (podobně jako k reálnému číslu nula neexistuje převrácená hodnota). To nás inspiruje k následující definici. Regulární, singulární matice 3.51. Definice. Čtvercová matice A typu (n, n) se nazývá regulární, pokud hod(A) = n. Čtvercová matice A se nazývá singulární, pokud není regulární, tj. hod(A) < n. 3.52. Věta. Nechť A a B jsou regulární čtvercové matice typu (n, n). Pak matice A · B je rovněž regulární matice typu (n, n). Důkaz. Matice A · B je čtvercová typu (n, n). To plyne přímo z definice maticového součinu. Stačí tedy dokázat, že je regulární. Podle věty 3.50 je matice regulární právě tehdy, když k ní existuje inverzní matice. Podle předpokladu k matici A existuje inverzní matice A−1 a k matici B existuje inverzní matice B−1 . Stačí ukázat, že existuje inverzní matice k matici A·B. Hledaná inverzní matice je tvaru B−1 ·A−1 , protože: (B−1 · A−1 ) · (A · B) = B−1 · (A−1 · A) · B = B−1 · E · B = B−1 · B = E, (A · B) · (B−1 · A−1 ) = A · (B · B−1 ) · A−1 = A · E · A−1 = A · A−1 = E. Výpočet inverzní matice eliminací 3.53. Příklad. Nejprve na jednoduchém příkladu ukážeme obvyklý postup hledání inverzní matice k dané matici A. Teprve pak dokážeme, že tento postup je oprávněný a vždy vede k inverzní matici. Naším úkolem bude najít inverzní matici k matici A =   1 2 3 −1 0 1 2 2 1   . Vedle prvků matice A napíšeme prvky jednotkové matice stejného typu (oddělíme od sebe pro přehlednost svislou čarou) a dále použijeme řádkové úpravy Gaussovy eliminační metody na matici (A|E) jako celek. To znamená, že pracujeme s řádky délky 2n, v našem konkrétním případě s řádky o šesti prvcích. Při eliminaci se snažíme vlevo od svislé čáry dostat postupně jednotkovou matici.   1 2 3 1 0 0 −1 0 1 0 1 0 2 2 1 0 0 1   ∼   1 2 3 1 0 0 0 2 4 1 1 0 0 −2 −5 −2 0 1   ∼   1 2 3 1 0 0 0 2 4 1 1 0 0 0 1 1 −1 −1   ∼ ∼   1 2 0 −2 3 3 0 2 0 −3 5 4 0 0 1 1 −1 −1   ∼   1 0 0 1 −2 −1 0 1 0 −3 2 5 2 2 0 0 1 1 −1 −1   , A−1 =   1 −2 −1 −3 2 5 2 2 1 −1 −1   . 38 Lineární algebra 3. Matice Tvrdíme, že hledaná inverzní matice k matici A je zapsána vpravo od svislé čáry v poslední úpravě. Přesněji, pokud (A|E) ∼ (E|B), kde „∼ znamená konečně mnoho řádkových úprav matice podle Gaussovy eliminační metody, pak B = A−1 . Zvídavý student se oprávněně ptá, proč tato metoda dává inverzní matici. Než si na to odpovíme, budeme muset propočítat následující příklad a dokázat dvě následující věty. 3.54. Příklad. Nechť A je matice typu (m, n). Nechť dále P1 je čtvercová matice typu (m, m), která vznikne z matice E prohozením i-tého řádku s j-tým. Pak matice B = P1 · A je shodná s maticí A až na to, že má přehozený i-tý řádek s j-tým. Rozmyslete si to sami. Nechť P2 je čtvercová matice typu (m, m), která vznikne z matice E pronásobením i-tého řádku číslem α. Pak matice B = P2 · A je shodná s maticí A až na to, že má pronásobený i-tý řádek číslem α. Ověřte si to sami. Nechť konečně P3 je čtvercová matice typu (m, m), která vznikne z matice E záměnou jednoho nulového prvku na zvolené pozici i, j (i = j) číslem α. Pak matice B = P2 · A je shodná s maticí A až na to, že místo i-tého řádku je zde zapsán součet i-tého řádku matice A s α-násobkem j-tého řádku. Prověřte si to sami. Z předchozího vidíme, že jednotlivé kroky Gaussovy eliminační metody můžeme „emulovat násobením vhodné čtvercové matice zleva. Následné použití dalších kroků lze „emulovat násobením dalšími čtvercovými maticemi zleva. Tento poznatek precizuje následující věta. 3.55. Věta. Nechť A ∼ B jsou dvě matice, přičemž v eliminaci označené zde symbolem „∼ nebyl použit krok vynechání nebo přidání nulového řádku. Pak existuje regulární čtvercová matice P taková, že B = P · A. Důkaz. Pro jednotlivé kroky Gaussovy eliminační metody jsme našli odpovídající čtvercové matice v příkladu 3.54. Vznikla-li matice B po k krocích Gaussovy eliminační metody, pak zřejmě existují matice C1, C2, . . . , Ck (každá z nich je některého ze tří typů podle příkladu 3.54) takové, že B = Ck · (Ck−1 · · · (C2 · (C1 · A)) · · ·) = (Ck · Ck−1 · · · C2 · C1) · A = P · A. Zde jsme využili asociativního zákona pro násobení matic z věty 3.38. Výsledná matice P je regulární, protože všechny matice C1, C2, . . . , Ck jsou regulární (mají lineárně nezávislé řádky) a součin regulárních matic je regulární podle věty 3.52. 3.56. Věta. Nechť A je regulární a (A|E) ∼ (E|B), kde „∼ označuje konečný počet řádkových úprav podle eliminační metody a E jednotkovou matici. Pak B = A−1 . Důkaz. Podle věty 3.55 existuje čtvercová matice P taková, že (A | E) ∼ (E | B) = (P · A | P · E). Protože P · A = E, je matice P inverzní maticí k matici A. Protože B = P · E, je matice B přímo rovna matici P, tedy inverzní matici k matici A. Pozorný čtenář by měl v tuto chvíli namítnout: proč je P inverzní matice k A, když víme pouze, že P · A = E, ale nevíme, jestli A · P = E ? Tento vzorec ale z existence inverzní matice pro regulární matici A plyne z prvního. Nechť A−1 je inverzní matice k matici A a nechť platí P·A = E. Vynásobíme nyní obě strany rovnice maticí A−1 zprava: (P · A) · A−1 = E · A−1 , tj. P · (A · A−1 ) = A−1 , tj. P = A−1 . 3.57. Poznámka. Všimněme si, že metoda hledání inverzních matic, popsaná v příkladu 3.53 a dokázaná ve větě 3.56 nám mimochodem umožní odpovědět i na otázku, zda vůbec inverzní matice k dané matici A existuje. Pokud zapíšeme (A|E) a na konci přímého chodu Gaussovy eliminační metody zjistíme, že v poli vlevo od svislé čáry máme nulový řádek, pak podle věty 3.17 víme, že A je singulární. Věta 3.50 nám říká, že inverzní matice neexistuje, takže nemá smysl dál počítat. 39 Lineární algebra 3. Matice 3.58. Poznámka. Kdybychom napsali jednotkovou matici pod matici A a aplikovali na sloupce této „dvojmatice sloupcové úpravy podle Gaussovy eliminační metody a získali nakonec v horní části matici E, pak je ve spodní části matice inverzní. Při důkazu tohoto tvrzení bychom postupovali analogicky jako při řádkové metodě, jen maticemi Pi, které „emulují sloupcové úpravy, bychom násobili matici A zprava a nikoli zleva. Rozmyslete si, že není možné při metodě hledání inverzní matice kombinovat řádkové i sloupcové operace dohromady. Naráží to na skutečnost, že násobení matic není komutativní. 3.59. Příklad. Najdeme matici X takovou, aby byla splněna rovnice A · X − X + 4 A = O, kde A je matice typu (3, 3) z příkladu 3.53 a O je nulová matice stejného typu. Hledaná matice musí být čtvercová typu (3, 3), jinak by nebylo definováno sčítání. Rovnici postupně upravíme (dáváme si pozor na to, že nemusí platit komutativní zákon). A · X − X = −4 A tj. A · X − E · X = −4 A tj. (A − E) · X = −4 A. Pokud existuje matice (A − E)−1 , pak po pronásobení obou stran rovnice touto maticí zleva dostáváme X = (A − E)−1 · (−4 A) = −4 (A − E)−1 · A. Je tedy potřeba najít inverzní matici k matici A − E (například metodou popsanou v příkladu 3.53). Nalezenou inverzní matici vynásobíme čtyřmi a nakonec provedeme maticové násobení 4 (A − E)−1 · A podle definice. Níže uvádíme jednotlivé mezivýpočty: A − E =   0 2 3 −1 −1 1 2 2 0   , (A − E)−1 =    −1 2 3 2 5 4 1 2 −3 2 −3 4 0 1 1 2    , 4 (A − E)−1 =   −2 6 5 2 −6 −3 0 4 2   , X = −4 (A − E)−1 · A = −   −2 6 5 2 −6 −3 0 4 2   ·   1 2 3 −1 0 1 2 2 1   =   −2 −6 −5 −2 2 3 0 −4 −6   . Hodnost součinu matic 3.60. Věta. Nechť A je libovolná matice (ne nutně čtvercová) a P, Q jsou regulární matice takové, že je definováno násobení P · A a A · Q. Pak hod A = hod(P · A) = hod(A · Q). Jinými slovy: násobení regulární maticí nemění hodnost. Důkaz. Označme B = P · A. Sestavíme matici (A|E) a budeme ji eliminovat, abychom vpravo od čáry získali matici P, tj. podle věty 3.55 dostáváme (A|E) ∼ (P · A | P · E) = (B|P). Protože P je regulární, takovou eliminaci lze určitě provést. Kdo tomu nevěří, může eliminovat „pozpátku od matice P k matici E a použít pak větu 3.10. Proveďme nakonec tutéž eliminaci znovu, jen s maticemi vlevo od svislé čáry: A ∼ B. Protože Gaussova eliminace zachovává hodnost (věta 3.17), je hod A = hod B = hod(P·A). K důkazu hod A = hod(A · Q) stačí podle (5) věty 3.38 přejít k transponovaným maticím a použít předchozí výsledek společně s větou 3.31: hod(A·Q) = hod(A·Q)T = hod(QT ·AT ) = hod AT = hod A. 3.61. Věta. Je-li A · B definováno, pak hod(A · B) ≤ min(hod A, hod B). Důkaz. Je-li h = hod A, pak lze provést eliminaci A ∼ C takovou, že matice C má prvních h řádků nenulových a zbylé řádky nulové. Podle věty 3.55 existuje regulární P taková, že A = P · C. Na levé straně dokazované nerovnosti tedy máme hod(A · B) = hod(P · C · B) = hod(C · B). V poslední úpravě jsme použili větu 3.60. Nyní je potřeba si uvědomit, že díky nulovým řádkům matice C má matice C · B pod h-tým řádkem všechny ostatní řádky nulové. Takže hod(C · B) ≤ h = hod A. Dostáváme výsledek hod(A · B) ≤ hod A. Přejdeme nyní k maticím transponovaným (A · B)T = BT · AT . Znovu použijeme právě dokázaný výsledek a větu 3.31: hod(A · B) = hod(A · B)T = hod(BT · AT ) ≤ hod BT = hod B. Protože hod(A · B) je menší nebo rovna hod A i hod B, musí být menší nebo rovna minimu těchto hodnot. 40 4. Determinant Determinant je číslo, které jistým způsobem charakterizuje čtvercovou matici. Toto číslo má mnoho důležitých významů, se kterými se setkáme nejen v lineární algebře, ale i v jiných matematických disciplínách. Determinant se podle definice počítá z prvků matice poměrně komplikovaným způsobem. Než budeme schopni tuto definici formulovat, musíme si něco říci o permutacích. Na tomto pojmu je totiž definice determinantu založena. Permutace4.1. Definice. Nechť M je konečná množina o n prvcích. Permutace prvků množiny M je uspořádaná n-tice prvků množiny M taková, že žádný prvek z množiny M se v ní neopakuje. Permutaci prvků množiny M = {1, 2, . . . , n} nazýváme stručně permutací n prvků. 4.2. Příklad. Uvedeme některé permutace pěti prvků: (1, 2, 4, 5, 3), (5, 4, 3, 2, 1), (3, 5, 4, 1, 2). Uspořádanou pětici (1, 2, 3, 2, 4) nepovažujeme za permutaci, protože se zde opakuje prvek 2. 4.3. Věta. Počet různých permutací n prvků je roven číslu n! . Důkaz. Připomínáme, že n! = n(n − 1)(n − 2) · · · 2 · 1. Důkaz věty provedeme matematickou indukcí. Pro čtenáře, který se s takovou formou důkazu ještě nesetkal, nejprve vysvětlíme princip matematické indukce. Matematickou indukcí dokazujeme tvrzení, které má platit pro všechna n ∈ N. Postupujeme ve dvou krocích. Nejprve dokážeme toto tvrzení pro n = 1. Pak dokážeme tzv. indukční krok, který je formulován ve tvaru implikace: „jestliže tvrzení platí pro n, pak platí pro n + 1 . Obhájíme-li platnost této implikace, máme dokázáno tvrzení pro všechna n ∈ N. Vysvětlíme si, proč. V prvním kroku jsme dokázali, že tvrzení platí pro n = 1. Uplatníme nyní indukční krok ve tvaru „jestliže tvrzení platí pro n = 1, pak platí pro n = 2 . Tím máme zaručeno, že tvrzení platí pro n = 2. Zopakujeme indukční krok, tentokrát ve tvaru „jestliže tvrzení platí pro n = 2, pak platí pro n = 3 . To dokazuje platnost tvrzení pro n = 3. Opakovaným uplatněním indukčního kroku jsme schopni doložit platnost tvrzení pro libovolně velké n. Tvrzení naší věty je: „počet různých permutací n prvků je roven číslu n! . Dokážeme v prvním kroku pro n = 1, tj. „počet různých permutací jednoho prvku je roven číslu 1! = 1 . O tom ale asi nikdo nepochybuje, nelze totiž vytvořit nic jiného než permutaci (1). Nyní dokážeme indukční krok. Předpokládáme tedy, že počet různých permutací n prvků je roven číslu n! a dokážeme, že počet různých permutací n+1 prvků je roven číslu (n+1)! . Prozkoumejme nejprve, kolik existuje permutací n+1 prvků, které mají v první složce zapsáno číslo 1. Je jich n!, protože zbylých n složek můžeme zaplnit čísly {2, 3, . . . , n, n + 1} a máme v tomto případě stejné množství možností, jako je počet permutací n prvků. Těch je podle indukčního předpokladu n! . Ze stejného důvodu existuje n! různých permutací n + 1 prvků, které mají v první složce zapsáno číslo 2. Totéž platí pro čísla 3, 4, . . . , n, n + 1 v první složce permutace. Existuje tedy (n + 1) · n! = (n + 1)! různých permutací n + 1 prvků. 4.4. Příklad. Uvedeme si všechny permutace tří prvků. Podle věty 4.3 je jejich počet roven šesti. Hledané permutace jsou: (1, 2, 3), (1, 3, 2), (2, 1, 3), (2, 3, 1), (3, 1, 2), (3, 2, 1). Zkusíme ještě zapsat všechny permutace čtyř prvků. Je jich 24. (1, 2, 3, 4), (1, 2, 4, 3), (1, 3, 2, 4), (1, 3, 4, 2), (1, 4, 2, 3), (1, 4, 3, 2), (2, 1, 3, 4), (2, 1, 4, 3), (2, 3, 1, 4), (2, 3, 4, 1), (2, 4, 1, 3), (2, 4, 3, 1), (3, 2, 1, 4), (3, 2, 4, 1), (3, 1, 2, 4), (3, 1, 4, 2), (3, 4, 2, 1), (3, 4, 1, 2), (4, 2, 3, 1), (4, 2, 1, 3), (4, 3, 2, 1), (4, 3, 1, 2), (4, 1, 2, 3), (4, 1, 3, 2). Kdybychom chtěli zapsat všechny permutace 50 prvků, po použití věty 4.3 bychom si to rychle rozmysleli. Těch permutací totiž je přibližně 3 · 1064 . Kdyby se nám na jeden řádek vešla jedna permutace a na stránku 60 řádků, spotřebovali bychom 5 · 1062 stránek. Při oboustranném tisku váží 500 stránek asi jeden kilogram, takže bychom spotřebovali 1057 tun papíru. Kdyby tisk jedné stránky trval vteřinu, strávili bychom u tiskárny zhruba 1055 let. Jistě uznáte, že to daleko přesahuje veškeré lidské možnosti. 41 Lineární algebra 4. Determinant 4.5. Definice. Nechť (i1, i2, . . . , in) je permutace n prvků. Inverze této permutace je taková dvojice (ik, il), pro které platí ik > il, a přitom k < l. 4.6. Příklad. Permutace (1, 2, 3) nemá žádnou inverzi. Permutace (1, 3, 2) má jednu inverzi, totiž dvojici (3, 2), pro kterou platí 3 > 2. Jednotlivé inverze jsou na následujících permutacích vyznačeny obloučkem (1, 2, 3), (1, 3, 2), (2, 1, 3), (2, 3, 1), (3, 1, 2), (3, 2, 1). Jako cvičení doplňte obloučky (tj. jednotlivé inverze) ke všem permutacím čtyř prvků. Znaménko permutace 4.7. Definice. Pro každou permutaci π = (i1, . . . , in) definujeme znaménko permutace sgn π takto: sgn π = +1 má-li π sudý počet inverzí −1 má-li π lichý počet inverzí 4.8. Příklad. Permutace z příkladu 4.6 mají tato znaménka: sgn(1, 2, 3) = +1, sgn(1, 3, 2) = −1, sgn(2, 1, 3) = −1, sgn(2, 3, 1) = +1, sgn(3, 1, 2) = +1, sgn(3, 2, 1) = −1. Jako cvičení si rozmyslete, jak vypadají znaménka všech permutací čtyř prvků. 4.9. Věta. Prohození jediné dvojice prvků v permutaci způsobí změnu jejího znaménka. Důkaz. Nechť π = (. . . , a, . . . , b, . . .) a π1 = (. . . , b, . . . , a, . . .) jsou dvě permutace, které se liší jen prohozením prvků a, b. Ukážeme, že rozdíl počtu inverzí permutací π a π1 je liché číslo. Inverze, ve kterých se nevyskytuje ani a, ani b, zůstávají v obou permutacích stejné. Tvoří-li dvojice (a, b) z permutace π inverzi, pak (b, a) z permutace π1 inverzi netvoří a naopak. Zatím jsme tedy zjistili, že se permutace π a π1 liší o jednu inverzi, což je liché číslo. Ještě prozkoumáme všechny inverze, ve kterých vystupuje a nebo b s nějakým jiným prvkem. Ukážeme, že pokud tam dojde ke změně, pak jedině o sudý počet inverzí. Uvažujme nějaký prvek x s menším indexem, než indexy prvků a i b, nějaký prvek y s větším indexem, než indexy prvků a i b a nějaký prvek z, který má index mezi indexy a a b. Názorně: π = (. . . , x, . . . , a, . . . , z, . . . , b, . . . , y, . . .), π1 = (. . . , x, . . . , b, . . . , z, . . . , a, . . . , y, . . .). Nemusejí v každém případě všechny tyto prvky existovat. Další rozbor tedy provedeme jen tehdy, pokud příslušný prvek existuje. Zabývejme se nejprve prvky x a y. Případné inverze mezi prvky (x, a), (x, b), (a, y) a (b, y) zůstanou po prohození prvků a, b v nezměněném stavu. Zajímavý je tedy jen prvek z. Nechť nejprve a < z < b, tj. v permutaci π netvoří dvojice (a, z) ani (z, b) inverzi. Pak v permutaci π1 vznikají dvě nové inverze (b, z) a (z, a), a to je sudé číslo. Nechť dále b < z < a, pak v permutaci π máme dvě inverze, které v permutaci π1 zanikají. Proběhla rovněž změna o sudý počet inverzí. Ještě může dojít k situaci z < a a z < b. Pak v permutaci π dvojice (a, z) tvoří inverzi a dvojice (z, b) netvoří, zatímco v permutaci π1 dvojice (b, z) tvoří inverzi a dvojice (z, a) netvoří. Počet inverzí se tedy v tomto případě nezměnil. Poslední případ a < z a b < z ověříme podobně, jako předchozí. 4.10. Definice. Nechť π = (i1, i2, . . . , in) je permutace n prvků. Inverzní permutací k permutaci π je permutace (j1, j2, . . . , jn), pro kterou platí jik = k pro všechna k ∈ {1, 2, . . . , n}. Tuto permutaci označujeme znakem π−1 . 4.11. Poznámka. Existuje několik možností, jak si představit inverzní permutaci k dané permutaci. (1) Je-li v permutaci π na x-tém místě prvek y, pak v permutaci π−1 musí být na y-tém místě prvek x. (2) Zapišme pod sebe permutaci π a permutaci (1, 2, . . . , n) takto: i1 i2 i3 . . . in 1 2 3 . . . n 42 Lineární algebra 4. Determinant a zaměnme pořadí sloupců této matice tak, abychom v prvním řádku měli vzestupně čísla (1, 2, 3, . . . , n). Pak ve spodním řádku je zapsána inverzní permutace k permutaci π. Uvažujme kupříkladu permutaci (3, 4, 2, 6, 1, 5) a pišme: 3 4 2 6 1 5 1 2 3 4 5 6 −→ 1 2 3 4 5 6 5 3 1 2 6 4 . Je tedy (3, 4, 2, 6, 1, 5)−1 = (5, 3, 1, 2, 6, 4). (3) Představme si šachovnici o rozměru n × n a rozestavme na ní n šachových věží tak, aby se vzájemně neohrožovaly. Takových rozestavení může být více a každé rozestavení můžeme popsat jednoznačně jako permutaci. V každém řádku i sloupci totiž stojí jediná věž a my můžeme číst rozestavení po řádcích takto: do první složky permutace napíšeme číslo sloupce, na kterém stojí věž z prvního řádku, do druhé složky číslo sloupce, na které stojí věž z druhého řádku atd. Dostáváme tak permutaci π. Pokud nyní čteme totéž rozestavení po sloupcích, tj. do první složky permutace napíšeme číslo řádku věže z prvního sloupce, do druhé složky číslo řádku věže z druhého sloupce atd., dostáváme permutaci π−1 . (4) Na permutaci n prvků můžeme pohlížet jako na zobrazení π : M → M, kde M = {1, 2, . . . , n}. Pak inverzní permutace odpovídá inverznímu zobrazení. Zná-li už čtenář pojem skládání funkcí (f ◦ g), pak může ověřit, že platí π ◦ π−1 = (1, 2, 3, . . . , n). 4.12. Věta. Nechť π je permutace n prvků. Pak π−1 má stejný počet inverzí, jako π. Důkaz. Pro názornost si představíme inverzní permutaci způsobem (2) z poznámky 4.11. Zaměřme se na dva sloupce uvedené dvouřádkové matice před prohozením sloupců: . . . , x, . . . , y, . . . . . . , a, . . . , b, . . . . Protože jde o stav před prohozením sloupců, víme, že a < b. Pokud x < y, tj. (x, y) netvoří inverzi v permutaci π, zůstanou po prohození sloupců tyto dva sloupce za sebou ve stejném pořadí. Takže se nová inverze v permutaci π−1 nevytvoří. Pokud ale x > y, tj. (x, y) tvoří inverzi v permutaci π, pak po prohození sloupců budou tyto dva sloupce v opačném pořadí. Dvojice prvků (b, a) tedy bude tvořit inverzi v permutaci π−1 . 4.13. Věta. Permutace π a π−1 mají vždy stejná znaménka. Důkaz. Věta je přímým důsledkem věty 4.12. 4.14. Poznámka. V předchozích definicích a větách jsme si řekli minimum toho, co potřebujeme vědět o permutacích, abychom pochopili definici determinantu a odvodili jednoduché vlastnosti determinantu. Ve skutečnosti se u permutací dá studovat ještě mnoho dalších vlastností, které zde nebudeme potřebovat. Definice determi- nantu 4.15. Definice. Nechť A = (ai,j) je čtvercová matice typu (n, n). Číslo π=(i1,i2,...,in) sgn π · a1,i1 a2,i2 · · · an,in (4.1) nazýváme determinantem matice A a značíme je det A. V uvedeném vzorci se sčítá přes všechny permutace n prvků, tj. jedná se podle věty 4.3 o n! sčítanců. 4.16. Poznámka. Je možné, že vzorec z definice 4.15 je pro některé čtenáře málo srozumitelný. Pokusíme se jej proto v této poznámce trochu vysvětlit a zlidštit. Představme si čtvercovou matici jako šachovnici rozměru n × n a pokusme se na ni rozmístit n šachových věží tak, aby se vzájemně neohrožovaly. Podle poznámky 4.11, odst. (3) je možné každé takové rozmístění popsat jednou permutací (pozice věží čteme po řádcích). Podle věty 4.3 vidíme, že existuje n! různých permutací, tedy existuje n! různých řešení této šachové úlohy. Pokusme se pro každé řešení této úlohy zapsat odpovídající permutaci, zjistit znaménko této permutace, nadzvednout věžičky a zapsat si hodnoty prvků, na kterých ty figurky stojí, vynásobit tyto hodnoty mezi sebou a výsledek ještě násobit znaménkem permutace. Pak si tento výsledek uložíme do paměti. Až projdeme všech n! možností rozmístění věží, získáme v paměti n! sčítanců a ty sečteme. Výsledkem je determinant matice. 43 Lineární algebra 4. Determinant 4.17. Příklad. Hledejme determinant matice typu (3, 3) tvaru A =   a1,1 a1,2 a1,3 a2,1 a2,2 a2,3 a3,1 a3,2 a3,3   . Podle vzorce z definice 4.15 budeme sčítat přes všechny permutace tří prvků. Těch je podle věty 4.3 3! = 6. Zapíšeme všechny tyto permutace, jejich znaménka a odpovídající rozmístění „šachových věží . π = (1, 2, 3), sgn π = +1,   a1,1 a1,2 a1,3 a2,1 a2,2 a2,3 a3,1 a3,2 a3,3   , sčítanec: + a1,1 · a2,2 · a3,3. π = (2, 3, 1), sgn π = +1,   a1,1 a1,2 a1,3 a2,1 a2,2 a2,3 a3,1 a3,2 a3,3   , sčítanec: + a1,2 · a2,3 · a3,1. π = (3, 1, 2), sgn π = +1,   a1,1 a1,2 a1,3 a2,1 a2,2 a2,3 a3,1 a3,2 a3,3   , sčítanec: + a1,3 · a2,1 · a3,2. π = (3, 2, 1), sgn π = −1,   a1,1 a1,2 a1,3 a2,1 a2,2 a2,3 a3,1 a3,2 a3,3   , sčítanec: − a1,3 · a2,2 · a3,1. π = (2, 1, 3), sgn π = −1,   a1,1 a1,2 a1,3 a2,1 a2,2 a2,3 a3,1 a3,2 a3,3   , sčítanec: − a1,2 · a2,1 · a3,3. π = (1, 3, 2), sgn π = −1,   a1,1 a1,2 a1,3 a2,1 a2,2 a2,3 a3,1 a3,2 a3,3   , sčítanec: − a1,1 · a2,3 · a3,2. det A = a1,1 a2,2 a3,3 + a1,2 a2,3 a3,1 + a1,3 a2,1 a3,2 − a1,3 a2,2 a3,1 − a1,2 a2,1 a3,3 − a1,1 a2,3 a3,2. Tento vzorec se dá zapamatovat pomocí mnemotechnické pomůcky: nejprve násobíme prvky na hlavní diagonále, dále ve směrech rovnoběžných s hlavní diagonálou a součiny sčítáme. Pak násobíme prvky na vedlejší diagonále, dále ve směrech rovnoběžných s vedlejší diagonálou, přičemž tyto součiny odečítáme. Této „poučce o diagonálách , která je použitelná jen pro matice typu (3, 3), říkáme Sarrusovo pravidlo. Toto populární pravidlo tedy není nic jiného než rozepsání definice determinantu pro matice typu (3, 3). Pro matici typu (4, 4) bychom dostali při výpočtu determinantu podle definice 4! = 24 sčítanců. Pro takovou matici se už těžko hledají mnemotechnické pomůcky. Má-li čtenář čas a místo na papíře, může se pokusit sestavit všechny permutace čtyř prvků, najít jejich znaménka a sečíst odpovídající součiny. Pokud čtenář nemá čas nebo místo na papíře, udělá nejlíp, když si počká na další metodu na počítání determinantů, která bude vyžadovat daleko méně početních úkonů. Na druhé straně rozepsání vzorce pro determinant matice typu (4, 4) je užitečné cvičení pro pochopení definice determinantu. 4.18. Příklad. Podobně, jako v předchozím příkladě, odvodíme vzorec pro výpočet determinantu matice typu (2, 2). π = (1, 2), sgn π = +1, a1,1 a1,2 a2,1 a2,2 , π = (2, 1), sgn π = −1, a1,1 a1,2 a2,1 a2,2 , det A = a1,1 · a2,2 − a1,2 · a2,1. Pro úplnost uvedeme ještě hodnotu determinantu matice A = (a1,1) typu (1, 1). Zřejmě je det A = a1,1. 4.19. Definice. Nechť A = (ai,j) je matice typu (n, n). Hlavní diagonála matice A je skupina jejích prvků a1,1, a2,2, . . . , an,n. Vedlejší diagonála matice A zahrnuje prvky a1,n, a2,n−1, . . . , an,1. Prvek pod hlavní diagonálou je každý prvek ai,j, pro který platí i > j. Prvek nad hlavní diagonálou je každý prvek ai,j, pro který platí i < j. 44 Lineární algebra 4. Determinant 4.20. Příklad. Nechť matice A typu (n, n) má pod hlavní diagonálou jen nulové prvky. Matice tedy názorně vypadá takto: A =       a1,1, a1,2, . . . , a1,n−1, a1,n 0, a2,2, . . . , a2,n−1, a2,n 0, 0, . . . , a3,n−1, a3,n ... 0, 0, . . . , 0, an,n       . (4.2) Zkusíme spočítat det A. V definici determinantu 4.15 se pracuje se součtem součinů sgn π · a1,i1 · a2,i2 · · · an,in . Pokud aspoň jeden z těchto činitelů je nulový, je nulový celý součin. V celkovém součtu nás zajímají jen nenulové součiny. Prozkoumejme, které to jsou. Z posledního řádku musíme vzít jen prvek an,n, protože všechny ostatní prvky v posledním řádku jsou nulové. Z předposledního řádku můžeme vzít jen prvek an−1,n−1, protože ostatní jsou nulové. Prvek an−1,n nelze do součinu zahrnout, protože z posledního sloupce už v součinu máme prvek an,n (věže by se vzájemně ohrožovaly). Analogickou úvahou zahrneme do součinu prvky an−2,n−2, . . . , a2,2, a1,1. Není tedy jiná možnost nenulového součinu, než součin a1,1 · a2,2 · · · an,n. Ten odpovídá permutaci (1, 2, . . . , n), která nemá žádnou inverzi a její znaménko je tedy +1. Ostatní sčítanci z definice determinantu jsou nuloví. Proto det A = a1,1 · a2,2 · a3,3 · · · an,n. Základní vlastnosti 4.21. Věta. Základní vlastnosti determinantu. (V1) Jestliže se matice B liší od matice A jen prohozením jedné dvojice řádků, pak det B = − det A. (V2) Jestliže matice A má dva stejné řádky, pak det A = 0. V dalších vlastnostech (V3) až (V5) označujeme symbolem    ... ai ...    matice, které se liší pouze v i-tém řádku, zde označeném ai. V řádcích, které jsou vyznačeny tečkami, se jednotlivé matice shodují. (V3) det    ... α ai ...    = α det    ... ai ...    . (V4) det    ... ai ...    + det    ... bi ...    = det    ... ai + bi ...    . (V5) det     ... ai + α aj ...     = det    ... ai ...    , kde aj je nějaký jiný řádek téže matice. Důkaz. (V1) Součin a1,i1 · · · an,in odpovídá ve vzorci pro výpočet det A permutaci π = (i1, i2, . . . , in). Tentýž součin najdeme i ve vzorci pro výpočet det B, pouze bude odpovídat permutaci π , která vznikne z permutace π přehozením dvou prvků. To podle věty 4.9 znamená, že sgn π = − sgn π. V každém z n! sčítanců pro výpočet det B tedy máme opačné znaménko, než ve sčítancích pro výpočet det A. Musí tedy být det B = − det A. (V2) Prohodíme-li v matici A mezi sebou dva stejné řádky, dostáváme zase matici A. Podle (V1) pro tuto matici platí det A = − det A, což nemůže být splněno jinak, než že det A = 0. Vlastnosti (V3) a (V4) plynou přímo z definice determinantu: (V3) sgn π a1,j1 a2,j2 · · · (α ai,ji ) ai+1,ji+1 · · · an,jn = α sgn π a1,j1 a2,j2 · · · ai,ji ai+1,ji+1 · · · an,jn . (V4) sgn π a1,j1 a2,j2 · · · (ai,ji + bi,ji ) ai+1,ji+1 · · · an,jn = = sgn π a1,j1 a2,j2 · · · ai,ji ai+1,ji+1 · · · an,jn + sgn π a1,j1 a2,j2 · · · bi,ji ai+1,ji+1 · · · an,jn . 45 Lineární algebra 4. Determinant (V5) dokážeme použitím právě dokázaných vlastností: det          ... aj ... ai + α aj ...          (V4) = det          ... aj ... ai ...          + det          ... aj ... α aj ...          (V3) = det          ... aj ... ai ...          + α det          ... aj ... aj ...          (V2) = det          ... aj ... ai ...          . Metoda počítání determi- nantu 4.22. Poznámka. Vlastnosti (V1), (V3) a (V5) nám ukazují, jak se změní determinant, změnímeli matici pomocí Gaussovy eliminační metody. Prohození řádků změní znaménko, vynásobení řádku nenulovým číslem α způsobí, že se determinant α-krát zvětší a konečně přičtení α-násobku jiného řádku ke zvolenému řádku nezmění hodnotu determinantu. Jsme tedy schopni upravovat matice Gaussovou eliminační metodou, a přitom si poznamenávat, jak se mění determinant. Tím můžeme převést matici na tvar (4.2). O této matici víme, že má determinant roven součinu prvků na hlavní diagonále. Uvědomme si, že tato metoda dává výraznou úsporu času a výpočetních prostředků při počítání determinantů. Představme si, že počítáme determinant matice typu (n, n). Při Gaussově eliminační metodě potřebujeme zhruba n operací na výrobu jednoho nulového prvku. Těch nul potřebujeme vytvořit zhruba n2 /2, takže k výpočtu determinantu nám stačí n3 /2 operací. Pro matici typu (50, 50) to je zhruba 62 500 operací. Pokud bychom chtěli počítat determinant stejně velké matice přímo z definice, potřebovali bychom na to 50 · 3 · 1064 operací (viz komentář v příkladu 4.4). Není v silách žádné výpočetní techniky spočítat to v rozumném čase. 4.23. Příklad. Právě popsanou metodou spočítáme determinant matice A =    1 2 4 −1 2 1 2 2 1 3 1 2 2 1 2 1    . V literatuře se pro det A často používá značení |A|. Níže tedy zapisujeme prvky jednotlivých matic mezi svislé čáry a tím dáváme na jevo, že počítáme determinant. 1 2 4 −1 2 1 2 2 1 3 1 2 2 1 2 1 (1) = 1 2 4 −1 0 −3 −6 4 0 1 −3 3 0 −3 −6 3 (2) = − 1 2 4 −1 0 1 −3 3 0 −3 −6 4 0 −3 −6 3 (3) = − 1 2 4 −1 0 1 −3 3 0 0 −15 13 0 0 −15 12 (4) = (4) = − 1 2 4 −1 0 1 −3 3 0 0 −15 13 0 0 0 −1 = −(−15) · (−1) = −15. V kroku (1) jsme první řádek násobili −2 a přičítali k druhému, pak jsme první řádek násobili −1 a přičítali k třetímu a nakonec jsme první řádek násobili −2 a přičítali ke čtvrtému. Tyto operace podle (V5) nemění hodnotu determinantu. V kroku (2) jsme prohodili druhý řádek se třetím, což podle (V1) změní znaménko determinantu. Napsali jsme toto znaménko před determinant modifikované matice. V kroku (3) jsme druhý řádek násobili třemi a přičetli ke třetímu a čtvrtému. To podle (V5) nemění hodnotu determinantu. Konečně v kroku (4) jsme třetí řádek násobili −1 a přičetli ke čtvrtému. Tím dostáváme matici tvaru (4.2) z příkladu 4.20, o které víme, že má determinant roven součinu prvků na diagonále. Upozorňujeme na častou začátečnickou chybu při počítání determinantů. V Gaussově eliminační metodě se většinou neklade důraz na to, který řádek od kterého odečítáme, protože výsledný řádek můžeme kdykoli později násobit číslem −1. Při počítání determinantů to ale jedno není. Například v kroku (1) jsme od druhého řádku odečítali dvojnásobek prvního a výsledek psali na druhý řádek. Kdybychom od dvojnásobku prvního řádku odečítali druhý a výsledek psali do druhého řádku, dopustili bychom se chyby, která nám změní znaménko determinantu. Mnemotechnická pomůcka: píšeme-li výsledek součtu na i-tý řádek, pak i-tý řádek původní matice nesmí být v součtu násoben žádnou konstantou. Ostatní řádky mohou být násobeny libovolnou konstantou a přičítány k tomuto řádku. Je třeba si tedy uvědomit, že „přičtení násobku řádku a k řádku b (korektní krok) není totéž, jako „přičtení řádku a k násobku řádku b (nekorektní krok). 46 Lineární algebra 4. Determinant 4.24. Příklad. Jednotková matice má determinant roven jedné. Jednotková matice je totiž tvaru (4.2), takže stačí pronásobit prvky na diagonále. 4.25. Příklad. Nechť A je matice typu (n, n), která má prvky na vedlejší diagonále rovny jedné a ostatní prvky jsou nulové. Spočítáme její determinant. Prohodíme první řádek s posledním, druhý s předposledním atd. až se dostaneme k prostřednímu řádku. Pro liché n necháváme prostřední řádek na místě, pro sudé n prohodíme naposled mezi sebou řádky n/2 a n/2 + 1. V obou případech jsme udělali [n/2] prohození (symbolem [x] zde značíme celou část z x). Matici A jsme těmito úpravami převedli na jednotkovou matici E. Podle předchozího příkladu je det E = 1, takže podle vlastnosti (V1) z věty 4.21 je det A = (−1)[n/2] det E = (−1)[n/2] . 4.26. Příklad. Nechť A je matice typu (n, n), která má nad vedlejší diagonálou nulové prvky. Spočítáme její determinant. Prohazováním řádků, stejně jako v předchozím příkladě, převedeme matici na tvar (4.2). Prvky z vedlejší diagonály se při těchto úpravách přestěhují na hlavní diagonálu. Determinant takto upravené matice je podle příkladu 4.20 roven součinu prvků na diagonále, takže máme det A = (−1)[n/2] a1,n a2,n−1 · · · an,1. 4.27. Věta. Čtvercová matice A je regulární právě tehdy, když det A = 0. Důkaz. Všimneme si nejprve, že Gaussova eliminační metoda realizovaná kroky (V1), (V3) a (V5) podle předchozí věty 4.21 nemění „nulovost determinantu. Přesněji, je-li A ∼ B, pak det A = 0 právě tehdy když det B = 0. Je-li matice A regulární (hod A = n), pak po úpravě Gaussovou eliminační metodou na matici B tvaru (4.2) musejí být všechny prvky na diagonále nenulové, protože podle věty 3.17 je také hod B = n. To znamená, že det B = 0 a tedy i det A = 0. Je-li matice A singulární (hod A < n), pak po úpravě Gaussovou eliminační metodou na matici B tvaru (4.2) bude existovat aspoň jeden řádek v matici B celý nulový. Nulový je tedy i diagonální prvek, takže det B = 0. Podle předchozího nutně musí být det A = 0. 4.28. Věta. Nechť A je čtvercová matice. Pak det A = det AT . Důkaz. Součinu a1,i1 a2,i2 · · · an,in ze vzorce (4.1) pro det A odpovídá permutace π = (i1, i2, . . . , in). Uspořádáme činitele tohoto součinu podle velikosti druhého indexu a dostaneme aj1,1 aj2,2 · · · ajn,n, kde pro permutaci π1 = (j1, j2, . . . , jn) platí π1 = π−1 . Právě takové součiny se objevují ve vzorci pro det AT . Vidíme tedy, že oba vzorce det A i det AT obsahují sumu stejných součinů, pouze permutace odpovídajících součinů je v prvním případě π a v druhém π−1 . Tyto permutace mají podle věty 4.12 stejný počet inverzí, takže i stejné znaménko. Musí tedy být det A = det AT . 4.29. Poznámka. Z právě dokázané věty plyne, že vlastnosti vyjmenované ve větě 4.21 platí nejen pro řádky matice, ale též pro sloupce. Při počítání determinantu podle metody popsané v poznámce 4.22 můžeme tedy svobodně přecházet od řádkových úprav ke sloupcovým a zpět, protože vlastnosti (V1), (V3) a (V5) věty 4.21 platí nejen pro řádky, ale i pro sloupce (tzv. řádkově-sloupcová dualita). Rozvoj deter- minantu 4.30. Věta (o rozvoji determinantu podle r-tého řádku). Nechť A = (ar,s) je čtvercová matice typu (n, n) a Ai,j jsou matice typu (n − 1, n − 1), které vzniknou z matice A vynecháním i-tého řádku a j-tého sloupce. Pak pro každé r ∈ {1, . . . , n} platí ar,1 (−1)r+1 det Ar,1 + ar,2 (−1)r+2 det Ar,2 + · · · + ar,n (−1)r+n det Ar,n = det A. (4.3) Je-li dále t ∈ {1, . . . , n}, t = r, pak platí ar,1 (−1)t+1 det At,1 + ar,2 (−1)t+2 det At,2 + · · · + ar,n (−1)t+n det At,n = 0. (4.4) Důkaz (pro hloubavé čtenáře). Podívejme se na vzorec (4.1) pro det A. Seskupíme v něm všechny sčítance, které obsahují prvek a1,1 k sobě, dále seskupíme k sobě sčítance, které obsahují prvek a1,2 a tak dále až po poslední skupinu, ve které se vyskytují sčítanci s prvkem a1,n. Tyto prvky ze součtů vytkneme. Pro s-tou skupinu sčítanců tedy máme: π=(s,i2,...,in) sgn π · a1,s a2,i2 · · · an,in = a1,s   π=(s,i2,...,in) sgn π · a2,i2 · · · an,in   = ∗ 47 Lineární algebra 4. Determinant Z permutace π = (s, i2, . . . , in) prvků množiny M = {1, 2, . . . , n} vytvořme permutaci π = (i2, . . . , in) prvků množiny M \{s} tak, že odebereme první prvek z permutace π. Nová permutace π má o s−1 méně inverzí než permutace π. (Nakreslete si všechny inverze spojené s prvkem s.) Pro znaménka permutací tedy platí sgn π = (−1)s−1 sgn π = (−1)s+1 sgn π . Pokračujme nyní dále v našem výpočtu: ∗ = a1,s (−1)1+s   π =(i2,...,in) sgn π · a2,i2 · · · an,in   = a1,s (−1)1+s det A1,s. Determinant A je součtem všech skupin sčítanců pro s = 1, 2, . . . , n, což dokazuje vzorec (4.3) pro r = 1. Nechť nyní r = 1. Prohodíme r-tý řádek matice A s předchozím, pak jej prohodíme s dalším předcházejícím řádkem, atd. až dostaneme původně r-tý řádek na první řádek modifikované matice B. K tomu potřebujeme provést r − 1 prohození, takže platí det B = (−1)r−1 det A. Provedeme rozvoj determinantu matice B podle prvního řádku (B1,s je matice, která vznikne z matice B vynecháním prvního řádku a s-tého sloupce): det B = ar,1 (−1)1+1 det B1,1 + ar,2 (−1)2+1 det B1,2 + · · · + ar,n (−1)1+n det B1,n. Protože det A = (−1)r−1 det B a protože B1,s = Ar,s, máme vzorec (4.3) dokázán. Uvažujme t = r a nahraďme t-tý řádek v matici A řádkem r-tým. Novou matici označme C. Má dva stejné řádky, takže je det C = 0. Rozvoj tohoto determinantu podle t-tého řádku odpovídá vzorci (4.4). 4.31. Poznámka. Vzhledem k platnosti věty 4.28 platí analogická věta o rozvoji determinantu podle s-tého sloupce. Zkuste si ji zformulovat jako cvičení. 4.32. Definice. Nechť A je čtvercová matice typu (n, n). Doplněk matice A v pozici (i, j) je číslo Di,j, definované vzorcem: Di,j = (−1)i+j det Ai,j, kde Ai,j je matice typu (n−1, n−1), která vznikne z matice A vynecháním i-tého řádku a j-tého sloupce. 4.33. Poznámka. Větu 4.30 lze při použití definice 4.32 a poznámky 4.31 přeformulovat. Nechť A je čtvercová matice typu (n, n) a Di,j jsou její doplňky. Nechť r, s, t ∈ {1, 2, . . . , n}, r = t, s = t. Pak platí det A = ar,1 Dr,1 + ar,2 Dr,2 + · · · + ar,n Dr,n, 0 = ar,1 Dt,1 + ar,2 Dt,2 + · · · + ar,n Dt,n, det A = a1,s D1,s + a2,s D2,s + · · · + an,s Dn,s, 0 = a1,s D1,t + a2,s D2,t + · · · + an,s Dn,t. 4.34. Příklad. Uvažujme matici A z příkladu 4.23. Provedeme rozvoj determinantu A podle prvního řádku. det A = 1·(−1)1+1 · 1 2 2 3 1 2 1 2 1 +2·(−1)1+2 · 2 2 2 1 1 2 2 2 1 +4·(−1)1+3 · 2 1 2 1 3 2 2 1 1 −1·(−1)1+4 · 2 1 2 1 3 1 2 1 2 = = 1 · 5 + 2 · 0 + 4 · (−5) − 1 · 0 = −15. Vidíme, že jsme si při výpočtu moc nepomohli. Rozvoj determinantu podle řádku nebo sloupce matice typu (n, n) obecně vede na n determinantů matic, které mají o jediný řádek a sloupec méně. To není žádná výhra. Kdybychom opakovaně prováděli rozvoj vzniklých determinantů podle řádku nebo sloupce, mohli bychom dojít až k maticím typu (1,1), u kterých je determinant přímo roven hodnotě prvku dané matice. Programátory může napadnout, že lze tedy větu o rozvoji determinantu využít při implementaci výpočtu determinantu rekurzivním algoritmem. Ovšem pozor! Tento algoritmus potřebuje zcela stejné množství operací, jako při výpočtu determinantu přímo z definice. Jak už jsme si uváděli, při matici typu (50, 50) se jedná zhruba o 1064 operací. Prakticky to znamená, že bychom se pravděpodobně výsledku nedočkali za celou dobu předpokládané existence naší sluneční soustavy a kdo ví, jestli by se dříve nezhroutil vesmír. Můžete namítnout, k čemu že je metoda rozvoje determinantu dobrá? Pokud se v nějakém řádku nebo sloupci matice vyskytuje mnoho nul, můžeme zmenšit velikost matic, ze kterých počítáme determinant. Je-li na řádku nebo sloupci jediný nenulový prvek, dostáváme jedinou matici o jeden řádek a 48 Lineární algebra 4. Determinant sloupec menší. V příkladu 4.23 jsme mohli například před provedením kroku (2) provést rozvoj determinantu podle prvního sloupce a dále pracovat jen s maticí typu (3, 3). Před krokem (4) jsme mohli znovu provést rozvoj determinantu podle prvního sloupce: 1 2 4 −1 2 1 2 2 1 3 1 2 2 1 2 1 = 1 2 4 −1 0 −3 −6 4 0 1 −3 3 0 −3 −6 3 = 1 · −3 −6 4 1 −3 3 −3 −6 3 = − 1 −3 3 −3 −6 4 −3 −6 3 = = − 1 −3 3 0 −15 13 0 −15 12 = −1 · −15 13 −15 12 = 15 · 12 − 15 · 13 = −15. Výhoda se projeví výrazněji, pokud například čísla v prvním řádku či sloupci jsou nesoudělná a je výhodnější začít vyrábět nuly v jiném řádku nebo sloupci. Eliminační metodou v něm vytvoříme nuly a pak provedeme podle tohoto řádku nebo sloupce rozvoj determinantu. Součin de- terminantů 4.35. Věta (Laplaceova). Nechť A, B jsou čtvercové matice. Pak det A det B = det(A · B). Důkaz (pro hloubavé čtenáře). Uvědomíme si, že lze matici A převést pouze řádkovými úpravami na matici A , která je tvaru (4.2). Navíc můžeme provádět pouze takové úpravy, které nemění determinant: přičítání násobku jiného řádku k řádku podle (V5) věty 4.21 nemění determinant a pokud potřebujeme prohodit řádky, pak okamžitě pronásobíme jeden z nich konstantou −1. Tyto operace skutečně stačí na převedení matice na tvar (4.2), a přitom máme zaručeno, že det A = det A . Podle věty 3.55 existuje čtvercová matice P, pro kterou platí A = P · A. Dále převedeme matici B na matici B tvaru (4.2) pouze sloupcovými úpravami takovými, které nemění determinant. Máme tedy det B = det B a navíc podle poznámky 3.58 existuje matice Q taková, že B = B · Q. Platí det A det B = det A det B = det(A · B ). Poslední rovnost ověříme z definice maticového násobení a využijeme toho, že obě matice A i B jsou tvaru (4.2). Matice A · B je také tvaru (4.2) a pro její diagonální prvky gi,i platí, že gi,i = ai,i bi,i. Protože se determinanty matic tvaru (4.2) počítají jako součin prvků na diagonále, máme skutečně det A det B = det(A · B ). Na matici A · B provedeme stejné řádkové a sloupcové úpravy, jako jsme provedli na matice A resp. B. Dostaneme matici A · B , protože P · (A · B) · Q = (P · A) · (B · Q) = A · B . Provedené řádkové a sloupcové úpravy nemění determinant, takže matice A · B má stejný determinant jako matice A · B. Dostáváme výsledek det A det B = det A det B = det(A · B ) = det(A · B). Existence inverzní ma- tice 4.36. Poznámka. Na závěr kapitoly o determinantech předvedeme slíbený důkaz věty 3.50 o existenci inverzní matice pro každou regulární matici. Můžeme to považovat za první praktické využití pojmu determinant. Další využití najdeme v následující kapitole o soustavách lineárních rovnic a dále později při počítání objemů jistých těles. Větu 3.50 o existenci inverzní matice zde přepíšeme znovu. 4.37. Věta. Ke čtvercové matici A existuje inverzní matice právě tehdy, když A je regulární. Důkaz. Nechť nejprve A je singulární, tj. podle věty 4.27 je det A = 0. Ukážeme, že pak inverzní matice neexistuje. Kdyby existovala (označme ji A−1 ), pak musí A · A−1 = E a podle věty 4.35 je 1 = det E = det(A · A−1 ) = det A det A−1 = 0 · det A−1 = 0, 49 Lineární algebra 4. Determinant což je spor. Inverzní matice tedy k singulární matici neexistuje. Nechť nyní A je regulární. Sestrojíme matici A−1 = 1 det A BT , kde B = (Di,j) je matice doplňků k matici A. Ukážeme, že takto sestrojená A−1 je inverzní matice. Musíme tedy ověřit A · A−1 = E a dále A−1 · A = E. Je-li B = (Di,j), pak samozřejme je BT = (Dj,i). Podle definice součinu matic 3.34 vypočítáme prvek ei,k matice A · A−1 : ei,k = n j=1 ai,j 1 det A Dk,j = 1 det A ai,1Dk,1 +ai,2Dk,2 +· · ·+ai,nDk,n =    1 det A det A = 1 pro i = k, 1 det A · 0 = 0 pro i = k. Zde jsme využili větu o rozvoji determinantu podle i-tého řádku, viz poznámku 4.33. Zjišťujeme, že prvky ei,k jsou v souladu s definicí jednotkové matice 3.44. Rovnost A−1 · A = E bychom dokazovali podobně. Použili bychom větu o rozvoji i-tého sloupce namísto řádku. 4.38. Věta. Nechť A je regulární matice. Pak det A−1 = 1/ det A. Důkaz. Důkaz jsme vlastně už provedli v první části důkazu předchozí věty. Zopakujeme si to. Protože E = A · A−1 , musí podle věty 4.35 být 1 = det E = det A det A−1 . Z toho přímo plyne dokazovaný vzorec. 4.39. Poznámka. Důkaz věty 4.37 nám dává návod, jak sestrojit inverzní matici k matici A. Je to vlastně vedle eliminační metody popsané v příkladu 3.53 další metoda hledání inverzní matice. Můžeme ji říkat „metoda hledání inverzní matice pomocí doplňků . Uvědomíme si ale, že pro velké matice je eliminační metoda podstatně účelnější než metoda pomocí doplňků, která vyžaduje spočítat n2 determinantů matic typu (n − 1, n − 1) a ještě spočítat det A. V následujících příkladech si proto tuto metodu ilustrujeme jen na malých maticích. 4.40. Příklad. Najdeme inverzní matici k matici A = a b c d . Označme B matici doplňků k matici A. V tomto případě se doplňky dobře počítají, protože se jedná o determinanty matic typu (1, 1): B = d −c −b a , A−1 = 1 det A BT = 1 ad − bc d −b −c a . 4.41. Příklad. Najdeme inverzní matici ke stejné matici, jako v příkladu 3.53, tj. k matici A =   1 2 3 −1 0 1 2 2 1   . Doplňky nyní budeme počítat z determinantů matic typu (2, 2), což už nám dá trochu práce. B =           + 0 1 2 1 − −1 1 2 1 + −1 0 2 2 − 2 3 2 1 + 1 3 2 1 − 1 2 2 2 + 2 3 0 1 − 1 3 −1 1 + 1 2 −1 0           =   −2 3 −2 4 −5 2 2 −4 2   , det A = −2, A−1 = 1 det A BT = − 1 2   −2 4 2 3 −5 −4 −2 2 2   . Výsledek můžeme srovnat s výsledkem v příkladu 3.53. 50 5. Soustavy lineárních rovnic 5.1. Definice. Nechť A je matice reálných čísel typu (m, n), nechť dále x je jednosloupcová matice symbolů   x1 ... xn   typu (n, 1) a b je matice reálných čísel   b1 ... bm   typu (m, 1). Pak maticovou rovnost A x = b navýváme soustavou m lineárních rovnic o n neznámých. Matici A nazýváme maticí soustavy a vektor bT = (b1, . . . , bm) nazýváme vektorem pravých stran. Připíšeme-li k matici soustavy do dalšího sloupce matici b oddělenou (pouze pro přehlednost) svislou čarou, dostáváme matici (A|b) typu (m, n+1), kterou nazýváme rozšířenou maticí soustavy. 5.2. Definice. Řešením soustavy A x = b je takový vektor a = (α1, α2, . . . , αn) ∈ Rn , pro který platí: dosadíme-li hodnoty αi za symboly xi, pak je splněna požadovaná maticová rovnost, tj. A ·     α1 α2 ... αn     =     b1 b2 ... bm     . (5.1) Řešit soustavu A x = b znamená nalézt všechna její řešení, tj. nalézt podmnožinu Rn všech řešení této soustavy. 5.3. Poznámka. Všimneme si, že z historických důvodů se v rovnosti A x = b značí jednosloupcové matice malým písmenem podobně, jako vektory. Často se na tyto matice zjednodušeně díváme jako na prvky z Rn nebo Rm , jen nesmíme zapomenout, že složky těchto uspořádaných m-tic a n-tic v kontextu rovnosti A x = b píšeme do sloupce a nikoli do řádku. Matice x může místo symbolů x1, x2, . . . , xn obsahovat i jiné symboly, například x, y, z. Frobeniova věta 5.4. Věta (Frobeniova). Soustava A x = b má řešení právě tehdy, když hod A = hod(A|b), tj. když hodnost matice soustavy se rovná hodnosti rozšířené matice soustavy. Důkaz. Vektor a = (α1, . . . , αn) je řešením soustavy A x = b právě tehdy, když platí (5.1). To znamená, že sloupec b je lineární kombinací sloupců matice A s koeficienty α1, α2, . . . , αn. To platí právě tehdy, když hod AT bT = hod AT . Protože platí věta 3.31, je Frobeniova věta dokázána. 5.5. Poznámka. V úvodní kapitole o Gaussově eliminační metodě jsme vlastně nevědomky vyslovili Frobeniovu větu. V této kapitole jsme si říkali, jak poznáme, že soustava má řešení. Mluvili jsme tam o tom, že soustava nemá řešení právě tehdy, když poslední řádek rozšířené matice soustavy po eliminaci je tvaru (0 0 · · · 0 | c), c = 0. Vzpomeneme-li si na metodu počítání hodnosti z příkladu 3.14, vidíme, že existence takového řádku je ekvivalentní s tím, že rozšířená matice soustavy má o jedničku větší hodnost, než matice soustavy. Uvědomíme si ještě, že hodnost rozšířené matice soustavy může být buď o jedničku větší nebo přímo rovna hodnosti matice soustavy. Žádná jiná možnost pro hodnosti těchto matic neexistuje. 5.6. Definice. Nechť A x = b je soustava m lineárních rovnic o n neznámých a C x = d je soustava k lineárních rovnic o stejném počtu n neznámých. Říkáme, že tyto soustavy jsou ekvivalentní, pokud obě soustavy mají stejné množiny řešení. 51 Lineární algebra 5. Soustavy lineárních rovnic Princip eliminační metody 5.7. Poznámka. Gaussova eliminační metoda řešení soustav lineárních rovnic popsaná v úvodní kapitole spočívá vlastně v převedení soustavy A x = b na soustavu C x = d, která je s původní soustavou rovnic ekvivalentní. Přitom řešení soustavy C x = d lze nalézt snadněji, protože C je horní trojúhelníková matice (srovnejte větu 3.23). Tuto skutečnost zaznamenáme do následující věty. 5.8. Věta. Ke každé soustavě A x = b lze nalézt ekvivalentní soustavu C x = d, jejíž matice C je horní trojúhelníková. Důkaz. Podle věty 3.23 lze nalézt (C|d) takovou, že (A|b) ∼ (C|d), a přitom C je horní trojúhelníková matice. Protože operace „∼ zde označuje konečně mnoho elementárních kroků Gaussovy eliminační metody, a protože jsme si řekli v úvodní kapitole, že tyto elementární kroky nemění množinu řešení odpovídající soustavy, je soustava C x = d ekvivalentní s původní soustavou A x = b. Řešení ho- mogenní soustavy 5.9. Definice. Existuje-li v matici b aspoň jeden prvek nenulový, říkáme, že je soustava lineárních rovnic A x = b nehomogenní. Jsou-li všechny prvky v matici b nulové, nazýváme soustavu rovnic homogenní a zapisujeme ji takto: A x = o (symbolem o nyní značíme jednosloupcovou nulovou matici). 5.10. Věta. Množina všech řešení homogenní soustavy A x = o s n neznámými tvoří lineární podprostor lineárního prostoru Rn . Důkaz. Především množina řešení homogenní soustavy je neprázdná, protože nulový vektor v Rn je samozřejmě řešením této soustavy. Podle definice 1.17 musíme dále dokázat: (1) jsou-li u ∈ Rn a v ∈ Rn řešení soustavy A x = o, pak též u + v je řešením stejné soustavy. (2) je-li u ∈ Rn řešením soustavy A x = o a α ∈ R, pak též α u je řešením stejné soustavy. Pro účely důkazu označme symbolem uT jednosloupcovou matici, jejíž prvky odpovídají složkám vektoru u. Podobně vT je sloupec vzniklý z vektoru v. Protože u a v jsou řešení soustavy A x = o, platí: A uT = o a A vT = o. Máme dokázat, že A (uT + vT ) = o a A (α uT ) = o. Podle věty 3.38 je A (uT + vT ) = A uT + A vT = o + o = o, A (α uT ) = α A uT = α o = o. 5.11. Příklad. Najdeme množinu všech řešení homogenní soustavy lineárních rovnic se šesti neznámými: x1 + x2 + 2x3 + 3x4 + 3x5 + 3x6 = 0 x1 + x2 + x3 + 3x4 + x5 + x6 = 0 2x1 + 2x2 + 2x3 + 6x4 + 2x5 + 8x6 = 0 Eliminujeme matici soustavy (vektor pravých stran je nulový, takže je zbytečné jej psát).   1 1 2 3 3 3 1 1 1 3 1 1 2 2 2 6 2 8   ∼   1 1 2 3 3 3 0 0 −1 0 −2 −2 0 0 −2 0 −4 2   ∼   1 1 2 3 3 3 0 0 1 0 2 2 0 0 0 0 0 6   . Z poslední rovnice budeme počítat x6, z předposlední rovnice x3 a z první rovnice x1. Hodnoty neznámých x2, x4, x5 mohou být libovolné. Zaveďme pro ně parametry x2 = t, x4 = u, x5 = v. Z poslední rovnice vychází jedině x6 = 0, z předposlední rovnice máme x3 = −2v a konečně z první rovnice dostáváme x1 = −t + 4v − 3u − 3v = −t + v − 3u. Výsledek sumarizujeme takto: (x1, x2, x3, x4, x5, x6) = (−t + v − 3u, t, −2v, u, v, 0) = = t (−1, 1, 0, 0, 0, 0) + u (−3, 0, 0, 1, 0, 0) + v (1, 0, −2, 0, 1, 0). Z tohoto zápisu vyplývá, že množina všech řešení dané homogenní soustavy je množinou všech lineárních kombinací uvedených tří vektorů, což můžeme zapsat pomocí lineárního obalu takto: M0 = (−1, 1, 0, 0, 0, 0), (−3, 0, 0, 1, 0, 0), (1, 0, −2, 0, 1, 0) . 52 Lineární algebra 5. Soustavy lineárních rovnic 5.12. Poznámka. Protože uvedené tři vektory z výsledku příkladu 5.11 jsou lineárně nezávislé, tvoří jednu z možných bází prostoru M0. To se nestalo náhodou, ale platí to vždy, jak ukazuje následující věta. 5.13. Věta. Nechť A x = o je homogenní soustava lineárních rovnic o n neznámých, k = n−hod A. Pak existuje k lineárně nezávislých vektorů u1, u2, . . . , uk z Rn takových, že pro množinu M0 všech řešení soustavy A x = o platí M0 = u1, u2, . . . , uk . Vektory u1, u2, . . . , uk tvoří jednu z možných bází lineárního prostoru všech řešení M0. Důkaz. Vektory u1, u2, . . . , uk najdeme analogicky, jako jsme to udělali v příkladu 5.11. Podle poznámky 3.24 je počet rovnic soustavy po eliminaci roven hod A a je roven počtu neznámých, které můžeme z rovnic vypočítat. Ostatních k = n − hod A neznámých xi1 , xi2 , . . . , xik může nabývat libovolných hodnot a zaveďme pro ně parametry xi1 = p1, xi2 = p2, . . . , xik = pk. Všechna řešení získáme například dosazovací metodou použitou na rovnice po eliminaci (začínáme poslední rovnicí a končíme první). Z tohoto řešení můžeme vytknout parametry: (x1, x2, . . . , xn) = p1 u1 + p2 u2 + · · · + pk uk (5.2) a dostáváme hledané vektory u1, u2, . . . , uk. Z uvedené rovnosti a z definice lineárního obalu 2.29 přímo plyne, že pro množinu všech řešení platí M0 = u1, u2, . . . , uk . Zbývá dokázat, že vektory u1, u2, . . . , uk jsou lineárně nezávislé. Označme u1 ∈ Rk , u2 ∈ Rk , . . . , uk ∈ Rk ty části vektorů u1, u2, . . . , uk, které obsahují jen složky i1, i2, . . . , ik. Protože platí rovnost (5.2) a také platí označení xi1 = p1, xi2 = p2, . . . , xik = pk, dostáváme u1 = (1, 0, 0, . . . , 0), u2 = (0, 1, 0, . . . , 0), . . . , uk = (0, 0, 0, . . . , 1). Toto jsou lineárně nezávislé vektory. Z toho plyne, že jsou lineárně nezávislé i vektory u1, u2, . . . , uk, protože u1, u2, . . . , uk jsou jejich části. Závěrečné tvrzení věty, že vektory u1, u2, . . . , uk tvoří bázi prostoru řešení homogenní soustavy, plyne přímo z definice báze 2.42. 5.14. Věta. Nechť M0 je lineární prostor všech řešení homogenní soustavy lineárních rovnic A x = o s n neznámými. Pak dim M0 = n − hod A. Důkaz. Věta je přímým důsledkem předchozí věty. 5.15. Poznámka. Nechť n je počet neznámých homogenní soustavy A x = o. Pak z věty 5.14 plyne tento důsledek: hod A = n pak soustava má jen nulové řešení, hod A < n pak soustava má nekonečně mnoho řešení. 5.16. Poznámka. Když jsme procvičovali definici lineární závislosti a nezávislosti (viz příklady za definicí 2.7 a 2.9), zadání vždy vedlo na homogenní soustavu lineárních rovnic, která má vždy aspoň nulové řešení. V příkladech šlo o to, zda soustava má i jiné než nulové řešení, tj. zda hodnost matice soustavy je menší než počet neznámých. Řešení ne- homogenní soustavy 5.17. Definice. Nechť A x = b je nehomogenní soustava lineárních rovnic o n neznámých a v ∈ Rn je nějaké jedno její řešení. Takovému řešení v říkáme partikulární řešení nehomogenní soustavy. Pokud zaměníme matici b za nulovou matici stejného typu, dostáváme homogenní soustavu A x = o, kterou nazýváme přidruženou homogenní soustavou k soustavě A x = b. 5.18. Věta. (1) Nechť v je partikulární řešení nehomogenní soustavy A x = b a u je libovolné řešení přidružené homogenní soustavy A x = o. Pak v + u je také řešením soustavy A x = b. (2) Nechť v a w jsou dvě partikulární řešení nehomogenní soustavy A x = b. Pak v − w je řešením přidružené homogenní soustavy A x = o. Důkaz. Označme (stejně jako v důkazu věty 5.10) symbolem vT jednosloupcovou matici, která obsahuje složky vektoru v. Analogicky označme uT a wT . (1) Podle předpokladu platí A vT = b, A uT = o. Pro součet v + u pak platí A (vT + uT ) = A vT + A uT = b + o = b. (2) Podle předpokladu platí A vT = b, A wT = b. Pro rozdíl v − w pak platí A (vT − wT ) = A vT − A wT = b − b = o. 53 Lineární algebra 5. Soustavy lineárních rovnic 5.19. Věta. Nechť v je partikulární řešení soustavy A x = b a M0 je lineární prostor všech řešení přidružené homogenní soustavy A x = o. Pak pro množinu M všech řešení soustavy A x = b platí M = v + u; u ∈ M0 . Důkaz. Z vlastnosti (1) věty 5.18 plyne, že {v + u; u ∈ M0} ⊆ M. Stačí dokázat obrácenou inkluzi. Pokud w ∈ M, pak podle vlastnosti (2) věty 5.18 existuje u = w−v ∈ M0, takže w ∈ {v+u; u ∈ M0}. Platí tedy i obrácenná inkluze. 5.20. Poznámka. Množinu všech řešení nehomogenní soustavy lineárních rovnic zapisujeme většinou zjednodušeně jako součet partikulárního řešení a lineárního prostoru všech řešení přidružené homogenní soustavy takto: M = v + M0 = v + u1, u2, . . . , uk . (5.3) Řešit nehomogenní soustavu tedy znamená najít partikulární řešení v a dále najít k lineárně nezávislých řešení přidružené homogenní soustavy u1, u2, . . . , uk (k je rovno počtu neznámých mínus hodnost matice soustavy). Výsledek je obvyklé psát ve tvaru (5.3). Strojové řešení soustav 5.21. Poznámka. Při strojovém zpracování rozsáhlých soustav většinou jde o to najít jedno partikulární řešení a bázi prostoru řešení přidružené homogenní soustavy. Přitom není nutné programovat symbolické výpočty, jako je například vytýkání parametrů podle rovnosti (5.2). Můžeme na to jít jinak. Nejprve eliminujeme rozšířenou matici soustavy na horní trojúhelníkovou a rozhodneme, které sloupce matice odpovídají proměnným, které budeme z rovnic počítat (většinou podle prvního nenulového prvku v každém řádku). Ostatní sloupce označíme i1, i2, . . . , ik jako v důkazu věty 5.13. Nechť c ∈ Rk je vektor hodnot řešení ve složkách i1, i2, . . . , ik. Volíme nejprve c = (0, 0, . . . , 0) a dopočítáme z rovnic ostatní složky řešení. Dostáváme partikulární řešení v. Dále zaměníme vektor pravých stran za nulový vektor (přecházíme k přidružené homogenní soustavě). Volíme postupně c = (1, 0, . . . , 0), c = (0, 1, . . . , 0), . . . , c = (0, 0, . . . , 1) (5.4) a pro každé takové zadání vektoru c dopočítáme ostatní složky vektoru řešení. Dostáváme tak postupně vektory u1, u2, . . . , uk. Množinu všech řešení pak můžeme zapsat stejně, jako ve vzorci (5.3). 5.22. Poznámka. Na malých modelových příkladech (soustavy s malým počtem rovnic a neznámých) většinou nemusíme použít strojové zpracovámí a můžeme řešení počítat „ručně . Pak se jeví výhodnější zavést parametry a vytknout je (podobně jako v příkladu 5.11) a nedělat při výpočtu zbytečné přechody na přidruženou homogenní soustavu. Oba dva přístupy (strojový i lidský) si ukážeme na následujícím příkladě. 5.23. Příklad. Najdeme množinu všech řešení soustavy lineárních rovnic se šesti neznámými: x1 + x2 + 2x3 + 3x4 + 3x5 + 3x6 = 1 x1 + x2 + x3 + 3x4 + x5 + x6 = − 1 2x1 + 2x2 + 2x3 + 6x4 + 2x5 + 8x6 = 10 Eliminujeme rozšířenou matici soustavy.   1 1 2 3 3 3 1 1 1 1 3 1 1 −1 2 2 2 6 2 8 10   ∼   1 1 2 3 3 3 1 0 0 −1 0 −2 −2 −2 0 0 −2 0 −4 2 8   ∼   1 1 2 3 3 3 1 0 0 1 0 2 2 2 0 0 0 0 0 6 12   ∼   1 1 2 3 3 3 1 0 0 1 0 2 2 2 0 0 0 0 0 1 2   . Nejprve ukážeme doporučený postup pro „ruční počítání . Z poslední rovnice budeme počítat x6, z předposlední rovnice x3 a z první rovnice x1. Hodnoty neznámých x2, x4, x5 mohou být libovolné. Zaveďme pro ně parametry x2 = t, x4 = u, x5 = v. Z poslední rovnice máme x6 = 2, z předposlední rovnice x3 = 2 − 2v − 2 · 2 = −2 − 2v a konečně z první rovnice dostáváme x1 = 1 − t − 2(−2 − 2v) − 3u − 3v − 3 · 2 = −1 − t + v − 3u. Výsledek sumarizujeme takto: (x1, x2, x3, x4, x5, x6) = (−1 − t + v − 3u, t, −2 − 2v, u, v, 2) = = (−1, 0, −2, 0, 0, 2) + t (−1, 1, 0, 0, 0, 0) + u (−3, 0, 0, 1, 0, 0) + v (1, 0, −2, 0, 1, 0). Z tohoto zápisu vyplývá, že množina všech řešení dané nehomogenní soustavy je rovna M = (−1, 0, −2, 0, 0, 2) + (−1, 1, 0, 0, 0, 0), (−3, 0, 0, 1, 0, 0), (1, 0, −2, 0, 1, 0) . Vektor (−1, 0, −2, 0, 0, 2) je partikulárním řešením dané nehomogenní soustavy a vektory (−1, 1, 0, 0, 0, 0), (−3, 0, 0, 1, 0, 0), (1, 0, −2, 0, 1, 0) tvoří bázi prostoru řešení přidružené homogenní soustavy. 54 Lineární algebra 5. Soustavy lineárních rovnic 5.24. Příklad. Je dána stejná soustava lineárních rovnic jako v příkladu 5.23. Ukážeme postup řešení vhodný pro strojové zpracování. Po eliminaci dostáváme matici   1 ↓ 1 2 ↓ 3 ↓ 3 3 1 0 0 1 0 2 2 2 0 0 0 0 0 1 2   . Šipkami jsou označeny sloupce, které odpovídají neznámým s libovomými hodnotami. Do nich budeme dosazovat postupně hodnoty (0, 0, 0) při daném vektoru pravých stran a dále (1, 0, 0), (0, 1, 0) a (0, 0, 1) při nulovém vektoru pravých stran. V prvním případě dopočítáme složky partikulárního řešení v. Víme, že je v = (?, 0, ?, 0, 0, ?). Zbylé složky označené otazníkem spočítáme z následující soustavy (dosazením nul sloupce vyznačené šipkami vymizí):   1 2 3 1 0 1 2 2 0 0 1 2   ∼   1 2 0 −5 0 1 0 −2 0 0 1 2   ∼   1 0 0 −1 0 1 0 −2 0 0 1 2   , je tedy v = (−1, 0, −2, 0, 0, 2). Nyní budeme počítat neznámé složky pro u1 = (?, 1, ?, 0, 0, ?). Na pravé straně jsou nyní nuly, protože počítáme řešení přidružené homogenní soustavy. Po dosazení jedničky ve druhém sloupci a převedení konstant na pravou stranu rovnic dostáváme nakonec na pravé straně „mínus druhý sloupec , tj.   1 2 3 −1 0 1 2 0 0 0 1 0   ∼   1 2 0 −1 0 1 0 0 0 0 1 0   ∼   1 0 0 −1 0 1 0 0 0 0 1 0   , je tedy u1 = (−1, 1, 0, 0, 0, 0). Všimneme si, že jsme vlastně řešili stejnou soustavu tří rovnic o třech neznámých, jako v případě vektoru v, jen pravá strana se lišila. Podobné by to bylo i pro ostatní vektory u2, u3. Je výhodné napsat všechny vektory pravých stran vedle sebe za svislou čáru a řešit tak všechny soustavy najednou. Pro úplnost vyřešíme znovu i v a u1. v = (?, 0, ?, 0, 0, ?), u1 = (?, 1, ?, 0, 0, ?), u2 = (?, 0, ?, 1, 0, ?), u3 = (?, 0, ?, 0, 1, ?),   1 2 3 1 −1 −3 −3 0 1 2 2 0 0 −2 0 0 1 2 0 0 0   ∼   1 2 0 −5 −1 −3 −3 0 1 0 −2 0 0 −2 0 0 1 2 0 0 0   ∼   1 0 0 −1 −1 −3 1 0 1 0 −2 0 0 −2 0 0 1 2 0 0 0   , v = (−1, 0, −2, 0, 0, 2), u1 = (−1, 1, 0, 0, 0, 0), u2 = (−3, 0, 0, 1, 0, 0), u3 = (1, 0, −2, 0, 1, 0), M = (−1, 0, −2, 0, 0, 2) + (−1, 1, 0, 0, 0, 0), (−3, 0, 0, 1, 0, 0), (1, 0, −2, 0, 1, 0) . Nejednoznačnost zápisu řešení 5.25. Poznámka. Již v úvodní kapitole o Gaussově eliminační metodě jsme zmínili, že množinu řešení soustavy lineárních rovnic neumíme popsat jednoznačným způsobem. Výjimkou je pouze případ, kdy má soustava jediné řešení. Víme totiž, že každý netriviální lineární podprostor má nekonečně mnoho bází a má-li soustava více řešení, pak i partikulární řešení může každý zapsat jiné. K různým zápisům téže množiny řešení můžeme dospět při výpočtu třeba tak, že volíme rozdílnou skupinu neznámých, které mohou nabývat libovolných hodnot. I při stejné skupině těchto neznámých nás nikdo nenutí, abychom volili výchozí hodnoty pro tyto neznámé jen jedničky a nuly způsobem, jak bylo uvedeno v (5.4). V modelových řešeních modelových příkladů ze skript se můžeme setkat někdy i s jinými výchozími hodnotami volenými tak, aby výsledek vyšel bez použití zlomků pouze s malými celými čísly. Tuto dovednost nebudeme v praktických příkladech (které nejsou modelové) potřebovat, takže nás nemusí frustrovat, že nám vycházejí ve výsledcích zlomky. Metodu, jak získat výsledek za každou cenu zapsaný pomocí malých celých čísel, ve svém textu nezmiňuji, protože ji nepovažuji za důležitou. Může nás ale zajímat, zda náš výsledek a výsledek, který třeba najdeme ve skriptech, popisují stejnou množinu řešení. Jak to poznáme? Především báze prostoru řešení přidružené homogenní soustavy musí obsahovat v obou výsledcích podle věty 2.59 stejný počet prvků. Ověříme ještě, že jsou v obou výsledcích skutečně báze, tj. že jsou vektory popisující prostor řešení přidružené homogenní soustavy skutečně lineárně nezávislé. Dále zjistíme, zda oba výsledky popisují stejný podprostor řešení přidružené homogenní soustavy. Jedna z možností, jak to zjistit, je dosadit do soustavy (jednodušeji se dosazuje do soustavy po eliminaci) všechny vektory prověřované báze prostoru řešení přidružené homogenní soustavy. Měl by pro všechny případy vyjít nulový vektor pravých stran. Pak dosadíme ještě partikulární řešení a měl by vyjít vektor pravých stran dané soustavy. 55 Lineární algebra 5. Soustavy lineárních rovnic 5.26. Poznámka. Co uděláme, pokud se nám dostanou do ruky dva zápisy řešení nějaké soustavy lineárních rovnic, a přitom nemáme k dispozici původní soustavu a nemůžeme tedy dosazovat? Jak v tomto případě poznáme, že oba zápisy popisují stejné řešení? Jsou dány třeba tyto zápisy: v + u1, u2, . . . , uk ? = w + g1, g2, . . . , gk Nejprve ověříme lineární nezávislost vektorů u1, u2, . . . , uk a lineární nezávislost vektorů g1, g2, . . . , gk. Dále zjistíme, zda jsou rovny lineární obaly. Ověříme, zda gi ∈ u1, u2, . . . , uk , ∀i ∈ {1, . . . , k}. Jinými slovy je třeba zjistit, zda gi se dá zapsat jako lineární kombinace vektorů u1, u2, . . . , uk. Tím máme zaručenu rovnost lineárních obalů. Díky vlastnosti (3) věty 2.64 není třeba ověřovat ui ∈ g1, g2, . . . , gk . Nakonec zjistíme, zda obě partikulární řešení popisují stejnou množinu řešení třeba podle vlastnosti (2) věty 5.18 tímto testem: v − w ∈ u1, u2, . . . , uk . C =                u1 u2 ... uk g1 g2 ... gk v − w                Ověřování gi ∈ u1, u2, . . . , uk , ∀i ∈ {1, . . . , k} vede na k soustav lineárních rovnic, což je poměrně pracné (pokud ovšem nejsou koeficienty lineární kombinace snadno vidět díky přítomnosti nul ve složkách vektorů). Je proto někdy výhodnější použít větu 3.13. Podle této věty hodnost matice C zapsané zde vpravo musí být rovna k. To je postačující pro rovnost množin řešení. Protože pro velká k je matice C „příliš vysoká , je někdy výhodné místo toho počítat hodnost matice CT . Podle věty 3.31 dostaneme stejný výsledek, ale navíc šetříme papírem a dalšími kancelářskými technologiemi. 5.27. Příklad. Prověříme, zda množina M1 = (1, 2, −4, −1, 1, 2) + (7, 1, −4, −2, 2, 0), (−8, 3, −2, 2, 1, 0), (2, −2, −6, 1, 3, 0) je rovna množině M z příkladu 5.24. Díky tomu, že naše řešení z příkladu 5.24 obsahuje na pozicích 2, 4 a 5 systematicky rozmístěné nuly a jedničky, můžeme okamžitě pohledem do těchto pozic psát následující koeficienty lineárních kombinací: (7, 1, −4, −2, 2, 0) = 1 (−1, 1, 0, 0, 0, 0) − 2 (−3, 0, 0, 1, 0, 0) + 2 (1, 0, −2, 0, 1, 0), (−8, 3, −2, 2, 1, 0) = 3 (−1, 1, 0, 0, 0, 0) + 2 (−3, 0, 0, 1, 0, 0) + 1 (1, 0, −2, 0, 1, 0), (2, −2, −6, 1, 3, 0) = −2 (−1, 1, 0, 0, 0, 0) + 1 (−3, 0, 0, 1, 0, 0) + 3 (1, 0, −2, 0, 1, 0), (1, 2, −4, −1, 1, 2) = (−1, 0, −2, 0, 0, 2) + 2 (−1, 1, 0, 0, 0, 0) − 1 (−3, 0, 0, 1, 0, 0) + 1 (1, 0, −2, 0, 1, 0). Tyto rovnosti platí i v ostatních složkách (nejen ve složkách 2, 4 a 5) a můžeme tedy prohlásit, že M1 = M. Pro porovnání zkusíme ještě metodu počítání hodnosti matice C z poznámky 5.26. Nejprve musíme ověřit, zda jsou vektory (7, 1, −4, −2, 2, 0), (−8, 3, −2, 2, 1, 0), (2, −2, −6, 1, 3, 0) lineárně nezávislé (například eliminací třířádkové matice obsahující tyto vektory). Zjistíme, že jsou lineárně nezávislé. Pak spočítáme hodnost matice C: CT =         −1 −3 1 7 −8 2 −2 1 0 0 1 3 −2 −2 0 0 −2 −4 −2 −6 2 0 1 0 −2 2 1 1 0 0 1 2 1 3 −1 0 0 0 0 0 0 0         ∼       −1 −3 1 7 −8 2 −2 0 −3 1 8 −5 0 −4 0 1 0 −2 2 1 1 0 0 −2 −4 −2 −6 2 0 0 1 2 1 3 −1       ∼   −1 −3 1 7 −8 2 −2 0 −3 1 8 −5 0 −4 0 0 1 2 1 3 −1   . Je hod C = 3, takže platí M = M1. Soustavy se čtvercovou maticí 5.28. Poznámka. Je-li A čtvercová matice, pak je výhodné při řešení soustavy A x = b spočítat det A. Pro det A = 0 je hod A rovna počtu neznámých, tj. matice A je regulární a soustava má jediné řešení. Podle věty 4.37 existuje inverzní matice, takže po vynásobení rovnosti A x = b inverzní maticí A−1 zleva máme okamžitě řešení této soustavy x = A−1 b. Navíc můžeme použít pro zjištění jednotlivých složek řešení tzv. Cramerovo pravidlo (viz následující větu). Pro det A = 0 je hod A menší než počet neznámých. Pokud má tato soustava podle Frobeniovy věty 5.4 řešení, pak po eliminaci a odstranění nulových řádků dostáváme soustavu, která už nemá čtvercovou matici. V tomto případě nezbývá nic jiného, než použít postup pro nalezení všech řešení, který byl již vyložen dříve. 56 Lineární algebra 5. Soustavy lineárních rovnic 5.29. Věta (Cramerovo pravidlo). Nechť A je regulární čtvercová matice. Pak pro i-tou složku řešení soustavy A x = b platí αi = det Bi det A , kde matice Bi je shodná s maticí A až na i-tý sloupec, který je zaměněn za sloupec pravých stran. Důkaz. Víme, že platí x = A−1 b. Podle důkazu věty 4.37 o existenci inverzní matice platí A−1 = (ci,j) = Dj,i det A , kde Di,j je matice doplňků k matici A. Nechť bi jsou složky sloupce b. Podle definice maticového násobení je αi = n j=1 ci,j bj = n j=1 Dj,i det A bj = 1 det A D1,i b1 + D2,i b2 + · · · + Dk,i bk = det Bi det A . V poslední rovnosti jsme využili větu o rozvoji determinantu matice Bi podle i-tého sloupce, viz poznámku 4.33. 5.30. Příklad. Při řešení soustavy   1 2 3 3 4 5 5 6 8   ·   x1 x2 x3   =   10 11 12   použijeme Cramerovo pravidlo. Dostáváme: x1 = 1 D 10 2 3 11 4 5 12 6 8 , x2 = 1 D 1 10 3 3 11 5 5 12 8 , x3 = 1 D 1 2 10 3 4 11 5 6 12 , kde D = 1 2 3 3 4 5 5 6 8 . Vypočítáním čtyř determinantů z uvedených matic typu (3,3) dostáváme výsledek x1 = 18 −2 = −9, x2 = −19 −2 = 19 2 , x3 = 0 −2 = 0, (x1, x2, x3) = −9, 19 2 , 0 . 5.31. Poznámka. Cramerovo pravidlo se nejeví pro výpočet řešení soustavy s regulární maticí příliš účelné. Potřebujeme spočítat n + 1 determinantů matic typu (n, n), což je pro velká n náročnější, než spočítat inverzní matici eliminační metodou. Výhodná může být tato metoda pouze tehdy, když nepotřebujeme znát všechny složky řešení, ale jen některé. Například můžeme mít nějaký fyzikální model vyjádřený rozsáhlou soustavou lineárních rovnic, přičemž z mnoha stovek výstupních veličin (tj. složek řešení) nás zajímá jen pár. 5.32. Příklad. Budeme řešit soustavu lineárních rovnic x + py + z = 1 x + 2y + z = − 1 y + pz = − 1 Rozlišíme různé množiny řešení této soustavy podle hodnot reálného parametru p. Determinant matice soustavy je roven D = p (2 − p), takže pro p = 0 a p = 2 je matice soustavy regulární a soustava má jediné řešení. Například Cramerovým pravidlem zjistíme toto řešení: x = 1 D 1 p 1 −1 2 1 −1 1 p = p + 1 2 − p , y = 1 D 1 1 1 1 −2 0 0 −1 p = 2 p − 2 , z = 1 D 1 p 1 1 2 −1 0 1 −1 = 1 2 − p . Pro p = 0 a p = 2 musíme řešit soustavu individuálně. p = 0 :   1 0 1 1 1 2 1 −1 0 1 0 −1   ∼ 1 0 1 1 0 1 0 −1 , při z = t, vychází y = −1, x = 1 − t, tj. (x, y, z) = (1 − t, −1, t) = (1, −1, 0) + t(−1, 0, 1), množina řešení: M = (1, −1, 0) + (−1, 0, 1) . p = 2 :   1 2 1 1 1 2 1 −1 0 1 2 −1   ∼ 1 2 1 1 0 0 0 −1 , podle Frobeniovy věty soustava pro p = 2 nemá řešení. 57 Lineární algebra 5. Soustavy lineárních rovnic Dodatky k řešení soustav 5.33. Poznámka. Existuje ještě jeden přístup, jak lze hledat bázi prostoru řešení homogenní soustavy. Tento přístup se může hodit při strojovém zpracování a opírá se o následující větu. 5.34. Věta. Nechť homogenní soustava lineárních rovnic Ax = o má matici soustavy ve tvaru A = (E|C), kde E je jednotková matice typu (m, m) a C je libovolná matice typu (m, k). Pak existuje báze řešení této soustavy b1, b2, . . . , bk, která má tvar:     b1 b2 ... bk     = (−CT |E ), kde E je jednotková matice typu (k, k). Důkaz. Nejprve překontrolujeme rozměry matic. Nechť počet neznámých soustavy je n, takže matice soustavy A je typu (m, n). Počet sloupců n této matice se skládá z m sloupců (matice E) a k sloupců (matice C). Je tedy n = m + k. Dimenze prostoru řešení je podle věty 5.14 rovna počtu neznámých minus hod A, což je n−m = k. To sedí. Skutečně matice B = (−CT |E ) má k řádků a tyto jsou lineárně nezávislé (díky matici E ). Matice B tedy může obsahovat řádky báze prostoru řešení. Stačí jen ověřit, že každý řádek matice B řeší soustavu Ax = o. Tj. stačí ověřit, že A · BT = O, kde O je nulová matice typu (m, k): A · BT = (E|C) · −C E = E · (−C) + C · E = −C + C = O. 5.35. Poznámka. Tato věta nám umožňuje rovnou napsat bázi řešení homogenní soustavy, pokud je matice soustavy v uvedeném tvaru. Dokonce, pokud matice soustavy není v uvedeném tvaru, je někdy možné jí eliminací do tohoto tvaru převést, tj. ekvivalentní soustava může mít tento tvar. Pokud ani ekvivalentní soustava nemá tento tvar, dá se prohozením pořadí neznámých dospět k požadovanému tvaru matice soustavy. V takovém případě je ovšem nutné před zapsáním báze prostoru řešení prohodit sloupce matice B = (−CT |E ) zpět. Místo dlouhého vysvětlování ukážeme použití věty na našem příkladu 5.23, ovšem budeme řešit jen přidruženou homogenní soustavu. 5.36. Příklad. Najdeme bázi prostoru řešení soustavy z příkladu 5.11. Eliminujeme matici soustavy:   1 1 2 3 3 3 1 1 1 3 1 1 2 2 2 6 2 8   ∼   1 1 2 3 3 3 0 0 −1 0 −2 −2 0 0 −2 0 −4 2   ∼   1 1 2 3 3 3 0 0 1 0 2 2 0 0 0 0 0 6   ∼   1 1 2 3 3 3 0 0 1 0 2 2 0 0 0 0 0 1   . Eliminujeme dále zpětným chodem, abychom ve sloupcích 1, 3 a 6 dostali jednotkové vektory:   1 1 2 3 3 3 0 0 1 0 2 2 0 0 0 0 0 1   ∼   1 1 2 3 3 0 0 0 1 0 2 0 0 0 0 0 0 1   ∼   1 1 0 3 −1 0 0 0 1 0 2 0 0 0 0 0 0 1   . Prohodíme druhý sloupec s třetím a poslední sloupec s novým třetím (měníme pořadí proměnných)   1 0 0 3 −1 1 0 1 0 0 2 0 0 0 1 0 0 0   a dostáváme matici podle předpokladu věty 5.34. Bázi řešení soustavy s takovou maticí můžeme podle této věty zapsat do matice, kde každý řádek obsahuje jeden bázický vektor:   −3 0 0 1 0 0 1 −2 0 0 1 0 −1 0 0 0 0 1   . Zpětně přehodíme poslední sloupec s třetím a druhý s novým třetím a dostáváme matici, obsahující (po řádcích) bázi řešení původní soustavy   −3 0 0 1 0 0 1 0 −2 0 1 0 −1 1 0 0 0 0   . 58 Lineární algebra 5. Soustavy lineárních rovnic Soustava lineárních soustav 5.37. Poznámka. Doc. Krajník ve svých skriptech o maticích [14] hned z kraje uvádí jednoduchý postřeh, který, když si uvědomíme, můžeme mít život s lineární algebrou snadnější. Násobíme-li matice A · X = B, pak sloupce matice B obsahují výsledky násobení A · odpovídající sloupec matice X. Uvažujme maticovou rovnost AX = B, ve které jsou dány matice A a B a hledáme matici X. Označme B = (bT 1 , . . . , bT k ), tj. matice má k sloupců. Stejný počet sloupců musí mít matice X (jinak by rovnost nemohla platit), takže X = (xT 1 , . . . xT k ). Hledání matice X pak přechází v hledání jejích sloupců x1, . . . , xk tak, že musejí být splněny současně tyto soustavy nehomogenních lineárních rovnic: A · xT 1 = bT 1 , A · xT 2 = bT 2 , . . . , A · xT k = bT k . Všechny tyto soustavy mají stejnou matici soustavy a jejich rozšířené matice soustav je možné eliminovat společně: (A|B) ∼ (A1|B1). Tyto dvě soustavy soustav AX = B a A1X = B1 jsou ekvivalentní, tj. mají stejnou množinu řešení, protože matice jedné soustavy vznikla z matice druhé soustavy eliminací. Všechny soustavy mají společnou přidruženou homogenní soustavu, takže její množinu řešení je možné hledat jen jednou. K jednotlivým vektorům pravých stran pak hledáme jen odpovídající partikulární řešení. 5.38. Příklad. Řešme maticovou rovnost   1 1 2 3 3 3 1 1 1 3 1 1 2 2 2 6 2 8   · X =   2 4 3 3 2 2 1 3 1 2 3 4   . Soustavu soustav řešíme eliminací:   1 1 2 3 3 3 2 4 3 3 1 1 1 3 1 1 2 2 1 3 2 2 2 6 2 8 1 2 3 4   ∼   1 1 2 3 3 3 2 4 3 3 0 0 1 0 2 2 0 2 2 0 0 0 2 0 4 −2 3 6 3 2   ∼   1 1 2 3 3 3 2 4 3 3 0 0 1 0 2 2 0 2 2 0 0 0 0 0 0 6 −3 −2 1 −2   . Přidruženou homogenní soustavu známe už z předchozích příkladů, takže víme, že její prostor řešení má bázi {(−1, 1, 0, 0, 0, 0), (−3, 0, 0, 1, 0, 0), (1, 0, −2, 0, 1, 0)}. Partikulární řešení budeme hledat pro každý sloupec pravých stran zvlášť. Počítat budeme poslední, třetí a první složku, v ostatních předpokládáme nuly. Pro sloupec (2, 0, −3)T máme řešení (3 2 , 0, 1, 0, 0, −1 2 ), pro sloupec (4, 2, −2)T máme řešení (−1 3 , 0, 8 3 , 0, 0, −1 3 ), pro sloupec (3, 2, 1)T máme řešení (−5 6 , 0, 5 3 , 0, 0, 1 6 ) a konečně pro sloupec (3, 0, −2)T máme řešení (8 3 , 0, 2 3 , 0, 0, −1 3 ). Zapíšeme-li tato řešení do sloupců vedle sebe, máme jedno z možných řešení pro hledanou matici X. Když k této matici přičteme matici, která bude mít čtyři stejné sloupce tvaru α (−1, 1, 0, 0, 0, 0)T +β (−3, 0, 0, 1, 0, 0)T +γ (1, 0, −2, 0, 1, 0)T , α, β, γ ∈ R, dostáváme zápis obecně všech matic X, které vyhovují zadané maticové rovnici. 5.39. Věta. Nechť A je regulární matice a B je libovolná matice se stejným počtem řádků. Rovnost A · X = B je ekvivalentní s (A|B) ∼ (E|X). Důkaz. Protože A je regulární, má soustava soustav AX = B jediné řešení. Eliminujme rozšířenou matici této soustavy soustav: (A|B) ∼ (E|X). Rozšířená matice (E|X) obsahuje vpravo od čáry řešení původní soustavy soustav AX = B právě tehdy, když (E|X) vznikla eliminací z původní rozšířené matice (A|B). 5.40. Poznámka. Podobným postupem můžeme snadno obhájit známou metodu výpočtu inverzní matice (A|E) ∼ (E|A−1 ). Vpravo od E máme řešení soustavy soustav AX = E, tj. máme tam inverzní matici. 5.41. Poznámka. Maticovou rovnici XA = B (při daných maticích A, B) bychom řešili například tak, že transponujeme obě strany rovnosti. Tím dostáváme AT · XT = BT a problém je převeden na tvar, se kterým už si víme rady. 5.42. Poznámka. Důkaz věty 6.31 (v následující kapitole) lze přeformulovat pomocí zde uvedené myšlenky soustavy soustav. To si dovolím přenechat čtenáři. Je to velmi názorné. 59 6. Více o lineárních prostorech konečné dimenze 6.1. Poznámka. V některých učebnicích, např. [7], se lineárním prostorům konečné dimenze říká vektorové prostory. V jiných učebnicích, např. [5], se pod pojmem vektorový prostor myslí obecný lineární prostor třeba i nekonečné dimenze. Vzhledem k této terminologické nejednotě nebudeme vůbec pojem vektorový prostor používat a budeme raději zdlouhavě mluvit o lineárních prostorech konečné dimenze. 6.2. Poznámka. Hlavním cílem této kapitoly je definice pojmu souřadnice vektoru vzhledem k bázi a pojem matice přechodu. Než se do toho pustíme, zmíníme ještě jednu větu o dimenzi průniku a sjednocení podprostorů. Věta 1.22 nám říká, že sjednocení dvou podprostorů nemusí být lineární prostor. Je proto výhodné formulovat následující definici. Spojení prostorů 6.3. Definice. Nechť L je lineární prostor, M a N jsou jeho podprostory. Množinu M ∪ N nazýváme spojením podprostorů M a N a značíme M ∨ N. 6.4. Poznámka. Podle věty 2.38 je M ∨ N nejmenší podprostor, který obsahuje všechny prvky z M i N dohromady. 6.5. Věta. Nechť L je lineární prostor, M a N jsou jeho podprostory. Pro podprostor M ∨ N platí: M ∨ N = {y + z; y ∈ M, z ∈ N}. Důkaz. Je-li x ∈ {y+z; y ∈ M, z ∈ N}, tj. x se dá rozepsat na součet prvku z M a prvku z N, pak podle definice lineárního obalu je x ∈ M ∪N = M ∨N. To dokazuje inkluzi {y+z; y ∈ M, z ∈ N} ⊆ M ∨N. Je-li x ∈ M ∨N = M ∪N , pak podle definice lineárního obalu existuje konečně mnoho prvků z M a konečně mnoho prvků z N takových, že x je lineární kombinací těchto prvků. Tuto lineární kombinaci rozdělíme na součet násobků prvků z M a součet násobků ostatních prvků (tedy prvků z N). První součet označíme y a druhý z. Protože M a N jsou podprostory, je podle věty 2.37 M = M, N = N, takže lineární kombinace prvků z M leží v M a podobně pro N. Máme tedy y ∈ M, z ∈ N. Protože x = y + z, je x ∈ {y + z; y ∈ M, z ∈ N}. To dokazuje obrácenou inkluzi. Dimenze průniku a spojení 6.6. Věta. Nechť L je lineární prostor konečné dimenze, M a N jsou jeho podprostory. Pak dim M + dim N = dim(M ∩ N) + dim(M ∨ N). Důkaz (pro hloubavé čtenáře). Nechť dim M = m, dim N = n, dim(M ∩ N) = k. Nechť b1, b2, . . . , bk je báze podprostoru M ∩N. Vzhledem k tomu, že M ∩N ⊆ M, lze lineárně nezávislé vektory b1, b2, . . . , bk doplnit o další prvky, aby dohromady tvořily bázi v M. Viz větu 2.51. Podobně lze doplnit b1, b2, . . . , bk o další prvky, aby tvořily bázi v N. Máme tedy báze M ∩ N: {b1, b2, . . . , bk}, báze M: {b1, b2, . . . , bk, ck+1, . . . , cm}, báze N: {b1, b2, . . . , bk, dk+1, . . . , dn}. Za této situace je množina B = {b1, b2, . . . , bk, ck+1, . . . , cm, dk+1, . . . , dn} bází podprostoru M ∨ N. Zdůvodníme proč. Ukážeme nejdříve, že B = M ∨ N. Protože B ⊆ M ∪ N, je B ⊆ M ∪ N = M ∨ N. Nyní ukážeme obrácenou inkluzi. Je-li x ∈ M ∨ N, pak podle věty 6.5 existují vektory y ∈ M a z ∈ N takové, že x = y + z. Vektor y lze zapsat jako lineární kombinaci prvků báze M a vektor z jako lineární kombinaci prvků báze N. Proto je vektor x lineární kombinací prvků množiny B a máme dokázánu obrácenou inkluzi M ∨ N ⊆ B . Nyní ukážeme, že B je lineárně nezávislá množina. Množina {b1, b2, . . . , bk, ck+1, . . . , cm} je lineárně nezávislá, protože je bází prostoru M. Množina {dk+1, . . . , dn} je také lineárně nezávislá, protože je podmnožinou báze prostoru N. Navíc pro všechny prvky di, i ∈ {k + 1, . . . , n} platí, že neleží v M, tedy di ∈ b1, b2, . . . , bk, ck+1, . . . , cm . Přidáním těchto prvků k vektorům b1, b2, . . . , bk, ck+1, . . . , cm zůstává rozšířená množina podle věty 2.39 lineárně nezávislá. Protože B je bází M ∨ N a je vidět, že B má m + n − k prvků, je dim(M ∨ N) = m + n − k. Dokazovaná rovnost nyní plyne z toho, že platí m + n = k + (m + n − k). 60 Lineární algebra 6. Více o lineárních prostorech konečné dimenze 6.7. Příklad. Jsou dány lineární podprostory M a N lineárního prostoru R5 pomocí lineárních obalů: M = (1, 2, 0, 1, 1), (1, 3, 1, 3, 4), (3, 5, 2, 4, 5) , N = (1, 1, 3, 4, 3), (1, 0, 2, 2, 0), (2, 1, 3, 2, 3), (0, 1, 2, 4, 3) . Najdeme bázi a dimenzi prostorů M, N, M ∩ N a M ∨ N. Podle věty 3.13 zachovává Gaussova eliminační metoda lineární obal řádků matice, takže budeme eliminovat následující matice: M :   1 2 0 1 1 1 3 1 3 4 3 5 2 4 5   ∼   1 2 0 1 1 0 1 1 2 3 0 −1 2 1 2   ∼   1 2 0 1 1 0 1 1 2 3 0 0 3 3 5   , N :     1 1 3 4 3 1 0 2 2 0 2 1 3 2 3 0 1 2 4 3     ∼     1 1 3 4 3 0 −1 −1 −2 −3 0 −1 −3 −6 −3 0 1 2 4 3     ∼     1 1 3 4 3 0 1 1 2 3 0 0 2 4 0 0 0 1 2 0     ∼   1 1 3 4 3 0 1 1 2 3 0 0 1 2 0   . Podle věty 3.22 jsou řádky matic zapsaných nejvíce vpravo lineárně nezávislé. Lineární obal těchto řádků zůstal zachován a je roven M, respektive N. Máme tedy: báze M : (1, 2, 0, 1, 1), (0, 1, 1, 2, 3), (0, 0, 3, 3, 5) , dim M = 3, báze N : (1, 1, 3, 4, 3), (0, 1, 1, 2, 3), (0, 0, 1, 2, 0) , dim N = 3. Vzhledem k tomu, že tři vektory, kterými je zadán podprostor M, jsou lineárně nezávislé, můžeme zapsat i jinou bázi M: {(1, 2, 0, 1, 1), (1, 3, 1, 3, 4), (3, 5, 2, 4, 5)}. Vektory, kterými je zadán podprostor N jsou lineárně závislé, takže netvoří bázi. Platí M ∨ N = M ∪ N = báze M ∪ báze N , takže bázi tohoto podprostoru najdeme eliminací následující matice: M ∨ N :           1 2 0 1 1 0 1 1 2 3 0 0 3 3 5 1 1 3 4 3 0 1 1 2 3 0 0 1 2 0           ∼         1 2 0 1 1 0 1 1 2 3 0 0 3 3 5 0 −1 3 3 2 0 0 1 2 0         ∼         1 2 0 1 1 0 1 1 2 3 0 0 3 3 5 0 0 4 5 5 0 0 1 2 0         ∼         1 2 0 1 1 0 1 1 2 3 0 0 3 3 5 0 0 0 −3 5 0 0 0 −3 5         ∼      1 2 0 1 1 0 1 1 2 3 0 0 3 3 5 0 0 0 −3 5      , báze M ∨ N : (1, 2, 0, 1, 1), (0, 1, 1, 2, 3), (0, 0, 3, 3, 5), (0, 0, 0, −3, 5) , dim(M ∨ N) = 4. Podle věty 6.6 máme okamžitě dimenzi průniku: dim(M ∩ N) = dim M + dim N − dim(M ∨ N) = 3 + 3 − 4 = 2, bohužel nalezení báze průniku dá ještě trochu práce. Vektory společné oběma podprostorům musí jít zapsat jako lineární kombinace báze M i lineární kombinace báze N: α (1, 2, 0, 1, 1) + β (0, 1, 1, 2, 3) + γ (0, 0, 3, 3, 5) = a (1, 1, 3, 4, 3) + b (0, 1, 1, 2, 3) + c (0, 0, 1, 2, 0). (6.1) Z tohoto požadavku nám vychází soustava pěti rovnic o šesti neznámých α, β, γ, a, b, c. Eliminujeme matici této homogenní soustavy.       1 0 0 −1 0 0 2 1 0 −1 −1 0 0 1 3 −3 −1 −1 1 2 3 −4 −2 −2 1 3 5 −3 −3 0       ∼       1 0 0 −1 0 0 0 1 0 1 −1 0 0 1 3 −3 −1 −1 0 2 3 −3 −2 −2 0 3 5 −2 −3 0       ∼ · · · ∼     1 0 0 −1 0 0 0 1 0 1 −1 0 0 0 3 −4 0 −1 0 0 0 1 0 1     . Volíme b = t, c = u, pak vychází a = −u. Ostatní hodnoty proměnných nemusíme počítat a vrátíme se k pravé straně rovnosti (6.1). Vektory, které jsou společné oběma prostorům, musejí tedy splňovat: −u (1, 1, 3, 4, 3) + t (0, 1, 1, 2, 3) + u (0, 0, 1, 2, 0) = t (0, 1, 1, 2, 3) + u (−1, −1, −2, −2, −3). Je tedy M ∩ N = (0, 1, 1, 2, 3), (1, 1, 2, 2, 3) a tyto dva vektory tvoří jednu z možných bází lineárního prostoru M ∩N. Že průnik obsahuje vektor (0, 1, 1, 2, 3) nás nepřekvapí, protože tento vektor byl součástí obou bází podprostorů M i N. Soustavu jsme počítali jen kvůli tomu, abychom našli ten druhý vektor. 61 Lineární algebra 6. Více o lineárních prostorech konečné dimenze Souřadnice vektoru 6.8. Definice. Nechť B = {b1, b2, . . . , bn} je báze lineárního prostoru L. Záleží-li nám na pořadí prvků báze b1, b2, . . . , bn (tj. požadujeme, aby b1 byl první prvek báze, b2 druhý prvek atd.), pak mluvíme o uspořádané bázi. Uspořádaná báze je tedy uspořádaná n-tice prvků báze, tj. (b1, b2, . . . , bn). Skutečnost, že báze B je uspořádaná, budeme vyznačovat symbolem (B). 6.9. Poznámka. Uspořádanou bázi máme definovánu jen pro lineární prostory konečné dimenze. Ačkoli tedy v dalším textu nebude tato skutečnost výslovně uvedena, všude tam, kde se mluví o uspořádaných bázích, máme na mysli lineární prostor konečné dimenze. 6.10. Definice. Nechť (B) = (b1, b2, . . . , bn) je uspořádaná báze lineárního prostoru L a x ∈ L je libovolný vektor. Uspořádanou n-tici reálných čísel (α1, α2, . . . , αn) nazýváme souřadnicemi vektoru x vzhledem k uspořádané bázi (B), pokud platí x = α1 b1 + α2 b2 + · · · + αn bn. Skutečnost, že (α1, α2, . . . , αn) jsou souřadnice vektoru x vzhledem k uspořádané bázi (B) budeme zapisovat takto: x = (α1, α2, . . . , αn)(B). Existence a jednoznačnost sou- řadnic 6.11. Poznámka. Nechť B je báze lineárního prostoru L. Protože B = L, je každý prvek x lineární kombinací prvků báze a tudíž každý prvek x má nějaké souřadnice vzhledem k uspořádané bázi (B). Následující věta ukazuje, že jsou tyto souřadnice určeny uspořádanou bází (B) jednoznačně. 6.12. Věta. Nechť (B) je uspořádaná báze lineárního porostoru L. Pak pro každý prvek x ∈ L jsou souřadnice x vzhledem k bázi (B) určeny jednoznačně. Důkaz. Označme (B) = (b1, b2, . . . , bn). Nechť x = (α1, α2, . . . , αn)(B) = (β1, β2, . . . , βn)(B). Ukážeme, že pak je αi = βi, ∀i ∈ {1, . . . , n}. Podle definice 6.10 je x = α1 b1 + α2 b2 + · · · + αn bn, x = β1 b1 + β2 b2 + · · · + βn bn. Odečtením těchto rovností dostáváme x − x = o = (α1 − β1) b1 + (α2 − β2) b2 + · · · + (αn − βn) bn. Protože vektory báze b1, b2, . . . , bn jsou lineárně nezávislé, pouze triviální lineární kombinace může být rovna nulovému vektoru. Všechny koeficienty uvedené lineární kombinace musejí tedy být rovny nule. Tím dostáváme αi = βi, ∀i ∈ {1, . . . , n}. 6.13. Věta. Nechť (B) = (b1, b2, . . . , bn) je uspořádaná báze lineárního prostoru L. Pak pro každý prvek a ∈ Rn , a = (α1, α2, . . . , αn), existuje x ∈ L takový, že x = (α1, α2, . . . , αn)(B). Důkaz. Stačí volit x = α1 b1 + α2 b2 + · · · + αn bn. 6.14. Poznámka. Nechť L je blíže neurčený lineární prostor, dim L = n. Souřadnice vektoru vzhledem k uspořádané bázi nám podle právě dokázaných vět umožňuje jednoznačně podchytit každý vektor x ∈ L pomocí uspořádané n-tice reálných čísel. Přesněji, při pevně volené uspořádané bázi (B) existuje ke každému prvku x ∈ L jednoznačně určená uspořádaná n-tice a ∈ Rn , která tvoří souřadnice tohoto vektoru vzhledem k bázi (B) a naopak. Význam pojmu souřadnice vzhledem k bázi je tedy v tom, že stačí v libovolném lineárním prostoru konečné dimenze (například polynomů nejvýše k-tého stupně, matic, . . . ) stanovit jednu uspořádanou bázi a pak popsat každý takový prvek uspořádanou n-ticí reálných čísel. V následující kapitole o lineárních zobrazeních ukážeme, že zobrazení z L na Rn , které přiřazuje každému prvku z L jeho souřadnice vzhledem k pevně zvolené uspořádané bázi, je tzv. izomorfismus. To znamená, že veškeré vlastnosti linearity (součty, násobky, lineární závislosti a nezávislosti, podprostory, lineární obaly atd.) se tímto zobrazením „přenášejí z prostoru L na důvěrně známý lineární prostor Rn . Stačí tedy tyto vlastnosti studovat v Rn a výsledky případně „zpětně přenést pomocí inverzního zobrazení do L. 62 Lineární algebra 6. Více o lineárních prostorech konečné dimenze 6.15. Příklad. Nechť L je lineární prostor polynomů nejvýše třetího stupně. Najdeme souřadnice polynomu p ∈ L, p(x) = 2x3 + x2 − 3x vzhledem k uspořádané bázi (B) = x + 1, x − 1, (x + 1)2 , (x + 1)3 . Nevěřící Tomášové by nejprve měli ověřit, zda je B skutečně bází lineárního prostoru L, tj. zda platí vlastnosti (1) a (2) z definice 2.42. Položili by následující lineární kombinaci rovnu nulovému polynomu: α (x + 1) + β (x − 1) + γ (x + 1)2 + δ (x + 1)3 = δ x3 + (γ + 3δ) x2 + (α + β + 2γ + 3δ) x + α − β + γ + δ = 0 a zkoumali by, za jakých okolností lze rovnost splnit. Polynom je nulový jen tehdy, když jsou nulové všechny jeho koeficienty, což vede na homogenní soustavu čtyř rovnic o neznámých α, β, γ, δ. Tu by Tomášové vyřešili, zjistili by, že má pouze nulové řešení, a proto jsou dané polynomy z množiny B lineárně nezávislé. Dále by Tomášové použili vlastnost (3) věty 2.64 a prohlásili, že když množina B je lineárně nezávislá a obsahuje stejný počet vektorů, jako je dimenze prostoru (podle příkladu 2.48 je dim L = 4), pak musí B = L. Tím by zjistili, že B je báze lineárního prostoru L. Nyní najdeme souřadnice polynomu p vzhledem k bázi (B). Podle definice 6.10 má pro souřadnice (α, β, γ, δ) platit 2x3 + x2 − 3x = α (x + 1) + β (x − 1) + γ (x + 1)2 + δ (x + 1)3 , po úpravě: 2x3 + x2 − 3x = δ x3 + (γ + 3δ) x2 + (α + β + 2γ + 3δ) x + α − β + γ + δ. Po porovnání jednotlivých koeficientů u polynomů na levé a pravé straně rovnosti dostáváme soustavu rovnic α − β + γ + δ = 0 α + β + 2γ + 3δ = − 3 γ + 3δ = 1 δ = 2 Soustava má jediné řešení α = 2, β = −1, γ = −5, δ = 2. Zapíšeme výsledek: p = (2, −1, −5, 2)(B). 6.16. Příklad. Uvažujme stejný lineární prostor L jako v předchozím příkladě a v něm stejný polynom p ∈ L, p(x) = 2x3 + x2 − 3x. Vzhledem ke standardní uspořádané bázi B0 = (1, x, x2 , x3 ) má polynom souřadnice shodné se svými koeficienty, tedy p = (0, −3, 1, 2)(B0). Platí totiž p(x) = 0 · 1 + (−3) · x + 1 · x2 + 2 · x3 . Matice přechodu 6.17. Poznámka. Předchozí dva příklady ilustrují skutečnost, že souřadnice vektoru vzhledem k uspořádané bázi jsou závislé na volbě uspořádané báze. Budeme se setkávat s úlohou, kdy jsou dány dvě různé uspořádané báze stejného lineárního prostoru a budeme znát souřadnice nějakého vektoru vzhledem k jedné bázi. Bude potřeba najít souřadnice téhož vektoru vzhledem ke druhé bázi. K tomu slouží tzv. matice přechodu. 6.18. Definice. Nechť (B) = (b1, b2, . . . , bn) a (C) = (c1, c2, . . . , cn) jsou dvě uspořádané báze stejného lineárního prostoru L. Matici A, která splňuje maticovou rovnost (b1, b2, . . . , bn) · A = (c1, c2, . . . , cn) (6.2) nazýváme maticí přechodu od uspořádané báze (B) k uspořádané bázi (C). Na definiční rovnost (6.2) se díváme jako na součin jednořádkové matice vektorů (b1, b2, . . . , bn) s maticí A reálných čísel typu (n, n), který se má rovnat jednořádkové matici vektorů (c1, c2, . . . , cn). Matici přechodu od báze (B) k bázi (C) budeme často pro názornost označovat A(B,C). 6.19. Věta. Pro každé dvě uspořádané báze stejného lineárního prostoru (B) a (C) existuje právě jedna regulární matice přechodu A(B,C). Důkaz. Podle definice maticového součinu a podle (6.2) je c1 = a1,1 b1 + a2,1 b2 + · · · + an,1 bn, kde a1,1, a2,1, . . . , an,1 jsou prvky prvního sloupce matice A(B,C). První sloupec matice tedy obsahuje souřadnice vektoru c1 vzhledem k bázi (B). Podobná vlastnost platí pro ostatní vektory ci, tedy i-tý sloupec matice A(B,C) obsahuje souřadnice vektoru ci vzhledem k bázi (B). To je návod, jak sestrojit hledanou matici. Matice tedy existuje a sloupce této matice jsou podle věty 6.12 určeny jednoznačně. Ukážeme ještě, že matice A(B,C) je regulární matice. Sloupce této matice musejí být lineárně nezávislé, protože tyto sloupce jsou násobeny stejnou jednořádkovou maticí (b1, b2, . . . , bn), a přitom tímto násobením mají vzniknout lineárně nezávislé vektory c1, c2, . . . , cn. Protože jsou sloupce matice A(B,C) lineárně nezávislé, tj. hod AT (B,C) = hod A(B,C) = n, je matice přechodu regulární. 63 Lineární algebra 6. Více o lineárních prostorech konečné dimenze 6.20. Poznámka. Transponujeme-li obě strany rovnosti (6.2), dostáváme maticovou rovnost AT (B,C) ·   b1 ... bn   =   c1 ... cn   , se kterou se můžeme setkat v některých učebnicích jako definiční rovností pro matici přechodu. Všimněme si, že se zde pracuje s maticí transponovanou k matici přechodu. Někteří autoři proto definují místo matice přechodu podle definice 6.18 matici k ní transponovanou. 6.21. Věta. Je-li A matice přechodu od báze (B) k bázi (C), pak A−1 je matice přechodu od báze (C) k bázi (B). Důkaz. Plyne rovnou vynásobením rovnosti (6.2) maticí A−1 zprava. 6.22. Příklad. Nechť L je lineární prostor polynomů z příkladů 6.15 a 6.16. Připomeňme uspořádané báze z těchto příkladů: (B) = x + 1, x − 1, (x + 1)2 , (x + 1)3 , (B0) = (1, x, x2 , x3 ). Pak jsme schopni podle definice 6.18 rovnou zapsat jednotlivé sloupce matice přechodu od báze (B0) k bázi (B): (1, x, x2 , x3 ) ·     1 −1 1 1 1 1 2 3 0 0 1 3 0 0 0 1     = x + 1, x − 1, (x + 1)2 , (x + 1)3 . Pokud bychom chtěli najít matici přechodu od báze (B) k bázi (B0), není přímé zapsání složek jednotlivých sloupců tak jednoduché. Použijeme proto větu 6.21 a budeme počítat inverzní matici k právě sestrojené matici:     1 −1 1 1 1 0 0 0 1 1 2 3 0 1 0 0 0 0 1 3 0 0 1 0 0 0 0 1 0 0 0 1     ∼      1 0 0 0 1 2 1 2 −3 2 5 2 0 1 0 0 −1 2 1 2 −1 2 1 2 0 0 1 0 0 0 1 −3 0 0 0 1 0 0 0 1      . Zapíšeme ještě jednou obě matice přechodu od báze (B0) k (B) a od báze (B) k (B0): A(B0,B) =     1 −1 1 1 1 1 2 3 0 0 1 3 0 0 0 1     , A(B,B0) =       1 2 1 2 −3 2 5 2 −1 2 1 2 −1 2 1 2 0 0 1 −3 0 0 0 1       . Souřadnice vektoru a matice přechodu 6.23. Věta. Nechť (B) a (C) jsou dvě uspořádané báze lineárního prostoru L, A(B,C) je matice přechodu od (B) k (C). Pak pro souřadnice každého vektoru x ∈ L, x = (x1, x2, . . . , xn)(B) = (y1, y2, . . . , yn)(C) platí A(B,C) ·    y1 ... yn    =    x1 ... xn    . (6.3) Důkaz. Věta je důsledkem věty o maticích lineárního zobrazení. Důkaz proto odložíme do následující kapitoly. Viz poznámku 7.58 v kapitole o lineárních zobrazeních. 6.24. Poznámka. Vzorec (6.3) si lze pamatovat takto: A(B,C) ·   souřadnice vzhledem k bázi (C)   =   souřadnice vzhledem k bázi (B)   . Vidíme, že matice přechodu od (B) k (C) umožňuje počítat maticovým násobením souřadnice vzhledem k bázi (B), pokud známe souřadnice vzhledem k bázi (C). Matice přechodu tedy převádí souřadnice přesně obráceně, než by vyplývalo z jejího názvu. 64 Lineární algebra 6. Více o lineárních prostorech konečné dimenze 6.25. Příklad. Vraťme se k bázím (B) = x + 1, x − 1, (x + 1)2 , (x + 1)3 a (B0) = (1, x, x2 , x3 ) z předchozího příkladu. Polynom p ∈ L, p(x) = 2x3 + x2 − 3x má podle příkladu 6.16 souřadnice p = (0, −3, 1, 2)(B0). Uvažujme ještě polynom q ∈ L daný vzorcem q(x) = x2 + 5, ∀x ∈ R. Polynom q má tedy souřadnice q = (5, 0, 1, 0)(B0). Za použití matice přechodu najdeme souřadnice polynomů p a q vzhledem k bázi (B). Matici přechodu A(B,B0) jsme spočítali v příkladu 6.22. Nyní použijeme vzorec (6.3):       1 2 1 2 −3 2 5 2 −1 2 1 2 −1 2 1 2 0 0 1 −3 0 0 0 1       ·     0 −3 1 2     =     2 −1 −5 2     ,       1 2 1 2 −3 2 5 2 −1 2 1 2 −1 2 1 2 0 0 1 −3 0 0 0 1       ·     5 0 1 0     =     1 −3 1 0     . Máme tedy výsledek: p = (2, −1, −5, 2)(B), q = (1, −3, 1, 0)(B). 6.26. Poznámka. Všimneme si, že jsme souřadnice polynomu p vzhledem k bázi (B) spočítali už v příkladu 6.15 bez použití matice přechodu. Stačilo nám rozepsat definici souřadnic vzhledem k bázi. Pokud potřebujeme zjistit souřadnice jediného vektoru vzhledem k nějaké bázi, pak je zřejmě účelnější použít definici pojmu souřadnice vzhledem k bázi a maticemi přechodu si zbytečně nekomplikovat život. Jakmile ale budeme potřebovat převádět souřadnice většího množství vektorů, pak se vyplatí najít odpovídající matici přechodu. V příkladu 6.15 jsme vlastně nevědomky použili matici přechodu A(B0,B). Byla to matice soustavy lineárních rovnic, pro kterou jsme hledali řešení. Přechod od báze (B) přes (C) k (D) 6.27. Věta. Nechť A(B,C) je matice přechodu od báze (B) k bázi (C) a A(C,D) je matice přechodu od báze (C) k bázi (D). Pak pro matici přechodu A(B,D) od báze (B) k bázi (D) platí A(B,D) = A(B,C) · A(C,D). Důkaz. Podle definice matice přechodu 6.18 je (B) · A(B,C) = (C), (C) · A(C,D) = (D). Vynásobíme-li první rovnost maticí A(C,D) zprava, dostáváme (B) · A(B,C) · A(C,D) = (C) · A(C,D) = (D). Sestavení matic přechodu 6.28. Poznámka. Na závěr této kapitoly se pokusíme ukázat metodu, jak sestavit matici přechodu, jsou-li dány uspořádané báze (B) a (C) v Rn . Nejprve si všimneme, jaká je souvislost mezi složkami vektorů z Rn a jejich souřadnicemi. 6.29. Věta. Nechť a ∈ Rn , a = (α1, α2, . . . , αn). Složky (α1, α2, . . . , αn) jsou souřadnicemi vektoru a vzhledem ke standardní bázi (S): (S) = (1, 0, 0, . . . , 0), (0, 1, 0, . . . , 0), . . . , (0, 0, 0, . . . , 1) . Důkaz. Pro vektor a ∈ Rn platí a = α1 (1, 0, 0, . . . , 0) + α2 (0, 1, 0, . . . , 0) + · · · + αn (0, 0, 0, . . . , 1). V souladu s definicí 6.10 jsou tedy složky (α1, α2, . . . , αn) souřadnicemi vektoru a vzhledem k bázi (S). 6.30. Věta. Nechť (B) = (b1, b2, . . . , bn) je uspořádaná báze lineárního prostoru Rn . Matice přechodu od standardní báze (S) k bázi (B) má tvar A(S,B) = (bT 1 , bT 2 , . . . , bT n ), kde symbolem bT i značíme sloupec složek vektoru bi. Jinými slovy, uvedenou matici přechodu sestavíme tak, že zapíšeme jednotlivé vektory báze vedle sebe, složky těchto vektorů zapíšeme do sloupců. Důkaz. Stačí si zopakovat důkaz věty 6.19. Vidíme, že i-tý sloupec matice A(S,B) podle tohoto důkazu obsahuje souřadnice vektoru bi vzhledem k bázi (S). Podle věty 6.29 jsou tyto souřadnice rovny přímo složkám vektoru bi. 65 Lineární algebra 6. Více o lineárních prostorech konečné dimenze 6.31. Věta. Nechť (B) = (b1, b2, . . . , bn) a (C) = (c1, c2, . . . , cn) jsou uspořádané báze lineárního prostoru Rn . Pak pro matice přechodu A(B,C) a A(C,B) platí (A(C,B) | E) ∼ (bT 1 , bT 2 , . . . bT n | cT 1 , cT 2 , . . . cT n ) ∼ (E | A(B,C)), kde „∼ značí konečně mnoho kroků Gaussovy eliminační metody, E je jednotková matice a bT i resp. cT j jsou vektory bi resp. cj, jejichž složky jsou zapsány do sloupců. Důkaz. Podle věty 6.30 je (bT 1 , bT 2 , . . . bT n | cT 1 , cT 2 , . . . cT n ) = (A(S,B) | A(S,C)). Dále podle vět 6.27 a 6.21 je A(B,C) = A(B,S) · A(S,C) = A−1 (S,B) · A(S,C). Protože (A(S,B) | A(S,C)) ∼ (E | X), existuje podle věty 3.55 taková regulární matice P, pro kterou platí (P · A(S,B) | P · A(S,C)) = (E | X). Z rovnosti P · A(S,B) = E plyne P = A−1 (S,B). Dostáváme tedy X = P · A(S,C) = A−1 (S,B) · A(S,C) = A(B,C). Skutečnost, že (A(C,B) | E) ∼ (A(S,B) | A(S,C)) bychom dokázali podobně. 6.32. Poznámka. Věta 6.31 nám dává návod, jak sestavit matici přechodu od báze (B) k bázi (C) v Rn . Stačí zapsat vedle sebe vektory obou bází (jejich složky jsou psány do sloupců) a pak eliminovat tak, abychom získali v levém poli jednotkovou matici. V pravém poli pak máme hledanou matici přechodu. 6.33. Příklad. Jsou dány uspořádané báze (B) a (C) v lineárním prostoru R4 : (B) = (1, 1, 1, 1), (1, 2, 1, 1), (1, 1, 2, 1), (1, 3, 2, 3) , (C) = (1, 0, 3, 3), (1, 2, 1, 1), (2, 2, 5, 4), (−2, −3, −4, −4) . Najdeme matice přechodu A(B,C) a A(C,B). Dále je dán vektor x ∈ R4 , x = (0, 1, 1, 0). Máme najít jeho souřadnice vzhledem k oběma uspořádaným bázím. Sestavíme matici vektorů obou bází podle věty 6.31 a budeme ji eliminovat „oběma směry .     1 1 1 1 1 1 2 −2 1 2 1 3 0 2 2 −3 1 1 2 2 3 1 5 −4 1 1 1 3 3 1 4 −4     ∼     1 1 1 1 1 1 2 −2 0 1 0 2 −1 1 0 −1 0 0 1 1 2 0 3 −2 0 0 0 1 1 0 1 −1     ∼     1 0 0 0 2 0 1 −1 0 1 0 0 −3 1 −2 1 0 0 1 0 1 0 2 −1 0 0 0 1 1 0 1 −1     ,     1 1 1 1 1 1 2 −2 1 2 1 3 0 2 2 −3 1 1 2 2 3 1 5 −4 1 1 1 3 3 1 4 −4     ∼     1 1 1 1 1 1 2 −2 1 2 1 3 0 2 2 −3 −1 0 0 2 0 0 1 −1 1 0 1 −3 0 0 0 1     ∼     1 0 0 −1 1 0 0 0 2 1 1 −2 0 1 0 0 0 0 1 −1 0 0 1 0 1 0 1 −3 0 0 0 1     . Je tedy A(B,C) =     2 0 1 −1 −3 1 −2 1 1 0 2 −1 1 0 1 −1     , A(C,B) =     1 0 0 −1 2 1 1 −2 0 0 1 −1 1 0 1 −3     . Vektor x = (0, 1, 1, 0) má podle definice 6.10 souřadnice (α, β, γ, δ) vzhledem k bázi (B), pokud platí (0, 1, 1, 0) = α (1, 1, 1, 1) + β (1, 2, 1, 1) + γ (1, 1, 2, 1) + δ (1, 3, 2, 3). To vede na nehomogenní soustavu lineárních rovnic, jejíž rozšířená matice je     1 1 1 1 0 1 2 1 3 1 1 1 2 2 1 1 1 1 3 0     ∼     1 1 1 1 0 0 1 0 2 1 0 0 1 1 1 0 0 0 1 0     ∼     1 0 0 0 −2 0 1 0 0 1 0 0 1 0 1 0 0 0 1 0     , výsledek: x = (−2, 1, 1, 0)(B). Pro nalezení souřadnic vektoru x vzhledem k bázi (C) využijeme právě spočítaného výsledku a věty 6.23.     1 0 0 −1 2 1 1 −2 0 0 1 −1 1 0 1 −3     ·     −2 1 1 0     =     −2 −2 1 −1     , výsledek: x = (−2, −2, 1, −1)(C). 66 7. Lineární zobrazení 7.1. Poznámka. Než se pustíme do definice pojmu lineární zobrazení, bude užitečné si zopakovat, co to je vůbec zobrazení a jeho základní vlastnosti. Definice zobrazení 7.2. Definice. Nechť L1 a L2 jsou libovolné množiny. Zobrazením A z množiny L1 do množiny L2 rozumíme jakýkoli předpis, který každému prvku z množiny L1 přiřadí jednoznačným způsobem nějaký prvek z množiny L2. Skutečnost, že A je zobrazení z množiny L1 do množiny L2 zapisujeme A : L1 → L2. Je-li x ∈ L1, pak zobrazení A : L1 → L2 přiřadí prvku x jednoznačně nějaký prvek z množiny L2. Tento prvek označujeme symbolem A(x) ∈ L2 a říkáme mu hodnota zobrazení A v bodě x. Je-li M ⊆ L1, pak definujeme A(M) = y ∈ L2; ∃x ∈ M tak, že A(x) = y . Zobrazení „na 7.3. Definice. Nechť L1 a L2 jsou libovolné množiny a uvažujme A : L1 → L2. Pokud platí A(L1) = L2, říkáme, že A je zobrazení z množiny L1 na množinu L2 (nebo říkáme, že zobrazení je surjektivní). 7.4. Poznámka. Zobrazení A z množiny L1 na množinu L2 je speciální případ zobrazení z množiny L1 do množiny L2 (všimneme si rozdílnosti slůvek „do a „na ). Může se stát, že existují prvky y ∈ L2, pro které neexistuje žádný prvek x ∈ L1, který by splňoval A(x) = y. V takovém případě zobrazení A není na množinu L2. Lidově řečeno, množina L2 je v takovém případě „větší , než množina všech hodnot zobrazení A. Prosté zobrazení 7.5. Definice. Nechť L1 a L2 jsou libovolné množiny a uvažujme A : L1 → L2. Zobrazení A je prosté (injektivní), pokud pro každé dva prvky x1 ∈ L1, x2 ∈ L1, x1 = x2 platí A(x1) = A(x2). Definice lineárního zobrazení 7.6. Definice. Nechť L1 a L2 jsou lineární prostory, A : L1 → L2 je zobrazení z L1 do L2. Zobrazení A nazýváme lineárním zobrazením, pokud pro všechna x ∈ L1, y ∈ L1, α ∈ R platí (1) A(x + y) = A(x) + A(y), (2) A(α · x) = α · A(x). 7.7. Poznámka. Lineární zobrazení „zachovává operace sčítání a násobení konstantou. Sečteme-li dva prvky z L1 a výsledek převedeme prostřednictvím lineárního zobrazení do L2, výjde totéž, jako kdybychom nejprve jednotlivé prvky převedli prostřednictvím zobrazení do L2 a tam je sečetli. Všimneme si, že první operace „+ ve vlastnosti (1) je sčítáním definovaným na lineárním prostoru L1, zatímco druhá operace „+ v této vlastnosti je sčítáním definovaným na lineárním prostoru L2. Tato dvě sčítání mohou být definována zcela rozdílným způsobem na zcela rozdílných lineárních prostorech. Podobně ve vlastnosti (2) je první operace „· násobkem definovaným na L1, zatímco druhá operace „· je násobek definovaný na L2. Princip superpozice 7.8. Věta (princip superpozice). Nechť L1 a L2 jsou lineární prostory. Zobrazení A : L1 → L2 je lineární právě tehdy, když pro všechna x ∈ L1, y ∈ L1, α ∈ R, β ∈ R platí A(α x + β y) = α A(x) + β A(y). (7.1) Důkaz. Nejprve předpokládejme, že pro zobrazení A : L1 → L2 platí (7.1) pro všechna x, y ∈ L1 a α, β ∈ R. Dokážeme, že A je lineární, tj. že platí (1) a (2) z definice 7.6. Pokud zvolíme α = β = 1, plyne z (7.1) vlastnost (1) a pokud volíme β = 0, plyne z (7.1) vlastnost (2). Nechť nyní A : L1 → L2 je lineární. Platí A(α x + β y) (1) = A(α x) + A(β y) (2) = α A(x) + β A(y). Nad rovnítky jsme uvedli, kterou vlastnost jsme zrovna použili. 7.9. Poznámka. Opakovaným použitím principu superpozice (nebo formálně matematickou indukcí) lze snadno dokázat, že A : L1 → L2 je lineární právě tehdy, když pro všechna n ∈ N, x1, x2, . . . , xn ∈ L1, α1, α2, . . . , αn ∈ R platí A(α1 x1 + α2 x2 + · · · + αn xn) = α1 A(x1) + α2 A(x2) + · · · + αn A(xn). (7.2) 67 Lineární algebra 7. Lineární zobrazení 7.10. Věta. Pro lineární zobrazení A : L1 → L2 platí A(o1) = o2, kde o1 je nulový vektor lineárního prostoru L1 a o2 je nulový vektor lineárního prostoru L2. Důkaz. Podle vlastnosti (7) definice 1.6 je o1 = 0 x, kde x ∈ L1. Podle vlastnosti (2) definice 7.6 je A(o1) = A(0 x) = 0 A(x) = o2. 7.11. Příklad. Ověříme, zda je zobrazení A : R2 → R3 , definované vzorcem A(x1, x2) = (x1 + 2x2, −x2, 2x1 − 3x2), lineární. Poznamenejme, že jsme v uvedeném vzorci vynechali jednu kulatou závorku, jako se to obvykle u zobrazení definovaných na Rn dělá, tj. místo abychom psali A (x1, x2) , píšeme stručně A(x1, x2). Ověříme vlastnosti (1) a (2) z definice 7.6: (1) A (x1, x2) + (y1, y2) = A(x1 + y1, x2 + y2) = = x1 + y1 + 2(x2 + y2), −(x2 + y2), 2(x1 + y1) − 3(x2 + y2) = = (x1 + 2x2, −x2, 2x1 − 3x2) + (y1 + 2y2, −y2, 2y1 − 3y2) = A(x1, x2) + A(y1, y2), (2) A α (x1, x2) = A(α x1, α x2) = (α x1 + 2α x2, −α x2, 2α x1 − 3α x2) = = α (x1 + 2x2, −x2, 2x1 − 3x2) = α A(x1, x2). 7.12. Příklad. Zobrazení A : R4 → R3 definované předpisem A(x1, x2, x3, x4) = (x2 + x3, x3 + 3, 2x1) není lineární, protože A(0, 0, 0, 0) = (0, 3, 0) a to není nulový vektor v R3 . Podle věty 7.10 musí každé lineární zobrazení zobrazit nulový vektor na nulový vektor. Pilnější čtenáři si zkusí ověřit, že A není lineární, přímo z definice 7.6 nebo z principu superpozice 7.8. 7.13. Příklad. Nechť L1 je lineární prostor všech diferencovatelných funkcí na R a L2 je lineární prostor všech funkcí na R. Pak zobrazení A : L1 → L2, které každé funkci z L1 přiřadí její derivaci, je lineární. Platí totiž A(f + g) = (f + g) = f + g = A(f) + A(g), A(αf) = (αf) = α f = α A(f). Zachování obalů 7.14. Věta. Nechť A : L1 → L2 je lineární zobrazení, M ⊆ L1. Pak A M = A(M) . Důkaz. Nechť y ∈ A M . Pak existuje vektor x ∈ M takový, že A(x) = y. Protože x ∈ M , existuje podle definice lineárního obalu konečně mnoho x1, x2, . . . , xi ∈ M takových, že x je lineární kombinací těchto vektorů. Protože A je lineární, máme podle (7.2) y = A(x) = A(α1 x1 + α2 x2 + · · · + αn xn) = α1 A(x1) + α2 A(x2) + · · · + αn A(xn). Z tohoto zápisu je patrné, že y ∈ A(M) . Nechť nyní obráceně y ∈ A(M) . Z definice lineárního obalu plyne, že existuje konečně mnoho yi ∈ A(M) takových, že y je lineární kombinací těchto vektorů. Pro každý vektor yi existuje vektor xi ∈ M takový, že A(xi) = yi. Máme tedy y = β1 y1 + β2 y2 + · · ·+βm ym = β1 A(x1)+ · · ·+ βm A(xm) = A(β1 x1 +β2 x2 + · · ·+ βm xm) = A(x). Je tedy x ∈ M a protože y = A(x), je též y ∈ A M . 7.15. Poznámka. Věta 7.14 má tento důsledek: Je-li M ⊆ L1 lineární podprostor v L1, pak A(M) je lineární podprostor v L2. Stačí si uvědomit platnost věty 2.37. Lineární zobrazení nám tedy převádí podprostory na podprostory. Jádro zobrazení 7.16. Definice. Nechť L1, L2 jsou lineární prostory, o2 je nulový vektor v lineárním prostoru L2 a A : L1 → L2 je lineární zobrazení. Množinu Ker A = {x ∈ L1; A(x) = o2} nazýváme jádrem lineárního zobrazení A. 68 Lineární algebra 7. Lineární zobrazení 7.17. Příklad. Uvažujme zobrazení definované v příkladu 7.13, které každé funkci přiřadí její derivaci. Jádrem tohoto zobrazení je množina všech konstantních funkcí, protože to jsou právě všechny funkce, které po zderivování dávají nulovou funkci. 7.18. Příklad. Najdeme jádro zobrazení A z příkladu 7.11. Podle definice jádra je Ker A = (x1, x2); A(x1, x2) = (0, 0, 0) = (x1, x2); (x1 + 2x2, −x2, 2x1 − 3x2) = (0, 0, 0) . To vede na homogenní soustavu tří rovnic o dvou neznámých. V tomto příkladě má tato soustava jen nulové řešení, takže máme Ker A = (0, 0) . 7.19. Věta. Jádro lineárního zobrazení A : L1 → L2 tvoří lineární podprostor lineárního prostoru L1. Důkaz. Především je Ker A neprázdná množina, protože podle věty 7.10 obsahuje tato množina nulový vektor. Podle definice 1.17 máme dokázat (1) je-li x ∈ Ker A, y ∈ Ker A, pak též x+y ∈ Ker A a (2) je-li x ∈ Ker A, α ∈ R, pak je α x ∈ Ker A. Předpoklady podle definice 7.16 říkají A(x) = A(y) = o2 a máme dokázat, že A(x + y) = o2, A(α x) = o2. Podle definice 7.6 lineárního zobrazení platí A(x + y) = A(x) + A(y) = o2 + o2 = o2, A(α x) = α A(x) = α o2 = o2. 7.20. Věta. Množina A(L1) všech hodnot lineárního zobrazení A : L1 → L2 tvoří lineární podprostor lineárního prostoru L2. Důkaz. Množina L1 je sama v sobě podprostorem. Podle věty 7.14 a poznámky 7.15 musí být lineárním podprostorem i množina A(L1). Defekt a hodnost zobrazení 7.21. Definice. Defekt lineárního zobrazení A : L1 → L2 je definován, jako dim Ker A a hodnost lineárního zobrazení A je definována jako dim A(L1). Defekt A značíme def A a hodnost A značíme hod A. Je tedy def A = dim Ker A, hod A = dim A(L1). 7.22. Poznámka. Předchozí dvě věty zaručují smysluplnost definice defektu a hodnosti: Ker A a A(L1) jsou lineární podprostory. Defekt zobrazení udává zhruba řečeno „vzdálenost zobrazení od ideálního prostého zobrazení. Jak moc je zobrazení A „defektní souvisí také s tím, kolik informace, které dovedeme v prostoru L1 rozlišit, se stává po aplikaci zobrazení A v prostoru L2 nerozlišitelné. 7.23. Příklad. Defekt zobrazení A definovaného v příkladu 7.13, které přiřazuje derivaci, je roven jedné. Je totiž množina konstantních funkcí lineárním podprostorem množiny všech funkcí, přitom báze tohoto podprostoru je libovolná jedna nenulová konstantní funkce. Proto je dimenze tohoto podprostoru rovna jedné. Hodnost tohoto zobrazení A je rovna nekonečnu, protože A(L1) obsahuje určitě všechny polynomy a o lineárním prostoru všech polynomů jsme si řekli v příkladu 2.47, že má nekonečnou bázi. 7.24. Příklad. Zobrazení A : R2 → R3 , A(x1, x2) = (x1 + 2x2, −x2, 2x1 − 3x2) z příkladu 7.11 má defekt roven nule. V příkladu 7.18 jsme totiž ukázali, že Ker A = {o1}. Vyšetříme, jak vypadá A(L1). Budeme se ptát, pro které hodnoty (y1, y2, y3) existuje dvojice (x1, x2) taková, že A(x1, x2) = (y1, y2, y3). Jinými slovy, zjistíme, pro které hodnoty pravých stran má nehomogenní soustava x1 + 2x2 = y1 − x2 = y2 2x1 − 3x2 = y3 s neznámými x1, x2 nějaké řešení. Eliminujme rozšířenou matici soustavy:   1 2 y1 0 −1 y2 2 −3 y3   ∼   1 2 y1 0 1 −y2 0 −7 y3 − 2y1   ∼   1 2 y1 0 1 −y2 0 0 y3 − 2y1 − 7y2   . Podle Frobeniovy věty 5.4 má tato soustava řešení jen tehdy, když y3 − 2y1 − 7y2 = 0, tj. y3 = 2y1 + 7y2. Z toho nám vychází A(L1) = (y1, y2, 2y1 + 7y2) = y1 (1, 0, 2) + y2 (0, 1, 7), ∀y1 ∈ R, ∀y2 ∈ R, A(L1) = (1, 0, 2), (0, 1, 7) . 69 Lineární algebra 7. Lineární zobrazení Je tedy hod A = dim A(L1) = 2. Obraz A(L1) můžeme spočítat i tak, že spočítáme obrazy báze L1 a využijeme větu 7.14. Souřadnice jako lineární zobrazení 7.25. Příklad. Nechť (B) = (b1, b2, . . . , bn) je uspořádaná báze lineárního prostoru L. Uvažujme zobrazení A : L → Rn definované takto nechť x = (α1, α2, . . . , αn)(B), pak A(x) = (α1, α2, . . . , αn). Ukážeme, že toto zobrazení je lineární a že def A = 0, hod A = n. Nechť x = (α1, α2, . . . , αn)(B), y = (β1, β2, . . . , βn)(B). Pro tyto vektory tedy platí x = α1 b1 + α2 b2 + · · · + αn bn, y = β1 b1 + β2 b2 + · · · + βn bn. Po sečtení těchto rovností a po vynásobení první rovnosti číslem γ ∈ R dostáváme x + y = (α1 + β1) b1 + (α2 + β2) b2 + · · · + (αn + βn) bn, γ x = (γ α1) b1 + (γ α2) b2 + · · · + (γ αn) bn. Protože souřadnice vektoru vzhledem k bázi jsou určeny jednoznačně, z uvedených rovností plyne, že A(x + y) = A(x) + A(y), A(γ x) = γ A(x). Zobrazení A je tedy lineární. Hledejme nyní Ker A. Z jednoznačnosti souřadnic vzhledem k bázi plyne, že existuje jediný vektor x = (0, 0, . . . , 0)(B). Protože o = 0 b1 + 0 b2 + · · · + 0 bn, je x = o. Ker A = {o} a def A = 0. Protože ke každému prvku a ∈ Rn , a = (α1, α2, . . . , αn) existuje x ∈ L, pro který A(x) = a (stačí volit x = α1 b1 + α2 b2 + · · · + αn bn), je A(L) = Rn . Zobrazení A je tedy zobrazením z L „na Rn . Je hod A = dim Rn = n. Lineární zobrazení na bázi 7.26. Poznámka. Následující věta ukazuje, že pokud známe hodnoty zobrazení A : L1 → L2 jen na bázi lineárního prostoru L1 a toto zobrazení má být lineární, pak jsou již známy jeho hodnoty na celém prostoru L1. Jinými slovy, lineární zobrazení je určeno jednoznačně svými hodnotami na bázi L1. 7.27. Věta. Nechť {b1, b2, . . . , bn} je báze lineárního prostoru L1 a nechť jsou dány libovolné vektory y1, y2, . . . , yn z lineárního prostoru L2. Pak existuje právě jedno lineární zobrazení A : L1 → L2, pro které platí A(bi) = yi, ∀i ∈ {1, 2, . . . , n}. (7.3) Důkaz. (1) Existence. Nechť x ∈ L1. Protože {b1, b2, . . . , bn} je báze L1, existují koeficienty αi ∈ R takové, že x = α1 b1 + α2 b2 + · · · + αn bn. Hodnotu zobrazení A v bodě x nyní definujeme takto: A(x) = α1 y1 + α2 y2 + · · · + αn yn. Zobrazení je lineární a splňuje (7.3). Ukážeme, proč. Čísla (α1, α2, . . . , αn) jsou souřadnicemi vektoru x vzhledem k uspořádané bázi (B). V příkladu 7.25 jsme ukázali, že je-li x = (α1, α2, . . . , αn)(B), y = (β1, β2, . . . , βn)(B), γ ∈ R, pak x + y = (α1 + β1, α2 + β2, . . . , αn + βn)(B), γ x = (γ α1, γ α2, . . . , γ αn)(B). Z těchto vlastností okamžitě plyne linearita zobrazení A. Protože souřadnice vektoru bi vzhledem k bázi (B) jsou všechny nulové s výjimkou i-té souřadnice, která je rovna jedné, platí A(bi) = n j=0 j=i 0 · yj + 1 · yi = yi, což dokazuje požadovanou vlastnost (7.3). (2) Jednoznačnost. Nechť ještě B : L1 → L2 je lineární a splňuje vlastnost (7.3). Pak je lineární i zobrazení (A−B) : L1 → L2. Platí (A−B)(bi) = o, ∀i ∈ {1, 2, . . . , n}, protože A i B splňují vlastnost (7.3). Z linearity zobrazení A − B plyne, že (A − B)(x) = (A − B)(α1 b1 + α2 b2 + · · · + αn bn) = = α1 (A − B)(b1) + α2 (A − B)(b2) + · · · + αn (A − B)(bn) = = α1 o + α2 o + · · · + αn o = o. Vidíme, že zobrazení A − B je nulové na celém definičním oboru, takže A = B. 70 Lineární algebra 7. Lineární zobrazení 7.28. Příklad. Předpokládejme, že A : R3 → R4 je lineární zobrazení. Najdeme vzorec pro výpočet hodnoty zobrazení A(x1, x2, x3), je-li známo: A(1, 1, 2) = (1, 0, 1, 0), A(1, 2, 2) = (2, 0, 2, 0), A(2, 1, 5) = (1, 2, 2, 1). Protože jsou vektory (1, 1, 2), (1, 2, 2), (2, 1, 5) lineárně nezávislé a jsou tři, tvoří podle poznámky 2.65 bázi lineárního prostoru R3 . Známe hodnoty hledaného zobrazení na bázi R3 , takže podle věty 7.27 můžeme jednoznačně určit hodnoty A i v ostatních bodech definičního oboru. Budeme postupovat stejně, jako v důkazu věty 7.27. Nechť (x1, x2, x3) je libovolný vektor z R3 . Najdeme souřadnice tohoto vektoru vzhledem k uspořádané bázi (1, 1, 2), (1, 2, 2), (2, 1, 5) : (x1, x2, x3) = α (1, 1, 2) + β (1, 2, 2) + γ (2, 1, 5). To vede na soustavu tří rovnic o třech neznámých α, β, γ. Eliminujme její rozšířenou matici:   1 1 2 x1 1 2 1 x2 2 2 5 x3   ∼   1 1 2 x1 0 1 −1 x2 − x1 0 0 1 x3 − 2x1   ∼   1 0 0 8x1 − x2 − 3x3 0 1 0 −3x1 + x2 + x3 0 0 1 x3 − 2x1   . Platí tedy (x1, x2, x3) = (8x1 − x2 − 3x3) · (1, 1, 2) + (−3x1 + x2 + x3) · (1, 2, 2) + (x3 − 2x1) · (2, 1, 5), A(x1, x2, x3) = A (8x1 − x2 − 3x3) · (1, 1, 2) + (−3x1 + x2 + x3) · (1, 2, 2) + (x3 − 2x1) · (2, 1, 5) = = (8x1 − x2 − 3x3) · A(1, 1, 2) + (−3x1 + x2 + x3) · A(1, 2, 2) + (x3 − 2x1) · A(2, 1, 5) = = (8x1 − x2 − 3x3) · (1, 0, 1, 0) + (−3x1 + x2 + x3) · (2, 0, 2, 0) + (x3 − 2x1) · (1, 2, 2, 1) = = (x2, −4x1 + 2x3, −2x1 + x2 + x3, −2x1 + x3). Zobrazení lineárně nezávislých vektorů 7.29. Věta. Nechť A : L1 → L2 je lineární zobrazení. Pak platí: (1) Jsou-li x1, x2, . . . , xn lineárně závislé vektory v L1, pak jsou i vektory A(x1), A(x2), . . . , A(xn) lineárně závislé v L2. (2) Jsou-li x1, x2, . . . , xn lineárně nezávislé vektory v L1, pak vektory A(x1), A(x2), . . . , A(xn) v L2 nemusí být lineárně nezávislé. Důkaz. (1) Jsou-li x1, x2, . . . , xn lineárně závislé, pak existuje netriviální lineární kombinace, pro kterou je α1 x1 + α2 x2 + · · · + αn xn = o. Z věty 7.10 a z linearity zobrazení A plyne, že o = A(o) = A(α1 x1 + α2 x2 + · · · + αn xn) = α1 A(x1) + α2 A(x2) + · · · + αn A(xn). Existuje tedy netriviální lineární kombinace vektorů A(x1), A(x2), . . . , A(xn) rovna nulovému vektoru. (2) Stačí uvést protipříklad. Nechť A je zobrazení definované v příkladu 7.13, které každé funkci přiřadí její derivaci. Nenulová konstantní funkce je v L1 lineárně nezávislá, ale zobrazí se na nulovou funkci, která je samozřejmě lineárně závislá. 7.30. Věta. Nechť A : L1 → L2 je lineární zobrazení. Následující podmínky jsou ekvivalentní: (1) A je prosté. (2) def A = 0. (3) Jsou-li x1, x2, . . . , xn lineárně nezávislé, jsou lineárně nezávislé i vektory A(x1), A(x2), . . . , A(xn). Důkaz. Ekvivalenci těchto podmínek ověříme tak, že dokážeme (1) ⇒ (2), (2) ⇒ (3) a (3) ⇒ (1). (1) ⇒ (2): Je-li A prosté, pak podle definice 7.5 pouze jeden prvek z L1 se může zobrazit na nulový prvek z L2. Protože A je lineární, musí tím prvkem být nulový prvek. Platí tedy Ker A = {o}, def A = dim Ker A = 0. (2) ⇒ (3): Ověříme lineární nezávislost vektorů A(x1), A(x2), . . . , A(xn). Položíme proto α1 A(x1) + α2 A(x2) + · · · + αn A(xn) = o 71 Lineární algebra 7. Lineární zobrazení a vyzkoumáme, co z toho plyne pro koeficienty α1, α2, . . . , αn. Z linearity zobrazení A plyne o = α1 A(x1) + α2 A(x2) + · · · + αn A(xn) = A(α1 x1 + α2 x2 + · · · + αn xn). Podle definice jádra zobrazení 7.16 je tedy (α1 x1 + α2 x2 + · · · + αn xn) ∈ Ker A. Podle předpokladu (2) jádro obsahuje pouze nulový vektor, tj. α1 x1 + α2 x2 + · · · + αn xn = o. Protože vektory x1, x2, . . . , xn jsou lineárně nezávislé, musí αi = 0, ∀i ∈ {1, 2, . . . , n}. Tím jsme dokázali, že i vektory A(x1), A(x2), . . . , A(xn) jsou lineárně nezávislé. (3) ⇒ (1): Nechť x ∈ L1, y ∈ L1, x = y. Dokážeme, že pak A(x) = A(y). Vektor x − y = o je sám o sobě lineárně nezávislý. Podle (3) musí být lineárně nezávislý i vektor A(x − y). Je tedy A(x − y) = o a z linearity zobrazení A plyne A(x) = A(y). Složené zobrazení 7.31. Definice. Nechť A : L1 → L2 a B : L2 → L3 jsou zobrazení. Symbolem B◦A : L1 → L3 označujeme složené zobrazení, které je definováno předpisem (B ◦ A)(x) = B A(x) , ∀x ∈ L1. 7.32. Věta. Nechť A : L1 → L2 a B : L2 → L3 jsou lineární zobrazení. Pak je lineární též složené zobrazení (B ◦ A) : L1 → L3. Důkaz. Nechť x ∈ L1, y ∈ L1, α ∈ R. (B ◦ A)(x + y) = B A(x + y) = B A(x) + A(y) = B A(x) + B A(y) = (B ◦ A)(x) + (B ◦ A)(y) (B ◦ A)(α x) = B A(α x) = B α A(x) = α B A(x) = α (B ◦ A)(x). Inverzní zobrazení 7.33. Definice. Identické zobrazení je zobrazení I : L → L, které je definováno předpisem I(x) = x. Stručně nazýváme zobrazení I identitou. Nechť A : L1 → L2 je prosté zobrazení. Pak definujeme inverzní zobrazení A−1 : A(L1) → L1 jako takové zobrazení, které splňuje A−1 ◦ A = I, kde I : L1 → L1 je identita. 7.34. Věta. Je-li A : L1 → L2 prosté, pak existuje právě jedno inverzní zobrazení A−1 : A(L1) → L1. Důkaz. Pro každý prvek y ∈ A(L1) existuje právě jeden prvek x ∈ L1 takový, že A(x) = y. To plyne přímo z definice 7.5 prostého zobrazení. Definujeme A−1 (y) = x. Vidíme, že A−1 ◦ A je identita. 7.35. Věta. Je-li L lineární prostor, pak identita I : L → L je lineární. Je-li A : L1 → L2 lineární a prosté zobrazení, pak též A−1 : A(L1) → L1 je lineární. Důkaz. Identita je zcela zřejmě lineární. Ověříme linearitu zobrazení A−1 . Počítejme A−1 (x + y) pro x ∈ A(L1), y ∈ A(L1). Podle věty 7.20 je A(L1) lineární podprostor, takže x + y ∈ A(L1). Protože A je prosté, existuje právě jeden vektor a ∈ L1 a právě jeden vektor b ∈ L1 tak, že A(a) = x, A(b) = y. Platí tedy A−1 (x) = a, A−1 (y) = b. Protože A je lineární, je A(a + b) = x + y, neboli A−1 (x + y) = a + b = A−1 (x) + A−1 (y). Protože A je lineární, platí pro α ∈ R, že A(α a) = α x, neboli A−1 (α x) = α a = α A−1 (x). 7.36. Věta. Nechť A : L1 → L2 je lineární, prosté a „na L2. Pak je inverzní zobrazení A−1 : L2 → L1 rovněž lineární, prosté a „na L1. Důkaz. Že je A−1 definováno na celém L2 plyne z toho, že A je „na L2, neboli A(L1) = L2. Že je A−1 lineární plyne z věty 7.35. Že je A−1 prosté plyne z toho, že je A zobrazení. Dvěma různým prvkům x ∈ L2, y ∈ L2 musejí odpovídat různé prvky a ∈ L1 a b ∈ L1 takové, že A(a) = x, A(b) = y. Kdyby mělo platit a = b, okamžitě vidíme, že zobrazení A nemůže splňovat A(a) = x = y = A(b) = A(a). Ukážeme, že A−1 je „na L1. Každý prvek a ∈ L1 je zobrazením A převeden na nějaký prvek A(a) = x ∈ L2. Jinými slovy neexistuje prvek a ∈ L1, který by neměl svůj protějšek A(a) = x ∈ L2. 72 Lineární algebra 7. Lineární zobrazení Izomorfismus7.37. Definice. Zobrazení A : L1 → L2 nazýváme izomorfismus, pokud je lineární, prosté a „na L2. Lineární prostor L1 nazýváme izomorfní s L2, pokud existuje izomorfismus A : L1 → L2. Protože k prostému lineárnímu zobrazení, které je „na L2, existuje inverzní zobrazení A−1 : L2 → L1, které je podle věty 7.36 rovněž izomorfismem, platí: je-li L1 izomorfní s L2, je též L2 izomorfní s L1. Často proto říkáme, že L1 a L2 jsou (vzájemně) izomorfní. 7.38. Poznámka. Izomorfismus A : L1 → L2 převádí podle věty 7.30 lineárně nezávislé vektory v L1 na lineárně nezávislé vektory v L2. Protože je lineární, pak přenáší i další pojmy „linearity z L1 do L2: lineární závislost (věta 7.29), lineární obaly (věta 7.14), podprostory (poznámka 7.15) a báze. Jsou-li L1 a L2 izomorfní, je tedy jedno, zda při vyšetřování „lineárních záležitostí se pohybujeme v L1 nebo v L2. Veškeré struktury přeneseme prostřednictvím izomorfismu do takového lineárního prostoru, se kterým se nám lépe pracuje. Z tohoto pohledu je pro nás důležitá následující věta. 7.39. Věta. Každý lineární prostor L, pro který je dim L = n, je izomorfní s lineárním prostorem Rn . Důkaz. Protože dim L = n, existuje konečná báze {b1, b2, . . . , bn} lineárního prostoru L. Uspořádejme tuto bázi a označme ji (B). Příklad 7.25 ukazuje, že zobrazení A : L → Rn , které každému prvku x ∈ L přiřadí jeho souřadnice vzhledem k bázi (B), je lineární, je „na Rn a platí pro ně def A = 0. Podle věty 7.30 je toto zobrazení prosté, takže podle definice 7.37 jde o izomorfismus. 7.40. Poznámka. Se všemi lineárními prostory konečné dimenze můžeme tedy pracovat stejně jako s Rn . Stačí v lineárním prostoru najít nějakou bázi a dále už jen pracovat se souřadnicemi vzhledem k této bázi. Setkali jsme se například s lineárním prostorem všech polynomů nejvýše n-tého stupně, který je izomorfní s Rn+1 , s lineárním prostorem matic typu (m, n), který je izomorfní s Rm·n a s lineárním prostorem orientovaných úseček, který je izomorfní s R3 . 7.41. Věta. Nechť A : L1 → L2 a B : L2 → L3 jsou izomorfismy. Pak je izomorfismem i složené zobrazení (B ◦ A) : L1 → L3. Důkaz. Že je B ◦ A lineární, dokazuje věta 7.32. Ukážeme, že je B ◦ A prosté. Nechť x ∈ L1, y ∈ L1, x = y. Pak platí A(x) = A(y), protože A je prosté. Také platí B A(x) = B A(y) , protože je B prosté. Tím jsme dokázali, že (B ◦ A)(x) = (B ◦ A)(y). Ukážeme ještě, že je B ◦ A „na L3. Protože je A(L1) = L2 a B(L2) = L3, je též (B ◦ A)(L1) = B A(L1) = B(L2) = L3. 7.42. Věta. Dva lineární prostory konečné dimenze jsou izomorfní právě tehdy, když se rovnají jejich dimenze. Důkaz. Nechť dim L1 = dim L2 = n. Oba lineární prostory jsou izomorfní s Rn podle věty 7.39. Nechť A : L1 → Rn a B : L2 → Rn jsou izomorfismy. Pak podle věty 7.36 je též B−1 : Rn → L2 izomorfismem a podle věty 7.41 je (B−1 ◦ A) : L1 → L2 izomorfismus. Nechť naopak dim L1 = dim L2. Protože izomorfismus převádí podle věty 7.30 lineárně nezávislé vektory na lineárně nezávislé vektory, převádí bázi v L1 na bázi v L2. Takové báze pak musejí mít stejný počet prvků, což je spor s předpokladem dim L1 = dim L2, takže izomorfismus A : L1 → L2 neexistuje. Matice lineárního zobrazení 7.43. Definice. Nechť L1 a L2 jsou lineární prostory konečné dimenze, A : L1 → L2 je lineární. Nechť (B) = (b1, b2, . . . , bn) je uspořádaná báze L1 a (C) = (c1, c2, . . . , cm) je uspořádaná báze L2. Matici A typu (m, n), která splňuje maticovou rovnost A(b1), A(b2), . . . , A(bn) = (c1, c2, . . . , cm) · A, (7.4) nazýváme maticí zobrazení A vzhledem k uspořádaným bázím (B) a (C). Na definiční rovnost (7.4) se díváme jako na součin jednořádkové matice vektorů (c1, c2, . . . , cm) s maticí A reálných čísel typu (m, n), který se má rovnat jednořádkové matici vektorů A(b1), A(b2), . . . , A(bn) . 73 Lineární algebra 7. Lineární zobrazení 7.44. Věta. Nechť platí předpoklady z definice 7.43. Pak matice A zobrazení A vzhledem k bázím (B) a (C) existuje a je určena jednoznačně. Důkaz. Povšimneme si, že i-tý sloupec matice A obsahuje souřadnice vektoru A(bi) vzhledem k bázi (C). To plyne přímo z definiční rovnosti (7.4) a z definice součinu matic. Máme tedy metodu, jak sestavit matici zobrazení. Vzhledem k tomu, že jsou souřadnice vektoru vzhledem k bázi (C) určeny jednoznačně, je i matice A zobrazení A určena tímto zobrazením a bázemi (B) a (C) jednoznačně. 7.45. Věta. Nechť L1, L2 jsou lineární prostory konečné dimenze, (B) = (b1, b2, . . . , bn) je uspořádaná báze L1 a (C) = (c1, c2, . . . , cm) je uspořádaná báze L2. Pak ke každé matici A typu (m, n) existuje právě jedno lineární zobrazení A : L1 → L2 takové, že A je maticí zobrazení A vzhledem k bázím (B) a (C). Důkaz. Rovnost (7.4) udává hodnoty zobrazení A na prvcích báze B. Z věty 7.27 víme, že známe-li hodnoty lineárního zobrazení na bázi, je toto lineární zobrazení určeno jednoznačně na celém definičním oboru. 7.46. Poznámka. Předchozí dvě věty ukazují, že pokud pevně zvolíme báze (B) v L1 a (C) v L2, pak je lineární zobrazení určeno svou maticí jednoznačně a obráceně, lineární zobrazení jednoznačně určuje svou matici. Místo lineárních zobrazení na lineárních prostorech konečné dimenze se tak můžeme zabývat jen maticemi těchto zobrazení bez ztráty informace. 7.47. Poznámka. Transponujeme-li definiční rovnost (7.4), dostáváme maticovou rovnost    A(b1) ... A(bn)    = AT ·   c1 ... cm   , se kterou se můžeme setkat v některých učebnicích jako s definiční rovností pro matici lineárního zobrazení A. Všimněme si, že se zde pracuje s maticí transponovanou k matici lineárního zobrazení. Hodnost matice zobrazení 7.48. Věta. Nechť (B) je báze v L1, (C) je báze v L2, A : L1 → L2 je lineární a A je maticí zobrazení A vzhledem k bázím (B) a (C). Pak hod A = hod A. Důkaz. Označíme-li symboly A1, A2, . . . , An jednotlivé sloupce matice A, pak platí: hod A = dim A(L1) = dim A B = dim A(B) = dim A(b1), A(b2), . . . , A(bn) = = dim (c1, c2, . . . , cm) · A1, (c1, c2, . . . , cm) · A2, . . . , (c1, c2, . . . , cm) · An = = dim A1, A2, . . . , An = hod A. V uvedené řadě rovností jsme nejprve použili definici hodnosti zobrazení 7.21, dále vlastnosti báze, dále větu 7.14, pak jsme rozepsali množinu A(B) výčtem prvků, dále jsme využili rovnost (7.4) a konečně jsme využili toho, že maximální počet lineárně nezávislých vektorů z množiny {A1, A2, . . . , An} (věta 3.18) je roven maximálnímu počtu lineárně nezávislých vektorů ze „skoro stejné množiny, jen každý vektor je násoben stejným řádkem lineárně nezávislých vektorů (c1, c2, . . . , cm). Úplně poslední rovnost je v souladu s definicí hodnosti matice 3.15 při použití věty 3.31. Zobrazení souřadnic 7.49. Věta. Nechť (B) = (b1, b2, . . . , bn) je báze v L1, (C) = (c1, c2, . . . , cm) je báze v L2, A : L1 → L2 je lineární a A je maticí zobrazení A vzhledem k bázím (B) a (C). Pak pro každý vektor x ∈ L1, x = (x1, x2, . . . , xn)(B), platí pro souřadnice vektoru A(x) = (y1, y2, . . . , ym)(C) následující rovnost: A ·     x1 x2 ... xn     =     y1 y2 ... ym     . (7.5) 74 Lineární algebra 7. Lineární zobrazení Důkaz. Označme A = (ai,j), i ∈ {1, 2, . . . , m}, j ∈ {1, 2, . . . , n}. Protože x = (x1, x2, . . . , xn)(B), je podle definice 6.10 x = x1 b1 + x2 b2 + · · · + xn bn. Pro vektor A(x) platí: A(x) = A(x1 b1 + x2 b2 + · · · + xn bn) = x1A(b1) + x2A(b2) + · · · + xnA(bn) = = x1 (c1 a1,1 + c2 a2,1 + · · · + cm am,1) + x2 (c1 a1,2 + c2 a2,2 + · · · + cm am,2) + · · · + + · · · + xn (c1 a1,n + c2 a2,n + · · · + cm am,n) = = c1 (a1,1 x1 + a1,2 x2 + · · · + a1,n xn) + c2 (a2,1 x2 + a2,2 x2 + · · · + a2,n xn) + · · · + + · · · + cm (am,1 x2 + am,2 x2 + · · · + am,n xn) = = y1 c1 + y2 c2 + · · · + ym cm. Z definice 6.10 vidíme, že čísla yj jsou souřadnicemi vektoru A(x) vzhledem k bázi (C). Z poslední rovnosti našeho výpočtu plyne, že yj = aj,1 x2 + aj,2 x2 + · · · + aj,n xn, ∀j ∈ {1, 2, . . . , m}, což ale podle definice maticového násobení 3.34 není nic jiného, než dokazovaný vzorec (7.5). 7.50. Poznámka. Právě dokázaná věta dává jednoduchý návod, jak počítat souřadnice hodnot zobrazení A, známe-li matici tohoto zobrazení. 7.51. Příklad. Vraťme se k příkladu 7.28. Je dáno zobrazení A : R3 → R4 . V příkladu jsme vypočítali, že A(x1, x2, x3) = (x2, −4x1 + 2x3, −2x1 + x2 + x3, −2x1 + x3). Najdeme matici A tohoto zobrazení vzhledem ke standardním bázím. Protože složky (x1, x2, x3) i složky hodnot zobrazení A jsou podle věty 6.29 současně souřadnicemi vzhledem ke standardním bázím, můžeme podle věty 7.49 psát: A ·   x1 x2 x3   =    x2 −4x1 + 2x3 −2x1 + x2 + x3 −2x1 + x3    . Z této maticové rovnosti můžeme okamžitě zapsat prvky matice A. V každém řádku této matice jsou koeficienty lineární kombinace čísel x1, x2, x3, které vedou na výsledek v odpovídajícím řádku na pravé straně. Je tedy A =     0 1 0 −4 0 2 −2 1 1 −2 0 1     . 7.52. Příklad. Ještě jednou se vrátíme k příkladu 7.28. Označme (B) = (1, 1, 2), (1, 2, 2), (2, 5, 1) . V příkladu jsme ověřili, že se jedná o bázi v R3 . Najdeme matici A zobrazení A vzhledem k bázím (B) a (S), kde symbolem (S) značíme standardní uspořádanou bázi v R4 . Zopakujme zadání příkladu: A(1, 1, 2) = (1, 0, 1, 0), A(1, 2, 2) = (2, 0, 2, 0), A(2, 1, 5) = (1, 2, 2, 1). Podle důkazu věty 7.44 obsahuje i-tý sloupec matice A souřadnice vektoru A(bi) vzhledem k bázi (S). Protože se jedná o standardní bázi, jsou tyto souřadnice přímo složkami vektorů A(bi). Můžeme tedy přímo zapsat matici A zobrazení A vzhledem k bázím (B) a (S): A =     1 2 1 0 0 2 1 2 2 0 0 1     . (7.6) 75 Lineární algebra 7. Lineární zobrazení Defekt + hodnost zobrazení 7.53. Věta. Nechť L1, L2 jsou lineární prostory konečné dimenze, A : L1 → L2 je lineární. Pak def A + hod A = dim L1. Důkaz. Zvolme nějakou bázi (B) v L1 a bázi (C) v L2. Nechť A je matice zobrazení A vzhledem k bázím (B) a (C). Podle věty 7.49 je Ker A = x ∈ L1; A(x) = o =    x ∈ L1; x = (x1, x2, . . . , xn)(B) a A ·   x1 ... xn   =   0 ... 0      . Protože z příkladu 7.25 víme, že zobrazení, které vektoru x přiřadí jeho souřadnice, je izomorfismem, platí def A = dim Ker A = dim x ∈ L1; A(x) = o = dim a ∈ Rn ; A · aT = oT . Vidíme, že def A je roven dimenzi prostoru řešení homogenní soustavy s maticí soustavy A. Podle věty 5.13 je tato dimenze rovna k = n − hod A, kde n je počet neznámých soustavy. Počet neznámých je v tomto případě roven počtu prvků báze B, takže je roven dim L1. Dostáváme výsledek def A = dim L1 − hod A = dim L1 − hod A. V poslední rovnosti jsme použili větu 7.48. 7.54. Příklad. Je dáno lineární zobrazení A : R4 → R3 předpisem A(x1, x2, x3, x4) = (x1 + 2x2 + 2x3 + 3x4, x1 + 2x2 + 4x3 + 7x4, 2x1 + 4x2 + 3x3 + 4x4). Najdeme matici zobrazení A vzhledem ke standardním bázím. Dále najdeme Ker A, def A a hod A. Podobně jako v příkladu 7.51 sestavíme matici lineárního zobrazení vzhledem ke standardním bázím tak, že zapíšeme koeficienty lineárních kombinací čísel x1, x2, x3, x4 do řádků matice: A =   1 2 2 3 1 2 4 7 2 4 3 4   . Podle důkazu věty 7.53 je Ker A roven množině všech řešení homogenní soustavy Ax = o. Eliminujeme tedy matici soustavy a najdeme všechna řešení   1 2 2 3 1 2 4 7 2 4 3 4   ∼   1 2 2 3 0 0 2 4 0 0 −1 −2   ∼ 1 2 2 3 0 0 1 2 . Při x4 = t, x2 = u je x3 = −2t, x1 = −2u − 2(−2t) − 3t = t − 2u. Jinak napsáno je: (x1, x2, x3, x4) = (t − 2u, u, −2t, t) = t (1, 0, −2, 1) + u (−2, 1, 0, 0), Ker A = (1, 0, −2, 1), (−2, 1, 0, 0) . Dále je def A = dim Ker A = 2, hod A = hod A = 2. Podle věty 7.53 je skutečně 2 + 2 = dim R4 . Matice složeného zobrazení 7.55. Věta. Nechť L1, L2, L3 jsou lineární prostory konečné dimenze, A : L1 → L2, B : L2 → L3 jsou lineární zobrazení. Nechť dále (B) je uspořádaná báze L1, (C) je uspořádaná báze L2 a (D) je uspořádaná báze L3. Předpokládejme ještě, že A je matice zobrazení A vzhledem k bázím (B) a (C) a konečně B je matice zobrazení B vzhledem k bázím (C) a (D). Pak B·A je matice složeného zobrazení B◦A vzhledem k bázím (B) a (D). Důkaz. Při označení (B) = (b1, b2, . . . , bn), (C) = (c1, c2, . . . , cm), (D) = (d1, d2, . . . , dk) podle definice 7.43 platí: A(b1), A(b2), . . . , A(bn) = (c1, c2, . . . , cm) · A, B(c1), B(c2), . . . , B(cm) = (d1, d2, . . . , dk) · B. Protože B je lineární, platí B A(b1) , B A(b2) , . . . , B A(bn) = B(c1), B(c2), . . . , B(cm) · A = (d1, d2, . . . , dk) · B · A. Podle definice 7.31 je B A(x) = (B ◦A)(x), takže B·A je maticí zobrazení B ◦A vzhledem k bázím (B) a (D). 76 Lineární algebra 7. Lineární zobrazení Matice identity 7.56. Věta. Nechť (B) a (C) jsou dvě báze lineárního prostoru L. Pak matice identického zobrazení I : L → L vzhledem k bázím (B) a (C) je rovna matici přechodu A(C,B) od báze (C) k bázi (B). Důkaz. Nechť A je matice identity vzhledem k bázím (B) a (C). Podle (7.4) je I(b1), I(b2), . . . , I(bn) = (b1, b2, . . . , bn) = (c1, c2, . . . , cn) · A. Tato podmínka je ekvivalentní s definicí 6.18 matice přechodu od báze (C) k bázi (B). 7.57. Příklad. Zkusíme se naposledy vrátit k příkladu 7.28. V původním zadání byly dány hodnoty zobrazení A pouze na bázi a našim úkolem bylo zjistit, jak vypadá A na celém definičním oboru. Pokusíme se příklad vyřešit ještě jednou, tentokrát s použitím matic zobrazení vzhledem k různým bázím. Cílem je najít matici zobrazení vzhledem ke standardním bázím. Uveďme báze, se kterými budeme pracovat: (B) = (1, 1, 2), (1, 2, 2), (2, 1, 5) , (S0) = (1, 0, 0), (0, 1, 0), (0, 0, 1) , (S) = (1, 0, 0, 0), (0, 1, 0, 0), (0, 0, 1, 0), (0, 0, 0, 1) . Známe matici A zobrazení A vzhledem k bázím (B) a (S), viz (7.6) v příkladu 7.52. Nechť A(B,S0) je matice přechodu od báze (B) k bázi (S0). Podle věty 7.56 je to zároveň matice identity vzhledem k bázím (S0) a (B). Podle věty 7.55 se matice A složeného zobrazení A ◦ I vzhledem k bázím (S0) a (S) počítá takto: A = A · A(B,S0). Matice A je hledanou maticí zobrazení A vzhledem ke standardním bázím, protože A ◦ I = A. Stačí tedy spočítat matici přechodu A(B,S0) a provést uvedené maticové násobení. Matice přechodu A(S0,B) od báze (S0) k bázi (B) obsahuje ve sloupcích přímo složky vektorů báze (B) (viz například větu 6.30). My bohužel potřebujeme najít matici přechodu od (B) k (S0). Budeme počítat inverzní matici, protože podle věty 6.21 je A(B,S0) = A−1 (S0,B). Níže uvádíme závěrečné výpočty:   1 1 2 1 0 0 1 2 1 0 1 0 2 2 5 0 0 1   ∼   1 1 2 1 0 0 0 2 −1 −1 1 0 0 0 1 −2 0 1   ∼   1 0 0 8 −1 −3 0 1 0 −3 1 1 0 0 1 −2 0 1   , A = A · A(B,S0) =     1 2 1 0 0 2 1 2 2 0 0 1     ·   8 −1 −3 −3 1 1 −2 0 1   =     0 1 0 −4 0 2 −2 1 1 −2 0 1     . 7.58. Poznámka. Při použití věty 7.56 vychází věta 6.23 jako důsledek věty 7.49: je-li A(B,C) maticí přechodu od báze (B) k bázi (C), pak podle věty 6.21 je A−1 (B,C) maticí přechodu od báze (C) k bázi (B). Podle věty 7.56 je A−1 (B,C) rovněž maticí identity vzhledem k bázím (B) a (C). Nyní použijeme větu 7.49. Nechť x ∈ L, x = (x1, x2, . . . , xn)(B), I(x) = x = (y1, y2, . . . , yn)(C), pak platí A−1 (B,C) ·    x1 ... xn    =    y1 ... yn    . Po vynásobení maticí A(B,C) zleva dostáváme tvrzení věty 6.23. A(B,C) ·    y1 ... yn    =    x1 ... xn    . 77 Lineární algebra 7. Lineární zobrazení 7.59. Věta. Nechť A : L1 → L2 je lineární zobrazení a nechť (B1), (C1) jsou báze lineárního prostoru L1 a (B2), (C2) jsou báze lineárního prostoru L2. Označme symbolem A(B1,C1) matici přechodu od báze (B1) k (C1) a A(C2,B2) matici přechodu od báze (C2) k (B2). Je-li A matice zobrazení A vzhledem k bázím (B1), (B2), pak A(C2,B2) · A · A(B1,C1) je matice téhož lineárního zobrazení vzhledem k bázím (C1), (C2). Důkaz. Matice A(B1,C1) je podle věty 7.56 maticí identického zobrazení I1 : L1 → L1 vzhledem k bázím (C1) a (B1). Stejně tak matice A(C2,B2) je maticí identity I2 : L2 → L2 vzhledem k bázím (B2) a (C2). Dále si stačí uvědomit, že A = I2 ◦ A ◦ I1 a použít větu 7.55. Zobrazení do stejného prostoru 7.60. Definice. Nechť A : L → L je lineární zobrazení (lineární prostor vzorů i obrazů je stejný a má konečnou dimenzi). Místo, abychom mluvili o matici lineárního zobrazení vzhledem ke stejným bázím (B) a (B) (to působí, jako bychom koktali), stručně se zmiňujeme o matici zobrazení A vzhledem k bázi (B). 7.61. Věta. Nechť A : L → L je lineární zobrazení, (B), (C) jsou dvě báze lineárního prostoru L a A(B,C) je matice přechodu od báze (B) k bázi (C). Je-li A matice zobrazení A vzhledem k bázi (B), pak A−1 (B,C) · A · A(B,C) je maticí téhož lineárního zobrazení vzhledem k bázi (C). Důkaz. A−1 (B,C) je podle věty 6.21 maticí přechodu od (C) k (B). Zbytek plyne z věty 7.59. 7.62. Poznámka. Protože možné matice přechodu od báze k bázi jsou právě všechny regulární matice, můžeme na základě předchozí věty říci, že dvě matice A, B jsou maticemi stejného lineárního zobrazení A : L → L právě tehdy, když existuje regulární matice P taková, že B = P−1 · A · P. Tyto matice se tedy z pohledu lineárního zobrazení příliš neliší, což vystihuje následující definice: 7.63. Definice. Matice A je podobná matici B, pokud existuje regulární matice P taková, že platí B = P−1 · A · P. 7.64. Poznámka. Je-li A podobná B, pak je i B podobná A, protože místo matice P můžeme použít matici P−1 . Stačí tedy říkat, že matice jsou si vzájemně podobné. Je-li A podobná B a B podobná C, pak je A podobná C, protože součin regulárních matic je matice regulární a protože (PQ)−1 = Q−1 P−1 . Matice je podobná sama sobě, protože E je regulární. Vlastní číslo, vlastní vek- tor 7.65. Poznámka. Následující část textu o vlastních číslech jsem ke kapitole o lineárních zobrazeních zařadil poté, co byla do osnov algebry pro první ročník zařazena zmínka o vlastních vektorech. Je to téma docela rozsáhlé. Zde jsou uvedeny jen základní vlastnosti, takže čtenář s hlubšími zájmy o tuto problematiku bude muset sáhnout po jiném zdroji informací, například [14]. 7.66. Definice. Nechť A : L → L je lineární zobrazení. Číslo λ ∈ C se nazývá vlastním číslem zobrazení A, pokud existuje vektor x ∈ L, x = o takový, že A(x) = λ x. Vektor x, který splňuje uvedenou rovnost, se nazývá vlastní vektor zobrazení A příslušný vlastnímu číslu λ. 7.67. Poznámka. Protože vlastní číslo může být číslo komplexní, je potřeba pracovat s modifikovanou definicí lineárního prostoru 1.6, ve které nahradíme množinu reálných čísel množinou čísel komplexních. Jak plyne z definice 7.66, budeme totiž nuceni při práci s vlastními čísly a vlastními vektory násobit vlastní vektor komplexním číslem. V modelových příkladech se pokusím komplexním číslům vyhnout. 7.68. Poznámka. Pokud existuje vlastní číslo zobrazení A, pak mu přísluší více vlastních vektorů. Přidáme-li k těmto vektorům vektor nulový, dostáváme lineární podprostor prostoru L. Skutečně, pokud x, y splňují A(x) = λ x, A(y) = λ y, pak A(x + y) = A(x) + A(y) = λ x + λ y = λ (x + y), A(α x) = α A(x) = αλ x = λ (α x). 7.69. Poznámka. Pojem vlastní číslo definujeme nejenom pro lineární zobrazení, ale rovněž pro čtvercové matice. Záhy zjistíme, že mezi vlastním číslem zobrazení a matice je úzká souvislost. 7.70. Definice. Nechť A je čtvercová matice typu (n, n) reálných nebo komplexních čísel. Číslo λ ∈ C se nazývá vlastním číslem matice A, pokud existuje vektor x ∈ Cn , x = o, takový, že A · xT = λ xT . Vektor x, který splňuje uvedenou rovnost, se nazývá vlastní vektor matice A příslušný vlastnímu číslu λ. 78 Lineární algebra 7. Lineární zobrazení 7.71. Věta. Nechť A : L → L je lineární zobrazení a A je jeho matice vzhledem k nějaké bázi (B). Pak λ je vlastním číslem zobrazení A právě tehdy, když je vlastním číslem matice A. Navíc x je vlastní vektor zobrazení A příslušný λ právě tehdy, když souřadnice vektoru x vzhledem k bázi (B) tvoří vlastní vektor matice A příslušný λ. Důkaz. Označme u ∈ Cn souřadnice vektoru x v bázi (B). Podle věty 7.49 sloupec A · uT obsahuje souřadnice obrazu A(x) vzhledem k bázi (B). Takže A(x) = λ x právě tehdy, když A · uT = λ uT . 7.72. Poznámka. Množina všech vlastních čísel lineárního zobrazení nebo matice se nazývá spektrum. Vlastním číslům/vektorům někteří čeští autoři říkají charakteristická čísla/vektory (anglicky eigenvalue, eigenvector, což je odvozeno z němčiny). 7.73. Poznámka. Vlastní číslo zobrazení A je podle předchozí věty vlastním číslem všech matic tohoto zobrazení (vzhledem k rozličným bázím). Tyto matice jsou podle poznámky 7.62 vzájemně podobné. Můžeme tedy říci, že pokud P je regulární matice, pak vlastní čísla matic A a P−1 · A · P jsou stejná. 7.74. Poznámka. Přikročíme nyní k výpočtu vlastních čísel, je-li dána čtvercová matice A. Vyjdeme z rovnosti A · xT = λ xT = λ E · xT . Z obou stran této rovnice odečteme λ E · xT . Dostáváme vztah A·xT −λ E·xT = (A−λ E)·xT = oT . Z definice vlastního čísla víme, že příslušný vlastní vektor x musí být nenulový. Je tedy zřejmé, že λ bude vlastním číslem matice A právě tehdy, když homogenní soustava s maticí A − λ E bude mít nenulové řešení. Tímto řešením pak bude vlastní vektor příslušný vlastnímu číslu λ. Aby tato soustava měla nenulové řešení, musí její matice být singulární, tj. musí det(A−λ E) = 0. Tím máme odvozen vzorec na výpočet vlastních čísel. Uvědomíme si ještě, že det(A − λ E) je polynom v proměnné λ. Tento polynom se nazývá charakteristický polynom matice A. Jeho stupeň je stejný, jako počet řádků matice A. Označme toto číslo n. Abychom tedy našli všechna vlastní čísla dané matice, stačí najít všechny kořeny charakteristického polynomu této matice. Podle základní věty algebry těchto kořenů (včetně jejich násobnosti) je n. Každá matice má tedy n vlastních čísel (obecně ne vzájmeně různých). Každé lineární zobrazení A : L → L má tolik vlastních čísel, kolik je dimeze L. 7.75. Definice. Nechť A je čtvercová matice. Polynom det(A − λ E) nazýváme charakteristický polynom matice A a rovnost det(A − λ E) = 0 charakteristickou rovnicí. Je-li λ k-násobným kořenem charakteristické rovnice, říkáme, že λ je k-násobným vlastním číslem. 7.76. Příklad. Uvedeme ještě celý postup odvození výpočtu vlastních čísel matice (viz předchozí poznámku) znovu na konkrétním numerickém příkladě, protože odvození může pro někoho být na konkrétním příkladě názornější. Budeme hledat vlastní čísla a vlastní vektory matice A =   5 −2 2 −1 4 −1 −4 4 −1   . Podle definice 7.70 hledáme takové číslo λ a vektor x = (x1, x2, x3), aby byla splněna maticová rovnost   5 −2 2 −1 4 −1 −4 4 −1   ·   x1 x2 x3   = λ   x1 x2 x3   , a přitom vektor x byl nenulový. Rozepíšeme tuto rovnost do složek: 5x1 − 2x2 + 2x3 = λx1 −x1 + 4x2 − x3 = λx2 −4x1 + 4x2 − x3 = λx3 tj. (5 − λ)x1 − 2x2 + 2x3 = 0 −x1+(4 − λ)x2 − x3 = 0 −4x1 + 4x2+(−1 − λ)x3 = 0 Potřebujeme, aby uvedená homogenní soustava se čtvercovou maticí měla nenulové řešení. Matice soustavy tedy musí být singulární, tj. musí mít nulový determinant: det   5 − λ −2 2 −1 4 − λ −1 −4 4 −1 − λ   = 0. 79 Lineární algebra 7. Lineární zobrazení Hledáme tedy λ takové, aby det(A − λE) = 0. Příště už toto odvození nebudeme opakovat, ale začneme rovnou od rovnice det(A − λE) = 0. det(A − λE) = (5 − λ)(4 − λ)(−1 − λ) − 16 − −4(4 − λ) − 4(5 − λ) + 2(−1 − λ) = −(λ − 3)2 (λ − 2), takže vlastní čísla jsou λ = 3 a λ = 2. Najdeme ještě vlastní vektory. Nejprve najdeme vlastní vektory příslušné vlastnímu číslu 3:   5 − 3 −2 2 −1 4 − 3 −1 −4 4 −1 − 3   =   2 −2 2 −1 1 −1 −4 4 −4   ∼ 1 −1 1 . Báze řešení homogenní soustavy s maticí (1 −1 1) je například {(1, 1, 0), (−1, 0, 1)}. Toto jsou dva lineárně nezávislé vlastní vektory, které přísluší vlastnímu číslu 3. Všechny vlastní vektory příslušející vlastnímu číslu 3 tvoří lineární obal této báze, ovšem bez nulového vektoru. Nyní najdeme vlastní vektory, které přísluší vlastnímu číslu 2:   5 − 2 −2 2 −1 4 − 2 −1 −4 4 −1 − 2   =   3 −2 2 −1 2 −1 −4 4 −3   ∼   −1 2 −1 0 4 −1 0 −4 1   ∼ −1 2 −1 0 4 −1 . Dimenze prostoru řešení homogenní soustavy s touto maticí je 1, tj. stačí najít jeden vektor řešení: (−2, 1, 4) a ostatní vektory řešení jsou jeho násobky. Tato řešení (bez nulového) jsou též všechny vlastní vektory matice A, které přísluší vlastnímu číslu 2. Celkem tedy má matice A tři lineárně nezávislé vlastní vektory: (1, 1, 0), (−1, 0, 1), (−2, 1, 4). První dva příslušejí vlastnímu číslu 3 a poslední přísluší vlastnímu číslu 2. 7.77. Příklad. Následující příklad ukazuje, že nemusí existovat tolik lineárně nezávislých vlastních vektorů, kolik řádků má matice. Budeme hledat vlastní čísla a vlastní vektory matice: A =   2 4 −3 −1 10 −6 −1 8 −4   . Vypočteme determinant matice A − λE: det   2 − λ 4 −3 −1 10 − λ −6 −1 8 −4 − λ   = −(λ − 3)2 (λ − 2). Vidíme, že matice má stejná vlastní čísla, jako matice z předchozího příkladu. Nyní vypočítáme vlastní vektory: λ = 3 :   2 − 3 4 −3 −1 10 − 3 −6 −1 8 −4 − 3   =    −1 4 −3 −1 7 −6 −1 8 −7    ∼    −1 4 −3 0 3 −3 0 4 −4    ∼ −1 4 −3 0 1 −1 vlastní vektor: (1, 1, 1) λ = 2 :   2 − 2 4 −3 −1 10 − 2 −6 −1 8 −4 − 2   =    0 4 −3 −1 8 −6 −1 8 −6    ∼ −1 8 −6 0 4 −3 vlastní vektor: (0, 3, 4) Na rozdíl od předchozího příkladu vícenásobnému vlastnímu číslu 3 přísluší jen jeden lineárně nezávislý vlastní vektor. Tato matice má tedy dohromady jen dva lineárně nezávislé vlastní vektory: (1, 1, 1), (0, 3, 4), které po řadě příslušejí vlastním číslům 3 a 2. 7.78. Věta. Podobné matice mají stejný charakteristický polynom. Důkaz. Nechť P je regulární. Matice P−1 AP je podobná matici A. Vypočteme její charakteristický polynom: det(P−1 AP − λ E) = det(P−1 AP − λ P−1 EP) = det(P−1 AP − P−1 λ EP) = = det(P−1 (A − λ E) P) = det P−1 det(A − λ E) det P = det(A − λ E), protože det P−1 det P = 1. 80 Lineární algebra 7. Lineární zobrazení 7.79. Poznámka. Právě uvedený výsledek je v souladu s poznámkou 7.73. 7.80. Poznámka. Matice z příkladů 7.76 a 7.77 mají sice stejný charakteristický polynom, ale za chvíli ukážeme, že si nejsou podobné. Tvrzení věty 7.78 tedy nelze obrátit. Podobnost s diagonální maticí 7.81. Příklad. Diagonální matice D =      λ1 0 0 . . . 0 0 λ2 0 . . . 0 0 0 λ3 . . . 0 . . . . . . . . . . . . . . . . . 0 0 0 . . . λn      má charakteristický polynom (λ1 −λ) (λ2 −λ) · · · (λn −λ), protože determinant diagonální matice D−λ E je roven součinu prvků na diagonále. Vlastní čísla matice D tedy jsou λ1, λ2, . . . , λn. Vlastní vektor matice D příslušný vlastnímu číslu λi je vektor obsahující samé nuly s výjimkou i-té složky, ve které je nějaké nenulové číslo, třeba jednička. Matici D z tohoto příkladu budeme značit D = diag(λ1, λ2, . . . , λn). Tím ušetříme papír. 7.82. Věta. Nechť A je čtvercová matice typu (n, n). Sestavme libovolná komplexní čísla λ1, . . . , λn do diagonální matice D = diag(λ1, . . . , λn) a libovolné nenulové vektory x1, . . . , xn z Cn zapišme do sloupců matice P, tj. P = (xT 1 , . . . , xT n ). Pak platí: čísla λ1, . . . , λn jsou vlastními čísly matice A a x1, . . . , xn jsou jejich odpovídající vlastní vektory právě tehdy, když je splněna rovnost PD = AP. Důkaz. Rozepišme maticové násobení: PD = (xT 1 , . . . , xT n )·diag(λ1, . . . , λn) = (λ1 xT 1 , . . . , λn xT n ). Dále je AP = A(xT 1 , . . . , xT n ) = (AxT 1 , . . . , AxT 1 ). Máme tedy obě strany zkoumané rovnosti PD = AP rozepsány do sloupců. Vidíme, že rovnost v i-tém sloupci λi xT i = AxT i platí právě tehdy, když λi je vlastní číslo matice A a xi je příslušný vlastní vektor. 7.83. Věta. Nechť má čtvercová matice A s n řádky n lineárně nezávislých vlastních vektorů (každý z nich přísluší nějakému vlastnímu číslu matice). Pak je matice A podobná diagonální matici. Důkaz. Sestavíme diagonální matici D z vlastních čísel příslušných vlastním vektorům x1, . . . , xn. Dále použijeme předchozí větu. Protože matice P = (xT 1 , . . . , xT n ) obsahuje podle předpokladu věty lineárně nezávislé sloupce, je P regulární, takže je možné vztah PD = AP vynásobit zprava maticí P−1 . Dostáváme A = PDP−1 , takže matice A je podobná matici D. 7.84. Věta. Nechť je matice A podobná diagonální matici, to znamená, že existuje regulární matice P a diagonální matice D takové, že A = PDP−1 . Pak D obsahuje vlastní čísla matice A a ve sloupcích matice P jsou vlastní vektory příslušné (podle pořadí) odpovídajícím vlastním číslům zapsaným v D. Důkaz. Po převedení vztahu A = PDP−1 na AP = PD stačí použít větu 7.82. 7.85. Příklad. Matice z příkladu 7.76 má tři řádky a tři lineárně nezávislé vlastní vektory. Jsou tedy splněny předpoklady věty 7.83 a matice je podobná diagonální matici. Věta 7.84 nám dává návod, jak najít matici P a diagonální matici. Sestavíme vlastní vektory (1, 1, 0), (−1, 0, 1), (−2, 1, 4) do sloupců a dostáváme matici P. Sestavíme v odpovídajícím pořadí vlastní čísla do diagonální matice, a dostáváme matici D, pro kterou platí A = PDP−1 . Konkrétně: A =   5 −2 2 −1 4 −1 −4 4 −1   =   1 −1 −2 1 0 1 0 1 4   ·   3 0 0 0 3 0 0 0 2   ·   1 −1 −2 1 0 1 0 1 4   −1 . 7.86. Příklad. Matice z příkladu 7.77 nemá tolik lineárně nezávislých vlastních vektorů, jako je počet jejích řádků. To znamená, že není podobná diagonální matici (kdyby byla, pak dostaneme spor s větou 7.84. Protože matice z příkladu 7.76 je podobná diagonální matici, zatímco matice z příkladu 7.77 není, nejsou si tyto matice ani vzájemně podobné. 81 Lineární algebra 7. Lineární zobrazení 7.87. Věta. Vlastní vektory, které příslušejí vzájemně různým vlastním číslům, jsou lineárně nezávislé. Důkaz. Jeden vlastní vektor je samozřejmě lineárně nezávislý, protože je podle definice nenulový. Dále postupujeme indukcí. Přepokládáme, že matice A má lineárně nezávislé vlastní vektory x1, . . . xk příslušející různým vlastním číslům λ1, . . . , λk a přidáme do této skupiny vlastní vektor xk+1 příslušející zatím nepoužitému vlastnímu číslu λk+1. Předpokládáme rovnost k+1 i=1 αixi = o a ukážeme, že všechny koeficienty αi musejí být nulové. Tím dokážeme lineární nezávislost. Rovnost transponujeme a vynásobíme zleva maticí A − λk+1E. Dostáváme: (A−λk+1E) k+1 i=1 αixT i = k+1 i=1 αi(AxT i −λk+1xT i ) = k+1 i=1 αi(λixT i −λk+1xT i ) = k+1 i=1 αi(λi −λk+1) xT i = oT . Koeficient u posledního sčítance v této rovnosti je nulový, protože λk+1 − λk+1 = 0. Podle indukčního předpokladu jsou vektory x1, . . . xk lineárně nezávislé, takže i ostatní koeficienty musejí být nulové. Protože ale λi = λk+1, musí αi = 0 pro i ∈ {1, . . . , k}. Dosadíme-li tento poznatek do výchozího tvaru rovnosti, máme 0 x1 + · · · + 0 xk + αk+1xk+1 = αk+1xk+1 = o. Protože xk+1 je vlastní vektor a tudíž nenulový, musí αk+1 = 0. 7.88. Poznámka. Nechť A je typu (n, n) a nechť jsou všechna vlastní čísla matice A jednonásobná. To znamená, že existuje n různých vlastních čísel. Pak podle předchozí věty jim příslušející vlastní vektory jsou lineárně nezávislé. Podle věty 7.83 je tedy matice A podobná diagonální matici. 7.89. Poznámka. Uvažujme matici A typu (n, n). Může se stát, že nějaké vlastní číslo λ této matice je vícenásobné. To může ale nemusí způsobit, že k matici A přestane existovat podobná diagonální matice. Záleží na číslu dλ = n−hod(A−λE). Protože A−λE je singulární, je toto číslo aspoň 1. Vzhledem k tomu, že dλ je dimenze prostoru řešení homogenní soustavy (A − λE) x = o, můžeme najít k vlastnímu číslu λ právě dλ lineárně nezávislých vlastních vektorů. Prostudujeme-li zpětně důkaz věty 7.87, shledáme, že jsme v indukčním kroku nepotřebovali vzájemnou různost vlastních čísel λ1, . . . , λk, jen jsme chtěli, aby λk+1 bylo od ostatních různé. Pokud je číslo dλ pro každé vícenásobné vlastní číslo rovno jeho násobnosti, pak můžeme postupně do „balíčku linárně nezávislých vlastních vektorů přihazovat za každé vlastní číslo tolik vektorů, kolik je násobnost vlastního čísla. Dohromady získáme n lineárně nezávislých vektorů, takže podle věty 7.83 je A podobná diagonální matici. 7.90. Poznámka. Stále předpokládáme čtvercovou matici A typu (n, n). Problémy nastanou, pokud číslo dλ = n−hod(A−λE) je menší než násobnost vlastního čísla λ. Pak nelze najít n lineárně nezávislých vlastních vektorů a matice A není podobná diagonální matici. Příklad 7.77 ilustruje, že takové případy opravdu nastávají. Matice A je pak podobná jen „skoro diagonální matici , která má na hlavní diagonále vlastní čísla a těsně nad touto diagonálou se občas vyskytují jedničky. Této matici se říká Jordanův kanonický tvar. Je potřeba definovat tzv. zobecněný vlastní vektor a tento pojem použít k vybudování regulární matice P, která převádí matici A na Jordanův kanonický tvar. Všechny tyto pojmy vyžadují hlubší studium a přesahují bohužel rámec tohoto úvodního textu. Pro další studium lze doporučit [14]. 7.91. Poznámka. Věty 7.83 a 7.84 se dají formulovat z úhlu pohledu lineárního zobrazení: 7.92. Věta. Nechť A : L → L je lineární zobrazení, dim L = n. Zobrazení A má n lineárně nezávislých vlastních vektorů právě tehdy, když existuje báze (B) prostoru L taková, že A má vzhledem k této bázi diagonální matici D. Přitom na diagonále matice D jsou vlastní čísla zobrazení A a báze (B) obsahuje vlastní vektory příslušné vlastním číslům v matici D ve stejném pořadí. Důkaz. Zvolme nějakou výchozí bázi (V ) prostoru L. Označme symbolem A matici zobrazení A vzhledem k bázi (V ). Existence báze (B) takové, že matice zobrazení A vzhledem k ní je D, je ekvivalentní s platností vztahu A = PDP−1 , kde P je matice přechodu od (V ) k (B). Dále při důkazu tvrzení „právě tehdy když použijeme v jednom směru větu 7.83. V druhém směru použijeme větu 7.84 a skutečnost, že matice přechodu P obsahuje ve sloupcích souřadnice báze (B) vzhledem k bázi (V ). 7.93. Poznámka. Při práci s lineárním zobrazením se někdy hodí zvolit takovou bázi, ve které je matice tohoto zobrazení „co nejbližší matici diagonální. Právě vyslovená věta říká, že za jistých okolností lze zvolit bázi, vzhledem ke které je matice zobrazení přímo diagonální. Pokud (x1, . . . , xn) jsou souřadnice vstupního vektoru x vzhledem k této bázi, pak výstupní vektor A(x) má vzhledem ke stejné bázi souřadnice (λ1x1, . . . , λnxn), kde λ1, . . . , λn jsou vlastní čísla tohoto zobrazení. 82 8. Lineární prostory se skalárním součinem 8.1. Poznámka. Lineární prostor je libovolná množina, na které je definováno sčítání a násobení konstantou tak, aby byly splněny vlastnosti (1) až (7) z definice 1.6. Pokud na takové množině navíc definujeme násobení prvků mezi sebou tak, že výsledek násobení je reálné číslo a násobení splňuje níže uvedené vlastnosti (1) až (4), definovali jsme na lineárním prostoru skalární součin. Ten nám umožní pracovat s novými vlastnostmi prvků lineárního prostoru, jako je jejich velikost a úhel mezi dvěma prvky. Definice skalárního součinu 8.2. Definice. Nechť L je lineární prostor. Operaci · : L × L → R nazveme skalárním součinem, pokud splňuje ∀x ∈ L, ∀y ∈ L, ∀z ∈ L, ∀α ∈ R následující vlastnosti (1) x · y = y · x, (2) (x + y) · z = x · z + y · z, (3) (α · x) · y = α · (x · y), (4) x · x ≥ 0, x · x = 0 jen tehdy, když x = o. Ve vlastnosti (4) značí symbol o nulový vektor lineárního prostoru L. Lineární prostor L, na kterém je definován skalární součin, nazýváme lineárním prostorem se skalárním součinem. 8.3. Poznámka. Je třeba rozlišovat mezi podobně znějícími pojmy „skalární násobek a „skalární součin . Skalární násobek · : R × L → L je násobek vektoru reálným číslem, který je definován v každém lineárním prostoru. Na druhé straně skalární součin · : L × L → R je součin vektorů mezi sebou. 8.4. Poznámka. Upozorňujeme, že stejně jako v definici lineárního prostoru 1.6, jsou ve vlastnostech (1) až (4) definice skalárního součinu používány symboly „+ a „· v různých významech podle toho, jakého typu jsou jejich operandy. Například první „+ ve vlastnosti (2) označuje sčítání vektorů podle definice lineárního prostoru, zatímco druhé „+ v této vlastnosti je sčítáním reálných čísel. Nebo první symbol „· ve vlastnosti (3) znamená skalární násobek definovaný v lineárním prostoru L, druhý symbol „· označuje skalární součin. Třetí symbol „· ve vlastnosti (3) je součin reálných čísel a poslední symbol „· v této vlastnosti znovu znamená skalární součin. Dále připomínáme, že budeme symbol „· jako dosud často vynechávat, takže místo x · y budeme stručně psát xy. 8.5. Poznámka. Všimneme si, že jsme v definici 1.6 lineárního prostoru definovali tento prostor „nad reálnými čísly , protože jsme definovali násobek vektoru reálným číslem. Nic nám ale nebránilo zcela stejně definovat násobek vektoru komplexním číslem. Až dosud jsme mohli nahradit slovo „reálné číslo slovem „komplexní číslo a naše teorie by zůstala platná. Všechny předchozí věty by nadále platily. Kdybychom ale chtěli definovat skalární součin jako komplexní číslo, museli bychom upravit vlastnost (1) definice 8.2 takto: (1) xy = yx, kde pruh nad komplexním číslem yx značí komplexně sdružené číslo. Některá tvrzení se tedy budou v případě komplexního skalárního součinu nepatrně lišit od tvrzení, která níže dokážeme. Protože se většina čtenářů tohoto textu nachází zatím v prvním semestru a nemá za sebou analýzu komplexních čísel, zjednodušíme si život tím, že zůstaneme u reálných čísel. Pro odvození důležitých vlastností lineárních prostorů se skalárním součinem nám to bude stačit. Zájemce o důsledky definice komplexního skalárního součinu odkážeme například na učebnici [5]. 8.6. Věta. Nechť L je lineární prostor se skalárním součinem, o je jeho nulový vektor. Pak pro všechna x ∈ L, y ∈ L a z ∈ L platí: (1) x · o = o · x = 0, (2) z · (x + y) = zx + zy. Důkaz. První vlastnost plyne z vlastnosti (7) definice lineárního prostoru 1.6 a z vlastnosti (3) definice skalárního součinu 8.2. Platí (0y) · x = 0 · xy = 0 Druhá vlastnost plyne z komutativity skalárního součinu, tj. z vlastnosti (1) definice 8.2 a dále z vlastnosti (2) této definice. 83 Lineární algebra 8. Lineární prostory se skalárním součinem Skalární součiny na Rn 8.7. Příklad. Pro x ∈ Rn , y ∈ Rn , x = (x1, x2, . . . , xn), y = (y1, y2, . . . , yn) definujme x · y = x1y1 + x2y2 + · · · + xnyn. (8.1) Ukážeme, že takto definovaný součin vektorů x a y je skalárním součinem. Je x · y ∈ R. Nechť ještě z ∈ Rn , z = (z1, z2, . . . , zn) a α ∈ R. Ověříme postupně vlastnosti (1) až (4): (1) x · y = x1y1 + x2y2 + · · · + xnyn = y1x1 + y2x2 + · · · + ynxn = y · x, (2) (x + y) · z = (x1 + y1) z1 + (x2 + y2) z2 + · · · + (xn + yn) zn = = x1z1 + x2z2 + · · · + xnzn + y1z1 + y2z2 + · · · + ynzn = x · z + y · z, (3) (α · x) · y = αx1y1 + αx2y2 + · · · + αxnyn = α (x1y1 + x2y2 + · · · + xnyn) = α (x · y), (4) x · x = x2 1 + x2 2 + · · · + x2 n ≥ 0. Vidíme, že z x2 1 + x2 2 + · · · + x2 n = 0 plyne x1 = x2 = · · · = xn = 0, takže je splněna i druhá část vlastnosti (4). Skalární součin na Rn definovaný vzorcem (8.1) nazýváme standardním skalárním součinem. Následující příklady ukazují, že existují i jiné skalární součiny na Rn . 8.8. Příklad. Definujme součin na R2 takto (x1, x2) · (y1, y2) = x1y1 + 6x2y2 + 2x1y2 + 2x2y1. Ukážeme, že takto definovaný součin je skalárním součinem na R2 . Ověříme vlastnosti (1) až (4) definice 8.2 (1) (x1, x2) · (y1, y2) = x1y1 + 6x2y2 + 2x1y2 + 2x2y1 = = y1x1 + 6y2x2 + 2y1x2 + 2y2x1 = (y1, y2) · (x1, x2), (2) (x1, x2) + (y1, y2) · (z1, z2) = (x1 + y1) z1 + 6(x2 + y2) z2 + 2(x1 + y1) z2 + 2(x2 + y2) z1 = = x1z1 + 6x2z2 + 2x1z2 + 2x2z1 + y1z1 + 6y2z2 + 2y1z2 + 2y2z1 = = (x1, x2) · (z1, z2) + (y1, y2) · (z1, z2), (3) α (x1, x2) · (y1, y2) = (α x1, α x2) · (y1, y2) = αx1y1 + 6αx2y2 + 2αx1y2 + 2αx2y1 = = α (x1y1 + 6x2y2 + 2x1y2 + 2x2y1) = α (x1, x2) · (y1, y2) , (4) (x1, x2) · (x1, x2) = x2 1 + 6x2 2 + 4x1x2 ? ≥ 0. Abychom dokázali vlastnost (4), potřebujeme pro x1 = 0, x2 = 0 dokázat, že x2 1 + 6x2 2 + 4x1x2 > 0. Nechť a = x2/x1, tj. x2 = ax1. Po dosazení je x2 1 + 6a2 x2 1 + 4ax2 1 = x2 1(1 + 6a2 + 4a). Aby byl daný výraz větší než nula, stačí aby 6a2 + 4a + 1 > 0, ∀a ∈ R. Protože diskriminant této kvadratické nerovnice je roven D = 16 − 24 = −8 < 0, je nerovnost 6a2 + 4a + 1 > 0 splněna pro všechna a ∈ R. 8.9. Příklad. Ukážeme, že předpis (x1, x2) ◦ (y1, y2) = x1y1 + 2x2y2 + 2x1y2 + 2x2y1 není skalárním součinem. Vlastnosti (1) až (3) jsou zřejmě splněny. Není splněna vlastnost (4), protože například (−1, 1) ◦ (−1, 1) = 1 + 2 − 2 − 2 = −1 > 0. Symetrické a pozitivně definitní matice 8.10. Poznámka. Výše uvedené příklady nás vedou k otázce, jak charakterizovat všechny skalární součiny na Rn a jak je rychle poznat. Souvisí to s tzv. pozitivně definitními a symetrickými maticemi. Níže uvádím nejdůležitější výsledky z této oblasti jen pro čtenáře, který chce být lépe informován. Nám ostatním bude v dalším textu stačit existence standardního skalárního součinu na Rn a povědomí, že existují i jiné skalární součiny. Téma symetrických a pozitivně definitních matic je možno přeskočit a věnovat se rovnou definici velikosti vektoru 8.17. 8.11. Definice. Čtvercová matice A typu (n, n) je symetrická, pokud platí AT = A. 8.12. Definice. Nechť A je čtvercová matice typu (n, n). Označme Ai čtvercovou matici typu (n−i, n−i), která vzniká z matice A vynecháním posledních i řádků a posledních i sloupců. Matice A se nazývá pozitivně definitní, pokud všechny determinanty det Ai, i ∈ {0, 1, 2, . . . , n − 1} jsou kladné. 84 Lineární algebra 8. Lineární prostory se skalárním součinem 8.13. Poznámka. Pozitivně definitní matice je vždy regulární, protože det A = det A0 > 0. 8.14. Věta. Nechť A je čtvercová matice typu (n, n). Definujme součin na Rn takto. Pro x ∈ Rn , y ∈ Rn je x · y = x · A · yT , kde na pravé straně rovnosti je maticový součin jednořádkové matice x, která obsahuje složky vektoru x, s maticí A a s maticí yT , což je sloupec složek vektoru y. Pak x · y je skalárním součinem právě tehdy, když A je symetrická a pozitivně definitní matice. Důkaz. Uvedeme jen stručný náznak. Pro vlastnost (1) skalárního součinu je nutná symetrie matice A. Vlastnost (2) a (3) je zaručena pro jakoukoli čtvercovou matici A. Konečně vlastnost (4) je zaručena díky tomu, že matice A je pozitivně definitní. Na oprávněnou otázku „proč zde máme malý prostor pro odpověď. Odkazujeme například na učebnici [5]. 8.15. Příklad. Vraťme se k příkladu 8.8. Tam je skalární součin definován takto: x · y = (x1, x2) · 1 2 2 6 · y1 y2 . Protože pro uvedenou matici platí A = AT , jedná se o symetrickou matici. Spočteme dále jednotlivé determinanty: det A0 = det A = 2, det A1 = det(1) = 1. Protože oba determinanty jsou kladná čísla, jedná se o pozitivně definitní matici. Podle věty 8.14 je definovaný součin skalárním součinem. Velikost vektoru 8.16. Poznámka. Budeme definovat velikost vektoru a úhel mezi dvěma nenulovými vektory na obecných lineárních prostorech se skalárním součinem. Tyto pojmy definujeme jen pomocí skalárního součinu pro zcela libovolné vektory. V následující kapitole ukážeme, že pokud budeme pracovat s vektory s geometrickým významem (např. s orientovanými úsečkami), pak pojmy velikost a úhel nyní zavedené abstraktně budou znamenat přesně to, co od nich z geometrického hlediska očekáváme. 8.17. Definice. Nechť L je lineární prostor se skalárním součinem. Pro x ∈ L definujeme velikost vektoru x hodnotou √ x · x. Velikost vektoru x značíme x , takže je x = √ x · x, tj. x 2 = x · x. Místo pojmu „velikost vektoru se často používá pojem norma vektoru. 8.18. Poznámka. Vidíme, že velikost je nezáporné číslo a že každý vektor má svou velikost. To nám zaručuje vlastnost (4) definice 8.2. Je x · x ≥ 0, takže odmocnina z tohoto čísla je definována. Dále vidíme, že jedině nulový vektor má velikost rovnu nule a žádný jiný. To nám zaručuje druhá část vlastnosti (4). 8.19. Věta. Nechť x je prvkem lineárního prostoru se skalárním součinem, α ∈ R. Pak α x = |α| · x . Důkaz. α x = (α x) · (α x) = √ α2 x · x = √ α2 · √ x · x = |α| · x . Úhel dvou vektorů 8.20. Definice. Nechť L je lineární prostor se skalárním součinem a x ∈ L, y ∈ L, x = o, y = o. Pak úhel mezi vektory x a y je takové číslo ϕ ∈ 0, 2π), pro které platí cos ϕ = x · y x · y . (8.2) 8.21. Poznámka. Zabývejme se otázkou, zda každé dva nenulové vektory mají definován úhel mezi sebou. Především podle poznámky 8.18 platí, že x = 0, y = 0, protože x = o, y = o. Takže se ve zlomku z rovnosti (8.2) nedělí nulou. Aby existovalo ϕ takové, že platí (8.2), musí platit −1 ≤ x · y x · y ≤ 1. Tento požadavek zaručuje následující věta. 85 Lineární algebra 8. Lineární prostory se skalárním součinem 8.22. Věta (Schwartzova nerovnost). Nechť L je lineární prostor se skalárním součinem a x ∈ L, y ∈ L. Pak platí: |x · y| ≤ x · y . (8.3) Důkaz. Nechť α ∈ R. Násobme sám se sebou vektor x − α y. Podle vlastnosti (4) definice 8.2 je 0 ≤ (x − α y) · (x − α y) = x · x − α · 2(x · y) + α2 · (y · y). V úpravách jsme použili vlastnosti (2) a (3) definice 8.2. Označme A = y · y = y 2 , B = −2(x · y), C = x · x = x 2 . Dostáváme 0 ≤ A α2 + B α + C. Tato nerovnost musí platit pro všechna α ∈ R. Diskriminant této kvadratické nerovnice tedy nesmí být kladný. Z toho nám vyplývá podmínka pro čísla A, B, C: B2 − 4AC ≤ 0, tj. B2 ≤ 4AC, tj. −2(x · y) 2 ≤ 4 x 2 y 2 , tj. (−2)2 (x · y)2 ≤ 4 x 2 y 2 , tj. (x · y)2 ≤ x 2 y 2 tj. |x · y| ≤ x · y . Vzdálenost vektorů 8.23. Definice. Nechť L je lineární prostor se skalárním součinem. Vzdálenost vektoru x od vektoru y definujeme jako y − x . Podle věty 8.19 je y − x = x − y , takže často mluvíme o vzdálenosti dvou vektorů x a y (bez závislosti na jejich pořadí). 8.24. Věta (trojúhelníková nerovnost). Pro velikosti vektorů platí x + y ≤ x + y . (8.4) Důkaz. x + y 2 = (x + y) · (x + y) = x x + 2 x y + y y ≤ x 2 + 2 x · y + y 2 = x + y 2 . Ve výpočtu jsme použili Schwartzovu nerovnost 8.22. Po odmocnění dostáváme dokazovanou nerovnost. 8.25. Poznámka. Vysvětlíme si, proč se dokázaná nerovnost nazývá trojúhelníková. Tu někteří čtenáři znají geometricky formulovanou třeba takto: součet délek dvou stran v trojúhelníku je vždy větší než délka strany třetí. Nechť vektory a, b a c jsou prvky lineárního prostoru se skalárním součinem a představme si je jako vrcholy pomyslného trojúhelníka. Velikost stran je totéž jako vzdálenost odpovídajících vektorů. Geometrické tvrzení o velikostech stran trojúhelníka tedy můžeme pomocí definice 8.23 přepsat takto: a − b ≤ a − c + c − b . Při volbě x = a − c, y = c − b přechází uvedená nerovnost na tvar (8.4). 8.26. Příklad. Uvažujme lineární prostor R4 se standardním skalárním součinem (8.1). Ukážeme, jak vypadá velikost vektoru (1, 2, 3, 4) a jaký je úhel mezi vektory (1, 2, 3, 4) a (1, 0, 0, 2). Podle definice 8.17 a podle (8.1) je (1, 2, 3, 4) = (1, 2, 3, 4) · (1, 2, 3, 4) = 12 + 22 + 32 + 42 = √ 30. Podle definice 8.20 platí pro úhel ϕ následující rovnost: cos ϕ = (1, 2, 3, 4) · (1, 0, 0, 2) (1, 2, 3, 4) · (1, 0, 0, 2) = 1 + 0 + 0 + 4 · 2 √ 30 · √ 1 + 4 = 9 √ 150 , tj. ϕ = arccos 9 √ 150 . 8.27. Příklad. Nechť L je lineární prostor spojitých funkcí definovaných na konečném uzavřeném intervalu D ⊆ R. Ukážeme, že předpis f · g = D f(x) g(x) dx 86 Lineární algebra 8. Lineární prostory se skalárním součinem definuje skalární součin na lineárním prostoru L. Ověříme vlastnosti (1) až (4). Nechť f ∈ L, g ∈ L, h ∈ L a α ∈ R. Pak platí (1) f · g = D f(x) g(x) dx = D g(x) f(x) dx = g · f, (2) (f + g) · h = D f(x) + g(x) h(x) dx = D f(x) h(x) + g(x) h(x) dx = = D f(x) h(x) dx + D g(x) h(x) dx = f · h + g · h, (3) (αf) · g = D αf(x) g(x) dx = α · D f(x) g(x) dx = α (f · g), (4) f · f = D f2 (x) dx ≥ 0, D f2 (x) dx = 0 jen tehdy, když f(x) = 0 ∀x ∈ D, protože f je spojitá. Příklad ilustruje, že i na lineárních prostorech nekonečné dimenze jsme schopni definovat skalární součin. Z tohoto skalárního součinu odvozená norma funkce f f , „úhel ϕ mezi funkcemi f a g a „vzdálenost dvou funkcí f a g f − g se počítá takto: f = D f2(x) dx, ϕ = arccos D f(x)g(x) dx D f2(x) dx D g2(x) dx , f − g = D f(x) − g(x) 2 dx. Kolmé vektory 8.28. Poznámka. Protože máme na lineárních prostorech se skalárním součinem definován úhel mezi nenulovými vektory, můžeme pro každé dva nenulové vektory rozhodnout, kdy jsou na sebe kolmé. Je to tehdy, když je cos ϕ = 0, neboli x · y = 0. Z toho vyplývá následující definice. 8.29. Definice. Nechť L je lineární prostor se skalárním součinem. Dva nenulové vektory x ∈ L a y ∈ L jsou na sebe kolmé (značíme x ⊥ y), pokud je x · y = 0. 8.30. Příklad. (Pythagorova věta.) Nechť x ∈ L, y ∈ L jsou nenulové vektory, které jsou na sebe kolmé. Pak platí x 2 + y 2 = x − y 2 . Zdůvodnění je jednoduché: x − y 2 = (x − y) · (x − y) = x · x − 2x · y + y · y = x 2 − 2 · 0 + y 2 . Geometrická interpretace tohoto příkladu je následující. Trojúhleník s vrcholy o, x a y je pravoúhlý s pravým úhlem při vrcholu o. Čísla x , y jsou velikosti odvěsen a x − y je velikost přepony. Ortonormální báze 8.31. Definice. Nechť B = {b1, b2, . . . , bn} je báze lineárního prostoru se skalárním součinem. Bázi B nazýváme ortogonální, pokud bi ⊥ bj ∀i ∈ {1, 2, . . . , n}, ∀j ∈ {1, 2, . . . , n}, i = j. Bázi B nazýváme ortonormální, pokud je ortogonální, a navíc bi = 1, ∀i ∈ {1, 2, . . . , n}. 8.32. Věta. Báze B = {b1, b2, . . . , bn} je ortonormální právě tehdy, když bi · bj = 0 pro i = j, 1 pro i = j. Důkaz. Báze B je ortonormální právě tehdy, když (podle definice 8.31) platí bi ·bj = 1 pro i = j a navíc je ortogonální, tj. bi ⊥ bj pro i = j. To podle definice 8.29 znamená, že bi · bj = 0 pro i = j. 8.33. Věta. Nechť (B) je ortonormální uspořádaná báze lineárního prostoru L se skalárním součinem. Pak pro všechna x ∈ L, y ∈ L, x = (x1, x2, . . . , xn)(B), y = (y1, y2, . . . , yn)(B) lze skalární součin počítat ze souřadnic vektorů takto: x · y = x1y1 + x2y2 + · · · + xnyn. 87 Lineární algebra 8. Lineární prostory se skalárním součinem Důkaz. Podle předpokladu je x = x1 b1 + x2 b2 + · · · + xn bn, y = y1 b1 + y2 b2 + · · · + yn bn. Počítejme x · y: x · y = (x1 b1 + x2 b2 + · · · + xn bn) · (y1 b1 + y2 b2 + · · · + yn bn) = = x1y1 b1·b1+x1y2 b1·b2+· · ·+x1yn b1·bn+x2y1 b2·b1+x2y2 b2·b2+· · ·+x2yn b2·bn+· · ·+xnyn bn·bn = = x1y1 ·1+x1y2 ·0+· · ·+x1yn ·0+x2y1 ·0+x2y2 ·1+· · ·+x2yn ·0+· · ·+xnyn ·1 = x1y1 +x2y2 +· · ·+xnyn. V úpravách jsme využili větu 8.32 a toho, že báze B je ortonormální. 8.34. Příklad. Nechť Rn je lineární prostor se standardním skalárním součinem zavedeným v příkladu 8.7. Pak standardní báze S = (1, 0, 0, . . . , 0), (0, 1, 0, . . . , 0), . . . , (0, 0, 0, . . . , 1) je ortonormální bází. 8.35. Věta. Nechť x1, x2, . . . , xn jsou nenulové vektory lineárního prostoru se skalárním součinem, které jsou na sebe navzájem kolmé, tj. xi · xj = 0 pro i = j a xi · xi > 0. Pak jsou tyto vektory lineárně nezávislé. Důkaz. Podle definice lineární nezávislosti stačí ověřit, že z rovnosti α1 · x1 + α2 · x2 + · · · + αn · xn = o nutně plyne, že všechna čísla čísla αi jsou nulová. Vynásobíme-li obě strany uvedené rovnosti skalárně vektorem xi, dostáváme na levé straně součet nul s výjimkou jediného sčítance, protože vektor xi je kolmý na všechny všechny ostatní vektory xj. Máme tedy αi xi · xi = o · xi = 0. Protože xi · xi je nenulové číslo, musí být αi = 0. Tuto operaci můžeme provést pro každý index i ∈ {1, 2, . . . , n}, takže všechna čísla čísla αi jsou nutně nulová. 8.36. Věta. Nechť (B) = (b1, b2, . . . , bn) je ortonormální báze lineárního prostoru se skalárním součinem. Pak pro souřadnice libovolného vektoru x platí x = (x·b1, x·b2, . . . , x·bn)(B). Důkaz. Označme y = (x·b1) b1 +(x·b2) b2 +· · ·+(x·bn) bn. Podle definice souřadnic vzhledem k bázi máme dokázat, že x = y. Násobme vektor y vektorem bi: y · bi = (x · b1) b1 + (x · b2) b2 + · · · + (x · bn) bn · bi = (x · bi) bi · bi = x · bi, protože báze (B) je ortonormální. Máme tedy výsledek x · bi = y · bi ∀i ∈ {1, 2, . . . , n}. Vektor x − y je kolmý na všechny prvky bi, protože z předchozího výpočtu plyne (x − y) · bi = 0. Pokud by x = y, pak podle věty 8.35 jsou vektory b1, b2, . . . , bn, x − y lineárně nezávislé, ale to je ve sporu s tím, že (B) je báze. Musí tedy být x = y. 8.37. Poznámka. Předchozí věta má názornou geometrickou interpretaci. Souřadnice x·bi jsou vlastně kolmé průměty vektoru x na vektory báze bi. O těchto pojmech pohovoříme podrobněji v následující kapitole. 8.38. Věta. Nechť (B) = (b1, b2, . . . , bn) je ortonormální báze lineárního prostoru se skalárním součinem a x = (x1, x2, . . . , xn)(B) je jeho libovolný vektor. Pak úhel ϕi mezi vektorem x a vektorem bi lze počítat podle vzorce cos ϕi = xi x . Důkaz. Podle definice 8.20 je cos ϕi = x · bi x bi = x · bi x = xi x . V úpravách jsme využili toho, že bi = 1 (báze je ortonormální) a dále věty 8.36, podle které je xi = x·bi. 88 Lineární algebra 8. Lineární prostory se skalárním součinem 8.39. Poznámka. Protože je x 2 / x 2 = 1 a dále je x 2 = x2 1 + x2 2 + · · · + x2 n, plyne z věty 8.38 zajímavý důsledek: cos2 ϕ1 + cos2 ϕ2 + · · · + cos2 ϕn = 1, kde ϕi jsou úhly mezi vektorem x a vektory ortonormální báze. Ortogonalizační proces 8.40. Poznámka. Je přirozené se ptát, zda každý lineární prostor (aspoň konečné dimenze) má ortonormální bázi. Věta 2.51 ukazuje, že každý lineární prostor má bázi. Následující věta ukazuje, že každá konečná báze se dá v jistém smyslu pozměnit tak, aby se z ní stala ortonormální báze. 8.41. Věta (Schmidtův ortogonalizační proces). Nechť {b1, b2, . . . , bn} je báze lineárního prostoru L se skalárním součinem. Pak existuje ortonormální báze {c1, c2, . . . , cn} taková, že b1, b2, . . . , bk = c1, c2, . . . , ck , ∀k ∈ {1, 2, . . . , n}. Důkaz. Nejprve vysvětlíme ideu důkazu, která je v tomto případě asi důležitější než podrobné počítání. Vektor c1 volíme stejný jako b1 jen s tím rozdílem, že jej „normalizujeme . To znamená, že jej násobíme vhodnou konstantou, aby c1 = 1. Představme si dále, že už jsme našli c1, c2, . . . , ck takové, že b1, b2, . . . , bk = c1, c2, . . . , ck , a přitom vektory c1, c2, . . . , ck jsou na sebe vzájemně kolmé a mají jednotkovou velikost. Vektor bk+1 nyní „ortogonalizujeme , tj. upravíme tak, aby byl kolmý na všechny vektory z c1, c2, . . . , ck . Ukážeme později, že k tomu účelu stačí od vektoru bk+1 odečíst určitou lineární kombinaci vektorů c1, c2, . . . , ck. Takto upravený vektor dále „normalizujeme , tj. vynásobíme vhodnou konstantou, aby ck+1 = 1. Tím se jeho kolmost vůči ostatním vektorům z c1, c2, . . . , ck nepokazí. Protože vektor ck+1 vznikl jako lineární kombinace vektorů c1, c2, . . . , ck, bk+1, je c1, c2, . . . , ck, ck+1 = c1, c2, . . . , ck, bk+1 = b1, b2, . . . , bk+1 . Tím jsme rozšířili naši novou postupně budovanou ortonormální bázi o další vektor. Opakovaným použitím tohoto postupu dostáváme hledanou ortonormální bázi {c1, c2, . . . , cn}. Nyní stačí jen podrobněji ukázat, jak se vektor „normalizuje a „ortogonalizuje . Normalizaci libovolného vektoru x provedeme tak, že položíme x = (1/ x ) · x. Skutečně je: x 2 = x · x = 1 x x · 1 x x = 1 x 2 x x = 1 x 2 x 2 = 1. Nechť bk+1 ∈ c1, c2, . . . , ck a nechť vektory c1, c2, . . . , ck jsou na sebe navzájem kolmé a mají jednotkovou velikost. Vektor bk+1 „ortogonalizujeme tak, že položíme bk+1 = bk+1 − k i=1 (bk+1 · ci) ci. Nově vytvořený vektor bk+1 je kolmý na všechny vektory c1, c2, . . . , ck, protože: bk+1 · cj = bk+1 − k i=1 (bk+1 · ci) ci · cj = bk+1 · cj − k i=1 (bk+1 · ci) (ci · cj) = bk+1 · cj − bk+1 · cj = 0. V uvedeném součtu jsou ostatní sčítanci nuloví, protože vektory c1, c2, . . . , ck jsou podle předpokladu na sebe navzájem kolmé. 89 9. Aplikace lineární algebry v geometrii Euklidovský prostor 9.1. Poznámka. Budeme pracovat s bodovým euklidovským prostorem. Bohužel nemáme zde místo na podrobné definování základních pojmů tohoto prostoru. Vycházíme tedy z toho, že čtenář intuitivně tuší, co to je bod, úsečku si představí jako nejkratší spojnici mezi dvěma body, nebo jako množinu bodů, která tuto spojnici vyplňuje. Jiné množiny bodů vytvářejí přímky nebo roviny. Všechny tyto množiny bodů jsou podmnožinami třírozměrného bodového euklidovského prostoru, označovaného obvykle E3. Jeho „třírozměrnost vyplývá z toho, že jsme schopni v tomto prostoru sestrojit maximálně tři na sebe navzájem kolmé přímky. Rovněž to souvisí s tím, že lineární prostory orientovaných úseček v E3 mají dimenzi rovnu třem. V bodovém prostoru E3 umíme měřit vzdálenost mezi libovolnými dvěma body a úhel mezi dvěma úsečkami, které mají společný jeden krajní bod. Předpokládáme tedy, že jsme vybaveni nějakým měřítkem a úhloměrem. Stupnice na našem měřítku vychází z nějaké jednotky vzdálenosti (metr, stopa aj.) a nebudeme tuto jednotku při popisování geometrických vlastností dále zmiňovat. 9.2. Příklad. V příkladech 1.24 a 2.24 jsme zavedli lineární prostor vázaných vektorů UO tak, že jsme zvolili jeden bod prostoru E3 a označili jej O. Na množině všech orientovaných úseček začínajících v bodě O jsme definovali sčítání (doplněním na rovnoběžník) a násobení konstantou (násobením velikosti úsečky). V příkladě 1.24 jsme ukázali, že množina takových úseček tvoří lineární prostor podle obecné definice lineárního prostoru a v příkladě 2.24 jsme naznačili, jak souvisí pojmy lineární závislost a nezávislost vektorů s geometrickými vlastnostmi lineárního prostoru UO. Zopakujeme nyní hlavní výsledky těchto příkladů a přidáme další poznatky. Nulový vektor o ∈ UO je úsečka s nulovou velikostí, tj. koncový bod splývá s počátečním bodem. Jeden vektor u ∈ UO je lineárně nezávislý právě tehdy, když je nenulový. Dva vektory {u, v} ⊂ UO jsou lineárně nezávislé právě tehdy, když neleží ve společné přímce. Tři vektory {u, v, w} ⊂ UO jsou lineárně nezávislé právě tehdy, když neleží ve společné rovině. Čtyři vektory z UO jsou vždy lineárně závislé. Z toho plyne, že dim UO = 3 a bázi UO tvoří libovolné tři vektory, které neleží ve společné rovině. Je-li u ∈ UO nenulový, pak u je množina vektorů, jejichž koncové body vyplňují přímku procházející bodem O. Jsou-li {u, v} ⊂ UO lineárně nezávislé, pak u, v je množina vektorů, jejichž koncové body vyplňují rovinu procházející bodem O. Jsou-li konečně tři vektory {u, v, w} ⊂ UO lineárně nezávislé, pak koncové body vektorů z u, v, w vyplňují celý prostor E3. Souřadnice orientovaných úseček Je-li B = {b1, b2, b3} ⊂ UO lineárně nezávislá množina, pak tvoří bázi UO a pro každý vektor u ∈ UO existuje právě jedna lineární kombinace vektorů b1, b2, b3, která je rovna vektoru u. Koeficienty této lineární kombinace jsou podle definice 6.10 souřadnicemi vektoru u vzhledem k uspořádané bázi (B). Tyto souřadnice tvoří uspořádanou trojici reálných čísel a zobrazení, které každému vektoru u ∈ UO přiřadí uspořádanou trojici jeho souřadnic z R3 je podle příkladu 7.25 izomorfismus. Toto zobrazení přenáší pojmy lineární závislost, podprostor a lineární obal z „geometrického lineárního prostoru UO na „numerický lineární prostor R3 . Jinými slovy, místo abychom zjišťovali tyto pojmy na lineárním prostoru UO, kde sčítání je definováno doplňováním na rovnoběžník (potřebujeme dvě pravítka resp. kružítko na konstruování rovnoběžníků), budeme je ověřovat jen numericky v R3 (vystačíme si se sčítáním a násobením reálných čísel). To je základním principem tzv. analytické geometrie. Tuto teorii rozpracoval v 17. století francouzský matematik René Descartes. Po něm se nazývá souřadnicový systém kartézský. Skalární součin ori- entovaných úseček 9.3. Příklad. Na lineárním prostoru UO nyní definujeme skalární součin. Nechť u a v jsou dvě orientované úsečky začínající v bodě O. Pokud je aspoň jedna z nich nulová, definujeme skalární součin u·v = 0. Jsou-li obě úsečky nenulové, pak existuje rovina , ve které leží společně obě úsečky. Přiložíme v této rovině úhloměr k daným úsečkám a změříme úhel ϕ mezi těmito úsečkami. Skalární součin pak definujeme vzorcem u · v = u v cos ϕ, (9.1) kde u a v jsou velikosti těchto úseček zjištěné měřítkem. Ukážeme, že uvedený vzorec definuje skalární součin v souladu s obecnou definicí 8.2, tj. že platí vlastnosti (1) až (4). (1) u · v = u v cos ϕ = v u cos ϕ = v · u, (2) (u + v) · w ? = u · w + v · w (vysvětlíme později), (3) (α u) · v = α u v cos ϕ = α u v cos ϕ = α (u · v), pro α ≥ 0, −α u v cos(ϕ + π) = α u v cos ϕ = α (u · v), pro α < 0, (4) u · u = u 2 cos 0 = u 2 ≥ 0. 90 Lineární algebra 9. Aplikace lineární algebry v geometrii Předpokládejme ještě u · u = u 2 = 0. Z toho plyne, že velikost úsečky u je nulová, takže nutně musí být u = o. Zbývá nám dokázat vlastnost (2). Jsou-li některé z úseček nulové, je tvrzení (2) okamžitě splněno. Nechť jsou tedy všechny tři úsečky nenulové. Nechť dále ϕ1 je úhel mezi u a w. Označme p1 = u cos ϕ1 velikost kolmého průmětu úsečky u na úsečku w. Ze vzorce (9.1) vidíme, že p1 = u · w/ w . Označme ještě p2 velikost kolmého průmětu úsečky v na úsečku w a konečně p0 velikost kolmého průmětu součtu u + v na úsečku w. Z geometrických vlastností rovnoběžníků a průmětů plyne, že p0 = p1 + p2 (udělejte si náčrtek). Protože platí p1 = u · w w , p2 = v · w w , p0 = (u + v) · w w , je po vynásobení rovnosti p0 = p1 + p2 číslem w požadovaná rovnost (2) dokázána. 9.4. Poznámka. Při ověřování vlastnosti (4) jsme mimochodem zjistili, že velikost úsečky odvozená ze skalárního součinu (definice 8.17) je rovna velikosti úsečky zjištěné měřítkem. Úhel mezi úsečkami podle definice 8.20 je také roven skutečnému úhlu mezi úsečkami. To plyne přímo ze vzorce (9.1). 9.5. Poznámka. K definování skalárního součinu na lineárním prostoru orientovaných úšeček jsme v předchozím příkladu použili kromě měřítka ještě úhloměr a nějaký stroj, který nám vyhodnotí funkci kosinus. Ukážeme, že lze modifikovat definici tak, že místo úhloměru a stroje na kosinus si vystačíme jen s pravítkem s ryskou (na sestrojování kolmic). Nechť u a v jsou nenulové orientované úsečky začínající ve společném bodě O. Nechť p je přímka, která obsahuje úsečku v. Pomocí pravítka s ryskou sestrojíme kolmici na přímku p, která prochází koncovým bodem úsečky u. Průsečík přímky p a sestrojené kolmice označme P. Nyní definujeme u · v = ± v · velikost úsečky OP, kde místo znaku „± použijeme znaménko „+ , je-li úsečka OP shodně orientovaná s úsečkou v, a použijeme znaménko „− , jsou-li tyto úsečky opačně orientované. Uvědomíme si, že úsečka OP je kolmým průmětem úsečky u na přímku p, velikost tohoto průmětu je podle kosinové věty rovna (až na znaménko) číslu u cos ϕ, kde ϕ je úhel mezi úsečkami u a v. Vidíme tedy, že je definice skalárního součinu shodná s definicí podle vzorce (9.1). Kolmý průmět vektoru na vektor Kolmý průmět vektoru u na nenulový vektor v je názorná geometrická aplikace skalárního součinu a má obecnou platnost i v lineárních prostorech s větší dimenzí. Stojí za to tento pojem formálně definovat pro libovolný lineární prostor se skalárním součinem: 9.6. Definice. Nechť L je lineární prostor se skalárním součinem, u ∈ L, v ∈ L, v = o. Pak vektor u · v v 2 v nazýváme kolmý průmět vektoru u na vektor v. Číslo (u · v) / v je velikost kolmého průmětu vektoru u na vektor v „až na znaménko . Toto číslo je záporné právě tehdy, když kolmý průmět na vektor v má opačný směr než vektor v. Ortonormální báze v UO 9.7. Příklad. Nechť UO je lineární prostor se skalárním součinem z příkladu 9.3. Sestrojíme dvě orientované úsečky začínající v bodě O s velikostí 1, které jsou na sebe kolmé (ověříme úhloměrem). Tyto dvě úsečky leží v jednoznačně určené rovině . Sestrojíme třetí úsečku velikosti 1, která začíná v bodě O a je kolmá na rovinu . Tyto tři úsečky označíme i, j, k. Je zřejmé, že B = {i, j, k} je ortonormální bází lineárního prostoru UO. 9.8. Poznámka. Souřadnice vektoru u ∈ UO vzhledem k ortonormální bázi B = {i, j, k} jsou podle věty 8.36 a definice 9.6 velikostmi (až na znaménko) kolmých průmětů vektoru u na vektory i, j, k. To nám umožňuje velmi snadno najít souřadnice geometrickými prostředky a dále se souřadnicemi (uspořádanými trojicemi v R3 ) pracovat numericky. 91 Lineární algebra 9. Aplikace lineární algebry v geometrii 9.9. Příklad. Nechť B = {i, j, k} je báze z příkladu 9.7. Uspořádejme tuto bázi, tj. záleží nám na pořadí prvků i, j, k. Vidíme, že jakákoli jiná uspořádaná ortonormální báze vzniká současným otočením úseček i, j, k kolem bodu O nebo současným otočením úseček i, j, −k kolem bodu O. Přechod mezi bází (B) = i, j, k a (B ) = i, j, −k nelze realizovat současným otočením všech úseček. Dá se ukázat, že pokud báze C vzniká z báze B otočením úseček kolem bodu O, má matice přechodu A(B,C) kladný determinant. Dále matice přechodu od báze B k bázi B vypadá takto A(B,B ) =   1 0 0 0 1 0 0 0 −1   . Je tedy det A(B,B ) = −1. To nás vede k následující definici kladně orientované báze. Kladně ori- entovaná báze 9.10. Definice. Nechť UO je lineární prostor se skalárním součinem podle příkladu 9.3. Ortonormální uspořádanou bázi (B) = i, j, k nazýváme kladně orientovanou, pokud při vhodném umístění a natočení pozorovatele vzhledem k této bázi směřuje úsečka i směrem k pozorovateli, j vpravo od pozorovatele a k nahoru. Mnemotechnickou pomůckou je tzv. pravidlo pravé ruky. Přiložíme-li pravou ruku k vektorům i, j tak, aby prsty směřovaly od i k j, potom palec naznačuje směr vektoru k. Všechny báze (C) (ne nutně ortonormální), které mají matici přechodu od (B) k (C) s kladným determinantem, nazýváme kladně orientované báze. Všechny báze (D), které mají matici přechodu od (B) k (D) se záporným determinantem, nazýváme záporně orientované báze. 9.11. Poznámka. Na lineárním prostoru UO jsme rozdělili všechny báze do dvou skupin: kladně orientované báze a záporně orientované báze. Matice přechodu je podle věty 6.19 vždy regulární, takže je jednoznačně dáno, zda je báze kladně nebo záporně orientovaná (determinant matice přechodu je vždy nenulový). Podle vět 6.27 a 4.35 také okamžitě vidíme, že matice přechodu mezi kladně orientovanými bázemi má vždy kladný determinant, matice přechodu mezi záporně orientovanými bázemi má také kladný determinant a matice přechodu od kladně orientované báze k záporně orientované bázi má záporný determinant stejně jako matice přechodu od záporně orientované báze ke kladně orientované bázi. 9.12. Poznámka. V libovolném lineárním prostoru konečné dimenze jsme schopni rozlišit dvě skupiny uspořádaných bází tak, že matice přechodu od báze z jedné skupiny k bázi v druhé skupině má záporný determinant a matice přechodu od báze k bázi uvnitř skupiny má kladný determinant. Nejedná se tedy jen o geometrickou vlastnost lineárního prostoru UO. Je proto vhodné uvést následující obecnou definici: 9.13. Definice. Orientovat libovolný lineární prostor s konečnou dimenzí znamená prohlásit jednu jeho uspořádanou bázi (B) za výchozí kladně orientovanou. Uspořádaná báze (C) se nazývá kladně orientovaná, pokud matice přechodu od výchozí báze (B) k bázi (C) má kladný determinant. Uspořádaná báze (D) se nazývá záporně orientovaná, pokud matice přechodu od výchozí báze (B) k bázi (D) má záporný determinant. 9.14. Příklad. Orientaci lineárního prostoru UO jsme provedli v definici 9.10. 9.15. Poznámka. Již dříve jsme mluvili o „orientovaných úsečkách. Ačkoli jsme použili stejné slovo, s orientací lineárního prostoru to příliš nesouvisí. Orientace úsečky znamená určení pořadí jejích krajních bodů, nebo (jinak řečeno) rozlišení mezi počátečním a konečným bodem úsečky. Vektorový součin 9.16. Poznámka. V další části textu definujeme vektorový součin, což je operace, která dvěma vektorům přiřadí jako výsledek vektor (na rozdíl od skalárního součinu, který dvěma vektorům přiřadí číslo, neboli skalár). Vektorový součin definujeme prozatím na lineárním prostoru UO orientovaných úseček, který již známe z příkladů 9.2, 9.3, 9.7 a 9.14. 92 Lineární algebra 9. Aplikace lineární algebry v geometrii 9.17. Definice. Nechť UO je lineární prostor orientovaných úseček. Vektorový součin je zobrazení (označujeme jej křížkem) × : UO × UO → UO, které splňuje následující vlastnosti. (A) Jsou-li vektory {u, v} ⊂ UO lineárně závislé, definujeme u × v = o (nulový vektor). (B) Jsou-li vektory {u, v} ⊂ UO lineárně nezávislé, pak je vektor u × v jednoznačně určen následujícími třemi vlastnostmi: (1) (u × v) ⊥ u, (u × v) ⊥ v, (2) u × v = u v sin ϕ, kde ϕ je úhel mezi vektory u a v. (3) Uspořádaná báze (u, v, u × v) je kladně orientovaná. 9.18. Poznámka. Vidíme, že skutečně vlastnosti (1) až (3) určují vektorový součin jednoznačně. První vlastnost udává, že výsledek bude kolmý na rovinu určenou u, v , druhá vlastnost určuje velikost výsledného vektoru a třetí vlastnost orientaci (zda výsledný vektor bude orientován vzhledem k rovině určené u, v „nahoru nebo „dolu . 9.19. Příklad. Nechť (B) = (i, j, k) je ortonormální kladně orientovaná uspořádaná báze lineárního prostoru UO. Pak podle definice je i × i = j × j = k × k = o, i × j = k, j × i = −k, i × k = −j, k × i = j, j × k = i, k × j = −i. 9.20. Věta (souřadnice vektorového součinu). Nechť (B) = (i, j, k) je ortonormální kladně orientovaná uspořádaná báze lineárního prostoru UO, u = (u1, u2, u3)(B), v = (v1, v2, v3)(B). Pak platí: u × v = u2 u3 v2 v3 , − u1 u3 v1 v3 , u1 u2 v1 v2 (B) . (9.2) Důkaz. Pokud jsou vektory u, v lineárně závislé, pak všechny determinanty ve vzorci (9.2) jsou nulové a výsledný vektor u × v má nulové souřadnice, takže je v souladu s definicí nulový. Zbývá tedy ověřit vlastnosti (1) až (3) z definice vektorového součinu pro případ, že vektory u, v jsou lineárně nezávislé. Ad (1). Ověříme (u×v)⊥u. Dva vektory jsou kolmé, pokud jejich skalární součin je nulový. Skalární součin můžeme počítat ze souřadnic podle věty 8.33: u2 u3 v2 v3 u1 − u1 u3 v1 v3 u2 + u1 u2 v1 v2 u3 = u1 u2 u3 v1 v2 v3 u1 u2 u3 = 0. Při úpravách jsme využili rozvoje determinantu podle třetího řádku a dále toho, že determinant je roven nule, pokud se v něm dva řádky opakují. Podobně by to dopadlo při ověřování (u × v) ⊥ v. Ad (2). u × v 2 = u2 u3 v2 v3 2 + u1 u3 v1 v3 2 + u1 u2 v1 v2 2 = poněkud pracnější výpočet je zde vynechán = = (u2 1 + u2 2 + u2 3) (v2 1 + v2 2 + v2 3) − (u1v1 + u2v2 + u3v3)2 = u 2 v 2 − (u · v)2 = = u 2 v 2 − u 2 v 2 cos2 ϕ = u 2 v 2 (1 − cos2 ϕ) = u 2 v 2 sin2 ϕ. Po odmocnění vychází požadovaná vlastnost. Ad (3). Především velikost vektoru u × v je pro lineárně nezávislé vektory u, v nenulová a tento vektor je kolmý na oba vektory u, v. Množina {u, v, u × v} tedy tvoří bázi lineárního prostoru UO. Matice A =         u1 v1 u2 u3 v2 v3 u2 v2 − u1 u3 v1 v3 u3 v3 u1 u2 v1 v2         je maticí přechodu od kladně orientované báze (i, j, k) k bázi (u, v, u × v). Její determinant spočítáme rozvojem podle třetího sloupce: det A = u2 u3 v2 v3 2 + u1 u3 v1 v3 2 + u1 u2 v1 v2 2 > 0. Je tedy i báze (u, v, u × v) kladně orientovaná. 93 Lineární algebra 9. Aplikace lineární algebry v geometrii 9.21. Poznámka. Věta 9.20 nám nejen dává možnost počítat souřadnice vektorového součinu ze souřadnic vstupních vektorů, ale inspiruje nás k definici vektorového součinu na R3 : 9.22. Definice. Nechť u ∈ R3 , v ∈ R3 , u = (u1, u2, u3), v = (v1, v2, v3). Pak definujeme vektorový součin na R3 předpisem: u × v = u2 u3 v2 v3 , − u1 u3 v1 v3 , u1 u2 v1 v2 . 9.23. Poznámka. Definici vektorového součinu lze rozšířit na libovolný lineární prostor L dimenze 3 se skalárním součinem, který byl orientován. Stačí použít definici 9.17 a uvědomit si, že se tato definice neopírá o žádné speciální vlastnosti množiny UO. Vychází pouze z těchto předpokladů: (1) Dimenze lineárního prostoru L musí být rovna třem. (2) Na lineárním prostoru L musí být definován skalární součin. (3) Lineární prostor L musí být orientován. Rovněž důkaz věty 9.20 se opíral jen o výše uvedené vlastnosti lineárního prostoru a věta tedy platí pro každý takový lineární prostor. Je třeba si uvědomit, že definici vektorového součinu nelze rozšířit na lineární prostory jiných dimenzí než 3. 9.24. Věta (základní vlastnosti vektorového součinu). Nechť L je lineární prostor s vektorovým součinem a u ∈ L, v ∈ L, w ∈ L, α ∈ R. Platí: u × u = o, u × v = −(v × u) (antikomutativní zákon), (α u) × v = α (u × v) = u × (α v), (u + v) × w = u × w + v × w (první distributivní zákon), u × (v + w) = u × v + u × w (druhý distributivní zákon). Důkaz. Snadno se dá ověřit, že tyto vzorce platí, pokud si zvolíme nějakou uspořádanou kladně orientovanou ortonormální bázi a budeme pracovat podle věty 9.20 se souřadnicemi těchto vektorů vzhledem k takto zvolené bázi. 9.25. Poznámka. Asociativní zákon pro vektorový součin neplatí, protože je (i × i) × j = o × j = o, zatímco i × (i × j) = i × k = −j, kde (i, j, k) je uspořádaná kladně orientovaná ortonormální báze. Nemá tedy smysl psát u × v × w bez použití závorek. Při opakovaném vektorovém součinu vždy musíme pomocí závorek vyznačit, v jakém pořadí budeme násobit. 9.26. Příklad. Spočítáme (2u − 5v) × (u + 3v) s využitím věty 9.24: (2u − 5v) × (u + 3v) = (2u − 5v) × u + (2u − 5v) × (3v) = = (2u) × u + (−5v) × u + (2u) × (3v) + (−5v) × (3v) = = 2 (u × u) − 5 (v × u) + 6 (u × v) − 15 (v × v) = = 2 o − 5 (−(u × v)) + 6 (u × v) − 15 o = 11 (u × v). 9.27. Věta (geometrický význam vektorového součinu). Nechť vektory u, v jsou lineárně nezávislé. Velikost vektorového součinu u × v je rovna ploše rovnoběžníka určeného svými stranami u a v. Důkaz. Stačí si uvědomit, že číslo v sin ϕ (kde ϕ je úhel mezi vektory u, v) je rovno podle vlastnosti funkce sinus výšce zmíněného rovnoběžníka a u je jeho základna. Na základní škole jsme se učili, že plocha rovnoběžníka se počítá jako základna krát výška, tedy u v sin ϕ, což je podle vlastnosti (2) definice 9.17 rovno velikosti vektorového součinu. Smíšený součin 9.28. Definice. Nechť u, v, w jsou vektory z lineárního prostoru se skalárním a vektorovým součinem. Pak číslo u · (v × w) nazýváme smíšeným součinem vektorů u, v, w (v tomto pořadí). 94 Lineární algebra 9. Aplikace lineární algebry v geometrii 9.29. Věta (smíšený součin ze souřadnic vektorů). Nechť (B) = (i, j, k) je ortonormální kladně orientovaná uspořádaná báze lineárního prostoru se skalárním a vektorovým součinem, u = (u1, u2, u3)(B), v = (v1, v2, v3)(B), w = (w1, w2, w3)(B). Pak je smíšený součin u · (v × w) roven determinantu: u1 u2 u3 v1 v2 v3 w1 w2 w3 . Důkaz. Věta plyne přímo z definice smíšeného součinu a vět 9.20, 8.33. Rozvojem determinantu podle prvního řádku dostáváme požadovaný výsledek. 9.30. Věta (geometrický význam smíšeného součinu). Absolutní hodnota smíšeného součinu lineárně nezávislých vektorů u, v, w je rovna objemu rovnoběžnostěnu určeného svými stranami u, v, w. Důkaz. Velikost vektorového součinu v × w je podle věty 9.27 roven ploše základny rovnoběžnostěnu. Rozepíšeme skalární součin pomocí kosinu úhlu ϕ mezi vektorem u a vektorem v × w: u · (v × w) = v × w · u | cos ϕ| = základna · výška = objem rovnoběžnostěnu. Číslo u | cos ϕ| je rovno požadované výšce, protože se jedná o velikost kolmého průmětu vektoru u na vektor v × w a vektor v × w je kolmý na základnu. 9.31. Poznámka. Je-li báze (u, v, w) kladně orientovaná, vychází smíšený součin kladně, protože úhel ϕ z důkazu předchozí věty je menší než π/2. Je-li ale tato báze záporně orientovaná, vychází smíšený součin jako záporné číslo, neboť úhel ϕ je větší než π/2. 9.32. Poznámka. Dá se ukázat, že absolutní hodnota determinantu matice typu (n, n) určuje objem rovnoběžnostěnu, který je určen svými stranami, jejichž souřadnice jsou zapsány do řádků této matice. Rovnoběžnostěn se „rozprostírá v n-dimenzionálním prostoru. Pomocí determinantů tedy můžeme měřit n-dimenzionální objemy. Věty 9.29 a 9.30 ilustrují, že determinanty měří objemy rovnoběžnostěnu aspoň pro dimenzi 3. Prostor V3 volných vektorů 9.33. Poznámka. Lineární prostor UO z příkladů 9.2, 9.3 a 9.7 má jednu nevýhodu. Obsahuje jen úsečky, které začínají v pevně zvoleném bodě O. Často ale při modelování fyzikálních situací ztotožňujeme orientovanou úsečku s jinou, která začíná v jiném bodě, ale je s původní úsečkou rovnoběžná, má stejnou velikost a stejnou orientaci. Z tohoto důvodu je výhodné zavést lineární prostor tzv. volných vektorů V3, ve kterém budeme ztotožňovat dvě úsečky, pokud jsou rovnoběžné, mají stejnou velikost a jsou stejně orientované. 9.34. Definice. Nechť UO je lineární prostor z příkladů 9.2 a 9.3. Volme uO ∈ UO. Množinu všech orientovaných úseček, které jsou s úsečkou uO rovnoběžné a mají stejnou velikost a orientaci nazýváme vektorem lineárního prostoru V3. Nechť u je vektor lineárního prostoru V3 Jde tedy o množinu vzájemně rovnoběžných úseček stejně velkých a stejně orientovaných. Jakoukoli orientovanu úsečku z této množiny nazýváme reprezentantem vektoru u. Na lineárním prostoru V3 definujeme sčítání vektorů a skalární násobek. Nechť u ∈ V3, v ∈ V3. Volme nějaký bod O ∈ E3. Existuje právě jeden reprezentant vektoru u, který začíná v bodě O. Označme jej uO. Dále nechť vO je reprezentant vektoru v začínající v bodě O. Pak je definován součet wO = uO + vO na lineárním prostoru UO. Součet u + v je takový prvek z V3, pro který je wO jeho reprezentantem začínajícím v bodě O. Je to tedy množina všech orientovaných úseček rovnoběžných, stejně velkých a stejně orientovaných, jako úsečka wO. Skalární násobek definujeme podobně. Nechť je u ∈ V3, α ∈ R. Pro u existuje reprezentant uO začínající v bodě O. K němu existuje skalární násobek definovaný v UO. Označme jej wO = α uO. Výsledný vektor α u je vektorem z V3 takovým, že wO je jeho reprezentant. Skalární součin vektorů u ∈ V3, v ∈ V3 definujeme jako skalární součin jejich reprezentantů uO a vO v lineárním prostoru UO. Vektorový součin u × v definujeme tak, že reprezentanty uO a vO vektorů u a v vynásobíme v lineárním prostoru UO. Výsledný součin u×v je takový vektor, pro který je uO×vO jeho reprezentantem začínajícím v bodě O. 95 Lineární algebra 9. Aplikace lineární algebry v geometrii 9.35. Poznámka. Dá se snadno ukázat, že výše definovaný součet, skalární násobek, skalární součin a vektorový součin vektorů z V3 nejsou závislé na volbě bodu O ∈ E3. 9.36. Poznámka. Volme pevně bod O ∈ E3. Uvažujme zobrazení, které každému vektoru uO ∈ UO přiřadí u ∈ V3 tak, že uO je reprezentantem vektoru u začínajícím v bodě O. Toto zobrazení je prosté a na. Navíc je lineární. Jedná se tedy o izomorfismus. Všechny pojmy, které jsme definovali na UO lze prostřednictvím tohoto izomorfismu definovat i na lineárním prostoru V3. Například: 9.37. Definice. Ortonormální báze na V3 je taková báze, jejíž reprezentanti začínající v nějakém bodě O ∈ E3 tvoří ortonormální bázi v UO. Viz příklad 9.7. Kladně orientovaná báze na V3 ja taková báze, jejíž reprezentanti začínající v nějakém bodě O ∈ E3 tvoří kladně orientovanou bázi v UO. Viz definici 9.10. Součet bodu s vektorem 9.38. Poznámka. Pro potřeby popisů geometrických objektů se kromě součtu volných vektorů mezi sebou hodí definovat součet bodu s volným vektorem a rozdíl bodů. 9.39. Definice. Pro každý bod A ∈ E3 a volný vektor v ∈ V3 existuje právě jeden reprezentant vektoru v, který začíná v bodě A. Koncový bod B ∈ E3 tohoto reprezentanta nazýváme součtem bodu A s vektorem v a značíme B = A + v. Pro každé dva body A ∈ E3, B ∈ E3 existuje v ∈ V3 takový, že orientovaná úsečka s počátkem v bodě A a koncem v bodě B je reprezentantem tohoto vektoru. Vektor v nazýváme rozdílem B − A, píšeme v = B − A. Vektor B − A se často značí symbolem −−→ AB. 9.40. Poznámka. Shrneme si, co s čím můžeme sčítat a s jakým výsledkem: volný vektor ± volný vektor = volný vektor, bod ± volný vektor = bod, bod + bod . . . nemá smysl, bod − bod = volný vektor. Definice sčítání bodu s vektorem a odčítání bodů se vzájemně doplňují, tj. platí A + (B − A) = B. Přímka a rovina 9.41. Příklad. V návaznosti na příklad 9.2 a definici 9.39 dostáváme následující popisy přímek a rovin v bodovém prostoru E3. Nechť u ∈ V3 je nenulový vektor, A ∈ E3. Pak p = A + u = {X ∈ E3; X = A + t u, t ∈ R} je přímka v bodovém prostoru E3, která prochází bodem A a je rovnoběžná se všemi reprezentanty vektoru u. Vektor u se nazývá směrovým vektorem přímky p. Nechť dále {u, v} ⊂ V3 jsou lineárně nezávislé vektory. Pak = A + u, v = {X ∈ E3; X = A + r u + s v, r ∈ R, s ∈ R} je rovina v bodovém prostoru E3, která prochází bodem A. Navíc reprezentanti vektorů u a v s počátkem v bodě A leží uvnitř této roviny. Vektorům u, v říkáme směrové vektory roviny. Existuje nekonečně mnoho bodů a nekonečně mnoho směrových vektorů, pomocí kterých je určena stejná přímka resp. stejná rovina. S touto nejednoznačností jsme se už setkali při řešení soustav lineárních rovnic v poznámkách 5.25 a 5.26. Souřadnicový systém v E3 9.42. Definice. Libovolný bod O ∈ E3 společně s uspořádanou bází (B) = (b1, b2, b3) vektorů z V3 tvoří souřadnicový systém bodového prostoru E3. Souřadnice vektoru u ∈ V3 v tomto souřadnicovém systému definujeme jako souřadnice vektoru u vzhledem k uspořádané bázi (B). Souřadnice bodu A ∈ E3 v tomto souřadnicovém systému definujeme jako souřadnice vektoru A−O. Vektor A − O nazýváme v tomto kontextu radiusvektorem bodu A. Přímky O + b1 , O + b2 , O + b3 jsou osy souřadnicového systému. Je-li báze (B) ortogonální, nazýváme odpovídající souřadnicový systém pravoúhlý. Je-li báze (B) ortonormální, nazýváme odpovídající souřadnicový systém kartézský. Je-li báze (B) kladně orientovaná, mluvíme též o kladně orientovaném souřadnicovém systému. 96 Lineární algebra 9. Aplikace lineární algebry v geometrii 9.43. Poznámka. Uvědomíme si podrobně, co to znamená, že bod A má souřadnice (a1, a2, a3) vzhledem k nějakému souřadnicovému systému (O, (b1, b2, b3)). Podle výše uvedené definice to znamená, že vektor A − O má souřadnice (a1, a2, a3), což podle definice souřadnic vektoru vzhledem k bázi znamená, že (A − O) = a1b1 + a2b2 + a3b3. 9.44. Věta. Zvolme pevně souřadnicový systém bodového prostoru E3, vzhledem ke kterému budeme udávat souřadnice bodů a vektorů. Tento souřadnicový systém nemusí být nutně kartézský. Nechť A ∈ E3 má souřadnice (a1, a2, a3), B ∈ E3 má souřadnice (b1, b2, b3), u ∈ V3 má souřadnice (u1, u2, u3), v ∈ V3 má souřadnice (v1, v2, v3), α ∈ R, β ∈ R. Potom platí: (1) Vektor α u + β v má souřadnice α (u1, u2, u3) + β (v1, v2, v3). (2) Bod A + u má souřadnice (a1, a2, a3) + (u1, u2, u3). (3) Vektor −−→ AB = B − A má souřadnice (b1, b2, b3) − (a1, a2, a3). Důkaz. Ad (1). Zobrazení, které přiřadí vektorům jejich souřadnice je podle příkladu 7.25 lineární. Ad (2). (A − O) + u je radiusvektor bodu A + u. Dále se použije vlastnost (1). Ad (3). Využijeme například toho, že A + (B − A) = B. 9.45. Poznámka. Protože podle předchozí věty se operace sčítání bodů s vektory dají převést na operace sčítání uspořádaných trojic jejich souřadnic, bývá často zvykem ztotožnit body z E3 a vektory z V3 s uspořádanými trojicemi jejich souřadnic. Píšeme tedy například A = (1, 2, −5) a čteme, že bod A má souřadnice (1, 2, −5). V jiné literatuře (např. [7]) se skutečnost, že bod A má dány souřadnice, zapisuje bez rovnítka a do hranatých závorek. Náš příklad se souřadnicemi (1, 2, −5) by vypadal takto: A[1, 2, −5]. Osobně toto značení nemám v oblibě, protože mezi označením bodu A a jeho souřadnicemi [1, 2, −5] chybí symbol pro sloveso. 9.46. Příklad. Vypočteme vzdálenost dvou bodů A ∈ E3 a B ∈ E3, pokud známe jejich souřadnice v kartézském souřadnicovém systému. Vzdálenost bodů A a B je rovna velikosti vektoru B −A a tu spočítáme podle definice velikosti jako (B − A) · (B − A). Přitom skalární součin spočítáme podle věty 8.33. Uvedeme konkrétní příklad. Nechť A = (1, 2, −5), B = (3, 2, 1). Vzdálenost těchto bodů je rovna velikosti vektoru B − A, který má podle věty 9.44 souřadnice (2, 0, 6). Počítáme velikost: (2, 0, 6) = (2, 0, 6) · (2, 0, 6) = 22 + 02 + 62 = √ 40. Uvedený postup s použitím věty 8.33 lze použít jen pro souřadnice v kartézském souřadnicovém systému, protože tato věta předpokládá souřadnice vektoru vzhledem k ortonormální bázi. 9.47. Příklad. Vypočteme obsah trojúhelníka v bodovém prostoru E3, pokud jsou dány kartézské souřadnice jeho vrcholů A, B, C. Podle věty 9.27 je obsah rovnoběžníka roven velikosti vektorového součinu jeho stran. Trojúhelník pak bude mít obsah poloviční. Obsah trojúhelníka tedy můžeme počítat takto: P = (B − A) × (C − A) 2 . Jsou-li dány kartézské souřadnice vrcholů třeba takto: A = (1, 2, 2), B = (2, −3, 3), C = (1, 4, 5), pak stačí dosadit do právě odvozeného vzorce: P = (2, −3, 3) − (1, 2, 2) × (1, 4, 5) − (1, 2, 2) 2 = (1, −5, 1) × (0, 2, 3) 2 = = (−17, −3, 2) 2 = √ 172 + 32 + 22 2 = √ 302 2 . Při výpočtu jsme použili nejen věty 9.44, ale též věty 9.20 pro výpočet vektorového součinu ze souřadnic a věty 8.33 pro výpočet skalárního součinu, který jsme potřebovali na výpočet velikosti vektoru. Posledně zmíněné věty předpokládají souřadnice vzhledem k ortonormální bázi, a proto bylo nutné mít souřadnice bodů zadány v kartézském systému souřadnic. 97 Lineární algebra 9. Aplikace lineární algebry v geometrii 9.48. Příklad. Vypočteme objem čtyřstěnu, určeného vrcholy A, B, C, D. Tyto vrcholy jsou dány v kartézských souřadnicích. Podle vět 9.29 a 9.30 je objem rovnoběžnostěnu roven absolutní hodnotě z determinantu, ve kterém jsou v řádcích napsány souřadnice jeho stran. Čtyřstěn bude mít objem šestinový, protože do rovnoběžnostěnu se vejde právě šest čtyřstěnů se shodným objemem. Kdo o tom pochybuje, rozkrájí si za domácí cvičení kostku tvrdého sýra na šest čtyřstěnů se stejným objemem. Nechť A je matice, která má v prvním řádku souřadnice vektoru B−A, ve druhém řádku souřadnice C − A a ve třetím řádku souřadnice D − A. Pak objem čtyřstěnu V je roven | det A|/6. Věta 9.29 předpokládá ortonormální bázi, proto je potřeba pracovat se souřadnicemi bodů v kartézském systému souřadnic. Rovnice přímky 9.49. Příklad. Ukážeme si, jak popíšeme přímku v souřadnicovém systému. Podle příkladu 9.41 a věty 9.44 je přímka p procházející bodem A = (a1, a2, a3) se směrovým vektorem u = (u1, u2, u3) množinou takových bodů X = (x, y, z), pro které platí: X = A + t u, t ∈ R tj. (x, y, z) = (a1, a2, a3) + t (u1, u2, u3), t ∈ R. Po rozepsání této rovnosti do jednotlivých souřadnic dostáváme parametrické rovnice přímky: x = a1 + t u1, y = a2 + t u2, z = a3 + t u3. Pokud vypočítáme z každé rovnice parametr t a výsledky položíme sobě rovny, dostáváme tzv. kanonickou rovnici přímky: x − a1 u1 = y − a2 u2 = z − a3 u3 . 9.50. Příklad. Popíšeme přímku, která prochází body A = (1, 2, 3) a B = (2, 2, 0). Směrovým vektorem přímky je například vektor B − A = (1, 0, −3) a přímka má tvar: p = A + B−A = (1, 2, 3) + (1, 0, −3) = (x, y, z); (x, y, z) = (1, 2, 3) + t (1, 0, −3), t ∈ R . Odtud dostáváme parametrické rovnice přímky: x = 1 + t, y = 2, z = 3 − 3t. a kanonický tvar: x − 1 1 = y − 2 0 = z − 3 −3 . Na zlomky v kanonickém tvaru pohlížíme jako na formální zápisy a nepozastavujeme se nad tím, že se tam může vyskytnout dělení nulou. Kanonický tvar nám poskytuje informaci o souřadnicích směrového vektoru ve jmenovatelích zlomků a souřadnice bodu A ∈ p přečteme v čitatelích zlomků. 9.51. Příklad. Ukážeme, jak spočítáme vzdálenost bodu Q ∈ E3 od přímky p = A + u . Tato vzdálenost je rovna výšce rovnoběžníka určeného stranami Q − A a u. Základna tohoto rovnoběžníka má velikost u . Platí tedy: vzdálenost bodu Q od přímky p = výška rovnoběžníka = obsah rovnoběžníka velikost základny = (Q − A) × u u . 98 Lineární algebra 9. Aplikace lineární algebry v geometrii Vzájemná poloha dvou přímek 9.52. Příklad. Vyšetříme vzájemnou polohu dvou přímek p = A + u a q = B + v . Jsou-li vektory u, v, B−A lineárně nezávislé, pak přímky neleží ve společné rovině a jsou tedy mimoběžné. Níže ukážeme, jak vypočítáme vzdálenost těchto přímek. Jsou-li vektory u, v, B−A lineárně závislé, pak přímky leží ve společné rovině a mohou být různoběžné, rovnoběžné nebo totožné. Jsou-li v takovém případě vektory u, v lineárně nezávislé, jsou přímky různoběžné. Níže ukážeme, jak vypočítáme průsečík a úhel mezi různoběžkami. Jsou-li konečně vektory u, v lineárně závislé, jedná se o rovnoběžky a v případě, že bod B ∈ p, pak tyto rovnoběžky splývají v přímku jedinou. Níže ukážeme, jak vypočítáme vzdálenost rovnoběžek. Vzdálenost dvou mimoběžek počítáme z objemu rovnoběžnostěnu, určeného svými stranami u, v, B−A, který z jedné strany lze počítat jako absolutní hodnotu smíšeného součinu a z druhé strany je tento objem roven obsahu rovnoběžníka základny krát výška. Tato výška je přitom hledaná vzdálenost. Platí tedy: vzdálenost mimoběžek = objem rovnoběžnostěnu obsah základny = |(B − A) · (u × v)| u × v = | det A| u × v , (9.3) kde matice A obsahuje postupně řádky se souřadnicemi vektorů B − A, u, v. Vzdálenost rovnoběžek vypočítáme jako vzdálenost bodu na jedné rovnoběžce od rovnoběžky druhé. To jsme dělali v příkladu 9.51. Máme tedy už odvozený vzorec: vzdálenost rovnoběžek = (B − A) × u u . Úhel mezi různoběžkami je roven úhlu ϕ mezi vektory u, v, který spočítáme podle definice 8.20. Může se ale stát, že tento úhel vychází větší než π/2. V takovém případě je úhel mezi přímkami roven π−ϕ. Tento vzorec vyplývá z toho, že mezi různoběžkami můžeme měřit dva úhly a za „oficiální úhel mezi nimi považujeme ten menší z nich. Protože platí | cos ϕ| = cos ϕ pro 0 ≤ ϕ ≤ π/2 a | cos ϕ| = cos(π − ϕ) pro π/2 < ϕ ≤ π, můžeme oba případy zahrnout do jediného vzorce, ve kterém píšeme absolutní hodnotu skalárního součinu: cos ϕ = |u · v| u v . (9.4) Souřadnice průsečíku různoběžek spočítáme jako společné řešení parametrických rovnic jednak pro přímku p a jednak pro přímku q. 9.53. Příklad. Vyšetříme vzájemnou polohu přímek p a q, které jsou dány svými parametrickými rovnicemi v kartézském souřadnicovém systému: p : x = 1 + t y = 2t z = 2 q : x = 3 + t y = 2 z = 1 − t . Z rovnic okamžitě vidíme souřadnice bodu, kterým přímka prochází a souřadnice směrového vektoru: p = (1, 0, 2) + (1, 2, 0) , q = (3, 2, 1) + (1, 0, −1) . Při označení A = (1, 0, 2), B = (3, 2, 1) je B − A = (2, 2, −1). Zjistíme lineární závislost vektoru B − A a směrových vektorů tak, že zapíšeme souřadnice těchto vektorů do matice a počítáme determinant: 2 2 −1 1 2 0 1 0 −1 = 0. (9.5) Zkoumané vektory jsou lineárně závislé, přímky tedy leží ve společné rovině. Protože směrové vektory (1, 2, 0), (1, 0, −1) jsou lineárně nezávislé, p, q jsou různoběžky. Úhel mezi různoběžkami počítáme podle vzorce (9.4): cos ϕ = |(1, 2, 0) · (1, 0, −1)| (1, 2, 0) (1, 0, −1) = |1 + 0 + 0| √ 12 + 22 + 02 √ 11 + 02 + 12 = 1 √ 10 , tj. ϕ = arccos 1 √ 10 . 99 Lineární algebra 9. Aplikace lineární algebry v geometrii Průsečík vychází z rovnic x = x, y = y, z = z, kde za souřadnice x, y, z dosadíme pravé strany odpovídajících parametrických rovnic a u přímky q zvolíme pro parametr jiné označení: 1 + t = 3 + s 2t = 2 2 = 1 − s Soustava je sice „přeurčena (je zde více rovnic než neznámých), ale protože nám vyšel determinant (9.5) nulový, má tato soustava určitě řešení. Řešením je v tomto případě t = 1, s = −1. Dosazením třeba t = 1 do parametrických rovnic přímky p dostáváme souřadnice průsečíku: P = (1, 0, 2)+1·(1, 2, 0) = (2, 2, 2). 9.54. Příklad. Vyšetříme vzájemnou polohu přímky p procházející body A, B s přímkou q procházející body C, D. Body jsou dány v kartézských souřadnicích takto: A = (1, 2, 3), B = (3, 2, 1), C = (1, 0, 2), D = (4, 2, 3). Směrový vektor přímky p je třeba B − A = (2, 0, −2) ∼ (1, 0, −1). Za vlnkou jsme napsali sice jiný směrový vektor, ale je to rovněž směrový vektor přímky p a navíc má souřadnice, se kterými se nám bude pohodlněji pracovat. Směrový vektor přímky q je třeba D − C = (3, 2, 1). Máme tedy: p = (1, 2, 3) + (1, 0, −1) , q = (1, 0, 2) + (3, 2, 1) . Snadno ověříme, že vektory A − C, (1, 0, −1), (3, 2, 1) jsou lineárně nezávislé, takže přímky jsou mimoběžné. Determinant matice, obsahující souřadnice těchto vektorů, je roven −6. Vzdálenost mimoběžek počítáme podle vzorce (9.3): | det A| (1, 0, −1) × (3, 2, 1) = | − 6| (2, −4, 2) = 6 √ 22 + 42 + 22 = 6 √ 24 . Rovnice roviny 9.55. Příklad. Ukážeme si, jak můžeme popsat rovinu v souřadnicovém systému. Nechť je rovina určena bodem A = (a1, a2, a3), kterým prochází, a dvěma lineárně nezávislými směrovými vektory u = (u1, u2, u3), v = (v1, v2, v3). Podle příkladu 9.41 je rovina množinou takových bodů X = (x, y, z), pro které platí: X = A + t u + s v, t ∈ R, s ∈ R, tj. (x, y, z) = (a1, a2, a3) + t (u1, u2, u3) + s (v1, v2, v3), t ∈ R, s ∈ R. Rozepsáním do jednotlivých souřadnic nám vycházejí parametrické rovnice roviny: x = a1 + t u1 + s v1 y = a2 + t u2 + s v2 z = a3 + t u3 + s v3 Na rozdíl od parametrických rovnic přímky se s parametrickými rovnicemi roviny moc často nesetkáme. Místo toho se pracuje s normálovým vektorem roviny, což je libovolný nenulový vektor n, který je kolmý na rovinu . Rovina je určena jedním bodem A = (a1, a2, a3), kterým prochází, a normálovým vektorem n = (a, b, c). Rovina je pak množinou takových bodů X = (x, y, z), pro které platí: (X − A) ⊥ n, tj. (X − A) · n = 0, tj. (x − a1, y − a2, z − a3) · (a, b, c) = 0. V kartézském souřadnicovém systému můžeme pro výpočet skalárního součinu použít větu 8.33 a dostáváme normálovou rovnici roviny, nebo prostě jen rovnici roviny: ax + by + cz + d = 0, kde d = −aa1 − ba2 − ca3. Uvědomíme si, že v rovnici roviny jsou přímo čitelné souřadnice normálového vektoru roviny n = (a, b, c), což je velmi užitečná informace. 100 Lineární algebra 9. Aplikace lineární algebry v geometrii 9.56. Příklad. Ukážeme si, jak je možné přejít od směrových vektorů u, v roviny k normálové rovnici roviny. Protože směrové vektory u a v jsou lineárně nezávislé, je n = u×v normálovým vektorem roviny. Je totiž podle definice vektorového součinu kolmý na oba vektory u a v a tedy je kolmý na celou rovinu . Abychom našli konstanty a, b, c použité v normálové rovnici roviny, stačí tedy vypočítat vektorový součin u × v. Konstantu d dopočítáme buď ze skutečnosti, že je dán bod A ∈ E3, který v rovině leží, nebo vyhodnocením skalárního součinu jako v předchozím příkladu. Existuje ještě jeden způsob sestavení normálové rovnice ze směrových vektorů u, v. Rovina , která prochází bodem A ∈ E3, je totiž také množinou bodů X ∈ E3, pro které je trojice vektorů (X − A), u, v lineárně závislá. Jinými slovy pro matici, která obsahuje v řádcích souřadnice těchto vektorů, musí platit, že má nulový determinant. Při A = (a1, a2, a3), u = (u1, u2, u3), v = (v1, v2, v3), X = (x, y, z) nám vychází: x − a1 y − a2 z − a3 u1 u2 u3 v1 v2 v3 = 0. Výpočtem tohoto determinantu dostáváme normálovou rovnici roviny. 9.57. Příklad. Najdeme rovnici roviny, která prochází body A = (1, 2, 3), B = (1, 1, 1), C = (2, 0, 2). Jedná se o rovinu, která prochází například bodem A a je určena směrovými vektory B − A, C − A. Jinými slovy = A + B − A, C − A = (1, 2, 3) + (0, −1, −2), (1, −2, −1) . Je tedy množina takových bodů X = (x, y, z), pro které platí (x, y, z) = (1, 2, 3) + t (0, −1, −2) + s (1, −2, −1), t ∈ R, s ∈ R. Odtud dostáváme parametrické rovnice roviny : x = 1 + s y = 2 − t − 2s z = 3 − 2t − s Normálový vektor roviny spočítáme jako vektorový součin směrových vektorů: n = (0, −1, −2) × (1, −2, −1) = (−3, −2, 1). Rovnice roviny má tedy tvar −3x − 2y + z + d = 0. Konstantu d ∈ R najdeme například na základě skutečnosti, že A ∈ , takže musí platit −3 · 1 − 2 · 2 + 3 + d = 0, tj. d = 4 a rovnice roviny je: − 3x − 2y + z + 4 = 0. Druhý způsob sestavení rovnice roviny výpočtem determinantu vypadá takto: x − 1 y − 2 z − 3 0 −1 −2 1 −2 −1 = 0, tj. − 3x − 2y + z + 4 = 0. 9.58. Příklad. Najdeme vzdálenost bodu Q ∈ E3 od roviny . Nechť A je libovolný bod roviny . Vzdálenost bodu Q od roviny je rovna absolutní hodnotě kolmého průmětu vektoru Q − A do normálového vektoru n roviny . Na výpočet velikosti kolmého průmětu vektoru použijeme skalární součin podle definice 9.6. Dostáváme: vzdálenost bodu od roviny = |(Q − A) · n| n . (9.6) Nechť například Q = (1, 4, 3) a rovina má rovnici 3x − 2y + 4z + 6 = 0 v kartézských souřadnicích. Z rovnice roviny okamžitě vidíme souřadnice normálového vektoru n = (3, −2, 4). Musíme ještě najít aspoň jedno řešení rovnice roviny, abychom získali souřadnice bodu A ∈ . Při x = 0 a z = 0 vychází y = 3, takže použijeme bod A = (0, 3, 0), Q − A = (1, 1, 3). Hledaná vzdálenost je: v = |(1, 1, 3) · (3, −2, 4)| (3, −2, 4) = |1 · 3 + 1 · (−2) + 3 · 4| √ 32 + 22 + 42 = 13 √ 29 . 101 Lineární algebra 9. Aplikace lineární algebry v geometrii Vzájemná poloha přímky a roviny 9.59. Příklad. Vyšetříme vzájemnou polohu přímky p = A + u a roviny , která prochází daným bodem B a má normálový vektor n. Je-li u ⊥ n, neboli u · n = 0, pak je přímka rovnoběžná s rovinou. V takovém případě ještě může nastat situace, kdy celá přímka leží v rovině, což zjistíme například podle toho, že (B − A) ⊥ n, neboli (B − A) · n = 0. Pokud je přímka rovnoběžná s rovinou, určíme vzdálenost přímky p od roviny stejně jako vzdálenost bodu A ∈ p od roviny . To jsme se naučili v předchozím příkladě 9.58. Je-li u · n = 0, pak přímka p protíná rovinu v jediném bodě. Průsečík najdeme tak, že dosadíme hodnoty x, y, z z parametrických rovnic přímky do rovnice roviny. Tím dostaneme hodnotu parametru, který nám dá po dosazení do parametrických rovnic souřadnice hledaného průsečíku. Tento postup ilustrujeme v následujícím příkladě. Úhel mezi přímkou p protínající rovinu a touto rovinou je roven α = π/2 − ϕ, kde ϕ je úhel mezi směrovým vektorem přímky u a normálovým vektorem roviny n. Pokud ϕ vychází větší než π/2, vezmeme místo něj úhel π − ϕ stejně, jako jsme to dělali při zjišťování úhlu mezi přímkami. Platí: sin α = cos(π/2 − α) = cos ϕ = |u · n| u n , tj. α = arcsin |u · n| u n . (9.7) 9.60. Příklad. Vyšetříme vzájemnou polohu přímky p = (1, 2, 3) + (1, 0, 2) a roviny , která prochází bodem B = (3, 3, 1) a má normálový vektor n = (2, 1, 0). Souřadnice jsou dány v kartézském souřadnicovém systému. Na základě skutečnosti, že B ∈ , můžeme doplnit konstantu d do rovnice roviny, kterou zatím máme ve tvaru 2x + y + 0z + d = 0. Dosazením souřadnic bodu B máme 2 · 3 + 3 + d = 0, takže d = −9 a rovnice roviny je ve tvaru 2x + y − 9 = 0. Směrový vektor přímky (1, 0, 2) není kolmý na normálový vektor roviny (2, 1, 0), protože skalární součin (1, 0, 2) · (2, 1, 0) = 2. Přímka tedy protíná rovinu. Spočítáme úhel mezi přímkou a rovinou podle vzorce (9.7): α = arcsin |(1, 0, 2) · (2, 1, 0)| (1, 0, 2) (2, 1, 0) = arcsin 2 √ 5 √ 5 = arcsin 2 5 . Nyní spočítáme průsečík přímky p s rovinou . Do rovnice roviny dosadíme parametrické rovnice přímky x = 1 + t, y = 2, z = 3 + 2t: 2 · (1 + t) + 2 − 9 = 0, tj. 2t − 5 = 0, tj. t = 5 2 . Průsečík má souřadnice P = (1, 2, 3) + 5 2 (1, 0, 2) = (7 2 , 2, 8). Vzájemná poloha dvou rovin 9.61. Příklad. Vyšetříme vzájemnou polohu dvou rovin. Nechť rovina prochází bodem A a má normálový vektor m a rovina σ prochází bodem B a má normálový vektor n. Pokud jsou vektory m a n lineárně nezávislé, roviny se protínají v přímce p. Tuto průsečnici najdeme jako množinu všech řešení soustavy dvou lineárních rovnic rovin a σ o třech neznámých x, y, z. Nebo můžeme vypočítat směrový vektor průsečnice jako vektorový součin u = m×n, protože průsečnice musí být kolmá k oběma normálovým vektorům. I v tomto případě ale musíme najít ještě aspoň partikulární řešení zmíněné soustavy dvou lineárních rovnic, abychom mohli průsečnici popsat ve tvaru p = P + u . Pokud jsou vektory m a n lineárně závislé, roviny jsou rovnoběžné nebo splývají. Druhý případ poznáme tak, že je B ∈ . Vzdálenost rovnoběžných rovin a σ vypočítáme jako vzdálenost bodu B ∈ σ od roviny , viz příklad 9.58. Úhel mezi dvěma různoběžnými rovinami a σ je shodný s úhlem ϕ mezi vektory m a n až na to, že pokud vychází tento úhel větší než π/2, bereme místo něj hodnotu π − ϕ (podobně jako při měření úhlu mezi přímkami). Dostáváme tedy vzorec: ϕ = arccos |m · n| m n . (9.8) 9.62. Příklad. Jsou dány roviny a σ svými rovnicemi v kartézských souřadnicích: : x + y + 2z − 1 = 0, σ : x − y + 1 = 0. (9.9) Vyšetříme jejich vzájemnou polohu. 102 Lineární algebra 9. Aplikace lineární algebry v geometrii Normálový vektor roviny je (1, 1, 2) a normálový vektor roviny σ je (1, −1, 0). Tyto dva vektory jsou lineárně nezávislé, takže se roviny protínají. Množina všech řešení soustavy (9.9) je p = (0, 1, 0) + (−1, −1, 1) , což je průsečnice rovin a σ. Úhel mezi rovinami je ϕ = arccos |(1, 1, 2) · (1, −1, 0)| (1, 1, 2) (1, −1, 0) = arccos 0 = π 2 , takže roviny jsou na sebe kolmé. 9.63. Příklad. Jsou dány roviny a σ svými rovnicemi v kartézských souřadnicích: : x + y − 2z − 1 = 0 σ : − x − y + 2z + 3 = 0 (9.10) Vyšetříme jejich vzájemnou polohu. Normálový vektor roviny je (1, 1, −2) a normálový vektor roviny σ je (−1, −1, 2). Tyto dva vektory jsou lineárně závislé, takže roviny a σ jsou rovnoběžné. Protože soustava (9.10) nemá žádné řešení, roviny nesplývají. Najdeme si nějaké body A ∈ , B ∈ σ. Při y = 0, z = 0 vychází pro rovinu souřadnice x = 1 a pro rovinu σ vychází x = 3. Máme tedy A = (1, 0, 0), B = (3, 0, 0). Vzdálenost dvou rovnoběžných rovin spočítáme jako vzdálenost bodu B od roviny podle vzorce (9.6): v = |(B − A) · n| n = |(2, 0, 0) · (1, 1, −2)| (1, 1, −2) = 2 √ 12 + 12 + 22 = 2 √ 6 . Souměrné body 9.64. Příklad. Najdeme bod Q , který je souměrný s bodem Q podle roviny . Nechť má tato rovina v kartézských souřadnicích rovnici x − 2y + z − 1 = 0 a nechť je Q = (−1, 5, 0). Body Q a Q leží na společné kolmici k k rovině , jsou stejně vzdáleny od roviny a leží v opačných částech prostoru E3, které rovina ohraničuje. Směrový vektor kolmice k je roven normálovému vektoru roviny , takže je k = (−1, 5, 0) + (1, −2, 1) . Dosadíme hodnoty x, y, z z parametrických rovnic kolmice do rovnice roviny: x = −1 + t, y = 5 − 2t, z = t, (−1 + t) − 2 (5 − 2t) + t − 1 = −12 + 6t = 0, tj. t = 2. Pokud pro t = 2 získáme průsečík kolmice s rovinou, pak pro dvojnásobnou hodnotu parametru t = 4 dostaneme hledaný bod Q . Je tedy Q = (−1, 5, 0) + 4 (1, −2, 1) = (3, −3, 4). 9.65. Příklad. Najdeme bod Q , který je souměrně sdružený podle přímky p = A + u s bodem Q. Body Q a Q leží na společné přímce k, která je kolmá na přímku p a protíná ji. Mají stejnou vzdálenost od průsečíku P a leží na opačných polopřímkách přímky k, které mají počátek v bodě P. Přímka k leží v rovině σ, která je kolmá na vektor u, takže u je normálovým vektorem této roviny. Průsečík P spočítáme jako průsečík roviny σ s přímkou p a pro hledaný bod Q platí Q = P + (P − Q). Nechť jsou například dány kartézské souřadnice Q = (−4, 5, 8), A = (−6, 1, 1), u = (5, 1, 3). Rovnice roviny σ je 5x + y + 3z + d = 0. Protože Q ∈ σ, dostáváme d = −9, takže rovina σ je určena rovnicí 5x + y + 3z − 9 = 0. Spočítáme dále průsečík přímky p s rovinou σ: 5 (−6 + 5t) + (1 + t) + 3 (1 + 3t) − 9 = −35 + 35t = 0, tj. t = 1. Průsečík přímky p s rovinou σ tedy je P = (−6, 1, 1) + 1 (5, 1, 3) = (−1, 2, 4). Nyní spočítáme souřadnice hledaného bodu: Q = (−1, 2, 4) + (P − Q) = (−1, 2, 4) + (3, −3, −4) = (2, −1, 0). 103 Lineární algebra 9. Aplikace lineární algebry v geometrii Tři roviny9.66. Příklad. Ukážeme geometrickou interpretaci množiny řešení soustavy tří lineárních rovnic o třech neznámých. Ztotožníme-li uspořádanou trojici (x, y, z) s bodem v E3, pro který jsou (x, y, z) jeho souřadnice vzhledem k nějakému pevně zvolenému souřadnicovému systému, můžeme mluvit o množinách řešení soustavy jako o bodech, přímkách a rovinách. Pak jsou jednotlivé rovnice soustavy též rovnicemi rovin. Tři rovnice v soustavě znamenají, že pracujeme se třemi rovinami. Množina všech řešení takové soustavy je pak společným průnikem všech tří rovin. Dvě rovnice jsou rovnicemi stejné roviny právě tehdy, když jedna rovnice je násobkem druhé. Pro další rozbor tento případ vyloučíme a budeme tedy pracovat se třemi rovinami, z nichž žádné dvě nejsou totožné. Označíme ještě symbolem M0 lineární prostor řešení přidružené homogenní soustavy. Případ dim M0 = 3 můžeme vyloučit, protože rovnice roviny nemohou mít všechny koeficienty nulové. Má-li soustava řešení, pak nemůže dim M0 = 2, protože to by znamenalo, že všechny tři roviny jsou totožné. Takový případ jsme před chvílí rovněž vyloučili. Má-li soustava řešení a je-li dim M0 = 1 (tj. hodnost matice soustavy je rovna 2), pak množina všech řešení tvoří přímku, která je společnou průsečnicí všech tří rovin. Má-li soustava jediné řešení (tj. hodnost matice soustavy je rovna 3), pak toto řešení tvoří bod P, který je společným průsečíkem všech tří rovin. Každé dvě roviny mají společnou průsečnici a tyto tři průsečnice se rovněž protínají v bodě P. Je-li množina řešení prázdná (tj. hodnost matice soustavy je 2 a rozšířené matice soustavy je 3), pak roviny jsou buď všechny tři vzájemně rovnoběžné, nebo jsou dvě roviny rovnoběžné a třetí je protíná nebo se tyto tři roviny protínají každá s každou v nějaké průsečnici a tyto tři průsečnice jsou rovnoběžné. K rozlišení těchto případů můžeme použít testy na lineární závislost a nezávislost normálových vektorů odpovídajících rovin podobně, jako v příkladě 9.61. 104 10. Lineární algebra v teorii kódování 10.1. Poznámka. Teorie kódování řeší otázku, jak převést danou informaci do slov, která používají znaky nějaké abecedy (obvykle abecedy jedniček a nul) pokud možno efektivně, tj. bez zbytečného zatěžování přenosových linek a paměťových médií nadbytečnými informacemi. Typickým příkladem kódování je ASCII kód, který písmenům anglické abecedy a běžným znakům přiřazuje sedmibitová slova. Navíc se při kódování často řeší otázka, jakým způsobem efektivně přidat k zakódované informaci dodatečné bity tak, aby byla informace odolná vůči šumu na přenosové lince nebo menším chybám na paměťovém médiu. Dekodér, tj. zařízení, které má za úkol restaurovat původní informaci, může být postaven za nekvalitní linkou a může tedy dostat informaci zkreslenou. Z vhodně navržených dodatečných bitů může dekodér zjistit, zda informace při průchodu linkou byla poškozena a v lepším případě dokáže chybu také opravit. Při návrhu vhodného kódování s možností detekce a opravy chyb se už od padesátých let minulého století používala lineární algebra. Tuto kapitolu završíme příkladem konstrukce tzv. lineárních Hammingových kódů. To samozřejmě zdaleka nepokrývá veškerou problematiku teorie kódování, zájemce o další studium této problematiky může použít třeba [1]. Někteří laici možná nerozlišují slovo kódování od slova šifrování. Šifrování je převod informace do takového stavu, aby ji bylo možné zpětně zrestaurovat jen pověřenými osobami. Tuto problematiku, ačkoli matematicky rovněž velmi zajímavou a ze strategického hlediska velmi důležitou, zde řešit nebudeme. Těleso Z210.2. Poznámka. Definice lineárního prostoru 1.6 předpokládá, že skaláry (čísla, kterými násobíme vektory) jsou reálná čísla. V této kapitole budeme pracovat s modifikovanou definicí lineárního prostoru, kde reálná čísla nahradíme tělesem Z2. Poznamenávám, že pojem tělesa jsem přesně zavedl v textu za poznámkou 1.29. Pokud čtenář tuto část textu přeskočil, může si pod pojmem těleso zhruba představit množinu s operacemi sčítání a násobení. Tyto operace mají podobné vlastnosti, jako sčítání a násobení reálných čísel (komutativita, asociativita, distributivita, atd.). 10.3. Definice. Těleso Z2 je dvoubodová množina {0, 1}, na které je definováno sčítání + : Z2 ×Z2 → Z2 a násobení · : Z2 × Z2 → Z2 takto: + 0 1 0 0 1 1 1 0 · 0 1 0 0 0 1 0 1 Tedy: 0 + 0 = 0, 0 + 1 = 1 + 0 = 1, 1 + 1 = 0, 0 · 0 = 0 · 1 = 1 · 0 = 0, 1 · 1 = 1. 10.4. Poznámka. Sčítání na Z2 je shodné s logickou operací XOR (vylučovací nebo) a násobení na Z2 je shodné s operací AND (logická konjunkce). Nebo jinak: Násobení na Z2 je stejné, jako jsme zvyklí násobit celá čísla, a sčítání skoro taky, až na jedinou výjimku: 1 + 1 = 0. Nebo ještě jinak: Prvek 0 v Z2 si můžeme představit jako jakékoli sudé číslo a prvek 1 jako jakékoli číslo liché. Sčítáme a násobíme pak sudá čísla se sudými, s lichými atd. Tyto operace pak dávají jako výsledek čísla sudá nebo lichá přesně podle pravidel počítání v Z2. Nebo ještě jinak: provedeme operaci sčítání a násobení jako v případě celých čísel, ale pokud výsledek padne mimo množinu {0, 1}, použijeme zbytek při dělení výsledku číslem 2. 10.5. Příklad. Na množině uspořádaných n-tic prvků ze Z2, tj. na množině Zn 2 , zavedeme operaci sčítání + : Zn 2 × Zn 2 → Zn 2 analogicky, jako v případě sčítání uspořádaných n-tic reálných čísel, jen samozřejmě pracujeme se sčítáním podle definice 10.3. Pro (a1, . . . , an) ∈ Zn 2 a (b1, . . . , bn) ∈ Zn 2 definujeme (a1, . . . , an) + (b1, . . . , bn) df = (a1 + b1, . . . , an + bn). Například (1, 0, 0, 1, 1) + (1, 1, 0, 0, 1) = (0, 1, 0, 1, 0). Dále definujeme násobení těchto uspořádaných n-tic jedničkou a nulou přirozeným způsobem: 1 · (a1, . . . , an) df = (a1, . . . , an), 0 · (a1, . . . , an) df = (0, . . . , 0). Povšimněte si analogie s příklady 1.11 a 1.69. Pokud nahradíme v definici lineárního prostoru 1.6 množinu reálných čísel R nějakým tělesem, pak takovému lineárnímu prostoru říkáme, že je definován „nad tělesem (podrobněji viz definici 1.67). V tomto příkladě jsme zavedli na množině Zn 2 operace tak, že dostáváme lineární prostor nad tělesem Z2. Nulový vektor tohoto lineárního prostoru je vektor (0, . . . , 0). Tento lineární prostor má celkem 2n vektorů, které mezi sebou umíme sčítat a samozřejmě tyto vektory umíme násobit jedničkou nebo nulou. 105 Lineární algebra 10. Lineární algebra v teorii kódování Počítání v Z2 10.6. Poznámka. Na rozdíl od lineárních prostorů nad R náš nově zavedený lineární prostor nad Z2 má konečně mnoho prvků. To je jediný rozdíl vzhledem k lineárním prostorům, které jsme dosud studovali. Všechny ostatní vlastnosti zůstávají stejné. 10.7. Poznámka. Každý vektor z Zn 2 je sám sobě opačným vektorem, tj. ∀x ∈ Zn 2 : x = −x, neboli x + x = o. Díky tomu v tělese Z2 a v lineárním prostoru nad tímto tělesem nemusíme rozlišovat mezi sčítáním a odčítáním. 10.8. Příklad. Najdeme dimenzi a bázi lineárního obalu čtyř vektorů v Z5 2: M = (1, 0, 1, 0, 1), (1, 1, 0, 0, 1), (1, 0, 0, 1, 1), (0, 1, 1, 0, 0) . Řešení: Protože Gaussova eliminace nemění lineární obal, najdeme bázi eliminací:     1 0 1 0 1 1 1 0 0 1 1 0 0 1 1 0 1 1 0 0     ∼     1 0 1 0 1 0 1 1 0 0 0 0 1 1 0 0 1 1 0 0     ∼     1 0 1 0 1 0 1 1 0 0 0 0 1 1 0 0 0 0 0 0     . Báze M je tedy například (1, 0, 1, 0, 1), (0, 1, 1, 0, 0), (0, 0, 1, 1, 0). Dimenze M je tři. 10.9. Poznámka. Protože Zn 2 obsahuje konečný počet vektorů, můžeme (na rozdíl od lineárních prostorů nad R) vypsat podprostor nebo lineární obal výčtem prvků. Pro podprostor M z předchozího příkladu platí: M = {(0, 0, 0, 0, 0), (1, 0, 1, 0, 1), (0, 1, 1, 0, 0), (0, 0, 1, 1, 0), (1, 1, 0, 0, 1), (1, 0, 0, 1, 1), (0, 1, 0, 1, 0), (1, 1, 1, 1, 1)}. Jak se dá takový výčet prvků najít? Především pro x = o je x = {o, x}. Skutečně, vektor x můžeme násobit jen jedničkou nebo nulou. To jsou všechny lineární kombinace, které můžeme s vektorem x vytvořit. Množina M má tříprvkovou bázi {a, b, c}. Takže pro sestavení lineárního obalu stačí najít všechny lineární kombinace těchto tří vektorů: o, a, b, c, a + b, a + c, b + c, a + b + c. 10.10. Příklad. Zjistěte počet prvků lineárního (pod)prostoru nad Z2, který má dimenzi n. Řešení: Má-li (pod)prostor dimenzi n, pak má n prvkovou bázi b1, b2, . . . , bn. Abychom získali všechny lineární kombinace těchto vektorů, musíme každý vektor násobit jedničkou nebo nulou. Máme tedy 2n lineárních kombinací. Tyto kombinace vyplňují celý lineární (pod)prostor a jsou navzájem různé. Kdyby se totiž dvě lineární kombinace s různými koeficienty rovnaly, pak jejich odečtením dostáváme netriviální lineární kombinaci rovnu nulovému vektoru. To je spor se skutečností, že b1, b2, . . . , bn je báze. Závěr: počet prvků lineárního (pod)prostoru nad Z2 dimenze n je 2n . Například podprostor M z příkladu 10.8 má dimenzi 3 a má tedy 23 = 8 prvků. 10.11. Příklad. Najděte všechna řešení x ∈ Z6 2 homogenní soustavy rovnic A x = o, je-li A =      1 1 0 1 0 1 1 0 1 1 0 0 0 1 0 0 1 1 1 0 0 1 1 0 1 1 1 0 0 1      . Řešení: Najdeme matici ekvivalentní soustavy s lineárně nezávislými řádky:      1 1 0 1 0 1 1 0 1 1 0 0 0 1 0 0 1 1 1 0 0 1 1 0 1 1 1 0 0 1      ∼      1 1 0 1 0 1 0 1 1 0 0 1 0 1 0 0 1 1 0 1 0 0 1 1 0 0 1 1 0 0      ∼    1 1 0 1 0 1 0 1 1 0 0 1 0 0 1 0 1 0 0 0 0 1 1 0    . Hodnost matice soustavy je 4, dimenze prostoru je 6, takže dimenze množiny řešení je 2. Hledáme tedy dvě lineárně nezávislá řešení: (?, ?, ?, ?, 1, 0) a (?, ?, ?, ?, 0, 1). Dosazením „zespoda nahoru dostáváme následující řešení: (0, 1, 1, 1, 1, 0), (0, 1, 0, 0, 0, 1). Množina všech řešení je lineárním obalem těchto dvou řešení a obsahuje 22 = 4 vektory: (0, 1, 1, 1, 1, 0), (0, 1, 0, 0, 0, 1) = {(0, 0, 0, 0, 0, 0), (0, 1, 1, 1, 1, 0), (0, 1, 0, 0, 0, 1), (0, 0, 1, 1, 1, 1)}. 106 Lineární algebra 10. Lineární algebra v teorii kódování 10.12. Poznámka. Při hledání báze prostoru řešení můžeme také využít větu 5.34. V předchozím příkladě bychom pak pokračovali v eliminaci zpětným chodem:    1 1 0 1 0 1 0 1 1 0 0 1 0 0 1 0 1 0 0 0 0 1 1 0    ∼    1 0 0 0 0 0 0 1 0 0 1 1 0 0 1 0 1 0 0 0 0 1 1 0    . Tvar matice (E|C) odpovídá předpokladu věty 5.34, takže řádky báze řešení tvoří matici: 0 1 1 1 1 0 0 1 0 0 0 1 . Poznamenejme, že nemusíme přecházet od matice C k matici −C, protože v aritmetice Z2 jsou obě matice stejné. Kód, kódové slovo 10.13. Definice. Nechť A je konečná množina (tzv. abeceda). Pak slovo je libovolná konečná posloupnost prvků z A. Kódování v obecném smyslu zahrnuje (1) algoritmus, kterým informace převádíme do posloupnosti slov (tzv. kodér) a (2) algoritmus, kterým zpětně z těchto slov získáváme původní informaci (dekodér). Slova, která vytváří kodér, se nazývají kódová slova. Množina všech kódových slov se nazývá kód. Je-li kód množinou slov stejné délky (každé kódové slovo má stejný počet znaků abecedy), mluvíme o tzv. blokovém kódu. Blokový kód délky n značí, že všechna kódová slova mají n znaků abecedy. 10.14. Poznámka. Typicky A = {0, 1}, tj. abeceda se skládá jen ze dvou znaků (tzv. bitů, anglicky bits, což je původně zkratka z BInary digiTS) a slova jsou posloupnosti těchto bitů. 10.15. Příklad. ASCII kód je množina 7bitových slov, která reprezentují jednotlivá písmena anglické abecedy a další běžné znaky (číslice, tečku, vykřičník, otazník, mezeru, # neboli vězení atd.). Tato množina obsahuje 91 slov, protože v době vzniku tohoto kódu byl požadavek na kódování 91 znaků. Kodér i dekodér pak pracují s tabulkou těchto znaků, u kterých jsou uvedena odpovídající kódová slova. Tato tabulka může být na straně kodéru technicky realizována třeba ovladačem klávesnice a na straně dekodéru fontem. Jedná se o blokový kód. Od počátku existence počítačů byl tento blokový kód rozšířen o redundantní nulový bit na začátku, takže často je ASCII kód prezentován jako množina 8bitových slov. Později začal být tento bit využíván pro různá rozšíření ASCII kódu, která zahrnují i reprezentaci některých písmen s diakritickými znaménky. 10.16. Poznámka. Je potřeba si uvědomit, že slova jsou do paměťového média nebo do přenosové linky vkládána za sebou bez oddělovačů. Blokový kód má tu výhodu, že dekodér dokáže snadno rozdělit tento „tok znaků abecedy na slova a těm pak přidělit význam například pomocí nějaké tabulky. Nevýhoda blokového kódu spočívá v tom, že plýtvá místem, neboť tušíme, že pokud navrhneme pro častěji se vyskytující slova kratší posloupnosti znaků, celkový počet znaků abecedy pro přenášené/ukládané informace může být menší. To ostatně je (alespoň zhruba) i vlastnost přirozeného jazyka. Tam máme ovšem abecedu rozsáhlejší (nebinární) a za prvek abecedy můžeme považovat i mezeru: oddělovač mezi slovy, který dekodéru pomůže. Nebo v Morseově abecedě máme také tři znaky: tečka, čárka a mezera. Bez mezery by bylo dekódování morseovky nemožné. Máme-li k dispozici jen binární abecedu A = {0, 1}, pak je potřeba při návrhu kódu se slovy nestejné délky myslet na možnosti dekodéru. Je to technicky možné, ale není to obsahem tohoto textu. Příkladem neblokového kódu je UTF8, který kóduje znaky abeced všech jazyků světa. Písmena anglické abecedy a běžné znaky jsou reprezentovány 8bitovým slovem, ale písmena dalších jazyků jsou kódována 16bitovým slovem nebo i delším (24 bitů a 32 bitů). Nadále budeme pracovat jen s blokovými kódy nad binární abecedou. Kódování s detekcí a opravou chyb 10.17. Poznámka. Nechť K je blokový kód délky n nad binární abecedou A. Pak platí K ⊆ An . Pokud K = An , pak mezi uspořádanými n-ticemi z A existují nekódová slova, tj. taková, která kodér nikdy nevytvoří a která nemají přidělen význam. Přijme-li dekodér (např. za nekvalitní linkou) nekódové slovo, je si jist, že při přenosu linkou došlo k chybě. Může například v takovém případě požádat pomocí jiných technických prostředků kodér, aby vyslal slovo znovu. Nebo se může pokusit chybu opravit. 107 Lineární algebra 10. Lineární algebra v teorii kódování Tušíme jisté problémy: šum na lince může způsobit tak nešťasnou chybu, že se z jednoho kódového slova stane jiné kódové slovo a dekodér nic nepozná. Je tedy rozumné kódování navrhnout tak, aby například omezený počet chyb v jednom slově (tj. záměn nuly za jedničku a naopak) zaručil, že se z kódového slova stane slovo nekódové. Znovu můžeme hledat analogii v přirozeném jazyce. Překlep ve slově jsme velmi často schopni detekovat i opravit. Někdy ale překlep může způsobit, že vzniká jiné běžné slovo jazyka. Člověk jako dekodér ani s tímto druhem chyby nemá většinou problém, protože pracuje s kontextem celé věty (větší skupiny slov). Takto inteligentní dekodér ale nebude naším cílem. Vystačíme si s detekováním a opravováním chyb jen na úrovni jednotlivých slov. 10.18. Definice. Nechť A = {0, 1}. Hammingova velikost slova u ∈ An je počet jedniček v tomto slově a značíme ji u . Hammingova vzdálenost slov v ∈ An a w ∈ An je počet bitů, ve kterých se tato dvě slova liší. Značíme ji d(v, w). 10.19. Poznámka. Nechť A = {0, 1} a v, w ∈ An . Pak v + w (v aritmetice Z2) je slovo, které má jedničky právě v místech, kde se v a w liší. Takže platí: d(v, w) = v + w . 10.20. Poznámka. Předpokládejme, že v je slovo vyslané kodérem a w slovo přijaté dekodérem. Pak d(v, w) udává počet chyb ve slově, které vznikly během přenosu. Poznámka v poznámce: předpokládáme, že díky technickým parametrům zařízení nikdy nedojde k chybě, kdy se jednička nebo nula ze slova zcela vytratí nebo vznikne nová, tj. nikdy nehrozí riziko, že by na straně dekodéru byl přečten jiný počet jedniček a nul než byl vyslán kodérem. 10.21. Příklad. Je dán tento kód: K = {0000, 0011, 0101, 1001, 0110, 1010, 1100, 1111}. Jedná se o blokový binární kód délky 4. Pro potřeby tohoto příkladu nebudeme specifikovat druh informace, kterou potřebujeme přenášet. Protože kód obsahuje jen 8 slov, může být původní informace zapsána pomocí nějaké 8 znakové abecedy. Zajímavé na tomto kódu je, že každé kódové slovo obsahuje sudý počet jedniček. Pokud dojde k jediné chybě ve slovu, máme jistotu, že dekodér přijme nekódové slovo (s lichým počtem jedniček) a ohlásí chybu. Je-li pravděpodobnost výskytu dvou nebo více chyb v jednom slově zanedbatelná a nám postačuje jen detekovat chyby (neopravovat je), je toto rozumný návrh kódu. Povšimneme si, že minimální Hammingova vzdálenost mezi dvěma různými kódovými slovy tohoto kódu je 2, takže jedna chyba způsobí vytvoření nekódového slova. 10.22. Příklad. Je dán blokový kód délky 8 bitů: K = {00000000, 00001111, 11110000, 11111111}. Minimální Hammingova vzdálenost mezi kódovými slovy je 4, takže ani tři chyby ve slově nezpůsobí přechod na jiné kódové slovo a dekodér správně detekuje chybu přenosu. Dekodér dokonce dokáže v tomto kódu opravit jednu chybu a detekovat výskyt dvou chyb ve slově. Chybu opraví tak, že se od přijatého slova w vrátí ke kódovému slovu v takovému, že Hammingova vzdálenost d(v, w) = 1. Samozřejmě, naučíme-li dekodér opravovat jednu chybu ve slově, pak už nemusí být schopen vždy správně detekovat tři chyby. Může se totiž stát, že místo toho opraví jeden bit a dostane jiné kódové slovo. 10.23. Příklad. Nechť minimální Hammingova vzdálenost mezi kódovými slovy je d > 2. Rozhodněte (A) kolik chyb ve slově může dekodér detekovat, pokud po něm nechceme, aby chyby opravoval, a (B) kolik chyb ve slově může opravit a kolik jich může aspoň detekovat bez opravy. Odpověď: (A) Dekodér může spolehlivě detekovat nejvýše d−1 chyb. (B) Je-li d sudé, může dekodér opravit jednu až d/2 − 1 chyb a detekovat d/2 chyb bez opravy. Je-li d liché, může opravit jednu až (d − 1)/2 chyb a žádné množství chyb nedetekuje bez opravy. Je samozřejmě možné i jiné rozvržení. Např. pro d liché necháme dekodér opravit nejvýše (d − 3)/2 chyb a při výskytu (d − 1)/2 nebo (d + 1)/2 chyb ve slově jen chyby detekujeme bez opravy. Lineární kód10.24. Poznámka. Při návrhu dekodéru s detekcí nebo opravou chyb se s výhodou využijí nástroje lineární algebry, jako je násobení matic, vymezení podprostorů a bází, řešení homogenních soustav atd. Binární slova délky n budeme v tomto případě považovat za vektory z lineárního prostoru Zn 2 , takže je můžeme sčítat. Ostatně, už v poznámce 10.19 jsem zmínil sčítání slov v a w. V teorii kódování se binární slova zapisují jedničkami a nulami bez mezer (viz příklady 10.21 a 10.22), zatímco v lineární algebře jsme dosud zapisovali vektory do závorek a jejich složky oddělovali čárkami. Věřím, že nedojde k nedorozumění, pokud dále v textu o kódování budu zapisovat vektory způsobem, jako v příkladu 10.21. 108 Lineární algebra 10. Lineární algebra v teorii kódování 10.25. Definice. Binární blokový kód K délky n je lineární, pokud K tvoří lineární podprostor lineárního prostoru Zn 2 . Jestliže dimenzi tohoto podprostoru označíme k, pak mluvíme o lineárním (n, k) kódu. 10.26. Věta. Nejmenší Hammingova vzdálenost mezi slovy lineárního kódu K je rovna nejmenší Hammingově velikosti nenulového kódového slova. Důkaz. Stačí si uvědomit, že pro v1, v2 ∈ K je v1 + v2 = d(v1, v2), a přitom v1 + v2 ∈ K, protože K je lineární kód. Navíc v = d(v, o). 10.27. Příklad. Kód z příkladu 10.21 je lineární, protože K tvoří podprostor lineárního prostoru Z4 2. Skutečně, sečteme-li dva vektory se sudým počtem jedniček, dostameme vektor se sudým počtem jedniček. Výsledek násobení vektoru z K konstantou α zůstane v K, protože v Z2 číslo α může být jen 0 nebo 1. Báze kódu z příkladu 10.21 je například {0011, 0101, 1100}, takže dimenze kódu je 3 a jedná se tedy o lineární (4, 3) kód. 10.28. Poznámka. Příklad 10.21 ilustruje tzv. kódování s kontrolním bitem parity. Původní informaci s osmi znaky je možné kódovat blokovým binárním kódem {000, 001, 010, 011, 100, 101, 110, 111}, tedy stačí nám tři bity. Pokud chceme detekovat jednu chybu ve slově, přidáme čtvrtý tzv. kontrolní bit, který nastavíme na 0, pokud je v původním tříbitovém slově sudý počet jedniček a nastavíme ho na 1, pokud je v původním slově lichý počet jedniček. Dostáváme tak kód z příkladu 10.21. Tento postup můžeme použít na jakýkoli „výchozí binární blokový kód délky k se všemi 2k kódovými slovy. Přidáním kontrolního bitu parity dostáváme lineární (k+1, k) kód, kterým jsme schopni detekovat jednu chybu ve slově. Dekodér pak odstraní kontrolní bit z každého přijatého slova a získá tím původní kódovanou informaci. 10.29. Poznámka. Vstupní informace je často připravena už jako posloupnost slov binárního blokového kódu délky k, ve kterém všechna slova jsou kódová. Naším úkolem je pak rozšířit tento kód o dalších n − k tzv. kontrolních bitů, abychom dostali lineární (n, k) kód. Kodér tedy očekává na vstupu libovolné slovo délky k a jeho úkolem je zkopírovat bity vstupu do výstupu (tzv. informační bity) a přidat n − k kontrolních bitů. Dekodér pak použije tyto kontrolní bity pro detekci a případnou opravu chyb a poté je odstraní a ponechá jen informační bity. Cílem je navrhnout kódování, které má co nejmenší redundanci (tj. poměr počtu kontrolních bitů ku počtu všech přenášených bitů ve slově), protože ta zatěžuje linku nebo paměťové médium režijními informacemi, které uživatel ze svého pohledu nevyužije. Přitom ale chceme co nejschopnější dekodér, který by detekoval a opravoval chyby a navíc by měl pracovat efektivně. Z pohledu lineární algebry je výše popsaný přechod od kódu délky k na lineární kód délky n > k lineární zobrazení A : Zk 2 → Zn 2 , které je prosté (jinak by docházelo ke ztrátě informace). Podle věty 7.20 množina obrazů tohoto zobrazení (neboli kód) tvoří lineární podporostor v Zn 2 . Bázi tohoto podprostoru můžeme hledat tak, že sepíšeme bázi ve výchozím prostoru Zk 2 a najdeme její obraz za použití zobrazení A. Tento obraz podle věty 7.27 jednoznačně určuje zobrazení A na celém Zk 2. Kodérem je přímo zobrazení A a možným dekodérem je zobrazení inverzní k A definované na A(Zk 2 ). Ovšem dekodér se musí umět vyrovnat i se slovy, která jsou nekódová, tj. neleží v množině A(Zk 2 ). To inverzní zobrazení k A neumí. 10.30. Příklad. Nechť je vstupní informace kódována binárním blokovým kódem délky k se všemi 2k slovy. Kodér této informace navrhneme tak, že každé vstupní slovo zopakuje a vytvoří výstupní slovo délky 2k. Tím vzniká lineární (2k, k) kód. Minimální Hammingova vzdálenost mezi dvěma kódovými slovy je 2, takže dekodér spolehlivě detekuje jednu chybu ve slově. Za jistých okolností může detekovat i více chyb ve slově, pokud chyba v první polovině slova se nezopakuje na stejném bitu druhé poloviny slova. V žádném případě ale dekodér nemůže odhalenou chybu spolehlivě opravit. Redundance je příliš vysoká, a přitom neumíme ani opravit chyby. Asi to nebude nejlepší možný návrh kódování. 10.31. Příklad. Kód z příkladu 10.22 je lineární. Nevýhoda tohoto kódu ale spočívá v tom, že kódová slova mohou reprezentovat jen čtyři rozdílné stavy původní informace, ale mají příliš mnoho bitů, které zbytečně zatěžují paměťové médium nebo přenosové linky. Proto se Hamming zaměřil na hledání jiných vhodnějších lineárních kódů. 109 Lineární algebra 10. Lineární algebra v teorii kódování Generující a kontrolní matice 10.32. Definice. Generující matice lineárního kódu K je po řádcích zapsaná báze tohoto kódu. Kontrolní matice lineárního kódu K je taková matice H s lineárně nezávislými řádky, pro kterou platí: množina řešení homogenní soustavy H x = o je rovna kódu K. 10.33. Věta. Nechť G je generující matice a H kontrolní matice lineárního (n, k) kódu. Pak G má k řádků a H má n−k řádků. Obě matice mají n sloupců. Jinými slovy, generující matice má tolik řádků, kolik je v kódu informačních bitů, kontrolní matice má tolik řádků, kolik má kód kontrolních bitů a počet sloupců obou matic je roven počtu přenášených bitů v jednom slově. Důkaz. Matice G má k řádků, protože báze prostoru dimenze k obsahuje k vektorů. Počet řádků matice H plyne z věty 5.14. Konečně n sloupců obou matic plyne přímo z definice těchto matic. 10.34. Příklad. Kód z příkladu 10.21 může mít následující generující matici: G =   1 0 0 1 0 1 0 1 0 0 1 1   , protože {1001, 0101, 0011} je báze kódu K. Popíšu, jak se obvykle tato báze sestavuje. Vyjde se ze standardní báze vstupního kódu: {100, 010, 001} a aplikuje se na ní zobrazení kodéru. Všechny tři prvky této báze mají lichý počet jedniček, takže poslední kontrolní bit kodér nastaví na jedničku. Kontrolní matice našeho kódu je H = ( 1 1 1 1 ) , protože množina řešení rovnice x1 + x2 + x3 + x4 = 0 je shodná s množinou slov, které mají sudý počet jedniček (sčítáme jedničky modulo 2), a to jsou právě všechna kódová slova. 10.35. Příklad. Kódujme vstupní informaci v blokovém kódu délky 4 podle příkladu 10.30 (zdvojení slova). Dostáváme lineární (8,4) kód. Jeho generující matice je G =    1 0 0 0 1 0 0 0 0 1 0 0 0 1 0 0 0 0 1 0 0 0 1 0 0 0 0 1 0 0 0 1    . K vytvoření této báze jsem použil stejný postup, jako v předchozím příkladě. Na standardní bázi prostoru Z4 2 jsem aplikoval zobrazení kodéru. Kontrolní matice je výjimečně v tomto příkladě H = G, protože soustava rovnic x1 + x5 = 0 x2 + x6 = 0 x3 + x7 = 0 x4 + x8 = 0 má za řešení právě taková slova, pro která první bit je roven pátému, druhý šestému, třetí sedmému a čtvrtý osmému, tj. obě části slova se rovnají a jedná se o kódové slovo. 10.36. Poznámka. Generující matice sama o sobě jednoznačně určuje lineární kód. Kontrolní matice sama o sobě také jednoznačně určuje lineární kód. Tyto dvě matice jsou v následujícím „duálním vztahu: 10.37. Věta. Nechť G je generující a H je kontrolní matice lineárního (n, k) kódu. Pak H · GT = O1 a také G · HT = O2, kde O1 je nulová matice s n − k řádky a k sloupci a O2 = OT 1 . Důkaz. Kód s uvedenými maticemi označíme písmenem K. Řádky matice G alias sloupce matice GT jsou podle definice generující matice prvky kódu K. Podle definice kontrolní matice musí tyto sloupce matice GT alias prvky kódu K být řešením soustavy H x = o. Přesně to říká vztah H·GT = O1, pokud jej rozepíšeme po jednotlivých sloupcích matice GT . Vztah G · HT = O2 vzniká transponováním matic na levé i pravé straně vztahu H · GT = O1. 110 Lineární algebra 10. Lineární algebra v teorii kódování 10.38. Poznámka. Předchozí věta ukazuje, že nejen řádky matice G řeší soustavu Hx = o, ale také řádky matice H řeší soustavu Gx = o. Známe-li jen jednu z těchto matic, pak druhou lze najít tak, že najdeme bázi množiny řešení odpovídající homogenní soustavy rovnic a zapíšeme ji do řádků. Protože velmi často je generující matice vytvořena za použití standardní báze vstupního prostoru Zk 2 a aplikací algoritmu kodéru na tuto bázi, který kopíruje informační bity a přidává kontrolní bity na konec slova, je matice G často ve tvaru G = (E|C), kde E je jednotková matice typu (k, k). Matici H pak můžeme snadno najít podle věty 5.34, přitom místo matice −CT stačí použít matici CT , protože v aritmetice Z2 je C = −C. Dostáváme H = (CT |E ), kde E je jednotková matice typu (n − k, n − k). 10.39. Příklad. S využitím věty 5.34 zkusíme sestavit kontrolní matice z příkladů 10.34 a 10.35, pokud je dána jen generující matice. Příklad 10.34. Matice C z rovnosti G = (E|C) obsahuje sloupec jedniček. CT je tedy řádek jedniček, ke kterému podle věty 5.34 vpravo připíšeme jednotkovou matici typu (1, 1). Dostáváme matici H. Příklad 10.35. Matice C z rovnosti G = (E|C) je jednotková matice, takže CT = C. K této jednotkové matici podle věty 5.34 připíšeme jednotkovou matici typu (4, 4). Dostáváme tím matici H, která je výjimečně rovna matici G. 10.40. Definice. Pokud existuje generující matice lineárního kódu ve tvaru G = (E|C), kde E je jednotková matice, nazýváme takový kód systematický. 10.41. Poznámka. Předchozí poznámka 10.38 ukazuje, že pro systematické kódy můžeme z generující matice snadno sestavit matici kontrolní ve tvaru H = (CT |E ). Také obráceně, pokud je dána kontrolní matice ve tvaru H = (CT |E ), je možné snadno přejít k matici generující tvaru G = (E|C). 10.42. Poznámka. Nechť je dána generující matice, která není tvaru (E|C). Protože generující matice obsahuje v řádcích bázi kódu, je možné eliminací této matice přejít k jiné generující matici téhož kódu. Stačí si uvědomit, že Gaussova eliminace nemění lineární obal řádků. Může se tedy stát, že po eliminaci dostaneme novou generující matici ve tvaru G = (E|C) a shledáme, že kód je systematický. Pokud ani po eliminaci generující matice nelze dosáhnout tvaru (E|C), jedná se o nesystematický kód. I v tomto případě je ovšem eliminací možné dospět k matici, která se od matice (E|C) liší jen prohozením některých sloupců. Nesystematický kód se tedy od systematického liší jen pořadím bitů v jednotlivých kódových slovech. Přechod od generující matice ke kontrolní (nebo obráceně) je u nesystematického kódu obtížnější, protože nelze přímo použít větu 5.34, ale před jejím použitím musíme prohodit sloupce generující matice, pak přejít ke kontrolní matici a u ní prohodit sloupce zpět. Podobně bychom postupovali, pokud přecházíme od kontrolní matice nesystematického kódu k matici generující. Systematický kód získáme zaručeně v případě, kdy necháme kodér kopírovat informační bity vstupního slova do výstupu a pak přidat bity kontrolní. Pokud ale kodér informační bity „promíchá s bity kontrolními, pak kód nemusí být systematický. 10.43. Věta. Kód je systematický právě tehdy, když existuje kontrolní matice tohoto kódu tvaru (CT |E ), kde E je jednotková matice. Důkaz. Tvrzení věty je důsledkem skutečnosti, že kód má generující matici tvaru G = (E|C) právě tehdy, když má kontrolní matici tvaru H = (CT |E ). 10.44. Poznámka. Je-li dána kontrolní matice v jiném tvaru než (CT |E ), pak z toho ještě neplyne, že kód není systematický. Eliminací kontrolní matice můžeme získat jinou kontrolní matici, která ovšem přísluší stejnému kódu. Stačí si uvědomit, že eliminací matice soustavy dostáváme případně matici jiné soustavy, ale se stejnou množinou řešení. Pokud tedy po eliminaci kontrolní matice získáme matici tvaru (CT |E ), pak je kód systematický. Kodér lineárního kódu 10.45. Věta. Nechť G je generující matice lineárního (n, k) kódu. Nechť dále A : Zk 2 → Zn 2 je lineární zobrazení, které zobrazuje standardní bázi prostoru Zk 2 na řádky matice G. Pak matice GT je maticí lineárního zobrazení A vzhledem ke standardním bázím. Důkaz. Matice lineárního zobrazení obsahuje podle definice 7.43 ve sloupcích souřadnice obrazů báze vstupního prostoru vzhledem k bázi výstupního prostoru. V našem případě generující matice G obsahuje v řádcích souřadnice obrazů (při zobrazení A) standardní báze Zk 2 vzhledem ke standardní bázi v Zn 2 . Abychom z řádků matice dostali sloupce podle definice matice lineárního zobrazení, stačí matici G transponovat. 111 Lineární algebra 10. Lineární algebra v teorii kódování 10.46. Poznámka. Zobrazení A z předchozí věty matematicky popisuje kodér lineárního kódu. Jeho generující matice je G. Věta říká, že GT je matice zobrazení tohoto kodéru vzhledem ke standardním bázím. Vstupuje-li vektor u ∈ Zk 2 do kodéru, pak jeho výstupem je vektor v ∈ Zn 2 , který spočítáme podle věty 7.49 jako součin matice zobrazení a vstupního vektoru: vT = GT · uT , neboli: v = u · G. 10.47. Poznámka. Pokud kodér kopíruje k vstupních bitů do výstupu a pak přidá kontrolní bity, nemusíme prvních k bitů výstupu počítat maticovým násobením. Stačí tímto násobením počítat kontrolní bity. Generující matice má v tomto případě tvar G = (E|C). Označíme-li u slovo, které vstupuje do kodéru a v vektor, který obsahuje jen kontrolní bity výstupního slova, pak platí: v = u · C. Dekodér li- neárního kódu 10.48. Poznámka. Dekodér při kontrole, zda se jedná o kódové slovo, použije kontrolní matici. Nechť dekodér přijme slovo w. Pak H · wT je nulový vektor právě tehdy, když je slovo w kódové. V takovém případě dekodér předpokládá, že nedošlo při přenosu slova k chybě, odstraní kontrolní bity a tím získá původní informaci. Pokud H · wT není nulový vektor, dekodér má jistotu, že došlo k chybě a že w není kódové slovo. Má-li chybu opravit, pak údaj H·wT bude při opravě potřebovat. Napíšeme-li výsledek násobení H·wT do řádku, dostáváme tzv. syndrom vektoru w. 10.49. Definice. Nechť H je kontrolní matice lineárního kódu. Syndrom slova w je vektor s, pro který platí sT = H · wT . Nechť v je slovo vyslané kodérem a w je slovo přijaté dekodérem. Pak e = w − v je chybové slovo. Protože v Zn 2 je −v = v, chybové slovo lze počítat jako w + v. 10.50. Poznámka. Jedničkové bity chybového slova označují místa, kde došlo k poškození slova v. Úkolem dekodéru je na základě znalosti w zjistit chybové slovo e. Pokud se mu to podaří, pak vypočte původní informaci jako v = w − e. Než se pustíme do sestavování tabulky, podle které bude dekodér opravovat chyby, je potřeba si uvědomit platnost dvou tvrzení. První z nich platí dokonce obecně na libovolném lineárním prostoru. 10.51. Věta. Nechť K je lineární podprostor lineárního prostoru L a nechť e1 ∈ L, e2 ∈ L. Pak množiny M1 = {e1 + v; v ∈ K}, M2 = {e2 + v; v ∈ K} jsou buď disjunktní nebo totožné. Důkaz. Sporem. Předpokládáme, že množiny M1 a M2 mají společný bod a a přitom nejsou totožné, tj. existuje vektor b ∈ M1, který neleží v M2. Protože a i b leží v množině M1, je a = e1 +u, b = e1 +v, kde u i v leží v K. Pak w = b − a = v − u leží v K, protože K je podprostor. Je tedy b = a + w. Protože a leží i v množině M2, je a = e2 + x, kde x ∈ K. Dosadíme-li tento poznatek do vztahu pro b, dostaneme b = e2 + x + w. Protože K je podprostor, x + w leží v K. Je tedy b = e2 + z, kde z ∈ K. To ale znamená, že b ∈ M2, což je sporu s předpokladem. 10.52. Věta. Nechť v je kódové slovo a e je libovolné slovo. Pak slova e i e + v mají stejný syndrom. Jinými slovy kódová slova modifikovaná stejnou chybou vytvářejí skupinu slov se společným syndromem. Důkaz. H · (e + v)T = H · eT + H · vT = H · eT + oT = H · eT . 10.53. Poznámka. Pokud požadujeme nejen detekci, ale i opravu chyb lineárního kódu, může dekodér pracovat s následující tabulkou pro opravování chyb: o o v2 v3 . . . v2k s2 e2 e2 + v2 e2 + v3 . . . e2 + v2k s3 e3 e3 + v2 e3 + v3 . . . e3 + v2k . . . . . . s2(n−k) e2(n−k) e2(n−k) + v1 e2(n−k) + v2 . . . e2(n−k) + v2k Vlevo od svislé čáry jsou syndromy, k těm se vrátím později. Nejprve vysvětlím obsah tabulky vpravo od svislé čáry. Tam jsou rozmístěna všechna slova lineárního prostoru Zn 2 . V prvním řádku jsou kódová 112 Lineární algebra 10. Lineární algebra v teorii kódování slova (je jich 2k ) a v ostatních řádcích jsou slova nekódová. Počet řádků je 2(n−k) , protože tak získáme celkový počet slov 2n = 2k ·2(n−k) . V prvním sloupci (vpravo od čáry) je nahoře umístěno nulové slovo a pod ním jsou postupně všechna chybová slova, která chceme, aby dekodér uměl odhalit a chybu opravit. Na ostatních pozicích tabulky jsou součty chybového slova v řádku s kódovým slovem ve sloupci. Tabulku vytvoříme tak, že zapíšeme nejprve do prvního řádku nulové kódové slovo a pak ostatní kódová slova (na pořadí nezáleží). Do druhého řádku napíšeme nejprve chybové slovo, které chceme dekodérem opravovat, a dále příslušné součty. Chybové slovo nesmí být slovem kódovým. Na třetím řádku napíšeme další chybové slovo. Toto chybové slovo se nesmí vyskytovat nikde na předchozích řádcích. K němu do řádku doplníme příslušné součty. Tak postupujeme dále, až vytvoříme tabulku s 2(n−k) řádky. První řádek tabulky obsahuje lineární prostor K, druhý řádek tabulky obsahuje množinu K + e2, která je podle věty 10.51 disjunktní s K. Platí totiž e2 ∈ K. Třetí řádek obsahuje množinu K + e3, která je disjunktní s K i s K + e2, protože e3 ∈ K a e3 ∈ K + e2, takže můžeme dvakrát použít větu 10.51. A tak dále. Slova v jednom řádku jsou samozřejmě různá. Máme tedy zaručeno, že žádné slovo se v tabulce neopakuje a že jsou vyčerpána všechna slova prostoru Zn 2 . Pokud nyní dekodér přijme slovo w, vyhledá ho v tabulce. Například slovo našel na i-tém řádku tabulky. Dekodér na základě toho rozhodne, že došlo k chybě ei a opraví ji tak, že provede w − ei. (Místo odčítání může vykonat w + ei, protože v aritmetice Z2 to dopadne stejně). Pokud w bylo na j-tém sloupci tabulky, dekodér se tímto postupem vrací ke kódovému slovu vj. Aby dekodér nemusel prohledávat celou tabulku o 2n slovech, vypočte nejdříve syndrom přijatého vektoru: sT = H · wT . Vlevo od svislé čáry jsou syndromy všech slov, které jsou napsány vpravo na stejném řádku (viz věta 10.52). Prohledáním tabulky syndromů a porovnáním se syndromem slova w dekodér odhalí správně řádek tabulky, ve kterém slovo w leží. Dekodér tedy nemusí pracovat s celou tabulkou, ale jen se sloupcem syndromů a sloupcem chybových slov. 10.54. Příklad. Než se pustíme do formulace požadavků na ideální kód pro opravu chyb, zkusíme sestavit tabulku pro opravování chyb pro případ kódů, kde to nebude příliš užitečné: kód s kontrolním bitem parity a opakovací kód. Tím odhalíme problémy, kterých bychom se měli při návrhu kódů s opravou chyb vyvarovat. Lineární (4,3) kód s kontrolním bitem parity má například tuto tabulku pro opravování chyb: 0 0000 0011 0101 0110 1001 1010 1100 1111 1 1000 1011 1101 1110 0001 0010 0100 0111 V této tabulce jsme zvolili chybové slovo 1000. Proto dekodér při obdržení nekódového slova opraví první bit. Kdybychom zvolili jiné chybové slovo (např. 0100), dostaneme jinou tabulku: druhý řádek bude obsahovat slova v jiném pořadí. Dekodér podle takové pozměněné tabulky bude po přijetí nekódového slova opravovat jiný bit. Bohužel, nemáme žádnou záruku, že dekodér opraví správný bit. Tabulka určuje pevně jeden bit, který bude dekodér opravovat. Lepší by bylo, kdybychom v prvním sloupci s chybovými slovy měli zapsána všechna chybová slova tvaru 1000, 0100, 0010, 0001. To bychom ale potřebovali mít v tabulce pět řádků a ne jen dva. Dva řádky v tabulce jsou důsledkem toho, že kód pracuje jen s jedním kontrolním bitem a že 21 = 2. Můžeme tedy říci, že pro úspěšnou opravu chyb je jeden kontrolní bit málo. To ostatně člověk intuitivně tuší i bez sestavování tabulek pro opravování chyb. Lineární (6,3) opakovací kód s kontrolní i generující maticí H = G =   1 0 0 1 0 0 0 1 0 0 1 0 0 0 1 0 0 1   může mít například následující tabulku pro opravování chyb: 000 000000 100100 010010 001001 110110 011011 101101 111111 100 100000 000100 110010 101001 010110 111011 001101 011111 010 010000 110100 000010 011001 100110 001011 111101 101111 001 001000 101100 011010 000001 111110 010011 100101 110111 110 110000 010100 100010 111001 000110 101011 011101 001111 101 101000 001100 111010 100001 011110 110011 000101 010111 011 011000 111100 001010 010001 101110 000011 110101 100111 111 111000 011100 101010 110001 001110 100011 010101 000111 113 Lineární algebra 10. Lineární algebra v teorii kódování Pokud dekodér pracuje podle této tabulky a přijme například slovo 111110, vypočte nejdříve syndrom H · (111110)T = (001)T , Dekodér zjistil, že slovo leží ve čtvrtém řádku tabulky. Tam je zvoleno chybové slovo 001000, takže dekodér opraví třetí bit a z přijatého slova 111110 dostává kódové slovo 110110. Jestliže předpokládáme, že přijaté slovo obsahuje jednu chybu, pak výše uvedená oprava nemusí být jediná možná. Opravou posledního bitu ve slově 111110 také dostáváme kódové slovo 111111. Problém tohoto kódu z pohledu tabulky pro opravování chyb je, že chybová slova s jednou jedničkou se objeví dvě na společném řádku tabulky. Na dalších řádcích (za čtvrtým řádkem) už nemůžeme použít chybové slovo 000001, protože toto slovo se na čtvrtém řádku už objevilo. Pokud bychom na čtvrtém řádku použili chybové slovo 000001, pak by se na tomto řádku zase vyskytlo i 001000. Množina slov vedle konkrétního syndromu se totiž nemůže změnit, protože se jedná o množinu řešení soustavy HxT = sT . Takže bychom dostali sice jinou tabulku pro opravování chyb, ale chybová slova s jednou jedničkou by se ani tak nepodařilo oddělit do jednotlivých řádků. Ačkoli (na rozdíl od kódu s kontrolním bitem parity) máme v tabulce dostatečný počet řádků, nemáme možnost dostat všechna chybová slova s jednou jedničkou do prvního sloupce tabulky. Dokonce jsme nuceni na posledním řádku tabulky použít chybové slovo se třemi jedničkami. 10.55. Poznámka. Nezdary při opravování chyb v předchozím příkladě nás inspirují k formulaci podmínek na kód, který spolehlivě opravuje jednu chybu. Předpokládáme lineární (n, k) kód. Chybových slov s jednou jedničkou je n a potřebujeme je všechna rozmístit do prvního sloupce tabulky pro opravování chyb. Žádná jiná chybová slova se v tomto sloupci nesmějí objevit. Z toho vyplývá, že počet řádků tabulky musí být n + 1 (první řádek tabulky obsahuje samotný kód). Protože počet řádků tabulky je 2(n−k) , máme podmínku 2(n−k) = n+1. Označíme-li počet kontrolních bitů c = n − k, pak je uvedená podmínka asi lépe čitelná ve tvaru n = 2c − 1. Celkový počet bitů n tedy musí být o jedničku menší než mocnina dvojky a hodnota této mocniny udává počet kontrolních bitů. Postupně pro c = 2, 3, 4, 5, 6, . . . dostáváme (3,1), (7,4), (15,11), (31,26), (63,57), . . . kódy. Abychom mohli rozmístit všechna chybová slova s jednou jedničkou do prvního sloupce, potřebujeme ještě zaručit, že žádné slovo s jednou jedničkou není kódové slovo a že dvě slova s jednou jedničkou nebudou mít stejný syndrom. Tuto podmínku nejlépe charakterizuje následující věta. 10.56. Věta. Slovo s jednou jedničkou je kódové právě tehdy, když kontrolní matice obsahuje nulový sloupec. Dvě různá slova s jednou jedničkou mají společný syndrom právě tehdy, když kontrolní matice obsahuje aspoň dva stejné sloupce. Důkaz. Stačí si uvědomit, že syndrom slova s jednou jedničkou na i-tém místě je roven i-tému sloupci kontrolní matice. To vyplývá z maticového násobení H · wT = sT . Hammingův kód 10.57. Poznámka. Aby lineární (n, k) kód opravoval všechny jednoduché chyby ve slově, je podle poznámky 10.55 nutné, aby n = 2c − 1, kde c = n − k, a dále podle věty 10.56 je nutné, aby kontrolní matice neměla žádný sloupec nulový a všechny sloupce od sebe vzájemně různé. Těch sloupců musí být n = 2c − 1, a přitom výška sloupce je c. Z toho nám vyplývá jediný možný tvar kontrolní matice (až na pořadí sloupců): v jednotlivých sloupcích kontrolní matice napíšeme ve dvojkové soustavě všechna čísla 1, 2, 3, . . . , n. Lineárnímu kódu s takovou kontrolní maticí říkáme Hammingův kód. 10.58. Příklad. Ukážeme si Hammingův (7, 4) kód. Podle předchozí poznámky napíšeme ve dvojkové soustavě do sloupců kontrolní matice čísla 1,2,3,4,5,6,7: H =   0 0 0 1 1 1 1 0 1 1 0 0 1 1 1 0 1 0 1 0 1   . Syndromy a první sloupec tabulky pro opravování chyb napíšeme (kvůli úspoře místa v tomto textu) místo do sloupců do řádků: 000 001 010 011 100 101 110 111 0000000 1000000 0100000 0010000 0001000 0000100 0000010 00000001 Vidíme, že při této volbě pořadí sloupců kontrolní matice má dekodér výrazně usnadněnou práci: nemusí prohledávat v tabulce syndromů, aby zjistil odpovídající chybové slovo. Stačí, aby interpretoval syndrom jako číslo zapsané ve dvojkové soustavě. Toto číslo udává pozici bitu chybového slova, kde se nalézá jednička. 114 Lineární algebra 10. Lineární algebra v teorii kódování Jak tedy bude dekodér postupovat při obdržení slova w? Vypočte syndrom pomocí sT = H · wT a interpretuje jej jako číslo i ve dvojkové soustavě. Je-li i = 0, je w kódové slovo a dekodér nic neopravuje. Je-li i > 0, pak dekodér opraví v obdrženém slově i-tý bit. Tím je kompletně navržen dekodér Hammingova (7, 4) kódu a zbývá ještě navrhnout kodér. Eliminací kontrolní matice přecházíme ke kontrolní matici stejného kódu (poznámka 10.44): H =   0 0 0 1 1 1 1 0 1 1 0 0 1 1 1 0 1 0 1 0 1   ∼   1 0 1 1 0 1 0 1 1 0 0 1 1 0 1 0 1 0 1 0 1   ∼   0 1 1 1 1 0 0 1 1 0 0 1 1 0 1 0 1 0 1 0 1   ∼   0 1 1 1 1 0 0 1 0 1 1 0 1 0 1 1 0 1 0 0 1   = H . Podle věty 10.43 se tedy jedná o systematický kód, protože H = (CT |E ). Podle poznámky 10.41 nyní přejdeme ke generující matici G = (E|C): G =     1 0 0 0 0 1 1 0 1 0 0 1 0 1 0 0 1 0 1 1 0 0 0 0 1 1 1 1     . Kodér necháme nejprve kopírovat první čtyři informační bity do výstupu a další tři kontrolní bity v počítáme ze vstupního slova u podle poznámky 10.47: v = u ·     0 1 1 1 0 1 1 1 0 1 1 1     . 10.59. Poznámka. Analogicky se postupuje při návrhu (15, 11), (31, 26), (63, 57) atd. Hammingových kódů. Všimněte si, že s rostoucím n se výrazně zlepšuje poměr informačních bitů ku celkovému počtu přenášených bitů. To je pro uživatele, kteří se zajímají jen o informační bity, dobrá zpráva. Ovšem prodlužováním délky přenášených slov se zase zvyšuje pravděpodobnost výskytu více než jedné chyby ve slově. Dekodér Hammingova kódu v takovém případě selže. Rozšířený Hammingův kód 10.60. Poznámka. Ve výpočetní technice se pracuje s přenosy 8 bitů, 16 bitů, 32 bitů atd. Hammingův kód předpokládá přenos slov délky o jeden bit kratší. Co se zbylým bitem? Použijeme jej pro kontrolu parity. Tím dostáváme rozšířený Hammingův kód, který umožní spolehlivě opravit jednu chybu a detekovat chyby dvě. 10.61. Příklad. K Hammingovu kódu (7, 4) přidáme kontrolní bit parity a dostáváme lineární (8, 4) kód s následující kontrolní maticí: H =     0 0 0 1 1 1 1 0 0 1 1 0 0 1 1 0 1 0 1 0 1 0 1 0 1 1 1 1 1 1 1 1     . Tento kód umí opravit jednu chybu ve slově a detekovat chyby dvě. Jak dekodér může postupovat? Přijme slovo w a vypočte syndrom sT = H · wT . Je-li syndrom nulový vektor, je slovo w kódové a dekodér nic neopravuje. Jsou-li první tři bity syndromu nulové a poslední nenulový, došlo při přenosu jen k chybě posledního kontrolního bitu parity. Je-li na prvních třech pozicích syndromu aspoň jeden bit nenulový a poslední bit syndromu je rovněž nenulový, došlo k lichému počtu chyb ve slově. Dekodér předpokládá, že došlo k jediné chybě a podle prvních třech bitů syndromu zjistí, který bit ve slově má opravit (stejně jako v příkladu 10.58). Je-li konečně poslední bit syndromu nulový, ale syndrom obsahuje aspoň jeden nenulový bit, pak došlo k sudému počtu chyb. Tento počet chyb neumí dekodér opravit, ale detekuje tento stav jako dvojnásobnou chybu. 10.62. Poznámka. Všimněte si, že nejmenší Hammingova vzdálenost mezi dvěma slovy rozšířeného Hammingova kódu je 4. To je v souladu s výsledky příkladu 10.23. 115 11. Literatura [1] J. Adámek, Foundations of Coding. A Wiley-Interscience publication, New York 1991. [2] V. Bartík, Úvod do algebry. Text k přednášce 1996 na http://math.feld.cvut.cz/bartik/. [3] H.–J. Bartsch, Matematické vzorce. Academia, Praha 2006 (4. vydání). [4] R. A. Beezer, A First Course in Linear Algebra. Tacoma, Washington, USA 2007. Text je mj. volně dostupný na http://linear.ups.edu/. [5] L. Bican, Lineární algebra a geometrie. Academia, Praha 2002. [6] G. Birkhoff, S. MacLane, Algebra. Chelsea Pub Co, (3rd edition) 1993. Existuje slovenský překlad staršího vydání Prehľad modernej algebry, Alfa, Bratislava, 1979. [7] M. Demlová, B. Pondělíček, Úvod do algebry. Vydavatelství ČVUT, Praha 1996. [8] I. M. Gelfand, Lineární algebra. Překlad M. Fiedler, ČSAV, Praha 1953. [9] J. Hefferon, Linear Algebra. Colchester, Vermont USA, volně dostupné na http://joshua.smcvt.edu/linearalgebra/. [10] S. Jílková, V. Maňasová, Z. Tischerová, Lineární algebra – úlohy. Vydavatelství ČVUT, Praha 1987. [11] A. Kalousová, Skripta z algebry. Text volně dostupný například z http://math.feld.cvut.cz/kalous/algebra.html [12] T. Kepka, Algebra. Poznámky z přednášek na MFF UK dostupné např. na http://lucy.troja.mff.cuni.cz/labtf/poznamky/. [13] V. Kořínek, Základy algebry. Klasická učebnice algebry, Academia, Praha 1956 (2. vydání). [14] E. Krajník, Základy maticového počtu. Vydavatelství ČVUT, Praha 2006. [15] V. Mahel & kol. kat. matematiky, Sbírka úloh z lineární algebry a analytické geometrie. Vydavatelství ČVUT, Praha 1986. [16] J. Matoušek, Šestnáct miniatur. Volně dostupný text s aplikacemi lineární algebry tam, kde bychom to možná nečekali, http://kam.mff.cuni.cz/ matousek/la1.html. [17] L. Motl, M. Zahradník, Pěstujeme lineární algebru. MFF UK, Praha 1994 (skriptum přístupné na http://www.kolej.mff.cuni.cz/~lmotm275/skripta/). [18] P. Olšák, Úvod do algebry, zejména lineární. FEL ČVUT, Praha 2007. [19] P. Olšák, TEXbook naruby. Konvoj, Brno 2001 (2. vydání). Text volně dostupný například na http://petr.olsak.net/tbn.html. [20] L. Procházka, Algebra. Academia, Praha 1990. [21] I. V. Proskurjakov, Sbornik zadač po linějnoj algebre. Uzdavatělstvo Nauka, Moskva 1970. [22] P. Pták, Introduction to Linear Algebra. Vydavatelství ČVUT, Praha 2006. [23] K. Rektorys, Přehled užité matematiky. Prometheus, Praha 2003 (6. vydání). [24] P. Vopěnka, Úhelný kámen evropské vzdělanosti a moci – rozpravy s geometrií. Práh, Praha 2003. [25] K. Výborný, M. Zahradník & kol. Sbírka příkladů z lineární algebry. Volně dostupný text k nalezení například na http://www.kolej.mff.cuni.cz/~lmotm275/skripta/. [26] J. Žára, B. Beneš, J. Sochor, P. Felkel, Moderní počítačová grafika. Computer Press, 2005 (2. vydání). [27] Rozcestník volně dostupných textů k algebře v češtině: http://home.pf.jcu.cz/~novakp08/Matematika/Algebra.htm. 116 12. Rejstřík 12.1. Poznámka. Na rozdíl od běžných rejstříků tento neodkazuje na čísla stran, ale na čísla odstavců. To by mělo čtenáři umožnit rychleji najít slovo z rejstříku v textu, protože cíl odkazu je přesnější: text odstavce je typicky menší než text celé strany. Až na výjimky nejsou v rejstříku pojmy odkazovány na všechna místa, kde se vyskytují. Například pojem „lineární prostor nebo „matice by asi musel obsahovat odkazy na skoro všechny odstavce. To by ztratilo smysl. Často používané pojmy jsou tedy v rejstříku odkazovány jen na místa, kde jsou definovány nebo kde jsou uvedeny jejich důležité vlastnosti. ◦ 7.31 ⊥ 8.29 . 2.29 ∨ 6.3 . 8.17 ∼ (str. 1), 3.9, 3.10, 3.13 × 1.3 → 1.3 A 7.2 A−1 3.48 AT 3.28 abeceda 10.13 Abel Niels Henrik 1.31, 1.32 Abelova grupa 1.31 analytická geometrie 9.2 anitkomutativní zákon 9.24 aritmetický vektor 1.11 ASCII kód 10.15 asociativní zákon 1.6, 1.31, 3.38, 9.25 Avel Niels Henrik 1.58 axiomy 1.1 axiomy grupy 1.31 — lineárního prostoru 1.6, 1.42, 1.67 — skalárního součinu 8.2 — tělesa 1.51 báze 2.42, 2.45, 2.46, 2.54, 2.59, 7.26 báze kladně orientovaná 9.10, 9.13, 9.37 — ortogonální 8.31 — ortonormální 8.31, 9.7, 9.37 — polynomů 2.47 — prostoru funkcí 2.54 — — matic 3.5, 3.6 — standardní 2.45, 2.46 — standardní v R3 2.45 — — v Rn 2.46 — uspořádaná 6.8 — záporně orientovaná 9.10, 9.13 bit 10.14 blokový kód 10.13 bod 9.1 bod souměrný podle přímky 9.65 — — podle roviny 9.64 Cramerovo pravidlo 5.29 číslo charakteristické 7.72 — vlastní 7.66, 7.70 čtvercová matice 3.1 def A 7.21 defekt zobrazení 7.21, 7.53 definice 1.1 dekodér 10.13, 10.48 Descartes René 9.2 det A 4.15 detekce chyb 10.23 determinant 4.15 determinant rozvoj 4.30, 4.33 — součinu matic 4.35 diag 7.81 diagonála matice hlavní 4.19 — — vedlejší 4.19 diagonální matice 7.81 dimenze 2.60, 2.62 dimenze prostoru matic 3.5, 3.6 — — polynomů 2.62 — — Rn 2.62 — — UO 2.62 dim L 2.60 distributivní zákon 1.6, 1.51, 3.38, 9.24 doplněk matice 4.32, 4.33 dualita řádkově-sloupcová 4.29 důkaz 1.1 dvojice uspořádaná 1.3, 1.9 E3 9.1 eigenvalue 7.72 eigenvector 7.72 ekvivalentní soustava 5.6 eliminační metoda Gaussova (str. 1), 3.9 euklidovská geometrie 2.24, 9.1 euklidovský prostor 9.1 Frobeniova věta 5.4 Galois Évariste 1.58 Galoisovo těleso 1.58 Gaussova eliminační metoda (str. 1), 3.9, 5.7 GEM (str. 1), 3.9, 5.7 generující matice 10.32 geometrie analytická 9.2 — euklidovská 2.24, 9.1 GF(2) 1.58 GF(p) 1.60 GF(pm ) 1.64 grupa 1.31, 1.46 grupa Abelova 1.31 — funkcí 1.37 — jednoprvková 1.33 — komutativní 1.31, 1.40, 1.41 117 Lineární algebra 12. Rejstřík — nekomutativní 1.31, 1.37–39 — permutací 1.38 — R 1.34, 1.35 — regulárních matic 1.39 grupoid 1.46 Hammingova velikost slova 10.18 — vzdálenost slov 10.18 Hammingův kód 10.57 hlavní diagonála matice 4.19 hod A 7.21 hod A 3.15 hodnost 3.15, 7.21 hodnost matice 3.15, 3.24, 3.33, 3.50, 3.60, 7.48 — zobrazení 7.21, 7.48, 7.53 hodnota zobrazení 7.2 homogenní soustava rovnic 5.9 horní trojúhelníková matice 3.21, 5.8 charakteristické číslo 7.72 charakteristický polynom 7.75 — vektor 7.72 charakteristika tělesa 1.61, 1.63 identické zobrazení 7.33 identita 7.33 indukce matematická 4.3 informační bit 10.29 injektivní zobrazení 7.5 inverze permutace 4.5, 4.12 inverzní matice 3.48–50, 3.53, 4.37 — permutace 4.10, 4.12 — prvek 1.31, 1.35, 1.44 — zobrazení 7.33 izomorfismus 7.37 izomorfní prostor 7.37 — zobrazení 7.37 jádro zobrazení 7.16 jednotková matice 3.44 jednotkový prvek 1.31, 1.44 Jordanův kanonický tvar 7.90 kanonická rovnice přímky 9.49 kartézský souřadnicový systém 9.42 Ker A 7.16 kladně orientovaná báze 9.10, 9.13, 9.37 kladně orientovaný souřadnicový systém 9.42 kód 10.13 kód ASCII 10.15 — blokový 10.13 — Hammingův 10.57 — Hammingův rozšířený 10.60 — lineární 10.25 — nesystematický 10.42 — opakovací 10.30 — s kontrolním bitem parity 10.28 — systematický 10.40, 10.42 — UTF8 10.16 kodér 10.13, 10.45 kódování 10.1, 10.13 kódové slovo 10.13 koeficienty lineární kombinace 2.3 kolmé vektory 8.29 kolmý průmět 9.6 kombinace lineární 2.3, 2.4 — lineární netriviální 2.5 — — triviální 2.5, 2.6 komutativní těleso 1.52 — zákon 1.6, 1.31, 3.37 komutující matice 3.40 konečné těleso 1.58, 10.3 kontrolní bit 10.28, 10.29 — matice 10.32 kořen polynomu 1.32 kvaterniony 1.52 Laplaceova věta 4.35 lemma Zornovo 2.50 lineární kód 10.25 — kombinace 2.3, 2.4 — nezávislost 2.9, 2.39, 2.40 — nezávislost funkcí 2.14 — — množiny vektorů 2.26 — — nekonečné množiny vektorů 2.26 — — řádků matice 3.22, 3.25 — — skupiny vektorů 2.9 — — vektorů 7.29 — obal 2.29, 2.33–35, 2.37–40, 2.56 — obal řádků matice 3.13 — podprostor 1.17, 2.37, 2.38 — prostor 1.6, 1.42, 1.67, 6.1, viz též prostor — prostor konečné dimenze 6.1 — — nad tělesem 1.67 — soustava rovnic 5.1 — závislost 2.7, 2.21, 2.22 — závislost funkcí 2.15 — — množiny vektorů 2.26 — — nekonečné množiny vektorů 2.26 — — skupiny vektorů 2.7 — — vektorů 7.29 — zobrazení 7.6 matematická indukce 4.3 matice (str. 1), 3.1 matice čtvercová 3.1 — diagonální 7.81 — doplněk 4.32 — generující 10.32 — horní trojúhelníková 3.21, 5.8 — identity 7.56 — inverzní 3.48–50, 3.53, 4.37 — jednotková 3.44 — komutující 3.40 — kontrolní 10.32 — násobek 3.3 — násobení 3.34, 3.37, 3.38 — nulová 3.1 — numericky nestabilní 3.27 — podobná 7.63 — pozitivně definitní 8.12 118 Lineární algebra 12. Rejstřík — přechodu 6.18, 7.56 — regulární 3.51, 3.60, 4.37 — singulární 3.51 — složeného zobrazení 7.55 — součet 3.3 — součin 3.34, 3.37, 3.38 — soustavy 5.1 — soustavy rozšířená 5.1 — symetrická 8.11 — transponovaná 3.28, 4.28 — vektorů 3.42 — zobrazení 7.43, 7.60 metoda eliminační Gaussova (str. 1), 5.7 — počítání determinantu 4.22 — — inverzní matice 3.53, 4.39 — — matice přechodu 6.31 — — matice zobrazení 7.51 — — vlastních čísel 7.74 mimoběžky 9.52 modelový příklad (str. 2), 3.26, 3.41, 5.22, 5.25, 7.67 násobek matic 3.3 — polynomu 1.4 násobení matic 3.34, 3.37, 3.38 — v Z2 10.4 násobnost vlastního čísla 7.75 nehomogenní soustava rovnic 5.9 — soustava rovnic 5.17 nekomutativní těleso 1.52 nerovnost Schwartzova 8.22 — trojúhelníková 8.24 nesystematický kód 10.42 netriviální lineární kombinace 2.5 neutrální prvek 1.31, 1.44 nezávislost vektorů lineární 7.29 norma 8.17 norma funkce 8.27 normálová rovnice roviny 9.55 normálový vektor 9.55 nulová matice 3.1 nulový prvek 1.6 — vektor 1.6, 1.42, 2.6 numericky nestabilní matice 3.27 obal lineární 2.29 objem čtyřstěnu 9.48 — rovnoběžnostěnu 9.30 obsah rovnoběžníka 9.27 — trojúhelníka 9.47 odečítání 1.34 okruh 1.55 opačný prvek 1.31, 1.34, 1.44 oprava chyb 10.23 orientace prostoru 9.13 ortogonalizační proces Schmidtův 8.41 ortogonální báze 8.31 ortonormální báze 8.31, 9.7, 9.37 osa souřadnic 9.42 parametrické rovnice přímky 9.49 — — roviny 9.55 partikulární řešení soustavy 5.17 permutace 1.38, 4.1 permutace inverzní 4.10, 4.12 — lichá 4.7 — sudá 4.7 podgrupa 1.47 podobnost matic 7.63 podprostor 2.63 podprostor lineární 1.17, 2.37, 2.38 — polynomů 1.19 — prostoru funkcí 1.18 — Rn 1.20, 1.21 podtěleso 1.54 pologrupa 1.46 polynom 1.4, 1.14, 1.18, 1.19, 2.28, 2.47 polynom charakteristický 7.75 pozitivně definitiní matice 8.12 poznámka 1.1 pravidlo Cramerovo 5.29 — pravé ruky 9.10 — Sarrusovo 4.17 pravoúhlý souřadnicový systém 9.42 princip superpozice 7.8 prosté zobrazení 7.5 prostor euklidovský 9.1 — funkcí 1.13, 2.54 — izomorfní 7.37 — konečné dimenze 6.1 — lineární 1.6, 1.42, 1.67, 6.1 — matic 3.3, 3.4 — orientovaný 9.13 — orientovaných úseček 1.24, 1.25, 2.24, 2.49, 2.62, 9.2, 9.7, 9.10, 9.17 — polynomů 1.14, 1.18, 2.47, 2.62 — R 1.12 — R2 1.9 — Rn 1.11, 2.62 — se skalárním součinem 8.2 — triviální 1.26 — UO 1.24, 1.25, 2.24, 2.49, 2.62, 9.2, 9.7, 9.10, 9.17 — vektorový 6.1 — volných vektorů 9.33, 9.34 — Zn 2 10.5 průmět kolmý 9.6 průnik prostorů 1.22 průsečík přímky s rovinou 9.59 — různoběžek 9.52 průsečnice rovin 9.61 prvek inverzní 1.31, 1.35, 1.44 — jednotkový 1.31, 1.44 — matice 3.1 — nad diagonálou 4.19 — neutrální 1.31, 1.44 — nulový 1.6 119 Lineární algebra 12. Rejstřík — opačný 1.31, 1.34, 1.44 přetěžování operátorů 1.5 přidružená homogenní soustava 5.17 příklad 1.1 příklad modelový (str. 2), 3.26, 3.41, 5.22, 5.25, 7.67 přímka 9.41 Pythagotova věta 8.30 R 1.12 R2 1.9 Rn 1.11, 1.20, 2.62 r: A 3.12 r: A 3.12 radiusvektor 9.42 rank 3.15 redundance 10.29 regulární matice 3.51, 3.60, 4.37 relace ∼ 3.9, 3.10 reprezentant vektoru 9.34 rovina 9.41 rovnice přímky kanonická 9.49 — — parametrické 9.49 — roviny 9.55 — roviny normálová 9.55 — — parametrické 9.55 rovnost matic 3.2 rozdíl bodů 9.39 rozšířená matice soustavy 5.1 rozšířený Hammingův kód 10.60 rozvoj determinantu 4.30, 4.33 různoběžky 9.52 řádek matice 3.1 řešení soustavy 5.2 — soustavy patrikulární 5.17 Sarrusovo pravidlo 4.17 sčítání polynomů 1.4 Schmidtův ortogonalizační proces 8.41 Schwartzova nerovnost 8.22 singulární matice 3.51 sjednocení prostorů 1.22 skalár 1.6, 10.2 skalární součin 8.2, 9.3 — součin standardní 8.7 skládání zobrazení 7.31 sloupec matice 3.1 slovo 10.13 slovo kódové 10.13 složené zobrazení 7.31 směrový vektor přímky 9.41 — — roviny 9.41 smíšený součin 9.28 součet bodu s vektorem 9.39 — v Z2 10.4 — matic 3.3 součin determinantů 4.35 — matic 3.34, 3.37, 3.38 — skalární 8.2, 9.3 — smíšený 9.28 — vektorový 9.17, 9.22 souřadnice bodu 9.42 — vektorového součinu 9.20 — vektoru 6.10, 7.25, 7.49, 9.8, 9.42 souřadnicový systém kartézský 9.42 — — kladně orientovaný 9.42 — — pravoúhlý 9.42 souřadnicový systém 9.42 soustava ekvivalentní 5.6 — homogenní přidružená 5.17 — lineárních rovnic (str. 1), 5.1 — rovnic homogenní 5.9 — — nehomogenní 5.9, 5.17 — sluneční 4.34 — soustav lineárních rovnic 5.37 spektrum matice 7.72 — zobrazení 7.72 spojení podprostorů 6.3 standardní skalární součin 8.7 Steinitzova věta o výměně 2.56 stupeň polynomu 1.15 Stvořitel 2.62 surjektivní zobrazení 7.3 symetrická matice 8.11 syndrom 10.49 systematický kód 10.40, 10.42 šifrování 10.1 těleso 1.51, 10.2 těleso C 1.56 — Galoisovo 1.58 — GF(2) 1.58 — GF(p) 1.60 — GF(pm ) 1.64 — komutativní 1.52 — konečné 1.58, 10.3 — nekomutativní 1.52 — R 1.53 — Z2 1.58, 10.3 — Zp 1.60 Tomáš nevěřící 6.15 transponovaná matice 3.28, 4.28 triviální lineární kombinace 2.5, 2.6 — prostor 1.26 trojúhelníková nerovnost 8.24 úhel přímek 9.52 — přímky a roviny 9.59 — rovin 9.61 — vektorů 8.20 uspořádaná báze 6.8 — dvojice 1.3, 1.9 UTF8 kód 10.16 V3 9.33, 9.34 vedlejší diagonála matice 4.19 vektor 1.6 vektor aritmetický 1.11 — charakteristický 7.72 120 Lineární algebra 12. Rejstřík — kolmý 8.29 — normálový 9.55 — nulový 1.6, 1.42, 2.6 — pravých stran 5.1 — vlastní 7.66, 7.70 — volný 9.33 vektorový prostor 6.1 — součin 9.17, 9.22 velikost kolmého průmětu 9.6 — slova Hammingova 10.18 — vektoru 8.17 vesmír 4.34 věta 1.1 věta Frobeniova 5.4 — Laplaceova 4.35 — o rozvoji determinantu 4.30 — Pythagotova 8.30 — Steinitzova o výměně 2.56 vlastní číslo 7.66, 7.70 — vektor 7.66, 7.70 — vektor zobecněný 7.90 volný vektor 9.33 vzdálenost bodů 9.46 — bodu od přímky 9.51 — bodu od roviny 9.58 — Hammingova 10.18 — mimoběžek 9.52 — přímky od roviny 9.59 — rovin 9.61 — rovnoběžek 9.52 — vektorů 8.23 Z2 1.58, 10.3 Zp 1.60 zákon antikomutativní 9.24 — asociativní 1.6, 1.31, 3.38, 9.25 — distributivní 1.6, 1.51, 3.38, 9.24 — komutativní 1.6, 1.31, 3.37 záporně orientovaná báze 9.10, 9.13 závislost vektorů lineární 7.29 znaménko permutace 4.7 zobecněný vlastní vektor 7.90 zobrazení 7.2 zobrazení identické 7.33 — injektivní 7.5 — inverzní 7.33 — izomorfní 7.37 — lineární 7.6 — na 7.3 — prosté 7.5 — surjektivní 7.3 Zornovo lemma 2.50 121